KR20120093882A - 융합 폴리펩티드 및 이들의 용도 - Google Patents
융합 폴리펩티드 및 이들의 용도 Download PDFInfo
- Publication number
- KR20120093882A KR20120093882A KR1020127009669A KR20127009669A KR20120093882A KR 20120093882 A KR20120093882 A KR 20120093882A KR 1020127009669 A KR1020127009669 A KR 1020127009669A KR 20127009669 A KR20127009669 A KR 20127009669A KR 20120093882 A KR20120093882 A KR 20120093882A
- Authority
- KR
- South Korea
- Prior art keywords
- polypeptide
- dna
- leu
- lys
- ligase
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 617
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 611
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 611
- 230000004927 fusion Effects 0.000 title claims abstract description 224
- 102000012410 DNA Ligases Human genes 0.000 claims abstract description 161
- 108010061982 DNA Ligases Proteins 0.000 claims abstract description 149
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 142
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 142
- 239000002157 polynucleotide Substances 0.000 claims abstract description 142
- 230000027455 binding Effects 0.000 claims abstract description 115
- 230000004568 DNA-binding Effects 0.000 claims abstract description 113
- 238000009739 binding Methods 0.000 claims abstract description 91
- 238000000034 method Methods 0.000 claims abstract description 68
- 230000014509 gene expression Effects 0.000 claims description 125
- 108020004414 DNA Proteins 0.000 claims description 109
- 150000007523 nucleic acids Chemical group 0.000 claims description 105
- 239000002773 nucleotide Substances 0.000 claims description 95
- 125000003729 nucleotide group Chemical group 0.000 claims description 95
- 108090000623 proteins and genes Proteins 0.000 claims description 83
- 239000012634 fragment Substances 0.000 claims description 71
- 230000000694 effects Effects 0.000 claims description 60
- 102000039446 nucleic acids Human genes 0.000 claims description 53
- 108020004707 nucleic acids Proteins 0.000 claims description 52
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 51
- 150000001413 amino acids Chemical class 0.000 claims description 45
- 102000004169 proteins and genes Human genes 0.000 claims description 43
- 239000013598 vector Substances 0.000 claims description 42
- 102100033195 DNA ligase 4 Human genes 0.000 claims description 39
- 241000588724 Escherichia coli Species 0.000 claims description 39
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 36
- 102100023050 Nuclear factor NF-kappa-B p105 subunit Human genes 0.000 claims description 32
- 101710086015 RNA ligase Proteins 0.000 claims description 24
- 239000000203 mixture Substances 0.000 claims description 23
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 21
- 230000004048 modification Effects 0.000 claims description 20
- 238000012986 modification Methods 0.000 claims description 20
- 241000282414 Homo sapiens Species 0.000 claims description 19
- 108020001507 fusion proteins Proteins 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 102000037865 fusion proteins Human genes 0.000 claims description 17
- 239000000758 substrate Substances 0.000 claims description 17
- 108010057466 NF-kappa B Proteins 0.000 claims description 16
- 229910019142 PO4 Inorganic materials 0.000 claims description 15
- 101710123496 Spindolin Proteins 0.000 claims description 15
- 239000010452 phosphate Substances 0.000 claims description 15
- 230000004570 RNA-binding Effects 0.000 claims description 11
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 10
- 239000003153 chemical reaction reagent Substances 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 9
- 108020005202 Viral DNA Proteins 0.000 claims description 8
- 102000002673 NFATC Transcription Factors Human genes 0.000 claims description 7
- 108010018525 NFATC Transcription Factors Proteins 0.000 claims description 7
- 101710096438 DNA-binding protein Proteins 0.000 claims description 6
- 108700020911 DNA-Binding Proteins Proteins 0.000 claims description 5
- 241000192091 Deinococcus radiodurans Species 0.000 claims description 5
- 101000844752 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) DNA-binding protein 7d Proteins 0.000 claims description 5
- 239000000872 buffer Substances 0.000 claims description 5
- 239000000463 material Substances 0.000 claims description 5
- 108700026244 Open Reading Frames Proteins 0.000 claims description 4
- 101000844753 Sulfolobus acidocaldarius (strain ATCC 33909 / DSM 639 / JCM 8929 / NBRC 15157 / NCIMB 11770) DNA-binding protein 7d Proteins 0.000 claims description 4
- 108020000946 Bacterial DNA Proteins 0.000 claims description 3
- 102000006947 Histones Human genes 0.000 claims description 3
- 108010033040 Histones Proteins 0.000 claims description 3
- 102000015335 Ku Autoantigen Human genes 0.000 claims description 3
- 108010025026 Ku Autoantigen Proteins 0.000 claims description 3
- 241000187479 Mycobacterium tuberculosis Species 0.000 claims description 3
- 241001515965 unidentified phage Species 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 108020000949 Fungal DNA Proteins 0.000 claims description 2
- 241000699660 Mus musculus Species 0.000 claims description 2
- 230000002759 chromosomal effect Effects 0.000 claims description 2
- 238000011830 transgenic mouse model Methods 0.000 claims 1
- 108090000364 Ligases Proteins 0.000 abstract description 76
- 102000003960 Ligases Human genes 0.000 abstract description 74
- 230000014616 translation Effects 0.000 abstract description 9
- 239000003814 drug Substances 0.000 abstract description 3
- 238000003745 diagnosis Methods 0.000 abstract 1
- 239000002417 nutraceutical Substances 0.000 abstract 1
- 235000021436 nutraceutical agent Nutrition 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 104
- 125000003275 alpha amino acid group Chemical group 0.000 description 45
- 235000001014 amino acid Nutrition 0.000 description 40
- 241000282326 Felis catus Species 0.000 description 39
- 235000018102 proteins Nutrition 0.000 description 32
- 230000010076 replication Effects 0.000 description 27
- 238000003556 assay Methods 0.000 description 24
- 108010050848 glycylleucine Proteins 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 22
- 125000006850 spacer group Chemical group 0.000 description 22
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 20
- 108010034529 leucyl-lysine Proteins 0.000 description 20
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 19
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 16
- 239000013615 primer Substances 0.000 description 16
- 239000002987 primer (paints) Substances 0.000 description 16
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 15
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 15
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 15
- 108010009298 lysylglutamic acid Proteins 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 230000002441 reversible effect Effects 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 14
- 108010003700 lysyl aspartic acid Proteins 0.000 description 14
- 108091008146 restriction endonucleases Proteins 0.000 description 14
- 238000000338 in vitro Methods 0.000 description 13
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 13
- 238000003752 polymerase chain reaction Methods 0.000 description 13
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 12
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 12
- 108010047857 aspartylglycine Proteins 0.000 description 12
- 108010000761 leucylarginine Proteins 0.000 description 12
- 108010073969 valyllysine Proteins 0.000 description 12
- 241000203069 Archaea Species 0.000 description 11
- 241000196324 Embryophyta Species 0.000 description 11
- 102000004190 Enzymes Human genes 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 11
- 108010005233 alanylglutamic acid Proteins 0.000 description 11
- 230000004071 biological effect Effects 0.000 description 11
- 229940088598 enzyme Drugs 0.000 description 11
- 239000000499 gel Substances 0.000 description 11
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 11
- 108010054155 lysyllysine Proteins 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- 102000008158 DNA Ligase ATP Human genes 0.000 description 10
- 108010060248 DNA Ligase ATP Proteins 0.000 description 10
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 238000003753 real-time PCR Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 9
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 9
- 241000700605 Viruses Species 0.000 description 9
- 230000004075 alteration Effects 0.000 description 9
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000003623 enhancer Substances 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000003112 inhibitor Substances 0.000 description 9
- 230000003612 virological effect Effects 0.000 description 9
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 8
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 8
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 8
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 8
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 8
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 230000001976 improved effect Effects 0.000 description 8
- 108010017391 lysylvaline Proteins 0.000 description 8
- 230000002018 overexpression Effects 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 7
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 7
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 7
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 7
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 7
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 7
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 7
- 108010003201 RGH 0205 Proteins 0.000 description 7
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 7
- 108010092854 aspartyllysine Proteins 0.000 description 7
- 108010054813 diprotin B Proteins 0.000 description 7
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 230000000977 initiatory effect Effects 0.000 description 7
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 6
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 6
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 6
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 6
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 6
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 6
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 6
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 6
- 101710137500 T7 RNA polymerase Proteins 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 108010085325 histidylproline Proteins 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 108010020532 tyrosyl-proline Proteins 0.000 description 6
- 108010003137 tyrosyltyrosine Proteins 0.000 description 6
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 5
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 5
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 5
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 5
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 5
- 108050006400 Cyclin Proteins 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 241000701959 Escherichia virus Lambda Species 0.000 description 5
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 5
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 5
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 5
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 5
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 5
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 5
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 5
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 5
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 5
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 5
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 5
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 5
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 5
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 5
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 5
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 108091005804 Peptidases Proteins 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 5
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 5
- 102100036691 Proliferating cell nuclear antigen Human genes 0.000 description 5
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 5
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 5
- 108020004682 Single-Stranded DNA Proteins 0.000 description 5
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 5
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- 108091023040 Transcription factor Proteins 0.000 description 5
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 5
- KRXFXDCNKLANCP-CXTHYWKRSA-N Tyr-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 KRXFXDCNKLANCP-CXTHYWKRSA-N 0.000 description 5
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 5
- 229960001456 adenosine triphosphate Drugs 0.000 description 5
- 108010008355 arginyl-glutamine Proteins 0.000 description 5
- 108010016616 cysteinylglycine Proteins 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 101150032700 pprA gene Proteins 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 108010084932 tryptophyl-proline Proteins 0.000 description 5
- 241000701447 unidentified baculovirus Species 0.000 description 5
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 4
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 4
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 4
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 4
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 4
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 4
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 4
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 4
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 4
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 4
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 4
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 4
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 4
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 4
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 4
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 4
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 4
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- 101100390711 Escherichia coli (strain K12) fhuA gene Proteins 0.000 description 4
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 4
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 4
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 4
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 4
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 4
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 4
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 4
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 4
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 4
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 4
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 4
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 4
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 4
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 4
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 4
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 4
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 4
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 4
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 4
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 4
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 4
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 4
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 4
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 4
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 4
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 4
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 4
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 4
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 4
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 4
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 4
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 4
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 4
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 4
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 4
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 4
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- BAWFJGJZGIEFAR-NNYOXOHSSA-O NAD(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-O 0.000 description 4
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 4
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 4
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 4
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 4
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 4
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 4
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 4
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 4
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 4
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 4
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 4
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 4
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 4
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 4
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 4
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 4
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 4
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- -1 for example Proteins 0.000 description 4
- 238000002873 global sequence alignment Methods 0.000 description 4
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 101150110245 ompC gene Proteins 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000003389 potentiating effect Effects 0.000 description 4
- 238000000159 protein binding assay Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 3
- 108010085238 Actins Proteins 0.000 description 3
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 3
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 3
- CVHJIWVKTFNGHT-ACZMJKKPSA-N Ala-Gln-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N CVHJIWVKTFNGHT-ACZMJKKPSA-N 0.000 description 3
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 3
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 3
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 3
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 3
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 3
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 3
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 3
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 3
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 3
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 3
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 3
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 3
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 3
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 3
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 3
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 3
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 3
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 3
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 3
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 3
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 3
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 3
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 3
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 3
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 3
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 3
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 3
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 3
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 3
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 3
- UIKLEGZPIOXFHJ-DLOVCJGASA-N Cys-Phe-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O UIKLEGZPIOXFHJ-DLOVCJGASA-N 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 3
- 241000588921 Enterobacteriaceae Species 0.000 description 3
- 241000701533 Escherichia virus T4 Species 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- APWLZZSLCXLDCF-CIUDSAMLSA-N Gln-Cys-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O APWLZZSLCXLDCF-CIUDSAMLSA-N 0.000 description 3
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 3
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 3
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 3
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 3
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 3
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 3
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 3
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 3
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 3
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 3
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 3
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 3
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 3
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 3
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 3
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 3
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 3
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 3
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 3
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 3
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 3
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 3
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 3
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 3
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 3
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 3
- WVUDHMBJNBWZBU-XUXIUFHCSA-N Ile-Lys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N WVUDHMBJNBWZBU-XUXIUFHCSA-N 0.000 description 3
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 3
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 3
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 3
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 3
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 3
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 3
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 3
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 3
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 3
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 3
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 3
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 3
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 3
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 3
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 3
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 3
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 3
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 3
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 3
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 3
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 3
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 3
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 3
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 3
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 3
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 3
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 3
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 3
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 3
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 3
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 3
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 3
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 3
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 3
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 101100178822 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) htrA1 gene Proteins 0.000 description 3
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 101100407828 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ptr-3 gene Proteins 0.000 description 3
- 102100034404 Nuclear factor of activated T-cells, cytoplasmic 1 Human genes 0.000 description 3
- 101710151542 Nuclear factor of activated T-cells, cytoplasmic 1 Proteins 0.000 description 3
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 3
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 3
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 3
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 3
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 3
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 3
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 3
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 3
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 3
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 3
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 3
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 3
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 101100277437 Rhizobium meliloti (strain 1021) degP1 gene Proteins 0.000 description 3
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 3
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 3
- 244000057717 Streptococcus lactis Species 0.000 description 3
- 235000014897 Streptococcus lactis Nutrition 0.000 description 3
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 3
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 3
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 3
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 3
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 3
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 3
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 3
- CJXURNZYNHCYFD-WDCWCFNPSA-N Thr-Lys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CJXURNZYNHCYFD-WDCWCFNPSA-N 0.000 description 3
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 3
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 3
- 102000006601 Thymidine Kinase Human genes 0.000 description 3
- 108020004440 Thymidine kinase Proteins 0.000 description 3
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 3
- XDQGKIMTRSVSBC-WDSOQIARSA-N Trp-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CNC2=CC=CC=C12 XDQGKIMTRSVSBC-WDSOQIARSA-N 0.000 description 3
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 3
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 3
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 3
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 3
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 3
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 3
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 3
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 3
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 3
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 3
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 3
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 3
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 3
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 3
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 3
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 3
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 238000006664 bond formation reaction Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 101150018266 degP gene Proteins 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 108020001096 dihydrofolate reductase Proteins 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010084389 glycyltryptophan Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 210000003292 kidney cell Anatomy 0.000 description 3
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 3
- 238000002824 mRNA display Methods 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 229950006238 nadide Drugs 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 108010018625 phenylalanylarginine Proteins 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 229920002704 polyhistidine Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 101150020043 sso7d gene Proteins 0.000 description 3
- 230000002459 sustained effect Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical class OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 2
- NJIFPLAJSVUQOZ-JBDRJPRFSA-N Ala-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C)N NJIFPLAJSVUQOZ-JBDRJPRFSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- 102100027211 Albumin Human genes 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- BBYTXXRNSFUOOX-IHRRRGAJSA-N Arg-Cys-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BBYTXXRNSFUOOX-IHRRRGAJSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- LLZXKVAAEWBUPB-KKUMJFAQSA-N Arg-Gln-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLZXKVAAEWBUPB-KKUMJFAQSA-N 0.000 description 2
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 2
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 2
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 2
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 2
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 2
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 2
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 2
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 2
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 2
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 2
- KMCRKVOLRCOMBG-DJFWLOJKSA-N Asn-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KMCRKVOLRCOMBG-DJFWLOJKSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 2
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 2
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 2
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 2
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 2
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- XQFLFQWOBXPMHW-NHCYSSNCSA-N Asp-Val-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XQFLFQWOBXPMHW-NHCYSSNCSA-N 0.000 description 2
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- UUERSUCTHOZPMG-SRVKXCTJSA-N Cys-Asn-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UUERSUCTHOZPMG-SRVKXCTJSA-N 0.000 description 2
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 2
- VBPGTULCFGKGTF-ACZMJKKPSA-N Cys-Glu-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VBPGTULCFGKGTF-ACZMJKKPSA-N 0.000 description 2
- BCSYBBMFGLHCOA-ACZMJKKPSA-N Cys-Glu-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BCSYBBMFGLHCOA-ACZMJKKPSA-N 0.000 description 2
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 2
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 2
- ORYFTECKJZTNQP-DCAQKATOSA-N Cys-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N ORYFTECKJZTNQP-DCAQKATOSA-N 0.000 description 2
- 102100027834 DNA repair protein XRCC1 Human genes 0.000 description 2
- 101710147739 DNA repair protein XRCC1 Proteins 0.000 description 2
- 108010059378 Endopeptidases Proteins 0.000 description 2
- 102000005593 Endopeptidases Human genes 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 2
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 2
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 2
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 2
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 2
- FTMLQFPULNGION-ZVZYQTTQSA-N Gln-Val-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FTMLQFPULNGION-ZVZYQTTQSA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 2
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 2
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 2
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 2
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 2
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 2
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 2
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 2
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 2
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 2
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 2
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 2
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 2
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 2
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 2
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 2
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 2
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 2
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 2
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 2
- LNJLOZYNZFGJMM-DEQVHRJGSA-N Ile-His-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N LNJLOZYNZFGJMM-DEQVHRJGSA-N 0.000 description 2
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 2
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 2
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 2
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 2
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 2
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 2
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 2
- 244000285963 Kluyveromyces fragilis Species 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 2
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 2
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 2
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 2
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 2
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 2
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 2
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 2
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 2
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 2
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 2
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 2
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 2
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical group [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 102100034400 Nuclear factor of activated T-cells, cytoplasmic 2 Human genes 0.000 description 2
- 101710151538 Nuclear factor of activated T-cells, cytoplasmic 2 Proteins 0.000 description 2
- 102100034399 Nuclear factor of activated T-cells, cytoplasmic 3 Human genes 0.000 description 2
- 101710151545 Nuclear factor of activated T-cells, cytoplasmic 3 Proteins 0.000 description 2
- 102100034398 Nuclear factor of activated T-cells, cytoplasmic 4 Human genes 0.000 description 2
- 101710151215 Nuclear factor of activated T-cells, cytoplasmic 4 Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 2
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 2
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 2
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 2
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 2
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 2
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 2
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 241000725643 Respiratory syncytial virus Species 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 101100116999 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) sso7d gene Proteins 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 2
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 2
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 2
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 2
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 2
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 2
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 2
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 2
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 2
- GFJXBLSZOFWHAW-JYJNAYRXSA-N Tyr-His-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GFJXBLSZOFWHAW-JYJNAYRXSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 2
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 2
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 2
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 2
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 2
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 2
- 244000000188 Vaccinium ovalifolium Species 0.000 description 2
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 2
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 2
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 2
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 2
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 2
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 2
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 2
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 2
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 2
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 2
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 238000007845 assembly PCR Methods 0.000 description 2
- 238000010170 biological method Methods 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 229910017052 cobalt Chemical group 0.000 description 2
- 239000010941 cobalt Chemical group 0.000 description 2
- 239000005515 coenzyme Substances 0.000 description 2
- 238000004883 computer application Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 210000000172 cytosol Anatomy 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 239000002158 endotoxin Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 102000018146 globin Human genes 0.000 description 2
- 108060003196 globin Proteins 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000017730 intein-mediated protein splicing Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 101150093139 ompT gene Proteins 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 101150009573 phoA gene Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical group C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 125000000548 ribosyl group Chemical class C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 101150108727 trpl gene Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- PLVPPLCLBIEYEA-WAYWQWQTSA-N (z)-3-(1h-indol-3-yl)prop-2-enoic acid Chemical compound C1=CC=C2C(\C=C/C(=O)O)=CNC2=C1 PLVPPLCLBIEYEA-WAYWQWQTSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- 101710176159 32 kDa protein Proteins 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- MLNSNVLOEIYJIU-ZUDIRPEPSA-N Ala-Leu-Thr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLNSNVLOEIYJIU-ZUDIRPEPSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- 101710187573 Alcohol dehydrogenase 2 Proteins 0.000 description 1
- 101710133776 Alcohol dehydrogenase class-3 Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 1
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241001367049 Autographa Species 0.000 description 1
- 241000304886 Bacilli Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000409811 Bombyx mori nucleopolyhedrovirus Species 0.000 description 1
- 241000701822 Bovine papillomavirus Species 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 101100543541 Chlorobium chlorochromatii (strain CaD3) ybeY gene Proteins 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102100027828 DNA repair protein XRCC4 Human genes 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 238000009007 Diagnostic Kit Methods 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102000018389 Exopeptidases Human genes 0.000 description 1
- 108010091443 Exopeptidases Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 241000700662 Fowlpox virus Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- RBSKVTZUFMIWFU-XEGUGMAKSA-N Gln-Trp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O RBSKVTZUFMIWFU-XEGUGMAKSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- 108010021582 Glucokinase Proteins 0.000 description 1
- 102000030595 Glucokinase Human genes 0.000 description 1
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 description 1
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 241001149669 Hanseniaspora Species 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 102000005548 Hexokinase Human genes 0.000 description 1
- 108700040460 Hexokinases Proteins 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- 101000649315 Homo sapiens DNA repair protein XRCC4 Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 101150062179 II gene Proteins 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- IXEFKXAGHRQFAF-HVTMNAMFSA-N Ile-Glu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IXEFKXAGHRQFAF-HVTMNAMFSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- MUFXDFWAJSPHIQ-XDTLVQLUSA-N Ile-Tyr Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 MUFXDFWAJSPHIQ-XDTLVQLUSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241000235651 Lachancea waltii Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 1
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 1
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 102000019040 Nuclear Antigens Human genes 0.000 description 1
- 108010051791 Nuclear Antigens Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 102000001105 Phosphofructokinases Human genes 0.000 description 1
- 108010069341 Phosphofructokinases Proteins 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 102100023715 Poly(A)-specific ribonuclease PARN Human genes 0.000 description 1
- 102000000823 Polynucleotide Ligases Human genes 0.000 description 1
- 108010001797 Polynucleotide Ligases Proteins 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 1
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 description 1
- 108020005115 Pyruvate Kinase Proteins 0.000 description 1
- 102000013009 Pyruvate Kinase Human genes 0.000 description 1
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241000223252 Rhodotorula Species 0.000 description 1
- 101100379247 Salmo trutta apoa1 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 101000869486 Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) Aminoglycoside (3'') (9) adenylyltransferase Proteins 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- 241001123650 Schwanniomyces occidentalis Species 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 241000205091 Sulfolobus solfataricus Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 1
- MVHHTXAUJCIOMZ-WDSOQIARSA-N Trp-Arg-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N MVHHTXAUJCIOMZ-WDSOQIARSA-N 0.000 description 1
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 1
- RERIQEJUYCLJQI-QRTARXTBSA-N Trp-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERIQEJUYCLJQI-QRTARXTBSA-N 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- WHVSJHJTMUHYBT-SRVKXCTJSA-N Val-Met-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N WHVSJHJTMUHYBT-SRVKXCTJSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 235000001513 akia Nutrition 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 208000005266 avian sarcoma Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 231100000147 cell transformation assay Toxicity 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 102000022788 double-stranded DNA binding proteins Human genes 0.000 description 1
- 108091013637 double-stranded DNA binding proteins Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 101150020087 ilvG gene Proteins 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- PLVPPLCLBIEYEA-UHFFFAOYSA-N indoleacrylic acid Natural products C1=CC=C2C(C=CC(=O)O)=CNC2=C1 PLVPPLCLBIEYEA-UHFFFAOYSA-N 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 229920006008 lipopolysaccharide Polymers 0.000 description 1
- 108010013555 lipoprotein-associated coagulation inhibitor Proteins 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 230000012976 mRNA stabilization Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000018343 nutrient deficiency Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000012514 protein characterization Methods 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 210000000717 sertoli cell Anatomy 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/85—Fusion polypeptide containing an RNA binding domain
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 DNA-결합 도메인과 같은 폴리뉴클레오티드-결합 도메인, DNA 리가아제 도메인과 같은 리가아제 도메인을 포함하는 융합폴리펩티드, 이러한 융합폴리펩티드의 생산방법, 및 용도에 관한 것으로, 예를 들어, 분자 생물학적 기술 분야 뿐만 아니라 진단, 단백질 생산, 기능 식품 및 의약 분야에서 적용된다.
Description
본 발명은 분자 생물학 분야에 관한 것으로, 특히 융합 폴리펩티드 및 이들의 용도에 관한 것이다. 특히, 본 발명은 폴리뉴클레오티드에 결합하는 도메인을 포함하고 있는 융합 폴리펩티드 및 DNA 리가아제(리가아제) 도메인과 같은 폴리뉴클레오티드 리가아제 도메인에 관한 것이다. 이러한 융합 폴리펩티드의 제조방법 및 용도도 분자 생물학적 기술 범위 내에서 제공된다.
DNA 리가아제와 같은 폴리뉴클레오티드 리가아제는 가장 널리 사용되는 분자 생물학적 효소이다. 광범위한 다양한 분자 생물학적 방법은 DNA 리가아제의 활성 효율과 상관성이 있다.
다양한 출처의 리가아제들이 분자 생물학에 적용하고자 탐구되어져 왔으며, 분자 생물학적 기법이 필요한 의약, 약학 및 식품산업과 같은 산업분야에서도 점점 사용이 증가되고 있다. 그럼에도 불구하고, DNA 리가아제와 같은 리가아제의 활성을 변경하는 방법에 관해서는 거의 알려진 바가 없다.
본 발명의 목적은 융합 폴리펩티드를 사용하는 방법을 제공하거나 또는 적어도 공중에게 유용한 선택을 제공하기 위하여 DNA 리가아제 활성과 같은 폴리뉴클레오티드 리가아제 활성을 포함하고 있는 융합 폴리펩티드를 제공하는 것이다.
요약
따라서, 본 발명의 제1 구체예는 융합 폴리펩티드를 생산하는 방법으로, 이는
적어도 하나의 발현 구조물을 포함하는 것을 특징으로 하는 숙주 세포를 제공하는 단계;
발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 숙주세포를 유지하는 단계; 및
상기 숙주세포 유래의 융합 폴리펩티드를 분리하는 단계;
로 이루어지고,
상기 발현 구조물이 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열로 이루어지는 것을 특징으로 한다.
본 발명의 한 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 DNA 리가아제 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 RNA 리가아제 폴리펩티드이다.
본 발명의 한 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 DNA-결합 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 RNA-결합 폴리펩티드이다. 예를 들어, 상기 폴리뉴클레오티드-리가아제는 RNA 리가아제 폴리펩티드인 일부 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 용이하게 RNA-결합 폴리펩티드 일 수 있다.
따라서, 본 발명의 한 구체예로, 융합 폴리펩티드를 생산하는 방법으로,
DNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 성열; 및 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 것을 특징으로 하는 숙주 세포를 제공하는 단계;
발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 숙주 세포를 유지하는 단계; 및
숙주 세포로부터 상기 융합 폴리펩티드를 선별하는 단계;
를 포함하는 것을 특징으로 한다.
한 구체예에서, 상기 발현 구조물은 높은 증폭 수(copy number)의 벡터이다.
한 구체예에서, DNA 리가아제 폴리펩티드를 인코딩(encoding)하는 적어도 하나의 핵산 서열을 강력한 프로모터에 작동가능하게 연결한다.
한 구체예에서, DNA-결합 폴리펩티드를 인코딩하는 상기 적어도 하나의 핵산 서열은 강력한 프로모터에 작동가능하게 연결한다.
한 구체예에서, 상기 강력한 프로모터는 바이러스 프로모터 또는 파지 프로모터이다.
한 구체예에서, 상기 프로모터는 파지 프로모터로, 예를 들어, T5 파지 프로모터, 또는 T7 파지 프로모터이다.
다른 구체예에서, 본 발명은 융합 폴리펩티드를 생산하는 방법을 제공하는 것으로,
폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열; 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 것을 특징으로 하는 체외 발현 시스템을 제공하는 단계; 및
발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 발현 시스템을 유지하는 단계;
를 포함하는 것을 특징으로 한다.
일부 구체예에서, 상기 방법은 발현 시스템에서 상기 융합 폴리펩티드를 분리하는 단계를 더 포함한다.
다른 일부 구체예에서, 본 발명은 발현 구조물에 관한 것으로, 상기 발현 구조물은, 폴리뉴클레오티드-리가아제 폴리펩트드를 인코딩하는 적어도 하나의 핵산 서열; 및 폴리튜클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 DNA 리가아제 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클레오티드-리가아제 폴리펩티드는 RNA 리가아제 폴리펩티드이다.
하나의 구체예에서, 상기 폴리뉴클레오티드-결합 폴리펩티드는 DNA-결합 폴리펩티드이다. 다른 구체예에서, 상기 폴리뉴클에오티드-결합 폴리펩티드는 RNA-결합 폴리펩티드이다.
따라서, 하나의 구체예에서, 상기 발현 구조물은, RNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열; 및 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 발현 구조물은 상기 DNA 리가아제 폴리펩티드 및 상기 DNA-결합 폴리펩티드를 포함하는 것을 특징으로 하는 융합 폴리펩티드를 인코딩한다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열 및 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열은 하나의 전사 해석틀(open reading frame)에 존재한다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 강력한 프로모터와 같은 프로모터에 작동가능하게 연결한다.
하나의 구체예에서, 상기 DNA-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 강력한 프로모터와 같은 프로모터에 작동가능하게 연결한다.
본 발명의 다른 측면은 본 발명의 발현 구조물을 포함하는 것을 특징으로 하는 벡터에 관한 것이다.
하나의 구체예에서, 상기 벡터는 높은 증폭수의 벡터이다.
하나의 구체예에서, 상기 벡터는 낮은 증폭수의 벡터이다.
하나의 구체예에서, 상기 벡터는 숙주 세포의 게놈(genome)으로의 안전한 병합(integration)에 적절한다.
본 발명의 다른 측면은 상기에서 정의된 발현 벡터 또는 벡터를 포함하는 것을 특징으로 하는 숙주세포에 관한 것이다.
본 발명의 다른 측면은 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클에오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나의 융합 폴리펩티드에 관한 것이다.
하나의 구체예에서, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함한다.
본 발명의 다른 측면은 상기에서 정의된 방법에 의해 생산되는 융합 폴리펩티드에 관한 것이다.
본 발명의 다른 측면은 융합 폴리펩티드를 포함하는 것을 특징으로 하는 조성물에 관한 것으로, 상기 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함한다.
하나의 구체예에서, 상기 조성물은 융합 폴리펩티드를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함한다.
본 발명의 다른 구체예는 융합 폴리펩티드를 포함하는 것을 특징으로 하는 조성물에 관한 것으로, 상기 융합 폴리펩티드는 상기에서 정의된 방법에 의해 생산된다.
본 발명의 다른 측면은 상기에서 정의된 발현 구조물, 벡터, 또는 숙주세포를 포함하는 것을 특징으로 하는 조성물에 관한 것이다.
본 발명의 다른 측면은 상기에서 정의된 조성물을 포함하는 것을 특징으로 하는 시약(reagent)에 관한 것이다.
하나의 구체예에서, 상기 시약은 진단 시약이다. 다른 구체예에서, 상기 시약은 실험실용 시약이다.
본 발명의 다른 측면은 상기에서 정의된 조성물을 포함하는 것을 특징으로 하는 키트에 관한 것이다.
하나의 구체예에서, 상기 키트는 진단 키트이다. 다른 구체예에서, 상기 키트는 실험실용 키트이다. 다양한 구체예에서, 상기 키트는 하나 이상의 다른 시약, 사용자 설명서 등을 선택적으로 포함한다.
하나의 구체예에서, 상기 조성물은 균일한(homogenous) 융합 폴리펩티드 파풀레이션(population)을 포함한다.
하나의 구체예에서, 상기 조성물은 혼합된 융합 폴리펩티드 파풀레이션을 포함한다.
하나의 구체예에서, 상기 조성물은 하나 이상의 DNA-결합 폴리펩티드와 같은 하나 이상의 폴리뉴틀레오티드-결합 폴리펩티드, 하나 이상의 DNA 리가아제 폴리펩티드와 같은 하나 이상의 폴리뉴클레오티드-리가아제 폴리펩티드, 하나 이상의 공동인자(cofactor), 또는 하나 이상의 조효소(coenzyme)를 하나 이상 포함하는 것을 특징으로 한다.
본 발명의 다른 구체예는 하나 이상의 핵산 분자를 연결하는 방법에 관한 것으로, 상기 방법은 하나 이상의 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 것을 포함하고, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 하나 이상의 핵산 분자를 연결(ligate)하는 방법은 하나 이상의 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 하나 이상의 핵산 분자는 DNA 분자이다. 다른 구체예에서, 상기 하나 이상의 핵산 분자는 적어도 두 개의 DNA 분자이다.
하나의 구체예에서, 상기 하나 이상의 핵산 분자는 하나 이상의 DNA 이중구조(duplex)이다.
하나의 구체예에서, 상기 하나 이상의 DNA 이중구조는 5` or 3` 오버행(overhang)을 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 하나 이상의 DNA 이중구조는 5' 또는 3‘ 오버행을 포함하지 않는 것을 특징으로 한다.
하나의 구체예에서, 하나 이상의 핵산을 연결하는 방법은 하나 이상의 융합 폴리펩티트와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 하나 이상의 핵산 분자는 RNA 분자이다. 다른 구체예에서, 상기 하나 이상의 핵산 분자는 적어도 두 개의 RNA 분자이다. 하나의 구체예에서, 하나 이상의 핵산 분자는 적어도 하나의 DNA 분자 및 적어도 하나의 RNA 분자이다.
다양한 구체예에서, 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하거나, 또는 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 하나 이상의 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 RNA-리가아제 폴리펩티드를 포함하는 것을 특징으로 하거나, 또는 상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 DNA-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
본 발명의 다른 측면은 인산디에스테르 결합의 형성을 촉매하는 방법에 관한 것으로, 상기 방법은 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 폴리뉴클에오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클로티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 인산디에스테르 결합의 형성을 촉매하는 방법은 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 DNA-리가아제 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 인산디에스테르 결합의 형성을 촉매하는 상기 방법은 융합 폴리펩티드와 하나 이상의 핵산 분자를 접촉하는 단계를 포함하고, 상기 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 이상의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 인산디에스테르 결합은 세포내의 결합이다. 다른 구체예에서, 상기 인산디에스테르 결합은 세포간의 결합이다.
하나의 구체예에서, 상기 방법은 5‘ 또는 3’ 오버행을 포함하는 하나 이상의 DNA 이중구조의 연결을 포함하는 것을 특징으로 한다. 특히, 호환되는(compatible) 오버행 말단을 가진 하나 이상의 DNA 이중구조를 연결을 포함하는 것을 특징으로 하는 방법이 고려된다.
하나의 구체예에서, 상기 방법은 5‘ 또는 3’ 오버행을 포함하지 않는(즉, 소위 “두 가닥 말단(blunt-ended) 연결”) 하나 이상의 DNA 이중구조의 연결을 포함하는 것을 특징으로 한다.
호환되는 오버행 말단을 가지고 있는 하나 이상의 DNA 이중구조의 연결을 포함하는 구체예에서, 바람직한 융합 폴리펩티드는 p50-리가아제, 리가아제-p50, NFAT-리가아제, 리가아제-cTF, PprA-리가아제, 리가아제-PprA, p50-LigA, 및 LigA-p50를 포함하는 군으로부터 선택할 수 있고, 더 바람직하게는 p50-리가아제, 리가아제-cTF, 리가아제-PprA, p50-LigA, 및LigA-p50를 함께 포함하는 군으로부터 선택한다.
5‘ 또는 3’ 오버행을 가지고 있지 않거나 또는 호환되는 말단을 가지고 있는 않는 하나 이상의 DNA 이중구조의 연결을 포함하는 것을 특징으로 하는 구체예에서, 바람직한 융합 폴리펩티드는 p50-리가아제, 리가아제-cTF, 리가아제-p50, NFAT-리가아제, 리가아제-PprA, 및 LigA-p50을 포함하는 군으로부터 선택할 수 있으며, 더 바람직하게는 p50-리가아제, 리가아제-cTF, 및 리가아제-PprA를 함께 포함하는 군으로부터 선택하는 것이다.
본 발명의 다른 구체예는 하나 이상의 핵산 분자를 연결하는 융합 폴리펩티드에 관한 것으로, 상기 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드로 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 하나 이상의 핵산을 연결하기 위한 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 융합 폴리펩티드는 Sso7d-리가아제, p50-리가아제, 리가아제-p50, NFAT-리가아제, 리가아제-NFAT, cTF-리가아제, 리가아제-cTF, PprA-리가아제, 리가아제-PprA, p50-LigA 및 LigA-p50을 포함하는 군으로부터 선택되며, 이들의 대표적인 예는 실시예에서 설명된다.
하나의 구체예에서, 하나 이상의 핵산 분자를 연결하기 위한 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 한다.
하나 이상의 핵산 분자를 연결하거나 또는 인산디에스테르 결합의 형성을 촉매하기 위한 조성물의 준비에서 상기에서 설명된 융합 폴리펩티드의 용도가 특별히 심사숙고된다.
하기의 구체예는 상기의 모든 내용들과 연관될 수 있다.
다양한 구체예에서, 상기 DNA 리가아제 폴리펩티드는 원핵생물의 DNA 리가아제, 원핵생물의 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편이다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드는 박테리아 DNA 리가아제, 박테이라 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편이다.
하나의 구체예에서, 상기 DNA 리가아제 폴리펩티드는 바이러스 DNA 리가아제, 바이러스 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편으로 예를 들어, 박테리오파지 DNA 리가아제, 변형물, 또는 이들의 기능이 있는 단편을 포함한다.
특히, E.coli DNA 리가아제 폴리펩티드(예를 들어, GenBank 접근 번호 M24278), 변형물 또는 이들의 기능이 있는 단편, 또는 박테리오파지 T4 DNA 리가아제 폴리펩티드(예를 들어, GenBank 접근번호. X00039), 변형물 또는 이들의 기능이 있는 단편이 심사숙고된다.
다양한 구체예에서, 상기 DNA 리가아제 폴리펩티드는 진핵생물의 DNA 리가아제, 또는 이들의 기능이 있는 단편으로 곰팡이 DNA 리가아제, 또는 포유동물의 DNA 리가아제, 또는 이들의 변형물 또는 기능이 있는 단편을 포함한다. 일부 구체예에서, 상기 DNA 리가아제 폴리펩티드는 포유동물의 DNA 리가아제 I, DNA 리가아제 II, DNA 수선 단백질 XRCC 1와 함께 DNA 리가아제 III를 포함하고 있는 DNA 리가아제 III, 또는 이들의 변형물 또는 기능이 있는 단편을 포함하고 있는 군으로부터 선택된다.
다양한 구체예에서, 상기 RNA 리가아제 폴리펩티드는 T4 RNA 리가아제 I 또는 T4 RNA 리가아제 II와 같은 T4 RNA 리가아제이다.
다양한 구체예에서, 상기 DNA-결합 폴리펩티드는 서열에 비-특이적인 DNA-결합 폴리펩티드이다.
다양한 구체예에서, 상기 DNA-결합 폴리펩티드는 염색체의 단백질, HMf와 유사한 단백질, 및 고세균(archeal)의 작고 기본적인 DNA-결합 단백질을 포함하는 군으로부터 선택된다.
특정 구체예에서, 상기 DNA-결합 폴리펩티드는,
다이노코쿠스 라디오듀런스(Deinococcus radiodurans)의 Ppr 단백질(GenBank 접근 번호 BAA21374); 인간(Homo sapiens (GenBank 접근번호 NP 003989)) 유래의 NF-kappaB 단백질, 또는 NF-kappaB p65 단백질, the NF-kappaB p50 단백질 또는 인간 NF-kappaB 단백질 아미노산 40-366을 포함하고 있는 단편; 결핵균(Mycobacterium tuberculosis) 유래의 Ku 단백질(GenBank 접근번호 NP_215452);
술포로부스 솔파타리쿠스(Sulfolobus solfataricus(GenBank 접근번호 NP_343889)) 유래의 Sso7 단백질;
술포로부스 아키도칼다리우스(Sulfolobus acidocaldarius(GenBank 접근번호 P13123)) 유래의 Sac7d 단백질;
다이노코커스 라디오듀런스(Deinococcus radiodurans (미국특허 제550564호))에서 설명되어져 있고, 상기 미국특허의 전체 내용이 본 발명에서 참조로 사용되었다)의 DdrA 단백질;
생쥐(Mus musculus) 유래의 NFATc 1 단백질과 같은 포유동물의 NFATc 단백질, 또는 생쥐(Mus musculus) 유래의 NFATc 1 단백질의 아미노산 403-703을 포함하고 있는 단편과 같은 이들의 하나 이상의 기능이 있는 단편, 또는 이들의 하나 이상의 기능이 있는 변형물; 또는
인간 NF-kappaB 유래의 아미노산 249-366에 알라닌(alanine) 잔기로 융합된 생쥐(Mus musculus) 유래의 NFATc 아미노산 403-579를 포함하고 있는 NFAT-Ala-p50 하이브리드 DNA-결합 단백질과 같은 이들의 두 개 이상의 모든 조합(본 발명에서 cTF로 언급됨; Lumley 등 (2004), J. Mol. Biol. 339, 1059- 1075 참조-본 발명에서 전체적인 내용이 참조로 사용됨);
을 포함하고 있는 군으로부터 선택된다.
하나의 구체예에서, 상기 DNA-결합 폴리펩티드는 서열에 특이적인 DNA-결합 폴리펩티드, 또는 이들의 기능이 있는 단편 또는 변형물이다.
다양한 구체예에서, 상기 DNA-결합 폴리펩티드는 아연집게(zinc finger) 폴리펩티드, 나선 대 나선 연결구조(helix-turn-helix) 폴리펩티드, 나선 고리 나선 구조(helix-loop-helix) 폴리펩티드, 류신지퍼(leucine zipper) 폴리펩티드, 및 Rel 패밀리 전사요소(family transcription factors)를 포함하는 전사요소를 포함하는 군으로부터 선택되는 폴리펩티드이다.
다양한 구체예에서, 융합 폴리펩티드를 코드하는 상기 핵산 서열은,
DNA 연결 폴리펩티드를 코드하는 핵산 서열의 5‘ 또는 3’ 말단과 인접한 DNA-결합 폴리펩티드을 코드하는 핵산 서열, 또는 원하는 길이의 폴리뉴틀레오티드 링커(linker) 또는 스페이서(spacer) 서열에 의해 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열 5‘ 또는 3’ 말단에 간접적으로 융합된 DNA-결합 폴리펩티드를 코드하는 핵산 서열;
DNA 리가아제 폴리펩티드를 코드하는 핵산 서열로 삽입되는, 선택된 원하는 길이의 폴리뉴클레오티드 링커 또는 스페이서 서열에 의해, DNA-결합 폴리펩티드를 코드하는 핵산 서열;
DNA-결합 폴리펩티드를 코드하는 핵산 서열로, 선택적으로 원하는 길이의 폴리뉴클레오티드 링커 또는 스페이서 서열에 의해, 삽입되는 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열;
DNA-결합 폴리펩티드를 코드하는 핵산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열 사이에 존재하는 프로테아제에 의해 잘리는 사이트를 코드하는 핵산 서열;
DNA-결합 폴리펩티드를 코드하는 핵산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 핵산 서열 사이에 존재하는 자가 스프라이싱(self-splicing) 요소를 코드하는 핵산 서열; 또는
이들의 두 개 이상의 모든 조합;
을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 적어도 하나의 융합 폴리펩티드는,
DNA-결합 폴리펩티드를 포함하거나 또는 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N- 또는 C- 말단 끝과 인접한 DNA-결합 폴리펩티드 결합 도메인을 포함하는 아미노산 서열;
원하는 길이의 펩티드 링커 또는 스페이서 서열에 의해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N- 또는 C- 말단과 간접적으로 융합된 DNA-결합 폴리펩티드를 포함하는 아미노산 서열;
펩티드 링커 또는 원하는 길이의 스페이서 서열에 의해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열로 삽입되는 DNA-결합 폴리펩티드를 포함하는 아미노산 서열;
DNA-결합 폴리펩티드를 포함하는 아미노산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 아미노산 서열 사이에 배치된 프로테아제에 의해 잘려지는 위치를 포함하는 아미노산 서열;
DNA-결합 폴리펩티드를 포함하는 아미노산 서열 및 DNA 리가아제 폴리펩티드를 코드하는 아미노산 서열 사이에 배치된 자가 스프라이싱 요소를 포함하는 아미노산 서열; 또는
이들의 두 개 이상의 모든 조합;
을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 적어도 하나의 융합 폴리펩티드는 실온에서 개선된 안정성, 또는 20℃, 19℃, 18℃, 17℃, 16℃, 15℃, 14℃, 13℃, 12℃, 11 ℃, 10℃, 9℃, 8℃, 7℃, 6℃, 5℃, 4℃, 3℃, 20℃, 2℃, 1℃, 또는 0℃ 에서 개선된 안정성과 같은 개선된 안정성을 가진다. 예를 들어, 실온, 또는 20℃, 19℃, 18℃, 17℃, 16℃, 15℃, 14℃, 13℃, 12℃, 11℃, 10℃, 9℃, 8℃, 7℃, 6℃, 5℃, 4℃, 3℃, 2℃, 1 ℃, 또는 0℃에서 보관될 때, 상기 융합 폴리펩티드는 실온에서 보관될 때, 적어도 약 24시간 동안, 20시간, 16시간, 12시간, 11시간, 약 10, 9, 8, 7, 6, 5, 4, 3, 또는 약 2시간, 또는 약 1시간 동안은 활성을 유지한다.
다양한 구체예에서, 상기 발현 구조물은 항상 발현하는(constitutive) 또는 조절 가능한 프로모터 시스템을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 상기 조절 가능한 프로모터 시스템은 유도하거나 또는 억제할 수 있는 프로모터 시스템이다.
다양한 구체예에서, 상기 조절 가능한 프로모터 시스템은 Lacl, Trp, 파지 λ, 파지 RNA 폴리머레이즈(polymerase), 및 E. coli RNA 폴리머레이즈 프로모터 시스템에서 선택한다.
하나의 구체예에서, 상기 프로모터는 당업자에게 알려진 모든 강력한 프로모터일 수 있다. 적절한 강력한 프로모터는 아데노바이러스의 주요한 후반부(adenoviral major late) 프로모터와 같은 아데노바이러스 프로모터; 또는 거대세포바이러스(cytomegalovirus, CMV) 프로모터; 호흡기 세포 융합 바이러스(respiratory syncytial virus, RSV) 프로모터; MMT 프로모터, 메탈로티오네인(metallothionein) 프로모터; 열 충격(heat shock) 프로모터; 알부민 프로모터; ApoAI 프로모터; 인간 글로빈(globin) 프로모터; 헤르페스 심플렉스 티미민 키나아제(Herpes simplex thymidine kinase) 프로모터와 같은 바이러스 티미딘 키나아제 프로모터; 레트로바이러스(retroviral) LTRs; 베타-엑틴(b-actin) 프로모터; 인간 성장 호르몬 프로모토; T5, T7, SP6 및 T3 RNA 폴리메라제 프로모터와 같은 파지 프로모터 및 꽃양배추의 모자이크(mosaic) 35S(CaMV) 프로모터를 포함한다.
다양한 구체예에서, 상기 프로모터는 서열번호 5의 뉴클레오티드 1-95에서 나타내는 서열을 가진 프로모터이다.
다양한 구체예에서, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중에서 하나의 10개 이상의 인접한 아미노산을 포함한다. 바람직하게는, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중에서 하나에서 적어도 15, 적어도 20, 더 바람직하게는 적어도 30, 더 바람직하게는 적어도 40, 더 바람직하게는 적어도 50, 더 바람직하게는 적어도 60, 더 바람직하게는 적어도 70, 더 바람직하게는 적어도 80, 더 바람직하게는 적어도 90, 더 바람직하게는 100, 더 바람직하게는 적어도 150, 또는 더 바람직하게는 적어도 200개의 인접한 아미노산을 포함한다.
하나의 구체예에서, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중 하나의 서열을 포함하는 폴리펩티드의 기능이 있는 변형물 또는 기능을 있는 단편이다.
다양한 대표적인 구체예에서, 상기 융합 폴리펩티드는,
서열번호 6의 아미노산 18 내지 344;
서열번호 8의 아미노산 18 내지 300;
서열번호 10의 아미노산 18 내지 79; 또는
서열번호 16의 아미노산 514 내지 842;
를 포함하는 군으로부터 선택된 서열유래의 적어도 10개의 인접한 아미노산을 포함하고; 그리고
서열번호 6의 아미노산 358 내지 843;
서열번호 8의 아미노산 311 내지 796;
서열번호 10의 아미노산 90 내지 575; 또는
서열번호 16의 아미노산 18 내지 503;
을 포함하는 군으로부터 선택된 서열유래의 적어도 10개의 인접한 아미노산을 포함하는 것을 특징으로 한다.
다양한 대표적인 구체예에서, 상기 융합 폴리펩티드는 서열번호 6, 8, 10, 또는 16 중 하나의 서열을 포함하는 것을 특징으로 한다.
다양한 구체예에서, 본 발명은 서열번호 5, 7, 9, 또는 15 중 하나에서 적어도 10개의 인접한 뉴클레오티드를 포함하는 선별, 정제, 또는 재조합된 폴리뉴클레오티드를 제공한다.
다양한 대표적인 구체예에서, 상기 폴리뉴클레오티드는,
서열번호 5의 뉴클레오티드 166 내지 1146;
서열번호 5의 뉴클레오티드 166 내지 1185;
서열번호 7의 뉴클레오티드 166 내지 1014;
서열번호 7의 뉴클레오티드 166 내지 1044;
서열번호 9의 뉴클레오티드 166 내지 351;
서열번호 9의 뉴클레오티드 166 내지 381;
서열번호 15의 뉴클레오티드 1624 내지 2640; 또는
서열번호 15의 뉴클레오티드 1654 내지 2640;
포함하는 군으로부터 선택된 서열유래의 적어도 10개의 인접한 뉴틀레오티드; 및
서열번호 5의 뉴클레오티드 1147 내지 2643;
서열번호 5의 뉴클레오티드 1186 내지 2643;
서열번호 7의 뉴클레오티드 1015 내지 2502; .
서열번호 7의 뉴클레오티드 1045 내지 2502;
서열번호 9의 뉴클레오티드 352 내지 1839;
서열번호 9 뉴클레오티드 382 내지 1839;
서열번호 15의 뉴클레오티드 166 내지 1623; 또는
서열번호 15의 뉴클레오티드 166 내지 1653;
를 포함하는 군으로부터 선택된 서열 유래의 적어도 10개의 인접한 뉴클레오티드를 포함하는 것을 특징으로 한다.
하나의 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 166-1146를 포함하거나, 또는 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 116 내지 1185를 포함하는 것을 특징으로 한다. 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 1147 내지 2643을 포함하는 것을 특징으로 한다.
또 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 뉴클레오티드 166 내지 2643을 포함한다. 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 5의 서열을 포함한다.
다양한 구체예에서, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오다이드 166 내지 1014를 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오티드 166-1044를 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오티드 1015 내지 2502를 포함한다.
대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 7의 뉴클레오티드 166 내지 2502를 포함한다. 또 다른 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 7의 서열을 포함한다.
다양한 구체예에서, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 166 내지 351을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 166 내지 381을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 352 내지 1839를 포함한다.
하나의 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 9의 뉴클레오티드 166 내지 1839를 포함한다. 또 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 9의 서열을 포함한다.
다양한 다른 구체예에서, 상기 폴리뉴클레오티드는 서열번호 15의 166 내지 1623을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 15의 뉴클레오티드 166 내지 1653을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 15의 뉴클레오티드 1624 내지 2640을 포함하거나 또는, 상기 폴리뉴클레오티드는 서열번호 15의 뉴클레오티드 1654 내지 2640을 포함한다.
대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 15의 뉴틀레오티드 166 내지 2640을 포함한다. 또 다른 대표적인 구체예에서, 상기 폴리뉴클레오티드는 서열번호 15의 서열을 포함한다.
다양한 구체예에서, 상기 세포는 각각 다른 융합 폴리펩티드를 인코드 하는 두 개 이상의 다른 발현 구조물을 포함한다.
본 발명에서 기재된 숫자 범위에 대한 참조는 그 범위 내의(예를 들어, 1, 1.1, 2, 3, 3.9, 4, 5, 6, 6.5, 7, 8, 9 및 10) 합리적인 모든 수 및 그 범위 내의(예를 들어, 2 내지 8, 1.5 내지 5.5, 및 3.1 내지 4.7) 합리적인 수의 모든 범위에 대하여 참조로 사용되도록 의도되었으며, 따라서, 본 발명에서 기재된 모든 범위의 모든 하위 범위는 이런 식으로 기재하여 표현하였다. 이들은 단지 특정하게 의도된 예이며, 열거된 최저값 및 최고값 사이의 모든 가능한 수치의 조합이 유사한 방법으로 이러한 적용방식으로 표현된다.
본 명세서에서 참조로 만들어진 특허 명세서, 기타 외부의 문헌, 또는 기타 정보 공급은 일반적으로 본 발명의 특징을 논하기 위해서이다. 특별히 반대로 언급되어져 있지 않다면, 이러한 외부 문헌에 대한 참조는 이러한 문헌, 또는 이러한 정보가 종래의 기술이거나 또는 당분야의 일반적인 상식적의 부분인 것을 나타내고자 참조한 것은 아니다.
도면의 설명
본 발명의 다른 측면은 단지 예시로 주어진 도면을 참고함으로써, 하기의 도면에 의해 명백해질 것이다.
도 1a는 T4 리가아제 융합 단백질과 외가닥말단(cohesive-end) 연결에 대한 겔(gel) 상에서의 체외 연결 활성 분석의 대표적인 도면이다. 시료는 다음과 같이 적용되었다: 문자 마커(1 및 2번째 줄), Sso7d-리가아제(2번째 줄), cTF-리가아제(3번째 줄), 리가아제-cTF(4번째 줄), p50-리가아제(5번째 줄), 리가아제-p50(6번째 줄), NFAT-리가아제(7번째 줄), 리가아제-NFAT(8번째 줄), PprA-리가아제(10번째 줄), 리가아제-PprA(11번째 줄), Ku-리가아제(12번째 줄), 리가아제-Ku(13번째 줄), T4 DNA 리가아제(14번째 줄), 음성 대조군(15번째 줄).
도 1b는 T4 DNA 리가아제 융합 단백질과 두가닥 말단(blunt-end) 연결에 대한 겔상에서의 체외 연결의 대표적인 도면을 보여준다.
도 2b는 대장균 LigA 리가아제 융합 단백질과 외가닥 말단 연결에 대한 겔 상의 체외 연결 활성 분석에 대한 대표적인 도면을 보여준다.
도 2b는 대장균 LigA 리가아제 융합 단백질와 두가닥 말단 연결에 대한 겔 상의 체외 연결 활성 분석의 대표적인 도면을 보여준다.
도 3 및 4는 실시예 5에서 설명된 양적인(quantitative) PCR을 기반으로 한 연결 활성 분석의 결과를 보여주는 그래프이다.
도5는 두가닥 말단 연결에 대한 겔 상의 체외 연결 활성 분석의 대표적인 도면은 보여준다. 시료는 다음과 같이 적용된다: Sso7d-리가아제(1번째 줄), p50-리가아제(2번째 줄), 리가아제-PprA(3번째 줄), 리가아제-cTF(4번째 줄), T4 DNA 리가아제(5번째 줄), 음성 대조군(6번째 줄), 양성 대조군(7번째 줄), 분자 마커(8번째 줄).
발명의 상세한 설명
본 발명은 융합 폴리펩티드 및 이들의 용도에 관한 것이다. 특히, 본 발명은 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 단백질과 융합된 DNA 리가아제 폴리펩티드와 같은 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 융합 폴리펩티드 및 다양한 분자 생물학적 방법에서의 이들의 용도에 관한 것이다.
1. 용어 정의
“고세균의 작은 기본적인 DNA-결합 단백질” 구문은 설펄로버스 설파타리쿠스(Sulfolobus sulfataricus)유래의 Sso-7d와 같은 천연상의 고세균의 작은 기본 DNA-결합 단백질에 대한 거의 대략 50 % 동일성을 가지는 50 내지 75 개의 아미노산에 관한 것으로, 천연 고세균의 작은 기본 DNA-결합 단백질에 대하여 특이적인 항체에 결합한다.
단어 “코딩 지역(coding region)" 또는 ”전사 해석들(open reading frame, ORF)“은 적절한 조절 서열에 의해서 전사 산물(transcription product) 및/또는 폴리펩티드를 생산할 수 있는 게놈 DNA 서열 또는 cDNA 서열의 센스가닥(sense standard)에 관한 것이다.
코딩서열은 5‘ 번역 시작 코돈(translation start codon) 및 3' 번역 종결 코돈(translation stop codon)의 존재에 의해 확인된다. 유전자의 구조물 상으로 삽입된 때, “코딩 서열”은 작동하는 프로모터 및 종결(terminator) 서열에 연결될 때 발현될 수 있다.
본 명세서에서 사용되는 단어 "포함하는"은 "적어도 부분으로 이루어지는"것을 의미한다. 본 명세서에서 "포함하는" 단어를 가지고 있는 각각의 문장을 해석할 때는, 그 단어에 의해 발달된 특징 이상이 존재할 수도 있다. 단어 "~을 포함하는" 및 "~것들을 포함하는" 것처럼 관련된 단어들은 같은 방식으로 해석되어야 한다.
당업자들은 몇몇 폴리뉴클레오티드-결합 폴리펩티드는 DNA 및 RNA(및 실제 기타 폴리펩티드의 유사물)에 대하여 활성을 가진다는 것을 인지하고 있을 것이다.
따라서, 단어 ‘폴리뉴클레오티드-결합 폴리펩티드’는 DNA, RNA, 또는 이들의 유사물과 같은 하나 이상의 폴리뉴클레오티드와 결합할 수 있는 폴리펩티드를 말한다.
본 발명에서 사용된 단어 ‘DNA-결합 폴리펩티드는 DNA에 결합할 수 있는 폴리펩티드’에 관한 것으로, 외가닥 DNA, 두가닥 DNA, 및 다른 형태의 DNA에 결합하는 폴리펩티드를 포함한다.
본 발명에서 설명된 것처럼, 상기 DNA-결합 폴리펩티드는 DNA-결합 폴리펩티드 또는 리가아제를 비활성하는 않으면서, DNA 리가아제 폴리펩티드, 예를 들어, DNA 리가아제의 N-말단(terminus) 또는 C-말단(terminus)에 결합할 수 있다.
DNA-결합 폴리펩티드는 DNA 외에 예를 들어, RNA, 또는 알려진 천연 뉴클레오티드의 유사물과 같은 폴리뉴클레오티드에도 결합 할 수 있다.
당업자들은 일부 폴리뉴클레오티드-리가아제 폴리펩티드는 DNA 및 RNA(및 실질적인 다른 폴리뉴클레오티드 유사물)에 대한 활성을 가진다는 것을 인지하고 있을 것이다.
단어 ‘DNA 리가아제 폴리펩티드’는 본 발명에서 DNA 폴리펩티드 상에서 우선적인 활성을 보여주는 폴리펩티드에 대하여 우선적으로 사용될 수 있으며, 본 발명에서 사용되는 상기 단어는 일반적으로 인산디에스테르 결합의 형성을 촉매할 수 있는 폴리펩티드를 의미한다.
단어 "도메인(domain)"은 단백질의 한 단위 또는 단백질 복합체를 의미하는 것으로, 폴리펩티드 서열, 완벽한(complete) 폴리펩티드 서열, 또는 복수의 폴리펩티드 서열을 포함하며, 상기 단위는 이미 증명된 기능을 가진다. 상기 기능은 광범위하게 정의 될 수 있는 것으로 이해되어져야 하며, 리간드(ligand) 결합 또는 촉매 활성이거나, 또는 단백질 구조를 안정화하는 효과를 가질 수 있다.
단어 "발현 구조물"은 삽입된 폴리뉴클레오티드 분자를 전사하도록 하는데 필수적인 요소를 포함하는 유전적인 구조물에 관한 것으로, 선택적으로 상기 전사물을 폴리펩트티를 번역하도록 하는 필수적인 요소를 포함한다. 발현 구조물은 전형적으로 5'에서 3‘ 방향으로 하기를 포함한다:
(1) 상기 구조물이 도입된 숙주세포에서 기능을 하는 프로모터,
(2) 발현되는 폴리뉴클레오티드, 및
(3) 구조물이 도입된 숙주세포에서 기능을 하는 종결자(terminator).
본 발명의 발현 구조물은 클로닝 또는 발현을 위해 복제 가능한 벡터로 삽입되거나, 또는 숙주의 게놈으로 병합될 수 있다.
폴리펩티드의 "단편(fragment)" 는 효소의 또는 결합 활성을 위해 필요하고/또는 폴리펩티드이 3차원적 구조를 형성하는데 기능을 하는 폴리펩티드 서열이다.
본 발명에서 사용되는 단어 ‘융합 폴리펩티드’는 두 개 이상의 아미노산의 부분서열(subsequence)을 포함하는 폴리펩티드를 말하는 것으로, 예를 들어, 하나의 연속하는 폴리펩티드를 형성하도록 융합된(예를 들어, 펩티드 연결에 의한 각각의 아미노산 및 카르복실 잔기에 의해서) 두 개 이상의 폴리펩티드를 의미한다.
두 개 이상의 아미노산 서열은 링커 또는 스페이서(spacer) 또는 부가적인 폴리펩티드에 의해서 이들의 각각의 아미노 및 카르복실 말단에 의해 직접적 또는 간접적으로 융합될 수 있음을 이해해야 한다.
하나의 구체예에서, 융합 폴리펩티드를 포함하고 있는 상기 아미노산 서열 중 하나는 DNA 리가아제 폴리펩티드를 포함한다.
하나의 구체예에서, 상기 융합 폴리펩티드를 포함하는 상기 아미노산 서열 중의 하나는 DNA-결합 폴리펩티드를 포함한다.
DNA 리가아제 폴리펩티드 및 DNA-결합 폴리펩티드를 포함하는 대표적인 융합 폴리펩티드는 본 발명의 실시예 및 서열 ID 리스트에서 제시되며, 본 발명에서 특별히 심사숙고하였다.
하나의 구체예에서, 상기 융합 폴리펩티드의 아미노산 부분서열은 DNA 리가아제-링커-DNA-결합 폴리펩티드 또는 DNA-결합 폴리펩티드-링커-DNA 리가아제, 또는 예를 들어, DNA-리가아제-링커-DNA-결합 폴리펩티드 결합 도메인 또는 DNA-결합 폴리펩티드 결합 도메인-링커-DNA 리가아제 순서로 배열된 상기 융합 폴리펩티드의 아미노산 서열인 링커 또는 스페이서에 의해서 간접적으로 융합된다.
다른 구체예에서, 상기 융합 폴리펩티드의 아미노산 서열은 DNA 리가아제-부가적인 폴리펩티드-DNA-결합 폴리펩티드 또는 DNA-리가아제-부가적인 폴리펩티드-DNA-결합 폴리펩티드 결합 도메인, 또는 DNA 리가아제-링커-DNA-결합 폴리펩티드-부가적인 폴리펩티드 또는 DNA 리가아제-링커-DNA-결합 폴리펩티드 결합 도메인-부가적인 폴리펩티드의 순서로 배열된 부가적인 폴리펩티드를 포함하거나 간접적으로 융합한다. 또한, DNA 리가아제와 같은 폴리뉴클레오티드-리가아제 폴리펩티드의 N-말단 확장 및 C-말단 확장 모두는 본 발명에서 특별히 심사숙고되었다.
본 발명에 따른 융합 폴리펩티드는 다른 폴리펩티드의 서열 내에 삽입되는 하나 이상의 폴리펩티드 서열도 포함할 수 있다. 예를 들어, 프로테아제 인식 서열과 같은 폴리펩티드 서열은 DNA-결합 도메인을 포함하고 있는 단백질의 다양한 지역으로 삽입될 수 있다.
용이하게, 본 발명의 융합 폴리펩티드는 하나의 핵산 서열에 의해 코드될 수 있으며, 상기 핵산 서열은 폴리펩티드 또는 폴리펩티드 도메인 각각을 인코드 하는 적어도 두 개의 부분 서열을 포함한다.
일부 구체예에서, 상기 적어도 두 개의 부분 서열은 하나의 전사핵석틀을 포함하며, 본 발명에서 심사숙고된 것처럼 융합 폴리펩티드를 인코드하도록 인프레임(in frame)으로 존재한다.
다른 구체예에서, 상기 적어도 두 개의 부분 서열은 "아웃 어브 프레임(out of frame)"으로 존재할 수 있으며, 번역시에 융합 폴리펩티드가 형성되도록 해독틀(reading frame)에서 변환(shift)을 촉진하는 리보좀 프레임-변환 위치 또는 기타 서열에 의해서 분리될 수 있다.
다른 구체예에서, 상기에서 논의된 적어도 두 개의 폴리펩티드 또는 폴리펩티드 도메인이 부가된 폴리펩티드에 의해 간접적으로 융합되는 것처럼, 적어도 두 개의 부분 서열은 인접하고 있지 않다.
단어 “유전자 구조물”은 폴리뉴클레오티드를 말하는 것으로, cDNA 분자 또는 PCR 산물과 같은(그러나 이로 한정되지 않음) 다른 폴리뉴클레오티드 분자(삽입되는 폴리뉴클레오티드 분자)로 삽입될 수 있는 이중 가닥 DNA를 의미한다.
유전자 구조물은 삽입된 폴리뉴클레오티드의 전사를 허락하는, 선택적으로 전사체가 폴리펩티드로 번역되는 것을 허락하는, 필요한 요소들을 포함할 수 있다.
상기 삽입되는 폴리뉴클레오티드 분자는 숙주 세포로부터 유래되거나 다른 세포 또는 개체로부터 유래될 수 있으며/또는 재조합 폴리뉴클레오티드일 수 있다.
숙주 세포 내에 있게 되면, 상기 유전자 구조물은 숙주 세포의 염색체 DNA로 통합될 수 있다. 상기 유전자 구조물은 벡터에 연결될 수 있다.
단어 “숙주 세포”는 박테리아 세포, 곰팡이 세포, 효모 세포, 식물 세포, 곤충 세포 또는 발현 구조물의 발현을 지지할 수 있는 포유동물의 숙주 세포와 같은 동물 세포를 의미한다.
본 발명에서 사용된 단어 “링커(linker)” 또는 “스페이서(spacer)”는 아미노산 또는 뉴클레오티드 서열에 관한 것으로, 간접적으로 두 개 이상의 폴리펩티드 또는 두 개 이상의 폴리펩티드를 인코드하는 두 개 이상의 핵산 서열에 융합한다.
일부 구체예에서, 상기 링커 또는 스페이서는 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 약 100개의 아미노산 또는 뉴클레오티드 길이이다. 다른 구체예에서, 상기 링커 또는 스페이서는 약 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950 또는 약 1000개의 아미노산 또는 핵산 길이이다.
다른 구체예에서, 상기 링커 또는 스페이서는 약 1 내지 1000 개의 아미노산 또는 뉴클레오티드이며, 구체적으로 약 10 내지 약 1000, 약 50 내지 약 1000, 약 100 내지 약 1000, 약 200 내지 1000, 약 300 내지 약 1000, 약 400 내지 1000, 약 500 내지 1000, 약 600 내지 1000, 약 700 내지 1000, 약 800 내지 1000, 약 900 내지 1000 개의 아미노산 또는 뉴클레오티드이다.
하나의 구체예에서, 상기 링커 또는 스페이서는 제한 효소 인식 사이트를 포함할 수 있다. 다른 구체예에서, 상기 링커 또는 스페이서는 엔테로키나아제(enterokinase), 트롬빈(thrombin) 또는 요소 Xa(Factor Xa) 인식 서열과 같은 프로테아제가 인식해서 자르는 서열, 또는 인테인(intein)과 같은 자가 스프라이싱 요소(self-splicing element)를 포함한다. 다른 구체예에서, 상기 링커 또는 스페이서는 융합 폴리펩티드의 독립적인 폴딩(folding)을 촉진한다.
본 발명에서 사용된 단어 “혼합된 파풀레이션(population)”은 두 개 이상의 독립체 파풀레이션을 의미하는 것으로, 상기 혼합된 파풀레이션 내의 각각의 독립체 파풀레이션은 상기 혼합된 파풀레이션내의 다른 독립체 파풀레이션과는 몇 가지 면에서 다르다.
예를 들어, 발현 구조물의 혼합된 파풀레이션과 관련하여 사용될 때, 이것은 두 개 이상의 발현 구조물의 파풀레이션을 의미하는 것으로, 각각의 발현 구조물 파풀레이션은 그 파풀레이션 구성물에 의해 인코드되는 융합 폴리펩티드, 또는 그 구조물 내에 존재하는 프로모터의 종류와 같은 구조물의 몇몇 다른 점들에 의해서 다르다.
별도로, 융합 폴리펩티드의 혼합 파풀레이션과 관련하여 사용될 때, 이것은 두 개 이상의 융합 폴리펩티드 파풀레이션을 의미하는 것으로, 융합 폴리펩티드의 각각의 파풀레이션은 폴리뉴클레오티드-리가아제 폴리펩티드과 같은 폴리펩티드, 예를 들어 DNA 리가아제, 또는 상기 파풀레이션의 멤버가 포함하고 있는 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드와는 다르다.
본 발명에서 사용되는 단어 “핵산”는 디옥시리보뉴클레오티드(deoxyribonucleotide), 리보뉴클레오티드(ribonucleotide) 베이스(base) 또는 본래의 뉴클레오티드의 잘 알려진 유사물, 또는 이들의 혼합물의 외가닥 또는 이중가닥의 중합체(polymer)를 의미한다. 상기 단어는 반대로 언급되지 않았다면, 특정 서열 뿐만 아니라 이들에 상응하는(complementary) 서열을 포함한다. 본 발명에서 단어 “핵산” 및 “폴리뉴클레오티드”는 함께 사용된다.
“작동 가능하도록 연결된”은 발현되는 서열은 프로모커, 조직-특이적인 조절 요소, 일시적인 조절 요소, 증폭자(enhancer), 억제자(repressor) 및 종결자(terminator)를 포함하는 조절 요소하에 배치된다.
단어 "과발현(over-expression)"은 일반적으로 정상적인 또는 형질전환되지 않은(non-trans정방향med) 숙주 세포내의 생산보다 더 많은 생산을 하는 숙주세포내의 유전자의 발현 산물을 의미한다. mRNA의 양과 관련하여 사용되는 단어 "과발현(overexpression)"은 대조군 또는 형질전화되지 않은 세포인 숙주세포에서 일반적으로 관찰되는 것보다 적어도 3배 이상의 발현양을 의미하는 것이다. 바람직하게는, 발현양은 대조군 숙주 세포 또는 형질전환되지 않은 세포에서 관찰되는 것보다. 적어도 약 5배 이상, 약 10배 이상, 약 15배 이상, 약 20배 이상, 약 25배 이상, 약 30배 이상, 약 35배 이상, 약 40배 이상, 약 45배 이상, 약 50배 이상, 약 55배 이상, 약 60배 이상, 약 65배이상, 약 70배 이상, 약 75배 이상, 약 80배 이상, 약 85배 이상, 약 90배 이상, 약 95배 이상, 약 100 이상 또는 그 이상이다.
mRNA의 발현양은 당업자에게 알려져 있는 노던 블랏(Northern blot) 분석 및 양적인(quantitative) RT-PCR을 포함하는 RT-PCR과 같은 여러 가지 기술을 사용하면서 측정될 수 있다.
본 발명에서 사용된 단어 “폴리펩티드”는 모든 길이의 아미노산 체인(chain)을 포함하고, 바람직하게는 적어도 5개의 아미노산으로 전체길이(Full-length) 단백질을 포함하며, 아미노산 잔기는 공유결합의 펩티드 결합에 의해 연결된다.
본 발명의 폴리펩티드는 정제된 천연의 산물이거나, 또는 재조합 또는 합성 기술을 사용하면서 부분적으로 또는 전체적으로 생산될 수 있다. 상기 단어는 이합체(dimer) 또는 다른 다합체(mulimer), 융합 폴리펩티드, 폴리펩티드 변형물 또는 이들의 유도체와 같은 폴리펩티드 응집체인 폴리펩티드를 말한다.
단어 “프로모터”는 유전자의 전사를 조절하는 코딩 지역의 업스트림(upstream)에 있는 전사되지 않는 시스-조절 인자(cis-regulatory element)를 말한다. 프로모터는 전자 시작 사이트(transcription initiation site) 및 TATA(conserved box), 박스, 및 모티프(motif)와 같은 보전된 박스를 특정화하는 시스-조절 인자를 포함한다.
본 발명의 폴리펩티드와 관련하여 사용될 때, 구문 “활성을 유지하는” 및 문법적으로 상응하는 표현 및 이들의 유사한 표현은 폴리펩티드가 유용한 리가아제 활성, 유용한 폴리뉴클레오티드-결합 활성(DNA-결합 활성과 같은), 또는 유용한 리가아제 활성 및 유용한 폴리뉴클레오티드-결합 활성 모두를 여전히 가지고 있음을 나타내기 위함이다.
바람직하게는, 상기 유지된 활성은 적어도 약 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 99 또는 100 %의 기본적인 활성을 가지고, 유용한 범위는 이러한 값들 중에서(예를 들어, 약 35 내지 약 100 %, 약 50 내지 약 100 %, 약 60 내지 약 100%, 약 70 내지 약 100 %, 약 80 내지 약 100 %, 및 약 90 내지 약 100%) 선택될 수 있다. 예를 들어, 본 발명의 바람직한 폴리펩티드는 주어진 보관 기간 동안, 예를 들어, 4 도에서 약 1시간 후에 상기 폴리펩티드의 원래의 활성에서 적어도 약 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 99 또는 100 % 활성을 유지한다. 유사하게, 본 발명의 바람직한 조성물은 이들이 포함하는 폴리펩티드의 유용한 활성의 유지를 도울 수 있으며, 본 발명에서 심사숙고된 방법을 사용하면서 사용될 때까지 이상적으로 활성을 유지할 수 있다.
본 발명에서 사용된 단어 “개선된 안정성”이 본 발명의 폴리펩티드 또는 조성물과 관련하여서 사용될 때, 상기 단어는 주어진 기간, 또는 특별한 상황에서, 또는 두 가지의 조건에서, 예를 들어 4 도에서 1시간, 활성을 유지할 수 있는 폴리펩티드 또는 주어진 기간 동안 폴리펩티드의 활성을 도울 수 있는 조성물을 의미한다. 일부 구체예에서, 본 발명의 융합 폴리펩티드의 상기 유지된 리가아제 활성은 같은 기간 동안 같은 조건에서 유지될 때 천연의 리가아제 폴리펩티드에서 보이는 것보다 더 우수하다. 다른 구체예에서, 본 발명의 융합 폴리펩티드의 상기 유지된 폴리뉴클레오티드-결합 활성은 같은 기간 동안 같은 조건에서 유지될 때 천연의 폴리뉴클레오티드-결합 폴리펩티드에서보다 더 우수하다.
구문 “서열 특이성이 없는 DNA-결합 도메인”은 뉴클레오티드 서열에 독립적인 방법으로 DNA(및 다른 핵산을 선택할 수 있음)에 대한 분명한 친화력으로 결합하는 폴리펩티드 도메인을 의미한다. 예를 들어, 별개의 뉴클레오티드 서열이 아닌 동일한 뉴클레오티드 조성물을 가진 것으로 다른 핵산보다 10배 이상, 또는 20배 이상, 또는 50배 이상, 또는 100배 이상의 친화력을 가지고 폴리펩티드 도메인에 결합할 수 있는 것으로 알려진 핵산이 없다.
구문 “서열 특이적인 DNA-결합 도메인”은 핵산 서열에 의존적인(dependent) 방식으로 DNA(및 다른 핵산을 선택할 수 있음)에 대한 분명한 친화력을 가지고 결합하는 폴리펩티드를 말한다. 예를 들어, 별개의 뉴클레오티드 서열이 아닌 동일한 뉴클레오티드 조성물을 가진 다른 핵산보다 10배 이상, 20배 이상, 50배 이상, 또는 100이상의 친화력으로 폴리펩티드 도메인에 결합할 수 있는 알려진 핵산이 있다.
단어 “물질(substance)”는 의도된 융합 폴리펩티드와 결합하거나, 흡수되거나, 또는 병합되는 것과 관련하여 언급될 때, 중합체 융합 폴리펩티드내로 흡수되거나 병합될 수 있는 융합 파트너 또는 물질에 의해 결합되는 물질을 의미한다.
단어 "종결자(terminator)"는 번역되는 서열의 다운스트림(dowmsteam)에 있는 유전자의 3'의 번역되지 않는 끝 쪽(ntranslated end)에서 발견되는 전사를 종결하는 서열을 말한다. 종결자는 mRNA의 안정성을 결정에 영향을 주는 중요한 결정자로, 몇몇 경우에서 공간적인 조절 기능을 가지는 것으로 알려졌다.
본 발명에서 제공되는 폴리뉴클레오티드 서열의 "단편(fragment)"는 연속하는 뉴클레오티드 서열로, 바람직하게는 적어도 15개 이상의 뉴클레오티드이다. 본 발명의 단편은 바람직하게는 본 발명의 폴리뉴클레오티드 중에서 적어도 20개의 뉴클레오티드, 더 바람직하게는 적어도 30개의 뉴클레오티드, 더 바람직하게는 적어도 40개 이상의 뉴클레오티드, 더 바람직하게는 50개 이상의 뉴클레오티드 및 가장 바람직하게는 적어도 60개의 연속하는 뉴클레오티드이다.
프로모터 폴리뉴클레오티드 서열과 관련하여 단어 "단편(fragment)"는 시스-인자를 포함하는 서열 및 상기 단편이 작동가능하도록 연결된 폴리뉴클레오티드 서열의 발현을 조절할 수 있는 프로모터 폴리뉴클레오티드 서열 부분을 포함한다. 본 발명의 폴리뉴클레오티드 서열의 단편은 본 발명의 폴리뉴클레오티드 중에서 바람직하게는 적어도 20개, 더 바람직하게는 적어도 30개, 더 바람직하게는 적어도 40개, 더 바람직하게는 적어도 50개, 더 바람직하게는 적어도 100개, 더 바람직하게는 적어도 200개, 더 바람직하게는 적어도 300개, 더 바람직하게는 적어도 400개, 더 바람직하게는 적어도 500개, 더 바람직하게는 적어도 600개, 더 바람직하게는 적어도 700개, 더 바람직하게는 적어도 800개, 더 바람직하게는 적어도 900개 및 가장 바람직하게는 적어도 100개의 뉴클레오티드를 포함한다.
본 발명에서 사용된 단어 "기능을 가지는 변형물(functional variant)" 및 "기능을 가지는 단편(functional fragment)"은 예를 들어, DNA 리가아제(들) 또는 DNA-결합 폴리펩티드(들)과 관련하여, 하나 이상의 아미노산 잔기가 삭제, 치환, 또는 첨가된 특이적으로 확인된 서열(들)과는 다른 폴리펩티드 서열 또는 특이적으로 확인된 서열(들)의 단편을 포함하는 서열을 말한다. 기능을 가지는 변형물은 자연적으로 발생하는 대립형질의(allelic) 변형물, 또는 비-자연적으로 발생하는 변형물일 수 있다. 기능을 가지는 변형물은 동일한 또는 다른 종래이며, 호모로그(homologue), 패러로그(paralogue) 및 오쏘로그(orthologue)을 포함할 수 있다. 폴리펩티드의 기능을 가지는 변형물 또는 기능을 가지는 단편은 자연적인 폴리펩티드에 의해 알려진 하나 이상의 생물학적인 효과를 얻을 수 있는 것과 같은 자연적으로 특이성을 가지는 것으로 증명된 폴리펩티드의 생물학적 활성을 하나 이상 가진다. 예를 들어, DNA 리가아제의 기능이 있는 단편은 일반적으로 인산디에스테르 결합의 형성을 촉매할 수 있을 것이다.
기능이 있는 변형물 또는 기능이 단편은 본래의 폴리펩티드보다 더 크거나 적은 활성을 가질 수 있다. 하나의 예로, 기능이 있는 변형물 또는 기능이 있는 단편이 가지고 있는 특이적으로 확인된 폴리펩티드의 하나 이상의 생물학적 활성은 본래의 폴리펩티드에서 발견되것보다 기능이 있는 변형물 또는 기능이 있는 단편에서 더 크거나 낮은 정도에서 존재할 수 있다.
다른 예에서, 기능이 있는 변형물 또는 기능이 있는 단편이 가지고 있는 특이성이 있는 것으로 확인된 본래의 폴리펩티드의 각각의 생물학적 활성은 본래의 폴리펩티드에서 발견된 것보다 기능이 있는 변형물 또는 기능이 있는 단편에 더 크거나 낮은 정도로 존재한다. 다른 예에서, 하나 이상의 본래의 폴리펩티드의 생물학적 활성이 유지되거나 본래의 폴리펩티드에서 발견되는 것보다 더 큰 정도로 생물학적 활성이 존재하는 기능이 있는 변형물 또는 기능이 있는 단편을 제공하는 것이 바람직하지만, 본래의 폴리펩티드의 다른 하나 이상의 생물학적 활성은 존재하지 않거나 또는 본래의 폴리펩티드에서 발견되는 것보다 더 낮은 정도로 존재한다. 이러한 기능이 단편의 예는 본 발명에서 설명되는 NF-kappaB 및 NFAT DNA 결합 폴리펩티드 단편을 포함한다.
DNA 리가아제와 같은 폴리뉴클레오티드-리가아제, 또는 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드에 의해 알려지는 하나 이상의 생물학적 효과를 확인하는 방법 또는 분석은 당 분야에서 잘 알려져 있으며, 본 발명의 실시예에서 설명되고, 이러한 방법 및 분석은 하나 이상의 기능이 있는 변형물 또는 폴리뉴클레오티드 리가아제 또는 폴리뉴클레오티드-결합 폴리펩티드의 기능이 있는 단편을 증명하고 확인하기 위해 사용될 수 있다. 예를 들어, 실시예에서 설명된 것과 같은 하나의, 큰 단편을 형성하는 두 개의 선형 DNA 단편의 연결을 촉매하는 DNA 리가아제의 능력 분석은 DNA 리가아제의 하나 이상의 기능이 있는 변형물 또는 기능이 있는 단편을 확인하는 것으로 가능하다.
기능을 가지는 단편의 예는 촉매 활성에 큰 영향을 끼치는(예를 들어, 서열에 비특이적인 DNA 결합, 또는 인산디에스테르결합 형성) 아미노산 서열을 포함하는 폴리펩티드 단편을 포함한다.
본 발명의 폴리펩티드 서열의 바람직한 단편(첨부된 서열 확인 목록에서 확인되는 서열)은 본 발명의 폴리펩티드 중에서 적어도 10개, 적어도 15개, 적어도 20개, 더 바람직하게는 30개, 더 바람직하게는 40개, 더 바람직하게는 50개, 더 바람직하게는 60개, 더 바람직하게는 70개, 더 바람직하게는 80개, 더 바람직하게는 90개, 더 바람직하게는 100개, 더 바람직하게는 150개, 더 바람직하게는 200개, 더 바람직하게는 250개, 더 바람직하게는 300개, 더 바람직하게는 350개, 더 바람직하게는 400개, 가장 바람직하게는 450개의 연속하는 아미노산 서열을 포함한다.
단어 "프라이머(primer)"는 항상 유리의 3‘ OH기를 가지는 짧은 뉴클레오티드를 말하는 것으로, 주형에 혼성화(hybridize)되며 상보적인 폴리뉴클레오티드의 중합을 시작하기 위하여 사용된다.
이러한 프라이머는 바람직하게는 적어도 5개, 더 바람직하게는 적어도 6개, 더 바람직하게는 적어도 7개, 더 바람직하게는 적어도 8개, 더 바람직하게는 적어도 9개, 더 바람직하게는 적어도 10개, 더 바람직하게는 적어도 11개 , 더 바람직하게는 적어도 12개, 더 바람직하게는 적어도 13개, 더 바람직하게는 적어도 14개, 더 바람직하게는 적어도 15개, 더 바람직하게는 적어도 16개, 더 바람직하게는 적어도 17개, 더 바람직하게는 적어도 18개, 더 바람직하게는 적어도 19개, 더 바람직하게는 적어도 20개의 뉴클레오티드 길이이다.
단어 "프로브(probe)"는 짧은 폴리뉴클레오티드를 말하는 것으로 하이브리디제이션(hybridization)을 기본으로 한 분석에서 프로브에 상보적인 폴리뉴클레오티드 서열을 탐지하고자 사용된다.
상기 프로브는 본 발명에서 정의되는 폴리뉴클레오티드의 “단편”으로 이루어질 수 있다. 이러한 프로브는 바람직하게는 적어도 5개, 더 바람직하게는 적어도 10개, 더 바람직하게는 적어도 20개, 더 바람직하게는 적어도 30개, 더 바람직하게는 적어도 40개, 더 바람직하게는 적어도 50개, 더 바람직하게는 적어도 100개, 더 바람직하게는 적어도 200개, 더 바람직하게는 적어도 300개, 더 바람직하게는 적어도 400개 및 가장 바람직하게는 적어도 500개의 뉴클레오티드 길이다.
본 발명에서 사용된 단어 "변형물(variant)"은 특이적으로 확인된 서열과는 다른 폴리뉴클레오티드 또는 폴리펩티드 서열을 말하는 것으로, 하나 이상의 폴리뉴클레오티드 또는 아미노산 잔기는 삭제, 치환, 또는 첨가된다. 변형물은 자연적으로 발생하는 대립형질의(allelic)의 변형물, 또는 자연적으로 발생하지 않는 변형물일 수 있다. 변형물은 동일한 또는 다른 종 유래일 수 있으며, 호모로그(homologue), 패러로그(paralogue) 및 오쏘로그(orthologue)을 포함할 수 있다. 일부 구체예에서, 상기 폴리뉴클레오티드 및 폴리펩티드의 변형물은 야생형(wild type) 폴리뉴클레오티드 또는 폴리펩티드와 동일하거나 유사한 생물학적 활성을 가진다. 폴리뉴클레오티드 및 폴리펩티드과 관련하여 단어 "변형물(varient)"은 본 발명에서 정의된 모든 형태의 폴리뉴클레오티드 및 폴리펩티드를 포함한다.
폴리뉴클레오티드 및 폴리펩티드 변형물
본 발명에서 사용된 단어 "폴리뉴클레오티드(polynucleotide(s))"는 모든 길이의 외가닥 또는 이중 가닥 디옥시리보뉴클레오티드(deoxyribonucleotide) 또는 리보뉴클레오티드(ribonucleotide)를 의미하고 코딩 및 코딩되지 않는 유전자 서열, 센스(sense) 및 안티센트(antisense) 서열 상보물(complement), 엑손(exon), 인트론(intron), 게놈 DNA, cDNA, mRNA 전구체, mRNA, rRNA, siRNA, miRNA, tRNA, 리보자임(ribozyme), 재조합 폴리펩티드, 선별되고 정제된 자연적으로 발생하는 DNA 또는 RNA 서열, 합성 RNA 및 DNA 서열, 핵산 프로브, 프라이머 및 단편을 의미한다. 많은 수의 핵산 유사물이 당 분야에서 잘 알려져 있으며, 또한 심사숙고된다.
폴리 뉴클레오티드 변형물
폴리뉴클레오티드 유사물의 서열은 특정한 폴리뉴클레오티드 서열에 대하여 바람직하게는 적어도 50 %, 더 바람직하게는 적어도 51 %, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 59%, 적어도 60%, 적어도 61 %, 적어도 62%, 적어도 63%, 적어도 64%, 적어도 65%, 적어도 66%, 적어도 67%, 적어도 68%, 적어도 69%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 보인다. 동일성은 적어도 20개의 뉴클레오티드, 바람직하게는 적어도 20개의 뉴클레오티드, 적어도 100개의 뉴클레오티드 위치, 또는 특정된 폴리뉴클레오티드의 전체 길이에 걸쳐서 위치를 비교하는 방식으로 확인해야 한다.
폴리뉴클레오티드 서열의 동일성은 하기의 방법으로 결정될 수 있다. 목적하는 폴리뉴클레오티드 서열은 NCBI (ftp://ftp.ncbi.nih.gov/blast/)에 공개되어 사용 가능한 BLASTN(bl2seq내에 있는 BLAST 속편 프로그램, 버전 2.2.10(2004년 10월(Tatiana A. Tatusova, Thomas L. Madden (1999), "Blast 2 sequences - a new tool 정방향 comparing protein-and nucleotide sequences", FEMS Microbiol Lett. 174:247-250)) 사용하여서 후보의 폴리뉴클레오티드 서열에 비교된다. bl2seq의 초기값은 낮은 복잡성 부분(low complexity part)의 여과를 끄지 않고 사용된다.
폴리뉴클레오티드 서열은 동일성은 하기의 유닉스 명령 선 값(unix command line parameter)을 사용하면서 평가될 수 있다.
bl2seq -i nucleotideseql -j nucleotideseq2 -F F -p blastn
패러미터 -F F는 복잡성이 낮은 부분을 여과하는 것을 끈다. 상기 매개변수 -P는 서열 쌍에 대한 적절한 알고리즘을 선택한다. 상기 bl2seq 프로그램은 "Idnetidities =" 줄에서 동일한 뉴클레오티드 수와 퍼센트로 서열의 동일성을 나타낸다.
폴리뉴클레오티드 서열의 동일성은 세계적인 서열 정렬 프로그램(즉, Needleman, S. B. 및 Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453)을 사용하면서 후보자와 비교하는 폴리뉴클레오티드 서열 간의 겹치는 전체적인 길이에 걸쳐서 계산될 수도 있다. 세계적인 정렬 알고지금의 전체적인 실행은 EMBOSS 패키지 내의 니들(needle) 프로그램(Rice, P. Longden, I. and Bleasby, A. EMBOSS: The European Molecular Biology Open Software Suite, Trends in Genetics June 2000, vol 16, No 6. pp.276-277)에서 발견되며, http://www.hgmp.mrc.ac.uk/Software/EMBOSS/. Needleman-Wunsch에서 얻을 수 있다. 유럽 생물정보학 연구소(European Bioin정방향matics Institute) 서버도 http:/www.ebi.ac.uk/emboss/align/에서 두 서열간의 EMBOSS-니들 세계적인 정렬을 수행하는 기능을 제공한다.
별개로 상기 GAP 프로그램은 말단의 차이(terminal gap)에 패널티 없이 두 개의 서열에 대한 최적의 전체적인 정렬(alignment)을 계산하고자 사용될 수 있다. GAP은 다음의 논문에서 설명되어져 있다: Huang, X. (1994) On Global Sequence Alignment. Computer Applications in the Biosciences 10, 227-235.
본 발명의 폴리뉴클에오티드 변형물은 이러한 서열의 기능적인 유사성을 가질 것으로 고려되는 하나 이상의 특이적인 것으로 확인된 서열에 대한 유사성을 보이며 우연에 의해 발생되지 않았을 것으로 합리적으로 판단되는 것들도 포함한다. 폴리펩티드와 관련하여 이러한 서열의 유사성은 BLAST 속편 프로그램(NCBI (ftp://ftp.ncbi.nih.gov/blast/)의 버전 2.2.10(2004년 10월)의 공개되어 사용가능한 bl2seq 프로그램을 사용하여서 판단될 수 있다.
폴리뉴클레오티드의 서열의 유사성은 다음의 유닉스 명령 선 값을 사용하면서 평가될 수 있다: bl2seq -i nucleotideseql -j nucleotideseq2 -F F -p tblastx
상기 값 -F F는 낮은 복잡성 부분의 여과를 끈다. 상기 값 -p 은 서열쌍에 대한 적절한 알고리즘을 선택한다. 상기 프로그램은 상기 서열간의 유사한 지역을 발견하고 각각의 지역에 대하여 무작위 서열을 포함하고 있는 고정된 크기의 참조의 데이터베이스내에서 우연하게 일치되어 발견될 수 있는 것으로 평가되는 횟수인 “E 값”을 제공한다. 이러한 데이터베이스의 크기는 bl2seq 프로그램내의 디폴트 초기값에 의해 설정된다. 1 보다 훨씬 작은 E 값은 이러한 무작위적인 맞춤의 대략적인 가능성이다.
변형물 폴리뉴클레오티드 서열이 특이적인 것으로 확인된 서열의 어떤 하나와 비교될 때, 바람직하게는 1 x 10-10 이하, 더 바람직하게는 1 x 10-20 이하, 1 x 10-30 이하, 1 x 10-40 이하, 1 x 10-50 이하, 1 x 10-60 이하, 1 x 10-70 이하, 1 x 10-80 이하, 1 x 10-90 이하, 1 x 10-100 이하, 1 x 10-110 이하, 1 x 10-120 이하, 또는 1 x 10-123 이하의 E 값을 보여준다.
별개로, 본 발명의 변형물 폴리뉴클레오티드는 엄격한 상태에서 특이적인 폴리뉴클레오티드 서열, 또는 이들의 상보물에 혼성화한다.
단어 “엄격한 상황에서 혼성화한다”, 및 이의 문법적으로 유사한 단어는 알려진 온도 및 염 농도에서 타겟 폴리뉴클레오티드 분자에(서던 블랏(Southern blot) 또는 노던 블랏(Northern blot)과 같은 DNA 또는 RNA 블랏위에 고정되는 타겟 폴리뉴클레오티드 분자와 같은) 혼성화하는 폴리뉴클레오티드 분자의 능력을 말한다. 엄격한 하이브리다이제이션 상태에서 혼성화하는 능력은 초기에 덜 엄격한 상태에서 혼성화 한 후, 원하는 엄격함으로 엄격성을 높임으로써 결정될 수 있다.
약 100 베이스보다 큰 폴리뉴클레오티드 분자와 관련하여, 일반적인 엄격한 하이브리다이제이션 조건은 천연의(native) 이중구조물의 녹는 온도(Tm) 이하인 25 ℃ 내지 30 ℃ 이하(예를 들어, 10 ℃) 이다(일반적인 참조, Sambrook 등, 1987 에디션, Molecular Cloning, A Laboratory Manual, 2nd Ed. Cold Spring Harbor 출판; Ausubel 등, 1987, Current Protocols in Molecular Biology, Greene 출판). 100 베이스보다 큰 폴리뉴클레오티드의 Tm은 공식: Tm = 81. 5 + 0. 41 % (G + C)-log (Na+)에 의해 계산될 수 있다(Sambrook 등, 1987 에디션, Molecular Cloning, 실험실 메뉴얼, 2번째 에디션, Cold Spring Harbor Press; Bolton 및 McCarthy, 1962, PNAS 84: 1390). 100 베이스보다 큰 길이의 폴리뉴클레오티드의 일반적인 엄격한 조건은 하룻밤동안 6X SSC, 0.2% SDS에서의 준비 세척; 65℃, 6X SSC, 0.2% SDS에서 하이브리다이제이션; 65 ℃, 1X SSC, 0.1% SDS에서 30분간 두 번 세척 및 65 ℃ 0.2 X SSC, 0.1% SDS에서 30분간 2번 세척과 같은 하이브리다이제이션 조건일 수 있다.
100 베이스보다 적은 길이의 폴리뉴클레오티드 분자와 관련하여, 대표적인 엄격한 하이브리다이제이션 조건은 5 내지 10 ℃ 이하의 Tm이다. 평균적으로, 100 bp 이하의 폴리뉴클레오티드 분자의 Tm은 대략 (500/올리고뉴클레오티드 길이)도로 감소된다.
DNA를 모방한 펩티드 핵산(PNAs)와 관련하여(Nielsen 등, Science. 1991년 12월 6;254(5037): 1497-500), Tm값은 DNA-DNA 또는 DNA-RNA에 대한 것보다 더 높고, Giesen 등, Nucleic Acids Res. 1998년 11월, l ;26(21):5004-6에서 설명된 공식에 의해서 계산될 수 있다. 100 베이드 미만의 길이인 DNA-RNA 하이브리드의 대표적인 엄격한 하이브리다이제이션 조건은 5 내지 10 ℃ 이상의 Tm이다.
본 발명의 변형물 폴리뉴클레오티드는 본 발명의 서열과는 다른 폴리뉴클레오티드도 포함하지만, 유전자 코드의 변경처럼, 본 발명의 변형물 폴리뉴클레오티드는폴리뉴클레오티드에 의해 인코드되는 폴리펩티드에 대하여 유사한 활성을 가지는 폴리펩티드를 인코드한다.
폴리펩티드의 아미노산 서열을 바꾸지 않는 서열 변경은 “조용한 변이(silent variation)”이다. ATG(메티오닌, methionine) 및 TGG(트립토판, tryptophan)를 제외하고, 동일한 아미노산의 다른 코돈은 당분야에서 알려진 기술에 의해서 특정 숙주 개체내의 코돈의 발현을 최적하고자 변경될 수 있다. 생물학적 활성을 바꾸지 않고 인코드된 폴리펩티드 서열내의 하나 이상의 아미노산의 보존되는 치환으로 결과되는 폴리뉴클레오티드 서열 변경도 본 발명에 포함된다. 당업자는 유전자형과 관련하여 조용한 아미노산 치환을 만드는 방법을 인지하고 있을 것이다(참조, Bowie 등, 1990, Science 247, 1306). 일부 구체예에서, 보존되지 않는 아미노산 치환으로 결과되는 폴리뉴클레오티드 서열 변경은 본 발명에서 심사숙고된 기능적인 변형물을 초래하며, 이러한 서열 변경도 본 발명에 포함된다.
인코드되는 폴리펩티드 서열내의 조용한 다양화 및 보전된 치환에 의한 다양한 폴리뉴클에오티드는 상기에서 설명된 것처럼, 공개되어 사용가능한 BLAST 속편 프로그램의 bl2seq 프로그램(버전 2.2.10, 2004년 10월), NCBI (ftp://ftp.ncbi.nih.gov/blast/)을 사용하면서 결정될 수 있다.
폴리펩티드 변형물
폴리펩티드와 관련하여 단어 “변형물”은 자연적으로 발생하고, 재조합되며, 합성에 의해 생산된 폴리뉴클레오티드를 포함한다. 폴리펩티드 변형물은 본 발명의 서열에 대하여 바람직하게는 적어도 50%, 더 바람직하게는 적어도 51%, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 59%, 적어도 60%, 적어도 61%, 적어도 62%, 적어도 63%, 적어도 64%, 적어도 65%, 적어도 66%, 적어도 67%, 적어도 68%, 적어도 69%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 보인다.
동일성은 적어도 20개의 아미노산 위치, 바람직하게는 적어도 50개의 아미노산 위치, 적어도 100개의 아미노산 위치, 또는 본 발명의 폴리펩티드의 전체 길이를 비교하는 것으로 확인된다.
폴리펩티드 서열의 동일성은 다음의 방법으로 결정될 수 있다. 비교되는 폴리펩티드 서열은 NCBI(ftp://ftp.ncbi.nih.gov/blast/bl2seq)에서 공개되어 사용가능한 bl2seq 내의 BLASTP(BLAST의 속편 프로그램, 버전 2.2.10, 2004년 10월)를 사용하면서 후보 폴리펩티드 서열과 비교된다. bl2seq의 기초값은 낮은 복잡성을 갖는 지역의 여과를 끄지 않고 사용될 수 있다.
폴리펩티드 서열의 동일성은 세계적인 서열 정렬 프로그램을 사용하여서 후보 폴리뉴클레오티드 서열 및 비교되는 폴리뉴클레오티드 서열 사이의 겹치는 전체 길이에 걸쳐서 계산될 수도 있다. 상기에서 논의된 EMBOSS-니들(httpr/www.ebi. ac.uk/emboss/align/) 및 GAP (Huang, X. (1994) On Global Sequence Alignment. Computer Applications in the Biosciences 10, 227-235)도 폴리펩티드 서열 동일성을 평가하는데 적절한 세계적인 서열 정렬 프로그램이다.
또한, 본 발명의 폴리펩티드 변형물은 이러한 서열의 기능적인 유사성을 보전하고 있음직한 특이적으로 확인된 하나 이상의 서열에 대하여 유사성을 보이는 것들 및 무작위적인 변경에 의해 발생했을 것으로 예상되지 않는 것들을 포함한다. 폴리펩티드와 관련하여 이러한 서열 유사성은 NCBI(ftp://ftp.ncbi.nih.gov/blast/)의 BLAST 속편 프로그램(버전 2.2.10, 2004년 10월)인 공개되어 사용가능한 bl2seq을 사용하면서 판단할 수 있다. 폴리펩티드 서열의 유사성은 다음의 유닉스 명령 선 값을 사용하면서 평가될 수 있다: bl2seq -i peptideseql -j peptideseq2 -F F -p blastp.
특이적으로 확인된 서열중의 하나와 비교될 때, 변형물 폴리펩티드 서열은 바람직하게는 1 x 10-10 미만, 더 바람직하게는 1 x 10-20 미만, 1 x 10-30 미만 1 x 10-40 미만, 1 x 10-50 미만, 1 x 10-60 미만, 1 x 10-70 미만 1 x 10-80 미만, 1 x 10-90 미만, 1 xlO-100 미만, 1 x 10-110 미만, 1 x 10-120 미만, 또는 1 x 10-123 미만의 E 값을 나타낸다.
값 -FF는 낮은 복잡성 부위를 여과하는 것을 끈다. 값 -p는 서열쌍에 대한 적절한 알고리즘을 선택한다. 이러한 프로그램은 서열간의 유사한 지역을 발견하고, 각각의 지역에 대하여, 무작위적인 서열을 포함하고 있는 고정된 크기의 참조인 데이터베이스내에서 우연하게 맞는 기대되는 값인 "E 값"을 보고한다. 1보다 훨씬 작은 E값은 이러한 무작위적인 맞춤의 대략적인 가능성이다.
생물학적 활성의 분명한 변경이 없는 것으로 설명되는 폴리펩티드 서열의 하나 이상의 아미노산의 보전된 치환도 본 발명에 포함된다. 당업자는 유전자형과 관련하여 조용한 아미노산 치환을 만드는 방법을 인지하고 있을 것이다(참조, Bowie 등, 1990, Science 247, 1306), 반면에, 보전되지 않은 치한을 포함하는 하나 이상의 아미노산 치환에 의한 기능적인 변형물이 본 발명에 포함된다.
또한, 본 발명의 폴리펩티드 변형물은 폴리펩티드를 인코드하는 핵산에 의해 생산되지만, 변경된 아미노산 서열을 갖도록 다르게 처리되어 야생형 폴리펩티드와는 다른 것을 포함한다. 예를 들어, 변형물은 야생형 폴리펩티드를 생산하는 초기의(primary) RNA 전사물의 별도의 스프라이싱 형태에 의해 생산될 수 있다.
단어 “벡터(vector)"는 폴리뉴클레오티드 분자를 말하는 것으로, 숙주세포내로 유전자 구조를 이송하는데 사용되는 이중 가닥 DNA이다. 상기 벡터는 대장균과 같은 적어도 하나의 부가적인 숙주 시스템에서 복제될 수 있다.
2. 폴리뉴클레오티드 리가아제
폴리뉴클레오티드 리가아제(또한 여기에서 폴리뉴클레오티드-리가아제 폴리펩티드로서 나타낸다)는 하나의 뉴클레오티드의 3’수산기 말단과 다른 뉴클레오티드의 5’ 인산염 말단 사이에 인산디에스테르 결합을 형성하는데 촉매작용을 할 수 있는 폴리펩티드이다. 예를 들면, DNA 리가아제(또한 여기에서는 DNA 리가아제 폴리펩티드로서 나타낸다)는 하나의 디옥시리보오스 뉴클레오티드의 3’수산기 말단과 다른 디옥시리보오스 뉴클레오티드의 5’ 인산염 말단 사이에 인산디에스테르 결합을 형성하는데 촉매작용을 할 수 있는 폴리펩티드이다. 일반적으로 Tomkinson 등, (2006), Chem. 역방향., 106, 687-699에서 검토된 DNA 리가아제는 본 발명에 포함된다. 또한, RNA 리가아제는 하나의 리보오스 뉴클레오티드 3’수산기 말단과 다른 리보오스 뉴클레오티드 5’ 인산염 말단 사이에 인산디에스테르 결합을 형성하는데 촉매작용을 한다.
2.1 바이러스 DNA 리가아제
가장 단순한 DNA 리가아제는 박테리오파지를 포함하는 바이러스로부터 유래된다. 바이러스 DNA 리가아제는 뉴클레오티드-결합 도메인 및 OB-폴드 도메인인 두 개의 도메인을 포함한다(Tomkinson 등, 2006). 바이러스 DNA 리가아제는 활성을 위하여 뉴클레오티드 보조인자 아데노신-5’-트리포스페이트(ATP)가 필요하다. 박테리오파지 T4 유래의 DNA 리가아제는 DNA, RNA 또는 DNA/RNA 하이브리드 이중구조 상에서 이중가닥 말단이고 그리고 외가닥 말단된 DNA 말단 뿐만 아니라 회복된 단일가닥과 연결되기 때문에 보통 체외 적용에서 사용된다. T4 DNA 리가아제를 포함하는 바이러스 리가아제는 본 발명에서 사용되기 위하여 처리할 수 있을 것이다.
2.2 원핵생물의 DNA 리가아제
박테리아는 활성을 위하여 ATP 대신 니코틴아미드 아데닌 디뉴클레오티드 (NAD+) 보조인자를 요구하는 DNA 리가아제를 포함한다. AND+-의존 DNA 리가아제는 뉴클레오티드-결합 및 OB-폴드 도메인, DNA-결합 및/또는 촉매작용을 돕는 하나 또는 하나 이상의 추가적인 도메인으로 이루어진 코어 모듈을 포함한다 Tomkinson 등, 2006). 대장균 유래의 NAD+-의존 리가아제는 이중가닥 말단 DNA 종점에 연결되지 않고, DNA는 RNA에 연결되지 않는다. 그러므로, NAD+-의존 리가아제는 선택적인 외가닥 말단의 연결이 필요하기 때문에 체외 적용에서 사용된다. 대장균 DNA 리가아제를 포함하는 NAD+-의존 박테리아 리가아제는 본 발명에서 사용되기 위하여 처리할 수 있을 것이다.
2.3 진핵 생물 및 고세균 DNA 리가아제
진핵 생물 및 고세균 유래의 DNA 리가아제는 ATP-의존적인 다양한-도메인 효소이다. 각각의 진핵 생물 게놈은 하나의 DNA 리가아제보다 더 인코드된다. 서로 다른 세포의 역할을 위한 서로 다른 리가아제의 보충은 추가적인 단백질 인자들과 특정한 상호작용에 의하여 영향을 받는다(Tomkinson 등, 2006). 대다수의 진핵 생물 DNA 리가아제는 특정되고, 본발명에서 사용하기 위하여 처리할 수 있을 것이다. 진핵 생물 DNA 리가아제는 일반적으로 포유류 DNA 리가아제 I, DAN 리가아제 II(DNA 리가아제 III로부터 선택적으로 스플리스됨), DNA 리가아제 III(DNA 회복 단백질 XRCC1의 조합상의 DNA 리가아제 III를 포함), 및 DNA 리가아제 IV(XRCC4의 조합상의 DNA 리가아제 IV를 포함)에 포함되는 것으로 여겨지는 포유류의 DNA 리가아제를 포함한다. 약간의 고세균 DNA 리가아제는 특정되고, 본 발명에서 사용되기 위하여 처리할 수 있을 것이다. 고세균 DNA 리가아제는 호열성 리가아제, 예를 들면 Nishida 등 (2006), J. Mol. Biol. 360, 956-967에 기재된 파이로코커스 퓨리오서스(Pyrococcus furiosus)로부터 유래되는 리가아제를 포함한다.
2.4 RNA 리가아제
RNA 리가아제는 본 발명이 속하는 기술에서 잘 알려져 있고, 본 발명에서 유용하다. 박테리오파지 T4 유래의 RNA 리가아제는 상당히 잘 특정되고, 상당히 넓은 기질 특성을 나타내기 때문에 RNA의 3’말단의 방사성 표지, 올리고디옥시리보뉴클레오티드 및 올리고리보뉴클레오티드의 원형화, 올리고머 및 닉의 연결, 혼성 및 융합 RNA/DNA 분자, 및 miRNA 복제와 같은 체외 적용을 위하여 제안된다. 예를 들면, T4 RNA 리가아제 I는 DNA 또는 RNA의 단일 가닥 5’-인산염 말단과 DNA 또는 RNA의 단일 가닥 3’-수산기 말단의 ATP-의존 공유결합에 촉매작용을 한다. T4 RNA 리가아제 II는 T4 RNA 리가아제 I과 비슷한 활성을 가지나, 이중 가닥 기질에 더 바람직하다. T4 RNA 리가아제 I 및 T4 RNA 리가아제 II, 이들의 기능이 있는 단편을 포함하는 바이러스 리가아제는 본 발명에서 사용하기 위하여 처리할 수 있을 것이다.
3. 폴리뉴클레오티드-결합 폴리펩티드
폴리튜클레오티드-결합 폴리펩티드는 서열에 특이적 또는 서열에 비특이적으로 폴리뉴클레오티드와 결합할 수 있는 폴리펩티드이다. 예를 들면, DNA-결합 폴리펩티드는 단일 가닥의 DNA, 이중 가닥의 DNA, 또는 다른 배열의 DNA와 결합하는 폴리펩티드를 포함하는 DNA와 결합할 수 있는 폴리펩티드이다. 당업자는 예상할 수 있기 때문에, 본 발명을 목적을 위하여 DNA-결합 폴리펩티드는 서열 비특이적 DNA-결합 폴리펩티드, 및 서열 특이적 DNA-결합 폴리펩티드 상에서 넓게 분리되어 있다.
3.1 서열 비-특이적 DNA-결합 폴리펩티드
폴리펩티드가 결합된 서열 비-특이적 핵산, 바람직하게는 서열 비-특이적 DNA-결합 폴리펩티드는 서열-독립적인 방법으로 핵산에 결합되는 폴리펩티드 또는 도메인과 같은 정의된 구역의 폴리펩티드이다. 즉, 폴리펩티드와 뉴클레오티드의 결합은 특정한 뉴클레오티드 서열을 위하여 두드러진 선호를 보이지 않는다.
특히 본 발명에 사용되기 적합한 서열 비-특이적 DNA-결합 폴리펩티드의 예는 디이노코커스 라디오두란스(Deinococcus radiodurans)의 PprA 단백질(접근 번호 BAA21374), 결핵균(Mycobacterium tuberculosis) 유래의 Ku 단백질(접근 번호 NP_343889), Sac7d 및 Sso7d를 포함하는 고세균의 작고 기본적인 DNA에 결합하는 단백질(각각의 접근 번호 PI 3123, 및 NP_343889), 디이노코커스 라디오두란스의 DdrA 단백질(미국등록특허 제7550564호에 개시되고, 그 전체가 본 발명에 포함됨), 고세균 HMf 유사 단백질(접근 번호 U08838 및 NP 633849를 포함하지만, 이에 한정되지 않음), 및 PCNA 상동체(접근 번호 NP 578712 및 NP 615084를 포함하지만, 이에 한정되지 않음)를 포함하지만, 이에 한정되지 않는다.
PprA는 DNA 손상을 수복하는 것으로 알려진 디이노코커스 라디오두란스로부터 유래된 대략 32 kDa 단백질이다. 체외에서, PprA는 우선적으로 DNA 분자의 말단에 결합되고(Murakami 등, (2006), Biochimica et Biophysica Acta - Proteins and Proteomics, 1764, 20-23), 체내에서 PprA는 DNA 손상지역에서 DNA 수복 단백질을 구성하기 위하여 중요하다(Narumi 등, (2004) Molecular Microbiology, 54, 278-285).
Sso7d 및 Sac7d는 대략 7 kDa이고, 각각 초고온성 아키아(archaea) 술포로버스 솔파타리쿠스균(Sulfolobus solfataricus) 및 술포로버스 아시도살다리우스균(S. acidocaldarius) 유래의 기본적인 염색체 단백질이다. 이러한 단백질들은 리신이 풍부하고, 높은 열, 산 및 화학적 안정성을 갖는다. 이러한 단백질들은 서열-독립적인 방법으로 DNA에 결합하고, 상승된 온도에서 게놈 DNA를 안정화 시키는 데에 연관되어 있는 것으로 알려져 있다.
HMf 유사 단백질은 아미노산 서열 및 진핵 생물 H4 히스톤의 구조에서 상동성을 공유하는 것으로 알려진 고세균 히스톤이다. 단백질의 HMf 패밀리는 용액에서 안정한 이량체를 형성하고, 몇몇의 HMf 상동체는 호열성 미생물로부터 확인되는 것으로 알려져 있다.
다수의 패밀리 B DNA 폴리머라아제는 예를 들면, 효율적인 DNA 합성을 달성하기 위하여 보조 단백질과 상호 작용을 하는 것으로 알려져 있다. 한 종류의 보조 단백질은 슬라이딩 클램프로서 나타난다. 다중결합의 클램프는 이중 가닥 DNA를 수용할 수 있는 토러스 유사 구조를 형성할 수 있다. 상기 슬라이딩 클램프는 특정 DNA 폴리머라아제의 C 말단과 상호 작용을 하고, 합성 시 이러한 폴리머라아제를 DNA 주형에 고정시키는 것을 도와주는 것으로 알려져 있다.
진핵 생물의 슬라이딩 클램프는 증식세포핵항원(proliferating cell nuclear antigen, PCNA)로 나타나고, 반면 다른 도메인 상의 유사한 단백질은 종종 PCNA 상동체로 나타난다. 이러한 상동체는 구조적 유사성이 표시되나, 서열 유사성이 제한된다. PCNA 상동체는 술포로버스 솔파타리쿠스균, 파이로코커스 퓨리오서스 등과 같은 호열성 아키아를 포함하는 비진핵 생물 유기체로부터 확인된다. PCNA 및 PCNA 상동체는 본 발명의 서열 비-특이적 DNA-결합 폴리펩티드로 유용하다.
본 발명에서의 사용에 적합한 서열 비-특이적 DNA-결합 도메인은 서열-독립적인 (바람직하게는 이중 가닥) 핵산에 결합한다. 다시 말하면, 본 발명의 도메인 결합은 핵산과 상당한 친화력을 가지고 결합하고, 뉴클레오티드 조성물과 동등하나 서열이 상이한 어떠한 알려진 핵산은 100배 내의 차이와 함께 도메인과 결합할 것이다. 비-특이적 결합은 본 발명의 기술분야에서 잘 알려진 방법론, 예를 들면 결합의 특징을 밝혀내기 위하여 동일한 뉴클레오티드 조성물이지만 상이한 핵산 서열의 경쟁 뉴클레오티드를 사용하여 수행될 수 있는 필터 바인딩 분석 또는 겔 이동 분석을 사용하여 분석될 수 있다.
서열 비-특이적 DNA-결합 폴리펩티드를 포함하는 서열 비-특이적 핵산 결합 폴리펩티드는 단일 가닥 또는 이중 가닥 핵산에 대한 선호를 보일 수 있다. 전형적으로, 가닥-특정 결합 폴리펩티드는 10-폴드 또는 단일 가닥 또는 이중 가닥 핵산에 대한 높은 친화력을 보일 수 있다. 당업자는 특정한 적용, 이중 가닥 특정, 서열 비-특이적 DNA-결합 폴리펩티드가 바람직할 것이라는 것을 인식할 것이다.
예를 들면, 이중 가닥 핵산에 대한 결합의 특징은 본 발명이 속하는 기술분야의 통상의 기술자에게 알려진 다양한 분석을 이용하여 시험될 수 있다. 이러한 분석은 필터 바인딩 분석 또는 겔 이동 분석을 포함한다. 예를 들면, 필터 바인딩 분석에서 이중 가닥 DNA에서 결합 활성을 위해 평가되는 폴리펩티드는 적절한 버퍼에서 방사성 표지된 단일 가닥 또는 이중 가닥 DNA와 함께 미리 섞여 진다. 상기 혼합물은 단백질 및 단백질-DNA 복합체를 거르는 막(즉, 니트로셀룰로스)을 통하여 여과된다. 필터 상에 걸러지는 DNA의 함량은 단백질과 결합된 양을 나타낸다. 결합은 표지된 DNA의 결합이 증가된 양의 표지되지 않은 DNA의 추가에 의해 경쟁하는 경쟁분석에 의해 수량화될 수 있다. 10배에서 이중 가닥 DNA와 결합하거나 또는 단일 가닥 DNA에 비해 친화력이 높은 폴리펩티드는 본 발명에서 이중 가닥 DNA결합 단백질로 정의된다. 그렇지 않으면, 결합 활성은 방사성 표지된 DNA가 시험 폴리펩티드와 함께 적용되는 겔 이동 분석에 의하여 평가될 수 있다. 단백질-DNA 복합체는 겔을 통하여 천천히 이동하여 이동된 밴드를 야기할 것이다. 결합의 양은 표지되지 않은 이중 가닥의 또는 표지되지 않은 DNA 단일 가닥의 증가된 양과 함께 적용된 샘플에 의하여 평가될 수 있고, 이동된 밴드에서 방사능의 양을 수량화할 수 있다.
3.2 서열 특정 DNA-결합 폴리펩티드
일반적으로, 본 발명의 융합 폴리펩티드 상에서 보통에서 높은 정도의 서열 특이도를 보이는 DNA-결합 폴리펩티드의 사용은 덜 바람직하다. 그러나, 당업자는 특정한 구체예에서 서열 특이도의 정도는 예를 들면, 우선적으로 DNA-결합 폴리펩티드에 의하여 결합된 특정한 서열 모티프를 포함하는 부분에서 결합의 효율을 향상시키는 데에 유용할 것이라고 인식할 것이다. 예를 들면, 높은 효율의 결합 벡터는 특정한 융합 펩티드와 함께 결합되는데 사용되기 위하여 디자인될 것이며, 결합 부분은 융합 폴리펩티드의 서열 특정 DNA-결합 폴리펩티드 도메인에 의해 결합된 인식 서열을 포함한다.
대부분의 서열 특정 DNA-결합 폴리펩티드는 예를 들면, 전사 인자, 제한 효소, 및 폴리머라아제를 포함하는 것으로 알려져 있다. 서열 특정 DNA-결합 폴리펩티드는 그들의 DNA-결합 도메인의 제2차 구조에 따라서 분류될 수 있다. 특징적인 DNA-결합의 예는 아연 짚게 모티프(zinc finger motifs), 헬릭스-턴-헬릭스 모티프(helix-turn-helix motifs), 루신 지퍼(leucine zippers), 및 헬릭스-루프-헬리스 모티프(helix-loop-helix motif)를 포함한다. 하나 또는 하나 이상의 이러한 도메인을 포함하는 서열 특정 DNA-결합 폴리펩티드는 본 발명의 사용에 있어 적합하다.
특별히 본 발명의 사용에 있어 적합한 서열 특정 DNA-결합 폴리펩티드의 예로는, 인간의 NF-kapaB p50 단백질(접근 번호 NP 003989), 및 가금류의 NF-kappaB p50 단백질(접근 번호 NP 032715)과 같은 포유류의 NF-kappaB p50 및 예를 들면, 하나 또는 하나 이상의 NFATc1, NFATc2, NFATc3, NFATc4, 또는 NFATc5와 같은 포유류의 NFAT 단백질과 같은 전사 인자를 포함하나, 이에 제한되지 않는다.
NF-kappaB(또한 B-세포 1에서 kappa 가벼운 폴리펩티드 유전자 인핸서의 핵인자로 알려져 있다)는 Rel 패밀리 유래의 서열 특정 DNA-결합 전사 인자이다. NF-kappaB p50은 8pM의 해리 상수(KQ)와 함께 특정한 컨센서스 서열(consensus sequence)에 결합하고, 비특정 DNA는 약 1000배 약하게 결합하는 것으로 알려져 있다(KD = 5.7 nM, de Lumley 등, 2004).
전사 인자의 NFAT 패밀리(또한 활성화된 T-세포의 핵인자로 알려져 있다) NFATcl, NFATc2, NFATc3, NFATc4, 및 NFAT5 5종류로 이루어져 있고, 본 발명의 DNA-결합 폴리펩티드로 사용되기에 적합하다.
또 다른 구체예에서, 서열 특정 DNA-결합 폴리펩티드의 기능이 있는 변형물은 활용될 것이다. 예를 들면, 서열 특정 DNA-결합에 의해 관찰되는 높은 친화력의 결합을 유지하나, 서열 특이도의 동일한 정도를 더 이상 보이지 않는 기능이 있는 변형물은 본 발명에서 사용되기 위하여 처리할 수 있다. 이러한 기능이 있는 변형물의 예는 본 발명이 속하는 기술분야에서 잘 알려져 있고, 본 발명은 cTF - de Lumley 등 (2004), J. Mol. Biol. 339, 1059-1075에 개시된 NFAT-Ala-p50 복합체 DNA-결합 단백질 전부를 포함한다. 이러한 복합체는 알라닌 잔기를 통하여 NF-kappaB의 아미노산 249-366에 융합된 NFATc1의 아미노산 403-579을 포함한다.
본 출원인은 이러한 복합체는 NF-kappaB의 특징이나, 서열 특이도를 잃어버린 DNA에 대하여 높은 친화력을 유지한다는 것을 알려준다. Lumley는 비특정 DNA 결합의 28 nM 및 40 nM에서 kappaB 컨센서스 서열의 KD를 측정하였다.
4. 발현 구조물
미생물, 식물 세포 또는 동물 세포 (세포 발현 시스템) 또는 무세포 발현 시스템에서 융합 폴리펩티드의 발현을 위한 발현 구조물을 생산 및 사용하기 위한 공정 및 본 발명에서 사용되기 위한 융합 폴리펩티드 형성에 유용한 발현 구조물을 포함하는 숙주 세포는 본 발명이 속하는 기술분야에서 잘 알려져 있다(즉, Sambrook 등, 1987; Ausubel 등, 1987).
본 발명의 방법에 사용되기 위한 발현 구조물은 복제 또는 발현을 위하여 반복 가능한 벡터에 삽입되거나 또는 숙주 게놈에 포함될 것이다. 다양한 벡터가 일반적으로 사용가능하다. 상기 벡터는, 예를 들면, 플라스미드, 코스미드, 바이러스 융합 폴리펩티드, 또는 파지의 형태일 것이다. 적절한 핵산 서열은 다양한 절차에 의하여 상기 벡터에 삽입될 것이다. 일반적으로, DNA는 본 발명이 속하는 기술분야에서 알려진 기술을 이용하여 적절한 제한 효소 자리에 삽입된다. 벡터 구성요소는 일반적으로 하나 또는 하나 이상의 신호 서열, 하나의 복제 개시점, 하나 또는 하나 이상의 선택 가능한 마커 유전자, 인핸서 요소, 프로모터, 및 전사 종료 서열을 포함하지만, 이에 제한되지 않는다. 하나 또는 하나 이상의 이러한 구성요소를 포함하는 적절한 벡터의 구조물은 본 발명이 속하는 기술분야에서 알려진 일반적인 결합 기술을 이용한다.
발현 및 복제 벡터 모두 하나 또는 하나 이상의 선택된 숙주 세포에서 벡터가 자기복제를 가능하게 하는 핵산 서열을 포함한다. 이러한 서열은 다양한 박테리아, 효모, 및 바이러스로 잘 알려져 있다.
하나의 구체예에서, 상기 발현 구조물은 높은 복제수의 벡터를 나타낸다.
하나의 구체예에서, 상기 높은 복제수 벡터는 숙주 세포 마다 20 내지 3000 복제를 나타내는 것으로부터 선택될 수 있다.
하나의 구체예에서, 상기 높은 복제수 벡터는 ColE1 또는 복제 개시점으로부터 유도된 ColE1과 같은 높은 복제수 복제 개시점(ori) 포함한다. 예를 들면, 복제 개시점으로부터 유도된 ColE-1은 pUC19 복제 개시점을 포함할 수 있다.
본 발명의 벡터로 사용하기에 적절한 수많은 높은 복제수 복제 개시점은 당업자에게 알려져 있다. 이러한 높은 복제수 복제 개시점은 pBR322로부터 유도된 복제 개시점인 ColE1 및 이들의 유도체뿐만 아니라, Ml3 FR ori 또는 pl-ori와 같은 다른 높은 복제수 복제 개시점을 포함한다. 2μ 플라스미드 개시점은 효모에 적합하하고, 다양한 바이러스 개시점(SV40, 폴리오마(polyoma), 아데노바이러스(adenovirus), VSV or BPV)은 포유류 세포에서 복제 벡터로 유용하다.
바람직하게는, 상기 높은 복제수 복제 개시점은 pUC19 복제 개시점으로부터 유도된 ColE1를 포함한다.
발현 및 복제 벡터는 전형적으로 또한 형질전환된 숙주 세포 내에서 벡터의 존재를 발견하기 위한 선택 가능한 마커로 일컬어질 수 있는 선택 유전자를 포함할 수 있다. 전형적인 선택 유전자는 (a) 항생제(antibiotics) 또는 다른 톡신(toxins)즉, 앰피실린(ampicillin), 네오마이신(neomycin), 메토트렉세이트(methotrexate), 또는 테트라사이클린(tetracycline)에 대한 저항성을 부여하고, (b) 영양 요구성 결핍을 보완하고, (c) 복합 배지로부터 사용가능 하지 않는 즉, 균을 위하여 D-알라닌 라세메이즈(racemase)를 인코딩한 유전자와 같은 복합체 임계 영양소를 제공하는 단백질을 인코드한다.
일반적으로 식물 형질전화에 사용되는 선택 가능한 마커는 가나마이신(kanamycin) 저항성을 부여하는 네오마이신 인산전이효소 II(neomycin phophotransferase II) 유전자 (NPT II), 스펙티노마이신(spectinomycin) 및 스트렙토마이신(streptomycin) 저항성을 부여하는 aadA 유전자, Ignite (Ag역방향o) 및 Basta (Hoechst) 저항성을 위한 포스피노트리신 아세틸 트랜스퍼라제(phosphinothricin acetyl transferase, 저항성 유전자), 및 하이그로마이신 저항성을 위한 하이그로마이신 포스포트랜스퍼라제(hygromycin phosphotransferase) 유전자(hpt)를 포함한다.
포유류 세포에 적합한 선택 가능한 마커의 예는 발현 구조물을 차지하기 위해서 세포 구성요소의 확인을 가능하게 하는 DHFR 또는 티미딘 키나제(thymidine kinase)와 같은 것들이다. 야생형 DHFR이 이용될 때, 적절한 숙주 세포는 DHFR 활성에 결함이 있고, Urlaub 등, 1980에 의해 개시된 것으로 제조되고 번식되는 CHO 세포주이다. 효모에 사용하기 위한 적절한 선택 유전자는 YRp7 효모 플라스미드에 나타난 trpl 유전자이다(Stinchcomb 등, 1979; Kingsman 등, 1979; Tschemper 등, 1980). 상기 trpl 유전자는 예를 들면, ATCC No. 44076 또는 PEP4- 1[Jones, Genetics, 85: 12 (1977)]과 같은 트립토판(tryptophan)에서의 생장 능력이 부족한 효모의 변이주를 위한 선택 마커를 제공한다.
융합 폴리펩티드를 형성하는데 유용한 발현 구조물은 바람직하게 DNA 리가아제, DNA-결합 폴리펩티드 또는 융합 폴리펩티드를 인코딩하는 적어도 하나의 핵산의 발현을 조절하는 프로모터를 포함한다.
다양한 잠재적인 숙주 세포에 의해 인식되는 프로모터는 잘 알려져 있다. 원핵 생물 숙주와 함께 이용하는데 적합한 프로모터는 β-락타마제(β-lactamase) 및 락토스 프로모터 시스템[Chang 등, 1978; Goeddel 등, 1979], 염기성 포스파타아제(alkaline phosphatase), 트립토판(tryptophan (trp)) 프로모터 시스템(Goeddel, Nucleic Acids Res., 8:4057 (1980); EP 36,776], 및 택 프로모터(tac promoter)와 같은 복합체 프로모터(deBoer 등, 1983)를 포함한다. 박테리아 시스템에서 사용되기 위한 프로모터는 사용가능하게 DNA 리가아제, DNA 리가아제 폴리펩티드, 또는 융합 폴리펩티드를 인코딩한 핵산에 연결된 샤인-달가르노(Shine-Dalgarno, S.D.) 서열을 포함할 것이다.
효모 숙주와 함께 사용하기 위한 프로모터 서열로 적합한 예는 에놀레이즈(enolase), 글리세르알데히드-3-포스페이트 디하이드로지나제(glyceraldehyde-3 -phosphate dehydrogenase), 헥소키나제(hexokinase), 파이루베이트 디카르복실라제(pyruvate decarboxylase), 포스포프럭토키나제(phosphofructokinase), 글루코스-6-포스페이트(glucose-6-phosphate), 아이소머라제(isomerase), 3-포스로글라이세레이트 뮤타제(3-phosphoglycerate mutase), 피루베이트 키나제(pyruvate kinase), 트리오세포스페이트 아이소머라제(triosephosphate isomerase), 포스포글루코스 아이소머라제(phosphoglucose isomerase), 및 글루코키나제(glucokinase)와 같은 3-포스포글리세레이트 키나제(3-phosphoglycerate kinase) [Hitzeman 등, 1980] 또는 다른 해당작용 효소(glycolytic enzymes) [Hess 등, 1968; Holland, 1978]를 위한 프로모터를 포함한다.
생장 조건에 의해 조절되는 추가적인 전사의 장점을 가지고 있는 유도성 프로모터인 다른 효모 프로모터는 알콜 디하이드로게나제 2(alcohol dehydrogenase 2), 아이소시토크롬 C(isocytochrome C), 탈인산화효소(acid phosphatase), 질소 대사와 관련된 분해 효소, 메탈로티오네인(metallothionein), 글리세르알데히드-3-포스페이트 디하이드로지나제(glyceraldehyde-3 -phosphate dehydrogenase), 및 말토오스 및 갈락토오스 이용의 원인이 되는 효소의 프로모터 지역이다.
단자엽 또는 다자엽 식물의 조직 또는 기관을 포함하는 식물 숙주 세포에 사용하기 적합한 프로모터의 예는 세포-특이적인 프로모터, 조직-특이적인 프로모터, 기관-특이적인 프로모터, 세포 주기 특이적인 프로모터, 시간 프로모터, 유도성 프로모터, 식물 조직에서 활성화된 발현 프로모터, 및 재조합 프로모터를 포함한다. 프로모터의 선택은 복제된 폴리뉴클레오티드의 시간적 및 공간적 발현에 달려있을 것이다. 프로모터는 숙주 세포로부터 유도되는 것들, 또는 다른 식물, 바이러스, 및 식물병원균 및 식물병원진균의 유전자들로부터 유도되는 프로모터일 것이다. 당업자는 과도한 실험 없이 본 발명의 폴리뉴클레오티드 서열을 포함하는 유전자 구조물을 사용한 발현 구조물의 변경 및 변조에 적합한 프로모터를 선택할 수 있다. 구성적 실물 프로모터의 예는 CaMV 35S 프로모터, 노팔린 합성효소(nopaline synthase) 프로모터 및 옥토파인 합성효소(octopine synthase) 프로모터, 및 옥수수로부터 유래된 Ubi 1 프로모터를 포함한다. 내부 발달 신호 또는 외부 생물적 또는 비생물적 스트레스에 응답하여 특정 조직에서 활성되는 식물 프로모터는 과학 문헌에 개시되어 있다. 예시적인 프로모터는 본 발명에서 참조로 사용되는 국제특허 제WO 02/00894호에 개시되어 있다.
곤충 숙주 세포에 사용되기 적합한 프로모터의 예는 베큘로바이러스(Baculovirus)와 같은 바이러스의 게놈으로부터 유도된 것들을 포함한다. 일반적으로 사용가능한 베큘로바이러스 발현 시스템은 flashBAC(Ox정방향d Expression Technologies) 및 Bac-to-Bac 베큘로바이러스 발현 시스템(Invitrogen)을 포함한다.
포유류 숙주 세포에 사용되기 적합한 프로모터의 예는 폴리오마(polyoma) 바이러스, 계두(fowlpox) 바이러스, (아데노바이러스 2와 같은) 아데노바이러스(adenovirus), 소 유두종(bovine papilloma) 바이러스, 조류 육종(avian sarcoma) 바이러스, 거대세포바이러스(cytomegalovirus), 레트로바이러스(retrovirus), B형 간염(hepatitis-B) 바이러스 및 원숭이(Simian) 바이러스 40 (SV40)과 같은 바이러스의 게놈으로부터 유도되어 얻어진 것들, 즉, 액틴(actin) 프로모터 또는 이뮤노글로불린(immunoglobulin) 프로모터와 같은 이종의 포유류 프로모터로부터 유도되어 얻어진 것들, 및 숙주 세포 시스템과 호환가능하게 제공된 열충격 프로모터로부터 유도되어 얻어진 것들을 포함한다.
높은 진핵 생물에 의한 발현 구조물의 전사는 벡터 내에 인핸서 서열을 삽입함으로써 증가할 것이다. 인핸서는 일반적으로 전사를 증가시키기 위하여 프로모터 상에서 활동하는 약 10 내지 300 bp인 DNA의 시스로 작동하는 요소이다. 포유류 유전자로부터 많은 인핸서 서열(글로빈(globin), 엘라타제(elastase), 알부민(albumin), α-페토프로테인(α-fetoprotein), 및 인슐린(insulin))이 지금 알려져 있다. 그러나 전형적으로, 진핵 생물 세포 바이러스로부터 하나의 인핸서가 사용될 것이다. 예는 복제 개시점의 마지막 측면 상에서 SV40 인핸서(bp 100-270), 시토메갈로바이러스의 초기 프로모터 인핸서, 복제 개시점의 마지막 측면 상에서 폴리오마 인핸서, 및 아데노바이러스 인핸서를 포함한다. 상기 인핸서는 벡터의 5’ 또는 3’ 위치에서 서열을 코딩한 DNA 리가아제, DNA 리가아제 폴리펩티드 또는 융합 폴리펩티드로 스플라이스될 것이며, 바람직하게는 프로모터로부터 5’ 사이트에 위치할 것이다.
진핵 생물 숙주 세포(효모, 진균, 곤충, 식물, 동물, 인간 또는 다세포 미생물로부터 유래된 다른 유핵 세포)에서 사용되는 발현 벡터는 또한 전사 종결에 필요하고, mRNA 안정화에 필요한 서열을 포함할 것이다. 이러한 서열은 일반적으로 5'로부터 이용가능하고, 때때로 진핵 생물 또는 바이러스 DNA 또는 cDNA의 전사되지 않은 지역인 3’으로부터 이용가능하다. 이러한 지역은 DNA 리가아제, DNA 리가아제 폴리펩티드 또는 융합 폴리펩티드를 인코딩한 mRNA의 전사되지 않은 부분에서 폴리아데닐레이트 단편으로 전사된 뉴클로오티드 마디를 포함한다.
하나의 구체예에서, 상기 발현 구조물은 아라비노스(arabinose)에 의해 유도되는 BAD 프로모터와 같은 상류 유도성 프로모터를 포함한다.
하나의 구체예에서, 상기 발현 구조물은 발현 또는 조절 프로모터 시스템을 포함한다.
하나의 구체예에서, 상기 조절 프로모터 시스템은 유도성 또는 억제성 프로모터 시스템이다.
재조합 단백질의 생산에 있어서 강력한 프로모터의 사용이 흔히 요구되지만, 이러한 프로모터들의 조절은 보통 이종 발현 과잉생산, 생장 속도에서 단백질의 감소를 야기시키고, 플라스미드 안정성 및 배양 생존능 때문에 필수적이다.
다수의 프로모터들은 억제 단백질과 다른 오퍼레이터와의 상호 작용에 의해 조절된다(프로모터로부터 다운스트림 지역). 가장 잘 알려진 오퍼레이터들은 락 오페론(lac operon) 및 박테리오파지 람다(bacteriophage lambda)로부터 유래된다. 대장균에서 조절된 프로모터의 개요는 Friehs & Reardon, 1991의 표 1에서 제공된다.
기준 박테리아 배양과 재조합 대장균이 관련된 것들의 주요한 차이점은 생장의 분리 및 생산기 또는 유도기이다. 재조합 단백질 생산물은 종종 생장기에서 높은 세포 밀도를 성취하고(프로모터가 작동이 안되고 숙주 세포 상에서 대사 부담이 적은 경우) 유도기에서 높은 이종 단백질 생산 속도를 성취하기(프로모터를 작동시키기 위한 유도) 위한 조절된 프로모터의 장점을 가지고 있다.
하나의 구체예에서, 조절 가능한 프로모터 시스템은 Lacl, Tip, 파지 람다(phage lambda) 및 파지 RNA 폴리머라아제(phage RNA polymerase)로부터 선택된다.
하나의 구체예에서, 상기 프로모터 시스템은 lac 또는 Ptac 포로모터 및 lacl 억제자, 또는 trp 프로모터 및 TrpR 억제자로부터 선택된다.
하나의 구체예에서, 상기 LacI 억제자는 활성 억제자에 결합하여 발현을 허락하는 오퍼레이터로부터의 분리를 야기시키는 이소프로필-β-D-티오갈락토피라노시드(isopropyl-β-D-thiogalactopyranoside, IPTG)의 추가에 의해 불활성화된다.
하나의 구체예에서, 상기 trp 프로모터 시스템은 정해진 트립토판 농도와 함께 합성 배지를 사용하고, 농도가 임계 수준 아래로 떨어지면 시스템은 스스로 유도된다. 하나의 구체예에서, 3-β-인돌-아크릴산은 TrpR 억제자를 불활성시키기 위하여 추가될 것이다.
하나의 구체예에서, 상기 프로모터 시스템은 박테리오파지 람다 억제자 cI의 사용을 만들 것이다. 이러한 억제자는 OL 및 OR이라고 불리는 두 개의 오퍼레이터들과 상호작용함으로써 람다 파지 및 모든 용균(lytic) 유전자의 발현 방지의 사용을 만든다. 이러한 오퍼레이터들은 각각 두 개의 강력한 프로모터 PL 및 PR과 겹친다. cI 억제자 존재하에서, RNA 폴리머라아제의 결합은 유지된다. 상기 cI 억제자는 자외선 조사 또는 마이토마이신(mitomycin C)의 세포 처리에 의하여 불활성화될 수 있다. 재조합 폴리펩티드 발현을 허용하는 더 간편한 방법은 cI 억제자의 온도-민감성 버전인 cI857의 적용이다. 람다계 발현 시스템을 수반하는 숙주 세포는 낮은 온도에서 중간 증식기로 생장될 수 있고, 재조합 폴리펩티드의 발현을 유도하기 위하여 높은 온도로 이동될 수 있다.
광범위하게 사용되는 발현 시스템은 T7 DNA 상에서 발견된 프로모터들로부터 인식되고, 숙주 세포 염색체 상에 존재하지 않는 파지 T7 RNA 폴리머라아제의 사용을 만들 수 있다. 그러므로, 상기 발현 구조물은 재조합 유전자가 융합되게 하기 위해 하나의 상기 T7 프로모터들(일반적으로 상기 프로모터는 유전자 10의 앞에 존재한다)을 포함할 것이다. T7 RNA 폴리머라아제의 유전자 코딩은 발현 구조물 상, 제2 경쟁 발현 구조물 상에서 나타나거나 또는 숙주 세포 염색체에서 통합된다. 이러한 모든 경우에서, 상기 유전자는 발현기 동안에 전사 및 번역을 허용하는 유도 프로모터에 융합된다.
대장균 가닥 BL21 (DE3) 및 BL21 (DE3) pLysS (Invitrogen, CA)는 T7 RNA 폴리머라아제 유전자를 수반하는 숙주 세포의 예시이다. 게놈에 통합된 T7 RNA 폴라머라제 유전자를 제공하는 슈도모나스 애루지노사 ADD 1976T7(Pseudomonas aeruginosa ADD 1976T7)과 같은 RNA 폴라머라제 유전자를 수반하는 다른 세포 가닥은 본 발명이 속하는 기술분야에서 잘 알려져 있다(Brunschwig & Darzins, 1992).
본 발명에 사용되기 적합한 다른 프로모터 시스템은 여기에서 전형적인 예가되는 T5 프로모터 시스템이다. 유용하게, 이러한 프로모터는 숙주 대장균 RNA 폴리머라아제에 의해 인식된다. 적합한 대장균 숙주 가닥은 실시예에 나타나 있다.
하나의 구체예에서, 상기 프로모터 시스템은 유도 사이클을 개시하기 위하여 30-37℃에서 42℃로 온도를 증가시키는 온도 이동에 의하여 유도되거나 또는 유도 사이클을 개시하기 위하여 스위치가 켜진 API 또는 APR과 같은 프로모터의 사용을 만든다.
바람직한 융합 폴리펩티드는 적어도 하나의 DNA 리가아제 및 적어도 하나의 DNA-결합 폴리펩티드를 포함한다.
여기에서 사용하기 위한 융합 폴리펩티드를 인코딩한 핵산 서열은 DNA 리가아제와 같은 폴리뉴클레오티드-라가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 및 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산을 포함한다. 일단 발현되면, 융합 폴리펩티드는 인산디에스테르 결합 형성을 형성하거나 또는 가능하게 할 수 있다.
하나의 구체예에서, 적어도 DNA 리가아제를 인코딩한 핵산 서열은 간접적으로 원하는 길이의 폴리뉴클레오티드 링커 또는 스페이서 서열을 통하여 DNA-결합 폴리펩티드를 인코딩한 핵산 서열과 융합된다. 하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드의 아미노산 서열은 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N-말단과 인접하다.
하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드의 아미노산 서열은 DNA 리가아제를 포함하는 아미노산 서열의 C-말단과 인접하다.
하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 단백질의 아미노산 서열은 간접적으로 원하는 길이의 펩티드 링커 또는 스페이서, 예를 들면 융합 폴리펩티드를 포함하는 폴리펩티드의 독립적인 폴딩을 가능하게 하는 링커 또는 스페이서를 통해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 N-말단과 융합된다.
하나의 구체예에서, 적어도 하나의 DNA-결합 폴리펩티드를 포함하는 융합 단백질의 아미노산 서열은 간접적으로 원하는 길이의 펩티드 링커 또는 스페이서, 예를 들면 융합 폴리펩티드의 독립적인 폴딩을 가능하게 하는 링커 또는 스페이서를 통해 DNA 리가아제 폴리펩티드를 포함하는 아미노산 서열의 C-말단과 융합된다.
본 발명의 바람직한 융합 폴리펩티드의 하나의 장점은 융합 폴리펩티드를 포함하는 폴리펩티드의 변경이 그들의 기능에 영향을 주지 않는다는 점이다. 예를 들면, 재조합 폴리펩티드가 그들의 N-말단 또는 C-말단에 융합되더라도 여기에서 예시로든 DNA 리가아제의 기능은 유지된다.
융합 폴리펩티드 상에서 단백질의 배열은 플라스미드에 포함된 핵산에서 유전자 서열의 순서에 의존적이다. 예를 들면, 융합 폴리펩티드의 생산이 요구될 것이며, DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드는 간접적으로 폴리뉴클레오티드 리가아제에 융합된다. 간접적으로 융합된다”라는 용어는 융합 폴리펩티드상에서 발현되기를 원하는 어떠한 추가적인 단백질에 의해 분리되는 폴리뉴클레오티드 리가아제 폴리펩티드 및 폴리뉴클레오티드-결합 폴리펩티드를 포함하는 융합 폴리펩티드를 나타낸다. 하나의 구체예에서, 상기 추가적인 단백질은 상기에서 언급된 바와 같이 DNA 리가아제 폴리펩티드, DNA-결합 폴리펩티드, 보조인자 또는 보조효소, 또는 융합 폴리펩티드, 또는 융합 폴리펩티드의 독립적인 폴딩을 가능하게 하는 링커 또는 스페이서로부터 선택된다. 이러한 구체예에서, 발현 구조물 상에서 융합 폴리펩티드의 원하는 배열을 반영하기 위하여 유전자 서열을 정리하는 것이 필요하다.
하나의 구체예에서, DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드는 직접적으로 DNA 리가아제와 같은 폴리뉴클레오티드-리가아제 폴리펩티드에 융합될 것이다. “직접적으로 융합된다”라는 용어는 두 개 또는 더 이상의 폴리펩티드가 펩티드 결합을 통하여 연결되는 위치를 나타내기 위하여 여기에서 사용된다.
적어도 두 개의 별개의 융합 폴리펩티드를 포함하는 조성물이 형성되는 것 또한 가능할 것이다. 예를 들면, 제1 융합 폴리펩티드는 DNA-리가아제에 융합된 단일 가닥 DNA-결합 폴리펩티드를 포함하는 반면, 제2 융합 폴리펩티드는 DNA-리가아제에 융합된 이중 가닥 DNA-결합 폴리펩티드를 포함할 것이다. 여기에서 개시된 융합 폴리펩티드의 어떠한 조합도 가능하고, 특정한 적용을 목표로 하기위하여 생산될 것이다. 게다가, 하나 또는 하나 이상의 융합 폴리펩티드는 이중가닥 말단된 DNA 말단 또는 외가닥 말단된 DNA 말단과 함께 이중가닥 말단된 DNA 말단 또는 외가닥 말단된 DNA 말단 DNA 단편에 대하여 향상된 결합 활성을 보일 것이다. 유사하게, 하나 또는 하나 이상의 융합 폴리펩티드는 RNA 단편 또는 RNA-DNA 복합체에 대하여 향상된 결합 활성을 보일 것이다. 이러한 융합 폴리펩티드는 특정한 적용을 목표로 하기 위하여 분리 또는 결합에 사용될 것이다.
하나의 구체예에서, 상기 발현 구조물은 체내에서 발현된다. 바람직하게 상기 발현 구조물은 미생물, 바람직하게는 대장균에서 발현되는 플라스미드다.
하나의 구체예에서, 상기 발현 구조물은 체외에서 발현된다. 바람직하게 상기 발현 구조물은 무세포 발현 시스템을 사용한 체외에서 발현된다.
하나의 구체예에서, 하나 또는 하나 이상의 유전자는 하나의 발현 구조물에 삽입될 수 있고, 하나 또는 하나 이상의 유전자는 숙주 세포 게놈에 통합될 수 있다. 모든 경우에 있어서, 발현은 상기에서 언급한 바와 같이 프로모터를 통해 조절될 수 있다.
하나의 구체예에서, 상기 발현 구조물은 상기에서 언급한 바와 같이 적어도 하나의 추가적인 폴리펩티드, 선택적으로 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드 및 DNA 리가아제 폴리펩티드와 같은 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 융합 폴리펩티드를 더 인코드할 수 있다.
다양한 구체예에서, 상기 발현 구조물은 본 발명의 발현된 폴리펩티드의 정제를 가능하게 하기 위하여 하나 또는 하나 이상의 폴리펩티드 태그를 포함할 수 있다. 이러한 태그의 예는 본 발명이 속하는 기술분야에서 잘 알려져 있으며, 폴리히스티딘 택(polyhistidine Tags), FLAG 에피토프(FLAG epitopes), c-myc 에피토프c-myc epitopes) 등을 포함한다. 이러한 정제산을 수반하는 폴리펩티드를 정제하는 방법은 본 발명이 속하는 기술분야에서 잘 알려져 있고, 크로마토그래피, 예를 들면 니켈 또는 코발트 결합에 의존하는 금속 친화력 크로마토그래피에 고정화된 폴리히스티딘 태그를 포함한다.
발현된 단백질로부터 이러한 정제 산을 제거하는 방법은 본 발명이 속하는 기술분야에서 잘 알려져 있다. 예를 들면, 태그 또는 에피토프는 목적하는 폴리펩티드로부터 엔도펩티다제 인지 서열(endopeptidase recognition sequence), 인테인 스플라이스 자리, 또는 엔도펩티다제를 사용한 폴리히스티딘-태그의 제거를 가능하게 하는 다른 어떠한 아미노산 서열에 의해 분리될 것이다. 예를 들면, TAGZyme (Qiagen)과 같은 엑소펩티다제(exopeptidases)는 발현 폴리펩티드로부터 N-말단 폴리히스티딘 태그의 제거를 위하여 사용될 것이다.
5. 숙주 세포
본 발명의 융합 폴리펩티드는 상기에서 언급된 하나 또는 하나 이상의 발현 구조물을 사용하여 알맞게 숙주 세포상에서 제조된다. 본 발명의 융합 폴리펩티드는 발현 구조물을 발현하기 위한 숙주 세포를 가능하게 하여 제조될 수 있다. 융합 폴리펩티드는 먼저 발현 구조물을 숙주 세포 또는 숙주 세포의 전구체에 도입함으로써, 예를 들면 발현 구조물과 함께 숙주 세포 또는 숙주 세포의 전구체를 형질전환 또는 전달, 또는 그렇지 않으면 숙주 세포 상에 존재하는 발현 구조물을 보존하는 것에 의해 이뤄낼 수 있다.
형질전환 후에, 형질전환된 숙주 세포는 발현 구조물로부터 유래된 융합 폴리펩티드의 발현 및 융합 폴리펩티드의 형성에 적합한 상태 하에서 유지된다. 이러한 상태는 본 발명이 속하는 기술분야에서 잘 알려진 적합한 유기체 상에서의 플라스미드와 같이 선택된 발현 구조물의 발현에 적합한 것들을 포함한다. 예를 들면, 특별히 높은 수율 또는 과잉발현을 원하는 경우, 적합한 배지의 공급은 융합 폴리펩티드의 합성을 허용한다.
따라서, 본 발명은 융합 폴리펩티드 제조 방법으로,
DNA 리가아제 폴리펩티드와 같은 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열 및 DNA-결합 폴리펩티드와 같은 폴리뉴클레오티드-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 숙주 세포를 제공하는 단계;
상기 발현 구조물의 발현이 적합한 상태에서 상기 숙주 세포를 유지하는 단계; 및
숙주로부터 융합 폴리펩티드를 분리하는 단계;
를 포함한다.
바람직하게 상기 숙주 세포는 박테리아 세포, 진균 세포, 효모 세포, 식물 세포, 곤충 세포 또는 동물 세포이고, 바람직하게 고립되거나 또는 비인간 숙주 세포이다. 본 발명이 속하는 기술분야에서 재결합 융합 폴리펩티드를 제조하기 위한 유용한 방법으로 잘 알려진 숙주 세포(즉, Sambrook 등, 1987 ; Ausubel 등, 1987)는 여기에서 언급된 고려사항을 유념하여 본 발명의 방법에 사용되는데 적합하다.
적합한 원핵 생물 숙주 세포는 예를 들면, 대장균 바이러스 대장균주(E. coli. Various E. coli strains)과 같은 엔테로박테리아세애(Enterobacteriaceae)가 일반적으로 사용가능한 그람(Gram)-음성 또는 그람-양성 유기체와 같은 진정세균(eubacteria)을 포함한다. 예를 들면, 대장균 K12 가닥 MM294 (ATCC 31,446); 대장균 XI 776 (ATCC 31,537); 대장균 가닥 W31 10 (ATCC 27,325) 및 K5 772 (ATCC 53,635), 및 DH5a-E (Invitrogen)과 같은 대장균 바이러스 대장균 가닥(E. coli. Various E. coli strains)과 같은 엔테로박테리아세애(Enterobacteriaceae)는 일반적으로 사용가능하다. 다른 적합한 원핵 생물 숙주 세포는 에스케리치아 종(Escherichia spp.), 엔테로박터(Enterobacter), 병원균(Erwinia), 클레브시엘라(Klebsiella), 프로테우스(Proteus), 살모넬라(Salmonella), 즉, 살모넬라 티피무리움(Salmonella typhimurium), 세라티아(Serratia), 즉, 세라티아 적벽세균(Serratia marcescans), 및 시겔라(Shigella)뿐만 아니라, 청국균(B. subtilis) 및 바실러스 리케니포르미스(B. licheni정방향mis)와 같은 균(Bacilli), 슈도모나스 애루기노사(P. aeruginosa)와 같은 슈도모나스(Pseudomonas), 및 스트렙토마이시스(Streptomyces), 로도코코스(Rhodococcus), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobaterium)과 같은 방선균(Actinomycetes)과 같은 다른 엔테로박테리아세를 포함한다.
어떤 구체예에서, 대장균 가닥 W31 10은 재조합 DNA 제품에 대한 일반적인 숙주 가닥이기 때문에 사용될 것이다. 바람직하게 숙주 세포는 최소 양의 단백질 가수분해 효소(proteolytic enzymes)를 분비한다. 예를 들면, 가닥 W31 10은 단백질 내인성을 숙주에 인코딩한 유전자 상에서 유전자 변이에 영향을 주기위하여 수정될 것이다. 이러한 숙주는 완벽한 유전자형 tonA를 가진 대장균 W31 10 가닥 1A2, 완벽한 유전자형 tonA ptr3을 가진 대장균 W31 10 가닥 9E4, 완벽한 유전자형 tonA ptr3 phoA E15 (argF-lac)169 degP ompT kanr을 가진 대장균 W31 10 가닥 27C7 (ATCC 55,244), 완벽한 유전자형 genotype tonA ptr3 phoA El 5 (argF-lac)169 degP ompT rbs7 ilvG kanr을 가진 대장균 W31 10 가닥 37D6, 비가나마이신 저항 degP 삭제 돌연변이와 함께 가닥 37D6인 대장균 W31 10 가닥 40B4를 포함한다.
일부 구체예에서, 제조하지 않거나 또는 낮은 수준의 리포폴리사카리드 엔도톡신(lipopolysaccharide endotoxins)을 제조하는 박테리아 숙주는 바람직하게 사용될 것이다. 예를 들면, 락토코커스 락티스 가닥 MG1363(Lactococcus lactis strain MG1363) 및 락토코커스 락티스 아종 크레모리스 NZ9000(Lactococcus lactis subspecies cremoris NZ9000)을 포함하는 락토코커스 락틱스 가닥(Lactococcus lactis strains)이 사용될 것이다.
원핵 생물에 더하여, 사상 진균(filamentous fungi) 또는 효모와 같은 진핵 미생물은 본 발명의 방법에 사용되기 위한 적합한 복제 또는 발현 숙주이다. 사카로마이세스 세레비시애(Saccharomyces ce역방향isiae)는 일반적으로 사용되는 진핵 숙주 미생물이다. 다른 것들은 시조사카로미세스 폼베(Schizosaccharomyces pombe) (Beach and Nurse, 1981 ; 유럽등록특허 제139,383호), 즉, 클루이베로미시스 락티스(K. lactis) (MW98-8C, CBS683, CBS4574; Louvencourt 등, 1983), 클루이베로미시스 플라길리스(K. fragilis) (ATCC 12,424), 클루이베로미시스 불가리쿠스(K. bulgaricus) (ATCC 16,045), 클루이베로미시스 위커라미(K. wickeramii) (ATCC 24,178), 클루이베로미시스 왈티(K. waltii) (ATCC 56,500), 클루이베로미시스 드로소피라룸(K. drosophilarum) (ATCC 36,906; Van den Berg et al, 1990), 클루이베로미시스 터모톨레란스(K. thermotolerans), 및 클루이베로미시스 말시아누스(K. marxianus)와 같은 클루이베로미시스 숙주(미국등록특허 제4,943,529호; Fleer 등, 1991), 야로위아(yarrowia) (유럽등록특허 제402,226호), 피키아 파스토리스(Pichia pastoris) (유럽등록특허 제183,070호; Sreekrishna 등, 1988), 칸디다(Candida), Trichoderma reesia (EP 244,234), 뉴로스포라 크라사(Neurospora crassa) (Case 등, 1979), 쉬반니오마이세스 오시덴탈리스(Schwanniomyces occidentalis) (1990년 10월 31일 공개된 유럽등록특허 394,538)와 같은 쉬반니오마이세스(Schwanniomyces), 및 즉, 뉴로스포라(Neurospora), 페니실리움(Penicillium), 톨리포클라디움(Tolypocladium) (1991년 1월 10일 공개된 WO 제91/00357호)와 같은 사상 진균(filamentous fungi) 및 아스퍼질러스 니둘란스(A. nidulans) (Ballance 등, 1983; Tilburn 등, 1983; Yelton 등, 1984) 및 아스퍼질러스 니거(A. niger) (Kelly and Hynes, 1985)와 같은 아스퍼질러스 숙주(Aspergillus hosts)를 포함한다. 메티로트로픽 효모(Methylotropic yeasts)는 여기에서 적합하고, 한세눌라(Hansenula), 칸디다(Candida), 클로엑케라(Kloeckera), 피치아(Pichia), 사카로마이세스(Saccharomyces), 토룰롭시스(Torulopsis), 및 로두투룰라(Rhodotorula)로 이루어지는 속으로부터 선택되는 메탄올의 생장을 가능하게 하는 효모를 포함한다. 예시로든 이러한 효모의 종류인 특정한 종의 리스트는 Anthony, 1982에서 발견 될 것이다.
무척추(invertebrate) 숙주 세포의 예는 초파리 S2(Drosophila S2) 및 스포돕테라 Sf9(Spodoptera Sf9)와 같은 곤충 세포뿐만 아니라, 면, 옥수수, 감자, 콩, 페튜니아, 토마토 및 담배 배지와 같은 식물 세포를 포함한다. 수많은 베큘로바이러스 가닥 및 변형물 및 베큘로바이러스와 같은 숙주로부터 유래된 대응하는 허용 곤충 숙주 세포는 구별된다. 형질감염을 위한 다양한 바이러스 가닥, 즉, 오토그라파 캘리포니카 NPV(Autographa cali정방향nica NPV)의 L-I 변형물 및 봄빅스 모리 NPV(Bombyx mori NPV)의 Bm-5 가닥은 일반적으로 이용가능하고, 이러한 바이러스들은 본 발명에 따른 바이러스, 특히 스포돕테라 프루지페르다 세포(Spodoptera frugiperda cell)의 형질감염으로 사용될 것이다.
유용한 포유류 숙주 세포주의 예는 SV40 (COS-7, ATCC CRL 1651)에 의해 변이된 원숭이 신장 CV1주, 인간 배아 신장주(293 or 293 cells subcloned 정방향 growth in suspension culture, Graham 등, J. Gen Virol. 36:59 (1977)), 새끼 햄스터 신장 세포(BHK, ATCC CCL 10), 중국 햄스터 난소 세포/-DHFR(CHO, Urlaub 등, 1980), 쥐 세르톨리 세포(TM4, Mather, 1980), 원숭이 신장 세포(CV1 ATCC CCL 70), 아프리카 녹색 원숭이 신장 세포(VERO-76, ATCC CRL-1587), 인간 자궁경부 암종 세포(HELA, ATCC CCL 2), 개 신장 세포(MDCK, ATCC CCL 34), 버팔로쥐 간 세포(BRL 3 A, ATCC CRL 1442), 인간 폐 세포(W138, ATCC CCL 75), 인간 간 세포(Hep G2, HB 8065), 쥐 유방암세포(MMT 060562, ATCC CCL51), TRI 세포(Mather 등, 1982),MRC 5 세포, FS4 세포, 및 인간 간암 세포주(Hep G2)이다.
진핵 생물 세포주, 특별히 포유류 세포주는 예를 들면, DNA-결합 폴리펩티드 또는 DNA 리가아제 폴리펩티드가 하나 또는 하나 이상의 번역 후 변형, 예를 들면 당화현상을 요구하는 경우 선호될 것이다. 예를 들면, 하나 또는 하나 이상의 DNA-결합 폴리펩티드는 최상의 활성을 갖기 위하여 번역 후 변형을 요구하고, 번역 후 변형이 가능한 발현 숙주에서 유용하게 발현될 것이다.
하나의 구체예에서, 상기 숙주 세포는 산화 세포질(oxidising cytosol), 예를 들면 대장균 올리가미 가닥(E. coli Origami strain (Novagen))을 포함하는 세포이다.
다른 구체예에서, 상기 숙주 세포는 환원 세포질(reducing cytosol), 바람직하게 대장균을 포함하는 세포이다.
융합 폴리펩티드는 또한 체외에서 형성될 수 있다. 바람직하게는 무세포 발현 시스템이 사용된다. 많은 무세포 번역 시스템은 일반적으로 이용가능하고, 여기에서 언급된 고려사항을 염려하여 본 발명의 융합 폴리펩티드의 생산에 있어서 사용에 적합하다.
융합 폴리펩티드는 적절한 경우에 원심분리기, 여과 또는 고정된 금속 친화력 정제를 포함하는 친화력 크로파토그래피를 이용하여 용해된 세포로부터 정제될 수 있다.
융합 폴리펩티드의 발현 특성은 융합 폴리펩티드가 제조되는 상태 조절을 통해 영향을 받거나 또는 조절을 받을 것이다. 예를 들면, 숙주 세포가 유지되는 상태, 예를 들면, 온도, 기질의 존재 등을 포함한다.
본 발명의 일부 구체예에서, 숙주 세포에서의 발현 구조물의 과잉발현을 달성하는 것이 바람직하다. 특정한 발현 구조물의 과잉발현에 대한 매커니즘은 본 발명이 속하는 기술분야에서 잘 알려져 있고, 구조물 자체, 발현되는 숙주 및 바람직하거나 또는 요구되는 과잉 발현 정도를 포함하는 다른 요인에 의존할 것이다. 예를 들면, 과잉발현은 i) 예를 들면, 원핵 생물 숙주에서의 T5 프로모터 시스템 또는 T7 RNA 폴리머라아제 프로모터 시스템과 같은 강력한 프로모터 시스템의 이용, ii) 예를 들면, colEl 복제 개시점을 포함하는 플라스미드와 같은 높은 복제수 플라스미드의 이용, iii) 예를 들면, 융합 서열을 통한 메신저 RNA의 안정화, 또는 iv) 예를 들면, 코돈 사용의 최적화, 리보솜의 결합 자리, 또는 말단 자리 등과 같은 번역의 최적화에 의해 달성될 수 있다. 과잉발현의 이점은 융합 폴리펩티드의 높은 수율의 제조를 허용한다.
6. 본 발명의 융합 폴리펩티드의 용도
본 발명은 하나 또는 하나 이상의 향상된 활성을 보이고, 핵산 결합 또는 인산디에스테르 결합 형성의 촉매작용에 있어서 향상된 효율을 포함하고, 또는 향상된 안정화, 변성, 열화 또는 불활성에 대한 향상된 저항성과 같은 향상된 하나 또는 하나 이상의 향상된 특성을 보이며, 또는 향상된 활성 및 향상된 특성을 모두 보이는 융합 폴리펩티드를 제공한다. 결과로서, 본 발명의 폴리펩티드는 바람직하거나 또는 요구되는 인산디에스테르 결합이 형성되는 경우 어떠한 적용에 있어서도 유용함을 가지고 있다. 예를 들면, 본 발명의 융합 폴리펩티드의 사용은 제한 없이 다음을 포함한다.
복제
복제는 복제 및/또는 재조합 핵산 서열, 예를 들면 재조합 단백질의 제조를 도울 수 있는 발현 벡터를 생성하기 위하여 또는 DNA 서열 등을 가능하게 하기 위해서 분자 생물학에서 이용 가능한 기술을 위해서 관련기술에서 인식된 용어이다. 복제는 유전자 확인, 단백질 특성화, 유전자 지문에서부터 큰 규모 단백질 제조에까지 넓은 적용분야에서 사용된다. 목적하는 핵산 단편이 복제되는 매우 다양한 특성화된 벡터는 단백질 발현, 태깅(택ging), 단일 가닥 RNA 및 DNA 제품 및 다른 조작 숙주로 존재한다. 어떠한 DNA단편의 복제는 필수적으로 다음의 4 단계를 포함한다: 1) 단편화 - DNA 가닥 또는 이중의 분리, 2) 결합 - DNA 조각들의 부착, 3) 형질감염 또는 형질전환 - 새로 형성된 DNA 조각들을 숙주 세포로의 삽입, 4) 스크리닝 또는 선별 - 새로 형성된 DNA 조각가 함께 성공적으로 형질 전환된 세포의 선별.
이러한 단계들이 복제 단계에서 변함없다고 하더라도 다수의 대안 가능한 경로들이 선택될 수 있고, 이는 ‘복제 전략’으로서 요약되어 있다.
연결 비트 분석
연결 비트 분석은 단일 뉴클레오티드 다형성과 같은 특정한 다형성 자리에서 뉴클레오티드의 존재를 알아내기 위하여 사용된다. 이러한 분석은 프라이머 사이에서 하나의 뉴클레오티드 갭과 함께 타겟이 되기 위하여 혼성화하는 두 개의 프라이머를 요구한다. 각각의 네 개의 뉴클레오티드는 DNA 폴리머라아제, 리가아제, 타겟 DNA및 프라이머를 포함하는 분리된 반응 혼합물에 첨가된다. 폴리머라아제는 SNP와 상호보완적인 제1 프라이머의 3’ 말단에 뉴클레오티드를 첨가하고, 리가아제는 두 개의 인접한 프라이머를 서로 결합한다. 샘플을 가열하는 동안에 연결이 발생하면, 이제 더 큰 프라이머가 혼성화될 것이고, 신호, 예를 들면 형광성이 탐지될 것이다. 이러한 방법에 대한 더 자세한 논의는 미국등록특허 제5,919,626호, 제5,945,283호, 제5,242,794호, 및 제5,952,174호에 나타나 있다.
mRNA 디스플레이
mRNA 디스플레이에 있어서, mRNA 변형물의 대형 라이브러리는 체외에서 전사되고 번역된다. 각각의 유전자 변형물은 3’ 말단에 부착된 퓨로마이신 모이에티 공유결합(puromycin moiety covalently)을 가지고 있다. 번역 리보솜이 mRNA 주형의 3’ 말단에 닿는 경우, 퓨로마이신 모이에티(puromycin moiety)는 리보솜의 A 지역으로 들어가고, 제조된 폴리펩티드 내로 포함된다. 이러한 결과는 다운스트림 스크리닝 및 선별 실험에서 사용될 수 있는 mRNA-폴리펩티드 융합이다. mRNA 디스플레이 라이브러리을 제조하는 중요한 단계는 3’-퓨로마이신 올리고뉴클레오티드 스페이서에 mRNA 주형의 결합이다. 이러한 경우, DNA 리가아제는 단일 가닥 RNA 분자를 단일 가닥 DNA 스페이서에 결합하기 위해 사용되고, 일반적으로 결합 합류점을 걸친 단일 가닥 DNA "스프린트(splint)"의 도움과 함께 사용된다. 이러한 방법에 대한 더 자세한 논의는 미국등록특허 제6,214,553호 및 제6,207,446호 에 나타나 있다. 본 발명은 또한 본 발명에 따른 사용을 위한 키트의 제조를 고려한다. 튜브, 유리병, 및 수축포장 및 블로우 성형 포장재를 포함하는 적합한 용기 및 포장재에서 적합한 키트는 본 발명에 따를 사용을 위하여 다양한 시약을 포함한다.
본 발명에 따른 적절한 키트에서 포함되기 적합한 물질은 본 발명의 하나 또는 하나 이상의 융합 폴리펩티드, 예를 들면, 본 발명의 융합 폴리펩티드의 효과적인 활성을 위해 요구되는 하나 또는 하나 이상의 양성 조절(여기에서 언급된 예시들), 버퍼, 보조인자, 및 다른 시약을 포함한다.
명확하게, 하나 또는 하나 이상의 폴리펩티드 또는 마이크로플루이딕스 장치(microfluidics device), 마이크로큐벳(microcuvette), 마이크로어레이(microarray), 중합체 비드(polymer bead), 자성입자를 포함하는 나노 또는 마이크로 입자 등과 같은 하나 또는 하나 이상의 고체 기질에 결합되는 본 발명의 조성물을 포함하는 키트는 고려된다. 키트는 또한 시험 샘플이 포함하는 것과 분석하고 비교할 수 있는 조절 샘플 또는 조절 샘플들의 시리즈를 포함할 수 있다. 키트 각각의 구성요소는 독립적인 용기에 둘러싸질 수 있고, 모든 다양한 용기는 키트를 이용하여 수행된 분석 또는 반응의 결과를 해석할 수 있는 설명서와 함께 하나의 포장재 내에 있을 수 있다.
본 발명은 상기에서 논의된 것으로 이루어져 있고, 또한 아래 기재된 실시예의 설명에 의해 예상한다.
실시예
실시예 1- 플라스미드의 구조물 및 융합 폴리펩티드의 제조
실시예는 아래 표 1과 같이, T4 DNA리가아제(리가아제) 또는 다양한 DNA-결합 폴리펩티드에 융합된 대장균 리가아제(LigA)를 포함하는 융합 폴리펩티드의 대장균 상에서 제조에 대한 플라스미드의 구조물을 기재한다. 서로 상대적인 리가아제 활성 및 DNA-결합 활성을 포함하는 폴리펩티드의 방향은 폴리펩티드가 융합 폴리펩티드의 이름 상에서 나열되는 순서에 의해 나타난다. - 예를 들면, p50-리가아제는 T4 DNA 리가아제 폴리펩티드의 N-말단에 융합된 p50 DNA-결합 폴리펩티드(선택적으로 연결 폴리펩티드를 통하여)를 포함하는 융합 폴리펩티드를 나타내는 반면, 리가아제-p50은 p50 DNA-결합 폴리펩티드의 N-말단에 융합된 T4 DNA 리가아제 폴리펩티드(다시, 선택적으로 연결 폴리펩티드를 통해)를 포함하는 융합 폴리펩티드로 나타낸다.
T4 DNA 리가아제 융합 폴리펩티드 | 대장균 DNA 리가아제 융합 폴리펩티드 |
T4 DNA 리가아제 (조절) Sso7d-리가아제(Sso7d-리가아제) P50-리가아제(P50-리가아제) 리가아제-p50(리가아제-p50) NFAT-리가아제(NFAT-리가아제) 리가아제-NFAT(리가아제-NFAT) cTF-리가아제(cTF-리가아제) 리가아제-cTF(리가아제-cTF) PprA-리가아제(PprA-리가아제) 리가아제-PprA(리가아제-PprA) Ku-리가아제(Ku-리가아제) 리가아제-Ku(리가아제-Ku) |
LigA (조절) P50-ligA LigA-p50 |
재료 및 방법
1. 대장균 가닥 DH5a-E의 생장
대장균 가닥 DH5a-E(Invitrogen)는 모든 실험에서 사용된다. 세포는 아래의 사항을 제외하고 표준 상태(LB medium, 37도 incubation)에서 생장한다.
2. 플라스미드 구조물
여기에서 사용된 대표적인 플라스미드 및 올리고뉴클레오티드는 표 2에 나타나 있다.
인간 NF-kappaB(즉, p50) 아미노산 40-366(즉, p50)을 인코딩한 DNA 단편은 폴리머라아제 연쇄 반응(PCR)에서 올리고뉴클레오티드 프라이머 50_Sfi.정방향(서열 번호 1) 및 p50-리가아제.역방향(서열 번호 2)와 함께 플라스미드 pRES112로부터 증폭된다. T4 DNA 리가아제를 인코딩한 DNA 단편은 PCR에서 올리고모뉴클레오티드 프라이머 p50-리가아제.정방향(서열 번호 3) 및 리가아제_Sfi.역방향(서열 번호 4)와 함께 플라스미드 pET14b-리가아제로부터 증폭된다. p50_Sfi.정방향(서열 번호 1) 및 리가아제 Sfi.역방향 (서열 번호 4)을 사용한 겹쳐진 조립 PCR(참조: Horton 등 (1989) Gene, 77, 61-68)은 p50-리가아제 융합 폴리펩티드가 코딩된 유전자를 야기시키는 p50 유전자 및 리가아제 유전자를 함께 스프라이싱하기 위하여 사용된다. 조립된 p50-리가아제 유전자는 제한 효소 SfiI과 함께 분해되고, pCA24N-p50-리가아제를 얻기 위해 발현 벡터 pCA24N(동일한 제한 효소로 처리됨)에 결합된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)를 포함하는 완벽한 발현 구조물은 서열 번호 5로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 6로 표시된다.
디이노코커스 라디외두란스(Deinococcus radiodurans)로부터 유래된 pprA 유전자는 유전자 디자이너 소프트웨어 패키지(Gene Designer software package, (Villalobos 등 (2006), BMC Bioin정방향matics, 7, 285))를 이용하여 대장균에서 발현을 강화시키기 위해 최적화된다. 이는 발현된 단백질의 아미노산 서열(GenBank 접근 번호 BAA21374)을 변경하지 않는 반면, pprA 유전자의 서열상에서 164 동의적 돌연변이를 도입한다. 연결된 제한 자리(flanking restriction sites, BamHI 및 Spel)와 함께 최적화된 유전자는 DNA 2.0(Menlo Park, CA)에 의해 합성되고, 그들의 복제 벡터 pJ204로 공급된다. 코돈-최적화 pprA 유전자는 제한 효소 BamHI 및 Spel와 함께 분해에 의해 pJ204-pprA로부터 제거된다. p50 모이에티는 동일한 제한 효소(참조 서열 번호 5)의 분해에 의해 pCA24N-p50-리가아제로부터 제거된다. 분해된 pprA의 결합은 pCA24N-pprA-리가아제가 생산된 리가아제-함유 pCA24N 백본(backbone)에 삽입된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)을 포함하는 완벽한 발현 구조물은 서열 번호 7로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 8로 표시된다.
술포로버스 솔파타리쿠스(Sulfolobus solfataricus)로부터 유래된 sso7d 유전자는 유전자 디자이너 소프트웨어 패키지(Gene Designer software package,(Villalobos 등 (2006), BMC Bioin정방향matics, 7, 285))를 이용하여 대장균에서 발현을 강화시키기 위해 최적화된다. 이는 발현된 단백질의 아미노산 서열(GenBank 접근 번호 NP 343889)을 변경하지 않는 반면, pprA 유전자의 서열상에서 47 동의적 돌연변이를 도입한다. 네 개의 코돈은 sso7d 유전자의 5’말단으로부터 제거된다. 연결된 제한 자리(flanking restriction sites, BamHI 및 Spel)와 함께 최적화된 유전자는 통합적인 DNA 기술(Coralville, IA)에 의해 합성되고, 그들의 복제 벡터 pIDTSmart로 공급된다. 코돈-최적화 sso7d 유전자는 제한 효소 BamHI 및 Spel와 함께 분해에 의해 pIDTSmart-sso7d로부터 제거된다. p50 모이에티는 동일한 제한 효소(참조 서열 번호 5)의 분해에 의해 pCA24N-p50-리가아제로부터 제거된다. 분해된 sso7d의 결합은 pCA24N-sso7d-리가아제가 생산된 리가아제-함유 pCA24N 백본(backbone)에 삽입된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)을 포함하는 완벽한 발현 구조물은 서열 번호 9로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 10으로 표시된다.
인간 NF-kappaB(즉, p50)의 아미노산 40-366을 인코딩한 DNA단편은 폴리머라아제 연쇄 반응(PCR)에서 올리고뉴클레오티드 프라이머 리가아제-p50.정방향(표 2, 서열 번호 11) 및 p50_Sfi.역방향(표 2, 서열 번호 12)와 함께 플라스미드 pRES112로부터 증폭된다. T4 DNA 리가아제를 인코딩한 DNA 단편은 PCR에서 올리고머뉴클레오티드 프라이머 리가아제 Sfi.정방향(표 2, 서열 번호 13) 및 리가아제-p50.역방향(표 2, 서열 번호 14)와 함께 플라스미드 pET14b-리가아제로부터 증폭된다. 프라이머 리가아제 Sfi.정방향(서열 번호 13) 및 p50_Sfi.역방향(서열 번호 12)을 사용한 겹쳐진 조립 PCR(참조: Horton 등 (1989) Gene, 77, 61-68)은 리가아제-p50 융합 폴리펩티드가 코딩된 유전자를 야기시키는 p50 유전자 및 리가아제 유전자를 함께 스프라이싱하기 위하여 사용된다. 조립된 리가아제-p50 유전자는 제한 효소 SfiI과 함께 분해되고, pCA24N-리가아제-p50을 얻기 위해 발현 벡터 pCA24N(동일한 제한 효소로 처리됨)에 결합된다. T5-lac 프로모터 및 (His)6-택(두 개의 벡터는 인코드됨)를 포함하는 완벽한 발현 구조물은 서열 번호 15로 표시되고, 융합 폴리펩티드의 유도된 아미노산 서열은 서열 번호 16으로 표시된다.
올리고뉴클레오티드 | 5’ → 3’ |
p50_Sfi.정방향 | GATCCGGCCCTGAGGGCCGCAGATGGCCCATACCTTCAAATAT택 [서열 번호 1] |
p50-리가아제.역방향 | CCGCCGGAGCCTCCGCCAC택TGCCCGAGCTCCCCTTCTGACGTTTCCTCTG [서열 번호 2] |
p50-리가아제.정방향 | GCAC택TGGCGGAGGCTCCGGCGGTGGCATTCTTAAAATTCTGAACGAAA택CATC [서열 번호 3] |
리가아제_Sfi.역방향 | ATGCGGCCGCA택GCCTTA택ACCAGTTACCTCATGAAAATC [서열 번호 4] |
리가아제-p50.정방향 | GCAC택TGGCGGAGGCTCCGGCGGTGGCGCAGATGGCCCATACCTTCAAATAT택 [서열 번호 11] |
p50_Sfi.역방향 | ATGCGGCCGCA택GCCT택CTCCCCTTCTGACGTTTCCTCTGC AC [서열 번호 12] |
리가아제_Sfi.정방향 | GATCCGGCCCTGAGGGCCATTCTTAAAATTCTGAACGAAA택C [서열 번호 13] |
igase-p50.역방향 | CCGCCGGAGCCTCCGCCAC택TGCC택ACCAGTTACCTCATGAAAATC [서열 번호 14] |
3. 융합 폴리펩티드의 제조 및 분리
플라스미드 pCA24N-p50-리가아제, pCA24N-pprA-리가아제, pCA24N-sso7d-리가아제 및 pCA24N-리가아제-p50는 대장균 DH5a-E 세포 내로 도입되고, 형질전환은 융합 폴리펩티드 제조에 적합한 상태(28℃, IPTG가 0.4 mM의 농도로 추가됨)에서 배양된다. 세포들은 펠렛되고, 칼럼 버퍼(CB: 40 mM Tris-HCl, pH 8.0; 300 mM 염화나트륨; 10 mM 이미다졸; 10% 글리세롤; 및 1 mM 베타-메르캅토데탄올)에서 떠 있는 상태가 되고, 초음파에 의해 분리된다. 투명한 용해물은 코발트계 금속 친화력 수지(Talon, Clontech)에 적용된다. 비-(His)6-태그된 세포 단백질을 제거하기 위하여 세척한 후, 150 mM 이미다졸을 포함하는 컬럼 버퍼와 함께 (His)6-태그된 융합 폴리펩티드가 분리된다. 분리된 부분은 모여지고, 저장 버퍼(50 mM 인산칼륨 버퍼, pH 7.8; 200 mM 염화나트륨; 10% 글리세롤)에 대해서 광범위하게 투석된다.
4. 리가아제 활성
융합 폴리펩티드의 리가아제 활성은 아가로스 겔-기반 분석(실시예 2 및 3), 세포 형질변환 분석(실시예 4) 및 정량적 PCR 분석(실시예 5), 세 가지 분석을 사용하여 결정된다.
실시예 2- T4 DNA 리가아제 융합 단백질의 결합 활성의 분석
겔-기반 활성 분석
외가닥 말단 결합에 대해서, 1,277 bp PCR 제품은 pCA24N.정방향역방향'-GATAAC AATTTC AC AC AGA ATTC ATTAA AGAG-3‘[서열 번호 19]) 및 pCA24N.역방향 (5 '-CCCATTAACATC ACCATCTAATTC AAC-3 ' [서열 번호 20]) 프라이머와 함께 플라스미드 pCA24N-ompC의 증폭에 의해 발생된다. 상기 PCR 제품은 매우 유사한 크기(638bp 및 639bp)의 두 개의 선형 단편을 생산하는 제한 효소 SpeI와 함께 절단된다. 절단 반응의 상기 두 제품은 함께 정제되고, 바이러스 리가아제 단백질 존재 및 부재하에서 인큐베이트 된다. 150 ng의 기질 DNA는 16℃에서 10 분 동안 20 pmol 효소와 함께 인큐베이트된다. 반응은 추가적인 15 분 동안 65℃로 가열함에 따라 정지된다. 리가아제 활성은 Qiagen MinElute 컬럼을 사용한 샘플의 정제 및 아갈로스 겔 상에서 이들의 작동에 의해 결정된다. 활성은 1,277 pb 결합된 제품의 출연 및 638/639 bp 기질 밴드의 소멸로서 측정된다.
이중가닥 말단 결합에 대해서, 프라스미드 pCA24N-tig는 세 개의 선형 단편(5,232 bp, 717 bp 및 589 bp)을 생산하는 제한 효소 Sfil 및 Smal와 함께 절단된다. 상기 717 bp 단편은 정제되고 150 ng DNA가 16℃에서 20 분 동안 20 pmol 리가아제 효소와 함께 인큐베이트되어 결합 분석에 사용된다. 반응은 추가적인 15분 동안 65℃로 가열함에 따라 정지된다. 리가아제 활성은 Qiagen MinElute 컬럼을 사용한 샘플들의 정제 및 아갈로스 겔 상에서 이들의 작동에 의해 결정된다. 활성은 1,434 pb 결합된 제품의 출연 및 717 bp 기질 밴드의 소멸로서 측정된다.
결과
바이러스 융합 폴리펩티드의 외가닥 말단 및 이중가닥 말단 결합 활성은 각각 도 1a 및 1b에 나타나 있다. 도 1a의 2, 4, 5, 및 11번째 줄에 그려진 시그널 밴드(1,277 bp)는 매우 효율적인 Sso7d-리가아제, 리가아제-cTF, p50-리가아제, 및 리가아제-PprA 융합 단백질과 외가닥 말단 결합 활성을 나타낸다. 상기 1,277 bp 밴드는 또한 3, 6-8, 및 10번째 줄에 있어서 이러한 융합 폴리펩티드가 또한 견고한 외가닥 말단 리가아제 활성을 갖는다는 것을 나타내는 분명한 증거가 된다. 비록, 상기에서 언급한 다수의 융합 폴리펩티드가 관찰되는 것보다는 적을 지라도, 결합 활성은 T4 DNA 리가아제 조절(도 1a, 14번째 줄)와 함께 관찰된다.
도 1b에서, 매우 효율적인 리가아제-cTF 및 p50-리가아제 융합 단백질과 이중가닥-말단 결합 활성을 나타내는 단일 밴드(1,434 bp)는 3번째 줄 및 4번째 줄에 나타나 있다. 상기 1,434 bp 밴드는 또한 1, 5, 6, 10, 및 11번째 줄에 있어서 이러한 융합 폴리펩티드가 또한 견고한 이중가닥 말단 리가아제 활성을 갖는다는 것을 나타내는 분명한 증거가 된다. 상기에서 언급한 다수의 융합 폴리펩티드가 관찰되는 것보다는 현저하게 적은 최소의 이중가닥 말단 결합 활성은 T4 DNA 리가아제 조절(도 1b, 14번째 줄)과 함께 관찰된다.
논의
상기 겔-기반 분석의 결과는 융합 파트너 및 융합의 특성이 DNA 리가아제의 활성을 조절할 것이라는 것을 보여준다.
특별히, 외가닥 말단 결합에 있어서, T4 DNA 리가아제와 Sso7d, cTF, p50 및 PprA DNA-결합 단백질과의 융합은 DNA-결합 단백질 융합이 부족한 T4 DNA 리가아제와 비교하여 현저하게 향상된 결합 활성을 보여준다. 이중가닥 말단 결합 활성은 리가아제가 cTF 및 p50 단백질에 융합하는 경우 특히 향상된다.
실시예 3- 대장균 LigA 융합 단백질 결합 활성의 분석
겔-기반 활성 분석
외가닥 말단 결합과 관련하여, 170 ng의 Spel로 잘려진 ompC 기질(실시예 2에 언급된 것으로서)은 16℃에서 17 시간동안 각각 LigA 효소 20 pmol과 함께 인큐베이트된다. 상기 반응은 가열-정지(65℃, 15 분)되고, 아갈로스 겔 상에서 작동된다. 게다가, LigA-p50 및 p50-LigA 융합 폴리펩티드, 네이티브 LigA 리가아제 및 세 개의 조절 샘플들이 분석되었다.
- 양성 조절-상업적으로 이용가능한 T4 DNA 리가아제 (Fermentas)
- 음성 조절-리가아제를 첨가하지 않음
- 상업적 조절-대장균 LigA 1 ul
이중가닥 말단 결합에 대하여, 120 ng의 Sfil/Smal-digested tig 기질(실시예 2에 언급된 것으로서)은 16℃에서 17 시간동안 각각 효소 20 pmol과 함께 인큐베이트된다. 상기 반응은 가열-정지(65℃, 15 분)되고, 아갈로스 겔 상에서 작동된다.
결과
LigA 융합 단백질의 외가닥 말단 및 이중가닥 말단 결합 활성은 각각 도 2a 및 2b에 나타나 있다. 네이티브 LigA는 외가닥 말단 결합(도 2a, 2 및 8번째 줄)에 대하여 상기 상업적으로 이용 가능한 LigA 효소와 비교할 만한 활성을 보여준다. p50 DNA-결합 단백질의 융합(도 2a, 3 및 4번째 줄)은 융합되지 않은 LigA와 비교하여 결합 활성의 향상을 보여준다.
예상된 바와 같이, 상기 상업적으로 이용 가능한 LigA 효소는 이중가닥 말단 분석(도 2b, 8번째 줄)에서 무시해도 될 정도의 활성을 보여준다. 상기 네이티브 LigA는 추적 활성(도 2b, 2번째 줄)을 보여준다. 이중가닥 말단 분석에 있어서 견고한 결합 활성은 p50-LigA 융합이 아닌 LigA-p50 융합 구조물과 함께 나타난다.
외가닥 말단 및 이중가닥 말단 분석에 있어서, 상기 T4 DNA 리가아제 양성 조절은 우수한 활성을 보여준다. 음성 조절 샘플에서는 활성이 관찰되지 않았다.
논의
본 발명이 속하는 기술분야에서 인식된 것과 같이, 대장균 LigA는 T4 DNA 리가아제와 비교하여 감소된 결합 활성을 보여준다. 그러나, LigA에 DNA-결합 폴리펩티드의 융합은 결합 활성이 향상되고, 확실히 LigA의 C-말단에 p50-DNA-결합 폴리펩티드의 융합은 LigA 이중가닥 말단 결합 활성을 부여하고, 본래의(native) 효소 상에서는 이중가닥 말단 결합 활성이 관찰되지 않는다.
실시예 4-형질전환 분석
형질전환 분석
상호 보완적인 외가닥 말단과 함께 5,032 bp 벡터 백본 및 1,311 bp 삽입 단편을 제조하기 위해 플라즈마 pCA24N-ompC는 Hindlll 및 Spel 제한 효소와 함께 선으로 만들어 진다.선으로 만들어진 플라스미드(탈인산화된 벡터(dephosphorylated vector) 100 ng 및 삽입 단편 78 ng)는 상기에서 목적한대로 제조된 p50-리가아제, 리가아제-PprA, Sso7d-리가아제, 또는 T4 DNA 리가아제의 존재 또는 부제 조건에서 인큐베이트된다. 16 ℃에서 60 분 동안 인큐베이트된 후, 각각의 샘플은 QiaQuick PCR 정제
키트(Qiagen)를 사용하여 정제되고, 부분 표본들은 대장균 DH5a-E 세포 의 형질전환에 사용된다. 형질전환된 세포는 클로람페니콜(chloramphenicol)을 포함하는 LB 배지에 놓여지고, 37℃에서 밤새 인큐베이트된다. 각각의 플레이트에서 복제된 수는 측정되고, 즉시 다시 원형으로 만들어진 플라스미드 분자, 및 그러므로 리가아제 융합 단백질의 활성과 비례한다.
결과
형질전환 분석의 결과는 아래 표 3에 나타나있다. T4 DNA 리가아제 및 리가아제-PprA 융합 단백질은 더 나은 결과를 낸 Sso7d-리가아제 및 p50-리가아제 융합 단백질에 보여진다. 음성 조절에서 대수롭지 않은 복제된 수가 관찰된다.
리가아제 융합 단백질 | 복제된 수 |
T4 DNA 리가아제 | 47 |
음성 조절(리가아제 없음) | 4 |
Sso7d-리가아제 | 18 |
p50-리가아제 | 17 |
리가아네-PprA | 53 |
실시예 5-정량적 PCR(qPCR)을 이용한 결합 활성의 분석
실시예 5는 다양한 융합 폴리펩티드의 리가아제 활성을 수량화하기 위하여 qPCR의 사용을 서술한다.
재료 및 방법
외가닥 말단 결합에 대하여, 상기 실시예 2에서 서술된 절단된 PCR 제품(Spel-digested ompC)은 다양한 리가아제 융합 단백질 존재하에 인큐베이트된다. 첫 번째 실험에서, 40 ng의 기질이 20 pmol의 p50-리가아제, 리가아제-p50, PprA-리가아제, Sso7d-리가아제나 또는 T4 DNA 리가아제 중 어느 하나와 함께 인큐베이트된다. 두 번째 실험에서, 420 ng의 기질이 1 pmol 의 리가아제-cTF, 리가아제-PprA, p50-리가아제나 또는 Sso7d-리가아제 중 어느 하나와 함께 인큐베이트된다. 16 ℃에서 10 분 동안 인큐베이트된 후, 각각의 샘플은 QiaQuick PCR 정제 키트(Qiagen)를 이용하여 탈염화된다. 양성 조절 반응은 PCR 제품 및 T4 DNA 리가아제로 이루어지고, 16 ℃에서 16 시간 동안 인큐베이트된다(결합 반응을 완성하기 위함). 음성 조절 반응은 어떠한 리가아제 단백질도 부족하다. 각각의 반응에서 결합된 제품(및 그러므로 각각의 리가아제의 활성)의 양은 결합 자리에 걸쳐진 165 bp 단편이 증폭된 프라이머를 이용하는 qPCR에 의해 측정된다. 각각의 qPCR에서 제품의 발견은 SYBR Green (Bio-Rad). qPCR 프라이머: ompC. 정방향 5'-GGCTTCGCGACCTACCGTAAC ACTG AC-3' [서열 번호 17]; ompC. 역방향, 5'-GCCGACGCCGTCGCCGTTTTGAC-3' [서열 번호 18]의 결합에 의한다.
이중가닥 말단 결합에 대하여, Sfil/Smal로 잘려진 티그(tig) 기질(실시예 2에 기재된)은 동일한 리가아제 융합 효소(리가아제-cTF, 리가아제-PprA, p50-리가아제, 또는 Sso7d-리가아제)와 함께 인큐베이트된다. 각각의 반응에 대하여, 16 ℃에서 5 시간 동안 100 ng의 기질이 1 pmol의 효소와 함께 인큐베이트된다. 상기 반응은 가열-정지(65 ℃, 15 분)되고, 단편은 정제되며, 아갈로스 겔 상에서 작동된다.
결과
qPCR 실험의 결과는 도 3 및 4에 나타나 있다. 상기 데이터는 각각 세 개 중의 하나에서 분석된 샘플로 이루어진 세 개의 독립적인 실험의 평균(+/- SEM)을 나타낸다. 각각의 실험에 대하여, 모든 활성은 양성 조절 반응의 활성(즉, 10 분 대신 16 시간 동안의 결합 반응)을 정상화된다. 실험 1에서 가장 활성이 있는 융합 단백질은 기질의 약 60%가 결합할 수 있는 p50-리가아제 및 PprA-리가아제이다(도 3). 실험 2에서 가장 활성이 있는 융합 단백질은 DNA 분자 기질의 약 62% 내지 69%가 결합할 수 있는 T4 DNA 리가아제, 리가아제-cTF 및 리가아제-PprA이다(도 4). 반대로, Sso7d-리가아제는 기질의 약 30%가 결합할 수 있다.
이중가닥 말단 결합에 대한 겔-기반 분석의 결과는 도 5에 나타나 있다. 무시해도 될 정도의 결합이 Sso7d-리가아제(1번째 줄) 및 T4 DNA 리가아제(5번째 줄)에 대하여 관찰되었다. 결합 활성의 추적 양은 리가아제-PprA(3번째 줄)에 대하여 관찰된 반면, p50-리가아제(2번째 줄) 및 리가아제-cTF(4번째 줄)를 가장 높은 활성을 보여준다.
논의
상기에 기재된 qPCR 분석은 DNA 리가아제의 결합 활성이 DNA-결합 폴리펩티드에의 융합에 의해 향상될 수 있다는 추가적인 확인을 제공한다. 두 개의-폴드 향상은 리가아제 단독에 비교하여 p50-리가아제, 리가아제-cTF 및 리가아제-PprA 융합 폴리펩티드에 대하여 관찰된다. 게다가, 융합 폴리펩티드의 특성 - 리가아제 폴리펩티드와 상대적인 DNA-결합 폴리펩티드의 정체 및 DNA-결합 폴리펩티드의 방향 - 은 융합 폴리펩티드의 결합 활성에 영향을 받는다.
산업상 이용가능성
본 발명의 융합 폴리펩티드 및 제조방법은 분자생물 기술뿐만 아니라, 진단, 단백질 제조, 약학, 영양학 및 의학 분야의 넓은 범위에서 유용하다.
SEQUENCE LISTING
<110> Massey University
Patrick, Wayne M
Wilson, Robert H
<120> FUSION POLYPEPTIDES AND USES THEREOF
<130> 626257 JBM
<150> 61/242865
<151> 2009-09-16
<150> 61/329604
<151> 2010-04-30
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 46
<212> DNA
<213> Artificial
<220>
<223> Synthetic - made in laboratory
<400> 1
gatccggccc tgagggccgc agatggccca taccttcaaa tattag 46
<210> 2
<211> 53
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 2
ccgccggagc ctccgccact agtgcccgag ctccccttct gacgtttcct ctg 53
<210> 3
<211> 58
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 3
gcactagtgg cggaggctcc ggcggtggca ttcttaaaat tctgaacgaa atagcatc 58
<210> 4
<211> 44
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 4
atgcggccgc ataggcctta tagaccagtt acctcatgaa aatc 44
<210> 5
<211> 2646
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<220>
<221> promoter
<222> (1)..(93)
<223> T5-lac promoter
<220>
<221> CDS
<222> (115)..(165)
<223> 6xHis tag and linker
<220>
<221> misc_feature
<222> (147)..(152)
<223> BamHI restriction site
<220>
<221> CDS
<222> (166)..(1146)
<223> p50 CDS (Homo sapiens)
<220>
<221> CDS
<222> (1147)..(1185)
<223> linker
<220>
<221> misc_feature
<222> (1159)..(1164)
<223> SpeI restriction site
<220>
<221> CDS
<222> (1186)..(2643)
<223> T4 ligase CDS
<400> 5
ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60
attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117
Met
1
aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcc 165
Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala
5 10 15
gca gat ggc cca tac ctt caa ata tta gag caa cct aaa cag aga gga 213
Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg Gly
20 25 30
ttt cgt ttc cgt tat gta tgt gaa ggc cca tcc cat ggt gga tta cct 261
Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu Pro
35 40 45
ggt gcc tct agt gaa aag aac aag aag tct tac cct cag gtc aaa atc 309
Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys Ile
50 55 60 65
tgc aac tat gtg gga cca gca aag gtt att gtt cag ttg gtc aca aat 357
Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr Asn
70 75 80
gga aaa aat atc cac ctg cat gcc cac agc ctg gtg gga aaa cac tgt 405
Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His Cys
85 90 95
gag gat ggg atc tgc act gta act gct gga ccc aag gac atg gtg gtc 453
Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val Val
100 105 110
ggc ttc gca aac ctg ggt ata ctt cat gtg aca aag aaa aaa gta ttt 501
Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val Phe
115 120 125
gaa aca ctg gaa gca cga atg aca gag gcg tgt ata agg ggc tat aat 549
Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr Asn
130 135 140 145
cct gga ctc ttg gtg cac cct gac ctt gcc tat ttg caa gca gaa ggt 597
Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu Gly
150 155 160
gga ggg gac cgg cag ctg gga gat cgg gaa aaa gag cta atc cgc caa 645
Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg Gln
165 170 175
gca gct ctg cag cag acc aag gag atg gac ctc agc gtg gtg cgg ctc 693
Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg Leu
180 185 190
atg ttt aca gct ttt ctt ccg gat agc act ggc agc ttc aca agg cgc 741
Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg Arg
195 200 205
ctg gaa ccc gtg gta tca gac gcc atc tat gac agt aaa gcc ccc aat 789
Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro Asn
210 215 220 225
gca tcc aac ttg aaa att gta aga atg gac agg aca gct gga tgt gtg 837
Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys Val
230 235 240
act gga ggg gag gaa att tat ctt ctt tgt gac aaa gtt cag aaa gat 885
Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys Asp
245 250 255
gac atc cag att cga ttt tat gaa gag gaa gaa aat ggt gga gtc tgg 933
Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val Trp
260 265 270
gaa gga ttt gga gat ttt tcc ccc aca gat gtt cat aga caa ttt gcc 981
Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe Ala
275 280 285
att gtc ttc aaa act cca aag tat aaa gat att aat att aca aaa cca 1029
Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys Pro
290 295 300 305
gcc tct gtg ttt gtc cag ctt cgg agg aaa tct gac ttg gaa acc agt 1077
Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr Ser
310 315 320
gaa cca aaa cct ttc ctc tac tat cct gaa atc aaa gat aaa gaa gaa 1125
Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu Glu
325 330 335
gtg cag agg aaa cgt cag aag ggg agc tcg ggc act agt ggc gga ggc 1173
Val Gln Arg Lys Arg Gln Lys Gly Ser Ser Gly Thr Ser Gly Gly Gly
340 345 350
tcc ggc ggt ggc att ctt aaa att ctg aac gaa ata gca tct att ggt 1221
Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly
355 360 365
tca act aaa cag aag caa gca att ctt gaa aag aat aaa gat aat gaa 1269
Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu
370 375 380 385
ttg ctt aaa cga gta tat cgt ctg act tat tct cgt ggg tta cag tat 1317
Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr
390 395 400
tat atc aag aaa tgg cct aaa cct ggt att gct acc cag agt ttt gga 1365
Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly
405 410 415
atg ttg act ctt acc gat atg ctt gac ttc att gaa ttc aca tta gct 1413
Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala
420 425 430
act cgg aaa ttg act gga aat gca gca att gag gaa tta act gga tat 1461
Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr
435 440 445
atc acc gat ggt aaa aaa gat gat gtt gaa gtt ttg cgt cga gtg atg 1509
Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met
450 455 460 465
atg cga gac ctt gaa tgt ggt gct tca gta tct att gca aac aaa gtt 1557
Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val
470 475 480
tgg cca ggt tta att cct gaa caa cct caa atg ctc gca agt tct tat 1605
Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr
485 490 495
gat gaa aaa ggc att aat aag aat atc aaa ttt cca gcc ttt gct cag 1653
Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln
500 505 510
tta aaa gct gat gga gct cgg tgt ttt gct gaa gtt aga ggt gat gaa 1701
Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu
515 520 525
tta gat gat gtt cgt ctt tta tca cga gct ggt aat gaa tat cta gga 1749
Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly
530 535 540 545
tta gat ctt ctt aag gaa gag tta att aaa atg acc gct gaa gcc cgc 1797
Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg
550 555 560
cag att cat cca gaa ggt gtg ttg att gat ggc gaa ttg gta tac cat 1845
Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His
565 570 575
gag caa gtt aaa aag gag cca gaa ggc cta gat ttt ctt ttt gat gct 1893
Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala
580 585 590
tat cct gaa aac agt aaa gct aaa gaa ttc gcc gaa gtt gct gaa tca 1941
Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser
595 600 605
cgt act gct tct aat gga atc gcc aat aaa tct tta aag gga acc att 1989
Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile
610 615 620 625
tct gaa aaa gaa gca caa tgc atg aag ttt cag gtc tgg gat tat gtc 2037
Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val
630 635 640
ccg ttg gta gaa ata tac agt ctt cct gca ttt cgt ttg aaa tat gat 2085
Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp
645 650 655
gta cgt ttt tct aaa cta gaa caa atg aca tct gga tat gat aaa gta 2133
Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val
660 665 670
att tta att gaa aac cag gta gta aat aac cta gat gaa gct aag gta 2181
Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val
675 680 685
att tat aaa aag tat att gac caa ggt ctt gaa ggt att att ctc aaa 2229
Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys
690 695 700 705
aat atc gat gga tta tgg gaa aat gct cgt tca aaa aat ctt tat aaa 2277
Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys
710 715 720
ttt aaa gaa gta att gat gtt gat tta aaa att gta gga att tat cct 2325
Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro
725 730 735
cac cgt aaa gac cct act aaa gcg ggt gga ttt att ctt gag tca gag 2373
His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu
740 745 750
tgt gga aaa att aag gta aat gct ggt tca ggc tta aaa gat aaa gcc 2421
Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala
755 760 765
ggt gta aaa tcg cat gaa ctt gac cgt act cgc att atg gaa aac caa 2469
Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln
770 775 780 785
aat tat tat att gga aaa att cta gag tgc gaa tgc aac ggt tgg tta 2517
Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu
790 795 800
aaa tct gat ggc cgc act gat tac gtt aaa tta ttt ctt ccg att gcg 2565
Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala
805 810 815
att cgt tta cgt gaa gat aaa act aaa gct aat aca ttc gaa gat gta 2613
Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val
820 825 830
ttt ggt gat ttt cat gag gta act ggt cta taa 2646
Phe Gly Asp Phe His Glu Val Thr Gly Leu
835 840
<210> 6
<211> 843
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 6
Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg
1 5 10 15
Ala Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg
20 25 30
Gly Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu
35 40 45
Pro Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys
50 55 60
Ile Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr
65 70 75 80
Asn Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His
85 90 95
Cys Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val
100 105 110
Val Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val
115 120 125
Phe Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr
130 135 140
Asn Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu
145 150 155 160
Gly Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg
165 170 175
Gln Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg
180 185 190
Leu Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg
195 200 205
Arg Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro
210 215 220
Asn Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys
225 230 235 240
Val Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys
245 250 255
Asp Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val
260 265 270
Trp Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe
275 280 285
Ala Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys
290 295 300
Pro Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr
305 310 315 320
Ser Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu
325 330 335
Glu Val Gln Arg Lys Arg Gln Lys Gly Ser Ser Gly Thr Ser Gly Gly
340 345 350
Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile
355 360 365
Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn
370 375 380
Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln
385 390 395 400
Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe
405 410 415
Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu
420 425 430
Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly
435 440 445
Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val
450 455 460
Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys
465 470 475 480
Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser
485 490 495
Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala
500 505 510
Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp
515 520 525
Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu
530 535 540
Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala
545 550 555 560
Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr
565 570 575
His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp
580 585 590
Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu
595 600 605
Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr
610 615 620
Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr
625 630 635 640
Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr
645 650 655
Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys
660 665 670
Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys
675 680 685
Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu
690 695 700
Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr
705 710 715 720
Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr
725 730 735
Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser
740 745 750
Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys
755 760 765
Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn
770 775 780
Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp
785 790 795 800
Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile
805 810 815
Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp
820 825 830
Val Phe Gly Asp Phe His Glu Val Thr Gly Leu
835 840
<210> 7
<211> 2505
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<220>
<221> promoter
<222> (1)..(93)
<223> T5-lac promoter
<220>
<221> CDS
<222> (115)..(165)
<223> 6xHis tag and linker
<220>
<221> CDS
<222> (166)..(1014)
<223> pprA CDS (Deinococcus radiodurans)
<220>
<221> CDS
<222> (1015)..(1044)
<223> Linker
<220>
<221> CDS
<222> (1045)..(2502)
<223> T4 ligase CDS
<400> 7
ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60
attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117
Met
1
aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcc 165
Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala
5 10 15
gcc cgt gcc aag gct aaa gat cag acg gac ggt atc tac gca gcg ttc 213
Ala Arg Ala Lys Ala Lys Asp Gln Thr Asp Gly Ile Tyr Ala Ala Phe
20 25 30
gac acc ctg atg agc acg gcg ggt gtt gac tct cag att gcg gca ctg 261
Asp Thr Leu Met Ser Thr Ala Gly Val Asp Ser Gln Ile Ala Ala Leu
35 40 45
gct gcg agc gaa gcc gac gcc ggc acc ctg gat gcg gcg ttg acg caa 309
Ala Ala Ser Glu Ala Asp Ala Gly Thr Leu Asp Ala Ala Leu Thr Gln
50 55 60 65
tcg ctg caa gag gcg cag ggc cgc tgg ggt ctg ggc ctg cac cac ttg 357
Ser Leu Gln Glu Ala Gln Gly Arg Trp Gly Leu Gly Leu His His Leu
70 75 80
cgc cat gag gcg cgt ttg acc gat gat ggt gac att gag atc ctg acc 405
Arg His Glu Ala Arg Leu Thr Asp Asp Gly Asp Ile Glu Ile Leu Thr
85 90 95
gac ggt cgc cct agc gca cgc gtt agc gag ggt ttt ggt gcc ctg gcg 453
Asp Gly Arg Pro Ser Ala Arg Val Ser Glu Gly Phe Gly Ala Leu Ala
100 105 110
caa gcc tac gca ccg atg caa gcg ctg gat gaa cgt ggc ctg tcc caa 501
Gln Ala Tyr Ala Pro Met Gln Ala Leu Asp Glu Arg Gly Leu Ser Gln
115 120 125
tgg gct gcg ctg ggc gag ggt tat cgc gca ccg ggc gat ctg ccg ctg 549
Trp Ala Ala Leu Gly Glu Gly Tyr Arg Ala Pro Gly Asp Leu Pro Leu
130 135 140 145
gct cag ctg aag gtt ctg atc gaa cat gcc cgc gat ttc gaa act gat 597
Ala Gln Leu Lys Val Leu Ile Glu His Ala Arg Asp Phe Glu Thr Asp
150 155 160
tgg agc gcg ggt cgt ggc gaa acg ttc caa cgc gtc tgg cgt aaa ggt 645
Trp Ser Ala Gly Arg Gly Glu Thr Phe Gln Arg Val Trp Arg Lys Gly
165 170 175
gac acc ctg ttt gtc gag gtg gcg cgt ccg gca tcc gcc gaa gcg gcg 693
Asp Thr Leu Phe Val Glu Val Ala Arg Pro Ala Ser Ala Glu Ala Ala
180 185 190
ctg agc gac gcg gcg tgg gat gtg att gcc agc atc aag gac cgt gcg 741
Leu Ser Asp Ala Ala Trp Asp Val Ile Ala Ser Ile Lys Asp Arg Ala
195 200 205
ttc cag cgt gag ctg atg cgt cgt tct gag aaa gac ggc atg ctg ggt 789
Phe Gln Arg Glu Leu Met Arg Arg Ser Glu Lys Asp Gly Met Leu Gly
210 215 220 225
gcg ctg ttg ggt gct cgc cat gct ggc gcc aag gca aac ttg gca cag 837
Ala Leu Leu Gly Ala Arg His Ala Gly Ala Lys Ala Asn Leu Ala Gln
230 235 240
ctg cca gag gcc cac ttt acc gtg cag gca ttt gtt cag act ctg agc 885
Leu Pro Glu Ala His Phe Thr Val Gln Ala Phe Val Gln Thr Leu Ser
245 250 255
ggt gcg gca gca cgt aat gcg gaa gaa tat cgc gca gcg ctg aaa acg 933
Gly Ala Ala Ala Arg Asn Ala Glu Glu Tyr Arg Ala Ala Leu Lys Thr
260 265 270
gcg gca gcc gct ctg gaa gag tac cag ggc gtg acc acc cgc cag ctg 981
Ala Ala Ala Ala Leu Glu Glu Tyr Gln Gly Val Thr Thr Arg Gln Leu
275 280 285
agc gaa gtc ctg cgt cac ggt ctg cgt gag agc ggc act agt ggc gga 1029
Ser Glu Val Leu Arg His Gly Leu Arg Glu Ser Gly Thr Ser Gly Gly
290 295 300 305
ggc tcc ggc ggt ggc att ctt aaa att ctg aac gaa ata gca tct att 1077
Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile
310 315 320
ggt tca act aaa cag aag caa gca att ctt gaa aag aat aaa gat aat 1125
Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn
325 330 335
gaa ttg ctt aaa cga gta tat cgt ctg act tat tct cgt ggg tta cag 1173
Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln
340 345 350
tat tat atc aag aaa tgg cct aaa cct ggt att gct acc cag agt ttt 1221
Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe
355 360 365
gga atg ttg act ctt acc gat atg ctt gac ttc att gaa ttc aca tta 1269
Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu
370 375 380 385
gct act cgg aaa ttg act gga aat gca gca att gag gaa tta act gga 1317
Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly
390 395 400
tat atc acc gat ggt aaa aaa gat gat gtt gaa gtt ttg cgt cga gtg 1365
Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val
405 410 415
atg atg cga gac ctt gaa tgt ggt gct tca gta tct att gca aac aaa 1413
Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys
420 425 430
gtt tgg cca ggt tta att cct gaa caa cct caa atg ctc gca agt tct 1461
Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser
435 440 445
tat gat gaa aaa ggc att aat aag aat atc aaa ttt cca gcc ttt gct 1509
Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala
450 455 460 465
cag tta aaa gct gat gga gct cgg tgt ttt gct gaa gtt aga ggt gat 1557
Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp
470 475 480
gaa tta gat gat gtt cgt ctt tta tca cga gct ggt aat gaa tat cta 1605
Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu
485 490 495
gga tta gat ctt ctt aag gaa gag tta att aaa atg acc gct gaa gcc 1653
Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala
500 505 510
cgc cag att cat cca gaa ggt gtg ttg att gat ggc gaa ttg gta tac 1701
Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr
515 520 525
cat gag caa gtt aaa aag gag cca gaa ggc cta gat ttt ctt ttt gat 1749
His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp
530 535 540 545
gct tat cct gaa aac agt aaa gct aaa gaa ttc gcc gaa gtt gct gaa 1797
Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu
550 555 560
tca cgt act gct tct aat gga atc gcc aat aaa tct tta aag gga acc 1845
Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr
565 570 575
att tct gaa aaa gaa gca caa tgc atg aag ttt cag gtc tgg gat tat 1893
Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr
580 585 590
gtc ccg ttg gta gaa ata tac agt ctt cct gca ttt cgt ttg aaa tat 1941
Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr
595 600 605
gat gta cgt ttt tct aaa cta gaa caa atg aca tct gga tat gat aaa 1989
Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys
610 615 620 625
gta att tta att gaa aac cag gta gta aat aac cta gat gaa gct aag 2037
Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys
630 635 640
gta att tat aaa aag tat att gac caa ggt ctt gaa ggt att att ctc 2085
Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu
645 650 655
aaa aat atc gat gga tta tgg gaa aat gct cgt tca aaa aat ctt tat 2133
Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr
660 665 670
aaa ttt aaa gaa gta att gat gtt gat tta aaa att gta gga att tat 2181
Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr
675 680 685
cct cac cgt aaa gac cct act aaa gcg ggt gga ttt att ctt gag tca 2229
Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser
690 695 700 705
gag tgt gga aaa att aag gta aat gct ggt tca ggc tta aaa gat aaa 2277
Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys
710 715 720
gcc ggt gta aaa tcg cat gaa ctt gac cgt act cgc att atg gaa aac 2325
Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn
725 730 735
caa aat tat tat att gga aaa att cta gag tgc gaa tgc aac ggt tgg 2373
Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp
740 745 750
tta aaa tct gat ggc cgc act gat tac gtt aaa tta ttt ctt ccg att 2421
Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile
755 760 765
gcg att cgt tta cgt gaa gat aaa act aaa gct aat aca ttc gaa gat 2469
Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp
770 775 780 785
gta ttt ggt gat ttt cat gag gta act ggt cta taa 2505
Val Phe Gly Asp Phe His Glu Val Thr Gly Leu
790 795
<210> 8
<211> 796
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 8
Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg
1 5 10 15
Ala Ala Arg Ala Lys Ala Lys Asp Gln Thr Asp Gly Ile Tyr Ala Ala
20 25 30
Phe Asp Thr Leu Met Ser Thr Ala Gly Val Asp Ser Gln Ile Ala Ala
35 40 45
Leu Ala Ala Ser Glu Ala Asp Ala Gly Thr Leu Asp Ala Ala Leu Thr
50 55 60
Gln Ser Leu Gln Glu Ala Gln Gly Arg Trp Gly Leu Gly Leu His His
65 70 75 80
Leu Arg His Glu Ala Arg Leu Thr Asp Asp Gly Asp Ile Glu Ile Leu
85 90 95
Thr Asp Gly Arg Pro Ser Ala Arg Val Ser Glu Gly Phe Gly Ala Leu
100 105 110
Ala Gln Ala Tyr Ala Pro Met Gln Ala Leu Asp Glu Arg Gly Leu Ser
115 120 125
Gln Trp Ala Ala Leu Gly Glu Gly Tyr Arg Ala Pro Gly Asp Leu Pro
130 135 140
Leu Ala Gln Leu Lys Val Leu Ile Glu His Ala Arg Asp Phe Glu Thr
145 150 155 160
Asp Trp Ser Ala Gly Arg Gly Glu Thr Phe Gln Arg Val Trp Arg Lys
165 170 175
Gly Asp Thr Leu Phe Val Glu Val Ala Arg Pro Ala Ser Ala Glu Ala
180 185 190
Ala Leu Ser Asp Ala Ala Trp Asp Val Ile Ala Ser Ile Lys Asp Arg
195 200 205
Ala Phe Gln Arg Glu Leu Met Arg Arg Ser Glu Lys Asp Gly Met Leu
210 215 220
Gly Ala Leu Leu Gly Ala Arg His Ala Gly Ala Lys Ala Asn Leu Ala
225 230 235 240
Gln Leu Pro Glu Ala His Phe Thr Val Gln Ala Phe Val Gln Thr Leu
245 250 255
Ser Gly Ala Ala Ala Arg Asn Ala Glu Glu Tyr Arg Ala Ala Leu Lys
260 265 270
Thr Ala Ala Ala Ala Leu Glu Glu Tyr Gln Gly Val Thr Thr Arg Gln
275 280 285
Leu Ser Glu Val Leu Arg His Gly Leu Arg Glu Ser Gly Thr Ser Gly
290 295 300
Gly Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser
305 310 315 320
Ile Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp
325 330 335
Asn Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu
340 345 350
Gln Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser
355 360 365
Phe Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr
370 375 380
Leu Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr
385 390 395 400
Gly Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg
405 410 415
Val Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn
420 425 430
Lys Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser
435 440 445
Ser Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe
450 455 460
Ala Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly
465 470 475 480
Asp Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr
485 490 495
Leu Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu
500 505 510
Ala Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val
515 520 525
Tyr His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe
530 535 540
Asp Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala
545 550 555 560
Glu Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly
565 570 575
Thr Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp
580 585 590
Tyr Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys
595 600 605
Tyr Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp
610 615 620
Lys Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala
625 630 635 640
Lys Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile
645 650 655
Leu Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu
660 665 670
Tyr Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile
675 680 685
Tyr Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu
690 695 700
Ser Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp
705 710 715 720
Lys Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu
725 730 735
Asn Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly
740 745 750
Trp Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro
755 760 765
Ile Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu
770 775 780
Asp Val Phe Gly Asp Phe His Glu Val Thr Gly Leu
785 790 795
<210> 9
<211> 1842
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<220>
<221> promoter
<222> (1)..(93)
<223> T5-lac promoter
<220>
<221> CDS
<222> (115)..(165)
<223> 6xHis tag and linker
<220>
<221> CDS
<222> (166)..(351)
<223> sso7d CDS (Sulfolobus solfataricus)
<220>
<221> CDS
<222> (352)..(381)
<223> Linker
<220>
<221> CDS
<222> (382)..(1839)
<223> T4 ligase CDS
<400> 9
ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60
attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117
Met
1
aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcg 165
Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala
5 10 15
act gtt aaa ttc aaa tac aaa ggt gag gag aaa gaa gtt gac att tcc 213
Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Ile Ser
20 25 30
aag atc aaa aag gta tgg cgc gtg ggc aaa atg atc tct ttc act tac 261
Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe Thr Tyr
35 40 45
gac gaa ggc ggc ggt aaa acc ggt cgt ggc gcg gtg agc gaa aag gac 309
Asp Glu Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys Asp
50 55 60 65
gcg cca aaa gaa ctg ctg cag atg ctg gaa aaa cag aag aaa ggc act 357
Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys Gly Thr
70 75 80
agt ggc gga ggc tcc ggc ggt ggc att ctt aaa att ctg aac gaa ata 405
Ser Gly Gly Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu Ile
85 90 95
gca tct att ggt tca act aaa cag aag caa gca att ctt gaa aag aat 453
Ala Ser Ile Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn
100 105 110
aaa gat aat gaa ttg ctt aaa cga gta tat cgt ctg act tat tct cgt 501
Lys Asp Asn Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg
115 120 125
ggg tta cag tat tat atc aag aaa tgg cct aaa cct ggt att gct acc 549
Gly Leu Gln Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr
130 135 140 145
cag agt ttt gga atg ttg act ctt acc gat atg ctt gac ttc att gaa 597
Gln Ser Phe Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile Glu
150 155 160
ttc aca tta gct act cgg aaa ttg act gga aat gca gca att gag gaa 645
Phe Thr Leu Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu
165 170 175
tta act gga tat atc acc gat ggt aaa aaa gat gat gtt gaa gtt ttg 693
Leu Thr Gly Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val Leu
180 185 190
cgt cga gtg atg atg cga gac ctt gaa tgt ggt gct tca gta tct att 741
Arg Arg Val Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser Ile
195 200 205
gca aac aaa gtt tgg cca ggt tta att cct gaa caa cct caa atg ctc 789
Ala Asn Lys Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met Leu
210 215 220 225
gca agt tct tat gat gaa aaa ggc att aat aag aat atc aaa ttt cca 837
Ala Ser Ser Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro
230 235 240
gcc ttt gct cag tta aaa gct gat gga gct cgg tgt ttt gct gaa gtt 885
Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu Val
245 250 255
aga ggt gat gaa tta gat gat gtt cgt ctt tta tca cga gct ggt aat 933
Arg Gly Asp Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly Asn
260 265 270
gaa tat cta gga tta gat ctt ctt aag gaa gag tta att aaa atg acc 981
Glu Tyr Leu Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met Thr
275 280 285
gct gaa gcc cgc cag att cat cca gaa ggt gtg ttg att gat ggc gaa 1029
Ala Glu Ala Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly Glu
290 295 300 305
ttg gta tac cat gag caa gtt aaa aag gag cca gaa ggc cta gat ttt 1077
Leu Val Tyr His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp Phe
310 315 320
ctt ttt gat gct tat cct gaa aac agt aaa gct aaa gaa ttc gcc gaa 1125
Leu Phe Asp Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu
325 330 335
gtt gct gaa tca cgt act gct tct aat gga atc gcc aat aaa tct tta 1173
Val Ala Glu Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu
340 345 350
aag gga acc att tct gaa aaa gaa gca caa tgc atg aag ttt cag gtc 1221
Lys Gly Thr Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln Val
355 360 365
tgg gat tat gtc ccg ttg gta gaa ata tac agt ctt cct gca ttt cgt 1269
Trp Asp Tyr Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg
370 375 380 385
ttg aaa tat gat gta cgt ttt tct aaa cta gaa caa atg aca tct gga 1317
Leu Lys Tyr Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser Gly
390 395 400
tat gat aaa gta att tta att gaa aac cag gta gta aat aac cta gat 1365
Tyr Asp Lys Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu Asp
405 410 415
gaa gct aag gta att tat aaa aag tat att gac caa ggt ctt gaa ggt 1413
Glu Ala Lys Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly
420 425 430
att att ctc aaa aat atc gat gga tta tgg gaa aat gct cgt tca aaa 1461
Ile Ile Leu Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys
435 440 445
aat ctt tat aaa ttt aaa gaa gta att gat gtt gat tta aaa att gta 1509
Asn Leu Tyr Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile Val
450 455 460 465
gga att tat cct cac cgt aaa gac cct act aaa gcg ggt gga ttt att 1557
Gly Ile Tyr Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile
470 475 480
ctt gag tca gag tgt gga aaa att aag gta aat gct ggt tca ggc tta 1605
Leu Glu Ser Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly Leu
485 490 495
aaa gat aaa gcc ggt gta aaa tcg cat gaa ctt gac cgt act cgc att 1653
Lys Asp Lys Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg Ile
500 505 510
atg gaa aac caa aat tat tat att gga aaa att cta gag tgc gaa tgc 1701
Met Glu Asn Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys
515 520 525
aac ggt tgg tta aaa tct gat ggc cgc act gat tac gtt aaa tta ttt 1749
Asn Gly Trp Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe
530 535 540 545
ctt ccg att gcg att cgt tta cgt gaa gat aaa act aaa gct aat aca 1797
Leu Pro Ile Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr
550 555 560
ttc gaa gat gta ttt ggt gat ttt cat gag gta act ggt cta taa 1842
Phe Glu Asp Val Phe Gly Asp Phe His Glu Val Thr Gly Leu
565 570 575
<210> 10
<211> 575
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 10
Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg
1 5 10 15
Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Ile
20 25 30
Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe Thr
35 40 45
Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys
50 55 60
Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys Gly
65 70 75 80
Thr Ser Gly Gly Gly Ser Gly Gly Gly Ile Leu Lys Ile Leu Asn Glu
85 90 95
Ile Ala Ser Ile Gly Ser Thr Lys Gln Lys Gln Ala Ile Leu Glu Lys
100 105 110
Asn Lys Asp Asn Glu Leu Leu Lys Arg Val Tyr Arg Leu Thr Tyr Ser
115 120 125
Arg Gly Leu Gln Tyr Tyr Ile Lys Lys Trp Pro Lys Pro Gly Ile Ala
130 135 140
Thr Gln Ser Phe Gly Met Leu Thr Leu Thr Asp Met Leu Asp Phe Ile
145 150 155 160
Glu Phe Thr Leu Ala Thr Arg Lys Leu Thr Gly Asn Ala Ala Ile Glu
165 170 175
Glu Leu Thr Gly Tyr Ile Thr Asp Gly Lys Lys Asp Asp Val Glu Val
180 185 190
Leu Arg Arg Val Met Met Arg Asp Leu Glu Cys Gly Ala Ser Val Ser
195 200 205
Ile Ala Asn Lys Val Trp Pro Gly Leu Ile Pro Glu Gln Pro Gln Met
210 215 220
Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Asn Lys Asn Ile Lys Phe
225 230 235 240
Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala Arg Cys Phe Ala Glu
245 250 255
Val Arg Gly Asp Glu Leu Asp Asp Val Arg Leu Leu Ser Arg Ala Gly
260 265 270
Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Glu Glu Leu Ile Lys Met
275 280 285
Thr Ala Glu Ala Arg Gln Ile His Pro Glu Gly Val Leu Ile Asp Gly
290 295 300
Glu Leu Val Tyr His Glu Gln Val Lys Lys Glu Pro Glu Gly Leu Asp
305 310 315 320
Phe Leu Phe Asp Ala Tyr Pro Glu Asn Ser Lys Ala Lys Glu Phe Ala
325 330 335
Glu Val Ala Glu Ser Arg Thr Ala Ser Asn Gly Ile Ala Asn Lys Ser
340 345 350
Leu Lys Gly Thr Ile Ser Glu Lys Glu Ala Gln Cys Met Lys Phe Gln
355 360 365
Val Trp Asp Tyr Val Pro Leu Val Glu Ile Tyr Ser Leu Pro Ala Phe
370 375 380
Arg Leu Lys Tyr Asp Val Arg Phe Ser Lys Leu Glu Gln Met Thr Ser
385 390 395 400
Gly Tyr Asp Lys Val Ile Leu Ile Glu Asn Gln Val Val Asn Asn Leu
405 410 415
Asp Glu Ala Lys Val Ile Tyr Lys Lys Tyr Ile Asp Gln Gly Leu Glu
420 425 430
Gly Ile Ile Leu Lys Asn Ile Asp Gly Leu Trp Glu Asn Ala Arg Ser
435 440 445
Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Asp Val Asp Leu Lys Ile
450 455 460
Val Gly Ile Tyr Pro His Arg Lys Asp Pro Thr Lys Ala Gly Gly Phe
465 470 475 480
Ile Leu Glu Ser Glu Cys Gly Lys Ile Lys Val Asn Ala Gly Ser Gly
485 490 495
Leu Lys Asp Lys Ala Gly Val Lys Ser His Glu Leu Asp Arg Thr Arg
500 505 510
Ile Met Glu Asn Gln Asn Tyr Tyr Ile Gly Lys Ile Leu Glu Cys Glu
515 520 525
Cys Asn Gly Trp Leu Lys Ser Asp Gly Arg Thr Asp Tyr Val Lys Leu
530 535 540
Phe Leu Pro Ile Ala Ile Arg Leu Arg Glu Asp Lys Thr Lys Ala Asn
545 550 555 560
Thr Phe Glu Asp Val Phe Gly Asp Phe His Glu Val Thr Gly Leu
565 570 575
<210> 11
<211> 57
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 11
gcactagtgg cggaggctcc ggcggtggcg cagatggccc ataccttcaa atattag 57
<210> 12
<211> 47
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 12
atgcggccgc ataggcctta gctccccttc tgacgtttcc tctgcac 47
<210> 13
<211> 44
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 13
gatccggccc tgagggccat tcttaaaatt ctgaacgaaa tagc 44
<210> 14
<211> 50
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 14
ccgccggagc ctccgccact agtgcctaga ccagttacct catgaaaatc 50
<210> 15
<211> 2643
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<220>
<221> promoter
<222> (1)..(93)
<223> T5-lac promoter
<220>
<221> CDS
<222> (115)..(165)
<223> 6xHis tag and linker
<220>
<221> CDS
<222> (166)..(1623)
<223> T4 ligase CDS
<220>
<221> CDS
<222> (1624)..(1653)
<223> Linker
<220>
<221> CDS
<222> (1654)..(2640)
<223> Human p50 CDS
<400> 15
ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60
attgtgagcg gataacaatt tcacacagaa ttcattaaag aggagaaatt aact atg 117
Met
1
aga gga tct cac cat cac cat cac cat acg gat ccg gcc ctg agg gcc 165
Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg Ala
5 10 15
att ctt aaa att ctg aac gaa ata gca tct att ggt tca act aaa cag 213
Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys Gln
20 25 30
aag caa gca att ctt gaa aag aat aaa gat aat gaa ttg ctt aaa cga 261
Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys Arg
35 40 45
gta tat cgt ctg act tat tct cgt ggg tta cag tat tat atc aag aaa 309
Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys Lys
50 55 60 65
tgg cct aaa cct ggt att gct acc cag agt ttt gga atg ttg act ctt 357
Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr Leu
70 75 80
acc gat atg ctt gac ttc att gaa ttc aca tta gct act cgg aaa ttg 405
Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys Leu
85 90 95
act gga aat gca gca att gag gaa tta act gga tat atc acc gat ggt 453
Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp Gly
100 105 110
aaa aaa gat gat gtt gaa gtt ttg cgt cga gtg atg atg cga gac ctt 501
Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp Leu
115 120 125
gaa tgt ggt gct tca gta tct att gca aac aaa gtt tgg cca ggt tta 549
Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly Leu
130 135 140 145
att cct gaa caa cct caa atg ctc gca agt tct tat gat gaa aaa ggc 597
Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly
150 155 160
att aat aag aat atc aaa ttt cca gcc ttt gct cag tta aaa gct gat 645
Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp
165 170 175
gga gct cgg tgt ttt gct gaa gtt aga ggt gat gaa tta gat gat gtt 693
Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val
180 185 190
cgt ctt tta tca cga gct ggt aat gaa tat cta gga tta gat ctt ctt 741
Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu
195 200 205
aag gaa gag tta att aaa atg acc gct gaa gcc cgc cag att cat cca 789
Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His Pro
210 215 220 225
gaa ggt gtg ttg att gat ggc gaa ttg gta tac cat gag caa gtt aaa 837
Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val Lys
230 235 240
aag gag cca gaa ggc cta gat ttt ctt ttt gat gct tat cct gaa aac 885
Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu Asn
245 250 255
agt aaa gct aaa gaa ttc gcc gaa gtt gct gaa tca cgt act gct tct 933
Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala Ser
260 265 270
aat gga atc gcc aat aaa tct tta aag gga acc att tct gaa aaa gaa 981
Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys Glu
275 280 285
gca caa tgc atg aag ttt cag gtc tgg gat tat gtc ccg ttg gta gaa 1029
Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val Glu
290 295 300 305
ata tac agt ctt cct gca ttt cgt ttg aaa tat gat gta cgt ttt tct 1077
Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe Ser
310 315 320
aaa cta gaa caa atg aca tct gga tat gat aaa gta att tta att gaa 1125
Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile Glu
325 330 335
aac cag gta gta aat aac cta gat gaa gct aag gta att tat aaa aag 1173
Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys Lys
340 345 350
tat att gac caa ggt ctt gaa ggt att att ctc aaa aat atc gat gga 1221
Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp Gly
355 360 365
tta tgg gaa aat gct cgt tca aaa aat ctt tat aaa ttt aaa gaa gta 1269
Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val
370 375 380 385
att gat gtt gat tta aaa att gta gga att tat cct cac cgt aaa gac 1317
Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys Asp
390 395 400
cct act aaa gcg ggt gga ttt att ctt gag tca gag tgt gga aaa att 1365
Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys Ile
405 410 415
aag gta aat gct ggt tca ggc tta aaa gat aaa gcc ggt gta aaa tcg 1413
Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys Ser
420 425 430
cat gaa ctt gac cgt act cgc att atg gaa aac caa aat tat tat att 1461
His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr Ile
435 440 445
gga aaa att cta gag tgc gaa tgc aac ggt tgg tta aaa tct gat ggc 1509
Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp Gly
450 455 460 465
cgc act gat tac gtt aaa tta ttt ctt ccg att gcg att cgt tta cgt 1557
Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu Arg
470 475 480
gaa gat aaa act aaa gct aat aca ttc gaa gat gta ttt ggt gat ttt 1605
Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp Phe
485 490 495
cat gag gta act ggt cta ggc act agt ggc gga ggc tcc ggc ggt ggc 1653
His Glu Val Thr Gly Leu Gly Thr Ser Gly Gly Gly Ser Gly Gly Gly
500 505 510
gca gat ggc cca tac ctt caa ata tta gag caa cct aaa cag aga gga 1701
Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg Gly
515 520 525
ttt cgt ttc cgt tat gta tgt gaa ggc cca tcc cat ggt gga tta cct 1749
Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu Pro
530 535 540 545
ggt gcc tct agt gaa aag aac aag aag tct tac cct cag gtc aaa atc 1797
Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys Ile
550 555 560
tgc aac tat gtg gga cca gca aag gtt att gtt cag ttg gtc aca aat 1845
Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr Asn
565 570 575
gga aaa aat atc cac ctg cat gcc cac agc ctg gtg gga aaa cac tgt 1893
Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His Cys
580 585 590
gag gat ggg atc tgc act gta act gct gga ccc aag gac atg gtg gtc 1941
Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val Val
595 600 605
ggc ttc gca aac ctg ggt ata ctt cat gtg aca aag aaa aaa gta ttt 1989
Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val Phe
610 615 620 625
gaa aca ctg gaa gca cga atg aca gag gcg tgt ata agg ggc tat aat 2037
Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr Asn
630 635 640
cct gga ctc ttg gtg cac cct gac ctt gcc tat ttg caa gca gaa ggt 2085
Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu Gly
645 650 655
gga ggg gac cgg cag ctg gga gat cgg gaa aaa gag cta atc cgc caa 2133
Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg Gln
660 665 670
gca gct ctg cag cag acc aag gag atg gac ctc agc gtg gtg cgg ctc 2181
Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg Leu
675 680 685
atg ttt aca gct ttt ctt ccg gat agc act ggc agc ttc aca agg cgc 2229
Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg Arg
690 695 700 705
ctg gaa ccc gtg gta tca gac gcc atc tat gac agt aaa gcc ccc aat 2277
Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro Asn
710 715 720
gca tcc aac ttg aaa att gta aga atg gac agg aca gct gga tgt gtg 2325
Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys Val
725 730 735
act gga ggg gag gaa att tat ctt ctt tgt gac aaa gtt cag aaa gat 2373
Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys Asp
740 745 750
gac atc cag att cga ttt tat gaa gag gaa gaa aat ggt gga gtc tgg 2421
Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val Trp
755 760 765
gaa gga ttt gga gat ttt tcc ccc aca gat gtt cat aga caa ttt gcc 2469
Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe Ala
770 775 780 785
att gtc ttc aaa act cca aag tat aaa gat att aat att aca aaa cca 2517
Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys Pro
790 795 800
gcc tct gtg ttt gtc cag ctt cgg agg aaa tct gac ttg gaa acc agt 2565
Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr Ser
805 810 815
gaa cca aaa cct ttc ctc tac tat cct gaa atc aaa gat aaa gaa gaa 2613
Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu Glu
820 825 830
gtg cag agg aaa cgt cag aag ggg agc taa 2643
Val Gln Arg Lys Arg Gln Lys Gly Ser
835 840
<210> 16
<211> 842
<212> PRT
<213> Artificial
<220>
<223> Synthetic Construct
<400> 16
Met Arg Gly Ser His His His His His His Thr Asp Pro Ala Leu Arg
1 5 10 15
Ala Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
20 25 30
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
35 40 45
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
50 55 60
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
65 70 75 80
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
85 90 95
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
100 105 110
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
115 120 125
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
130 135 140
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
145 150 155 160
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
165 170 175
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
180 185 190
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
195 200 205
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
210 215 220
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
225 230 235 240
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
245 250 255
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
260 265 270
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
275 280 285
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
290 295 300
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
305 310 315 320
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
325 330 335
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
340 345 350
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
355 360 365
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
370 375 380
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
385 390 395 400
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
405 410 415
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
420 425 430
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
435 440 445
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
450 455 460
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
465 470 475 480
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
485 490 495
Phe His Glu Val Thr Gly Leu Gly Thr Ser Gly Gly Gly Ser Gly Gly
500 505 510
Gly Ala Asp Gly Pro Tyr Leu Gln Ile Leu Glu Gln Pro Lys Gln Arg
515 520 525
Gly Phe Arg Phe Arg Tyr Val Cys Glu Gly Pro Ser His Gly Gly Leu
530 535 540
Pro Gly Ala Ser Ser Glu Lys Asn Lys Lys Ser Tyr Pro Gln Val Lys
545 550 555 560
Ile Cys Asn Tyr Val Gly Pro Ala Lys Val Ile Val Gln Leu Val Thr
565 570 575
Asn Gly Lys Asn Ile His Leu His Ala His Ser Leu Val Gly Lys His
580 585 590
Cys Glu Asp Gly Ile Cys Thr Val Thr Ala Gly Pro Lys Asp Met Val
595 600 605
Val Gly Phe Ala Asn Leu Gly Ile Leu His Val Thr Lys Lys Lys Val
610 615 620
Phe Glu Thr Leu Glu Ala Arg Met Thr Glu Ala Cys Ile Arg Gly Tyr
625 630 635 640
Asn Pro Gly Leu Leu Val His Pro Asp Leu Ala Tyr Leu Gln Ala Glu
645 650 655
Gly Gly Gly Asp Arg Gln Leu Gly Asp Arg Glu Lys Glu Leu Ile Arg
660 665 670
Gln Ala Ala Leu Gln Gln Thr Lys Glu Met Asp Leu Ser Val Val Arg
675 680 685
Leu Met Phe Thr Ala Phe Leu Pro Asp Ser Thr Gly Ser Phe Thr Arg
690 695 700
Arg Leu Glu Pro Val Val Ser Asp Ala Ile Tyr Asp Ser Lys Ala Pro
705 710 715 720
Asn Ala Ser Asn Leu Lys Ile Val Arg Met Asp Arg Thr Ala Gly Cys
725 730 735
Val Thr Gly Gly Glu Glu Ile Tyr Leu Leu Cys Asp Lys Val Gln Lys
740 745 750
Asp Asp Ile Gln Ile Arg Phe Tyr Glu Glu Glu Glu Asn Gly Gly Val
755 760 765
Trp Glu Gly Phe Gly Asp Phe Ser Pro Thr Asp Val His Arg Gln Phe
770 775 780
Ala Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Ile Asn Ile Thr Lys
785 790 795 800
Pro Ala Ser Val Phe Val Gln Leu Arg Arg Lys Ser Asp Leu Glu Thr
805 810 815
Ser Glu Pro Lys Pro Phe Leu Tyr Tyr Pro Glu Ile Lys Asp Lys Glu
820 825 830
Glu Val Gln Arg Lys Arg Gln Lys Gly Ser
835 840
<210> 17
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 17
ggcttcgcga cctaccgtaa cactgac 27
<210> 18
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 18
gccgacgccg tcgccgtttt gac 23
<210> 19
<211> 32
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 19
gataacaatt tcacacagaa ttcattaaag ag 32
<210> 20
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 20
cccattaaca tcaccatcta attcaac 27
Claims (50)
- 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 선별, 정제, 또는 재조합된 융합 폴리펩티드.
- 제1항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드 중에서 적어도 하나는 DNA-리가아제 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
- 제1항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드 중에서 적어도 하나는 RNA-리가아제 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 DNA-결합 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 RNA-결합 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
- 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 DNA 리가아제 폴리펩티드는 원핵 생물의 DNA리가아제, 원핵 생물의 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
- 제6항에 있어서, 상기 DNA 리가아제 폴리펩티드는 박테리아 DNA 리가아제, 박테리아 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
- 제7항에 있어서, 상기 DNA 리가아제 폴리펩티드는 대장균 DNA 리가아제 폴리펩티드 또는 기능이 있는 변형물 또는 이들의 기능이 있는 단편이거나 또는 포함하는 것을 특징으로 하는 융합 폴리펩티드.
- 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 DNA 리가아제 폴리펩티드는 박테리오파지 DNA 리가아제, 변형물, 또는 이들의 기능이 있는 단편을 포함하는 바이러스 DNA 리가아제, 바이러스 DNA 리가아제 변형물, 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
- 제9항에 있어서, 상기 DNA 리가아제 폴리펩티드는 T4 DNA 리가아제, 또는 기능이 있는 변형물 또는 기능이 있는 이들의 단편인 것을 특징으로 하는 융합 폴리펩티드.
- 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 DNA 리가아제 폴리펩티드는 진핵 생물의 DNA 리가아제, 기능이 있는 이들의 변형물, 또는 기능이 있는 이들의 단편인 것을 특징으로 하는 융합 폴리펩티드.
- 제11항에 있어서, 상기 DNA 리가아제 폴리펩티드는 곰팡이의 DNA 리가아제, 포유류의 DNA 리가아제, 또는 기능이 있는 변형물 또는 이들의 기능이 있는 단편인 것을 특징으로 하는 융합 폴리펩티드.
- 제1항 내지 12항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 서열 비-특이적 DNA-결합 폴리펩티드인 것을 특징으로 하는 융합 펩티드.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드 중에서 적어도 하나는 서열 특이적 DNA-결합 폴리펩티드인 것을 특징으로 하는 융합 폴리펩티드.
- 제4항 내지 제14항 중 어느 한 항에 있어서, 상기 DNA-결합 폴리펩티드는 염색체 단백질, 히스톤, HMf-유사 단백질, 및 고세균(archael)의 작고 기본적인 DNA-결합 단백질을 포함하는 군으로부터 선택되는 것을 특징으로 하는 융합 폴리펩티드.
- 제4항 내지 제15항 중 어느 한 항에 있어서, 상기 DNA-결합 폴리펩티드는,
디이노코쿠스 라디오두란스(Deinococcus radiodurans) (GenBank 접근 번호 BAA21374) 유래의 PprA 단백질;
호모 사피엔스 유래의 NF-kappaB 단백질, 또한 NF-kappaB p50 단백질 또는 인간 NF-kappaB 단백질의 아미노산 40-366을 포함하는 단편과 같은 하나 또는 하나 이상의 그들의 단편을 포함하는 포유류 NF-kappaB 단백질;
결핵균(Mycobacterium tuberculosi) (GenBank 접근 번호 NP_215452) 유래의 Ku 단백질;
술포로버스 솔파타리쿠스(Sulfolobus solfataricus) (GenBank 접근 번호 NP_343889) 유래의 Sso7d 단백질;
술포로버스 애시도칼다리우스(Sulfolobus acidocaldarius) (GenBank 접근 번호 P13123) 유래의 Sac7d 단백질;
데이노코쿠스 라디오두란스(Deinococcus radiodurans)의 DdrA 단백질;
유전자 이식 생쥐(Mus musculus) 유래의 NFATcI 단백질, 또는 유전자 이식 생쥐 유래의 NFATcI 단백질의 아미노산 403-703을 포함하는 하나 또는 하나 이상의 기능이 있는 이들의 단편, 또는 하나 또는 하나 이상의 기능이 있는 이들의 변형물과 같은 포유류 NFATc 단백질; 및
상기 물질들의 하나 또는 하나 이상의 상동체(homologues), 상기 물질들의 하나 또는 하나 이상의 기능이 있는 변형물 또는 기능이 있는 단편, 및 상기 물질들의 두 개 이상의 조합물;
을 포함하는 군으로부터 선택되는 것을 특징으로 하는 융합 폴리펩티드.
- 제16항에 있어서, 상기 DNA-결합 폴리펩티드는 NFAT-Ala-p50 혼성 DNA-결합 단백질(cTF)인 것을 특징으로 하는 융합 폴리펩티드.
- 제16항 또는 제17항에 있어서, 상기 DNA 리가아제는 T4 DNA 리가아제인 것을 특징으로 하는 융합 폴리펩티드.
- 제16항 또는 제18항에 있어서, 상기 DNA-결합 폴리펩티드는 PprA, Sso7d, 및 p50으로부터 선택되는 것을 특징으로 하는 융합 폴리펩티드.
- 제19항에 있어서, 상기 T4 DNA 리가아제 및 p50을 포함하는 것을 특징으로 하는 융합 폴리펩티드.
- 제1항에 있어서, 서열 번호 6, 8, 10, 또는 16 중 어느 하나에서 10개 이상의 인접한 아미노산을 포함하는 것을 특징으로 하는 융합 폴리펩티드.
- 제21항에 있어서, 상기 융합 폴리펩티드는,
서열번호 6의 아미노산 8 내지 344;
서열번호 8의 아미노산 18 내지 300;
서열번호 16의 아미노산 514 내지 842;
를 포함하는 군으로부터 선택된 서열 유래의 적어도 10개의 인접한 아미노산; 및
서열번호 6의 아미노산 358 내지 843;
서열번호 8의 아미노산 311 내지 796;
서열번호 10의 아미노산 90 내지 575; 및
서열번호 16의 아미노산 18 내지 503;
을 포함하는 군으로부터 선택된 서열 유래의 적어도 10개의 인접한 아미노산;
을 포함하는 것을 특징으로 하는 융합 폴리펩티드.
- 제1항에 있어서, 본 발명의 실시예에서 참조로 설명된 것을 특징으로 하는 융합 폴리펩티드.
- 제1항 내지 23항 중 어느 한 항에 따른 융합 폴리펩티드를 인코딩한 선별, 정제 또는 재조합된 것을 특징으로 하는 폴리뉴클레오티드.
- 서열번호 5, 7, 9, 및 15 중 어느 하나에서 하나 이상의 인접한 뉴클레오티드를 포함하는 선별, 정제 또는 재조합된 것을 특징으로 하는 폴리뉴클레오티드.
- 제25항에 있어서, 상기 폴리뉴클레오티드는,
서열번호 5의 뉴클레오티드 166 내지 1146;
서열번호 5의 뉴클레오티드 166 내지 1185;
서열번호 7의 뉴클레오티드 166 내지 1014;
서열번호 7의 뉴클레오티드 166 내지 1044;
서열번호 9의 뉴클레오티드 166 내지 351;
서열번호 9의 뉴클레오티드 166 내지 381;
서열번호 15의 뉴클레오티드 1624 내지 2640; 및
서열번호 15의 뉴클레오티드 1654 내지 2640;
를 포함하는 군으로부터 선택된 서열 유래의 적어도 10개 이상의 인접한 뉴클레오티드; 및
서열번호 5의 뉴클레오티드 1147 내지 2643;
서열번호 5의 뉴클레오티드 1186 내지 2643;
서열번호 7의 뉴클레오티드 1015 내지 2502;
서열번호 7의 뉴클레오티드 1045 내지 2502;
서열번호 9의 뉴클레오티드 352 내지 1839;
서열번호 9의 뉴클레오티드 382 내지 1839;
서열번호 15의 뉴클레오티드 166 내지 1623; 및
서열번호 15의 뉴클레오티드 166 내지 1653;
를 포함하는 군으로부터 선택된 하나의 서열로부터 적어도 10개 이상의 인접한 뉴클레오티드를 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩하는 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 하는 발현 구조물.
- 제27항에 있어서, DNA-리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 하는 발현 구조물.
- 제27항 또는 제28항에 있어서, DNA-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 것을 특징으로 하는 발현 구조물.
- 제28항 또는 제29항에 있어서, 상기 구조물은 하나의 DNA 리가아제 폴리펩티드 및 하나의 DNA-결합 폴리펩티드를 포함하는 하나의 융합 폴리펩티드를 인코딩하는 것을 특징으로 하는 발현 구조물.
- 제29항 또는 제30항에 있어서, 상기 DNA 리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열 및 상기 DNA-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열은 하나의 전사 해석틀(open reading frame)로 존재하는 것을 특징으로 하는 발현 구조물.
- 제27항 내지 제31항 중 어느 한 항에 있어서, 상기 발현 구조물은 청구항 6 내지 23항 중 어느 한 항에 따른 융합 폴리펩티드를 인코드하는 것을 특징으로 하는 발현 구조물.
- 제27항 내지 제32항 중 어느 한 항에 있어서, 상기 발현 구조물은 서열번호 5, 7, 9, 또는 15 중 어느 하나에서 10개 이상의 인접한 뉴클레오티드를 포함하는 것을 특징으로 하는 발현 구조물.
- 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물을 포함하는 것을 특징으로 하는 벡터.
- 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물 또는 제34항에 따른 벡터를 포함하는 것을 특징으로 하는 숙주 세포.
- 제1항 내지 제23항 중 어느 한 항에 따른 융합 단백질, 제24항 내지 제26항 중 어느 한 항에 따른 폴리뉴클레오티드, 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물, 제34항에 따른 벡터, 또는 제35항에 따른 숙주세포를 포함하는 것을 특징으로 하는 조성물.
- 폴리뉴클레오티드-리가아제 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열 및 폴리뉴클레오티드-결합 폴리펩티드를 인코딩한 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 발현 구조물을 포함하는 숙주 세포를 제공하는 단계;
발현 구조물의 발현 및 융합 폴리펩티드의 형성에 적절한 상태에서 숙주 세포를 유지하는 단계; 및
상기 숙주 세포로부터 융합 폴리펩티드를 분리하는 단계;
를 포함하는 것을 특징으로 하는 융합 폴리펩티드의 생산 방법.
- 제37항에 있어서, 상기 발현 구조물은 제27항 내지 제33항 중 어느 한 항에 따른 발현 구조물인 것을 특징으로 하는 융합 폴리펩티드의 생산 방법.
- 하나 또는 하나 이상의 융합 폴리펩티드와 하나 또는 하나 이상의 핵산분자를 접촉하는 단계를 포함하는 하나 이상의 핵산 분자의 연결 방법으로,
상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드와 융합된 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
- 제39항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
- 제39항 또는 제40항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
- 제39항 내지 제41항 중 어느 한 항에 있어서, 상기 하나 또는 하나 이상의 핵산 분자는 DNA 분자인 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
- 제39항 내지 제41항 중 어느 한 항에 있어서, 상기 하나 또는 하나 이상의 핵산 분자는 적어도 두 개의 DNA 분자인 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
- 제39항 내지 제43항 중 어느 한 항에 있어서, 상기 하나 또는 하나 이상의 핵산 분자는 RNA 분자인 것을 특징으로 하는 하나 이상의 핵산 분자의 연결 방법.
- 하나 이상의 핵산을 하나의 융합 폴리펩티드에 접촉시키는 단계를 포함하는 인산디에스테르 결합 형성의 촉매방법으로,
상기 하나 이상의 융합 폴리펩티드는 적어도 하나의 폴리뉴클레오티드-결합 폴리펩티드에 융합된 적어도 하나의 폴리뉴클레오티드-리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
- 제45항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 DNA-결합 폴리펩티드에 융합된 적어도 하나의 DNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
- 제45항에 있어서, 상기 융합 폴리펩티드는 적어도 하나의 RNA-결합 폴리펩티드에 융합된 적어도 하나의 RNA 리가아제 폴리펩티드를 포함하는 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
- 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 인산디에스테르 결합은 분자내(intermolecular)의 결합인 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
- 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 인산디에스테르 결합은 분자간(intermolucular)의 결합인 것을 특징으로 하는 인산디에스테르 결합 형성의 촉매방법.
- 제1항 내지 제23항의 어느 한 항에 따른 하나 이상의 융합 폴리펩티드, 제24항 내지 제26항의 어느 한 항에 따른 폴리뉴클레오티드, 제27항 내지 제33항의 어느 한 항에 따른 발현 구조물, 제35에 따른 숙주세포, 또는 제36항에 따른 조성물을 포함하고,
선택적으로 하나 이상의 버퍼, 보조인자, 양성 인자, 음성 인자, 기질, 또는 본 발명의 융합 폴리펩티드의 활성에 요구되는 다른 시약을 포함하는 것을 특징으로 하는 키트.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US24286509P | 2009-09-16 | 2009-09-16 | |
US61/242,865 | 2009-09-16 | ||
US32960410P | 2010-04-30 | 2010-04-30 | |
US61/329,604 | 2010-04-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20120093882A true KR20120093882A (ko) | 2012-08-23 |
Family
ID=43758865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127009669A KR20120093882A (ko) | 2009-09-16 | 2010-09-16 | 융합 폴리펩티드 및 이들의 용도 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20120214208A1 (ko) |
EP (1) | EP2478014A4 (ko) |
JP (1) | JP2013505016A (ko) |
KR (1) | KR20120093882A (ko) |
CN (1) | CN102597006A (ko) |
AU (1) | AU2010296086A1 (ko) |
CA (1) | CA2774333A1 (ko) |
SG (1) | SG179200A1 (ko) |
WO (1) | WO2011034449A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101468585B1 (ko) * | 2012-12-13 | 2014-12-03 | 한국 한의학 연구원 | 하나의 핵산상에서 서로 떨어져 있는 복수의 염기서열 요소들의 pcr 증폭 방법 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014145269A1 (en) * | 2013-03-15 | 2014-09-18 | Theranos, Inc. | Thermostable blunt-end ligase and methods of use |
WO2015175748A1 (en) * | 2014-05-14 | 2015-11-19 | Evorx Technologies, Inc. | Methods and compositions for controlling gene expression and treating cancer |
CA3062550A1 (en) * | 2017-05-08 | 2018-11-15 | Codexis, Inc. | Engineered ligase variants |
CN113166270A (zh) * | 2018-12-17 | 2021-07-23 | 深圳华大生命科学研究院 | 融合蛋白及其应用 |
WO2021198341A1 (en) * | 2020-03-31 | 2021-10-07 | Arcticzymes As | Atp-dependent dna ligase |
CN113774032B (zh) * | 2021-11-12 | 2022-03-01 | 翌圣生物科技(上海)股份有限公司 | 重组t4连接酶突变体、编码dna及ngs建库方法 |
US20230295707A1 (en) * | 2022-03-21 | 2023-09-21 | Abclonal Science, Inc. | T4 DNA Ligase Variants with Increased Ligation Efficiency |
CN118291587A (zh) * | 2023-01-03 | 2024-07-05 | 南京诺唯赞生物科技股份有限公司 | 一种组合物及其在核酸纯化中的应用 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5871902A (en) * | 1994-12-09 | 1999-02-16 | The Gene Pool, Inc. | Sequence-specific detection of nucleic acid hybrids using a DNA-binding molecule or assembly capable of discriminating perfect hybrids from non-perfect hybrids |
US6706505B1 (en) * | 2000-03-08 | 2004-03-16 | Amgen Inc | Human E3α ubiquitin ligase family |
US6627424B1 (en) * | 2000-05-26 | 2003-09-30 | Mj Bioworks, Inc. | Nucleic acid modifying enzymes |
US20070015148A1 (en) * | 2001-01-25 | 2007-01-18 | Orr Michael S | Gene expression profiles in breast tissue |
US7271005B2 (en) * | 2002-04-30 | 2007-09-18 | University Of Florida Research Foundation, Inc. | Modulation of bacterial membrane permeability |
EP2264155A1 (en) * | 2002-07-25 | 2010-12-22 | Bio-Rad Laboratories, Inc. | Hybrid polymerase methods and compositions |
JPWO2006085407A1 (ja) * | 2005-02-09 | 2008-12-18 | 学校法人日本大学 | Hcv量に関連する遺伝子のスクリーニング方法 |
JP5241493B2 (ja) * | 2005-07-15 | 2013-07-17 | アジレント・テクノロジーズ・インク | Dna結合タンパク質−ポリメラーゼのキメラ |
US20070059713A1 (en) * | 2005-09-09 | 2007-03-15 | Lee Jun E | SSB-DNA polymerase fusion proteins |
WO2008005310A2 (en) * | 2006-06-30 | 2008-01-10 | Ambit Biosciences Corp. | Detectable nucleic acid tag |
ATE542830T1 (de) * | 2006-12-04 | 2012-02-15 | Pasteur Institut | Als gerüst verwendeter ob-fold zur entwicklung neuer spezifischer bindemittel |
US20110020877A1 (en) * | 2008-01-11 | 2011-01-27 | Genesys Limited | Cren7 chimeric protein |
-
2010
- 2010-09-16 AU AU2010296086A patent/AU2010296086A1/en not_active Abandoned
- 2010-09-16 US US13/496,263 patent/US20120214208A1/en not_active Abandoned
- 2010-09-16 EP EP10817494.7A patent/EP2478014A4/en not_active Withdrawn
- 2010-09-16 WO PCT/NZ2010/000187 patent/WO2011034449A1/en active Application Filing
- 2010-09-16 KR KR1020127009669A patent/KR20120093882A/ko not_active Application Discontinuation
- 2010-09-16 CA CA2774333A patent/CA2774333A1/en not_active Abandoned
- 2010-09-16 JP JP2012529707A patent/JP2013505016A/ja active Pending
- 2010-09-16 SG SG2012018941A patent/SG179200A1/en unknown
- 2010-09-16 CN CN2010800458787A patent/CN102597006A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101468585B1 (ko) * | 2012-12-13 | 2014-12-03 | 한국 한의학 연구원 | 하나의 핵산상에서 서로 떨어져 있는 복수의 염기서열 요소들의 pcr 증폭 방법 |
Also Published As
Publication number | Publication date |
---|---|
CA2774333A1 (en) | 2011-03-24 |
AU2010296086A1 (en) | 2012-05-10 |
EP2478014A4 (en) | 2013-11-27 |
US20120214208A1 (en) | 2012-08-23 |
JP2013505016A (ja) | 2013-02-14 |
EP2478014A1 (en) | 2012-07-25 |
WO2011034449A1 (en) | 2011-03-24 |
CN102597006A (zh) | 2012-07-18 |
SG179200A1 (en) | 2012-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20120093882A (ko) | 융합 폴리펩티드 및 이들의 용도 | |
JP7518549B2 (ja) | 遺伝子編集における非意図的な変異の阻害 | |
US11926854B2 (en) | Soluble intein fusion proteins and methods for purifying biomolecules | |
Sharp et al. | The interface of ς with core RNA polymerase is extensive, conserved, and functionally specialized | |
TWI682997B (zh) | 用於改善插入序列傾向及增加dna輸入耐受度之經修飾的轉位酶 | |
Evans Jr et al. | Intein‐mediated protein ligation: Harnessing nature's escape artists | |
US5723584A (en) | Biotinylation of proteins | |
Garinot-Schneider et al. | Identification of putative active-site residues in the DNase domain of colicin E9 by random mutagenesis | |
Evans et al. | Mechanistic and kinetic considerations of protein splicing | |
Endo et al. | High-throughput, genome-scale protein production method based on the wheat germ cell-free expression system | |
Schmohl et al. | Engineering sortase a by screening a second‐generation library using phage display | |
KR20090125047A (ko) | 증대된 단백질 발현 및 정제를 위한 방법 및 조성물 | |
Arsène et al. | Role of region C in regulation of the heat shock gene-specific sigma factor of Escherichia coli, ς32 | |
AU2002341204B2 (en) | Method for producing and identifying soluble protein domains | |
CA2837503C (en) | Sequence-specific engineered ribonuclease h and the method for determining the sequence preference of dna-rna hybrid binding proteins | |
JP5587528B2 (ja) | c−Jun蛋白質と複合体を形成する蛋白質、及び、それをコードする核酸、ならびに、それらの利用方法 | |
JP2017530726A (ja) | 抗体様タンパク質 | |
WO2002038580A1 (en) | Streptavidin-binding peptides and uses thereof | |
JP2006180886A (ja) | Dnaポリメラーゼの製造方法 | |
Zhang | Protein Engineering in the Study of Protein Labeling and Degradation | |
JP3829174B2 (ja) | Dnaポリメラーゼ活性と3’−5’エキソヌクレアーゼ活性を有する耐熱性ヘテロダイマー酵素およびその製法 | |
JPH07126297A (ja) | カルモジュリン融合蛋白質 | |
WO2024178215A2 (en) | Chimeric biosensor for the detection 2'3'-cyclic gmp-amp (cgamp) and methods of use thereof | |
Schirra et al. | Role of Region C in Regulation of the Heat | |
Reid-Varley | A Cutting-Edge Tail: Crystallisation of UCH-L5 C-terminal Domain William-Bernard Reid-Varley Petsko-Ringe Lab |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |