KR20230172542A - 개선된 특성들을 가진 신규한 루시페라제들 - Google Patents
개선된 특성들을 가진 신규한 루시페라제들 Download PDFInfo
- Publication number
- KR20230172542A KR20230172542A KR1020237039320A KR20237039320A KR20230172542A KR 20230172542 A KR20230172542 A KR 20230172542A KR 1020237039320 A KR1020237039320 A KR 1020237039320A KR 20237039320 A KR20237039320 A KR 20237039320A KR 20230172542 A KR20230172542 A KR 20230172542A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- ala
- gly
- luciferase
- lys
- Prior art date
Links
- 108060001084 Luciferase Proteins 0.000 title claims abstract description 194
- 230000000694 effects Effects 0.000 claims abstract description 101
- 238000000034 method Methods 0.000 claims abstract description 45
- 108700008625 Reporter Genes Proteins 0.000 claims abstract description 41
- 238000012360 testing method Methods 0.000 claims abstract description 40
- 238000013537 high throughput screening Methods 0.000 claims abstract description 16
- 238000007876 drug discovery Methods 0.000 claims abstract description 15
- 230000003472 neutralizing effect Effects 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 115
- 239000005089 Luciferase Substances 0.000 claims description 110
- YHIPILPTUVMWQT-UHFFFAOYSA-N Oplophorus luciferin Chemical compound C1=CC(O)=CC=C1CC(C(N1C=C(N2)C=3C=CC(O)=CC=3)=O)=NC1=C2CC1=CC=CC=C1 YHIPILPTUVMWQT-UHFFFAOYSA-N 0.000 claims description 92
- 239000000758 substrate Substances 0.000 claims description 79
- 102000004169 proteins and genes Human genes 0.000 claims description 78
- 239000002773 nucleotide Substances 0.000 claims description 72
- 125000003729 nucleotide group Chemical group 0.000 claims description 68
- 108700026244 Open Reading Frames Proteins 0.000 claims description 62
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 40
- 108090000331 Firefly luciferases Proteins 0.000 claims description 38
- 239000013598 vector Substances 0.000 claims description 21
- 108010052090 Renilla Luciferases Proteins 0.000 claims description 20
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 claims description 18
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 claims description 17
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 claims description 17
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 claims description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 17
- 102000040430 polynucleotide Human genes 0.000 claims description 15
- 108091033319 polynucleotide Proteins 0.000 claims description 15
- 239000002157 polynucleotide Substances 0.000 claims description 15
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 14
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 230000001105 regulatory effect Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 3
- 229940000406 drug candidate Drugs 0.000 claims description 3
- 210000001672 ovary Anatomy 0.000 claims description 3
- 241000271566 Aves Species 0.000 claims description 2
- 241000699802 Cricetulus griseus Species 0.000 claims description 2
- 241000238631 Hexapoda Species 0.000 claims description 2
- 241000341655 Human papillomavirus type 16 Species 0.000 claims description 2
- 241001465754 Metazoa Species 0.000 claims description 2
- 101100024330 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MSB1 gene Proteins 0.000 claims description 2
- 238000002405 diagnostic procedure Methods 0.000 claims description 2
- 238000007877 drug screening Methods 0.000 claims 2
- 230000004952 protein activity Effects 0.000 claims 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 230000003213 activating effect Effects 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 abstract description 3
- 230000031018 biological processes and functions Effects 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 174
- 150000001413 amino acids Chemical group 0.000 description 66
- 235000018102 proteins Nutrition 0.000 description 58
- 239000000523 sample Substances 0.000 description 43
- 241000186140 Metridia longa Species 0.000 description 34
- 230000014509 gene expression Effects 0.000 description 28
- 238000011002 quantification Methods 0.000 description 23
- 108010076504 Protein Sorting Signals Proteins 0.000 description 21
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 21
- 108010061238 threonyl-glycine Proteins 0.000 description 20
- 108091026890 Coding region Proteins 0.000 description 19
- 239000013612 plasmid Substances 0.000 description 17
- 108020004414 DNA Proteins 0.000 description 14
- 241000963438 Gaussia <copepod> Species 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 229940024606 amino acid Drugs 0.000 description 14
- 108010056582 methionylglutamic acid Proteins 0.000 description 13
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 12
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 11
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 11
- 108010079364 N-glycylalanine Proteins 0.000 description 11
- 108010047495 alanylglycine Proteins 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 10
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 10
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 10
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 10
- 108010081551 glycylphenylalanine Proteins 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 9
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 9
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 9
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 9
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 9
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 9
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 9
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 238000003146 transient transfection Methods 0.000 description 9
- ICAYWNTWHRRAQP-FXQIFTODSA-N Asp-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N ICAYWNTWHRRAQP-FXQIFTODSA-N 0.000 description 8
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 8
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 230000009977 dual effect Effects 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 7
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 7
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 7
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 7
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 7
- ALNKNYKSZPSLBD-ZDLURKLDSA-N Cys-Thr-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ALNKNYKSZPSLBD-ZDLURKLDSA-N 0.000 description 7
- 241000701022 Cytomegalovirus Species 0.000 description 7
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 7
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 7
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 7
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 7
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 7
- WTOAPTKSZJJWKK-HTFCKZLJSA-N Ile-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WTOAPTKSZJJWKK-HTFCKZLJSA-N 0.000 description 7
- RFMDODRWJZHZCR-BJDJZHNGSA-N Ile-Lys-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O RFMDODRWJZHZCR-BJDJZHNGSA-N 0.000 description 7
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 7
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 7
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 7
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 7
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 7
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 7
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 7
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 7
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 7
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 7
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 7
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 7
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 7
- 239000010931 gold Substances 0.000 description 7
- 229910052737 gold Inorganic materials 0.000 description 7
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 7
- 239000003446 ligand Substances 0.000 description 7
- 230000028327 secretion Effects 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 6
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 6
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 6
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 6
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 6
- OANWAFQRNQEDSY-DCAQKATOSA-N Arg-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N OANWAFQRNQEDSY-DCAQKATOSA-N 0.000 description 6
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 6
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 6
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 6
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 6
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 6
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 6
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 6
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 6
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 6
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 6
- 108091005804 Peptidases Proteins 0.000 description 6
- 239000004365 Protease Substances 0.000 description 6
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 6
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 6
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 6
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 150000007523 nucleic acids Chemical group 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 5
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 5
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 5
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 5
- ZKONLKQGTNVAPR-DCAQKATOSA-N Glu-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N ZKONLKQGTNVAPR-DCAQKATOSA-N 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 5
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 5
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 5
- 102000006601 Thymidine Kinase Human genes 0.000 description 5
- 108020004440 Thymidine kinase Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000003115 biocidal effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 4
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 4
- CVOZXIPULQQFNY-ZLUOBGJFSA-N Cys-Ala-Cys Chemical compound C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O CVOZXIPULQQFNY-ZLUOBGJFSA-N 0.000 description 4
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 4
- LKHMGNHQULEPFY-ACZMJKKPSA-N Cys-Ser-Glu Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O LKHMGNHQULEPFY-ACZMJKKPSA-N 0.000 description 4
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 4
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 4
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 4
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 4
- 239000013543 active substance Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000004907 flux Effects 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 238000004020 luminiscence type Methods 0.000 description 4
- 108010084572 phenylalanyl-valine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 3
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 3
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 3
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 3
- 102000004631 Calcineurin Human genes 0.000 description 3
- 108010042955 Calcineurin Proteins 0.000 description 3
- 102000000584 Calmodulin Human genes 0.000 description 3
- 108010041952 Calmodulin Proteins 0.000 description 3
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 3
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 3
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 3
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 3
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 3
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 3
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 3
- PYUCNHJQQVSPGN-BQBZGAKWSA-N Gly-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)CN=C(N)N PYUCNHJQQVSPGN-BQBZGAKWSA-N 0.000 description 3
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- 101001054334 Homo sapiens Interferon beta Proteins 0.000 description 3
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 3
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 3
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 3
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 3
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 3
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 210000004900 c-terminal fragment Anatomy 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 230000006037 cell lysis Effects 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 108010004073 cysteinylcysteine Proteins 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 210000004898 n-terminal fragment Anatomy 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 2
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 2
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- LBHOVGUGOBINDL-KKUMJFAQSA-N His-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O LBHOVGUGOBINDL-KKUMJFAQSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 2
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 2
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 2
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 2
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 2
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 2
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 2
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005415 bioluminescence Methods 0.000 description 2
- 230000029918 bioluminescence Effects 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 230000022534 cell killing Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- HBZBAMXERPYTFS-SECBINFHSA-N (4S)-2-(6,7-dihydro-5H-pyrrolo[3,2-f][1,3]benzothiazol-2-yl)-4,5-dihydro-1,3-thiazole-4-carboxylic acid Chemical compound OC(=O)[C@H]1CSC(=N1)c1nc2cc3CCNc3cc2s1 HBZBAMXERPYTFS-SECBINFHSA-N 0.000 description 1
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- RCQRKPUXJAGEEC-ZLUOBGJFSA-N Ala-Cys-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O RCQRKPUXJAGEEC-ZLUOBGJFSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- YMIYZAOBQDRCPP-UHFFFAOYSA-N Ala-Thr-Cys-Cys Chemical compound CC(N)C(=O)NC(C(O)C)C(=O)NC(CS)C(=O)NC(CS)C(O)=O YMIYZAOBQDRCPP-UHFFFAOYSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- PPPXVIBMLFWNSK-BQBZGAKWSA-N Arg-Gly-Cys Chemical compound C(C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N PPPXVIBMLFWNSK-BQBZGAKWSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 1
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 241001339134 Calanoides Species 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- SMYXEYRYCLIPIL-ZLUOBGJFSA-N Cys-Cys-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O SMYXEYRYCLIPIL-ZLUOBGJFSA-N 0.000 description 1
- ZJBWJHQDOIMVLM-WHFBIAKZSA-N Cys-Cys-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZJBWJHQDOIMVLM-WHFBIAKZSA-N 0.000 description 1
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 1
- ANRWXLYGJRSQEQ-CIUDSAMLSA-N Cys-His-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ANRWXLYGJRSQEQ-CIUDSAMLSA-N 0.000 description 1
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- FTTHLXOMDMLKKW-FHWLQOOXSA-N Gln-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTTHLXOMDMLKKW-FHWLQOOXSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- ZGXGVBYEJGVJMV-HJGDQZAQSA-N Glu-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O ZGXGVBYEJGVJMV-HJGDQZAQSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- JIUYRPFQJJRSJB-QWRGUYRKSA-N His-His-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JIUYRPFQJJRSJB-QWRGUYRKSA-N 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- XFBBBRDEQIPGNR-KATARQTJSA-N Lys-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O XFBBBRDEQIPGNR-KATARQTJSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 1
- KVNLHIXLLZBAFQ-RWMBFGLXSA-N Lys-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N KVNLHIXLLZBAFQ-RWMBFGLXSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 1
- RAAVFTFEAUAVIY-DCAQKATOSA-N Met-Glu-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N RAAVFTFEAUAVIY-DCAQKATOSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- JHVNNUIQXOGAHI-KJEVXHAQSA-N Met-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N)O JHVNNUIQXOGAHI-KJEVXHAQSA-N 0.000 description 1
- 241000186243 Metridia Species 0.000 description 1
- 101100476480 Mus musculus S100a8 gene Proteins 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- DGOJNGCGEYOBKN-BWBBJGPYSA-N Thr-Cys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O DGOJNGCGEYOBKN-BWBBJGPYSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 1
- IQXWAJUIAQLZNX-IHPCNDPISA-N Trp-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N IQXWAJUIAQLZNX-IHPCNDPISA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- BZOSBRIDWSSTFN-AVGNSLFASA-N Val-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N BZOSBRIDWSSTFN-AVGNSLFASA-N 0.000 description 1
- SJLVYVZBFDTRCG-DCAQKATOSA-N Val-Lys-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N SJLVYVZBFDTRCG-DCAQKATOSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 238000000695 excitation spectrum Methods 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/66—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving luciferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6897—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/12—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/12—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
- C12Y113/12007—Photinus-luciferin 4-monooxygenase (ATP-hydrolysing) (1.13.12.7), i.e. firefly-luciferase
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/502—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
- G01N33/5023—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/5044—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- General Physics & Mathematics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Food Science & Technology (AREA)
- Toxicology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
본 발명은 리포터 유전자로서 세포들에서 발현될 때 개선된 특성들을 보이는 신규한 루시페라제 유전자들 및 테스트 샘플에서 약리학적 활성 분자들의 활성을 검출하고 그리고 선택적으로 정량화하기 위해 동일한 것을 사용하는 방법에 관한 것이다. 본 발명은 추가로 본 발명의 리포터 세포주를 사용하여 테스트 샘플에 존재하는 약리학적 활성 분자에 대한 중화 항체들을 검출하고 그리고 선택적으로 정량화하기 위한 방법에 관한 것이다. 본 발명은 추가로 상기 루시페라제 유전자들을 리포터 유전자들로 사용하여 최적의 민감도(sensitivity), 시그널 강도(strength) 및 생물학적 정확도(fidelity)로 생물학적(biologic) 프로세스들을 검출하고 그리고 최적으로 모니터링하기 위한 약물 발견에서 고-처리량 스크리닝을 위한 방법에 관한 것이다.
Description
본 발명은 자연 발생 해양 요각류(copepod) Metridia longa 루시페라제(luciferase) 유전자로부터 유래된 루시페라제 유전자들 및 리포터 유전자들로 상기 루시페라제들을 포함하는(incorporating) 리포터-유전자 세포주들 및 테스트 샘플에서 유전자 발현을 검출하고 최적으로(optimally) 정량화하기(quantitating) 위하여 이를 사용하는 방법에 관한 것이다. 본 발명은 또 본 발명의 리포터 세포주들을 사용하여 테스트 샘플에 존재하는 약리 활성 분자들(pharmacology active molecules)의 활성 및 상기 분자들에 대한 중화 항체 반응(neutralizing antibody response)을 검출하고 최적으로 정량화하기 위한 방법에 관한 것이다. 본 발명은 또 최적의 민감도(sensitivity), 신호 강도 및 생물학적 충실도(fidelity)로 생물학적 프로세스들을 검출하고 최적으로 모니터링하기 위한 멀티플 샘플링을 허용하는 약물 발견에서 고-처리량(high-throughput) 스크리닝을 위한 비-독성 방법에 관한 것이다. 박테리아 및 포유류 둘다 선택 마커들, 멀티플 클로닝 부위, 트랜스포존-특이적 역 말단 반복들(inverted terminal repeats), 효율적인 최소(minimal) 프로모터를 함유하고 형광 단백질 예를 들어 녹색 형광 단백질(green fluorescent protein) (GFP) 또는 적색 형광 단백질(red fluorescent protein) (RFP), 또는 반딧불이(firefly) 루시페라제, 레닐라(Renilla) 루시페라제, 가우시아(Gaussia) 루시페라제, 또는 본 발명에 개시된 Metridia longa로부터 유래된 신규한 루시페라제를 포함하나 이에 제한되지 않은 루시페라제와 같은 효소들을 포함하나 이에 제한되지 않는 광범위한 자연 발생 또는 조작된 리포터-유전자들의 발현에 이상적으로 적합한 신규한(novel) 벡터가 또한 개시되어 있다.
생물발광(Bioluminescent) 및 형광(fluorescent) 리포터-유전자들은 유전자 발현의 연구에 광범위하게 사용되며 약물 활성의 정량화(Lallemand et al. 2010, 2011, 2017)를 위하여 그리고 약물 발견에서 고-처리량 스크리닝(high-throughput screening) (HTS) (Inglese et al, 2007)에서 넓은 적용을 발견하였다. 발광(luminescence)의 주요 장점들 중 하나는 형광(fluorescence)과 대조적으로 외부 광원에 의한 여기(excitation)를 필요로 하지 않아 높은 신호 대 배경(background) 비율을 야기한다는 것이다. 생물발광(Bioluminescence) 분석들은 루미노미터를 사용하여 정량화될 수 있는 빛의 방출(emission)과 함께 루시페린(luciferin) 기질들의 옥시루시페린(oxyluciferin)으로의 산화를 촉매 작용하는 루시페라제 효소들을 사용한다(employ). 자연 발생 루시페라제들은 D-루시페린/ATP 또는 코엘렌테라진(coelenterazine)을 기질로의 사용에 따라 두 개의 주요 그룹들로 나뉠 수 있다(Thorne et al 2010). 자연적으로 발생하는 루시페라제들은 반딧불이 루시퍼라제(firefly luciferase) (FL)의 경우와 같이 세포 내에서(intracellularly) 발현되거나 Metridia 루시페라제와 같이 분비될 수 있다(Markova et al 2004). FL 또는 레닐라(Renilla) 루시페라제와 같은 루시페라제들은 GFP와 같은 형광 단백질들에 비해 상대적으로 짧은 반감기들을 가지며(Corish and Tyler-Smith 1999) 리포터-유전자 전사 수준들에서 동적 변화들을 정량화하는데 사용될 수 있어 우리 및 다른 이들이 보여준 대로 정량화되는 다양한 세포외 신호들 또는 세포 내 유전자 발현의 활성의 정량화를 가능하게 한다 (Lallemand et al. 2008, 2010, 2011, 2017). 루시페라제들은 약물-반응성(responsive) 프로모터의 제어 하 예를 들어 FL을 사용하여 정량화되는 세포 표면 수용체와 약물의 상호작용을 따르는(following) 것과 같은 세포외 신호의 활성화를 가능하게 하는 듀얼 리포터-유전자 분석들에서 조합될 수 있고 결과들은 리포터-유전자 구조체들(constructs) 둘 다로 세포들의 안정적 트랜스펙션 후 또는 일시적 트랜스펙션 실험들에서 항시적 프로모터(constitutive promoter)의 제어 하 레닐라 루시페라제 (RL)와 같은 두 번째 루시페라제의 발현에 대해(relative) 정규화될(normalized) 수 있다 (Lallemand et al. 2010, 2011, 2017). 이것은 예를 들어 FL을 사용하여 정량화되는 약물 활성 및 상업적으로 이용가능한 기질을 사용하여 마이크로티터(microtiter) 플레이트의 동일한 웰에서 RL 수준들의 정량화 및 FL 발현의 켄칭(quenching) 후 세포 숫자에서 차이들 및 세포독성과 같은 효과들에 대하여 정량화되는(normalized) 결과들을 가능하게 한다 (Lallemand et al. 2010, 2011, 2017).
자연 발생 루시페라제들이 약물 발견에서 고-처리량 스크리닝에서 그리고 유전자 발현의 연구를 위한 리포터-유전자들로서 넓은 적용을 발견하였지만, 이상적으로는 단일 카피 유전자들의 산물이 쉽게 검출될 수 있도록 극히 밝아야 하고, 큰 동적(dynamic) 범위를 나타내고, 낮은 배경 수준들을 주고 연속(serial) 샘플링을 가능하게 하도록 분비되고, 주입기들(injectors)이 장착된(equipped) 루미노미터의 사용을 필요로 하지 않고, 트랜스펙트된 세포들에서 발현을 촉진하기 위해 크기가 작고 높은 수준들에서 발현될 때 세포들에 무-독성이기 위해 "glo" 기질을 사용해야 하는 개선된 루시페라제들에 대한 필요가 있다.
상기로부터 약리 활성 분자들의 활성의 정량화 및 약물 발견에서 고처리량 스크리닝(high throughput screening)을 위한 리포터 유전자로 사용을 위한 최적의 특성들(characteristics)을 나타내는 조작된 루시페라제에 대한 필요가 있다는 결론이 나온다.
또한 종래의 멀티플 클로닝 부위 및 트랜스포존-특이적 통합(integration) 부위 둘다, 및 개선된 최소(minimal) 프로모터를 가진 다용도(versatile) 듀얼 박테리아-포유동물 발현에 대한 필요가 여전히 있다.
도면들의 간략한 설명
도 1은 야생형 Metridia longa 루시페라제 유전자 및 유전자의 5' 번역(translated) 영역의 결실(deletion) 돌연변이체 (mutant) (nt. 51 내지 nt. 228)의 뉴클레오타이드 서열 정렬을 보여준다.
도 2는 시그널(signal) 펩타이드 및 추정(putative) 촉매(catalytic) 도메인들 1 및 2의 위치를 보여주는 천연(native) Metridia longa 루시페라제의 아미노-산 서열을 보여준다.
도 3A는 각각 항시적(constitutive) CMV 프로모터의 제어 하에, 표시된 루시페라제 유전자들을 인코딩하는(encoding) 신규한(novel) Svar 벡터로 세포들의 일시적(transient) 트랜스펙션, 및 항시적 티미딘 키나제(thymidine kinase) (TK) 프로모터의 제어 하에 반딧불이 루시페라제로 세포들의 공동-트랜스펙션(co-transfection) 후 HEK293 세포들의 반응을 보여준다. 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc Gold, Invivogen)을 사용하여 37 ℃에서 세포들의 18 시간 인큐베이션 후 세포 상청액(supernatant)에서 루시페라제 활성이 정량화되었다. 그 다음 세포들이 용해되었고 반딧불이 루시페라제 활성이 BrightGlo (Promega)으로 정량화되었다. 결과들은 코엘렌테라진(coelenterazine) 의존적 루시페라제와 교차 반응(cross react)하지 않는 반딧불이 루시페라제의 발현에 대해 정규화(normalized)된다.
도 3B는 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc Gold, Invivogen)을 사용하여 루시페라제 시그널의 정량화 전 37 ℃에서 6 시간 동안 TNFα의 100 ng/ml으로 처리되고 표준(canonical) NFkB 인식 서열의 6-배(fold) 탠덤(tandem) 반복(repeat) 및 SV40 최소(minimal) 프로모터로 구성된 키메라 프로모터의 제어 하 각각 야생형 Metridia longa 루시페라제 유전자, 또는 Svar 루시페라제 1 또는 Svar 루시페라제 2 유전자들을 인코딩하는 신규한 Svar 벡터로 세포들의 일시적(transient) 트랜스펙션 후 HEK293 세포들의 반응을 보여준다.
도 4A 및 도 4B는 유전자의 5' 번역(translated) 영역 및 네 개 돌연변이체(mutant) 루시페라제 유전자들의 그것에서 177-뉴클레오타이드 결실(deletion)을 갖는 Metridia longa 루시페라제 유전자의 코딩(coding) 서열의 다중(multiple) 서열 정렬을 보여준다(illustrate). 네 개 돌연변이체 루시페라제 유전자들 및 5' 번역 영역에서 177-뉴클레오타이드 결실을 가진 Metridia longa 루시페라제 유전자 둘 다에서 뉴클레오타이드들 1 내지 51은 Gaussia 루시페라제의 시그널 펩타이드의 뉴클레오타이드 서열을 나타낸다.
1. 5' 번역 영역에서 177 뉴클레오타이드 결실이 있는 Metridia longa 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열
2. SVAR Luc-1 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열.
3. SVAR Luc-2 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열.
4. SVAR Luc-3 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열.
5. SVAR Luc-4 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열
도 5는 유전자의 5' 번역 영역 및 네 개 돌연변이체 루시페라제 유전자들의 그것에서 177-뉴클레오타이드 결실을 갖는 Metridia longa 루시페라제 유전자의 아미노산 서열의 다중(multiple) 서열 정렬을 보여준다. 5' 번역 영역에서 177-뉴클레오타이드 결실을 가진 Metridia longa 루시페라제 유전자 및 네 개 돌연변이체(mutant) 루시페라제 단백질들 둘 다에서 아미노산들 1 내지 17은 Gaussia 루시페라제의 시그널 펩타이드의 아미노산 서열을 나타낸다.
1. 5' 번역 영역에서 177 뉴클레오타이드 결실을 가진 Metridia longa 루시페라제 유전자의 코딩 영역의 아미노산 서열
2. SVAR Luc-1 루시페라제 유전자의 코딩 영역의 아미노산 서열.
3. SVAR Luc-2 루시페라제 유전자의 코딩 영역의 아미노산 서열
4. SVAR Luc-3 루시페라제 유전자의 코딩 영역의 아미노산 서열.
5. SVAR Luc-4 루시페라제 유전자의 코딩 영역의 아미노산 서열
도 6A는 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc, Gold Invivogen)을 사용하여 실온(room temperature)에서 증가하는 시간에서 루시페라제 활성의 정량화, 및 각각 항시적(constitutive) CMV 프로모터의 제어 하, 표시되는(indicated) 루시페라제 유전자들로 세포들의 일시적 트랜스펙션 후 HEK293 세포들의 상청액에서 루시페라제 활성의 손실의 비율(rate)을 나타낸다.
도 6B는 도 6A에 보여지는 동일한 샘플들의 15분에서 상대적인(relative) 루시페라제 활성을 보여준다.
도 7은 증가된 농도들(concentrations)의 TNFα로 처리된 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복 및 SV40 최소 프로모터로 구성된 키메라 프로모터의 제어 하 SEQ ID NO: 1에 제시된 서열을 포함하는 리포터 유전자로 안정적으로 트랜스펙트된 HEK293 세포들의 클론(clonal) 세포주의 반응을 나타낸다.
패널 Α. RLU 값들
패널 B. TNFα로 처리되지 않은 대조군에 대한 배수(Fold) 유도(induction)
도 8은 37 ℃에서 6 시간 동안 증가하는 농도들의 TNFα로 세포들의 처리 및 동일한 NFkB 반응성(responsive) 프로모터의 제어 하 반딧불이 루시페라제 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 반딧불이 루시페라제 유전자로 안정적으로 트랜스펙트된 K562 세포들 및 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복 및 SV40 최소 프로모터로 구성된 키메라 프로모터의 제어 하 SEQ ID NO: 1에 제시된 서열을 포함하는 루시페라제 유전자로 안정적으로 트랜스펙트된 K562 세포들의 반응의 비교를 나타낸다.
도 9는 Bright-Glo (Promega)를 사용한 반딧불이 루시페라제 활성의 정량화 또는 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc Plus, Invivogen)을 사용한 Svar 루시페라제 활성의 정량화 전 37 ℃에서 4 시간 동안 200 ng/ml 의 TNFα로 처리되고 동일한 키메라 프로모터의 제어 하 반딧불이 루시페라제를 발현하는 pGL4 (Promega) 또는 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복 및 SV40 최소 프로모터로 구성되는 키메라 프로모터의 제어 하 Svar 루시페라제 1을 발현하는 플라스미드로 세포들의 일시적 트랜스펙션 후 HEK293 세포들의 반응을 나타낸다.
도 10은 Svar Luciferase-1 (SVL1) nt. 1330 내지 1779의 코돈 최적화된(optimized) 코딩 서열, Gaussia 루시페라제 시그널 펩타이드 nt. 1276 내지 1329 (GLuc SP), 인간 인터페론 베타 유전자 nt.1141 내지 1263의 5'-UTR로부터의 최소(minimal) 프로모터, 트랜스포존(transposon)-특이적(specific) 5' 반전(inverted) 말단(terminal) 반복 nt. 652 내지 682, 트랜스포존-특이적 3' 반전(inverted) 말단(terminal) 반복 nt. 4567 내지 4601, 코돈 최적화된 누르세트리신(nourseothricine) 항생제(antibiotic) 저항성(resistance) 유전자 nt. 5138 내지 5710 (natMx6_OPTI), EM7 프로모터 nt. 5072-5137의 제어 하, 코돈-최적화된 히그로마이신(hygromycin) 저항성(resistance) 유전자 nt. 2532 내지 3557 (Hygro OPTI), SV40 최소 프로모터 nt. 2138 내지 2495의 제어 하, 및 다중(multiple) 클로닝 부위 nt. 1110 내지 1134 (MCS), 및 박테리아 복제 기점(origin) nt. 5954 내지 217을 포함하는 신규한 벡터 (6325 bp)의 주요 특징들을 보여준다. 주요 제한 부위들(restriction sites)은 하기를 포함한다; 컨센서스(consensus) 반응(response) 서열의 삽입(insertion)을 위한 KpnI, NheI, 및 Xhol, 포유동물 선택 마커의 치환(substitution)을 위한 Bcul/SalI, 리포터-유전자의 치환(substitution)을 위한 BglII/Xbal, 및 최소 프로모터 서열의 치환을 위한 Xhol/BglII.
도 11은 일반적인(generic) 코엘렌테라진(coelenterazine) 기반 루시페라제 기질의 조성을 보여주는 표 1을 나타낸다.
도 12는 문헌에 보고된 다른 천연 또는 조작된 루시페라제들의 그것들과 비해(relative) AA1 및 AA2에 제시된 서열에 의해 인코딩된 아미노산 서열을 포함하고 SEQ ID NO: 1 및 SEQ ID NO:2에 제시된 서열에 의해 인코딩되는 루시페라제의 특성들의 비교를 보여주는 표 2를 나타낸다.
도 13은 AP1 반응성 프로모터의 6-배(fold) 탠덤 반복의 제어 하 코돈-최적화된 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결된 듀얼 또는 폴리-시스트론(cistronic) 구조물(construct)로 트랜스펙트된 본 발명에 따른 HEK293 세포들의 클론 세포주의 반응을 나타내며, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 6에 제시된 자가-절단(self-cleaving) 2A 펩타이드 F2A의 코딩 서열에 의해 분리되는 코돈 최적화된 반딧불이 루시페라제를 인코딩하는 두 번째 오픈 리딩 프레임 및 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다. 듀얼 루시페라제 활성의 정량화 전에 37 ℃에서 6 시간 동안 100 ng/ml의 PMA로 세포들이 처리되었다.
도 14는 원형화된(circularized) Svar 루시페라제 Luc의 N-말단(terminal) 및 C-말단 단편들을 나타낸다.
도 15는 재구성될(reconstituted)때 기능적(functional)원형화된 루시페라제 Luc-1을 나타낸다.
뉴클레오타이드 서열들의 간략한 설명
SEQ. ID NO:1. SVAR 루시페라제 Luc-1, 코돈 최적화됨
SEQ. ID NO:2. SVAR 루시페라제 Luc-2, 코돈 최적화됨
SEQ. ID NO:3. Gaussia 시그널 펩타이드, 코돈 최적화되고 Gaussia 시그널 펩타이드를 인코딩함.
SEQ. ID NO:4. 누르세오트리신(Nourseothricine) 저항성 유전자, 코돈 최적화됨
SEQ. ID NO:5. SVAR 플라스미드의 전체 뉴클레오타이드 서열
SEQ. ID NO:6. SVAR 루시페라제 Luc-1, 코돈 최적화, 반딧불이 루시페라제 유전자의 뉴클레오타이드 서열 및 F2A 자가-절단(self-cleaving) 펩타이드의 뉴클레오타이드 서열의 업스트림.
뉴클레오타이드들 1 내지 54 Gaussia 루시페라제 시그널 펩타이드
뉴클레오타이드들 55 내지 501 Svar 루시페라제 Luc-1, 코돈 최적화
F2A 자가-절단 펩타이드를 인코딩하는 뉴클레오타이드들 517 내지 582
코돈 최적화된(codon optimized), 상기(the)/a 반딧불이 루시페라제를 인코딩하는 뉴클레오타이드들 582 내지 2235
SEQ ID NO:7은 SEQ ID NO: AA5 및 따라서 원형화된 루시페라제 Luc-1의 N-말단 및 C-말단 단편들을 인코딩한다.
아미노산 서열들의 간략한 설명
SEQ. ID NO: AA1; SEQ ID NO: 1에 의해 인코딩되는, SVAR 루시페라제 Luc-1.
SEQ. ID NO: AA2; SEQ ID NO: 2에 의해 인코딩되는, SVAR 루시페라제 Luc-2.
SEQ. ID NO: AA3; Gaussia 시그널 펩타이드의 아미노산 서열
SEQ. ID NO: AA4; Gaussia 시그널 펩타이드 (아미노산들 1 내지 18) SVAR 루시페라제 Luc-1, (아미노-산들 19 내지 167), F2A 자가-절단(self-cleaving) 펩타이드 (아미노산들 168 내지 194), 반딧불이 루시페라제 (아미노-산들 195 내지 745)의 아미노산 서열.
SEQ ID NO: AA5; 아미노산 서열은 도 14에 보여진 대로 재구성될(reconstituted) 때 기능적인 원형화된(functional) 루시페라제 Luc-1의 N-말단(terminal) 및 C-말단 단편들에 해당한다.
도 1은 야생형 Metridia longa 루시페라제 유전자 및 유전자의 5' 번역(translated) 영역의 결실(deletion) 돌연변이체 (mutant) (nt. 51 내지 nt. 228)의 뉴클레오타이드 서열 정렬을 보여준다.
도 2는 시그널(signal) 펩타이드 및 추정(putative) 촉매(catalytic) 도메인들 1 및 2의 위치를 보여주는 천연(native) Metridia longa 루시페라제의 아미노-산 서열을 보여준다.
도 3A는 각각 항시적(constitutive) CMV 프로모터의 제어 하에, 표시된 루시페라제 유전자들을 인코딩하는(encoding) 신규한(novel) Svar 벡터로 세포들의 일시적(transient) 트랜스펙션, 및 항시적 티미딘 키나제(thymidine kinase) (TK) 프로모터의 제어 하에 반딧불이 루시페라제로 세포들의 공동-트랜스펙션(co-transfection) 후 HEK293 세포들의 반응을 보여준다. 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc Gold, Invivogen)을 사용하여 37 ℃에서 세포들의 18 시간 인큐베이션 후 세포 상청액(supernatant)에서 루시페라제 활성이 정량화되었다. 그 다음 세포들이 용해되었고 반딧불이 루시페라제 활성이 BrightGlo (Promega)으로 정량화되었다. 결과들은 코엘렌테라진(coelenterazine) 의존적 루시페라제와 교차 반응(cross react)하지 않는 반딧불이 루시페라제의 발현에 대해 정규화(normalized)된다.
도 3B는 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc Gold, Invivogen)을 사용하여 루시페라제 시그널의 정량화 전 37 ℃에서 6 시간 동안 TNFα의 100 ng/ml으로 처리되고 표준(canonical) NFkB 인식 서열의 6-배(fold) 탠덤(tandem) 반복(repeat) 및 SV40 최소(minimal) 프로모터로 구성된 키메라 프로모터의 제어 하 각각 야생형 Metridia longa 루시페라제 유전자, 또는 Svar 루시페라제 1 또는 Svar 루시페라제 2 유전자들을 인코딩하는 신규한 Svar 벡터로 세포들의 일시적(transient) 트랜스펙션 후 HEK293 세포들의 반응을 보여준다.
도 4A 및 도 4B는 유전자의 5' 번역(translated) 영역 및 네 개 돌연변이체(mutant) 루시페라제 유전자들의 그것에서 177-뉴클레오타이드 결실(deletion)을 갖는 Metridia longa 루시페라제 유전자의 코딩(coding) 서열의 다중(multiple) 서열 정렬을 보여준다(illustrate). 네 개 돌연변이체 루시페라제 유전자들 및 5' 번역 영역에서 177-뉴클레오타이드 결실을 가진 Metridia longa 루시페라제 유전자 둘 다에서 뉴클레오타이드들 1 내지 51은 Gaussia 루시페라제의 시그널 펩타이드의 뉴클레오타이드 서열을 나타낸다.
1. 5' 번역 영역에서 177 뉴클레오타이드 결실이 있는 Metridia longa 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열
2. SVAR Luc-1 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열.
3. SVAR Luc-2 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열.
4. SVAR Luc-3 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열.
5. SVAR Luc-4 루시페라제 유전자의 코딩 영역의 뉴클레오타이드 서열
도 5는 유전자의 5' 번역 영역 및 네 개 돌연변이체 루시페라제 유전자들의 그것에서 177-뉴클레오타이드 결실을 갖는 Metridia longa 루시페라제 유전자의 아미노산 서열의 다중(multiple) 서열 정렬을 보여준다. 5' 번역 영역에서 177-뉴클레오타이드 결실을 가진 Metridia longa 루시페라제 유전자 및 네 개 돌연변이체(mutant) 루시페라제 단백질들 둘 다에서 아미노산들 1 내지 17은 Gaussia 루시페라제의 시그널 펩타이드의 아미노산 서열을 나타낸다.
1. 5' 번역 영역에서 177 뉴클레오타이드 결실을 가진 Metridia longa 루시페라제 유전자의 코딩 영역의 아미노산 서열
2. SVAR Luc-1 루시페라제 유전자의 코딩 영역의 아미노산 서열.
3. SVAR Luc-2 루시페라제 유전자의 코딩 영역의 아미노산 서열
4. SVAR Luc-3 루시페라제 유전자의 코딩 영역의 아미노산 서열.
5. SVAR Luc-4 루시페라제 유전자의 코딩 영역의 아미노산 서열
도 6A는 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc, Gold Invivogen)을 사용하여 실온(room temperature)에서 증가하는 시간에서 루시페라제 활성의 정량화, 및 각각 항시적(constitutive) CMV 프로모터의 제어 하, 표시되는(indicated) 루시페라제 유전자들로 세포들의 일시적 트랜스펙션 후 HEK293 세포들의 상청액에서 루시페라제 활성의 손실의 비율(rate)을 나타낸다.
도 6B는 도 6A에 보여지는 동일한 샘플들의 15분에서 상대적인(relative) 루시페라제 활성을 보여준다.
도 7은 증가된 농도들(concentrations)의 TNFα로 처리된 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복 및 SV40 최소 프로모터로 구성된 키메라 프로모터의 제어 하 SEQ ID NO: 1에 제시된 서열을 포함하는 리포터 유전자로 안정적으로 트랜스펙트된 HEK293 세포들의 클론(clonal) 세포주의 반응을 나타낸다.
패널 Α. RLU 값들
패널 B. TNFα로 처리되지 않은 대조군에 대한 배수(Fold) 유도(induction)
도 8은 37 ℃에서 6 시간 동안 증가하는 농도들의 TNFα로 세포들의 처리 및 동일한 NFkB 반응성(responsive) 프로모터의 제어 하 반딧불이 루시페라제 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 반딧불이 루시페라제 유전자로 안정적으로 트랜스펙트된 K562 세포들 및 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복 및 SV40 최소 프로모터로 구성된 키메라 프로모터의 제어 하 SEQ ID NO: 1에 제시된 서열을 포함하는 루시페라제 유전자로 안정적으로 트랜스펙트된 K562 세포들의 반응의 비교를 나타낸다.
도 9는 Bright-Glo (Promega)를 사용한 반딧불이 루시페라제 활성의 정량화 또는 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 (QuantiLuc Plus, Invivogen)을 사용한 Svar 루시페라제 활성의 정량화 전 37 ℃에서 4 시간 동안 200 ng/ml 의 TNFα로 처리되고 동일한 키메라 프로모터의 제어 하 반딧불이 루시페라제를 발현하는 pGL4 (Promega) 또는 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복 및 SV40 최소 프로모터로 구성되는 키메라 프로모터의 제어 하 Svar 루시페라제 1을 발현하는 플라스미드로 세포들의 일시적 트랜스펙션 후 HEK293 세포들의 반응을 나타낸다.
도 10은 Svar Luciferase-1 (SVL1) nt. 1330 내지 1779의 코돈 최적화된(optimized) 코딩 서열, Gaussia 루시페라제 시그널 펩타이드 nt. 1276 내지 1329 (GLuc SP), 인간 인터페론 베타 유전자 nt.1141 내지 1263의 5'-UTR로부터의 최소(minimal) 프로모터, 트랜스포존(transposon)-특이적(specific) 5' 반전(inverted) 말단(terminal) 반복 nt. 652 내지 682, 트랜스포존-특이적 3' 반전(inverted) 말단(terminal) 반복 nt. 4567 내지 4601, 코돈 최적화된 누르세트리신(nourseothricine) 항생제(antibiotic) 저항성(resistance) 유전자 nt. 5138 내지 5710 (natMx6_OPTI), EM7 프로모터 nt. 5072-5137의 제어 하, 코돈-최적화된 히그로마이신(hygromycin) 저항성(resistance) 유전자 nt. 2532 내지 3557 (Hygro OPTI), SV40 최소 프로모터 nt. 2138 내지 2495의 제어 하, 및 다중(multiple) 클로닝 부위 nt. 1110 내지 1134 (MCS), 및 박테리아 복제 기점(origin) nt. 5954 내지 217을 포함하는 신규한 벡터 (6325 bp)의 주요 특징들을 보여준다. 주요 제한 부위들(restriction sites)은 하기를 포함한다; 컨센서스(consensus) 반응(response) 서열의 삽입(insertion)을 위한 KpnI, NheI, 및 Xhol, 포유동물 선택 마커의 치환(substitution)을 위한 Bcul/SalI, 리포터-유전자의 치환(substitution)을 위한 BglII/Xbal, 및 최소 프로모터 서열의 치환을 위한 Xhol/BglII.
도 11은 일반적인(generic) 코엘렌테라진(coelenterazine) 기반 루시페라제 기질의 조성을 보여주는 표 1을 나타낸다.
도 12는 문헌에 보고된 다른 천연 또는 조작된 루시페라제들의 그것들과 비해(relative) AA1 및 AA2에 제시된 서열에 의해 인코딩된 아미노산 서열을 포함하고 SEQ ID NO: 1 및 SEQ ID NO:2에 제시된 서열에 의해 인코딩되는 루시페라제의 특성들의 비교를 보여주는 표 2를 나타낸다.
도 13은 AP1 반응성 프로모터의 6-배(fold) 탠덤 반복의 제어 하 코돈-최적화된 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결된 듀얼 또는 폴리-시스트론(cistronic) 구조물(construct)로 트랜스펙트된 본 발명에 따른 HEK293 세포들의 클론 세포주의 반응을 나타내며, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 6에 제시된 자가-절단(self-cleaving) 2A 펩타이드 F2A의 코딩 서열에 의해 분리되는 코돈 최적화된 반딧불이 루시페라제를 인코딩하는 두 번째 오픈 리딩 프레임 및 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다. 듀얼 루시페라제 활성의 정량화 전에 37 ℃에서 6 시간 동안 100 ng/ml의 PMA로 세포들이 처리되었다.
도 14는 원형화된(circularized) Svar 루시페라제 Luc의 N-말단(terminal) 및 C-말단 단편들을 나타낸다.
도 15는 재구성될(reconstituted)때 기능적(functional)원형화된 루시페라제 Luc-1을 나타낸다.
뉴클레오타이드 서열들의 간략한 설명
SEQ. ID NO:1. SVAR 루시페라제 Luc-1, 코돈 최적화됨
SEQ. ID NO:2. SVAR 루시페라제 Luc-2, 코돈 최적화됨
SEQ. ID NO:3. Gaussia 시그널 펩타이드, 코돈 최적화되고 Gaussia 시그널 펩타이드를 인코딩함.
SEQ. ID NO:4. 누르세오트리신(Nourseothricine) 저항성 유전자, 코돈 최적화됨
SEQ. ID NO:5. SVAR 플라스미드의 전체 뉴클레오타이드 서열
SEQ. ID NO:6. SVAR 루시페라제 Luc-1, 코돈 최적화, 반딧불이 루시페라제 유전자의 뉴클레오타이드 서열 및 F2A 자가-절단(self-cleaving) 펩타이드의 뉴클레오타이드 서열의 업스트림.
뉴클레오타이드들 1 내지 54 Gaussia 루시페라제 시그널 펩타이드
뉴클레오타이드들 55 내지 501 Svar 루시페라제 Luc-1, 코돈 최적화
F2A 자가-절단 펩타이드를 인코딩하는 뉴클레오타이드들 517 내지 582
코돈 최적화된(codon optimized), 상기(the)/a 반딧불이 루시페라제를 인코딩하는 뉴클레오타이드들 582 내지 2235
SEQ ID NO:7은 SEQ ID NO: AA5 및 따라서 원형화된 루시페라제 Luc-1의 N-말단 및 C-말단 단편들을 인코딩한다.
아미노산 서열들의 간략한 설명
SEQ. ID NO: AA1; SEQ ID NO: 1에 의해 인코딩되는, SVAR 루시페라제 Luc-1.
SEQ. ID NO: AA2; SEQ ID NO: 2에 의해 인코딩되는, SVAR 루시페라제 Luc-2.
SEQ. ID NO: AA3; Gaussia 시그널 펩타이드의 아미노산 서열
SEQ. ID NO: AA4; Gaussia 시그널 펩타이드 (아미노산들 1 내지 18) SVAR 루시페라제 Luc-1, (아미노-산들 19 내지 167), F2A 자가-절단(self-cleaving) 펩타이드 (아미노산들 168 내지 194), 반딧불이 루시페라제 (아미노-산들 195 내지 745)의 아미노산 서열.
SEQ ID NO: AA5; 아미노산 서열은 도 14에 보여진 대로 재구성될(reconstituted) 때 기능적인 원형화된(functional) 루시페라제 Luc-1의 N-말단(terminal) 및 C-말단 단편들에 해당한다.
발명의 개요
본 발명은 상기 서술된 선행기술을 고려하여 이루어진 것이며, 본 발명의 목적은 약물 발견(drug discovery)에서 고 처리량 스크리닝에서 사용을 위하여 그리고 약리 활성 분자들(pharmacology active molecules)의 활성의 정량화를 위하여 리포터-유전자로 사용을 위해 최적화된(optimized) 신규한(novel) 루시페라제 유전자를 제공하는 것이다.
특히, 본 발명의 목적은 다음 중 하나 이상을 포함하지만 이에 제한되지 않는 천연(native) 유전자에 의해 인코딩되는(encoded) 것과 비교하여 우수한 특성들(properties)을 나타내는 루시페라제 단백질을 인코딩하는 최적화된 루시페라제 유전자에 대하여 제공하는 것이다;
(i): 증가된 빛 아웃풋(밝기),
(ii): 높은 상대적 빛 단위들(Relative Light Units) (RLU)에 의해 반영되는(reflected) 대로 향상된 신호 안정성 및/또는 신호 지속 기간(duration)
(iii): 약리 활성 물질(pharmacology active substance)의 부존재에서 대조군 샘플들에 비해(relative) 큰 동적(dynamic) 범위를 나타낸다,
(iv): 낮은 배경 수준들을 주고 연속(serial) 샘플링을 가능하게 하기 위해 분비된다,
(v): 주입기들이 장착된 루미노미터의 사용에 대한 필요를 제거하기(obviate)에 충분히 긴 반감기를 갖는다,
(vi): 분자 크기가 작고 이종 트랜스펙트된(heterologous transfected) 세포들에서 발현을 촉진하도록 코돈-최적화되어(codon-optimized) 있다,
(vii): 다음 특성들 중 적어도 하나를 포함하는 향상된 생체적합성(biocompatibility)을 나타낸다; 높은 수준들로 발현될 때 감소된 독성 및 세포들 내 개선된 발현.
(viii): 프로테아제 절단 부위에 의해 분리되고, 스플라이싱 동안 원형화되고(circularized), 세포에 들어가는 프로테아제들에 의해 절단되어, 빛 방출(light emission) 및 SL1의 재구성(reconstitution)을 초래하여 따라서 세포 사멸(killing)을 감지하는데(detect) 사용되는, SL1-N-Ter 및 SL-1-C-Ter, 두 개 서브유닛들의 재구성에 대하여 제공한다.
(ix) SL1-N-Ter 및 SL-1-C-Ter, 두 개 서브유닛들로 스플릿(split)에 대해 제공하고, 두 개 서브유닛들은 칼모듈린 의존적 세린-트레오닌 포스파타제 칼시뉴린과 같은 두 번째 메신저의 존재 하에 재어닐링할(reanneal) 수 있고 따라서 Ca2+ 플럭스(flux)에서 변화들을 감지하기 위하여 사용된다.
본 발명의 구성요소들(elements)은 상기 언급된 효과들 중 하나 이상에 대해 제공한다.
여러가지 구현예들(embodiments)에서, 본 발명은 용해성(soluble) 활성 모노머들로서, 또는 루시페라제들 또는 형광 단백질들 예를 들어 녹색 형광 단백질들 (green fluorescent proteins) (GFPs) 향상된 녹색 형광 단백질 (enhanced green fluorescent protein) (EGFP), 적색 형광 단백질들 (red fluorescent proteins) (RFPs), 황색 형광 단백질 (yellow fluorescent protein) (YFP), 청색 형광 단백질 (blue fluorescent protein) (BFP) 및 입자들, 분석-플레이트들 또는 튜브들과 같은 고체 표면들에 부착된, 또는 여러가지 링커 단백질들, 또는 다른 여기/방출 스펙트럼(spectra)을 보여주는 그것의 변형(variant)을 포함하는 다른 단백질들과 융합 단백질들로서 용액에 존재하는 신규 루시페라제들을 포함한다.
문제를 해결하기 위해, 본 발명은 본 발명의 하나의 구현예에서 (i)-(iii) 중 적어도 하나를 포함하는 신규 루시페라제 유전자를 제공한다:
(i) 상기 세포에서 발현을 위해 코돈-최적화된(codon-optimized), 루시페라제 단백질을 인코딩하는 오픈 리딩 프레임.
특정 구현예에서 오픈 리딩 프레임은 SEQ ID NO: 1에 제시된(set forth) 뉴클레오타이드 서열을 포함하거나 이로 구성될 수 있고, 이는 SEQ ID NO: AA1에 제시된 아미노산 서열을 인코딩할 수 있다.
추가의 구현예에서, 오픈 리딩 프레임은 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 이로 구성될 수 있고 이는 SEQ ID NO: AA2에 제시된 아미노산 서열을 인코딩할 수 있다.
(ii) 세포로부터 효율적인 분비를 보장하기(ensure) 위하여, 동종(homologous) 또는 이종(heterologous) 종(species)으로부터인지, 신호 펩타이드.
하나의 측면에서, 오픈 리딩 프레임은 세포로부터 효율적인 분비를 가능하게 할 수 있는 SEQ ID NO: 3에 제시된 서열을 포함하거나 이로 구성된다.
(iii) 인간 인터페론 베타 유전자의 5' UTR로부터의 최소 프로모터, Gaussia 루시페라제 유전자의 코돈-최적화된 신호 펩타이드, 및 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들을 포함할 수 있는, 트랜스유전자(transgene) 또는 리포터-유전자의 삽입을 위한 트랜스포사제들(transposases)에 의해 인식되는 5' 및 3' 전이가능한 반복들(transposable repeats), 및 박테리아 및 포유동물 세포들 둘다에서 기능적인 EM7 최소 프로모터 또는 합성(composite) CMV T7 프로모터의 제어 하 예컨대 암피실린(ampicillin) 또는 카나마이신(kanamycin)과 같은 다른 항생제 저항성(antibiotic resistance) 유전자 또는 Nourseothricin 항생제 저항성 유전자, 및 SEQ ID NO:4에 제시된 서열을 포함하거나 이로 구성되는, 코돈 최적화된 하이그로마이신(hygromycin) 저항성 유전자, 또는 네오마이신(neomycin), 푸로마이신(puromycin), 제오신(zeocin), 또는 블라스티시딘(blasticidin)과 같은 다른 포유동물 항생제 저항성 유전자를 함유하는 신규한 박테리아 발현 벡터.
하나의 측면에서, 박테리아 발현 벡터는 전체로서 SEQ ID NO: 5에 제시된 서열을 포함하거나 이로 구성될 수 있는 플라스미드일 수 있다.
따라서, 하나의 측면에서, SEQ ID NO.: 5는 SEQ ID NO :1, SEQ ID NO:3, 및 SEQ ID NO: 4를 포함하거나 또는 이로 구성된다.
본 발명의 또다른 측면은 테스트 샘플에서 약리 활성 분자의 활성을 검출하고 선택적으로(optionally) 정량화하는(quantitating) 방법에 대해 제공하며, 상기 방법은 다음의 단계들을 포함한다
(i)
테스트 샘플을 제공하는 것,
(ii)
상기 테스트 샘플을 본 발명에 따른 세포주와 접촉시키는 것으로, 상기 세포주는 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된, 테스트 샘플에 존재하는 약리 활성 분자(들)로 세포주의 처리에 반응하는, 이종(heterologous) 시스-작용(cis-acting) 조절(regulatory) 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 함유하고, 여기서 상기 프로모터는 SEQ ID NO: AA1 및 SEQ ID NO: AA2에 제시되는 서열들 중 하나를 포함하는 첫 번째 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게 연결되어 있다.
(iii)
바람직한 구현예에서, 분석의 정규화(normalization)에 대해 제공하기 위해, 본 발명에 따른 세포주는 약리 활성 분자(pharmacology active molecule)에 반응하는 리포터 유전자 구조물(construct)에서 사용되는 것과 다른 루시페라제의 항시적(constitutive) 생산을 위한 구조물을 추가로 갖는다. 예를 들어, 항시적 생산은 두 번째 루시페라제, 예를 들어 레닐라 루시페라제 또는 반딧불이 루시페라제일 수 있다.
(iv)
조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질 또는 상업적으로 이용가능한 기질 예를 들어 Quanti-Luc Gold (InvivoGen), 또는 임의의 적합한 상업적으로 이용가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주에서 첫 번째 리포터 단백질의 활성을 결정하는(determining) 것,
(v)
코엘렌테라진(coelenterazine)의 부존재 하 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 하나를 포함하는 첫 번째 리포터 단백질의 활성을 효율적으로 억제하는 Dual-Glo 시스템 (Promega)으로부터 Stop & Glo 시약을 사용하여 동일한 샘플에서 리포터 유전자 루시페라제가 측정된 후 상기 세포주에서 두 번째 리포터 단백질의 활성을 결정하는(determining) 것.
(vi)
두 번째 루시페라제의 활성에 대해 정규화된 첫 번째 루시페라제의 활성은 그것의 전체가 여기에 참조로 포함된 US 2011/0189658에 서술되어 있다.
(vii)
추가의 바람직한(preferred) 구현예에서, 다른 기질들을 사용하여 듀얼-루시페라제 분석에 대해 제공하기 위해,
본 발명에 따른 세포들은 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결된 듀얼 또는 폴리-시스트론(cistronic) 구조물(construct)을 추가로 갖고, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 6에 제시된 자가-절단(self-cleaving) 2A 펩타이드 F2A의 코딩(coding) 서열에 의해 분리된 기질로 루시페린을 사용하는 임의의 다른 루시페라제 또는 반딧불이 루시페라제를 인코딩하는 두 번째 오픈 리딩 프레임을 포함하거나 또는 이로 구성된다
(viii)
조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질 또는 상업적으로 이용가능한 기질 예를 들어 Quanti-Luc Gold (InvivoGen), 또는 임의의 적합한 상업적으로 이용가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주에서 첫 번째 리포터 단백질의 활성을 결정하는(determining) 것,
(ix)
BrightGlo 시약(Promega), 또는 또다른 상업적으로 이용가능한 루시페린 기반 기질을 사용하여 동일한 샘플에서 리포터 유전자 루시페라제가 측정된(measured) 후 상기 세포주에서 두 번째 리포터 단백질의 활성을 결정하는(determining) 단계,
(x)
추가의 바람직한 구현예에서, 다른 기질들을 사용하여 트리(tri)-루시페라제 분석에 대해 제공하기 위해, 본 발명에 따른 세포들은 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임과 작동적으로(operationally) 연결된 다른 리간드-반응성 프로모터에 각각 작동가능하게(operably) 연결된 3개 구조물들(constructs)을 추가로 갖고, 여기서 상기 오픈 리딩 프레임은 기질로 코엘테라렌진(coelenterazine)을 사용하는 임의의 다른 루시페라제 또는 레닐라 루시페라제를 인코딩하는 세 번째 오픈 리딩 프레임과 함께 기질로 루시페린을 사용하는 임의의 다른 루시페라제 또는 반딧불이 루시페라제를 인코딩하는 두 번째 오픈 리딩 프레임 및 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 이로 구성된다. 대안적으로, 레닐라 루시퍼라제는 두 개의 리간드 반응성 루시페라제의 활성이 그것의 전체가 참조로 여기에 포함되는 US 2011/0189658에 서술된 항시적 프로모터의 제어 하 루시페라제의 활성에 대해 정규화되는 것이 가능하도록 항시적 프로모터에 작동적으로(operationally) 연결될 수 있다.
(xi)
첫 번째 리포터 단백질의 활성을 측정하는(determining) 것으로 여기서 상기 오픈 리딩 프레임은 그 조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질 또는 Quanti-Luc Gold (InvivoGen)과 같은 상업적으로 이용가능한 기질, 또는 또다른 상업적으로 이용가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주의 상등액(supernatant) 또는 배양 배지 내로 첫 번째 리포터 단백질의 효율적인 분비를 보장하는(ensures) 신호 펩타이드의 제어 하 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다,
(xii)
DualGlo 시약 (Promega)을 사용하여 세포 용해 후 상기 세포주에서 반딧불이 루시페라제와 같은 루시페린 기반 기질을 필요로 하는 두 번째 리포터 단백질의 활성을 측정하고(determining) 그 후 레닐라 루시페라제 활성의 정량화를 가능하게 하는 코엘렌테라진(coelenterazine) 기반 기질을 함유하고 반딧불이 루시페라제 활성을 켄치하는(quenches) 두 번째 요소(component) 및 첫 번째 요소가 기질이 반딧불이 루시페라제 활성의 정량화를 가능하게 하는 것을 가능하게 하는 루시페린-기반 기질인 상업적으로 이용가능한 두 개 요소 기질을 사용하여 또는 DualGlo 시약 (Promega)을 사용하여, 동일한 샘플에서 코엘레란테리즈(coeleranterize) 기반 기질을 필요로 하는 레닐라 루시페라제와 같은 세 번째 리포터 유전자의 활성이 측정되는(measured) 것.
(xiii)
추가의 선호되는 구현예에서, 세포들에 들어가는 프로테아제들에 의해 매개되는 세포 사멸(killing)의 검출을 위한 개선된 방법에 대해 제공하기 위해, Svar 루시페라제는 프로테아제 절단 부위에 의해 분리되는, 두 개의 서브유닛들, SL1-N-Ter 및 SL-1-C-Ter 로 재구성되고(reconstituted), 세포에 들어가는 프로테아제들에 의해 절단되고, 스플라이싱 동안 원형화되는 SEQ ID AA: 5를 인코딩하는 SEQ ID NO: 7에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되어, SL1의 재구성(reconstitution) 및 빛 방출을 야기하고 따라서 세포 사멸의 정량화된다.
(xiv)
추가의 선호되는 구현예에서, Ca2+ 플럭스에서 변화들 및 칼모듈린 의존성 세린-트레오닌 포스파타제 칼시뉴린과 같은, 이온 플럭스에서 변화들을 야기하고 세포 내 두 번째 메신저들의 활성화의 검출을 위한 개선된 방법에 대해 제공하기 위해, Svar 루시페라제가 두 개의 서브유닛들, SL1-N-Ter 및 SL-1-C-Ter로 재구성되고(reconstituted), 세포에 들어가는 프로테아제들에 의해 절단되고, 스플라이싱 동안 원화되는, SEQ ID AA: 5를 인코딩하는 SEQ ID NO: 7에 제시되는 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되고, SL1의 재구성(reconstitution) 및 빛 방출을 야기하여 따라서 세포 사멸의 정량화된다.
(xv)
두 개의 서브유닛들, SL1-N-Ter 및 SL-1-C-Ter로 스플릿(split)될 수 있고, SEQ ID AA: 5를 인코딩하는 SEQ ID NO: 7에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되고, 두 개 서브유닛들은 칼모듈린 의존적 세린-트레오닌 포스파타제 칼시뉴린과 같은 두 번째 메신저의 존재 하 재어닐링(reanneal)할 수 있고 따라서 Ca2+ 플럭스에서 변화들을 검출하는데 사용된다.
본 발명의 추가적인 측면은 약물 발견(drug discovery)에서 고 처리량 스크리닝을 위한 방법에 관한 것이고 상깅 방법은 다음 단계들을 포함한다:
(i)
스크리닝될 화합물들의 라이브러리로 구성된 테스트 샘플(들)을 제공하는 것,
(ii)
본 발명에 따른 세포주와 (i)의 상기 시험 샘플(들)을 접촉시키는 것이며, 상기 세포주는 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된 테스트 샘플(들)에 존재하는 약리 활성 분자(들)로 세포주의 처리에 반응하는, 이종 시스-작용 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 함유하고, 여기서 상기 프로모터는 SEQ ID NO: 1 and SEQ ID NO: 2에서 제시되는 서열들 하나를 포함하는 첫 번째 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결되어 있다. 바람직한 구현예에서 본 발명에 따른 세포주는 웰 플레이트들 또는 분석(assay) 플레이트들에 시딩(seeded)된다.
(iii)
라이브러리를 스크리닝하는 데 사용되는 제제(agent)(들)로 본 발명에 따른 세포주의 처리.
(iv)
바람직한 구현예에서, 분석의 정규화(normalization)에 대해 제공하기 위해, 본 발명에 따른 세포주는 리포터 유전자 구조물(construct)에 사용되는 것과 다른 루시페라제의 항시적(constitutive) 생산을 위한 구조물(construct)을 추가로 갖는다. 예를 들어, 항시적 생산은 두 번째 루시페라제, 예를 들어 레닐라 루시페라제 또는 반딧불이 루시페라제의 것일 수 있다.
(v)
코엘렌테라진(coelenterazine) 기반 기질 예를 들어 그 조성이 표 1에 보여지는 것 또는 상업적으로 이용가능한 기질 예를 들어 Quanti-Luc Gold (InvivoGen), 또는 또다른 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 기질을 사용하여 상기 세포주에서 첫 번째 리포터 단백질의 활성을 측정하는(determining) 것,
(vi)
리포터 유전자 루시페라제가 코엘렌테라진(coelenterazine)의 부존재 하 SEQ ID NO: AA1 및 SEQ ID NO: AA2에 제시된 서열들 하나를 포함하는 첫 번째 리포터 단백질의 활성을 효율적으로 억제하는 상업적으로 이용가능한 루시페린 기반 기질 또는 Bright Glo (Promega)을 사용하여 동일한 샘플에서 리포터 유전자 루시페라제가 측정된(measured) 후 상기 세포주에서 두 번째 리포터 단백질의 활성을 측정하는(determining) 단계.
(vii)
두 번째 루시페라제의 활성에 대해 정규화된(normalized) 첫 번째 루시페라제의 활성은 그것의 전체가 여기에 참조로 포함된 US 2011/0189658에 서술되어 있다.
본 발명의 추가적인 측면은 테스트 샘플에 존재하는 약리 활성 분자(들)에 대한 중화 항체들을 검출하고 선택적으로(optionally) 정량화하는(quantitating) 방법에 관한 것이며, 상기 방법은 다음 단계들을 포함한다
(i) 약리 활성 분자(들)을 포함하는 테스트 샘플을 제공하는 것
(ii) 첫 번째 및 두 번째 세포 샘플을 제공하는 것으로, 여기서 상기 세포들 샘플들은 본 발명에 다른 세포주를 포함하는 것,
(iii) 첫 번째 세포 샘플을 테스트 샘플과 그리고 다음에 약리 활성 분자와 접촉시키는 것,
(iv) 두 번째 세포 샘플을 약리 활성 분자와 접촉시키는 것,
(iv) 첫 번째 세포 샘플의 세포들에서 첫 번째 리포터 단백질의 활성을 결정하고(determining), 두 번째 세포 샘플의 세포들에서 첫 번째 리포터 단백질의 활성을 결정하는 것,
(v) 첫 번째 및 두 번째 세포 샘플에서 리포터 활성 사이의 비율을 제공하며(provide), 여기서 일보다 더 낮은 비율(첫 번째/두 번째)은 상기 샘플에서 약리 활성 분자에 대한 항체들의 존재를 나타낸다.
그 결과, 본 발명은 루시페라제 유전자들 및 상기 유전자들로 트랜스펙트된 세포주들을 제공하며, 본 발명의 여러가지 맥락에서 그것의 사용은 트랜스펙트된 세포들의 EC50이 상응하는 천연(native) 유전자 또는 유전자들로 트랜스펙트된 세포들과 비교하여 적어도 감소되도록, 더 높은 감도로 약리 활성 분자의 활성의 검출을 가능하게 한다. 유전자는 예를 들어 천연 Metridia longa 루시페라제 유전자일 수 있지만 그렇지 않으면 다른 및/또는 추가 유전자들을 포함할 수 있다. 감소는 예컨대 약 3-배와 같은, 예컨대 약 4-배와 같은, 예컨대 약 5-배와 같은, 예컨대 6-배와 같은, 예컨대 7-배와 같은, 예컨대 약 8-배와 같은, 예컨대 9-배와 같은, 예컨대 10-배와 같은, 예컨대 50-배와 같은, 약 100-배와 같은, 또는 약 1000-배와 같은, 약 2-배(fold)일 수 있다.
발명의 상세한 설명
본 발명의 구현예들을 서술함에 있어서, 명확성을 위해 특정 용어(terminology)가 사용될(resorted) 것이다. 그러나, 본 발명은 그렇게 선택된 특정 용어들(terms)에 제한되는 것으로 의도되지 않으며, 각각의 특정 용어는 유사하거나 또는 동일한 목적을 달성하기 위해 유사한 방식으로 작동하는(operate) 모든 기술적 등가물들을 포함하는 것으로 이해된다.
본 발명은 천연 단백질에 비해(relative) 개선된 특성들을 갖고 포유동물 세포들에서 발현을 위해 코돈-최적화되고 약리 활성 분자들의 활성의 정량화(quantification) 및 약리 활성 분자들에 대한 항체들의 검출/정량화(quantitating)를 위해 동일한 것을 사용하는 방법들을 위해 리포터 유전자로서 사용을 위해, 그리고 약물 발견(drug discovery)에서 고 처리량(high throughput) 스크리닝을 위해 최적의 특성을 보이는 루시페라제 단백질들을 인코딩하는, Metridia longa의 루시페라제 유전자로부터 유래된, 오픈 리딩 프레임들을 위하여, i.a. 제공한다.
특정 구현예에서, 본 발명은 SEQ ID NO: AA1에 제시된 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 SEQ ID NO: AA1에 제시된 서열에 예컨대 100% 서열 동일성과 같은, SEQ ID NO: AA1에 적어도 75%의 서열 동일성(sequence identity)을 갖는 아미노산 서열을 포함하거나 또는 이로 구성될 수 있는 오픈 리딩 프레임에 관한 것이다. 하나의 측면에서 뉴클레오타이드 서열은 SEQ ID NO: AA1에 제시된 서열과 동일한 아미노산 서열을 인코딩할 수 있다.
하나의 측면에서, SEQ ID NO: AA1은
MGVKVLFALICIAVAEAKRGKSPGKKLPLAVIMEIEANAFKAGCTRGCLICLSKIKCTAKMKVYIPGRCHDYGGDKKTGQAGIVGAIVDIPEISGFKEMEPMEQFIAQVDRCASCTTGCLKGLANVKCSELLKKWLPDRCASFADKIQKEVHNIKGMAGDR 일 수 있다.
하나의 측면에서, 본 발명은 SEQ ID NO: AA1에 제시된 아미노산 서열을 인코딩하는 SEQ ID NO: 1에 제시된 뉴클레오타이드 서열, 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: 1에 제시된 서열에 100% 서열 동일성과 같은, SEQ ID NO:1에 적어도 75%의 서열 동일성을 갖는 뉴클레오타이드 서열을 포함하거나 또는 이로 구성될 수 있는 오픈 리딩 프레임에 관한 것이다.
특정 구현예에서, 본 발명은 SEQ ID NO: AA2에 제시된 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: AA2에 제시된 서열에 100% 서열 동일성과 같은, SEQ ID NO: AA2에 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되는 오픈 리딩 프레임에 관한 것이다. 하나의 측면에서 뉴클레오타이드 서열은 SEQ ID NO: AA2에 제시된 서열과 동일한 아미노산 서열을 인코딩할 수 있다.
하나의 측면에서, SEQ ID NO: AA2는
MGVKVLFALICIAVAEAKRGKSPGKKLPLAVIMEIEANAFKAGCTRGCLICLSKIKCTAKMKVYIPGRCHDYGGDKKTGQAGIVGAIVDIPEISGFKEMEPMEQFVAQVDRCASCTTGCLKGLANVKCSELLKKWLPDRCASFADKIQKEVHNIKGMAGDR 일 수 있다.
하나의 측면에서, 본 발명은 SEQ ID NO: AA2에 제시된 아미노산 서열을 인코딩하는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열, 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: 2에 제시된 서열과 100% 서열 동일성과 같은, SEQ ID NO:2에 적어도 75%의 서열 동일성을 갖는 뉴클레오타이드 서열에 관한 것이다.
또다른 측면에서, 본 발명은 SEQ ID NO: AA1에 제시된 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열을 포함하거나 이로 구성될 수 있고 추가로 SEQ ID NO: AA2에 제시된 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열을 포함하거나 또는 이로 구성될 수 있는 오픈 리딩 프레임에 관한 것이다.
특정 측면에서, 본 발명은 SEQ ID NO: 1에 제시된 뉴클레오타이드 서열을 포함하거나 이로 구성될 수 있고 SEQ ID NO: AA1에 제시된 아미노산 서열을 인코딩할 수 있는 오픈 리딩 프레임에 관한 것이고, 그리고 오픈 리딩 프레임은 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 추가로 포함하거나 이로 구성될 수 있고 이는 SEQ ID NO: AA2에 제시된 아미노산 서열을 인코딩할 수 있다.
본 발명의 추가의 측면에서 SEQ ID NO: AA3은 MGVKVLFALICIAVAEAK, 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: AA3에 제시된 서열과 100% 서열 동일성과 같은, SEQ ID NO:AA3에 적어도 75%의 서열 동일성을 갖는 서열일 수 있다.
본 발명의 더욱더 추가의 측면에서 SEQ ID NO: AA4는 MEAEAERGKSPGKKLPLAVIMEIEANAFKAGCTRGCLICLSKIKCTAKMKVYIPGRCHDYGGDKKTGQAGIVGAIVDIPEISGFKEMEPMEQFIAQVDRCASCTTGCLKGLANVKCSELLKKWLPDRCASFADKIQKEVHNIKGMAGDRKIVAPVKQTLNFDLLKLAGDVESNPGPMEDAKNIKKGPAPFYPLEDGTAGEQLHKAMKRYALVPGTIAFTDAHIEVDITYAEYFEMSVRLAEAMKRYGLNTNHRIVVCSENSLQFFMPVLGALFIGVAVAPANDIYNERELLNSMGISQPTVVFVSKKGLQKILNVQKKLPIIQKIIIMDSKTDYQGFQSMYTFVTSHLPPGFNEYDFVPESFDRDKTIALIMNSSGSTGLPKGVALPHRTACVRFSHARDPIFGNQIIPDTAILSVVPFHHGFGMFTTLGYLICGFRVVLMYRFEEELFLRSLQDYKIQSALLVPTLFSFFAKSTLIDKYDLSNLHEIASGGAPLSKEVGEAVAKRFHLPGIRQGYGLTETTSAILITPEGDDKPGAVGKVVPFFEAKVVDLDTGKTLGVNQRGELCVRGPMIMSGYVNNPEATNALIDKDGWLHSGDIAYWDEDEHFFIVDRLKSLIKYKGYQVAPAELESILLQHPNIFDAGVAGLPDDDAGELPAAVVVLEHGKTMTEKEIVDYVASQVTTAKKLRGGVVFVDEVPKGLTGKLDARKIREILIKAKKGGKIAV*, 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: AA4에 제시된 서열과 100% 서열 동일성과 같은, SEQ ID NO:AA4에 적어도 75%의 서열 동일성을 갖는 서열일 수 있다.
하나의 측면에서, 본 발명은 아미노산 서열 MEAEAERGKSPGKKLPLAVIMEIEANAFKAGCTRGCLICLSKIKCTAKMKV YIPGRCHDYGGDKKTGQAGIVGAIVDIPEISGFKEMEPMEQFIAQVDR CASCTTGCLKGLANVKCSELLKKWLPDRCASFADKIQKEVHNIKGMAGDR
을 포함하거나 또는 이로 구성될 수 있는 SEQ ID NO: AA5, 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: AA5에 제시된 서열과 100% 서열 동일성과 같은 SEQ ID NO:AA5에 적어도 75%의 서열 동일성을 갖는 서열에 관한 것이다.
또 다른 측면에서, 본 발명은 세포 또는 세포주에 관한 것이다. 본 발명에 따른 세포 또는 세포주, 여기서 상기 세포는 본 발명에 따른 적어도 하나의 아미노산을 인코딩하는 다운-스트림 오픈 리딩 프레임에 작동가능하게(operably) 연결된 프로모터를 포함하는 폴리뉴클레오타이드를 포함할 수 있다.
세포 또는 세포주는 SEQ ID NO: AA1에 제시된 아미노산 서열 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: AA1에 제시된 서열과 100% 서열 동일성과 같은, SEQ ID NO: AA1에 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열을 포함하거나 또는 이로 구성될 수 있는 오픈 리딩 프레임을 포함할 수 있다. 하나의 측면에서 뉴클레오타이드 서열은 SEQ ID NO: AA1에 제시된 서열과 동일한 아미노산 서열을 인코딩할 수 있다.
또다른 측면에서, 본 발명에 따른 세포 또는 세포주는 SEQ ID NO: AA2에 제시된 아미노산 서열 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: AA2에 제시된 서열과 100% 서열 동일성과 같은 SEQ ID NO: AA2에 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되는 오픈 리딩 프레임을 포함할 수 있다. 하나의 측면에서, 뉴클레오타이드 서열은 SEQ ID NO: AA2에 제시된 서열과 동일한 아미노산 서열을 인코딩할 수 있다.
또다른 측면에서, 세포 또는 세포주는 SEQ ID NO: AA1에 제시된 아미노산 서열 또는 SEQ ID NO: AA1에 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열을 포함하거나 또는 이로 구성될 수 있는 오픈 리딩 프레임, 및 SEQ ID NO: AA2에 제시된 아미노산 서열 또는 SEQ ID NO: AA2에 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 인코딩할 수 있는 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되는 오픈 리딩 프레임을 포함할 수 있다. 하나의 비-제한적 예에서, 세포 또는 세포주는 SEQ ID NO: AA1을 인코딩하는 SEQ ID NO:1, 및 SEQ ID NO: AA2를 인코딩하는 SEQ ID NO:2를 포함할 수 있다.
본 발명은 또한 SEQ ID NO: 3-7 중 하나 이상, 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: 3-7에 제시된 서열과 100% 서열 동일성과 같은 SEQ ID NO: 3-7에 적어도 75%의 서열 동일성을 갖는 임의의 그러한 서열에 관한 것이다.
또다른 측면에서, 본 발명은 SEQ ID NO:6에 제시된 뉴클레오타이드 서열, 또는 예컨대 적어도 80% 서열 동일성과 같은, 예컨대 적어도 85% 서열 동일성과 같은, 예컨대 적어도 90% 서열 동일성과 같은, 예컨대 적어도 95% 서열 동일성과 같은, 예컨대 적어도 96% 서열 동일성과 같은, 예컨대 적어도 97% 서열 동일성과 같은, 예컨대 적어도 98% 서열 동일성과 같은, 예컨대 적어도 99% 서열 동일성과 같은, 또는 예컨대 SEQ ID NO: 6에 제시된 서열과 100% 서열 동일성과 같은 SEQ ID NO: 6에 적어도 75%의 서열 동일성을 갖는 임의의 그러한 서열을 포함하거나 또는 이로 구성될 수 있는 오픈 리딩 프레임을 추가로 포함하거나 또는 이로 구성될 수 있는 세포 또는 세포주에 관한 것이다. 따라서 본 발명에 따른 세포 또는 세포주는 SEQ ID NO:1 또는 2 중 하나를 포함할 수 있거나, 또는 SEQ ID NO:1 또는 2의 둘다를 포함할 수 있고, 그리고 추가로(additionally) SEQ ID NO: 6을 포함할 수 있다.
추가의 측면에서, 본 발명은 SEQ ID NO:1-4에 제시된 뉴클레오타이드 서열 중 적어도 하나 이상을 포함하거나 또는 이로 구성될 수 있는 오픈 리딩 프레임을 포함하거나 또는 이로 구성될 수 있는 세포 또는 세포주에 관한 것이다.
하나의 측면에서, 본 발명은 SEQ ID NO:1에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성될 수 있고 SEQ ID: 3-4 중 하나 이상을 추가로 포함할 수 있는 오픈 리딩 프레임을 포함하거나 또는 이로 구성될 수 있는 세포 또는 세포주에 관한 것이고, 여기서 전체(entire) 수집된(collected) 서열은 SEQ ID NO.: 5로 나타낼(denoted) 수 있다.
또 다른 측면에서, 본 발명은 SEQ ID NO:2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성될 수 있고 그리고 SEQ ID: 3-4 중 하나 이상을 추가로 포함할 수 있는 오픈 리딩 프레임을 포함하거나 이로 구성될 수 있는 세포 또는 세포주에 관한 것이다.
하나의 측면에서, 본 발명은 임의의 진단 방법에서 아미노산 서열, 또는 본 발명의 아미노산 서열들 중 어느 하나를 인코딩할 수 있는 폴리뉴클레오타이드, 또는 세포 또는 세포주의 용도(use)에 관한 것이다.
하나의 측면에서, 본 발명은 생물학적 샘플에서 중화 항체들(neutralizing antibodies)의 존재를 결정하기 위한 아미노산 서열, 또는 본 발명의 아미노산들 서열들 중 어느 하나를 인코딩할 수 있는 폴리뉴클레오타이드, 또는 세포 또는 세포주의 용도에 관한 것이다.
또다른 측면에서, 본 발명은 아미노산 서열, 또는 본 발명의 아미노산들 서열들 중 어느 하나를 인코딩할 수 있는 폴리뉴클레오타이드, 또는 예를 들어, 약물들 또는 약물 후보들의 스크리닝에서 용도와 같은, 약물 발견(drug discovery)에서 세포 또는 세포주의 용도에 관한 것이다. 특정 측면에서, 스크리닝은 고 처리량(high through-put) 스크리닝과 관련될 수 있다.
따라서, 본 발명은 또한 테스트 샘플에서 약리 활성 분자의 활성을 검출하고(detecting) 선택적으로(optionally) 정량화하는 방법에 관한 것이다. 하나의 측면에서, 상기 방법은 다음 단계들을 포함할 수 있다;
(ⅰ) 테스트 샘플을 제공하는 것,
(ⅱ) 본 발명에 따른 세포주와 상기 테스트 샘플을 접촉시키는 것으로, 상기 세포주는 이종 시스-작용(cis-acting) 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 함유하고, 이는 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된, 테스트 샘플에 존재하는 약리 활성 분자(들)로 세포주의 처리에 반응하고, 여기서 상기 프로모터는 첫 번째 리포터 단백질을 인코딩하는 SEQ ID NO: 2 및 SEQ ID NO: 1에 제시된 서열들 중 하나를 포함하는 오픈 리딩 프레임에 작동가능하게(operably) 연결되는 것,
(ⅲ) 선택적으로, (ii)에서 약리 활성 분자에 반응하는 리포터 유전자 구성물(construct)에 사용된 것과 다른 루시페라제의 항시적(constitutive) 생산을 위한 구성물(construct)을 추가로 갖는 본 발명에 따른 세포주들을 사용하여(employing), 분석의 정규화(normalization)를 제공하는 것. 하나의 측면에서, 항시적(constitutive) 생산은 (ii)의 리포터 단백질과 다른 두 번째 루시페라제의 것일 수 있고, 원칙적으로 임의의 적합한 리포터 단백질일 수 있고, 그리고 예를 들어 레닐라 루시페라제 또는 반딧불이 루시페라제일 수 있다.
(ⅳ) 조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질 또는 상업적으로 이용가능한 기질 예를 들어 Quanti-Luc Gold (InvivoGen), 또는 또다른 상업적으로 이용가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주에서 ((ii)에서) 첫 번째 리포터 단백질의 활성을 결정하는 것.
(ⅴ) 코엘렌테라진(coelenterazine)의 부존재에서 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 하나에 의해 인코딩되는 첫 번째 리포터 단백질의 활성을 효율적으로 억제하고, 레닐라 루시페라제 활성의 그 다음의 정량화를 가능하게 하는 코엘렌테라진 기반 기질을 함유하고 반딧불이 루시페라제 활성을 켄치하는(quenches) 듀얼 루시페라제 버퍼의 두 번째 요소를 포함하는 검출 시스템, 또는 Dual-Glo 시스템 (Promega)로부터 Stop & Glo 시약을 사용하여 동일한 샘플에서 리포터 유전자 루시페라제가 측정된 후 상기 세포주에서 ((iii)에서) 두 번째 리포터 단백질의 활성을 결정하는 것.
(ⅵ) 두 번째 루시페라제의 활성에 대해(relative) 정규화된(normalized) 첫 번째 루시페라제의 활성은 US 2011/0189658에 서술되어 있고 그것의 전체가 참고로 여기에 포함된다.
추가의 바람직한(preferred) 구현예에서, 상이한(different) 기질들을 사용하여 듀얼-루시페라제 분석을 제공하기 위해, 본 발명에 따른 세포들은 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결된 듀얼 또는 폴리-시스트론 구조물(construct)을 추가로 가질 수 있으며, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열 및 SEQ ID NO: 6에 제시된 자가-절단 2A 펩타이드 F2A의 코딩 서열에 의해 분리되는 기질로서 루시페린을 사용하는 임의의 다른 루시페라제 또는 반딧불이 루시페라제를 인코딩하는 두 번째 오픈 리딩 프레임을 포함하거나 또는 이로 구성된다.
본 발명에 따른 방법은 또한 대안적으로 다음 단계들을 포함할 수 있다:
(ⅶ) 조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질 또는 상업적으로 이용가능한 기질 예를 들어 Quanti-Luc Gold (InvivoGen), 또는 또다른 상업적으로 이용가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주에서 첫 번째 리포터 단백질의 활성을 결정하는 것.
(ⅷ) BrightGlo 시약 (Promega), 또는 상업적으로 이용가능한 루시페린 기반 기질을 사용하여 동일한 샘플에서 리포터 유전자 루시페라제가 측정된 후 상기 세포주에서 두 번째 리포터 단백질의 활성을 결정하는 것.
추가로 바람직한 구현예에서, 상이한 기질들을 사용하여 트리(tri)-루시페라제 분석을 제공하기 위해, 본 발명에 따른 세포들은 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임과 작동적으로(operationally) 연결된 상이한 리간드-반응성 프로모터에 각각 작동가능하게(operably) 연결된 3 구조물들(constructs)을 추가로 갖고, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열 및 기질로 코엘렌테라진(coelenterazine)을 사용하는 임의의 다른 루시페라제 또는 레닐라 루시페라제를 인코딩하는 세 번째 오픈 리딩 프레임과 함께 기질로 루시페린을 사용하는 임의의 다른 루시페라제 또는 반딧불이 루시페라제를 인코딩하는 두 번째 오픈 리딩 프레임을 포함하거나 또는 이로 구성된다. 대안적으로, 레닐라 루시퍼라제는 그것의 전체가 참고로 여기에 포함되는 US 2011/0189658 에 서술된 항시적(constitutive) 프로모터의 제어 하 두 개의 리간드 반응성 루시페라제의 활성이 루시페라제의 활성에 대해(relative) 정규화되는 것을 가능하게 하기 위해 항시적(constitutive) 프로모터에 작동적으로(operationally) 연결될 수 있다.
본 발명에 따른 방법은 대안적으로 다음 단계들을 포함할 수 있다;
(ⅸ) 첫 번째 리포터 단백질의 활성을 결정하는 것이며, 여기서 상기 오픈 리딩 프레임은 그 조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질 또는 상업적으로 이용가능한 기질 예를 들어 Quanti-Luc Gold (InvivoGen), 또는 또다른 상업적으로 이용가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주의 상청액 또는 배양 배지 내로 첫 번째 리포터 단백질의 효율적인 분비를 보장하는(ensures) 시그널 펩타이드의 제어 하 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다.
(ⅹ) DualGlo 시약 (Promega)을 사용하여, 그 첫 번째 요소가 반딧불이 루시페라제 활성의 정량화를 가능하게 하는 기질을 가능하게 하는 루시페린-기반 기질이고 반딧불이 루시페라제 활성을 켄치(quenches)하고 레닐라 루시페라제 활성의 정량화를 가능하게 하는 코엘렌테라진(coelenterazine) 기반 기질을 함유하는 두 번째 요소인 상업적으로 이용가능한 두 요소 기질을 사용하여, 세포 용해 후 상기 세포주에서 반딧불이 루시페라제와 같은 루시페린 기반 기질을 필요로 하는 두 번째 리포터 단백질의 활성을 결정하는 것이며, 그후 코엘레란테리즈(coeleranterize) 기반 기질을 필요로 하는 레닐라 루시페라제와 같은 세 번째 리포터 유전자의 활성이 DualGlo 시약 (Promega), 또는 또다른 상업적으로 이용가능한 등가물(equivalent)을 사용하여 동일한 샘플에서 측정된다.
위에서 언급한 바와 같이, 본 발명은 또한 약물 발견에서 고 처리량 스크리닝을 위한 방법에 관한 것이고 상기 방법은 다음 단계들을 포함한다
(ⅰ) 스크리닝될 화합물들의 라이브러리로 구성된 테스트 샘플(들) 제공하는 것
(ⅱ) 본 발명에 따른 세포주와 상기 테스트 샘플(들)을 접촉시키는 것, 상기 세포주는 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된 테스트 샘플(들)에 존재하는 약리 활성 분자(들)로 세포주의 처리에 반응하는, 이종 시스-작용(cis-acting) 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 함유하고, 여기서 상기 프로모터는 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 하나를 포함하는 첫 번째 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결된다. 하나의 측면에서, 본 발명에 따른 세포주는 96, 384 또는 1536 웰 플레이트들 분석 플레이트들에서 접종될(seeded) 수 있다.
(ⅲ) 라이브러리를 스크리닝((screen))하는 데 사용되는 약물 후보들 또는 제제(들)로 본 발명에 따른 세포주의 처리.
(ⅳ) 선택적으로, 분석의 정규화(normalization)를 제공하기 위해, 본 발명에 따른 세포주들은 리포터 유전자 구조물(construct)에 사용된 것과 다르고 따라서 SEQ ID NO:1 또는 SEQ ID NO:2에 의해 인코딩되는 리포터 단백질들과 다른 루시페라제의 항시적(constitutive) 생산을 위한 구조물(construct)을 추가로 갖는다. 예를 들어, 항시적(constitutive) 생산은 두 번째 루시페라제, 예를 들어 레닐라 루시페라제 또는 반딧불이 루시페라제의 것일 수 있다.
(ⅴ) 조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질 또는 상업적으로 이용 가능한 기질 예를 들어 Quanti-Luc Gold (InvivoGen), 또는 또다른 상업적으로 이용 가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주에서 첫 번째 리포터 단백질의 활성을 결정하는 것.
(ⅵ) 코엘렌테라진(coelenterazine)의 부존재에서 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 하나를 포함하는 첫 번?? 리포터 단백질의 활성을 효율적으로 억제하는 또다른 상업적으로 이용가능한 루시페린 기반 기질 또는 Bright Glo (Promega)을 사용하여 동일한 샘플에서 리포터 유전자 루시페라제가 측정된 후 상기 세포주에서 두 번?? 리포터 단백질의 활성을 결정하는 것.
(ⅶ) 그것의 전체가 참고로 여기에 포함되는 US 2011/0189658에 서술되는 두 번째 루시페라제의 활성에 대해(relative) 정규화된(normalized) 첫 번째 루시페라제의 활성을 결정하는 것.
본 발명의 추가의 측면은 테스트 샘플에 존재하는 약리 활성 분자(들)에 대한 중화 항체들을 검출하고 선택적으로(optionally) 정량화하는(quantitating) 방법에 관한 것이다.
본 발명에 따른 방법은 다음 단계들을 포함할 수 있다;
(i) 약리 활성 분자(들)을 포함하는 테스트 샘플을 제공하는 것,
(ii) 첫 번째 및 두 번째 세포 샘플을 제공하는 것으로, 여기서 상기 세포들 샘플들은 본 발명에 따른 세포주를 포함하는 것
(iii) (ii)에서 첫 번째 세포 샘플을 ((i)에서) 테스트 샘플과 그리고 그 다음 약리 활성 분자와 접촉시키는 것,
(iv) 두 번째 세포 샘플을 약리 활성 분자(pharmacology active molecule)와 접촉시키는 것,
(iv) 첫 번째 세포 샘플의 세포들에서 첫 번째 리포터 단백질의 활성을 결정하고, 두 번째 세포 샘플의 세포들에서 첫 번째 리포터 단백질의 활성을 결정하는 것,
(v) 첫 번째 및 두 번째 세포 샘플에서 리포터 활성 사이의 비율을 제공하고(provide), 여기서 일보다 더 낮은 비율 (첫 번째/두 번째)은 상기 샘플에 약리 활성 분자에 대한 항체들의 존재를 나타낸다.
정의들
벡터
용어 "벡터(vector)" 또는 벡터 구조물(vector construct)"은 숙주 세포 내로 재조합 유전 물질을 전달하기(transfer) 위한 비히클로 사용되는 DNA 분자를 나타낸다. 벡터의 네 가지 주요 타입들은 플라스미드들, 박테리오파지들 및 다른 바이러스들, 코스미드들, 및 인공 염색체들(chromosomes)이다. 벡터 자체는 일반적으로 삽입물(insert)(이종 핵산 서열, 이식유전자(transgene)) 및 벡터의 "백본(backbone)" 역할을 하는 더 큰 서열로 구성된 DNA 서열이다. 유전정보를 숙주에게 전달(transfers)하는 벡터의 목적은 일반적으로 표적(target) 세포에서 삽입물을 분리, 증식(multiply) 또는 발현하는 것이다. 발현 벡터들(발현 구조물들(expression constructs))로 불리는 벡터들은 표적 세포에서 이종 서열들의 발현을 위해 특이적으로(specifically) 개조되고(adapted), 그리고 일반적으로 이종 서열들의 발현을 이끄는(drives) 프로모터 서열을 갖는다. 본 발명의 구현예들에 사용되는 벡터의 선택은 폴리펩타이드들 또는 폴리뉴클레오타이드를 인코딩하는 벡터의 특정 적용에 따른다.
작동적으로 연결된(Operatively linked)
용어 "작동적으로 연결된(operatively linked)"은 유전자 또는 오픈 리딩 프레임과 같은 기능적 단위의 일부인 구성요소들(elements)의 커넥션(connection)을 나타낸다. 따라서, 프로모터를 폴리펩타이드를 인코딩하는 핵산 서열(오픈 리딩 프레임, ORF)에 작동적으로(operatively) 연결함으로써, 두 구성요소들은 유전자 - 기능적 단위의 일부가 된다. 핵산 서열로 발현 제어 서열(프로모터)의 연결은 프로모터에 의해 지시되는(directed) 핵산 서열의 전사(transcription)를 가능하게 한다. 폴리펩타이드를 인코딩하는 두 개의 이종 핵산 서열들을 작동적으로(operatively) 연결함으로써 서열들은 이종 핵산 서열들에 의해 인코딩되는 아미노산 서열들을 포함하는 융합 단백질을 인코딩하는 오픈 리딩 프레임 - 기능적 단위의 일부가 된다. 두 개의 아미노산들 서열들을 작동적으로(operatively) 연결함으로써, 서열들은 폴리펩타이드 - 동일한 기능 단위의 일부가 된다. 두 개의 이종 아미노산 서열들을 작동적으로(Operatively) 연결하는 것은 하이브리드(융합) 폴리펩타이드를 생성한다(generates).
최소 항시적 프로모터(Minimal constitutive promoter)
리포터 유전자의 발현을 지시하는 프로모터는 일반적으로 본 발명의 리포터 세포주를 확립하는데 사용되는 포유동물 숙주 세포에서 최소한으로(minimally) 항시적으로(constitutively) 활성이며, 단독으로는 약리 활성 분자로 세포들의 처리에 반응하지 않는다. 유용한 항시적으로(constitutively) 활성인(active) 프로모터들은 사이토메갈로바이러스(cytomegalovirus) (CMV) 초기(early) 인핸서/프로모터, SV40 프로모터, UBC 프로모터, PGK 프로모터, 인간 β-액틴 (hACTB), 인간 신장 인자-1α (human elongation factor-1α) (hEF-1α), 티미딘 키나제 (Thymidine Kinase) (TK) 프로모터 및 사이토메갈로바이러스 초기 인핸서/닭 β-actin (CAG) 프로모터들을 포함한다.
본 발명의 구현예를 서술할 때, 가능한 모든 구현예들의 조합들 및 순열들(permutations)은 명시적으로(explicitly) 설명되지 않았다. 그럼에도 불구하고, 특정 방안들(measures)이 서로(mutually) 다른 종속항들에 인용되거나(recited) 다른 구현예들에 서술되어 있다는 단순한 사실이 이들 방안들(measures)의 조합들이 유리하게 사용될 수 없다는 것을 나타내지 않는다. 본 발명은 서술된 구현예들의 모든 가능한 조합들 및 순열들을 예상한다(envisages).
여기에서 용어들 "포함하는(comprising)", "포함한다(comprise)" 및 "포함한다(comprises)"는 선택적으로 모든 경우들에서, 각각, 용어들 "구성되는(consisting of)", "구성한다(consist of)" 및 "구성한다(consist of)"로 대체될 수 있도록(substitutable) 의도된다. 본 발명은 본 발명의 상세한 설명에 대한 참조로 더욱 완전히 이해될 것이다. 그러나 이것은 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다. 모든 문헌 인용들은 그것들의 전체가 참조로 여기에 포함된다.
용어 "SEQ ID NO: X"는 DNA 또는 폴리뉴클레오타이드 서열 번호 X를 의미하는 것으로 의도된다. 본 발명에 따라 정의는 예를 들어 SEQ ID NO:1-7 중 어느 하나를 나타낼 수 있다.
용어 "SEQ ID NO: AAX"는 펩타이드 또는 아미노산 서열 번호 X를 의미하는 것으로 의도된다. 본 발명에 따라 정의는 예를 들어 SEQ ID NO: AA1-5 중 어느 하나를 나타낼 수 있다.
실시예들
다음에서, 본 발명은 비-제한적인 실시예들에 의해 추가로 설명된다(illustrated).
약물 발견에서 고 처리량(high throughput) 스크리닝을 위하여 그리고 약리 활성 분자들의 활성의 정량화를 위하여 리포터 유전자로 사용을 위한 최적의 특성들을 보이는 루시페라제 단백질을 개발하기 위하여, 특히 루시페라제가 다른 단백질들 또는 다른 분자들과 융합 단백질로서 발현될 때 포유동물 세포들에서의 발현을 용이하게 하기 위해 유전자가 가능한 한 작은 것이 바람직하다. 천연(native) Metridia longa 루시페라제 유전자의 5' 코딩 영역의 일련의 결실 돌연변이체들이 in silic로 설계되었고, 인 비트로(in vitro)로 합성되었고, 일시적(transient) 트랜스펙션 실험들에서 테스트되었다. 천연 Metridia longa 유전자 루시페라제 유전자의 뉴클레오타이드 서열은 도 1에, 그리고 아미노산 서열은 도 2에 보여진다(illustrated). 천연 Metridia longa 루시페라제 유전자의 5' 번역 영역에서 개시 코돈(AUG)로부터 아미노산 1 내지 아미노산 76을 포함하는 결실 돌연변이체(mutant) (도 1)이 천연 단백질의 그것과 유사한(comparable) 활성을 보이는 것으로 발견되었지만 (도 3) 천연 Metridia longa 단백질에 대한 23.8 kDa의 분자량과 비교하여 SVAR Luc-1 단백질의 분자량이 17.3 kDa인 것을 고려하면 76 아미노산들에 의한 루시페라제 단백질의 크기를 감소시키는 것은 6.5 kDa의 분자량에서 감소에 상당한다(equivalent). 분비 효율을 증가시키고, 그리고 따라서 생물발광의 배경 수준들을 감소시키고 연속적(serial) 샘플링을 가능하게 하기 위해, 현재까지 서술된 (Stern, B., et al, 2007) 가장 효율적인 시그널 펩타이드로 보여진 칼라노이드(calanoid) 요각류(copepod) Gaussia로부터의 루시페라제 유전자의 시그널 펩타이드가 시그널 펩타이드(도 2)의 17 아미노산들을 인코딩하는 Metridia longa 루시페라제 유전자 (도 1)의 천연 시그널 펩타이드 (nt. 1 내지 nt. 51)로 치환되었다(substituted). 약리 활성 분자로 세포들의 처리에 반응하여, 따라서 약리 활성 분자로 처리되지 않은 대조군 세포들에 비해(relative) 시그널을 증가시키는 리포터 유전자 구조물(construct)로 트랜스펙트된 세포들에서 배경 수준들을 감소시키고 분비의 효율을 향상시키기 위해 Metridia longa 루시페라제 유전자의 천연 시그널 펩타이드가 결실되었고 Gaussia 루시페라제를 인코딩하는 유전자러부터 코돈 최적화된 시그널 펩타이드로 대체되었다(replaced).
단일 또는 다중(multiple) 돌연변이들을 갖는(carrying) 올리고뉴클레오타이드들을 사용하여 일련의 무작위(random) 돌연변이가 천연 Metridia longa 루시페라제 유전자의 코딩 서열 내에 도입되었다(도 4). 올리고뉴클레오타이드들이 인 비트로에서 합성되었고, 조직 배양에서 성장한 인간 배아 신장 세포들로부터 원래 유래된 인간 HEK293 세포주에서 일시적 트랜스펙션 실험들에서 테스트되었다 (ATCC Catalogue CRL-1573). 천연 Metridia longa 루시페라제 유전자의 코딩 서열에 도입된 특정 돌연변이들은 개별적으로 그리고 함께 둘다 다음 특성들 중 적어도 하나에서 천연 유전자에 의해 인코딩된 그것보다 우수한 루시페라제 단백질을 인코딩하는 것으로 밝혀졌다; 증가된 광 아웃풋(밝기), 향상된 시그널 안정성 및/또는 높은 상대 광 단위 (relative light units) (RLU)에 의해 반영되는 시그널 지속 시간(duration), 및 약리 활성 물질의 부존재에서 대조군 샘플들에 비해 증가된 동적(dynamic) 범위를 포함하는 향상된 발광(luminescence). 도 5에 보이는 대로 첫 번째 추정(putative) 촉매적(catalytic) 도메인 (Markova, SV., et al., 2004)에서, 위치들 66 및 105에서 각각 세린 (S) 및 이소류신 (I)으로 메티오닌을 인코딩하는 뉴클레오타이드들의 돌연변이가 인젝터들(injectors)이 장착된 루미노미터의 필요성을 제거하고(obviating) "glo" 기질의 사용을 가능하게 하는 빛 방출을 안정화시키는 것으로 발견되었다.
천연 Metridia longa 루시페라제 유전자에 의해 인코딩된 아미노산 서열의 추정(putative) 두 번째 촉매적 도메인(Markova, SV., et al., 2004)에서 위치 100에서 알라닌(alanine) (A)의 글루탐산(glutamic acid) (E)으로 돌연변이는 증가된 광 아웃풋(밝기), 증가된 시그널 안정성 및/또는 아미노산 서열에서만 위치들 22 및 35에서 돌연변이들을 인코딩하는 유전자 또는 천연 유전자에 의해 나타나는 것보다 더 높은 상대 광 단위(relative light units)(RLU)에 의해 반영되는 시그널 지속 시간(duration) (도 5). 및 천연 Metridia longa 루시페라제 유전자에 의해 나타나는 그것보다 약리 활성 물질의 부존재에서 대조군 샘플들에 비해 더 높은 동적 범위(도 3B)를 포함하는 증가된 발광을 보이는 (SEQ ID NO: AA1에 따른 SVAR Luc-1 및 SEQ ID NO: AA2에 따른 SVAR Luc-2) 루시페라제 단백질들을 인코딩하는 것으로 발견되었다.
첫 번째 추정 촉매적 도메인에서 아미노산 서열에서 위치 106에서 이소류신(I)의 발린(V)으로 돌연변이가 SVAR Luc-1 루시페라제 (뉴클레오타이드 SEQ ID NO: 1 및 아미노 서열 SEQ ID NO: AA1)에 비해 등가의(equivalent) 또는 약간 감소된 활성 및 5' 번역 영역에서 177 뉴클레오타이드 결실과 Metridia longa 루시페라제 유전자에 의해 인코딩되는 루시페라제 또는 천연 Metridia longa 루시페라제에 비해 개선된 활성을 보인 루시페라제 단백질 SVAR Luc-2 (뉴클레오타이드 SEQ ID NO: 2 및 아미노산 SEQ ID NO: AA2)를 야기하는 것으로 발견되었다.
위치들 141 및 142에서 아미노산들 알라닌(A) 및 세린(S)을 아미노산들 티로신(T) 및 글리신(G)으로 각각 인코딩하는 천연 Metridia longa 루시페라제 유전자의 코딩 서열에서 서열 nt 423 내지 nt 435의 돌연변이가 감소된 광 아웃풋 (밝기), 감소된 시그널 안정성 및/또는 천연 유전자에 의해 보이는 그것보다 더 낮은 상대 광 단위 (relative light units) (RLU)에 의해 반영되는 시그널 지속 시간, 및 천연 Metridia longa 루시페라제 유전자, Svar 루시페라제 1 또는 Svar 루시페라제 2에 의해 보이는 그것보다 약리 활성 물질의 부존재에서 대조군 샘플들에 비해 더 낮은 동적 범위를 포함하는 감소된 발광성을 보이는 루시페라제 단백질 (SVAR Luc-3)을 인코딩하는 것으로 발견되었다(도 3). 유사하게, 천연 Metridia longa 루시페라제 유전자에 의해 인코딩되는 아미노산 서열에서 각각 위치 144에서 알라닌(A) 및 위치 145에서 메티오닌을 인코딩하는 nt 432 및 nt 433의 돌연변이가 감소된 광 아웃풋 (밝기), 감소된 시그널 안정성 및/또는 천연 Metridia longa 루시페라제 유전자, Svar 루시페라제 Luc-1 또는 Svar 루시페라제 Luc-2에 의해 보이는 그것보다 더 낮은 상대 광 단위 (RLU)에 의해 반사되는 시그널 지속 시간(duration)를 포함하는 감소된 발광을 보이는 루시페라제 단백질 (SVAR Luc-4)을 인코딩하는 것으로 발견되었다 (도 3B). 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 QuantiLuc Gold (Invivogen)을 사용하여 루시페라제 활성의 정량화 전 37 ℃에서 18 시간 동안 인간 HEK293 세포들에서 일시적(transient) 트랜스펙션 실험들에서 테스트된 강한 항시적(constitutive) CMV 프로모터의 제어 하 Svar 루시페라제들 1 및 Svar 루시페라제들 2 둘다가 야생형 Metridia longa 루시페라제에 의해 보여지는 그것보다 증가된 시그널 안정성 및/또는 시그널 지속 시간을 보였다(도 6). Svar 루시페라제들 1 및 Svar 루시페라제들 2는 또한 둘다 천연 Metridia longa 유전자, 또는 유전자의 5' 번역 영역에서 아미노산들 1 내지 76의 결실을 갖는 Metridia longa 유전자, 또는 SVAR 루시페라제 3, 또는 레닐라 루시페라제, Nano 루시페라제, 또는 Gaussia 루시페라제에 의해 보이는 더 높은 상대 광 단위 (relative light units) (RLU)에 의해 반영되는, 증가된 광 아웃풋 (밝기)를 보였다 (도 3A). 37 ℃에서 6 시간 동안 100 ng/ml 의 TNFα로 처리되거나 또는 그렇지 않고 표준(canonical) NFkB 인식 서열의 6-배(fold) 탠덤 반복(repeat) 및 SV40 최소 프로모터로 구성되는 키메라 프로모터의 제어 하 야생형 Metridia longa 루시페라제 유전자, Svar 루시페라제 1 또는 Svar 루시페라제 2로 각각 트랜스펙트된 HEK293 세포들에서 일시적(transient) 트랜스펙션의 결과들은 SVAR 루시페라제 유전자들 둘다 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 QuantiLuc Plus (Invivogen)를 사용하여 더 높은 상대 광 단위(RLU)에 의해 반영된 대로 같이 야생형 유전자에 비해 향상된 루시페라제 활성을 보였다는 것을 보여주었다 (도 3B).
HEK293 세포들은 표준(canonical) NFkB 인식 서열의 6-배(fold) 탠덤 반복 및 SV40 최소 프로모터로 구성되는 키메라 프로모터의 제어 하 Svar 루시페라제 Luc-1 유전자로 트랜스펙트되었고 안정적인(stable) 클론들이 단리되었고(isolated) 그리고 특성화되었다(characterized). 37 ℃에서 6 시간 동안 TNFα를 증가시키면서 하나의 이러한 클론 세포주의 처리 또는 그렇지 않은 것은 상업적으로 이용가능한 코엘렌테라진 (coelenterazine) 기반 "glo" 기질 QuantiLuc Gold (Invivogen)을 사용하여 TNFα (도 7)로 처리되지 않은 대조군 샘플에 비해 배수 유도(fold induction) 및 상대 광 단위 (relative light units) (RLU) 둘다의 높은 수준들을 야기하였다.
만성 골수성 백혈병 (myelogenous leukemia) (ATCC, 카탈로그 번호 CCL-243)로부터 원래 유래된 K562 세포들이 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복 및 SV40 최소 프로모터로 구성되는 키메라 프로모터의 제어 하 각각 Svar 루시페라제 Luc-1 유전자 또는 반딧불이 루시페라제 유전자로 트랜스펙트되었다. 안정적인 클론들이 단리되었고 특성화되었다. 클론 세포주들이 37 ℃에서 6 시간 동안 증가하는 농도들의 TNFα로 처리되었다(도 8). SVAR Luc-1 유전자로 안정적으로 트랜스펙트된 세포들은 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 "glo" 기질 QuantiLuc Gold (Invivogen)을 사용하여 루시페라제 활성의 정량화 후 동일한 NFkB 반응성 프로모터의 제어 하 반딧불이 루시페라제 유전자로 안정적으로 트랜스펙트된 세포들보다 현저히 더 높은 상대 광 단위(RLU) 값들을 보였다 (도 8).
SVAR Luc-1 루시페라제는 작은 크기, 밝기, 및 트랜스펙트된 포유동물 세포들에 대한 독성의 부존재를 포함하는 문헌에 보고된 다른 천연 또는 조작된(engineered) 루시페라제들에 비해 몇몇 개선된 특성들을 나타낸다(표 2).
약물 발견에서 고 처리량 스크리닝을 위해, 그리고 약리 활성 분자들의 활성의 정량화를 위해, SEQ ID NO: 1 및 SEQ ID NO: 2에서 제시된 뉴클레오타이드 서열들을 포함하나, 이에 제한되지 않는, 리포터 유전자로서 Svar Luc-1 및 Svar Luc-2 루시페라제들의 발현을 위한 벡터로 사용을 위한 최적의 특성들을 보이는(exhibits) 플라스미드를 개발하기 위해 플라스미드는 E. coli의 실험실 균주들(laboratory strains)에서 염색체 외부에서(extra chromosomally) 쉽게 복제될 수 있고, 이 목적에 필요한 필수(necessary) DNA 서열들을 함유하고, 그리고 박테리아에서 증가되는 생산량(yield)을 야기하는 숙주 인자들(host factors)의 방해(interference)의 더 낮은 확률(probability)이 있도록 3,000 내지 6,000 염기-쌍들의 정도(order)의 상대적으로(relatively) 작은 크기인 것이 바람직하다. 따라서, 플라스미드 (pSVAR001)가 인 실리코(in silico)로 설계되었고 다음을 함유하여 인 비트로에서 합성되었다: 박테리아 복제 기점(origin of replication) (nt. 5954 내지 217), 인간 인터페론 베타 유전자의 5' UTR로부터의 최소 프로모터 (nt. 1141-1263), 코돈 최적화된 Gaussia 루시페라제 유전자 (nt. 1276-1329)로부터의 시그널 펩타이드 (SEQ. ID NO 3), 트랜스포존(transposon)-특이적 5' (nt. 652-682) 및 3' (nt. 4567-4601) 역전(inverted) 말단 반복들(terminal repeats), 및 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열들을 포함하나 이에 제한되지 않는 리포터-유전자 (nt. 1330-1779)의 코딩(coding) 서열, 이식유전자(transgene)의 트랜스포사제(transposase) 통합(integration)을 위한 인식 서열들, EM7 프로모터 (nt. 5072-5137)의 제어 하 누르세오트리신(nourseothricine) 항생제 저항성(antibiotic resistance) 유전자 (nt. 5138-5710), 및 SEQ ID NO: 4에 제시된 서열을 포함하거나 또는 이로 구성되는, SV40 최소 프로모터 (nt. 2138-2495)의 제어 하, 코돈-최적화된 하이그로마이신(hygromycin) 저항성 유전자 (nt. 2532-3557). 플라스미드는 다수의 주요 제한 부위들을 추가로 함유한다: 컨센서스(consensus) 반응 서열의 삽입을 위한 KpnI, NheI, 및 Xhol, 포유동물 선택 마커의 치환(substitution)을 위한 BcuI-SalI, SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들을 포함하나 이에 제한되지 않는 리포터-유전자의 치환을 위한 BglI-Xbal, 및 최소 프로모터 서열의 치환을 위한 Xhol-BglII. pSVAR001 플라스미드의 퍼포먼스를 테스트하기 위해, 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복이 Kpn-XhoI 제한 부위(restriction site) 내로 삽입되었고 그리고 그 결과인(resulting) 플라스미드가 상업적으로 이용가능한 코엘렌테라진(coelenterazine) 기반 기질 (QuantiLuc Gold, Invivogen)을 사용하여 SVAR1 루시페라제 활성의 정량화 전 37 ℃에서 4 시간 동안 200 ng/ml 의 TNFα로 처리되거나 그렇지 않은 인간 HEK293 세포들에서 일시적(transient) 트랜스펙션 실험들에서 테스트되었다. 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복을 함유하는 pSVAR001 플라스미드의 퍼포먼스를 Kpn-XhoI 제한 부위 내로 삽입된 표준(canonical) NFkB 인식 서열의 6-배 탠덤 반복의 제어 하 BgIII-Xbal 제한 부위 내로 삽입된 SVAR Luc-1 루시페라제 유전자를 함유하는 pGL4 플라스미드 (Promega)의 그것과의 비교는 pSVAR001 플라스미드로 수득된 최대(maximum) RLU 수준들이 표준 NFkB 인식 서열의 6-배 탠덤 반복의 제어 하 SVAR Luc-1 루시페라제 유전자를 함유하는 pGL4 플라스미드로 수득된 그것들에 비슷했지만(comparable) 배수 유도(fold induction)는 pSVAR001 플라스미드를 사용하여 상당히 더 컸다는 것을 보여주었다 (도 9).
참고문헌들
Inglese, J., et al., Nat. Chem. Biol. 3:466-479, 2007
Thorne, N., et al., Chem. Biol. 17:646-657, 2010
Markova, SV., et al., J. Biol. Chem. 279:3212-3217, 2004
Stern, B., et al. Trends Cell Mol. Biol. 2:1-17, 2007
Corish, P., and Tyler-Smith, C., Protein Eng., 12:1035-1040, 1999
Lallemand et al. J. Interferon & Cytokine Res. 28:393-404, 2008.`
Lallemand et al. J.Immunol. Methods. 356: 18-28, 2010.
Lallemand et al. J.Immunol. Methods. 373: 229-239, 2011
Lallemand et al. J.Immunol. Res. 390: 1-19, 2017
특정 구현예들에서, 본 발명은 또한 다음 아이템들에 관한 것이다:
1. 다음을 포함하는 메타조안(metazoan) 세포
(i) 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된 이종(heterologous) 시스-작용(cis-acting) 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드, 여기서 상기 프로모터는 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결되어 있고, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다.
(ⅱ) 바람직한 구현예에서, 분석의 정규화(normalization)를 제공하기 위해, 본 발명에 따른 세포들은 약리 활성 분자에 반응하는 리포터 유전자 구조물(construct)에 사용된 것과 다른 루시페라제의 항시적(constitutive) 발현을 위한 구조물(construct)을 추가로 갖는다. 예를 들어, 항시적 생산은 항시적 프로모터의 제어 하 두 번째 루시페라제, 예를 들어 레닐라 루시페라제 또는 반딧불이 루시페라제일 수 있다.
(ⅹⅰ) 추가로 바람직한 구현예에서, 다른 기질들을 사용하여 트리(tri)-루시페라제 분석에 대해 제공하기 위해, 본 발명에 따른 세포들은 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결되고 다른 리간드-반응성 프로모터에 각각 작동가능하게 연결된 듀얼 구조물들을 추가로 갖고, 여기서 상기 오픈 리딩 프레임은 US 2011/0189658에 서술된 항시적(constitutive) 프로모터의 제어 하 루시페라제의 활성에 대해(relative) 정규화되는 두 개의 리간드-반응성 루시페라제의 활성을 가능하게 하기 위하여 항시적(constitutive) 프로모터의 제어 하 또는 세 번째 리간드-반응성 프로모터의 제어 하 기질로서 코엘렌테라진(coelenterazine)을 사용하는 임의의 다른 루시페라제 또는 레닐라 루시페라제를 인코딩하는 세 번째 오픈 리딩 프레임과 함께 기질로서 루시페린을 사용하는 임의의 다른 루시페라제 또는 반딧불이 루시페라제를 인코딩하는 두 번째 오픈 리딩 프레임 및 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다.
(ⅲ) 첫 번째 리포터 단백질의 활성을 결정하는 것, 여기서 상기 오픈 리딩 프레임은 Quanti-Luc Gold (InvivoGen)와 같은 상업적으로 이용가능한 기질 또는 조성이 표 1에 보여지는 것과 같은 코엘렌테라진(coelenterazine) 기반 기질을 사용하여 상기 세포주의 상청액(supernatant) 또는 배양 배지에서 첫 번째 리포터 단백질의 효율적인 분비를 보장하는(ensures) 시그널 펩타이드의 제어 하 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다.
(ⅳ) 세 번째 리포터-유전자의 활성의 정량화 전 두 번째 리포터 단백질의 활성을 효율적으로 억제하는 DualGlo 시약 (Promega)을 사용하여 세포 용해(lysis) 후 코엘레란테리즈(coeleranterize) 기반 기질을 필요로 하는 레닐라 루시페라제와 같은 세 번째 리포터 유전자의 활성이 동일한 샘플에서 측정되는 Dual-Glo 기질 (Promega)을 사용하여 세포들의 용해 후 상기 세포주에서 반딧불이 루시페라제와 같은 루시페린 기반 기질을 필요로 하는 두 번째 리포터 단백질의 활성을 결정하는 것.
2. 앞의 아이템들에 따른 포유동물 세포, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 서열 또는 SEQ ID NO: 1, 또는 SEQ ID NO: 2에 적어도 75% 서열 동일성 예를 들어 SEQ ID NO: 1 또는 SEQ ID NO: 2에 79% 서열 동일성, 예를 들어 SEQ ID NO: 1 또는 SEQ ID NO: 2에 85% 서열 동일성, 예를 들어 SEQ ID NO: 1 또는 SEQ ID NO: 2에 90% 서열 동일성, 예를 들어 SEQ ID NO: 1 또는 SEQ ID NO: 2에 95% 서열 동일성, 예를 들어 SEQ ID NO: 1 또는 SEQ ID NO: 2에 97% 서열 동일성, 예를 들어 SEQ ID NO: 1 또는 SEQ ID NO: 2에 98% 서열 동일성, 예를 들어 SEQ ID NO: 1 또는 SEQ ID NO: 2에 99% 서열 동일성을 갖는 서열을 포함하거나 또는 이로 구성된다. 10. 앞의 아이템들 중 어느것에 따른 포유동물 세포, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 1에 제시된 서열을 포함하거나 또는 이로 구성된다.
3. 앞의 아이템들 중 어느것에 따른 세포, 여기서 상기 세포는 HEK293, HEK293T, K562, U937, Jurkat, Molt-4, HeLa 세포들, HT1080 세포들, ARPE-19, ARPE-19/HPV-16, 곤충 세포(insect cell) 예를 들어 Sf9 세포들, 조류(avian) 세포들 예를 들어 DT-40, MSB1, 또는 LMH, 마우스(mouse) 세포들 예를 들어 L929 세포들 또는 LS 변종(variant), 모든 변동들(variants)을 포함하는 CHO-K1, CHO-DXB11, CHO-DG44, CHOK1SV 세포들과 같은 중국 햄스터 난소(Chinese hamster ovary) (CHO) 세포들로 구성되나 이에 제한되지 않는 군으로부터 선택된다.
4. 앞의 아이템들 중 어느것에 따른 세포주, 여기서 상기 세포주는 HEK293이다.
5. 테스트 샘플에서 약리학적 활성 분자(pharmacologically active molecule)의 활성을 검출하고 선택적으로(optionally) 정량화하는(quantitating) 방법이며, 상기 방법은
(i) 테스트 샘플을 제공하는 것,
(ii) 앞의 아이템들 중 어느 하나에 따른 세포주와 상기 테스트 샘플을 접촉시키는 것,
(iii) 상기 세포주에서 첫 번째 리포터 단백질의 활성을 결정하는 것
의 단계들을 포함한다.
6. 아이템들 중 어느것에 따른 방법이며, 여기서 상기 세포주는 두 번째 단백질을 발현하고, 상기 방법은
(iv) 상기 세포주에서 첫 번째 리포터 단백질의 활성을 결정하는 것,
(v) 첫 번째 리포터 단백질 및 두 번째 리포터 단백질의 활성 사이의 비율을 제공하는 것
을 추가로 포함한다.
7. 약물 발견에서 고 처리량 스크리닝을 위한 방법이며, 상기 방법은
(ⅰ) 스크리닝될 화합물들의 라이브러리로 구성된, 테스트 샘플(들)을 제공하는 것
(ⅱ) 본 발명에 따른 세포주와 상기 테스트 샘플(들)을 접촉시키는 것, 상기 세포주는 다운스트림 프로모터 서열에 작동가능하게 연결된, 테스트 샘플(들)에 존재하는 약리 활성 분자(들)로 세포주의 처리에 반응하는, 이종 시스-작용 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 함유하고, 여기서 상기 프로모터는 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 하나를 포함하는 첫 번째 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게 연결된다. 바람직한 구현예에서, 본 발명에 따른 세포주는 384 또는 1536 웰 플레이트들 분석 플레이트들에 접종(seeded)된다.
8. 약리 활성 분자들의 활성의 정량화(quantification)를 위한 리포터 유전자의 발현을 위한 벡터로 사용을 위한 최적의 특성들(characteristics)을 보이는 플라스미드.
9. 리포터 유전자의 발현을 위한 벡터로 사용을 위한 최적의 특성들을 보이는 플라스미드이며, 상기 리포터 유전자는 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된다.
10. SEQ ID NO: 4에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성된 코돈 최적화된 하이그로마이신(hygromycin) 저항성 유전자를 함유하는 포유동물 세포들에서 리포터 유전자의 발현을 위한 벡터로 사용을 위한 최적화된 특성들을 보이는 플라스미드.
11. SEQ ID NO: 5에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되는 포유동물 세포들에서 리포터 유전자의 발현을 위한 벡터로 사용을 위한 최적의 특성들을 보이는 플라스미드
SEQUENCE LISTING
<110> SVAR Life Science AB
<120> Novel Luciferases with improved properties
<130> P243003PC00
<150> EP21170068.7
<151> 2021-04-23
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 450
<212> DNA
<213> Artificial
<220>
<223> Artifical Sequence
<220>
<221> NO.1
<222> (1)..(450)
<223> SEQ ID NO.1
<400> 1
atggaggccg aggccgagag aggcaagagc cccggcaaga agctgcccct ggccgtgatc 60
atggagatcg aggccaacgc cttcaaggcc ggctgcacca gaggctgcct gatctgcctg 120
agcaagatca agtgcaccgc caagatgaag gtgtacatcc ccggcagatg ccacgactac 180
ggcggcgaca agaagaccgg ccaggccggc atcgtgggcg ccatcgtgga catccccgag 240
atcagcggct tcaaggagat ggagcccatg gagcagttca tcgcccaggt ggacagatgc 300
gccagctgca ccaccggctg cctgaagggc ctggccaacg tgaagtgcag cgagctgctg 360
aagaagtggc tgcccgacag atgcgccagc ttcgccgaca agatccagaa ggaggtgcac 420
aacatcaagg gcatggccgg cgacagatga 450
<210> 2
<211> 450
<212> DNA
<213> Artificial
<220>
<223> Artifical sequence
<220>
<221> NO.2
<222> (1)..(450)
<223> SEQ ID NO.2
<400> 2
atggaggccg aggccgagag aggcaagagc cccggcaaga agctgcccct ggccgtgatc 60
atggagatcg aggccaacgc cttcaaggcc ggctgcacca gaggctgcct gatctgcctg 120
agcaagatca agtgcaccgc caagatgaag gtgtacatcc ccggcagatg ccacgactac 180
ggcggcgaca agaagaccgg ccaggccggc atcgtgggcg ccatcgtgga catccccgag 240
atcagcggct tcaaggagat ggagcccatg gagcagttcg tggcccaggt ggacagatgc 300
gccagctgca ccaccggctg cctgaagggc ctggccaacg tgaagtgcag cgagctgctg 360
aagaagtggc tgcccgacag atgcgccagc ttcgccgaca agatccagaa ggaggtgcac 420
aacatcaagg gcatggccgg cgacagatga 450
<210> 3
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Artifical sequence
<220>
<221> NO.3
<222> (1)..(54)
<223> SEQ ID NO.3
<400> 3
atgggagtca aagttctgtt tgccctgatc tgcatcgctg tggccgaggc caag 54
<210> 4
<211> 573
<212> DNA
<213> Artificial Sequence
<220>
<223> Artifical sequence
<220>
<221> NO.4
<222> (1)..(573)
<223> SEQ ID NO.4
<400> 4
atggggacta ccctcgatga cacagcttac cgctatcgca cgtcagtgcc aggtgacgca 60
gaagccattg aggcgttgga tggttccttc acgaccgaca ccgtgtttcg cgttactgcg 120
acaggcgacg gtttcacctt acgcgaagtt ccggttgatc ctccgctgac caaagtgttt 180
ccggatgacg aaagcgacga cgaatcggat gatggggagg atggtgatcc cgatagccgc 240
acctttgtcg cctatggcga tgatggcgat ctggcaggct tcgttgtggt cagctactct 300
ggctggaatc gccgtcttac ggtggaggac atcgaagtag cgccggaaca tcgcggtcat 360
ggagtaggac gtgctctgat ggggttagcg acggagtttg ctcgggaacg tggtgcaggc 420
cacttgtggc tggaagtcac caacgtgaac gccccagcaa ttcacgccta tcgtcgtatg 480
ggctttacgc tgtgtggtct ggataccgcg ctgtatgacg gcactgcgag tgatggcgaa 540
caggccctgt acatgtcgat gccttgcccg taa 573
<210> 5
<211> 6325
<212> DNA
<213> Artificial Sequence
<220>
<223> Artifical sequence
<220>
<221> NO.5
<222> (1)..(6325)
<223> SEQ ID NO.5
<400> 5
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 60
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 120
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 180
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 240
acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 300
ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 360
gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 420
tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 480
agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 540
tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 600
cacaggaaac agctatgacc atgattacgc caagcttaac cctagaaaga taatcatatt 660
gtgacgtacg ttaaagataa tcatgtgtaa aattgacgca tgtgttttat cggtctgtat 720
atcgaggttt atttattaat ttgaatagat attaagtttt attatattta cacttacata 780
ctaataataa attcaacaaa caatttattt atgtttattt atttattaaa aaaaacaaaa 840
actcaaaatt tcttctataa agtaacaaaa cttttatgag ggacagcccc cccccaaagc 900
ccccagggat gtaattacgt ccctcccccg ctagggggca gcagcgagcc gcccggggct 960
ccgctccggt ccggcgctcc ccccgcatcc ccgagccggc agcgtgcggg gacagcccgg 1020
gcacggggaa ggtggcacgg gatcgctttc ctctgaacgc ttctcgctgc tctttgagcc 1080
tgcagacacc tggggggata cggggaaaag gtacctgagc tcgctagcct cgagcctcca 1140
tagagagagg accatctcat ataaataggc catacccatg gagaaaggac attctaactg 1200
caacctttcg aagcctttgc tctggcacaa caggtagtag gcgacactgt tcgtgttgtc 1260
aacagatctg ccaccatggg agtcaaagtt ctgtttgccc tgatctgcat cgctgtggcc 1320
gaggccaaga tggaggccga ggccgagaga ggcaagagcc ccggcaagaa gctgcccctg 1380
gccgtgatca tggagatcga ggccaacgcc ttcaaggccg gctgcaccag aggctgcctg 1440
atctgcctga gcaagatcaa gtgcaccgcc aagatgaagg tgtacatccc cggcagatgc 1500
cacgactacg gcggcgacaa gaagaccggc caggccggca tcgtgggcgc catcgtggac 1560
atccccgaga tcagcggctt caaggagatg gagcccatgg agcagttcat cgcccaggtg 1620
gacagatgcg ccagctgcac caccggctgc ctgaagggcc tggccaacgt gaagtgcagc 1680
gagctgctga agaagtggct gcccgacaga tgcgccagct tcgccgacaa gatccagaag 1740
gaggtgcaca acatcaaggg catggccggc gacagatgat aattctagag tcggggcggc 1800
cggccgcttc gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga 1860
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 1920
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 1980
cagggggagg tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc 2040
gataaggatc cgtttgcgta ttgggcgctc ttccgctgat ctgcgcagca ccatggcctg 2100
aaataacctc tgaaagagga acttggttag ctaccttctg aggcggaaag aaccagctgt 2160
ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 2220
aaagcatgca tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag 2280
gcagaagtat gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc 2340
cgcccatccc gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa 2400
ttttttttat ttatgcagag gccgaggccg cctctgcctc tgagctattc cagaagtagt 2460
gaggaggctt ttttggaggc ctaggctttt gcaaaaagct cgattcttct gacactagca 2520
ctagtgccac catgaagaag cccgagctga ccgccaccag cgtggagaag ttcctgatcg 2580
agaagttcga cagcgtgagc gacctgatgc agctgagcga gggcgaggag agcagagcct 2640
tcagcttcga cgtgggcggc agaggctacg tgctgagagt gaacagctgc gccgacggct 2700
tctacaagga cagatacgtg tacagacact tcgccagcgc cgccctgccc atccccgagg 2760
tgctggacat cggcgagttc agcgagagcc tgacctactg catcagcaga agagcccagg 2820
gcgtgaccct gcaggacctg cccgagaccg agctgcccgc cgtgctgcag cccgtggccg 2880
aggccatgga cgccatcgcc gccgccgacc tgagccagac cagcggcttc ggccccttcg 2940
gcccccaggg catcggccag tacaccacct ggagagactt catctgcgcc atcgccgacc 3000
cccacgtgta ccactggcag accgtgatgg acgacaccgt gagcgccagc gtggcccagg 3060
ccctggacga gctgatgctg tgggccgagg actgccccga ggtgagacac ctggtgcacg 3120
ccgacttcgg cagcaacaac gtgctgaccg acaacggcag aatcaccgcc gtgatcgact 3180
ggagcgaggc catgttcggc gacagccagt acgaggtggc caacatcttc ttctggagac 3240
cctggctggc ctgcatggag cagcagacca gatacttcga gagaagacac cccgagctgg 3300
ccggcagccc cagactgaga gcctacatgc tgagaatcgg cctggaccag ctgtaccaga 3360
gcctggtgga cggcaacttc gacgacgccg cctgggccca gggcagatgc gacgccatcg 3420
tgagaagcgg cgccggcacc gtgggcagaa cccagatcgc cagaagaagc gccgccgtgt 3480
ggaccgacgg ctgcgtggag gtgctggccg acagcggcaa cagaagaccc agcaccagac 3540
ccagagccaa ggagtgaatg agtcgacaat caacctctgg attacaaaat ttgtgaaaga 3600
ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg 3660
cctttgtatc atgcgttaac taaacttgtt tattgcagct tataatggtt acaaataaag 3720
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 3780
gtccaaactc atcaatgtat cttatcatgt ctggaattga ctcaaatgat gtcaattagt 3840
ctatcagaag ctcatctggt ctcccttccg ggggacaaga catccctgtt taatatttaa 3900
acagcagtgt tcccaaactg ggttcttata tcccttgctc tggtcaacca ggttgcaggg 3960
tttcctgtcc tcacaggaac gaagtcccta aagaaacagt ggcagccagg tttagccccg 4020
gaattgactg gattcctttt ttagggccca ttggtatggc tttttccccg tatcccccca 4080
ggtgtctgca ggctcaaaga gcagcgagaa gcgttcagag gaaagcgatc ccgtgccacc 4140
ttccccgtgc ccgggctgtc cccgcacgct gccggctcgg ggatgcgggg ggagcgccgg 4200
accggagcgg agccccgggc ggctcgctgc tgccccctag cgggggaggg acgtaattac 4260
atccctgggg gctttggggg ggggctgtcc ctgatatcta taacaagaaa atatatatat 4320
aataagttat cacgtaagta gaacatgaaa taacaatata attatcgtat gagttaaatc 4380
ttaaaagtca cgtaaaagat aatcatgcgt cattttgact cacgcggtcg ttatagttca 4440
aaatcagtga cacttaccgc attgacaagc acgcctcacg ggagctccaa gcggcgactg 4500
agatgtccta aatgcacagc gacggattcg cgctatttag aaagagagag caatatttca 4560
agaatgcatg cgtcaatttt acgcagacta tctttctagg gttaagaatt cactggccgt 4620
cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc gccttgcagc 4680
acatccccct ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 4740
acagttgcgc agcctgaatg gcgaatggcg cctgatgcgg tattttctcc ttacgcatct 4800
gtgcggtatt tcacaccgca tatggtgcac tctcagtaca atctgctctg atgccgcata 4860
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 4920
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 4980
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 5040
ggttaatgtc atgataataa tggtttctta gttgacaatt aatcatcggc atagtatatc 5100
ggcatagtat aatacgactc actataggag ggccatcatg gggactaccc tcgatgacac 5160
agcttaccgc tatcgcacgt cagtgccagg tgacgcagaa gccattgagg cgttggatgg 5220
ttccttcacg accgacaccg tgtttcgcgt tactgcgaca ggcgacggtt tcaccttacg 5280
cgaagttccg gttgatcctc cgctgaccaa agtgtttccg gatgacgaaa gcgacgacga 5340
atcggatgat ggggaggatg gtgatcccga tagccgcacc tttgtcgcct atggcgatga 5400
tggcgatctg gcaggcttcg ttgtggtcag ctactctggc tggaatcgcc gtcttacggt 5460
ggaggacatc gaagtagcgc cggaacatcg cggtcatgga gtaggacgtg ctctgatggg 5520
gttagcgacg gagtttgctc gggaacgtgg tgcaggccac ttgtggctgg aagtcaccaa 5580
cgtgaacgcc ccagcaattc acgcctatcg tcgtatgggc tttacgctgt gtggtctgga 5640
taccgcgctg tatgacggca ctgcgagtga tggcgaacag gccctgtaca tgtcgatgcc 5700
ttgcccgtaa gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 5760
cctcactgat taagcattgg taactgtcag accaagttta ctcatatata ctttagattg 5820
atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 5880
tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 5940
tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 6000
aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 6060
aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg tagccgtagt 6120
taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 6180
taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 6240
agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 6300
tggagcgaac gacctacacc gaact 6325
<210> 6
<211> 2235
<212> DNA
<213> Artificial Sequence
<220>
<223> Artifical sequence
<220>
<221> NO.6
<222> (1)..(2235)
<223> SEQ ID NO.6
<400> 6
atgggagtca aagttctgtt tgccctgatc tgcatcgctg tggccgaggc caagatggag 60
gccgaggccg agagaggcaa gagccccggc aagaagctgc ccctggccgt gatcatggag 120
atcgaggcca acgccttcaa ggccggctgc accagaggct gcctgatctg cctgagcaag 180
atcaagtgca ccgccaagat gaaggtgtac atccccggca gatgccacga ctacggcggc 240
gacaagaaga ccggccaggc cggcatcgtg ggcgccatcg tggacatccc cgagatcagc 300
ggcttcaagg agatggagcc catggagcag ttcatcgccc aggtggacag atgcgccagc 360
tgcaccaccg gctgcctgaa gggcctggcc aacgtgaagt gcagcgagct gctgaagaag 420
tggctgcccg acagatgcgc cagcttcgcc gacaagatcc agaaggaggt gcacaacatc 480
aagggcatgg ccggcgacag aaaaattgtc gctcctgtca aacaaactct taactttgat 540
ttactcaaac tggctgggga tgtagaaagc aatccaggtc caatggagga cgcaaagaac 600
atcaagaagg gtcctgcacc cttttaccct ctggaggacg gaactgctgg cgagcaactg 660
cacaaagcca tgaaacgtta tgctctggta cctgggacta tagcctttac ggatgcacac 720
attgaggtgg acatcacgta tgccgagtat ttcgaaatga gtgttcgact ggcagaagcg 780
atgaagaggt acgggttgaa cacaaatcac aggatagtgg tctgctcaga gaactccctg 840
cagttcttca tgcctgtcct cggcgcactg tttatcgggg tcgcggttgc tcccgctaat 900
gacatctaca acgaacggga actgctgaac tccatgggca taagccagcc gacagtcgtg 960
ttcgtgtcca agaaagggct ccagaaaatt ctgaacgtcc agaagaagct gcccattatc 1020
cagaaaatca tcatcatgga cagcaaaacc gactatcaag ggttccagtc catgtacacg 1080
ttcgtgactt cccatctgcc accaggcttc aatgagtacg attttgtccc agagtcattt 1140
gacagggaca aaaccattgc cttgatcatg aactcttccg gttctacagg tctgccaaag 1200
ggagtggcat tgccccatcg tactgcctgt gtgcgattta gccacgctag ggaccccata 1260
tttggtaatc agattatccc agatactgca atcctgtcag tggtgccatt tcatcacggt 1320
ttcggcatgt tcaccaccct tggctacctc atctgcggat ttagagtggt cctcatgtac 1380
cggttcgaag aggagttgtt cctgcgctct cttcaggatt acaaaattca gagcgctctc 1440
ctggtgccta cactctttag cttcttcgcc aagtctacac tcattgacaa atatgacctg 1500
agtaatctcc acgagattgc ctctggcggg gcacctctga gtaaggaggt gggagaagcc 1560
gtggccaagc ggtttcacct cccaggaata cgccaagggt atggtctgac cgaaaccacc 1620
tcagccatct tgatcacacc agaaggggac gataaacccg gagcggtggg caaggttgtc 1680
cctttctttg aggcaaaggt agttgacctg gatactggca aaacccttgg cgtgaatcag 1740
agaggcgaac tgtgtgtgag aggacccatg attatgagcg ggtacgtcaa caatcccgag 1800
gccaccaatg cgctgatcga caaggatgga tggctgcaca gtggcgatat tgcctattgg 1860
gatgaggatg agcatttctt cattgtggac cgcctgaaaa gcctcataaa gtacaagggg 1920
taccaggttg ctccggccga acttgagagc atactgctgc aacatccgaa catctttgat 1980
gctggtgttg ccggccttcc cgatgatgat gctggagagc tgcctgcagc tgttgtggta 2040
ctggaacatg gcaaaaccat gacagagaaa gaaattgtcg actatgtggc ctctcaggtt 2100
accacagcca agaagttgcg gggaggagta gtctttgtgg acgaagtacc caaaggcctt 2160
actgggaagc ttgatgccag aaagatccgc gaaattctga tcaaagcgaa gaagggcggt 2220
aaaattgctg tgtag 2235
<210> 7
<211> 161
<212> PRT
<213> Artificial Sequence
<220>
<223> Artifical sequence
<220>
<221> AA1
<222> (1)..(161)
<220>
<221> AA1
<222> (1)..(161)
<223> SEQ ID NO. AA1
<400> 7
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro Leu Ala Val Ile
20 25 30
Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys
35 40 45
Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys Met Lys Val Tyr
50 55 60
Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln
65 70 75 80
Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu Ile Ser Gly Phe
85 90 95
Lys Glu Met Glu Pro Met Glu Gln Phe Ile Ala Gln Val Asp Arg Cys
100 105 110
Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Lys Cys
115 120 125
Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys Ala Ser Phe Ala
130 135 140
Asp Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly Met Ala Gly Asp
145 150 155 160
Arg
<210> 8
<211> 161
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<220>
<221> AA2
<222> (1)..(161)
<220>
<221> AA2
<222> (1)..(161)
<223> SEQ ID NO. AA2
<400> 8
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro Leu Ala Val Ile
20 25 30
Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys
35 40 45
Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys Met Lys Val Tyr
50 55 60
Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln
65 70 75 80
Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu Ile Ser Gly Phe
85 90 95
Lys Glu Met Glu Pro Met Glu Gln Phe Val Ala Gln Val Asp Arg Cys
100 105 110
Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Lys Cys
115 120 125
Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys Ala Ser Phe Ala
130 135 140
Asp Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly Met Ala Gly Asp
145 150 155 160
Arg
<210> 9
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial sequence
<220>
<221> AA3
<222> (1)..(18)
<220>
<221> AA3
<222> (1)..(18)
<223> SEQ ID NO. AA3
<400> 9
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys
<210> 10
<211> 726
<212> PRT
<213> Artificial Sequence
<220>
<223> Artifical sequence
<220>
<221> AA4
<222> (1)..(726)
<220>
<221> AA4
<222> (1)..(726)
<223> SEQ ID NO. AA4
<400> 10
Met Glu Ala Glu Ala Glu Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro
1 5 10 15
Leu Ala Val Ile Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys
20 25 30
Thr Arg Gly Cys Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys
35 40 45
Met Lys Val Tyr Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys
50 55 60
Lys Thr Gly Gln Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu
65 70 75 80
Ile Ser Gly Phe Lys Glu Met Glu Pro Met Glu Gln Phe Ile Ala Gln
85 90 95
Val Asp Arg Cys Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala
100 105 110
Asn Val Lys Cys Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys
115 120 125
Ala Ser Phe Ala Asp Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly
130 135 140
Met Ala Gly Asp Arg Lys Ile Val Ala Pro Val Lys Gln Thr Leu Asn
145 150 155 160
Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
165 170 175
Met Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe Tyr Pro
180 185 190
Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met Lys Arg
195 200 205
Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His Ile Glu
210 215 220
Val Asp Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg Leu Ala
225 230 235 240
Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile Val Val
245 250 255
Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly Ala Leu
260 265 270
Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn Glu Arg
275 280 285
Glu Leu Leu Asn Ser Met Gly Ile Ser Gln Pro Thr Val Val Phe Val
290 295 300
Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys Leu Pro
305 310 315 320
Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr Gln Gly
325 330 335
Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro Gly Phe
340 345 350
Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys Thr Ile
355 360 365
Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys Gly Val
370 375 380
Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala Arg Asp
385 390 395 400
Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu Ser Val
405 410 415
Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly Tyr Leu
420 425 430
Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu Glu Leu
435 440 445
Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu Leu Val
450 455 460
Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp Lys Tyr
465 470 475 480
Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser
485 490 495
Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile
500 505 510
Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr
515 520 525
Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe
530 535 540
Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val
545 550 555 560
Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly
565 570 575
Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp Gly
580 585 590
Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp Glu His Phe
595 600 605
Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys Gly Tyr Gln
610 615 620
Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn Ile
625 630 635 640
Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu Leu
645 650 655
Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu Lys
660 665 670
Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys Leu
675 680 685
Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr Gly
690 695 700
Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys Lys
705 710 715 720
Gly Gly Lys Ile Ala Val
725
<210> 11
<211> 450
<212> DNA
<213> Artificial
<220>
<223> Artificial
<220>
<221> NO.7
<222> (1)..(450)
<223> SEQ ID NO. 7
<400> 11
atggaggccg aggccgagag aggcaagagc cccggcaaga agctgcccct ggccgtgatc 60
atggagatcg aggccaacgc cttcaaggcc ggctgcacca gaggctgcct gatctgcctg 120
agcaagatca agtgcaccgc caagatgaag gtgtacatcc ccggcagatg ccacgactac 180
ggcggcgaca agaagaccgg ccaggccggc atcgtgggcg ccatcgtgga catccccgag 240
atcagcggct tcaaggagat ggagcccatg gagcagttca tcgcccaggt ggacagatgc 300
gccagctgca ccaccggctg cctgaagggc ctggccaacg tgaagtgcag cgagctgctg 360
aagaagtggc tgcccgacag atgcgccagc ttcgccgaca agatccagaa ggaggtgcac 420
aacatcaagg gcatggccgg cgacagatga 450
<210> 12
<211> 149
<212> PRT
<213> Artificial
<220>
<223> Artificial
<220>
<221> AA5
<222> (1)..(149)
<220>
<221> AA5
<222> (1)..(149)
<223> SEQ ID NO. AA5
<400> 12
Met Glu Ala Glu Ala Glu Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro
1 5 10 15
Leu Ala Val Ile Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys
20 25 30
Thr Arg Gly Cys Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys
35 40 45
Met Lys Val Tyr Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys
50 55 60
Lys Thr Gly Gln Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu
65 70 75 80
Ile Ser Gly Phe Lys Glu Met Glu Pro Met Glu Gln Phe Ile Ala Gln
85 90 95
Val Asp Arg Cys Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala
100 105 110
Asn Val Lys Cys Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys
115 120 125
Ala Ser Phe Ala Asp Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly
130 135 140
Met Ala Gly Asp Arg
145
<210> 13
<211> 219
<212> PRT
<213> Metridia longa
<400> 13
Met Asp Ile Lys Val Val Phe Thr Leu Val Phe Ser Ala Leu Val Gln
1 5 10 15
Ala Lys Ser Thr Glu Phe Asp Pro Asn Ile Asp Ile Val Gly Leu Glu
20 25 30
Gly Lys Phe Gly Ile Thr Asn Leu Glu Thr Asp Leu Phe Thr Ile Trp
35 40 45
Glu Thr Met Glu Val Met Ile Lys Ala Asp Ile Ala Asp Thr Asp Arg
50 55 60
Ala Ser Asn Phe Val Ala Thr Glu Thr Asp Ala Asn Arg Gly Lys Met
65 70 75 80
Pro Gly Lys Lys Leu Pro Leu Ala Val Ile Met Glu Met Glu Ala Asn
85 90 95
Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys Leu Ile Cys Leu Ser Lys
100 105 110
Ile Lys Cys Thr Ala Lys Met Lys Val Tyr Ile Pro Gly Arg Cys His
115 120 125
Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln Ala Gly Ile Val Gly Ala
130 135 140
Ile Val Asp Ile Pro Glu Ile Ser Gly Phe Lys Glu Met Ala Pro Met
145 150 155 160
Glu Gln Phe Ile Ala Gln Val Asp Arg Cys Ala Ser Cys Thr Thr Gly
165 170 175
Cys Leu Lys Gly Leu Ala Asn Val Lys Cys Ser Glu Leu Leu Lys Lys
180 185 190
Trp Leu Pro Asp Arg Cys Ala Ser Phe Ala Asp Lys Ile Gln Lys Glu
195 200 205
Val His Asn Ile Lys Gly Met Ala Gly Asp Arg
210 215
<210> 14
<211> 160
<212> PRT
<213> Artificial
<220>
<223> Artificial
<400> 14
Met Asp Ile Lys Val Val Phe Thr Leu Val Phe Ser Ala Leu Val Gln
1 5 10 15
Ala Arg Gly Lys Met Pro Gly Lys Lys Leu Pro Leu Ala Val Ile Met
20 25 30
Glu Met Glu Ala Asn Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys Leu
35 40 45
Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys Met Lys Val Tyr Ile
50 55 60
Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln Ala
65 70 75 80
Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu Ile Ser Gly Phe Lys
85 90 95
Glu Met Ala Pro Met Glu Gln Phe Ile Ala Gln Val Asp Arg Cys Ala
100 105 110
Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Lys Cys Ser
115 120 125
Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys Ala Ser Phe Ala Asp
130 135 140
Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly Met Ala Gly Asp Arg
145 150 155 160
<210> 15
<211> 161
<212> PRT
<213> Artificial
<220>
<223> Artificial
<400> 15
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro Leu Ala Val Ile
20 25 30
Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys
35 40 45
Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys Met Lys Val Tyr
50 55 60
Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln
65 70 75 80
Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu Ile Ser Gly Phe
85 90 95
Lys Glu Met Glu Pro Met Glu Gln Phe Ile Ala Gln Val Asp Arg Cys
100 105 110
Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Lys Cys
115 120 125
Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys Ala Ser Phe Ala
130 135 140
Asp Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly Met Ala Gly Asp
145 150 155 160
Arg
<210> 16
<211> 161
<212> PRT
<213> Artificial
<220>
<223> Artificial
<400> 16
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro Leu Ala Val Ile
20 25 30
Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys
35 40 45
Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys Met Lys Val Tyr
50 55 60
Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln
65 70 75 80
Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu Ile Ser Gly Phe
85 90 95
Lys Glu Met Glu Pro Met Glu Gln Phe Val Ala Gln Val Asp Arg Cys
100 105 110
Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Lys Cys
115 120 125
Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys Ala Ser Phe Ala
130 135 140
Asp Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly Met Ala Gly Asp
145 150 155 160
Arg
<210> 17
<211> 161
<212> PRT
<213> Artificial
<220>
<223> Artificial
<400> 17
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro Leu Ala Val Ile
20 25 30
Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys
35 40 45
Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys Met Lys Val Tyr
50 55 60
Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln
65 70 75 80
Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu Ile Ser Gly Phe
85 90 95
Lys Glu Met Glu Pro Met Glu Gln Phe Val Ala Gln Val Asp Arg Cys
100 105 110
Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Lys Cys
115 120 125
Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys Thr Gly Phe Gln
130 135 140
Ala Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly Met Ala Gly Asp
145 150 155 160
Arg
<210> 18
<211> 161
<212> PRT
<213> Artificial
<220>
<223> Artificial
<400> 18
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Arg Gly Lys Ser Pro Gly Lys Lys Leu Pro Leu Ala Val Ile
20 25 30
Met Glu Ile Glu Ala Asn Ala Phe Lys Ala Gly Cys Thr Arg Gly Cys
35 40 45
Leu Ile Cys Leu Ser Lys Ile Lys Cys Thr Ala Lys Met Lys Val Tyr
50 55 60
Ile Pro Gly Arg Cys His Asp Tyr Gly Gly Asp Lys Lys Thr Gly Gln
65 70 75 80
Ala Gly Ile Val Gly Ala Ile Val Asp Ile Pro Glu Ile Ser Gly Phe
85 90 95
Lys Glu Met Glu Pro Ile Glu Gln Phe Ile Ala Gln Val Asp Arg Cys
100 105 110
Ala Ser Cys Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Lys Cys
115 120 125
Ser Glu Leu Leu Lys Lys Trp Leu Pro Asp Arg Cys Ala Ser Phe Ala
130 135 140
Asp Lys Ile Gln Lys Glu Val His Asn Ile Lys Gly Met Ala Gly Asp
145 150 155 160
Arg
<210> 19
<211> 660
<212> PRT
<213> Artificial
<220>
<223> Artificial
<400> 19
Ala Thr Gly Gly Ala Thr Ala Thr Ala Ala Ala Gly Gly Thr Thr Gly
1 5 10 15
Thr Cys Thr Thr Thr Ala Cys Thr Cys Thr Thr Gly Thr Thr Thr Thr
20 25 30
Cys Thr Cys Ala Gly Cys Ala Thr Thr Gly Gly Thr Thr Cys Ala Gly
35 40 45
Gly Cys Ala Ala Ala Ala Thr Cys Ala Ala Cys Thr Gly Ala Ala Thr
50 55 60
Thr Cys Gly Ala Thr Cys Cys Thr Ala Ala Cys Ala Thr Thr Gly Ala
65 70 75 80
Cys Ala Thr Thr Gly Thr Thr Gly Gly Thr Thr Thr Ala Gly Ala Ala
85 90 95
Gly Gly Ala Ala Ala Ala Thr Thr Thr Gly Gly Thr Ala Thr Ala Ala
100 105 110
Cys Ala Ala Ala Cys Cys Thr Thr Gly Ala Gly Ala Cys Gly Gly Ala
115 120 125
Thr Thr Thr Ala Thr Thr Cys Ala Cys Ala Ala Thr Ala Thr Gly Gly
130 135 140
Gly Ala Gly Ala Cys Ala Ala Thr Gly Gly Ala Gly Gly Thr Cys Ala
145 150 155 160
Thr Gly Ala Thr Cys Ala Ala Ala Gly Cys Ala Gly Ala Thr Ala Thr
165 170 175
Thr Gly Cys Ala Gly Ala Thr Ala Cys Thr Gly Ala Thr Ala Gly Ala
180 185 190
Gly Cys Cys Ala Gly Cys Ala Ala Cys Thr Thr Thr Gly Thr Thr Gly
195 200 205
Cys Ala Ala Cys Thr Gly Ala Ala Ala Cys Cys Gly Ala Thr Gly Cys
210 215 220
Thr Ala Ala Cys Cys Gly Thr Gly Gly Ala Ala Ala Ala Ala Thr Gly
225 230 235 240
Cys Cys Thr Gly Gly Cys Ala Ala Ala Ala Ala Ala Cys Thr Gly Cys
245 250 255
Cys Ala Cys Thr Gly Gly Cys Ala Gly Thr Thr Ala Thr Cys Ala Thr
260 265 270
Gly Gly Ala Ala Ala Thr Gly Gly Ala Ala Gly Cys Cys Ala Ala Thr
275 280 285
Gly Cys Thr Thr Thr Cys Ala Ala Ala Gly Cys Thr Gly Gly Cys Thr
290 295 300
Gly Cys Ala Cys Cys Ala Gly Gly Gly Gly Ala Thr Gly Cys Cys Thr
305 310 315 320
Thr Ala Thr Cys Thr Gly Thr Cys Thr Thr Thr Cys Ala Ala Ala Ala
325 330 335
Ala Thr Ala Ala Ala Gly Thr Gly Thr Ala Cys Ala Gly Cys Cys Ala
340 345 350
Ala Ala Ala Thr Gly Ala Ala Gly Gly Thr Gly Thr Ala Cys Ala Thr
355 360 365
Thr Cys Cys Ala Gly Gly Ala Ala Gly Ala Thr Gly Thr Cys Ala Thr
370 375 380
Gly Ala Thr Thr Ala Thr Gly Gly Thr Gly Gly Thr Gly Ala Cys Ala
385 390 395 400
Ala Gly Ala Ala Ala Ala Cys Thr Gly Gly Ala Cys Ala Gly Gly Cys
405 410 415
Ala Gly Gly Ala Ala Thr Ala Gly Thr Thr Gly Gly Thr Gly Cys Ala
420 425 430
Ala Thr Thr Gly Thr Thr Gly Ala Cys Ala Thr Thr Cys Cys Cys Gly
435 440 445
Ala Ala Ala Thr Cys Thr Cys Thr Gly Gly Ala Thr Thr Thr Ala Ala
450 455 460
Gly Gly Ala Gly Ala Thr Gly Gly Cys Ala Cys Cys Cys Ala Thr Gly
465 470 475 480
Gly Ala Ala Cys Ala Gly Thr Thr Cys Ala Thr Thr Gly Cys Thr Cys
485 490 495
Ala Ala Gly Thr Thr Gly Ala Thr Cys Gly Thr Thr Gly Cys Gly Cys
500 505 510
Thr Thr Cys Cys Thr Gly Cys Ala Cys Thr Ala Cys Thr Gly Gly Ala
515 520 525
Thr Gly Thr Cys Thr Cys Ala Ala Ala Gly Gly Thr Cys Thr Thr Gly
530 535 540
Cys Cys Ala Ala Thr Gly Thr Thr Ala Ala Gly Thr Gly Cys Thr Cys
545 550 555 560
Thr Gly Ala Ala Cys Thr Cys Cys Thr Gly Ala Ala Gly Ala Ala Ala
565 570 575
Thr Gly Gly Cys Thr Gly Cys Cys Thr Gly Ala Cys Ala Gly Ala Thr
580 585 590
Gly Thr Gly Cys Ala Ala Gly Thr Thr Thr Thr Gly Cys Thr Gly Ala
595 600 605
Cys Ala Ala Gly Ala Thr Thr Cys Ala Ala Ala Ala Ala Gly Ala Ala
610 615 620
Gly Thr Thr Cys Ala Cys Ala Ala Thr Ala Thr Cys Ala Ala Ala Gly
625 630 635 640
Gly Cys Ala Thr Gly Gly Cys Thr Gly Gly Ala Gly Ala Thr Cys Gly
645 650 655
Thr Thr Gly Ala
660
<210> 20
<211> 486
<212> DNA
<213> Artificial
<220>
<223> Artificial
<400> 20
atgggcgtga aggtactttt cgcactgatc tgcatcgccg ttgccgaggc aaagcgtgga 60
aaaatgcctg gcaaaaaact gccactggca gttatcatgg aaatggaagc caatgctttc 120
aaagctggct gcaccagggg atgccttatc tgtctttcaa aaataaagtg tacagccaaa 180
atgaaggtgt acattccagg aagatgtcat gattatggtg gtgacaagaa aactggacag 240
gcaggaatag ttggtgcaat tgttgacatt cccgaaatct ctggatttaa ggagatggca 300
cccatggaac agttcattgc tcaagttgat cgttgcgctt cctgcactac tggatgtctc 360
aaaggtcttg ccaatgttaa gtgctctgaa ctcctgaaga aatggctgcc tgacagatgt 420
gcaagttttg ctgacaagat tcaaaaagaa gttcacaata tcaaaggcat ggctggagat 480
cgttga 486
<210> 21
<211> 486
<212> DNA
<213> Artificial
<220>
<223> Artificial
<400> 21
atgggcgtga aggtactttt cgcactgatc tgcatcgccg ttgccgaggc aaagcggggt 60
aaaagcccag ggaaaaagct tccattggcc gtgatcatgg aaatcgaggc taacgctttt 120
aaggctggct gtactcgcgg atgtctgatc tgtttaagca aaatcaagtg tacagctaag 180
atgaaggtct atattccagg ccggtgccac gactacggag gcgacaagaa gactggacag 240
gcgggaattg tgggggcaat cgtagacatc ccagaaatta gcgggtttaa ggaaatggag 300
ccaatggagc agttcatagc ccaagtggac aggtgtgcat catgcaccac cggatgccta 360
aaggggttag ccaatgtaaa atgtagcgag cttcttaaga agtggctgcc agatcggtgc 420
gcctcctttg cggacaagat ccagaaagag gtgcacaata ttaaaggcat ggccggagat 480
cgttga 486
<210> 22
<211> 486
<212> DNA
<213> Artificial
<220>
<223> Artificial
<400> 22
atgggtgtga aagtcttatt tgctttgata tgcatagctg tcgctgaagc caaaaggggg 60
aaaagcccgg ggaaaaagct gcctttagcg gttatcatgg agatcgaagc caatgctttc 120
aaagctggct gcactagggg ctgcctgatc tgcctaagta agatcaaatg cactgctaag 180
atgaaggttt atatacctgg aaggtgtcat gattacggtg gtgacaaaaa gactggtcag 240
gctggaattg ttggtgcaat cgtggacatc cccgagattt ctggcttcaa agaaatggag 300
ccaatggagc agtttgtcgc acaagtggac cggtgtgctt cttgtacgac cgggtgtctg 360
aagggcctgg caaatgtaaa gtgtagtgaa ctcctgaaga aatggttacc ggatcggtgt 420
gcctcgtttg ccgataagat ccaaaaagaa gtccataaca taaaaggtat ggcaggcgac 480
agatga 486
<210> 23
<211> 486
<212> DNA
<213> Artificial
<220>
<223> Artificial
<400> 23
atgggcgtga aggtgctgtt cgccctgatc tgcatcgccg tggccgaggc caagagaggc 60
aagagccccg gcaagaagct gcccctggcc gtgatcatgg agatcgaggc caacgccttc 120
aaggccggct gcaccagagg ctgcctgatc tgcctgagca agatcaagtg caccgccaag 180
atgaaggtgt acatccccgg cagatgccac gactacggcg gcgacaagaa gaccggccag 240
gccggcatcg tgggcgccat cgtggacatc cccgagatca gcggcttcaa ggagatggag 300
cccatggagc agttcgtggc ccaggtggac agatgcgcca gctgcaccac cggctgcctg 360
aagggcctgg ccaacgtgaa gtgcagcgag ctgctgaaga agtggctgcc cgacagatgc 420
accggcttcc aggccaagat ccagaaggag gtgcacaaca tcaagggcat ggccggcgac 480
agatga 486
<210> 24
<211> 486
<212> DNA
<213> Artificial
<220>
<223> Artificial
<400> 24
atgggcgtga aggtgctgtt cgccctgatc tgcatcgccg tggccgaggc caagagaggc 60
aagagccccg gcaagaagct gcccctggcc gtgatcatgg agatcgaggc caacgccttc 120
aaggccggct gcaccagagg ctgcctgatc tgcctgagca agatcaagtg caccgccaag 180
atgaaggtgt acatccccgg cagatgccac gactacggcg gcgacaagaa gaccggccag 240
gccggcatcg tgggcgccat cgtggacatc cccgagatca gcggcttcaa ggagatggag 300
cccatcgagc agttcatcgc ccaggtggac agatgcgcca gctgcaccac cggctgcctg 360
aagggcctgg ccaacgtgaa gtgcagcgag ctgctgaaga agtggctgcc cgacagatgc 420
gccagcttcg ccgacaagat ccagaaggag gtgcacaaca tcaagggcat ggccggcgac 480
agatga 486
Claims (16)
- SEQ ID NO: AA1, SEQ ID NO: AA2, SEQ ID NO: AA3, SEQ ID NO: AA4, 및d SEQ ID NO: AA5로 제시된 하나 이상의 펩타이드 서열들을 인코딩하는 하나 이상의 뉴클레오타이드 서열들.
- 제 1항에 있어서,
상기 하나 이상의 뉴클레오타이드 서열들은 SEQ ID NO: AA1, 및/또는 SEQ ID NO: AA2, 및/또는 SEQ ID NO: AA5에 제시된 펩타이드 서열들 중 하나 이상을 인코딩하는, 하나 이상의 뉴클레오타이드 서열들.
- 제 1항 내지 제 2항 중 어느 한 항에 있어서,
상기 뉴클레오타이드 서열들은 SEQ ID NO: 1 내지 SEQ ID NO:7에 제시된 서열들 중 하나 이상인, 하나 이상의 뉴클레오타이드 서열들.
- 제 1항 내지 제 3항 중 어느 한 항에 있어서,
상기 뉴클레오타이드 서열들은 SEQ ID NO: 1 및/또는 SEQ ID NO:2에 제시된 서열들 중 하나 이상인, 하나 이상의 뉴클레오타이드 서열들.
- SEQ ID NO: 1 내지 SEQ ID NO:7에 제시된 서열들 중 하나 이상을 포함하는 벡터.
- 제 5항에 있어서,
상기 벡터는 SEQ ID NO: 1 및/또는 SEQ ID NO:2 중 하나 이상, 그리고 선택적으로(optionally) SEQ ID NO:6을 포함하는, 벡터.
- 제 5항 내지 제 6항 중 어느 한 항에 따른 벡터를 포함하는 세포 또는 세포주.
- 제 1항 내지 제 7항 중 어느 한 항에 있어서,
상기 세포 또는 세포주는 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된 이종 시스-작용(cis-acting) 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 포함하며, 여기서 상기 프로모터는 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결되고, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되고, 그리고 SEQ ID NO:AA1 및 SEQ ID NO:AA2와 다른 두 번째 리포터 단백질의 항시적(constitutive) 생산을 위한 추가의 구조물(construct)을 선택적으로(optionally) 포함하는, 세포 또는 세포주.
- 제 1항 내지 제 8항 중 어느 한 항에 있어서,
상기 세포 또는 세포주는 SEQ ID NO:3 및 SEQ ID NO:4를 추가로 포함하는, 세포 또는 세포주.
- 제1항 내지 제9항 중 어느 한 항에 있어서,
여기서 상기 세포 또는 세포주는 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된 이종 시스-작용 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 포함하고, 여기서 상기 프로모터는 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게 연결되어 있으며, 여기서 상기 오픈 리딩 프레임은 SEQ ID NO: 1 또는 SEQ ID NO: 2에 제시된 뉴클레오타이드 서열을 포함하거나 또는 이로 구성되고, 그리고 선택적으로(optionally) 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된 이종 시스-작용 조절 서열을 포함하는 추가의 구조물(construct)을 포함하고, 여기서 상기 프로모터는 루시페린-기반(luciferin-based) 기질을 필요로 하는 반딧불이 루시페라제와 같은 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동 가능하게 연결되어 있고, 선택적으로 다운스트림 프로모터 서열에 작동가능하게 연결된 세 번째 이종 시스-작용 조절 서열을 포함하는 추가의 구조물(construct)을 포함하며, 여기서 상기 프로모터는 레닐라 루시페라제와 같은 SEQ ID NO:AA1 및 SEQ ID NO:AA2와 다른 코엘렌테라진-기반(coelenterazine-based) 기질을 필요로 하는 루시페라제 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게 연결되어 있는,
세포 또는 세포주.
- 제 1항 내지 제 10항 중 어느 한 항에 있어서,
상기 세포 또는 세포주는 HEK293, HEK293T, K562, U937, Jurkat, Molt-4, HeLa 세포들, HT1080 세포들, ARPE-19, ARPE-19/HPV-16, 곤충(insect) 세포 예를 들어 Sf9 세포들, 조류(avian) 세포들 예를 들어 DT-40, MSB1, 또는 LMH, 마우스 세포들 예를 들어 L929 세포들 또는 LS 변종(variant), 모든 변종들(variants)을 포함하는 중국 햄스터 난소 (Chinese hamster ovary) (CHO) 세포들 예를 들어 CHO-K1, CHO-DXB11, CHO-DG44, CHOK1SV 세포들을 포함하는 군으로부터 선택되는, 메타조안(metazoan) 세포 또는 세포주인,
세포 또는 세포주.
- 진단 방법 또는 약물 스크리닝 방법에서, 제 1항 내지 제 4항 중 어느 한 항에 따른 서열 또는 제 7항 내지 제 11항 중 어느 한 항에 따른 세포 또는 세포주의 용도(Use).
- 제 12항에 있어서,
상기 진단 용도는 테스트 샘플에서 약리학적 활성 분자(pharmacologically active molecule)의 활성을 검출하고 선택적으로(optionally) 정량화하는(quantitating) 방법을 포함하고, 여기서 상기 약물 스크리닝 방법은 고 처리량(high throughput) 스크리닝 방법인, 용도.
- 테스트 샘플에서 약리학적 활성 분자(pharmacologically active molecule)의 활성을 검출하고 선택적으로 정량화하는(quantitating) 방법이며, 상기 방법은:
i) 테스트 샘플을 제공하는 것,
ii) 상기 테스트 샘플을 다운스트림 프로모터 서열에 작동가능하게 연결된, 테스트 샘플에 존재하는 약리(pharmacology) 활성 분자(들)로 상기 세포주의 처리에 반응하는, 제 7항 내지 제 11항에 따른 상기 세포주와 접촉시키는 것, 여기서 상기 프로모터는 SEQ ID NO:AA1 및 SEQ ID NO:AA2와 다른 두 번째 리포터 단백질의 항시적(constitutive) 생산을 위한 추가의 구조물(construct)을 포함하고, 그리고 SEQ ID NO: AA1 및 SEQ ID NO: AA2에 제시된 서열들 중 하나를 포함하는 첫 번째 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게(operably) 연결되는 것,
iii) 코엘렌테라진(coelenterazine) 기반 기질을 사용하여, SEQ ID NO:AA1 또는 SEQ ID NO: AA2에 제시된 상기 첫 번째 리포터 단백질의 상기 활성을 결정하는 것,
iv) 코엘렌테라진(coelenterazine)의 부존재에서 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 중 하나를 포함하는 상기 첫 번째 리포터 단백질의 상기 활성을 효율적으로 억제하는, 상업적으로 이용가능한 루시페린 기반 기질을 사용하여, 동일한 샘플에서 SEQ ID NO:AA1 또는 SEQ ID NO: AA2의 상기 리포터 단백질이 측정된 후 상기 세포주에서 상기 두 번째 리포터 단백질의 상기 활성을 결정하는 것,
v) 상기 두 번째 리포터 단백질 활성에 대하여(relative) 상기 첫 번째 리포터 단백질 활성의 상기 활성을 정규화하는 것(normalizing)
의 단계들을 포함하는 방법.
- 약물 발견(drug discovery)에서 고 처리량(high throughput) 스크리닝을 위한 방법이며, 상기 방법은;
(i) 스크리닝될 약리학적 활성 분자(들)의 라이브러리를 포함하는, 테스트 샘플(들)을 제공하는 것,
(ii) 제 7항 내지 제 11항에 따른 세포주와 상기 테스트 샘플(들)을 접촉시키는 것으로, 상기 세포주는 다운스트림 프로모터 서열에 작동가능하게(operably) 연결된, 테스트 샘플(들)에 존재하는 약리 활성 분자(들)로 상기 세포주의 처리에 반응하는, 이종 시스-작용 조절 서열을 포함하는 첫 번째 이종 폴리뉴클레오타이드를 포함하고, 여기서 상기 프로모터는 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 하나를 포함하는 첫 번째 리포터 단백질을 인코딩하는 오픈 리딩 프레임에 작동가능하게 연결된다.
(iii) 상기 라이브러리를 스크리닝하는 데 사용되는 제제(들) 또는 약물 후보들과 제 7항 내지 제 11항에 따른 세포주를 처리하는 것,
(iv) 선택적으로(optionally), 상기 분석의 정규화에 대해 제공하기 위해,
제 7항 내지 제 11항에 따른 세포주들이 상기 리포터 유전자 구조물(construct)에 사용된 그것과 다르고 그리고 따라서 SEQ ID NO:1 또는 SEQ ID NO:2에 의해 인코딩되는 상기 리포터 단백질들과 다른 루시페라제의 항시적(constitutive) 생산을 위한 구조물(construct)을 추가로 갖는다.
(v) 코엘렌테라진(coelenterazine) 기반 기질 또는 임의의 다른 상업적으로 이용가능한 코엘렌테라진 기반 기질을 사용하여 상기 세포주에서 상기 첫 번째 리포터 단백질의 상기 활성을 결정하는 것,
(vi) 코엘렌테라진의 부존재에서 SEQ ID NO: 1 및 SEQ ID NO: 2에 제시된 서열들 하나를 포함하는 상기 첫 번째 리포터 단백질의 상기 활성을 효율적으로 억제하는 상업적으로 이용가능한 루시페린 기반 기질을 사용하여 상기 리포터 유전자 루시페라제가 동일한 샘플에서 측정된 후 상기 세포주에서 상기 두 번째 리포터 단백질의 상기 활성을 결정하는 것, 및
(vii) 상기 두 번째 루시페라제의 상기 활성에 대해(relative) 정규화된 상기 첫 번째 루시페라제의 상기 활성을 결정하는 것
의 단계들을 포함하는 방법.
- 상기 테스트 샘플에 존재하는 약리 활성 분자(들)에 대한 중화 항체들을 검출하고 그리고 선택적으로 정량화하기 위한 방법이며, 상기 방법은;
(i) 약리학적(pharmacologically) 활성 분자(들)을 포함하는 테스트 샘플을 제공하는 것,
(ii) 첫 번째 및 두 번째 세포 샘플을 제공하는 것이며, 여기서 상기 세포들 샘플들은 제 7항 내지 제 11항에 따른 상기 세포주를 포함하는 것,
(iii) (ii)에서 상기 첫 번째 세포 샘플을 상기 약리 활성 분자(pharmacology active molecule)와 그리고 그 다음에 ((i)에서) 테스트 샘플과 접촉시키는 것,
(iv) 상기 두 번째 세포 샘플을 상기 약리 활성 분자와 접촉시키는 것,
(iv) 상기 첫 번째 세포 샘플의 상기 세포들에서 상기 첫 번째 리포터 단백질의 상기 활성을 결정하는 것 그리고 상기 두 번째 세포 샘플의 상기 세포들에서 상기 첫 번째 리포터 단백질의 상기 활성을 결정하는 것,
(v) 첫 번째 및 두 번째 세포 샘플에서 상기 리포터 활성 사이의 상기 비율을 평가하는 것, 여기서 일보다 더 낮은 비율 (첫 번째/두 번째)는 상기 샘플에서 상기 약리 활성 분자(pharmacology active molecule)에 대한 항체들의 존재를 나타낸다.
의 단계들을 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21170068.7 | 2021-04-23 | ||
EP21170068.7A EP4079846A1 (en) | 2021-04-23 | 2021-04-23 | Novel luciferases with improved properties |
PCT/EP2022/060666 WO2022223768A2 (en) | 2021-04-23 | 2022-04-22 | Novel luciferases with improved properties |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230172542A true KR20230172542A (ko) | 2023-12-22 |
Family
ID=75659862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237039320A KR20230172542A (ko) | 2021-04-23 | 2022-04-22 | 개선된 특성들을 가진 신규한 루시페라제들 |
Country Status (4)
Country | Link |
---|---|
EP (2) | EP4079846A1 (ko) |
JP (1) | JP2024517633A (ko) |
KR (1) | KR20230172542A (ko) |
WO (1) | WO2022223768A2 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6696621B2 (en) * | 2001-02-23 | 2004-02-24 | Paradigm Genetics, Inc. | Selectable marker in plants |
WO2009111572A2 (en) | 2008-03-04 | 2009-09-11 | Le Centre Nationale De La Recherche Scientifique | Cell, method and kit for conducting an assay for neutralizing antibodies |
CN103582701B (zh) * | 2010-12-03 | 2018-08-14 | 基因流股份有限公司 | 改善的光-发射分子 |
EP3436037A4 (en) * | 2016-03-31 | 2019-12-04 | University of Southern California | HIGHLY SENSITIVE AND SPECIFIC LUCIFERASE-BASED REPORTER TEST FOR ANTIGEN DETECTION |
WO2020257638A1 (en) * | 2019-06-21 | 2020-12-24 | University Of Utah Research Foundation | Novel live-cell assay for neuronal activity |
-
2021
- 2021-04-23 EP EP21170068.7A patent/EP4079846A1/en not_active Withdrawn
-
2022
- 2022-04-22 JP JP2023563985A patent/JP2024517633A/ja active Pending
- 2022-04-22 EP EP22724710.3A patent/EP4326859A2/en active Pending
- 2022-04-22 KR KR1020237039320A patent/KR20230172542A/ko active Search and Examination
- 2022-04-22 WO PCT/EP2022/060666 patent/WO2022223768A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022223768A3 (en) | 2022-11-24 |
EP4326859A2 (en) | 2024-02-28 |
WO2022223768A2 (en) | 2022-10-27 |
EP4079846A1 (en) | 2022-10-26 |
JP2024517633A (ja) | 2024-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101538624B1 (ko) | 오플로포러스-유래된 루시퍼라아제, 신규 코엘렌테라진 기질, 및 사용 방법 | |
US20170226495A1 (en) | Sortase molecules and uses thereof | |
US20100204052A1 (en) | Protein scaffolds and uses thereof | |
US7655439B2 (en) | Trimerizing polypeptides | |
US20060234299A1 (en) | Protein scaffolds and uses thereof | |
CN114380922A (zh) | 在细胞内产生点突变的融合蛋白、其制备及用途 | |
CN1378593A (zh) | 构建融合文库的方法和组合物及该文库的用途 | |
US8003757B2 (en) | Receptor-based interaction trap | |
JP2008528033A (ja) | ポリペプチドの分泌を検出するためのリーダー配列およびその産生のための方法 | |
KR20100065332A (ko) | 제조 방법 | |
KR20160003705A (ko) | 발현 방법 | |
EP2839011B1 (en) | Method for the expression of polypeptides using modified nucleic acids | |
US6800457B2 (en) | Expression vectors containing hot spot for increased recombinant protein expression in transfected cells | |
US20100184619A1 (en) | Method for analyzing organelle-localized protein and material for analysis | |
KR20230172542A (ko) | 개선된 특성들을 가진 신규한 루시페라제들 | |
JP6824594B2 (ja) | 合成遺伝子の設計方法 | |
JP2004538002A (ja) | 停止コドン抑制による組み換え遺伝子発現の新規方法 | |
CA2311678C (en) | Signal sequence trapping method | |
US9587000B2 (en) | VP16-CREB fusion gene | |
WO2024051728A9 (en) | Il-18 variant polypeptides | |
WO2024051728A1 (en) | Il-18 variant polypeptides | |
US20040209323A1 (en) | Protein expression by codon harmonization and translational attenuation | |
JP2019187453A (ja) | 合成遺伝子の設計方法 | |
JPH11514854A (ja) | 転写活性化のインヒビターについてのスクリーニングのための方法および構築物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |