KR20190113860A - 신규한 루시퍼라제 및 이를 이용하는 방법 - Google Patents
신규한 루시퍼라제 및 이를 이용하는 방법 Download PDFInfo
- Publication number
- KR20190113860A KR20190113860A KR1020197025169A KR20197025169A KR20190113860A KR 20190113860 A KR20190113860 A KR 20190113860A KR 1020197025169 A KR1020197025169 A KR 1020197025169A KR 20197025169 A KR20197025169 A KR 20197025169A KR 20190113860 A KR20190113860 A KR 20190113860A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- pro
- arg
- ile
- Prior art date
Links
- 108060001084 Luciferase Proteins 0.000 title claims abstract description 199
- 238000000034 method Methods 0.000 title claims abstract description 66
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 167
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 161
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 161
- 210000004027 cell Anatomy 0.000 claims abstract description 113
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 111
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 89
- 239000012634 fragment Substances 0.000 claims abstract description 66
- 238000002372 labelling Methods 0.000 claims abstract description 9
- 239000005089 Luciferase Substances 0.000 claims description 162
- 230000014509 gene expression Effects 0.000 claims description 57
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 48
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 claims description 35
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 claims description 30
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 claims description 30
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 claims description 30
- 230000009261 transgenic effect Effects 0.000 claims description 22
- 108091035707 Consensus sequence Proteins 0.000 claims description 7
- 230000001105 regulatory effect Effects 0.000 claims description 6
- 230000030570 cellular localization Effects 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 230000002759 chromosomal effect Effects 0.000 claims description 3
- 102000037983 regulatory factors Human genes 0.000 claims description 2
- 108091008025 regulatory factors Proteins 0.000 claims description 2
- 210000003850 cellular structure Anatomy 0.000 claims 1
- 239000002773 nucleotide Substances 0.000 abstract description 39
- 125000003729 nucleotide group Chemical group 0.000 abstract description 39
- 241000233866 Fungi Species 0.000 abstract description 16
- 230000035772 mutation Effects 0.000 abstract description 16
- 239000000203 mixture Substances 0.000 abstract description 12
- 230000000694 effects Effects 0.000 abstract description 11
- 210000003463 organelle Anatomy 0.000 abstract description 5
- 230000001131 transforming effect Effects 0.000 abstract description 5
- 238000010353 genetic engineering Methods 0.000 abstract description 4
- 238000012360 testing method Methods 0.000 abstract description 4
- 230000004850 protein–protein interaction Effects 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 70
- 238000005415 bioluminescence Methods 0.000 description 39
- 230000029918 bioluminescence Effects 0.000 description 39
- 239000013598 vector Substances 0.000 description 37
- 229940024606 amino acid Drugs 0.000 description 32
- 150000001413 amino acids Chemical class 0.000 description 32
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 28
- 108010068265 aspartyltyrosine Proteins 0.000 description 25
- 239000002609 medium Substances 0.000 description 23
- 241000196324 Embryophyta Species 0.000 description 21
- 238000007254 oxidation reaction Methods 0.000 description 21
- 238000002703 mutagenesis Methods 0.000 description 20
- 231100000350 mutagenesis Toxicity 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 229920001184 polypeptide Polymers 0.000 description 19
- 102000004196 processed proteins & peptides Human genes 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 241000588724 Escherichia coli Species 0.000 description 18
- 230000003647 oxidation Effects 0.000 description 17
- 239000000243 solution Substances 0.000 description 17
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 15
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 15
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 15
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 15
- OBCRZLRPJFNLAN-DCAQKATOSA-N Met-His-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OBCRZLRPJFNLAN-DCAQKATOSA-N 0.000 description 15
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 15
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 15
- 239000000523 sample Substances 0.000 description 15
- 238000001228 spectrum Methods 0.000 description 15
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 14
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 14
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 13
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 13
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 13
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 13
- 241001465754 Metazoa Species 0.000 description 13
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 13
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 13
- 108010093581 aspartyl-proline Proteins 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 108010029020 prolylglycine Proteins 0.000 description 13
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 12
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 12
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 12
- YHIPILPTUVMWQT-UHFFFAOYSA-N Oplophorus luciferin Chemical compound C1=CC(O)=CC=C1CC(C(N1C=C(N2)C=3C=CC(O)=CC=3)=O)=NC1=C2CC1=CC=CC=C1 YHIPILPTUVMWQT-UHFFFAOYSA-N 0.000 description 12
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 12
- SVGAWGVHFIYAEE-JSGCOSHPSA-N Trp-Gly-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 SVGAWGVHFIYAEE-JSGCOSHPSA-N 0.000 description 12
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 12
- 239000002299 complementary DNA Substances 0.000 description 12
- 108010049041 glutamylalanine Proteins 0.000 description 12
- 238000004020 luminiscence type Methods 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 12
- 241000216633 Armillaria gallica Species 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 11
- 241000263600 Mycena chlorophos Species 0.000 description 11
- 241001247959 Omphalotus olearius Species 0.000 description 11
- 102000037865 fusion proteins Human genes 0.000 description 11
- 108020001507 fusion proteins Proteins 0.000 description 11
- 108010017446 glycyl-prolyl-arginyl-proline Proteins 0.000 description 11
- 108010057821 leucylproline Proteins 0.000 description 11
- WXPZDDCNKXMOMC-AVGNSLFASA-N (2s)-1-[(2s)-2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@H](C(O)=O)CCC1 WXPZDDCNKXMOMC-AVGNSLFASA-N 0.000 description 10
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 10
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 10
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 10
- 241001296613 Mycena citricolor Species 0.000 description 10
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 10
- 241000222639 Panellus stipticus Species 0.000 description 10
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 10
- 108010079547 glutamylmethionine Proteins 0.000 description 10
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 238000001890 transfection Methods 0.000 description 10
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 9
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 9
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 9
- 244000221226 Armillaria mellea Species 0.000 description 9
- 235000011569 Armillaria mellea Nutrition 0.000 description 9
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 9
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 9
- NUEHSWNAFIEBCQ-NAKRPEOUSA-N Ile-Val-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUEHSWNAFIEBCQ-NAKRPEOUSA-N 0.000 description 9
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 9
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 108010008355 arginyl-glutamine Proteins 0.000 description 9
- 238000001727 in vivo Methods 0.000 description 9
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 9
- 108010009298 lysylglutamic acid Proteins 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 8
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 8
- 241000216654 Armillaria Species 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 8
- 240000000249 Morus alba Species 0.000 description 8
- 235000008708 Morus alba Nutrition 0.000 description 8
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 8
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 8
- 238000005119 centrifugation Methods 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 210000001938 protoplast Anatomy 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 7
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 7
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 7
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 7
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 7
- 108010047357 Luminescent Proteins Proteins 0.000 description 7
- 102000006830 Luminescent Proteins Human genes 0.000 description 7
- 241001237922 Neonothopanus nambi Species 0.000 description 7
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 7
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 7
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- -1 but in this case Chemical compound 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 230000002538 fungal effect Effects 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 6
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 6
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 6
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 6
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 6
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 6
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 6
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 6
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 6
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 6
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 6
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 6
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 6
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 6
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 6
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 6
- BAWFJGJZGIEFAR-NNYOXOHSSA-N NAD zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-N 0.000 description 6
- 240000001439 Opuntia Species 0.000 description 6
- 235000013389 Opuntia humifusa var. humifusa Nutrition 0.000 description 6
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 6
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 6
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 6
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000002347 injection Methods 0.000 description 6
- 239000007924 injection Substances 0.000 description 6
- 210000004962 mammalian cell Anatomy 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 229950006238 nadide Drugs 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid group Chemical group C(CCCCCCC\C=C/CCCCCCCC)(=O)O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 229920001817 Agar Polymers 0.000 description 5
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 5
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 5
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 5
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 5
- 241000216635 Armillaria ostoyae Species 0.000 description 5
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 5
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 5
- 108091033409 CRISPR Proteins 0.000 description 5
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 5
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 5
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 5
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 5
- 108020005004 Guide RNA Proteins 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 5
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 5
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 101100460719 Mus musculus Noto gene Proteins 0.000 description 5
- 241000699670 Mus sp. Species 0.000 description 5
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 5
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 5
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 5
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 5
- 108010003201 RGH 0205 Proteins 0.000 description 5
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 5
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 5
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 101100187345 Xenopus laevis noto gene Proteins 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 239000008272 agar Substances 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 210000001161 mammalian embryo Anatomy 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 4
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 4
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 4
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 4
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 4
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 4
- ZQFZEBRNAMXXJV-KKUMJFAQSA-N Asp-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O ZQFZEBRNAMXXJV-KKUMJFAQSA-N 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 241000252212 Danio rerio Species 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- SFKMXFWWDUGXRT-NWLDYVSISA-N Glu-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N)O SFKMXFWWDUGXRT-NWLDYVSISA-N 0.000 description 4
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 4
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 4
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 4
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 4
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 4
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 4
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 4
- 108090000604 Hydrolases Proteins 0.000 description 4
- 102000004157 Hydrolases Human genes 0.000 description 4
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 4
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 4
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 4
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 4
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 4
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 4
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 4
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 241000606860 Pasteurella Species 0.000 description 4
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 4
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 4
- 241000195887 Physcomitrella patens Species 0.000 description 4
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 4
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 4
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 4
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 4
- 241001340896 Pyralis Species 0.000 description 4
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 4
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 4
- 241000121220 Tricholoma matsutake Species 0.000 description 4
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 108010054812 diprotin A Proteins 0.000 description 4
- 235000021186 dishes Nutrition 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 235000020077 pisco Nutrition 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 230000019491 signal transduction Effects 0.000 description 4
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 4
- 229920002554 vinyl polymer Polymers 0.000 description 4
- WRHMXGUVFLEOJF-ZZXKWVIFSA-N 3,4-dihydroxy-6-[(E)-2-(4-hydroxyphenyl)ethenyl]pyran-2-one Chemical compound Oc1ccc(\C=C\c2cc(O)c(O)c(=O)o2)cc1 WRHMXGUVFLEOJF-ZZXKWVIFSA-N 0.000 description 3
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 3
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 3
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 3
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 3
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 3
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 3
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 3
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 3
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 3
- 244000063299 Bacillus subtilis Species 0.000 description 3
- 241000221198 Basidiomycota Species 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 3
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 3
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 3
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 3
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 3
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 3
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 3
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 3
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 3
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 3
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 3
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 3
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 3
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 3
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 3
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 3
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 3
- 108091061960 Naked DNA Proteins 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 241001536563 Panus Species 0.000 description 3
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 3
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 3
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 3
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 3
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 3
- 235000011613 Pinus brutia Nutrition 0.000 description 3
- 241000018646 Pinus brutia Species 0.000 description 3
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 3
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 3
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 3
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 3
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 3
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 3
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 3
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 3
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 3
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 3
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 3
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 3
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 210000002308 embryonic cell Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001917 fluorescence detection Methods 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 238000011503 in vivo imaging Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000002515 oligonucleotide synthesis Methods 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 230000000149 penetrating effect Effects 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 230000003389 potentiating effect Effects 0.000 description 3
- 238000001742 protein purification Methods 0.000 description 3
- WQGWDDDVZFFDIG-UHFFFAOYSA-N pyrogallol Chemical compound OC1=CC=CC(O)=C1O WQGWDDDVZFFDIG-UHFFFAOYSA-N 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 125000005504 styryl group Chemical group 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 239000003440 toxic substance Substances 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 239000007222 ypd medium Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- RCQRKPUXJAGEEC-ZLUOBGJFSA-N Ala-Cys-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O RCQRKPUXJAGEEC-ZLUOBGJFSA-N 0.000 description 2
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 2
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 2
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 2
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 2
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 2
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- GJBOLSUJHGTFAL-AATRIKPKSA-N C1CCN2C3=C(C=C(C=C13)/C=C/C1=CC(=C(C(O1)=O)O)O)CCC2 Chemical compound C1CCN2C3=C(C=C(C=C13)/C=C/C1=CC(=C(C(O1)=O)O)O)CCC2 GJBOLSUJHGTFAL-AATRIKPKSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 2
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 2
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 2
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 2
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 2
- CMMBEMZGNGYJRJ-IHRRRGAJSA-N His-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N CMMBEMZGNGYJRJ-IHRRRGAJSA-N 0.000 description 2
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 2
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001576503 Mellea Species 0.000 description 2
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 2
- ODFBIJXEWPWSAN-CYDGBPFRSA-N Met-Ile-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O ODFBIJXEWPWSAN-CYDGBPFRSA-N 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241000222638 Panellus Species 0.000 description 2
- 241001596784 Pegasus Species 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 2
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 2
- 241000254064 Photinus pyralis Species 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 241000242739 Renilla Species 0.000 description 2
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- UCCNDUPVIFOOQX-CUJWVEQBSA-N Thr-Cys-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 UCCNDUPVIFOOQX-CUJWVEQBSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 2
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 2
- YXSSXUIBUJGHJY-SFJXLCSZSA-N Trp-Thr-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)[C@H](O)C)C(O)=O)C1=CC=CC=C1 YXSSXUIBUJGHJY-SFJXLCSZSA-N 0.000 description 2
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 2
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 2
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 2
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 2
- PDASTHRLDFOZMG-JYJNAYRXSA-N Val-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 PDASTHRLDFOZMG-JYJNAYRXSA-N 0.000 description 2
- 241000269370 Xenopus <genus> Species 0.000 description 2
- 241000269368 Xenopus laevis Species 0.000 description 2
- 108010084455 Zeocin Proteins 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 125000004093 cyano group Chemical group *C#N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000004720 fertilization Effects 0.000 description 2
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 2
- 235000019688 fish Nutrition 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 210000003000 inclusion body Anatomy 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000001000 micrograph Methods 0.000 description 2
- 230000003228 microsomal effect Effects 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001590 oxidative effect Effects 0.000 description 2
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 2
- 231100000614 poison Toxicity 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000012846 protein folding Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- UHUFTBALEZWWIH-UHFFFAOYSA-N tetradecanal Chemical compound CCCCCCCCCCCCCC=O UHUFTBALEZWWIH-UHFFFAOYSA-N 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- MPVGZUDRATZEEE-YFKPBYRVSA-N (2s)-2-amino-3-(3-hydroxyimidazol-4-yl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1O MPVGZUDRATZEEE-YFKPBYRVSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 101710149506 28 kDa protein Proteins 0.000 description 1
- NCQVIRXINIIOJT-UHFFFAOYSA-N 3,4-dihydroxypyran-2-one Chemical compound OC=1C=COC(=O)C=1O NCQVIRXINIIOJT-UHFFFAOYSA-N 0.000 description 1
- 108010000239 Aequorin Proteins 0.000 description 1
- 241000222485 Agaricales Species 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- AAXVGJXZKHQQHD-LSJOCFKGSA-N Ala-His-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N AAXVGJXZKHQQHD-LSJOCFKGSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- XKXAZPSREVUCRT-BPNCWPANSA-N Ala-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=C(O)C=C1 XKXAZPSREVUCRT-BPNCWPANSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- BNODVYXZAAXSHW-IUCAKERBSA-N Arg-His Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BNODVYXZAAXSHW-IUCAKERBSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 1
- QLRRUWXMMVXORS-UHFFFAOYSA-N Augustine Natural products C12=CC=3OCOC=3C=C2CN2C3CC(OC)C4OC4C31CC2 QLRRUWXMMVXORS-UHFFFAOYSA-N 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 244000056139 Brassica cretica Species 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 244000223760 Cinnamomum zeylanicum Species 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 241000252203 Clupea harengus Species 0.000 description 1
- 101710137943 Complement control protein C3 Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 241000035538 Cypridina Species 0.000 description 1
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 1
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 1
- 108050008072 Cytochrome c oxidase subunit IV Proteins 0.000 description 1
- 102000000634 Cytochrome c oxidase subunit IV Human genes 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- 101150074155 DHFR gene Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 241000199914 Dinophyceae Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241001427543 Elateridae Species 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 102000030902 Galactosyltransferase Human genes 0.000 description 1
- 108060003306 Galactosyltransferase Proteins 0.000 description 1
- 241000963438 Gaussia <copepod> Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- GXMBDEGTXHQBAO-NKIYYHGXSA-N Gln-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N)O GXMBDEGTXHQBAO-NKIYYHGXSA-N 0.000 description 1
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 1
- QQQHYJFKDLDUNK-CIUDSAMLSA-N His-Asp-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QQQHYJFKDLDUNK-CIUDSAMLSA-N 0.000 description 1
- LBHOVGUGOBINDL-KKUMJFAQSA-N His-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O LBHOVGUGOBINDL-KKUMJFAQSA-N 0.000 description 1
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 1
- 101001033280 Homo sapiens Cytokine receptor common subunit beta Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 241001632576 Hyacinthus Species 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- MUFXDFWAJSPHIQ-XDTLVQLUSA-N Ile-Tyr Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 MUFXDFWAJSPHIQ-XDTLVQLUSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 241001506991 Komagataella phaffii GS115 Species 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 235000013956 Lactobacillus acidophilus Nutrition 0.000 description 1
- 241000254158 Lampyridae Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- 241001673526 Lydia Species 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- ZEDVFJPQNNBMST-CYDGBPFRSA-N Met-Arg-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZEDVFJPQNNBMST-CYDGBPFRSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 1
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 241000186140 Metridia longa Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 241000207746 Nicotiana benthamiana Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241001237902 Omphalotus Species 0.000 description 1
- 241000238590 Ostracoda Species 0.000 description 1
- AVFIYMSJDDGDBQ-UHFFFAOYSA-N Parthenium Chemical compound C1C=C(CCC(C)=O)C(C)CC2OC(=O)C(=C)C21 AVFIYMSJDDGDBQ-UHFFFAOYSA-N 0.000 description 1
- 241001495454 Parthenium Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 108010085186 Peroxisomal Targeting Signals Proteins 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- GAMLAXHLYGLQBJ-UFYCRDLUSA-N Phe-Val-Tyr Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC1=CC=C(C=C1)O)C(C)C)CC1=CC=CC=C1 GAMLAXHLYGLQBJ-UFYCRDLUSA-N 0.000 description 1
- 241000360552 Phengodidae Species 0.000 description 1
- BELBBZDIHDAJOR-UHFFFAOYSA-N Phenolsulfonephthalein Chemical compound C1=CC(O)=CC=C1C1(C=2C=CC(O)=CC=2)C2=CC=CC=C2S(=O)(=O)O1 BELBBZDIHDAJOR-UHFFFAOYSA-N 0.000 description 1
- 108010030688 Photinus luciferase Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 1
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- 238000010802 RNA extraction kit Methods 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101710152003 Suppressor of silencing P0 Proteins 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- OCCYDHCUKXRPSJ-SXNHZJKMSA-N Trp-Ile-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OCCYDHCUKXRPSJ-SXNHZJKMSA-N 0.000 description 1
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 1
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 1
- QFHRUCJIRVILCK-YJRXYDGGSA-N Tyr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O QFHRUCJIRVILCK-YJRXYDGGSA-N 0.000 description 1
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 101000756604 Xenopus laevis Actin, cytoplasmic 1 Proteins 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 238000007845 assembly PCR Methods 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000003390 bioluminescence detection Methods 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 229910001424 calcium ion Inorganic materials 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 235000017803 cinnamon Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 description 1
- 239000004062 cytokinin Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical group P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 238000002270 exclusion chromatography Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 102000005525 fibrillarin Human genes 0.000 description 1
- 108020002231 fibrillarin Proteins 0.000 description 1
- JLYXXMFPNIAWKQ-GNIYUCBRSA-N gamma-hexachlorocyclohexane Chemical class Cl[C@H]1[C@H](Cl)[C@@H](Cl)[C@@H](Cl)[C@H](Cl)[C@H]1Cl JLYXXMFPNIAWKQ-GNIYUCBRSA-N 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 235000019514 herring Nutrition 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 102000055647 human CSF2RB Human genes 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 229940127121 immunoconjugate Drugs 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 125000000814 indol-3-yl group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C([*])C2=C1[H] 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 229940039695 lactobacillus acidophilus Drugs 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000504 luminescence detection Methods 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 230000004297 night vision Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 230000008823 permeabilization Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000014318 peroxisome localization Effects 0.000 description 1
- 229960003531 phenolsulfonphthalein Drugs 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000005892 protein maturation Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 235000019231 riboflavin-5'-phosphate Nutrition 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 101150107585 tetA gene Proteins 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 150000003679 valine derivatives Chemical class 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000001429 visible spectrum Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/40—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N11/00—Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/66—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving luciferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/12—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/12—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
- C12Y113/12007—Photinus-luciferin 4-monooxygenase (ATP-hydrolysing) (1.13.12.7), i.e. firefly-luciferase
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/502—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
- G01N33/5023—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/531—Production of immunochemical test materials
- G01N33/532—Production of labelled immunochemicals
- G01N33/535—Production of labelled immunochemicals with enzyme label or co-enzymes, co-factors, enzyme inhibitors or enzyme substrates
Abstract
본 발명은 신규한 루시퍼라제, 이의 기능성 단편, 상동체(homologous) 및 돌연변이를 암호화하는 핵산 분자, 및 상기 핵산에 의해 암호화되는 단백질에 관한 것이다. 관심 있는 핵산 분자는 균류(fungi)로부터 분리되거나 또는 유전공학적 방법에 의해 수득된다. 또한, 상기 핵산 분자를 포함하는 숙주세포, 안정한 세포주(stable cell line) 및 형질전환 유기체가 제공된다. 이에 더하여, 본 발명의 단백질에 특이적인 항체가 제공된다. 상기 단백질 및 핵산은 많은 적용분야 및 방법에 이용되고 있으며, 특히, 유기체, 세포, 세포 소기관, 또는 단백질의 표지에 이용되고 있다. 또한, 상기 단백질 및 뉴클레오티드 조성물은 다양한 조건하에서 단백질-단백질 상호작용을 검출하는 방법, 프로모터 활성을 테스트하는 방법에 이용된다. 마지막으로, 다양한 방법 및 적용분야에서 본 발명의 단백질 및 핵산을 이용하기 위한 키트가 제공된다.
Description
본 발명은 일반적으로 생물학 및 화학 분야에 관한 것이며, 특히, 루시퍼라제에 관한 것이다.
생물 발광(Bioluminescence)은 빛을 생성 및 방출하는 생물학적 유기체(biological organism) 또는 생체분자의 능력을 의미한다. 생물 발광을 생성하는 능력은 루시퍼라제(luciferase) 또는 광단백질(photoprotein)과 같은 특정한 단백질의 존재에 의해 결정된다. 루시퍼라제는 저분자 화합물(low molecular weight compound), 즉, 루시페린(luciferin)의 산화를 촉매하고(catalyzing), 이들을 옥시루시페린(oxyluciferin)으로 전환시키는 효소이다. 산화는 빛의 방출 및 옥시루시페린의 방출을 동반한다.
또한, 광단백질은 루시페린의 산화를 촉매하나, 이 경우에, 루시페린은 보결분자단(prosthetic group)으로 작용해서 안정한 광단백질 복합체를 형성한다. 광단백질에 의해 생성된 빛의 양은 이의 농도에 거의 비례하는 반면, 루시퍼라제의 경우에는 효소의 농도와 루시페린의 농도 모두에 좌우된다. 많은 경우에서, 광단백질에 의해 촉매되는 생물발광 반응은 매질 중 금속 이온의 방출에 응하여 활성화된다. 예를 들어, 에쿼린 광단백질(aequorin photoprotein)은 빛의 짧은 섬광(short flash)의 방출을 야기하는 칼슘 이온의 방출에 응하여, 루시페린[코엘렌테라진(coelenterazine)]의 산화를 촉매한다.
루시퍼라제는 생물의약품 및 생명공학의 많은 적용분야에서 리포터 유전자로 이용된다. 특히, 이들은 진단법, 매질 중 미생물 및 독성 제제(toxic agent)를 검출하는 방법에 이용되고, 또한, 이들은 다양한 물질 농도의 검출, 신호전달 연쇄반응(signalling cascade)의 활성의 검출 등에 이용된다 [Scott et al., Annu Rev Anal Chem, 2011, 4: 297-319; Badr and Tannous, Trends Biotechnol. 2011, 29: 624-33; Andreu et al., FEMS Microbiol Rev. 2011, 35: 360-94]. 루시퍼라제를 응용하는 많은 방법들이 검토되어 왔다 [Kaskova et al., Chem Soc Rev., 2016, 45: 6048-6077; Scott et al., Annu Rev Anal Chem, 2011, 4: 297-319; Widder and Falls, IEEE Journal of Selected Topics in Quantum Electronics, 2014, 20: 232-241].
현재, 몇몇 유형의 생물 발광 시스템이 공지되어 있다. 다양한 유기체가 40회가 넘는 진화의 과정에서 이들을 독립적으로 발달시켰다는 것이 밝혀졌다 [Herring, Journal of Bioluminescence and Chemiluminescence, 1987, 1: 147-63; Haddock et al., Annual Review of Marine Science, 2010; 2: 443-93].
D-루시페린의 산화를 촉매하는, 포티누스 피랄리스 ( Photinus pyralis ) (북미 반딧불이)로부터의 루시퍼라제가 기술되어 있다 [de Wet et al., Proc. Natl. Acad. Sci. USA, 1985, 82: 7870-3; de Wet et al., Proc. Natl. Acad. Sci. USA, 1987, 7: 725-37]. D-루시페린의 산화는 560 nm에서 방출 최대(emission maximum)를 갖는 연두색 빛의 방출을 동반한다. 동일한 D-루시페린이 다른 곤충 루시퍼라제에 의해 산화되는데, 오늘부로, 딱정벌레과(Phengodidae), 방아벌레과(Elateridae) 및 반딧불이과(Lampyridae)의 다양한 곤충 종으로부터의 30종이 넘는 효소들 - 536 내지 630 nm 범위에서 방출 최대를 갖는 빛을 방출하는 - 이 클로닝되었다. 또한, 곤충 루시퍼라제의 돌연변이형이 기술되었고, 합성 D-루시페린 유사체가 생산되었는데, 이는 상이한 특성을 지닌 루시페린-루시퍼라제 페어(pair)의 수득을 가능하게 한다 [Thorne et al., Chem Biol., 2010, 17: 646-57]. 매우 다양한 유사체에도 불구하고, 반응의 높은 양자 효율 (0.88+-0.25 [Seliger and McElroy, Arch Biochem Biophys, 1960, 88: 136-141])로 인해, 여전히 D-루시페린이 시험관내 생물발광에 대한 가장 통상적인 기질이다. 이 시스템의 이용에 있어서, 중대한 어려움은 포티누스 피랄리스로부터의 루시퍼라제의 상대적으로 큰 분자량(61 kDa)이다. 이 사실은 이의 증가된 게놈의 낮은 안정성으로 인해, 이 시스템을 몇몇 키메라 단백질(예를 들어, 바이러스의 연구를 위한)의 고안에 부적합하도록 만든다 [Tran et al., J Virol, 2013, 87: 13321-13329; Tran et al., Viruses, 2015, 7: 5319-5327]. 다른 어려움은 광학적으로 순수한 (enantiomerically pure) 형태의 D-루시페린의 수득의 필요성인데, 그 이유는 이의 이성질체인 L-루시페린이 반응의 강력한 경쟁적 저해제이기 때문이다 [Lembert, Biochem J, 1996, 317: 273-277]. 포티누스 피랄리스로부터의 루시퍼라제가 분비되지 않는다는 사실도 생체 내 생물 발광 신호의 정량화에 대한 추가의 한계점에 처하게 한다.
또한, 코엘렌테라진의 산화를 촉매하는 큰 그룹의 루시퍼라제 및 광단백질이 기술되어 있다. 예를 들어, 레닐라 ( Renilla ), 가우시아 ( Gaussia ) 및 메트리디아 롱가(Metridia longa )에서의 코엘렌테라진-의존성 생물 발광 시스템이 기술되어 있고 [O. Shimomura, Bioluminescence: Chemical Principles and Methods, World Scientific Publishing Co. Pte. Ltd, Singapore, 2006, 470 p.], 광범위하게 사용되고 있다. 코엘렌테라진-의존성 루시퍼라제 및 광단백질의 돌연변이형 및 코엘렌테라진의 합성 유사체가 또한 수득되었다 [Kaskova et al., Chem Soc Rev., 2016, 45: 6048-6077]. 코엘렌테라진 시스템의 복수의 이점 - 즉, 분비될 수 있는 능력, 작은 크기 및 이용할 수 있는 루시퍼라제가 매우 다양함 - 에도 불구하고, 이의 적용에 대한 주요 한계점은 청색 영역(blue region)에서의 생물 발광 방출 최대의 위치에 주로 관련되어 있는데, 결과적으로, 청색광은 관심 있는 조직에 의해 생체 내에서 대부분 흡수된다. 게다가, 생물 발광 기질 자체가 비-효소적 산화 동안에 주변의 산소에 의해 빛을 방출할 수 있는데 [조직에서, 초과산화물 음이온(superoxide anion) 및 퍼옥시니트리트 이온(peroxynitrite ion)의 존재는 이 과정을 강화시킴], 이는 측정된 생물 발광 신호에서 노이즈를 야기한다.
해양 세균(marine bacteria)에 관한 생물 발광 시스템의 다른 예시가 기술되어 있다. 이 시스템은 다른 생물 발광 시스템과 현저히 상이하다. 세균 루시페린 [미리스틱 알데히드(myristic aldehyde)]은 반응 동안에 산화되나, 생물 발광 방출체(emitter)는 아니다 [O. Shimomura, Bioluminescence: Chemical Principles and Methods, World Scientific Publishing Co. Pte. Ltd, Singapore, 2006? 470 p.]. 루시페린 외에, 발광 반응(luminescent reaction)의 주요 구성요소는 니코틴아미드 아데닌 디뉴클레오티드(nicotinamide adenine dinucleotide, NADH)와 플라빈 모노뉴클레오티드(flavin mononucleotide, FMN-H2)이며, 이들의 산화된 유사체가 진정한 광원(true light source)으로 작용한다. 해양 세균의 생물 발광 시스템은 원핵생물 발현 시스템에만 적용되기 때문에, 이들은 사용이 한정되어 있다.
고 반응성(highly reactive) 루시페린과 매우 안정한 루시퍼라제를 특징으로 하는, 패충류(ostracod) 사이프리디나(Cypridina)의 생물 발광 시스템이 공지되어 있다 [Shimomura et al., Science, 1969, 164: 1299-300]. 이 생물 발광 시스템의 주요 불리한 점 중 하나는 공기 중에서, 특히 불순물이 존재하는 경우에, 사이프리디나 루시페린의 극도로 낮은 안정성이다. 루시페린의 생물 발광 최대는 448-463 nm의 범위 내에 있다(용액의 이온 강도에 따라). 이 사실은 이 시스템이 심부 조직(deep tissue)에서 변형된 형태의 생체 내 적용에 부적합하도록 만든다.
와편모충류(dinoflagellate) 및 난바다곤쟁이류(euphausiids)의 생물 발광 시스템이 또한 공지되어 있다. 오늘부로, 이 그룹의 세 종의 루시퍼라제를 코딩하는(coding) 유전자가 클로닝되어 있다 [O. Shimomura, Bioluminescence: Chemical Principles and Methods, World Scientific Publishing Co. Pte. Ltd, Singapore, 2006]. 이들 시스템의 중대한 불리한 점은 이들에 대한 지식이 부족한 것인데, 전체 루시퍼라제 서열이 아직 확인되지 않았고, 이 시스템의 적용의 범위가 결정되지 않았다. 오늘부로, 와편모충류 및 난바다곤쟁이류의 생물 발광 메커니즘과 관련된 지식은 단편적이다.
오늘날 이용되고 있는 복수의 생물 발광 시스템에도 불구하고, 새로운 특성을 지니는, 더 많은 루시페린-루시퍼라제 페어에 대한 필요성이 여전히 존재한다. 특히, 수-가용성 세포-투과성 루시페린을 산화시키는 것이 가능한 ATP- 및 NAD(P)H-비의존성 루시퍼라제는 이로울 수 있다.
이 점에 있어서, 균류 루시퍼라제(fungal luciferase)는 대단한 관심사이다. 균류 생물 발광은 공지되어 있다. 더욱이, 아리스토텔레스의 논문(Aristotle's tractates)에서도 언급되었다. 그러나, 균류 생물 발광 시스템은 여전히 잘 알려져 있지 않다. 1959년에, Airth와 McElroy는 균류 생물 발광 시스템이 적어도 하나의 열-민감성 구성요소, 즉, 루시퍼라제와 열-비민감성 (heat-insensitive) 구성요소, 즉, 루시페린과 NAD(P)H를 포함한다는 것을 제시했다 [Airth and McElroy, Journal of Bacteriology, 1959, 77: 249-50]. 2015년에, Purtov 등은 균류 루시페린을 검출했는데, 이는 막-투과성 분자인, 3-히드록시히스피딘 (3-hydroxyhispidin)이었다 [Purtov et al., Angewandte Chemie, 2015, 54: 8124-28]. 그러나, 클로닝된 균류 루시퍼라제는 없었다.
본 발명은 신규한 루시퍼라제와 이의 기능성 돌연변이를 암호화하는 분리된 핵산 분자를 제공한다. 상기 루시퍼라제는 3-히드록시히스피딘(3-hydroxyhispidin)을 산화시켜서 빛의 방출을 야기한다. 상기 루시퍼라제는 ATP와 NAD(P)H에 대해 비의존성이다. 바람직한 양태에서, 상기 핵산은 균류로부터 분리되거나 또는 유전공학적 방법을 이용하여 수득된다.
일부 양태에서, 본 발명의 핵산은 서열번호 02, 04, 06, 08, 10, 12, 14, 16 또는 18로 이루어진 군으로부터 선택된 루시퍼라제를 암호화한다. 뉴클레오티드 서열의 예시는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17에 나타난다.
일부 양태에서, 본 발명의 핵산은 서열번호 35에 나타낸 특정한 일치 아미노산 서열을 포함하는 루시퍼라제를 암호화한다.
일부 양태에서, 본 발명의 핵산은 자연적인 루시퍼라제에 비해서 C-말단 및/또는 N-말단이 짧은 루시퍼라제의 기능성 단편을 암호화한다.
일부 양태에서, 본 발명의 핵산은 루시퍼라제를 암호화하며, 이의 아미노산 서열은 서열번호 02, 04, 06, 08, 10, 12, 14, 16 또는 18로 이루어진 군으로부터 선택된 루시퍼라제와 실질적으로 동일하다. 일부 양태에서, 본 발명의 핵산은 루시퍼라제의 기능성 단편을 암호화하며, 이의 아미노산 서열은 서열번호: 20, 22, 24, 26, 28, 30, 32 또는 34로 이루어진 군으로부터 선택된 기능성 단편과 실질적으로 동일하다.
또한, 유전적 암호의 축퇴(degeneracy) 또는 이들과의 혼성화로 인해, 제공된 뉴클레오티드 서열과 상이한 핵산 분자는 본 발명의 범위 내에 있다.
다른 양태에서 본 발명의 핵산을 포함하는 벡터가 또한 제공된다. 이에 더하여, 본 발명은 본 발명의 핵산과 선택된 숙주세포에서의 핵산의 발현에 필요한 조절 인자를 포함하는 발현 카세트를 제공한다. 이에 더하여, 본 발명의 핵산, 벡터 또는 발현 카세트를 포함하는 세포, 안정한 세포주, 형질전환 유기체 (예를 들어, 식물, 동물, 균류, 미생물)가 제공된다.
다른 양태에서, 상기 언급된 핵산에 의해 암호화되는 본 발명의 기능성 루시퍼라제가 제공된다.
또한, 본 발명의 핵산을 포함하는 핵산 또는 벡터 또는 발현 카세트를 포함하는 키트가 제공된다.
또한, 본 발명의 단백질에 특이적으로 결합하는 항체 또는 이의 단편이 제공된다.
또한, 본 발명의 핵산 및 단백질을 이용하여, 세포, 세포 구조체, 및 생체분자를 표지하는 방법이 제공된다.
기술적 결과는 생물발광 시스템을 이용하는 분야에서의 기술적인 수단의 확장을 수반한다. 이는 빛의 방출을 동반하는 3-히드록시히스피딘 산화를 촉매할 수 있는 새로운 그룹의 효소의 아미노산과 뉴클레오티드 서열을 확인함으로써 달성된다.
도 1은 네오노토파누스 남비(Neonothopanus nambi)로부터의 루시퍼라제가 (1) 자연적 시스템 및 (2) 이종 시스템에서 발현되는 경우에, 이의 생물 발광 스펙트럼을 나타낸다.
도 2 및 도 3은 비-형질전환 대조 세포(9);와 네오노토파누스 남비 (1), 뽕나무 버섯 (2) 미세나 시트리컬러 (3), 잣뽕나무 버섯 (4), 받침애주름 버섯 (5), 천마 버섯 (6), 부채 버섯 (7), 옴팔로투스 올레아리우스 (8)로부터의 루시퍼라제를 발현하는, HeLa Kyoto 세포 (도 2) 및 HEK293T 세포 (도 3);에 의한 시간에 따른 생물 발광 강도의 변화를 나타낸다.
도 4는 his-태그(his-tag)를 표적으로 하는 항체와 겨자무 과산화효소(horseradish peroxidase)와 컨쥬게이팅된(conjugating) 항체를 이용한 웨스턴 블랏의 사진을 나타낸다. 1번 레인: 네오노토파누스 남비로부터의 비-his-태그된(non-his-tagged) 루시퍼라제를 발현하는 세포의 후-핵 상청액(post-nuclear supernatant). 2번 레인: 네오노토파누스 남비로부터의 his-태그된 루시퍼라제를 발현하는 세포의 후-핵 상청액. 3번 레인: 140000 g에서의 원심분리에 의해 수득된 상청액. 4번 레인: 140000 g에서의 원심분리에 의해 수득된 펠렛.
도 5는 본 발명의 루시퍼라제의 아미노산 서열의 다중 정렬을 나타낸다. N-말단 막 관통 도메인(N-terminal transmembrane domain)에 밑줄이 표기되어 있다. 공통 서열은 맨 위에 나타냈다.
도 6은 코마시 블루-염색된 농도 구배 폴리아크릴아미드 겔(gradient polyacrylamide gel) (10-25%)의 사진을 나타낸다. IPTG 유도(induction)전의 대장균 용해물 (1번 레인); 실온에서 밤새 발현시킨 후의 대장균 용해물 (2번 레인); 세포 용해 및 35000 g에서의 원심분리 후의 상청액 (3번 레인); 대장균 봉입체(E. coli inclusion body)로부터의 추출물 (4번 레인).
도 7은 pH에 대한 네오노토파누스 남비로부터의 재조합 루시퍼라제의 생물 발광 강도의 의존성을 나타낸다.
도 8은 적색 투과 채널 (상단, mKate2) 및 녹색 투과 채널(하단, 루시퍼라제)에서 촬영된, 현미경 사진에 중첩된 (superimposed) 투과현미경 사진을 나타낸다.
도 9는 네오노토파누스 남비로부터의 루시퍼라제 (마우스의 등의 좌측 반부에 이식됨) 및 포티누스 피랄리스 루시퍼라제(우측 반부에 이식됨)를 이용한 살아있는 마우스에서의 종양 세포의 표지를 나타낸다. 마우스 사진과 이식된 종양으로부터 비롯된, 기록된 광신호(light signal)의 중첩(superimposition)이 나타난다.
도 10은 네오노토파누스 남비로부터의 루시퍼라제의 도움으로, 신경관 형성(neurulation)중인 (16-17 단계) 아프리카 발톱 개구리( Xenopus laevis ) 배아의 신경계의 표지를 나타낸다. 루시퍼라제 생물 발광이 나타난다.
도 2 및 도 3은 비-형질전환 대조 세포(9);와 네오노토파누스 남비 (1), 뽕나무 버섯 (2) 미세나 시트리컬러 (3), 잣뽕나무 버섯 (4), 받침애주름 버섯 (5), 천마 버섯 (6), 부채 버섯 (7), 옴팔로투스 올레아리우스 (8)로부터의 루시퍼라제를 발현하는, HeLa Kyoto 세포 (도 2) 및 HEK293T 세포 (도 3);에 의한 시간에 따른 생물 발광 강도의 변화를 나타낸다.
도 4는 his-태그(his-tag)를 표적으로 하는 항체와 겨자무 과산화효소(horseradish peroxidase)와 컨쥬게이팅된(conjugating) 항체를 이용한 웨스턴 블랏의 사진을 나타낸다. 1번 레인: 네오노토파누스 남비로부터의 비-his-태그된(non-his-tagged) 루시퍼라제를 발현하는 세포의 후-핵 상청액(post-nuclear supernatant). 2번 레인: 네오노토파누스 남비로부터의 his-태그된 루시퍼라제를 발현하는 세포의 후-핵 상청액. 3번 레인: 140000 g에서의 원심분리에 의해 수득된 상청액. 4번 레인: 140000 g에서의 원심분리에 의해 수득된 펠렛.
도 5는 본 발명의 루시퍼라제의 아미노산 서열의 다중 정렬을 나타낸다. N-말단 막 관통 도메인(N-terminal transmembrane domain)에 밑줄이 표기되어 있다. 공통 서열은 맨 위에 나타냈다.
도 6은 코마시 블루-염색된 농도 구배 폴리아크릴아미드 겔(gradient polyacrylamide gel) (10-25%)의 사진을 나타낸다. IPTG 유도(induction)전의 대장균 용해물 (1번 레인); 실온에서 밤새 발현시킨 후의 대장균 용해물 (2번 레인); 세포 용해 및 35000 g에서의 원심분리 후의 상청액 (3번 레인); 대장균 봉입체(E. coli inclusion body)로부터의 추출물 (4번 레인).
도 7은 pH에 대한 네오노토파누스 남비로부터의 재조합 루시퍼라제의 생물 발광 강도의 의존성을 나타낸다.
도 8은 적색 투과 채널 (상단, mKate2) 및 녹색 투과 채널(하단, 루시퍼라제)에서 촬영된, 현미경 사진에 중첩된 (superimposed) 투과현미경 사진을 나타낸다.
도 9는 네오노토파누스 남비로부터의 루시퍼라제 (마우스의 등의 좌측 반부에 이식됨) 및 포티누스 피랄리스 루시퍼라제(우측 반부에 이식됨)를 이용한 살아있는 마우스에서의 종양 세포의 표지를 나타낸다. 마우스 사진과 이식된 종양으로부터 비롯된, 기록된 광신호(light signal)의 중첩(superimposition)이 나타난다.
도 10은 네오노토파누스 남비로부터의 루시퍼라제의 도움으로, 신경관 형성(neurulation)중인 (16-17 단계) 아프리카 발톱 개구리( Xenopus laevis ) 배아의 신경계의 표지를 나타낸다. 루시퍼라제 생물 발광이 나타난다.
본 발명은 신규한 루시퍼라제, 이의 기능성 단편, 상동체 및 돌연변이를 암호화하는 핵산 분자, 및 상기 핵산에 의해 암호화되는 단백질에 관한 것이다. 관심 있는 핵산 분자는 균류로부터 분리되거나 또는 유전적으로 조작된다. 또한, 이들 핵산 분자를 포함하는 숙주세포, 안정한 세포주 및 형질전환 유기체(transgenic organism)가 제공된다. 이에 더하여, 본 발명의 단백질에 특이적인 항체가 제공된다.
상기 단백질 및 뉴클레오티드 조성물은 많은 적용분야 및 방법에 이용되며, 특히, 유기체, 세포, 세포 소기관 또는 단백질의 표지에 이용된다. 또한, 상기 단백질 및 뉴클레오티드 조성물은 다양한 조건하에서 단백질-단백질 상호작용의 검출방법 및 프로모터 활성의 테스트에 이용된다. 마지막으로, 이러한 방법 및 적용을 위한 키트가 제공된다.
정의
본 발명의 대상에 대한 다양한 용어들이 상기에서, 및 상세한 설명과 청구범위에서 이용된다.
본 명세서에서 이용된, 용어 "루시퍼라제(luciferase)"는 루시페린을 산화시킬 수 있는 단백질을 의미하며, 여기서 산화반응은 빛의 방출 (발광)을 동반하며, 산화된 루시페린이 방출된다.
본원에 이용된, 용어 "인간화- "는 포유동물 세포에서의 단백질의 발현에 대해 코돈을 최적화시키기 위해, 핵산 서열에 만들어진 변화를 의미한다 (Yang et al., 1996, Nucleic Acids Research 24:4592-4593).
본원에 이용된, 용어 "분리된- "은 분자 또는 세포가 자연적인 조건하에 존재하는 환경과 상이한, 환경에 처한 분자 또는 세포를 의미한다.
본원에 이용된, 용어 "돌연변이" 또는 "유도체"는 하나 이상의 아미노산이 본 발명의 단백질의 N-말단에서 및/또는 C-말단에서 및/또는 자연적인 아미노산 서열 내에서 첨가되고/되거나 치환되고/되거나 결실되고/되거나 삽입되는, 본 발명의 단백질을 의미한다. 본원에서 이용된, 용어 "돌연변이"는 돌연변이 단백질을 암호화하는 핵산 분자를 의미한다. 또한, 본원에서, 용어 "돌연변이"는 단백질 또는 핵산보다 더 짧거나 더 긴, 임의의 변이체를 의미한다.
용어 "상동성"은 뉴클레오티드 또는 아미노산 서열과, 다른 뉴클레오티드 또는 아미노산 서열의 상호연결(interconnection)을 기술하는 데 이용되는데, 이 상호연결은 이러한 비교된 서열 사이의 일치도(degree of identity) 및/또는 유사도(degree of similarity)에 의해 결정된다.
본원에 이용된, 아미노산 또는 뉴클레오티드 서열이 비교 대상으로 선택된 영역 내의 명시된 서열에 대해서 적어도 40% 동일하다면, 아미노산 또는 뉴클레오티드 서열은 참조 서열에 대해서 "실질적으로 유사"하거나 또는 "실질적으로 동일"하다. 따라서, 실질적으로 유사한 서열은, 예를 들어, 적어도 45% 동일한, 또는 적어도 50% 동일한, 또는 적어도 55% 동일한, 또는 적어도 60% 동일한, 또는 적어도 62% 동일한, 또는 적어도 65% 동일한, 또는 적어도 70% 동일한, 또는 적어도 75% 동일한, 예를 들어, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한 (예를 들어, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 98% 또는 99% 동일한) 서열이다. 서로 동일한 두 서열은 또한 실질적으로 유사하다. 본 발명의 목적으로, 비교되는 루시퍼라제 서열의 길이는 단백질 또는 기능성 단편의 아미노산 서열의 적어도 100개의 아미노산, 바람직하게는 적어도 200개의 아미노산, 예를 들어, 200-230개의 아미노산 또는 전체 길이이다. 핵산에 대해서는, 비교되는 서열의 길이가 통상적으로 적어도 300개의 뉴클레오티드, 바람직하게는 적어도 600개의 뉴클레오티드이다.
서열의 일치성은 참조 서열에 기초하여 결정된다. 서열 분석용 알고리즘이 당해 분야에 공지되어 있으며, 예를 들어, BLAST가 Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990)에 기술되어 있다. 본 발명의 목적으로, 표준 파라미터와 함께 갭 정렬(gapped alignment)을 이용한, 국립 생물공학 정보센터 (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/blast)가 제공하는 BLAST 소프트웨어 패키지에 의한 뉴클레오티드 및 아미노산 서열의 비교는 뉴클레오티드 서열과 아미노산 서열 사이의 일치도와 유사도의 결정에 이용될 수 있다.
본원에 이용된, 용어 "기능성- "은 뉴클레오티드 또는 아미노산 서열이 명시된 테스트 또는 과업에 대해서 기능할 수 있다는 것을 의미한다. 루시퍼라제에 대해서 이용된 용어 "기능성- "은 단백질이 발광을 동반하는, 루시페린 산화 반응을 촉매할 수 있다는 것을 의미한다.
본원에 이용된, "생물화학적 특성"은 단백질 폴딩(folding)과 성숙(maturation) 속도, 반감기, 촉매작용 속도, pH 및 온도 안정성, 및 다른 유사한 특성을 의미한다.
본원에 이용된, "스펙트럼 특성"은 스펙트럼, 양자 효율(quantum efficiency) 및 발광 강도, 및 다른 유사한 특성들을 의미한다.
키메라 단백질(chimeric protein)에 대해서 이용된, 용어 "작동 가능하게 연결된- " 또는 유사한 용어는 서로 물리적으로 및 기능적으로 연결된 폴리펩티드 서열을 의미한다. 가장 바람직한 양태에서, 키메라 분자의 폴리펩티드 구성요소의 기능은 분리된 폴리펩티드 구성요소의 기능적 특성에 비해서 변화하지 않는다. 예를 들어, 본 발명의 루시퍼라제는 관심 있는 융합 파트너(fusion partner)에 융합될 수 있다. 이 경우에, 키메라 단백질은 루시퍼라제 특성을 유지하고, 관심 있는 폴리펩티드는 이의 본래의 생물학적 특성을 유지한다. 일부 양태에서, 루시퍼라제 및 융합 파트너 모두의 활성이 분리된 단백질의 활성에 비해서 감소될 수 있다. 또한, 이러한 키메라 단백질은 본 발명의 범위 내에서 적용된다. 핵산에 대해서 이용된, 용어 "작동 가능하게 연결된- " 또는 유사한 용어는 핵산이 이의 접합(junction)이 리딩 프레임과 종결 코돈의 "고장"을 포함하지 않는 방식으로 공유결합되는 것을 의미한다. 통상의 기술자는 "작동 가능하게 연결된" 구성요소 (단백질, 폴리펩티드, 연결 서열, 단백질 도메인 등)를 포함하는, 키메라 단백질을 암호화하는 뉴클레오티드 서열이 상기 구성요소를 암호화하는 단편 - 이 단편은 뉴클레오티드 서열의 전사 및 번역 동안에, 전체 길이의 키메라 단백질이 생성되는 방식으로 공유결합된다 - 으로 이루어졌다는 것을 인식할 것이다.
본원에 이용된, 용어 "특이적으로 혼성화하다"는 두 개의 단일-가닥 핵산 분자 또는 충분히 상보적인 서열 사이의 회합(association)을 의미하는데, 당해 분야에서 통상적으로 이용되는 미리 결정된 조건하에서, 이러한 혼성화를 허용한다 (용어 "실질적으로 상보적인- "이 때때로 이용된다).
폴리펩티드를 "암호화하는" 뉴클레오티드 서열에 대한 참조는 이러한 폴리펩티드가 mRNA 전사 및 번역 동안에 뉴클레오티드 서열로부터 생성된다는 것을 의미한다. 이를 위해, mRNA와 동일하고 서열 리스트에 통상적으로 이용되는 코딩 가닥(coding strand)과 전사 동안에 주형으로 이용되는 상보적 가닥 모두가 명시될 수 있다. 통상의 기술자는 이 용어가 일정한(uniform) 아미노산 서열을 암호화하는 임의의 축퇴 뉴클레오티드 서열(degenerate nucleotide sequence)을 또한 포함한다는 것을 인식할 것이다. 폴리펩티드를 암호화하는 뉴클레오티드 서열은 인트론을 포함하는 서열을 포함한다.
핵산 분자
본 발명은 루시퍼라제 및 이의 기능성 단편(예를 들어, 절단되거나 또는 연장된 루시퍼라제의 변이체)을 암호화하는 핵산 분자를 제공한다. 바람직한 양태에서, 본 발명의 핵산은 루시퍼라제를 암호화하고, 이의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 및 18로 이루어진 군으로부터 선택된다. 또한, 상기 언급된 루시퍼라제와 실질적으로 유사한 상기 루시퍼라제의 상동체 및 돌연변이를 암호화하는 핵산 분자는 본 발명의 범위 내에 있다. 이러한 특정한 유형의 관심 있는 핵산 분자 각각은 아래의 실험 부분에서 더욱 상세히 개시된다.
본원에 이용된, 핵산 분자는 게놈 DNA 또는 cDNA를 비롯한 DNA 분자, 또는 mRNA 분자를 비롯한 RNA 분자이다. 일부 양태에서, 본 발명의 핵산 분자는 본 발명의 루시퍼라제를 암호화하고, 적합한 조건하에서 [예를 들어, 생리적 세포 내 조건(physiological intracellular condition)하에서], 이종 발현 시스템(heterologous expression system)에서, 루시퍼라제로 발현되는 것이 가능한 오픈 리딩 프레임을 갖는 DNA 분자 (또는 cDNA)이다.
일부 양태에서, 루시퍼라제를 암호화하는 본 발명의 핵산 분자는 균류로부터 분리된다. 관심 있는 특정한 핵산 분자는 네오노토파누스 남비 (서열번호: 2), 천 마버섯 ( Armillaria gallica ) (서열번호: 4), 뽕나무 버섯 ( Armillaria mellea ) (서열번호: 6), 잣뽕나무 버섯 ( Armillaria ostoyae ) (서열번호: 8), 받침애주름 버섯 ( Mycena chlorophos ) (서열번호: 10), 미세나 시트리컬러 ( Mycena citricolor) (서열번호: 12), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) (서열번호: 14), 및 부채 버섯 ( Panellus stipticus ) (서열번호: 16 및 18)으로부터의 루시퍼라제를 암호화하는 핵산을 포함한다. 이러한 핵산의 뉴클레오티드 서열은 서열번호 1, 3, 5, 7, 9, 11, 13, 15 및 17에 나타냈다.
일부 양태에서, 본 발명의 핵산 분자는 유전적으로 조작된다. 핵산을 수득하는 방법이 당해 분야에 공지되어 있다. 예를 들어, 아미노산 서열 정보(예를 들어, 서열번호 2-18) 또는 뉴클레오티드 서열 정보 (예를 들어, 서열번호: 3, 5, 7, 9, 11, 13, 15 또는 17)의 가용성(availability)은 올리고뉴클레오티드 합성에 의한, 본 발명의 분리된 핵산 분자의 제조를 가능하게 한다. 아미노산 서열에 대한 정보가 입수 가능하다면, 유전적 코드의 축퇴(degeneracy)로 인해 서로 상이한 몇몇 핵산들이 합성될 수 있다. 목적하는 숙주에 대한 코돈 변이체를 선별하는 방법은 당해 분야에 공지되어 있다.
합성 올리고뉴클레오티드는 포스포라미디트법 (phosphoramidite method)을 이용하여 제조될 수 있다. 수득된 제작물을 고성능 액체 크로마토그래피 (high-performance liquid chromatography, HPLC) 또는 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., (1989) Cold Spring Harbor Press, Cold Spring Harbor, NY에 기술된 다른 방법을 비롯한, 당해 분야에 공지된 방법에 의해, 예를 들어, 미국 보건복지부 (HHS), 재조합 DNA 연구에 대한 국립보건원 (National Institute of Health, NIH) 가이드라인에 기술된 지시에 따라서 정제할 수 있다. 본 발명의 긴 이중-가닥 DNA 분자는 다음과 같이 합성될 수 있다: 인접한 단편과 부착(cohesion)이 가능한 적합한 말단을 포함하는, 필요한 상보성(necessary complementarity)을 갖는 몇몇 더 작은 단편들이 합성될 수 있다. 인접한 단편은 재조합에 기초한 방법에서 DNA 리가아제에 의해, 또는 PCR 동안에 결합될 수 있다.
또한, 본 발명의 루시퍼라제를 암호화하는 핵산 분자는 바시디오마이코다 문(Basidiomycota division), 바람직하게는 담자균 강(Basidiomycetes class), 특히, 주름버섯 목(Agaricales order)에 속하는 균류로부터의 생물학적 공급원(biological source)으로부터 클로닝될 수 있다.
본 발명은 또한 본 발명의 단백질을 암호화하는 핵산과 상동성인, 실질적으로 유사한, 동일한 또는, 이로부터 유래된 핵산을 포함할 수 있다.
본 발명의 핵산은 자연적인 조건하에서 이들이 존재하는 환경과 상이한 환경에 처하는데, 예를 들어, 이들은 분리되거나, 이들의 수가 증가되거나, 이들이 시험관내 시스템, 또는 자연적인 조건하에서 이들이 존재하는 세포 또는 유기체 이외의 세포 또는 유기체에 존재하거나 또는 이에서 발현된다.
매우 유사한 뉴클레오티드 서열 간의 뉴클레오티드 서열의 변경 또는 차이는 보통의 복제(replication) 또는 중복(duplication) 동안에 발생하는 뉴클레오티드 서열 치환을 나타낼 수 있다. 다른 치환은 구체적으로 추산될 수 있고, 특정 아미노산의 코돈 또는 조절 영역(regulatory region)의 뉴클레오티드 서열을 변경시키는 것과 같은, 특정한 목적으로 서열로 삽입될 수 있다. 이러한 특정한 치환이 다양한 돌연변이유발 기술을 이용해서 시험관내에서 만들어질 수 있거나, 또는 이러한 변화를 유도하거나 또는 선별하는 특정한 번식 조건하에서, 숙주 유기체에서 수득될 수 있다. 서열의 이러한 특정하게 제조된 변이체를 본래의 서열의 "돌연변이" 또는 "유도체"라고 할 수 있다.
본 발명은 루시퍼라제 - 이의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18에 나타냄 - 와 실질적으로 유사한 루시퍼라제를 암호화하는 핵산을 또한 제공한다. 이러한 폴리펩티드 또는 이의 단편을 암호화하는 핵산은 복수의 공지된 방법 중 임의의 방법에 의해 수득될 수 있다. 본 발명의 cDNA 단편은 매우 엄격한 조건하에서 표적 유기체로부터의 cDNA 라이브러리에 대한 혼성화 탐침으로 이용될 수 있다. 탐침은 큰 단편 또는 더 짧은 축퇴 프라이머(degenerate primer)일 수 있다. 유사한 서열을 갖는 핵산은 매우 엄격한 조건하에서, 예를 들어, 50°C 이상의 온도 (예를 들어, 60°C 또는 65°C)에서, 50% 포름아미드, 0.1 Х SSC (15 mM 소듐 클로라이드 /1.5 mM 소듐 시트레이트), 0.1% SDS의 조건하에서, 혼성화에 의해 검출될 수 있다. 참조 서열과 실질적으로 동일한 영역, 예를 들어, 대립유전자 변이체(allelic variant), 유전적으로 변형된 핵산 변이체 등을 갖는 핵산은 매우 엄격한 혼성화 조건하에서 참조 서열에 결합한다. 이러한 뉴클레오티드 서열은 탐침, 특히, 참조 DNA 서열에 상보적인 표지된 탐침을 이용하여 분리될 수 있다.
이러한 폴리펩티드 또는 이의 단편을 암호화하는 핵산은 게놈 시퀀싱 또는 전사체 시퀀싱(transcriptomic sequencing) 동안에 또한 검출될 수 있다. 특히, 실질적으로 유사한 루시퍼라제는 유기체 시퀀싱 동안에, 예를 들어, 다양한 종, 대부분 바시디오마이코다 문, 예를 들어, 담자균 강, 특히 주름버섯 목의 균류의 시퀀싱 동안에 획득된 데이터에 기초하여 예측된 가설 단백질(hypothetical protein)의 서열 중에서 식별될 수 있다.
본 발명은 서열번호 35에 나타낸 서열과 실질적으로 유사한 특정한 일치 아미노산 서열을 갖는 루시퍼라제를 암호화하는 핵산을 또한 제공한다. 여기서, 용어 "공통 서열"은 본 발명의 상이한 루시퍼라제에 규칙적으로 존재하는 평균적인 아미노산 서열(개개의 아미노산에 소규모 변이가 있는)을 의미한다.
돌연변이 또는 유도된 핵산은 상기-기술된 핵산으로부터 선택된, 주형 핵산의 서열에 하나 이상의 뉴클레오티드를 변형, 결실, 또는 첨가함으로써, 또는 이의 조합에 의해, 이 주형 핵산으로부터 수득하여 주형 핵산의 변이체를 생성할 수 있다. 변형, 첨가 또는 결실은 당해 분야에 공지된 임의의 방법을 이용하여 수행될 수 있는데 (예를 들어, Gustin et al., Biotechniques (1993) 14: 22; Barany, Gene (1985) 37: 111-123; and Colicelli et al., Mol. Gen. Genet. (1985) 199:537-539, Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108을 참고), 에러-유발 PCR(error-prone PCR), 셔플링(shuffling), 올리고뉴클레오티드-지정 돌연변이 유발(oligonucleotide-directed mutagenesis), 어셈블리 PCR (assembly PCR), 유성 PCR 돌연변이 유발(sexual PCR mutagenesis), 생체 내 돌연변이 유발(in vivo mutagenesis), 카세트 돌연변이 유발(cassette mutagenesis), 반복 앙상블 돌연변이 유발(recursive ensemble mutagenesis), 대수적 앙상블 돌연변이 유발(exponential ensemble mutagenesis), 부위-특이적 돌연변이 유발(site-specific mutagenesis), 무작위 돌연변이 유발(random mutagenesis), 유전자 어셈블리(gene reassembly), 유전자 부위 포화 돌연변이 유발(gene site saturation mutagenesis, GSSM), 합성 라이게이션 재-어셈블리(synthetic ligation reassembly, SLR), 또는 이들의 조합을 포함한다. 변형, 첨가 및 결실은 재조합, 반복 서열 재조합, 포스포티오에이트-변형 DNA 돌연변이 유발(phosphothioate-modified DNA mutagenesis), 우라실-함유 주형 돌연변이 유발(uracil-containing template mutagenesis), 갭 듀플렉스 돌연변이 유발(gapped duplex mutagenesis), 점 미스매치 수선 돌연변이 유발(point mismatch repair mutagenesis), 수선-결핍 숙주 균주 돌연변이 유발(repair-deficient host strain mutagenesis), 화학적 돌연변이 유발, 방사성 돌연변이 유발, 결실 돌연변이 유발, 제한-선별 돌연변이 유발(restriction-selection mutagenesis), 제한-정제 돌연변이 유발(restriction-purification mutagenesis), 인공 유전자 합성(artificial gene synthesis), 앙상블 돌연변이 유발(ensemble mutagenesis), 키메라 핵산 멀티머 생성(chimeric nucleic acid multimer creation), 또는 이들의 조합을 포함하는, 방법에 의해 또한 도입될 수 있다. 일부 양태에서, 돌연변이 또는 유도된 핵산에 의해 암호화된 루시퍼라제는 야생형 루시퍼라제와 동일한 스펙트럼 또는 생화학적 특성을 갖는다. 다른 양태에서, 돌연변이 또는 유도된 핵산은 변형된 특성을 갖는 루시퍼라제를 암호화한다.
또한, 본 발명의 단백질을 암호화하는 핵산의 축퇴 변이체가 제공된다. 축퇴 핵산 변이체는 동일한 아미노산을 암호화하는 다른 코돈과의 핵산 코돈의 치환을 포함한다. 특히, 핵산의 축퇴 변이체는 생성되어 숙주세포에서의 발현을 증가시킨다. 이 양태에서, 숙주세포 유전자에서 바람직하지 않거나 또는 덜 바람직한 핵산 코돈은 상기 치환된 코돈이 동일한 아미노산을 암호화하는, 숙주세포 내 유전자의 코딩 서열에 풍부하게(abundantly) 존재하는 코돈으로 치환된다. 관심 있는 축퇴 변이체의 예시는 아래의 실험 부분에 더 상세히 기술된다.
이러한 루시퍼라제의 절단 및 연장된 변이체를 암호화하는 핵산은 또한 본 발명의 범위 내에 있다. 본원에서 이용된, 이러한 단백질 변이체는 폴리펩티드 사슬의 변경된 C-말단, N-말단, 또는 두 말단을 갖는 아미노산 서열을 포함한다.
절단된 변이체에서, 하나 이상의 (보통 최고 39개, 대개 37개 이하) 아미노산이 서열로부터 제거될 수 있거나, 또는 임의의 다른 아미노산으로 치환될 수 있다. 특히, 막 관통 도메인을 암호화하는 서열 및 루시퍼라제의 N-말단으로부터의 이전의 아미노산 서열은 완전히 또는 부분적으로 제거될 수 있다. 막 관통 도메인은 당해 분야에 공지된 방법, 예를 들어, [Krogh et al., Journal of Molecular Biology2001, 305(3):567-580] 및 [Sonnhammer et al., Proceedings of the Sixth International Conference on Intelligent Systems for Molecular Biology, pages 175-182, Menlo Park, CA, 1998. AAAI Press]에 기술된 알고리즘을 이용하여 식별될 수 있다. 분석을 위해, 상기 알고리즘에 기초하고, [http://www.cbs.dtu.dk/services/TMHMM/]에 기술된 소프트웨어가 이용될 수 있다. 연장된 변이체에서, 단백질의 C-말단 또는 N-말단은 추가의 아미노산을 포함할 수 있다. 기능성 단편의 아미노산 서열 및 대응하는 암호화 뉴클레오티드 서열의 예시는 서열번호 19-34에 나타냈다. 기능성 단편의 발현을 위해, 이들을 암호화하는 핵산이 적어도 조절 서열 및 전사 개시 부위를 포함하는 핵산에 작동 가능하게 연결된다. 또한, 이들 핵산은 6-his-태그-암호화 서열, 신호 펩티드 (signal peptide) 또는 기능성 단백질 도메인을 포함할 수 있다.
상기 언급된 변형들은 루시퍼라제의 스펙트럼 특성을 실질적으로 변화시키지 않으나, 세포 내 국소화(intracellular localization)를 변화시킬 수 있거나, 숙주세포에서 단백질 폴딩을 촉진시킬 수 있거나, 응집을 감소시킬 수 있거나, 또는 다른 생화학적 단백질 특성, 예를 들어, 반감기를 조절할 수 있다. 일부 양태에서, 이러한 변형은 생화학적 단백질 특성들을 변화시키지 않는다. 상기 모든 유형의 변형들 및 돌연변이들은 원칙적으로는 핵산 수준에서 수행된다.
본 발명의 핵산 분자는 전체 대상 단백질 또는 이의 부분을 암호화할 수 있다. 이중-가닥 단편 및 단일-가닥 단편은 표준 방법, 효소 제한(enzymatic restriction), PCR 증폭 등에 따라서 올리고뉴클레오티드의 화학적 합성에 의해 DNA 서열로부터 수득될 수 있다. 일반적으로, DNA 단편의 크기는 적어도 약 15개의 뉴클레오티드, 보통 적어도 약 18개의 뉴클레오티드 또는 약 25개의 뉴클레오티드일 것이고, 적어도 약 50개의 뉴클레오티드일 수 있다. 일부 양태에서, 대상 핵산 분자는 약 100, 약 200, 약 300, 약 400, 약 500, 약 600 이상의 크기를 가질 수 있다. 대상 핵산은 대상 단백질의 단편 또는 완전한 단백질을 암호화할 수 있는데, 예를 들어, 대상 핵산은 단백질의 약 25개의 아미노산, 약 50개의 아미노산, 약 75개의 아미노산, 약 100개의 아미노산, 약 125개의 아미노산, 약 150개의 아미노산, 약 200개의 아미노산, 최대, 완전한 길이의 폴리펩티드를 암호화할 수 있다.
대상 핵산은 실질적으로 순수한 형태로 분리 및 수득될 수 있다. 실질적으로 순수한 형태는 핵산이 적어도 약 50% 순수한 것, 보통은 적어도 약 90% 순수한 것, 보통은 "재조합"된 것, 즉, 이의 자연적인 숙주에서, 자연적으로 존재하는 염색체의 서열에 통상적으로 결합하지 않는, 하나 이상의 뉴클레오티드가 플랭킹(flanking)된 것을 의미한다.
아래에서 상술되는 본 발명의 단백질 또는 이의 단편을 포함하는, 융합된 단백질을 암호화하는 핵산이 또한 제공된다.
대상 핵산을 포함하는 벡터 및 다른 핵산 제작물이 또한 제공된다. 적합한 벡터는 바이러스 벡터 및 비-바이러스 벡터, 플라스미드, 코스미드, 파지 등을 포함하고, 바람직하게는 플라스미드를 포함하며, 본 발명의 핵산 서열을 적합한 숙주로 클로닝하는 것, 증폭시키는 것, 발현시키는 것, 이동시키는 것(transferring) 등에 이용된다. 적합한 벡터를 선택하는 것은 통상의 기술자에게 용이한 것이다. 제작물을 제조하기 위해, 통상적으로 부분적 또는 전체-길이의 핵산은 벡터 내 절단된 제한 효소 부위로의 DNA 리가아제 부착에 의해 벡터로 삽입된다. 대안적으로는, 목적하는 뉴클레오티드 서열이 생체 내 상동 재조합(in vivo homologous recombination)에 의해, 통상적으로는 목적하는 뉴클레오티드 서열의 플랭크(flank)위에서 벡터에 상동성 영역을 붙임으로써 삽입될 수 있다. 상동성 영역은, 예를 들어, 올리고뉴클레오티드의 라이게이션에 의해, 또는 상동성 영역 및 목적하는 뉴클레오티드서열의 부분 모두를 포함하는 프라이머를 이용하는 중합효소 연쇄반응에 의해 추가된다. 원칙적으로는, 벡터는 숙주에서 이의 복제 - 외부 염색체 인자로서 세포로 도입된 것의 결과 - 를 보장하는 복제 기점을 갖는다. 벡터는 숙주에서 핵산의 발현 및 재조합 기능성 루시퍼라제의 생성을 제공하는 조절 인자를 또한 포함할 수 있다. 발현 벡터에서, 상기 핵산은 프로모터, 인핸서(enhancer), 종결자(terminator), 작동자(operator), 억제자(repressor), 사일런서(silencer), 인슐레이터(insulator) 및 유도자(inducer)를 포함할 수 있는 조절 서열에 기능적으로 연결된다.
이용되는, 그 중에서도, 대상 루시퍼라제 또는 이에 기초한 키메라 단백질의 수득, 또는 대상 핵산 분자의 복제에 이용되는 발현 카세트 또는 시스템이 또한 제공된다. 발현 카세트는 외부 염색체 인자로 존재할 수 있거나, 또는 세포로의 상기 발현 카세트의 도입 결과로서, 세포의 게놈으로 통합될 수 있다. 발현을 위해, 본 발명의 핵산에 의해 암호화된 유전자 산물은, 예를 들어, 박테리아, 효모, 식물, 곤충, 양서류(amphibian) 또는 포유동물을 포함하는 임의의 편리한 발현 시스템에서 발현된다. 발현 카세트에서, 표적 핵산은 프로모터, 인핸서, 종결 서열, 작동자, 억제자 및 유도자를 포함할 수 있는 조절 서열에 작동 가능하게 연결된다. 목적하는 생성물을 발현시킬 수 있는 발현 카세트 또는 시스템을 제조하는 방법은 통상의 기술자에게 공지되어 있다.
본 발명의 단백질을 지속 가능하게(sustainably) 발현시키는 세포주는 당해 분야에 공지된 방법에 의해 선택될 수 있다 (예, dhfr, gpt, 네오마이신 또는 히그로마이신(hygromycin)을 비롯한 선별 마커와의 공동-형질주입은 게놈으로 통합된 유전자를 포함하는, 형질주입된 세포의 식별 및 분리를 허용한다).
상기 발현 시스템은 원핵생물 숙주 또는 진핵생물 숙주에서 이용될 수 있다. 대장균, 고초균(B. subtilis ), S. 세리비시아 (S. cerevisiae ), 곤충 세포, 또는 인간 배아세포가 아닌 고등 유기체(higher organism) 세포 - 효모, 식물 [예를 들어, 애기장대(Arabidopsis thaliana ), 니코티아나 벤타미아나 ( Nicotiana benthamiana ), 피스코미트렐라 파텐스 ( Physcomitrella patens)], 척추동물 [예를 들어, COS 7 세포, HEK 293, CHO, 제노푸스 난모세포 ( Xenopus oocyte)] 등을 비롯함 - 와 같은 숙주세포가 단백질의 생산에 이용될 수 있다.
상기 참조된 숙주세포, 또는 다른 적절한 숙주세포 또는 유기체 중 임의의 것이 본 발명의 핵산의 복제 및/또는 발현에 이용되는 경우에, 생성되는 복제된 핵산, 발현된 단백질 또는 폴리펩티드는 숙주세포 또는 유기체의 생성물로서, 본 발명의 범위 내에 있다. 생성물은 당해 분야에 공지된 적절한 수단에 의해 회수될 수 있다.
PCR, 롤링 서클 증폭(rolling circle amplification), 혼성화 스크리닝 탐침(hybridization screening probe) 등을 위한 프라이머로 유용한, 대상 핵산의 작은 DNA 단편이 또한 제공된다. 이전에 기술된 대로, 더 큰 DNA 단편은 암호화된 폴리펩티드의 생산에 유용하다. 그러나, PCR을 비롯한 기하적 증폭 반응(geometric amplification reaction)에 이용하기 위해, 작은 DNA 단편의 쌍, 즉, 프라이머가 이용된다. 프라이머 서열의 정확한 조성이 발명에 중대한 것은 아니나, 대부분의 적용에서, 당해 분야에 알려진 대로, 프라이머는 엄격한 조건하에서 대상 서열에 혼성화할 것이다. 적어도 약 50개의 뉴클레오티드, 바람직하게는 적어도 약 100개의 뉴클레오티드의 증폭 산물을 생성하고, 전체 핵산 서열까지 연장할, 프라이머의 쌍을 선택하는 것이 바람직하다. 프라이머 서열의 선택을 위한 알고리즘은 일반적으로 공지되어 있고, 상업적인 소프트웨어 패키지에서 입수 가능하다. 증폭 프라이머는 DNA의 상보적 가닥에 혼성화하고, 서로를 향해 프라이밍(priming)할 것이다.
본 발명의 핵산 분자는 생물학적 샘플에서 유전자의 발현을 확인하는 데 또한 이용될 수 있다. 게놈 DNA 또는 RNA를 비롯한 특정 뉴클레오티드 서열의 존재에 대해, 세포를 탐침하는 방식이 문헌에 잘 규명되어 있다. 간단히 말해서, DNA 또는 mRNA는 세포 샘플로부터 분리된다. mRNA는 역전사 효소(reverse transcriptase)를 이용해서 상보적 DNA 가닥을 형성한 후에, 대상 DNA 서열에 특이적인 프라이머를 이용한 중합효소 연쇄반응 증폭을 수행하는, RT-PCR에 의해 증폭될 수 있다. 대안적으로, mRNA 샘플은 겔 전기영동에 의해 분리되고, 적합한 지지체, 예, 니트로셀룰로스(nitrocellulose), 나일론(nylon) 등으로 옮긴(transferring) 다음에, 탐침으로서 대상 DNA의 단편에 탐침한다. 올리고뉴클레오티드 라이게이션 검정(oligonucleotide ligation assay), 인 시츄 혼성화(in situ hybridization), 및 솔리드 칩(solid chip) 상에 정렬된 DNA 탐침으로의 혼성화를 비롯한 다른 기법도 또한 이용될 수 있다. 대상 서열에 혼성화하는 mRNA의 검출은 샘플에서의 유전자 발현을 나타낸다.
단백질
본 발명은 루시퍼라제, 및 이의 전체-길이 단백질 및 부분 또는 단편을 포함하는 이의 상동체, 유도체 및 돌연변이를 또한 제공한다.
대상 단백질은 산소가 존재하는 경우에 루시페린의 산화를 촉매할 수 있는 루시퍼라제이다. 산화 반응은 매질 중 ATP, NAD(P)H 및 다른 대사 산물의 존재에 대해서 비의존성이다. 대상 단백질이 하기 화학식 1의 구조를 갖는 3-히드록시히스피딘 (3-hydroxyhispidin)을 산화시키기 때문에, 대상 단백질은 공지된 루시퍼라제와는 상이하다:
[화학식 1]
대상 루시퍼라제는 다른 화합물의 산화를 촉매할 수 있다. 이러한 화합물을 검출하기 위해, 분리된 루시퍼라제 및 상기 화합물은 적합한 조건하에서 결합되고, 산화 반응 동안에 방출된 빛이 검출된다. 대상 루시퍼라제에 대한 루시페린으로서 작용할 수 있는 화합물의 예시는, 예를 들어, 다음과 같다:
[화학식 2]
다음의 구조를 갖는, (E)-6-(4-디에틸아미노)스티릴)-3,4-디히드록시-2H-피란-2-원
[화학식 3]
다음의 구조를 갖는, (E)-3,4-디히드록시-6-(4-히드록시스티릴)-2H-피란-2-원
[화학식 4]
다음의 구조를 갖는, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원
[화학식 5]
다음의 구조를 갖는, (E)-6-(2-(1,2,3,5,6,7-헥사히드로피리도[3,2,1-ij]퀴놀린-9-일)비닐)-3,4-디히드록시-2H-피란-2-원
[화학식 6]
다음의 구조를 갖는, (E)-3,4-디히드록시-6-(2-(6-히드록시나프?렌-2-일)비닐)-2H-피란-2-원
본 발명의 루시퍼라제에 의한 루시페린의 산화는 검출 가능한 빛의 방출을 동반한다.
본 발명의 일부 양태에서, 반응 동안에 방출된 빛은 통상적인 방법[예를 들어, 육안 검사(visual inspection), 야간 투시(night vision), 분광 광도법(spectrophotometry), 분광 형광법(spectrofluorimetry), 영상 사진 기록(image photographic recording), 및 예를 들어, IVIS 스펙트럼 인 비보 이미징 시스템(IVIS Spectrum In Vivo Imaging System) (PerkinElmer)을 비롯한 특정한 발광 및 형광 검출 장비(special luminescence and fluorescence detection equipment) 등]을 이용하여 검출될 수 있다. 기록된 빛은 한 광자(photon)의 강도 범위(intensity range) 내에서, 예를 들어, 1 cd의 강도를 갖는 용이하게 가시적인 빛(easily visible light), 및 예를 들어, 100 cd 이상의 강도를 갖는 밝은 빛(bright light)으로 방출될 수 있다.
3-히드록시히스피딘의 산화 동안에 방출된 빛은 400 내지 700 nm의 범위 내에 속하고, 대개 450 내지 650 nm의 범위 내에 속하며, 520-590 nm에서 방출 최대를 갖는다.
대상 단백질은 50°C 이하의 온도, 대개 최고 45°C의 온도에서 활성을 유지한다. 즉, 이들은 30-42°C의 온도 범위 이내에서 활성을 유지하고, 시험관내 및 생체내 이종 발현 시스템에서 이용될 수 있다.
대상 단백질은 4 내지 10의 범위 이내에서, 대개 6.5 내지 9.5의 범위 이내에서 pH 안정성을 갖는다. 대상 단백질의 최적 pH 안정성은 7.0 내지 8.0의 범위 이내에서, 예를 들어, 7.3 내지 7.5에 속한다.
관심 있는 특정한 단백질은 네오노토파누스 남비 (서열번호: 2), 천마버섯 (Armillaria gallica ) (서열번호: 4), 뽕나무 버섯 ( Armillaria mellea ) (서열번호: 6), 잣뽕나무 버섯 ( Armillaria ostoyae ) (서열번호: 8), 받침애주름 버섯 ( Mycena chlorophos ) (서열번호: 10), 미세나 시트리컬러 ( Mycena citricolor ) (서열번호: 12), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) (서열번호: 14), 및 부채 버섯 ( Panellus stipticus ) (서열번호: 16 및 18)으로부터의 자연적인 루시퍼라제 및, 예를 들어, 서열번호 20, 22, 24, 26, 28, 30, 32, 34에 나타낸 아미노산 서열을 포함하는 이들의 재조합 및 절단 변이체를 포함하며, 이는 아래의 실험 섹션에서 더 상세히 기술된다.
상기 루시퍼라제 및 이의 기능성 단편과 실질적으로 유사한 루시퍼라제가 또한 제공된다. 많은 양태에서, 관심 있는 아미노산 서열은 서열에서 실질적으로 동일하며, 예를 들어, 적어도 40% 동일, 예를 들어, 적어도 45% 동일하거나, 또는 적어도 50% 동일하거나, 또는 적어도 55% 동일하거나, 또는 적어도 60% 동일하거나, 또는 적어도 65% 동일하거나, 또는 적어도 70% 동일하거나, 또는 적어도 75% 동일하거나, 예를 들어, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일(예를 들어, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 98% 또는 99% 동일)하다. 특히, 이는 단백질 기능성 영역을 제공하는 아미노산 서열, 즉, 본 발명의 자연적인 루시퍼라제의 일부인 막 관통 도메인의 서열 후에 위치하는 단백질 서열을 의미한다.
본 발명은 또한 본 발명의 자연적인 루시퍼라제에 내재하는 특정한 공통 서열을 포함하는 루시퍼라제를 제공하며, 이 공통 서열을 서열번호 35에 나타냈다. 공통 서열은 복수의 관련된 서열에 있는 위치에서 가장 통상적으로 접하는 아미노산의 식별을 통한 본 발명의 루시퍼라제의 다중 비교(multiple comparison)에 기초하여 수득된다.
본 발명은 상기 언급된 단백질의 돌연변이를 또한 제공한다. 돌연변이는 단백질 - 이로부터, 돌연변이가 수득됨 - 의 생물학적 특성을 유지할 수 있거나, 또는 야생형 단백질의 생물학적 특성과는 상이한 생물학적 특성을 가질 수 있다. 본 발명에 따른, 용어 단백질의 "생물학적 특성"은 다양한 루시페린을 산화시키는 능력; 생체내 및/또는 시험관내 안정성 (예를 들어, 반감기)와 같은 생화학적 특성; 성숙 속도 (maturation rate); 응집 또는 올리고머화(oligomerization) 경향 및 다른 유사한 특성들을 의미하나, 이에 한정되는 것은 아니다. 돌연변이는 하나 이상의 아미노산에 대한 변경, 하나 이상의 아미노산의 결실 또는 삽입, N-말단 절단 또는 연장, C-말단 절단 또는 연장 등을 포함한다.
돌연변이는 상기 "핵산 분자" 섹션에 상술되어 있는 기법과 같은, 통상적인 분자 생물학적 기법을 이용하여 수득될 수 있다.
본 발명의 단백질은 분리된 형태이다. 즉, 주어진 단백질은 실질적으로 다른 단백질 또는 올리고당(oligosaccharide), 핵산 및 이의 단편 등을 비롯한, 다른 자연적인 생물학적 분자로부터 유리되어 있다. 이런 맥락에서, 용어 "실질적으로 유리 -"는 분리된 단백질을 함유하는 상기 조성물의 70% 미만, 보통 60% 미만, 및 대개 50% 미만이 다른 자연적인 생물학적 분자로 구성되어 있다는 것을 의미한다. 일부 양태에서, 상기 단백질은 실질적으로 순수한 형태이다. 이런 맥락에서, 용어 "실질적으로 순수한 형태"는 상기 단백질이 적어도 95% 순수하고, 보통 적어도 97% 순수하며, 대개 적어도 99% 순수하다는 것을 의미한다.
바람직한 양태에서, 합성법을 이용하여, 예를 들어, 관심 있는 단백질을 암호화하는 서열을 암호화하는 재조합 핵산을 적합한 숙주에서 발현시킴으로써 표적 단백질이 수득되는데, 이는 상기 기술된 바와 같다. 임의의 편리한 단백질 정제 절차를 이용할 수 있으며, 적합한 단백질 정제 기법이 적절한 참조 가이드에 기술되어 있다 (Guide to Protein Purification, (Deuthser ed.) (Academic Press, 1990)). 예를 들어, 용해물은 본래의 공급원으로부터 제조되어, HPLC, 배제 크로마토그래피, 겔 전기영동, 친화도 크로마토그래피 등을 이용하여 정제될 수 있다.
본 발명은, 예를 들어, 세포 내 국소화 서열(subcellular localization sequence)[예를 들어, 핵 국소화 신호(nuclear localization signal), 퍼옥시좀 국소화 신호(peroxisome localization signal), 미토콘드리아, 골지체 등], 신호 펩티드 또는 관심 있는 임의의 단백질 또는 폴리펩티드에 융합된, 본 발명의 단백질 또는 이의 기능성 단편을 포함하는 융합 단백질을 또한 수반한다. 융합 단백질은, 예를 들어, 본 발명의 루시퍼라제, 및 루시퍼라제의 N-말단 및/또는 C-말단에 인-프레임 방식으로 작동 가능하게 융합된 제2 폴리펩티드 ["융합 파트너 (Fusion partner)])를 포함할 수 있다. 융합 파트너는 이 융합 파트너(예를 들어, 에피토프 태그)에 특이적인 항체에 결합할 수 있는 폴리펩티드, 이의 항체 또는 결합 단편, 촉매 기능을 제공하거나 또는 세포 반응을 유도하는 폴리펩티드, 이의 리간드 또는 수용체 또는 모방체(mimetics) 등을 포함하나, 이에 한정되는 것은 아니다.
본 발명은 본 발명의 루시퍼라제에 특이적으로 결합하는 항체를 또한 제공한다. 적합한 항체는 당해 분야에 공지된 기법을 이용하여 수득될 수 있다. 예를 들어, 다중클론 항체는 (Harlow and Lane Antibodies: A Laboratory Manual, (1988) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York)에 기술된 기법을 이용하여 수득될 수 있다. 단일클론 항체는 (Goding Monoclonal Antibodies: Principles and Practice: Production and Application of Monoclonal Antibodies in Cell Biology, Biochemistry and Immunology; 3rd edition, (1996) Academic Press)에 기술된 대로 수득될 수 있다. 인간화된 항체를 포함하는 키메라 항체, 및 Fv, F (ab')2 및 FAb를 비롯한 단일-쇄 항체 및 항체 단편이 또한 관심 대상이다.
형질전환체 (
transformant
)
본 발명의 핵산은 세포주에서의 형질전환 유기체 또는 부위-특이적 유전자 변형을 포함하는 형질전환체(transformant)의 생성에 이용될 수 있다. 본 발명의 형질전환 세포는 전이 유전자(transgene)로 존재하는 본 발명의 하나 이상의 핵산을 포함한다. 본 발명의 목적으로, 원핵생물 숙주[예를 들어, 대장균, 스트렙토미세스 속( Streptomyces sp .), 바실러스 서브틸리스 (Bacillus subtilis ), 락토바실러 스 아시도필루스 (Lactobacillus acidophilus) 등] 또는 인간 배아세포를 제외한 진핵생물 숙주를 포함하는 임의의 적합한 숙주를 이용할 수 있다. 본 발명의 형질전환 유기체는 박테리아, 시아노박테리아, 균류, 식물 및 동물을 포함하는 원핵생물 또는 진핵생물 유기체일 수 있고, 본 발명의 이종 핵산을 포함하는 이 유기체의 하나 이상의 세포가 당해 분야에 주지된 형질전환 기법을 비롯한 인간의 개입(human intervention)에 의해 도입된다.
본 발명의 분리된 핵산은 당해 분야에 공지된 방법, 예를 들어, 감염, 형질주입, 형질전환, 유전자-건 전달(gene-gun delivery) 또는 트랜스컨쥬게이션(transconjugation)에 의해 숙주로 도입될 수 있다. 핵산 분자(즉, DNA)를 이러한 유기체로 이동시키는 기법은 널리 공지되어 있으며, Sambrook 등의 (Molecular Cloning: A Laboratory Manual, 3nd Ed., (2001) Cold Spring Harbor Press, Cold Spring Harbor, NY)와 같은 참고문헌에 제공된다.
한 양태에서, 형질전환 유기체는 원핵생물 유기체일 수 있다. 원핵생물 숙주의 형질전환 방법은 당해 분야에 주지되어 있다 (예를 들어, Sambrook 등의 (Molecular Cloning: A Laboratory Manual, 2nd Ed., (1989) Cold Spring Harbor Laboratory Press) 및 Ausubel 등의 (Current Protocols in Molecular Biology (1995) John Wiley & Sons, Inc)를 참고한다).
다른 양태에서, 상기 형질전환 유기체는 균류, 예를 들어, 효모일 수 있다. 효모는 이종 유전자 발현용 비히클로서 널리 이용된다(예를 들어, Goodey 등의 Yeast biotechnology, D R Berry et al., eds, (1987) Allen and Unwin, London, pp. 401-429, 및 Kong 등의 Molecular and Cell Biology of Yeasts, E. F. Walton and G. T. Yarronton, eds, Blackie, Glasgow (1989) pp. 107-133을 참고한다). 몇몇 유형의 효모 벡터가 이용 가능하며, 통합 벡터(integrative vector) - 이의 유지를 위해서 숙주 게놈과의 재조합을 필요로 한다 - 및 자율 복제 플라스미드 벡터(autonomously replicating plasmid vector)를 포함한다.
다른 숙주 유기체는 동물이다. 당해 분야에 주지되고, 참고문헌(Pinkert, Transgenic Animal Technology: A Laboratory Handbook, 2nd edition (2003) San Diego: Academic Press; Gersenstein and Vinterstein, Manipulating the Mouse Embryo: A Laboratory Manual, 3rd ed, (2002) Nagy A. (Ed), Cold Spring Harbor Laboratory; Blau et al., Laboratory Animal Medicine, 2nd Ed., (2002) Fox J.G., Anderson L.C., Loew F.M., Quimby F.W. (Eds), American Medical Association, American Psychological Association; Gene Targeting: A Practical Approach by Alexandra L. Joyner (Ed.) Oxford University Press; 2nd edition (2000)을 비롯함)에 제공된 형질전환 기법에 의해 형질전환 동물이 획득될 수 있다. 예를 들어, 형질전환 동물은 내인성 유전자 자리(endogenous locus)가 변경되는, 이종 재조합을 통해 획득될 수 있다. 대안적으로는, 핵산 제작물이 게놈에 무작위로 통합된다. 안정한 통합을 위한 벡터는 플라스미드, 레트로바이러스 및 다른 동물 바이러스, YAC 등을 포함한다.
미세주입(microinjection), 또는 재조합 바이러스 또는 재조합 바이러스 벡터를 이용한 감염 등을 비롯한, 의도적인 유전적 조작(deliberate genetic manipulation)에 의한 세포의 전구체로의 도입을 통해서, 핵산은 직접적이거나 또는 간접적으로 세포로 도입될 수 있다. 용어 "유전적 조작"은 전통적인 교배육종(cross-breeding) 또는 시험관내 수정을 포함하지 않고, 그 보다는 재조합 핵산 분자의 도입을 의미한다. 이 핵산 분자는 염색체 내에 통합될 수 있거나, 또는 이는 외부 염색체 인자로 복제하는 DNA(extrachromosomally replicating DNA)일 수 있다.
상동 재조합용 DNA 제작물은 본 발명의 핵산의 적어도 일부를 포함하며, 상기 유전자는 목적하는 하나 이상의 유전적 변형을 갖고, 표적 유전자 자리에 상동성 영역을 포함한다. 무작위 통합용 DNA 제작물은 재조합을 매개하기 위해, 상동성 영역을 포함할 필요가 없다. 양성 선택 및 음성 선택용 마커가 또한 포함될 수 있다. 상동 재조합을 통한 표적된 유전자 변형을 갖는 세포를 생성하는 방법이 당해 분야에 공지되어 있다. 포유동물 세포를 형질주입하는 다양한 기법이, 예를 들어, (Keown et al., Meth. Enzymol. (1990) 185:527-537)에 기술되어 있다.
배아 줄기 (embryonic stem, ES) 세포의 경우, ES 세포주가 이용될 수 있거나, 또는 배아세포가 마우스, 랫트, 기니피그 등을 비롯한 숙주로부터 새롭게 수득될 수 있다. 이러한 세포는 적절한 섬유아세포-피더 층(fibroblast-feeder layer) 상에서 성장되거나, 또는 백혈병 억제 인자(leukemia inhibiting factor, LIF)가 존재하는 경우 성장한다. 당해 분야에 공지된 적절한 기법을 이용하여, 형질전환된 ES 또는 배아세포는 형질전환 동물의 생성에 이용될 수 있다.
형질전환 동물은 인간이 아닌 포유동물 (예, 마우스, 랫트), 조류 또는 양서류 등을 포함하는, 임의의 인간이 아닌 동물일 수 있고, 기능 연구(functional study), 약물 스크리닝 등에 이용될 수 있다.
형질전환 식물이 또한 획득될 수 있다. 형질전환 식물세포 및 식물을 제조하는 방법이 특허 제5,767,367호, 제5,750,870호, 제5,739,409호, 제5,689,049호, 제5,690,045호, 제5,674,731호, 제5,656,666호, 제5,633,155호, 제5,629,470호, 제5,595,896호, 제5,576,198호, 제5,538,879호 및 제5,484,956호에 기술되어 있고, 이들의 개시는 본원에 참고로 포함된다. 형질전환 식물을 생성하는 방법이 Plant Biochemistry and Molecular Biology (eds. Lea and Leegood, John Wiley & Sons (1993) pp. 275-295) 및 Plant Biotechnology and Transgenic Plants (eds. Oksman-Caldentey and Barz) (2002) 719 p에서 또한 검토된다.
예를 들어, 체세포를 포함하는 배형성 외식편(embryogenic explant)은 형질전환 숙주의 제조에 이용될 수 있다. 세포 또는 조직의 수확 후에, 관심 있는 외인성 DNA를 식물세포로 도입시키는데, 다양한, 상이한 기법이 이러한 도입에 이용 가능하다. 분리된 원형질체(protoplast)를 이용하면, DNA-매개 유전자 전달 프로토콜 - 다가 양이온 (polyvalent cation) (예를 들어, PEG 또는 PLO)의 존재하에, 관심 있는 외인성 코딩 서열을 포함하는 플라스미드와 같은 네이키드 DNA (naked DNA)와 원형질체의 배양; 또는 관심 있는 외인성 서열을 포함하는 네이키드 DNA의 존재하에, 원형질체의 전기천공(electroporation);을 포함함 - 을 통해 도입시킬 기회가 생긴다. 그런 다음에, 외인성 DNA를 성공적으로 함입한 원형질체가 선별되고, 적절한 양 및 비율의 자극 인자 - 옥신(auxin) 및 시토키닌(cytokinin)과 같은 - 와의 접촉을 통해서 캘러스(callus)로 성장하여, 궁극적으로는 형질전환 식물로 성장한다.
통상적인 기술자가 이용할 수 있는 "유전자-건" 접근법 또는 아그로박테리움-매개 형질전환(Agrobacterium-mediated transformation)과 같은, 식물을 생산하는 다른 적합한 방법들이 이용될 수 있다.
이용방법
본 발명의 폴리펩티드 및 핵산은 다양한, 상이한 적용분야에서 이용된다. 예를 들어, 이들은 진단학, 품질관리, 환경시험(environmental test) 및 생물공학 및 의학분야에서의 다른 유사한 검정을 위한 시약으로 이용된다. 또한, 이들은 가정에서, 오락-지향 적용분야(entertainment-oriented application), 예를 들어, 광원으로 이용될 수 있는 생물 발광 형질전환 식물 및 동물의 생성에 이용된다.
예를 들어, 조성물의 핵산은 매질에서 다양한 외부 신호의 검출, 예를 들어, 포유동물의 장(intestine)에서 신호의 검출에 이용된다. 이 양태에 대해서, 신호전달 연쇄반응(signalling cascade)을 암호화하는 발현 카세트가 숙주의 게놈으로 도입되는데, 분석된 주변 신호는 트리거(trigger)로 작용하고, 루시퍼라제 유전자 발현은 리포터(reporter)로 작용한다. 루시퍼라제 유전자 발현은 신호전달 연쇄반응 전달에 의해, 또는 예를 들어, [Kotula et al., Proc. Natl. Acad. Sci. USA, 2014, 111: 4838-4843]에 기술된 기법을 이용하여 세포 게놈의 유전적 변경을 유도하는 것을 통해 직접적으로 야기될 수 있다. 예를 들어, 주변 매질 중 테트라사이클린의 존재를 검출하는 대장균 균주의 고안에 대해서, tetA 유전자 프로모터의 제어하에 있는 루시퍼라제 코딩 서열, 및 항시성 프로모터(constitutive promoter)의 제어하에서 트랜스포존(transposon) Tn10의 테트라사이클린 억제자 (tetracycline repressor, TetR)를 암호화하는 서열이 대장균 게놈으로 도입된다. 대장균의 게놈 편집(editing)은, 예를 들어, [Sabri et al., Microbial Cell Factories, 2013, 12:60]에 기술된 당해 분야에 주지된 기법을 통해 수행된다. 샘플 매질에서 배양된 후에 유전적으로 변형된 대장균 세포 및 이러한 배양을 하지 않은 대조 세포에 3-히드록시히스피딘을 추가한 후에, 매질 중 테트라사이클린의 존재가 생물 발광 강도의 비교에 의해 검출된다. 이와 유사하게, 신호전달 연쇄반응의 대응하는 인자를 목적하는 신호에 특이적으로 감수성인 인자로 치환시킴으로써, 다른 주변 매질 신호에 감수성인 다른 미생물 균주가 고안될 수 있다. 대상 루시퍼라제에 의한 빛 방출이 ATP, NAD(P)H 및 다른 대사산물의 세포 내 가용성(intracellular availability)으로부터 독립적인 것은 세포의 다양한 생리학적 상태에서 리포터 신호의 안정성을 보장한다.
또한, 본 발명의 핵산은 수(water) 중 독성 물질, 예를 들어, 헥사클로로사이클로핵산(hexachlorocyclohexane) 유도체 등의 존재를 결정하는 방법에 이용된다. 신속한 단백질 분해의 신호에 작동 가능하게 융합된 루시퍼라제의 항시적인 생성을 제공하는 발현 카세트가 숙주 (예를 들어, 대장균)로 도입된다. 독성을 측정하기 위해, 동결건조된 박테리아를 90분 동안 생물 발광 검출 큐벳에서 동일한 액체와 배양시키고; 동시에, 박테리아의 다른 분획물을 대조 액체(control liquid)와 배양시킨다. 독성 효과에 대한 기준은 독성 물질을 함유하지 않는 용액을 갖는 샘플의 생물 발광 강도의 변화와 비교된, 분석된 탐침에서의 생물 발광 강도의 변화이다. 따라서, 발광 강도의 하락에 기초해 독성 효과를 측정할 수 있다.
또한, 본 발명의 분자는 샘플 용액 중 3-히드록시히스피딘의 농도의 측정에 이용될 수 있다. 이를 위해, 알려진 농도의 정제된 루시퍼라제를 함유하는 시약을 큐벳에 넣고, 백그라운드 생물 발광 신호를 발광측정기(luminometer)를 이용해서 기록한다. 그런 다음, 대조군 보정 측정 (Control calibration measurement)을 다음과 같이 수행한다: 생물 발광 강도를 기록하는 동안에 알려진 농도의 3-히드록시히스피딘 용액을 큐벳에 추가한다. 3-히드록시히스피딘이 존재하는 경우 또는 존재하지 않는 경우의 생물 발광 강도 신호의 등급(magnitude)의 차이는 3-히드록시히스피딘의 농도에 비례하는 값이다. 수행될 측정에 관계된 3-히드록시히스피딘 용액의 농도에 대해서 작업을 반복한다. 획득된 데이터에 기초하여, 3-히드록시히스피딘 농도에 대한 생물 발광 강도의 의존성에 대한 보정 곡선(calibration curve)을 플로팅한다. 알려지지 않은 농도의 3-히드록시히스피딘 용액을 시약에 추가한 후에, 상기 보정 곡선을 이용하여, 알려지지 않은 샘플 중 3-히드록시히스피딘 농도를 생물 발광 강도에 기초하여 결정한다. 대상 단백질 및 핵산은 다른 화합물을 포함하는 복합 혼합물(complex mixture) 중 3-히드록시히스피딘의 농도를 특이적으로 측정할 수 있는 유일하게 존재하는 시약이다.
조성물의 핵산은 빛-방출 형질전환 식물 또는 동물의 생산에 더 이용될 수 있다. 예를 들어, 형질전환 이끼 [피스코미트렐라 파텐스 ( Physcomitrella patens )]를 생산하기 위해, 항시성 프로모터(constitutive promoter), 예를 들어, 벼의 AktI 유전자의 프로모터, 또는 유도성 프로모터(inducible promoter), 예를 들어, 대두의 Gmhsp17.3B 유전자의 열-민감성 프로모터의 제어하에서, 숙주세포에서의 발현에 최적화된 서열을 암호화하는 루시퍼라제를 이의 게놈으로 통합시키는 것이 필요하다. 화농성연쇄상구균 (Streptococcus pyogenes )으로부터의 Cas9 핵산가수분해효소와 게놈 유전자 자리에 상보적인 가이드 RNA (guide RNA)를 이용하여, 당해 분야에 공지된 임의의 방법이 이러한 통합, 예를 들어, 이끼의 게놈 DNA에서의 이중-가닥 갭(double-stranded gap)의 형성에 의해 유도되는 상동 재조합에 이용될 수 있다. 이 경우에, 통합된 유전적 제작물은 길이가 약 250개인 뉴클레오티드를 갖는 이중-가닥 갭의 영역 내 게놈의 영역에 상동인 영역이 플랭킹(flanking)되어야 한다. 임의의 공지된 기법이 DNA의 이끼 세포로의 전달, 예를 들어, 폴리에틸렌 글리콜을 이용한 이끼 원형질체와 네이키드 DNA의 형질전환에 또한 이용될 수 있다. 형질전환 후에, 이끼 원형질체는 세포벽 재생을 위한 성장 배지에서 성장되어야 하고, 그런 다음에 이들은 배우체(gametophyte)의 재생을 위한 고체 배지에 플레이팅(plating)되어야 한다. 유전적으로 변형된 식물은 3-히드록시히스피딘 또는 방출된 분자가 배지 또는 토양에 추가되는 경우에 광원으로 작용할 수 있거나, 또는 숙주세포에서 3-히드록시히스피딘 생합성이 발생하는 경우에 자체적으로 생물발광할 수 있다. 대상 루시퍼라제는 대부분 초록색 빛을 방출하므로, 가시 스펙트럼(visible spectrum)의 초록색 영역에서 광합성 식물 조직의 감소된 흡수로 인해, 이러한 조직을 통한 빛의 방출에 최적으로 적합하다.
조성물의 핵산은 세포 단백질, 소기관, 개별적인 세포 또는 조직의 가시화에 또한 이용될 수 있다. 예를 들어, 유기체에서 암세포의 이동을 가시화하기 위해, 루시퍼라제의 핵산 서열은 발현 카세트 또는 발현 벡터의 일부로서 암세포에 도입된다. 당해 분야에 공지된 임의의 방법은 이러한 도입에 이용될 수 있다. 예를 들어, 루시퍼라제를 암호화하는 핵산은 숙주로 이식되기 전에 암세포의 게놈에 통합될 수 있다. 다른 양태에서, 핵산은 모든 유기체 세포로 통합되나, 암세포에서만 활성인 프로모터의 제어하에 있다. 3-히드록시히스피딘이 세포막을 통해 침투하는 것이 가능하기 때문에, 대상 루시퍼라제는 조직 고정(tissue fixation) 및 투과화(permeabilization) 없이, 살아있는 유기체에서 생체내 가시화될 수 있다. 암 종양 및 전이의 발달을 가시화하기 위해, 루시페린 용액은 샘플 유기체로 도입되어야 하고, 조직은 생물 발광의 검출에 적합한 장비를 이용하여 가시화되어야 한다.
키트
본 발명은 본 발명의 핵산 및 단백질의 하나 이상의 적용을 실시하는 키트를 또한 제공한다.
상기 키트는 통상적으로는 본 발명에 따른 단백질 또는 이러한 단백질을 암호화하는 핵산을 포함하고, 바람직하게는 인자를 함께 포함하여 숙주에서의 표적 단백질의 발현을 제공하는데, 그 예로는 표적 단백질을 암호화하는 핵산을 포함하는 발현 벡터 또는 발현 카세트가 있다. 또한, 상기 키트는 본 발명의 루시퍼라제에 의해 매개된 발광 반응을 수행하는 루시페린을 포함한다.
일부 양태에서, 루시페린은 3-히드록시히스피딘, (E)-6-(4-디에틸아미노)스티릴)-3,4-디히드록시-2H-피란-2-원, (E)-3,4-디히드록시-6-(4-히드록시스티릴)-2H-피란-2-원, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원, (E)-6-(2-(1,2,3,5,6,7-헥사히드로피리도[3,2,1-ij]퀴놀린-9-일)비닐)-3,4-디히드록시-2H-피란-2-원, 및 (E)-3,4-디히드록시-6-(2-(6-히드록시나프탈렌-2-일)비닐)-2H-비란-2-원으로 이루어진 군으로부터 선택된다.
상기 키트 구성요소는 완충 용액과 같은 적합한 보관 매질(storage medium)에, 보통은 적합한 용기에 존재한다. 상기 구성요소는 동결건조된 형태로 키트에 존재할 수 있다.
또한, 키트는 대상 단백질에 특이적인 항체를 포함할 수 있다. 일부 양태에서, 상기 키트는 복수의 상이한 벡터 - 이들 각각은 표적 단백질을 암호화한다 - 를 포함하고, 상기 벡터는 상이한 매질 및/또는 다양한 조건하에서의 발현, 예를 들어, 항시적인 발현(constitutive expression)과 같은 발현을 위해 설계되었으며, 상기 벡터는 포유동물 세포에서의 발현을 위한 강력한 프로모터, 또는 통상적인 프로모터 통합 및 장기적인 발현 등을 위한 다중 클로닝 부위 (multiple cloning site)를 갖는 비-프로모터 벡터를 포함한다.
상기 구성요소 외에, 표적 키트는 대상 방법을 실시하기 위한 설명서를 또한 포함한다. 설명서는 표적 키트에 상이한 형태로 존재할 수 있고, 하나 이상의 이러한 형태가 각 키트에 존재할 수 있다.
아래 실시예는 한정하는 것이 아닌, 예시로서 제공된다.
[
실시예
]
[
실시예
1.
네오노토파누스
남비
로부터의
루시퍼라제의
코딩 서열의 분리]
네오노토파누스 남비의 균사체(mycelium)로부터의 전체 RNA를 [Chomczynski and Sacchi, Anal. Biochem., 1987, 162, 156-159]에 기술된 방법을 이용하여 분리하였다. cDNA를 SMART PCR cDNA 합성 키트 (미국 소재, Clontech)를 이용하여 제조사의 프로토콜에 따라 증폭시켰다. PCR 산물을 pGAPZ 벡터 (미국 소재, Invitrogen)로 클로닝했고, XL1 블루 균주 (XL1 Blue strain)의 컴피턴트 대장균 세포(competent E. coli cell)로 형질전환시켰다. 이 박테리아를 제오신 항생제(zeocin antibiotic)가 존재하는 페트리 접시(Petri dish)에서 성장시켰다. 16시간 후에, 콜로니를 접시로부터 세척했고, 강하게 혼합하였으며, 플라스미드 DNA 추출 키트 (러시아 소재, Evrogen)를 이용해서, 이로부터 플라스미드 DNA를 추출했다. 분리된 플라스미드 DNA를 AvrII 제한 부위에 의해 선형화시켜서 피히아 파스토리스 GS115 (Pichia pastoris GS115) 세포의 형질전환에 이용했다. 전기천공법(Electroporation)을 [Wu and Letchworth, Biotechniques, 2004, 36:152-4]에 기재된, 리튬 아세테이트 및 디티오트레이톨을 이용한 방법에 따라 수행했다. 전기천공된 세포를 1 M 솔비톨, 2% (w/v) 포도당, 1.34% (w/v) 효모 질소 염기 (yeast nitrogen base, YNB), 0.005% (w/v) 아미노산 혼합물, 0.00004% (w/v) 비오틴 및 2% (w/v) 한천을 함하는, RDB 배지를 함유하는 페트리 접시에 도말했다(spreading). 효모에서 네오 노토파누스 남비의 생성되는 cDNA 라이브러리의 다양성은 약 100만 개의 클론에 달했다. 수득된 콜로니들을 3-히드록시히스피딘의 용액과 함께 분무했고(spraying), 세포에서 루시퍼라제의 존재를 빛 방출에 의해 검출했다. IVIS 스펙트럼 CT (미국 소재, PerkinElmer)를 콜로니가 방출한 빛의 검출에 이용했다. 3-히드록시히스피딘을 추가한 후에 발광이 검출된 콜로니들을 선별해서 PCR용 표준 플라스미드 프라이머와 함께 주형으로 이용했다. PCR 산물을 생거법(Sanger method)에 의해 시퀀싱했다. 수득된 핵산 서열은 서열번호 01에 나타냈다. 수득된 핵산 서열로 암호화되는 아미노산 서열은 서열번호 02에 나타냈다.
발현된 루시퍼라제의 생물 발광을 분석하기 위해, 발광이 관찰된 피히아 파스토리스 콜로니들을 분리해서, 250 ml의 YPD 배지가 채워져 있는 750 ml 플라스크에서, 72시간 동안, 30°C에서 성장시켰고, 200 rpm에서 스터링했다(stirring). 그런 다음에, 루시퍼라제-발현 세포를 5000 g에서 15분 동안, 4°C에서 원심분리시켜서 펠렛으로 만들었다. 수득된 펠렛을 0.1% DDM을 포함하는 pH 7.4의 0.1 M 포스페이트 완충액에 2시간 동안 4°C에서 재현탁시켰다(resuspending). 현탁액을 21000 g에서 30분 동안 4°C에서 원심분리시켰다. 750 μl의 수득된 현탁액을 1% DDM 중 3-히드록시히스피딘 (25 μM)의 용액 250 μl에 추가하여 생물 발광 반응을 활성화시켰다. Varian Cary Eclipse 분광 형광 측정기(spectrofluorimeter)를 이용해서 생물 발광을 검출하였다. 수득된 스펙트럼은 네오노토파누스 남비 균사체 생물 발광의 스펙트럼과 실질적으로 동일했다 (도 1).
[
실시예
2. 다양한
균종(Fungal Species)으로부터의
루시퍼라제의
코딩 서열의 분리]
게놈 DNA를 천마버섯 ( Armillaria gallica ), 뽕나무 버섯 ( Armillaria mellea), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯( Mycena chlorophos), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) 및 부채 버섯 (Panellus stipticus )으로부터 분리했고, Illumina HiSeq 기술 (미국 소재, Illumina)를 이용해서 제조사의 권고에 따라, 전체 게놈 시퀀싱(full genomic sequencing)을 수행했다. 시퀀싱 결과를 가설 단백질의 아미노산 서열의 예측 및 실시예 1에 기술된 대로 검출된 네오노토파누스 남비로부터의 루시퍼라제의 상동체의 탐색에 이용했다. Altschul 등의 J. Mol. Biol., 215, pp. 403-10 (1990)에 기술된 서열 분석용 알고리즘 및 국립 생물공학 정보센터에 의해 제공된 소프트웨어를 이용해서 상동체를 탐색했다. 아미노산 서열을 NCBI Genbank 데이터베이스의 균류 게놈 시퀀싱 데이터에서 탐색했다. BLASTP의 검색 프로그램의 표준 파라미터를 탐색에 이용했다. 결과적으로, 가설 단백질의 서열, 즉, 천마버섯 ( Armillaria gallica), 뽕나무 버섯 ( Armillaria mellea ), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯 ( Mycena chlorophos ), 옴팔로투스 올레아리우스 (Omphalotus olearius ), 부채 버섯 (Panellus stipticus ) 및 미세나 시트리컬러 (Mycena citricolor )에서 네오노토파누스 남비로부터의 루시퍼라제의 상동체가 검출되었다. 검출된 루시퍼라제 모두가 서로 실질적으로 동일하다. 아미노산 서열의 일치도는 표 1에 나타냈다.
[표 1.
루시퍼라제의
아미노산 서열의 일치도]
뉴클레오티드 서열의 보존 영역(conserved region)의 다중 정렬에 기초하여, 축퇴 프라이머를 제작했다. 프라이머의 구조를 서열번호 36-43에 나타냈다. 전체 RNA를 천마버섯 ( Armillaria gallica ), 뽕나무 버섯 ( Armillaria mellea ), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯 ( Mycena chlorophos ), 미세나 시 트리컬러 (Mycena citricolor ), 옴팔로투스 올레아리우스 ( Omphalotus olearius ), 및 부채 버섯 ( Panellus stipticus )의 자실체(fruiting body) 및 균사체로부터 분리했고, 실시예 1에 기술된 대로 cDNA를 제조했다. 수득된 cDNA를 상기 프라이머와 함께 PCR에 이용했다. 1μl의 20배 증폭된 cDNA, Encyclo 중합효소 믹스 (Evrogen), 제조사에 의해 제공된 1배 완충액, 200 μM dNTPs 및 프라이머 1711-1714 중 하나인, 0.5 μM의 프라이머, 및 프라이머 1715 -1718 중 하나인, 0.5 μM의 프라이머를 포함하는, 50 μl의 반응 혼합물에서 PCR을 수행했다. PTC-200 MJ Research Thermal Cycler에서, "Block" 온도 제어법 (각 사이클은 다음의 조건하에서 수행된다: 95°C에서 10초, 55°C에서 10초, 및 72°C에서 1분)을 이용하여 30회의 PCR 사이클을 수행했다. PCR 산물을 pTAdv 벡터 (Clontech)로 클로닝했고, 플라스미드 DNA를 분리해서 생거법으로 M13 공통 프라이머(universal primer)를 이용하여 시퀀싱했다. 모든 경우에서, 샘플 균류의 cDNA는 루시퍼라제 서열을 보였다.
부채 버섯 ( Panellus stipticus ) cDNA의 증폭은 146번 위치에서(서열번호: 15-18), 발린을 이소류신으로 단일 아미노산 치환하는 것을 특징으로 하는, 루시퍼라제 서열의 두 변이체를 야기했다.
[
실시예
3. 포유동물 세포에서
루시퍼라제의
발현]
실시예 1과 실시예 2에서 나타낸 대로 수득한 루시퍼라제의 코딩 서열을 포유동물 세포에서의 발현에 최적화 (인간화)시켰다. 인간화된 핵산을 올리고뉴클레오티드 합성에 의해 표준 기법을 이용해서 수득했다. 인간화된 핵산의 뉴클레오티드 프로파일(nucleotide profile)을 서열번호 44-51에 나타냈고, 대응하는 단백질의 아미노산 프로파일은 서열번호 2, 4, 6, 8, 10, 12, 14, 16에 나타낸 야생형 단백질과 동일하다. 수득된 핵산을 mKate2-케라틴 융합 단백질을 암호화하는 서열 대신, Nhel 및 Notl 제한 부위를 이용하는 pmKate2-케라틴 벡터 (러시아 소재, Evrogen)로 클로닝했다. 플라스미드 DNA를 정제해서, FuGENE HD 형질주입 시약 (미국 소재, Promega)을 이용하여, 제조사의 프로토콜에 따라 HEK293NT 및 HeLa 세포로 형질주입했다. 형질주입 절차 24시간 후에, 농도가 660 μg/ml인 3-히드록시히스피딘을 배지에 추가하였고, IVIS 스펙트럼 CT (PerkinElmer)를 이용해서 세포 발광을 검출했다. 모든 샘플의 빛 방출의 강도는 비-형질주입 대조 세포로부터 비롯된 신호보다 한 크기 정도(an order of magnitude) 크다 (도 2).
벡터에 포함된 뉴클레오티드 서열 서열번호 51에 146번 위치에서 발린을 이소류신으로 대체하는, 부위-지정 돌연변이를 유발시켰다. 수득된 서열을 포함하는 벡터를 HEK293NT 세포로 형질주입했다. 형질주입 절차 24시간 후에, 농도가 660 μg/ml인 3-히드록시히스피딘을 배지에 추가했고, IVIS 스펙트럼 CT (PerkinElmer)를 이용해서 세포 발광을 검출했다. 이 변이체가 또한 생물 발광 반응에서 3-히드록시히스피딘의 산화를 가능하게 한다는 것이 밝혀졌다.
[
실시예
4.
피히아
파스토리스
세포에서
네오노토파누스
남비
로부터의
루
시퍼라제의 발현]
네오노토파누스 남비로부터의 루시퍼라제를 암호화하는 DNA를 실시예 1에 나타낸 대로 수득했다. 유전자-특이적 말단 프라이머(terminal primer)를 이용하여 루시퍼라제 유전자를 증폭시켜서, C-말단 his-태그를 암호화하는 서열과 인-프레임으로, BstBI와 SalI 제한 핵산 내부 가수분해효소 부위를 이용하는 GAP-pPicZA 발현 벡터 (Invitrogen)로 클로닝시켰다. 전기천공법에 의해, 수득된 유전자 제작물을 낮은 단백질 가수분해 효소 활성을 특징으로하는 피히아 핑크( Pichia pink) 균주로 형질전환시켰다. 전기천공법 절차를 [Wu and Letchworth, Biotechniques, 2004, 36:152-4]에 기술된 리튬 아세테이트 및 디티오트레이톨(dithiothreitol)을 이용한 방법에 따라 수행했다. 전기천공된 세포를 YPD 배지 (2% (w/v) 펩톤, 1% (w/v) 효모 추출물, 2% (w/v) 포도당, 2 % (w/v) 한천) 및 농도가 100 μg/ml인 제오신 항생제를 함유하는 페트리 접시에 도말했다.
루시퍼라제를 생성하는 피히아 핑크 클론을 3-히드록시히스피딘의 용액과 함께 콜로니의 분무 및 IVIS 스펙트럼 CT (PerkinElmer)를 이용한 생물 발광 (방출하는 빛)의 가시화를 통해 검출했다. 가장 높은 발광 강도를 특징으로 하는 클론들을 선별했다. 클론들을 분리했고, 250 ml의 YPD 배지로 채워져 있는 750 ml 플라스크에서, 72시간 동안, 30°C에서 성장시켰으며, 200 rpm에서 교반시켰다. 5000 g에서, 15분 동안, 4°C에서의 원심분리에 의해, 루시퍼라제-발현 세포를 펠렛으로 만들었다. 수득된 펠렛을 100 ml의 용해 완충액 (0.1 M 소듐 포스페이트, 0.1 M KCl, 4 mM EDTA, 2 mM TCEP, 1 mM PMSF, pH 7.4) 중에 재현탁시켰고, APV2000 고압 균질기 (SPX)을 이용하여, 600 bar에서 20회 처리했다. 용해물을 8000 g에서 15분 동안 4°C에서 원심분리시켰다. 수득된 후-핵 상청액(post-nuclear supernatant)을 140000 g에서 2시간 동안 4°C에서 원심분리시켰다. 수득된 잔류물 (마이크로솜 분획)을 10 ml의 수중에 재현탁시켰다. 램리법(Laemmli method)에 따라서 (쿠마시 블루로 염색된 10-25% 폴리아크릴마이드 겔), 폴리아크릴아미드 겔 전기영동을 변성시킴으로써 샘플을 용해했고, 화학발광 신호 검출(chemiluminescence signal detection)과 함께, his-태그를 표적화하는 항체 컨쥬게이트 및 겨자무 과산화효소를 이용하는 웨스턴 블랏에 사용했다 (도 4). 웨스턴 블랏은 네오노토파누스 남비로부터의 루시퍼라제의 예상 분자량에 대략적으로 대응하는, 28 kDa의 단백질의 영역 내 겔에서 이동하는 루시퍼라제의 특이적인 염색을 보였다. 또한, 웨스턴 블랏은 재조합 루시퍼라제와 140000 g에서의 원심분리에 의해 수득된 잔류물의 공침(coprecipitation)을 나타냈다.
[
실시예
5.
루시퍼라제의
기능성 단편의 수득]
네오노토파누스 남비로부터의 루시퍼라제의 절단된 단편을 암호화하는 오픈 리딩 프레임을 올리고뉴클레오티드 합성을 이용하여 수득했다. N-말단에서 6, 9, 12, 15, 21, 25, 31, 33, 35, 37 및 40번 아미노산 잔기에서의 절단(cut)을 갖는 루시퍼라제 단편을 암호화하는 핵산을 전사 개시 부위 및 his-태그를 암호화하는 핵산에 작동 가능하게 융합시킨 다음에, BamHI과 HindIII 제한 핵산 내부 가수분해효소를 이용하여 pET-23 벡터로 클로닝했다. 벡터를 이용해서 BL21-CodonPlus 균주 (Stratagene BL21-Gold 고-수율 균주의 유도체)의 대장균 세포로 형질전환시켰다. 이 세포를 다음의 배지를 함유하는 페트리 접시에 플레이팅했고(plating): 1% NaCl, 1% 트립톤, 0.5% 효모 추출물, 1.5% 한천, 100 μg/ml의 암피실린, 100 μg/ml의 클로람페니콜 및 물), 37°C에서 밤새 배양시켰다. 그런 다음에, 대장균 세포 콜로니를 루시페린의 용액과 함께 분무했고, IVIS 스펙트럼 CT (미국 소재, PerkinElmer)에서 가시화하여 발현된 루시퍼라제 단편의 기능성을 측정했다. N-말단의 6, 9, 12, 15, 21, 25, 31, 33, 35, 37번 아미노산 잔기에서 절단이 있는 루시퍼라제 단편이 루시페린의 용액과 함께 분무되는 경우에 빛을 방출한다는 것이 밝혀졌다.
루시퍼라제 단편이 작동 가능하게 융합된 N-말단의 뉴클레오티드 및 아미노산 서열을 서열번호 52와 53에 각각 나타냈다.
[http://www.cbs.dtu.dk/services/TMHMM/]에 기술된 소프트웨어를 이용하여, 네오노토파누스 남비로부터의 루시퍼라제의 아미노산 서열의 분석을 수행했고, 처음 39개의 아미노산이 막 관통 도메인을 포함한다는 것을 보였다 (도 5). 획득된 데이터에 기초하여, 막 관통 도메인을 포함하는 서열의 제거는 빛 방출을 동반하는, 3-히드록시히스피딘의 산화를 촉매하는 균류 루시퍼라제의 능력에 영향을 끼치지 않는다는 결론을 내렸다.
[http://www.cbs.dtu.dk/services/TMHMM/]에 제공되는 소프트웨어를 이용하여, 실시예 2에서 기술된 대로 클로닝된, 천마버섯 ( Armillaria gallica ), 뽕나무 버섯 ( Armillaria mellea ), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯 ( Mycena chlorophos ), 미세나 시 트리컬러 ( Mycena citricolor ), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) 및 부채 버섯 ( Panellus stipticus )으로부터의 루시퍼라제를 분석했다. 각 경우에서, 막 관통 도메인을 포함하는 N-말단 단편을 아미노산 서열에서 검출했다 (도 5). 막 관통 도메인을 포함하는 N-말단 서열의 제거 후에 수득된, 루시퍼라제 단편의 뉴클레오티드 및 아미노산 서열을 서열번호 19-34에 나타냈다.
루시퍼라제의 다중 정렬을 도 5에 나타냈다. 단백질이 C-말단에서 길이가 8-11개인 아미노산의 비-보존적 단편을 포함하는 것을 볼 수 있다. 단편은 또한 루시퍼라제 기능성의 손실 없이 제거될 수 있거나 또는 다른 C-말단으로 치환될 수 있다. 루시퍼라제가 서열번호 35에 나타낸 공통 서열을 포함하는 고-상동성 중심 영역(high-homologous central region)을 포함하는 것을 또한 볼 수 있다.
[
실시예
6. 다른 루시페린과
루시퍼라제의
이용]
포유동물 세포에서의 발현에 필요한 균류 루시퍼라제의 코딩 서열을 포함하는 플라스미드를 실시예 3에 기술된 대로 수득해서, HEK293N 세포의 형질주입에 이용했다. 형질주입 절차 24시간 후, 트립신-베르센 용액(trypsin-Versen solution) (0,025% 트립신)을 이용하여 세포를 접시로부터 떼어냈고, 배지를 pH 8.0의 포스페이트 살린 버퍼(Phosphate-buffered saline)로 교체했으며, 원심분리에 의해 세포를 재현탁시켰고, 초음파를 이용하여 용해했다; 농도가 660 μg/ml인 3-히드록시히스피딘 또는 이의 유도체 ((E)-6-(4-디에틸아미노)스티릴)-3,4-디히드록시-2H-피란-2-원, (E)-3,4-디히드록시-6-(4-히드록시스티릴)-2H-피란-2-원, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원, (E)-6-(2-(1,2,3,5,6,7-헥사히드로피리도[3,2,1-ij]퀴놀린-9-일)비닐)-3,4-디히드록시-2H-피란-2-원 및 (E)-3,4-디히드록시-6-(2-(6-히드록시나프텔렌-2-일)비닐)-2H-피란-2-원) 중 하나를 배지에 추가했다.
Varian Cary Eclipse 분광 형광 측정기를 생물 발광 스펙트럼의 검출에 이용했다. 모든 검토된 루시페린으로, 모든 샘플들이 빛을 방출했다. 이용된 루시페린에 따라, 발광 최적 변위(luminescence optimum displacement)가 다음과 같이 관찰되었다 : (E)-3,4-디히드록시-6-(2-(6-히드록시나프탈렌-2-일)비닐)-2H-피란-2-원의 산화 동안에, 580 nm가 넘는 파장을 갖는, 양자의 현저한 방출을 동반한 장-파장 영역으로의 이동이 관찰되고, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원의 산화 동안에, 단-파장 영역으로의 이동이 관찰된다.
[
실시예
7. 재조합
루시퍼라제의
수득]
서열번호 52의 서열을 루시퍼라제의 기능성 단편을 암호화하는 핵산(서열번호 19, 21, 23, 25, 27, 29, 31, 33)의 5'말단에 작동 가능하게 연결했고, 수득된 제작물을 pET-23 벡터로 BamHI 및 HindIII 제한 핵산 내부가수분해 효소를 이용해서 클로닝했다. 벡터를 이용해서 BL21-CodonPlus 균주 (Stratagene BL21-Gold 고-수율 균주의 유도체)의 대장균 세포로 형질전환했다. 세포를 1.5% 한천, 100 μg/ml의 암피실린 및 100 μg/ml의 클로람페니콜을 포함하는 LB 배지를 포함하는 페트리 접시에 플레이팅했고, 37°C에서 밤새 배양시켰다. 그런 다음에, 대장균 콜로니를 암피실린과 클로람페니콜이 보충된 4 ml의 액체 LB 배지로 옮겨서, 37°C에서, 요동(rocking)과 함께 밤새 배양시켰다. 1 ml의 밤새 배양물(overnight culture)을 미리 추가된 암피실린과 클로람페니콜을 함유하는, 100 ml의 Overnight Express Autoinduction 배지 (Novagen)로 옮겼다. 600 nm에서 0.6 OD의 광학 밀도에 도달할 때까지, 배양물을 37°C에서 2.5시간 동안 성장시킨 다음에, 이를 16시간 동안 실온에서 성장시켰다. 그런 다음에, Eppendorf 5810R 원심분리기에서, 4500 rpm에서 20분 동안의 원심분리에 의해 세포를 펠렛으로 만들었고, 35 ml의 완충액 (50 mM Tris HCl, pH 8.0, 150 mM NaCl) 중에 재현탁해서 음파 파쇄(sonication) 시켰다. 세포 용해물을 7500 rpm에서 15분 동안 원심분리했고, 잔류물을 추출했으며, 상청액을 35000 rpm에서 1시간 동안 더 원심분리해서 마이크로솜 분획을 가용성 분획으로부터 분리했다. 잔류물을 요소를 함유하는 10 ml의 완충액 (8M 요소, 50 mM Tris, pH 8.0)에, 실온에서 밤새 용해시켰다.
예상 재조합 생성물의 존재는 전기천공법에 의해 확인했다. 네오노토파누스 남비로부터의 루시퍼라제의 단편에 대한 이러한 분석의 예시는 도 6에 나타냈다. 네오노토파누스 남비로부터의 루시퍼라제의 예상 분자량에 대략적으로 대응하는 28 kDa 영역 내 밴드가 관찰될 수 있었다. 분리된 재조합 단백질의 분획물을 전기영동용 폴리아크릴아미드 겔에 적용했다. 또한, 이들을 재조합 단백질의 기능성과 안정성의 확인에 이용했다. 3-히드록시히스피딘을 추가한 경우에, 분리된 재조합 단백질은 빛을 방출했고, 520-535 nm의 범위 내에서 방출 최대를 가지며, 네오노토파누스 남비로부터의 루시퍼라제의 기능성 단편은 가장 높은 강도의 방출된 빛을 가졌고, 옴팔로투스 올레아리우스 ( Omphalotus olearius )로부터의 루시퍼라제의 기능성 단편은 가장 낮은 강도를 가졌다. 재조합 단백질은 pH 7-9의 완충 용액에서 활성이었고, pH 7.3-8에서 최대 강도의 생물 발광을 보였다. 용액의 pH에 대한 생물 발광 강도의 의존성에 대한 다이어그램의 예시를 도 7에 나타냈다.
온도 안정성을 분석하기 위해, 루시퍼라제를 상이한 온도에서, 10분 동안, pH 7.4에서 배양시켰다. 배양의 말에, 3-히드록시히스피딘을 단백질에 추가했고, 생물 발광 강도를 상기 기술된 대로 분석했다. 50°C 이하의 온도에서 배양시킨 후에, 루시퍼라제는 활성을 최대 활성의 10% 넘게, 40°C 이하의 온도에서는 최대 활성의 30% 넘게, 38°C 이하의 온도에서는 70% 넘게, 및 34°C 이하의 온도부터는 활성을 100% 유지했다.
[
실시예
8. 세포 표지를 위한
네오노토파누스
남비
로부터의
루시퍼라제의
이용]
실시예 3에 기술된 대로 수득된, 거대세포 바이러스 프로모터(cytomegaloviral promoter)의 제어하에 있는 네오노토파누스 남비로부터의 루시퍼라제를 포함하는 벡터를 붉은색 형광 단백질을 암호화하는 pTurboFP635-N 벡터 (러시아 소재, Evrogen)와 함께 HEK293NT 세포주의 세포로 공동-형질주입했다. FuGENE HD 형질주입 시약 (Promega)을 이용해서, 제조사가 권고한 프로토콜에 따라서 형질주입을 수행했다. 형질주입 절차 24시간 후에, 3-히드록시히스피딘을 배지에 660 μg/ml의 최종농도로 추가했고, 20x 대물렌즈와 Leica DM6000 현미경을 이용해서 세포 발광을 분석했다. 세포를 투과광(transmitted light)에서, 형광을 검출하는 초록색 채널과 붉은색 채널에서 가시화했다 (도 6). 인간 세포에서 네오노 토파누스 남비로부터의 루시퍼라제의 발현은 스펙트럼의 초록색 영역에서 분명한 광신호를 야기한다. 세포에 대한 루시퍼라제 발현의 독성에 대한 신호는 나타나지 않았다.
[
실시예
9.
네오노토파누스
남비로
부터의
루시퍼라제를
이용한 단백질의 표지]
실시예 3에 기술된 대로 수득된, 네오노토파누스 남비로부터의 루시퍼라제를 암호화하는 인간화된 핵산을 세포질 베타-액틴(cytoplasmic beta-actin) 및 인간 피브릴라린(fibrillarin)을 암호화하는 핵산에 작동 가능하게 융합했다 (인-프레임 방식으로 클로닝함). 실시예 3에 기술된 대로, 수득된 제작물을 pmKate2-케라틴 벡터로 클로닝했다. 형질주입 절차 24시간 후에, 3-히드록시히스피딘을 배양 배지에 최종 농도 660 μg/ml까지 추가했고, 기록된 생물 발광은 대응하는 세포 단백질의 전형적인 세포내 국소화 패턴에 일치했다.
[
실시예
10.
네오노토파누스
남비로
부터의
루시퍼라제를
이용한 세포 소기관의 표지]
실시예 3에 기술된 대로 인간 세포에서의 발현에 최적화되고 수득된, 네오노토파누스 남비로부터의 루시퍼라제의 서열의 변이체를 다음의 세포내 국소화 신호에 인-프레임 방식으로 작동 가능하게 융합했다: 인간 사이토크롬 산화효소(cytochrome oxidase)의 서브 유닛 7로부터의 미토콘드리아 표적 신호(mitochondrial targeting signal, MTS); 인간 베타 1-4 갈락토실 전이효소의 N-말단의 81 아미노산에 의해 암호화되는 신호 [Watzele and Berger, Nucleic Acids. Res., 1990, 18:7174]; 퍼옥시좀 표적 신호(peroxisomal targeting signal) [Gould et al. J. Biol. Chem., 1989, 108: 1657-1664; Gould et al. EMBO J., 1990, 9: 85-90; Monosov et al., J. Histo. Cytochem., 1996, 44: 581-589]; SV40 T 항원의 핵 국소화 신호(nuclear localization signal, NLS)의 세 카피 (copy) [Kalderon et al., Cell, 1984, 39: 499-509; Lanford et al., Cell, 1986, 46: 575-582]. 네오노토파누스 남비로부터의 루시퍼라제와의 키메라 제작물을 발현하는, 플라스미드와 HeLa Kyoto 세포의 형질주입은 대응하는 세포내 소기관으로의 키메라 단백질의 효율적인 전달을 야기했다. 매질에 3-히드록시히스피딘을 최종 농도 660 μg/ml로 추가하는 것을 수반하는 형질주입 24시간 후에, 생물 발광이 검출되었다.
[
실시예
11. 전체 유기체 내에 있는 세포의 표지]
거대세포 바이러스 프로모터의 제어하에 있는 네오노토파누스 남비로부터의 루시퍼라제의 코딩 서열을 포함하는 벡터를 실시예 3에 기술된 대로 수득했다. 또한, 포티누스 피랄리스 ( Photinus pyralis ) 반딧불이로부터의 루시퍼라제를 암호화하는 인간화된 뉴클레오티드 서열을 합성해서 동일한 벡터로 클로닝했다.
수득된 제작물을 CT26 세포 [생쥐( Mus musculus ) 암종 세포)]의 형질주입에 이용했다. 네오노토파누스 남비로부터의 루시퍼라제를 발현하는 세포를 마우스의 등의 좌측 반부에 피하로 주사한 반면, 포티누스 피랄리스의 루시퍼라제를 발현하는 세포를 동일한 방식으로 마우스의 등의 우측 반부에 주사했다. 주사 10분 후에, 균류 루시페린 (0.5 mg)과 포티누스 피랄리스 반딧불이 루시페린 (0.5 mg)의 혼합물을 복강내로 주사했다. 그런 다음에, 마우스의 생물 발광을 IVIS 스펙트럼 CT (PerkinElmer)를 이용하여 가시화했다. 네오노토파누스 남비로부터의 루시퍼라제를 발현하는 종양은 20000000 cu의 빛 방출의 강도를 보이며, 포티누스 피랄리스로부터의 루시퍼라제를 발현하는 종양은 21000000 cu의 빛 방출의 강도를 보였다 (도 9).
SP6 mMessage mMachine 키트 (미국 소재, Ambion)로부터의 SP6 중합효소를 이용하여, 루시퍼라제 유전자를 포함하는 Acc65I 선형화된 pCS2+ 벡터의 시험관내 전사를 통해 네오노토파누스 남비로부터의 루시퍼라제의 mRNA를 수득했다. mRNA를 CleanRNA Standard 키트 (Evrogen)에 의해 더 정제했고, 2-세포기(two-cell) 아프리카 발톱 개구리 배아의 두 할구 모두에, 할구 당 500 pg의 mRNA를 주사했다. 가시화를 위해, 초기 낭배기(gastrula stage) (단계 10.5)에서 660 μg/ml의 루시페린 용액을 배아의 할구에 주사했다. 신경관형성 (단계 16-17) 동안에, Leica DM6000 현미경을 이용해서, 현미경의 초록색 형광 검출 및 붉은색 형광 검출 채널에서, 5x 대물렌즈로, 로다민(rhodamine) 염색 후의 배아 발광을 검출했다 (도 10). 생물 발광 신호를 배아의 신경 조직에서 검출했다.
[
실시예
12. 다중클론 항체의 제조]
서열번호 19에 나타낸 막 관통 도메인의 결실이 있는, 네오노토파누스 남비로부터의 루시퍼라제의 코딩 서열을 이중-가닥 DNA로서 합성적으로 수득해서, 생성되는 재조합 단백질의 N-말단이 his-태그를 포함하는 방식으로, pQE-30 발현 벡터 (독일 소재, Qiagen)에 클로닝했다. 대장균에서의 발현 후에, 재조합 단백질을 변성 조건하에서 금속-친화도 TALON 수지 (Clontech)로 정제했다. 프로인드 보강제(Freund's adjuvant) 중에 유화된, 정제된 단백질 제제를 4번의 토끼의 면역화(immunization)에 매월 이용했다. 면역화 후 10일째 또는 11일째에서 토끼의 혈액을 채혈했다. 수득된 다중클론 항혈청의 활성을 ELISA와 웨스턴 면역 블로팅법(Western immunoblotting method)을 이용하여 재조합 단백질에 의해 입증했다.
[
실시예
13. 형질전환 식물의 획득]
네오노토파누스 남비로부터의 루시퍼라제의 코딩 서열을 피스코미트렐라 파 텐스(Physcomitrella patens) 이끼 세포 (서열번호 54)에서의 발현을 위해 최적화했다. 그런 다음에, 벼의 aktI 유전자의 프로모터, 인간 거대세포 바이러스의 5'-비번역 영역, 루시퍼라제의 코딩 서열, 종결 코돈, 및 아그로박테리움 투메파키엔스 (Agrobacterium tumefaciens ) osc 유전자로부터의 종결 서열을 포함하는 전사 유닛(transcriptional unit)을 인 실리코(in silico)로 고안했다. 수득된 서열을 합성적으로 생성해서, 깁슨 어셈블리법 [Gibson et al., Nat Methods, 2009, 6: 343-5]을 이용하여 pLand#1 발현 벡터로, 피스코미트렐라 파텐스 이끼의 게놈 DNA의 유전자 자리와 부합하는 DNA 단편 사이 - 고도로 발현되는 이끼 유전자 Pp3c16_6440V3.1과 Pp3c16_6460V3.1의 서열 사이에 있는 - 에 클로닝했다. pLand#1 벡터는 동일한 DNA 유전자 자리 영역에 상보적인, Cas9 핵산 가수분해 효소에 대한 가이드 RNA의 서열(sgRNA)을 또한 포함했다.
[Cove et al., Cold Spring Harb Protoc., 2009, 2]에 기술된 폴리에틸렌 글리콜 형질전환 프로토콜에 따라서, 플라스미드 DNA 제제를 Cas9 핵산 가수분해 효소 서열을 포함하는 발현 벡터와 피스코미트렐라 파텐스 원형질체로 공동 형질전환했다. 그런 다음에, 형질전환체를 50 rpm에서 교반하면서, BCD 배지에서 2일 동안 어둠 속에서 배양시켜 세포벽을 재생시켰다. 그런 다음에, 원형질체를 한천과 BCD 매질을 포함하는 페트리 접시로 옮겨서, 일주일 동안 16시간의 조명(illumination)하에서 성장시켰다. 형질전환된 이끼 콜로니를 외부 게놈 프라이머(external genomic primer)로부터 PCR에 의해 스크리닝해서 게놈으로의 유전적 제작물의 통합을 평가했고, 새로운 페트리 접시로 옮겨서 30일 동안 동일한 조명 조건하에서 성장시켰다.
수득된 이끼 배우체를 농도가 660 μg/ml인 3-히드록시히스피딘을 포함하는 BCD 배치에 침지했고(soaking), IVIS 스펙트럼 인 비보 영상화 시스템 (PerkinElmer)으로 분석했다. 모든 샘플 형질전환 식물은 3-히드록시히스피딘을 포함하는 동일한 용액에서 배양된 야생형 대조 식물의 신호 강도보다 적어도 두 크기 정도(two orders of magnitude)가 큰 강도를 갖는 생물 발광을 보였다.
[
실시예
14. 형질전환 동물의 획득]
[Hisano et al., Sci Rep., 2015, 5:8841]에 기술된 방법에 따라서, 네오노 토파누스 남비로부터의 루시퍼라제의 유전자를 포함하는, 형질전환 어류 [ 다니오 레리오(Danio rerio )]를 고안했다. 형질전환 동물을 고안하기 위해, T7 박테리오파지 중합효소 프로모터의 제어하에 있는, 가이드 RNA와 Cas9 핵산 가수분해 효소의 mRNA의 서열을 포함하는 DNA 단편을 합성했다. MAXIscript T7 키트 (미국 소재, Life Technologies)로부터의 시약을 이용해서, 수득된 단편을 시험관내 전사에 이용했고, 합성된 RNA를 RNA 분리 키트 (러시아 소재, Evrogen)를 이용해서 정제했다. 네오노토파누스 남비로부터의 루시퍼라제의 유전자를 포함하는 공여 벡터 (donor vector) 서열 - 다니오 레리오 유전자인, krtt1c19e로부터의 50개의 뉴클레오티드 서열이 플랭킹(flanking)된 - 또한 합성적으로 수득했다. 공여 벡터, Cas9 핵산 가수분해 효소의 mRNA 및 가이드 RNA를 주사 완충액 (40 mM HEPES, pH 7.4, 240 mM KCl, 0.5% 페놀 레드를 추가함)에 용해시켜서, 약 1-2 nl의 부피로 1-2-세포기 다니오 레리오 배아에 주사했다. 70개의 배아 중 약 50개의 배아가 주사 후에 생존했고, 수정 후 4일째에 정상적인 발달을 보였다.
생물 발광 신호를 기록하기 위해, [Cosentino et al., J Vis Exp. 2010; (42): 2079]에 기술된 절차에 따라서 3-히드록시히스피딘의 용액을 다니오 레리오 유생(larvae)에 정맥으로 주사했다. IVIS 스펙트럼 인 비보 영상화 시스템 (PerkinElmer)을 이용해 생물 발광을 기록했다. 측정 후에, 게놈 DNA를 유생으로부터 분리해서 게놈으로의 루시퍼라제 유전자의 통합을 확인했다. 네오노토파누스 남비로부터의 루시퍼라제의 유전자의 게놈 통합이 올바르게 된 모든 유생은 3-히드록시히스피딘 용액의 주사 후의 야생형 어류로부터의 신호의 강도보다 적어도 한 크기 정도(an order of magnitude)가 큰 강도를 갖는 생물 발광을 보였다.
각각의 개별적인 간행물 또는 특허 출원이 구체적이고 개별적으로 본원에 참고로 포함된다는 것을 나타내는 경우와 마찬가지로, 모든 간행물 및 특허 출원이 본원에 참고로 포함된다. 각 간행물의 인용이 예시로서 제공되고, 본 발명의 이해에 있어서 유용할 수 있다. 명확하게 또는 내재적으로 참고된 임의의 간행물이 선행 기술이라는 것을 인정하는 것은 아니다.
SEQUENCE LISTING
<110> OBSCHESTVO S OGRANICHENNOY OTVETSTVENNOSTYU "PLANTA"
<120> NOVEL LUCIFERASES AND METHODS FOR USING SAME
<130> 000002747
<150> RU 2017102986
<151> 2017-01-30
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 801
<212> DNA
<213> Neonothopanus nambi
<400> 1
atgcgcatta acattagcct ctcgtctctc ttcgaacgtc tctccaaact tagcagtcgc 60
agcatagcga ttacatgtgg agttgttctc gcctccgcaa tcgcctttcc catcatccgc 120
agagactacc agactttcct agaagtggga ccctcgtacg ctccgcagaa ctttagagga 180
tacatcatcg tctgtgtcct ctcgctattc cgccaagagc agaaagggct cgccatctat 240
gatcgtcttc ccgagaaacg caggtggttg gccgaccttc cctttcgtga aggaaccaga 300
cccagcatta ccagccatat cattcagcga cagcgcactc aactggtcga tcaggagttt 360
gccaccaggg agctcataga caaggtcatc cctcgcgtgc aagcacgaca caccgacaaa 420
acgttcctca gcacatcaaa gttcgagttt catgcgaagg ccatatttct cttgccttct 480
atcccaatca acgaccctct gaatatccct agccacgaca ctgtccgccg aacgaagcgc 540
gagattgcac atatgcatga ttatcatgat tgcacacttc atcttgctct cgctgcgcag 600
gatggaaagg aggtgctgaa gaaaggttgg ggacaacgac atcctttggc tggtcctgga 660
gttcctggtc caccaacgga atggactttt ctttatgcgc ctcgcaacga agaagaggct 720
cgagtagtgg agatgatcgt tgaggcttcc atagggtata tgacgaacga tcctgcagga 780
aagattgtag aaaacgccaa g 801
<210> 2
<211> 267
<212> PRT
<213> Neonothopanus nambi
<400> 2
Met Arg Ile Asn Ile Ser Leu Ser Ser Leu Phe Glu Arg Leu Ser Lys
1 5 10 15
Leu Ser Ser Arg Ser Ile Ala Ile Thr Cys Gly Val Val Leu Ala Ser
20 25 30
Ala Ile Ala Phe Pro Ile Ile Arg Arg Asp Tyr Gln Thr Phe Leu Glu
35 40 45
Val Gly Pro Ser Tyr Ala Pro Gln Asn Phe Arg Gly Tyr Ile Ile Val
50 55 60
Cys Val Leu Ser Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr
65 70 75 80
Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Ala Asp Leu Pro Phe Arg
85 90 95
Glu Gly Thr Arg Pro Ser Ile Thr Ser His Ile Ile Gln Arg Gln Arg
100 105 110
Thr Gln Leu Val Asp Gln Glu Phe Ala Thr Arg Glu Leu Ile Asp Lys
115 120 125
Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Lys Thr Phe Leu Ser
130 135 140
Thr Ser Lys Phe Glu Phe His Ala Lys Ala Ile Phe Leu Leu Pro Ser
145 150 155 160
Ile Pro Ile Asn Asp Pro Leu Asn Ile Pro Ser His Asp Thr Val Arg
165 170 175
Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp Cys Thr
180 185 190
Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Leu Lys Lys
195 200 205
Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro
210 215 220
Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Asn Glu Glu Glu Ala
225 230 235 240
Arg Val Val Glu Met Ile Val Glu Ala Ser Ile Gly Tyr Met Thr Asn
245 250 255
Asp Pro Ala Gly Lys Ile Val Glu Asn Ala Lys
260 265
<210> 3
<211> 798
<212> DNA
<213> Armillaria gallica
<400> 3
atgtccttca tcgacagcat gaaacttgac ctcgtcggac acctctttgg catcaggaat 60
cgcggcttag ccgccgcttg ttgtgctcta gcagtcgcct ctactatcgc cttcccttac 120
attcgtaggg actaccagac atttttatct ggcggtccct cttacgctcc ccagaatatc 180
agaggatatt tcatcgtctg cgttctggcc ttgttccgtc aggagcaaaa gggccttgcg 240
atatatgatc gccttcccga gaagcgcagg tggctgcctg acttgcctcc tcgcaatggc 300
ccgcggccga tcacgaccag ccatataatc caaagacagc gcaaccaggc gccggacccc 360
aagttcgccc tcgaggaact caaggccacg gttattccac gggtgcaggc tcgccatact 420
gacctcaccc atctcagcct atccaaattc gagttccatg ctgaagcaat tttcctgctc 480
ccctctgtac ccatcgatga tccaaaaaat gttccaagtc acgacacggt gcgcaggacg 540
aaaagggaga tcgcgcatat gcacgactac catgacttca cgctgcatct tgcactggcc 600
gcccaagacg ggaaggaagt cgtgtcgaag ggatgggggc agcgacaccc cctagcaggc 660
cctggcgttc ctggtccacc tacggagtgg acatttattt atgcgccacg taacgaagag 720
gaactggcag tggtggaaat gattatcgag gcatcaatag gctatatgac caatgaccct 780
gctggagtag ttatcgca 798
<210> 4
<211> 266
<212> PRT
<213> Armillaria gallica
<400> 4
Met Ser Phe Ile Asp Ser Met Lys Leu Asp Leu Val Gly His Leu Phe
1 5 10 15
Gly Ile Arg Asn Arg Gly Leu Ala Ala Ala Cys Cys Ala Leu Ala Val
20 25 30
Ala Ser Thr Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe
35 40 45
Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Arg Gly Tyr Phe
50 55 60
Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala
65 70 75 80
Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro
85 90 95
Pro Arg Asn Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg
100 105 110
Gln Arg Asn Gln Ala Pro Asp Pro Lys Phe Ala Leu Glu Glu Leu Lys
115 120 125
Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His
130 135 140
Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu
145 150 155 160
Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr
165 170 175
Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp
180 185 190
Phe Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val
195 200 205
Ser Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro
210 215 220
Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu
225 230 235 240
Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met
245 250 255
Thr Asn Asp Pro Ala Gly Val Val Ile Ala
260 265
<210> 5
<211> 801
<212> DNA
<213> Armillaria mellea
<400> 5
atgtccttct tcgacagcgt gaaacttgac ctcgtcggac gcctctttgg catcaggaat 60
cgcggcttag ctgttacttg ttgtgctgtg gcagtcgcct ctatcatcgc gttcccttac 120
attcgtaggg actaccagac atttttatct gggggtccct cctacgctcc ccagaacatc 180
agaggatacc tcattgtctg cgtcctggcc ttgttccgtc aggagcaaaa aggccttgcg 240
atatacgacc gccttcccga gaagcgcagg tggctacctg acttgcctcc tcgcgatggc 300
ccacggccca tcacgaccag ccatataatc caaagacagc gcaaccaggc gccggacctc 360
aagttcgccc tcgaggaact caaggccacg gtcattccac gggtgcaggc tcgccacact 420
gacctcaccc atctcagcct atccaagttc gagttccatg ctgaagcaat cttcctgctc 480
ccctctgtac ccatcgatga tccaaagaat gtgccaagtc acgacacggt gcgcaggacg 540
aagagggaaa ttgcgcatat gcacgactac catgactaca cgctgcatct tgcgttggcc 600
gcccaagacg ggaaggaagt cgtatcaaag ggatgggggc agcgacaccc gctggcaggc 660
cctggcgttc ctggtccacc gacggagtgg acgtttattt atgcgccacg taacgaagag 720
gagctggcag tggtggaaat gattatcgag gcatcgatag gctatatgac caatgaccct 780
gcaggaaaaa ctatcgcata g 801
<210> 6
<211> 266
<212> PRT
<213> Armillaria mellea
<400> 6
Met Ser Phe Phe Asp Ser Val Lys Leu Asp Leu Val Gly Arg Leu Phe
1 5 10 15
Gly Ile Arg Asn Arg Gly Leu Ala Val Thr Cys Cys Ala Val Ala Val
20 25 30
Ala Ser Ile Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe
35 40 45
Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Arg Gly Tyr Leu
50 55 60
Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala
65 70 75 80
Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro
85 90 95
Pro Arg Asp Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg
100 105 110
Gln Arg Asn Gln Ala Pro Asp Leu Lys Phe Ala Leu Glu Glu Leu Lys
115 120 125
Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His
130 135 140
Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu
145 150 155 160
Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr
165 170 175
Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp
180 185 190
Tyr Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val
195 200 205
Ser Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro
210 215 220
Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu
225 230 235 240
Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met
245 250 255
Thr Asn Asp Pro Ala Gly Lys Thr Ile Ala
260 265
<210> 7
<211> 801
<212> DNA
<213> Armillaria ostoyae
<400> 7
atgtccttca tcgacagcat gaaacttgac ttcgtcggac acctctttgg catcaggaat 60
cgcggcttag ccaccgcttg ttgtgctgtg gcagtcgctt ctgccatcgc cttcccttac 120
attcgtaggg actaccagac attcttatct ggcggtccct cttacgctcc ccagaacatc 180
aaaggatatc tcatcgtctg cgtcctggcc ttgttccgtc aggagcaaaa gggccttgcg 240
atatatgacc gccttcccga gaagcgcagg tggctacctg acttgcctcc tcgcaatggc 300
ccgcggccca tcacgaccag ccatataatc caaagacagc gcaaccaggc gccagactcc 360
aagttcgccc tcgaggaact caaggctacg gtcattccac gggtgcaggc tcgccacact 420
gacctcaccc atctcagcct atccaagttc gagttccatg ctgaagcaat cttcctgctc 480
ccctctgtac ccatcgatga tccaaaaaat gttccaagtc atgacacggt gcgcaggacg 540
aagagggaga tcgcgcatat gcacgactac catgacttta cgttgcatct tgcactggcc 600
gcccaagacg ggaaggaagt cgtggcgaag ggatgggggc agcgacaccc gctggcaggc 660
cctggcgttc ctggtccacc tacggagtgg acgtttattt atgcgccacg taacgaagag 720
gaactggcag tggtggaaat gattatcgag gcatcaatag gctatatgac caatgaccct 780
gctggaacag ttatcgtata g 801
<210> 8
<211> 266
<212> PRT
<213> Armillaria ostoyae
<400> 8
Met Ser Phe Ile Asp Ser Met Lys Leu Asp Phe Val Gly His Leu Phe
1 5 10 15
Gly Ile Arg Asn Arg Gly Leu Ala Thr Ala Cys Cys Ala Val Ala Val
20 25 30
Ala Ser Ala Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe
35 40 45
Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Lys Gly Tyr Leu
50 55 60
Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala
65 70 75 80
Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro
85 90 95
Pro Arg Asn Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg
100 105 110
Gln Arg Asn Gln Ala Pro Asp Ser Lys Phe Ala Leu Glu Glu Leu Lys
115 120 125
Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His
130 135 140
Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu
145 150 155 160
Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr
165 170 175
Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp
180 185 190
Phe Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val
195 200 205
Ala Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro
210 215 220
Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu
225 230 235 240
Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met
245 250 255
Thr Asn Asp Pro Ala Gly Thr Val Ile Val
260 265
<210> 9
<211> 753
<212> DNA
<213> Mycena chlorophos
<400> 9
atggtccaac tcacccgaac ctccggattc atcgccgctg cggccattgt tgctgccatc 60
gccttcccgt tcattcgtcg agactaccag acgttccttc gtggtgggcc gtcctatgcc 120
ccacagaaca tccgcggcta tatcatcgtc ctggttctgt ccctcttccg cggcgaggag 180
aagggtcttg caatctacga gccccttcct gagaagcgca catggctgcc ggagcttccg 240
cggcgcgcgg gagaccggcc caagacgacg agccacatca tccaacggca gctcgaccag 300
taccccgacc cggactttgt cctcaaagcc ctgaaagcga cggtcatccc gcgtgtccaa 360
gcccggcaca cagacaagac tcacctcgcg ctgtccaagt tcgagttcca tgctgaggcc 420
atcttcgtgc gcccggaaat cgccatcgac gacccgaagc atatccccag ccacgacacg 480
gtgcgacgga cgaagcgcga gattgcgcac atgcacgact atcacgactg cacgctgcat 540
ttggcgctag cggcgcagga cgcgaagcag gtgctgcaga agggctgggg ccagcgccat 600
ccgctggcag ggcctgggat gcccgggccg cccacggagt ggacgttctt gtatgccccg 660
aggaccgagg aggaagtgaa ggttgtggag accattgtcg aggcctctat cgcgtacatg 720
acgaacgcgg agaagccggt cgagctggtg cag 753
<210> 10
<211> 251
<212> PRT
<213> Mycena chlorophos
<400> 10
Met Val Gln Leu Thr Arg Thr Ser Gly Phe Ile Ala Ala Ala Ala Ile
1 5 10 15
Val Ala Ala Ile Ala Phe Pro Phe Ile Arg Arg Asp Tyr Gln Thr Phe
20 25 30
Leu Arg Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Arg Gly Tyr Ile
35 40 45
Ile Val Leu Val Leu Ser Leu Phe Arg Gly Glu Glu Lys Gly Leu Ala
50 55 60
Ile Tyr Glu Pro Leu Pro Glu Lys Arg Thr Trp Leu Pro Glu Leu Pro
65 70 75 80
Arg Arg Ala Gly Asp Arg Pro Lys Thr Thr Ser His Ile Ile Gln Arg
85 90 95
Gln Leu Asp Gln Tyr Pro Asp Pro Asp Phe Val Leu Lys Ala Leu Lys
100 105 110
Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Lys Thr His
115 120 125
Leu Ala Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Val Arg
130 135 140
Pro Glu Ile Ala Ile Asp Asp Pro Lys His Ile Pro Ser His Asp Thr
145 150 155 160
Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp
165 170 175
Cys Thr Leu His Leu Ala Leu Ala Ala Gln Asp Ala Lys Gln Val Leu
180 185 190
Gln Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Met Pro
195 200 205
Gly Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Thr Glu Glu
210 215 220
Glu Val Lys Val Val Glu Thr Ile Val Glu Ala Ser Ile Ala Tyr Met
225 230 235 240
Thr Asn Ala Glu Lys Pro Val Glu Leu Val Gln
245 250
<210> 11
<211> 738
<212> DNA
<213> Mycena citricolor
<400> 11
atggcttatc agctcacttg gattcagact ctcgtgctgg gtgcccttgt ggcaatggca 60
gtagcgttcc ccttcatcaa gaaagactac gagacgttcc tgaagggcgg cccctcctat 120
gcgccccaaa acgttcgcgg atacatcatc gtgctcgtgc tcgcgctctt ccgccaagag 180
cagctcgggc tggagatcta cgaccgcatg cccgagaaac gtcgctggct cgcgaatctc 240
cctcagcgcg agggcccccg ccccaagacc acaagtcaca tcatccagcg gcagctcagc 300
cagcacacgg accccgcatt cggcgccgcg tacctcaaag acaccgtcat tccgcgcgtc 360
caggcgcggc acgcagccaa cacgcacatc gcgcgctcga cgttcgagtt ccacgccgcc 420
gcgatcttcc tgaacgcgga cgtgccgctg cccgagggcc tgcccgcaag cgagacggtg 480
cggcggacca agggcgagat cgcgcacatg cacgactacc acgacttcac gctgcacctc 540
gcgctcgcag cagcggatgg gaaggaggtg gtcggcaagg gctgggggca gcgccatccg 600
ctggcgggac ccggcgtgcc gggtccgccg aacgagtgga cctttgtgta tgcgccgagg 660
aatgaagagg agatgggcgt ggtcgagcag atcgtagagg cggcgattgg gtacatgtcg 720
aacgtgcctg cgctggaa 738
<210> 12
<211> 246
<212> PRT
<213> Mycena citricolor
<400> 12
Met Ala Tyr Gln Leu Thr Trp Ile Gln Thr Leu Val Leu Gly Ala Leu
1 5 10 15
Val Ala Met Ala Val Ala Phe Pro Phe Ile Lys Lys Asp Tyr Glu Thr
20 25 30
Phe Leu Lys Gly Gly Pro Ser Tyr Ala Pro Gln Asn Val Arg Gly Tyr
35 40 45
Ile Ile Val Leu Val Leu Ala Leu Phe Arg Gln Glu Gln Leu Gly Leu
50 55 60
Glu Ile Tyr Asp Arg Met Pro Glu Lys Arg Arg Trp Leu Ala Asn Leu
65 70 75 80
Pro Gln Arg Glu Gly Pro Arg Pro Lys Thr Thr Ser His Ile Ile Gln
85 90 95
Arg Gln Leu Ser Gln His Thr Asp Pro Ala Phe Gly Ala Ala Tyr Leu
100 105 110
Lys Asp Thr Val Ile Pro Arg Val Gln Ala Arg His Ala Ala Asn Thr
115 120 125
His Ile Ala Arg Ser Thr Phe Glu Phe His Ala Ala Ala Ile Phe Leu
130 135 140
Asn Ala Asp Val Pro Leu Pro Glu Gly Leu Pro Ala Ser Glu Thr Val
145 150 155 160
Arg Arg Thr Lys Gly Glu Ile Ala His Met His Asp Tyr His Asp Phe
165 170 175
Thr Leu His Leu Ala Leu Ala Ala Ala Asp Gly Lys Glu Val Val Gly
180 185 190
Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro Gly
195 200 205
Pro Pro Asn Glu Trp Thr Phe Val Tyr Ala Pro Arg Asn Glu Glu Glu
210 215 220
Met Gly Val Val Glu Gln Ile Val Glu Ala Ala Ile Gly Tyr Met Ser
225 230 235 240
Asn Val Pro Ala Leu Glu
245
<210> 13
<211> 786
<212> DNA
<213> Omphalotus olearius
<400> 13
atgctcccag ctttcatcta caaaccaagg ctagtgatca cttgtgtatt cgttctggcc 60
tccgcactcg catttccctt catacgcaaa gattaccaga ctttcctgga ggtgggaccc 120
tcgtacgccc cgcagaacct ccaaggatac atcatcgtct gtgtactctc tctgttccgg 180
caagaacaga aagacgtagc gatttatgat cgccttcctg agaaaaggag gtggttagga 240
gacctcccgt ttcgcgaggg gccaagaccg agtatcacta gccatatcat ccagcgacag 300
cgcacccaat tggctgacgc cgagttcgct accaaagagc tgataggcaa aatcatccct 360
cgcgtccaag cccgacacac caacacaaca ttcctcagca catctaaatt cgaattccac 420
gcccaggcca tcttcctttt gccctctatc ccaatcaacg accctcaaaa cattccaagc 480
cacgataccg ttcgtcgcac gaaacgcgag atcgcgcata tgcatgatta tcacgactgt 540
acgttgcatc tcgcacttgc tgctcaagat gggaaggagg ttttagagaa aggatggggt 600
cagcgacatc ctcttgctgg acctggtgtt cctggcccgc cgacggagtg gacgtttctt 660
tatgcaccgc gcagcgaaga ggaggttcgg gttgtggaga tgattgttga ggcatcagtt 720
gtgtatatga cgaatgatcc tgcggataaa atcgtagaag ctactgtgca gggtactgaa 780
gaatag 786
<210> 14
<211> 261
<212> PRT
<213> Omphalotus olearius
<400> 14
Met Leu Pro Ala Phe Ile Tyr Lys Pro Arg Leu Val Ile Thr Cys Val
1 5 10 15
Phe Val Leu Ala Ser Ala Leu Ala Phe Pro Phe Ile Arg Lys Asp Tyr
20 25 30
Gln Thr Phe Leu Glu Val Gly Pro Ser Tyr Ala Pro Gln Asn Leu Gln
35 40 45
Gly Tyr Ile Ile Val Cys Val Leu Ser Leu Phe Arg Gln Glu Gln Lys
50 55 60
Asp Val Ala Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Gly
65 70 75 80
Asp Leu Pro Phe Arg Glu Gly Pro Arg Pro Ser Ile Thr Ser His Ile
85 90 95
Ile Gln Arg Gln Arg Thr Gln Leu Ala Asp Ala Glu Phe Ala Thr Lys
100 105 110
Glu Leu Ile Gly Lys Ile Ile Pro Arg Val Gln Ala Arg His Thr Asn
115 120 125
Thr Thr Phe Leu Ser Thr Ser Lys Phe Glu Phe His Ala Gln Ala Ile
130 135 140
Phe Leu Leu Pro Ser Ile Pro Ile Asn Asp Pro Gln Asn Ile Pro Ser
145 150 155 160
His Asp Thr Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp
165 170 175
Tyr His Asp Cys Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys
180 185 190
Glu Val Leu Glu Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro
195 200 205
Gly Val Pro Gly Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg
210 215 220
Ser Glu Glu Glu Val Arg Val Val Glu Met Ile Val Glu Ala Ser Val
225 230 235 240
Val Tyr Met Thr Asn Asp Pro Ala Asp Lys Ile Val Glu Ala Thr Val
245 250 255
Gln Gly Thr Glu Glu
260
<210> 15
<211> 747
<212> DNA
<213> Panellus stipticus
<400> 15
atgaacatca acctgaaagc tctgatcgga gtctgtgccg tgctcatcac cgctgcagtg 60
ttccccttcg ttcgtaaaga ctatcacacc tttcttgaag gtggaccatc ctacgcgccg 120
cagaatttgc aaggctatat catcgtgttg gtgctctcac tctttcgagg ggaggagacg 180
ggattggaaa tatacgaccg cttgcccgaa aaacgccgct ggctcgagga gctgcctgtt 240
cgcgaaggcc cgcgcccaaa gacaaccagc cacatcattc agagacagtt gaatcagcac 300
gttgacccgg acttcggaat gaactctttg aaaggctccg tcatccggcg ccttcaatcc 360
cgccaccagg acataactca actcgcactc tcgaaattcg aattccacgc cgaggccata 420
tttctgcgcc ccgatgtcgc gatcaacgat cccaaacacg tcccgagcca cgacacggtg 480
cgccgcacaa agcgcgagat agctcacatg cacgactacc atgattacac gtgtcatttg 540
gcgctcgcag cgcaggatgg gaagcaagtg attgcaaaag ggtggggcca gagacatccg 600
ctcgccggac cgggcatgcc ggggccgccg acggagtgga catttttgta tgcgccgagg 660
aatgaggcgg aggttcaagt gttggagacg attatcgaag cgtcaatcgg gtacatgtcg 720
aacgcaccag ccttgggtgg gagcgag 747
<210> 16
<211> 249
<212> PRT
<213> Panellus stipticus
<400> 16
Met Asn Ile Asn Leu Lys Ala Leu Ile Gly Val Cys Ala Val Leu Ile
1 5 10 15
Thr Ala Ala Val Phe Pro Phe Val Arg Lys Asp Tyr His Thr Phe Leu
20 25 30
Glu Gly Gly Pro Ser Tyr Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile
35 40 45
Val Leu Val Leu Ser Leu Phe Arg Gly Glu Glu Thr Gly Leu Glu Ile
50 55 60
Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Glu Glu Leu Pro Val
65 70 75 80
Arg Glu Gly Pro Arg Pro Lys Thr Thr Ser His Ile Ile Gln Arg Gln
85 90 95
Leu Asn Gln His Val Asp Pro Asp Phe Gly Met Asn Ser Leu Lys Gly
100 105 110
Ser Val Ile Arg Arg Leu Gln Ser Arg His Gln Asp Ile Thr Gln Leu
115 120 125
Ala Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Arg Pro
130 135 140
Asp Val Ala Ile Asn Asp Pro Lys His Val Pro Ser His Asp Thr Val
145 150 155 160
Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp Tyr
165 170 175
Thr Cys His Leu Ala Leu Ala Ala Gln Asp Gly Lys Gln Val Ile Ala
180 185 190
Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Met Pro Gly
195 200 205
Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Asn Glu Ala Glu
210 215 220
Val Gln Val Leu Glu Thr Ile Ile Glu Ala Ser Ile Gly Tyr Met Ser
225 230 235 240
Asn Ala Pro Ala Leu Gly Gly Ser Glu
245
<210> 17
<211> 747
<212> DNA
<213> Panellus stipticus
<400> 17
atgaacatca acctgaaagc tctgatcgga gtctgtgccg tgctcatcac cgctgcagtg 60
ttccccttcg ttcgtaaaga ctatcacacc tttcttgaag gtggaccatc ctacgcgccg 120
cagaatttgc aaggctatat catcgtgttg gtgctctcac tctttcgagg ggaggagacg 180
ggattggaaa tatacgaccg cttgcccgaa aaacgccgct ggctcgagga gctgcctgtt 240
cgcgaaggcc cgcgcccaaa gacaaccagc cacatcattc agagacagtt gaatcagcac 300
gttgacccgg acttcggaat gaactctttg aaaggctccg tcatccggcg ccttcaatcc 360
cgccaccagg acataactca actcgcactc tcgaaattcg aattccacgc cgaggccata 420
tttctgcgcc ccgatatcgc gatcaacgat cccaaacacg tcccgagcca cgacacggtg 480
cgccgcacaa agcgcgagat agctcacatg cacgactacc atgattacac gtgtcatttg 540
gcgctcgcag cgcaggatgg gaagcaagtg attgcaaaag ggtggggcca gagacatccg 600
ctcgccggac cgggcatgcc ggggccgccg acggagtgga catttttgta tgcgccgagg 660
aatgaggcgg aggttcaagt gttggagacg attatcgaag cgtcaatcgg gtacatgtcg 720
aacgcaccag ccttgggtgg gagcgag 747
<210> 18
<211> 249
<212> PRT
<213> Panellus stipticus
<400> 18
Met Asn Ile Asn Leu Lys Ala Leu Ile Gly Val Cys Ala Val Leu Ile
1 5 10 15
Thr Ala Ala Val Phe Pro Phe Val Arg Lys Asp Tyr His Thr Phe Leu
20 25 30
Glu Gly Gly Pro Ser Tyr Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile
35 40 45
Val Leu Val Leu Ser Leu Phe Arg Gly Glu Glu Thr Gly Leu Glu Ile
50 55 60
Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Glu Glu Leu Pro Val
65 70 75 80
Arg Glu Gly Pro Arg Pro Lys Thr Thr Ser His Ile Ile Gln Arg Gln
85 90 95
Leu Asn Gln His Val Asp Pro Asp Phe Gly Met Asn Ser Leu Lys Gly
100 105 110
Ser Val Ile Arg Arg Leu Gln Ser Arg His Gln Asp Ile Thr Gln Leu
115 120 125
Ala Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Arg Pro
130 135 140
Asp Ile Ala Ile Asn Asp Pro Lys His Val Pro Ser His Asp Thr Val
145 150 155 160
Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp Tyr
165 170 175
Thr Cys His Leu Ala Leu Ala Ala Gln Asp Gly Lys Gln Val Ile Ala
180 185 190
Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Met Pro Gly
195 200 205
Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Asn Glu Ala Glu
210 215 220
Val Gln Val Leu Glu Thr Ile Ile Glu Ala Ser Ile Gly Tyr Met Ser
225 230 235 240
Asn Ala Pro Ala Leu Gly Gly Ser Glu
245
<210> 19
<211> 690
<212> DNA
<213> artificial sequence
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Neonothopanus nambi
<400> 19
atcatccgca gagactacca gactttccta gaagtgggac cctcgtacgc tccgcagaac 60
tttagaggat acatcatcgt ctgtgtcctc tcgctattcc gccaagagca gaaagggctc 120
gccatctatg atcgtcttcc cgagaaacgc aggtggttgg ccgaccttcc ctttcgtgaa 180
ggaaccagac ccagcattac cagccatatc attcagcgac agcgcactca actggtcgat 240
caggagtttg ccaccaggga gctcatagac aaggtcatcc ctcgcgtgca agcacgacac 300
accgacaaaa cgttcctcag cacatcaaag ttcgagtttc atgcgaaggc catatttctc 360
ttgccttcta tcccaatcaa cgaccctctg aatatcccta gccacgacac tgtccgccga 420
acgaagcgcg agattgcaca tatgcatgat tatcatgatt gcacacttca tcttgctctc 480
gctgcgcagg atggaaagga ggtgctgaag aaaggttggg gacaacgaca tcctttggct 540
ggtcctggag ttcctggtcc accaacggaa tggacttttc tttatgcgcc tcgcaacgaa 600
gaagaggctc gagtagtgga gatgatcgtt gaggcttcca tagggtatat gacgaacgat 660
cctgcaggaa agattgtaga aaacgccaag 690
<210> 20
<211> 230
<212> PRT
<213> artificial sequence
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Neonothopanus nambi
<400> 20
Ile Ile Arg Arg Asp Tyr Gln Thr Phe Leu Glu Val Gly Pro Ser Tyr
1 5 10 15
Ala Pro Gln Asn Phe Arg Gly Tyr Ile Ile Val Cys Val Leu Ser Leu
20 25 30
Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr Asp Arg Leu Pro Glu
35 40 45
Lys Arg Arg Trp Leu Ala Asp Leu Pro Phe Arg Glu Gly Thr Arg Pro
50 55 60
Ser Ile Thr Ser His Ile Ile Gln Arg Gln Arg Thr Gln Leu Val Asp
65 70 75 80
Gln Glu Phe Ala Thr Arg Glu Leu Ile Asp Lys Val Ile Pro Arg Val
85 90 95
Gln Ala Arg His Thr Asp Lys Thr Phe Leu Ser Thr Ser Lys Phe Glu
100 105 110
Phe His Ala Lys Ala Ile Phe Leu Leu Pro Ser Ile Pro Ile Asn Asp
115 120 125
Pro Leu Asn Ile Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu
130 135 140
Ile Ala His Met His Asp Tyr His Asp Cys Thr Leu His Leu Ala Leu
145 150 155 160
Ala Ala Gln Asp Gly Lys Glu Val Leu Lys Lys Gly Trp Gly Gln Arg
165 170 175
His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr
180 185 190
Phe Leu Tyr Ala Pro Arg Asn Glu Glu Glu Ala Arg Val Val Glu Met
195 200 205
Ile Val Glu Ala Ser Ile Gly Tyr Met Thr Asn Asp Pro Ala Gly Lys
210 215 220
Ile Val Glu Asn Ala Lys
225 230
<210> 21
<211> 681
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Armillaria gallica
<400> 21
tacattcgta gggactacca gacattttta tctggcggtc cctcttacgc tccccagaat 60
atcagaggat atttcatcgt ctgcgttctg gccttgttcc gtcaggagca aaagggcctt 120
gcgatatatg atcgccttcc cgagaagcgc aggtggctgc ctgacttgcc tcctcgcaat 180
ggcccgcggc cgatcacgac cagccatata atccaaagac agcgcaacca ggcgccggac 240
cccaagttcg ccctcgagga actcaaggcc acggttattc cacgggtgca ggctcgccat 300
actgacctca cccatctcag cctatccaaa ttcgagttcc atgctgaagc aattttcctg 360
ctcccctctg tacccatcga tgatccaaaa aatgttccaa gtcacgacac ggtgcgcagg 420
acgaaaaggg agatcgcgca tatgcacgac taccatgact tcacgctgca tcttgcactg 480
gccgcccaag acgggaagga agtcgtgtcg aagggatggg ggcagcgaca ccccctagca 540
ggccctggcg ttcctggtcc acctacggag tggacattta tttatgcgcc acgtaacgaa 600
gaggaactgg cagtggtgga aatgattatc gaggcatcaa taggctatat gaccaatgac 660
cctgctggag tagttatcgc a 681
<210> 22
<211> 227
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Armillaria gallica
<400> 22
Tyr Ile Arg Arg Asp Tyr Gln Thr Phe Leu Ser Gly Gly Pro Ser Tyr
1 5 10 15
Ala Pro Gln Asn Ile Arg Gly Tyr Phe Ile Val Cys Val Leu Ala Leu
20 25 30
Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr Asp Arg Leu Pro Glu
35 40 45
Lys Arg Arg Trp Leu Pro Asp Leu Pro Pro Arg Asn Gly Pro Arg Pro
50 55 60
Ile Thr Thr Ser His Ile Ile Gln Arg Gln Arg Asn Gln Ala Pro Asp
65 70 75 80
Pro Lys Phe Ala Leu Glu Glu Leu Lys Ala Thr Val Ile Pro Arg Val
85 90 95
Gln Ala Arg His Thr Asp Leu Thr His Leu Ser Leu Ser Lys Phe Glu
100 105 110
Phe His Ala Glu Ala Ile Phe Leu Leu Pro Ser Val Pro Ile Asp Asp
115 120 125
Pro Lys Asn Val Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu
130 135 140
Ile Ala His Met His Asp Tyr His Asp Phe Thr Leu His Leu Ala Leu
145 150 155 160
Ala Ala Gln Asp Gly Lys Glu Val Val Ser Lys Gly Trp Gly Gln Arg
165 170 175
His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr
180 185 190
Phe Ile Tyr Ala Pro Arg Asn Glu Glu Glu Leu Ala Val Val Glu Met
195 200 205
Ile Ile Glu Ala Ser Ile Gly Tyr Met Thr Asn Asp Pro Ala Gly Val
210 215 220
Val Ile Ala
225
<210> 23
<211> 681
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Armillaria mellea
<400> 23
tacattcgta gggactacca gacattttta tctgggggtc cctcctacgc tccccagaac 60
atcagaggat acctcattgt ctgcgtcctg gccttgttcc gtcaggagca aaaaggcctt 120
gcgatatacg accgccttcc cgagaagcgc aggtggctac ctgacttgcc tcctcgcgat 180
ggcccacggc ccatcacgac cagccatata atccaaagac agcgcaacca ggcgccggac 240
ctcaagttcg ccctcgagga actcaaggcc acggtcattc cacgggtgca ggctcgccac 300
actgacctca cccatctcag cctatccaag ttcgagttcc atgctgaagc aatcttcctg 360
ctcccctctg tacccatcga tgatccaaag aatgtgccaa gtcacgacac ggtgcgcagg 420
acgaagaggg aaattgcgca tatgcacgac taccatgact acacgctgca tcttgcgttg 480
gccgcccaag acgggaagga agtcgtatca aagggatggg ggcagcgaca cccgctggca 540
ggccctggcg ttcctggtcc accgacggag tggacgttta tttatgcgcc acgtaacgaa 600
gaggagctgg cagtggtgga aatgattatc gaggcatcga taggctatat gaccaatgac 660
cctgcaggaa aaactatcgc a 681
<210> 24
<211> 227
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Armillaria mellea
<400> 24
Tyr Ile Arg Arg Asp Tyr Gln Thr Phe Leu Ser Gly Gly Pro Ser Tyr
1 5 10 15
Ala Pro Gln Asn Ile Arg Gly Tyr Leu Ile Val Cys Val Leu Ala Leu
20 25 30
Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr Asp Arg Leu Pro Glu
35 40 45
Lys Arg Arg Trp Leu Pro Asp Leu Pro Pro Arg Asp Gly Pro Arg Pro
50 55 60
Ile Thr Thr Ser His Ile Ile Gln Arg Gln Arg Asn Gln Ala Pro Asp
65 70 75 80
Leu Lys Phe Ala Leu Glu Glu Leu Lys Ala Thr Val Ile Pro Arg Val
85 90 95
Gln Ala Arg His Thr Asp Leu Thr His Leu Ser Leu Ser Lys Phe Glu
100 105 110
Phe His Ala Glu Ala Ile Phe Leu Leu Pro Ser Val Pro Ile Asp Asp
115 120 125
Pro Lys Asn Val Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu
130 135 140
Ile Ala His Met His Asp Tyr His Asp Tyr Thr Leu His Leu Ala Leu
145 150 155 160
Ala Ala Gln Asp Gly Lys Glu Val Val Ser Lys Gly Trp Gly Gln Arg
165 170 175
His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr
180 185 190
Phe Ile Tyr Ala Pro Arg Asn Glu Glu Glu Leu Ala Val Val Glu Met
195 200 205
Ile Ile Glu Ala Ser Ile Gly Tyr Met Thr Asn Asp Pro Ala Gly Lys
210 215 220
Thr Ile Ala
225
<210> 25
<211> 798
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Armillaria ostoyae
<400> 25
atgtccttca tcgacagcat gaaacttgac ttcgtcggac acctctttgg catcaggaat 60
cgcggcttag ccaccgcttg ttgtgctgtg gcagtcgctt ctgccatcgc cttcccttac 120
attcgtaggg actaccagac attcttatct ggcggtccct cttacgctcc ccagaacatc 180
aaaggatatc tcatcgtctg cgtcctggcc ttgttccgtc aggagcaaaa gggccttgcg 240
atatatgacc gccttcccga gaagcgcagg tggctacctg acttgcctcc tcgcaatggc 300
ccgcggccca tcacgaccag ccatataatc caaagacagc gcaaccaggc gccagactcc 360
aagttcgccc tcgaggaact caaggctacg gtcattccac gggtgcaggc tcgccacact 420
gacctcaccc atctcagcct atccaagttc gagttccatg ctgaagcaat cttcctgctc 480
ccctctgtac ccatcgatga tccaaaaaat gttccaagtc atgacacggt gcgcaggacg 540
aagagggaga tcgcgcatat gcacgactac catgacttta cgttgcatct tgcactggcc 600
gcccaagacg ggaaggaagt cgtggcgaag ggatgggggc agcgacaccc gctggcaggc 660
cctggcgttc ctggtccacc tacggagtgg acgtttattt atgcgccacg taacgaagag 720
gaactggcag tggtggaaat gattatcgag gcatcaatag gctatatgac caatgaccct 780
gctggaacag ttatcgta 798
<210> 26
<211> 266
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Armillaria ostoyae
<400> 26
Met Ser Phe Ile Asp Ser Met Lys Leu Asp Phe Val Gly His Leu Phe
1 5 10 15
Gly Ile Arg Asn Arg Gly Leu Ala Thr Ala Cys Cys Ala Val Ala Val
20 25 30
Ala Ser Ala Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe
35 40 45
Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Lys Gly Tyr Leu
50 55 60
Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala
65 70 75 80
Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro
85 90 95
Pro Arg Asn Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg
100 105 110
Gln Arg Asn Gln Ala Pro Asp Ser Lys Phe Ala Leu Glu Glu Leu Lys
115 120 125
Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His
130 135 140
Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu
145 150 155 160
Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr
165 170 175
Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp
180 185 190
Phe Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val
195 200 205
Ala Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro
210 215 220
Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu
225 230 235 240
Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met
245 250 255
Thr Asn Asp Pro Ala Gly Thr Val Ile Val
260 265
<210> 27
<211> 684
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Mycena chlorophos
<400> 27
ttcattcgtc gagactacca gacgttcctt cgtggtgggc cgtcctatgc cccacagaac 60
atccgcggct atatcatcgt cctggttctg tccctcttcc gcggcgagga gaagggtctt 120
gcaatctacg agccccttcc tgagaagcgc acatggctgc cggagcttcc gcggcgcgcg 180
ggagaccggc ccaagacgac gagccacatc atccaacggc agctcgacca gtaccccgac 240
ccggactttg tcctcaaagc cctgaaagcg acggtcatcc cgcgtgtcca agcccggcac 300
acagacaaga ctcacctcgc gctgtccaag ttcgagttcc atgctgaggc catcttcgtg 360
cgcccggaaa tcgccatcga cgacccgaag catatcccca gccacgacac ggtgcgacgg 420
acgaagcgcg agattgcgca catgcacgac tatcacgact gcacgctgca tttggcgcta 480
gcggcgcagg acgcgaagca ggtgctgcag aagggctggg gccagcgcca tccgctggca 540
gggcctggga tgcccgggcc gcccacggag tggacgttct tgtatgcccc gaggaccgag 600
gaggaagtga aggttgtgga gaccattgtc gaggcctcta tcgcgtacat gacgaacgcg 660
gagaagccgg tcgagctggt gcag 684
<210> 28
<211> 228
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Mycena chlorophos
<400> 28
Phe Ile Arg Arg Asp Tyr Gln Thr Phe Leu Arg Gly Gly Pro Ser Tyr
1 5 10 15
Ala Pro Gln Asn Ile Arg Gly Tyr Ile Ile Val Leu Val Leu Ser Leu
20 25 30
Phe Arg Gly Glu Glu Lys Gly Leu Ala Ile Tyr Glu Pro Leu Pro Glu
35 40 45
Lys Arg Thr Trp Leu Pro Glu Leu Pro Arg Arg Ala Gly Asp Arg Pro
50 55 60
Lys Thr Thr Ser His Ile Ile Gln Arg Gln Leu Asp Gln Tyr Pro Asp
65 70 75 80
Pro Asp Phe Val Leu Lys Ala Leu Lys Ala Thr Val Ile Pro Arg Val
85 90 95
Gln Ala Arg His Thr Asp Lys Thr His Leu Ala Leu Ser Lys Phe Glu
100 105 110
Phe His Ala Glu Ala Ile Phe Val Arg Pro Glu Ile Ala Ile Asp Asp
115 120 125
Pro Lys His Ile Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu
130 135 140
Ile Ala His Met His Asp Tyr His Asp Cys Thr Leu His Leu Ala Leu
145 150 155 160
Ala Ala Gln Asp Ala Lys Gln Val Leu Gln Lys Gly Trp Gly Gln Arg
165 170 175
His Pro Leu Ala Gly Pro Gly Met Pro Gly Pro Pro Thr Glu Trp Thr
180 185 190
Phe Leu Tyr Ala Pro Arg Thr Glu Glu Glu Val Lys Val Val Glu Thr
195 200 205
Ile Val Glu Ala Ser Ile Ala Tyr Met Thr Asn Ala Glu Lys Pro Val
210 215 220
Glu Leu Val Gln
225
<210> 29
<211> 666
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Mycena citricolor
<400> 29
ttcatcaaga aagactacga gacgttcctg aagggcggcc cctcctatgc gccccaaaac 60
gttcgcggat acatcatcgt gctcgtgctc gcgctcttcc gccaagagca gctcgggctg 120
gagatctacg accgcatgcc cgagaaacgt cgctggctcg cgaatctccc tcagcgcgag 180
ggcccccgcc ccaagaccac aagtcacatc atccagcggc agctcagcca gcacacggac 240
cccgcattcg gcgccgcgta cctcaaagac accgtcattc cgcgcgtcca ggcgcggcac 300
gcagccaaca cgcacatcgc gcgctcgacg ttcgagttcc acgccgccgc gatcttcctg 360
aacgcggacg tgccgctgcc cgagggcctg cccgcaagcg agacggtgcg gcggaccaag 420
ggcgagatcg cgcacatgca cgactaccac gacttcacgc tgcacctcgc gctcgcagca 480
gcggatggga aggaggtggt cggcaagggc tgggggcagc gccatccgct ggcgggaccc 540
ggcgtgccgg gtccgccgaa cgagtggacc tttgtgtatg cgccgaggaa tgaagaggag 600
atgggcgtgg tcgagcagat cgtagaggcg gcgattgggt acatgtcgaa cgtgcctgcg 660
ctggaa 666
<210> 30
<211> 222
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Mycena citricolor
<400> 30
Phe Ile Lys Lys Asp Tyr Glu Thr Phe Leu Lys Gly Gly Pro Ser Tyr
1 5 10 15
Ala Pro Gln Asn Val Arg Gly Tyr Ile Ile Val Leu Val Leu Ala Leu
20 25 30
Phe Arg Gln Glu Gln Leu Gly Leu Glu Ile Tyr Asp Arg Met Pro Glu
35 40 45
Lys Arg Arg Trp Leu Ala Asn Leu Pro Gln Arg Glu Gly Pro Arg Pro
50 55 60
Lys Thr Thr Ser His Ile Ile Gln Arg Gln Leu Ser Gln His Thr Asp
65 70 75 80
Pro Ala Phe Gly Ala Ala Tyr Leu Lys Asp Thr Val Ile Pro Arg Val
85 90 95
Gln Ala Arg His Ala Ala Asn Thr His Ile Ala Arg Ser Thr Phe Glu
100 105 110
Phe His Ala Ala Ala Ile Phe Leu Asn Ala Asp Val Pro Leu Pro Glu
115 120 125
Gly Leu Pro Ala Ser Glu Thr Val Arg Arg Thr Lys Gly Glu Ile Ala
130 135 140
His Met His Asp Tyr His Asp Phe Thr Leu His Leu Ala Leu Ala Ala
145 150 155 160
Ala Asp Gly Lys Glu Val Val Gly Lys Gly Trp Gly Gln Arg His Pro
165 170 175
Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Asn Glu Trp Thr Phe Val
180 185 190
Tyr Ala Pro Arg Asn Glu Glu Glu Met Gly Val Val Glu Gln Ile Val
195 200 205
Glu Ala Ala Ile Gly Tyr Met Ser Asn Val Pro Ala Leu Glu
210 215 220
<210> 31
<211> 705
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Omphalotus olearius
<400> 31
ttcatacgca aagattacca gactttcctg gaggtgggac cctcgtacgc cccgcagaac 60
ctccaaggat acatcatcgt ctgtgtactc tctctgttcc ggcaagaaca gaaagacgta 120
gcgatttatg atcgccttcc tgagaaaagg aggtggttag gagacctccc gtttcgcgag 180
gggccaagac cgagtatcac tagccatatc atccagcgac agcgcaccca attggctgac 240
gccgagttcg ctaccaaaga gctgataggc aaaatcatcc ctcgcgtcca agcccgacac 300
accaacacaa cattcctcag cacatctaaa ttcgaattcc acgcccaggc catcttcctt 360
ttgccctcta tcccaatcaa cgaccctcaa aacattccaa gccacgatac cgttcgtcgc 420
acgaaacgcg agatcgcgca tatgcatgat tatcacgact gtacgttgca tctcgcactt 480
gctgctcaag atgggaagga ggttttagag aaaggatggg gtcagcgaca tcctcttgct 540
ggacctggtg ttcctggccc gccgacggag tggacgtttc tttatgcacc gcgcagcgaa 600
gaggaggttc gggttgtgga gatgattgtt gaggcatcag ttgtgtatat gacgaatgat 660
cctgcggata aaatcgtaga agctactgtg cagggtactg aagaa 705
<210> 32
<211> 235
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Omphalotus olearius
<400> 32
Phe Ile Arg Lys Asp Tyr Gln Thr Phe Leu Glu Val Gly Pro Ser Tyr
1 5 10 15
Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile Val Cys Val Leu Ser Leu
20 25 30
Phe Arg Gln Glu Gln Lys Asp Val Ala Ile Tyr Asp Arg Leu Pro Glu
35 40 45
Lys Arg Arg Trp Leu Gly Asp Leu Pro Phe Arg Glu Gly Pro Arg Pro
50 55 60
Ser Ile Thr Ser His Ile Ile Gln Arg Gln Arg Thr Gln Leu Ala Asp
65 70 75 80
Ala Glu Phe Ala Thr Lys Glu Leu Ile Gly Lys Ile Ile Pro Arg Val
85 90 95
Gln Ala Arg His Thr Asn Thr Thr Phe Leu Ser Thr Ser Lys Phe Glu
100 105 110
Phe His Ala Gln Ala Ile Phe Leu Leu Pro Ser Ile Pro Ile Asn Asp
115 120 125
Pro Gln Asn Ile Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu
130 135 140
Ile Ala His Met His Asp Tyr His Asp Cys Thr Leu His Leu Ala Leu
145 150 155 160
Ala Ala Gln Asp Gly Lys Glu Val Leu Glu Lys Gly Trp Gly Gln Arg
165 170 175
His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr
180 185 190
Phe Leu Tyr Ala Pro Arg Ser Glu Glu Glu Val Arg Val Val Glu Met
195 200 205
Ile Val Glu Ala Ser Val Val Tyr Met Thr Asn Asp Pro Ala Asp Lys
210 215 220
Ile Val Glu Ala Thr Val Gln Gly Thr Glu Glu
225 230 235
<210> 33
<211> 681
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the functional fragment of luciferase from
Panellus stipticus
<400> 33
ttcgttcgta aagactatca cacctttctt gaaggtggac catcctacgc gccgcagaat 60
ttgcaaggct atatcatcgt gttggtgctc tcactctttc gaggggagga gacgggattg 120
gaaatatacg accgcttgcc cgaaaaacgc cgctggctcg aggagctgcc tgttcgcgaa 180
ggcccgcgcc caaagacaac cagccacatc attcagagac agttgaatca gcacgttgac 240
ccggacttcg gaatgaactc tttgaaaggc tccgtcatcc ggcgccttca atcccgccac 300
caggacataa ctcaactcgc actctcgaaa ttcgaattcc acgccgaggc catatttctg 360
cgccccgatg tcgcgatcaa cgatcccaaa cacgtcccga gccacgacac ggtgcgccgc 420
acaaagcgcg agatagctca catgcacgac taccatgatt acacgtgtca tttggcgctc 480
gcagcgcagg atgggaagca agtgattgca aaagggtggg gccagagaca tccgctcgcc 540
ggaccgggca tgccggggcc gccgacggag tggacatttt tgtatgcgcc gaggaatgag 600
gcggaggttc aagtgttgga gacgattatc gaagcgtcaa tcgggtacat gtcgaacgca 660
ccagccttgg gtgggagcga g 681
<210> 34
<211> 227
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the functional fragment of luciferase from
Panellus stipticus
<400> 34
Phe Val Arg Lys Asp Tyr His Thr Phe Leu Glu Gly Gly Pro Ser Tyr
1 5 10 15
Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile Val Leu Val Leu Ser Leu
20 25 30
Phe Arg Gly Glu Glu Thr Gly Leu Glu Ile Tyr Asp Arg Leu Pro Glu
35 40 45
Lys Arg Arg Trp Leu Glu Glu Leu Pro Val Arg Glu Gly Pro Arg Pro
50 55 60
Lys Thr Thr Ser His Ile Ile Gln Arg Gln Leu Asn Gln His Val Asp
65 70 75 80
Pro Asp Phe Gly Met Asn Ser Leu Lys Gly Ser Val Ile Arg Arg Leu
85 90 95
Gln Ser Arg His Gln Asp Ile Thr Gln Leu Ala Leu Ser Lys Phe Glu
100 105 110
Phe His Ala Glu Ala Ile Phe Leu Arg Pro Asp Val Ala Ile Asn Asp
115 120 125
Pro Lys His Val Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu
130 135 140
Ile Ala His Met His Asp Tyr His Asp Tyr Thr Cys His Leu Ala Leu
145 150 155 160
Ala Ala Gln Asp Gly Lys Gln Val Ile Ala Lys Gly Trp Gly Gln Arg
165 170 175
His Pro Leu Ala Gly Pro Gly Met Pro Gly Pro Pro Thr Glu Trp Thr
180 185 190
Phe Leu Tyr Ala Pro Arg Asn Glu Ala Glu Val Gln Val Leu Glu Thr
195 200 205
Ile Ile Glu Ala Ser Ile Gly Tyr Met Ser Asn Ala Pro Ala Leu Gly
210 215 220
Gly Ser Glu
225
<210> 35
<211> 211
<212> PRT
<213> artificial
<220>
<223> Consensus sequence
<220>
<221> MISC_FEATURE
<222> (3)..(214)
<223> ??any amino acid
<400> 35
Asp Tyr Xaa Thr Phe Leu Xaa Xaa Gly Pro Ser Tyr Ala Pro Gln Asn
1 5 10 15
Xaa Xaa Gly Tyr Xaa Ile Val Xaa Val Leu Xaa Leu Phe Arg Xaa Glu
20 25 30
Xaa Xaa Xaa Xaa Ile Tyr Xaa Xaa Xaa Pro Glu Lys Arg Xaa Trp Leu
35 40 45
Xaa Xaa Leu Pro Xaa Arg Xaa Gly Xaa Arg Pro Xaa Xaa Thr Ser His
50 55 60
Ile Ile Gln Arg Gln Xaa Xaa Gln Xaa Xaa Asp Xaa Xaa Phe Xaa Xaa
65 70 75 80
Xaa Xaa Leu Xaa Xaa Xaa Xaa Ile Xaa Arg Xaa Gln Xaa Arg His Xaa
85 90 95
Xaa Xaa Thr Xaa Xaa Xaa Ser Xaa Phe Glu Phe His Ala Xaa Ala Ile
100 105 110
Phe Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Xaa Pro Xaa Xaa
115 120 125
Xaa Thr Val Arg Arg Thr Lys Xaa Glu Ile Ala His Met His Asp Tyr
130 135 140
His Asp Xaa Thr Xaa His Leu Ala Leu Ala Ala Xaa Asp Xaa Lys Val
145 150 155 160
Xaa Xaa Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Xaa
165 170 175
Pro Gly Pro Pro Xaa Glu Trp Thr Phe Xaa Tyr Ala Pro Arg Xaa Glu
180 185 190
Xaa Glu Xaa Xaa Val Xaa Glu Xaa Ile Xaa Glu Ala Xaa Xaa Xaa Tyr
195 200 205
Met Xaa Asn
210
<210> 36
<211> 38
<212> DNA
<213> artificial
<220>
<223> Primer 1711
<220>
<221> misc_feature
<222> (6)..(36)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<400> 36
atcgcnttyc cntwcathcc narrgaytac saracntt 38
<210> 37
<211> 35
<212> DNA
<213> artificial
<220>
<223> Primer 1712
<220>
<221> misc_feature
<222> (6)..(3)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<220>
<221> misc_feature
<222> (6)..(6)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, t or u
<400> 37
atcgcnttyc cntwcathcc narrgaytac sarac 35
<210> 38
<211> 32
<212> DNA
<213> artificial
<220>
<223> Primer 1713
<220>
<221> misc_feature
<222> (6)..(31)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<400> 38
atcgcnttyc cntwcathcc narrgaytac sa 32
<210> 39
<211> 29
<212> DNA
<213> artificial
<220>
<223> Primer 1714
<220>
<221> misc_feature
<222> (6)..(27)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<400> 39
atcgcnttyc cntwcathcc narrgayta 29
<210> 40
<211> 42
<212> DNA
<213> artificial
<220>
<223> Primer 1715
<220>
<221> misc_feature
<222> (1)..(40)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<400> 40
ngcagggncn ttsgtcatat asccnatnga ngcytcnayn at 42
<210> 41
<211> 36
<212> DNA
<213> artificial
<220>
<223> Primer 1716
<220>
<221> misc_feature
<222> (1)..(34)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<400> 41
ngcagggncn ttsgtcatat asccnatnga ngcytc 36
<210> 42
<211> 32
<212> DNA
<213> artificial
<220>
<223> Primer 1717
<220>
<221> misc_feature
<222> (7)..(30)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<400> 42
gcagggncnt tsgtcatata sccnatngan gc 32
<210> 43
<211> 30
<212> DNA
<213> artificial
<220>
<223> Primer 1718
<220>
<221> misc_feature
<222> (1)..(28)
<223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or
T, N ?any base
<400> 43
ngcagggncn ttsgtcatat asccnatnga 30
<210> 44
<211> 801
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Neonothopanus nambi
<400> 44
atgcgcatta acatctccct ttcatctctt ttcgagcgat tgagcaaact gagttccagg 60
agtattgcaa tcacttgtgg ggttgtcctc gcgagcgcca tcgcattccc catcatccgg 120
agagattatc agacgtttct tgaggtgggc cctagctatg caccacagaa cttccgagga 180
tatatcatcg tgtgtgtact gtcactgttt aggcaagaac aaaagggatt ggctatctat 240
gataggttgc ctgagaaacg gcggtggctc gctgatctcc catttagaga ggggacacga 300
ccgagcatca cttcacacat catacaaaga cagcgaacgc agctcgttga ccaagagttc 360
gcaactaggg aactgattga taaggtgata cccagagtac aggcgcgaca caccgataaa 420
acttttcttt ccacctctaa attcgagttc catgccaaag ctattttctt gttgccttcc 480
ataccgatta atgatcctct gaatattcca tcccacgaca cagttcgacg gacgaaacgc 540
gaaattgcgc acatgcacga ctatcacgat tgcactttgc acctggcact ggctgctcaa 600
gacggaaaag aagttctgaa aaagggttgg gggcaaagac atccgctggc gggacccggt 660
gtacctgggc cgcctacgga atggacattt ttgtacgcac cgaggaacga agaggaggcc 720
agggtcgttg agatgattgt tgaggctagt attgggtaca tgacgaatga tccggctggt 780
aaaattgttg aaaatgcaaa g 801
<210> 45
<211> 798
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Armillaria gallica
<400> 45
atgagcttta tagactcaat gaaacttgat cttgtaggac acctcttcgg catacgcaac 60
agaggactcg cagcagcctg ttgcgccctt gcagtagctt ccacgatagc tttcccttat 120
atccgccggg attaccaaac gttccttagc ggtggccctt cttacgcgcc acagaacata 180
cgaggctatt ttatcgtgtg tgtgctcgct ctgtttcgcc aagaacagaa agggctggcg 240
atttatgacc gacttcctga gaaacgaagg tggcttcctg accttcctcc ccggaatggc 300
cctcgcccga ttacgacctc tcatattata caaagacaga ggaaccaagc gccagatccg 360
aaatttgccc tggaggagct caaggccact gtgattccac gagtccaagc ccgccatacg 420
gatcttacac atctcagtct tagcaaattt gagtttcatg ccgaggcaat ttttcttttg 480
ccgtccgttc cgatagacga ccccaaaaat gtaccctcac acgatacggt caggcgcaca 540
aagagggaga tcgcccatat gcatgactat cacgacttta ccctgcatct cgctctggcg 600
gcacaagacg gcaaggaggt agtcagcaaa ggctggggcc aaaggcatcc gctcgcgggc 660
ccaggggttc cggggccacc tacagagtgg actttcatct atgcgccgcg aaacgaggaa 720
gaactcgcag tagttgagat gatcatagag gcatcaattg gctacatgac gaacgatcct 780
gccggagtcg ttatagcc 798
<210> 46
<211> 798
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Armillaria mellea
<400> 46
atgagttttt ttgactctgt caaacttgat ctggtgggac ggctcttcgg catccgaaac 60
aggggacttg cggttacttg ctgcgcggta gcggtcgcct ctattatcgc cttcccatac 120
attcgccgcg actatcagac cttcctgtca ggcggacctt cttatgcacc gcagaatata 180
aggggctatc ttattgtttg tgtactggct ctctttcggc aagaacaaaa aggtctggct 240
atctacgata gacttcctga gaaacgacgc tggctgccag atcttccccc ccgcgacggc 300
ccaaggccca taacaacaag tcatattata cagagacaac ggaaccaggc cccagacctc 360
aagtttgccc tcgaggagct gaaagcgact gttataccta gagtacaggc gagacataca 420
gacttgaccc atttgagcct gagcaagttt gaattccatg ccgaagcaat ctttcttctg 480
ccttccgtac ccattgacga tccaaaaaac gtcccctcac atgatactgt aagacgcacg 540
aagcgagaga tcgcacacat gcacgactac catgactaca ctctgcacct tgccttggca 600
gctcaggatg gcaaggaagt tgtatccaag gggtggggcc aaagacaccc cttggctggc 660
ccgggagtgc ctggaccccc gaccgaatgg acgtttattt acgcaccaag gaacgaggaa 720
gaattggccg tcgttgaaat gattattgaa gcgtccatag gatatatgac caacgatccg 780
gccggaaaga caatcgcg 798
<210> 47
<211> 798
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Armillaria ostoyae
<400> 47
atgtctttta ttgacagtat gaagcttgat ttcgtaggtc acttgtttgg tatacgaaac 60
cgaggtctcg ctactgcgtg ctgcgcggtg gcagtagcga gtgctatagc attcccgtat 120
atccgccgag attaccagac atttcttagc ggtggaccta gctatgcacc ccagaatatt 180
aaagggtatt tgatcgtttg tgtgcttgca ctgtttcgcc aggagcagaa gggtcttgct 240
atttacgacc gactgcctga gaaaaggcga tggttgcctg accttccacc cagaaacggt 300
cccaggccca tcacgacctc acacataatc caacggcaga ggaaccaggc tccagattca 360
aagtttgcgc ttgaggaact caaggctact gtaataccta gagtccaggc cagacatacg 420
gatctcaccc atctcagcct cagtaagttt gagtttcatg cggaagctat tttcctgctc 480
ccgagcgtac ccattgatga ccccaagaat gtcccctcac atgatacggt acgacgcacg 540
aagcgggaga tagctcacat gcacgactac catgatttca ctctgcatct cgccttggca 600
gcgcaggatg gcaaggaggt agtagcgaaa ggatgggggc agagacaccc gctggcaggc 660
cctggggttc ccggccctcc gaccgaatgg acatttatct atgcgccccg caacgaagag 720
gagctcgcag ttgttgagat gatcattgaa gcatccattg ggtacatgac aaatgaccca 780
gccggtacag tcattgtt 798
<210> 48
<211> 753
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Mycena chlorophos
<400> 48
atggtacagc tcacgcgaac ctcagggttt attgcagcgg ctgcgattgt tgccgccatc 60
gcgttcccgt ttattcgacg ggactatcag acttttctgc gagggggccc ctcatatgcc 120
ccacagaata ttcgcggcta tatcattgtc ctggtcttgt ccctcttcag aggagaagaa 180
aagggtctgg ctatctatga gccgcttcca gagaaacgga cgtggttgcc agagttgcct 240
agacgggcgg gcgatagacc caaaactacc agccatataa tacaacgaca actcgaccaa 300
tatcccgacc cggacttcgt acttaaagca ttgaaagcaa ctgtaatacc gagagttcag 360
gcaaggcaca ctgataaaac ccatcttgca ctttccaagt ttgaattcca cgccgaggca 420
atcttcgtcc gaccagagat agccatagac gatccgaaac atatcccaag tcatgacaca 480
gtcagacgaa cgaaacggga gatagcccat atgcatgatt atcatgactg caccctgcac 540
cttgcgcttg cggcacagga cgcaaaacag gtcttgcaaa aaggatgggg acagagacac 600
ccccttgccg gacctggcat gccgggtccg cctactgaat ggacattcct ctacgccccg 660
agaactgagg aggaggtgaa agtggttgaa accatagtgg aggcgagtat agcttacatg 720
accaatgcag aaaaaccagt agaactcgta caa 753
<210> 49
<211> 738
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Mycena citricolor
<400> 49
atggcttatc agttgacatg gattcagact cttgtattgg gtgctctcgt ggctatggct 60
gttgcatttc cattcatcaa aaaagattat gagaccttcc tcaagggcgg cccttcatac 120
gccccccaga atgtccgcgg ttatattatc gtactcgtcc tcgcgctgtt cagacaagaa 180
caattggggc ttgagatata tgaccgcatg cccgaaaaac gcaggtggct cgctaacctc 240
cctcaacggg aaggtccgcg accgaaaacc actagccata tcattcagcg ccagctctct 300
cagcataccg accccgcctt tggagcggct tatctgaaag acaccgtaat cccgcgagtg 360
caggcgcggc atgcagcgaa cactcacata gcgcgaagta cgttcgaatt tcacgcagcg 420
gctatctttc tcaacgcaga cgtgccgttg cccgaaggac tgccagctag cgaaacagtg 480
agacgaacca aaggagaaat cgcgcacatg cacgattacc acgattttac gctgcacctg 540
gcacttgcgg cagcggacgg gaaagaggtg gtcggcaaag gatggggaca gagacatcca 600
ctcgctggcc ctggggtgcc tggccctccg aatgagtgga cattcgtgta cgctcccagg 660
aacgaggaag agatgggcgt agtagagcag attgtagagg ctgcaatcgg ttacatgtca 720
aatgtccctg ctctcgag 738
<210> 50
<211> 783
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Omphalotus olearius
<400> 50
atgctcccgg ctttcatata taaaccgaga ttggtcatta cgtgcgtttt tgttctcgct 60
agtgcattgg cttttccctt cataagaaag gactatcaga ctttcctcga agtcgggccg 120
tcttatgctc ctcaaaacct tcaagggtat atcatagtct gcgtattgtc actcttcaga 180
caagagcaaa aagatgtagc catatacgat agactccccg agaaaagaag gtggcttggt 240
gacctgccgt tcagagaagg gccgcgcccg tctattacct cccacattat ccaacgccaa 300
agaacgcaac ttgctgatgc agagttcgca acaaaggagt tgattgggaa gatcattccg 360
agggtgcagg caaggcatac aaataccact ttcttgtcaa cgagtaaatt tgagtttcac 420
gcccaggcaa tctttctgct tccttcaatt cccataaacg atccacaaaa tatcccaagt 480
cacgatacgg tacggcgcac gaagcgcgag atcgcccaca tgcatgatta tcatgattgc 540
acgcttcact tggctctcgc cgcgcaggac gggaaagagg tgcttgagaa ggggtggggt 600
cagcggcatc cactcgccgg gccaggtgtt cccggtcccc caaccgaatg gacatttctc 660
tatgcgcccc gctctgaaga agaggtacgg gtcgtggaaa tgatagtcga ggctagcgtg 720
gtttatatga cgaatgatcc tgcggacaag attgtagagg ccaccgtcca gggcaccgaa 780
gag 783
<210> 51
<211> 747
<212> DNA
<213> artificial
<220>
<223> Humanized nucleic acid coding luciferase from Panellus stipticus
<400> 51
atgaatataa atctgaaagc acttattggt gtctgtgcgg tactcatcac cgctgctgtc 60
tttccttttg tacggaaaga ctatcacacc tttttggagg gcggcccttc ctatgctcca 120
cagaacttgc agggctacat aatagtcctc gtcttgtcac tcttcagggg agaggagact 180
ggtttggaaa tttatgatcg cttgccagaa aagcggcgat ggctggaaga actgccagtg 240
cgggagggac cgcggcctaa gactacgagt cacatcatcc aacgccagct caaccagcac 300
gttgaccccg acttcggcat gaatagcttg aaaggctctg tgatacggag gcttcaatcc 360
cgccaccaag atataacgca gcttgctctt tccaagtttg agtttcacgc cgaagcaatt 420
tttctccggc ctgacgtcgc aatcaatgac cccaaacacg tgccatctca tgacactgtc 480
cgacgcacaa agagggagat cgctcacatg cacgactacc acgattacac ttgccatttg 540
gcccttgccg cccaagatgg caaacaagtg atagcgaagg gctggggtca aagacatccg 600
cttgctgggc ccggtatgcc tggacctcct accgagtgga ccttccttta tgccccacgc 660
aacgaagcag aggtgcaagt gctggaaact attattgagg caagtatagg atatatgagt 720
aacgcacctg ccctgggagg ttccgaa 747
<210> 52
<211> 60
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding site of transcription initiation and His-tag
<400> 52
atggctagca tgactggtgg acagcaaatg ggtcgcggat cccaccacca ccaccaccac 60
<210> 53
<211> 20
<212> PRT
<213> artificial
<220>
<223> N-terminal amino acid sequence comprising His-tag
<400> 53
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser His His
1 5 10 15
His His His His
20
<210> 54
<211> 801
<212> DNA
<213> artificial
<220>
<223> Nucleic acid coding the luciferase from Neonothopanus nambi,
optimised fro expression in Physcomitrella patens
<400> 54
atgaggataa atatctcttt gtctagtctc tttgagagac tgagcaaatt gtcatcccga 60
tccatcgcaa ttacctgcgg cgtagtcttg gcaagtgcaa tagcattccc aattatccga 120
agagactatc aaacgttcct tgaagtcggt ccgagctatg ccccacagaa cttccgaggc 180
tatatcatcg tttgtgtctt gtcacttttt aggcaagagc agaaagggtt ggcaatctat 240
gacaggcttc cagaaaagag gcgttggctt gccgacttgc cgtttcgtga agggacgagg 300
ccatccataa cctcccacat tatacagcgt cagcgtactc agctggtaga tcaagagttt 360
gcaaccagag aacttatcga taaggtgatc ccacgtgtgc aagcaagaca cacagacaaa 420
acttttctca gtacgtcaaa atttgagttt catgcaaagg ccatcttcct tctcccctct 480
atccctatta atgatcctct taacattccc tcacacgata cggtaagaag aaccaagcgt 540
gagatcgctc acatgcatga ttaccatgat tgcactctgc acttggctct tgctgctcag 600
gatggtaagg aagttttgaa gaaggggtgg ggccagcgtc acccactggc cggaccagga 660
gtcccaggcc ctcctactga gtggaccttc ctttacgcac caaggaacga agaggaggcc 720
agagttgtcg agatgatagt cgaagctagt attggctaca tgactaacga tcctgctggt 780
aagattgtcg aaaatgccaa g 801
Claims (9)
- 루시퍼라제(luciferase) 또는 이의 기능성 단편을 암호화하는 분리된 핵산으로서, 상기 핵산은 하기로 이루어진 군으로부터 선택되는 것인, 분리된 핵산:
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 특징으로 하는 단백질을 암호화하는 핵산;
(b) 상기 (a)의 아미노산 서열과 적어도 60% 동일한 서열을 갖는 단백질을 암호화하는 핵산; 및
(c) 서열번호 35의 공통 서열(consensus sequence)을 포함하는 단백질을 암호화하는 핵산.
- 제1항에 기재된 핵산 분자를 포함하는 발현 카세트(expression cassette)로서, 숙주세포에서의 핵산 발현에 필요한 조절 인자(regulatory element)의 제어하에 있고, 숙주세포 게놈에 통합되거나 또는 외부 염색체 인자(extrachromosomal element)의 형태로 숙주세포에 도입되며, 제1항에 기재된 핵산에 의해 암호화되는 루시퍼라제의 발현을 제공할 수 있는 것인, 발현 카세트.
- 제1항에 기재된 핵산에 의해 암호화되는 루시퍼라제를 생산하는 세포로서, 상기 세포는 제2항에 기재된 발현 카세트를 외부 염색체 인자 또는 세포 게놈에 통합된 인자의 형태로 포함하는 것인, 세포.
- 하기로 이루어진 군으로부터 선택된, 분리된 루시퍼라제 또는 이의 기능성 단편:
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34에 주어진 아미노산 서열과 실질적으로 동일한 아미노산 서열을 특징으로 하는 단백질;
(b) 상기 (a)의 아미노산 서열과 적어도 60% 동일한 아미노산 서열을 갖는 단백질; 및
(c) 서열번호 35의 공통 서열을 포함하는 아미노산 서열을 갖는 단백질.
- (1) 제1항에 기재된 핵산, 또는 제2항에 기재된 발현 카세트, 또는 제4항에 기재된 단백질; 및 (2) 제1항에 기재된 루시퍼라제에 의해 산화될 수 있는 루시페린(luciferin);을 포함하는, 키트.
- 제1항에 기재된 핵산을 포함하는, 형질전환 유기체(transgenic organism).
- 제4항에 기재된 단백질에 특이적으로 연결되는, 항체.
- 세포내 국소화 신호 (intracellular localisation signal)에 작동 가능하게(operably) 융합된, 제1항에 기재된 핵산 분자를 포함하는 발현 카세트로서, 숙주세포에서의 핵산의 발현에 필요한 조절 인자의 제어하에 있고, 숙주세포 게놈에 통합되거나 또는 외부 염색체 인자의 형태로 세포에 도입되며, 세포내 국소화 신호에 연결된 제1항에 기재된 핵산에 의해 암호화되는 루시퍼라제의 발현을 제공할 수 있는 것인, 발현 카세트.
- 제2항 또는 제8항에 기재된 발현 카세트를 세포에 도입하는 단계를 포함하는, 세포 및 세포 구조체(cellular structure)를 표지하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2017102986 | 2017-01-30 | ||
RU2017102986A RU2674894C2 (ru) | 2017-01-30 | 2017-01-30 | Новые люциферазы и способы их использования |
PCT/RU2017/050125 WO2018139956A1 (ru) | 2017-01-30 | 2017-12-06 | Новые люциферазы и способы их использования |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190113860A true KR20190113860A (ko) | 2019-10-08 |
KR102594240B1 KR102594240B1 (ko) | 2023-10-26 |
Family
ID=62979645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197025169A KR102594240B1 (ko) | 2017-01-30 | 2017-12-06 | 신규한 루시퍼라제 및 이를 이용하는 방법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US11913033B2 (ko) |
EP (1) | EP3575395A4 (ko) |
JP (1) | JP7298907B2 (ko) |
KR (1) | KR102594240B1 (ko) |
CN (1) | CN110234758A (ko) |
AU (1) | AU2017395644A1 (ko) |
BR (1) | BR112019015682A8 (ko) |
CA (1) | CA3051667A1 (ko) |
MX (1) | MX2019009045A (ko) |
RU (1) | RU2674894C2 (ko) |
WO (1) | WO2018139956A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2730038C2 (ru) | 2018-06-28 | 2020-08-14 | Общество с ограниченной ответственностью "ПЛАНТА" | Ферменты биосинтеза люциферина и их применение |
RU2744869C2 (ru) * | 2019-08-08 | 2021-03-16 | Общество с ограниченной ответственностью "ПЛАНТА" | Метод и реактивы для детекции активности люциферазы |
CN111560454B (zh) * | 2020-04-10 | 2022-08-16 | 上海交通大学 | 植物细胞高尔基体特异标记及应用 |
WO2024034619A1 (ja) * | 2022-08-10 | 2024-02-15 | 国立大学法人大阪大学 | 発光タンパク質 |
CN117567640A (zh) * | 2023-11-09 | 2024-02-20 | 苏州泓迅生物科技股份有限公司 | 一种在大肠杆菌宿主细胞中高效表达与纯化重组蛋白的融合标签肽及其应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004514460A (ja) * | 2000-12-15 | 2004-05-20 | カーディオジニクス インコーポレーテッド | ルシフェラーゼ生物発光に関する光活性型インビトロアッセイ法 |
KR20130060605A (ko) * | 2011-11-30 | 2013-06-10 | 전남대학교산학협력단 | 신규 박테리아 용해 단백질 및 그의 용도 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5385938B1 (en) | 1986-12-23 | 1997-07-15 | Tristrata Inc | Method of using glycolic acid for treating wrinkles |
US5739409A (en) | 1987-06-19 | 1998-04-14 | The Regents Of The University Of California | Endogenously sweetened transgenic plant products |
US5256558A (en) | 1989-05-03 | 1993-10-26 | The Trustees Of Rockefeller University | Gene encoding plant asparagine synthetase |
US5484956A (en) | 1990-01-22 | 1996-01-16 | Dekalb Genetics Corporation | Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin |
US5767367A (en) | 1990-06-23 | 1998-06-16 | Hoechst Aktiengesellschaft | Zea mays (L.) with capability of long term, highly efficient plant regeneration including fertile transgenic maize plants having a heterologous gene, and their preparation |
DE4207358A1 (de) | 1992-03-04 | 1993-09-09 | Inst Genbiologische Forschung | Expressionskassette und plasmide zur schliesszellenspezifischen expression und ihre verwendung zur herstellung transgener pflanzenzellen und pflanzen |
US5633155A (en) | 1992-08-19 | 1997-05-27 | Jinro Limited | Expression vector for phytolacca antiviral protein and process for preparing transgenic plant transformed therewith |
US5576198A (en) | 1993-12-14 | 1996-11-19 | Calgene, Inc. | Controlled expression of transgenic constructs in plant plastids |
US5750870A (en) | 1994-06-17 | 1998-05-12 | Agritope, Inc. | Plant genetic transformation methods and transgenic plants |
US5750868A (en) | 1994-12-08 | 1998-05-12 | Pioneer Hi-Bred International, Inc. | Reversible nuclear genetic system for male sterility in transgenic plants |
US5629470A (en) | 1995-01-20 | 1997-05-13 | Rutgers, The State University Of New Jersey | Transgenic plants and plant cells with enhanced pathogen resistance and related methods |
US5674731A (en) | 1995-04-27 | 1997-10-07 | Life Technologies, Inc. | Regeneration of both plant tissues and transgenic plant tissues using a new plant hormone, 5-bromoindole-3-acetic acid |
US5690045A (en) | 1996-10-10 | 1997-11-25 | Marine Automation, Inc. | Personal watercraft lift at transom |
AU772485C (en) * | 1999-10-26 | 2004-11-18 | Promega Corporation | Novel enzyme |
EP1373481A4 (en) * | 2001-03-07 | 2005-04-13 | Xenogen Corp | PROCESS FOR SCREENING ON THE INTRODUCTION OF DNA TO A TARGET CELL |
AU2002307203A1 (en) * | 2001-04-06 | 2002-10-21 | The Scripps Research Institute | Bioluminescent plants and methods of making same |
US20050014687A1 (en) * | 2002-03-19 | 2005-01-20 | Anderson David W. | Therapeutic polypeptides, nucleic acids encoding same, and methods of use |
WO2004076685A2 (en) * | 2003-02-28 | 2004-09-10 | Lux Biotechnology Limited | Fungal biosensor and assay |
EP3000886A1 (en) * | 2003-03-19 | 2016-03-30 | Amgen Fremont Inc. | Antibodies against t cell immunoglobulin domain and mucin domain 1 (tim-1) antigen and uses thereof |
EP2512227B1 (en) * | 2009-12-17 | 2016-11-02 | Sanofi | Animal model expressing luciferase under control of the myelin basic protein promoter (mbp-luci) and use of the model for bioluminescence in vivo imaging |
CN106220739A (zh) * | 2010-12-09 | 2016-12-14 | 宾夕法尼亚大学董事会 | 嵌合抗原受体‑修饰的t细胞治疗癌症的用途 |
US9587266B2 (en) * | 2011-02-09 | 2017-03-07 | University Of Massachusetts | Mutant luciferases |
IL293944A (en) * | 2012-08-20 | 2022-08-01 | Hutchinson Fred Cancer Res | Method and preparations for cellular immunotherapy |
-
2017
- 2017-01-30 RU RU2017102986A patent/RU2674894C2/ru active
- 2017-12-06 US US16/479,693 patent/US11913033B2/en active Active
- 2017-12-06 AU AU2017395644A patent/AU2017395644A1/en active Pending
- 2017-12-06 MX MX2019009045A patent/MX2019009045A/es unknown
- 2017-12-06 CA CA3051667A patent/CA3051667A1/en active Pending
- 2017-12-06 BR BR112019015682A patent/BR112019015682A8/pt unknown
- 2017-12-06 EP EP17893668.8A patent/EP3575395A4/en active Pending
- 2017-12-06 JP JP2019538322A patent/JP7298907B2/ja active Active
- 2017-12-06 WO PCT/RU2017/050125 patent/WO2018139956A1/ru unknown
- 2017-12-06 KR KR1020197025169A patent/KR102594240B1/ko active IP Right Grant
- 2017-12-06 CN CN201780085183.3A patent/CN110234758A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004514460A (ja) * | 2000-12-15 | 2004-05-20 | カーディオジニクス インコーポレーテッド | ルシフェラーゼ生物発光に関する光活性型インビトロアッセイ法 |
KR20130060605A (ko) * | 2011-11-30 | 2013-06-10 | 전남대학교산학협력단 | 신규 박테리아 용해 단백질 및 그의 용도 |
Non-Patent Citations (1)
Title |
---|
Nigerian Journal of Science and Environment, 2016, Vol.14, No.1, pp.132-139 1부.* * |
Also Published As
Publication number | Publication date |
---|---|
EP3575395A4 (en) | 2020-10-14 |
JP2020505028A (ja) | 2020-02-20 |
CN110234758A (zh) | 2019-09-13 |
MX2019009045A (es) | 2019-12-16 |
RU2674894C2 (ru) | 2018-12-13 |
US20210079363A1 (en) | 2021-03-18 |
US11913033B2 (en) | 2024-02-27 |
WO2018139956A1 (ru) | 2018-08-02 |
BR112019015682A8 (pt) | 2021-11-09 |
RU2017102986A (ru) | 2018-07-30 |
JP7298907B2 (ja) | 2023-06-27 |
BR112019015682A2 (pt) | 2020-04-14 |
EP3575395A1 (en) | 2019-12-04 |
KR102594240B1 (ko) | 2023-10-26 |
CA3051667A1 (en) | 2018-08-02 |
AU2017395644A1 (en) | 2019-09-12 |
RU2017102986A3 (ko) | 2018-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102594240B1 (ko) | 신규한 루시퍼라제 및 이를 이용하는 방법 | |
JP5295206B2 (ja) | ルシフェラーゼ発現カセットおよび使用法 | |
AU2006281994B2 (en) | Arachnocampa luciferases | |
JP5221308B2 (ja) | 非凝集性蛍光性タンパク質およびその使用方法 | |
JP2003527833A (ja) | 花虫類に由来する発色団/蛍光体、およびそれらの使用法 | |
RU2730038C2 (ru) | Ферменты биосинтеза люциферина и их применение | |
JP2003509029A5 (ko) | ||
JP4330338B2 (ja) | 大きく赤側にシフトした蛍光タンパク質 | |
JP4510464B2 (ja) | Aequoreacoerulescens由来の新規な蛍光タンパク質およびその使用方法 | |
RU2434943C2 (ru) | БИОСЕНСОР ДЛЯ ДЕТЕКЦИИ ПЕРОКСИДА ВОДОРОДА В ЖИВЫХ КЛЕТКАХ, ОБЛАДАЮЩИЙ ПОВЫШЕННОЙ УСТОЙЧИВОСТЬЮ К ИЗМЕНЕНИЯМ pH | |
AU767483B2 (en) | Pholasin | |
RU2809367C2 (ru) | Гиспидин-синтазы и их применение | |
RU2812474C2 (ru) | Кофеилпируват-гидролазы и их применение | |
JP2005514032A (ja) | 変異体発色団/蛍光団ならびにそれらの製造法および使用法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |