KR20230026987A - Atp-의존성 dna 리가제 - Google Patents
Atp-의존성 dna 리가제 Download PDFInfo
- Publication number
- KR20230026987A KR20230026987A KR1020227037488A KR20227037488A KR20230026987A KR 20230026987 A KR20230026987 A KR 20230026987A KR 1020227037488 A KR1020227037488 A KR 1020227037488A KR 20227037488 A KR20227037488 A KR 20227037488A KR 20230026987 A KR20230026987 A KR 20230026987A
- Authority
- KR
- South Korea
- Prior art keywords
- acid molecule
- leu
- seq
- lys
- glu
- Prior art date
Links
- 102000008158 DNA Ligase ATP Human genes 0.000 title claims abstract description 102
- 108010060248 DNA Ligase ATP Proteins 0.000 title claims abstract description 102
- 102000012410 DNA Ligases Human genes 0.000 claims abstract description 117
- 108010061982 DNA Ligases Proteins 0.000 claims abstract description 117
- 102000003960 Ligases Human genes 0.000 claims abstract description 78
- 108090000364 Ligases Proteins 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims abstract description 64
- 239000000203 mixture Substances 0.000 claims abstract description 31
- 229920002477 rna polymer Polymers 0.000 claims description 162
- 102000053602 DNA Human genes 0.000 claims description 135
- 108020004414 DNA Proteins 0.000 claims description 134
- 150000007523 nucleic acids Chemical class 0.000 claims description 117
- 102000039446 nucleic acids Human genes 0.000 claims description 105
- 108020004707 nucleic acids Proteins 0.000 claims description 105
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 78
- 239000002253 acid Substances 0.000 claims description 69
- 239000012634 fragment Substances 0.000 claims description 66
- 239000000872 buffer Substances 0.000 claims description 51
- 210000004027 cell Anatomy 0.000 claims description 46
- 238000006243 chemical reaction Methods 0.000 claims description 46
- 230000000295 complement effect Effects 0.000 claims description 40
- 239000002299 complementary DNA Substances 0.000 claims description 37
- 230000002255 enzymatic effect Effects 0.000 claims description 25
- 150000001768 cations Chemical class 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 19
- 108090000623 proteins and genes Proteins 0.000 claims description 18
- 239000013604 expression vector Substances 0.000 claims description 13
- 230000005783 single-strand break Effects 0.000 claims description 12
- 239000013612 plasmid Substances 0.000 claims description 11
- 102000004169 proteins and genes Human genes 0.000 claims description 11
- 230000001419 dependent effect Effects 0.000 claims description 10
- 238000003259 recombinant expression Methods 0.000 claims description 8
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 238000000338 in vitro Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 241000701959 Escherichia virus Lambda Species 0.000 claims description 4
- 210000004436 artificial bacterial chromosome Anatomy 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 239000013603 viral vector Substances 0.000 claims description 4
- 210000005253 yeast cell Anatomy 0.000 claims description 4
- 241000238631 Hexapoda Species 0.000 claims description 3
- 239000013599 cloning vector Substances 0.000 claims description 3
- 210000005260 human cell Anatomy 0.000 claims description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 24
- 238000002360 preparation method Methods 0.000 abstract description 8
- 238000001823 molecular biology technique Methods 0.000 abstract 1
- 239000000758 substrate Substances 0.000 description 72
- 125000003729 nucleotide group Chemical group 0.000 description 37
- 239000002773 nucleotide Substances 0.000 description 35
- 102000004190 Enzymes Human genes 0.000 description 29
- 108090000790 Enzymes Proteins 0.000 description 29
- 229940088598 enzyme Drugs 0.000 description 29
- 239000011777 magnesium Substances 0.000 description 26
- 108020004999 messenger RNA Proteins 0.000 description 23
- 108091034117 Oligonucleotide Proteins 0.000 description 19
- 230000014509 gene expression Effects 0.000 description 17
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 241000588724 Escherichia coli Species 0.000 description 13
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 12
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 12
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 12
- 235000001014 amino acid Nutrition 0.000 description 12
- 108010000761 leucylarginine Proteins 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- 108010054155 lysyllysine Proteins 0.000 description 11
- 238000000746 purification Methods 0.000 description 11
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 10
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 10
- 108010062796 arginyllysine Proteins 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- 235000018102 proteins Nutrition 0.000 description 10
- 241001515965 unidentified phage Species 0.000 description 10
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 9
- 239000007983 Tris buffer Substances 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 9
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 8
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 8
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 8
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 8
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 239000011324 bead Substances 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 239000000975 dye Substances 0.000 description 8
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 8
- 108010003700 lysyl aspartic acid Proteins 0.000 description 8
- 108010017391 lysylvaline Proteins 0.000 description 8
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 8
- 239000004055 small Interfering RNA Substances 0.000 description 8
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 8
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 7
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 7
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 7
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 108010038633 aspartylglutamate Proteins 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 229960002685 biotin Drugs 0.000 description 7
- 235000020958 biotin Nutrition 0.000 description 7
- 239000011616 biotin Substances 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 6
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 6
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 6
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 6
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 6
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 6
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 6
- 108091032955 Bacterial small RNA Proteins 0.000 description 6
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 6
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 6
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 6
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 6
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 6
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 6
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 6
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 6
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 6
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 6
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 6
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 6
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 6
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 6
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 6
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 239000011541 reaction mixture Substances 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 5
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 5
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 5
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 5
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 5
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 5
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 5
- 241000700618 Vaccinia virus Species 0.000 description 5
- 206010046865 Vaccinia virus infection Diseases 0.000 description 5
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000010804 cDNA synthesis Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000013467 fragmentation Methods 0.000 description 5
- 238000006062 fragmentation reaction Methods 0.000 description 5
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 5
- 108010028295 histidylhistidine Proteins 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 229910001629 magnesium chloride Inorganic materials 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 208000007089 vaccinia Diseases 0.000 description 5
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 4
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 4
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 4
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 4
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 4
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 4
- RTDZQOFEGPWSJD-AVGNSLFASA-N Arg-Leu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O RTDZQOFEGPWSJD-AVGNSLFASA-N 0.000 description 4
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 4
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 4
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 4
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 4
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 4
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 4
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 4
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 4
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 4
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 4
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 4
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 4
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 4
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 4
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 4
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 4
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 4
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 4
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 4
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 4
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 4
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 4
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 4
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 4
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 4
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 4
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 4
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 4
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 4
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 4
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 4
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 4
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 4
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 4
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 4
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 4
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 4
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 4
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 4
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 4
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 4
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 4
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 4
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 4
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 4
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 4
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 4
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 4
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 4
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 4
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 4
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 4
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 4
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 4
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 4
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 4
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 4
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 4
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 4
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 4
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 4
- 108700011259 MicroRNAs Proteins 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 4
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 4
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 4
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 4
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 4
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 4
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 4
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 4
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 4
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 4
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 4
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 4
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 4
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 4
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 4
- IVBJBFSWJDNQFW-XIRDDKMYSA-N Trp-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IVBJBFSWJDNQFW-XIRDDKMYSA-N 0.000 description 4
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 4
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 4
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 4
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 4
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 4
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 4
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 4
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 239000012062 aqueous buffer Substances 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- -1 i.e. Proteins 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 4
- 108010027338 isoleucylcysteine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 239000002679 microRNA Substances 0.000 description 4
- 108010018625 phenylalanylarginine Proteins 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 4
- 241000589291 Acinetobacter Species 0.000 description 3
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 3
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 3
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 3
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 3
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 3
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 3
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 3
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000701533 Escherichia virus T4 Species 0.000 description 3
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 3
- XIYWAJQIWLXXAF-XKBZYTNZSA-N Gln-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XIYWAJQIWLXXAF-XKBZYTNZSA-N 0.000 description 3
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 3
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 3
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 3
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 3
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 3
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 3
- HZVRQFKRALAMQS-SLBDDTMCSA-N Ile-Trp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZVRQFKRALAMQS-SLBDDTMCSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 3
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 3
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 3
- BAKAHWWRCCUDAF-IHRRRGAJSA-N Pro-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BAKAHWWRCCUDAF-IHRRRGAJSA-N 0.000 description 3
- 101710086015 RNA ligase Proteins 0.000 description 3
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 3
- YXGCIEUDOHILKR-IHRRRGAJSA-N Ser-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CO)N YXGCIEUDOHILKR-IHRRRGAJSA-N 0.000 description 3
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 3
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 3
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 3
- KRCPXGSWDOGHAM-XIRDDKMYSA-N Trp-Lys-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O KRCPXGSWDOGHAM-XIRDDKMYSA-N 0.000 description 3
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 3
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 3
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 3
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 3
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 3
- 125000001931 aliphatic group Chemical group 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000000099 in vitro assay Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000005304 joining Methods 0.000 description 3
- 238000002386 leaching Methods 0.000 description 3
- 238000007834 ligase chain reaction Methods 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- ZWLPBLYKEWSWPD-UHFFFAOYSA-N o-toluic acid Chemical compound CC1=CC=CC=C1C(O)=O ZWLPBLYKEWSWPD-UHFFFAOYSA-N 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- UQYCFWDXGAGNGW-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-methylpentanoyl)amino]-3-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound CCC(C)C(N)C(=O)NC(C(C)CC)C(=O)NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 UQYCFWDXGAGNGW-UHFFFAOYSA-N 0.000 description 2
- OCKGFTQIICXDQW-ZEQRLZLVSA-N 5-[(1r)-1-hydroxy-2-[4-[(2r)-2-hydroxy-2-(4-methyl-1-oxo-3h-2-benzofuran-5-yl)ethyl]piperazin-1-yl]ethyl]-4-methyl-3h-2-benzofuran-1-one Chemical compound C1=C2C(=O)OCC2=C(C)C([C@@H](O)CN2CCN(CC2)C[C@H](O)C2=CC=C3C(=O)OCC3=C2C)=C1 OCKGFTQIICXDQW-ZEQRLZLVSA-N 0.000 description 2
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 2
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 2
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 2
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 2
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 2
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 2
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 2
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 2
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 2
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 2
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 2
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 2
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 2
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 2
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 2
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 2
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 2
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 2
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 2
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- LNENWJXDHCFVOF-DCAQKATOSA-N Asp-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LNENWJXDHCFVOF-DCAQKATOSA-N 0.000 description 2
- RWHHSFSWKFBTCF-KKUMJFAQSA-N Asp-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N RWHHSFSWKFBTCF-KKUMJFAQSA-N 0.000 description 2
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 2
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 2
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 2
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 2
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 2
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 2
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 2
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- HRJLVSQKBLZHSR-ZLUOBGJFSA-N Cys-Asn-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O HRJLVSQKBLZHSR-ZLUOBGJFSA-N 0.000 description 2
- UCMIKRLLIOVDRJ-XKBZYTNZSA-N Cys-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)O UCMIKRLLIOVDRJ-XKBZYTNZSA-N 0.000 description 2
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 2
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 2
- NLDWTJBJFVWBDQ-KKUMJFAQSA-N Cys-Lys-Phe Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NLDWTJBJFVWBDQ-KKUMJFAQSA-N 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 2
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 2
- LLRJEFPKIIBGJP-DCAQKATOSA-N Gln-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LLRJEFPKIIBGJP-DCAQKATOSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 2
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 2
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 2
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 2
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 2
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 2
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 2
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 2
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 2
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 2
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 2
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 2
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 2
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 2
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- CYHWWHKRCKHYGQ-GUBZILKMSA-N His-Cys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CYHWWHKRCKHYGQ-GUBZILKMSA-N 0.000 description 2
- WSXNWASHQNSMRX-GVXVVHGQSA-N His-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSXNWASHQNSMRX-GVXVVHGQSA-N 0.000 description 2
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 2
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 2
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 2
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 2
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 2
- JQLFYZMEXFNRFS-DJFWLOJKSA-N Ile-Asp-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N JQLFYZMEXFNRFS-DJFWLOJKSA-N 0.000 description 2
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 2
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 2
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 2
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 2
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 2
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 2
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 2
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 2
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 2
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 2
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 2
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 2
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 2
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 2
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 2
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 2
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 2
- OCRSGGIJBDUXHU-WDSOQIARSA-N Met-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OCRSGGIJBDUXHU-WDSOQIARSA-N 0.000 description 2
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 2
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 2
- KVNOBVKRBOYSIV-SZMVWBNQSA-N Met-Pro-Trp Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N KVNOBVKRBOYSIV-SZMVWBNQSA-N 0.000 description 2
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 2
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 241000531155 Pectobacterium Species 0.000 description 2
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 2
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 2
- YEEFZOKPYOUXMX-KKUMJFAQSA-N Phe-Gln-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YEEFZOKPYOUXMX-KKUMJFAQSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 2
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 2
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 2
- GNZCMRRSXOBHLC-JYJNAYRXSA-N Phe-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N GNZCMRRSXOBHLC-JYJNAYRXSA-N 0.000 description 2
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical group [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 2
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 2
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 2
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 2
- BVRBCQBUNGAWFP-KKUMJFAQSA-N Pro-Tyr-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O BVRBCQBUNGAWFP-KKUMJFAQSA-N 0.000 description 2
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 2
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000003661 Ribonuclease III Human genes 0.000 description 2
- 108010057163 Ribonuclease III Proteins 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 2
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 2
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 2
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 2
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 2
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 2
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 2
- YTYHAYZPOARHAP-HOCLYGCPSA-N Trp-Lys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N YTYHAYZPOARHAP-HOCLYGCPSA-N 0.000 description 2
- OWSRIUBVJOQHNY-IHPCNDPISA-N Trp-Lys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N OWSRIUBVJOQHNY-IHPCNDPISA-N 0.000 description 2
- RPTAWXPQXXCUGL-OYDLWJJNSA-N Trp-Trp-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O RPTAWXPQXXCUGL-OYDLWJJNSA-N 0.000 description 2
- XQMGDVVKFRLQKH-BBRMVZONSA-N Trp-Val-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)=CNC2=C1 XQMGDVVKFRLQKH-BBRMVZONSA-N 0.000 description 2
- UBKKNELWDCBNCF-STQMWFEESA-N Tyr-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBKKNELWDCBNCF-STQMWFEESA-N 0.000 description 2
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 2
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 2
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 2
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 2
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 2
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 2
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 108010084217 alanyl-glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 230000007940 bacterial gene expression Effects 0.000 description 2
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 2
- 239000004327 boric acid Substances 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000030609 dephosphorylation Effects 0.000 description 2
- 238000006209 dephosphorylation reaction Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 108091008053 gene clusters Proteins 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 238000012269 metabolic engineering Methods 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000012089 stop solution Substances 0.000 description 2
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical compound OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- RGNOTKMIMZMNRX-XVFCMESISA-N 2-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-4-one Chemical compound NC1=NC(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RGNOTKMIMZMNRX-XVFCMESISA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 1
- GJCOSYZMQJWQCA-UHFFFAOYSA-N 9H-xanthene Chemical compound C1=CC=C2CC3=CC=CC=C3OC2=C1 GJCOSYZMQJWQCA-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000607534 Aeromonas Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- 102100021935 C-C motif chemokine 26 Human genes 0.000 description 1
- 241000095723 Cronobacter phage CR9 Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- MIKUYHXYGGJMLM-UUOKFMHZSA-N Crotonoside Chemical compound C1=NC2=C(N)NC(=O)N=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MIKUYHXYGGJMLM-UUOKFMHZSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 101000897493 Homo sapiens C-C motif chemokine 26 Proteins 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 1
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241001634957 Pectobacterium phage phiTE Species 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- 239000012564 Q sepharose fast flow resin Substances 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000003936 denaturing gel electrophoresis Methods 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 101150001899 lacY gene Proteins 0.000 description 1
- QDLAGTHXVHQKRE-UHFFFAOYSA-N lichenxanthone Natural products COC1=CC(O)=C2C(=O)C3=C(C)C=C(OC)C=C3OC2=C1 QDLAGTHXVHQKRE-UHFFFAOYSA-N 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000011880 melting curve analysis Methods 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- YAAWASYJIRZXSZ-UHFFFAOYSA-N pyrimidine-2,4-diamine Chemical compound NC1=CC=NC(N)=N1 YAAWASYJIRZXSZ-UHFFFAOYSA-N 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y605/00—Ligases forming phosphoric ester bonds (6.5)
- C12Y605/01—Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
- C12Y605/01001—DNA ligase (ATP) (6.5.1.1)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 리가제 분야에 관한 것이다. 보다 구체적으로, 이는 리가제를 다양한 분자생물학 기술에서 특히 유용하게 만드는 독특한 리가제 활성을 갖는 신규하고 매우 효율적인 ATP-의존성 DNA 리가제에 관한 것이다. 또한, 본 발명은 DNA 리가제를 포함하는 조성물 및 키트, 이의 제조 방법 및 용도에 관한 것이다.
Description
본 발명은 리가제 분야에 관한 것이다. 보다 구체적으로, 이는 ATP-의존성 DNA 리가제, DNA 리가제를 포함하는 키트 및 조성물, 제조 방법 및 용도에 관한 것이다.
DNA 리가제는 적절하게 정렬된 DNA 서열에서 5'-포스포릴과 3'-하이드록실 말단-기 사이의 DNA의 당-포스페이트 백본에서 포스포디에스테르 결합의 형성을 촉매작용한다. 생체 내 리가제는 닉(nick)의 복구 뿐만 아니라 DNA 복제 및 복구에 중요한 단일-가닥 및 이중-가닥 파손에서 중요한 역할을 한다.
DNA 복제 및 복구에 중요할 뿐만 아니라, T4 DNA 리가제와 같은 박테리오파지로부터 분리된 DNA 리가제는 재조합 플라스미드 작제를 위한 DNA 단편의 벡터로의 삽입, 차세대 DNA 시퀀싱 라이브러리 작제 및 dsDNA의 원형화에서의 어댑터 라이게이션을 위해 분자 생물학에서 수십 년 동안 널리 사용되어 왔다(문헌["Ligases", Enzyme Resources Guide. Promega Corporation. pp. 8-14] 참조).
DNA 리가제 효소는 보조인자 ATP 또는 NAD의 피로포스페이트 가수분해와 커플링된, 하나의 DNA 사슬의 3'-하이드록실 말단-기와 또 다른 DNA 사슬의 인접한 5'-포스포릴 말단-기의 공유 결합을 촉매작용한다(문헌[Gumport, R. I., et al., Proc. Natl. Acad. Sci. USA (1971), vol.68:2559-63]).
기질 선호도에 기초하여 리가제는 DNA 리가제 또는 RNA 리가제, 즉, 각각 DNA 또는 RNA의 포스포디에스테르 결합을 생성하는 효소로 분류될 수 있다(문헌[Tomkinson, A.E. et al, Location of the active site for enzyme-adenylate formation in DNA ligase, Proc. Natl. Acad. Sci. USA, 1991, vol.88, p.400-404]).
비대칭 제한 효소 분해에 의해 생성된 dsDNA 분자에서 사전하이브리드화된 점착-말단을 라이게이션하는 것과 같은 이중 가닥 핵산 분자에서 단일-가닥 파손을 밀봉하는 것은 라이게이션될 2개의 말단이 용액에서 자유롭게 존재하는 블런트 말단 라이게이션보다 훨씬 더 효율적이다. 라이게이션 접합부에 걸쳐 있는 상보적 핵산 분자의 존재 하에 2개의 단일 가닥 핵산 분자의 라이게이션을 촉매작용하여 2개의 말단을 매우 근접하게 하는 주형-의존적 리가제에 의해 촉매되는 라이게이션 반응은 블런트 말단 라이게이션보다 훨씬 더 빠르고 더 효율적이다.
박테리오파지 T3, T4 및 T7로부터 분리된 여러 DNA 리가제 및 RNA 리가제가 지난 수십 년 내에 분리되고 특성규명되었다(문헌[Dunn, J. J., et al., J. Mal. Biol., 148:303-30 (1981); Armstrong, J., et al., Nucleic Acids Res., 11:.7145-56 (1983); 및 Schmitt, M. P., et al., J. Mal. Biol., vol.193:479-95 (1987)]). 플라스미드 또는 올리고뉴클레오티드를 사용한 시험관 내 실험에서 T4 핵산 리가제가 다양한 효율 및 기질 특이성으로 이중-가닥 핵산에서 닉(nick)을 연결하는 것으로 밝혀졌다(문헌[Bullard, D. R., & Bowater, R. P,. Direct comparison of nick-joining activity of the nucleic acid ligases from bacteriophage T4, The Biochemical Journal, 2006, 398(1), 135-144] 참조). 연구는 T4 RNA(T4RnL) 리가제 및 T4 DNA(T4DnL) 리가제가 다양한 DNA-RNA 하이브리드를 라이게이션시킬 수 있음을 입증하였다. 백시니아 바이러스 또는 진핵생물 L 세포로부터 분리된 DNA 리가제는 DNA-RNA 하이브리드에서 닉을 밀봉하는 것으로 보고되었다(문헌[Sekiguchi, J. and Shuman, S., Ligation of RNA-containing duplexes by Vaccinia DNA ligase, Biochemistry, 1997, vol. 36, 9073-9079 및 Bedows, E. et al., L cell DNA ligase joins RNA to DNA on a DNA template, Biochemistry, 1997, vol. 16, no. 10, 2231-2235] 참조).
그러나, 라이게이션 접합부에 걸쳐 있는 상보적 DNA 분자의 존재 하에 DNA 분자를 RNA 분자의 5' 말단에 고효율로 라이게이션하는 것은 지금까지 문헌에 설명되어 있지 않다(예를 들어, 문헌[Bullard and Bowater, 2006, Sekiguchi and Shuman, 1997 및 Bedows et al., 1977] 참조).
재조합 DNA 기술에 사용하기에 적합한 여러 핵산 리가제의 존재에도 불구하고, 독특한 기질 특이적 라이게이션 특성을 갖는 추가의 고효율 리가제가 항상 필요하다.
본 발명자는 라이게이션 접합부에 걸쳐 있는 상보성 단일 가닥 DNA 주형의 존재 하에 단일 가닥 DNA 분자를 RNA 분자의 5' 말단에 고효율로 라이게이션시킬 수 있는 것으로 생화학적 특성규명에 의해 밝혀진 박테리오파지로부터 분리된 ATP-의존성 DNA 리가제의 새로운 패밀리의 클로닝 및 재조합 발현 및 분리에 의해 상기 언급된 요구를 해결하였다.
본 발명에 따른 리가제는 상기 설명된 독특한 기질 특이성에 더하여 또한 라이게이션 접합부에 걸쳐 있는 상보적 단일 가닥 DNA 주형의 존재 하에 단일 가닥 DNA 분자를 RNA 분자의 3' 말단에 고효율로 라이게이션시키는 능력을 갖는다.
제1 양태에 따르면, 본 발명은 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 제공하며, 여기서 DNA 리가제는 SEQ ID No. 1의 아미노산 서열을 포함하거나 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 SEQ ID No. 1과 적어도 75% 동일한 아미노산 서열을 포함한다.
제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 SEQ ID No. 1과 적어도 80%, 85%, 90%, 93% 또는 95%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
제1 양태의 일 추가 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 1을 갖는 아미노산 서열로 구성된다. 이의 효소적으로 활성인 단편이 또한 제공되며, 여기서 DNA 리가제 단편은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
제1 양태의 일 추가 구현예에서, SEQ ID No. 1과 적어도 70% 동일한 아미노산 서열을 갖는 분리된 ATP-의존성 DNA 리가제는 파지, 바람직하게는, 크로노박터 파지, 펙토박테리움 파지 또는 아시네토박터 파지로부터 분리된 DNA 리가제이다.
본 발명에 따른 또 다른 구현예에서, SEQ ID No. 1(L13)과 적어도 70% 동일한 아미노산 서열을 포함하는 ATP 의존성 DNA 리가제는 SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16을 갖는 DNA 리가제 중 임의의 것으로부터 선택된다.
일 추가 양태에서, ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편이 제공되며, 여기서 상기 DNA 리가제는,
(a) SEQ ID No. 1 또는 이와 적어도 80% 동일한 아미노산 서열,
(b) SEQ ID No. 7 또는 이와 적어도 80% 동일한 아미노산 서열,
(c) SEQ ID No. 10 또는 이와 적어도 80% 동일한 아미노산 서열, 또는
(d) SEQ ID No. 16 또는 이와 적어도 80% 동일한 아미노산 서열로부터 선택된 아미노산 서열을 가지며,
여기서, DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
본 발명의 이러한 양태의 바람직한 구현예에서, ATP-의존성 DNA 리가제는 SEQ ID NOs.1, 7, 10 또는 16과 적어도 85%, 90% 또는 95%, 예를 들어, 적어도 98% 또는 99% 또는 99.5% 동일한 아미노산 서열을 갖는다.
제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편으로서, 여기서 상기 DNA 리가제는 SEQ ID No. 1, SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16 중 어느 하나로부터 선택된 아미노산 서열을 갖는다.
제1 양태의 일 구현예에서, His-태그를 포함하는 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편으로서, 여기서 상기 DNA 리가제는 SEQ ID No. 2, SEQ ID No. 8, SEQ ID No. 11 및 SEQ ID No. 17 중 어느 하나로부터 선택된 아미노산 서열을 갖는다.
제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 1 또는 SEQ ID No. 2의 아미노산 서열을 갖는다.
제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 7 또는 SEQ ID No. 8의 아미노산 서열을 갖는다.
제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 10 또는 SEQ ID No. 11의 아미노산 서열을 갖는다.
제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 16 또는 SEQ ID No. 17의 아미노산 서열을 갖는다.
제1 양태의 일 구현예에 따르면, ATP-의존성 DNA 리가제는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질 상에 라이게이션된 생성물을 제공하는 전환율을 제공하는 리가제이고, 여기서 상기 이중-가닥 핵산 분자는 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산을 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체로 포함하고, 여기서 상기 전환율은 적어도 0.02, 적어도 0.03, 적어도 0.04, 적어도 0.05 또는 적어도 0.1이고, 여기서 상기 전환율은 ATP, Mg2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
제1 양태의 일 구현예에 따르면, ATP-의존성 DNA 리가제는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질 상에 라이게이션된 생성물을 제공하는 전환율을 제공하는 리가제이고, 여기서 상기 이중-가닥 핵산 분자는 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산을 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체로 포함하고, 여기서 상기 전환은 적어도 0.15, 적어도 0.2, 적어도 0.3, 적어도 0.4, 적어도 0.5, 적어도 0.8, 적어도 1.0, 적어도 1.5이고, 여기서 상기 전환율은 ATP, Mn2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
제1 양태의 일 구현예에서, ATP-의존성 DNA 리가제는 테트라펩티드 모티프 KXaaDG를 포함하고, 여기서 Xaa는 지방족 및 비극성 아미노산이고, 테트라펩티드 모티프는 아미노산 위치 159 내지 162에 상응하며, 넘버링은 SEQ ID No. 1의 아미노산 넘버링에 따른다.
일 추가 구현예에서, 지방족 및 비극성 아미노산 잔기는 메티오닌, 이소류신, 류신, 발린, 류신, 알라닌 및 글리신으로 구성된 군으로부터 선택된다.
또 다른 추가의 구현예에서, 지방족 및 비극성 아미노산 잔기는 메티오닌이다.
제1 양태의 또 다른 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 박테리오파지로부터 유래된다.
본 발명의 제2 양태에서, 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 인코딩하거나 상기 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 단백질을 인코딩하는 재조합 핵산 분자가 제공된다.
제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 3의 핵산 분자 또는 SEQ ID No. 3의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.
제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 9의 핵산 분자 또는 SEQ ID No. 9의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.
제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 18의 핵산 분자 또는 SEQ ID No. 18의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.
제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.
제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 축퇴된 버전을 포함하거나 이로 구성된다.
본 발명의 제3 양태에서, 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자를 포함하거나 제2 양태에 따른 재조합 핵산 분자를 포함하는 벡터가 제공되고, 여기서 벡터는 재조합 발현 벡터, 클로닝 벡터, 플라스미드, 바이러스 벡터, 코스미드, 람다 파지 또는 박테리아 인공 염색체이다.
제3 양태의 일 구현예에서,
a) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1의 아미노산 서열 또는 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는, 핵산 분자, 또는
b) a)에서 ATP-의존성 DNA 리가제를 인코딩하는 SEQ ID No. 3의 핵산 분자 또는 SEQ ID No. 3의 코돈-최적화된 핵산 서열을 포함하는 핵산 분자를 포함하거나 이로 구성된 벡터가 제공되며,
c) 여기서, a) 또는 b)에서 ATP-의존성 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
제3 양태의 일 구현예에서,
a) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1의 아미노산 서열 또는 SEQ ID No. 1과 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는, 핵산 분자, 또는
b) a)에서 ATP-의존성 DNA 리가제를 인코딩하는 SEQ ID No. 3의 핵산 분자 또는 SEQ ID No. 3의 코돈-최적화된 핵산 서열을 포함하는 핵산 분자를 포함하거나 이로 구성된 벡터가 제공되며,
c) 여기서, a) 또는 b)에서 ATP-의존성 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
제3 양태의 일 구현예에서,
a) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1, SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16 중 어느 하나로부터 선택된 아미노산 서열을 갖는, 핵산 분자, 또는
b) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1 또는 이와 적어도 80% 동일한 아미노산 서열, SEQ ID No. 7 또는 이와 적어도 80% 동일한 아미노산 서열, SEQ ID No. 10 또는 이와 적어도 80% 동일한 아미노산 서열, 또는 SEQ ID No. 16 또는 이와 적어도 80% 동일한 아미노산 서열로부터 선택된 아미노산 서열을 갖는, 핵산 분자, 또는
c) a)에서 ATP-의존성 DNA 리가제를 인코딩하는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 코돈-최적화된 핵산 서열을 포함하는 핵산 분자를 포함하거나 이로 구성된 벡터가 제공되며,
d) 여기서, a) 또는 b)에서 ATP-의존성 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
제3 양태의 일 구현예에서, 벡터는 재조합 발현 벡터, 클로닝 벡터, 플라스미드, 바이러스 벡터, 코스미드, 람다 파지 또는 박테리아 인공 염색체이다.
제3 양태의 일 구현예에서, 벡터는 재조합 발현 벡터이다.
제3 양태의 일 구현예에서, 벡터는 바람직하게는 플라스미드이다.
본 발명의 제4 양태에서, 제3 양태에 따른 벡터를 포함하는 숙주 세포가 제공되며, 여기서 숙주 세포는 효모 세포, 곤충 세포, 인간 세포주 또는 박테리아 세포이다.
제4 양태의 일 구현예에서, 박테리아 세포는 바람직하게는 E. 콜리이다.
본 발명의 제5 양태에서,
a) 제1 양태 및 이의 구현예에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편의 발현에 적합한 조건하에서 제4 양태에 따른 숙주 세포를 배양하는 단계; 및
b) 숙주 세포 또는 배양 배지 또는 상층액으로부터 DNA 리가제 또는 이의 효소적으로 활성인 단편을 분리하는 단계를 포함하는 제1 양태 및 이의 구현예에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편의 분리 및 정제를 위한 방법이 제공된다.
본 발명의 제6 양태에서, 제1 양태에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 조성물이 제공된다.
제6 양태의 일 구현예에서, 조성물은 완충액을 추가로 포함한다.
완충액은 일 구현예에서 ATP 및 Mg2+ 또는 Mn2+를 포함하는 완충액일 수 있다.
완충액은 일 구현예에서 ATP 및 MgCl2 또는 MnCl2를 포함하는 완충액일 수 있다.
완충액은 일 구현예에서 본 발명에 따른 ATP-의존성 DNA 리가제를 저장하기에 적합한 완충액일 수 있고, 여기서 완충액은 Tris-HCl, KCl, Mg2+, BSA 및 글리세롤을 포함한다.
제6 양태의 일 구현예에서, 조성물은 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 적어도 하나의 5' 포스포릴-리보핵산 분자 및 적어도 하나의 제2 상보적 데옥시리보핵산 분자를 추가로 포함하고, 여기서 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 적어도 하나의 5' 포스포릴-리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
제6 양태의 일 구현예에서, 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자는 비드 상에 고정되거나, 포획 표지, 바람직하게는 비오틴 또는 유도체화된 뉴클레오티드, 예를 들어, 염료, 바람직하게는 형광 염료를 추가로 포함하고, 여기서 비드, 포획 표지 또는 유도체화된 뉴클레오티드는 상기 제1 데옥시리보핵산 분자의 5' 말단에 부착된다.
제6 양태의 일 구현예에서, 조성물은 ATP를 포함하는 라이게이션 완충액을 추가로 포함한다.
일 추가 구현예에서, 라이게이션 완충액의 ATP의 농도는 약 0.01 mM 내지 약 10 mM ATP, 바람직하게는 약 0.05 mM 내지 약 2.5 mM ATP이다.
일 추가 구현예에서, 라이게이션 완충액은 2가 양이온을 포함한다.
일 추가 구현예에서, 라이게이션 완충액의 2가 양이온은, 예를 들어, MgCl2 또는 MnCl2 형태의 Mg2+ 또는 Mn2+이고, 여기서 Mg2+ 또는 Mn2+의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.
일 추가 구현예에서, 라이게이션 완충액의 2가 양이온은, 예를 들어, MgCl2 형태의 Mg2+이고, 여기서 Mg2+의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.
일 추가 구현예에서, 라이게이션 완충액의 2가 양이온은, 예를 들어, MnCl2 형태의 Mn2+이고, 여기서 Mn2+의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.
일 추가 구현예에서, 라이게이션 완충액은 약 0.01 mM 내지 약 10 mM ATP 및 바람직하게는 약 0.05 mM 내지 약 2.5 mM ATP의 농도의 ATP 및, 예를 들어, MgCl2 형태의 Mg2+를 포함하고, 여기서 Mg2+의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.
일 추가 구현예에서, 라이게이션 완충액은 약 0.01 mM 내지 약 10 mM ATP 및 바람직하게는 약 0.05 mM 내지 약 2.5 mM ATP의 농도의 ATP 및, 예를 들어, MnCl2 형태의 Mn2+를 포함하고, 여기서 Mn2+의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.
본 발명의 제7 양태에서,
a. 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편 또는 제6 양태에 따른 ATP-의존성 DNA 리가제를 포함하는 조성물을 포함하는 제1 용기;
b. ATP 및 2가 양이온을 포함하는 라이게이션 완충액을 포함하는 제2 용기;
c. 선택적으로 5' 포스포릴-리보핵산 분자의 5' 말단에 라이게이션될 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제3 용기로서, 여기서 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 여기서 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 여기서 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재하는, 제3 용기; 및
d. 선택적으로, 키트를 사용하기 위한 설명서를 포함하는 리보핵산 분자의 말단에 데옥시리보핵산 분자를 라이게이션시키기 위한 키트가 제공된다.
제7 양태의 일 구현예에서, 키트는 3'-하이드록실-리보핵산 분자의 3' 말단에 라이게이션될 적어도 하나의 제1 5'-포스포릴-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제4 용기를 포함하며, 여기서 적어도 하나의 제2 데옥시리보핵산 분자는 3' 영역 및 5' 영역을 포함하고, 여기서 5' 영역은 제1 데옥시리보핵산 분자에 상보적이고, 3' 영역은 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 3' 영역은 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 여기서 제1 5'-포스포릴-데옥시리보핵산 및 제2 데옥시리보핵산 분자는 사전 하이브리드화된 복합체 형태로 존재할 수 있다.
일 구현예에서, 라이게이션 완충액의 ATP 및 2가 양이온의 농도는 약 0.01mM 내지 약 10mM ATP 및 바람직하게는 약 0.05mM 내지 약 2.5mM ATP이고, 2가 양이온은, 예를 들어, MgCl2 또는 MnCl2의 형태의 Mg2+ 또는 Mn2+이고, 여기서 Mg2+ 또는 Mn2+의 농도는 약 1mM 내지 약 20mM, 바람직하게는 약 5mM 내지 약 10mM이다. 바람직하게는, 2가 양이온은 MnCl2 형태의 Mn2+이다.
본 발명의 추가 양태에서, 이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법이 제공되고, 여기서 상기 방법은 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제6 양태에 따른 조성물과 접촉시키는 것을 포함한다.
본 발명의 제8 양태에서, 이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법이 제공되며, 여기서 상기 방법은 이중-가닥 핵산 분자에서 5'-포스포릴 리보핵산 분자의 5' 말단에 대한 3'-하이드록실-데옥시리보핵산 분자의 라이게이션을 허용하는 조건 하에 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1 양태 및 이의 구현예에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편과 접촉시키는 것을 포함하고, 여기서 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루고 있다.
상기 방법에 따른 일 구현예에서, 3'-하이드록실-데옥시리보핵산 분자는 비드 상에 고정되거나, 포획 표지, 바람직하게는 비오틴 또는 유도체화된 뉴클레오티드, 예를 들어, 염료, 바람직하게는 형광 염료를 추가로 포함하고, 여기서 비드, 포획 표지 또는 유도체화된 뉴클레오티드는 상기 3'-하이드록실-데옥시리보핵산 분자의 5' 말단에 연결된다.
상기 방법에 따른 일 구현예에서, 리보핵산(RNA) 분자는 메신저 RNA(mRNA), 리보솜 RNA(rRNA), 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA), 반복 연관 siRNA(rasiRNA)를 포함하는 군으로부터 선택된 RNA 분자이다.
상기 방법에 따른 일 구현예에서, ATP 및 2가 양이온을 포함하는 라이게이션 완충액를 첨가하는 것을 추가로 포함한다.
상기 방법에 따른 일 추가 구현예에서, ATP의 농도는 약 0.01mM 내지 약 10mM 및 바람직하게는 약 0.05mM 내지 약 2.5mM이고, 여기서 2가 양이온은, 예를 들어, MgCl2 또는 MnCl2의 형태의 Mg2+ 또는 Mn2+이고, 여기서 Mg2+ 또는 Mn2+의 농도는 약 1mM 내지 약 20mM, 바람직하게는 약 5mM 내지 약 10mM이다. 바람직하게는, 2가 양이온은 MnCl2 형태의 Mn2+이다.
상기 방법에 따른 일 구현예에서, 핵산 단편의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 라이게이션을 달성하기 위해 6시간 미만 내에, 예를 들어, 1시간 미만 내에, 예를 들어, 45분 미만 내에 또는 바람직하게는 30분 내에, 더욱 바람직하게는 15분 내에 ATP 의존성 DNA 리가제를 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자와 함께 인큐베이션하는 것을 추가로 포함한다.
상기 방법에 따른 일 구현예에서, 상기 방법은 시험관 내 전사의 목적을 위한 RNA 분자의 5' 말단에 프로모터 요소 및/또는 번역 인핸서 요소를 포함하는 cDNA 분자 합성에서 주형으로 작용하는 DNA 요소의 라이게이션인, 공지된 또는 공지되지 않은 서열의 RNA 분자를 포획하기 위한 RNA 5'-말단 어댑터 라이게이션에 사용된다.
본 발명의 제9 양태는 시험관 내 전사의 목적을 위한 RNA 분자의 5' 말단에 프로모터 요소 및/또는 번역 인핸서 요소를 포함하는 cDNA 분자 합성에서 주형으로 작용하는 DNA 요소의 라이게이션인, 공지된 또는 공지되지 않은 서열의 RNA 분자를 포획하기 위한 RNA 5'-말단 어댑터 라이게이션을 위한 제1 양태에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제6 양태에 따른 ATP-의존성 DNA 리가제를 포함하는 조성물의 용도를 제공한다.
본 발명의 제10 양태에서, 데옥시리보핵산 분자를 리보핵산 분자의 5' 말단 및 3' 말단에 라이게이션시키기 위한 방법이 제공되며, 상기 방법은,
a. 리보핵산 분자의 집단을 포함하는 샘플을 제공하는 단계로서, 여기서 리보핵산 분자 중 하나 이상이 5' 포스포릴-말단 기 및 3'-하이드록실-말단 기를 포함하는, 단계;
b. 적어도 하나의 제2 데옥시리보핵산의 존재 하에 리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시키는 단계로서, 여기서 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 여기서 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 여기서 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 단계; 및
c. 3' 영역 및 5' 영역을 포함하는 적어도 하나의 추가의 제2 데옥시리보핵산의 존재 하에 적어도 하나의 다른 5' 포스포릴-데옥시리보핵산 분자를 단계 b의 리보핵산 분자의 3'-말단에 라이게이션시키는 단계로서, 여기서 5' 영역이 5' 포스포릴-데옥시리보핵산 분자에 상보적이고, 3' 영역이 단계 b에서 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나, 3' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합시키기 위해 축퇴된 서열이고, 여기서 5' 포스포릴-데옥시리보핵산 및 추가의 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태일 수 있는, 단계를 포함하며;
여기서, 단계 b 및 c의 라이게이션 반응은 제1 양태에 따른 ATP-의존성 리가제에 의해 촉매작용되고, 단계 b 및 c의 라이게이션 반응은 동시에 또는 순차적으로 수행된다.
제10 양태의 일 구현예에서, 샘플은 ATP 및 2가 양이온, 바람직하게는 Mn2+ 또는 Mg2+를 추가로 포함한다.
본 발명의 추가 양태는 RNA 라이브러리 작제에서 제10 양태의 방법의 용도를 제공한다.
도 1: 본 발명의 T4 DNA 리가제 및 L13 리가제의 아미노산 서열을 비교하는 서열 정렬.
도 2a-c: 상이한 박테리오파지로부터 유래된 본 발명에 따른 DNA 리가제의 다중 서열 정렬. 모든 서열은 지금까지 확인된 모든 리가제에 대한 공통 모티프인 KXDG 아데닐화 부위를 포함한다.
도 3a: 문헌[Bullard and Bowater, 2006]에 설명된 실험 설정에 기반한 리가제 활성을 측정하기 위한 일반적인 실험 설정을 예시한다.
도 3b: 다른 공지된 리가제와 비교한 AZ L13의 기질 특이성. 리가제 AZ L13 및 상업적 기준 효소(AZ T4 DNA 리가제(ArcticZymes), T4 Rnl 1(NEB), T4 Rnl 2(NEB), T3 DNA 리가제(NEB), T7 DNA 리가제(NEB))의 효소 활성을 시험하기 위해 8개의 상이한 닉킹된 기질 세트를 사용하였다. 사용된 기질은 각각 데옥시리보핵산(DNA) 올리고 단독(기질 S1), 리보핵산(RNA) 올리고 단독(기질 S2) 또는 데옥시리보핵산(DNA) 올리고 및 리보핵산(RNA) 올리고의 혼합물(기질 S3 내지 S8)로 구성될 수 있는 3개의 올리고의 어셈블리이다. 양성 리가제 활성은 도 1b에 도시된 바와 같이 형광 표지된 핵산 올리고의 길이를 증가시킨다. 밴드는 라이게이션되지 않은 단일-가닥 8-mer 올리고뉴클레오티드 생성물인 하부 밴드 및 라이게이션된 단일-가닥 20-mer 올리고뉴클레오티드 생성물인 상부 밴드로 표시된다.
도 4: DNA 올리고가 본 발명의 ATP-의존성 DNA L13 리가제 효소를 사용하여 DNA 라이게이션 주형의 존재 하에 RNA의 5'-말단에 라이게이션되는 본 발명의 양태를 도시하며, 여기서 DNA 주형 서열은 반-축퇴성이어서 서열의 혼합물을 포함한다. 여기서, 반-축퇴된 DNA 주형의 한 영역은 제1 DNA 올리고에 상보적이고, 다른 영역은 공지되지 않은 서열의 RNA 분자를 포획하거나 상이한 대립유전자로부터의 RNA 분자를 포획하기 위해 상이한 5-모노포스포릴화 RNA 올리고에 대한 비특이적 하이브리드화를 위한 하나 이상의 축퇴된 뉴클레오티드를 포함하고, 여기서, RNA 올리고 내의 일부 뉴클레오티드 위치는 상이한 대립유전자에서 상이하다. 대립유전자는 동일한 유전자를 나타내는 유전자 변이체이다. N은 A, C, G 또는 T를 나타낸다.
도 5: RNA 분자의 푸울이 모노포스포릴화된 RNA 분자 및 5'-변형, 예를 들어, 5' 캡 또는 삼중 포스페이트 기를 포함하는 RNA 분자의 혼합물을 포함하는 도 4에 설명된 양태의 구현예를 도시한다. 5' 변형을 포함하는 RNA 분자는 라이게이션에서 제외될 것이다.
도 6: 모노포스포릴화된 RNA 분자에 라이게이션될 DNA 분자가 본 도면에서 비오틴 태그로 예시된 5' 태그를 포함하는 도 4에 설명된 본 발명의 양태의 대안적 구현예를 도시한다. 포획은, 예를 들어, 컬럼 또는 자성 비드에 커플링된 비오틴 태그 및 스트렙타비딘을 사용하여 수행될 수 있다.
도 7: 방법이 특정 mRNA 종을 포획하는 도 4에 설명된 본 발명의 양태의 대안적인 구현예를 도시한다. 상기 설명된 바와 같이, mRNA의 5'-모노포스포릴화된 말단에만 DNA 올리고의 선택적 라이게이션이 존재한다. mRNA는 일반적으로 캡핑되고 인산화되지 않아 설명된 L13 리가제를 사용한 라이게이션을 방지할 것이다. 포스파타제에 의한 모든 5'-포스페이트 함유 RNA 종의 탈인산화 및 이후 mRNA의 탈-캡핑은 DNA의 3'-말단에 대한 라이게이션을 위한 mRNA 5'-말단을 제조할 것이다. 포획은 비오틴 태그 및 스트렙타비딘을 사용하여 수행될 수 있다.
도 8: 직접 세포 유리 ivTT(시험관 내 전사-번역)에서 사용하기 위해 프로모터가 탈-캡핑된 mRNA에 태깅되는 본 발명의 양태의 대안적인 구현예를 예시한다. 도 4에 설명된 바와 같은 비특이적 하이브리드화를 위해 축퇴된 영역을 갖는 DNA 주형을 사용한 mRNA의 5'-모노포스포릴화된 말단에서의 DNA 올리고의 선택적 라이게이션. 비-mRNA RNA 종의 탈인산화 및 mRNA의 탈-캡핑. 5'-인산화된 mRNA는 축퇴된 영역 및 프로모터 서열을 함유하는 5'-DNA 어댑터로 태깅될 것이다. 제1 가닥 cDNA 합성은 cDNA가 시험관 내 전사/번역 기술에서 직접 사용될 수 있도록 하는 RNA 중합효소 결합 부위를 포함하는 mRNA의 RNA 중합효소-판독가능한 카피를 야기할 것이다.
도 9a: 본 발명에 따른 ATP-의존성 DNA 리가제(AZ L13)의 야생형 아미노산 서열 SEQ ID No 1.
도 9b: 본 발명에 따른 ATP-의존성 DNA 리가제(AZ L13)의 His-태깅된 아미노산 서열 SEQ ID No 2.
도 9c: 도 9a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 3).
도 10a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel1)의 아미노산 서열 SEQ ID No 7.
도 10b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel1)의 His-태깅된 아미노산 서열 SEQ ID No 8.
도 10c: 도 10a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 9).
도 11a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel2)의 아미노산 서열 SEQ ID No 10.
도 11b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel2)의 His-태깅된 아미노산 서열 SEQ ID No 11.
도 11c: 도 11a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 12).
도 12a: ATP-의존성 DNA 리가제(L13rel3)의 아미노산 서열 SEQ ID No 13.
도 12b: 도 12a의 ATP-의존성 DNA 리가제(L13rel3)의 His-태깅된 아미노산 서열 SEQ ID No 14.
도 12c: 도 12a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 15).
도 13a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel4)의 아미노산 서열 SEQ ID No 16.
도 13b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel4)의 His-태깅된 아미노산 서열 SEQ ID No 17.
도 13b: 도 13a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 18).
도 14a-b: 백시니아 DNA 리가제 및 본 발명의 L13 리가제의 아미노산 서열을 비교하는 서열 정렬.
도 2a-c: 상이한 박테리오파지로부터 유래된 본 발명에 따른 DNA 리가제의 다중 서열 정렬. 모든 서열은 지금까지 확인된 모든 리가제에 대한 공통 모티프인 KXDG 아데닐화 부위를 포함한다.
도 3a: 문헌[Bullard and Bowater, 2006]에 설명된 실험 설정에 기반한 리가제 활성을 측정하기 위한 일반적인 실험 설정을 예시한다.
도 3b: 다른 공지된 리가제와 비교한 AZ L13의 기질 특이성. 리가제 AZ L13 및 상업적 기준 효소(AZ T4 DNA 리가제(ArcticZymes), T4 Rnl 1(NEB), T4 Rnl 2(NEB), T3 DNA 리가제(NEB), T7 DNA 리가제(NEB))의 효소 활성을 시험하기 위해 8개의 상이한 닉킹된 기질 세트를 사용하였다. 사용된 기질은 각각 데옥시리보핵산(DNA) 올리고 단독(기질 S1), 리보핵산(RNA) 올리고 단독(기질 S2) 또는 데옥시리보핵산(DNA) 올리고 및 리보핵산(RNA) 올리고의 혼합물(기질 S3 내지 S8)로 구성될 수 있는 3개의 올리고의 어셈블리이다. 양성 리가제 활성은 도 1b에 도시된 바와 같이 형광 표지된 핵산 올리고의 길이를 증가시킨다. 밴드는 라이게이션되지 않은 단일-가닥 8-mer 올리고뉴클레오티드 생성물인 하부 밴드 및 라이게이션된 단일-가닥 20-mer 올리고뉴클레오티드 생성물인 상부 밴드로 표시된다.
도 4: DNA 올리고가 본 발명의 ATP-의존성 DNA L13 리가제 효소를 사용하여 DNA 라이게이션 주형의 존재 하에 RNA의 5'-말단에 라이게이션되는 본 발명의 양태를 도시하며, 여기서 DNA 주형 서열은 반-축퇴성이어서 서열의 혼합물을 포함한다. 여기서, 반-축퇴된 DNA 주형의 한 영역은 제1 DNA 올리고에 상보적이고, 다른 영역은 공지되지 않은 서열의 RNA 분자를 포획하거나 상이한 대립유전자로부터의 RNA 분자를 포획하기 위해 상이한 5-모노포스포릴화 RNA 올리고에 대한 비특이적 하이브리드화를 위한 하나 이상의 축퇴된 뉴클레오티드를 포함하고, 여기서, RNA 올리고 내의 일부 뉴클레오티드 위치는 상이한 대립유전자에서 상이하다. 대립유전자는 동일한 유전자를 나타내는 유전자 변이체이다. N은 A, C, G 또는 T를 나타낸다.
도 5: RNA 분자의 푸울이 모노포스포릴화된 RNA 분자 및 5'-변형, 예를 들어, 5' 캡 또는 삼중 포스페이트 기를 포함하는 RNA 분자의 혼합물을 포함하는 도 4에 설명된 양태의 구현예를 도시한다. 5' 변형을 포함하는 RNA 분자는 라이게이션에서 제외될 것이다.
도 6: 모노포스포릴화된 RNA 분자에 라이게이션될 DNA 분자가 본 도면에서 비오틴 태그로 예시된 5' 태그를 포함하는 도 4에 설명된 본 발명의 양태의 대안적 구현예를 도시한다. 포획은, 예를 들어, 컬럼 또는 자성 비드에 커플링된 비오틴 태그 및 스트렙타비딘을 사용하여 수행될 수 있다.
도 7: 방법이 특정 mRNA 종을 포획하는 도 4에 설명된 본 발명의 양태의 대안적인 구현예를 도시한다. 상기 설명된 바와 같이, mRNA의 5'-모노포스포릴화된 말단에만 DNA 올리고의 선택적 라이게이션이 존재한다. mRNA는 일반적으로 캡핑되고 인산화되지 않아 설명된 L13 리가제를 사용한 라이게이션을 방지할 것이다. 포스파타제에 의한 모든 5'-포스페이트 함유 RNA 종의 탈인산화 및 이후 mRNA의 탈-캡핑은 DNA의 3'-말단에 대한 라이게이션을 위한 mRNA 5'-말단을 제조할 것이다. 포획은 비오틴 태그 및 스트렙타비딘을 사용하여 수행될 수 있다.
도 8: 직접 세포 유리 ivTT(시험관 내 전사-번역)에서 사용하기 위해 프로모터가 탈-캡핑된 mRNA에 태깅되는 본 발명의 양태의 대안적인 구현예를 예시한다. 도 4에 설명된 바와 같은 비특이적 하이브리드화를 위해 축퇴된 영역을 갖는 DNA 주형을 사용한 mRNA의 5'-모노포스포릴화된 말단에서의 DNA 올리고의 선택적 라이게이션. 비-mRNA RNA 종의 탈인산화 및 mRNA의 탈-캡핑. 5'-인산화된 mRNA는 축퇴된 영역 및 프로모터 서열을 함유하는 5'-DNA 어댑터로 태깅될 것이다. 제1 가닥 cDNA 합성은 cDNA가 시험관 내 전사/번역 기술에서 직접 사용될 수 있도록 하는 RNA 중합효소 결합 부위를 포함하는 mRNA의 RNA 중합효소-판독가능한 카피를 야기할 것이다.
도 9a: 본 발명에 따른 ATP-의존성 DNA 리가제(AZ L13)의 야생형 아미노산 서열 SEQ ID No 1.
도 9b: 본 발명에 따른 ATP-의존성 DNA 리가제(AZ L13)의 His-태깅된 아미노산 서열 SEQ ID No 2.
도 9c: 도 9a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 3).
도 10a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel1)의 아미노산 서열 SEQ ID No 7.
도 10b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel1)의 His-태깅된 아미노산 서열 SEQ ID No 8.
도 10c: 도 10a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 9).
도 11a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel2)의 아미노산 서열 SEQ ID No 10.
도 11b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel2)의 His-태깅된 아미노산 서열 SEQ ID No 11.
도 11c: 도 11a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 12).
도 12a: ATP-의존성 DNA 리가제(L13rel3)의 아미노산 서열 SEQ ID No 13.
도 12b: 도 12a의 ATP-의존성 DNA 리가제(L13rel3)의 His-태깅된 아미노산 서열 SEQ ID No 14.
도 12c: 도 12a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 15).
도 13a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel4)의 아미노산 서열 SEQ ID No 16.
도 13b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel4)의 His-태깅된 아미노산 서열 SEQ ID No 17.
도 13b: 도 13a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 18).
도 14a-b: 백시니아 DNA 리가제 및 본 발명의 L13 리가제의 아미노산 서열을 비교하는 서열 정렬.
하기 설명에서, 당업자에게 본 발명의 보다 완전한 이해를 제공하기 위해 본 발명의 다양한 실시예 및 구현예가 제시된다. 다양한 구현예의 맥락에서 그리고 첨부된 도면을 참조하여 설명된 특정 세부사항은 제한으로 해석되도록 의도되지 않는다.
달리 구체적으로 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 유전학, 생화학, 및 분자생물학 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
상기 언급된 바와 같이, 본 발명자는 라이게이션 접합부에 걸쳐 있는 상보적 제2 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5' 말단에 라이게이션될 제1 3'-하이드록실-데옥시리보핵산 분자를 포함하는 이중 가닥 핵산 복합체 내의 단일 가닥 파손을 라이게이션시키는 능력을 갖는 신규한 ATP-의존성 DNA 리가제(L13)를 확인하였다(예시를 위해 도 3a 참조).
본 발명자는 또한 박테리오파지로부터 원래 분리된 추가의 DNA 리가제를 확인하였고, 여기서 추가의 DNA 리가제는 SEQ ID No. 1을 갖는 L13 리가제의 아미노산 서열과 적어도 70%, 예를 들어, 적어도 75% 동일한 아미노산 서열을 갖고, 여기서 추가의 DNA 리가제는 L13과 유사한 효소 활성 및 기질 특이성을 갖는다.
추가의 DNA 리가제는 SEQ ID No. 7의 아미노산 서열 및 SEQ ID No. 9의 cDNA 서열을 갖는 L13rel1이다.
추가의 DNA 리가제는 SEQ ID No. 10 SEQ ID No. 12의 아미노산 서열을 갖는 L13rel2이다.
추가의 DNA 리가제는 SEQ ID No. 16 SEQ ID No. 18의 아미노산 서열을 갖는 L13rel4이다.
본 발명에 따른 리가제는 상기 설명된 독특한 기질 특이성에 더하여 또한 라이게이션 접합부에 걸쳐 있는 상보적 제2 데옥시리보핵산 분자의 존재 하에 3'-하이드록실 말단-기를 포함하는 RNA 분자의 3' 말단에 라이게이션될 5' 포스포릴 말단-기를 포함하는 제1 DNA 분자를 포함하는 이중 가닥 핵산 복합체에서 단일-가닥 파손을 고효율로 라이게이션시키는 능력을 갖는다.
제2 데옥시리보핵산과 함께 라이게이션 반응에 사용되는 제1 3'-하이드록실-데옥시리보핵산 분자, 5' 포스포릴-리보핵산 분자 또는 이들의 일부는 바람직하게는 단일 가닥이고, 3'-하이드록실-데옥시리보핵산 분자 및 5' 포스포릴-리보핵산 분자는 라이게이션 접합부에 걸쳐 있는 제2 데옥시리보핵산 분자의 적어도 일부에 부분적으로 또는 전체적으로 상보적일 수 있다.
"상보적 핵산 서열이 서로 결합한다"는 사실은 DNA 및 RNA의 특성이다. 상보성은 핵염기: 아데닌(A), 티민(T) 또는 (RNA에서 우라실), 구아닌(G) 및 시토신(C) 사이의 뚜렷한 상호작용에 의해 달성된다.
용어 "3'-하이드록실-데옥시리보핵산 분자"는 이의 3' 말단에 유리 하이드록실 기(OH-기)를 갖는다. 데옥시리보핵산 분자의 뉴클레오티드는 표준 뿐만 아니라 비표준 뉴클레오티드일 수 있다. 비표준 뉴클레오티드의 비제한적인 예는 이노신, 크산토신, 이소-구아노신, 이소-시티딘, 디아미노피리미딘, 및 데옥시-우리딘을 포함한다. 데옥시리보핵산 분자는 변형된 또는 유도체화된 뉴클레오티드를 포함할 수 있다. 데옥시리보스 또는 염기 모이어티에 대한 변형의 비제한적인 예는 아세틸 기, 아미노 기, 카르복실 기, 카르복시메틸 기, 하이드록실 기, 메틸 기, 포스포릴 기, 및 티올 기의 첨가(또는 제거)를 포함한다. 유도체화된 뉴클레오티드의 적합한 예는 공유 부착된 염료, 예를 들어, 형광 염료 또는 켄칭 염료, 또는 다른 분자, 예를 들어, 비오틴, 디곡시게닌, 또는 자성 입자를 갖는 것들을 포함한다(도 6 및 7 참조).
3'-하이드록실-데옥시리보핵산 분자는 이의 5' 말단에서 미세유체 장치 또는 다른 반응 챔버에서 자성 비드, 유리 또는 실리카 기질 또는 표면에 연결될 수 있다. 3'-하이드록실-데옥시리보핵산 분자가 직접적으로 또는 간접적으로 커플링될 수 있는 추가의 고체-상태 기질은 아크릴아미드, 셀룰로스, 니트로셀룰로스, 유리 또는 당업자에게 공지된 다른 널리 공지된 기질을 포함한다.
3'-하이드록실-데옥시리보핵산 분자의 길이는 라이게이션 생성물의 길이 및 이의 요망되는 특징에 따라 달라질 수 있고 달라질 것이다. 일반적으로, 3'-하이드록실-데옥시리보핵산 분자는 실시예 2에 제시된 바와 같이 적어도 약 8개의 뉴클레오티드이지만, 길이가 15개 뉴클레오티드 및 최대 100개 뉴클레오티드의 범위일 수 있다.
RNA의 5' 어댑터 라이게이션
용어 "상보적 제2 데옥시리보핵산 분자" 또는 "상보적 라이게이션 주형"은 라이게이션 반응의 효율을 개선시키기 위해 사용되는 데옥시리보핵산(DNA) 분자로서 이해되어야 한다. 5' 포스포릴-리보핵산 분자의 5'-말단에서 제1 3'-하이드록실-데옥시리보핵산 분자의 라이게이션은 상기 설명된 바와 같이 라이게이션 주형으로도 불리는 이러한 제2 데옥시리보핵산 분자의 존재 하에 수행된다. 이러한 제2 데옥시리보핵산 분자는 리보핵산 분자에 상보적이고 이와 하이브리드화되는 5' 영역 및 제1 데옥시리보핵산 분자에 상보적이고 이와 하이브리드화되는 3' 영역의 2개의 별개의 영역을 포함한다(도 3a 참조).
"상보적 제2 데옥시리보핵산 분자"는 정확한 상보물일 수 있거나 이의 2개의 표적 서열의 거의 정확한 상보물일 수 있다. 라이게이션 주형은 제1 3'-하이드록실-데옥시리보핵산 분자 및 리보핵산 분자 둘 모두에 하이브리드화되기 때문에, 이는 3'-하이드록실-데옥시리보핵산 분자가 5' 포스포릴-리보핵산 분자의 5' 말단에 근접하게 되도록 라이게이션 접합부에 걸쳐 있다. 제2 데옥시리보핵산 분자는 또한 3'-하이드록실-데옥시리보핵산 분자에 대해 설명된 바와 유사한 표준, 비표준, 변형 또는 유도체화된 뉴클레오티드를 포함할 수 있다.
일반적으로, 상보적 제2 데옥시리보핵산 분자는 길이가 적어도 약 10개 뉴클레오티드, 바람직하게는 길이가 적어도 약 20개 뉴클레오티드일 것이며, 라이게이션 주형의 약 절반은 리보핵산 분자에 대해 상보성을 갖고 나머지 절반은 제1 3'-하이드록실-데옥시리보핵산 분자에 대해 상보성을 갖는다. 당업자는 상보적 제2 데옥시리보핵산 분자가, 예를 들어, 적어도 약 25 또는 30 또는 35 또는 40 또는 45 또는 최대 약 100개의 뉴클레오티드가 더 길 수 있음을 이해할 것이다.
추가 구현예에서, 제2 데옥시리보핵산 분자는 RNA의 5' 말단 어댑터 라이게이션에서 사용하기 위한 반-축퇴성 라이게이션 주형일 수 있으며, 이는 제1 3'-하이드록실-데옥시리보핵산 분자와 하이브리드화되는 3' 영역, 및 뉴클레오티드의 무작위 혼합물을 포함하는 축퇴성 5' 영역을 포함하여, 각각의 주형은 상이한 대립유전자로부터의 RNA 집단에서 별개의 RNA와 하이브리드화될 수 있다. 당업자는 축퇴 영역을 포함하는 뉴클레오티드의 수가 가능한 주형 조합의 수, 및 이에 따라 하이브리드화될 수 있는 RNA의 수를 결정한다는 것을 이해할 것이다. 5' RNA 어댑터 라이게이션의 예시 목적을 위해 주형이 반-축퇴된 도 4 내지 8을 참조한다.
RNA의 3' 어댑터 라이게이션
대안적 구현예에서, "상보적 제2 데옥시리보핵산 분자" 또는 "상보적 라이게이션 주형"은 라이게이션 반응의 효율을 개선시키기 위해 사용되는 데옥시리보핵산(DNA) 분자로서 이해되어야 한다. 3' 하이드록실-리보핵산 분자의 3'-말단에서 제1 5'-포스포릴-데옥시리보핵산 분자의 라이게이션은 상기 설명된 바와 같이 라이게이션 주형으로도 불리는 이러한 제2 데옥시리보핵산 분자의 존재 하에 수행된다. 이러한 제2 데옥시리보핵산 분자는 리보핵산 분자에 상보적이고 이와 하이브리드화되는 3' 영역 및 제1 데옥시리보핵산 분자에 상보적이고 이와 하이브리드화되는 5' 영역의 2개의 별개의 영역을 포함한다.
추가 구현예에서, 제2 데옥시리보핵산 분자는 RNA의 3' 말단 어댑터 라이게이션에서 사용하기 위한 반-축퇴성 라이게이션 주형일 수 있으며, 이는 제1 5'-포스포릴-데옥시리보핵산 분자와 하이브리드화되는 5' 영역, 및 뉴클레오티드의 무작위 혼합물을 포함하는 축퇴성 3' 영역을 포함하여, 각각의 주형은 상이한 대립유전자로부터의 RNA 집단에서 별개의 RNA와 하이브리드화될 수 있다. 당업자는 축퇴 영역을 포함하는 뉴클레오티드의 수가 가능한 주형 조합의 수, 및 이에 따라 하이브리드화될 수 있는 RNA의 수를 결정한다는 것을 이해할 것이다. 예시 목적으로, 주형이 반-축퇴된 도 4 내지 8에 도시된 5' RNA 어댑터 라이게이션을 참조한다.
특정 구현예에서, 제1 3'-하이드록실-데옥시리보핵산 분자 또는 5' 포스포릴-데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자는 리보핵산 분자를 포함하는 샘플을 첨가하기 전에 어댑터 분자로서 본원에 설명된 듀플렉스를 형성하기 위해 사전-하이브리드화된다(5' RNA 어댑터 라이게이션의 예시를 위해 도 4 내지 8 참조).
용어 "하이브리드되다"는 이러한 맥락에서 5' 제1 데옥시리보핵산 및 3' 리보핵산의 2개의 단일 가닥 영역에 선택적으로 결합하고 이들이 결합되도록 병치시키기 위해 제2 데옥시리보핵산 상의 상보적 또는 대략 상보적인 염기의 특이적 어닐링에 충분한 당 분야에 공지된 하이브리드화 조건의 선택으로 이해되어야 한다.
ATP-의존성 DNA 리가제는 후보 리가제에 대한 검색에서 메타게노믹 뉴클레오티드 서열 데이터를 포함하는 공개적으로 이용 가능한 UniProt KB 데이터베이스(UniProtKB/Swiss-Prot UniProt release 2015_06)를 마이닝함으로써 본 발명자에 의해 확인되었다. 놀랍게도, 이들은 상기 설명된 독특한 리가제 활성을 갖는 NCBI 등록 번호 및 Locus 식별 번호 YP_009015226.1을 갖는 크로노박터 사카자키이(Cronobacter sakazakii) 박테리오파지 CR9로부터 원래 분리된 본 발명에 따른 ATP-의존성 DNA 리가제를 인코딩하는 서열을 발견하였다. 크로노박터 파지 CR9의 완전한 유전체 서열은 NCBI 등록 번호 JQ691611을 갖는다. YP_009015226.1의 아미노산 서열은 유전체 서열의 개념적 번역에 의해 추정 리가제로서 인식된다(YP_009015226.1에 대한 NCBI 뉴클레오티드 및 단백질 데이터베이스의 서열에 대한 정보 참조). 데이터베이스에 따르면 서열은 확인되지 않았다. 따라서, 본 발명자는 본 발명에 따른 ATP-의존성 리가제에 대한 최적화된 발현 시스템을 최초로 클로닝하고 개발하였다.
상기 언급된 크로노박터 파지 CR9의 기원 국가는 불분명하다. 항목 JQ691611에 대한 NCBI 데이터베이스의 정보에 따르면, 크로노박터 사카자키이 박테리오파지 CR9의 유전체 서열은 서울대학교(1 Gwanak-ro, Gwanak-gu, Seoul 151-921, South Korea)의 식품 동물 생명공학과에 의해 제공되었다.
핵산 분자를 RNA 분자의 5' 말단에 라이게이션하는 능력은 고전적 클로닝 및 깁슨(Gibson) 접근법을 사용한 클로닝(Gibson, D.G. et al., Enzymatic assembly of DNA molecules up to several hundred kilobases, Nature Methods, 2009,vol.6, page 343-345), 라이브러리 제조 동안의 어댑터 라이게이션(예를 들어, illumine, Head, S.R. et al., Library construction for next-generation sequencing: overviews and challenges, Biotechniques, 2014, vo..56, no. 2, p. 1-31), DNA 합성, 라이게이션에 의한 시퀀싱(예를 들어, SOLiD)(Voelkerding, K.V. et al. Next-Generation Sequencing: from basic research to diagnostics, Clinical Chemistry, 2009, vol55, no.4, p.641-658), 리가제 연쇄 반응(J; Czajka, J; Luo, J; Barany, F; Batt, CA (Feb 1994). "Ligase chain reaction (LCR)--overview and applications". PCR Methods and Applications. 3 (4): S51-64), SNP 검출(Etter, P.D. et al., SNP discovery and genotyping for evolutionary genetics using RAD sequencing, Methods Mol. Biol., 2011, vol.772, p.157-178) 및 RNA의 5'-말단 라벨링과 같은 많은 분자생물학 기술에서 바람직하다.
일반적으로, RNA의 5'-어댑터 라이게이션은 5'-RNA 분자를 라이게이션하거나, 예를 들어, T4 RNA 리가제를 사용하여 하이브리드 DNA-RNA 분자를 RNA 분자의 5' 말단에 라이게이션함으로써 수행된다. 그러나, RNA는 분해되기 쉽기 때문에 DNA와 비교하여 RNA로 작업하는 것은 덜 유리하다. 따라서, 일부 맥락에서 DNA 분자를 RNA 분자의 5' 말단에 라이게이션하는 것이 바람직할 수 있다.
또한, 본 발명에 따른 리가제는 상기 설명된 독특한 기질 특이성에 더하여 또한 라이게이션 접합부에 걸쳐 있는 상보적 DNA 주형의 존재 하에 DNA 분자를 RNA 분자의 3' 말단에 고효율로 라이게이션시키는 능력을 갖는다. 따라서, 하나의 효소가 RNA 분자의 5' 말단 및 3' 말단 둘 모두에서 DNA 어댑터 분자를 라이게이션시키는 것을 가능하게 한다.
RNA 분자의 3' 말단 및 5' 말단에서의 어댑터 라이게이션은 단일 단계 또는 별도의 단계로 수행될 수 있다.
따라서, 본 발명에 따른 리가제는 "이중-라이게이션된" RNA 단편(즉, 5' 및 3' 말단 둘 모두에서 라이게이션된 어댑터를 함유하는 RNA 단편)을 필요로 하는 어댑터 라이게이션 공정에 사용될 수 있다. 예를 들어, 널리 사용되는 Illumina 시퀀싱 플랫폼에 의해 요구되는 차세대 시퀀싱(NGS)을 위한 라이브러리 구성에 일반적으로 사용되는 공정은, 예를 들어, 문헌[Steven R. Head et al., Library construction for next-generation sequencing: Overviews and challenges, Biotechniques, Published online 2014 Feb 1, 2014; 56(2):61, doi: 10.2144/000114133]을 참조한다.
3' 말단 및 5' 말단에서 어댑터 라이게이션을 위해 준비된 RNA 단편은 바람직하게는 본 발명에 따른 RNA 분자의 3' 말단 및 5' 말단에서의 어댑터 라이게이션의 예시를 위해 효율적인 라이게이션이 일어나도록 5' 포스포릴 말단-기 및 3' 하이드록실-말단 기를 포함해야 한다(도면...을 참조한다).
mRNA 및 긴 비-코딩 RNA와 같은 긴 RNA 분자는 단편화될 필요가 있을 수 있다. RNA의 단편화를 위한 공정은 당업자에게 공지되어 있으며, 예를 들어, NEBNext® RNase III RNA 단편화 모듈 및 NEBNext® Magnesium RNA 단편화 모듈을 참조한다. NEBNext RNase III
RNA 단편화 모듈은 긴 이중 가닥 RNA를 5' 및 3' 말단 라이게이션 반응에 직접 사용될 수 있는 5' 포스페이트 및 3' 하이드록실 말단을 갖는 RNA 단편으로 절단하는 리보-엔도뉴클레아제를 사용한다. 그러나, NEBNext® Magnesium RNA Fragmentation 모듈은 2가 금속 이온(Mg+) 및 열을 사용하여 RNA를 단편화하고; 5' 하이드록실 및 3' 포스페이트 말단을 갖는 RNA 단편을 생성한다. 이러한 후자의 경우, RNA 단편의 말단은 5' 포스페이트 및 3' 하이드록실 말단을 포함하는 단편을 획득하기 위해 변형되어야 한다.
놀랍게도, 본원에 설명된 바와 같이 박테리오파지, 보다 구체적으로 크로노박터 파지로부터 획득된 ATP-의존성 DNA 리가제는 ATP 및 이가 양이온의 존재 하에 라이게이션 접합부에 걸쳐 있는 상보적 DNA 분자의 존재 하에 단일 가닥 영역을 갖는 DNA 분자를 RNA의 5' 말단에 고효율로 라이게이션시키는 것으로 밝혀졌다.
본 발명에 따른 ATP-의존성 DNA 리가제는 다른 공지된 리가제와 낮은 서열 동일성을 갖고, 널리 공지된 T4 DNA 리가제 효소에 대해 30% 미만의 서열 동일성을 갖는다(도 1 참조).
상기 설명된 바와 같이, 동봉된 DNA 리가제의 한 가지 특성은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 3'-하이드록실-데옥시리보핵산 분자를 5' 포스포릴-리보핵산 분자의 5' 말단에 고효율로 라이게이션하는 능력이다.
리가제가 상이한 기질의 서브셋을 라이게이션시킬 수 있다는 것은 문헌에 잘 설명되어 있다, 예를 들어, 문헌[Bullard, D. R., & Bowater, R. P., Direct comparison of nick-joining activity of the nucleic acid ligases from bacteriophage T4. The Biochemical Journal, 2006, 398(1), 135-144)] 참조. 본 발명에 따른 DNA 리가제는 또한 기질의 서브셋을 고효율로 라이게이션시킬 수 있으며(도 3b(AZ L13) 참조), 여기서 AZ L13은 기질 1, 6, 7 및 8을 고효율로 및 기질 3 및 5를 저효율로 라이게이션시킬 수 있음이 명백하다.
용어 고효율은 6시간 미만 내, 예를 들어, 1시간 미만 내, 예를 들어, 45분 미만 내 또는 바람직하게는 30분 내 또는 15분 내에 폴리뉴클레오티드의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 라이게이션을 달성하기 위해 당업자에게 공지된 표준 온도 및 완충액 조건 하에 이중 가닥 핵산 분자 내의 단일 가닥 파손을 라이게이션시키는 효소의 능력에 관한 것이다. 표준 완충액 및 온도 조건의 예는 표 2a 및 표 2b 및 실시예 2에 설명되어 있다.
본 발명에 따른 라이게이션 효율 또는 라이게이션 속도 또는 전환율은 당업자에게 공지된 상이한 방법을 사용하여 계산될 수 있다. 예를 들어, 라이게이션 효율은 도 3b에 제시된 바와 같이 라이게이션 생성물을 검출함으로써 계산될 수 있고, 여기서 70% 효율은 ((라이게이션된 생성물)/(라이게이션된 생성물 + 라이게이션되지 않은 생성물)) * 100 = 70을 의미한다. 70%의 라이게이션된 생성물 + 라이게이션되지 않은 생성물은 라이게이션된 생성물로서 존재한다. 이는 도 3b에 제시된 바와 같이 겔 상의 상이한 밴드의 강도를 측정하고 설명된 바와 같이 효율을 계산함으로써 실험적으로 검출될 수 있다. 라이게이션 생성물 및 라이게이션되지 않은 생성물을 나타내는 겔 상의 밴드의 강도는 영상화 기술, 예를 들어, Alpha Imager(AlphaImager HP 시스템)를 사용하여 측정될 수 있다.
본 발명의 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 DNA 주형의 존재 하에 DNA 분자를 RNA 분자의 5' 말단에 라이게이션시키는 이의 능력에서 T4 DNA 리가제, T3DnL,SplintR 또는 백시니아 바이러스로부터의 DNA 리가제에 비해 개선된 라이게이션 효율을 가지며, 여기서 개선된 라이게이션 효율은 T4 DNA 리가제, T3DnL,SplintR 또는 백시니아 바이러스로부터의 DNA 리가제의 라이게이션 효율에 비해 적어도 2 내지 100배이다. T4 DNA 리가제, T3DnL,SplintR 또는 백시니아 바이러스로부터의 DNA 리가제와 비교하여 본 발명의 DNA 리가제의 증가된 라이게이션 효율은 적어도 2배 초과, 적어도 5배 초과, 적어도 10배 초과, 적어도 12배 초과, 적어도 15배 초과, 적어도 20배 초과 또는 적어도 100배 초과이다.
본 발명에 따른 효소 활성에 대한 척도로서의 전환율은 분당 효소 pmol 당 라이게이션된 기질 pmol로 표현될 수 있다.
기질의 전환율 및 라이게이션 %는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질을 사용하여 측정되며, 여기서 이중-가닥 핵산 분자는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체화된 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산을 포함한다(도 3b에 따른 S8 기질).
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.02, 적어도 0.03, 적어도 0.04, 적어도 0.05 또는 적어도 0.1이고, 여기서 전환율은 ATP, Mg2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.02이고, 여기서 전환율은 ATP, Mg2+ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.02 내지 0.1이고, 여기서 전환율은 ATP, Mg2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.02 내지 0.1이고, 여기서 전환율은 ATP, Mg2+ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.15, 적어도 0.2, 적어도 0.3, 적어도 0.4, 적어도 0.5, 적어도 0.8, 적어도 1.0, 적어도 1.5 이고, 여기서 전환율은 ATP, Mn2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.15이고, 여기서 전환율은 ATP, Mn2+ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.15 내지 2.0이고, 여기서 전환율은 ATP, Mn2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.15 내지 2.0이고, 여기서 전환율은 ATP, Mn2+ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.
본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mg2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 25%를 라이게이션시킬 수 있다.
본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mg2+ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 25%를 라이게이션시킬 수 있다.
본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mn2+ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 50%, 바람직하게는 적어도 60%를 라이게이션시킬 수 있다.
본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mn2+ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 50%, 바람직하게는 적어도 60%를 라이게이션시킬 수 있다.
따라서, 본 발명의 일 양태에 따르면, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편이 제공되며, 여기서 상기 ATP-의존성 DNA 리가제는 SEQ ID No. 1의 아미노산 서열을 포함하거나 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.
DNA 리가제의 "이의 효소적 단편"이라는 표현은 SEQ ID No. 1에 도시된 바와 같은 아미노산 서열을 갖는 리가제의 촉매 활성이 트렁케이션된 형태에서 유지되는 DNA 리가제를 의미하는 것으로 이해되어야 한다. 실시예 2는 리가제 활성을 측정하기에 적합한 검정을 제공한다.
일 구현예에서, 본 발명에 따른 DNA 리가제 또는 이의 효소적 단편은 SEQ ID No.1과 적어도 75%, 80%, 85%, 90%, 92%, 94%, 95%, 98% 또는 99% 또는 바람직하게는 적어도 85% 또는 94% 동일한 아미노산 서열을 포함한다.
일부 구현예에서, SEQ ID No. 1과 적어도 70% 동일한 아미노산 서열을 포함하는 ATP 의존성 DNA 리가제는 하기를 갖는 서열로부터 선택될 수 있다:
NCBI 등록 번호 ARB11687.1,
NCBI 등록 번호 YP_007392649.1,
NCBI 등록 번호 KAB3178420.1,
NCBI 등록 번호 YP_006383262.1,
NCBI 등록 번호 YP_009042486.1,
NCBI 등록 번호 ATS93644.1,
NCBI 등록 번호 QEG12338.1,
NCBI 등록 번호 AXN57775.1 또는
NCBI 등록 번호 WP_133670648.1.
일 구현예에서, 본 발명에 따른 DNA 리가제 또는 이의 효소적 단편은 SEQ ID No.1과 적어도 75% 동일한 아미노산 서열을 포함한다.
본 발명에 따른 또 다른 구현예에서, SEQ ID No. 1(L13)과 적어도 70% 동일한 아미노산 서열을 포함하는 ATP 의존성 DNA 리가제는 표 1의 DNA 리가제 중 임의의 것으로부터 선택된다:
표 1
또한, 표 1의 상기 서열 중 임의의 것의 효소적 단편이 포함된다.
NCBI 등록 번호 YP_009846950.1을 갖는 L13Rel3은 SEQ ID No. 1(L13)과 단지 39% 동일한 아미노산 서열을 포함하는 애어로모나스 파지 4로부터의 추정 DNA 리가제이다. 아미노산 서열 및 cDNA 서열은 도 12a 내지 12c 및 SEQ ID No: 13 내지 15에 제시되어 있다. L13Rel3은 본 발명에 따른 DNA-의존적 리가제의 L13-클러스터에 속하지 않고, 리가제는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질에 대한 감소된 효소 활성을 가지며, 여기서 이중-가닥 핵산 분자는 본 발명에 따른 L13 ATP-의존성 DNA 리가제에 비해 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체화된 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산(도 3b에 따른 S8 기질)을 포함한다.
상기 서열에 비한 SEQ ID No. 1의 다중 서열 정렬은 도 2a-c에 제시되어 있다. 서열은 지금까지 조사된 모든 리가제에 의해 공유된 KXaaDG 모티프를 포함하는 여러 보존된 도메인을 공유한다는 것이 도 2a-c로부터 명백하며, 여기서 리신 잔기는 핵산에 결합하는 아데닐화된 효소 중간체를 형성하는데 관여한다(Tomkinson, et al., Bioessays, 19(10):893-901 (1997), Shuman, et al., Virology, 211(1):73-83 (1995), and Luo, et al., Nucleic Acids Res, 24(15):3079-3085 (1996)).
SEQ ID No. 1의 변이체는 SEQ ID No. 1의 상기 아미노산의 하나 이상의 아미노산이 보존적 치환을 겪은 아미노산 서열을 포함한다. 바람직하게는, 이러한 치환은 본 발명의 DNA 리가제의 변형된 형태가 비변형된 형태와 동일한 효소 활성을 갖는다는 점에서 침묵 치환이다.
본 발명의 DNA 리가제는 변형된 형태, 예를 들어, DNA 리가제의 분리, 가용화 및/또는 정제 또는 확인을 위한 공정에 유용한 아미노산 태그를 갖는 융합 단백질로 제공될 수 있다. 이러한 아미노산 태그는 폴리 히스티딘(His) 태그를 포함하나, 이에 제한되지 않는다. 본 발명의 폴리-히스티딘 태깅된 DNA 리가제의 예는 SEQ ID No. 2에 언급되어 있다. 본 발명의 다른 폴리-히스티딘 태깅된 DNA 리가제는 SEQ ID No. 8, SEQ ID No. 11 및 SEQ ID No. 17에 언급되어 있다.
또한, 본 발명은 또한 본 발명의 DNA 리가제 및 이의 효소적 단편을 인코딩하는 핵산 분자를 제공한다. SEQ ID No. 1의 아미노산 서열에 상응하는 핵산 서열은 SEQ ID No. 3에 개시되어 있다.
SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16의 아미노산 서열에 상응하는 추가의 핵산 분자는 SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18에 개시된다.
본 발명의 핵산은 상기 핵산 분자 또는 변이체 핵산 분자를 포함할 수 있다. 변이체 핵산 분자는 구조적으로 상이한 뉴클레오티드가 유전자 코드가 축퇴된다는 사실로 인해 동일한 기능 또는 수율을 수행할 수 있는 분자를 포함한다. 유전자 코드의 축퇴성은 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 핵산 분자가 생성된 리가제의 효소적 활성에 영향을 미치지 않으면서 SEQ ID No. 1, SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16에 의해 제공된 바와 같은 아미노산 분자를 인코딩하는 많은 핵산 분자 중 단지 하나임을 의미한다. 이후, SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18에 개시된 핵산 분자는 E. 콜리 숙주 세포에서 발현을 최적화하기 위해 코돈 최적화될 수 있다.
또한, SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 핵산을 포함하거나 이로 구성된 핵산 분자가 개시된다. 이러한 핵산 분자는 핵산 벡터, 예를 들어, 플라스미드, 재조합 발현 벡터, 바이러스 벡터, 코스미드, 람다 파지 벡터 또는 박테리아 인공 염색체 벡터일 수 있다. 바람직한 벡터는 박테리아 세포에서 리가제의 클로닝 및/또는 발현에 사용하기 위한 플라스미드와 같은 벡터이다.
또한, 본 발명의 다른 구현예에서, DNA 리가제 및 His-태그를 포함하는 폴리펩티드를 인코딩하는 핵산 분자가 제공된다. His-태그를 인코딩하는 핵산 분자는 생성된 DNA 리가제의 활성에 영향을 미치지 않으면서 본 발명의 핵산 서열에 첨가될 수 있다.
또한, 숙주 세포로부터 DNA 리가제 효소의 분비를 제공하는 신호 펩티드를 인코딩하는 핵산 분자는 또한 본 발명의 핵산 서열에 연결될 수 있다.
본원에서 사용되는 바와 같이, 단백질 및 핵산 분자 또는 이의 단편 둘 모두와 관련하여, "서열 동일성"을 언급할 때, 제2 서열과 적어도 x%의 동일성을 갖는 서열은 x%가 둘 모두의 서열이 제2 아미노산 또는 뉴클레오티드 서열의 총 길이에 비해 전체 정렬을 통해 최적으로 정렬될 때 제2 서열의 매칭된 아미노산 또는 뉴클레오티드와 동일한 제1 서열 내의 아미노산 또는 뉴클레오티드의 수를 나타내는 것을 의미한다. 둘 모두의 서열은 x가 최대일 때 최적으로 정렬된다. 동일성 백분율의 정렬 및 결정은 수동으로 또는 자동으로 수행될 수 있다.
당업자는 서열 동일성 백분율을 결정하는 목적을 위한 정렬이, 예를 들어, 디폴트 파라미터를 갖는 Clustal W(Thomson et al., 1994, Nucleic Acid Res., 22, pp 4673-4680) https://www.ebi.ac.uk/Tools/msa/clustalw2/ 또는 NCBI BLAST(미국 국립생물공학 정보 센터(NCBI), USA로부터)와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 다양한 방식으로 달성될 수 있음을 인지할 것이다.
본 발명의 DNA 리가제의 제조
본 발명의 DNA 리가제 및 이의 효소적 단편 또는 리가제를 인코딩하는 핵산 분자는 박테리오파지, 예를 들어, 크로노박터 파지, 펙토박테리움 파지, 또는 아시네토박터 파지와 같은 천연 공급원으로부터 분리될 수 있다.
대안적으로, 효소는 숙주 세포에서 재조합적으로 생산되고 이로부터 분리 및 정제될 수 있다. 숙주 세포는 본 발명의 DNA 리가제를 인코딩하는 유전자를 자연적으로 발현하는 유기체가 아니거나, 이로부터 유래하지 않고, 즉 숙주 세포는 이종성 숙주 세포, 예를 들어, 효모 세포, 곤충 세포, 인간 세포주 또는 박테리아 세포, 바람직하게는 E. 콜리이다.
본 발명에 따른 DNA 리가제 또는 이의 효소적 단편을 인코딩하는 핵산 서열은 유전체 DNA로부터 PCR을 사용하여 증폭되거나, cDNA로서 분리되거나, GENEWIZ, Thermo Fisher Scientific의 GeneArt 또는 Genscript와 같은 상업적 공급업체에 의해 주문될 수 있다.
상기 설명된 바와 같이, DNA 리가제 또는 이의 효소적 단편을 인코딩하는 핵산 서열은 이종성 숙주 세포에서 증가된 단백질 생산을 위해 코돈 최적화될 수 있다. 코돈-최적화를 돕기 위한 다양한 소프트웨어 프로그램은 당 분야에 널리 공지되어 있다. CodonW는 사용될 수 있는 오픈 소스 소프트웨어 프로그램의 예이다. 바람직하게는, 문헌[Raab, D., Graf, M., Notka, F., Schdl, T., & Wagner, R. (2010). The GeneOptimizer Algorithm: Using a sliding window approach to cope with the vast sequence space in multiparameter DNA sequence optimization. Systems and Synthetic Biology, 4(3), 215-225]에 설명된 GeneOptimizer 알고리즘이 E. 콜리 숙주 세포에서 본 발명의 DNA 리가제의 발현을 위한 코돈 최적화된 DNA 서열을 생성하는 데 사용된다.
널리 공지된 재조합 유전자 발현 시스템을 사용하여 다양한 숙주 세포 시스템에서 이종성 발현에 의해 DNA 서열로부터 단백질을 발현시키기 위한 다양한 이용 가능한 분자 기술이 존재한다. 예를 들어, 본 발명에 따른 ATP-의존성 DNA 리가제를 인코딩하거나 이의 효소적 단편을 인코딩하는 핵산 분자는 선택된 숙주 세포에 대해 적절한 발현에 필요한 전사 및 번역 요소를 포함하는 적합한 발현 벡터에 삽입될 수 있다. 일반적으로 사용되는 발현 벡터의 예는 플라스미드 또는 바이러스이다.
관심 유전자의 신뢰할 수 있는 전사를 보장하기 위해, 발현 벡터는 강한 프로모터를 포함할 수 있고, 박테리오파지 T5 및 T7은 E. 콜리에서의 발현을 위한 강한 프로모터의 예이다. 프로모터는 화학적 스위치를 포함함으로써 조절될 수 있다. E. 콜리에서 사용하기 위한 유도성 프로모터의 예는 이소로필-베타-D-티오갈락토시드(IPTG)에 의해 유도된 통상적으로 사용되는 lac 프로모터(Hansen LH, Knudsen S, SJ, "The effect of the lacY gene on the induction of IPTG inducible promoters, studied in Escherichia coli and Pseudomonas fluorescens", Curr. Microbiol. 1998, 36 (6): 341-7) 또는 톨루익산으로 유도될 수 있는 프로모터를 포함하는 XylS/Pm 발현 카세트(Gawin, A. et al., The XylS/Pm regulator/promoter system and its use in fundamental studies of bacterial gene expression, recombinant protein production and metabolic engineering, Microb. Biotechnol., 2017, Vol.10, No.4, p 702-718)이다. 슈도모나스 푸티다(Pseudomonas putida)로부터 유래된 XylS/Pm 조절제/프로모터 시스템은 E. 콜리 및 다른 박테리아에서 유전자 및 유전자 클러스터의 조절된 저- 및 고-수준 재조합 발현에 널리 사용된다.
본 발명의 추가 양태는 적합한 이종성 세포에서 상기 설명된 바와 같은 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적 단편의 발현 방법이다. 숙주 세포는 박테리아 또는 효모 세포일 수 있다. 바람직하게는, 효소의 발현은 박테리아 숙주 세포, 더욱 바람직하게는 E. 콜리, BL21(DE3) 세포에서 일어난다.
본 발명의 DNA 리가제를 포함하는 상기 설명된 발현 벡터의 형질전환은 당업자에게 널리 공지된 방법에 의해, 예를 들어, 화학적으로 적격한 세포를 사용함으로써 수행될 수 있다.
상기 설명된 바와 같이, 본 발명의 DNA 리가제는 재조합 DNA 기술을 사용하여 합성될 수 있다. 대안적으로, DNA 리가제는 무세포 발현 시스템 또는 DNA 리가제의 화학적 합성을 사용하여 생산될 수 있다.
세포 배양 배지로의 분비를 위한 신호전달 펩티드를 포함하는 리가제 효소는 당 분야에 공지되고 문헌에 잘 설명된 임의의 기술을 사용하여 숙주 세포 배양 배지로부터 분리 및 정제될 수 있다. 이러한 기술 또는 임의의 조합의 예는 침전, 초여과, 상이한 크로마토그래피 기술, 예를 들어, 크기-배제 크로마토그래피, 고정화된 금속 친화성 컬럼 크로마토그래피 및/또는 면역흡착 크로마토그래피를 포함할 수 있다.
세포 내에서 생산된 본 발명의 DNA 리가제 효소는 또한 당업자에게 널리 공지된 기술을 사용하여 분리되고 정제될 수 있다. E. 콜리 세포로부터 세포 용해질의 제조를 위한 방법의 예는 균질화, 초음파처리 또는 리소자임을 사용한 효소적 용해이다. DNA 리가제가 용해된 세포로부터 방출된 후, 효소는 임의의 정제 방법, 예를 들어, 크기-배제 크로마토그래피, 고정된 금속 친화성 컬럼 크로마토그래피 및/또는 면역흡착 크로마토그래피에 적용될 수 있다.
상기 언급된 바와 같이, 본 발명의 DNA 리가제는 효소의 분리, 정제 및/또는 확인을 용이하게 하기 위해 c-말단 His-태그를 포함할 수 있다. 본 발명의 폴리히스티딘 태깅된 DNA 리가제는 SEQ ID No. 2, SEQ ID No. 8, SEQ ID No. 11 및 SEQ ID No. 17에 도시되어 있다.
따라서, 본 발명의 또 다른 양태에 따르면, 하기 단계를 포함하는 본 발명에 따른 DNA 리가제 또는 이의 효소적으로 활성인 단편의 분리 및 정제를 위한 방법이 제공된다:
a) 본 발명에 따른 ATP-의존성 DNA 리가제를 발현시키기에 적합한 조건 하에 숙주 세포를 배양하는 단계;
b) 숙주 세포 또는 배양 배지 또는 상층액으로부터 DNA 리가제를 분리하는 단계.
본 발명에 따른 정제된 ATP-의존성 DNA 리가제 효소 또는 이의 효소적 단편은 최종적으로, 예를 들어, 10 mM Tris-HCl pH 7.5(25℃), 0.3 M KCl, 5 mM MgCl2, 0.2 mg/ml BSA 및 50% 글리세롤을 포함하는 완충액에 저장될 수 있다. 리가제를 저장하기에 적합한 대안적인 완충액은 당업자에게 공지되어 있다.
본 발명의 DNA 리가제를 포함하는 조성물 및 키트
또한, 제1 양태에 따른 ATP-의존성 DNA 리가제 및 라이게이션 단계를 수행하기 위해 하나 이상의 추가의 필요한 시약, 예를 들어, 라이게이션 완충액을 포함하는 조성물 및 키트가 개시된다. 라이게이션을 수행하기 위한 적합한 라이게이션 완충액 및 반응 조건은 하기 표 2a 또는 2b에 설명되어 있다.
전형적으로, 본 발명의 분리된 ATP-의존성 DNA 리가제는 수성 완충액에 배치될 것이며, 유사하게 본 발명의 분리된 ATP-의존성 DNA 리가제를 포함하는 조성물은 또한 수성 완충액을 포함할 것이다. 본 발명에 따른 수성 완충액은 pH가 약 7 내지 약 8.5, 바람직하게는 pH가 약 7.5인 Tris, MES Bis-Tris, 포스페이트 또는 HEPES 완충액과 같은 표준 완충액을 포함한다. 수성 완충액은 바람직하게는 효소를 안정화시키기 위해 BSA 및 글리세롤을 추가로 포함할 수 있다.
본 발명의 DNA 리가제는 라이게이션 단계를 수행하기 위해 보조인자로서 ATP를 이용하는 ATP-의존성 DNA 리가제이며, 효소 반응의 개요에 대해서는 단락 "배경"을 참조한다. 또한, 반응의 ATP-의존성은 반응이 촉매작용을 위해 다중 2가 양이온, 예를 들어, Mg2+ 또는 Mn2+ 이온을 필요로 하고, 필수 2가 양이온, 바람직하게는 Mg2+, 더욱 바람직하게는 Mn2+가 필요함을 나타낸다.
따라서, 일 구현예에서, 라이게이션 완충액은 ATP를 포함한다. 상기 ATP의 농도는 약 0.01mM 내지 약 10mM 및 바람직하게는 약 0.05mM 내지 약 2.5mM 및 더욱 바람직하게는 약 1mM이다.
추가 구현예에서, 라이게이션 완충액은 2가 양이온을 포함한다. 상기 2가 양이온은, 예를 들어, MgCl2 또는 MnCl2의 형태의 Mg2+ 또는 Mn2+이다.
추가 구현예에서, 라이게이션 완충액에서 2가 양이온의 농도는 1mM 내지 20mM, 바람직하게는 5mM 내지 15mM, 및 더욱 바람직하게는 약 10mM이다.
라이게이션 완충액은 환원제를 추가로 포함할 수 있다. 적합한 환원제의 비제한적인 예는 디티오트레이톨 및 [베타]-머캅토에탄올을 포함한다.
추가 구현예에서, 라이게이션은 20℃ 내지 35℃ 및 바람직하게는 25℃ 내지 30℃의 온도에서 수행된다.
또한, 추가의 양태에는 본 발명에 따른 임의의 분리된 ATP-의존성 DNA 리가제를 포함하는 키트가 개시된다. 키트는 최적의 라이게이션을 위한 라이게이션 완충액을 추가로 포함할 수 있다. 키트는 또한 본 발명에 따른 개시된 ATP-의존성 DNA 리가제를 사용하여 라이게이션 단계를 수행하는 방법에 대한 서면 설명을 포함할 수 있다. 적합한 조건은 실시예 2에 설명되어 있으며, 이는 키트에 또는 리가제 효소와 함께 제공될 수 있다. 표 2a 및 2b는 본 발명의 DNA 리가제를 사용한 최적의 라이게이션을 위한 반응 혼합물의 예를 제공한다.
표 2a
표 2b
표 2a 또는 표 2b의 반응 혼합물을 30℃에서 30분 동안 인큐베이션된다. 대안적으로, 표 2a 또는 표 2b의 반응 혼합물을 25℃에서 15분 동안 인큐베이션된다. 표 2a 또는 2b의 반응 혼합물은 MnCl2 또는 MgCl2를 포함할 수 있다.
본 발명의 DNA 리가제의 용도
본 발명의 또 다른 양태에서, 이중 가닥 핵산 분자에서 단일 가닥 파손을 라이게이션하기 위한 방법이 제공되며, 상기 방법은 이중-가닥 핵산 분자에서 5'-포스포릴 리보핵산 분자의 5' 말단에 3'-하이드록실-데옥시리보핵산 분자의 라이게이션을 허용하는 조건하에서 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자를 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편과 접촉시키는 것을 포함하고, 여기서 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루고 있다.
일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13 리가제이다.
일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13rel1 리가제이다.
일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13rel2 리가제이다.
일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13rel4 리가제이다.
본 발명에 따른 단일 가닥-파손은 닉 및 갭 둘 모두를 포함한다.
5'-포스포릴-리보핵산 분자는 5' 말단에 포스페이트 기를 포함하는 RNA 분자이다. 일 구현예에서, 리보핵산 분자는 메신저 RNA(mRNA), 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA), 반복 연관 siRNA(rasiRNA)를 포함하는 군으로부터 선택된 리보핵산(RNA) 분자일 수 있다.
본 발명에 사용하기에 적합한 작은 RNA-함유 샘플의 공급원은 적용에 따라 달라질 수 있고 달라질 것이다. 성숙한 작은 RNA를 포함하는 샘플은 동물, 식물, 진균, 원생생물, 바이러스, 박테리아, 또는 고세균으로부터 유래될 수 있다.
임의의 상기 언급된 공급원으로부터 유래된 샘플은 본질적으로 순수한 RNA 분자의 제조물로부터 세포의 미정제 추출물의 범위일 수 있다. 일 구현예에서, 샘플은 작은 RNA 분자의 분리된 제조물일 수 있다. 또 다른 구현예에서, 샘플은 세포로부터 추출된 총 RNA의 분리된 제조물일 수 있다. 또 다른 구현예에서, 샘플은 핵산, 단백질, 지질, 및 탄수화물을 포함하는 세포질 세포 추출물일 수 있다. 또 다른 구현예에서, 샘플은 온전한 세포일 수 있다. 또 다른 구현예에서, 작은 RNA를 포함하는 샘플은 시험관 내 전사 반응 또는 화학적 합성 반응일 수 있다. 총 RNA 또는 작은 RNA는 당 분야에 널리 공지된 상업적으로 이용 가능한 키트 또는 기술을 사용하여 세포, 세포 추출물, 또는 시험관 내 반응으로부터 분리 및 정제될 수 있으며, 예를 들어, 문헌[Ausubel et al. (2003) Current Protocols in Molecular Biology, John Wiley & Sons, New York, NY, 또는 Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY]을 참조한다.
라이게이션 반응에 첨가된 샘플에서 작은 RNA의 양은 RNA-함유 샘플의 공급원에 따라 달라질 수 있고 달라질 것이다. 일반적으로, 임의의 양의 RNA가 사용될 수 있다.
메신저 RNA(mRNA)는 일반적으로 전구체 메신저 RNA와 같은 일부 일차 전사체의 5' 말단에서 특별히 변경된 뉴클레오티드인 5-프라임 캡(5' 캡)을 갖는다. mRNA 캡핑으로 공지된 이 과정은 고도로 조절되며 단백질 합성 동안 번역을 겪을 수 있는 안정하고 성숙한 메신저 RNA의 생성에 필수적이다. 미토콘드리아 mRNA 및 클로로플라스틱 mRNA는 캡핑되지 않는다. 라이게이션이 일어나기 위해, mRNA는 먼저 캡핑을 제거한 후 5' 말단에서 인산화될 필요가 있을 수 있다. 예시를 위해 도 7을 참조한다. 적합한 캡핑 제거 효소는 당업자에게 공지되어 있다. 도 6은 5'캡을 포함하는 mRNA가 라이게이션되지 않은 상황을 예시한다.
방법을 수행하기 위한 적합한 조건의 예는 상기 표 2 및 실시예 2에 설명되어 있다.
상기 방법에 따른 일 구현예에서, 6시간 미만 내, 예를 들어, 1시간 미만 내, 예를 들어, 45분 미만 내 또는 바람직하게는 30분 내, 예를 들어, 15분 내에 폴리뉴클레오티드의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 라이게이션을 달성하기 위해 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자와 함께 ATP 의존성 DNA 리가제를 인큐베이션하는 것을 추가로 포함한다.
상기 방법의 대안적 구현예에서, 3'-하이드록실-데옥시리보핵산 분자는 비드 상에 고정되거나, 포획 표지, 바람직하게는 비오틴 또는 유도체화된 뉴클레오티드, 예를 들어, 염료, 바람직하게는 형광 염료를 추가로 포함하고, 여기서 비드, 포획 표지 또는 유도체화된 뉴클레오티드는 상기 데옥시리보핵산 분자의 5' 말단에 연결된다.
라이게이션 생성물을 검출하기 위한 검정은 당업자에게 공지되어 있다. 라이게이션 생성물을 검출하는 전통적인 방법의 예는 변성 겔 전기영동, 서열 증폭, 및 용융 곡선 분석을 포함한다.
실시예
본 발명은 이제 상기 도면 및 표 7의 생물학적 서열을 참조하여 비제한적인 실시예에 의해 설명될 것이다.
본 발명의 ATP-의존성 DNA 리가제(L13)는 후보 리가제에 대한 공개 데이터베이스를 마이닝하는 서열-기반 메타게노믹 접근법에 의해 발견되었다. 상기 언급된 바와 같이, 본 발명의 DNA 리가제는 원래 크로노박터 파지 CR9로부터 분리되었고, 이의 DNA 및 단백질 서열은 NCBI 참조 서열: YP_009015226.1로부터 획득될 수 있다. 본 발명에 따른 추가의 바람직한 ATP-의존성 DNA 리가제는 원래 크로노박터 파지 CR8로부터 분리되었으며 이의 DNA 및 단백질 서열은 NCBI 참조 서열: YP_009042486.1로부터 획득될 수 있고(L13rel1); 원래 펙토박테리움 파지 phiTE로부터 분리되었으며 이의 DNA 및 단백질 서열은 NCBI 참조 서열: YP_007392649.1로부터 획득될 수 있고(L13rel2); 원래 아시네토박터 파지 ABPH49로부터 분리되었으며 이의 DNA 및 단백질 서열은 NCBI 참조 서열: AXN57775.1로부터 획득될 수 있는(L13rel4), L13 리가제와 적어도 70%의 아미노산 서열 동일성을 갖는 DNA 리가제 L13의 동족체 DNA 리가제이다.
실시예 1: 클로닝, 발현 및 정제
선택된 서열을 E. 콜리에서의 발현을 위해 코돈-최적화하고, C-말단 His-태그를 갖는 발현 벡터 pVB-1A0B1(Vectron Biosolutions)에 클로닝하고, E. 콜리 BL21(DE3)로 형질전환시켰다.
클로닝
L13 또는 L13rel1, L13rel2, L13rel3 또는 L13rel4 중 임의의 것의 코딩 서열은 GeneOptimizer 알고리즘(Raab, D., Graf, M., Notka, F., Schdl, T., & Wagner, R. (2010). The GeneOptimizer Algorithm: Using a sliding window approach to cope with the vast sequence space in multiparameter DNA sequence optimization. Systems and Synthetic Biology, 4(3), 215-225. http://doi.org/10.1007/s11693-010-9062-3)을 사용하여 E. 콜리에서의 발현을 위해 코돈 최적화되었으며, GeneArt 유전자 합성 서비스를 사용하여 Thermo Fisher Scientific으로부터 주문되었다. 유전자 코딩 서열의 측면에 C-말단 GSG 링커 및 His-태그를 코딩한 후 정지-코돈, N-말단 PciI 및 NdeI 제한 부위 및 다운스트림 클로닝 접근법을 위한 C-말단 XhoI 제한 부위를 코딩하는 추가 서열 정보가 첨가되었다. NdeI 및 XhoI 제한 부위를 발현 벡터 pVB-1A0B1(Vectron Biosolutions, Trondheim, Norway)로 클로닝하기 위해 사용하였다. pVB 벡터 패밀리는 톨루익산으로 유도될 수 있는 프로모터를 포함하는 XylS/Pm 발현 카세트를 갖는 RK2 플라스미드에 기반한 독점적인 E. 콜리 발현 벡터 백본으로 구성된다. 슈도모나스 푸티다(Pseudomonas putida) TOL 플라스미드 pWW0로부터 유래하는 XylS/Pm 조절제/프로모터 시스템은 대장균(E. 콜리) 및 다른 박테리아의 유전자 및 유전자 클러스터의 조절된 저수준 및 고수준 재조합 발현에 널리 사용되며, 이는 문헌[Gawin, A. et al., The XylS/Pm regulator/promoter system and its use in fundamental studies of bacterial gene expression, recombinant protein production and metabolic engineering, Microb. Biotechnol., 2017, Vol.10, No.4, p 702-718]에 설명되어 있다.
DNA 리가제의 발현 및 정제
SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12, SEQ ID No. 15 또는 SEQ ID No. 18로부터 선택된 코돈 최적화된 핵산 분자를 Vectron Biosolutions로부터의 발현 벡터 pVB-1A0B1 내로 클로닝하고, BL21(DE3) 세포로 형질전환시켰다. 세포를 Terrific Broth(TB) 배지를 갖는 2.5 L Ultra Yield(Thomson) 플라스크에서 성장시켰고; 1% 밤새 전배양물을 100 μg/ml 암피실린을 함유하는 1 L TB 배지로 옮기고, OD600이 5-6에 도달할 때까지 37℃, 220 rpm에서 인큐베이션하였다. 온도를 15℃로 감소시키고, 온도가 ≤20℃일 때 세포를 2 mM 톨루익산으로 유도하였다. 세포를 밤새(ON) 인큐베이션하고, 원심분리에 의해 수확하고, -20℃에서 동결시켰다.
동결된 세포 펠렛에 용해 완충액(50 mM Tris-HCl(25℃에서 pH 8.5), 10 mM 이미다졸, 0.5 M NaCl, 5 mM MgCl2, 0.5 % Tween 20, 5% 글리세롤, 1 mg/ml 리소자임 및 400 U/ml HL-SAN)을 120의 OD600으로 첨가하고, 15℃에서 90 rpm으로 밤새 인큐베이션하였다. 용해질을 20 000 g에서 20분 동안 원심분리하고 정제 전에 여과하였다.
33.4 ml의 Ni-세파로스 6 FF로 패킹된 HiScale 26/20 컬럼을 사용하여 제1 정제 단계를 수행하였다. 용해질의 적용 후, 컬럼을 증가하는 농도의 이미다졸로 용리시키기 전에 IMAC 세척 완충액(50 mM Tris-HCl(25℃에서 pH 7.5), 20 mM 이미다졸, 5 mM MgCl2 및 0.5 M NaCl)으로 세척하였다. 제2 정제 단계에서, 34.5 ml의 Q-세파로스 FF 수지로 패킹된 HiScale 26/20 컬럼을 사용하였다. 제1 정제 단계로부터의 희석된 용리액의 적용 후, 컬럼을 Q 세척 완충액(20 mM Tris-HCl pH 7.5(25℃ 및 50 mM KCl)으로 세척하고, His-태깅된 L13 효소를 Q-용리 완충액(20 mM Tris-HCl pH 7.5(25℃), 10 mM MgCl2 및 0.2 M NaCl)을 사용하여 컬럼으로부터 용리시켰다. 정제된 L13 리가제 효소를 최종적으로 10 mM Tris-HCl pH 7.5(25℃), 0.3 M KCl, 5 mM MgCl2, 0.2 mg/ml BSA 및 50% 글리세롤에 저장하였다.
실시예 2A: 기질 특이성을 측정하기 위한 리가제 활성 검정
실험 설정
상이한 기질에 대한 리가제 활성은 불러드 및 보워터(Bullard and Bowater)의 절차에 따라 검정될 수 있다(Bullard, D. R., & Bowater, R. P. (2006). Direct comparison of nick-joining activity of the nucleic acid ligases from bacteriophage T4. The Biochemical Journal, 398(1), 135-144). 이중-가닥 기질을 사용하여 라이게이션 활성을 분석하는 시험관 내 검정을 수행하였고, 이는 문헌[Bullard and Bowater 2006]에 설명된 변형된 설정에 기초하였다. 올리고뉴클레오티드는 Metabion(독일)에서 구입하였다. 이중-가닥 기질을 각각의 올리고의 30 μM 용액을 사용하여 상보적 20-mer 핵산 주형 올리고에 하나의 8-mer 핵산 올리고 및 하나의 12-mer 핵산 올리고를 어닐링함으로써 생성시켰다. 어닐링 단계를 100 μl TE 완충액(10mM Tris/HCl, pH 8, 및 0.5mM EDTA)에서 수행하였고, 3개의 올리고를 포함하는 완충액을 95℃로 5분 동안 가열하고 실온에서 16시간 동안 냉각시켰다. 8-mer 올리고의 5'뉴클레오티드 잔기는 플루오레세인 염료 분자 6-FAM(IUPAC 명칭 3',6'-디하이드록시스피로[이소벤조푸란-1(3H),9'-[9H]크산텐]-3-온; CAS 번호 2321-07-5)으로 표지되고, 12-mer 올리고는 5'-모노포스포릴화된 핵산 잔기를 포함한다. 각각의 이중-가닥 기질은 리보핵산 올리고뉴클레오티드 단독 또는 데옥시리보핵산 올리고뉴클레오티드 단독 또는 리보핵산 올리고뉴클레오티드와 데옥시리보핵산 올리고뉴클레오티드의 혼합물로 나타내어, 하기 표 3 및 도 3a 및 3b에 도시된 바와 같은 이중-가닥 기질의 총 8개의 상이한 조성을 초래하였다.
8-mer 올리고*)
5'-GGCCAGTG-3' (SEQ ID No. 4)
12-mer 올리고*)
5'-AATTCGAGCTCG-3' (SEQ ID No. 5)
20-mer 올리고*)
5'-CGAGCTCGAATTCACTGGCC-3' (SEQ ID No. 6)
T는 RNA 올리고에서 U로 대체된다.
표 3: 니킹된 기질의 제조를 위한 올리고 조합
도 3a에 도시된 바와 같이 각 효소의 라이게이션 활성을 측정하는 종점 시험관 내 검정에 닉킹된 이중-가닥 20개 염기쌍(bp) 기질을 사용하였다. 모든 라이게이션 반응에 사용되는 완충액은 55mM Tris/HCl(pH 7.4), 10mM MgCl2, 10.5mM DTT 25mM KCl 및 1mM ATP를 포함한다. 종점 라이게이션 반응을 하기와 같이 수행하였다: 총 부피 5 μl의 70 pmol의 리가제, 상기 설명된 바와 같은 45 pmol의 이중-가닥 올리고 핵산 기질. 반응 혼합물을 30℃에서 30분 동안 인큐베이션한 후, 5 μl의 포름아미드 정지 용액(95% 포름아미드, 10mM EDTA, 브롬-페놀-블루)을 사용하여 정지시켰다. 실험의 마지막에, 샘플을 5분 동안 95℃로 가열하고, 20% 폴리아크릴아미드-우레아 겔 1X TBE(89mM Tris, 89mM 붕산 및 2mM EDTA)에서 변성 조건 하에 분석하였다. 반응 생성물(도 3b 참조)을 Bio-Rad Pharos 시스템을 사용하여 겔 상에서 시각화하였다. ImageLab(BioRad)을 사용하여 정량화를 수행하였다.
다른 상업적으로 이용 가능한 리가제와 비교하여 L13 DNA 리가제의 라이게이션 활성을 도 1b에 예시된 바와 같이 분석하였다. 놀랍게도, L13 DNA 리가제는 기질 8(S8)에서 단일-가닥 파손을 고효율로 라이게이션시킬 수 있는 유일한 리가제였다. 기질 S8은 시험된 상업적으로 이용 가능한 리가제 효소에 대한 불량한 기질이었다.
실시예 2B: 대안적인 S8 유사 기질에 대한 리가제 활성 검정
대안적인 S8 기질에 대한 L13 DNA 리가제의 라이게이션 활성을 시험하였다. SEQ ID No 19, 20 및 21을 갖는 서열을 포함하는 닉킹된 이중-가닥 43 염기쌍(bp) 기질을 L13의 라이게이션 활성을 측정하는 종점 시험관 내 검정에 사용하였다. 모든 라이게이션 반응에 사용되는 완충액은 50mM Tris/HCl(pH 7.5), 10mM MgCl2, 10mM DTT, <46 mM KCl 및 0.1mM ATP를 포함한다. 종점 라이게이션 반응을 하기와 같이 수행하였다: 총 부피 10 μl의 상이한 양의 L13 리가제, 상기 설명된 바와 같은 9 pmol의 이중-가닥 올리고 핵산 기질. 반응 혼합물을 25℃에서 15분 동안 인큐베이션한 후, 5 μl의 포름아미드 정지 용액(95% 포름아미드, 10mM EDTA, 브롬-페놀-블루)을 사용하여 정지시켰다. 실험의 마지막에, 샘플을 5분 동안 95℃로 가열하고, 20% 폴리아크릴아미드-우레아 겔 1X TBE(89mM Tris, 89mM 붕산 및 2mM EDTA)에서 변성 조건 하에 분석하였다. 반응 생성물을 Bio-Rad Pharos 시스템을 사용하여 겔 상에서 시각화하였다. ImageLab(BioRad)을 사용하여 정량화를 수행하였다.
실험으로부터의 결과는 하기 표 3에 도시되어 있으며, 이는 L13 리가제가 또한 실시예 2A와 비교하여 상이한 핵산 서열을 포함하는 이중 가닥 DNA-RNA 하이브리드에서 닉을 고효율로 라이게이션시킬 수 있음을 명백히 입증한다.
대안적인 S8 - 기질
20-mer 5'-FAM-표지된 DNA 올리고
5'-GGCCAGTGAATTCGAGCTCG-3' (SEQ ID No. 19)
23-mer RNA 올리고 5'-P
5'-P-ACUGAUAGAAGUUCCCGAAACAG-3' (SEQ ID No. 20)
43-mer DNA 올리고
5'-CTGTTTCGGGAACTTCTATCAGTCGAGCTCGAATTCACTGGCC-3' (SEQ ID No.21)
표 3
실시예 3: L13, L13rel1, L13rel2, L13rel3 및 L13rel4의 리가제 활성
이 실시예에서, 본 발명의 상이한 리가제의 리가제 활성을 시험하였다. 결과는 표 4 및 표 5에 제시되어 있으며, 이는 L13, L13rel1, L13rel2 및 L13rel4 효소가 S8 기질에 대한 유사한 라이게이션 효율, 즉, 라이게이션 접합부에 걸쳐 있는 DNA 분자의 존재 하에 RNA 분자의 5'-말단에 DNA 분자를 라이게이션시키는 라이게이션 효율을 갖는 것을 입증한다.
표 4
검정 조건 1: 50 mM Tris/HCl pH 7.5, 10mM MgCl2, 10 mM DTT, 25mM KCl, 1mM ATP, 11.4 pmol 리가제, 9 pmol S8 기질, 총 부피 20 μl. 30℃에서 30분 인큐베이션.
검정 조건 2: 50 mM Tris/HCl pH 7,5, 10mM MgCl2, 10 mM DTT, 25mM KCl, 1mM ATP, 7 pmol 리가제, 18 pmol S8 기질, 총 부피 20 μl. 25℃에서 15분 인큐베이션.
표 5
검정 조건: 50 mM Tris/HCl pH 7.5, 10 mM MnCl2, 10 mM DTT, 25mM KCl, 1mM ATP, 11.4 pmol 리가제, 18 pmol S8 기질, 총 부피 20 μl. 25℃에서 15분 인큐베이션.
실시예 4: 백시니아 DNA 리가제와 비교한 L13 DNA 리가제의 리가제 활성
본 발명의 L13 DNA 리가제의 효능을 종래 기술의 백시니아 바이러스로부터의 DNA 리가제와 비교하였다(백시니아 DNA 리가제의 단백질 서열은 등록 번호 YP_233058.1로 NCBI 데이터베이스에 도시되어 있다). 표 6은 실험으로부터의 결과를 도시한다. 효소 활성을 실시예 2a에 따라 18 pmol S8 기질을 사용하여 시험하였다; MnCl2 또는 MgCl2를 포함하는 라이게이션 완충액 및 20 μl의 반응 부피. 라이게이션을 25℃에서 15분 동안 실행하고, 라이게이션된 기질 % 및 전환율을 계산하였다.
표 6
표 6에 제시된 데이터는 라이게이션 접합부에 걸쳐 있는 DNA 분자의 존재 하에 DNA 분자를 RNA 분자의 5'-말단에 라이게이션시키는데 있어서 L13이 백시니아 DNA 리가제와 비교하여 더 효율적인 리가제임을 분명히 입증한다(기질 S8의 경우, 실시예 2 참조).
표 7
SEQUENCE LISTING
<110> ArcticZymes
<120> Ligases
<130> P27155PC00
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 458
<212> PRT
<213> L13 wild type amino acid sequence
<400> 1
Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser
1 5 10 15
Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly
20 25 30
Leu Lys Gln Ala Phe Gln Ile Ala Tyr Ser Lys Glu Leu Asn Phe Phe
35 40 45
Val Arg Gly Leu Lys Val Gln Ser Leu Pro Gly Leu Arg Ser Leu Ser
50 55 60
Glu Ser Val Glu Met Leu Val Lys Asn Ile Ala Gly Arg Val Tyr Thr
65 70 75 80
Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys Glu
85 90 95
Glu Pro Asp Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys Gly
100 105 110
Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr Glu
115 120 125
Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg Lys
130 135 140
Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu Tyr
145 150 155 160
Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg Ser
165 170 175
Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala Leu
180 185 190
Met Lys Ala Ala Val Ala Glu Asp Gly Thr Ala Lys Pro Tyr Val Ala
195 200 205
His Gly Glu Gly Leu Val Ile Asp Pro Asp Gly Leu His Gly Val Met
210 215 220
Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile
225 230 235 240
Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Arg Val Thr Met Asp
245 250 255
Glu Tyr Ile Ala Arg Lys Ser Lys Arg Pro Tyr Ser Glu Arg Arg Leu
260 265 270
Ser Ala Gln Gly Leu Ala Trp Trp Val Glu Asp Pro Asp His Met Gln
275 280 285
Phe Val Lys Gly Arg Gln Ile Asn Ser Leu Lys Glu Ala Ile Asp His
290 295 300
Phe Ile Glu Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu
305 310 315 320
Ala Glu Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu
325 330 335
Lys Asn Glu Phe Asp Val Asp Leu Val Val Val Gly Thr Thr Pro His
340 345 350
Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg Asp
355 360 365
Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg
370 375 380
Lys Lys Pro Ala Glu Tyr Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala
385 390 395 400
Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu
405 410 415
Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Val
420 425 430
Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp
435 440 445
Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu
450 455
<210> 2
<211> 467
<212> PRT
<213> L13 amino acid sequence with His-tag
<400> 2
Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser
1 5 10 15
Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly
20 25 30
Leu Lys Gln Ala Phe Gln Ile Ala Tyr Ser Lys Glu Leu Asn Phe Phe
35 40 45
Val Arg Gly Leu Lys Val Gln Ser Leu Pro Gly Leu Arg Ser Leu Ser
50 55 60
Glu Ser Val Glu Met Leu Val Lys Asn Ile Ala Gly Arg Val Tyr Thr
65 70 75 80
Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys Glu
85 90 95
Glu Pro Asp Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys Gly
100 105 110
Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr Glu
115 120 125
Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg Lys
130 135 140
Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu Tyr
145 150 155 160
Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg Ser
165 170 175
Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala Leu
180 185 190
Met Lys Ala Ala Val Ala Glu Asp Gly Thr Ala Lys Pro Tyr Val Ala
195 200 205
His Gly Glu Gly Leu Val Ile Asp Pro Asp Gly Leu His Gly Val Met
210 215 220
Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile
225 230 235 240
Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Arg Val Thr Met Asp
245 250 255
Glu Tyr Ile Ala Arg Lys Ser Lys Arg Pro Tyr Ser Glu Arg Arg Leu
260 265 270
Ser Ala Gln Gly Leu Ala Trp Trp Val Glu Asp Pro Asp His Met Gln
275 280 285
Phe Val Lys Gly Arg Gln Ile Asn Ser Leu Lys Glu Ala Ile Asp His
290 295 300
Phe Ile Glu Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu
305 310 315 320
Ala Glu Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu
325 330 335
Lys Asn Glu Phe Asp Val Asp Leu Val Val Val Gly Thr Thr Pro His
340 345 350
Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg Asp
355 360 365
Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg
370 375 380
Lys Lys Pro Ala Glu Tyr Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala
385 390 395 400
Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu
405 410 415
Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Val
420 425 430
Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp
435 440 445
Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu Gly Ser Gly His His His
450 455 460
His His His
465
<210> 3
<211> 1377
<212> DNA
<213> L13 cDNA sequence
<400> 3
atgtcaaacg taacgagtat tctcgcagag ttgtctgcaa cccgatccct gaaggagaag 60
gaagcgatcc tgcgagcaaa tgcggataat gacggcctta aacaagcctt ccagatcgca 120
tattccaaag aactgaactt cttcgttcgc ggactgaagg ttcaatccct gccagggttg 180
cgttccctgt ccgaaagtgt ggaaatgttg gtgaagaaca tcgccgggcg agtgtatact 240
ggtgacgacg ccaagtcgta catgacccaa ctggtgcaga cctgcgaaga gccggatacg 300
ctcctgaaga tcatcaaccg cgatctggag tgcggcatcc agacgactct gaccaacaag 360
gtgtggaaag acctgatcac ggagcctccg taccagagct ataccctgtt caaagaggat 420
ctgttgcgta agttcaacta caagggcgct ttctccgacg agaagatgga cggcttgtat 480
gctgacatca tggtgtggcc tgagcaggtc atttatcgct ctcgctccgg caaggaactg 540
aacttccgtg ctccggagaa cgtggaacgt gcgctgatga aggcggctgt tgccgaggat 600
ggaacagcga agccatacgt tgctcacggc gaaggtctgg ttattgatcc ggacggcctg 660
cacggcgtta tggaacgtgc tgaaggcaac ggttatctga accaagaccc ggaagacatc 720
gatcgtaacc gtgttcgact ggtgatttgg gaccgtgtga ctatggacga gtatatcgcc 780
cgcaagtcga agcgtccgta cagtgaacgc cgtctgtcag cgcagggtct cgcatggtgg 840
gttgaagatc ctgatcacat gcagttcgtt aagggccgtc agatcaacag cctcaaagag 900
gcgatcgacc acttcatcga gatgcgtctc cagaagaaag aaggcaccgt cttgaaagag 960
gccgagatgc cttggggcga caacaagacg aagaaaggcg tcaagttgaa gaacgagttc 1020
gatgtggatc tggtcgttgt cgggacaacc ccgcacaaga aagatcctgc cctgatcgga 1080
tcactgatct gtcagactcg tgacggccta ctggaagtcg gcgttggctc cggcctgacc 1140
gatgcgcttc gtaagaagcc agcggaatac ttcatcgggc agatcatcac gatcaaggcc 1200
aacgacatca cgaagtcgga gaccaaagag cttcagtctc tgttcttgcc tcgtttgaac 1260
tacaagttcg tcgagatccg catggacaag accgtggcta acagtcttcc agaagtgatc 1320
gaagcctctg attctctgct ggatctcctg cgggcaattg cggaggactt ggaatga 1377
<210> 4
<211> 8
<212> DNA
<213> 8-mer DNA oligo
<400> 4
ggccagtg 8
<210> 5
<211> 12
<212> RNA
<213> 12-mer RNA oligo
<400> 5
aauucgagcu cg 12
<210> 6
<211> 20
<212> DNA
<213> 20-mer DNA oligo
<400> 6
cgagctcgaa ttcactggcc 20
<210> 7
<211> 455
<212> PRT
<213> L13Rel1
<400> 7
Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser
1 5 10 15
Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly
20 25 30
Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe
35 40 45
Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu
50 55 60
Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr
65 70 75 80
Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys
85 90 95
Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys
100 105 110
Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr
115 120 125
Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg
130 135 140
Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu
145 150 155 160
Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg
165 170 175
Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Glu Ile Glu Gln Arg
180 185 190
Leu Met Gln Ala Ala Glu Asn Arg Gly Ala Phe Val Ala His Gly Glu
195 200 205
Gly Leu Val Ile Asp Asp Asp Gly Leu His Gly Val Met Glu Arg Ala
210 215 220
Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp Ile Asp Arg Asp
225 230 235 240
Leu Val Arg Leu Val Ile Trp Asp Ile Val Thr Met Glu Glu Tyr Ile
245 250 255
Ala Arg Lys Ser Lys Thr Asp Tyr Ala Asp Arg Arg Ile Glu Ala Asp
260 265 270
Leu Leu Val Gln Glu Val Asp Arg Arg Tyr Asn Phe Arg Met Val Thr
275 280 285
Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile Glu
290 295 300
Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Lys Met
305 310 315 320
Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu Lys Asn Glu
325 330 335
Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys Asp
340 345 350
Pro Ser Leu Val Gly Ala Leu Ile Cys Arg Thr Arg Asp Gly Leu Leu
355 360 365
Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg Lys Lys Pro
370 375 380
Ala Asp Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp Ile
385 390 395 400
Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg Leu
405 410 415
Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Lys Ala Asn Ser
420 425 430
Leu Glu Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp Leu Leu Arg
435 440 445
Ala Ile Ala Glu Asp Leu Glu
450 455
<210> 8
<211> 464
<212> PRT
<213> L13Rel1amino acid sequence with His-tag
<400> 8
Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser
1 5 10 15
Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly
20 25 30
Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe
35 40 45
Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu
50 55 60
Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr
65 70 75 80
Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys
85 90 95
Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys
100 105 110
Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr
115 120 125
Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg
130 135 140
Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu
145 150 155 160
Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg
165 170 175
Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Glu Ile Glu Gln Arg
180 185 190
Leu Met Gln Ala Ala Glu Asn Arg Gly Ala Phe Val Ala His Gly Glu
195 200 205
Gly Leu Val Ile Asp Asp Asp Gly Leu His Gly Val Met Glu Arg Ala
210 215 220
Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp Ile Asp Arg Asp
225 230 235 240
Leu Val Arg Leu Val Ile Trp Asp Ile Val Thr Met Glu Glu Tyr Ile
245 250 255
Ala Arg Lys Ser Lys Thr Asp Tyr Ala Asp Arg Arg Ile Glu Ala Asp
260 265 270
Leu Leu Val Gln Glu Val Asp Arg Arg Tyr Asn Phe Arg Met Val Thr
275 280 285
Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile Glu
290 295 300
Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Lys Met
305 310 315 320
Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu Lys Asn Glu
325 330 335
Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys Asp
340 345 350
Pro Ser Leu Val Gly Ala Leu Ile Cys Arg Thr Arg Asp Gly Leu Leu
355 360 365
Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg Lys Lys Pro
370 375 380
Ala Asp Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp Ile
385 390 395 400
Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg Leu
405 410 415
Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Lys Ala Asn Ser
420 425 430
Leu Glu Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp Leu Leu Arg
435 440 445
Ala Ile Ala Glu Asp Leu Glu Gly Ser Gly His His His His His His
450 455 460
<210> 9
<211> 1368
<212> DNA
<213> L13Rel1 cDNA
<400> 9
atgtcaaacg taacgagtat tctcgcagag ttgtctgcaa cccgatccct caaggagaag 60
gaagcgatcc tgcgggctaa tgccgataac gatggcctaa aacaagcctt cgctgttgca 120
tattccaaag aactgaactt tttcgtccga ggactgcggg ttccattctt cacggctggt 180
cttaccccgc tatctgaaag cgtagatctg ctggtgaaga acatcgcagg gcgagtttac 240
acgggtgatg atgccaagtc gtacatgact caactggtac agacctgcga ggagccgggt 300
acactcctga agatcatcaa ccgagatctg gagtgcggca tccagaccac tctaaccaac 360
aaggtgtgga aagacctgat cactgagcct ccgtaccaga gttacaccct gttcaaagag 420
gatctgctgc gtaagttcaa ctacaagggc gctttctccg acgagaaaat ggacggcctg 480
tatgcggaca tcatggtgtg gcctgagcag gtgatctacc gttcccgctc cgggaaggaa 540
ctgaacttcc gtgcgccgga agagatcgag cagcgcctga tgcaggcggc agaaaaccgt 600
ggggcctttg tggcacacgg cgaaggtctg gttatcgacg atgacggcct gcatggtgtg 660
atggaacgtg ctgagggcaa cggatacctg aaccaagacc cggcagacat cgatcgtgat 720
ctggtgcgcc tggtgatctg ggacatcgtg acgatggaag agtacatcgc acgtaagtcg 780
aagaccgact acgctgatcg tcgtatcgag gcggatctgc tggtgcagga agtcgatcgc 840
cgttacaact tccgtatggt cacgggccgc aagatcaaca gcctgaagga agctatcgat 900
cacttcatcg aaatgcgcct ccagaagaaa gaaggcaccg tcctcaaaga ggcgaagatg 960
ccgtggggcg acaacaagac gaagaaaggc gtcaagttga agaacgagtt cgatgttgat 1020
ctggaagtcg tggcgacgac gccgcacaag aaagatccga gcctcgtcgg cgcactgatc 1080
tgtcgtactc gtgacggcct gctggaagtt ggcgtcggct ccggcttgac ggacgcgctt 1140
cgtaagaagc cagcggactt cttcatcggg cagatcatca cgatcaaggc caacgacatc 1200
acgaagtcgg aaaccaaaga gcttcagtct ctgttcctgc ctcgtctgaa ctacaagttc 1260
gtcgagatcc gtatggacaa gaccaaggct aacagcctgg aagaggtgat cgaggcatct 1320
gactccctgc tggatctgct gcgggctatt gcggaggatc tggaatga 1368
<210> 10
<211> 459
<212> PRT
<213> L13Rel2 amino acid sequence
<400> 10
Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser
1 5 10 15
Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly
20 25 30
Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe
35 40 45
Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu
50 55 60
Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr
65 70 75 80
Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys
85 90 95
Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys
100 105 110
Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Val Thr
115 120 125
Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg
130 135 140
Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu
145 150 155 160
Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg
165 170 175
Asp Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala
180 185 190
Leu Met Gln Ala Ala Val Asp Asp Asp Gly Thr Ala Lys Pro Tyr Val
195 200 205
Ala His Gly Glu Gly Leu Val Ile Asp Pro Asn Gly Leu His Gly Val
210 215 220
Met Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp
225 230 235 240
Ile Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Tyr Val Thr Met
245 250 255
Asp Glu Tyr Ile Val Arg Lys Ser Lys Arg Pro Tyr Ile Ser Arg Arg
260 265 270
Leu Ser Ala Gln Gly Leu Ala Ala Trp Val Glu Asp Lys Glu His Met
275 280 285
Gln Phe Val Lys Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp
290 295 300
His Phe Ile Glu Val Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys
305 310 315 320
Glu Ala Asp Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys
325 330 335
Leu Lys Asn Glu Phe Asp Val Asp Leu Glu Val Val Gly Thr Ile Arg
340 345 350
His Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg
355 360 365
Asp Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ser Leu
370 375 380
Arg Lys Lys Pro Ala Glu Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys
385 390 395 400
Ala Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe
405 410 415
Leu Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr
420 425 430
Val Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu
435 440 445
Gly Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu
450 455
<210> 11
<211> 468
<212> PRT
<213> L13Rel2 amino acid sequence with His-tag
<400> 11
Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser
1 5 10 15
Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly
20 25 30
Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe
35 40 45
Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu
50 55 60
Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr
65 70 75 80
Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys
85 90 95
Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys
100 105 110
Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Val Thr
115 120 125
Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg
130 135 140
Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu
145 150 155 160
Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg
165 170 175
Asp Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala
180 185 190
Leu Met Gln Ala Ala Val Asp Asp Asp Gly Thr Ala Lys Pro Tyr Val
195 200 205
Ala His Gly Glu Gly Leu Val Ile Asp Pro Asn Gly Leu His Gly Val
210 215 220
Met Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp
225 230 235 240
Ile Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Tyr Val Thr Met
245 250 255
Asp Glu Tyr Ile Val Arg Lys Ser Lys Arg Pro Tyr Ile Ser Arg Arg
260 265 270
Leu Ser Ala Gln Gly Leu Ala Ala Trp Val Glu Asp Lys Glu His Met
275 280 285
Gln Phe Val Lys Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp
290 295 300
His Phe Ile Glu Val Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys
305 310 315 320
Glu Ala Asp Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys
325 330 335
Leu Lys Asn Glu Phe Asp Val Asp Leu Glu Val Val Gly Thr Ile Arg
340 345 350
His Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg
355 360 365
Asp Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ser Leu
370 375 380
Arg Lys Lys Pro Ala Glu Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys
385 390 395 400
Ala Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe
405 410 415
Leu Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr
420 425 430
Val Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu
435 440 445
Gly Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu Gly Ser Gly His His
450 455 460
His His His His
465
<210> 12
<211> 1380
<212> DNA
<213> L13Rel2 cDNA
<400> 12
atgtcaaacg taacgagtat tctcgcagag ttgtctgcaa cccgatccct gaaggagaag 60
gaagcgatcc tgcgagccaa tgccgataac gacggcctaa aacaagcctt cgctgttgca 120
tattccaaag aactgaactt tttcgtccga ggactgcggg ttcccttctt cacggctggt 180
cttactccgc tgtctgaaag cgtggatctg ctggtgaaga acatcgcagg gcgagtttac 240
acgggcgatg atgcgaagtc gtacatgact caactggtac agacctgcga ggagccgggc 300
acacttctga agatcatcaa ccgagatctg gagtgcggca tccagacaac tctgaccaac 360
aaggtgtgga aggatctggt cacggagcct ccgtaccaga gctataccct gttcaaagag 420
gatctgctgc gtaagttcaa ctataagggc gctttctctg acgagaagat ggacggcctg 480
tatgcggaca tcatggtgtg gcctgagcag gtcatctatc gatcacgcga cggcaaggaa 540
ctgaacttcc gcgccccaga gaacgtggaa cgtgccctga tgcaagctgc ggttgacgac 600
gatggcacag caaaaccata cgtagctcac ggtgaaggtc tggttattga tccgaatggc 660
ctgcatgggg ttatggaacg cgcagagggc aacggctacc tgaaccaaga tccagcagac 720
atcgatcgaa atcgtgttcg actggtgatc tgggactatg tgacgatgga cgagtatatc 780
gtccgtaagt ccaagcgacc gtacatcagt cgtcgtctgt cagcgcaggg cctcgccgca 840
tgggttgaag ataaagagca catgcagttc gtgaagggta gaaagatcaa cagcctcaaa 900
gaggcaatcg accacttcat cgaggtgcgt ctccagaaga aagaggggac ggtcctcaaa 960
gaggcagaca tgccgtgggg cgacaacaag acgaagaaag gtgtcaagtt gaagaatgag 1020
ttcgatgtgg atctggaagt tgtcggcacg atccgacaca agaaagaccc ggcattgatt 1080
ggatccctaa tctgccaaac tcgtgatggg ttattggagg ttggtgttgg ttctggactt 1140
acagattcgc tccgtaagaa accagcggag ttctttatcg ggcagatcat cacgatcaag 1200
gcaaacgaca tcacgaagtc ggagactaaa gagcttcagt cgctgttcct gccccgcctc 1260
aactacaagt tcgttgagat ccgcatggac aagaccgttg caaacagcct accggaagtg 1320
atcgaggcgt ctgactccct tctgggtctg ttgcgggcaa ttgcggagga tctggaatga 1380
<210> 13
<211> 457
<212> PRT
<213> L13Rel3 amino acid sequence
<400> 13
Met Lys Lys Val Val Asp Ile Ile Lys Glu Leu Arg Ser Thr Ser Ser
1 5 10 15
Arg Asn Glu Lys Glu Ala Ile Leu Thr Thr Asn Lys Asp Asn Glu Thr
20 25 30
Leu Lys Lys Val Phe Tyr Leu Ala Tyr Asp Pro Ser Ile Asn Phe Tyr
35 40 45
Ile Lys Ser Ile Pro Tyr Glu Asp Asn Trp Lys His Gly Glu Tyr Phe
50 55 60
Glu Tyr Asp Glu Asn Asp Glu Phe Glu Ile Leu Phe Asp Val Leu Glu
65 70 75 80
Thr Ile Tyr Ser Arg Glu Leu Thr Gly Asn Lys Ala Ile Ser Phe Leu
85 90 95
Thr Gly Val Leu Ser Glu Arg Ser Thr Glu Met Gln Glu Leu Ile Cys
100 105 110
Asn Ile Val Lys Lys Asp Leu Asp Cys Gly Val Gln Thr Thr Thr Ile
115 120 125
Asn Lys Ile Trp Lys Gly Leu Ile Thr Asp Pro Pro Tyr Met Gly Tyr
130 135 140
Gln Leu Phe Ser Glu Lys Leu Ile Lys Ser Phe Lys Leu Pro Cys Tyr
145 150 155 160
Ser Gln Ile Lys Leu Asp Gly Leu Tyr Ala Asp Val Phe Val Met Lys
165 170 175
Asp Ser Val Ser Tyr Arg Ser Arg Ser Gly Ile Asn Cys Lys Phe Lys
180 185 190
Leu Pro Asp Asn Val Glu Glu Lys Leu Leu Asn Leu Ser Gln Phe Ser
195 200 205
Asp Val Glu Phe Val Leu His Cys Glu Ala Leu Val Arg Lys Gly Glu
210 215 220
Ser Phe Thr Glu Phe Glu Glu Arg Lys Ile Gly Asn Gly Tyr Leu Asn
225 230 235 240
Ser Asp Glu Ser Asp Pro Gly Lys Val Val Ile Val Ile Trp Asp Val
245 250 255
Val Gly Ile Asp Glu Tyr Asn Asn Arg Lys Ser Thr Glu Asp Tyr Ser
260 265 270
Glu Arg Phe Asn Leu Val Glu Lys Ile Val Glu Tyr Val Asp Thr Pro
275 280 285
His Val Gln Met Val Glu Ser Arg Phe Cys Asn Ala Thr Gln Asp Val
290 295 300
Ile Asp His Phe Val Glu Ser Arg Ser Lys Gly Met Glu Gly Thr Val
305 310 315 320
Ile Lys Ser Pro Lys Leu Lys Trp Lys Asp Gly Lys Val Lys Asp Gly
325 330 335
Leu Lys Leu Lys Asn Glu Phe Val Val Glu Met Lys Ile Ile Gly Phe
340 345 350
Gln Glu His Ser Lys Arg Ser Gly Gln Ile Gly Ala Ile Phe Val Glu
355 360 365
Ser Glu Asp Gly Val Val Lys Cys Lys Val Gly Ser Gly Leu Thr Asp
370 375 380
Ala Gln Arg Lys Lys Phe Phe Leu Thr Gln Asp Glu Met Ile Gly Lys
385 390 395 400
Ile Val Thr Val Lys Gly Asn Asp Leu Val Thr Asn Glu Leu Lys Gln
405 410 415
Asp Arg His Ser Val Phe Leu Pro Arg Phe Val Glu Val Arg Asp Asp
420 425 430
Lys Thr Val Ala Asp Met Phe Asp Lys Ile Met Ala Thr Lys Asp Ser
435 440 445
Ile Ile Asp Leu Leu Lys Asn Ile Lys
450 455
<210> 14
<211> 466
<212> PRT
<213> L13Rel3 amino acid sequence with His-tag
<400> 14
Met Lys Lys Val Val Asp Ile Ile Lys Glu Leu Arg Ser Thr Ser Ser
1 5 10 15
Arg Asn Glu Lys Glu Ala Ile Leu Thr Thr Asn Lys Asp Asn Glu Thr
20 25 30
Leu Lys Lys Val Phe Tyr Leu Ala Tyr Asp Pro Ser Ile Asn Phe Tyr
35 40 45
Ile Lys Ser Ile Pro Tyr Glu Asp Asn Trp Lys His Gly Glu Tyr Phe
50 55 60
Glu Tyr Asp Glu Asn Asp Glu Phe Glu Ile Leu Phe Asp Val Leu Glu
65 70 75 80
Thr Ile Tyr Ser Arg Glu Leu Thr Gly Asn Lys Ala Ile Ser Phe Leu
85 90 95
Thr Gly Val Leu Ser Glu Arg Ser Thr Glu Met Gln Glu Leu Ile Cys
100 105 110
Asn Ile Val Lys Lys Asp Leu Asp Cys Gly Val Gln Thr Thr Thr Ile
115 120 125
Asn Lys Ile Trp Lys Gly Leu Ile Thr Asp Pro Pro Tyr Met Gly Tyr
130 135 140
Gln Leu Phe Ser Glu Lys Leu Ile Lys Ser Phe Lys Leu Pro Cys Tyr
145 150 155 160
Ser Gln Ile Lys Leu Asp Gly Leu Tyr Ala Asp Val Phe Val Met Lys
165 170 175
Asp Ser Val Ser Tyr Arg Ser Arg Ser Gly Ile Asn Cys Lys Phe Lys
180 185 190
Leu Pro Asp Asn Val Glu Glu Lys Leu Leu Asn Leu Ser Gln Phe Ser
195 200 205
Asp Val Glu Phe Val Leu His Cys Glu Ala Leu Val Arg Lys Gly Glu
210 215 220
Ser Phe Thr Glu Phe Glu Glu Arg Lys Ile Gly Asn Gly Tyr Leu Asn
225 230 235 240
Ser Asp Glu Ser Asp Pro Gly Lys Val Val Ile Val Ile Trp Asp Val
245 250 255
Val Gly Ile Asp Glu Tyr Asn Asn Arg Lys Ser Thr Glu Asp Tyr Ser
260 265 270
Glu Arg Phe Asn Leu Val Glu Lys Ile Val Glu Tyr Val Asp Thr Pro
275 280 285
His Val Gln Met Val Glu Ser Arg Phe Cys Asn Ala Thr Gln Asp Val
290 295 300
Ile Asp His Phe Val Glu Ser Arg Ser Lys Gly Met Glu Gly Thr Val
305 310 315 320
Ile Lys Ser Pro Lys Leu Lys Trp Lys Asp Gly Lys Val Lys Asp Gly
325 330 335
Leu Lys Leu Lys Asn Glu Phe Val Val Glu Met Lys Ile Ile Gly Phe
340 345 350
Gln Glu His Ser Lys Arg Ser Gly Gln Ile Gly Ala Ile Phe Val Glu
355 360 365
Ser Glu Asp Gly Val Val Lys Cys Lys Val Gly Ser Gly Leu Thr Asp
370 375 380
Ala Gln Arg Lys Lys Phe Phe Leu Thr Gln Asp Glu Met Ile Gly Lys
385 390 395 400
Ile Val Thr Val Lys Gly Asn Asp Leu Val Thr Asn Glu Leu Lys Gln
405 410 415
Asp Arg His Ser Val Phe Leu Pro Arg Phe Val Glu Val Arg Asp Asp
420 425 430
Lys Thr Val Ala Asp Met Phe Asp Lys Ile Met Ala Thr Lys Asp Ser
435 440 445
Ile Ile Asp Leu Leu Lys Asn Ile Lys Gly Ser Gly His His His His
450 455 460
His His
465
<210> 15
<211> 1374
<212> DNA
<213> L13Rel3 cDNA
<400> 15
atgaaaaagg ttgtagatat tattaaagaa cttcgttcga cttcttctcg taatgagaag 60
gaagcaatct tgactacaaa taaagacaat gaaaccctaa agaaagtttt ctaccttgct 120
tatgacccga gtatcaactt ttatattaaa agtattccat atgaagataa ttggaaacac 180
ggggaatatt ttgagtatga tgagaatgat gagtttgaga ttttgtttga tgttcttgaa 240
acaatttact ctcgtgaact gacagggaat aaagcaattt cttttttgac tggtgttttg 300
tcagaacggt caactgagat gcaagaacta atttgcaata ttgtcaagaa agatttggat 360
tgtggtgtcc agacaactac aattaataaa atatggaaag gcttgattac cgatccgcca 420
tatatgggtt atcagttgtt cagtgaaaaa ctaattaaaa gtttcaaact tccgtgttac 480
tcacaaatta aacttgatgg tctgtatgct gacgtatttg taatgaaaga ttctgttagt 540
tatcgttcac gaagtggtat taattgcaag ttcaaacttc cagataatgt agaagaaaaa 600
cttcttaatt tgtcacagtt cagcgatgtt gaatttgtcc tacactgcga ggctcttgtc 660
cgcaaaggtg agagttttac agagtttgag gaacgcaaaa ttggcaatgg atacttgaat 720
agtgatgaat ctgatccagg gaaagttgtt attgttatct gggatgttgt tggtattgat 780
gaatataaca atcgtaagtc aacagaagat tatagtgaac gttttaatct tgtagaaaag 840
attgtagaat acgttgacac accgcatgtt cagatggtag aatctcgttt ctgcaatgca 900
acacaagacg tcattgatca ttttgtagaa tcacgttcta aaggcatgga aggaactgta 960
atcaaatcac ctaaacttaa atggaaagat ggtaaagtta aagatggttt gaagctcaaa 1020
aatgaatttg tagttgagat gaaaattatt ggtttccaag aacatagtaa aagatctgga 1080
cagattggtg caatctttgt agaatctgaa gatggtgttg ttaagtgtaa agttggtagt 1140
ggtttgactg atgcacaacg caaaaaattc ttcttgacac aagatgaaat gattggtaag 1200
attgtaacag tgaaaggaaa tgatttggta actaacgaat tgaaacaaga tcgacatagt 1260
gtcttcttgc cacgttttgt tgaagtccgt gatgataaaa ctgttgctga tatgtttgac 1320
aaaattatgg caacaaaaga cagtattatt gatttgttga aaaatattaa ataa 1374
<210> 16
<211> 457
<212> PRT
<213> L13Rel4 amino acid sequence
<400> 16
Met Thr Lys Ser Val Thr Glu Ile Leu Asn Glu Leu Arg Ala Thr Ser
1 5 10 15
Ser Lys Asn Glu Lys Glu Arg Ile Ile Arg Glu Asn Ala Asp His Asp
20 25 30
Gly Leu Arg Glu Ala Phe Arg Val Ala Tyr Ser Lys Glu Leu Asn Phe
35 40 45
Phe Val Arg Gly Val Lys Asn Thr Tyr Gln Asn Pro Gly Leu Arg Pro
50 55 60
Leu Ser Asp Ser Ile Asn Asp Leu Val Thr Asn Ile Ala Gly Arg Leu
65 70 75 80
Tyr Thr Gly Asp Glu Ala Lys Ser Tyr Met Gln Gln Leu Ile Gly Leu
85 90 95
Cys Glu Glu Pro Asp Thr Leu Val Ala Ile Ile Asn Arg Asp Leu Glu
100 105 110
Cys Gly Val Gln Thr Thr Ile Thr Asn Lys Val Trp Lys Asp Leu Ile
115 120 125
Thr Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Thr Glu Lys Leu Leu
130 135 140
Arg Lys Phe Asn Phe Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly
145 150 155 160
Leu Tyr Ala Asp Ile Met Val Trp Pro Asp Gln Val Ile Tyr Arg Ser
165 170 175
Arg Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Gln Ala Val Glu Asp
180 185 190
Ala Leu Met Ser Ala Ala Cys Thr Arg Gly Pro Phe Val Ala His Gly
195 200 205
Glu Gly Leu Val Ile Asp Pro Thr Ala Arg His Gly Val Met Glu Arg
210 215 220
Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile Asp Arg
225 230 235 240
Asn Arg Val Arg Leu Val Val Trp Asp Met Val Asp Met Asp Asp Tyr
245 250 255
Ile Ala Arg Lys Ser Lys Val Glu Tyr Tyr Ile Arg Arg Asp Asn Thr
260 265 270
Ser Phe Leu Val Ala Glu Val Asp Val Leu Glu His Phe Gln Met Val
275 280 285
Arg Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile
290 295 300
Glu Met Arg Gln Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Asp
305 310 315 320
Met Leu Trp Gly Asp Asn Lys Thr Lys Lys Gly Ile Lys Leu Lys Asn
325 330 335
Glu Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys
340 345 350
Lys Glu Gly Trp Val Gly Ala Leu Ile Cys Gln Thr Arg Asp Gly Leu
355 360 365
Leu Glu Val Gly Ala Gly Ser Gly Leu Thr Asp Ala Leu Arg Gly Lys
370 375 380
Ser Pro Asp Tyr Phe Val Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp
385 390 395 400
Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg
405 410 415
Leu Asn Tyr Lys Phe Val Glu Ile Arg Arg Asp Lys Ser Ile Ala Asn
420 425 430
Ser Leu Glu Glu Val Ile Gln Ala Ala Asp Ser Leu Leu Glu Leu Leu
435 440 445
Arg Lys Ile Ala Glu Asp Val Asp Lys
450 455
<210> 17
<211> 466
<212> PRT
<213> L13Rel4 amino acid sequence with His-tag
<400> 17
Met Thr Lys Ser Val Thr Glu Ile Leu Asn Glu Leu Arg Ala Thr Ser
1 5 10 15
Ser Lys Asn Glu Lys Glu Arg Ile Ile Arg Glu Asn Ala Asp His Asp
20 25 30
Gly Leu Arg Glu Ala Phe Arg Val Ala Tyr Ser Lys Glu Leu Asn Phe
35 40 45
Phe Val Arg Gly Val Lys Asn Thr Tyr Gln Asn Pro Gly Leu Arg Pro
50 55 60
Leu Ser Asp Ser Ile Asn Asp Leu Val Thr Asn Ile Ala Gly Arg Leu
65 70 75 80
Tyr Thr Gly Asp Glu Ala Lys Ser Tyr Met Gln Gln Leu Ile Gly Leu
85 90 95
Cys Glu Glu Pro Asp Thr Leu Val Ala Ile Ile Asn Arg Asp Leu Glu
100 105 110
Cys Gly Val Gln Thr Thr Ile Thr Asn Lys Val Trp Lys Asp Leu Ile
115 120 125
Thr Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Thr Glu Lys Leu Leu
130 135 140
Arg Lys Phe Asn Phe Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly
145 150 155 160
Leu Tyr Ala Asp Ile Met Val Trp Pro Asp Gln Val Ile Tyr Arg Ser
165 170 175
Arg Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Gln Ala Val Glu Asp
180 185 190
Ala Leu Met Ser Ala Ala Cys Thr Arg Gly Pro Phe Val Ala His Gly
195 200 205
Glu Gly Leu Val Ile Asp Pro Thr Ala Arg His Gly Val Met Glu Arg
210 215 220
Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile Asp Arg
225 230 235 240
Asn Arg Val Arg Leu Val Val Trp Asp Met Val Asp Met Asp Asp Tyr
245 250 255
Ile Ala Arg Lys Ser Lys Val Glu Tyr Tyr Ile Arg Arg Asp Asn Thr
260 265 270
Ser Phe Leu Val Ala Glu Val Asp Val Leu Glu His Phe Gln Met Val
275 280 285
Arg Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile
290 295 300
Glu Met Arg Gln Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Asp
305 310 315 320
Met Leu Trp Gly Asp Asn Lys Thr Lys Lys Gly Ile Lys Leu Lys Asn
325 330 335
Glu Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys
340 345 350
Lys Glu Gly Trp Val Gly Ala Leu Ile Cys Gln Thr Arg Asp Gly Leu
355 360 365
Leu Glu Val Gly Ala Gly Ser Gly Leu Thr Asp Ala Leu Arg Gly Lys
370 375 380
Ser Pro Asp Tyr Phe Val Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp
385 390 395 400
Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg
405 410 415
Leu Asn Tyr Lys Phe Val Glu Ile Arg Arg Asp Lys Ser Ile Ala Asn
420 425 430
Ser Leu Glu Glu Val Ile Gln Ala Ala Asp Ser Leu Leu Glu Leu Leu
435 440 445
Arg Lys Ile Ala Glu Asp Val Asp Lys Gly Ser Gly His His His His
450 455 460
His His
465
<210> 18
<211> 1371
<212> DNA
<213> L13Rel4 cDNA
<400> 18
atgaccaagt cagtaactga gatccttaac gagctgcgtg caacctcgtc taagaacgaa 60
aaagagcgaa tcatccgtga gaatgctgat catgacggcc tgcgtgaagc atttcgtgta 120
gcttactcga aagagttgaa cttctttgtg cgtggcgtga agaacaccta ccagaacccg 180
ggcctgcgcc ctctttcgga cagcatcaac gatctggtaa cgaacatcgc tggccgcctg 240
tacaccggcg acgaagccaa gtcgtacatg cagcagctga tcggcttgtg tgaagagcct 300
gatacgctgg tggcgatcat caaccgcgat ctggagtgtg gtgtacagac aaccatcacc 360
aacaaagtgt ggaaggacct gatcaccgag cctccgtacc agagctacac gctgttcacc 420
gagaagttgc tgcgtaagtt caacttcaag ggcgctttct ccgatgagaa aatggacggt 480
ctgtatgcag acatcatggt atggcctgat caggttatct atcgctcacg atctggtaaa 540
gagctgaact tccgtgcccc acaggcagtg gaagatgcgc tgatgtcggc ggcctgcact 600
cgaggcccat tcgtggcaca cggtgaaggt ctggttatcg atccgacagc acgtcatggt 660
gttatggaac gtgcagaggg taacggctat ctgaaccaag atcctgaaga catcgaccga 720
aaccgggtcc gacttgttgt ctgggacatg gttgacatgg acgattacat cgcccgcaag 780
tcgaaagtcg aatattacat tcgtcgtgac aacaccagct tcttggttgc agaggtggat 840
gttcttgagc atttccagat ggttcgtggt cgtaagatca acagcctgaa agaggcgatc 900
gaccacttca tcgaaatgcg acagcagaag aaggaaggga cggtactcaa agaagctgat 960
atgttgtggg gtgacaacaa gaccaagaag ggtatcaaac tgaagaatga gtttgacgtc 1020
gatctggaag ttgttgcgac gacacctcac aagaagaagg aaggttgggt gggcgctctg 1080
atctgtcaga cacgtgatgg tctgcttgag gttggtgccg gttctggatt gacagatgca 1140
ctgcgtggca agtcaccaga ctacttcgtc ggccagatca tcacgatcaa ggcgaacgac 1200
atcacgaaat ctgagacgaa agaactccag tctctgttcc tgccacgact caactacaag 1260
tttgttgaga tccgccggga caagagcatc gccaacagtc tggaagaagt tatccaagct 1320
gctgactcac tgctggaact gctgcgtaaa attgcggagg atgtggataa a 1371
<210> 19
<211> 20
<212> DNA
<213> 20-mer DNA oligo
<400> 19
ggccagtgaa ttcgagctcg 20
<210> 20
<211> 23
<212> RNA
<213> 23-mer RNA oligo
<400> 20
acugauagaa guucccgaaa cag 23
<210> 21
<211> 43
<212> DNA
<213> 43-mer DNA oligo
<400> 21
ctgtttcggg aacttctatc agtcgagctc gaattcactg gcc 43
Claims (22)
- 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편으로서, 상기 DNA 리가제가 SEQ ID No. 1의 아미노산 서열을 포함하거나 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 DNA 리가제가 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있는, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편.
- 제1항에 있어서, DNA 리가제가 SEQ ID No. 1과 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편.
- 제1항에 있어서, DNA 리가제가,
(a) SEQ ID No. 1 또는 이와 적어도 80% 동일한 아미노산 서열,
(b) SEQ ID No. 7 또는 이와 적어도 80% 동일한 아미노산 서열,
(c) SEQ ID No. 10 또는 이와 적어도 80% 동일한 아미노산 서열, 또는
(d) SEQ ID No. 16 또는 이와 적어도 80% 동일한 아미노산 서열로부터 선택된 아미노산 서열을 갖고,
상기 DNA 리가제가 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있는,
분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편. - 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 DNA 리가제가 SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 7, SEQ ID No. 8, SEQ ID No. 10, SEQ ID No. 11, SEQ ID No. 16 및 SEQ ID No. 17 중 어느 하나로부터 선택된 아미노산 서열을 갖는, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편.
- 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 인코딩하거나 상기 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 단백질을 인코딩하는 재조합 핵산 분자.
- 제5항에 있어서, 상기 핵산 분자가 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 코돈-최적화된 서열을 포함하거나 이로 구성되는 재조합 핵산 분자.
- 제5항에 있어서, 상기 핵산 분자가 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 축퇴된 버전을 포함하거나 이로 구성되는 재조합 핵산 분자.
- 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자를 포함하거나 제5항 내지 제7항 중 어느 한 항에 따른 핵산 분자를 포함하거나 이로 구성된 벡터로서, 상기 벡터가 재조합 발현 벡터, 클로닝 벡터, 플라스미드, 바이러스 벡터, 코스미드, 람다 파지 또는 박테리아 인공 염색체인, 벡터.
- 제8항에 따른 벡터를 포함하는 숙주 세포로서, 상기 세포가 효모 세포, 곤충 세포, 인간 세포주 또는 박테리아 세포인, 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 조성물.
- 제10항에 있어서, 조성물이 완충액을 추가로 포함하고, 바람직하게는 상기 완충액이 ATP 및 2가 양이온을 포함하고, 상기 2가 양이온이 바람직하게는 Mn2+ 또는 Mg2+인, 조성물.
- 제10항 또는 제11항에 있어서, 조성물이 라이게이션될 핵산 분자를 포함하는 샘플에 적용하기 위한 용액인 조성물.
- 제10항 내지 제12항 중 어느 한 항에 있어서, 조성물이 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 적어도 하나의 5' 포스포릴-리보핵산 분자 및 적어도 하나의 제2 상보적 데옥시리보핵산 분자를 추가로 포함하고, 상기 DNA 리가제가 라이게이션 접합부에 걸쳐 있는 적어도 하나의 상보적 데옥시리보핵산 분자의 존재 하에 적어도 하나의 5' 포스포릴-리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있는, 조성물.
- a. 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편 또는 제10항에 따른 조성물을 포함하는 제1 용기;
b. ATP 및 2가 양이온을 포함하는 라이게이션 완충액을 포함하는 제2 용기;
c. 선택적으로 5'-포스포릴-리보핵산 분자의 5' 말단에 라이게이션될 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제3 용기로서, 상기 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 상기 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 상기 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 상기 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 제3 용기; 및
d. 선택적으로, 키트를 사용하기 위한 설명서를 포함하는,
데옥시리보핵산 분자를 리보핵산 분자의 말단에 라이게이션시키기 위한 키트. - 제14항에 있어서, 키트가 3'-하이드록실-리보핵산 분자의 3' 말단에 라이게이션될 적어도 하나의 제1 5'-포스포릴-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제4 용기를 포함하며, 상기 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 상기 5' 영역이 제1 5'-포스포릴-데옥시리보핵산 분자에 상보적이고, 상기 3' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 상기 3' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 제1 5'-포스포릴-데옥시리보핵산 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 키트.
- 이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법으로서, 상기 방법이 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항 또는 제11항에 따른 조성물과 접촉시키는 단계를 포함하는, 방법.
- 이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법으로서, 상기 방법이 이중 가닥 핵산 분자에서 5'-포스포릴 리보핵산 분자의 5' 말단에 대한 3'-하이드록실-데옥시리보핵산 분자의 라이게이션을 허용하는 조건 하에 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자를 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항에 따른 조성물과 접촉시키는 단계를 포함하고, 상기 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산이 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루는, 방법.
- 이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법으로서, 상기 방법이 이중 가닥 핵산 분자에서 리보핵산 분자의 3'-말단에 대한 5' 포스포릴-데옥시리보핵산 분자의 라이게이션을 허용하는 조건 하에 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항에 따른 조성물과 접촉시키는 단계를 포함하고, 상기 5' 포스포릴-데옥시리보핵산 분자 및 리보핵산 분자가 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루는, 방법.
- 제17항 또는 제18항에 있어서, 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자가 샘플에 포함되고, 상기 샘플이 ATP 및 2가 양이온, 바람직하게는 Mn2+ 또는 Mg2+를 추가로 포함하는, 방법.
- 시험관 내 전사의 목적을 위한 RNA 분자의 5' 말단에 프로모터 요소 및/또는 번역 인핸서 요소를 포함하는 cDNA 분자 합성에서 주형으로 작용하는 DNA 요소의 라이게이션인, 공지된 또는 공지되지 않은 서열의 RNA 분자를 포획하기 위한 RNA 5'-말단 어댑터 라이게이션을 위한 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항에 따른 조성물의 용도.
- 리보핵산 분자의 5' 말단 및 3' 말단에 데옥시리보핵산 분자를 라이게이션시키기 위한 방법으로서, 상기 방법이,
a. 리보핵산 분자의 집단을 포함하는 샘플을 제공하는 단계로서, 상기 리보핵산 분자 중 하나 이상이 5' 포스포릴-말단 기 및 3'-하이드록실-말단 기를 포함하는, 단계;
b. 적어도 하나의 제2 데옥시리보핵산의 존재 하에 리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시키는 단계로서, 상기 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 상기 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 상기 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 상기 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 단계; 및
c. 3' 영역 및 5' 영역을 포함하는 적어도 하나의 추가의 제2 데옥시리보핵산의 존재 하에 적어도 하나의 다른 5' 포스포릴-데옥시리보핵산 분자를 단계 b의 리보핵산 분자의 3'-말단에 라이게이션시키는 단계로서, 상기 5' 영역이 5' 포스포릴-데옥시리보핵산 분자에 상보적이고, 상기 3' 영역이 단계 b에서 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나, 상기 3' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 5' 포스포릴-데옥시리보핵산 및 추가의 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 단계를 포함하며;
상기 단계 b 및 c의 라이게이션 반응이 제1항 내지 제3항 중 어느 한 항에 따른 ATP-의존성 리가제 또는 제9항의 조성물에 의해 촉매작용되고, 단계 b 및 c의 라이게이션 반응이 동시에 또는 순차적으로 수행되는,
방법. - 제21항에 있어서, 샘플이 ATP 및 2가 양이온, 바람직하게는 Mn2+ 또는 Mg2+를 추가로 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20167251 | 2020-03-31 | ||
EP20167251.6 | 2020-03-31 | ||
PCT/EP2021/058452 WO2021198341A1 (en) | 2020-03-31 | 2021-03-31 | Atp-dependent dna ligase |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230026987A true KR20230026987A (ko) | 2023-02-27 |
Family
ID=70110176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227037488A KR20230026987A (ko) | 2020-03-31 | 2021-03-31 | Atp-의존성 dna 리가제 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230125232A1 (ko) |
EP (1) | EP4127147A1 (ko) |
JP (1) | JP2023520224A (ko) |
KR (1) | KR20230026987A (ko) |
CN (1) | CN115916965A (ko) |
CA (1) | CA3173175A1 (ko) |
WO (1) | WO2021198341A1 (ko) |
-
2021
- 2021-03-31 US US17/912,770 patent/US20230125232A1/en active Pending
- 2021-03-31 WO PCT/EP2021/058452 patent/WO2021198341A1/en unknown
- 2021-03-31 CN CN202180038971.3A patent/CN115916965A/zh active Pending
- 2021-03-31 EP EP21714243.9A patent/EP4127147A1/en active Pending
- 2021-03-31 JP JP2022560040A patent/JP2023520224A/ja active Pending
- 2021-03-31 KR KR1020227037488A patent/KR20230026987A/ko active Search and Examination
- 2021-03-31 CA CA3173175A patent/CA3173175A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230125232A1 (en) | 2023-04-27 |
CA3173175A1 (en) | 2021-10-07 |
CN115916965A (zh) | 2023-04-04 |
WO2021198341A1 (en) | 2021-10-07 |
JP2023520224A (ja) | 2023-05-16 |
EP4127147A1 (en) | 2023-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2787565B1 (en) | Transposon end compositions and methods for modifying nucleic acids | |
US20060240451A1 (en) | Compositions and methods employing 5' phosphate-dependent nucleic acid exonucleases | |
US10787702B2 (en) | Thermolabile exonucleases | |
CN112301019B (zh) | 新型耐高温arCas12a蛋白在核酸检测方面的应用 | |
WO2023169228A1 (zh) | 一种新型嗜热核酸内切酶突变体及其制备方法和应用 | |
WO2024112441A1 (en) | Double-stranded dna deaminases and uses thereof | |
EP2285953B1 (en) | Rna polyphosphatase compositions, kits, and uses thereof | |
EP0877084B1 (en) | Thermostable diaphorase gene | |
US20230125232A1 (en) | Atp-dependent dna ligase | |
CN113481174B (zh) | 核酸连接酶 | |
US20230340449A1 (en) | Thermostable ligase with reduced sequence bias | |
CN114958808B (zh) | 一种小型编辑基因组的CRISPR/Cas系统及其专用的CasX蛋白 | |
RU2809366C1 (ru) | Способ получения большого фрагмента Bst-полимеразы (варианты) | |
EP4265718A1 (en) | Novel single-subunit rna polymerase | |
JPWO2002010360A1 (ja) | 新規dna合成酵素 | |
Gustavsson | Cloning of an aldolase mutant | |
JP2022550810A (ja) | 海洋性dnaポリメラーゼi | |
US20160230156A1 (en) | Recombinant fusion protein possessing nuclease and phosphatase activity | |
JP2009136153A (ja) | 変異型rnaポリメラーゼ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |