KR102643631B1 - 올리고뉴클레오티드의 신규 생성 방법 - Google Patents
올리고뉴클레오티드의 신규 생성 방법 Download PDFInfo
- Publication number
- KR102643631B1 KR102643631B1 KR1020227022320A KR20227022320A KR102643631B1 KR 102643631 B1 KR102643631 B1 KR 102643631B1 KR 1020227022320 A KR1020227022320 A KR 1020227022320A KR 20227022320 A KR20227022320 A KR 20227022320A KR 102643631 B1 KR102643631 B1 KR 102643631B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- lys
- glu
- gly
- asp
- Prior art date
Links
- 108091034117 Oligonucleotide Proteins 0.000 title claims abstract description 365
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 title claims abstract description 161
- 238000000034 method Methods 0.000 title claims abstract description 136
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 23
- 230000008569 process Effects 0.000 title claims description 21
- 102000003960 Ligases Human genes 0.000 claims description 208
- 108090000364 Ligases Proteins 0.000 claims description 208
- 238000006243 chemical reaction Methods 0.000 claims description 198
- 239000012634 fragment Substances 0.000 claims description 191
- 125000003729 nucleotide group Chemical group 0.000 claims description 151
- 239000002773 nucleotide Substances 0.000 claims description 128
- 108090000623 proteins and genes Proteins 0.000 claims description 96
- 230000004048 modification Effects 0.000 claims description 70
- 238000012986 modification Methods 0.000 claims description 70
- 102000004169 proteins and genes Human genes 0.000 claims description 66
- 239000011324 bead Substances 0.000 claims description 64
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 55
- 239000012535 impurity Substances 0.000 claims description 51
- 239000000463 material Substances 0.000 claims description 44
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 claims description 34
- 229910019142 PO4 Inorganic materials 0.000 claims description 33
- 239000010452 phosphate Substances 0.000 claims description 30
- 235000000346 sugar Nutrition 0.000 claims description 29
- 230000000295 complement effect Effects 0.000 claims description 28
- 235000021317 phosphate Nutrition 0.000 claims description 27
- 230000015572 biosynthetic process Effects 0.000 claims description 26
- 238000003786 synthesis reaction Methods 0.000 claims description 26
- 102000004357 Transferases Human genes 0.000 claims description 25
- 108090000992 Transferases Proteins 0.000 claims description 25
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 23
- -1 fibrous support Substances 0.000 claims description 19
- 239000012528 membrane Substances 0.000 claims description 18
- 230000001225 therapeutic effect Effects 0.000 claims description 16
- 238000000137 annealing Methods 0.000 claims description 15
- 101710086015 RNA ligase Proteins 0.000 claims description 14
- 238000004925 denaturation Methods 0.000 claims description 14
- 230000036425 denaturation Effects 0.000 claims description 14
- 239000001913 cellulose Substances 0.000 claims description 12
- 229920002678 cellulose Polymers 0.000 claims description 12
- 108010042407 Endonucleases Proteins 0.000 claims description 11
- 108010090804 Streptavidin Proteins 0.000 claims description 11
- 230000002255 enzymatic effect Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 claims description 7
- TWGNOYAGHYUFFR-UHFFFAOYSA-N 5-methylpyrimidine Chemical compound CC1=CN=CN=C1 TWGNOYAGHYUFFR-UHFFFAOYSA-N 0.000 claims description 6
- 239000002202 Polyethylene glycol Substances 0.000 claims description 6
- 108020004459 Small interfering RNA Proteins 0.000 claims description 6
- 229920001223 polyethylene glycol Polymers 0.000 claims description 6
- 150000003839 salts Chemical class 0.000 claims description 6
- 239000004055 small Interfering RNA Substances 0.000 claims description 6
- 239000001226 triphosphate Substances 0.000 claims description 6
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 claims description 5
- YIMATHOGWXZHFX-WCTZXXKLSA-N (2r,3r,4r,5r)-5-(hydroxymethyl)-3-(2-methoxyethoxy)oxolane-2,4-diol Chemical compound COCCO[C@H]1[C@H](O)O[C@H](CO)[C@H]1O YIMATHOGWXZHFX-WCTZXXKLSA-N 0.000 claims description 4
- 102000004533 Endonucleases Human genes 0.000 claims description 4
- 229920000642 polymer Polymers 0.000 claims description 4
- 238000004064 recycling Methods 0.000 claims description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 claims description 3
- 239000007853 buffer solution Substances 0.000 claims description 3
- 150000001720 carbohydrates Chemical class 0.000 claims description 3
- 235000014633 carbohydrates Nutrition 0.000 claims description 3
- 239000000412 dendrimer Substances 0.000 claims description 3
- 229920000736 dendritic polymer Polymers 0.000 claims description 3
- ANCLJVISBRWUTR-UHFFFAOYSA-N diaminophosphinic acid Chemical compound NP(N)(O)=O ANCLJVISBRWUTR-UHFFFAOYSA-N 0.000 claims description 3
- 239000011521 glass Substances 0.000 claims description 3
- 150000004676 glycans Chemical class 0.000 claims description 3
- 229920001542 oligosaccharide Polymers 0.000 claims description 3
- 150000002482 oligosaccharides Chemical class 0.000 claims description 3
- 229920000620 organic polymer Polymers 0.000 claims description 3
- 150000003013 phosphoric acid derivatives Chemical class 0.000 claims description 3
- 229920001282 polysaccharide Polymers 0.000 claims description 3
- 239000005017 polysaccharide Substances 0.000 claims description 3
- 229910052717 sulfur Inorganic materials 0.000 claims description 3
- 239000011593 sulfur Substances 0.000 claims description 3
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 claims description 2
- 208000035657 Abasia Diseases 0.000 claims description 2
- 108091027076 Spiegelmer Proteins 0.000 claims description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 2
- 229910052760 oxygen Inorganic materials 0.000 claims description 2
- 239000001301 oxygen Substances 0.000 claims description 2
- 125000006239 protecting group Chemical group 0.000 claims description 2
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 claims 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 claims 1
- 102000004190 Enzymes Human genes 0.000 abstract description 30
- 108090000790 Enzymes Proteins 0.000 abstract description 30
- 238000002560 therapeutic procedure Methods 0.000 abstract description 2
- 239000000047 product Substances 0.000 description 216
- 108010034529 leucyl-lysine Proteins 0.000 description 85
- 238000004128 high performance liquid chromatography Methods 0.000 description 80
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 66
- 108010061982 DNA Ligases Proteins 0.000 description 48
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 48
- 238000000926 separation method Methods 0.000 description 48
- 102000012410 DNA Ligases Human genes 0.000 description 46
- 108010050848 glycylleucine Proteins 0.000 description 44
- 239000000243 solution Substances 0.000 description 42
- 108020004414 DNA Proteins 0.000 description 40
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 34
- 108010003137 tyrosyltyrosine Proteins 0.000 description 34
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 33
- 108010073969 valyllysine Proteins 0.000 description 33
- 150000007523 nucleic acids Chemical class 0.000 description 32
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 30
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 30
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 29
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 29
- 108010062796 arginyllysine Proteins 0.000 description 29
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 29
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 28
- 238000010438 heat treatment Methods 0.000 description 27
- 108020004707 nucleic acids Proteins 0.000 description 27
- 102000039446 nucleic acids Human genes 0.000 description 27
- 241000305071 Enterobacterales Species 0.000 description 24
- 108010038633 aspartylglutamate Proteins 0.000 description 24
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 23
- 239000000872 buffer Substances 0.000 description 23
- 108010054813 diprotin B Proteins 0.000 description 23
- 108010017391 lysylvaline Proteins 0.000 description 23
- 239000013615 primer Substances 0.000 description 23
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 22
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 22
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 22
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 22
- 239000006228 supernatant Substances 0.000 description 22
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 21
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 21
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 21
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 21
- 108010016616 cysteinylglycine Proteins 0.000 description 21
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 21
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 20
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 20
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 20
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 20
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 20
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 20
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 20
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 20
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 20
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 20
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 20
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 20
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 20
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 20
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 20
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 20
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 20
- 238000010367 cloning Methods 0.000 description 20
- 238000002474 experimental method Methods 0.000 description 20
- 238000000605 extraction Methods 0.000 description 20
- 239000002002 slurry Substances 0.000 description 20
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 19
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 19
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 19
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 19
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 19
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 19
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 19
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 19
- 108010066427 N-valyltryptophan Proteins 0.000 description 19
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 19
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 19
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 19
- 239000002953 phosphate buffered saline Substances 0.000 description 19
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 19
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 18
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 18
- 238000011026 diafiltration Methods 0.000 description 18
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 17
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 17
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 17
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 17
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 17
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 16
- 241000588724 Escherichia coli Species 0.000 description 16
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 16
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 16
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 16
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 16
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 16
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 16
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 16
- 108010092854 aspartyllysine Proteins 0.000 description 16
- 238000010561 standard procedure Methods 0.000 description 16
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 15
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 15
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 15
- BBYTXXRNSFUOOX-IHRRRGAJSA-N Arg-Cys-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BBYTXXRNSFUOOX-IHRRRGAJSA-N 0.000 description 15
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 15
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 15
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 15
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 15
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 15
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 15
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 15
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 15
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 15
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 15
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 15
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 15
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 15
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 15
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 15
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 15
- 241000880493 Leptailurus serval Species 0.000 description 15
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 15
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 15
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 15
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 15
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 15
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 15
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 15
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 15
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 15
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 15
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 15
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 15
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 15
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 15
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 15
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 15
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 15
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 15
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 15
- 108010000761 leucylarginine Proteins 0.000 description 15
- 108010003700 lysyl aspartic acid Proteins 0.000 description 15
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 15
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 14
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 14
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 14
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 14
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 14
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 14
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 14
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 14
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 14
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 14
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 14
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 14
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 14
- BCSYBBMFGLHCOA-ACZMJKKPSA-N Cys-Glu-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BCSYBBMFGLHCOA-ACZMJKKPSA-N 0.000 description 14
- ORYFTECKJZTNQP-DCAQKATOSA-N Cys-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N ORYFTECKJZTNQP-DCAQKATOSA-N 0.000 description 14
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 14
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 14
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 14
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 14
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 14
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 14
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 14
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 14
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 14
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 14
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 14
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 14
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 14
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 14
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 14
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 14
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 14
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 14
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 14
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 14
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 14
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 14
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 14
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 14
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 14
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 14
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 14
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 14
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 14
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 14
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 14
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 14
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 14
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 14
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 14
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 14
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 14
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 14
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 14
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 14
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 14
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 14
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 14
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 14
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 14
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 14
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 14
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 14
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 14
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 14
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 14
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 14
- 108010087823 glycyltyrosine Proteins 0.000 description 14
- 108010037850 glycylvaline Proteins 0.000 description 14
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 14
- 108010038320 lysylphenylalanine Proteins 0.000 description 14
- 108010070643 prolylglutamic acid Proteins 0.000 description 14
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 14
- 108010051110 tyrosyl-lysine Proteins 0.000 description 14
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 13
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 13
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 13
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 13
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 13
- 108010009298 lysylglutamic acid Proteins 0.000 description 13
- 239000012466 permeate Substances 0.000 description 13
- 239000011541 reaction mixture Substances 0.000 description 13
- 230000001419 dependent effect Effects 0.000 description 12
- 238000001914 filtration Methods 0.000 description 12
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 12
- 238000010532 solid phase synthesis reaction Methods 0.000 description 12
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 11
- 235000010980 cellulose Nutrition 0.000 description 11
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 11
- 239000007787 solid Substances 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 239000012465 retentate Substances 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 9
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 9
- 241001541469 Shigella phage Shf125875 Species 0.000 description 9
- 108010018006 histidylserine Proteins 0.000 description 9
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 8
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 8
- 108010008758 Chlorella virus DNA ligase Proteins 0.000 description 8
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 8
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 8
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 125000003275 alpha amino acid group Chemical group 0.000 description 8
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 8
- 238000005251 capillar electrophoresis Methods 0.000 description 8
- 238000005119 centrifugation Methods 0.000 description 8
- 238000010511 deprotection reaction Methods 0.000 description 8
- 108010078144 glutaminyl-glycine Proteins 0.000 description 8
- 150000004713 phosphodiesters Chemical class 0.000 description 8
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 8
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 7
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 7
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 7
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 7
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 7
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 7
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 7
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 7
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 7
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 7
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 7
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 7
- LMLBOGIOLHZXOT-JYJNAYRXSA-N Tyr-Glu-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O LMLBOGIOLHZXOT-JYJNAYRXSA-N 0.000 description 7
- 238000006209 dephosphorylation reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 6
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 6
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 6
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 6
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 6
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 6
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 6
- YGHCVNQOZZMHRZ-DJFWLOJKSA-N Asn-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N YGHCVNQOZZMHRZ-DJFWLOJKSA-N 0.000 description 6
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 6
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 6
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- 241001469056 Enterobacter phage CC31 Species 0.000 description 6
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 6
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 6
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 6
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 6
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 6
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 6
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 6
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 6
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 6
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 6
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 6
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 6
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 6
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 6
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 6
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 6
- 229920001213 Polysorbate 20 Polymers 0.000 description 6
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 6
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 6
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 6
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 6
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 6
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 6
- 108010070783 alanyltyrosine Proteins 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 238000009295 crossflow filtration Methods 0.000 description 6
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 6
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 108010084389 glycyltryptophan Proteins 0.000 description 6
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 6
- 238000002515 oligonucleotide synthesis Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 6
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 239000007790 solid phase Substances 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 5
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 5
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 5
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 5
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 5
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 5
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 5
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 5
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 5
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 5
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 5
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 5
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 5
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 5
- DOMHVQBSRJNNKD-ZPFDUUQYSA-N Gln-Met-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DOMHVQBSRJNNKD-ZPFDUUQYSA-N 0.000 description 5
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 5
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 5
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 5
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 5
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 5
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 5
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 5
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 5
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 5
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 5
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 5
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 5
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 5
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 5
- RWHRUZORDWZESH-ZQINRCPSSA-N Ile-Trp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RWHRUZORDWZESH-ZQINRCPSSA-N 0.000 description 5
- 229930010555 Inosine Natural products 0.000 description 5
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 5
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 5
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 5
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 5
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 5
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 5
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 5
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 5
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 5
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 5
- KTINOHQFVVCEGQ-XIRDDKMYSA-N Lys-Trp-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CC(O)=O)C(O)=O KTINOHQFVVCEGQ-XIRDDKMYSA-N 0.000 description 5
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 5
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 5
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 5
- NSMXRFMGZYTFEX-KJEVXHAQSA-N Met-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCSC)N)O NSMXRFMGZYTFEX-KJEVXHAQSA-N 0.000 description 5
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 5
- YTGGLKWSVIRECD-JBACZVJFSA-N Phe-Trp-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 YTGGLKWSVIRECD-JBACZVJFSA-N 0.000 description 5
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 5
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 5
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 5
- 239000007983 Tris buffer Substances 0.000 description 5
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 5
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 5
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 5
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 5
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 5
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 5
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 5
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 5
- 238000004587 chromatography analysis Methods 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 108010040030 histidinoalanine Proteins 0.000 description 5
- 229960003786 inosine Drugs 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- 238000007169 ligase reaction Methods 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 238000004949 mass spectrometry Methods 0.000 description 5
- 238000002844 melting Methods 0.000 description 5
- 230000008018 melting Effects 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 4
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 4
- UZNSWMFLKVKJLI-VHWLVUOQSA-N Asp-Ile-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UZNSWMFLKVKJLI-VHWLVUOQSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 4
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 4
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 4
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 4
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 4
- URBJRJKWSUFCKS-AVGNSLFASA-N Lys-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N URBJRJKWSUFCKS-AVGNSLFASA-N 0.000 description 4
- 101710163270 Nuclease Proteins 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 4
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 4
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 4
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 230000030609 dephosphorylation Effects 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000004460 liquid liquid chromatography Methods 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 150000008300 phosphoramidites Chemical class 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 235000011178 triphosphate Nutrition 0.000 description 4
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 3
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 3
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 3
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 3
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 3
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 3
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 3
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 3
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 3
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 3
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 3
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 3
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 3
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 3
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 3
- 241000191967 Staphylococcus aureus Species 0.000 description 3
- 108010076818 TEV protease Proteins 0.000 description 3
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 3
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010036533 arginylvaline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 238000004185 countercurrent chromatography Methods 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 238000010494 dissociation reaction Methods 0.000 description 3
- 230000005593 dissociations Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 239000011544 gradient gel Substances 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000004255 ion exchange chromatography Methods 0.000 description 3
- 238000011031 large-scale manufacturing process Methods 0.000 description 3
- 239000012160 loading buffer Substances 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 239000000376 reactant Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000007858 starting material Substances 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- AKVIWWJLBFWFLM-UHFFFAOYSA-N (2-amino-2-oxoethyl)phosphonic acid Chemical compound NC(=O)CP(O)(O)=O AKVIWWJLBFWFLM-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical group OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000691306 Actia Species 0.000 description 2
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 2
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 2
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 2
- 108091023037 Aptamer Proteins 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 2
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 101100346156 Caenorhabditis elegans moe-3 gene Proteins 0.000 description 2
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102100037696 Endonuclease V Human genes 0.000 description 2
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 2
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 2
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 2
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 2
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 2
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 2
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 2
- WVUDHMBJNBWZBU-XUXIUFHCSA-N Ile-Lys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N WVUDHMBJNBWZBU-XUXIUFHCSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 2
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 2
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 2
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 2
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Chemical group OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- WHVSJHJTMUHYBT-SRVKXCTJSA-N Val-Met-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N WHVSJHJTMUHYBT-SRVKXCTJSA-N 0.000 description 2
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 229920001222 biopolymer Polymers 0.000 description 2
- 238000000738 capillary electrophoresis-mass spectrometry Methods 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 238000004440 column chromatography Methods 0.000 description 2
- 238000005112 continuous flow technique Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 150000002466 imines Chemical class 0.000 description 2
- 230000003308 immunostimulating effect Effects 0.000 description 2
- 239000013067 intermediate product Substances 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- PXQPEWDEAKTCGB-UHFFFAOYSA-N orotic acid Chemical compound OC(=O)C1=CC(=O)NC(=O)N1 PXQPEWDEAKTCGB-UHFFFAOYSA-N 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 229910000160 potassium phosphate Inorganic materials 0.000 description 2
- 235000011009 potassium phosphates Nutrition 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- NSMOSDAEGJTOIQ-CRCLSJGQSA-N (2r,3s)-2-(hydroxymethyl)oxolan-3-ol Chemical compound OC[C@H]1OCC[C@@H]1O NSMOSDAEGJTOIQ-CRCLSJGQSA-N 0.000 description 1
- MUVQIIBPDFTEKM-IUYQGCFVSA-N (2r,3s)-2-aminobutane-1,3-diol Chemical compound C[C@H](O)[C@H](N)CO MUVQIIBPDFTEKM-IUYQGCFVSA-N 0.000 description 1
- KZVAAIRBJJYZOW-LMVFSUKVSA-N (2r,3s,4s)-2-(hydroxymethyl)oxolane-3,4-diol Chemical compound OC[C@H]1OC[C@H](O)[C@@H]1O KZVAAIRBJJYZOW-LMVFSUKVSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- MZLSNIREOQCDED-UHFFFAOYSA-N 1,3-difluoro-2-methylbenzene Chemical compound CC1=C(F)C=CC=C1F MZLSNIREOQCDED-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- UZDMJOILBYFRMP-UHFFFAOYSA-N 2-[2-[2-[(2-amino-3-methylpentanoyl)amino]propanoylamino]propanoylamino]-3-methylpentanoic acid Chemical compound CCC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)C(C)CC UZDMJOILBYFRMP-UHFFFAOYSA-N 0.000 description 1
- FMYBFLOWKQRBST-UHFFFAOYSA-N 2-[bis(carboxymethyl)amino]acetic acid;nickel Chemical compound [Ni].OC(=O)CN(CC(O)=O)CC(O)=O FMYBFLOWKQRBST-UHFFFAOYSA-N 0.000 description 1
- BCGYGWYRGHQYML-UHFFFAOYSA-N 2-cyclopentylpurin-2-amine Chemical compound N1=CC2=NC=NC2=NC1(N)C1CCCC1 BCGYGWYRGHQYML-UHFFFAOYSA-N 0.000 description 1
- IPPYUXVFNVMHCP-UHFFFAOYSA-N 2-propylpurin-2-amine Chemical compound CCCC1(N)N=CC2=NC=NC2=N1 IPPYUXVFNVMHCP-UHFFFAOYSA-N 0.000 description 1
- HLPXUVWTMGENBN-UHFFFAOYSA-N 3-methylidenemorpholine Chemical group C=C1COCCN1 HLPXUVWTMGENBN-UHFFFAOYSA-N 0.000 description 1
- YJHUFZQMNTWHBO-UHFFFAOYSA-N 5-(aminomethyl)-1h-pyrimidine-2,4-dione Chemical compound NCC1=CNC(=O)NC1=O YJHUFZQMNTWHBO-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- JDBGXEHEIRGOBU-UHFFFAOYSA-N 5-hydroxymethyluracil Chemical compound OCC1=CNC(=O)NC1=O JDBGXEHEIRGOBU-UHFFFAOYSA-N 0.000 description 1
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 1
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 1
- TVICROIWXBFQEL-UHFFFAOYSA-N 6-(ethylamino)-1h-pyrimidin-2-one Chemical compound CCNC1=CC=NC(=O)N1 TVICROIWXBFQEL-UHFFFAOYSA-N 0.000 description 1
- ZOHFTRWZZPGYIS-UHFFFAOYSA-N 6-amino-5-(aminomethyl)-1h-pyrimidin-2-one Chemical compound NCC1=CNC(=O)N=C1N ZOHFTRWZZPGYIS-UHFFFAOYSA-N 0.000 description 1
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 1
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 1
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 231100000582 ATP assay Toxicity 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N Adenosine Natural products C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108020004634 Archaeal DNA Proteins 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- CFGHCPUPFHWMCM-FDARSICLSA-N Arg-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N CFGHCPUPFHWMCM-FDARSICLSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- UWOPETAWXDZUJR-ACZMJKKPSA-N Asp-Cys-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O UWOPETAWXDZUJR-ACZMJKKPSA-N 0.000 description 1
- QQXOYLWJQUPXJU-WHFBIAKZSA-N Asp-Cys-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O QQXOYLWJQUPXJU-WHFBIAKZSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- CPAJYCKJILOUHF-UHFFFAOYSA-N C1(CCCC1)C1(NC(C2=NC=NC2=N1)=O)N Chemical compound C1(CCCC1)C1(NC(C2=NC=NC2=N1)=O)N CPAJYCKJILOUHF-UHFFFAOYSA-N 0.000 description 1
- QOSATKMQPHFEIW-UHFFFAOYSA-N COP(O)=S Chemical compound COP(O)=S QOSATKMQPHFEIW-UHFFFAOYSA-N 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- 125000000824 D-ribofuranosyl group Chemical group [H]OC([H])([H])[C@@]1([H])OC([H])(*)[C@]([H])(O[H])[C@]1([H])O[H] 0.000 description 1
- GUBGYTABKSRVRQ-WFVLMXAXSA-N DEAE-cellulose Chemical compound OC1C(O)C(O)C(CO)O[C@H]1O[C@@H]1C(CO)OC(O)C(O)C1O GUBGYTABKSRVRQ-WFVLMXAXSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 1
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 1
- APWLZZSLCXLDCF-CIUDSAMLSA-N Gln-Cys-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O APWLZZSLCXLDCF-CIUDSAMLSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- XOEKMEAOMXMURD-JYJNAYRXSA-N Glu-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O XOEKMEAOMXMURD-JYJNAYRXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 1
- TVSPLSZTKTUYLV-ZPFDUUQYSA-N Ile-Glu-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O TVSPLSZTKTUYLV-ZPFDUUQYSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- CEPIAEUVRKGPGP-DSYPUSFNSA-N Ile-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 CEPIAEUVRKGPGP-DSYPUSFNSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- 108010058683 Immobilized Proteins Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- RAAVFTFEAUAVIY-DCAQKATOSA-N Met-Glu-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N RAAVFTFEAUAVIY-DCAQKATOSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- MKYBYDHXWVHEJW-UHFFFAOYSA-N N-[1-oxo-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propan-2-yl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(C(C)NC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 MKYBYDHXWVHEJW-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 108090000119 Nucleotidyltransferases Proteins 0.000 description 1
- 102000003832 Nucleotidyltransferases Human genes 0.000 description 1
- PKUWKAXTAVNIJR-UHFFFAOYSA-N O,O-diethyl hydrogen thiophosphate Chemical compound CCOP(O)(=S)OCC PKUWKAXTAVNIJR-UHFFFAOYSA-N 0.000 description 1
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- CJXURNZYNHCYFD-WDCWCFNPSA-N Thr-Lys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CJXURNZYNHCYFD-WDCWCFNPSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- XSTXAVWGXDQKEL-UHFFFAOYSA-N Trichloroethylene Chemical compound ClC=C(Cl)Cl XSTXAVWGXDQKEL-UHFFFAOYSA-N 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 1
- VNRTXOUAOUZCFW-WDSOQIARSA-N Trp-Val-His Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O VNRTXOUAOUZCFW-WDSOQIARSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 1
- GFJXBLSZOFWHAW-JYJNAYRXSA-N Tyr-His-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GFJXBLSZOFWHAW-JYJNAYRXSA-N 0.000 description 1
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 1
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- HSULLSUSGAHAOJ-UHFFFAOYSA-N acetic acid;hexan-1-amine Chemical compound CC([O-])=O.CCCCCC[NH3+] HSULLSUSGAHAOJ-UHFFFAOYSA-N 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- NHQSDCRALZPVAJ-HJQYOEGKSA-N agmatidine Chemical compound NC(=N)NCCCCNC1=NC(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NHQSDCRALZPVAJ-HJQYOEGKSA-N 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 235000019169 all-trans-retinol Nutrition 0.000 description 1
- 239000011717 all-trans-retinol Substances 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 125000005340 bisphosphate group Chemical group 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- JADWVLYMWVNVAN-UHFFFAOYSA-N ctk0h5271 Chemical compound NP(N)(O)=S JADWVLYMWVNVAN-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- BOKOVLFWCAFYHP-UHFFFAOYSA-N dihydroxy-methoxy-sulfanylidene-$l^{5}-phosphane Chemical compound COP(O)(O)=S BOKOVLFWCAFYHP-UHFFFAOYSA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical class [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- ZJXZSIYSNXKHEA-UHFFFAOYSA-N ethyl dihydrogen phosphate Chemical compound CCOP(O)(O)=O ZJXZSIYSNXKHEA-UHFFFAOYSA-N 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 238000000589 high-performance liquid chromatography-mass spectrometry Methods 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000002013 hydrophilic interaction chromatography Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010075702 lysyl-valyl-aspartyl-leucine Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- CAAULPUQFIIOTL-UHFFFAOYSA-N methyl dihydrogen phosphate Chemical compound COP(O)(O)=O CAAULPUQFIIOTL-UHFFFAOYSA-N 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000001728 nano-filtration Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229920002842 oligophosphate Polymers 0.000 description 1
- 229960005010 orotic acid Drugs 0.000 description 1
- 125000003431 oxalo group Chemical group 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 238000004810 partition chromatography Methods 0.000 description 1
- 230000002572 peristaltic effect Effects 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- XUYJLQHKOGNDPB-UHFFFAOYSA-N phosphonoacetic acid Chemical compound OC(=O)CP(O)(O)=O XUYJLQHKOGNDPB-UHFFFAOYSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 229920005597 polymer membrane Polymers 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- LCDCPQHFCOBUEF-UHFFFAOYSA-N pyrrolidine-1-carboxamide Chemical compound NC(=O)N1CCCC1 LCDCPQHFCOBUEF-UHFFFAOYSA-N 0.000 description 1
- 150000003235 pyrrolidines Chemical class 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- PETSAYFQSGAEQY-UHFFFAOYSA-N ricinine Chemical compound COC=1C=CN(C)C(=O)C=1C#N PETSAYFQSGAEQY-UHFFFAOYSA-N 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-M sulfamate Chemical compound NS([O-])(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-M 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- PCYCVCFVEKMHGA-UHFFFAOYSA-N thiirane 1-oxide Chemical compound O=S1CC1 PCYCVCFVEKMHGA-UHFFFAOYSA-N 0.000 description 1
- ZEMGGZBWXRYJHK-UHFFFAOYSA-N thiouracil Chemical compound O=C1C=CNC(=S)N1 ZEMGGZBWXRYJHK-UHFFFAOYSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 238000007039 two-step reaction Methods 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1031—Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1264—DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/314—Phosphoramidates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/321—2'-O-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/322—2'-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/323—Chemical structure of the sugar modified ring structure
- C12N2310/3231—Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
- C12N2310/332—Abasic residue
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/341—Gapmers, i.e. of the type ===---===
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/345—Spatial arrangement of the modifications having at least two different backbone modifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/346—Spatial arrangement of the modifications having a combination of backbone and sugar modifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y605/00—Ligases forming phosphoric ester bonds (6.5)
- C12Y605/01—Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
- C12Y605/01003—RNA ligase (ATP) (6.5.1.3)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 효소를 사용하여 올리고뉴클레오티드를 생성하는 신규 방법에 관한 것이며, 여기서 상기 방법은 화학적으로 변형된 올리고뉴클레오티드, 예컨대 요법에 사용하기 위한 것의 생성에 사용하기에 적합하다.
Description
본 발명은 효소를 사용하여 올리고뉴클레오티드를 생성하는 신규 방법에 관한 것이며, 여기서 상기 방법은 화학적으로 변형된 올리고뉴클레오티드, 예컨대 요법에 사용하기 위한 화학적으로 변형된 올리고뉴클레오티드의 생성에 사용하기에 적합하다.
포스포르아미다이트 화학을 통한 올리고뉴클레오티드 및 변형된 올리고뉴클레오티드의 화학적 합성은 잘 확립되어 있으며, 수십년 동안 이들 정의된 서열 생체고분자를 합성하기 위한 선택된 방법이었다. 합성 공정은 통상적으로 고체상 합성으로서 실행되며, 여기서 단일 뉴클레오티드는 각각의 뉴클레오티드의 첨가와 함께 순차적으로 첨가되며, 이는 후속 단계를 위해 제조에서 성장하는 올리고뉴클레오티드 ("올리고")를 첨가하고 탈보호하기 위해 여러 화학적 단계의 사이클을 필요로 한다. 뉴클레오티드의 순차적 첨가 종료시, 올리고가 고체상 지지체로부터 방출되고, 추가 탈보호가 일어난 다음, 조질 올리고뉴클레오티드가 컬럼 크로마토그래피에 의해 추가로 정제된다.
이 방법은 일상적인 것으로 간주될 수 있고 자동화될 수 있지만, 특히 올리고뉴클레오티드 치료제를 위해 필요로 되는 대규모로 올리고뉴클레오티드를 제조하는 것이 목표인 경우, 이 방법에는 여러 단점이 있다. 이들 단점은 다음을 포함하나, 이에 제한되지는 않는다:
1) 크로마토그래피 사용에 내재된 실제적인 한계로 인해 대량의 올리고뉴클레오티드를 정제하는데 적합하지 않다. 대규모 크로마토그래피의 사용은 고가이고, 컬럼 크기 및 성능의 한계로 인해 성취하기 어렵다.
2) 합성되는 올리고뉴클레오티드의 길이에 따라 오류의 수가 누적된다. 따라서, 현재 공정의 선형 순차적 성질은 수율의 기하학적 저하를 초래한다. 예를 들어, 뉴클레오티드 첨가의 각각의 사이클에 대한 수율이 99%인 경우, 20 머의 수율은 83%일 것이다.
3) 합성 올리고뉴클레오티드 합성기 및 하류 정제 및 단리 장비에 대한 규모 제한: 현재는 단일 배치로 생성될 수 있는 생성물의 최대량은 대략 10 kg이다.
따라서, 컬럼 크로마토그래피를 감소시키고 (또는 이상적으로 제거하고) 또한 수율을 증가시키기 위해 순수하게 순차적이지 않은 방식으로 합성을 수행할 필요가 있다.
DNA 폴리머라제는 종종 분자 생물학 및 유사한 응용에 사용하기 위한 올리고뉴클레오티드를 합성하는데 사용된다. 그러나, DNA 폴리머라제는 상대적으로 짧은 길이의 올리고뉴클레오티드 및 상이한 데옥시리보스 또는 리보스 변형을 갖는 뉴클레오티드를 구별할 필요성 모두로 인해 치료용 올리고뉴클레오티드의 합성에 부적합하다. 예를 들어, 치료용 올리고뉴클레오티드는 종종 20 내지 25개 범위의 뉴클레오티드이다. DNA 폴리머라제는 각각의 방향으로 프라이머로서 적어도 7 또는 8개의 뉴클레오티드, 및 최적으로 18 내지 22개의 뉴클레오티드를 필요로 하므로, 프라이머가 목적 생성물과 크기가 유사한 경우 치료용 올리고를 합성하려는 시도가 거의 없다. 또한, DNA 폴리머라제는 모든 뉴클레오티드가 반응에 존재할 것을 요구하고, 들어오는 뉴클레오티드를 정렬하기 위해 왓슨-크릭 염기 쌍형성에 의존한다. 그러므로, DNA 폴리머라제는 데옥시리보스 또는 리보스 변형, 예컨대 갭머(gapmer)에 의해 요구되는 변형의 임의의 순서를 구별할 수 없고, 결과는 주어진 위치에서 데옥시리보스 또는 리보스 변형의 혼합일 것이다.
<발명의 요약>
본 발명은 적어도 하나의 변형된 뉴클레오티드 잔기를 갖는 단일-가닥 올리고뉴클레오티드 생성물의 생성 방법이며,
a) 생성물 서열의 절편을 포함하는 올리고뉴클레오티드 (I)의 풀을 제공하는 단계이며, 여기서 생성물 서열의 적어도 하나의 절편은 적어도 하나의 변형된 뉴클레오티드 잔기를 함유하고, 각각의 절편은 효소적 합성 또는 고체상 합성에 의해 생성된 것인 단계;
b) 단일-가닥 올리고뉴클레오티드 생성물의 서열과 상보적인 주형 올리고뉴클레오티드 (II)를 제공하는 단계이며, 상기 주형은 생성물로부터 분리되어 향후 반응에 사용하기 위해 재순환되는 것을 허용하는 특성을 갖는 것인 단계;
c) 주형 올리고뉴클레오티드로의 절편 올리고뉴클레오티드의 어닐링을 허용하는 조건에서 (I) 및 (II)를 접촉시키는 단계;
d) 리가제를 사용하여 절편 올리고뉴클레오티드를 연결하여 생성물을 형성하는 단계;
e) 어닐링된 주형 및 임의의 불순물 올리고뉴클레오티드 가닥을 변성시키기 위해 조건을 변화시키고, 불순물을 분리하는 단계;
f) 어닐링된 주형 및 생성물 올리고뉴클레오티드 가닥을 변성시키기 위해 조건을 변화시키고, 단일-가닥 올리고뉴클레오티드 생성물을 분리하는 단계; 및
g) 향후 반응에 사용하기 위해 주형 올리고뉴클레오티드를 재순환시키는 단계
를 포함하는 방법을 제공한다.
본 발명은 또한 이중-가닥 올리고뉴클레오티드 생성물의 생성 방법을 제공하며, 여기서 단일-가닥 올리고뉴클레오티드 생성물을 생성하기 위한 상기 언급된 방법에 의해 생성된 2개의 상보적 단일-가닥 올리고뉴클레오티드는 어닐링을 허용하는 조건 하에 혼합된다.
<도면의 설명>
도 1 절편 올리고뉴클레오티드의 효소적 생성의 개략도: a) 2-단계 반응: 첨가 및 탈보호를 포함하는 절편 합성을 위한 3'-연장. 예시적인 첨가 단계는 단일-가닥 핵산 프라이머의 3'-OH로의 뉴클레오티드-3',5'-비스(티오)포스페이트의 ATP 의존적 라이게이션 및 이어서 포스파타제에 의한 단일-가닥 올리고뉴클레오티드 상의 3'-포스페이트의 탈보호를 수반한다; 및 b) 절편 서열을 생성하기 위한 예시적인 3'-연장 (첨가 및 탈보호), 이어서 부위-특이적 뉴클레아제 (예를 들어, 엔도뉴클레아제 V - 이노신 후, 즉 이노신에 대해 3'에 있는 제2 포스포디에스테르 결합에서 1개의 염기를 절단함)를 사용한 쇄 절단에 의한 절편의 방출.
도 2 절편 올리고뉴클레오티드를 라이게이션하여 생성물을 형성하는 단계, 및 불순물을 제거하기 위해 조건을 변화시키는 단계를 포함하는 본 발명의 방법의 개략도.
도 3 다수의 주형 배열의 개략도.
도 4 플로우 시스템에서 수행되는 본 발명의 방법의 기본 개략도.
도 5 플로우 시스템에서 수행되는 본 발명의 방법의 상세한 개략도: a) 라이게이션 화학 섹션, b) 라이게이션 정제 섹션, 및 c) 대안적인 라이게이션 화학 섹션, 및 d) 대안적인 정제 섹션. N.B. 섹션 a) 및 b) (대안적으로 c) 및 d))는 단일 단계로 수행될 수 있다 (예를 들어, a)에서 수집 용기 = b)에서 라이게이션 단계로부터의 출력).
도 6 본 발명의 방법 동안 생성될 수 있는 불순물의 예.
도 7 상업용 NEB T4 리가제 (서열식별번호(SEQ ID NO):3) 및 비변형된 DNA (실시예 1)를 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 8 펄로자(PERLOZA) 결합된 T4 리가제 (서열식별번호: 4) 및 비변형된 DNA (실시예 1)를 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 9 실시예 2에 따라 발현된 펄로자 결합된 T4 리가제 및 2'-OMe 변형된 올리고뉴클레오티드 단편을 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 10 실시예 4에 대한 HPLC 트레이스: 상부 트레이스 (a) - 리가제 대조군 없음. 하부 트레이스 (b) - 클론 A4. 생성물 및 주형은 이 HPLC 방법에서 공동-용리한다. 2개의 중간체 라이게이션 단편 (절편)은 10.3 및 11.2분에 클론 A4 트레이스에서 볼 수 있다.
도 11 "허브"로 지칭되는 지지체 물질 및 3개의 주형 서열을 포함하는, 실시예 13에서 사용된 "트리-주형 허브"의 개략도.
도 12 실시예 13에서 사용된 반연속적인 라이게이션 기구의 개략도.
도 13 실시예 14에서 사용된 데드-엔드 여과 기구의 개략도.
도 14 실시예 14에서 사용된 크로스-플로우 여과 기구의 개략도.
도 15 실시예 14에서 60℃에서 10 kDa MWCO NADIR 막을 사용한 데드-엔드 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 a)는 2개의 투석여과 부피 후 여과 셀에 남아있고 주로 트리-주형 허브를 함유한 체류물 용액의 크로마토그램이고; 크로마토그램 b)는 2개의 투석여과 부피 후 생성물이 풍부한 투과물 용액의 크로마토그램이다.
도 16 실시예 14에서 50℃ 및 3.0 bar 압력에서 5 kDa MWCO 스나이더(Snyder) 막을 사용한 크로스-플로우 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 a)는 20개의 투석여과 부피 후 주로 트리-주형 허브 및 생성물을 함유한 체류물 용액의 크로마토그램이고; 도 b)는 20개의 투석여과 부피 후 주로 절편 올리고뉴클레오티드를 함유한 투과물의 크로마토그램이다.
도 17 실시예 14에서 80℃ 및 3.1 bar 압력에서 5 kDa MWCO 스나이더 막을 사용한 크로스-플로우 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 17은 a) 20개의 투석여과 부피 후 트리-주형 허브만을 함유한 체류물 용액의 크로마토그램; 및 b) 2개의 투석여과 부피 후 생성물만을 함유한 투과물 용액의 크로마토그램을 나타낸다.
도 1 절편 올리고뉴클레오티드의 효소적 생성의 개략도: a) 2-단계 반응: 첨가 및 탈보호를 포함하는 절편 합성을 위한 3'-연장. 예시적인 첨가 단계는 단일-가닥 핵산 프라이머의 3'-OH로의 뉴클레오티드-3',5'-비스(티오)포스페이트의 ATP 의존적 라이게이션 및 이어서 포스파타제에 의한 단일-가닥 올리고뉴클레오티드 상의 3'-포스페이트의 탈보호를 수반한다; 및 b) 절편 서열을 생성하기 위한 예시적인 3'-연장 (첨가 및 탈보호), 이어서 부위-특이적 뉴클레아제 (예를 들어, 엔도뉴클레아제 V - 이노신 후, 즉 이노신에 대해 3'에 있는 제2 포스포디에스테르 결합에서 1개의 염기를 절단함)를 사용한 쇄 절단에 의한 절편의 방출.
도 2 절편 올리고뉴클레오티드를 라이게이션하여 생성물을 형성하는 단계, 및 불순물을 제거하기 위해 조건을 변화시키는 단계를 포함하는 본 발명의 방법의 개략도.
도 3 다수의 주형 배열의 개략도.
도 4 플로우 시스템에서 수행되는 본 발명의 방법의 기본 개략도.
도 5 플로우 시스템에서 수행되는 본 발명의 방법의 상세한 개략도: a) 라이게이션 화학 섹션, b) 라이게이션 정제 섹션, 및 c) 대안적인 라이게이션 화학 섹션, 및 d) 대안적인 정제 섹션. N.B. 섹션 a) 및 b) (대안적으로 c) 및 d))는 단일 단계로 수행될 수 있다 (예를 들어, a)에서 수집 용기 = b)에서 라이게이션 단계로부터의 출력).
도 6 본 발명의 방법 동안 생성될 수 있는 불순물의 예.
도 7 상업용 NEB T4 리가제 (서열식별번호(SEQ ID NO):3) 및 비변형된 DNA (실시예 1)를 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 8 펄로자(PERLOZA) 결합된 T4 리가제 (서열식별번호: 4) 및 비변형된 DNA (실시예 1)를 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 9 실시예 2에 따라 발현된 펄로자 결합된 T4 리가제 및 2'-OMe 변형된 올리고뉴클레오티드 단편을 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 10 실시예 4에 대한 HPLC 트레이스: 상부 트레이스 (a) - 리가제 대조군 없음. 하부 트레이스 (b) - 클론 A4. 생성물 및 주형은 이 HPLC 방법에서 공동-용리한다. 2개의 중간체 라이게이션 단편 (절편)은 10.3 및 11.2분에 클론 A4 트레이스에서 볼 수 있다.
도 11 "허브"로 지칭되는 지지체 물질 및 3개의 주형 서열을 포함하는, 실시예 13에서 사용된 "트리-주형 허브"의 개략도.
도 12 실시예 13에서 사용된 반연속적인 라이게이션 기구의 개략도.
도 13 실시예 14에서 사용된 데드-엔드 여과 기구의 개략도.
도 14 실시예 14에서 사용된 크로스-플로우 여과 기구의 개략도.
도 15 실시예 14에서 60℃에서 10 kDa MWCO NADIR 막을 사용한 데드-엔드 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 a)는 2개의 투석여과 부피 후 여과 셀에 남아있고 주로 트리-주형 허브를 함유한 체류물 용액의 크로마토그램이고; 크로마토그램 b)는 2개의 투석여과 부피 후 생성물이 풍부한 투과물 용액의 크로마토그램이다.
도 16 실시예 14에서 50℃ 및 3.0 bar 압력에서 5 kDa MWCO 스나이더(Snyder) 막을 사용한 크로스-플로우 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 a)는 20개의 투석여과 부피 후 주로 트리-주형 허브 및 생성물을 함유한 체류물 용액의 크로마토그램이고; 도 b)는 20개의 투석여과 부피 후 주로 절편 올리고뉴클레오티드를 함유한 투과물의 크로마토그램이다.
도 17 실시예 14에서 80℃ 및 3.1 bar 압력에서 5 kDa MWCO 스나이더 막을 사용한 크로스-플로우 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 17은 a) 20개의 투석여과 부피 후 트리-주형 허브만을 함유한 체류물 용액의 크로마토그램; 및 b) 2개의 투석여과 부피 후 생성물만을 함유한 투과물 용액의 크로마토그램을 나타낸다.
<발명의 상세한 설명>
<정의>
본원에서 사용된 바와 같은 용어 "올리고뉴클레오티드" 또는 생략하여 "올리고"는 뉴클레오티드 잔기의 중합체를 의미한다. 이들은 데옥시리보뉴클레오티드 (여기서, 생성된 올리고뉴클레오티드는 DNA임), 리보뉴클레오티드 (여기서, 생성된 올리고뉴클레오티드는 RNA임), 변형된 뉴클레오티드, 또는 이들의 혼합물일 수 있다. 올리고뉴클레오티드는 자연에서 발견되는 바와 같은 뉴클레오티드 잔기로 완전히 구성될 수 있거나, 변형된 적어도 하나의 뉴클레오티드, 또는 뉴클레오티드 사이의 적어도 하나의 연결을 함유할 수 있다. 올리고뉴클레오티드는 단일-가닥 또는 이중-가닥일 수 있다. 본 발명의 올리고뉴클레오티드는 또 다른 분자, 예를 들어 N-아세틸갈락토사민 (GalNAc) 또는 이들의 집합 (GalNAc 클러스터)에 접합될 수 있다.
본원에서 사용된 바와 같은 용어 "치료용 올리고뉴클레오티드"는 예를 들어 인간 또는 동물에서 상태 또는 질환의 예방 또는 치료에서 치료적 적용을 갖는 올리고뉴클레오티드를 의미한다. 이러한 올리고뉴클레오티드는 전형적으로 하나 이상의 변형된 뉴클레오티드 잔기 또는 연결을 함유한다. 치료용 올리고뉴클레오티드는 안티센스, 스플라이스-전환 또는 엑손-스키핑, 면역자극 및 RNA 간섭 (RNAi), 예를 들어 microRNA (miRNA) 및 작은 간섭 RNA (siRNA)를 포함하나 이에 제한되지는 않는 여러 상이한 메커니즘 중 하나를 통해 작용한다. 치료용 올리고뉴클레오티드는 아프타머일 수 있다. 치료용 올리고뉴클레오티드는 항상은 아니지만 일반적으로 정의된 서열을 가질 것이다.
본원에서 사용된 바와 같은 용어 "주형"은 표적 (또는 생성물) 올리고뉴클레오티드의 서열과 100% 상보적인 서열을 갖는 올리고뉴클레오티드를 의미한다.
달리 특정되지 않는 한, 본원에서 사용된 바와 같은 용어 "상보적"은 100% 상보적을 의미한다.
본원에서 사용된 바와 같은 용어 "생성물"은 본원에서 "표적 올리고뉴클레오티드"로도 지칭되는, 특정 서열을 갖는 목적 올리고뉴클레오티드를 의미한다.
본원에서 사용된 바와 같은 용어 "풀(pool)"은 서열이 다양할 수 있고, 표적 서열보다 짧거나 길 수 있고, 표적 서열과 동일한 서열을 갖지 않을 수 있는 올리고뉴클레오티드의 군을 지칭한다. 올리고뉴클레오티드의 풀은 올리고뉴클레오티드 합성, 예를 들어 정제와 함께 또는 정제 없이 사용되는 포스포르아미다이트 화학을 통한 고체상 화학적 합성 또는 효소적 합성의 생성물일 수 있다. 올리고뉴클레오티드의 풀은 표적 서열의 절편으로 구성될 수 있다. 각각의 절편 자체는 그 절편의 풀로서 존재할 수 있고, 올리고뉴클레오티드 합성, 예를 들어 포스포르아미다이트 화학을 통한 고체상 화학적 합성 또는 효소적 합성의 생성물일 수 있다.
본원에서 사용된 바와 같은 용어 "어닐링"은 서열 특이적 방식으로 상보적 올리고뉴클레오티드의 혼성화, 예를 들어 이중-가닥 올리고뉴클레오티드를 형성하기 위한 왓슨 및 크릭 염기-쌍형성의 수소 결합을 통한 2개의 단일-가닥 올리고뉴클레오티드의 쌍형성을 의미한다. "어닐링을 허용하는 조건"은 혼성화된 상보적 올리고뉴클레오티드의 Tm에 의존할 것이고, 관련 기술분야의 통상의 기술자에게 쉽게 명백할 것이다. 예를 들어, 어닐링을 위한 온도는 혼성화된 올리고뉴클레오티드의 Tm 미만일 수 있다. 대안적으로, 어닐링을 위한 온도는 혼성화된 올리고뉴클레오티드의 Tm에 근접할 수 있다 (예를 들어, +/- 1, 2 또는 3℃). 어닐링을 위한 온도는 일반적으로 혼성화된 올리고뉴클레오티드의 Tm보다 10℃ 더 높지 않다. 어닐링을 허용하는 특정 조건은 실시예 섹션에 요약되어 있는 바와 같다.
이중-가닥 올리고뉴클레오티드와 관련하여, 본원에서 사용된 바와 같은 용어 "변성"은 상보적 가닥이 더 이상 어닐링되지 않음, 즉 왓슨 및 크릭 염기-쌍형성이 파괴되고 가닥이 해리되었음을 의미하는데 사용된다. 변성은 조건의 변화, 예를 들어 온도의 상승, pH의 변화, 또는 완충 용액의 염 농도의 변화의 결과로서 일어난다. 변성을 위한 조건은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 본원에 기재된 바와 같은 이중-가닥 올리고뉴클레오티드 ("이중나선")를 변성시키면 단일-가닥 생성물 또는 불순물 올리고뉴클레오티드 및 단일-가닥 주형 올리고뉴클레오티드가 생성된다.
본원에서 사용된 바와 같은 용어 "불순물" 또는 "불순물들"은 목적 생성물 서열을 갖지 않는 올리고뉴클레오티드를 의미한다. 이들 올리고뉴클레오티드는 생성물보다 더 짧은 (예를 들어, 1, 2, 3, 4, 5개 이상의 뉴클레오티드 잔기가 더 짧은), 또는 생성물보다 더 긴 (예를 들어, 1, 2, 3, 4, 5개 이상의 뉴클레오티드 잔기가 더 긴) 올리고뉴클레오티드를 포함할 수 있다. 생성 방법이 절편 사이에 연결이 형성되는 단계를 포함하는 경우, 불순물은 하나 이상의 연결이 형성되지 않으면 남아있는 올리고뉴클레오티드를 포함한다. 불순물은 또한 부정확한 뉴클레오티드가 혼입된 올리고뉴클레오티드를 포함하며, 이는 주형과 비교하여 미스매치를 초래한다. 불순물은 상기 기재된 특징 중 하나 이상을 가질 수 있다. 도 6은 발생할 수 있는 일부 불순물을 나타낸다.
본원에서 사용된 바와 같은 용어 "절편"은 더 긴 올리고뉴클레오티드의 더 작은 부분, 특히 생성물 또는 표적 올리고뉴클레오티드의 더 작은 부분이다. 주어진 생성물에 대해, 그의 절편 모두가 그의 주형에 어닐링되고 함께 라이게이션되는 경우, 생성물이 형성된다.
본원에서 사용된 바와 같은 용어 "효소적 라이게이션"은 2개의 인접한 뉴클레오티드 사이의 연결이 효소적으로, 즉 효소에 의해 형성되는 것을 의미한다. 이 연결은 자연 발생 포스포디에스테르 결합 (PO), 또는 포스포로티오에이트 (PS) 또는 포스포르아미데이트 (PA)를 포함하나 이에 제한되지는 않는 변형된 연결일 수 있다.
본원에서 사용된 바와 같은 용어 "효소적 합성"은 효소, 예를 들어 리가제, 트랜스퍼라제, 포스파타제 및 뉴클레아제, 특히 엔도뉴클레아제를 사용한, 절편 및 최종 생성물을 포함하는 올리고뉴클레오티드의 생성을 의미한다. 이들 효소는 야생형 효소 또는 돌연변이체 효소일 수 있다. 변형된 뉴클레오티드 또는 올리고뉴클레오티드 기질에 작용할 수 있는 돌연변이체 효소는 본 발명의 범위 내에 포함된다.
본원에서 사용된 바와 같은 용어 "리가제"는 2개의 올리고뉴클레오티드 분자의 연결, 즉 공유결합적 연결을, 예를 들어 하나의 올리고뉴클레오티드 (또는 절편)의 3' 말단 및 동일한 또는 또 다른 올리고뉴클레오티드 (또는 절편)의 5' 말단 사이의 포스포디에스테르 결합의 형성에 의해 촉매하는 효소를 의미한다. 이들 효소는 종종 DNA 리가제 또는 RNA 리가제로 지칭되며, 보조인자: ATP (진핵생물, 바이러스 및 고세균 DNA 리가제) 또는 NAD (원핵생물 DNA 리가제)를 사용한다. 모든 유기체에서 발생함에도 불구하고, DNA 리가제는 아미노산 서열, 분자 크기 및 특성의 광범위한 다양성을 나타낸다 (Nucleic Acids Research, 2000, Vol. 28, No. 21, 4051-4058). 이들은 통상적으로 국제 생화학 분자 생물학 연합에 의해 정의된 바와 같은 효소 클래스 EC 6.5의 구성원, 즉 인산 에스테르 결합을 형성하는데 사용되는 리가제이다. 비변형된 올리고뉴클레오티드를 또 다른 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 리가제, 비변형된 올리고뉴클레오티드를 변형된 올리고뉴클레오티드에 (즉, 변형된 5' 올리고뉴클레오티드를 비변형된 3' 올리고뉴클레오티드에, 및/또는 비변형된 5' 올리고뉴클레오티드를 변형된 3' 올리고뉴클레오티드에) 연결시킬 수 있는 리가제, 뿐만 아니라 변형된 올리고뉴클레오티드를 또 다른 변형된 올리고뉴클레오티드에 연결시킬 수 있는 리가제는 본 발명의 범위 내에 포함된다.
본원에서 사용된 바와 같은 용어 "단일-가닥 리가제" 또는 "ss리가제"는 (i) 단일-가닥 수용자 RNA 가닥의 3'-OH로의 5'-인산화된 단일-가닥 RNA의 ATP-의존적 라이게이션 및 (ii) RNA 또는 변형된 올리고뉴클레오티드의 3' 말단으로의 단일 잔기 (변형된 잔기 포함), 예를 들어 뉴클레오티드-3',5'-비스포스페이트, 3',5'-티오비스포스페이트 또는 3'-포스페이트-5' 티오포스페이트의 라이게이션을 촉매할 수 있는 효소, 예를 들어 RNA 리가제를 의미한다 (Modified Oligoribonucleotides: 17 (11), 2077-2081, 1978). ss리가제의 예는 T4 RNA 리가제이며, 이는 또한 특정 조건 하에 DNA 기질에 작용하는 것으로 나타났다 (Nucleic Acids research 7(2), 453-464, 1979). T4 박테리오파지로 감염된 에스케리키아 콜라이(Escherichia coli)에서 T4 RNA 리가제의 자연적 기능은 바이러스 공격에 대한 박테리아 방어 메커니즘에 의해 야기되는 박테리아 tRNA에 대한 단일-가닥 파단을 복구하는 것이다. 비변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제, 비변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제, 변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제, 뿐만 아니라 변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제는 본 발명의 범위 내에 포함된다. 본 발명에 따른 ss리가제는 라이게이션 발생을 위해 주형 올리고뉴클레오티드를 필요로 하지 않는 리가제이며, 즉 리가제의 라이게이션 활성은 주형-독립적이다.
본원에서 사용된 바와 같은 "열안정한 리가제"는 상승된 온도에서, 즉 인간 체온 초과, 즉 37℃ 초과에서 활성인 리가제이다. 열안정한 리가제는 예를 들어, 40℃ - 65℃; 또는 40℃ - 90℃ 등에서 활성일 수 있다.
본원에서 사용된 바와 같은 "트랜스퍼라제"는 하나의 뉴클레오티드의 또 다른 뉴클레오티드 또는 올리고뉴클레오티드로의 주형 독립적 연결을 촉매하는 효소를 의미한다. 본원에 기재된 바와 같은 트랜스퍼라제는 DNA 뉴클레오티딜엑소트랜스퍼라제 (DNTT) 또는 말단 트랜스퍼라제로도 공지된 말단 뉴클레오티딜 트랜스퍼라제 (TdT)를 포함한다. TdT는 V-D-J 항체 유전자 접합부 다양성을 가능하게 하는 미성숙, 프리-B, 프리-T-림프계 세포에서 발현되는 전문화된 DNA 폴리머라제이다. TdT는 DNA 분자의 3' 말단으로의 뉴클레오티드의 첨가를 촉매한다. 본원에 기재된 바와 같은 트랜스퍼라제는 비자연 발생 또는 돌연변이체 TdT를 포함한다. 비변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제, 비변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제, 변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제, 뿐만 아니라 변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제는 본 발명의 범위 내에 포함된다.
본원에서 사용된 바와 같은 용어 "포스파타제"는 포스포에스테르의 가수분해를 촉매하여 알콜을 생성하는 효소를 의미한다. 알칼리성 포스파타제는 DNA 및 RNA (및 변형된 올리고뉴클레오티드)의 5' 및 3' 말단의 탈인산화를 비특이적으로 촉매하고, 또한 뉴클레오티드 트리포스페이트 (NTP 및 dNTP)를 가수분해시키고, 알칼리성 pH 환경에서 최적으로 활성이다.
본원에서 사용된 바와 같은 용어 "서열-특이적 엔도뉴클레아제" 또는 "부위-특이적 엔도뉴클레아제"는 상호교환적으로 사용되고, 특정 위치에서 단일-가닥 올리고뉴클레오티드를 특이적으로 절단하는 뉴클레아제를 의미한다. 예를 들어, 엔도뉴클레아제 V는 이노신 후 1개의 염기, 즉 이노신에 대해 3'에 있는 제2 포스포디에스테르 결합에서 RNA를 절단한다. 부위-특이적 엔도뉴클레아제의 다른 예는 메가뉴클레아제, 아연 핑거 뉴클레아제, TALEN 및 Cas9의 패밀리를 포함한다.
본원에서 사용된 바와 같은 용어 "프라이머"는 본 발명의 절편 올리고뉴클레오티드를 합성하기 위한 출발점으로서 사용되는 올리고뉴클레오티드 서열을 의미한다. 프라이머는 적어도 3개의 뉴클레오티드를 포함하고, 지지체 물질에 부착될 수 있다.
본원에서 사용된 바와 같은 용어 "변형된 뉴클레오티드 잔기" 또는 "변형된 올리고뉴클레오티드"는 자연 발생 뉴클레오티드 잔기 또는 올리고뉴클레오티드와 상이한 그의 화학의 적어도 하나의 측면을 함유하는 뉴클레오티드 잔기 또는 올리고뉴클레오티드를 의미한다. 이러한 변형은 뉴클레오티드 잔기의 임의의 부분, 예를 들어 당, 염기 또는 포스페이트에서 발생할 수 있다. 뉴클레오티드의 변형의 예는 하기 개시되어 있다.
본원에서 사용된 바와 같은 용어 "변형된 리가제"는 하나 이상의 아미노산 잔기만큼 자연 발생 "야생형" 리가제와 상이한 리가제를 의미한다. 이러한 리가제는 자연에서 발견되지 않는다. 이러한 리가제는 본 발명의 신규 방법에 유용하다. 변형된 리가제의 예는 하기 개시되어 있다. 용어 "변형된 리가제" 및 "돌연변이체 리가제"는 상호교환적으로 사용된다.
본원에서 사용된 바와 같은 용어 "변형된 트랜스퍼라제"는 하나 이상의 아미노산 잔기만큼 자연 발생 "야생형" 트랜스퍼라제와 상이한 트랜스퍼라제를 의미한다. 이러한 트랜스퍼라제는 자연에서 발견되지 않는다. 이러한 트랜스퍼라제는 본 발명의 신규 방법에 유용하다. 용어 "변형된 트랜스퍼라제" 및 "돌연변이체 트랜스퍼라제"는 상호교환적으로 사용된다.
본원에서 사용된 바와 같은 용어 "갭머"는 2개의 외부 "윙 절편"에 의해 플랭킹된 내부 "갭 절편"을 갖는 올리고뉴클레오티드를 의미하며, 여기서 갭 절편은 RNase H 절단을 지지하는 다수의 뉴클레오티드로 이루어지고, 각각의 윙 절편은 갭 절편 내 뉴클레오티드와 화학적으로 구별되는 하나 이상의 뉴클레오티드로 이루어진다.
본원에서 사용된 바와 같은 용어 "지지체 물질"은 올리고뉴클레오티드, 예를 들어 주형 또는 프라이머의 분자량을 증가시켜, 예를 들어 불순물 및 생성물이 반응 혼합물로부터 분리될 때 이에 의해 유지되는 것을 허용하는 고분자량 화합물 또는 물질을 의미한다.
본원에서 사용된 바와 같은, 의문 핵산 서열 및 대상 핵산 서열 사이의 "동일성 백분율"은 쌍별 BLASTN 정렬이 수행된 후 대상 핵산 서열이 의문 핵산 서열과 100% 의문 포함을 갖는 경우 BLASTN 알고리즘에 의해 계산된 백분율로 표현된 "동일성" 값이다. 의문 핵산 서열 및 대상 핵산 서열 사이의 이러한 쌍별 BLASTN 정렬은 낮은 복잡성 영역에 대한 필터를 끈 상태에서 미국 국립생물공학정보센터(National Center for Biotechnology Institute)의 웹사이트에서 이용가능한 BLASTN 알고리즘의 디폴트 설정을 사용하여 수행된다. 중요하게는, 의문 핵산 서열은 본원의 하나 이상의 청구항에서 확인된 핵산 서열에 의해 기재될 수 있다. 의문 서열은 대상 서열과 100% 동일할 수 있거나, 또는 동일성 %가 100% 미만이 되도록 대상 서열과 비교하여 특정 정수까지의 뉴클레오티드 변경을 포함할 수 있다. 예를 들어, 의문 서열은 대상 서열과 적어도 80, 85, 90, 95, 96, 97, 98, 또는 99% 동일하다.
<발명의 진술>
본 발명의 한 측면에서, 적어도 하나의 변형된 뉴클레오티드 잔기를 갖는 단일-가닥 올리고뉴클레오티드 생성물의 생성 방법이며,
a) 생성물 서열의 절편을 포함하는 올리고뉴클레오티드 (I)의 풀을 제공하는 단계이며, 여기서 생성물 서열의 적어도 하나의 절편은 적어도 하나의 변형된 뉴클레오티드 잔기를 함유하고, 각각의 절편은 효소적 합성 또는 고체상 합성에 의해 생성된 것인 단계;
b) 단일-가닥 올리고뉴클레오티드 생성물의 서열과 상보적인 주형 올리고뉴클레오티드 (II)를 제공하는 단계이며, 상기 주형은 생성물로부터 분리되어 향후 반응에 사용하기 위해 재순환되는 것을 허용하는 특성을 갖는 것인 단계;
c) 주형 올리고뉴클레오티드로의 절편 올리고뉴클레오티드의 어닐링을 허용하는 조건에서 (I) 및 (II)를 접촉시키는 단계;
d) 리가제를 사용하여 절편 올리고뉴클레오티드를 연결하여 생성물을 형성하는 단계;
e) 어닐링된 주형 및 임의의 불순물 올리고뉴클레오티드 가닥을 변성시키기 위해 조건을 변화시키고, 불순물을 분리하는 단계;
f) 어닐링된 주형 및 생성물 올리고뉴클레오티드 가닥을 변성시키기 위해 조건을 변화시키고, 단일-가닥 올리고뉴클레오티드 생성물을 분리하는 단계; 및
g) 향후 반응에 사용하기 위해 주형 올리고뉴클레오티드를 재순환시키는 단계
를 포함하는 방법이 제공된다.
본 발명의 한 실시양태에서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드는 효소적으로 생성된다.
본 발명의 한 실시양태에서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드는 단일-가닥 리가제 (ss리가제)를 사용하여 생성된다. 한 실시양태에서, ss리가제는 RNA 리가제이다. 한 실시양태에서, ss리가제는 T4 RNA 리가제 또는 변형된 T4 RNA 리가제이다.
또 다른 실시양태에서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은
(i) 3' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티 및 5' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티를 갖는, 뉴클레오티드, 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드를 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 단계;
(ii) 포스파타제를 사용하여 3'-포스페이트 모이어티, 3'-티오포스페이트 모이어티 또는 3' 디티오포스페이트 모이어티를 제거하는 단계;
(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계: 및
(iv) 서열 특이적 엔도뉴클레아제를 사용하여 올리고뉴클레오티드 프라이머로부터 절편 올리고뉴클레오티드를 방출하는 단계
를 포함한다.
본 발명의 한 실시양태에서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은 황으로 치환된 포스페이트 산소 중 하나 이상을 갖는 3',5' 뉴클레오티드 비스포스페이트를 단계 (i)에서 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 것을 포함한다.
본 발명의 한 실시양태에서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은 3',5' 뉴클레오티드 비스포스페이트, 3',5' 뉴클레오티드 티오포스페이트 (예를 들어, 3',5' 비스티오포스페이트 또는 3'-포스페이트-5'-티오포스페이트 또는 3'-티오포스페이트-5'-포스페이트) 또는 3',5' 뉴클레오티드 디티오포스페이트 (예를 들어, 3',5' 비스디티오포스페이트 또는 3'-포스페이트-5'-디티오포스페이트 또는 3'-디티오포스페이트-5'-포스페이트)를 단계 (i)에서 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 것을 포함한다.
본 발명의 한 실시양태에서, 하나 이상의 절편 올리고뉴클레오티드는 트랜스퍼라제를 사용하여 생성된다. 본 발명의 한 실시양태에서, 트랜스퍼라제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은
(i) 3'-OH 상에 보호기를 갖는, 뉴클레오티드-5'-트리포스페이트, 알파-티오트리포스페이트 또는 알파디티오트리포스페이트를 트랜스퍼라제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 단계;
(ii) 3'-OH를 재생시키기 위해 3'-위치를 탈보호하는 단계;
(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계;
(iv) 서열 특이적 엔도뉴클레아제를 사용하여 올리고뉴클레오티드 프라이머로부터 절편 올리고뉴클레오티드를 방출하는 단계
를 포함한다.
본 발명의 한 실시양태에서, 각각의 절편은 효소적 합성에 의해 생성된다. 본 발명의 한 실시양태에서, 각각의 절편은 ss리가제를 사용하여 생성된다. 본 발명의 한 실시양태에서, 각각의 절편은 트랜스퍼라제를 사용하여 생성된다.
ss리가제, 예를 들어 RNA 리가제, 트랜스퍼라제, 또는 단일 뉴클레오티드를 단일-가닥 올리고뉴클레오티드에 첨가할 수 있는 임의의 다른 효소를 주형 독립적 방식으로 사용하는 것은 정의된 서열을 갖는 올리고뉴클레오티드의 합성을 허용한다. 이러한 접근법은 단일 염기를 반복적으로 첨가함으로써 전체 올리고뉴클레오티드 생성물을 생성하는데 사용될 수 있다. 그러나, 각각의 합성 사이클이 100% 수율로 실행되지 않으면, 서열 결실 오류가 최종 생성물에 혼입될 것이다. 예를 들어, 올리고뉴클레오티드가 합성 사이클에서 99% 수율로 하나의 뉴클레오티드만큼 연장되는 경우, 나머지 1%는 후속적 합성 사이클에서 반응하는데 이용가능하지만, 형성되는 생성물은 목적 생성물보다 1개 뉴클레오티드 더 짧을 것이다. 사이클의 수가 증가함에 따라, 오류율이 복합되므로, 이 예에서, 99% 사이클 수율은 20머의 생성을 위한 단일 염기 단축된 서열의 20%의 형성을 유발할 것이다.
본 발명에 따라, 오류의 순차적 누적은 다음에 의해 회피된다. 먼저, 오직 짧은 서열, 전형적으로 5 내지 8개의 뉴클레오티드 길이가 단일 뉴클레오티드의 첨가에 의해 합성된다. 이 방법은 오류 누적의 더 적은 사이클에 노출되므로 긴 서열보다 더 고순도를 갖는 짧은 서열을 야기한다. 둘째, 이들 짧은 서열이 상보적 DNA 주형 상에 어셈블리된 후, 함께 연결된다. 리가제와 함께 상보적 주형을 사용하면, 정확한 길이 및 정확한 서열 둘 모두를 갖는 짧은 올리고뉴클레오티드만이 어셈블리되는 것이 보장된다. 따라서, 본 발명의 방법은 더 높은 총괄 수율 및, 중요하게는 더 높은 총괄 서열 충실도 모두를 야기한다.
본 발명의 한 실시양태는 본원에 앞서 기재된 바와 같은 방법을 제공하며, 여기서 주형 및 불순물 이중나선의 변성 및/또는 주형 및 생성물 이중나선의 변성은 온도 증가로부터 발생한다. 한 실시양태에서, 변성은 pH 변화의 결과로서 발생한다. 추가 실시양태에서, 변성은 완충 용액 중 염 농도를 변화시킴으로써 발생한다.
본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 절편 올리고뉴클레오티드는 3 내지 15개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 절편은 5 내지 10개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 절편은 5 내지 8개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 절편은 4, 5, 6, 7 또는 8개의 뉴클레오티드 길이이다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 7개의 뉴클레오티드 길이인 5' 절편, 6개의 뉴클레오티드 길이인 중심 절편 및 7개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 6개의 뉴클레오티드 길이인 5' 절편, 8개의 뉴클레오티드 길이인 중심 절편 및 6개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 5개의 뉴클레오티드 길이인 5' 절편, 10개의 뉴클레오티드 길이인 중심 절편 및 5개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 4개의 뉴클레오티드 길이인 5' 절편, 12개의 뉴클레오티드 길이인 중심 절편 및 4개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 4개의 절편 올리고뉴클레오티드가 존재한다: 5개의 뉴클레오티드 길이인 5' 절편, 5개의 뉴클레오티드 길이인 5'-중심 절편, 5개의 뉴클레오티드 길이인 중심-3' 절편, 및 5개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다.
본 발명의 한 실시양태는 본원에 앞서 기재된 바와 같은 방법을 제공하며, 여기서 생성물은 10 내지 200개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 생성물은 15 내지 30개의 뉴클레오티드 길이이다. 본 발명의 한 실시양태에서, 생성물은 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 뉴클레오티드 길이이다. 본 발명의 한 실시양태에서, 생성물은 20개의 뉴클레오티드 길이, "20-머"이다. 본 발명의 한 실시양태에서, 생성물은 21개의 뉴클레오티드 길이, "21-머"이다. 본 발명의 한 실시양태에서, 생성물은 22개의 뉴클레오티드 길이, "22-머"이다. 본 발명의 한 실시양태에서, 생성물은 23개의 뉴클레오티드 길이, "23-머"이다. 본 발명의 한 실시양태에서, 생성물은 24개의 뉴클레오티드 길이, "24-머"이다. 본 발명의 한 실시양태에서, 생성물은 25개의 뉴클레오티드 길이, "25-머"이다. 본 발명의 한 실시양태에서, 생성물은 26개의 뉴클레오티드 길이, "26-머"이다. 본 발명의 한 실시양태에서, 생성물은 27개의 뉴클레오티드 길이, "27-머"이다. 본 발명의 한 실시양태에서, 생성물은 28개의 뉴클레오티드 길이, "28-머"이다. 본 발명의 한 실시양태에서, 생성물은 29개의 뉴클레오티드 길이, "29-머"이다. 본 발명의 한 실시양태에서, 생성물은 30개의 뉴클레오티드 길이, "30-머"이다.
본 발명의 한 실시양태에서, 방법은 치료용 올리고뉴클레오티드를 생성하는 방법이다. 본 발명의 한 실시양태에서, 방법은 단일-가닥 치료용 올리고뉴클레오티드를 생성하는 방법이다. 본 발명의 한 실시양태에서, 방법은 이중-가닥 치료용 올리고뉴클레오티드를 생성하는 방법이다.
본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형이 생성물로부터 분리되는 것을 허용하는 특성은 주형이 지지체 물질에 부착된 것이다. 본 발명의 추가 실시양태에서, 지지체 물질은 가용성 지지체 물질이다. 본 발명의 또 다른 추가 실시양태에서, 가용성 지지체 물질은 폴리에틸렌 글리콜, 가용성 유기 중합체, DNA, 단백질, 덴드리머, 다당류, 올리고당 및 탄수화물로 이루어진 군으로부터 선택된다. 본 발명의 한 실시양태에서, 지지체 물질은 폴리에틸렌 글리콜 (PEG)이다. 본 발명의 추가 실시양태에서, 지지체 물질은 불용성 지지체 물질이다. 본 발명의 추가 실시양태에서, 지지체 물질은 고체 지지체 물질이다. 또 다른 추가 실시양태에서, 고체 지지체 물질은 유리 비드, 중합체 비드, 섬유질 지지체, 막, 스트렙타비딘 코팅된 비드 및 셀룰로스로 이루어진 군으로부터 선택된다. 한 실시양태에서, 고체 지지체 물질은 스트렙타비딘 코팅된 비드이다. 추가 실시양태에서, 고체 지지체 물질은 반응 용기 자체의 일부, 예를 들어 반응 벽이다.
본 발명의 한 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형의 다수의 반복된 카피는 연속적인 방식으로 단일 부착점을 통해 지지체 물질에 부착된다. 주형의 다수의 반복된 카피는 예를 들어 도 3에 나타낸 바와 같이 링커에 의해 분리될 수 있다. 주형의 다수의 반복된 카피는 직접 반복부일 수 있으며, 즉 이는 링커에 의해 분리되지 않는다.
본 발명의 또 다른 실시양태에서, 주형은 다수의 부착점에서 지지체 물질에 부착된다.
본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형이 생성물로부터 분리되는 것을 허용하는 특성은 주형의 분자량이다. 예를 들어, 주형 서열의 반복된 카피는 링커 서열과 함께 또는 링커 서열 없이 단일 올리고뉴클레오티드 상에 존재할 수 있다.
본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형, 또는 주형 및 지지체 물질은 예를 들어 하기 상세히 설명된 바와 같이 향후 반응에 사용하기 위해 재순환된다. 본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 반응은 예를 들어 도 4 또는 도 5에 나타낸 바와 같이 연속적인 또는 반연속적인 유동 공정을 사용하여 수행된다.
본 발명의 한 실시양태에서, 방법은 올리고뉴클레오티드, 특히 치료용 올리고뉴클레오티드의 대규모 제조를 위한 것이다. 본 발명의 맥락에서, 올리고뉴클레오티드의 대규모 제조는 1 리터 이상의 규모로 제조하는 것을 의미하며, 예를 들어 방법은 1 L 이상의 반응기에서 수행된다. 대안적으로 또는 추가로, 본 발명의 맥락에서, 올리고뉴클레오티드의 대규모 제조는 생성물을 그램 규모로 제조하는 것, 특히 10 그램 이상의 생성물을 생성하는 것을 의미한다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 그램 규모이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100 그램 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950 그램 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 500 그램 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물은 킬로그램 규모이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 1 kg 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 kg 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100 kg 이상이다.
본 발명의 한 실시양태에서, 생성된 생성물의 양은 10 그램 내지 100 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 10 그램 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 100 그램 내지 100 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 100 그램 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 500 그램 내지 100 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 500 그램 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 1 kg 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 10 kg 내지 50 kg이다.
본 발명의 한 실시양태에서, 올리고뉴클레오티드 제조는 2, 3, 4, 5, 6, 7, 8, 9, 10 리터 이상의 규모로, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9 또는 10 L 반응기에서 일어난다. 본 발명의 한 실시양태에서, 올리고뉴클레오티드 제조는 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 리터 이상의 규모로, 예를 들어 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 L 반응기에서 일어난다. 본 발명의 한 실시양태에서, 올리고뉴클레오티드 제조는 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 리터 이상의 규모로, 예를 들어 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 L 반응기에서 일어난다.
본 발명의 한 실시양태에서, 반응기 부피는 약 10,000 L, 약 5000 L, 약 2000 L, 약 1000 L, 약 500 L, 약 125 L, 약 50 L, 약 20 L, 약 10 L, 또는 약 5 L이다.
본 발명의 한 실시양태에서, 반응기 부피는 5 내지 10,000 L, 10 내지 5000 L, 20 내지 2000 L, 또는 50 내지 1000 L이다.
본 발명에 따른 올리고뉴클레오티드는 RNA 또는 DNA-기반 올리고뉴클레오티드와 비교하여 적어도 하나의 백본 변형, 및/또는 적어도 하나의 당 변형, 및/또는 적어도 하나의 염기 변형을 가질 수 있다.
본 발명의 한 실시양태에서, 하나 이상의 절편 올리고뉴클레오티드는 RNA 또는 DNA-기반 올리고뉴클레오티드와 비교하여 적어도 하나의 백본 변형, 및/또는 적어도 하나의 당 변형, 및/또는 적어도 하나의 염기 변형을 갖는다. 한 실시양태에서, 모든 절편 올리고뉴클레오티드는 적어도 하나의 백본 변형을 갖는다. 한 실시양태에서, 절편 중 적어도 하나는 완전히 변형된 백본을 갖는다. 본 발명의 한 실시양태에서, 모든 절편은 완전히 변형된 백본을 갖는다. 한 실시양태에서, 모든 절편 올리고뉴클레오티드의 백본은 포스포로티오에이트 연결로 이루어진다. 한 실시양태에서, 절편 중 2개 이상은 RNA 또는 DNA-기반 올리고뉴클레오티드와 비교하여 적어도 하나의 당 변형 및/또는 적어도 하나의 염기 변형을 갖는다. 한 실시양태에서, "윙" 절편은 적어도 하나의 당 변형을 포함한다. 한 실시양태에서, "윙" 절편은 변형된 당으로 완전히 이루어진다. 한 실시양태에서, "윙" 절편은 2'-MOE-변형된 당으로 완전히 이루어진다.
본 발명의 한 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 생성물은 적어도 1개의 변형된 뉴클레오티드 잔기를 함유한다. 추가 실시양태에서, 변형은 당 모이어티의 2' 위치에 있다.
본 발명의 방법에 사용된 올리고뉴클레오티드는 당 변형, 즉 리보실 모이어티의 변형된 버전, 예컨대 2'-O-변형된 RNA, 예컨대 2'-O-알킬 또는 2'-O-(치환된)알킬, 예를 들어 2'-O-메틸, 2'-O-(2-시아노에틸), 2'-O-(2-메톡시)에틸 (2'-MOE), 2'-O-(2-티오메틸)에틸, 2'-O-부티릴, 2'-O-프로파르길, 2'-O-알릴, 2'-O-(3-아미노)프로필, 2'-O-(3-(디메틸아미노)프로필), 2'-O-(2-아미노)에틸, 2'-O-(2-(디메틸아미노)에틸); 2'-데옥시 (DNA); 2'-O-(할로알콕시)메틸 (Arai K. et al. Bioorg. Med. Chem. 2011, 21, 6285), 예를 들어 2'-O-(2-클로로에톡시)메틸 (MCEM), 2'-O-(2, 2-디클로로에톡시)메틸 (DCEM); 2'-O- 알콕시카르보닐, 예를 들어 2'-O-[2-(메톡시카르보닐)에틸] (MOCE), 2'-O-[2-(N-메틸카르바모일)에틸] (MCE), 2'-O-[2-(N, N-디메틸카르바모일)에틸] (DCME); 2'-할로, 예를 들어 2'-F, FANA (2'-F 아라비노실 핵산); 카르바슈가 및 아자슈가 변형; 3'-O-알킬, 예를 들어 3'-O-메틸, 3'-O-부티릴, 3'-0-프로파르길; 및 이들의 유도체를 포함할 수 있다.
본 발명의 한 실시양태에서, 당 변형은 2'-플루오로 (2'-F), 2'-O-메틸 (2'-OMe), 2'-O-메톡시에틸 (2'-MOE), 및 2'-아미노로 이루어진 군으로부터 선택된다. 또 다른 추가 실시양태에서, 변형은 2'-MOE이다.
다른 당 변형은 "브릿지(bridged)" 또는 "이환식(bicyclic)" 핵산 (BNA), 예를 들어 잠금 핵산 (LNA), 크실로-LNA, α-L-LNA, β-D-LNA, cEt (2'-O,4'-C 구속된 에틸) LNA, cMOEt (2'-O,4'-C 구속된 메톡시에틸) LNA, 에틸렌-브릿지 핵산 (ENA), 트리시클로 DNA; 비잠금 핵산 (UNA); 시클로헥세닐 핵산 (CeNA), 알트리올 핵산 (ANA), 헥시톨 핵산 (HNA), 플루오린화 HNA (F-HNA), 피라노실-RNA (p-RNA), 3'-데옥시피라노실-DNA (p-DNA); 모르폴리노 (예를 들어, PMO, PPMO, PMOPlus, PMO-X에서); 및 이들의 유도체를 포함한다.
본 발명의 방법에 사용된 올리고뉴클레오티드는 다른 변형, 예컨대 펩티드-기반 핵산 (PNA), 붕소 변형된 PNA, 피롤리딘-기반 옥시-펩티드 핵산 (POPNA), 글리콜- 또는 글리세롤-기반 핵산 (GNA), 트레오스-기반 핵산 (TNA), 비환식 트레오니놀-기반 핵산 (aTNA), 통합된 염기 및 백본을 갖는 올리고뉴클레오티드 (ONIB), 피롤리딘-아미드 올리고뉴클레오티드 (POM); 및 이들의 유도체를 포함할 수 있다.
본 발명의 한 실시양태에서, 변형된 올리고뉴클레오티드는 포스포로디아미데이트 모르폴리노 올리고머 (PMO), 잠금 핵산 (LNA), 펩티드 핵산 (PNA), 브릿지 핵산 (BNA), 예컨대 (S)-cEt-BNA, 또는 SPIEGELMER를 포함한다.
추가 실시양태에서, 변형은 핵염기에 있다. 염기 변형은 자연 퓨린 및 피리미딘 염기 (예를 들어, 아데닌, 우라실, 구아닌, 시토신, 및 티민)의 변형된 버전, 예컨대 이노신, 히포크산틴, 오로트산, 아그마티딘, 리시딘, 2-티오피리미딘 (예를 들어, 2-티오우라실, 2-티오티민), G-클램프 및 그의 유도체, 5-치환된 피리미딘 (예를 들어, 5-메틸시토신, 5-메틸우라실, 5-할로우라실, 5-프로피닐우라실, 5-프로피닐시토신, 5-아미노메틸우라실, 5-히드록시메틸우라실, 5-아미노메틸시토신, 5-히드록시메틸시토신, 수퍼 T), 2,6-디아미노퓨린, 7-데아자구아닌, 7-데아자아데닌, 7-아자-2, 6-디아미노퓨린, 8-아자-7-데아자구아닌, 8-아자-7-데아자아데닌, 8-아자-7-데아자-2, 6-디아미노퓨린, 수퍼 G, 수퍼 A, 및 N4- 에틸시토신, 또는 그의 유도체; N2-시클로펜틸구아닌 (cPent-G), N2-시클로펜틸-2-아미노퓨린 (cPent-AP), 및 N2-프로필-2-아미노퓨린 (Pr-AP), 또는 그의 유도체; 및 축퇴 또는 범용 염기, 예컨대 2,6-디플루오로톨루엔 또는 결여 염기, 예컨대 비염기성 부위 (예를 들어, 1-데옥시리보스, 1,2-디데옥시리보스, 1-데옥시-2-O-메틸리보스; 또는 고리 산소가 질소로 대체된 피롤리딘 유도체 (아자리보스))를 포함한다. 수퍼 A, 수퍼 G 및 수퍼 T의 유도체의 예는 US6683173에서 찾을 수 있다. cPent-G, cPent-AP 및 Pr-AP는 siRNA에 혼입될 때 면역자극 효과를 감소시키는 것으로 나타났다 (Peacock H. et al. J. Am. Chem. Soc. (2011), 133, 9200).
본 발명의 한 실시양태에서, 핵염기 변형은 5-메틸 피리미딘, 7-데아자구아노신 및 비염기성 뉴클레오티드로 이루어진 군으로부터 선택된다. 한 실시양태에서, 변형은 5-메틸 시토신이다.
본 발명의 방법에 사용된 올리고뉴클레오티드는 백본 변형, 예를 들어 RNA에 존재하는 포스포디에스테르의 변형된 버전, 예컨대 포스포로티오에이트 (PS), 포스포로디티오에이트 (PS2), 포스포노아세테이트 (PACE), 포스포노아세트아미드 (PACA), 티오포스포노아세테이트, 티오포스포노아세트아미드, 포스포로티오에이트 프로드러그, H-포스포네이트, 메틸 포스포네이트, 메틸 포스포노티오에이트, 메틸 포스페이트, 메틸 포스포로티오에이트, 에틸 포스페이트, 에틸 포스포로티오에이트, 보라노포스페이트, 보라노포스포로티오에이트, 메틸 보라노포스페이트, 메틸 보라노포스포로티오에이트, 메틸 보라노포스포네이트, 메틸보라노포스포노티오에이트, 및 이들의 유도체를 포함할 수 있다. 또 다른 변형은 포스포르아미다이트, 포스포르아미데이트, N3'→P5' 포스포르아미데이트, 포스포르디아미데이트, 포스포로티오디아미데이트, 술파메이트, 디메틸렌술폭사이드, 술포네이트, 트리아졸, 옥살릴, 카르바메이트, 메틸렌이미노 (MMI), 및 티오아세트아미도 핵산 (TANA); 및 이들의 유도체를 포함한다.
추가 실시양태에서, 변형은 백본에 있고, 포스포로티오에이트 (PS), 포스포르아미데이트 (PA) 및 포스포로디아미데이트로 이루어진 군으로부터 선택된다. 본 발명의 한 실시양태에서, 변형된 올리고뉴클레오티드는 포스포로디아미데이트 모르폴리노 올리고머 (PMO)이다. PMO는 포스포로디아미데이트 연결을 갖는 메틸렌모르폴린 고리의 백본을 갖는다. 본 발명의 한 실시양태에서, 생성물은 포스포로티오에이트 (PS) 백본을 갖는다.
본 발명의 한 실시양태에서, 올리고뉴클레오티드는 상기 개시된 바와 같은 2개 이상의 변형의 조합을 포함한다. 관련 기술분야의 통상의 기술자는 올리고뉴클레오티드의 많은 합성 유도체가 있음을 이해할 것이다.
본 발명의 한 실시양태에서, 생성물은 갭머이다. 본 발명의 한 실시양태에서, 윙 절편은 백본 및 당 변형을 포함하고, 중심 또는 '갭' 절편은 백본 변형을 포함하나 당 변형은 포함하지 않는다. 본 발명의 한 실시양태에서, 갭머의 5' 및 3' 윙은 2'-MOE 변형된 뉴클레오티드를 포함하거나 이로 이루어진다. 본 발명의 한 실시양태에서, 갭머의 갭 절편은 당 모이어티의 2' 위치에 수소를 함유하는 뉴클레오티드, 즉 DNA-유사를 포함하거나 이로 이루어진다. 본 발명의 한 실시양태에서, 갭머의 5' 및 3' 윙은 2'MOE 변형된 뉴클레오티드로 이루어지고, 갭머의 갭 절편은 당 모이어티의 2' 위치에 수소를 함유하는 뉴클레오티드 (즉, 데옥시뉴클레오티드)로 이루어진다. 본 발명의 한 실시양태에서, 갭머의 5' 및 3' 윙은 2'MOE 변형된 뉴클레오티드로 이루어지고, 갭머의 갭 절편은 당 모이어티의 2' 위치에 수소를 함유하는 뉴클레오티드 (즉, 데옥시뉴클레오티드)로 이루어지고, 모든 뉴클레오티드 사이의 연결은 포스포로티오에이트 연결이다.
본 발명의 한 실시양태는 본원에 앞서 기재된 바와 같은 방법을 제공하며, 여기서 생성된 생성물은 90% 초과 순수하다. 추가 실시양태에서, 생성물은 95% 초과 순수하다. 추가 실시양태에서, 생성물은 96% 초과 순수하다. 추가 실시양태에서, 생성물은 97% 초과 순수하다. 추가 실시양태에서, 생성물은 98% 초과 순수하다. 추가 실시양태에서, 생성물은 99% 초과 순수하다. 올리고뉴클레오티드의 순도는 임의의 적합한 방법, 예를 들어 고성능 액체 크로마토그래피 (HPLC) 또는 질량 분광법 (MS), 특히 액체 크로마토그래피-MS (LC-MS), HPLC-MS 또는 모세관 전기영동 질량 분광법 (CEMS)을 사용하여 결정될 수 있다.
본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드는 안티센스 올리고뉴클레오티드이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드는 아프타머이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드는 miRNA이다. 본 발명의 한 실시양태에서, 생성물은 치료용 올리고뉴클레오티드이다.
본 발명의 또 다른 실시양태는 이중-가닥 올리고뉴클레오티드를 생성하는 방법을 제공하며, 여기서 2개의 상보적 단일-가닥 올리고뉴클레오티드는 임의의 상기 실시양태의 방법에 의해 생성된 후, 어닐링을 허용하는 조건 하에 혼합되며, 이러한 조건은 통상의 기술자에게 쉽게 명백하다. 한 실시양태에서, 생성물은 siRNA이다.
본 발명의 한 실시양태에서, 절편을 라이게이션하기 위한 반응 용기에 뉴클레오티드가 실질적으로 없다. 본 발명의 한 실시양태에서, 절편을 라이게이션하기 위한 반응 용기에 뉴클레오티드가 없다. 본 발명의 또 다른 실시양태에서, 절편을 라이게이션하기 위한 반응 용기는 뉴클레오티드의 풀을 포함하지 않으며, 즉 반응물에는 뉴클레오티드가 실질적으로 내지 완전히 없다.
본원에 개시된 본 발명은 올리고뉴클레오티드 결합의 특성을 사용하여 이들의 생성을 위한 개선된 방법을 제공한다. 표적 서열과 100% 상보성을 갖는 주형 올리고뉴클레오티드를 제공하고, 생성물이 특정 조건 하에 방출되고 분리될 수 있도록 반응 조건을 제어함으로써, 높은 정도의 순도를 갖는 생성물이 수득될 수 있다.
생성물 (또는 불순물):주형 이중나선의 변성 및 주형으로부터 생성물 (또는 불순물)의 분리
주형으로부터의 생성물 (또는 임의의 불순물)의 방출은 주형 올리고뉴클레오티드 가닥 및 생성물 (또는 불순물) 사이의 왓슨-크릭 염기 쌍형성이 파괴되는 것 (즉, 이중나선의 변성)을 필요로 한다. 그 후, 생성물 (또는 불순물)은 주형으로부터 분리될 수 있으며, 이는 2개의 별도의 단계 또는 1개의 조합된 단계로서 일어날 수 있다.
방법이 컬럼 반응기에서 수행되는 경우, 생성물 (또는 불순물)의 방출 및 분리는 1개의 단계로서 일어날 수 있다. pH 또는 염 농도를 변경하거나 염기 쌍형성을 파괴하는 화학 작용제 (예컨대, 포름아미드 또는 우레아)를 함유하는 완충제의 실행은 올리고뉴클레오티드 가닥의 변성을 야기할 것이고, 생성물 (또는 불순물)이 완충제에서 용리될 것이다.
공정이 다른 반응 용기에서 수행되는 경우, 생성물 (또는 불순물)의 방출 및 분리는 2-단계 공정으로 발생할 수 있다. 먼저, 왓슨-크릭 염기 쌍이 파괴되어 가닥을 변성시킨 후, 생성물 (또는 불순물)이 주형으로부터 분리되며, 예를 들어 반응 용기로부터 제거된다. 생성물의 방출 및 분리가 2-단계 공정으로 수행되는 경우, 완충제 상태 (pH, 염)를 변경하거나 화학적 파괴제(disrupting agent) (포름아미드, 우레아)를 도입함으로써 왓슨-크릭 염기 쌍의 파괴가 성취될 수 있다. 대안적으로, 온도 상승은 또한 두 가닥의 해리, 즉 변성을 야기할 것이다. 그 후, 생성물 (또는 불순물)은 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합을 포함하는 방법을 통해 분리 (및 또한 원한다면 반응 용기로부터 제거)될 수 있다.
공정이 연속적인 또는 반연속적인 유동 반응기에서 수행되는 경우, 생성물 (또는 불순물)의 방출 및 분리는 한 단계 또는 두 단계일 수 있다. 예를 들어, 한 단계로 생성물 (또는 불순물)의 방출 및 분리는 두 가닥의 해리를 유발하기 위해 온도를 증가시키고, 온도를 상승시키기 위해 사용된 반응기의 동일한 부분에서 분자량에 기초하여 방출된 가닥을 분리함으로써 영향을 받을 수 있다. 두 단계에서 생성물 (또는 불순물)의 방출 및 분리는 반응기의 한 부분에서 두 가닥의 해리를 야기하기 위해 온도를 상승시키고, 반응기의 상이한 부분에서 분자량에 기초하여 방출된 가닥을 분리함으로써 영향을 받을 수 있다.
주형으로부터 불순물을 특이적으로 방출하고 분리하지만, 생성물을 주형에 유지함
부정확한 뉴클레오티드가 쇄 연장 동안 올리고뉴클레오티드 가닥에 혼입되는 경우, 또는 쇄 연장 반응이 조기에 종결되는 경우, 불순물이 발생한다. 반응이 절편 올리고뉴클레오티드를 라이게이션하는 단계를 포함하고 하나 이상의 라이게이션 단계가 일어나지 않는 경우에도 불순물이 발생한다. 발생할 수 있는 불순물의 종류는 도 6에 예시되어 있다.
왓슨-크릭 염기 쌍형성의 특성은 생성물의 방출 전에 주형에 결합된 임의의 불순물을 특이적으로 방출하는데 사용될 수 있다. 각각의 이중-가닥 올리고뉴클레오티드는 특정 조건 하에 해리할 것이며, 상기 조건은 100% 상보성을 갖는 서열과 비교하는 경우 100% 상보성을 갖지 않는 서열에 대해 상이하다. 이러한 조건을 결정하는 것은 통상의 기술자의 권한 내에 있다.
올리고뉴클레오티드를 변성시키는 통상적인 방법은 온도를 상승시키는 것이다. 염기 쌍의 절반이 해리되는 온도, 즉 이중나선의 50%가 단일-가닥 상태인 온도를 용융 온도, Tm이라고 한다. 용융 온도를 결정하는 가장 신뢰성 있고 정확한 수단은 경험적인 것이다. 그러나, 이는 번거롭고 보통 필수적이 아니다. Tm 값을 계산하기 위해 여러 식이 사용될 수 있으며 (Nucleic Acids Research 1987, 15 (13): 5069-5083; PNAS 1986, 83 (11): 3746-3750; Biopolymers 1997, 44 (3): 217-239), 수많은 용융 온도 계산기는 시약 공급회사 및 대학이 호스팅하는 온라인에서 찾을 수 있다. 주어진 올리고뉴클레오티드 서열에 대해, 모든 포스포로티오에이트 연결을 갖는 변이체는 모든 포스포디에스테르 연결을 갖는 변이체보다 더 낮은 온도에서 용융하는 것으로 공지되어 있다. 올리고뉴클레오티드에서 포스포로티오에이트 연결의 수를 증가시키는 것은 그의 의도된 표적에 대한 올리고뉴클레오티드의 Tm을 낮추는 경향이 있다.
반응 혼합물로부터 불순물을 특이적으로 분리하기 위해, 먼저 생성물:주형 이중나선의 용융 온도를 계산한다. 그 후, 반응 용기를 제1 온도, 예를 들어 생성물:주형 이중나선의 용융 온도 미만의 온도, 예를 들어 용융 온도보다 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10℃ 낮은 온도로 가열한다. 이 가열 단계는 주형으로부터 생성물이 아닌, 즉 주형과 100% 상보적이지 않은 올리고뉴클레오티드의 변성을 야기한다. 그 후, 이들 변성된 올리고뉴클레오티드는 상기 개시된 방법, 예를 들어 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합 중 하나를 사용하여 반응 용기로부터 제거될 수 있다. 그 후, 반응 용기를 더 높은 제2 온도, 예를 들어 계산된 용융 온도보다 높은, 예를 들어 용융 온도보다 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10℃ 높은 온도로 상승시켜, 주형으로부터 생성물의 변성을 야기할 것이다. 그 후, 생성물은 상기 개시된 방법, 예를 들어 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합 중 하나를 사용하여 분리 (및 반응 용기로부터 제거)될 수 있다.
파괴제가 pH 또는 염 농도의 변화를 야기하는 작용제 또는 화학적 파괴제인 경우, 유사한 공정이 사용될 수 있다. 파괴제는 주형으로부터 생성물이 아닌 올리고뉴클레오티드의 변성을 야기하기 위해 생성물이 해리하는 농도 바로 아래까지 농도가 증가된다. 그 후, 이들 불순물은 상기 개시된 방법 중 하나를 사용하여 반응 용기로부터 제거될 수 있다. 그 후, 파괴제는 생성물이 주형으로부터 해리하는 농도 초과로 농도가 증가된다. 그 후, 생성물은 상기 개시된 방법 중 하나를 사용하여 반응 용기로부터 제거될 수 있다.
상기 개시된 바와 같은 공정으로부터 수득된 생성물은 추가 정제 단계의 필요 없이 높은 정도의 순도를 갖는다. 예를 들어, 수득된 생성물은 95% 초과 순수하다.
주형의 특성
주형은 생성물에서 불순물이 되는 것을 방지하기 위해 생성물이 제거될 때 반응 용기에서 유지되는 것을 허용하는 특성을 요구한다. 다시 말해서, 주형은 생성물로부터 분리되는 것을 허용하는 특성을 갖는다. 본 발명의 한 실시양태에서, 이 체류는 주형을 지지 물질에 커플링함으로써 성취된다. 이 커플링는 고분자량을 갖는 주형-지지체 복합체를 생성하고, 따라서 불순물 및 생성물이 예를 들어 여과에 의해 제거될 때 반응 용기에서 유지될 수 있다. 주형은 고체 지지체 물질, 예컨대 중합체 비드, 섬유질 지지체, 막, 스트렙타비딘 코팅된 비드 및 셀룰로스에 커플링될 수 있다. 주형은 또한 가용성 지지체 물질, 예컨대 폴리에틸렌 글리콜, 가용성 유기 중합체, DNA, 단백질, 덴드리머, 다당류, 올리고당 및 탄수화물에 커플링될 수 있다.
각각의 지지체 물질은 주형이 부착될 수 있는 다수의 점을 가질 수 있으며, 각각의 부착점은 예를 들어 도 3에 나타낸 방식으로 부착된 다수의 주형을 가질 수 있다.
주형은 지지체 물질로의 부착 없이 고분자량 자체를 가질 수 있으며, 예를 들어 도 3에 나타낸 방식으로 예를 들어 링커에 의해 분리된 주형의 다수의 카피를 갖는 분자일 수 있다.
주형을 반응 용기에서 유지하는 능력은 또한 회수되거나 연속적인 또는 반연속적인 유동 공정에서 사용함으로써 주형이 향후 반응을 위해 재순환되는 것을 허용한다.
주형을 생성물 (또는 불순물)로부터 분리하는 방법
상기 개시된 바와 같은 주형의 특성은 주형 및 생성물의 분리, 또는 주형 결합된 생성물 및 불순물의 분리를 허용한다. 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합이 사용될 수 있다.
주형이 고체 지지체에 부착된 경우, 생성물로부터의 주형의 분리, 또는 주형에 결합된 생성물로부터의 불순물의 분리는 관련 기술분야의 통상의 기술자에게 쉽게 명백한 바와 같이 적절한 조건 하에 고체 지지체를 세척함으로써 성취된다. 주형이 가용성 지지체에 커플링되거나 그 자체가 반복 주형 서열로 구성된 경우, 생성물로부터의 주형의 분리, 또는 불순물로부터의 주형 결합된 생성물의 분리는 예를 들어 더 큰 분자는 필터에 의해 유지되고 더 작은 분자는 통과하도록 필터 물질이 선택되는 기술, 예컨대 한외여과 또는 나노-여과를 사용함으로써 분자량-기반 분리에 의해 성취될 수 있다. 주형 생성물 복합체로부터의 불순물의 단일 분리 단계, 또는 주형으로부터의 생성물의 분리가 충분히 효율적이지 않은 경우, 다수의 순차적 여과 단계를 사용하여 분리 효율을 증가시키고 목적 순도를 충족시키는 생성물을 생성할 수 있다.
효율적이고 산업적 생산 규모로 적용가능한 이러한 올리고뉴클레오티드의 분리 방법을 제공하는 것이 바람직하다. 문헌 ["Therapeutic oligonucleotides: The state of the art in purification technologies" Sanghvi et al. Current Opinion in Drug Discovery (2004) Vol. 7 No. 8]은 올리고뉴클레오티드 정제를 위해 사용된 공정을 검토한다.
WO 01/55160 A1은 오염물과 이민 연결을 형성한 후 이민-연결 불순물을 크로마토그래피 또는 다른 기술로 제거함으로써 올리고뉴클레오티드를 정제하는 것을 개시한다. 문헌 ["Size Fractionation of DNA Fragments Ranging from 20 to 30000 Base Pairs by Liquid/Liquid chromatography" Muller et al. Eur. J. Biochem (1982) 128-238]은 뉴클레오티드 서열의 분리를 위해 PEG/덱스트란 상이 침착된 미세결정질 셀룰로스의 고체 컬럼의 사용을 개시한다. 문헌 ["Separation and identification of oligonucleotides by hydrophilic interaction chromatography." Easter et al. The Analyst (2010); 135(10)]은 고체 실리카 지지체 상을 사용하는 HPLC의 변이체를 사용한 올리고뉴클레오티드의 분리를 개시한다. 문헌 ["Fractionation of oligonucleotides of yeast soluble ribonucleic acids by countercurrent distribution" Doctor et al. Biochemistry (1965) 4(1) 49-54]은 건조 DEAE-셀룰로스로 충전된 건조 고체 컬럼의 사용을 개시한다. 문헌 ["Oligonucleotide composition of a yeast lysine transfer ribonucleic acid" Madison et al.; Biochemistry, 1974, 13(3)]은 뉴클레오티드 서열의 분리를 위한 고체상 크로마토그래피의 사용을 개시한다.
액체-액체 크로마토그래피는 공지된 분리 방법이다. 문헌 ["Countercurrent Chromatography The Support-Free Liquid Stationary Phase" Billardello, B.; Berthod, A; Wilson & Wilson's Comprehensive Analytical Chemistry 38; Berthod, A., Ed.; Elsevier Science B.V.: Amsterdam (2002) pp 177-200]은 액체-액체 크로마토그래피에 대한 유용한 일반적인 설명을 제공한다. 다양한 액체-액체 크로마토그래피 기술이 공지되어 있다. 이러한 기술 중 하나는 액체-액체 역류 크로마토그래피 (본원에서 "CCC"로 지칭됨)이다. 또 다른 공지된 기술은 원심 분배 크로마토그래피 (본원에서 "CPC"로 지칭됨)이다.
상기 개시된 방법 및 WO 2013/030263에 개시된 방법은 생성물 올리고뉴클레오티드를 예를 들어 주형 및/또는 불순물로부터 분리하는데 사용될 수 있다.
본 발명의 방법, 즉 라이게이션 단계 (d)에서 사용하기 위한 리가제
본 발명의 한 실시양태에서, 리가제는 ATP 의존적 리가제이다. ATP 의존적 리가제는 크기의 범위가 30 내지 >100 kDa이다. 본 발명의 한 실시양태에서, 리가제는 NAD 의존적 리가제이다. NAD 의존적 효소는 고도로 상동성이며, 70-80 kDa의 단량체 단백질이다. 본 발명의 한 실시양태에서, 리가제는 열안정한 리가제이다. 열안정한 리가제는 호열성 박테리아로부터 유래될 수 있다.
본 발명의 한 실시양태에서, 리가제는 주형-의존적 리가제이다.
본 발명의 한 실시양태에서, 리가제는 야생형 엔테로박테리아(Enterobacteria) 파지 CC31 DNA 리가제 (서열식별번호: 6) 또는 야생형 시겔라(Shigella) 파지 Shf125875 DNA 리가제 (서열식별번호: 8)이다.
본 발명의 한 실시양태에서, 리가제는 변형된 리가제이다. 예를 들어, 변형된 리가제는 변형된 T4 DNA 리가제, 변형된 엔테로박테리아 파지 CC31 리가제, 변형된 시겔라 파지 Shf125875 리가제 및 변형된 클로렐라(Chlorella) 리가제를 포함한다.
한 실시양태에서, 야생형 T4 DNA 리가제는 서열식별번호: 3의 아미노산 위치 368 또는 아미노산 위치 371에서 변형된다.
한 실시양태에서, 돌연변이체 리가제는 서열식별번호: 3을 포함하거나 이로 이루어지며, 여기서 위치 368의 아미노산은 R 또는 K이다.
한 실시양태에서, 돌연변이체 리가제는 서열식별번호: 3을 포함하거나 이로 이루어지며, 여기서 위치 371의 아미노산은 다음 아미노산: L, K, Q, V, P, R 중 임의의 하나이다.
한 실시양태에서, T4 DNA 리가제와 관련하여 상기 개시된 상응하는 잔기(들)는 엔테로박테리아 파지 CC31 리가제, 시겔라 파지 Shf125875 리가제 및 클로렐라 리가제 중 임의의 하나에서 돌연변이된다. DNA 리가제의 보존된 영역은 문헌 [Chem. Rev. 2006, 106, 687-699] 및 [Nucleic Acids Research, 2000, Vol. 28, No. 21, 4051-4058]에 개시되어 있다. 한 실시양태에서, 리가제는 링커 영역에서 변형된다.
본 발명의 한 실시양태에서, 리가제는 서열식별번호: 23을 포함하거나 이로 이루어지거나, 야생형 리가제, 예를 들어 엔테로박테리아 파지 CC31 리가제를 제외하고 리가제는 이와 적어도 90% 서열 동일성을 갖는다.
본 발명의 한 실시양태에서, 리가제는 다음 아미노산 서열: 서열식별번호: 10-28 중 임의의 하나를 포함하거나 이로 이루어진다.
본 발명의 한 실시양태에서, 리가제는 예를 들어 비드 상에 고정화된다.
출발 물질로 사용되는 올리고뉴클레오티드
본 발명의 방법을 위한 출발 물질로 사용되는 올리고뉴클레오티드는 "풀"로 본원에 기재되어 있으며, 그의 정의는 상기 제공된다. 풀은 올리고뉴클레오티드의 비균질한 세트이다. 풀을 형성하는 올리고뉴클레오티드는 다른 올리고뉴클레오티드 생성 방법, 예를 들어 고체상 또는 효소적 합성에 의해 생성된 것일 것이며, 따라서 불순물을 함유할 가능성이 있다.
풀은 생성물 올리고뉴클레오티드의 절편으로 구성되며, 이어서 주형 상에 어셈블리되는 동안 함께 연결된다. 각각의 절편은 상이한 길이 및/또는 부정확하게 혼입된 잔기의 불순물을 갖는 비균질한 세트일 것이다.
효소를 사용한 절편 올리고뉴클레오티드의 생성
1) ss리가제, 예를 들어 RNA 리가제
ss리가제는 ATP 구동된 첨가, 예를 들어, 3',5' 뉴클레오티드 비스포스페이트, 3',5' 뉴클레오티드 티오포스페이트 (예를 들어, 3',5' 비스티오포스페이트 또는 3'-포스페이트-5'-티오포스페이트 또는 3'-티오포스페이트-5'-포스페이트) 또는 3'5' 뉴클레오티드 디티오포스페이트 (예를 들어, 3',5' 비스디티오포스페이트 또는 3'-포스페이트-5'-디티오포스페이트 또는 3'-디티오포스페이트-5'-포스페이트)를 짧은 올리고뉴클레오티드 (프라이머)의 3'-OH에 주형-독립적 방식으로 첨가하는 것을 촉매한다. 통상의 기술자는 당 모이어티의 3' 위치에 디포스페이트 (또는 디티오포스페이트) 또는 트리포스페이트 (또는 하나 이상의 산소 원자가 황에 의해 치환된 다른 올리고포스페이트)가 또한 사용될 수 있으나, 추가 포스페이트 (또는 티오포스페이트) 모이어티는 필요하지 않다는 것을 이해할 것이다. 동등하게 변형된 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드는 상기 언급된 개별 뉴클레오티드 대신에 사용될 수 있다. 올리고뉴클레오티드 프라이머는 통상적으로 최소 3개의 뉴클레오티드 길이이다. 이 첨가 반응의 생성된 올리고뉴클레오티드는 출발 올리고뉴클레오티드보다 1개 뉴클레오티드 더 길다 (또는 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드가 각각 사용되는 경우 출발 올리고뉴클레오티드보다 2, 3 또는 4개 뉴클레오티드 더 길다). 새로운 3' 위치가 이제 인산화된다. 후속 뉴클레오티드를 첨가하기 위해, 성장하는 올리고뉴클레오티드의 3' 포스페이트는 가수분해에 의해 제거되어 3'-OH를 생성한다. 이 가수분해는 전형적으로 도 1에 나타낸 바와 같이 포스파타제 효소를 사용하여 수행된다.
2) 트랜스퍼라제
말단 데옥시뉴클레오티딜 트랜스퍼라제 (TdT) 효소는 3'-보호된 뉴클레오티드 트리포스페이트, 예를 들어 3'-O-아지도메틸, 3'-아미노옥시 또는 3'-O-알릴 기에 의해 보호된 3'-보호된 뉴클레오티드 트리포스페이트를 주형-독립적 방식으로 짧은 올리고뉴클레오티드 (프라이머)의 3'-OH에 첨가하는 것을 촉매한다. 이 올리고뉴클레오티드 프라이머는 통상적으로 최소 3개의 뉴클레오티드 길이이다.
적합한 방법은 예를 들어, EP2796552, US8808989, WO16128731 A1 및 WO16139477 A1에 기재되어 있다.
절편 올리고뉴클레오티드를 생성하기 위한 상기 기재된 ss리가제 및 트랜스퍼라제 방법에 사용되는 프라이머 올리고뉴클레오티드는
(1) 원한다면 절편 올리고뉴클레오티드의 일부로서 유지될 수 있거나, 또는
(2) 생성물 올리고뉴클레오티드로부터 절단되어, 목적 생성물의 분리를 허용하고, 추가 절편 올리고뉴클레오티드를 제조하기 위해 재순환의 가능성을 허용할 수 있다. 절편 올리고뉴클레오티드로부터 프라이머의 절단은 절단이 효과적이고 또한 정확하도록 서열 특이적 뉴클레아제 및 적절한 설계의 프라이머 및 절편을 사용하여 수행될 수 있다.
<실시예>
약어
OMe O-메틸
MOE O-메톡시에틸 (DNA 백본) 또는 메톡시에틸 (RNA 백본)
CBD 셀룰로스 결합 도메인
HPLC 고성능 액체 크로마토그래피
PBS 포스페이트 완충 염수
HAA 헥실암모늄 아세테이트
SDS PAGE 나트륨 도데실 술페이트 폴리아크릴아미드 겔 전기영동
LCMS 액체 크로마토그래피 질량 분광법
PO 포스포디에스테르
DTT 디티오트레이톨
Ni-NTA 니켈 니트릴로트리아세트산
/3Phos/ 3'-포스페이트 기
/5Phos/ 5' 포스페이트 기
(p) 포스페이트 기
PS 또는 * 포스포로티오에이트
/i데옥실/ 2' 데옥시이노신
5mC 5-메틸시토신
BSA 소 혈청 알부민
LNA 잠금 핵산
WT 야생형
실시예 1: 야생형 T4 DNA 리가제를 사용한 올리고뉴클레오티드 (DNA) 절편 어셈블리 및 라이게이션
1.1 출발 및 대조군 서열의 화학적 합성
다수의 짧은 올리고뉴클레오티드 ("절편")가 상보적 주형 가닥 상에 정확한 순서로 어셈블리되고 목적 최종 생성물 ("표적")을 제공하도록 라이게이션될 수 있음을 입증하기 위해, 표 1에 상세히 기재된 바와 같은 절편, 표적 및 주형 서열을 표준 방법을 사용하여 화학적으로 합성하였다.
1.2 HPLC 분석
흡광도를 258 nm에서 모니터링하면서, 0.2 ml/분으로 실행하는 애질런트(Agilent) ZORBAX 이클립스 플러스(Eclipse Plus) XDB-C18 컬럼 (4.6 x 150 mm, 5 ㎛ dp. 애질런트 P/N 993967-902)을 사용하여 HPLC 분석을 수행하였다. 컬럼을 60℃에서 유지하였다. 20 ㎕의 샘플을 주입하고, 20-31% 완충제 B로부터 구배를 20분에 걸쳐 실행한 후, 5분 동안 최대 80% 완충제 B로 계단식으로 진행하였다.
완충제 A: 75 ml 1 M HAA, 300 ml 이소프로필 알콜, 200 ml 아세토니트릴, 4425 ml 물
완충제 B: 650 ml 이소프로필 알콜, 350 ml 아세토니트릴
<표 1>
(p) 포스페이트
1.3 상업용 T4 DNA 리가제 (서열식별번호: 3)를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법
5' 절편, 중심 절편 및 3' 절편을 주형 상에 어셈블리하였다: 각각의 절편 및 주형을 1 mg/ml의 농도로 물에 용해시킨 후 다음과 같이 혼합하였다.
5'-절편 2 ㎕
중심 절편 2 ㎕
3-절편 2 ㎕
비오티닐화 주형 2 ㎕
H2O 36 ㎕
조합된 올리고뉴클레오티드 용액을 94℃에서 5분 동안 인큐베이션하고, 37℃로 냉각한 후, 37℃에서 추가 5분 동안 인큐베이션하여 절편이 주형에 어닐링하도록 하였다. 그 후, 2 ㎕ (2 ㎍과 동등함)의 T4 DNA 리가제 (NEB) 및 4 ㎕의 1 x T4 DNA 라이게이션 완충제 (NEB)을 첨가하고, 반응물 (총 반응 부피 50 ㎕)을 실온에서 1시간 동안 인큐베이션하였다. 그 후, 40 ㎕의 스트렙타비딘 코팅된 자성 비드를 첨가하고, 현탁액을 실온에서 10분 동안 인큐베이션하여, 비오티닐화 주형이 스트렙타비딘 비드에 결합되도록 하였다. 스트렙타비딘 비드를 2 x 100 ㎕ PBS로 세척하여, 비결합된 절편을 제거하였다. 세척액을 HPLC에 의해 분석하였다. 그 후, 반응 혼합물을 94℃에서 10분 동안 인큐베이션하여, 결합된 라이게이션 생성물 (또는 임의의 결합된 절편)을 주형으로부터 분리시킨 후, 얼음 상에서 급속하게 냉각시켜 DNA를 '용융'하고, 주형으로의 올리고뉴클레오티드 생성물 (또는 절편)의 재어닐링을 정지시켰다. 그 후, 라이게이션 반응의 분석을 HPLC에 의해 수행하였다.
1.4 사내 T4 DNA 리가제 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법
1.4.1 비드 슬러리 생성
N-말단에서 셀룰로스 결합 도메인 (CBD)에 융합된 T4 리가제 (서열식별번호: 4)를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 이 T4 리가제 아미노산 서열은 N-말단 메티오닌 (M)이 글리신 및 세린 (GS)으로 대체되었다는 점에서 상업용 T4 리가제 서열 (서열식별번호: 3)과 상이하다. CBD 융합 단백질의 생성 및 발현을 돕기 위해 이들 아미노산 치환을 수행하였다. CBD-T4 리가제 융합 단백질을 BL21 A1 세포 (인비트로젠)에서 발현시켰다. 상등액을 수확하고, 600 ㎕의 펄로자 100 (펄로자) 비드에 첨가하고, 26℃에서 1시간 동안 진탕하였다. 그 후, 펄로자 셀룰로스 비드를 수집하고, 2 ml 완충제 (50 mM 트리스(Tris) pH 8.0, 200 mM NaCl, 0.1% 트윈(Tween) 20, 10% 글리세롤), 이어서 5 ml PBS로 세척하고, 최종적으로 200 ㎕ PBS (10 mM PO4 3-, 137 mM NaCl, 2.7 mM KCl pH 7.4)에 재현탁시켰다. 단백질 발현을 분석하기 위해, 15 ㎕의 펄로자 비드 슬러리를 5 ㎕의 SDS 로딩 완충제와 혼합하고, 표준 프로토콜에 따라 SDS PAGE 구배 겔 (4 - 20%) 상에서 실행시키기 전에 80℃에서 10분 동안 인큐베이션하였다.
1.4.2 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션
펄로자 비드에 결합된 T4 리가제에 대해, 상기 1.3의 어셈블리 및 라이게이션 방법을 다음과 같이 변형하였다. 초기 절편 혼합물에서, 36 ㎕의 H2O를 8 ㎕의 H2O로 감소시켰다. 어닐링 후, 2 ㎕의 상업용 T4 DNA 리가제를 20 ㎕의 펄로자 비드 슬러리로 대체하였다. 스트렙타비딘 자성 비드를 첨가하기 전에, 펄로자 비드를 스핀다운시키고, 상등액을 제거하였다. 스트렙타비딘 자성 비드를 상등액에 첨가하고, 실온에서 10분 동안 인큐베이션하여, 비오티닐화 주형이 스트렙타비딘 비드에 결합되도록 하였다.
1.5 결과 및 결론
생성물, 주형 및 모든 3개의 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었다.
리가제 반응물의 HPLC 분석은 일부 라이게이션되지 않은 올리고뉴클레오티드 절편이 남아있지만, 상업용 T4 DNA 리가제 (NEB)는 3개의 절편의 라이게이션을 촉매하여 목적 생성물 올리고뉴클레오티드를 생성할 수 있다는 것을 나타내었다 (도 7). 펄로자 비드 결합된 T4 DNA 리가제는 올리고뉴클레오티드 절편의 라이게이션에서 덜 효율적인 것으로 나타났으며, 올리고뉴클레오티드 절편은 대조군 세척 샘플 및 반응 샘플 둘 모두에서 나타났다 (도 8). 그러나, 상업용 효소와 비교하여 동일한 양의 효소가 비드 상에 첨가되었는지를 확인하기가 어렵기 때문에, 라이게이션 효율의 직접 비교는 불가능하였다.
실시예 2: 야생형 T4 DNA 리가제를 사용한 2'-OMe 리보스 변형된 올리고뉴클레오티드 절편 어셈블리 및 라이게이션
2.1 모든 절편에서 각각의 뉴클레오티드 위치의 2' OMe
T4 DNA 리가제가 리보스 고리의 2' 위치에서 변형을 갖는 올리고뉴클레오티드 절편을 라이게이션할 수 있는지를 결정하기 위해, 하기 나타낸 바와 같이 리보스 고리의 2' 위치가 OMe 기로 치환되고, 티미딘이 우리딘으로 대체된 것을 제외하고 실시예 1에서와 동일한 서열을 갖는 올리고뉴클레오티드 절편을 합성하였다.
<표 2>
(p) = 포스페이트
둘 모두 펄로자 비드에 결합된 상업용 NEB 리가제 및 T4 리가제 CBD 융합체를 사용한 어셈블리, 라이게이션 및 HPLC 분석을 실시예 1의 방법을 사용하여 수행하였다. 상업용 T4 DNA 리가제 (NEB) 실험을 위한 반응 믹스에 사용된 물의 양은 36 ㎕가 아니라 26 ㎕이므로, 최종 반응 부피는 40 ㎕였다. 사내 T4 DNA 리가제 비드 슬러리 실험을 위한 반응 믹스에 사용된 물의 양은 23 ㎕이고, 사용된 비드의 양은 5 ㎕이므로, 최종 반응 부피는 또한 40 ㎕였다. 2'-OMe DNA와 대조적으로 비변형된 DNA를 사용한 대조군 실험을 병렬로 실행하였다.
대조군 실험으로부터의 결과는 실시예 1에 따른 것이었다. 2'-OMe 실험에 대해 HPLC를 사용하여 생성물이 검출되지 않았으며, 이는 펄로자 비드에 결합된 상업용 T4 DNA 리가제 또는 사내 T4 DNA 리가제 CBD 융합체를 사용하였는지 여부에 관계없이, T4 DNA 리가제가 2'-OMe 변형된 올리고뉴클레오티드 절편을 완전히 라이게이션할 수 없음을 나타낸다.
2.2 단일 절편에서 각각의 뉴클레오티드 위치의 2'-OMe
각각의 올리고뉴클레오티드의 1 mg/ml 용액을 사용하여, 표 3에 상세히 기재된 바와 같은 반응을 설정하였다.
<표 3>
상업용 NEB 리가제 및 사내 펄로자 결합된 T4 DNA 리가제를 사용한 실시예 1의 방법을 사용하여 어셈블리 및 라이게이션을 수행하였다.
반응물을 94℃에서 5분 동안 인큐베이션한 후, 5분 동안 37℃에서 인큐베이션하여, 어닐링을 허용하였다. 4 ㎕의 1x NEB T4 DNA 라이게이션 완충제를 5 ㎕ (대략 2 ㎍)의 사내 T4 DNA 리가제 또는 2 ㎕ (대략 2 ㎍)의 상업용 T4 DNA 리가제 (리가제 대조군 없음인 실험 1 제외)와 함께 각각의 반응물에 첨가하고, 라이게이션 반응을 2시간 동안 실온에서 진행시켰다. 그 후, 스트렙타비딘 자성 비드를 각각의 반응물에 첨가하고, 반응물을 94℃로 가열한 후, 실시예 1에 기재된 바와 같이 얼음에서 급속하게 냉각시켜, 주형을 출발 물질 및 생성물로부터 분리시켰다.
프로세싱된 반응물을 둘로 분할하였다: 절반을 실시예 1 (섹션 1.2)에 기재된 바와 같이 HPLC에 의해 분석하였다. HPLC 결과를 확인하기 위해 샘플의 나머지 절반을 질량 분광법을 위해 유지시켰다.
비변형된 올리고뉴클레오티드 절편 (실험 5)의 라이게이션은 전장 생성물을 생성할 것으로 예상된 바와 같이 진행되었다. 도 9에 나타낸 바와 같이 5' 절편이 2'-OMe 치환된 경우 (실험 3) 소량의 라이게이션이 나타났으나, 3' 절편이 2'-OMe 치환된 경우 (실험 2) 라이게이션이 나타나지 않았다. 2.1에 따라 모든 3개의 절편이 2'-OMe 치환된 경우 (실험 4) 유의한 생성물이 나타나지 않았다.
2.3 결론
야생형 T4 DNA 리가제는 2'-OMe 치환된 올리고뉴클레오티드 절편의 라이게이션에 불량하지만, 3' 절편보다 5' 올리고뉴클레오티드 절편의 변형에 약간 덜 민감하였다.
실시예 3: 야생형 및 돌연변이체 리가제를 사용한 2'-OMe 리보스 변형된 올리고뉴클레오티드 절편 어셈블리 및 라이게이션
3.1 재료
야생형 엔테로박테리아 파지 리가제 CC31 (서열식별번호: 6), 야생형 시겔라 파지 Shf125875 리가제 (서열식별번호: 8), 및 N-말단에서 CBD에 각각 융합된 서열식별번호: 10-19의 10개의 돌연변이체 T4 리가제를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 1.4.1에 개시된 바와 같이, CBD 융합 단백질을 생성하고 발현시키기 위해, 각각의 경우에 N-말단 메티오닌 (M)을 글리신 및 세린 (GS)으로 대체하였다 (예를 들어, 엔테로박테리아 파지 리가제 CC31의 경우 서열식별번호: 7 및 시겔라 파지 Shf125875 리가제의 경우 서열식별번호: 9).
하기 올리고뉴클레오티드를 표준 고체상 방법에 의해 합성하였다.
<표 4>
N.B. OMe는 리보스 고리 상의 2' 메톡시 치환을 나타낸다.
(p) = 포스페이트
* 처음 5개의 뉴클레오티드는 2'-OMe (GGCCA) 변형되었지만, 최종 A는 그렇지 않다는 점을 주목한다.
3.2 리가제 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법
3.2.1 비드 슬러리 생성
CBD에 융합된 리가제를 1.4에 기재된 바와 같이 펄로자 비드에 결합시켜 비드 슬러리를 생성하였다.
3.2.2 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션
96 웰 플레이트에서 50 ㎕의 최종 부피로 하기 구성성분을 사용하여 라이게이션 반응물을 제조하였다:
2 ㎕ ~1 mg/mL 5' (2'-OMe) 절편
2 ㎕ ~1 mg/mL 중심 절편
2 ㎕ ~1 mg/mL 3' 절편
2 ㎕ ~1 mg/mL 주형
5 ㎕ NEB T4 DNA 리가제 완충제
22 ㎕ H2O
15 ㎕ 펄로자 결합된 비드 슬러리
펄로자 비드 슬러리를 첨가하기 전에 반응물을 15분 동안 실온에서 인큐베이션하여 절편이 주형에 어닐링되도록 하였다. 펄로자 비드 슬러리를 첨가하고, 반응물을 실온에서 1시간 동안 인큐베이션하였다. 1시간 인큐베이션 후, 용액을 ACOPREP 어드밴스 350 필터 플레이트 (PN 8082)로 이동시키고, 필터 플레이트를 ABGENE 슈퍼플레이트 (써모 사이언티픽(Thermo Scientific), #AB-2800)의 상단에 위치시키고, 10분 동안 4,000 rpm에서 원심분리하여, 펄로자 비드 슬러리를 제거하였다. 그 후, 실시예 1 (섹션 1.2)에 기재된 방법을 사용하여 HPLC에 의해 용액을 분석하였다.
각각의 올리고뉴클레오티드 어셈블리 및 라이게이션을 각각의 리가제에 대해 6회 반복하였다.
3.3 결과 및 결론
야생형 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 6) 및 야생형 시겔라 파지 Shf125875 리가제 (서열식별번호: 8)는 5개의 2'-OMe 핵염기 및 1개의 데옥시핵염기를 함유하는 2' OMe 치환된 5' 절편을 비변형된 DNA만을 함유하는 절편으로 라이게이션할 수 있다. 또한, 야생형 T4 DNA 리가제 (서열식별번호: 3 및 4)는 실시예 2에 나타나고 본원에서 재확인된 바와 같이 이 반응을 수행하는데 불량하지만, 위치 368 및 371에서의 수많은 돌연변이는 5개의 2' OMe 핵염기 및 1개의 데옥시핵염기를 함유하는 2'-OMe 치환된 5' 절편을 리가제 (서열식별번호: 10-19) 상에 비변형된 DNA만을 함유하는 절편으로 라이게이션하는 능력을 부여한다.
실시예 4: 돌연변이체 DNA 리가제를 사용한 2' MOE 리보스 변형된 및 5-메틸 피리미딘 변형된 올리고뉴클레오티드 절편 어셈블리 및 라이게이션
4.1 재료
하기 표 5에 기재된 바와 같은 변형된 올리고뉴클레오티드 절편을 표준 고체상-기반 방법에 의해 합성하였다.
<표 5>
(p) = 포스페이트, mX = MOE 염기, dX = DNA 염기
모두 5-메틸 피리미딘
야생형 엔테로박테리아 파지 CC31 리가제, 야생형 T4 리가제 및 야생형 시겔라 파지 Shf125875 리가제에 기초한 돌연변이체 DNA 리가제 (서열식별번호: 20-28)를 표준 클로닝, 발현 및 추출 방법을 사용하여 N-말단에서 셀룰로스 결합 도메인 (CBD)에 각각 융합시켰다. CBD에 융합된 리가제를 1.4에 기재된 바와 같이 펄로자 비드에 결합시켜, 비드 슬러리를 생성하였다. 리가제를 펄로자 비드로부터 방출하기 위해, 2 ㎕의 TEV 프로테아제를 슬러리에 첨가하고, 밤새 4℃에서 인큐베이션하였다. 이제 셀룰로스 결합 도메인이 결여된 절단된 단백질을 10분 동안 4000 rpm에서 원심분리에 의해 수집하였다.
4.2 방법
반응을 다음과 같이 설정하였다:
중심 절편 20 μM 최종
MOE 3' 절편 20 μM 최종
MOE 5' 절편 20 μM 최종
주형 20 μM 최종
NEB T4 DNA 리가제 완충제 5 ㎕
돌연변이체 DNA 리가제 15 ㎕
H2O 최종 반응 부피를 50 ㎕로 만듦
DNA 리가제를 첨가하기 전에 모든 구성성분을 혼합하고 볼텍싱하였다. 반응물을 1시간 동안 35℃에서 인큐베이션하였다. 1시간 후, PCR 블록에서 95℃에서 5분 동안 가열에 의해 반응을 정지시켰다.
실시예 1 (섹션 1.2)에서 사용된 HPLC 프로토콜에 따라 생성물 동일성을 확인하기 위해 샘플을 HPLC 및 LCMS 둘 모두에 의해 분석하였다. 상업용 NEB T4 DNA 리가제의 대조군 및 음성 대조군 (임의의 리가제 대신 H2O)을 포함시켰다.
4.3 결과 및 결론
도 10은 대조군 반응 및 서열식별번호: 23 (클론 A4 - 돌연변이체 엔테로박테리아 파지 CC31 리가제)에 의해 촉매된 반응에 대한 HPLC 트레이스를 나타낸다. 이 HPLC 방법을 사용하여 생성물 및 주형이 공동-용리되므로, 생성물은 생성물 + 주형 피크의 피크 면적의 증가로서 보인다. 돌연변이체 리가제 트레이스 (b)에서, 생성물 + 주형 피크가 증가할 뿐만 아니라, 2개의 새로운 피크가 10.3 및 11.2분에서 나타난다. 이들 피크는 MOE 5' 절편 또는 MOE 3' 절편과 중심 절편의 라이게이션에 상응한다. 또한, 입력 절편 피크는 생성물 및 중간체 피크 증가와 함께 대조군보다 실질적으로 더 작다. NEB 상업용 T4 리가제 트레이스 (a)는 입력 올리고뉴클레오티드 절편의 수반된 저하와 함께 주형 + 생성물, 소량의 중간체 라이게이션 생성물에 대한 피크 면적의 약간의 증가를 나타내었다. 그러나, 돌연변이체 리가제 (서열식별번호: 23)는 실질적으로 더 큰 생성물 + 주형 피크 면적 및 입력 올리고뉴클레오티드 절편에 대한 피크 면적의 수반된 감소를 나타내었다. 그러므로, 돌연변이체 리가제 (서열식별번호: 23)는 상업용 T4 DNA 리가제보다 2' MOE 치환된 절편에 대해 훨씬 더 효과적인 리가제이다. 다른 돌연변이체 리가제 (서열식별번호: 20, 21, 24-28)에 대해 유사한 개선이 나타났다.
실시예 5: 라이게이션 부위에서 상이한 뉴클레오티드 쌍형성의 효과
5.1 재료
N-말단에서 셀룰로스 결합 도메인 (CBD)에 융합된 돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 추출된 CBD-돌연변이체 엔테로박테리아 파지 CC31 리가제 융합 단백질을 25 ml의 펄로자 100 (펄로자) 셀룰로스 비드에 첨가하고, 20℃에서 1시간 동안 진탕하였다. 그 후, 펄로자 비드를 수집하고, 250 ml 완충제 (50 mM 트리스 pH 8.0, 200 mM NaCl, 0.1% 트윈 20, 10% 글리세롤), 이어서 250 ml PBS로 세척하고, 최종적으로 10 ml PBS (10 mM PO4 3-, 137 mM NaCl, 2.7 mM KCl pH 7.4)에 재현탁시켰다. 단백질 발현을 분석하기 위해, 15 ㎕의 펄로자 비드 슬러리를 5 ㎕의 SDS 로딩 완충제와 혼합하고, 표준 프로토콜에 따라 SDS PAGE 구배 겔 (4 - 20%) 상에서 실행시키기 전에 80℃에서 10분 동안 인큐베이션하였다. 비드로부터 리가제의 방출을 위해, 70 ㎕의 TEV 프로테아제를 첨가하고, 밤새 4℃에서 진탕하면서 인큐베이션하였다. 소화된 비드를 80 ml의 PBS로 세척함으로써 리가제를 수집하였다. 그 후, 아미콘(Amicon) 30 Kd MCO 필터를 사용하여 리가제를 1.2 ml로 농축시켰다.
하기 비오티닐화 DNA 주형 올리고뉴클레오티드 (표 6) 및 DNA 절편 올리고뉴클레오티드 (표 7)를 표준 고체상 방법에 의해 합성하였다. 볼드체 표시된 뉴클레오티드는 라이게이션 부위에 존재하는 것임을 주목한다 (즉, 라이게이션 반응에서 함께 연결된 뉴클레오티드 - 표 7; 및 라이게이션 반응을 통해 연결된 것과 상보적인 뉴클레오티드 - 표 6).
<표 6>
<표 7>
(p) = 포스페이트
N.B. 이전 실시예와 달리, 본 실시예에서 라이게이션 반응은 2개의 절편: 5'-절편 및 3'-절편을 함께 연결시키는 것을 수반하며, 즉 중심 절편이 없다는 점을 주목한다.
5.2 방법
반응을 다음과 같이 설정하였다:
<표 8>
각각의 50 ㎕ 반응에 대해:
3' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕
5' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕
주형 (1 mM 스톡, 20 μM 최종) 1 ㎕
NEB DNA 리가제 완충제 (T4 리가제를 위한) 5 ㎕
돌연변이체 CC31 DNA 리가제 (0.45 mM 스톡, 90 μM 최종) 10 ㎕
H2O 50 ㎕까지
각각의 반응 믹스를 30분 및 1시간 둘 모두 동안 35℃에서 인큐베이션하였다. 각각의 반응을 95℃에서 5분 동안 가열함으로써 종결시켰다. HPLC 분석을 수행하였다.
5.3 결과 및 결론
모든 반응은 HPLC 분석에서 1시간 인큐베이션 후 생성물 피크를 생성하였다. 따라서, 라이게이션 방법은 접합부에서 뉴클레오티드의 모든 조합이 연결되도록 작용한다. 생성물 수율을 개선시키기 위한 최적화가 가능하지만, 결과가 결정적이어서 필요하지는 않았으며, 반응이 접합부에서 뉴클레오티드의 모든 조합이 연결되도록 작용한다는 것이 명확하였다.
실시예 6: 라이게이션 부위에서 상이한 변형의 효과
6.1 재료
돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하고, 클로렐라 바이러스 DNA 리가제 (서열식별번호: 29, SplintR 리가제, NEB로서 시판됨)를 구입하였다.
하기 비오티닐화 주형 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 9)를 표준 고체상 방법에 의해 합성하였다.
<표 9>
OMe는 리보스 고리 상의 2' 메톡시 치환을 나타낸다.
F는 리보스 고리 상의 2' 플루오로 치환을 나타낸다.
모든 나머지 당 잔기는 데옥시리보스 잔기이다.
Me는 5-메틸 시토신을 나타낸다.
6.2 방법
반응을 다음과 같이 설정하였다:
<표 10>
각각의 50 ㎕ 반응에 대해:
3' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕
중심 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕
5' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕
주형 (1 mM 스톡, 20 μM 최종) 1 ㎕
H2O 50 ㎕까지
돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)에 대해
DNA 리가제 완충제 (50 mM 트리스-HCl, 1 mM DTT) 5 ㎕
돌연변이체 CC31 DNA 리가제 (0.45 mM) 10 ㎕
MnCl2 (50 mM) 5 ㎕
ATP (10 mM) 10 ㎕
반면, 클로렐라 바이러스 DNA 리가제 (서열식별번호: 29, SplintR 리가제, NEB로서 시판됨)에 대해
NEB DNA 리가제 완충제 (클로렐라를 위해) 5 ㎕
클로렐라 바이러스 DNA 리가제 2 ㎕
각각의 반응 믹스를 20℃에서 1시간 동안 인큐베이션하였다. 각각의 반응을 95℃에서 10분 동안 가열함으로써 종결시켰다. HPLC 분석을 실시예 1의 방법을 사용하여 수행하였다.
6.3 결과 및 결론
모든 반응은 HPLC 분석에서 생성물 피크를 생성하였다. 따라서, 라이게이션 방법은 접합부에서 시험된 변형의 모든 조합이 연결되도록 작용한다. 생성물 수율을 개선시키기 위한 최적화가 가능하지만, 결과가 결정적이어서 필요하지는 않았으며, 반응이 접합부에서 시험된 변형의 모든 조합이 연결되도록 작용한다는 것이 명확하였다.
실시예 7: 더 큰 올리고뉴클레오티드를 구축하기 위해 상이한 수의 절편을 사용하는 능력
7.1 재료
돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하였다.
하기 비오티닐화 주형 DNA 올리고뉴클레오티드 및 DNA 절편 올리고뉴클레오티드 (표 11)를 표준 고체상 방법에 의해 합성하였다.
<표 11>
(p) = 포스페이트,
7.2 방법
반응을 다음과 같이 설정하였다:
<표 12>
반응을 100 ㎕의 총 부피로 포스페이트 완충 염수, pH = 7.04에서 실행하고 다음과 같이 설정하였다:
주형 (20 μM 최종)
각각의 절편 (20 μM 최종)
MgCl2 (10 mM 최종)
ATP (100 μM 최종)
돌연변이체 CC31 DNA 리가제 (25 μM 최종)
각각의 반응물을 28℃에서 밤새 인큐베이션한 후, 94℃에서 1분 동안 가열함으로써 종결시켰다. 생성물을 HPLC 질량 분광법에 의해 분석하였다.
7.3 결과 및 결론
4개의 절편을 사용한 반응은 27개의 염기 쌍 길이의 완전히 라이게이션된 생성물을 생성하였다. 5개의 절편을 사용한 반응은 33개의 염기 쌍 길이의 생성물을 생성하였다. 두 경우 모두에서, 생성물의 관찰된 질량은 목적 서열에 대해 예상된 것과 일치하였다. 결론적으로, 적절한 상보적 주형 서열에 의해 정의된 바와 같이 목적 길이 및 서열의 올리고뉴클레오티드를 생성하기 위해 다수의 절편을 어셈블리하는 것이 명확하게 가능하다.
실시예 8: 갭머를 형성하기 위한 5-10-5 절편의 어셈블리 및 라이게이션, 여기서 5' 및 3' 절편은 (i) 2'-OMe 리보스 당 변형, (ii) 포스포로티오에이트 연결 또는 (iii) 2'-OMe 리보스 당 변형 및 포스포로티오에이트 연결을 포함하며, 중심 절편은 비변형된 DNA이다.
8.1 재료
돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하였으며, 하기 비오티닐화 주형 DNA 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 13)를 표준 고체상 방법에 의해 합성하였다.
<표 13>
OMe는 리보스 고리 상의 2' 메톡시 치환을 나타낸다.
모든 나머지 당 잔기는 데옥시리보스 잔기이다.
*포스포로티오에이트
8.2 방법
반응을 다음과 같이 설정하였다:
<표 14>
각각의 반응 1, 2 및 3을 다음 구성성분을 갖는 포스페이트 완충 염수 중 100 ㎕ 최종 부피로 설정하였다:
3' 절편 20 μM 최종
중심 절편 20 μM 최종
5' 절편 20 μM 최종
주형 20 μM 최종
MgCl2 10 mM 최종
ATP 50 μM 최종
효소 25 μM 최종
각각의 반응 믹스를 20℃에서 밤새 인큐베이션하였다. 각각의 반응을 95℃에서 10분 동안 가열함으로써 종결시켰다. HPLC 질량 분광법 분석을 수행하였다.
8.3 결과 및 결론
3개의 단편 모두의 성공적인 라이게이션에 상응하는 생성물 올리고뉴클레오티드를 3개의 반응 모두에서 생성하였다.
따라서, 돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)는 3개의 절편을 함께 라이게이션하여 '갭머'를 형성할 수 있으며, 여기서 5' 및 3' '윙'은 포스포로티오에이트 백본을 갖는 반면, 중심 영역은 포스포디에스테르 백본을 갖고, 갭머의 모든 당 잔기는 데옥시리보스 잔기이다. 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)는 또한 3개의 절편을 함께 라이게이션하여 '갭머'를 형성할 수 있으며, 여기서 5' 및 3' '윙'은 2'-메톡시리보스 (2'-OMe) 잔기를 갖는 반면, 중심 영역은 데옥시리보스 잔기를 갖고, 모든 연결은 포스포디에스테르 연결이다. 최종적으로, 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)는 3개의 절편을 함께 라이게이션하여 '갭머'를 형성할 수 있으며, 여기서 5' 및 3' '윙'은 조합된 변형 (포스포로티오에이트 백본 및 2'-메톡시리보스 잔기)을 갖는 반면, 중심 영역은 데옥시리보스 잔기 및 포스포디에스테르 연결을 갖는다.
실시예 9: 잠금 핵산 (LNA)을 포함하는 절편의 어셈블리 및 라이게이션
9.1 재료
돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하였다. 돌연변이체 스타필로코쿠스 아우레우스(Staphylococcus aureus) NAD 의존적 리가제 (NAD-14)를 13.1에 기재된 바와 같이 생성하였다.
하기 비오티닐화 주형 DNA 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 15)를 표준 고체상 방법에 의해 합성하였다.
<표 15>
(p) = 포스페이트
LNA = 잠금 핵산
9.2 방법
반응을 다음과 같이 설정하였다:
반응 부피 100 ㎕
주형 20 μM 최종
효소 25 μM 최종
모든 올리고뉴클레오티드 절편 20 μM 최종
반응을 표 16에 기재된 바와 같이 다양한 효소 (돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23) 또는 NAD-14), 2가 양이온 (Mg2+ 또는 Mn2+) 및 올리고뉴클레오티드 절편의 조합으로 설정하였다.
<표 16>
각각의 반응 믹스를 28℃에서 밤새 인큐베이션하였다. 각각의 반응을 94℃에서 1분 동안 가열함으로써 종결시켰다. HPLC 질량 분광법 분석을 수행하였다.
9.3 결과 및 결론
생성물 올리고뉴클레오티드가 대조군 반응에서 생성되었으며 (오직 비변형된 올리고뉴클레오티드), 여기서 단일 잠금 핵산은 접합부의 3' 또는 5' 측 상에 있는지에 관계없이 라이게이션 접합부에서 하나의 절편에 포함되었다. 잠금 핵산이 양쪽 측 (올리고 1 + 올리고 2)에 포함된 경우, 생성물이 검출되지 않았다. 데이터는 Mg2+ 또는 Mn2+ 사용 여부에 관계없이 두 효소 모두에 대해 유사하였다.
접합부의 3' 및 5' 측 둘 모두에서 잠금 핵산을 갖는 절편을 라이게이션할 수 있는 효소를 확인하기 위해 효소 돌연변이 및/또는 선택 스크린을 수행할 수 있었다.
실시예 10: Mg2+ 또는 Mn2+의 존재하에 엔테로박테리아 파지 CC31 리가제의 변이체를 사용한, 갭머를 형성하기 위한 3개의 절편 (7-6-7)의 어셈블리 및 라이게이션, 여기서 5' 및 3' 절편은 2' MOE 리보스 당 변형을 포함하며, 모든 연결은 포스포로티오에이트 연결이다.
10.1 포스포로티오에이트 결합 형성
돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)가 포스포로티오에이트 백본, 2' MOE 리보스 당 변형 및 5-메틸화된 피리미딘 염기를 갖는 변형된 올리고뉴클레오티드 절편을 라이게이션할 수 있는지를 결정하기 위해, 반응을 표 15에 나타낸 올리고뉴클레오티드 절편을 사용하여 수행하였다. 반응을 Mg2+ 및 Mn2+ 이온의 존재하에 수행하였다.
10.2 재료
올리고뉴클레오티드를 하기 나타낸 바와 같이 표준 방법을 사용하여 화학적으로 합성하였다:
<표 17>
(p)* = 5'-포스포로티오에이트, * = 포스포로티오에이트 연결, mX = MOE 염기, dX = DNA 염기
모든 절편 및 생성물은 5-메틸 피리미딘을 갖는다 (주형 제외).
mT 및 m (Me)U는 등가물로 고려된다.
N.B. 표 17에 나타낸 비오티닐화 주형으로 혼성화될 때 표 17의 절편의 라이게이션에 의해 생성된 표적 2'MOE PS 분자는 다음과 같다:
5'-mG*mG*mC*mC*mA*dA*dA*dC*dC*dT*dC*dG*dG*dC*dT*mU*mA*mC*mC*mU-3'
(서열식별번호: 1)
정제된 돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 실시예 5.1에 기재된 바와 같이 제조하였다. HPLC 분석을 수행하였다.
10.3 엔테로박테리아 파지 CC31 리가제 변이체 (서열식별번호: 23)를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법
반응물을 다음과 같이 제조하였다:
MgCl2 반응물
10 x T4 DNA 리가제 완충제 (NEB)* 5 ㎕
주형 20 μM 최종 농도
5' 절편 2' MOE PS 20 μM 최종 농도
중심 절편 PS 20 μM 최종 농도
3' 절편 2' MOE PS 20 μM 최종 농도
리가제 (24.3 μM) 10 ㎕
물 50 ㎕까지로 만듦
*1 x 완충제는 50 mM 트리스-HCl, 10 mM MgCl2, 1 mM ATP, 10 mM DTT, pH 7.5를 함유한다.
MnCl2 반응물
10 x 리가제 완충제* 5 ㎕
ATP (10 mM) 5 ㎕
MnCl2 (50 mM) 5 ㎕
주형 20 μM 최종 농도
5' 절편 2' MOE PS 20 μM 최종 농도
중심 절편 PS 20 μM 최종 농도
3' 절편 2' MOE PS 20 μM 최종 농도
리가제 (24.3 μM) 10 ㎕
물 50 ㎕까지로 만듦
*1 x 완충제는 50 mM 트리스-HCl, 10 mM DTT, pH 7.5를 함유한다.
최종 반응물은 20 μM의 각각의 절편 및 주형, 5 mM MgCl2 또는 5 mM MnCl2, 1mM ATP, 50 mM 트리스-HCl, 10 mM DTT, pH 7.5 및 4.9 μM 리가제를 함유하였다. 효소를 함유하지 않은 추가 반응물을 제조하고, 음성 대조군으로서 사용하였다. 반응물을 16시간 동안 25℃에서 인큐베이션한 후, 5분 동안 95℃로 가열함으로써 켄칭하였다. 침전된 단백질을 원심분리에 의해 제거하고, 샘플을 HPLC에 의해 분석하였다.
10.4 결과 및 결론
생성물, 주형 및 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었으며, 라이게이션이 관찰되지 않았다. 5 mM MgCl2의 존재하에 수행된 리가제 반응은 5' 절편 및 중심 절편의 라이게이션으로부터 형성된 중간체 생성물의 형성을 야기하였으나, 전장 생성물은 검출되지 않았다. MnCl2의 존재하에 수행된 리가제 반응은 전장 생성물 및 중간체 (5' 절편 + 중심 절편 중간체) 둘 모두를 생성하였다. 리가제 반응 둘 모두는 라이게이션되지 않은 올리고뉴클레오티드 절편이 남아있음을 나타내었다. 그러나, 생성물 수율을 극대화하기 위해 프로토콜의 최적화가 가능하다.
실시예 11: 천연 Mg2+의 존재하에 야생형 클로렐라 바이러스 DNA 리가제를 사용한, 갭머를 형성하기 위한 3개의 절편 (7-6-7)의 어셈블리 및 라이게이션, 여기서 5' 및 3' 절편은 2' MOE 리보스 당 변형을 포함하며, 모든 연결은 포스포로티오에이트 연결이다.
11.1 재료
클로렐라 바이러스 DNA 리가제 (서열식별번호: 29, SplintR 리가제, NEB로 시판됨)가 포스포로티오에이트 백본을 갖는 변형된 올리고뉴클레오티드 절편을 라이게이션할 수 있는지를 결정하기 위해, 실시예 10.2 표 17에 나타낸 올리고뉴클레오티드 절편을 사용하여 2' MOE 리보스 당 변형 및 5-메틸화된 피리미딘 염기 반응을 수행하였다. 효소 활성에 대한 온도의 효과를 조사하기 위해 반응을 25℃, 30℃ 및 37℃에서 수행하였다.
11.2 상업용 클로렐라 바이러스 DNA 리가제 (서열식별번호: 29)를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법
각각의 올리고뉴클레오티드 절편 및 주형을 하기 상세히 설명된 바와 같이 뉴클레아제 무함유 물에 용해시켰다:
비오티닐화 주형 249.6 ng/㎕
5' 절편 2' MOE PS 182.0 ng/㎕
중심 절편 PS 534.0 ng/㎕
3' 절편 2' MOE PS 531.0 ng/㎕
반응물을 다음과 같이 제조하였다:
10 x 완충제 (NEB)* 6 ㎕
주형 3.8 ㎕
5' 절편 2' MOE PS 18.1 ㎕
중심 절편 PS 4.8 ㎕
3' 절편 2' MOE PS 6.3 ㎕
물 15 ㎕
SplintR 리가제 (25 U/㎕) 6 ㎕
*1 x 완충제는 50 mM 트리스-HCl, 10 mM MgCl2, 1 mM ATP, 10 mM DTT, pH 7.5를 함유한다.
최종 반응물은 20 μM의 각각의 절편 및 주형, 50 mM 트리스-HCl, 10 mM MgCl2, 1 mM ATP, 10 mM DTT, pH 7.5 및 2.5 U/㎕ 리가제를 함유하였다. 반응물을 25℃, 30℃ 및 37℃에서 인큐베이션하였다. 효소를 함유하지 않는 추가 반응물을 제조하고, 음성 대조군으로서 사용하였다. 16시간 인큐베이션 후, 반응물을 10분 동안 95℃로 가열함으로써 켄칭하였다. 침전된 단백질을 원심분리에 의해 제거하고, 샘플을 HPLC에 의해 분석하였다.
11.3 결과 및 결론
생성물, 주형 및 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었으며, 라이게이션이 관찰되지 않았다. 리가제 반응물의 HPLC 분석은 라이게이션되지 않은 올리고뉴클레오티드 절편이 남아있지만, 클로렐라 바이러스 DNA 리가제는 절편을 성공적으로 라이게이션할 수 있음을 나타내었다. 리가제의 활성은 온도 상승에 따라 증가하였다. 25℃에서 클로렐라 바이러스 DNA 리가제는 5' 절편 및 중심 절편을 성공적으로 라이게이션할 수 있었지만, 전장 생성물은 관찰되지 않았다. 30℃ 및 37℃에서, 5' 절편 및 중심 절편으로부터 형성된 중간체 이외에 전장 생성물이 검출되었다.
실시예 12: 갭머를 형성하기 위한 3개의 절편 (7-6-7)의 라이게이션을 향한 활성에 대한 15개의 ATP 및 NAD 리가제의 패널의 스크리닝, 여기서 5' 및 3' 절편은 2' MOE 리보스 당 변형을 포함하고, 모든 연결은 포스포로티오에이트 연결이다.
12.1 재료
표 18 및 19에 기재된 야생형 ATP 및 NAD 의존적 리가제를 각각 N-말단에서 CBD에 융합시켰다. 표준 클로닝, 발현 및 추출 방법을 사용하여 유전자를 합성하고, pET28a로 클로닝하고, 이. 콜라이 BL21(DE3)에서 발현시켰다.
<표 18>
ATP 의존적 리가제
<표 19>
NAD 의존적 리가제
CBD-리가제 융합체를 하기 변형을 사용하여 1.4에 기재된 바와 같이 펄로자 비드에 결합시켰다. CBD-리가제 융합 단백질을 BL21(DE3) 세포 (NEB)의 단일 콜로니로부터 성장시키고, 50 mL 발현 배양액에서 성장시켰다. 세포를 원심분리에 의해 수확하고, 5-10 mL 트리스-HCl (50 mM, pH 7.5)에 재현탁시키고, 초음파처리에 의해 용해하였다. 용해물을 원심분리에 의해 제거하고, 1 ml의 펄로자 100 (펄로자) 비드 (50 % 슬러리, 50 mM 트리스-HCl pH 7.5로 사전-평형화됨)를 상등액에 첨가하고, 이를 20℃에서 1시간 동안 진탕시켰다. 그 후, 펄로자 셀룰로스 비드를 수집하고, 30 ml 완충제 (50 mM 트리스 pH 8.0, 200 mM NaCl, 0.1% 트윈 20, 10% 글리세롤), 이어서 10 ml 트리스-HCl (50 mM, pH 7.5)로 세척하고, 최종적으로 1 mL 트리스-HCl (50 mM, pH 7.5)에 재현탁시켰다. 단백질 발현을 분석하기 위해, 20 ㎕의 펄로자 비드 슬러리를 20 ㎕의 SDS 로딩 완충제와 혼합하고, 표준 프로토콜에 따라 SDS PAGE 구배 겔 (4 - 20%) 상에서 실행시키기 전에 95℃에서 5분 동안 인큐베이션하였다.
12.2 2' MOE 및 포스포로티오에이트 변형된 올리고뉴클레오티드 어셈블리 및 라이게이션 방법
실시예 10.2 표 17에 나타낸 포스포로티오에이트 백본, 2' MOE 리보스 당 변형 및 5-메틸화된 피리미딘 염기를 갖는 변형된 올리고뉴클레오티드 절편을 사용하였다. 각각의 올리고뉴클레오티드 절편 및 주형을 하기 상세히 설명된 바와 같이 뉴클레아제 무함유 물에 용해시켰다:
비오티닐화 주형 1500 ng/㎕
5' 절편 2' MOE PS 1008 ng/㎕
중심 절편 PS 725 ng/㎕
3' 절편 2' MOE PS 1112 ng/㎕
ATP 검정 믹스를 다음과 같이 제조하였다:
주형 85.6 ㎕
5' 절편 2' MOE PS 43.5 ㎕
중심 절편 PS 46.8 ㎕
3' 절편 2' MOE PS 40.1 ㎕
DTT 1M 8 ㎕
MgCl2 1M 4 ㎕
ATP (50 mM) 16 ㎕
트리스 0.5 M 80 ㎕
물 476 ㎕
NAD 검정 믹스를 다음과 같이 제조하였다:
주형 85.6 ㎕
5' 절편 2' MOE PS 43.5 ㎕
중심 절편 PS 46.8 ㎕
3' 절편 2' MOE PS 40.1 ㎕
DTT 1M 8 ㎕
MgCl2 1M 4 ㎕
NAD (50 mM) 1.6 ㎕
트리스 0.5 M 80 ㎕
물 490.4 ㎕
각각의 고정화된 단백질 (40 ㎕, 50% 펄로자 비드 슬러리)을 PCR 튜브에 피펫팅하였다. 비드를 원심분리에 의해 펠렛화하고, 상등액을 피펫팅에 의해 제거하였다. 검정 믹스 (40 ㎕)를 각각의 반응물에 첨가하였다 (최종 반응물은 20 μM의 각각의 절편 및 주형, 50 mM 트리스-HCl, 10 mM MgCl2, 1 mM ATP 또는 100 μM NAD, 10 mM DTT, pH 7.5, 및 펄로자 비드 상의 40 ㎕의 리가제를 함유함). 단백질을 함유하지 않는 반응물을 음성 대조군으로 사용하였다. 반응물을 18시간 동안 30℃에서 인큐베이션한 후, 10분 동안 95℃로 가열함으로써 켄칭하였다. 침전된 단백질을 원심분리에 의해 제거하고, 샘플을 HPLC에 의해 분석하였다.
12.3 결과 및 결론
생성물, 주형 및 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었으며, 라이게이션이 관찰되지 않았다. 리가제 반응물의 HPLC 분석은 모든 단백질이 5' 절편 및 중심 절편의 성공적인 라이게이션을 촉매하여 중간체 생성물을 형성시켰지만, 오직 일부 리가제만이 모든 3개의 절편의 라이게이션을 촉매하여 표 20에 기재된 바와 같은 전장 생성물을 수득하였음을 나타내었다. 스타필로코쿠스 아우레우스 (SaNAD, 서열식별번호: 61)로부터의 NAD 의존적 리가제는 가장 완전한 길이의 생성물을 수득하였다. 생성물 수율을 개선시키기 위한 최적화가 가능하고, 통상의 기술자의 기술 범위 내에 있다.
<표 20>
* 반응에서 소비되지 않고 내부 표준으로서 작용하는 주형에 대한 HPLC 피크 면적으로부터 전환율을 계산하였다. 전환율 = 생성물 면적/ (주형 + 생성물 면적)*100
실시예 13: 반연속적인 라이게이션 반응
13.1 재료
N-말단에서 CBD에 융합된 돌연변이체 스타필로코쿠스 아우레우스 리가제 (NAD-14)를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 그 후, CBD-NAD-14 돌연변이체 리가제를 펄로자 비드에 결합시켰다: 50 ml의 단백질 용해물을 7.5 ml 펄로자 비드에 첨가하고, 실온에서 1시간 동안 인큐베이션한 후, 비드를 유리 컬럼 (바이오라드(BioRad) 이코노-컬럼(Econo-Column) 10 cm 길이, 2.5 cm 직경 #7372512)에 수집하였다. 비드를 200 ml 완충제 Y (50 mM 트리스8, 500 mM NaCl, 0.1% 트윈 20, 10% 글리세롤)로 세척한 후, 200 ml 완충제 Z (50 mM 트리스8, 200 mM NaCl, 0.1% 트윈 20, 10% 글리세롤) 및 200 ml PBS로 세척하였다. 비드 상의 돌연변이체 NAD-14 리가제의 추정된 농도는 비드 ml 당 69 μM의 리가제였다.
하기 주형 DNA 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 21)를 표준 고체상 방법에 의해 합성하였다.
<표 21>
(p) = 포스페이트, mX = MOE 염기, dX = DNA 염기
모두 5-메틸 피리미딘
모든 연결은 포스포디에스테르 연결이다.
"허브"라고 지칭되는 지지체 물질 및 3개의 주형 서열을 포함하는 "트리-주형 허브" (대략 24 kDa)를 생성하였다 (도 11). 주형의 각각의 카피를 자체 개별 부착점에서 "허브"에 공유결합으로 부착하였다. "트리-주형 허브" 분자는 표적 (생성물) 올리고뉴클레오티드 (주형 서열과 100% 상보적)보다 더 높은 분자량을 가지며, 이에 의해 불순물 및 생성물이 반응 혼합물로부터 분리될 때 이를 유지되게 할 수 있다. 이 특정 경우, 주형 서열은 서열식별번호: 30이고, 3개의 카피가 허브에 부착되었다는 것에 주목해야 한다. 다음 실시예에서, 상이한 주형 서열을 갖는 트리-주형 허브를 또한 생성하였다. 따라서, 주형 서열이 실시예마다 다르기 때문에, 트리-주형 허브도 마찬가지이다.
하기 반응 믹스 (총 부피 5 ml)를 제조하였다:
250 ㎕ 1 M KH2PO4, pH 7.5 (50 mM 최종)
108 ㎕ 0.07011 M 중심 절편 (1.5 mM 최종)
137 ㎕ 0.05481 M 3'-절편 (1.5 mM 최종)
168 ㎕ 0.04461 M 5'-절편 (1.5 mM 최종)
750 ㎕ 0.00387M 허브 (주형) (0.55 mM 최종)
350 ㎕ 50 mM NAD+ (3.5 mM 최종)
1000 ㎕ 50 mM MgCl2 (10 mM 최종)
2237 ㎕ 뉴클레아제 무함유 H2O
13.2 방법
반연속적인 시스템을 도 12에 나타낸 바와 같이 설정하였다.
4 ml의 펄로자 비드 및 고정화된 돌연변이체 NAD-14 리가제를 파마시아(Pharmacia) XK16 컬럼 (B)에 충전하였다. 컬럼 물 구획을 사용하여 컬럼의 온도를 30℃에서 유지시키기 위해 수조 및 연동 펌프 (C)를 사용하였다. pH 7.5에서 50 mM KH2PO4를 함유하는 120 ml (30x 컬럼 부피)의 완충제를 120분 동안 1 ml/분에서 실행시킴으로써 비드를 평형화시켰다. 파마시아 XK16 컬럼을 통한 유동을 생성하기 위해 AKTA 익스플로러(explorer) 펌프 A1 (A)을 사용하였다.
컬럼 평형화 후, 5 ml 반응 믹스 (볼텍싱에 의해 잘 혼합됨)를 컬럼 상에 로딩하고, 저장소 튜브 (D)에 수집하고, AKTA 익스플로러 A1 펌프를 사용하여 컬럼을 통해 재순환시켰다. 반응 믹스를 16시간 동안 연속적인 순환 방식으로 1 ml/분의 유속으로 시스템을 통해 재순환시켰다. HPLC 분석을 위해 30분, 60분, 90분, 4시간, 5시간, 6시간, 7시간, 14시간 및 16시간 후 샘플을 수집하였다.
13.3 결과 및 결론
<표 22>
각각의 절편, 중간체 및 생성물의 백분율은 트리-주형 허브 피크 면적에 대한 피크 면적 분율로서 표시한다.
결론적으로, 반연속적인 유동 반응이 작동하였고, 16시간 후에 반응이 거의 완료되었다.
실시예 14: 여과에 의한 상이한 크기의 올리고뉴클레오티드의 분리: a) 20-머 올리고뉴클레오티드 (서열식별번호: 1) 및 3개의 비상보적 20-머 올리고뉴클레오티드 (서열식별번호: 30)를 포함하는 허브의 분리; (b) 절편 6-머 및 8-머 올리고뉴클레오티드 (표 1 참조) 및 3개의 상보적 20-머 올리고뉴클레오티드 (서열식별번호: 2)를 포함하는 허브로부터 20-머 올리고뉴클레오티드 (서열식별번호: 1)의 분리
14.1 재료
사용된 모든 올리고뉴클레오티드는 표준 고체상 방법에 의해 합성하였다.
13.1 (도 11)에 기재된 바와 같은 트리-주형 허브를 사용하였다.
표 23 및 24에 나타낸 바와 같이 다양한 분자량 컷오프 및 상이한 제조사의 다양한 필터를 사용하였다.
14.2 방법
14.2.1 중합체 막의 스크리닝을 위한 데드-엔드 여과 설정 및 프로토콜: (프로토콜 1)
자성 교반기 및 핫플레이트 상에 놓인 수조에 위치된 MET 데드-엔드 여과 셀을 포함하는 데드-엔드 여과 기구를 도 13에 나타낸 바와 같이 설정하였다. 셀 내부 압력은 질소 유동으로부터 제공되었다.
시험될 막 (14 ㎠)의 쿠폰을 먼저 적절한 크기로 절단하고, 셀에 위치시켰다. 막을 먼저 HPLC 등급 물 (200 ml)로 컨디셔닝한 후, PBS 완충제 (200 ml)로 컨디셔닝하였다. 그 후, 셀을 감압하고, 나머지 PBS 용액을 제거하고, 올리고뉴클레오티드를 함유하는 용액 (1 g/L 농도의 PBS 중 40 ml의 올리고뉴클레오티드)으로 대체하였다. 셀을 교반기 핫플레이트 상에 위치시키고, 자성 진탕을 사용하여 교반하면서 용액을 목적 온도로 가열하였다. 셀에 압력을 가하였다 (대략 3.0 bar를 목표로 하며; 실제 압력은 각각의 경우에 기록됨). 용액의 교반을 정지시키거나 계속하고, 투과물 용액을 수집하고 (대략 20 ml), HPLC에 의해 분석하였다. 플럭스를 기록하였다. 그 후, 시스템을 감압시켜, 체류물 용액의 샘플링 및 HPLC에 의한 분석을 허용하였다. 그 후, 추가 PBS 완충제 (20 ml)을 여과 셀에 첨가하고, 이전 절차를 3회 반복하였다. 최종적으로 막을 PBS 완충제로 세척하였다.
모든 샘플을 어떠한 희석 없이 HPLC에 의해 분석하였다.
14.2.2 중합체 막의 스크리닝을 위한 크로스-플로우 여과 설정 및 프로토콜: (프로토콜 2)
크로스-플로우 여과 기구를 도 14에 나타낸 바와 같이 설정하였다. 원뿔형 플라스크로 이루어진 공급 용기 (1)는 정제될 올리고뉴클레오티드 용액을 함유하였다. 핫 플레이트 (3)를 사용하여 셀 내의 온도를 유지하면서 용액을 HPLC 펌프 (2)를 사용하여 크로스-플로우 여과 셀 (4)로 펌핑하였다. 기어 펌프 (6)를 사용하여 셀 내의 용액을 재순환시켰다. 압력 게이지 (5)를 통해 실험 동안 압력을 판독할 수 있었다. 투과물 용액을 투과물 수집 용기 (8)로부터 샘플링하면서, 체류물 용액의 샘플을 샘플링 밸브 (7)로부터 취하였다.
시험될 막의 쿠폰을 먼저 적절한 크기로 절단하고, 셀에 위치시켰다. 시스템을 PBS 용액 (100 ml)으로 세척하였다. 용액의 온도를 목적 설정 점으로 조정하였다. PBS 중 올리고뉴클레오티드 생성물을 함유하는 용액 (1 g/L에서 7.5 ml)을 시스템에 공급하였다. 그 후, HPLC 펌프를 사용하여 투과물 용액의 유속 (전형적으로 3 ml/분)과 일치하는 유속으로 PBS 용액을 시스템으로 펌핑하였다. 압력 게이지를 사용하여 압력을 기록하였다. 5개의 투석여과 부피마다 HPLC 분석을 위해 체류물 용액을 샘플링하였다. 투석여과 부피마다 HPLC 분석을 위해 투과물 용액을 샘플링하였다. 20개의 투석여과 부피 후 실험을 정지시켰다.
5 kDa 분자량 컷오프를 갖는 스나이더 막 (로트 번호 120915R2) 및 서열식별번호: 46 및 서열식별번호: 30을 사용하는 실험의 경우, 상기 방법을 다음과 같이 변형하였다. 시험될 막의 쿠폰을 먼저 적절한 크기로 절단하고, 셀에 위치시켰다. 시스템을 인산칼륨 용액 (100 ml, 50 mM, pH 7.5)으로 세척하였다. 용액의 온도를 목적 설정 점으로 조정하였다. 인산칼륨 중 올리고뉴클레오티드 생성물을 함유하는 용액 (대략 1 g/L)을 에틸렌디아민테트라아세트산 (EDTA) (230 ㎕의 500 mM 용액)에 첨가하였다. 그 후, 용액을 시스템에 공급하였다. 그 후, HPLC 펌프를 사용하여 투과물 용액의 유속 (전형적으로 4 ml/분)과 일치하는 유속으로 인산칼륨 완충제를 시스템으로 펌핑하였다. 압력 게이지를 사용하여 압력을 기록하였다. 5개의 투석여과 부피마다 HPLC 분석을 위해 체류물 용액을 샘플링하였다. 투석여과 부피마다 HPLC 분석을 위해 투과물 용액을 샘플링하였다. 15개의 투석여과 부피 후 실험을 정지시켰다.
14.3 결과
<표 23>
MWCO = 분자량 컷오프
60℃에서 10 kDa MWCO NADIR 막을 사용한 실험에서, 생성물 서열 (서열식별번호: 1) 및 비상보적 트리-주형 허브 (서열식별번호: 30 포함) 사이의 명확한 분리가 입증되었다. 도 15는 a) 2개의 투석여과 부피 후 여과 셀에 남아있고 주로 트리-주형 허브를 함유한 체류물 용액의 크로마토그램; 및 b) 2개의 투석여과 부피 후 생성물이 풍부한 투과물 용액의 크로마토그램을 나타낸다.
<표 24>
MWCO = 분자량 컷오프
* 용질의 농도가 너무 낮아 의미있는 분석을 방지함
50℃ 및 3.0 bar 압력에서 5 kDa MWCO 스나이더 막을 사용한 실험에서, 절편 서열 (표 1 참조) 및 상보적 트리-주형 허브 (서열식별번호: 2 포함) 및 생성물 (서열식별번호: 1) 사이의 명확한 분리가 입증되었다. 도 16은 a) 20개의 투석여과 부피 후 주로 트리-주형 허브 및 생성물을 함유한 체류물 용액의 크로마토그램; 및 b) 20개의 투석여과 부피 후 주로 절편 올리고뉴클레오티드를 함유한 투과물의 크로마토그램을 나타낸다.
80℃ 및 3.1 bar 압력에서 5 kDa MWCO 스나이더 막을 사용한 실험에서, 상보적 트리-주형 허브 (서열식별번호: 2 포함) 및 생성물 (서열식별번호: 1) 사이의 명확한 분리가 입증되었다. 도 17은 a) 20개의 투석여과 부피 후 트리-주형 허브만을 함유한 체류물 용액의 크로마토그램; 및 b) 2개의 투석여과 부피 후 생성물만을 함유한 투과물 용액의 크로마토그램을 나타낸다.
14.4 결론
여과를 사용하여 상이한 길이 및 분자량의 올리고뉴클레오티드를 분리할 수 있다. 상기 나타낸 바와 같이, 막의 유형 및 조건, 예컨대 온도는 분리 수준에 영향을 미친다. 상이한 길이/분자량의 올리고뉴클레오티드의 주어진 세트에 대해, 요구되는 분리를 허용하기 위해 적합한 막 및 조건을 선택할 수 있다. 예를 들어, 본 발명자들은 표 1에 요약된 바와 같은 절편 올리고뉴클레오티드 (6 및 8개의 뉴클레오티드 길이의 짧은 다량체)가 생성물 올리고뉴클레오티드 (서열식별번호: 1을 갖는 20-머 올리고뉴클레오티드) 및 트리-주형 허브 (고체 지지체에 부착된 서열식별번호: 2의 3 x 20-머를 포함함)로부터 분리될 수 있고, 생성물 올리고뉴클레오티드 및 트리-주형 허브가 차례로 서로로부터 분리될 수 있음을 입증하였다.
실시예 15: 2'-OMe 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장
야생형 ss리가제 (서열식별번호: 63 내지 83)를 N-말단에서 6xHis로 이루어진 히스티딘 태그에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다.
리가제를 마지막으로 첨가하여 하기 표 25에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 85의 존재에 대해 HPLC에 의해 분석하였다.
<표 25>
<표 26>
*생성물로의 전환율 (%) - 파장 258 nm에서의 프라이머 N 피크 vs. 생성물 N+1(pi) 피크의 면적 %
실시예 16: 2'-OMe 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장
야생형 ss리가제 (서열식별번호: 63 내지 83)를 N-말단에서 6xHis로 이루어진 히스티딘 태그에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다.
리가제를 마지막으로 첨가하여 하기 표 27에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 85의 존재에 대해 HPLC에 의해 분석하였다.
<표 27>
<표 28>
*생성물로의 전환율 (%) - 파장 258 nm에서의 프라이머 N 피크 vs. 생성물 N+1(pi) 피크의 면적 %
실시예 17: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장
야생형 ss리가제 (서열식별번호: 63 내지 83)를 N-말단에서 6xHis로 이루어진 히스티딘 태그에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다.
리가제를 마지막으로 첨가하여 하기 표 29에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.
<표 29>
<표 30>
*생성물로의 전환율 (%) - 파장 258 nm에서의 프라이머 N 피크 vs. 생성물 N+1(pi) 피크의 면적 %
실시예 18: 2'H 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장
야생형 ss리가제 (서열식별번호: 63 내지 83)를 N-말단에서 6xHis로 이루어진 히스티딘 태그에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다.
리가제를 마지막으로 첨가하여 하기 표 31에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.
<표 31>
<표 32>
*생성물로의 전환율 (%) - 파장 258 nm에서의 프라이머 N 피크 vs. 생성물 N+1(pi) 피크의 면적 %
실시예 19: 2'MOE 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장
야생형 ss리가제 (서열식별번호: 63 내지 83)를 N-말단에서 6xHis에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다.
리가제를 마지막으로 첨가하여 하기 표 33에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.
<표 33>
<표 34>
*생성물로의 전환율 (%) - 파장 258 nm에서의 프라이머 N 피크 vs. 생성물 N+1(pi) 피크의 면적 %
실시예 20: 2'OMe 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장의 최적화
야생형 ss리가제 (서열식별번호: 67)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 35에 따라 반응을 설정하였다. 반응물을 25℃에서 18시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 85의 존재에 대해 HPLC에 의해 분석하였다.
<표 35>
<표 36>
*생성물로의 전환율 (%) - 파장 258 nm에서의 프라이머 N 피크 vs. 생성물 N+1(pi) 피크의 면적 %
실시예 21: 2'MOE 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장의 최적화
야생형 ss리가제 (서열식별번호: 67)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 37에 따라 반응을 설정하였다. 반응물을 25℃에서 12시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.
<표 37>
<표 38>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 87 피크의 면적 %
실시예 22: WT를 돌연변이체와 비교하는 반응 - 2'MOE 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장
야생형 또는 돌연변이체 ss리가제 (서열식별번호: 67 및 88 내지 92)를 N-말단에서 6xHis에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 39에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.
<표 39>
<표 40>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 vs. 서열식별번호: 87 피크의 면적 %
실시예 23: WT를 돌연변이체와 비교하는 반응 - 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장
야생형 또는 돌연변이체 ss리가제 (서열식별번호: 67 및 88 내지 92)를 N-말단에서 6xHis에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 41에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.
<표 41>
<표 42>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 vs. 서열식별번호: 87 피크의 면적 %
실시예 24: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장 - 아데노신
돌연변이체 ss리가제 (서열식별번호: 88)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 43에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.
<표 43>
<표 44>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 87 피크의 면적 %
실시예 25: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장 - 5-메틸시티딘
돌연변이체 ss리가제 (서열식별번호: 88)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 45에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 93의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.
<표 45>
<표 46>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 93 피크의 면적 %
실시예 26: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장 - 티미딘
돌연변이체 ss리가제 (서열식별번호: 88)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 47에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 94의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.
<표 47>
<표 48>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 94 피크의 면적 %
실시예 27: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장, 이어서 3' 탈인산화 및 제2 단일 염기 라이게이션 및 제2 탈인산화 - 반응 순서.
돌연변이체 ss리가제 (서열식별번호: 88) 및 야생형 포스파타제 (서열식별번호: 95)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.
리가제를 마지막으로 첨가하여 하기 표 49에 따라 제1 라이게이션 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다. 반응물의 나머지를 이온-교환 크로마토그래피에 의해 정제하고, 동결건조시키고, 제1 탈보호 (즉, 탈인산화)에서 직접 사용하였다.
<표 49>
<표 50>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 87 피크의 면적 %
포스파타제를 마지막으로 첨가하여 하기 표 51에 따라 제1 탈보호/탈인산화 반응을 설정하였다. 반응물을 37℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 96의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다. 반응물의 나머지를 이온-교환 크로마토그래피에 의해 정제하고, 동결건조시키고, 제2 라이게이션 반응에서 직접 사용하였다.
<표 51>
<표 52>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 85 피크 vs. 서열식별번호: 96 피크의 면적 %
리가제를 마지막으로 첨가하여 하기 표 53에 따라 제2 라이게이션 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 96의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다. 반응물의 나머지를 이온-교환 크로마토그래피에 의해 정제하고, 동결건조시키고, 제2 탈보호/탈인산화 반응에서 직접 사용하였다.
<표 53>
<표 54>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 97 피크 vs. 서열식별번호: 96 피크의 면적 %
포스파타제를 마지막으로 첨가하여 하기 표 55에 따라 제2 탈보호/탈인산화 반응을 설정하였다. 반응물을 37℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 98의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.
<표 55>
<표 56>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 97 피크 vs. 서열식별번호: 98 피크의 면적 %
실시예 28: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 절편 또는 생성물 올리고뉴클레오티드 서열의 방출을 위한 엔도뉴클레아제에 의한 특이적 쇄 절단
야생형 엔도뉴클레아제 (서열식별번호: 100)를 N-말단에서 CBD에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) A1에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 비드 셀룰로스에 결합시킨 후 TEV 프로테아제로 절단함으로써 단백질을 정제하고 직접 사용하였다.
엔도뉴클레아제를 마지막으로 첨가하여 하기 표 58에 따라 반응을 설정하였다. 반응물을 65℃에서 16시간 동안 인큐베이션하였다. 그 후, 반응물을 5분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 101 및 ACTIA (표 57에 기재된 특정 변형)의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.
<표 57>
<표 58>
<표 59>
*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 100 피크 vs. 서열식별번호: 101 및 ACTIA 피크의 면적 %
전반적인 결론
본 발명자들은 간단한 물 및 공기 안정한 뉴클레오시드 유도체로부터 출발하여 먼저 RNA 리가제 효소를 사용하여 짧은 올리고뉴클레오티드 절편을 생성하고 둘째로 상보적 주형 상에 짧은 절편을 어셈블리함으로써, 치료적으로 관련된 다양한 화학적 변형을 갖는 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드를 용액에서 효소적으로 합성할 수 있음을 보여주었다. 그 후, 절편은 함께 라이게이션되어, 생성물 올리고뉴클레오티드를 생성할 수 있으며, 이는 대규모 치료용 올리고뉴클레오티드 제조에 적합하고 확장가능한 효율적인 공정으로 불순물 및 그의 상보적 주형 둘 모두로부터 분리될 수 있다.
용액에서 올리고뉴클레오티드를 합성함으로써, 본 발명자들은 고체상 방법에 의해 부과되는 스케일 업 구속을 회피하였다. 상보적 서열의 충실도 및 상보적 서열의 길이 둘 모두를 반영하는 친화성으로 상보적 서열을 특이적으로 인식하고 상보적 서열에 결합하는 DNA의 고유의 특성을 사용함에 있어서, 본 발명자들은 크로마토그래피에 대한 필요성 없이 고순도의 올리고뉴클레오티드를 생성할 수 있었으며, 이는 생산 공정의 효율 및 공정의 확장성 둘 모두를 개선시킨다. 분리 공정 동안 주형을 비변화된 상태로 회수함으로써, 본 발명자들은 합성의 추가 라운드를 위해 주형을 재사용할 수 있어, 형성된 생성물 올리고뉴클레오티드의 모든 등가물에 대해 주형의 하나의 등가물을 제조해야 하는 경제적 결과를 회피하였다.
최종적으로, 야생형 리가제가 정상적인 DNA 및 RNA를 효과적으로 라이게이션하는 것으로 공지되어 있지만, 본 발명자들은 DNA 또는 RNA에 대한 변형이 저하된 라이게이션 효율을 야기하고, DNA 또는 RNA에 대한 다수의 변형이 라이게이션의 효율을 저하시키는 효과에 부가적이며, 이는 일부 경우에 DNA 또는 RNA 리가제가 완전히 효과적이지 못하게 할 수 있음을 보여주었다. 본 발명자들은 DNA 및 RNA 리가제의 적절한 돌연변이 및 진화에 의해, 라이게이션 효율이 회복될 수 있고, 적절하게 변형된 DNA 및 RNA 리가제가 다수의 변형을 함유하는 올리고뉴클레오티드를 합성하기 위한 효과적인 촉매임을 보여주었다.
<서열 목록>
SEQUENCE LISTING
<110> GlaxoSmithKline Intellectual Property Development Limited
<120> Novel processes for the production of oligonucleotides
<130> PB66490
<150> 1721307.5
<151> 2017-12-19
<160> 101
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 1 desired product oligonucleotide sequence ("target")
<400> 1
ggccaaacct cggcttacct 20
<210> 2
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 1-4, 6, 10 and 11 template oligonucleotide sequence
<400> 2
tttaggtaag ccgaggtttg gcc 23
<210> 3
<211> 487
<212> PRT
<213> enterobacteria phage T4
<400> 3
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 4
<211> 488
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild type T4 DNA ligase protein sequence (when fused to CBD)
<400> 4
Gly Ser Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr
1 5 10 15
Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu
20 25 30
Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile
35 40 45
Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu
50 55 60
Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg
65 70 75 80
Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr
85 90 95
Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg
100 105 110
Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro
115 120 125
Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu
130 135 140
Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys
145 150 155 160
Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp
165 170 175
Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp
180 185 190
Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile
195 200 205
His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln
210 215 220
Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro
225 230 235 240
Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr
245 250 255
Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu
260 265 270
Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu
275 280 285
Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg
290 295 300
Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu
305 310 315 320
Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr
325 330 335
Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile
340 345 350
Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys
355 360 365
Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg
370 375 380
Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly
385 390 395 400
Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val
405 410 415
Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr
420 425 430
Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser
435 440 445
Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg
450 455 460
Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly
465 470 475 480
Asp Phe His Glu Val Thr Gly Leu
485
<210> 5
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 2 target sequence
<400> 5
ggccaaaccu cggcuuaccu 20
<210> 6
<211> 482
<212> PRT
<213> Enterobacteria phase CC31
<400> 6
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Thr Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 7
<211> 483
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild-type Enterobacteria phage CC31 DNA ligase protein sequence
(when fused to CBD)
<400> 7
Gly Ser Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr
1 5 10 15
Lys Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu
20 25 30
Lys Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile
35 40 45
Lys Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu
50 55 60
Asp Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr
65 70 75 80
Gly Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser
85 90 95
Asp Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg
100 105 110
Cys Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile
115 120 125
Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile
130 135 140
Glu Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly
145 150 155 160
Ala Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys
165 170 175
Ile Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys
180 185 190
Gln Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly
195 200 205
Gly Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro
210 215 220
Ala Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys
225 230 235 240
Ala Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala
245 250 255
Asn Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met
260 265 270
Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu
275 280 285
Gly Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu
290 295 300
Leu Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile
305 310 315 320
Val His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp
325 330 335
Glu Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu
340 345 350
Asn Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Thr Ile
355 360 365
Asp Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys
370 375 380
Ala Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys
385 390 395 400
Ala Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu
405 410 415
Asp Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val
420 425 430
Leu Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp
435 440 445
Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys
450 455 460
Asp Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val
465 470 475 480
Thr Gly Leu
<210> 8
<211> 497
<212> PRT
<213> Shigella phage Shf125875
<400> 8
Met Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr Lys
1 5 10 15
Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu Glu
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu Glu
50 55 60
Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala Asp
85 90 95
Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu Lys
130 135 140
Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln Phe
165 170 175
Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala Asp
180 185 190
Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn Gly
195 200 205
Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys Lys
210 215 220
Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn Glu
225 230 235 240
Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly Leu
245 250 255
Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu Gly
260 265 270
Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr Ser
275 280 285
Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala Leu
290 295 300
Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn Gln
305 310 315 320
Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr Val
325 330 335
Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr Trp
340 345 350
Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Glu Val Ile Asp
355 360 365
Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro Asn
370 375 380
Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr Thr
385 390 395 400
Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp Gly
405 410 415
Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg Glu
420 425 430
Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile Ala
435 440 445
Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly Thr
450 455 460
Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys Thr
465 470 475 480
Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr Gly
485 490 495
Leu
<210> 9
<211> 498
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild-type Shigella phage Shf125875 DNA ligase protein sequence
(when fused to CBD)
<400> 9
Gly Ser Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr
1 5 10 15
Lys Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu
20 25 30
Glu Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile
35 40 45
Lys Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu
50 55 60
Glu Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg
65 70 75 80
Lys Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala
85 90 95
Asp Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg
100 105 110
Asp Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro
115 120 125
Gly Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu
130 135 140
Lys Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys
145 150 155 160
Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln
165 170 175
Phe Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala
180 185 190
Asp Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn
195 200 205
Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys
210 215 220
Lys Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn
225 230 235 240
Glu Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly
245 250 255
Leu Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu
260 265 270
Gly Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr
275 280 285
Ser Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala
290 295 300
Leu Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn
305 310 315 320
Gln Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr
325 330 335
Val Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr
340 345 350
Trp Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Glu Val Ile
355 360 365
Asp Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro
370 375 380
Asn Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr
385 390 395 400
Thr Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp
405 410 415
Gly Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg
420 425 430
Glu Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile
435 440 445
Ala Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly
450 455 460
Thr Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys
465 470 475 480
Thr Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr
485 490 495
Gly Leu
<210> 10
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 10
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 11
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 11
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 12
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 12
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 13
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 13
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Leu Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 14
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 14
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Lys Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 15
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 15
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Gln Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 16
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 16
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Val Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 17
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 17
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Arg Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 18
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 18
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Ala Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 19
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 19
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Lys Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 20
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 20
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg
355 360 365
Val Ile Val Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 21
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 21
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys
355 360 365
Val Ile Glu Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 22
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (T4 backbone) protein sequence
<400> 22
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys
355 360 365
Val Ile His Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 23
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Enterobacteria phage CC31 backbone - clone A4)
protein sequence
<400> 23
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg Val Ile Val Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 24
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Enterobacteria phage CC31 backbone) protein
sequence
<400> 24
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys Val Ile Lys Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 25
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Enterobacteria phage CC31 backbone) protein
sequence
<400> 25
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly Val Ile Phe Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 26
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Enterobacteria phage CC31 backbone) protein
sequence
<400> 26
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly Val Ile Leu Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 27
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Enterobacteria phage CC31 backbone) protein
sequence
<400> 27
Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp
50 55 60
Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly
65 70 75 80
Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp
85 90 95
Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys
100 105 110
Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro
115 120 125
Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu
130 135 140
Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala
145 150 155 160
Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile
165 170 175
Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln
180 185 190
Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly
195 200 205
Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala
210 215 220
Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala
225 230 235 240
Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn
245 250 255
Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys
260 265 270
Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly
275 280 285
Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu
290 295 300
Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val
305 310 315 320
His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu
325 330 335
Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn
340 345 350
Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg Val Ile Phe Ile Asp
355 360 365
Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala
370 375 380
Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala
385 390 395 400
Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp
405 410 415
Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu
420 425 430
Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr
435 440 445
Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp
450 455 460
Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr
465 470 475 480
Gly Leu
<210> 28
<211> 497
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Shigella phage Shf125875 backbone) protein
sequence
<400> 28
Met Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr Lys
1 5 10 15
Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu Glu
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu Glu
50 55 60
Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala Asp
85 90 95
Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu Lys
130 135 140
Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln Phe
165 170 175
Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala Asp
180 185 190
Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn Gly
195 200 205
Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys Lys
210 215 220
Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn Glu
225 230 235 240
Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly Leu
245 250 255
Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu Gly
260 265 270
Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr Ser
275 280 285
Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala Leu
290 295 300
Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn Gln
305 310 315 320
Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr Val
325 330 335
Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr Trp
340 345 350
Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Arg Val Ile Val
355 360 365
Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro Asn
370 375 380
Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr Thr
385 390 395 400
Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp Gly
405 410 415
Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg Glu
420 425 430
Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile Ala
435 440 445
Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly Thr
450 455 460
Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys Thr
465 470 475 480
Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr Gly
485 490 495
Leu
<210> 29
<211> 298
<212> PRT
<213> Paramecium bursaria Chlorella virus PBCV-1
<400> 29
Met Ala Ile Thr Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Ile Glu
1 5 10 15
Asp Val Gln Phe Pro Cys Leu Ala Thr Pro Lys Ile Asp Gly Ile Arg
20 25 30
Ser Val Lys Gln Thr Gln Met Leu Ser Arg Thr Phe Lys Pro Ile Arg
35 40 45
Asn Ser Val Met Asn Arg Leu Leu Thr Glu Leu Leu Pro Glu Gly Ser
50 55 60
Asp Gly Glu Ile Ser Ile Glu Gly Ala Thr Phe Gln Asp Thr Thr Ser
65 70 75 80
Ala Val Met Thr Gly His Lys Met Tyr Asn Ala Lys Phe Ser Tyr Tyr
85 90 95
Trp Phe Asp Tyr Val Thr Asp Asp Pro Leu Lys Lys Tyr Ile Asp Arg
100 105 110
Val Glu Asp Met Lys Asn Tyr Ile Thr Val His Pro His Ile Leu Glu
115 120 125
His Ala Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn
130 135 140
Ile Thr Glu Leu Leu Gln Tyr Glu Arg Asp Val Leu Ser Lys Gly Phe
145 150 155 160
Glu Gly Val Met Ile Arg Lys Pro Asp Gly Lys Tyr Lys Phe Gly Arg
165 170 175
Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp
180 185 190
Ala Glu Ala Thr Ile Ile Ser Met Thr Ala Leu Phe Lys Asn Thr Asn
195 200 205
Thr Lys Thr Lys Asp Asn Phe Gly Tyr Ser Lys Arg Ser Thr His Lys
210 215 220
Ser Gly Lys Val Glu Glu Asp Val Met Gly Ser Ile Glu Val Asp Tyr
225 230 235 240
Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Ala Asp Gln Arg
245 250 255
Arg Asp Phe Trp Gln Asn Lys Glu Ser Tyr Ile Gly Lys Met Val Lys
260 265 270
Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Cys Pro Arg Phe Pro Val
275 280 285
Phe Ile Gly Ile Arg His Glu Glu Asp Arg
290 295
<210> 30
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5, 8 and 9 template oligonucleotide sequence
<400> 30
tttggtgcga agcagactga ggc 23
<210> 31
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 31
tttggtgcga agcagagtga ggc 23
<210> 32
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 32
tttggtgcga agcagattga ggc 23
<210> 33
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 33
tttggtgcga agcagaatga ggc 23
<210> 34
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 34
tttggtgcga agcagtctga ggc 23
<210> 35
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 35
tttggtgcga agcagtgtga ggc 23
<210> 36
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 36
tttggtgcga agcagtttga ggc 23
<210> 37
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 37
tttggtgcga agcagtatga ggc 23
<210> 38
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 38
tttggtgcga agcagcctga ggc 23
<210> 39
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 39
tttggtgcga agcagcgtga ggc 23
<210> 40
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 40
tttggtgcga agcagcttga ggc 23
<210> 41
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 41
tttggtgcga agcagcatga ggc 23
<210> 42
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 42
tttggtgcga agcaggctga ggc 23
<210> 43
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 43
tttggtgcga agcagggtga ggc 23
<210> 44
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 44
tttggtgcga agcaggttga ggc 23
<210> 45
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 5 template oligonucleotide sequence
<400> 45
tttggtgcga agcaggatga ggc 23
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 14 "20 mer" oligonucleotide sequence
<400> 46
gccucagtct gcttcgcacc 20
<210> 47
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 7 template oligonucleotide sequence
<400> 47
tttggtgcga agcagaaggt aagccgaggt ttggcc 36
<210> 48
<211> 298
<212> PRT
<213> Paramecium bursaria Chlorella virus NE-JV-4
<400> 48
Met Ala Ile Thr Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Ile Glu
1 5 10 15
Asp Val Gln Phe Pro Cys Leu Ala Thr Pro Lys Ile Asp Gly Ile Arg
20 25 30
Ser Val Lys Gln Thr Gln Met Leu Ser Arg Thr Phe Lys Pro Ile Arg
35 40 45
Asn Ser Val Met Asn Arg Leu Leu Thr Glu Leu Leu Pro Glu Gly Ser
50 55 60
Asp Gly Glu Ile Ser Ile Glu Gly Ala Thr Phe Gln Asp Thr Thr Ser
65 70 75 80
Ala Val Met Thr Gly His Lys Met Tyr Asn Ala Lys Phe Ser Tyr Tyr
85 90 95
Trp Phe Asp Tyr Val Thr Asp Asp Pro Leu Lys Lys Tyr Ser Asp Arg
100 105 110
Val Glu Asp Met Lys Asn Tyr Ile Thr Ala His Pro His Ile Leu Asp
115 120 125
His Glu Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn
130 135 140
Ile Thr Glu Leu Leu Gln Tyr Glu Arg Asp Val Leu Ser Lys Gly Phe
145 150 155 160
Glu Gly Val Met Ile Arg Lys Pro Asp Gly Lys Tyr Lys Phe Gly Arg
165 170 175
Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp
180 185 190
Ala Glu Ala Thr Ile Ile Ser Met Thr Ala Leu Phe Lys Asn Thr Asn
195 200 205
Thr Lys Thr Lys Asp Asn Phe Gly Tyr Ser Lys Arg Ser Thr His Lys
210 215 220
Asn Gly Lys Val Glu Glu Asp Val Met Gly Ser Ile Glu Val Asp Tyr
225 230 235 240
Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Ala Asp Gln Arg
245 250 255
Arg Asp Phe Trp Gln Asn Lys Glu Ser Tyr Ile Gly Lys Met Val Lys
260 265 270
Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Cys Pro Arg Phe Pro Val
275 280 285
Phe Ile Gly Ile Arg His Glu Glu Asp His
290 295
<210> 49
<211> 298
<212> PRT
<213> Paramecium bursaria Chlorella virus NYs1
<400> 49
Met Thr Ile Ala Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Leu Asp
1 5 10 15
Asp Val Lys Phe Pro Cys Leu Val Thr Pro Lys Ile Asp Gly Ile Arg
20 25 30
Ser Leu Lys Gln Gln His Met Leu Ser Arg Thr Phe Lys Pro Ile Arg
35 40 45
Asn Ser Val Met Asn Lys Leu Leu Ser Glu Leu Leu Pro Glu Gly Ala
50 55 60
Asp Gly Glu Ile Cys Ile Glu Asp Ser Thr Phe Gln Ala Thr Thr Ser
65 70 75 80
Ala Val Met Thr Gly His Lys Val Tyr Asp Glu Lys Phe Ser Tyr Tyr
85 90 95
Trp Phe Asp Tyr Val Val Asp Asp Pro Leu Lys Ser Tyr Thr Asp Arg
100 105 110
Val Asn Asp Met Lys Lys Tyr Val Asp Asp His Pro His Ile Leu Glu
115 120 125
His Glu Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn
130 135 140
Ile Asp Glu Leu Ser Gln Tyr Glu Arg Asp Val Leu Ala Lys Gly Phe
145 150 155 160
Glu Gly Val Met Ile Arg Arg Pro Asp Gly Lys Tyr Lys Phe Gly Arg
165 170 175
Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp
180 185 190
Ala Glu Ala Thr Ile Ile Ser Met Ser Pro Arg Leu Lys Asn Thr Asn
195 200 205
Ala Lys Ser Lys Asp Asn Leu Gly Tyr Ser Lys Arg Ser Thr His Lys
210 215 220
Ser Gly Lys Val Glu Glu Glu Thr Met Gly Ser Ile Glu Val Asp Tyr
225 230 235 240
Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Asp Glu Gln Arg
245 250 255
Lys His Phe Trp Glu Asn Lys Asp Ser Tyr Ile Gly Lys Leu Leu Lys
260 265 270
Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Ala Pro Arg Phe Pro Val
275 280 285
Phe Ile Gly Ile Arg His Glu Glu Asp Cys
290 295
<210> 50
<211> 301
<212> PRT
<213> Paramecium bursaria Chlorella virus NE-JV-1
<400> 50
Met Thr Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Phe Lys Lys Leu
1 5 10 15
Thr Val Ala Asp Val Lys Tyr Pro Val Phe Ala Thr Pro Lys Leu Asp
20 25 30
Gly Ile Arg Ala Leu Lys Ile Asp Gly Ala Phe Val Ser Arg Thr Phe
35 40 45
Lys Pro Ile Arg Asn Arg Ala Ile Ala Asp Ala Leu Gln Asp Leu Leu
50 55 60
Pro Asn Gly Ser Asp Gly Glu Ile Leu Ser Gly Ser Thr Phe Gln Asp
65 70 75 80
Ala Ser Ser Ala Val Met Thr Ala Lys Ala Gly Ile Gly Ala Asn Thr
85 90 95
Ile Phe Tyr Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Pro Tyr
100 105 110
Leu Asp Arg Met Thr Asp Met Glu Asn Tyr Leu Lys Glu Arg Pro Glu
115 120 125
Ile Leu Asn Asp Asp Arg Ile Lys Ile Val Pro Leu Ile Pro Lys Lys
130 135 140
Ile Glu Thr Lys Asp Glu Leu Asp Thr Phe Glu Lys Ile Cys Leu Asp
145 150 155 160
Gln Gly Phe Glu Gly Val Met Ile Arg Ser Gly Ala Gly Lys Tyr Lys
165 170 175
Phe Gly Arg Ser Thr Glu Lys Glu Gly Ile Leu Ile Lys Ile Lys Gln
180 185 190
Phe Glu Asp Asp Glu Ala Val Val Ile Gly Phe Thr Pro Met Gln Thr
195 200 205
Asn Thr Asn Asp Lys Ser Met Asn Glu Leu Gly Asp Met Lys Arg Ser
210 215 220
Ser His Lys Asp Gly Lys Val Asn Leu Asp Thr Leu Gly Ala Leu Glu
225 230 235 240
Val Asp Trp Asn Gly Ile Thr Phe Ser Ile Gly Thr Gly Phe Asp His
245 250 255
Ala Leu Arg Asp Lys Leu Trp Ser Glu Arg Asp Lys Leu Ile Gly Lys
260 265 270
Ile Val Lys Phe Lys Tyr Phe Ala Gln Gly Val Lys Thr Ala Pro Arg
275 280 285
Phe Pro Val Phe Ile Gly Phe Arg Asp Pro Asp Asp Met
290 295 300
<210> 51
<211> 300
<212> PRT
<213> Acanthocystis turfacea Chlorella virus Canal-1
<400> 51
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser
1 5 10 15
Val Gly Asp Leu Thr Phe Pro Val Phe Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Val Gly Gly Thr Ile Val Ser Arg Thr Phe Lys
35 40 45
Pro Val Arg Asn Ser Ala Ile Ser Glu Val Leu Ala Ser Ile Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Glu Ser
65 70 75 80
Thr Ser Thr Val Met Thr Ala Asp Ala Gly Leu Gly Ser Gly Thr Met
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Ser Phe Thr Asp Arg His Pro Glu Ile
115 120 125
Leu Lys Asp Lys Arg Val Thr Ile Val Pro Leu Phe Pro Lys Lys Ile
130 135 140
Asp Thr Thr Glu Glu Leu His Glu Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Val Glu Leu Glu Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Arg Asp
245 250 255
Thr Arg Val Asp Leu Trp Lys Arg Arg Glu Gly Val Ile Gly Lys Ile
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Lys Asp Asp Met
290 295 300
<210> 52
<211> 300
<212> PRT
<213> Acanthocystis turfacea Chlorella virus Br0604L
<400> 52
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Leu Ser
1 5 10 15
Val Asp Asp Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys
35 40 45
Pro Ile Arg Asn Thr Thr Ile Ser Lys Val Leu Thr Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Ser Ala Asp Ala Gly Ile Gly Ser Gly Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Ile Lys Lys Phe Ile Asp Cys Arg Pro Glu Ile
115 120 125
Leu Lys Asp Ser Arg Val Ile Ile Val Pro Leu Phe Pro Lys Lys Ile
130 135 140
Asp Thr Ala Glu Glu Leu Asn Val Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Val Asn Glu Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Val Asp Leu Asp Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Gly Ile Gly Thr Gly Phe Asp Lys Asp
245 250 255
Thr Arg Glu Asp Leu Trp Lys Arg Arg Asp Ser Ile Ile Gly Lys Ile
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Val Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Lys Asn Asp Met
290 295 300
<210> 53
<211> 300
<212> PRT
<213> Acanthocystis turfacea Chlorella virus NE-JV-2
<400> 53
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Leu Ser
1 5 10 15
Val Asp Asp Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Ile Val Ser Arg Thr Phe Lys
35 40 45
Pro Ile Arg Asn Thr Thr Ile Ser Asn Val Leu Met Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Ser Ala Asp Ala Gly Ile Gly Ser Gly Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asp Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Lys Phe Val Asp Ser His Pro Glu Ile
115 120 125
Leu Lys Asp Arg Arg Val Thr Ile Val Pro Leu Ile Pro Lys Lys Ile
130 135 140
Asp Thr Val Glu Glu Leu Asn Val Phe Glu Gln Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Val Asn Asp Lys Lys Met Asn Glu Leu Gly Asp Met Arg Arg Thr Ser
210 215 220
His Lys Asp Gly Lys Ile Asp Leu Glu Met Leu Gly Ala Leu Asp Val
225 230 235 240
Glu Trp Asn Gly Ile Arg Phe Gly Ile Gly Thr Gly Phe Asp Lys Asp
245 250 255
Thr Arg Glu Asp Leu Trp Lys Lys Arg Asp Ser Ile Ile Gly Lys Val
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Glu Asn Asp Met
290 295 300
<210> 54
<211> 300
<212> PRT
<213> Acanthocystis turfacea Chlorella virus TN603.4.2
<400> 54
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser
1 5 10 15
Val Asp Asn Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys
35 40 45
Pro Ile Arg Asn Thr Thr Ile Ser Lys Val Leu Ala Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Thr Thr Asp Ala Gly Ile Gly Ser Asp Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asp Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Thr Phe Val Asp Gln His Pro Glu Ile
115 120 125
Leu Lys Asp Ser Cys Val Thr Ile Val Pro Leu Phe Pro Lys Lys Ile
130 135 140
Asp Thr Pro Glu Glu Leu His Val Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Thr Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Val Asp Leu Asp Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Lys Asp
245 250 255
Thr Arg Glu Asp Leu Trp Lys Gln Arg Asp Ser Ile Val Gly Lys Val
260 265 270
Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Glu Asn Asp Met
290 295 300
<210> 55
<211> 300
<212> PRT
<213> Acanthocystis turfacea Chlorella virus GM0701.1
<400> 55
Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser
1 5 10 15
Val Asp Asp Leu Thr Phe Pro Val Tyr Thr Thr Pro Lys Leu Asp Gly
20 25 30
Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys
35 40 45
Pro Val Arg Asn Ser Ala Ile Ser Glu Val Leu Ala Ser Leu Leu Pro
50 55 60
Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser
65 70 75 80
Thr Ser Thr Val Met Thr Thr Asp Ala Gly Ile Gly Ser Asp Thr Thr
85 90 95
Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu
100 105 110
Asp Arg Ile Ala Asp Met Lys Thr Phe Ile Asp Gln His Pro Glu Met
115 120 125
Leu Lys Asp Asn His Val Thr Ile Val Pro Leu Ile Pro Lys Lys Ile
130 135 140
Asp Thr Val Glu Glu Leu Asn Ile Phe Glu Lys Trp Cys Leu Asp Gln
145 150 155 160
Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe
165 170 175
Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe
180 185 190
Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn
195 200 205
Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser
210 215 220
His Gln Asp Gly Lys Ile Asp Leu Glu Met Leu Gly Ala Leu Asp Val
225 230 235 240
Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Arg Asp
245 250 255
Thr Arg Val Asp Leu Trp Lys Arg Arg Asp Gly Ile Val Gly Arg Thr
260 265 270
Ile Lys Phe Lys Tyr Phe Gly Gln Gly Ile Lys Thr Ala Pro Arg Phe
275 280 285
Pro Val Phe Leu Gly Phe Arg Asp Lys Asp Asp Met
290 295 300
<210> 56
<211> 287
<212> PRT
<213> Synechococcus phage S-CRM01
<400> 56
Met Leu Ala Gly Asn Phe Asp Pro Lys Lys Ala Lys Phe Pro Tyr Cys
1 5 10 15
Ala Thr Pro Lys Ile Asp Gly Ile Arg Phe Leu Met Val Asn Gly Arg
20 25 30
Ala Leu Ser Arg Thr Phe Lys Pro Ile Arg Asn Glu Tyr Ile Gln Lys
35 40 45
Leu Leu Ser Lys His Leu Pro Asp Gly Ile Asp Gly Glu Leu Thr Cys
50 55 60
Gly Asp Thr Phe Gln Ser Ser Thr Ser Ala Ile Met Arg Ile Ala Gly
65 70 75 80
Glu Pro Asp Phe Lys Ala Trp Ile Phe Asp Tyr Val Asp Pro Asp Ser
85 90 95
Thr Ser Ile Leu Pro Phe Ile Glu Arg Phe Asp Gln Ile Ser Asp Ile
100 105 110
Ile Tyr Asn Gly Pro Ile Pro Phe Lys His Gln Val Leu Gly Gln Ser
115 120 125
Ile Leu Tyr Asn Ile Asp Asp Leu Asn Arg Tyr Glu Glu Ala Cys Leu
130 135 140
Asn Glu Gly Tyr Glu Gly Val Met Leu Arg Asp Pro Tyr Gly Thr Tyr
145 150 155 160
Lys Phe Gly Arg Ser Ser Thr Asn Glu Gly Ile Leu Leu Lys Val Lys
165 170 175
Arg Phe Glu Asp Ala Glu Ala Thr Val Ile Arg Ile Asp Glu Lys Met
180 185 190
Ser Asn Gln Asn Ile Ala Glu Lys Asp Asn Phe Gly Arg Thr Lys Arg
195 200 205
Ser Ser Cys Leu Asp Gly Met Val Pro Met Glu Thr Thr Gly Ala Leu
210 215 220
Phe Val Arg Asn Ser Asp Gly Leu Glu Phe Ser Ile Gly Ser Gly Leu
225 230 235 240
Asn Asp Glu Met Arg Asp Glu Ile Trp Lys Asn Lys Ser Ser Tyr Ile
245 250 255
Gly Lys Leu Val Lys Tyr Lys Tyr Phe Pro Gln Gly Val Lys Asp Leu
260 265 270
Pro Arg His Pro Val Phe Leu Gly Phe Arg Asp Pro Asp Asp Met
275 280 285
<210> 57
<211> 322
<212> PRT
<213> marine sediment metagenome
<400> 57
Met Asp Ala His Glu Leu Met Lys Leu Asn Glu Tyr Ala Glu Arg Gln
1 5 10 15
Asn Gln Lys Gln Lys Lys Gln Ile Thr Lys Pro Met Leu Ala Ala Ser
20 25 30
Leu Lys Asp Ile Thr Gln Leu Asp Tyr Ser Lys Gly Tyr Leu Ala Thr
35 40 45
Gln Lys Leu Asp Gly Ile Arg Ala Leu Met Ile Asp Gly Lys Leu Val
50 55 60
Ser Arg Thr Phe Lys Pro Ile Arg Asn Asn His Ile Arg Glu Met Leu
65 70 75 80
Glu Asp Val Leu Pro Asp Gly Ala Asp Gly Glu Ile Val Cys Pro Gly
85 90 95
Ala Phe Gln Ala Thr Ser Ser Gly Val Met Ser Ala Asn Gly Glu Pro
100 105 110
Glu Phe Ile Tyr Tyr Met Phe Asp Tyr Val Lys Asp Asp Ile Thr Lys
115 120 125
Glu Tyr Trp Arg Arg Thr Gln Asp Met Val Gln Trp Leu Ile Asn Gln
130 135 140
Gly Pro Thr Arg Thr Pro Gly Leu Ser Lys Leu Lys Leu Leu Val Pro
145 150 155 160
Thr Leu Ile Lys Asn Tyr Asp His Leu Lys Thr Tyr Glu Thr Glu Cys
165 170 175
Ile Asp Lys Gly Phe Glu Gly Val Ile Leu Arg Thr Pro Asp Ser Pro
180 185 190
Tyr Lys Cys Gly Arg Ser Thr Ala Lys Gln Glu Trp Leu Leu Lys Leu
195 200 205
Lys Arg Phe Ala Asp Asp Glu Ala Val Val Ile Gly Phe Thr Glu Lys
210 215 220
Met His Asn Asp Asn Glu Ala Thr Lys Asp Lys Phe Gly His Thr Val
225 230 235 240
Arg Ser Ser His Lys Glu Asn Lys Arg Pro Ala Gly Thr Leu Gly Ser
245 250 255
Leu Ile Val Arg Asp Ile Lys Thr Glu Ile Glu Phe Glu Ile Gly Thr
260 265 270
Gly Phe Asp Asp Glu Leu Arg Gln Lys Ile Trp Asp Ala Arg Pro Glu
275 280 285
Trp Asp Gly Leu Cys Val Lys Tyr Lys His Phe Ala Ile Ser Gly Val
290 295 300
Lys Glu Lys Pro Arg Phe Pro Ser Phe Ile Gly Val Arg Asp Val Glu
305 310 315 320
Asp Met
<210> 58
<211> 691
<212> PRT
<213> Mycobacterium tuberculosis (strain ATCC 25618/H37Rv)
<400> 58
Met Ser Ser Pro Asp Ala Asp Gln Thr Ala Pro Glu Val Leu Arg Gln
1 5 10 15
Trp Gln Ala Leu Ala Glu Glu Val Arg Glu His Gln Phe Arg Tyr Tyr
20 25 30
Val Arg Asp Ala Pro Ile Ile Ser Asp Ala Glu Phe Asp Glu Leu Leu
35 40 45
Arg Arg Leu Glu Ala Leu Glu Glu Gln His Pro Glu Leu Arg Thr Pro
50 55 60
Asp Ser Pro Thr Gln Leu Val Gly Gly Ala Gly Phe Ala Thr Asp Phe
65 70 75 80
Glu Pro Val Asp His Leu Glu Arg Met Leu Ser Leu Asp Asn Ala Phe
85 90 95
Thr Ala Asp Glu Leu Ala Ala Trp Ala Gly Arg Ile His Ala Glu Val
100 105 110
Gly Asp Ala Ala His Tyr Leu Cys Glu Leu Lys Ile Asp Gly Val Ala
115 120 125
Leu Ser Leu Val Tyr Arg Glu Gly Arg Leu Thr Arg Ala Ser Thr Arg
130 135 140
Gly Asp Gly Arg Thr Gly Glu Asp Val Thr Leu Asn Ala Arg Thr Ile
145 150 155 160
Ala Asp Val Pro Glu Arg Leu Thr Pro Gly Asp Asp Tyr Pro Val Pro
165 170 175
Glu Val Leu Glu Val Arg Gly Glu Val Phe Phe Arg Leu Asp Asp Phe
180 185 190
Gln Ala Leu Asn Ala Ser Leu Val Glu Glu Gly Lys Ala Pro Phe Ala
195 200 205
Asn Pro Arg Asn Ser Ala Ala Gly Ser Leu Arg Gln Lys Asp Pro Ala
210 215 220
Val Thr Ala Arg Arg Arg Leu Arg Met Ile Cys His Gly Leu Gly His
225 230 235 240
Val Glu Gly Phe Arg Pro Ala Thr Leu His Gln Ala Tyr Leu Ala Leu
245 250 255
Arg Ala Trp Gly Leu Pro Val Ser Glu His Thr Thr Leu Ala Thr Asp
260 265 270
Leu Ala Gly Val Arg Glu Arg Ile Asp Tyr Trp Gly Glu His Arg His
275 280 285
Glu Val Asp His Glu Ile Asp Gly Val Val Val Lys Val Asp Glu Val
290 295 300
Ala Leu Gln Arg Arg Leu Gly Ser Thr Ser Arg Ala Pro Arg Trp Ala
305 310 315 320
Ile Ala Tyr Lys Tyr Pro Pro Glu Glu Ala Gln Thr Lys Leu Leu Asp
325 330 335
Ile Arg Val Asn Val Gly Arg Thr Gly Arg Ile Thr Pro Phe Ala Phe
340 345 350
Met Thr Pro Val Lys Val Ala Gly Ser Thr Val Gly Gln Ala Thr Leu
355 360 365
His Asn Ala Ser Glu Ile Lys Arg Lys Gly Val Leu Ile Gly Asp Thr
370 375 380
Val Val Ile Arg Lys Ala Gly Asp Val Ile Pro Glu Val Leu Gly Pro
385 390 395 400
Val Val Glu Leu Arg Asp Gly Ser Glu Arg Glu Phe Ile Met Pro Thr
405 410 415
Thr Cys Pro Glu Cys Gly Ser Pro Leu Ala Pro Glu Lys Glu Gly Asp
420 425 430
Ala Asp Ile Arg Cys Pro Asn Ala Arg Gly Cys Pro Gly Gln Leu Arg
435 440 445
Glu Arg Val Phe His Val Ala Ser Arg Asn Gly Leu Asp Ile Glu Val
450 455 460
Leu Gly Tyr Glu Ala Gly Val Ala Leu Leu Gln Ala Lys Val Ile Ala
465 470 475 480
Asp Glu Gly Glu Leu Phe Ala Leu Thr Glu Arg Asp Leu Leu Arg Thr
485 490 495
Asp Leu Phe Arg Thr Lys Ala Gly Glu Leu Ser Ala Asn Gly Lys Arg
500 505 510
Leu Leu Val Asn Leu Asp Lys Ala Lys Ala Ala Pro Leu Trp Arg Val
515 520 525
Leu Val Ala Leu Ser Ile Arg His Val Gly Pro Thr Ala Ala Arg Ala
530 535 540
Leu Ala Thr Glu Phe Gly Ser Leu Asp Ala Ile Ala Ala Ala Ser Thr
545 550 555 560
Asp Gln Leu Ala Ala Val Glu Gly Val Gly Pro Thr Ile Ala Ala Ala
565 570 575
Val Thr Glu Trp Phe Ala Val Asp Trp His Arg Glu Ile Val Asp Lys
580 585 590
Trp Arg Ala Ala Gly Val Arg Met Val Asp Glu Arg Asp Glu Ser Val
595 600 605
Pro Arg Thr Leu Ala Gly Leu Thr Ile Val Val Thr Gly Ser Leu Thr
610 615 620
Gly Phe Ser Arg Asp Asp Ala Lys Glu Ala Ile Val Ala Arg Gly Gly
625 630 635 640
Lys Ala Ala Gly Ser Val Ser Lys Lys Thr Asn Tyr Val Val Ala Gly
645 650 655
Asp Ser Pro Gly Ser Lys Tyr Asp Lys Ala Val Glu Leu Gly Val Pro
660 665 670
Ile Leu Asp Glu Asp Gly Phe Arg Arg Leu Leu Ala Asp Gly Pro Ala
675 680 685
Ser Arg Thr
690
<210> 59
<211> 676
<212> PRT
<213> Enterococcus faecalis (strain ATCC 700802/V583)
<400> 59
Met Glu Gln Gln Pro Leu Thr Leu Thr Ala Ala Thr Thr Arg Ala Gln
1 5 10 15
Glu Leu Arg Lys Gln Leu Asn Gln Tyr Ser His Glu Tyr Tyr Val Lys
20 25 30
Asp Gln Pro Ser Val Glu Asp Tyr Val Tyr Asp Arg Leu Tyr Lys Glu
35 40 45
Leu Val Asp Ile Glu Thr Glu Phe Pro Asp Leu Ile Thr Pro Asp Ser
50 55 60
Pro Thr Gln Arg Val Gly Gly Lys Val Leu Ser Gly Phe Glu Lys Ala
65 70 75 80
Pro His Asp Ile Pro Met Tyr Ser Leu Asn Asp Gly Phe Ser Lys Glu
85 90 95
Asp Ile Phe Ala Phe Asp Glu Arg Val Arg Lys Ala Ile Gly Lys Pro
100 105 110
Val Ala Tyr Cys Cys Glu Leu Lys Ile Asp Gly Leu Ala Ile Ser Leu
115 120 125
Arg Tyr Glu Asn Gly Val Phe Val Arg Gly Ala Thr Arg Gly Asp Gly
130 135 140
Thr Val Gly Glu Asn Ile Thr Glu Asn Leu Arg Thr Val Arg Ser Val
145 150 155 160
Pro Met Arg Leu Thr Glu Pro Ile Ser Val Glu Val Arg Gly Glu Cys
165 170 175
Tyr Met Pro Lys Gln Ser Phe Val Ala Leu Asn Glu Glu Arg Glu Glu
180 185 190
Asn Gly Gln Asp Ile Phe Ala Asn Pro Arg Asn Ala Ala Ala Gly Ser
195 200 205
Leu Arg Gln Leu Asp Thr Lys Ile Val Ala Lys Arg Asn Leu Asn Thr
210 215 220
Phe Leu Tyr Thr Val Ala Asp Phe Gly Pro Met Lys Ala Lys Thr Gln
225 230 235 240
Phe Glu Ala Leu Glu Glu Leu Ser Ala Ile Gly Phe Arg Thr Asn Pro
245 250 255
Glu Arg Gln Leu Cys Gln Ser Ile Asp Glu Val Trp Ala Tyr Ile Glu
260 265 270
Glu Tyr His Glu Lys Arg Ser Thr Leu Pro Tyr Glu Ile Asp Gly Ile
275 280 285
Val Ile Lys Val Asn Glu Phe Ala Leu Gln Asp Glu Leu Gly Phe Thr
290 295 300
Val Lys Ala Pro Arg Trp Ala Ile Ala Tyr Lys Phe Pro Pro Glu Glu
305 310 315 320
Ala Glu Thr Val Val Glu Asp Ile Glu Trp Thr Ile Gly Arg Thr Gly
325 330 335
Val Val Thr Pro Thr Ala Val Met Ala Pro Val Arg Val Ala Gly Thr
340 345 350
Thr Val Ser Arg Ala Ser Leu His Asn Ala Asp Phe Ile Gln Met Lys
355 360 365
Asp Ile Arg Leu Asn Asp His Val Ile Ile Tyr Lys Ala Gly Asp Ile
370 375 380
Ile Pro Glu Val Ala Gln Val Leu Val Glu Lys Arg Ala Ala Asp Ser
385 390 395 400
Gln Pro Tyr Glu Met Pro Thr His Cys Pro Ile Cys His Ser Glu Leu
405 410 415
Val His Leu Asp Glu Glu Val Ala Leu Arg Cys Ile Asn Pro Lys Cys
420 425 430
Pro Ala Gln Ile Lys Glu Gly Leu Asn His Phe Val Ser Arg Asn Ala
435 440 445
Met Asn Ile Asp Gly Leu Gly Pro Arg Val Leu Ala Gln Met Tyr Asp
450 455 460
Lys Gly Leu Val Lys Asp Val Ala Asp Leu Tyr Phe Leu Thr Glu Glu
465 470 475 480
Gln Leu Met Thr Leu Asp Lys Ile Lys Glu Lys Ser Ala Asn Asn Ile
485 490 495
Tyr Thr Ala Ile Gln Gly Ser Lys Glu Asn Ser Val Glu Arg Leu Ile
500 505 510
Phe Gly Leu Gly Ile Arg His Val Gly Ala Lys Ala Ala Lys Ile Leu
515 520 525
Ala Glu His Phe Gly Asp Leu Pro Thr Leu Ser Arg Ala Thr Ala Glu
530 535 540
Glu Ile Val Ala Leu Asp Ser Ile Gly Glu Thr Ile Ala Asp Ser Val
545 550 555 560
Val Thr Tyr Phe Glu Asn Glu Glu Val His Glu Leu Met Ala Glu Leu
565 570 575
Glu Lys Ala Gln Val Asn Leu Thr Tyr Lys Gly Leu Arg Thr Glu Gln
580 585 590
Leu Ala Glu Val Glu Ser Pro Phe Lys Asp Lys Thr Val Val Leu Thr
595 600 605
Gly Lys Leu Ala Gln Tyr Thr Arg Glu Glu Ala Lys Glu Lys Ile Glu
610 615 620
Asn Leu Gly Gly Lys Val Thr Gly Ser Val Ser Lys Lys Thr Asp Ile
625 630 635 640
Val Val Ala Gly Glu Asp Ala Gly Ser Lys Leu Thr Lys Ala Glu Ser
645 650 655
Leu Gly Val Thr Val Trp Asn Glu Gln Glu Met Val Asp Ala Leu Asp
660 665 670
Ala Ser His Phe
675
<210> 60
<211> 670
<212> PRT
<213> Haemophilus influenzae (strain ATCC 51907/DSM 11121/ KW20/Rd)
<400> 60
Met Thr Asn Ile Gln Thr Gln Leu Asp Asn Leu Arg Lys Thr Leu Arg
1 5 10 15
Gln Tyr Glu Tyr Glu Tyr His Val Leu Asp Asn Pro Ser Val Pro Asp
20 25 30
Ser Glu Tyr Asp Arg Leu Phe His Gln Leu Lys Ala Leu Glu Leu Glu
35 40 45
His Pro Glu Phe Leu Thr Ser Asp Ser Pro Thr Gln Arg Val Gly Ala
50 55 60
Lys Pro Leu Ser Gly Phe Ser Gln Ile Arg His Glu Ile Pro Met Leu
65 70 75 80
Ser Leu Asp Asn Ala Phe Ser Asp Ala Glu Phe Asn Ala Phe Val Lys
85 90 95
Arg Ile Glu Asp Arg Leu Ile Leu Leu Pro Lys Pro Leu Thr Phe Cys
100 105 110
Cys Glu Pro Lys Leu Asp Gly Leu Ala Val Ser Ile Leu Tyr Val Asn
115 120 125
Gly Glu Leu Thr Gln Ala Ala Thr Arg Gly Asp Gly Thr Thr Gly Glu
130 135 140
Asp Ile Thr Ala Asn Ile Arg Thr Ile Arg Asn Val Pro Leu Gln Leu
145 150 155 160
Leu Thr Asp Asn Pro Pro Ala Arg Leu Glu Val Arg Gly Glu Val Phe
165 170 175
Met Pro His Ala Gly Phe Glu Arg Leu Asn Lys Tyr Ala Leu Glu His
180 185 190
Asn Glu Lys Thr Phe Ala Asn Pro Arg Asn Ala Ala Ala Gly Ser Leu
195 200 205
Arg Gln Leu Asp Pro Asn Ile Thr Ser Lys Arg Pro Leu Val Leu Asn
210 215 220
Ala Tyr Gly Ile Gly Ile Ala Glu Gly Val Asp Leu Pro Thr Thr His
225 230 235 240
Tyr Ala Arg Leu Gln Trp Leu Lys Ser Ile Gly Ile Pro Val Asn Pro
245 250 255
Glu Ile Arg Leu Cys Asn Gly Ala Asp Glu Val Leu Gly Phe Tyr Arg
260 265 270
Asp Ile Gln Asn Lys Arg Ser Ser Leu Gly Tyr Asp Ile Asp Gly Thr
275 280 285
Val Leu Lys Ile Asn Asp Ile Ala Leu Gln Asn Glu Leu Gly Phe Ile
290 295 300
Ser Lys Ala Pro Arg Trp Ala Ile Ala Tyr Lys Phe Pro Ala Gln Glu
305 310 315 320
Glu Leu Thr Leu Leu Asn Asp Val Glu Phe Gln Val Gly Arg Thr Gly
325 330 335
Ala Ile Thr Pro Val Ala Lys Leu Glu Pro Val Phe Val Ala Gly Val
340 345 350
Thr Val Ser Asn Ala Thr Leu His Asn Gly Asp Glu Ile Glu Arg Leu
355 360 365
Asn Ile Ala Ile Gly Asp Thr Val Val Ile Arg Arg Ala Gly Asp Val
370 375 380
Ile Pro Gln Ile Ile Gly Val Leu His Glu Arg Arg Pro Asp Asn Ala
385 390 395 400
Lys Pro Ile Ile Phe Pro Thr Asn Cys Pro Val Cys Asp Ser Gln Ile
405 410 415
Ile Arg Ile Glu Gly Glu Ala Val Ala Arg Cys Thr Gly Gly Leu Phe
420 425 430
Cys Ala Ala Gln Arg Lys Glu Ala Leu Lys His Phe Val Ser Arg Lys
435 440 445
Ala Met Asp Ile Asp Gly Val Gly Gly Lys Leu Ile Glu Gln Leu Val
450 455 460
Asp Arg Glu Leu Ile His Thr Pro Ala Asp Leu Phe Lys Leu Asp Leu
465 470 475 480
Thr Thr Leu Thr Arg Leu Glu Arg Met Gly Ala Lys Ser Ala Glu Asn
485 490 495
Ala Leu Asn Ser Leu Glu Asn Ala Lys Ser Thr Thr Leu Ala Arg Phe
500 505 510
Ile Phe Ala Leu Gly Ile Arg Glu Val Gly Glu Ala Thr Ala Leu Asn
515 520 525
Leu Ala Asn His Phe Lys Thr Leu Asp Ala Leu Lys Asp Ala Asn Leu
530 535 540
Glu Glu Leu Gln Gln Val Pro Asp Val Gly Glu Val Val Ala Asn Arg
545 550 555 560
Ile Phe Ile Phe Trp Arg Glu Ala His Asn Val Ala Val Val Glu Asp
565 570 575
Leu Ile Ala Gln Gly Val His Trp Glu Thr Val Glu Val Lys Glu Ala
580 585 590
Ser Glu Asn Leu Phe Lys Asp Lys Thr Val Val Leu Thr Gly Thr Leu
595 600 605
Thr Gln Met Gly Arg Asn Glu Ala Lys Ala Leu Leu Gln Gln Leu Gly
610 615 620
Ala Lys Val Ser Gly Ser Val Ser Ser Lys Thr Asp Phe Val Ile Ala
625 630 635 640
Gly Asp Ala Ala Gly Ser Lys Leu Ala Lys Ala Gln Glu Leu Asn Ile
645 650 655
Thr Val Leu Thr Glu Glu Glu Phe Leu Ala Gln Ile Thr Arg
660 665 670
<210> 61
<211> 667
<212> PRT
<213> Staphylococcus aureus
<400> 61
Met Ala Asp Leu Ser Ser Arg Val Asn Glu Leu His Asp Leu Leu Asn
1 5 10 15
Gln Tyr Ser Tyr Glu Tyr Tyr Val Glu Asp Asn Pro Ser Val Pro Asp
20 25 30
Ser Glu Tyr Asp Lys Leu Leu His Glu Leu Ile Lys Ile Glu Glu Glu
35 40 45
His Pro Glu Tyr Lys Thr Val Asp Ser Pro Thr Val Arg Val Gly Gly
50 55 60
Glu Ala Gln Ala Ser Phe Asn Lys Val Asn His Asp Thr Pro Met Leu
65 70 75 80
Ser Leu Gly Asn Ala Phe Asn Glu Asp Asp Leu Arg Lys Phe Asp Gln
85 90 95
Arg Ile Arg Glu Gln Ile Gly Asn Val Glu Tyr Met Cys Glu Leu Lys
100 105 110
Ile Asp Gly Leu Ala Val Ser Leu Lys Tyr Val Asp Gly Tyr Phe Val
115 120 125
Gln Gly Leu Thr Arg Gly Asp Gly Thr Thr Gly Glu Asp Ile Thr Glu
130 135 140
Asn Leu Lys Thr Ile His Ala Ile Pro Leu Lys Met Lys Glu Pro Leu
145 150 155 160
Asn Val Glu Val Arg Gly Glu Ala Tyr Met Pro Arg Arg Ser Phe Leu
165 170 175
Arg Leu Asn Glu Glu Lys Glu Lys Asn Asp Glu Gln Leu Phe Ala Asn
180 185 190
Pro Arg Asn Ala Ala Ala Gly Ser Leu Arg Gln Leu Asp Ser Lys Leu
195 200 205
Thr Ala Lys Arg Lys Leu Ser Val Phe Ile Tyr Ser Val Asn Asp Phe
210 215 220
Thr Asp Phe Asn Ala Arg Ser Gln Ser Glu Ala Leu Asp Glu Leu Asp
225 230 235 240
Lys Leu Gly Phe Thr Thr Asn Lys Asn Arg Ala Arg Val Asn Asn Ile
245 250 255
Asp Gly Val Leu Glu Tyr Ile Glu Lys Trp Thr Ser Gln Arg Glu Ser
260 265 270
Leu Pro Tyr Asp Ile Asp Gly Ile Val Ile Lys Val Asn Asp Leu Asp
275 280 285
Gln Gln Asp Glu Met Gly Phe Thr Gln Lys Ser Pro Arg Trp Ala Ile
290 295 300
Ala Tyr Lys Phe Pro Ala Glu Glu Val Val Thr Lys Leu Leu Asp Ile
305 310 315 320
Glu Leu Ser Ile Gly Arg Thr Gly Val Val Thr Pro Thr Ala Ile Leu
325 330 335
Glu Pro Val Lys Val Ala Gly Thr Thr Val Ser Arg Ala Ser Leu His
340 345 350
Asn Glu Asp Leu Ile His Asp Arg Asp Ile Arg Ile Gly Asp Ser Val
355 360 365
Val Val Lys Lys Ala Gly Asp Ile Ile Pro Glu Val Val Arg Ser Ile
370 375 380
Pro Glu Arg Arg Pro Glu Asp Ala Val Thr Tyr His Met Pro Thr His
385 390 395 400
Cys Pro Ser Cys Gly His Glu Leu Val Arg Ile Glu Gly Glu Val Ala
405 410 415
Leu Arg Cys Ile Asn Pro Lys Cys Gln Ala Gln Leu Val Glu Gly Leu
420 425 430
Ile His Phe Val Ser Arg Gln Ala Met Asn Ile Asp Gly Leu Gly Thr
435 440 445
Lys Ile Ile Gln Gln Leu Tyr Gln Ser Glu Leu Ile Lys Asp Val Ala
450 455 460
Asp Ile Phe Tyr Leu Thr Glu Glu Asp Leu Leu Pro Leu Asp Arg Met
465 470 475 480
Gly Gln Lys Lys Val Asp Asn Leu Leu Ala Ala Ile Gln Gln Ala Lys
485 490 495
Asp Asn Ser Leu Glu Asn Leu Leu Phe Gly Leu Gly Ile Arg His Leu
500 505 510
Gly Val Lys Ala Ser Gln Val Leu Ala Glu Lys Tyr Glu Thr Ile Asp
515 520 525
Arg Leu Leu Thr Val Thr Glu Ala Glu Leu Val Glu Ile His Asp Ile
530 535 540
Gly Asp Lys Val Ala Gln Ser Val Val Thr Tyr Leu Glu Asn Glu Asp
545 550 555 560
Ile Arg Ala Leu Ile Gln Lys Leu Lys Asp Lys His Val Asn Met Ile
565 570 575
Tyr Lys Gly Ile Lys Thr Ser Asp Ile Glu Gly His Pro Glu Phe Ser
580 585 590
Gly Lys Thr Ile Val Leu Thr Gly Lys Leu His Gln Met Thr Arg Asn
595 600 605
Glu Ala Ser Lys Trp Leu Ala Ser Gln Gly Ala Lys Val Thr Ser Ser
610 615 620
Val Thr Lys Asn Thr Asp Val Val Ile Ala Gly Glu Asp Ala Gly Ser
625 630 635 640
Lys Leu Thr Lys Ala Gln Ser Leu Gly Ile Glu Ile Trp Thr Glu Gln
645 650 655
Gln Phe Val Asp Lys Gln Asn Glu Leu Asn Ser
660 665
<210> 62
<211> 652
<212> PRT
<213> Streptococcus pneumoniae (strain P1031)
<400> 62
Met Asn Lys Arg Met Asn Glu Leu Val Ala Leu Leu Asn Arg Tyr Ala
1 5 10 15
Thr Glu Tyr Tyr Thr Ser Asp Asn Pro Ser Val Ser Asp Ser Glu Tyr
20 25 30
Asp Arg Leu Tyr Arg Glu Leu Val Glu Leu Glu Thr Ala Tyr Pro Glu
35 40 45
Gln Val Leu Ala Asp Ser Pro Thr His Arg Val Gly Gly Lys Val Leu
50 55 60
Asp Gly Phe Glu Lys Tyr Ser His Gln Tyr Pro Leu Tyr Ser Leu Gln
65 70 75 80
Asp Ala Phe Ser Arg Glu Glu Leu Asp Ala Phe Asp Ala Arg Val Arg
85 90 95
Lys Glu Val Ala His Pro Thr Tyr Ile Cys Glu Leu Lys Ile Asp Gly
100 105 110
Leu Ser Ile Ser Leu Thr Tyr Glu Lys Gly Ile Leu Val Ala Gly Val
115 120 125
Thr Arg Gly Asp Gly Ser Ile Gly Glu Asn Ile Thr Glu Asn Leu Lys
130 135 140
Arg Val Lys Asp Ile Pro Leu Thr Leu Pro Glu Glu Leu Asp Ile Thr
145 150 155 160
Val Arg Gly Glu Cys Tyr Met Pro Arg Ala Ser Phe Asp Gln Val Asn
165 170 175
Gln Ala Arg Gln Glu Asn Gly Glu Pro Glu Phe Ala Asn Pro Arg Asn
180 185 190
Ala Ala Ala Gly Thr Leu Arg Gln Leu Asp Thr Ala Val Val Ala Lys
195 200 205
Arg Asn Leu Ala Thr Phe Leu Tyr Gln Glu Ala Ser Pro Ser Thr Arg
210 215 220
Asp Ser Gln Glu Lys Gly Leu Lys Tyr Leu Glu Gln Leu Gly Phe Val
225 230 235 240
Val Asn Pro Lys Arg Ile Leu Ala Glu Asn Ile Asp Glu Ile Trp Asn
245 250 255
Phe Ile Gln Glu Val Gly Gln Glu Arg Glu Asn Leu Pro Tyr Asp Ile
260 265 270
Asp Gly Val Val Ile Lys Val Asn Asp Leu Ala Ser Gln Glu Glu Leu
275 280 285
Gly Phe Thr Val Lys Ala Pro Lys Trp Ala Val Ala Tyr Lys Phe Pro
290 295 300
Ala Glu Glu Lys Glu Ala Gln Leu Leu Ser Val Asp Trp Thr Val Gly
305 310 315 320
Arg Thr Gly Val Val Thr Pro Thr Ala Asn Leu Thr Pro Val Gln Leu
325 330 335
Ala Gly Thr Thr Val Ser Arg Ala Thr Leu His Asn Val Asp Tyr Ile
340 345 350
Ala Glu Lys Asp Ile Arg Lys Asp Asp Thr Val Ile Val Tyr Lys Ala
355 360 365
Gly Asp Ile Ile Pro Ala Val Leu Arg Val Val Glu Ser Lys Arg Val
370 375 380
Ser Glu Glu Lys Leu Asp Ile Pro Thr Asn Cys Pro Ser Cys Asn Ser
385 390 395 400
Asp Leu Leu His Phe Glu Asp Glu Val Ala Leu Arg Cys Ile Asn Pro
405 410 415
Arg Cys Pro Ala Gln Ile Met Glu Gly Leu Ile His Phe Ala Ser Arg
420 425 430
Asp Ala Met Asn Ile Thr Gly Leu Gly Pro Ser Ile Val Glu Lys Leu
435 440 445
Phe Ala Ala Asn Leu Val Lys Asp Val Ala Asp Ile Tyr Arg Leu Gln
450 455 460
Glu Glu Asp Phe Leu Leu Leu Glu Gly Val Lys Glu Lys Ser Ala Ala
465 470 475 480
Lys Leu Tyr Gln Ala Ile Gln Ala Ser Lys Glu Asn Ser Ala Glu Lys
485 490 495
Leu Leu Phe Gly Leu Gly Ile Arg His Val Gly Ser Lys Ala Ser Gln
500 505 510
Leu Leu Leu Gln Tyr Phe His Ser Ile Glu Asn Leu Tyr Gln Ala Asp
515 520 525
Ser Glu Glu Val Ala Ser Ile Glu Ser Leu Gly Gly Val Ile Ala Lys
530 535 540
Ser Leu Gln Thr Tyr Phe Ala Thr Glu Gly Ser Glu Ile Leu Leu Arg
545 550 555 560
Glu Leu Lys Glu Thr Gly Val Asn Leu Asp Tyr Lys Gly Gln Thr Val
565 570 575
Val Ala Asp Ala Ala Leu Ser Gly Leu Thr Val Val Leu Thr Gly Lys
580 585 590
Leu Glu Arg Leu Lys Arg Ser Glu Ala Lys Ser Lys Leu Glu Ser Leu
595 600 605
Gly Ala Lys Val Thr Gly Ser Val Ser Lys Lys Thr Asp Leu Val Val
610 615 620
Val Gly Ala Asp Ala Gly Ser Lys Leu Gln Lys Ala Gln Glu Leu Gly
625 630 635 640
Ile Gln Val Arg Asp Glu Ala Trp Leu Glu Ser Leu
645 650
<210> 63
<211> 374
<212> PRT
<213> Wild-type Enterobacteria phage T4 RNA ligase 1 protein sequence - 'Rnl1'
<400> 63
Met Gln Glu Leu Phe Asn Asn Leu Met Glu Leu Cys Lys Asp Ser Gln
1 5 10 15
Arg Lys Phe Phe Tyr Ser Asp Asp Val Ser Ala Ser Gly Arg Thr Tyr
20 25 30
Arg Ile Phe Ser Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Leu Pro
35 40 45
Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Gly Glu Lys
50 55 60
Pro Val Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Asn
65 70 75 80
Glu Asn Pro Phe Thr Met Asn Ile Asp Leu Asn Asp Val Asp Tyr Ile
85 90 95
Leu Thr Lys Glu Asp Gly Ser Leu Val Ser Thr Tyr Leu Asp Gly Asp
100 105 110
Glu Ile Leu Phe Lys Ser Lys Gly Ser Ile Lys Ser Glu Gln Ala Leu
115 120 125
Met Ala Asn Gly Ile Leu Met Asn Ile Asn His His Arg Leu Arg Asp
130 135 140
Arg Leu Lys Glu Leu Ala Glu Asp Gly Phe Thr Ala Asn Phe Glu Phe
145 150 155 160
Val Ala Pro Thr Asn Arg Ile Val Leu Ala Tyr Gln Glu Met Lys Ile
165 170 175
Ile Leu Leu Asn Val Arg Glu Asn Glu Thr Gly Glu Tyr Ile Ser Tyr
180 185 190
Asp Asp Ile Tyr Lys Asp Ala Thr Leu Arg Pro Tyr Leu Val Glu Arg
195 200 205
Tyr Glu Ile Asp Ser Pro Lys Trp Ile Glu Glu Ala Lys Asn Ala Glu
210 215 220
Asn Ile Glu Gly Tyr Val Ala Val Met Lys Asp Gly Ser His Phe Lys
225 230 235 240
Ile Lys Ser Asp Trp Tyr Val Ser Leu His Ser Thr Lys Ser Ser Leu
245 250 255
Asp Asn Pro Glu Lys Leu Phe Lys Thr Ile Ile Asp Gly Ala Ser Asp
260 265 270
Asp Leu Lys Ala Met Tyr Ala Asp Asp Glu Tyr Ser Tyr Arg Lys Ile
275 280 285
Glu Ala Phe Glu Thr Thr Tyr Leu Lys Tyr Leu Asp Arg Ala Leu Phe
290 295 300
Leu Val Leu Asp Cys His Asn Lys His Cys Gly Lys Asp Arg Lys Thr
305 310 315 320
Tyr Ala Met Glu Ala Gln Gly Val Ala Lys Gly Ala Gly Met Asp His
325 330 335
Leu Phe Gly Ile Ile Met Ser Leu Tyr Gln Gly Tyr Asp Ser Gln Glu
340 345 350
Lys Val Met Cys Glu Ile Glu Gln Asn Phe Leu Lys Asn Tyr Lys Lys
355 360 365
Phe Ile Pro Glu Gly Tyr
370
<210> 64
<211> 334
<212> PRT
<213> Wild-type Enterobacteria phage T4 RNA ligase 2 protein sequence - 'Rnl2'
<400> 64
Met Phe Lys Lys Tyr Ser Ser Leu Glu Asn His Tyr Asn Ser Lys Phe
1 5 10 15
Ile Glu Lys Leu Tyr Ser Leu Gly Leu Thr Gly Gly Glu Trp Val Ala
20 25 30
Arg Glu Lys Ile His Gly Thr Asn Phe Ser Leu Ile Ile Glu Arg Asp
35 40 45
Lys Val Thr Cys Ala Lys Arg Thr Gly Pro Ile Leu Pro Ala Glu Asp
50 55 60
Phe Phe Gly Tyr Glu Ile Ile Leu Lys Asn Tyr Ala Asp Ser Ile Lys
65 70 75 80
Ala Val Gln Asp Ile Met Glu Thr Ser Ala Val Val Ser Tyr Gln Val
85 90 95
Phe Gly Glu Phe Ala Gly Pro Gly Ile Gln Lys Asn Val Asp Tyr Cys
100 105 110
Asp Lys Asp Phe Tyr Val Phe Asp Ile Ile Val Thr Thr Glu Ser Gly
115 120 125
Asp Val Thr Tyr Val Asp Asp Tyr Met Met Glu Ser Phe Cys Asn Thr
130 135 140
Phe Lys Phe Lys Met Ala Pro Leu Leu Gly Arg Gly Lys Phe Glu Glu
145 150 155 160
Leu Ile Lys Leu Pro Asn Asp Leu Asp Ser Val Val Gln Asp Tyr Asn
165 170 175
Phe Thr Val Asp His Ala Gly Leu Val Asp Ala Asn Lys Cys Val Trp
180 185 190
Asn Ala Glu Ala Lys Gly Glu Val Phe Thr Ala Glu Gly Tyr Val Leu
195 200 205
Lys Pro Cys Tyr Pro Ser Trp Leu Arg Asn Gly Asn Arg Val Ala Ile
210 215 220
Lys Cys Lys Asn Ser Lys Phe Ser Glu Lys Lys Lys Ser Asp Lys Pro
225 230 235 240
Ile Lys Ala Lys Val Glu Leu Ser Glu Ala Asp Asn Lys Leu Val Gly
245 250 255
Ile Leu Ala Cys Tyr Val Thr Leu Asn Arg Val Asn Asn Val Ile Ser
260 265 270
Lys Ile Gly Glu Ile Gly Pro Lys Asp Phe Gly Lys Val Met Gly Leu
275 280 285
Thr Val Gln Asp Ile Leu Glu Glu Thr Ser Arg Glu Gly Ile Thr Leu
290 295 300
Thr Gln Ala Asp Asn Pro Ser Leu Ile Lys Lys Glu Leu Val Lys Met
305 310 315 320
Val Gln Asp Val Leu Arg Pro Ala Trp Ile Glu Leu Val Ser
325 330
<210> 65
<211> 389
<212> PRT
<213> Wild-type Aeromonas virus Aeh1 ligase protein sequence - 'RNA3'
<400> 65
Met Gln Ser Ile Lys Glu Leu Tyr Gln Asn Leu Ile Asn Leu Cys Val
1 5 10 15
Asp Asp Asn Thr Lys Phe Tyr Phe Ala Glu Thr Val Thr Ser Leu Gly
20 25 30
Thr Lys Val Arg Ile Phe Asp Tyr His Val Ala Gly Tyr Asn Asp Trp
35 40 45
Ile Arg Pro Asp Ala Met Ala Ser Arg Gly Ile Met Phe Glu Met Asn
50 55 60
Gly Glu Ile Pro Val Arg Ile Met Ser Arg Pro Met Asp Lys Phe Phe
65 70 75 80
Asn Tyr Ser Glu Val Ile Gly Trp Glu Lys Leu Glu Thr Ala Gly Asn
85 90 95
Met Lys Met Pro Asp Leu Asn Lys Ile Ala Tyr Val Ile Asp Lys Arg
100 105 110
Asp Gly Ser Leu Ile Ser Thr Tyr Leu Asp Ile Ser Gly Glu Ile Lys
115 120 125
Asn Leu Leu Leu Lys Ser Lys Ala Ser Ile Arg Ser Asn Gln Ala Asn
130 135 140
Asp Ala Ser Val Trp Leu Tyr Gln Glu Asp His Lys Asp Leu Leu Glu
145 150 155 160
Phe Cys Thr Ala Tyr Ala Glu Asn Gly Phe Thr Val Asn Met Glu Trp
165 170 175
Thr Ala Pro His Asn Gln Ile Val Leu Cys Tyr Asn Glu His Gln Leu
180 185 190
Arg Ile Leu Asn Ile Arg His Asn Glu Thr Gly Glu Tyr Val Asp Phe
195 200 205
Gly Glu Leu Gln Lys Asp Pro Thr Phe Val Lys Tyr Ala Ala Asp Phe
210 215 220
Phe Glu Val Pro Gly Asp Gly Lys Ala Trp Ile Asp Glu Val Tyr Gln
225 230 235 240
Met Thr Gly Ile Glu Gly Phe Val Val Val Met Glu Asp Tyr Gln Met
245 250 255
Phe Lys Leu Lys Thr Asp Trp Tyr Val Ala Leu His His Thr Lys Asp
260 265 270
Ser Ile Asn Asn Ser Glu Arg Leu Ile Tyr Ala Cys Ala Glu Asn Cys
275 280 285
Thr Asp Asp Leu Arg Gln Met Phe Arg Asp Asp Glu Asn Ser Leu Gln
290 295 300
Lys Ile Glu Ile Phe Asp Asn His Phe Arg Asp Val Val Met Asp Ala
305 310 315 320
Met Lys Lys Leu Thr Glu Ala Tyr Glu Lys Tyr Arg Gly Met Glu Arg
325 330 335
Arg Asp Tyr Ala Ile Asn Met Asn Asn Asp Phe Lys Asn Glu Arg His
340 345 350
Trp Phe Asn Ile Ala Met Gln Met Phe Ala Gln Arg Pro Asp Phe Ser
355 360 365
Met Thr Asp Glu Ile Val Ala Val Ile Lys Lys Tyr Pro Lys Thr Phe
370 375 380
Ile Pro Lys Gly Tyr
385
<210> 66
<211> 383
<212> PRT
<213> Wild-type Klebsiella phage JD18 ligase protein sequence - 'RNA6'
<400> 66
Met Leu Glu Leu Tyr Lys Asn Leu Met Asn Leu Cys Glu Ser Ser Glu
1 5 10 15
Val Ala Lys Phe Phe Tyr Lys Asp Phe Thr Gly Pro Met Asp Gly Lys
20 25 30
Phe Arg Val Phe Ser Tyr His Tyr Ala Ser Tyr Ser Glu Trp Leu Lys
35 40 45
Pro Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Gly Asp
50 55 60
Thr Pro Ile Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu
65 70 75 80
Asn Glu Asn Pro Met Thr Met Gly Ile Asp Ile Ser Asp Val Glu Tyr
85 90 95
Ile Met Asp Lys Ala Asp Gly Ser Leu Val Ser Ser Tyr Val Asp Asp
100 105 110
Gly Tyr Leu Tyr Leu Lys Ser Lys Thr Ser Leu Tyr Ser Asp Gln Ala
115 120 125
Arg Gln Ala Ser Ala Leu Leu Asn Ser Glu Glu Tyr Ser Ser Leu His
130 135 140
Gln Val Ile Leu Glu Leu Ala Leu Asp Gly Tyr Thr Val Asn Met Glu
145 150 155 160
Phe Val Ser Pro Asn Asn Arg Val Val Leu Ala Tyr Gln Glu Pro Gln
165 170 175
Leu Phe Val Leu Asn Val Arg Asn Asn Thr Thr Gly Glu Tyr Ile Lys
180 185 190
Tyr Asp Asp Leu Tyr Ala Asn Ala Lys Ile Arg Pro Tyr Leu Ile Asn
195 200 205
Ala Tyr Gly Ile Ser Asp Pro Thr Thr Trp Val Glu Gly Val Arg Ala
210 215 220
Leu Glu Gly Val Glu Gly Tyr Ile Ala Val Leu Asn Thr Gly Gln Arg
225 230 235 240
Phe Lys Val Lys Thr Glu Trp Tyr Ser Ala Leu His His Thr Lys Asp
245 250 255
Ser Ile Thr Ser Asn Glu Arg Leu Phe Ala Ser Val Val Ser Ala Asn
260 265 270
Ser Asp Asp Leu Arg Ser Leu Phe Ala Gly Asp Glu Tyr Ala Ile Lys
275 280 285
Lys Ile Ser Ala Phe Glu Gln Ala Tyr Leu Asp Tyr Leu Gly Lys Ser
290 295 300
Leu Glu Leu Cys Gln Ser Phe Tyr Asp Glu Tyr Arg Gly Arg Ala Arg
305 310 315 320
Lys Asp Tyr Ala Ile Ala Ala Gln Lys Ala Thr Val Asn Gln Arg His
325 330 335
Leu Phe Gly Val Ile Met Asn Met Tyr Glu Gly Thr Val Asp Val Asp
340 345 350
Lys Leu Leu Lys Asp Leu Glu Arg Val Phe Leu Lys Tyr Trp Ala Gly
355 360 365
Tyr Val Pro Lys Glu Tyr Glu Lys Glu Ile Glu Ile Ser Glu Glu
370 375 380
<210> 67
<211> 384
<212> PRT
<213> Wild-type Stenotrophomonas phage IME13 ligase protein sequence - 'RNA8'
<400> 67
Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu
1 5 10 15
Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met
20 25 30
Gly Thr Lys Ala Arg Ile Phe Ser Tyr Phe Ile Ala Ser Tyr Thr Asp
35 40 45
Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu
50 55 60
Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys
65 70 75 80
Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr
85 90 95
Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser
100 105 110
Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Ala Ala Ile Phe
115 120 125
Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr
130 135 140
Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe
145 150 155 160
Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu
165 170 175
Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln
180 185 190
Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg
195 200 205
Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu
210 215 220
Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile
225 230 235 240
Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr
245 250 255
Ser Ser Leu His Arg Thr Lys Asp Ser Ile Asn Asn Asn Lys Ala Leu
260 265 270
Phe Gln Ser Ile Lys Glu Arg Ala Ser Asp Asp Leu Arg Gly Met Phe
275 280 285
Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala
290 295 300
Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe
305 310 315 320
Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala
325 330 335
Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln
340 345 350
Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu
355 360 365
Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg
370 375 380
<210> 68
<211> 394
<212> PRT
<213> Wild-type Escherichia phage JSE ligase protein sequence - 'RNA9'
<400> 68
Met Glu His Lys Leu Cys Gln Gln Lys Lys Thr Thr Lys Lys Val Leu
1 5 10 15
Ala Leu Phe Lys Asn Leu Met Ala Leu Cys Asp Gly Ser Asp Thr Phe
20 25 30
Tyr Tyr Lys Asp Glu Ile Thr Ala Met Gln Thr Arg Met Arg Ile Phe
35 40 45
Ser Tyr Leu Tyr Leu Ser Lys Pro Glu Met Trp Asn Lys Pro Asp Ala
50 55 60
Leu Glu Cys Arg Gly Ile Met Phe Glu Ile Asp Asp Lys Asp Arg Pro
65 70 75 80
Val Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Gly Glu
85 90 95
Asn Asp Arg Ala Arg Phe Lys Pro Glu Asp Val Glu Met Val Met Asp
100 105 110
Lys Met Asp Gly Ser Leu Val Ser Thr Tyr Ile Asp Asn Gly Tyr Val
115 120 125
Gln Leu Lys Ser Lys Ala Ala Leu Tyr Ser Ser Gln Ala Glu Arg Ala
130 135 140
Asn Gly Leu Leu Tyr Ser Glu Lys Tyr Ala Asp Leu Arg Ala Lys Ile
145 150 155 160
Ala Asp Ile Gly Ser Asp Tyr Thr Phe Asn Phe Glu Tyr Thr Ala Pro
165 170 175
Ser Asn Arg Ile Val Val Glu Tyr Ser Glu Pro Ser Leu Thr Leu Leu
180 185 190
Asn Val Arg His Asn Val Thr Gly Glu Tyr Val Pro His Gln Met Leu
195 200 205
Phe Ala Asp Ala Ile Leu Arg Pro His Leu Val Asn Ala Leu Gln Val
210 215 220
Asp Ser Ala Arg Phe Ser Asn Ile Leu Asp Glu Val Arg Thr Ala Glu
225 230 235 240
Gly Ile Glu Gly Ile Val Ala Arg Thr Lys Asp Gly Gln Met Phe Lys
245 250 255
Val Lys Ser Glu Trp Tyr Ile Gly Val His Asn Ile Lys Asn Thr Ser
260 265 270
Met Phe Pro Asn Asn Leu Ile Tyr Tyr Val Val Glu Ser Glu Thr Asp
275 280 285
Asp Leu Arg Ala Ala Tyr Glu Gly Glu Pro Glu Ala Leu Glu Arg Ile
290 295 300
Glu Leu Phe Glu Glu Ala Phe Arg Ser Ile Leu Arg Asn Ala Phe Thr
305 310 315 320
Thr Ala Thr Glu Phe Tyr Asn Ala His Ala Gly Glu Asp Arg Lys Thr
325 330 335
Tyr Ala Ser Asn Ala Thr Ile Glu Ser Arg Lys His Gly Asp Ala Gln
340 345 350
Ser Tyr Ile Phe Met Cys Leu Met Ile Ala Phe Asp Gly Leu Asp Tyr
355 360 365
Asp Arg Ile Leu Ala Ser Met Lys Thr Tyr Tyr Leu Arg Asn Tyr Lys
370 375 380
Lys Leu Ile Pro Ala Asp Lys Ile Asp Trp
385 390
<210> 69
<211> 385
<212> PRT
<213> Wild-type Acinetobacter phage Acj61 ligase protein sequence - 'RNA16'
<400> 69
Met Lys Glu Leu Phe Asp Asn Leu Met Ala Leu Gln Asp Pro Asn Asp
1 5 10 15
Ile Ser Lys Phe Phe Tyr Lys Asp Val Val Thr Gln Pro Gly Thr Lys
20 25 30
Cys Arg Ile Phe Ser Tyr Asn Tyr Ala Ala Tyr Ser Asp Trp Leu Leu
35 40 45
Pro Gly Ala Leu Glu Ser Arg Gly Ile Met Phe Glu Leu Asp Ala Asp
50 55 60
Asn Gln Pro Val Arg Val Met Ala Arg Pro Met Glu Lys Phe Phe Asn
65 70 75 80
Leu Glu Glu Asn Pro Phe Thr Met Asp Leu Asp Leu Ser Gln Leu Glu
85 90 95
Tyr Ala Met Thr Lys Ala Asp Gly Ser Leu Ile Ser Thr Tyr Val Asp
100 105 110
Gln Gly Tyr Leu Tyr Thr Lys Ser Lys Gly Ser Ile Ser Ser Ser Gln
115 120 125
Ala Ile Glu Ser Lys Gln Leu Leu Leu Asp Ile Asn Tyr Lys Pro Leu
130 135 140
Ala Glu Arg Ala Leu Glu Leu Ala Lys Asp Gly Phe Thr Cys Asn Phe
145 150 155 160
Glu Tyr Val Ala Pro Asn Asn Arg Ile Val Leu Asn Tyr Ala Lys Lys
165 170 175
Asp Leu Ile Leu Leu Asn Val Arg His Asn Glu Thr Gly Glu Tyr Val
180 185 190
Pro Met Ala Glu Leu Gln Lys Asp Pro Val Leu Arg Asn Tyr Leu Ile
195 200 205
Asp Val Tyr Pro Pro Arg Glu Asp Ile Asp Thr Asn Glu Met Ile Lys
210 215 220
Glu Ile Arg Glu Met Val Asp Ile Glu Gly Phe Val Phe Gln His Ala
225 230 235 240
Ser Gly Leu Lys Phe Lys Leu Lys Thr Glu Trp Tyr Ser Asn Leu His
245 250 255
Arg Val Lys Asp Thr Leu Asn Asn Ser Glu Ala Leu Phe Met Val Val
260 265 270
Val Ala Gly Gly Ser Asp Asp Met Lys Ser Leu Phe Thr Asp Asp Leu
275 280 285
Ser Arg Thr Lys Ile Glu Ser Phe Glu Thr Ala Phe Leu Asp Tyr Leu
290 295 300
Lys Lys Thr Ser Asn Phe Val Phe Asp Leu Gln Arg Gln Leu Ile Gly
305 310 315 320
Ser Asp Arg Lys Thr Tyr Ala Ile Glu Cys Gln Thr Ile Leu Arg Asn
325 330 335
Thr Asp Gln Leu Glu Leu Phe Gly Val Met Met Glu Leu Tyr Lys Gly
340 345 350
Ala Asp Gln Glu Gln Thr Ile Lys Asn Ile Asn Val Val Phe Met Lys
355 360 365
Asn Tyr Lys Lys Tyr Val Pro Ala Gly Phe Glu Thr Leu Lys Asn Glu
370 375 380
Tyr
385
<210> 70
<211> 381
<212> PRT
<213> Wild-type Vibrio phage VH7D ligase protein sequence - 'RNA20'
<400> 70
Met Asn Val Gln Glu Leu Tyr Lys Asn Leu Met Ser Leu Ala Asp Asp
1 5 10 15
Ala Glu Gly Lys Phe Phe Phe Ala Asp His Leu Ser Pro Leu Gly Glu
20 25 30
Lys Phe Arg Val Phe Ser Tyr His Ile Ala Ser Tyr Ser Asp Trp Leu
35 40 45
Leu Pro Gly Ala Leu Glu Ala Arg Gly Ile Met Phe Gln Leu Asp Asp
50 55 60
Asn Asp Glu Met Ile Arg Ile Val Ser Arg Pro Met Glu Lys Phe Phe
65 70 75 80
Asn Leu Asn Glu Asn Pro Phe Thr Met Glu Leu Asp Leu Thr Thr Thr
85 90 95
Val Gln Leu Met Asp Lys Ala Asp Gly Ser Leu Ile Ser Thr Tyr Leu
100 105 110
Ser Gly Glu Asn Phe Ala Leu Lys Ser Lys Thr Ser Ile Phe Ser Glu
115 120 125
Gln Ala Val Ala Ala Asn Arg Tyr Ile Lys Lys Pro Glu Asn Arg Asp
130 135 140
Leu Trp Glu Phe Cys Asp Asp Cys Thr Gln Ala Gly Leu Thr Val Asn
145 150 155 160
Met Glu Trp Cys Ala Pro Asn Asn Arg Ile Val Leu Glu Tyr Pro Glu
165 170 175
Ala Lys Leu Val Ile Leu Asn Ile Arg Asp Asn Glu Thr Gly Asp Tyr
180 185 190
Val Ser Phe Asp Asp Ile Pro Gln Ser Ala Leu Met Arg Val Lys Gln
195 200 205
Trp Leu Val Asp Glu Tyr Asp Pro Ala Thr Ala His Glu Pro Asp Phe
210 215 220
Val Glu Lys Leu Arg Asp Thr Lys Gly Ile Glu Gly Met Ile Leu Arg
225 230 235 240
Leu Ala Asn Gly Gln Ser Val Lys Ile Lys Thr Gln Trp Tyr Val Asp
245 250 255
Leu His Ser Gln Lys Asp Ser Val Asn Val Pro Lys Lys Leu Val Thr
260 265 270
Thr Ile Leu Asn Gly Asn His Asp Asp Leu Tyr Ala Leu Phe Ala Asp
275 280 285
Asp Lys Pro Thr Ile Glu Arg Ile Arg Glu Phe Asp Ser His Val Thr
290 295 300
Lys Thr Leu Thr Asn Ser Phe Asn Ala Val Arg Gln Phe Tyr Ala Arg
305 310 315 320
Asn Arg His Leu Ala Arg Lys Asp Tyr Ala Ile Ala Gly Gln Lys Val
325 330 335
Leu Lys Pro Trp Glu Phe Gly Val Ala Met Ile Ala Tyr Gln Lys Gln
340 345 350
Thr Val Glu Gly Val Tyr Glu Ser Leu Val Thr Ala Tyr Leu Lys Arg
355 360 365
Pro Glu Leu Ala Ile Pro Glu Lys Tyr Leu Asn Gly Val
370 375 380
<210> 71
<211> 382
<212> PRT
<213> Wild-type Escherichia phage JS98 ligase protein sequence - 'RNA22'
<400> 71
Met Ile Glu Leu Tyr Asp Asn Leu Met Thr Leu Val Lys Asn Ser Thr
1 5 10 15
Lys Ser Lys Phe Phe Phe Lys Asp Phe Gln Ser Ala Leu Gly Val Asn
20 25 30
Tyr Arg Ile Phe Ser Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Glu
35 40 45
Asp Gly Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Glu Asn
50 55 60
Gly Pro Val Arg Ile Ala Ala Arg Pro Met Gln Lys Phe Phe Asn Leu
65 70 75 80
Asp Glu Asn Pro Leu Thr Ile Gly Leu Asp Leu Ser Gln Glu Asn Ile
85 90 95
Asp Leu Val Met Ala Lys Glu Asp Gly Ser Leu Ile Ser Thr Phe Met
100 105 110
Asp Arg Gln Tyr Leu Ser Val Lys Ser Lys Gly Ser Ile His Ser Ser
115 120 125
Met Val His Asp Ser Leu Arg Phe Leu Arg Leu Pro Glu Asn Glu Ala
130 135 140
Phe Ala Ala Arg Leu Glu Glu Ile Thr Lys Ala Gly Tyr Thr Cys Asn
145 150 155 160
Leu Glu Tyr Val Ser Pro Thr Asn Arg Ile Val Leu Ala Tyr Gln Glu
165 170 175
Thr Asn Leu Ile Leu Leu Asn Val Arg Asn Asn Glu Thr Gly Glu Tyr
180 185 190
Ile Pro Tyr Ala Glu Leu Phe Lys Asp Gly Ala Leu Arg Lys His Leu
195 200 205
Val Lys Ser Tyr Glu Leu Ser Glu Gly Asp Phe Val Asp Asn Ile Arg
210 215 220
Lys Gln Glu Gly Ile Glu Gly Phe Ile Phe Val Leu Lys Asp Gly Thr
225 230 235 240
Phe Phe Lys Leu Lys Thr Ala Trp Tyr Ser Ala Leu His His Thr Lys
245 250 255
Asp Ser Ile Asn Asn Asn Glu Arg Leu Phe Glu Val Val Val Ala Gly
260 265 270
Gly Thr Asp Asp Leu Arg Gly Leu Phe Ser Thr Asp Ser Phe Ala Ile
275 280 285
Glu Lys Ile Asn Ala Phe Glu Arg Ile His Leu Asp Tyr Leu Glu Gln
290 295 300
Ser Leu Ala Leu Leu Glu Ala Ala Tyr Ser Gln Leu Lys Gly Arg Asp
305 310 315 320
Arg Lys Asp Tyr Ala Val Thr Gly Gln Leu Ile Leu Lys Asp Phe Pro
325 330 335
Gly Leu Phe Ser Ile Leu Met Gln Ala Tyr Val Asp Gly Ile Asn Tyr
340 345 350
Asp Thr Val Met Asp Gln Ile Asn Ser Val Phe Leu Lys Asn His Lys
355 360 365
Ala Gln Ile Pro Glu Lys Tyr Leu Lys Glu Ile Val Val Glu
370 375 380
<210> 72
<211> 386
<212> PRT
<213> Wild-type Escherichia phage vB_EcoM_112 ligase protein sequence - 'RNA23'
<400> 72
Met Val Leu Tyr Ser Lys His Lys Arg Gly Tyr Thr Met Gln Glu Leu
1 5 10 15
Phe Asn Asn Leu Met Glu Leu Cys Lys Asp Ser Gln Arg Lys Phe Phe
20 25 30
Tyr Ser Asp Asp Val Ser Ala Ser Gly Arg Thr Tyr Arg Ile Phe Ser
35 40 45
Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Leu Pro Asp Ala Leu Glu
50 55 60
Cys Arg Gly Ile Met Phe Glu Met Asp Gly Glu Lys Pro Val Arg Ile
65 70 75 80
Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Asn Glu Asn Pro Phe
85 90 95
Thr Met Asn Ile Asp Leu Asn Asp Val Asp Tyr Ile Leu Thr Lys Glu
100 105 110
Asp Gly Ser Leu Val Ser Thr Tyr Leu Asp Gly Asp Glu Ile Leu Phe
115 120 125
Lys Ser Lys Gly Ser Ile Lys Ser Glu Gln Ala Leu Met Ala Asn Gly
130 135 140
Ile Leu Met Asn Ile Asn His His Gln Leu Arg Asp Arg Leu Lys Glu
145 150 155 160
Leu Ala Glu Asp Gly Phe Thr Ala Asn Phe Glu Phe Val Ala Pro Thr
165 170 175
Asn Arg Ile Val Leu Ala Tyr Gln Glu Met Lys Ile Ile Leu Leu Asn
180 185 190
Val Arg Glu Asn Glu Thr Gly Glu Tyr Ile Ser Tyr Asp Asp Ile Tyr
195 200 205
Lys Asp Ala Ile Leu Arg Pro Tyr Leu Val Glu Arg Tyr Glu Ile Asp
210 215 220
Ser Pro Lys Trp Val Glu Glu Ala Lys Asn Ala Glu Asn Ile Glu Gly
225 230 235 240
Tyr Val Ala Val Met Lys Asp Gly Ser His Phe Lys Ile Lys Ser Asp
245 250 255
Trp Tyr Val Ser Leu His Ser Thr Lys Ser Ser Leu Asp Asn Pro Glu
260 265 270
Lys Leu Phe Lys Thr Ile Ile Asp Gly Ala Ser Asp Asp Leu Lys Ala
275 280 285
Met Tyr Ala Asp Asp Glu Tyr Ser Tyr Arg Lys Ile Glu Ala Phe Glu
290 295 300
Thr Thr Tyr Leu Lys Tyr Leu Asp Arg Ala Leu Phe Leu Val Leu Asp
305 310 315 320
Cys His Asn Lys His Cys Gly Lys Asp Arg Lys Thr Tyr Ala Met Glu
325 330 335
Ala Gln Gly Val Ala Lys Gly Ala Gly Met Asp His Leu Phe Gly Ile
340 345 350
Ile Met Ser Leu Tyr Gln Gly Tyr Asp Ser Gln Glu Lys Val Met Cys
355 360 365
Glu Ile Glu Gln Asn Phe Leu Lys Asn Tyr Lys Lys Phe Ile Pro Glu
370 375 380
Gly Tyr
385
<210> 73
<211> 392
<212> PRT
<213> Wild-type Aeromonas phage CC2 ligase protein sequence - 'RNA28'
<400> 73
Met Lys Glu Leu Tyr Asn Asn Leu Leu Lys Leu Thr Glu Glu His Gly
1 5 10 15
Asp Cys Phe Phe Phe Arg Asp His Trp Ser Ser Ile Gly Asn His Phe
20 25 30
Arg Val Phe Ser Tyr His Ile Ala Gly Leu Thr Gln Trp Met Leu Pro
35 40 45
Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu Ile Asn Gly Glu
50 55 60
Pro Tyr Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Ala
65 70 75 80
Glu Arg Gln Ala Trp Asn Leu Thr Asn Ser Gly Val Val Gly Leu Asp
85 90 95
Lys Leu Glu Leu Asp Tyr Ser Asn Ile Asp Arg Tyr Glu Asp Lys Ala
100 105 110
Asp Gly Ser Leu Met Ser Ser Tyr His Phe Ile Asp Pro Glu Asp Asp
115 120 125
Asn Arg Ile Asn Tyr Met Leu Lys Ser Lys Thr Ser Ile Asn Ser Asp
130 135 140
Gln Ala Asn Asp Ala Asn Arg Trp Leu Val Asn His Thr Asp Leu Leu
145 150 155 160
Asp Phe Ile Ile Asp Cys Glu Glu Ala Gly Tyr Thr Val Asn Leu Glu
165 170 175
Trp Cys Ser Pro Lys Asn Gln Ile Val Ile Met Tyr Pro Glu Glu Ser
180 185 190
Leu Lys Ile Leu Asn Val Arg His Arg Asp Thr Gly Glu Tyr Tyr Ser
195 200 205
Asn Asn Ser Leu Ile Arg Ser Pro Val Phe Arg Lys Tyr Ala Val Asp
210 215 220
Gln Phe Met Phe Glu Glu Gly Thr Asp Val Asn Thr Ala Ile Ser Asn
225 230 235 240
Met Tyr Asn Glu Thr Gly Ile Glu Gly Tyr Ile Leu Val Met Arg Asp
245 250 255
Gly Ser Arg Val Lys Ile Lys Thr Thr Ser Tyr Val Ala Arg His Lys
260 265 270
Leu Lys Asp Ser Ile Thr Asn Asn Lys Asp Leu Val Ile Ala Val Ala
275 280 285
Gln Gly Val Ser Asp Asp Leu Arg Gln Leu Phe Leu Asp Asp Ser Leu
290 295 300
Ser Leu Thr Lys Ile Gln Glu Phe Glu Asp His Val Val Ser Val Ala
305 310 315 320
Gly Ser Thr Tyr Thr Lys Ile Arg Glu Ala His Lys Ala Cys Ala Gly
325 330 335
Met Glu Arg Arg Glu Tyr Ala Ile Ser Met Gln Asn Thr Phe Lys Gln
340 345 350
Asp Arg Met Phe Phe Asn Ile Val Met Lys Met Phe Gln Ala Pro Asp
355 360 365
Leu Glu Val Met Pro Glu Ile Met Ser Val Ile Ile Lys Tyr Pro Asp
370 375 380
Glu Phe Val Pro Thr Lys Trp Lys
385 390
<210> 74
<211> 374
<212> PRT
<213> Wild-type Enterobacteria phage RB69 ligase protein sequence - 'RNA29'
<400> 74
Met Glu Lys Leu Tyr Tyr Asn Leu Leu Ser Leu Cys Lys Ser Ser Ser
1 5 10 15
Asp Arg Lys Phe Phe Tyr Ser Asp Asp Val Ser Pro Ile Gly Lys Lys
20 25 30
Tyr Arg Ile Phe Ser Tyr Asn Phe Ala Ser Tyr Ser Asp Trp Leu Leu
35 40 45
Pro Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Gly Glu
50 55 60
Thr Pro Leu Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu
65 70 75 80
Asn Glu Asn Pro Phe Thr Leu Ser Ile Asp Leu Asn Asp Val Lys Tyr
85 90 95
Leu Met Thr Lys Glu Asp Gly Ser Leu Val Ser Thr Tyr Leu Asp Gly
100 105 110
Asn Met Val Arg Phe Lys Ser Lys Gly Ser Ile Lys Ser Asp Gln Ala
115 120 125
Ala Ser Ala Thr Ser Ile Leu Leu Asp Ile Asn His Lys Asp Leu Ala
130 135 140
Asp Arg Leu Leu Glu Leu Cys Asn Asp Gly Phe Thr Ala Asn Phe Glu
145 150 155 160
Tyr Val Ala Pro Ser Asn Lys Ile Val Leu Thr Tyr Pro Glu Lys Arg
165 170 175
Leu Ile Leu Leu Asn Ile Arg Asp Asn Asn Thr Gly Lys Tyr Ile Glu
180 185 190
Tyr Asp Asp Ile Tyr Leu Asp Pro Val Phe Arg Lys Tyr Leu Val Asp
195 200 205
Arg Phe Glu Ala Pro Glu Gly Asp Trp Val Pro Gly Val Lys Ser Ser
210 215 220
Thr Asn Ile Glu Gly Tyr Val Ala Val Met Lys Asp Gly Ser His Phe
225 230 235 240
Lys Leu Lys Thr Asp Trp Tyr Val Ala Leu His Thr Thr Arg Asp Ser
245 250 255
Ile Ser Ser Pro Glu Lys Leu Phe Leu Ala Ile Met Asn Gly Ala Ser
260 265 270
Asp Asp Leu Lys Ala Met Tyr Ala Asp Asp Glu Phe Ser Phe Lys Lys
275 280 285
Val Glu Leu Phe Glu Lys Ala Tyr Leu Asp Phe Leu Asp Arg Ser Phe
290 295 300
Tyr Ile Cys Leu Asp Ala Tyr Asp Lys His Lys Gly Lys Asp Arg Lys
305 310 315 320
Thr Tyr Ala Ile Glu Ala Gln Ala Ile Cys Lys Gly Ala Gln Ser Pro
325 330 335
Trp Leu Phe Gly Ile Ile Met Asn Leu Tyr Gln Gly Gly Ser Lys Glu
340 345 350
Gln Met Met Thr Ala Leu Glu Ser Val Phe Ile Lys Asn His Lys Asn
355 360 365
Phe Ile Pro Glu Gly Tyr
370
<210> 75
<211> 388
<212> PRT
<213> Wild-type Acinetobacter phage Ac42 ligase protein sequence - 'RNA31
<400> 75
Met Asn Glu Leu Tyr Asn Asn Leu Met Thr Leu Ile Glu Pro Gly Lys
1 5 10 15
Met Ser Arg Phe Phe Leu Arg Asp Ala Val Thr Pro Phe Gly Thr Arg
20 25 30
Val Arg Met Phe Gly Tyr Asn Tyr Ala Ser Tyr Thr Asp Trp Leu Leu
35 40 45
Pro Asp Ala Leu Glu Ala Arg Gly Ile Met Phe Glu Met Asp Glu Asn
50 55 60
Asp Gln Pro Ile Arg Val Met Ala Arg Pro Met Glu Lys Phe Phe Asn
65 70 75 80
Leu Gly Glu Asn Pro Phe Thr Ile Asp Leu Asp Leu Ser Thr Ile Glu
85 90 95
Tyr Phe Met Asp Lys Ser Asp Gly Ser Leu Ile Ser Ser Tyr Val Asp
100 105 110
Asn Asp Thr Leu Phe Met Lys Ser Lys Met Ser Ile Gly Ser Val Gln
115 120 125
Ala Val Ala Ala Arg Gln Val Ile Gln Asp Tyr Val His Arg Asp Leu
130 135 140
His Asp Arg Val Leu Glu Leu Ala Lys Asp Gly Phe Thr Cys Asn Phe
145 150 155 160
Glu Tyr Val Ala Pro Asp Asn Arg Val Val Ile Leu Tyr Pro Glu Arg
165 170 175
Ala Leu Val Leu Leu Asn Val Arg Asn Asn Glu Thr Gly Glu Tyr Val
180 185 190
His Ile Glu Glu Leu Lys Arg Asp Pro Val Leu Arg Arg Tyr Leu Val
195 200 205
Asn Asn Tyr Val Ile Asp Pro Glu Asn Phe Asp Gln Asp Thr Phe Val
210 215 220
Asn Asp Ile Tyr Gln Met Val Asp Ile Glu Gly Tyr Val Phe Arg Leu
225 230 235 240
Met Thr Gly Gln His Val Lys Ile Lys Thr Glu Trp Tyr Lys Met Leu
245 250 255
His Tyr Ala Lys Asp Thr Ile Asn Asn Asn Glu Ala Leu Phe Ala Ile
260 265 270
Thr Val Ala Ala Gln Leu Asp Asp Val Arg Ser Leu Tyr Ser Asp Asp
275 280 285
Tyr Ala Leu Gly Lys Ile Asn Lys Phe Glu Glu Val Phe Leu Gly Phe
290 295 300
Leu Asp Thr Arg Leu Pro Ile Leu Leu Asn Leu His Lys Glu Leu Asn
305 310 315 320
Gly Ser Ser Arg Lys Asp Tyr Ala Ile Lys Ser Gln Thr Tyr Phe Lys
325 330 335
Gln Ala Asn Glu Leu Tyr Leu Phe Gly Ile Phe Met Gln Met Phe Glu
340 345 350
Gly Val Pro Pro Arg Glu Gln Leu Val Glu Lys Leu Ser Glu Ala Phe
355 360 365
Met Lys Asn Tyr Lys Leu Phe Val Pro Pro Glu Tyr Asp Lys Val Val
370 375 380
Glu Tyr Asp Asn
385
<210> 76
<211> 382
<212> PRT
<213> Wild-type Pectobacterium phage CBB ligase protein sequence - 'RNA33'
<400> 76
Met Arg Thr Lys Gln Ile Phe Asp Asp Leu Met Asn Leu Thr Ala Lys
1 5 10 15
Asn Asp Ala Phe Met Trp Lys Asp Phe Val Ser Pro Ala Gly Gly Leu
20 25 30
Phe Arg Ile Phe Ser Tyr Arg Leu Ala Ser Tyr Ser Asp Phe Leu Glu
35 40 45
Pro Asn Ala Leu Glu Cys Arg Gly Ser Met Phe Lys Val Asp Asp Glu
50 55 60
Gly Asn Phe Val Gly Ile Ala Ser Arg Thr Pro Met Lys Phe Phe Asn
65 70 75 80
Ala Tyr Glu Asn Pro Phe Thr Met Tyr Asp Lys Asp Thr Leu Ser Ser
85 90 95
Glu Ile Ala Val Val Met Asp Lys Leu Asp Gly Ser Ile Ile Ser Thr
100 105 110
Phe Met Asp Val Asp Phe Val Val Arg Thr Lys Ser His Ala Ser Leu
115 120 125
His Ser Asp His Ala Tyr Asn Ser Thr Ala Met Leu Ile Ala Asp Lys
130 135 140
Glu Leu Tyr Asn Glu Val His Tyr Ala Glu Ser Met Gly Tyr Thr Val
145 150 155 160
Asn Met Glu Tyr Thr Ser Pro Glu Tyr Arg Ile Val Leu Pro Tyr Gln
165 170 175
Glu Asp Asn Leu Thr Val Leu Asn Leu Arg His Arg Glu Thr Gly Glu
180 185 190
Leu Leu Ile Gly Glu Arg Leu Lys Glu Phe Ser Lys Ile Leu Tyr Glu
195 200 205
Arg Ser Val Phe Ala Lys His Gly Glu Ile Asp Ala Thr Phe Pro Met
210 215 220
Lys Glu Thr Leu Lys Glu Ser Ile Asp Ala Val Arg Gly Met Ala Asp
225 230 235 240
Ile Glu Gly Tyr Val Leu Ile Leu Lys Asp Gly Arg Met Cys Lys Ile
245 250 255
Lys Thr Asp Trp Tyr Cys Ala Leu His Phe Thr Lys Asp Ser Ile Asn
260 265 270
Val Asp Ser Arg Leu Tyr Asp Ala Ile Ile Thr Gly Ala Ser Asp Asp
275 280 285
Leu Lys Gln Met Phe Ser Thr Asp Leu Tyr Ala Met Lys Lys Ile Glu
290 295 300
Lys Met Glu Gln Leu Ile Phe Ser Cys Tyr Asn Lys Leu Val His Asp
305 310 315 320
Val Glu Ser Phe Tyr Glu Glu Asn Lys His Leu Glu Arg Lys Glu Tyr
325 330 335
Ala Leu Lys Val Gln Ser Thr Leu Pro Asn Glu Leu Gly Met Pro Gly
340 345 350
Leu Ala Phe Ser Leu Tyr Ala Ser Lys Pro Val Asp Tyr Lys Gly Gln
355 360 365
Met Leu Lys Tyr Met Lys Asp Val Leu Val Asn Phe Glu Val
370 375 380
<210> 77
<211> 385
<212> PRT
<213> Wild-type Aeromonas phage phiAS5 ligase protein sequence - 'RNA35
<400> 77
Met Gln Ser Ile Lys Glu Leu Tyr Gln Asn Leu Val Asn Leu Cys Val
1 5 10 15
Asp Asp Asn Thr Lys Phe Phe Phe Ser Glu Thr Val Thr Ser Leu Gly
20 25 30
Thr Lys Val Arg Ile Phe Asp Tyr His Val Ala Gly Tyr Asn Asp Trp
35 40 45
Ile Arg Pro Asp Ala Met Ala Cys Arg Gly Ile Met Phe Glu Met Asn
50 55 60
Gly Glu Ile Pro Val Arg Ile Met Ser Arg Pro Met Asp Lys Phe Phe
65 70 75 80
Asn Tyr Ser Glu Val Ile Gly Trp Glu Lys Leu Glu Thr His Gly Asn
85 90 95
Met Lys Met Pro Asp Leu Ser Lys Ile Lys Phe Val Ile Asp Lys Arg
100 105 110
Asp Gly Ser Leu Ile Ser Thr Phe Met Asp Val Asp Asn Leu Leu Leu
115 120 125
Lys Ser Lys Gly Ser Ile Arg Ser Asn Gln Ala Asn Asp Ala Ser Val
130 135 140
Trp Leu Tyr Gln Asp Asp Gln Ala Asp Leu Leu Glu Phe Cys Arg Ala
145 150 155 160
Tyr Ala Lys Glu Gly Phe Thr Val Asn Met Glu Trp Thr Ala Pro His
165 170 175
Asn Gln Ile Val Leu Cys Tyr Thr Asp His Gln Leu Arg Ile Leu Asn
180 185 190
Ile Arg His Asn Glu Thr Gly Glu Tyr Val Asp Phe Ala Glu Leu Gln
195 200 205
Lys Asp Ser Val Phe Arg Lys Tyr Ala Ala Asp Phe Tyr Glu Val Pro
210 215 220
Gln Asp Gly Ala Glu Trp Ile Lys Asn Val Tyr Gly Met Thr Gly Ile
225 230 235 240
Glu Gly Tyr Val Val Val Met Glu Asp Tyr Gln Met Phe Lys Leu Lys
245 250 255
Thr Asp Trp Tyr Val Ala Leu His His Thr Lys Asp Ser Ile Asn Asp
260 265 270
Ser Lys Arg Leu Ile Ser Ala Cys Ala Glu Asn Ala Thr Asp Asp Leu
275 280 285
Arg Gln Met Phe Arg Asp Asp Pro Asn Ser Leu Ala Lys Ile Glu Val
290 295 300
Phe Asp Ala Lys Phe Arg Asp Val Val Ser Ser Ala Met Gln Ala Leu
305 310 315 320
Thr Asn Ala Tyr Ser Lys Tyr Lys Ala Leu Glu Arg Arg Glu Tyr Ala
325 330 335
Ile Ser Met Thr Asn Glu Phe Lys Asn Glu Arg His Trp Phe Asn Ile
340 345 350
Ala Met Gln Met Phe Ser Thr Arg Pro Asp Phe Ser Leu Ala Asp Glu
355 360 365
Ile Val Ala Val Ile Lys Lys Tyr Pro Glu Lys Phe Val Pro Gln Gly
370 375 380
Tyr
385
<210> 78
<211> 376
<212> PRT
<213> Wild-type Salmonella phage vB_SenMS16 ligase protein sequence - 'RNA36
<400> 78
Met Lys Glu Leu Phe Asp Asn Leu Met Asn Leu Cys Asn Asp Thr Asp
1 5 10 15
Glu Ser Arg Phe Phe Tyr Arg Asp Asp Ile Ser Pro Ser Gly Leu Lys
20 25 30
Tyr Arg Ile Phe Ser Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Leu
35 40 45
Pro Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Ile Asp Gly
50 55 60
Val Pro Val Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu
65 70 75 80
Asn Glu Thr Pro Phe Thr Met Asn Leu Asp Leu Ser Asn Ala Val His
85 90 95
Met Met Lys Lys Glu Asp Gly Ser Leu Val Ser Ser Tyr Leu Asp Gly
100 105 110
Asn Ile Leu Arg Phe Lys Ser Lys Ser Ser Leu Lys Ser Glu Gln Ala
115 120 125
Tyr Leu Ser Ser Ala Met Leu Thr Ser Ile Thr His Glu Ala Leu Leu
130 135 140
Trp Arg Leu Leu Glu Leu Ala Arg Asp Gly Phe Thr Ala Asn Phe Glu
145 150 155 160
Tyr Val Ser Pro Glu Asn Arg Ile Val Leu Ala Tyr Gln Lys Lys Asp
165 170 175
Leu Ile Leu Leu Asn Ile Arg Glu Asn Asp Thr Gly Ala Tyr Val Pro
180 185 190
Tyr Asn Glu Ile Ala Lys Asp Pro Val Leu Arg Gln Tyr Leu Val Glu
195 200 205
Ser Tyr Glu Ile Pro Glu Gly Asp Phe Val Ser Asp Ile Lys Ala Met
210 215 220
Glu Gly Ile Glu Gly Tyr Val Phe Val Met Asp Asn Gly Leu Arg Phe
225 230 235 240
Lys Leu Lys Thr Asp Trp Tyr Thr Ala Leu His His Thr Lys Asp Ser
245 250 255
Ile Thr Lys Asn Asp Arg Leu Phe Glu Val Ile Val Asn Asn Ala Ser
260 265 270
Asp Asp Leu Lys Gly Leu Phe Ser Asn Asp Ala Tyr Ser Leu Lys Lys
275 280 285
Ile Asn Lys Phe Glu Glu Val Tyr Leu Asp Tyr Leu Arg Arg Ser Leu
290 295 300
Ser Phe Ile Ser Thr Ser Tyr Gln Lys Leu Arg Gly Leu Asp Arg Lys
305 310 315 320
Thr Tyr Ala Gly Glu Ala Lys Arg Leu Ala Asp Ala Glu Arg Leu Pro
325 330 335
Phe Leu Phe Thr Ile Leu Met Leu Met Phe Asn Asp Ser Met Asp Tyr
340 345 350
Asp Thr Thr Ile Lys Lys Val Asn Glu Leu Phe Met Lys Asn Tyr Lys
355 360 365
Thr Phe Ile Pro Lys Glu Tyr Glu
370 375
<210> 79
<211> 381
<212> PRT
<213> Wild-type Vibrio phage KVP40 ligase protein sequence - 'RNA39'
<400> 79
Met Thr Thr Gln Glu Leu Tyr Asn His Leu Met Thr Leu Thr Glu Asp
1 5 10 15
Ala Glu Gly Lys Phe Phe Phe Ala Asp His Ile Ser Pro Leu Gly Glu
20 25 30
Lys Leu Arg Val Phe Ser Tyr His Ile Ala Ser Tyr Ser Asp Trp Leu
35 40 45
Leu Pro Gly Ala Leu Glu Ala Arg Gly Ile Met Phe Gln Leu Asp Glu
50 55 60
Gln Asp Lys Met Val Arg Ile Val Ser Arg Pro Met Glu Lys Phe Phe
65 70 75 80
Asn Leu Asn Glu Asn Pro Phe Thr Met Asp Leu Asp Leu Thr Thr Thr
85 90 95
Val Gln Leu Met Asp Lys Ala Asp Gly Ser Leu Ile Ser Thr Tyr Leu
100 105 110
Thr Gly Glu Asn Phe Ala Leu Lys Ser Lys Thr Ser Ile Phe Ser Glu
115 120 125
Gln Ala Val Ala Ala Asn Arg Tyr Ile Lys Leu Pro Glu Asn Arg Asp
130 135 140
Leu Trp Glu Phe Cys Asp Asp Leu Thr Gln Ala Gly Cys Thr Val Asn
145 150 155 160
Met Glu Trp Cys Ala Pro Asn Asn Arg Ile Val Leu Glu Tyr Pro Glu
165 170 175
Ala Lys Leu Val Ile Leu Asn Ile Arg Asp Asn Glu Thr Gly Asp Tyr
180 185 190
Val Ser Phe Asp Asp Ile Pro Leu Pro Ala Leu Met Arg Val Lys Lys
195 200 205
Trp Leu Val Asp Glu Tyr Asp Pro Glu Thr Ala His Val Asp Asp Phe
210 215 220
Val Glu Lys Leu Arg Ala Thr Lys Gly Ile Glu Gly Met Ile Leu Arg
225 230 235 240
Leu Ala Asn Gly Gln Ser Val Lys Ile Lys Thr Gln Trp Tyr Val Asp
245 250 255
Leu His Ser Gln Lys Asp Ser Val Asn Val Pro Lys Lys Leu Val Thr
260 265 270
Thr Ile Leu Asn Asn Asn His Asp Asp Leu Tyr Ala Leu Phe Ala Asp
275 280 285
Asp Lys Pro Thr Ile Asp Arg Ile Arg Glu Phe Asp Ser His Val Ser
290 295 300
Lys Thr Val Ser Ala Ser Phe His Ala Val Ser Gln Phe Tyr Val Lys
305 310 315 320
Asn Arg His Met Ser Arg Lys Asp Tyr Ala Ile Ala Gly Gln Lys Ala
325 330 335
Leu Lys Pro Trp Glu Phe Gly Val Ala Met Ile Ala Tyr Gln Lys Lys
340 345 350
Thr Val Glu Gly Val Tyr Glu Ala Leu Val Gly Ala Tyr Leu Lys Arg
355 360 365
Pro Glu Leu Leu Ile Pro Glu Lys Tyr Leu Asn Glu Ala
370 375 380
<210> 80
<211> 361
<212> PRT
<213> Wild-type Campylobacter virus CP220 ligase protein sequence - 'RNA49'
<400> 80
Met Asn Tyr Leu Glu Leu Lys Asn Met Ala Glu Asn Leu Lys Asp Ser
1 5 10 15
Asn Tyr Arg Ser Thr Lys Leu Asn Asn Phe Lys Phe Tyr Thr Tyr Ile
20 25 30
Phe Ser Asp Tyr Lys Asn Phe Lys Glu Asn Asn Thr Phe Phe Ile Arg
35 40 45
Gly Leu Met Ile Asp Ser Lys Ser Ile Leu Asn Lys Asp Thr Leu Ala
50 55 60
Pro Gly Ile Ser Ile Pro Met Pro Lys Phe Phe Asn Ile Asn Glu Asn
65 70 75 80
Glu Asp Trp Leu Leu Pro Asp Ser Thr Asn Leu Glu Asp Phe Thr Ile
85 90 95
Val Thr Lys Tyr Asp Gly Ser Leu Met Ile Pro Tyr Glu Tyr Asp Gly
100 105 110
Ile Lys Phe Arg Thr Lys Met Ser Ile Asp Asn Asp Gln Thr Lys Leu
115 120 125
Ala Asn Lys Tyr Ile Lys Asn Asn Pro Asp Ile Leu Asp Leu Ile Lys
130 135 140
Asn Asn Pro Asp Thr Gln Tyr Phe Phe Glu Leu Ile Ser Pro Leu Asn
145 150 155 160
Arg Ile Val Val Asp Tyr Asn Lys Thr Glu Leu Lys Leu Ile Ala Glu
165 170 175
Leu Asp Leu Arg Thr Leu Glu Phe Lys Ile His Glu Thr Asn Glu Phe
180 185 190
Asn Phe Lys Asp Leu Asn Ile Lys Thr Leu Lys Asp Leu Lys Asp Tyr
195 200 205
Ile Asn Thr Ile Ser Asn Tyr Glu Gly Val Ile Leu Gln His Lys Val
210 215 220
Thr Lys Lys Val Tyr Lys Leu Lys Thr Gln Glu Tyr Leu Asp Leu His
225 230 235 240
Asn Thr Met Thr Asn Leu Asp Leu Lys Val Ile Tyr Lys Met Ile Leu
245 250 255
Glu Glu Thr Ile Asp Asp Val Leu Pro Lys Leu Ser Pro Glu Ala Val
260 265 270
Ala Tyr Ile Asp Ser Val Ser Asn Ser Val Lys Val Lys Leu Asn Glu
275 280 285
Ile Leu Asp Ser Ile Asp Ser Asn Tyr Ile Lys Thr Lys Asp Leu Glu
290 295 300
Thr Pro Ala Leu Tyr Ile Lys Asp Leu Asn Ile Asp Pro Ile Ala Lys
305 310 315 320
Asp Cys Leu Phe Lys Leu Cys Lys Asn Lys Leu Asn Leu Asp Asp Val
325 330 335
Leu Asn Gln Val Lys Lys Ser Met Leu Lys Tyr Asn Lys Leu Arg Asp
340 345 350
Ile Lys Val Phe Leu Lys Trp Ile His
355 360
<210> 81
<211> 380
<212> PRT
<213> Wild-type Pseudomonas phage phiPMW ligase protein sequence - 'RNA59'
<400> 81
Met Lys Val Ile Glu Phe Leu Lys Asn Ala Pro Ser Ile Thr Asp Gly
1 5 10 15
Leu Ala Ser Leu His Leu Glu Leu Gly Ile Lys Ala Lys Ile Tyr Glu
20 25 30
Asp Glu Gly Leu Ile Val Leu Asn Tyr Ser Gln Ile Asp Ser Pro Lys
35 40 45
Thr His Pro Ile Val Gln Glu Cys Arg Gly Leu Ile Ile Asp Asn Asp
50 55 60
Leu Thr Val Val Ala Arg Pro Phe Asp Arg Phe Phe Asn Tyr Gly Glu
65 70 75 80
Ala Leu Asn Val Met Pro Glu Ile Asp Trp Glu Asn Ala Ser Ile Phe
85 90 95
Glu Lys Val Asp Gly Ser Leu Ile Lys Ile Tyr Phe His Lys Gly Arg
100 105 110
Trp Glu Val Ala Thr Arg Gly Thr Ala Phe Ala Glu Ser Glu Cys Met
115 120 125
Gly His Gly Ile Thr Phe Lys Glu Leu Val Phe Asn Ala Leu Lys Val
130 135 140
His Asp Asp Asp Gly Phe Gln Tyr Leu Met Asn Asn Ala Tyr Leu Phe
145 150 155 160
Arg Asp Thr Thr Tyr Leu Phe Glu Leu Thr Cys Val Glu Asn Arg Val
165 170 175
Val Arg His Tyr His Gly Tyr Asn Leu His Phe Leu Ala Ala Arg Asp
180 185 190
Asn Val Ser Gly Asn Tyr Ser Glu Glu Cys Arg Asp Trp Leu Arg Ser
195 200 205
Pro Asp Cys Ile Leu Tyr Gly Ile Val Lys His Pro Lys Arg Tyr Ala
210 215 220
Leu Gly Ser Ala Asp Glu Ala Leu Gln Ala Ala Lys Glu Leu Lys Asn
225 230 235 240
Leu Asp Glu Gly Phe Ile Val Tyr Gln Asn Ala Val Pro Ile Ala Lys
245 250 255
Ile Lys Ser Pro Ala Tyr Val Ala Val His His Ile Arg Gly Glu Gly
260 265 270
Leu Asn Pro Lys Arg Ile Met Glu Leu Val Leu Ser Gly Glu His Asp
275 280 285
Glu Tyr Leu Ser Tyr Phe Pro Glu Asp Arg Pro Ile Ile Gln Pro Tyr
290 295 300
Val Asp Ser Leu Leu Asp Met Leu Asn Ile Ile Ala Val Thr Tyr Pro
305 310 315 320
Arg Leu Asn Gln Ala Thr Thr Pro Lys Ala Phe Ala Ala Ala Ile Lys
325 330 335
His Ala Gly Ile Asp Lys Gln Lys Ala Ser Val Tyr Phe Met Ala Arg
340 345 350
Arg Asp Asn Lys Asp Pro Val Gln Val Phe His Gly Met Lys Thr Thr
355 360 365
Phe Lys Met Asp Met Leu Arg Lys Trp Met Met Val
370 375 380
<210> 82
<211> 317
<212> PRT
<213> Wild-type Pseudomonas phage vB_PaeM_C2-10_Ab1 ligase protein sequence - 'RNA61'
<400> 82
Met Pro Asn Cys Arg Ile Glu Ile Arg Arg Ser Arg Met Glu Gly Asn
1 5 10 15
Leu Asn Ile Ala Met Tyr Lys Asp Leu Ile Ala Asn Lys Leu Val Thr
20 25 30
Val Lys His Phe Asn Gly Met Ser Ile Ile Lys Tyr Ala Arg Lys Val
35 40 45
Phe Tyr Glu Asn Leu Trp Asn Glu His Pro Leu Leu Leu Glu Ala Arg
50 55 60
Gly His Val Phe Asp Gln His Ser Gly Asp Cys Ile Val Arg Pro Phe
65 70 75 80
Glu Lys Val Phe Asn Leu Gly Glu Asn Gly Ala Gly Ser Phe Leu His
85 90 95
Pro Lys Phe Arg Val Arg Leu Ile Glu Lys Val Asn Gly Phe Met Phe
100 105 110
Ser Val Thr Lys His Asn Gly Ser Leu Ile Phe Ser Thr Thr Gly Ser
115 120 125
Leu Thr Ser Asp Tyr Val Ala Leu Gly Gln Lys Tyr Val Ser Asn Asn
130 135 140
Pro Asp Asp Tyr Ile Ala Gly Phe Thr Tyr Asn Phe Glu Ile Cys Ser
145 150 155 160
Pro Asp Asp Pro His Ile Val Glu Glu Glu Glu Gly Ala Tyr Leu Ile
165 170 175
Gly Ile Arg Asp Ile Phe Thr Gly Gly Gln Leu Ser Glu Tyr Ile Leu
180 185 190
Asp Ser His Ala Leu Gly Val Thr Asp His Ser Ser Val Lys Ile Leu
195 200 205
Arg Pro Glu His Ile Glu Cys Ser Trp Glu His Ala Lys Gly Leu Leu
210 215 220
Ser Ser Cys Glu Lys Glu Gly Tyr Met Val Gln Thr Gly Leu Gly Thr
225 230 235 240
Val Lys Cys Lys Ser Thr His Tyr Leu Gly Lys Lys Phe Ile Met Arg
245 250 255
Met Gly Ser Lys Lys Val Asn Ser Met Tyr Gln Asp Pro Ala Gly Phe
260 265 270
Lys Gln Thr Leu Asp Glu Glu Phe Tyr Pro Leu Val Asp Phe Leu Val
275 280 285
Asn Glu Val Glu Glu Val Arg Phe Thr Glu Met Thr Asp Ala Gln Arg
290 295 300
Arg Leu Leu Ile Glu Thr Tyr Phe Asp Met Ala Arg Ile
305 310 315
<210> 83
<211> 368
<212> PRT
<213> Wild-type Butyrivibrio proteoclasticus ligase protein sequence - 'RNA82'
<400> 83
Met Lys Ser Arg Ile Leu Glu Phe Ile Lys Asn Asn Pro Asp Thr Trp
1 5 10 15
Glu Glu Lys Leu Asn Glu Lys Phe Ile Arg Thr Asn His Asn Gly Asp
20 25 30
Leu Val Cys Phe Lys Tyr Ala Thr Glu Ala Asp Phe Ser Asp Pro Leu
35 40 45
Val Cys Glu Ala Arg Gly Ile Ile Ile Asp Val Ala Gln Leu Val Val
50 55 60
Val Cys Trp Pro Phe Asp Lys Phe Phe Asn Val Gln Glu Lys Tyr Ala
65 70 75 80
Ala Asp Ile Asp Trp Asn Ser Ala Arg Val Leu Glu Lys Ile Asp Gly
85 90 95
Ser Met Ile Lys Leu Phe Trp Tyr Lys Gly Ala Trp Arg Phe Ala Thr
100 105 110
Ser Ser Thr Cys Asp Ala Lys Asp Ala Ala Ile Pro Gly Tyr Asn Glu
115 120 125
Leu Thr Tyr Ala Asp Ile Ile Ala Arg Ala Glu Asn Val Asn Glu Ile
130 135 140
Pro Phe Glu Glu Leu Asn Lys Asp Tyr Thr Tyr Ile Phe Glu Leu Val
145 150 155 160
Ser Pro Leu Ser Gln Ile Val Val Arg Tyr Glu Met Thr Glu Leu Phe
165 170 175
Phe Leu Thr Ala Arg Asn Asn Leu Thr Gly Glu Glu Leu Asp Thr Glu
180 185 190
Leu Leu Gln Phe Arg Arg Pro Arg Ser Phe Ala Leu Lys Ser Met Asn
195 200 205
Glu Cys Leu Asp Ala Ala Leu Ala Leu Asn Lys Gly Asp Glu Ile Glu
210 215 220
Asp Glu Gly Phe Val Val Val Asp Glu Lys His Asn Arg Val Lys Ile
225 230 235 240
Lys Ser Pro Ala Tyr Val Ala Met His Arg Leu Ser Thr Asn Lys Val
245 250 255
Phe Thr Val Lys Arg Met Ala Glu Phe Phe Cys Asn Gly Glu Asp Leu
260 265 270
Ser Lys Leu Ala Lys Asp Phe Pro Ala Asn Ala His Ile Ile Lys Tyr
275 280 285
Tyr Asp Trp Gln Phe Ala Glu Met Lys His Lys Ala Glu Asp Met Met
290 295 300
Leu Tyr Ser Arg Arg Leu Tyr Glu Glu Tyr Asp His Asp Arg Lys Ala
305 310 315 320
Val Ala Met Thr Ile Lys Asp Ser Pro Tyr Ala Trp Ala Gly Phe Arg
325 330 335
Ala Ile Gly Asn Asp Lys Asp Ile Thr Asp Ile Met Ala Val Leu Ala
340 345 350
Pro Ala Asn Val Glu Lys Leu Ile Val Glu Tyr Pro Glu Ile Ser Asn
355 360 365
<210> 84
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 15 and 16 primer oligonucleotide sequence
<400> 84
acuccucggu 10
<210> 85
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> Example 15 and 16 product oligonucleotide sequence
<400> 85
acuccucggu a 11
<210> 86
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 17 primer oligonucleotide sequence
<400> 86
actcatcgat 10
<210> 87
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 17 product oligonucleotide sequence
<400> 87
actcatcgat a 11
<210> 88
<211> 384
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein
sequence
<400> 88
Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu
1 5 10 15
Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met
20 25 30
Gly Thr Lys Ala Arg Ile Phe Ser His Lys Ile Ala Ser Tyr Thr Asp
35 40 45
Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu
50 55 60
Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys
65 70 75 80
Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr
85 90 95
Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser
100 105 110
Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Ser Ile Phe
115 120 125
Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr
130 135 140
Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe
145 150 155 160
Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu
165 170 175
Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln
180 185 190
Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg
195 200 205
Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu
210 215 220
Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile
225 230 235 240
Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr
245 250 255
Ser Ser Leu Gly Arg Thr Lys Phe Ser Ile Asn Asn Asn Lys Ala Leu
260 265 270
His Gln Ser Ile Lys Glu Arg Ala Ser Val Ala Leu Arg Gly Met Phe
275 280 285
Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala
290 295 300
Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe
305 310 315 320
Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala
325 330 335
Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln
340 345 350
Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu
355 360 365
Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg
370 375 380
<210> 89
<211> 384
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein
sequence
<400> 89
Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu
1 5 10 15
Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met
20 25 30
Gly Thr Lys Ala Arg Ile Phe Ser His Gln Ile Ala Ser Tyr Thr Asp
35 40 45
Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu
50 55 60
Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys
65 70 75 80
Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr
85 90 95
Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser
100 105 110
Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Ser Ile Phe
115 120 125
Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr
130 135 140
Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe
145 150 155 160
Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu
165 170 175
Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln
180 185 190
Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg
195 200 205
Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu
210 215 220
Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile
225 230 235 240
Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr
245 250 255
Ser Ser Leu Gly Arg Thr Lys Phe Ser Ile Asn Asn Asn Lys Ala Leu
260 265 270
His Gln Ser Ile Lys Glu Arg Ala Ser Gly Ala Leu Arg Gly Met Phe
275 280 285
Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala
290 295 300
Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe
305 310 315 320
Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala
325 330 335
Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln
340 345 350
Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu
355 360 365
Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg
370 375 380
<210> 90
<211> 384
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein
sequence
<400> 90
Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu
1 5 10 15
Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met
20 25 30
Gly Thr Lys Ala Arg Ile Phe Ser Tyr Phe Ile Ala Ser Tyr Thr Asp
35 40 45
Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu
50 55 60
Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys
65 70 75 80
Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr
85 90 95
Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser
100 105 110
Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Ser Ile Phe
115 120 125
Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr
130 135 140
Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe
145 150 155 160
Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu
165 170 175
Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln
180 185 190
Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg
195 200 205
Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu
210 215 220
Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile
225 230 235 240
Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr
245 250 255
Ser Ser Leu Gly Arg Thr Lys Tyr Ser Ile Asn Asn Asn Lys Ala Leu
260 265 270
Asn Gln Ser Ile Lys Glu Arg Ala Ser Val Ala Leu Arg Gly Met Phe
275 280 285
Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala
290 295 300
Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe
305 310 315 320
Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala
325 330 335
Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln
340 345 350
Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu
355 360 365
Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg
370 375 380
<210> 91
<211> 384
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein
sequence
<400> 91
Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu
1 5 10 15
Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met
20 25 30
Gly Thr Lys Ala Arg Ile Phe Ser His Asn Ile Ala Ser Tyr Thr Asp
35 40 45
Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu
50 55 60
Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys
65 70 75 80
Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr
85 90 95
Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser
100 105 110
Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Thr Ile Phe
115 120 125
Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr
130 135 140
Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe
145 150 155 160
Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu
165 170 175
Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln
180 185 190
Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg
195 200 205
Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu
210 215 220
Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile
225 230 235 240
Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr
245 250 255
Ser Ser Leu Gly Arg Thr Lys Tyr Ser Ile Asn Asn Asn Lys Ala Leu
260 265 270
His Gln Ser Ile Lys Glu Arg Ala Ser Val Asp Leu Arg Gly Met Phe
275 280 285
Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala
290 295 300
Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe
305 310 315 320
Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala
325 330 335
Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln
340 345 350
Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu
355 360 365
Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg
370 375 380
<210> 92
<211> 384
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein
sequence
<400> 92
Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu
1 5 10 15
Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met
20 25 30
Gly Thr Lys Ala Arg Ile Phe Ser His Lys Ile Ala Ser Tyr Thr Asp
35 40 45
Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu
50 55 60
Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys
65 70 75 80
Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr
85 90 95
Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser
100 105 110
Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Ala Ala Ile Phe
115 120 125
Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr
130 135 140
Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe
145 150 155 160
Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu
165 170 175
Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln
180 185 190
Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg
195 200 205
Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu
210 215 220
Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile
225 230 235 240
Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr
245 250 255
Ser Ser Leu His Arg Thr Lys Asp Ser Ile Asn Asn Asn Lys Ala Leu
260 265 270
Phe Gln Ser Ile Lys Glu Arg Ala Ser Asp Asp Leu Arg Gly Met Phe
275 280 285
Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala
290 295 300
Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe
305 310 315 320
Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala
325 330 335
Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln
340 345 350
Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu
355 360 365
Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg
370 375 380
<210> 93
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 26 product oligonucleotide sequence
<400> 93
actcatcgat c 11
<210> 94
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 26 product oligonucleotide sequence
<400> 94
actcatcgat t 11
<210> 95
<211> 477
<212> PRT
<213> Wild type phosphatase (Pandalus borealis) protein sequence - 'SAP'
<400> 95
Met Glu Glu Asp Lys Ala Tyr Trp Asn Lys Asp Ala Gln Asp Ala Leu
1 5 10 15
Asp Lys Gln Leu Gly Ile Lys Leu Arg Glu Lys Gln Ala Lys Asn Val
20 25 30
Ile Phe Phe Leu Gly Asp Gly Met Ser Leu Ser Thr Val Thr Ala Ala
35 40 45
Arg Ile Tyr Lys Gly Gly Leu Thr Gly Lys Phe Glu Arg Glu Lys Ile
50 55 60
Ser Trp Glu Glu Phe Asp Phe Ala Ala Leu Ser Lys Thr Tyr Asn Thr
65 70 75 80
Asp Lys Gln Val Thr Asp Ser Ala Ala Ser Ala Thr Ala Tyr Leu Thr
85 90 95
Gly Val Lys Thr Asn Gln Gly Val Ile Gly Leu Asp Ala Asn Thr Val
100 105 110
Arg Thr Asn Cys Ser Tyr Gln Leu Asp Glu Ser Leu Phe Thr Tyr Ser
115 120 125
Ile Ala His Trp Phe Gln Glu Ala Gly Arg Ser Thr Gly Val Val Thr
130 135 140
Ser Thr Arg Val Thr His Ala Thr Pro Ala Gly Thr Tyr Ala His Val
145 150 155 160
Ala Asp Arg Asp Trp Glu Asn Asp Ser Asp Val Val His Asp Arg Glu
165 170 175
Asp Pro Glu Ile Cys Asp Asp Ile Ala Glu Gln Leu Val Phe Arg Glu
180 185 190
Pro Gly Lys Asn Phe Lys Val Ile Met Gly Gly Gly Arg Arg Gly Phe
195 200 205
Phe Pro Glu Glu Ala Leu Asp Ile Glu Asp Gly Ile Pro Gly Glu Arg
210 215 220
Glu Asp Gly Lys His Leu Ile Thr Asp Trp Leu Asp Asp Lys Ala Ser
225 230 235 240
Gln Gly Ala Thr Ala Ser Tyr Val Trp Asn Arg Asp Asp Leu Leu Ala
245 250 255
Val Asp Ile Arg Asn Thr Asp Tyr Leu Met Gly Leu Phe Ser Tyr Thr
260 265 270
His Leu Asp Thr Val Leu Thr Arg Asp Ala Glu Met Asp Pro Thr Leu
275 280 285
Pro Glu Met Thr Lys Val Ala Ile Glu Met Leu Thr Lys Asp Glu Asn
290 295 300
Gly Phe Phe Leu Leu Val Glu Gly Gly Arg Ile Asp His Met His His
305 310 315 320
Ala Asn Gln Ile Arg Gln Ser Leu Ala Glu Thr Leu Asp Met Glu Glu
325 330 335
Ala Val Ser Met Ala Leu Ser Met Thr Asp Pro Glu Glu Thr Ile Ile
340 345 350
Leu Val Thr Ala Asp His Gly His Thr Leu Thr Ile Thr Gly Tyr Ala
355 360 365
Asp Arg Asn Thr Asp Ile Leu Asp Phe Ala Gly Ile Ser Asp Leu Asp
370 375 380
Asp Arg Arg Tyr Thr Ile Leu Asp Tyr Gly Ser Gly Pro Gly Tyr His
385 390 395 400
Ile Thr Glu Asp Gly Lys Arg Tyr Glu Pro Thr Glu Glu Asp Leu Lys
405 410 415
Asp Ile Asn Phe Arg Tyr Ala Ser Ala Ala Pro Lys His Ser Ala Thr
420 425 430
His Asp Gly Thr Asp Val Gly Ile Trp Val Asn Gly Pro Phe Ala His
435 440 445
Leu Phe Thr Gly Val Tyr Glu Glu Asn Tyr Ile Pro His Ala Leu Ala
450 455 460
Tyr Ala Ala Cys Val Gly Thr Gly Arg Thr Phe Cys Asp
465 470 475
<210> 96
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 27 product oligonucleotide sequence
<400> 96
actcatcgat a 11
<210> 97
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 27 product oligonucleotide sequence
<400> 97
actcatcgat aa 12
<210> 98
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 27 product oligonucleotide sequence
<400> 98
actcatcgat aa 12
<210> 99
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 28 product oligonucleotide sequence
<220>
<221> misc_feature
<222> (4)..(4)
<223> n = 2' deoxyInosine
<400> 99
actnagacca cg 12
<210> 100
<211> 221
<212> PRT
<213> Wild type Archaeoglobus fulgidus endonuclease V endonuclease
<400> 100
Met Leu Gln Met Asn Leu Glu Glu Leu Arg Arg Ile Gln Glu Glu Met
1 5 10 15
Ser Arg Ser Val Val Leu Glu Asp Leu Ile Pro Leu Glu Glu Leu Glu
20 25 30
Tyr Val Val Gly Val Asp Gln Ala Phe Ile Ser Asp Glu Val Val Ser
35 40 45
Cys Ala Val Lys Leu Thr Phe Pro Glu Leu Glu Val Val Asp Lys Ala
50 55 60
Val Arg Val Glu Lys Val Thr Phe Pro Tyr Ile Pro Thr Phe Leu Met
65 70 75 80
Phe Arg Glu Gly Glu Pro Ala Val Asn Ala Val Lys Gly Leu Val Asp
85 90 95
Asp Arg Ala Ala Ile Met Val Asp Gly Ser Gly Ile Ala His Pro Arg
100 105 110
Arg Cys Gly Leu Ala Thr Tyr Ile Ala Leu Lys Leu Arg Lys Pro Thr
115 120 125
Val Gly Ile Thr Lys Lys Arg Leu Phe Gly Glu Met Val Glu Val Glu
130 135 140
Asp Gly Leu Trp Arg Leu Leu Asp Gly Ser Glu Thr Ile Gly Tyr Ala
145 150 155 160
Leu Lys Ser Cys Arg Arg Cys Lys Pro Ile Phe Ile Ser Pro Gly Ser
165 170 175
Tyr Ile Ser Pro Asp Ser Ala Leu Glu Leu Thr Arg Lys Cys Leu Lys
180 185 190
Gly Tyr Lys Leu Pro Glu Pro Ile Arg Ile Ala Asp Lys Leu Thr Lys
195 200 205
Glu Val Lys Arg Glu Leu Thr Pro Thr Ser Lys Leu Lys
210 215 220
<210> 101
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> Example 28 product oligonucleotide sequence
<400> 101
gaccacg 7
Claims (24)
- 이중-가닥 치료용 올리고뉴클레오티드 생성물을 생성하는 방법이며,
2개의 상보적 단일-가닥 올리고뉴클레오티드 생성물이 어닐링을 허용하는 조건 하에 혼합되고, 각각의 단일-가닥 올리고뉴클레오티드 생성물은 하기를 포함하는 방법에 의해 생성되는 것인, 방법:
a) 생성물 서열의 절편을 포함하는 올리고뉴클레오티드 (I)의 풀을 제공하는 단계이며, 생성물 서열의 적어도 하나의 절편은 적어도 하나의 변형된 뉴클레오티드 잔기를 함유하고, 각각의 절편은 효소적 합성에 의해 생성된 것인 단계;
b) 단일-가닥 올리고뉴클레오티드 생성물의 서열과 상보적인 주형 올리고뉴클레오티드 (II)를 제공하는 단계이며, 상기 주형은 생성물로부터 분리되어 향후 반응에서의 사용을 위해 재순환되는 것을 허용하는 특성을 갖는 것인 단계;
c) 주형 올리고뉴클레오티드로의 절편 올리고뉴클레오티드의 어닐링을 허용하는 조건에서 (I) 및 (II)를 접촉시키는 단계;
d) 리가제를 사용하여 절편 올리고뉴클레오티드를 연결하여 생성물을 형성하는 단계;
e) 어닐링된 주형 및 임의의 불순물 올리고뉴클레오티드 가닥이 변성되도록 조건을 변화시키고, 불순물을 분리하는 단계;
f) 어닐링된 주형 및 생성물 올리고뉴클레오티드 가닥이 변성되도록 조건을 변화시키고, 단일-가닥 올리고뉴클레오티드 생성물을 분리하는 단계, 및
g) 주형 올리고뉴클레오티드를 향후 반응에서의 사용을 위해 재순환시키는 단계. - 제1항에 있어서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드가 단일-가닥 리가제(ss리가제) 또는 RNA 리가제를 사용하여 생성되는 것인 방법.
- 제2항에 있어서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법이
(i) 3' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티 및 5' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티를 갖는, 뉴클레오티드, 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드를 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가하는 단계,
(ii) 포스파타제를 사용하여 3'-포스페이트, 3'-티오포스페이트 또는 디티오포스페이트를 제거하는 단계,
(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계: 및
(iv) 서열 특이적 엔도뉴클레아제를 사용하여 올리고뉴클레오티드 프라이머로부터 절편 올리고뉴클레오티드를 방출하는 단계
를 포함하는 것인 방법. - 제3항에 있어서, 포스페이트 둘 중 하나 이상에서 산소가 황으로 치환된 3',5' 뉴클레오티드 비스포스페이트가 단계 (i)에서 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가되는 것인 방법.
- 제3항에 있어서, 단계 (i)에서 3',5' 비스티오포스페이트, 3'-포스페이트-5'-티오포스페이트, 3'-티오포스페이트-5'-포스페이트, 3',5' 비스디티오포스페이트, 3'-포스페이트-5'-디티오포스페이트 또는 3'-디티오포스페이트-5'-포스페이트가 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가되는 것인 방법.
- 제1항에 있어서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드가 트랜스퍼라제를 사용하여 생성되는 것인 방법.
- 제6항에 있어서, 트랜스퍼라제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법이
(i) 3'-OH 상에 보호기를 갖는, 뉴클레오티드-5'-트리포스페이트, 알파-티오트리포스페이트 또는 알파디티오트리포스페이트를 트랜스퍼라제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가하는 단계,
(ii) 3'-OH가 재생되도록 3'-위치를 탈보호하는 단계,
(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계, 및
(iv) 서열 특이적 엔도뉴클레아제를 사용하여 올리고뉴클레오티드 프라이머로부터 절편 올리고뉴클레오티드를 방출하는 단계
를 포함하는 것인 방법. - 제1항 내지 제7항 중 어느 한 항에 있어서, 반연속적인 또는 연속적인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 생성물이 그램 또는 킬로그램 규모 또는 그 초과 규모로 생성되고/거나, 방법이 적어도 1L의 반응기에서 수행되는 것인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 변성이 온도 증가, pH의 변화 또는 완충 용액 중 염 농도의 변화로부터 발생하는 것인 방법.
- 제10항에 있어서,
i) 주형:불순물 이중나선이 변성되도록, 및
ii) 주형:생성물 이중나선이 변성되도록
온도를 증가시키는 2개의 단계를 포함하는 방법. - 제1항 내지 제7항 중 어느 한 항에 있어서, 절편이 3 내지 15개의 뉴클레오티드 길이인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 생성물의 길이가 10 내지 200개의 뉴클레오티드 길이, 20 내지 30개의 뉴클레오티드 길이, 또는 20 내지 25개의 뉴클레오티드 길이인 방법.
- 제13항에 있어서, 각각의 단일-가닥 올리고뉴클레오티드 생성물이 20개의 뉴클레오티드 길이이고 다음을 포함하는 3개의 절편 올리고뉴클레오티드를 포함하는 것인 방법:
(i) 7개의 뉴클레오티드 길이인 5' 절편,
6개의 뉴클레오티드 길이인 중심 절편 및
7개의 뉴클레오티드 길이인 3' 절편,
(ii) 6개의 뉴클레오티드 길이인 5' 절편,
8개의 뉴클레오티드 길이인 중심 절편 및
6개의 뉴클레오티드 길이인 3' 절편,
(iii) 5개의 뉴클레오티드 길이인 5' 절편,
10개의 뉴클레오티드 길이인 중심 절편 및
5개의 뉴클레오티드 길이인 3' 절편,
(iv) 4개의 뉴클레오티드 길이인 5' 절편,
12개의 뉴클레오티드 길이인 중심 절편 및
4개의 뉴클레오티드 길이인 3' 절편, 또는
(v) 3개의 뉴클레오티드 길이인 5' 절편,
14개의 뉴클레오티드 길이인 중심 절편 및
3개의 뉴클레오티드 길이인 3' 절편. - 제1항 내지 제7항 중 어느 한 항에 있어서, 주형이 지지체 물질에 부착되는 것인 방법.
- 제15항에 있어서, 지지체 물질이 가용성 지지체 물질, 폴리에틸렌 글리콜, 가용성 유기 중합체, DNA, 단백질, 덴드리머, 다당류, 올리고당 또는 탄수화물인 것인 방법.
- 제15항에 있어서, 지지체 물질이 불용성 지지체 물질, 유리 비드, 중합체 비드, 섬유질 지지체, 막, 스트렙타비딘 코팅된 비드, 셀룰로스, 또는 반응 벽일 수 있는 반응 용기 자체의 일부인 방법.
- 제15항에 있어서, 주형의 다수의 반복된 카피가 연속적인 방식으로 단일 부착점을 통해 지지체 물질에 부착되는 것인 방법.
- 제15항에 있어서, 주형이 다수의 부착점에서 지지체 물질에 부착되는 것인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 변형이 당 모이어티의 2' 위치에 있거나, 2'-F, 2'-OMe, 2'-MOE 및 2'-아미노로 이루어진 군으로부터 선택되거나, 또는 올리고뉴클레오티드가 PMO, LNA, PNA, BNA 또는 SPIEGELMER를 포함하는 것인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 변형이 핵염기에 있거나, 또는 변형이 5-메틸 피리미딘, 7-데아자구아노신 및 비염기성 뉴클레오티드로 이루어진 군으로부터 선택되는 것인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 변형이 백본에 있거나, 또는 변형이 포스포로티오에이트, 포스포르아미데이트 및 포스포로디아미데이트로 이루어진 군으로부터 선택되는 것인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 생성된 이중-가닥 올리고뉴클레오티드 생성물이 적어도 90% 순수하거나, 적어도 95% 순수하거나, 또는 적어도 98% 순수한 것인 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 작은 간섭 RNA(siRNA) 를 생성하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020247006894A KR20240033153A (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1721307.5 | 2017-12-19 | ||
GBGB1721307.5A GB201721307D0 (en) | 2017-12-19 | 2017-12-19 | Novel processes for the production of oligonucleotides |
PCT/EP2018/085179 WO2019121500A1 (en) | 2017-12-19 | 2018-12-17 | Novel processes for the production of oligonucleotides |
KR1020207020495A KR102417049B1 (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207020495A Division KR102417049B1 (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247006894A Division KR20240033153A (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220094219A KR20220094219A (ko) | 2022-07-05 |
KR102643631B1 true KR102643631B1 (ko) | 2024-03-05 |
Family
ID=61009182
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227022320A KR102643631B1 (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
KR1020247006894A KR20240033153A (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
KR1020207020495A KR102417049B1 (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247006894A KR20240033153A (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
KR1020207020495A KR102417049B1 (ko) | 2017-12-19 | 2018-12-17 | 올리고뉴클레오티드의 신규 생성 방법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20240287566A1 (ko) |
EP (2) | EP4015631A1 (ko) |
JP (2) | JP7065970B2 (ko) |
KR (3) | KR102643631B1 (ko) |
CN (2) | CN111479923B (ko) |
BR (1) | BR112020012252A2 (ko) |
CA (1) | CA3085237A1 (ko) |
DK (1) | DK3728585T3 (ko) |
ES (1) | ES2914591T3 (ko) |
GB (1) | GB201721307D0 (ko) |
WO (1) | WO2019121500A1 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7537422B2 (ja) * | 2019-02-18 | 2024-08-21 | 味の素株式会社 | 相補部分を含む修飾オリゴヌクレオチドの製造方法 |
EP4065723A4 (en) * | 2019-11-29 | 2024-01-17 | MGI Holdings Co., Limited | ENZYMATIC SYNTHESIS OF OLIGONUCLEOTIDES |
US20230295707A1 (en) * | 2022-03-21 | 2023-09-21 | Abclonal Science, Inc. | T4 DNA Ligase Variants with Increased Ligation Efficiency |
WO2023194537A1 (en) | 2022-04-08 | 2023-10-12 | Glaxosmithkline Intellectual Property Development Limited | Novel processes for the production of polynucleotides including oligonucleotides |
WO2024025200A1 (ko) | 2022-07-28 | 2024-02-01 | 주식회사 엘지에너지솔루션 | 슬롯 다이 코터 |
CN117660374A (zh) * | 2022-09-08 | 2024-03-08 | 凯莱英医药集团(天津)股份有限公司 | Rna连接酶在寡核苷酸制备上的应用 |
CN115724998A (zh) * | 2022-10-28 | 2023-03-03 | 深圳先进技术研究院 | 一种基于共振能量转移的全遗传编码nmn蛋白探针及其应用 |
CN118166051A (zh) * | 2022-12-08 | 2024-06-11 | 凯莱英生命科学技术(天津)有限公司 | 双链rna的合成方法及rna连接酶在双链rna合成中的应用 |
CN117247911B (zh) * | 2023-08-22 | 2024-06-07 | 武汉爱博泰克生物科技有限公司 | 大肠杆菌dna连接酶突变体及其在毕赤酵母中表达纯化方法 |
CN117106782B (zh) * | 2023-10-16 | 2024-04-26 | 吉林凯莱英医药化学有限公司 | gRNA及其生物合成方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5516664A (en) | 1992-12-23 | 1996-05-14 | Hyman; Edward D. | Enzymatic synthesis of repeat regions of oligonucleotides |
WO2001064864A2 (en) | 2000-02-28 | 2001-09-07 | Maxygen, Inc. | Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation |
US20030120035A1 (en) | 2001-03-14 | 2003-06-26 | The Regents Of The University Of Michigan | Linkers and co-coupling agents for optimization of oligonucleotide synthesis and purification on solid supports |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6683173B2 (en) | 1998-04-03 | 2004-01-27 | Epoch Biosciences, Inc. | Tm leveling methods |
US6586586B1 (en) | 2000-01-31 | 2003-07-01 | Isis Pharmaceuticals, Inc. | Purification of oligonucleotides |
US20060166235A1 (en) * | 2004-12-29 | 2006-07-27 | Applera Corporation | Methods, compositions, and kits for forming labeled polynucleotides |
GB201115218D0 (en) | 2011-09-02 | 2011-10-19 | Glaxo Group Ltd | Novel process |
US8808989B1 (en) | 2013-04-02 | 2014-08-19 | Molecular Assemblies, Inc. | Methods and apparatus for synthesizing nucleic acids |
GB201502152D0 (en) | 2015-02-10 | 2015-03-25 | Nuclera Nucleics Ltd | Novel use |
GB201503534D0 (en) | 2015-03-03 | 2015-04-15 | Nuclera Nucleics Ltd | Novel method |
CN105506125B (zh) * | 2016-01-12 | 2019-01-22 | 上海美吉生物医药科技有限公司 | 一种dna的测序方法及一种二代测序文库 |
GB201612011D0 (en) * | 2016-07-11 | 2016-08-24 | Glaxosmithkline Ip Dev Ltd | Novel processes for the production of oligonucleotides |
-
2017
- 2017-12-19 GB GBGB1721307.5A patent/GB201721307D0/en not_active Ceased
-
2018
- 2018-12-17 ES ES18822043T patent/ES2914591T3/es active Active
- 2018-12-17 CA CA3085237A patent/CA3085237A1/en active Pending
- 2018-12-17 EP EP22154581.7A patent/EP4015631A1/en active Pending
- 2018-12-17 EP EP18822043.8A patent/EP3728585B1/en active Active
- 2018-12-17 US US16/771,362 patent/US20240287566A1/en active Pending
- 2018-12-17 WO PCT/EP2018/085179 patent/WO2019121500A1/en unknown
- 2018-12-17 DK DK18822043.8T patent/DK3728585T3/da active
- 2018-12-17 CN CN201880082633.8A patent/CN111479923B/zh active Active
- 2018-12-17 BR BR112020012252-1A patent/BR112020012252A2/pt active Search and Examination
- 2018-12-17 KR KR1020227022320A patent/KR102643631B1/ko active IP Right Grant
- 2018-12-17 KR KR1020247006894A patent/KR20240033153A/ko active Application Filing
- 2018-12-17 CN CN202410777781.9A patent/CN118516431A/zh active Pending
- 2018-12-17 KR KR1020207020495A patent/KR102417049B1/ko active IP Right Grant
- 2018-12-17 JP JP2020533192A patent/JP7065970B2/ja active Active
-
2022
- 2022-04-26 JP JP2022072032A patent/JP7438259B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5516664A (en) | 1992-12-23 | 1996-05-14 | Hyman; Edward D. | Enzymatic synthesis of repeat regions of oligonucleotides |
WO2001064864A2 (en) | 2000-02-28 | 2001-09-07 | Maxygen, Inc. | Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation |
US20030120035A1 (en) | 2001-03-14 | 2003-06-26 | The Regents Of The University Of Michigan | Linkers and co-coupling agents for optimization of oligonucleotide synthesis and purification on solid supports |
Non-Patent Citations (1)
Title |
---|
Nature chemistry, 2017년 09월 11일, Vol.14, p.1089-1098 |
Also Published As
Publication number | Publication date |
---|---|
CN118516431A (zh) | 2024-08-20 |
BR112020012252A2 (pt) | 2020-11-24 |
WO2019121500A1 (en) | 2019-06-27 |
CN111479923A (zh) | 2020-07-31 |
ES2914591T3 (es) | 2022-06-14 |
KR20240033153A (ko) | 2024-03-12 |
GB201721307D0 (en) | 2018-01-31 |
EP3728585B1 (en) | 2022-03-16 |
KR20200099564A (ko) | 2020-08-24 |
EP3728585A1 (en) | 2020-10-28 |
JP2022109986A (ja) | 2022-07-28 |
DK3728585T3 (da) | 2022-05-23 |
EP4015631A1 (en) | 2022-06-22 |
US20240287566A1 (en) | 2024-08-29 |
JP2021507699A (ja) | 2021-02-25 |
CN111479923B (zh) | 2024-06-18 |
JP7065970B2 (ja) | 2022-05-12 |
CA3085237A1 (en) | 2019-06-27 |
KR102417049B1 (ko) | 2022-07-06 |
KR20220094219A (ko) | 2022-07-05 |
JP7438259B2 (ja) | 2024-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102643631B1 (ko) | 올리고뉴클레오티드의 신규 생성 방법 | |
US20200277659A1 (en) | Novel processes for the production of oligonucleotides | |
BR112018076725B1 (pt) | Processos para produzir um produto de oligonucleotídeo de fita simples e de fita dupla |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |