KR20240004213A - 신규 중합효소 및 이의 용도 - Google Patents
신규 중합효소 및 이의 용도 Download PDFInfo
- Publication number
- KR20240004213A KR20240004213A KR1020237017769A KR20237017769A KR20240004213A KR 20240004213 A KR20240004213 A KR 20240004213A KR 1020237017769 A KR1020237017769 A KR 1020237017769A KR 20237017769 A KR20237017769 A KR 20237017769A KR 20240004213 A KR20240004213 A KR 20240004213A
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- dna polymerase
- nucleotides
- polymerase
- reaction mixture
- Prior art date
Links
- 108020004414 DNA Proteins 0.000 claims abstract description 153
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims abstract description 78
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims abstract description 65
- 102000053602 DNA Human genes 0.000 claims abstract description 59
- 230000001419 dependent effect Effects 0.000 claims abstract description 46
- 230000000694 effects Effects 0.000 claims abstract description 38
- 108060002716 Exonuclease Proteins 0.000 claims abstract description 35
- 102000013165 exonuclease Human genes 0.000 claims abstract description 35
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 25
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 25
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 25
- 230000035772 mutation Effects 0.000 claims abstract description 19
- 230000005783 single-strand break Effects 0.000 claims abstract description 16
- 108020004511 Recombinant DNA Proteins 0.000 claims abstract description 14
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 9
- 125000003729 nucleotide group Chemical group 0.000 claims description 95
- 239000002773 nucleotide Substances 0.000 claims description 93
- 239000011541 reaction mixture Substances 0.000 claims description 41
- 239000003446 ligand Substances 0.000 claims description 28
- 210000004027 cell Anatomy 0.000 claims description 25
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 24
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 24
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 24
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 21
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 19
- 239000012634 fragment Substances 0.000 claims description 17
- 238000012163 sequencing technique Methods 0.000 claims description 11
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 10
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 10
- 108091008146 restriction endonucleases Proteins 0.000 claims description 9
- 108010093204 DNA polymerase theta Proteins 0.000 claims description 8
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 150000001413 amino acids Chemical class 0.000 claims description 7
- 239000011230 binding agent Substances 0.000 claims description 7
- 238000001727 in vivo Methods 0.000 claims description 7
- 238000006116 polymerization reaction Methods 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 6
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 claims description 5
- 239000000758 substrate Substances 0.000 claims description 5
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 4
- 239000007787 solid Substances 0.000 claims description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 3
- 102100029766 DNA polymerase theta Human genes 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 230000001580 bacterial effect Effects 0.000 abstract description 3
- 102100035481 DNA polymerase eta Human genes 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 10
- 230000010076 replication Effects 0.000 description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 101150040913 DUT gene Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 7
- 108020001580 protein domains Proteins 0.000 description 7
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- 108010090804 Streptavidin Proteins 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 230000005778 DNA damage Effects 0.000 description 5
- 231100000277 DNA damage Toxicity 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 230000006820 DNA synthesis Effects 0.000 description 4
- 101710178665 Error-prone DNA polymerase Proteins 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 239000012148 binding buffer Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000001915 proofreading effect Effects 0.000 description 4
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 101150022192 PolH gene Proteins 0.000 description 3
- 108700018273 Rad30 Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 101100137166 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RAD30 gene Proteins 0.000 description 3
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 3
- 230000009824 affinity maturation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 208000035657 Abasia Diseases 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108010010677 Phosphodiesterase I Proteins 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 108010086271 exodeoxyribonuclease II Proteins 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 108010068698 spleen exonuclease Proteins 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 1
- CLGFIVUFZRGQRP-UHFFFAOYSA-N 7,8-dihydro-8-oxoguanine Chemical compound O=C1NC(N)=NC2=C1NC(=O)N2 CLGFIVUFZRGQRP-UHFFFAOYSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- GMCOADLDNLGOFE-ZLUOBGJFSA-N Asn-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N GMCOADLDNLGOFE-ZLUOBGJFSA-N 0.000 description 1
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- AECPDLSSUMDUAA-ZKWXMUAHSA-N Asn-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N AECPDLSSUMDUAA-ZKWXMUAHSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- KOWYNSKRPUWSFG-IHPCNDPISA-N Asp-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)O)N KOWYNSKRPUWSFG-IHPCNDPISA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- ZQFZEBRNAMXXJV-KKUMJFAQSA-N Asp-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O ZQFZEBRNAMXXJV-KKUMJFAQSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 1
- DZIGZIIJIGGANI-FXQIFTODSA-N Cys-Glu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DZIGZIIJIGGANI-FXQIFTODSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 102000007528 DNA Polymerase III Human genes 0.000 description 1
- 108010071146 DNA Polymerase III Proteins 0.000 description 1
- 102000001996 DNA Polymerase beta Human genes 0.000 description 1
- 108010001132 DNA Polymerase beta Proteins 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 102100035472 DNA polymerase iota Human genes 0.000 description 1
- 108010025600 DNA polymerase iota Proteins 0.000 description 1
- 102100035474 DNA polymerase kappa Human genes 0.000 description 1
- 101710108091 DNA polymerase kappa Proteins 0.000 description 1
- 101710177421 DNA polymerase lambda Proteins 0.000 description 1
- 108700036833 DNA polymerase zeta Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101710180995 Endonuclease 1 Proteins 0.000 description 1
- 102100026121 Flap endonuclease 1 Human genes 0.000 description 1
- 108050002219 Flap endonuclease 1 Proteins 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 1
- GXMBDEGTXHQBAO-NKIYYHGXSA-N Gln-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N)O GXMBDEGTXHQBAO-NKIYYHGXSA-N 0.000 description 1
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- RNPGPFAVRLERPP-QEJZJMRPSA-N Gln-Trp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RNPGPFAVRLERPP-QEJZJMRPSA-N 0.000 description 1
- BJVBMSTUUWGZKX-JYJNAYRXSA-N Gln-Tyr-His Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BJVBMSTUUWGZKX-JYJNAYRXSA-N 0.000 description 1
- QZQYITIKPAUDGN-GVXVVHGQSA-N Gln-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QZQYITIKPAUDGN-GVXVVHGQSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- MXPBQDFWIMBACQ-ACZMJKKPSA-N Glu-Cys-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O MXPBQDFWIMBACQ-ACZMJKKPSA-N 0.000 description 1
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- RNVUQLOKVIPNEM-BZSNNMDCSA-N His-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O RNVUQLOKVIPNEM-BZSNNMDCSA-N 0.000 description 1
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- SYVMEYAPXRRXAN-MXAVVETBSA-N Ile-Cys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SYVMEYAPXRRXAN-MXAVVETBSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- JDCQDJVYUXNCGF-SPOWBLRKSA-N Ile-Ser-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JDCQDJVYUXNCGF-SPOWBLRKSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000186604 Lactobacillus reuteri Species 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- XATKLFSXFINPSB-JYJNAYRXSA-N Lys-Tyr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O XATKLFSXFINPSB-JYJNAYRXSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 1
- QMIXOTQHYHOUJP-KKUMJFAQSA-N Met-Gln-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N QMIXOTQHYHOUJP-KKUMJFAQSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 1
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- ABEFOXGAIIJDCL-SFJXLCSZSA-N Phe-Thr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ABEFOXGAIIJDCL-SFJXLCSZSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- QSHKTZVJGDVFEW-GUBZILKMSA-N Ser-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N QSHKTZVJGDVFEW-GUBZILKMSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- MHVXPTAMDHLTHB-IHPCNDPISA-N Ser-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MHVXPTAMDHLTHB-IHPCNDPISA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 1
- VUKVQVNKIIZBPO-HOUAVDHOSA-N Thr-Asp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VUKVQVNKIIZBPO-HOUAVDHOSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 1
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 1
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- ASJWEHCPLGMOJE-LJMGSBPFSA-N ac1l3rvh Chemical class N1C(=O)NC(=O)[C@@]2(C)[C@@]3(C)C(=O)NC(=O)N[C@H]3[C@H]21 ASJWEHCPLGMOJE-LJMGSBPFSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 238000010352 biotechnological method Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000003927 comet assay Methods 0.000 description 1
- 231100000170 comet assay Toxicity 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 229940001882 lactobacillus reuteri Drugs 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000007169 ligase reaction Methods 0.000 description 1
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000037048 polymerization activity Effects 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 101710197907 rDNA transcriptional regulator pol5 Proteins 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1024—In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07007—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/101—DNA polymerase
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Saccharide Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 개시내용은 5'-3' 엑소뉴클레아제 활성을 갖고 3'-5' 엑소뉴클레아제 활성이 결여된 재조합 DNA 의존적 DNA 중합효소에 관한 것으로서, 상기 중합효소는 단일 불일치 염기쌍으로부터 DNA 중합을 확장할 수 있고 적어도 1:1000의 오류율을 갖는다. 본 개시내용은 또한 재조합 DNA 의존적 DNA 중합효소를 코딩하는 핵산 분자, 이중 가닥 DNA(dsDNA)를 합성하는 방법, 주형 dsDNA 분자에서 단일 가닥 파괴(single strand break)의 위치를 수득하는 방법, 박테리아 또는 진핵 세포, 또는 유기체의 DNA에 돌연변이를 도입하는 방법에 관한 것이다.
Description
본 개시내용은 분자 도구 분야, 특히 생명공학적 방법에 유용한 조작된 DNA 의존 중합효소, 이를 코딩하는 핵산, 이를 발현하는 숙주 세포, 및 개시된 분자 도구를 이용하는 다양한 방법에 관한 것이다. 분자 도구는 DNA 분석, 돌연변이유발 유도 및 친화도 성숙에 적용된다.
게놈 DNA의 완전성(integrity)은 세포의 유전 정보를 보존하기 위한 필수조건이며, 복제, 전사 및 대사 과정의 부산물과 같은 자연적 과정 및 또한 방사선 및 화학물질과 같은 환경적 요인으로 인해 끊임없이 위협을 받고 있다. 충실한 복제와 손상 복구가 실패하면 발현된 단백질에 돌연변이가 생길 수 있다. 돌연변이는 일반적으로 유기체에 해롭지만 드물게는 특정 상황에서 유익한 것으로 입증된 변경된 특성을 초래할 수도 있다.
DNA 손상(단일-가닥 및 이중-가닥 절단, 또는 손상된 염기)을 검출하는 방법은 손상 인자의 결과뿐만 아니라, 이러한 손상의 후속 복구를 결정하는데 필요하다. 개별 세포당 DNA 손상 정도를 평가하는 현재 방법의 예로는 DNA 단편화 및 다양한 서열분석 기반 분석법의 총 추정치를 제공하는 COMET 분석법(PMID: 6477583), 및 말단-표지를 사용하거나(PMID:27688757) 변형된 염기에서 중합효소 진행성에서 DNA 변형을 활용하여(PMID:31247470) 게놈 내의 위치를 결정하거나 병변의 위치에서 형광단-표지된 뉴클레오티드를 혼입시켜 세포에서 DNA 손상을 시각화하는(PMID:29723708) 서열분석-기반 방법이 있다.
DNA 중합효소는 복제 과정에서 돌연변이율을 감소시키기 위해 높은 충실도를 얻도록 진화해왔다. 높은 충실도의 단점은 복제에 사용되는 DNA 중합효소가 손상된 염기, 예를 들어 cis-syn 티민 이량체, 무염기(abasic) 부위 및 7,8-디히드로-8-옥소구아닌(8-oxoG)을 우회할 수 없다는 것이다. 이러한 위치를 우회하기 위해 원핵생물과 진핵생물 모두에 존재하는, 이러한 손상된 염기에 반대되는 DNA 합성을 가능케 하는 몇 가지 트랜스레시온(translesion) DNA 중합효소가 존재한다. 트랜스레시온 DNA 중합효소는 뉴클레오티드 식별에 대한 보다 완화된 요구사항의 결과로 손상되지 않은 DNA에서 더 높은 빈도로 잘못된 통합(miss-incorporation)을 갖는다. 10-2 내지 10-3(PMID:10601233)의 트랜스레시온 DNA 중합효소 η의 높은 오류율은, 고친화성 항체의 발달에서 체세포 과돌연변이 과정 동안, B 세포의 면역글로불린 유전자(PMID:11376341)에서 효소 AID에 의해 생성된 무염기 부위에 돌연변이를 도입한다. 그러나 중합효소 η의 진행성은 매우 낮아서, DNA 가닥이 떨어지기 전에 몇 개의 뉴클레오티드만 통합된다(PMID:10601233).
향상된 친화도를 갖는 재조합 단백질을 진화시키기 위해 후천적 돌연변이를 이용하는 개념은, 예를 들어 더 높은 돌연변이율을 갖는 박테리아 균주를 이용하는 것으로 이용되었다(PMID: 9373321, PMID: 8757799). 이러한 논문에서 사용된 대장균(E. coli) 균주는 DNA 중합효소 III의 교정 능력에 결함이 있으므로(PMID: 3054881) 복제 동안 돌연변이율이 더 높아진다.
개요
본 발명자들은 위에서 논의된 개선된 방법을 용이하게 하는 오류가 발생하기 쉬운(error-prone) DNA 의존적 DNA 중합효소에 대한 필요성을 확인하였다. 이러한 DNA 의존적 DNA 중합효소는 다음 기준을 충족해야 한다: (1) 고도로 오류가 발생하기 쉬워야(error prone) 한다, (2) 불일치(mismatched) 염기로부터 확장될 수 있어야 한다, (3) 3'에서 5'으로의 엑소뉴클레아제 활성이 없어야 한다(즉, 교정 없음), 그리고 (4) 새로운 가닥을 합성하는 동안 닉(nick) 앞에 있는 가닥을 제거하기 위한 5'에서 3'으로의 엑소뉴클레아제 활성을 가져야 한다.
또한 DNA 손상을 검출하여 수율을 증가시키고, 입력 요구사항을 감소시키며 시험관 내 잡음(artifact)을 방지하고, 또한 다양한 플랫폼을 사용하여 분석 가능성을 제공하는 기존 방법의 개선이 필요하다.
또한 DNA의 특정 영역으로의 돌연변이를 유도하는 유도성 오류가 발생하기 쉬운 DNA 중합효소를 갖는, 재조합 단백질의 친화도 성숙을 위한 개선된 방법이 필요하다. 유도성 프로모터에 의해 제어되는 고도로 오류가 발생하기 쉬운 중합효소를 운반하는, 원핵 또는 진핵 세포의 균주를 만들 수 있는 가능성은 돌연변이가 유도되는 시기를 제어할 수 있게 하고 내인성 중합효소만 발현되는 조건(즉, 추가 돌연변이가 삽입되지 않는 조건)에서 박테리아 배양을 확장할 수 있게 한다. DNA 닉으로부터 DNA 합성을 개시하는 DNA 중합효소를 가짐으로써, 그 앞의 가닥을 5'에서 3'으로의 엑소뉴클레아제 활성에 의해 분해하면 DNA 닉이 있는 영역에서 돌연변이의 짧은 스트레치(short stretch)를 도입할 수 있다.
본 발명의 목적은 전술한 바와 같이 오류가 발생하기 쉬운 DNA 의존적 DNA 중합효소를 제공하는 것이다.
본 발명의 추가의 목적은 개별 세포당 DNA 손상 정도뿐만 아니라, 게놈 내 손상의 정확한 위치를 평가할 수 있는 새로운 유형의 방법을 제공하는 것으로서, 이는 현재 방법으로는 불가능하다.
따라서, 제1 양태에서 본 발명은 5'-3' 엑소뉴클레아제 활성을 갖고 3'-5' 엑소뉴클레아제 활성이 결여된 재조합 DNA 의존적 DNA 중합효소에 관한 것으로서, 상기 중합효소는 불일치 염기쌍(mismatched base pair)으로부터 DNA 중합을 확장할 수 있고 적어도 1:1000의 오류율(error rate)을 갖는다.
일부 실시형태에서, 재조합 DNA 의존적 DNA 중합효소는, 5'-3' 엑소뉴클레아제 활성을 갖고 3'-5' 엑소뉴클레아제 활성이 결여된 제1 도메인, 및 불일치 염기쌍으로부터 DNA 중합을 확장할 수 있는 능력이 있는 제2 도메인을 포함하는, 키메라 DNA 의존적 DNA 중합효소이다. 일부 실시형태에서, 재조합 DNA 의존적 DNA 중합효소는 DNA 중합효소 I의 5'-3' 엑소뉴클레아제 도메인 및 트랜스레시온 DNA 중합효소 η를 포함한다.
일부 실시형태에서, 재조합 DNA 의존적 DNA 중합효소는 SEQ ID NO: 2의 아미노산 15-337 및 350-981과 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100%의 서열 동일성의 아미노산 서열을 갖는다.
본 발명은 또한 본 발명에 따른 재조합 DNA 의존적 DNA 중합효소를 코딩하는 핵산 분자에 관한 것이다.
일부 실시형태에서, 핵산 분자는 SEQ ID NO: 1의 뉴클레오티드 43-1011 및 1048-2943과 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성의 뉴클레오티드 서열을 갖는다.
본 발명은 또한 본 발명에 따른 DNA 의존적 DNA 중합효소를 단일 가닥 파괴(single strand break)를 포함하는 dsDNA 주형 분자, 및 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 3개의 뉴클레오티드를 포함하는 반응 혼합물과 접촉시키는 단계를 포함하는, 이중 가닥 DNA(dsDNA)를 합성하는 방법에 관한 것으로서, 상기 반응 혼합물은 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 하나의 뉴클레오티드를 포함하지 않는다.
일부 실시형태에서, 반응 혼합물은 dUTP를 추가로 포함한다.
일부 실시형태에서, 반응에 포함된 뉴클레오티드는 친화성 리간드로 변형되거나 친화성 리간드로 변형되도록 적응된다.
일부 실시형태에서, 친화성 리간드는 데스티오비오틴(desthiobiotin)이다.
일부 실시형태에서, 친화성 리간드로 변형된 뉴클레오티드는 dUTP이다.
본 발명은 또한 주형 dsDNA 분자에서 단일 가닥 파괴의 위치를 수득하기 위한 방법에 관한 것이며, 상기 방법은
- 제7항 내지 제10항 중 어느 한 항에 따른 방법에 따라 dsDNA를 합성하여 주형 dsDNA 분자로부터 유래하는 제1 가닥 및 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 제2 가닥을 포함하는 하이브리드 dsDNA 분자를 수득하는 단계로서, 상기 제2 가닥의 일부에서;
- 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 제2 가닥의 일부의 외부의 하나 이상의 위치에서 하이브리드 dsDNA 분자를 절단하기 위해 반응 혼합물에 결여된 뉴클레오티드를 포함하는 제한 인식 부위를 갖는 제한 효소와 하이브리드 dsDNA 분자를 접촉시켜 DNA 단편을 수득하는 단계;
- 선택적으로 반응 혼합물에 결여된 뉴클레오티드를 포함하는 DNA 단편으로부터 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 DNA 단편을 단리하는 단계; 및
- 반응 혼합물에 결여된 뉴클레오티드를 포함하지 않는 DNA 단편을 서열분석하는 단계;
를 포함하며, 이로써 주형 dsDNA 분자에서 단일 가닥 파괴의 위치가 얻어진다.
일부 실시형태에서, 반응 혼합물은 친화성 리간드로 변형된 뉴클레오티드를 추가로 포함한다.
일부 실시형태에서, 친화성 리간드로 변형된 뉴클레오티드는 dATP, dCTP, dGTP, dTTP 중 하나가 아니다.
일부 실시형태에서, 상기 단리 단계는 고체 기질에 결합된 친화성 결합제에 친화성 리간드를 결합시킴으로써 수행된다.
추가 양태에서, 본 발명은 본 발명에 따른 핵산 분자를 포함하고 코딩된 DNA 의존적 DNA 중합효소를 발현하는 원핵 또는 진핵 세포에 관한 것이다.
추가 양태에서, 본 발명은 본 발명에 따른 DNA 의존적 DNA 중합효소를 단일 가닥 파괴를 포함하는 하나 이상의 dsDNA 주형 분자, 및 dsDNA 주형 분자와 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 4개의 뉴클레오티드를 포함하는 반응 혼합물과 접촉시키는 단계를 포함하는 하나 이상의 이중 가닥 DNA(dsDNA) 분자를 합성하는 방법에 관한 것이다.
추가 양태에서, 본 발명은 세포의 DNA에 돌연변이를 도입하는 방법에 관한 것으로서, 상기 방법은 상기 세포에서 본 발명에 따른 DNA 의존적 DNA 중합효소를 발현시키는 단계를 포함한다.
일부 실시형태에서, 이러한 방법은 비-치료적이다. 일부 실시형태에서, 이러한 방법은 치료 목적으로 인간 또는 동물 신체 상에서 수행되지 않는다.
일부 실시형태에서, 이러한 방법은 본 발명에 따른 숙주 세포에서의 생체 내에서 수행되며, 예를 들어, 본 발명에 따른 DNA 의존적 DNA 중합효소는 세포의 DNA에 돌연변이를 도입하기 위해 발현된다. 일부 실시형태에서, 이러한 방법은 다세포 유기체의 생체 내에서 수행된다.
일부 실시형태에서, DNA 의존적 DNA 중합효소는 유도성 프로모터 또는 조직 특이적 프로모터의 제어 하에 발현된다.
본 개시내용은 하기 상세한 설명으로부터 명백해질 것이다. 상세한 설명 및 구체적인 예는 단지 예시로서 본 발명의 바람직한 실시예를 개시한다. 당업자는 본 개시내용의 범위 내에서 변경 및 수정이 이루어질 수 있음을 상세한 설명의 안내를 통해 이해할 수 있다.
따라서, 본원에 개시된 개시내용은 그러한 장치 및 방법이 다양할 수 있기 때문에 설명된 장치 또는 설명된 방법의 단계의 특정 구성요소 부품으로 제한되지 않는다는 것을 이해해야 한다.
본 개시내용의 상기 목적뿐만 아니라, 추가적인 목적, 특징 및 이점은, 첨부된 도면과 함께, 본 개시내용의 예시적인 실시형태에 대한 하기의 예시적이고 비-제한적인 상세한 설명을 참조함으로써 보다 완전하게 이해될 것이다.
도 1은 ssDNA 파괴를 표지하기 위한 방법의 개략적인 개요를 제공한다.
도 2a 내지 2c는 본 발명에 따른 주형 dsDNA 분자에서 단일 가닥 파괴의 위치를 분석하기 위한 방법의 단계를 도시한다. 도 2d는 도면에 표시된 바와 같이, 상이한 시점에 4개의 뉴클레오티드(dATP, dGTP, dTTP 및 dCTP) 또는 3개의 뉴클레오티드(dATP, dGTP 및 dTTP)가 있는 헤어핀의 변성 PAGE 시각화 확장을 도시한다. 도 2e는 다양한 비율의 dTTP:데스티오비오틴-dUTP로 Sybrgold(적색) 및 IRDye® 800CW Streptavidin(녹색)으로 염색된 변성 PAGE를 도시한다.
도 1은 ssDNA 파괴를 표지하기 위한 방법의 개략적인 개요를 제공한다.
도 2a 내지 2c는 본 발명에 따른 주형 dsDNA 분자에서 단일 가닥 파괴의 위치를 분석하기 위한 방법의 단계를 도시한다. 도 2d는 도면에 표시된 바와 같이, 상이한 시점에 4개의 뉴클레오티드(dATP, dGTP, dTTP 및 dCTP) 또는 3개의 뉴클레오티드(dATP, dGTP 및 dTTP)가 있는 헤어핀의 변성 PAGE 시각화 확장을 도시한다. 도 2e는 다양한 비율의 dTTP:데스티오비오틴-dUTP로 Sybrgold(적색) 및 IRDye® 800CW Streptavidin(녹색)으로 염색된 변성 PAGE를 도시한다.
정의
본원에서 사용된 용어는 단지 특정 실시형태를 설명하기 위한 것이며, 제한하려는 의도가 아님을 이해해야 한다. 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 관사 "하나의"("a", "an", "the"), 및 "상기(said)"는 문맥에서 달리 명시적으로 지시하지 않는 한 하나 이상의 요소가 있음을 의미함에 유의해야 한다. 따라서, 예를 들어, "하나의 장치(a unit)" 또는 "장치(the unit)"에 대한 언급은 여러 장치 등을 포함할 수 있다. 또한, 단어 "포함하는(comprising)", "포괄하는(including)", "함유하는(containing)" 및 유사한 단어는 다른 요소 또는 단계를 배제하지 않는다. 모든 용어는 당업자가 통상적으로 부여하는 의미가 부여된다. 명확성을 위해, 몇 가지 용어가 하기 추가로 정의된다.
엑소뉴클레아제 활성 - 폴리뉴클레오티드 사슬의 끝(엑소(exo))에서 한 번에 하나 또는 몇 개(최대 10개)의 뉴클레오티드를 절단하여 작용하는 효소 활성.
오류율 - 복제 주기당 염기당 오류. 오류율은 실시예에서 기술된 바와 같이 결정될 수 있다.
서열 동일성 - 2개 이상의 뉴클레오티드 서열 사이의 유사성 정도. 2개 이상의 서열 사이의 서열 동일성은 또한, 예를 들어, 유럽 생물정보학 연구소(European Bioinformatics Institute)(문헌[Madeira F, Park YM, Lee J, et al. The EMBL-EBI search and sequence analysis tools APIs in 2019. Nucleic Acids Research. 2019 Jul;47(W1):W636-W641])에서 입수할 수 있는 쌍별(pairwise) 서열 정렬 또는 다중 서열 정렬을 위해 일반적으로 이용가능한 소프트웨어를 사용하는 정렬에 기초할 수 있다.
dsDNA - 이중-가닥 DNA
ssDNA - 단일-가닥 DNA
친화성 리간드 - 이에 특이적인 모이어티나 이에 대항하여 생성된 항체에 매우 높은 친화도로 결합할 수 있는 분자.
유도성 및 조직 특이적 프로모터 - 특정 조건 하에서, 예를 들어, 생체분자 또는 화학물질의 존재 하에서 유도될 수 있는 유전자 프로모터, 및 특정 세포 유형 또는 조직에서만 활성인 프로모터.
서열
하기 서열이 본 개시내용과 관련되어 있다.
본 발명에 따른 DNA 의존적 DNA 중합효소의 하나의 실시형태를 개시하는 SEQ ID NO: 1 및 SEQ ID NO: 2에서, TEV 인식 서열이 있는 6xHis 태그는 밑줄로 강조되어 있다. 대장균(E-coli) DNA 중합효소 I의 5´-3´엑소 도메인은 굵은 글씨로 강조되어 있다. 4xTGS 스페이서는 기울인 글씨(이탤릭체)로 강조되어 있다. 대장균(E-coli)에서 발현/번역을 위해 최적화된 코돈 용도인, 효모 트랜스레시온 DNA 중합효소 η(RAD30)는 기울인 글씨의 밑줄 로 강조되어 있다.
SEQ ID NO: 1
유형: DNA
SEQ ID NO: 2
단백질
이론적인 pI: 6.57
이론적인 Mw: 109348.19
상세한 설명
본 발명은 분자 생물학에서 유용하고 하기와 같은 특징을 나타내는 DNA 중합효소를 제공하는 것을 목적으로 한다: (1) 고도로 오류가 발생하기 쉽다(error prone), (2) 불일치(mismatched) 염기로부터 확장될 수 있다, (3) 3'에서 5'으로의 엑소뉴클레아제 활성이 없다(즉, 교정 없음), 그리고 (4) 새로운 가닥을 합성하는 동안 닉(nick) 앞에 있는 가닥을 제거하기 위한 5'에서 3'으로의 엑소뉴클레아제 활성을 갖는다. 본 발명자들은 시판되는 여러 유형의 DNA 중합효소를 조사하고 변경된 완충액 조건이 필요에 따라 수행하도록 강제할 수 있는지 조사하였지만, 원하는 특징을 얻을 수는 없었다. 따라서, 본 발명자들은 상기 명세서에 따라 수행되는 본 발명에 따른 DNA 중합효소의 조작에 착수했다.
상기에 따라, 본 발명자들은 본원에서 오류가 발생하기 쉬운 DNA 트랜스레시온 중합효소를 대장균(E Coli) DNA 중합효소 I의 5´-3´엑소뉴클레아제 도메인과 조합하여, DNA 중합효소를 조작하였다. 이러한 키메라 중합효소는 3개의 뉴클레오티드만 공급하여 DNA를 복제할 수 있다. 엑소뉴클레아제 활성은 DNA 닉으로부터 복제를 개시하도록 하고 중합효소 앞의 DNA 가닥을 제거하여 긴 스트레치의 뉴클레오티드가 교체되도록 한다. 본원에서 본 발명자들은 이러한 키메라 중합효소가 ssDNA 파괴 위치를 결정하는데 사용될 수 있고 따라서 분석을 위한 샘플을 제조하기 위한 간단한 방법을 연구 커뮤니티에 제공할 것임을 보여주었다.
필요한 모든 기능을 갖춘 DNA 중합효소를 제공하기 위해 본 발명자들은 대장균(E. Coli) DNA 중합효소 I의 5´-3´엑소뉴클레아제 도메인을 효모 트랜스레시온 DNA 중합효소 η(RAD30)과 융합하여 키메라 DNA 중합효소를 조작하였다. 이러한 키메라 중합효소의 구축 및 발현이 실시예 1에 상세하게 기술되어 있다.
이러한 키메라 중합효소가 요구되는 특징을 갖는다는 것이 실시예 2에 기술된 바와 같은 실험을 통해 확인되었다.
따라서, 제1 양태에서, 본 발명은 5'-3' 엑소뉴클레아제 활성을 갖고 3'-5' 엑소뉴클레아제 활성이 결여된 재조합 DNA 의존적 DNA 중합효소에 관한 것으로서, 상기 중합효소는 단일 불일치 염기쌍으로부터 DNA 중합을 확장 및/또는 개시할 수 있고 적어도 1:1000의 오류율을 갖는다.
일부 실시형태에서, 재조합 DNA 의존적 DNA 중합효소는 키메라 DNA 의존적 DNA 중합효소로서, 이는 5'-3' 엑소뉴클레아제 활성을 갖고 3'-5' 엑소뉴클레아제 활성이 결여된 제1 도메인, 및 불일치 염기쌍으로부터 DNA 중합을 확장하는 능력을 가진 제2 도메인을 포함한다.
일부 실시형태에서, 제1 도메인은 예를 들어 DNA 중합효소 I, T7 DNA 중합효소, 중합효소 γ, 중합효소 θ, 중합효소 υ, 엑소뉴클레아제 II 또는 Flap 구조-특이적 엔도뉴클레아제 1의 5'-3' 엑소뉴클레아제 도메인으로부터 유도된다.
따라서 5'-3' 엑소뉴클레아제 활성은 기존 효소에 5'-3' 엑소뉴클레아제 활성을 부여하는 단백질 도메인을 코딩하는 핵산을 본 발명에 따른 DNA 의존적 DNA 중합효소를 코딩하는 재조합 핵산에 포함시킴으로써 DNA 의존적 DNA 중합효소에 부여될 수 있다. 이러한 단백질 도메인, 및 이를 코딩하는 핵산이 당업계에 알려져 있다. 일부 실시형태에서, 본 발명에 따른 DNA 의존적 DNA 중합효소에 포함된 단백질 도메인은 DNA 중합효소 I, T7 DNA 중합효소, 중합효소 γ, 중합효소 θ, 중합효소 υ, 엑소뉴클레아제 II 또는 Flap 구조-특이적 엔도뉴클레아제 1의 5'-3' 엑소뉴클레아제 도메인으로부터 유도된다.
일부 실시형태에서, 중합효소는 원핵생물 또는 진핵생물 유기체, 예를 들어 박테리아, 효모, 진균, 척추동물, 및 포유류로부터 유래한다. 일부 실시형태에서, 중합효소는 대장균(E. coli), S. 세레비지애(S. cervisiae), 또는 임의의 다른 모델 유기체로부터 유래한다.
일 실시형태에서, 5'-3' 엑소뉴클레아제 활성은 5'-3' 엑소뉴클레아제 활성을 부여하는 단백질 도메인을 코딩하는 핵산을 DNA 중합효소 I에 통합시킴으로써 DNA 의존적 DNA 중합효소에 부여된다. 일 실시형태에서, DNA 중합효소 I은 대장균(E. coli)으로부터 유래한다. 일 실시형태에서, 5'-3' 엑소뉴클레아제 활성은 SEQ ID NO: 1의 뉴클레오티드 43-1011와 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성의 뉴클레오티드 서열을 갖는 핵산의 통합을 통해 DNA 의존적 DNA 중합효소에 부여된다. 일 실시형태에서, 5'-3' 엑소뉴클레아제 활성은 SEQ ID NO: 2의 아미노산 15-337과 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성을 갖는 아미노산 서열을 코딩하는 핵산의 통합을 통해 DNA 의존적 DNA 중합효소에 부여된다.
일부 실시형태에서, 제2 도메인은 트랜스레시온 DNA 중합효소로부터 유도된다.
DNA 중합효소 활성은 기존 효소에 적합한 DNA 중합효소 활성을 부여하는 단백질 도메인을 코딩하는 핵산을 본 발명에 따른 DNA 의존적 DNA 중합효소를 코딩하는 재조합 핵산에 통합시킴으로써 DNA 의존적 DNA 중합효소에 부여될 수 있으며, 생성된 DNA 의존적 DNA 중합효소에 적어도 1:1000의 오류율을 부여한다. 이러한 단백질 도메인, 및 이를 코딩하는 핵산이 당업계에 알려져 있다. 일부 실시형태에서, 본 발명에 따른 DNA 의존적 DNA 중합효소에 포함된 단백질 도메인은 DNA 중합효소 ι, DNA 중합효소 κ, DNA 중합효소 η, DNA 중합효소 ζ, DNA 중합효소 IV 또는 DNA 중합효소 V로부터 유도된다. 일부 실시형태에서, 중합효소는 대장균(E. coli), S. 세레비지애(S. cervisiae), 또는 임의의 다른 모델 유기체로부터 유래한다.
일 실시형태에서, DNA 중합효소 활성은 트랜스레시온 DNA 중합효소 η을 코딩하는 핵산의 통합을 통해 DNA 의존적 DNA 중합효소에 부여된다. 일 실시형태에서, 트랜스레시온 DNA 중합효소 η는 S. 세레비지애(S. cerevisiae)로부터 유래한다. 일 실시형태에서, DNA 중합효소 활성은 SEQ ID NO: 1의 뉴클레오티드 1048-2943과 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성의 뉴클레오티드 서열을 갖는 핵산의 통합을 통해 DNA 의존적 DNA 중합효소에 부여된다. 일 실시형태에서, DNA 중합효소 활성은 SEQ ID NO: 2의 아미노산 350-981과 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성을 갖는 아미노산 서열을 코딩하는 뉴클레오티드 서열을 갖는 핵산의 통합을 통해 DNA 의존적 DNA 중합효소에 부여된다.
추가 양태에서, 본 발명은 본 발명에 따른 DNA 의존적 DNA 중합효소를 단일 가닥 파괴를 포함하는 dsDNA 주형 분자, 및 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 3개의 뉴클레오티드를 포함하는 반응 혼합물과 접촉시키는 단계를 포함하는, 이중 가닥 DNA(dsDNA)를 합성하는 방법에 관한 것이며, 상기 반응 혼합물은 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 하나의 뉴클레오티드를 포함하지 않는다. 일 실시형태에서, 반응 혼합물은 dATP를 포함하지 않는다. 일 실시형태에서, 반응 혼합물은 dGTP를 포함하지 않는다. 일 실시형태에서, 반응 혼합물은 dTTP를 포함하지 않는다. 일 실시형태에서, 반응 혼합물은 dCTP를 포함하지 않는다. 일 실시형태에서 반응 혼합물은 dUTP를 포함한다. 이러한 방법을 수행하기 위한 예시적인 조건이 실시예 2에 기술되어 있다.
일 실시형태에서, 반응 혼합물은 친화성 리간드로 변형된 뉴클레오티드를 추가로 포함한다. 반응 혼합물에 친화성 리간드를 지닌(carrying) 뉴클레오티드를 제공하면 새롭게 합성되는 DNA 가닥에 통합되어, 예를 들어 친화성 크로마토그래피 또는 고체 기질에 대한 친화성 결합에 의해 반응으로부터 새롭게 합성된 DNA 분자를 쉽게 추출할 수 있다. 상응하는 친화성 결합제와 함께 친화성 리간드는 당업계에 잘 알려져 있다. 예는 스트렙타비딘 또는 아비딘, 디곡시제닌(DIG)/항-DIG-항체 및 디니트로페놀(DNP)/항-DNP-항체, 형광단(예를 들어, 플루오레세인) 및 항-형광단-항체(예를 들어, 항-플루오레세인-항체)와 함께 비오틴 또는 데스티오비오틴을 포함한다. 뉴클레오티드는 또한 친화성 리간드를 새롭게 합성된 DNA 분자에 커플링하기 위해 후속적으로 사용될 수 있는 5-에티닐-기를 통합하는 것과 같이, 친화성 리간드로 변형되도록 적응될 수 있다. 일 실시형태에서 친화성 결합제는 데스티오비오틴이다. 일 실시형태에서, 친화성 리간드로 변형된 뉴클레오티드는 데스티오비오티닐화된 dUTP이다. 일 실시형태에서 친화성 결합제는 데스티오비오틴이다. 일 실시형태에서, 친화성 리간드로 변형된 뉴클레오티드는 데스티오비오티닐화된 dATP이다.
본 발명은 또한 단일 가닥 파괴에 적용된 게놈 DNA의 위치를 특이적으로 표지하는 방법을 용이하게 하고 제공하는 것을 목적으로 하며, 이러한 방법은 오류가 발생하기 쉬운 DNA 중합효소 및 오직 3개의 뉴클레오티드만을 사용한다. 예를 들어, 반응에 추가된 dNTP로부터 dCTP를 제거함으로써(즉, dATP, dGTP, dTTP만 제공), 새롭게 합성된 가닥으로부터 모든 시티딘이 고갈된다. 이렇게 하면 합성된 영역에서 불일치가 발생하므로, 이러한 영역 외부에서만 DNA를 절단할 수 있는 제한 효소의 인식 부위를 파괴한다.
따라서, 일 양태에서, 본 발명은 주형 dsDNA 분자에서 단일 가닥 파괴의 위치를 수득하기 위한 방법에 관한 것으로서, 상기 방법은
- 상기 방법에 따라 dsDNA를 합성하여 주형 dsDNA 분자로부터 유래하는 제1 가닥 및 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 제2 가닥을 포함하는 하이브리드 dsDNA 분자를 수득하는 단계로서, 상기 제2 가닥의 일부에서;
- 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 제2 가닥의 일부의 외부의 하나 이상의 위치에서 하이브리드 dsDNA 분자를 절단하기 위해 반응 혼합물에 결여된 뉴클레오티드를 포함하는 제한 인식 부위를 갖는 제한 효소와 하이브리드 dsDNA 분자를 접촉시켜 DNA 단편을 수득하는 단계;
- 선택적으로 반응 혼합물에 결여된 뉴클레오티드를 포함하는 DNA 단편으로부터 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 DNA 단편을 단리하는 단계; 및
- 반응 혼합물에 결여된 뉴클레오티드를 포함하지 않는 DNA 단편을 서열분석하는 단계;
를 포함하며, 이로써 주형 dsDNA 분자에서 단일 가닥 파괴의 위치가 얻어진다.
주형 dsDNA 분자에서 단일 가닥 파괴의 위치는 하나의 뉴클레오티드가 서열에서 고갈된 지점, 예를 들어, dATP가 dNTP 혼합물로부터 제거되는 경우, 모든 아데노신이 구아노신, 티미딘 또는 시티딘으로 대체되는 서열의 위치를 식별함으로써 얻어진다. 서열 상류 병변은 4개의 뉴클레오티드를 모두 함유하지만, 닉으로부터 뉴클레오티드 중 하나가 오류가 있는 것(erroneous one)으로 대체된다. 뉴클레오티드가 대체된 하류 영역의 서열은 두 가닥 모두를 서열분석하거나, 새롭게 합성된 가닥의 서열을 참조 서열과 비교함으로써 식별될 수 있다. 상류 영역과 함께 하류 영역은 게놈 위치를 식별한다.
일 실시형태에서, 반응 혼합물은 친화성 리간드로 변형된 뉴클레오티드를 추가로 포함한다. 이는 친화성 리간드에 특이적으로 결합하는 친화성 결합제를 사용함으로써 새롭게 합성된 DNA 분자의 단리를 용이하게 하며, 상기 친화성 결합제는 바람직하게는 고체 기질에 결합한다. 친화성 리간드는 상기에 추가로 기술되어 있다. 일부 실시형태에서, 친화성 리간드로 변형된 뉴클레오티드는 dATP, dCTP, dGTP, dTTP 중 하나가 아니다. 일부 실시형태에서, 친화성 리간드로 변형된 뉴클레오티드는 dUTP이다. 친화성 리간드, 예를 들어 비오틴은 DNA 중합효소가 새로운 뉴클레오티드를 삽입한 반응 혼합물의 분획을 추출하는데 사용될 수 있다. DNA의 매우 작은 분획만이 DNA 닉을 함유할 수 있으므로, 예를 들어, 비오티닐화된 분자를 끌어내리는(pull down) 스트렙타비딘을 사용하는 친화성-기반 정제 방법은 관심 분자의 분획을 증가시킨다. 따라서, 비용이 절감된다(즉, 변형되지 않은 DNA의 서열분석 판독을 생성하지 않음).
도 1은 ssDNA 파괴를 표지하기 위한 방법의 개략적인 개요를 제공한다. 제한 효소에 의해 생성된 DNA 단편을 추출할 수 있도록, 합성에 사용된 dNTP 반응 혼합물은 예를 들어 데스티오비오티닐화된 dUTP를 끌어내리기(pull down) 위해 사용될 수 있는 변형된 뉴클레오티드의 풀(pool)을 함유할 수 있다.
처음에(도 1a) 자발적인 ssDNA 파괴가 형성되거나, 예를 들어 UDG, FPG: T4 PDG 또는 엔도 VIII에 의해 변형된 염기 또는 무염기 부위를 제거하기 위해 생성된다.
그런 다음 본 발명에 따른 오류가 발생하기 쉬운 DNA 중합효소는 DNA의 닉에 결합하여 이의 5´-3´ 엑소뉴클레아제 활성을 통해 하류 영역을 분해하고 새로운 뉴클레오티드를 통합시킨다(도 1b). 별 표시(star)는 통합된 변형된 뉴클레오티드(예를들어, 데스티오비오틴-dUTP)를 나타낸다. 또한, 오직 3개의 뉴클레오티드만이 사용되므로(dATP, dGTP, dTTP), 중합효소는 모든 dC를 dT(또는 데스티오비오틴-dU)로 대체한다.
그런 다음 제한 효소는 효소가 인식을 위해 dC를 필요로 하므로 중합된 영역(수직 막대의 왼쪽과 오른쪽)의 외부에서 DNA를 절단한다(도 1c). 데스티오비오티닐화된 DNA 단편은 오류가 발생하기 쉬운 DNA 중합효소에 의해 변형된 DNA 단편의 정제를 위해 스트렙타비딘-코팅된 비드에 의해 결합된다(도 1d).
어댑터는 다운스트림 서열분석을 위해 라이게이션된다. DNA 합성을 프라이밍하기 위해 사용되었던 DNA 닉의 위치는 먼저 잘못 통합된(misincorporated) 염기의 위치에 의해 결정된다.
일 양태에서, 본 발명은 본 발명에 따른 DNA 의존적 DNA 중합효소를 코딩하는 핵산 분자를 포함하는 숙주 세포에 관한 것이다. 이러한 숙주 세포는 원핵생물, 예를 들어 박테리아, 예를 들어 대장균(Escherichia coli), 락토바실러스 루테리(Lactobacillus reuteri), 기타 락토바실러스(Lactobacillus), 바실러스 속(Bacillus spp)일 수 있다. 숙주 세포, 또는 유기체는 또한 진핵생물, 예를 들어 효모, 예를 들어 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 피키아 패스토리스(Pichia pastoris), 또는 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 또는 진균, 예를 들어 아스퍼질러스 오리재(Aspergillus oryzae), 포유류 세포, 예를 들어 호모 사피엔스(Homo sapiens), 무스 무스쿨러스(Mus musculus), 라투스 노르베지쿠스(Rattus norvegicus) 또는 식물, 예를 들어 아라비돕시스 탈리아나(Arabidopsis thaliana)일 수 있다. 핵산 분자는 사용될 특정 종의 숙주 세포에 대해 코돈-최적화될 수 있다. 핵산은 특정 성장 조건 하에, 자극 시에 또는 세포 또는 조직의 한정된 집단에서 조절된 발현을 보장하기 위해 구성적(constitutive), 유도적(inducible), 또는 조직-특이적 프로모터에 작동 가능하게(operably) 연결될 수 있다. 이를 통해 정의된 세포 집단에서 정의된 기간 동안 돌연변이의 비율의 증가를 제어할 수 있다. 따라서, 이는 의료 연구의 여러 적용에 대한 모델 시스템으로서 사용될 수 있으며, 예를 들어 암 발달 및 진행에 대한 모델, 및 표적화된 요법에 대한 내성 발달 및 악성 세포의 돌연변이 부담이 면역 반응에서 미치는 영향을 결정하기 위한 모델 시스템으로서 사용될 수 있다.
본 발명에 따른 키메라 중합효소는 또한 생체 내에서, 예를 들어 전술된 바와 같은 숙주 세포에서 돌연변이를 생성하기 위한 대안적인 접근법을 제공하는데 사용될 수 있다. 본 발명에 따른 키메라 중합효소는 따라서 생체 내에서 돌연변이를 생성하기 위한 대안적인 접근법을 제공하며 임의의 세포 유형에서, 제어된 방식으로 돌연변이 비율을 증가시키기 위해 활용될 수 있다. 이는 박테리아 또는 진핵 세포에서 생산되는 재조합 친화성 시약의 친화성을 증가시키기 위해 적용될 수 있다. 증가된 친화성의 선택은 세포가 돌연변이되도록 유도되는 동안 수행될 수 있다, 즉, 이는 기질 상의 항원에 결합하기 위해 경쟁할 것이다. 이러한 시스템은 임의의 세포 유형에서, 재조합 친화성 시약, 또는 임의의 관심 단백질의 친화도 성숙을 제공할 것이다.
본 발명에 따른 키메라 중합효소가 전술된 바와 같은 ssDNA 파괴의 검출에 사용되는 DNA 중합효소에 대한 모든 요건을 충족함을 확인한 후, 본 발명자들은 이것이 닉이 생긴 플라스미드(nicked plasmid)에서 뉴클레오티드 서열을 변형시킬 수 있는지 추가로 분석하였다. 닉을 선택적으로 도입하기 위해, 본 발명자들은 pcDNA3.1 플라스미드에서 6개의 닉을 생성하는 Nickase Nt.BsmAI를 활용하였다. 닉이 생긴 플라스미드를 3개의 뉴클레오티드가 있는 실시예 1에서 수득된 키메라 중합효소로 15분 동안 처리한 다음, 후속적으로 제한 효소 RsaI로 소화시켰다. 어댑터를 말단에 라이게이션시키고 PCR로 증폭하였다. PCR 증폭물을 TOPO-벡터에 클로닝하고 대장균(E coli) 내로 형질전환하였다. 20개의 단일 콜로니를 선택하고 서열분석하고 이러한 콜로니 중 3개에서 닉 부위의 하류의 뉴클레오티드 교환을 검출하였다(결과가 도 3에 도시되어 있음). 데이터는 본 발명에 따른 키메라 중합효소가 닉이 생긴 DNA 분자로부터 복제를 개시할 수 있고 15분 인큐베이션 동안 적어도 40 뉴클레오티드를 합성할 수 있음을 확인시켜 주었다.
따라서, 추가 양태에서, 본 발명은 본 발명에 따른 DNA 의존적 DNA 중합효소를 단일 가닥 파괴를 포함하는 하나 이상의 dsDNA 주형 분자, 및 dsDNA 주형 분자와 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 4개의 뉴클레오티드를 포함하는 반응 혼합물과 접촉시키는 단계를 포함하는 하나 이상의 이중 가닥 DNA(dsDNA) 분자를 합성하는 방법에 관한 것이다.
일 실시형태에서, 이러한 양태에 따른 방법은 본 발명에 따른 숙주 세포의 생체 내에서 수행된다.
본원에 기술된 발명을 수행함에 있어서, 당업자는 당업계에 공지된 통상적인 일반 지식을 사용할 수 있다. 이러한 지식은 예를 들어 문헌[Molecular Cloning: A Laboratory Manual, 2nd edition (1989) (Sambrook, Fritsch, and Maniatis)]; 문헌[Molecular Cloning: A Laboratory Manual, 4th edition (2012) (Green and Sambrook)]; 문헌[Current Protocols in Molecular Biology (1987) (F.M. Ausubel et al. eds.)]; 문헌[Methods in Enzymology 시리즈(Academic Press, Inc.): PCR 2: A Practical Approach (1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.): Antibodies, A Laboratory Manual (1988) (Harlow and Lane, eds.): Antibodies A Laboratory Manual, 2nd edition 2013 (E.A. Greenfield ed.)]; 문헌[Animal Cell Culture (1987) (R.I. Freshney, ed.)]; 문헌[Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223)]; 문헌[Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829)]; 문헌[Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710)]; 문헌[Singleton e/a/., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994)], 문헌[March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, N.Y. 1992)]; 및 문헌[Marten H. Hofker and Jan van Deursen, Transgenic Mouse Methods and Protocols, 2nd edition (2011)]에서 이용가능하다.
본원에서 인용된 모든 참고문헌은 인용되어 명시적으로 포함된다.
하기 실시예는 본 발명을 추가로 설명하기 위해 제공된다. 예시적이고 유익하지만, 이들은 상기 및 첨부된 청구범위에서 정의된 바와 같이 본 발명을 제한하지 않는다.
실시예 1: 재조합 키메라 중합효소의 발현
대장균(E Coli) DNA 중합효소 I의 5´-3´엑소뉴클레아제 도메인(처음 969개 뉴클레오티드)을 효모 RAD30의 5'-말단(E. coli에서 발현하기 위한 코돈 최적화를 포함함)에 융합시켜 중합효소(SEQ ID NO: 1)를 설계하였다. 이들 사이에 짧은 스페이서(4xTGS)를 포함시켰고 TEV 인식 서열이 있는 6xHis 태그를 작제물의 5'에 위치시켜 재조합 단백질을 정제할 수 있도록 하였다. 작제물을 pBAD 벡터에 위치시켰다. 상이한 DNA 중합효소를 위한 벡터를 대장균(E. coli)(LMG194) 내로 형질전환시키고 37℃ 및 격렬한 교반에서 암피실린을 함유하는 LB 배지에서 확장시켰으며, 처음에는 밤샘 배양을 하였고 이후에는 보다 큰 생산 배양으로 옮겼다. OD600= 0.5에 도달할 때까지 생산 배양물을 배양하였다. 이후 최종 농도 0.02%의 L-아라비노스를 첨가하고 박테리아를 격렬히 교반하면서 실온에서 밤새 배양하였다. 6000 x g 및 4℃에서 15분 동안 원심분리하여 박테리아를 수확하고, EDTA(4693159001, vwr) 없이 0.2 mg/ml 리소자임, 1 mM MgCl2, 0,25% Triton-x 및 1x cOmplete 프로테아제 억제제로 보충한 결합 완충액(50 mM 소듐 포스페이트, 500 mM NaCl, pH 7.4)으로 4℃에서 30분 동안 용해하였다. 용해물을 4℃에서 13000 x g에서 15분 동안 원심분리하여 세정한 다음 용해물을 0,45 um 필터에 통과시켰다. 제조업체의 권장사항에 따라 결합 완충액으로 His GraviTrapTM TALON® 컬럼(29000594, Fisher scientific)을 평형화시킨 다음 용해물을 4℃에서 컬럼에 적용하였다. 용해물을 컬럼에 통과시킨 후 4℃에서 5 mM 이미다졸로 보충된 10mL 결합 완충액으로 2회 세척하였다. His-태깅된 중합효소를 4℃에서 50 mM 이미다졸로 보충된 결합 완충액을 사용하여 용출하였다. 용출물을 농축하고 Amicon 10 kDa 스핀 필터를 사용하여 2x 저장 완충액(50 mM Tris.HCl, 2 mM DTT, 0,2 mM EDTA 및 25℃에서 pH 7.4)으로 완충액을 교환하였다. Nanodrop을 사용하여 효소 농도를 측정한 다음 최종 농도 50%의 글리세롤을 첨가하였다.
실시예 2:
중합효소 특성 확인
2개의 올리고: 5´-CCCAAACCCAATTAATGTACTGCAGAATTCAGCTCGAAGCTT GGCCGGATCCAGCGTGGGACTGAGTC(SEQ ID NO: 3) 및 포스페이트-5´-GTCTCGTGTCTGTAAAAAC GTACGTAGATGCCATTTCTAAAAAAACAGACACGAGACGACTCAGTCCCACGCT(SEQ ID NO: 4)(각각 20 uM)를 리가제 반응 완충액(50 mM Tris-HCl, 10 mM MgCl2, 1 mM DTT, 1 mM ATP 및 25℃에서 pH 7.6)에서 T4 리가제(EL0011, Thermo Scientific)로 4℃에서 밤새 라이게이션하여 51개 염기의 오버행이 있는 헤어핀 형상의 DNA 단편(SEQ ID NO: 5)을 형성하였다(도 2a). 오버행을 연장시키고 블런트-말단의 헤어핀을 생성하기 위해, 최종 농도 0,02 uM의 DNA 단편을 헤어핀에 혼성화하는 올리고뉴클레오티드 5'-CCGGCCAAGC TTCGAGCTGAATTCTGCAGTACATTAATTGGGTTTGGG(SEQ ID NO: 6)와 혼합하고(도 2b) 0,1 mM MnCl2. 0,05 uM Sloppymerase로 보충된 1x NEBufferTM2(B7002S, New England Biolabs, 50 mM NaCl, 10 mM Tris-HCl, 10 mM MgCl2, 1 mM DTT 및 25℃에서 pH 7.9)에서 인큐베이션하고 4개의 뉴클레오티드, 즉 각각 최종 농도가 0,1 mM인 dATP, dCTP, dGTP 및 dTTP 또는 3개의 뉴클레오티드 즉 dATP(0,1 mM), dGTP(0,1 mM) 및 dTTP(0,2 mM)를 반응에 첨가하였다. 비오티닐화된 뉴클레오티드의 도입을 위해, 0,1 mM의 dTTP에 0,1 mM의 데스티오비오틴-X-(5-아미노알릴)-dUTP를 보충하였다. 그런 다음 샘플을 37℃에서 120분 동안 인큐베이션하였다. 효소를 75℃에서 20분 동안 열 불활성화시켰다.
샘플을 변성 폴리아크릴아미드 겔 전기영동(PAGE: polyacrylamide gel electrophoresis)으로 실행시켰다. DNA를 시각화하기 위해, 겔을 1x SYBRTM Gold Nucleic Acid Gel Stain(S11494, Thermo Fisher Scientific)으로 염색하였다. 또한, 데스티오비오티닐화된 뉴클레오티드의 혼입을 시각화하기 위해, 0,2 ug/ml의 최종 농도의 IRDye® 800CW 스트렙타비딘(926-32230, LI-COR Biosciences)으로 겔을 염색하였다.
Sloppymerase로 처리한 샘플을 메뉴얼에 따라 PhusionTM High-Fidelity DNA 중합효소를 사용하여 PCR로 증폭시켰다. 블런트-말단의 PCR 생성물을 에탄올 침전으로 정제하였다. 그런 다음 정제한 PCR 산물을 Zero Blunt® TOPO® PCR 클로닝(450245, Thermo Fisher Scientific)을 사용하여 플라스미드 벡터 내로 클로닝하였다. 클로닝 및 One ShotTM TOP10 화학적으로 유능한(Chemically competent) 대장균(E. coli)(C404010)의 후속 형질전환의 경우 제조업체의 권장사항을 따랐다. PureLink® Quick Plasmid Miniprep Kit(K210011, Thermo Fisher Scientific)를 사용하여 플라스미드 DNA를 단리한 후 서열분석을 위해 샘플을 Eurofins Genomics로 보냈다.
5'-오버행을 갖도록 설계한 DNA 헤어핀을 확장시켜 오류율을 결정하였다. 그런 다음 4개의 뉴클레오티드(dCTP, dGTP, dATP, dTTP) 또는 3개의 뉴클레오티드(dCTP, dGTP, dTTP)(즉 dATP 생략)를 사용하여 본 발명에 따른 DNA 중합효소에 의해 헤어핀을 확장시켰다. 확장을 변성 PAGE 상에서 확인하였고 어댑터를 확장된 헤어핀에서 라이게이션시켰다. 그런 다음 증폭 및 서열분석을 위해 어댑터의 프라이머 부위와 헤어핀의 루프의 프라이머 부위를 활용하여, DNA 서열분석을 위해 생성물을 보냈다. 잘못 통합된 뉴클레오티드, 결실 및 삽입의 빈도를 결정하기 위해 판독물을 분석하였다. DNA 헤어핀의 서열을 올리고디자인(oligodesign)으로 설정하였지만, 오류율이 낮은 교정 DNA 중합효소(Phusion DNA 중합효소)에 의한 헤어핀의 DNA 합성 확장에 의해 도입된 오류를 제어하기 위해 비교로서 사용하였다. Phusion DNA 중합효소에 대해 결정된 것 이상의 잘못된 통합(misincorporation), 결실 및 삽입의 빈도를 실제 오류로 간주하였고 본 발명에 따른 DNA 중합효소에 대한 오류율, 확장된 헤어핀에서 발생한 오류 빈도를 결정하는데 사용하였다.
3개의 뉴클레오티드만이 제공되었을 때 키메라 중합효소가 DNA를 복제할 수 있는지 여부를 결정하기 위해, 본 발명자들은 52개의 뉴클레오티드("올리고 1(oligo 1)" 도 2a)의 5'-오버행이 있는 142개 뉴클레오티드(SEQ ID NO: 5)의 전술된 DNA 헤어핀을 설계하였다. 오버행은 여러 제한 효소에 대한 인식 부위를 포함한다. 5´-3´ 엑소뉴클레아제 활성을 모니터링하기 위해, 본 발명자들은 헤어핀에 상보적인 49개의 뉴클레오티드(SEQ ID NO: 6)가 있는 올리고뉴클레오티드에 헤어핀을 혼성화하여, 3개의 뉴클레오티드("올리고 2(oligo 2)" 도 2a)의 갭을 생성하였다. 프라이머와 주형이 함께 연결됨에 따라, 복제는 변성 PAGE에서 길이 증가(즉, 142개에서 194개 뉴클레오티드로)로서 측정된다. 49개의 뉴클레오티드 크기의 밴드가 사라지면 키메라 중합효소의 엑소뉴클레아제 활성이 나타난다. 4개의 dNTP가 모두 함께 제공되는 경우 키메라 중합효소는 올바른 뉴클레오티드로 헤어핀을 확장하고 하나의 뉴클레오티드, 예를 들어 dATP가 혼합물에서 제거될 때(도 2b) 몇 가지 불일치가 생성된다(도 2c). 이러한 불일치는 제한 효소에 대한 인식 부위를 파괴할 것이며 따라서 합성된 영역 외부의 영역만 절단될 것이다. 데스티오비오티닐화된 dUTP와 같은 친화성 리간드로 변형된 뉴클레오티드를 포함시키면 새롭게 합성된 dsDNA에 친화성 리간드가 통합되어 친화성 분리가 용이해진다.
키메라 중합효소를 3개의 뉴클레오티드(dATP, dGTP 및 dTTP) 또는 4개의 뉴클레오티드와 함께 상기 기술된 올리고뉴클레오티드 시스템과 함께 인큐베이션하였고 반응을 상이한 시점(5, 15, 30, 60 및 120분)에서 중단시켰다. 그런 다음 샘플을 변성 PAGE에서 실행하고 증폭을 헤어핀의 크기 증가로서 결정하였으며 엑소뉴클레아제 활성을 혼성화된 올리고뉴클레오티드의 분해로 결정하였다(도 2d). 데이터는 키메라 중합효소가 엑소뉴클레아제 활성뿐만 아니라 중합 활성을 가지며 또한 감소된 속도일지라도 단지 3개의 뉴클레오티드의 존재 하에서 중합을 허용하기에 충분히 낮은 충실도를 갖는다는 것을 분명히 보여준다. 확장된 헤어핀의 서열분석은 반응 혼합물에서 dCTP를 생략하면 반응 혼합물에 4개의 뉴클레오티드가 모두 존재할 때(표 1, dNTP)와 대조적으로 C가 없는 생성물(표 1, -dCTP)을 생성함을 보여준다. 잘못 통합된 뉴클레오티드는 굵은 문자로 표시하였고, C가 통합되어야 하는 위치, 즉 상보적 DNA 가닥에서 G가 위치하는 위치는 음영 열(화살표로 표시됨)로 표시하였다.
[표 1]
키메라 중합효소가 데스티오비오틴-dUTP를 통합시킬 수 있는지 확인하기 위해, dTTP에 대해 다양한 비율로 데스티오비오틴-dUTP를 첨가하고, 3개 또는 4개의 뉴클레오티드가 존재하는(즉, dCTP가 있거나 없는) 실험을 수행하였다. PAGE 겔을 Sybrgold로 염색하여 DNA를 시각화하고 IRDye® 800CW 스트렙타비딘으로 통합된 데스티오비오틴-dUTP를 시각화하였으며 키메라 중합효소가 또한 변형된 dNTP를 성공적으로 통합함을 보여주었다(도 2e).
SEQUENCE LISTING
<110> S철derberg Ola
<120> New DNA polymerase and use thereof
<130> P42001903SE00
<150> SE2051265-3
<151> 2020-10-30
<160> 6
<170> BiSSAP 1.3.6
<210> 1
<211> 2946
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA polymerase
<400> 1
atgcatcacc atcaccatca cgaaaacctg tattttcagg gcatggttca gatcccccaa 60
aatccactta tccttgtaga tggttcatct tatctttatc gcgcatatca cgcgtttccc 120
ccgctgacta acagcgcagg cgagccgacc ggtgcgatgt atggtgtcct caacatgctg 180
cgcagtctga tcatgcaata taaaccgacg catgcagcgg tggtctttga cgccaaggga 240
aaaacctttc gtgatgaact gtttgaacat tacaaatcac atcgcccgcc aatgccggac 300
gatctgcgtg cacaaatcga acccttgcac gcgatggtta aagcgatggg actgccgctg 360
ctggcggttt ctggcgtaga agcggacgac gttatcggta ctctggcgcg cgaagccgaa 420
aaagccgggc gtccggtgct gatcagcact ggcgataaag atatggcgca gctggtgacg 480
ccaaatatta cgcttatcaa taccatgacg aataccatcc tcggaccgga agaggtggtg 540
aataagtacg gcgtgccgcc agaactgatc atcgatttcc tggcgctgat gggtgactcc 600
tctgataaca ttcctggcgt accgggcgtc ggtgaaaaaa ccgcgcaggc attgctgcaa 660
ggtcttggcg gactggatac gctgtatgcc gagccagaaa aaattgctgg gttgagcttc 720
cgtggcgcga aaacaatggc agcgaagctc gagcaaaaca aagaagttgc ttatctctca 780
taccagctgg cgacgattaa aaccgacgtt gaactggagc tgacctgtga acaactggaa 840
gtgcagcaac cggcagcgga agagttgttg gggctgttca aaaagtatga gttcaaacgc 900
tggactgctg atgtcgaagc gggcaaatgg ttacaggcca aaggggcaaa accagccgcg 960
aagccacagg aaaccagtgt tgcagacgaa gcaccagaag tgacggcaac gacaggcagc 1020
accgggtcga ctgggagtac gggttccatg tctaagttta catggaaaga gttaattcaa 1080
ttaggcagtc catcgaaagc atacgagtcc tcattagctt gtatcgcaca tattgatatg 1140
aatgcgttct tcgcccaggt ggagcagatg cgttgtggcc tgtctaagga ggatcccgta 1200
gtatgcgttc agtggaacag catcattgcg gtgtcttatg ctgctcgcaa atacggcatc 1260
tcccgtatgg acaccatcca ggaggctctg aagaaatgct cgaacttaat ccctattcat 1320
acggccgtct tcaagaaagg agaagatttc tggcagtacc atgatgggtg tgggtcgtgg 1380
gtacaggacc ccgcgaagca aatctcggtc gaggatcaca aggtttcact ggagccctat 1440
cgtcgtgaat cacgcaaggc gcttaaaatc ttcaagtcgg catgcgattt ggtagagcgt 1500
gcctctattg acgaggtatt ccttgacttg ggacgtatct gctttaacat gttaatgttt 1560
gacaatgagt acgaattgac aggggactta aagttaaaag atgcactgtc taatattcgc 1620
gaagccttta tcggggggaa ttatgatatt aactcgcatt taccgcttat tcctgagaaa 1680
attaagagct tgaagtttga gggggatgtt tttaatcccg aaggccgtga cctgatcacc 1740
gactgggacg acgtgattct tgcacttggg agccaggttt gcaaaggtat tcgcgacagt 1800
attaaagaca tcttgggcta tacaacctca tgcgggcttt catcaacgaa aaacgtctgt 1860
aaacttgctt caaactataa gaagcctgac gcccagacta ttgtcaagaa tgactgtctt 1920
ctggattttt tggactgcgg aaagttcgag attacatcct tttggacgct gggtggagtc 1980
ttgggaaagg aactgattga tgtccttgac ttacctcatg agaactcgat caaacacatt 2040
cgtgagacat ggcctgacaa cgccggacag ttgaaggagt ttctggacgc caaggtcaaa 2100
caatctgatt atgatcgctc gacctctaac atcgaccctt tgaaaaccgc tgatctggcc 2160
gaaaagcttt ttaaactttc gcgcggtcgt tacggacttc cattatcttc acgtccggtt 2220
gttaagtcta tgatgtccaa caaaaacctg cgtggtaagt cgtgcaattc catcgttgac 2280
tgtatttcct ggttagaagt attctgcgcc gagctgacat cccgcattca ggatcttgaa 2340
caagagtata acaagattgt catccctcgt acagtctcga tctcactgaa aactaaatcg 2400
tacgaagtgt accgtaagtc agggccggtg gcctacaagg gcatcaattt tcaaagccac 2460
gagttattga aagtcgggat caaatttgta accgaccttg acattaaagg gaaaaataaa 2520
tcctactatc cgttaacgaa gctgtctatg accattacta acttcgacat catcgatttg 2580
caaaaaactg ttgtggacat gtttgggaac caagtacaca catttaagtc ctcggcgggc 2640
aaagaggacg aggagaagac aactagcagt aaggcggatg aaaagacacc gaaactggaa 2700
tgttgtaaat atcaagtgac tttcacggac caaaaagcac ttcaagagca tgctgactac 2760
cacctggctt taaagctttc tgagggtctg aatggagcgg aggagagcag taaaaatttg 2820
tcctttggcg aaaagcgctt gctgttctct cgtaaacgtc caaacagtca acacactgct 2880
actccccaga aaaagcaggt tacttcatca aaaaatattc ttagtttctt cactcgtaaa 2940
aaatga 2946
<210> 2
<211> 981
<212> PRT
<213> Artificial Sequence
<220>
<223> DNA polymerase
<400> 2
Met His His His His His His Glu Asn Leu Tyr Phe Gln Gly Met Val
1 5 10 15
Gln Ile Pro Gln Asn Pro Leu Ile Leu Val Asp Gly Ser Ser Tyr Leu
20 25 30
Tyr Arg Ala Tyr His Ala Phe Pro Pro Leu Thr Asn Ser Ala Gly Glu
35 40 45
Pro Thr Gly Ala Met Tyr Gly Val Leu Asn Met Leu Arg Ser Leu Ile
50 55 60
Met Gln Tyr Lys Pro Thr His Ala Ala Val Val Phe Asp Ala Lys Gly
65 70 75 80
Lys Thr Phe Arg Asp Glu Leu Phe Glu His Tyr Lys Ser His Arg Pro
85 90 95
Pro Met Pro Asp Asp Leu Arg Ala Gln Ile Glu Pro Leu His Ala Met
100 105 110
Val Lys Ala Met Gly Leu Pro Leu Leu Ala Val Ser Gly Val Glu Ala
115 120 125
Asp Asp Val Ile Gly Thr Leu Ala Arg Glu Ala Glu Lys Ala Gly Arg
130 135 140
Pro Val Leu Ile Ser Thr Gly Asp Lys Asp Met Ala Gln Leu Val Thr
145 150 155 160
Pro Asn Ile Thr Leu Ile Asn Thr Met Thr Asn Thr Ile Leu Gly Pro
165 170 175
Glu Glu Val Val Asn Lys Tyr Gly Val Pro Pro Glu Leu Ile Ile Asp
180 185 190
Phe Leu Ala Leu Met Gly Asp Ser Ser Asp Asn Ile Pro Gly Val Pro
195 200 205
Gly Val Gly Glu Lys Thr Ala Gln Ala Leu Leu Gln Gly Leu Gly Gly
210 215 220
Leu Asp Thr Leu Tyr Ala Glu Pro Glu Lys Ile Ala Gly Leu Ser Phe
225 230 235 240
Arg Gly Ala Lys Thr Met Ala Ala Lys Leu Glu Gln Asn Lys Glu Val
245 250 255
Ala Tyr Leu Ser Tyr Gln Leu Ala Thr Ile Lys Thr Asp Val Glu Leu
260 265 270
Glu Leu Thr Cys Glu Gln Leu Glu Val Gln Gln Pro Ala Ala Glu Glu
275 280 285
Leu Leu Gly Leu Phe Lys Lys Tyr Glu Phe Lys Arg Trp Thr Ala Asp
290 295 300
Val Glu Ala Gly Lys Trp Leu Gln Ala Lys Gly Ala Lys Pro Ala Ala
305 310 315 320
Lys Pro Gln Glu Thr Ser Val Ala Asp Glu Ala Pro Glu Val Thr Ala
325 330 335
Thr Thr Gly Ser Thr Gly Ser Thr Gly Ser Thr Gly Ser Met Ser Lys
340 345 350
Phe Thr Trp Lys Glu Leu Ile Gln Leu Gly Ser Pro Ser Lys Ala Tyr
355 360 365
Glu Ser Ser Leu Ala Cys Ile Ala His Ile Asp Met Asn Ala Phe Phe
370 375 380
Ala Gln Val Glu Gln Met Arg Cys Gly Leu Ser Lys Glu Asp Pro Val
385 390 395 400
Val Cys Val Gln Trp Asn Ser Ile Ile Ala Val Ser Tyr Ala Ala Arg
405 410 415
Lys Tyr Gly Ile Ser Arg Met Asp Thr Ile Gln Glu Ala Leu Lys Lys
420 425 430
Cys Ser Asn Leu Ile Pro Ile His Thr Ala Val Phe Lys Lys Gly Glu
435 440 445
Asp Phe Trp Gln Tyr His Asp Gly Cys Gly Ser Trp Val Gln Asp Pro
450 455 460
Ala Lys Gln Ile Ser Val Glu Asp His Lys Val Ser Leu Glu Pro Tyr
465 470 475 480
Arg Arg Glu Ser Arg Lys Ala Leu Lys Ile Phe Lys Ser Ala Cys Asp
485 490 495
Leu Val Glu Arg Ala Ser Ile Asp Glu Val Phe Leu Asp Leu Gly Arg
500 505 510
Ile Cys Phe Asn Met Leu Met Phe Asp Asn Glu Tyr Glu Leu Thr Gly
515 520 525
Asp Leu Lys Leu Lys Asp Ala Leu Ser Asn Ile Arg Glu Ala Phe Ile
530 535 540
Gly Gly Asn Tyr Asp Ile Asn Ser His Leu Pro Leu Ile Pro Glu Lys
545 550 555 560
Ile Lys Ser Leu Lys Phe Glu Gly Asp Val Phe Asn Pro Glu Gly Arg
565 570 575
Asp Leu Ile Thr Asp Trp Asp Asp Val Ile Leu Ala Leu Gly Ser Gln
580 585 590
Val Cys Lys Gly Ile Arg Asp Ser Ile Lys Asp Ile Leu Gly Tyr Thr
595 600 605
Thr Ser Cys Gly Leu Ser Ser Thr Lys Asn Val Cys Lys Leu Ala Ser
610 615 620
Asn Tyr Lys Lys Pro Asp Ala Gln Thr Ile Val Lys Asn Asp Cys Leu
625 630 635 640
Leu Asp Phe Leu Asp Cys Gly Lys Phe Glu Ile Thr Ser Phe Trp Thr
645 650 655
Leu Gly Gly Val Leu Gly Lys Glu Leu Ile Asp Val Leu Asp Leu Pro
660 665 670
His Glu Asn Ser Ile Lys His Ile Arg Glu Thr Trp Pro Asp Asn Ala
675 680 685
Gly Gln Leu Lys Glu Phe Leu Asp Ala Lys Val Lys Gln Ser Asp Tyr
690 695 700
Asp Arg Ser Thr Ser Asn Ile Asp Pro Leu Lys Thr Ala Asp Leu Ala
705 710 715 720
Glu Lys Leu Phe Lys Leu Ser Arg Gly Arg Tyr Gly Leu Pro Leu Ser
725 730 735
Ser Arg Pro Val Val Lys Ser Met Met Ser Asn Lys Asn Leu Arg Gly
740 745 750
Lys Ser Cys Asn Ser Ile Val Asp Cys Ile Ser Trp Leu Glu Val Phe
755 760 765
Cys Ala Glu Leu Thr Ser Arg Ile Gln Asp Leu Glu Gln Glu Tyr Asn
770 775 780
Lys Ile Val Ile Pro Arg Thr Val Ser Ile Ser Leu Lys Thr Lys Ser
785 790 795 800
Tyr Glu Val Tyr Arg Lys Ser Gly Pro Val Ala Tyr Lys Gly Ile Asn
805 810 815
Phe Gln Ser His Glu Leu Leu Lys Val Gly Ile Lys Phe Val Thr Asp
820 825 830
Leu Asp Ile Lys Gly Lys Asn Lys Ser Tyr Tyr Pro Leu Thr Lys Leu
835 840 845
Ser Met Thr Ile Thr Asn Phe Asp Ile Ile Asp Leu Gln Lys Thr Val
850 855 860
Val Asp Met Phe Gly Asn Gln Val His Thr Phe Lys Ser Ser Ala Gly
865 870 875 880
Lys Glu Asp Glu Glu Lys Thr Thr Ser Ser Lys Ala Asp Glu Lys Thr
885 890 895
Pro Lys Leu Glu Cys Cys Lys Tyr Gln Val Thr Phe Thr Asp Gln Lys
900 905 910
Ala Leu Gln Glu His Ala Asp Tyr His Leu Ala Leu Lys Leu Ser Glu
915 920 925
Gly Leu Asn Gly Ala Glu Glu Ser Ser Lys Asn Leu Ser Phe Gly Glu
930 935 940
Lys Arg Leu Leu Phe Ser Arg Lys Arg Pro Asn Ser Gln His Thr Ala
945 950 955 960
Thr Pro Gln Lys Lys Gln Val Thr Ser Ser Lys Asn Ile Leu Ser Phe
965 970 975
Phe Thr Arg Lys Lys
980
<210> 3
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligo 1 from Example 2
<400> 3
cccaaaccca attaatgtac tgcagaattc agctcgaagc ttggccggat ccagcgtggg 60
actgagtc 68
<210> 4
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligo 2
<400> 4
gtctcgtgtc tgtaaaaacg tacgtagatg ccatttctaa aaaaacagac acgagacgac 60
tcagtcccac gct 73
<210> 5
<211> 141
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligo 1+2
<400> 5
cccaaaccca attaatgtac tgcagaattc agctcgaagc ttggccggat ccagcgtggg 60
actgagtcgt ctcgtgtctg taaaaacgta cgtagatgcc atttctaaaa aaacagacac 120
gagacgactc agtcccacgc t 141
<210> 6
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligo 3
<400> 6
ccggccaagc ttcgagctga attctgcagt acattaattg ggtttggg 48
Claims (20)
- 5'-3' 엑소뉴클레아제 활성을 갖고, 3'-5' 엑소뉴클레아제 활성이 결여된 재조합 DNA 의존적 DNA 중합효소로서,
상기 중합효소는 불일치 염기쌍(mismatched base pair)으로부터 DNA 중합을 확장할 수 있고, 적어도 1:1000의 오류율(error rate)을 갖는, 재조합 DNA 의존적 DNA 중합효소. - 제1항에 있어서, 5'-3' 엑소뉴클레아제 활성을 갖고, 3'-5' 엑소뉴클레아제 활성이 결여된 제1 도메인, 및 불일치 염기쌍으로부터 DNA 중합을 확장하는 능력을 가진 제2 도메인을 포함하는 키메라 DNA 의존적 DNA 중합효소인, 재조합 DNA 의존적 DNA 중합효소.
- 제2항에 있어서, 제1 도메인은 DNA 중합효소 I의 5'-3' 엑소뉴클레아제 도메인이고, 제2 도메인은 트랜스레시온(translesion) DNA 중합효소 η인, 재조합 DNA 의존적 DNA 중합효소.
- 제1항 내지 제3항 중 어느 한 항에 있어서, SEQ ID NO: 2의 아미노산 15~337 및 350~981과 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성의 아미노산 서열을 갖는, 재조합 DNA 의존적 DNA 중합효소.
- 제1항 내지 제4항 중 어느 한 항의 재조합 DNA 의존적 DNA 중합효소를 코딩하는, 핵산 분자.
- 제5항에 있어서, SEQ ID NO: 1의 뉴클레오티드 43~1011 및 1048~2943과 적어도 50%, 예를 들어 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성의 뉴클레오티드 서열을 갖는, 핵산 분자.
- 제1항 내지 제5항 중 어느 한 항의 DNA 의존적 DNA 중합효소를 단일 가닥 파괴(single strand break)를 포함하는 dsDNA 주형 분자, 및 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 3개의 뉴클레오티드를 포함하는 반응 혼합물과 접촉시키는 단계를 포함하는, 이중 가닥 DNA(dsDNA)를 합성하는 방법으로서,
상기 반응 혼합물은 dATP, dGTP, dTTP 및 dCTP로부터 선택되는 하나의 뉴클레오티드를 포함하지 않는, dsDNA를 합성하는 방법. - 제7항에 있어서, 반응 혼합물은 dUTP를 추가로 포함하는, dsDNA를 합성하는 방법.
- 제7항 또는 제8항에 있어서, 반응물에 포함된 뉴클레오티드는 친화성 리간드로 변형되거나, 변형되도록 적응되는, dsDNA를 합성하는 방법.
- 제9항에 있어서, 친화성 리간드는 데스티오비오틴(desthiobiotin)인, dsDNA를 합성하는 방법.
- 제9항 또는 제10항에 있어서, 친화성 리간드로 변형된 뉴클레오티드는 dUTP인, dsDNA를 합성하는 방법.
- 주형 dsDNA 분자에서 단일 가닥 파괴의 위치를 수득하는 방법으로서,
상기 방법은
- 제7항 내지 제11항 중 어느 한 항의 방법에 따라 dsDNA를 합성하여 주형 dsDNA 분자로부터 유래하는 제1 가닥 및 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 제2 가닥을 포함하는 하이브리드 dsDNA 분자를 수득하는 단계로서, 상기 제2 가닥의 일부에서;
- 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 제2 가닥의 일부의 외부의 하나 이상의 위치에서 하이브리드 dsDNA 분자를 절단하기 위해 반응 혼합물에 결여된 뉴클레오티드를 포함하는 제한 인식 부위를 갖는 제한 효소와 하이브리드 dsDNA 분자를 접촉시켜 DNA 단편을 수득하는 단계;
- 선택적으로 반응 혼합물에 결여된 뉴클레오티드를 포함하는 DNA 단편으로부터 반응 혼합물에 포함되지 않은 뉴클레오티드가 결여된 DNA 단편을 단리하는 단계; 및
- 반응 혼합물에 결여된 뉴클레오티드를 포함하지 않는 DNA 단편을 서열분석하는 단계;
를 포함하며, 이로써 주형 dsDNA 분자에서 단일 가닥 파괴의 위치가 얻어지는, 방법. - 제12항에 있어서, 반응 혼합물은 친화성 리간드로 변형된 뉴클레오티드를 추가로 포함하는, 방법.
- 제13항에 있어서, 친화성 리간드로 변형된 뉴클레오티드는 dATP, dCTP, dGTP, dTTP 중 하나가 아닌, 방법.
- 제13항 또는 제14항에 있어서, 제12항의 단리 단계는 고체 기질에 결합된 친화성 결합체에 친화성 리간드를 결합시킴으로써 수행되는, 방법.
- 제5항 또는 제6항의 핵산 분자를 포함하고, 코딩된 DNA 의존적 DNA 중합효소를 발현하는 원핵 또는 진핵 세포.
- 세포의 DNA에 돌연변이를 도입하는 방법으로서,
상기 방법은 상기 세포에서 제1항 내지 제4항 중 어느 한 항의 DNA 의존적 DNA 중합효소를 발현시키는 단계를 포함하는, 방법. - 제17항에 있어서, 상기 방법은 제16항의 세포의 생체 내에서 수행되는, 방법.
- 제18항에 있어서, 상기 방법은 다세포 유기체의 생체 내에서 수행되는, 방법.
- 제17항 내지 제19항 중 어느 한 항에 있어서, DNA 의존적 DNA 중합효소의 발현은 유도성 프로모터 또는 조직 특이적 프로모터의 제어 하에 있는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE2051265 | 2020-10-30 | ||
SE2051265-3 | 2020-10-30 | ||
PCT/SE2021/051028 WO2022093091A1 (en) | 2020-10-30 | 2021-10-19 | New polymerase and use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240004213A true KR20240004213A (ko) | 2024-01-11 |
Family
ID=78463876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237017769A KR20240004213A (ko) | 2020-10-30 | 2021-10-19 | 신규 중합효소 및 이의 용도 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230399684A1 (ko) |
EP (1) | EP4237547A1 (ko) |
JP (1) | JP2023548440A (ko) |
KR (1) | KR20240004213A (ko) |
CN (1) | CN116783292A (ko) |
AU (1) | AU2021370172A1 (ko) |
CA (1) | CA3197038A1 (ko) |
IL (1) | IL302510A (ko) |
WO (1) | WO2022093091A1 (ko) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1765995A2 (en) * | 2004-05-20 | 2007-03-28 | The Government of the United States of America as represented by The Secretary of the Department of Health and Human Services | Thermostable y-family polymerases and chimeras |
US20070009922A1 (en) * | 2005-01-04 | 2007-01-11 | Stratagene California | Hot start polymerase reaction using a thermolabile blocker |
EP2986719B1 (en) * | 2013-12-06 | 2020-07-29 | Bio-Rad Laboratories, Inc. | Fusion polymerases |
-
2021
- 2021-10-19 CN CN202180088632.6A patent/CN116783292A/zh active Pending
- 2021-10-19 IL IL302510A patent/IL302510A/en unknown
- 2021-10-19 EP EP21801252.4A patent/EP4237547A1/en active Pending
- 2021-10-19 CA CA3197038A patent/CA3197038A1/en active Pending
- 2021-10-19 US US18/034,338 patent/US20230399684A1/en active Pending
- 2021-10-19 WO PCT/SE2021/051028 patent/WO2022093091A1/en active Application Filing
- 2021-10-19 KR KR1020237017769A patent/KR20240004213A/ko unknown
- 2021-10-19 JP JP2023551645A patent/JP2023548440A/ja active Pending
- 2021-10-19 AU AU2021370172A patent/AU2021370172A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3197038A1 (en) | 2022-05-05 |
JP2023548440A (ja) | 2023-11-16 |
AU2021370172A1 (en) | 2023-06-08 |
WO2022093091A1 (en) | 2022-05-05 |
EP4237547A1 (en) | 2023-09-06 |
US20230399684A1 (en) | 2023-12-14 |
CN116783292A (zh) | 2023-09-19 |
IL302510A (en) | 2023-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114410625B (zh) | 通过Cas9-crRNA复合物的RNA指导的DNA裂解 | |
CN107922931B (zh) | 热稳定的Cas9核酸酶 | |
CN107075511B (zh) | 合成子的形成 | |
KR20240007322A (ko) | Ruvc 도메인이 존재하는 효소 | |
KR102278495B1 (ko) | Dna 생산 방법 및 dna 단편 연결용 키트 | |
JP2001511018A (ja) | 多型核酸フラグメントを分析または型分類するためのポリメラーゼおよびその使用 | |
JP2015109852A (ja) | 核酸分子のインビトロでの連結および組み合わせアセンブリのための方法 | |
JP7025552B2 (ja) | 無細胞系でdnaを編集する方法 | |
WO2009110606A1 (ja) | 相同組換え方法およびクローニング方法並びにキット | |
WO2003087301A2 (en) | Methods and compositions for dna manipulation | |
JP2003510052A (ja) | 改良されたポリヌクレオチド合成のための方法と組成物 | |
CA3054881A1 (en) | Method of replicating or amplifying circular dna | |
WO2019128836A1 (zh) | 一种改进的启动子及其应用 | |
KR20240055073A (ko) | 클래스 ii, v형 crispr 시스템 | |
KR20240053585A (ko) | 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법 | |
JP2022522397A (ja) | 環状及び線状dna分子を規則正しく構築する方法 | |
KR20240004213A (ko) | 신규 중합효소 및 이의 용도 | |
JP2002543795A (ja) | 核酸合成の感度および特異性の増大のための組成物および方法 | |
JP2002522042A (ja) | ポリメラーゼ活性を有する熱安定性invitro複合体 | |
JP4808361B2 (ja) | 新規dna合成酵素 | |
JP5051423B2 (ja) | 改変型の耐熱性RecAタンパク質、及び該タンパク質を用いた核酸増幅方法 | |
WO2022210748A1 (ja) | 新規なガイドrnaとの複合体形成能を有するポリペプチド | |
WO2004020621A1 (ja) | 耐熱性リボヌクレアーゼh | |
EP2682479A1 (en) | METHOD FOR DNA AMPLIFICATION BASED ON THE ORIGINS OF REPLICATION OF THE BACTERIOPHAGE phi29 AND ASSOCIATED NUCLEOTIDE SEQUENCES | |
WO2024024583A1 (ja) | 次世代シーケンサー解析等のための断片化及びタグメント化方法 |