CN117568312A - 一种从头设计的中温核酸内切酶蛋白及其制备方法与应用 - Google Patents
一种从头设计的中温核酸内切酶蛋白及其制备方法与应用 Download PDFInfo
- Publication number
- CN117568312A CN117568312A CN202311547124.7A CN202311547124A CN117568312A CN 117568312 A CN117568312 A CN 117568312A CN 202311547124 A CN202311547124 A CN 202311547124A CN 117568312 A CN117568312 A CN 117568312A
- Authority
- CN
- China
- Prior art keywords
- kmago
- protein
- endonuclease
- temperature
- variant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004533 Endonucleases Human genes 0.000 title claims abstract description 42
- 108010042407 Endonucleases Proteins 0.000 title claims abstract description 42
- 238000002360 preparation method Methods 0.000 title abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 51
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 47
- 239000012634 fragment Substances 0.000 claims abstract description 19
- 102000008682 Argonaute Proteins Human genes 0.000 claims abstract description 8
- 108010088141 Argonaute Proteins Proteins 0.000 claims abstract description 8
- 241000957589 Kurthia massiliensis Species 0.000 claims abstract description 5
- 108020004414 DNA Proteins 0.000 claims description 34
- 238000000034 method Methods 0.000 claims description 17
- 102000039446 nucleic acids Human genes 0.000 claims description 14
- 108020004707 nucleic acids Proteins 0.000 claims description 14
- 150000007523 nucleic acids Chemical class 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 102000040430 polynucleotide Human genes 0.000 claims description 7
- 108091033319 polynucleotide Proteins 0.000 claims description 7
- 239000002157 polynucleotide Substances 0.000 claims description 7
- 238000010362 genome editing Methods 0.000 claims description 6
- 238000000338 in vitro Methods 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 5
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 230000007018 DNA scission Effects 0.000 claims 2
- 108091092584 GDNA Proteins 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 23
- 102000004190 Enzymes Human genes 0.000 abstract description 17
- 108090000790 Enzymes Proteins 0.000 abstract description 17
- 102000008300 Mutant Proteins Human genes 0.000 abstract description 8
- 108010021466 Mutant Proteins Proteins 0.000 abstract description 8
- 230000003197 catalytic effect Effects 0.000 abstract description 7
- 238000012216 screening Methods 0.000 abstract description 7
- 101710163270 Nuclease Proteins 0.000 abstract description 5
- 238000011160 research Methods 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 150000001413 amino acids Chemical group 0.000 description 9
- 102000053602 DNA Human genes 0.000 description 8
- 108020004682 Single-Stranded DNA Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- 238000013461 design Methods 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 101100454361 Arabidopsis thaliana LCB1 gene Proteins 0.000 description 6
- 101100171146 Oryza sativa subsp. japonica DREB2C gene Proteins 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- 241001123227 Saccharomyces pastorianus Species 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 239000011535 reaction buffer Substances 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- -1 AP23 Proteins 0.000 description 3
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 3
- 241000235650 Kluyveromyces marxianus Species 0.000 description 3
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 3
- 101100350479 Nicotiana tabacum AP24 gene Proteins 0.000 description 3
- 101100216185 Oryza sativa subsp. japonica AP25 gene Proteins 0.000 description 3
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 3
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 3
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000009368 gene silencing by RNA Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000222178 Candida tropicalis Species 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- 241000235072 Saccharomyces bayanus Species 0.000 description 2
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 2
- 241000192263 Scheffersomyces shehatae Species 0.000 description 2
- 241000235060 Scheffersomyces stipitis Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- HZNVUJQVZSTENZ-UHFFFAOYSA-N 2,3-dichloro-5,6-dicyano-1,4-benzoquinone Chemical compound ClC1=C(Cl)C(=O)C(C#N)=C(C#N)C1=O HZNVUJQVZSTENZ-UHFFFAOYSA-N 0.000 description 1
- JZODKRWQWUWGCD-UHFFFAOYSA-N 2,5-di-tert-butylbenzene-1,4-diol Chemical compound CC(C)(C)C1=CC(O)=C(C(C)(C)C)C=C1O JZODKRWQWUWGCD-UHFFFAOYSA-N 0.000 description 1
- IKHKJYWPWWBSFZ-UHFFFAOYSA-N 4-[[4-(diethylamino)phenyl]-(4-diethylazaniumylidenecyclohexa-2,5-dien-1-ylidene)methyl]benzene-1,3-disulfonate;hydron Chemical compound C1=CC(N(CC)CC)=CC=C1C(C=1C(=CC(=CC=1)S([O-])(=O)=O)S(O)(=O)=O)=C1C=CC(=[N+](CC)CC)C=C1 IKHKJYWPWWBSFZ-UHFFFAOYSA-N 0.000 description 1
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 1
- YMZMTOFQCVHHFB-UHFFFAOYSA-N 5-carboxytetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(C(O)=O)C=C1C([O-])=O YMZMTOFQCVHHFB-UHFFFAOYSA-N 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000588771 Morganella <proteobacterium> Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 1
- 241001466077 Salina Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Landscapes
- Enzymes And Modification Thereof (AREA)
Abstract
本发明公开了一种从头设计的中温核酸内切酶蛋白及其制备方法与应用,通过广泛而深入的研究,进行大量筛选,获得了对于KmAgo酶的活性具有显著改善的突变型的蛋白,是基于kurthia massiliensis的中温核酸酶Argonaute的从头设计的多点突变蛋白或其活性片段、变异形式、衍生蛋白。本发明所述中温核酸内切酶蛋白KmAgo在10至80℃温度范围内具有核酸酶活性。中温核酸内切酶蛋白KmAgo的酶催化活性较野生型显著提高,具有更好的高温热稳定性。
Description
技术领域
本发明属于蛋白质工程技术领域,涉及一种从头设计的中温核酸内切酶蛋白及其制备方法与应用。
背景技术
Argonaute(Ago)蛋白作为RNA诱导的沉默复合物(RISC)的重要组成部分,对小分子RNA的剪切与招募发挥着非常关键的作用,是继RNA干扰(RNAi)发现之后颇受关注的一个蛋白家族。目前发现,Argonaute蛋白广泛存在于真核和原核生物中,并且在真核和原核生物中的功能各有不同,在真核物中Ago蛋白主要参与RNAi过程,在形成RISC复合体中起到重要的作用;而在原核生物中,Ago蛋白主要起到宿主防御功能,参与细菌对外源基因入侵的防御机制以及参与宿主的复制及损伤修复。
原核生物来源的Argonaute蛋白(简称pAgos)相比eAgos功能和结构更加多样化,但其生理功能长期以来难以捉摸。早期研究主要集中于高温生物来源的pAgos,除了MpAgo偏爱利用5’末端羟基化(5’OH)的RNA向导(gDNA)切割靶单链DNA(single-stranded DNA,ssDNA)和靶RNA之外,其余高温来源的pAgos都偏爱利用5’末端磷酸化(5’P)的gDNA切割靶ssDNA和/或靶RNA。高温生物来源的pAgos在中温条件下都只有低水平的gDNA引导的靶ssDNA和/或靶RNA切割活性,这限制了基于高温pAgos的应用开发。最近的研究开始集中于中温生物来源的pAgos,以期找到能够在中温条件下有效切割靶DNA和/或靶RNA的pAgos。与现在常用的CRISPR-Cas9和CRISPR-Cas12a/13a类似,也有人建议将pAgos用作下一代基因组编辑工具。但KmAgo蛋白在中温环境下核酸内切酶活性水平较低,这极大限制了其在基因编辑和核酸检测等领域的应用。
传统蛋白质工程技术如定向进化对天然蛋白序列进行小的扰动,本质是一种试错方法,在不采用高通量筛选手段时效率很低,且难以创造出具有新结构和新功能的蛋白。而伴随着计算机技术和AI的快速发展,计算机在酶工程中的应用使得酶的序列空间探索度不断被扩大。而从结构功能的需求出发,通过计算手段确定氨基酸序列的方法,既可以用于蛋白质从头设计,也更多地被应用于既有蛋白质的改造设计,是亟待推动的发展方向。
因此,针对该蛋白迫切需要开发一种可以获得高催化活性的KmAgo突变体的方法。并且借助对KmAgo催化活力的改造也将进一步推动蛋白质从头设计技术的发展。
发明内容
有鉴于此,本发明的目的在于提供一种从头设计的中温核酸内切酶蛋白及其制备方法与应用,酶催化活性显著提高,且具有非常好的热稳定性。
为达到上述目的,本发明提供如下技术方案:
1、一种从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白,所述中温核酸内切酶蛋白KmAgo选自SEQ ID NO.1~11所示的氨基酸序列(具体为AP1、AP2、AP7、AP10、AP14、AP16、AP21、AP22、AP23、AP24、AP25),或与SEQ ID NO.1~11具有至少50%同一性的氨基酸序列;所述中温核酸内切酶来源于中温原核生物kurthiamassiliensis。
作为优选的技术方案之一,所述中温核酸内切酶蛋白KmAgo选自SEQ ID NO.2、SEQID NO.3、SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.11所示的氨基酸序列,即AP2、AP7、AP16、AP21、AP22、AP23、AP25。
作为进一步优选的技术方案之一,所述中温核酸内切酶蛋白KmAgo选自SEQ IDNO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.11所示的氨基酸序列,即AP21、AP22、AP23、AP25。
作为更进一步优选的技术方案之一,所述中温核酸内切酶蛋白KmAgo选自SEQ IDNO.8、SEQ ID NO.9所示的氨基酸序列,即AP22、AP23。
作为优选的技术方案之一,所述中温为10~80℃,进一步优选为32~44℃,更进一步优选为37℃。
作为优选的技术方案之一,所述中温核酸内切酶蛋白KmAgo的酶活力Q1,与野生型的酶活力Q0的比值:Q1/Q0为≥4,较佳地≥5,更佳地≥7,最佳地≥8。
作为进一步优选的技术方案之一,所述中温核酸内切酶蛋白KmAgo的酶活力Q1,与野生型的酶活力Q0的比值:Q1/Q0比值为4.0~5.0,较佳的为7.0~8.6。
作为优选的技术方案之一,所述的活性片段、变异形式、衍生蛋白包括:
在SEQ ID NO.1~11所示序列上具有一个或几个(例如通常为1-30个,较佳地1-10个,更佳地1-6个,再佳地1-3个、最佳地1个)氨基酸残基的缺失、插入和/或取代后,仍然具有定向剪切单链DNA活性(cA1),该活性显著高于SEQ ID NO.12所示野生型KmAgo酶的相应活性(cA0),所述显著高于为(cA1-cA0)/cA0≥10%-800%中的任意数值,例如≥15%、≥20%、≥40%、≥50%、≥100%、≥200%、或≥600%或更高;
蛋白的修饰(通常不改变一级结构),具体形式包括:体内或体外的蛋白的化学衍生形式如乙酰化或羧基化;糖基化;具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列;被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的蛋白;
前述蛋白或其活性片段与其他蛋白或标记物形成的融合蛋白或偶联物;
含有一种或多种其他的突变,从而进一步提升从头设计的中温核酸内切酶蛋白KmAgo的酶切活性。
2、一种分离的多核苷酸,其编码前述中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白。
3、一种载体,其含有前述分离的多核苷酸。
作为优选的技术方案之一,所述载体为重组表达载体,是指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒或其他载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
作为优选的技术方案之一,所述的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与编码本发明实施例中的中温核酸内切酶蛋白KmAgo的核苷酸序列相同或者是简并的变异体。
4、一种宿主细胞,其含有前述载体,或其核酸中含有前述分离的多核苷酸。
作为优选的技术方案之一,所述宿主细胞包括来源于以下微生物的细胞:
酿酒酵母(Saccharomyces cerevisiae)、毕赤酵母(Pichia pastoris)、摩纳酵母(Saccharo mycesmonacensis)、贝酵母(Saccharomyces bayanus)、巴氏酵母(Saccharomyces pastorianus)、卡氏酵母(Saccharomyces carlsbergensis)、粟酒裂殖酵母(Saccharomyces pombe)、马克斯克鲁维酵母(Kluyveromyces marxiamus)、乳酸克鲁维酵母(Kluyveromyces lactis)、脆壁克鲁维酵母(Kluyveromyces fragilis),树干毕赤酵母(Pichia stipites)、休哈塔假丝酵母(Candida shehatae)、热带假丝酵母(Candidatropicalis)、大肠杆菌(Escherichia coli)。
可通过本领域常规的重组转化方法获得本发明从头设计蛋白,并且所述从头设计蛋白可以在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超声处理、高压匀浆、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、亲和层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。获得本发明所述宿主细胞可表达中温核酸内切酶蛋白KmAgo。
作为进一步优选的技术方案之一,在适合表达的条件下,培养宿主细胞,从而表达中温核酸内切酶蛋白KmAgo;和
分离所述中温核酸内切酶蛋白KmAgo。
获得的中温核酸内切酶蛋白KmAgo还可任选地进行纯化,从而获得更纯的蛋白产物。
作为更进一步优选的技术方案之一,所述的适合表达的条件包括本领域常规的技术,而纯化技术包括镍柱纯化,离子交换层析等。
5、前述一种从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白的制备方法,培养前述宿主细胞,从而表达所述的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白。
6、前述一种从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白在核酸检测、基因编辑中的应用。
7、一种基于前述从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白的体外切割DNA的体系,包括:
(A)向导DNA(gDNA),所述向导DNA(gDNA)靶向结合于预定的靶位点;和
(B)可编程核酸内切酶Argonaute(KmAgo),其中,可编程核酸内切酶为前述的KmAgo突变蛋白或其活性片段、变异形式、衍生蛋白;和
(C)靶DNA(target DNA),所述靶DNA具有与所述向导DNA大部分互补的核苷酸序列。
作为优选的技术方案之一,所述向导DNA的长度为21~45nt,进一步优选为15~21nt,更进一步优选为16~18nt。
作为优选的技术方案之一,所述向导DNA与所述靶核酸之间具有反向互补的片段。
作为优选的技术方案之一,所述靶DNA是携带报告分子的靶核酸,所述报告分子是分别携带荧光基团和淬灭基团的核酸分子。
作为进一步优选的技术方案之一,所述荧光基团包括:FAM、HEX、CY5、CY3、VIC、JOE、TET、5-TAMRA、ROX、Texas Red-X,或其组合,更进一步优选为FAM。
作为进一步优选的技术方案之一,所述猝灭基团包括:BHQ、TAMRA、DABCYL、DDQ,或其组合,更进一步优选为BHQ。
8、基于前述体系的一种体外切割DNA的方法,具体步骤如下:
S1.基于KmAgo和gDNA形成KmAgo-向导复合物;
S2.令KmAgo-向导复合物与靶DNA接触,所述KmAgo-向导复合物在特定位点切割靶DNA。
作为优选的技术方案之一,所述KmAgo及KmAgo-向导复合物的核酸酶活性需要存在至少一种选自Mn2+,Mg2+,Ca2+,Cu2+,Fe2+,Co2+,Zn2+和Ni2+或其中任意组合的二价金属离子。
作为进一步优选的技术方案之一,所述KmAgo及KmAgo-向导复合物的阳离子是Mn2 +。
作为进一步优选的技术方案之一,二价金属离子的浓度为10μM~3mM,更进一步优选为10μM~200mM,更进一步优选为20μM。
本发明的有益效果在于:
本发明通过广泛而深入的研究,进行大量筛选,获得了对于KmAgo酶的活性具有显著改善的突变型的蛋白,是基于kurthia massiliensis的中温核酸酶Argonaute(KmAgo,SEQ ID NO.12所示的野生型序列)的从头设计的多点突变蛋白或其活性片段、变异形式、衍生蛋白。
本发明借助GNN模型学习不同pAgo蛋白结构信息,辅以Alpahfold等筛选方法来选择AI从头设计的Ago蛋白,通过筛选获得酶催化活性提高的突变体。在本发明中,最终选择的高活性突变体共11个,选自SEQ ID NO.1~11所示的氨基酸序列(具体为AP1、AP2、AP7、AP10、AP14、AP16、AP21、AP22、AP23、AP24、AP25),或与SEQ ID NO.1~11具有至少50%同一性的氨基酸序列。
本发明所述中温核酸内切酶蛋白KmAgo在10至80℃,优选的中温条件指32至44℃的温度范围内具有核酸酶活性,更进一步优选在37℃下具有核酸酶活性。中温核酸内切酶蛋白KmAgo的酶催化活性较野生型显著提高,具有更好的高温热稳定性。
中温核酸内切酶蛋白KmAgo显著提升了定向剪切单链DNA靶标的活性,活性提升可达400%至860%,从而为病原体检测、基因分型、病程监测等提供帮助。本发明的方法可对胞外的遗传物质进行位点特异性修饰,因此可以有效地应用在核酸检测和基因编辑等生物技术领域。这提高了该蛋白在核酸检测技术领域中的应用潜力,同时也为开发新的基因操作工具奠定了基础。
本发明的主要优点如下:
1、本发明筛选得到的突变型,与野生型相比,酶催化活性显著提高,最大可达至8.6倍;
2、本发明的突变体的热稳定性,没有因为突变而受到不良影响,保持非常好的热稳定性;
3、本发明的突变体,在核酸检测技术,以及开发基因编辑工具技术中,都有应用潜力。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明。
图1为野生型KmAgo和突变体的SDS-PAGE电泳图,其中,M:Marker;泳道1:纯化WT样品;泳道2-12:纯化突变体蛋白样品;
图2野生型KmAgo和突变体的底物剪切效率与时间曲线图;
图3为野生型KmAgo和突变体的剪切活性比较图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
实施例1野生型KmAgo质粒载体的构建与合成及突变体的选择
在NCBI数据库中搜索KmAgo野生型的核苷酸序列,送生工生物公司合成,经密码子优化后,选择pET28a(+)载体,选择NdeI和XhoI双酶切位点,将公司合成的质粒产物转化至大肠杆菌Ecoli-BL21(DE3)感受态中,涂布平板(含有50μg/ml卡那霉素),37℃倒置过夜培养,第二天挑取单菌落送测序验证质粒序列是否正确,经比对正确后,提质粒。质粒提取步骤参照Axygen质粒小提试剂盒说明书。质粒浓度由Nano-300测定。
本发明所涉及的来源中温原核菌kurthia massiliensis的Argonaute蛋白(KmAgo)的野生型(WT)氨基酸序列如SEQ ID NO.12所示。
通过已有的GNN模型对KmAgo进行从头设计,辅以Alpahfold等筛选方法来选择AI从头设计的KmAgo蛋白。
实施例2从头设计蛋白的表达与剪切活性测定
转化pET28a-KmAgo质粒至大肠杆菌BL21(DE3),单菌落接种到含有50μg/mL卡那霉素的LB液体培养基中,于37℃、220rpm的摇床上摇瓶培养,当菌体OD600达到0.6-0.8时,添加终浓度0.5mM IPTG(异丙基-β-D-硫代半乳糖苷)后移至18℃摇床过夜。4000rpm离心15-20min收集菌体,用Buffer A(20mM Tris-HCl pH 7.5,500mM NaCl,10mM咪唑)洗菌后,将菌体重悬于Buffer A,超声破碎。13,300rpm离心45min,收集上清。上清过滤后,进行Ni-NTA纯化。使用10mM、20mM和250mM咪唑各洗1个柱体积,收集含有高纯度目的蛋白的洗脱组分,超滤换液至Buffer B(20mM Tris-HCl pH 7.5,500mM NaCl)。收集纯化的蛋白并用SDS-聚丙烯酰胺凝胶鉴定纯度(图1)。将蛋白分成小份,经液氮速冻后,储存在-80℃。
设计16nt gDNA序列与30nt的靶DNA序列,送公司合成。gDNA与靶DNA的序列见表1。
表1.gDNA与靶DNA的序列
配置反应缓冲液(含15mM Tris-HCl pH 8.8、250mM NaCl),在反应缓冲液中加入终浓度20μM的MnCl2、100nM KmAgo、1μM合成的gDNA和1μM互补单链DNA靶标核酸,在490nm的激发波长和550nm的发射波长下反应在37℃反应120min,测定终点时荧光值,每个实验做三个重复。如图3所示。
配置反应缓冲液(含15mM Tris-HCl pH 8.8、250mM NaCl),在反应缓冲液中加入终浓度20μM的MnCl2、100nM KmAgo、1μM合成的gDNA和1μM互补单链DNA靶标核酸,37℃下孵育30min,取6-10μL样品,按1:1比例(体积比)加入上样缓冲液(含质量浓度95%(去离子)甲酰胺,0.5mmol/L EDTA,质量浓度0.025%溴酚蓝,质量浓度0.025%二甲苯蓝),在16%的核酸Urea-PAGE下进行电泳检测,如图2所示。
结果
酶活力提升数据如表2所示,经过筛选得到11个酶活力提高的从头设计蛋白AP1,AP2,AP7,AP10,AP14,AP16,AP21,AP22,AP23,AP24与AP25。
表2.酶活力提升情况
图3为KmAgo从头设计蛋白活性提高柱状图。结果表明,突变体蛋白活性较野生型蛋白可最多提高至8.6倍。且可在体外应用于基因检测,具有良好的应用前景。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (8)
1.一种从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白,其特征在于,所述中温核酸内切酶蛋白KmAgo选自SEQ ID NO.1~11所示的氨基酸序列,或与SEQ ID NO.1~11具有至少50%同一性的氨基酸序列;所述中温核酸内切酶来源于中温原核生物kurthia massiliensis。
2.一种分离的多核苷酸,其特征在于,其编码权利要求1所述中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白。
3.一种载体,其特征在于,其含有权利要求2所述分离的多核苷酸。
4.一种宿主细胞,其特征在于,其含有权利要求3所述载体,或其核酸中含有权利要求2所述分离的多核苷酸。
5.权利要求1所述一种从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白的制备方法,其特征在于,培养权利要求4所述宿主细胞,从而表达权利要求1所述的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白。
6.权利要求1所述一种从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白在核酸检测、基因编辑中的应用。
7.一种基于权利要求1所述从头设计的中温核酸内切酶蛋白KmAgo或其活性片段、变异形式、衍生蛋白的体外切割DNA的体系,其特征在于,包括:
(A)向导DNA,所述向导DNA靶向结合于预定的靶位点;和
(B)可编程核酸内切酶Argonaute,其中,可编程核酸内切酶为前述的KmAgo突变蛋白或其活性片段、变异形式、衍生蛋白;和
(C)靶DNA,所述靶DNA具有与所述向导DNA大部分互补的核苷酸序列。
8.基于权利要求7所述体系的一种体外切割DNA的方法,其特征在于,具体步骤如下:
S1.基于KmAgo和gDNA形成KmAgo-向导复合物;
S2.令KmAgo-向导复合物与靶DNA接触,所述KmAgo-向导复合物在特定位点切割靶DNA。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311547124.7A CN117568312A (zh) | 2023-11-20 | 2023-11-20 | 一种从头设计的中温核酸内切酶蛋白及其制备方法与应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311547124.7A CN117568312A (zh) | 2023-11-20 | 2023-11-20 | 一种从头设计的中温核酸内切酶蛋白及其制备方法与应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117568312A true CN117568312A (zh) | 2024-02-20 |
Family
ID=89860134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311547124.7A Pending CN117568312A (zh) | 2023-11-20 | 2023-11-20 | 一种从头设计的中温核酸内切酶蛋白及其制备方法与应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117568312A (zh) |
-
2023
- 2023-11-20 CN CN202311547124.7A patent/CN117568312A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023169228A1 (zh) | 一种新型嗜热核酸内切酶突变体及其制备方法和应用 | |
CN113234702B (zh) | 一种Lt1Cas13d蛋白及基因编辑系统 | |
JP5804378B2 (ja) | クルイベロマイセス・マルシアヌス由来の高発現プロモーター | |
JP2024504439A (ja) | エステラーゼ変異体及びその用途 | |
CN106589134A (zh) | 嵌合蛋白pAgoE及构建方法、应用以及使用向导的嵌合蛋白pAgoE及构建方法、应用 | |
CN110592035B (zh) | 一种羰基还原酶的突变体、重组表达载体及其在生产手性醇中的应用 | |
EP0877084B1 (en) | Thermostable diaphorase gene | |
CN117568312A (zh) | 一种从头设计的中温核酸内切酶蛋白及其制备方法与应用 | |
CN113999826B (zh) | 一种细菌漆酶变构体及其制备方法 | |
Xiong et al. | High efficiency and throughput system in directed evolution in vitro of reporter gene | |
CN116286743A (zh) | 一种中温核酸内切酶突变蛋白及其制备方法与应用 | |
CN111019915B (zh) | 羰基还原酶突变体在手性邻位卤代-α-苯乙醇合成中的应用 | |
CN114230644A (zh) | 一种gp32蛋白突变体、重组载体及其构建方法和应用 | |
CN117025571A (zh) | 一种常温限制性核酸内切酶突变蛋白及其制备方法与应用 | |
CN114164223B (zh) | 一种南极土壤来源的酯酶及其编码基因与应用 | |
KR101411920B1 (ko) | 신규 리비톨 탈수소화효소 및 이를 이용한 l-리불로스의 생산방법 | |
CN115786296B (zh) | 一种内消旋-二氨基庚二酸脱氢酶突变体及生产方法 | |
EP4330386A2 (en) | Enzymes with ruvc domains | |
EP3889269A2 (en) | Dna-cutting agent | |
WO2023049789A2 (en) | Yeast cells with reduced propensity to degrade acrylic acid | |
CN118272339A (zh) | 一种蛋白质及其制备方法和应用、生物材料及其应用 | |
Wang et al. | Engineering for an HPV 9-valent Vaccine using Genomic Constitutive Over-expression and Low Lipopolysaccharide Levels in Escherichia Coli Cells | |
CN116064476A (zh) | 一种非限制性核酸内切酶突变体及其制备方法 | |
CN115838712A (zh) | 具有肌肽水解酶功能的蛋白酶及其在l-肌肽合成中的应用 | |
CN117586415A (zh) | 一种重组Ulp1融合蛋白酶及其制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |