CN117327683A - 一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统 - Google Patents
一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统 Download PDFInfo
- Publication number
- CN117327683A CN117327683A CN202311178714.7A CN202311178714A CN117327683A CN 117327683 A CN117327683 A CN 117327683A CN 202311178714 A CN202311178714 A CN 202311178714A CN 117327683 A CN117327683 A CN 117327683A
- Authority
- CN
- China
- Prior art keywords
- lncbe
- editing
- nls
- protein
- ugi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 139
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 83
- 239000013598 vector Substances 0.000 claims abstract description 65
- 108020004414 DNA Proteins 0.000 claims abstract description 48
- 108020005196 Mitochondrial DNA Proteins 0.000 claims abstract description 30
- 101000884048 Burkholderia cenocepacia (strain H111) Double-stranded DNA deaminase toxin A Proteins 0.000 claims abstract description 28
- 102000000311 Cytosine Deaminase Human genes 0.000 claims abstract description 28
- 108091093105 Nuclear DNA Proteins 0.000 claims abstract description 14
- 230000035772 mutation Effects 0.000 claims abstract description 14
- 230000001506 immunosuppresive effect Effects 0.000 claims abstract description 13
- 241000904817 Lachnospiraceae bacterium Species 0.000 claims abstract description 11
- 206010062016 Immunosuppression Diseases 0.000 claims abstract description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 42
- 102000053602 DNA Human genes 0.000 claims description 29
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 27
- 239000002773 nucleotide Substances 0.000 claims description 27
- 125000003729 nucleotide group Chemical group 0.000 claims description 25
- 229940104302 cytosine Drugs 0.000 claims description 21
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 20
- 150000001413 amino acids Chemical class 0.000 claims description 12
- 230000025608 mitochondrion localization Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 9
- 210000003855 cell nucleus Anatomy 0.000 claims description 6
- 230000030648 nucleus localization Effects 0.000 claims description 6
- 229960003444 immunosuppressant agent Drugs 0.000 claims description 5
- 230000001861 immunosuppressant effect Effects 0.000 claims description 5
- 239000003018 immunosuppressive agent Substances 0.000 claims description 5
- 230000002401 inhibitory effect Effects 0.000 claims description 4
- 230000007457 establishment of nucleus localization Effects 0.000 claims description 3
- 201000010099 disease Diseases 0.000 claims description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 108060003393 Granulin Proteins 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 claims 1
- 102000017941 granulin Human genes 0.000 claims 1
- YIEDSISPYKQADU-UHFFFAOYSA-N n-acetyl-n-[2-methyl-4-[(2-methylphenyl)diazenyl]phenyl]acetamide Chemical compound C1=C(C)C(N(C(C)=O)C(=O)C)=CC=C1N=NC1=CC=CC=C1C YIEDSISPYKQADU-UHFFFAOYSA-N 0.000 claims 1
- 238000010362 genome editing Methods 0.000 abstract description 4
- 108091062167 DNA cytosine Proteins 0.000 abstract description 2
- 238000010171 animal model Methods 0.000 abstract description 2
- 230000001717 pathogenic effect Effects 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 30
- 239000012634 fragment Substances 0.000 description 15
- 238000000034 method Methods 0.000 description 10
- 230000032965 negative regulation of cell volume Effects 0.000 description 10
- 230000002438 mitochondrial effect Effects 0.000 description 9
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 8
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 8
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 8
- 229960000723 ampicillin Drugs 0.000 description 8
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 6
- 210000003470 mitochondria Anatomy 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 238000010442 DNA editing Methods 0.000 description 5
- 208000012268 mitochondrial disease Diseases 0.000 description 5
- 108700012359 toxins Proteins 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 229950010131 puromycin Drugs 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000004186 co-expression Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 101100062880 Burkholderia cenocepacia (strain H111) dddA gene Proteins 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 230000009946 DNA mutation Effects 0.000 description 2
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 208000031873 Animal Disease Models Diseases 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 231100000699 Bacterial toxin Toxicity 0.000 description 1
- 241000371430 Burkholderia cenocepacia Species 0.000 description 1
- 101000883965 Burkholderia cenocepacia (strain H111) Double-stranded DNA deaminase immunity protein Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 230000011206 DNA cytosine deamination Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 206010052641 Mitochondrial DNA mutation Diseases 0.000 description 1
- 206010058799 Mitochondrial encephalomyopathy Diseases 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108050002485 Sirtuin Proteins 0.000 description 1
- 102000011990 Sirtuin Human genes 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 238000011558 animal model by disease Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000000688 bacterial toxin Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000032537 response to toxin Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04001—Cytosine deaminase (3.5.4.1)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明公开了一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统。该编辑系统通过工程化改造Lachnospiraceae bacterium sunii NSJ‑8来源的双链DNA胞嘧啶脱氨基酶DddA结构域的分割蛋白来构建骨架载体,相较于原始版本的脱氨基酶,能够在DNA上实现更加高效的在靶编辑和极低的脱靶编。同时公开了一种DNA双链脱氨基酶免疫抑制蛋白,能够有效抑制LnCBE编辑系统核DNA脱靶编辑。该LnCBE编辑系统可用于制备基因编辑试剂盒,构建C/G到T/A的线粒体DNA致病突变动物模型,为基因编辑技术提供了新的工具。
Description
技术领域
本发明属于基因编辑技术领域,是一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统。
背景技术
线粒体疾病是一类严重危害人类健康可致残致死的母性遗传疾病,如线粒体脑肌病、共济失调等。线粒体疾病常由细胞核基因突变和线粒体DNA突变引起,特别地,针对线粒体DNA(mtDNA)突变造成的线粒体疾病更是束手无策,其中最重要的原因是缺少线粒体基因编辑工具构建线粒体疾病动物模型,以开展系统的分子机制研究和治疗方法探索。
由于RNA无法进入线粒体,因此现有的基于CRISPR的编辑工具无法用来编辑mtDNA。通过融合线粒体定位信号肽的限制性内切酶、mito-ZFN和mito-TALEN可以对突变的mtDNA引入DNA双链断裂(DSB),以降低突变mtDNA的比例。然而,这些方法不能实现对mtDNA进行单个碱基的精准编辑,因此不能用来构建mtDNA突变动物疾病模型,也无法用于探索线粒体疾病的精准治疗。
来自Burkholderia cenocepacia的细菌毒素蛋白的DddA功能域即DddAtox具有双链DNA脱氨基酶活性,通过和TALE相连形成胞嘧啶碱基编辑器(DdCBE),可以实现线粒体中定点C/G到T/A的突变。但是,原始版本的DdCBE只能对线粒体DNA上的“tC”基序中的C进行编辑,通过噬菌体进化得到的DdCBE突变体V6和V11的版本,提高了编辑效率,拓宽了编辑序列偏好性,但是针对“gC”基序中的C编辑的效率依然很低,且会在全线粒体DNA上造成脱靶编辑,无法实现精准编辑,同时也会在核DNA上造成核脱靶,严重影响了其在生物应用方面的安全性。
发明内容
本发明的目的是针对现有技术的上述不足,提供一种精确高效的DNA胞嘧啶编辑系统LnCBE,并且通过DddIA抑制其核脱靶编辑,可以实现对“gC”基序中的C进行高效精确编辑。
本发明的另一目的是提供该系统的应用。
本发明的目的可通过以下技术方案实现:
一种双链DNA胞嘧啶脱氨基酶DddA结构域,该DddA结构域为Lachnospiraceaebacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域,Uniprot ID为A0A7G9FZY2,基因名简称为FZY2。
本发明所述的胞嘧啶脱氨基酶DddA结构域氨基酸序列如SEQ ID NO:1所示。
编码本发明所述的胞嘧啶脱氨基酶DddA结构域的基因。
作为本发明的一种优选,所述的胞嘧啶脱氨基酶DddA结构域的编码基因序列如SEQ ID NO:2所示。
来自本发明所述DddA结构域的分割蛋白,按该DddA的结构域的氨基酸结构特征选择在S100位点进行分割得到一对half DddA的分割蛋白,为:S100N和S100C,分割蛋白成对使用;S100N氨基酸序列如SEQ ID NO:3所示,S100C氨基酸序列如SEQ ID NO:5所示。
编码本发明所述的分割蛋白的基因。
作为本发明的一种优选,编码S100N的核苷酸序列如SEQ ID NO:4所示,编码S100C的核苷酸序列如SEQ ID NO:6所示。
增强版分割蛋白,在上述的分隔蛋白的氨基酸序列中引入突变,用于提高原始蛋白脱氨基酶活性,得到的增强版分割蛋白的氨基酸序列如下所示:S100N-mut1氨基酸序列如SEQ ID NO:7所示,S100N-mut2氨基酸序列如SEQ ID NO:9所示,S100C-mut3氨基酸序列如SEQ ID NO:11所示。
编码本发明所述的增强版分割蛋白的基因。
作为本发明的一种优选,S100N-mut1编码基因序列如SEQ ID NO:8所示,S100N-mut2编码基因序列如SEQ ID NO:10所示;S100C-mut3编码基因序列如SEQ ID NO:12所示。
本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域或其编码基因、所述的分割蛋白或其编码基因、所述的增强版分割蛋白或其编码基因在构建对gC基序中的C实现高效C/G到T/A的高保真编辑系统LnCBE中的应用,所述的应用不包含对人的疾病治疗。
采用本发明所述的编码增强版分割蛋白的基因构建的胞嘧啶编辑系统LnCBE。
作为本发明的一种优选,所述胞嘧啶编辑系统LnCBE,包括RVD文库、线粒体定位骨架载体和/或细胞核定位骨架载体,用于实现线粒体DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用MTS-LnCBE骨架载体,用于实现细胞核DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用NLS-LnCBE骨架载体。
作为本发明的一种优选,5个线粒体定位骨架载体(即MTS-LnCBE骨架载体)分别为:MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI;5个细胞核定位骨架载体(即NLS-LnCBE骨架载体)分别为:NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。
使用时由于分割蛋白配对使用,因此,相应的线粒体定位骨架载体或细胞核定位骨架载体也应按照S100N-mut1和S100C配对,S100N-mut2和S100C配对,S100N-mut1和S100C-mut3配对,S100N-mut2和S100C-mut3配对的原则配对使用。即:MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-UGI配对使用,MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-UGI配对使用,MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-mut3-UGI配对使用,MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-mut3-UGI配对使用;NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-UGI配对使用,NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-UGI配对使用,NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-mut3-UGI配对使用,NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-mut3-UGI配对使用。
作为本发明的一种优选,MTS-TALE骨架载体的核苷酸序列如SEQ ID NO:13所示;NLS-TALE骨架载体的核苷酸序列如SEQ ID NO:14所示;UGI编码基因的核苷酸序列如SEQID NO:15所示。
一种双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddIA,该蛋白为Lachnospiraceaebacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白,Uniprot ID为A0A7G9FY10,能够抑制LnCBE编辑系统在核DNA中的脱靶编辑;该免疫抑制蛋白的氨基酸序列如SEQ ID NO:18所示。
编码所述的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddIA的基因。
作为本发明的一种优选,编码所述的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddIA的基因核苷酸序列如SEQ ID NO:19所示。
采用本发明所述脱氨基酶免疫抑制蛋白DddIA、或其所述的基因构建NLS-FZY2-DddIA载体。
作为本发明的一种优选,所述的NLS-FZY2-DddIA载体包含细胞核定位骨架载体、Flag标签蛋白及编码FZY2-DddIA的基因序列。
作为本发明的一种优选,细胞核定位骨架载体的核苷酸序列如SEQ ID NO:20所示;Flag标签蛋白核甘酸序列如SEQ ID NO:21所示。
本发明所述的胞嘧啶编辑系统LnCBE和/或所述的NLS-FZY2-DddIA载体在线粒体DNA或者细胞核DNA的C/G到T/A编辑中的应用。
本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域或其编码基因、所述的分割蛋白或其编码基因、所述的增强版分割蛋白或其编码基因、所述的胞嘧啶编辑系统LnCBE和/或所述的NLS-FZY2-DddIA载体在制备线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒中的应用。
一种用于线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒,该试剂盒含有本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域或其编码基因、所述的分割蛋白或其编码基因、所述的增强版分割蛋白或其编码基因、所述的胞嘧啶编辑系统LnCBE和/或所述的NLS-FZY2-DddIA载体。
作为本发明的一种优选,所述的试剂盒含有选自以下任意一种的组分:
(1)MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-UGI,
(2)MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-UGI,
(3)MTS-ccdb-S100N-mut1-UGI和MTS-ccdb-S100C-mut3-UGI,
(4)MTS-ccdb-S100N-mut2-UGI和MTS-ccdb-S100C-mut3-UGI;
(5)NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-UGI,
(6)NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-UGI,
(7)NLS-ccdb-S100N-mut1-UGI和NLS-ccdb-S100C-mut3-UGI,
(8)NLS-ccdb-S100N-mut2-UGI和NLS-ccdb-S100C-mut3-UGI,
(9)NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100C-UGI和NLS-FZY2-DddIA,
(10)NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100C-UGI和NLS-FZY2-DddIA,
(11)NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100C-mut3-UGI和NLS-FZY2-DddIA,(12)NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100C-mut3-UGI和NLS-FZY2-DddIA。
进一步说明:
本发明提供的用于实现DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE,在于工程化改造已发现的来源于Lachnospiraceae bacterium sunii NSJ-8菌属中的双链DNA胞嘧啶脱氨基结构域DddAtox(Uniprot ID:A0A7G9FZY2),基因名简称为FZY2,通过TALE融合增强版本FZY2的DddAtox分割蛋白和糖基化酶抑制剂(Uracil glycosylase inhibitor,UGI)组成了LnCBE系统,可以提高原始FZY2蛋白脱氨酶活性,实现对靶位点的gC基序中的C进行高效编辑。
该工程化改造后的结构域没有作为DddA结构域进行公开过,但是其原始蛋白的序列是在Uniprot和NCBI等蛋白数据库中是存在的,注释的名称是A0A7G9FZY2。
本发明将Lachnospiraceae bacterium sunii NSJ-8来源的FZY2中的DddA结构域(第1-125位氨基酸)在第100位氨基酸进行分割,产生2种Half DddA,并对这两种分割蛋白进行多个单氨基酸的工程化突变,通过筛选获得有增强效果的改造版本的分割蛋白,分别将改造后的分割蛋白和糖基化酶抑制剂(UGI)通过linker氨基酸序列融合后分别插入到MTS-TALE骨架载体和NLS-TALE骨架载体中,按照S100N-mut1和S100C配对,S100N-mut2和S100C配对,S100N-mut1和S100C-mut3配对,S100N-mut2和S100C-mut3配对的原则,共构建LnCBE-v1.6、LnCBE-v2.3、LnCBE-v2.3、LnCBE-v2.4四种编辑系统,最终获得5个MTS骨架载体和5个NLS骨架载体(如图1和图2所示)。
本发明提供的用于实现DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE,包含以下5个MTS-LnCBE骨架载体(见图2),分别为MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI;和/或,5个NLS-LnCBE骨架载体(见图2)NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。
本发明提供的用于抑制LnCBE编辑系统核脱靶的NLS-FZY2-DddIA,来源于新发现的Lachnospiraceae bacterium sunii NSJ-8菌属的双链DNA脱氨基酶免疫抑制蛋白DddIA,Uniprot ID为A0A7G9FY10。通过同源重组融合核定位信号蛋白和Flag标签蛋白,组成NLS-FZY2-DddIA(见图2),可有效抑制LnCBE编辑系统在核基因组上的脱靶编辑。
该免疫抑制蛋白未作为DddIA进行公开过,但是其整个蛋白的序列是在Uniprot和NCBI等蛋白数据库中是存在的,其功能没有做过探究。
本发明的所有骨架载体匹配于一种TALE组装系统,骨架载体毒素基因ccdb两侧分别含有Bsa I酶切位点,酶切后产生不同的粘性末端用于特异性连接识别特定DNA序列的TALE序列,组装方法见授权专利:一种基于TALE组装的线粒体DNA编辑系统,专利号ZL202110688797.9。
本发明所述的四种LnCBE编辑系统用于双链DNA的C/G到T/A编辑的应用,尤其是对线粒体DNA的编辑应用,针对“gC”基序中的C进行高效编辑。
本发明按照S100N-mut1和S100C配对,S100N-mut2和S100C配对,S100N-mut1和S100C-mut3配对,S100N-mut2和S100C-mut3配对的原则,选择本发明系统中所述的对应的2个LnCBE载体进行配对,将其转染到所要编辑的细胞,通过嘌呤霉素筛选转染成功的细胞,实现DNA“gC”基序中C的编辑。
进一步的,本发明将S100N与S100C进行配对,并和NLS-FZY2-DddIA载体共转染细胞,实现对细胞核DNA的编辑应用,针对“gC”基序中的C进行高效编辑,且有效抑制LnCBE编辑系统在核基因组上的脱靶编辑。
本发明所述的四种LnCBE编辑系统可以用来探索线粒体或细胞核DNA突变的功能。同时,利用本发明的工具可以在细胞上对突变的DNA进行修复。
本发明的工作原理:将LnCBE系统转染细胞后,可以对编辑位点实现C/G到T/A的编辑,主要通过双链DNA胞嘧啶脱氨基酶进行对要编辑的C进行脱氨基形成dU,进一步通过细胞的复制实现C/G到T/A的编辑。
为了实现线粒体DNA的C/G到T/A编辑,Mok BY等报道的TALE-DddAtox可以实现线粒体DNA上“tC”序列中的C/G到T/A编辑(Nature.2020Jul;583(7817):631-637.),同时Li Mi等报道的Simiaoa sunii(Ddd_Ss)可以实现线粒体DNA上“gC”序列中C/G到T/A编辑(NatCommun.2023Feb;14(1):874.),而本发明开发的DNA编辑系统LnCBE相较于Ddd_Ss能进一步增强线粒体DNA上“gC”序列中高效的C/G到T/A编辑。
本发明有益效果:
本发明主要的创新价值在于对一个双链DNA脱氨基酶进行了工程化改造,增强了原始脱氨蛋白的功能活性,可以实现对双链DNA上任意位置“gC”基序中的C进行高效编辑,并且公开了一种DNA双链脱氨基酶免疫抑制蛋白,能够有效的抑制LnCBE编辑系统的核脱靶效应,使LnCBE可被设计成为gC兼容性更好的mtDNA胞嘧啶编辑器。
附图说明
图1工程化改造LnCBE编辑系统示意图
A为DddA、DddA-V6、DddA-V11以及FZY2氨基酸序列比对结果;B为工程化改造后的FZY2蛋白3D结构图;C为第一轮FZY2氨基酸单突变版本;D为第二轮FZY2氨基酸双突变及三突变版本。
图2四种LnCBE编辑系统的MTS及NLS骨架载体示意图
A为LnCBE系统工作示意图;B为NLS-FZY2-DddIA载体示意图;C为带有线粒体定位信号(MTS)及核定位信号(NLS)的不同分割类型的四种LnCBE编辑系统,载体携带ccdb基因元件,ccdb位于两个Bsa I酶切位点之间,载体上带有氨苄青霉素抗性元件。
图3 T-Pool表征LnCBE编辑系统特性
A为FZY2不同突变版本在T-Pool中的编辑活性比较;B为四种增强版本LnCBE的四种不同NC-motif的编辑效率情况。
图4四种LnCBE编辑系统在线粒体上GC位点的编辑情况
A,上图为线粒体m.G3635A位点编辑窗口的序列信息,下图为DddA-V11及LnCBE编辑系统对m.G3635A位点窗口内所有序列的编辑情况;B为DddA-V11及LnCBE编辑系统在m.G3635A位点编辑效率比较;C,上图为线粒体m.G8313A位点编辑窗口的序列信息,下图为LnCBE编辑系统对m.G8313A位点窗口内所有序列的编辑情况;D为LnCBE编辑系统在m.G8313A位点编辑效率比较。
图5LnCBE编辑系统在线粒体位点m.G3460A,m.G3635A的脱靶情况A为LnCBE编辑系统在线粒体m.G3635A位点上的脱靶数目以及平均脱靶率;B为LnCBE编辑系统在线粒体m.G8313A位点上的脱靶数目以及平均脱靶率;C为LnCBE编辑系统在线粒体m.G3635A位点上全线粒体靶位点编辑及脱靶情况
图6共表达FZY2-DddIA对LnCBE编辑系统的核脱靶抑制情况
A为DddA-DddIA与FZY2-DddIA的蛋白结构比对;B为共表达DddA-DddIA与FZY2-DddIA分别对DddA与FZY2的核脱靶抑制情况;C为共表达DddA-DddIA与FZY2-DddIA分别对DddA-G1397NC的核脱靶抑制情况;D为共表达DddA-DddIA分别对DddA与FZY2的核脱靶抑制情况;E为共表达FZY2-DddIA对FZY2的核脱靶抑制情况;F为在核基因组位点JAK2上共表达FZY2-DddIA对FZY2的核脱靶抑制情况;G为共表达FZY2-DddIA对线粒体G8313位点的核脱靶抑制情况。
具体实施方式
下面结合实施例对本发明做详细说明,借此对如何应用本发明实现DNA的C/G到T/A编辑充分理解并据以实施。
下面结合附图对本发明进一步说明。本发明提供了一种新型DNA编辑工具:LnCBE可以实现C/G到T/A编辑,并通过共表达NLS-FZY2-DddIA抑制其核脱靶效应,LnCBE系统包括:线粒体定位的有5个载体,细胞核定位的有5个载体。可以选择线粒体定位的LnCBE实现对线粒体DNA的编辑,选择细胞核定位的LnCBE可以实现对细胞核基因组上的编辑。RVD文库可以选择与编辑系统相适应的任意文库,本发明在实施例中采用的文库见CellDiscov.2021Sep3;7(1):78,组装方法见授权专利:一种基于TALE组装的线粒体DNA编辑系统,专利号ZL202110688797.9。实施例未详细描述的步骤、试剂、模块等为本领域技术人员熟知的内容,本申请不再赘述。
实施例1
胞嘧啶编辑系统LnCBE的MTS-LnCBE和NLS-LnCBE骨架载体的构建方法说明如下:
将Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域分割成2个half DddA,对2个分割蛋白分别进行工程化氨基酸突变,获得增强版本的分割蛋白,其相互配对并分别和糖基化酶抑制剂(UGI)融合之后,分别插入到MTS-TALE骨架载体的NheⅠ和PmeⅠ这两个酶切位点之间,分别得到5个MTS-LnCBE骨架载体;具体步骤1、根据FZY2与DddA的氨基酸同源比对及蛋白的二级结构,选择DddA-G1397对应的FZY2-S100蛋白分割位点进行分割,得到两个蛋白分割对,随之合成不同分割对的基因片段;2、设计带有16bp的引物,对合成的基因片段及糖基化酶抑制剂(UGI)进行PCR扩增,使不同的蛋白基因片段一端与糖基化酶抑制剂(UGI)一端具有16bp同源臂,两者另一端分别带有Nhe I和Pme I酶切位点同源臂;3、选择带有线粒体定位信号(MTS)、Nhe I和Pme I酶切位点、ccdb毒素基因及氨苄青霉素抗性基因的载体进行酶切,获得两端分别与蛋白基因片段及糖基化酶抑制剂(UGI)基因片段相匹配的同源臂的DNA骨架片段;4、将骨架片段,蛋白基因片段及糖基化酶抑制剂(UGI)基因片段进行同源重组;5、多片段重组的产物转入具有ccdb毒素抗性的感受态细胞trans DB3.1后经氨苄青霉素筛选,选取单克隆进行Sanger测序验证,获得测序结果正确的5个MTS-LnCBE骨架载体:MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI;据此同样的方法,将Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域分割成2个half DddA,对2个分割蛋白分别进行工程化氨基酸突变,获得增强版本的分割蛋白,其相互配对并分别和糖基化酶抑制剂(UGI)融合之后,分别插入到NLS-TALE骨架载体的NheⅠ和PmeⅠ这两个酶切位点之间,分别得到5个NLS-LnCBE骨架载体:NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。
以上所述的MTS-TALE骨架载体包含的主要元件5’端到3’端依次为:线粒体定位信号(MTS)序列、TALE-N端(NTD)136个氨基酸的核苷酸序列、ccdb毒素基因、TALE-C末端(CTD)41个氨基酸的核苷酸序列、嘌呤霉素细胞药筛基因、氨苄青霉素抗性元件;NLS-TALE骨架载体包含的主要元件5’端到3’端依次为:细胞核定位信号(NLS)序列、TALE-N端(NTD)136个氨基酸的核苷酸序列、ccdb毒素基因、TALE-C端(CTD)63个氨基酸的核苷酸序列、嘌呤霉素细胞药筛基因、氨苄青霉素抗性元件。
S100N的核苷酸序列如SEQ ID NO:4所示,S100C的核苷酸序列如SEQ ID NO:6所示,S100N-mut1的核苷酸序列如SEQ ID NO:8所示,S100N-mut2的核苷酸序列如SEQ ID NO:10所示;S100C-mut3的核苷酸序列如SEQ ID NO:12所示,MTS-TALE骨架载体的核苷酸序列如SEQ ID NO:13所示,NLS-TALE骨架载体的核苷酸序列如SEQ ID NO:14所示,UGI编码基因的核苷酸序列如SEQ ID NO:15所示。
所有骨架载体匹配于一种TALE组装系统,骨架载体毒素基因ccdb两侧分别含有Bsa I酶切位点,酶切后产生不同的粘性末端用于特异性连接识别特定DNA序列的TALE序列。
实施例2
利用细胞核定位的NLS版本的LnCBE,在人293FT细胞中对靶向的T载体进行编辑。
(一)设计TALE序列和LnCBE的组装
构建Spacer内包含不同motif的T载体(6xNNC、6xNCN、6xCNN、JAK2、SIRT6),Spacer两端还有相同的识别序列及4bp不同长度的碱基序列作为后续拆分index,将不同motif的T载体(共38个)按照等纳克数混合成T-Pool,测定总体浓度。将靶向T载体识别不同DNA碱基的RVD模块(Cell Discov.2021Sep3;7(1):78)通过Golden Gate的方法分别组装到LnCBE骨架载体上,组装方法见授权专利:一种基于TALE组装的线粒体DNA编辑系统,专利号ZL202110688797.9。
将组装的产物转化DH5α并采用含有氨苄青霉素的固体LB培养板进行筛选,之后挑取单克隆并使用下述引物进行PCR鉴定,引物序列如SEQ ID NO:16、17所示。根据RVD数量,判断阳性的克隆,如16个RVD大小应为1759bp,15个RVD大小应为1657bp。之后,使用上述引物进行正反测序,序列正确的阳性克隆提取质粒用于后续实验。
(二)转染细胞进行检测不同组合LnCBE的编辑效率
选择293FT细胞作为编辑对象,在细胞密度达到70-90%时,提前2小时换液,细胞计数后,取1.5x105个细胞用于细胞电转染(仪器:Lonza4D-nucleofector)。将5个NLS版本的Half-DddA的载体按照S100N-mut1和S100C配对,S100N-mut2和S100C配对,S100N-mut1和S100C-mut3配对,S100N-mut2和S100C-mut3配对的原则进行组合与包含不同motif的T载体进行电转细胞293FT细胞。左右两端的载体各转染400ng,T-Pool 50ng使用SF-Cell Line4D-nucleofector X-kit电转染细胞。
电转染完成后,将细胞接入12孔板中并培养24小时,接着使用含有1μg/mL的嘌呤霉素进行细胞筛选,培养72小时后将细胞消化离心,并收取细胞用于检测DNA突变效率。
收取的细胞样品DNA提取方式如下:采用30μL的QuickExtractTM DNA ExtractionSolution(Lucigen)重选细胞,之后65℃加热45min,接着98°C加热2min。
采用2Green Taq Mix(Vazyme)扩增T载体或线粒体DNA上含有编辑位点的目的片段,之后用于Sanger测序;或采用Phanta Super-Fidelity DNA polymerase(Vazyme)及高通量测序建库引物进行高通量测序分析编辑效率。如图2和图3所示,L-S100N-mut1+R-S100C(LnCBE-v1.6);L-S100N-mut2+R-S100C(LnCBE-v2.1);L-S100N-mut1+R-S100C-mut3(LnCBE-v2.3);L-S100N-mut2+R-S100C-mut3(LnCBE-v2.4)(L为左端,R为右端),高通量测序的结果显示,LnCBE增强版本系统(v1.6、v2.1、v2.3、v2.4)相较于原始LnCBE编辑系统(FZY2),其针对“gC”基序中的C进行高效的编辑的能力有明显提升。
实施例3
利用线粒体定位的MTS版本的LnCBE,在人293FT细胞中线粒体DNA进行编辑。
选择人类线粒体DNA(参考序列版本:NC_012920.1)上m.G8313A,m.G3635A位点进行编辑(如图4的上部分所示),根据这些位点的附近的DNA序列,设计识别的TALE序列,将识别的不同DNA碱基的RVD模块通过Golden Gate的方法分别组装到5个线粒体定位的LnCBE的骨架载体上。
将组装的产物转化DH5α并采用含有氨苄青霉素的固体LB培养板进行筛选,之后挑取单克隆并使用下述引物进行PCR鉴定,引物序列如SEQ ID NO:16及SEQ ID NO:17所示。根据RVD数量,判断阳性的克隆,如16个RVD大小应为1759bp,15个RVD大小应为1657bp。之后,使用上述引物进行正反测序,序列正确的阳性克隆提取质粒用于后续实验。
按实施例2中后面相同的操作流程,每个位点的的四个组合分别转染293FT细胞,并进行收集细胞,提取DNA进行构建全线粒体文库,进行突变效率分析。如图4所示,L-S100N-mut1+R-S100C(LnCBE-v1.6);L-S100N-mut2+R-S100C(LnCBE-v2.1);L-S100N-mut1+R-S100C-mut3(LnCBE-v2.3);L-S100N-mut2+R-S100C-mut3(LnCBE-v2.4)(L为左端,R为右端),LnCBE增强版本系统(v1.6、v2.1、v2.3、v2.4)相较于原始LnCBE编辑系统(FZY2),其针对线粒体内源性“gC”位点能进行高效的编辑的能力明显提升,显示其高效且特异对“gC”基序中C的编辑效果。如图5所示,针对“gC”位点的编辑相应的平均脱靶率及脱靶数目,LnCBE编辑系统均低于DddA-V11,表明LnCBE编辑系统对“gC”高效,特异且高保真的特性。
实施例4
针对LnCBE编辑系统核脱靶抑制的NLS-FZY2-DddIA载体的构建方法说明如下:
将Lachnospiraceae bacterium sunii NSJ-8菌属的双链DNA脱氨基酶免疫抑制蛋白FZY2-DddIA与Flag标签蛋白融合后插入到NLS-骨架载体的NheI和PmlI这两个酶切位点之间,得到NLS-FZY2-DddIA,具体步骤为:设计带有16bp同源臂的引物,对合成的基因片段DddIA与Flag标签蛋白进行PCR扩增,使合成的DddIA一端与Flag一端具有16bp同源臂,两者分别带有NheI和PmlI两个酶切位点同源臂;然后将骨架片段、Flag和DddIA基因片段进行同源重组,将重组产物转入感受态细胞trans 5后经氨苄青霉素筛选,选取单克隆进行Sanger测序验证,获得测序结果正确的NLS-FZY2-DddIA。
以上所述FZY2-DddIA氨基酸序列为SEQ ID NO:18,编码序列为SEQ ID NO:19,NLS-骨架载体核苷酸序列为SEQ ID NO:,20,Flag标签蛋白的核苷酸序列为SEQ ID NO:21。
按实施例2中后面相同的操作流程,将NLS-FZY2-DddIA载体与实施例2的LnCBE系统共转染293FT细胞,并进行收集细胞,提取DNA构建长片段扩增子文库,进行突变效率分析。如图6所示,通过共表达NLS-FZY2-DddIA载体,LnCBE编辑系统对于细胞核DNA的脱靶编辑明显被抑制,表明FZY2-DddIA免疫抑制蛋白可以有效抑制LnCBE编辑系统核脱靶。
本发明实施例中仅是以一种编码序列构建载体验证技术方案的可行性和技术效果,任何编码本发明所述的双链DNA胞嘧啶脱氨基酶DddA结构域、分隔蛋白、增强分割蛋白、双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddIA的基因都在本发明的保护范围内,均可以用于本发明技术方案的实施,产生与上述实施例相似或相同的技术效果,解决本发明的技术问题。
Claims (20)
1.一种双链DNA胞嘧啶脱氨基酶DddA结构域,其特征在于该DddA结构域为Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶DddA结构域,Uniprot ID为A0A7G9FZY2,基因名简称为FZY2。
2.根据权利要求1所述的胞嘧啶脱氨基酶DddA结构域,其特征在于该DddA结构域的氨基酸序列如SEQ ID NO:1所示。
3.编码权利要求1所述的胞嘧啶脱氨基酶DddA结构域的基因。
4.来自权利要求1所述DddA结构域的分割蛋白,其特征在于,按该DddA的结构域的氨基酸结构特征选择在S100位点进行分割得到一对half DddA的分割蛋白,为:S100N和S100C,分割蛋白成对使用;S100N氨基酸序列优选如SEQ ID NO:3所示,S100C氨基酸序列优选如SEQ ID NO:5所示。
5.编码权利要求4所述的分割蛋白的基因。
6.增强版分割蛋白,其特征在于,在权利要求4中所述的分隔蛋白的氨基酸序列中引入突变,用于提高原始蛋白脱氨基酶活性,得到的增强版分割蛋白的氨基酸序列如下所示:S100N-mut1氨基酸序列如SEQ ID NO:7所示,S100N-mut2氨基酸序列如SEQ ID NO:9所示,S100C-mut3氨基酸序列如SEQ ID NO:11所示。
7.编码权利要求6所述的增强版分割蛋白的基因。
8.权利要求1所述的双链DNA胞嘧啶脱氨基酶DddA结构域、权利要求3所述的基因、权利要求4所述的分割蛋白、权利要求5所述的基因、权利要求6所述的增强版分割蛋白、权利要求7所述的基因在构建对gC基序中的C实现高效C/G到T/A的高保真编辑系统LnCBE中的应用。
9.采用权利要求7所述的基因构建的胞嘧啶编辑系统LnCBE。
10.根据权利要求9所述胞嘧啶编辑系统LnCBE,包括RVD文库、线粒体定位骨架载体和/或细胞核定位骨架载体,其特征在于,用于实现线粒体DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用MTS-LnCBE骨架载体,用于实现细胞核DNA的C/G到T/A编辑的胞嘧啶编辑系统LnCBE采用NLS-LnCBE骨架载体。
11.根据权利要求10所述胞嘧啶编辑系统LnCBE,其特征在于,5个MTS-LnCBE骨架载体分别为:MTS-ccdb-S100N-mut1-UGI、MTS-ccdb-S100N-mut2-UGI、MTS-ccdb-S100N-UGI、MTS-ccdb-S100C-mut3-UGI、MTS-ccdb-S100C-UGI;5个NLS-LnCBE骨架载体分别为:NLS-ccdb-S100N-mut1-UGI、NLS-ccdb-S100N-mut2-UGI、NLS-ccdb-S100N-UGI、NLS-ccdb-S100C-mut3-UGI、NLS-ccdb-S100C-UGI。
12.根据权利要求11所述胞嘧啶编辑系统LnCBE,其特征在于,MTS-TALE骨架载体的核苷酸序列如SEQ ID NO:13所示;NLS-TALE骨架载体的核苷酸序列如SEQ ID NO:14所示;UGI编码基因的核苷酸序列如SEQ ID NO:15所示。
13.一种双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddIA,其特征在于该蛋白为Lachnospiraceae bacterium sunii NSJ-8来源的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白,Uniprot ID为A0A7G9FY10,能够抑制LnCBE编辑系统在核DNA中的脱靶编辑;优选该免疫抑制蛋白的氨基酸序列如SEQ ID NO:18所示。
14.编码权利要求13所述的双链DNA胞嘧啶脱氨基酶免疫抑制蛋白DddIA的基因。
15.采用权利要求13所述脱氨基酶免疫抑制蛋白DddIA、权利要求14所述的基因构建NLS-FZY2-DddIA载体。
16.根据权利要求15所述的NLS-FZY2-DddIA载体,其特征在于包含细胞核定位骨架载体、Flag标签蛋白及FZY2-DddIA。
17.根据权利要求15所述的NLS-FZY2-DddIA载体,其特征在于,细胞核定位骨架载体的核苷酸序列如SEQ ID NO:20所示;Flag标签蛋白核甘酸序列如SEQ ID NO:21所示。
18.权利要求9-12中任一所述的胞嘧啶编辑系统LnCBE和/或权利要求15-17所述的NLS-FZY2-DddIA载体在线粒体DNA或者细胞核DNA的C/G到T/A编辑中的应用,所述的应用不包含对人的疾病治疗。
19.权利要求1所述的双链DNA胞嘧啶脱氨基酶DddA结构域、权利要求3所述的基因、权利要求4所述的分割蛋白、权利要求5所述的基因、权利要求6所述的增强版分割蛋白、权利要求7所述的基因、权利要求9-12中任一所述的胞嘧啶编辑系统LnCBE和/或权利要求15-17所述的NLS-FZY2-DddIA载体在制备线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒中的应用。
20.一种用于线粒体DNA或细胞核DNA的C/G到T/A编辑的试剂盒,其特征在于,该试剂盒含有权利要求1所述的双链DNA胞嘧啶脱氨基酶DddA结构域、权利要求3所述的基因、权利要求4所述的分割蛋白、权利要求5所述的基因、权利要求6所述的增强版分割蛋白、权利要求7所述的基因、权利要求9-12中任一所述的胞嘧啶编辑系统LnCBE和/或权利要求15-17所述的NLS-FZY2-DddIA载体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311178714.7A CN117327683A (zh) | 2023-09-13 | 2023-09-13 | 一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311178714.7A CN117327683A (zh) | 2023-09-13 | 2023-09-13 | 一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117327683A true CN117327683A (zh) | 2024-01-02 |
Family
ID=89282036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311178714.7A Pending CN117327683A (zh) | 2023-09-13 | 2023-09-13 | 一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117327683A (zh) |
-
2023
- 2023-09-13 CN CN202311178714.7A patent/CN117327683A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6010907A (en) | Eukaryotic use of non-chimeric mutational vectors | |
CA3129158A1 (en) | Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence | |
CN109880851B (zh) | 用于富集CRISPR/Cas9介导的同源重组修复细胞的筛选报告载体及筛选方法 | |
CN114438110B (zh) | 一种精确无pam限制的腺嘌呤碱基编辑器及其构建方法 | |
WO2019120193A1 (zh) | 拆分型单碱基基因编辑系统及其应用 | |
CN113403341A (zh) | 一种基于tale组装的线粒体dna编辑系统 | |
CN116004592B (zh) | 一种实现DNA上C/G到T/A编辑的RsCBE系统 | |
CN112430586B (zh) | 一种VI-B型CRISPR/Cas13基因编辑系统及其应用 | |
CN113249362B (zh) | 经改造的胞嘧啶碱基编辑器及其应用 | |
CN114560946A (zh) | 无pam限制的腺嘌呤单碱基编辑产品、方法和应用 | |
JP2017029159A (ja) | 改変され、そして改善された細胞および生物を生成するための組成物および方法 | |
CN117327683A (zh) | 一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统 | |
CA3234217A1 (en) | Base editing enzymes | |
CN112725331B (zh) | 一种高通量突变体文库的构建方法 | |
CN117106758B (zh) | 一种特异在DNA的gC基序上实现C/G到T/A编辑的RiCBE系统 | |
CN117487787A (zh) | 一种在DNA的gC基序上实现高效C/G到T/A编辑的SbCBE系统 | |
CN113151277A (zh) | 鸡DF-1细胞IHH基因敲除稳定细胞株的构建方法及其特异性sgRNA | |
CN115703842A (zh) | 高效率高精度的胞嘧啶c到鸟嘌呤g转变的碱基编辑器 | |
WO2020036181A1 (ja) | 細胞を単離又は同定する方法及び細胞集団 | |
CN116179513B (zh) | 一种Cpf1蛋白及其在基因编辑中的应用 | |
CN117683755B (zh) | 一种C-to-G碱基编辑系统 | |
CN117448300B (zh) | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 | |
WO2023050169A1 (zh) | 一种在基因组上高通量实现tag到taa转换的方法 | |
WO2021155607A1 (zh) | 经改造的胞嘧啶碱基编辑器及其应用 | |
CN117126827A (zh) | 一种融合蛋白及含有由尿嘧啶-n-糖基化酶突变体介导的碱基编辑系统和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |