CN113637672B - 一种碱基编辑工具及其构建方法 - Google Patents

一种碱基编辑工具及其构建方法 Download PDF

Info

Publication number
CN113637672B
CN113637672B CN202110911545.8A CN202110911545A CN113637672B CN 113637672 B CN113637672 B CN 113637672B CN 202110911545 A CN202110911545 A CN 202110911545A CN 113637672 B CN113637672 B CN 113637672B
Authority
CN
China
Prior art keywords
sequence
gcn4
editing
pcmv
pegrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110911545.8A
Other languages
English (en)
Other versions
CN113637672A (zh
Inventor
谢红娴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Shutong Medical Technology Co ltd
Original Assignee
Zhuhai Shutong Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Shutong Medical Technology Co ltd filed Critical Zhuhai Shutong Medical Technology Co ltd
Priority to CN202211602322.4A priority Critical patent/CN115772523A/zh
Priority to CN202110911545.8A priority patent/CN113637672B/zh
Publication of CN113637672A publication Critical patent/CN113637672A/zh
Priority to PCT/CN2022/093505 priority patent/WO2023016021A1/zh
Application granted granted Critical
Publication of CN113637672B publication Critical patent/CN113637672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/14Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from fungi, algea or lichens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种碱基编辑工具及其构建方法。为了提高现有PE2系统目标碱基编辑效率和精准度,本发明提供一种新的碱基编辑工具及其构建方法,所述的碱基编辑工具所述的碱基编辑工具包括SunTag系统和PE2系统。本发明首次利用SunTag系统和PE系统结果,采用SunTag系统和编辑效率更高的PE2版本,构建SunTag‑PE2系统,经优化后,在HEK293T细胞上和原始的PE2系统进行比较,能够进一步提高PE2系统编辑的准确性,增强编辑精准度,为基因编辑提供更多的选择,该技术将推动我国及全世界在生命科学研究、农业生产和生物医药等领域的快速发展,具有重要的应用价值。

Description

一种碱基编辑工具及其构建方法
技术领域
本发明属于基因编辑技术领域,具体涉及一种碱基编辑工具及其构建方法。
背景技术
基因组编辑(简称为基因编辑)技术是利用人工核酸酶对基因组进行靶向修饰的遗传工程技术,是当今生命科学领域的研究热点。人工核酸酶主要包含锌指核酸酶(ZincFinger Nuclease,ZFN)、TALEN核酸酶(Transcription Activator-Like EffectorNuclease)以及CRISPR/Cas9(Clustered regularly interspaced short palindromicrepeats/CRISPR-associated protein 9)。利用这些技术,人们可以根据自身研究的需求对感兴趣的基因进行敲除或过表达等操作,进而研究基因的功能和调控机制。
CRISPR/Cas9系统是存在于细菌和古细菌中的一种免疫防御机制,用来抵抗噬菌体以及外源DNA的入侵,基于CRISPR系统开发而来的基因编辑系统已经被广泛运用于动物、植物和人细胞的基因编辑。CRISPR/Cas9基因编辑系统的核心是一个RNA蛋白复合物,由能与基因组中靶DNA序列互补结合的sgRNA和Cas9核酸酶两部分组成。当该复合物与靶位点结合之后,会激活Cas9的核酸酶活性,从而切割靶DNA,产生双链断裂(DSB)的DNA损伤。DSB进一步激活细胞内的DNA损伤修复机制,主要包括易错的非同源末端连接(Non-homologousEnd Joining,NHEJ)以及高保真的同源重组修复(Homologous Recombination,HDR)。
非同源末端连接的修复方式会在靶位点处产生DNA片段的插入或缺失(InDels),导致移码突变,从而造成靶基因的功能丧失,成为无效等位基因(null allele)。当通过同源重组的方式进行修复时,需要内源的同源序列或者外源导入的同源序列作为修复模板,在靶位点处敲入外源片段或引入点突变。但是,在细胞中,同源重组的效率远远低于非同源末端连接,导致靶位点处修复结果不可控,并倾向于产生核苷酸的插入和缺失。
为了提高定点突变的效率,将CRISPR/Cas9和其他酶产物进行结合的单碱基编辑系统被相继报道。例如:哈佛大学生物化学家David Liu组开发了base editor系统。baseeditor单碱基编辑系统主要由sgRNA和融合蛋白两部分组成,其中融合蛋白一般由改造的Cas9蛋白、胞嘧啶脱氨酶和尿嘧啶糖基化酶抑制子三者构成,而中科院上海营养与健康研究院常兴课题组开发的融合蛋白仅包含Cas9和胞嘧啶脱氨酶两部分。sgRNA通过与靶位点互补配对,引导融合蛋白结合到靶位点发挥作用。融合蛋白中的胞嘧啶脱氨酶能够使非互补链中相应的胞嘧啶C经脱氨基作用转变为尿嘧啶U,而DNA复制进一步使得U被T代替,而互补链上原来与C的互补碱基鸟嘌呤G将会变成腺嘌呤A,而尿嘧啶糖基化酶抑制子则能够抑制U的切除,最终实现非互补链上的C替换为T和互补链上G替换为A的精确编辑。根据融合蛋白中Cas9蛋白突变体的不同,可以将该系统分为两类,一类选用了无核酸内切酶活性的dCas9,进行编辑时不会造成切割靶DNA;另一类选用了有单链DNA切口酶活性的Cas9n,进行编辑时会在靶基因位点的一条DNA单链产生切口,再以互补链为模板进行合成修复。由于Cas9n和dCas9仍保持与sgRNA结合的能力,但均不会引起双链DNA的断裂,从而抑制了由NHEJ介导的DNA片段的插入或缺失。单碱基编辑系统只能将在胞嘧啶核苷脱氨酶活性位点附近的C脱氨基,这个区域称为活性窗口。通常胞嘧啶脱氨酶的活性窗口有5个核苷酸,为距离PAM最远端数起的第4~8位核苷酸,这样就会使活性窗口中非靶向的碱基也会发生替换作用。后来的研究者试图通过三种方式来缩短活性窗口,提高基因编辑的精准性,但是效果仍然不十分理想。
接着,David Liu开发的一种新的基因编辑方法——引导编辑(Prime Editor,PE),这种方法可以在不引入双链断裂(DSB)和供体DNA模板的前提下,实现靶标位点的插入、缺失和所有12种类型点突变(目前ABE和CBE系统仅能实现C→T,G→A,A→G,T→C四种突变类型),扩展了碱基编辑的范围,提高了精准编辑的效率。引导编辑(prime editing)是一种基于“搜索和替换“(search-and-replace)的基因组编辑方式。引导编辑的搜索功能是基于改造的向导RNA(the engineered guide RNA,the pegRNA),pegRNA中包含我们熟知的single guide RNAs(sgRNAs),不同的是,在其3’端还有一段引物结合序列(Primerbinding site,PBS)和转录模板序列(RT template)。prime editor蛋白由Cas9切口酶(Cas9 nickase,仅有切割单链的功能,H840A)和逆转录酶(M-MLV RT)融合而成。这样,Cas9切口酶在pegRNA上的sgRNA序列指引下,切割DNA单链,pegRNA 3’端的PBS(引物结合序列)可以与切割断点前的互补序列识别配对,逆转录酶(M-MLV RT)以pegRNA上PBS序列后的人工设计的模板序列为模板进行逆转录,将目标序列直接聚合到切口的DNA链上。在PAM识别链上进行单链切割后,会在这条单链DNA上形成3’末端(3’flaps)和5’末端(5’flaps)两段序列,而5’末端会被具有5’核酸内切酶和5’核酸外切酶活性FEN1和具有5’核酸外切酶活性的EXO1蛋白切割。而3’末端通过反转录酶合成的编辑序列,就可以更大概率的保留在修复后的序列中。通过这套系统,可以在无需引入双链断裂和外源DNA模板的情况下,有效地产生精确的碱基转换或颠换、插入和缺失等变异。并在PE的基础上,进一步优化和提高了逆转录酶的效率,推出了比PE编辑效率更高的PE2版本。由于PE2编辑后的DNA双链为杂合链,即一条为编辑链,一条为非编辑链。而杂合双链错配修复的模板是随机的,为了解决因错配修复造成的编辑效率降低,他们团队进一步开发出了PE3版本编辑系统,这一版本在非编辑链上距离pegRNA造成的切口处50bp的位置引入了一个新的切口(避免产生双链断裂),从而让细胞尽量多的以编辑链为模板进行DNA修复,以达到精准编辑的目的。
然而,不同的PE碱基编辑系统对同一位点进行编辑时,编辑效率不尽相同。pegRNA中PBS序列长度,反转录模板长度以及切口sgRNA的位置都会或多或少影响最终的基因编辑效率,但如何影响的并没有明显的规律,进行插入和缺失编辑时,随着插入或缺失片段的增长,其编辑效率是逐渐降低的。因此提高精准编辑的效率十分必要。
发明内容
本发明的目的是提供一种能够实现进一步提高碱基编辑的准确性、增强碱基编辑精准度的新的碱基编辑工具,为基因编辑提供更多的选择。
为达到上述目的,本发明采用的技术方案是:
本发明第一方面提供一种碱基编辑工具,所述的碱基编辑工具包括SunTag系统和PE2系统。
具体地,将所述的SunTag系统和所述的PE2系统相结合形成SunTag-PE2系统。
具体地,所述的SunTag系统包括GCN4多肽,所述的GCN4多肽能够被单链可变片段抗体识别。
SunTag是一个信号扩增系统。是多拷贝的、含有一个单链抗体(scFv)识别的19个氨基酸GCN4多肽。小可溶性标签GB1是g群链球菌g蛋白的结合域,融合到scFv的c端以蛋白聚集。SunTag系统是一个合成的支架,最多能招募蛋白质的24个拷贝。最初,是用于与GFP蛋白结合以放大荧光标记效应,用于实现活细胞内单分子的追踪,而不会影响蛋白质的功能。SunTag系统已成功应用于荧光成像和特定DNA位点的靶向去甲基化,并且有报道利用SunTag系统和BE系统结合,和BE3相比,进一步拓宽编辑窗口和提高编辑精准度,原始的BE3的编辑窗口在PAM上游的4-8bp,SunTag系统和BE系统结合的BE-Plus系统扩展PAM上游的9-16bp的编辑窗口。但是目前的BE3系统为C>G、A>T两种突变方向,而PE2系统将基因组编辑提升到了一个新的水平,这种方法允许引入所有突变类型,包括插入、缺失和12种碱基-碱基转换,并且通过设计pegRNA的序列,可以实现PAM上游3-29bp的编辑窗口。目前PE2系统的关键在于提高编辑效率,主要通过优化不同的RTs和pegRNA设计来实现,却未见将SunTag系统和PE2系统相结合的报道,主要是因为SunTag系统和PE2系统的结合并非简单的将BE系统替换为PE2系统,SunTag系统和PE2系统结合的难点包括两种系统结合时的空间位阻的影响,两者的结合方式对结合后的系统的编辑效率密切相关,如果结合方式没有选择好,甚至会出现编辑效率比原始PE2系统差的结果。
具体地,所述的PE2系统包括pegRNA、仅有单链DNA切口酶活性的Cas9切口酶、以及逆转录酶,所述的pegRNA的序列包括sgRNA序列、引物结合序列、以及转录模板序列。
PE系统可以在无需引入双链断裂和外源DNA模板的情况下,有效地产生精确的碱基转换或颠换、插入和缺失等变异。
本发明利用SunTag系统和PE2系统结果,采用SunTag系统和编辑效率更高的PE2版本,构建SunTag-PE2系统,经优化后,可以进一步提高碱基编辑的准确性、增强碱基编辑精准度。
优选地,将多个所述的GCN4多肽与所述的Cas9切口酶的C端和/或N端相连。
进一步优选地,所述的GCN4多肽的数量为1~20。
根据一种具体实施方式,GCN4多肽的氨基酸序列为EELLSKNYHLENEVARLKK(SEQ IDNO.14)。
再进一步优选地,所述的Cas9切口酶的C端和N端分别连接1~5个所述的GCN4多肽。
优选地,用于连接所述Cas9切口酶和所述GCN4多肽的接头序列为flexiblelinker。
根据一种具体实施方式,用于连接所述Cas9切口酶和所述GCN4多肽的flexiblelinker的氨基酸序列为SGGSSGGSSGSETPGTSESATTPESSGGSSGGSS(SEQ ID NO.15)。
优选地,将所述的逆转录酶和所述的单链可变片段连接形成融合蛋白,将所述的融合蛋白与所述的pegRNA相连。
再进一步优选地,用于连接所述的逆转录酶和所述的单链可变片段的接头序列为flexible linker或GS linker。
根据一种具体实施方式,所述的flexible linker的氨基酸序列为SGGSSGGSSGSETPGTSESATTPESSGGSSGGSS(SEQ ID NO.15)。
具体地,所述的GS linker的氨基酸序列为(GGGS)nG,n为大于等于1的整数。
进一步地,n为2~10之间的整数。
根据一种具体实施方式,所述的GS linker的氨基酸序列为GGGSGGGSGGGSGGGSG(SEQ ID NO.16)。
本发明第二方面提供一种所述的碱基编辑工具的构建方法,包括:
将逆转录酶、单链可变片段、以及pegRNA相连并插到pU6上,构建pU6-pegRNA-scFv-linker-RT质粒;
将n个GCN4多肽与Cas9蛋白酶的C端和/或N端相连,然后插入到pCMV上,构建pCMV-PE2-n×GCN4质粒,
其中,1≤n≤20。
根据一种具体地实施方式,所述的碱基编辑工具或所述的构建方法构建的碱基编辑工具,能够将如SEQ ID NO.1所示的目标序列编辑为如SEQ ID NO.2所示序列,采用的pegRNA序列如SEQ ID NO.3所示。
优选地,所述的Cas9切口酶的C端和N端分别连接1个所述的GCN4多肽。
优选地,用于连接所述的逆转录酶和所述的单链可变片段的接头序列为GSlinker。
优选地,所述的Cas9切口酶为H840A。
本发明第三方面还提供一种所述的碱基编辑工具在生命科学研究、农业生产和生物医药中的应用。
由于上述技术方案运用,本发明与现有技术相比具有下列优点:
本发明首次利用SunTag系统和PE系统结果,采用SunTag系统和编辑效率更高的PE2版本,构建SunTag-PE2系统,经优化后,在293T细胞上和原始的PE2系统进行比较,能够进一步提高PE2系统编辑的准确性,增强编辑精准度,为基因编辑提供更多的选择,该技术将推动我国及全世界在生命科学研究、农业生产和生物医药等领域的快速发展,具有重要的应用价值。
附图说明
图l为PE系统的示意图。引导编辑的搜索功能是基于改造的向导RNA(theengineered guide RNA,the pegRNA),pegRNA中包含我们熟知的single guide RNAs(sgRNAs),不同的是,在其3’端还有一段引物结合序列(Primer binding site,PBS)和转录模板序列(RT template)。prime editor蛋白由Cas9切口酶(Cas9 nickase,仅有切割单链的功能,H840A)和逆转录酶(M-MLV RT)融合而成;
图2为PE系统编辑目标DNA的流程示意图。Cas9切口酶在pegRNA上的sgRNA序列指引下,切割DNA单链,pegRNA 3’端的PBS(引物结合序列)可以与切割断点前的互补序列识别配对,逆转录酶(M-MLV RT)以pegRNA上PBS序列后的人工设计的模板序列为模板进行逆转录,将目标序列直接聚合到切口的DNA链上;
图3为SunTag-PE2系统的示意图。将SunTag系统和PE2系统结合,n个GCN4与nCas9的C端连接,构成pCMV-PE2-n×GCN4质粒,其中n代表不同的GCN4的数量;逆转录酶(M-MLVRT)通过flexible linker与scFv连接形成融合蛋白,pegRNA序列连在含有RT的质粒上,构成pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒,其中+1代表目标突变的位置位于HEK3的sgRNA引导的靶序列被Cas9切割的断点后第一个碱基位置,CTTins代表目标突变为CTT这3个碱基插入。当这两个质粒共转染时,dCas9-GCN4被sgRNA引导到结合位点,scFv-RT是围绕结合位点招募来诱导CTT这3个碱基插入的;
图4为SunTag-PE2系统的示意图以及和原始的PE2系统的效果比较图。在nCas9的C端连接不同数量的GCN4,从而分别构建质粒:pCMV-PE2-1×GCN4,pCMV-PE2-2×GCN4,pCMV-PE2-3×GCN4,pCMV-PE2-5×GCN4,pCMV-PE2-10×GCN4,与pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒共转染,和原始的PE2系统比较目标突变的效果;
图5为SunTag-PE2系统的优化方式1的编辑效果。在nCas9的N端同时连接不同数量的GCN4,并且分别和C端同时连接不同数量的GCN4进行组合,从而分别构建质粒:
1×GCN4-pCMV-PE2-1×GCN4,1×GCN4-pCMV-PE2-2×GCN4,
1×GCN4-pCMV-PE2-3×GCN4,1×GCN4-pCMV-PE2-5×GCN4,
2×GCN4-pCMV-PE2-1×GCN4,2×GCN4-pCMV-PE2-2×GCN4,
2×GCN4-pCMV-PE2-3×GCN4,2×GCN4-pCMV-PE2-5×GCN4,
3×GCN4-pCMV-PE2-1×GCN4,3×GCN4-pCMV-PE2-2×GCN4,
3×GCN4-pCMV-PE2-3×GCN4,3×GCN4-pCMV-PE2-5×GCN4,
5×GCN4-pCMV-PE2-1×GCN4,5×GCN4-pCMV-PE2-2×GCN4,
5×GCN4-pCMV-PE2-3×GCN4,5×GCN4-pCMV-PE2-5×GCN4,
与pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒共转染,和原始的PE2系统比较目标突变的效果;
图6为SunTag-PE2系统的优化方式2示意图以及编辑效果。将flexible linker替换成GS linker,构建质粒pegRNA-scFv-GS-linker-RT-HEK3(+1-CTTins)。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。
实施例中使用的引物由苏州金唯智生物科技有限公司合成;PCR试剂采用北京全式金生物科技有限公司的
Figure BDA0003203821910000061
PCR SuperMix(货号:AS111-02)。
为了详细说明本发明的SunTag-PE2系统,以下实施例针对文献中编辑效果较为稳定的pU6-HEK3_pegRNA_CTTins,本领域技术人员可根据以下实施例设计针对其他基因的目标位点的碱基编辑的SunTag-PE2系统。
以下实施例将目标序列:
catttgtaggcttgatgctttttttctgcttctccagccctggcctgggtcaatccttggggcccagactgagcacgtgatggcagaggaaaggaagccctgcttcctcc(SEQ ID NO.1)
精准编辑为:
catttgtaggcttgatgctttttttctgcttctccagccctggcctgggtcaatccttggggcccagactgagcacgCTTtgatggcagaggaaaggaagccctgcttcctcc(SEQ ID NO.2)(目标位点插入CTT这3个碱基,大写字母表示)。
实施例1
1、构建pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒
采用文献中验证有效的pU6-HEK3_pegRNA_CTTins的序列HEK3_pegRNA_CTTins:
cggcccagactgagcacgtgagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtgggaccgagtcggtcctctgccatcaaagcgtgctcagtctg(SEQ ID NO.3)。
逆转录酶(M-MLV RT)通过flexible linker与scFv连接形成融合蛋白,pegRNA序列连在含有RT的质粒上,构建pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒。构建完成后,通过常规测序比对确定构建载体序列正确无突变,挑选出完全正确的克隆进行扩增并提取质粒。
pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒完整序列如SEQ IDNO.4所示。
2、在nCas9的C端连接不同数量的GCN4,从而分别构建质粒:pCMV-PE2-1×GCN4,pCMV-PE2-2×GCN4,pCMV-PE2-3×GCN4,pCMV-PE2-5×GCN4,pCMV-PE2-10×GCN4。构建完成后,通过常规测序比对确定构建载体序列正确无突变,挑选出完全正确的克隆进行扩增并提取质粒。
pCMV-PE2-1×GCN4质粒序列:完整序列如SEQ ID NO.5所示。
pCMV-PE2-2×GCN4质粒序列:将pCMV-PE2-1×GCN4质粒序列中的1×GCN4(SEQ IDNO.6)替换成2×GCN4(SEQ ID NO.7)。
pCMV-PE2-3×GCN4质粒序列:将pCMV-PE2-1×GCN4质粒序列中的1×GCN4(SEQ IDNO.6)替换成3×GCN4(SEQ ID NO.8)。
pCMV-PE2-5×GCN4质粒序列:将pCMV-PE2-1×GCN4质粒序列中的1×GCN4(SEQ IDNO.6)替换成5×GCN4(SEQ ID NO.9)。
pCMV-PE2-10×GCN4质粒序列:将pCMV-PE2-1×GCN4质粒序列中的1×GCN4(SEQID NO.6)替换成10×GCN4(SEQ ID NO.10)。
3、比较SunTag-PE2系统和原始的PE2系统的目标编辑效果
将质粒pCMV-PE2-1×GCN4、pCMV-PE2-2×GCN4、pCMV-PE2-3×GCN4、pCMV-PE2-5×GCN4、pCMV-PE2-10×GCN4分别与pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒共转染,并分别测试目标突变效率。
具体方法步骤如下:
(1)细胞培养
人胚肾细胞系293T用含有10%血清的DMEM完全培养基在37℃、5%CO2培养箱里培养。待细胞融合度达到90%时用0.25%的胰酶消化后,用DMEM完全培养基终止消化,接种到12孔板中,继续培养24小时。
(2)质粒转染
24小时后,确认细胞贴壁良好,细胞融合度达到80%,即可进行转染。每孔转染0.5ug含有pegRNA的质粒以及0.5ug的含有nCas9的质粒,使用Roche公司的X-tremeGENE HPDNA Transfection Reagent转染试剂按照说明书要求进行转染,以等量的空载体(1μg)作为阴性对照。转染后的细胞继续在37℃、5%CO2培养箱中培养。
(3)基因组DNA的提取
转染48小时后,常规0.25%的胰酶消化,用DMEM完全培养基终止消化,收集细胞到离心管中,300g离心5分钟,弃除培养基,PBS洗涤一次,再次300g离心5分钟,弃除PBS,获得细胞渣,使用细胞基因组提取试剂盒(全式金生物技术有限公司,货号:EE101-01)提取细胞基因组DNA,测量DNA浓度。
(4)扩增子建库引物的设计
分别根据HEK3的sgRNA靶向的基因序列(SEQ ID NO.11)设计引物,引物两端横跨靶点(产物长度优选150~200bp,并且靶点距离引物两段的距离应当差别不大),以扩增出目的片段。本实施例中与HEK3的sgRNA相对应的引物序列为:
HEK3-NGS-F:ACACTCTTTCCCTACACGACGCTCTTCCGATCTctggcctgggtcaatccttg。
HEK3-NGS-R:GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTgctgcacatactagcccctg。
(5)扩增子建库的PCR反应:
以上述提取的基因组DNA为模版,用上述引物进行PCR反应。本实验使用的高保真kapa聚合酶为KAPA HiFi HotStart ReadyMix(货号:KK2602)。
第一轮PCR:
Figure BDA0003203821910000081
Figure BDA0003203821910000091
PCR反应体系:
98℃ for 3min;25cycles of(98℃ for 20s,65℃ for 15s,72℃ for 15s),72℃ for 1min,4℃ for∞。
第二轮PCR:
名称 体积
KAPA HiFi HotStart ReadyMix 12.5μl
第一轮的PCR产物 1μl
I7 primer(10μM) 2
I5 primer(10μM) 2
补无菌去离子水 To 25μl
总共 25μl
I7 primer和I5 primer采用商业的illumina测序接头引物:Hieff NGS384 DualIndex Primer Kit for
Figure BDA0003203821910000092
(货号12613ES02)。
PCR反应体系:
98℃ for 3min;11cycles of(98℃ for 20s,65℃ for 15s,72℃ for 15s),72℃ for 1min,4℃ for∞。
PCR反应完成后,取PCR产物进行琼脂糖凝胶电泳,将目标片段大小257bp的扩增子文库进行高通量测序分析目标突变效率,结果见图4,pCMV-PE2-1×GCN4及pCMV-PE2-3×GCN4与pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒共转染的效果最好,约为8%,和原始的PE2系统效果接近。
实施例2
对实施例1的SunTag-PE2系统的优化方式1:
在nCas9的N端同时连接不同数量的GCN4,并且分别和C端同时连接不同数量的GCN4进行组合,从而分别构建以下pCMV-PE2-n×GCN4质粒:
1×GCN4-pCMV-PE2-1×GCN4,1×GCN4-pCMV-PE2-2×GCN4,
1×GCN4-pCMV-PE2-3×GCN4,1×GCN4-pCMV-PE2-5×GCN4,
2×GCN4-pCMV-PE2-1×GCN4,2×GCN4-pCMV-PE2-2×GCN4,
2×GCN4-pCMV-PE2-3×GCN4,2×GCN4-pCMV-PE2-5×GCN4,
3×GCN4-pCMV-PE2-1×GCN4,3×GCN4-pCMV-PE2-2×GCN4,
3×GCN4-pCMV-PE2-3×GCN4,3×GCN4-pCMV-PE2-5×GCN4,
5×GCN4-pCMV-PE2-1×GCN4,5×GCN4-pCMV-PE2-2×GCN4,
5×GCN4-pCMV-PE2-3×GCN4,5×GCN4-pCMV-PE2-5×GCN4,
1×GCN4-pCMV-PE2-1×GCN4质粒序列:完整序列如SEQ ID NO.12所示。
1×GCN4-pCMV-PE2-2×GCN4质粒序列:在GCN(1x)-pCMV-PE2-GCN(1x)质粒的nCas9的N端将1×GCN4(SEQ ID NO.6)替换成2×GCN4(SEQ ID NO.7),其余14个pCMV-PE2-n×GCN4质粒以此类推,构建而得。
将上述16个pCMV-PE2-n×GCN4质粒分别与pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒共转染,和原始的PE2系统比较目标突变的效果,方法同实施例1,结果见图5,柱状图结果显示1×GCN4-pCMV-PE2-1×GCN4与pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒共转染的效果最好,约为16%,明显优于原始的PE2系统效果。
实施例3
对实施例2的SunTag-PE2系统的优化方式2:
将pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒中的flexiblelinker替换成GS linker,构建pegRNA-scFv-GS-linker-RT-HEK(+1-CTTins)质粒:逆转录酶(M-MLV RT)通过GS linker与scFv连接形成融合蛋白,pegRNA序列连在含有RT的质粒上,构成pegRNA-scFv-GS-linker-RT-HEK3(+1-CTTins)质粒。构建完成后,通过常规测序比对确定构建载体序列正确无突变,挑选出完全正确的克隆进行扩增并提取质粒。
pegRNA-scFv-GS-linker-RT-HEK3(+1-CTTins)质粒完整序列如SEQ ID NO.13所示。
将实施例2中的16个pCMV-PE2-n×GCN4质粒分别与pegRNA-scFv-flexible-linker-RT-HEK3(+1-CTTins)质粒共转染,和原始的PE2系统比较目标突变的效果,方法同实施例1,结果见图6,柱状图结果显示,将flexible linker替换成GS linker后编辑效率进一步提升,并且1×GCN4-pCMV-PE2-1×GCN4质粒与pegRNA-scFv-GS-linker-RT-HEK3(+1-CTTins)质粒共转染的效果最好,约为18%,明显优于原始的PE2系统效果。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。
序列表
<110> 珠海舒桐医疗科技有限公司
<120> 一种碱基编辑工具及其构建方法
<160> 16
<170> SIPOSequenceListing 1.0
<210> 1
<211> 110
<212> DNA
<213> rengongxulie(人工序列)
<400> 1
catttgtagg cttgatgctt tttttctgct tctccagccc tggcctgggt caatccttgg 60
ggcccagact gagcacgtga tggcagagga aaggaagccc tgcttcctcc 110
<210> 2
<211> 113
<212> DNA
<213> rengongxulie(人工序列)
<400> 2
catttgtagg cttgatgctt tttttctgct tctccagccc tggcctgggt caatccttgg 60
ggcccagact gagcacgctt tgatggcaga ggaaaggaag ccctgcttcc tcc 113
<210> 3
<211> 123
<212> DNA
<213> rengongxulie(人工序列)
<400> 3
cggcccagac tgagcacgtg agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tgggaccgag tcggtcctct gccatcaaag cgtgctcagt 120
ctg 123
<210> 4
<211> 6820
<212> DNA
<213> rengongxulie(人工序列)
<400> 4
aaggatctgc gatcgctccg gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc 60
cgagaagttg gggggagggg tcggcaattg aacgggtgcc tagagaaggt ggcgcggggt 120
aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc 180
gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac 240
acagctgaag cttcgagggg ctcgcatctc tccttcacgc gcccgccgcc ctacctgagg 300
ccgccatcca cgccggttga gtcgcgttct gccgcctccc gcctgtggtg cctcctgaac 360
tgcgtccgcc gtctaggtaa gtttaaagct caggtcgaga ccgggccttt gtccggcgct 420
cccttggagc ctacctagac tcagccggct ctccacgctt tgcctgaccc tgcttgctca 480
actctacgtc tttgtttcgt tttctgttct gcgccgttac agatccaagc tgtgaccggc 540
gcctacggtt tagtgaaccg tcagatccgc tagagatccg cggccgctaa tacgactcac 600
tatagggaga gccgccacca aacggacagc cgacggaagc gagttcgagt caatgaaaag 660
gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa aagatgggcc ccgacatcgt 720
gatgacccag agccccagca gcctgagcgc cagcgtgggc gaccgcgtga ccatcacctg 780
ccgcagcagc accggcgccg tgaccaccag caactacgcc agctgggtgc aggagaagcc 840
cggcaagctg ttcaagggcc tgatcggcgg caccaacaac cgcgcccccg gcgtgcccag 900
ccgcttcagc ggcagcctga tcggcgacaa ggccaccctg accatcagca gcctgcagcc 960
cgaggacttc gccacctact tctgcgccct gtggtacagc aaccactggg tgttcggcca 1020
gggcaccaag gtggagctga agcgcggcgg cggcggcagc ggcggcggcg gcagcggcgg 1080
cggcggcagc agcggcggcg gcagcgaggt gaagctgctg gagagcggcg gcggcctggt 1140
gcagcccggc ggcagcctga agctgagctg cgccgtgagc ggcttcagcc tgaccgacta 1200
cggcgtgaac tgggtgcgcc aggcccccgg ccgcggcctg gagtggatcg gcgtgatctg 1260
gggcgacggc atcaccgact acaacagcgc cctgaaggac cgcttcatca tcagcaagga 1320
caacggcaag aacaccgtgt acctgcagat gagcaaggtg cgcagcgacg acaccgccct 1380
gtactactgc gtgaccggcc tgttcgacta ctggggccag ggcaccctgg tgaccgtgag 1440
cagctaccca tacgatgttc cagattacgc tggttctgga ggatctagcg gaggatcctc 1500
tggcagcgag acaccaggaa caagcgagtc agcaacacca gagagcagtg gcggcagcag 1560
cggcggcagc agcaccctaa atatagaaga tgagtatcgg ctacatgaga cctcaaaaga 1620
gccagatgtt tctctagggt ccacatggct gtctgatttt cctcaggcct gggcggaaac 1680
cgggggcatg ggactggcag ttcgccaagc tcctctgatc atacctctga aagcaacctc 1740
tacccccgtg tccataaaac aataccccat gtcacaagaa gccagactgg ggatcaagcc 1800
ccacatacag agactgttgg accagggaat actggtaccc tgccagtccc cctggaacac 1860
gcccctgcta cccgttaaga aaccagggac taatgattat aggcctgtcc aggatctgag 1920
agaagtcaac aagcgggtgg aagacatcca ccccaccgtg cccaaccctt acaacctctt 1980
gagcgggctc ccaccgtccc accagtggta cactgtgctt gatttaaagg atgccttttt 2040
ctgcctgaga ctccacccca ccagtcagcc tctcttcgcc tttgagtgga gagatccaga 2100
gatgggaatc tcaggacaat tgacctggac cagactccca cagggtttca aaaacagtcc 2160
caccctgttt aatgaggcac tgcacagaga cctagcagac ttccggatcc agcacccaga 2220
cttgatcctg ctacagtacg tggatgactt actgctggcc gccacttctg agctagactg 2280
ccaacaaggt actcgggccc tgttacaaac cctagggaac ctcgggtatc gggcctcggc 2340
caagaaagcc caaatttgcc agaaacaggt caagtatctg gggtatcttc taaaagaggg 2400
tcagagatgg ctgactgagg ccagaaaaga gactgtgatg gggcagccta ctccgaagac 2460
ccctcgacaa ctaagggagt tcctagggaa ggcaggcttc tgtcgcctct tcatccctgg 2520
gtttgcagaa atggcagccc ccctgtaccc tctcaccaaa ccggggactc tgtttaattg 2580
gggcccagac caacaaaagg cctatcaaga aatcaagcaa gctcttctaa ctgccccagc 2640
cctggggttg ccagatttga ctaagccctt tgaactcttt gtcgacgaga agcagggcta 2700
cgccaaaggt gtcctaacgc aaaaactggg accttggcgt cggccggtgg cctacctgtc 2760
caaaaagcta gacccagtag cagctgggtg gcccccttgc ctacggatgg tagcagccat 2820
tgccgtactg acaaaggatg caggcaagct aaccatggga cagccactag tcattctggc 2880
cccccatgca gtagaggcac tagtcaaaca accccccgac cgctggcttt ccaacgcccg 2940
gatgactcac tatcaggcct tgcttttgga cacggaccgg gtccagttcg gaccggtggt 3000
agccctgaac ccggctacgc tgctcccact gcctgaggaa gggctgcaac acaactgcct 3060
tgatatcctg gccgaagccc acggaacccg acccgaccta acggaccagc cgctcccaga 3120
cgccgaccac acctggtaca cggatggaag cagtctctta caagagggac agcgtaaggc 3180
gggagctgcg gtgaccaccg agaccgaggt aatctgggct aaagccctgc cagccgggac 3240
atccgctcag cgggctgaac tgatagcact cacccaggcc ctaaagatgg cagaaggtaa 3300
gaagctaaat gtttatactg atagccgtta tgcttttgct actgcccata tccatggaga 3360
aatatacaga aggcgtgggt ggctcacatc agaaggcaaa gagatcaaaa ataaagacga 3420
gatcttggcc ctactaaaag ccctctttct gcccaaaaga cttagcataa tccattgtcc 3480
aggacatcaa aagggacaca gcgccgaggc tagaggcaac cggatggctg accaagcggc 3540
ccgaaaggca gccatcacag agactccaga cacctctacc ctcctcatag aaaattcatc 3600
accctctggc ggctcaaaaa gaaccgccga cggcagcgaa ttcgagccca agaagaagag 3660
gaaagtctaa ccggtcatca tcaccatcac cattgagttt aaacccgctg atcagcctcg 3720
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3780
ctggaaggtg ccactcccac tgtcctttcc taataaaatg agaaaattgc atcgcattgt 3840
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3900
tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 3960
agaaccagct ggggctcgat accgtcgacc tctagctaga gcttggcgta atcatggtca 4020
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 4080
agcataaagt gtaaagccta gggtgcctaa tgagtgagct aactcacatt aattgcgttg 4140
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 4200
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 4260
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 4320
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 4380
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 4440
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 4500
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 4560
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 4620
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 4680
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 4740
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 4800
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 4860
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 4920
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 4980
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 5040
actcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 5100
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 5160
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 5220
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 5280
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 5340
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 5400
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 5460
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 5520
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 5580
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 5640
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 5700
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 5760
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 5820
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 5880
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 5940
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 6000
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 6060
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 6120
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtcgacgga 6180
tcgggagatc gatctcccga tcccctaggg tctactctca gtacaatctg ctctgatgcc 6240
gcatagttaa gccagtatct gctccctgct tgtgtgttgg aggtcgctga gtagtgcgcg 6300
agcaaaattt aagctacaac aaggcaaggc ttgaccgaca attgcatgaa gaatctgctt 6360
agggttaggc gttttgcgct gcttcgcgat gtacggggag ggcctatttc ccatgattcc 6420
ttcatatttg catatacgat acaaggctgt tagagagata attagaatta atttgactgt 6480
aaacacaaag atattagtac aaaatacgtg acgtagaaag taataatttc ttgggtagtt 6540
tgcagtttta aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta 6600
tttcgatttc ttggctttat atatcttgtg gaaaggacga aacaccggcc cagactgagc 6660
acgtgagttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 6720
aaaagtggga ccgagtcggt cctctgccat caaagcgtgc tcagtctgtt tttttaagcc 6780
tctagacggg ccagatatac gcgttccaga tatacgcgtt 6820
<210> 5
<211> 7806
<212> DNA
<213> rengongxulie(人工序列)
<400> 5
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420
ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480
ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540
tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta gtgaaccgtc 600
agatccgcta gagatccgcg gccgctaata cgactcacta tagggagagc cgccaccatg 660
aaacggacag ccgacggaag cgagttcgag tcaccaaaga agaagcggaa agtcgacaag 720
aagtacagca tcggcctgga catcggcacc aactctgtgg gctgggccgt gatcaccgac 780
gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 840
aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 900
ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 960
gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 1020
tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 1080
gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 1140
gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 1200
ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 1260
ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 1320
agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 1380
aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggaaa cctgattgcc 1440
ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 1500
ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 1560
gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 1620
gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 1680
agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 1740
cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 1800
gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 1860
gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 1920
accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 1980
cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2040
ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 2100
tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 2160
aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 2220
aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 2280
ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 2340
cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 2400
ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 2460
gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 2520
aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 2580
acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 2640
gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 2700
cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 2760
aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 2820
tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 2880
attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 2940
gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 3000
gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 3060
atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 3120
acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 3180
gtggaccagg aactggacat caaccggctg tccgactacg atgtggacgc tatcgtgcct 3240
cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 3300
cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 3360
cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 3420
gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 3480
acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 3540
gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 3600
tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 3660
gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 3720
ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 3780
aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 3840
aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 3900
gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 3960
cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 4020
ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 4080
aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 4140
ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 4200
ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 4260
gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 4320
ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 4380
aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 4440
aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 4500
cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 4560
gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 4620
gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 4680
ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 4740
gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 4800
cagctgggag gtgactctgg aggatctagc ggaggatcct ctggcagcga gacaccagga 4860
acaagcgagt cagcaacacc agagagcagt ggcggcagca gcggcggcag cagctccaac 4920
ggtccgactg acgccgcgga agaagaactt ttgagcaaga attatcatct tgagaacgaa 4980
gtggctcgtc ttaagaaagg ctcaggctca ggcaccgcgg taaacatagg tggtggaacc 5040
cccaagaaga agaggaaagt ctaaccggtc atcatcacca tcaccattga gtttaaaccc 5100
gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 5160
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgagaaaa 5220
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 5280
gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 5340
cttctgaggc ggaaagaacc agctggggct cgataccgtc gacctctagc tagagcttgg 5400
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 5460
acatacgagc cggaagcata aagtgtaaag cctagggtgc ctaatgagtg agctaactca 5520
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 5580
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 5640
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 5700
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 5760
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 5820
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 5880
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 5940
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 6000
tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 6060
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 6120
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 6180
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 6240
gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 6300
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 6360
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 6420
ctacggggtc tgacactcag tggaacgaaa actcacgtta agggattttg gtcatgagat 6480
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 6540
aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta 6600
tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa 6660
ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac 6720
gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa 6780
gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag 6840
taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg 6900
tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag 6960
ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg 7020
tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc 7080
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat 7140
tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata 7200
ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa 7260
aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca 7320
actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc 7380
aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc 7440
tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg 7500
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 7560
ctgacgtcga cggatcggga gatcgatctc ccgatcccct agggtctact ctcagtacaa 7620
tctgctctga tgccgcatag ttaagccagt atctgctccc tgcttgtgtg ttggaggtcg 7680
ctgagtagtg cgcgagcaaa atttaagcta caacaaggca aggcttgacc gacaattgca 7740
tgaagaatct gcttagggtt aggcgttttg cgctgcttcg cgatgtacgg gccagatata 7800
cgcgtt 7806
<210> 6
<211> 126
<212> DNA
<213> rengongxulie(人工序列)
<400> 6
tccaacggtc cgactgacgc cgcggaagaa gaacttttga gcaagaatta tcatcttgag 60
aacgaagtgg ctcgtcttaa gaaaggctca ggctcaggca ccgcggtaaa cataggtggt 120
ggaacc 126
<210> 7
<211> 198
<212> DNA
<213> rengongxulie(人工序列)
<400> 7
tccaacggtc cgactgacgc cgcggaagaa gaacttttga gcaagaatta tcatcttgag 60
aacgaagtgg ctcgtcttaa gaaaggttct ggcagtggag aagaactgct ttcaaagaat 120
taccacctgg aaaatgaggt agctagactg aaaaagggct caggctcagg caccgcggta 180
aacataggtg gtggaacc 198
<210> 8
<211> 270
<212> DNA
<213> rengongxulie(人工序列)
<400> 8
tccaacggtc cgactgacgc cgcggaagaa gaacttttga gcaagaatta tcatcttgag 60
aacgaagtgg ctcgtcttaa gaaaggttct ggcagtggag aagaactgct ttcaaagaat 120
taccacctgg aaaatgaggt agctagactg aaaaagggga gcggaagtgg ggaggagttg 180
ctgagcaaaa attatcattt ggagaacgaa gtagcacgac taaagaaagg ctcaggctca 240
ggcaccgcgg taaacatagg tggtggaacc 270
<210> 9
<211> 414
<212> DNA
<213> rengongxulie(人工序列)
<400> 9
tccaacggtc cgactgacgc cgcggaagaa gaacttttga gcaagaatta tcatcttgag 60
aacgaagtgg ctcgtcttaa gaaaggttct ggcagtggag aagaactgct ttcaaagaat 120
taccacctgg aaaatgaggt agctagactg aaaaagggga gcggaagtgg ggaggagttg 180
ctgagcaaaa attatcattt ggagaacgaa gtagcacgac taaagaaagg gtccggatcg 240
ggtgaggagt tactctcgaa aaattatcat ctcgaaaacg aagtggctcg gctaaaaaag 300
ggcagtggtt ctggagaaga gctattatct aaaaactacc acctcgaaaa tgaggtggca 360
cgcttaaaaa agggctcagg ctcaggcacc gcggtaaaca taggtggtgg aacc 414
<210> 10
<211> 774
<212> DNA
<213> rengongxulie(人工序列)
<400> 10
tccaacggtc cgactgacgc cgcggaagaa gaacttttga gcaagaatta tcatcttgag 60
aacgaagtgg ctcgtcttaa gaaaggttct ggcagtggag aagaactgct ttcaaagaat 120
taccacctgg aaaatgaggt agctagactg aaaaagggga gcggaagtgg ggaggagttg 180
ctgagcaaaa attatcattt ggagaacgaa gtagcacgac taaagaaagg gtccggatcg 240
ggtgaggagt tactctcgaa aaattatcat ctcgaaaacg aagtggctcg gctaaaaaag 300
ggcagtggtt ctggagaaga gctattatct aaaaactacc acctcgaaaa tgaggtggca 360
cgcttaaaaa agggaagtgg cagtggtgaa gagctactat ccaagaatta tcatcttgag 420
aacgaggtag cgcgtttgaa gaagggttcc ggctcaggag aggaactgct ctcgaagaac 480
tatcatcttg aaaatgaggt cgctcgatta aaaaagggat cgggcagtgg tgaggaacta 540
ctttcaaaga attaccacct cgaaaacgaa gtagctcgat taaagaaagg ttcagggtcg 600
ggtgaagaat tactgagtaa aaattatcat ctggaaaatg aggtagcgag actaaaaaag 660
gggagtggtt ctggcgagga attgctatcg aaaaattatc atcttgagaa cgaagttgct 720
aggctcaaaa agggctcagg ctcaggcacc gcggtaaaca taggtggtgg aacc 774
<210> 11
<211> 660
<212> DNA
<213> unknown(未知)
<400> 11
agaatgggtc acagtggcaa atgaggctgg agaggcccgt gagctgctgt cccagagggc 60
ctgggatgtc ctgcagggag cttggcatga gaaaccttgg agagttttaa gcaagggctg 120
atgtgggctg cctagaaagg catggatgag agaagcctgg agacagggat cccagggaaa 180
cgcccatgca attagtctat ttctgctgca agtaagcatg catttgtagg cttgatgctt 240
tttttctgct tctccagccc tggcctgggt caatccttgg ggcccagact gagcacgtga 300
tggcagagga aaggaagccc tgcttcctcc agagggcgtc gcaggacagc ttttcctaga 360
caggggctag tatgtgcagc tcctgcaccg ggatactggt tgacaagttt ggctgggctg 420
gaagccagca cctagggagg tccctggaag gggccagcct caccaggaga ggagggacct 480
ggcccttcag ggtcgagctc aacagaggaa aagatctcag ggcacccaga acccagtggc 540
tttcagcacc tgcatgaaaa tcagagatca accagattac cccatattgc ccaagagaaa 600
actgaggcca gaaagtgatg gagcttgccc aggaccccag agggtgttag aggcaggcca 660
<210> 12
<211> 7985
<212> DNA
<213> rengongxulie(人工序列)
<400> 12
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420
ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480
ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540
tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta gtgaaccgtc 600
agatccgcta gagatccgcg gccgctaata cgactcacta taggatggga cccaagaaaa 660
aacgcaaggt ggaagatcct aagaaaaagc ggaaagtgga cggcattggt agtgggagca 720
acggcagcag cggagaggaa ctgctgagca agaactacca cctggaaaac gaggtggcca 780
gactgaagaa aggctctggc tctggcggaa gcggttctgg cggatcagga tctggaagtg 840
gcggctctgg aagcggaggt tctggatctg gcccaaagaa gaagcggaaa gtcgacaaga 900
agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg atcaccgacg 960
agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg cacagcatca 1020
agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag gccacccggc 1080
tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc tatctgcaag 1140
agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga ctggaagagt 1200
ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc aacatcgtgg 1260
acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag aaactggtgg 1320
acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac atgatcaagt 1380
tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac gtggacaagc 1440
tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc atcaacgcca 1500
gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga cggctggaaa 1560
atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac ctgattgccc 1620
tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag gatgccaaac 1680
tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc cagatcggcg 1740
accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc ctgctgagcg 1800
acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct atgatcaaga 1860
gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg cagcagctgc 1920
ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc ggctacattg 1980
acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg gaaaagatgg 2040
acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg aagcagcgga 2100
ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac gccattctgc 2160
ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc gagaagatcc 2220
tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc agattcgcct 2280
ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa gtggtggaca 2340
agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag aacctgccca 2400
acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg tataacgagc 2460
tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg agcggcgagc 2520
agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc gtgaagcagc 2580
tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc tccggcgtgg 2640
aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt atcaaggaca 2700
aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg ctgaccctga 2760
cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc cacctgttcg 2820
acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc aggctgagcc 2880
ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg gatttcctga 2940
agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac agcctgacct 3000
ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg cacgagcaca 3060
ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca gtgaaggtgg 3120
tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg atcgaaatgg 3180
ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga atgaagcgga 3240
tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc gtggaaaaca 3300
cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg gatatgtacg 3360
tggaccagga actggacatc aaccggctgt ccgactacga tgtggacgct atcgtgcctc 3420
agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc gacaagaacc 3480
ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag aactactggc 3540
ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg accaaggccg 3600
agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag ctggtggaaa 3660
cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac actaagtacg 3720
acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc aagctggtgt 3780
ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac taccaccacg 3840
cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag taccctaagc 3900
tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag atgatcgcca 3960
agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc aacatcatga 4020
actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg cctctgatcg 4080
agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt gccaccgtgc 4140
ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg cagacaggcg 4200
gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc gccagaaaga 4260
aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc tattctgtgc 4320
tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg aaagagctgc 4380
tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac tttctggaag 4440
ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag tactccctgt 4500
tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg cagaagggaa 4560
acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc cactatgaga 4620
agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa cagcacaagc 4680
actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg atcctggccg 4740
acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag cccatcagag 4800
agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc cctgccgcct 4860
tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa gaggtgctgg 4920
acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc gacctgtctc 4980
agctgggagg tgactctgga ggatctagcg gaggatcctc tggcagcgag acaccaggaa 5040
caagcgagtc agcaacacca gagagcagtg gcggcagcag cggcggcagc agctccaacg 5100
gtccgactga cgccgcggaa gaagaacttt tgagcaagaa ttatcatctt gagaacgaag 5160
tggctcgtct taagaaaggc tcaggctcag gcaccgcggt aaacataggt ggtggaaccc 5220
ccaagaagaa gaggaaagtc taaccggtca tcatcaccat caccattgag tttaaacccg 5280
ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 5340
gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgagaaaat 5400
tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 5460
caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc 5520
ttctgaggcg gaaagaacca gctggggctc gataccgtcg acctctagct agagcttggc 5580
gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 5640
catacgagcc ggaagcataa agtgtaaagc ctagggtgcc taatgagtga gctaactcac 5700
attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 5760
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 5820
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 5880
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 5940
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 6000
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 6060
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 6120
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6180
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 6240
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6300
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 6360
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6420
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6480
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6540
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 6600
tacggggtct gacactcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 6660
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 6720
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 6780
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 6840
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 6900
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 6960
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 7020
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 7080
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 7140
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 7200
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 7260
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 7320
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 7380
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7440
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7500
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7560
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 7620
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 7680
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 7740
tgacgtcgac ggatcgggag atcgatctcc cgatccccta gggtctactc tcagtacaat 7800
ctgctctgat gccgcatagt taagccagta tctgctccct gcttgtgtgt tggaggtcgc 7860
tgagtagtgc gcgagcaaaa tttaagctac aacaaggcaa ggcttgaccg acaattgcat 7920
gaagaatctg cttagggtta ggcgttttgc gctgcttcgc gatgtacggg ccagatatac 7980
gcgtt 7985
<210> 13
<211> 6784
<212> DNA
<213> rengongxulie(人工序列)
<400> 13
aaggatctgc gatcgctccg gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc 60
cgagaagttg gggggagggg tcggcaattg aacgggtgcc tagagaaggt ggcgcggggt 120
aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc 180
gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac 240
acagctgaag cttcgagggg ctcgcatctc tccttcacgc gcccgccgcc ctacctgagg 300
ccgccatcca cgccggttga gtcgcgttct gccgcctccc gcctgtggtg cctcctgaac 360
tgcgtccgcc gtctaggtaa gtttaaagct caggtcgaga ccgggccttt gtccggcgct 420
cccttggagc ctacctagac tcagccggct ctccacgctt tgcctgaccc tgcttgctca 480
actctacgtc tttgtttcgt tttctgttct gcgccgttac agatccaagc tgtgaccggc 540
gcctacggtt tagtgaaccg tcagatccgc tagagatccg cggccgctaa tacgactcac 600
tatagggaga gccgccacca aacggacagc cgacggaagc gagttcgagt caatgaaaag 660
gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa aagatgggcc ccgacatcgt 720
gatgacccag agccccagca gcctgagcgc cagcgtgggc gaccgcgtga ccatcacctg 780
ccgcagcagc accggcgccg tgaccaccag caactacgcc agctgggtgc aggagaagcc 840
cggcaagctg ttcaagggcc tgatcggcgg caccaacaac cgcgcccccg gcgtgcccag 900
ccgcttcagc ggcagcctga tcggcgacaa ggccaccctg accatcagca gcctgcagcc 960
cgaggacttc gccacctact tctgcgccct gtggtacagc aaccactggg tgttcggcca 1020
gggcaccaag gtggagctga agcgcggcgg cggcggcagc ggcggcggcg gcagcggcgg 1080
cggcggcagc agcggcggcg gcagcgaggt gaagctgctg gagagcggcg gcggcctggt 1140
gcagcccggc ggcagcctga agctgagctg cgccgtgagc ggcttcagcc tgaccgacta 1200
cggcgtgaac tgggtgcgcc aggcccccgg ccgcggcctg gagtggatcg gcgtgatctg 1260
gggcgacggc atcaccgact acaacagcgc cctgaaggac cgcttcatca tcagcaagga 1320
caacggcaag aacaccgtgt acctgcagat gagcaaggtg cgcagcgacg acaccgccct 1380
gtactactgc gtgaccggcc tgttcgacta ctggggccag ggcaccctgg tgaccgtgag 1440
cagctaccca tacgatgttc cagattacgc tggtggggga ggaggtagtg gcggtggtgg 1500
ttcaggaggc ggcggaagcg gtggaggtgg aagcggtacc ctaaatatag aagatgagta 1560
tcggctacat gagacctcaa aagagccaga tgtttctcta gggtccacat ggctgtctga 1620
ttttcctcag gcctgggcgg aaaccggggg catgggactg gcagttcgcc aagctcctct 1680
gatcatacct ctgaaagcaa cctctacccc cgtgtccata aaacaatacc ccatgtcaca 1740
agaagccaga ctggggatca agccccacat acagagactg ttggaccagg gaatactggt 1800
accctgccag tccccctgga acacgcccct gctacccgtt aagaaaccag ggactaatga 1860
ttataggcct gtccaggatc tgagagaagt caacaagcgg gtggaagaca tccaccccac 1920
cgtgcccaac ccttacaacc tcttgagcgg gctcccaccg tcccaccagt ggtacactgt 1980
gcttgattta aaggatgcct ttttctgcct gagactccac cccaccagtc agcctctctt 2040
cgcctttgag tggagagatc cagagatggg aatctcagga caattgacct ggaccagact 2100
cccacagggt ttcaaaaaca gtcccaccct gtttaatgag gcactgcaca gagacctagc 2160
agacttccgg atccagcacc cagacttgat cctgctacag tacgtggatg acttactgct 2220
ggccgccact tctgagctag actgccaaca aggtactcgg gccctgttac aaaccctagg 2280
gaacctcggg tatcgggcct cggccaagaa agcccaaatt tgccagaaac aggtcaagta 2340
tctggggtat cttctaaaag agggtcagag atggctgact gaggccagaa aagagactgt 2400
gatggggcag cctactccga agacccctcg acaactaagg gagttcctag ggaaggcagg 2460
cttctgtcgc ctcttcatcc ctgggtttgc agaaatggca gcccccctgt accctctcac 2520
caaaccgggg actctgttta attggggccc agaccaacaa aaggcctatc aagaaatcaa 2580
gcaagctctt ctaactgccc cagccctggg gttgccagat ttgactaagc cctttgaact 2640
ctttgtcgac gagaagcagg gctacgccaa aggtgtccta acgcaaaaac tgggaccttg 2700
gcgtcggccg gtggcctacc tgtccaaaaa gctagaccca gtagcagctg ggtggccccc 2760
ttgcctacgg atggtagcag ccattgccgt actgacaaag gatgcaggca agctaaccat 2820
gggacagcca ctagtcattc tggcccccca tgcagtagag gcactagtca aacaaccccc 2880
cgaccgctgg ctttccaacg cccggatgac tcactatcag gccttgcttt tggacacgga 2940
ccgggtccag ttcggaccgg tggtagccct gaacccggct acgctgctcc cactgcctga 3000
ggaagggctg caacacaact gccttgatat cctggccgaa gcccacggaa cccgacccga 3060
cctaacggac cagccgctcc cagacgccga ccacacctgg tacacggatg gaagcagtct 3120
cttacaagag ggacagcgta aggcgggagc tgcggtgacc accgagaccg aggtaatctg 3180
ggctaaagcc ctgccagccg ggacatccgc tcagcgggct gaactgatag cactcaccca 3240
ggccctaaag atggcagaag gtaagaagct aaatgtttat actgatagcc gttatgcttt 3300
tgctactgcc catatccatg gagaaatata cagaaggcgt gggtggctca catcagaagg 3360
caaagagatc aaaaataaag acgagatctt ggccctacta aaagccctct ttctgcccaa 3420
aagacttagc ataatccatt gtccaggaca tcaaaaggga cacagcgccg aggctagagg 3480
caaccggatg gctgaccaag cggcccgaaa ggcagccatc acagagactc cagacacctc 3540
taccctcctc atagaaaatt catcaccctc tggcggctca aaaagaaccg ccgacggcag 3600
cgaattcgag cccaagaaga agaggaaagt ctaaccggtc atcatcacca tcaccattga 3660
gtttaaaccc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 3720
ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 3780
aatgagaaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 3840
gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg 3900
ggctctatgg cttctgaggc ggaaagaacc agctggggct cgataccgtc gacctctagc 3960
tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 4020
attccacaca acatacgagc cggaagcata aagtgtaaag cctagggtgc ctaatgagtg 4080
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 4140
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 4200
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 4260
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 4320
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 4380
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 4440
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 4500
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 4560
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 4620
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 4680
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 4740
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 4800
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 4860
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 4920
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 4980
ttgatctttt ctacggggtc tgacactcag tggaacgaaa actcacgtta agggattttg 5040
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 5100
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 5160
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 5220
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 5280
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 5340
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 5400
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 5460
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 5520
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 5580
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 5640
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 5700
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 5760
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 5820
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 5880
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 5940
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 6000
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 6060
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 6120
aaagtgccac ctgacgtcga cggatcggga gatcgatctc ccgatcccct agggtctact 6180
ctcagtacaa tctgctctga tgccgcatag ttaagccagt atctgctccc tgcttgtgtg 6240
ttggaggtcg ctgagtagtg cgcgagcaaa atttaagcta caacaaggca aggcttgacc 6300
gacaattgca tgaagaatct gcttagggtt aggcgttttg cgctgcttcg cgatgtacgg 6360
ggagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 6420
gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 6480
aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 6540
tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 6600
acgaaacacc ggcccagact gagcacgtga gttttagagc tagaaatagc aagttaaaat 6660
aaggctagtc cgttatcaac ttgaaaaagt gggaccgagt cggtcctctg ccatcaaagc 6720
gtgctcagtc tgttttttta agcctctaga cgggccagat atacgcgttc cagatatacg 6780
cgtt 6784
<210> 14
<211> 19
<212> PRT
<213> rengongxulie(人工序列)
<400> 14
Glu Glu Leu Leu Ser Lys Asn Tyr His Leu Glu Asn Glu Val Ala Arg
1 5 10 15
Leu Lys Lys
<210> 15
<211> 34
<212> PRT
<213> rengongxulie(人工序列)
<400> 15
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly
20 25 30
Ser Ser
<210> 16
<211> 17
<212> PRT
<213> rengongxulie(人工序列)
<400> 16
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
1 5 10 15
Gly

Claims (3)

1.一种碱基编辑工具,其特征在于:所述的碱基编辑工具包括SunTag系统和PE2系统,所述的SunTag系统由GCN4多肽组成,所述的GCN4多肽能够被单链可变片段scFv识别,所述的PE2系统由pegRNA、仅有单链DNA切口酶活性的Cas9切口酶H840A、以及M-MLV逆转录酶组成,所述的pegRNA的序列包括sgRNA序列、引物结合序列、以及转录模板序列;
所述碱基编辑工具的构建方法包括:
将所述的逆转录酶和所述的单链可变片段scFv连接形成融合蛋白,将所述的融合蛋白与所述的pegRNA相连,从而构建用于递送所述的pegRNA、逆转录酶和单链可变片段scFv的质粒,其中用于连接所述的逆转录酶和所述的单链可变片段scFv的接头序列为GS linker,所述GS linker的氨基酸序列如SEQ ID NO.16所示;
在所述的Cas9切口酶的C端和N端分别连接1个所述的GCN4多肽,从而构建用于递送所述的Cas9切口酶和GCN4多肽的质粒,所述GCN4多肽的氨基酸序列如SEQ ID NO.14所示,用于连接所述的Cas9切口酶和所述的GCN4多肽的接头序列为flexible linker,所述flexible linker的氨基酸序列如SEQ ID NO.15所示。
2.根据权利要求1所述的碱基编辑工具,其特征在于:所述的碱基编辑工具能够将如SEQ ID NO.1所示的目标序列编辑为如SEQ ID NO.2所示序列,采用的pegRNA序列如SEQ IDNO.3所示。
3.如权利要求1所述的碱基编辑工具在碱基编辑中的应用。
CN202110911545.8A 2021-08-10 2021-08-10 一种碱基编辑工具及其构建方法 Active CN113637672B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202211602322.4A CN115772523A (zh) 2021-08-10 2021-08-10 一种碱基编辑工具
CN202110911545.8A CN113637672B (zh) 2021-08-10 2021-08-10 一种碱基编辑工具及其构建方法
PCT/CN2022/093505 WO2023016021A1 (zh) 2021-08-10 2022-05-18 一种碱基编辑工具及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110911545.8A CN113637672B (zh) 2021-08-10 2021-08-10 一种碱基编辑工具及其构建方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211602322.4A Division CN115772523A (zh) 2021-08-10 2021-08-10 一种碱基编辑工具

Publications (2)

Publication Number Publication Date
CN113637672A CN113637672A (zh) 2021-11-12
CN113637672B true CN113637672B (zh) 2023-01-31

Family

ID=78420263

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211602322.4A Pending CN115772523A (zh) 2021-08-10 2021-08-10 一种碱基编辑工具
CN202110911545.8A Active CN113637672B (zh) 2021-08-10 2021-08-10 一种碱基编辑工具及其构建方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211602322.4A Pending CN115772523A (zh) 2021-08-10 2021-08-10 一种碱基编辑工具

Country Status (2)

Country Link
CN (2) CN115772523A (zh)
WO (1) WO2023016021A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115772523A (zh) * 2021-08-10 2023-03-10 珠海舒桐医疗科技有限公司 一种碱基编辑工具

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020278864A1 (en) * 2019-05-22 2021-12-23 Toolgen Incorporated Single base substitution protein, and composition comprising same
CA3158555A1 (en) * 2019-10-23 2021-04-29 Pairwise Plants Services, Inc. Compositions and methods for rna-templated editing in plants
CA3169462A1 (en) * 2020-01-30 2021-08-05 Pairwise Plants Services, Inc. Compositions, systems, and methods for base diversification
CN111850034B (zh) * 2020-06-24 2023-01-10 中国农业大学 一种基因编辑的载体和方法
CN115772523A (zh) * 2021-08-10 2023-03-10 珠海舒桐医疗科技有限公司 一种碱基编辑工具

Also Published As

Publication number Publication date
CN113637672A (zh) 2021-11-12
CN115772523A (zh) 2023-03-10
WO2023016021A1 (zh) 2023-02-16

Similar Documents

Publication Publication Date Title
KR102370675B1 (ko) 표적 핵산의 변형을 위한 개선된 방법
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
CN108588071A (zh) CRISPR-Cas9靶向敲除人肠癌细胞CNR1基因及其特异性的sgRNA
KR102140596B1 (ko) 유기산 내성 효모 유래 신규 프로모터 및 이를 이용한 목적유전자의 발현방법
CN108642053A (zh) CRISPR-Cas9靶向敲除人肠癌细胞PPP1R1C基因及其特异性的sgRNA
CN107893075A (zh) CRISPR‑Cas9靶向敲除人肠癌细胞RITA基因及其特异性的sgRNA
CN108026523A (zh) 向导rna组装载体
US11001859B2 (en) Recombinantly-modified adeno-associated virus helper vectors and their use to improve the packaging efficiency of recombinantly-modified adeno-associated virus
CN113227365A (zh) 新型乙酰转移酶
DK2828384T3 (en) PROCEDURE FOR SURVIVING SENSITIVITY TO CHEMICAL DNA MODIFICATIONS OF CONSTRUCTED SPEECH DNA BINDING DOMAINS
CN109749987B (zh) 一种通过悬浮震荡共培养制备重构胚胎的方法及其专用组合物
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
CN113637672B (zh) 一种碱基编辑工具及其构建方法
KR20200044968A (ko) 멜라닌 항체 및 이의 용도
CN110373427A (zh) 一种人源tlr4基因3′非翻译区的双荧光素酶报告基因载体及其构建方法与应用
CN106086054A (zh) 一种幽门螺杆菌基因无痕敲除的方法
CN114874332B (zh) 经修饰的rnf112作为治疗als药物的应用
CN114644581B (zh) 含芳基硫酚或芳基硒酚经修饰的氨基酸、重组蛋白及其生物合成方法及应用
KR102335519B1 (ko) 인체 감염 사스코로나 바이러스 예방 및 감염 증상 완화용 백신 조성물
CN113498438A (zh) 基因疗法dna载体
CN112209883B (zh) 一种与rna特异性结合的荧光素染料及其应用
CN114058607B (zh) 一种用于c到u碱基编辑的融合蛋白及其制备方法和应用
CN111041039B (zh) 一种嗜热厌氧乙醇杆菌基因组编辑载体及其应用
KR20110017146A (ko) 인터루킨-10 억제용 siRNA, 그를 포함하는 조성물 및 세포
CN115093482A (zh) 一种高精确性腺嘌呤碱基编辑器及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40058785

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant