CN112251464A - 一种基因点突变的诱导方法 - Google Patents

一种基因点突变的诱导方法 Download PDF

Info

Publication number
CN112251464A
CN112251464A CN202011117935.XA CN202011117935A CN112251464A CN 112251464 A CN112251464 A CN 112251464A CN 202011117935 A CN202011117935 A CN 202011117935A CN 112251464 A CN112251464 A CN 112251464A
Authority
CN
China
Prior art keywords
nucleic acid
sequence
acid construct
sgrna
deaminase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011117935.XA
Other languages
English (en)
Other versions
CN112251464B (zh
Inventor
李硕
王小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongshan Hospital Fudan University
Original Assignee
Zhongshan Hospital Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongshan Hospital Fudan University filed Critical Zhongshan Hospital Fudan University
Priority to CN202011117935.XA priority Critical patent/CN112251464B/zh
Publication of CN112251464A publication Critical patent/CN112251464A/zh
Application granted granted Critical
Publication of CN112251464B publication Critical patent/CN112251464B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种产生基因点突变的融合蛋白及基因点突变的诱导方法。本发明找到了构建融合蛋白的新方法,通过将胞苷脱氨酶融合于nCas9/dCas9为代表的突变型核酸酶内部不同的插入位点,得到的新融合蛋白能对位于前间隔序列3‑14位的胞嘧啶实现有效的C‑T碱基突变。此外,通过将不同的脱氧腺苷脱氨酶及变体组合融合于nCas9/dCas9为代表的突变型核酸酶内部不同的插入位点,得到的新融合蛋白能对位于前间隔序列2‑16位的腺嘌呤实现有效的A‑G碱基突变。通过所述2种方法获得的不同的插入位点为基础的融合蛋白,其可突变范围各有差异。本发明可实现更广范围、更精细且安全性更高的C‑T单碱基替换和A‑G单碱基替换,能有效拓宽单碱基编辑工具的应用。

Description

一种基因点突变的诱导方法
技术领域
本发明涉及分子生物学基因编辑领域,具体地说,涉及一种产生基因点突变的融合蛋白及基因点突变的诱导方法。
背景技术
近年来,随着基因工程技术的飞速发展,基因编辑(Clustered regularlyinterspaced short palindromic repeats,CRISPR)技术已经成为科学界的研究热点,被广泛应用于各类体内和体外的基因组编辑、转基因模式动物的构建以及基因治疗等领域。
目前广泛应用于基因组编辑的CRISPR-Cas9系统属于II型CRISPR-Cas系统,其作用机制具体而言可分为三步:第一步是Cas蛋白对外源DNA的识别,之后Cas蛋白会选择性的切割出长度为30-50bp的外源DNA(被称作原型间隔序列),并将其插入原核生物(宿主)的CRISPR位点。而Cas蛋白选择原型间隔序列的标准是附近的PAM序列,即只有PAM序列附近的外源DNA才能被Cas识别,切割并插入CIRSPR位点。第二步是CRISPR位点的转录,最终形成两条短链的crRNAs(CRISPR来源的RNAs)和tracrRNA(反式作用的crRNA)。其中crRNAs中包含有一段与外源DNA互补的序列,这是CRISPR-Cas系统识别并清除外源DNA的基础。第三步是清除入侵的外源DNA。这一过程需要Cas9、crRNA和tracrRNA的共同作用,它们会靶向外源的双链DNA,靶向的特异性由crRNA中包含的外源DNA互补序列决定:只有当外源双链DNA中包含与crRNA互补的序列并有PAM位点方能被Cas9、crRNA和tracrRNA形成的复合物切割形成DNA双链断裂缺口(DSBs)。
从上述的CRISPR-Cas9作用机制中我们可以看出,CRISPR-Cas9系统切割外源DNA依赖于Cas9、crRNA和tracrRNA。通过在真核生物的基因组中寻找原型间隔序列,便可以构建出特异性的crRNA,之后辅以Cas9和tracrRNA,我们便能实现真核生物基因组的定向切割。而研究者将crRNA与tracrRNA融合,构建出了单一的sgRNA(single-stranded RNA,单向导RNA),这样整个系统只需要Cas9和sgRNA便可发挥基因组定向切割。Cas9和sgRNA可以在基因组中引入DNA双链断裂缺口(double-strain breaks,DSBs)而开启基因编辑过程。
传统基因组点突变诱导与修复的基本原理是利用在靶位点区自发或诱发的DNA双链缺口(double-strain breaks,DSBs),DSBs将激活细胞内的DNA修复机制来进行基因组的改造,比如非同源区的末端连接(Non-homologous end joint,NHEJ)或是同源重组(Homologous recombination,HR)。同源重组的发生通常需要外源的模板DNA以修复DSBs附近的突变或是在DSBs附近引入点突变。
在哺乳动物细胞内,DSB自发产生的概率约低于1/104,如果通过基因工程方法采用spCas9和SaCas9等核酸酶诱发DSBs,效率可提高至10%以上,且具有位点特异性,因此方便了下一步对内源基因靶位点进行的基因修复过程顺利进行。在点突变诱导与修复的过程中,DSBs的引入有利于NHEJ的发生,由于NHEJ与HR之间存在竞争关系,抑制NHEJ的策略被用于增强HR的效率。尽管如此,HR的效率依然不高。
SpCas9和SaCas9等核酸酶中,特定的点突变(如spCas9中的D10A突变和N863A突变)会抑制其切割双链DNA形成DSBs的能力,使核酸酶只切割双链DNA的一条链(单点突变如spCas9中的D10A或N863A,称为切口酶nCas9,其中D10A突变型Cas9切割与sgRNA互补的DNA单链,而N863A突变型Cas9切割非互补链)或不切割双链DNA(多点突变,如在spCas9中同时引入D10A和N863A点突变,称为失活体Cas9(dCas9));但突变后的核酸酶依然能在sgRNA的引导下识别并结合于特定的DNA序列。
将特定的胞苷脱氨酶(cytidine deaminase)与突变型核酸酶(如携带有D10A或/和N863A突变的spCas9)组合,得到的融合蛋白在sgRNA的引导下,可以在不诱发DSBs的情况下,直接在前间隔序列(protospacer)的特定位置诱导胞嘧啶(C)突变为尿嘧啶(U),在DNA序列中,尿嘧啶(U)会被识别并替换为胸腺嘧啶(T),最终实现C-T的单碱基突变。细胞内存在有一种重要的DNA修复酶---尿嘧啶糖基化酶(uracil glycosylase),它能特异性的识别并修复DNA单链或双链中的尿嘧啶残基,这对C-T碱基替换有抑制作用。为提升单碱基编辑的效率,尿嘧啶糖基化酶抑制因子(UGI)被添加至融合蛋白中或是与融合蛋白共表达。目前被用于单碱基编辑的胞苷脱氨酶有大鼠胞苷脱氨酶APOBEC1,人的活化诱导的胞苷脱氨酶(AID),人胞苷脱氨酶APOBEC3A,七鳃鳗胞苷脱氨酶PmCDA1以及七鳃鳗来源的多种胞苷脱氨基酶。通过与不同的突变型核酸酶(如spCas9及各种突变体;SaCas9及各种突变体;Cpf1)组合,得到的融合蛋白能够实现特定区域内的C-T碱基突变,其突变范围取决于两方面,一是核酸酶所能识别的PAM位点相邻的前间隔序列,二是胞苷脱氨酶的活性区域。目前已知以大鼠APOBEC1及七鳃鳗的PmCDA1与spCas9切口酶组合的融合蛋白,主要能编辑位于前间隔序列4-8位的胞嘧啶(前间区序列邻近基序(PAM)的NGG序列定为21-23位),对其它位置的胞嘧啶的编辑能力有限。此外,专利文献CN109021111A,公开日2018.12.18,公开了一种基因碱基编辑器,其包含有两个片段,第一片段包含载脂蛋白B人胞嘧啶脱氨酶3A(humanAPOBEC3A,hA3A),第二片段包含CRISPR/Cas系统相关蛋白。该基因碱基编辑器即使是在GpC二核苷酸的背景下,仍然能够实现高精度、高效率的定向碱基编辑,还能够在甲基化的胞嘧啶(methylated C)上进行高效率的编辑。专利文献CN107522787A,公开了一种在细胞内产生点突变的融合蛋白、其制备及用途,所述融合蛋白含有胞嘧啶脱氨酶和核酸酶活性缺失、保留了解旋酶活性的Cas酶,或由胞嘧啶脱氨酶和核酸酶活性缺失、保留了解旋酶活性的Cas酶形成。本发明能实现定点突变的同时,在特定的基因区获得高的突变效率和多种突变组合。
将优化后的腺苷脱氨基酶(adenosine deaminase)(优化后的腺苷脱氨基酶被称为脱氧腺苷脱氨酶)与突变型核酸酶(如携带有D10A或/和N863A突变的spCas9)组合,得到的融合蛋白在sgRNA的引导下,可以在不诱发DSBs的情况下,直接在前间隔序列(protospacer)的特定位置诱导腺嘌呤(A)突变为次黄嘌呤(I),在DNA序列中,次黄嘌呤(I)会被识别并替换为鸟嘌呤(G),最终实现A-G的单碱基突变。目前被用于单碱基编辑的脱氧腺苷脱氨酶是细菌来源且经定向优化过的ecTadA(未优化称为ecTadA,优化后称为ecTadA*)。通过与不同的突变型核酸酶(如spCas9及各种突变体;SaCas9及各种突变体)组合,得到的融合蛋白能够实现特定区域内的A-G碱基突变,其突变范围取决于两方面,一是核酸酶所能识别的PAM位点相邻的前间隔序列,二是脱氧腺苷脱氨酶的活性区域。目前已知ecTadA-ecTadA*二聚体及各种功能性突变体、ecTadA*单体及各种功能性突变体与spCas9切口酶组合的融合蛋白,主要能编辑位于前间隔序列5-7位的腺嘌呤(前间区序列邻近基序(PAM)的NGG序列定为21-23位),对其它位置的腺嘌呤的编辑能力有限。此外,ecTadA-ecTadA*二聚体、ecTadA*单体与spCas9切口酶组合的融合蛋白在RNA水平有明显的脱靶,限制了其应用。研究者通过脱氨基酶蛋白质工程策略,构建出ecTadA-ecTadA*二聚体及各种功能性突变体、ecTadA*单体及各种功能性突变体,与spCas9切口酶组合的融合蛋白的RNA脱靶明显降低,但可编辑的腺嘌呤位置仍然有限,对位于前间隔序列3-9位的腺嘌呤编辑能力较高(前间区序列邻近基序(PAM)的NGG序列定为21-23位),对其它位置的腺嘌呤的编辑能力有限。有研究者通过将脱氧腺苷脱氨酶与nCas9/dCas9变体(包括循环排列技术(circular permutation)改造的Cas9变体CP-Cas9)拓展突变窗口,但其突变窗口的多样性依然有限。本发明能实现定点突变的同时,在特定的基因区获得高的突变效率和多种突变组合。
然而,目前单碱基编辑工具编辑能力的不足极大的限制了其应用。
发明内容
为了解决上述技术问题,本发明提供了一种提供新的单碱基编辑工具及方法,通过将胞苷脱氨酶/脱氧腺苷脱氨酶融合于nCas9/dCas9为代表的突变型核酸酶内部不同的插入位点,得到的新融合蛋白。与传统的N末端融合蛋白相比,不同插入位点为基础的融合蛋白在RNA水平的脱靶风险有明显降低。本发明可实现更广范围、更精细且安全性更高的C-T单碱基替换和A-G单碱基替换,能有效拓宽单碱基编辑工具的应用。
第一方面,本发明提供了一种核酸构建物,所述核酸构建物具有5’至3’的式I结构:
P1-X2-L1-X1-L2-X3(I)
式中,P1、X2、L1、X1、L2、X3分别为用于构成所述核酸构建物的元件,
P1为第一启动子序列,
X1为脱氨酶及其变体的编码序列,
X2为核酸酶为插入位点N端的的编码序列,
X3为核酸酶为插入位点C端的的编码序列,
L1为无或连接序列,
L2为无或连接序列,
所述核酸酶是无切割活性或单链切割活性的Cas酶,
并且,各“-”独立地为键或核苷酸连接序列。
在某些实施例中,所述核酸酶选自spCas9或其突变体、SaCas9或其突变体、Cpf1或其突变体。
在某些实施例中,所述核酸酶选自nspCas9、nSaCas9、nLbCpf1、nAsCpf1、dspCas9、dSaCas9、dLbCpf1、dAsCpf1任一种。
在某些实施例中,述核酸构建物中还包括核定位信号编码序列。
在某些实施例中,所述脱氨酶变体为胞苷脱氨酶及其变体、脱氧腺苷脱氨酶及其变体、脱氧腺苷脱氨酶及其变体的同源/异源二聚体。
第二方面,本发明提供了一种载体,所述载体包含本发明第一方面所述的核酸构建物。
第三方面,本发明提供了一种宿主细胞,所述细胞含有本发明第一方面所述的核酸构建物或本发明第二方面所述的载体。
第四方面,本发明提供了一种用于基因点突变的试剂组合,包括,
(i)本发明第一方面所述的核酸构建物,或含有所述核酸构建物的第一载体;
(ii)第二核酸构建物,或含有所述第二核酸构建物的第二载体,所述第二核酸构建物具有5’至3’的式II结构:
P2-Y1(II)
式中,P2、Y1分别为用于构成所述核酸构建物的元件,
P2为第二启动子序列,
Y1为sgRNA的编码序列。
并且,各“-”独立地为键或核苷酸连接序列。
在某些实施例中,所述sgRNA编码序列中还包括靶标结合区和核酸酶识别区。
第五方面,本发明还提供了一种试剂盒,所述试剂盒包括本发明第四方面所述的试剂组合。
第六方面,本发明还提供了一种基因点突变的诱导方法,包括以下步骤:
S1:提供待编辑物;
S2:将本发明第一方面所述的核酸构建物或本发明第二方面所述的载体或本发明第四方面所述的试剂组合导入所述待编辑物中。
相对于现有技术的有益效果:
1、本发明找到了nCas9/dCas9为代表的突变型核酸酶内部用于脱氨基酶融合的插入位点,通过与脱氧腺苷脱氨酶及变体/胞苷脱氨酶及变体组合,得到的新融合蛋白能对位于前间隔序列3-16位的腺嘌呤(前间区序列邻近基序(PAM)的NGG序列定为21-23位)实现有效的A-G碱基突变,或对位于前间隔序列3-14位的胞嘧啶(前间区序列邻近基序(PAM)的NGG序列定为21-23位)实现有效的C-T碱基突变,且不同的插入位点为基础的融合蛋白,其可突变范围各有差异。基于此,提供了新的基因编辑组合物,可实现更广范围、更精细的A-G单碱基替换和C-T单碱基替换。
2、本发明还发现,nCas9/dCas9为代表的突变型核酸酶内部用于脱氨基酶融合的插入位点,通过与脱氧腺苷脱氨酶及变体组合,对融合蛋白在RNA水平的脱靶风险有重要影响,能明显降低其在RNA水平的脱靶风险。通过与不同的脱氧腺苷脱氨酶及变体组合,可进一步降低其在RNA水平的脱靶风险。即本发明证实了不同的融合方法会改变A-G单碱基替换及C-T单碱基替换的作用范围,还会改变其在RNA水平的脱靶风险。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式描述中所需要使用的附图作简单地介绍。
图1本发明采用的内部融合单基因编辑系统
图2本发明实施例2中sgRNA的编辑效率统计图
图3本发明实施例3中ABE内部融合系统在RNA水平的脱靶效果
图4本发明实施例3中不同单碱基编辑系统针对各种sgRNA的单碱基编辑效率图
图5本发明实施例4中不同单碱基编辑系统针对sgA和HEK两种sgRNA的编辑效率图,其中胞苷脱氨基酶为LpCDA1L1-1(8)
图6本发明实施例4中不同单碱基编辑系统针对sgA和HEK两种sgRNA的编辑效率图,其中胞苷脱氨基酶为A3A(Y130F)
具体实施方式
根据下述实施例,可以更好地理解本发明。然而,本领域的技术人员容易理解,实施案例所描述的内容仅用于说明和解释本发明,并不用于限制权利要求书中所详细描述的本发明。除非特别说明,本发明采用的试剂、方法和设备如无特别说明,均为常规方法,所使用的试验材料如无特别说明,均可从商业公司获取。
定义
如本文所用,术语“基因编辑”或“碱基突变”或“碱基编辑”指核苷酸序列的某一位置处发生碱基的替换(substitution)、插入(insertion)和/或缺失(deletion)。本发明中所述“编辑”或“突变”优选为单碱基突变。
如本文所用,术语“碱基替换”指核苷酸序列的某一位置处的碱基突变为另一不同的碱基,比如A突变为G,C突变为T。
如本文所用,术语“Cas蛋白”指一种核酸酶。一种优选的Cas蛋白是Cas9蛋白。典型的Cas9蛋白包括(但并不限于):来源于酿脓链球菌(Streptococcuspyogenes)的Cas9。在本发明中,Cas9蛋白为突变的Cas9蛋白,具体地,是无切割活性或只具有单链切割活性的突变的Cas9蛋白。在一优选实施方式中,本发明的Cas9蛋白包括但不限于SpCas9n(D10A)、nSpCas9NG、nSpG、nSpRY、SaCas9n、ScCas9n、XCas9n。
如本文所用,术语“Cas蛋白的编码序列”指编码Cas蛋白的核苷酸序列。在插入的多聚核苷酸序列被转录和翻译从而产生功能性Cas蛋白的情况下,技术人员会认识到,因为密码子的简并性,有大量多聚核苷酸序列可以编码相同的多肽。另外,技术人员也会认识到不同物种对于密码子具有一定的偏好性,可能会根据在不同物种中表达的需要,会对Cas蛋白的密码子进行优化,这些变异体都被术语“Cas蛋白的编码序列”所具体涵盖。此外,术语特定地包括了全长的、与Cas基因序列基本相同的序列,以及编码出保留Cas蛋白功能的蛋白质的序列。
如本文所用,术语“胞苷脱氨酶”是一类能移除胞嘧啶分子氨基的酶。在本发明中,胞苷脱氨酶是与SEQ ID NO:7-8任一所示氨基酸序列相同,或具有同一性且仍保持脱氨基活性的酶。例如具有一定水平(例如70%,75%,80%,85%,90%,95%,98%,99%)序列同一性的变体和突变体,这些变体和突变体都具有胞苷脱氨活性。
如本文所用,术语“腺苷脱氨酶”是一类能移除腺嘌呤分子氨基的酶。在本发明中,腺苷脱氨酶是与SEQ ID NO:3-4任一所示氨基酸序列相同,或具有同一性且仍保持脱氨基活性的酶。例如具有一定水平(例如70%,75%,80%,85%,90%,95%,98%,99%)序列同一性的变体和突变体,这些变体和突变体都具有腺苷脱氨活性。
如本文所用,术语“脱氨酶及其变体”也可以在一些氨基酸位置进行进一步的修饰,例如添加,缺失和/或取代。这样的修饰可以是在一个,两个或三个或更多个氨基酸位置上进行的取代替换。在一个实施例中,修饰是在一个位置处的替换。在一些实施例中,这样的替换是保守氨基酸取代。
如本文所用,术语“保守氨基酸取代”是指氨基酸残基被其他具有相似侧链的氨基酸残基取代的情况。具有相似侧链的氨基酸残基家族在本领域内已有公认的定义,包括碱性侧链(例如赖氨酸,精氨酸,组氨酸),酸性侧链(例如天冬氨酸,谷氨酸),不带电荷的极性侧链(例如甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸),非极性侧链(例如丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,色氨酸,异亮氨酸)和芳族侧链(例如酪氨酸,苯丙氨酸,色氨酸,组氨酸)家族。因此,该发明公开的融合蛋白中的非关键氨基酸残基可以被来自相同侧链家族的另一氨基酸残基取代置换。
在本发明中,通过识别特定DNA序列,以将所述脱氨酶引入到特定突变可以有多种策略,包括基因工程改造过的I-sceI、I-AniI、FoxI、Cas9以及一些合成多核苷酸,如LNA、PNA等。
如本文所用,术语“sgRNA”通常包括两部分:靶标结合区和Cas蛋白识别区。靶标结合区与Cas蛋白识别区通常以5’到3’的方向连接。靶标结合区的长度通常为15~25个碱基,更通常为18~22个碱基,如20个碱基。靶标结合区与DNA的模板链特异性结合,从而将融合蛋白招募到预定位点。通常,DNA模板链上sgRNA结合区域的对侧区紧邻PAM,或者隔开数个碱基(例如10个以内,或8个以内,或5个以内)。因此,在设计sgRNA时,通常先根据所用的Cas酶确定该酶的PAM,然后在DNA的非模板链上寻找可作为PAM的位点,之后将该非模板链(3’到5’)PAM位点下游紧邻该PAM位点或与该PAM位点隔开10个以内(例如8个以内、5个以内等)的长15~25个碱基、更通常长18~22个碱基的片段作为sgRNA的靶标结合区的序列。sgRNA的Cas蛋白识别区则根据所使用的Cas蛋白而确定,这为本领域所技术人员所掌握。
因此,本发明的sgRNA的靶标结合区的序列为含所选Cas酶识别的PAM位点的DNA链下游紧邻该PAM位点或与该PAM位点隔开10个以内(例如8个以内、5个以内等)的长15~25个碱基、更通常长18~22个碱基的片段;其Cas蛋白识别区为所选Cas酶所特异性识别。
可采用本领域常规的方法制备sgRNA,例如,采用常规的化学合成方法合成。sgRNA也可经由表达载体转入细胞,在细胞内表达出该sgRNA。可采用本领域周知的方法构建sgRNA的表达载体。
如本文所用,术语“多核苷酸”可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。本发明所述的核苷酸序列通常可以用PCR扩增法获得。具体而言,可根据本发明所公开的核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
如本文所用,术语“核酸构建物”含有本发明所述的融合蛋白的编码序列,以及与这些序列操作性连接的一个或多个调控序列。本发明所述的融合蛋白的编码序列可以多种方式被操作以保证所述蛋白的表达。在将核酸构建物插入载体之前可根据表达载体的不同或要求而对核酸构建物进行操作。利用重组DNA方法来改变多核苷酸序列的技术是本领域已知的。调控序列可以是合适的启动子序列。启动子序列通常与待表达蛋白的编码序列操作性连接。启动子可以是在所选择的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合启动子,并且可以从编码与该宿主细胞同源或异源的胞外或胞内多肽的基因获得。调控序列也可以是合适的转录终止子序列,由宿主细胞识别以终止转录的序列。终止子序列与编码该多肽的核苷酸序列的3’末端操作性连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。调控序列也可以是合适的前导序列,对宿主细胞翻译重要的mRNA的非翻译区。前导序列与编码该多肽的核苷酸序列的5’末端可操作连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。
在某些实施方案中,所述核酸构建物是载体。例如,可将本发明的多核苷酸序列插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其它载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。表达载体还可包括翻译起始用的核糖体结合位点和转录终止子。本发明所述的多核苷酸序列可操作性地连接到表达载体中的适当启动子上,以经由该启动子指导mRNA合成。
本领域一般技术人员清楚如何选择适当的载体、启动子、增强子和宿主细胞。可采用本领域技术人员熟知的方法构建含本发明所述的多核苷酸序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
可将本发明所述的载体转化适当的宿主细胞,以使其能够表达本发明所述的融合蛋白。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;丝状真菌细胞、或是高等真核细胞,如哺乳动物细胞。宿主细胞还可以是植物细胞。宿主细胞的代表性例子有:大肠杆菌;链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母、丝状真菌;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。除用于表达融合蛋白的细胞外,其它的含本发明所述多核苷酸序列或载体以及sgRNA或其表达载体的细胞,例如用于制备点突变蛋白的细胞,也在本发明所述的宿主细胞的范围之内。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
转化宿主细胞后,获得的转化子可以用常规方法培养,以允许其表达本发明所述的融合蛋白。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。可利用本领域已知的各种分离方法分离和纯化本发明的重组融合蛋白。这些方法是本领域技术人员所熟知的,包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
本发明的融合蛋白、其编码序列或表达载体,和/或sgRNA、其编码序列或表达载体还可以组合物的形式提供。例如,组合物可含有本发明的融合蛋白和sgRNA或sgRNA的表达载体,或可含有本发明融合蛋白的表达载体和sgRNA或sgRNA的表达载体。在组合物中,融合蛋白或其表达载体、或sgRNA或其表达载体可以混合物的形式提供,或者可单独包装。组合物可以是溶液的形式,也可以是冻干形式。
组合物可提供在试剂盒中。因此,本发明提供含有本发明所述组合物的试剂盒。或者,本发明也提供一种试剂盒,该试剂盒含有本发明的融合蛋白和sgRNA或sgRNA的表达载体,或含有本发明融合蛋白的表达载体和sgRNA或sgRNA的表达载体。试剂盒中,融合蛋白或其表达载体、或sgRNA或其表达载体可独立包装,或以混合物的形式提供。试剂盒中还可包括例如用于将所述融合蛋白或其表达载体和/或sgRNA或其表达载体转入细胞的试剂,以及指导技术人员进行所述转入的说明书。或者,试剂盒还可包括指导技术人员采用试剂盒所含成分实施本发明所述的各种方法和用途的说明书。试剂盒中还包括其它的试剂,例如用于PCR的试剂等。
方法和用途
本发明的基因点突变的诱导方法包括在细胞内表达或转染本发明所述的融合蛋白和sgRNA的步骤。一种具体的诱导方法为:根据目标位点的特点(待编辑C/A位点周围的序列信息)设计sgRNA,并构建sgRNA表达载体,之后选取合适的融合蛋白的表达载体,将两者共转染进入目标细胞或动物,实现目标位点的C-T或A-G单碱基替换。另一种具体的诱导方法为:可体外合成针对靶目标的sgRNA,并体外转录获得表达融合蛋白的mRNA,或是获得融合蛋白,将mRNA或融合蛋白与sgRNA混合转染入目标细胞或动物,实现目标位点的单碱基替换。
细胞可以是任意感兴趣的细胞,包括原核细胞和真核细胞,例如植物细胞、动物细胞、微生物细胞等。尤其优选的是动物细胞,例如哺乳动物细胞、啮齿类动物细胞,包括人、马、牛、羊、鼠、兔等等。微生物细胞包括本领域周知的来自各种微生物种类的细胞,尤其是那些具有医疗研究价值、生产价值(例如燃料如乙醇的生产、蛋白质生产、油脂如DHA生产)的微生物种类的细胞。细胞还可以是各种器官来源的细胞,例如来自人肝脏、肾脏、皮肤等处的细胞。
动物可以是任意动物,优选为哺乳动物,如人、马、牛、羊、鼠、兔等。
产生突变的基因可以来自于微生物、植物、动物、细胞、哺乳动物或人。
本发明的方法可以是体外方法,也可以是体内方法。当体内实施时,可采用本领域周知的手段将本发明的融合蛋白或其表达载体和sgRNA或其表达载体转入实验对象体内,如相应的组织细胞内,并通过观察动物表型变化筛选出感兴趣的功能变体。应理解,体内实验时,实验对象可以是各种非人动物,尤其是本领域惯常采用的各种非人模式生物。体内实验也应满足伦理要求。
在本发明中,核苷酸序列的描述是从5’至3’方向,除非特别注明。
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
实施例1构建融合蛋白
合成人源密码子优化的腺苷脱氨酶(TadA)和脱氧腺苷脱氨酶(TadA*)的开放阅读框(ORF),其核苷酸序列分别如SEQ ID NO:1-2所示,编码的氨基酸序列分别如SEQ ID NO:3-4所示。合成胞苷脱氨基酶LpCDA1L1-1(8)和胞苷脱氨基酶APOBEC3A3-Y130F(A3A(Y130F)),其核苷酸序列分别如SEQ ID NO:5-6所示,编码的氨基酸序列分别如SEQ ID NO:7-8所示。
本实验采用spCas9,SaCas9,并引入特定的突变得到nspCas9(Addgene#48137;NCBI ACCESSION QAB34447.1),nSaCas9(Addgene#61593;NCBI ACCESSION J7RUA5)。通过点突变在nspCas9内部引入酶切位点(表1),以融合胞苷脱氨基酶或脱氧腺苷脱氨酶,获得融合蛋白用于后续实验。
利用2A肽段共表达融合蛋白与绿色荧光蛋白EGFP,用以指示融合蛋白的表达情况,并用于后续的流式细胞分选(见图1)。
表1 nspCas9内部的融合位点
Figure BDA0002730970830000161
表2融合蛋白表达载体详细信息
Figure BDA0002730970830000171
Figure BDA0002730970830000181
注:SEQ ID NO:9中的Cbh-nspCas9(N)-Link-adenine deaminase dimer-Link-nCas9(C)序列和SEQ ID NO:10-11中的Cbh-nspCas9(N)-Link-cytidine deaminase-Link-nCas9(C)序列为代表性表述,仅表示融合位点为nCas9-DS113的组合方式,实际构建的载体中融合位点可为表1中的任一个。
实施例2 sgRNA表达载体的构建
构建sgRNA表达载体,在表达特定sgRNA的同时表达UGI-2A-mCherry。UGI可以抑制尿嘧啶糖基化酶的活性,提高C-T突变效率,红色荧光蛋白mCherry用于指示载体表达情况,可用于后续的流式细胞分选(见图1)。
选取多种sgRNAs(详细信息参见表3)构建sgRNA表达载体(详细信息见表4),以分析前间隔序列中胞嘧啶突变为胸腺嘧啶的频率。
表3 sgRNA信息
S16 GGGAATAAATCATAGAATCC SEQ ID NO:12
sgA tGCCCCTCCCTCCCTGGCCC SEQ ID NO:13
sgB AGAGCCCCCCCTCAAAGAGA SEQ ID NO:14
HEK4 GGCACTGCGGCTGGAGGTGG SEQ ID NO:15
FANCFN GGAATCCCTTCTGCAGCACC SEQ ID NO:16
EMXNGG GAGTCCGAGCAGAAGAAGAA SEQ ID NO:17
site1 GAACACAAAGCATAGACTGC SEQ ID NO:18
表4 sgRNA表达载体详细信息
Figure BDA0002730970830000182
Figure BDA0002730970830000191
注:SEQ ID NO:19中的sgRNA序列信息为代表性表述,仅表示sgRNA连入的位点,实际构建的载体中为相应的sgRNA编码序列,即SEQ ID NO:12-18中的任一个。
实施例3不同ABE内部融合单碱基编辑载体与sgRNA表达载体转染HEK293T细胞检测A-G突变频率及特点
将HEK293T细胞系种植在24孔板上放入37℃含5%二氧化碳培养箱进行培养,8-16小时后进行转染实验。ABE内部融合蛋白系统的表达载体(SEQ ID NO:9)与特定sgRNA的表达载体用Lipofectamine 3000进行共转染,37℃,5%二氧化碳培养箱培养72小时后,通过流式细胞分选(flow cytometry)富集同时表达GFP和mCherry两种荧光蛋白的细胞。提取基因组后,使用针对特定sgRNA的PCR引物进行片段扩增,送sanger测序,分析sgRNA靶向的前间隔序列中的A-G突变情况。各融合单碱基编辑系统针对sg1一种sgRNA的编辑效率参见图2,我们发现24种内部融合单碱基编辑系统中有11种在该sgRNA的特定A位点呈现出>40%的A-G单碱基替换效率(535-/583-/770-/793-/801-/895-/905-/919-/1010-/1029-/1249-TadA*-TadA*)。
之后我们将HEK293T细胞系种植在24孔板上放入37℃含5%二氧化碳培养箱进行培养,8-16小时后进行转染实验。ABE内部融合蛋白系统的表达载体与特定sgRNA的表达载体用Lipofectamine 3000进行共转染,37℃,5%二氧化碳培养箱培养48小时后,通过流式细胞分选(flow cytometry)富集同时表达GFP和mCherry两种荧光蛋白的细胞提取总RNA,通过转录组测序和突变分析,我们发现,与N-末端融合的ABE系统相比,ABE系统内部融合系统在RNA水平的脱靶明显降低(图3)。
之后我们挑选有代表性的ABE系统内部融合蛋白,与其它的sgRNA用Lipofectamine 3000进行共转染,37℃,5%二氧化碳培养箱培养72小时后,通过流式细胞分选(flow cytometry)富集同时表达GFP和mCherry两种荧光蛋白的细胞。提取基因组后,使用针对特定sgRNA的PCR引物进行片段扩增,送高通量测序,分析sgRNA靶向的前间隔序列中的A-G突变情况。综合每种单碱基编辑系统针对各种sgRNA的单碱基编辑情况(图4)。我们选用N-末端融合的ABE系统作为比较对象。我们发现,ABE内部融合蛋白系统的活性编辑窗口更加多样化。
实施例4不同CBE内部融合单碱基编辑载体与sgRNA表达载体转染HEK293T细胞检测C-T突变频率及特点
将HEK293T细胞系种植在24孔板上放入37℃含5%二氧化碳培养箱进行培养,8-16小时后进行转染实验。CBE内部融合蛋白系统(脱氨基酶为LpCDA1L1-1(8))的表达载体(SEQID NO:10)与特定sgRNA的表达载体用Lipofectamine 3000进行共转染,37℃,5%二氧化碳培养箱培养72小时后,通过流式细胞分选(flow cytometry)富集同时表达GFP和mCherry两种荧光蛋白的细胞。提取基因组后,使用针对特定sgRNA的PCR引物进行片段扩增,送sanger测序,分析sgRNA靶向的前间隔序列中的C-T突变情况。各融合单碱基编辑系统针对sgA和HEK4两种sgRNA的编辑效率参见图5,我们发现24种内部融合单碱基编辑系统中有12种在至少一种sgRNA的特定C位点呈现出>40%的C-T单碱基替换效率(203-/312-/535-/701-/770-/793-/801-/905-/919-/1010-/1154-/1249-8-BE)。
将HEK293T细胞系种植在24孔板上放入37℃含5%二氧化碳培养箱进行培养,8-16小时后进行转染实验。CBE内部融合蛋白系统(脱氨基酶为A3A(Y130F))的表达载体(SEQ IDNO:11)与特定sgRNA的表达载体用Lipofectamine 3000进行共转染,37℃,5%二氧化碳培养箱培养72小时后,通过流式细胞分选(flow cytometry)富集同时表达GFP和mCherry两种荧光蛋白的细胞。提取基因组后,使用针对特定sgRNA的PCR引物进行片段扩增,送sanger测序,分析sgRNA靶向的前间隔序列中的C-T突变情况。各融合单碱基编辑系统针对sgA和HEK4两种sgRNA的编辑效率参见图6,我们发现24种内部融合单碱基编辑系统中有10种在至少一种sgRNA的特定C位点呈现出>40%的A-G单碱基替换效率(203-/535-/770-/793-/801-/895-/905-/1010-/1029-/1249-A3A(Y130F)-BE)。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
SEQUENCE LISTING
<110> 复旦大学附属中山医院
<120> 一种基因点突变的诱导方法
<130> 202010
<160> 19
<170> PatentIn version 3.3
<210> 1
<211> 495
<212> DNA
<213> Homo sapiens
<400> 1
gaagtcgagt tttcccatga gtactggatg agacacgcat tgactctcgc aaagagggct 60
tgggatgaac gcgaggtgcc cgtgggggca gtactcgtgc ataacaatcg cgtaatcggc 120
gaaggttgga ataggccgat cggacgccac gaccccactg cacatgcgga aatcatggcc 180
cttcgacagg gagggcttgt gatgcagaat tatcgactta tcgatgcgac gctgtacgtc 240
acgcttgaac cttgcgtaat gtgcgcggga gctatgattc actcccgcat tggacgagtt 300
gtattcggtg cccgcgacgc caagacgggt gccgcaggtt cactgatgga cgtgctgcat 360
cacccaggca tgaaccaccg ggtagaaatc acagaaggca tattggcgga cgaatgtgcg 420
gcgctgttgt ccgacttttt tcgcatgcgg aggcaggaga tcaaggccca gaaaaaagca 480
caatcctcta ctgac 495
<210> 2
<211> 504
<212> DNA
<213> Homo sapiens
<400> 2
ggatccagcg aggtggagtt cagccacgag tactggatga ggcacgccct gaccctggcc 60
aagagggcca gggacgagag ggaggtgccc gtgggcgccg tgctggtgct gaacaacagg 120
gtgatcggcg agggctggaa cagggccatc ggcctgcacg accccaccgc ccacgccgag 180
atcatggccc tgaggcaggg cggcctggtg atgcagaact acaggctgat cgacgccacc 240
ctgtacgtga ccttcgagcc ctgcgtgatg tgcgccggcg ccatgatcca cagcaggatc 300
ggcagggtgg tgttcggcgt gaggaacgcc aagaccggcg ccgccggcag cctgatggac 360
gtgctgcact accccggcat gaaccacagg gtggagatca ccgagggcat cctggccgac 420
gagtgcgccg ccctgctgtg ctacttcttc aggatgccca ggcaggtgtt caacgcccag 480
aagaaggccc agagcagcac cgac 504
<210> 3
<211> 165
<212> PRT
<213> Homo sapiens
<400> 3
Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu
1 5 10 15
Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu
20 25 30
Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly
35 40 45
Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly
50 55 60
Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg
85 90 95
Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala
100 105 110
Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg Val
115 120 125
Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser
130 135 140
Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala
145 150 155 160
Gln Ser Ser Thr Asp
165
<210> 4
<211> 168
<212> PRT
<213> Homo sapiens
<400> 4
Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala
1 5 10 15
Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly
20 25 30
Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
35 40 45
Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu
50 55 60
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr
65 70 75 80
Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile
85 90 95
His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr
100 105 110
Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn
115 120 125
His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala
130 135 140
Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln
145 150 155 160
Lys Lys Ala Gln Ser Ser Thr Asp
165
<210> 5
<211> 645
<212> DNA
<213> Homo sapiens
<400> 5
atggccggcg acgagaacgt gcgcgtgagc aagaagctgg acttcaacac cttcgagttc 60
gagttcgaga acctgcacta cgccgagggc cgcggccgca cctacgtgat cttcgacgtg 120
aagccccaga gcgagggcgg ccgcggcgag cgcctgtggg gctacgtgcg caacaacccc 180
ctggacgacc acgccgaggt gatcctgatg agcaagatca acgaccacct ggagacacac 240
cagggcaact acaccatgac ctggtacatg agctggagcc cctgcggcaa ctgcagcagc 300
gagctggtgc cctggctgca gaacctgctg gaggagcagc agcacaccct gaccatgtac 360
ttcagccgca tctacgacaa ggaccgcgcc gtggaccacc gcggcctgtg cgacctgcag 420
cacgtggtga gcaacggctt ccagatgggc gtgatgggcc agaccgaggt ggacacctgc 480
ctggccgagt acgtggaggc cagcggctgc ccccccctga agtggctgca catgaccgac 540
agcaacgcca cccagaccca ggacaagctg agcagcatcc tgatgaaccg cttcgtgcgc 600
tgcgccggca tgcgcgagag cggcatgccc ctgcacctgt tcacc 645
<210> 6
<211> 597
<212> DNA
<213> Homo sapiens
<400> 6
atggaagcca gcccagcatc cgggcccaga cacttgatgg atccacacat attcacttcc 60
aactttaaca atggcattgg aaggcataag acctacctgt gctacgaagt ggagcgcctg 120
gacaatggca cctcggtcaa gatggaccag cacaggggct ttctacacaa ccaggctaag 180
aatcttctct gtggctttta cggccgccat gcggagctgc gcttcttgga cctggttcct 240
tctttgcagt tggacccggc ccagatctac agggtcactt ggttcatctc ctggagcccc 300
tgcttctcct ggggctgtgc cggggaagtg cgtgcgttcc ttcaggagaa cacacacgtg 360
agactgcgta tcttcgctgc ccgcatcttc gattacgacc ccctatataa ggaggcactg 420
caaatgctgc gggatgctgg ggcccaagtc tccatcatga cctacgatga atttaagcac 480
tgctgggaca cctttgtgga ccaccaggga tgtcccttcc agccctggga tggactagat 540
gagcacagcc aagccctgag tgggaggctg cgggccattc tccagaatca gggaaac 597
<210> 7
<211> 214
<212> PRT
<213> Homo sapiens
<400> 7
Ala Gly Asp Glu Asn Val Arg Val Ser Lys Lys Leu Asp Phe Asn Thr
1 5 10 15
Phe Glu Phe Glu Phe Glu Asn Leu His Tyr Ala Glu Gly Arg Gly Arg
20 25 30
Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Glu Gly Gly Arg Gly
35 40 45
Glu Arg Leu Trp Gly Tyr Val Arg Asn Asn Pro Leu Asp Asp His Ala
50 55 60
Glu Val Ile Leu Met Ser Lys Ile Asn Asp His Leu Glu Thr His Gln
65 70 75 80
Gly Asn Tyr Thr Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Gly Asn
85 90 95
Cys Ser Ser Glu Leu Val Pro Trp Leu Gln Asn Leu Leu Glu Glu Gln
100 105 110
Gln His Thr Leu Thr Met Tyr Phe Ser Arg Ile Tyr Asp Lys Asp Arg
115 120 125
Ala Val Asp His Arg Gly Leu Cys Asp Leu Gln His Val Val Ser Asn
130 135 140
Gly Phe Gln Met Gly Val Met Gly Gln Thr Glu Val Asp Thr Cys Leu
145 150 155 160
Ala Glu Tyr Val Glu Ala Ser Gly Cys Pro Pro Leu Lys Trp Leu His
165 170 175
Met Thr Asp Ser Asn Ala Thr Gln Thr Gln Asp Lys Leu Ser Ser Ile
180 185 190
Leu Met Asn Arg Phe Val Arg Cys Ala Gly Met Arg Glu Ser Gly Met
195 200 205
Pro Leu His Leu Phe Thr
210
<210> 8
<211> 199
<212> PRT
<213> Homo sapiens
<400> 8
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Phe Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 9
<211> 6283
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
ggtacccgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 60
cccattgacg tcaatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta 120
tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc 180
tattgacgtc aatgacggta aatggcccgc ctggcattgt gcccagtaca tgaccttatg 240
ggactttcct acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt 300
gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 360
tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc 420
gccaggcggg gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc 480
agccaatcag agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg 540
gccctataaa aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg 600
tgccccgctc cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc 660
cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagctg agcaagaggt 720
aagggtttaa gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc 780
ctgaaatcac tttttttcag gttggaccgg tgccaccatg gactataagg accacgacgg 840
agactacaag gatcatgata ttgattacaa agacgatgac gataagatgg ccccaaagaa 900
gaagcggaag gtcggtatcc acggagtccc agcagccgac aagaagtaca gcatcggcct 960
ggccatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca aggtgcccag 1020
caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga acctgatcgg 1080
agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga gaaccgccag 1140
aagaagatac accagacgga agaaccggat ctgctatctg caagagatct tcagcaacga 1200
gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc tggtggaaga 1260
ggataagaag actagtggat ccagctctgc tagacctaag aaaaagagga aggtggcggc 1320
cgctggatct ggacctaaga aaaagaggaa ggtggcggcc gctggatcta gcgaggtgga 1380
gttcagccac gagtactgga tgaggcacgc cctgaccctg gccaagaggg ccagggacga 1440
gagggaggtg cccgtgggcg ccgtgctggt gctgaacaac agggtgatcg gcgagggctg 1500
gaacagggcc atcggcctgc acgaccccac cgcccacgcc gagatcatgg ccctgaggca 1560
gggcggcctg gtgatgcaga actacaggct gatcgacgcc accctgtacg tgaccttcga 1620
gccctgcgtg atgtgcgccg gcgccatgat ccacagcagg atcggcaggg tggtgttcgg 1680
cgtgaggaac gccaagaccg gcgccgccgg cagcctgatg gacgtgctgc actaccccgg 1740
catgaaccac agggtggaga tcaccgaggg catcctggcc gacgagtgcg ccgccctgct 1800
gtgctacttc ttcaggatgc ccaggcaggt gttcaacgcc cagaagaagg cccagagcag 1860
caccgacagc ggcggcagca gcggcggcag cagcggcagc gagacccccg gcaccagcga 1920
gagcgccacc cccgagagca gcggcggcag ctctggtgga tccagcgagg tggagttcag 1980
ccacgagtac tggatgaggc acgccctgac cctggccaag agggccaggg acgagaggga 2040
ggtgcccgtg ggcgccgtgc tggtgctgaa caacagggtg atcggcgagg gctggaacag 2100
ggccatcggc ctgcacgacc ccaccgccca cgccgagatc atggccctga ggcagggcgg 2160
cctggtgatg cagaactaca ggctgatcga cgccaccctg tacgtgacct tcgagccctg 2220
cgtgatgtgc gccggcgcca tgatccacag caggatcggc agggtggtgt tcggcgtgag 2280
gaacgccaag accggcgccg ccggcagcct gatggacgtg ctgcactacc ccggcatgaa 2340
ccacagggtg gagatcaccg agggcatcct ggccgacgag tgcgccgccc tgctgtgcta 2400
cttcttcagg atgcccaggc aggtgttcaa cgcccagaag aaggcccaga gcagcaccga 2460
cgctagacac gagcggcacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga 2520
gaagtacccc accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga 2580
cctgcggctg atctatctgg ccctggccca catgatcaag ttccggggcc acttcctgat 2640
cgagggcgac ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca 2700
gacctacaac cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc 2760
catcctgtct gccagactga gcaagagcag acggctggaa aatctgatcg cccagctgcc 2820
cggcgagaag aagaatggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc 2880
caacttcaag agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac 2940
ctacgacgac gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt 3000
tctggccgcc aagaacctgt ccgacgccat cctgctgagc gacatcctga gagtgaacac 3060
cgagatcacc aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca 3120
ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagagat 3180
tttcttcgac cagagcaaga acggctacgc cggctacatt gacggcggag ccagccagga 3240
agagttctac aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct 3300
cgtgaagctg aacagagagg acctgctgcg gaagcagcgg accttcgaca acggcagcat 3360
cccccaccag atccacctgg gagagctgca cgccattctg cggcggcagg aagattttta 3420
cccattcctg aaggacaacc gggaaaagat cgagaagatc ctgaccttcc gcatccccta 3480
ctacgtgggc cctctggcca ggggaaacag cagattcgcc tggatgacca gaaagagcga 3540
ggaaaccatc accccctgga acttcgagga agtggtggac aagggcgctt ccgcccagag 3600
cttcatcgag cggatgacca acttcgataa gaacctgccc aacgagaagg tgctgcccaa 3660
gcacagcctg ctgtacgagt acttcaccgt gtataacgag ctgaccaaag tgaaatacgt 3720
gaccgaggga atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga 3780
cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa 3840
gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc 3900
cctgggcaca taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggacaatga 3960
ggaaaacgag gacattctgg aagatatcgt gctgaccctg acactgtttg aggacagaga 4020
gatgatcgag gaacggctga aaacctatgc ccacctgttc gacgacaaag tgatgaagca 4080
gctgaagcgg cggagataca ccggctgggg caggctgagc cggaagctga tcaacggcat 4140
ccgggacaag cagtccggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa 4200
cagaaacttc atgcagctga tccacgacga cagcctgacc tttaaagagg acatccagaa 4260
agcccaggtg tccggccagg gcgatagcct gcacgagcac attgccaatc tggccggcag 4320
ccccgccatt aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt 4380
gatgggccgg cacaagcccg agaacatcgt gatcgaaatg gccagagaga accagaccac 4440
ccagaaggga cagaagaaca gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga 4500
gctgggcagc cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa 4560
gctgtacctg tactacctgc agaatgggcg ggatatgtac gtggaccagg aactggacat 4620
caaccggctg tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga 4680
ctccatcgac aacaaggtgc tgaccagaag cgacaagaac cggggcaaga gcgacaacgt 4740
gccctccgaa gaggtcgtga agaagatgaa gaactactgg cggcagctgc tgaacgccaa 4800
gctgattacc cagagaaagt tcgacaatct gaccaaggcc gagagaggcg gcctgagcga 4860
actggataag gccggcttca tcaagagaca gctggtggaa acccggcaga tcacaaagca 4920
cgtggcacag atcctggact cccggatgaa cactaagtac gacgagaatg acaagctgat 4980
ccgggaagtg aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt 5040
ccagttttac aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa 5100
cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta 5160
cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg 5220
caaggctacc gccaagtact tcttctacag caacatcatg aactttttca agaccgagat 5280
taccctggcc aacggcgaga tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg 5340
ggagatcgtg tgggataagg gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc 5400
ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat 5460
cctgcccaag aggaacagcg ataagctgat cgccagaaag aaggactggg accctaagaa 5520
gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga 5580
aaagggcaag tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga 5640
aagaagcagc ttcgagaaga atcccatcga ctttctggaa gccaagggct acaaagaagt 5700
gaaaaaggac ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggccg 5760
gaagagaatg ctggcctctg ccggcgaact gcagaaggga aacgaactgg ccctgccctc 5820
caaatatgtg aacttcctgt acctggccag ccactatgag aagctgaagg gctcccccga 5880
ggataatgag cagaaacagc tgtttgtgga acagcacaag cactacctgg acgagatcat 5940
cgagcagatc agcgagttct ccaagagagt gatcctggcc gacgctaatc tggacaaagt 6000
gctgtccgcc tacaacaagc accgggataa gcccatcaga gagcaggccg agaatatcat 6060
ccacctgttt accctgacca atctgggagc ccctgccgcc ttcaagtact ttgacaccac 6120
catcgaccgg aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca 6180
gagcatcacc ggcctgtacg agacacggat cgacctgtct cagctgggag gcgacaaaag 6240
gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa aag 6283
<210> 10
<211> 5761
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
ggtacccgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 60
cccattgacg tcaatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta 120
tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc 180
tattgacgtc aatgacggta aatggcccgc ctggcattgt gcccagtaca tgaccttatg 240
ggactttcct acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt 300
gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 360
tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc 420
gccaggcggg gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc 480
agccaatcag agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg 540
gccctataaa aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg 600
tgccccgctc cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc 660
cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagctg agcaagaggt 720
aagggtttaa gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc 780
ctgaaatcac tttttttcag gttggaccgg tgccaccatg gactataagg accacgacgg 840
agactacaag gatcatgata ttgattacaa agacgatgac gataagatgg ccccaaagaa 900
gaagcggaag gtcggtatcc acggagtccc agcagccgac aagaagtaca gcatcggcct 960
ggccatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca aggtgcccag 1020
caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga acctgatcgg 1080
agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga gaaccgccag 1140
aagaagatac accagacgga agaaccggat ctgctatctg caagagatct tcagcaacga 1200
gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc tggtggaaga 1260
ggataagaag actagtggat ccagctctgc tagaatggcc ggcgacgaga acgtgcgcgt 1320
gagcaagaag ctggacttca acaccttcga gttcgagttc gagaacctgc actacgccga 1380
gggccgcggc cgcacctacg tgatcttcga cgtgaagccc cagagcgagg gcggccgcgg 1440
cgagcgcctg tggggctacg tgcgcaacaa ccccctggac gaccacgccg aggtgatcct 1500
gatgagcaag atcaacgacc acctggagac acaccagggc aactacacca tgacctggta 1560
catgagctgg agcccctgcg gcaactgcag cagcgagctg gtgccctggc tgcagaacct 1620
gctggaggag cagcagcaca ccctgaccat gtacttcagc cgcatctacg acaaggaccg 1680
cgccgtggac caccgcggcc tgtgcgacct gcagcacgtg gtgagcaacg gcttccagat 1740
gggcgtgatg ggccagaccg aggtggacac ctgcctggcc gagtacgtgg aggccagcgg 1800
ctgccccccc ctgaagtggc tgcacatgac cgacagcaac gccacccaga cccaggacaa 1860
gctgagcagc atcctgatga accgcttcgt gcgctgcgcc ggcatgcgcg agagcggcat 1920
gcccctgcac ctgttcaccg ctagacacga gcggcacccc atcttcggca acatcgtgga 1980
cgaggtggcc taccacgaga agtaccccac catctaccac ctgagaaaga aactggtgga 2040
cagcaccgac aaggccgacc tgcggctgat ctatctggcc ctggcccaca tgatcaagtt 2100
ccggggccac ttcctgatcg agggcgacct gaaccccgac aacagcgacg tggacaagct 2160
gttcatccag ctggtgcaga cctacaacca gctgttcgag gaaaacccca tcaacgccag 2220
cggcgtggac gccaaggcca tcctgtctgc cagactgagc aagagcagac ggctggaaaa 2280
tctgatcgcc cagctgcccg gcgagaagaa gaatggcctg ttcggcaacc tgattgccct 2340
gagcctgggc ctgaccccca acttcaagag caacttcgac ctggccgagg atgccaaact 2400
gcagctgagc aaggacacct acgacgacga cctggacaac ctgctggccc agatcggcga 2460
ccagtacgcc gacctgtttc tggccgccaa gaacctgtcc gacgccatcc tgctgagcga 2520
catcctgaga gtgaacaccg agatcaccaa ggcccccctg agcgcctcta tgatcaagag 2580
atacgacgag caccaccagg acctgaccct gctgaaagct ctcgtgcggc agcagctgcc 2640
tgagaagtac aaagagattt tcttcgacca gagcaagaac ggctacgccg gctacattga 2700
cggcggagcc agccaggaag agttctacaa gttcatcaag cccatcctgg aaaagatgga 2760
cggcaccgag gaactgctcg tgaagctgaa cagagaggac ctgctgcgga agcagcggac 2820
cttcgacaac ggcagcatcc cccaccagat ccacctggga gagctgcacg ccattctgcg 2880
gcggcaggaa gatttttacc cattcctgaa ggacaaccgg gaaaagatcg agaagatcct 2940
gaccttccgc atcccctact acgtgggccc tctggccagg ggaaacagca gattcgcctg 3000
gatgaccaga aagagcgagg aaaccatcac cccctggaac ttcgaggaag tggtggacaa 3060
gggcgcttcc gcccagagct tcatcgagcg gatgaccaac ttcgataaga acctgcccaa 3120
cgagaaggtg ctgcccaagc acagcctgct gtacgagtac ttcaccgtgt ataacgagct 3180
gaccaaagtg aaatacgtga ccgagggaat gagaaagccc gccttcctga gcggcgagca 3240
gaaaaaggcc atcgtggacc tgctgttcaa gaccaaccgg aaagtgaccg tgaagcagct 3300
gaaagaggac tacttcaaga aaatcgagtg cttcgactcc gtggaaatct ccggcgtgga 3360
agatcggttc aacgcctccc tgggcacata ccacgatctg ctgaaaatta tcaaggacaa 3420
ggacttcctg gacaatgagg aaaacgagga cattctggaa gatatcgtgc tgaccctgac 3480
actgtttgag gacagagaga tgatcgagga acggctgaaa acctatgccc acctgttcga 3540
cgacaaagtg atgaagcagc tgaagcggcg gagatacacc ggctggggca ggctgagccg 3600
gaagctgatc aacggcatcc gggacaagca gtccggcaag acaatcctgg atttcctgaa 3660
gtccgacggc ttcgccaaca gaaacttcat gcagctgatc cacgacgaca gcctgacctt 3720
taaagaggac atccagaaag cccaggtgtc cggccagggc gatagcctgc acgagcacat 3780
tgccaatctg gccggcagcc ccgccattaa gaagggcatc ctgcagacag tgaaggtggt 3840
ggacgagctc gtgaaagtga tgggccggca caagcccgag aacatcgtga tcgaaatggc 3900
cagagagaac cagaccaccc agaagggaca gaagaacagc cgcgagagaa tgaagcggat 3960
cgaagagggc atcaaagagc tgggcagcca gatcctgaaa gaacaccccg tggaaaacac 4020
ccagctgcag aacgagaagc tgtacctgta ctacctgcag aatgggcggg atatgtacgt 4080
ggaccaggaa ctggacatca accggctgtc cgactacgat gtggaccata tcgtgcctca 4140
gagctttctg aaggacgact ccatcgacaa caaggtgctg accagaagcg acaagaaccg 4200
gggcaagagc gacaacgtgc cctccgaaga ggtcgtgaag aagatgaaga actactggcg 4260
gcagctgctg aacgccaagc tgattaccca gagaaagttc gacaatctga ccaaggccga 4320
gagaggcggc ctgagcgaac tggataaggc cggcttcatc aagagacagc tggtggaaac 4380
ccggcagatc acaaagcacg tggcacagat cctggactcc cggatgaaca ctaagtacga 4440
cgagaatgac aagctgatcc gggaagtgaa agtgatcacc ctgaagtcca agctggtgtc 4500
cgatttccgg aaggatttcc agttttacaa agtgcgcgag atcaacaact accaccacgc 4560
ccacgacgcc tacctgaacg ccgtcgtggg aaccgccctg atcaaaaagt accctaagct 4620
ggaaagcgag ttcgtgtacg gcgactacaa ggtgtacgac gtgcggaaga tgatcgccaa 4680
gagcgagcag gaaatcggca aggctaccgc caagtacttc ttctacagca acatcatgaa 4740
ctttttcaag accgagatta ccctggccaa cggcgagatc cggaagcggc ctctgatcga 4800
gacaaacggc gaaaccgggg agatcgtgtg ggataagggc cgggattttg ccaccgtgcg 4860
gaaagtgctg agcatgcccc aagtgaatat cgtgaaaaag accgaggtgc agacaggcgg 4920
cttcagcaaa gagtctatcc tgcccaagag gaacagcgat aagctgatcg ccagaaagaa 4980
ggactgggac cctaagaagt acggcggctt cgacagcccc accgtggcct attctgtgct 5040
ggtggtggcc aaagtggaaa agggcaagtc caagaaactg aagagtgtga aagagctgct 5100
ggggatcacc atcatggaaa gaagcagctt cgagaagaat cccatcgact ttctggaagc 5160
caagggctac aaagaagtga aaaaggacct gatcatcaag ctgcctaagt actccctgtt 5220
cgagctggaa aacggccgga agagaatgct ggcctctgcc ggcgaactgc agaagggaaa 5280
cgaactggcc ctgccctcca aatatgtgaa cttcctgtac ctggccagcc actatgagaa 5340
gctgaagggc tcccccgagg ataatgagca gaaacagctg tttgtggaac agcacaagca 5400
ctacctggac gagatcatcg agcagatcag cgagttctcc aagagagtga tcctggccga 5460
cgctaatctg gacaaagtgc tgtccgccta caacaagcac cgggataagc ccatcagaga 5520
gcaggccgag aatatcatcc acctgtttac cctgaccaat ctgggagccc ctgccgcctt 5580
caagtacttt gacaccacca tcgaccggaa gaggtacacc agcaccaaag aggtgctgga 5640
cgccaccctg atccaccaga gcatcaccgg cctgtacgag acacggatcg acctgtctca 5700
gctgggaggc gacaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa 5760
g 5761
<210> 11
<211> 5713
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
ggtacccgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 60
cccattgacg tcaatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta 120
tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc 180
tattgacgtc aatgacggta aatggcccgc ctggcattgt gcccagtaca tgaccttatg 240
ggactttcct acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt 300
gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 360
tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc 420
gccaggcggg gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc 480
agccaatcag agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg 540
gccctataaa aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg 600
tgccccgctc cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc 660
cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagctg agcaagaggt 720
aagggtttaa gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc 780
ctgaaatcac tttttttcag gttggaccgg tgccaccatg gactataagg accacgacgg 840
agactacaag gatcatgata ttgattacaa agacgatgac gataagatgg ccccaaagaa 900
gaagcggaag gtcggtatcc acggagtccc agcagccgac aagaagtaca gcatcggcct 960
ggccatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca aggtgcccag 1020
caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga acctgatcgg 1080
agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga gaaccgccag 1140
aagaagatac accagacgga agaaccggat ctgctatctg caagagatct tcagcaacga 1200
gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc tggtggaaga 1260
ggataagaag actagtggat ccagctctgc tagaatggaa gccagcccag catccgggcc 1320
cagacacttg atggatccac acatattcac ttccaacttt aacaatggca ttggaaggca 1380
taagacctac ctgtgctacg aagtggagcg cctggacaat ggcacctcgg tcaagatgga 1440
ccagcacagg ggctttctac acaaccaggc taagaatctt ctctgtggct tttacggccg 1500
ccatgcggag ctgcgcttct tggacctggt tccttctttg cagttggacc cggcccagat 1560
ctacagggtc acttggttca tctcctggag cccctgcttc tcctggggct gtgccgggga 1620
agtgcgtgcg ttccttcagg agaacacaca cgtgagactg cgtatcttcg ctgcccgcat 1680
cttcgattac gaccccctat ataaggaggc actgcaaatg ctgcgggatg ctggggccca 1740
agtctccatc atgacctacg atgaatttaa gcactgctgg gacacctttg tggaccacca 1800
gggatgtccc ttccagccct gggatggact agatgagcac agccaagccc tgagtgggag 1860
gctgcgggcc attctccaga atcagggaaa cgctagacac gagcggcacc ccatcttcgg 1920
caacatcgtg gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa 1980
gaaactggtg gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca 2040
catgatcaag ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga 2100
cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc 2160
catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag 2220
acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggcaa 2280
cctgattgcc ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga 2340
ggatgccaaa ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc 2400
ccagatcggc gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat 2460
cctgctgagc gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc 2520
tatgatcaag agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg 2580
gcagcagctg cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc 2640
cggctacatt gacggcggag ccagccagga agagttctac aagttcatca agcccatcct 2700
ggaaaagatg gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg 2760
gaagcagcgg accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca 2820
cgccattctg cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat 2880
cgagaagatc ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag 2940
cagattcgcc tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga 3000
agtggtggac aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa 3060
gaacctgccc aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt 3120
gtataacgag ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct 3180
gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac 3240
cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat 3300
ctccggcgtg gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat 3360
tatcaaggac aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt 3420
gctgaccctg acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc 3480
ccacctgttc gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg 3540
caggctgagc cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct 3600
ggatttcctg aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga 3660
cagcctgacc tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct 3720
gcacgagcac attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac 3780
agtgaaggtg gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt 3840
gatcgaaatg gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag 3900
aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc 3960
cgtggaaaac acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg 4020
ggatatgtac gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca 4080
tatcgtgcct cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag 4140
cgacaagaac cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa 4200
gaactactgg cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct 4260
gaccaaggcc gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca 4320
gctggtggaa acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa 4380
cactaagtac gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc 4440
caagctggtg tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa 4500
ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa 4560
gtaccctaag ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa 4620
gatgatcgcc aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag 4680
caacatcatg aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg 4740
gcctctgatc gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt 4800
tgccaccgtg cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt 4860
gcagacaggc ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat 4920
cgccagaaag aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc 4980
ctattctgtg ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt 5040
gaaagagctg ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga 5100
ctttctggaa gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa 5160
gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact 5220
gcagaaggga aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag 5280
ccactatgag aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga 5340
acagcacaag cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt 5400
gatcctggcc gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa 5460
gcccatcaga gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc 5520
ccctgccgcc ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa 5580
agaggtgctg gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat 5640
cgacctgtct cagctgggag gcgacaaaag gccggcggcc acgaaaaagg ccggccaggc 5700
aaaaaagaaa aag 5713
<210> 12
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
gggaataaat catagaatcc 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
gggaataaat catagaatcc 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
agagcccccc ctcaaagaga 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
ggcactgcgg ctggaggtgg 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
ggaatccctt ctgcagcacc 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
gagtccgagc agaagaagaa 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
gaacacaaag catagactgc 20
<210> 19
<211> 5951
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gagaccgaga gagggtctca gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttaaagaat 360
tcctagcgtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 420
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 480
gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 540
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 600
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 660
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 720
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 780
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 840
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 900
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 960
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 1020
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 1080
ggcctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 1140
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 1200
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 1260
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 1320
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1380
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1440
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1500
gtggttcaaa gtttttttct tccatttcag gtgtcgtgac gtacggccac catgcatggt 1560
ggccgtacgg ccaccatgtc tagacctaag aaaaagagga aggtggcggc cgctggatcc 1620
ccatggatga ccaacctttc cgacatcata gagaaggaaa caggcaaaca gttggtcatc 1680
caagagtcga tactcatgct tcctgaagaa gttgaggagg tcattgggaa taagccggaa 1740
agtgacattc tcgtacacac tgcgtatgat gagagcaccg atgagaacgt gatgctgctc 1800
acgtcagatg ccccagagta caaaccctgg gctctggtga ttcaggactc taatggagag 1860
aacaagatca agatgctatc tggtggttct ggaggatctg gtggttctca attcactaat 1920
ctgtcagata ttattgaaaa ggaaaccggc aagcaactgg ttatccagga atccatcctc 1980
atgctcccag aggaggtgga agaagtcatt gggaacaagc cggaaagcga tatactcgtg 2040
cacaccgcct acgacgagag caccgacgag aatgtcatgc ttctgactag cgacgcccct 2100
gaatacaagc cctgggctct ggtcatacag gatagcaacg gtgagaacaa gattaagatg 2160
ctctctggtg gttctcccaa gaagaagagg aaagtcgcta gcgagggcag aggaagtctg 2220
ctaacatgcg gtgacgtcga ggagaatcct ggccctagcg tgagcaaggg cgaggaggat 2280
aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 2340
ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 2400
gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat cctgtcccct 2460
cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 2520
aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 2580
gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 2640
ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 2700
gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 2760
aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac ctacaaggcc 2820
aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga catcacctcc 2880
cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg ccactccacc 2940
ggcggcatgg acgagctgta caaggaattc taactagagc tcgctgatca gcctcgactg 3000
tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg 3060
aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga 3120
gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg 3180
aagagaatag caggcatgct ggggagcggc cgcaggaacc cctagtgatg gagttggcca 3240
ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 3300
cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc 3360
tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata cgtcaaagca 3420
accatagtac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 3480
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 3540
tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 3600
ccgatttagt gctttacggc acctcgaccc caaaaaactt gatttgggtg atggttcacg 3660
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 3720
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg gctattcttt 3780
tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 3840
aaaatttaac gcgaatttta acaaaatatt aacgtttaca attttatggt gcactctcag 3900
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 3960
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4020
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4080
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4140
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4200
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4260
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 4320
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 4380
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 4440
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 4500
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 4560
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 4620
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 4680
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 4740
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 4800
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 4860
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 4920
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 4980
gcgtggaagc cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 5040
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 5100
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 5160
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 5220
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 5280
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 5340
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 5400
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 5460
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 5520
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 5580
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 5640
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 5700
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 5760
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 5820
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 5880
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 5940
tgctcacatg t 5951

Claims (10)

1.一种核酸构建物,其特征在于,所述核酸构建物具有5’至3’的式I结构:
P1-X2-L1-X1-L2-X3 (I)
式中,P1、X2、L1、X1、L2、X3分别为用于构成所述核酸构建物的元件,
P1为第一启动子序列,
X1为脱氨酶及其变体的编码序列,
X2为核酸酶为插入位点N端的的编码序列,
X3为核酸酶为插入位点C端的的编码序列,
L1为无或连接序列,
L2为无或连接序列,
所述核酸酶是无切割活性或单链切割活性的Cas酶,
并且,各“-”独立地为键或核苷酸连接序列。
2.根据权利要求1所述的核酸构建物,其特征在于,所述核酸酶选自spCas9或其突变体、SaCas9或其突变体、Cpf1或其突变体。
3.根据权利要求2所述的核酸构建物,其特征在于,所述核酸酶选自nspCas9、nSaCas9、nLbCpf1、nAsCpf1、dspCas9、dSaCas9、dLbCpf1、dAsCpf1任一种。
4.根据权利要求1所述的核酸构建物,其特征在于,所述脱氨酶变体为胞苷脱氨酶及其变体、脱氧腺苷脱氨酶及其变体、脱氧腺苷脱氨酶及其变体的同源/异源二聚体。
5.一种载体,其特征在于,所述载体包含权利要求1-4任一所述的核酸构建物。
6.一种宿主细胞,其特征在于,所述细胞含有权利要求1-5任一所述的核酸构建物或权利要求5所述的载体。
7.一种用于基因点突变的试剂组合,其特征在于,包括,
(i)权利要求1-4任一所述的核酸构建物,或含有所述核酸构建物的第一载体;
(ii)第二核酸构建物,或含有所述第二核酸构建物的第二载体,所述第二核酸构建物具有5’至3’的式II结构:
P2-Y1(II)
式中,P2、Y1分别为用于构成所述核酸构建物的元件,
P2为第二启动子序列,
Y1为sgRNA的编码序列。
并且,各“-”独立地为键或核苷酸连接序列。
8.根据权利要求7所述的试剂组合,其特征在于,所述sgRNA编码序列中还包括靶标结合区和核酸酶识别区。
9.一种试剂盒,其特征在于,所述试剂盒包括权利要求7所述的试剂组合。
10.一种基因点突变的诱导方法,其特征在于,包括以下步骤:
S1:提供待编辑物;
S2:将权利要求1-4任一所述的核酸构建物或权利要求5所述的载体或权利要求7-8任一所述的试剂组合导入所述待编辑物中。
CN202011117935.XA 2020-10-19 2020-10-19 一种基因点突变的诱导方法 Active CN112251464B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011117935.XA CN112251464B (zh) 2020-10-19 2020-10-19 一种基因点突变的诱导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011117935.XA CN112251464B (zh) 2020-10-19 2020-10-19 一种基因点突变的诱导方法

Publications (2)

Publication Number Publication Date
CN112251464A true CN112251464A (zh) 2021-01-22
CN112251464B CN112251464B (zh) 2023-09-12

Family

ID=74243993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011117935.XA Active CN112251464B (zh) 2020-10-19 2020-10-19 一种基因点突变的诱导方法

Country Status (1)

Country Link
CN (1) CN112251464B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113073094A (zh) * 2021-03-29 2021-07-06 中山大学 基于胞苷脱氨酶LjCDA1L1_4a及其突变体的单碱基突变系统
CN113717961A (zh) * 2021-09-10 2021-11-30 四川大学 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用
CN114045277A (zh) * 2021-10-21 2022-02-15 复旦大学 碱基编辑器及其构建方法与应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018143477A1 (ja) * 2017-02-06 2018-08-09 国立大学法人 筑波大学 双子葉植物のゲノムの改変方法
CN110467679A (zh) * 2019-08-06 2019-11-19 广州大学 一种融合蛋白、碱基编辑工具和方法及其应用
CN110835629A (zh) * 2018-08-15 2020-02-25 华东师范大学 一种新型碱基转换编辑系统的构建方法及其应用
CN111748546A (zh) * 2019-03-26 2020-10-09 复旦大学附属中山医院 一种产生基因点突变的融合蛋白及基因点突变的诱导方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018143477A1 (ja) * 2017-02-06 2018-08-09 国立大学法人 筑波大学 双子葉植物のゲノムの改変方法
CN110835629A (zh) * 2018-08-15 2020-02-25 华东师范大学 一种新型碱基转换编辑系统的构建方法及其应用
CN111748546A (zh) * 2019-03-26 2020-10-09 复旦大学附属中山医院 一种产生基因点突变的融合蛋白及基因点突变的诱导方法
CN110467679A (zh) * 2019-08-06 2019-11-19 广州大学 一种融合蛋白、碱基编辑工具和方法及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LUKAS VILLIGER ET AL.: "Replacing the SpCas9 HNH domain by deaminases generates compact base editors with an alternative targeting scope", 《MOLECULAR THERAPY: NUCLEIC ACIDS》 *
MINH THUAN NGUYEN TRAN ET AL.: "Engineering domain-inlaid SaCas9 adenine base editors with reduced RNA off-targets and increased on-target DNA editing", 《NATURE COMMUNICATIONS》 *
张爱霞等: "基于CRISPR/Cas9系统的单碱基基因编辑技术及其在医药研究中的应用", 《中国药理学与毒理学杂志》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113073094A (zh) * 2021-03-29 2021-07-06 中山大学 基于胞苷脱氨酶LjCDA1L1_4a及其突变体的单碱基突变系统
CN113717961A (zh) * 2021-09-10 2021-11-30 四川大学 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用
CN114045277A (zh) * 2021-10-21 2022-02-15 复旦大学 碱基编辑器及其构建方法与应用

Also Published As

Publication number Publication date
CN112251464B (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
CN107557393B (zh) 一种磁性纳米材料介导的CRISPR/Cas9 T细胞内递送系统及其制备方法和应用
CN112251464B (zh) 一种基因点突变的诱导方法
CN108359691B (zh) 利用mito-CRISPR/Cas9系统敲除异常线粒体DNA的试剂盒及方法
KR101748575B1 (ko) Ins 유전자 녹아웃 당뇨병 또는 당뇨병 합병증 동물모델 및 이의 제조방법
CN111201317B (zh) 经修饰的Cas9蛋白及其用途
CN112375748B (zh) 基于水疱性口炎病毒载体的新型冠状病毒嵌合重组疫苗及其制备方法与应用
CN102146371B (zh) 高抗草甘膦突变基因及其改良方法和应用
CN108949721B (zh) 表达磷脂酶d的重组菌株及应用
CN111748546B (zh) 一种产生基因点突变的融合蛋白及基因点突变的诱导方法
CN112852875B (zh) 示踪肿瘤T淋巴细胞浸润的CD3e转基因小鼠模型的构建方法
CN112941038B (zh) 基于水疱性口炎病毒载体的重组新型冠状病毒及其制备方法与应用
WO2021110993A1 (en) An efficient shuttle vector system for the expression of heterologous and homologous proteins for the genus zymomonas
US20030145345A1 (en) LexA DNA binding domain optimized for arabidopsis species
CN114107231B (zh) 实现全脑突触后神经元胞体标记的重组腺相关病毒及其应用
CN107988253A (zh) 一个人miRNA作为猪蓝耳病病毒抑制物的应用
CN111118049B (zh) 质粒载体及其应用
CN114317584B (zh) 新型转座子突变株文库的构建系统、新型转座子突变文库和应用
CN113481114B (zh) 一种基于酵母细胞表面展示技术的爆炸物可视化生物传感器及其制备方法和应用
KR20210053932A (ko) 사람 백혈구 항원에 의해 제공된 무작위화된 펩타이드 라이브러리
CN109880837B (zh) 一种降解烟草秸秆木质素的方法
CN106978445A (zh) CRISPER‑Cas9系统介导的山羊EDAR基因敲除的方法
CN113774047B (zh) 鱼源蛋白酶基因及其应用
CN112662573B (zh) 一种高效合成l-哌嗪酸的微生物菌株及其构建方法和应用
AU758623B2 (en) Kinase wee1 fusion protein compositions, nucleotide sequences, expression systems, and methods of use
JPH09299087A (ja) 走査型プローブ顕微鏡を用いた核酸関連分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant