CN112779240B - Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途 - Google Patents

Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途 Download PDF

Info

Publication number
CN112779240B
CN112779240B CN202011250901.8A CN202011250901A CN112779240B CN 112779240 B CN112779240 B CN 112779240B CN 202011250901 A CN202011250901 A CN 202011250901A CN 112779240 B CN112779240 B CN 112779240B
Authority
CN
China
Prior art keywords
lys
leu
glu
site
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011250901.8A
Other languages
English (en)
Other versions
CN112779240A (zh
Inventor
刘涛
凌鑫宇
高小芹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huida Biotechnology Co ltd
Original Assignee
Beijing Huida Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huida Biotechnology Co ltd filed Critical Beijing Huida Biotechnology Co ltd
Publication of CN112779240A publication Critical patent/CN112779240A/zh
Application granted granted Critical
Publication of CN112779240B publication Critical patent/CN112779240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了CRISPR家族蛋白与核酸的定点偶联方法及其偶联物和用途;所述定点偶联方法包括将CRISPR家族蛋白进行非天然氨基酸的定点突变,然后,再与核酸进行偶联;其中,所述的非天然氨基酸具有正交化学反应活性。本发明定点突变的CRISPR家族蛋白及其偶联物,及其提高基因切割、基因编辑效率及碱基编辑效率等方面的应用。

Description

CRISPR家族蛋白与核酸的定点偶联方法及其偶联物和用途
技术领域
本申请属于但不限于生物医药领域,具体涉及CRISPR家族蛋白与核酸的定点偶联方法及其偶联物和用途。
背景技术
CRISPR是细菌及古细菌中的依赖于RNA的后天免疫防御机制,该机制可以很有效的帮助细菌抵御外界如噬菌体等DNA的侵入,在特定位点高效准确切割外源基因,防止外源基因在体内扩增。细菌利用这种机制阻止病毒的感染,以此实现对自身的保护。SpCas9及AsCas12a分别来源于酿脓链球菌(Streptococcus pyogenes)和氨基酸球菌属(Acidaminococcus BV3L6),是CRISPR系统的功能行使者。crRNA通过与靶DNA形成碱基配对,将Cas9或者Cas12a引导至靶区附近,并使之构象发生变化,成为具有DNA切割活性的核糖核蛋白复合体(RNP),活化的Cas9或者Cas12a可以切割靶DNA,使之形成双链缺口(doublestrand break,DSB)。DNA双链缺口对于细胞而言非常致命,因而细胞会快速启动相应的修复机制,主要包括两种修复途径:非同源性末端结合(non-homologous end joining,NHEJ)和同源重组修复(Homologous directed repair,HDR),前者由于不需要修复模板、响应速度快而被细胞广泛的应用于DNA损伤修复,因而引入缺失或者插入;HDR需要修复模板、且在细胞处于一定分裂周期时才可以启动该修复途径,从而完成DNA双链缺口的精确修复。科学家利用CRISPR系统所产生的DNA双链缺口并在模板DNA的指引下,完成对基因的正确编辑。自该系统被发现以来,因其高效、简捷、稳定的编辑效率,而广泛地被应用于畜牧业及农业的基因改造,有效提高了家畜和经济作物的产量与质量;在医疗健康方面,不仅为人类疾病尤其是遗传病的治愈带来希望,同时其广泛应用也促进了基础科研、基础医学及临床治疗的发展。
随着生物制药技术的发展与更新迭代,蛋白质的随机修饰由于批次生产的不均一性,质量可控性较差等原因逐渐被淘汰,定点修饰的蛋白质药物由于性质均一且可控,已成为现今生物技术制药的研发热点和发展方向。目前常见的蛋白质定点修饰技术主要为以下几类:一、依赖于酶促反应的转肽酶及内含肽技术可实现在蛋白质上特定序列上的定点修饰;二、依赖于糖基化修饰的基于糖基转移酶的定点标记技术,在蛋白上通过融合小蛋白或标签如Aldehyde Tag等实现定点标记;三、依赖于蛋白酶对特定序列的生物素标记。但这些标记均需要特定的序列,因而只能在目的蛋白N/C端添加这种特定序列,对于酶及许多蛋白很容易影响其稳定性和功能,可供选择的空间较小,不适用于对于Cas9及Cas12a的修饰。
当前CRISPR技术已经成功的应用于畜牧业及农业的基因改造以及生物医药如基因疾病的治疗,然而该技术却仍存在一些问题,比如:面对SpCas9在基因编辑中同源重组效率低,有文章报道指出,提高双链缺口处供体DNA的浓度会有利于提高基因编辑的效率(Ma,M.,Zhuang,F.,Hu,X.,Wang,B.,Wen,X.Z.,Ji,J.F.,and Xi,J.J.(2017).Efficientgeneration of mice carrying homozygous double-floxp alleles using the Cas9-Avidin/Biotin-donor DNA system.Cell research 27,578-581.)。因而科学家利用融合蛋白与其配体之间的亲和力,使供体DNA与Cas9蛋白紧密相连,因而在发生切割后,可以快速到达DSB处,指导同源重组修复的完成(Carlson-Stevermer,J.,Abdeen,A.A.,Kohlenberg,L.,Goedland,M.,Molugu,K.,Lou,M.,and Saha,K.(2017).Assembly ofCRISPR ribonucleoproteins with biotinylated oligonucleotides via an RNAaptamer for precise gene editing.Nature communications 8,1711.;Hemphill,J.,Borchardt,E.K.,Brown,K.,Asokan,A.,and Deiters,A.(2015).Optical Control ofCRISPR/Cas9 Gene Editing.Journal of the American Chemical Society137,5642-5645.;Savic,N.,Ringnalda,F.C.,Lindsay,H.,Berk,C.,Bargsten,K.,Li,Y.,Neri,D.,Robinson,M.D.,Ciaudo,C.,Hall,J.,et al.(2018).Covalent linkage of the DNArepair template to the CRISPR-Cas9 nuclease enhances homology-directedrepair.eLife 7.)。虽然这几种方案确实使同源重组修复效率得以提升,但是,在Cas9蛋白上融合一个蛋白会使转染难度增加,影响有效被递送至细胞内的RNP复合物;在一段较长的供体DNA上标记化学修饰,也大大增加了合成成本并极大限制了其广泛应用。以上科学研究尚不能有效而广泛的解决这一根本问题。又例如,AsCas12a因为与Cas9拥有不同的PAM识别区,以及切割后产生的粘性末端更利于发生同源重组,在基因编辑领域也得到了广泛重视。但是其递送至细胞后的切割效率极其低下,推测与AsCas12a与其crRNA的亲和力较低,在递送过程中发生解离,有效被递送至靶区DNA的RNP太少,因而切割效率低下。此外,单碱基基因编辑技术由于其不需要在细胞中产生双链断裂就可以实现基因单位点的碱基修复受到人们的广泛关注,但目前碱基编辑仍存在编辑位点窗口较大,无法实现精准编辑,编辑效率较低等问题限制其在生物医药领域的应用。当前CRISPR技术虽然在多个领域已经取得了较好的应用成果,然而仍存在诸如上述的同源重组效率和切割效率不足所引起的问题,因而本领域迫切需要提供解决这些问题的方案。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
鉴于以上迫切需要解决的问题,本发明人研发了一种将CRISPR家族蛋白定点与核酸通过化学共价键偶联的方式,将蛋白与核酸作为一个整体递送至细胞内发挥其基因编辑功能。本申请通过将CRISPR家族蛋白与供体DNA共价偶联后,CRISPR蛋白在gRNA的引导下到达靶DNA位置进行切割,而蛋白上偶联的供体DNA可以在切割完成后,在同源重组修复蛋白酶的作用下,完成正确的修复。又如Cas12a体内切割效率低的问题,通过提高Cas12a蛋白与crRNA亲和力,提高靶DNA附近有效RNP复合物浓度提高切割效率同时可以提高碱基编辑效率,从而解决现有技术中精准基因编辑效率低下的问题。
本发明人利用多特异性甲烷球菌的TyrRS(MjPolyRS)/tRNACUA,PylRS或者LeuRS的蛋白质翻译系统使非天然氨基酸定点掺入到蛋白质中,从而得到定点突变的CRISPR蛋白。同时,通过基因密码子扩展技术,在CRISPR家族蛋白定点引入含有生物正交反应基团如叠氮、炔基、醛基、酮基、环丙烯四嗪等结构的非天然氨基酸,通过点击化学反应与相应的修饰的核酸偶联,来解决CRIPSR家族蛋白在基因编辑应用中所存在的一些问题。
本申请提供了一种CRISPR家族蛋白与核酸的定点偶联方法,首先将CRISPR家族蛋白进行非天然氨基酸的定点突变,然后,再与核酸进行偶联;其中,所述的非天然氨基酸具有正交化学反应活性。
另一方面,本申请还提供了非天然氨基酸定点突变的CRISPR家族蛋白;其中,所述的非天然氨基酸具有正交化学反应活性。
第三方面,本申请还提供了CRISPR家族蛋白与核酸的定点偶联物,其中,所述CRISPR家族蛋白为非天然氨基酸定点突变的CRISPR家族蛋白,而且,所述的非天然氨基酸具有正交化学反应活性。
第四方面,本申请还提供了上述非天然氨基酸定点突变的CRISPR家族蛋白或其与核酸的定点偶联物的制备方法,以及所述非天然氨基酸定点突变的CRISPR家族蛋白相应的核酸序列及其载体、宿主表达细胞。
第五方面,本申请提供了上述非天然氨基酸定点突变的CRISPR家族蛋白或其与核酸的定点偶联物的用途。
在本申请的实施方案中,本申请提供了一种将CRISPR家族蛋白与核酸的定点偶联方法,所述方法包括:
(a)将CRISPR家族蛋白进行非天然氨基酸的定点突变;
(b)将步骤(a)得到的非天然氨基酸定点突变的CRISPR家族蛋白与核酸进行偶联,从而得到CRISPR家族蛋白与核酸的定点偶联物;
其中,所述的非天然氨基酸具有正交化学反应活性,这里,所述的正交化学反应活性是指但不限于所述非天然氨基酸包含叠氮、炔基、醛基、酮基、四嗪或环丙烯等基团。
在本申请的实施方案中,所述CRISPR家族蛋白包括但不限于不同种属来源的Cas9蛋白、Cas12a蛋白、CasX蛋白、Casφ蛋白、Cas12g蛋白、或其相关不具有切割活性但保留结合活性的失活的同种蛋白(例如dCas9蛋白,dCas12a蛋白,或ddCas12a蛋白等);这里,所述Cas9蛋白可以是来源自Streptococcus pyogenes strain SF370的SpCas9、来源自Staphylococcus aureus的SauCas9、来源自Neisseria meningitidis的NmeCas9、或者来源自S.thermophilus 1的St1Cas9。所述Cas12a蛋白可以选自来源自Francisella novicidaU112的FnCas12a、来源自细菌毛螺菌科(Lachnospiraceae bacterium ND2006)的LbCas12a、来源自氨基酸球菌Acidaminococcus sp.BV3L6的AsCas12a、或来源自Moraxellabovoculi 237的MbCas12a。所述CasX蛋白可以是来源自Deltaproteobacteria CasX的DpbCasX、或来源自Planctomycetes CasX的PlmCasX。优选地,所述CRISPR家族蛋白为Cas9蛋白或Cas12a蛋白,优选地,为SpCas9或AsCas12a。在本申请中,Cas12a与Cpf1是互换的关系。
在本申请的一些实施方案中,所述非天然氨基酸可以选自下列化合物中的一种:
Figure BDA0002771545060000051
-pAcF
Figure BDA0002771545060000052
-AeF
Figure BDA0002771545060000053
-NAEK
Figure BDA0002771545060000054
-p-AzF
Figure BDA0002771545060000061
-o-AzbK
Figure BDA0002771545060000062
-AzK
Figure BDA0002771545060000063
-ACPK
Figure BDA0002771545060000064
-PrpF
Figure BDA0002771545060000065
-PrpK
Figure BDA0002771545060000066
-CpOK
Figure BDA0002771545060000071
-TetF
Figure BDA0002771545060000072
-Tet1
Figure BDA0002771545060000073
-Tet2
Figure BDA0002771545060000074
-Tet3
优选地为pAcF、AeF、PrpF、NAEK或TetF。
在本申请的一些实施方案中,本申请还提供了非天然氨基酸定点突变的CRISPR家族蛋白;其中,所述的非天然氨基酸带有叠氮、炔基、醛基、酮基、环丙烯或四嗪等基团;
可选地,在SpCas9上为以下位点突变:SEQ ID NO.1的第K3位,D39位,H41位,H116位,D576位,E945位,K1151位,G1367位中的一个或多个位点;
在AsCas12a上为以下位点突变:SEQ ID NO.3的第M806位,L834,S835,K860,K1086位中的一个或多个位点。
在本申请的实例中,本申请提供了非天然氨基酸定点突变的CRISPR家族蛋白;其中,所述的非天然氨基酸优选地为pAcF、AeF、PrpF、NAEK或TetF;
在SpCas9上为以下位点突变:SEQ ID NO.1的第K3位,D39位,H41位,H116位,D576位,E945位,K1151位,G1367位中的一个或多个位点。
在本申请的实例中,本申请提供了非天然氨基酸定点突变的CRISPR家族蛋白;其中,所述的非天然氨基酸优选地为pAcF、AeF、PrpF、NAEK或TetF;
在AsCas12a上为以下位点突变:SEQ ID NO.3的第M806位,L834,S835,K860,K1086位中的一个或多个位点。
在本申请的一些实施方案中,本申请还提供了非天然氨基酸定点突变的CRISPR家族蛋白,其中,与野生型的CRISPR家族蛋白区别在于,将SEQ ID NO.1及NO.3中所示的序列的第N位氨基酸被突变为AeF,所述突变氨基酸残基与野生型蛋白序列的连接方式如下所示:
Figure BDA0002771545060000081
从R1到R2为所述蛋白的氨基酸序列由N端到C端,其中第N位氨基酸为所选的位点,包括SpCas9的第3位,39位,41位,116位,576位,945位,1151位,1367位氨基酸中的一个;或者AsCas12a的806位,834位,835位,860位,1086位氨基酸中的一个;R1为第N-1位氨基残基,R2为第N+1位氨基残基。
在本申请的一些实施方案中,本申请还提供了非天然氨基酸定点突变的CRISPR家族蛋白,其中,与野生型的CRISPR家族蛋白区别在于,将SEQ ID NO.1及NO.3中所示的序列的第N位氨基酸被突变为NAEK,所述突变氨基酸残基与野生型蛋白序列的连接方式如下所示:
Figure BDA0002771545060000091
从R1到R2为所述蛋白的氨基酸序列由N端到C端,其中第N位氨基酸为所选的位点,包括SpCas9的第3位,39位,41位,116位,576位,945位,1151位和1367位氨基酸中的一个;或者AsCas12a的806位,834位,835位,860位,1086位氨基酸中的一个;R1为第N-1位氨基残基,R2为第N+1位氨基残基。
在本申请的实施方案中,SpCas9分子量为158.46kDa,由1368个氨基酸残基组成,其氨基酸序列为SEQ ID NO.1;编码SpCas9的碱基序列为SEQ ID NO.2;AsCas12a分子量为143.56kDa,由1227个氨基酸残基组成,其氨基酸序列为SEQ ID NO.3;编码AsCas12a的碱基序列为SEQ ID NO.4,AsCas12-BE分子量为188.78kDa,由1638个氨基酸残基组成,其氨基酸序列为SEQ ID NO.6;编码AsCas12-BE的碱基序列为SEQ ID NO.7。
在本申请的一些实施方案中,本申请还提供了CRISPR家族蛋白与核酸的定点偶联物,其中,所述CRISPR家族蛋白为上述非天然氨基酸定点突变的CRISPR家族蛋白,而且,所述的非天然氨基酸带有叠氮、炔基、醛基、酮基、环丙烯或四嗪等基团;
这里,所述核酸带有DBCO(双苯环辛炔)或下列Nor、BCN、TCO或sTCO基团:
Figure BDA0002771545060000101
所述非天然氨基酸与上述核酸进行正交化学反应,从而得到CRISPR家族蛋白与核酸的定点偶联物。
在本申请的一些实例中,本申请提供了CRISPR家族蛋白与核酸的定点偶联物,其中,所述定点突变的CRISPR家族蛋白,与DBCO修饰的核酸以如下的连接方式偶联:
Figure BDA0002771545060000102
这里,R3为不同序列的DNA或者RNA;
从R1到R2为所述蛋白的氨基酸序列由N端到C端,其中第N位氨基酸为所选的位点,包括SpCas9的第3位,39位,41位,116位,576位,945位,1151位,1367位氨基酸中的一个;或者AsCas12a的806位,834位,835位,860位,1086位氨基酸中的一个;R1为第N-1位氨基残基,R2为第N+1位氨基残基。
在本申请的一些实施方案中,所述CRISPR家族蛋白与核酸的定点偶联物中核酸可以是oligo DNA、供体DNA、或crRNA及其相关修饰核酸。
在本申请的一些实施方案中,本申请还提供了上述非天然氨基酸定点突变的CRISPR家族蛋白或其与核酸的定点偶联物的制备方法,所述制备方法包括如下步骤:
(1)位点选择:根据所述CRISPR家族蛋白例如SpCas9或者AsCas12a的结构信息,在所述CRISPR家族蛋白氨基酸序列中选择一个或者多个特定的氨基酸位点;
(2)基因突变:将编码步骤(1)中所选择位点的氨基酸的密码子利用基因工程方法突变为密码子TAG,得到突变的CRISPR蛋白基因;
(3)表达载体构建:将步骤(2)通过基因工程得到的突变的CRISPR蛋白基因通过分子克隆的方式与表达质粒相连接,得到含突变序列的突变型表达载体质粒;
(4)蛋白表达:将(3)得到的突变型表达载体质粒与非天然氨基酸工具质粒(例如pUltra-MjPolyRS质粒)共同转染到相同的宿主细胞中,在转染成功后的宿主细胞培养液中添加含有非天然氨基酸例如pAcF、AeF或者NAEK的条件下培养,并诱导宿主细胞表达突变蛋白;
这里,所述非天然氨基酸工具质粒含有tRNA及氨酰-tRNA合成酶,可以特异性识别TAG,并在该密码子对应的位置插入非天然氨基酸例如AeF或者NAEK。
在本申请的一些实施方案中,所述制备方法可以进一步包括:
对于能够表达突变蛋白的宿主,对CRISPR蛋白进行表达产量的评估及活性检测,对于能保留野生型80%以上产量及活性的突变体设定为定点改良候选对象。
在本申请的一些实施方案中,所述制备方法还可以包括:
表达满足上述条件要求的突变蛋白,并对其产物进行进一步的纯化;
对于含有非天然氨基酸的CRISPR家族蛋白进行活性检测。
在本申请的一些实例中,所述制备方法还可以包括:
对含有非天然氨基酸的SpCas9蛋白,加入DBCO修饰的单链供体DNA,使蛋白上的叠氮基团与DNA上的DBCO发生点击化学反应,之后检测其体外及体内活性;
对含有非天然氨基酸的SpCas9蛋白,加入DBCO修饰的adaptor-DNA,制备形成稳定的蛋白核酸接头复合物,之后检测其体外及体内活性;
对于不影响SpCas9活性的突变体,加入与adaptor部分碱基配对的供体DNA,使之组合形成RNP-adaptor-供体DNA复合物,并转染到体内。相比野生型,得到提高同源重组修复效率的SpCas9-ssODN复合物。
在本申请的一些实例中,所述制备方法还可以包括:
对含有非天然氨基酸的AsCas12a蛋白,加入DBCO修饰的crRNA,蛋白与crRNA先通过亲和力,形成正确的结合构象之后,靠近DBCO修饰的含有叠氮基团的非天然氨基酸通过邻近效应发生点击化学反应,使二者形成共价RNP复合物,之后检测其体外活性;
对于不影响AsCas12a活性的突变体,转染到体内;相比野生型,得到提高基因切割效率的AsCas12a突变体蛋白为改良的AsCas12a蛋白。
在上述的实例中,所述DBCO修饰的adaptor DNA可以为针对任意靶区DNA的核酸序列,长度约为18-30碱基,与对应供体DNA同源臂互补配对,通过化学反应对其3’端进行DBCO修饰。
在上述的实例中,所述供体DNA与所述adaptor DNA在其5’端通过碱基互补配对可以被招募。
在上述的实例中,所述DBCO修饰的crRNA及改良型crRNA可以为针对任意靶区DNA的核酸序列,对其5’端进行DBCO修饰。
在本申请的一些实施方案中,本申请提供了编码上述非天然氨基酸定点突变的CRISPR家族蛋白相应的核酸序列,其中,例如编码SpCas9的碱基序列为SEQ ID NO.2,该碱基序列中对应于突变氨基酸的密码子为TAG、TAA或TGA,优选地,为TAG;例如编码AsCas12a的碱基序列为SEQ ID NO.4,该碱基序列中对应于突变氨基酸的密码子为TAG、TAA或TGA,优选地,为TAG。
在本申请的一些实施方案中,本申请还提供了用于制备上述非天然氨基酸定点突变的CRISPR家族蛋白或其与核酸偶联物的载体,该载体包含上述编码上述非天然氨基酸定点突变的CRISPR家族蛋白相应的核酸序列。
在本申请的一些实例中,所述用于制备上述非天然氨基酸定点突变的CRISPR家族蛋白或其与核酸偶联物的质粒,包括但不限于pET28a-Cas9-K3、pET28a-Cas9-D39、pET28a-Cas9-H116、pET28a-Cas9-H41、pET28a-Cas9-D576、pET28a-Cas9-E945、pET28a-Cas9-K1151或pET28a-Cas9-G1367;pET22b-Cas12a-M806,pET22b-Cas12a-K1086。
在本申请的一些实施方案中,本申请还提供了用于制备上述非天然氨基酸定点突变的CRISPR家族蛋白或其与核酸偶联物的宿主细胞,所述宿主细胞包含上述的辅助质粒与非天然氨基酸工具质粒,这里,所述辅助质粒为表达(tRNAtyr)和氨酰-tRNA合成酶的质粒;可选地,所述宿主细胞为真核宿主细胞或者原核宿主细胞。
在本申请的实施方案中,本申请提供了上述非天然氨基酸定点突变的CRISPR家族蛋白或其与核酸的定点偶联物的用途,包括但不限于如在体外及体内提高基因编辑效率,提高同源重组效率,提高碱基编辑效率,以及在小鼠胚胎干细胞中提高基因编辑效率的应用。
本发明在CRISPR家族蛋白引入非天然氨基酸,由于这种非天然氨基酸的存在,通过点击化学反应可以使化学修饰的核酸定点锚定在蛋白定点修饰的非天然氨基酸上,而不会锚定在其他位置。这对于保证该家族蛋白功能的完整性至关重要。
具体地,在本发明的一个具体的实施案例中,提供了引入非天然氨基酸的CRISPR家族蛋白,主要通过两个步骤:
1)构建含有在选定氨基酸位点被突变为TAG的编码CRIPSR家族蛋白的载体;
2)需要非天然氨基酸工具质粒,将步骤1)构建的质粒与该质粒正在合适的宿主菌中共表达,且在培养基中添加需要的非天然氨基酸,可获得引入非天然氨基酸的CRISPR家族蛋白。
在本发明的一个具体的实施案例中,通过将带有琥珀密码子TAG的SpCas9或者AsCas12a基因插入到载体(pET28a-Cas9质粒,pET22b-Cas12a质粒,pET22b-Cas12a-BE质粒)中,将所述的表达质粒与非天然氨基酸工具质粒一起转化到大肠杆菌工程菌,即可通过在培养液中添加非天然氨基酸如pAcF、AeF或者NAEK获得定点突变的SpCas9或者AsCas12a蛋白。
在本发明的一个具体实施方案中,本发明提供了一种定点引入含有叠氮基团非天然氨基酸的SpCas9蛋白,该定点突变的蛋白可以与DBCO修饰的oligo DNA发生点击化学反应,将oligo-DNA锚定在SpCas9蛋白的特定位置。该DNA可以通过碱基互补配对招募供体DNA到Cas9附近,形成RNP-oligo DNA-供体DNA复合物,从而在递送过程中,可以提高DSB附近供体DNA浓度,可以提高体内同源重组修复效率。
在本发明中的一个实施案例中,本发明提供了一种定点引入含有叠氮基团非天然氨基酸的AsCas12a蛋白,该定点突变蛋白上的叠氮基团可以与DBCO修饰的crRNA发生点击化学反应,将crRNA锚定在AsCas12a蛋白上,形成RNP复合物,在递送过程中,不会因为二者的解离造成靶区DNA的RNP浓度不够,可以实现提高体内切割效率,同源重组效率及碱基编辑效率。
在本发明中提供了一种可在大肠杆菌中重组表达的,定点引入非天然氨基酸的突变的CRISPR家族蛋白,并且这种定点突变的引入并不影响该家族蛋白的体外及体内功能。同时,偶联oligo DNA并招募供体DNA的SpCas9蛋白在体内体外的切割活性均不受影响;偶联crRNA的AsCas12a在体外的切割活性不受影响,在递送至细胞时,切割效率,同源重组效率及碱基编辑效率得以提升。
本发明提供了定点共价锚定核酸的一种方法,该方法通过利用生物正交反应,在蛋白定点引入可反应基团,在核酸上进行化学修饰,二者通过生物正交反应而共价偶联,这些生物正交反应,包括但不局限于叠氮与DBCO的1,3-偶极环加成反应(又称无铜点击化学),四嗪与环状烯烃或环状炔烃的狄尔斯-阿尔德反应。
在本申请中,采用的基因密码子扩展技术可以参见Peter Schultz教授于2001年提出的在蛋白质中插入人工合成的非天然氨基酸的技术。自然界中所有的蛋白都是由61个密码子编码20种氨基酸组成,其中TAG、TAA和TGA三个终止密码子执行蛋白翻译的终止。该技术的关键则是改变TGA及TAG的生物功能,将人工合成的具有特殊物理和化学特性的“人造氨基酸”插入到任何选定蛋白的任何选定位点。借住这些人造氨基酸可以将功能各异、具有特殊化学、物理或者生物活性官能团定点引入到蛋白质之中,例如,羰基、炔基和叠氮基团等特殊化学基团,这些基团能够有效地且选择性地形成共价键,更加有利于蛋白质的定点特异性修饰,从而改善蛋白的性质或者增加蛋白质的功能。到目前为止,该技术已经成功的将几十种非天然氨基酸定点表达在活细胞蛋白质中,赋予了这些蛋白质新的物理、化学、生理性质。这种定点修饰既不同于随机修饰的无质控标准,也不同于上述三种定点修饰,需要在被修饰蛋白上添加特定氨基酸序列。
关于“生物正交反应”的概念参见:Hang,H.C.,Yu,C.,Kato,D.L.,and Bertozzi,C.R.(2003).A metabolic labeling approach toward proteomic analysis of mucin-type O-linked glycosylation.Proceedings of the National Academy of Sciencesof the United States of America 100,14846-14851.。该反应是指能在生物系统中发生而且不干扰内源性生物化学过程的化学反应。相对于传统的标记方式,如荧光蛋白标记,以化学小分子作为标记物好处在于他们更容易进入细胞,且具备高选择性。生物正交反应使得对生物体内的生物分子(如糖类、蛋白质和脂类)的实时研究成为可能。经过十多年的努力,一系列生物正交反应被广泛应用于细胞标记、抗体修饰、高通量测序、蛋白质组学等领域。目前已发展了大量满足生物正交性的化学偶联策略,如叠氮化合物与环炔烃的1,3-偶极环加成反应(又称无铜点击化学)(Baskin,J.M.,Prescher,J.A.,Laughlin,S.T.,Agard,N.J.,Chang,P.V.,Miller,I.A.,Lo,A.,Codelli,J.A.,and Bertozzi,C.R.(2007).Copper-free click chemistry for dynamic in vivo imaging.Proceedings of theNational Academy of Sciences 104,16793-16797.)、硝酮与环炔烃的反应(Ning,X.,Temming,R.P.,Dommerholt,J.,Guo,J.,Ania,D.B.,Debets,M.F.,Wolfert,M.A.,Boons,G.-J.,and van Delft,F.L.(2010).Protein Modification by Strain-PromotedAlkyne-Nitrone Cycloaddition.Angewandte Chemie International Edition 49,3065-3068.)、醛或酮形成肟或腙的反应、四嗪与环状烯烃或环状炔烃的狄尔斯-阿尔德反应(Blackman,M.L.,Royzen,M.,and Fox,J.M.(2008).Tetrazine Ligation:FastBioconjugation Based on Inverse-Electron-Demand Diels-AlderReactivity.Journal of the American Chemical Society 130,13518-13519.)、基于异氰化物的点击反应(
Figure BDA0002771545060000151
H.,Neves,A.A.,Stairs,S.,Brindle,K.M.,and Leeper,F.J.(2011).Exploring isonitrile-based click chemistry for ligation withbiomolecules.Organic&biomolecular chemistry 9.),以及四环烷偶联反应(Sletten,E.M.,and Bertozzi,C.R.(2011).A Bioorthogonal Quadricyclane Ligation.Journalof the American Chemical Society 133,17570-17573.)。上述文献全部内容引入本申请中作为参考。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1:非天然氨基酸AeF在SpCas9-G1367的表达与镍柱亲和层析纯化。
图2:SpCas9-G1367-AeF蛋白经过镍柱纯化后,进一步通过阳离子交换纯化。其中左图箭头所指的为梯度盐浓度条件下洗脱的SpCas9-G1367-AeF蛋白;右图为箭头所收集的蛋白组分用于SDS-PAGE鉴定。
图3:经过离子交换后的SpCas9-G1367-AeF再经分子筛纯化。其中左图箭头所指的为单体的SpCas9-G1367-AeF蛋白;右图为箭头所收集的蛋白组分用于SDS-PAGE鉴定,可见该蛋白纯度在95%以上。
图4:SpCas9-G1367-AeF体外切割效率的评价。对照代表未切割的模板DNA,SpCas9-WT为野生型蛋白与gRNA,G1367-AeF为SpCas9-G1367-AeF蛋白与gRNA。其中黑线所指为RNP切割后的所形成的2条DNA。根据结果可看到,SpCas9-G1367-AeF蛋白的体外活性与野生型基本没有差别。
图5:SpCas9-G1367-AeF蛋白与DBCO修饰的DNA反应条件的摸索。泳道1-4的反应时间分别为0h,1h,2h,3h。可以看到在3小时的时候,点击化学反应基本上100%完成。
图6:偶联oligo DNA的SpCas9-G1367-AeF,SpCas9-K1151-AeF的体外活性评价。
图7:偶联crRNA的AsCas12a-M806-AeF的体外活性评价。
图8:偶联oligo DNA的SpCas9-G1367-AeF体内活性评价。其中对照代表未处理组,G1367-AeF代表SpCas9-G1367-AeF蛋白与gRNA转染进入细胞,G1367-AeF-NH2-oligo,代表SpCas9-G1367-AeF蛋白与gRNA形成RNP后,加入NH2修饰的oligo DNA及供体DNA。G1367-AeF-DBCO-oligo,代表SpCas9-G1367-AeF蛋白与gRNA形成RNP后,加入DBCO修饰的oligoDNA及供体DNA。
图9:偶联crRNA的AsCas12a-M806-AeF的体内活性评价。
图10:共价偶联oligo DNA的RNP与供体DNA孵育后对基因切割效率的影响。
图11:共价偶联crRNA的Cas12a的RNP后对精准敲入短片段实现精准基因修复的影响。根据结果可以看到偶联组复合物可以显著提高编辑效率。
图12:构建含有dAsCas12a的碱基编辑系统如图A所示,靶向编辑区域用红色标出,图B显示为共价偶联crRNA的Cas12a的RNP后,能够实现定点碱基编辑效率的有效提升。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下文中将对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
实施例所用试剂包括如下:
Phanta Super-Fidelity DNA Polymerase(诺唯赞),KOD OneTM PCR Master Mix(TOYOBO),DpnI(New England Biolabs,NEB),壮观霉素(Sigma),卡那霉素(Sigma),氨苄霉素(Sigma),DMEM培养基(Macgene),1XTrypsin-EDTA 0.25%(Macgene),1XPBS(Macgene),镍介质(GE healthcare)
实施例所用仪器包括如下:
PCR仪(Biorad),电泳仪(Tanon),天能凝胶成像系统(Tanon),超声破碎仪(SONICS),高压灭菌锅(STIK),纯水仪(Millipore),Nanodrop(Thermo),台式离心机(Thermo),亚超速离心机(Beckman),AKTA蛋白纯化系统(GE healthcare),流式细胞仪(Beckman CytoFLEX)细胞培养箱(Thermo)
实施例1:包含定点突变的SpCas9及AsCas12a的基因载体的构建
(1)辅助质粒的获得
pUltra-MjPolyRS(由Addgene公司购买)(以下简称辅助质粒),该质粒可以表达用于特异性识别及插入非天然氨基酸AeF的tRNA和tRNA合成酶。
(2)含SpCas9、AsCas12a的质粒的获得
pET28a-SpCas9质粒(Liang,Z.,Chen,K.,Li,T.,Zhang,Y.,Wang,Y.,Zhao,Q.,Liu,J.,Zhang,H.,Liu,C.,Ran,Y.,et al.(2017).Efficient DNA-free genome editingof bread wheat using CRISPR/Cas9 ribonucleoprotein complexes.Naturecommunications 8,14261.),可以在大肠埃希氏菌中重组表达SpCas9蛋白。pET22b-AsCas12a质粒中蛋白序列由Addgene质粒#102565中通过PCR获得,进而利用PCR引物在末端引入酶切5’Nde1,3’Xho1,通过酶切连接构建得到完整质粒序列,可以在大肠埃希氏菌中重组表达AsCas12a蛋白。
所用引物序列如下:
Figure BDA0002771545060000181
(3)定点突变位点的选择及突变质粒的构建
根据对SpCas9蛋白晶体结构进行解析的结果进行分析,发明人选择了第3位,39位,41位,116位,576位,945位,1151位,1367位这几个位点,作为定点突变的靶氨基酸,用含有叠氮基团的非天然氨基酸置换这几个特定的氨基酸残基,然后可以以此为原料,对SpCas9进行定点偶联供体DNA,使二者及gRNA形成RNP-DNA复合物,在递送到细胞靶区DNA位置时,可以保持足够的供体DNA浓度,从而提高同源重组修复效率。
根据对AsCas12a蛋白晶体结构进行解析的结果进行分析,本发明人选择了M806位,K1086位这几个位点,作为定点突变的靶氨基酸,用含有叠氮基团的非天然氨基酸置换这几个特定的氨基酸残基,然后可以以此为原料,对AsCas12a进行定点偶联crRNA,使二者形成共价复合物,因而解决了在递送过程中,AsCas12a和crRNA因解离而导致的靶区DNA附近RNP浓度不够造成的切割效率低下的问题。
本发明人针对以上两个蛋白,SpCas9的3位,39位,41位,116位,576位,945位,1151位,1367位,以及AsCas12a的M806位及K1086位这几个位点,分别设计能够使编码所述氨基酸的相应密码子突变为TAG的引物,具体引物如下表所示。
表1:突变引物列表
Figure BDA0002771545060000191
Figure BDA0002771545060000201
以pET28a-Cas9质粒为模板,使用以上引物及KOD酶进行扩增,并将所获得的PCR产物进行DpnI消化,所得到的产物转化DH5α菌株,复苏后涂在相应抗性的平板上,次日挑取单克隆测序,以得到pET28a-Cas9-K3,pET28a-Cas9-D39,pET28a-Cas9-H41,pET28a-Cas9-H116,pET28a-Cas9-D576,pET28a-Cas9-E945 pET28a-Cas9-K1151,pET28a-Cas9-G1367的质粒。
(4)定点突变的SpCas9表达菌株的构建
将步骤(1)所得到的辅助质粒pULTRA-Ambrx(壮观霉素抗性)和步骤(3)所获得的表达质粒pET28a-Cas9-G1367(卡那霉素抗性)两个质粒同时转化到大肠杆菌Ecoli.BL21(DE3)亚型,经双抗性平板(壮观霉素和卡那霉素抗性)筛选出同时转化了两种质粒的阳性菌株,命名为表达菌株pET28a-Cas9-G1367。
依照同样的方法,获取其余各个突变位点的表达菌株,分别为表达株:pET28a-Cas9-K3,pET28a-Cas9-D39,pET28a-Cas9-H41,pET28a-Cas9-H116,pET28a-Cas9-D576,pET28a-Cas9-E945,pET28a-Cas9-K1151。
实施例2:点突变的SpCas9的表达和纯化
1:氨基酸来于商品化购买
2:SpCas9蛋白定点插入非天然氨基酸AeF的表达
将实施案例1步骤(4)获得的表达株pET28a-Cas9-G1367在2YT培养基(含有100ug/ul壮观霉素和100ug/ul卡那霉素)中37℃过夜培养。次日按照1:100接种到新鲜培养基中至OD值为0.3时,加入1mM AeF继续培养,待OD值为0.6-1.0时,加入0.2mM IPTG(异丙基硫代半乳糖苷,Isopropylβ-D-1-thiogalactopyranoside),于18-20℃诱导表达16-18小时后收集菌体。此表达试验采用的阳性对照为野生型的pET22b-Cas9(实施案例1步骤2获得)表达菌株,除接种菌不同外,其余条件均与突变菌相同。
其他各突变体表达菌,均按照以上条件进行表达。
3:AeF突变蛋白的纯化
1)将上述收集的表达菌体用高盐缓冲buffer(20mM Tris,pH8.0,1M KCl)重悬,利用超声破碎。
2)将步骤1)破碎产物进行高速离心,吸取上清作为可溶性成分。
3)将步骤2)的产物上清样品与Ni亲和柱纯化,并用高浓度咪唑洗脱,结果见图1。
4)将步骤3)的纯化产物置换到低盐缓冲液(20mM Tris,pH8.0,300mM KCl),通过阳离子交换进行进一步纯化,洗脱缓冲液为20mM Tris,pH8.0,1M KCl。收集目的蛋白组分,结果见图2。
5)将步骤4)的纯化产物利用分子筛层析进一步纯化,使用Superdex 200(GEhealthcare)柱子,洗脱缓冲液为20mM Tris,pH8.0,150mM KCl,收集目的蛋白组分,结果见图3。
经过上述三种工艺途径的纯化,可以成功获得电泳电泳纯级(>95%)的目的蛋白样品(图3),为后续活性验证以及功能探索提供足够的实验样品。
4:其他各AeF突变蛋白质的纯化
用表达菌pET28a-Cas9-K3,pET28a-Cas9-D39,pET28a-Cas9-H41,pET28a-Cas9-D576,pET28a-Cas9-E945,pET28a-Cas9-K1151,按照上述步骤2-3的方式进行培养,纯化,分离得到用非天然氨基酸AeF定点突变SpCas9第3位,39位,41位,116位,576位,945位,1151位,1367位氨基酸的突变体蛋白纯品,简称K3AeF-Cas9,D39AeF-Cas9,H41AeF-Cas9,H116AeF-Cas9,D576AeF-Cas9,E945AeF-Cas9,K1151AeF-Cas9,G1367AeF-Cas9。
5:SpCas9蛋白定点插入非天然氨基酸NAEK的表达及纯化
1)非天然氨基酸NAEK直接商品化购买。
2)除了用NAEK替换AeF,用WT PylRS替换MjPolyRS外,其他条件与前述步骤2-4相同,对SpCas9进行各个位点的NAEK插入表达及纯化试验。并得到用非天然氨基酸NAEK定点突变的SpCas9第3位,39位,41位,116位,576位,945位1151位,1367位氨基酸的突变体蛋白纯品,简称K3NAEK-Cas9,D39NAEK-Cas9,H41NAEK-Cas9,H116NAEK-Cas9,D576NAEK-Cas9,E945NAEK-Cas9,K1151NAEK-Cas9,G1367NAEK-Cas9。
6:突变SpCas9活性的验证
为验证插入有非天然氨基酸的SpCas9及AsCas12a在高效表达的同时,在gRNA的引导下,具有切割双链DNA的功能,本发明人对其活性进行了检测。以SpCas9第1367位插入非天然氨基酸AeF为例对其进行活性检测,其余个点的突变体的检测手段与此类似。
取3pmol蛋白(野生型与突变型)与9pmol gRNA在室温孵育10分钟,使之形成RNP复合物,将事先准备好的模板双链DNA(100μg)与RNP加入到含有NEB3.1缓冲液的反应体系中,在37℃下孵育1个小时,并在65℃条件下进行热失活。随后将反应产物用于核酸胶分离,结果见图4:证明了突变的SpCas9及AsCas12a具有与野生型一致的切割活性,该结果表明,非天然氨基酸的插入并不会影响蛋白对双链DNA的识别以及切割活性。
所使用的gRNA以及模板DNA扩增引物序列如下
Figure BDA0002771545060000231
模板DNA(SEQ ID NO.5)序列如下:
TCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACGGGCCCTCTAGACTCGAGATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGAgCcACGGCGTcCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACAT。
实施例3:突变体与DBCO修饰核酸分子的共价偶联
当在SpCas9及AsCas12a中掺入含有叠氮基团的非天然氨基酸之后,可以通过点击化学(click chemistry)反应的方式与DBCO修饰的核酸分子进行偶联,下面对这种偶联方式进行了试验。
1)DBCO修饰核酸的合成
DBCO修饰的单链DNA或者RNA均为商品化产品,从安徽通用生物合成公司及美国IDT公司(Integrated DNA Technologies,Inc.)购买获得。
序列如下:
Figure BDA0002771545060000241
2)通过点击化学反应偶联核酸
按照1:1将突变的蛋白与DBCO修饰的核酸进行混匀,在室温及4℃等条件下进行反应条件的摸索,隔一定的时间取样,SDS-PAGE鉴定,结果见图5,由图可知,点击化学反应速度比较快,在4℃,3小时以内,可以达到平衡,而长时间进行反应则大大增加蛋白降解。根据实验结果,确定反应时间为3小时,大约95%以上的蛋白可以偶联核酸。
其他位点AeF或者NAEK的突变体蛋白与DBCO修饰的核酸偶联方法与上同,可得到近似产率的偶联产物。
实施例4:定点修饰核酸的CRISPR家族蛋白体外活性评价
1)取上述3pmol偶联单链DNA的突变体蛋白SpCas9-G1367-AeF(对照组为野生型蛋白)与9pmolgRNA在室温孵育10分钟,使之形成RNP复合物,将事先准备好的模板双链DNA(100μg)与RNP加入到含有NEB3.1缓冲液的反应体系中,在37℃下孵育1个小时,并在65℃条件下进行热失活。随后将反应产物用于核酸胶分离,结果见图6:证明了偶联单链DNA的SpCas9具有与野生型一致的切割活性,该结果表明,非天然氨基酸的插入及偶联单链DNA并不会影响蛋白对双链DNA的识别以及切割活性。
其余插入AeF及NAEK的突变体蛋白与单链DNA偶联后的体外活性检测方法与前述一致,可得到近似的切割效率。
2)取3pmol突变体蛋白AsCas12a-M806-AeF,与3pmol DBCO修饰的crRNA在4℃反应3小时(对照组为野生型蛋白与crRNA室温孵育10分钟),使之形成RNP复合物,并将事先准备好的模板双链DNA(100μg)与RNP加入到含有NEB3.1缓冲液的反应体系中,在37℃下孵育1个小时,并在65℃条件下进行热失活。随后将反应产物用于核酸胶分离,结果见图7:证明了偶联crRNA的AsCas12a具有与野生型一致的切割活性,该结果表明,非天然氨基酸的插入及偶联crRNA并不会影响AsCas12a蛋白对双链DNA的识别以及切割活性。
其余插入AeF及NAEK的突变体蛋白与crRNA偶联后的体外活性检测方法与前述一致,可得到近似的切割效率。
实施例5:定点修饰核酸的CRISPR家族蛋白体内活性评价
具体过程如下:先将贴壁的报告细胞株进行胰酶消化,并用PBS悬浮后计数,根据计数结果收集1x106个细胞,用20μL电转缓冲液(Celetrix公司生产,在使用前将A液和B液进行等比例混合后使用)悬浮。将18pmol的RNP或者偶联核酸的RNP与细胞轻轻混匀后,放到专用的电转杯中,按照优化的参数(420V,30ms)进行电击。电击结束后,迅速将转染后的细胞加入到2ml预热的DMEM中,放入37℃培养箱在六孔板中中进行培养。24小时后,加入终浓度为10ug/ml的多西环素盐酸盐溶液。48小时后,将细胞消化悬浮,置换到PBS缓冲液中进行流式分析。结果如图8显示:偶联核酸的SpCas9在细胞内的GFP荧光淬灭率基本上可以达到野生型的80-90%左右;野生型AsCas12与不同RNA组合可以实现约20%左右的编辑效率,偶联crRNA的AsCas12a在细胞内的GFP荧光淬灭率是野生型的4-5倍(图9),表明这种crRNA偶联到AsCas12a蛋白上可以提高切割效率。
本发明人为此构建了一个报告细胞株评价体系,利用慢病毒系统pLV包装含有Teton启动子下游为EGFP基因的慢病毒,并用其侵染293T细胞,通过流式分选,分选绿色荧光强阳性细胞得到单克隆化的细胞株。该体系是利用GFP蛋白的荧光淬灭作为表征,与直接表达GFP蛋白的细胞株不同之处在于,本发明人的报告细胞株GFP的表达是由Teton操纵子控制的,只有在加入多环西素(Doxycycline,Dox)才会诱导性表达。该报告细胞株可以大大缩短GFP荧光淬灭的观测时间。该试验就是通过将偶联核酸的RNP通过电转的方式递送至细胞内,通过RNP对GFP基因的切割,扰乱其后续的转录及翻译,从而观测GFP的淬灭率来检测RNP对基因的编辑效率。
实施例6:定点偶联oligoDNA的SpCas9在细胞内基因编辑效率的评价
本例通过对细胞内保守基因GAPDH TAG密码子前基因进行切割,通过供体DNA插入一个含有13个氨基酸的HiBiT基因,该基因可以编码在GAPDH蛋白后融合表达HiBiT。HiBiT与LgBiT可以形成完整的nanoluciferase,在底物的参与下释放荧光。通过荧光的释放与否评估基因编辑效率。对于RNP-Oligo DNA复合物的转染,使用18pmol Cas9野生型/突变体蛋白与24pmol sgRNA首先在室温混合并孵育5min,后向复合物中加入18pmol核酸匹配接头Adaptor,在4度孵育3h,在转染前将18pmol单链供体DNA(ssODN)加入到混合物进行下一步的转染。转染使用的是CTX-1500A LE型号电转仪,根据说明书按照buffer A及B等比例混合配置,对于单次反应使用20ul电转buffer重悬1*106个细胞,将预先配置好的偶联复合物加入到细胞悬液中进行电转,电转条件为420V 30ms,电转后立刻将细胞吸出置于预热的DMEM培养基中继续培养48h。在转染后48小时,将细胞收集裂解,使用Promega公司提供的
Figure BDA0002771545060000261
HiBiT Lytic Detection System试剂盒检测荧光发生,评价偶联RNP-DNA后,对基因编辑效率的影响。结果如图10所示,偶联oligo DNA的RNP可以显著提高基因编辑效率,证明了发明人所创立的这套RNP上定点偶联oligo DNA招募供体DNA的方法确实可以提高基因编辑中的同源重组修复效率。
在本例中所用的核酸序列如下表所示:
Figure BDA0002771545060000271
实施例7:定点偶联crRNA的AsCas12a在细胞内进行同源重组水平的评价
本例通过对人源细胞内保守基因HPRT基因进行切割,在切割位点处引入含有左右各40bp同源臂6个bp特定序列,该序列为EcoR1特异性识别位点,如果成功实现基因编辑并且发生精准同源重组可以通过基因组特异性扩增对应片段,进而进行片段酶切评价。EcoR1切割的效率可以直接反应同源重组的水平。具体操作如下,使用40/60pmol AsCas12a蛋白与对应的crRNA(1.2倍当量)在体外孵育10分钟形成RNP后,置于4度反应3小时后,加入0.6倍当量的单链供体DNA形成复合物进行后续的转染。转染使用的是CTX-1500A LE型号电转仪,根据说明书按照buffer A及B等比例混合配置,对于单次反应使用20ul电转buffer重悬1*106个细胞,将预先配置好的偶联复合物加入到细胞悬液中进行电转,电转条件为420V30ms,电转后立刻将细胞吸出置于预热的DMEM培养基中继续培养48h。在转染后48小时,将细胞收集,使用诺唯赞公司提供的基因组提取试剂盒提取细胞基因组,对目标区域进行PCR扩增后,扩增得到的产物使用Cycle pure纯化试剂盒纯化后进行定量。同源重组效率的评价利用酶切进行鉴定,具体操作如下,按照PCR产物200ng/反应进行加样,酶切体系为10ul,加入1ul Cutsmart溶液,200ng模板及1ul EcoRI-HF酶,用水补齐至10ul,在37度反应1h后使用1%琼脂糖凝胶电泳进行产物的鉴定,并对条带进行定量分析。结果如图11所示,在40pmol及60pmol的RNP切割浓度下均可以看到偶联组(cCas12a)能够显著提高7-8倍同源重组效率,证明了发明人所创立的这套RNP上定点偶联crRNA方法确实可以提高基因编辑中的同源重组修复效率。
在本例中所用的核酸序列如下表所示:
Figure BDA0002771545060000281
实施例8:定点偶联crRNA的AsCas12a碱基编辑器在细胞内碱基编辑效率的评价
本例首先进行含有AsCas12a的碱基编辑器(AsCas12a-BE)的蛋白的表达和纯化,突变体的突变位点为M806AeF,质粒构建及蛋白表达纯化与上述实例2相同。蛋白获得后进行细胞水平碱基编辑效率的评价,本例中所用的评价系统针对人源细胞293T的内源基因FANCF进行编辑,具体操作如下,使用200pmol AsCas12a-BE蛋白与对应的crRNA(1.2倍当量)在体外孵育10分钟形成RNP后,置于4度反应3小时后,形成复合物进行后续的转染。转染使用的是CTX-1500A LE型号电转仪,根据说明书按照buffer A及B等比例混合配置,对于单次反应使用20ul电转buffer重悬1*106个细胞,将预先配置好的偶联复合物加入到细胞悬液中进行电转,电转条件为420V 30ms,电转后立刻将细胞吸出置于预热的DMEM培养基中继续培养48h。在转染后48小时,将细胞收集,使用诺唯赞公司提供的基因组提取试剂盒提取细胞基因组,对目标区域进行PCR扩增进行sanger测序,利用在线EditR工具进行分析,结果如图12所示,在不同浓度下均能够看到偶联组碱基编辑效率能够显著的优于野生型蛋白,证明了发明人所创立的这套RNP上定点偶联crRNA方法确实可以提高碱基编辑效率。
在本例中所用的核酸序列如下表所示:
crRNA靶向human FANCF序列 UCCGUGUUCCUUGACUCUGG
PCR正向引物 GAAGGCCCAGAATTCAGCATAGCGC
PCR反向引物 GTCCCAGGTGCTGACGTAGGTAG
虽然本申请所揭露的实施方式如上,但所述的内容仅为便于理解本申请而采用的实施方式,并非用以限定本申请。任何本申请所属领域内的技术人员,在不脱离本申请所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本申请的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
序列表
<110> 北京大学
<120> CRISPR家族蛋白与核酸的定点偶联方法及其偶联物和用途
<130> 012028676
<150> CN201911092554.8
<151> 2019-11-11
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes strain SF370
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 2
<211> 4104
<212> DNA
<213> Streptococcus pyogenes strain SF370
<400> 2
atggacaaga agtactccat tgggctcgat atcggcacaa acagcgtcgg ctgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatcat 2520
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agac 4104
<210> 3
<211> 1227
<212> PRT
<213> Acidaminococcus sp BV3L6
<400> 3
Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu
1 5 10 15
Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn
20 25 30
Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly
35 40 45
Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val
50 55 60
Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe
65 70 75 80
Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu
85 90 95
Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu
100 105 110
Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro
115 120 125
Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn
130 135 140
Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met
145 150 155 160
Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn
165 170 175
Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val
180 185 190
Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile
195 200 205
Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe
210 215 220
Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile
225 230 235 240
Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu
245 250 255
Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe
260 265 270
Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe
275 280 285
Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg
290 295 300
Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu
305 310 315 320
Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe
325 330 335
Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly
340 345 350
Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile
355 360 365
His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg
370 375 380
Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln
385 390 395 400
Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile
405 410 415
Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu
420 425 430
Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn
435 440 445
Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser
450 455 460
Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn
465 470 475 480
Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu
485 490 495
Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln
500 505 510
Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln
515 520 525
Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr
530 535 540
Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys
545 550 555 560
Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn
565 570 575
Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu
580 585 590
Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser
595 600 605
Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp
610 615 620
Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp
625 630 635 640
Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe
645 650 655
Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val
660 665 670
Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu
675 680 685
Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr
690 695 700
Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr
705 710 715 720
Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg
725 730 735
Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys
740 745 750
Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn
755 760 765
Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys
770 775 780
Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala
785 790 795 800
Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val Arg
805 810 815
Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp Arg
820 825 830
Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly Asn
835 840 845
Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly
850 855 860
Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys
865 870 875 880
Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys
885 890 895
Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu
900 905 910
Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn Ser
915 920 925
Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys
930 935 940
Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys
945 950 955 960
Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr
965 970 975
Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile
980 985 990
Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly
995 1000 1005
Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys
1010 1015 1020
Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp
1025 1030 1035 1040
Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala
1045 1050 1055
Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg
1060 1065 1070
Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val
1075 1080 1085
Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn
1090 1095 1100
Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys
1105 1110 1115 1120
Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met
1125 1130 1135
Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro
1140 1145 1150
Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala
1155 1160 1165
Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr
1170 1175 1180
Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala
1185 1190 1195 1200
Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu
1205 1210 1215
Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 4
<211> 3681
<212> DNA
<213> Acidaminococcus sp BV3L6
<400> 4
tcaaagctcg agaaattcac caactgttat tcgttgagca aaacactgcg gtttaaagcg 60
attccagtcg gcaagactca agagaatata gacaataagc ggctgttggt ggaagatgaa 120
aagcgcgcgg aagactacaa aggggtgaag aagttgttgg acagatacta cctctctttt 180
atcaatgatg tcttgcactc aatcaaattg aagaatctga acaactacat ctccctcttc 240
agaaagaaaa caaggacaga aaaggagaat aaggaacttg aaaatttgga gatcaatctg 300
aggaaagaga tcgcgaaagc ctttaaaggc aacgaaggat acaaaagtct gttcaagaag 360
gatataattg agacaatttt gccagagttc ctcgatgaca aggacgagat tgcgctggtc 420
aattcgttca acggattcac aacagcattc acaggcttct ttgataatcg ggaaaatatg 480
ttctctgagg aggcaaagtc cacttctatt gcgttcaggt gtatcaatga gaatctcact 540
aggtacattt ccaacatgga tatctttgag aaggttgacg caatttttga caagcacgaa 600
gttcaggaga ttaaggagaa gatcctcaat tccgattatg acgttgagga cttcttcgaa 660
ggtgagtttt ttaatttcgt gctcactcaa gagggtatcg acgtgtataa tgcgatcatc 720
ggtgggttcg tgactgagtc cggtgaaaag attaagggat tgaacgagta tatcaacctt 780
tacaaccaaa agacgaaaca gaagctgcca aagttcaagc ctctttacaa acaggttctt 840
tcagaccgcg agtcactctc gttctatggg gagggctaca cttcggatga ggaagtcctg 900
gaggtgttca ggaatactct caataagaat tcggagattt tctcttctat aaaaaaactg 960
gaaaagttgt ttaagaattt tgacgaatac tctagcgccg gcatatttgt gaaaaacggc 1020
ccggccatat caacgataag taaagatatc ttcggcgaat ggaacgtgat cagagacaaa 1080
tggaacgcgg agtatgacga tattcacctg aagaagaagg ctgtcgtaac ggagaagtac 1140
gaggatgatc gcaggaaaag cttcaaaaag atcggaagtt tcagcctgga acagttgcag 1200
gagtatgctg acgccgatct tagcgtcgtc gagaagttga aggagataat catccaaaag 1260
gtcgacgaga tatataaagt ctatggatca agtgaaaaac tgttcgacgc cgacttcgtt 1320
ttggagaagt ccctgaagaa gaacgacgct gttgttgcca ttatgaagga tctgctcgac 1380
agcgtgaaga gtttcgagaa ctatattaag gcttttttcg gggaggggaa ggagactaac 1440
agagatgagt ccttctacgg agacttcgtc ctcgcgtacg atatactcct taaggtagac 1500
cacatctacg acgcaatcag aaattacgtg acacaaaagc cgtacagcaa ggacaagttc 1560
aaactctact tccagaaccc ccagttcatg ggcggctggg acaaggacaa ggaaacggat 1620
tacagggcta cgatcctgag gtatggttca aaatactact tggcgattat ggacaagaag 1680
tacgccaagt gtctccagaa gattgacaaa gacgatgtca atggcaatta tgagaagatc 1740
aactacaagc tgcttccggg tccgaacaag atgctcccaa aggttttctt cagcaagaaa 1800
tggatggcct actataaccc aagcgaggac atccagaaga tttataagaa cggtacgttc 1860
aagaagggcg acatgttcaa tcttaacgac tgtcacaagc tgatcgactt cttcaaagac 1920
tcaattagcc ggtacccaaa gtggtctaac gcctatgact tcaacttttc ggaaaccgag 1980
aagtacaagg atatagccgg attttataga gaggtggaag agcagggcta caaggtgtca 2040
ttcgagtccg ccagcaagaa ggaagtggac aagctcgtgg aagagggtaa gctctacatg 2100
ttccagattt ataataaaga ctttagcgat aagagccacg ggacacctaa tctccacaca 2160
atgtatttca agctgctctt cgacgagaat aaccacggcc aaatcaggtt gtcaggaggg 2220
gctgaactct tcatgcggcg cgctagcctt aagaaggagg agcttgtagt ccaccctgcg 2280
aatagtccaa ttgcgaataa gaacccggac aatcctaaaa agactacaac attgagctac 2340
gacgtgtaca aggataagag gttttccgag gatcagtacg agctccacat cccgattgcg 2400
atcaacaagt gcccaaagaa tattttcaag ataaacacag aggtgcgtgt actcctgaag 2460
catgacgaca atccttacgt cattgggatt gatcggggcg agaggaacct cctctatatt 2520
gtggtggtgg acgggaaggg gaacatagtc gaacagtact cccttaacga aataattaac 2580
aatttcaacg gcatccgtat caagaccgac taccattcgt tgctggacaa gaaggagaag 2640
gagagatttg aggcgcggca aaattggaca agtatcgaga acatcaagga actcaaagca 2700
ggttatatct ctcaagttgt gcataagata tgcgagctgg ttgagaagta tgacgcagtg 2760
atcgctcttg aggacctcaa ctcgggcttt aagaattcta gagttaaagt ggagaagcag 2820
gtctatcaaa agttcgagaa gatgcttata gataagctca actacatggt cgataagaaa 2880
tcgaacccat gtgccaccgg cggcgcactc aaaggttacc aaataacaaa caaattcgag 2940
tccttcaaat cgatgagtac tcagaatggg ttcatatttt atataccggc gtggcttacg 3000
tctaagatcg acccgtcaac tggttttgtc aacctgttga agacgaaata cacgtccatt 3060
gccgattcga aaaagttcat atctagtttt gatcgtatta tgtacgtccc agaggaagat 3120
cttttcgagt ttgctctcga ctacaaaaac ttttcgcgga ccgatgcgga ttacattaaa 3180
aaatggaaac tctattcgta cggcaacaga atcaggattt ttcgcaaccc taagaagaat 3240
aacgtctttg attgggagga agtttgcttg actagcgcgt acaaggagct ctttaataag 3300
tatggcatta actaccaaca gggtgatatc agagcactgc tttgcgaaca atctgacaag 3360
gctttctact catccttcat ggctttgatg agcctgatgc tccagatgag aaattcaatt 3420
acaggcagaa ccgacgtgga tttcttgatc tccccggtta aaaattctga tggcatcttt 3480
tacgatagca ggaactatga agcgcaagag aatgcgattc tgccaaaaaa tgcagacgcc 3540
aacggtgcct ataacatcgc caggaaagtc ctgtgggcga tcggccagtt caaaaaggcc 3600
gaagacgaaa aattggacaa ggtcaaaatc gctatcagca acaaagagtg gctggagtat 3660
gctcagacat ccgtaaagca t 3681
<210> 5
<211> 600
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg 60
ggaggtctat ataagcagag ctctctggct aactagagaa cccactgctt actggcttat 120
cgaaattaat acgactcact atagggagac ccaagctggc tagcgtttaa acgggccctc 180
tagactcgag atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt 240
cgagctggac ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga 300
tgccacctac ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc 360
ctggcccacc ctcgtgacca ccctgagcca cggcgtccag tgcttcagcc gctaccccga 420
ccacatgaag cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg 480
caccatcttc ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg 540
cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat 600
<210> 6
<211> 1638
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Gln Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn Ser Gly Ser Glu Thr Pro Gly Thr Ser
195 200 205
Glu Ser Ala Thr Pro Glu Ser Met Thr Gln Phe Glu Gly Phe Thr Asn
210 215 220
Leu Tyr Gln Val Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly
225 230 235 240
Lys Thr Leu Lys His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys
245 250 255
Ala Arg Asn Asp His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile
260 265 270
Tyr Lys Thr Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp
275 280 285
Glu Asn Leu Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu
290 295 300
Glu Thr Arg Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala
305 310 315 320
Ile His Asp Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile
325 330 335
Asn Lys Arg His Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu
340 345 350
Phe Asn Gly Lys Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu
355 360 365
His Glu Asn Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe
370 375 380
Ser Gly Phe Tyr Arg Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile
385 390 395 400
Ser Thr Ala Ile Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe
405 410 415
Lys Glu Asn Cys His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser
420 425 430
Leu Arg Glu His Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val
435 440 445
Ser Thr Ser Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu
450 455 460
Leu Thr Gln Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile
465 470 475 480
Ser Arg Glu Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu
485 490 495
Asn Leu Ala Ile Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser
500 505 510
Leu Pro His Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg
515 520 525
Asn Thr Leu Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val
530 535 540
Ile Gln Ser Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val
545 550 555 560
Leu Glu Thr Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu
565 570 575
Thr His Ile Phe Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala
580 585 590
Leu Cys Asp His Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg
595 600 605
Ile Ser Glu Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val
610 615 620
Gln Arg Ser Leu Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser
625 630 635 640
Ala Ala Gly Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu
645 650 655
Ile Leu Ser His Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr
660 665 670
Leu Lys Lys Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser
675 680 685
Leu Leu Gly Leu Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser
690 695 700
Asn Glu Val Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu
705 710 715 720
Glu Met Glu Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala
725 730 735
Thr Lys Lys Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met
740 745 750
Pro Thr Leu Ala Arg Gly Trp Asp Val Asn Arg Glu Lys Asn Asn Gly
755 760 765
Ala Ile Leu Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro
770 775 780
Lys Gln Lys Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys
785 790 795 800
Thr Ser Glu Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala
805 810 815
Ala Lys Met Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala
820 825 830
His Phe Gln Thr His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile
835 840 845
Glu Pro Leu Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu
850 855 860
Lys Glu Pro Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp
865 870 875 880
Gln Lys Gly Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg
885 890 895
Asp Phe Leu Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser
900 905 910
Leu Arg Pro Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu
915 920 925
Leu Asn Pro Leu Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys
930 935 940
Glu Ile Met Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile
945 950 955 960
Tyr Asn Lys Asp Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His
965 970 975
Thr Leu Tyr Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr
980 985 990
Ser Ile Lys Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser
995 1000 1005
Arg Met Lys Arg Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys
1010 1015 1020
Lys Leu Lys Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu
1025 1030 1035 1040
Leu Tyr Asp Tyr Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu
1045 1050 1055
Ala Arg Ala Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu
1060 1065 1070
Ile Ile Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val
1075 1080 1085
Pro Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn
1090 1095 1100
Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile Ile
1105 1110 1115 1120
Gly Ile Ala Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val Ile Asp
1125 1130 1135
Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr Ile Gln Gln
1140 1145 1150
Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu Arg Val Ala
1155 1160 1165
Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile Lys Asp Leu Lys Gln
1170 1175 1180
Gly Tyr Leu Ser Gln Val Ile His Glu Ile Val Asp Leu Met Ile His
1185 1190 1195 1200
Tyr Gln Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly Phe Lys Ser
1205 1210 1215
Lys Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys
1220 1225 1230
Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala
1235 1240 1245
Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe
1250 1255 1260
Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val
1265 1270 1275 1280
Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp
1285 1290 1295
Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe
1300 1305 1310
Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1315 1320 1325
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu
1330 1335 1340
Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu Thr
1345 1350 1355 1360
Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg Ile Val
1365 1370 1375
Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg Asp Leu Tyr
1380 1385 1390
Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly Ile Val Phe
1395 1400 1405
Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu Asn Asp Asp Ser
1410 1415 1420
His Ala Ile Asp Thr Met Val Ala Leu Ile Arg Ser Val Leu Gln Met
1425 1430 1435 1440
Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn Ser Pro Val
1445 1450 1455
Arg Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu
1460 1465 1470
Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys
1475 1480 1485
Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu
1490 1495 1500
Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu
1505 1510 1515 1520
Arg Asn His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser
1525 1530 1535
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1540 1545 1550
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1555 1560 1565
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
1570 1575 1580
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
1585 1590 1595 1600
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
1605 1610 1615
Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Leu Glu
1620 1625 1630
His His His His His His
1635
<210> 7
<211> 4917
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atggaagcaa gtccagcctc gggccctcgt cacttaatgg atccgcatat cttcacgtcc 60
aacttcaaca atggcatcgg ccgtcacaag acctatcttt gctatgaagt cgaacgtctg 120
gataacggca cgagcgtaaa gatggatcaa caccgtggtt tccttcacca acaggctaag 180
aacttattat gtgggttcta cggtcgtcac gcagagttgc gcttccttga cctggtacct 240
tcccttcaac tggatcctgc acaaatctac cgcgttacct ggttcatttc ttggagtcca 300
tgcttttctt ggggctgtgc tggcgaagta cgtgcatttt tgcaagagaa tacgcatgtt 360
cgtttgcgta tcttcgcggc ccgcatttat gattatgacc cgctttataa ggaggcttta 420
cagatgttac gtgacgctgg cgcacaggtt tcaattatga cctacgacga gttcaaacac 480
tgctgggaca cattcgtcga tcatcaaggt tgtccctttc aaccctggga tgggttagac 540
gaacacagcc aggcgttgtc gggacgcctg cgtgcgattc ttcaaaatca aggtaacagc 600
gggtccgaga cacccggaac atcggaaagt gccactcctg agtctatgac acagttcgag 660
ggctttacca acctgtatca ggtgagcaag acactgcggt ttgagctgat cccacagggc 720
aagaccctga agcacatcca ggagcagggc ttcatcgagg aggacaaggc ccgcaatgat 780
cactacaagg agctgaagcc catcatcgat cggatctaca agacctatgc cgaccagtgc 840
ctgcagctgg tgcagctgga ttgggagaac ctgagcgccg ccatcgactc ctatagaaag 900
gagaaaaccg aggagacaag gaacgccctg atcgaggagc aggccacata tcgcaatgcc 960
atccacgact acttcatcgg ccggacagac aacctgaccg atgccatcaa taagagacac 1020
gccgagatct acaagggcct gttcaaggcc gagctgttta atggcaaggt gctgaagcag 1080
ctgggcaccg tgaccacaac cgagcacgag aacgccctgc tgcggagctt cgacaagttt 1140
acaacctact tctccggctt ttatcgcaac aggaagaacg tgttcagcgc cgaggatatc 1200
agcacagcca tcccacaccg catcgtgcag gacaacttcc ccaagtttaa ggagaattgt 1260
cacatcttca cacgcctgat caccgccgtg cccagcctgc gggagcactt tgagaacgtg 1320
aagaaggcca tcggcatctt cgtgagcacc tccatcgagg aggtgttttc cttccctttt 1380
tataaccagc tgctgacaca gacccagatc gacctgtata accagctgct gggaggaatc 1440
tctcgggagg caggcaccga gaagatcaag ggcctgaacg aggtgctgaa tctggccatc 1500
cagaagaatg atgagacagc ccacatcatc gcctccctgc cacacagatt catccccctg 1560
tttaagcaga tcctgtccga taggaacacc ctgtctttca tcctggagga gtttaagagc 1620
gacgaggaag tgatccagtc cttctgcaag tacaagacac tgctgagaaa cgagaacgtg 1680
ctggagacag ccgaggccct gtttaacgag ctgaacagca tcgacctgac acacatcttc 1740
atcagccaca agaagctgga gacaatcagc agcgccctgt gcgaccactg ggatacactg 1800
aggaatgccc tgtatgagcg gagaatctcc gagctgacag gcaagatcac caagtctgcc 1860
aaggagaagg tgcagcgcag cctgaagcac gaggatatca acctgcagga gatcatctct 1920
gccgcaggca aggagctgag cgaggccttc aagcagaaaa ccagcgagat cctgtcccac 1980
gcacacgccg ccctggatca gccactgcct acaaccctga agaagcagga ggagaaggag 2040
atcctgaagt ctcagctgga cagcctgctg ggcctgtacc acctgctgga ctggtttgcc 2100
gtggatgagt ccaacgaggt ggaccccgag ttctctgccc ggctgaccgg catcaagctg 2160
gagatggagc cttctctgag cttctacaac aaggccagaa attatgccac caagaagccc 2220
tactccgtgg agaagttcaa gctgaacttt cagatgccta cactggcccg tggctgggac 2280
gtgaatcgcg agaagaacaa tggcgccatc ctgtttgtga agaacggcct gtactatctg 2340
ggcatcatgc caaagcagaa gggcaggtat aaggccctga gcttcgagcc cacagagaaa 2400
accagcgagg gctttgataa gatgtactat gactacttcc ctgatgccgc caagatgatc 2460
ccaaagtgca gcacccagct gaaggccgtg acagcccact ttcagaccca cacaaccccc 2520
atcctgctgt ccaacaattt catcgagcct ctggagatca caaaggagat ctacgacctg 2580
aacaatcctg agaaggagcc aaagaagttt cagacagcct acgccaagaa aaccggcgac 2640
cagaagggct acagagaggc cctgtgcaag tggatcgact tcacaaggga ttttctgtcc 2700
aagtatacca agacaacctc tatcgatctg tctagcctgc ggccatcctc tcagtataag 2760
gacctgggcg agtactatgc cgagctgaat cccctgctgt accacatcag cttccagaga 2820
atcgccgaga aggagatcat ggatgccgtg gagacaggca agctgtacct gttccagatc 2880
tataacaagg actttgccaa gggccaccac ggcaagccta atctgcacac actgtattgg 2940
accggcctgt tttctccaga gaacctggcc aagacaagca tcaagctgaa tggccaggcc 3000
gagctgttct accgccctaa gtccaggatg aagaggatgg cacaccggct gggagagaag 3060
atgctgaaca agaagctgaa ggatcagaaa accccaatcc ccgacaccct gtaccaggag 3120
ctgtacgact atgtgaatca cagactgtcc cacgacctgt ctgatgaggc cagggccctg 3180
ctgcccaacg tgatcaccaa ggaggtgtct cacgagatca tcaaggatag gcgctttacc 3240
agcgacaagt tctttttcca cgtgcctatc acactgaact atcaggccgc caattcccca 3300
tctaagttca accagagggt gaatgcctac ctgaaggagc accccgagac acctatcatc 3360
ggcatcgcgc ggggcgagag aaacctgatc tatatcacag tgatcgactc caccggcaag 3420
atcctggagc agcggagcct gaacaccatc cagcagtttg attaccagaa gaagctggac 3480
aacagggaga aggagagggt ggcagcaagg caggcctggt ctgtggtggg cacaatcaag 3540
gatctgaagc agggctatct gagccaggtc atccacgaga tcgtggacct gatgatccac 3600
taccaggccg tggtggtgct ggagaacctg aatttcggct ttaagagcaa gaggaccggc 3660
atcgccgaga aggccgtgta ccagcagttc gagaagatgc tgatcgataa gctgaattgc 3720
ctggtgctga aggactatcc agcagagaaa gtgggaggcg tgctgaaccc ataccagctg 3780
acagaccagt tcacctcctt tgccaagatg ggcacccagt ctggcttcct gttttacgtg 3840
cctgccccat atacatctaa gatcgatccc ctgaccggct tcgtggaccc cttcgtgtgg 3900
aaaaccatca agaatcacga gagccgcaag cacttcctgg agggcttcga ctttctgcac 3960
tacgacgtga aaaccggcga cttcatcctg cactttaaga tgaacagaaa tctgtccttc 4020
cagaggggcc tgcccggctt tatgcctgca tgggatatcg tgttcgagaa gaacgagaca 4080
cagtttgacg ccaagggcac ccctttcatc gccggcaaga gaatcgtgcc agtgatcgag 4140
aatcacagat tcaccggcag ataccgggac ctgtatcctg ccaacgagct gatcgccctg 4200
ctggaggaga agggcatcgt gttcagggat ggctccaaca tcctgccaaa gctgctggag 4260
aatgacgatt ctcacgccat cgacaccatg gtggccctga tccgcagcgt gctgcagatg 4320
cggaactcca atgccgccac aggcgaggac tatatcaaca gccccgtgcg cgatctgaat 4380
ggcgtgtgct tcgactcccg gtttcagaac ccagagtggc ccatggacgc cgatgccaat 4440
ggcgcctacc acatcgccct gaagggccag ctgctgctga atcacctgaa ggagagcaag 4500
gatctgaagc tgcagaacgg catctccaat caggactggc tggcctacat ccaggagctg 4560
cgcaaccatg gatcacccaa gaagaaacgg aaagtgtctg gtggttctac taatctgtca 4620
gatattattg aaaaggagac cggtaagcaa ctggttatcc aggaatccat cctcatgctc 4680
ccagaggagg tggaagaagt cattgggaac aagccggaaa gcgatatact cgtgcacacc 4740
gcctacgacg agagcaccga cgagaatgtc atgcttctga ctagcgacgc ccctgaatac 4800
aagccttggg ctctggtcat acaggatagc aacggtgaga acaagattaa gatgctctct 4860
ggtggttctc ccaagaagaa gaggaaagtc ctcgagcacc accaccacca ccactga 4917

Claims (9)

1.一种将CRISPR家族蛋白与核酸的定点偶联方法,所述方法包括:
(a)将CRISPR家族蛋白进行非天然氨基酸的定点突变;
(b)将步骤(a)得到的非天然氨基酸定点突变的CRISPR家族蛋白与二苯并环辛炔修饰的核酸进行偶联,从而得到CRISPR家族蛋白与核酸的定点偶联物;
其中,所述的非天然氨基酸为
Figure FDA0003778187960000011
-AeF;
所述CRISPR家族蛋白为SpCas9,在SEQ ID NO.1的第G1367位突变;
或所述CRISPR家族蛋白为AsCas12a,在SEQ ID NO.3的第M806位突变。
2.一种非天然氨基酸定点突变的CRISPR家族蛋白,其中,所述非天然氨基酸为
Figure FDA0003778187960000012
-AeF;
所述CRISPR家族蛋白为SpCas9,在SEQ ID NO.1的第G1367位突变;
或所述CRISPR家族蛋白为AsCas12a,在SEQ ID NO.3的第M806位突变。
3.如权利要求2所述的非天然氨基酸定点突变的CRISPR家族蛋白的制备方法,包括如下步骤:
(1)位点选择:根据所述CRISPR家族蛋白的SpCas9或者AsCas12a的结构信息,在所述SpCas9蛋白氨基酸序列中选择第G1367位氨基酸位点,在所述AsCas12a蛋白氨基酸序列中选择第M806位氨基酸位点;
(2)基因突变:将编码步骤(1)中所选择位点的氨基酸的核苷酸利用基因工程方法将突变位点的密码子突变为TAG、TAA或TGA,得到突变的CRISPR蛋白基因;
(3)突变型表达载体构建:将步骤(2)通过基因工程得到的突变的CRISPR蛋白基因通过分子克隆的方式与表达质粒相连接,得到含突变序列的表达载体质粒;
(4)蛋白表达:将(3)得到的表达载体质粒与用于非天然氨基酸插入的工具质粒共同转染到相同的宿主细胞中,在转染成功后的宿主细胞培养液中添加含有所述非天然氨基酸的条件下培养,并诱导宿主细胞表达突变蛋白。
4.如权利要求3所述非天然氨基酸定点突变的CRISPR家族蛋白的制备方法,其中,所述用于非天然氨基酸插入的工具质粒含有tRNA及氨酰-tRNA合成酶,可以特异性识别TAG,并在该密码子对应的位置插入所述非天然氨基酸。
5.如权利要求3所述的非天然氨基酸定点突变的CRISPR家族蛋白的制备方法,其中,在步骤(2)中:将SEQ ID NO.1所示蛋白的第G1367位氨基酸的核苷酸的密码子突变为TAG;或将SEQ ID NO.3所示蛋白的第M806位氨基酸的核苷酸的密码子突变为TAG。
6.用于制备权利要求2所述的非天然氨基酸定点突变的CRISPR家族蛋白的载体,该载体包含编码权利要求2中任一项非天然氨基酸定点突变的CRISPR家族蛋白相应的核酸序列。
7.一种CRISPR家族蛋白与核酸的定点偶联物,其中,所述CRISPR家族蛋白为权利要求2所述的非天然氨基酸定点突变的CRISPR家族蛋白。
8.如权利要求7所述的CRISPR家族蛋白与核酸的定点偶联物,所述核酸可以是oligoDNA、供体DNA、crRNA及其相关修饰核酸。
9.权利要求2所述的非天然氨基酸定点突变的CRISPR家族蛋白、或者权利要求7或8所述CRISPR家族蛋白与核酸的定点偶联物提高基因编辑效率和/或降低脱靶效应的应用。
CN202011250901.8A 2019-11-11 2020-11-11 Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途 Active CN112779240B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911092554 2019-11-11
CN2019110925548 2019-11-11

Publications (2)

Publication Number Publication Date
CN112779240A CN112779240A (zh) 2021-05-11
CN112779240B true CN112779240B (zh) 2022-09-23

Family

ID=75750489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011250901.8A Active CN112779240B (zh) 2019-11-11 2020-11-11 Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途

Country Status (2)

Country Link
CN (1) CN112779240B (zh)
WO (1) WO2021093752A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020226864B2 (en) * 2019-02-22 2023-09-28 Integrated Dna Technologies, Inc. Lachnospiraceae Bacterium ND2006 Cas12a mutant genes and polypeptides encoded by same
CN116212042B (zh) * 2023-03-10 2023-09-05 中国人民解放军空军军医大学 一种负载rna的脑内递送系统及其制备方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109642232A (zh) * 2016-06-01 2019-04-16 Kws种子欧洲股份公司 用于基因组改造的杂合核酸序列
WO2019135816A2 (en) * 2017-10-23 2019-07-11 The Broad Institute, Inc. Novel nucleic acid modifiers

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109642232A (zh) * 2016-06-01 2019-04-16 Kws种子欧洲股份公司 用于基因组改造的杂合核酸序列
WO2019135816A2 (en) * 2017-10-23 2019-07-11 The Broad Institute, Inc. Novel nucleic acid modifiers

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Biocontainment of genetically modified organisms by synthetic protein;Mandell DJ等;《Nature》;20150205;第518卷(第7537期);第55-60页 *
improving the efficiency of precise genome editing with site-specific cas9-oligonucleotide conjugates;Ling XY等;《Science Advances》;20200408;第6卷(第15期);第1-8页 *
Recoded organisms engineered to depend on synthetic amino acids;Rovner AJ等;《Nature》;20150205;第518卷(第7537期);第89-93页 *
利用非天然氨基酸提高基因组编辑的安全性和特异性;张建铎;《中国优秀硕士学位论文全文数据库 基础科学辑》;20170215;第28、33页 *

Also Published As

Publication number Publication date
CN112779240A (zh) 2021-05-11
WO2021093752A1 (zh) 2021-05-20

Similar Documents

Publication Publication Date Title
AU2019250224B2 (en) Enhanced transgene expression and processing
CN112410377B (zh) VI-E型和VI-F型CRISPR-Cas系统及用途
CN113631708B (zh) 编辑rna的方法和组合物
KR102339365B1 (ko) 키메라 게놈 조작 분자 및 방법
CN112399860A (zh) 用于在真核细胞中翻译的环状rna
KR20210116526A (ko) 증진된 항-신생물 활성 및 면역억제 내성을 갖는 변형된 면역 세포
KR20200058508A (ko) 게놈 편집을 위한 폴리뉴클레오티드, 조성물 및 방법
AU2022200130B2 (en) Engineered Cas9 systems for eukaryotic genome modification
KR20190116407A (ko) 고-충실도 Cas9 변이체 및 그의 적용
CN113881652B (zh) 新型Cas酶和系统以及应用
CN112779240B (zh) Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途
CN116249779A (zh) 免疫刺激细菌递送平台及其用于递送治疗产物的用途
JP7335224B2 (ja) 全長t細胞受容体オープンリーディングフレームの迅速な組立ておよび多様化のための二成分ベクターライブラリシステム
KR20210006966A (ko) 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
CN112899237A (zh) Cdkn1a基因报告细胞系及其构建方法和应用
CN116239703A (zh) 一种融合蛋白及含有其的高效特异碱基编辑系统和应用
US20220145332A1 (en) Cell penetrating transposase
CN105695509B (zh) 一种获得高纯度心肌细胞的方法
KR102491095B1 (ko) Cas 단백질 및 HIF의 TAD 도메인을 포함하는 단백질 융합체 및 이의 용도
EP4305177A1 (en) Method for the production of seamless dna vectors
O'Brien Cloning and Expression of Hydra Innexin 2, a Gap Junction Protein Required for Coordinated Contraction of the Body Column
KR20230145117A (ko) 변이체 cas12i4 폴리펩타이드를 포함하는 조성물 및 이의 용도
CN115786373A (zh) 一种用于检测protac分子的重组核酸分子
CN117295816A (zh) 包含变体多肽的组合物及其用途
CN114672504A (zh) 一种具有高效同源定向修复活性Cas9-RNAi RNP的制备方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210518

Address after: 100176 Room 501, 5th floor, building 15, yard 8, Liangshuihe 2nd Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Applicant after: BEIJING HUIDA BIOTECHNOLOGY Co.,Ltd.

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Applicant before: Peking University

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant