CN109295186B - 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用 - Google Patents

一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用 Download PDF

Info

Publication number
CN109295186B
CN109295186B CN201811160230.9A CN201811160230A CN109295186B CN 109295186 B CN109295186 B CN 109295186B CN 201811160230 A CN201811160230 A CN 201811160230A CN 109295186 B CN109295186 B CN 109295186B
Authority
CN
China
Prior art keywords
tada
leu
lys
glu
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811160230.9A
Other languages
English (en)
Other versions
CN109295186A (zh
Inventor
松阳洲
梁普平
黄军就
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201811160230.9A priority Critical patent/CN109295186B/zh
Publication of CN109295186A publication Critical patent/CN109295186A/zh
Priority to PCT/CN2019/107243 priority patent/WO2020063520A1/zh
Priority to US17/279,124 priority patent/US20210395812A1/en
Application granted granted Critical
Publication of CN109295186B publication Critical patent/CN109295186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了一种基于全基因组测序检测腺嘌呤单碱基编辑系统(Adenine base editor,ABE)脱靶效应的方法及其在基因编辑中的应用。所述腺嘌呤单碱基编辑系统由TadA:TadA*:Cas9的融合基因和gRNA两部分组分组成。其能催化靶位点处腺嘌呤(Adenine,A)至鸟嘌呤(Guanine,G)的高效置换,在人类疾病基因编辑治疗和疾病模型构建中有广泛的应用前景。为此,我们开发了首个能够检测ABE系统全基因组范围内脱靶效应的检测方法——EndoV‑seq。本发明提供的EndoV‑seq方法在基因编辑,尤其是基因编辑治疗领域,具有广泛的应用前景。

Description

一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应 的方法及其在基因编辑中的应用
技术领域
本发明属于分子生物学技术领域。更具体地,涉及是基于全基因组测序检测腺嘌呤单碱基编辑系统(Adenine base editor,ABE)脱靶效应的方法及其在基因编辑中的应用。
背景技术
CRISPR/Cas9系统是一项新的人工核酸酶技术,其是由gRNA(guide RNA)和Cas9蛋白组成的复合物。在靶位点3’末端PAM(Protospacer adjacent motif)序列的帮助下,该gRNA-Cas9蛋白复合物通过gRNA5’末端的20个碱基与靶DNA结合,从而将内切核酸酶Cas9招募到靶位点处,切割靶DNA,从而编辑靶基因。虽然,CRISPR/Cas9技术的出现,极大地提高了基因定点突变的效率,但目前依然无法满足临床基因治疗的需要。最近,基于CRISPR/Cas9技术,科学家开发了新一代的基因编辑系统——腺嘌呤单碱基编辑系统(Adenine baseeditor,ABE)。ABE系统是由TadA:TadA*:Cas9融合蛋白和gRNA两部分组分组成的。在gRNA的引导下,TadA:TadA*:Cas9融合蛋白能够与DNA上的靶位点结合,其中与gRNA互补的DNA链会被Cas9核酸酶切断,而非互补链上4-9位的A碱基则会被腺嘌呤脱氨酶——TadA蛋白——催化脱氨基形成I碱基。随着DNA的复制,I(次黄嘌呤,Inosine)碱基会被G(鸟嘌呤,Guanine)碱基替代,从而实现A至G的碱基置换。与CRISPR/Cas9核酸酶相比,ABE系统的效率更高。由于,ABE系统能在不诱导DNA双链断裂的情况下实现A至G的碱基置换,其安全性比CRISPR/Cas9核酸酶也更高。
大约48%的人致病单碱基突变可以通过A至G的碱基置换实现修复,从而最终实现遗传疾病的治疗,所以ABE系统在人类疾病基因治疗领域有着广泛的应用前景。但是,目前仍未有一项能够在全基因组范围内检测ABE系统脱靶效应的方法,这严重制约了ABE系统的应用。
发明内容
本发明的目的是针对上述ABE系统尚无全基因组范围内检测脱靶效应的方法,提供一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用。
在本发明一具体实施例中,本发明通过基因合成、分子克隆、蛋白表达纯化、体外转录、核酸纯化、全基因组测序、PCR产物深度测序、生物信息学分析等技术检测ABE系统的脱靶效应。同时,我们还结合细胞转染和PCR产物深度测序技术对该检测方法的有效性和灵敏度进行了验证。
本发明上述目的通过以下技术方案实现:
第一方面,本发明提供了一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法,其特征在于,包括如下步骤:
(1)、将TadA:TadA*:Cas9融合蛋白、一种或多种靶向待测DNA序列的gRNA以及基因组DNA共混后进行反应;其中,所述基因组DNA包含有待测DNA序列,在所述反应体系中,TadA:TadA*:Cas9和gRNA复合物切割与gRNA互补的待测DNA链,同时将非互补链上的腺嘌呤转变成次黄嘌呤;
(2)、在步骤(1)反应后的体系中加入内切核酸酶V切割包含次黄嘌呤DNA,造成DNA双链断裂;
(3)、利用全基因组测序以及生物信息学分析检测腺嘌呤单碱基编辑系统的脱靶效应。
在本发明第一方面一具体实施例中,本发明提供了一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法(EndoV-seq);所述EndoV-seq首先利用体外纯化的TadA:TadA*:Cas9融合蛋白与gRNA共处理基因组DNA;TadA:TadA*:Cas9和gRNA的复合物将切割与gRNA互补的DNA链,同时将非互补链上的A转变成I;然后,利用内切核酸酶V(Endonuclease V,EnodV)切割包含I碱基的基因组DNA,造成DNA双链断裂;最后,利用全基因组测序结合生物信息学分析检测DNA双链断裂,从而探究ABE系统的脱靶效应。我们将这一方法命名为EndoV-seq。
在本发明第一方面一具体实施例中,所述TadA:TadA*:Cas9融合蛋白包括CRISPR/Cas系统的效应蛋白结构域、腺苷脱氨酶结构域。
在本发明第一方面一具体实施例中,所述TadA:TadA*:Cas9融合蛋白包括CRISPR/Cas系统的效应蛋白结构域、连接多肽、腺苷脱氨酶结构域。
本领域技术人员可以理解的是,本发明所述的TadA:TadA*:Cas9融合蛋白由Cas9效应蛋白与腺苷脱氨酶(简称TadA蛋白)融合而成,本领域技术人员可以根据需要,利用一条或多条连接多肽,将一个Cas9 效应蛋白结构域与一个或多个TadA蛋白进行连接,获得融合蛋白,在本发明一具体实施例中,所述TadA蛋白均重复一次。可以理解的是,所述Cas9效应蛋白和TadA蛋白的N端和C端的连接顺序为本领域常规技术,连接多肽包括但不限于本领域常规的连接多肽片段,常见地,比如GS linker。
本领域技术人员可以理解的是,本领域技术人员可以根据具体需要,针对基因组DNA设计任意特异性靶向的gRNA,并对gRNA进行本领域熟知的修饰,以提高gRNA靶向特异性。在本发明一具体实施例中,本发明设计的gRNA序列包括:
HBG:GTGGGGAAGGGGCCCCCAAGAGG,其中下划线标注的为PAM序列
VEGFA3:GGTGAGTGAGTGTGTGCGTGTGG,其中下划线标注的为PAM序列。
本领域技术人员可以理解的是,TadA:TadA*:Cas9融合蛋白中,TadA为腺苷脱氨酶的缩写,TadA*为TadA突变体的缩写,Cas9为CRISPR/Cas系统的Cas9效应蛋白。
进一步地,所述CRISPR/Cas系统的效应蛋白结构域中,所述Cas9效应蛋白包括但不限定于无切割活性或仅具有单链切割活性的Cas蛋白Streptococcus pyogenes Cas9(SpCas9),Staphylococcus aureus Cas9(SaCas9),Lachnospiraceae Cpf1(LbCpf1),Acidaminococcus Cpf1(AsCpf1),Streptococcus thermophilus Cas9(StCas9),andNeisseriameningitidis Cas9(NmCas9)和Francisella Cpf1(FnCpf1)等。
进一步地,所述的TadA:TadA*:Cas9融合蛋白中,腺苷脱氨酶TadA蛋白的氨基酸序列如SEQ ID NO.1所示。
在本发明第一方面一具体实施例中,所述TadA:TadA*:Cas9融合蛋白的氨基酸序列为SEQ ID NO.2所示或为与SEQ ID NO.2所示氨基酸至少80%、85%、90%、92%、95%、96%、97%、98%、99%或99.5%一致的序列。
在本发明第一方面一具体实施例中,所述TadA:TadA*:Cas9融合蛋白的制备方法是将合成的TadA:TadA*:Cas9融合蛋白原核表达载体(pET42b-ABE7.10,SEQ ID NO.3)载体在大肠杆菌中进行表达并纯化TadA:TadA*:Cas9融合蛋白。
更具体地,该制备过程包括步骤(1)将pET42b-ABE7.10转化到BL21StarTM(DE3)E.coli(Thermo Fisher)感受态中。
更具体地,步骤(2)诱导TadA:TadA*:Cas9融合蛋白表达的方式是:挑取单克隆37℃过夜培养后1:200接种于1L含有50μg/ml卡那霉素的LB培养基中,37℃培养至OD600=0.7–0.8。然后,将培养液放于4℃冰箱静置1h,加入终浓度0.5mM IPTG18℃诱导蛋白表达14-16h。
更具体地,步骤(3)纯化及保存TadA:TadA*:Cas9融合蛋白的方式是:4000rpm,10min收集诱导后的菌体,加入10ml裂解液(100mM Tris-HCl,pH 8.0,1M NaCl,20%甘油,5mM TCEP(Sigma-Aldrich),0.4mM PMSF(Sigma-Aldrich),蛋白酶抑制剂(Roche)and 20mMImidazole(Sigma-Aldrich))。超声(5min total,2s on,5s off)初步破碎细胞。然后,15000rpm,4℃离心10min后收集上清液再次超声(5min total,2s on,5s off)。之后,15000rpm,4℃离心10min后收集上清液。上清液与Ni-NTA琼脂糖树脂(GE Healthcare)4℃孵育1.5h。混合液倒入层析柱,然后用40ml洗涤液(100mM Tris-HCl,pH 8.0,0.5M NaCl,20%甘油,5mM TCEP,20mM imidazole)清洗Ni-NTA琼脂糖树脂(GE Healthcare)。然后,用洗脱液(100mM Tris-HCl,pH 8.0,0.5M NaCl,20%甘油,5mM TCEP,270mM Imidazole)将蛋白从Ni柱洗脱。洗脱蛋白过5ml阳离子交换层析(Hi-Trap HP SP阳离子交换柱,GEHealthcare)。然后,用30kDa浓缩管浓缩(Millipore)至300μl。然后,将浓缩产物过0.22μm滤菌膜(Millipore)过滤除菌。用BCA试剂盒(Pierce Biotechnology)测蛋白浓度后暂存于4℃,如需长期保存,则将蛋白用液氮速冻后冻于-80℃保存。
更具体地,所述gRNA的制备方法是包括(1)化学合成gRNA;(2)体外转录合成gRNA。
在本发明第一方面一具体实施例中,所述反应体系为溶液反应体系,所述溶液反应体系还包含所述TadA:TadA*:Cas9融合蛋白将所述非互补链上的腺嘌呤转变成次黄嘌呤所需的缓冲液组分。
在本发明第一方面一具体实施例中,所述步骤(3)包括:
对步骤(2)酶切后的体系进行全基因组测序,获得全基因组测序结果;
对全基因组测序结果进行生物信息学分析,获得所述腺嘌呤单碱基编辑系统的脱靶数据;
进一步地,所述步骤(3)还包括:根据所述脱靶数据预测所述腺嘌呤单碱基编辑系统在细胞(包括人细胞、动物细胞、植物细胞等)或机体内(包括人、动物、植物等)的脱靶效应。
第二方面,本发明提供了一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的试剂盒,包括第一方面所提供的靶向目的DNA的gRNA序列或TadA:TadA*:Cas9融合蛋白、EndoV核酸酶。
第三方面,本发明提供了一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法在检测腺嘌呤单碱基编辑系统脱靶效应中的应用。
本发明利用体外纯化的TadA:TadA*:Cas9融合蛋白和gRNA,利用融合蛋白-gRNA复合物处理基因组DNA。然后,利用核酸纯化试剂盒纯化处理过的基因组DNA。再利用内切核酸酶V消化以上纯化的基因组DNA。消化完成后,再将该基因组DNA纯化,并进行全基因组测序检测ABE系统的全基因组脱靶效应。该检测方法(EndoV-seq)和检测结果也在本发明的保护范围之内。同时,还可以根据EndoV-seq的检测结果,优选出效率和特异性高的gRNA。EndoV-seq作为优选gRNA的方法也在本发明的保护范围之内。
另外,上述EndoV-seq在基因编辑中的应用也在本发明的保护范围之内。
本发明将促进以ABE系统为工具,进行的精准基因编辑治疗的临床应用,精准疾病模型构建的应用,精准基因编辑植物或作物的培育等应用。
第四方面,EndoV-seq还可以用于检测其他能够将A碱基转变成I碱基的酶或化学试剂的效率和脱靶活性。酶包括但不限定于TadA腺嘌呤脱氨酶。
本发明具有以下有益效果:
本发明提供了基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法,该检测方法可以用于腺嘌呤单碱基编辑系统脱靶效应的检测,促进腺嘌呤单碱基编辑系统在疾病基因治疗、模型构建、基因编辑植物或作物的培育等应用,具有十分广泛的应用前景。
附图说明
图1为Cas9蛋白、BE3蛋白和TadA:TadA*:Cas9蛋白的蛋白凝胶电泳图;第一道泳道为蛋白分子Marker,第二道为Cas9蛋白,第三道为BE3蛋白,第四道为TadA:TadA*:Cas9蛋白;
图2为gRNA琼脂糖凝胶电泳结果,两条泳道均为gRNA。
图3为TadA:TadA*:Cas9蛋白-gRNA复合物和EndoV共处理能够切开靶DNA分子。
图4为EnodV-seq能够检测到靶位点处的DNA双链断裂。
图5为EndoV-seq检测HBG和VEGFA3两条gRNA介导的ABE系统的全基因组范围内的脱靶效应。A图是Circosplot展示EndoV-seq检测到的靶位点及脱靶位点,红色箭头指示的是靶位点。B图是Weblog展示的脱靶位点的分子模式。下方标注的是gRNA的靶序列,其中PAM标注为绿色字母。
图6为PCR产物深度测序验证HBG的脱靶位点,18个脱靶位点中有6个位点能被验证,并用*号标出。
图7为PCR产物深度测序验证VEGFA3的脱靶位点,22个脱靶位点中有3个位点能被验证,并用*号标出;
图8为本发明基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法(EndoV-seq)的流程示意图。
具体实施方式
以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。
除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。除非特别说明,以下实施例所用试剂和材料均为市购。未注明具体条件的实验方法,通常按照常规条件,或制造厂商所建议条件实施。
本发明一具体实施方式中,本发明提供了一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的系统、方法、试剂盒及其应用。
本发明提供的基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法,采用了本发明提供的基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应检测试剂盒,所述方法包括但不限于如下步骤的一个或多个步骤:
TadA:TadA*:Cas9融合蛋白的表达纯化和gRNA的制备
1、TadA:TadA*:Cas9融合蛋白的表达纯化
制备含编码TadA:TadA*:Cas9融合蛋白基因的重组表达质粒,本实施例中,所述TadA:TadA*:Cas9融合蛋白的原核表达载体为pET42b-ABE7.10(SEQ ID NO.3);
步骤(1)、将pET42b-ABE7.10转化到BL21StarTM(DE3)E.coli(Thermo Fisher)感受态中。
步骤(2)、诱导TadA:TadA*:Cas9融合蛋白表达:挑取单克隆37℃过夜培养后1:200接种于1L含有50μg/ml卡那霉素的LB培养基中,37℃培养至OD600=0.7–0.8。培养液放于4℃冰箱静置1h,加入终浓度0.5mM IPTG18℃诱导蛋白表达14-16h。
步骤(3)、纯化及保存TadA:TadA*:Cas9融合蛋白:4℃收集菌体并纯化蛋白。4000rpm,10min收集诱导后的菌体,加入10ml裂解液(100mM Tris-HCl,pH 8.0,1M NaCl,20%甘油,5mM TCEP(Sigma-Aldrich),0.4mM PMSF(Sigma-Aldrich),蛋白酶抑制剂(Roche)and 20mM Imidazole(Sigma-Aldrich))。超声(5min total,2s on,5s off)初步破碎细胞,15000rpm,4℃离心10min后收集上清液再次超声(5min total,2s on,5s off),15000rpm,4℃离心10min后收集上清液。上清液与Ni-NTA琼脂糖树脂(GE Healthcare)4℃孵育1.5h。混合液倒入层析柱,40ml洗涤液(100mM Tris-HCl,pH 8.0,0.5M NaCl,20%甘油,5mM TCEP,20mM imidazole)清洗Ni-NTA琼脂糖树脂(GE Healthcare)。然后用洗脱液(100mM Tris-HCl,pH 8.0,0.5M NaCl,20%甘油,5mM TCEP,270mM Imidazole)将蛋白从Ni柱洗脱。洗脱蛋白过5ml阳离子交换层析(Hi-Trap HP SP阳离子交换柱,GE Healthcare)。然后用30kDa浓缩管浓缩(Millipore)至300μl。然后将浓缩产物过0.22μm滤菌膜(Millipore)过滤除菌。用BCA试剂盒(Pierce Biotechnology)测蛋白浓度后暂存于4℃,如需长期保存,则将蛋白用液氮速冻后冻于-80℃保存。
蛋白表达检测结果如附图1,图1显示了Cas9蛋白、BE3蛋白和TadA:TadA*:Cas9蛋白的蛋白凝胶电泳图。
2、gRNA的制备
本发明实施例通过化学直接合成或者通过体外转录制备gRNA,其中,体外转录制备gRNA包括以下步骤①通过PCR的方式获得包含T7启动子的gRNA转录模板DNA。或者将gRNA编码序列克隆到包含T7启动子的转录载体中,然后将该载体线性化而获得包含T7启动子的gRNA转录模板DNA;②体外转录gRNA;
体外转录gRNA的方法是:以包含T7启动子的gRNA转录模板DNA为模板,用MEGAshortscript T7kit(Life Technologies)转录生产gRNA。再用RNA纯化试剂盒纯化gRNA(Qiagen),并用不含核酸酶的水洗脱gRNA,即可获得gRNA。
具体地,gRNA体外转录方法的操作程序如下:
1)以gRNA转录模板DNA为模板,利用MEGAshortscript T7kit(LifeTechnologies),按照如下表1所示体系配制反应体系。
表1 反应体系
成分 用量
T7 10×反应液 2μl
T7 ATP溶液 2μl
T7 CTP溶液 2μl
T7 GTP溶液 2μl
T7 UTP溶液 2μl
模板DNA 1μg
T7 RNA转录酶 2μl
ddH2O 加水至20μl
37℃反应2h,案后往反应体系中加1μl TURBO DNase,37℃反应15min。
2)gRNA的纯化,用Qiagen的RNaeasy Kit纯化,按照如下步骤进行:
a.加ddH2O使得起始RNA的体积为100μl,混匀。
b.加350μl Binding Solution Concentrate到RNA样品中,并混匀。
c.加250μl 100%乙醇,并混匀。
d.将样品转移到柱子中,12000g离心15s。
e.用500μl Wash Solution洗两次,12000g离心15s。
f.加50μl ddH2O将RNA从柱子上洗脱下来。
3)结果如图2所示,图2显示了HBG和VEGFA3两条gRNA的琼脂糖凝胶电泳结果。
EndoV-seq检测ABE系统在靶位点的单碱基编辑
为了验证EndoV-seq是否能够用于检测ABE系统全基因组范围内的脱靶效应,我们利用了一条已经多次被验证能高效靶向靶位点的gRNA——HEK293-2,其靶序列为GAACACAAAGCATAGACTGCGGG,其中下划线标注的为PAM序列。首先,我们通过PCR的方式扩增出了包含了HEK293-2位点的PCR产物,然后将该产物纯化,具体纯化方法如下。
按AxyPrep PCR cleanup kit的操作手册进行实验。
a.在PCR反应液中,加3个体积的Buffer PCR-A并混匀,然后转移到DNA制备管,将DNA制备管置于2ml离心管中,12,000g离心1min,将滤液弃掉。
b.将制备管放回2ml离心管中,加700μl Buffer W2,12000g离心1min,将滤液弃掉。
c.将制备管放回2ml离心管中,加400μl Buffer W2,12000g离心1min,弃滤液。
d.12,000g离心3min,使Buffer W2中的乙醇充分弃掉。
e.将制备管置于新的1.5ml离心管中,在制备管中央加25-30μl的无核酸酶的水,静置1min。12000
g离心1min(无核酸酶的水用前先65℃预热)。
获得了纯化后的PCR产物之后,将PCR产物加入到20μl反应体系中。该反应体系中含有2μl10×NEBuffer 3,400nM TadA:TadA*:Cas9融合蛋白,900nM gRNA and 200ng PCR产物。37℃反应3h。依次加入RNase A和Proteinase K移除gRNA及蛋白。然后再次按照如上步骤纯化,取100ng与1单位的Endo V(ThermoFisher)混合10μl反应体系,65℃反应30min。3%琼脂糖检测。检测结果如图3所示,用EndoV消化TadA:TadA*:Cas9和gRNA处理过的PCR产物,能够将包含HEK293-2靶位点的PCR产物切断。其中Cas9蛋白作为阳性对照。图3的结果说明EndoV能够用于检测ABE系统的脱氨基作用。
为了进一步检测EndoV-seq是否能够用于检测ABE系统的脱氨基作用,我们进一步用TadA:TadA*:Cas9融合蛋白和HEK293-2gRNA一起处理人HEK293T细胞的基因组DNA。首先,我们用基因组DNA提取试剂盒从HEK293T细胞中提取基因组DNA(DNeasy Blood&TissueKit,Qiagen),操作方法完全按照说明书进行。然后用TadA:TadA*:Cas9融合蛋白和HEK293-2gRNA一起处理人HEK293T细胞的基因组DNA。在500μl反应体系中我们加有50μl 10×NEBuffer 3,400nM ABE7.10,900nM gRNA and 10μg基因组DNA。37℃反应8h。8h后,向反应体系中加入RNase A和Proteinase K移除gRNA及蛋白。然后用苯酚/氯仿/异戊醇仿抽提基因组DNA,操作步骤如下。
a.向以上反应加入1体积的苯酚/氯仿/异戊醇剧烈混匀,室温下静置10分钟,待分层后12000rpm离心10分钟;
b.吸取上层水相,并记录其体积;
c.加入1/10体积的3M NaAc,加3倍体积冷的无水乙醇(-20℃冰箱),剧烈混匀。然后,冰上孵育15分钟;
d.离心(12000rpm,15分钟,4℃),用移液器尽可能除去乙醇;
e.加入0.5ml 70%乙醇洗DNA沉淀一次,12000rpm,离心2分钟,吸取并尽可能弃掉乙醇;
f.加入30μl水溶解DNA,然后用Nanodrop测定其浓度;
然后,取4μg基因组DNA与8单位的EndoV核酸酶(ThermoFisher)混合100μl反应体系,65℃反应3h,酚氯仿抽提基因组DNA。最后,取1μg基因组DNA做全基因组测序。然后用BWA软件将测序的Reads比对到人参考基因组。我们发现EndoV-seq确实能够检测到ABE系统介导的靶位点的修饰,结果如图4所示。
EndoV-seq检测ABE系统在全基因组范围内的脱靶效应
为了进一步探究EndoV-seq是否能够用于检测ABE系统全基因范围内的脱靶效应。我们进一步利用在实施例1中所转录出的HBG和VEGFA3两条gRNA,然后将其分别与TadA:TadA*:Cas9融合蛋白孵育。然后用该蛋白-RNA复合物处理HEK293-2基因组DNA。
在500μl反应体系中我们加有50μl 10×NEBuffer 3,400nM ABE7.10,900nM gRNAand 10μg基因组DNA。37℃反应8h。8h后,向反应体系中加入RNase A和Proteinase K移除gRNA及蛋白。然后用苯酚/氯仿/异戊醇仿抽提基因组DNA,操作步骤如下。
a.向以上反应加入1体积的苯酚/氯仿/异戊醇剧烈混匀,室温下静置10分钟,待分层后12000rpm离心10分钟;
b.吸取上层水相,并记录其体积;
c.加入1/10体积的3M NaAc,加3倍体积冷的无水乙醇(-20℃冰箱),剧烈混匀。然后,冰上孵育15分钟;
d.离心(12000rpm,15分钟,4℃),用移液器尽可能除去乙醇;
e.加入0.5ml 70%乙醇洗DNA沉淀一次,12000rpm,离心2分钟,吸取并尽可能弃掉乙醇;
f.加入30μl水溶解DNA,然后用Nanodrop测定其浓度;
然后,取4μg基因组DNA与8单位的EndoV核酸酶(ThermoFisher)混合100μl反应体系,65℃反应3h,酚氯仿抽提基因组DNA。最后,取1μg基因组DNA做全基因组测序。然后,用BWA软件将测序的Reads比对到人参考基因组。再利用在线软件
(Digenome 2.0,http://www.rgenome.net/digenome-js/standalone)对基因组各个位点进行打分,确定其切割的分值。参考之前用Digenome-seq检测胞嘧啶单碱基编辑系统脱靶效应的研究,我们将分值大于0.1的位点定义为阳性脱靶位点。我们发现EndoV-seq能够检测到靶位点以及脱靶位点,研究结果如图5所示,EndoV-seq检测到的脱靶位点见表2和表3。
表2 EndoV-seq检测到的HBG gRNA介导的ABE系统的脱靶位点统计
表3 EndoV-seq检测到的VEGFA3gRNA介导的ABE系统的脱靶位点统计
为了进一步研究EndoV-seq的有效性和敏感度。我们将pcDNA3.1-ABE7.10载体(由广州艾基生物科技有限公司合成,SEQ ID NO.4)与表达HBG(或VEGFA3)gRNA的gRNA表达载体pUC19-SpCas9-gRNA(SEQ ID NO.5,本实验室构建)共转染到293T细胞中,48h后收集细胞。利用基因组DNA提取试剂盒提取基因组DNA(DNeasy Blood&Tissue Kit,Qiagen),操作方法完全按照说明书进行。然后利用表2和表3中的引物通过PCR扩增靶位点和脱靶位点,并将这些PCR产物用于深度测序。如图6,通过深度测序,我们发现,对于HBG来说,18个脱靶位点中有6个位点能被验证。而对于VEGFA3来说,22个脱靶位点中有3个位点能被验证。所以,EndoV-seq的总验证率为22.5%(9/40),说明EndoV-seq能够有效检测ABE系统的脱靶效应。对于HBG gRNA来说,我们发现HBG-OT9位点在细胞内的脱靶效率为0.13%,十分接近PCR产物深度测序的检测极限0.1%1(1.Tsai,S.Q.et al.CIRCLE-seq:a highly sensitive invitro screen for genome-wide CRISPR-Cas9nuclease off-targets.Nature methods14,607-614(2017).),说明EndoV-seq具有很高的灵敏度。以上结果说明,EndoV-seq能够高效、灵敏地检测ABE系统全基因组范围内的脱靶效应。
为进一步说明本发明的有益效果,本发明提供了本发明基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法(EndoV-seq)的流程示意图,如图8所示。
如图8,本发明实施例利用体外纯化的TadA:TadA*:Cas9融合蛋白、gRNA以及基因组DNA共孵育。在该反应体系中,TadA:TadA*:Cas9和gRNA的复合物将切割与gRNA互补的DNA链,同时将非互补链上的A转变成I(次黄嘌呤,Inosine)。然后,利用内切核酸酶V(Endonuclease V,EndoV)切割包含I碱基的基因组DNA,造成DNA双链断裂。最后,利用全基因组测序结合生物信息学分析检测ABE系统的脱靶效应。
基于全基因组测序检测腺嘌呤单碱基编辑系统(Adenine base editor,ABE)脱靶效应的方法,能催化靶位点处腺嘌呤(Adenine,A)至鸟嘌呤(Guanine,G)的高效置换,在人类疾病基因编辑治疗和疾病模型构建中有广泛的应用前景。但由于CRISPR/Cas9系统的特异性不高,易将TadA:TadA*:Cas9融合蛋白靶向到与gRNA不完全匹配的脱靶位点上,导致脱靶。严重制约了ABE系统的应用。为此,本发明提供的首个能够检测ABE系统全基因组范围内脱靶效应的检测方法EndoV-seq,利用EndoV-seq能在体外检测到ABE系统的脱靶位点,并结合体内实验进行验证。可以预见,EndoV-seq在基因编辑,尤其是基因编辑治疗领域,将具有广泛的应用前景。
本发明所述SEQ ID NO.4和SEQ ID NO.5的碱基序列分别如下(所述SEQ ID NO.4和SEQ ID NO.5的碱基序列为商业质粒载体的序列,故不写入后续序列表中):
SEQ ID NO.3:
GATATACCATGGGCAGCAGTCATCATCATCACCATCACTCGGAGGTTGAATTCTCCCACGAGTATTGGATGCGGCACGCTCTTACGTTAGCAAAACGCGCGTGGGACGAGCGTGAAGTACCGGTAGGCGCCGTGTTAGTGCATAATAACCGGGTCATTGGTGAAGGATGGAATCGGCCGATCGGGAGACACGATCCGACAGCACATGCTGAGATTATGGCTTTACGGCAAGGAGGACTGGTTATGCAGAACTACCGGTTGATTGATGCTACACTGTACGTAACCTTAGAACCATGTGTGATGTGTGCTGGAGCCATGATACATTCCCGCATCGGAAGAGTGGTTTTTGGGGCTCGTGATGCAAAAACTGGCGCCGCCGGAAGTCTTATGGACGTGTTACATCATCCAGGCATGAATCATCGGGTCGAGATTACAGAGGGCATTTTGGCAGATGAATGTGCTGCATTGCTTAGTGATTTCTTCCGCATGCGGAGACAGGAAATCAAAGCCCAAAAAAAAGCTCAAAGTAGTACTGATAGTGGTGGATCCAGTGGAGGCTCGTCAGGCTCTGAAACGCCTGGCACATCAGAATCGGCAACGCCAGAGTCGTCAGGAGGTTCCTCAGGTGGATCTTCGGAGGTCGAGTTTTCACATGAGTATTGGATGCGTCATGCCTTGACGTTGGCGAAACGGGCGCGCGATGAGCGTGAGGTGCCCGTGGGAGCGGTGTTGGTACTGAATAACCGGGTTATAGGGGAAGGATGGAACCGGGCTATTGGGTTACACGACCCAACGGCGCACGCCGAGATAATGGCACTGCGCCAAGGGGGCTTAGTTATGCAGAATTATCGCCTTATCGATGCTACACTGTATGTAACCTTTGAACCCTGCGTAATGTGTGCGGGGGCTATGATCCACTCGAGAATAGGGCGCGTGGTATTCGGCGTACGCAACGCTAAAACCGGGGCTGCGGGCTCGTTGATGGATGTTCTGCACTACCCCGGAATGAATCACAGAGTAGAGATCACGGAGGGAATTTTGGCCGACGAATGTGCAGCTTTACTGTGCTACTTTTTTCGGATGCCGCGGCAAGTCTTCAACGCACAGAAGAAGGCTCAATCTTCCACTGACTCAGGTGGCTCGAGTGGTGGGAGTAGCGGATCTGAGACGCCAGGCACATCAGAGAGTGCAACCCCCGAGTCATCGGGTGGGAGTTCCGGCGGATCTGATAAGAAATACTCAATAGGCTTAGCTATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGG ACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTTGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTCTGGCGGGTCTCCCAAGAAGAAGAGGAAAGTCTAATAATTGATTAATACCTAGGCTGCTAAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTA GCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCATATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGATTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCATGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCAAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCAATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATACACTCCGCTATCGCTACGTGACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGGCAGCTGCGGTAAAGCTCATAAGCGTGGTCGTGAAGCGATTCACAGATGTCTGCCTGTTCATCCGCGTCCAGCTCGTTGAGTTTCTCCAGAAGCGTTAATGTCTGGCTTCTGATAAAGCGGGCCATGTTAAGGGCGGTTTTTTCCTGTTTGGTCACTGATGCCTCCGTGTAAGGGGGATTTCTGTTCATGGGGGTAATGATACCGATGAAACGAGAGAGGATGCTCACGATACGGGTTACTGATGATGAACATGCCCGGTTACTGGAACGTTGTGAGGGTAAACAACTGGCGGTATGGATGCGGCGGGACCAGAGAAAAATCACTCAGGGTCAATGCCAGCGCTTCGTTAATACAGATGTAGGTGTTCCACAGGGTAGCCAGCAGCATCCTGCGATGCAGATCCGGAACATAATGGTGCAGGGCGCTGACTTCCGCGTTTCCAGACTTTACGAAACACGGAAACCGAAGACCATTCATGTTGTTGCTCAGGTCGCAGACGTTTTGCAGCAGCAGTCGCTTCACGTTCGCTCGCGTATCGGTGATTCATTCTGCTAACCAGTAAGGCAACCCCGCCAGCCTAGCCGGGTCCTCAACGACAGGAGCACGATCATGCGCACCCGTGGGGCCGCCATGCCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGAGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCAGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACAACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCATGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCAAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCTAGAAATAATTTTGTTTAACTTTAAGAAGGA
SEQ ID NO.4:
AGCTTAAGTTTAAACCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAATTCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAGGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGCGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAGCGGGACTCTGGGGTTCGAAATGACCGACCAAGCGACGCCCAACCTGCCATCACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTT GAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACGGGCCCTCTAGACTCGAGCGGCCGCCATGTCCGAAGTCGAGTTTTCCCATGAGTACTGGATGAGACACGCATTGACTCTCGCAAAGAGGGCTTGGGATGAACGCGAGGTGCCCGTGGGGGCAGTACTCGTGCATAACAATCGCGTAATCGGCGAAGGTTGGAATAGGCCGATCGGACGCCACGACCCCACTGCACATGCGGAAATCATGGCCCTTCGACAGGGAGGGCTTGTGATGCAGAATTATCGACTTATCGATGCGACGCTGTACGTCACGCTTGAACCTTGCGTAATGTGCGCGGGAGCTATGATTCACTCCCGCATTGGACGAGTTGTATTCGGTGCCCGCGACGCCAAGACGGGTGCCGCAGGTTCACTGATGGACGTGCTGCATCACCCAGGCATGAACCACCGGGTAGAAATCACAGAAGGCATATTGGCGGACGAATGTGCGGCGCTGTTGTCCGACTTTTTTCGCATGCGGAGGCAGGAGATCAAGGCCCAGAAAAAAGCACAATCCTCTACTGACTCTGGTGGTTCTTCTGGTGGTTCTAGCGGCAGCGAGACTCCCGGGACCTCAGAGTCCGCCACACCCGAAAGTTCTGGTGGTTCTTCTGGTGGTTCTTCCGAGGTCGAATTTTCACATGAGTATTGGATGCGACACGCCTTGACGCTCGCCAAAAGGGCGAGGGACGAACGGGAAGTTCCCGTAGGCGCCGTCCTTGTACTGAATAATCGAGTTATTGGCGAAGGTTGGAACAGGGCCATAGGACTGCATGATCCAACAGCCCATGCAGAAATCATGGCGCTCCGGCAGGGTGGCCTTGTCATGCAAAATTATAGGCTGATCGACGCGACGTTGTACGTCACCTTCGAACCTTGCGTTATGTGTGCAGGCGCTATGATACATTCAAGAATTGGGCGAGTCGTGTTTGGGGTCAGGAACGCAAAGACTGGTGCAGCCGGTTCCCTTATGGATGTGCTCCACTACCCAGGAATGAATCATCGGGTCGAGATTACAGAGGGGATACTGGCTGACGAATGCGCCGCCCTCCTGTGCTACTTCTTTCGGATGCCCAGGCAGGTGTTTAACGCACAGAAGAAAGCTCAAAGCAGTACCGACTCTGGGGGCTCTAGTGGAGGCTCCAGCGGTTCTGAGACCCCCGGCACTAGTGAATCTGCCACTCCCGAATCATCCGGGGGATCTTCAGGGGGATCTGATAAAAAGTATTCTATTGGTTTAGCCATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGCTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAGATCACAAAGCATGTTGCCCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACTCTGGTGGTTCTCCCAAGAAGAAGAGGAAAGTCTAAA
SEQ ID NO.5:
TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTG GGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTCGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCGAGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTCTAGAGTCGACCTGCAGGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTC
应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明实施例的保护范围。
序列表
<110> 中山大学
<120> 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用
<130> 2018
<160> 2
<170> SIPOSequenceListing 1.0
<210> 1
<211> 167
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp
165
<210> 2
<211> 1763
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1 5 10 15
Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile
35 40 45
Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
50 55 60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
85 90 95
Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala
100 105 110
Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg
115 120 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
130 135 140
Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys
145 150 155 160
Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly
165 170 175
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
180 185 190
Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp
195 200 205
Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
210 215 220
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu
225 230 235 240
Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu
245 250 255
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu
260 265 270
Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala
275 280 285
Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg
290 295 300
Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr
305 310 315 320
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp
325 330 335
Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val
340 345 350
Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser
355 360 365
Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
370 375 380
Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr
385 390 395 400
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
405 410 415
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
420 425 430
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
435 440 445
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
450 455 460
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
465 470 475 480
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
485 490 495
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
500 505 510
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
515 520 525
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
530 535 540
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
545 550 555 560
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
565 570 575
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
580 585 590
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
595 600 605
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
610 615 620
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser
625 630 635 640
Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp
645 650 655
Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn
660 665 670
Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala
675 680 685
Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn
690 695 700
Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr
705 710 715 720
Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln
725 730 735
Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn
740 745 750
Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr
755 760 765
Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu
770 775 780
Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe
785 790 795 800
Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala
805 810 815
Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg
820 825 830
Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly
835 840 845
Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
850 855 860
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly
865 870 875 880
Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn
885 890 895
Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr
900 905 910
Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly
915 920 925
Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val
930 935 940
Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys
945 950 955 960
Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser
965 970 975
Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu
980 985 990
Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
995 1000 1005
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg
1010 1015 1020
Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp
1025 1030 1035 1040
Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg
1045 1050 1055
Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys
1060 1065 1070
Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe
1075 1080 1085
Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1090 1095 1100
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala
1105 1110 1115 1120
Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val
1125 1130 1135
Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu
1140 1145 1150
Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1155 1160 1165
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys
1170 1175 1180
Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln
1185 1190 1195 1200
Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp
1205 1210 1215
Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1235 1240 1245
Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1250 1255 1260
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1265 1270 1275 1280
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr
1285 1290 1295
Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1300 1305 1310
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln
1315 1320 1325
Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1330 1335 1340
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1345 1350 1355 1360
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1365 1370 1375
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu
1380 1385 1390
Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1395 1400 1405
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1410 1415 1420
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1425 1430 1435 1440
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1445 1450 1455
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1475 1480 1485
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1490 1495 1500
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1505 1510 1515 1520
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr
1525 1530 1535
Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1540 1545 1550
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1555 1560 1565
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1570 1575 1580
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1585 1590 1595 1600
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1605 1610 1615
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr
1620 1625 1630
Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
1635 1640 1645
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1650 1655 1660
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1665 1670 1675 1680
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1685 1690 1695
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1715 1720 1725
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1730 1735 1740
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1745 1750 1755 1760
Gly Gly Asp

Claims (10)

1.一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法,其特征在于,包括如下步骤:
(1)、将TadA:TadA*:Cas9融合蛋白、一种或多种靶向待测DNA序列的gRNA以及基因组DNA共混后进行反应;其中,所述基因组DNA包含有待测DNA序列,在所述反应中,TadA:TadA*:Cas9融合蛋白和gRNA复合物切割与gRNA互补的待测DNA链,同时将非互补链上的腺嘌呤转变成次黄嘌呤;
(2)、在步骤(1)反应后的体系中加入内切核酸酶V切割包含次黄嘌呤的DNA,造成DNA双链断裂;
(3)、利用全基因组测序以及生物信息学分析检测腺嘌呤单碱基编辑系统的脱靶效应。
2.根据权利要求1所述的方法,其特征在于,所述TadA:TadA*:Cas9融合蛋白包括CRISPR/Cas9系统的效应蛋白结构域、腺苷脱氨酶结构域。
3.根据权利要求1所述的方法,其特征在于,所述TadA:TadA*:Cas9融合蛋白包括CRISPR/Cas9系统的效应蛋白结构域、连接多肽、腺苷脱氨酶结构域。
4.根据权利要求2-3任一权利要求所述的方法,其特征在于,所述CRISPR/Cas9系统的效应蛋白结构域中,效应蛋白包括但不限定于无切割活性或仅具有单链切割活性的Cas蛋白,所述无切割活性或仅具有单链切割活性的Cas蛋白包括StreptococcuspyogenesCas9(SpCas9),StaphylococcusaureusCas9(SaCas9),LachnospiraceaeCpf1(LbCpf1),AcidaminococcusCpf1(AsCpf1),StreptococcusthermophilusCas9(StCas9),andNeisseriameningitidis Cas9(NmCas9),FrancisellaCpf1(FnCpf1)中的一种或多种。
5.根据权利要求1-3任一权利要求所述的方法,其特征在于,所述的TadA:TadA*:Cas9融合蛋白中,腺苷脱氨酶TadA蛋白的氨基酸序列如SEQ ID NO.1所示。
6.根据权利要求1所述的方法,其特征在于,所述TadA:TadA*:Cas9融合蛋白的氨基酸序列为SEQ ID NO.2所示。
7.根据权利要求2所述的方法,其特征在于,所述TadA:TadA*:Cas9融合蛋白是利用原核表达载体在细菌中表达并纯化获得的。
8.根据权利要求3所述的方法,其特征在于,所述反应体系为溶液反应体系,所述溶液反应体系还包含所述TadA:TadA*:Cas9融合蛋白将所述非互补链上的腺嘌呤转变成次黄嘌呤所需的缓冲液组分。
9.一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的试剂盒在权利要求1所述方法中的应用,其特征在于,所述试剂盒包括权利要求1提供的靶向目的DNA的gRNA序列、TadA:TadA*:Cas9融合蛋白和/或EndoV核酸酶。
10.如权利要求1所述一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法在检测腺嘌呤单碱基编辑系统脱靶效应中的应用。
CN201811160230.9A 2018-09-30 2018-09-30 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用 Active CN109295186B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201811160230.9A CN109295186B (zh) 2018-09-30 2018-09-30 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用
PCT/CN2019/107243 WO2020063520A1 (zh) 2018-09-30 2019-09-23 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用
US17/279,124 US20210395812A1 (en) 2018-09-30 2019-09-23 Method for detecting off-target effect of adenine base editor system based on whole-genome sequencing and use thereof in gene editing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811160230.9A CN109295186B (zh) 2018-09-30 2018-09-30 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用

Publications (2)

Publication Number Publication Date
CN109295186A CN109295186A (zh) 2019-02-01
CN109295186B true CN109295186B (zh) 2023-10-03

Family

ID=65161428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811160230.9A Active CN109295186B (zh) 2018-09-30 2018-09-30 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用

Country Status (3)

Country Link
US (1) US20210395812A1 (zh)
CN (1) CN109295186B (zh)
WO (1) WO2020063520A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109295186B (zh) * 2018-09-30 2023-10-03 中山大学 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用
CA3128876A1 (en) * 2019-02-13 2020-08-20 Beam Therapeutics Inc. Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
CN110804628B (zh) * 2019-02-28 2023-05-12 中国科学院脑科学与智能技术卓越创新中心 高特异性无脱靶单碱基基因编辑工具
CN111778233B (zh) * 2019-04-04 2023-11-21 辉大(上海)生物科技有限公司 一种新型的单碱基编辑技术及其应用
WO2020199200A1 (zh) * 2019-04-04 2020-10-08 中国科学院脑科学与智能技术卓越创新中心 一种新型的单碱基编辑技术及其应用
CN110029091B (zh) * 2019-04-28 2021-03-26 王清路 Pd-1免疫检查点解除抑制的t淋巴细胞制剂的制法
CN110452929B (zh) * 2019-07-09 2021-07-20 中山大学 一种非嵌合基因编辑猪胚胎模型的构建方法
CN110551760B (zh) * 2019-08-08 2022-11-18 复旦大学 CRISPR/Sa-SeqCas9基因编辑系统及其应用
EP4028026A4 (en) * 2019-09-09 2023-09-06 Beam Therapeutics, Inc. NOVEL NUCLEOBASE EDITORS AND METHODS OF USING THE SAME
CN110669775B (zh) * 2019-09-30 2021-07-16 北京市农林科学院 差异代理技术在a·g碱基替换细胞富集中的应用
CN112725348B (zh) * 2019-10-28 2022-04-01 安徽省农业科学院水稻研究所 一种提高水稻单碱基编辑效率的基因、方法及应用
CN115279922A (zh) * 2020-03-04 2022-11-01 苏州齐禾生科生物科技有限公司 检测单碱基编辑系统随机脱靶效应的方法
CN114058607B (zh) * 2020-07-31 2024-02-27 上海科技大学 一种用于c到u碱基编辑的融合蛋白及其制备方法和应用
CN115247162B (zh) * 2021-04-27 2024-05-03 华东师范大学 一种腺嘌呤碱基编辑用融合蛋白及其应用
WO2022242739A1 (zh) * 2021-05-20 2022-11-24 北京大学 用于检测碱基编辑器编辑位点的方法和试剂盒
CN113774085B (zh) * 2021-08-20 2023-08-15 中国科学院广州生物医药与健康研究院 一种单碱基编辑工具TaC9-ABE及其应用
CN114835818B (zh) * 2022-03-17 2024-03-22 江南大学 一种基因编辑融合蛋白、其构建的腺嘌呤碱基编辑器及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160058703A (ko) * 2014-11-14 2016-05-25 기초과학연구원 유전체에서 유전자 가위의 비표적 위치를 검출하는 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102084186B1 (ko) * 2017-01-17 2020-03-03 기초과학연구원 Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
CN109295186B (zh) * 2018-09-30 2023-10-03 中山大学 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160058703A (ko) * 2014-11-14 2016-05-25 기초과학연구원 유전체에서 유전자 가위의 비표적 위치를 검출하는 방법

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Incision at hypoxanthine residues in DNA by a mammalian homologue of the Escherichia coli antimutator enzyme endonuclease V;Ane Moe 等;《Nucleic Acids Res》;20030715;第31卷(第14期);3893-3900 *
Precision genome engineering through adenine and cytosine base editing;Jin-Soo Kim;《Nature Plants》;20180331;第4卷(第3期);148–151 *
Programmable base editing of A•T to G•C in genomic DNA without DNA cleavage;Nicole M. Gaudelli等;《NATURE》;20171101;第551卷(第7681期);464-471 *
基于CRISPR/Cas9系统的OsbHLH116基因编辑及其脱靶效应分析;杜彦修等;《中国水稻科学》;20161110(第06期);577-586 *
基因组编辑脱靶研究进展;何秀斌等;《生物工程学报》;20171025(第10期);104-122 *
慢病毒介导的CRISPR/Cas9技术编辑PFF细胞BMPR-IB基因及BMPs信号通路重要基因表达分析;杨强等;《中国农业科学》;20180404(第07期);161-172 *

Also Published As

Publication number Publication date
WO2020063520A1 (zh) 2020-04-02
CN109295186A (zh) 2019-02-01
US20210395812A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
CN109295186B (zh) 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用
CN113136375B (zh) 新型CRISPR/Cas12f酶和系统
ES2955957T3 (es) Polinucleótidos de ADN/ARN híbridos CRISPR y procedimientos de uso
AU2014273085B2 (en) New compact scaffold of Cas9 in the type II CRISPR system
CN102558309B (zh) 一对转录激活子样效应因子核酸酶及其编码基因与应用
CN112538470B (zh) 一种原核生物来源的Argonaute蛋白及其应用
KR20190059966A (ko) S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드
JP2023517041A (ja) クラスiiのv型crispr系
CN106192019A (zh) 用于制备测序文库的组合物和方法
JP7361109B2 (ja) C2c1ヌクレアーゼに基づくゲノム編集のためのシステムおよび方法
CN102850444B (zh) 一对转录激活子样效应因子核酸酶l3和r1及其编码基因与应用
CN110551762B (zh) CRISPR/ShaCas9基因编辑系统及其应用
KR20240049306A (ko) Ruvc 도메인을 갖는 효소
CN114990093A (zh) 氨基酸序列小的蛋白序列mini rfx-cas13d
CN114686456A (zh) 基于双分子脱氨酶互补的碱基编辑系统及其应用
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
CN110577970B (zh) CRISPR/Sa-SlutCas9基因编辑系统及其应用
CN109943589A (zh) 一种单碱基突变方法及采用的系统
CN110551763A (zh) CRISPR/SlutCas9基因编辑系统及其应用
CN104479025A (zh) 一种组织型纤溶酶原激活剂的构建、表达纯化及功能鉴定
RU2722934C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии pasteurella pneumotropica
RU2788197C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Streptococcus uberis NCTC3858
CN116970590B (zh) 小于380个氨基酸的超级迷你型基因编辑器及其应用
RU2780677C1 (ru) Способ редактирования гена GJB2 для исправления патогенного варианта c.del35G в клетках человека, культивируемых in vitro
RU2722933C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии demequina sediminicola

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant