改进的基因组编辑方法
技术领域
本发明涉及基因工程领域。具体而言,本发明涉及一种改进的基因组编辑系统和方法,其具有高特异性,并且能获得稳定的突变类型。
背景技术
基因组编辑技术是基于特异性核酸酶对基因组进行靶向修饰的基因工程技术,在农业和医学研究中发挥着越来越强大的作用。成簇的规律间隔的短回文重复序列及其相关系统(Clustered regularly interspaced short palindromic repeats/CRISPRassociated)是目前使用最广泛的基因组编辑工具,因其高效率、使用简单,在全球范围内引起了基因编辑领域的革命。
CRISPR/Cas9系统虽然有较高的基因定点修饰效率,但是由于同源重组效率较低,基因组单碱基的突变效率仍然较低。哈佛大学David Liu团队的Komor等将CRISPR/Cas9和胞嘧啶脱氨酶结合,创造了单碱基编辑系统,该系统可以实现定点C至T的高效替换[1]。此后,各种基于脱氨酶的单碱基编辑系统也层出不穷,常兴等人建立的TAM(targeted AID-mediated mutagenesis)利用人源胞嘧啶脱氨酶融合dCas9(dCas9-AIDx),也可以达到单碱基编辑的目的[2]。Keiji Nishida等将来源于七鳃鳗的胞嘧啶脱氨酶与Cas9蛋白和UGI融合,在哺乳动物细胞中实现了约15%~55%的靶向突变[3]。斯坦福大学的科学家将胞嘧啶脱氨酶融合到MS2蛋白上,创造了CRISPR-X系统,也可以得到较高的单碱基突变效率[4]。
基于CRISPR的单碱基编辑系统,其可以在特定的靶序列处导致少至一个碱基的替换,但是靶序列长度并不发生改变,即,靶序列突变后与突变前长度相同,仅存在一个或多个碱基的差异。由于CRISPR系统自身存在脱靶的可能,CRISPR核酸酶可以结合与gRNA存在一定差异的靶位点,并产生编辑。所以,在原有的gRNA协助下,单碱基编辑系统仍有可能识别发生碱基替换之后的靶位点,并进一步实施碱基替换。这带来的潜在风险是突变类型不能稳定存在。这样的风险在其它基因组编辑系统中同样存在。
因此,本领域仍需要新的基因组编辑系统和方法,其具有高特异性,并且能获得稳定的突变类型。
发明简述
在一方面,本发明提供一种用于对细胞基因组中的至少一个基因组靶序列进行定点修饰的基因组编辑系统,其包含:
1)包含gRNA的编码序列的表达构建体,所述gRNA靶向所述至少一个基因组靶序列;
2)包含CRISPR核酸酶编码序列的表达构建体;和
3)包含gRNA编码序列的表达构建体,所述gRNA靶向所述CRISPR核酸酶编码序列中的靶序列,
其中在导入细胞后,靶向所述至少一个基因组靶序列的gRNA指导所述CRISPR核酸酶靶向所述至少一个靶序列并导致所述靶序列中的一个或多个突变,靶向所述CRISPR核酸酶编码序列中的靶序列的gRNA指导所述CRISPR核酸酶靶向所述CRISPR核酸酶编码序列中的靶序列并导致所述CRISPR核酸酶的失活突变。
在另一方面,本发明提供了一种修饰细胞基因组中至少一个基因组靶序列的方法,包括将本发明的基因组编辑系统导入所述细胞。
在另一方面,本发明还提一种产生经遗传修饰的细胞的方法,包括将本发明的基因组编辑系统导入细胞中。
在另一方面,本发明还提供经遗传修饰的生物体,其包含通过本发明的方法产生的经遗传修饰的细胞或其后代。
在仍另一方面,本发明还包括用于本发明的方法的试剂盒,该试剂盒包括本发明的基因组编辑系统,以及使用说明。
附图描述
图1:水稻OsWxb基因单碱基突变体的遗传分析。
图2:pSU-PBE的工作原理。
图3:APOBEC1-nCas9蛋白的表达分析。
发明详述
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学、免疫学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。例如,本发明中使用的标准重组DNA和分子克隆技术为本领域技术人员熟知,并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,MolecularCloning:A Laboratory Manual;Cold Spring Harbor Laboratory Press:Cold SpringHarbor,1989(下文称为“Sambrook”)。
在一方面,本发明提供了一种用于对细胞基因组中的至少一个基因组靶序列进行定点修饰的基因组编辑系统,其包含:
1)包含gRNA的编码序列的表达构建体,所述gRNA靶向所述至少一个基因组靶序列;
2)包含CRISPR核酸酶编码序列的表达构建体;和
3)包含gRNA编码序列的表达构建体,所述gRNA靶向所述CRISPR核酸酶编码序列中的靶序列,
其中在导入细胞后,靶向所述至少一个基因组靶序列的gRNA指导所述CRISPR核酸酶靶向所述至少一个靶序列并导致所述靶序列中的一个或多个突变,靶向所述CRISPR核酸酶编码序列中的靶序列的gRNA指导所述CRISPR核酸酶靶向所述CRISPR核酸酶编码序列中的靶序列并导致所述CRISPR核酸酶的失活突变。例如,所述失活突变是使所述CRISPR核酸酶翻译提前终止的突变。
本发明人发现,将基于CRISPR核酸酶的基因组编辑系统导入细胞中并实现靶序列中的突变之后,如果该基因组编辑系统在细胞中仍然具有活性(例如CRISPR核酸酶或gRNA的编码序列整合进基因组并持续表达),其仍会对已经突变的靶序列进行进一步的编辑,从而改变靶序列的突变类型,造成所获得细胞或生物体的突变类型不稳定;或者,由于基因组编辑系统的持续活性,脱靶的可能性大大增加。
特别是对于基于CRISPR的单碱基编辑系统,其可以在特定的靶序列处导致少至一个碱基的替换,但是靶序列长度并不发生改变,即,靶序列突变后与突变前长度相同,仅存在一个或多个碱基的差异。由于CRISPR系统自身存在脱靶的可能,CRISPR核酸酶可以结合与gRNA存在一定差异的靶位点,并产生编辑。所以,在原有的gRNA协助下,单碱基编辑系统仍有可能识别发生碱基替换之后的靶位点,并进一步实施碱基替换。这带来的潜在风险是:突变类型不能稳定存在。
然而,本发明人令人惊奇地发现,通过在基因组编辑系统中添加靶向所述CRISPR核酸酶编码序列的gRNA,使细胞中的CRISPR核酸酶在编辑靶序列之后还靶向自身编码序列,造成自身的失活(不再表达或表达无编辑活性的版本),可以防止已经突变的靶序列的进一步编辑,同时提高编辑的特异性。
如本文所用,术语“CRISPR核酸酶”通常指在天然存在的CRISPR系统中存在的核酸酶,以及其修饰形式、其突变体(包括切口酶突变体、失活突变体)、其催化活性片段或它们与其它功能性蛋白的融合物。CRISPR核酸酶可以通过与crRNA和任选的tracrRNA或与人工gRNA一起相互作用来识别和/或切割靶核酸结构。该术语涵盖基于CRISPR系统的能够在细胞内实现基因组编辑(包括碱基编辑)的任何核酸酶。
在一些实施方式中,所述CRISPR核酸酶包括Cas9核酸酶或其变体。所述Cas9核酸酶可以是来自不同物种的Cas9核酸酶,例如来自化脓链球菌(S.pyogenes)的spCas9。
在一些实施方式中,所述Cas9核酸酶变体包括Cas9核酸酶的高特异性变体,例如Feng Zhang等人的Cas9核酸酶变体eSpCas9(1.0)(K810A/K1003A/R1060A)、eSpCas9(1.1)(K848A/K1003A/R1060A),以及J.Keith Joung等人开发的Cas9核酸酶变体SpCas9-HF1(N497A/R661A/Q695A/Q926A)。
在一些实施方式中,所述Cas9核酸酶变体包括Cas9切口酶(nCas9),其中Cas9核酸酶的DNA切割结构域中的两个亚结构域(HNH核酸酶亚结构域和RuvC亚结构域)之一被失活而形成切口酶。
在一些实施方式中,所述CRISPR核酸酶包括Cpf1核酸酶或其变体例如高特异性变体。所述Cpf1核酸酶可以是来自不同物种的Cpf1核酸酶,例如来自Francisella novicidaU112、Acidaminococcus sp.BV3L6和Lachnospiraceae bacterium ND2006的Cpf1核酸酶。
在一些实施方式中,所述CRISPR核酸酶还包括缺失DNA切割活性的CRISPR核酸酶和脱氨酶的融合蛋白,本文也称为“单碱基编辑CRISPR核酸酶”。
如本发明所用,“缺失DNA切割活性的CRISPR核酸酶”包括但不限于Cas9切口核酸酶(nCas9)、核酸酶死亡的Cas9核酸酶(dCas9)或核酸酶死亡的Cpf1核酸酶(dCpf1)。核酸酶死亡的Cas9核酸酶(dCas9)或核酸酶死亡的Cpf1核酸酶(dCpf1)完全缺失DNA切割活性。本领域已知多种缺失DNA切割活性的CRISPR核酸酶。
如本发明所用,“脱氨酶”是指催化脱氨基反应的酶。在本发明一些实施方式中,所述脱氨酶指的是胞嘧啶脱氨酶,其能够接受单链DNA作为底物并能够催化胞苷或脱氧胞苷分别脱氨化为尿嘧啶或脱氧尿嘧啶。在本发明一些实施方式中,所述脱氨酶指的是腺嘌呤脱氨酶,其能够接受单链DNA作为底物并能够催化腺苷或脱氧腺苷(A)形成肌苷(I)。通过使用缺失DNA切割活性的CRISPR核酸酶与脱氨酶的融合蛋白(“单碱基编辑CRISPR核酸酶”),可以实现靶DNA序列中的碱基编辑,例如C至T的转换或A至G的转换。本领域已知多种合适的接受单链DNA作为底物的胞嘧啶脱氨酶或腺嘌呤脱氨酶,例如APOBEC1脱氨酶、激活诱导的胞苷脱氨酶(AID)、APOBEC3G、CDA1,或者例如Nicloe M.Gaudelli等人,doi:10.1038/nature24644,2017所公开的DNA依赖型腺嘌呤脱氨酶。
如本文所用,“gRNA”和“向导RNA”可互换使用,指的是能够与CRISPR核酸酶形成复合物并由于与靶序列具有一定互补性而能够将所述复合物靶向靶序列的RNA分子。例如,在基于Cas9的基因编辑系统中,gRNA通常由部分互补形成复合物的crRNA和tracrRNA分子构成,其中crRNA包含与靶序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物(Cas9+crRNA+tracrRNA)与该靶序列序列特异性地结合的序列。然而,本领域已知可以设计单向导RNA(sgRNA),其同时包含crRNA和tracrRNA的特征。而在基于Cpf1的基因组编辑系统中,gRNA通常仅由成熟crRNA分子构成,其中crRNA包含的序列与靶序列具有足够相同性以便与靶序列的互补序列杂交并且指导复合物(Cpf1+crRNA)与该靶序列序列特异性结合。基于所使用的CRISPR核酸酶和待编辑的靶序列设计合适的gRNA属于本领域技术人员的能力范围内。
在本发明一具体实施方式中,所述CRISPR核酸酶是APOBEC1-nCas9,其是APOBEC1脱氨酶和Cas9切口酶(nCas9)的融合蛋白。在一些实施方式中,所述APOBEC1-nCas9具有SEQID NO:1的氨基酸序列。
在一些实施方式中,为了适于设计合适的gRNA,所述CRISPR核酸酶的编码序列在不改变表达产物的情况下被修饰以引入PAM序列和/或待突变位点,所述待突变位点被突变后能够造成所述CRISPR核酸酶的失活。例如,可以在“单碱基编辑CRISPR核酸酶”的编码序列中包含一或多个C,在使得当其中一或多个C被单碱基编辑为T时,能够形成一个或多个终止密码子,使此单碱基编辑CRISPR核酸酶的翻译发生终止,从而阻止继续产生有功能的单碱基编辑CRISPR核酸酶。
例如,在一些具体实施方式中,所述APOBEC1-nCas9的编码核苷酸序列示于SEQ IDNO:2。相应地,针对所述APOBEC1-nCas9编码序列的gRNA识别(靶向)SEQ ID NO:3所示序列。
“基因组”如本文所用不仅涵盖存在于细胞核中的染色体DNA,而且还包括存在于细胞的亚细胞组分(如线粒体、质体)中的细胞器DNA。
如本发明所用,“表达构建体”是指适于感兴趣的核苷酸序列在细胞或生物体中表达的载体如重组载体。“表达”指功能产物的产生。例如,核苷酸序列的表达可指核苷酸序列的转录(如转录生成mRNA或功能RNA)和/或RNA翻译成前体或成熟蛋白质。本发明的“表达构建体”可以是线性的核酸片段、环状质粒、病毒载体。本发明的“表达构建体”可包含不同来源的调控序列和感兴趣的核苷酸序列,或相同来源但以不同于通常天然存在的方式排列的调控序列和感兴趣的核苷酸序列。“调控序列”和“调控元件”可互换使用,指位于编码序列的上游(5'非编码序列)、中间或下游(3'非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
本发明可使用的启动子的实例包括但不限于聚合酶(pol)I、pol II或pol III启动子。pol I启动子的实例包括鸡RNA pol I启动子。pol II启动子的实例包括但不限于巨细胞病毒立即早期(CMV)启动子、劳斯肉瘤病毒长末端重复(RSV-LTR)启动子和猿猴病毒40(SV40)立即早期启动子。pol III启动子的实例包括U6和H1启动子。可以使用诱导型启动子如金属硫蛋白启动子。启动子的其他实例包括T7噬菌体启动子、T3噬菌体启动子、β-半乳糖苷酶启动子和Sp6噬菌体启动子。当用于植物时,启动子可以是花椰菜花叶病毒35S启动子、玉米Ubi-1启动子、小麦U6启动子、水稻U3启动子、玉米U3启动子、水稻肌动蛋白启动子。
本发明的“表达构建体”还可以包含用于对转化的细胞或生物体进行筛选的可选择标记,例如抗生素抗性标记、除草剂抗性标记等。
在本发明中,针对所述至少一个基因组靶序列的gRNA的编码序列、所述CRISPR核酸酶的编码序列和针对所述CRISPR核酸酶的gRNA的编码序列可以各自构建于单独的表达构建体中,或者可以任意组合地构建于同一构建体中。例如,如果存在多个待编辑的基因组靶序列,针对这些靶序列的gRNA编码序列可以构建于同一个表达构建体。或者,例如针对基因组靶序列的gRNA编码序列可以和针对CRISPR核酸酶的gRNA的编码序列构建于同一个表达构建体中。构建用于表达多个gRNA的表达构建体的方法是本领域已知的。
可通过本发明的系统进行基因组编辑的细胞优选是真核生物细胞,包括但不限于,哺乳动物细胞如人、小鼠、大鼠、猴、犬、猪、羊、牛、猫;家禽如鸡、鸭、鹅的细胞;植物细胞包括单子叶植物细胞和双子叶植物细胞,例如水稻、玉米、小麦、高粱、大麦、大豆、花生、拟南芥等的细胞。在本发明的一些优选实施方案中,所述细胞是植物细胞。
在另一方面,本发明提供了一种修饰细胞基因组中至少一个基因组靶序列的方法,包括将本发明的基因组编辑系统导入所述细胞。
将本发明的基因组编辑系统的表达构建体“导入”细胞是指用所述构建体转化细胞,使得所述构建体在细胞中能够发挥功能(如表达CRSPR核酸酶和/或转录生成gRNA)。本发明所用的“转化”优选指的是稳定转化。“稳定转化”指将外源核苷酸序列导入基因组中,导致外源基因稳定遗传。一旦稳定转化,外源核酸序列稳定地整合进所述生物体和其任何连续世代的基因组中。在一些实施方案中,通过表达构建体上的可选择标记筛选稳定转化的细胞。
可用于将本发明的基因组编辑系统导入细胞的方法包括但不限于:磷酸钙转染、原生质融合、电穿孔、脂质体转染、微注射、病毒感染(如杆状病毒、痘苗病毒、腺病毒、腺相关病毒、慢病毒和其他病毒)、基因枪法、PEG介导的原生质体转化、土壤农杆菌介导的转化。
在本发明中,细胞基因组中的所述靶序列可以位于基因组的任何位置,例如位于功能基因如蛋白编码基因内,或者例如可以位于基因表达调控区如启动子区或增强子区,从而实现对所述基因功能修饰或对基因表达的修饰。可以通过T7EI、PCR/RE或测序方法检测所述细胞基因组靶序列中的突变。所述突变例如是一或多个核苷酸的取代、缺失和添加。
在另一方面,本发明还提一种产生经遗传修饰的细胞的方法,包括将本发明的基因组编辑系统导入细胞中。
在另一方面,本发明还提供经遗传修饰的生物体,其包含通过本发明的方法产生的经遗传修饰的细胞或其后代。
如本文所用,“经遗传修饰的生物体”或“经遗传修饰的细胞”意指在其基因组内包含外源多核苷酸或修饰的基因或表达调控序列的生物体或细胞。例如外源多核苷酸能够稳定地整合进生物体或细胞的基因组中,并遗传连续的世代。外源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。修饰的基因或表达调控序列为在生物体或细胞基因组中所述序列包含单个或多个脱氧核苷酸取代、缺失和添加。针对序列而言的“外源”意指来自外来物种的序列,或者如果来自相同物种,则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座的显著改变的序列。
如本文所用,“生物体”包括适于基因组编辑的任何生物体,优选真核生物。生物体的实例包括但不限于,哺乳动物如人、小鼠、大鼠、猴、犬、猪、羊、牛、猫;家禽如鸡、鸭、鹅;植物包括单子叶植物和双子叶植物,例如水稻、玉米、小麦、高粱、大麦、大豆、花生、拟南芥等。
在植物的基因组编辑操作中,优选将表达用于基因组编辑的各组分的构建体整合进基因组中,便于通过构建体的可选择标记对转化的植物进行筛选,提高获得基因组编辑植物的效率。然而,由于CRSPR核酸酶和/或gRNA的编码序列整合进植物基因组,其将在后续世代中均具有持续活性,存在对已经编辑(特别是单碱基编辑)的靶序列再进一步编辑的风险,以及具有较高的脱靶效应。因此,本发明的系统和方法特别适合于对植物进行遗传修饰(例如基因组编辑),因为CRSPR核酸酶在完成对靶序列的编辑之后将被失活。因此,在本发明的一些优选实施方案中,所述细胞是植物细胞。在本发明的一些优选实施方案中,所述生物体是植物。
在仍另一方面,本发明还包括用于本发明的方法的试剂盒,该试剂盒包括本发明的基因组编辑系统,以及使用说明。试剂盒一般包括表明试剂盒内容物的预期用途和/或使用方法的标签。术语标签包括在试剂盒上或与试剂盒一起提供的或以其他方式随试剂盒提供的任何书面的或记录的材料。
实施例
下面将通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所描述的实施例范围中。
实施例1、APOBEC1-nCas9能够靶向已发生单碱基突变的位点,并再次导致单碱基编辑
本发明人通过设计单个sgRNA,对水稻的Wxb基因上的靶位点进行单碱基编辑(见图1)。单碱基编辑利用APOBEC1-nCas9(SEQ ID NO:1)进行。其中sgRNA编码序列和APOBEC1-nCas9编码序列(SEQ ID NO:4所示)整合进水稻基因组中。
T0植物中鉴定发现一株突变体T0-4,在Wxb的两个等位基因座上,均发生突变:其中一个等位基因座在靶位点第三位的C突变为T;另一等位基因座在靶位点第三位和第五位的两个C均突变为T。
然而,对该突变体的T1植株进行基因型鉴定,令人惊奇地发现一些植株的突变类型发生了改变。例如,在其中一株植物T1-4中发现一个等位基因座处,三个C突变为T,而且未检测出T0代中单个C被突变的类型。说明,在传代过程中,原有的sgRNA仍能够介导APOBEC1-nCas9作用于已发生碱基替换的位点。
实施例2、不完全匹配的sgRNA能够指导APOBEC1-nCas9完成碱基编辑
为了进一步证明编辑后的靶位点,仍可能被原有的sgRNA识别并发生单碱基编辑,发明人设计了一套预测为错配的sgRNA进行验证。
水稻OsALS2基因的一段靶序列中存在多个串联的C。发明人设计了多个sgRNA,每个sgRNA中均有一个碱基不能与基因组靶序列的对应位点配对。利用农杆菌转化法将APOBEC1-nCas9表达构建体和各sgRNA的表达构建体共转化入植物,并通过可选择标记对植物进行筛选。结果在筛选出的T0代依然存在很高的突变效率。这说明,错配的sgRNA依然能够指导APOBEC1-nCas9进行单碱基编辑。
表1:非精确sgRNA介导的单碱基编辑效率
实施例3、新型单碱基编辑体系的建立
首先APOBEC1-nCas9融合蛋白在DNA水平上做了重编码(SEQ ID NO:2):将三个精氨酸密码子都设定为CGA;将之后的一个精氨酸密码子设定为AGG,创造出一个PAM位点。设计一个sgRNA,识别图2中所示的靶序列(SEQ ID NO:3)。任意一个CGA密码子中的C突变为T都能终止nCas9蛋白的翻译,使其不能产生有功能的融合蛋白。我们将这套载体(包括改造的APOBEC1-nCas9载体和对应的sgRNA载体)命名为pSU-PBE。pSU-PBE的工作原理见图2。其中黑框标识的是PAM位点,下划线标识的是nCas9基因上sgRNA所针对的靶序列。
实施例4、新型单碱基编辑系统能够得到基因组靶位点发生编辑并且BE3完全失活的植株
利用pSU-PBE系统加上基因特异性sgRNA表达载体编辑水稻OsALS2基因和OsNRT1.1B。突变效率如表2所示。当APOBEC1-nCas9突变纯合,并且靶位点有突变时,即可获得在T1代中突变类型稳定遗传的植物,在两个基因位点的突变效率均较高,分别是13.79%、15.7%。
按照常规操作选择三株SU系统得到的转基因植物提取植物蛋白,使用abcam公司的Cas9蛋白抗体Anti-CRISPR-Cas9antibody(ab204448)进行western blot实验。内参为Actin。如图3所示,第一及第三株植物中APOBEC1-nCas9没有发生突变(第一、三泳道),第二株植物为APOBEC1-nCas9点突变纯合体(第二泳道),其中APOBEC1-nCas9蛋白不表达。
表2:pSU-PBE系统的编辑效率
参考文献
[1]Komor AC,Kim YB,Packer MS,Zuris JA,Liu DR.Programmable editing ofa target base in genomic DNA without double-stranded DNA cleavage.Nature,2016,533(7603):420–424。
[2]Ma YQ,Zhang JY,Yin WJ,Zhang ZC,Song Y,Chang X.Targeted AID-mediated mutagenesis(TAM)enables efficient genomic diversification inmammalian cells.Nat Methods,2016,13(12):1029–1035。
[3]Nishida K,Arazoe T,Yachie N,Banno S,Kakimoto M,Tabata M,MochizukiM,Miyabe A,Araki M,Hara KY,Shimatani Z,Kondo A.Targeted nucleotide editingusing hybrid prokaryotic and vertebrate adaptive immune systems.Science,2016,353(6305):aaf8729。
[4]Hess GT,Frésard L,Han K,Lee CH,Li A,Cimprich KA,Montgomery SB,Bassik MC.Directed evolution usingdCas9-targeted somatic hypermutation inmammalian cells.Nat Methods,2016:13(12):1036–1042。
序列表
<110> 中国科学院遗传与发育生物学研究所
<120> 改进的基因组编辑方法
<130> 150428
<150> CN201810101165.6
<151> 2018-02-01
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 1736
<212> PRT
<213> Artificial Sequence
<220>
<223> APOBEC1-nCas9
<400> 1
Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val
1 5 10 15
Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe
20 25 30
Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile
35 40 45
Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr
50 55 60
Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg
65 70 75 80
Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp
85 90 95
Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg
100 105 110
Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His
115 120 125
Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly
130 135 140
Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg
145 150 155 160
Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr
165 170 175
Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile
180 185 190
Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln
195 200 205
Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu
210 215 220
Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr
225 230 235 240
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Leu Lys Asp Lys Lys Tyr
245 250 255
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
260 265 270
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
275 280 285
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
290 295 300
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
305 310 315 320
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
325 330 335
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
340 345 350
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
355 360 365
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
370 375 380
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
385 390 395 400
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
405 410 415
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
420 425 430
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
435 440 445
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
450 455 460
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
465 470 475 480
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser
485 490 495
Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp
500 505 510
Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn
515 520 525
Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala
530 535 540
Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn
545 550 555 560
Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr
565 570 575
Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln
580 585 590
Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn
595 600 605
Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr
610 615 620
Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu
625 630 635 640
Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe
645 650 655
Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala
660 665 670
Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg
675 680 685
Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly
690 695 700
Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
705 710 715 720
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly
725 730 735
Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn
740 745 750
Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr
755 760 765
Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly
770 775 780
Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val
785 790 795 800
Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys
805 810 815
Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser
820 825 830
Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu
835 840 845
Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
850 855 860
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg
865 870 875 880
Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp
885 890 895
Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg
900 905 910
Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys
915 920 925
Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe
930 935 940
Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
945 950 955 960
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala
965 970 975
Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val
980 985 990
Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu
995 1000 1005
Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys
1010 1015 1020
Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly
1025 1030 1035
Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu
1040 1045 1050
Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
1055 1060 1065
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
1070 1075 1080
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu
1085 1090 1095
Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
1100 1105 1110
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys
1115 1120 1125
Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
1130 1135 1140
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly
1145 1150 1155
Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
1160 1165 1170
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
1175 1180 1185
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu
1190 1195 1200
Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg
1205 1210 1215
Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His
1220 1225 1230
His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu
1235 1240 1245
Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp
1250 1255 1260
Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln
1265 1270 1275
Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile
1280 1285 1290
Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile
1295 1300 1305
Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1310 1315 1320
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu
1325 1330 1335
Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr
1340 1345 1350
Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp
1355 1360 1365
Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly
1370 1375 1380
Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala
1385 1390 1395
Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu
1400 1405 1410
Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn
1415 1420 1425
Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys
1430 1435 1440
Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu
1445 1450 1455
Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys
1460 1465 1470
Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr
1475 1480 1485
Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn
1490 1495 1500
Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp
1505 1510 1515
Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu
1520 1525 1530
Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
1535 1540 1545
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1550 1555 1560
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe
1565 1570 1575
Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val
1580 1585 1590
Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu
1595 1600 1605
Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala
1610 1615 1620
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Thr Arg Asp
1625 1630 1635
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr
1640 1645 1650
Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
1655 1660 1665
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu
1670 1675 1680
Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu
1685 1690 1695
Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile
1700 1705 1710
Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly
1715 1720 1725
Ser Pro Lys Lys Lys Arg Lys Val
1730 1735
<210> 2
<211> 5211
<212> DNA
<213> Artificial Sequence
<220>
<223> APOBEC1-nCas9 encoding sequence variant
<400> 2
atgccgaaga agaagcgcaa ggtgtccagc gagacgggcc cagtggctgt cgacccaacg 60
ctgcgcaggc gcatcgagcc gcacgagttc gaggtcttct tcgaccccag ggagctgcgc 120
aaggagacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180
accagccaga acacgaacaa gcacgtggag gtcaacttca tcgagaagtt caccacggag 240
aggtacttct gcccgaacac ccgctgctcc atcacgtggt tcctgtcctg gagcccctgc 300
ggcgagtgct ccagggcgat caccgagttc ctcagccgct acccgcacgt gacgctgttc 360
atctacatcg ctaggctcta ccaccacgct gaccccagga acaggcaggg cctccgcgac 420
ctgatctcca gcggcgtgac catccagatc atgacggagc aggagtccgg ctactgctgg 480
aggaacttcg tcaactactc cccaagcaac gaggctcact ggccgaggta cccacacctc 540
tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc gccctgcctc 600
aacatcctga ggcgcaagca gccccagctg accttcttca cgatcgccct ccagagctgc 660
cactaccaga ggctcccacc acacatcctg tgggcgaccg gcctcaagtc cggcagcgag 720
acgccaggca cgtccgagag cgctacgcca gagctgaagg acaagaagta ctcgatcggc 780
ctcgccattg ggactaactc tgttggctgg gccgtgatca ccgacgagta caaggtgccc 840
tcaaagaagt tcaaggtcct gggcaacacc gatcggcatt ccatcaagaa gaatctcatt 900
ggcgctctcc tgttcgacag cggcgagacg gctgaggcta cgcggctcaa gcgcaccgct 960
cgacgacgat atacgagaag gaagaatcgc atctgctacc tgcaggagat tttctccaac 1020
gagatggcga aggttgacga ttctttcttc cacaggctgg aggagtcatt cctcgtggag 1080
gaggataaga agcacgagcg gcatccaatc ttcggcaaca ttgtcgacga ggttgcctac 1140
cacgagaagt accctacgat ctaccatctg cggaagaagc tcgtggactc cacagataag 1200
gcggacctcc gcctgatcta cctcgctctg gcccacatga ttaagttcag gggccatttc 1260
ctgatcgagg gggatctcaa cccggacaat agcgatgttg acaagctgtt catccagctc 1320
gtgcagacgt acaaccagct cttcgaggag aaccccatta atgcgtcagg cgtcgacgcg 1380
aaggctatcc tgtccgctag gctctcgaag tctcggcgcc tcgagaacct gatcgcccag 1440
ctgccgggcg agaagaagaa cggcctgttc gggaatctca ttgcgctcag cctggggctc 1500
acgcccaact tcaagtcgaa tttcgatctc gctgaggacg ccaagctgca gctctccaag 1560
gacacatacg acgatgacct ggataacctc ctggcccaga tcggcgatca gtacgcggac 1620
ctgttcctcg ctgccaagaa tctgtcggac gccatcctcc tgtctgatat tctcagggtg 1680
aacaccgaga ttacgaaggc tccgctctca gcctccatga tcaagcgcta cgacgagcac 1740
catcaggatc tgaccctcct gaaggcgctg gtcaggcagc agctccccga gaagtacaag 1800
gagatcttct tcgatcagtc gaagaacggc tacgctgggt acattgacgg cggggcctct 1860
caggaggagt tctacaagtt catcaagccg attctggaga agatggacgg cacggaggag 1920
ctgctggtga agctcaatcg cgaggacctc ctgaggaagc agcggacatt cgataacggc 1980
agcatcccac accagattca tctcggggag ctgcacgcta tcctgaggag gcaggaggac 2040
ttctaccctt tcctcaagga taaccgcgag aagatcgaga agattctgac tttcaggatc 2100
ccgtactacg tcggcccact cgctaggggc aactcccgct tcgcttggat gacccgcaag 2160
tcagaggaga cgatcacgcc gtggaacttc gaggaggtgg tcgacaaggg cgctagcgct 2220
cagtcgttca tcgagaggat gacgaatttc gacaagaacc tgccaaatga gaaggtgctc 2280
cctaagcact cgctcctgta cgagtacttc acagtctaca acgagctgac taaggtgaag 2340
tatgtgaccg agggcatgag gaagccggct ttcctgtctg gggagcagaa gaaggccatc 2400
gtggacctcc tgttcaagac caaccggaag gtcacggtta agcagctcaa ggaggactac 2460
ttcaagaaga ttgagtgctt cgattcggtc gagatctctg gcgttgagga ccgcttcaac 2520
gcctccctgg ggacctacca cgatctcctg aagatcatta aggataagga cttcctggac 2580
aacgaggaga atgaggatat cctcgaggac attgtgctga cactcactct gttcgaggac 2640
cgggagatga tcgaggagcg cctgaagact tacgcccatc tcttcgatga caaggtcatg 2700
aagcagctca agaggaggag gtacaccggc tgggggaggc tgagcaggaa gctcatcaac 2760
ggcattcggg acaagcagtc cgggaagacg atcctcgact tcctgaagag cgatggcttc 2820
gcgaaccgca atttcatgca gctgattcac gatgacagcc tcacattcaa ggaggatatc 2880
cagaaggctc aggtgagcgg ccagggggac tcgctgcacg agcatatcgc gaacctcgct 2940
ggctcgccag ctatcaagaa ggggattctg cagaccgtga aggttgtgga cgagctggtg 3000
aaggtcatgg gcaggcacaa gcctgagaac atcgtcattg agatggcccg ggagaatcag 3060
accacgcaga agggccagaa gaactcacgc gagaggatga agaggatcga ggagggcatt 3120
aaggagctgg ggtcccagat cctcaaggag cacccggtgg agaacacgca gctgcagaat 3180
gagaagctct acctgtacta cctccagaat ggccgcgata tgtatgtgga ccaggagctg 3240
gatattaaca ggctcagcga ttacgacgtc gatcatatcg ttccacagtc attcctgaag 3300
gatgactcca ttgacaacaa ggtcctcacc aggtcggaca agaaccgggg caagtctgat 3360
aatgttcctt cagaggaggt cgttaagaag atgaagaact actggcgcca gctcctgaat 3420
gccaagctga tcacgcagcg gaagttcgat aacctcacaa aggctgagag gggcgggctc 3480
tctgagctgg acaaggcggg cttcatcaag aggcagctgg tcgagacacg gcagatcact 3540
aagcacgttg cgcagattct cgactcacgg atgaacacta agtacgatga gaatgacaag 3600
ctgatccgcg aggtgaaggt catcaccctg aagtcaaagc tcgtctccga cttcaggaag 3660
gatttccagt tctacaaggt tcgggagatc aacaattacc accatgccca tgacgcgtac 3720
ctgaacgcgg tggtcggcac agctctgatc aagaagtacc caaagctcga gagcgagttc 3780
gtgtacgggg actacaaggt ttacgatgtg aggaagatga tcgccaagtc ggagcaggag 3840
attggcaagg ctaccgccaa gtacttcttc tactctaaca ttatgaattt cttcaagaca 3900
gagatcactc tggccaatgg cgagatccgg aagcgccccc tcatcgagac gaacggcgag 3960
acgggggaga tcgtgtggga caagggcagg gatttcgcga ccgtcaggaa ggttctctcc 4020
atgccacaag tgaatatcgt caagaagaca gaggtccaga ctggcgggtt ctctaaggag 4080
tcaattctgc ctaagcggaa cagcgacaag ctcatcgccc gcaagaagga ctgggatccg 4140
aagaagtacg gcgggttcga cagccccact gtggcctact cggtcctggt tgtggcgaag 4200
gttgagaagg gcaagtccaa gaagctcaag agcgtgaagg agctgctggg gatcacgatt 4260
atggagcgct ccagcttcga gaagaacccg atcgatttcc tggaggcgaa gggctacaag 4320
gaggtgaaga aggacctgat cattaagctc cccaagtact cactcttcga gctggagaac 4380
ggcaggaagc ggatgctggc ttccgctggc gagctgcaga aggggaacga gctggctctg 4440
ccgtccaagt atgtgaactt cctctacctg gcctcccact acgagaagct caagggcagc 4500
cccgaggaca acgagcagaa gcagctgttc gtcgagcagc acaagcatta cctcgacgag 4560
atcattgagc agatttccga gttctccaag cgcgtgatcc tggccgacgc gaatctggat 4620
aaggtcctct ccgcgtacaa caagcaccgc gacaagccaa tcagggagca ggctgagaat 4680
atcattcatc tcttcaccct gacgaacctc ggcgcccctg ctgctttcaa gtacttcgac 4740
acaactatcg atcgcaagag gtacacaagc actaaggagg tcctggacgc gaccctcatc 4800
caccagtcga ttaccggcct ctacgagacg cgcatcgacc tgtctcagct cgggggcgac 4860
aagcggccag cggcgacgaa gaaggcgggg caggcgaaga agaagaagac ccgcgactcc 4920
ggcggcagca cgaacctctc cgacatcatc gagaaggaga cgggcaagca gctcgtgatc 4980
caggagagca tcctcatgct gccggaggag gtggaggagg tcatcggcaa caagcccgag 5040
tccgacatcc tcgtgcacac cgcctacgac gagtccacgg acgagaacgt catgctcctg 5100
acgagcgacg ctccagagta caagccatgg gctctcgtga tccaggacag caacggcgag 5160
aacaagatca agatgctgtc cggcggctcc ccgaagaaga agcgcaaggt c 5211
<210> 3
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> target sequence
<400> 3
ctcgacgacg atatacgaga agg 23
<210> 4
<211> 4764
<212> DNA
<213> Artificial Sequence
<220>
<223> APOBEC1-nCas9 encoding sequence
<400> 4
atgacggagc aggagtccgg ctactgctgg aggaacttcg tcaactactc cccaagcaac 60
gaggctcact ggccgaggta cccacacctc tgggtgcgcc tctacgtgct cgagctgtac 120
tgcatcatcc tcggcctgcc gccctgcctc aacatcctga ggcgcaagca gccccagctg 180
accttcttca cgatcgccct ccagagctgc cactaccaga ggctcccacc acacatcctg 240
tgggcgaccg gcctcaagtc cggcagcgag acgccaggca cgtccgagag cgctacgcca 300
gagctgaagg acaagaagta ctcgatcggc ctcgccattg ggactaactc tgttggctgg 360
gccgtgatca ccgacgagta caaggtgccc tcaaagaagt tcaaggtcct gggcaacacc 420
gatcggcatt ccatcaagaa gaatctcatt ggcgctctcc tgttcgacag cggcgagacg 480
gctgaggcta cgcggctcaa gcgcaccgcc cgcaggcggt acacgcgcag gaagaatcgc 540
atctgctacc tgcaggagat tttctccaac gagatggcga aggttgacga ttctttcttc 600
cacaggctgg aggagtcatt cctcgtggag gaggataaga agcacgagcg gcatccaatc 660
ttcggcaaca ttgtcgacga ggttgcctac cacgagaagt accctacgat ctaccatctg 720
cggaagaagc tcgtggactc cacagataag gcggacctcc gcctgatcta cctcgctctg 780
gcccacatga ttaagttcag gggccatttc ctgatcgagg gggatctcaa cccggacaat 840
agcgatgttg acaagctgtt catccagctc gtgcagacgt acaaccagct cttcgaggag 900
aaccccatta atgcgtcagg cgtcgacgcg aaggctatcc tgtccgctag gctctcgaag 960
tctcggcgcc tcgagaacct gatcgcccag ctgccgggcg agaagaagaa cggcctgttc 1020
gggaatctca ttgcgctcag cctggggctc acgcccaact tcaagtcgaa tttcgatctc 1080
gctgaggacg ccaagctgca gctctccaag gacacatacg acgatgacct ggataacctc 1140
ctggcccaga tcggcgatca gtacgcggac ctgttcctcg ctgccaagaa tctgtcggac 1200
gccatcctcc tgtctgatat tctcagggtg aacaccgaga ttacgaaggc tccgctctca 1260
gcctccatga tcaagcgcta cgacgagcac catcaggatc tgaccctcct gaaggcgctg 1320
gtcaggcagc agctccccga gaagtacaag gagatcttct tcgatcagtc gaagaacggc 1380
tacgctgggt acattgacgg cggggcctct caggaggagt tctacaagtt catcaagccg 1440
attctggaga agatggacgg cacggaggag ctgctggtga agctcaatcg cgaggacctc 1500
ctgaggaagc agcggacatt cgataacggc agcatcccac accagattca tctcggggag 1560
ctgcacgcta tcctgaggag gcaggaggac ttctaccctt tcctcaagga taaccgcgag 1620
aagatcgaga agattctgac tttcaggatc ccgtactacg tcggcccact cgctaggggc 1680
aactcccgct tcgcttggat gacccgcaag tcagaggaga cgatcacgcc gtggaacttc 1740
gaggaggtgg tcgacaaggg cgctagcgct cagtcgttca tcgagaggat gacgaatttc 1800
gacaagaacc tgccaaatga gaaggtgctc cctaagcact cgctcctgta cgagtacttc 1860
acagtctaca acgagctgac taaggtgaag tatgtgaccg agggcatgag gaagccggct 1920
ttcctgtctg gggagcagaa gaaggccatc gtggacctcc tgttcaagac caaccggaag 1980
gtcacggtta agcagctcaa ggaggactac ttcaagaaga ttgagtgctt cgattcggtc 2040
gagatctctg gcgttgagga ccgcttcaac gcctccctgg ggacctacca cgatctcctg 2100
aagatcatta aggataagga cttcctggac aacgaggaga atgaggatat cctcgaggac 2160
attgtgctga cactcactct gttcgaggac cgggagatga tcgaggagcg cctgaagact 2220
tacgcccatc tcttcgatga caaggtcatg aagcagctca agaggaggag gtacaccggc 2280
tgggggaggc tgagcaggaa gctcatcaac ggcattcggg acaagcagtc cgggaagacg 2340
atcctcgact tcctgaagag cgatggcttc gcgaaccgca atttcatgca gctgattcac 2400
gatgacagcc tcacattcaa ggaggatatc cagaaggctc aggtgagcgg ccagggggac 2460
tcgctgcacg agcatatcgc gaacctcgct ggctcgccag ctatcaagaa ggggattctg 2520
cagaccgtga aggttgtgga cgagctggtg aaggtcatgg gcaggcacaa gcctgagaac 2580
atcgtcattg agatggcccg ggagaatcag accacgcaga agggccagaa gaactcacgc 2640
gagaggatga agaggatcga ggagggcatt aaggagctgg ggtcccagat cctcaaggag 2700
cacccggtgg agaacacgca gctgcagaat gagaagctct acctgtacta cctccagaat 2760
ggccgcgata tgtatgtgga ccaggagctg gatattaaca ggctcagcga ttacgacgtc 2820
gatcatatcg ttccacagtc attcctgaag gatgactcca ttgacaacaa ggtcctcacc 2880
aggtcggaca agaaccgggg caagtctgat aatgttcctt cagaggaggt cgttaagaag 2940
atgaagaact actggcgcca gctcctgaat gccaagctga tcacgcagcg gaagttcgat 3000
aacctcacaa aggctgagag gggcgggctc tctgagctgg acaaggcggg cttcatcaag 3060
aggcagctgg tcgagacacg gcagatcact aagcacgttg cgcagattct cgactcacgg 3120
atgaacacta agtacgatga gaatgacaag ctgatccgcg aggtgaaggt catcaccctg 3180
aagtcaaagc tcgtctccga cttcaggaag gatttccagt tctacaaggt tcgggagatc 3240
aacaattacc accatgccca tgacgcgtac ctgaacgcgg tggtcggcac agctctgatc 3300
aagaagtacc caaagctcga gagcgagttc gtgtacgggg actacaaggt ttacgatgtg 3360
aggaagatga tcgccaagtc ggagcaggag attggcaagg ctaccgccaa gtacttcttc 3420
tactctaaca ttatgaattt cttcaagaca gagatcactc tggccaatgg cgagatccgg 3480
aagcgccccc tcatcgagac gaacggcgag acgggggaga tcgtgtggga caagggcagg 3540
gatttcgcga ccgtcaggaa ggttctctcc atgccacaag tgaatatcgt caagaagaca 3600
gaggtccaga ctggcgggtt ctctaaggag tcaattctgc ctaagcggaa cagcgacaag 3660
ctcatcgccc gcaagaagga ctgggatccg aagaagtacg gcgggttcga cagccccact 3720
gtggcctact cggtcctggt tgtggcgaag gttgagaagg gcaagtccaa gaagctcaag 3780
agcgtgaagg agctgctggg gatcacgatt atggagcgct ccagcttcga gaagaacccg 3840
atcgatttcc tggaggcgaa gggctacaag gaggtgaaga aggacctgat cattaagctc 3900
cccaagtact cactcttcga gctggagaac ggcaggaagc ggatgctggc ttccgctggc 3960
gagctgcaga aggggaacga gctggctctg ccgtccaagt atgtgaactt cctctacctg 4020
gcctcccact acgagaagct caagggcagc cccgaggaca acgagcagaa gcagctgttc 4080
gtcgagcagc acaagcatta cctcgacgag atcattgagc agatttccga gttctccaag 4140
cgcgtgatcc tggccgacgc gaatctggat aaggtcctct ccgcgtacaa caagcaccgc 4200
gacaagccaa tcagggagca ggctgagaat atcattcatc tcttcaccct gacgaacctc 4260
ggcgcccctg ctgctttcaa gtacttcgac acaactatcg atcgcaagag gtacacaagc 4320
actaaggagg tcctggacgc gaccctcatc caccagtcga ttaccggcct ctacgagacg 4380
cgcatcgacc tgtctcagct cgggggcgac aagcggccag cggcgacgaa gaaggcgggg 4440
caggcgaaga agaagaagac ccgcgactcc ggcggcagca cgaacctctc cgacatcatc 4500
gagaaggaga cgggcaagca gctcgtgatc caggagagca tcctcatgct gccggaggag 4560
gtggaggagg tcatcggcaa caagcccgag tccgacatcc tcgtgcacac cgcctacgac 4620
gagtccacgg acgagaacgt catgctcctg acgagcgacg ctccagagta caagccatgg 4680
gctctcgtga tccaggacag caacggcgag aacaagatca agatgctgtc cggcggctcc 4740
ccgaagaaga agcgcaaggt ctga 4764