CN112481309A - Ago蛋白的用途及组合物和基因编辑方法 - Google Patents

Ago蛋白的用途及组合物和基因编辑方法 Download PDF

Info

Publication number
CN112481309A
CN112481309A CN201910870351.0A CN201910870351A CN112481309A CN 112481309 A CN112481309 A CN 112481309A CN 201910870351 A CN201910870351 A CN 201910870351A CN 112481309 A CN112481309 A CN 112481309A
Authority
CN
China
Prior art keywords
leu
glu
ile
ala
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910870351.0A
Other languages
English (en)
Other versions
CN112481309B (zh
Inventor
仪宏
冯慧勇
李天明
刘金雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shijiazhuang Aiwa Gene Technology Co ltd
Original Assignee
Shijiazhuang Aiwa Gene Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shijiazhuang Aiwa Gene Technology Co ltd filed Critical Shijiazhuang Aiwa Gene Technology Co ltd
Publication of CN112481309A publication Critical patent/CN112481309A/zh
Application granted granted Critical
Publication of CN112481309B publication Critical patent/CN112481309B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mycology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一种Ago蛋白的用途及组合物和基因编辑方法,本发明的真核细胞靶向基因编辑方案,通过使外源Ago蛋白与同源重组片段出现于真核细胞中,进行所述细胞内的基于同源重组的靶向基因编辑,其不需要向导DNA或向导RNA的靶向定位,仅需外源Ago蛋白与同源重组片段便可引发真核细胞的基因编辑,应用前景广泛。

Description

Ago蛋白的用途及组合物和基因编辑方法
技术领域
本发明涉及生物技术领域,特别涉及一种Ago蛋白的用途。同时,本发明 还涉及了一种包括该Ago蛋白的组合物,以及一种应用该组合物实现真核细胞 基因编辑的基因编辑方法。
背景技术
靶向基因编辑技术是一类高效率基因组定点改写技术的总称,它的主要优 势在于:基因组靶向精度高、基因编辑效率高、应用范围广泛。靶向基因编辑 技术可以针对微生物、植物、动物(包括哺乳动物)的细胞或个体,开展基因 组的功能研究和遗传改造;进一步地,靶向基因编辑技术与合成生物学技术汇 聚,可以实现基因组的改造与物种定制。
目前公知的是:基因编辑技术的发展,主要历经了ZFN、TALEN、CRISPR 三代技术系统的演化。至今,CRISPR-Cas9技术已经被广泛应用,可以用于包 括酵母、丝状真菌、植物、动物(含哺乳动物及人类细胞)在内的真核细胞内 的靶向基因编辑。上述基于ZFN、TALEN、CRISPR的靶向基因编辑技术都能 够引发对靶向位点的DNA的切割,造成基因组DNA的双链断裂(DSB),促 使细胞启动同源介导的修复(HDR)、或者非同源末端连接(NHEJ)来挽救基因组的完整性。其中,NHEJ修复保真度低,有可能造成DSB附近的碱基缺失、 置换等错误,从而引入突变或者失活基因。在同源序列充当修复模板的前提下, 通过HDR修复可以实现精确的基因编辑,包括内源基因的精确修复或外源基 因的精确导入。
ZFN和TALEN技术需要对蛋白质结构域进行设计和改造而实现基因组的 靶向,因而存在成本高、技术难度大、效率低等缺点。
CRISPR是细菌等原核生物用于防御外来DNA入侵的初级免疫系统,其中 Cas9蛋白可以使用人工设计的5’端羟基化的单链向导RNA(sgRNA),对基 因组特定的靶向区域进行识别并结合,之后,Cas9蛋白自身的两个核酸酶活性 位点切割靶DNA,造成靶向区域DNA的双链断裂(DSB)并引发NHEJ或HDR, 从而实现基因编辑。CRISPR技术借助向导寡核苷酸完成对基因组特定位点的 靶向,易于实现人工编程,所以CRISPR技术自2012年问世以来发展迅速,已 经成为目前最受欢迎的技术,被广泛应用,该技术也已经形成和积累了大量的 公开发表文献。
然而,根据已经公开的文献,CRISPR技术仍然存在一些问题,例如:存 在脱靶问题、存在NHEJ造成的非预期编辑。另一方面,Cas9、Cpf1等CRISPR 相关蛋白的分子量较大,在开展哺乳动物成体细胞的基因编辑时,导致表达元 件的递送困难。上述问题的解决,期待着更小的能够执行靶向基因编辑的蛋白 元件、或者由更少的元件构成的更简便的技术体系的开发。Argonautes蛋白是 普遍存在于从原核细菌到高等生物(包括哺乳动物)的一类有进化谱系的核酸 酶。Argonautes蛋白的一个普遍的生物学特征是:与短链寡核苷酸互作并实现 对相应互补核酸序列的靶向结合。在高等细胞中一些Argonautes蛋白参与了非编码RNA(ncRNA)相关的许多重要生理过程,例如RNAi。
近几年来,来自原核微生物的prokaryotic Argonaute(pAgo)蛋白的相关研 究也取得了有趣的进展,pAgo也被寄希望用于开发新的基因编辑工具,并形成 了一些公开发表的文献,但是与CRISPR相比较,pAgo的研究文献目前并不够 丰富,也并未能在真核细胞中实现靶向基因编辑。
已经公开的专利主要有:发明人为VAN DER OOST,John的 WO/2014/189628A1专利公开了DNA向导的DNA干扰技术,但是否能在常温 下采用来自嗜热原核微生物Thermusthermophilus的TtAgo完成细胞内基因组 编辑,并没有相关的示例。发明人为DOUDNA,Jennifer的WO2015/157534A1 专利公开了利用来自原核微生物Marinitoga piezophila的MpAgo进行单链靶标 核酸(DNA或者RNA)切割的技术方法,但是,该专利只有体外实验验证(in vitro)实施例、缺乏活体细胞内(in vivo)的实施例。发明人为VALTON,Julien 的WO2015/140347A1专利,公开了利用DNA向导的Argonaute干扰系统 (DAIS)工程化哺乳动物基因组的技术,采用序列优化之后可以在30℃到40℃ 工作的TtAgo,以一个TtAgo加两个对向的5’磷酸化的单链向导DNA的方式、 实施了包括T细胞在内哺乳动物细胞基因组编辑,然而该专利的实施例十分粗 糙,其技术方案并未被广泛接受和采用。发明人为沈啸、韩春雨的 CN109153990A专利,公开了利用单链向导DNA和NgAgo进行真核细胞基因 编辑的技术方案,并且公开了在人类细胞293T中的实施例,然而该技术方案 及相关论文一同被全球范围内的多个实验室认定为不可实现。
围绕pAgo相关的主要学术论文发表情况如下:2009年8月25日,Kira S Makarova等依据生物信息学的深度挖掘,预测了来自原核生物的pAgo很可能 是一种对抗外来遗传物质入侵的原始防御系统。2013年9月12日,Ivan Olovnikov等报告了来自Rhodobactersphaeroides的RsAgo能够通过对转录组 “采样”而识别监控外来DNA。2014年2月16日,DaanC.Swarts等报道了 来自嗜热菌Thermus thermophilus的TtAgo以13–25nt的5’磷酸化的单链DNA 为向导切割靶向DNA,并将这种宿主防御系统称之为DNA向导的DNA干扰, 简称DNAi。2015年4月29日,Daan C.Swarts等在线发表了来自古细菌 Pyrococcus furiosus的PfAgo,该PfAgo利用5’磷酸化的单链DNA为向导, 能够靶向切割单链或双链DNA,起到防御外来DNA入侵的作用。
2016年4月12日,Emine Kaya等报道了来自Marinitoga piezophila的与 CRISPR相关的MpAgo,该MpAgo以15到40nt的5’羟基化单链RNA为向 导,能够识别和切割所靶向的单链DNA或者单链RNA。2016年5月2日,Feng Gao等报道了来自嗜盐微生物Natronobacterium gregoryi的NgAgo,该论文声 称以24nt的5’磷酸化的单链DNA为向导的该NgAgo,能够在常温下造成哺 乳动物细胞靶向基因组位点的双链断裂(DSB)并引发高效率的基因组编辑, 然而该论文因重复性危机而与2017年8月3日撤稿。
2016年6月21日,Tomohiro Miyoshi等以
Figure RE-GDA0002326750620000031
的分辨率解析了来自Rhodobactersphaeroides的RsAgo的结构,该RsAgo识别18nt的guide RNA (gRNA)。2017年3月20日,Sarah Willkomm等人和Adrian Zander等人背靠 背刊发了两篇报道,以
Figure RE-GDA0002326750620000041
的分辨率解析了来自于Methanocaldococcus jannaschii的MjAgo的结构,并对MjAgo催化活性的机制进行了讨论。2019年 2月22日和2月25日,Anton Kuzmenko等人和Jorrit W.Hegge等人分别独立 在线发表了来自Clostridium butyricum的CbAgo,该蛋白在中等温度(37℃) 下能够在单链小干扰DNA(small interfering DNA)引导下以较高的活性切割单 链和双链DNA。
此外,Kuzmenko等人还同时发表了来自Limnothrix rosea的LrAgo,该蛋白 也能在中等温度下利用向导DNA切割单链和双链DNA。然而在生理条件下在 活体细胞内(特别是真核细胞内),他们并未能够实现靶向基因编辑。2019年4 月4日,Kok Zhi Lee等人在体外检测出了NgAgo的DNA内切核酸酶活性。2019 年7月30日,Yuanwei Cao等人报道了2种来自人类肠道菌群的pAgo,分别是 来自Clostridium perfringens的CpAgo和来自Intestinibacter bartlettii的IbAgo, 这2种pAgo蛋白能在较宽的温度范围内(4℃-60℃)以单链DNA(15~30nt) 为向导切割单链和质粒双链DNA(double-stranded plasmidDNA)。
此外,CpAgo还能够利用向导DNA实现对RNA的靶向切割。上述几项工 作都只是在体外测试了几种来自常温菌的pAgo的DNA切割活性,并且这种活 性依赖于单链DNA;上述几篇论文并未发现和报告这些pAgo的体内活性、特 别是其在真核细胞中的基因编辑能力。
2019年1月30日,Lei Fu等人报告了NgAgo能够通过与RecA结合来促进 RecA介导的DNA链交换,进而增强细菌中基因编辑(插入或删除)的效率。 这是至今为止,pAgo在原核生物体内呈现基因编辑活性的唯一报道,但是 NgAgo仍然不能用于真核细胞的基因编辑。
综上,尽管全球范围内有多个团队在努力,但是至今为止,未能在真核细 胞中真实地实现基于Ago蛋白的靶向基因编辑。
发明内容
有鉴于此,本发明旨在提出一种Ago蛋白的用途,其能够以较为简便的方 式进行真核细胞靶向基因编辑。
为达到上述目的,本发明的Ago蛋白的用途为所述Ago蛋白用于真核细胞 内的不依赖于外源靶向向导、并基于同源重组的靶向基因编辑。
进一步的,所述Ago蛋白包括来自常温菌的pAgo蛋白以及来自嗜热菌的 pAgo蛋白。
进一步的,所述Ago蛋白是PIWI核酸酶活性中心四元基序符合DEDX特 征的pAgo蛋白。
进一步的,所述pAgo蛋白是来自常温菌的pAgo蛋白,并来自 Halogeometricumpallidum(NCBI登录号:ELZ29017.1)的HpAgo,或来自 Microcystis aeruginosa(NCBI登录号WP_012265209.1)的MaAgo,或来自 Halorubrum ezzemoulense(NCBI登录号:WP_094494460.1)的HeAgo,或来 自filamentous cyanobacterium(NCBI登录号:WP_106331578.1)的FcAgo,或 来自Mastigocoleus testarum(NCBI登录号:WP_027844945.1)的MtAgo;或 者,所述pAgo蛋白是来自嗜热菌的pAgo蛋白,并来自Exiguobacterium sp.(NCBI登录号:ACQ71053.1)的ExAgo。
进一步的,所述Ago蛋白是来自常温菌的、PIWI核酸酶活性中心四元基 序不符合DEDX特征的pAgo蛋白。
进一步的,所述pAgo蛋白是来自Pantoea anthophila(NCBI登录号: WP_046101283.1)的PaAgo,或来自Flavobacterium soli(NCBI登录号: WP_026705043.1)的FsAgo。
进一步的,所述Ago蛋白为PIWI核酸酶活性中心突变后不再符合DEDX 特征的pAgo蛋白的突变体。
进一步的,所述pAgo蛋白是来自常温菌的HpAgo的突变体HpAgoD646A, 或者来自嗜热菌的ExAgo的突变体ExAgoD398A/S400A
进一步的,所述Ago蛋白含有与所述pAgo蛋白/突变体的序列同源性大于 等于80%的氨基酸序列。
本发明的另一目的在于提出一种组合物,其用于真核细胞的靶向基因编辑, 且所述组合物由同源重组片段和如上所述的Ago蛋白组合而成。
进一步的,所述同源重组片段是能够在靶向区域实现基因表达盒插入的同 源重组片段,或能够在靶向区域通过替换原有基因片段以实现基因表达盒插入 的同源重组片段,或能够在靶向区域实现基因片段插入或替换的同源重组片段, 或能够在靶向区域实现基因片段删除的同源重组片段。
进一步的,所述组合物中的Ago蛋白是所述Ago蛋白本身,或者是包括其 编码RNA/其整合到宿主染色体的表达盒/其表达质粒在内的所述Ago蛋白的表 达元件。
进一步的,所述同源重组片段中,至少一侧的同源臂的长度不低于200bp。
进一步的,所述同源重组片段中,至少一侧的同源臂的长度不低于400bp。
此外,本发明还提出了一种基因编辑方法,该方法用于真核细胞靶向基因 的编辑,并且该方法通过使如上所述组合物出现于真核细胞中,进行真核细胞 内的靶向基因编辑。
进一步的,使所述组合物出现于真核细胞中,是采用转染、或化学转化、 或电转化、或基因枪转化的方式将所述组合物导入细胞内实现的。
进一步的,该方法中所述基因编辑的形式包括基因表达盒的靶向敲入或替 换、基因片段的靶向敲入或替换、基因片段的靶向删除。
进一步的,所述真核细胞为活体真核微生物细胞、活体植物细胞或活体动 物细胞。
最后,本发明也提出了一种真核细胞,该真核细胞由以上所述的基因编辑 方法获得。
本发明中的Ago蛋白,可以在无需DNA或RNA所构成的靶向向导下,用 于真核细胞的靶向定位编辑,其使用更为简便,效果更优。在其编辑应用时, 仅需将Ago蛋白和同源重组片段组成的组合物中,至少所述同源重组片段被配 置于用于转化或转染的递送体系内,即可进行基于同源重组修复(HDR)的靶 向基因组编辑,其为基因编辑技术的应用提供了更好的发展空间。
此外,在各类靶向基因编辑应用场景中,本发明基因编辑方案相对于包括 CRISPR在内的现有技术,具有如下的特点和优势:
(1)与公知的ZFN及TALEN技术方案相比较,本发明提供的真核细胞靶 向基因编辑技术方案,无需编辑改造外源核酸酶,仅需使用所选择的、无需重 新编码的、固定的pAgo蛋白。
(2)与公知的CRISPR技术方案相比较,本发明提供的真核细胞靶向基因 编辑技术方案可以实现向导RNA或向导DNA设计和使用的省却,可以实现由 “外源核酸酶+向导核酸+同源重组片段”的“三元体系”向“外源核酸酶+同 源重组片段”的“二元体系”简化和回归。应用本方案时,只需将由pAgo蛋 白或者能够表达该pAgo蛋白的基因元件、和同源重组片段组成的组合物导入 细胞,即可实现真核细胞靶向基因编辑;对不同区域的基因编辑,本方案仅需 执行基于PCR的同源重组片段的搭接或者直接合成所需的同源重组片段、无需 执行额外的克隆及其他的分子构建操作,从而为真核细胞的靶向基因编辑提供 了更便利、更高效的技术方案。
(3)本发明提供的真核细胞靶向基因编辑方案,对于靶向区域的精准靶向, 不同于依赖于长度仅为19-21nt向导RNA的CRISPR系统,也不同于被广泛推 测但仍未能真实实现的、依赖于24nt单链向导DNA的pAgo系统,而能够大 幅度提高靶向精准度、大幅度降低基因编辑的脱靶概率。
(4)本发明提供的真核细胞靶向基因编辑方案,提供了多种可在真核细胞 内实现靶向基因编辑的pAgo蛋白工具,不同的pAgo蛋白工具在不同的应用场 景中,在都能够完成基因编辑的前提下,还具备各自的独特性,使得本发明方 案可以针对不同的应用场景选择不同的pAgo蛋白工具,极大地丰富了靶向基 因编辑技术的工具箱。
(5)相对于其他靶向基因编辑方案中所使用的Cas9等外源蛋白质,本发明 提供的方案中所使用的候选pAgo蛋白的分子量较小,在基因治疗等应用场景 中,将有利于解决递送困难等问题。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示 意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。本发明 所述的附图如下:
图1:总体设计思想与技术方案示意图;
图2:实验流程示意图;
图3(a):同源重组片段WHR的设计及同源重组示意图;
图3(b):同源重组片段WHRgfp的设计及同源重组示意图;
图3(c):同源重组片段XHR的设计及同源重组示意图;
图3(d):同源重组片段XHRhis的设计及同源重组示意图;
图3(e):同源重组片段WHRleu1100的设计及同源重组示意图;
图3(f):同源重组片段WHRgfp1100的设计及同源重组示意图;
图3(g):同源重组片段Δ190HRhis的设计及同源重组示意图;
图4(a):PaAgo蛋白表达质粒paago-pRS424-TRP构建图谱;
图4(b):FsAgo蛋白表达质粒fsago-pRS424-TRP构建图谱;
图4(c):HpAgo蛋白表达质粒hpago-pRS424-TRP构建图谱;
图4(d):MaAgo蛋白表达质粒maago-pRS424-TRP构建图谱;
图4(e):HeAgo蛋白表达质粒heago-pRS424-TRP构建图谱;
图4(f):FcAgo蛋白表达质粒fcago-pRS424-TRP构建图谱;
图4(g):MtAgo蛋白表达质粒mtago-pRS424-TRP构建图谱;
图4(h):ExAgo蛋白表达质粒exago-pRS424-TRP构建图谱;
图4(i):dExAgo蛋白表达质粒dexago-pRS424-TRP构建图谱;
图4(j):dHpAgo蛋白表达质粒dhpago-pRS424-TRP构建图谱;
图5(a):PaAgo蛋白介导的靶向基因编辑表型验证;
图5(b):FsAgo蛋白介导的靶向基因编辑表型验证;
图5(c):HpAgo蛋白介导的靶向基因编辑表型验证;
图5(d):MaAgo蛋白介导的靶向基因编辑表型验证;
图5(e):HeAgo蛋白介导的靶向基因编辑表型验证;
图5(f):FcAgo蛋白介导的靶向基因编辑表型验证;
图5(g):MtAgo蛋白介导的靶向基因编辑表型验证;
图5(h):ExAgo蛋白介导的靶向基因编辑表型验证;
图5(i):dExAgo蛋白介导的靶向基因编辑表型验证;
图5(j):dHpAgo蛋白介导的靶向基因编辑表型验证;
图6(a):WHRgfp同源重组PCR验证电泳图;
图6(b):WHRgfp1100同源重组PCR验证电泳图;
图6(c):WHRleu1100同源重组PCR验证电泳图;
图6(d):XHR同源重组PCR验证电泳图;
图6(e):XHRhis同源重组PCR验证电泳图;
图6(f):Δ190HRhis同源重组PCR验证电泳图;
图6(g):WHR同源重组PCR验证电泳图;
图7:氨基酸个数处于592至863之间的233个pAgo蛋白四元基序DEDX 预测分析图;
图8:分属于8个pAgo亚群的55个pAgo蛋白的四元基序DEDX预测分 析图;
图9:实施例中采用的10个pAgo蛋白的四元基序DEDX预测分析图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征 可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
本发明涉及真核细胞基因编辑,尤其是真核细胞的基于同源重组的靶向基 因编辑。
针对于该基于同源重组的真核细胞靶向基因编辑,本发明首先涉及一种组 合物,该组合物即用于真核细胞的靶向基因编辑组合物。在构成上,所述组合 物由同源重组片段和Ago蛋白组合而成。在组合物应用时,至少同源重组片段 应被配置于用于转化或转染的递送体系内,一般情况下,该递送体系的溶剂是 水或者TE缓冲液等常规缓冲液,溶质是同源重组片段及Ago蛋白、或同源重 组片段及Ago蛋白的表达元件,即:该用于转化或转染的递送体系是由同源重 组片段、Ago蛋白/Ago蛋白表达元件、水/缓冲液构成的。
其中,针对于组合物中的同源重组片段,其应是能够在靶向区域实现基因 表达盒插入的同源重组片段,或能够在靶向区域通过替换原有基因片段以实现 基因表达盒插入的同源重组片段,或能够在靶向区域实现基因片段插入或替换 的同源重组片段,或能够在靶向区域实现基因片段删除的同源重组片段。
同源重组片段的设计和组装可采用搭接PCR等常规分子生物学方法进行, 通过对同源重组片段的设计,本发明能够在靶向区域实现外源基因的插入、原 有基因的替换(由外源基因替换原有基因)、或者原有基因的删除。
如同以上所述的,插入或进行替换的外源基因可为基因表达盒或基因片段, 而基因表达盒代表在基因序列两端分别携带有启动子序列和终止子序列,以能 够独立地转录出mRNA进而翻译成蛋白质,其长度一般在数百个bp以上,基 因片段则是相对于基因表达盒而言,代表在基因序列两端不携带有启动子序列 和终止子序列、仅由一个、数个乃至数十个或更多个bp所构成,只能用于对原 有基因序列进行置换但不能够如基因表达盒那样独立地转录出mRNA进而翻 译成蛋白质。
从以上对本发明的同源重组片段的描述可以看出,本发明在靶向编辑时可 实现基因表达盒的插入、替换,或基因片段的插入、替换或删除,其在具体应 用情形中,视需要进行相关的选取设置即可。为了较好的实现靶向基因编辑效 果,本发明的同源重组片段在设置上,其至少一侧的同源臂的长度应不低于 200bp,并进一步优选的为不低于400bp。此时,例如同源重组片段任一侧的同 源臂的长度可采用200bp、250bp、300bp、350bp、400bp、420bp、450bp、470bp、 500bp、530bp、560bp、598bp、600bp、603bp、612bp、614bp、625bp、634bp、 650bp、700bp、800bp等等。
尽管不同的pAgo在介导基因编辑时,对同源重组片段的要求不尽完全相 同,但是,一般而言,同源重组片段的同源臂的长度愈大,其在靶向基因编辑 时的编辑效果趋好,随着同源臂长度的减小,靶向基因编辑的效果会下降,故 本发明并不推荐采用低于200bp长度的同源臂的同源重组片段进行靶向基因编 辑,且优选的推荐同源臂采用不低于400bp的长度,特别是在设置基因表达盒 敲入所需的同源重组片段时,尽可能取较长的同源臂,以提高靶向基因编辑效 率。
例如在以绿色荧光蛋白GFP的表达盒敲入替代can1基因中间527bp的基 因片段时,所采用同源重组片段WHRgfp,其上同源臂612bp、下同源臂634bp。 在特定的转化体系中(特定的感受态细胞、同源重组片段用量等),此WHRgfp 的本底重组率(无相关Ago蛋白介导时)在0.1~1%左右,而以此同源重组片段 测试各候选pAgo蛋白的基因编辑活性,一般将高出此本底重组率3倍以上的 情形判定为具备靶向基因编辑活性,高出此本底重组率10倍以上的情形则判定 为具备有效的靶向基因编辑。
以此同源重组片段WHRgfp测试ExAgo及PaAgo介导的基因编辑,其效 率均能达到20%左右,但将WHRgfp同源臂缩短至上同源臂226bp下同源臂 204bp后,则难以稳定地检测到有效的靶向基因编辑活性。
再例如,在设置24bp外源基因片段替换can1基因中间24bp的同源重组片 段时,所设置的XHR的上同源臂625bp、下同源臂614bp,进一步的,设置了 上同源臂439p下同源臂494bp的XHR400,以及上同源臂272p下同源臂250bp 的XHR200。此时,所述的XHR、XHR400、XHR200的本底重组率均在0.05~0.5% 之内。
而以同源重组片段XHR、XHR400、XHR200测试ExAgo介导的靶向基因 编辑,其效率则分别达到20%左右、10%左右、3%左右。可见ExAgo介导的靶 向基因编辑效率与同源重组片段的同源臂长度呈现正相关性。
本实施例中将在后文中通过多个具体实例,对采用不同的pAgo蛋白、不 同的同源重组片段、以及不同的同源臂长度的同源重组片段实施靶向基因编辑 的具体情况进行示例说明。
针对于组合物中的Ago蛋白,需要说明的是,本发明的所述Ago蛋白可以 是其本身、也即组合物中包含的所谓Ago蛋白直接采用由氨基酸连接而成的具 有蛋白质性质的Ago蛋白。或者,作为其它可行方式,所谓的Ago蛋白也能够 是来自包括其编码RNA、或其整合到宿主染色体的表达盒、或其表达质粒在内 的其表达元件的Ago蛋白。
其中,不管是为Ago蛋白本身,亦或是能够表达Ago蛋白的其表达元件, 本发明的Ago蛋白为来自于原核生物的pAgo蛋白,并特别的包括来自常温菌 的pAgo蛋白以及来自嗜热菌的pAgo蛋白。
此时,我们从NCBI等公开的生物信息数据库中,挖掘比对Ago蛋白的氨 基酸序列,搜寻出320个来自原核生物的pAgo蛋白的氨基酸序列的有效信息。
由于生物领域普遍认为酿酒酵母这一模式的细胞具有普适性,因此对320 个有效pAgo蛋白,针对酿酒酵母生物开展了一系列测试验证,包括相关pAgo 蛋白表达基因的合成、四元基序DEDX不同残基突变、相关pAgo蛋白表达质 粒构建、靶向基因编辑方法研究、组合物设计、靶向基因编辑活性测试等。
试验发现pAgo蛋白的氨基酸个数低于592的PlAgo等pAgo没有真核细胞 基因编辑活性,NgAgo等氨基酸个数高于863的pAgo也没有真核细胞基因编 辑活性。因此,在320个有效pAgo蛋白中,筛选出氨基酸个数处于592至863 之间的233个具有基因编辑活性的Ago蛋白,详见表1及图7。
表1 氨基酸个数在592至863之间的233个pAgo蛋白列表
Figure RE-GDA0002326750620000121
Figure RE-GDA0002326750620000131
Figure RE-GDA0002326750620000141
Figure RE-GDA0002326750620000151
Figure RE-GDA0002326750620000161
Figure RE-GDA0002326750620000171
Figure RE-GDA0002326750620000181
Figure RE-GDA0002326750620000191
Figure RE-GDA0002326750620000201
结合生物信息学分析和靶向基因编辑活性测试结果,表1中最后10个(序 号为224-233的pAgo)经测试验证活性较差,由此便得到了包含有基因编辑活 性的、氨基酸个数在592至863之间的223个pAgo蛋白,即表1中的序号为 1-223的pAgo。
其中:78个为来自常温菌并且其核酸酶活性中心四元基序符合公知的 DEDX特征的pAgo蛋白,115个为自常温菌并且其活性中心四元基序不符合公 知的DEDX特征的pAgo蛋白,26个为来自嗜热菌的并且其核酸酶活性中心四 元基序符合公知的DEDX特征的pAgo蛋白,4个为来自嗜热菌的并且其核酸 酶活性中心四元基序不符合公知的DEDX特征的pAgo蛋白。
在进一步的生物信息学分析和靶向基因编辑活性测试中,从上述233个 pAgo蛋白中筛选出能够更为有效的进行真核细胞基因编辑的、由55个pAgo 蛋白构成的8个亚群。
8个的亚群的55个pAgo蛋白的情况详见表2及图8。
表2 来自8个pAgo亚群的55个pAgo蛋白列表
Figure RE-GDA0002326750620000202
Figure RE-GDA0002326750620000211
Figure RE-GDA0002326750620000221
基于上述生物信息学分析和靶向基因编辑活性测试结果,从该8个亚群中 选取代表性pAgo,得到10个具备基因编辑活性的pAgo,详情见表3及图9。 而且表2中的pAgo蛋白与表3内相关的代表性pAgo蛋白之间的序列同源性大 于等于80%。
同时,本发明中该10个pAgo将作为具体示例,通过下文中对这10个pAgo 的具体试验验证来说明本发明的组合物,以及采用所述组合物的基因编辑方法。
表3 用于具体实施例的10个代表性pAgo蛋白或突变体列表
Figure RE-GDA0002326750620000231
表3中:5个为来自常温菌pAgo蛋白亚群的代表性pAgo蛋白,具体包括 来自Halogeometricum pallidum(NCBI登录号:ELZ29017.1)的HpAgo、来自 Microcystisaeruginosa(NCBI登录号WP_012265209.1)的MaAgo、来自 Halorubrum ezzemoulense(NCBI登录号:WP_094494460.1)的HeAgo、来自 filamentous cyanobacterium(NCBI登录号:WP_106331578.1)的FcAgo、来自 Mastigocoleus testarum(NCBI登录号:WP_027844945.1)的MtAgo,上述5个 pAgo蛋白的PIWI核酸酶活性中心四元基序符合公知的DEDX特征。
1个为来自嗜热菌的pAgo蛋白亚群的代表性pAgo蛋白,其具体包括来自Exiguobacterium sp.(NCBI登录号:ACQ71053.1)的ExAgo,该pAgo蛋白的 PIWI核酸酶活性中心四元基序符合公知的DEDX特征。
2个为来自常温菌的pAgo蛋白,具体包括来自Pantoea anthophila(NCBI 登录号:WP_046101283.1)的PaAgo和来自Flavobacterium soli(NCBI登录号: WP_026705043.1)的FsAgo,上述2个pAgo蛋白的PIWI核酸酶活性中心四元 基序不符合公知的DEDX特征。
2个分别为来自常温菌的HpAgo的失活突变体HpAgoD646A和来自嗜热菌的 ExAgo的突变体ExAgoD398A/S400A,这两个pAgo蛋白其PIWI核酸酶活性中心突 变后四元基序不再符合DEDX特征,但该两个突变体均具备基因编辑活性。
应当指出的是,其PIWI核酸酶活性中心四元基序符合公知的DEDX特征 的pAgo蛋白,该pAgo蛋白DEDX的某些氨基酸残基的突变会导致其基因编 辑性的丧失,例如ExAgoD467A。可见对于pAgo而言,其PIWI核酸酶活性中心 四元基序的不同的氨基酸残基对于其活性维持的贡献是不等同的,某些情况下 的突变,例如第一个氨基酸残基D的突变,并不造成该pAgo蛋白基因编辑活 性的丧失,而另外一些情况下的突变,例如第二个氨基酸残基D的突变,将会 造成该pAgo蛋白基因编辑活性的丧失。
本发明所涉及的组合物中的Ago蛋白即是含有与上述代表性pAgo蛋白或 其突变体的序列同源性大于等于80%的氨基酸序列的Ago蛋白,如此,组合物 中的Ago蛋白当然可以是以上10个代表性pAgo蛋白或其突变体中的一个,或 者,其亦可以是满足序列同源性大于等于80%、且具有基因编辑活性的表2内 众多其它pAgo蛋白中的一个。
基于上述的组合物,本实施例进一步涉及有针对于真核细胞的基因编辑方 法,该编辑方法即用于真核细胞的靶向基因编辑,同时其为通过使以上组合物 出现于真核细胞中,而进行基于同源重组的靶向基因编辑。
此时,为使组合物出现在真核细胞中,例如可采用转染、或化学转化、或 电转化、或基因枪转化等方式,以将所述组合物导入细胞内。而且,与前述针 对同源重组片段的描述对应的,本实施例中靶向基因编辑的形式包括基因表达 盒的靶向敲入或替换、基因片段的靶向敲入或替换、基因片段的靶向删除。此 外,需要注意的是,本实施例所述的真核细胞具体为活体真核微生物细胞、活 体植物细胞或活体动物细胞中的一种。而本发明则具体以普适性好的活体酿酒 酵母(Saccharomyces cerevisiae)细胞进行相关试验,以验证本发明的组合物及 相关的基于编辑方法。
本实施例的靶向基因编辑方法一般在常温下进行,并优选为在酿酒酵母的 最适温度下、即30℃下进行。而且通过本实施例编辑方法,其可建立和优化真 核细胞靶向基因编辑的方法,打破了目前对采用Ago进行真核细胞靶向基因编 辑的一贯认知,而可为真核细胞靶向基因编辑的应用开拓出崭新的思路。
另外,还需要指出的是,本实施例同时也涉及有一种Ago蛋白的用途,该 Ago蛋白即用于真核细胞内的基于同源重组的靶向基因编辑,并且该所述Ago 蛋白正是如上介绍的组合物中的Ago蛋白,而其在真核细胞内所进行的靶向基 因编辑的应用则同以上描述的真核细胞基因编辑方法。基于此,对该Ago蛋白 的用途将不再做过多描述。
最后,本实施例亦涉及一种真核细胞,该真核细胞即由以上基因编辑方法 获得。
下面,将以表3中的代表性Ago蛋白为例,运用本发明所提供的靶向基因 编辑方法,具体介绍本发明的Ago蛋白及具有其的组合物的用途。具体而言, 其以酿酒酵母为模式真核生物,Ago蛋白的基因根据酿酒酵母碱基偏好性设计 合成,之后采用Gibson组装等分子生物学方法将其构建到表达质粒上备用。
具体的105个实施例:
以下的实施例,不需要向导RNA或向导DNA的靶向定位,仅需Ago蛋白 与同源重组片段便可引发真核细胞内的靶向基因编辑,该方法可以应用于真核 细胞,应用前景广泛。
本发明的基本原理、整体设计思想及总体技术方案,可由图1加以辅助说 明。并且在图1中:
pAgo表示作为外源Ago的来自于原核生物的pAgo蛋白,且其中:
①代表外源Ago的pAgo蛋白的表达质粒;
②代表外源Ago的pAgo蛋白的编码mRNA;
③代表外源Ago的pAgo蛋白;
HR表示,同源重组片段,且up表示上同源臂、down表示下同源臂,其中,
④代表实现基因表达盒靶向插入、或实现基因表达盒靶向插入同时替换原 有基因的同源重组片段;
⑤代表实现靶向区域基因片段替换的同源重组片段;
⑥代表实现靶向区域基因片段删除的同源重组片段;
基于如上的基本原理、整体设计思想及总体技术方案,设计组织实施了一 系列的实施例,所涉及到基本的方法和总体实验流程,可由图2加以辅助说明。
一、本实施例中生物信息学分析与实验测试验证工作是交叉互动的,首先 采用BLAST等软件工具,分析和挖掘来自原核生物的pAgo蛋白作为本发明方 案中所述的外源Ago蛋白,具体见表1、表2、表3,相关的pAgo蛋白的PIWI 核酸酶活性位点四元基序分析见图7、图8、图9。
二、本实施例中所涉及到的微生物学操作技术以及质粒构建、转化、PCR 验证、基因测序验证等分子生物学操作技术,除以下额外说明的情况之外,均 采用常规方法进行,这些常规方法是公知的、生命科学与技术领域经专业训练 的人员所应熟悉和掌握的基本方法,具体参见2002年8月出版的《分子克隆实 验指南》(上、下册)第三版(Sambrook,J.等著、黄培堂等译、科学出版社出 版),本说明书不再具体加以描述。
三、本实施例中所采用的微生物菌种、基础培养基及筛选培养基、培养条 件具体如下:大肠杆菌Escherichia coli DH5α等:LB培养基,37℃培养。双倍 体酿酒酵母Saccharomyces cerevisiae SC4(His-,Leu-,Trp-,Ura-):YNB培 养基,30℃培养。液体摇瓶培养时,采用100mL三角瓶装液10mL,或者50mL 三角瓶装液5mL,摇瓶转速为90rpm至180rpm、一般为120rpm。
四、本实施例选择酿酒酵母精氨酸运输蛋白的编码基因(can1基因)作为 靶向基因,开展基因编辑方法及用于基因编辑的组合物的研究。特别的,本实 施例中,依据酿酒酵母碱基偏好性合成相关Ago的基因,并构建于T克隆上保 存。具体见表4。
表4 实施例所采用的基础质粒列表
质粒名称 相关性质 来源
pEASY-Blunt Amp抗性,kan抗性 购自北京全式金公司
pRS424-TRP Amp抗性,携带TRP筛选标记 本工作保存
hpago-pEASY 合成hpago基因克隆质粒 本工作构建
maago-pEASY 合成maago基因克隆质粒 本工作构建
fcago-pEASY 合成fcago基因克隆质粒 本工作构建
mtago-pEASY 合成mtago基因克隆质粒 本工作构建
paago-pEASY 合成paago基因克隆质粒 本工作构建
fsago-pEASY 合成fsago基因克隆质粒 本工作构建
exago-pEASY 合成dexago基因克隆质粒 本工作构建
在表4所述的T克隆基础上,进一步构建出携带pAgo蛋白基因表达元件 的穿梭质粒备用,具体见表5。
表5 实施例所构建的Ago蛋白表达质粒列表
基因名称 基因大小 表达质粒名称 相关性质
hpago 2592bp hpago-pRS424-TRP 携带hpago表达盒,TRP筛选
maago 2244bp maago-pRS424-TRP 携带maago表达盒,TRP筛选
fcago 2238bp fcago-pRS424-TRP 携带fcago表达盒,TRP筛选
mtago 2295bp mtago-pRS424-TRP 携带mtago表达盒,TRP筛选
paago 2196bp paago-pRS424-TRP 携带paago表达盒,TRP筛选
fsago 1995bp fsago-pRS424-TRP 携带fsago表达盒,TRP筛选
heago 2544bp heago-pRS424-TRP 携带heago表达盒,TRP筛选
exago 1818bp exago-pRS424-TRP 携带exago表达盒,TRP筛选
dexago 1818bp dexago-pRS424-TRP 携带dexago表达盒,TRP筛选
dhpago 2592bp dhpago-pRS424-TRP 携带dhpago表达盒,TRP筛选
五、本实施例中所选用的同源重组片段包括以下几种情况中的一种:能够 在靶向区域实现基因表达盒插入的同源重组片段,或能够在靶向区域通过替换 原有基因片段以实现基因表达盒插入的同源重组片段,或能够在靶向区域实现 基因片段插入或替换的同源重组片段,或能够在靶向区域实现基因片段删除的 同源重组片段,基因表达盒的靶向敲入或替换、基因片段的靶向敲入或替换、 基因片段的靶向删除。
同源臂HR的设计及其T克隆质粒构建的具体情况如下:
以酿酒酵母的全长1773bp的精氨酸运输蛋白的编码基因(简称can1基因) 作为基本靶点,设计一系列的重组片段HR并构建于T克隆上保存备用:
(1)WHR:敲除can1基因中央区域527bp,并同时敲入带有终止密码子24bp 的外源序列,上同源臂长612bp,下同源臂长634bp,详情见图3(a)。
(2)WHRgfp:敲除can1基因中央区域527bp、并同时敲入cyc终止子及绿 色荧光蛋白(gfp)的表达盒共1570bp(tef启动子、CPS1终止子),上同源臂 长612bp,下同源臂长634bp,详情见图3(b)。
(3)XHR:敲除can1基因中央区域24bp、并同时敲入带有终止密码子24bp 的外源序列,上同源臂长625bp,下同源臂长614bp,详情见图3(c)。
(4)XHRhis:敲除can1基因中央区域24bp、并同时敲入cyc终止子及his3 基因表达盒共1433bp,上同源臂长625bp,下同源臂长614bp。见图3(d)
(5)WHRleu1100:敲除can1基因中央区域527bp、并同时敲入1346bp由cyc 终止子及来自leu2基因的1100bp片段连接而成的基因序列,上同源臂长612bp, 下同源臂长634bp,详情见图3(e)。
(6)WHRgfp1100:敲除can1基因中央区域527bp,并同时敲入1100bp由cyc 终止子及来自gfp基因的720bp片段连接而成的基因序列,上同源臂长612bp, 下同源臂长634bp,详情见图3(f)。
(7)Δ190HRhis:敲除can1基因中央区域190bp、并敲入cyc终止子及 his基因表达盒1178bp,上同源臂长603bp,下同源臂长598bp,详情见图3(g)。
(8)XHR400:敲除can1基因中央区域24bp、并同时敲入带有终止密码子 24bp的外源序列,上同源臂长439bp,下同源臂长494bp,详情见图3(c)。
(9)XHR200:敲除can1基因中央区域24bp、并同时敲入带有终止密码子 24bp的外源序列,上同源臂长272bp,下同源臂长250bp,详情见图3(c)。
在图3中:
1.阴影部分为基因组上被删除或者被替换部分;
2.下划线部分为同源片段上敲入染色体部分;
3.黑体部分为同源片段与基因组序列同源部分;
4.数字表示碱基数;
5.序列前后数字表示相应HR在can1基因中碱基的位数。
采用Overlapping PCR技术,融合上下同源臂及插入基因,T克隆,获得 各HR相应基因克隆质粒如表6所示。
表6 实施例所构建的HR质粒及其验证引物列表
Figure RE-GDA0002326750620000281
Figure RE-GDA0002326750620000291
在进行酿酒酵母靶向基因编辑时,以各同源重组片段(以下简称HR)的T 克隆质粒为模板,应用相应的引物做PCR扩增,获得转化所需的HR片段,这些 HR的PCR产物浓度一般控制在300-400ng/ul。某些实施例所需的单链HR制备 方法为:用PCR仪将双链HR片段99℃加热5分钟之后迅速插冰5分钟,备用。
六、感受态细胞的制备与转化:
将细胞培养到OD600值处于0.78-0.81时,离心收获细胞,用1×TE缓冲液 洗细胞一次,用25μL 1×LiAc/0.5×TE重悬,室温静置10min,加入0.6μg-1 μg pAgo-pRS424-TRP、1.5μg-6μg HR片段和1.5μL鱼精蛋白ss-DNA(10.0 mg/mL),加入250μL1×LiAc/40%PEG3350/1×TE,混合均匀,30℃孵育培养30 min,加入30μL DMSO,混合均匀,42℃热激7min,离心,弃去上清,1mL 1 ×TE洗一次,离心,弃去上清,菌悬液注入10mL相应TRP-的筛选培养基的100mL 三角瓶中,30℃,120rpm或90rmp,培养64-72小时。
七、突变株表型验证:
为了快速评估酿酒酵母基因编辑结果及效率,选用其编码产物为精氨酸转 运蛋白的can1基因作为模式靶标(参见doi:10.1093/nar/gkt135)。can1基 因作为模式靶标可以快速筛选表型,其基本原理是:如果can1基因突变,则酵 母细胞丧失将细胞外的精氨酸转运进入细胞的能力,该突变株可以通过自我合 成精氨酸而继续存活,因为上述精氨酸转运能力的缺失,这类突变株也不能够 运输刀豆氨酸这个有毒的精氨酸类似物,因而可以在含有刀豆氨酸的培养基中 存活并正常生长。与此相对应的是,can1基因未被编辑(未突变)的出发菌株, 却将因为具备精氨酸转运能力而将刀豆氨酸中毒,不能够在含有刀豆氨酸的培 养基中存活下来。
为了提高刀豆氨酸评估can1基因编辑的准确性,以下实施例中,本发明中 相关实施例对刀豆氨酸法评估can1基因编辑的方法做了进一步改进,将培养基 中的刀豆氨酸浓度由60μg/mL提高到80μg/mL,以便排除假阳性。在以上改 进基础上,以酿酒酵母can1为模式基因,建立了平板微滴影印法,以便在每一 个平板上开展多个实验验证筛选。
具体步骤如下:将待检验菌悬液或者待检验菌株的液体培养物取100μL, 注入96孔板中,再依次稀释10-1、10-2、10-3三个稀释度,每个稀释度菌液分别 取3.5μL影印到含有80μg/mL刀豆氨酸和不含有刀豆氨酸的TRP-的YNB筛选培 养基的平板上,能在含有80μg/mL刀豆氨酸筛选培养基的平板上生长的为突变 子,进一步的,可通过转化子的单菌落的数量,以不含有刀豆氨酸的平板为对 照,评估靶向基因编辑效率。
八、靶向基因编辑的分子生物学验证:
随机挑取实施例所获得的can1基因靶向编辑阳性克隆,进行PCR验证,结 果显示全部为靶向基因编辑。具体如下:随机挑取在80μg/mL刀豆氨酸平板上 生长的单菌落,平板扩大培养16小时左右,挑取少量菌体细胞,蒸馏水混悬, 匀浆器震荡裂解,采用敲入和敲除等两套验证引物,进行PCR验证。用敲入定 位验证引物验证插入基因或插入的失活基因的存在,用敲除定位验证引物验证 被敲除基因的敲除。各HR对应的验证引物见表6。
九、具体实施例的实施详情与结果汇总:
1、实施例1-1至实施例1-13:来源于Pantoea anthophila的PaAgo蛋白 介导的靶向基因编辑。
PaAgo蛋白来源于Pantoea anthophila,NCBI登录号:WP_046101283.1, 含有731个氨基酸,以Clostridium Butyricum来源的CbuAgo为参照,其PIWI 核酸酶活性位点预测结果显示,PaAgo蛋白不符合四元基序为DEDX的特征。其 表达质粒paago-pRS424-TRP的构建如方法1所述,相关的同源重组片段(HR) 的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法 4所述,基因编辑的分子生物学验证方法如方法5所述。
PaAgo蛋白靶向基因编辑共13个实施例:实施例1到实施例13,各实施例 的实验体系、条件及结果汇总如表7。
表7 PaAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000311
Figure RE-GDA0002326750620000321
对表7有关实施例进行PCR验证的结果如下:实施例1-5验证结果见图6 (a),实施例1-6验证结果见图6(a),实施例1-7验证结果见图6(c),实施 例1-8验证结果见图6(d),实施例1-10验证结果见图6(e),实施例1-11 验证结果见图6(f),实施例1-12验证结果见图6(a),实施例1-13验证结果 见图6(b),均为阳性结果。其中,实施例1-5、实施例1-6、实施例1-7、实 施例1-8、实施例1-10、实施例1-11、实施例1-12、实施例1-13经进一步的 PCR验证,结果分别见图6(a)、图6(a)、图6(c)、图6(d)、图6(e)、图 6(f)、图6(a)、图6(b)。上述PCR结果表明,所验证的单克隆为预期的靶 向基因编辑的结果。
2、实施例2-1至实施例2-8:来源于Flavobacterium soli的FsAgo蛋白 介导的靶向基因编辑。
FsAgo蛋白来源于Flavobacterium soli,NCBI登录号:WP_026705043.1, 含有664个氨基酸,以Clostridium Butyricum来源的CbuAgo为参照,其PIWI 核酸酶活性位点预测结果显示,FsAgo蛋白不符合四元基序为DEDX的特征。其 表达质粒fsago-pRS424-TRP的构建如方法1所述,相关的同源重组片段(HR) 的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法 4所述,基因编辑的分子生物学验证方法如方法5所述。
FsAgo蛋白靶向基因编辑共8个实施例:实施例2-1到实施例2-8,各实施 例的实验体系、条件及结果汇总如表8。
表8 FsAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000322
Figure RE-GDA0002326750620000331
对表8有关实施例进行PCR验证的结果如下:实施例2-2验证结果见图6 (a),实施例2-4验证结果见图6(a),实施例2-6验证结果见图6(c),实施 例2-8验证结果见图6(d),均为阳性结果。其中,实施例2-2、实施例2-4、 实施例2-6、实施例2-8经进一步的PCR验证,结果分别见图6(a)、图6(a)、 图6(c)、图6(d)。上述PCR结果表明,所验证的单克隆为预期的靶向基因编 辑的结果。3、实施例3-1至实施例3-11:来源于Halogeometricum pallidum 的HpAgo蛋白介导的靶向基因编辑。
HpAgo蛋白来源于Halogeometricum pallidum,NCBI登录号:ELZ29017.1, 含有863个氨基酸,以Clostridium Butyricum来源的CbuAgo为参照,其PIWI 核酸酶活性位点预测结果显示,HpAgo蛋白符合四元基序为DEDX的特征。其表 达质粒hpago-pRS424-TRP的构建如方法1所述,相关的同源重组片段(HR) 的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法 4所述,基因编辑的分子生物学验证方法如方法5所述。
HpAgo蛋白靶向基因编辑共11个实施例:实施例3-1到实施例3-11,各实 施例的实验体系、条件及结果汇总如表9。
表9 HpAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000341
对表9有关实施例进行PCR验证的结果如下:实施例3-6验证结果见图6(a), 实施例3-7验证结果见图6(c),实施例3-9验证结果见图6(d),实施例3-11 验证结果见图6(e),均为阳性结果。其中,实施例3-6、实施例3-7、实施例 3-9、实施例3-11经进一步的PCR验证,结果分别见图6(a)、图6(c)、图6 (d)、图6(e)。上述PCR结果表明,所验证的单克隆为预期的靶向基因编辑 的结果。4、实施例4-1至实施例4-8:来源于Microcystis aeruginosa的MaAgo 蛋白介导的靶向基因编辑。
MaAgo蛋白来源于Microcystis aeruginosa,NCBI登录号: WP_012265209.1,含有747个氨基酸,以Clostridium Butyricum来源的CbuAgo 为参照,其PIWI核酸酶活性位点预测结果显示,MaAgo蛋白符合四元基序为DEDX 的特征。其表达质粒maago-pRS424-TRP的构建如方法1所述,相关的同源重 组片段(HR)的设计构建如方法2所述,转化方法如方法3所述,转化子的表 型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。
MaAgo蛋白靶向基因编辑共8个实施例:实施例4-1到实施例4-8,各实施 例的实验体系、条件及结果汇总如表10。
表10 MaAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000351
对表10有关实施例进行PCR验证的结果如下:实施例4-1验证结果见图6 (g),实施例4-2验证结果见图6(d),实施例4-4验证结果见图6(c),实施 例4-5验证结果见图6(a),实施例4-6验证结果见图6(c),实施例4-7验证 结果见图6(a),实施例4-8验证结果见图6(a),均为阳性结果。其中,实施 例4-1、实施例4-2、实施例4-4、实施例4-5、实施例4-6、实施例4-7、实施 例4-8经进一步的PCR验证,结果分别见图6(g)、图6(d)、图6(c)、图6 (a)、图6(c)、图6(a)、图6(a)。上述PCR结果表明,所验证的单克隆为 预期的靶向基因编辑的结果。
5、实施例5-1至实施例5-6:来源于Halorubrum ezzemoulense的HeAgo 蛋白介导的靶向基因编辑。
HeAgo蛋白来源于Halorubrum ezzemoulense,NCBI登录号: WP_094494460.1,含有847个氨基酸,以Clostridium Butyricum来源的CbuAgo 为参照,其PIWI核酸酶活性位点预测结果显示,HeAgo蛋白符合四元基序为DEDX 的特征。其表达质粒heago-pRS424-TRP的构建如方法1所述,相关的同源重 组片段(HR)的设计构建如方法2所述,转化方法如方法3所述,转化子的表 型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。
HeAgo蛋白靶向基因编辑共6个实施例:实施例5-1到实施例5-6,各实施 例的实验体系、条件及结果汇总如表11。
表11 HeAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000361
对表11有关实施例进行PCR验证的结果如下:实施例5-1验证结果见图6 (a),实施例5-4验证结果见图6(c),实施例5-5验证结果见图6(a),实施 例5-6验证结果见图6(d),均为阳性结果。其中,实施例5-1、实施例5-4、 实施例5-5、实施例5-6经进一步的PCR验证,结果分别见图6(a)、图6(c)、 图6(a)、图6(d)。上述PCR结果表明,所验证的单克隆为预期的靶向基因编 辑的结果。
6、实施例6-1至实施例6-10:来源于filamentous cyanobacterium的FcAgo 蛋白介导的靶向基因编辑。
FcAgo蛋白来源于filamentous cyanobacterium,NCBI登录号: WP_106331578.1,含有745个氨基酸,以Clostridium Butyricum来源的CbuAgo 为参照,其PIWI核酸酶活性位点预测结果显示,FcAgo蛋白符合四元基序为DEDX 的特征。其表达质粒fcago-pRS424-TRP的构建如方法1所述,相关的同源重 组片段(HR)的设计构建如方法2所述,转化方法如方法3所述,转化子的表 型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。
FcAgo蛋白靶向基因编辑共10个实施例:实施例6-1到实施例6-10,各实 施例的实验体系、条件及结果汇总如表12。
表12 FcAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000371
Figure RE-GDA0002326750620000381
对表12有关实施例进行PCR验证的结果如下:实施例6-1验证结果见图6 (a),实施例6-2验证结果见图6(a),实施例6-3验证结果见图6(a),实施 例6-5验证结果见图6(c),实施例6-7验证结果见图6(d),实施例6-8验证 结果见图6(c),实施例6-9验证结果见图6(a),实施例6-10验证结果见图 6(d),均为阳性结果。其中,实施例6-1、实施例6-2、实施例6-3、实施例 6-5、实施例6-7、实施例6-8、实施例6-9、实施例6-10经进一步的PCR验证, 结果分别见图6(a)、图6(a)、图6(a)、图6(c)、图6(d)、图6(c)、图 6(a)、图6(d)。上述PCR结果表明,所验证的单克隆为预期的靶向基因编辑 的结果。
7、实施例7-1至实施例7-11:来源于Mastigocoleus testarum的MtAgo 蛋白介导的靶向基因编辑。
MtAgo蛋白来源于Mastigocoleus testarum,NCBI登录号: WP_027844945.1,含有764个氨基酸,以Clostridium Butyricum来源的CbuAgo 为参照,其PIWI核酸酶活性位点预测结果显示,MtAgo蛋白符合四元基序为DEDX 的特征。其表达质粒mtago-pRS424-TRP的构建如方法1所述,相关的同源重 组片段(HR)的设计构建如方法2所述,转化方法如方法3所述,转化子的表 型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。
MtAgo蛋白靶向基因编辑共11个实施例:实施例7-1到实施例7-11,各实 施例的实验体系、条件及结果汇总如表13。
表13 MtAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000382
Figure RE-GDA0002326750620000391
对表13有关实施例进行PCR验证的结果如下:实施例7-1验证结果见图6 (a),实施例7-3验证结果见图6(a),实施例7-5验证结果见图6(c),实施 例7-7验证结果见图6(d),实施例7-8验证结果见图6(g),实施例7-9验证 结果见图6(c),实施例7-10验证结果见图6(a),实施例7-11验证结果见图 6(d),均为阳性结果。其中,实施例7-1、实施例7-3、实施例7-5、实施例 7-7、实施例7-8、实施例7-9、实施例7-10、实施例7-11经进一步的PCR验 证,结果分别见图6(a)、图6(a)、图6(c)、图6(d)、图6(g)、图6(c)、 图6(a)、图6(d)。上述PCR结果表明,所验证的单克隆为预期的靶向基因编 辑的结果。
8、实施例8-1至实施例8-5:来源于Exiguobacterium sp.的ExAgo蛋白 介导的靶向基因编辑。
ExAgo蛋白来源于Exiguobacterium sp.,NCBI登录号:ACQ71053.1,含 有605个氨基酸,以Clostridium Butyricum来源的CbuAgo为参照,其PIWI 核酸酶活性位点预测结果显示,ExAgo蛋白符合四元基序为DEDX的特征。其表 达质粒exago-pRS424-TRP的构建如方法1所述,相关的同源重组片段(HR) 的设计构建如方法2所述,转化方法如方法3所述,转化子的表型验证如方法 4所述,基因编辑的分子生物学验证方法如方法5所述。
ExAgo蛋白靶向基因编辑共5个实施例:实施例8-1到实施例8-5,各实施 例的实验体系、条件及结果汇总如表14。
表14 ExAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000401
9、实施例9-1至实施例9-26:来源于Exiguobacterium sp.的突变体dExAgo 蛋白介导的靶向基因编辑。
以实施例8-1及8-2中所构建的exago-pRS424-TRP为模版,根据NCBI 登录号:ACQ71053.1记录所指示的ExAgo蛋白的PIWI结构域核酸酶活性位点, 设计突变点引物,实现位点突变D398A/S400A,通过Gibson组装,得到dexago -pRS424-TRP,相关的同源重组片段(HR)的设计构建如方法2所述,转化方法 如方法3所述,转化子的表型验证如方法4所述,基因编辑的分子生物学验证 方法如方法5所述。
dExAgo蛋白靶向基因编辑共26个实施例:实施例9-1到实施例9-26,各 实施例的实验体系、条件及结果汇总如表15。
表15 dExAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000411
Figure RE-GDA0002326750620000421
对表15有关实施例进行PCR验证的结果如下:实施例9-18验证结果见图 6(a),实施例9-19验证结果见图6(c),实施例9-20验证结果见图6(d), 实施例9-22验证结果见图6(e),实施例9-23验证结果见图6(a),均为阳性 结果。其中,实施例9-18、实施例9-19、实施例9-20、实施例9-22、实施例 9-23经进一步的PCR验证,结果分别见图6(a)、图6(c)、图6(d)、图6(e)、 图6(a)。上述PCR结果表明,所验证的单克隆为预期的靶向基因编辑的结果。10、实施例10-1至实施例10-7:来源于Halogeometricum pallidum的突变 dHpAgo蛋白介导的靶向基因编辑。
以实施例3-1及3-11中所构建的hpago-pRS424-TRP为模版,根据NCBI 登录号ELZ29017.1记录所指示的PIWI结构域核酸酶活性位点,设计突变点引 物,实现位点突变D646A,通过Gibson组装,得到dhpago-pRS424-TRP。相关 的同源重组片段(HR)的设计构建如方法2所述,转化方法如方法3所述,转 化子的表型验证如方法4所述,基因编辑的分子生物学验证方法如方法5所述。
dHpAgo蛋白靶向基因编辑共7个实施例:实施例10-1到实施例10-7,各 实施例的实验体系、条件及结果汇总如表16。
表16 dHpAgo蛋白介导的靶向基因编辑实验体系、条件及结果汇总
Figure RE-GDA0002326750620000431
对表16有关实施例进行PCR验证的结果如下:实施例10-3验证结果见图 6(a),实施例10-5验证结果见图6(d),实施例10-7验证结果见图6(e), 均为阳性结果。其中,实施例10-3、实施例10-5、实施例10-7经进一步的PCR 验证,结果分别见图6(a)、图6(d)、图6(e)。上述PCR结果表明,所验证 的单克隆为预期的靶向基因编辑的结果。
通过以上试验结果可以看出,本发明的采用原核生物pAgo蛋白的Ago蛋 白、特别是包含有该Ago蛋白的组合物,其基于对应的靶向基因编辑方法,能 够实现真核细胞内的多种形式的靶向基因编辑,且其编辑效率大多不低于10%, 仅有少数在3%或5%,故本发明能够很好的实现真核细胞的靶向基因编辑,进 而为真核细胞的靶向基因编辑的研究提供了全新的思路。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发 明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发 明的保护范围之内。
缩略词表
Figure RE-GDA0002326750620000451
pAgo蛋白简称命名规则约定:
默认情况下,使用属名的第1个大写字母加种名的第1个小写字母;如果存在重名物种, 则将取用范围延长至种名的前2~4个字母以作区分,与CbAgo同源度高的pAgo优先使用更 短的简称;对于同一物种下的不同Ago蛋白,第1个蛋白使用默认命名法,其后的蛋白附加 NCBI登录号后3位(版本号不计入)以作区分。如果NCBI数据库仅提供了相关Ago的属 名信息,则使用属名的前2~4个字母进行命名。
本专利中所有的关于Ago的表述,包括表1、表2、表3在内,皆遵从本约定。
SEQUENCE LISTING
<110> 石家庄埃佤基因科技有限公司
<120> Ago蛋白的用途及组合物和基因编辑方法
<130> 2019.9.12
<160> 20
<170> PatentIn version 3.3
<210> 1
<211> 731
<212> PRT
<213> Pantoea anthophila
<400> 1
Met Pro Ile Val Leu Asn Ala Phe Pro Leu Lys Val Pro Asp Met Glu
1 5 10 15
Leu Lys Phe Val Gln Ile Pro Tyr Asp Lys Thr Thr Leu Asp Ser Leu
20 25 30
Arg Ser Ser His Lys Met Thr His Val Phe Arg Arg Gln Gly Asp Ser
35 40 45
Ile Gln Ile Phe Ser Ser Asp Gly Thr Phe Pro Lys Ser Gly Thr Pro
50 55 60
Gln Thr Leu Gln Leu Lys Asn Asn Leu Gly Ile Phe Phe Ser Leu Val
65 70 75 80
Lys Asp Gly Leu Leu Lys His Phe Ala Gly Leu Gly Arg Ser Pro Cys
85 90 95
Gly Phe Asn Pro Ile Glu Val Val Ser Ala Gln Ala Lys Asp Asn Leu
100 105 110
Leu Ala Ser Ile Leu Gly Glu Ala Tyr Pro Leu Lys Ile Cys Ala Lys
115 120 125
Tyr Ser Ile Asp Thr Arg Thr Val Gln Gly Gln Pro Cys Leu Ile Ile
130 135 140
Asp Cys Ser Thr Arg Arg Val Val Lys Glu Asn Cys Leu Phe Phe Leu
145 150 155 160
Lys Thr Gly Phe Asn Val Ile Gly Arg Tyr Val Val Thr Glu Gln Asp
165 170 175
Asp Gly Phe Arg Lys Leu Leu Gly Phe Val Glu Asn Cys His Glu Gly
180 185 190
Arg Thr Leu Ser Val Ile Arg Pro Asp Gly Gln Ala Val His Ala Glu
195 200 205
Ala Lys Asp Val Tyr Leu Glu Ala Ser Arg Ala Asn Phe Asp Asp Tyr
210 215 220
Ile Leu Tyr Thr His Gly Thr Lys Lys Asp Ser Ile Val Glu Arg Ile
225 230 235 240
Arg Gln Ser Val Ser Ile Phe Asn Gly Gly Lys Asn Lys Lys Asp Arg
245 250 255
Ile Asp Ala Leu Lys Lys Tyr Ile Gln Ala Thr Asn Ile Ser Leu Leu
260 265 270
Asp Gly Thr Arg Ile Glu Ile Glu Glu Pro Ser Asp Ile Gln Lys Asp
275 280 285
Cys Ala Gln Met Gln Lys Pro Val Phe Val Phe Asn Asp Asn Gly Glu
290 295 300
Ala Asp Trp Thr Glu Lys Gly Leu Thr Gln Asn Gly Pro Tyr Thr Lys
305 310 315 320
Arg Thr Phe Asp Arg Asn Asp Pro Ser Ile Cys Val Ile Cys Ala Gln
325 330 335
His Asp Arg Gly Arg Val Glu Gln Phe Val Arg Lys Leu Leu Lys Gly
340 345 350
Met Ala Asn Ser Lys Tyr Phe Arg Asn Gly Leu Glu Gly Lys Phe Ala
355 360 365
Leu Gly Thr Ser Arg Val Glu Val Phe Glu Thr Ser Thr Asn Ser Val
370 375 380
Asp Ala Tyr Lys Ser Ala Ile Glu Ala Ala Ile Arg Lys Lys Ala Asp
385 390 395 400
Asp Gly Gly Arg Trp Asp Leu Ala Leu Val Gln Val Arg Gln Ser Phe
405 410 415
Lys Gln Leu Lys Val Thr Asp Asn Pro Tyr Tyr Leu Gly Lys Ser Leu
420 425 430
Phe Tyr Met His Gln Val Pro Val Gln Asp Phe Thr Ile Glu Leu Leu
435 440 445
Ser Gln Ser Asp Tyr Ser Leu Gly Tyr Ser Leu Asn Asn Met Ser Leu
450 455 460
Ala Cys Tyr Ala Lys Met Gly Gly Val Pro Trp Leu Leu Lys Ser Ser
465 470 475 480
Pro Thr Leu Ser His Glu Leu Val Ile Gly Ile Gly Asn Ala Asn Ile
485 490 495
Val Gln Glu Arg Gly Ala His Asn Gln Arg Ile Met Gly Ile Thr Thr
500 505 510
Val Phe Ser Gly Asp Gly Ser Tyr Ile Val Ser Ser Thr Ser Lys Ala
515 520 525
Val Val Pro Glu Ala Tyr Cys Glu Ala Leu Thr Ser Val Leu Gly Glu
530 535 540
Asn Ile Glu Lys Ile Gln Arg Arg Met Asn Trp Gln Lys Gly Asp Ser
545 550 555 560
Ile Arg Leu Ile Phe His Ala Gln Val Lys Lys Phe Asn Lys Glu Glu
565 570 575
Ile Gln Ala Val Arg Ala Val Ile Asp Lys Tyr Arg Asp Tyr Gln Ile
580 585 590
Glu Tyr Ala Phe Val Lys Ile Ser Glu Asn His Gly Leu His Met Phe
595 600 605
Asp Ser Ser Thr Ala Thr Met Pro Lys Gly Arg Leu Ala Thr His Arg
610 615 620
Gly Lys Thr Phe Lys Leu Ser Lys Asn Glu Met Leu Val Tyr Leu Ile
625 630 635 640
Gly Gln Arg Glu Leu Arg Gln Glu Thr Asp Gly His Pro Arg Gly Val
645 650 655
Ile Val Asn Val His Lys Asp Ser Thr Phe Lys Asp Ile Lys Tyr Leu
660 665 670
Ser Ala Gln Leu Tyr Ser Phe Ala Ser His Ser Trp Arg Ser Tyr Phe
675 680 685
Pro Asn Pro Met Pro Val Thr Ile Thr Tyr Ser Asp Leu Ile Ala His
690 695 700
Asn Leu Gly Trp Leu Asn Gln Leu Pro Gly Trp Ser Asp Ser Val Met
705 710 715 720
Ile Gly Lys Ile Gly His Ser Gln Trp Phe Leu
725 730
<210> 2
<211> 664
<212> PRT
<213> Flavobacterium soli
<400> 2
Met Ser Gly Leu Phe Leu Asn Phe Tyr Gln Val Asp Ile Pro Thr Lys
1 5 10 15
Ser Val Pro Ile His Ser Val Glu Tyr Ser His Tyr Ser Ser Lys Glu
20 25 30
Ala Phe Ile Ala Leu Lys Glu Asn Phe Pro Tyr Phe Ser Phe Tyr Arg
35 40 45
Asp Asp Asp Arg Ile Leu Ile Trp Lys Lys Asp Lys Asp Ala Glu Leu
50 55 60
Pro Glu Lys Asn Ser Leu Ile Glu Ile Asp Phe Thr Glu Lys Ala Lys
65 70 75 80
Val Leu Ser Lys Ile Leu Glu Arg Ala Ile Ile Asp Phe Ile Glu Pro
85 90 95
Lys Gly Tyr Lys Ile Phe Lys Asn Lys Tyr Ser Asn Ser Trp Glu Ile
100 105 110
Val Ser Met Lys Asp Ile Leu Asn Gly Gly Ile Glu Gly Leu Ser Ile
115 120 125
Asn Arg Ile Val His Phe Ser Pro Cys Phe Phe Phe Lys Glu Asn Lys
130 135 140
Leu Met Leu Gly Phe Ser Leu Ser Thr Ser Leu Lys Asn Val Phe Thr
145 150 155 160
Trp Asn Lys Ala Asp Phe Glu Arg Tyr Gly Phe Asp Ile Lys Gly Leu
165 170 175
Lys Gly Asp Glu Glu Arg Ile Phe Ala Asn Lys Gln Ser Leu Lys Arg
180 185 190
Phe Leu Glu Thr Lys Gly Ala Val Ala Met Tyr Asp Gln Ile Ile Ala
195 200 205
Lys Glu Asn Lys Asn Ala Lys Met Phe Ser Ile Ile Asp Gly Phe Tyr
210 215 220
Arg Trp Leu Glu Arg Asn Lys Thr Glu Ile Gln Leu Pro Phe Gly Leu
225 230 235 240
Lys Ile Asn Ser Val Ser Lys Lys Tyr Leu Pro Phe Glu Asp Glu Leu
245 250 255
Ile Lys Ser Glu Ile Ile Pro Lys Pro Gln Arg Tyr Phe Tyr Ser Asn
260 265 270
Arg Lys Asn Thr Gln Ser Leu Arg Tyr Tyr Asp Glu Met Val Lys Thr
275 280 285
Tyr Gln Pro Tyr Ser Leu Glu Leu Tyr Gln Asn Lys Gln Ile Asn Ile
290 295 300
Gly Ile Ile Cys Pro Ser Glu Tyr Gln Gly Glu Thr Glu Gly Phe Ile
305 310 315 320
Lys Lys Ile Glu Leu Lys Leu Lys Glu Val Phe His Phe Asn Ser Leu
325 330 335
Ile Phe His Phe Lys Thr Ile Thr Asn Lys Asp Leu Ala Ser Tyr Lys
340 345 350
Glu Val Leu Tyr Asp Asp Glu Leu Leu Lys Cys Asp Leu Ile Tyr Val
355 360 365
Ile Val Asn Glu Ala Gln Glu Lys Leu Ser Pro Asn Asn Ser Pro Tyr
370 375 380
Tyr Val Cys Lys Ala Lys Phe Ile Gly Asn Gly Ile Pro Thr Gln Asp
385 390 395 400
Ile Gln Ile Glu Thr Ile Arg Gln Asn Leu Asn Ala Phe Thr Met Thr
405 410 415
Asn Ile Ser Leu Asn Ser Tyr Ala Lys Leu Gly Gly Thr Ala Trp Thr
420 425 430
Ile Glu Lys Glu Asp Lys Leu Lys Asp Glu Leu Val Ile Gly Ile Gly
435 440 445
Ser Thr Leu Ser Glu Asn Gly Gln Phe Val Leu Gly Ile Ala Gln Ile
450 455 460
Phe His Asn Asp Gly Arg Tyr Met Ala Gly Asp Cys Ser Pro Leu Ser
465 470 475 480
Thr Phe Ser Asn Tyr Ala Glu Asn Leu Glu Asp His Leu Tyr Lys Thr
485 490 495
Leu Lys Pro Leu Val Glu Glu Met Ser Lys Ser Gly Thr Phe Arg Leu
500 505 510
Ile Phe His Leu Phe Lys Ser Ala Ser Glu Glu Tyr Glu Ile Arg Ala
515 520 525
Ile Asn Gly Leu Gln Lys Arg Leu Ala Asn Tyr Asn Phe Glu Phe Ala
530 535 540
Leu Val His Leu Ala Tyr Gly His Asn Phe Arg Leu Tyr Tyr Asn Asp
545 550 555 560
Gly Asn Gly Asp Ile Asn Gln Gly Thr Tyr Ile Gln Leu Ser Lys His
565 570 575
Ser Ala Leu Leu His Phe Val Ser Lys Ser Asp Leu Pro Leu Lys Ile
580 585 590
Asp Leu Asp Lys Arg Ser Thr Phe Thr Ser Leu Phe Tyr Ile Ala Lys
595 600 605
Gln Val Tyr Trp Phe Ser His Leu Ser His Arg Ser Tyr Met Pro Ser
610 615 620
Lys Arg Thr Val Thr Ile Met Tyr Pro Ser Ile Met Ala Lys Met Thr
625 630 635 640
Glu Glu Leu Lys Lys Val Glu Gly Trp Asp Tyr Glu Arg Leu Lys Ala
645 650 655
Val Ser Asp Lys Leu Trp Phe Ile
660
<210> 3
<211> 863
<212> PRT
<213> Halogeometricum pallidum
<400> 3
Met Val Lys Arg Tyr Ile Ser Phe His Leu Phe Pro Arg Ile Lys Leu
1 5 10 15
Cys Gly Val Tyr Leu Cys Leu Arg Met Asn Thr Lys Asp Asp Ile Ala
20 25 30
His Lys Gln Pro Ile Thr Ile Glu Val Gln Val Leu Lys Glu Leu Asp
35 40 45
Lys Pro Ser Pro Lys Met Ala Thr Arg Leu Leu Val Ala Asp Arg Ala
50 55 60
Gly Asn Arg Phe Pro Leu Ala Ile Trp Lys Asn Asn Ala Leu Ser Asp
65 70 75 80
Tyr Asp Trp Thr Ile Gly Gln Trp Tyr Arg Leu Glu Asn Ala Arg Gly
85 90 95
Asn Val Phe Asn Gly Lys Gln Ser Leu Asn Gly Ser Ser Asn Met Arg
100 105 110
Ala Thr Pro Leu Glu Ala Ser Glu Glu Asp Glu Thr Arg Ala Asp Asp
115 120 125
Val Gly Arg Val Asp Thr Ile Leu Gly Asn Leu Ser Pro Asn Gln Ala
130 135 140
Tyr Leu Ser Leu Phe Pro Ile Ser Arg Ser Phe Asp Thr Leu Ser Val
145 150 155 160
Tyr Glu Tyr Ser Ile Glu Ala Ala Glu Ala Phe Glu Asp Asp Pro Asp
165 170 175
Thr Val Thr Tyr Gln Cys Ala Gly Arg Leu Arg Arg Ile Thr Gly Ala
180 185 190
Gly Val Ala Tyr Ala Gly Pro Met Gln Ile Val Ser Thr Arg Lys Leu
195 200 205
Pro Asp Lys Leu Ala Asp Pro Phe Ser Leu Ser Glu Pro Thr Glu Arg
210 215 220
Glu Leu Lys Ala Ala Asp Ala Arg Asp Arg His Arg Ile Glu Arg Leu
225 230 235 240
Leu Lys Ser Leu Val Lys Ala Ala Ile Asp Asp Ser Thr Tyr Asp Pro
245 250 255
Tyr Gln Ile Asn Arg Ile Arg Ala Arg Thr Pro Ala Ile Thr Ala Gly
260 265 270
Asp Gly Leu Phe Glu Ala Cys Tyr Glu Phe Ala Ala Arg Val Asp Val
275 280 285
Met Pro Ser Gly Asp Ala Phe Val Gly Ile Glu Val Arg Tyr His Ala
290 295 300
Arg Ser Gln Val Thr Ala Asp Val Tyr Glu Asp Lys Thr Gly Glu Leu
305 310 315 320
Val Gly Thr Ile Val Glu His Asp Pro Glu Arg Tyr Asn Val Ser Gly
325 330 335
Thr Gly Arg Val Val Gly Phe Thr Asp His Tyr Phe Thr Asp Ala Leu
340 345 350
Asp Glu Leu Gly Gly Leu Ser Leu Ala Asp Trp Tyr Ala Gln Lys Asp
355 360 365
Arg Val Pro Glu Gly Val Leu Glu Ala Leu Arg Glu Lys Asn Pro Arg
370 375 380
Leu Val Asp Ile Gln Tyr Gln Glu Asp Glu Pro Ala Gln Ile His Val
385 390 395 400
Pro Glu Leu Leu Arg Val Ala Pro Arg Lys Glu Val Val Lys Glu Leu
405 410 415
Asp Pro Thr Phe His Arg Arg Trp Asp Arg Glu Ala Lys Met Leu Pro
420 425 430
Asp Lys Arg Phe Arg His Ala Ile Glu Phe Val Asp His Leu Gly Ser
435 440 445
Leu Pro Asp Ile Asp Ala Thr Val Ala Pro Glu Pro Leu Gly Pro Ser
450 455 460
Leu Ser Tyr Met Ser Thr Ala Val Asp Arg Glu Glu Asn Leu Arg Phe
465 470 475 480
Lys Asp Gly Arg Thr Ala Thr Thr Pro Ser Ser Gly Ile Arg Ser Gly
485 490 495
Val Tyr Gln Gln Pro Thr Ser Phe Asp Ile Ala Tyr Val Tyr Pro Thr
500 505 510
Glu Ser Glu Gln Glu Ser Lys Gln Phe Ile Ser Asn Phe Glu Asn Lys
515 520 525
Leu Ser Arg Cys His Cys Glu Pro Thr Ala Thr Arg His Val Pro Tyr
530 535 540
Glu Leu Gly Gly Glu Leu Ser Tyr Leu Ala Val Ile Asn Glu Leu Glu
545 550 555 560
Ser Val Asp Ala Val Leu Ala Val Val Pro Pro Arg Asn Asp Asp Arg
565 570 575
Ile Ala Ala Gly Asp Ile Thr Asp Pro Tyr Pro Glu Phe Lys Lys Gly
580 585 590
Leu Gly Lys Gln Lys Val Pro Ser Gln Met Val Val Thr Glu Asn Leu
595 600 605
Asp Thr Arg Trp Val Met Asn Asn Thr Ala Met Gly Leu Ile Ala Gly
610 615 620
Ala Gly Gly Val Pro Trp Arg Val Asp Glu Met Pro Gly Glu Ala Asp
625 630 635 640
Cys Phe Ile Gly Leu Asp Val Thr Arg Asp Pro Glu Thr Gly Gln His
645 650 655
Leu Gly Ala Ser Ala Asn Val Val Tyr Ala Asp Gly Thr Val Phe Ala
660 665 670
Ser Lys Thr Gln Thr Leu Gln Ser Gly Glu Thr Phe Asp Glu Gln Ser
675 680 685
Ile Ile Asp Val Ile Lys Asp Val Phe Gln Glu Phe Val Arg Arg Glu
690 695 700
Gly Arg Ser Pro Glu His Ile Val Ile His Arg Asp Gly Arg Leu Phe
705 710 715 720
Glu Asp Ala Asp Glu Ile Gln Ala Pro Phe Ala Asp Ser Gly Val Ser
725 730 735
Ile Asp Ile Leu Asp Ile Arg Lys Ser Gly Ala Pro Arg Ile Ala Arg
740 745 750
Tyr Glu Asp Asn Ser Phe Lys Ile Asp Glu Lys Gly Arg Leu Phe Ile
755 760 765
Ser Gln Asp Asp Thr His Gly Phe Ile Ala Thr Thr Gly Lys Pro Glu
770 775 780
Phe Asp Asp Ser Asp Asn Leu Gly Thr Pro Lys Thr Leu Arg Val Val
785 790 795 800
Arg Arg Ala Gly Asp Thr Pro Met Leu Thr Leu Leu Lys Gln Val Tyr
805 810 815
Trp Leu Ser Glu Ala His Ile Gly Ser Val Ser Arg Ser Val Arg Leu
820 825 830
Pro Ile Thr Thr Tyr Tyr Ala Asp Arg Cys Ala Glu His Ala Arg Glu
835 840 845
Gly Tyr Leu Leu His Gly Glu Leu Ile Glu Gly Val Pro Tyr Leu
850 855 860
<210> 4
<211> 747
<212> PRT
<213> Microcystis aeruginosa
<400> 4
Met Asn Tyr Thr Ala Ala Asn Thr Ala Asn Ser Pro Ile Phe Leu Ser
1 5 10 15
Glu Ile Ser Ser Leu Thr Leu Lys Asn Ser Cys Leu Asn Cys Phe Gln
20 25 30
Leu Asn His Gln Val Thr Arg Lys Ile Gly Asn Arg Phe Ser Trp Gln
35 40 45
Phe Ser Arg Lys Phe Pro Asp Val Val Val Ile Phe Glu Asp Asn Cys
50 55 60
Phe Trp Val Leu Ala Lys Asp Glu Lys Ser Ile Pro Ser Leu Gln Gln
65 70 75 80
Trp Lys Glu Ala Leu Ser Asp Ile Gln Glu Val Leu Arg Glu Asp Ile
85 90 95
Gly Asp His Tyr Tyr Ser Ile His Trp Leu Lys Asp Phe Gln Ile Thr
100 105 110
Ala Leu Val Thr Ala Gln Leu Ala Val Arg Ile Leu Lys Ile Phe Gly
115 120 125
Lys Phe Ser Asp Pro Ile Val Phe Pro Lys Asp Ser Gln Ile Ser Glu
130 135 140
Asn Gln Val Gln Val Arg Arg Glu Val Asn Phe Trp Ala Glu Ile Ile
145 150 155 160
Asn Asp Thr Asp Pro Ala Ile Cys Leu Thr Val Asp Ser Ser Ile Val
165 170 175
Tyr Ser Gly Asp Leu Glu Gln Phe Tyr Glu Asn His Pro Tyr Arg Gln
180 185 190
Asp Ala Val Lys Leu Leu Val Gly Leu Lys Val Lys Asp Arg Glu Thr
195 200 205
Asn Gly Thr Ala Lys Ile Ile Arg Ile Ala Gly Arg Ile Gly Glu Arg
210 215 220
Arg Glu Asp Leu Leu Thr Lys Ala Thr Gly Ser Ile Ser Arg Arg Lys
225 230 235 240
Leu Glu Glu Ala His Leu Gly Gln Pro Val Val Ala Val Gln Phe Gly
245 250 255
Lys Asn Pro Gln Glu Tyr Ile Tyr Pro Leu Ala Ala Leu Lys Pro Trp
260 265 270
Val Thr Asp Glu Asp Glu Ser Leu Phe Gln Val Asn Tyr Gly Asn Leu
275 280 285
Leu Lys Ala Thr Lys Ile Phe Tyr Ala Glu Arg Gln Glu Leu Leu Lys
290 295 300
Leu Tyr Lys Gln Glu Ala Gln Lys Ala Leu Asn Asn Phe Gly Phe Gln
305 310 315 320
Leu Arg Glu Lys Ser Ile Asn Ser Gln Glu Tyr Pro Glu Leu Phe Trp
325 330 335
Thr Pro Ser Ile Ser Ile Glu Gln Thr Pro Ile Leu Phe Gly Gln Gly
340 345 350
Glu Arg Gly Glu Lys Arg Glu Ile Ile Lys Gly Leu Ser Lys Gly Gly
355 360 365
Val Tyr Lys Arg His Arg Glu Tyr Val Asp Pro Ala Arg Lys Ile Arg
370 375 380
Leu Ala Ile Leu Lys Pro Ala Asn Leu Lys Val Gly Asp Phe Arg Glu
385 390 395 400
Gln Leu Glu Lys Arg Leu Lys Leu Tyr Lys Phe Glu Thr Ile Leu Pro
405 410 415
Pro Glu Asn Gln Ile Asn Phe Ser Val Glu Gly Leu Gly Phe Glu Lys
420 425 430
Arg Ala Arg Leu Glu Glu Ala Val Asp Arg Leu Ile Gly Val Glu Ile
435 440 445
Pro Val Asp Ile Ala Leu Val Phe Leu Pro Gln Glu Asp Arg Asn Ala
450 455 460
Asp Asn Thr Glu Glu Gly Ser Leu Tyr Ser Trp Ile Lys Arg Lys Phe
465 470 475 480
Leu Gly Arg Gly Val Ile Thr Gln Met Ile Tyr Glu Lys Thr Leu Asn
485 490 495
Asp Lys Ser Asn Tyr Lys Asn Ile Leu Asn Gln Val Val Pro Gly Ile
500 505 510
Leu Ala Lys Leu Gly Asn Leu Pro Tyr Val Leu Ala Glu Pro Leu Glu
515 520 525
Ile Ala Asp Tyr Phe Ile Gly Leu Asp Val Gly Arg Met Pro Lys Lys
530 535 540
Asn Leu Pro Gly Ser Leu Asn Val Cys Ala Ser Val Arg Leu Tyr Gly
545 550 555 560
Lys Gln Gly Glu Phe Val Arg Cys Arg Val Glu Asp Ser Leu Thr Glu
565 570 575
Gly Glu Glu Ile Pro Gln Arg Ile Leu Glu Asn Cys Leu Pro Gln Ala
580 585 590
Glu Leu Lys Asn Gln Thr Val Leu Ile Tyr Arg Asp Gly Lys Phe Gln
595 600 605
Gly Lys Glu Val Glu Asn Leu Leu Ala Arg Ala Arg Ala Ile Asn Ala
610 615 620
Lys Phe Ile Leu Val Glu Cys Tyr Lys Thr Gly Ile Pro Arg Leu Tyr
625 630 635 640
Asn Leu Gln Gln Lys Gln Ile Asn Ala Pro Ser Lys Gly Leu Ala Leu
645 650 655
Ala Leu Ser Asn Arg Glu Val Ile Leu Ile Thr Ser Gln Val Ser Glu
660 665 670
Gln Ile Gly Val Pro Arg Pro Leu Arg Leu Lys Val His Glu Leu Gly
675 680 685
Glu Gln Arg Asn Leu Lys Gln Leu Val Asp Thr Thr Leu Lys Leu Thr
690 695 700
Leu Leu His Tyr Gly Ser Leu Lys Asp Pro Arg Leu Pro Ile Pro Leu
705 710 715 720
Tyr Gly Ala Asp Ile Ile Ala Tyr Arg Arg Leu Gln Gly Ile Tyr Pro
725 730 735
Ser Leu Leu Glu Asp Asp Cys Gln Phe Trp Leu
740 745
<210> 5
<211> 847
<212> PRT
<213> Halorubrum ezzemoulense
<400> 5
Met Thr Thr Gln Ala Asp Ile Glu Asp Gly Lys Arg Ile Asp Ile Thr
1 5 10 15
Val Gln Val Val Ala Glu Leu Asp Cys Thr Thr Ser Lys Met Ala Lys
20 25 30
Arg Leu Lys Val Arg Asp Thr Ala Gly Asn Glu Phe Pro Leu Ala Ile
35 40 45
Trp Asn Asn Asn Ala Leu Ser Asp Phe Ala Trp Glu Ser Gly Arg Trp
50 55 60
Tyr Glu Leu Glu Asn Ala Lys Gly Asn Glu Trp Arg Gly Glu Lys Ser
65 70 75 80
Leu Asn Gly Ser Ser Arg Leu Ser Ala Glu Ile Val Glu Pro Pro Glu
85 90 95
Glu Glu Asn Glu Asp Ser Ser Glu Ser Glu Lys Ile Ser Gly Gly Gln
100 105 110
Leu Phe Asp Thr Leu Gln Asp Asn Leu Pro Tyr Leu Ser Leu Phe Pro
115 120 125
Phe Asp Arg Asp Phe Glu Thr Leu Ser Val Tyr Glu Tyr Arg Ile Glu
130 135 140
Ala Asn Asp Ala Phe Glu Asp Ser Pro Met Asp Ala Thr Tyr Asn Leu
145 150 155 160
Ala Ala Tyr Leu Arg Ser Ser Ser Asn Ala Ala Val Thr His Ala Gly
165 170 175
Val Met Ser Leu Ile Ser Thr Glu Pro Leu Glu Ile Ser Leu Pro Asp
180 185 190
Pro Phe Thr Leu Thr Ser Glu Thr Arg Val Thr Leu Arg Ala Asp Glu
195 200 205
Thr Ser Asp Asn Glu Thr Met Val Arg Leu Leu Gln Gln Leu Ile Lys
210 215 220
Lys Ser Ile Ser Thr Asp Lys Tyr Glu Thr Gly Arg Val Asp Arg Ile
225 230 235 240
Arg Thr Lys Glu Pro Val Ile Ser Gly Pro Glu Gly Leu Phe Glu Ala
245 250 255
Cys Leu Ala Tyr Arg Val Gly Ile Glu Val Leu Pro Ser Gly Asp Ala
260 265 270
Tyr Val Gly Val Glu Val Ser His His Ala Arg Ser Gln Ala Thr Val
275 280 285
Asp Glu Tyr Ile Asp Arg Val Asn Ala Thr Val Asp Glu Leu Val Asp
290 295 300
Thr His Val Glu His Asp Pro Glu Thr Tyr Ser Thr Pro Gly Ser Gly
305 310 315 320
Gln Leu Lys Ser Leu Ala Asp Val Arg Phe Thr Asp Pro Ile Pro Asp
325 330 335
Phe Gly Asn Gln Ser Leu Ala Asp Trp Tyr Glu Arg Lys Asp Arg Val
340 345 350
Ser Asp Glu Met Leu Asp Gln Leu Arg Ser Glu Asn Pro Arg Leu Val
355 360 365
Glu Val Gln Tyr Asn Pro Asn Ser Asp Glu Thr Ser Val His Val Pro
370 375 380
Gln Leu Leu Arg Val Ser Pro Arg Lys Glu Val Val Lys Gln Leu Ser
385 390 395 400
Pro Arg Phe His Arg Glu Trp Asp Arg Arg Ala Lys Met Leu Pro Glu
405 410 415
Glu Arg Phe Gln Lys Ala Thr Gln Phe Val Thr Asp Leu Asp Thr Leu
420 425 430
Pro Ala Val Asp Thr Tyr Leu Asp Pro Thr Pro Val Gly Pro Ser Ile
435 440 445
Ser Phe Met Ser Thr Glu Val Asp Arg Ala Asp Asn Leu Arg Phe Gly
450 455 460
Asn Asp Cys Thr Ala Asp Leu Pro Gly Ser Gly Leu Asn Arg Tyr Gly
465 470 475 480
Val Tyr Arg Arg Pro Ser Ser Phe Arg Leu His Tyr Leu Val Pro Glu
485 490 495
Arg Tyr Thr Asp Glu Phe Val Glu Leu Arg Ser Arg Ile Glu Glu Gln
500 505 510
Leu Glu Asp Met Asn Cys Ser Pro Asp Glu Met Ser Tyr Ser Glu Tyr
515 520 525
Ala Leu Gly Ser Glu Ile Glu Tyr Ser Asn Ala Ala Ala Ala Ile Ser
530 535 540
Asp Val Asp Val Val Leu Ala Ala Val Pro Ser Pro Ser Asn Asp Phe
545 550 555 560
Ile Gln Asp Gly Thr Ile Asp Asp Pro Tyr Gly Glu Phe Lys Lys Ala
565 570 575
Leu Gly Lys Gln Thr Ile Pro Ser Gln Met Val Arg Val Asp Asn Leu
580 585 590
Asp Asn Lys Trp Val Val Arg Asn Thr Ala Leu Gly Ile Ile Ala Gly
595 600 605
Ala Gly Gly Val Pro Trp Arg Val Asp Gln Met Pro Gly Asn Thr Asp
610 615 620
Cys Phe Val Gly Leu Asp Ala Thr Arg Asp Pro Asp Thr Gly Gln Phe
625 630 635 640
Leu Gly Ala Ser Ala Asn Val Val Leu Ala Asp Gly Thr Val Phe Val
645 650 655
Ser Lys Thr Gln Ser Leu Gln Ser Gly Glu Thr Phe Asp Glu Asp Ala
660 665 670
Val Val Asp Val Leu Lys Asp Val His Arg Glu Phe Val Arg Ala Glu
675 680 685
Gly Glu Lys Pro Asn Ser Ile Val Val His Arg Asp Gly Arg Leu Phe
690 695 700
Glu Asp Val Asp Ala Ile Leu Ala Pro Phe Asn Gly Thr Gly Ile Asp
705 710 715 720
Ile Asp Ile Leu Asp Ile Arg Lys Ser Gly Ala Pro Arg Ala Ala Phe
725 730 735
Arg Arg Asn Gly Gln Phe Arg Val Asp His Lys Gly Arg Ile Phe Ile
740 745 750
Ala Gln Asn Asp Asp His Gly Phe Leu Thr Thr Thr Gly Arg Pro Glu
755 760 765
Phe Asp Asp Ser Asp Gly Leu Gly Thr Pro Arg Thr Leu Arg Ile Val
770 775 780
Arg Arg Ala Gly Glu Thr Pro Met Gln Thr Leu Met Glu Gln Val Tyr
785 790 795 800
Trp Leu Ser Glu Ser His Val Gly Ser Ala Gln Arg Ser Thr Arg Leu
805 810 815
Pro Ile Thr Thr Tyr Tyr Ala Asp Arg Cys Ala Glu Ala Thr Arg Lys
820 825 830
Gly Tyr Leu Val Asn Gly Glu Ile Ile Arg Gly Val Pro Tyr Ile
835 840 845
<210> 6
<211> 745
<212> PRT
<213> Filamentous cyanobacterium
<400> 6
Met Thr Val Ala Val Gln Val His Thr Gln Pro Ala Ser Pro Ile Phe
1 5 10 15
Leu Ser Glu Ile Phe Pro Leu Arg Ile Ser Gln Leu Asn Leu Ile Gly
20 25 30
Phe Arg Val Thr Pro Glu Val Asp Arg Glu Ile Gly Asn Arg Leu Ser
35 40 45
Trp Arg Phe Ser Gln Lys Phe Pro Asp Val Val Ala Ile Trp Gln Asp
50 55 60
Lys Tyr Phe Trp Val Leu Ala Lys Pro Asp Gln Pro Met Pro Ser Gln
65 70 75 80
Asp Glu Trp Arg Leu Lys Leu Ala Glu Ile Leu Glu Glu Leu Lys Lys
85 90 95
Asp Ile Gly Asp Arg Tyr Tyr Ser Ile Gln Trp Val Arg Glu Pro Gln
100 105 110
Val Thr Ala Ser Ile Leu Ala Gln Leu Ala Val Arg Val Leu Lys Ile
115 120 125
Ala Arg Pro Phe Ser Ser Asn Ser Val Met Ser Glu Asn Gln Val Gln
130 135 140
Val Arg Arg Glu Val Asp Phe Trp Ala Glu Thr Ile Asp Leu Gln Gly
145 150 155 160
Val Leu Gln Pro Ala Leu Thr Leu Thr Ile His Ser Arg Ile Leu Phe
165 170 175
Lys Gly Asp Leu Ala Gln Phe Cys Glu Asn His Pro Tyr Arg Gln Asp
180 185 190
Pro Lys Asn Ile Leu Ile Gly Leu Lys Val Arg Asp Ile Glu His Asn
195 200 205
Ser Phe Ala Arg Ile Thr Gly Ile Val Gly Thr Ile Glu Glu His Arg
210 215 220
Asp Gln Leu Leu Lys Glu Ala Thr Gly Ala Ile Ser Lys Gln Ala Leu
225 230 235 240
Lys Asp Ala Pro Asn Glu Gln Pro Val Val Ala Val Gln Phe Gly Lys
245 250 255
Asp Ala Lys Pro Phe His Tyr Ala Met Ala Ala Leu Arg Pro Cys Ile
260 265 270
Thr Pro Glu Thr Ala Lys Arg Phe Glu Val Asp Tyr Gly Glu Leu Leu
275 280 285
Lys Ala Thr Lys Val Ser Tyr Lys Asp Arg Lys Asp Leu Leu Val Leu
290 295 300
Tyr Lys Lys Glu Ala Gly Glu Ala Leu Tyr Asn Tyr Gly Phe Gln Leu
305 310 315 320
Glu Arg Ser Ile Asn Ser Arg Asp Cys Pro Asn Leu Phe Trp Glu Pro
325 330 335
Lys Val Lys Val Glu Gln Thr Gln Leu Met Phe Gly Glu Asn Phe Thr
340 345 350
Gly Ile Gln Ser Gln Ile Leu Thr Gly Leu Ser Lys Gly Gly Val Tyr
355 360 365
Arg Arg His Glu Asp Tyr Leu Asp Pro Ser Arg Pro Ile Arg Ile Ala
370 375 380
Ala Leu Lys Leu Cys Asn Phe Lys Val Gly Ser Phe Leu Ser Glu Phe
385 390 395 400
Gln Lys Arg Leu Lys Arg Tyr Gly Phe Glu Ser Ile Leu Pro Glu Glu
405 410 415
Asn Lys Lys Glu Leu Ser Val Asp Ser Leu Arg Gly Ala Glu Ala Arg
420 425 430
Ala Lys Val Glu Glu Ala Val Asp Asp Leu Met Val Arg Gln Pro Asp
435 440 445
Val Val Leu Thr Phe Leu Pro Thr Ser Asp Arg His Ala Asp Asp Lys
450 455 460
Glu Gly Gly Ser Leu Tyr Ser Trp Val Tyr Ser Arg Leu Leu Arg Arg
465 470 475 480
Gly Ile Ala Ser Gln Val Ile Tyr Glu Asp Thr Leu Arg Asn Val Gln
485 490 495
Ala Asn Tyr Leu Leu Asn Gln Val Ile Pro Gly Val Leu Ala Lys Leu
500 505 510
Gly Asn Leu Pro Phe Ile Leu Ala Glu Pro Leu Glu Ile Ala Asp Tyr
515 520 525
Phe Ile Gly Leu Asp Ile Ser Arg Gly Ser Lys Lys Lys Gly Ala Gly
530 535 540
Thr Met Asn Ala Cys Ala Ser Val Arg Leu Tyr Gly Lys Gln Gly Glu
545 550 555 560
Phe Ile Arg Tyr Arg Leu Glu Asp Ala Leu Ile Glu Gly Glu Glu Ile
565 570 575
Pro Gln Arg Ile Leu Glu Ser Phe Leu Pro Ala Ala Asp Leu Lys Asn
580 585 590
Lys Thr Val Leu Ile Tyr Arg Asp Gly Arg Phe Cys Gly Glu Glu Val
595 600 605
Lys Tyr Leu Arg Glu Arg Ala Asn Ala Ile Ser Ser Lys Phe Ile Leu
610 615 620
Val Glu Cys Tyr Lys Ser Gly Ile Pro Arg Met Tyr Asn Leu Thr Glu
625 630 635 640
Lys Leu Val Leu Pro Pro Arg Lys Gly Leu Ala Leu Arg Ile Ser Asp
645 650 655
Phe Glu Ala Ile Leu Val Thr Thr Glu Val Lys Ser Glu Ser Met Gly
660 665 670
Leu Pro Leu Pro Leu Arg Leu Asn Val Ile Pro Tyr Pro Gly Gln Gln
675 680 685
Val Ser Ile Glu Ser Val Val Glu Thr Thr Val Gln Leu Thr Leu Leu
690 695 700
His His Gly Ser Leu Asn Glu Pro Arg Leu Pro Ile Pro Leu Phe Gly
705 710 715 720
Ser Asp Arg Met Ala Tyr Arg Arg Leu Gln Gly Ile Tyr Pro Gly Ala
725 730 735
Leu Asp Gly Asp Arg Gln Phe Trp Leu
740 745
<210> 7
<211> 764
<212> PRT
<213> Mastigocoleus testarum
<400> 7
Met Asn Ile Ala Ile Thr Lys Pro Leu Pro Gln Ser Ala Val Thr Pro
1 5 10 15
Ile Phe Leu Ser Glu Ile Leu Pro Leu Ile Phe Glu Val Asp Asn Ser
20 25 30
Arg Tyr Asn Leu Lys Glu Asn Ile Ile Cys Phe Gln Ile Phe Pro Glu
35 40 45
Val Gly Arg Glu Ile Gly Asn Arg Leu Ser Trp His Leu Cys Gln Lys
50 55 60
Phe Thr Glu Leu Ile Val Ile Trp Gln Asn Asn Phe Phe Trp Val Leu
65 70 75 80
Asn Lys Pro Thr Gln Ile Pro Pro Asn His Lys Gln Phe Lys Lys Ala
85 90 95
Leu Leu Glu Ile Cys Glu Glu Leu Lys Arg Asp Ile Ser Asn Ser Tyr
100 105 110
Asn Phe Asn Phe Ala Phe His Asn Asn Tyr Ser Val Gln Leu Val Glu
115 120 125
Lys Pro Gln Ile Thr Ala Ser Thr Leu Ala Gln Leu Ala Thr Arg Ile
130 135 140
Leu Lys Ile Ala Cys Pro Phe Ser Ser Pro Ile Ala Phe Ser Gln Lys
145 150 155 160
Gln Val Glu Val Arg Arg Glu Ala Asn Phe Trp Ala Glu Ile Ile Glu
165 170 175
Leu Glu Gly Gln Phe Ile Pro Ala Leu Thr Ile Thr Ala Lys Ser Asn
180 185 190
Phe Asn Cys Thr Ile Asn Leu Ala Glu Phe Tyr Gln Asn His Ser Tyr
195 200 205
Lys Gln Asn Pro Gln Gln Leu Leu Val Gly Leu Lys Val Gln Asp Ile
210 215 220
Glu Arg Ser Ser Phe Ala Thr Ile Thr Gly Ile Val Gly Thr Val Gly
225 230 235 240
Glu His Lys Glu Lys Leu Lys Ala Ser Ala Thr Gly Thr Ile Ser Lys
245 250 255
Gln Ala Leu Glu Glu Ala Pro Asp Glu Gln Pro Leu Val Ser Val Gln
260 265 270
Phe Gly Lys Asn Lys Gln Gln Phe His Tyr Ala Met Gly Ala Leu Arg
275 280 285
Pro Cys Ile Thr Leu Glu Thr Ala Ile Lys Leu Gly Leu Glu His Asn
290 295 300
Lys Leu Leu Asn Val Ala Lys Ile Val Pro Arg Glu Arg Lys Glu Leu
305 310 315 320
Leu Ile Leu Tyr Lys Gln Glu Ala Glu Lys Val Leu Thr Asn Tyr Gly
325 330 335
Phe Gly Leu Gly Lys Ser Ile Asn Ser Arg Asn Tyr Pro Gln Leu Phe
340 345 350
Trp Gln Pro Lys Phe Lys Ile Ser Ala Thr Lys Leu Leu Phe Gly Asn
355 360 365
Asn Ile Thr Glu Phe Gln Ser Asn Ile Leu Lys Gly Leu Ser Arg Gly
370 375 380
Gly Val Tyr Arg Arg His Gln Asn Tyr Arg Asn Pro Ser Asp Lys Ile
385 390 395 400
Thr Ile Ala Ala Leu Lys Ile Gly Asn Phe Leu Val Lys Asn Ser Cys
405 410 415
Leu Lys Gln Val Gln Glu Arg Leu Gln Gln Tyr Gly Phe Glu Ser Ile
420 425 430
Ile Pro Gln Glu Asn Val Lys Ser Leu Tyr Leu Glu Asn Phe Thr Thr
435 440 445
Ile Glu Ala Arg Thr Lys Val Glu Glu Lys Ile Asn Asp Leu Met Glu
450 455 460
Lys His Pro Asp Ile Val Leu Val Phe Leu Pro Gln Glu Asp Arg Asn
465 470 475 480
Ser Asp Asp Thr Pro Asn Gly Ser Leu Tyr Ser Leu Ile Ser Ser Cys
485 490 495
Leu Leu Arg Arg Gly Ile Ala Ser Gln Phe Ile Tyr Glu Arg Thr Leu
500 505 510
Lys Asp Val Lys Phe His Asn Ile Leu Asn Gln Ile Ile Pro Gly Ile
515 520 525
Leu Ala Lys Leu Gly Asn Leu Pro Phe Val Leu Ala Lys Pro Leu Glu
530 535 540
Ile Ala Asp Tyr Phe Ile Gly Leu Asp Val Ser Arg Ala Ser Lys Lys
545 550 555 560
Arg Ser Lys Gly Ser Met Asn Ala Cys Ala Ser Ser Arg Leu Tyr Gly
565 570 575
Lys Gln Gly Glu Phe Asp Asp Tyr Lys Ile Gly Asp Ala Leu Ile Glu
580 585 590
Gly Glu Glu Ile Pro Gln Val Val Leu Gln Asn Phe Leu Pro Gly Ala
595 600 605
Lys Leu Lys Glu Lys Thr Val Leu Ile Tyr Arg Asp Gly Arg Phe Cys
610 615 620
Gly Asp Glu Ala Leu His Leu Lys Glu Trp Ala Lys Ala Thr Gly Ser
625 630 635 640
Gln Phe Ile Leu Val Glu Cys Tyr Lys Ser Gly Ile Pro Arg Leu Tyr
645 650 655
Asn Trp Glu Gln Gln Ile Ile Lys Ala Pro Thr Lys Gly Leu Gly Leu
660 665 670
Arg Leu Ser Ala Arg Glu Ile Ile Leu Val Thr Thr Glu Phe Lys Ser
675 680 685
Glu Asn Val Gly Leu Pro Leu Pro Leu Arg Leu Lys Ile His Glu Ala
690 695 700
Gly His Gln Val Ser Ile Glu Asp Leu Ala Glu Thr Thr Leu Lys Leu
705 710 715 720
Thr Leu Leu His His Gly Ser Leu Arg Glu Pro Arg Leu Pro Ile Pro
725 730 735
Leu Phe Gly Ser Asp Arg Ile Ala Tyr Arg Arg Leu Arg Gly Ile Tyr
740 745 750
Pro Gly Gly Leu Asp Gly Asn Arg Gln Phe Trp Leu
755 760
<210> 8
<211> 605
<212> PRT
<213> Exiguobacterium sp.
<400> 8
Met Lys Lys Gln Leu Glu Arg Leu Ala His Pro Asn Tyr Met Met Asn
1 5 10 15
Arg Gly Lys Phe Arg Ser Lys Gln Ala His Pro Lys Ser Thr Ser Gly
20 25 30
Leu Leu Ile Tyr Pro Ala Leu Asp Leu Asn Val Asn Val Ser Glu Thr
35 40 45
Ala Glu Ile Val Phe Gly Phe Asp Leu Thr His Gln Phe Glu Tyr Arg
50 55 60
Glu Asn Leu Leu Gln Gln Ile Lys Arg Asp Pro Lys Ser Val Ser Ala
65 70 75 80
Gly Met Arg Val Ile Asp Ser Thr His Pro Lys Ser Tyr Glu Tyr Glu
85 90 95
Phe Val Glu Val Ala Pro Tyr Arg Ala Asn Glu Val Ser Pro Ile Met
100 105 110
Arg Cys Ser Ile Ile Asp Tyr Phe Ala Lys Lys Asp Pro Lys Arg Val
115 120 125
Ile Glu Pro Asp Ala Leu Val Val His Val Lys Asp Arg Asn Asn Gln
130 135 140
Ile Leu Ile Tyr Leu Pro Glu Gln Leu Lys Gln Ser Cys Ser Phe Glu
145 150 155 160
Thr Ile Pro Ala Arg His Leu Gly Ala Val Ser Arg Ile Ile Lys Leu
165 170 175
Ser Pro Asp Ala Arg Met Ser Lys Leu Met Pro Glu Ala Leu Ala Leu
180 185 190
Ile Gly Arg Leu Pro Met Leu Gln Phe Glu Arg Gln Asp Val Arg Ala
195 200 205
Ala Arg Leu Gly Tyr Ser Ile Gln Thr Leu Pro Ser Pro Arg Leu Arg
210 215 220
Phe Gly Lys Gly Arg Thr Thr Ser Tyr Ala Lys Thr Gly Leu Lys Gln
225 230 235 240
Gly Gly Val Tyr Glu Thr Gly Glu Ala Thr Val Ser Phe Phe Val Asp
245 250 255
Pro Lys Leu Arg Asp His Gln Lys Leu Gln Val Leu Glu Phe Ile Asn
260 265 270
Lys Leu Lys Thr Thr Ser Glu Arg Phe Gly Val Thr Leu Asn Val Ser
275 280 285
His Lys Pro Lys Gly Leu Ser Gln Lys Leu Pro Ser Asp Leu Leu Gln
290 295 300
Thr Glu Asp Ile Leu Tyr Gln Leu Lys Asn Ile Pro Gln His Phe Glu
305 310 315 320
Gly Val Val Val Val Ile Ala Glu Glu Ala Ser Leu Gln His Ser Tyr
325 330 335
Gln Ala Ile Lys Arg Gln Phe Gly Gly Lys Gln Asp Val Val Thr Gln
340 345 350
Cys Val Glu Leu His Asp Arg Val Leu Asn Ser Glu Asp Thr Leu Tyr
355 360 365
Asn Ile Leu Leu Gly Ile Tyr Val Lys Ala Gly Leu Gln Pro Trp Ile
370 375 380
Leu Gly Glu Pro Leu His Ser Asp Cys Phe Val Gly Leu Asp Val Ser
385 390 395 400
His Glu Asn Gly Lys His Ala Ala Gly Ile Ile Gln Ile Ile Gly Lys
405 410 415
Asp Gly Ala Met Ile Lys Gln Lys Ala Leu Ser Thr Ser Glu Ala Gly
420 425 430
Glu Lys Ile Ser Ser Glu Thr Met Arg Glu Ile Val Tyr Asp Thr Leu
435 440 445
His Ala Phe Glu Glu Gln Tyr Gly His Ala Pro Lys His Ile Thr Phe
450 455 460
His Arg Asp Gly Phe Gly Arg Glu Asp Leu Thr Leu Ile Asp Ser Ile
465 470 475 480
Leu Ser Pro Arg Glu Ile Gln Phe Asp Tyr Val Glu Ile Leu Lys Asn
485 490 495
Ile Asn Arg Arg Met Ala Ile His Glu Asp Glu Trp Lys Thr Ser Gln
500 505 510
Gly Leu Ser Tyr Thr Lys Glu Arg Met Gly Tyr Leu Leu Ser Thr Asn
515 520 525
Pro His Ala Arg Val Gly Met Ala Lys Pro Leu Lys Val Val Gln Gln
530 535 540
Thr Thr Thr Leu Pro Phe Glu Ala Ile Leu Thr Asp Val Tyr Arg Leu
545 550 555 560
Ser Phe Met His Val His Ser Leu Leu Lys Thr Arg Leu Pro Ile Thr
565 570 575
Thr His Tyr Ala Asp Leu Ser Ser Thr Phe His Asn Arg Gly Leu Leu
580 585 590
Asn Ala Asn Thr Glu His Glu Glu Ala Leu Pro Phe Val
595 600 605
<210> 9
<211> 605
<212> PRT
<213> Exiguobacterium sp.
<400> 9
Met Lys Lys Gln Leu Glu Arg Leu Ala His Pro Asn Tyr Met Met Asn
1 5 10 15
Arg Gly Lys Phe Arg Ser Lys Gln Ala His Pro Lys Ser Thr Ser Gly
20 25 30
Leu Leu Ile Tyr Pro Ala Leu Asp Leu Asn Val Asn Val Ser Glu Thr
35 40 45
Ala Glu Ile Val Phe Gly Phe Asp Leu Thr His Gln Phe Glu Tyr Arg
50 55 60
Glu Asn Leu Leu Gln Gln Ile Lys Arg Asp Pro Lys Ser Val Ser Ala
65 70 75 80
Gly Met Arg Val Ile Asp Ser Thr His Pro Lys Ser Tyr Glu Tyr Glu
85 90 95
Phe Val Glu Val Ala Pro Tyr Arg Ala Asn Glu Val Ser Pro Ile Met
100 105 110
Arg Cys Ser Ile Ile Asp Tyr Phe Ala Lys Lys Asp Pro Lys Arg Val
115 120 125
Ile Glu Pro Asp Ala Leu Val Val His Val Lys Asp Arg Asn Asn Gln
130 135 140
Ile Leu Ile Tyr Leu Pro Glu Gln Leu Lys Gln Ser Cys Ser Phe Glu
145 150 155 160
Thr Ile Pro Ala Arg His Leu Gly Ala Val Ser Arg Ile Ile Lys Leu
165 170 175
Ser Pro Asp Ala Arg Met Ser Lys Leu Met Pro Glu Ala Leu Ala Leu
180 185 190
Ile Gly Arg Leu Pro Met Leu Gln Phe Glu Arg Gln Asp Val Arg Ala
195 200 205
Ala Arg Leu Gly Tyr Ser Ile Gln Thr Leu Pro Ser Pro Arg Leu Arg
210 215 220
Phe Gly Lys Gly Arg Thr Thr Ser Tyr Ala Lys Thr Gly Leu Lys Gln
225 230 235 240
Gly Gly Val Tyr Glu Thr Gly Glu Ala Thr Val Ser Phe Phe Val Asp
245 250 255
Pro Lys Leu Arg Asp His Gln Lys Leu Gln Val Leu Glu Phe Ile Asn
260 265 270
Lys Leu Lys Thr Thr Ser Glu Arg Phe Gly Val Thr Leu Asn Val Ser
275 280 285
His Lys Pro Lys Gly Leu Ser Gln Lys Leu Pro Ser Asp Leu Leu Gln
290 295 300
Thr Glu Asp Ile Leu Tyr Gln Leu Lys Asn Ile Pro Gln His Phe Glu
305 310 315 320
Gly Val Val Val Val Ile Ala Glu Glu Ala Ser Leu Gln His Ser Tyr
325 330 335
Gln Ala Ile Lys Arg Gln Phe Gly Gly Lys Gln Asp Val Val Thr Gln
340 345 350
Cys Val Glu Leu His Asp Arg Val Leu Asn Ser Glu Asp Thr Leu Tyr
355 360 365
Asn Ile Leu Leu Gly Ile Tyr Val Lys Ala Gly Leu Gln Pro Trp Ile
370 375 380
Leu Gly Glu Pro Leu His Ser Asp Cys Phe Val Gly Leu Ala Val Ala
385 390 395 400
His Glu Asn Gly Lys His Ala Ala Gly Ile Ile Gln Ile Ile Gly Lys
405 410 415
Asp Gly Ala Met Ile Lys Gln Lys Ala Leu Ser Thr Ser Glu Ala Gly
420 425 430
Glu Lys Ile Ser Ser Glu Thr Met Arg Glu Ile Val Tyr Asp Thr Leu
435 440 445
His Ala Phe Glu Glu Gln Tyr Gly His Ala Pro Lys His Ile Thr Phe
450 455 460
His Arg Asp Gly Phe Gly Arg Glu Asp Leu Thr Leu Ile Asp Ser Ile
465 470 475 480
Leu Ser Pro Arg Glu Ile Gln Phe Asp Tyr Val Glu Ile Leu Lys Asn
485 490 495
Ile Asn Arg Arg Met Ala Ile His Glu Asp Glu Trp Lys Thr Ser Gln
500 505 510
Gly Leu Ser Tyr Thr Lys Glu Arg Met Gly Tyr Leu Leu Ser Thr Asn
515 520 525
Pro His Ala Arg Val Gly Met Ala Lys Pro Leu Lys Val Val Gln Gln
530 535 540
Thr Thr Thr Leu Pro Phe Glu Ala Ile Leu Thr Asp Val Tyr Arg Leu
545 550 555 560
Ser Phe Met His Val His Ser Leu Leu Lys Thr Arg Leu Pro Ile Thr
565 570 575
Thr His Tyr Ala Asp Leu Ser Ser Thr Phe His Asn Arg Gly Leu Leu
580 585 590
Asn Ala Asn Thr Glu His Glu Glu Ala Leu Pro Phe Val
595 600 605
<210> 10
<211> 863
<212> PRT
<213> Halogeometricum pallidum
<400> 10
Met Val Lys Arg Tyr Ile Ser Phe His Leu Phe Pro Arg Ile Lys Leu
1 5 10 15
Cys Gly Val Tyr Leu Cys Leu Arg Met Asn Thr Lys Asp Asp Ile Ala
20 25 30
His Lys Gln Pro Ile Thr Ile Glu Val Gln Val Leu Lys Glu Leu Asp
35 40 45
Lys Pro Ser Pro Lys Met Ala Thr Arg Leu Leu Val Ala Asp Arg Ala
50 55 60
Gly Asn Arg Phe Pro Leu Ala Ile Trp Lys Asn Asn Ala Leu Ser Asp
65 70 75 80
Tyr Asp Trp Thr Ile Gly Gln Trp Tyr Arg Leu Glu Asn Ala Arg Gly
85 90 95
Asn Val Phe Asn Gly Lys Gln Ser Leu Asn Gly Ser Ser Asn Met Arg
100 105 110
Ala Thr Pro Leu Glu Ala Ser Glu Glu Asp Glu Thr Arg Ala Asp Asp
115 120 125
Val Gly Arg Val Asp Thr Ile Leu Gly Asn Leu Ser Pro Asn Gln Ala
130 135 140
Tyr Leu Ser Leu Phe Pro Ile Ser Arg Ser Phe Asp Thr Leu Ser Val
145 150 155 160
Tyr Glu Tyr Ser Ile Glu Ala Ala Glu Ala Phe Glu Asp Asp Pro Asp
165 170 175
Thr Val Thr Tyr Gln Cys Ala Gly Arg Leu Arg Arg Ile Thr Gly Ala
180 185 190
Gly Val Ala Tyr Ala Gly Pro Met Gln Ile Val Ser Thr Arg Lys Leu
195 200 205
Pro Asp Lys Leu Ala Asp Pro Phe Ser Leu Ser Glu Pro Thr Glu Arg
210 215 220
Glu Leu Lys Ala Ala Asp Ala Arg Asp Arg His Arg Ile Glu Arg Leu
225 230 235 240
Leu Lys Ser Leu Val Lys Ala Ala Ile Asp Asp Ser Thr Tyr Asp Pro
245 250 255
Tyr Gln Ile Asn Arg Ile Arg Ala Arg Thr Pro Ala Ile Thr Ala Gly
260 265 270
Asp Gly Leu Phe Glu Ala Cys Tyr Glu Phe Ala Ala Arg Val Asp Val
275 280 285
Met Pro Ser Gly Asp Ala Phe Val Gly Ile Glu Val Arg Tyr His Ala
290 295 300
Arg Ser Gln Val Thr Ala Asp Val Tyr Glu Asp Lys Thr Gly Glu Leu
305 310 315 320
Val Gly Thr Ile Val Glu His Asp Pro Glu Arg Tyr Asn Val Ser Gly
325 330 335
Thr Gly Arg Val Val Gly Phe Thr Asp His Tyr Phe Thr Asp Ala Leu
340 345 350
Asp Glu Leu Gly Gly Leu Ser Leu Ala Asp Trp Tyr Ala Gln Lys Asp
355 360 365
Arg Val Pro Glu Gly Val Leu Glu Ala Leu Arg Glu Lys Asn Pro Arg
370 375 380
Leu Val Asp Ile Gln Tyr Gln Glu Asp Glu Pro Ala Gln Ile His Val
385 390 395 400
Pro Glu Leu Leu Arg Val Ala Pro Arg Lys Glu Val Val Lys Glu Leu
405 410 415
Asp Pro Thr Phe His Arg Arg Trp Asp Arg Glu Ala Lys Met Leu Pro
420 425 430
Asp Lys Arg Phe Arg His Ala Ile Glu Phe Val Asp His Leu Gly Ser
435 440 445
Leu Pro Asp Ile Asp Ala Thr Val Ala Pro Glu Pro Leu Gly Pro Ser
450 455 460
Leu Ser Tyr Met Ser Thr Ala Val Asp Arg Glu Glu Asn Leu Arg Phe
465 470 475 480
Lys Asp Gly Arg Thr Ala Thr Thr Pro Ser Ser Gly Ile Arg Ser Gly
485 490 495
Val Tyr Gln Gln Pro Thr Ser Phe Asp Ile Ala Tyr Val Tyr Pro Thr
500 505 510
Glu Ser Glu Gln Glu Ser Lys Gln Phe Ile Ser Asn Phe Glu Asn Lys
515 520 525
Leu Ser Arg Cys His Cys Glu Pro Thr Ala Thr Arg His Val Pro Tyr
530 535 540
Glu Leu Gly Gly Glu Leu Ser Tyr Leu Ala Val Ile Asn Glu Leu Glu
545 550 555 560
Ser Val Asp Ala Val Leu Ala Val Val Pro Pro Arg Asn Asp Asp Arg
565 570 575
Ile Ala Ala Gly Asp Ile Thr Asp Pro Tyr Pro Glu Phe Lys Lys Gly
580 585 590
Leu Gly Lys Gln Lys Val Pro Ser Gln Met Val Val Thr Glu Asn Leu
595 600 605
Asp Thr Arg Trp Val Met Asn Asn Thr Ala Met Gly Leu Ile Ala Gly
610 615 620
Ala Gly Gly Val Pro Trp Arg Val Asp Glu Met Pro Gly Glu Ala Asp
625 630 635 640
Cys Phe Ile Gly Leu Ala Val Thr Arg Asp Pro Glu Thr Gly Gln His
645 650 655
Leu Gly Ala Ser Ala Asn Val Val Tyr Ala Asp Gly Thr Val Phe Ala
660 665 670
Ser Lys Thr Gln Thr Leu Gln Ser Gly Glu Thr Phe Asp Glu Gln Ser
675 680 685
Ile Ile Asp Val Ile Lys Asp Val Phe Gln Glu Phe Val Arg Arg Glu
690 695 700
Gly Arg Ser Pro Glu His Ile Val Ile His Arg Asp Gly Arg Leu Phe
705 710 715 720
Glu Asp Ala Asp Glu Ile Gln Ala Pro Phe Ala Asp Ser Gly Val Ser
725 730 735
Ile Asp Ile Leu Asp Ile Arg Lys Ser Gly Ala Pro Arg Ile Ala Arg
740 745 750
Tyr Glu Asp Asn Ser Phe Lys Ile Asp Glu Lys Gly Arg Leu Phe Ile
755 760 765
Ser Gln Asp Asp Thr His Gly Phe Ile Ala Thr Thr Gly Lys Pro Glu
770 775 780
Phe Asp Asp Ser Asp Asn Leu Gly Thr Pro Lys Thr Leu Arg Val Val
785 790 795 800
Arg Arg Ala Gly Asp Thr Pro Met Leu Thr Leu Leu Lys Gln Val Tyr
805 810 815
Trp Leu Ser Glu Ala His Ile Gly Ser Val Ser Arg Ser Val Arg Leu
820 825 830
Pro Ile Thr Thr Tyr Tyr Ala Asp Arg Cys Ala Glu His Ala Arg Glu
835 840 845
Gly Tyr Leu Leu His Gly Glu Leu Ile Glu Gly Val Pro Tyr Leu
850 855 860
<210> 11
<211> 2196
<212> DNA
<213> 人工序列
<400> 11
atgccaatcg tactcaacgc gttcccattg aaggttccag acatggaatt gaagttcgtt 60
caaatcccat acgacaagac tactttggac tctttgagat cttctcacaa gatgactcac 120
gttttcagaa gacaaggtga ctctatccaa atcttctctt ctgacggtac tttcccaaag 180
tctggtactc cacaaacttt gcaattgaag aacaacttgg gtatcttctt ctctttggtt 240
aaggacggtt tgttgaagca cttcgctggt ttgggtagat ctccatgtgg tttcaaccca 300
atcgaagttg tttctgctca agctaaggac aacttgttgg cttctatctt gggtgaagct 360
tacccattga agatctgtgc taagtactct atcgacacta gaactgttca ggggcaacca 420
tgcctaatca tcgactgttc tactagaaga gttgttaagg aaaactgttt gttcttcttg 480
aagactggtt tcaacgttat cggtagatac gttgttactg aacaagacga cggtttcaga 540
aagttgttgg gtttcgttga aaactgtcac gaaggtagaa ctttgtctgt tatcagacca 600
gacggtcaag ctgttcacgc tgaagctaag gacgtttact tggaagcttc tagagctaac 660
ttcgacgact acatcttgta cactcacggt actaagaagg actctatcgt tgaaagaatc 720
cgtcagtctg taagcatctt caacggtggt aagaacaaga aggacagaat cgacgctttg 780
aagaagtaca tccaagctac taacatctct ttgttggacg gtactagaat cgaaatcgaa 840
gaaccatctg acatccaaaa ggactgtgct caaatgcaaa agccagtttt cgttttcaac 900
gacaacggtg aagctgactg gactgaaaag ggtttgactc aaaacggtcc atacactaag 960
agaactttcg acagaaacga cccatctatc tgtgttatct gtgctcaaca cgacagaggt 1020
agagttgaac aattcgttag aaagttgttg aagggtatgg ctaactctaa gtacttcaga 1080
aacggtttgg aaggtaagtt cgctttgggt acttctcgtg ttgaagtctt cgaaacctct 1140
actaactctg ttgacgctta caagtctgct atcgaagctg ctatcagaaa gaaggctgac 1200
gacggtggta gatgggactt ggctttggtt caagttagac aatctttcaa gcaattgaag 1260
gttactgaca acccatacta cttgggtaag tctttgttct acatgcacca agttccagtt 1320
caagacttca ctatcgaatt gttgtctcaa tctgactact ctttgggtta ctctttgaac 1380
aacatgtctt tggcttgtta cgctaagatg ggtggtgttc catggttgtt gaagtcttcg 1440
ccaacattgt ctcacgaact cgttatcggt atcggtaacg ctaacatcgt tcaagaaaga 1500
ggtgctcaca accaaagaat catgggtatc actactgttt tctctggtga cggttcttac 1560
atcgtttctt ctacttctaa ggctgttgtt ccagaagctt actgcgaggc tctcactagt 1620
gtgctcggtg aaaacatcga aaagatccaa agaagaatga actggcaaaa gggtgactct 1680
atcagattga tcttccacgc tcaagttaag aagttcaaca aggaagaaat ccaagctgtt 1740
agagctgtta tcgacaagta cagagactac caaatcgaat acgctttcgt taagatctct 1800
gaaaaccacg gtttgcacat gttcgactct tctactgcta ctatgccaaa gggtagattg 1860
gctactcaca gaggtaagac tttcaagttg tctaagaacg aaatgttggt ttacttgatc 1920
ggtcaaagag aattgagaca agaaactgac ggtcacccaa gaggtgttat cgttaacgtt 1980
cacaaggact ctactttcaa ggacatcaag tacttgtctg ctcaattgta ctctttcgct 2040
tctcactctt ggagatctta cttcccaaac ccaatgccag ttactatcac ttactctgac 2100
ttgatcgctc acaacttggg ttggttgaac caattgccag gttggtctga ctctgttatg 2160
atcggtaaga tcggtcactc tcaatggttc ttgtaa 2196
<210> 12
<211> 1995
<212> DNA
<213> 人工序列
<400> 12
atgtctggtt tgttcttgaa cttctaccaa gttgacatcc caactaagtc tgttccaatc 60
cactctgttg aatactctca ctactctagt aaggaagcgt ttatagctct caaggaaaac 120
tttccatact tctctttcta cagagacgac gacagaatct tgatctggaa gaaggacaag 180
gacgctgaat tgccagaaaa gaactctttg atcgaaatcg acttcactga aaaggctaag 240
gttttgtcta agatcttgga aagagctatc atcgacttca tcgaaccaaa gggttacaag 300
atcttcaaga acaagtactc taactcttgg gaaatcgttt ctatgaagga catcttgaac 360
ggtggcatag aaggcttgtc tatcaaccgt atcgttcact tctctccatg tttcttcttc 420
aaggaaaaca agttgatgtt gggtttctct ttgtctactt cgctcaagaa cgtgttcaca 480
tggaacaagg ctgacttcga aagatacggt ttcgacatca agggtttgaa gggtgacgaa 540
gaaagaatct tcgctaacaa gcaatctttg aagagattct tggaaactaa gggtgctgtt 600
gctatgtacg accaaatcat cgctaaggaa aacaagaacg ctaagatgtt ctctatcatc 660
gacggtttct acagatggtt ggaaagaaac aagactgaaa tccaattgcc attcggtttg 720
aagatcaact ctgtttctaa gaagtacttg ccattcgaag acgaattgat caagtctgaa 780
atcatcccaa agccacaaag atacttctac tctaacagaa agaacactca atctttgaga 840
tactacgacg aaatggttaa gacttaccaa ccatactctt tggaattgta ccaaaacaag 900
caaatcaaca tcggtatcat ctgtccatct gaataccaag gtgaaactga aggtttcatc 960
aagaagatcg aattgaagtt gaaagaagtt ttccacttca acagcttgat cttccacttt 1020
aagactatca ctaacaagga cttggctagt tacaaggaag tgctctacga cgacgaattg 1080
ttgaagtgtg acttgatcta cgttatcgtt aacgaagctc aagaaaagtt gtctccaaac 1140
aactctccat actacgtttg taaggctaag ttcatcggta acggtatccc aactcaagac 1200
atccaaatcg aaactatcag acaaaacttg aacgctttca ctatgactaa catctctttg 1260
aactcttacg ctaagttggg tggtactgct tggactatcg aaaaggaaga caagttgaag 1320
gacgaattgg ttatcggtat cggttctact ttgtctgaaa acggtcaatt cgttttgggt 1380
atcgctcaaa tcttccacaa cgacggtaga tacatggctg gtgactgttc tccattgtct 1440
actttctcta actacgctga aaacttggaa gaccacttgt acaagacttt gaagccattg 1500
gttgaagaaa tgtctaagtc tggtactttc agattgatct tccacttgtt caagtctgct 1560
tctgaagaat acgaaatcag agctatcaac ggtttgcaaa agagattggc taactacaac 1620
ttcgaattcg ctttggttca cttggcttac ggtcacaact tcagattgta ctacaacgac 1680
ggtaacggtg acatcaacca aggtacttac atccaattgt ctaagcactc tgctttgttg 1740
cacttcgttt ctaagtctga cttgccattg aagatcgact tggacaagag atctactttc 1800
acttctttgt tctacatcgc taagcaagtt tactggttct ctcacttgtc tcacagatct 1860
tacatgccat ctaagagaac tgttactatc atgtacccat ctatcatggc taagatgact 1920
gaagaattga agaaggttga aggttgggac tacgaaagat tgaaggctgt ttctgacaag 1980
ttgtggttca tctaa 1995
<210> 13
<211> 2592
<212> DNA
<213> 人工序列
<400> 13
atggttaaga gatacatatc gttccacttg ttcccaagaa tcaagttgtg tggtgtttac 60
ttgtgtttga gaatgaacac taaggacgac atcgctcaca agcaaccaat cactatcgaa 120
gttcaagttt tgaaggaatt ggacaagcca tctccaaaga tggctactag attgttggtt 180
gctgacagag ctggtaacag attcccattg gctatctgga agaacaacgc tttgtctgac 240
tacgactgga ctatcggtca atggtacaga ttggaaaacg ctagaggtaa cgttttcaac 300
ggtaagcaat ctttgaacgg ttcttctaac atgagagcta ctccattgga agctagtgaa 360
gaagacgaaa ctagagctga cgacgttggt agagttgaca ctatcttggg taacttgtct 420
ccaaaccagg cgtacttgag cttgttccca atctcgcgta gcttcgacac tctctcggtg 480
tacgaataca gcatcgaagc ggcggaagcg ttcgaagacg acccagacac tgttacttac 540
caatgtgctg gtagattgag aagaatcact ggtgctggtg ttgcttacgc tggtccaatg 600
caaatcgttt ctactagaaa gttgccagac aagttggctg acccattctc tttgtctgaa 660
ccaactgaaa gagaattgaa ggctgctgac gctagagaca gacacagaat cgaaagattg 720
ttgaagtctt tggttaaggc tgctatcgac gactctactt acgacccata ccaaatcaac 780
agaatcagag ctagaactcc agctatcact gcgggcgacg gcttgttcga agcgtgctac 840
gaatttgctg ctagagttga cgttatgcca tctggtgacg ctttcgttgg tatcgaagtt 900
agataccacg ctagatctca agttactgct gacgtttacg aagacaagac tggtgaattg 960
gttggtacta tcgttgaaca cgacccagaa agatacaacg tttctggtac tggtagagtt 1020
gttggtttca ctgaccacta cttcactgac gctttggacg aattgggtgg tttgtctttg 1080
gctgactggt acgctcaaaa ggacagagtt ccagaaggtg ttctcgaagc tctcagagaa 1140
aagaatccaa gattggttga catccaatac caagaagacg aaccagctca aatccacgtt 1200
ccagaattgt tgagagttgc tccaagaaag gaagttgtta aggaattgga cccaactttc 1260
cacagaagat gggacagaga agctaagatg ttgccagaca agagattcag acacgctatc 1320
gaatttgttg accacttggg ttctttgcca gacatcgacg ctactgttgc tccagaacca 1380
ctcggcccaa gcctctctta catgtcgact gctgttgaca gagaagaaaa cttgagattc 1440
aaggacggta gaactgctac tactccatct tctggtatca gatctggtgt ttaccaacaa 1500
ccaacttctt tcgacatcgc ttacgtttac ccaactgaat ctgaacaaga atctaagcaa 1560
ttcatctcta acttcgaaaa caagttgtct cgttgtcact gtgaaccaac tgctactaga 1620
cacgttccat acgaattggg tggtgaattg tcttacttgg ctgttatcaa cgaattggaa 1680
tctgttgacg ctgttttggc tgttgttcca ccaagaaacg acgacagaat cgctgctggt 1740
gacatcactg acccataccc agaatttaag aagggtttgg gtaagcaaaa ggttccatct 1800
caaatggttg ttactgaaaa cttggacact agatgggtta tgaacaacac tgctatgggt 1860
ttgatcgctg gtgctggtgg tgttccatgg agagttgacg aaatgccagg tgaggctgac 1920
tgtttcatcg gtctcgacgt tactcgtgac ccagaaactg gtcaacactt gggtgcttct 1980
gctaacgttg tttacgctga cggtactgtt ttcgcttcta agactcaaac tttgcaatct 2040
ggtgaaactt tcgacgaaca atctatcatc gacgttatca aggacgtttt ccaagaattt 2100
gttagaagag aaggtagatc tccagaacac atcgttatcc acagagacgg tagattgttc 2160
gaagacgctg acgaaatcca agctccattc gctgactctg gtgtttctat cgacatcttg 2220
gacatcagaa agtctggtgc tccaagaatc gctagatacg aagacaactc tttcaagatc 2280
gacgaaaagg gtagattgtt catctctcaa gacgacactc acggtttcat cgctactact 2340
ggtaagccag aatttgacga ctctgacaac ctcggtactc caaagactct cagagttgtt 2400
cgtagagctg gtgacactcc aatgttgact ttgttgaagc aagtttactg gttgtctgaa 2460
gctcacatcg gttctgtttc tcgttctgtt agattgccaa tcactactta ctacgctgac 2520
agatgtgctg aacacgctag agaaggttac ttgttgcacg gtgaattgat cgaaggtgtt 2580
ccatacttgt aa 2592
<210> 14
<211> 2244
<212> DNA
<213> 人工序列
<400> 14
atgaactaca ctgctgctaa cactgctaac tctccaatct tcttgtctga aatctcttct 60
ttgactttga agaactcttg tttgaactgt ttccaattga accaccaagt tactagaaag 120
atcggtaaca gattctcttg gcaattctct agaaagttcc cagacgttgt tgttatcttc 180
gaagacaatt gtttttgggt gctagctaag gacgaaaagt ctatcccatc tttgcaacaa 240
tggaaggaag ctttgtctga catccaagaa gttttgagag aagacatcgg tgaccactac 300
tactctatcc actggttgaa ggacttccaa atcactgctt tggttactgc tcaattggct 360
gttagaatct tgaagatctt cggtaagttc tctgacccaa tcgttttccc aaaggactct 420
caaatctctg aaaaccaagt tcaagttaga agagaagtta acttctgggc tgaaatcatc 480
aacgacactg acccagctat ctgtttgact gttgactctt ctatcgttta ctctggtgac 540
ttggaacaat tctacgaaaa ccacccatac agacaagacg ctgttaagtt gttggttggt 600
ttgaaggtta aggacagaga aactaacggt actgctaaga tcatcagaat cgctggtaga 660
atcggtgaaa gaagagaaga cttgttgact aaggctactg gttctatctc tagaagaaag 720
ttggaagaag ctcacttggg tcaaccagtt gttgctgttc aattcggtaa gaacccacaa 780
gaatacatct acccattggc tgctttgaag ccatgggtta ctgacgaaga cgaatctttg 840
ttccaagtta actacggtaa cttgttgaag gctactaaga tcttctacgc tgaaagacaa 900
gaattgttga agttgtacaa gcaagaagct caaaaggctt tgaacaactt cggtttccaa 960
ttgagagaaa agtctatcaa ctctcaagaa tacccagaat tgttctggac tccatctatc 1020
tctatcgaac aaactccaat cttgttcggt caaggtgaaa gaggtgaaaa gagagaaatc 1080
atcaagggtt tgtctaaggg tggtgtttac aagagacaca gagaatacgt tgacccagct 1140
agaaagatca gattggctat cttgaagcca gctaacttga aggttggtga cttcagagaa 1200
caattggaaa agagattgaa gttgtacaag ttcgaaacta tcttgccacc agaaaaccaa 1260
atcaatttct ctgttgaagg tctcggtttc gaaaagagag ctagattgga agaagctgtt 1320
gacagattga tcggtgttga aatcccagtt gacatcgctt tggttttctt gccacaagaa 1380
gacagaaacg ctgacaacac tgaagaaggt tctttgtact cttggatcaa gagaaagttc 1440
ttgggtagag gtgttatcac tcaaatgatc tacgaaaaga ctttgaacga caagtctaac 1500
tacaagaaca tcttgaacca agttgttcca ggtatcttgg ctaagttggg taacttgcca 1560
tacgttttgg ctgaaccatt ggaaatcgct gactacttca tcggtttgga cgttggtaga 1620
atgccaaaga agaacttgcc aggctcgttg aacgtgtgcg cttctgttag attgtacggt 1680
aagcaaggtg aattcgttag atgtagagtt gaggacagct tgactgaagg tgaggaaatc 1740
ccacaaagaa tcttggaaaa ctgtttgcca caagctgaat tgaagaacca aactgttttg 1800
atctacagag acggtaagtt ccaaggtaag gaagttgaaa acttgttggc tagagctaga 1860
gctatcaacg ctaagttcat cttggttgaa tgttacaaga ctggtatccc aagattgtac 1920
aacttgcaac aaaagcaaat caacgctcca tctaagggtt tggctttggc tttgtctaac 1980
agagaagtta tcttgatcac atcgcaagta agcgaacaaa tcggtgttcc aagaccattg 2040
agattgaagg ttcacgaatt gggtgaacaa agaaacttga agcaattggt tgacactact 2100
ttgaagttga ctttgttgca ctacggttct ttgaaggacc caagattgcc aatcccattg 2160
tacggtgctg acatcatcgc ttacagaaga ttgcaaggta tctacccatc tttgttggaa 2220
gacgactgtc aattctggtt gtaa 2244
<210> 15
<211> 2544
<212> DNA
<213> 人工序列
<400> 15
atgactactc aagctgacat cgaagacggt aagagaatcg acatcactgt tcaagttgtt 60
gctgaattgg actgtactac ttctaagatg gctaagagat tgaaggttag agacactgct 120
ggtaacgaat tcccattggc tatctggaac aacaacgctt tgtctgactt cgcttgggaa 180
tctggtagat ggtacgaatt ggaaaacgct aagggtaacg aatggagagg tgaaaagtct 240
ttgaacggtt cttctagatt gtctgctgaa atcgttgaac caccagaaga agaaaacgaa 300
gactcttctg aatctgaaaa gatctctggt ggtcaattgt tcgacacttt gcaagacaac 360
ttgccatact tgtctttgtt cccattcgac agagacttcg aaactttgtc tgtttacgaa 420
tacagaatcg aagctaacga cgctttcgaa gactctccaa tggacgctac ttacaacttg 480
gctgcttact tgagatcttc ttctaacgct gctgttactc acgctggtgt tatgtctttg 540
atctctactg aaccattgga aatctctttg ccagacccat tcactttgac ttctgaaact 600
agagttactt tgagagctga cgaaacttct gacaacgaaa ctatggttag attgttgcaa 660
caattgatca agaagtctat ctctactgac aagtacgaaa ctggtagagt tgacagaatc 720
agaactaagg aaccagttat ctctggtcca gaaggtttgt tcgaagcttg tttggcttac 780
agagttggta tcgaagtttt gccatctggt gacgcttacg ttggtgttga agtttctcac 840
cacgctagat ctcaagctac tgttgacgaa tacatcgaca gagttaacgc tactgttgac 900
gaattggttg acactcacgt tgaacacgac ccagaaactt actctactcc aggttctggt 960
caattgaagt ctttggctga cgttagattc actgacccaa tcccagactt cggtaaccaa 1020
tctttggctg actggtacga aagaaaggac agagtttctg acgaaatgtt ggaccaattg 1080
agatctgaaa acccaagatt ggttgaagtt caatacaacc caaactctga cgaaacttct 1140
gttcacgttc cacaattgtt gagagtttct ccaagaaagg aagttgttaa gcaattgtct 1200
ccaagattcc acagagaatg ggacagaaga gctaagatgt tgccagaaga aagattccaa 1260
aaggctactc aattcgttac tgacttggac actttgccag ctgttgacac ttacttggac 1320
ccaactccag ttggtccatc tatctctttc atgtctactg aagttgacag agctgacaac 1380
ttgagattcg gtaacgactg tactgctgac ttgccaggca gtggtctcaa cagatacggc 1440
gtttacagaa gaccatcgag cttcagattg cactacttgg ttccagaaag atacactgac 1500
gaattcgttg aattgagatc tagaatcgaa gaacaattgg aagacatgaa ctgttctcca 1560
gacgaaatgt cttactctga atacgctttg ggttctgaaa tcgaatactc taacgctgct 1620
gctgctatct ctgacgttga cgttgttttg gctgctgttc catctccatc taacgacttc 1680
atccaagacg gtactatcga cgacccatac ggtgaattca agaaggcttt gggtaagcaa 1740
actatcccat ctcaaatggt tagagttgac aacttggaca acaagtgggt tgttagaaac 1800
actgctttgg gtatcatcgc tggtgctggt ggtgttccat ggagagttga ccaaatgcca 1860
ggtaacactg actgtttcgt tggtttggac gctactagag acccagacac tggtcaattc 1920
ttgggtgctt ctgctaacgt tgttttggct gacggtactg ttttcgtttc taagactcaa 1980
tctttgcaat ctggtgaaac tttcgacgaa gacgctgttg ttgacgtttt gaaggacgtt 2040
cacagagaat tcgttagagc tgaaggtgaa aagccaaact ctatcgttgt tcacagagac 2100
ggtagattgt tcgaagacgt tgacgctatc ttggctccat tcaacggtac tggtatcgac 2160
atcgacatct tggacatcag aaagtctggt gccccaagag ccgcgttcag aagaaacggc 2220
caattcagag ttgaccacaa gggtagaatc ttcatcgctc aaaacgacga ccacggtttc 2280
ttgactacta ctggtagacc agaattcgac gattcggacg gtctcggtac tccaaggact 2340
ctcagaatcg ttcgtagagc tggtgaaact ccaatgcaaa ctttgatgga acaagtttac 2400
tggttgtctg aatctcacgt tggttctgct caaagatcta ctagattgcc aatcactact 2460
tactacgctg acagatgtgc tgaagctact agaaagggtt acttggttaa cggtgaaatc 2520
atcagaggtg ttccatacat ctaa 2544
<210> 16
<211> 2238
<212> DNA
<213> 人工序列
<400> 16
atgactgttg ctgttcaagt tcacactcaa ccagcttctc caatcttctt gtctgaaatc 60
ttcccattga gaatctctca attgaacttg atcggtttca gagttactcc agaagttgac 120
agagaaatcg gtaacagatt gtcttggaga ttctctcaaa agttcccaga cgttgttgct 180
atctggcaag acaagtactt ctgggttttg gctaagccag accaaccaat gccatctcaa 240
gacgaatgga gattgaagtt ggctgaaatc ttggaagaat tgaagaagga catcggtgac 300
agatactact ctatccaatg ggttagagaa ccacaagtta ctgcttctat cttggctcaa 360
ttggctgtta gagttttgaa gatcgctaga ccattctctt ctaactctgt tatgtctgaa 420
aaccaagttc aagttagaag agaagttgac ttctgggctg aaactatcga cttgcaaggt 480
gttttgcaac cagctttgac tttgactatc cactctagaa tcttgttcaa gggtgacttg 540
gctcaattct gtgaaaacca cccatacaga caagacccaa agaacatctt gatcggtttg 600
aaggttagag acatcgaaca caactctttc gctagaatca ctggtatcgt tggtactatc 660
gaagaacaca gagaccaatt gttgaaggaa gctactggtg ctatctctaa gcaagctttg 720
aaggacgctc caaacgaaca accagttgtt gctgttcaat tcggtaagga cgctaagcca 780
ttccactacg ctatggctgc tttgagacca tgtatcactc cagaaactgc taagagattc 840
gaagttgact acggtgaatt gttgaaggct actaaggttt cttacaagga cagaaaggac 900
ttgttggttt tgtacaagaa ggaagctggt gaagctttgt acaactacgg tttccaattg 960
gaaagatcta tcaactctag agactgtcca aacttgttct gggaaccaaa ggttaaggtt 1020
gaacaaactc aattgatgtt cggtgaaaac ttcactggta tccaatctca aatcttgact 1080
ggtttgtcta agggtggtgt ttacagaaga cacgaagact acttggaccc atctagacca 1140
atcagaatcg ctgctttgaa gctctgtaac ttcaaggttg gtagcttctt gtcggaattc 1200
caaaagagat tgaagagata cggtttcgaa tctatcttgc cagaagaaaa caagaaggaa 1260
ttgtctgttg actctttgag aggtgctgaa gctagagcta aggttgaaga agctgttgac 1320
gacttgatgg ttagacagcc agacgttgtt ctcacattct tgccaacttc ggacagacac 1380
gctgacgaca aggaaggtgg ttctttgtac tcttgggttt actctagatt gttgagaaga 1440
ggtatcgctt ctcaagttat ctacgaagac actttgagaa acgttcaagc taactacttg 1500
ttgaaccaag ttatcccagg tgttttggct aagttgggta acttgccatt catcttggct 1560
gaaccattgg aaatcgctga ctacttcatc ggtttggaca tctctagagg ttctaagaag 1620
aagggtgctg gtactatgaa cgcttgtgct tctgttagat tgtacggtaa gcaaggtgaa 1680
ttcatcagat acagattgga agacgctttg atcgaaggtg aagaaatccc acaaagaatc 1740
ttggaatctt tcttgccagc tgctgacttg aagaataaga ctgtgctcat ctacagagac 1800
ggtagattct gtggtgaaga agttaagtac ttgagagaaa gagctaacgc tatctcttct 1860
aagttcatct tggttgaatg ttacaagtct ggtatcccaa gaatgtacaa cctcactgag 1920
aagttggtgc taccaccaag aaagggtttg gctttgagaa tctctgactt cgaagctatc 1980
ttggttacta ctgaagttaa gtctgaatct atgggtttgc cattgccatt gagattgaac 2040
gttatcccat acccaggtca acaagtttct atcgaatctg ttgttgaaac tactgttcaa 2100
ttgactttgt tgcaccacgg ttctttgaac gaaccaagat tgccaatccc attgttcggt 2160
tctgacagaa tggcttacag aagattgcaa ggtatctacc caggtgcttt ggacggtgac 2220
agacaattct ggttgtaa 2238
<210> 17
<211> 2295
<212> DNA
<213> 人工序列
<400> 17
atgaacatcg ctatcactaa gccattgcca caatctgctg ttactccaat cttcttgtct 60
gaaatcttgc cattgatctt cgaagttgac aactctagat acaacttgaa ggaaaacatc 120
atctgtttcc aaatcttccc agaagttggt agagaaatcg gtaacagatt gtcttggcac 180
ttgtgtcaaa agttcactga attgatcgtt atctggcaaa acaacttctt ctgggttttg 240
aacaagccaa ctcaaatccc accaaaccac aagcaattca agaaggcttt gttggaaatc 300
tgtgaagaat tgaagagaga catctctaac tcttacaact tcaacttcgc tttccacaac 360
aactactctg ttcaattggt tgaaaagcca caaatcactg cttctacttt ggctcaattg 420
gctactagaa tcttgaagat cgcttgtcca ttctcttctc caatcgcttt ctctcaaaag 480
caagttgaag ttagaagaga agctaacttc tgggctgaaa tcatcgaatt ggaaggtcaa 540
ttcatcccag ctttgactat cactgctaag tctaacttca actgtactat caacttggct 600
gaattctacc aaaaccactc ttacaagcaa aacccacaac aactcctcgt tggtctcaag 660
gttcaagaca tcgaaagatc ttctttcgct actatcactg gtatcgttgg tactgttggt 720
gaacacaagg aaaagttgaa ggcttctgct actggtacta tctctaagca agctttggaa 780
gaagctccag acgaacaacc attggtttct gttcaattcg gtaagaacaa gcaacaattc 840
cactacgcta tgggtgcttt gagaccatgt atcactttgg aaactgctat caagttgggt 900
ttggaacaca acaagttgtt gaacgttgct aagatcgttc caagagaaag aaaggaattg 960
ttgatcttgt acaagcaaga agctgaaaag gttttgacta actacggttt cggtttgggt 1020
aagtctatca actctagaaa ctacccacaa ttgttctggc aaccaaagtt caagatctct 1080
gctactaagt tgttgttcgg taacaacatc actgaattcc aatctaacat cttgaagggt 1140
ttgtctagag gtggtgttta cagaagacac caaaactaca gaaacccatc tgacaagatc 1200
actatcgctg ctttgaagat cggtaacttc ttggttaaga actcttgttt gaagcaagtt 1260
caagaaagat tgcaacaata cggtttcgaa tctatcatcc cacaagaaaa cgttaagtct 1320
ttgtacttgg aaaacttcac tactatcgaa gctagaacta aggttgaaga aaagatcaac 1380
gacttgatgg aaaagcaccc agatatcgtt ttggtcttcc tgccacaaga agacagaaac 1440
tctgacgaca ctccaaacgg ttctttgtac tctttgatct cttcttgttt gttgagaaga 1500
ggtatcgctt ctcaattcat ctacgaaaga actttgaagg acgttaagtt ccacaacatc 1560
ttgaaccaaa tcatcccagg tatcttggct aagttgggta acttgccatt cgttttggct 1620
aagccattgg aaatcgctga ctacttcatc ggtttggacg tttctagagc ttctaagaag 1680
agatctaagg gttctatgaa cgcttgtgct tcttctagat tgtacggtaa gcaaggtgaa 1740
ttcgacgact acaagatcgg tgacgctttg atcgaaggtg aagaaatccc acaagttgtt 1800
ttgcaaaact tcttgccagg tgctaagttg aaggaaaaga ctgttttgat ctacagagac 1860
ggtagattct gtggtgacga agctttgcac ttgaaggaat gggctaaggc tactggttct 1920
caattcatct tggttgaatg ttacaagtct ggtatcccaa gattgtacaa ctgggaacaa 1980
caaatcatca aggctccaac taagggtttg ggtttgagat tgtctgctag agaaatcatc 2040
ttggttacta ctgaattcaa gtctgaaaac gttggtttgc cattgccatt gagattgaag 2100
atccacgaag ctggtcacca agtttctatc gaagacttgg ctgaaactac tttgaagttg 2160
actttgttgc accacggttc tttgagagaa ccaagattgc caatcccatt gttcggttct 2220
gacagaatcg cttacagaag attgagaggt atctacccag gtggtttgga cggtaacaga 2280
caattctggt tgtaa 2295
<210> 18
<211> 1818
<212> DNA
<213> 人工序列
<400> 18
atgaagaagc aattggaaag attggctcac ccaaactaca tgatgaacag aggtaagttc 60
agatctaagc aagctcaccc aaagtctact tctggtttgt tgatctaccc agctttggac 120
ttgaacgtta acgtttctga aactgctgaa atcgtttttg gcttcgactt gactcatcaa 180
ttcgaataca gagaaaactt gttgcaacaa atcaagagag acccaaagtc tgtttctgct 240
ggtatgagag ttatcgactc tactcaccca aagtcttacg aatacgaatt cgttgaagtt 300
gctccataca gagctaacga agtttctcca atcatgagat gttctatcat cgactacttc 360
gctaagaagg acccaaagag agttatcgaa ccagacgctt tggttgttca cgttaaggac 420
agaaacaacc aaatcttgat ctacttgcca gaacaattga agcaatcttg ttctttcgaa 480
actatcccag ctagacactt gggtgctgtt tctagaatca tcaagttgtc tccagacgct 540
agaatgtcta agttgatgcc agaagcgctc gctctcatcg gtagactccc aatgttgcaa 600
ttcgaaagac aagacgttag agctgctaga ttgggttact ctatccaaac tttgccatct 660
ccaagattga gattcggtaa gggtagaact acttcttacg ctaagactgg tttgaagcaa 720
ggtggtgttt acgaaactgg tgaagctact gttagcttct tcgttgaccc aaagttgaga 780
gaccaccaaa agttgcaagt tttggaattc atcaacaagt tgaagactac ttctgaaaga 840
ttcggtgtta ctttgaacgt ttctcacaag ccaaagggtt tgtctcaaaa gttgccatct 900
gacttgttgc aaactgaaga catcttgtac caattgaaga acatcccaca acacttcgaa 960
ggtgttgttg ttgttatcgc tgaagaggcg agcttgcaac actcttacca agctatcaag 1020
agacaattcg gtggtaagca agacgttgtt actcaatgtg ttgaattgca cgacagagtt 1080
ttgaactcgg aggacactct ctacaacatc ctcttgggta tctacgttaa ggctggtttg 1140
caaccatgga tcttgggtga accattgcac tctgactgtt tcgttggttt ggacgtttct 1200
cacgaaaacg gtaagcacgc tgctggtatc atccaaatca tcggtaagga cggtgctatg 1260
atcaagcaaa aggctttgtc tacttctgaa gctggtgaaa agatctcttc tgaaactatg 1320
agagaaatcg tttacgacac tttgcacgct ttcgaagaac aatacggtca cgctccaaag 1380
cacatcactt tccacagaga cggtttcggt agagaagact tgactttgat cgactctatc 1440
ttgtctccaa gagaaatcca attcgactac gttgaaatct tgaagaacat caacagaaga 1500
atggctatcc acgaagacga atggaagact tctcaaggtt tgtcttacac taaggaaaga 1560
atgggttact tgttgtctac taacccacac gctagagttg gtatggctaa gccattgaag 1620
gttgttcaac agactactac tctcccattc gaagcgatct tgactgacgt ttacagattg 1680
tctttcatgc acgttcactc tttgttgaag actagattgc caatcactac tcactacgct 1740
gacttgtctt ctactttcca caacagaggt ttgttgaacg ctaacactga acacgaagaa 1800
gctttgccat tcgtttaa 1818
<210> 19
<211> 1818
<212> DNA
<213> 人工序列
<400> 19
atgaagaagc aattggaaag attggctcac ccaaactaca tgatgaacag aggtaagttc 60
agatctaagc aagctcaccc aaagtctact tctggtttgt tgatctaccc agctttggac 120
ttgaacgtta acgtttctga aactgctgaa atcgtttttg gcttcgactt gactcatcaa 180
ttcgaataca gagaaaactt gttgcaacaa atcaagagag acccaaagtc tgtttctgct 240
ggtatgagag ttatcgactc tactcaccca aagtcttacg aatacgaatt cgttgaagtt 300
gctccataca gagctaacga agtttctcca atcatgagat gttctatcat cgactacttc 360
gctaagaagg acccaaagag agttatcgaa ccagacgctt tggttgttca cgttaaggac 420
agaaacaacc aaatcttgat ctacttgcca gaacaattga agcaatcttg ttctttcgaa 480
actatcccag ctagacactt gggtgctgtt tctagaatca tcaagttgtc tccagacgct 540
agaatgtcta agttgatgcc agaagcgctc gctctcatcg gtagactccc aatgttgcaa 600
ttcgaaagac aagacgttag agctgctaga ttgggttact ctatccaaac tttgccatct 660
ccaagattga gattcggtaa gggtagaact acttcttacg ctaagactgg tttgaagcaa 720
ggtggtgttt acgaaactgg tgaagctact gttagcttct tcgttgaccc aaagttgaga 780
gaccaccaaa agttgcaagt tttggaattc atcaacaagt tgaagactac ttctgaaaga 840
ttcggtgtta ctttgaacgt ttctcacaag ccaaagggtt tgtctcaaaa gttgccatct 900
gacttgttgc aaactgaaga catcttgtac caattgaaga acatcccaca acacttcgaa 960
ggtgttgttg ttgttatcgc tgaagaggcg agcttgcaac actcttacca agctatcaag 1020
agacaattcg gtggtaagca agacgttgtt actcaatgtg ttgaattgca cgacagagtt 1080
ttgaactcgg aggacactct ctacaacatc ctcttgggta tctacgttaa ggctggtttg 1140
caaccatgga tcttgggtga accattgcac tctgactgtt tcgttggttt ggctgttgca 1200
cacgaaaacg gtaagcacgc tgctggtatc atccaaatca tcggtaagga cggtgctatg 1260
atcaagcaaa aggctttgtc tacttctgaa gctggtgaaa agatctcttc tgaaactatg 1320
agagaaatcg tttacgacac tttgcacgct ttcgaagaac aatacggtca cgctccaaag 1380
cacatcactt tccacagaga cggtttcggt agagaagact tgactttgat cgactctatc 1440
ttgtctccaa gagaaatcca attcgactac gttgaaatct tgaagaacat caacagaaga 1500
atggctatcc acgaagacga atggaagact tctcaaggtt tgtcttacac taaggaaaga 1560
atgggttact tgttgtctac taacccacac gctagagttg gtatggctaa gccattgaag 1620
gttgttcaac agactactac tctcccattc gaagcgatct tgactgacgt ttacagattg 1680
tctttcatgc acgttcactc tttgttgaag actagattgc caatcactac tcactacgct 1740
gacttgtctt ctactttcca caacagaggt ttgttgaacg ctaacactga acacgaagaa 1800
gctttgccat tcgtttaa 1818
<210> 20
<211> 2592
<212> DNA
<213> 人工序列
<400> 20
atggttaaga gatacatatc gttccacttg ttcccaagaa tcaagttgtg tggtgtttac 60
ttgtgtttga gaatgaacac taaggacgac atcgctcaca agcaaccaat cactatcgaa 120
gttcaagttt tgaaggaatt ggacaagcca tctccaaaga tggctactag attgttggtt 180
gctgacagag ctggtaacag attcccattg gctatctgga agaacaacgc tttgtctgac 240
tacgactgga ctatcggtca atggtacaga ttggaaaacg ctagaggtaa cgttttcaac 300
ggtaagcaat ctttgaacgg ttcttctaac atgagagcta ctccattgga agctagtgaa 360
gaagacgaaa ctagagctga cgacgttggt agagttgaca ctatcttggg taacttgtct 420
ccaaaccagg cgtacttgag cttgttccca atctcgcgta gcttcgacac tctctcggtg 480
tacgaataca gcatcgaagc ggcggaagcg ttcgaagacg acccagacac tgttacttac 540
caatgtgctg gtagattgag aagaatcact ggtgctggtg ttgcttacgc tggtccaatg 600
caaatcgttt ctactagaaa gttgccagac aagttggctg acccattctc tttgtctgaa 660
ccaactgaaa gagaattgaa ggctgctgac gctagagaca gacacagaat cgaaagattg 720
ttgaagtctt tggttaaggc tgctatcgac gactctactt acgacccata ccaaatcaac 780
agaatcagag ctagaactcc agctatcact gcgggcgacg gcttgttcga agcgtgctac 840
gaatttgctg ctagagttga cgttatgcca tctggtgacg ctttcgttgg tatcgaagtt 900
agataccacg ctagatctca agttactgct gacgtttacg aagacaagac tggtgaattg 960
gttggtacta tcgttgaaca cgacccagaa agatacaacg tttctggtac tggtagagtt 1020
gttggtttca ctgaccacta cttcactgac gctttggacg aattgggtgg tttgtctttg 1080
gctgactggt acgctcaaaa ggacagagtt ccagaaggtg ttctcgaagc tctcagagaa 1140
aagaatccaa gattggttga catccaatac caagaagacg aaccagctca aatccacgtt 1200
ccagaattgt tgagagttgc tccaagaaag gaagttgtta aggaattgga cccaactttc 1260
cacagaagat gggacagaga agctaagatg ttgccagaca agagattcag acacgctatc 1320
gaatttgttg accacttggg ttctttgcca gacatcgacg ctactgttgc tccagaacca 1380
ctcggcccaa gcctctctta catgtcgact gctgttgaca gagaagaaaa cttgagattc 1440
aaggacggta gaactgctac tactccatct tctggtatca gatctggtgt ttaccaacaa 1500
ccaacttctt tcgacatcgc ttacgtttac ccaactgaat ctgaacaaga atctaagcaa 1560
ttcatctcta acttcgaaaa caagttgtct cgttgtcact gtgaaccaac tgctactaga 1620
cacgttccat acgaattggg tggtgaattg tcttacttgg ctgttatcaa cgaattggaa 1680
tctgttgacg ctgttttggc tgttgttcca ccaagaaacg acgacagaat cgctgctggt 1740
gacatcactg acccataccc agaatttaag aagggtttgg gtaagcaaaa ggttccatct 1800
caaatggttg ttactgaaaa cttggacact agatgggtta tgaacaacac tgctatgggt 1860
ttgatcgctg gtgctggtgg tgttccatgg agagttgacg aaatgccagg tgaggctgac 1920
tgtttcatcg gtctcgcagt tactcgtgac ccagaaactg gtcaacactt gggtgcttct 1980
gctaacgttg tttacgctga cggtactgtt ttcgcttcta agactcaaac tttgcaatct 2040
ggtgaaactt tcgacgaaca atctatcatc gacgttatca aggacgtttt ccaagaattt 2100
gttagaagag aaggtagatc tccagaacac atcgttatcc acagagacgg tagattgttc 2160
gaagacgctg acgaaatcca agctccattc gctgactctg gtgtttctat cgacatcttg 2220
gacatcagaa agtctggtgc tccaagaatc gctagatacg aagacaactc tttcaagatc 2280
gacgaaaagg gtagattgtt catctctcaa gacgacactc acggtttcat cgctactact 2340
ggtaagccag aatttgacga ctctgacaac ctcggtactc caaagactct cagagttgtt 2400
cgtagagctg gtgacactcc aatgttgact ttgttgaagc aagtttactg gttgtctgaa 2460
gctcacatcg gttctgtttc tcgttctgtt agattgccaa tcactactta ctacgctgac 2520
agatgtgctg aacacgctag agaaggttac ttgttgcacg gtgaattgat cgaaggtgtt 2580
ccatacttgt aa 2592

Claims (19)

1.一种Ago蛋白的用途,其特征在于:所述Ago蛋白用于真核细胞内的不依赖于外源靶向向导、并基于同源重组的靶向基因编辑。
2.根据权利要求1所述的Ago蛋白的用途,其特征在于:所述Ago蛋白包括来自常温菌的pAgo蛋白以及来自嗜热菌的pAgo蛋白。
3.根据权利要求2所述的Ago蛋白的用途,其特征在于:所述Ago蛋白是PIWI核酸酶活性中心四元基序符合DEDX特征的pAgo蛋白。
4.根据权利要求3所述的Ago蛋白的用途,其特征在于:所述pAgo蛋白是来自常温菌的pAgo蛋白,并来自Halogeometricum pallidum(NCBI登录号:ELZ29017.1)的HpAgo,或来自Microcystis aeruginosa(NCBI登录号WP_012265209.1)的MaAgo,或来自Halorubrumezzemoulense(NCBI登录号:WP_094494460.1)的HeAgo,或来自filamentouscyanobacterium(NCBI登录号:WP_106331578.1)的FcAgo,或来自Mastigocoleus testarum(NCBI登录号:WP_027844945.1)的MtAgo;或者,所述pAgo蛋白是来自嗜热菌的pAgo蛋白,并来自Exiguobacterium sp.(NCBI登录号:ACQ71053.1)的ExAgo。
5.根据权利要求2所述的Ago蛋白的用途,其特征在于:所述Ago蛋白是来自常温菌的、PIWI核酸酶活性中心四元基序不符合DEDX特征的pAgo蛋白。
6.根据权利要求5所述的Ago蛋白的用途,其特征在于:所述pAgo蛋白是来自常温菌的Pantoea anthophila(NCBI登录号:WP_046101283.1)的PaAgo,或Flavobacterium soli(NCBI登录号:WP_026705043.1)的FsAgo。
7.根据权利要求2所述的Ago蛋白的用途,其特征在于:所述Ago蛋白为PIWI核酸酶活性中心突变后不再符合DEDX特征的pAgo蛋白的突变体。
8.根据权利要求7所述的Ago蛋白的用途,其特征在于:所述pAgo蛋白是来自常温菌的HpAgo的突变体HpAgoD646A,或者来自嗜热菌的ExAgo的突变体ExAgoD398A/S400A
9.根据权利要求3至8中任一项所述的Ago蛋白的用途,其特征在于:所述Ago蛋白含有与所述pAgo蛋白/突变体的序列同源性大于等于80%的氨基酸序列。
10.一种组合物,用于真核细胞的靶向基因编辑,其特征在于:所述组合物由同源重组片段和权利要求1至9中任一项所述的Ago蛋白组合而成。
11.根据权利要求10所述的组合物,其特征在于:所述同源重组片段是能够在靶向区域实现基因表达盒插入的同源重组片段,或能够在靶向区域通过替换原有基因片段以实现基因表达盒插入的同源重组片段,或能够在靶向区域实现基因片段插入或替换的同源重组片段,或能够在靶向区域实现基因片段删除的同源重组片段。
12.根据权利要求10所述的组合物,其特征在于:所述组合物中的Ago蛋白是所述Ago蛋白本身,或者是包括其编码RNA/其整合到宿主染色体的表达盒/其表达质粒在内的所述Ago蛋白的表达元件。
13.根据权利要求10至12中任一项所述的组合物,其特征在于:所述同源重组片段中,至少一侧的同源臂的长度不低于200bp。
14.根据权利要求13所述的组合物,其特征在于:所述同源重组片段中,至少一侧的同源臂的长度不低于400bp。
15.一种基因编辑方法,用于真核细胞靶向基因的编辑,其特征在于:该方法使权利要求10至14中任一项所述组合物出现于真核细胞中。
16.根据权利要求15所述的基因编辑方法,其特征在于:使所述组合物出现于真核细胞中,是采用转染、或化学转化、或电转化、或基因枪转化的方式将所述组合物导入细胞内实现的。
17.根据权利要求15所述的基因编辑方法,其特征在于:该方法中所述基因编辑的形式包括基因表达盒的靶向敲入或替换、基因片段的靶向敲入或替换、基因片段的靶向删除。
18.根据权利要求15所述的基因编辑方法,其特征在于:所述真核细胞为活体真核微生物细胞、活体植物细胞或活体动物细胞。
19.一种真核细胞,其特征在于:该真核细胞由权利要求15至18中任一项所述的基因编辑方法获得。
CN201910870351.0A 2019-09-12 2019-09-16 Ago蛋白的用途及组合物和基因编辑方法 Active CN112481309B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019108665398 2019-09-12
CN201910866539 2019-09-12

Publications (2)

Publication Number Publication Date
CN112481309A true CN112481309A (zh) 2021-03-12
CN112481309B CN112481309B (zh) 2023-10-10

Family

ID=74919995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910870351.0A Active CN112481309B (zh) 2019-09-12 2019-09-16 Ago蛋白的用途及组合物和基因编辑方法

Country Status (1)

Country Link
CN (1) CN112481309B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112538470A (zh) * 2020-12-11 2021-03-23 湖北大学 一种原核生物来源的Argonaute蛋白及其应用
CN114163506A (zh) * 2021-11-09 2022-03-11 上海交通大学 施氏假单胞杆菌来源的PsPIWI-RE蛋白在介导同源重组上的应用
CN117778377A (zh) * 2023-12-14 2024-03-29 湖北大学 基于新型可编程核酸酶Argonaute的大片段DNA高效合成与组装方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170058298A1 (en) * 2015-08-31 2017-03-02 Agilent Technologies, Inc. Compounds and methods for crispr/cas-based genome editing by homologous recombination
CN106589134A (zh) * 2016-11-11 2017-04-26 仪宏 嵌合蛋白pAgoE及构建方法、应用以及使用向导的嵌合蛋白pAgoE及构建方法、应用
CN107880132A (zh) * 2016-09-30 2018-04-06 北京大学 一种融合蛋白及使用其进行同源重组的方法
US20180327784A1 (en) * 2015-07-15 2018-11-15 Rutgers, The State University Of New Jersey Nuclease-Independent Targeted Gene Editing Platform and Uses Thereof
CN109153990A (zh) * 2015-12-21 2019-01-04 浙江大学 用于基因编辑的组合物和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180327784A1 (en) * 2015-07-15 2018-11-15 Rutgers, The State University Of New Jersey Nuclease-Independent Targeted Gene Editing Platform and Uses Thereof
US20170058298A1 (en) * 2015-08-31 2017-03-02 Agilent Technologies, Inc. Compounds and methods for crispr/cas-based genome editing by homologous recombination
CN109153990A (zh) * 2015-12-21 2019-01-04 浙江大学 用于基因编辑的组合物和方法
CN107880132A (zh) * 2016-09-30 2018-04-06 北京大学 一种融合蛋白及使用其进行同源重组的方法
CN106589134A (zh) * 2016-11-11 2017-04-26 仪宏 嵌合蛋白pAgoE及构建方法、应用以及使用向导的嵌合蛋白pAgoE及构建方法、应用

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112538470A (zh) * 2020-12-11 2021-03-23 湖北大学 一种原核生物来源的Argonaute蛋白及其应用
CN112538470B (zh) * 2020-12-11 2023-03-28 湖北大学 一种原核生物来源的Argonaute蛋白及其应用
CN114163506A (zh) * 2021-11-09 2022-03-11 上海交通大学 施氏假单胞杆菌来源的PsPIWI-RE蛋白在介导同源重组上的应用
CN114163506B (zh) * 2021-11-09 2023-08-25 上海交通大学 施氏假单胞杆菌来源的PsPIWI-RE蛋白在介导同源重组上的应用
CN117778377A (zh) * 2023-12-14 2024-03-29 湖北大学 基于新型可编程核酸酶Argonaute的大片段DNA高效合成与组装方法

Also Published As

Publication number Publication date
CN112481309B (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
CN107922931B (zh) 热稳定的Cas9核酸酶
US10640754B1 (en) Engineered enzymes
ES2802984T3 (es) Ingeniería del genoma multiplex mediante CRISPR
ES2353700T3 (es) Generación de genes recombinantes en saccharomyces cerevisiae.
CN111448313A (zh) 用于改善基于Cas9的敲入策略的有效性的组合物和方法
CN112481309B (zh) Ago蛋白的用途及组合物和基因编辑方法
Zhang et al. A gene cluster that regulates both heterocyst differentiation and pattern formation in Anabaena sp. strain PCC 7120
US20190144852A1 (en) Combinatorial Metabolic Engineering Using a CRISPR System
CN114262369B (zh) ZmDi19基因及其靶标基因ZmPR10在培育抗灰斑病植物中的应用
Nobile et al. Large-scale gene disruption using the UAU1 cassette
CN106589134B (zh) 嵌合蛋白pAgoE及构建方法、应用以及使用向导的嵌合蛋白pAgoE及构建方法、应用
CN111902541A (zh) 增加细胞中感兴趣的核酸分子表达水平的方法
García-Pedrajas et al. DelsGate, a robust and rapid gene deletion construction method
US6703200B1 (en) Methods and materials for the rapid and high volume production of a gene knock-out library in an organism
CN114008070A (zh) 导致大肠杆菌赖氨酸产量增加的全基因组合理设计的突变
Testa et al. BAC engineering for the generation of ES cell-targeting constructs and mouse transgenes
JPWO2017135317A1 (ja) 変異糸状菌の製造方法
JP2021505158A (ja) Tprドメイン含有タンパク質の遺伝子改変を介した藻類脂質生産性の改善方法
CN108728477A (zh) 一种高效的转座突变系统及构建方法
Li et al. Simplification of nutritional conditions in transformation procedures for genome editing with the CRISPR/Cas9 system for fission yeast
Houkes et al. Design, construction and optimization of a synthetic RNA polymerase operon in Escherichia coli
Kianpour Identification of optimal sgRNA candidates for mutagenesis of the ALS1 gene in Ipomoea batatas using in-vitro cleavage assay and CRISPR/Cas9 technology
Almutawa Impact of Chromosomal Translocations (CTs) on reproductive isolation and fitness in natural yeast isolates
Daniels et al. Saccharomyces cerevisiae [version 2; referees: 3 approved]
WO2000055311A2 (en) Gene modification by homologous recombination

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant