CN109641062A

CN109641062A - 用于产生化合物的组合物和方法

Info

Publication number: CN109641062A
Application number: CN201780030563.7A
Authority: CN
Inventors: B.R.鲍曼; J.A.V.布洛杰特; G.L.维尔丁; D.C.格雷; J.P.摩根-斯特恩; L.富尔斯顿; K.罗比森
Original assignee: Waterloo Biology Co
Current assignee: Ginkgo Bioworks Inc
Priority date: 2016-04-12
Filing date: 2017-04-12
Publication date: 2019-04-16
Also published as: JP2019511231A; WO2017180748A1; ES2921056T3; EP3442599A1; MA44680A; KR102615448B1; EP4085933A3; US10907188B2; KR20220021019A; US11447810B2; AU2017249412A1; US20190136284A1; CA3020594A1; AU2017249412B2; KR102359972B1; US20210238646A1; EP4085933A2; KR20190005872A; EP3442599B1; JP7187318B2

Abstract

本公开提供了编码转录因子LuxR家族的大ATP结合调控因子(LAL)的核酸、包括此类核酸的载体和宿主细胞以及用于使用此类核酸、载体和/或宿主细胞产生化合物(例如聚酮或β‑内酰胺化合物)的方法。

Description

用于产生化合物的组合物和方法

背景

转录活化因子LuxR家族的大ATP结合调控因子(LAL)为诸如FK506或雷帕霉素(rapamycin)的聚酮的已知转录调控因子。已发现LAL家族在诱导一些类型的天然产物基因簇的表达中具有积极作用，例如PikD对于苦霉素产生以及RapH对于雷帕霉素产生。LAL蛋白含有三个结构域；核苷酸结合域、诱导剂结合域及螺旋-转角-螺旋(DNA结合)结构域。DNA结合域的结构为四螺旋束。该基序中螺旋3的特定蛋白残基序列将LAL引导至原核转录启动子区中所含的特定DNA序列(即，LAL结合位点)。复合物中的LAL或多个LAL结合至产生小分子的基因簇(例如聚酮合酶基因簇或产生β-内酰胺化合物的蛋白质基因簇)内的基因启动子中的特定位点，增强基因簇的表达并且因此促进化合物(例如聚酮或β-内酰胺化合物)的产生。因此，通过优化对产生小分子的对应基因簇(例如PKS基因簇或β-内酰胺化合物基因簇)的调控有机会开发出产生更高效和/或增加的化合物(例如聚酮或β-内酰胺化合物)产生的组合物和方法。

发明概述

本公开提供了编码重组LAL的核酸、包括重组LAL的载体和宿主细胞以及在用于产生化合物(例如聚酮、脂肪酸、类萜、非核糖体多肽、β-内酰胺化合物以及生物碱)的方法中使用这些核酸、载体以及宿主细胞的方法。因此，在第一方面中，本公开提供了一种经过工程化以表达重组LAL(例如异源LAL)的宿主细胞(例如天然缺乏LAL和/或LAL结合位点的宿主细胞)。在一些实施方案中，LAL为组成活性的。在一些实施方案中，通过在核酸中插入LAL结合位点将宿主细胞工程化。在一些实施方案中，重组LAL结合至LAL结合位点促进核酸(例如编码诸如聚酮合酶或产生β-内酰胺化合物的蛋白质等产生化合物的蛋白质的核酸)的转录。在一些实施方案中，LAL结合位点对于LAL为异源的。在一些实施方案中，LAL结合位点对于LAL为内源性的。在一些实施方案中，LAL结合位点包括序列GGGGGT。

在一些实施方案中，宿主细胞包括包含异源LAL结合位点的核酸，所述异源LAL结合位点可操作地连接至开放阅读框，使得LAL结合至异源LAL结合位点促进开放阅读框的表达。在一些实施方案中，异源LAL结合位点为合成LAL结合位点。在一些实施方案中，异源LAL结合位点与可操作地连接至开放阅读框的内源性LAL结合位点相比更大程度地促进表达。在一些实施方案中，异源LAL结合位点包括C₁-T₂-A₃-G₄-G₅-G₆-G₇-G₈-T₉-T₁₀-G₁₁-C₁₂(SEQ IDNO:2)的至少8个连续核苷酸，其中除了G₄、G₅、G₆、G₇、G₈、T₉以及T₁₀中的任何三个核苷酸(例如G₄、G₇以及T₉；G₅、G₈以及T₁₀；或G₆、G₇以及G₈)以外没有一个或最多六个核苷酸由任何其他核苷酸置换。

在一些实施方案中，重组LAL包括与SEQ ID NO:1的序列具有至少70％(例如至少75％、至少80％、至少85％、至少90％、至少95％、至少99％)序列同一性的部分。在一些实施方案中，重组LAL包括具有SEQ ID NO:1的序列的部分。在一些实施方案中，重组LAL具有SEQID NO:1的氨基酸序列。

MPAVESYELDARDDELRRLEEAVGQAGNGRGVVVTITGPIACGKTELLDAAAAKSDAITLRAVCSEEERALPYALIGQLIDNPAVASQLPDPVSMALPGEHLSPEAENRLRGDLTRTLLALAAERPVLIGIDDMHHADTASLNCLLHLARRVGPARIAMVLTELRRLTPAHSQFHAELLSLGHHREIALRPLGPKHIAELARAGLGPDVDEDVLTGLYRATGGNLNLGHGLIKDVREAWATGGTGINAGRAYRLAYLGSLYRCGPVPLRVARVAAVLGQSANTTLVRWISGLNADAVGEATEILTEGGLLHDLRFPHPAARSVVLNDLSARERRRLHRSALEVLDDVPVEVVAHHQAGAGFIHGPKAAEIFAKAGQELHVRGELDAASDYLQLAHHASDDAVTRAALRVEAVAIERRRNPLASSRHLDELTVAARAGLLSLEHAALMIRWLALGGRSGEAAEVLAAQRPRAVTDQDRAHLRAAEVSLALVSPGASGVSPGASGPDRRPRPLPPDELANLPKAARLCAIADNAVISALHGRPELASAEAENVLKQADSAADGATALSALTALLYAENTDTAQLWADKLVSETGASNEEEGAGYAGPRAETALRRGDLAAAVEAGSAILDHRRGSLLGITAALPLSSAVAAAIRLGETERAEKWLAEPLPEAIRDSLFGLHLLSARGQYCLATGRHESAYTAFRTCGERMRNWGVDVPGLSLWRVDAAEALLHGRDRDEGRRLIDEQLTHAMGPRSRALTLRVQAAYSPQAQRVDLLEEAADLLLSCNDQYERARVLADLSEAFSALRHHSRARGLLRQARHLAAQCGATPLLRRLGAKPGGPGWLEESGLPQRIKSLTDAERRVASLAAGGQTNRVIADQLFVTASTVEQHLTNVFRKLGVKGRQHLPAELANAE(SEQ ID NO:1)。

在一些实施方案中，宿主细胞为细菌(例如放线菌，诸如生二素链霉菌(Streptomyces ambofaciens)、吸水链霉菌(Streptomyces hygroscopicus)或马来亚链霉菌(Streptomyces malayensis))。在一些实施方案中，放线菌为S1391、S1496或S2441。

在一些实施方案中，已对宿主细胞进行修饰以增强产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的表达。举例来说，在一些实施方案中，已如下对宿主细胞进行修饰以增强产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的表达：(i)缺失表达产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的内源性基因簇；(ii)插入表达产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的异源基因簇；(iii)使所述宿主细胞暴露于抗生素攻击；和/或(iv)引入与同源启动子相比使化合物的表达至少增加两倍的异源启动子。用于增强化合物(例如聚酮或β-内酰胺化合物)的表达的另一方法为优化用于生长的培养基条件。这包括培养基的具体化学和营养物组成、在液体还是固体培养基中进行发酵、发酵的时间过程以及发酵操作的体积/规模。

在另一个方面中，本公开提供了一种编码LAL的核酸，其中LAL包括与SEQ ID NO:1的氨基酸序列具有至少70％(例如至少75％、至少80％、至少85％、至少90％、至少95％、至少99％)序列同一性的部分。在一些实施方案中，LAL包括具有SEQ ID NO:1的序列的部分。在一些实施方案中，LAL具有SEQ ID NO:1的序列。在一些实施方案中，核酸在至少一个开放阅读框中缺乏TTA调控密码子。

在一些实施方案中，核酸还包含LAL结合位点，例如与SEQ ID NO:2(CTAGGGGGTTGC)的序列具有至少80％(例如至少85％、至少90％、至少95％、至少99％)同一性的LAL结合位点。在一些实施方案中，LAL结合位点包括SEQ ID NO:2的序列。在一些实施方案中，LAL结合位点具有SEQ ID NO:2的序列。在一些实施方案中，LAL结合位点包括序列SEQ ID NO:3(GGGGGT)。

在一些实施方案中，核酸还包括被定位以使得LAL结合至LAL结合位点促进开放阅读框表达的开放阅读框。在一些实施方案中，开放阅读框编码产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)。

在一些实施方案中，开放阅读框编码聚酮合酶。在一些实施方案中，核酸还编码非核糖体肽合酶。在一些实施方案中，核酸还编码第一P450酶。在一些实施方案中，核酸还编码第二P450酶。

在一些实施方案中，开放阅读框编码产生β-内酰胺化合物的蛋白质。在一些实施方案中，开放阅读框编码两种或更多种(例如三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种或八种或更多种)产生β-内酰胺化合物的蛋白质。在一些实施方案中，核酸还编码一种或多种剪裁蛋白(tailoring protein)。

在另一个方面中，本公开提供了一种包括前述核酸中的任一种的表达载体。在一些实施方案中，表达载体为人工染色体(例如细菌人工染色体)。

在另一个方面中，本公开提供了一种包括前述载体中的任一种的宿主细胞。

在另一个方面中，本公开提供了一种产生化合物(例如聚酮、脂肪酸、类萜、β-内酰胺化合物、非核糖体多肽或生物碱)的方法。此方法包括：(a)提供宿主细胞，所述宿主细胞经工程化以表达重组LAL并且包括可操作地连接至开放阅读框的LAL结合位点，使得重组LAL结合至LAL结合位点促进开放阅读框的表达，其中宿主细胞包括编码产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的核酸；以及(b)在适合于允许化合物由产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)表达的条件下培养宿主细胞；由此产生化合物。

在另一个方面中，本公开提供了一种鉴定合成LAL结合位点的方法，所述方法包括：(a)提供包括至少八个核苷酸的多个合成核酸；(b)使包括至少八个核苷酸的多个核苷酸中的一个或多个与一个或多个LAL接触；(c)测定步骤(a)的核酸与步骤(b)的LAL之间的结合亲和力，其中如果合成结合位点当连接至下游基因时如由RNA转录至少增加2倍所测量能够诱导所连接基因的转录，那么将合成核酸鉴定为合成LAL结合位点。在一些实施方案中，其中如果合成核酸与LAL之间的亲和力小于500nM(例如小于250nm、小于100nM、小于50nM、小于20nM或在1-50nM之间、在5-75nM之间、在50与100nM之间、在75与250nM之间)，那么将合成核酸鉴定为合成LAL结合位点。

定义

如本文所用的术语“产生化合物的蛋白质”是指诸如聚酮合酶等蛋白质，所述蛋白质当在细胞中在适合的条件下表达时产生小分子(例如聚酮、脂肪酸、类萜、β-内酰胺化合物、非核糖体多肽或生物碱)。

细胞被“工程化以含有”和/或“工程化以表达”是指细胞已被修饰以含有和/或表达不天然存在于细胞中的蛋白质。可例如通过引入编码蛋白质的核酸(通过引入包括核酸的载体)将细胞工程化以含有蛋白质。

如本文所用的术语“产生小分子的基因簇”是指编码一种或多种产生化合物的蛋白质的基因簇。

如本文所用的术语“异源”是指两种或更多种蛋白质、核酸、化合物和/或细胞之间的在自然界中不存在的关系。举例来说，具有SEQ ID NO:1的序列的LAL天然存在于S18链霉菌属菌株中并且因此与所述菌株同源并且因此将与S12链霉菌属菌株异源。

如本文所用的术语“同源”是指两种或更多种蛋白质、核酸、化合物和/或细胞之间的天然存在的关系。举例来说，具有SEQ ID NO:1的序列的LAL天然存在于S18链霉菌属菌株中并且因此与所述菌株同源。

“聚酮合酶”是指属于多域酶家族的能够产生聚酮的酶。聚酮合酶可天然地在细菌、真菌、植物或动物中表达。

“β-内酰胺化合物”是指具有包括β-内酰胺环的结构的任何化合物，包括β-内酰胺抗生素和β-内酰胺抑制剂。式I中提供了β-内酰胺环的结构。

本发明的β-内酰胺化合物被视为至少包括5元不饱和β-内酰胺化合物(例如碳青霉烯(carbapanem))、5元饱和β-内酰胺化合物(例如青霉烷(penam)，诸如青霉素；以及克拉维烷(clavam)，诸如克拉维酸(clavulanic acid))、单环β-内酰胺化合物(例如诺卡霉素(nocardicin)和单菌霉素(monobactam))以及6元不饱和β-内酰胺化合物(例如头孢烯(cephem)，诸如头孢菌素)。Hamed,R.B.等人,The enzymes of β-lactambiosynthesis.Nat Prod Rep.31(9):1127(2014)中描述了示例性β-内酰胺化合物，该文献的化合物以引用的方式并入本文中。

“产生β-内酰胺化合物的蛋白质”是指生物合成途径中产生β-内酰胺化合物的任何蛋白质(例如酶)。可认为产生β-内酰胺化合物的酶包括产生β-内酰胺环的生物合成前体的蛋白质(例如ACV合成酶、羧乙基精氨酸合酶)、催化形成β内酰胺环的蛋白质(例如异青霉素N合成酶、β-内酰胺合成酶、CarA、CarB、CarC或ThnM)或修饰β-内酰胺环的任何蛋白质(例如剪裁酶(tailoring enzyme))。Hamed,R.B.等人,The enzymes ofβ-lactambiosynthesis.Nat Prod Rep.31(9):1127(2014)中描述了示例性产生β-内酰胺的酶，该文献的酶以引用的方式并入本文中。

“产生β-内酰胺化合物的蛋白质基因簇”是指编码产生β-内酰胺化合物的蛋白质的产生的任何基因簇。在一些实施方案中，本发明的产生β-内酰胺化合物的蛋白质基因簇可编码天然存在的β-内酰胺化合物。在其他实施方案中，本发明的产生β-内酰胺化合物的蛋白质基因簇可编码天然存在的β-内酰胺化合物的工程化变体。

如本文所用的术语“重组”是指使用合成方法产生的蛋白质。

附图说明

图1A至图1C为示出使用LAL转录调控因子来进行生物合成基因座的一般诱导和过表达的策略的图。图1A示出了包括两个双向启动子区和LAL编码基因的X1生物合成基因座的设计。图1B示出了从FK簇启动子区提取的一系列保守推定LAL结合域。图1C示出了噬菌体整合性组成性LAL构建的流程。

图2为示出基于基因组数据库的LAL序列分析的图。比对了一系列FK LAL的氨基酸序列并且用于设计对LAL分化(clading)的查询。指出了所设计查询中的保守残基(*＝在FKLAL中100％保守；:＝极度类似的残基；.＝稍微类似的残基)。

图3为表明FkPhD聚集在一起并且不同于其他PKS-相关LAL(诸如pikD)的进化分枝图。

图4为示出针对增加的化合物1、化合物2以及化合物3产量通过LC/MS测定的S22/LAL接合后体的图。

图5为示出用于增加S22中的化合物1和化合物2产量的组合的LAL和cyp操纵的一系列图。

图6为示出用X1启动子置换X15启动子以及引入异源LAL编码基因座的策略的图。

图7为表明用X1启动子置换X15启动子以及异源LAL表达引起来自沉默X15簇的生物合成产生的一系列图。

图8为示出各种FK双向启动子的序列分析的图。Rap和X1启动子与良好产生相关。X11.1和X22.1启动子与减损的产生相关。X15和X23.1启动子为沉默的。与共有序列的偏差与减少的分子产生相关联。

图9为示出X11.1和X11.2双向启动子工程化以及野生型(即，X11.1和X11.2)与恢复的(即，Seq1、Seq2以及Seq3)LAL结合序列的序列比对的图。

图10为表明LAL序列中的序列病变恢复产生增加的PKS产量的一系列图。

图11A为示出对用于形成四种UniLAL变体(PC_L、PC_R、PT_L以及PT_R)的生物合成基因座中的两个启动子区的剖析的图。

图11B为示出适用于产生四种UniLAL变体的核酸序列工程化策略的图。

图12为示出在LAL-阴性S22对照中以及当将四种UniLAL变体中的每一种中的一种亚克隆在S18LAL的前面并且用于驱动S22中的PKS表达时产生的化合物1、化合物2、化合物3以及化合物4的水平的图。

图13为示出使用UniLAL来活化不天然包括LAL调控因子的转录沉默生物合成簇的聚酮产生的图。

图14为示出使用LAL调节子来形成用于来自生物合成簇的过表达的正反馈循环的图。

图15为示出联合使用正反馈循环和组成性S18LAL的图。

图16为示出将X1启动子敲入内源性基因座中的FKPHD簇中用于天然菌株表达的图。

图17A至图17B为示出使用pX1-S18LAL体系来驱动新颖β-内酰胺基因簇WAC292过表达的图。图17A示出了包括插入WAC292β-内酰胺基因簇的三个双向X1启动子区(P2、P3以及P5)的生物合成基因座的设计。图17B为示出通过NanoString测量且以log2值形式展示的归一化mRNA水平的表格。NanoString分析表明与WAC292-WT相比在WAC292-p2p3p5中连接至P2、P3以及P5启动子的转录物显著上调。

具体实施方式

本发明人发现LAL的螺旋-转角-螺旋DNA结合基序的螺旋3内与已知聚酮合酶相关的氨基酸序列为100％保守的。由于LAL的螺旋3的保守，在编码聚酮合酶的基因的启动子-操纵子区中存在可预测的可能包括LAL结合位点的DNA序列基序。LAL-DNA相互作用基序在蛋白质与DNA层面的保守使得LAL能够可互换地用于活化天然产物基因簇的转录。

化合物

可使用本发明的方法产生的化合物包括但不限于聚酮和聚酮大环内酯抗生素，诸如红霉素；杂合聚酮/非核糖体肽，诸如雷帕霉素和FK506；碳水化合物，包括氨基糖苷抗生素，诸如庆大霉素(gentamicin)、卡那霉素(kanamycin)、新霉素、妥布霉素(tobramycin)；类苯并呋喃(benzofuranoids)；类苯并吡喃(benzopyranoids)；类黄酮；糖肽，包括万古霉素(vancomycin)；脂肽，包括达托霉素(daptomycin)；丹宁酸；木酚素；多环芳族天然产物、类萜、类固醇、固醇、噁唑烷酮，包括利奈唑胺(linezolid)；氨基酸、肽以及肽抗生素，包括多粘菌素、非核糖体肽、β-内酰胺化合物，包括β-内酰胺抗生素和β-内酰胺酶抑制剂(例如碳青霉烯、头孢菌素、青霉素、克拉维酸、单菌霉素、诺卡霉素、烟草野火毒素(tabtoxin)以及缀合β-内酰胺)；嘌呤、蝶啶、聚吡咯、四环素、喹诺酮以及氟喹诺酮；以及磺酰胺。

蛋白质

LAL

LAL包括三个结构域：核苷酸结合域、诱导剂结合域以及DNA结合域。包括LAL的调控蛋白的结构类别的定义特征为存在AAA+ATP酶结构域。核苷酸水解与蛋白质中的大构象变化和/或多聚化有关，并且核苷酸结合和水解代表控制LAL活性(例如LAL活性的持续时间)的“分子计时器”。通过使小分子配体结合至诱导剂结合位点来活化LAL。在大多数情况下，LAL的别构诱导剂为未知的。在相关蛋白MalT的情况下，别构诱导剂为麦芽三糖。可能的LAL蛋白诱导剂包括在触发化合物(例如聚酮或β-内酰胺化合物)生物合成的环境中发现的小分子。LAL的调控控制产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的产生，从而在存在外部环境刺激的情况下引起化合物(例如聚酮或β-内酰胺化合物)产生的活化。因此，存在产生小分子的基因簇(例如PKS基因簇或产生β-内酰胺化合物的蛋白质基因簇)，所述产生小分子的基因簇当存在于菌株中时不产生化合物，因为(i)LAL尚未活化，(ii)菌株具有不同于共有的LAL结合位点，(iii)菌株缺乏LAL调控因子，或(iv)LAL调控因子在实验室的条件下可能不良表达或不表达。因为已知PKS LAL的LAL DNA结合区为高度保守的，所以已知LAL可互换地用于活化PKS基因簇和其他产生化合物的基因簇，诸如产生β-内酰胺化合物的蛋白质基因簇，除了它们天然调控的那些。在一些实施方案中，LAL为融合蛋白。

在一些实施方案中，可对LAL进行修饰以包括非LAL DNA结合域，由此形成包括LAL核苷酸结合域和非LAL DNA结合域的融合蛋白。在某些实施方案中，非LAL DNA结合域能够结合于包括蛋白结合位点的启动子，所述蛋白结合位点被定位以使得DNA结合域结合至启动子的蛋白结合位点促进所关注的基因(例如编码如本文所描述的产生化合物的蛋白质的基因)的表达。非LAL DNA结合域可包括本领域已知的任何DNA结合域。在一些情况下，非LALDNA结合域为转录因子DNA结合域。非LAL DNA结合域的实例包括但不限于碱性螺旋-环-螺旋(bHLH)结构域、亮氨酸拉链结构域(例如碱性亮氨酸拉链结构域)、GCC盒结构域、螺旋-转角-螺旋结构域、同源结构域、srf样结构域、配对盒结构域、翼状螺旋结构域、锌指结构域、HMG盒结构域、Wor3结构域、OB-折叠结构域、免疫球蛋白结构域、B3结构域、TAL效应子结构域、Cas9DNA结合域、GAL4DNA结合域以及本领域已知的任何其他DNA结合域。在一些情况下，启动子定位在所关注的基因上游，使得融合蛋白可结合于启动子并且诱导或抑制所关注的基因的表达。在某些情况下，启动子为引入含有所关注的基因的核酸(例如染色体、质粒、福斯粘粒(fosmid)或本领域已知的任何其他核酸构建体)的异源启动子。在其他情况下，启动子为定位于所关注的基因上游的预先存在的启动子。启动子内的蛋白结合位点可例如为非LAL蛋白结合位点。在某些实施方案中，蛋白结合位点结合于非LAL DNA结合域，由此形成同源DNA结合域/蛋白结合位点对。

在一些实施方案中，LAL由与SEQ ID NO:4-25中的任一者具有至少70％(例如至少75％、至少80％、至少85％、至少90％、至少95％、至少99％)序列同一性的核酸编码或具有与SEQ ID NO:26-36中的任一者具有至少70％(例如至少75％、至少80％、至少85％、至少90％、至少95％、至少99％)序列同一性的序列。

SEQ ID NO:4：

ATGCCTGCCGTGGAGTGCTATGAACTGGACGCCCGCGATGACGAGCTCAGAAAACTGGAGGAGGTTGTGACCGGGCGGGCCAACGGCCGGGGTGTGGTGGTCACCATCACCGGACCGATCGCCTGCGGCAAGACCGAACTGCTCGACGCAGCCGCCGCGAAGGCCGACGCCATCACGTTACGAGCGGTCTGCTCCGCGGAGGAACAGGCACTCCCGTACGCCCTGATCGGGCAGCTCATCGACAACCCGGCGCTCGCCTCCCACGCGCTGGAGCCGGCCTGCCCGACCCTCCCGGGCGAGCACCTGTCGCCGGAGGCCGAGAACCGGCTGCGCAGCGACCTCACCCGTACCCTGCTGGCGCTCGCCGCCGAACGGCCGGTGCTGATCGGCATCGACGAGTCACACGCGAACGCTTTGTGTCTGCTCCACCTGGCCCGAAGGGTCGGCTCGGCCCGGATCGCCATGGTCCTCACCGAGTTGCGCCGGCTCACCCCGGCCCACTCACAGTTCCAGGCCGAGCTGCTCAGCCTGGGGCACCACCGCGAGATCGCGCTGCGCCCGCTCAGCCCGAAGCACACCGCCGAGCTGGTCCGCGCCGGTCTCGGTCCCGACGTCGACGAGGACGTGCTCACGGGGTTGTACCGGGCGACCGGCGGCAACCTGAACCTCACCCGCGGACTGATCAACGATGTGCGGGAGGCCTGGGAGACGGGAGGGACGGGCATCAGCGCGGGCCGCGCGTACCGGCTGGCATACCTCGGTTCCCTCTACCGCTGCGGCCCGGTCCCGTTGCGGGTCGCACGGGTGGCCGCCGTGCTGGGCCAGAGCGCCAACACCACCCTGGTGCGCTGGATCAGCGGGCTCAACGCGGACGCGGTGGGCGAGGCAACCGAGATCCTCACCGAAGGCGGCCTGCTGCACGACCTGCGGTTCCCGCACCCGGCGGCCCGTTCGGTGGTACTCAACGACATGTCCGCCCAGGAACGACGCCGCCTGCACCGGTCCGCTCTGGAAGTGCTGGACGACGTGCCCGTGGAAGTGGTCGCGCACCACCAGGTCGGCGCCGGTCTCCTGCACGGCCCGAAGGCCGCCGAGATATTCGCCAAGGCCGGCCAGGAGCTGCATGTGCGCGGCGAGTTGGACACCGCGTCCGACTATCTGCAACTGGCCCACCAGGCCTCCGACGACGCCGTCACCGGGATGCGGGCCGAGGCCGTGGCGATCGAGCGCCGCCGCAACCCGCTGGCCTCGAGCCGGCACCTCGACGAGCTGACCGTCGTCGCCCGTGCCGGGCTGCTCTTCCCCGAGCACACGGCGCTGATGATCCGCTGGCTGGGCGTCGGCGGGCGGTCCGGCGAGGCAGCCGGGCTGCTGGCCTCGCAGCGCCCCCGTGCGGTCACCGACCAGGACAGGGCCCATATGCGGGCCGCCGAGGTATCGCTCGCGCTGGTCAGCCCCGGCACGTCCGGCCCGGACCGGCGGCCGCGTCCGCTCACGCCGGATGAGCTCGCGAACCTGCCGAAGGCGGCCCGGCTCTGCGCGATCGCCGACAATGCCGTCATGTCGGCCCTGCGCGGTCGTCCCGAGCTCGCCGCGGCCGAGGCGGAGAACGTCCTGCAGCACGCCGACTCGGCGGCGGCCGGCACCACCGCCCTCGCCGCGCTGACCGCCTTGCTGTACGCGGAGAACACCGACACCGCTCAGCTCTGGGCCGACAAGCTGGTCTCCGAGACCGGGGCGTCGAACGAGGAGGAGGCGGGCTACGCGGGGCCGCGCGCCGAAGCCGCGTTGCGTCGCGGCGACCTGGCCGCGGCGGTCGAGGCAGGCAGCACCGTTCTGGACCACCGGCGGCTCTCGACGCTCGGCATCACCGCCGCGCTACCGCTGAGCAGCGCGGTGGCCGCCGCCATCCGGCTGGGCGAGACCGAGCGGGCGGAGAAGTGGCTCGCCCAGCCGCTGCCGCAGGCCATCCAGGACGGCCTGTTCGGCCTGCACCTGCTCTCGGCGCGCGGCCAGTACAGCCTCGCCACGGGCCAGCACGAGTCGGCGTACACGGCGTTTCGCACCTGCGGGGAACGTATGCGGAACTGGGGCGTTGACGTGCCGGGTCTGTCCCTGTGGCGCGTCGACGCCGCCGAGGCGCTGCTGCACGGCCGCGACCGGGACGAGGGCCGACGGCTCGTCGACGAGCAACTCACCCGTGCGATGGGACCCCGTTCCCGCGCCTTGACGCTGCGGGTGCAGGCGGCGTACAGCCCGCCGGCGAAGCGGGTCGACCTGCTCGATGAAGCGGCCGACCTGCTGCTCTCCTGCAACGACCAGTACGAGCGGGCACGGGTGCTCGCCGACCTGAGCGAGACGTTCAGCGCGCTCCGGCACCACAGCCGGGCGCGGGGACTGCTTCGGCAGGCCCGGCACCTGGCCGCCCAGCGCGGCGCGATACCGCTGCTGCGCCGACTCGGGGCCAAGCCCGGAGGCCCCGGCTGGCTGGAGGAATCCGGCCTGCCGCAGCGGATCAAGTCGCTGACCGACGCGGAGCGGCGGGTGGCGTCGCTGGCCGCCGGCGGACAGACCAACCGCGTGATCGCCGACCAGCTCTTCGTCACGGCCAGCACGGTGGAGCAGCACCTCACGGACGTCTCCACTGGGTCAAGGCCGCCAGCACCTGCCGCCGAACTCGTCTAG

SEQ ID NO:5

ATGCCTGCCGTGGAGTGCTATGAACTGGACGCCCGCGATGACGAGCTCAGAAAACTGGAGGAGGTTGTGACCGGGCGGGCCAACGGCCGGGGTGTGGTGGTCACCATCACCGGACCGATCGCCTGCGGCAAGACCGAACTGCTCGACGCAGCCGCCGCGAAGGCCGACGCCATCACGCTGCGAGCGGTCTGCTCCGCGGAGGAACAGGCACTCCCGTACGCCCTGATCGGGCAGCTCATCGACAACCCGGCGCTCGCCTCCCACGCGCTGGAGCCGGCCTGCCCGACCCTCCCGGGCGAGCACCTGTCGCCGGAGGCCGAGAACCGGCTGCGCAGCGACCTCACCCGTACCCTGCTGGCGCTCGCCGCCGAACGGCCGGTGCTGATCGGCATCGACGAGTCACACGCGAACGCTTTGTGTCTGCTCCACCTGGCCCGAAGGGTCGGCTCGGCCCGGATCGCCATGGTCCTCACCGAGTTGCGCCGGCTCACCCCGGCCCACTCACAGTTCCAGGCCGAGCTGCTCAGCCTGGGGCACCACCGCGAGATCGCGCTGCGCCCGCTCAGCCCGAAGCACACCGCCGAGCTGGTCCGCGCCGGTCTCGGTCCCGACGTCGACGAGGACGTGCTCACGGGGTTGTACCGGGCGACCGGCGGCAACCTGAACCTCACCCGCGGACTGATCAACGATGTGCGGGAGGCCTGGGAGACGGGAGGGACGGGCATCAGCGCGGGCCGCGCGTACCGGCTGGCATACCTCGGTTCCCTCTACCGCTGCGGCCCGGTCCCGTTGCGGGTCGCACGGGTGGCCGCCGTGCTGGGCCAGAGCGCCAACACCACCCTGGTGCGCTGGATCAGCGGGCTCAACGCGGACGCGGTGGGCGAGGCAACCGAGATCCTCACCGAAGGCGGCCTGCTGCACGACCTGCGGTTCCCGCACCCGGCGGCCCGTTCGGTGGTACTCAACGACATGTCCGCCCAGGAACGACGCCGCCTGCACCGGTCCGCTCTGGAAGTGCTGGACGACGTGCCCGTGGAAGTGGTCGCGCACCACCAGGTCGGCGCCGGTCTCCTGCACGGCCCGAAGGCCGCCGAGATATTCGCCAAGGCCGGCCAGGAGCTGCATGTGCGCGGCGAGTTGGACACCGCGTCCGACTATCTGCAACTGGCCCACCAGGCCTCCGACGACGCCGTCACCGGGATGCGGGCCGAGGCCGTGGCGATCGAGCGCCGCCGCAACCCGCTGGCCTCGAGCCGGCACCTCGACGAGCTGACCGTCGTCGCCCGTGCCGGGCTGCTCTTCCCCGAGCACACGGCGCTGATGATCCGCTGGCTGGGCGTCGGCGGGCGGTCCGGCGAGGCAGCCGGGCTGCTGGCCTCGCAGCGCCCCCGTGCGGTCACCGACCAGGACAGGGCCCATATGCGGGCCGCCGAGGTATCGCTCGCGCTGGTCAGCCCCGGCACGTCCGGCCCGGACCGGCGGCCGCGTCCGCTCACGCCGGATGAGCTCGCGAACCTGCCGAAGGCGGCCCGGCTCTGCGCGATCGCCGACAATGCCGTCATGTCGGCCCTGCGCGGTCGTCCCGAGCTCGCCGCGGCCGAGGCGGAGAACGTCCTGCAGCACGCCGACTCGGCGGCGGCCGGCACCACCGCCCTCGCCGCGCTGACCGCCTTGCTGTACGCGGAGAACACCGACACCGCTCAGCTCTGGGCCGACAAGCTGGTCTCCGAGACCGGGGCGTCGAACGAGGAGGAGGCGGGCTACGCGGGGCCGCGCGCCGAAGCCGCGTTGCGTCGCGGCGACCTGGCCGCGGCGGTCGAGGCAGGCAGCACCGTTCTGGACCACCGGCGGCTCTCGACGCTCGGCATCACCGCCGCGCTACCGCTGAGCAGCGCGGTGGCCGCCGCCATCCGGCTGGGCGAGACCGAGCGGGCGGAGAAGTGGCTCGCCCAGCCGCTGCCGCAGGCCATCCAGGACGGCCTGTTCGGCCTGCACCTGCTCTCGGCGCGCGGCCAGTACAGCCTCGCCACGGGCCAGCACGAGTCGGCGTACACGGCGTTTCGCACCTGCGGGGAACGTATGCGGAACTGGGGCGTTGACGTGCCGGGTCTGTCCCTGTGGCGCGTCGACGCCGCCGAGGCGCTGCTGCACGGCCGCGACCGGGACGAGGGCCGACGGCTCGTCGACGAGCAACTCACCCGTGCGATGGGACCCCGTTCCCGCGCCTTGACGCTGCGGGTGCAGGCGGCGTACAGCCCGCCGGCGAAGCGGGTCGACCTGCTCGATGAAGCGGCCGACCTGCTGCTCTCCTGCAACGACCAGTACGAGCGGGCACGGGTGCTCGCCGACCTGAGCGAGACGTTCAGCGCGCTCCGGCACCACAGCCGGGCGCGGGGACTGCTTCGGCAGGCCCGGCACCTGGCCGCCCAGCGCGGCGCGATACCGCTGCTGCGCCGACTCGGGGCCAAGCCCGGAGGCCCCGGCTGGCTGGAGGAATCCGGCCTGCCGCAGCGGATCAAGTCGCTGACCGACGCGGAGCGGCGGGTGGCGTCGCTGGCCGCCGGCGGACAGACCAACCGCGTGATCGCCGACCAGCTCTTCGTCACGGCCAGCACGGTGGAGCAGCACCTCACGGACGTCTCCACTGGGTCAAGGCCGCCAGCACCTGCCGCCGAACTCGTCTAG

SEQ ID NO:6

GTGGTTCCTGAAGTGCGAGCAGCCCCCGACGAACTGATCGCCCGCGATGACGAGCTGAGCCGCCTCCAACGGGCACTCACCAGGGCGGGGAGCGGAAGGGGCGGCGTCGTCGCCATCACCGGGCCCATCGCCAGCGGAAAGACGGCGCTGCTCGACGCCGGAGCGGCCAAGTCCGGCTTCGTCGCACTCCGTGCGGTGTGCTCCTGGGAAGAGCGCACTCTGCCGTACGGGATGCTGGGCCAGCTCTTCGACCATCCCGAACTGGCCGCCCAGGCGCCGGACCTTGCCCACTTCACGGCTTCGTGCGAGAGCCCTCAGGCCGGTACCGACAACCGCCTGCGGGCCGAGTTCACCCGCACCCTGCTGGCGCTCGCCGCGGACTGGCCCGTCCTGATCGGCATCGACGACGTGCACCACGCCGACGCGGAATCACTGCGCTGTCTGCTCCACCTCGCCCGCCGCATCGGCCCGGCCCGCATCGCGGTCGTACTGACCGAGCTGCGCAGACCGACGCCCGCCGACTCCCGCTTCCAGGCGGAACTGCTGAGCCTGCGCTCCTACCAGGAGATCGCGCTCAGACCGCTCACCGAGGCGCAGACCGGCGAACTCGTACGTCGGCACCTCGGCGCGGAGACCCACGAGGACGTCTCCGCCGATACGTTCCGGGCGACCGGCGGGAACCTGCTCCTCGGGCACGGTTTGATCAATGACATCCGGGAGGCGCGGACAGCGGGACGGCCGGGGGTCGTCGCGGGGCGGGCGTACCGGCTCGCGTACCTCAGCTCGCTCTACCGCTGCGGCCCGAGCGCGCTGCGTGTCGCCCGGGCGTCCGCCGTGCTCGGCGCGAGCGCCGAAGCCGTGCTCGTCCAGCGGATGACCGGACTGAACAAGGACGCGGTCGAACAGGTCTATGAGCAGCTGAACGAGGGACGGCTGCTGCAGGGCGAGCGGTTTCCGCACCCGGCGGCCCGCTCCATCGTCCTTGACGACCTGTCGGCCCTGGAACGCAGAAACCTGCACGAGTCGGCGCTGGAGCTGCTGCGGGACCACGGCGTGGCCGGCAACGTGCTCGCCCGCCACCAGATCGGCGCCGGCCGGGTGCACGGCGAGGAGGCCGTCGAGCTGTTCACCGGGGCCGCACGGGAGCACCACCTGCGCGGTGAACTGGACGACGCGGCCGGATACCTGGAACTCGCCCACCGTGCCTCCGACGACCCCGTCACGCGCGCCGCACTACGCGTCGGCGCCGCCGCGATCGAGCGCCTCTGCAATCCGGTACGGGCAGGCCGGCATCTGCCCGAGCTGCTCACCGCGTCGCGCGCGGGACTGCTCTCCAGCGAGCACGCCGTGTCGCTCGCCGACTGGCTGGCGATGGGCGGGCGCCCGGGCGAGGCGGCCGAGGTCCTCGCGACGCAGCGTCCCGCGGCCGACAGCGAGCAGCACCGCGCACTCCTGCGCAGCGGCGAGTTGTCCCTCGCGCTGGTCCACCCCGGCGCGTGGGATCCGTTGCGCCGGACCGATCGGTTCGCCGCGGGCGGGCTCGGCTCGCTTCCCGGACCCGCCCGGCACCGCGCGGTCGCCGACCAAGCCGTCATCGCGGCGCTGCGTGGACGTCTCGACCGGGCGGACGCCAACGCGGAGAGCGTTCTCCAGCACACCGACGCCACGGCGGACCGGACCACGGCCATCATGGCGTTGCTGGCCCTGCTCTACGCGGAGAACACCGATGCTGTCCAGTTCTGGGTCGACAAACTGGCCGGTGACGAGGGCACCAGGACACCGGCCGACGAGGCGGTCCACGCGGGGTTCAACGCCGAGATCGCGCTGCGCCGCGGCGACTTGATGAGAGCCGTCGAGTACGGCGAGGCAGCGCTCGGCCACCGGCACCTGCCCACCTGGGGAATGGCCGCCGCTCTGCCGCTGAGCAGCACCGTGGTTGCCGCGATCCGGCTCGGCGACCTCGACAGGGCCGAGCGGTGGCTCGCCGAGCCGCTGCCGCAGCAGACGCCGGAGAGCCTCTTCGGGCTGCACCTGCTCTGGGCCCGCGGGCAGCACCACCTCGCGACCGGGCGGCACGGGGCGGCGTACACGGCGTTCAGGGAATGCGGCGAGCGGATGCGGCGGTGGGCCGTCGACGTGCCGGGCCTGGCCCTGTGGCGGGTCGACGCCGCCGAATCGCTGCTGCTGCTCGGCCGTGACCGTGCCGAAGGACTGCGGCTCGTCTCCGAGCAGCTGTCCCGGCCGATGCGCCCTCGCGCGCGCGTGCAGACGTTACGGGTACAGGCGGCCTACAGTCCGCCGCCCCAACGGATCGACCTGCTCGAAGAGGCCGCCGACCTGCTGGTCACCTGCAACGACCAGTACGAACTGGCAAACGTACTCAGCGACTTGGCAGAGGCCTCCAGCATGGTCCGGCAGCACAGCAGGGCGCGGGGTCTGCTCCGCCGGGCACGGCACCTCGCCACCCAGTGCGGCGCCGTGCCGCTCCTGCGGCGGCTCGGCGCGGAACCCTCGGACATCGGCGGAGCCTGGGACGCGACGCTGGGACAGCGGATCGCGTCACTGACGGAGTCGGAGCGGCGGGTGGCCGCGCTCGCCGCGGTCGGGCGTACGAACAGGGAGATCGCCGAGCAGCTGTTCGTCACGGCCAGCACGGTGGAACAGCACCTCACGAACGTGTTCCGCAAACTGGCGGTGAAGGGCCGCCAGCAGCTTCCGAAGGAACTGGCCGACGTCGGCGAGCCGGCGGACCGCGACCGCCGGTGCGGGTAG

SEQ ID NO:7

ATGGTTCCTGAAGTGCGAGCAGCCCCCGACGAACTGATCGCCCGCGATGACGAGCTGAGCCGCCTCCAACGGGCACTCACCAGGGCGGGGAGCGGAAGGGGCGGCGTCGTCGCCATCACCGGGCCCATCGCCAGCGGAAAGACGGCGCTGCTCGACGCCGGAGCGGCCAAGTCCGGCTTCGTCGCACTCCGTGCGGTGTGCTCCTGGGAAGAGCGCACTCTGCCGTACGGGATGCTGGGCCAGCTCTTCGACCATCCCGAACTGGCCGCCCAGGCGCCGGACCTTGCCCACTTCACGGCTTCGTGCGAGAGCCCTCAGGCCGGTACCGACAACCGCCTGCGGGCCGAGTTCACCCGCACCCTGCTGGCGCTCGCCGCGGACTGGCCCGTCCTGATCGGCATCGACGACGTGCACCACGCCGACGCGGAATCACTGCGCTGTCTGCTCCACCTCGCCCGCCGCATCGGCCCGGCCCGCATCGCGGTCGTACTGACCGAGCTGCGCAGACCGACGCCCGCCGACTCCCGCTTCCAGGCGGAACTGCTGAGCCTGCGCTCCTACCAGGAGATCGCGCTCAGACCGCTCACCGAGGCGCAGACCGGCGAACTCGTACGTCGGCACCTCGGCGCGGAGACCCACGAGGACGTCTCCGCCGATACGTTCCGGGCGACCGGCGGGAACCTGCTCCTCGGGCACGGTTTGATCAATGACATCCGGGAGGCGCGGACAGCGGGACGGCCGGGGGTCGTCGCGGGGCGGGCGTACCGGCTCGCGTACCTCAGCTCGCTCTACCGCTGCGGCCCGAGCGCGCTGCGTGTCGCCCGGGCGTCCGCCGTGCTCGGCGCGAGCGCCGAAGCCGTGCTCGTCCAGCGGATGACCGGACTGAACAAGGACGCGGTCGAACAGGTCTATGAGCAGCTGAACGAGGGACGGCTGCTGCAGGGCGAGCGGTTTCCGCACCCGGCGGCCCGCTCCATCGTCCTTGACGACCTGTCGGCCCTGGAACGCAGAAACCTGCACGAGTCGGCGCTGGAGCTGCTGCGGGACCACGGCGTGGCCGGCAACGTGCTCGCCCGCCACCAGATCGGCGCCGGCCGGGTGCACGGCGAGGAGGCCGTCGAGCTGTTCACCGGGGCCGCACGGGAGCACCACCTGCGCGGTGAACTGGACGACGCGGCCGGATACCTGGAACTCGCCCACCGTGCCTCCGACGACCCCGTCACGCGCGCCGCACTACGCGTCGGCGCCGCCGCGATCGAGCGCCTCTGCAATCCGGTACGGGCAGGCCGGCATCTGCCCGAGCTGCTCACCGCGTCGCGCGCGGGACTGCTCTCCAGCGAGCACGCCGTGTCGCTCGCCGACTGGCTGGCGATGGGCGGGCGCCCGGGCGAGGCGGCCGAGGTCCTCGCGACGCAGCGTCCCGCGGCCGACAGCGAGCAGCACCGCGCACTCCTGCGCAGCGGCGAGTTGTCCCTCGCGCTGGTCCACCCCGGCGCGTGGGATCCGTTGCGCCGGACCGATCGGTTCGCCGCGGGCGGGCTCGGCTCGCTTCCCGGACCCGCCCGGCACCGCGCGGTCGCCGACCAAGCCGTCATCGCGGCGCTGCGTGGACGTCTCGACCGGGCGGACGCCAACGCGGAGAGCGTTCTCCAGCACACCGACGCCACGGCGGACCGGACCACGGCCATCATGGCGTTGCTGGCCCTGCTCTACGCGGAGAACACCGATGCTGTCCAGTTCTGGGTCGACAAACTGGCCGGTGACGAGGGCACCAGGACACCGGCCGACGAGGCGGTCCACGCGGGGTTCAACGCCGAGATCGCGCTGCGCCGCGGCGACTTGATGAGAGCCGTCGAGTACGGCGAGGCAGCGCTCGGCCACCGGCACCTGCCCACCTGGGGAATGGCCGCCGCTCTGCCGCTGAGCAGCACCGTGGTTGCCGCGATCCGGCTCGGCGACCTCGACAGGGCCGAGCGGTGGCTCGCCGAGCCGCTGCCGCAGCAGACGCCGGAGAGCCTCTTCGGGCTGCACCTGCTCTGGGCCCGCGGGCAGCACCACCTCGCGACCGGGCGGCACGGGGCGGCGTACACGGCGTTCAGGGAATGCGGCGAGCGGATGCGGCGGTGGGCCGTCGACGTGCCGGGCCTGGCCCTGTGGCGGGTCGACGCCGCCGAATCGCTGCTGCTGCTCGGCCGTGACCGTGCCGAAGGACTGCGGCTCGTCTCCGAGCAGCTGTCCCGGCCGATGCGCCCTCGCGCGCGCGTGCAGACGCTGCGGGTACAGGCGGCCTACAGTCCGCCGCCCCAACGGATCGACCTGCTCGAAGAGGCCGCCGACCTGCTGGTCACCTGCAACGACCAGTACGAACTGGCAAACGTACTCAGCGACTTGGCAGAGGCCTCCAGCATGGTCCGGCAGCACAGCAGGGCGCGGGGTCTGCTCCGCCGGGCACGGCACCTCGCCACCCAGTGCGGCGCCGTGCCGCTCCTGCGGCGGCTCGGCGCGGAACCCTCGGACATCGGCGGAGCCTGGGACGCGACGCTGGGACAGCGGATCGCGTCACTGACGGAGTCGGAGCGGCGGGTGGCCGCGCTCGCCGCGGTCGGGCGTACGAACAGGGAGATCGCCGAGCAGCTGTTCGTCACGGCCAGCACGGTGGAACAGCACCTCACGAACGTGTTCCGCAAACTGGCGGTGAAGGGCCGCCAGCAGCTTCCGAAGGAACTGGCCGACGTCGGCGAGCCGGCGGACCGCGACCGCCGGTGCGGGTAG

SEQ ID NO:8

GTGATAGCGCGCTTATCTCCCCCAGACCTGATCGCCCGCGATGACGAGTTCGGTTCCCTCCACCGGGCGCTCACCCGAGCGGGGGGCGGGCGGGGCGTCGTCGCCGCCGTCACCGGGCCGATCGCCTGCGGCAAGACCGAACTCCTCGACGCCGCCGCGGCCAAGGCCGGCTTCGTCACCCTTCGCGCGGTGTGCTCCATGGAGGAGCGGGCCCTGCCGTACGGCATGCTCGGCCAGCTCCTCGACCAGCCCGAGCTGGCCGCCCGGACACCGGAGCTGGTCCGGCTGACGGCATCGTGCGAAAACCTGCCGGCCGACGTCGACAACCGCCTGGGGACCGAACTCACCCGCACGGTGCTGACGCTCGCCGCGGAGCGGCCCGTACTGATCGGCATCGACGACGTGCACCACGCCGACGCGCCGTCGCTGCGCTGCCTGCTCCACCTCGCGCGCCGCATCAGCCGGGCCCGTGTCGCCATCGTGCTGACCGAGCTGCTCCGGCCGACGCCCGCCCACTCCCAATTCCGGGCGGCACTGCTGAGTCTGCGCCACTACCAGGAGATCGCGCTGCGCCCGCTCACCGAGGCGCAGACCACCGAACTCGTGCGCCGGCACCTCGGCCAGGACGCGCACGACGACGTGGTGGCCCAGGCGTTCCGGGCGACCGGCGGCAACCTGCTCCTCGGCCACGGCCTGATCGACGACATCCGGGAGGCACGGACACGGACCTCAGGGTGCCTGGAAGTGGTCGCGGGGCGGGCGTACCGGCTCGCCTACCTCGGGTCGCTCTATCGTTGCGGCCCGGCCGCGCTGAGCGTCGCCCGAGCTTCCGCCGTGCTCGGCGAGAGTGTCGAACTCACCCTCGTCCAGCGGATGACCGGCCTCGACACCGAGGCGGTCGAGCAGGCCCACGAACAGCTGGTCGAGGGGCGGCTGCTGCGGGAAGGGCGGTTCCCGCACCCCGCGGCCCGCTCCGTCGTACTCGACGACCTCTCCGCCGCCGAGCGGCGTGGCCTGCACGAGCTGGCGCTGGAACTGCTGCGGGACCGCGGCGTGGCCAGCAAGGTGCTCGCCCGCCACCAGATGGGTACCGGCCGGGTGCACGGCGCCGAGGTCGCCGGGCTGTTCACCGACGCCGCGCGCGAGCACCACCTGCGCGGCGAGCTCGACGAGGCCGTCACCTACCTGGAGTTCGCCTACCGGGCCTCCGACGACCCCGCCGTCCACGCCGCACTGCGCGTCGACACCGCCGCCATCGAGCGGCTCTGCGATCCCGCCAGATCCGGCCGGCATGTGCCCGAGCTGCTCACCGCGTCGCGGGAACGGCTCCTCTCCAGCGAGCACGCCGTGTCGCTCGCCTGCTGGCTGGCGATGGACGGGCGGCCGGGCGAGGCCGCCGAGGTCCTGGCGGCCCAGCGCTCCGCCGCCCCGAGCGAGCAGGGCCGGGCGCACCTGCGCGTCGCGGACCTGTCCCTCGCGCTGATCTATCCCGGCGCGGCCGATCCGCCGCGTCCGGCCGATCCGCCGGCCGAGGACGAGGTCGCCTCGTTTTCCGGAGCCGTCCGGCACCGCGCCGTCGCCGACAAGGCCCTGAGCAACGCGCTGCGCGGCTGGTCCGAACAGGCCGAGGCCAAAGCCGAGTACGTGCTCCAGCACTCCCGGGTCACGACGGACCGGACCACGACCATGATGGCGTTGCTGGCCCTGCTCTACGCCGAGGACACCGATGCCGTCCAGTCCTGGGTCGACAAGCTGGCCGGTGACGACAACATGCGGACCCCGGCCGACGAGGCGGTCCACGCGGGGTTCCGCGCCGAGGCCGCGCTGCGCCGCGGCGACCTGACCGCCGCCGTCGAATGCGGCGAGGCCGCGCTCGCCCCCCGGGTCGTGCCCTCCTGGGGGATGGCCGCCGCATTGCCGCTGAGCAGCACCGTGGCCGCCGCGATCCGACTGGGCGACCTGGACCGGGCGGAGCGGTGGCTCGCCGAGCCGTTGCCGGAGGAGACCTCCGACAGCCTCTTCGGACTGCACATGGTCTGGGCCCGTGGGCAACACCATCTCGCGGCCGGGCGGTACCGGGCGGCGTACAACGCGTTCCGGGACTGCGGGGAGCGGATGCGACGCTGGTCCGTCGACGTGCCGGGCCTGGCCCTGTGGCGGGTCGACGCCGCCGAAGCGCTTCTGCTGCTCGGCCGCGGCCGTGACGAGGGGCTGAGGCTCATCTCCGAGCAGCTGTCCCGGCCGATGGGGTCCCGGGCGCGGGTGATGACGCTGCGGGTGCAGGCGGCCTACAGTCCGCCGGCCAAGCGGATCGAACTGCTCGACGAGGCCGCCGATCTGCTCATCATGTGCCGCGACCAGTACGAGCTGGCCCGCGTCCTCGCCGACATGGGCGAAGCGTGCGGCATGCTCCGGCGGCACAGCCGTGCGCGGGGACTGTTCCGCCGCGCACGGCACCTCGCGACCCAGTGCGGAGCCGTGCCGCTCCTCCGGCGGCTCGGTGGGGAGTCCTCGGACGCGGACGGCACCCAGGACGTGACGCCGGCGCAGCGGATCACATCGCTGACCGAGGCGGAGCGGCGGGTGGCGTCGCACGCCGCGGTCGGGCGCACCAACAAGGAGATCGCCAGCCAGCTGTTCGTCACCTCCAGCACGGTGGAACAGCACCTCACCAACGTGTTCCGCAAGCTGGGGGTGAAGGGCCGTCAGCAACTGCCCAAGGAACTGTCCGACGCCGGCTGA

SEQ ID NO:9

ATGATAGCGCGCCTGTCTCCCCCAGACCTGATCGCCCGCGATGACGAGTTCGGTTCCCTCCACCGGGCGCTCACCCGAGCGGGGGGCGGGCGGGGCGTCGTCGCCGCCGTCACCGGGCCGATCGCCTGCGGCAAGACCGAACTCCTCGACGCCGCCGCGGCCAAGGCCGGCTTCGTCACCCTTCGCGCGGTGTGCTCCATGGAGGAGCGGGCCCTGCCGTACGGCATGCTCGGCCAGCTCCTCGACCAGCCCGAGCTGGCCGCCCGGACACCGGAGCTGGTCCGGCTGACGGCATCGTGCGAAAACCTGCCGGCCGACGTCGACAACCGCCTGGGGACCGAACTCACCCGCACGGTGCTGACGCTCGCCGCGGAGCGGCCCGTACTGATCGGCATCGACGACGTGCACCACGCCGACGCGCCGTCGCTGCGCTGCCTGCTCCACCTCGCGCGCCGCATCAGCCGGGCCCGTGTCGCCATCGTGCTGACCGAGCTGCTCCGGCCGACGCCCGCCCACTCCCAATTCCGGGCGGCACTGCTGAGTCTGCGCCACTACCAGGAGATCGCGCTGCGCCCGCTCACCGAGGCGCAGACCACCGAACTCGTGCGCCGGCACCTCGGCCAGGACGCGCACGACGACGTGGTGGCCCAGGCGTTCCGGGCGACCGGCGGCAACCTGCTCCTCGGCCACGGCCTGATCGACGACATCCGGGAGGCACGGACACGGACCTCAGGGTGCCTGGAAGTGGTCGCGGGGCGGGCGTACCGGCTCGCCTACCTCGGGTCGCTCTATCGTTGCGGCCCGGCCGCGCTGAGCGTCGCCCGAGCTTCCGCCGTGCTCGGCGAGAGTGTCGAACTCACCCTCGTCCAGCGGATGACCGGCCTCGACACCGAGGCGGTCGAGCAGGCCCACGAACAGCTGGTCGAGGGGCGGCTGCTGCGGGAAGGGCGGTTCCCGCACCCCGCGGCCCGCTCCGTCGTACTCGACGACCTCTCCGCCGCCGAGCGGCGTGGCCTGCACGAGCTGGCGCTGGAACTGCTGCGGGACCGCGGCGTGGCCAGCAAGGTGCTCGCCCGCCACCAGATGGGTACCGGCCGGGTGCACGGCGCCGAGGTCGCCGGGCTGTTCACCGACGCCGCGCGCGAGCACCACCTGCGCGGCGAGCTCGACGAGGCCGTCACCTACCTGGAGTTCGCCTACCGGGCCTCCGACGACCCCGCCGTCCACGCCGCACTGCGCGTCGACACCGCCGCCATCGAGCGGCTCTGCGATCCCGCCAGATCCGGCCGGCATGTGCCCGAGCTGCTCACCGCGTCGCGGGAACGGCTCCTCTCCAGCGAGCACGCCGTGTCGCTCGCCTGCTGGCTGGCGATGGACGGGCGGCCGGGCGAGGCCGCCGAGGTCCTGGCGGCCCAGCGCTCCGCCGCCCCGAGCGAGCAGGGCCGGGCGCACCTGCGCGTCGCGGACCTGTCCCTCGCGCTGATCTATCCCGGCGCGGCCGATCCGCCGCGTCCGGCCGATCCGCCGGCCGAGGACGAGGTCGCCTCGTTTTCCGGAGCCGTCCGGCACCGCGCCGTCGCCGACAAGGCCCTGAGCAACGCGCTGCGCGGCTGGTCCGAACAGGCCGAGGCCAAAGCCGAGTACGTGCTCCAGCACTCCCGGGTCACGACGGACCGGACCACGACCATGATGGCGTTGCTGGCCCTGCTCTACGCCGAGGACACCGATGCCGTCCAGTCCTGGGTCGACAAGCTGGCCGGTGACGACAACATGCGGACCCCGGCCGACGAGGCGGTCCACGCGGGGTTCCGCGCCGAGGCCGCGCTGCGCCGCGGCGACCTGACCGCCGCCGTCGAATGCGGCGAGGCCGCGCTCGCCCCCCGGGTCGTGCCCTCCTGGGGGATGGCCGCCGCATTGCCGCTGAGCAGCACCGTGGCCGCCGCGATCCGACTGGGCGACCTGGACCGGGCGGAGCGGTGGCTCGCCGAGCCGTTGCCGGAGGAGACCTCCGACAGCCTCTTCGGACTGCACATGGTCTGGGCCCGTGGGCAACACCATCTCGCGGCCGGGCGGTACCGGGCGGCGTACAACGCGTTCCGGGACTGCGGGGAGCGGATGCGACGCTGGTCCGTCGACGTGCCGGGCCTGGCCCTGTGGCGGGTCGACGCCGCCGAAGCGCTTCTGCTGCTCGGCCGCGGCCGTGACGAGGGGCTGAGGCTCATCTCCGAGCAGCTGTCCCGGCCGATGGGGTCCCGGGCGCGGGTGATGACGCTGCGGGTGCAGGCGGCCTACAGTCCGCCGGCCAAGCGGATCGAACTGCTCGACGAGGCCGCCGATCTGCTCATCATGTGCCGCGACCAGTACGAGCTGGCCCGCGTCCTCGCCGACATGGGCGAAGCGTGCGGCATGCTCCGGCGGCACAGCCGTGCGCGGGGACTGTTCCGCCGCGCACGGCACCTCGCGACCCAGTGCGGAGCCGTGCCGCTCCTCCGGCGGCTCGGTGGGGAGTCCTCGGACGCGGACGGCACCCAGGACGTGACGCCGGCGCAGCGGATCACATCGCTGACCGAGGCGGAGCGGCGGGTGGCGTCGCACGCCGCGGTCGGGCGCACCAACAAGGAGATCGCCAGCCAGCTGTTCGTCACCTCCAGCACGGTGGAACAGCACCTCACCAACGTGTTCCGCAAGCTGGGGGTGAAGGGCCGTCAGCAACTGCCCAAGGAACTGTCCGACGCCGGCTGA

SEQ ID NO:10

GTGGAGTTTTACGACCTGGTCGCCCGCGATGACGAGCTCAGAAGGTTGGACCAGGCCCTCGGCCGCGCCGCCGGCGGACGGGGTGTCGTGGTCACCGTCACCGGACCGGTCGGCTGCGGCAAGACCGAACTGCTGGACGCGGCCGCGGCCGAGGAGGAATTCATCACGTTGCGTGCGGTCTGCTCGGCCGAGGAGCGGGCCCTGCCGTACGCCGTGATCGGCCAACTCCTCGACCATCCCGTACTCTCCGCACGCGCGCCCGACCTGGCCTGCGTGACGGCTCCGGGCCGGACGCTGCCGGCCGACACCGAGAACCGCCTGCGCCGCGACCTCACCCGGGCCCTGCTGGCCCTGGCCTCCGAACGACCGGTTCTGATCTGCATCGACGACGTGCACCAGGCCGACACCGCCTCGCTGAACTGCCTGCTGCACCTGGCCCGGCGGGTCGCCTCGGCCCGGATCGCCATGATCCTCACCGAGTTGCGCCGGCTCACCCCGGCTCACTCCCGGTTCGAGGCGGAACTGCTCAGCCTGCGGCACCGCCACGAGATCGCGCTGCGTCCCCTCGGCCCGGCCGACACCGCCGAACTGGCCCGCGCCCGGCTCGGCGCCGGCGTCACCGCCGACGAGCTGGCCCAGGTCCACGAGGCCACCAGCGGGAACCCCAACCTGGTCGGAGGCCTGGTCAACGACGTGCGAGAGGCCTGGGCGGCCGGTGGCACGGGCATTGCGGCGGGGCGGGCGTACCGGCTGGCGTACCTCAGCTCCGTGTACCGCTGTGGTCCGGTCCCGTTGCGGATCGCCCAGGCGGCGGCGGTGCTGGGTCCCAGCGCCACCGTCACGCTGGTGCGCCGGATCAGCGGGCTCGACGCCGAGACGGTGGACGAGGCGACCGCGATCCTCACCGAGGGCGGCCTGCTCCGGGACCACCGGTTCCCGCATCCGGCGGCCCGCTCGGTCGTACTCGACGACATGTCCGCGCAGGAACGCCGCCGCCTGCACCGGTCCACGCTGGACGTGCTGGACGGCGTACCCGTCGACGTGCTCGCGCACCACCAGGCCGGCGCCGGTCTGCTGCACGGCCCGCAGGCGGCCGAGATGTTCGCCCGGGCCAGCCAGGAGCTGCGGGTACGCGGCGAGCTGGACGCCGCGACCGAGTACCTGCAACTGGCCTACCGGGCCTCCGACGACGCCGGCGCCCGGGCCGCCCTGCAGGTGGAGACCGTGGCCGGCGAGCGCCGCCGCAACCCGCTGGCCGCCAGCCGGCACCTGGACGAGCTGGCCGCCGCCGCCCGGGCCGGCCTGCTGTCGGCCGAGCACGCCGCCCTGGTCGTGCACTGGCTGGCCGACGCCGGACGACCCGGCGAGGCCGCCGAGGTGCTGGCGCTGCAGCGGGCGCTGGCCGTCACCGACCACGACCGGGCCCGCCTGCGGGCGGCCGAGGTGTCGCTCGCGCTGTTCCACCCCGGCGTCCCCGGTTCGGACCCGCGGCCCCTCGCGCCGGAGGAGCTCGCGAGCCTGTCCCTGTCGGCCCGGCACGGTGTGACCGCCGACAACGCGGTGCTGGCGGCGCTGCGCGGCCGTCCCGAGTCGGCCGCCGCCGAGGCGGAGAACGTGCTGCGCAACGCCGACGCCGCCGCGTCCGGCCCGACCGCCCTGGCCGCGCTGACGGCCCTGCTCTACGCCGAGAACACCGACGCCGCCCAGCTCTGGGCGGACAAGCTGGCCGCGGGCATCGGGGCGGGGGAGGGGGAGGCCGGCTACGCGGGGCCGCGGACCGTGGCCGCCCTGCGTCGCGGCGACCTGACCACCGCGGTCCAGGCGGCCGGCGCGGTCCTGGACCGCGGCCGGCCGTCGTCGCTCGGCATCACCGCCGTGTTGCCGTTGAGCGGCGCGGTCGCCGCCGCGATCCGGCTGGGCGAGCTCGAGCGGGCCGAGAAGTGGCTGGCCGAGCCGCTGCCCGAAGCCGTCCACGACAGCCTGTTCGGCCTGCACCTGCTGATGGCGCGGGGCCGCTACAGCCTCGCGGTGGGCCGGCACGAGGCGGCGTACGCCGCGTTCCGGGACTGCGGTGAACGGATGCGCCGGTGGGACGTCGACGTGCCCGGGCTGGCCCTGTGGCGGGTGGACGCGGCCGAGGCGCTGCTGCCCGGCGATGACCGGGCGGAGGGCCGGCGGCTGATCGACGAGCAGCTCACCCGGCCGATGGGGCCCCGGTCACGAGCCCTGACCCTGCGGGTACGAGCGGCCTACGCCCCGCCGGCGAAACGGATCGACCTGCTCGACGAAGCGGCCGACCTGCTGCTCTCCAGCAACGACCAGTACGAGCGGGCACGGGTGCTGGCCGACCTGAGCGAGGCGTTCAGCGCGCTCCGGCAGAACGGCCGGGCGCGCGGCATCCTGCGGCAGGCCCGGCACCTGGCCGCCCAGTGCGGGGCGGTCCCCCTGCTGCGCCGGCTGGGCGTCAAGGCCGGCCGGTCCGGTCGGCTCGGCCGGCCGCCGCAGGGAATCCGCTCCCTGACCGAGGCCGAGCGCCGGGTGGCCACGCTGGCCGCCGCCGGGCAGACCAACCGGGAGATCGCCGACCAGCTCTTCGTCACCGCCAGCACGGTCGAGCAGCACCTCACCAACGTGTTCCGCAAGCTCGGCGTGAAGGGCCGCCAGCAATTGCCGGCCGAGCTGGCCGACCTGCGGCCGCCGGGCTGA

SEQ ID NO:11

ATGGAGTTTTACGACCTGGTCGCCCGCGATGACGAGCTCAGAAGGTTGGACCAGGCCCTCGGCCGCGCCGCCGGCGGACGGGGTGTCGTGGTCACCGTCACCGGACCGGTCGGCTGCGGCAAGACCGAACTGCTGGACGCGGCCGCGGCCGAGGAGGAATTCATCACGTTGCGTGCGGTCTGCTCGGCCGAGGAGCGGGCCCTGCCGTACGCCGTGATCGGCCAACTCCTCGACCATCCCGTACTCTCCGCACGCGCGCCCGACCTGGCCTGCGTGACGGCTCCGGGCCGGACGCTGCCGGCCGACACCGAGAACCGCCTGCGCCGCGACCTCACCCGGGCCCTGCTGGCCCTGGCCTCCGAACGACCGGTTCTGATCTGCATCGACGACGTGCACCAGGCCGACACCGCCTCGCTGAACTGCCTGCTGCACCTGGCCCGGCGGGTCGCCTCGGCCCGGATCGCCATGATCCTCACCGAGTTGCGCCGGCTCACCCCGGCTCACTCCCGGTTCGAGGCGGAACTGCTCAGCCTGCGGCACCGCCACGAGATCGCGCTGCGTCCCCTCGGCCCGGCCGACACCGCCGAACTGGCCCGCGCCCGGCTCGGCGCCGGCGTCACCGCCGACGAGCTGGCCCAGGTCCACGAGGCCACCAGCGGGAACCCCAACCTGGTCGGAGGCCTGGTCAACGACGTGCGAGAGGCCTGGGCGGCCGGTGGCACGGGCATTGCGGCGGGGCGGGCGTACCGGCTGGCGTACCTCAGCTCCGTGTACCGCTGTGGTCCGGTCCCGTTGCGGATCGCCCAGGCGGCGGCGGTGCTGGGTCCCAGCGCCACCGTCACGCTGGTGCGCCGGATCAGCGGGCTCGACGCCGAGACGGTGGACGAGGCGACCGCGATCCTCACCGAGGGCGGCCTGCTCCGGGACCACCGGTTCCCGCATCCGGCGGCCCGCTCGGTCGTACTCGACGACATGTCCGCGCAGGAACGCCGCCGCCTGCACCGGTCCACGCTGGACGTGCTGGACGGCGTACCCGTCGACGTGCTCGCGCACCACCAGGCCGGCGCCGGTCTGCTGCACGGCCCGCAGGCGGCCGAGATGTTCGCCCGGGCCAGCCAGGAGCTGCGGGTACGCGGCGAGCTGGACGCCGCGACCGAGTACCTGCAACTGGCCTACCGGGCCTCCGACGACGCCGGCGCCCGGGCCGCCCTGCAGGTGGAGACCGTGGCCGGCGAGCGCCGCCGCAACCCGCTGGCCGCCAGCCGGCACCTGGACGAGCTGGCCGCCGCCGCCCGGGCCGGCCTGCTGTCGGCCGAGCACGCCGCCCTGGTCGTGCACTGGCTGGCCGACGCCGGACGACCCGGCGAGGCCGCCGAGGTGCTGGCGCTGCAGCGGGCGCTGGCCGTCACCGACCACGACCGGGCCCGCCTGCGGGCGGCCGAGGTGTCGCTCGCGCTGTTCCACCCCGGCGTCCCCGGTTCGGACCCGCGGCCCCTCGCGCCGGAGGAGCTCGCGAGCCTGTCCCTGTCGGCCCGGCACGGTGTGACCGCCGACAACGCGGTGCTGGCGGCGCTGCGCGGCCGTCCCGAGTCGGCCGCCGCCGAGGCGGAGAACGTGCTGCGCAACGCCGACGCCGCCGCGTCCGGCCCGACCGCCCTGGCCGCGCTGACGGCCCTGCTCTACGCCGAGAACACCGACGCCGCCCAGCTCTGGGCGGACAAGCTGGCCGCGGGCATCGGGGCGGGGGAGGGGGAGGCCGGCTACGCGGGGCCGCGGACCGTGGCCGCCCTGCGTCGCGGCGACCTGACCACCGCGGTCCAGGCGGCCGGCGCGGTCCTGGACCGCGGCCGGCCGTCGTCGCTCGGCATCACCGCCGTGTTGCCGTTGAGCGGCGCGGTCGCCGCCGCGATCCGGCTGGGCGAGCTCGAGCGGGCCGAGAAGTGGCTGGCCGAGCCGCTGCCCGAAGCCGTCCACGACAGCCTGTTCGGCCTGCACCTGCTGATGGCGCGGGGCCGCTACAGCCTCGCGGTGGGCCGGCACGAGGCGGCGTACGCCGCGTTCCGGGACTGCGGTGAACGGATGCGCCGGTGGGACGTCGACGTGCCCGGGCTGGCCCTGTGGCGGGTGGACGCGGCCGAGGCGCTGCTGCCCGGCGATGACCGGGCGGAGGGCCGGCGGCTGATCGACGAGCAGCTCACCCGGCCGATGGGGCCCCGGTCACGAGCCCTGACCCTGCGGGTACGAGCGGCCTACGCCCCGCCGGCGAAACGGATCGACCTGCTCGACGAAGCGGCCGACCTGCTGCTCTCCAGCAACGACCAGTACGAGCGGGCACGGGTGCTGGCCGACCTGAGCGAGGCGTTCAGCGCGCTCCGGCAGAACGGCCGGGCGCGCGGCATCCTGCGGCAGGCCCGGCACCTGGCCGCCCAGTGCGGGGCGGTCCCCCTGCTGCGCCGGCTGGGCGTCAAGGCCGGCCGGTCCGGTCGGCTCGGCCGGCCGCCGCAGGGAATCCGCTCCCTGACCGAGGCCGAGCGCCGGGTGGCCACGCTGGCCGCCGCCGGGCAGACCAACCGGGAGATCGCCGACCAGCTCTTCGTCACCGCCAGCACGGTCGAGCAGCACCTCACCAACGTGTTCCGCAAGCTCGGCGTGAAGGGCCGCCAGCAATTGCCGGCCGAGCTGGCCGACCTGCGGCCGCCGGGCTGA

SEQ ID NO:12

GTGGTCACCGTCACCGGCCCAATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGAGGCCATCATTCTGCGCGCGGTCTGCGCGCCAGAAGAGCGGGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGGGCTGGCTGATCGGATAGCCCAGGGCGGGCAGCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTCGACCGGCCTGTGCTGATCGGCGTCGACGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATTTGGCGCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGGTTCAAGGCGGAGCTGCTCAGCCTGCCGTACCACCACGAGATCGCGCTGCGTCCGTTCGGACCGGAGCAATCGGCGGAGCTGGCCCGCGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGTGGGGTTGTATAAAACGACCAGGGGCAATCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCTGGCCAACGGAGAGAGCGCCTTCGAGGCGGGCCGCGCGTTCCGGCTGGCGTACCTCGGCTCGCTCTACCGCTGTGGCCCGGTCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCGAGCGCCACCACCACGCTGGTGCGCCGTCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACCGAGGGCGGGCTGCTGCTCGACCAGCAGTTCCCGCACCCGGCCGCCCGCTCGGTGGTGCTTGATGACATGTCCGCCCAGGAACGACGCGGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATGTTCGCCAAGGCCGGCAAGGCTCTGGTCGTACGCAACGAGTTGGGCGACGCGGCAGAATACCTGCAACTGGCTCACCGGGCCTCCGACGATGTCTCCACCCGGGCCGCCTTACGGGTCGAGGCCGTGGCGATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGGCACATGGACGAGCTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCGGCGCTGGCCGTCTTCTGGCTGGCCGACGGCGGGCGATCCGGCGAGGCAGCCGAGGTGCTGGCGTCGGAACGCCCGCTAGCGACCACCGATCAGAACCGGGCCCACTTGCGATTTGTCGAGGTGACTCTCGCGCTGTTCTCTCCCGGCGCCTTCGGATCGGACCGGCGCCCACCTCCGCTGACGCCGGACGAACTCGCCAGCCTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGCCATGACCGCCTTGCACGGTCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCGATCCCCGCCGCGCTGATCGCCCTGTTGTACGCGGAGAACACCGAGTCCGCTCATATCTGGGCCGACAAGCTGGGCAGCACGAATGGCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTAGCACCGTCCTGGACGACCGGTCGCTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCCGCCGCTGTCCGGCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCCGAGCCGCTTCCGAACGGCGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCATACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCGGCTCTCCGGGCGTTTCACACCTGCGGAGAACGTATGCGCAGCTGGGATGTTGACGTGCCTGGTCTGGCCCTGTGGCGTGTCGACGCCGCCGAGGCGCTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCACCCGTCCGATGGGGCCTCGTTCCCGCGCGTTAACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCGGCCGAGCTGCTGCTCCCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCGCCCAGTGCGGTGCTGTCCCGCTGCTGCGCAGGCTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGGCGGCGCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCAAACAGCTGTTCGTCACGGCCAGCACAGTGGAACAGCACCTCACAAGCGTCTTCCGCAAACTGGGGGTCAAGGGTCGCAAGCAGCTGCCGACCGCGCTGGCCGACGTGGAACAGACCTGA

SEQ ID NO:13

ATGTATAGCGGTACCTGCCGTGAAGGATACGAACTCGTCGCACGCGAGGACGAACTCGGCATTCTACAGAGGTCTCTGGAACAAGCGAGCAGCGGCCAGGGCGTCGTGGTCACCGTCACCGGCCCAATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGAGGCCATCATTCTGCGCGCGGTCTGCGCGCCAGAAGAGCGGGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGGGCTGGCTGATCGGATAGCCCAGGGCGGGCAGCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTCGACCGGCCTGTGCTGATCGGCGTCGACGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATTTGGCGCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGGTTCAAGGCGGAGCTGCTCAGCCTGCCGTACCACCACGAGATCGCGCTGCGTCCGTTCGGACCGGAGCAATCGGCGGAGCTGGCCCGCGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGTGGGGTTGTATAAAACGACCAGGGGCAATCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCTGGCCAACGGAGAGAGCGCCTTCGAGGCGGGCCGCGCGTTCCGGCTGGCGTACCTCGGCTCGCTCTACCGCTGTGGCCCGGTCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCGAGCGCCACCACCACGCTGGTGCGCCGTCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACCGAGGGCGGGCTGCTGCTCGACCAGCAGTTCCCGCACCCGGCCGCCCGCTCGGTGGTGCTTGATGACATGTCCGCCCAGGAACGACGCGGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATGTTCGCCAAGGCCGGCAAGGCTCTGGTCGTACGCAACGAGTTGGGCGACGCGGCAGAATACCTGCAACTGGCTCACCGGGCCTCCGACGATGTCTCCACCCGGGCCGCCCTGCGGGTCGAGGCCGTGGCGATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGGCACATGGACGAGCTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCGGCGCTGGCCGTCTTCTGGCTGGCCGACGGCGGGCGATCCGGCGAGGCAGCCGAGGTGCTGGCGTCGGAACGCCCGCTAGCGACCACCGATCAGAACCGGGCCCACTTGCGATTTGTCGAGGTGACTCTCGCGCTGTTCTCTCCCGGCGCCTTCGGATCGGACCGGCGCCCACCTCCGCTGACGCCGGACGAACTCGCCAGCCTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGCCATGACCGCCTTGCACGGTCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCGATCCCCGCCGCGCTGATCGCCCTGTTGTACGCGGAGAACACCGAGTCCGCTCATATCTGGGCCGACAAGCTGGGCAGCACGAATGGCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTAGCACCGTCCTGGACGACCGGTCGCTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCCGCCGCTGTCCGGCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCCGAGCCGCTTCCGAACGGCGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCATACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCGGCTCTCCGGGCGTTTCACACCTGCGGAGAACGTATGCGCAGCTGGGATGTTGACGTGCCTGGTCTGGCCCTGTGGCGTGTCGACGCCGCCGAGGCGCTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCACCCGTCCGATGGGGCCTCGTTCCCGCGCGCTGACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCGGCCGAGCTGCTGCTCCCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCGCCCAGTGCGGTGCTGTCCCGCTGCTGCGCAGGCTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGGCGGCGCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCAAACAGCTGTTCGTCACGGCCAGCACAGTGGAACAGCACCTCACAAGCGTCTTCCGCAAACTGGGGGTCAAGGGTCGCAAGCAGCTGCCGACCGCGCTGGCCGACGTGGAACAGACCTGA

SEQ ID NO:14

ATGCCTGCCGTGGAGAGCTATGAACTGGACGCCCGCGATGACGAGCTCAGAAGACTGGAGGAGGCGGTAGGCCAGGCGGGCAACGGCCGGGGTGTGGTGGTCACCATCACCGGGCCGATCGCCTGCGGCAAGACCGAACTGCTCGACGCGGCCGCCGCGAAGAGCGACGCCATCACATTACGTGCGGTCTGCTCCGAGGAGGAACGGGCCCTCCCGTACGCCCTGATCGGGCAGCTCATCGACAACCCGGCGGTCGCCTCCCAGCTGCCGGATCCGGTCTCCATGGCCCTCCCGGGCGAGCACCTGTCGCCGGAGGCCGAGAACCGGCTGCGCGGCGACCTCACCCGTACCCTGCTGGCGCTCGCCGCCGAACGGCCGGTGCTGATCGGCATCGACGACATGCACCACGCCGACACCGCCTCTTTGAACTGCCTGCTCCACCTGGCCCGGAGGGTCGGCCCGGCCCGGATCGCCATGGTCCTCACCGAGCTGCGCCGGCTCACCCCGGCCCACTCCCAGTTCCACGCCGAGCTGCTCAGCCTGGGGCACCACCGCGAGATCGCGCTGCGCCCGCTCGGCCCGAAGCACATCGCCGAGCTGGCCCGCGCCGGCCTCGGTCCCGATGTCGACGAGGACGTGCTCACGGGGTTGTACCGGGCGACCGGCGGCAACCTGAACCTCGGCCACGGACTGATCAAGGATGTGCGGGAGGCCTGGGCGACGGGCGGGACGGGCATCAACGCGGGCCGCGCGTACCGGCTGGCGTACCTCGGTTCCCTCTACCGCTGCGGCCCGGTCCCGTTGCGGGTCGCACGGGTGGCCGCCGTGCTGGGCCAGAGCGCCAACACCACCCTGGTGCGCTGGATCAGCGGGCTCAACGCGGACGCGGTGGGCGAGGCGACCGAGATCCTCACCGAGGGCGGCCTGCTGCACGACCTGCGGTTCCCGCATCCGGCGGCCCGTTCGGTCGTACTCAACGACCTGTCCGCCCGGGAACGCCGCCGACTGCACCGGTCCGCTCTGGAAGTGCTGGATGACGTACCCGTTGAAGTGGTCGCGCACCACCAGGCCGGTGCCGGTTTCATCCACGGTCCCAAGGCCGCCGAGATCTTCGCCAAGGCCGGCCAGGAGCTGCATGTGCGCGGCGAGCTGGACGCCGCGTCCGACTATCTGCAACTGGCCCACCACGCCTCCGACGACGCCGTCACCCGGGCCGCGCTGCGGGTCGAGGCCGTGGCGATCGAGCGCCGCCGCAACCCGCTGGCCTCCAGCCGCCACCTCGACGAGCTGACCGTCGCCGCCCGTGCCGGTCTGCTCTCCCTCGAGCACGCCGCGCTGATGATCCGCTGGCTGGCTCTCGGCGGGCGGTCCGGCGAGGCGGCCGAGGTGCTGGCCGCGCAGCGCCCGCGTGCGGTCACCGACCAGGACAGGGCCCACCTGCGGGCCGCCGAGGTATCGCTGGCGCTGGTCAGCCCGGGCGCGTCCGGCGTCAGCCCGGGTGCGTCCGGCCCGGATCGGCGGCCGCGTCCGCTCCCGCCGGATGAGCTCGCGAACCTGCCGAAGGCGGCCCGGCTTTGTGCGATCGCCGACAACGCCGTCATATCGGCCCTGCACGGTCGTCCCGAGCTTGCCTCGGCCGAGGCGGAGAACGTCCTGAAGCAGGCTGACTCGGCGGCGGACGGCGCCACCGCCCTCTCCGCGCTGACGGCCTTGCTGTACGCGGAGAACACCGACACCGCTCAGCTCTGGGCCGACAAGCTCGTCTCCGAGACCGGGGCGTCGAACGAGGAGGAAGGCGCGGGCTACGCGGGGCCGCGCGCCGAGACCGCGTTGCGCCGCGGCGACCTGGCCGCGGCGGTCGAGGCGGGCAGCGCCATTCTGGACCACCGGCGGGGGTCGTTGCTCGGCATCACCGCCGCGCTACCGCTGAGCAGCGCGGTAGCCGCCGCCATCCGGCTGGGCGAGACCGAGCGGGCGGAGAAGTGGCTCGCCGAGCCGCTGCCGGAGGCCATTCGGGACAGCCTGTTCGGGCTGCACCTGCTCTCGGCGCGCGGCCAGTACTGCCTCGCGACGGGCCGGCACGAGTCGGCGTACACGGCGTTCCGCACCTGCGGGGAACGGATGCGGAACTGGGGCGTCGACGTGCCGGGTCTGTCCCTGTGGCGCGTCGACGCCGCCGAGGCGCTGCTGCACGGCCGCGACCGGGACGAGGGCCGACGGCTCATCGACGAGCAGCTCACCCATGCGATGGGACCCCGTTCCCGCGCTTTGACGCTGCGGGTGCAGGCGGCGTACAGCCCGCAGGCGCAGCGGGTCGACCTGCTCGAAGAGGCGGCCGACCTGCTGCTCTCCTGCAACGACCAGTACGAGCGGGCGCGGGTGCTCGCCGATCTGAGCGAGGCGTTCAGCGCGCTCAGGCACCACAGCCGGGCGCGGGGACTGCTCCGGCAGGCCCGGCACCTGGCCGCCCAGTGCGGCGCGACCCCGCTGCTGCGCCGGCTCGGGGCCAAGCCCGGAGGCCCCGGCTGGCTGGAGGAATCCGGCCTGCCGCAGCGGATCAAGTCGCTGACCGACGCGGAGCGGCGGGTGGCGTCGCTGGCCGCCGGCGGCCAGACCAACCGCGTGATCGCCGACCAGCTCTTCGTCACGGCCAGCACGGTGGAGCAGCACCTCACGAACGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCCAGCACCTGCCGGCCGAACTCGCCAACGCGGAATAG

SEQ ID NO:15

ATGCCTGCCGTGGAGAGCTATGAACTGGACGCCCGCGATGACGAGCTCAGAAGACTGGAGGAGGCGGTAGGCCAGGCGGGCAACGGCCGGGGTGTGGTGGTCACCATCACCGGGCCGATCGCCTGCGGCAAGACCGAACTGCTCGACGCGGCCGCCGCGAAGAGCGACGCCATCACACTGCGTGCGGTCTGCTCCGAGGAGGAACGGGCCCTCCCGTACGCCCTGATCGGGCAGCTCATCGACAACCCGGCGGTCGCCTCCCAGCTGCCGGATCCGGTCTCCATGGCCCTCCCGGGCGAGCACCTGTCGCCGGAGGCCGAGAACCGGCTGCGCGGCGACCTCACCCGTACCCTGCTGGCGCTCGCCGCCGAACGGCCGGTGCTGATCGGCATCGACGACATGCACCACGCCGACACCGCCTCTTTGAACTGCCTGCTCCACCTGGCCCGGAGGGTCGGCCCGGCCCGGATCGCCATGGTCCTCACCGAGCTGCGCCGGCTCACCCCGGCCCACTCCCAGTTCCACGCCGAGCTGCTCAGCCTGGGGCACCACCGCGAGATCGCGCTGCGCCCGCTCGGCCCGAAGCACATCGCCGAGCTGGCCCGCGCCGGCCTCGGTCCCGATGTCGACGAGGACGTGCTCACGGGGTTGTACCGGGCGACCGGCGGCAACCTGAACCTCGGCCACGGACTGATCAAGGATGTGCGGGAGGCCTGGGCGACGGGCGGGACGGGCATCAACGCGGGCCGCGCGTACCGGCTGGCGTACCTCGGTTCCCTCTACCGCTGCGGCCCGGTCCCGTTGCGGGTCGCACGGGTGGCCGCCGTGCTGGGCCAGAGCGCCAACACCACCCTGGTGCGCTGGATCAGCGGGCTCAACGCGGACGCGGTGGGCGAGGCGACCGAGATCCTCACCGAGGGCGGCCTGCTGCACGACCTGCGGTTCCCGCATCCGGCGGCCCGTTCGGTCGTACTCAACGACCTGTCCGCCCGGGAACGCCGCCGACTGCACCGGTCCGCTCTGGAAGTGCTGGATGACGTACCCGTTGAAGTGGTCGCGCACCACCAGGCCGGTGCCGGTTTCATCCACGGTCCCAAGGCCGCCGAGATCTTCGCCAAGGCCGGCCAGGAGCTGCATGTGCGCGGCGAGCTGGACGCCGCGTCCGACTATCTGCAACTGGCCCACCACGCCTCCGACGACGCCGTCACCCGGGCCGCGCTGCGGGTCGAGGCCGTGGCGATCGAGCGCCGCCGCAACCCGCTGGCCTCCAGCCGCCACCTCGACGAGCTGACCGTCGCCGCCCGTGCCGGTCTGCTCTCCCTCGAGCACGCCGCGCTGATGATCCGCTGGCTGGCTCTCGGCGGGCGGTCCGGCGAGGCGGCCGAGGTGCTGGCCGCGCAGCGCCCGCGTGCGGTCACCGACCAGGACAGGGCCCACCTGCGGGCCGCCGAGGTATCGCTGGCGCTGGTCAGCCCGGGCGCGTCCGGCGTCAGCCCGGGTGCGTCCGGCCCGGATCGGCGGCCGCGTCCGCTCCCGCCGGATGAGCTCGCGAACCTGCCGAAGGCGGCCCGGCTTTGTGCGATCGCCGACAACGCCGTCATATCGGCCCTGCACGGTCGTCCCGAGCTTGCCTCGGCCGAGGCGGAGAACGTCCTGAAGCAGGCTGACTCGGCGGCGGACGGCGCCACCGCCCTCTCCGCGCTGACGGCCTTGCTGTACGCGGAGAACACCGACACCGCTCAGCTCTGGGCCGACAAGCTCGTCTCCGAGACCGGGGCGTCGAACGAGGAGGAAGGCGCGGGCTACGCGGGGCCGCGCGCCGAGACCGCGTTGCGCCGCGGCGACCTGGCCGCGGCGGTCGAGGCGGGCAGCGCCATTCTGGACCACCGGCGGGGGTCGTTGCTCGGCATCACCGCCGCGCTACCGCTGAGCAGCGCGGTAGCCGCCGCCATCCGGCTGGGCGAGACCGAGCGGGCGGAGAAGTGGCTCGCCGAGCCGCTGCCGGAGGCCATTCGGGACAGCCTGTTCGGGCTGCACCTGCTCTCGGCGCGCGGCCAGTACTGCCTCGCGACGGGCCGGCACGAGTCGGCGTACACGGCGTTCCGCACCTGCGGGGAACGGATGCGGAACTGGGGCGTCGACGTGCCGGGTCTGTCCCTGTGGCGCGTCGACGCCGCCGAGGCGCTGCTGCACGGCCGCGACCGGGACGAGGGCCGACGGCTCATCGACGAGCAGCTCACCCATGCGATGGGACCCCGTTCCCGCGCTTTGACGCTGCGGGTGCAGGCGGCGTACAGCCCGCAGGCGCAGCGGGTCGACCTGCTCGAAGAGGCGGCCGACCTGCTGCTCTCCTGCAACGACCAGTACGAGCGGGCGCGGGTGCTCGCCGATCTGAGCGAGGCGTTCAGCGCGCTCAGGCACCACAGCCGGGCGCGGGGACTGCTCCGGCAGGCCCGGCACCTGGCCGCCCAGTGCGGCGCGACCCCGCTGCTGCGCCGGCTCGGGGCCAAGCCCGGAGGCCCCGGCTGGCTGGAGGAATCCGGCCTGCCGCAGCGGATCAAGTCGCTGACCGACGCGGAGCGGCGGGTGGCGTCGCTGGCCGCCGGCGGCCAGACCAACCGCGTGATCGCCGACCAGCTCTTCGTCACGGCCAGCACGGTGGAGCAGCACCTCACGAACGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCCAGCACCTGCCGGCCGAACTCGCCAACGCGGAATAG

SEQ ID NO:16

GTGAAGCGCAACGATCTGGTTGCCCGCGATGGCGAGCTCAGGTGGATGCAAGAGATTCTCAGTCAGGCGAGCGAGGGCCGGGGGGCCGTGGTCACCATCACGGGGGCGATCGCCTGTGGCAAGACGGTGCTGCTGGACGCCGCGGCAGCCAGTCAAGACGTGATCCAACTGCGTGCGGTCTGCTCGGCGGAGGAGCAGGAGCTGCCGTACGCGATGGTCGGACAACTACTCGACAATCCGGTGCTCGCCGCGCGAGTGCCGGCCCTGGGCAACCTGGCTGCGGCGGGCGAGCGGCTGCTGCCGGGCACCGAGAACAGGATCCGGCGGGAGCTCACCCGCACCCTGCTGGCTCTCGCCGACGAACGACCGGTGCTGATCGGCGTCGACGACATGCACCATGCGGACCCCGCCTCGCTGGACTGCCTGCTGCACCTGGCCCGGCGGGTCGGCCCGGCCCGCATCGCGATCGTTCTGACCGAGTTGCGCCGGCTCACCCCGGCTCACTCGCGCTTCCAGTCCGAGCTGCTCAGCCTGCGGTACCACCACGAGATCGGGTTGCAGCCGCTCACCGCGGAGCACACCGCCGACCTGGCCCGCGTCGGCCTCGGTGCCGAGGTCGACGACGACGTGCTCACCGAGCTCTACGAGGCGACCGGCGGCAACCCGAGTCTGTGCTGCGGCCTGATCAGGGACGTGCGGCAGGACTGGGAGGCCGGGGTCACCGGTATCCACGTCGGCCGGGCGTACCGGCTGGCCTATCTCAGTTCGCTCTACCGCTGCGGCCCGGCGGCGCTGCGGACCGCCCGCGCGGCCGCGGTGCTGGGCGACAGCGCCGACGCCTGCCTGATCCGCCGGGTCAGCGGCCTCGGTACGGAGGCCGTGGGCCAGGCGATCCAGCAGCTCACCGAGGGCGGCCTGCTGCGTGACCAGCAGTTCCCGCACCCGGCGGCCCGCTCGGTCGTGCTCGACGACATGTCCGCGCAGGAACGCCACGCGATGTATCGCAGCGCCCGGGAGGCAGCCGCCGAAGGTCAGGCCGACCCCGGCACCCCGGGCGAGCCGCGGGCGGCTACGGCGTACGCCGGGTGTGGTGAGCAAGCCGGTGACTACCCGGAGCCGGCCGGCCGGGCCTGCGTGGACGGTGCCGGTCCGGCCGAGTACTGCGGCGACCCGCACGGCGCCGACGACGACCCGGACGAGCTGGTCGCCGCGCTGGGCGGGCTGCTGCCGAGCCGGCTCGTGGCGATGAAGATCCGGCGCCTGGCGGTGGCCGGGCGCCCCGGGGCGGCTGCCGAGCTGCTGACCTCGCAGCGGTTGCACGCGGTGACCAGCGAGGACCGGGCCAGCCTGCGGGCCGCCGAGGTGGCGCTCGCCACGCTGTGGCCGGGTGCGACCGGCCCGGACCGGCATCCGCTCACGGAGCAGGAGGCGGCGAGCCTGCCGGAGGGTCCGCGCCTGCTCGCTGCCGCCGACGATGCCGTCGGGGCCGCCCTGCGCGGTCGCGCCGAGTACGCCGCGGCCGAGGCGGAGAACGTCCTGCGGCACGCCGATCCGGCAGCCGGTGGTGACGCCTACGCCGCCATGATCGCCCTGCTGTACACGGAGCACCCCGAGAACGTGCTGTTCTGGGCCGACAAGCTCGACGCGGGCCGCCCCGACGAGGAGACCAGTTATCCCGGGCTGCGGGCCGAGACCGCGGTGCGGCTCGGTGACCTGGAAACGGCGATGGAGCTGGGCCGCACGGTGCTGGACCAGCGGCGGCTGCCGTCCCTGGGTGTCGCCGCGGGCCTGCTCCTGGGCGGCGCGGTGACGGCCGCCATCCGGCTCGGCGACCTCGACCGGGCGGAGAAGTGGCTCGCCGAGCCGATCCCCGACGCCATCCGTACCAGCCTCTACGGCCTGCACGTGCTGGCCGCGCGGGGCCGGCTCGACCTGGCCGCGGGCCGCTACGAGGCGGCGTACACGGCGTTCCGGCTGTGTGGCGAGCGGATGGCAGGCTGGGATGCCGATGTCTCCGGGCTGGCGCTGTGGCGCGTCGACGCCGCCGAGGCCCTGCTGTCCGCGGGCATCCGCCCGGACGAGGGCCGCAAGCTCATCGACGACCAGCTCACCCGTGAGATGGGGGCCCGCTCCCGGGCGCTGACGCTGCGGGCGCAAGCGGCGTACAGCCTGCCGGTGCACCGGGTGGGCCTGCTCGACGAGGCGGCCGGCCTGCTGCTCGCCTGCCATGACGGGTACGAGCGGGCGCGGGTGCTCGCGGACCTGGGGGAGACCCTGCGCACGCTGCGGCACACCGACGCGGCCCAGCGGGTGCTCCGGCAGGCCGAGCAGGCGGCCGCGCGGTGCGGGTCGGTCCCGCTGCTGCGGCGGCTCGGGGCCGAACCCGTACGCATCGGCACCCGGCGTGGTGAACCCGGCCTGCCGCAGCGGATCAGGCTGCTGACCGATGCCGAGCGGCGGGTTGCCGCGATGGCCGCCGCCGGGCAGACCAACCGGGAGATCGCCGGTCGGCTCTTCGTCACGGCCAGCACGGTGGAGCAGCACCTGACCAGCGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCCGGTTCCTGCCGACCGAGCTCGCCCAAGCCGTCTGA

SEQ ID NO:17

ATGCCTGCCGTGAAGCGCAACGATCTGGTTGCCCGCGATGGCGAGCTCAGGTGGATGCAAGAGATTCTCAGTCAGGCGAGCGAGGGCCGGGGGGCCGTGGTCACCATCACGGGGGCGATCGCCTGTGGCAAGACGGTGCTGCTGGACGCCGCGGCAGCCAGTCAAGACGTGATCCAACTGCGTGCGGTCTGCTCGGCGGAGGAGCAGGAGCTGCCGTACGCGATGGTCGGACAACTACTCGACAATCCGGTGCTCGCCGCGCGAGTGCCGGCCCTGGGCAACCTGGCTGCGGCGGGCGAGCGGCTGCTGCCGGGCACCGAGAACAGGATCCGGCGGGAGCTCACCCGCACCCTGCTGGCTCTCGCCGACGAACGACCGGTGCTGATCGGCGTCGACGACATGCACCATGCGGACCCCGCCTCGCTGGACTGCCTGCTGCACCTGGCCCGGCGGGTCGGCCCGGCCCGCATCGCGATCGTTCTGACCGAGTTGCGCCGGCTCACCCCGGCTCACTCGCGCTTCCAGTCCGAGCTGCTCAGCCTGCGGTACCACCACGAGATCGGGTTGCAGCCGCTCACCGCGGAGCACACCGCCGACCTGGCCCGCGTCGGCCTCGGTGCCGAGGTCGACGACGACGTGCTCACCGAGCTCTACGAGGCGACCGGCGGCAACCCGAGTCTGTGCTGCGGCCTGATCAGGGACGTGCGGCAGGACTGGGAGGCCGGGGTCACCGGTATCCACGTCGGCCGGGCGTACCGGCTGGCCTATCTCAGTTCGCTCTACCGCTGCGGCCCGGCGGCGCTGCGGACCGCCCGCGCGGCCGCGGTGCTGGGCGACAGCGCCGACGCCTGCCTGATCCGCCGGGTCAGCGGCCTCGGTACGGAGGCCGTGGGCCAGGCGATCCAGCAGCTCACCGAGGGCGGCCTGCTGCGTGACCAGCAGTTCCCGCACCCGGCGGCCCGCTCGGTCGTGCTCGACGACATGTCCGCGCAGGAACGCCACGCGATGTATCGCAGCGCCCGGGAGGCAGCCGCCGAAGGTCAGGCCGACCCCGGCACCCCGGGCGAGCCGCGGGCGGCTACGGCGTACGCCGGGTGTGGTGAGCAAGCCGGTGACTACCCGGAGCCGGCCGGCCGGGCCTGCGTGGACGGTGCCGGTCCGGCCGAGTACTGCGGCGACCCGCACGGCGCCGACGACGACCCGGACGAGCTGGTCGCCGCGCTGGGCGGGCTGCTGCCGAGCCGGCTCGTGGCGATGAAGATCCGGCGCCTGGCGGTGGCCGGGCGCCCCGGGGCGGCTGCCGAGCTGCTGACCTCGCAGCGGTTGCACGCGGTGACCAGCGAGGACCGGGCCAGCCTGCGGGCCGCCGAGGTGGCGCTCGCCACGCTGTGGCCGGGTGCGACCGGCCCGGACCGGCATCCGCTCACGGAGCAGGAGGCGGCGAGCCTGCCGGAGGGTCCGCGCCTGCTCGCTGCCGCCGACGATGCCGTCGGGGCCGCCCTGCGCGGTCGCGCCGAGTACGCCGCGGCCGAGGCGGAGAACGTCCTGCGGCACGCCGATCCGGCAGCCGGTGGTGACGCCTACGCCGCCATGATCGCCCTGCTGTACACGGAGCACCCCGAGAACGTGCTGTTCTGGGCCGACAAGCTCGACGCGGGCCGCCCCGACGAGGAGACCAGTTATCCCGGGCTGCGGGCCGAGACCGCGGTGCGGCTCGGTGACCTGGAAACGGCGATGGAGCTGGGCCGCACGGTGCTGGACCAGCGGCGGCTGCCGTCCCTGGGTGTCGCCGCGGGCCTGCTCCTGGGCGGCGCGGTGACGGCCGCCATCCGGCTCGGCGACCTCGACCGGGCGGAGAAGTGGCTCGCCGAGCCGATCCCCGACGCCATCCGTACCAGCCTCTACGGCCTGCACGTGCTGGCCGCGCGGGGCCGGCTCGACCTGGCCGCGGGCCGCTACGAGGCGGCGTACACGGCGTTCCGGCTGTGTGGCGAGCGGATGGCAGGCTGGGATGCCGATGTCTCCGGGCTGGCGCTGTGGCGCGTCGACGCCGCCGAGGCCCTGCTGTCCGCGGGCATCCGCCCGGACGAGGGCCGCAAGCTCATCGACGACCAGCTCACCCGTGAGATGGGGGCCCGCTCCCGGGCGCTGACGCTGCGGGCGCAAGCGGCGTACAGCCTGCCGGTGCACCGGGTGGGCCTGCTCGACGAGGCGGCCGGCCTGCTGCTCGCCTGCCATGACGGGTACGAGCGGGCGCGGGTGCTCGCGGACCTGGGGGAGACCCTGCGCACGCTGCGGCACACCGACGCGGCCCAGCGGGTGCTCCGGCAGGCCGAGCAGGCGGCCGCGCGGTGCGGGTCGGTCCCGCTGCTGCGGCGGCTCGGGGCCGAACCCGTACGCATCGGCACCCGGCGTGGTGAACCCGGCCTGCCGCAGCGGATCAGGCTGCTGACCGATGCCGAGCGGCGGGTTGCCGCGATGGCCGCCGCCGGGCAGACCAACCGGGAGATCGCCGGTCGGCTCTTCGTCACGGCCAGCACGGTGGAGCAGCACCTGACCAGCGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCCGGTTCCTGCCGACCGAGCTCGCCCAAGCCGTCTGA

SEQ ID NO:18

GTGGTCACCGTCACCGGCCCAATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGAGGCCATCATTCTGCGCGCGGTCTGCGCGCCAGAAGAGCGGGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGGGCTGGCTGATCGGATAGCCCAGGGCGGGCAGCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTGGACCGGCCTGTGCTGATCGGCGTCGACGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATTTGGCCCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGGTTCAAGGCGGAGCTGCTCAGCCTGCCATACCACCACGAGATCGCGCTGCGTCCATTCGGACCGGAGCAATCGGCGGAGCTGGCTCGCGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGCGGGGTTGTATAAAACGACCAGGGGCAATCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCTGGCCAACGGAGAGAGCGCTTTCGAGGCGGGCCGCGCGTTCCGGCTGGCGTACCTCAGCTCGCTCTACCGCTGTGGCCCGGTCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCAAGCGCCACCACCACGCTGGTGCGCCGGCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACTGAGGGCGGGCTGCTGCTCGACCAGCAGTTCCCGCACCCGGCCGCCCGCTCGGTGGTGCTCGATGACATGTCCGCCCAGGAACGACGCAGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATGTTCGCCAAGGCCGGCAAGGCTCTGGTCGTACGCAACGAGTTGGGCGACGCGGCCGAATACCTGCAACTGGCTCACCGGGCCTCCGACGATGTCTCCACCCGGGCCGCCTTACGGGTCGAGGCCGTGGCCATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGGCACATGGACGAACTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCGGCGCTGGCCGTCTTCTGGCTAGCCGACGGCGGGCGATCCGGCGAGGCAGCCGAAGTGCTGGCGTCGGAACGCCCGCTCGCGACCACCGATCAGAACCGGGCCCACCTGCGATTTGTCGAGGTGACTCTCGCGCTGTTCTCTCCCGGCGCCTTCGGATCGGACCGGCGCCCACCTCCGCTGACGCCGGACGAACTCGCCAGCCTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGCCATGACCGCCTTGCACGGCCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCGATCCCCGCCGCGCTGATCGCCCTGTTGTACGCGGAGAACACCGAGTCCGCTCATATCTGGGCCGACAAGCTGGGCAGCACGAATGCCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTAGCGCCGTCCTGGACGACCGGTCGCTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCCGCCGCTGTCCGGCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCCGAGCCGCTTCCGAACGGCGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCGTACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCAGCTCACCGGGCGTTTCGCACCTGCGGAGAACGTATGCGCAGCTGGGATGTTGACGTGCCTGGTCTGGCCCTGTGGCGTGTCGACGCCGCCGAGGCGCTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCACCCGTCCGATGGGGCCTCGTTCCCACGCGTTAACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCGGCCGAGCTGCTGCTCCCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCACCCAGTGCGGTGCTGTCCCGCTGCTGCGCAGGCTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGGCGGCGCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCGAACAGCTGTTCGTCACGGCCAGCACAGTGGAACAGCACCTCACAAGCGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCAAGCAGCTGCCGACCGCGCTGGCCGACGTGGAACAGACCTGA

SEQ ID NO:19

ATGTATAGCGGTACCTGCCGTGAAGGATACGAACTCGTCGCACGCGAGGACGAACTCGGTATTCTACAGAGGTCTCTGGAACAAGCGAGCAGCGGCCAGGGCGTCGTGGTCACCGTCACCGGCCCAATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGAGGCCATCATTCTGCGCGCGGTCTGCGCGCCAGAAGAGCGGGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGGGCTGGCTGATCGGATAGCCCAGGGCGGGCAGCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTGGACCGGCCTGTGCTGATCGGCGTCGACGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATTTGGCCCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGGTTCAAGGCGGAGCTGCTCAGCCTGCCATACCACCACGAGATCGCGCTGCGTCCATTCGGACCGGAGCAATCGGCGGAGCTGGCTCGCGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGCGGGGTTGTATAAAACGACCAGGGGCAATCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCTGGCCAACGGAGAGAGCGCTTTCGAGGCGGGCCGCGCGTTCCGGCTGGCGTACCTCAGCTCGCTCTACCGCTGTGGCCCGGTCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCAAGCGCCACCACCACGCTGGTGCGCCGGCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACTGAGGGCGGGCTGCTGCTCGACCAGCAGTTCCCGCACCCGGCCGCCCGCTCGGTGGTGCTCGATGACATGTCCGCCCAGGAACGACGCAGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATGTTCGCCAAGGCCGGCAAGGCTCTGGTCGTACGCAACGAGTTGGGCGACGCGGCCGAATACCTGCAACTGGCTCACCGGGCCTCCGACGATGTCTCCACCCGGGCCGCCCTGCGGGTCGAGGCCGTGGCCATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGGCACATGGACGAACTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCGGCGCTGGCCGTCTTCTGGCTAGCCGACGGCGGGCGATCCGGCGAGGCAGCCGAAGTGCTGGCGTCGGAACGCCCGCTCGCGACCACCGATCAGAACCGGGCCCACCTGCGATTTGTCGAGGTGACTCTCGCGCTGTTCTCTCCCGGCGCCTTCGGATCGGACCGGCGCCCACCTCCGCTGACGCCGGACGAACTCGCCAGCCTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGCCATGACCGCCTTGCACGGCCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCGATCCCCGCCGCGCTGATCGCCCTGTTGTACGCGGAGAACACCGAGTCCGCTCATATCTGGGCCGACAAGCTGGGCAGCACGAATGCCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTAGCGCCGTCCTGGACGACCGGTCGCTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCCGCCGCTGTCCGGCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCCGAGCCGCTTCCGAACGGCGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCGTACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCAGCTCACCGGGCGTTTCGCACCTGCGGAGAACGTATGCGCAGCTGGGATGTTGACGTGCCTGGTCTGGCCCTGTGGCGTGTCGACGCCGCCGAGGCGCTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCACCCGTCCGATGGGGCCTCGTTCCCACGCGCTGACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCGGCCGAGCTGCTGCTCCCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCACCCAGTGCGGTGCTGTCCCGCTGCTGCGCAGGCTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGGCGGCGCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCGAACAGCTGTTCGTCACGGCCAGCACAGTGGAACAGCACCTCACAAGCGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCAAGCAGCTGCCGACCGCGCTGGCCGACGTGGAACAGACCTGA

SEQ ID NO:20

GTGTATAGCGGTACCTGCCGTGAAGGATACGAACTCGTCGCCCGCGAGGACGAACTCGGCATTCTGCAGAGGTCTCTGGAAGAAGCAGGCAGCGGCCAGGGCGCCGTGGTCACCGTCACCGGCCCGATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGACGCCATCATTCTGCGCGCGGTCTGCGCGCCCGAAGAGCGCGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGAGCTGGCTGATCGGATAGCCCAGGGCGGGCATCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTCGACCGGCCTGTGCTGATCGGCGTCGACGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATTTAGCCCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGATTCAAGGCGGAGCTGCTCAGCCTGCCGTACCACCACGAGATCGCGCTGCGTCCACTCGGACCGGAGCAATCGGCGGAGCTGGCCCACGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGCGGGGTTGTATGGGATGACCAGGGGCAACCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCAGGCCAACGGAGAGAGCGCTTTCGAGGTGGGCCGCGCGTTCCGGCTGGCGTACCTCAGCTCGCTCTACCGCTGTGGCCCGATCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCAAGCGCCACCACCACGCTGGTGCGCCGTCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACTGAGGGCGGGCTGCTGCTCGACCACCAGTTCCCGCACCCGGCCGCCCGCTCGGTGGTGCTCGATGACATGTCCGCCCAGGAACGACGCAGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATATTCGCCAGGGCTGGCCAGGCTCTGGTTGTACGCAACGAGTTGGGCGACGCGGCCGAATACCTGCAACTGGCTCACCGAGCCTCCGACGATGTCTCCACCCGGGCCGCCTTACGGGTCGAGGCCGTGGCAATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGTCACATGGACGAGCTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCAGCGCTGGCTGTCTTCTGGCTGGCCGACGGCGGGCGATCCGGCGAGGCAGCCGAGGTGCTGGCGTCGGAACACCCGCTCGCGACCACCGATCAGAACCGAGCACACCTGCGATTTGCCGAGGTGACTCTCGCGCTGTTCTGTCCCGGCGCCTTCGGGTCGGACCGGCGCCCACCTCCGCTGGCGCCGGACGAGCTCGCCAGCTTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGTCATGACAGCGTTGCATGCTCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCAATCCCCGCCGCACTGATCGCCCTGTTGTACGCAGAGAACACCGAGTCCGCTCAGATCTGGGCCGACAAGCTGGGCAGCACCAATGCCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTGGCACCGTCCTGGACGACCGGCCGCTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCAGCCGCTGTCCGCCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCTGAGCCGCTTCCGAACGGTGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCGCACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCGGCTCACCGGGCGTTTCACACCTGCGGAGAACGTATGCGCAGCTGGGGTGTTGACGTGCCTGGTCTAGCCCTGTGGCGTGTCGACGCCGCCGAGGCACTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCGCCCGTCCGATGGGACCTCGTTCCCGCGCATTAACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCAGCTGAGCTGCTGCTCTCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCACCCAGTGCGGTGCTGTCCCGCTGCTGCGCCGACTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGTCGGCCCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCAAACAGCTATTCGTCACGGCCAGCACCGTGGAACAGCACCTCACAAGCGTCTTCCGCAAGCTGGGCGTTAAGGGCCGCAGGCAGCTACCGACCGCGCTGGCCGACGTGGAATAG

SEQ ID NO:21

ATGTATAGCGGTACCTGCCGTGAAGGATACGAACTCGTCGCCCGCGAGGACGAACTCGGCATTCTGCAGAGGTCTCTGGAAGAAGCAGGCAGCGGCCAGGGCGCCGTGGTCACCGTCACCGGCCCGATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGACGCCATCATTCTGCGCGCGGTCTGCGCGCCCGAAGAGCGCGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGAGCTGGCTGATCGGATAGCCCAGGGCGGGCATCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTCGACCGGCCTGTGCTGATCGGCGTCGACGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATCTGGCCCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGATTCAAGGCGGAGCTGCTCAGCCTGCCGTACCACCACGAGATCGCGCTGCGTCCACTCGGACCGGAGCAATCGGCGGAGCTGGCCCACGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGCGGGGTTGTATGGGATGACCAGGGGCAACCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCAGGCCAACGGAGAGAGCGCTTTCGAGGTGGGCCGCGCGTTCCGGCTGGCGTACCTCAGCTCGCTCTACCGCTGTGGCCCGATCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCAAGCGCCACCACCACGCTGGTGCGCCGTCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACTGAGGGCGGGCTGCTGCTCGACCACCAGTTCCCGCACCCGGCCGCCCGCTCGGTGGTGCTCGATGACATGTCCGCCCAGGAACGACGCAGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATATTCGCCAGGGCTGGCCAGGCTCTGGTTGTACGCAACGAGTTGGGCGACGCGGCCGAATACCTGCAACTGGCTCACCGAGCCTCCGACGATGTCTCCACCCGGGCCGCCCTGCGGGTCGAGGCCGTGGCAATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGTCACATGGACGAGCTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCAGCGCTGGCTGTCTTCTGGCTGGCCGACGGCGGGCGATCCGGCGAGGCAGCCGAGGTGCTGGCGTCGGAACACCCGCTCGCGACCACCGATCAGAACCGAGCACACCTGCGATTTGCCGAGGTGACTCTCGCGCTGTTCTGTCCCGGCGCCTTCGGGTCGGACCGGCGCCCACCTCCGCTGGCGCCGGACGAGCTCGCCAGCTTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGTCATGACAGCGTTGCATGCTCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCAATCCCCGCCGCACTGATCGCCCTGTTGTACGCAGAGAACACCGAGTCCGCTCAGATCTGGGCCGACAAGCTGGGCAGCACCAATGCCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTGGCACCGTCCTGGACGACCGGCCGCTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCAGCCGCTGTCCGCCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCTGAGCCGCTTCCGAACGGTGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCGCACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCGGCTCACCGGGCGTTTCACACCTGCGGAGAACGTATGCGCAGCTGGGGTGTTGACGTGCCTGGTCTAGCCCTGTGGCGTGTCGACGCCGCCGAGGCACTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCGCCCGTCCGATGGGACCTCGTTCCCGCGCACTGACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCAGCTGAGCTGCTGCTCTCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCACCCAGTGCGGTGCTGTCCCGCTGCTGCGCCGACTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGTCGGCCCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCAAACAGCTATTCGTCACGGCCAGCACCGTGGAACAGCACCTCACAAGCGTCTTCCGCAAGCTGGGCGTTAAGGGCCGCAGGCAGCTACCGACCGCGCTGGCCGACGTGGAATAG

SEQ ID NO:22

GTGTATAGCGGTACCTGCCGTGAAGGATACGAACTCGTCGCACGCGAGGACGAACTCGGCATTCTACAGAGGTCTCTGGAACAAGCGAGCAGCGGCCAGGGCGTCGTGGTCACCGTCACCGGCCCAATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGAGGCCATCATTCTGCGCGCGGTCTGCGCGCCCGAAGAGCGGGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGGGCTGGCTGATCGGATAGCCCAGGGCGGGCAGCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTGCACCGGCCTGTGCTGATCGGCGTCGATGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATTTGGCGCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGATTCAAGGCGGAGCTGCTCAGCCTGCCGTACCACCACGAGATCGCGCTGCGTCCATTCGGACCGGAGCAATCGGCGGAGCTGGCTCGCGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGCGGGGTTGTATAAAACGACCAGGGGCAATCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCTGGCCAACGGAGAGAGCGCTTTCGAGGCGGGCCGCGCGTTCCGGCTGGCGTACCTCAGCTCGCTCTACCGCTGTGGCCCGGTCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCAAGCGCCACCACCACGCTGGTGCGCCGGCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACCGAGGGCGGGCTGCTGCTCGACCAGCAGTTTCCGCACCCGGCCGCCCGCTCGGTGGTGCTCGATGACATGTCCGCCCAGGAACGACGCGGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATGTTCGCCAAGGCCGGCAAGGCTCTGGTCGTACGCAACGAGTTGGGCGACGCGGCCGAATACCTGCAACTGGCTCACCGGGCCTCCGACGATGTCTCCACCCGGGCCGCCTTACGGGTCGAGGCCGTGGCGATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGGCACATGGACGAGCTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCGGCGCTGGCCGTCTTCTGGCTGGCCGACGGCGGGCGATCCGGCGAGGCAGCCCAGGTGCTGGCGTCGGAACGCCCGCTCGCGACCACCGATCAGAACCGGGCCCACCTGCGATTTGTCGAGGTGACTCTCGCGCTGTTCTCTCCCGGCGCCTTCGGATCGGACCGGCGCCCACCTCCGCTGACGCCGGACGAACTCGCCAGCCTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGCCATGACCGCCTTGCACGGCCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCGATCCCCGCCGCGCTGATCGCCCTGTTGTACGCGGAGAACACCGAGTCCGCTCATATCTGGGCCGACAAGCTGGGCAGCATGAATGCCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTAGCACCGTCCTGGACGACCGGTCACTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCCGCCGCTGTCCGGCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCCGAGCCGCTTCCGAACGGCGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCGTACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCGGCTCACCGGGCGTTTCGCACCTGCGGAGAACGTATGCGCAGCTGGGATGTTGACGTGCCTGGTCTGGCCCTGTGGCGTGTCGACGCCGCCGAGGCGCTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCACCCGTCCGATGGGACCTCGTTCCCGCGCGTTAACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCGGCCGAGCTGCTGCTCCCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCACCCAGTGCGGTGCTGTCCCGCTGCTGCGCCGACTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGGCGGCGCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCGAACAGCTGTTCGTCACGGCCAGCACAGTGGAACAGCACCTCACAAGCGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCAAGCAGCTGCCGACCGCGCTGGCCGACGTGGAACAGACCTGA

SEQ ID NO:23

ATGTATAGCGGTACCTGCCGTGAAGGATACGAACTCGTCGCACGCGAGGACGAACTCGGCATTCTACAGAGGTCTCTGGAACAAGCGAGCAGCGGCCAGGGCGTCGTGGTCACCGTCACCGGCCCAATCGCCTGCGGCAAGACAGAACTGCTTGACGCGGCTGCCGCGAAGGCTGAGGCCATCATTCTGCGCGCGGTCTGCGCGCCCGAAGAGCGGGCTATGCCGTACGCCATGATCGGGCAGCTCATCGACGACCCGGCGCTCGCGCATCGGGCGCCGGGGCTGGCTGATCGGATAGCCCAGGGCGGGCAGCTGTCGCTGAGGGCCGAGAACCGACTGCGCAGGGATCTCACCCGTGCCCTGCTGGCGCTTGCCGTGCACCGGCCTGTGCTGATCGGCGTCGATGATGTGCATCACGCCGACACCGCCTCTTTGAACTGTCTGCTGCATTTGGCGCGCCGGGTCCGTCCGGCCCGGATATCCATGATCTTCACCGAGTTGCGCAGCCTCACCCCTACTCAGTCACGATTCAAGGCGGAGCTGCTCAGCCTGCCGTACCACCACGAGATCGCGCTGCGTCCATTCGGACCGGAGCAATCGGCGGAGCTGGCTCGCGCCGCCTTCGGCCCGGGCCTCGCCGAGGATGTGCTCGCGGGGTTGTATAAAACGACCAGGGGCAATCTGAGTCTCAGCCGTGGACTGATCAGCGATGTGCGGGAGGCCCTGGCCAACGGAGAGAGCGCTTTCGAGGCGGGCCGCGCGTTCCGGCTGGCGTACCTCAGCTCGCTCTACCGCTGTGGCCCGGTCGCGCTGCGGGTCGCCCGAGTGGCTGCCGTGCTGGGCCCAAGCGCCACCACCACGCTGGTGCGCCGGCTAAGCGGGCTCAGCGCGGAGACGATAGACCGGGCAACCAAGATCCTCACCGAGGGCGGGCTGCTGCTCGACCAGCAGTTTCCGCACCCGGCCGCCCGCTCGGTGGTGCTCGATGACATGTCCGCCCAGGAACGACGCGGCCTGCACACTCTCGCCCTGGAACTGCTGGACGAGGCGCCGGTTGAAGTGCTCGCGCACCACCAGGTCGGCGCCGGTCTCATACACGGGCCCAAGGCTGCGGAGATGTTCGCCAAGGCCGGCAAGGCTCTGGTCGTACGCAACGAGTTGGGCGACGCGGCCGAATACCTGCAACTGGCTCACCGGGCCTCCGACGATGTCTCCACCCGGGCCGCCCTGCGGGTCGAGGCCGTGGCGATCGAGCGCCGCCGCAATCCGCTGGCCTCCAGTCGGCACATGGACGAGCTGAGCGCCGCCGGCCGCGCCGGTCTGCTTTCCCCCAAGCATGCGGCGCTGGCCGTCTTCTGGCTGGCCGACGGCGGGCGATCCGGCGAGGCAGCCCAGGTGCTGGCGTCGGAACGCCCGCTCGCGACCACCGATCAGAACCGGGCCCACCTGCGATTTGTCGAGGTGACTCTCGCGCTGTTCTCTCCCGGCGCCTTCGGATCGGACCGGCGCCCACCTCCGCTGACGCCGGACGAACTCGCCAGCCTGCCGAAGGCGGCCTGGCAATGCGCGGTCGCCGACAACGCGGCCATGACCGCCTTGCACGGCCATCCAGAACTTGCCACCGCTCAGGCGGAAACAGTTCTGCGGCAGGCTGATTCGGCAGCCGACGCGATCCCCGCCGCGCTGATCGCCCTGTTGTACGCGGAGAACACCGAGTCCGCTCATATCTGGGCCGACAAGCTGGGCAGCATGAATGCCGGGGTATCGAACGAGGCGGAAGCGGGCTACGCCGGCCCGTGCGCCGAGATCGCCCTGCGGCGCGGCGACCTGGCCACGGCGTTCGAGGCTGGTAGCACCGTCCTGGACGACCGGTCACTGCCGTCGCTCGGCATCACCGCCGCATTGCTGTTGAGCAGCAAGACGGCCGCCGCTGTCCGGCTGGGCGAACTCGAGCGTGCGGAGAAGCTGCTCGCCGAGCCGCTTCCGAACGGCGTCCAGGACAGCCTTTTCGGTCTGCACCTGCTCTCGGCGTACGGCCAGTACAGCCTCGCGATGGGCCGATATGAATCGGCTCACCGGGCGTTTCGCACCTGCGGAGAACGTATGCGCAGCTGGGATGTTGACGTGCCTGGTCTGGCCCTGTGGCGTGTCGACGCCGCCGAGGCGCTGCTCAGCCTCGACCGGAACGAGGGCCAGCGGCTCATCGACGAACAACTCACCCGTCCGATGGGACCTCGTTCCCGCGCGCTGACGCTGCGGATCAAGGCGGCATACCTCCCGCGGACGAAGCGGATCCCCCTGCTCCATGAGGCGGCCGAGCTGCTGCTCCCCTGCCCCGACCCGTACGAGCAAGCGCGGGTGCTCGCCGATCTGGGCGACACGCTCAGCGCGCTCAGACGCTATAGCCGGGCGCGGGGAGTTCTCCGGCAGGCTCGTCACCTGGCCACCCAGTGCGGTGCTGTCCCGCTGCTGCGCCGACTCGGGGGCGAGCCCGGCCGGATCGACGACGCCGGCCTGCCGCAGCGGAGCACATCGTTGACCGATGCGGAGCGGCGGGTGGCGGCGCTGGCCGCGGCCGGACAGACCAACCGGGAGATCGCCGAACAGCTGTTCGTCACGGCCAGCACAGTGGAACAGCACCTCACAAGCGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCAAGCAGCTGCCGACCGCGCTGGCCGACGTGGAACAGACCTGA

SEQ ID NO:24

GTGCGAGCTATTAATGCGTCCGACACCGGTCCTGAACTGGTCGCCCGCGAAGACGAACTGGGACGTGTACGAAGTGCCCTGAACCGAGCGAACGGCGGCCAAGGTGTCCTGATCTCCATTACCGGTCCGATCGCCTGCGGCAAGACCGAACTGCTTGAGGCTGCCGCCTCGGAAGTTGACGCCATCACTCTGCGCGCGGTCTGTGCCGCCGAGGAACGGGCGATACCTTATGCCCTGATCGGGCAGCTTATCGACAACCCCGCGCTCGGCATTCCGGTTCCGGATCCGGCCGGCCTGACCGCCCAGGGCGGACGACTGTCATCGAGCGCCGAGAACCGACTGCGTCGCGACCTCACCCGTGCCCTGCTGACGCTCGCCACCGACCGGCTGGTGCTGATCTGTGTCGATGACGTGCAGCACGCCGACAACGCCTCGTTGAGCTGCCTTCTGTATCTGGCCCGACGGCTTGTCCCGGCTCGAATCGCTCTGGTATTCACCGAGTTGCGAGTCCTCACCTCGTCTCAGTTACGGTTCAACGCGGAGCTGCTCAGCTTGCGGAACCACTGCGAGATCGCGCTGCGCCCACTCGGCCCGGGGCATGCGGCCGAGCTGGCCCGCGCCACCCTCGGCCCCGGCCTCTCCGACGAAACACTCACGGAGCTGTACCGGGTGACCGGAGGCAACCTGAGTCTCAGCCGCGGGCTGATCGACGATGTGCGGGACGCCTGGGCACGAGGGGAAACGGGCGTCCAGGTGGGCCGGGCGTTCCGGCTGGCCTACCTCGGTTCCCTCCACCGCTGTGGTCCGCTGGCGTTGCGGGTCGCCCGCGTAGCCGCCGTACTGGGCCCGAGCGCCACCAGCGTCCTGGTGCGCCGGATCAGTGGGCTCAGCGCGGAGGCCATGGCCCAGGCGACCGATATCCTCGCTGACGGCGGCCTCCTGCGCGACCAGCGGTTCACACATCCAGCGGCCCGCTCGGTGGTGCTCGACGACATGTCCGCCGAGGAACGACGCAGCGTGCACAGCCTCGCCCTGGAACTGCTGGACGAGGCACCGGCCGAGATGCTCGCGCACCACCGGGTCGGCGCCGGTCTCGTGCACGGGCCGAAGGCCGCGGAGACATTCACCGGGGCCGGCCGGGCACTGGCCGTTCGCGGCATGCTGGGCGAGGCAGCCGACTACCTGCAACTGGCGTACCGGGCCTCCGGCGACGCCGCTACCAAGGCCGCGATACGCGTCGAGTCCGTGGCGGTCGAGCGCCGACGCAATCCGCTGGTCGTCAGTCGCCATTGGGACGAGCTGAGCGTCGCGGCCCGCGCCGGTCTGCTCTCCTGCGAGCACGTGTCCAGGACGGCCCGCTGGCTGACCGTCGGTGGGCGGCCCGGCGAGGCGGCCAGGGTGCTGGCGTCGCAACACCGACGGGTCGTCACCGATCAGGACCGGGCCCACCTGCGGGTCGCCGAGTTCTCGCTCGCGCTGCTGTACCCCGGTACGTCCGGCTCGGACCGGCGCCCGCACCCGCTCACGTCGGACGAACTCGCGGCCCTACCGACTGCGACCAGACACTGCGCGATCGCCGATAACGCTGTCATGGCTGCCTTGCGTGGTCATCCGGAGCTTGCCACCGCCGAGGCAGAAGCCGTTCTGCAGCAAGCCGACGCGGCGGACGGCGCTGCTCTCACCGCGCTGATGGCCCTGCTGTACGCGGAGAGCATCGAGGTCGCTGAAGTCTGGGCGGACAAGCTGGCGGCAGAGGCCGGAGCATCGAACGGGCAGGACGCGGAGTACGCCGGTATACGCGCCGAAATCGCCCTGCGGCGCGGCGATCTGACCGCGGCCGTCGAGACCGCCGGCATGGTCCTGGACGGCCGGCCGCTGCCGTCGCTCGACATCACCGCCACGTTGCTGTTGGCCGGCAGGGCGTCCGTCGCCGTCCGGCTGGGCGAACTCGACCACGCGGAGGAGCTGTTCGCCGCGCCGCCGGAGGACGCCTTCCAGGACAGCCTCTTCGGTCTGCATCTGCTCTCGGCGCACGGCCAGTACAGCCTCGCGACAGGCCGGCCCGAGTCGGCATACCGGGCCTTTCGTGCCTGCGGCGAACGTATGCGCGATTGGGGCTTCGACGCGCCCGGTGTGGCCCTGTGGCGCGTCGGCGCCGCCGAGGCGCTGCTCGGCCTCGACCGGAACGAGGGCCGACGGCTCATCGACGAACAGCTGAGCCGGACGATGGCCCCCCGGTCCCACGCGTTGACGCTGCGGATAAAAGCGGCGTACATGCCGGAGCCGAAGCGGGTCGACCTGCTCTACGAAGCGGCTGAGCTGCTGCTCTCCTGCCGGGACCAGTATGAGCGAGCGCGGGTGCTCGCCGATCTGGGCGAGGCGCTCAGCGCGCTCGGGAACTACCGGCAGGCGCGAGGTGTGCTCCGGCAGGCTCGGCATCTGGCCATGCGAACCGGCGCGGACCCGCTGCTGCGCCGGCTCGGAATCAGGCCCGGCCGGCAGGACGACCCCGACCCGCAGCCGCGGAGCAGATCGCTGACCAACGCTGAGCGGCGTGCGGCGTCGCTGGCCGCGACCGGACTGACCAACCGGGAGATCGCCGACCGGCTCTTCGTCACCGCCAGCACCGTGGAGCAGCACCTCACCAACGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCAAGCAGCTGCCGGCCGAGTTGGACGACATGGAATAG

SEQ ID NO:25

ATGCGAGCTATTAATGCGTCCGACACCGGTCCTGAACTGGTCGCCCGCGAAGACGAACTGGGACGTGTACGAAGTGCCCTGAACCGAGCGAACGGCGGCCAAGGTGTCCTGATCTCCATTACCGGTCCGATCGCCTGCGGCAAGACCGAACTGCTTGAGGCTGCCGCCTCGGAAGTTGACGCCATCACTCTGCGCGCGGTCTGTGCCGCCGAGGAACGGGCGATACCTTATGCCCTGATCGGGCAGCTTATCGACAACCCCGCGCTCGGCATTCCGGTTCCGGATCCGGCCGGCCTGACCGCCCAGGGCGGACGACTGTCATCGAGCGCCGAGAACCGACTGCGTCGCGACCTCACCCGTGCCCTGCTGACGCTCGCCACCGACCGGCTGGTGCTGATCTGTGTCGATGACGTGCAGCACGCCGACAACGCCTCGTTGAGCTGCCTTCTGTATCTGGCCCGACGGCTTGTCCCGGCTCGAATCGCTCTGGTATTCACCGAGTTGCGAGTCCTCACCTCGTCTCAGCTGCGGTTCAACGCGGAGCTGCTCAGCTTGCGGAACCACTGCGAGATCGCGCTGCGCCCACTCGGCCCGGGGCATGCGGCCGAGCTGGCCCGCGCCACCCTCGGCCCCGGCCTCTCCGACGAAACACTCACGGAGCTGTACCGGGTGACCGGAGGCAACCTGAGTCTCAGCCGCGGGCTGATCGACGATGTGCGGGACGCCTGGGCACGAGGGGAAACGGGCGTCCAGGTGGGCCGGGCGTTCCGGCTGGCCTACCTCGGTTCCCTCCACCGCTGTGGTCCGCTGGCGTTGCGGGTCGCCCGCGTAGCCGCCGTACTGGGCCCGAGCGCCACCAGCGTCCTGGTGCGCCGGATCAGTGGGCTCAGCGCGGAGGCCATGGCCCAGGCGACCGATATCCTCGCTGACGGCGGCCTCCTGCGCGACCAGCGGTTCACACATCCAGCGGCCCGCTCGGTGGTGCTCGACGACATGTCCGCCGAGGAACGACGCAGCGTGCACAGCCTCGCCCTGGAACTGCTGGACGAGGCACCGGCCGAGATGCTCGCGCACCACCGGGTCGGCGCCGGTCTCGTGCACGGGCCGAAGGCCGCGGAGACATTCACCGGGGCCGGCCGGGCACTGGCCGTTCGCGGCATGCTGGGCGAGGCAGCCGACTACCTGCAACTGGCGTACCGGGCCTCCGGCGACGCCGCTACCAAGGCCGCGATACGCGTCGAGTCCGTGGCGGTCGAGCGCCGACGCAATCCGCTGGTCGTCAGTCGCCATTGGGACGAGCTGAGCGTCGCGGCCCGCGCCGGTCTGCTCTCCTGCGAGCACGTGTCCAGGACGGCCCGCTGGCTGACCGTCGGTGGGCGGCCCGGCGAGGCGGCCAGGGTGCTGGCGTCGCAACACCGACGGGTCGTCACCGATCAGGACCGGGCCCACCTGCGGGTCGCCGAGTTCTCGCTCGCGCTGCTGTACCCCGGTACGTCCGGCTCGGACCGGCGCCCGCACCCGCTCACGTCGGACGAACTCGCGGCCCTACCGACTGCGACCAGACACTGCGCGATCGCCGATAACGCTGTCATGGCTGCCTTGCGTGGTCATCCGGAGCTTGCCACCGCCGAGGCAGAAGCCGTTCTGCAGCAAGCCGACGCGGCGGACGGCGCTGCTCTCACCGCGCTGATGGCCCTGCTGTACGCGGAGAGCATCGAGGTCGCTGAAGTCTGGGCGGACAAGCTGGCGGCAGAGGCCGGAGCATCGAACGGGCAGGACGCGGAGTACGCCGGTATACGCGCCGAAATCGCCCTGCGGCGCGGCGATCTGACCGCGGCCGTCGAGACCGCCGGCATGGTCCTGGACGGCCGGCCGCTGCCGTCGCTCGACATCACCGCCACGTTGCTGTTGGCCGGCAGGGCGTCCGTCGCCGTCCGGCTGGGCGAACTCGACCACGCGGAGGAGCTGTTCGCCGCGCCGCCGGAGGACGCCTTCCAGGACAGCCTCTTCGGTCTGCATCTGCTCTCGGCGCACGGCCAGTACAGCCTCGCGACAGGCCGGCCCGAGTCGGCATACCGGGCCTTTCGTGCCTGCGGCGAACGTATGCGCGATTGGGGCTTCGACGCGCCCGGTGTGGCCCTGTGGCGCGTCGGCGCCGCCGAGGCGCTGCTCGGCCTCGACCGGAACGAGGGCCGACGGCTCATCGACGAACAGCTGAGCCGGACGATGGCCCCCCGGTCCCACGCGTTGACGCTGCGGATAAAAGCGGCGTACATGCCGGAGCCGAAGCGGGTCGACCTGCTCTACGAAGCGGCTGAGCTGCTGCTCTCCTGCCGGGACCAGTATGAGCGAGCGCGGGTGCTCGCCGATCTGGGCGAGGCGCTCAGCGCGCTCGGGAACTACCGGCAGGCGCGAGGTGTGCTCCGGCAGGCTCGGCATCTGGCCATGCGAACCGGCGCGGACCCGCTGCTGCGCCGGCTCGGAATCAGGCCCGGCCGGCAGGACGACCCCGACCCGCAGCCGCGGAGCAGATCGCTGACCAACGCTGAGCGGCGTGCGGCGTCGCTGGCCGCGACCGGACTGACCAACCGGGAGATCGCCGACCGGCTCTTCGTCACCGCCAGCACCGTGGAGCAGCACCTCACCAACGTCTTCCGCAAGCTGGGCGTCAAGGGCCGCAAGCAGCTGCCGGCCGAGTTGGACGACATGGAATAG

SEQ ID NO:26

MPAVECYELDARDDELRKLEEVVTGRANGRGVVVTITGPIACGKTELLDAAAAKADAITLRAVCSAEEQALPYALIGQLIDNPALASHALEPACPTLPGEHLSPEAENRLRSDLTRTLLALAAERPVLIGIDESHANALCLLHLARRVGSARIAMVLTELRRLTPAHSQFQAELLSLGHHREIALRPLSPKHTAELVRAGLGPDVDEDVLTGLYRATGGNLNLTRGLINDVREAWETGGTGISAGRAYRLAYLGSLYRCGPVPLRVARVAAVLGQSANTTLVRWISGLNADAVGEATEILTEGGLLHDLRFPHPAARSVVLNDMSAQERRRLHRSALEVLDDVPVEVVAHHQVGAGLLHGPKAAEIFAKAGQELHVRGELDTASDYLQLAHQASDDAVTGMRAEAVAIERRRNPLASSRHLDELTVVARAGLLFPEHTALMIRWLGVGGRSGEAAGLLASQRPRAVTDQDRAHMRAAEVSLALVSPGTSGPDRRPRPLTPDELANLPKAARLCAIADNAVMSALRGRPELAAAEAENVLQHADSAAAGTTALAALTALLYAENTDTAQLWADKLVSETGASNEEEAGYAGPRAEAALRRGDLAAAVEAGSTVLDHRRLSTLGITAALPLSSAVAAAIRLGETERAEKWLAQPLPQAIQDGLFGLHLLSARGQYSLATGQHESAYTAFRTCGERMRNWGVDVPGLSLWRVDAAEALLHGRDRDEGRRLVDEQLTRAMGPRSRALTLRVQAAYSPPAKRVDLLDEAADLLLSCNDQYERARVLADLSETFSALRHHSRARGLLRQARHLAAQRGAIPLLRRLGAKPGGPGWLEESGLPQRIKSLTDAERRVASLAAGGQTNRVIADQLFVTASTVEQHLTDVSTGSRPPAPAAELV

SEQ ID NO:27

MVPEVRAAPDELIARDDELSRLQRALTRAGSGRGGVVAITGPIASGKTALLDAGAAKSGFVALRAVCSWEERTLPYGMLGQLFDHPELAAQAPDLAHFTASCESPQAGTDNRLRAEFTRTLLALAADWPVLIGIDDVHHADAESLRCLLHLARRIGPARIAVVLTELRRPTPADSRFQAELLSLRSYQEIALRPLTEAQTGELVRRHLGAETHEDVSADTFRATGGNLLLGHGLINDIREARTAGRPGVVAGRAYRLAYLSSLYRCGPSALRVARASAVLGASAEAVLVQRMTGLNKDAVEQVYEQLNEGRLLQGERFPHPAARSIVLDDLSALERRNLHESALELLRDHGVAGNVLARHQIGAGRVHGEEAVELFTGAAREHHLRGELDDAAGYLELAHRASDDPVTRAALRVGAAAIERLCNPVRAGRHLPELLTASRAGLLSSEHAVSLADWLAMGGRPGEAAEVLATQRPAADSEQHRALLRSGELSLALVHPGAWDPLRRTDRFAAGGLGSLPGPARHRAVADQAVIAALRGRLDRADANAESVLQHTDATADRTTAIMALLALLYAENTDAVQFWVDKLAGDEGTRTPADEAVHAGFNAEIALRRGDLMRAVEYGEAALGHRHLPTWGMAAALPLSSTVVAAIRLGDLDRAERWLAEPLPQQTPESLFGLHLLWARGQHHLATGRHGAAYTAFRECGERMRRWAVDVPGLALWRVDAAESLLLLGRDRAEGLRLVSEQLSRPMRPRARVQTLRVQAAYSPPPQRIDLLEEAADLLVTCNDQYELANVLSDLAEASSMVRQHSRARGLLRRARHLATQCGAVPLLRRLGAEPSDIGGAWDATLGQRIASLTESERRVAALAAVGRTNREIAEQLFVTASTVEQHLTNVFRKLAVKGRQQLPKELADVGEPADRDRRCGSEQ ID NO:28

MIARLSPPDLIARDDEFGSLHRALTRAGGGRGVVAAVTGPIACGKTELLDAAAAKAGFVTLRAVCSMEERALPYGMLGQLLDQPELAARTPELVRLTASCENLPADVDNRLGTELTRTVLTLAAERPVLIGIDDVHHADAPSLRCLLHLARRISRARVAIVLTELLRPTPAHSQFRAALLSLRHYQEIALRPLTEAQTTELVRRHLGQDAHDDVVAQAFRATGGNLLLGHGLIDDIREARTRTSGCLEVVAGRAYRLAYLGSLYRCGPAALSVARASAVLGESVELTLVQRMTGLDTEAVEQAHEQLVEGRLLREGRFPHPAARSVVLDDLSAAERRGLHELALELLRDRGVASKVLARHQMGTGRVHGAEVAGLFTDAAREHHLRGELDEAVTYLEFAYRASDDPAVHAALRVDTAAIERLCDPARSGRHVPELLTASRERLLSSEHAVSLACWLAMDGRPGEAAEVLAAQRSAAPSEQGRAHLRVADLSLALIYPGAADPPRPADPPAEDEVASFSGAVRHRAVADKALSNALRGWSEQAEAKAEYVLQHSRVTTDRTTTMMALLALLYAEDTDAVQSWVDKLAGDDNMRTPADEAVHAGFRAEAALRRGDLTAAVECGEAALAPRVVPSWGMAAALPLSSTVAAAIRLGDLDRAERWLAEPLPEETSDSLFGLHMVWARGQHHLAAGRYRAAYNAFRDCGERMRRWSVDVPGLALWRVDAAEALLLLGRGRDEGLRLISEQLSRPMGSRARVMTLRVQAAYSPPAKRIELLDEAADLLIMCRDQYELARVLADMGEACGMLRRHSRARGLFRRARHLATQCGAVPLLRRLGGESSDADGTQDVTPAQRITSLTEAERRVASHAAVGRTNKEIASQLFVTSSTVEQHLTNVFRKLGVKGRQQLPKELSDAG

SEQ ID NO:29

MEFYDLVARDDELRRLDQALGRAAGGRGVVVTVTGPVGCGKTELLDAAAAEEEFITLRAVCSAEERALPYAVIGQLLDHPVLSARAPDLACVTAPGRTLPADTENRLRRDLTRALLALASERPVLICIDDVHQADTASLNCLLHLARRVASARIAMILTELRRLTPAHSRFEAELLSLRHRHEIALRPLGPADTAELARARLGAGVTADELAQVHEATSGNPNLVGGLVNDVREAWAAGGTGIAAGRAYRLAYLSSVYRCGPVPLRIAQAAAVLGPSATVTLVRRISGLDAETVDEATAILTEGGLLRDHRFPHPAARSVVLDDMSAQERRRLHRSTLDVLDGVPVDVLAHHQAGAGLLHGPQAAEMFARASQELRVRGELDAATEYLQLAYRASDDAGARAALQVETVAGERRRNPLAASRHLDELAAAARAGLLSAEHAALVVHWLADAGRPGEAAEVLALQRALAVTDHDRARLRAAEVSLALFHPGVPGSDPRPLAPEELASLSLSARHGVTADNAVLAALRGRPESAAAEAENVLRNADAAASGPTALAALTALLYAENTDAAQLWADKLAAGIGAGEGEAGYAGPRTVAALRRGDLTTAVQAAGAVLDRGRPSSLGITAVLPLSGAVAAAIRLGELERAEKWLAEPLPEAVHDSLFGLHLLMARGRYSLAVGRHEAAYAAFRDCGERMRRWDVDVPGLALWRVDAAEALLPGDDRAEGRRLIDEQLTRPMGPRSRALTLRVRAAYAPPAKRIDLLDEAADLLLSSNDQYERARVLADLSEAFSALRQNGRARGILRQARHLAAQCGAVPLLRRLGVKAGRSGRLGRPPQGIRSLTEAERRVATLAAAGQTNREIADQLFVTASTVEQHLTNVFRKLGVKGRQQLPAELADLRPPG

SEQ ID NO:30

MYSGTCREGYELVAREDELGILQRSLEQASSGQGVVVTVTGPIACGKTELLDAAAAKAEAIILRAVCAPEERAMPYAMIGQLIDDPALAHRAPGLADRIAQGGQLSLRAENRLRRDLTRALLALAVDRPVLIGVDDVHHADTASLNCLLHLARRVRPARISMIFTELRSLTPTQSRFKAELLSLPYHHEIALRPFGPEQSAELARAAFGPGLAEDVLVGLYKTTRGNLSLSRGLISDVREALANGESAFEAGRAFRLAYLGSLYRCGPVALRVARVAAVLGPSATTTLVRRLSGLSAETIDRATKILTEGGLLLDQQFPHPAARSVVLDDMSAQERRGLHTLALELLDEAPVEVLAHHQVGAGLIHGPKAAEMFAKAGKALVVRNELGDAAEYLQLAHRASDDVSTRAALRVEAVAIERRRNPLASSRHMDELSAAGRAGLLSPKHAALAVFWLADGGRSGEAAEVLASERPLATTDQNRAHLRFVEVTLALFSPGAFGSDRRPPPLTPDELASLPKAAWQCAVADNAAMTALHGHPELATAQAETVLRQADSAADAIPAALIALLYAENTESAHIWADKLGSTNGGVSNEAEAGYAGPCAEIALRRGDLATAFEAGSTVLDDRSLPSLGITAALLLSSKTAAAVRLGELERAEKLLAEPLPNGVQDSLFGLHLLSAYGQYSLAMGRYESALRAFHTCGERMRSWDVDVPGLALWRVDAAEALLSLDRNEGQRLIDEQLTRPMGPRSRALTLRIKAAYLPRTKRIPLLHEAAELLLPCPDPYEQARVLADLGDTLSALRRYSRARGVLRQARHLAAQCGAVPLLRRLGGEPGRIDDAGLPQRSTSLTDAERRVAALAAAGQTNREIAKQLFVTASTVEQHLTSVFRKLGVKGRKQLPTALADVEQT

SEQ ID NO:31

MPAVESYELDARDDELRRLEEAVGQAGNGRGVVVTITGPIACGKTELLDAAAAKSDAITLRAVCSEEERALPYALIGQLIDNPAVASQLPDPVSMALPGEHLSPEAENRLRGDLTRTLLALAAERPVLIGIDDMHHADTASLNCLLHLARRVGPARIAMVLTELRRLTPAHSQFHAELLSLGHHREIALRPLGPKHIAELARAGLGPDVDEDVLTGLYRATGGNLNLGHGLIKDVREAWATGGTGINAGRAYRLAYLGSLYRCGPVPLRVARVAAVLGQSANTTLVRWISGLNADAVGEATEILTEGGLLHDLRFPHPAARSVVLNDLSARERRRLHRSALEVLDDVPVEVVAHHQAGAGFIHGPKAAEIFAKAGQELHVRGELDAASDYLQLAHHASDDAVTRAALRVEAVAIERRRNPLASSRHLDELTVAARAGLLSLEHAALMIRWLALGGRSGEAAEVLAAQRPRAVTDQDRAHLRAAEVSLALVSPGASGVSPGASGPDRRPRPLPPDELANLPKAARLCAIADNAVISALHGRPELASAEAENVLKQADSAADGATALSALTALLYAENTDTAQLWADKLVSETGASNEEEGAGYAGPRAETALRRGDLAAAVEAGSAILDHRRGSLLGITAALPLSSAVAAAIRLGETERAEKWLAEPLPEAIRDSLFGLHLLSARGQYCLATGRHESAYTAFRTCGERMRNWGVDVPGLSLWRVDAAEALLHGRDRDEGRRLIDEQLTHAMGPRSRALTLRVQAAYSPQAQRVDLLEEAADLLLSCNDQYERARVLADLSEAFSALRHHSRARGLLRQARHLAAQCGATPLLRRLGAKPGGPGWLEESGLPQRIKSLTDAERRVASLAAGGQTNRVIADQLFVTASTVEQHLTNVFRKLGVKGRQHLPAELANAE

SEQ ID NO:32

MPAVKRNDLVARDGELRWMQEILSQASEGRGAVVTITGAIACGKTVLLDAAAASQDVIQLRAVCSAEEQELPYAMVGQLLDNPVLAARVPALGNLAAAGERLLPGTENRIRRELTRTLLALADERPVLIGVDDMHHADPASLDCLLHLARRVGPARIAIVLTELRRLTPAHSRFQSELLSLRYHHEIGLQPLTAEHTADLARVGLGAEVDDDVLTELYEATGGNPSLCCGLIRDVRQDWEAGVTGIHVGRAYRLAYLSSLYRCGPAALRTARAAAVLGDSADACLIRRVSGLGTEAVGQAIQQLTEGGLLRDQQFPHPAARSVVLDDMSAQERHAMYRSAREAAAEGQADPGTPGEPRAATAYAGCGEQAGDYPEPAGRACVDGAGPAEYCGDPHGADDDPDELVAALGGLLPSRLVAMKIRRLAVAGRPGAAAELLTSQRLHAVTSEDRASLRAAEVALATLWPGATGPDRHPLTEQEAASLPEGPRLLAAADDAVGAALRGRAEYAAAEAENVLRHADPAAGGDAYAAMIALLYTEHPENVLFWADKLDAGRPDEETSYPGLRAETAVRLGDLETAMELGRTVLDQRRLPSLGVAAGLLLGGAVTAAIRLGDLDRAEKWLAEPIPDAIRTSLYGLHVLAARGRLDLAAGRYEAAYTAFRLCGERMAGWDADVSGLALWRVDAAEALLSAGIRPDEGRKLIDDQLTREMGARSRALTLRAQAAYSLPVHRVGLLDEAAGLLLACHDGYERARVLADLGETLRTLRHTDAAQRVLRQAEQAAARCGSVPLLRRLGAEPVRIGTRRGEPGLPQRIRLLTDAERRVAAMAAAGQTNREIAGRLFVTASTVEQHLTSVFRKLGVKGRRFLPTELAQAV

SEQ ID NO:33

MYSGTCREGYELVAREDELGILQRSLEQASSGQGVVVTVTGPIACGKTELLDAAAAKAEAIILRAVCAPEERAMPYAMIGQLIDDPALAHRAPGLADRIAQGGQLSLRAENRLRRDLTRALLALAVDRPVLIGVDDVHHADTASLNCLLHLARRVRPARISMIFTELRSLTPTQSRFKAELLSLPYHHEIALRPFGPEQSAELARAAFGPGLAEDVLAGLYKTTRGNLSLSRGLISDVREALANGESAFEAGRAFRLAYLSSLYRCGPVALRVARVAAVLGPSATTTLVRRLSGLSAETIDRATKILTEGGLLLDQQFPHPAARSVVLDDMSAQERRSLHTLALELLDEAPVEVLAHHQVGAGLIHGPKAAEMFAKAGKALVVRNELGDAAEYLQLAHRASDDVSTRAALRVEAVAIERRRNPLASSRHMDELSAAGRAGLLSPKHAALAVFWLADGGRSGEAAEVLASERPLATTDQNRAHLRFVEVTLALFSPGAFGSDRRPPPLTPDELASLPKAAWQCAVADNAAMTALHGHPELATAQAETVLRQADSAADAIPAALIALLYAENTESAHIWADKLGSTNAGVSNEAEAGYAGPCAEIALRRGDLATAFEAGSAVLDDRSLPSLGITAALLLSSKTAAAVRLGELERAEKLLAEPLPNGVQDSLFGLHLLSAYGQYSLAMGRYESAHRAFRTCGERMRSWDVDVPGLALWRVDAAEALLSLDRNEGQRLIDEQLTRPMGPRSHALTLRIKAAYLPRTKRIPLLHEAAELLLPCPDPYEQARVLADLGDTLSALRRYSRARGVLRQARHLATQCGAVPLLRRLGGEPGRIDDAGLPQRSTSLTDAERRVAALAAAGQTNREIAEQLFVTASTVEQHLTSVFRKLGVKGRKQLPTALADVEQT

SEQ ID NO:34

MYSGTCREGYELVAREDELGILQRSLEEAGSGQGAVVTVTGPIACGKTELLDAAAAKADAIILRAVCAPEERAMPYAMIGQLIDDPALAHRAPELADRIAQGGHLSLRAENRLRRDLTRALLALAVDRPVLIGVDDVHHADTASLNCLLHLARRVRPARISMIFTELRSLTPTQSRFKAELLSLPYHHEIALRPLGPEQSAELAHAAFGPGLAEDVLAGLYGMTRGNLSLSRGLISDVREAQANGESAFEVGRAFRLAYLSSLYRCGPIALRVARVAAVLGPSATTTLVRRLSGLSAETIDRATKILTEGGLLLDHQFPHPAARSVVLDDMSAQERRSLHTLALELLDEAPVEVLAHHQVGAGLIHGPKAAEIFARAGQALVVRNELGDAAEYLQLAHRASDDVSTRAALRVEAVAIERRRNPLASSRHMDELSAAGRAGLLSPKHAALAVFWLADGGRSGEAAEVLASEHPLATTDQNRAHLRFAEVTLALFCPGAFGSDRRPPPLAPDELASLPKAAWQCAVADNAVMTALHAHPELATAQAETVLRQADSAADAIPAALIALLYAENTESAQIWADKLGSTNAGVSNEAEAGYAGPCAEIALRRGDLATAFEAGGTVLDDRPLPSLGITAALLLSSKTAAAVRLGELERAEKLLAEPLPNGVQDSLFGLHLLSAHGQYSLAMGRYESAHRAFHTCGERMRSWGVDVPGLALWRVDAAEALLSLDRNEGQRLIDEQLARPMGPRSRALTLRIKAAYLPRTKRIPLLHEAAELLLSCPDPYEQARVLADLGDTLSALRRYSRARGVLRQARHLATQCGAVPLLRRLGGEPGRIDDAGLPQRSTSLTDAERRVSALAAAGQTNREIAKQLFVTASTVEQHLTSVFRKLGVKGRRQLPTALADVE

SEQ ID NO:35

MYSGTCREGYELVAREDELGILQRSLEQASSGQGVVVTVTGPIACGKTELLDAAAAKAEAIILRAVCAPEERAMPYAMIGQLIDDPALAHRAPGLADRIAQGGQLSLRAENRLRRDLTRALLALAVHRPVLIGVDDVHHADTASLNCLLHLARRVRPARISMIFTELRSLTPTQSRFKAELLSLPYHHEIALRPFGPEQSAELARAAFGPGLAEDVLAGLYKTTRGNLSLSRGLISDVREALANGESAFEAGRAFRLAYLSSLYRCGPVALRVARVAAVLGPSATTTLVRRLSGLSAETIDRATKILTEGGLLLDQQFPHPAARSVVLDDMSAQERRGLHTLALELLDEAPVEVLAHHQVGAGLIHGPKAAEMFAKAGKALVVRNELGDAAEYLQLAHRASDDVSTRAALRVEAVAIERRRNPLASSRHMDELSAAGRAGLLSPKHAALAVFWLADGGRSGEAAQVLASERPLATTDQNRAHLRFVEVTLALFSPGAFGSDRRPPPLTPDELASLPKAAWQCAVADNAAMTALHGHPELATAQAETVLRQADSAADAIPAALIALLYAENTESAHIWADKLGSMNAGVSNEAEAGYAGPCAEIALRRGDLATAFEAGSTVLDDRSLPSLGITAALLLSSKTAAAVRLGELERAEKLLAEPLPNGVQDSLFGLHLLSAYGQYSLAMGRYESAHRAFRTCGERMRSWDVDVPGLALWRVDAAEALLSLDRNEGQRLIDEQLTRPMGPRSRALTLRIKAAYLPRTKRIPLLHEAAELLLPCPDPYEQARVLADLGDTLSALRRYSRARGVLRQARHLATQCGAVPLLRRLGGEPGRIDDAGLPQRSTSLTDAERRVAALAAAGQTNREIAEQLFVTASTVEQHLTSVFRKLGVKGRKQLPTALADVEQT

SEQ ID NO:36

MRAINASDTGPELVAREDELGRVRSALNRANGGQGVLISITGPIACGKTELLEAAASEVDAITLRAVCAAEERAIPYALIGQLIDNPALGIPVPDPAGLTAQGGRLSSSAENRLRRDLTRALLTLATDRLVLICVDDVQHADNASLSCLLYLARRLVPARIALVFTELRVLTSSQLRFNAELLSLRNHCEIALRPLGPGHAAELARATLGPGLSDETLTELYRVTGGNLSLSRGLIDDVRDAWARGETGVQVGRAFRLAYLGSLHRCGPLALRVARVAAVLGPSATSVLVRRISGLSAEAMAQATDILADGGLLRDQRFTHPAARSVVLDDMSAEERRSVHSLALELLDEAPAEMLAHHRVGAGLVHGPKAAETFTGAGRALAVRGMLGEAADYLQLAYRASGDAATKAAIRVESVAVERRRNPLVVSRHWDELSVAARAGLLSCEHVSRTARWLTVGGRPGEAARVLASQHRRVVTDQDRAHLRVAEFSLALLYPGTSGSDRRPHPLTSDELAALPTATRHCAIADNAVMAALRGHPELATAEAEAVLQQADAADGAALTALMALLYAESIEVAEVWADKLAAEAGASNGQDAEYAGIRAEIALRRGDLTAAVETAGMVLDGRPLPSLDITATLLLAGRASVAVRLGELDHAEELFAAPPEDAFQDSLFGLHLLSAHGQYSLATGRPESAYRAFRACGERMRDWGFDAPGVALWRVGAAEALLGLDRNEGRRLIDEQLSRTMAPRSHALTLRIKAAYMPEPKRVDLLYEAAELLLSCRDQYERARVLADLGEALSALGNYRQARGVLRQARHLAMRTGADPLLRRLGIRPGRQDDPDPQPRSRSLTNAERRAASLAATGLTNREIADRLFVTASTVEQHLTNVFRKLGVKGRKQLPAELDDME

LAL结合位点

在一些实施方案中，基因簇(例如PKS基因簇或β-内酰胺化合物基因簇)包括一个或多个启动子，所述一个或多个启动子包括一个或多个LAL结合位点。LAL结合位点可包括多核苷酸共有LAL结合位点序列(例如如本文所描述)。在一些情况下，LAL结合位点包括核心AGGGGG基序。在某些情况下，LAL结合位点包括与SEQ ID NO:2具有至少80％(例如80％、85％、90％、95％、97％、98％、99％或100％)同源性的序列。LAL结合位点可包括突变位点，所述突变位点已恢复以匹配共有或优化的LAL结合位点的序列。在一些实施方案中，LAL结合位点为合成LAL结合位点。在一些实施方案中，可如下来鉴定合成LAL结合位点：(a)提供包括至少八个核苷酸的多个合成核酸；(b)使包括至少八个核苷酸的多个核苷酸中的一个或多个与一个或多个LAL接触；(c)测定步骤(a)的核酸与步骤(b)的LAL之间的结合亲和力，其中如果合成核酸与LAL之间的亲和力大于X，那么将合成核酸鉴定为合成LAL结合位点。然后可将鉴定的合成LAL结合位点在产生化合物的簇(例如PKS簇或产生β-内酰胺化合物的蛋白质基因簇)中引入宿主细胞中。

在一些实施方案中，可如下鉴定LAL结合位点与异源LAL的配对或异源LAL结合位点与LAL的配对与天然配对相比具有增加的表达：(a)提供一个或多个LAL结合位点；(b)使所述LAL结合位点中的一个或多个与一个或多个LAL接触；(c)测定LAL结合位点与LAL之间的结合亲和力，其中如果LAL结合位点与LAL之间的亲和力大于LAL结合位点与其同源LAL和/或在其同源LAL结合位点处的LAL之间的亲和力，那么将配对鉴定为具有增加的表达。在一些实施方案中，通过测定包括LAL与LAL结合位点两者的细胞对蛋白质或化合物的表达来测定LAL结合位点与LAL之间的结合亲和力。

组成活性LAL

在一些实施方案中，重组LAL为组成活性LAL。举例来说，已以一种方式对LAL的氨基酸序列进行了修饰，使得改变的LAL占用其同源结合位点并且活化产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的转录不需要存在诱导剂化合物。将组成活性LAL引入宿主细胞将可能使得产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的表达增加，并且进而增加对应化合物(例如聚酮或β-内酰胺化合物)的产量。

工程化单向LAL

FkPhD基因簇被布置成具有由多个双向启动子-操纵子驱动的多顺反子架构，所述多个双向启动子-操纵子具有假定为LAL结合位点的保守的(以单次或多次以及彼此反向和/或直接重复的形式)GGGGGT(SEQ ID NO:3)基序。可如下将双向LAL启动子转变为单向LAL启动子(UniLAL)：通过在战略上缺失相对启动子中的一者，但维持串联LAL结合位点(如针对MalT所展现，在天然启动子中的LAL结合为协作性的情况下)。在功能上，这是通过去除存在于反义链上的保守GGGGGT(SEQ ID NO:3)基序3'的所有序列(可能含有-35以及-10启动子序列)，但完整地留下正义链上的整个序列来实现。由于此缺失，将仅在一个方向上活化转录。此前馈回路架构的优点将为在链霉菌属营养和发酵生长条件的复杂生命周期内调节和/或最大化LAL表达。

宿主细胞

在一些实施方案中，宿主细胞为细菌，诸如放线菌。举例来说，在一些实施方案中，宿主细胞为链霉菌属菌株。在一些实施方案中，宿主细胞为环圈链霉菌(Streptomycesanulatus)、抗生链霉菌(Streptomyces antibioticus)、天蓝色链霉菌(Streptomycescoelicolor)、波赛链霉菌(Streptomyces peucetius)、链霉菌属ATCC 700974、暗灰链霉菌(Streptomyces canus)、结节链霉菌(Streptomyces nodosus)、链霉菌属(多个种)、印度斯坦链异壁菌(Streptoalloteicus hindustanus)、吸水链霉菌、除虫链霉菌(Streptomycesavermitilis)、绿色产色链霉菌(Streptomyces viridochromogenes)、轮枝链霉菌(Streptomyces verticillus)、教酒链霉菌(Streptomyces chartruensis)、链霉菌属(多个种)、易变糖丝菌(Saccharothrix mutabilis)、霍耳斯特德链霉菌(Streptomyceshalstedii)、棒状链霉菌(Streptomyces clavuligerus)、委内瑞拉链霉菌(Streptomycesvenezuelae)、玫瑰产色链霉菌(Strteptomyces roseochromogenes)、东方拟无枝酸菌(Amycolatopsis orientalis)、棒状链霉菌、利尻链霉菌(Streptomyces rishiriensis)、淡紫灰链霉菌(Streptomyces lavendulae)、玫瑰孢链霉菌(Streptomyces roseosporus)、野野村氏菌属某种(Nonomuraea sp.)、波赛链霉菌、红色糖多孢菌(Saccharopolysporaerythraea)、菲律宾链霉菌(Streptomyces filipinensis)、吸水链霉菌、绛红小单孢菌(Micromonospora purpurea)、吸水链霉菌、那波链霉菌(Streptomyces narbonensis)、卡那霉素链霉菌(Streptomyces kanamyceticus)、山丘链霉菌(Streptomyces collinus)、拉沙里链霉菌(Streptomyces lasaliensis)、林肯链霉菌(Streptomyces lincolnensis)、桔橙指孢囊菌(Dactosporangium aurantiacum)、毒三素链霉菌(Streptomycestoxitricini)、吸水链霉菌、褶皱链霉菌(Streptomyces plicatus)、淡紫灰链霉菌、加纳链霉菌(Streptomyces ghanaensis)、肉桂地链霉菌(Streptomyces cinnamonensis)、金素链霉菌(Streptomyces aureofaciens)、纳塔尔链霉菌(Streptomyces natalensis)、恰塔努加链霉菌(Streptomyces chattanoogensis)L10、利迪链霉菌(Streptomyces lydicus)A02、弗雷德氏链霉菌(Streptomyces fradiae)、生二素链霉菌、唐德链霉菌(Streptomycestendae)、诺尔斯氏链霉菌(Streptomyces noursei)、除虫链霉菌、龟裂链霉菌(Streptomyces rimosus)、威德摩尔链霉菌(Streptomyces wedmorensis)、可可链霉菌(Streptomyces cacaoi)、始旋链霉菌(Streptomyces pristinaespiralis)、始旋链霉菌、游动放线菌属某种ATCC 33076、吸水链霉菌、产气列契瓦尼尔氏菌(Lechevalieriaaerocolonegenes)、地中海拟无枝酸菌(Amycolatopsis mediterranei)、苍黄拟无枝酸菌(Amycolatopsis lurida)、白色链霉菌(Streptomyces albus)、浅灰链霉菌(Streptomycesgriseolus)、壮观链霉菌(Streptomyces spectabilis)、刺糖多孢菌(Saccharopolysporaspinosa)、生二素链霉菌、棍孢链霉菌(Streptomyces staurosporeus)、灰色链霉菌(Streptomyces griseus)、链霉菌属(多个种)、不产色链霉菌(Streptomycesacromogenes)、筑波链霉菌(Streptomyces tsukubaensis)、垣霉素游动放线菌(Actinoplanes teichomyceticus)、淡青链霉菌(Streptomycesglaucescens)、龟裂链霉菌、卡特利链霉菌(Streptomyces cattleya)、远青链霉菌(Streptomyces azureus)、印度斯坦链异壁菌、教酒链霉菌、弗雷德氏链霉菌、天蓝色链霉菌、吸水链霉菌、链霉菌属某种11861、弗吉尼亚链霉菌(Streptomyces virginiae)、日本拟无枝酸菌(Amycolatopsisjaponicum)、糖肽霉素拟无枝酸菌(Amycolatopsis balhimycini)、白色链霉菌J1074、天蓝色链霉菌M1146、浅青紫链霉菌(Streptomyces lividans)、肉红链霉菌(Streptomycesincarnates)、紫红链霉菌(Streptomyces violaceoruber)或灰褐链霉菌(Streptomycesgriseofuscus)。在一些实施方案中，宿主细胞为埃希氏杆菌属(Escherichia)菌株，诸如大肠埃希氏杆菌(Escherichia coli)。在一些实施方案中，宿主细胞为芽孢杆菌属(Bacillus)菌株，诸如枯草芽孢杆菌(Bacillus subtilis)。在一些实施方案中，宿主细胞为假单孢菌属(Pseudomonas)菌株，诸如恶臭假单胞菌(Pseudomonas putitda)。在一些实施方案中，宿主细胞为粘球菌属(Myxococcus)菌株，诸如黄色粘球菌(Myxococcusxanthus)。

方法

可使用本发明的核酸、载体以及宿主细胞来获得增加和/或更有效的化合物(例如聚酮或β-内酰胺化合物)产生。将重组和/或异源LAL引入宿主细胞或将异源结合位点引入产生小分子的基因簇(例如PKS基因簇或产生β-内酰胺化合物的蛋白质基因簇)允许更大程度上控制对编码负责产生所关注的化合物(例如聚酮或β-内酰胺化合物)的产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的基因的调控。

异源LAL的引入

在一些实施方案中，通过将异源LAL引入宿主细胞(例如可使用诸如人工染色体等包括编码LAL的核酸的表达载体引入LAL)来产生化合物(例如聚酮或β-内酰胺化合物)。在一些实施方案中，宿主细胞天然缺乏LAL。在一些实施方案中，宿主细胞天然产生不同于所引入的LAL的LAL。所引入的LAL可为具有调控LAL的PKS的保守四螺旋束DNA结合区的任何LAL。在一些实施方案中，所引入的LAL为天然LAL。在一些实施方案中，所引入的LAL为修饰过的LAL，例如组成活性LAL。在一些实施方案中，所引入的LAL与SEQ ID NO:1具有至少70％序列同一性。在一些实施方案中，所引入的LAL包括SEQ ID NO:1的序列或由其组成。在宿主细胞天然产生LAL的一些实施方案中，在引入异源LAL之前表达天然LAL的核酸为缺失的。在某些实施方案中，所引入的LAL由表达载体表达，在所述表达载体中编码LAL的多核苷酸序列为密码子优化的。举例来说，TTA密码子已知在链霉菌属宿主细胞中对具有此类密码子的基因实施翻译控制，在LAL编码序列中可被去除和/或置换。在一些实施方案中，可对宿主细胞进行修饰，例如以去除细胞色素P450加氧酶。

异源LAL结合位点的引入

在一些实施方案中，通过将异源LAL结合位点引入宿主细胞(例如可使用包括具有LAL结合位点或经由同源重组插入的核酸的诸如人工染色体等表达载体引入LAL结合位点)来产生化合物(例如聚酮或β-内酰胺化合物)。在一些实施方案中，宿主细胞天然缺乏LAL结合位点。在一些实施方案中，宿主细胞天然包括不同于所引入的LAL结合位点的LAL结合位点。在一些实施方案中，所引入的LAL结合位点与SEQ ID NO:2具有至少80％同一性。在一些实施方案中，所引入的LAL结合位点包括SEQ ID NO:2的序列或由其组成。在一些实施方案中，所引入的LAL结合位点包括序列GGGGGT(SEQ ID NO:3)。在一些实施方案中，所引入的LAL结合位点使得化合物(例如聚酮或β-内酰胺化合物)的产量增加。在一些实施方案中，编码产生化合物的蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)的开放阅读框被定位以使得LAL结合至LAL结合位点促进表达一种或多种生物合成蛋白质(例如聚酮合酶或产生β-内酰胺化合物的蛋白质)并且因此促进化合物(例如聚酮或β-内酰胺化合物)。在一些实施方案中，LAL结合位点具有SEQ ID NO:2的序列并且LAL具有SEQ ID NO:1的序列。

在一些情况下，构建体可包括一个或多个包括异源LAL结合位点的启动子。举例来说，构建体可包括单向启动子，所述单向启动子驱动一个或多个基因(例如产生小分子的基因簇，诸如PKS基因簇或产生β-内酰胺化合物的蛋白质基因簇中的基因)的表达。在一些情况下，构建体可包括定位在两组所要表达的基因之间的双向启动子，其中双向启动子的一个部分包括第一LAL结合位点并且驱动一组基因的表达，并且双向启动子的第二部分包括第二LAL结合位点并且驱动第二组基因的表达。两组基因可为相对于彼此反平行取向的。在某些情况下，宿主细胞可包括受单向或双向启动子控制的基因簇，以及至少一个受含有LAL结合位点的启动子控制的编码异源LAL的基因。基因簇和异源LAL编码基因可位于相同构建体上，或可位于不同构建体上。LAL(例如内源性LAL或异源LAL)的表达引起异源LAL以及基因簇中的基因的表达。所表达的异源LAL可在正反馈循环中又进一步驱动基因簇中的基因和异源LAL的表达。

异源PKS基因簇的引入

在一些实施方案中，通过将编码异源PKS基因簇的核酸引入宿主细胞(例如可使用诸如人工染色体等表达载体引入核酸)来产生聚酮。在一些实施方案中，核酸还包括LAL结合位点。在一些实施方案中，LAL结合位点对于PKS基因簇为异源的。在一些实施方案中，LAL结合位点对于PKS基因簇为同源的。在一些实施方案中，还将异源LAL引入宿主细胞(例如可使用包括编码LAL的核酸的诸如人工染色体等表达载体引入LAL)。在一些实施方案中，LAL由编码异源PKS基因簇的相同核酸编码。在一些实施方案中，LAL对于LAL结合位点和/或PKS基因簇为异源的。在一些实施方案中，LAL对于LAL结合位点和/或PKS基因簇为同源的。在一些实施方案中，在不存在LAL或LAL结合位点的情况下聚酮合酶不表达。

可对宿主细胞进行修饰以优化来自异源PKS基因簇的产生。在一些实施方案中，缺失一种或多种剪裁酶(例如细胞色素P450加氧酶，cypB)。在一些实施方案中，可对宿主细胞进行修饰以包括特定等位基因，所述特定等位基因赋予抗生素抗性(例如针对链霉素(例如rpsL)、利福平(rifampicin)(例如rpoB)以及庆大霉素的抗性等位基因)，这可使得产生较高次级代谢产物效价。

异源的产生β-内酰胺化合物的蛋白质基因簇的引入

在一些实施方案中，通过将编码异源的产生β-内酰胺化合物的蛋白质基因簇的核酸引入宿主细胞(例如可使用诸如人工染色体等表达载体引入核酸)来产生β-内酰胺化合物。在一些实施方案中，核酸还包括LAL结合位点。在一些实施方案中，LAL结合位点对于产生β-内酰胺化合物的蛋白质基因簇为异源的。在一些实施方案中，LAL结合位点对于产生β-内酰胺化合物的蛋白质基因簇为同源的。在一些实施方案中，还将异源LAL引入宿主细胞(例如可使用包括编码LAL的核酸的诸如人工染色体等表达载体引入LAL)。在一些实施方案中，LAL由编码异源的产生β-内酰胺化合物的蛋白质基因簇的相同核酸编码。在一些实施方案中，LAL对于LAL结合位点和/或产生β-内酰胺化合物的蛋白质基因簇为异源的。在一些实施方案中，LAL对于LAL结合位点和/或产生β-内酰胺化合物的蛋白质基因簇为同源的。在一些实施方案中，在不存在LAL或LAL结合位点的情况下β-内酰胺化合物不表达。

可对宿主细胞进行修饰以优化来自异源的产生β-内酰胺化合物的蛋白质基因簇的产生。在一些实施方案中，缺失一种或多种剪裁酶。在一些实施方案中，可对宿主细胞进行修饰以包括特定等位基因，所述特定等位基因赋予抗生素抗性(例如针对链霉素(例如rpsL)、利福平(例如rpoB)以及庆大霉素的抗性等位基因)，这可使得产生较高次级代谢产物效价。

通过NanoString分析对mRNA转录物的定量

在一些实施方案中，可使用NanoString nCounterAnalysis(Nanostring)对基因表达(例如由异源LAL结合位点调控的一个或多个基因的表达)进行定量。NanoString nCounter测定涉及使用靶标特异性、颜色编码探针对来直接数字检测mRNA分子。不需要通过逆转录将mRNA转化为cDNA或通过PCR对所得cDNA进行扩增。使用一对带有35碱基至50碱基靶标特异性序列的报告探针和捕获探针来检测所关注的每个靶基因。此外，每个报告探针在5'端带有独特颜色编码，从而实现所关注的基因的分子条形码编码(barcoding)，同时捕获探针全部在3'端带有生物素标记，从而为靶基因连接提供分子把手(molecular handle)以促进下游数字检测。在靶mRNA与报告-捕获探针对之间的溶液相杂交之后，去除过量探针并且将探针/靶标复合物排列并固定在nCounter筒中，然后将其放于数字分析仪中以便进行图像采集和数据处理。使指示所关注的mRNA靶标的成千上万的颜色编码在筒表面上直接成像。通过计算检测到基因的颜色编码条形码的次数来测量所述基因的表达水平，并且然后将条形码计数列入表格。Kulkarni,M.Curr.Protoc.Mol.Biol.94:25B.10.1-25B.10.17(2011)中进一步描述了NanoString的方法和用途。

在一些实施方案中，使用Nanostring分析来确定位于异源LAL结合位点附近的基因簇(例如PKS基因簇或产生β-内酰胺化合物的蛋白质基因簇)的基因座的表达相对于基因座不位于异源LAL结合位点附近时的相同基因座是否上调。

实施例

方法

LAL克隆：

从WarpDrive基因组数据库或从诸如GenBank的公共来源获得FKPHD基因簇的LAL基因序列。从野生型对LAL基因进行修饰以去除单个或多个TTA密码子，所述单个或多个TTA密码子已知对链霉菌属中具有这些密码子的基因实施翻译控制。将由强组成性ermE*启动子、TTA较少的LAL以及来自噬菌体fd的转录终止子组成的合成EcoRI/XbaI有界盒克隆至pSET152中，所述pSET152具有PhiC31整合酶和attP位点、阿泊拉霉素(apramycin)抗性基因以及用于从接合型(conjugation-proficient)大肠埃希氏杆菌接合转移的oriT。还将TTA较少的LAL基因插入其他整合载体(实例pWFE1)或功能等效物，保持在强组成性启动子PermE*的转录控制下。

使用供体菌株JV36通过属间接合将克隆至pWFE1中的LAL基因组(gene panel)引入放线菌中，所述放线菌具有基因组FKPHD基因簇并且还在FKPHD生物合成基因座的启动子-操纵子区中具有预期LAL结合位点。在R2NSY培养基上在30℃或37℃下使用标准方法进行属间接合，并且在18-48小时之后用0.3-2.0mg阿泊拉霉素和0.5-1.0mg萘啶酮酸覆盖接合板。具有pWFE1-LAL质粒的放线菌接合后体划线至含有阿泊拉霉素(30-50mg/L)和萘啶酮酸(25-30mg/L)的新鲜板中以去除残余大肠埃希氏杆菌供体并且确认稳定的阿泊拉霉素抗性。

如下测试携带整合LAL质粒的重组放线菌的FKPHD产生：使放线菌的发酵剂培养物(Starter culture)在含有阿泊拉霉素(25-50mg/L)的15ml麦芽糖-酵母提取物-葡萄糖肉汤中生长。在29-30℃下2-3天之后，涂铺发酵剂培养物以便汇合成适合于产生的固体培养基(例如Medium 2或8430或其他培养基)。在30℃下生长6-7天之后，收获生长了汇合放线菌的两个琼脂板用于提取。简单来说，将生长有附着的放线菌的琼脂从皮氏板(petri plate)移去并且用100％甲醇提取。在甲醇中浸泡过夜之后，移去琼脂，并且将甲醇用水稀释至15-30％最终浓度。使用Phenomenex C18-U SPE柱(0.5g，6mL容量)从水性提取物捕获FKPHD化合物。在将具有结合的提取物的柱子用30％甲醇洗涤之后，将包括FKPHD的剩余分子用100％甲醇洗脱。

从洗出液真空移除甲醇，并且将所得粗物质溶解于DMSO中。然后根据需要将溶解的样品在甲醇中稀释(通常为10μL至490μL纯甲醇中)，并且通过LC/MS进行分析。(二极管阵列Agilent HPLC与Agilent 6120单四极杆质谱仪相配合)。使用常规分析使用AgilentMassHunter或Agilent ChemStation软件测量离子提取质量色谱图的曲线下面积(AUC)来半定量确定对改善的菌株的筛选。通过与缺乏pWFE1-LAL构建体的野生型菌株相比的按比例液体生长、分子纯化以及按重量测量以及使用内标的NMR来进行菌株改善的最终评估。

生物合成酶的缺失：

为增加特定FKPHD化合物的效价而缺失生物合成酶是用以下方式来进行：首先，通过PCR扩增侧接选择缺失的基因的起始和终止密码子的约1kb同源区。使用重叠-延伸PCR将这些同源臂组装至单一缺失盒中，并且克隆至大肠埃希氏杆菌-链霉菌属穿梭载体pJVD52.1中。如本领域已知的进行缺失，如上文所详述使用接合将带有缺失盒的载体递送至目标菌株中。值得注意的是，基于pJVD52.1的缺失策略可利用链霉素反选择，并且利用具有rpsL突变的亲本菌株。当在存在链霉素(10至100μg/mL)的情况下将菌株涂铺于适合的培养基(例如ISP2，BectonDickinson Co.)上时，在rpsL等位基因中自发突变的细菌已知为可分离的。通过用PCR扩增并且与野生型rpsL DNA序列比较确认了推定突变体放线菌缺失宿主在rpsL中具有所需病变。

然后如上使在rpsL背景中的所得缺失菌株发酵，并且针对野生型和rpsL亲本菌株提取物对含有FKPHD化合物的发酵提取物进行分析，确认特定FKPHD的效价增加可归因于特定基因缺失(例如编码预期细胞色素P450加氧酶的基因)，而不归因于基因缺失过程所需的rpsL突变。

诱导rpoB/rpsL：

具有赋予对某些抗生素的抗性的特定等位基因的放线菌与缺乏这些等位基因的菌株相比有时可产生更高的次级代谢产物效价。在使用包括链霉素(rpsL)、利福平(rpoB)、庆大霉素以及其他抗生素时可选择具有这些等位基因的自发细菌突变体。这些抗生素抗性表型单独或组合(双突变体、三突变体或更多突变体)可为有用的。改善的FKPHD产生株的分离与LAL基因簇活化组合说明了将两种重组策略组合以使菌株相较于野生型有所增强的功效和相容性。为了分离自发rpoB突变体(上文所描述的rpsL)，将所需菌株的营养菌丝体或孢子铺展至含有利福平的ISP2板，并且在存在利福平的情况下培养所得个别菌落以确认抗性。通过对来自与敏感亲本菌株平行的抗性分离株的rpoB基因座进行PCR扩增来确认rpoB中产生抗生素抗性的核苷酸病变，并且比较两者的DNA序列。然后在发酵组中比较序列确认的rpoB突变体，针对不具有抗性等位基因的野生型和LAL增强的重组菌株对增加的产生进行筛检。

启动子交换和启动子修复：

由具有野生型X15基因簇的链霉菌属菌株的基因组DNA制备PAC文库并且将其克隆至pESAC13主链中(由BioSandT(Montreal,Canada)进行)。通过菌落PCR由文库鉴定具有完整野生型X15基因簇的分子克隆。使用以下引物(参见下文)从S12基因簇对X1.1-S12启动子进行PCR扩增并且克隆至X15基因簇中。

为了引入S18 LAL转录因子，首先将Gateway受体载体(ThermoFisher,GrandIsland,NY)克隆至pESAC13主链中。使用LR克隆酶将S18 LAL转移至X15 PAC主链中。使用相同方法来修复X11.2 PAC中的非规范LAL启动子序列。使用DNAWorks网站服务器(mcl1.ncifcrf.gov/dnaworks/)通过合成基因构建设计来产生具有修复过的LAL位点的X11.1和X11.2启动子。

>PAC_HA_X11.1_启动子_G

>PAC_HA_X11.1_启动子_G_4bp

>PAC_HA_X11.2_启动子_A

3'>PAC_HA_X11.2_S12_启动子SEQ ID NO:42:5'-GCGTTCGGCATTGACGCGAAGCAAGTCATGAATCGGCTGAATCAATTCCGCGCGCGACATTCA TACCCTTCCGGCGAAGTGCAGTTCACCCGGTAATGCATTCCGGACCGTAGCAGTCCGATACAGACGTCCGCCATGCCGTGCCACCCTTGTTTTTCACCCCCCTACGCCCGTTTCGCCTGGCCGGAAACCTAGGGGGTTGCGTGGAAAGCACCGGCGGGTGTTCGCTTGCACAGCGCCACCTCGGGCATTTTCTGGATGCGCGAGCAATACCTTTCCGGGAGAGGTGAATGGCTTCCAAAAGTCCCCGCCCAGGGTCCGAGAGAGCGGGTTCTGCGATTTCCCGGGCA-3'

由链霉菌属基因组DNA产生野生型X2基因簇并且由Intact Genomics,Inc.(St.Louis,MO)克隆至修饰过的pCC1主链中。由UniLAL-S18-LAL表达载体PCR扩增UniLAL启动子并且克隆至X2基因簇中。

实施例1.使用LAL转录调控因子作为一般诱导和过表达策略

构建受一个或多个双向启动子控制的基因簇。具体地说，产生FkPhD基因簇的集合(图1A)，所述FkPhD基因簇各自包括如启动子区1和启动子区2所示的两个双向启动子。每个启动子含有一个或多个选自图1B中所示的那些的LAL结合域。从FK基因簇启动子区提取的此类推定LAL结合域的集合的比对揭示了保守区域。如图1C中所示，一般实验方法涉及将密码子优化的LAL组亚克隆至由例如强ermE*启动子驱动的整合载体中。

通过使包括可发布(publication-quality)组装的基因组的高通量基因组数据库中的所有LAL分化来为这些实验选择LAL(图2)。使用雷帕霉素LAL(S9)的螺旋-转角-螺旋基序使这些LAL分化，产生设计查询。FkPhD LAL被显示分化在一起并且在序列水平上不同于其他I型PKS-相关LAL，诸如pikD(图3)。

实施例2.LAL的表达驱动由生物合成基因簇产生聚酮

如图4中所呈现，使一大组LAL在X1家族分子(化合物1、化合物2以及化合物3)的天然链霉菌属产生株中表达。具体地说，在S22天然菌株中观测到X1FkPhD基因簇，并且然后使一组LAL接合至S22中。针对增强的聚酮表达对所得菌株进行测定。通过LC/MS评估X1基因簇家族产物(即，化合物1、化合物2以及化合物3)的产生。结果表明一些LAL充当抑制子并且与野生型(即，在不存在LAL的情况下)相比抑制聚酮表达。在一些情况下，与野生型相比LAL显著增加聚酮的表达。因此，这些结果表明某些LAL在此背景下为组成活性的。具有组成性表达S18LAL的整合载体的接合后菌株(exconjugate)S363产生最高水平的化合物1、化合物2以及化合物3。通过将S18过表达与对生物合成基因座的其他修饰(包括核糖体蛋白rpsL突变(例如由链霉素诱导)和P450缺失组合)进一步优化了所需产物化合物2的产生(图5)。所得菌株S583产生了增加的化合物2产生。

实施例3.用于置换生物合成基因簇中的沉默LAL启动子的启动子工程化

X15基因簇包括不含规范LAL结合位点的沉默启动子。将此启动子用X1启动子置换，所述X1启动子包括用于产生受X1启动子控制的重构X15基因簇的LAL结合位点(图6)。然后通过Gateway克隆对包括重构X15基因簇的pESAC13表达载体进行修饰以引入其中S18LAL的表达受ermE*启动子控制的盒。然后使所得表达载体接合至S942细胞中(生二素链霉菌的衍生物)用于异源表达S18 LAL和X15基因簇中的生物合成基因。

如图7中所示，将X15基因簇再工程化以用X1启动子置换X15启动子引起X15基因簇基因的表达以及下游高水平的X15生物合成产物产生。顶行的图片示出了单独的S942作为对照。中间的图片示出了在S18 LAL由载体主链表达的情况下通过使S942接合至X1基因簇(编码化合物1和化合物2)所产生的菌株。通过自上而下蛋白质组学分析观测了化合物2表达。此数据证实在异源产生菌株中，如通过存在功能性LAL结合位点所确定，在存在完整启动子的情况下LAL表达可诱导菌株的PKS表达。底部图片示出了在内源性启动子与X1启动子交换并且S18 LAL由载体主链表达的情况下通过使S942接合至X15基因簇所产生的上文所描述的菌株。这些数据表明X15产生匹配或超过了经过工程化以由X1.1基因座产生化合物2的S942细胞的产生。因此，数据证实启动子置换和LAL表达可在异源产生株中诱导由沉默基因簇产生PKS表达。

实施例4.FK双向启动子

分析了来自雷帕霉素、X1、X11.1、X22.1、X15以及X23.1生物合成基因簇的启动子的序列，以使保守序列元件与天然和/或异源产生相关联(图8)。鉴定了三种一般类别的双向FkPhD启动子：(1)具有包括功能性LAL结合位点的完整启动子序列的高度活性启动子(例如雷帕霉素和X1)，(2)产生受损的较低活性启动子，其中在核心LAL结合位点中观测到突变(例如X11.1和X22.1)，以及(3)与共有序列有严重偏差的沉默启动子(例如X15和X23.1)。通常，与共有启动子序列的偏差与减少的化合物产生相关联。

两种新颖和相关FkPhD基因簇的主要双向启动子X11.1和X11.2内的LAL结合位点的序列比对展示若干突变(与共有LAL结合位点的偏差)，这似乎调控启动子强度和所得产量。举例来说，鉴定出降低启动子强度并且导致不良FkPhD表达的突变(图9)。在X11.1的情况下，野生型启动子缺乏保守ACAC基序和来自核心LAL操纵子序列(AGGGGG)的G。在X11.2的情况下，野生型启动子缺乏来自核心LAL操纵子序列的A。我们将X11.1和X11.2序列恢复至共有序列以产生以Seq1、Seq2以及Seq3形式示出的序列，并且检验了修复这些突变是否影响在X11.2基因簇中的表达。

LAL结合序列中恢复的序列病变产生增加的聚酮合酶产量。图10示出了X1.1启动子交换、X11.1启动子加上恢复的核心G和ACAC基序(Seq2)以及X11.2启动子加上恢复的核心LAL结合序列(Seq3)的A情况下的X11.2 FkPhD表达的比较。与野生型(WT)11.2相比之下，Seq2启动子产生FkPhD产量的显著增加。来自核心LAL结合序列(Seq3)的A的恢复使FkPhD产量增加超过Seq2启动子。总X1启动子交换产生最大FkPhD产量。这些数据表明恢复突变的保守启动子序列为一种可靠的增加FkPhD产量的方法。这些数据还为我们对核心LAL结合位点序列的限定提供实验支持。

实施例5.UniLAL变体

战略剖析启动子区1和区2双向启动子，得到用于后续功能测试的四种启动子设计(即，PC_L、PC_R、PT_L、PT_R)(图11A)。每个UniLAL变体包括-10和-35位点以及LAL结合位点。图11B获得了UniLAL剖析的逻辑。将UniLAL启动子限定为核糖体结合位点(RBS)、LAL结合位点和/或主要原核启动子元件，诸如-10和-35位点。在一些情况下，LAL结合位点重叠或替换-10或-35位点。除这些主要元件的组成和序列之外，间隔和取向(正义/反义)也可能为特定设计的功能必不可少的。

评估了UniLAL变体的每一种的启动子强度。为了排列4种UniLAL设计(PC_L、PC_R、PT_L、PT_R)的次序，将每个UniLAL启动子亚克隆在S18 LAL的前面。使所得整合表达质粒接合至S22，这产生化合物2家族的化合物。因而，预期特定接合体中的UniLAL启动子由S18 LAL活化以形成前馈回路从而最大化LAL表达、基因簇活化并且产生化合物2产量的增加。图12中示出了由UniLAL启动子中的每一者诱导的化合物4、化合物1、化合物2以及化合物3的产生。这些数据表明启动子区1设计(即，PC_L、PC_R)对于驱动LAL表达和基因簇产生为最有效的。

还测试了此方法在天然不包括LAL调控因子的一般沉默生物合成基因簇中驱动聚酮产生的能力(图13)。当修饰过的X2基因簇在存在S18 LAL的情况下表达时，通过自上而下测定观测到稳健的X2表达。

实施例6.正反馈过表达策略

设计LAL调节子以形成正反馈循环(图14)。此方法涉及将LAL结合位点放于双向启动子中以及编码S18 LAL的基因的上游。因而，LAL(例如野生型LAL)的表达可诱导来自在PKS生物合成基因簇中的LAL结合位点以及在S18 LAL的启动子中的那些LAL结合位点中的每一者的表达，这继而可进一步活化来自LAL结合位点的表达，由此产生正反馈循环。这可产生强过表达(例如比由PermE*启动子驱动的表达更强)。另外，此策略可容许根据前体通量和/或翻译后修饰确定繁殖期的时间。图15表明反馈循环可用于增强聚酮产生。这些数据表明反馈循环和/或组成性LAL表达(经由ErmE*启动子)可诱导超过单独天然菌株(S22)的PKS表达。组成性和正向反馈表达可产生额外的PKS表达。

在一个实例中，将X2生物合成基因簇的单兆顺反子(mega-cistron)以及S18 LAL的转录置于X1 UniLAL启动子的控制下，后者有效建立自动调控操纵子。LAL的转录将因LAL本身的表达而进一步加强。使UniLAL启动子调控的S18 LAL和X2 PKS构建体依序与天然X2基因簇一起接合至S1496中以充当对照。

实施例7.X1启动子敲入FKPHD基因簇中

替代插入X1启动子以置换具有FkPhD基因簇的BAC或PAC上的野生型启动子以便进行异源表达(例如如以上实施例4中所描述)，将X1启动子敲入天然菌株(S61)的内源性基因座，其编码新颖FkPhD基因簇X11(图16)。pJVD具有温度敏感性复制起点、阿泊拉霉素选择标记物以及rpsLrplS反选择基因。将添加有侧接X11的相对PKS兆开放阅读框(mega orf)的起始密码子的1000bp DNA序列的X1启动子克隆至pJVD52.1pJVD中，并且使此载体接合至S61中并且在30℃的许可温度下针对阿泊拉霉素抗性进行选择。通过在39℃下生长并且维持阿泊拉霉素选择迫使发生染色体整合。然后在不存在阿泊拉霉素的情况下使细胞传代，然后用链霉素攻击以偏向于针对所需分辨率双交换事件选择的克隆，从而使得X1启动子精确地无疤痕插入宿主染色体中以置换WT X11启动子。通过影印培养法(replica plating)以确认对阿泊拉霉素的易感性并且通过预期尺寸的5'和3'扩增子的连接PCR(junction PCR)检查来确认菌落为真正的pX1敲入者。

实施例8.前馈/UniLAL(单向LAL敏感)启动子法

S18 LAL的前馈构型

最初将(TTA-，合成)S18源性LAL基因放在S12源性“核心”UniLAL-左侧和右侧启动子的转录控制下。经由两步亚克隆程序使S18 LAL在起始密码子处被S12生物合成基因簇的左侧和右侧PKS转录物取代。首先，将含有S18 LAL基因的除5'269个碱基外的所有碱基的BamHI至SpeI片段亚克隆至BamHI/XbaI消化的pWFE1 cTR表达载体(其具有以下用于接合递送至放线菌中的特征：噬菌体TG1整合酶基因和attP、大肠埃希氏杆菌转移起点[oriT]以及赋予硫链丝菌素抗性的基因)中。然后，用AarI和BamHI限制性核酸内切酶消化中间质粒，并且使用来自New EnglandBiolabs的2X预混液(Master Mix)根据其说明书经由3部分等温吉普森组装(3-part isothermal Gibson assembly)将构成左侧或右侧UniLAL启动子的PCR扩增子加上S18 LAL中丢失的在基因中从起始密码子到BamHI位点的约269个碱基缝合在一起。为了获得第一扩增子，使用以下引物对使用pWarp因子1X 1基因组TAR克隆作为模板对UniLAL左侧启动子进行PCR扩增并且添加有S18LAL基因的5'端：

FF核心SEQ ID NO:43gcgcccaccttaatcgcaggtgTCCACGCAACCCCCTAGGTTTCC

L_Aar_F GGCCAGG

SEQ ID NO:44gttcatagctctccacggcaggcatTCATACCCTTCCGGCGAAGTG

C-L_S18_R CAGTTCACCCGGT

类似地，使用以下引物对UniLAL右侧启动子进行扩增并且添加有S18 LAL基因的5'端：

SEQ ID NO:45gcgcccaccttaatcgcagGTGCCACCCTTGTTTTTCACCCC

FF核心CCT

R_Aar_F ACGCCCGT

SEQ ID NO:46gttcatagctctccacggcaggcatTCACCTCTCCCGGAAAGGTATT

C-R_S18_R GCTCGTGCATCCA

对于第二扩增子，使用以下引物对使用pSET152 S18 LAL(TTA-)作为模板扩增S18LAL基因的5'端并且在5'端添加有UniLAL左侧或UniLAL右侧序列：

SEQ ID NO:47actgcacttcgccggaagggtatgaATGCCTGCCGTGGAGAGCTAT

C-L_Bam_F GAACTGGACGC

S18LAL_Bam_R SEQ ID NO:48CCGGGAGGGCCATGGAGACCGGA

或

SEQ ID NO:49agcaatacctttccgggagaggtgaATGCCTGCCGTGGAGAGCTAT

C-R_Bam_F GAACTGGACGC

S18LAL_Bam_R SEQ ID NO:50CCGGGAGGGCCATGGAGACCGGA

使用来自New England Biolabs的Q5 Hot Start DNA聚合酶根据其说明书进行所有PCR扩增(同时包括GC增强子补充物)。通过标准琼脂糖电泳分离AarI/BamHI消化的载体以及扩增子并且使用Zymoclean^TM凝胶DNA回收试剂盒从琼脂糖纯化。将十分之一的吉普森组装反应物转化至化学感受态NEB 10β大肠埃希氏杆菌中并且铺展至氯霉素(25μg/mL)LB板上。在37℃下孵育过夜之后，将氯霉素抗性菌落挑取至补充有25μg/mL氯霉素的鲁里亚贝塔尼肉汤(Luria Bertani broth)的5mL培养物中并且在37℃下振荡过夜。使用QIAprepSpin Miniprep试剂盒分离质粒，然后写信索取GeneWiz,Inc的桑格序列(Sangersequence)验证。

实施例9.用“核心左侧”UniLAL启动子交换X2.1生物合成基因簇的天然启动子

放线菌S17的基因组DNA的下一代测序(NGS)揭示具有聚酮合酶的生物合成基因簇，这类似于但不同于已知编码天然产物美立霉素(meridamycin)的信息的生物合成基因簇。此基因簇被指定为X2(并且随后当由S55的NGS鉴定第二近乎相同的基因簇(X2.2)时为X2.1)。为了获得X2.1生物合成基因簇的分子克隆，在存在0.5％w/v甘氨酸的情况下对S17进行液体培养。将菌丝体生物质冷冻并且送至Lucigen Corporation，该公司提取并且随机剪切基因组DNA，然后用它在其宿主大肠埃希氏杆菌菌株复制器v2.0(其基因型为rpsL)中在其穿梭载体pSMART BAC-S(其为能够通过添加噬菌体ΦC31的整合酶基因和attP、大肠埃希氏杆菌oriT以及赋予阿泊拉霉素抗性的基因来接合和整合至链霉菌属中的常规BAC载体)中构建BAC文库。以排列于384-孔板中的大肠埃希氏杆菌甘油储备液的形式供应文库。使用从X2.1基因簇的分别用HEX和FAM氟标记的近端5'或3'侧接区设计的探针通过双色TaqMan测定鉴定具有完整X2.1基因座的克隆。使用IDT的软件设计引物和探针，然后从其定购。为了鉴定双阳性克隆，结合引物对和探针以及快速高级预混液使用1μL的甘油储备液作为模板。在Bio Rad CFX384 Touch^TM实时PCR检测系统中进行循环和实时荧光监测。在Tacgen通过桑格末端测序确认由双阳性克隆制备的BAC DNA为正确的，并且最终在Yale YCGA通过Illumina和PacBio NGS进行彻底检验。

对X1.1 UniLAL左侧启动子进行PCR扩增(使用Q5 DNA聚合酶和作为模板的pWF1X1.1质粒)并且在5'和3'端添加分别在X2.1 KCDA基因的起始密码子上游和恰好在下游的60bp序列。所用的引物对(以大写字母/小写字母表示的侧接序列表示退火至X1核心-左侧UniLAL启动子的区域；起始反密码子以粗体表示)为：

SEQ ID NO:51CTACCCGAATACATCGCCTTCTGGGGCCCAGCCCAAACCAGC

X2.1_ULL-Run_F GCCCTCATCCACACtccacgcaaccccctaggtttccggc

SEQ ID NO:52gCGGCCCACAACGTGCACGAGCGTGGCGATATCGGACGCG

X2.1_ULL-Run_R GAAAGAACCAGCGTGCTCATtcatacccttccggcgaagtgcagttcaccc

通过结合侧接预期插入位点的以下引物对使用0.5μL培养物作为模板进行10μLPCR扩增来获得对X1核心-左侧启动子恰好在X2.1 KCDA起始密码子处插入的证实：

SEQ ID NO:53CGCCGTCTACCCAGCCCAAAG

X2.1_HandR_cPCR_2F CCAGC

SEQ ID NO:54CGGGTTCGTGGTGCGGCATCC

X2.1_HandR_cPCR_2R ATTCG

根据制造商的条件用ExoSAP-IT处理长度预期为476bp的扩增子以降解过量引物和dNTP，并且写信索取GeneWiz Inc的桑格序列验证(对于两个个别读段单独使用每个引物)。将源自于克隆中具有确切预期序列(在起始密码子处融合至X2.1 KCDA基因的X1核心-左侧UniLAL启动子)的一种克隆的250ml LB肉汤培养物馈入BAC XTRA纯化系统(根据制造商的条件)以分离完整X2.1/核心-左侧UniLAL BAC DNA。使用此DNA制剂来电转化S181大肠埃希氏杆菌，允许回收S181大肠埃希氏杆菌，然后在37℃下用氯霉素(25μg/mL)和阿泊拉霉素(100μg/mL)LB琼脂板选择过夜。将菌落挑取至5ml补充有氯霉素和阿泊拉霉素的LB肉汤中，生长过夜，然后用于接合至各种异源产生菌株中。

实施例10.经由dsDNA重组工程化进行启动子置换

为了置换X15的内源性启动子，首先使用dsDNA重组工程化将X15 PAC工程化以具有正/负选择盒，由此实现第二轮的无缝DNA插入。赋予具有含完整X15启动子的PAC的大肠埃希氏杆菌以电转感受性，如本领域已知的用pKD46转化(例如如Wanner和Datsenko；ProcNatl Acad Sci U S A.(2000)97:6640-5中所描述)并且在30℃下用卡那霉素(50μg/mL)和卡本西林(carbenicillin)(100μg/mL)LB琼脂板共选择。通过使用Phusion聚合酶(NEBBiosystems,Beverly,MA)，对质粒模板pKDCR(用于rpsL和氯霉素抗性基因的双顺反子表达)进行PCR扩增来产生正/负选择盒，所述正/负选择盒含有与X15 NRPS基因和PKS-A同源的50bp悬突的DNA寡核苷酸。

将来自PCR反应的扩增子进行琼脂糖凝胶纯化并且提取。将具有X15 PAC和pKD46的大肠埃希氏杆菌饱和培养物1:100稀释至补充有卡那霉素和卡本西林以及1％w/v L-阿拉伯糖的LB Lenox肉汤中。将培养物在30℃下以250rpm振荡，直至OD600达到0.5，此时如Datsenko等人所描述使用冷的蒸馏dH₂O洗涤使细胞为电转感受态。使用处于“EC”设定的Bio RAD MicroPulser^TM电穿孔器将100ng的纯化选择盒电穿孔至大肠埃希氏杆菌中。允许将大肠埃希氏杆菌在30℃下在1mL的SOC中回收1小时，铺展至氯霉素(25μg/mL)和卡本西林(100μg/mL)LB琼脂板上并且在30℃下选择过夜。将菌落挑取至补充有卡那霉素、氯霉素以及卡本西林的LB肉汤的1mL培养物中并且使其在30℃下生长过夜。对正/条件性负选择盒在X15主要启动子基因座处插入的证实是通过连接PCR来确认的。

使对于预期5'接点和3'接点扩增子双阳性(如通过琼脂糖电泳来判断)的培养物如上文所述在含有卡那霉素、卡本西林以及阿拉伯糖的LB Lenox中生长并且使其为电转感受态。对S12启动子进行PCR扩增(使用Q5 DNA聚合酶和作为模板的pWF1.1 X1.1质粒)并且在5'和3'端添加X15 NRPS基因和PKS-A的50bp同源臂。

允许将电穿孔细胞在振荡下在37℃下在1mL的SOC中回收1小时，然后在37℃下用卡那霉素(50μg/mL)+链霉素(250μg/mL)LB琼脂板选择过夜。将菌落挑取至补充有卡那霉素(50μg/mL)和阿泊拉霉素(100μg/mL)的LB肉汤的1mL培养物中并且使其在振荡下在37℃下生长过夜。对S12启动子在X15主要启动子基因座处插入的证实是通过连接PCR来确认的。

实施方案11.经由ssDNA重组工程化和吉普森克隆进行启动子置换

在另一技术中，为了置换X15的内源性启动子，首先使用ssDNA重组工程化将X15PAC工程化以引入侧接内源性X15主要启动子基因座的富AT PmeI限制位点(5'-GTTTAAAC-3')。赋予具有含有完整X15启动子的PAC的大肠埃希氏杆菌以电转感受性，用pKD46的exo和γ基因已缺失的变体pKD46β转化(Wanner和Datsenko；Proc Natl Acad Sci U S A.(2000)97:6640-5)，并且在30℃下用卡那霉素(50μg/mL)和卡本西林(10μg/mL)LB琼脂板共选择。将具有X15PAC和pKD46β的大肠埃希氏杆菌饱和培养物1:100稀释至补充有卡那霉素和卡本西林以及1％w/v L-阿拉伯糖的LB Lenox肉汤中。将培养物在30℃下以250rpm振荡，直至OD600达到0.5，此时如Datsenko等人所描述使用冷的蒸馏dH₂O洗涤使细胞为电转感受态。将细胞再悬浮于50μL的1μM ssDNA寡核苷酸溶液中并且使用处于“EC”设定的Bio RADMicroPulser^TM电穿孔器电穿孔至大肠埃希氏杆菌中。允许将大肠埃希氏杆菌在30℃下在1mL的SOC中回收1小时，铺展至卡那霉素(25μg/mL)LB Lennox上过夜至饱和。对PmeI位点在X15主要启动子基因座处的插入的证实是通过将等位基因-特异性PCR与连续两轮有限稀释克隆方案组合来确认的，所述有限稀释克隆方案允许经成功修饰的具有单一PmeI位点的X15PAC的克隆选择。然后重复此方案以引入第二侧接PmeI位点。测试了合成的具有5'硫代磷酸根帽的“正义”与“反义”寡核苷酸以确定PAC的滞后链(lagging strand)。

ssDNA寡核苷酸(PmeI位点加下划线)

5'_X15_PmeI_正义

5'_X15_PmeI_反义

3'_X15_PmeI_正义

3'_X15_PmeI_反义

现经修饰为具有PmeI位点的X15 PAC为用PmeI线性化的。对S12启动子进行PCR扩增(使用PQ5DNA聚合酶和作为模板的pWF1.1 X1.1质粒；下文列举引物)并且在5'和3'端添加X15 NRPS基因和PKS-A的50bp同源臂。

使用吉普森组装超级试剂盒(SGI-DNA,Inc.)使用所建议的方案通过吉普森克隆对S12启动子和PmeI线性化的X15 PAC进行无缝克隆。在电穿孔之后，如上所述鉴定恰当的克隆。

实施例12.LAL的表达驱动由β-内酰胺基因簇产生β-内酰胺化合物

使用先前描述的pX1-S18 LAL体系来驱动新颖β-内酰胺基因簇WAC292的过表达(图17A)。将pX1启动子的三个拷贝亚克隆至WAC292中以驱动在5个启动子位点中的3个处的预期核心生物合成操纵子从而产生WAC292-p2p3p5。将S18 LAL克隆至WAC292-p2p3p5的主链上，并且使所得工程化的BAC接合至S5627，S5627是一种已知的产生β-内酰胺的菌株，其中内源性β-内酰胺簇缺失，由此去除了所有内源性β-内酰胺活性。在发酵后，使用针对簇的19个位点设计的定制探针组将WT和WAC292-p2p3p5 S5627菌株的Nanostring分析mRNA相比较。与WAC292-WT相比，在WAC292-p2p3p5中连接至P2、P3以及P5启动子的转录物显著上调(图17B)。

产生WAC292-p2p3p5的克隆方案

在独特的PacI和SwaI(NEB)位点处将具有β-内酰胺基因簇的YAC/BAC接合载体pWF10线性化。使用pWFE1 S18LAL作为模板对S18LAL表达盒(ermE*启动子/合成的不含TTA密码子的S18 LAL基因/噬菌体fd转录终止子)进行PCR扩增并且使用Q5 HotStart DNA聚合酶在每个末端添加PacI位点的5'近端和SwaI位点的3'近端的约40bp载体序列。

将限制消化的BAC和PCR扩增子混合成总共5μl并且添加相等体积的NEBuilderHiFi DNA组装2X预混液，此后在50℃下进行一小时反应。将1.5μl的完全反应物添加至70μl的电转感受态NEB 10-β大肠埃希氏杆菌中，混合，将内容物保藏于Bulldog Bio 0.1cm空隙电穿孔杯中并且使用设定至“EC1”参数的BioRad微脉冲发生器电穿孔器转化。使用930μl的SOC培养基再悬浮电穿孔的细胞并且将全部体积吸移至50ml Falcon管中。将管放于设定在37℃的振荡孵育器中并且允许将电穿孔的大肠埃希氏杆菌回收1小时。将200μl的回收的细菌铺展至五个LB琼脂-100μg/ml阿泊拉霉素皮式培养皿上。将培养皿颠倒并且在37℃下孵育过夜。将菌落挑取至补充有100μg/ml阿泊拉霉素的LB肉汤的1ml培养物中并且在振荡下在37℃下孵育过夜。在PCR反应中将1μl的饱和细菌培养物用作模板以扩增整个S18 LAL表达盒。

将所得扩增子用dH₂O 1:144稀释，将14.5μl的稀释扩增子添加至0.5μl的一系列100μM测序引物中并且写信索取桑格验证以确保在克隆过程中未将错误引入S18LAL表达盒中。使序列完美克隆大规模生长(300ml培养物制剂)并且使用Macherey Nagel NucleobondXtra BAC试剂盒对YAC/BAC进行纯化。

在37℃下同时用与Alt-R CRISPR-Cas9tracRNA和重组化脓性链球菌(S.pyogenes)Cas9蛋白复合的三种Alt-R向导crRNA(所有均来自Integrated DNATechnologies)将纯化的YAC/BAC消化一小时。将向导cRNA设计成在β内酰胺生物合成基因簇的双向启动子2、3以及5内切割。对三重Cas9消化的BAC载体进行乙醇沉淀并且再悬浮于20μl的10mM Tris pH 8.0中。同时，产生三个PCR扩增子、两个酵母营养缺陷型标记物以及单个X1双向核心启动子用于在共转化至酿酒酵母(S.cerevisiae)中后在三个Cas9消化位点处进行“空位修复”插入。

使用以上引物对、Q5HotStart DNA聚合酶以及作为模板的pRS414、pRS415以及pWF1X1，获得扩增子并且进行凝胶纯化(使用Zymo Research凝胶DNA回收试剂盒)。

以>10X摩尔过量将三个扩增子添加至三重消化的β内酰胺YAC/BAC中并且使用Geitz实验室的乙酸锂/PEG法转化至BY4727酿酒酵母(ATCC 200889)中。在热激之后，将酵母从锂/PEG/DNA混合物中转化出来，使酵母在10,000X g下集结成球粒30秒并且再悬浮于1ml的SD TRP不含LEU肉汤中。然后将酵母铺展至四个SD TRP不含LEU琼脂板(Teknova)上，将板颠倒，并且在30℃下孵育直至菌落可见(约四天)。拯救残留在酵母菌落的细胞中的YAC/BAC并且如下转化至大肠埃希氏杆菌中：将菌落挑取至含有20μl 200mM乙酸锂/1％SDS的微量离心管中，添加五个或六个100μm直径酸洗瓷珠(OPS Diagnostics)并且将内容物在最大rpm下涡旋5分钟。将1μl的裂解物电穿孔至电转感受态NEB10-β大肠埃希氏杆菌中并且在LB琼脂100μg/ml阿泊拉霉素皮式培养皿上进行选择。使用菌落在补充有100μg/ml阿泊拉霉素的LB肉汤中接种1ml培养物，并且从这些培养物使用1μl在PCR(Bioline MyTaqHotstart Red 2X预混液)中作为模板以验证预期用于X1双向核心(P5)和TRP(P2)以及LEU(P3)标记物插入的5'及3'接点的存在。

对六个接点为阳性的一个克隆大规模生长(300ml培养物制剂)并且将YAC/BAC纯化，用过量的BstZ17I和HpaI限制酶(NEB)消化，乙醇沉淀，并且再悬浮于50μl的10mM TrispH 8.0中。对于X1双向核心启动子的多重插入，在两个单独反应中，将启动子扩增并且添加BstZ17I和HpaI消化位点近端的约30bp 5'和3'序列，并且凝胶纯化。

以十倍摩尔过量将X1双向启动子扩增子添加至BstZ17I/HpaI消化的BAC中，对混合物进行乙醇沉淀并且再悬浮于5μl 10mM Tris pH 8.0中。添加5μl的SGI吉普森组装超级试剂盒“A混合物”，混合，并且在37℃下孵育5分钟，在75℃下热杀20分钟，逐步降至60℃并且使温度以0.1℃/秒的速率降至4℃。然后添加10μl的“B混合物”并且允许反应在45℃下进行15分钟。将1.5μl的完全反应物电穿孔至70μl的电转感受态NEB10-β大肠埃希氏杆菌中并且在100μg/ml阿泊拉霉素LB琼脂皮式培养皿上进行选择。使用菌落在补充有100μg/ml阿泊拉霉素的LB肉汤中接种1ml培养物并且在PCR中使用1μl作为模板以确认指示替代天然β内酰胺的双向启动子2和3的X1双向启动子的插入的四个新接点的存在。

对在P2、P3以及P5处插入的X1双向核心启动子周围的基因座进行PCR扩增并且用作桑格序列QC的模板以确保在克隆过程中未引入错误。

菌株构建和Nanostring法

通过从大肠埃希氏杆菌供体接合至已通过同源重组缺失内源性碳青霉烯簇的产碳青霉烯菌株链霉菌属某种S5627中来使构建体WAC292-p2p3p5动员。用含有50μg/ml阿泊拉霉素的培养基对所得接合后体进行选择。使所得菌株WAC292-p2p3p5-S5627在带挡板的125ml烧瓶中在25ml WDSM1培养基中在种菌培养物中生长48h，然后在无挡板的125ml烧瓶中在25ml发酵培养基FMKN1中再亚培养(5％接种体)48h。将1ml样品移至冰上并离心以使菌丝体集结成球粒(湿重约150mg)。将球粒再悬浮于裂解缓冲液RA1(Macherey-Nagal740955.50)中并且转移至FastPrep裂解基质B管(MP Biomedical 116911050)。以速度30将菌丝体在Qiagen TissueLyser II中通过珠粒击打破碎5min。通过离心使细胞碎片集结成球粒并且利用1μl的细胞裂解物进行杂交以用于Nanostring分析(遵循制造商的说明书)。产生Nanostring探针汇集物并且根据制造商的说明书来使用。

Nanostring数据分析和归一化

将RCC文件输入nSolver 3.0(Nanostring Inc)。然后将原始计数数据输出到Excel中。将以下基因中的一种或这些基因的集合的中值用作归一化因子：GAPDH、HrdB、phiC31int、AprR。通过用所关注的测量值除以归一化因子，取所述值以2为底的对数并且添加换算常数10来进行归一化。

其他实施方案

应了解，虽然已结合详细说明描述了本公开，但前述描述旨在说明而不是限制本公开的范围，本公开的范围由随附权利要求书的范围界定。其他方面、优点以及变化在以下权利要求书的范围内。

本领域技术人员将认识到或能够仅仅使用常规实验确定本文所描述的根据本发明的特定实施方案的许多等效物。本发明的范围不旨在限于以上描述，而是如随附权利要求书中所阐述。

在权利要求书中，除非由上下文指示为相反的或以其他方式显而易见，否则诸如“一个(种)(a/an)”和“所述”等冠词可意指一个(种)或超过一个(种)。除非上下文指示为相反的或以其他方式显而易见，否则在权利要求书或描述中，如果在给定产物或方法中存在、采用一个、超过一个或所有组成员或一个、超过一个或所有组成员以其他方式与给定产物或方法有关，那么认为满足在一个或多个组成员之间包括“或”。本发明包括在给定产物或方法中存在、采用刚好一个组成员或刚好一个组成员与给定产物或方法有关的实施方案。本发明包括在给定产物或方法中存在、采用超过一个或所有组成员，或超过一个或所有组成员以其他方式与给定产物或方法有关的实施方案。

还应注意，术语“包含”旨在为开放性的并且允许但不要求包括额外的元素或步骤。当本文中使用术语“包含”时，由此还涵盖和公开了术语“由……组成”。

在给出范围的情况下，包括终点。此外，应了解，除非另外指出或由上下文和本领域技术人员所了解以其他方式显而易见，否则在本发明的不同实施方案中以范围表示的值可采取所陈述范围内的任何具体值或子范围，除非上下文另外明确指示，否则以范围下限的单位的十分之一为间隔。

此外，应了解，属于先前技术范围内的本发明的任何特定实施方案均可明确地排除在权利要求中任何一项或多项之外。由于此类实施方案被认为是本领域技术人员已知的，所以即使本文中未明确阐述排除，也可将它们排除。本发明组合物的任何特定实施方案(例如任何多核苷酸或由其编码的蛋白质；任何产生方法；任何使用方法)均可由于任何原因排除在任何一项或多项权利要求之外，无论是否与存在先前技术有关。

Claims

1.一种宿主细胞，其经工程化以表达重组LAL。

2.如权利要求1所述的宿主细胞，其中所述宿主细胞天然缺乏LAL。

3.如权利要求1或2所述的宿主细胞，其中所述宿主细胞天然缺乏LAL结合位点。

4.如权利要求1至3中任一项所述的宿主细胞，其中所述宿主细胞经工程化以在核酸中含有LAL结合位点。

5.如权利要求4所述的宿主细胞，其中所述重组LAL结合至所述LAL结合位点促进所述核酸的表达。

6.如权利要求5所述的宿主细胞，其中所述核酸编码产生化合物的蛋白质。

7.如权利要求1至6中任一项所述的宿主细胞，其中所述重组LAL包含与SEQ ID NO:1(S18LAL)的序列具有至少70％序列同一性的部分。

8.如权利要求7所述的宿主细胞，其中所述重组LAL包含具有SEQ ID NO:1的序列的部分。

9.如权利要求8所述的宿主细胞，其中所述重组LAL具有SEQID NO:1的氨基酸序列。

10.如权利要求1至9中任一项所述的宿主细胞，其中所述宿主细胞为细菌。

11.如权利要求10所述的宿主细胞，其中所述细菌为放线菌。

12.如权利要求11所述的宿主细胞，其中所述放线菌为生二素链霉菌、吸水链霉菌或马来亚链霉菌。

13.如权利要求12所述的宿主细胞，其中所述放线菌为S1391、S1496或S2441。

14.如权利要求1至13中任一项所述的宿主细胞，其中所述宿主细胞已进行修饰以增强产生化合物的蛋白质的表达。

15.如权利要求14所述的宿主细胞，其中所述宿主细胞已如下进行修饰以增强产生化合物的蛋白质的表达：(i)缺失表达产生化合物的蛋白质的内源性基因簇；(ii)插入表达产生化合物的蛋白质的异源基因簇；(iii)使所述宿主细胞暴露于抗生素攻击；和/或(iv)引入与同源启动子相比使化合物的表达增加至少2倍的异源启动子。

16.如权利要求4至15中任一项所述的宿主细胞，其中所述核酸还包含一个或多个额外的LAL结合位点。

17.如权利要求4至16中任一项所述的宿主细胞，其中所述核酸还包含编码LAL的基因。

18.如权利要求17所述的宿主细胞，其中编码LAL的所述基因受包含LAL结合位点的启动子的控制。

19.如权利要求16至18中任一项所述的宿主细胞，其中所述LAL结合位点中的至少一个包含在启动子中。

20.如权利要求19所述的宿主细胞，其中所述启动子为双向启动子。

21.一种编码LAL的核酸，其中所述LAL包含与SEQ ID NO:1的氨基酸序列具有至少70％序列同一性的部分。

22.如权利要求21所述的核酸，其中所述LAL包含具有SEQ IDNO:1的序列的部分。

23.如权利要求22所述的核酸，其中所述LAL具有SEQ ID NO:1的序列。

24.如权利要求21至23中任一项所述的核酸，其中所述核酸在至少一个开放阅读框中缺乏TTA抑制密码子。

25.如权利要求21至24中任一项所述的核酸，其中所述核酸还包含LAL结合位点。

26.如权利要求25所述的核酸，其中所述LAL结合位点与SEQID NO:2(CTAGGGGGTTGC)的序列具有至少80％同一性。

27.如权利要求26所述的核酸，其中所述LAL结合位点包含SEQ ID NO:2的序列。

28.如权利要求27所述的核酸，其中所述LAL结合位点具有SEQ ID NO:2的序列。

29.如权利要求25所述的核酸，其中所述LAL结合位点具有SEQ ID NO:3(GGGGGT)的序列。

30.如权利要求21至29中任一项所述的核酸，其中所述核酸还包含被定位以使得所述LAL结合至所述LAL结合位点促进开放阅读框表达的所述开放阅读框。

31.如权利要求30所述的核酸，其中所述开放阅读框编码产生化合物的蛋白质。

32.如权利要求31所述的核酸，其中所述产生化合物的蛋白质为聚酮合酶或产生β-内酰胺化合物的蛋白质。

33.如权利要求21至32中任一项所述的核酸，其中所述核酸还编码非核糖体肽合酶。

34.如权利要求21至33中任一项所述的核酸，其中所述核酸还编码第一P450酶。

35.如权利要求34所述的核酸，其中所述核酸还编码第二P450酶。

36.如权利要求25至35中任一项所述的核酸，其中所述核酸还包含一个或多个额外的LAL结合位点。

37.如权利要求25至36中任一项所述的核酸，其中所述核酸还包含编码LAL的基因。

38.如权利要求37所述的核酸，其中所述编码LAL的基因受包含LAL结合位点的启动子的控制。

39.如权利要求36至38中任一项所述的核酸，其中所述LAL结合位点中的至少一个包含在启动子中。

40.如权利要求39所述的核酸，其中所述启动子为双向启动子。

41.一种表达载体，其包含如权利要求21至40中任一项所述的核酸。

42.如权利要求41所述的表达载体，其中所述表达载体为人工染色体。

43.如权利要求42所述的表达载体，其中所述人工染色体为细菌人工染色体。

44.一种宿主细胞，其包含如权利要求41至43中任一项所述的表达载体。

45.一种产生化合物的方法，所述方法包括：

(a)提供宿主细胞，所述宿主细胞经工程化以表达重组LAL并且包含可操作地连接至开放阅读框的LAL结合位点，使得所述重组LAL结合至所述LAL结合位点促进所述开放阅读框的表达，其中所述开放阅读框编码产生化合物的蛋白质；以及

(b)在适合于允许化合物由所述产生化合物的蛋白质表达的条件下培养所述宿主细胞；

由此产生化合物。

46.如权利要求45所述的方法，其中所述产生化合物的蛋白质为聚酮合酶。

47.如权利要求45或46所述的方法，其中所述化合物为聚酮。

48.如权利要求45所述的方法，其中所述产生化合物的蛋白质为产生β-内酰胺化合物的蛋白质。

49.如权利要求45或48所述的方法，其中所述化合物为β-内酰胺化合物。

50.如权利要求49所述的方法，其中所述β-内酰胺化合物选自由以下组成的组：碳青霉烯、头孢菌素、青霉素、克拉维酸、单菌霉素、诺卡霉素、烟草野火毒素或缀合β-内酰胺化合物。

51.一种鉴定合成LAL结合位点的方法，所述方法包括：

(a)提供包含至少八个核苷酸的多个合成核酸；

(b)使包含至少八个核苷酸的所述多个核苷酸中的一个或多个与一个或多个LAL接触；

(c)测定步骤(a)的核酸与步骤(b)的LAL之间的结合亲和力，

其中如果如由RNA转录增加至少2倍所测量合成结合位点当连接至下游基因时能够诱导所连接基因的转录，那么将合成核酸鉴定为合成LAL结合位点。