基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法
技术领域
本发明涉及具有生产16位羟基化大环内酯类化合物能力的基因重组微生物以及使用这些微生物的16位羟基化大环内酯类化合物的制备方法。
背景技术
放线菌生产的各种代谢产物中,发现了作为生理活性物质的重要的物质。尤其是,发现许多结构上在母核中具有聚烯酮(polyketide)的化合物(以下称为聚烯酮化合物)。已知有,例如,已知为抗菌性物质的红霉素、交沙霉素、Tyrocin、麦迪霉素、麻西那霉素,已知为抗真菌性物质的制霉菌素、两性霉素,已知为杀虫性物质的密尔伯霉素(Milbemycin)、除虫菌素(Avermectin),已知为免疫抑制物质的他克莫司(Tacrolimus)、雷帕霉素(Rapamycin)和已知为抗肿瘤物质的道诺霉素(daunomycin)、亚德里亚霉素、阿克拉霉素等多种具有生物活性的化合物。
作为这种聚烯酮化合物的一种,为被命名为普拉地内酯(pladienolide)的显示出优异的抗肿瘤活性的一组大环内酯类化合物。普拉地内酯是从放线菌链霉菌属(Streptomyces sp.)Mer-11107株的培养物中发现的化合物组的总称,已知有以下式(A)表示的11107B(有时称为普拉地内酯B)为代表的50种以上的衍生物(参照WO2002/060890)。
这些普拉地内酯中,下式(I)表示的16位羟基化体具有强抗肿瘤活性的优异性质,但是其生产性比11107B的生产性要差,制造效率低。
(但是,R表示氢原子或羟基)
并且,式(I)中,有时R为氢原子的化合物称为ME-282,将R为羟基的化合物称为11107D或普拉地内酯D。
然后,本申请人的研究组进行了11107B的16位羟基化反应,发现称为普拉地内酯生产菌的其它放线菌(参照WO2003/099813和WO2004/050890),从这些放线菌中获得了与11107B的16位羟基化反应相关的DNA(编码16位羟基化酶及其铁氧还蛋白的DNA),并进行了鉴定(参照2005年6月9日公布的WO-A 2005/052152)。
而且,普拉地内酯生产菌-链霉菌属(Streptomyces sp.)Mer-11107株获得了参与11107B的生物合成的多肽和编码这些多肽的DNA,并进行了鉴定(参照2006年1月26日公布的WO-A 2006/009276)。
这样一来,使用链霉菌属(Streptomyces sp.)Mer-11107株或其变体生产11107B等,通过进行这些16位羟基化反应的其它放线菌将获得的11107B等转化成16位羟基化体,可以实现比以往更有效地制备16位羟基化体。但是,由于进行两个阶段的反应,作业的麻烦变成两倍,希望建立更有效的制备方法。
另一方面,已知有通过在生产聚烯酮化合物的菌株中以可以表达的形式导入编码修饰该聚烯酮化合物的酶的基因,直接生产由导入的酶修饰的聚烯酮化合物的实例。例如,已经报道了在生产丁省霉素(Tetracenomycin)C的淡青链霉菌(Streptomyces glaucescens)GLA.0株中导入弗氏链霉菌(Streptomyces fradiae)Tu2717株的羟基化基因,可以直接生产6-羟基-丁省霉素C(参照J.Bacteriol,1995,vol.177,6126-6136)。
而且,已知有通过向具有修饰聚烯酮化合物的酶的菌株中以可以表达的形式导入该聚烯酮化合物的生物合成基因,作为宿主的菌株直接生产由本来具有的酶修饰的聚烯酮化合物的实例。例如,已经报道了通过向具有羟基化丁省霉素C的6位的酶的弗氏链霉菌(Streptomycesfradiae)Tu2717株中导入淡青链霉菌(Streptomyces glaucescens)GLA.0株的丁省霉素C的生物合成基因,可以直接生产6-羟基-丁省霉素C(参照J.Bacteriol,1995,vol.177,6126-6136)。
而且,还存在通过在异种菌株中导入聚烯酮化合物的生物合成基因和编码修饰该聚烯酮化合物的酶的基因,可以通过异种菌株生产修饰的聚烯酮化合物的情况。例如,报道了通过以变铅青链霉菌(Streptomyceslividans)K4-114株作为宿主,在宿主中导入红色糖多孢菌(Saccharopolyspora erythraea)株来源的编码6-红霉内酯(Erythronolide)B合成酶的基因和抗生链霉菌(Streptomyces antibioticus)ATCC11891株来源的P-450基因,可以直接生产8,8a-二羟基-6-红霉内酯B(参照J.Antibiot.,2000,vol.53,502-508)。
发明的公开
本发明的课题是提供具有生产由前述式(I)表示的16位羟基化大环内酯类化合物的能力的基因重组微生物。进而,还提供了使用这些基因重组微生物的16位羟基化大环内酯类化合物的制备方法。
本发明人,为了解决上述问题,用基因工程的方法制备(育种)具有先前分离鉴定的参与11107B的生物合成的DNA和与11107B的16位羟基化反应相关的DNA的微生物,发现在其培养液中积累了大量16位羟基化大环内酯类化合物,完成了本发明。
即,本发明涉及以下的[1]-[21]。
[1]具有生产式(I)
(但是,R表示氢原子或羟基)表示的16位羟基化大环内酯类化合物的能力的微生物,其为具有(a)编码参与式(II)
(但是,R表示氢原子或羟基)表示的大环内酯类化合物的生物合成的多肽的部分或全部的DNA以及(b)编码具有前述式(II)表示的大环内酯类化合物的16位羟基化酶活性的多肽的部分或全部的DNA的基因重组微生物。
[2]根据[1]记载的基因重组微生物,前述(a)表示的DNA为编码具有聚烯酮合成酶活性的多肽、具有7位乙酰化酶活性的多肽、具有18,19位环氧化酶活性的多肽和具有转录调节因子活性的多肽的部分或全部的DNA。
[3]根据[1]或[2]记载的基因重组微生物,前述(a)表示的DNA为含有
(a-1)序列号1的第8340-27935位碱基的连续的碱基序列
(a-2)序列号1的第28021-49098位碱基的连续的碱基序列
(a-3)序列号1的第49134-60269位碱基的连续的碱基序列
(a-4)序列号1的第60269-65692位碱基的连续的碱基序列
(a-5)序列号1的第68160-66970位碱基的连续的碱基序列
(a-6)序列号1的第69568-68270位碱基的连续的碱基序列
(a-7)序列号1的第72725-70020位碱基的连续的碱基序列的DNA或其变体。
[4]根据[2]或[3]记载的基因重组微生物,前述(a)表示的DNA还包含编码具有6位羟基化酶活性的多肽的部分或全部的DNA。
[5]根据[4]记载的基因重组微生物,编码具有6位羟基化酶活性的多肽的部分或全部的DNA是含有序列号1的第65707-66903位的连续的碱基序列的DNA或其变体。
[6]根据[1]-[5]任一项记载的基因重组微生物,前述(b)表示的DNA是选自于下组的DNA或其变体:
(b-1)序列号2的第1322-2548位的连续的碱基序列、
(b-2)序列号3的第420-1604位的连续的碱基序列,和
(b-3)序列号4的第172-1383位的连续的碱基序列。
[7]根据[1]-[6]任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的氨基酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸的密码子的改变位点。
[8]根据[1]-[6]任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸、蛋氨酸或脯氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸或丝氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸、脯氨酸、酪氨酸或苯丙氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸或脯氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸或缬氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸、半胱氨酸或异亮氨酸的密码子的改变位点。
[9]根据[1]-[6]任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)第1592-1594位碱基中的序列cgc改变成编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸的密码子的改变位点。
[10]根据[1]记载的基因重组微生物,其在具有前述(a)表示的DNA的宿主中整合了异种微生物来源的前述(b)表示的DNA。
[11]根据[1]记载的基因重组微生物,其在具有前述(b)表示的DNA的宿主中整合了异种微生物来源的前述(a)表示的DNA。
[12]根据[1]记载的基因重组微生物,其在不具有前述(a)和(b)表示的任一DNA的宿主中整合了异种微生物来源的前述(a)和(b)表示的两种DNA。
[13]根据[1]-[12]任一项记载的基因重组微生物,具有生产式(I)表示的16位羟基化大环内酯类化合物的能力的基因重组微生物为属于链霉菌(Streptomyces)属的菌株。
[14]根据[1]-[13]任一项记载的基因重组微生物,其在装入了30ml下述培养基的容积为250ml的三角烧瓶中接种基因重组微生物,于25℃旋转振荡(220rpm)培养4天后,通过加入270ml乙腈进行提取,在下述测定条件下对获得的提取液进行HPLC分析、定量式(I)表示的16位羟基化大环内酯类化合物时,具有每1L培养液生产50mg以上的式(I)表示的16位羟基化大环内酯类化合物的能力:
(培养基)
5%溶性淀粉,1%葡萄糖,3%pharmamedia,0.1%CaCO3、pH7.5
(HPLC测定条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%-55%甲醇(0-5分钟),55%甲醇(5-13分钟),55%-70%甲醇(13-21分钟)、70%甲醇(21-25分钟)
流速:1.2mL/分钟
检测:UV240nm
注入容量:5μL
柱温度:40℃。
[15]式(I)表示的16位羟基化大环内酯类化合物或其可药用盐或它们的水合物的制备方法,其特征在于在营养培养基中培养[1]-[14]任一项记载的基因重组微生物,从其培养液中收集式(I)表示的16位羟基化大环内酯类化合物。
[16]根据[15]中记载的方法,其特征在于使环糊精类存在于培养液中。
[17]根据[16]中记载的方法,所述环糊精类为选自于β-环糊精、γ-环糊精、部分甲基化β-环糊精、二甲基-β-环糊精、三甲基-β-环糊精、糖基-β-环糊精和羟丙基-β-环糊精中的环糊精类。
[18]含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸的密码子的改变位点。
[19]含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸、蛋氨酸或脯氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸或丝氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸、脯氨酸、酪氨酸或苯丙氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸或脯氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸或缬氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸、半胱氨酸或异亮氨酸的密码子的改变位点。
[20]含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸的密码子的改变位点。
[21]由[18]-[20]任一项中记载的DNA变体编码的多肽。
并且,本说明书中的各种用语的定义如下所述。
所谓“基因重组微生物”是指使用基因重组技术在特定的微生物中导入其它生物来源的基因的微生物(细菌、放线菌、酵母、丝状菌等),其中使用的基因导入方法包括使用质粒等载体的基因重组法以及同源重组等方法。
所谓“DNA变体”是指:
(1)在严紧条件下与原DNA杂交的DNA,
(2)与原DNA的碱基序列具有70%以上的同源性的碱基序列的DNA,
(3)具有与原DNA的碱基序列互补的碱基序列的DNA,或者
(4)由于遗传密码子的简并性,与原DNA在严紧条件下不杂交,但具有编码与由(1)项-(3)项任一项定义的DNA编码的氨基酸序列相同的序列的碱基序列的DNA。
而且,所谓“在严紧条件下杂交的DNA”是指例如以原DNA作为探针,通过使用菌落杂交法、噬菌斑杂交法或Southern杂交法等获得的DNA,具体而言,可以列举,使用固定了菌落或噬菌斑来源的DNA的滤膜,在0.7-1.0M的氯化钠存在下,于65℃进行杂交后,使用0.1-2倍浓度的SSC溶液(1倍浓度的SSC溶液是由150mM氯化钠、15mM柠檬酸钠构成的),通过于65℃条件清洗滤膜可以鉴定的DNA。
所谓“衍生物”是指赋予化学结构具有特征的主要骨架相同,而修饰的样式和侧链的形状等不相同的化合物。
所谓“16位羟基化酶活性”是指将大环内酯类化合物(II)的16位氢原子转化为羟基的活性。
所谓“6位羟基化酶活性”是指将下式(B)表示的大环内酯类化合物(有时称之为ME-265)的6位氢原子转化为羟基的活性。
所谓“聚烯酮合成酶活性”是指合成下述式(E)表示的大环内酯类化合物的活性。
所谓“7位乙酰化酶活性”是指将下式(C)表示的大环内酯类化合物的7位羟基转化为乙酰基的活性。
(但是,R表示氢原子或羟基)
所谓“18,19位环氧化酶活性”是指将式(D)表示的大环内酯类化合物的18,19位双键转换成环氧基的活性。
(但是,R表示氢原子或羟基)
所谓“转录调节因子活性”是指调节编码参与大环内酯类化合物(II)的生物合成的多肽的DNA转录的活性。
通过本发明,可以获得具有编码参与大环内酯类化合物(II)的生物合成的多肽的DNA和编码具有大环内酯类化合物(II)的16位羟化酶活性的多肽的DNA、且可以直接发酵生产16位羟基化大环内酯类化合物(I)的基因重组微生物。而且,通过培养这种基因重组微生物,从培养液中收集,可以有效生产16位羟基化大环内酯类化合物(I)。
尤其是,通过在上述方法中使用编码将具有16位羟基化酶活性的多肽的氨基酸序列改变一部分的多肽的DNA,可以更有效地选择性生产16位羟基化大环内酯类化合物(I)。
附图说明
图1是表示Mer-11107株中普拉地内酯的生物合成途径的图。
图2是表示与Mer-11107株中普拉地内酯的生物合成途径相关的DNA的各ORF和粘粒的对应关系的图。
图3是表示质粒pKU253的结构的图。
图4是表示质粒pUC19aph::oriT::intphiC31的结构的图。
发明的详细说明
以下,对本发明的实施方式进行详细的说明。
在本发明中,编码参与大环内酯类化合物(II)的生物合成的多肽的DNA,可以按照本领域中公知的方法(例如,分子克隆第2版中记载的菌落杂交法),从具有生产该大环内酯类化合物能力的微生物的培养菌体中获得。作为这类微生物,如果是具有生产该大环内酯类化合物能力的微生物,则可以不论种和株的种类随意使用,但是作为优选微生物,可以列举属于链霉菌(Streptomyces)属放线菌的菌株。作为其中一例,可以列举从土壤分离的链霉菌属(Streptomyces sp.)Mer-11107株。Mer-11107株以保藏号FERM P-18144于平成12年12月19日保藏于日本305-8566茨城县筑波市东1丁目1番3号的工业技术院生命工学工业技术研究所,再于平成13年11月27日转移到位于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心(IPOD),国际保藏号为FERM BP-7812。
以下,以Mer-11107株的情况为例,对获得目的DNA的操作的概况进行简要的说明。首先,在大肠杆菌中整合通过将用适当的限制性酶部分分解Mer-11107株的基因组DNA所获得片段与用适当的限制性酶部分分解可以在大肠杆菌内复制的粘粒载体所获得片段相连接所获得的重组DNA,获得转化株。然后,以公知的羟基化酶(细胞色素P450酶)基因的片段作为探针,首先,筛选获得的大量转化株,选择与探针结合的转化株。然后,获得与存在于选择出的粘粒中的羟基化酶基因结合的DNA,测定其序列。再将其导入于大肠杆菌,在确认转化的大肠杆菌具有6位羟基化酶活性方面,可以通过使用编码该6位羟基化酶的DNA作为探针,进行Southern杂交,从先前获得的多个阳性克隆(粘粒)中选择含有与编码6位羟基化酶的DNA相邻的大环内酯类化合物的生物合成基因簇的粘粒,并进行排列来获得。对于所有这些操作的详细内容,记载于参考例1中,而且也记载于由本申请人申请的WO-A2006/009276的说明书中,可以参照这些记载。
含有编码参与这样获得的大环内酯类化合物(II)的生物合成的多肽的DNA的周边区域的核苷酸序列(在编码序列中的氨基酸序列)示于序列表的序列号1中。
在该序列号1所示的DNA中,包含pldA I(第8340-27935位碱基)、pldA II(第28021-49098位碱基)、pldA III(第49134-60269位碱基)、pldAIV(第60269-65692位碱基)、pldB(第65707-66903位碱基)、pldC(68160-66970位碱基)、pldD(第69568-68270位碱基)和pldR(第72725-70020位碱基)这8个开放阅读框(ORF)。
这些DNA中,pldA I、pldA II、pldA III和pldA IV中,存在几个分别含有与已经清楚的其它聚烯酮生物合成基因同样的称为模块的1个或1个以上的重复单位的几个转录解读框。于是,各模块,编码如后述的选自于与聚烯酮合成的缩合反应相关的酰基载体蛋白质(ACP)、β-酮酰基ACP合成酶(KS)、酰基转移酶(AT)和与β位羰基修饰反应相关的酮酰基还原酶(KR)、脱氢酶(DH)和烯酰基还原酶(ER)的所有区域或几个区域,最后的模块中存在由聚烯酮合成酶从聚烯酮链切离的硫酯酶(TE)区域。
图1中表示了Mer-11107株中大环内酯类化合物的生物合成途径。起始模块(loading module),与其它模块不同,其活性中心的半胱氨酸被置换成谷氨酰胺,从而清楚了pldA I与起始反应相关。而且,由于模块10中存在硫酯酶(TE)结构域,从而清楚了pldA IV与聚烯酮基本骨架合成的最后反应相关。这样一来,形成聚烯酮的基本骨架后,再受pldD编码的18,19位环氧化酶,pldC编码的7位乙酰化酶和由pldB编码的6位羟基化酶的修饰,就生物合成大环内酯类化合物(II)。而且,大环内酯类化合物(II)中,R为氢原子的化合物,可以通过改变成使pldB缺失,或使之功能不表达来进行制备。而且,pldR与编码除虫菌素(Avermectin)生物合成中转录调节因子的基因aveR同源性高,编码参与大环内酯类化合物的生物合成的DNA的转录调节因子。
在本发明中,编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA,可以按照本领域公知的方法(例如,分子克隆第2版中记载的菌落杂交法),从具有该大环内酯类化合物的16位羟基化能力的微生物的培养菌体中获得。作为这类微生物,如果是具有将该大环内酯类化合物的16位氢原子转化成羟基的能力的微生物,则不论是种和株的种类都可以随意使用,但作为优选微生物,可以列举属于放线菌的菌株。作为其实例,可以列举从土壤中分离的链霉菌属(Streptomyces sp.)A-1544株、链霉菌属(Streptomyces sp.)Mer-11107株或链霉菌属(Streptomyces sp.)A-1560株。A-1544株以保藏号FERM P-18943于平成14年7月23日保藏于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心,再于平成15年7月30日转移到位于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心(IPOD),国际保藏号为FERM BP-8446。A-1560株以保藏号FERMP-19585于平成15年11月13日保藏于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心,再于平成16年8月19日转移到位于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心(IPOD),国际保藏号为FERM BP-10102。
以下,以A-1544株的情况为例,对获得目的DNA的操作的概况进行说明。首先,制备A-1544株的基因组DNA,然后基于公知的羟基化酶(细胞色素P450酶)基因的序列信息,制备引物,进行PCR反应,获得特异性扩增的DNA片段,测定其序列。可以通过再基于获得的序列信息,用逆向PCR法(细胞工程14卷,p.591-593,1995年),扩增跨越克隆的DNA片段的上游和下游区域的周边区域的碱基序列,克隆,并分析序列来获得。对于这些操作的所有内容详细记载于参考例2(A-1544株)、参考例3(Mer-11107株)和参考例4(A-1560株),而且也记载于2005年6月9日公开的WO-A2005/052152中,可以参照这些记载。
从这样的A-1544株中获得的编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA(包括周边区域)示于序列表的序列号2中。该序列号2所示的DNA中包含psmA(第1322-2548位碱基)和psmB(第2564-2761位碱基)这两个开放阅读框(ORF),它们分别编码16位羟基化酶和铁氧还蛋白。
同样,从Mer-11107株中获得的编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA(包含周边区域)示于序列表的序列号3中。该序列号3所示的DNA中含有bpmA(第420-1604位碱基)和bpmB(第1643-1834位碱基)这两个开放阅读框(ORF),它们分别编码16位羟基化酶和铁氧还蛋白。
从A-1560株中获得的编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA(包括周边区域)示于序列表的序列号4中。该序列号4所示的DNA中含有tpmA(第172-1383位碱基)和tpmB(第1399-1593位碱基)这两个开放阅读框(ORF),它们分别编码16位羟基化酶和铁氧还蛋白。
而且,上述的编码具有16位羟基化酶活性的多肽的各种DNA变体可以如下述方式获得。首先,基于原来的DNA的序列信息进行位点特异性的改变处理,然后将获得的位点特异性DNA变体整合到宿主中,以该基因重组微生物的16位羟基化酶活性的强度和选择性高度作为指标进行选择,可以获得这些变体。位点特异性的改变处理,可以使用例如以克隆了原来的DNA的质粒作为模板,使用基于其序列信息设计的引物,使用市售的试剂盒,例如QuickChangeTM Site-DirectedMutagenesis试剂盒(Stratagene Co.)等来进行。
这些变体中作为16位羟基化酶活性高且选择性高的变体,可以列举,例如从A-1544中获得的编码16位羟基化酶的psmA的情况,含有序列号2的第1322位碱基至第2548位碱基的连续的碱基序列,且含有选自于以下的1)-6)的1个或2个以上的改变部位的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的氨基酸优选地编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的氨基酸优选地编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸优选地编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸优选地编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸优选地编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸优选地编码蛋氨酸的密码子的改变位点。
本发明的重组体,也就是带有前述“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”和“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”的基因重组微生物,可以通过以下的A)-C)所示的方法进行制备。
A)在原本具有“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”的宿主中整合“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”。
B)在原本具有“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”的宿主中整合“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”。
C)在原本不具有“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”且不具有“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”的宿主中整合这两种DNA。
本发明的重组体宿主只要是可以整合目的DNA,可以生产目的16位羟基化大环内酯化合物的微生物均可使用,并没有特别的限制,但作为优选微生物,可以例举属于链霉菌属(Streptomyces)的放线菌的菌株。例如,前述A)的情况,可以列举链霉菌属(Streptomyces sp.)Mer-11107株等、前述B)的情况,可以列举链霉菌属(Streptomyces sp.)A-1544株、链霉菌属(Streptomyces sp.)Mer-11107株或链霉菌属(Streptomycessp.)A-1560株等。而且,前述C)的情况,可以列举属于大肠杆菌(Escherichia coli)属的菌株等。
为了使目的DNA整合到宿主中进行表达,没有特别的限定,可以使用例如记载于分子克隆第2版,Current Protocols In MolecularBiology等中的方法来进行。宿主、质粒-载体系统如果是目的DNA可以在宿主中稳定保持并表达的系统,则没有特别的限制。而且,质粒除了目的DNA之外还可以包括自我复制序列,启动子序列,终止子序列,药物抗性基因等,作为质粒的种类,不仅可以是自我复制型质粒,还可以是与预定使用的宿主的基因组的一定区域具有同源序列的整合型质粒。整合目的DNA的部位可以是在质粒上或在宿主微生物的基因组上。
作为宿主,如果以放线菌或其衍生株作为宿主,可以利用自我复制型载体-pIJ6021(Gene 166,133-137(1995))和染色体整合型载体KC515〔Thebacteria,vol.9.Antibiotic-producing Streptomyces(Queener,S.E.和Day,L.E.编著).p.119-158.Academic Press,Orlando,Fgla.〕等。
作为自我复制序列,可以列举rep pIJ101(1988,J.Bacteriol.,170,4634-4651)、rep SCP2(1981,J.Gen.Microbiol.,126,427-442)、pUC19(Gene,33(1),103-119(1985)等,作为启动子序列,可以列举ermEp(Mol Microbiol.,1994,Nov;14(3):533-45.)、SnpAp(JBacteriol.,1992,May;174(9):2797-2808)等,作为终止子,可以列举ter(mmr)(Gene,1987:58(2-3):229-41)、fd终止子(Nucleic AcidsRes.,5(12),4495-4503(1978))等,作为药物抗性基因,可以列举hyg(Nucleic Acids Res.,4(14),1565-1581(1986))、tsr(Mol.Gen.Genet.,199(1),26-36(1985))等。而且,只要是本领域技术人员,按照本发明的说明书的记载就可以容易地制备本发明的基因重组微生物。
培养这样制备的基因重组微生物,通过以下方法评价16位羟基化大环内酯类化合物(I)的生产性,进行选择,可以获得该大环内酯类化合物的高产菌株。也就是说,具有每1L培养液生产50mg以上的该大环内酯类化合物的能力的基因重组微生物,可以以约40%的概率获得,具有每1L培养液生产100mg以上的能力的重组微生物,可以以约30%的概率获得,均可以以高概率获得。
(生产性评价方法)
将基因重组微生物接种于装入了30mL培养基(5%溶性淀粉,1%葡萄糖,3%pharmamedia,0.1%CaCO3、pH7.5)的容量为250mL的三角烧瓶中,于25℃振荡培养(220rpm)4天后,添加270mL乙腈进行提取,在下述测定条件下HPLC分析获得的提取液,定量16位羟基化大环内酯类化合物(I)的累积浓度。
(HPLC测定条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%-55%甲醇(0-5分钟),55%甲醇(5-13分钟),55%-70%甲醇(13-21分钟)、70%甲醇(21-25分钟)
流速:1.2mL/分钟
检测:UV240nm
注入容量:5μL
柱温度:40℃
在营养源培养基中接种本发明的基因重组微生物,通过好氧培养,可以从其培养液中收集16位羟基化大环内酯类化合物(I)或其药学上允许的盐或它们的水合物。
这些基因重组微生物的培养方法,原则上按照一般的微生物的培养方法,但优选在通过液体培养的振荡培养、通气搅拌培养等好氧条件下实施的方法。作为培养中可以使用的培养基,可以是含有这些微生物可以利用的营养源的培养基,也可以利用各种合成、半合成培养基、天然培养基等中的任一种。作为培养基的组成,可以单独或组合使用葡萄糖、蔗糖、果糖、甘油、糊精、淀粉、糖蜜、大豆油等作为碳源。作为氮源,可以单独或组合使用pharmamedia、蛋白胨、肉膏、大豆粉、酪蛋白、氨基酸、酵母提取物、尿素等有机氮源;硝酸钠、硫酸铵等无机氮源。其它例子,可以按照需要添加例如氯化钠、氯化钾、碳酸钙、硫酸镁、磷酸钠、磷酸钾、氯化钴等盐类、重金属类盐、维生素B和生物素等维生素类。而且,在培养中冒泡明显时,还可以在适当培养基中添加各种消泡剂。而且,根据需要还可以添加维持药物抗性基因所必需的药物。当添加消泡剂时,不对目的物质的生产产生大影响的浓度是理想的。
而且,培养本发明的基因重组微生物,在制备16位羟基化大环内酯类化合物(I)时,通过使环糊精存在于培养液中,可以增大16位羟基化大环内酯类化合物的累积浓度。作为可以在本发明中使用的环糊精类,可以例举β-环糊精、γ-环糊精、部分甲基化β-环糊精、二甲基-β-环糊精、三甲基-β-环糊精、糖基-β-环糊精和羟丙基-β-环糊精,可以单独或组合使用这些环糊精。
向培养液中添加环糊精的量优选是0.5%-5%。添加时,可以在培养初期或培养途中添加。
培养条件可以在该菌株良好生长且可以生产16位羟基化大环内酯类化合物(I)的范围内适当选择。例如,培养基的pH是5-9左右,通常理想的是中性附近。培养温度通常保持在20-40℃,优选可以保持在23-35℃。培养天数为2-12天左右,通常为3-10天左右。上述的各种培养条件,可以根据使用微生物的种类和特性、外部条件等适当改变,当然可以选择最适条件。为了分离纯化培养液中积累的16位羟基化大环内酯类化合物(I),可以利用用于从其培养液中分离微生物代谢产物的分离、纯化的方法。例如,其中适用使用甲醇、乙醇、丁醇、醋酸乙酯、氯仿、丙酮、甲苯等的有机溶剂提取、使用各种离子交换层析、SephadexLH-20等的凝胶过滤层析、通过活性碳、硅胶、吸附树脂(ダイヤイオンHP20)的吸附层析,或通过薄层层析的吸附脱吸附处理,或使用逆相柱等的高速液相层析等公知的所有方法时,不限于这里所示的方法。通过单独或按照任意顺序组合这些方法,并且反复使用,可以分离纯化16位羟基化大环内酯类化合物(I)。
实施例
以下,通过列举实施例对本发明进行具体的说明,但是本发明并不受这些实施例的任何限制。而且,下述的说明中,对培养基成分,只要没有特别的说明,以重量%表示浓度。
参考例1:编码参与大环内酯类化合物(II)的生物合成的多肽的DNA的获得
(1)Mer-11107株的培养和基因组DNA的获得
将链霉菌属(Streptomyces sp.)Mer-11107株的菌丝接种于25mL的Tryptic Soy Broth中,于28℃振荡培养3天。按照D.A.Hopwood等人的放线菌基因实验书Practical Streptomyces Genetics(The John InnesFoundation,Norwich,England,2000)的Isolation genomic DNA(P162~170)中记载的方法从获得的培养液中制备基因组DNA。
(2)Mer-11107株的基因组文库的制备
混合160μl灭菌纯化水,200μl Mer-11107株的基因组DNA溶液(1mg/ml),40μl 10倍浓度的M缓冲液[100mM Tris-HCl(pH7.5),100mMMgCl2,10mM二硫苏糖醇,500mM NaCl]和1μl限制性酶Sau3AI(1单位/μl),于37℃温育3分钟。然后,取出50μl,用50μl的酚-氯仿混液(酚∶氯仿∶异戊醇=25∶24∶1,容量比)提取,回收水相,再用50μl氯仿提取,并回收水相。向该溶液中加入5μl的3M醋酸钠(pH6.0)和150μl的乙醇,于-80℃放置30分钟,通过离心沉淀,回收DNA。用70%乙醇清洗该DNA后,溶解于90μl的灭菌纯化水中,加入10μl的10倍浓度BAP缓冲液[500mM Tris-HCl(pH9.0),10mM MgCl2]和5μl细菌碱性磷酸酶(0.5单位/μl、TakaraBio公司),于37℃温育3小时。用100μl酚-氯仿混液(酚∶氯仿∶异戊醇=25∶24∶1,容量比)提取该反应液,回收水相,再用100μl的氯仿提取,并回收水相。向该溶液中加入10μl的3M醋酸钠(pH6.0)和300μl的乙醇,于-80℃放置30分钟,通过离心沉淀,回收DNA。用70%乙醇清洗该DNA后,溶解于20μl的TE缓冲液[10mMTris-HCl(pH8.0),1mM EDTA]中。
另一方面,按照Stratagene公司的手册用限制性酶XbaI消化10μgSuperCos粘粒载体(Stratagene公司)后,用牛肠碱性磷酸酶(TakaraBio公司)进行DNA末端的脱磷酸化,进而用限制性酶BamHI消化,纯化后,溶解于10μl的TE缓冲液中。向1μl该粘粒DNA溶液中加入2.5μl前述的Mer-11107株DNA的Sau3A1部分分解物的溶液,再依次加入1.5μl灭菌纯化水,5μl DNA连接试剂盒(TakaraBio公司)的溶液II,10μl的溶液I后,于23℃温育10分钟。用Gigapack III XL试剂盒(Stratagene公司)将4μl该反应液包裹入λ噬菌体。对于获得的包装液(总量为500μl)实施转导试验,检测菌落形成能力的结果为380cfu(菌落形成单位)/μl。
(3)各种探针的制备
(3-1)含有酮合成酶编码区域的探针的制备
一般基于聚烯酮合成酶的酮合成酶结构域(keto synthase domain)中保守的序列,分别合成包含以下所述的序列构成的2种引物、即KS-3F和KS-4R(参照序列号5和6)。
KS-3F:5’-GACCGCGGCTGGGACGTGGAGGG-3’
KS-4R:5’-GTGCCCGATGTTGGACTTCAACGA-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水 31μl
2倍浓缩GC缓冲液 50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM) 16μl
KS-3F(100pmol/μl) 0.5μl
KS-4R(100pmol/μl) 0.5μl
Mer-11107株总DNA(100ng/μl) 1μl
LA Taq聚合酶(5u/μl,TakaraBio公司) 1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟) 30个循环
72℃5分钟
在0.8%琼脂糖凝胶上电泳由该反应最终扩增的930bp DNA片段,切出分离的930bp DNA片段,用SUPREC-01(TakaraBio公司)回收纯化DNA。进而,以获得的10ng DNA片段作为模板,除反应循环数为20个循环外,在与前述PCR相同的反应条件下再扩增含有酮合成酶编码区域的930bp DNA片段。用SUPREC-02(TakaraBio公司)浓缩纯化该DNA片段,以获得的50μl TE溶液作为探针溶液。
(3-2)含有细胞色素P450基因区域的探针的制备
为了制备细胞色素P450基因探针,从放线菌中扩增公知的2种细胞色素P450基因。也就是说,为了扩增耐热链霉菌(Streptomycesthermotolerans)ATCC11416来源的ORF-A基因(Biosci.Biotechnol.Biochem.59:582-588,1995),合成包含如下所示的序列的两种引物,即CB-1F和CB-2R(参照序列号7和8)。
CB-1F:5’-ATGACAGCTTTGAATCTGATGGATCCC-3’
CB-2R:5’-TCAGAGACGGACCGGCAGACTCTTCAGACG-3’
另一方面,为了扩增委内瑞拉链霉菌(Streptomyces venezuelae)ATCC15439来源的pikC基因(Chem.Biol.5:661-667,1998),分别合成包含如下所示的序列的两种引物,即PKC-1F和PKC-2R。
PKC-1F:5’-GTGCGCCGTACCCAGCAGGGAACGACC-3’
PKC-2R:5’-TCACGCGCTCTCCGCCCGCCCCCTGCC-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水 31μl
2倍浓缩GC缓冲液 50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM) 16μl
引物-F(100pmol/μl) 0.5μl
引物-R(100pmol/μl) 0.5μl
ATCC11416株或ATCC15439株的基因组DNA(100ng/μl) 1μl
LA Taq聚合酶(5u/μl,TakaraBio公司) 1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟) 30个循环
72℃5分钟
用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化由该反应最终扩增的两种1.2kb DNA片段后,制备含有各个DNA片段各10ng/μl的等量混合溶液,制成探针溶液。
(4)采用含有酮合成酶编码区域的探针进行筛选
使用前述(2)中制备的Mer-11107株的基因组DNA文库的包装液,以大肠杆菌XL-1Blue MR(Stratagene公司)作为宿主,按照Stratagene公司的手册进行转导。将转导操作后的菌液分注于10个LB-50μg/ml氨苄青霉素-1.5%琼脂培养基培养皿(内径90mm、高度15mm)中,涂覆,于37℃培养18小时。将各培养皿中生长的菌落转移到HybondoN+滤膜(amersham biosciences公司)上,按HybondoN+滤膜附带的手册中记载的条件进行碱处理、中和处理,于80℃干燥2小时,从而将菌落来源的DNA固定在滤膜上。
以100ng前述(3-1)制备的含有酮合成酶区域的930bp DNA片段作为探针,使用AlkPhos Direct System(amersham biosciences公司)通过菌落杂交法筛选基因组DNA文库。杂交在0.5M NaCl盐浓度下于65℃进行2小时。对于探针DNA的标识、杂交和检测的条件,按照AlkPhos Direct System附带的手册中记载的条件。在试验的约7,600个菌落中,分离出与用碱性磷酸酶标识的探针强力杂交的59个菌落。从由该菌落中衍生的大肠杆菌克隆中提取纯化粘粒。
(5)用含有细胞色素P450基因区域的探针进行具有普拉地内酯生物合成基因区域的粘粒克隆的选择确认
将2μl前述(4)中获得的各粘粒的DNA溶液点样于HybondoN+滤膜上,在附带的手册中记载的条件下进行碱处理、中和处理,进而于80℃干燥2小时,从而将DNA固定于滤膜上。使用该滤膜,以实施例3中记载的细胞色素P450基因片段作为探针,在与实施例4相同的条件下进行杂交。结果选择了与该探针强力杂交的1个粘粒,命名为pKS58。
用限制性酶Sau3AI部分分解pKS58DNA后,用噬菌体载体ZapExpress、BamHI-CIAP处理后(Stratagene公司)连接,用Gigapack III XL试剂盒(Stratagene公司)包装入λ噬菌体。使该噬菌体液感染大肠杆菌XL1-Blue MRF’,使噬菌斑形成。通过使用前述(3-2)中制备的细胞色素P450基因探针进行噬菌斑杂交,亚克隆约2kb的含有细胞色素P450基因的DNA片段。
测定该细胞色素P450基因DNA片段的序列,由被视为细胞色素P450编码区域的N-末端和C-末端分别合成包含如下所示的序列的两种引物、即PDL58-1F和PDL58-2R(参见序列号11和12)。
PDL58-1F:5’-GCCCCGCATATGGATCTGGAAACCCAACTTCTC-3’
PDL58-2R:5’-GCACTAGTCAGCCGCGCTCGACGAGGAGGTG-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水 31μl
2倍浓缩GC缓冲液 50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM) 16μl
PDL58-1F(100pmol/μl) 0.5μl
PDL58-2R(100pmol/μl) 0.5μl
pKS58DNA(10ng/μl) 1μl
LA Taq聚合酶(5u/μl,TakaraBio公司) 1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟) 20个循环
72℃5分钟
用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化由该反应最终扩增的1.2kb DNA片段后,用限制性酶NdeI和SpeI分解。反应后在0.8%琼脂糖凝胶上电泳DNA,切出分离的1.2kb DNA片段,用QIAGEN Gel提取试剂盒(QIAGEN公司)回收纯化DNA。通过将该DNA片段插入到细胞色素P450基因表达用质粒pT7NS-camAB(参照参考例5和WO03/087381)的NdeI和SpeI位点,构建出pPDL96。
用该质粒转化大肠杆菌BL21(DE3),在M9CG培养基(1.28%Na2HPO4·7H2O、0.3%KH2PO4、0.05%NaCl、0.1%NH4Cl、1%酪蛋白氨基酸、0.4%葡萄糖、1mM MgCl2、100μM CaCl2、50μg/ml氨苄青霉素)中培养直至菌密度OD600(600nm处的光密度)达到0.8。分别以80μg/ml、0.1mM的终浓度添加5-氨基乙酰丙酸和IPTG后,于22℃继续培养25小时,使细胞色素P450蛋白质诱导。诱导后,收集菌体,悬浮于5mlCV缓冲液[50mM磷酸钠(pH7.3)、1mM EDTA、10%甘油、1mM葡萄糖]。用试管取1ml该溶液,添加5μl普拉地内酯B的6位脱氧体ME-265的DMSO溶液(50mg/ml),于28℃温育15小时。向该反应液中加入1ml的乙腈,混合后,分离离心,通过在下述条件下用HPLC分析上清,确认了向普拉地内酯B的转变。由此确认了pKS58中含有普拉地内酯生物合成基因区域。
(HPLC的分析条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
55% 甲醇(5~13分钟)
55%~70%甲醇(13~21分钟)
45% 甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注射容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:ME-265:20分钟;普拉地内酯B:13分钟
(6)含有与细胞色素P450基因相邻的生物合成基因簇的粘粒的选定
在前述(4)中获得的59个粘粒DNA中,选定前述(5)中获得的含有与细胞色素P450基因相邻的生物合成基因簇的粘粒。
用限制性酶EcoRI、BamHI消化59个粘粒DNA,对获得的各个DNA进行琼脂糖凝胶电泳,用除虫菌素(Avermectin)糖苷配基合成酶基因(参照Proc.Natl.Acad.Sci.USA 96(1999)9509-9514、特开平2000-245457号公报或WO 00/50605小册子)的KS结构域的DNA(aveA2的KS6结构域)、AT结构域的DNA(aveA1的AT2结构域)、和前述(5)中获得的细胞色素P450基因作为探针进行Southern杂交。
根据经限制性酶EcoRI、BamHI消化的DNA的电泳图谱和与各探针杂交的条带图型的结果,首先将具有以相同长度杂交的DNA片段的粘粒分组。其中,对于显示出几乎同等图型的粘粒,削除1个、残留的粘粒中,将条带图型部分一致的粘粒整列。然后,以前述(5)中获得的含有细胞色素P450基因的粘粒pKS58为中心,选择pKS54作为与自细胞色素P450基因侧与含有聚烯酮合成酶基因侧相邻的粘粒,再选择pKS35作为与pKS54相邻的粘粒。此外,选择粘粒pKS58和作为自细胞色素P450基因侧与不含有聚烯酮合成酶基因侧相邻的粘粒pKS23。其结果是,如图2所示,选定pKS23,pKS58,pKS54,pKS35作为包括普拉地内酯生物合成基因簇的粘粒克隆。
(7)普拉地内酯生物合成基因簇的碱基序列的确定
确定了编码普拉地内酯生物合成基因的一组DNA的碱基序列。用氯化铯法分离前述(6)选择出的各粘粒后,用HydroShear(Genomic solutions公司)剪断成约1kb,用BKL试剂盒(TakaraBio公司)亚克隆。
对获得的亚克隆,进行采用荧光标识引物的循环测序反应(amershambiosciences公司),确定各片段的碱基序列(MegaBACE 1000:amershambiosciences公司),从而测定含有与普拉地内酯生物合成相关的DNA的约75kb的碱基序列(参照序列号1)。
(8)普拉地内酯的6位羟化酶基因(pldB)缺陷株的制备
根据前述(7)中测定的含有与普拉地内酯生物合成相关的DNA的约75kb的碱基序列(参照序列号1),清楚了普拉地内酯由图1中所示的生物合成途径进行生物合成。于是,认为通过只破坏其中的细胞色素P450基因pldB,可以获得只生产普拉地内酯B的6位脱氧体ME-265的菌株,因此用以下方法制备pldB缺陷株。
基于序列号1记载的碱基序列分别合成包含下述序列的4种引物,即pldB-L-Bgl2F、pldB-L-Hind3R、pldB-R-Hind3F和pldB-R-Bgl2R(参照序列号13,14,15和16)。
pldB-L-Bgl2F:5’-GGGAGATCTAGAGGCCGGTTACCTCTACGAGTA-3’
pldB-L-Hind3R:5’-GGGAAGCTTGCGATGAGCTGTGCCAGATAG-3’
pldB-R-Hind3F:5’-GGGAAGCTTGAACTGGCGCGACAGTGTCTT-3’
pldB-R-Bgl2R:5’-GGGAGATCTGCAGCGGATCGTCTTCGAGACCCTT-3’
采用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水 30μl
2倍浓缩GC缓冲液 50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM) 16μl
pldB-L-Bgl2F或pldB-R-Hind3F(50pmol/μl) 1μl
pldB-L-Hind3R或pldB-R-Bgl2R(50pmol/μl) 1μl
Mer-11107株总DNA(100ng/μl) 1μl
LA Taq聚合酶(5u/μl,TakaraBio公司) 1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟) 30个循环
72℃5分钟
该反应的结果是,由使用pldB-L-Bgl2F和pldB-L-Hind3R的反应扩增含有序列号1的第64756位碱基至第66302位碱基的1.57kb DNA片段(DNA片段L1),由使用pldB-R-Hind3F与pldB-R-Bgl2R的反应扩增出含有序列号1的第66849位碱基至第68368位碱基的1.54kb DNA片段(DNA片段R1)。用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化DNA片段L1和R1后,用限制性酶BglII和HindIII消化。
用DNA ligation kit ver.2.1(TakaraBio公司)将经限制性酶BglII和HindIII消化的DNA片段L1和R1与经限制性酶HindIII消化的2.3kb潮霉素B抗性基因(由pHP45omegahyg:Gene 190,315-317,1997获得。以下存在简称为hyg的情况)和经限制性酶BamHI消化的穿梭载体pKU253(参照图3)共四种物质连接。这样构建出在DNA片段L1与R1间插入了潮霉素B抗性基因的约5.4kb DNA片段,插入于pKU253中的约21.4kb的质粒pKU253-L1-hyg-R1。
用获得的pKU253-L1-hyg-R1以电穿孔法转化接合大肠杆菌S17-1,获得了S17-1/pKU253-L1-hyg-R1株。将获得的S17-1/pKU253-L1-hyg-R1株接种于10ml含有25μg/ml卡那霉素和100μg/ml潮霉素B的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pKU253-L1-hyg-R1株供体菌悬浮液和10μl Mer-11107株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pKU253-L1-hyg-R1转化株。
将获得的pKU253-L1-hyg-R1转化株接种于10ml不含有核糖霉素的TSB培养基中,于30℃振荡培养24小时。收集pKU253-L1-hyg-R1转化株培养液中的菌体,用10ml灭菌水清洗2次后,悬浮于10ml灭菌水中。将适当稀释的悬浮液涂布于含有200μg/ml潮霉素B的YMS琼脂培养基(0.4%酵母提取物、1%麦芽提取物、0.4%溶性淀粉、2%琼脂、10mM氯化钙)中,于30℃培养4天。将在含有潮霉素B的YMS琼脂培养基中生长的单菌落转接种于含有200μg/ml潮霉素B的YMS琼脂培养基和含有200μg/ml核糖霉素的YMS琼脂培养基中,于30℃培养2天。培养后,以潮霉素B抗性选择核糖霉素敏感性株。获得的菌株是缺失基因组中pldB基因内的546bp(序列号1的第66303位碱基至第66848位碱基),其间插入了潮霉素B抗性基因的pldB缺陷株,称为Mer-11107pldB::hyg株。
(9)普拉地内酯的6位羟化酶基因(pldB)缺陷株的普拉地内酯生产性试验
将200μl前述(8)中获得的Mer-11107pldB::hyg株的冷冻种子接种于20ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.5%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3pH无调整)中,于25℃培养两天。将300μl获得的种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、2%β-环糊精、0.1%CaCO3 pH7.5)中,于25℃培养4天和5天。培养终止后,对20ml获得的培养液添加等量乙腈进行提取。分取其提取液的一部分,用乙腈稀释成5倍量。在下述条件下用HPLC测定普拉地内酯B和ME-265的量。测定结果示于表1中。
(HPLC分析条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm ×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
55% 甲醇(5~13分钟)
55%~70%甲醇(13~17分钟)
70% 甲醇(17~35分钟)
45% 甲醇(35~40分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:10μl
柱温度:40℃
分析时间:35分钟
保留时间:ME-265:22分钟;普拉地内酯B:16分钟
表1
Mer-11107pldB::hyg株 |
ME-265(mg/L) |
普拉地内酯B(mg/L) |
培养4天(96小时) |
1247.7 |
0.0 |
培养5天(120小时) |
1316.6 |
0.0 |
参考例2:编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA-1
(1)链霉菌属菌株A-1544株的基因组DNA的制备
向由1%葡萄糖、0.4%麦芽提取物、1%酵母提取物构成的培养基接种A-1544株,于28℃培养3天。将获得的培养液3000转/分钟离心10分钟收集菌体。使用Blood&Cell Culture kit(QIAGEN公司)从该菌体制备基因组DNA。
(2)克隆编码具有大环内酯类化合物11107B的16位羟化活性的蛋白质的DNA的部分序列
参考推定为天蓝色链霉菌(Streptomyces coelicolor)A3(2)细胞色素P450(CYP105D5)的氨基酸序列,设计并制备以下的混合引物(5Dm-3F和5Dm-3R(参照序列号17和18)。
5Dm-3F:5’-TTCGCSCTSCCSGTCCCSTCSATGGTSAT-3’
5Dm-3R:5’-GTTGATSAYSGASGTSGAGAA-3’
考虑到密码子的摇摆性,为了提高反应性,使用了混合碱基S(=C+G)、Y(=C+T)。
接下来,使用这2种引物(5Dm-3F和5Dm-3R)并以上述(1)获得的A-1544株基因组DNA为模板进行PCR反应。PCR反应使用Takara LATaq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、50℃退火2分钟、68℃延伸30秒的3阶段反应重复进行35次。结果扩增到约500bp大小的DNA片段(以下称为DNA片段-A1)。该DNA片段-A1为编码具有羟化活性的蛋白质的DNA的一部分的可能性高。PCR反应所扩增的DNA片段-A1通过SUPREC PCR(TakaraBio公司)自反应液回收。
接下来,为了获得对于分析所得到的DNA片段-A1的碱基序列而言足量的DNA片段-A1,使用DNA Ligation kit ver.2(TakaraBio公司)将DNA片段-A1连接入质粒载体pT7Blue T(Novagen公司),转化大肠杆菌JM109株。然后,使用含有氨苄青霉素(50μg/mL)、X-gal(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;40μg/mL)、IPTG(异丙基-β-D-硫代吡喃半乳糖苷;100μM)的L-肉汤琼脂培养基(1.0%细菌用胰胨、0.5%酵母提取物、0.5%NaCl、1.5%琼脂)选择所转化的大肠杆菌。将由此分离的转化大肠杆菌的菌落用含有氨苄青霉素(50μg/mL)的L-肉汤液体培养基(1%细菌用胰胨、0.5%酵母提取物、0.5%NaCl)培养。使用质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司)自增殖的转化大肠杆菌菌体分离纯化质粒DNA,获得一定量的DNA片段-A1。
(3)经克隆的DNA片段-A1的碱基序列分析
将前项(2)所获得的DNA片段-A1的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL)通过染料终止子循环测序法分析DNA碱基序列。虽然通过电泳测定的PCR反应所扩增DNA片段-A1为约500bp,但碱基序列分析的结果表明确切地为528bp(参见序列号2的第1775-2302位碱基)。由于在所克隆的上述528bp DNA序列的两端发现有与进行上述PCR反应时使用的2种引物对应的DNA序列,因此明确了上述PCR反应中DNA片段-A1是由这2种引物(5Dm-3F和5Dm-3R)特异性扩增的。
(4)DNA片段-A1的邻近区域的分析
如上所述,由于确定了编码来自A-1544株的、具有羟化活性的蛋白质的部分DNA序列,通过反向PCR法(细胞工学14卷,p.591-593,1995年)对跨越克隆片段的上游、下游域的邻近区域的碱基序列进行扩增、克隆、序列分析。即,将A-1544株基因组DNA(参见前项(1))于H缓冲液(50mMTris-HCl,pH7.5,10mM MgCl2,10mM二硫苏糖醇,100mM NaCl)中分别使用限制酶PstI和SalI分别消化。将获得的各限制酶切断的DNA片段使用DNA Ligation Kit ver.2(TakaraBio公司)进行自身环化。
另一方面,自DNA片段-A1的碱基序列设计并制备以下引物(6PIN-2F和6PIN-2R)(参照序列号19和20)。
6PIN-2F:5’-GCTGCGCCTGGCCCTGGAGGACATCGAGAT-3’
6PIN-2R:5’-CTGTTCCTCGAAGAACTCGTGGTCGGCGTA-3’
接下来,使用这2种引物(6PIN-2F和6PIN-2R)并以上述经自身环化的A-1544株基因组DNA作为模板进行PCR反应。PCR反应使用了TakaraLA Taq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、68℃退火和延伸5分钟的2阶段反应重复35次。
结果扩增了约3.5kbp大小的DNA片段(DNA片段-B1)和约2.8kbp大小的DNA片段(DNA片段-C1),它们极有可能为编码具有羟化活性的蛋白质的DNA以及具有包含其上游和下游区域的DNA序列的DNA。
通过SUPREC PCR(TakaraBio公司)从该PCR扩增反应液回收DNA片段-B1、DNA片段-C1。接下来,对于DNA片段-B1、DNA片段-C1,为了获得足量用于碱基序列分析的各DNA片段,与上述(2)同样,使用质粒载体pT7Blue T(Novagen公司)、DNA Ligation kit ver.2(TakaraBio公司)、大肠杆菌JM109株和质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司),获得一定量的各DNA片段。
(5)DNA片段-B1(约3.5kbp大小)、DNA片段-C1(约2.8kbp大小)的碱基序列分析
将前项(4)所得的DNA片段-B1、DNA片段-C1的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL),通过染料终止子循环测序法分析。进行这样的碱基序列分析了解到自DNA片段-B1、DNA片段-C1序列中得到序列号2所示的3793bp的碱基序列这一信息。
对该3793bp中的开放式阅读框(ORF)进行检索,确定了有2种蛋白质得到编码。将这些蛋白质的氨基酸序列通过BLAST search检索的结果为:序列号2的第1322~2548位碱基中存在编码包含与细胞色素P450具有高同源性的409个氨基酸的蛋白质的ORF(以下称为psmA)。于是,psmA与推定为天蓝色链霉菌A3(2)的细胞色素P450(CYP105D5)的氨基酸序列以及与推定为变铅青链霉菌的细胞色素P450(CYP105D4)的氨基酸序列具有最高的同源性(同源性72.6%)、与灰色链霉菌的细胞色素P450soy(SoyC)也具有比较高的同源性(同源性69.4%)。由此认为psmA为编码细胞色素P450类的羟化酶的基因的可能性高。
另外,在紧挨psmA的下游(序列号2的第2564~2761位碱基)存在编码与2Fe-2S类的铁氧还蛋白具有高同源性的蛋白质的ORF(以下称为psmB)。psmB编码的蛋白质包含66个氨基酸,与紧挨推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列下游的推定为铁氧还蛋白的氨基酸序列具有最高的同源性(83.3%)、与灰色链霉菌的铁氧还蛋白soy(SoyB)也具有较高的同源性(同源性57.6%)。因此认为psmB用于电子转移,与psmA一同编码进行羟化的铁氧还蛋白。
(6)质粒pTC-tpmAB的构建
将pT7NS-CamAB(参见参考例5和WO03/087381)在H缓冲液(50mMTris-HCl,pH7.5,10mM MgCl2,10mM二硫苏糖醇,100mM NaCl)中通过限制酶NdeI和SpeI消化得到质粒消化物。另一方面,参考序列号2的碱基序列,设计并制备了在5’末端添加有NdeI位点的引物DM-NdeF(5’-GCCCCCATATGACGGAACTGACGGACATCA-3’:参照序列号33)和5’末端添加有SpeI位点的引物DM-SpeR(5’-GGGCCACTAGTCAGCCGGCCGGTTCGGTCA-3’:参照序列号34)。然后,接下来,利用这2种引物(DM-NdeF和DM-SpeR)并以前述(1)所获得的A-1544株基因组DNA为模板,进行PCR反应。PCR反应使用Takara LA Taq(宝酒造社)和PCR扩增装置(Biometra社TGradient),将98℃变性20秒、68℃退火和延伸2分钟的2阶段反应重复进行30次。从该PCR扩增反应液中通过SUPREC PCR(宝酒造社)回收含有psmA和psmB的约1.5kbp大小的DNA片段。用限制性酶NdeI和SpeI消化获得的DNA片段,使用DNA Ligation Kit ver.2(TakaraBio公司)连接该消化物和前述pT7NS-camAB质粒消化物。由此,构建了内部含有psmA和spmB这两者的DNA片段和质粒pT7NS-camAB连接的约9.5kbp大小的质粒(有时称为质粒pTC-DM)。
参考例3:编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA-2
(1)链霉菌属菌株Mer-11107株的基因组DNA的制备
向由1%葡萄糖、0.4%麦芽提取物、1%酵母提取物构成的培养基接种Mer-11107株,于28℃培养3天。将获得的培养液3000转/分钟离心10分钟收集菌体。使用Blood&Cell Culture kit(QIAGEN公司)从该菌体制备基因组DNA。
(2)克隆编码具有大环内酯类化合物11107B的16位羟化活性的蛋白质的DNA的部分序列
参考推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列,设计并制备以下的混合引物(5Dm-3F和5D-1R(参照序列号17和21)。
5Dm-3F:5’-TTCGCSCTSCCSGTCCCSTCSATGGTSAT-3’
5D-1R:5’-AGGTGCCCAGCGAGATCATGTT-3’
考虑到密码子的摇摆性,为了提高反应性,使用了混合碱基S(=C+G)、Y(=C+T)。
接下来,使用这2种引物(5Dm-3F和5D-1R)并以上述(1)获得的Mer-11107株基因组DNA为模板进行PCR反应。PCR反应使用Takara LATaq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、50℃退火2分钟、68℃延伸30秒的3阶段反应重复进行35次。结果扩增到约300bp大小的DNA片段(以下称为DNA片段-A2)。该DNA片段-A2为编码具有羟化活性的蛋白质的DNA的一部分的可能性高。PCR反应所扩增的DNA片段-A2通过SUPREC PCR(TakaraBio公司)自反应液回收。
接下来,为了分析对产生的DNA片段-A2的碱基序列,获得足量的DNA片段-A2,使用DNA Ligation kit ver.2(TakaraBio公司)将DNA片段-A2连接入质粒载体pT7Blue T(Novagen公司),转化大肠杆菌JM109株。然后,使用含有氨苄青霉素(50μg/mL)、X-gal(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;40μg/mL)、IPTG(异丙基-β-D-硫代吡喃半乳糖苷;100μM)的L-肉汤琼脂培养基(1.0%细菌用胰胨、0.5%酵母提取物、0.5%NaCl、1.5%琼脂)选择所转化的大肠杆菌。将由此分离的转化大肠杆菌的菌落用含有氨苄青霉素(50μg/mL)的L-肉汤液体培养基(1%细菌用胰胨、0.5%酵母提取物、0.5%NaCl)培养。使用质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司)自增殖的转化大肠杆菌菌体分离纯化质粒DNA,获得一定量的DNA片段-A2。
(3)经克隆的DNA片段-A2的碱基序列分析
将前项(2)所获得的DNA片段-A2的碱基序列使用分析装置(PEBiosystems 377XL)通过染料终止子循环测序法分析DNA碱基序列。虽然通过电泳测定的PCR反应所扩增DNA片段-A2为约300bp,但碱基序列分析的结果表明确切地为325bp(参见序列号3的第837-1161位碱基)。由于在所克隆的上述325bp DNA序列的两端发现有与进行上述PCR反应时使用的2种引物对应的DNA序列,因此明确了上述PCR反应中DNA片段-A2是由这2种引物(5Dm-3F和5D-1R)特异性扩增的。
(4)DNA片段-A2的邻近区域的分析
如上所述,由于确定了编码来自Mer-11107株的、具有羟化活性的蛋白质的部分DNA序列,通过反向PCR法(细胞工学14卷,p.591-593,1995年)对跨越克隆片段的上游、下游域的邻近区域的碱基序列进行扩增、克隆、序列分析。即,将Mer-11107株基因组DNA(参见前项(1))于K缓冲液(50mMTris-HCl,pH8.5,10mM MgCl2,1mM二硫苏糖醇,100mM KCl)中使用限制酶BamHI、于H缓冲液(50mM Tris-HCl,pH7.5,10mM MgCl2,1mM二硫苏糖醇,100mM NaCl)中使用限制酶SalI分别消化。将获得的各限制酶切断的DNA片段使用DNA Ligation Kit ver.2(TakaraBio公司)进行自身环化。
另一方面,自DNA片段-A2的碱基序列设计并制备以下引物(7PIN-2F和6PIN-2R)(参照序列号22和20)。
7PIN-2F:5’-CCATGATCCTGCTGGTGGCCGGCCATGAGA-3’
6PIN-2R:5’-CTGTTCCTCGAAGAACTCGTGGTCGGCGTA-3’
接下来,使用这2种引物(7PIN-2F和6PIN-2R)并以上述经自身环化的Mer-11107株基因组DNA作为模板进行PCR反应。PCR反应使用了Takara LA Taq(TakaraBio公司)和PCR扩增装置(Biometra社TGradient),将98℃变性20秒、68℃退火和延伸5分钟的2阶段反应重复35次。
结果扩增了约1.3kbp大小的DNA片段(DNA片段-B2)、约1.4kbp大小的DNA片段(DNA片段-C2),它们极有可能为编码具有羟化活性的蛋白质的DNA以及具有包含其上游和下游区域的DNA序列的DNA。
通过SUPREC PCR(TakaraBio公司)从该PCR扩增反应液回收DNA片段-B2和DNA片段-C2。接下来,对于DNA片段-B2、DNA片段-C2,为了获得足量用于碱基序列分析的各DNA片段,与上述(2)同样,使用质粒载体pT7Blue T(Novagen公司)、DNA Ligation kit ver.2(TakaraBio公司)、大肠杆菌JM109株和质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司),获得一定量的各DNA片段。
(5)DNA片段-B2(约1.3kbp大小)、DNA片段-C2(约1.4kbp大小)的碱基序列分析
将前项(4)所得的DNA片段-B2、DNA片段-C2的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL),通过染料终止子循环测序法分析。进行这样的碱基序列分析了解到自DNA片段-B2、DNA片段-C2序列中得到序列号3所示的2329bp的碱基序列这一信息。
对该2329bp中的开放式阅读框(ORF)进行检索,确定了有2种蛋白质得到编码。将这些蛋白质的氨基酸序列通过BLAST search检索的结果为:序列号3的第420~1604位碱基中存在编码由与细胞色素P450具有高同源性的395个氨基酸构成的蛋白质的ORF(以下称为bpmA)。于是,bpmA与自A-1544株分离的psmA的氨基酸序列具有最高的同源性(同源性67.4%)、与灰色链霉菌的细胞色素P450soy(SoyC)也具有比较高的同源性(同源性64.8%)。由此认为bpmA编码细胞色素P450类的羟化酶的可能性高。
另外,在紧挨bpmA的下游(序列号3的第1643~1834位碱基)存在编码与2Fe-2S类的铁氧还蛋白具有高同源性的蛋白质的ORF(以下称为bpmB)。bpmB编码的蛋白质由64个氨基酸构成,与自A-1544株分离的psmB的氨基酸序列具有最高的同源性(同源性81.0%),与紧挨推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列下游的推定为铁氧还蛋白的氨基酸序列也具有比较高的同源性(76.2%)。因此认为bpmB用于电子转移,与bpmA一同进行羟化。
参考例4:编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA-3
(1)A-1560株的基因组DNA的制备
向由1%葡萄糖、0.4%麦芽提取物、1%酵母提取物构成的培养基接种A-1560株,于28℃培养3天。将获得的培养液3000转/分钟离心10分钟收集菌体。使用Blood & Cell Culture kit(QIAGEN公司)从该菌体制备A-1560株的基因组DNA。
(2)克隆编码具有大环内酯类化合物11107B的16位羟化活性的蛋白质的DNA的部分序列
参考推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列,设计并制备以下的混合引物(5Dm-3F和5Dm-2R(参照序列号17和23)。
5Dm-3F:5’-TTCGCSCTSCCSGTCCCSTCSATGGTSAT-3’
5Dm-2R:5’-CTGGATSGTGTCSCCSGGYTT-3’
考虑到密码子的摇摆性,为了提高反应性,使用了混合碱基S(=C+G)、Y(=C+T)。
接下来,使用这2种引物(5Dm-3F和5Dm-2R)并以上述(1)获得的A-1560株基因组DNA为模板进行PCR反应。PCR反应使用Takara LATaq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、50℃退火2分钟、68℃延伸30秒的3阶段反应重复进行35次。结果扩增到约750bp大小的DNA片段(以下称为DNA片段-A3)。该DNA片段-A3为编码具有羟化活性的蛋白质的DNA的一部分的可能性高。通过SUPREC PCR(TakaraBio公司)从反应液中回收PCR反应所扩增的DNA片段-A3。
接下来,为了分析对产生的DNA片段-A3的碱基序列,获得足量的DNA片段-A3,使用DNA Ligation kit ver.2(TakaraBio公司)将DNA片段-A3连接入质粒载体pT7Blue T(Novagen公司),转化大肠杆菌JM109株(Stratagene公司)。然后,使用含有氨苄青霉素(50μg/mL)、X-gal(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;40μg/mL)、IPTG(异丙基-β-D-硫代吡喃半乳糖苷;100μM)的L-肉汤琼脂培养基(1.0%细菌用胰胨、0.5%酵母提取物、0.5%NaCl、1.5%琼脂)选择所转化的大肠杆菌。将由此分离的转化大肠杆菌的菌落用含有氨苄青霉素(50μg/mL)的L-肉汤液体培养基(1%细菌用胰胨、0.5%酵母提取物、0.5%NaCl)培养。使用质粒纯化试剂盒(QIAfilterPlasmid Midi Kit,QIAGEN公司)从增殖的转化大肠杆菌菌体分离纯化质粒DNA,获得一定量的DNA片段-A3。
(3)经克隆的DNA片段-A3的碱基序列分析
将前项(2)所获得的DNA片段-A3的碱基序列使用分析装置(PEBiosystems 377XL)通过染料终止子循环测序法分析DNA碱基序列。虽然通过电泳测定的PCR反应所扩增DNA片段-A3为约750bp,但碱基序列分析的结果表明确切地为741bp(参见序列号4的第616-1356位碱基)。由于在所克隆的上述741bp DNA序列的两端发现有与进行上述PCR反应时使用的2种引物对应的DNA序列,因此明确了上述PCR反应中DNA片段-A3是由这2种引物(5Dm-3F和5Dm-2R)特异性扩增的。
(4)DNA片段-A3的邻近区域的分析
如上所述,由于确定了编码来自A-1560株的、具有羟化活性的蛋白质的部分DNA序列,通过反向PCR法(细胞工学14卷,p.591-593,1995年)对跨越克隆片段的上游、下游域的邻近区域的碱基序列进行扩增、克隆、序列分析。即,将A-1560株基因组DNA(参见前项(1))于K缓冲液(50mMTris-HCl,pH8.5,10mM MgCl2,1mM二硫苏糖醇,100mM KCl)中使用限制酶BamHI、于L缓冲液(10mM Tris-HCl,pH7.5,10mM MgCl2,1mM二硫苏糖醇)中使用限制酶KpnI、于H缓冲液(50mM Tris-HCl,pH7.5,10mMMgCl2,1mM二硫苏糖醇,100mM NaCl)中使用限制酶SalI分别消化。将获得的各限制酶切断的DNA片段使用DNA Ligation Kit ver.2(TakaraBio公司)进行自身环化。
另一方面,自DNA片段-A3的碱基序列设计并制备以下引物(5PIN-2F和6PIN-2R(参照序列号24和20))。
5PIN-2F:5’-CGGAATCCACCAGTGCCTCGGCCAGAACCT-3’
6PIN-2R:5’-CTGTTCCTCGAAGAACTCGTGGTCGGCGTA-3’
接下来,使用这2种引物(5PIN-2F和6PIN-2R)并以上述经自身环化的A-1560株基因组DNA作为模板进行PCR反应。PCR反应使用了TakaraLA Taq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、68℃退火和延伸5分钟的2阶段反应重复35次。
结果扩增了约4.5kbp大小的DNA片段(DNA片段-B3)、约3.0kbp大小的DNA片段(DNA片段-C3)和约1.7kbp大小的DNA片段(DNA片段-D3),它们极有可能为编码具有羟化活性的蛋白质的DNA以及具有包含其上游和下游区域的DNA序列的DNA。
通过SUPREC PCR(TakaraBio公司)自该PCR扩增反应液回收DNA片段-B3、DNA片段-C3和DNA片段-D3。接下来,为了获得足量用于碱基序列分析的各DNA片段:DNA片段-B3、DNA片段-C3和DNA片段-D3,与上述(2)同样,使用质粒载体pT7Blue T(Novagen公司)、DNA Ligation kitver.2(TakaraBio公司)、大肠杆菌JM109株和质粒纯化试剂盒(QIAfilterPlasmid Midi Kit,QIAGEN公司),获得一定量的各DNA片段。
(5)DNA片段-B3(约4.5kbp大小)、DNA片段-C3(约3.0kbp大小)和DNA片段-D3(约1.7kbp大小)的碱基序列分析
将前项(4)所得的DNA片段-B3、DNA片段-C3和DNA片段-D3的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL),通过染料终止子循环测序法分析。进行这样的碱基序列分析了解到自DNA片段-B3、DNA片段-C3和DNA片段-D3的序列中得到序列号4所示的1860bp的碱基序列这一情报。
对该1860bp中的开放式阅读框(ORF)进行检索,确定了有2种蛋白质得到编码。将这些蛋白质的氨基酸序列通过BLAST search检索的结果为:序列号4的第172~1383位碱基中存在编码包含与细胞色素P450具有高同源性的404个氨基酸的蛋白质的ORF(以下称为tpmA)。tpmA与推定为天蓝色链霉菌A3(2)的细胞色素P450(CYP105D5)的氨基酸序列具有最高的同源性(同源性77.4%)、与自A-1544株分离的psmA的氨基酸序列也具有高的同源性(同源性76.6%)。由此认为tpmA为编码细胞色素P450类的羟化酶的基因的可能性高。
另外,在紧挨tpmA的下游(序列号4的第1399~1593位碱基)存在编码与2Fe-2S类的铁氧还蛋白具有高同源性的蛋白质的ORF(以下称为tpmB)。tpmB编码的蛋白质包含65个氨基酸,与自A-1544株分离的psmB的氨基酸序列具有最高的同源性(同源性87.3%),与紧挨推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列下游的推定为铁氧还蛋白的氨基酸序列也具有高同源性(82.5%)。因此认为tpmB用于电子转移,编码与tpmA一同进行羟化的铁氧还蛋白。
参考例5:质粒pT7NS-camAB的构建
以恶臭假单胞菌(Pseudomonas putida)ATCC 17453的基因组DNA为模板,用包含以下所示序列的引物PRR-1F(参照序列号29)和PRR-2R(参照序列号30)在下述条件下进行PCR。
PRR-1F:5’-GCCCCCCATATGAACGCAAACGACAACGTGGTCATC-3’
PRR-2R:5’-GCGGATCCTCAGGCACTACTCAGTTCAGCTTTGGC-3’
(PCR反应液组成)
灭菌纯化水 15μl
2倍浓缩GC缓冲液I(宝酒造) 25μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM) 8μl
PRR-1F引物(100pmol/μl) 0.5μl
PRR-2R引物(100pmol/μl) 0.5μl
恶臭假单胞菌ATCC 17453株的基因组DNA(10ng/μl) 0.5μl
LA Taq聚合酶(5u/μl,TakaraBio公司) 0.5μl
(温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟) 30个循环
72℃5分钟
在用限制性酶NdeI和BamHI处理含有获得的恶臭假单胞氧还蛋白还原酶(putidaredoxin reductase)基因(camA)及其基因附近下游的恶臭假单胞氧还蛋白基因(camB)的1.5kb的扩增的片段(camAB片段)后,用0.8%琼脂糖凝胶进行电泳。泳动后,用SUPREC-01(宝酒造)从由凝胶中切出的含有camAB片段的凝胶切片中回收纯化同一片段。用T4DNA连接酶将该片段连接到大肠杆菌质粒载体pET11a(Stratagene公司)的NdeI位点和BamHI位点后,转化大肠杆菌DH5α,构建出质粒pT7-camAB。然后,用T4DNA连接酶将接头1分子连接到该质粒的NdeI位点,其中所述接头1分子是通过将由以下所示的序列构成的两种合成寡DNA SP-1(参照序列号31)和SP-2(参照序列号32)进行退火获得的,转化大肠杆菌DH5α,构建出质粒pT7NS-camAB。
SP-1:5’-TATGCGTCACTAGTCGGGAGTGCGTTA-3’
SP-2:5’-TATAACGCACTCCCGACTAGTGACGCA-3’
实施例1:连接了pldA启动子和psmAB的质粒pPapsmAB的制备
为了使psmAB与普拉地内酯B生物合成基因连动表达,将普拉地内酯B生物合成基因的pldA的启动子区域与psmAB连接。以序列号1的碱基序列信息为基础,为了扩增pldA的启动子区域,合成了如下所示的序列构成的两种引物,pldApro-SpeNdeF(在5’端添加了SpeI和NdeI位点,参照序列号25)和pldApro-NdeR(在5’端添加了NdeI位点,参照序列号26)。
pldApro-SpeNdeF:5’-GGGCATATGACTAGTAGCCGTGTCCTGCCCGCC-3’
pldApro-NdeR:5’-GGGCATATGTTCGGACGTGAATTCATTCG-3’
使用这些引物在以下的条件下进行PCR。
(PCR反应液组成:使用东洋纺织社KOD-plus-)
灭菌纯化水 71μl
10倍浓缩PCR缓冲液 10μl
dNTP混合溶液(dATP,dGTP,dCTP,dTTP各2mM)10μl
MgSO4(25mM) 4μl
KOD+ 2μl
pldApro-SpeNdeF(50pmol/μl) 1μl
pldApro-NdeR(50pmol/μl) 1μl
pKS35(参考例1(6)10ng/μl) 1μl
(反应条件:使用Biometra社T GRADIENT)
95℃5分钟
(98℃20秒,63℃1分钟,68℃1分钟) 25个循环
72℃5分钟
该反应的结果是,用QIAquick PCR纯化试剂盒(QIAGEN公司)回收扩增的360bp的DNA片段。用限制性酶NdeI消化获得的360bp的DNA片段。同样,用限制性酶NdeI消化质粒pTC-DM(参考例2(6))。用DNALigation Kit ver.2(TakaraBio公司)连接获得的360bp的DNA片段的消化物和质粒消化物。由此,构建了使pldA启动子和psmAB连接的约9.9kbp大小的质粒pPapsmAB。
实施例2:重组导入用质粒的制备
用限制性酶SpeI消化实施例1中制备的质粒pPapsmAB后,用BKL试剂盒(TakaraBio公司)将末端平端化。在0.8%的分子生物琼脂糖(注册商标、BIO-RAD公司)上对获得的DNA进行电泳(Mupid-ex:advance公司),切出分离的1.8kbp的含有pldA启动子和psmAB的DNA片段(以后,有时也称为PapsmAB),用QIAquick Gel提取试剂盒(QIAGEN公司)回收纯化。而且,用限制性酶BamHI消化图4所示的重组导入用载体pUC19aph::oriT::intphiC31后,用BKL试剂盒(TakaraBio公司)将末端变为平端。用DNA Ligation Kit ver.2.1(TakaraBio公司)连接所获得的载体和PapsmAB。由此,构建了在整合导入用载体pUC19aph::oriT::intphiC31中插入了PapsmAB的重组导入用质粒pAOC::PapsmAB。
实施例3:重组导入用质粒pAOC::PapsmAB向Mer-11107株中导入
用电穿孔法将获得的pAOC::PapsmAB转化接合大肠杆菌S17-1(ATCC47055),获得了S17-1/pAOC::PapsmAB株。将获得的S17-1/pAOC::PapsmAB株接种于10ml含有25μg/ml卡那霉素的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pAOC::PapsmAB株供体菌悬浮液和10μl Mer-11107株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素(Ribostamycin)的2.5mlSNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pAOC::PapsmAB转化株Mer-11107::pAOC::PapsmAB株。
实施例4:Mer-11107::pAOC::PapsmAB株的普拉地内酯生产试验
对于以实施例3中获得的Mer-11107::pAOC::PapsmAB株和作为对照的亲本株Mer-11107株,进行普拉地内酯B和16位羟基化体的普拉地内酯D的生产性试验。
分别将Mer-11107::pAOC::PapsmAB株和Mer-11107株的冷冻种子300μl接种于60ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将获得的600μl种子培养液接种于60ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol(アデカノ一ル)LG-126、0.1%CaCO3pH7.5),于25℃培养3天、4天、5天和6天。培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体的普拉地内酯D的量。测定结果示于表2中。
此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
55% 甲醇(5~13分钟)
55%~70%甲醇(13~21分钟)
70% 甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B 12.4分钟
普拉地内酯D 4.3分钟
表2
该结果确认了,与亲本株Mer-11107株中几乎没发现生产普拉地内酯D相反,在导入了pAOC::PapsmAB的菌株Mer-11107::pAOC::PapsmAB株中生产普拉地内酯D。由此表明,通过在普拉地内酯B生产菌株Mer-11107株中导入普拉地内酯B的16位羟基化酶基因psmAB,可以直接生产普拉地内酯D。
实施例5:添加β-CD对于Mer-11107::pAOC::PapsmAB株的普拉地内酯D生产的效果
对于实施例3中获得的Mer-11107::pAOC::PapsmAB株中普拉地内酯B及其16位羟基化体普拉地内酯D的生产性,研究了β-环糊精(β-CD)的添加效果。将300μl Mer-11107::pAOC::PapsmAB株的冷冻种子接种于30ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3pH无调整)中,于25℃培养3天。将获得的300μl种子培养液接种于30ml添加了2%β-CD的主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol LG-126、2%β-CD、0.1%CaCO3 pH7.5),或接种于30ml未添加β-CD的主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol LG-126、0.1%CaCO3 pH7.5),于25℃培养3天、4天、5天和6天。培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体-普拉地内酯D的量。测定结果示于表3中。此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
55% 甲醇(5~13分钟)
55%~70%甲醇(13~21分钟)
70% 甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B 12.4分钟
普拉地内酯D 4.3分钟
表3
该结果是,由于添加了2%β-CD,普拉地内酯D的累积量增大至约1.4倍,由此表明β-CD的添加对普拉地内酯D的直接生产有效果。
实施例6:Mer-11107::pAOC::PapsmAB株的普拉地内酯生产(2)
将300μl实施例3制备的Mer-11107::pAOC::PapsmAB株的冷冻种子接种于30ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将获得的300μl种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、1%大豆粉(J-オイルミルズ社:丰年soypro)、0.05%Adekanol LG-126、2%β-CD、0.1%CaCO3 pH7.5),于25℃培养3天、4天、5天、6天和7天。
培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体普拉地内酯D的量。测定结果示于表4中。此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相(容量%):45%~55%甲醇(0~5分钟)
55% 甲醇(5~13分钟)
55%~70%甲醇(13~21分钟)
70% 甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B 12.4分钟
普拉地内酯D 4.3分钟
表4
|
普拉地内酯B(mg/L) |
普拉地内酯D(mg/L) |
培养3天(72小时) |
378.3 |
230.6 |
培养4天(96小时) |
601.4 |
567.9 |
培养5天(120小时) |
480.4 |
874.2 |
培养6天(144小时) |
387.4 |
985.4 |
培养7天(168小时) |
439.1 |
1215.9 |
将50ml通过在前述的培养液中加入等量的乙腈获得的提取液过滤后,用30ml水清洗菌体。在滤液中加入70ml水,用100ml醋酸乙酯提取1次,50mL提取2次。合并醋酸乙酯层,用50ml饱和食盐水清洗2次后,使用无水硫酸钠干燥。除去溶剂后,通过将获得的残渣经薄层层析(MERCKSilicagel 60 F254 0.5mm展开液;甲苯∶丙酮=1∶1)纯化,获得了12.8mg普拉地内酯B,23.1mg普拉地内酯D。普拉地内酯B和普拉地内酯D的1H-NMR分析结果如下。
普拉地内酯B;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重度,结合常数J(Hz)):0.93(3H,d,J=7.0Hz),0.94(3H,d,J=6.8Hz),0.98(3H,t,J=8.0Hz),1.12(3H,d,J=6.8Hz),1.23(3H,s),1.25(1H,m),1.42(2H,m),1.53-1.70(6H,m),1.79(3H,d,J=1.0Hz),2.10(3H,s),2.52(1H,m),2.56(2H,m),2.60(1H,m),2.70(1H,dd,J=2.4,8.3Hz),2.76(1H,dt,J=2.4,5.7Hz),3.56(1H,dt,J=8.3,4.4Hz),3.82(1H,m),5.08(2H,d,J=9.8Hz),5.60(1H,dd,J=9.8,15.2Hz),5.70(1H,dd,J=8.3,15.2Hz),5.74(1H,dd,J=9.8,15.2Hz),6.13(1H,d,J=9.8Hz),6.36(1H,dd,J=9.8,15.2Hz)
普拉地内酯D;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重度,结合常数J(Hz)):0.93(3H,d,J=7.0Hz),0.95(3H,d,J=6.8Hz),0.98(3H,t,J=8.0Hz),1.23(3H,s),1.30(1H,m),1.36-1.66(9H,m),1.70(1H,dd,J=6.4,14.2Hz),1.82(3H,d,J=1.0Hz),1.90(1H,dd,J=6.4,14.2Hz),2.10(3H,s),2.52(2H,m),2.62(1H,m),2.72(1H,dd,J=2.4,8.3Hz),2.94(1H,dt,J=2.4,5.7Hz)3.55(1H,dt,J=8.3,4.4Hz),3.82(1H,m),5.10(1H,d,J=9.8Hz),5.11(1H,d,J=10.8),5.60(1H,dd,J=9.8,15.2Hz),5.74(1H,dd,J=8.3,15.2Hz),5.92(1H,d,J=15.2Hz),6.18(1H,d,J=10.8Hz),6.57(1H,dd,J=10.8,15.2Hz),
实施例7:重组导入用质粒pAOC::PapsmAB向Mer-11107pldB::hyg株的导入
将实施例3中获得的S17-1/pAOC::PapsmAB株接种于10ml含有25μg/ml卡那霉素的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时,将参考例1(8)制备的Mer-11107pldB::hyg株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pAOC::PapsmAB株供体菌悬浮液和10μl Mer-11107pldB::hyg株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素(Ribostamycin)的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pAOC::PapsmAB转化株Mer-11107pldB::hyg::pAOC::PapsmAB株。
实施例8:Mer-11107pldB::hyg::pAOC::PapsmAB株的普拉地内酯生产试验
对于实施例7获得的Mer-11107pldB::hyg::pAOC::PapsmAB株和作为对照的亲本株的Mer-11107pldB::hyg株,对ME-265及其16位羟基化体ME-282的生产性进行试验。分别将Mer-11107pldB::hyg::pAOC::PapsmAB株和Mer-11107pldB::hyg株300μl冷冻种子接种于30ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将300μl获得的种子培养液接种于30ml添加了2%的β-CD的主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol LG-126、2.0%β-CD、0.1%CaCO3pH7.5)中,于25℃培养3天、4天、5天和6天。培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定ME-265及其16位羟基化体ME-282的量。测定结果示于表5。而且,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
55% 甲醇(5~13分钟)
55%~70%甲醇(13~17分钟)
70%甲醇(17~35分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:35分钟
保留时间:ME-26521.0分钟
ME-28215.6分钟
表5
该结果确认了,与亲本株Mer-11107pldB::hyg株中几乎没发现生产ME-282相反,在导入了pAOC::PapsmAB的菌株Mer-11107pldB::hyg::pAOC::PapsmAB株中生产ME-282。由此表明,通过向ME-265生产菌株Mer-11107pldB::hyg株中导入ME-265的16位羟基化酶基因psmAB,可以直接生产ME-282。
向约90ml通过在前述的Mer-11107pldB::hyg::pAOC::PapsmAB株的培养液中添加等量的乙腈获得的提取液中添加过滤助剂并混合后,用桐山ロ一ト60φ(桐山滤纸No.4)过滤,分离菌体。用50ml水清洗菌体,获得菌体分离滤液。用100ml醋酸乙酯提取菌体分离滤液2次。用无水硫酸钠干燥后,除去溶剂获得残渣。通过薄层层析(MERCK Silicagel 60 F254 0.5mm展开液;甲苯∶丙酮=1∶1)纯化,获得了0.5mg ME-265,12.5mgME-282。ME-265和ME-282的1H-NMR分析结果如下。
ME-265;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重度,结合常数J(Hz)):0.87(3H,d,J=7.0Hz),0.90(3H,d,J=7.0Hz),0.94(3H,d,J=7.3Hz),0.97(3H,d,J=7.0Hz),1.08(3H,d,J=7.0Hz),1.17-1.21(1H,m),1.24-1.36(2H,m),1.42-1.52(3H,m),1.61-1.66(3H,m),1.74(3H,d,J=1.1Hz),1.89-1.96(1H,m),2.00(3H,s),2.41-2.47(1H,m),2.43(1H,dd,J=5.5,13.9Hz),2.51-2.58(1H,m),2.56(1H,dd,J=3.7,13.9Hz),2.65(1H,dd,J=2.2,8.1Hz),2.72(1H,dt,J=2.2,5.9Hz),3.51(1H,dt,J=4.4,8.4Hz),3.75-3.80(1H,m),4.91(1H,dd,J=8.8,10.6Hz),5.00(1H,d,J=10.6Hz),5.42(1H,dd,J=9.2,15.0Hz),5.49(1H,dd,J=9.2,15.0Hz),5.65(1H,dd,J=8.4,15.0Hz),6.08(1H,d,J=10.6Hz),6.32(1H,dd,J=10.6,15.0Hz)
ME-282;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重性,结合常数J(Hz)):0.87(3H,d,J=7.0Hz),0.90(3H,d,J=7.0Hz),0.94(3H,d,J=7.3Hz),0.97(3H,d,J=6.6Hz),1.21-1.26(1H,m),1.29-1.37(3H,m),1.34(3H,s),1.42-1.52(2H,m),1.60-1.64(1H,m),1.65(1H,dd,J=6.2,13.9Hz),1.77(3H,d,J=1.1Hz),1.86(1H,dd,J=5.4,13.9Hz),1.89-1.94(1H,m)2.00(3H,s),2.43(1H,dd,J=5.5,13.9Hz),2.50-2.60(1H,m),2.56(1H,dd,J=3.3,13.9Hz),2.66(1H,dd,J=2.2,7.7Hz),2.89(1H,dt,J=2.2,6.2Hz),3.52(1H,dt,J=4.8,8.4Hz),3.75-3.80(1H,m),4.90(1H,与D2O重叠),5.01(1H,d,J=10.6Hz),5.42(1H,dd,J=9.2,15.0Hz),6.13(1H,d,J=10.6Hz),6.52(1H,dd,J=11.0,15.0Hz)
实施例9:制备连接了ermE启动子和psmAB的质粒pPepsmAB
为了使用ermE启动子表达psmAB,使ermE启动子区域与psmAB连接。以序列号2的碱基序列信息为基础,合成用于扩增psmAB的由如下所示的序列构成的两条引物,eDM-SphF(5’末端添加了SphI位点:参照序列号27)和eDM-SphR(5’末端添加了SphI位点:参照序列号28)。
eDM-SphF:5’-TCCCCGCATGCCGGAACTGACGGACATCAC-3’
eDM-SphR:5’-CCCGGGCATGCAGACGACGACGTAGAGGAA-3’
使用这些引物在以下条件下进行PCR。
(PCR反应液组成:使用TakaraBio公司LA Taq)
灭菌纯化水 17μl
2倍浓缩GC缓冲液II 25μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2mM)5μl
LA Taq 0.5μl
eDM-SphF(50pmol/μl) 0.5μl
eDM-SphR(50pmol/μl) 0.5μl
链霉菌A-1544株基因组DNA
(参考例2(1)10ng/μl) 1μl
(反应条件:使用Biometra公司T GRADIENT)
95℃3分钟
(98℃20秒,68℃4分钟) 30个循环
68℃5分钟
该反应的结果是,用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化扩增的1570bp的含有psmAB的DNA片段。用限制性酶SphI消化获得的1570bp的DNA片段。同样,用限制性酶SphI消化质粒pSK117(参照J.Bacteriol.vol.2002 184,6417-6423)。用DNA Ligation Kitver.2.1(TakaraBio公司)连接获得的1570bp的含有psmAB的DNA片段的消化物和质粒消化物。由此,构建了使ermE启动子和psmAB连接的质粒pPepsmAB。
实施例10:载入了与ermE启动子相连接的psmAB的重组导入用质粒的制备
用限制性酶KpnI和BglII消化实施例9中制备的质粒pPepsmAB,用BKL试剂盒(TakaraBio公司)将末端平端化。在0.8%的分子生物学琼脂糖(注册商标、BIO-RAD公司)上对获得的DNA进行电泳(Mupid-ex:advance公司),切出分离的2060bp的含有ermE启动子和psmAB的DNA片段(以后,称为PepsmAB),用QIAquick Gel提取试剂盒(QIAGEN公司)回收纯化。而且,用限制性酶BamHI消化图4所示的重组导入用载体pUC19aph::oriT::intphiC31后,用BKL试剂盒(TakaraBio公司)将末端变为平端化。用DNA Ligation Kit ver.2.1(TakaraBio公司)连接所获得的载体和PepsmAB。由此,构建了在重组导入用载体pUC19aph::oriT::intphiC31中插入了PepsmAB的重组导入用质粒pAOC::PepsmAB。
实施例11:载入了天然型psmAB的重组导入用质粒的制备
参考序列号2的碱基序列,设计并制备了在5’末端添加有BglII位点的引物DM-BglF(5’-CGCATAGATCTTCACCCGAGCGGGTGATCA-3’:参照序列号35)和5’末端添加有BglII位点的引物DM-BglR(5’-TCCCGAGATCTTGAAGGTCCGCGTCACCGT-3’:参照序列号36)。然后,接下来,利用这2种引物(DM-BglF和DM-BglR)并以参考例2(1)所获得的A-1544株基因组DNA为模板,进行PCR反应。PCR反应使用Takara LA Taq(TakaraBio公司)和PCR扩增装置(Biometra公司T Gradient),将98℃变性20秒、63℃退火30秒,68℃延伸4分钟的3阶段反应重复进行30次。自该PCR扩增反应液中通过琼脂糖凝胶电脉和SUPREC 01(TakaraBio公司)回收含有天然型psmA和psmB的约3.5kbp大小的DNA片段(以后称为PopsmAB)。用限制性酶BglII消化获得的DNA片段。而且,用限制性酶BamHI消化图4所示的重组导入用载体pUC19aph::oriT::intphiC31。用DNA Ligation Kit ver.2.1(TakaraBio公司)连接这样获得的载体和PopsmAB。由此,构建了在重组导入用载体pUC19aph::oriT::intphiC31中插入了PopsmAB的重组导入用质粒pAOC::PopsmAB。
实施例12:重组导入用质粒pUC19aph::oriT::intphiC31、pAOC::PepsmAB和pAOC::PopsmAB向Mer-11107株中导入
用电穿孔法分别将获得的重组导入用载体pUC19aph::oriT::intphiC31和实施例10和11中获得的pAOC::PepsmAB和pAOC::PopsmAB转化接合大肠杆菌S17-1(ATCC47055),分别获得了S17-1/pUC19aph::oriT::intphiC31株、S17-1/pAOC::PepsmAB株、S17-1/pAOC::PopsmAB株。将获得的这3个菌株接种于10ml含有25μg/ml卡那霉素的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。分别将所获得的这3个菌株的供体菌悬浮液各500μl与10μlMer-11107株受体菌悬浮液混合,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素(Ribostamycin)的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pUC19aph::oriT::intphiC31转化株Mer-11107::pAOC株、pAOC::PepsmAB转化株Mer-11107::pAOC::PepsmAB株和pAOC::PopsmAB转化株Mer-11107::pAOC::PopsmAB株。
实施例13:Mer-11107::pAOC株、Mer-11107::pAOC::PepsmAB株、Mer-11107::pAOC::PopsmAB株的普拉地内酯生产试验
对于以实施例12中获得的Mer-11107::pAOC株、Mer-11107::pAOC::PepsmAB株、Mer-11107::pAOC::PopsmAB株,进行普拉地内酯B和16位羟基化体普拉地内酯D的生产性试验。将Mer-11107::pAOC株、Mer-11107::pAOC::PepsmAB株、Mer-11107::pAOC::PopsmAB株的冷冻种子各300μl接种于20ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将获得的300μl种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.1%CaCO3 pH7.5),于25℃培养4天。培养终止后,对获得的培养液添加9倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体普拉地内酯D的量。测定结果示于表6中。此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相(容量%):45%~55%甲醇(0~5分钟)
55% 甲醇(5~13分钟)
55%~70%甲醇(13~21分钟)
70% 甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B 12.4分钟
普拉地内酯D 4.3分钟
表6
|
Mer-11107::pAOC株 |
Mer-11107::pAOC::PepsmAB株 |
Mer-11107::pAOC::PopsmAB株 |
普拉地内酯B(mg/L) |
243.0 |
309.0 |
241.3 |
普拉地内酯D(mg/L) |
0.0 |
54.8 |
18.8 |
该结果确认了,与只导入载体的Mer-11107::pAOC株中几乎没发现生产普拉地内酯D相反,在导入了pAOC::PepsmAB或pAOC::PopsmAB的菌株Mer-11107::pAOC::PepsmAB株和Mer-11107::pAOC::PopsmAB株中生产普拉地内酯D。由此表明,通过在普拉地内酯B生产菌株Mer-11107株中导入普拉地内酯B的16位羟基化酶基因psmAB,可以直接生产普拉地内酯D。
实施例14:包含变异型psmA的pPampsmAB的制备
为了在psmA中导入位点特异性变异,以实施例1制备的pPapsmAB为模板,使用QuickChangeTM位点导向性诱变试剂盒导入变异,制备了pPampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY。
首先,合成由如下所示的序列构成的引物R91C-F和R91C-R(参照序列号37和38),
R91C-F:5’-TTCGCGGCCGTCTGCGACCGGCGGGTG-3’
R91C-R:5’-CACCCGCCGGTCGCAGACGGCCGCGAA-3’
以pPapsmAB作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第91位的精氨酸替代为半胱氨酸的pPampsmAB-C。然后,合成以下所示的序列构成的引物R195L-F和R195L-R(参照序列号39和40),
R195L-F:5’-TCGCAAGGGGCGCTCGAGCGGCTCGAG-3’
R195L-R:5’-CTCGAGCCGCTCGAGCGCCCCTTCCGA-3’
以pPampsmAB-C作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第195位的精氨酸替代为亮氨酸的pPampsmAB-CL。然后,合成以下所示的序列构成的引物L403M-F和L403M-R(参照序列号41和42),
L403M-F:5’-ACGATCCAGGGGATGATGGAACTCCCCGTGA-3’
L403M-R:5’-TCACGGGGAGTTCCATCATCCCCTGGATCG-3’
以pPampsmAB-CL作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第403位的亮氨酸替代为蛋氨酸的pPampsmAB-CLM。然后,合成以下所示的序列构成的引物R236L-F和R236L-R(参照序列号43和44),
R236L-F:5’-AGCTGGACCGACTCGACGTGGTGGCGCTGG-3’
R236L-R:5’-AGCGCCACCACGTCGAGTCGGTCCAGCTC-3’
以pPampsmAB-CLM作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第236位的精氨酸替代为亮氨酸的pPampsmAB-CLLM。然后,合成以下所示的序列构成的引物I244F-F和I244F-R(参照序列号45和46),
I244F-F:5’-TGGCGCTGGCCGTCTTCCTGCTCGTGG-3’
I244F-R:5’-CCACGAGCAGGAAGACGGCCAGCGCCACCA-3’
以pPampsmAB-CLM作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第244位的异亮氨酸替代为苯丙氨酸的pPampsmAB-CLFM。然后,合成以下所示的序列构成的引物M112T-F和M112T-R(参照序列号47和48),
M112T-F:5’-CAGCGGCGGATGACGATCCCGTCGTTC-3’
M112T-R:5’-GAACGACGGGATCGTCATCCGCCGCTG-3’
以pPapsmAB作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第112位的蛋氨酸替代为苏氨酸的pPampsmAB-T。然后,合成以下所示的序列构成的引物R195Y-F和R195Y-R(参照序列号49和50),
R195Y-F:5’-AGGGGCGCGCGAGTACCTCGAGGAGTACCT-3’
R195Y-R:5’-GGTACTCCTCGAGGTACTCGCGCGCCCCTT-3’
以pPapsmAB-T作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第195位的精氨酸替代为酪氨酸的pPampsmAB-TY。
实施例15:通过双同源重组制备导入质粒
通过确定参考例1(7)普拉地内酯生物合成基因簇的碱基序列,我们认为可以使用确定的含有参与普拉地内酯的生物合成的DNA及其周边的DNA的碱基序列,通过双同源重组导入psmAB或其变体,用以下的方法制备导入用质粒。
为了扩增用于双同源重组的同源序列,基于参与普拉地内酯的生物合成的DNA的下游的碱基序列,合成由以下序列构成的4条引物,pldout-L-Bgl2F、pldout-L-Sph1R、pldout-R-Sph1F和p1dout-R-Bgl2R(参照序列号51、52、53和54)。
pldout-L-Bgl2F:5’-GGGAGATCTGCAGGTCATCGGGGGGAAGAACCACA-3’
pldout-L-Sph1R:5’-TCTCCAGCCGCATGCGGTCCCGGGTCACCGT-3’
pldout-R-Sph1F:5’CCCGCATGCGGCTGGAGATCATCCAGAGCGCA-3’
pldout-R-Bgl2R:5’-GGGAGATCTAGAACATGCCGGGCCAGAGGCTGAC-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水 30μl
2倍浓缩GC缓冲液II 50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM) 16μl
pldout-L-Bgl2F或pldout-R-Sph1F(50pmol/μl) 1μl
pldout-L-Sph1R或pldout-R-Bgl2R(50pmol/μl) 1μl
Mer-11107株总DNA(100ng/μl) 1μl
LA Taq聚合酶(5u/μl,宝酒造社) 1μl
(反应温度条件)
95℃3分钟
(98℃20秒,65℃30秒,68℃3分钟) 30个循环
72℃5分钟
该反应的结果是,由使用pldout-L-Bgl2F和pldout-L-Sph1R的反应扩增2.08kb DNA片段(DNA片段LZ),由使用pldout-R-Sph1F与pldout-R-Bgl2R的反应扩增出2.73kb DNA片段(DNA片段RX)。用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化DNA片段LZ和RX后,用限制性酶BglII和SphI消化。
然后,为了扩增潮霉素抗性基因,基于碱基序列,合成由下述序列构成的两种引物hyg-SpeSphF和hyg2-SphR(参照序列号55和56)。
hyg-SpeSphF:5’-GGGGCATGCGGACTAGTACACCGTCGCCTCGGT-3’
hyg2-SphR:5’-GCCGCATGCGTCAGGCGCCGGGGGCGGTGT-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水 30μl
2倍浓缩GC缓冲液II 50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM) 16μl
hyg-SpeSphF(50pmol/μl) 1μl
hyg2-SphR (50pmol/μl) 1μl
吸水链霉菌(Streptomyces hygroscopicus)JM 4772株总DNA(100ng/μl) 1μl
LA Taq聚合酶(5u/μl,宝酒造社) 1μl
(反应温度条件)
95℃6分钟
(98℃20秒,63℃30秒,68℃2分钟) 30个循环
72℃5分钟
该反应的结果是,用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化扩增的1.21kb的DNA片段(DNA片段hyg2),用限制性酶SphI消化。
用DNA ligation kit ver.2.1(TakaraBio公司)将经限制性酶BglII和SphI消化的DNA片段LZ和RX,经限制性酶SphI消化的DNA片段hyg2和经限制性酶BamHI消化的穿梭质粒pKU253(参照图3)这四者连接。这样在DNA片段LZ与RX间插入了DNA片段hyg2的约6.0kb的DNA片段通过插入至pKU253中的约22kb的双同源重组构建了导入用质粒pKU253-LZ-hyg2-RX。
实施例16:通过双同源重组向导入用质粒pKU253-LZ-hyg2-RX插入psmAB或其变体
用限制性酶SpeI消化实施例1中构建的pPapsmAB和实施例14中构建的pPampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY。用限制性酶SpeI消化的各DNA在0.8%的CertifiedTM分子生物学琼脂糖(BIO-RAD公司)上进行电泳(Mupid-ex:advance公司),切出分离的1.8kbp的含有pldA启动子和psmAB或其变体的DNA片段(下文中有时也称为PapsmAB,PampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY),用QIAquick凝胶提取试剂盒(QIAGEN公司)回收并纯化。用DNA ligation kit ver.2.1(TakaraBio公司)将这样获得的各DNA 片段(PapsmAB,PampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY)与经限制性酶SpeI消化的实施例15中制备的pKU253-LZ-hyg2-RX相连接。通过双同源重组构建了在pKU253-LZ-hyg2-RX的hyg2的上游插入了以上各DNA片段(PapsmAB,PampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY)的约24kb的psmAB或其变体导入质粒pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX。
实施例17:通过双同源重组向Mer-11107株插入psmAB或其变体
采用电穿孔法分别以pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化接合大肠杆菌S17-1,获得了S17-1/pKU253-LZ-hyg2-PapsmAB-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLFM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-TY-RX株。将获得的S17-1/pKU253-LZ-hyg2-PapsmAB-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLFM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-TY-RX株分别接种于10ml含有25μg/ml卡那霉素和100μg/ml潮霉素B的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药社)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pKU253-LZ-hyg2-PapsmAB-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLFM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-TY-RX株供体菌悬浮液和10μl Mer-11107株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药社)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化株。将获得的pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化株分别接种于10ml不含有核糖霉素的TSB培养基中,于30℃振荡培养24小时。收集pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化株培养液中的菌体,用10ml灭菌水清洗2次后,悬浮于10ml灭菌水中。将适当稀释的悬浮液涂布于含有200μg/ml潮霉素B的YMS琼脂培养基(0.4%酵母提取物、1%麦芽提取物、0.4%溶性淀粉、2%琼脂、10mM氯化钙)中,于30℃培养4天。将在含有潮霉素B的YMS琼脂培养基中生长的单菌落转接种于含有200μg/ml潮霉素B的YMS琼脂培养基和含有200μg/ml核糖霉素的YMS琼脂培养基中,于30℃培养2天。培养后,以潮霉素B抗性选择核糖霉素敏感性株。获得的菌株是在基因组中的参与普拉地内酯的生物合成的DNA下游(序列号1的第73362位碱基和第73369位之间)插入了潮霉素B抗性基因的hyg2和psmAB或其变体的菌株,分别称为Mer-11107-ZX::hyg2::PapsmAB株,Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株。
实施例18:Mer-11107-ZX::hyg2::PapsmAB株,Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株的普拉地内酯生产
将实施例17获得的Mer-11107-ZX::hyg2::PapsmAB株,Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株的冷冻种子各500μl接种于25ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将300μl获得的种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、1%soypro、0.05%Adekanol LG-126、2%β-环糊精、0.1%CaCO3 pH7.5)中,于25℃培养6天。
培养终止后,对获得的培养液添加4倍量乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯D,普拉地内酯D的20位羟基化体普拉地内酯H13和普拉地内酯D的21位酮体普拉地内酯C2,普拉地内酯D的20位羟基化、21位酮体普拉地内酯C3的量。测定结果示于表7中。此外,HPLC的测定条件如下所示。
(HPLC分析条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(4.6×50mm 3μm)
移动相:20%~35%乙腈(0~13分钟)
35%-100%乙腈(13~17分钟)
20%乙腈(17~22分钟)
流速:1.0ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:22分钟
保留时间:普拉地内酯H13;5.5分钟、
普拉地内酯C3;8.3分钟、
普拉地内酯D;9.0分钟、
普拉地内酯C2;11.1分钟
该结果确认了,与导入了PapsmAB的Mer-11107-ZX::hyg2::PapsmAB株中普拉地内酯D的生产和大量生产普拉地内酯D的分解物-普拉地内酯H13、普拉地内酯C2、普拉地内酯C3相反,在导入了PampsmAB-CLM,PampsmAB-CLLM,PampsmAB-CLFM,PampsmAB-TY的菌株Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株中生产普拉地内酯D,并且普拉地内酯D的分解物-普拉地内酯H13、普拉地内酯C2、普拉地内酯C3的生产减少到约四分之一。由此表明,通过在普拉地内酯B生产菌株-Mer-11107株中导入普拉地内酯B的16位羟基化酶基因psmAB的变体,可以直接生产普拉地内酯D并且降低普拉地内酯D的分解物的生产。
序列表
<110>卫材R&D管理有限公司
<110>美露香株式会社
<120>基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法
<130>06011PCT
<150>2005-154114
<151>2005-05-26
<160>56
<210>1
<211>74342
<212>DNA
<213>链霉菌属(Streptomyces sp.)
<400>1
cgattttgca ccttgtccat cgctggtggt gtgaggcatg ctcctattgg aacataaaac 60
ctctgaacct ttaagaggtt atggcggagg ctttcgacgc gacacgaggg agaagcggat 120
gagaatcgtg gggattcacc gggagggcgc aggcatagag gtggcccggc tgtcggacga 180
cgggcggcgg gcagtcgtgc tggccccgct cgaagtcttc tgggccgacg ccaccggcca 240
tctggcgcgc ggggacggtg gaccagtcgt cccggtgtcc gcggtggagc tggtaccgcc 300
ggttctgccg gacgcgcggg tgatctgcat cgggctcaac tacctcaagc atgtggccga 360
gggaacctac cgcgaccagg aagtccccga gcaccccacg ctgttcgccc gctggacacg 420
gtcgctgacc gtggacggag ccgaggtccc ggtgccctcg gacgaggccg ggctggactg 480
ggagggtgag gtggtggcct gggtgggcgc accactcgtg gacgccacgc cggaggaggc 540
gctgaccgcc gtcatcggct actccctctt caacgacctc acctcccggc gggctcagaa 600
gctcacctct cagtggaccc tgggcaagaa cggggacaac tccggcccgc tcgggccgat 660
ggtgccggct gccgaggtgg gcgacctgcg cgacgggctg cgggtacaga cccgggtcaa 720
cggggagacg atgcaggatg gcagcacgga cgagatggtc tacaccgtgg gtgacacgct 780
cgcgcacatc tcccgcacct tcatcctgcg tcccggcgac ctgctggcga cgggcacccc 840
gtccggagtc ggctacgccc ggaccccacc gcagctcctg cagccgggag acgtcgtcga 900
ggtggaggtc gaacggctcg gcgtgctgcg caaccccgtg gtgtccaacg acgcccggct 960
gcgcgcaccc aagtgaggac gcaagaggcc ccgcgcccgc ccgcggaacg cgggtgctcg 1020
ccctgcggca cacgccgcag gacacacctg gtcaccgtcc tgcgtcgccg ggtcctgcgg 1080
tggggcaccg ttgaccgtgg tcaaggacta caccgagaac cagaagcgcc cggactgagc 1140
gcggcccgat cgtgggagca ttccgaagcg aggcggcggc gctccgcgcc gccttgctca 1200
ggatgcgttt cctcccgggc gtgaacgccc ggggttcctc gcacggtcag gctgagactt 1260
ctctcacatg gggagtccag tcgtcggccg gatctgcggc cggagccggt accggcggcg 1320
agggctggaa cggcgaactc acgtactcct ccacgagcgg attacggtgc gggacacgaa 1380
aggtcggaga ccagggggcg gctcgggccg gggattaggc gtaggggtgg ctgatggtgt 1440
gctggcgccg ggcggtggcc aggacgttgt cagggaagcg ggagccggcg acgtagtggc 1500
ggcccttggt ctgccccacc gccgtcagca gctccgcctt ggtcagggcc tgcaggtccc 1560
gtgtggcctg ctgggtgttg agggcctcgg ctcgctcata gcgcgagcgg cgaacccggc 1620
ccaccatcgc cacctcgtgc agcgcggtga tctgccgctc ggtgatcccg aggctgtcgg 1680
cggcgtccat gagctgcctc cagcagtcgt tggagcggtc gacgcggcgc tgcacccgct 1740
gggtctgctg gtggtaggcg agcaggttga agcggatcca cggcccggtg tcgcgcttcg 1800
gtgagtagac cgggccgccg acctcgcgca gcgctttgta gtactcccag gtgttgcccg 1860
gcatgcccag ccactcctcg atggaggaga actccggcgc cagcactccg ccccgggcga 1920
tgaccagcgt ctgcagggag cgggacatcc gcccgttccc gtccgaccac gggtggatct 1980
tcaccaggtt caggtgcgcc atcgccgccc gcaccaggac gtgggcgtcc aggtcgccgt 2040
cgttgagcca gtccaccagc tcgcccatca ggcccggcag caggtcggcg tccgggcctt 2100
cgtagtcggt ggccagctcg tcgccggggg cggtgatgcg gatcgcagtg cgacgccact 2160
ggccggccag ccgcagcgga tggtggtggc cctgcagcat ccagtgcagc gagttgagca 2220
actccttgct gtagctgaag tcgcctacgt cgtgcaggga ctggatgtag gccatcgcct 2280
gctggtaggc cagcgtctcg gccttgttct cctcgctggc atccacggca tcgcgttcgc 2340
cgtccatcag gtccgcgaca tccttcgcat cgacctggta accctcgatg gtgttggacg 2400
ccgcgatcgc gctggccgtc agcgccttgc gcagatcctg cgtccacttc gtcggcacct 2460
gctgcaccgc gtggcgcagc tgctcctgca gggaattgat ctcctccagg acccggcggt 2520
cgtcggtggt gaggtgaggc gtctgataca gcataagtga atgatacctg actcctatca 2580
ttccttcaac gctgcggctt catcaccgtc cgtccacgat gaacatgaac tcgcccagct 2640
cgacgagcag ggccaccggc ctgccgaccc acgctggtca ctgatcaaca caccaggtca 2700
acgagtacgt ctgcaggact ggatggagtg acaggcagcg cggggcagcc aagcaggcgg 2760
cgcgaccacg taacggaccg gcgaacccga gctgagcacc ggtgagctcc gcgaccggct 2820
gactgccctc agctacaaca tcgagaacag ctggccgagc ttgcccggag ccggcggcgc 2880
ggatcacgtc cgccgtgtgt gcgaggggcg cgccgcttcc ggcggtgtcg tcgacgccag 2940
gcccgccaag ttgctgagcg acgcggcgtt ccggacgtcc gcacgtcgcg gatcccgaga 3000
cgaggggtga gccaagccgc cgggatcacg ccgccgcgca tgatgcctac cacggcttgc 3060
cgatgtggag gctgggcaga gatcccctca gcctccggta cgtcgacggg caggcacccg 3120
cctggccgga gctccgtgcg gggccgttgg agcggagtgt gcccccgcac cggagacccg 3180
ccaggactcc gtgcgaccaa aagactcttc gtctcacctg gtctcacaca tctctcacaa 3240
acgagagcgc acgggagcac gcgagaacct ctgacctgga cattcgctgt cgccacggac 3300
cacggcggac caggtagaca ttacataggc taggactcga ttctagtgat caagtcaaat 3360
gcccaggtca gaggctgttt ttgctgttcg ccgagggctg atatctcaca tatttattgc 3420
tggaactgcg gcacaaggtc gagatccatc ggatgaccgg gcgggtcgtc gagtgctcga 3480
tcgacgaggt ggaccgcccg cgggtatcca aggacgccgc cctgcggatc ccgccgaccg 3540
agctggaggt caggcgctgt tcatcggctg ggttggcgag ctggcgactt gccgcaagtt 3600
cgccctcacc gcgcggaact acaccgcatc gaaactgatg tcgtaggtcg ggctcggggt 3660
gagcgaggca tgcaaactcg acctggccga catcaagtgg gacctgggcc gcttcggcaa 3720
gctccatgtg cgtcacggcg agggcgcccg cggctcgggt ccgcgcgagc ggatggtgcc 3780
gctgatcaac ggcgccgacc gcatgctgcg gtggttcatc gaggacgtcc ggggccagtt 3840
cgacgacgac cgcacccgcc ccggtgcccc gctgttcccc tctgagcgca agaacgccgt 3900
cggctcctcg cgcctcgtcg gcgacgacgc gttgcgcaac ggtctggccg ccgcggcgga 3960
ggtcgcgtcc aaaaggtggt gtaaaaggcg acgagcgaaa gtttcgtact gaacagccaa 4020
gttcgtacga aaggacccac gctcgtgtag tcacgagtgt cacccatcga ggcgatccat 4080
gccgagatcg atgccgtctt cgcctagtac tgcaacggtg tttgccgtga cggttgggca 4140
ggctggtcgt tggtctgagc atgggtgggg accttgctga tgtcggggtg tgggccagtg 4200
aagtggacgc tgtgcacgag aggttcgtgc accggttttc cagggcggag ccgcgggagt 4260
cggcgcttgc ctatatgcgg ggactgaccg ctccgctgga gcggaagaac ggctggacac 4320
tggccgaaca ggccggtcat gtcgctccgg accgtattca tcgactgctg aaccggatcg 4380
agtgggaagc cgatgaggtc ctggccgatg tgcgcgacta cgtcatggag aacctcggcg 4440
accccgaggc cctcatcgtg gacgacaccg gcttcctgaa gaaggggacc cgttcggcag 4500
ggggccggcg tcagtactcc gggaccgcgg gggcctgtat ttcaattact gctcggtgaa 4560
cgggtgttgg cgggacaatg agatgtgact gcgcgcacgg ccgctcgggc ctcagttgtg 4620
gctttgaggg cgaagttcga tcagttcctt ccccatctcg atgagcggcg ccgtcggatc 4680
tacctggcca gcgaggccgc cgcgcttggc cacggcggga tcacgctggt ggccaccgct 4740
tccggcgcca gtgcggccac catcgcacgc gggatcgccg agctgtccgg gcacactctg 4800
ccggccgggc ggatccgggc tccgggagcc ggccgcaagc cggtcacggt caccgacccc 4860
ggtctgctgc ccgcgcttga agctctgatc gagccgcaca cccggggcga tccggtctcg 4920
ccattgcgct ggaccacgct ctcgctgcgg tccctggcct cggcgctgac cactcagggc 4980
cacccggtca gcgcggcgac cgtcggacgc ctgctacatg ccctgggata cagcctgcag 5040
ggcaccgcca agaccacgga aggggccagt catcccgacc gggatgctca gttcacgcac 5100
atcaacgcca ccgccgcgga cttcctcgaa gacaaccagc cggtgatcag cgtcgacacc 5160
aaggccaagg agtggctcgg caaccgcgac cgacccggac gcacctggcg accgggcaag 5220
aaccctatcc gtgtggactg ccacacgttc accaccagtg accagccagt agccatcccc 5280
tacgggatct acgacatcgc tcgcaacacc ggctgggtca acgtcgggac cgaccacgac 5340
acgggcgagt tcgcggtgga atccatccgc cgctggtggt agcagcacgg acgcggcgac 5400
cacccggacg ccggccgact gctcatcacc gccgactgcg gtggttccaa cgacccccgc 5460
cgctggacat ggaagaagca tctcgccgcc ttcgccctgg aaagcggact cgagatcacg 5520
gtctgccact tcccacccgg aacatcgaag tggaacaaga tcgaacaccg gatgttctgc 5580
cacatcaccg cgaactggcg cggcaggccc ctgaccagct accaggtcgt catcgagacc 5640
atcgccgcca cgaccactcg caccgggctc agcatcggcg ccgaactcga caccggccga 5700
tacgacctgg gcaccacagt cccacccgcc gagttccaag ccctgccaat cacaccccac 5760
accttccacg gcgactggaa ctacaccctg gcaccactcg caccccggct gcccgagccg 5820
gcaccgagcc gacaacggat cgaccccgcc ctgaccacga tgctcaccga cccggccctg 5880
accggcatgt cacgctccgc cttcgaccac ctggtcgcca tctcggaacc gtactgggac 5940
gccctggccg aggcggcatt ccaacgacgc ttccaccgcc cacgcagcta cctccacccg 6000
cagaccagca gcctcgacca ctaccaccgc ctgctgaccg ccctgttacg ccgccgcaga 6060
gccgtcacca gcacactgct ggcccagctc ctgaacgtcg gccgcaccaa cctgtccaac 6120
cagttccaag acggccaccg cctcctggac ctgcaccgca tcgcggtcac tccgctatct 6180
ggagccccgg cccgcaccct cgcccaacta caagcccgcc taccgccaca cgacgacacc 6240
cgcacagatc aactctgaca gttattcaga cacaggcccc cgggcggatc gagaactccc 6300
aggtcgccgt ctacctggtc taggcaggtg cccggggcca cgcggcggtg gaccgggaac 6360
tgtacgtgcc ccgttcctgg acctgtgacc agggccgctg cagggcggcg gggctcggcg 6420
aggacatcgt cttcgccacc aagccggagc tggcccgcac gatgatcgaa cggttcctgg 6480
acgccggaca ccacgtgggc tgggtcgctg gcgacgaggt ctacggcggc aacccgaagc 6540
tgcgatctgc gctggaggta cgcggcctcg gctatgtcct cgcggtggcc tgctcggccg 6600
aagtcaccac caaggcaggc aagttccgag ccgacacgct ggcggcgaag gtaccgaagc 6660
gggcctggca gaagctgtcg gcaggcgcgg gagccaaggg caaccgcttc tacgactggg 6720
ccgtcgtcga cctggccgag cccggccccg gccaccggca gctgctgatc cgccgcaacc 6780
gccgcaccgg tgaactggcc tactaccgat gccactccac ctcaccggtc ccgctcgcca 6840
ccctggtcag ggttgccgga tcacggtggc gggtggagga gacattccag accgagaagg 6900
gcctggccgg cctggacgag caccagctcc gccgctaccc ctcctgggcc cgctggggca 6960
ccctcgccat gctcgcccac gctttcctcg ccgtcgtccg cgccgacgaa cacacccgcc 7020
cgacccccga cgacctcatt ccgctgacct gcaacgagat ccagcacctg ttcctcgcgc 7080
tcgtcgtcca gccgctgtcc aacgtcgccc accgcctcgc ctggtccgag tggagacgac 7140
gtcatcaagc ccgatcacgc accagtcact accggcgaca agccgcaact cagacatgaa 7200
gatcacgatc tacagctgga gtattaggtc cccgaacaac aaccggggac agtcctaatg 7260
ggcgtcactt tcgtatcgaa ccagcaaaat ttggagggaa cgatattcga ctcgcatagc 7320
cttacggtcg gagcatatta cgaccaggtc aatgaattgc tccccgccat gcattctcag 7380
gcgggatgcc gtcgaggggg cgagggtctg tatgatgtcg ttgacatcgg ccgcagtggt 7440
gatggccttg agcggagtgc cgtgtccgtc acagatcagg tggtgtctgc tgccggtcct 7500
gcgccggtcg accggcgcag gaccggcgtc ggctcccccc tttcgcgcgg acatgagagc 7560
cgtccacgca cgcgcgtgac cagtcgagtt cgccggccgc gttgagttcg gcgagcggga 7620
tgcggtgcga ccctggtctg ctgccatcgt tccagccgcc gcaccgctgc tctcgcagat 7680
ccgctcgata gtccggccgg gacgctcacc gcgacacctc ttcgagggcg agggctaccc 7740
gacgccgacc ggccagcggt actgcatcaa ctcgatctcc ctgcggctga ttcccgacga 7800
gggctgagat ccgtatcgac acaccacgtc cgtggacgtg gcccacgggc gtccggtcaa 7860
gcgtgagtgt cgtggcatcg atctcctgcg cgctcagtga ccgcgcgagg cgggccggaa 7920
tcggcgagtt ggacggggtc ggggcgagcc tgcgtggctt tcttggccgt caactcgacg 7980
acgtggccgt gctgctggcc gtagccgtgt cctgcccgcc gggcgggtgg ctgtccgggg 8040
ctgcccgcct ccccgcggtc gttgccgcca ccaggccgca cgccactgag cagctgaccc 8100
ggcgcggact cgacgaggcc gccttcgtca ccgaactcgt cctgagggca ccgggtcacc 8160
aacgccttcc gttgctcccc agacctctct gggaagatca ataggggccc gtaaaggggg 8220
ggtgagggtt gaaaaagggg gggtattcaa aaataggctg agtccgctgc aaaaatcttg 8280
agaccggtcg gaacgggtgt agctgaatga ctgaatcgaa tgaattcacg tccgaagcgg 8340
tgctcagtgc ggctgatgat gcaatagcca tcatcggcat gtcttgccgg ctgccgcgag 8400
cagtcaatcc tcaggagttc tgggaactcc tgaggaatgg tgagagcggg attaccgagg 8460
tgccgcccca gcggtgggac gcgaactccc tcttcgatgc ggaacggtcc acgcccggga 8520
cgatgaatac acgctggggc gggttcatcg acggcgtgga ccagttcgac cccggcttct 8580
tcgggatctc ctcccgcgaa gcggtcgcca tggatccgca gcaacggctc gtactggagc 8640
tgagctggga ggccctggag gacgcgcgaa tcgtcccgga gcgccttcgc cacaccgcta 8700
ccggtgtctt cgtcggcgcg atctgggacg actacgcatc attgatgagc gcgcgaggcc 8760
gagaagcggt gacccatcac accgtgaccg gtacgcaccg cagcatcatt gccaaccggg 8820
tgtcgtacgc cctcggccta caggggccga gcatggcggt ggactccggg cagtcgtcgt 8880
cactggtctc cgtccatctg gcctgcgaga gcctgcgcag gggggagtcc acgctcgcgc 8940
tggccggcgg ggtgaatctc aaccttgtcc cggagagcac catcggcatg gcgaagttcg 9000
gcgggctctc ccccgatggc cgctgcttca ccttcgacac ccgcgccaac ggctacgtgc 9060
ggggtgaggg cggcggtgtg gtcgtcctca aaccgctggc ggacgcgatc gcggaccagg 9120
acccgatcta ctgcgtcatc cgtggcagcg ccgtcaacaa cgacggttcc ggtgagaacc 9180
tgaccacgcc gaactcccag gcgcaggcag ctgtgctgcg cgaggcctac cgccgcgccg 9240
gcgtggaccc ggcccaggtc cagtacgtgg aactgcacgg taccgggacc cctgtcggcg 9300
acccgattga agccgaggcc ctcggcgcgg tgatcggtgc cgcccggccg ccgggtgacc 9360
ccctgtgggt gggatcggcg aagaccaaca tcggccatct ggaggccgcc gccggcatcg 9420
ccggcctgct caaggtcgtg ctgtccatca gccaccggga gctcccggcc agtctcaact 9480
tcgccacggc caatccgcgg attccactgg actccctgaa cctgcgcgtg ggcgacgagc 9540
tcacatcgtg gccgtctgcc ggtcggccga tgctcgccgg tgtgagcgcg ttcggcatgg 9600
gcggtaccaa cgcccacgcc gtggtcgaac aatctcccgt agcagcgcgg cagattccgg 9660
ctcccggagg cacgccgacg gatcaggggg ggccggtgcc gtggttgttg tcgggtgggt 9720
cggtggcggc ggtgcggggt caggcggcgc ggttgttgtc gcatctggag ggtcggtcgg 9780
gtctgcgtgc ggtggatgtc ggctggtcgc tggccacgac tcgttccgtg ttccctcatc 9840
gtgctgttgt cgttgccgac gatggtggtt acggccagag tctcgccgcg ctggccgcgg 9900
gttccgtgga tgccggggtg gttgagggcc ttgccgatgt gagtggcaag acggtgttcg 9960
tcttccccgg tcagggttcg cagtgggtgg gtatggccgt tgagctgctg gacggctcgg 10020
aggttttcgc cgagcatatg gccgcctgcg ccagggccct ggaaccgttt gtgggctggt 10080
ccctggagga tgtcctgcgt caggtggacg gtacgtggtc actggatcgt gtggatgtgg 10140
tccagcctgt gctgtgggcg gtcatggtct cgctcgcggg actgtggcag gcacatggcg 10200
ttgagcctgc tgcggtgctg ggccactccc aaggtgagat cgctgcggct tgcgtggcgg 10260
gtgcgctgag tctggaagac ggagcccggg tggtggctct tcgcagccgc gccatcgccg 10320
aggcccttgc gggccatggc gggatgctgt cgatagccgc ccccgccacc gaagtcacgg 10380
ccctgatcac cccctggggc aggcagatca ccattgccac ggtcaacgga ccgcattcgg 10440
tggtggtcgc aggagaccct gacgcgctcg aggcactccg cggcgaactg gagacccgtg 10500
gtctccgcaa tcgtcgcatc ccggtcgact acgcctcaca cacccctcac gtcgaggcga 10560
tccgtgaacg gctcctggcc gacctggcag tgatccagcc acgtgccgcg agcattcccg 10620
tgctgtccac cgtcaccggc gcatggctcg acaccaccgt gatggacgcc gagtactggt 10680
accgcaacct acgtcagacc gtggagttcg aagcagccac ccgcactctc ctcgaccagg 10740
accaccgcta cttcgtcgag atcagcccgc accccgtact caccaccgcg atccaggaaa 10800
ccctcgacgt cacagacacc gccgccgtcg ccaccggaac cctgcgacgc aacgaaggca 10860
gcctccggcg tttccagctc gcccttgccg aactcgtcac ccgtggcctc accccgcact 10920
ggcccgccct ctatcccgac gcccgccaca cggacctccc cacctatccc ttccaacgcg 10980
agcgctactg ggtcggcagc tcctcggtgc gggacgcggc gccggctccg caaccggacc 11040
cggcaactgg gcgagcggcc ggtccggctt cgggccgggc cgccgtcgat ggcggcgacg 11100
ggcccgcgga gctgctggct ctggtgcgtg cccacgtggc cgtggtgctc ggtgagacga 11160
cgccggacag tgtcgatccg aaactgacct tcaagcagct cggcttcgac tcggtcatgt 11220
ccgtcgagct ccggaaccgg ctgagctccg ccaccggatc gtctctgccg agcacagtgc 11280
tgttcaacca ccccacgccg gaccggctcg cccgccatct gtccgccgag gcgtccagcc 11340
aggtggaagg cgcgcacgac gcggcgccga cgggtgccgc cgacgagccg atcgcgatcg 11400
tgggtatggg atgcaggtac cccggaggag tcgcgtcgcc ggaggacttg tggcggctgg 11460
tgacatccgg gggcgatgcg atctccggct tccccacgga ccgtggctgg gacctcgagg 11520
tcatgtacga cccggaccat cggcggcccg gcaccagcag tacccgcgag ggcgggttcc 11580
tgtacgaggc cggtgacttc gacgccggtt tcttcggcat cagcccgcgc gaggcgtcgg 11640
ccatggaccc gcagcagcgc ctgctgctcg agacttcctg ggaggccgtg gaacgggcgg 11700
gcatcgaccc gctgtcgctg cacggtacgc gggccggggt tttcgtcggg gccatggccc 11760
aggagtacgg cccgcgtctg gacgagggcg cggacggcta tgagggcttc ctgctgaccg 11820
gtggcctgac gagcgtgttg tccgggcggc tggcctacag cctggggttg gagggacccg 11880
cggtcaccgt ggacaccgcg tgctcgtcgt cgctggtcgc cgtgcacatg gccgcccagg 11940
ctctccgtca ggggcagtgt tccctggcgc tggcaggcgg ggtcaccgtc atgtccggcc 12000
ccgggatatt cctggagttc agcaggcaga gcggactggc accggacggc cgctgcaagg 12060
cgttcgcggc cggagctgac ggcacgggct gggccgaagg cgtcggcgtg ctggtgctgg 12120
agcggctctc cgacgcccgg cgcaacggac atccggtgct ggcggtggta cgggggtcgg 12180
cgatcaacca ggacggtgcc tcgaacggcc tgacggcacc gaacgggctc gcgcaggagc 12240
gggtgatccg tgaggccctg acggacgcag ggctgtctcc cgccgacgtc gacctggtcg 12300
aggcccacgg caccggcacc accttgggtg acccgatcga ggcgcaggcc ctgatcgcga 12360
cctacggaca gggccgtccg gcggaccggc cgctgcgact gggctcgctg aagtccaaca 12420
tcggccacgc ccaggcggca gccggagtgg gcggagtcat caagacggtg atggcggtgc 12480
ggcacgcaac catgccccag accctgcatg tcgacgcgcc gtcaccgcat gtggactggt 12540
cgtccggcca ggtccggctg ctgaccgagg cagtgccgtg gcccgagtcc gaccaccccc 12600
ggagggcggc ggtctcgtcc ttcgggatca gcggcaccaa cgctcacgtt gtcgttgagc 12660
agcccccggc ggaggtgtcc gcggtcaccg ggccatcacc tatggcgccg gacgaggccg 12720
taccggcccc ggggcagccg gtgccctggc tgctgtcggg caagtcaccg gaagcggtgc 12780
gcgagcaagc ggcgcggctg cggtcgtacc tggccgaccg gcccggcgcc ggtctcgccg 12840
acatcggctg gtccctggcg tcgacccggt cggcgttcga gcaccgtacg gtggtggtcg 12900
cggcggacca tgggcagttc cgtgaggcgc tgggcgcggc cgcggcgggt tcggcggatg 12960
cccgggtcgt cgagggcgtg gccgacatcg acggcaagac cgtcttcgtc ttccccggcc 13020
agggcgcgca gtgggccggc atggccgggg aactcctgga ctcctccgag gtgttcgccg 13080
cccggatggc cgactgcgcg cgggctttgg ccccgttcgt cggctggtcg ttgcaggatg 13140
tcgtccggca ggccgagggc gccccgccgc tggaccgggt cgacgtcgtc cagccggtgc 13200
tgtgggcggt catggtgtcg ctggccgacc tatggcgtgc tcatggcgtt gagccctcgg 13260
ccgtggtggg ccactcgcag ggtgagatcg cggccgcctg cgtcgccggt gggctgacgc 13320
tggaagacgc cgcgcgggtg gtgtcgctgc ggagccgggc catcgccgaa gtactcgccg 13380
gacacggcgg catgctgtcg gtgaccgcgg cccgggaaca ggtcgaggag tggctgctcc 13440
cctgggaggg caggatttcg ctcgcaacca tcaacggaac cgaatccgtc gtggtcgccg 13500
gcgatcccga cgcgctggcg gaattccgcg cgtggttggg gaaccgacag atccgtagcc 13560
gcaccctgcc ggtcgattac gcctctcact cggcgcaggt cgaggctgtc caccagcgac 13620
tgctggacga cctggcgccg atccgccccc gtacgtgccg taccccgctg ctgtcctcgg 13680
tcaccggcca gtggctggac accgcctcga tggacgccga gtactggtac cagaacctgc 13740
gccggaccgt ggagttcgcc gcggcgaccc gcaccttggc cgacgggggg caccgcatct 13800
tcatcgaggt gagctcgcat ccggtgctgg tcggcgcgat acgggaaacc ctcgaagccg 13860
tcgaggtcca ggccgctgtc gccgggtcac tccggcgtga cgacggaggc ctgcggcgtt 13920
tccggctctc gcttgccgcg ctcgtcaccc gggggctggc ccccgactgg tccatgctct 13980
gccccggggt gagccgaacc gacctcccca cctacccttt ccagcgcagc cgttactgga 14040
tcaccgcctt ctcggggtcg cggagcgccg gtgaactcaa cgctgcggac tcacgcttct 14100
gggaggcggt cgacagcgag gaccccgggc ggctggccga ggtgctcagc ctcgacgacg 14160
acgcgtcgct cgaaccggtc ttcctggcac tgtcctcgtg gcggcgacgg caccgggtgc 14220
ggtccaccct ggacgactgg cgttatcggg tgacctggca gccgctgccc ggggccgccg 14280
tcccgttgac ggcggcaacc ctcggaggga cctggctggt ggccgtgccc cacgaggacg 14340
cctacgtctc ccaggtgctg cgcgggctgg gcgaccgcgg cgcgaccgtg atcaccctac 14400
gagccgacga cccgcgccac ggcccgctcg ccgagcgggt ccgggaggcg ctggccggag 14460
cgggcgagat caccggcgtg ctgtcgctgc tggcgttgga cgagcggccg cacccggaac 14520
atccggtcct tcccatgggc ctggcgctca acacggcgct ggtgcgggca ctggtggaca 14580
aggacgtccg ggctccgttg tggtgcgcca cgcggggcgc ggtgtcggtg ggccgatccg 14640
accggctggg cagccctgcc caggcgatgg tgtgggggct cggcctggtg gcggccctgg 14700
aacacccgcg gcactggggc gggctggtgg atctgcccga aaccgtggac gagcgggtgc 14760
tgaaccggct ggtgaccgtg atctcgggcc aacgagtcca cggacaggga gccccgggcc 14820
aggacggcga aaacccgggc gatgaggacc agcttgcggt gcgggcgtcc ggagtgttcg 14880
cgcggcggct gtcgcacgcg cccgtgtcgg gcagccgcaa ccgggagtgg acgccccggg 14940
gcaccgtgct ggtcaccgga ggcaccggtg gcgcgggcac ccaggtggct cgctggctgg 15000
cccgtaacgg cgccgaacac ctgctgctga ccagccgtcg tggcagggac gccgaggggg 15060
ccgccgagct ggcggccgaa ctcacggaag ccggcgtcag ggtcacggtc gccgcctgcg 15120
acgtagcgga ccgggacgcc ctggcccggc tgctcgccgg cgtaccggac gagctgccgc 15180
tgaccgccgt gattcatgcc gccggtgtgg tcaccaccgc cccgctggac agcaccggtc 15240
cggaggaact ggccgaggtg ctggcgggca aggtggccgg cgccgcccat ctggacgctc 15300
tgctcggcga ccggcagttg gacgccttcg tactgttctc ctccaacgcc ggcgtgtggg 15360
gcagcggcgg gcaggcggcc tacgccgcgg ccaacgccta cctggacgcc ctggcccagc 15420
agcggtcctc tatgggccag accgcgacct cagtggcctg gggtgcctgg ggcggggccg 15480
ggatggcggc cgaggaaggg ttcaaggagc ggctgcgccg gcggggcatc atcgaaatgg 15540
acccggagct ggccgtcacg gcgctcgtgc aggccgtcga gtccggagag gcgtcgatag 15600
ccgttgccga cgtcgattgg gcacgcttcg tgcccggctt cacctcgaac cggcccagtc 15660
cgctgatcgg cgacctgcct gaggtgcggg acgcgctgcg ggaggccgac agccggcccg 15720
ccgtcgatca gggcgggtcg gcgctcgcca cgcggctggc cgggctgtcc gtgctcgaac 15780
gggagcgggt cctgctcaac ctggtgcgca ccgaggtggc ctcggtactc ggtcacacca 15840
cggccgacat ggtcgatgcc cgtcgcccct tccgtgaact cgggttcgac tcgctgatcg 15900
cggtggagtt ccgcggccgg ttgaacgccg cgaccgggct gcggctgcct acctcggtcg 15960
ccttcgacca ccccaccccg gccgagctcg ccggccatct gcgggagttg ttcgccggat 16020
cccgcggtga caccgccatg cccgtgtcgg tgaccaccgc cggggacgac gaaccgatcg 16080
ccatcgtagc gatgtcctgc cggtacccgg gcggtgtgcg cactccggag gacctgtggc 16140
ggctggtggc cgagggccgg gacgcgatca cggacttccc caccgaccgc ggctgggata 16200
tcgaaagcct gtatgacccc gacccgggcc ggtccggcac ctcctacacc cggcggggcg 16260
gcttcctcga cgacgcggcg gccttcgatc cggcgttctt ccggatctcc ccccgcgagg 16320
ccctggccat ggacccgcag cagcggctgc tcctcgaaat gacgtgggag accctcgaac 16380
gggcgctcat cgacccaaca acgctgaagg gcagccaggc cggggtgttc atcggcaccg 16440
cacaccccgg ctacggcgag ggcatccacc acgagtcgca gggcgtcgag ggccagcagc 16500
tgttcggcgg ctcggccgcc gtggccgcag gccggatcgc ctacacgttc ggcctggaag 16560
ggccggcgat gacggtggac accatgtgct cgtcctcgct ggtggcactc catctggcct 16620
gccagtccct gcgcaccggc gagtcctcga tggcgctcgc cggcggggtc acggtaatgg 16680
cacggccgac cgctttcacc gagttcagcc ggcatcgggg actgtccccc gacggacggt 16740
gcaagtcctt ctccgacgcc gccgacggca ccggctgggc cgagggcgcc ggtgtgctcc 16800
ttctcgaacg gctctccgac gcccgtcgaa acggccaccc cgtgctggcc gtcatccgcg 16860
gcagcgccat caaccaggac ggcgccagca acggccttac cgcacccaac ggcccctccc 16920
agcaacgcgt catccagcag gccctggcga acgcgtccct gtcgccggcc gacgtcgccg 16980
ccgtcgaggc ccacggcacc ggtaccaccc tgggcgaccc gatcgaggcc caggccctga 17040
tcgccgccta cggacaggac cgcccgacgg accggccgct acggctgggc tcgctgaagt 17100
ccaacatcgg ccacgcgcag tccgcagccg cagtcggcgg cgtgatcaag atggtccagg 17160
ccatccggca cggcctcctc ccgcgcacgc tgcacgcgga gcagccctcc cgccacgtgg 17220
actggtccgc cggctcggtg gaactgctca ccgaggcgat gccgtggccg gacaacgacc 17280
aaccccggcg ggcgggtgtc tcggcgttcg gcggcagcgg caccaacgcc cacatgatca 17340
tcgagcaggc gcccgcgccg gacgagccgg agcacaccga cggcacgagc aggaccagcg 17400
gcgagagcgg cgccgaacag gccaggccgc tgccgatggt gccctgggtg ctgtccgcgc 17460
ggagtgacac cgcgctgcgg gcacaggccc ggcgcctgcg cgcctacgcg gccgccgccg 17520
aggcgggcag catctgcgac atcgggtggg cgctggcgac cacccgagcc acgctggacg 17580
accgggccgt ggtcgtggcc gcggaacggg aaggattcct caccgctctc gacgcgctgg 17640
ccgaggaccg gaccgccccc ggtctggtcc ggggggcggc tggaacagga gtgcggtcgg 17700
cattcctgtt ctccggccag ggctcacaaa gactcggcat ggggcgcgag ctgtacgaca 17760
cgtccctcgt gttcgccgag gcgctggacg aggtgtgcgc ccagctcgac gggcacctgg 17820
accggcccct cctgcgggtg ctgttcgcgg cggagggttc cgacgacgcg tcgatgctgg 17880
accagaccgc cttcacccag gccgcgttgt tcgcggtcga ggtggcgctg ttccgcctcg 17940
tctggtcctg gggcctgcgg cccgatttcc tcatcgggca ttccgtgggc gaagtcgcgg 18000
ccgcccatgt ctcgggcgtg ctgtccctcg ccgacgccgc gacactggtg gtcgcccgcg 18060
gtcggctgat gcaggcgttg ccctccggcg gcgcgatggt ggccttgcaa gcgggtgagg 18120
aggaagtacg gctgtccctg gcgggactgg aggacgttgt cggcgtcgcc gccctcaacg 18180
gccccgcctc gaccgtgatc tctggcgacg aggaggccgt cctcccggtg gccgcgcact 18240
ggcgcgcgca gggccgcaag acgcgtcgcc tcaaggtgag ccacgccttc cactcacccc 18300
gtatggaacc catgttgcac cggttccacg ccgtgctcaa aacgctttcc ttcgccgagc 18360
cggccattcc cgtggtctcg aatgtgaccg gccgtcccgc cgagcggacc gaactgtgcg 18420
cggcggacta ctgggtgcgc catgtccggc atacggtgcg cttccatgac ggcatccgcg 18480
cgctggaggc cgaaggcgtc agcgcattcc tggagttggg gcccgacggc acactctcgg 18540
cgatggtccg cgactgcctg gacaccagcc gcccggtggt cacggcaccg gttttgcgac 18600
gtgaccgtac cgatgtgtct gccgcgttga cggcactggc cgaagcgcac gggcacgggg 18660
tgccggtgga ctgggcgtcg ctcttcgccg gctcgaccgc ccgggcggtc gagctgccga 18720
cgtacccgtt ccagcgggaa cacttctggc tggattccgt cacgggcagc agtgacatga 18780
gcacggccgg actggcgtcc cccgatcatc cgctgttggg agccgtgacg acggtggccg 18840
gcgaggacgg cctcctcttc accggcaacc tgtcggtacg gacgcaccca tggctggccg 18900
accacaggat caccggttcg gtcctgctgc ccggcacggc gttcctggaa ctggccgtcc 18960
aggccgggga ccaggccggc tgcgggcggg tcgaggacct gacgctgctg gctccgctcg 19020
tactgcccga agagggcagc gtcagggtcc agatgaaggt gggggagccc gacgccacgg 19080
gccgccgcac catcgaggtg tactcctcgg accagcaggc ccccggccgg gaacgctggg 19140
tcctcaacgc gagcgggatg cttgccggcg aaccggtgga ggccccgccg agtctcacca 19200
cctggccccc ggaaggcgct gtccccgttc cgctggacgg cttccacgac cggctggcgg 19260
cacgcggcta cggctacggc ccgacattcc gcgggctgag cgccgcgtgg tcacgcggtg 19320
acgagatctt cgccgaagcg gcgctcccct cgggccatcg gcaggatgcc gcccgctatg 19380
gactccaccc cgccctactc gacgctgccc tgcacgccat ggaactccgg gaaccccgcc 19440
cggccggcga cggagtccgg cttccgttcg cctggaacgg cttctccctg cacgcgtcgg 19500
gtgccgaagc ggtacggctg cgcctcgcgc cgacgggcgc cgacgctctg tcggtgaccc 19560
tcgccgatgc catcggtcgc ccggttgcct cagcccgctc gctggccctg cgggagctct 19620
cgtccgacct gctgcgcccg gcgtccgtct cgtacgggga ctcgctgttc cgcaccgctt 19680
ggatacccgc cctcgtcggc ccggaggcgg agtccgggcc ggtgcgaccg tccgccggct 19740
gggcggtgct gggccccgat ccgctcggcg cggccaacgc cctgaacctc acgggaacct 19800
cctgctcctg ctatccggac ctggcggcgc tgatcgcggc cgtcgacggc ggagccgcgg 19860
tgcccgaggc cgtactcgcg ccgtacgcgg cggagccagc cccggacgcg ggatctcccg 19920
cggacgccgt acgggcctcg accggccggg cgctgcaact gctgcaatcc tggctgtccg 19980
aggaccggtt ggagcgaagc cggctgatcg tgctcacccg gggggcggtg gccgtcggta 20040
cggacgaagg cgtcaccgac ctggtgagtg cgtcggtccg gggtctggtc cgttcggcgc 20100
aggccgagca ccctggcagg ttctccctgg tcgacatcga cgaccgggag gagtcctggg 20160
ccgtcctgag cgcggcggcg gtatccgatg agccacaact cgccctgcgc tgcggccaga 20220
tgaaggtgcc ccgcctcggc tccgtcgacg ttcccacgac cggtatgcct gagatgcccg 20280
acgtttgggg tgttgacggt accgtgttga tcactggcgg gaccggtgtg ctgggtgggc 20340
tcgtcgcccg tcatctggtc gccgggcatg gggtccgtcg tctgttgctc tgcagcaggc 20400
ggggccctga tgcgccgggt gcggtggagc tggtcgccga gctcaccgct ctgggtgcgg 20460
atgtcaccgt tgccgcctgc gacgcggccg accgggatgc gctggccgcg ctcttggaca 20520
ccgttcccgc cacgcaccct ctgactggtg tcgtgcatac cgctggtgtc atcgatgacg 20580
ccactgtcac caccctcact cccgagcgca tcgacgcggt cctacgcccc aaggtcgacg 20640
ccgcgctcaa cctccatcag ctgacggcgc atctcggctt gacccgcttt gtgctcttct 20700
cctccgccgc cgggctcttc ggcggcgcgg gccagggtaa ctacgcggcc gccaacgcct 20760
tcctcgacgc actggcccaa caccggcggg ccaacggcct caatgcccag tccctggcgt 20820
ggggactgtg ggcggaagcc agcgggatga ccgggcacct ggacgcggcc gacctcgccc 20880
gggtggcccg ttccggcctc accgcgatgc ccaccgggga cgggctggcg ctgctcgaca 20940
ccgctcagcg ggtggacgaa gccaccctgg tcacggccgc gctggacacc cgggccctgc 21000
atgcccgggc cgcagacggc acgctgccgg cgctgttcca cgcactcgtg cccgtaccgc 21060
gccgatccgc gacctccccg gcggcccagg ccgcggggcc ggatggactc cgccagcggt 21120
tgtcggggtt ggtcgagggg gagcgtcgag cggcgctgct ggatttggtg tgtggtcatg 21180
tcgcgagggt gctggggcac gcggacccga gcagcattga ggagacccgg cccttcaagg 21240
acaccggctt cgactcattg accgctgtgg agctgcgcaa tgtgctgcac ggtgcgaccg 21300
ggttgcggct gccggccacg ctggtcttcg actacccgac gcctgcagct ctcaccgatc 21360
acctctacga cgagcttctg ggttcccgcg aggacgccgt gctcgccccg atcaccaggg 21420
ccgcgtacga cgagccgatc gcgatcgtgg ggatggcctg ccgctatccg ggcggggtgg 21480
agtccccgga ggacctgtgg cagctggtcg ccgacggccg tgacgccatc tccgacttcc 21540
ccgccgaccg gggctggaac gtcgagagcc tctaccaccc cgaccccgac caccccggca 21600
ccagctacac ccgtgccgga ggcttcctgc acgacgcggc ggacttcgac ccggagttct 21660
tcgggatctc accgcgtgag gcactggcca ccgaccccca gcagcgactg ctgctggaga 21720
cgacgtggga ggccttcgaa cacgccgggg tcggcccggc gtcactgcgt ggcagccgga 21780
ccggcgtctt cgtcggcgtg atgtacaacg actacgcctc gcgtatccgg cacatcccag 21840
agagcgtcga gggcggtctg accaccaaca gcgcggggag tgtggcgtcg ggccgggtct 21900
cgtacacgtt cggtctggag ggaccggccg tcacggtgga taccgcgtgt tcgtcgtcgc 21960
tggtggcgtt gcatctggcc gcgcaggcgt tgcgcaacgg tgagtgcact ctggctctgg 22020
cgggcggtgt tgcggtgatg tccactcctg ccacgtttgt cgagttcagc cggcagcggg 22080
ggctggcagc tgatgggcgg tgcaaagcct tcgcggacgc tgccgacggc accggctggg 22140
gcgaaggcgt cggtgtgctg ctggtggagc gtttgtcgga cgcgcgccgc aacgggcatc 22200
cggtgctggc ggtcgtttcg ggcagtgctg tcaaccagga cggggccagc aatggtctga 22260
cggcgcccaa tggtccttcg cagcaacggg tgatccaaca ggcgctggcc aatgcggggt 22320
tggcgggggc ggatgtcgat gccgtggagg cgcacggcac gggaacccgg ctgggcgacc 22380
cgatcgaggc gcaagcgttg atcgccacct acggacaggc ccggtcggcg gaccggccgt 22440
tgtggctggg ttcgctgaag tccaacatcg gtcacaccca ggccgccgcg ggcgtcgccg 22500
gcgtcatcaa aatggtgcag gcgatgcagc acgggactct gccgcccacc ctgcacatcg 22560
accagcccac gggccaggtc gactgggcta cgggtgcagt ggagctgctg accgaggccg 22620
tgccctggcc ggacagtgac cggccccgcc gggtggctgt ctcctcgttc ggtgtcagcg 22680
gtaccaacgc ccacgtcatc atcgaacaca ccccacacac cccacacacc acccgcacct 22740
cccaatcctc ccaatccccc caggccccgc agactgtgca ggcccatcgg ccggtgccgt 22800
ggctgctgtc ggcgaagacc tcgcaggccc tggccgcgca ggcccggcgc ctgtcagctc 22860
acttgcgagc caaccccgat ctgcgttcgg ctgatgtggc gcattccctg ctcaccacgc 22920
ggtctgtcca cgccgagcgc gccgtcttca tcgccggtga ccgggatgag gctcttgccg 22980
ccctggacgc actggccgac ggcacccctg cccctcacct cgttcagggc cttgccgatg 23040
tgagtggcaa gacggtgttc gtcttccccg gtcagggttc gcagtgggtg ggtatggccg 23100
ttgagctgct ggacggctcg gaggttttcg ccgagcatat ggccgcctgc gccagggccc 23160
tggaaccgtt tgtggactgg tccctggagg acgtcctacg ccagacggac ggtacgtggc 23220
cactggaacg cgtcgaagtg gtccagcccg tgctgtgggc ggtcatggtc tcgctcgcgg 23280
gactgtggca ggcacatggc gttgagcctg ctgcggtgct gggccactcc caaggtgaga 23340
tcgctgcggc ttgcgtggcg ggagccctga gtctggaaga cggagcccgc gttgtcgcgc 23400
ttcgcagcca agccatcgcc gaaaccctcg caggacacgg cggaatgctc tcaatcgccg 23460
cccccgccac cgacatcgca cccctgatcg cccgctggaa cgagcggatc tccatcgcca 23520
cggtcaacgg accgcattcg gtggtggtcg caggagaccc tgacgcgctc gaggcactcc 23580
gcggcgaact ggagacccgt ggtctccgca atcgtcgcat cccggtcgac tacgcctcac 23640
acacccctca cgtcgaggcg atccgtgaac ggctcctggc cgacctggca gtgatccagc 23700
cacgtgccgc gagcattccc gtgctgtcca ccgtcaccgg cgcatggctc gacaccaccg 23760
tgatggacgc cgagtactgg taccgcaacc tacgtcagac cgtggagttc gaagcagcca 23820
cccgcactct cctcgaccag gaccaccgct acttcgtcga gatcagcccg caccccgtac 23880
tcaccatcgg tctacagcag accatcgagg aaaccaccgc tccggcccgg accctctcca 23940
ccctccgacg caacgaaggc accctccggc acctgttcac ttccctcgcc caggcccacg 24000
cccacggcct gaccatcgac tggacccccg ccttcaccca caccgagccc cgcaccaccc 24060
ccctgcccac ctaccccttc caacacgaac gctactggct ggaggacgga gctccgaagt 24120
ccggggacgt ggcttcggcc ggactcggct cggcggacca tccgctgctg ggcgccgctg 24180
tgccgctgcc cgattccggg ggcttcctgt tcaccggcca gttgtcgctg cggagtcacc 24240
cctggttcgc cgaccacgcg gtacacggca ccgtgctgct gccgggcacc gcgttcgtgg 24300
aactggcgct ccaggccggt ggccgtctcg gctgcgggct gctggaggaa ctcaccctgg 24360
aggcaccgct ggtgctgccg gaaaacagct ccgtccagct ccaactcgtg gtgaacgccc 24420
cggacgccca ggacgactcg ggcggcagga ccttcagcgt gtactcgcgc ccgcaggacc 24480
gtactgcgga cgcgccctgg gtgcggcacg ccaccggagt ggtccggtcc ggaggcgcgc 24540
cggagccgga gggactgacc gtgtggccgc cgaccggagc ggtcgcggtg ccggtcgagg 24600
acttctacca ggtgctcggt gaccgtggct atgactacgg acctgcgttc cgtggggtaa 24660
gggccgcgtg gcgccacggt gacgtggtgt atgccgaggc cgcactggcc gaggagcagc 24720
agtcggacgc cgcgctgttc cacctccacc cggccctgct cgactcggcg ctgcacggga 24780
tgggactgat gccctcggcg agcgcggagc agacccggct gccgttcgcg tggcgcggtg 24840
tgacgctgca tgcggtgggg gcgtcggccc ttcgggtgag tcttaggccc gccgggcccg 24900
acacggtgga ggtcctactg gccgatggcg caggtcggcc ggtcgcttcg gccgacgcac 24960
tggtggtccg gccgctccga caggaggaac tggcggtctg gcaggacgcg taccgcgact 25020
ggctgtaccg ggtcgactgg cccgagttgc cggaggtccc cctggtggct ccggccgggc 25080
catgggccgt cctgggcggg aacgccggcg ggatactcgg caccgatggc tcggccgggt 25140
tgctggccgg ggtcccgatc gacgcctatc gggacctggc ggagctgcgc gaccggacgg 25200
gcccgagcag cgcgttcccg gccgtggtgg tcgcgccggt cgccacggga accggtgccg 25260
cgccggacgc ggtgcgggag gtgacgtacc aggtgctgga catgatccag tcatggctcg 25320
ccgacgatcg ttccgcctcg tcgacccttc tcctggtgac ccgcggcgcg gtgtccaccg 25380
gcttcgggga cgacctggtc gatctggggc aggcggcggt atgggggttg gtgagggccg 25440
cgcagtcgga gaacccggac cgcttcgtcc tcctcgacct cgacgggagc gagccggtcg 25500
ggcctctccc gacggcggcg ctgctctccg gggagccgca actggcgttc cgggagggca 25560
aggtgctgac cgcccggctg gaccgggtgt cgtccgacgc gggaacgctg ctgccgcccg 25620
ccgggccgga cccgtggcga ctcgacgtca ccagccgggg cacgctcgac aacctcgcgc 25680
tcctcgcggc gccgcaggtg tcggcgccgc tcgccgaggg acaggtccgg gtcgcggtgc 25740
acgcggccgg cctgaacttc cgcgatgtgc tggtcgctct gggcatgtac ccgggtgagg 25800
gttcgatggg cagcgaaggc gccggcgtgg tgctggaggt cgggcccggc gttgagcggc 25860
tggccccggg cgaccgggtg atgggcatgc tcgcgggcgg cttcttcggg ccggtcgccg 25920
taaccgacca gcgcatggtg accaagcttc cggacggctg gtcgttcacc gagggcgcat 25980
cggtaccgat cgtcttcctc accgcgtact acggactggt cgacctgggc ggcctgcgcg 26040
ccggccagtc gctgctggtg catgcggcga ccggtggtgt gggaatggcg gctacgcagc 26100
tggcccggca cctcggcgct gaggtgttcg gcacggcgag ccccggcaag tgggaggcgc 26160
tgcgggggat gggattggac gaggagcaca tcgcctcgtc gcgggacctg gacttcgaga 26220
agaagttctc ggccgcgacc ggtggccgcg gtgtcgacgt ggtgctgaac tcgctggccc 26280
gggagttcgt ggacgcgtcg ctgcggctgc tgccgcgcgg cggtcgattc gtggagatgg 26340
gcaagaccga catccgtgac gccgaggcgg ttgccgccgg gcatcccggc gtcgtctacc 26400
gggccttcga cctgctggac gccgcggggc cggaccgtat ccaggagatg ctggccgagt 26460
tgctcgcgct cttcgaggcg ggggtgatcg agccgctgcc gctgacgacc tgggacatcc 26520
ggcgtgcccc ggaggcgctg cggcacctga gccaggcacg gcacatcggc aagatggtct 26580
tcaccctgcc gcccgccccg gacccggacg gtacgttcct gatcacgggt gtgcccggag 26640
cgctgggcaa cctggtcgcc cgccatctgg tgaccgaggg tggcatacgg aacctgctgc 26700
tcgtcagccg ccgggggccg gcggcccccg gcgcggaggg gctggccacc gagctggccg 26760
ggctgggggc gacggtgacc ctggcggcct gtgacgtggc cgaccgccag gccctggccg 26820
ggctgctcgc cgacatcccg gcggagcatc cgctgacggg tgtggtgcac gccgccggtg 26880
tgctggacga cgggatcgtg gcatccctga cccgcgaacg gctggacgcg gtctaccgcc 26940
ccaaggtgga cgccgcctgg aacctgcacg agctgaccaa ggacagcggc ctggccgcgt 27000
tcgtactgtt ctcctcggcc gccgcgacgc tcggcagcgc aggccagggc aactatgcag 27060
cggccaacgc cttcctcgac gccttggccc aattccgcca ggcccagggc ctggcggcca 27120
gctccctcgg ctggggattc tgggccgaga gcggtgagat gaccggtcac ctgggggcct 27180
ccgacctggc acggatggca cgttcgggca tcgccgccct gacggtcgag cagggcctgg 27240
ccctgttcga ctccgcacgg tcgggtgtct gtgcgtcagt gctgccggta cggctggaac 27300
tcaccgggcc cggtgcgcgg gccgggtcgg gaacggtgcc ggcgctgatg cgggggctgg 27360
tgcgggcacc ggcccggcgg gtggtggaaa caaccacggg cggtgccgtc acaggcctgc 27420
gccaacggct ggcgccgctg tccggcgcgg accgcgaccg cgccctccaa gagctggtgt 27480
gctcgcatgc ggccaccgtg ctggggcaca gccgttccgg atcggtgccc gcgcagcggg 27540
cgttcaagga gctcggcttc gattcgctga cagccgtcga gttgcgcaac cggctcaacg 27600
tggcgaccgg cctccggctc cccgcgactc tggtgttcga ccacccgacc ccgctggcga 27660
tggcggaaca gctccggaag gagctgttcg cggacgagat cccggtggcg ccgcaggttt 27720
tggaggaact ggaccgtctg gaggcggcgt tcgccgtctc ctccgccggc gacctccagc 27780
agtcgggagc cgcggcacgg ctgagggcac tgctgaggcg gatcggcacc gtcactccgg 27840
cgggagggga cgctgccgac ggcctcgccg tagagctcga aacagccacc cacgacgaga 27900
tcttcgccct tatcgacgag gaggtagggg acgtgtgacc ggtcggtcgc tcccccctca 27960
cccctacccc ccgcccggac tagcagcatg gatgagatca cgatgactga tgagaccgct 28020
gtgcccaaaa cagagaccac cgaggagaag ctcttctcct acctgaagaa ggccacctcc 28080
gaactccagc agagccgccg ccgggtggca gagctggagg cggcggaggc ggagcccatc 28140
gcgatcgtgg gcacggcctg ccggtacccg ggtggagtac gttccccgga ggacctgtgg 28200
cggttggtcg cggaggggca gcacgcgatc tccagcttcc cgacggaccg cggctgggat 28260
ctcgaagacc tctacgaccc ggacccggac cggcccggca agtcctacgc ccgggacggc 28320
ggcttcctcg acggtgccgc ccagttcgac gcggcgttct tcgggatctc gccacgtgag 28380
gcgctggcca tggacccgca gcagaggctg ctgctcgaga cgacgtggga ggtcttcgag 28440
cgcgccggga tcgacccgac atcgctccgt ggcagccgga ccggggtgtt cgccggcatc 28500
agccaccagg actacgctgc cggacagcgc ccgtcggccg aggtctccga ggggcacctg 28560
atgaccggca ccgcggtcag cgtggtgtcc gggcgggtcg cctatgcctt cggcctggaa 28620
gggccggcca tgacggtgga cacggcctgc tcctcgtcgc tggtggcgtt gcacctggcc 28680
gcgcaggcgt tgcgcaatgg tgagtgcacg ctggcggtgg ccggcggcgt caccgtcatg 28740
gccacgccgg gcgccttcac caggttcagc cgggagcggg gcctggcccc ggacgggcgc 28800
tgcaaggcct tcagctcgga cgccgacggc accggcttca gcgagggtgt gggtgtgctg 28860
ctggtggagc gtttgtcgga cgcgcgccgc aacgggcatc cggtgctggc ggtcgtttcg 28920
ggcagtgctg tcaaccagga cggggccagc aatggtctga cggcgcccaa tggtccttcg 28980
cagcaacggg tgatccaaca ggcgctggcc aatgcggggt tggcgggggc ggatgtcgat 29040
gccgtggagg cgcacggcac gggaacccgg ctgggtgacc cgatcgaggc gcaggcgttg 29100
atcgcgacgt atggacaggc ccggtcggcg gaccggccgt tgtggctggg ttcgctgaag 29160
tccaacatcg gccacaccca ggccgccgcg ggcgtcgccg gcgtcatcaa gatgatccag 29220
gccatgggtc acgggacgct gccccgtacg ctgcatgtca accagccctc gccccaggtc 29280
gactgggcgg caggcgcggt ggagctactg accgaagcca tgccctggcc cgagggtgac 29340
cggccccgcc gggccggaat ctcctccttc ggaatcagcg gtaccaacgc ccacgtcatc 29400
atcgaacagg gggccccgcc acggacagcg tccgaccccg gtgaaagtcg tgctgacgag 29460
cccggcgtac ggggcggcgc tcccgtccct gccaccacgg agtcggccac cgaaccgcag 29520
ccggttccct ggctgctgtc cgggcacagc gcgaccgcgc tgcgggcgca ggcggatcgc 29580
ttgaagtcgt acgcggccaa caacaccggc atccgtccgg ccgacatcgg cttctcgctg 29640
gtcaccaccc gggccgcgct ggaacaccgc gctgtcgtcg tggcagccga ccatgccggt 29700
ttcacggctg gtctcgacgc gctggccgag ggccggacag ctcccggagt ggtgagcgga 29760
acggtcgtcg ccggtgcccg gagcgcgttc ctcttctccg gtcagggctc gcagcgggtc 29820
ggcatggggc gcgagctcca gcaggcgttc ccggttttcg ccgaggcttt cgaagcagtc 29880
tgcgcccagg tcgacccgta cctggagcac ccacttctcg atgtcgtact cgccgcgccg 29940
gacagcgact tcggcgcgtt gctccatcag accgcctaca cgcagccggc actgttcgcc 30000
ctcgaagtgg ccctgttccg gctggtcgaa tcctggggtg tcaggccgga ttacgttgcc 30060
gggcattcgg tcggtgagat cgcggcggcc catgtggcgg gggtgttctc gctggaggat 30120
gcggctcgtc tggtggtggc gcgcggacag ttgatgcagg cgttgccggc tgaaggcgcg 30180
atggtggcgc tccaggtgtc cgaggacgag gtcctgccgt ccctgactcc ttggctggag 30240
caggaccggg tggatgtcgc ggcggtcaac ggcgcagcat ccacagtggt gtcgggcgat 30300
gaggaggcgg tcctggcggt tgccgagcac tggcaggcgc ggggccgcaa ggttcgtcgg 30360
ctcactgtca gccatgcctt ccactcacct cgtatggacc cgatgctcga ccagttccgt 30420
gtggtcgtgg agggtatccg tttcgcggag ccggccatcc cggtcgtctc cagcgtcacc 30480
ggtcgtcttg ccgagcccgg gcagttgacc actgcggact actgggtgcg ccacgtccgt 30540
caaacggtcc gcttccacga cgccctccag accctccaga ccgagaatgt gaccgcgttt 30600
ctggagatcg gtcccgacgg gcaactctcg gcaatgaccc gcgacttcct gaccgatacc 30660
ggggcccacg ccgccgtcgc acccctcctg cggcgcgaac gtcccgaggc acccagcgcg 30720
ctcaccgcaa tcgccgggct gcacacccac ggcgtctcga tcgactggcg cacgtacttc 30780
accagcacca gcaccagcac cagcaccagc accggtaccg gtaccggtac ggggcaggcc 30840
actgccgaca cgcccgtcca gctgcccacg tacgccttcc agcaccagtc cttctggctc 30900
ggccccacgg cccctgtcgg cgacgtcagc accgccgggc tcacctcgcc cgaccacccc 30960
ctgctcagcg cagccaccac caccgctgtc gacggcagcc tcctgctcac cggcaggctg 31020
tcgcagcggt cgcccgcgtg gatcggcgac caccgcatcg gcggtgtggt cctgctgcca 31080
ggcaccgctc tcgtggaact cgtcgtacgc gccggggacc aggccggttg cagccgcatc 31140
gacgaactca tcatgctcac gccgctgacg ctgcccgagc atggtgccgt gcggatccag 31200
gtcgccgtcg gcggcccggc ccacgacggc cgccgcccgg tgcacatcca ctccagcacc 31260
tcggacacga ccggcgacga acagtggacc ctcaacgcca gcggtctgct caccgtcgag 31320
atgaccgatc cgcccgccga tctcaccccc tggccgccgc agcacgccac ccgcataccg 31380
ctcgacggcc tctacgagcg gctcgccgaa agcggctacg gatacggccc ggtcttccag 31440
ggcctgcgcg ctgcctggac actcggcgac gacacctacg ccgaggtcga gatccccgcc 31500
ggcgaccaga ccgacaccga ccgctacgaa ctccaccccg cgctcctcga cgccgcgctg 31560
cacgcgtcct ccctccaggg cgacgaggcc ggggccgggc agctgctgcc gttcgcctgg 31620
accggggtgt cgctgtacgc ggccggcgcc tcggccctgc tcgtcaaggt gtcccgtacc 31680
ggtccggaca ccatggcgct gctcgtggcc gacaccgagg gccacccggt cgccaccgtc 31740
gactcactga ctgtccggcc gatggccatc gaccagaccg cccggagcac cagccaccct 31800
gacgcgctgt tcaccgtggg gctggagtgg gcccaagccc gggagggcaa ccggaccatc 31860
cccctgtccg actgcgccat gctggctccg gacgaaccgg acctcacctc cgccccggcc 31920
tggcccgggt cctccgcgca gcggtacgcc ggcctcgcgg cgctcgctga gatctgcgga 31980
acggacgggc cggtacctgc cgtggtactg gcgcccttcc tccccggcga tgccgcgccc 32040
gccgacaccg ccgccgcgac gcacgcgacg acgcgccgcg ccgccgctct catcaagggc 32100
tggctgggcg acgaccgttt caccgactcg cgtctggtct tcgtcacccg tggcgcggtg 32160
gccaccagcg gccgggacga actgcacgac ctggaacact ccacggtctg gggtctggtc 32220
cggtcggccc agaccgagaa ccccggcagg ttcgcgctgc tcgatctcga cgacccggac 32280
accgtcaccg aactgccgga agccatcctg gccgatcagg cacagctggt cctgcgggac 32340
gggcggctgg gaaacctccg gctggccaag ggcgctgcga tacaggatcc cgacccgggt 32400
tggggtgttg acggtaccgt gttgatcact ggcgggaccg gtgtgctggg tgggctcgtc 32460
gcccgtcatc tggtcgccgg gcatggggtc cgtcgtctgt tgctctgcag caggcggggc 32520
cctgatgcgc cgggtgcggt ggagctggtc gccgagctca ccgctctggg tgcggatgtc 32580
accgttgccg cctgcgacgc ggctgaccgg gatgcgctgg ccgcgctctt ggacaccgtt 32640
cccgccacgc accctctgac tggtgtcgtg cataccgctg gtgtcatcga tgacgccact 32700
gtcaccaccc tcactcccga gcgcatcgac gcggtcctac gccccaaggt cgacgccgcg 32760
ctcaacctcc atcagctgac ggcgcatctc ggcttgaccc gctttgtgct cttctcctcc 32820
gccgccgggc tcttcggcgg cgcgggccag ggtaactacg cggccgccaa cgccttcctc 32880
gacgcactgg cgcagctgcg gaagcggcag ggactgccgg gcgtgtcgct ggcctggggt 32940
gcctgggtcc aggacggcgg aatgaccgca acgctggacg cgggcgacgt cgagcggatg 33000
gcgcgcggcg gtgtgctgcc gctcagccac gagcagggcc tgaacctgtt cgacctggca 33060
gtggcagggt ccgagccgct ggtggcaccg atgcggctgg acaccaccgc gctgcgcgag 33120
tccggtgcca ccgtgccgga gatgctgcgc gggttggtgc gtgagcggtc acgccgccgg 33180
gtcggaccct cgcacacgac gtccgccgcc atggcgctgg aacaacggtt gtcggggttg 33240
gtcgaggggg agcgtcgagc ggcgctgctg gatttggtgt gtggtcatgt cgcgagggtg 33300
ctggggcacg cggacccgag cagcattgag gagacccggc ccttcaagga caccggcttc 33360
gactcattga ccgctgtgga gctgcgcaat gtgctgcacg gtgcgaccgg gttgcggctg 33420
ccggccacgc tggtcttcga ctacccgacg cctgcagctc tcaccgatca cctctacgac 33480
gagcttctgg gttcccgcga ggacgccgtg ctcgccccga tcaccagggc cgcgtacgac 33540
gagccgatcg ccatcgtagc gatgtcctgc cggtacccgg gcggtgtctg cactccggag 33600
gacctgtggc ggctggtggc cgagggccgg gacacgatca cggacttccc ggacgaccgc 33660
ggctgggata tcgacgccct gtatgacccc gacccgggcc accccggcac ctcctacacc 33720
cggcggggcg gcttcctgtc cgacgcggcg ggtttcgatc cggcgttctt ccggatctcc 33780
ccccgcgagg cgctggccat ggacccgcag cagcggctgc tgctcgaaat gacgtgggag 33840
atgttcgaac gggcgctcat cgacccaaca acgctgaagg gcagccaggc cggggtgttc 33900
atcggcaccg ccggccccgg ctacggcggc cgcatccacc acgagtcgca gggcgtcgag 33960
ggccagcagc tgttcggcgg ctcggccgcc gtgacctcag gccggatctc gtacacgttc 34020
ggcctggaag ggccggcgat gacggtggac accatgtgct cgtcctcgct ggtggccctg 34080
cacctggccg tccagtccct gcgcaacggc gagtcctcga tggcgctcgc cggcggggtc 34140
acggtgatgt cccggccggc cgcgttcacc gagttcagcc ggcagcgggg gctgtccccc 34200
gacgggcggt gcaagtcgtt cgccgacgcg gccgacggca ccggctgggg cgagggcgcc 34260
ggcgtgctcc tcctcgagcg gctctccgac gcccgtcgca acggccaccc ggtgctggcc 34320
gtcatccgcg gcagcgccgt caaccaggac ggcgccagca acggcctcac ggcacccaac 34380
ggcccctcgc agcaacgcgt catccgccag gccctggcga acgcgtccct gtcgccggcc 34440
gacgtcgacg ccgtcgaggc ccacggcacc gggacccccc tgggcgaccc gatcgaggcg 34500
caggccctga tcgccaccta cggacaggac cgcccggcgg accggccgct gcggctgggc 34560
tcggtgaagt ccaacatcgc ccacgcgcag gccgcagccg cagtcggcgg cgtcatcaag 34620
atggtccagg cgatccggca cggcctcctc ccgaagaccc tgcacgtgga gcagccctcc 34680
cgccacgtcg actggtccgc cggctcggtg gagctgctca ccgaggcgat gccgtggccg 34740
gagaccgacc aaccccggcg ggccggtgtc tcggcgttcg gcggcagcgg caccaacgcc 34800
cacatgatca tcgagcaggc gcccgcgccg gacgaggagc acaccgacgg cacgagcagg 34860
accagcggcg agagcggcgc cgaacaggcc aggccgctgc cgatggtgcc ctggctgctg 34920
tcggcgaaga cctcgcaggc cctggccgcg caggcccggc gcctgtcagc tcacttgcga 34980
gccaaccccg atctgcgttc ggctgatgtg gcgcattccc tgctcaccac gcggtctgtc 35040
cacgccgagc gcgccgtctt catcgccggt gaccgggatg aggctcttgc cgccctggac 35100
gcactggccg acggcacccc tgcccctcac ctcgttcagg gccttgccga tgtgagtggc 35160
aagacggtgt tcgtcttccc cggtcagggt tcgcagtggg tgggtatggc cgttgagctg 35220
ctggacggct cggaggtttt cgccgagcat atggccgcct gcgccagggc cctggaaccg 35280
tttgtggact ggtccctgga ggacgtccta cgccagacgg acggtacgtg gccactggaa 35340
cgcgtcgaag tggtccagcc cgtgctgtgg gcggtcatgg tctcgctcgc gggactgtgg 35400
caggcacatg gcgttgagcc tgctgcggtg ctgggccact cccaaggtga gatcgctgcg 35460
gcttgcgtgg cgggagccct gagtctggaa gacggagccc gcgttgtcgc gcttcgcagc 35520
caagccatcg ccgaaaccct cgcaggacac ggcggaatgc tctcaatcgc cgcccccgcc 35580
accgacatcg cacccctgat cgcccgctgg aacgagcgga tctccatcgc cacggtcaac 35640
ggaccgcatt cggtggtggt cgcaggagac cctgacgcgc tcgaggcact ccgcggcgaa 35700
ctggagaccc gtggtctccg caatcgtcgc atcccggtcg actacgcctc acacacccct 35760
cacgtcgagg cgatccgtga acggctcctg gccgacctgg cagtgatcca gccacgtgcc 35820
gcgagcattc ccgtgctgtc caccgtcacc ggcgcatggc tcgacaccac cgtgatggac 35880
gccgagtact ggtaccgcaa cctacgtcag accgtggagt tcgaagcagc cacccgcact 35940
ctcctcgacc aggaccaccg ctacttcgtc gagatcagcc cgcaccccgt actctcggcg 36000
atggtccgcg actgcctgga caccagccgc ccggtggtca cggcacccac cctccgacgt 36060
gaccgtaccg atgccactgc cgcgttgacg gcactggccg aagcgcacgg gcacggggtg 36120
ccggtcgact gggcgtcgct cttcgccggc tcgaccgccc gggcggtcca cctgccgacg 36180
taccccttcc agcggcaaca ctactggctg gattccggta cgggcagcag tgacatgagc 36240
acggccggac tggcgtcccc cgatcatccg ctgttgggag ccgtgacgac ggtggccggc 36300
gaggacggcc acctcttcac cggccggctg tcggtacgga cgcacccatg gctggccgac 36360
caccagatca ccggttcggt cctgttgccg ggcacggcct tcgtcgaact ggccgtccgg 36420
gccggggacc aggccggctg cgggcgggtc gaggagctga cgctgctggc tccgctcgta 36480
ctgcccgaag agggcagcgt cagggtccag atgaaggtgg gggagcccga cgccacgggc 36540
cgccgcacca tcgaggtgta ctcctcggac cagcaggccc ccggccggga acgctgggtc 36600
ctcaacgcga gcgggatgct tgccggcgaa ccggtggagg ccccgccgag tctcaccacc 36660
tggcccccgg aaggcgctgt ccccgttccg ctggacggct tccacgaccg gctggcggca 36720
cgcggcttcg gctacggtcc gacattccgc gggctgagcg ccgcgtggtc acgcggtgac 36780
gagatcttcg ccgaagcggc gctcccctcg ggccatcggc aggatgccgc ccggttcgga 36840
ctccacccgg cgctactcga cgctgccctg cacgccatgg aactccggga accccgcccg 36900
gccggcgacg gagtccggct tccgttcgcc tggaacggct tctccctgca cgcgtcgggt 36960
gccgaagcgg tacggctgcg cctcgcgccg acgggcgccg acgctctgtc ggtgaccctc 37020
gccgatgcca tcggtcgccc ggttgcctca gcccgctcgc tggccctgcg ggagctctcg 37080
tccgacctgc tgcgcccggc gtccgtctcg tacggggact cgctgttccg caccgcttgg 37140
atacccgccc tcgtcggccc ggaggcggag tccgggccgg ggcgaccgtc cgccggctgg 37200
gcggtgctgg gccccgatcc gctcggcgcg gccaacgccc tgaacctcac gggaacctcc 37260
tgctcctgct atccggacct ggcggcgctg atcgcggccg tcgacggcgg agccgcggtg 37320
cccgaggccg tactcgcgcc gtacgcggcg gagccagccc cggacgcggg atctcccgcg 37380
gacgccgtac gggcctcgac cggccgggcg ctgcaactgc tgcaatcctg gctgtccgag 37440
gaccggttgg agcgaagccg gctgatcgtg ctcacccggg gggcggtggc cgtcggtacg 37500
gacgaaggcg tcaccgacct ggtgagtgcg tcggtccggg gtctggtccg ttcggcgcag 37560
gccgagcacc ctggcaggtt ctccctggtc gacatcgacg accgggagga gtcctgggcc 37620
gtcctgagcg cggcggcggt atccggtgag ccgcaggtcg ccctgcgctg cggccagatg 37680
aaggtgcccc gcctcggctc cgtcgacgtt cccacgaccg gtatgcctga gatgcccgac 37740
gtttggggtg ttgacggtac cgtgttgatc actggcggga ccggtgtgct gggtgggctc 37800
gtcgcccgtc atctggtcgc cgggcatggg gtccgtcggt tgttgctctg cagcaggcgg 37860
ggccctgatg cgccgggtgc ggtggagctg gtggccgagc tcaccgctct gggtgcggat 37920
gtcaccgttg ccgcctgtga tgcggccgac cgggatgcgc tggccgcgct cttggacacc 37980
gttcccgcca cgcaccctct gactggtgtc gtgcataccg ctggtgtcat cgatgacgcc 38040
actgtcacca ccctcactcc cgagcgcatc gacgcggtcc tacgccccaa ggtcgacgcc 38100
gcgctcaacc tccatcagct gacggcgcat ctcggcttga cccgctttgt gctcttctct 38160
tcggccgccg ggctcttcgg cggcgcgggg cagggcaact acgcggcggc caacgccttc 38220
ctcgacgcac tggcccaaca ccgccgggcc aacggcctca atgcccagtc cctggcgtgg 38280
ggactgtggg cggaagccag cgggatgacc gggcacctgg acgcggccga cctcgcccgg 38340
atgggccgtt ccggcctcac cgcgatgccc accggggacg ggctggcgct gctcgacacc 38400
gcccagcggg tggacgaagc caccctggtc acggccgcgc tggacacccg ggccctgcat 38460
gcccgggccg cagacggcac gctgccggcg ctgttccacg cactcgtgcc cgtaccgcgc 38520
cgatccgcga cctccccggc ggcccaggcc gcggggccgg atggactccg ccagcggttg 38580
tcggggctgg tcgtggggga gcgccgagcg gcgctgctgg atttggtgtg tggtcatgtc 38640
gcgagggtgc tggggcacgc ggacccgagc agcattgagg agaacaaggg cttcaaggac 38700
accggcttcg actccttgag cgcggtggag ttccgcaacc ggctgcacgg tgcgaccggg 38760
ttgcggctgc cggccacgct ggtcttcgac tacccgacgc ctgcagctct caccgatcac 38820
ctctacgacg agcttctggg ttcccgcgag gacgccgtgc tcgccccgat caccagggcc 38880
gcgtacgacc cggtggactt cgactacccg acgcctgcag ctctcaccga tcacctctac 38940
gacgagcttc tgggttcccg cgaggacgcc gtgctcgccc cgatcaccag ggccgcgtac 39000
gacgagccga tcgcgatcgt ggggatggcc tgccgctatc cgggcggggt ggagtccccg 39060
gaggacctgt ggcagctggt cgccgacggc cgtgacgcca tctccgactt ccccgccgac 39120
cggggctgga acgtcgagag cctctaccac cccgaccccg accaccccgg caccagctac 39180
acccgtgccg gaggcttcct gcacgacgcg gcggacttcg acccggagtt cttcgggatc 39240
tcaccgcgtg aggcactggc caccgacccc cagcagcgac tgctgctgga aaccagctgg 39300
gaagccatgg aacgggcggg aatcaacccc tccaccctga agggcacccc caccggcgtc 39360
ttcctcggcg tcatgtacaa cgactacggc actgccatgc agcaggcggc agaggtcttc 39420
gagggccata tggccagcgg tagcgcgggg agtgtggcgt cgggccgggt ctcgtacacg 39480
ttcggtctgg agggaccggc cgtcacggtg gataccgcgt gttcgtcgtc gctggtggcg 39540
ttgcatctgg ccgcgcaggc gttgcgcaac ggtgagtgca ctctggctct ggcgggcggt 39600
gttgcggtga tgtccactcc tgccacgttt gtcgagttca gccggcagcg ggggctggca 39660
gctgatgggc ggtgcaaagc cttcgcggac gctgccgacg gcaccggctg gggcgaaggc 39720
gtcggtgtgc tgctggtgga gcgtttgtcg gacgcgcgcc gcaacgggca tccggtgctg 39780
gcggtcgttt cgggcagtgc tgtcaaccag gacggggcca gcaatggtct gacggcgccc 39840
aatggtcctt cgcagcaacg ggtgatccaa caggcgctgg ccaatgcggg gttggcgggg 39900
gcggatgtcg atgccgtgga ggcgcacggc acgggaaccc ggctgggcga cccgatcgag 39960
gcgcaagcgt tgatcgccac ctacggacag gcccggtcgg cggaccggcc gttgtggctg 40020
ggttcgctga agtccaacat cggtcacacc caggccgccg cgggcgtcgc cggcgtcatc 40080
aaaatggtgc aggcgatgca gcacgggact ctgccgccca ccctgcacat cgaccagccc 40140
acgggccagg tcgactgggc tacgggtgca gtggagctgc tgaccgaggc cgtgccctgg 40200
ccggacagtg accggccccg ccgggtggct gtctcctcgt tcggtgtcag cggtaccaac 40260
gcccacgtca tcatcgaaca caccccacac accccacaca ccacccgcac ctgcccaatc 40320
ctcccaatcc ccccaggccc cgcagactgt gcaggcccat cggccggtgc gtggctgctg 40380
tcggcgaaga cctcgcaggc cctggccgcg caggcccggc gcctgtcagc tcacttgcga 40440
gccaaccccg atctgcgttc ggctgatgtg gcgcattccc tgctcaccac gcggtctgtc 40500
cacgccgagc gcgccgtctt catcgccggt gaccgggatg aggctcttgc cgccctggac 40560
gcactggccg acggcacccc tgcccctcac ctcgttcagg gccttgccga tgtgagtggc 40620
aagacggtgt tcgtcttccc cggtcagggt tcgcagtggg tgggtatggc cgttgagctg 40680
ctggacggct cggaggtttt cgccgagcat atggccgcct gcgccagggc cctggaaccg 40740
tttgtggact ggtccctgga ggacgtccta cgccagacgg acggtacgtg gccactggaa 40800
cgcgtcgaag tggtccagcc cgtgctgtgg gcggtcatgg tctcgctcgc gggactgtgg 40860
caggcacatg gcgttgagcc tgctgcggtg ctgggccact cccaaggtga gatcgctgcg 40920
gcttgcgtgg cgggagccct gagtctggaa gacggagccc gcgttgtcgc gcttcgcagc 40980
caagccatcg ccgaaaccct cgcaggacac ggcggaatgc tctcaatcgc cgcccccgcc 41040
accgacatcg cacccctgat cgcccgctgg aacgagcgga tctccatcgc cacggtcaac 41100
ggaccgcatt cggtggtggt cgcaggagac cctgacgcgc tcgaggcact ccgcggcgaa 41160
ctggagaccc gtggtctccg caatcgtcgc atcccggtcg actacgcctc acacacccct 41220
cacgtcgagg cgatccgtga acggctcctg gccgacctgg cagtgatcca gccacgtgcc 41280
gcgagcattc ccgtgctgtc caccgtcacc ggcgcatggc tcgacaccac cgtgatggac 41340
gccgagtact ggtaccgcaa cctacgtcag accgtggagt tcgaagcagc cacccgcact 41400
ctcctcgacc aggaccaccg ctacttcgtc gagatcagcc cgcaccccgt actcaccatc 41460
ggtctacagc agaccatcga ggaaaccacc gctccggccc ggaccctctc caccctccga 41520
cgcaacgaag gcaccctccg gcacctgttc acttccctcg cccaggccca cgcccacggc 41580
ctgaccatcg actggacccc cgccttcacc cacaccgagc cccgcaccac ccccctgccc 41640
acctacccct tccaacacga acgctactgg ctggacacgg cggagccgcc tgttgggcag 41700
ggagccggca ccgacaccgt cgagagcggt ttttgggacg ccgtcgaggg cgaggagtgg 41760
cagacgttgg ccgacacgct cggcgttacc gccgacgcgc cgttcgactc cgtgatgtcc 41820
gccctgtcgt cctggcggct ccgacagcgt gagcagtcct tggtggacgg ctggcgttac 41880
cggatcgagt ggaagccgtt ccgcgccccc gtgtcggcac cggattccgt gtcgggcacc 41940
tggtgggtgg tcgttcccgc ccatgccggc gacgcggacc gggagagggc gcaagccgtg 42000
cggggcacgc tggagtcctc cggccgtgcg cggacgatcc tggtcgcggt ggacccggcc 42060
gccgacgacc gggggtcgct cgaactgaaa ctcagggacg ccgcgaccga ggcgggtccg 42120
ccggccgggg tgctgtccct gctggccacc gacgaacgtc ccctccccgg gcatgatgtg 42180
gtgcccgggg ggctggcagc caacctggct ctcgtccagg cactgggcga cgcgcagatc 42240
gatgccccgc tctgggtggg cacctgcggg gcggtctccg ccggccggtc cgaccggctg 42300
gcgaaccccg ggcaggccgc ggtctggggg ctcggacggg tggtcgccct ggagcacccg 42360
gaacgctggg gcggtctgat cgatctgccc gtggtcctcg acccgcgcgc tgtggaacgg 42420
ctggtgacag tacttgccgc gtcgggcgag gaggaccagc tcgccgtacg ggcgtcgggg 42480
gtcctcgtgc gcaggctcgt gcgggtaccc gcacgccaag tgccggacgg cgtgcagtgg 42540
aagcccgagg ggacggtcct ggtgaccggt gggaccggag cgctgggcgc ggaggtcgcg 42600
cggtggctgg ctcatggcgg cgccgaacac ctggtgctga ccagccgtcg cggcggctcg 42660
gcgcccggtg cggccgagct gacggacgag ctgcttgccc tcgggacgga agtgacactg 42720
gccgcctgtg acatggcaga ccgggacgcg gtcgccgcgc tgctcgccga gcacgcgccg 42780
agctcggtgg tgcacaccgc cggcgtcctc gacgacggtg tactggacag cctggaccgc 42840
gggcggctgg agtcggttct gctgccgaag gtggccgccg ctcggcacct gcacgagttg 42900
acgaaggacg cgaacgtgtc ggcattcgtg ttgttctcgt ccgccgcagg cgtgctcggc 42960
agcgcaggcc agggcaacta cgcagccgcc aacgcctacc tggacgccct ggccgaacag 43020
cgcagggccg atggactggt cgcccattcg atcgcctggg gcgcgtggga cggcggtggg 43080
ctggccgtgg gcgacagcgt ggtcgaggaa cggctgcgcc acggaggagt ggtccccatg 43140
cgcccgcagc tggcgatcac ggcgctccag cagacgttgg accgggcgga gaccgcggtg 43200
gtcatcgctg acgttgactg gccgcgctac ctcaccgcgg tcacaccgcg cccatggctg 43260
gcggacctgc cggaggtcgc ccaggccctt aacgccgacg acgcggctgg tgccccttgc 43320
ggcacagccg ggcagggctc gtccccgctg gccgagcgtc tctccgggcg cccggcaccc 43380
gagcagcggc gactggtgct cgacctggtc cgtacgaacg tggcggcggt gctcggccac 43440
gccggtgcgg agtcgatcga gtccggccgg gccttccgcg agctgggctt cgactctctg 43500
accgccgtcg agctgcgcaa caggctggct gcggccaccg ggctgcggct gcccaccacc 43560
ctggtgttcg actacccgag cgctgccgtg ctcgccgatc acctgtacgc gcaggcgatc 43620
ggttcggacg aggggcccgt ggcggatctg tcctccggcg ccgatccggc ggccggaccg 43680
gacgacgagc ccatcgccat cgtgtcgatg agctgccgtt tccccggcgg tgtctcctcc 43740
ccggaggagc tgtggcagct gctgctggcc ggtgaggaca cgattaccgg gttcccggac 43800
gaccgggact gggatgtcga cgccctgtac gacccggacc cggaccaccc ggggaccacg 43860
tattcccgca gcggcgcgtt cctgtccgac gcggccggtt tcgacgcgac gctgttcggg 43920
atctcgccgc gtgaggcgct ggccatggac ccgcagcagc ggctgctgct ggagacggca 43980
tgggaggtgt tcgagcgggc gggcatcgat cccacctcgg tacgtggcag ccgggccggc 44040
gttttcgtcg ggaccaacgg ccaggactac gcccgccatg tgccccagga accgatcggc 44100
gtggaggggt atctgctggc gggcaatgcg gccagcgtca tctccggccg tctgtcgtac 44160
acgtttggtc tggaggggcc ggccgtcacg gtggacaccg cgtgttcgtc ctcgctggtc 44220
gccctgcacc tcgccgtcca ggccttgcgc aacggcgaat gctccatagc cctggcggga 44280
ggcgtgtcgg tgatgtccac cccggcggcg ttcgtggaat tcagccggca gcgggggctg 44340
gcggctgacg ggcggtgcaa ggcgttcgcg gacgcggcgg acggcaccgg ctggggcgag 44400
ggggttggcg tgctcctcgt ggagcgtctg tccgacgcgc gccgcaacgg tcacccggtg 44460
ctggccgtcg tacgcggcag cgccgttaac caggacggcg ccagcaacgg cctcacggcg 44520
cccaacggac cctcgcagca acgcgtcatc cgccaggcac tcgttgacgc cgcgctgacc 44580
ggtagcgaca tcgacgccgt cgaagcccac ggcaccggga cccggctggg tgacccgatc 44640
gaggcgcagg ccctgatcgc cacctacggt caggaccgcc cggcgaaccg gcccctgtgg 44700
ctgggctcgg tcaaatccaa catcgcacac acgcaggccg ccgcgggcgt cgccggcgtc 44760
atcaagatgg tccaggcgat ccgccatggc gtacttccca agaccctgca cgtggaccgg 44820
ccgaccagcc acgtcgactg ggaggcaggc gcggtggagt tgctgaccga ggccatgccc 44880
tggccggaga ccgaccggcc gcgtcgggcc ggcatctctt ccttcggcgt cagcggcacc 44940
aacgcacaca ccatcgtgga gcaggcacct gcggcggaag acgagccgga aacggggcca 45000
cccgccgatg ctccgcccac ggtggtgccc tgggtgctct ccgctgccac cgaggacgcg 45060
ctgcgagagc aggccgcacg cctcgccacg tacctcgacg agcgccccga gccaagcccg 45120
gccgacatcg ggtcctccct ggtcaccacg cgtgcagccc ttgaccaccg ggcggtggtg 45180
ctcggtgagg accgcgacgc tctgcgggcc gggctggttc tgctggcgaa cgggaagtcc 45240
ggtcccgctg tcgtccgtgg cctcgccagg cccggacaga aggtggcgtt cctgttcacc 45300
gggcagggca gccagcgact gggcatgggc agggagctcc atcgccacct gccggtgttc 45360
cggcagttct tcgacgaggc gtgcgccgcg ctcgacgcac acctgccggt accgatagcg 45420
gccgcgctgt tcgcgcaggc ggatggggcg gatgcggggc tgatcgatgg gacggaattc 45480
gcgcagccgg cgttgttcgc gctggaggtg gcgttgtgcc ggacgttgga gttctgcggt 45540
gtcaggccgg tttacgttgc cgggcattcg gtcggtgaga tcgcggcggc ccatgtggcg 45600
ggggtgttct cgctggagga tgcggctcgt ctggtggtgg cgcgcggaca gttgatgcag 45660
gcgttgccgg ccggtggtgc gatggtcgcg ctccaggtgt ccgaagacga cctcctgcca 45720
tccttgactc cttggctgga gcaggaccgg ctgggtatcg cggcggtcaa cggcgcagca 45780
tccacagtgg tgtcgggcga tgaggaggcg gtcctggcgg ttgccgagca ctggcaggcg 45840
cggggccgca aggttcgtcg gctcactgtc agccatgcct tccactcacc tcgtatggac 45900
ccgatgctcg accagttccg tgtggtcgtg gagggtatcc gtttcgcgga gccggccatc 45960
ccggtcgtct ccagcgtcac cggtcgtctt gccgagcccg ggcagttgac cactgcggac 46020
tactgggtgc gccacgtccg tcaaacggtc cgcttccacg acgccctcca gaccctccag 46080
accgagaatg tgaccgcgtt tctggagatc ggtcccgacg ggcaactctc ggcaatggcc 46140
caggagacgc tcaccgccca ggtccatacc atccccaccc tccgaaagaa ccggtctgag 46200
accaccggct tgctcaccgc actggcgcaa ctccacacca ccggcaccgt ccccgactgg 46260
accgcttacc tcaaccacca ccccacaccc tccacacccg tgcccaccta ccccttccaa 46320
caccaccact actggatgca cggcggtacc caggccaccg atgtcagctc cgccggcctg 46380
tcaggagcca accacccgct gctgggggcc gcggtcccgc tggccggtgg ggagggccac 46440
ctgttcaccg gccggctgtc ggtgcggacc caccgctggc tggccgacca ccaggtcggc 46500
agcaccgtcg tgttgccggg cactgccttc gtcgaactgg cggtacgggc cggtgaccag 46560
gtcggctgcg gccacgtgga ggagctgacg ctggaagcgc cgctcgtgct gcccgagagc 46620
ggcgccgtac agatacagct ccggctgcgc cgggcggacg aatccggacg gcgtgaactc 46680
gtcgtgtacg ggcggctcgc gacggaccgt gaggacctgt ggtccgagga ggaatggacc 46740
cggcacgcca gcggtgtcgt cgtcgcagca gcgccctcgg cccccgagcc cgtccaactg 46800
accgtatggc ccccggaagg cgccaccgag ctcatcgtga aggacctcta cgaacggatc 46860
gccggcacca gcttcggcta cggtcccgcc ttccaagggc tgcgcgccgc ctggcggctg 46920
gacgacgcgg tgttcgcgga ggtcgtgctg ccacaggatc agtacgccgt cgcgagccgg 46980
ttcggactcc acccggcgct gctcgacgcc gccctccacg gggtcgcgct ggggcagccg 47040
gcggctgaca ccgccgagcc gcacaccgac cggatgccct tctcctggag cggcgttacc 47100
ctctacgccg ccggtgccac cgcactgcgg gtgcggttgg acatcgcttc gcccgaggac 47160
gtgtcgctgc tcgtcgccga tggctcgggg gctccggtgg ccgcggtgaa ctcgctgaag 47220
ctgcgcccgg tcgcggccga cctggccagt gccggtgtcg ccgactcgct gttccggctg 47280
gagtggtcga aggcggtcga cgacgagccc ggccgggccg aaccggggca atgggccctg 47340
atcggaacgc cgcccggtgc cgacttcacg ccgggcgagg acggcgtcat catcggaagc 47400
tacccggaca tggccgcgtt gaccgacgcg ctcgacaagg gagtcgccgt cccgcagcgg 47460
gtgttgttgt ccgccccgtc ggaggaggag caggaccagg cgcacgatct cgcgagcgcg 47520
gtggacaagg ccacgaacgc gctgctcgca gtgctccagc agtggctgtc cgacgaccgg 47580
ttcgactcct ccaggctggc tgtgctgacc cgtcacgcgg tgtccacggc tgggcaggag 47640
gacgtgacgg accttgccca cgcctcgtgg tggggactcg ttcgctcggc gcagtccgaa 47700
catcccgacc ggttcgtgct ggccgacacc gacggcaccc agatcagtca cgctgccctt 47760
ctgcccgctt tgctgtccgg tgagccgcag gtcgcgctgc gtgacggaac ccggtatgtg 47820
ccgcggctgg ccagggccgt tgcgtccggg gacgggccgg tggcgcgggt ggacccggcg 47880
gggacggtgt tggtgaccgg tggtacgggg actctggggt cttcgctggc caggcatttg 47940
gtggttgagc acggggtgcg gcggttgttg ctggtgagcc gtcggggcgg ggagtcggag 48000
ggcgcggcgg agttggtggc tgagctgacc gggctcgggg cggatgtcac ggtggcggcg 48060
tgtgatgtgg gggaccgggg ggccgtggcg gagttgctgg cggggattcc ggccggtcat 48120
ccgttgacgg cggtggtgca tgcctcgggg gtcactgatg acgcggtgat cgaggcgttg 48180
actgcggagc aggtcggccg ggtgctgcgg tcgaaggtcg atggggcggt caatctgcat 48240
gagttgacgc gggggctgga tctgtcggcg tttgtgttgt tctcttcggc ggccggtgtg 48300
ttcgggaatc cggggcaggg caactacgcg gcggccaatg cctttctgga tgcgttggcg 48360
gtgcggcgcc gggcggaggg cctggctgcg cggtcgctgg cctggggtct gtgggaggag 48420
gccagcgcga tgacgagccg gctggccggg gccgatctgg tccggatggg ccgtgcgggc 48480
ctgcttcccc tcaccaccgg gcaagggctc gccctcttcg acgccgccca ccggacagac 48540
gagcccctgg tactgccgat gaggctggac accacggccc tgcgctccac caccggacag 48600
ccgccggcgc tgctgcgcaa cctggtccgg gtccaggctc gccggacggc gggcgcggcc 48660
cccggaccgg acgcggccgc caccttccag cagcagctca tcagcctgtc cgtcgcggag 48720
cgcgggcggg tgctgctgga gaccgtacgc ggccacgcgg ccgccgtgct cgggcactcc 48780
ggcccggaag ccgtcgatgt cgacaagggc ttcatggaag cgggcttcga ctccttgagc 48840
gcggtggagt tccggaaccg gctgacgtcc accaccgggc tgcggatgcc ggccaccgtc 48900
acgttcgact acccgagccc ggccgcgctg gccgagcacc tgctgacgcg gttggttccc 48960
gaggtcgcca tgcccgcgga ggagcagcac ccgcacaccc ggcccgaaga cgggccggtg 49020
gacaggcccg gagacgaaca ggggggcgcg atcgacgaca tggacgtcga cagcctcgta 49080
gaactcgccc tcggcgaatg attcctgatg ccgcatcgat ccgggaggac agcatgagca 49140
agccccatga aaaagtagtc gcggcgctcc gggcgtcgct gaaggccaac gaacgcctgc 49200
gggagctcaa cgacgagctc gcctcggcgt cccgcgaacc ggtcgccatc gtcggcatgg 49260
cgtgccggta tcccggcggg gtgacgtccc ccgaggaact gtgggacctg gtcgccggcg 49320
gcaccgacgc ggtgtcggag ttccccgccg accgtggctg gaacgtcgag gagctctacc 49380
acccggaccc ggaccactcg ggcacctcct acgtgaggga gggaggcttc ctgcatgagg 49440
cggcggagtt cgatccggtg ttcttcggca tgtccccacg ggaggcgctg gccacggatc 49500
cgcaacagcg gctgctcctg gaaacggcat gggaggcctt cgagcggggc ggtatcgacc 49560
cactccggct ccggggcagc cggaccggcg tattcgtcgg cgtcatgtac aacgactacc 49620
tcacccgcct ccagccggcc cccgcggact tcgaggggca gctcggcaac ggcagcgcgg 49680
gcagcgtcgc caccggccgg ctggcctaca cgttcgggct ggaggggccg gcggtcacgg 49740
tggacacggc gtgttcgtcc tcactggtcg ctctgcacct cgccgcccag gcgctgcgca 49800
acggcgaatg caccatggcg ctggcaggcg gggtcgccgt gatggccacc ccggggccct 49860
tcaccgagtt cagccggcag cgcggtctcg cggtggacgg ccggtgcaag ccgttcgccg 49920
cggcggcgga cggcaccggc tgggcagagg gcgtcggcct gctgctggtc gagcggctct 49980
cggacgcccg gcgcaacgga cacccggtgc tggctgtcat acgcggaacg gcggtgaacc 50040
aggacggtgc cagcagcggc ctgaccgtgc ccaatggccc ctcgcagcag cgcgtcatcc 50100
ggcaggcact ggcgaacgcg ggcctgtcgg ccgccgacgt cgacgcggtg gaggcacacg 50160
gcacgggcac cccgctgggg gacccgatcg aggcccaggc cctgatcgcc acctacgggc 50220
aggaccgccc ggccggccgg ccgttgtggc ttggttcgct gaagtccaac atcggccaca 50280
cccaggccgc cgcgggcgcc gccggagtca tgaagatggt ccaggccatg cgccacggga 50340
ccctcccgaa gagcctgcac atcgacgccc ccacgcccca ggtcgactgg gaggccgggg 50400
cggtggaact gctcaccgag gccgtgccgt ggcacgagac cgaccggccc cgcagggcgg 50460
gcgtgtcctc cttcggggtc agtggcacca acgcccacgt gatcatcgag gaggctcccc 50520
cgaccgaagc tcccgagggc gtgacggcgc gggcgccgct caacgccgag accttgccgt 50580
gggtggtctc gggccgtggc gtagaggccg tccgggcgca ggccgggcag ctgcgctcct 50640
atctgtcgga gcgtcaggac tcgtcactgg agggcatcgg actctctctg gccaccacgc 50700
ggtcggcgtt ccagcaccgg gccgtcgtac tggcggccga ccacgatggc ttcatggccg 50760
ggctggacgc gctggccacc ggggaaccgg cgaagggctt ggtcgatggg gaggccgtat 50820
cgggcggcgg agtcgccctg gtcttccccg gccagggctc ccaatgggcc ggaatggcgc 50880
tcgaactgct ggactcctca tccgtgttca gagaccggat ggaagcctgc gcgcaggcgc 50940
tgagccccta catcgactgg tcactgaccg aggtcctgcg ctcctgcgaa ggcgagctgg 51000
aacgggtgga cgtggtccag cccgcgctgt gggccgtgat ggtctcgctg gccgaactat 51060
ggcgttcctt cggagtccgg cccgccgcgg tcctgggcca ctcgcagggc gagatagcgg 51120
cggcctgtgt ggccggcgcg ctcagcttgg aggacgccgc gctggtggtc gcgctgcgca 51180
gccaggccat cgcgaccgag ctggccggcc ggggcgcaat gctgtccgtc gccctgccga 51240
aggcacgggc ccaggactgg atgacggggc gggcggaacg gctgtcggtc gcggcggtca 51300
acgggcccgg atcagttgtg gtctccgggg acgtggacgc ggtggaggag ctgcgggcgg 51360
agctggccgc cgagggggtg cgggtccgca ggcttccggt cgactacgcc tcgcacagct 51420
cgcatgtgga gcggatccgc acacgtctgc tggcggcgct cgccccggtc tccccgcgcc 51480
cttccgagat caccctgtac tcgtccgtga ccggtggtcc catcgacacc acgaccatgg 51540
acgccgagta ctggtaccgg aacctgcggc agaccgtgga gttcgagcgg gcggtccgca 51600
cctcgatgtc cgacggctac cggttcttca tcgagtccag cccgcacccg gtgctgacga 51660
cgggcatcga ggagaccgcg gaggacgctg accggttcgc ggcggcggtc ggttcgctgc 51720
gccgttcgga cggtggcccc gacaggttcc tgactgcgct cgcggaggct cacgtgcgcg 51780
gcgtgccggt ggagtgggcg gtgatgttcg ccggccggcc cgtgagtcag cccgatctcc 51840
cgacgtactc cttccagcgg cagcggtatt ggctggcccc cgacacgtcc cccggcgacg 51900
acggcggcgg cgacgaacgc tcggagacgc ggttctggga ggctgtcgag cgccaggacc 51960
tcggcgaact gagcgagacc ctgcggatcg gtgacgcgga ccggcaggcg tcgttgggtg 52020
agttgttgcc ggccctgtgg acgtggcgtg agcagaaccg gtccgccgcc gtcctggaca 52080
gctggcggta ccgggtctca tggcggcccg tctccccggc gtccgatcca gccttgccgg 52140
gcacctggct gatcgtggtc ccggcgggga cggcggacca gcagtgggcc gaagcgctct 52200
cccgagccgc cgagggcctg ggagaccagg ctgtccgggt cgaactgggc agggccgaag 52260
ccggccggga ggagtacgcg gccaggctcg ccgaggcggc ggccggcggt ccggtggccg 52320
gcgtgctttc cctgctcgcc ctggccgagg agccggcgga cgccgacccg gtgtggcgcc 52380
cgtatgtcac cagcacgctg gcacttatgc aggcgctggg cgacgcgggg atcggcgcgc 52440
cgctgtggct ggccacccgg ggcgcggtct cgatcgggcg gtccgacaag ccggtcccgt 52500
cgacagccgc acaggcccag ctgtggggcc tgggccgggt catgggactc gaacaccccg 52560
aacggtgggg tgggctcgtt gatctgccgg agacggccga cgctcgtgcg acggcgcggc 52620
tggccggcat cctggccggc ggtctcggcc ccgaggacca gtgcgcggtg cggtcctccg 52680
gcgtgtacgt acggcgtctg gtccgcgcac cgctcgaccg gcgagcgcgg aggccgtcct 52740
ggcacacgtc ccgtacggcc ctggtcaccg gtggcaccgg cggtctcggg gcgcacgtcg 52800
cccgatggct ggcgagcacc ggcgcggaac acctggtgct caccagcagg cgcggcccgg 52860
acgcccctgg gacggacgag ctgtgcgccg aactgtccgc cctcggggtg cgggtgagcg 52920
tggtggcctg cgatgtgtcc gaccgggacc aactggccgc cacattggca cgattgaccg 52980
ccgacggcca caccgtccgt acggtggtac atgccgccgg ggtcagtacg ccgggcgcgc 53040
tggccgacct cgggcccgcc gagttcgccg aggccgtcgc gggcaaggcg gcgggcgccg 53100
cgcacctcga cgaactgctc ggcgacgcgg agctggacgc cttcgtgctc ttctcatcca 53160
acgccggcgt gtggggcggc ggcggccagg gcgcctatgc cgccgccaac gcctacctgg 53220
acgcgctggc caaacggcgc cggtcccgcg gccgcgtcgc gacctccgtc gcatgggggg 53280
cttgggccgg cggcggcatg gccgcggagc gtaccgccga cgagcagctg cgccgccgag 53340
gggtgcgggc gatggaccca gcgatggcga tctccgcact ccaggaggcg ctggagcacg 53400
aggagacgtt tctcgcggtg gccgacatgg actgggaccg tttcctcccg tccttcacca 53460
tggcccggcc ccgccccctc ctcgacgacc tgccggaggt ccagcggcag cggctgagcg 53520
cggccccgtc atgggccacc gcggagaccg acggcccggc actcgcgcag cagctcgccg 53580
gggtctttga accggagcgc gggcggcgcc tgctcgacct ggtgcgcaag cacgcggcgg 53640
cggtgctcgg ctacgccggc ccgaacgagg tcgaggcgga acgggccttc cgggagctgg 53700
gcttcgactc cctcaccgcg gtggagatgc gcaaccgact ccagccggcg accgggctga 53760
cgctgcccgc caccctggtc ttcgaccacc cgacgccccg cgctctggcc gcgcatctgc 53820
gggatgagct gttcggtgtg caggacgaca cgccggaacc ggcgcgggcg tcggcaccgg 53880
acgacgaccc gatcgccatc gtgtcgatgg gctgccgttt ccccggtggt gtctcctccc 53940
cggaggggct gtgggagctg ctgctgtccg gccgtgacgc catgtcgtcg ttcccagtgg 54000
accgaggctg ggacctggac agccttgccg gtgacggccc cggacagatc ggcggcggtt 54060
acacccttga gggcggcttc ctcgatgacg cggccggttt cgacgcggcg ctgttcggga 54120
tctcgccgcg tgaggcgctg gccatggacc cacagcagcg gctgctgctg gaggcttcgt 54180
gggaggcctt cgaacgagcg ggcatcccct cggccgacct gcggtccagc cggaccgggg 54240
tgttcatcgg cgcttcctca cagggatacg cccaggtcgc cgcggagtcc gcggaaggag 54300
tcgagggaca tgtggtgacc ggtgacgcgg ccagcgtcat gtccggccgt ctgtcgtaca 54360
cgttcggtct ggagggaccg gccgtcacgg tggataccgc gtgttcgtcg tcgctggtgg 54420
cgttgcacct ggctgcgcag gcgttgcgca acggtgagtg cactctggct ctggcgggcg 54480
gggtcgcggt gatggtgacc ccggcggcgt ttgtcgagtt cagccggcag cgggggctgg 54540
cagctgatgg gcggtgcaaa gccttcgcgg acgctgccga cggcaccggc tggggcgaag 54600
gcgtcggtgt gctgctggtg gagcgtttgt cggacgcgcg ccgcaacggg catccggtgc 54660
tggcggtcgt ttcgggcagt gctgtcaacc aggacggggc cagcaatggt ctgacggcgc 54720
ccaatggtcc ttcgcagcaa cgggtgatcc aacaggcgct ggccaatgcg gggttggcgg 54780
gggcggatgt cgatgccgtg gaggcgcacg gcacgggaac ccggctgggc gacccgatcg 54840
aggcgcaggc gttgatcgcc acctacggac aggcccggtc ggcggaccgg ccgttgtggc 54900
tgggttcgct gaagtccaac atcggccaca cccaggccgc cgcgggcgtc gccggcgtca 54960
tcaagatgat ccaggccatg ggtcacggga cgctgccccg tacgctgcat gtcgaccggc 55020
cctcgtccca ggtggattgg gaagccggcg cggtggagct gctgaccgaa gccatgccct 55080
ggcccgaggc cgaccggccc cgccgggcag cagtctcctc gttcggtgtc agtggtacga 55140
acgcgcacgt catcatcgaa cacgccccgc aggtcactcc cgcctcccag gccccggaac 55200
cggtgaagtc cccggatgct gtggaggctg atcgaccggt cccgtggctg ctgtcggcgg 55260
gcagtgacgc ggcgttgggc gaggtggccg aacggctggc cgcctacgcc gaatcgcacc 55320
cggaggtcag tgcggccgag gtcgcgttct cgctcgcgac cacccggtcc ctgttgccgt 55380
gccgcgccgc cgtcgttggc gcggaccgcg acgagctggt ccagcgcatc cggtccgtgg 55440
gcgggggcac caccgccccg ggcgtcttct gcgggacggc gagttcggag tgcaccacgg 55500
cgttcctgtt ctccgggcag ggcagccagc gactgggcat ggggcatgag ctgtacgccg 55560
cgcacccgga gttcgccgag gcgctcgacg aggtctgcgg tcacctcgac gtgttcgggg 55620
accggccgtt gaaggaggtg ctgttcgcgc aggcggatgg ggcggatgcg gggctgatcg 55680
acggggcggg gttcgcgcag ccggcgttgt tcgcactgga ggtcgcgctg taccggaccc 55740
tggaagcatg gggcatcacc cccgactatc tggccgggca ctcccttggt gagatcgcgg 55800
cggctcatgt cgccggggtg ttcagcctgg aggacgccgc tcgcctggtc acggcgcggg 55860
ggcagctcat gcaggccctg cccggcggtg gcgcgatggt ggccgtccag gcctccgagg 55920
acgagatcct ggccatctcg gcgccgtggc tggaggggga cggggtcggc atcgccgccg 55980
tcaacggtcc cgcctcggtc gtcgtctccg gggacgagga agccgtcctg gcgatcgccg 56040
ggcactggcg ggcacagggc cgcaagaccc gtcggctcag cgtcagccac gccttccact 56100
caccccacat ggatcccatg ctcgacgggt tccgccgggt cgtcgacggc atgcaccttg 56160
tcgagccggt cattccggtc atctccaacc tcaccggtcg cctcgccgat cccgggcagc 56220
tgaccagcgc cgactactgg gtccggcacg tccgccaagc cgtccggttc cacgacggcc 56280
tacagaccct gcacgatcag ggcgtcacca cctacctgga aatcggccct gacgcccagc 56340
tcacggccat ggctcaggag gccctgagcc cccagtccca caccgtctcc accctgcgca 56400
ggaaccagcc cgaaaccacc agtctgctca ccacgctcgc gcgactccac accaccggta 56460
ccacccccga ctggatcacc tacctcaacc accgaccctc atccccgaca ccgctgccca 56520
cctacccctt ccaacaccac cgctactggc cgcgcggcga tgctcaggcc gccgatgtca 56580
gctccgccgg cctgtccggt gcgaaccatc cactgctggg agccgcggtc ccgctggccg 56640
acggcgacgg ccatctgttc accgggcggc tgtcggcacg gacgcaccgc tggctggccg 56700
accaccaggt cggcggcaac gtcgtactgc cgggcaccgc cttcgtggaa ctggcggtac 56760
gggctggtga ccaggtcggc tgcagccagg ttgaagaact gacgctggaa gcgccgctgg 56820
tgctgcccga gagcggcgcg gtccaggtac agctccggct gggccgggcg gacgagtccg 56880
gccgacgtga cctcaccgtc tacgggcgac tggcgggggg cggcgaggac ctgtggctcg 56940
aggaggagtg gacccggcac gccagcgggg tcctctccag cgcctcggcc cccgaacccg 57000
tcgcactgac cgtatggccg ccgtccgccg ccgaggccgt gccggtggag ggcttctaca 57060
ccggtctggc cgagagcggg tacggctacg gccccgcctt ccagggcctg cgggccgcct 57120
ggcgtcaggg cgacacggtc ttcgccgagg tccaactccc tgaggtggta cgggaggagg 57180
ccgcctccta caccatccac ccggctctcc tggatgccgc cctccaagcc gtcggtttcg 57240
tcacggacgg gagcgacaac cccgtggtac ggatgccgtt cgcctggtcc ggcgtgtcca 57300
tgtacgcgtc cggcgcctcc gagctgcggg tgcggctcgc ccggacagga ccggagacgg 57360
tcaccttcgc cgtcaccgac cccaccggcc gccccgtggc ctcggtcggc tcgctcgtca 57420
tgcgcccggt cgccaccgga gtaccgcgcc tgacacgcaa cgggctccac gaggtggtct 57480
gggagcaact cctcgatgcg ccggccaccc ccgcgaccga gtgcgccgtc atcggggacg 57540
cggacgcggc ggcgctgctg ggcgcggagg cgcacccgga cctggcgtcg ttgggggaag 57600
cggtgccccc gctggtggtg gccgtggccg gcggcgacgg tacacgggcg gcactggagc 57660
gcgcccttgg ctgggtgcag ggatggatgg cggaggagcg gttcgccggt tcccggctcg 57720
ccgtcgtcac ccgtggtgcg gtggcggtcg gtgcgggcga ggtgctggcg gacgctgcgg 57780
gtgccgccgt gaccggcctg gtgaagtcgg cggagtcgga gaacccgggc cgcttcctgc 57840
tggtggatgt ggacggcacc accgagtcct ggcgggcgct gccgactctc ggcggcggcg 57900
acgagccgca gatcgcgctc cgcgacgggc aggcgtacgt cccccgcctg gtgcgtgccg 57960
gtgaggacgg cggctcgctg ctgcccccgg ccggggcgga cgcctggcgc ctggagacag 58020
gcgaggccgg cagcctggac gggctccggc tcgcccctgc cgaggacgcg caggcggcgc 58080
tgctgccggg gcaggtgcgg atcgcggtcc gtgccgcagg cctcaacttc cgtgacgtcc 58140
tcggtgcgct cggcatgtac cccggcggac tcgacctcct cggcagcgag atcgccggcg 58200
aggtgctgga gaccggcgat ggggtgaccg gcctcgcggt gggcgaccgg gtcatgggcc 58260
tggtcgccgg cggcttcggt ccgatggccg tcgccgacag ctggcgggtc gtacggatac 58320
cgtccggctg gaccttcacc cgcgcggccg gtgttccggt cgccttcctc accgccctgt 58380
acggactgcg tgaactgggt gggctggcgg cgggccagcg ggtgcttgtg cacgcggccg 58440
ccggtggcgt gggtacggcg gcggtgcaac tcgcccggct attgggggct gaggtgtacg 58500
ccacggccag cgcccccaag caggagtatg tggcggatct gggcgtggac cgcgcccgta 58560
tcgcctcctc ccgcaccctg gacttcgctt ccagcttccc tgaggtcgac gtcgtgctga 58620
actccctggc cggggagtac gtggacgcct cgctggggtt gttgcgcgag ggcggccggt 58680
tcgtggagat gggcaagacc gatgttcggg atgctgccgc gtacgacggt gtgacgtacc 58740
ggacgttcga cctggggcag gccggtccgg agctgatcgc ccgaatgctg ggtgagttgg 58800
tggagtggtt cgaggccggg gaactcactc cggtccgcac agccgcctgg gatgtccggc 58860
gcgcggtggg cgcgttccgt tggatgagcc aggcccggca cacaggcaag atcgtcctga 58920
cggtgccgcg cgacctggac gccgacggca cggtcctgat caccggcggc accggcacgc 58980
tgggcggtct gctcgcccgg cacctggtca ccgaacacgg cgtacgacac ctgctgctgg 59040
tctcccgcac gggagaacgg gccgctctcc gtcgtgaact ggaggagctg ggcgccgagg 59100
tacggatcgc ggcctgcgac atggctgacc gcgcggcggt ggccgaactc ctcgacggca 59160
tcccgtcgga gcacccgctg accggtgtgt tccacgcggc gggtgtcctg gacgacggcg 59220
tggtcaccgg cctcgactcc gctcggctgg cacgggtgct ggctccgaag gtggacggcg 59280
ccctccacct gcacgaactg acggcggagc tggacctctc ggcgttcgtc ctgttctcct 59340
ctatgtcggg tctcctcggc gcctccggcc aggccgggta cgcggcggcg aacatgttcc 59400
tcgacgcgct cgcccagcag cggcgtgccc agggcctgcc cgcgctgtcg ctggcgtggg 59460
gtttgtggga gaccgcgagc gcgatgaccg cgcacctgag cgacaccgac ctgcgccgca 59520
tgggcgggat cggcatgctc gggctcaccc gcaacgaggg catggaactc ctcgacgcgg 59580
cctggcagag cggcgaggcg ctgctggtcc cggtccgctg ggaccaccgg gtgctgcggg 59640
agcgggcctc ctcgggcgcc cgggtgccct ccctgctgcg gaggctggtg cgggcgccga 59700
ggcgccgtac ggtgccggag agcgccaagg gcgcgggcgg cgggctgcgg gagcggctgg 59760
cgacgctgcc ggaggcggag cgccggggca tgctcatcga gctggtggcg gggcacgtgg 59820
ccgcggtgct gggccatgcg ggcaccgatg cggtgtcggt ggaccgcccg ttcaaggagc 59880
tcggcttcga ctcgctgacc tccgtggagt tccgcaaccg gctgaacgaa gcgaccgggc 59940
tgcggctgcc ttcgaccctg gtgttcgacc accccacacc taccacgctg gcggcccggc 60000
tcgacgccct gctgccgggg gcagagacgg cgacaacggt tgctgccccc acctcgccgc 60060
acgaggaact cgaccgactg gcaacggtgc tgctgtcacc cgcgttgaac atggcggatc 60120
gggacggcct cgccgcccgg ctccgagccc tggcttccca gcttggcgag ccgactggtc 60180
cggccgatgg cagcaccgtc gccgaccgga tccagtcggc caccgatgac gagctcttcg 60240
agttgctcga cgacaggttc gagaactcat gagccaacac gacgatgctt ctgacgcgct 60300
gaggacgggc gatgttccga tgacacagtt tccgacgaac gaggacaagc tccgcgacta 60360
tctgaagcgg gcggtcaccg acctgcacca cacccgtgag cagctggccg cggccgaggc 60420
caagaaccgg gaaccgctgg cgatcgtgtc gatgagctgt cgcttccctg gcggagtcag 60480
gtcgcccgaa gccttgtggc agctggtgcg tgccggtgaa gacgtgatct cgtcgtttcc 60540
caccgaccgt ggatgggacc tcgacggcct ctacaacccg gatccgggga acagtggcac 60600
cacctacgtg cgagagggcg ggttcctgtc cgacgcgacg gagttcgacc ccgccgtgtt 60660
cgggatctcc ccgcgtgagg cgctgggaat ggacccgcag cagcggctga tgctggagac 60720
ctcgtgggag gccttcgagc gggccggcat cggtccggca tcggcacgcg gcagccggac 60780
cggtgtgttc atcggcgcct ccgcccaggg ctacagcttg ctgttccaga actcgcggga 60840
ggaggccgag ggcctcctgg ccaccggtga ctcggccagc gtgatctccg gccgggtctc 60900
ctacaccttc ggcctcgaag gacctgcggt cacactcgac accgcgtgct cctcgtccct 60960
ggtcgctctt cacctggccg tgcgctcggt tcggcagggc gagtgctcca tggcgttggt 61020
gggcggcgtc tcggtgatgt gcacgccggc gatcttcatc gagttcagcc gccagcgagg 61080
tctcgcggcg gacggccggt gcaagccgtt cgccgcggcg gcggacggca ccagctgggg 61140
ggaaggcgcc ggagtcgtcc tcatcgagcg gctggaggac gcccgacgca acgggcaccc 61200
ggtgctggcc gtcatccgcg gcagtgccat caaccaggac ggtgccagca acggcctgac 61260
tgccccgcac gggccgtcgc agcggcggct gatccagcag gcgctggcgg acgcccagct 61320
gtcgcccggc cagatcgaca tggtcgaggc acacggcacc ggcacctcgc tgggggatcc 61380
gatcgaggcg caggcactgc tggaaacgta cggtgccaac cgccccgcgg accgcccgct 61440
ctggctcggt tccgtcaagt ccaacatcgg acacacccag gcggcggccg gtctcgcgtc 61500
cgtcatcaag accgtacagg cgctgcgaca cgcccacctg gccaggacac tgcacgtcga 61560
ccggccgacc ccgcgcgtgg actggtcgtc gggtggggtg gaactgctgg ccgacgacca 61620
gccgtggccc gagacggggc agccccgccg agccgccgtg tcctcgttcg gggtcagcgg 61680
caccaacgcg cacgtcgtcc tcgaacaggc gcccgcctcg gagaacccgc ccctccgccg 61740
tccgggaggg gaccgcgtcg cggcgcgccg ggtactcccg ctggtgatct ccggcaagac 61800
gccggaagcc ctgcgggctc aggcggggaa cctggtgtcc catgtgcgcg agcacccgga 61860
cctccggctg gaggacctcg ggtactcgct ggccaccacc aggtcggccc tcggacaccg 61920
ggccgtcgtc gtggcggaca cccccgacgg attcctccgt ggctgcgagg cggtggagcg 61980
cggcgagacc ccggcgtcgg tggaccgggg cgtggtccgg gggcgcggca cgaccgcgtt 62040
cctgttcacg gggcagggcg cccagcgggt cggcatgggc cggcagctct acgcggcgat 62100
ccccgcgttc gcgcggttcc tcgacgaggc ctgctcccat ctcgaccgct ttacgaagca 62160
gcccctgagg gacgtgctgt tcgctgccga gggcagcgcc gaggcagcgc tcctggaccg 62220
taccggattc gcccagccgg ccctgttcgc cctggaggtg gcgctgttcc gcaccctgga 62280
gtcctggggt gtgaccccgg actacctcgc cggacactcc atcggtgagc tcgctgccgc 62340
ccatgtggcc ggtgtgctct cgctgggaga cgccacccgg ctggtgaccg cgcgtggcaa 62400
cctcatggaa cagctccccg cggggggcgg catgctcgcc ctgcaagctt ccgaagccgg 62460
ggtgctcccg ctcctcgacg gcgccgatgg cctggtgtcc gtcgccgccg tcaacagccc 62520
ccgctccacc gtggttgccg gagacagcga cgccctcgcc gccctcgccg gccaggcccg 62580
ctctcagggc atcaaggccc gccacctcac tgtcagccac gccttccact ccccgctgat 62640
ggaccccgtc ctcgacgcct accgcgagac cgccgagcag ctctcctacc acccgccgcg 62700
tatcccgatc atctcgaccg tcaccggccg gtccgtcacc accgagatgt ccgaacccgg 62760
ctactgggtc cggcacgccc gcgaggccgt ccggttcacc gatgccgtgg ccacgctccg 62820
gcagcacggc accaccgcct acctggaact cggccccgac gccgtcctca ctgccatgac 62880
ccgcgaacac ctggcgggcg acggcacctc gggcaaggag tccaccttcg cggcggtgat 62940
gcgcaggaac cggccggagc cggaggtcct gaccagcgcc gtgtcccagc tgttcgcccg 63000
gggcacccgc gtcgactggc gggccgtgtt cgcggatgtg gatgggcagg tcgtccagct 63060
gccgacctac gccttccagc gcagccggta ctggccgcag gcatcactga cccggccggc 63120
cgggggcgcc tccgcgacgt cgctgttcca cctgcgctgg gtgccggtga cggcccagga 63180
cacggcgccg gcggacgact gggcgttgct cggcggggcc gacgcgctgc ccggccaggg 63240
cttcgccgac ctggcgtccc tgggggagac gatcgacggc ggatcggccg caccccgcac 63300
ggtgtgtgtg ccgttgctgc ctccggccga cggcgcccag gattccgccg ccacgcacga 63360
cgccgcccac cgggcgctgg cgctggctca ggcttggctc gccgacgatc gcttcacctc 63420
ctcccggctg gtgttcctca cccgtggtgc ggtggccgtg accgacgagg aataccccga 63480
ggactccgtc gacgccttcg catacgcctc cgtgtggggt ctgctgcgtt cggcccagac 63540
ggagaacccg ggccggttcg gcctggtgga cctcgacccc gacgccgacc cggacgcggc 63600
cgggcagcgg tgcccggtcc cggccgccgc cctggacggc gacgaaccgc agctggcgat 63660
gcgccgaggc gtggtccacg ctccccggct cacccgggtc acggccgcgc ccaaggaccc 63720
ggaccgggca cccgccgggt tcgaccacgg cggaaccgtg ctgatcacgg gcgccaccgg 63780
tggactcgga ccgctgctgg cccgccatct ggtcgtcgag cacggcgtac gccacctgct 63840
gctgacgagc cgtcgcggcg cggcggcgag cggcgcccag gcactgctgg acgagctcgc 63900
cgacctgggt gccgaggcca ccgtggtctc ctgcgacctg gctgaccggg aggcggtggc 63960
cggcctgctg gcccaggtgc cgcccgcgcg tccgctgacc gcggtggtgc acgccgcggg 64020
cgtcctggac gacggcgtga tcccgtccct gagcccggaa cgcgtcgacg gggtactgcg 64080
gccgaaggcg gacggggccc tgcacctgca tgagctgacc aaggatctgg acctggccca 64140
cttcatcctg ttctcctcga ccgccggtgt cctcggcagt gccggccagg gcaactacgc 64200
ggccgcgaac acgttcctgg acgcgctggc ccagcaccgg cgggcagcag ggctggccgc 64260
tgtctcgctc gcctggggaa cgtgggaacc gagcggcggc atgaccggcg ggctgacgcg 64320
cgcagacctg gagcgcatga cgaagggagg catgccaccg ttgtcccccc gggacgggct 64380
ggcgctcttc gatgccgcca tcgcttcggg gcgggccctg gtggtgccgg ccgtgctcga 64440
tctcgacctg ctgcgttccc ggatcgggac gaacgtaccg gcgctgctgc gcggcctcat 64500
cgagccccgg cccgtggagc cgtctgcccc aggggaggca gccgaggcac tcgccctgcg 64560
gatggcctcc tgctccgccg cggagcgcac gggcgtactc ctggacctgg tccgcgccga 64620
cgcggccacg gtgctgggac atgacggtcc gcacgccatc gacccggagc gtggactgct 64680
cgaagcgggc ttcgactccc tgacgacgct ggagctgcgc aaccggctgg ccgaggccac 64740
cggactggcc gtcccggccg gttacctcta cgagtacccc accccgaacc tgcttgccga 64800
acacctggcg gccgcgttgg ccgagtcgcc gcagtccggc gcggcgaccg gagccgacgg 64860
accggccgag ccgctgagcg tgctcttcca gcaggcgtat gacctcggca aggtcaccga 64920
gggcatgacc ctgctcagga gcgcgtccgc gctccgcccg acctacgaca ccccttcgga 64980
cctcagtgaa ctgccgcagc ccactcgcct ggcccgtggc cccgaacgtg ccacgctgct 65040
gtgcttctcc gccatcgtgg cactcgcggg ctcgcaccag tactcgcgct tcgcctcgtc 65100
cttccgcgag gaacgggacg tctcggtcct ctacgcgccg gggttcttcg ccggggagct 65160
cctgccgacc agcctcgaaa cggtcatcga cacccaggtg gaaaccgtgc ggcagcaggc 65220
cgcggacggt ccggtggtgc tcgtcggcgc gtcttccggc ggctggctcg cccatgccgc 65280
cgccgcccgg ctggaggcgc tgggaacacc accggcagcc gtggtcctgc tggacaccta 65340
cctgccggac gaccagttcc tcgcccgtga ccaggaccgt ttcatcggcg gagtcttcga 65400
ccggcaggac cggttctcca tccgggagga cgtcagcctg tccgcgatgg gctggtatct 65460
gcacctgttc gacggctgga agcccaccgc gatctccgtc ccggaactgc tggtccgggc 65520
gagtgagccg ctgcccagcc cttccggccg cccgccgagg gccgccgact ggcggacctc 65580
atggcatgtg gcacagcaca gcgtcgaggt gcccggcgat cacttcacga tgctggagga 65640
attcaacgac gccacggccg acgccgtccg acgctggctt ctcgacattg actgaaaggc 65700
ctgtccatgg atctggaaac ccaacttctc tccccggcat acctacggaa cccgcacccg 65760
ctcaacgccg cattgcgttc cgccgaccct gttcaacgtg ccgtggcttc ggggggcctg 65820
tccgtctggg tggtgacccg ctacgaggac gtgcgcgcgc tgctcgccga ttccaggctg 65880
ggcaaaggcg tcacgcagct ccgcgaggcg gtactgctca acgcgggtga cgacgagcgg 65940
atcagccagt tcaccgactc cctcaccgag cacatgctca acagcgaccc acccgaccac 66000
acccggctgc gccgcctggt cggcaaggcg ttcaccgccg gccgcataga acagcttcgc 66060
cccaggatca cggagatcgt cgacaatcta ctggaccggc tgagtcccgg tcaggaggtc 66120
gacctcgtcc ctgtcttcgc cctgcccatg ccgaccactg tgatctgcga actgctcggc 66180
gtgccgtccg tcgaccggtc gtcgttcagc cactggtcca atgtgctggt gtcgaccgcg 66240
gaagtcggcg aactggccga ggccggcgga gcgatggtcg cctatctggc acagctcatc 66300
gcggacaaac gcgccaaccc ctgtgacgac ctgctcacca agctggtgca agccaccgac 66360
aacggcgacc agctctccga gacggaactc gtggcgacgg ccttcctgct gctgtccgcc 66420
gggcacgaga ccacggtgaa cctcattgcc gccggtacgc tcactctgct ccagaacccg 66480
gaccagctcg cccggttgcg ctccgacctc acgctgctgc ccggcgcgat cgaggagctc 66540
atacggtacg acgggcccgg cggcatggtg ctccggcaca ccctggagcc ggtcgaggtc 66600
ggcggtgtga ccatcccggc ccagcaggtc gtcctgctct cgctgtcctc ggcgggccgc 66660
gactccaccc ggttcagcga cgccgaccgg ctcgacatcg gccgtcccat cgggggcagc 66720
gtggggttcg ggcacggtat ccaccactgc atcggcgccc cgctcgccag gctggagggc 66780
gagatcgcgt tccgggccct gctcacccgc ttccccgacc tgcggctcgc ggtcccgccg 66840
gaggagctga actggcgcga cagtgtcttc atccgcggcc cggaatcgct gcccgtggtg 66900
ctgtgacgcg catggggaga ggggaccgac ccgtcagtgt cggtcccctc tccccatacc 66960
cggcggctac gccgacatga ggatccgacg ggtgctttcg actacctcgg cgatctgccg 67020
atgcccgaag cagctgggcg aatacgggac ttccagggcc agccggccct ccacggtgat 67080
cgccgacacc accagcggcc cccgcccctg ctccggcgac cagttctccg gtaccgggat 67140
ccaccgcaaa ccgcccagct cgagcccggg gggtgccacc aggtccgcga cacggcccag 67200
gttggtgagc acgagactgg ccgccagcag agcgggattc tcaaagaagt ggcgcaccgc 67260
gaggatctcg cgttcgggat cgccccgctc gacacccgcg cgaagccggt cgtagaccag 67320
ccggccgagc gtgcgcacat ccgcccgcgg ggagacttcg acaatgtcgt agaacgacgc 67380
ggcggccagc accagggtct cctctgccag cggtggagtg acccggtgcc ggaagtcgac 67440
gggggacgcc aaggccagcg aaaggggtgc gtcggtcgct tcgagggcgc ggcgcaccgc 67500
gatgagcagt gccgccgcca ccaggccctg taccgagatc ccggcggccc gggcggatcc 67560
ggcgagccgc gtcgtctcgt cggaagtgag ccggagggtc cttacgtgta tctcgccctg 67620
ctccggcgct tccacgcccg ggtcccccag atagggcagc agcacggggg gaaggcgctt 67680
cgcctgctcg gcccggcggg ccgcgtaggc gaggacatcc gcctccgggt gatggccgag 67740
acgggtctcg atgggcgccg ggtagctgtc ggccacgtgt gccgaggacg ccatcggccc 67800
ttcgcccagc gcggcgtacg tccgccacac cgccgacagc aaggcgacca cgctgcggcc 67860
gtcgcagatc cggtgatcga catggagtat gaaggtgtcc tccgccgcgc cgcgcagcag 67920
ggtggcgcgg accagcgggc cgcagcggtc cagccggctc cgcatctccc ggtcgaggtc 67980
ccaggagccg gcccggcgga cgacgagttc gggcggcccg tcgtccagcg ggtgcagcac 68040
caactcggta ccgtccggcg atatccggct ccgcaaggag gggtgcgcgg ccacggacga 68100
ggcgaaggcc cgttggagaa gctgttcgtt ggtatcgccc cgtaccgtgc acagcgccat 68160
gattctcgtg agacctggcc cggagagcat gagctctccc gtggacagct cacgtcgggt 68220
attcggttgc atgtttgctt gcgcctttcc gttgcccggg gccgagctac tggggcgagc 68280
cgacgatgga ttcccgttcc cgggaggtga gagggggccc ggtgagcggc ggccgggtag 68340
ggccgagaag ggtctcgaag acgatccggg gcgtcatcag ccgggtcagc ggggccgaca 68400
gggtgaacgt gtccgacacc gcggcggcca cccgggggcg gtcggctgcg gtcttggtca 68460
cccggttgac atagcgccgc tgcatccgcg cggccagccc cggccgccgg ccactcacat 68520
tcgggtagaa gatgtcctgt cctgtggcca tcgcccacgc attgttgacg gcgcccgcga 68580
cggcggcctg tgtggcgcgg ctcgtcccgg ccaccaaccc gtcgctccgc aggacgtcgc 68640
gcagcgccga agcgctcatg gcggccaccg acatgccgtg cccgtacacc gggttcaggg 68700
cggccgcggc gtcgccgagc accacgaagc ccttcggcca gtcggccagt tcctcgtagt 68760
agcggcggcg gttgaccgtg gtgcgactgc tgtggatcgg cccgatcggc tcggcgttcg 68820
cgatgaggtc cccgatcacc gaatgccgca gtctccgggc gaacgccacg aagccttccg 68880
gatcacgcgg cggctcgcac ccacgggtcc cggtcagcgt gacgatccac tgtccgtcct 68940
cgatcggcag cagcaccgcg ccctggcccg gctggtcgtc ctccgggtcc ggcagcacgt 69000
tcacgatggg aaagccgctc tccgccccgg ccggcgcgcg gtaccggcgg gtggcgtagg 69060
agagcccgat gtcgatcttc acctcgcgca cggcgggcag accgagcgcc tggagccagg 69120
tgttcgcgcc ggatccacgg ccggtggcgt ccaccacgaa gtccgcgtcc agccggagcg 69180
attccccgga cgcccggtcc tgggcctgga ccccggtcac ccgggtggca tcgccgtcga 69240
gcccctggac gtcaacaccg ctccgcaggg tgatgcggtc gtcttccagg acgaggcgcc 69300
gcagcgtcca gtccagcagc ggacgaccac aggtgaccat gaactgggcg ccgggcatcc 69360
ttcgggccca cccctgccgt gagcaggaga cgagcccgct gggtacctcg gtccggtgcg 69420
caccggcggc cagcaggcgg tggaggctcc cgggcaccag cgagtcgatg gtccgtgcgc 69480
cgttcgacat caggatgtgc gagtggaggg tctgtggggt gccctttctg acttccgggc 69540
cgtccggtac ctggtcccgg tccagcatca ctacctcgtc cacgaacttc gcgagcacgg 69600
atgccgtaag ggcaccagcc agaccgctgc cgagaactat tgcgcgattc accatatcca 69660
tcgtcctttc aacgtcgcag aacacgtaat taatacgccg aattcaagcc gtgatttctc 69720
cgacttagtg cgacggggat cgcgcctcaa tactcctggg ccccctcggt ctccccgtgc 69780
gtgcagagtg gatgggttta tatccgttgc cgttcgatga ggtcggcaag gaaaacaatg 69840
tggtttgcgc gacgctaccg gtgtttccct ctccggggtg atcgccttcg tcgtgccgtt 69900
gattggaggt tcccctgaag attcttttcg gtaatcgcta tggcgccgcg caggcctgcg 69960
gccggcatgg tcatgccgcc ggggcggccg tgcacccagg tcctgtccgg gtctcctcat 70020
gccgtctggg gcagggccag ctggagctcg agaggcaact cctcccggcg ggtgatgtcg 70080
agcttgcggt acacgcgggt caggtgctgc tccaccgtgc tcatcgtgat gaacaacttg 70140
gccgagattt cacggttggt cagacccttg gccgccagtg cggcaactcg gcgctcggac 70200
tcgctcagat tggcgccgac gtccgctccg cggaattcga gcgccgagga catgccaccc 70260
tcgggggagg gacgatggct ggagccgatc ggctcggacg ggacctccgc actgcaatcg 70320
cctgcgatct gccgcgccat atggcggatg gcgtcggcac gcctgcccac gcccagttcc 70380
tcgtaggtgg acgccaggtc agcgaggacc ttggccagtt gcagccggtc cccggtctcc 70440
tgtaaccgct cggcagcctg gatgagcagt cgtgtccgtt cgcccggctc ggcgaacatc 70500
gcgcggacgc gcagcactgc accgtccgtc gccgcgccta tgccggccgt cgcgctgtcg 70560
tactcggcca gcatccgttc cgcctgctcc cgatcgttga gccggagcca ggcatgggcg 70620
gagtccacct gccagggcag ttctgccgac ggagccagac cccagcgctc cgcgagccgg 70680
ccgatgctga ggaagtcgga gagcgcgagg tggggccggt tgacggccag ggcgtagtgg 70740
ccgcgggcac ggagatacgg gagcccgtag acactccgga acagcgcctc gggaaccggg 70800
cggtccagca gatgagcgac gtccttgtaa cgtcccatct cggtgtagac agtcatcagg 70860
acggtcagcg ggccgccgtg cagccaggtg ctggacggtt cggcgaggcc gtccagggac 70920
atccatgcga acgtctcggc ctcggtcagc ttgccctgtc tcagcgcgat atcggctcgc 70980
acggcggcga acagccgttg ccagcccggg ataccccgca cggtcgcgtt cttcaggaaa 71040
acgtcgcacc acgtagccgc cagatccagc cggccgaccc gcgtgagcga gttcagctcg 71100
gtgaggatga ggctgagcgt catgtcggac agcggcgtgg tccgcagcag tttctccgag 71160
tcctggatat ccccgggctt gcgtcccagc tccttgatcc aagtggccag cgcccccagc 71220
gcgtcgctgc gggaggtgcc atcggcgcag tcctttccgg acagaccgtc cgccagagcg 71280
cgggatccgg cacaccaggc cgccggcatg ccggtcatcg gggggaagaa ccacagccac 71340
gtgttgccga cgaccgtcag gtccgttgta ctgcgaagac cgcgcagggt gggccgtacc 71400
tcccgcagca gttctcccgc ttcctccacg cggcccaggc tgaccagcag ttggatcagc 71460
agaacggcat cgacggggca gagctcgggt cccggtgccc gctccccgca gtagccgtcg 71520
agatggtggc gttcgacgga acaggggtcg acgcgccacc tgacgagtgc ccgcttcagg 71580
cggatgtggc cccgctccca ggagtcggtg gaggcgtcat gggccagttc gaggtacgcg 71640
ccggcctgtt cggcgtcgtc cgagtccaac gcctcctcgg cggcgtgccg cagggctccc 71700
acatgccagg gttccgtcgc cgagcccgct tcgagcaggt ggcgggcgat cgtacggctg 71760
ccgacgccgt gccgactcag cagttccgcg gcccggtggc gcagttcggc gcgctgcttg 71820
gggccgatga tgttcagggt cgcgcgctcg accaaggggt gctggaaacg gtagccgtcg 71880
accagtccgg ccgaggccaa cgcaaggata ccgcgcgcga tctcggcggc gttcagcccg 71940
agcagctcct ccaacagttc cggcctggag tcctcgccca ggaccgcgat gccggtggcg 72000
agggacacca ccgcggggtc gttgccctgc acgcagttga ccgcggcctg cgcgaagagg 72060
ccgtcggcgg caggccacgg ggcggtttgg cctgcggcgt tgcggacccg gtgttcttcc 72120
aacagcgccc gcacgagcag ggggttgccg ccgctcagcc ggaacacgtc gtccaggaag 72180
gtgtcctccg ccggccggcc ctccagggcg ccgaccaggt cgacgacatg gtcccgggtc 72240
attgggcgca gcgcgatccg gtggagattg ggctgccgca ggagctcgca gtggaactcc 72300
ggcccgagtg atgtgcggag tgcctgtacg acgatcagca tcagcctgct ggaccggagc 72360
ctggcccgtg tggcctccag cagccagcgc cagctcaggc tgtcgagatc ctgtaggtcg 72420
tcgaggcaga cgaccaccgg tgaccggtcg gccagggcct cgagtcggcc gcagaactcc 72480
acgaactcgg cggtttgtgc cgaactcatc gagctcatcc tgggaacatt gtcgaatcca 72540
aggtcgcggg cgttcaccac gaccgctccg gaggccttca catgctcgcc gaaatttacc 72600
agtaattcgc ttttcccgca gtaggcaccg ccctccaata ccacggtcac agccttgccg 72660
atctcgcatt cgacaagcaa ggatttcagt agatcaagtt ccgagtcccg cccgaagaga 72720
tgcatccgaa ttgaatcccc aatctccacc acgaaatgag tgccacgatc gactccggtt 72780
gcaaatcggg ccggccggcg ggttggttgc catacggttc gcctcgctcg tggccgaatc 72840
taagcgctgt cacgcggcga ttggggcact acaccgggca agtaagcggc aactcaggca 72900
ggtgacgtgc cgcccggctc gactggacgc ccgggttgca gaacacccgc cgaatgtggc 72960
cggaggactc gcttttccag aagacgccct ggtgtcggcc gagcccgcgg ttgagcgctt 73020
ccggccactt ctggccggcg cccgaatcgt cacgaccgaa accggtccgc accaggatcc 73080
atccgagacc caggcgcgct gcacgatcgg gcggagtgaa cgtctccgtc gactccaacc 73140
gcccgccgca ccgttcaagg caccgagtcc gtggggtcgg tcagccggtt gatcagcacc 73200
tcccgcacaa agggggacgt cacgcggacg gctcggttac tcctgctcgg ccgtcaggac 73260
ggacaggcag tgccggagtt ccccggcctc cgacggccgc catgggattc gacgacaagg 73320
agcgcccatc cccgcctcgc gggccgacgg tgacccggga ccagatctgg ctggagatca 73380
tccagagcgc actcgaccgt gcaccggctc ctacggcgcg gcgctgacac gctacgtgca 73440
caccgaaggc gtcacggtca tcgaggtcaa ccagccggac taggccaccc gccgccgacg 73500
cggcaagacc gacgctcgac gcggcgccgc cgcccaagcg gtgctgtccg gccgcgccac 73560
cgccaacgcc aagaccggcg gcagagacaa ccctgaacgg atggtcagcg aggcatcctt 73620
cgccgcactc ggcggcgtca gcccggtgga gtcatcctca gccaggaccc aacgccgcag 73680
gttcaaccgc ggcggcgacc gccaagccaa cggtgcgacg tcacatgtcg ggaacacccc 73740
gccgtcagcc acgtactggc ggagggtcag gggccgaagg cactggttct ggctcccgga 73800
aacgatgtga gcgtgccccg ggtcaggttc tggatccggg cacctgcgtt gtcacctgcg 73860
ggagttgtcg ggcactccca tcgcggcgaa caacgcgtcc gccgcaccac gtacatccga 73920
tgctcgcatc gcgccgagag cctgagcggc ctgggccata cacgccacgc actcgactgg 73980
gtgagctgca aggcgcgctc cgcgtcgtcc gtggcctccg tcggacggcc gagacggtga 74040
aggacgtcga ccgaacgtcg cgagggccag cgcgacgttg ccccggatcc cgcgtctcgt 74100
cgcacaactg ccgggccgta acccgctctt ggaccaccgc atggtagcgc cttgccgggc 74160
tccaggggag gagtggtcgg cacgcgctct tggattgccc cgcgatgctg attctggtgc 74220
ctcgacccaa ccttcgagcg gatccaggac gttgaacctc agctgctcct tcgtgtggtc 74280
cgctgtcaag cccctctgca cgtgacgtgc atgaaatctt ccgatgcagg gtgcgtttga 74340
ac 丂 74342
<210>2
<211>3793
<212>DNA
<213>链霉菌属
<220>
<221>CDS
<222>(1322)..(2548)
<220>
<221>CDS
<222>(2564)..(2761)
<400>2
ctgcagctcg acgtgcgggt cggacttcac gttgaagtac cagaccggat gcttgggcgc 60
accgcccagc gaggcgaccg ccgcgtaact cccctcgtgc tcgacccgca tcagcggcgt 120
cttgcggatc tttccgctgc gcgcgccccg ggtggtgagc acgatgaccg gcagcccggt 180
gtcccgcagc gtggtgccct tggtgccccc ggaactctcg tacagctcga cctgctcgcg 240
cacccactgc gtcgggctgg gctcgtactc gccctcaagt ggcaagggat ccgtctcctt 300
cgtcggtccg gcggatggtg ctccggacgg tcccaactcc cgcggccgcc cggatcatcc 360
gtaccgcatg ccccttcgcc cgagcgggtg atcaccgttc cggccatccg gtcgtccgca 420
ccgcgagcac caggatcacg gcgctggaga gcagggccgt gaccagccgc ccccggtggc 480
ccgtcagggc gcgacccagc agcgcgcccc cgcccgccag cagtagctgc cagctcgcgg 540
acgcggcgaa ggccgccgcg gcgaacaccg cccgtttcag cggccgtgcc gcaccggcgg 600
cgccgctgcc gagcaccagc gccacgaagt agaccaccgt catgggattg agcagggtga 660
tcccgagaag gccgagataa gcccctgccg cgcctggaac cggccgttcc gggcgggtgg 720
tgagccgatg ggcgcggtac tgccgcaggg cgagcagcgc cgcccgcagc gcgagcaccg 780
cgaggaccag cgccgaggcc cagcgcagcg ggtccagcac cggccgcagc tgtgccgcga 840
gggcggcgcc gcccacggtc gcgagcagcg cgtacagccc gtcggccgtg gcgacgccga 900
gcgccgccga ggcgccggtg cgcagcgagg tgcgggcggt gagggagacc agataggtcc 960
cgaccgcgcc gacgggcacc gcgatgccgt acccggcgag caggcccgcg agcagcgcgc 1020
ccgtcacggg cgtgcgggac tggttcctcc ggggacggcg gggctgctgt cggcccggca 1080
ccgcgggggc ggtggcagcg ggcgtcggca ggagggaggc tgtaggaggc atgggccgat 1140
cctggggccg ccgcgcccgc accggcaaat gaattacggc gcgttccagc ccccggccgg 1200
ctcgctcttc ggccacttca ccgcgtacgg cgatctggcc gaacttgctg tcgccccata 1260
ggtgcctcgg gcatctaatg aagatcggca cgacgcacct cttcgtctgc gaggtctttc 1320
c atg acg gaa ctg acg gac atc acc ggc ccg ggg acc ccg gcc gaa 1366
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Gly Thr Pro Ala Glu
1 5 10 15
ccc gtc gca ttc ccc cag gac cgc acc tgc ccc tac cac ccc ccc acc 1414
Pro Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr
20 25 30
gga tac ggc ccg ctg cgc gac ggg cgc agc ctg tcc cgc gtc acc ctc 1462
Gly Tyr Gly Pro Leu Arg Asp Gly Arg Ser Leu Ser Arg Val Thr Leu
35 40 45
ttc gac ggc cgt gag gtc tgg atg gtc acg ggc cac gcc acc gcc cgc 1510
Phe Asp Gly Arg Glu Val Trp Met Val Thr Gly His Ala Thr Ala Arg
50 55 60
gcg ctg ctc gcg gac ccc cgg ctg tcc acc gac cgc acc ctc ccg ggc 1558
Ala Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Thr Leu Pro Gly
65 70 75
ttc ccc gtg tcc acg gcc cgc ttc gcg gcc gtc cgc gac cgg cgg gtg 1606
Phe Pro Val Ser Thr Ala Arg Phe Ala Ala Val Arg Asp Arg Arg Val
80 85 90 95
gcg ctg ctc ggc gtg gac gac ccg gtc cac cag acc cag cgg cgg atg 1654
Ala Leu Leu Gly Val Asp Asp Pro Val His Gln Thr Gln Arg Arg Met
100 105 110
atg atc ccg tcg ttc acc ctc aag cgc gcg gcc ggg ctg cgg ccc acc 1702
Met Ile Pro Ser Phe Thr Leu Lys Arg Ala Ala Gly Leu Arg Pro Thr
115 120 125
atc cag cgg acc gtc gac ggg ctg ctg gac gcg atg atc gag aag ggg 1750
Ile Gln Arg Thr Val Asp Gly Leu Leu Asp Ala Met Ile Glu Lys Gly
130 135 140
ccg ccg gcc gag ctg gtc tcc gcc ttc gcc ctg ccc gtg ccc tcg atg 1798
Pro Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met
145 150 155
gtc atc tgc ggc ctg ctc ggc gtg ccg tac gcc gac cac gag ttc ttc 1846
Val Ile Cys Gly Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe
160 165 170 175
gag gaa cag tcc cgc acg ctg ctg cgc ggt ccc acg gcc gcc gac tcg 1894
Glu Glu Gln Ser Arg Thr Leu Leu Arg Gly Pro Thr Ala Ala Asp Ser
180 185 190
caa ggg gcg cgc gag cgg ctc gag gag tac ctc ggc ggg ctg atc gac 1942
Gln Gly Ala Arg Glu Arg Leu Glu Glu Tyr Leu Gly Gly Leu Ile Asp
195 200 205
gac aag gag cgg cag gcc gaa ccc ggc gac ggc gtc ctg gac gac ctc 1990
Asp Lys Glu Arg Gln Ala Glu Pro Gly Asp Gly Val Leu Asp Asp Leu
210 215 220
gtc cac cag cgg ctg cgc acc ggc gag ctg gac cga cgc gac gtg gtg 2038
Val His Gln Arg Leu Arg Thr Gly Glu Leu Asp Arg Arg Asp Val Val
225 230 235
gcg ctg gcc gtc atc ctg ctc gtg gcc ggg cac gag acg acc gcc aac 2086
Ala Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn
240 245 250 255
atg atc tcc ctc ggc acc tac acg ctg ctg cgg cac ccc ggc cgg ctg 2134
Met Ile Ser Leu Gly Thr Tyr Thr Leu Leu Arg His Pro Gly Arg Leu
260 265 270
gcc gag ctg cgc gcc gac ccg gcg ctg ctg ccc gcc gcc gtg gag gag 2182
Ala Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Ala Val Glu Glu
275 280 285
ctg atg cgg atg ctc tcg atc gcg gac ggg ctg ctg cgc ctg gcc ctg 2230
Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu Arg Leu Ala Leu
290 295 300
gag gac atc gag atc gcc ggc gcc acg atc cgg gcc ggc gag ggc gtc 2278
Glu Asp Ile Glu Ile Ala Gly Ala Thr Ile Arg Ala Gly Glu Gly Val
305 310 315
ctg ttc tcc acc tcg ctg atc aac cgc gac gag tcc gtg ttc gac gac 2326
Leu Phe Ser Thr Ser Leu Ile Asn Arg Asp Glu Ser Val Phe Asp Asp
320 325 330 335
ccc gac acc ctg gac ttc cac cgc tcc acc cgc cac cac gtg gcc ttc 2374
Pro Asp Thr Leu Asp Phe His Arg Ser Thr Arg His His Val Ala Phe
340 345 350
ggt ttc ggc atc cac cag tgc ctg ggc cag aac cta gcc cgc gcc gag 2422
Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu
355 360 365
ctg gag atc gcc ctg ggc acg ctc ctg gag cgg ctc ccc ggc ctc cgg 2470
Leu Glu Ile Ala Leu Gly Thr Leu Leu Glu Arg Leu Pro Gly Leu Arg
370 375 380
ctg gcc gcg ccc gcc gag gag atc ccg ttc aaa ccc ggc gac acg atc 2518
Leu Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile
385 390 395
cag ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggctctgg tc atg cac 2569
Gln Gly Met Leu Glu Leu Pro Val Thr Trp Met His
400 405 410
atc gac atc gac aag gac cgc tgc atc ggc gcc ggc cag tgc gcg ctg 2617
Ile Asp Ile Asp Lys Asp Arg Cys Ile Gly Ala Gly Gln Cys Ala Leu
415 420 425
gcc gcc ccg ggc gtg ttc acc cag gac gac gac ggc tac agc acc ctg 2665
Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser Thr Leu
430 435 440
ctc ccc ggc cgc gag gac ggc ggg ggc gac ccg atg gtc cgg gag gcg 2713
Leu Pro Gly Arg Glu Asp Gly Gly Gly Asp Pro Met Val Arg Glu Ala
445 450 455
gcc cgc gcc tgc ccg gtg agc gcc atc cgg gtg acc gaa ccg gcc ggc 2761
Ala Arg Ala Cys Pro Val Ser Ala Ile Arg Val Thr Glu Pro Ala Gly
460 465 470 475
tga ggcggggccc ggcggccgcg gcccgctgcc gggaccgccg ttcccagttc agtagg 2820
gtcgtgcgat gacctcacag gccgggaagc ccttcctcta cgtcgtcgtc tgcgcggccg 2880
ggaccgccgc cggagtcacc acgctgatcg gcgccgccca ggcgcggggc tgggaggtgg 2940
gggtcctggc cacgccggtg gcgatgggcg ggttcttcga cacggctgcg gtcgaggaga 3000
tgacgggccg gcccatccgc tcggcctggc gctcgccggc cgatccgcgc ccgttcccgc 3060
cgccgggcgc cgtggtggtg gcgcccgcca ccttcaacac cgtcaacaag tgggcggccg 3120
gtctcgccga cacgctcgcc gtcggcacgc tctgcgaggc ggcgggcctc ggcgtgccga 3180
tcgccgtcct gccctgcgtg gcggacgcgc tggccgccca ccccgcgtac cgggagggcc 3240
ttctccggct gcgtgggatg ggcgtccgct tcggcgagcc gtacgccggc ccgccggggg 3300
aggacggcga ggcggacggc gcacggcccg ggttcgcctg ggagaacgcc ctggacctgc 3360
tggagcgggc ctgaacccgc tccccgaccc gtagggcctg tctgacactg tcagacaggc 3420
cctaacggca ggtcagcgcc ggcccggcca gcatgccgcc ggtgtagagg tcctggcccc 3480
gcggcagcca gtagcccagc ctggagacca ccgtggagca gtcaggcccg acggtgacgc 3540
ggaccttcac cgtctcggga cggccgggct gcagcgcggt cagcgcgcag tccagggagt 3600
acgcgagccg ggtcttcgag gtaccggccg accagcgggt tgacgcagcg ggcgtcgtcc 3660
gtggcgatcc gcaccccggt gcccgccccg ccgatgagtc cgagccgggc gctgccgtcg 3720
ccctcgtcgc tgtcccggcg gaccgtgtag gtcagcgtgg tggtggcgtc gcgccgcagg 3780
gtgtccggtc gac 3793
<210>3
<211>2329
<212>DNA
<213>链霉菌属
<220>
<221>CDS
<222>(420)..(1604)
<220>
<221>CDS
<222>(1643)..(1834)
<400>3
ggatccacgg gtggccgccg cgctcgcccg ggtgaccgac cggcgtatcg gctatgtcgc 60
cgcgctcttc gcggcgctgg gcttccccga gggcgaggcg cgggaccgcg gcctgctggc 120
gtacaccgcc tacctcggcc acacccagct cggacatgcc gtccgacaga gcctgccggc 180
cgaggcggca cacgaccgct atctggatgg cgtgatcgac accctcgtac ggccgcggga 240
cggaggcgat gaagccgaac atgtcacaat ctgaacgagg ttggcggaac tgcgcgcaga 300
acatgcccgg tatccgcggc atgaggtgag atcggcgcgg cgaaacacgg tgcgccacag 360
cgttgccatc tcacacacga gcaactcgag ccacttgaga ctcgtacggg aggaaattc 419
gtg acc gaa gcc atc ccc tac ttt cag aac cgc acc tgt ccc tac cac 467
Val Thr Glu Ala Ile Pro Tyr Phe Gln Asn Arg Thr Cys Pro Tyr His
1 5 10 15
ccg ccc gcc gcc tat cag cca ctg cgc ggg gcc ggc ccg ctg agc cat 515
Pro Pro Ala Ala Tyr Gln Pro Leu Arg Gly Ala Gly Pro Leu Ser His
20 25 30
gtc acg ttc tac gac ggc cgg aag gtg tgg gcg gtc acc ggc cac ccc 563
Val Thr Phe Tyr Asp Gly Arg Lys Val Trp Ala Val Thr Gly His Pro
35 40 45
gag gca cgg gcg ctg ctg acc gac cag cga ctc tcc gcc gac cgg cag 611
Glu Ala Arg Ala Leu Leu Thr Asp Gln Arg Leu Ser Ala Asp Arg Gln
50 55 60
aac ccg gcc ttc ccg gtc ccc ttc gaa cgc ttc gcg gcc atc cgc cgg 659
Asn Pro Ala Phe Pro Val Pro Phe Glu Arg Phe Ala Ala Ile Arg Arg
65 70 75 80
gtc cgg acg ccg ctg atc ggg gtc gac gac ccg gag cac aac acc cag 707
Val Arg Thr Pro Leu Ile Gly Val Asp Asp Pro Glu His Asn Thr Gln
85 90 95
cgc cgg atg ctg atc ccc agc ttc agc ctc aag cgg acc gcc gca ctg 755
Arg Arg Met Leu Ile Pro Ser Phe Ser Leu Lys Arg Thr Ala Ala Leu
100 105 110
cgg ccg gag atc cag cgg atc gtc gac ggg ctg ctc gac cgg atg ctg 803
Arg Pro Glu Ile Gln Arg Ile Val Asp Gly Leu Leu Asp Arg Met Leu
115 120 125
gat cag ggc ccg ccc acc gag ctg gtc tcc gcg ttc gcc ctg ccg gtc 851
Asp Gln Gly Pro Pro Thr Glu Leu Val Ser Ala Phe Ala Leu Pro Val
130 135 140
ccg tcg atg gtg atc tgc gca ctg ctc gga gtc tca tac gcc gac cat 899
Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Ser Tyr Ala Asp His
145 150 155 160
gag ttc ttc gag gag gag tcc cgc cgc atc ctg cgc ggc cgg tcg gcc 947
Glu Phe Phe Glu Glu Glu Ser Arg Arg Ile Leu Arg Gly Arg Ser Ala
165 170 175
gag gag gcg gag gac gcc cgg ctg aag ctg gag gag tac ttc acc ggg 995
Glu Glu Ala Glu Asp Ala Arg Leu Lys Leu Glu Glu Tyr Phe Thr Gly
180 185 190
ctg atc gcc gcc aag gag aag aac ccg ggc gac ggg ctg ctg gac gag 1043
Leu Ile Ala Ala Lys Glu Lys Asn Pro Gly Asp Gly Leu Leu Asp Glu
195 200 205
ctg atc gag gac cgg ctg cgg acc ggc gcg ctc acc cgc gac gag ctg 1091
Leu Ile Glu Asp Arg Leu Arg Thr Gly Ala Leu Thr Arg Asp Glu Leu
210 215 220
gtc cgg ctc gcc atg atc ctg ctg gtg gcc ggc cat gag acc acc gcc 1139
Val Arg Leu Ala Met Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala
225 230 235 240
aac atg atc tcg ctc ggc acc ttc acc ctg ctg gac cac ccc gag cag 1187
Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Asp His Pro Glu Gln
245 250 255
ctg gcg cag ctc aag gcc gac gag ggc ctg atg ccg gcc gcc atc gag 1235
Leu Ala Gln Leu Lys Ala Asp Glu Gly Leu Met Pro Ala Ala Ile Glu
260 265 270
gag ctg ctg cga ttc ctg tcc atc gcg gac ggc ctg ctg cgg gtg gcg 1283
Glu Leu Leu Arg Phe Leu Ser Ile Ala Asp Gly Leu Leu Arg Val Ala
275 280 285
acg gag gac atc gag atc ggc ggt cag gtg atc cgg gcc gac gac gcg 1331
Thr Glu Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Asp Asp Ala
290 295 300
gtc ctg ttc ccc gcc tca ctg atc aac cgg gac gag gcc gcc tat ccg 1379
Val Leu Phe Pro Ala Ser Leu Ile Asn Arg Asp Glu Ala Ala Tyr Pro
305 310 315 320
gca ccc gac gag ctg gac ctc ggc cgt tcg gcc cgc cat cac gtg gcg 1427
Ala Pro Asp Glu Leu Asp Leu Gly Arg Ser Ala Arg His His Val Ala
325 330 335
tcc ggc ttc ggg atc cac cag tgc ctg ggg cag aac ctc gcc cgc gcg 1475
Ser Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala
340 345 350
gag atg gag atc gcg ctg cgc tca ctg ttc acc agg atc ccg cag ctg 1523
Glu Met Glu Ile Ala Leu Arg Ser Leu Phe Thr Arg Ile Pro Gln Leu
355 360 365
cgg ctc gcc gtg ccg gcc gcc gag att ccg ttc aag gac gga gac acc 1571
Arg Leu Ala Val Pro Ala Ala Glu Ile Pro Phe Lys Asp Gly Asp Thr
370 375 380
ctg caa ggc atg atc gaa ctg ccg ctg gcc tgg tag cagccaggac ggcaga 1623
Leu Gln Gly Met Ile Glu Leu Pro Leu Ala Trp
385 390 395
ccaaagaaag gggtccgga atg cgg atc gcg atc gac acc gac cgc tgt atc 1675
Met Arg Ile Ala Ile Asp Thr Asp Arg Cys Ile
400 405
ggc gcc ggc cag tgt gcc ctg acc gcg ccc ggg ggt ttc acc cag gat 1723
Gly Ala Gly Gln Cys Ala Leu Thr Ala Pro Gly Gly Phe Thr Gln Asp
410 415 420
gac gac ggt ttc agt gca ctg ctg ccc ggc cgg gag gac ggc gcc ggc 1771
Asp Asp Gly Phe Ser Ala Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly
425 430 435
gac ccg ctg gtg cgg gaa gcc gcc cgc gcc tgc ccc gtg cag gcc att 1819
Asp Pro Leu Val Arg Glu Ala Ala Arg Ala Cys Pro Val Gln Ala Ile
440 445 450
gcg gtc acc gac gat tag cagcaccccc gcggacgacc cggcagacgc gcgcggcc 1875
Ala Val Thr Asp Asp
455
ccggctgaca cccggcgccc gaggcgcgcc cgagccgtcc gcccctccac ttgtccctac 1935
ggcatccacc ccatccgcta ccgcaacacc ccttgggtga cgggcagttt cgaggacccc 1995
ggtgtgcccg gggcgtactg gtgaccgtca ccggcttcac gccgcgattg cccacatagg 2055
cgtcgtcgct cgcggcgatc acgaagcgcg gtcggtgccc cggctcgtaa cggtgcacga 2115
tgcccggcag ttccacggtg aaccgccggg ccacatcggg cacccgggcc ggggccacca 2175
acaggtgcac cagcgtcttc ctgccgttcg gcgcgacatc gtagagcttg gcgaacagca 2235
ccagcttgtc cgccgcatcc gcggaccgct gcgcccgccc ggcctgcggc gaggcaacct 2295
tcagcgtcac cctcggcgcg cccaccacgt cgac 2329
<210>4
<211>1860
<212>DNA
<213>A-1560株
<220>
<221>CDS
<222>(172)..(1383)
<220>
<221>CDS
<222>(1399)..(1593)
<400>4
cggggatcgt acgccgtacc gtttcggggc aaccgaatta cgatgcggaa tggatggttc 60
ccagccagat cccgcaggta gccgatctgg ccgaacttga tgtcgtgcac tggatgcctc 120
gggcatctaa tgaagatcgg cacgacgcat ccttcgtctg cgaggtctcc c atg aca 177
Met Thr
1
gac acg aca gac ctg acc gag ctg tca gat ccc gtc tcc ttc ccc cag 225
Asp Thr Thr Asp Leu Thr Glu Leu Ser Asp Pro Val Ser Phe Pro Gln
5 10 15
gac cgg agc tgc ccc tac cac ccg ccc acc ggg tac gac ccg ctg cgc 273
Asp Arg Ser Cys Pro Tyr His Pro Pro Thr Gly Tyr Asp Pro Leu Arg
20 25 30
acc gaa cgg ccg ccc gcc cgc atc cgg ctc tac gac ggc cgc ccc gcc 321
Thr Glu Arg Pro Pro Ala Arg Ile Arg Leu Tyr Asp Gly Arg Pro Ala
35 40 45 50
tgg ctc gtc acc ggc cac gcc gtc gcc cgt gac ctg ctg gtc gac ccc 369
Trp Leu Val Thr Gly His Ala Val Ala Arg Asp Leu Leu Val Asp Pro
55 60 65
cgc ctg tcc acg gac cgc acc cgc tcg ggc ttc ccg gcc aca act ccc 417
Arg Leu Ser Thr Asp Arg Thr Arg Ser Gly Phe Pro Ala Thr Thr Pro
70 75 80
cgc ttc gcc gcg gtc cgc gac cgc aag ccg gcg ctc ctc ggc gtc gac 465
Arg Phe Ala Ala Val Arg Asp Arg Lys Pro Ala Leu Leu Gly Val Asp
85 90 95
gac ccc aag cac cgc acc cag cgg tgg atg atg atc ccg agc ttc acc 513
Asp Pro Lys His Arg Thr Gln Arg Trp Met Met Ile Pro Ser Phe Thr
100 105 110
ctc agg cgc gcc acc gag ctc agg ccg cgc atc cag gag atc gtc gac 561
Leu Arg Arg Ala Thr Glu Leu Arg Pro Arg Ile Gln Glu Ile Val Asp
115 120 125 130
gaa ctg ctg gac gtg atg atc gcc cag gga ccc ccg gcc gac ctg gtg 609
Glu Leu Leu Asp Val Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val
135 140 145
cgt tcc ttc gcg ctg ccg gtg ccg tcc atg gtg atc tgc gcc ctg ctc 657
Arg Ser Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu
150 155 160
ggc gtg ccc tac gcc gac cac gag ttc ttc gag gac cag tcc agg cgg 705
Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu Asp Gln Ser Arg Arg
165 170 175
ctg ctg cgc gga ccg gcg gcc gag gac acg cag gac gcc cgg gac cgg 753
Leu Leu Arg Gly Pro Ala Ala Glu Asp Thr Gln Asp Ala Arg Asp Arg
180 185 190
ctc gcc gcg tac ctg gag gac ctg atc gac gag aag cgg cgc cgg ccc 801
Leu Ala Ala Tyr Leu Glu Asp Leu Ile Asp Glu Lys Arg Arg Arg Pro
195 200 205 210
ggt gac ggc ctg ctg gac gaa ctc gtc cag cag cgt ctg aac gaa ggc 849
Gly Asp Gly Leu Leu Asp Glu Leu Val Gln Gln Arg Leu Asn Glu Gly
215 220 225
gag ctc gac cgg gag gaa ctg acc gcg ctg gcg atg atc ctg ctg gtc 897
Glu Leu Asp Arg Glu Glu Leu Thr Ala Leu Ala Met Ile Leu Leu Val
230 235 240
gcg ggc cac gag acc acc gcc aac atg atc tcc ctg ggc acc tac acg 945
Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Tyr Thr
245 250 255
ctc ctg ctg cac ccc gaa cgg ctg acc gag ctg cgc gcc gac ccc gcg 993
Leu Leu Leu His Pro Glu Arg Leu Thr Glu Leu Arg Ala Asp Pro Ala
260 265 270
ctg ctg ccg gcc gcc gtc gag gaa ctg atg cgg atg ctg tcc atc gcg 1041
Leu Leu Pro Ala Ala Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala
275 280 285 290
gac gga ctg ctg cgg cag gcc acc gag gac atc gag atc gcc ggg acc 1089
Asp Gly Leu Leu Arg Gln Ala Thr Glu Asp Ile Glu Ile Ala Gly Thr
295 300 305
acc atc agg gcc ggg gac ggc gtg gtc ttc tcc acc tct gtc atc aac 1137
Thr Ile Arg Ala Gly Asp Gly Val Val Phe Ser Thr Ser Val Ile Asn
310 315 320
cgc gac gag gac gtc tac ccg gcc ccc gac acc ctc gac ttc cac cgc 1185
Arg Asp Glu Asp Val Tyr Pro Ala Pro Asp Thr Leu Asp Phe His Arg
325 330 335
tcg acc cgc cac cac gtc gcc ttc ggt ttc gga atc cac cag tgc ctc 1233
Ser Thr Arg His His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu
340 345 350
ggc cag aac ctc gcc cgc acc gaa ctg gag atc gcc ctg cgc acg ctc 1281
Gly Gln Asn Leu Ala Arg Thr Glu Leu Glu Ile Ala Leu Arg Thr Leu
355 360 365 370
ctc gaa cgg ctg ccc acg ctc cgg ctc gcc gcc cca ccg gag gaa atc 1329
Leu Glu Arg Leu Pro Thr Leu Arg Leu Ala Ala Pro Pro Glu Glu Ile
375 380 385
ccc ttc aaa ccc ggc gac acc atc cag ggg atg ctg gaa ctc ccc gtc 1377
Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val
390 395 400
agc tgg taa gaggctgccg tc atg cat atc gag atc gac aag gac cgc tgc 1428
Ser Trp Met His Ile Glu Ile Asp Lys Asp Arg Cys
405 410
atc ggc gcc gga cag tgc gcc ctg acc gcc ccg ggt gtg ttc acc cag 1476
Ile Gly Ala Gly Gln Cys Ala Leu Thr Ala Pro Gly Val Phe Thr Gln
420 425 430
gac gac gac ggc ttc agt gac ctg ttg ccc ggc cgg gag gac ggc gcc 1524
Asp Asp Asp Gly Phe Ser Asp Leu Leu Pro Gly Arg Glu Asp Gly Ala
415 435 440 445
ggc gac ccg atg gtc cgg gag gcc gcc agg gcc tgc ccc gtg agt gcc 1572
Gly Asp Pro Met Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala
450 455 460
atc acg ctg tcc gag gac ggg tag ggggccgagc cgcgccgccc gccggtccgc 1626
Ile Thr Leu Ser Glu Asp Gly
465
tgccgcggcg ccgtgccgac gcggcggccg gccggcccgt ccggtgcccg tcgcgtcgcc 1686
ccgtggcccc ggcggcggct gattgactag ggttcccggg tgagcgaaca ggcccagaag 1746
ccctccgggg cgccgcccgc gaaagacacc gggacggcgc ccgggaaacc ccttcctcta 1806
cgtcgtcgtc tgcgccgccg gcatcgccga aggcgtcagc aagctgatca ccgc 1860
<210>5
<211>23
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:KS-3F引物
<400>5
gaccgcggct gggacgtgga ggg 23
<210>6
<211>24
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:KS-4R引物
<400>6
gtgcccgatg ttggacttca acga 24
<210>7
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:CB-1F引物
<400>7
atgacagctt tgaatctgat ggatccc 27
<210>8
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:CB-2R引物
<400>8
tcagagacgg accggcagac tcttcagacg 30
<210>9
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PKC-1F引物
<400>9
gtgcgccgta cccagcaggg aacgacc 27
<210>10
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PKC-2R引物
<400>10
tcacgcgctc tccgcccgcc ccctgcc 27
<210>11
<211>33
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PDL58-1F引物
<400>11
gccccgcata tggatctgga aacccaactt ctc 33
<210>12
<211>31
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PDL58-2R引物
<400>12
gcactagtca gccgcgctcg acgaggaggt g 31
<210>13
<211>33
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-L-Bgl2F引物
<400>13
gggagatcta gaggccggtt acctctacga gta 33
<210>14
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-L-Hind3R引物
<400>14
gggaagcttg cgatgagctg tgccagatag 30
<210>15
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-R-Hind3F引物
<400>15
gggaagcttg aactggcgcg acagtgtctt 30
<210>16
<211>34
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-R-Bgl2R引物
<400>16
gggagatctg cagcggatcg tcttcgagac cctt 34
<210>17
<211>29
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5Dm-3F引物
<400>17
ttcgcsctsc csgtcccstc satggtsat 29
<210>18
<211>21
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5Dm-3R引物
<400>18
gttgatsays gasgtsgaga a 21
<210>19
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:6PIN-2F引物
<400>19
gctgcgcctg gccctggagg acatcgagat 30
<210>20
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:6PIN-2R引物
<400>20
ctgttcctcg aagaactcgt ggtcggcgta 30
<210>21
<211>22
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5D-1R引物
<400>21
aggtgcccag cgagatcatg tt 22
<210>22
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:7PIN-2F引物
<400>22
ccatgatcct gctggtggcc ggccatgaga 30
<210>23
<211>21
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5Dm-2R引物
<400>23
ctggatsgtg tcsccsggyt t 21
<210>24
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5PIN-2F引物
<400>24
cggaatccac cagtgcctcg gccagaacct 30
<210>25
<211>33
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldApro-SpeNdeF引物
<400>25
gggcatatga ctagtagccg tgtcctgccc gcc 33
<210>26
<211>29
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldApro-NdeR引物
<400>26
gggcatatgt tcggacgtga attcattcg 29
<210>27
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:eDM-SphF引物
<400>27
tccccgcatg ccggaactga cggacatcac 30
<210>28
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:eDM-SphR引物
<400>28
cccgggcatg cagacgacga cgtagaggaa 30
<210>29
<211>36
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PRR-1F引物
<400>29
gccccccata tgaacgcaaa cgacaacgtg gtcatc 36
<210>30
<211>35
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PRR-2R引物
<400>30
gcggatcctc aggcactact cagttcagct ttggc 35
<210>31
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:SP-1
<400>31
tatgcgtcac tagtcgggag tgcgtta 27
<210>32
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:SP-2
<400>32
tataacgcac tcccgactag tgacgca 27
<210>33
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-NdeF
<400>33
gcccccatat gacggaactg acggacatca 30
<210>34
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-SpeR
<400>34
gggccactag tcagccggcc ggttcggtca 30
<210>35
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-BglF
<400>35
cgcatagatc ttcacccgag cgggtgatca 30
<210>36
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-BglR
<400>36
tcccgagatc ttgaaggtcc gcgtcaccgt 30
<210>37
<211>27
<212>DNA
<213>人工序列
<220>
<223>R91C-F引物
<400>37
ttcgcggccg tctgcgaccg gcgggtg 27
<210>38
<211>27
<212>DNA
<213>人工序列
<220>
<223>R91C-R引物
<400>38
cacccgccgg tcgcagacgg ccgcgaa 27
<210>39
<211>27
<212>DNA
<213>人工序列
<220>
<223>R195L-F引物
<400>39
tcgcaagggg cgctcgagcg gctcgag 27
<210>40
<211>27
<212>DNA
<213>人工序列
<220>
<223>R195L-R引物
<400>40
ctcgagccgc tcgagcgccc cttccga 27
<210>41
<211>31
<212>DNA
<213>人工序列
<220>
<223>L403M-F引物
<400>41
acgatccagg ggatgatgga actccccgtg a 31
<210>42
<211>30
<212>DNA
<213>人工序列
<220>
<223>L403M-R引物
<400>42
tcacggggag ttccatcatc ccctggatcg 30
<210>43
<211>30
<212>DNA
<213>人工序列
<220>
<223>R236L-F引物
<400>43
agctggaccg actcgacgtg gtggcgctgg 30
<210>44
<211>29
<212>DNA
<213>人工序列
<220>
<223>R236L-R引物
<400>44
agcgccacca cgtcgagtcg gtccagctc 29
<210>45
<211>27
<212>DNA
<213>人工序列
<220>
<223>I244F-F引物
<400>45
tggcgctggc cgtcttcctg ctcgtgg 27
<210>46
<211>30
<212>DNA
<213>人工序列
<220>
<223>I244F-R引物
<400>46
ccacgagcag gaagacggcc agcgccacca 30
<210>47
<211>27
<212>DNA
<213>人工序列
<220>
<223>M112T-F引物
<400>47
cagcggcgga tgacgatccc gtcgttc 27
<210>48
<211>27
<212>DNA
<213>人工序列
<220>
<223>M112T-R引物
<400>48
gaacgacggg atcgtcatcc gccgctg 27
<210>49
<211>30
<212>DNA
<213>人工序列
<220>
<223>R195Y-F引物
<400>49
aggggcgcgc gagtacctcg aggagtacct 30
<210>50
<211>30
<212>DNA
<213>人工序列
<220>
<223>R195Y-R引物
<400>50
ggtactcctc gaggtactcg cgcgcccctt 30
<210>51
<211>35
<212>DNA
<213>人工序列
<220>
<223>pldout-L-Bgl2F引物
<400>51
gggagatctg caggtcatcg gggggaagaa ccaca 35
<210>52
<211>31
<212>DNA
<213>人工序列
<220>
<223>pldout-L-Sph1R引物
<400>52
tctccagccg catgcggtcc cgggtcaccg 31
<210>53
<211>32
<212>DNA
<213>人工序列
<220>
<223>pldout-R-Sph1F引物
<400>53
cccgcatgcg gctggagatc atccagagcg ca 32
<210>54
<211>34
<212>DNA
<213>人工序列
<220>
<223>pldout-R-Bgl2R引物
<400>54
gggagatcta gaacatgccg ggccagaggc tgac 34
<210>55
<211>33
<212>DNA
<213>人工序列
<220>
<223>hyg-SpeSphF引物
<400>55
ggggcatgcg gactagtaca ccgtcgcctc ggt 33
<210>56
<211>30
<212>DNA
<213>人工序列
<220>
<223>hyg-SphR引物
<400>56
gccgcatgcg tcaggcgccg ggggcggtgt 30