启动子
发明所属技术领域
本发明涉及来源于酵母的转录上可控制的启动子,该启动子在采用基因重组DNA技术制造有用蛋白质及代谢产物等的分子生物工程中有用;本发明也涉及一种DNA,其中所说的启动子以可表达的方式连接到异源基因上;本发明也涉及包含所说DNA的载体。本发明还涉及一种使用包含DNA的载体制造蛋白质的方法,所说DNA是通过以可表达的方式在所说启动子的下游连接上编码所说蛋白质的核酸获得的。
现有技术
为了以遗传工程方式生产作为药物、食品等有用的蛋白质,以酵母为宿主在酵母中生产这些物质已被广泛地进行。把异源基因引入酵母属(特别是啤酒糖酵母(Saccharomyces cerevisiae),简称为S.cerevisiae)的酵母以用于相应异源蛋白质生产的技术已为人们所了解。当异源基因(包括基因组DNA和cDNA)在啤酒糖酵母细胞中表达时,在其上游给出在酵母中可表达启动子是必要的。迄今为止已知的用于啤酒糖酵母的启动子的例子是已知显示出强表达的酒精脱氢酶(ADH1)基因的启动子或3-磷酸甘油酸激酶(PGK)基因的启动子;在半乳糖培养基中诱导转录的GAL1和GAL10启动子;和在具有低浓度无机磷酸盐的培养基中诱导转录的PH05启动子。能够进行转录控制且具有更高的表达的启动子是合乎需要的。
对于用酵母进行异源蛋白质的大规模生产而言,不仅显示强的表达而且能够进行转录控制的启动子是优选的。已知在一合成的基本培养基中,酵母单倍体菌株增加一倍的时间是大约140分钟,而在全营养培养基中时间大约为90分钟[酶学方法,194,15(1991)]。这样,作为培养产生异源蛋白质的酵母的条件,富含营养的全营养培养基是优选的,这是由于其加速细胞增殖速率并且能保持高的细胞密度。然而,迄今已知的能够诱导转录的启动子目前利用以半乳糖为碳源的培养基或具有低浓度磷酸盐的培养基。因此,从以异源蛋白质的大规模的产生为目的的细胞增殖的角度看,它们不是优选的。
发明目的
本发明的目的是提供一种从酵母衍生的启动子的核苷酸序列,该启动子能够由PDR1基因产物转录控制,并且可以用于全营养培养基中,以使上述问题得到解决。
发明概述
本发明发明人已经发现,当短梗霉素(aureobasidin)敏感细胞(野生型菌株)经历一种使其具有短梗霉素抗性的处理(例如基因突变)时,与短梗霉素的敏感性有关的基因(从短梗霉素敏感细胞获得的)的表达增加,同时他们也已考虑提供一种参与所说的基因表达的启动子。
作为深入研究的结果,本发明发明人从已被处理成具有短梗霉素抗性的突变基因组DNA克隆了参与上述基因表达的启动子,并确定了其核苷酸序列。出乎意料的是,当研究进一步进行时,本发明发明人发现了所说启动子的转录活性被多效药物抗性基因的PDR1基因的基因产物控制,由此完成了本发明。
本发明概述如下:本发明的第一项涉及一种启动子,其特征在于其是序列表中SEQ ID NO:1或其部分所代表的且在酵母中具有启动子活性的DNA。第二项涉及第一项的DNA,其中其可以用PDR1基因产物进行转录控制。第三项涉及一种DNA,其特征在于其可与第一项的DNA杂交且在酵母中具有启动子活性。第四项涉及一种DNA,其特征在于异源基因以可表达的方式连接到1-3项之任一的DNA上。第五项涉及一种载体,其特征在于其包含1-4项之任一的DNA。第六项涉及一种酵母,其特征在于其中引入了第四项的DNA或者其被第五项的载体转化过。第七项涉及一种制造蛋白质的方法,其特征在于利用经包含DNA的载体转化过的酵母,所说DNA是通过以可表达的方式在1-3项之任一的DNA下游连接上编码蛋白质的核酸获得的。
附图简要说明
图1显示了用scaur2基因为探针的啤酒糖酵母野生型菌株与短梗霉素抗性菌株的Northern杂交结果。
图2显示了Scaur2基因的限制酶图谱。
发明详述
在本说明书中使用的“启动子”指这样的一种启动子:处在转录起始点(+1)上游,包含TATA框或与其类似的域(其具有经RNA聚合酶从精确位置启动转录的功能),并且可以包含上游激活序列(UAS)以及供控制表达的与蛋白质而不是RNA聚合酶相关联所必需的域。
在本说明书中使用的“启动子活性”是显示出以下能力和功能的这样一种活性,即当异源基因以可表达的方式连接到所说启动子的下游并引入宿主(酵母)中时,在宿主细胞内或外产生所说异源基因的基因产物的能力和功能。
通常,将一种容易定量检测的编码蛋白质的基因(报导基因)以可表达的方式连接到启动子下游并引入到宿主中,然后测定所说蛋白质的表达,由此启动子存在与否和启动子的潜能用启动子活性表示。当异源基因以可表达的方式连接到启动子下游,并引入到宿主中和基因产物的表达在宿主内或外得到证实时,这时所说的启动子在引入它的宿主中具有启动子活性。
在本说明书中使用的“PDR1基因产物”包括直接从PDR1基因获得的基因产物,也包括从修饰的PDR1基因获得的基因产物,所说的修饰是通过天然突变或定点突变产生的至少一种一部分核苷酸序列的取代、插入和缺失进行的。
在本说明书中使用的“异源基因”是这样一种基因,其对宿主(酵母)来说是异源的(即外来的),是例如非真菌基因、修饰基因、不同真菌物种的基因、自身克隆基因等。异源基因包括在酵母中可表达的编码蛋白质的基因,来源于酵母的基因的反义DNA或反义RNA,编码得自酵母的转录因子的基因,因子结合位点的核苷酸序列,具有与其类似的序列的引诱物(decoy),还具有切割酵母衍生mRNA的核酶,等。
在酵母中的可表达的编码蛋白质的基因的一个例子是来自酵母的基因,但是本发明不限于此,来源于微生物(如细菌、放线菌、丝状真菌、子囊菌和担子菌)和其它生物体(如植物、昆虫和动物)的任何基因,只要其在酵母中是可表达,都包括在本说明书的异源基因中。
此外,由上述异源基因产生的任何蛋白质将被称为异源蛋白质。
在本说明书中使用的“引诱物(decoy)”指来源于酵母的转录因子的编码基因,具有转录因子的结合位点的序列的DNA以及具有与其类似的序列的DNA。当“引诱物”作为“引诱鸟(decoy bird)”引入酵母中时,转录因子的功能能够被抑制。
在本说明书中使用的“核酶”指切割特定蛋白质的mRNA和抑制这种特定蛋白质翻译的酶。可从编码特定蛋白质的基因序列设计核酶。关于锤头型核酶,在FEBS Letter
228,228-230(1988)中论及的方法可被使用。此外,不仅锤头型核酶,任何核酶(如发夹核酶和Δ核酶),不论其是何种类型的核酶,只要其切割特定蛋白质的mRNA和抑制这种特定蛋白质翻译,都可以包括在本说明书的核酶中。
短梗霉素(日本公开专利出版物平-02/138,296,03/022,995,03/220,199,05/279,384和06/065,291;抗生素杂志,44,(9),919-924;同上,4419),925-933;和同上,44,(11),1187-1198(1991))是一种环状的depsipeptide,其是作为菌株出芽短梗霉(Aureobasidiumpullulans)No.R106(FERM BP-1938)的发酵产物获得的,且结构与其它抗真菌素完全不同。如以下所给出的表1和2中所示,短梗霉素A是典型的短梗霉素化合物,在假丝酵母属的各种酵母(如白假丝酵母(Candidaalbicans)),新型隐球酵母(Cryptococcus neoformans),荚膜组织孢桨菌(Histoplasma capsulatum),Blastomyces dermatidis以及曲霉属真菌上显示很强的抗真菌性(日本公开专利出版物平-02/138,296),但是毒性很弱。因此,它是一种具有极好选择毒性的抗真菌剂。
在下文中,假丝酵母属、隐球酵母属和曲霉属将分别被缩写为C.,Cr.,A.。在下表1和2中,“MIC”代表短梗霉素对各种真菌的最小抑制浓度(微克/毫升)。
表 1所测试的微生物 TIMM数量 MIC(微克/毫升)白假丝酵母 0136 ≤0.04C.albicans var. 1308 ≤0.04stellatoidea热带假丝酵母 0312 0.08乳酒假丝酵母 0298 0.14近平滑假丝酵母 0287 0.16克鲁斯假丝酵母 0270 ≤0.04季氏假丝酵母 0257 0.08C.glabrata 1062 ≤0.04新型隐球酵母 0354 0.63地生隐球酵母 0424 0.31深红红酵母 0923 0.63烟曲霉 0063 20.00棒曲霉 0056; 0.16
表 2所测试的微生物 TIMM数量 MIC(微克/毫升)构巢曲霉 0112 0.16土曲霉 0120 5.00普通青霉 1331 1.25须发癣菌 1189 10.00絮状表皮癣菌 0431 2.50佩德罗索氏产色芽生菌 0482 0.31Exophiala werneckii 1334 1.25Cladosporium bantianum 0343 0.63荚膜组织孢桨菌 0713 0.16巴西芽生菌 0880 0.31白地霉 0694 0.63皮炎芽生菌 0126 0.31
如日本公开专利出版物平-07/313,172所提到的,本发明发明人已发现真菌如粟酒裂殖酵母(Schizosacchromyces pombe)(下文缩写为Schizo.pombe)和啤酒糖酵母对短梗霉素敏感。
表 3
所测试的微生物 MIC(微克/毫升)
粟酒裂殖酵母 0.08
啤酒糖酵母 0.31
本发明发明人已诱变了粟酒裂殖酵母,啤酒糖酵母等对短梗霉素敏感的野生型菌株给出抗性细胞(抗性菌株),同时成功地从抗性菌株分离了可以赋予短梗霉素抗性的基因(抗性基因),并从野生型菌株分离了赋予相应的短梗霉素敏感性的基因(敏感基因)。本发明发明人进而阐明由那些基因编码的蛋白质的存在。此外,本发明发明人构建了包含所说基因的复制载体,并成功地表达了上述基因,用所说的载体转化了细胞。本发明发明人继而利用上述基因的DNA片段为探针,成功地从其它短梗霉素敏感真菌发现了新的短梗霉素敏感性相关基因。
与短梗霉素敏感性(aur)相关的基因是与短梗霉素敏感性的相联系的蛋白质的编码基因,该基因包括敏感基因和抗性基因。
为分离与短梗霉素敏感性相关的基因,通过突变的方法首先从短梗霉素敏感性细胞(野生型菌株)诱导出抗性菌株,从该抗性菌株的染色体DNA或者cDNA制备DNA文库,然后从该DNA文库克隆能够赋予抗性的基因(抗性基因)。当制备了野生型菌株的DNA文库,然后从DNA文库分离了可与抗性基因杂交的DNA分子时,分离敏感基因就是可能的。
诱变的例子是用化学试剂(如乙基甲磺酸或是N-甲基-N-硝基-N-亚硝基胍(NTG))处理的方法和用紫外线或其它辐射处理的方法。获得抗性的细胞可通过在适宜条件下,在具有适当浓度短梗霉素的营养培养基中培养突变细胞来筛选。生成的抗性菌株可以随使用的突变方法以及所使用的诱变条件而变化。
现用啤酒糖酵母DKD8D菌株(交配型:a;基因型:leu2-3*112,trp1,ura3-52,his4)作为野生型菌株的例子对本发明进行具体描述。
用EMS对短梗霉素敏感性啤酒糖酵母DKD8D诱发突变,从形成的突变体中分离对多种药物不具抗性但对短梗霉素具有特定抗性的啤酒糖酵母AL33-18C菌株。
所说的菌株命名为啤酒糖酵母AL33-18C。该菌株已以保藏号FERMP-14920保藏在日本国家生命科学和人体技术研究所,工业科学和技术部,MITI(位于1-3,Higashi-1-chome,Tsukuba市,Ibaragi县305日本),并且以保藏号FERM BP-5529在原保藏单位转变为按照布达佩斯条约的保藏。
然后对啤酒糖酵母DKD8D菌株和啤酒糖酵母AL33-18C菌株短梗霉素敏感性相关基因的表达进行证实。为了证实表达,从两种菌株提取总RNA。
当总RNA用scaur2基因(例如日本公开专利出版物平-07/313,172提到的)为探针进行Northern杂交时,与短梗霉素敏感性相关的scaur2基因的表达能够得到证实。
结果在图1中给出。如图1所示,在具有短梗霉素抗性的菌株啤酒糖酵母AL33-18C菌株中,scaur2基因具有很高的表达。探针scaur2基因包含在pSCAR2质粒中。携带所说pSCAR2质粒的大肠杆菌HB101命名为大肠杆菌HB101/pSCAR2,该菌株已保藏在日本国家生命科学和人体技术研究所,工业科学和技术部,MITI。保藏号为FERM BP-4484。
然后试图克隆被认为处在scaur2基因上游,表现出高的表达的启动子。为克隆该启动子,首先从啤酒糖酵母AL33-18C菌株中克隆与短梗霉素敏感性相关的scaur2基因。在克隆scaur2基因过程中,可以使用在日本公开专利出版物平-07/313,172所论及的方法。例如,从啤酒糖酵母AZ33-18C菌株制备基因组DNA,并制备基因组文库。此后,以日本公开专利出版物平-07/313,172提到的scaur2基因为探针通过杂交来筛选基因组文库,从而得到啤酒糖酵母AZ33-18C菌株的scaur2基因。图2显示了具有所说的scaur2基因的DNA片段的限制酶图谱。为了证实所说的scaur2基因是否是与短梗霉素敏感性相关的基因,测定啤酒糖酵母AL33-L8C菌株的scaur2基因的核苷酸序列,并且与日本公开专利出版物平-07/313,172中所提的scaur2基因的核苷酸序列相比较,也与从核苷酸序列推测的由scaur2基因编码的蛋白质的氨基酸序列相比较。具有啤酒糖酵母AL33-18C菌株之scaur2基因的蛋白质编码区的域的核苷酸序列在序列表中的SEQIDNO:2中显示,而从所说基因的核苷酸序列推测的氨基酸序列则在序列表中的SEQ ID NO:3中显示。
结果证实啤酒糖酵母AL33-18C菌株的scaur2基因是与短梗霉素敏感性相关的基因。然后,被克隆认为定位在所说scaur2基因上游的启动子。例如,以一种适当的限制酶消化具有所说的scaur2基因的DNA片段,以便亚克隆具有scaur2基因上游区域的DNA片段,由此测定核苷酸序列。在所说的核苷酸序列中,位于scaur2基因上游的在SEQ ID NO:4中显示。只有scaur2基因的上游区可以由PCR或类似方法获得。例如,从SEQ ID NO:4设计与上述DNA片段的上游相应的引物(SEQ ID NO:5),而从SEQ ID NO:2设计与scaur2基因的上游相应的引物(SEQ ID NO:6),然后用这些引物进行PCR,由此可以制备包含启动子的DNA片段。所说的DNA片段的核苷酸序列由序列表中的SEQ ID NO:1显示。
然后,为了证实所说的DNA片段是否作为启动子起作用,将所说的DNA片段整合进一个适当的载体中,制备重组载体,其中异源基因与所说DNA片段相同方向的下游连接。并且终止子在相同方向上与异源基因的下游连接。就终止子而言,可以使用任何已知的存在于scaur2基因下游的终止子或将存在于scaur2基因下游的终止子。为了获得处在scaur2基因的下游的终止子,用与scaur2基因的下游相应的引物(SEQ ID NO:7)和与重组质粒(用具有scaur2基因的DNA片段整合的)的载体序列相应的另一个引物(当载体是如pUC119时,则可以使用M13引物M3(由Takara Shuzo制造))进行PCR,从而获得包含终止子的DNA片段。终止子的核苷酸序列由序列表中SEQ ID NO:8显示。将形成的重组质粒转入酵母(或类似的细胞)中,以检查异源基因或异源蛋白质的表达,由此证实所说的DNA片段是否作为启动子起作用。例如,将β-半乳糖苷酶基因[酶学方法,100,293-308(1983)]用作异源基因,在相同方向上与上述的DNA片段的下游连接,从而产生重组载体,把所说的重组载体转化进酵母,在包含5-溴-4-氯-3-吲哚基-P-D-半乳糖苷(X-gal)的培养基上培养形成的重组细胞,同时观察所形成的菌落颜色变蓝与否(由于表达半乳糖苷酶),由此证实所说的DNA片段是否具有启动子活性。
结果清楚表明,包含本发明启动子的DNA片段具有启动子活性。
然后,为证实在上述啤酒糖酵母DKD8D菌株和啤酒糖酵母AL33-18C菌株之间,是否由于具有上述DNA片段的启动子的活性,而在scaur2基因的表达上具有明显的差异,将用于证实启动子活性的重组载体转化进每个野生型菌株和具有短梗霉素抗性的菌株中。可适用的野生型菌株的例子是啤酒糖酵母DKDgD菌株、啤酒糖酵母SH3328菌株(交配型:c;基因型:ura3-52,his4,thr4,leu2-3*112)等,而具有短梗霉素抗性的菌株的例子是啤酒糖酵母AL33-18C菌株。培养形成的重组细胞,收集生长的细胞并匀浆。用邻硝基苯-β-D-半乳糖苷(ONPG)为底物测量(冷泉港实验室1972,分子生物学实验杂志第352-355页)粉碎的细胞匀浆的半乳糖苷酶的活性,由此β-半乳糖苷酶基因的表达量可作为β-半乳糖苷酶的酶促活性来测量。结果是(包括scaur2基因表达比较的结果),经重组载体转化的啤酒糖酵母AL33-18C菌株的重组细胞显示出非常高的活性。因此,现在很清楚,存在诱导本发明的启动子高表达的转录调节因子。
然后,为证实这个转录调节因子是什么,对啤酒糖酵母AL33-18C菌株进行遗传分析。结果弄清了:突变在已知为转录调节因子(生物化学杂志262,(35),16879-16879(1987))的多效药物抗性基因中的PDRI基因中发生;本发明启动子的转录由所说PDR1基因产物调节;本发明的启动子能够用PDR1基因产物进行转录调节。
依据本发明,通过利用本发明的启动子,由PDR1基因产物控制连接到所说启动子的下游可表达位置上的基因的表达是可能的,所说启动子在有用的重组体蛋白质等的制造中也是有用的。此外,当酵母作为转化用的宿主时,本发明的启动子对有用重组蛋白质的大规模的产生是有用的,因为重组细胞能在具有高营养的全营养培养基中培养,而在这种培养基中细胞增殖速率是高的,并且保持高细胞浓度。
本发明的启动子可以从啤酒糖酵母ALˉ33-18C菌株制备。通过利用包含本发明的启动子的核苷酸序列,现在制备能够与所说的核苷酸序列杂交的、与本发明的启动子性质相同的,对重组蛋白质制造有用的启动子是可能的。所说启动子也包括在本发明内。
对通过杂交方法制备所需启动子的方法而言,可以使用例如下面的方法。这样,首先,将从目的基因源获得的染色体DNA与质粒或噬菌体载体连接并按照常规方法引入宿主,由此制备DNA文库。在平板上培养文库,将生长的菌落或噬斑取到硝酸纤维素膜或者是尼龙膜上并进行变性处理,使噬斑菌落中的DNA固定到膜上。在包含事先用32P(或类似标记物)标记的探针(就这里使用的探针而言,可以使用具有序列表中SEQ ID NO:1和4的核苷酸序列或其部分的探针)的溶液中保持膜至温热,在膜上形成DNA和探针之间的杂交体。这样,例如,将其中固定有DNA的膜在溶液中于65℃下与所说探针杂交20小时,所说溶液包含6×SSC、1%月桂基硫酸钠、100微克/毫升鲑精DNA和5×Denhardt溶液(含牛血清白蛋白、聚乙烯吡咯烷酮和菲可各0.1%)。杂交后,洗去非特异性吸附物,借助放射自显影术(或类似方法)鉴定与探针形成杂交体的克隆质粒或者噬菌体。重复这样的操作直到杂交克隆成为单一的克隆为止。结果发现目的启动子被插入到如此制备的克隆质粒或噬菌体中。
通过例如以下方式测定形成的DNA的核苷酸序列,以证实所形成的DNA是不是目的启动子。
这样,在通过杂交获得克隆的质粒的情况下,用试管(或类似器皿)培养重组体大肠杆菌,并用常规方法从重组体中提取质粒。用限制酶切割质粒,提取出所插入的片段并亚克隆到M13噬菌体载体(或类似载体)中,通过双脱氧法测定核苷酸序列。当重组体是噬菌体时,基本采用相同的步骤来测定核苷酸序列。从培养到核苷酸序列测定的基本的实验方法在例如《分子克隆实验室手册》(冷泉港实验室T.Maniatis等,1982)中有描述。
为了证实形成的DNA是否为目的启动子,将证实的核苷酸序列与本发明的启动子的核苷酸序列以及在序列表中在SEQ ID NO:1中提及的序列进行比较,从而使其基因结构得到阐明。
当形成的DNA不含有启动子的所有区域时,通过合成DNA(基于所形成的DNA制备)经PCR扩增形成的DNA中缺乏的区域,或者用DNA片段为探针进一步筛选DNA文库,由此可以测定与本发明启动子杂交的启动子的整个区域的核苷酸序列。
例如,可以从对短梗霉素具有抗性的啤酒糖酵母L22-8B菌株获得目的启动子,该菌株被作为基因源在日本公开专利出版物平-07/313,L72中提及。
进而,在本发明启动子的核苷酸序列基础上,进行具有所说核苷酸序列的DNA的定点突变(至少一种核苷酸的取代、插入或缺失),以修饰所说的核苷酸序列的一部分,由此,修饰本发明启动子的功能并产生类似于本发明启动子的启动子是可能的。关于定点突变,已知有几种方法,例如缺口双链体方法(酶学方法,
154,350-367页(1987)),尿嘧啶DNA方法(酶学方法,
154,367-382页(1987)),亚硝酸盐法(美国国家科学院会议录,79,7258-7262页(1982))以及盒式诱变法(基因杂志,
34,315-323页(1985))。
在本发明启动子的核苷酸序列基础上,将具有所说核苷酸序列或其部分的DNA连接到已知启动子的DNA或其一部分上或者用已知启动子的DNA或其一部分取代,以制备嵌合启动子(美国国家科学院会议录,
79,7266-7270页(1991))是可能的,由此可以获得与本发明启动子一样,可由PDR1基因产物转录的启动子。
这样制备的启动子可以通过以下方法证实在细胞中是否起作用,即在其下游位置连接各种报导基因和通过与在本发明启动子上采用的相同方法测量启动子活性。
通过单独或和终止子一起与适当载体整合,本发明的启动子和能够与所说启动子杂交且与本发明的启动子具有相同性质的启动子可以被用作重组载体。就用于酵母的载体的情况下,能被利用的载体的例子是pYR型,pYC型,pYE型,pYI型等。一个或多个结构基因可以以可表达方向整合进所说的重组载体中。此外,用包含信号序列的所说结构基因整合的重组载体是优选的,所说信号序列将从所说结构基因表达的基因产物分泌到细胞外。就用于所说重组载体转化的细胞和与结构基因整合的重组载体而言,任何细胞都可用,只要本发明的启动子或能够与本发明的启动子杂交且具有与本发明启动子相同性质的启动子在该细胞中具有启动子活性,其优选的例子是酵母。就用于将所说重组载体或具有结构基因的重组载体转化到那些细胞的方法而言,任何已知方法都可以使用,如原生质体法、锂醋酸盐法、电穿孔法等。
此外,当所说的重组载体或具有结构基因的重组载体和具有PDR1基因的重组载体以可在合适载体中表达的方式整合,并转化进同一细胞中时,调节本发明的启动子或能够与本发明的启动子杂交且具有与本发明启动子相同性质的启动子的转录是可能的。
而且,当所说的重组载体或整合进结构基因(或类似基因)的重组载体用于无细胞系统蛋白质合成和PDR1基因产物从外部添加其中或从初期阶段置于其中时,调节从本发明的启动子或能够与本发明的启动子杂交且具有与本发明启动子相同性质的启动子的转录是可能的,并且以比通常的情况更好的方式进行蛋白质合成也是可能的。
现在,将通过下列实施例对本发明进行具体描述,尽管本发明不限于此。实施例1啤酒糖酵母的短梗霉素抗性突变体的分离
将对短梗霉素A的敏感浓度为0.31微克/毫升的啤酒糖酵母DKD8D菌株(交配型:a;基因型:leu2-3*112,trip1,ura3-52,his4)的大约1×108个细胞悬浮在具有0.9%的氯化钠的1毫升磷酸盐缓冲液中。用3%(最终浓度)EMS在30℃的条件进行突变90分钟。用8毫升5%的硫代硫酸钠使EMS灭活,通过五分钟的离心(2,500转/分)回收处理后的细胞,用6毫升盐溶液洗涤两次并悬浮在2毫升YPD培养基(具有2%的葡萄糖、1%的酵母提取物和2%的聚胨)中。悬浮液在搅拌下于30℃保持五小时,涂布在具有浓度为1.5微克/毫升的短梗霉素A的YPD平板上(YPD培养基具有1.5%的琼脂),并培养三到四天。这样得到的啤酒糖酵母菌株的抗性突变体甚至对浓度为25微克/毫升的短梗霉素A具有抗性,推测对许多其它化学药品不具抗性而只对短梗霉素具有抗性。
所说的菌株被命名为啤酒糖酵母AL33-18C,于1995年5月11日保藏在日本国家生命科学和人体技术研究所,工业科学和技术部,MITI(位于1-3,Higashi-1-chome,Tsukuba市,Ibaragi县305日本),保藏号为FERM P-14920,于1996年5月9日在原单位转变为国际保藏,保藏号为FERM BP-5529。实施例2啤酒糖酵母DKD8D菌株和啤酒糖酵母AL33-18C菌株中scaur2基因的表达
用Jensen等的方法(美国国家科学院会议录,
80,3035-3039页(1983)),从啤酒糖酵母菌株的野生型菌株啤酒糖酵母DKD8D和实施例1中制备的具有短梗霉素抗性的菌株啤酒糖酵母AL33-18C中提取总RNA并纯化。然后将poly(A)RNA用oligotex-dT30(由Takara Shuzo制造)纯化。用含有甲醛1.2%的琼脂糖凝胶电泳分离纯化的poly(A)RNA(2.5μg),并在转移到尼龙膜(Hybond-N型;由Amersham公司制造)上后固定。作为证实scaur2基因表达的探针,pSCAR2从大肠杆菌HB101/pSCAR2(FERM BP-4484)制备,所说大肠杆菌携带有质粒pSCAR2,该质粒包含来源于啤酒糖酵母L22-8B菌株的scaur2基因,该菌株是短梗霉素(日本公开专利出版物平-07/313,172提及的)抗性的,然后用HindIII(由Takara Shuzo制造)和PstI(由Takara Shuzo制造)对pSCAR2进行双重消化,随后用琼脂糖凝胶电泳收集和纯化scaur2基因的HindIII-PstI片段(1.2kbp)。用(α-32P)dCTP标记所说的DNA片段,将该DNA片段用作探针与上述固定的poly(A)RNA杂交。结果在图1中给出。这样,图1是从野生型菌株或具有抗性的菌株获得的mRNA通过含有甲醛的1.2%的琼脂糖凝胶电泳并接着进行Northern杂交之结果的放射自显影。图中泳道1和2分别表示从野生型菌株和抗生菌株获得的mRNA。结果显示,在啤酒糖酵母AL33-18C菌株中的scaur2mRNA的表达比在啤酒糖酵母DKD8D菌株中的高50倍或更多。实施例3scaur2基因启动子的克隆
(1)scaur2基因的克隆。
为克隆scaur2基因的启动子,从啤酒糖酵母AL33-18C菌株克隆scaur2基因。
采用Philippsen等的方法(酶学方法杂志,194 169-175(1981))从实施例1中制备的具有短梗霉素抗性的菌株啤酒糖酵母AL33-18C中提取基因组DNA并纯化。
将纯化的基因组DNA(8μg)在37℃下,用HindIII5单位进行10分钟的部分消化,用苯酚-三氯甲烷脱蛋白并用乙醇沉淀,以给出一种部分消化DNA。将这种DNA在0.8%琼脂糖凝胶上进行电泳,分离并纯化3-15kbp范围的DNA。将这种DNA连接到酵母-大肠杆菌穿梭载体pWH5(2μg)上,该载体已用DNA连接试剂盒(由Takara Shuzo制造)被HindIII(质粒,
15,156-158页(1986))完全消化,然后将这种DNA转化进大肠杆菌HB101中,以制备基因组文库。将包含基因组文库的大肠杆菌涂布在含有氨苄青霉素和四环素的LB琼脂培养基上,在37℃下培养一夜。将形成的菌落转移到尼龙膜(Hybond-N型)上并进行菌落杂交。作为探针,使用8.5kbp的DNA片段,该片段包含用于实施例2中的scaur2基因,其是日本公开专利出版物平-07/313,172中提及的,并且用随机引物DNA标记试剂盒(由TakaraShuzo制造)用(α-32P)dCTP标记过。筛选2×104个菌落的结果是得到与探针杂交的几个克隆。那些克隆包含由4.6kbp和3.9kbp的HindIII DNA片段组成的8.5kbp的DNA片段。从那些DNA片段的限制酶图谱发现其是在日本公开专利出版物平-07/313,172上提到的scaur2基因。所说的8.5kbp的DNA片段在图2中显示。
将形成的8.5kbp的DNA片段亚克隆到pUC118(由Takara Shuzo制造)中,然后测定DNA核苷酸序列(SEQ ID NO:2)。基于序列表中SEQ ID NO:2的核苷酸序列估计由序列表中SEQ ID NO:3代表的氨基酸序列。
此外,将所说8.5kbp的DNA片段亚克隆到pUC118(由Takara Shuzo制造)的HindIII位点上,该质粒被命名为pUscaur2,具有所说的pUscaur2的大肠杆菌被命名为大肠杆菌HB101/pUscaur2。
(2)scaur2基因的启动子的克隆和核苷酸序列的测定。
实施例3-(1)中制备的pUscaur2由限制酶
BamHI(由Takara Shuzo制造)消化,用0.8%琼脂糖进行电泳,从中提取并纯化被认为包含启动子的大约2kbp的DNA片段。然后,用DNA平端化试剂盒(由Takara Shuzo制造)使所说的DNA片段的变成平端形式,并插入到pUC118的
SmaI位点中。形成的质粒用于测定核苷酸序列。在测定的核苷酸序列中,处在scaur2基因上游的序列由序列表中的SEQ ID NO:4显示。
然后,为了仅获得具有处在scaur2基因上游的启动子的DNA片段,设计一种引物,其中HindIII识别序列被添加到与由序列表中的SEQ ID NO:4显示的上述DNA片段的上部区域相应的核苷酸序列的5′-末端侧。所说引物的核苷酸序列由序列表中的SEQ ID NO:5显示。接下来,设计另一种引物,其中BamHI识别序列被添加到与序列表中的SEQ ID NO:6显示的scaur2基因的上游区域相应的核苷酸序列的5′-末端侧。所说的引物的核苷酸序列由序列表中的SEQ ID NO:6显示。利用这两种引物并以质粒pUscaur2作为模板进行PCR。PCR的产物由HindIII-BamHI消化并用0.8%琼脂糖凝胶进行电泳,从而使由PCR得到的大约1.4kbp的HindIII-BamHI DNA片段得到分离和纯化。将所说的DNA片段克隆到pUC119的HindIII-BamHI位点,以测定核苷酸序列。在所说的核苷酸序列中,与pUscaur2相应的序列由序列表中的SEQ ID NO:1显示。
(3)scaur2基因终止子的克隆和核苷酸序列的测定。
为了克隆包含在scaur2基因的下游的终止子的DNA片段,设计一种引物,其中
SmaI识别序列被添加加到与scaur2基因的下游区相应的核苷酸序列的5′-末端侧。所说引物的核苷酸序列由序列表中的SEQ ID NO:7显示。
用所说的引物和M13引物M3(由Takara Shuzo制造)以pUscaur2为模板进行PCR。用
SmaI(Takara Shuzo制造)消化PCR产物,用0.8%琼脂糖凝胶进行电泳,从而分离和纯化由PCR获得的大约1.1kbp的
SmaI DNA片段。将所说DNA片段克隆到pUC119的
SmaI位点,以测定核苷酸序列。在所说的核苷酸序列中,与pUscaur2相应的序列由序列表中的SEQ ID NO:8显示。实施例4.启动子活性的测定
(1)其中β-半乳糖苷酶引入scaur2基因的启动子下游的质粒的构建。
将包含实施例3-(2)中获得的启动子的HindIII-BamHI DNA片段(大约1.4kbp)插入到pUC119的HindIII-BamHI位点,然后以与包含启动子的DNA片段相同的方向插入包含实施例3-(3)中所获得的终止子的
SmaI DNA片段(大约1.1kbp),由此制备质粒pUscaur2P-T。
下一步,按照下列方法将β-半乳糖苷酶基因插入到pUscaur2P-T中。这样,就β-半乳糖苷酶(lacZ)基因而言,用
BamHI切割质粒pMC1871(酶学方法杂志,100,293-308(1983)),并以0.8%琼脂糖凝胶电泳分离所需的大约3.1kbp的DNA片段,从而回收和纯化该片段。将这一3.1kbp的DNA片段以与上面描述的包含启动子DNA片段相同的方向插入到pUscaur2P-T的BamHI位点,以给出具有在所说启动子下游的β-半乳糖苷酶基因的pUAR2LZ质粒。
(2)其中β-半乳糖苷酶基因被引入到scaur2启动子的下游的酵母复制pYC质粒的构建。
用
HindIII消化pUAR2LZ,包含scaur2基因启动子、scaur2基因的终止子和β-半乳糖苷酶基因的大约5.4kbp的DNA片段通过用8%琼脂糖凝胶电泳分离,回收和纯化该片段。将被DNA平端化试剂盒平端化的5.4kbp的DNA片段与为pYC载体的pYEUra3(由Clontech制造)的平端化BamHI-EcoRiI位点连接。这样制备的质粒被命名为pYCAR2LZ。
(3)来自scaur2基因的启动子的β-半乳糖苷酶基因在野生型菌株和短梗霉素抗性菌株中的表达。
将实施例4-(2)获得的pYCAR2LZ用锂醋酸盐法转化进啤酒糖酵母SH3328菌株(交配型:α;基因型:ura3-52,his4,thr4,leu2-3*112)(野生型)和啤酒糖酵母AL33-18C菌株(短梗霉素抗性型)。
这样,将细胞悬浮在0.1M锂醋酸盐溶液中(pH:7.5),此外加入5μg的pYCAR2LZ和850μl(具有0.1M锂醋酸盐的)40%的聚乙二醇,将混合物在30℃下保持30分钟,在42℃下进行15分钟加工,离心,在5ml YPD液体培养基中培养(培养基包含1%的酵母提取物,2%的聚胨和2%的葡萄糖)收集的细胞。将培养液接种到SD琼脂培养基(一种无尿嘧啶的基本琼脂培养基;包含0.67%的无氨基酸酵母氮基质,2%的葡萄糖和2%的琼脂)上,在30℃下培养。在三至四天后,得到已变成不需尿嘧啶的转化体。然后为检验lacZ的表达,将那些转化体接种到平板上(平板是SD琼脂培养基或YPD琼脂培养基,含有0.004%的X-gal和0.1M的磷酸钾缓冲液(pH:7.0))。在30℃培养两至三天后,比较转化体菌落蓝色的变化,观察到从啤酒糖酵母SH3328菌株获得的转化体为浅蓝色,从啤酒糖酵母AL33-18C菌株获得的转化体形成蓝到深蓝色的菌落。这样,证实了由scaur2基因启动子控制的β-半乳糖苷酶的表达在抗性菌株中具有显著的增加。在抗性菌株中表达的增加进一步通过测量β-半乳糖苷酶活性得到证实。为了测量活性,将转化体在30℃下在YPD斜面上培养一夜。刮取细胞并悬浮在盐溶液中使OD600为大约15。将细胞悬液(100μl)与玻璃珠(425-600微米;由西格马公司制造)混合,用涡旋搅拌器匀浆(每次30秒,共三次)细胞,并用冰冷却。然后将Z缓冲液(具有0.1M钠磷酸盐缓冲液(pH:7.0),0.01M的KCl,1mM的MgSO4和0.05M的2-巯基乙醇)添加到匀浆中使总体积达到1ml。用ONPG为底物(分子生物学实验杂志,第352-355页(1972),冷泉港实验室),用匀浆(0.5ml)测量半乳糖苷酶活性。这样,使0.5ml细胞匀浆和0.5ml Z缓冲液混合,在28℃下保持混合物五分钟,再加入0.2ml的ONPG溶液(4毫克/毫升磷酸盐缓冲液(pH:7.0))以启动酶促反应。在28℃下保持20-40分钟,然后加入0.5ml 1M Na2CO3使反应终止。此后,在10,000rpm下离心一分钟,测量上清液的OD420和OD550。活性由下列表达式计算。
活性(单位/OD600)=1000×OD420-1.75×OD550/t×v×OD600
其中OD420,OD550:在反应溶液的上清液中测量的
OD600:细胞悬液的细胞浓度
t:反应时间(单位:分钟)
v:用于反应的细胞悬液的量(ml)
结果在表4中给出。如表4所示,在scaur2基因启动子控制下的β-半乳糖苷酶的表达,在短梗霉素抗性菌株啤酒糖酵母AL33-18C中比在野生型菌株啤酒糖酵母SH3328中高大约20倍。
表 4
活性(单位/OD600)具有pYCAR2LZ的野生型菌株(啤酒糖酵母SH3328)
克隆1 2.12
克隆2 1.99
克隆3 2.09
克隆4 1.86
克隆5 2.28具有pYCAR2LZ的抗性菌株(啤酒糖酵母AL33-18C)
克隆1 36.6
克隆2 54.4
克隆3 48.6
克隆4 53.8
克隆5 45.7实施例5短梗霉素抗性菌株啤酒糖酵母AL33-18C的抗性基因的鉴别
对啤酒糖酵母AL33-18C菌株进行基因分析,发现抗性基因存在于邻近第七染色体着丝点,从四分体分析结果发现它邻近LEU1基因标记(<4.1cM(分摩))。已知为多效药物抗性基因的PDR1基因出现在这个位置,现在清楚了,在啤酒糖酵母AL33-18C菌株中,突变发生于PDR1基因之中。PDR1基因和scaur2基因是完全不同的基因,此外,PDR1基因产物已知为转录控制因子,从而发现PDR1基因产物控制scaur2基因的转录。
如上所述,本发明提供了能够转录控制的启动子,它对用基因重组技术制造异源蛋白质和代谢产物来说是有用的。所说启动子可用于全营养培养基中,另外由PDR1基因产物进行其转录控制是可能的。
上述的出芽短梗霉No.R106菌株已被指定为这一名称,并按照布达佩斯条约,于1988年7月8日保藏在日本国立生命科学和人体技术研究所,工业科学和技术部,MITI(位于1-3,Higashi-1-chome,Tsukuba市,Ibaragi县305日本),保藏号为FERM BP-1983。
此外,上述携带质粒pSCAR2的大肠杆菌HB101被命名为大肠杆菌HB101/pSCAR2,并以保藏号FERM BP-4484保藏在日本国立生命科学和人体技术研究所,工业科学和技术部,MITI(位于1-3,Higashi-1-chome,Tsukuba市,Ibaragi县305日本)(原始保藏日期:1993年4月13日;请求转变为国际保藏的日期:1993年12月1日)。
序列表SEQ ID NO:1
长度:1366
类型:核酸
链型:双链
拓扑结构:线性
分子类型:基因组DNA
序列描述:
TCCAACCCTG CGCATTCACC ATTATCAAAC TCGTCTTTTT TGTCTTTACG TTTTAATTTA 60
GCACCGAGCC CAACGTTGTC GTCCTTAATT GACACTTTGA TATGCGAAGT GTTCGAATTC 120
ATGGGGGATA ACCCCAGACC CATACCGGGT TTCCATCCAA ACTTTTCTAG AAATTGGTGC 180
CCGAATCTCG AGGTGTCGTT ACTCCATGCC GTATTTCTGG GGTCTAAACC AAACCGCTGT 240
TTGGTTCTTG TAGCTGCCAA ACCCATTCTG CTTCTTTGTT TAATGGTGTA AGCTGCCTAT 300
ATGTTACTAT TGAGTACTCA TCTCATCGCT TCTTTCAGAA CAAAATTTTT CATATTTTTT 360
TTTTTTCCTT TTCTTTTTTT TTTTTTCTTT GACTGTTACC CGGTTGTTTA TATTTGTAGG 420
AAAACAACAA CGACAGAGAA AATATCCTTG CAGTGGCGGC TAATTTGTTA GTTGACTGAT 480
TGATCACCTT CACTTATTAA AGTAAAATCA GCATACAAGA GATCAGAAGG GAGAAAGAGA 540
GTGGGCAAGG CTATAGTACT TTGAAGAAAG CATCTTTGAA CCGACTAGTT CTCTTCACAA 600
GCAAAATCTA TATGACTAAC CGCAAGGGGC AAAGGGTTGT GAGAGGGCCC GTCTTTCTCC 660
CGCTATAGCC GTCACTGGTA TCCCTCCTGG CTGCACAAAT CCGATAGAAA GGGGAAGAAG 720
GAAGTTTAGT GCCACCTTAT AGCACGCAGT TACTGTTTAC GCTAAGGAGA GGCATACTCA 780
ATTTTTATTA GTCGCCTTCT TTAGTTGCTG CGTTTTTATC CACGGTTCTC TACTAAATGC 840
TTGCGATAAG CGCTTCTATT TTCCTCCCCA CCGCGAGGCG GAAATGGCAC ATTTTTTTTC 900
TTTTGCTTCT GTGCTTTTGC TGTAATTTTT GGCATGTGCT ATTGTATGAA GATAACGCGT 960
GGTTCCGTGG AAATAGCCGG AAATTTTGCC GGGAATATGA CGGACATGAT TTAACACCCG 1020
TGGAAATGAA AAAAGCCAAG GTAAGAAAGT GGCAATATTT TTCCTACAAA TAGATCTGCT 1080
GTCCCTTAGA TGATTACCAT ACATATATAT ATTTATTACA CACATCTGTC AGAGGTAGCT 1140
AGCGAAGGTG TCACTGAAAT ATTTTTTGTT CCAGTTAGTA TAAATACGGA GGTAGAACAG 1200
CTCTCCGCGT GTATATCTTT TTTTGCGCTA TACAAGAACA GGAAGAACGC ATTTCCATAC 1260
CTTTTTCTCC TTACAGGTGC CCTCTGAGTA GTGTCACGAA CGAGGAAAAA GATTAATATT 1320
ACTGTTTTTA TATTCAAAAA GAGTAAAGCC GTTGCTATAT ACGAAT 1366SEQ ID NO:2
长度:5340
类型:核酸
链型:双链
拓扑结构:线性
分子类型:基因组DNA
序列描述:
AGCGCTTCTA TTTTCCTCCC CACCGCGAGG CGGAAATGGC ACATTTTTTT TCTTTTGCTT 60
CTGTGCTTTT GCTGTAATTT TTGGCATGTG CTATTGTATG AAGATAACGC GTGGTTCCGT 120
GGAAATAGCC GGAAATTTTG CCGGGAATAT GACGGACATG ATTTAACACC CGTGGAAATG 180
AAAAAAGCCA AGGTAAGAAA GTGGCAATAT TTTTCCTACA AATAGATCTG CTGTCCCTTA 240
GATGATTACC ATACATATAT ATATTTATTA CACACATCTG TCAGAGGTAG CTAGCGAAGG 300
TGTCACTGAA ATATTTTTTG TTCCAGTTAG TATAAATACG GAGGTAGAAC AGCTCTCCGC 360
GTGTATATCT TTTTTTGCGC TATACAAGAA CAGGAAGAAC GCATTTCCAT ACCTTTTTCT 420
CCTTACAGGT GCCCTCTGAG TAGTGTCACG AACGAGGAAA AAGATTAATA TTACTGTTTT 480
TATATTCAAA AAGAGTAAAG CCGTTGCTAT ATACGAATAT GACGATTACC GTGGGGGATG 540
CAGTTTCGGA GACGGAGCTG GAAAACAAAA GTCAAAACGT GGTACTATCT CCCAAGGCAT 600
CTGCTTCTTC AGACATAAGC ACAGATGTTG ATAAAGACAC ATCGTCTTCT TGGGATGACA 660
AATCTTTGCT GCCTACAGGT GAATATATTG TGGACAGAAA TAAGCCCCAA ACCTACTTGA 720
ATAGCGATGA TATCGAAAAA GTGACAGAAT CTGATATTTT CCCTCAGAAA CGTCTGTTTT 780
CATTCTTGCA CTCTAAGAAA ATTCCAGAAG TACCACAAAC CGATGACGAG AGGAAGATAT 840
ATCCTCTGTT CCATACAAAT ATTATCTCTA ACATGTTTTT TTGGTGGGTT CTACCCATCC 900
TGCGAGTTGG TTATAAGAGA ACGATACAGC CGAACGATCT CTTCAAAATG GATCCGAGGA 960TGTCTATAGA GACCCTTTAT GACGACTTTG AAAAAAACAT GATTTACTAT TTTGAGAAGA 1020CGAGGAAAAA ATACCGTAAA AGACATCCAG AAGCGACAGA AGAAGAGGTT ATGGAAAATG 1080CCAAACTACC TAAACATACA GTTCTGAGAG CTTTATTATT CACTTTTAAG AAACAGTACT 1140TCATGTCGAT AGTGTTTGCA ATTCTCGCTA ATTGTACATC CGGTTTTAAC CCCATGATTA 1200CCAAGAGGCT AATTGAGTTT GTCGAAGAAA AGGCTATTTT TCATAGCATG CATGTTAACA 1260AAGGTATTGG TTACGCTATT GGTGCATGTT TGATGATGTT CGTTAACGGG TTGACGTTCA 1320ATCATTTCTT TCATACATCC CAACTGACTG GTGTGCAAGC TAAGTCTATT CTTACTAAAG 1380CTGCCATGAA GAAAATGTTT AATGCATCTA ATTATGCGAG ACATTGTTTT CCTAACGGTA 1440AAGTGACTTC TTTTGTAACA ACAGATCTCG CTAGAATTGA ATTTGCCTTA TCTTTTCAGC 1500CGTTTTTGGC TGGGTTCCCT GCAATTTTGG CTATTTGCAT TGTTTTATTG ATCGTTAACC 1560TTGGACCCAT TGCCTTAGTT GGGATTGGTA TTTTTTTCGG TGGGTTTTTC ATATCCTTAT 1620TTGCATTTAA GTTAATTCTG GGCTTTAGAA TTGCTGCGAA CATCTTCACT GATGCTAGAG 1680TTACCATGAT GAGAGAAGTG CTGAATAATA TAAAAATGAT TAAATATTAT ACGTGGGAGG 1740ATGCGTATGA AAAAAATATT CAAGATATTA GGACCAAAGA GATTTCTAAA GTTAGAAAAA 1800TGCAACTATC AAGAAATTTC TTGATTGCTA TGGCCATGTC TTTGCCTAGT ATTGCTTCAT 1860TGGTCACTTT CCTTGCAATG TACAAAGTTA ATAAAGGAGG CAGGCAACCT GGTAATATTT 1920TTGCCTCTTT ATCTTTATTT CAGGTCTTGA GTTTGCAAAT GTTTTTCTTA CCTATTGCTA 1980TTGGTACTGG AATTGACATG ATCATTGGAT TGGGCCGTTT GCAAAGCTTA TTGGAGGCTC 2040CAGAAGATGA TCCAAATCAG ATGATTGAAA TGAAGCCCTC TCCTGGCTTT GATCCAAAAT 2100TGGCTCTAAA AATGACACAT TGCTCATTTG AGTGGGAAGA TTATGAATTA AACGACGCTA 2160TTGAAGAAGC AAAAGGAGAA GCTAAAGATG AAGGTAAAAA GAACAAAAAA AAGCGTAAGG 2220ATACATGGGG TAAGCCATCT GCAAGTACTA ATAAGGCGAA AAGATTGGAC AATATGTTGA 2280AAGACAGAGA CGGCCCGGAA GATTTAGAAA AAACTTCGTT TAGGGGTTTC AAGGACTTGA 2340ACTTCGATAT TAAAAAGGGC GAATTTATTA TGATTACGGG ACCTATTGGT ACTGGTAAAT 2400CTTCATTATT GAATGCGATG GCAGGATCAA TGAGAAAAAT TGATGGTAAG GTTGAAGTCA 2460ACGGGGACTT ATTAATGTGT GGTTATCCAT GGATTCAAAA TGCATCTGTA AGAGATAACA 2520TCATATTCGG TTCACCATTC AATAAAGAAA AGTATGATGA AGTAGTTCGT GTTTGCTCTT 2580TGAAAGCTGA TCTGGATATT TTACCGGCAG GCGATATGAC CGAAATTGGG GAACGTGGTA 2640TTACTTTATC TGGTGGTCAA AAGGCACGTA TCAATTTAGC CAGGTCTGTT TATAAGAAGA 2700AGGATATTTA TGTATTCGAC GATGTCCTAA GTGCTGTCGA TTCTCGTGTT GGTAAACACA 2760TCATGGATGA ATGTCTAACC GGAATGCTTG CTAATAAAAC CAGAATTTTA GCAACGCATC 2820AGTTGTCACT GATTGAGAGA GCTTCTAGAG TCATCGTTTT AGGTACTGAT GGCCAAGTCG 2880ATATTGGTAC TGTTGATGAG CTAAAAGCTC GTAATCAAAC TTTGATAAAT CTTTTACAAT 2940TCTCTTCTCA AAATTCGGAG AAAGAGGATG AAGAACAGGA AGCGGTTGTT TCCGGTGAAT 3000TGGGACAACT AAAATATGAA CCAGAGGTAA AGGAATTGAC TGAACTGAAG AAAAAGGCTA 3060CAGAAATGTC ACAAACTGCA AATAGTGGTA AAATTGTAGC GGATGGTCAT ACTAGTAGTA 3120AAGAAGAAAG AGCAGTCAAT AGTATCAGTC TGAAAATATA CCGTGAATAC ATTAAAGCTG 3180CAGTAGGTAA GTGGGGTTTT ATCGCACTAC CGTTGTATGC AATTTTAGTC GTTGGAACCA 3240CATTCTGCTC ACTTTTTTCT TCCGTTTGGT TATCTTACTG GACTGAGAAT AAATTCAAAA 3300ACAGACCACC CAGTTTTTAT ATGGGTCTTT ACTCCTTCTT TGTGTTTGCT GCTTTCATAT 3360TCATGAATGG CCAGTTCACC ATACTTTGCG CAATGGGTAT TATGGCATCG AAATGGTTAA 3420ATTTGAGGGC TGTGAAAAGA ATTTTACACA CTCCAATGTC ATACATAGAT ACCACACCTT 3480TGGGACGTAT TCTGAACAGA TTCACAAAAG ATACAGATAG CTTAGATAAT GAGTTAACCG 3540AAAGTTTACG GTTGATGACA TCTCAATTTG CTAATATTGT AGGTGTTTGC GTCATGTGTA 3600TTGTTTACTT GCCGTGGTTT GCTATCGCAA TTCCGTTTCT TTTGGTCATC TTTGTTCTGA 3660TTGCTGATCA TTATCAGAGT TCTGGTAGAG AAATTAAAAG ACTTGAAGCT GTGCAACGGT 3720CTTTTGTTTA CAATAATTTA AATGAAGTTT TGGGTGGGAT GGATACAATC AAAGCATACC 3780GAAGTCAGGA ACGATTTTTG GCGAAATCAG ATTTTTTGAT CAACAAGATG AATGAGGCGG 3840GATACCTTGT AGTTGTCCTG CAAAGATGGG TAGGTATTTT CCTTGATATG GTTGCTATCG 3900CATTTGCACT AATTATTACG TTATTGTGTG TTACGAGAGC CTTTCCTATT TCCGCGGCTT 3960CAGTTGGTGT TTTGTTGACT TATGTATTAC AATTGCCTGG TCTATTAAAT ACCATTTTAA 4020GGGCAATGAC TCAAACAGAG AATGACATGA ATAGTGCCGA AAGATTGGTA ACATATGCAA 4080CTGAACTACC ACTAGAGGCA TCCTATAGAA AGCCCGAAAT GACACCTCCA GAGTCATGGC 4140CCTCAATGGG CGAAATAATT TTTGAAAATG TTGATTTTGC CTATAGACCT GGTTTACCTA 4200TAGTTTTAAA AAATCTTAAC TTGAATATCA AGAGTGGGGA AAAAATTGGT ATCTGTGGTC 4260GTACAGGTGC TGGTAAGTCC ACTATTATGA GTGCCCTTTA CAGGTTGAAT GAATTGACCG 4320CAGGTAAAAT TTTAATTGAC AATGTTGATA TAAGTCAGCT GGGACTTTTC GATTTAAGAA 4380GAAAATTAGC CATCATTCCA CAAGATCCAG TATTATTTAG GGGTACGATT CGCAAGAACT 4440TAGATCCATT TAATGAGCGT ACAGATGACG AATTATGGGA TGCATTGGTG AGAGGTGGTG 4500CTATCGCCAA GGATGACTTG CCGGAAGTGA AATTGCAAAA ACCTGATGAA AATGGTACTC 4560ATGGTAAAAT GCATAAGTTC CATTTAGATC AAGCAGTGGA AGAAGAGGGC TCCAATTTCT 4620CCTTAGGTGA GAGACAACTA TTAGCATTAA CAAGGGCATT GGTCCGCCAA TCAAAAATAT 4680TGATTTTGGA TGAGGCTACA TCCTCAGTGG ACTACGAAAC GGATGGCAAA ATCCAAACAC 4740GTATTGTTGA GGAATTTGGA GATTGTACAA TTTTGTGTAT TGCTCACAGA CTGAAGACCA 4800TTGTAAATTA TGATCGTATT CTTGTTTTAG AGAAGGGTGA AGTCGCAGAA TTCGATACAC 4860CATGGACGTT GTTTAGTCAA GAAGATAGTA TTTTCAGAAG CATGTGTTCT AGATCTGGTA 4920TTGTGGAAAA TGATTTCGAG AACAGAAGTT AATTTATATT ATTTGTTGCA TGATTTTTCT 4980CTTTTATTTA TTTATATGTT GCCGATGGTA CAAATTAGTA CTAGAAAAGA AAACCCACTA 5040CTATGACTTG CAGAAAAAGT TATGTGTGCC ATAGATAGAT ATAATTGCAT ACCCACATCG 5100TATACTCAAA ATTCCGAAAA GAACATTTCA TTTTTTATGA GGCAAACTGA ACAACGCTTC 5160GGTCCTTTTT TCATTCTAGA AATATATATT TATACATCAT TTTCAGAAGA TATTCAAAGA 5220ACTTATTGGG ATGTCTATTT ACTGAATAAA GTATACACAA AAAACGAATT TAAAATGGAA 5280GGCATAAATA GAAAACTTAG AAGTGAAAAT CCTAAAACCG AAGGATATTT CAAATACGTA 5340SEQ ID NO:3
长度:1477
类型:氨基酸
链型:单链
拓扑结构:线性
分子类型:肽
序列描述:
Met Thr Ile Thr Val Gly Asp Ala Val Ser Glu Thr Glu Leu Glu
5 10 15
Asn Lys Ser Gln Asn Val Val Leu Ser Pro Lys Ala Ser Ala Ser
20 25 30
Ser Asp Ile Ser Thr Asp Val Asp Lys Asp Thr Ser Ser Ser Trp
35 40 45Asp Asp Lys Ser Leu Leu Pro Thr Gly Glu Tyr Ile Val Asp Arg
50 55 60Asn Lys Pro Gln Thr Tyr Leu Asn Ser Asp Asp Ile Glu Lys Val
65 70 75Thr Glu Ser Asp Ile Phe Pro Gln Lys Arg Leu Phe Ser Phe Leu
80 85 90His Ser Lys Lys Ile Pro Glu Val Pro Gln Thr Asp Asp Glu Arg
95 100 105Lys Ile Tyr Pro Leu Phe His Thr Asn Ile Ile Ser Asn Met Phe
110 115 120Phe Trp Trp Val Leu Pro Ile Leu Arg Val Gly Tyr Lys Arg Thr
125 130 135Ile Gln Pro Asn Asp Leu Phe Lys Met Asp Pro Arg Met Ser Ile
140 145 150Glu Thr Leu Tyr Asp Asp Phe Glu Lys Asn Met Ile Tyr Tyr Phe
155 160 165Glu Lys Thr Arg Lys Lys Tyr Arg Lys Arg His Pro Glu Ala Thr
170 175 180Glu Glu Glu Val Met Glu Asn Ala Lys Leu Pro Lys His Thr Val
185 190 195Leu Arg Ala Leu Leu Phe Thr Phe Lys Lys Gln Tyr Phe Met Ser
200 205 210Ile Val Phe Ala Ile Leu Ala Asn Cys Thr Ser Gly Phe Asn Pro
215 220 225Met Ile Thr Lys Arg Leu Ile Glu Phe Val Glu Glu Lys Ala Ile
230 235 240Phe His Ser Met His Val Asn Lys Gly Ile Gly Tyr Ala Ile Gly
245 250 255Ala Cys Leu Met Met Phe Val Asn Gly Leu Thr Phe Asn His Phe
260 265 270Phe His Thr Ser Gln Leu Thr Gly Val Gln Ala Lys Ser Ile Leu
275 280 285Thr Lys Ala Ala Met Lys Lys Met Phe Asn Ala Ser Asn Tyr Ala
290 295 300Arg His Cys Phe Pro Asn Gly Lys Val Thr Ser Phe Val Thr Thr
305 310 315Asp Leu Ala Arg Ile Glu Phe Ala Leu Ser Phe Gln Pro Phe Leu
320 325 330Ala Gly Phe Pro Ala Ile Leu Ala Ile Cys Ile Val Leu Leu Ile
335 340 345Val Asn Leu Gly Pro Ile Ala Leu Val Gly Ile Gly Ile Phe Phe
350 355 360Gly Gly Phe Phe Ile Ser Leu Phe Ala Phe Lys Leu Ile Leu Gly
365 370 375Phe Arg Ile Ala Ala Asn Ile Phe Thr Asp Ala Arg Val Thr Met
380 385 390Met Arg Glu Val Leu Asn Asn Ile Lys Met Ile Lys Tyr Tyr Thr
395 400 405Trp Glu Asp Ala Tyr Glu Lys Asn Ile Gln Asp Ile Arg Thr Lys
410 415 420Glu Ile Ser Lys Val Arg Lys Met Gln Leu Ser Arg Asn Phe Leu
425 430 435Ile Ala Met Ala Met Ser Leu Pro Ser Ile Ala Ser Leu Val Thr
440 445 450Phe Leu Ala Met Tyr Lys Val Asn Lys Gly Gly Arg Gln Pro Gly
455 460 465Asn Ile Phe Ala Ser Leu Ser Leu Phe Gln Val Leu Ser Leu Gln
470 475 480Met Phe Phe Leu Pro Ile Ala Ile Gly Thr Gly Ile Asp Met Ile
485 490 495Ile Gly Leu Gly Arg Leu Gln Ser Leu Leu Glu Ala Pro Glu Asp
500 505 510Asp Pro Asn Gln Met Ile Glu Met Lys Pro Ser Pro Gly Phe Asp
515 520 525Pro Lys Leu Ala Leu Lys Met Thr His Cys Ser Phe Glu Trp Glu
530 535 540Asp Tyr Glu Leu Asn Asp Ala Ile Glu Glu Ala Lys Gly Glu Ala
545 550 555Lys Asp Glu Gly Lys Lys Asn Lys Lys Lys Arg Lys Asp Thr Trp
560 565 570Gly Lys Pro Ser Ala Ser Thr Asn Lys Ala Lys Arg Leu Asp Asn
575 580 585Met Leu Lys Asp Arg Asp Gly Pro Glu Asp Leu Glu Lys Thr Ser
590 595 600Phe Arg Gly Phe Lys Asp Leu Asn Phe Asp Ile Lys Lys Gly Glu
605 610 615Phe Ile Met Ile Thr Gly Pro Ile Gly Thr Gly Lys Ser Ser Leu
620 625 630Leu Asn Ala Met Ala Gly Ser Met Arg Lys Ile Asp Gly Lys Val
635 640 645Glu Val Asn Gly Asp Leu Leu Met Cys Gly Tyr Pro Trp Ile Gln
650 655 660Asn Ala Ser Val Arg Asp Asn Ile Ile Phe Gly Ser Pro Phe Asn
665 670 675Lys Glu Lys Tyr Asp Glu Val Val Arg Val Cys Ser Leu Lys Ala
680 685 690Asp Leu Asp Ile Leu Pro Ala Gly Asp Met Thr Glu Ile Gly Glu
695 700 705Arg Gly Ile Thr Leu Ser Gly Gly Gln Lys Ala Arg Ile Asn Leu
710 715 720Ala Arg Ser Val Tyr Lys Lys Lys Asp Ile Tyr Val Phe Asp Asp
725 730 735Val Leu Ser Ala Val Asp Ser Arg Val Gly Lys His Ile Met Asp
740 745 750Glu Cys Leu Thr Gly Met Leu Ala Asn Lys Thr Arg Ile Leu Ala
755 760 765Thr His Gln Leu Ser Leu Ile Glu Arg Ala Ser Arg Val Ile Val
770 775 780Leu Gly Thr Asp Gly Gln Val Asp Ile Gly Thr Val Asp Glu Leu
785 790 795Lys Ala Arg Asn Gln Thr Leu Ile Asn Leu Leu Gln Phe Ser Ser
800 805 810Gln Asn Ser Glu Lys Glu Asp Glu Glu Gln Glu Ala Val Val Ser
815 820 825Gly Glu Leu Gly Gln Leu Lys Tyr Glu Pro Glu Val Lys Glu Leu
830 835 840Thr Glu Leu Lys Lys Lys Ala Thr Glu Met Ser Gln Thr Ala Asn
845 850 855Ser Gly Lys Ile Val Ala Asp Gly His Thr Ser Ser Lys Glu Glu
860 865 870Arg Ala Val Asn Ser Ile Ser Leu Lys Ile Tyr Arg Glu Tyr Ile
875 880 885Lys Ala Ala Val Gly Lys Trp Gly Phe Ile Ala Leu Pro Leu Tyr
890 895 900Ala Ile Leu Val Val Gly Thr Thr Phe Cys Ser Leu Phe Ser Ser
905 910 915Val Trp Leu Ser Tyr Trp Thr Glu Asn Lys Phe Lys Asn Arg Pro
920 925 930Pro Ser Phe Tyr Met Gly Leu Tyr Ser Phe Phe Val Phe Ala Ala
935 940 945Phe Ile Phe Met Asn Gly Gln Phe Thr Ile Leu Cys Ala Met Gly
950 955 960Ile Met Ala Ser Lys Trp Leu Asn Leu Arg Ala Val Lys Arg Ile
965 970 975Leu His Thr Pro Met Ser Tyr Ile Asp Thr Thr Pro Leu Gly Arg
980 985 990Ile Leu Asn Arg Phe Thr Lys Asp Thr Asp Ser Leu Asp Asn Glu
995 1000 1005Leu Thr Glu Ser Leu Arg Leu Met Thr Ser Gln Phe Ala Asn Ile
1010 1015 1020Val Gly Val Cys Val Met Cys Ile Val Tyr Leu Pro Trp Phe Ala
1025 1030 1035Ile Ala Ile Pro Phe Leu Leu Val Ile Phe Val Leu Ile Ala Asp
1040 1045 1050His Tyr Gln Ser Ser Gly Arg Glu Ile Lys Arg Leu Glu Ala Val
1055 1060 1065Gln Arg Ser Phe Val Tyr Asn Asn Leu Asn Glu Val Leu Gly Gly
1070 1075 1080Met Asp Thr Ile Lys Ala Tyr Arg Ser Gln Glu Arg Phe Leu Ala
1085 1090 1095Lys Ser Asp Phe Leu Ile Asn Lys Met Asn Glu Ala Gly Tyr Leu
1100 1105 1110Val Val Val Leu Gln Arg Trp Val Gly Ile Phe Leu Asp Met Val
1115 1120 1125Ala Ile Ala Phe Ala Leu Ile Ile Thr Leu Leu Cys Val Thr Arg
1130 1135 1140Ala Phe Pro Ile Ser Ala Ala Ser Val Gly Val Leu Leu Thr Tyr
1145 1150 1155Val Leu Gln Leu Pro Gly Leu Leu Asn Thr Ile Leu Arg Ala Met
1160 1165 1170Thr Gln Thr Glu Asn Asp Met Asn Ser Ala Glu Arg Leu Val Thr
1175 1180 1185Tyr Ala Thr Glu Leu Pro Leu Glu Ala Ser Tyr Arg Lys Pro Glu
1190 1195 1200Met Thr Pro Pro Glu Ser Trp Pro Ser Met Gly Glu Ile Ile Phe
1205 1210 1215Glu Asn Val Asp Phe Ala Tyr Arg Pro Gly Leu Pro Ile Val Leu
1220 1225 1230Lys Asn Leu Asn Leu Asn Ile Lys Ser Gly Glu Lys Ile Gly Ile
1235 1240 1245Cys Gly Arg Thr Gly Ala Gly Lys Ser Thr Ile Met Ser Ala Leu
1250 1255 1260Tyr Arg Leu Asn Glu Leu Thr Ala Gly Lys Ile Leu Ile Asp Asn
1265 1270 1275Val Asp Ile Ser Gln Leu Gly Leu Phe Asp Leu Arg Arg Lys Leu
1280 1285 1290Ala Ile Ile Pro Gln Asp Pro Val Leu Phe Arg Gly Thr Ile Arg
1295 1300 1305Lys Asn Leu Asp Pro Phe Asn Glu Arg Thr Asp Asp Glu Leu Trp
1310 1315 1320Asp Ala Leu Val Arg Gly Gly Ala Ile Ala Lys Asp Asp Leu Pro
1325 1330 1335Glu Val Lys Leu Gln Lys Pro Asp Glu Asn Gly Thr His Gly Lys
1340 1345 1350Met His Lys Phe His Leu Asp Gln Ala Val Glu Glu Glu Gly Ser
1355 1360 1365Asn Phe Ser Leu Gly Glu Arg Gln Leu Leu Ala Leu Thr Arg Ala
1370 1375 1380Leu Val Arg Gln Ser Lys Ile Leu Ile Leu Asp Glu Ala Thr Ser
1385 1390 1395Ser Val Asp Tyr Glu Thr Asp Gly Lys Ile Gln Thr Arg Ile Val
1400 1405 1410Glu Glu Phe Gly Asp Cys Thr Ile Leu Cys Ile Ala His Arg Leu
1415 1420 1425Lys Thr Ile Val Asn Tyr Asp Arg Ile Leu Val Leu Glu Lys Gly
1430 1435 1440Glu Val Ala Glu Phe Asp Thr Pro Trp Thr Leu Phe Ser Gln Glu
1445 1450 1455Asp Ser Ile Phe Arg Ser Met Cys Ser Arg Ser Gly Ile Val Glu
1460 1465 1470Asn Asp Phe Glu Asn Arg Ser
1475SEQ ID NO:4
长度:1512
类型:核酸
链型:双链
拓扑结构:线性
分子类型:基因组DNA
序列描述:GGATCCCACG TGCTTGCTAA ACTTCACCCT TCACAAAATG GATACCCCAT TTTCCGTCAA 60TAATCTTCTG CTTTCTCTGC GTGTCCAATT CCTCTGATAT TTTGCTTTCC TTTCCGTTCA 120GCCTACCAAG AATTCGCTGG AAGACATCCA ACCCTGCGCA TTCACCATTA TCAAACTCGT 180CTTTTTTGTC TTTACGTTTT AATTTAGCAC CGAGCCCAAC GTTGTCGTCC TTAATTGACA 240CTTTGATATG CGAAGTGTTC GAATTCATGG GGGATAACCC CAGACCCATA CCGGGTTTCC 300ATCCAAACTT TTCTAGAAAT TGGTGCCCGA ATCTCGAGGT GTCGTTACTC CATGCCGTAT 360TTCTGGGGTC TAAACCAAAC CGCTGTTTGG TTCTTGTAGC TGCCAAACCC ATTCTGCTTC 420TTTGTTTAAT GGTGTAAGCT GCCTATATGT TACTATTGAG TACTCATCTC ATCGCTTCTT 480TCAGAACAAA ATTTTTCATA TTTTTTTTTT TTCCTTTTCT TTTTTTTTTT TTCTTTGACT 540GTTACCCGGT TGTTTATATT TGTAGGAAAA CAACAACGAC AGAGAAAATA TCCTTGCAGT 600GGCGGCTAAT TTGTTAGTTG ACTGATTGAT CACCTTCACT TATTAAAGTA AAATCAGCAT 660ACAAGAGATC AGAAGGGAGA AAGAGAGTGG GCAAGGCTAT AGTACTTTGA AGAAAGCATC 720TTTGAACCGA CTAGTTCTCT TCACAAGCAA AATCTATATG ACTAACCGCA AGGGGCAAAG 780GGTTGTGAGA GGGCCCGTCT TTCTCCCGCT ATAGCCGTCA CTGGTATCCC TCCTGGCTGC 840ACAAATCCGA TAGAAAGGGG AAGAAGGAAG TTTAGTGCCA CCTTATAGCA CGCAGTTACT 900GTTTACGCTA AGGAGAGGCA TACTCAATTT TTATTAGTCG CCTTCTTTAG TTGCTGCGTT 960TTTATCCACG GTTCTCTACT AAATGCTTGC GATAAGCGCT TCTATTTTCC TCCCCACCGC 1020GAGGCGGAAA TGGCACATTT TTTTTCTTTT GCTTCTGTGC TTTTGCTGTA ATTTTTGGCA 1080TGTGCTATTG TATGAAGATA ACGCGTGGTT CCGTGGAAAT AGCCGGAAAT TTTGCCGGGA 1140ATATGACGGA CATGATTTAA CACCCGTGGA AATGAAAAAA GCCAAGGTAA GAAAGTGGCA 1200ATATTTTTCC TACAAATAGA TCTGCTGTCC CTTAGATGAT TACCATACAT ATATATATTT 1260ATTACACACA TCTGTCAGAG GTAGCTAGCG AAGGTGTCAC TGAAATATTT TTTGTTCCAG 1320
TTAGTATAAA TACGGAGGTA GAACAGCTCT CCGCGTGTAT ATCTTTTTTT GCGCTATACA 1380
AGAACAGGAA GAACGCATTT CCATACCTTT TTCTCCTTAC AGGTGCCCTC TGAGTAGTGT 1440
CACGAACGAG GAAAAAGATT AATATTACTG TTTTTATATT CAAAAAGAGT AAAGCCGTTG 1500
CTATATACGA AT 1512SEQ ID NO:5
长度:29
类型:核酸
链型:单链
拓扑结构:线性
分子类型:其他核酸(合成DNA)
序列描述:
CTGGAAGCTT TCCAACCCTG CGCATTCAC 29SEQ ID NO∷6
长度:25
类型:核酸
链型:单链
拓扑结构:线性
分子类型:其它核酸
序列描述:
AACTGGATCC CCCACGGTAA TCGTC 25SEQ ID NO:7
长度:29
类型:核酸
链型:单链
拓扑结构:线性
分子类型:其它核酸(合成DNA)
序列描述:
GGTACCCGGG AAAATGATTT CGAGAACAG 29SEQ ID NO:8
长度:926
类型:核酸
链型:双链
拓扑结构:线性
分子类型:基因组DNA
序列描述:
TAATTTATAT TATTTGTTGC ATGATTTTTC TCTTTTATTT ATTTATATGT TGCCGATGGT 60
ACAAATTAGT ACTAGAAAAG AAAACCCACT ACTATGACTT GCAGAAAAAG TTATGTGTGC 120
CATAGATAGA TATAATTGCA TACCCACATC GTATACTCAA AATTCCGAAA AGAACATTTC 180
ATTTTTTATG AGGCAAACTG AACAACGCTT CGGTCCTTTT TTCATTCTAG AAATATATAT 240
TTATACATCA TTTTCAGAAG ATATTCAAAG AACTTATTGG GATGTCTATT TACTGAATAA 300
AGTATACACA AAAAACGAAT TTAAAATGGA AGGCATAAAT AGAAAACTTA GAAGTGAAAA 360
TCCTAAAACC GAAGGATATT TCAAATACGT AAAAGAAGTG AAAGATAAAA TAAAGCCCTA 420
AATAAGGAAG AAAAGAAGGG ATAACATTTT TTTTTGTTAC TTTTTGCTTA TTCCTCACCT 480
AAACAGAAGG AAAAAGCCAT TCTTGTTTAA AGAGTATTTT TAAAGCGTTC ATGAAAAGTC 540
ACAGTCCAAG GAGTATTTCA AATTGTCACT TGAAGTGAAA ACACCCCAGT GCTTCTCGAC 600
ATCAGAGGTA CCAGAGGTGT TTGGCTTCCA ATCTTCATCA AAGGCTTCAA AAACAATAAC 660
GTTAACACCC CAAGCTCTCA TGGAACAGAT ACCTTCTTTC CAGAATTGTT TGGCGTTGTC 720
AACAGATGGG TAAGAACTTT CAAAGTTGGT ACCATCAGTT GGCCAACCGG TCTCACCAAC 780
CCAGAAGGTA ATATCGGTAG AACCTTTAGT AGATTGGATA ACCTGTAGAG CTTGCATAAT 840
ATCATCAAAG AATGAGTAAG AGGCATTTTG CATGGTTTGA CCTTGCCAGT AGGAGAACGC 900
GTTAGCCATA ACAAAATCGG AAGCTT 926