TWI377253B

TWI377253B - Product and process for transformation of thraustochytriales microorganisms

Info

Publication number: TWI377253B
Application number: TW100112656A
Authority: TW
Inventors: Paul G Roessler; T Dave Matthews; Tom M Ramseier; James G Metz
Original assignee: Martek Biosciences Corp
Priority date: 2001-04-16
Filing date: 2002-04-15
Publication date: 2012-11-21
Also published as: EP1414941B1; EP1414941A2; EP1414941A4; JP2013005817A; CA2443908A1; JP2016039831A; CN101760469A; WO2002083869A2; CN1861795A; ES2377557T3; JP6211577B2; US8206984B2; US7001772B2; HK1065819A1; US20050112719A1; TW201127960A; ES2688953T3; US7851191B2; US20030166207A1; US8945875B2

Description

六、發明說明： C ^明所屬技領域】發明範圍本發明一般地係關於一種編碼破囊壺菌目乙酿乳酸合成酶之分離的核酸分子’其包括可授予破囊壺菌目微生物對磺醯服化合物、咪唑琳酮種類抑制劑及/或氧基苯甲酸嘧咬酯類具有減低的敏感度之乙醯乳酸合成酶類；亦關於_ 種包含可用於破囊壺菌目微生物轉形的選擇標記之重組型核酸分子；及亦關於使用本發明之重組型核酸分子來轉形此微生物之方法。本發明亦關於一種在破囊壺菌目表現系統中有用的基因啟動子。本發明之重組型核酸分子可使用作為破囊壺菌目微生物中外源核酸的表現型，及用於破囊壺菌目微生物中基因的刪除、突變或失活化。發明背景破囊壺菌類⑽加以少的也)的分類已隨著發展而產生修正。分類理論學家將破囊壺菌類放置在藻類或藻類似的原生生物中。但是，因為分類上的不確定，對本發明之標的來說’在本發明中描述為破囊壺菌類之菌株較佳地視為（目：破囊壺菌目；科：破囊壺菌科（77^如0£^卿心6邮）；屬••破囊壺菌屬（Thraustochytrium)、裂壺菌屬 (Schizochyirium)、類網菌屬（Labyrinthuloides)或日表壺菌屬。分類的改變則總整理在下列。於本文中所揭示及主張的某些單細胞微生物之菌株為 1377253 破囊壺菌目成員。破囊壺菌類為一種具有分類歷史問題之海洋真核生物類《破囊壺菌類的分類位置問題已由摩斯 (Moss)(1986)、班韋柏（Bahnweb)及傑寇（Jackle)(1986)及錢伯蘭（Chamberlain)及摩斯（1988)所評論。為了方便起見，破囊壺菌類首先由分類學者分配在藻菌綱(P/iycow少ceiei)(似真菌的藻類）中之其它無色游動抱子真核生物類。但是，藻菌綱的名稱最後則從分類狀態去除，而破囊壺菌類則保留在卵菌綱雙鞭毛游動孢子真菌）中。最初假定卵菌綱與不等鞭毛藻類有關，最後在廣泛範圍的超微結構及生化研究下（由巴爾（Barr)(1983)總整理）支持此假設。卵菌綱事實上由李大耳(Leedale)(1974) 及其它藻類學家接受為不等鞭毛藻類部分。但是，由於其方便的異養本質情形，卵菌綱及破囊壺菌類已大部分由真菌學者(研究真菌的科學家)研究，而非由藻類學家(研究藻類的科學家）。從另一個分類觀點來看，進化生物學家已發展出二種思考真核生物類如何發展的共通學派。理論之一提出由薄膜包圍的胞器為經由一系列内共生現象的外生源（馬爾估里斯（Margulis)1970);例如，粒腺體起源於細菌的内共生體、葉綠體起源於藍藻類及鞭毛起源於螺旋體。另一個理論則建議由薄膜包圍的胞器乃經由自體過程從無薄膜包圍的原核生物原型系統中逐漸發展形成（卡伐里爾（Cavauer)_ 史被斯(Smith) 1975)。但是，此二組進化生物學家已將即菌綱與破囊壺菌類移出真菌，而將其與雜色藻類(chromophyte 4 1377253 algae)放置在雜色藻界少加)（卡伐里爾·史密斯 1981)(此界更近已擴大至包括其它原生生物，且此界的成員現在稱為真菌界(Stramenopiles));或與全部的藻類放置在 • 原生生物界（馬爾估里斯及沙根(Sagan)(1985) » 隨著電子顯微鏡的發展，在二種破囊壺菌類的游動孢子之超顯微結構上的研究，破囊壺菌屬及裂壺菌屬（博金斯 (Perkins)1976 ;卡曰瑪（Kazama)1980 ;巴爾 1981)已提供破囊壺菌科僅略微地與卵菌綱相關的好證據。額外地，可顯 % 示5S核醣體RNA序列的相依分析（一種多元統計資料形式) 之基因資料指出破囊壺菌目明顯地為一種獨特的真核生物群，其可完全地從卵菌綱成員的真菌中分出，而最緊密地與紅及褐藻類相關（門内拉(Mannella)等人1987)。大部分的分類學者已同意將破囊壺菌類移出卵菌綱（巴克尼吉·蓋西亞（Bartnicki-Garcia)1988)。總而言之，使用卡伐里爾-史密斯的分類系統（1981， 1983)，破囊壺菌類與雜色藻類乃分類在雜色藻界（真菌 φ 界）。此將其放置在與真菌完全不同的界，其全部放置在狹義的真菌界(Eufungi)中。因此，將破囊壺菌類的分類位置總整理在下列：界：雜色藻界（真菌界）門··不等鞭毛門(//eieroAOWia) 目：破囊壺菌目 . 科：破囊壺菌科屬：破囊壺菌屬、裂壺菌屬、類網菌屬或曰本壺菌屬 5 1377253 某些早期的分類學者將破囊壺菌屬的少數原始成員 (具有變形蟲生命階段的那些）分離成個別的屬稱為優肯菌 (i//kma)。但是，現在已熟知大部分(若非全部）的破囊壺菌類（包括破囊壺菌屬及裂壺菌屬）具有變形蟲階段，如此某些人不將優肯菌屬視為有用的屬。如於本文中所使用，破囊壺菌屬將包括優肯菌屬。雖然在較高的門及界分類中處於不確定的分類位置，破囊壺菌類仍然為一種特殊及有特徵的群集，其成員仍然可分類在破囊壺菌目中。裂壺菌屬及其它破囊壺菌目微生物具有實質上存在及潛在的商業價值，因為其具有可產生大量脂質樣化合物的能力’包括高不飽和脂肪酸類(HUFAs)及不同的類胡蘿葡素類（例如’瑕青素）。歐美加（Omega)-3r^不飽和脂肪酸類且有明顯的商業利益，它們最近已鑑定出可作為重要的飲食化合物，而可用來防止動脈硬化及冠狀動脈心臟疾病、用來緩和炎性症狀及用來阻礙腫瘤細胞生長。這些有益的效應為從歐美加-6脂肪酸製造的會造成競爭性抑制之歐美加 -3HUFAS化合物類，與從歐美加_3HUFAs它們本身直接製造的有益化合物類二者之結果（辛摩炮洛斯（Simopoulos)等人，1986)。歐美加_6脂肪酸類為在植物類及動物類中發現的主要HUFAs。因此，對商業製造生物的破囊壺菌目微生物來說’其進一步的發展將可經由重組DNA技術對該生物製出特定的基因改變之能力而明顯地獲利，其包括提高此生物對高價值HUFAs及類胡蘿動素類之產量。此外，獲得 6 對此具差的特徵之生物族群其生物化學及分子生物學能力之較佳了解將可提供指導未來菌株發展有用的訊息。但是，在本發明之前’無法獲得合適用於破囊壺_(包括裂壺菌屬及破囊壺®料該些屬的a M)轉狀方法及重組架構。重要地，在本發明之前無法獲得對轉形破囊壺菌目微生物特別錢之選擇標記及鏗定破囊壺菌目特定啟動子序列的發展。先前的研究者已描述可使用在不同微生物（包括非為破嚢壺菌目成員的微藻類）的轉形方法及試劑。美國專利案號6,027,90〇(由阿爾納特(AllnuU)等人）揭示使用在真核藻類（特別地，二角褐指藻(烈咖如妙所純_的謂》基因工程中之翻融合，其使用—從光合成絲光採集基因來之啟動子及從印度斯坦鏈異壁菌（5Vr印⑽ ⑽財)來的Sh办紿基因作為選擇標記。該些細胞可在高鹽濃度(例如’ 10-35克/升)及肉辛(Ze〇cin)™(用來選擇轉化株）中生長。合適於使用此方法轉形的微藻類細胞有可在局鹽條件下生長之光合成微藻類。美國專利案號 5,661，017(由唐納黑(Dunahay)等人)揭示出一種含葉綠素ε 的藻類(例如，矽藻類)之轉形方法，其使用的重組架構包括一種操作地連結至調節控制序列（其合適於該標記在含葉綠素C的藻類中表現)之選擇性標記。該選擇標記已揭示可為任何合適的標記，包括從細菌及真菌來源分離出的標。己較佳地為新黴素磷轉移酶。該調節控制序列可包括任何起源於含葉綠素C的藻類之調節序列，較佳地，來自隱 1377253 小環藤（Cyc/oieZ/acr;^⑽)(例如，隱小環藻（C. cr_y/?iicfl)乙醯基-CoA脫羧酶調節序列）》但是，此方法無法容易地轉移至破囊壺菌目微生物的

轉形，因為，在本發明之前，微生物(諸如破囊壺菌目，例如，微藻類）之轉形並非例行的程序。已良好發展可用於細菌及酵母菌之標記及轉形系統並不容易地合適於其它微生物。更確切地’美國專利案號5,661，017提及“在真核微藻類的轉形系統發展上已有些微的成功’，(第1攔，第49-51行），其部分地由於難以將外源DNA引進此微生物，部分地由於缺乏合適用於此轉形的標記及載體。在美國專利案號 5,661，017中描述的系統特別地發展用於含葉綠素〇的藻類，因為那些發明家相信其經得起基因轉形，特別是與其它藻類比較。類似地，美國專利案號6,〇27,9〇〇(其教導一種對光合成微藻類專一的轉形方法）談及其相信大部分藻類對任何型式的基因操作具耐熱性（第丨欄，第39_47行）。合適於細菌、酵母菌、昆蟲及動物細胞的系統並不容易地適應於微藻類。因此，在本發明之前，在技藝中仍然需要—種對微藻類專一的有效轉形系統及方法。 -----------------认衣过岡口％你興雜巴澡類歸納在界，在技藝中仍然有某些人主張這些微生物與大部分藻類相當地不同，且某些熟知此技藝之人士已主張囊目成員根本不合適地分類為微藻類。視為微藻類的微在進化期間已在至少四個各別的時期進化，而致使類”型式的微生物被放置在不同界中（例如紅藻類'

S 及金黃藻類（雜色藻界），全部在不同的界中）。結果，已說 8月可在其它微藻類中有用的轉形系統不預期對破囊壺菌目有用。因此，雖然破囊壺菌目微生物具有商業價值，使用基因工程來發揮此微生物的最大潛力之能力迄今為止尚未獲得。在本發明之前，本發明家尚未察覺有任何啟動子、選擇標記或載體可用於破囊壺菌目微生物之轉形，或有任何知識考慮到所選擇的系統可使用或適應於破囊壺菌目。

，總而言之，在技藝中已需要發展一種可用於破囊壺菌西/生物轉形之方法，因此提供一種可創造具提高的商業貝值之菌株的方法。此外，在技藝令已需要發展一種可利 2原或非同源重組來突變或失活化破囊壺菌目微生物中特疋，因的方法，以提供—種可改變細胞新陳代謝及鑑定破囊壺_目中待^基因的功能之新穎的方法。【發啊Θ容】發明概述

子其勹人卿开肢貝他椚你關於—種分離的核酸分 -鮮種選自於由下列所組成之群的核酸序列：⑷ 帅c具有選自於由下列所組成之群的胺 19、序列辨：質:序列辨識編號:15、序列辨識編號：質為-種:號:22及序列辨識編號:24,其中該蛋白帅)之胺酸合成酶；（b) 一種核酸序歹’其編蜗具有質，立序列至少約75%相同的胺基酸序列之蛋白酸序列，：ΐ白質為一種乙酿乳酸合柄;及，⑷-種核 '與⑷或(b)的核酸序列完全互補。在—個觀點 9 中，此一核酸序列編碼一種具有與(a)之胺基酸序列至少約 85°/〇相同的胺基酸序列之蛋白質，及其中該蛋白質為一種乙醯乳酸合成酶。在另一個觀點中，此一核酸序列編碼一種具有與(a)的胺基酸序列至少約95%相同的胺基酸序列之蛋白質，其中該蛋白質為一種乙驢乳酸合成酶。在更另一個觀點中，此一核酸序列編碼一種具有胺基酸序列不同於序列辨識編號：15之蛋白質，其可在選自於由下列所組成之群的胺基酸位置處刪除、嵌入或取代一胺基酸：116G、

Π7Α、192P、200A、251K、358M、383D、592V、595W 及599F。在一個觀點中’該核酸序列編碼一種具有選自於由下列所組成之群的胺基酸序列之蛋白質：序列辨識編號：15、序列辨識編號：19 '序列辨識編號：22及序列辨識編號：24，及其中該蛋白質為一種乙醢乳酸合成酶。在更另一個觀點中，該核酸序列選自於由下列所組成之群：序列辨識編號：14之核苷酸1260-3314、序列辨識編號：18 之核苷酸1260-3314、序列辨識編號：21之核苷酸1260-3314 及序列辨識編號：23之核苷酸1260-3314。較佳地’由上述鑑別的核酸序列所編碼之蛋白質的表現性可授予以此核酸分子轉形的破囊壺菌目微生物對選自於由下列所組成之群的化合物具有減低的敏感度：磺醯脲化合物類、咪唾琳酮種類抑制劑及氧基苯曱酸喊咬酯類。在此具體實施例的一個觀點中，該核酸序列編碼一種具有選自於由下列所組成之群的胺基酸序列之蛋白質：序列辨識编號：19、序列辨識編號：22及序列辨識编號：24。在 10 I. 此具體實施例的另一個觀點中’該核酸序列選自於由下列所組成之群：序列辨識编號：Η之核苷酸1260-3314、序列辨識編號：18之核苷酸1260-3314、序列辨識編號：21之核苷酸1260-3314及序列辨識編號：23之核苷酸1260-3314。在本發明的一個具體實施例中，上述描述的核酸序列綠碼一種裂壺菌屬乙醯乳酸合成酶。在一個觀點中，該裂壺菌屬乙醯乳酸合成酶的表現性為可授予該以核酸分子轉形的破囊壺菌目微生物對選自於由下列所組成之群的化合物具有減低的敏感度：峰酿脲化合物類、η米嗤琳酮種類抑制劑及氧基苯曱酸嘧啶酯類》本發明的另一個具體實施例係關於一種包含任何上述 59迷之分離的核酸分子之重組型核酸分子，其被可操作地連結至一轉錄控制序列。本發明的另一個具體實施例係關於〜種被此重組型核酸分子所轉形的破囊壺菌類重組型微生物。本發明的更另一個具體實施例係關於一種破囊壺菌目微生物轉形用之重組型載體。該載體包括一種編碼乙醯乳酸合成酶的核酸序列，而該合成酶可授予該破囊壺菌目微生物對選自於由下列所組成之群的化合物具有減低的敏感度.磺醯服化合物類、咪唑啉酮種類抑制劑及氧基苯甲酸嘧啶酯類。該乙醯乳酸合成酶具有選自於由下列所組成之群的胺基酸序列：（a)—種胺基酸序列，其選自於由下列所組成之群：序列辨識編號：19、序列辨識編號·· 22及序列辨識編號，· 24 ;及(b) —種胺基酸序列，其與(a)的胺基酸序 1377253 列至少約75%相同。該可譯成乙酿乳酸合成酶的核酸序列操作地連結至-轉錄控制序列。在一個觀點中’該重組型載體為-種表現載體。在另-個觀點中，該重組型載體為 -種致標載體。在其它觀點中，在載體中的該核酸序列可 _ 譯成-種具有胺基酸序列與(a)之胺基酸序列至少約85%相同的乙醯乳酸合成酶，在另-個觀點中，至少約95%相同。在一個觀點中，該核酸序列編碼一種具有胺基酸序列與序列辨識編號：15不同的蛋白質，其可藉由在選自於由下列所組成之群的胺基酸位置處刪除、嵌入或取代一胺基酸· 鲁 116G、117A、192P、200A、251K、358M、383D、592V、 595W及599F。在一個較佳的觀點中’該乙醯乳酸合成酶具有選自於由下列所組成之群的胺基酸序列：序列辨識編號：19、序列辨識編號：22及序列辨識編號：24。在另一個觀點中，該核酸序列可選自於由下列所組成之群：序列辨識編號：18之核苔酸1260-3314 '序列辨識編號：21之核苷酸1260-3314及序列辨識編號：23之核苷酸1260-3314。在該重組型載體中的轉錄控制序列可包括（但是非為限制）破 · 囊壺菌目α-微管蛋白啟動子、破囊壺菌目乙酿乳酸合成酶啟動子、從破囊壺菌目聚乙醯合成酶(PKS)系統來的啟動子或破囊壺菌目脂肪酸去飽和酶啟動子。在一個觀點中，該載體包含一種選自於由下列所組成之群的核酸序列：序列辨識編號：18、序列辨識編號：21及序列辨識編號：23。本發明的更另一個具體實施例係關於一種破囊壺菌目微生物細胞之轉形方法。該方法包括第—步驟(&)將一包含 12 1377253 編碼乙醯乳酸合成梅之核酸序列的重組型核酸分子引進破

°物# 種類抑制劑及氧基苯甲㈣㈣類，其中°亥乙Κ酸合成_具有選自於由下列所组成之群的胺基酸序列.（1)種胺基酸序列，其選自於由下列所組成之群： · 19 '序列辨識編號：22及序列辨識編號： 24 ’及’（u) —種胺基酸序列，其與⑴的胺基酸序列至少約 75%相同°該方法包括第二步驟(b)選擇已成功地以重組型核酸分子轉形的細胞’其藉由將⑷的細胞培養在包含至少 —種會抑制未轉形的細胞之化合物的培養基中，該化合物可選自於由下列所組成之群：磺醯脲化合物、哺°坐琳酮種類抑制劑及氧基笨甲酸1^定醋類。在一個觀點中，該核酸序列可譯成具有胺基酸序列與⑴的胺基酸序列至少約85〇/〇相同之乙酿乳酸合成晦’更佳地至少約95%相同。在一個觀點中’該核酸序列可譯成一種具有胺基酸序列與序列辨識編號：15不同的蛋白質，其可藉由在選自於由下列所組成之群的胺基酸位置處刪除、嵌入或取代一胺基酸H16G、

117A、192P、200A、251K、358M、383D、592V、595W 及599F。在另一個觀點中，該乙醯乳酸合成酶具有選自於由下列所組成之群的胺基酸序列：序列辨識編號：19、序列辨識編號：22及序列辨識編號：24。較佳地，該核酸序列選自於由下列所組成之群··序列辨識編號：18之核苷酸 1260-3314、序列辨識編號：21之核苷酸1260-3314及序列辨 13 1377253 識編號：23之核苷酸1260-3314。在更另一個觀點中，該核酸序列可操作地連結至一選自於由下列所組成之群的轉錄控制序列：破囊壺菌目α-微管蛋白啟動子、破囊壺菌目乙 - 醯乳酸合成酶啟動子、從破囊壺菌目聚乙醯合成酶(PKS) . 系統來之啟動子及破囊壺菌目脂肪酸去飽和酶啟動子。在一個觀點中，該重組型核酸分子進一步包含一種可譯成欲由細胞製造的蛋白質之核酸序列，其中該可譯成蛋白質的核酸序列操作地連結至一轉錄控制序列。在此具體實施例的一個觀點中，該蛋白質與合成選自於由下列所組 φ 成之群的脂肪酸有關：廿二碳六烯酸(DHA)、廿二碳五烯酸(DPA)、廿十碳五烯酸(EPA)及花生四烯酸(ARA)。在此具體實施例的另一個觀點中，·該蛋白質選自於由下列所組成之群：脂肪酸合成酶、脂肪酸去飽和酶、脂肪酸鏈加長酶(elongase)、與聚乙醯合成酶複合體有關的蛋白質及與將脂肪酸併入磷脂類或甘油三酯分子有關的蛋白質。在一個觀點中，該蛋白質為一種ω·3脂肪酸去飽和酶，其可由核酸序列序列辨識編號：29編碼。在另一個觀點中’該蛋白質 · 為一種多烯脂肪酸異構酶。在更另一個觀點中，該蛋白質選自於由下列所組成之群·· HMG-CoA合成酶、HMG-CoA 還原酶、鯊烯合成酶、八氫番茄紅素合成酶、八氫番茄紅素去飽和酶、類胡蘿葡素環化酶、類胡蘿蔔素羥化酶、類胡蘿蔔素酮酶、維他命E及硫辛酸。在本方法的另一個觀點中，在步驟(a)中的重組型核酸分子進一步包含一可與微生物中之標的核酸序列雜交的核 14 竣序列，人以第— 此包含該樟的核酸序列的基因可利用同源重組

序列端瑪酸序〜變或失活化。在此觀點中，該標的核酸解_/=種選自於由下列所組成之群的蛋白f:脂肪分白質、月曰肪酸氧化轉類、與碳水化合物類合成有關的蛋髮版分戊―缔途從產物的合成有關之蛋白質與細胞之蛋白成有關的蛋白質、與飽和脂肪酸合成途獲有關聚乙、與多不飽和脂肪酸合成途徑有關之蛋白質、與類心D鱗複合體有關之蛋白纽與將麟酸併入磷腊 "油三酯分子有關之蛋白質。

質之桉法可進一步包括將至少一種含編碼欲表現的蛋白中料列的額外重組型核酸分子引進細胞之步驟，其點中^序列操作地連結至—轉錄控制序列。在另一個觀生物中^方法進一步包含的步驟有將至少一種包含可與微型杪峻之標的核酸序列雜交的第二核酸序列之額外的重組利®刀子引進細胞，如此包含該標的核酸序列的基因可點中重組與第二核酸序列突變或失活化。在另一個觀合蛋白該方法進一步包括的步驟有將具有編碼博菜黴素-結點中質的核酸序列之重組型核酸分子引進細胞。在此觀 β亥包含編碼博菜黴素-結合蛋白質的核酸序列之重組之核進一步包括—編碼欲由細胞表現的第二蛋白質妗至列，其中該編碼第二蛋白質的核酸序列操作地連轉錄控制序列。此一轉錄控制序列可包括(但是非為限制)破囊®菌目α微管蛋白啟動子、破囊壺菌目乙酿乳酸合成酶啟動子、從破囊壺菌目聚乙醯合成酶(PKS)系統來的 15 1377253 啟動子及破囊壺菌目脂肪酸去飽和酶啟動子。在此具體實施例的進一步觀點中，該包含編碼博菜黴素-結合蛋白質的核酸序列之重組型核酸分子進一步包含一可與微生物中之標的核酸序列雜交的第二核酸序列’如此包含該標的核酸序列的基因可利用同源重組與第二核酸序列突變或失活化。在一個具體實施例中’該重組型核酸分子包含核酸序列序列辨識編號：9。在本發明之方法中’該微生物可為一種屬，其包括（但是非為限制)破囊壺菌屬、癀爾磨肩、曰本壺菌屬及裂壺菌屬。在一個觀點中，該微生物可為一物種，其包括(但是非為限制）裂壺菌jp.)、叢狀裂壺菌 (Schizochytrium aggregatum)、軟後裂壺菌（Schizochytrium iimacinum)、破嚢壺菌（Thfaustochytrium sp.)、故狀破囊壺菌(Thraustochytrium striatum)、黃金破囊壺菌 {Thraustochytrium aureum)、粉紅破囊壺菌 {Thraustochytrium. roseum)反 B 豕壺菌（Japonochytrium sp ) ° 在本方法的一個具體實施例中，該引進步驟可利用一種選自於由下列所組成之群的方法來進行：粒子轟擊、電穿孔法、顯微注射法、微脂粒感染、吸附、感染及原生質體融合。本發明的另一個具體實施例係關於一種破囊壺菌目重組型微生物，其可以包含能編碼乙醯乳酸合成酶之核酸序列的重組型核酸分子轉形，該合成嗨可授予該微生物對選 16 1377253 自於由下列所組成之群的化合物具有減低的敏感度：磺醯服化合物類、β米峻琳酮種類抑制劑及氧基苯甲酸喊咬酯類。該乙醯乳酸合成酶具有一種選自於由下列所組成之群的胺基酸序列：（a)—種胺基酸序列，其選自於由下列所組成之群··序列辨識編號：19、序列辨識編號：22及序列辨識編號：24 ;及，（b) —種胺基酸序列，其與(a)的胺基酸序列至少約75%相同。在一個觀點中，該核酸序列編碼具有與0)的胺基酸序列至少約85%相同之胺基酸序列的乙醯乳酸合成酶。在另一個觀點中，該核酸序列編碼具有與(a)的胺基酸序列至少約95%相同之胺基酸序列的乙醯乳酸合成誨。在另一個觀點中，乙醯乳酸合成酶具有選自於由下列所組成之群的胺基酸序列：序列辨識編號：19、序列辨識編號：22及序列辨識編號：24。在更另一個觀點中，該核酸序列可選自於由下列所組成之群··序列辨識編號：18之核苷酸1260-3314、序列辨識編號：21之核苷酸1260-3314 及序列辨識編號：23之核苷酸1260-3314。在更另一個觀點中’該重組型核酸分子包含選自於由下列所組成之群的核酸序列：序列辨識編號：18、序列辨識編號：21及序列辨識編號：23。較佳地’該編碼乙醯乳酸合成酶的核酸序列操作地連結至一可在破囊壺菌目微生物中作用的啟動子。在一個觀點中，該可譯碼成乙酿乳酸合成酶的核酸序列操作地連結至選自於由下列所組成之群的轉錄控制序列：破囊壺菌目α-微管蛋白啟動子、破囊壺菌目乙醯乳酸合成酶啟動子、從破囊壺菌目聚乙酿合成酶(PKS)系統來之啟動子 17 1377253 及破囊壺菌目脂肪酸去飽和酶啟動子。在一個具體實施例中，該重組蜇核酸分子進一步包含一種編碼由微生物製造的第—蛋白質之核酸序列，其中該編碼第一蛋白質的核酸序列操作地連結至一轉錄控制序列。在另一個具體實施例 . 中’該重組細胞進一步以包含編碼博菜黴素-結合蛋白質的核酸序列之重組型核酸分子轉形。較佳地，該重組型核酸分子包含核酸序列序列辨識編號：9。在一個具體實施例中，該包含編碼博菜黴素-結合蛋白質核酸序列的重組型核酸分子進一步包含一編碼由細胞製造之第二蛋白質的核酸 · 序列，其中該編碼第二蛋白質的核酸序列操作地連結至一轉錄控制序列。在一個具體實施例中’該微生物亦包括至少一種包含編碼由細胞製造的蛋白質之核酸序列的其它重組型核酸分子。本發明的更另一個具體實施例係關於一種分離的核酸分子，其包含一種選自於由下列所組成之群的核酸序列： (a)序列辨識編號：9之核苷酸441-894 ; (b) —種核酸序列，其在序列辨識編號：9之核苷酸441-894的全長上與序列辨 # 識編號：9之核苷酸441-894至少約95%相同，其中該核酸序列具有至少基本的α-微管蛋白啟動子轉錄活性；及(c)一種分離的多核苷酸，其包含一與(a)或(b)之多核苷酸完全互補的核酸序列。較佳地，該分離的核酸分子包含一種選自於由下列所組成之群的核酸序列：序列辨識编號：4及序列辨識編號：9之核苷酸441-894。本發明的更另一個具體實施例係關於一種破囊壺菌目 18 微生物轉形用之重組型載體，其包含一種編碼博菜黴素結合蛋白質之核酸序列而操作地連結至選自於由下列所組成之群的啟動子：破囊壺菌目α_微管蛋白啟動子、破囊壺菌目乙醯乳酸合成誨啟動子、從破囊壺菌目聚乙醯合成晦 (pks)系統來之啟動子及破囊壺菌目脂肪酸去飽和酶啟動子。在一個觀點中，該破囊壺菌目乙醯乳酸合成酶啟動子包含序列辨識編號：14之核苷酸1-1259。在一個觀點中該α-微管蛋白啟動子包含一選自於由下列所組成之群的拉酸序列：序列辨識編號：9之核苷酸類441-894 ;及—核酸序列，其在序列辨識編號：9之核苷酸441-894的全長上與序列辨識編號：9之核苷酸441-894至少約95%相同，其中兮核酸序列具有至少基本的α-微管蛋白啟動子轉錄活性。在另一個觀點中，該從破囊壺菌目PKS系統來的啟動子包括序列辨識編號：34或一包含在序列辨識編號：34中的核酸序列’其t該啟動子具有至少基本的PKS啟動子轉錄活性。在另一個觀點中，該重組型載體包含一選自於由下列所組成之群的核酸序列：序列辨識編號：8及序列辨識編號· 9 〇圖形簡述第1圖闡明重組質體pTUBZEO-l 1的架構。第2圖闡明重組質體pTUBZEOll-2的架構。第3八圖闡明重組質體pMON50200。第圖闡明重組質體PMON50201。第3C圖闡明重組質體pMON50202 » 1377253 第3D圖闡明重組質體pMON50203。 C實方&方式1 發明之詳細說明本發明包括基因地轉形破囊壺菌目微生物之方法及其相關的物質。於本文中所揭示的使用作為本發明之重組架構的轉化株之單細胞微生物菌株（其亦可通常指為破囊壺读類）全部為破囊32菌目成貝。根據本發明，措辭“破囊壺菌’’、“破囊壺菌目微生物”及“破囊壺菌目的微生物’’可交替著使用。本發明家在任何先前的報導中並無察覺到有描述可用於裂壺菌屬或任何其它破囊壺菌目微生物之轉形系統。於本文中描述的轉形系統可使用來將外源基因引進破囊壺菌目微生物，因此提供一種可以產生具提高的商業價值之菌株的方法。此外，本發明能夠利用同源或非同源重組來突變或失活化特定的基因，以提供一種改變細胞新陳代謝及鑑定破囊壺菌目微生物中的特定基因之功能的新方法。更特別地，本發明家已藉由使用二種型式的轉形載體來說明破囊壺菌目裂壺菌屬微生物（目：破囊壺菌目；科：破囊壺菌科；屬：裂壺菌屬）之基因轉形。這些載體可利用標準方法來引進細胞’接著根據其於選擇性化合物存在下的生長能力來鐘別及分離該重組細胞^本發明家已說明利用粒子蟲擊來引進這些载體的功效，但是亦可使用在技藝中熟知的其它方法來引進載體(例如，電穿孔法），且其意欲包含在本發明中。 20 1377253 對一種於本文中例示的轉形載體（由pTUBZEOll-2表示的重組型載體)來說’可產生一種將從印度斯坦鏈異壁菌來之We基因（其編碼一種“博菜黴素-結合蛋白質”)放置在裂壺菌屬微管蛋白基因啟動子下游之嵌合基因。SV40终止子則放置在此構造中基因的下游。此載體能夠在裂壺菌屬中表現ά/e基因，因此可授予對肉辛™及相關化合物（當其包含在生長培養基中於適當的程度下時對野生型細胞有毒) 之抵抗性。在此構造中的基因及SV40終止子來源為一種可商業上購得的載體，名稱為pSV40/Zeo，其可從因維戳郡股份（有限）公司（Invitrogen Corporation)(卡爾斯貝德 (Carlsbad)，CA)(工藝手冊(Technical Manual)180202，版本 B , “日歐卡謝(ZeoCassette)載體”；因維戳郡股份(有限)公司，1600法拉第大道(Faraday Ave.)，卡爾斯貝德，CA92008) 購得。微管蛋白基因啟動子可經由聚合酶連鎖反應而分離；使用於此反應的引4之一乃以透過隨機裂壺菌屬cDNA 定序計劃獲得的序列資料為基礎。pTUBZEOll-2的基因圖顯示在第2圖，且pTUBZEO 11 -2的核苷酸序列可由序列辨識編號：9表示。含此載體的裂壺菌屬之轉形可藉由使用聚合酶連鎖反應及南方墨點分析來偵測併入裂壺菌屬基因組的載體序列之存在而確定。該We基因已由先前的研究者使用作為一種選擇標記而用於不同生物的基因轉形，包括細菌、非破囊壺菌微藻類、真菌、原生生物、植物及動物細胞（參見，例如，美國專利案號6,027,900 ;蘭布雷拉斯(Lumbreras)等人，1998，植物 21 1377253 期刊«/.)14 . 441-447，羅黑（Rohe)等人，1996，〇1/"*· 29 : 587-590 ;美辛納（Messina)等人，1995，基因 (Gene)165 : 213-217 ;古耶雷羅（Guerrero)等人，1992，却/?/. Microbiol. Biotechnol. 36 Ί59-762 ;策瑞级(perez)等人， 1989，尸/α«ίΜ>/•价·<?/. 13 : 365-373 ;蓋帝格諾（Gatigno)等人，1990，基因91 : 35-41)。該We基因編碼一種“博菜徽素 -結合蛋白質”，其可授予對數種抗生素（包括博菜黴素、腐卓徽素及肉辛（卓客特（Drocourt)等人，1990，

Jc此18 : 4009))之抵抗性。此基因可從因維戳郡股份 (有限)公司商業地購得，其為本發明家使用來產生裂壺菌屬轉形載體pTUBZEOll-2的基因來源。但是，本發明家相信首先要製造一該基因附著至破囊壺菌啟動子的轉形載體，以使該基因可在破囊壺菌類中表現。第二組轉形載體則利用乙醯乳酸合成酶基因（以5)(其為本發明家從裂壺菌基因庫中分離出來的）的活體外定點突變而製造。這些突變可改變該已譯碼的酵素(ALS)之胺基酸序列，如此其對嘧磺隆甲基及其它磺醯脲化合物類、咪唑啉酮種類抑制劑及氧基苯甲酸嘧啶酯類（其對破囊壺菌目微生物敏感）更不敏感。續醢脲化合物類（諸如嘴續隆甲基 (SMM))經常對細胞有毒，因為它們能夠結合至不同生物的乙醯乳酸合成酶(ALS)而使之失活化。ALS可催化在該些胺基酸(纈胺酸、白胺酸及異白胺酸）之生物合成中的第一步驟。咪唑啉酮類、三唑嘧啶類及其它化合物類亦已顯示出可結合至某些生物且使ALS失活化。可從其它生物編碼乙 22 1377253 醯乳酸合成酶（亦熟知為乙醯羥酸合成酶）的基因之突變形式已先前地使用作為選擇標記，而用於酵母菌及植物的轉 • 形（Annu. Rev. Plant Physiol. Plant Mol· 40 ·· 441-4Ί0 ’ • 1989)。但是，在本發明之前尚未有報導描述從裂壺菌屬或任何其它破囊壺菌目成員來之α/ί基因的序列或性質，或使用突變型破囊壺菌目fl/j基因來授予抗磺醯脲、咪唑啉納或氧基苯甲睃嘧啶酯化合物性。事實上，對本發明家的知識來說，甚至尚未有任何已公告出的報導考慮到破囊壺菌目 φ 微生物對這些選擇性試劑（包括嘧磺隆甲基）的敏感度’因此，在本發明之前甚至不熟知此一選擇性標記是否可使用在破囊壺菌轉形系統。值得注意的是該些與熟知的基因實質上同源之基因會在不同的生物中發生，但是不會編碼能夠催化乙醯乳酸合成的酵素(及·ocAimfcia! WΛ JcM 1385 : 401-419、1998)。因此，尚未明瞭的是該選殖的同源化合物事實上會編碼ALS。為了最後地測定該經選殖的裂壺菌屬基因是否為真實的ah基因，本發明家透過鲁轉形實驗來說明抗嘴續隆甲基性與已推斷突變的裂袭菌屬基因之表現性具正關聯性。本案發明人已製造出三種包含突變型a/j基因的不同轉形載體··一突變型ah基因編碼一種在位置595處的色胺酸由纈胺酸取代之酵素（質體pMON50201，或ALSmml-7);另〆種編碼在位置192處的脯胺酸以麵醯胺酸取代（質體 PMON50202，或ALSmut2_2);及第三種形式則包含此二突變物（質體PMON50203，或ALSmuT3-5)。在這些載體中， 23 1377253 重組突變型基因的表現性可由天然的a/s基因啟動子及終止子所控制。這些載體的基因圖與包含野生型裂壺菌屬此基因（質體pMON50200，或AE-5)的載體一起顯示在第 3A-3D圖中》含這些突變型ALS-譯碼載體的裂壺菌屬之轉 - 形可藉由聚合酶連鎖反應及南方墨點分析來偵測併入裂壺菌屬基因組之載體序列的存在而確定。如下列詳細地描述’本發明家現在已鑑別出a/s基因的完整序列，其它突變 (在下列詳細指明）亦可製得。因此，所描述的突變型^&基因意指為典型的實例，而非包含全部可能的突變。 0 本發明之轉形系統已用來將外源基因經由共轉形而引進破囊壺菌目細胞。在這些情況中，該些外來的基因放置在不同的裂壺菌屬啟動子和適當的終止子之間（例如，SV40 或裂32菌屬基因終止子區域）。例如，本發明家已製造及引進種編瑪從線蟲類泥蟲（CaeworAahi/沿來的ω-3 脂肪酸去飽和崎之合成基因（於本文由序列辨識編號：29表不），以增加廿二碳六烯酸在裂壺菌屬中的程度。序列辨識編號.30顯示出由序列辨識編號：29編碼的去飽和酶之胺 · 基酸序列。包含外源基因的表現匣亦可利用在含選擇性標記之轉形载體中的直接内含物而引進破囊壺菌目細胞。再者’本發明家亦已說明在裂壺菌屬中發生的同源重、且之大變型ALS_譯碼載體其指出使用重組工具來失活化或大變特定的天然裂壺菌屬基因之可行性。關於在本文中描述的破囊壺菌目啟動子序列，所報導的破囊$菌目成員之全部的核苷酸及蛋白質序列之序列資 24 1377253 料庫搜尋(基因銀行(GenBank))說明，在本發明之時間中並無報導從裂壺菌屬或任何其它破囊壺菌目成員來的啟動子序列。已報導的從任何裂壺菌屬物種來之唯一基因為叢狀裂壺菌（义flggregfliMAn)之5S核醣體RNA(基因銀行編號 X06104及M13616)°5S及18S核醣體RNA序列曾報導用於破囊壺菌目成員，種：罃#磨及屬：癀縛磨屬及破囊壺菌屬，但是此與本發明無關。從黃金破囊壺菌來之“推斷的T3/T7 似的RNA聚合酶”基因之部分編碼區域已描述（核酸研究 (A/wc/ez.c : 648-654，1996)，但是尚無報導用於此基因之啟動子序列。本發明可用來將有興趣的任何基因或其它核苷酸序列引進破囊壺菌目微生物。此核苷酸序列包括(但是非為限制）與編碼合成脂肪酸(例如，脂肪酸類：廿二碳六烯酸(DHA)、廿二碳五烯酸（DPA)、廿十碳五烯酸（EPA)及花生四烯酸 (ARA))有關的蛋白質（例如，酵素類）之核酸。此些蛋白質包括（但是非為限制）：脂肪酸合成酶類、脂肪酸去飽和酶類、脂肪酸鏈加長酶類和與聚乙醯合成酶複合體有關的蛋白質及/或與將此脂肪酸併入磷脂類或甘油三醋分子有關的蛋白質。例如，本發明已使用來將編碼不同ω_3脂肪酸去飽和酶的基因引進裂壺菌屬，以企圖經由廿二碳五稀酸 (DPA)的ω-3去飽和反應來增加細胞中的廿二碳六稀酸 (DHA)程度。至於另一個實例，亦已說明源自於裂壺菌屬的紅藻，必洛塔(Ptilota)，之推定多烯脂肪酸異構酶之表現性。編碼裂壺菌屬聚乙醯合成酶複合體的基因（即’聚乙酿 25 1377253 合成酶系統）已存放為基因銀行編號AF378329(ORFA)、 AF378328(ORFB)及AF378329(ORFC)。本發明亦可有用地用來將基因及其它核苷酸序列（其編碼與類異戊二烯生物合成途徑有關的蛋白質）引進破囊壺菌目微生物。此類蛋白質包括(但是非為限制)HMG-CoA 合成酶及HMG-CoA還原酶。其它合適的蛋白質包括與源自類異戊二稀次單元之分子合成有關的蛋白質，該次單元包括（但是非為限制）不同的類固醇化合物和不同的類胡蘿g 素化合物。與不同的類胡蘿蔔素化合物之合成有關的蛋白質包括(但是非為限制）鯊烯合成梅、八氫番茄紅素合成酶、八氫番祐紅素去飽和酶及不同的類胡蘿萄素環化酵素類、羥化酶類及酮酶類。本發明亦可有用地用來將一種或多種核酸序列引進破囊壺菌目，其中該序列編碼與抗氧化劑化合物（包括(但是非為限制）維他命E及硫辛酸)之合成有關的蛋白質。此外

本發明可使用來將任何基因或其它核誓酸如載體引進破囊壺菌目微生物以使基因失活化或刪除（即 “剔除”或“目標基因《Hi]失活化或刪除典型的目自使用來提高微生㈣商業價值^如，可想要移除能^ 飽和及h㈣和脂魏合錢徑之料（或可調節此a 基因表現之核酸類）的基因。在另—個觀點中，可想要抑_ 或剔除能編碼與其它由破囊壺菌目微生物所產生之有用白化合物之降解有關或會減少想要的化合物之值的蛋白質: 基因。例如，想要由本Μ麵之標料會編碼脂肪分j 5 26 1377253 酶類、脂肪酸氧化酶類及具有會令人不愉快的風味或氣味之蛋白質的基因。在更另一個觀點中，可想要剔除能編碼與其合成會與其它有興趣的分子競爭之化合物的合成有關之蛋白質的基因。例如，此些基因包括(但是非為限制)編瑪與碳水化合物生物合成有關的蛋白質之基因、編碼與類異戊二烯途徑的不同產物之合成有關的蛋白質（例如，留醇類或特定的類胡蘿®素化合物類）之基因、及編碼與細胞壁組

分之合成有關的蛋白質之基因。以實例說明之，該些基因已利用本發明引進裂壺菌屬細胞，以企圖使與從許旺尼拉來之聚乙醯合成酶基因同源的基因失活化，以評估其在高不飽和脂肪酸類(HUFA)的製造中之角色。如由實例6所例証，本發明亦可使用來失活化、刪除或突變天然

基因（其與脂肪酸類 '類胡蘿蔔素類、留醇類、維他命類或其它化合物類之製造有關），以改善與這些化合物有關的產品之經濟性或容許性。應注意的是在某些具體實施例中（如上述討論）’想要提高所獲得的蛋白質之產量，然而在其它具體實施例中，可想要抑制相同蛋白質之生產。此決定以欲從該特定微生物獲得的用途及製造目標為準。本發明亦可有用地用來決定在裂壺菌屬中的基因重組之方法。其它可有用地引進破囊壺菌目之基t因及核酸分子將由熟知此技藝之人士所明瞭，此些基因及分子全部意欲包含在本發明中。本發明的不同具體實施例將初始地在下列描述，而與本發明之破囊壺菌目α/ι5基因及/或ALS蛋白質有關。但是， 27 1377253 需了解的是此些共通的項目及方法之觀念意欲應用至在下列描述的其它基因、核酸類及蛋白質之討論上。本發明部分基於編碼選擇標記的核酸序列之鑑別、分離及製造，其合適使用於破囊壺菌微生物轉形的重組構造。此選擇標記可選擇出已成功地以本發明之重組構造轉形之微生物。根據本發明，可有用地用於破囊壺菌目轉形的選擇標記為一種破囊壺菌目乙醯乳酸合成酶（即，ALS)。較佳地，該乙醯乳酸合成酶已經改性、突變或選擇，而可抵抗由磺醯脲化合物類、咪唑啉酮種類抑制劑及/或氧基苯甲酸嘧啶酯類之抑制（即’此ALS為天然發生的乙醯乳酸合成酶之同源化合物）。根據本發明，乙醯乳酸合成酶為一種具有乙醯乳酸合成酶的生物活性之蛋白質，其包括天然發生的乙醯乳酸合成酶之全長蛋白質、融合蛋白質或任何同源化合物。乙醯乳酸合成酶的同源化合物包括與天然發生的乙醯乳酸合成酶不同之蛋白質，其有至少一個或數個（但是不限制為一個或數個）胺基酸已刪除(例如，截斷形式的蛋白質，諸如胜肽或片段）、嵌入 '轉化、取代及/或衍生（例如，利用糖化作用、磷酸化作用、乙醯化作用、肉豆蔻醯化作用、異戊烯化作用、棕櫚酸化作用、醯胺化作用及/或糖基磷脂醯基肌醇的加成作用）。天然發生的乙醯乳酸合成酶之較佳同源化合物則詳細地描述在下列。根據本發明，分離的蛋白質（諸如分離的乙醯乳酸合成酶)為一種已從其天然環境移出（即，其已接受人類操作）之 28 1377253 蛋白質，可例如包括經純化的蛋白質、部分純化的蛋白質、重組製造的蛋白質及合成製造的蛋白質。就其本身而論， “分離的”並非反映出該蛋白質已純化的程度。較佳地，本發明之分離的乙醯乳酸合成酶經重組地製造。“破囊壺菌目乙醯乳酸合成酶”指為一種從破囊壺菌目微生物來的乙醯乳酸合成晦（包括天然發生的乙醯乳酸合成酶之同源化合物），或其已從破囊壺菌目微生物的天然發生之乙醯乳酸合成酶的結構(例如，序列）之知識而製造。換句話說，破囊壺菌目乙醯乳酸合成酶包括任何具有從破囊壺菌目微生物來之天然發生的乙醯乳酸合成酶之結構及功能的乙醯乳酸合成酶，或其為一種從破囊壺菌目微生物來之天然發生的乙醯乳酸合成酶之可生物活化（即，具有生物活性）的同源化合物（如詳細地描述於本文）。就其本身而論，破囊壺菌目乙醯乳酸合成酶可包括純化、部分純化、重組、突變/改性及合成的蛋白質。通常地，蛋白質的生物活性或生物作用指為任何可歸因於天然發生形式之蛋白質的蛋白質所展示或進行的功能，如可在活體内（即在蛋白質的天然生理環境中）或活體外 (即，在實驗室條件下）測量或觀察到。例如，乙醯乳酸合成酶的生物活性包括乙醯乳酸合成酶的酵素活性。蛋白質之改性（諸如同源化合物或模倣物（在下列討論))可產生具有與天然發生的蛋白質相同之生物活性的蛋白質，或具有比天然發生的蛋白質減少或增加的生物活性之蛋白質。可造成蛋白質表現性減少或蛋白質活性減少之改性可指為蛋白 29 1377253 質的失活化（完全或部分）'向下調節或減少作用。類似地，可造成蛋白質表現性增加或蛋白質活性增加之改性可指為蛋白質的放大'過度產生、活化、提高、向上調節或增加作用。關於本發明之乙酿乳酸合成酶，較佳地為存在於乙醯乳酸合成酶同源化合物中之改性（如與天然發生的乙酿乳酸合成酶比較）’實質上不改變或至少實質上不減少該合成酶的基本生物活性(如與天然發生的蛋白質比較）。但是此類同源化合物可在蛋白質的功能性或酵素活性外具有與天然發生的形式不同之特徵，諸如與天然發生的蛋白質比較’其可減少對某些抑制化合物的敏感度。較佳地，天然發生的乙醯乳酸合成酶之同源化合物具有降低（即，減低、減少）對結合至及使天然發生的乙醯乳酸合成酶失活化之化合物的敏感度’如與同源化合物所衍生之天然發生的乙醯乳酸合成酶比較。例如，項醢脲化合物類（諸如嘴續隆甲基(SMM))經常對細胞有毒，因為它們能夠結合至及使乙醯乳酸合成酶(ALS)失活化。咪唑啉酮類、三唑嘧啶類及其它類似的化合物類（於本文通常指為咪唑啉酮種類抑制劑）亦已顯示出可結合至及使ALS失活化。因此，天然發生的乙酿乳酸合成酶之同源化合物較佳地對續醯脲化合物類、°米唾琳_種類抑制劑及氧基苯甲酸痛咬醋類具有減低的敏感度(例如，藉由中斷此類抑制劑的結合場址或減低結合場址對此抑制劑之親和力），同時維持乙醢乳酸合成酶的酵素活性0 1377253 如於本文中所使用，具有“乙酿乳酸合成酶生物活性” 或指為“乙醯乳酸合成‘，的蛋白質指為-種蛋白質，其可 • 雜在_酸、白胺酸及異白胺酸之胺基酸類的生物錢巾之第一步驟。更特別地，本發明之分離的乙酿乳酸合成酶(包括全長蛋白質'截斷蛋白質、融合蛋白質及同源化合物）可在直接方式中藉由該蛋白質將丙酮酸鹽催化合成乙酿乳酸的能力而鏗定。乙酿乳酸合成酶生物活性可由熟知技藝之人士利用任何合適的活體外或活體内試驗做酵素活 Φ 性之評估。在-個具體實施例中，本發明之乙醯乳酸合成酶具有與選自於由下列所組成之群的胺基酸序列至少約65%相同之胺基酸序列：序列辨識編號：15、序列辨識編號：19、序列辨識編號：22、序列辨識編號：24，且超過此些序列的任何一種至少約600個胺基酸，其中該蛋白質為一種乙醯乳酸合成酶（即’具有乙醯乳酸合成酶生物活性）。更佳地，本發明之乙醯乳酸合成酶具有與序列辨識編號：15、序列辨識編破.19、序列辨識編號：22或序列辨識編號：24任何一種至少約70%相同的胺基酸序列，更佳地，至少約75〇/〇相同’甚至更佳地至少約80%相同，甚至更佳地至少約85% 相同，甚至更佳地至少約90%相同，甚至更佳地至少約95% 相同，甚至更佳地至少約96%相同，甚至更佳地至少約97% 相同，甚至更佳地至少約98%相同及甚至更佳地至少約99% 相同，且超過序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24任何—種約6〇〇個胺基 31 酸，其中該蛋白質具有乙醯乳酸合成酶生物活性。在另一個具體實施例中，本發明之乙醯乳酸合成酶具有與選自於由下列所組成之群的胺基酸序列至少約75%相同的胺基酸序列：序列辨識編號：15、序列辨識編號：19、序列辨識編號：22、序列辨識編號：24，且超過此些序列的任何一種至少95個胺基酸，其中該蛋白質為一種乙醯乳酸合成酶（即’具有乙酿乳酸合成酶生物活性）。更佳地，本發明之乙醯乳酸合成酶具有與序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24任何一種至少約80%相同的胺基酸序列，甚至更佳地至少約85〇/〇相同，甚至更佳地至少約90%相同、甚至更佳地至少約950/〇相同，甚至更佳地至少約96%相同，甚至更佳地至少約97% 相同，甚至更佳地至少約98%相同及甚至更佳地至少約99% 相同，且超過序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24的任何一種至少95個胺基酸，其中該蛋白質具有乙醯乳酸合成酶生物活性。甚至更佳地，本發明之乙醯乳酸合成酶與序列辨識編號· 15、序列辨識編號：19、序列辨識編號：22或序列辨識編號： 24任何一種之胺基酸序列，具有任何上述所提出的相同百分比，且超過序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24任何一種至少100個胺基酸，更佳地125，更佳地150，更佳地175，更佳地2〇〇，更佳地225，更佳地25〇，更佳地275，更佳地3〇〇，更佳地 325，更佳地350，更佳地375，更佳地400，更佳地425，更 32 1377253 佳地450，更佳地475，更佳地500，更佳地525，更佳地550 及更佳地575個胺基酸’其中該蛋白質具有乙醯乳酸合成酶生物活性。如於本文中所使用（除非另有指定），所參考的相同百分比（％)指為同源體的評估，其可使用下列方法來進行： (1) BLAST 2.0基本BLAST同源搜尋’使用標準預設參數以 blastp做胺基酸搜尋及以blastn做核酸搜尋，其中該查詢序列可利用預設值過濾出低複雜性區域（描述在阿斯苦 (Altschul)，S.F.，瑪登(Madden)，T.L.，史卡弗（Sch詛ffer)， A.A·，張(Zhang) ’ J.，張，Z. ’ 米勒（Miller)，W.&里普曼 (Lipman)，D.J.(1997) “ 有間隔的（Gapped) BLAST 及 PSI-BLAST.新一代蛋白質資料庫搜尋程式。"Nucleic Acids Res· 25 : 3389-3402，其全文以參考之方式併於本文）； (2) BLAST2排比(使用下列描述的參數）；⑶及/或具標準預設參數的PSI-BLAST(位置特定的重複（Position-Specific Iterated) BLAST)。應注意的是由於在BLAST 2.0基本 BLAST及BLAST 2間的標準參數上之某些差異，二種特定的序列其可使用BLAST 2程式認定為具有明顯的同源性，然而在BLAST 2.0基本BLAST中進行的搜尋(使用一序列作為查詢序列）可能在上部配對中不為相同的第二序列。此外，PSI-BLAST提供一種自動的、容易使用的“曲線(profile)” 搜尋版本’其為一種敏感的搜尋序列同源化合物之方法。該程式首先進行具間隔的BLAST資料庫搜尋。PSI-BLAST 程式使用任何有意義的排比資訊回饋來構造一種位置特定 33 的計分矩陣，其取代了下一輪資料庫搜尋用之查詢序列。因此，可了解的是該相同百分比可使用這些程式的任何一種來測量》二種特定的序列可使用BLAST 2序列來彼此排比，如描述在塔土梭伐〇^扣3(^3)及瑪登，（1999)，“81^5丁2序列 -一種新型的比較蛋白質及核苷酸序列用之工具”，F五MS ⑽· 174 : 247-250，其全文以參考之方式併於本文。BLAST 2序列排比以blastp或blastn使用BLAST 2.0演算法進行，以在二種序列間進行具間隔的BLAST搜尋(BLAST 2.0)，以在產生的排比中引進間隔（刪除及嵌入）。於此，為了清楚目的，可使用如下的標準預設參數來進行BLAST 2 序列排比》對blastn來說，使用OBLOSUM62矩陣：配對的獎勵(reward)= 1 錯誤配對的罰分(penalty)=-2 開放間距(open gap)(5)及延伸間距(extension gap)(2)罰分間距X下降(dr〇p〇fO(50)預期（expect)(l〇)字形大小 (word size)( 11)過濾(filter)(開）對blastp來說，使用OBLOSUM62矩陣：開放間距（11)及延伸間距（1)罰分間距X下降(50)預期（10)字形大小（3)過濾（開)。本發明之乙醯乳酸合成酶亦可包括具有序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨 1377253 識編號：24任何一種的至少3〇個連續胺基酸殘基之胺基酸序列的蛋白質（即，有30個連續的胺基酸殘基100%與序列辨識編號：15、序列辨識編號·· 、序列辨識編號：22或序 • 列辨識編號：24任何一種的30個連續胺基酸相同）。在一個較佳的具體實施例中，本發明之乙醯乳酸合成酶包括具有序列辨識編號：15、序列辨識編號：19、序列辨識編號： 22或序列辨識編號· 24任何一種的至少50個連續胺基酸殘基之胺基酸序列的蛋白質，更佳地至少75，更佳地至少 • 100，更佳地至少115 ’更佳地至少130，更佳地至少150，更佳地至少200 ’更佳地，至少250，更佳地至少300，更佳地至少350 ’更佳地至少400，更佳地至少450，更佳地至少 500,更佳地至少550’更佳地至少600及更佳地至少650個。此一蛋白質具有乙醯乳酸合成酶生物活性。根據本發明，與於本文描述的核酸或胺基酸序列有關之名稱“連續的”或“連貫的”意謂著以完整的序列連接。例如，對包含第二序列的30個連續（或連貫的）胺基酸之第一序 • 列來說，意謂著該第一序列包括一完整的30個胺基酸殘基序列’其與在第二序列中的30個胺基酸殘基之完整序列 100%相同。類似地’對具有與第二序列“ 1〇〇%相同”之第一序列來說’此意謂著第一序列精確地與第二序列相符合而在核笞酸或胺基酸間並無間隔。在另一個具體實施例中，本發明之乙醯乳酸合成酶（包括乙醢乳酸合成酶同源化合物）包括一種蛋白質，其與天然發生的乙醯乳酸合成酶胺基酸序列具有足夠類似的胺基酸 35 1377253 序列’編碼能在中度、高度或非常高度嚴苛的條件(描述在下列）下，與編碼天然發生的乙醯乳酸合成酶核酸分子（即，與編碼天然發生的乙酿乳酸合成酶胺基酸序列之核酸股的 - 補體)雜交之同源化合物的核酸序列。較佳地，乙酿乳酸合 - 成酶可由能在中度、高度或非常高度嚴苛的條件下與一核酸序列（其編碼包含由序列辨識編號：15、序列辨識編號： 19、序列辨識編號：22或序列辨識編號：24表示之胺基酸序列的蛋白質）的補體雜交之核酸序列所編碼。甚至更佳地，本發明之乙醯乳酸合成酶可由能在中度、高度或非常 · 高度嚴苛的條件下與序列辨識編號：15之核苷酸 1260-3314、序列辨識編號：18之核苷酸1260-3314、序列辨識編號：21之核苷酸1260-3314或序列辨識編號：23之核芽酸1260-3314的補體雜交之核酸序列所編碼。此雜交條件詳細地描述在下列。編碼本發明之乙醯乳酸合成酶的核酸序列之核酸序列補體指為與編碼乙醯乳酸合成酶的股互補之核酸股的核酸序列。需了解的是編碼提供的胺基酸序列之雙股DNA包含一單股DNA和具有與該單股DNA互補的序籲列之補體股。就其本身而論，本發明之核酸分子可為雙股或單股’且包括那些可在嚴苛的雜交條件下與編碼胺基酸序列序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24之核酸序列及/或與可譯碼成任何此胺基酸序列的互補核酸序列形成穩定混雜體的核酸分子。推論出互補序列的方法已由熟知此技藝之人士所熟知。應注意的是因為胺基酸定序及核酸定序技術並非全部 36 1377253 無誤差，於本文顯現的序列充其量僅代表本發明之乙酿乳酸合成酶的明顯序列。 • 乙醯乳酸合成酶同源化合物可為天然對等基因變異或 • 天然突變的結果。本發明之乙醯乳酸合成酶同源化合物亦可使用於技藝中熟知的技術來製造，包括（但是非為限制）使用例如傳統或重組DNA技術對蛋白質直接改質，或對編碼蛋白質的基因改質，以達成隨機或有目標的致突變。編碼乙醯乳酸合成酶的核酸之天然發生的對等基因變異為一 φ 種基本上發生在基因組中的相同位址(locus)(或位址(i〇ci)) 處之基因，而為編碼胺基酸序列序列辨識編號：15的基因，但是其由於由例如突變或重組所造成的天然變異而具有類似但是不相同的序列。天然的對等基因變異編碼的蛋白質典型地與比較用的基因所編碼之蛋白質具有類似的活性。同種類的對等基因變異編碼相同蛋白質，但是由於基因密碼的降解而具有不同的核酸序列。對等基因變異亦可包含在基因的5,或3’之未轉化區域的改變（例如，在調節控制區籲域中）。對等基因變異已由熟知此技藝之人士所熟知。本發明之乙醞乳酸合成酶蛋白質亦包括基因融合（例如’使用來過度表現重組蛋白質的可溶性、活性形式）、致大變基因（諸如具有密碼子改性以提高基因轉錄及轉化之 =因）及朗基因（諸如具有薄膜結合區域已移除以產生可 ’合形式的薄膜蛋#質之基@ ;或具有信號序列已移除而在特別重組的宿主中具差的容忍、度之基因）的表現產物。本發明之蛋白質及/或同源化合物的最小尺寸為足以 37 1377253 具有乙酿乳酸合成酶生物活性之尺寸。純地，本發明之蛋白質長度至少有30個胺基酸，更佳地至少約5〇，更佳地至少75’更佳地至少100,更佳地至少U5，更佳地至少13〇, 更佳地至少150，更佳地至少2〇〇 ,更佳地至少25〇 ,更佳地至少300，更佳地至少350，更佳地至少4〇〇，更佳地至少 450，更佳地至少500，更佳地至少55〇，更佳地至少6〇〇，更佳地至少650，更佳地至少684個胺基酸長。除了實際限制外，此蛋白質的最大尺寸並無限制，其中該蛋白質可包括乙醯乳酸合成酶蛋白質的部分或乙醯乳酸合成酶的全長，若必要時可加上額外的序列（諸如融合蛋白質序列）。本發明亦包括一種融合蛋白質，其包括一種附著至一個或多個融合部分之乙醯乳酸合成酶區域（即，根據本發明之乙醯乳酸合成酶的胺基酸序列）。合適使用於本發明之融合部分包括(但是非為限制）具有下列功能的部分：其可提高蛋白質的穩定性；可提供其它想要的生物活性；及/或可輔助乙醯乳酸合成酶純化(例如，利用親和色譜法）。合適的融合部分可為具有想要的功能之任何尺寸的區段(例如，可授予增加的穩定性、溶解度、作用或生物活性；及/或蛋白質的簡單純化）。融合部分可連結至蛋白質之含乙醯乳酸合成酶區段的胺基及/或羧基終端，且可易地切割以能夠直接獲得乙醯乳酸合成酶。融合蛋白質較佳地藉由培養經融合核酸分子（其可譯碼出包括附著至含乙醯乳酸合成酶區段的叛基及/或胺基終端融合部分之蛋白質）轉移的重組細胞而製造。 38 1377253 本發明亦包括-種己酿乳酸合成酶模倣物。如於本文中所使用’名稱“模倣物”習慣上指為任何能夠模仿天然發生的胜肽之生物作用的胜肽或非胜肽化合物，經常因為該模倣物具有模仿天然發生的胜肽之基本結構的基本結構，及/或具有天然發生的胜肽之顯著的生物性質4些模做物可包括(但是非為限制）：實質上從原型改性的胜肽，諸如與天然發生的胜狀類似之無側鏈胜肤(例如，此改性可減少其對降解的敫感性）；抗遺傳及/或催化的抗體，或其片段；分離的蛋白質之非蛋白質部分(例如，碳水化合物結構）；或合成或天然的有機分子，例如包括經由組合化學認定的核酸類及藥物類。此模倣物可使用技藝中所熟知的不同方法來設計、選擇及/或鑑別。不同的藥物設計方法(可有用地設計在本發明有用的模倣物或其它治療化合物中）則揭示在毛里克 (Maulik)等人，1997，分子生物科技（从〇/咖心 Biotechnology).治療應用反東略（Therapeutic Application 化gb)，威利-里斯有限公司（wiley-Liss，Inc.)中，其全文以參考之方式併於本文。乙醯乳酸合成酶模倣物可例如從分子多樣性策略(讓大的、化學多樣性的分子基因庫 (libraries)快速建構之相關策略的組合）；天然或合成的化合物基因庫，特別是從化學或組合的基因庫（即，序列或尺寸不同，但是具有類似的構造嵌段之化合物的基因庫）；或利用合理、直接或隨機的藥物設計而獲得。參見例如前述的毛里克等人。 39 t分子多樣性料中，大化合物基因庫刊如從胜狀、寡核賊類、碳慨合物減/或合成的有機分子中，使用生物、料及/或化學方法來合成。在發展分子多樣性封策中的_參數包括次單元多樣性、分子尺寸及基因庫多樣性° _選此基因庫的共同目標為使驗合選擇的序列應用以獲得對想要的標的具高親和力之配位基ϋ後利用隨機或直接設計策略來最佳化引導分子。分子多樣性的方法則由毛里克等人詳細地描述，同前所述。例如’毛里克等人亦揭示出直接設計的方法，其為使用者可直接從適當選擇的片段之#絲因庫來創造新賴分子的方法；隨機設計的方法，其為使用者可使用基因或其匕廣舁法來隨意地突變片段及其組合，同時應用選擇標準來怦估候選配位基的適合性；及以網柵為基礎的方法，其為使用者可計算在三維接受器結構及小片段探針間之交互作用的能量，接著將適合的探針場址連結在一起。根據本發明’乙醯乳酸合成酶可源自於任何破囊壺菌目微生物’特別地，源自於任何裂壺菌屬微生物。在一個具體實施例中’本發明之較佳的乙醯乳酸合成酶具有選自於序列辨識編號：15、序列辨識編號：19、序列辨識編號： 22、序列辨識編號：24群組之胺基酸序列》該具有由序列辨識編號：15表示之胺基酸序列的蛋白質為一種從破囊壺菌目微生物來之天然發生（即野生型）的乙醯乳酸合成酶，特別地，為一種裂壺菌屬乙醯乳酸合成酶。由序列辨識编號： 19、序列辨識編號：22、序列辨識編號：24表示之胺基酸 40 1377253 序列為已改性之序列(如與天然發生的由胺基酸序列序列辨識編號·· 15表示之蛋白質比較），如此產生的酵素已減低對續酿脲化合_、味”難_咖及氧基苯甲酸喊咬醋類的敏感度。應注意的是由序列辨識編號：19、序列辨識編號：22及相_編號：24表示之蛋㈣具有乙酿乳酸合成酶生物活性。對伽脲化合物類、料_種類抑制劑及氧基苯甲酸旨類具有減低敏感度的乙酿乳酸合成酶為本發明較佳的乙酿乳酸合成酶，因為㈣此合成

酶的核酸序列可使用在本發明之重组型載體巾作為選擇標記。

因此’本發明的-個具體實施例係關於一種改性的乙醯乳酸合成酶，其包括任何序列辨識編號：15、序列辨識編號：19、序列辨識編號：22及序列辨識編號：24之任何同源化合物，其中該同源化合物具有乙醯乳酸合成酶生物活性’特別地，其中該同源化合物對磺醯脲化合物類、咪嗅·#酮種類抑制劑及氧基苯甲酸嘧啶酯類具有減低的敏感度’如與天然發生的由胺基酸序列序列辨識編號：15表示之蛋白質比較。在一個觀點中，此乙醯乳酸合成酶同源化合物包括具有胺基酸序列不同於序列辨識編號：15之蛋白質’其可藉由在下列一個或多個位置處刪除、嵌入或取代一胺基酸：116G、117A、192P、200A、251K、358M、383D、 592V、595W或599F。這些位置與在酵母菌乙醯乳酸合成酶中熟知的ALS突變場址相符合（即，各別地為116G、117A、 192P、200A、251K、354M、379D、583V、586W及590F)(參 41 1377253 見馬曰爾（Mazur)及法扣（Falco)，1989，Λβν·户/⑽/ Ρ/α«ίΜο人所〇/· 40 : 441-470，其全文以參考之方式併於本文）。其它可能的突變場址已在技藝中熟知，而為根據從其它生物在ALS中成功地胺基酸突變的那些。將此些場址應用在破囊壺菌目ALS中相符合的場址則亦包含在本發明中β 如上述所討論，本發明部分基於破囊壺菌微生物轉形用之重組架構體的發現與製造。因此，本發明的一個具體實施例係關於一種分離的核酸分子，其包含一種編碼破囊壺菌目乙醢乳酸合成酶的核酸序列及其完全互補的核酸序列。編碼本發明之乙醯乳酸合成酶的核酸分子包括—種編碼任何上述討論之乙醯乳酸合成酶蛋白質（包括同源化合物）的核酸分子。更特別地是，本發明的一個具體實施例係關於一種包含編碼一蛋白質的核酸序列之分離的核酸分子’其中該蛋白質具有的胺基酸序列與選自於序列辨識編號.15、序列辨識編號：19、序列辨識編號：22、序列辨識編號：24群組之胺基酸序列有至少約65%相同，且超過此些序列的任何一種至少約600個胺基酸，其中該蛋白質為一種乙醜乳酸合成酶（即，具有乙醯乳酸合成酶生物活性）。更佳地’耒發明之分離的核酸分子具有编碼與序列辨識編號’ 15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24任何一種至少約70%相同的胺基酸序列之核酸序列’更佳地至少約75%相同，甚至更佳地至少約8〇q/〇相同甚至更佳地至少約85%相同，甚至更佳地至少約9〇〇/〇相 42 1377253 同，甚至更佳地至少約95%相同，甚至更佳地至少約96¾相同，甚至更佳地至少約97%相同，甚至更佳地至少約98%相 • 同及甚至更佳地至少約99%相同，且超過序列辨識編號： . 15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24任何一種至少約600個胺基酸，其中該蛋白質具有乙醯乳酸合成酶生物活性。在另一個具體實施例中，本發明之分離的核酸分子具有編碼與選自於序列辨識編號：15、序列辨識編號：19、 • 序列辨識編號·· 22、序列辨識編號：24群組之胺基酸序列至少約75%相同的胺基酸序列之核酸序列，且超過此些序列任何一種至少95個胺基酸，其中該蛋白質為一種乙醯乳酸合成酶(即’具有乙醯乳酸合成酶生物活性更佳地，本發明之分離的核酸分子具有編碼與序列辨識編號·· 15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24 任何一種至少約80%相同的胺基酸序列之核酸序列，甚至更佳地至少約85%相同，甚至更佳地至少約9〇%相同，甚至 ^ 更佳地至少約95%相同’甚至更佳地至少約96%相同，甚至更佳地至少約97%相同，甚至更佳地至少約98%相同及甚至更佳地至少約99%相同’且超過序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨識編號：24任何一種至少95個胺基酸，其中該蛋白質具有乙醯乳酸合成酶生物活性。在更另一個具體實施例中，本發明之分離的核酸分子具有編碼與序列辨識編號：15、序列辨識編號：19、序列 43 辨識編號：22或序列㈣編號·· 24任何-種具有任何上述參考的百分比相同性之胺基酸序列的核酸序列且超過序列辨識編號：15、序列辨識編號：19、序列辨識編號：22 或序列辨識編號：24任何-種至少丨_絲酸更佳地 125 ’更佳地15〇，更佳地175，更佳地細，更佳地225，更佳地250 ’更佳地275，更佳地_ ,更佳地仍，更佳地別，更佳地375 ’更佳地彻，更佳地425，更佳地，更佳地

475，更佳地500 ’更佳地525 ’更佳地55〇，更佳地π個胺基酸，其中該蛋白質具有乙酿乳酸合成酶生物活性。相同百分比可使用如上所述之BLAST 2.0基本BLAST預設參數來測量。

在一個具體實施例中，編碼本發明之乙醯乳酸合成酶的核酸分子包括可在中度嚴苛的條件下與編碼天然發生的乙醯乳酸合成酶之核酸序列補體雜交之分離的核酸分子’ 甚至更佳地在高度嚴苛的條件下，甚至更佳地在非常高度嚴苛的條件下。較佳地’編碼本發明的乙醯乳酸合成酶之分離的核酸分子包含一核酸序列，其可在中度或高度嚴苛的條件下與編碼包含由序列辨識編號：15、序列辨識編號： 19、序列辨識編號：22或序列辨識編號：24表示之胺基酸序列的蛋白質核酸序列補體雜交。在一個具體實施例中，該分離的核酸分子包含一核酸序列，其可在中度、高度或非常高度嚴苛的條件下與由序列辨識編號：14之核苷酸 1260-3314、序列辨識編號：18之核苷酸1260-3314、序列辨識編號：21之核苷酸U60-3314或序列辨識編號：23之核苷 44 1377253 酸1260-3314表示之核酸序列補體雜交。如於本文中所使用，雜交條件指為一種標準的雜交條 • 件，在此之下核酸分子可使用來鑑別類似的核酸分子。此標準條件例如揭示在山姆布魯克(Sambrook)等人，分子選殖(A/o/ecw/izr CVcw'wg).實驗室手冊⑽〇/)，冷泉哈伯實驗室出版社(Cold Spring Harbor Labs Press)， 1989 ’山姆布魯克等人，同前所述，其全文以參考之方式併入本文(特別地參見第9.31-9.62頁）。此外，計算適當的雜 φ 交及清洗條件以獲得核苔酸的錯誤配對之變化程度在准許範圍的雜交之式子則揭示在，例如，門寇斯(Meinkoth)等人，1984，价ocAew. 138 ’ 267-284 ;門寇斯等人，同前所述’其全文以參考之方式併入本文。更特別地是，中度嚴苛的雜交及洗滌條件(如於本文指出）指為可分離出具有與在雜交反應中使用來探測的核酸分子之核酸序列至少約70%相同的核酸分子之條件（即，該條件准許約30%或較少的核苷酸錯誤配對）。高度嚴苛的雜 ® 交及洗滌條件（如於本文指出）指為可分離具有與在雜交反應中使用來探測的核酸分子之核酸序列至少約80%相同的核酸分子之條件（即，該條件可准許約20%或較少的核普酸錯誤配對）。非常高度嚴苛的雜交及洗滌條件(如於本文指出）指為可分離具有與在雜交反應中使用來探測的核酸分子之核酸序列至少約90%相同的核酸分子之條件（即，該條件准許約10%或較少的核苷酸錯誤配對”如上述所討論，熟知技藝之人士可使用在門寇斯等人（同前所述）中的式子來計 45 1377253 算適當的雜交及清洗條件，以獲得這些特別的核苷酸錯誤配對程度。此些條件將依欲形成的DNA: RNA或DNA: DNA 混雜體(hybrids)而變化。經計算的DNA : DNA混雜體之熔化溫度比DNA: RNA混雜體少10EC。在特別的具體實施例中，DNA : DNA混雜體的嚴苛雜交條件包括在沾ssc(〇 9M Na+)的離子強度下，在約20EC至約35£(：間之溫度（較不嚴苛) 中雜交’更佳地，在約28EC至約40EC間（更嚴苛），甚至更佳地，在約35EC至約45EC間（甚至更嚴苛），且具適當的清洗條件。在特別的具體實施例中，DNA : RNA混雜體的嚴苛雜交條件包括在6X SSC(0.9M Na+)的離子強度下，在約

30EC至約45EC間之溫度中雜交，更佳地，在約38EC至約 50EC間’甚至更佳地在約45ec至約55EC間，以類似嚴苛的清洗條件。這些值根據大於約1〇〇個核苷酸之分子、〇%曱醯胺及約40%的G+C含量的熔化溫度來計算。此外，Tm可如山姆布魯克等人（前述，第9.31至9.62頁）所提經驗地計算。通常地，清洗條件應該儘可能地嚴苛，且應該適當地選擇雜交條件。例如，雜交條件可包括鹽與溫度條件（其低於特別的混雜體經計算的]^約20-25EC)之組合；及清洗條件典型地包括鹽與溫度條件（其低於特別的混雜體經計算的1\„約12-20EC)之組合。合適使用於DNA : DNA混雜體的雜交條件實例包括在6X SSC(50%甲醯胺）中，在約42EC下雜父2-24小時；接著為洗蘇步驟，其包括在室溫下於約2χ SSC中洗務一次或多次；接著為在較高的溫度及較低的離子強度下額外的洗蘇(例如，在約〇 1χ_〇 5X SSC中，於約37EC 46 1377253 下清洗至少一次，接著在約01χ_0 5χ SSC中，於約68EC下清洗至少一次）。在另一個具體實施例中，編碼本發明之乙醯乳酸合成 • 酶的核酸分子包括一分離的核酸分子，其具有編碼含一胺基酸序列之蛋白質的核酸序列，其中該胺基酸序列包含序列辨識編號：15、序列辨識編號：19、序列辨識編號：22 或序列辨識編號：24任何一種至少3〇個連續的胺基酸殘基 (即，30個連續胺基酸與序列辨識編號：15、序列辨識編號： # 19、序列辨識編號：22或序列辨識編號：24任何一種的30 個連續胺基酸殘基具有100%相同）。在一個較佳的具體實施例中，該分離的核酸分子包含一編碼具有一胺基酸序列之蛋白質的核酸序列，該胺基酸序列包含序列辨識編號：15、序列辨識編號：19、序列辨識編號：22或序列辨識編號： 24任何一種的至少50個連續胺基酸殘基，更佳地至少75，更佳地至少100，更佳地至少115，更佳地至少no ,更佳地至少150，更佳地至少200，更佳地至少250，更佳地至少 ® 300，更佳地至少350，更佳地至少400，更佳地至少450，更佳地至少500，更佳地至少550，更佳地至少600及更佳地至少650。此蛋白質具有乙醯乳酸合成酶生物活性。在一個具體實施例中，該編碼乙醯乳酸合成酶之分離的核酸分子包含一核酸序列，其具有序列辨識編號：15之核苷酸 1260-3314、序列辨識編號：18之核苷酸1260-3314、序列辨識編號：21之核苷酸1260-3314或序列辨識編號·· 23之核苷酸1260-3314的連續核苷酸至少60個連續的核苷酸，更佳地 47 1377253 至少150，更佳地至少225，更佳地至少3〇〇，更佳地至少 345，更佳地至少390，更佳地至少450，更佳地至少525，更佳地至少600，更佳地至少75〇，更佳地至少9〇〇，更佳地至少1050，更佳地至少12〇〇 ,更佳地至少135〇，更佳地至少1500，更佳地至少1650 ,更佳地至少18〇〇及甚至更佳地 . 至少1950。本發明之特別佳的核酸分子包含序列辨識編號：14之核苷酸類1260-3314(其編碼序列辨識編號：15)、序列辨識編號·· 18之核苷酸類1260-3314(其編碼序列辨識編號：19)、序列辨識編號：21之核苷酸1260-3314(其編碼序列辨識編 ® 號：22)或序列辨識編號：23之核苷酸1260-3314(其編碼序列辨識編號：24)、序列辨識編號：14、序列辨識編號：18、序列辨識編號：21或序列辨識編號：23。根據本發明’ §玄分離的核酸分子為一種已從其天然環境移出（即，其已接受人類操作）的核酸分子，該天然環境為發現該天然核酸分子的基因組或染色體。就其本身而論， “分離的，，不必反映出該核酸分子已純化的程度，而是顯示 0 出該分子不包括全部的基因組或全部的染色體（於此發現天然核酸分子）。分離的核酸分子可包含一基因，諸如於本文描述的乙醯乳酸合成酶基因。包含一基因之分離的核酸分子不為包含此基因的染色體片段，而是包括與基因有關的譯碼區域及調節區域，但是在相同的染色體上並無天然發現的其它基因。分離的核酸分子亦可包括一位於旁側之額外核酸（即，在序列的5’及/或3’末端）之特定核酸序列 48 1377253 (即’為異種序列），其中該額外的核酸在天然中正常地不會位於該特定核酸序列之旁側。分離的核酸分子可包括 DNA、RNA(例如，mRNA)、或DNA或RNA之衍生物（例如， cDNA)。雖然措辭“核酸分子”主要指為生理的核酸分子及措辭“核酸序列”主要指為在核酸分子上的核苷酸序列，二措辭可交替地使用，特別是關於能編碼一蛋白質的核酸分子或核酸序列。較佳地，本發明之分離的核酸分子可使用重組DNA技術(例如，聚合酶連鎖反應(PCR)放大、選殖）或化學合成來製造。分離的核酸分子包括天然的核酸分子及其同源化合物，包括（但是非為限制）天然的對等基因變異及核苷酸已以此方法嵌入、刪除、取代及/或轉化之經改性的核酸分子，此改性可在蛋白質生物活性上提供想要的效應。對等基因變異及蛋白質同源化合物（例如，可由核酸同源化合物編碼的蛋白質）已在上述詳細地討論。核酸分子同源化合物可由熟知此技藝之人士使用一些方法來製造（參見，例如，山姆布魯克等人，同前所述）。例如，核酸分子可使用多種技術來改性包括（但是非為限制）傳統的致突變技術及重組DNA技術，諸如定點突變、核酸分子的化學處理以引發突變、核酸片段的限制酵素切割、核酸片段的連接、核酸序列的選擇區域之pCR放大及/或致大變'养核甘酸混合物之合成及連接混合物群組以“建立核酸分子之”混合物及其組合。核酸分子同源化合物可藉由該核酸及/或藉由與野生型基因雜交而編碼的蛋白質之功能 49 來篩選，而選自於—經改性的核酸之混合物β 類似地，本發明之核酸分子的最小尺寸為足以編碼具有想要的生物活性之蛋白質的尺寸，或足以形成探針或^ 與編敬《自質_时子之_序_成穩定的^ 體之寡核$酸引子(例如’在中度、高度或非常高度嚴苛的條件下）。就其本身而論，編碼此蛋白質之核酸分子尺4可視在核酸分子與補體序列間之核酸組合物及百分比同源或相同性，和本身的雜交條件(例如，溫度、鹽濃度及甲醯胺濃度）而定。使用作為寡核苷酸引子或作為探針的核酸分子之最小尺寸典型地長度至少約12至約15個核苷酸（若該核酸分子富含GC)，及長度至少約15至約18個鹼基(若它們富 3 AT)。除了實際的限制外’在本發明之核酸分子的最大尺寸上並無限制，該核酸分子可包含部分能編碼蛋白質的序歹J (例如’編碼乙酿乳酸合成酶的序列）或編碼全長蛋白質的核酸序列。本發明的一個具體實施例包括一種使用來轉形破囊壺菌目微生物之重組型載體。根據本發明，重組型載體為一種經設計的（即’人工製造)核酸分子，其可使用作為一種用來操作核酸序列之選擇及用來將此核酸序列引進宿主細胞的工具。因此，該重組型載體合適使用於選殖、定序及/或操作核酸序列之選擇’諸如可藉由將該選擇的核酸序列表現及/或傳遞進入宿主細胞以形成一重組細胞。此一載體典型地包括異種核酸序列，其經發現不天然地毗連至欲傳送的核酸序列的核酸序列，雖然該載體亦可包括控制的核酸 50 1377253 序列(例如’啟動子、未轉㈣區域）’其經發現㈣地础連至本發明的核酸分子（詳細地在下列討論)。該載體可為RNA 或dna(原核生物的或真核生物的），典型地為質體。誃載 • 體可維持為染色體外的元素(例如，質體）或其可併入重組型微生物的染色體。全部的載體可適當地保持在宿主細胞中’或在某些條件下，該質體DNA可刪除、留下本發明的核酸分子。經合併的核酸分子可由染色體啟動子控制、由天然或質體啟動子控制或由數種啟動子控制之組合。核酸鲁分子的單一或多重複製可併入染色體。本發明之重組型載體包括至少一種可用於根據本發明之破囊壺菌目微生物的選擇標記，諸如编碼破囊壺菌目乙醯乳酸合成梅(天然蛋白質或同源化合物）之核酸序列或編碼6&基因的核酸序列（描述在下列）。如於本文中所使用，措辭“重組型核酸分子”主要用來指為一種重組型載體，其已連接至欲選殖、操作、轉形進入宿主細胞（即，嵌入）的核酸序列。典型地，重組型載體（因此重組型核酸分子）包括至少一 • 種本發明之核酸分子，其操作地連結至一種或多種轉錄控制序列。如於本文中所使用，措辭“重組分子”或“重組型核酸分子，，主要地指為一種操作地連結至一轉錄控制序列的核酸分子或核酸序列，但是可與措辭“核酸分子”交替地使用，當此核酸分子為一種如於本文討論的重組分子時。根據本發明，措辭“操作地連結，’指為以一種將該核酸分子連結至一轉錄控制序列上之方法’如此當分子轉移（即’轉形、轉導(transduced)、轉移、結合或導入)進入宿主細胞時 51 1377253 能夠表現。轉錄控制序列為可控制轉錄的起始、延長或終止之序列。特別重要的轉錄控制序列為可控制轉錄起始的那些，諸如啟動子、增強子、操作子及抑制子序列。合適 · 的轉錄控制序列包括任何可在破囊壺菌目微生物中作用的轉錄控制序列。本發明家相信首先要分離及鑑別至少三種此類啟動子，其詳細地描述於本文別處。較佳的啟動子包括（但是非為限制）破囊壺菌目乙醯乳酸合成酶啟動子（於本文由序列辨識編號：14之核苷酸 1-1259表示）、破囊壺菌目α-微管蛋白啟動子(於本文由序列鲁辨識編號：9之核苷酸441-894表示）、從破囊壺菌目聚乙醯合成酶(PKS)系統來之啟動子（包含在序列辨識編號：34中）及破囊壺菌目脂肪酸去飽和酶啟動子（包括在序列辨識編號：31中；應注意的是脂肪酸去飽和酶啟動子在美國臨時專利申請系列案號60/284，116中（前述)指為去飽和酶啟動子）。α-微管蛋白啟動子、乙醯乳酸合成酶啟動子及脂肪酸去飽和酶啟動子之選殖及定序則描述在實例部分。在一個較佳的具體實施例中，該α-微管蛋白啟動子包含天然發生修的破囊壺菌目α-微管蛋白啟動子序列（序列辨識編號：9之核苷酸類441-894)，或一與序列辨識編號：9之核苷酸441-894 至少95%相同的核酸序列，其中該啟動子具有至少基本的α_ 微管蛋白啟動子轉錄活性。類似地，較佳的乙醯乳酸合成酶啟動子包含一天然發生的破囊壺菌目乙醯乳酸合成酶啟動子之核酸序列（表現在序列辨識編號：14之核苷酸卜1259 中）’或一與序列辨識編號：14之核苷酸1-1259至少75¾相 52 1377253 同的核酸㈣，更佳地，更佳地85%，更佳地·及更佳地95%，其中該啟動子具至少基本的乙驢乳酸合成酶啟 . 動子轉錄活性。較佳的PKS啟動子包含一天然發生的破囊 • 纟菌目PKS啟動子之核酸序列（表現在序列辨識編號：34 t)，或一與序列辨識編號：34至少75%相同的核酸序列，更佳地80% ’更佳地85%，更佳地90%及更佳地95%，其中該啟動子具至少基本的PKS啟動子轉錄活性。最後地，較佳的脂肪睃去飽和酶啟動子包含一天然發生的破囊壺菌目 • 脂肪酸去飽和酶啟動子之核酸序列（表現在序列辨識編號：31中）’或包含在與序列辨識編號·· 31至少75%相同的核酸序列令，更佳地80%，更佳地85%，更佳地9〇%及更佳地95% ’其中該啟動子具至少基本的脂肪酸去飽和酶啟動子轉錄活性°用來測定相同百分比的方法已先前地描述於本文的乙醯乳酸合成酶序列，且包含於本文。在一個具體實施例中，本發明之重組型載體為一種表現載體。如於本文中使用，措辭“表現載體，，習慣上指為一 ® 種合適用來製造編碼產物(例如，有興趣的蛋白質）之載體。在此具體實施例中，編碼欲製造的產物之核酸序列嵌入該重組型載體以產生一重組型核酸分子。該編碼欲製造的蛋白質之核酸序列以操作地連結該核酸序列至載體(例如，本發明之破囊壺菌目啟動子）中的控制序列之方法嵌入載體’其可在重組型微生物中轉錄及轉譯該核酸序列。本發明之選擇標記可選擇一已成功地引進本發明之重組型核酸分子的重組型微生物。 53 1377253 在另一個具體實施例中，本發明之重組型載體為一種致標載體。如於本文令使用’措辭“致標載體”習慣上指為一種使用來將特別的核酸分子傳送進入重組細胞之載體， ' 其中該核酸分子使用來刪除或失活化在宿主細胞中的内生 . 基因（即，使用於標的基因分裂或剔除的技術）。此載體亦可在技藝中熟知為“剔除”載體。在此具體實施例的一個觀點中，部分載體(但是更典型地’核酸分子嵌入載體（即，嵌入)）具有一與宿主細胞中之標的基因的核酸序列同源之核酸序列（即，其目標為刪除或失活化之基因）。該載體嵌入之核酸 φ 序列可設計成結合至該標的基因，如此該標的基因及該嵌入進行同源重組’藉此該内生標的基因會刪除、失活化或減弱（即，至少部分内生標的基因會突變或刪除）。在一個具體實施例中，本發明的較佳重組型載體為一種合適用於破囊壺菌目微生物之重組型載體，及其包括一種編碼本發明之乙醯乳酸合成酶分子的核酸序列。較佳地，該乙醯乳酸合成酶與天然發生形式(序列辨識編號：15) 比較地改性’如此該合成酶可授予已以重組型載體轉移的 · 破囊壺菌目微生物對磺醯脲化合物類、咪唑啉酮種類抑制劑及/或氧基苯甲酸嘧啶酯類具有減低的敏感度。較佳地，此重組型載體包含一編碼包含不同於序列辨識编號：15胺基酸序列的乙醯乳酸合成酶蛋白質之核酸序列，其可藉由在下列一個或多個位置處刪除、嵌入或取代一胺基酸： 116G、117A、192P、200A、251K、358M、383D、592V、 595W或599F»在一個具體實施例中，此乙醯乳酸合成酶蛋 54 I3?7253 白質具有一胺基酸序列，其包括(但是非為限制）：序列辨識编號：19、序列辨識編號：22及序列辨識編號：24。較佳地’此重組型載體包含一選自於下列之核酸序列：序列辨識編號：18之核苔酸1260-3314、序列辨識編號：21之核答酸1260-3314及序列辨識編號：23之核苷酸1260-3314。在一個特別佳的具體實施例中，包含ALS-譯碼核酸序列（其可授予想要的抵抗)之重組型載體包括序列辨識編號：18、序列辨識編號：21及序列辨識編號：23。在一個具體實施例中，合適用來授予已以重組型載體轉移的破囊壺菌目微生物對磺醯脲化合物類、味哇琳酮種類抑制劑及/或氧基本甲酸啦。定g旨類具有減低的敏感度之重組型載體包含序列辨識編號：15，其為天然發生的裂壺菌屬乙醯乳酸合成酶序列。在此具體實施例中，該重組变載體設計成可過度表現天然發生的合成酶，藉此過度表現性授予微生物具有抵抗特定化合物之效應。在此具體實施例中，需由熟知此技藝之人士了解的是使用重組DNA技術可改善該經轉形的核酸分子之表現性控制，例如可藉由操作在宿主細胞中的核酸分子之複製數目、那些核酸分子的轉錄效率、所產生的轉錄之轉譯效率及後轉譯改性效率。額外地，啟動子序列可基因地設計以改善可與天然啟動子比較的表現程度。可有用地用來控制核酸分子表現性的重組技術包括（但是非為限制）將核酸分子接合進入一個或多個宿主細胞的染色體、將裁體穩定序列加入至質體、轉錄控制訊號的取代或改性(例如，啟動子、操作子、增強子）、 55 1377253 轉譯控制訊號的取代或改性（例如’核糖體結合場址、閃_ 達卡諾(Shine-Dalgarno)序列）、改性該核酸分子以與宿主細胞使用的密碼子相符合、及刪除使轉錄不安定化的序列。在本發明的一個具體實施例中，合適使用於破囊壺菌目微生物轉形的重組型載體包括將從印度斯坦鏈異壁菌來的Sh 6/e基因（其編碼“博菜徽素·結合蛋白質，，)作為選擇標記’而與先前於本文描述之破囊壺菌目啟動子組合。一包含We基因及破囊壺菌目啟動子的較佳重組型載體包括，例如’由序列辨識編號：8或9表示之載體序列。印度斯坦鏈異壁菌博菜黴素結合蛋白質之胺基酸序列於本文可表示為序列辨識編號：10。本發明之重組型核酸分子（其可為〇]^八或11]^八)亦可包括額外的控制序列，諸如轉譯控制序列、複製起始點及其匕可與重組細胞相容的控制序列。在一個具體實施例中，本發明的重組分子（包括接合至宿主細胞染色體的那些）亦包括为/必訊號（即’訊號部分核酸序列），以使表現的蛋白質旎夠從產生蛋白質的細胞中分泌出。合適的訊號部分包括天然地與欲表現的蛋白質聯結之訊號部分，或任何能引導分泌根據本發明之蛋白質的異種訊號部分。在另一個具體實施例中，本發明之重組分子包含一領導序列（leader sequence)以使表現的蛋白質能夠傳送至及嵌入宿主細胞薄膜。合適的領導序列包括天然地與蛋白質聯結的領導序列，或任何能引導蛋白質傳遞及嵌入至細胞薄膜的異種領導序列。 56 1377253 可有用地用於破囊壺菌目微生物轉形之不同工具已描述，本發明之一個具體實施例係關於一種破囊壺菌目微生物細胞的轉形方法β該方法包括第一步驟：（a)將先前於本文描述的重組型核酸分子引進破囊壺菌目微生物細胞。該重組型核酸分子包含一編碼乙醯乳酸合成酶的核酸序列，其可授予該些細胞對選自於由下列所組成之群的化合物具有減低的敏感度：續酿服化合物類'咪唑琳酮種類抑制劑及氧基苯f酸嘧啶酯類。此乙醯乳酸合成誨已在上述詳細

地描述，且包括具有由序列辨識編號：19、序列辨識編號： 22及序列辨識編號：24表示之胺基酸序列的乙酿乳酸合成酶和此些序列的任何一種’或如上述討論的序列辨識編號：15之同源化合物。言亥方法包括第二步锦：（b)選擇已成

功地經重組型核酸分子轉形的細胞，其可知將_細胞培養在包含至少-種可抑制未轉形的細胞之化合物的培養基十，該化合物可選自所組叙群：輯脈化合物、喃料酮種類抑制劑及氧絲曱酸。可於此類化合物存在下生長之細胞已成功地轉形。於太η 4,㈣㈣分子包含任料前描述本發明的重組型載體’及典型地包括至少一種編 :欲由重組細胞製造之蛋白質的核 =酸序_組細胞中内生基因之標的刪除或失活化有用的核酸序列（即，包含—重組的致標栽體）。 :-個具體實施例中，該重組型一種編碼欲“胞製造的蛋白#之顧 57 1377253 蛋白質之核酸序列操作地連結至一轉錄控制序列。想要在破囊壺菌目中製造的蛋白質已由熟知此技藝之人士所熟知’及全部意欲包含在本發明中。特別佳的蛋白質包括(但 . 是非為限制）與選自於由下列所組成之群的脂肪酸之合成有關的蛋白質：廿二碳六烯酸（DHA)、廿二碳五烯酸 (DPA)、廿十碳五稀酸(EPA)及arachadonic酸(ARA)。此類蛋白質包括’例如，脂肪酸合成酶、脂肪酸去飽和酶、脂肪酸鏈加長酶、與聚乙醯合成酶複合體有關的蛋白質及與將脂肪酸併入碗脂類或甘油三酯分子有關之蛋白質。在一個鲁觀點中’該蛋白質為一種(〇-3脂肪酸去飽和酶·，其可由核酸序列序列辨識編號：29編碼。序列辨識編號：3〇代表去飽和酶的胺基酸序列。在另一個觀點中，該蛋白質為一多稀脂肪酸異構酶。在一個具體實施例中，可使用本方法在破囊壺菌目微生物中製造的蛋白質包含與類異戊二烯生物合成途徑有關的蛋白質。此類蛋白質包括（但是非為限制)HMG-CoA合成酶、HMG-CoA還原酶、鯊烯合成酶、八氫番莊紅素合成酶、八氫番蘇紅素去飽和酶、類胡蘿蔔素環化酶、類胡蘿蔔素羥化酶、類胡蘿蔔素酮酶。在更另一個具體實施例中，可使用本方法在破囊壺菌目微生物中製造的蛋白質包括（但是非為限制）維他命E及硫辛酸。在一個具體實施例中，於本發明之方法中有用的重組型核酸分子包括一可與微生物中的標的核酸序列雜交之核酸序列，如此包含該標的核酸序列的基因可藉由同源重組與第二核酸序列突變或失活化。此一核酸序列可與能編碼

S 58 類a因：Γ飽和脂肪酸合成途徑之酵素類(或可調節此的= 核酸類)的基因、能編碼與降低其它有用 2_目微生物製造之化合物或減少想要的化合物 1貝值有關的蛋白質之基因'或能塢碼與复八有興趣的分子競爭該些化合物之合成有_蛋自質

例如，該標的核酸序列包雖是非為限制)編碼麟刀解酶類、脂贿氧化酶類、與碳水化合物類合成有關的蛋白質、與類異戊二烯途徑產物合成有關的蛋白質與細胞壁組分合成㈣的蛋白質、與飽和脂㈣合成途徑有關的蛋白質、與多元不飽和脂肪酸合成途徑有關的蛋白質、與聚乙醯合成酶複合體有關的蛋白質及與將脂肪酸併入填脂類或甘油三酯分子有關的蛋白質之序列。

在本發明的一個具體實施例中，用於破囊壺菌目微生物轉形之方法包括將至少一種具有編螞欲表現的蛋白質之核酸序列的額外重組型核酸分子引進細胞的步驟，該核酸序列操作地連結至一轉錄控制序列。此外，該額外的重組型核酸分子可包括能與微生物中之標的核酸序列雜交的第二核酸序列，如此包含該標的核酸序列的基因可藉由同源重組與第二核酸序列突變或失活化。在此方法中，可將多重蛋白質引進細胞，可使多重基因失活化，或可為二種之組合。可將額外的重組型核酸分子同時地(即，共轉形)與第一重組型核酸分子引進破囊壺菌目微生物，或以連續轉形的方式（例如；用於“交疊（stacking)”特性之目的）。在一個具體實施例中，該方法進一步包括將至少一種 59 1377253 具有编碼博菜黴素-結合蛋白質的核酸序列之額外的重組型核酸分子引進細胞的步驟。在此具體實施例中，該額外的重組型核酸分子較佳地以連續步驟引進，而非共轉形。較佳地，該包含編碼博菜黴素_結合蛋白質的核酸序列之重組型核酸分子進步包含一種編碼欲由細胞表現的第二蛋白質之核酸序列，其中該編碼第二蛋白質的核酸序列操作地連結至一轉錄控制序列。再者（或此外），該包含編碼博菜黴素-結合蛋白質的核酸序列之重組型核酸分子進一步包含一種可與微生物中之標的核酸序列雜交的第二核酸序列，如此包含該標的核酸序列之基因可利用同源重組與第二核酸序列突變或失活化《在一個具體實施例中，此重組型核酸分子包含一核酸序列序列辨識編號：9。合適於使用本發明之方法來轉形的宿主細胞包括（但是非為限制）任何破囊壺菌目微生物。該宿主細胞可為未轉形的細胞或已以至少一種核酸分子轉移的細胞。可使用於本發明的較佳宿主細胞包括下列屬的微生物（但是非為限制）：破囊壺菌屬、類網菌屬、曰本壺菌屬及裂壺菌屬。在這些屬中，較佳的物種包括(但是非為限制）：任何裂壺菌屬物種，包括叢狀裂壺菌、軟體裂壺菌屬、微小裂壺菌屬；任何破囊壺菌屬物種（包括先前的優肯菌物種諸如t/.維斯兒均（Wswr容ewjzi)、ί/.阿米巴（awodo!·而）、t/.薩卡瑞那 (sarkariana)、U.普分遠(Profunda)、U.籍射狀(radiata)、 C/.微小(mzwwia)及優肯菌印.BP-5601) ’及包括紋狀破囊壺菌、黃金破囊壺菌、粉紅破囊壺菌；及任何曰本壺菌屬物 % 60 1377253 種。特別佳的破囊壺菌目菌株包括(但是非為限制）：裂壺菌 (S31) (ATCC20888);裂壺菌（S8) (ATCC20889);裂壺菌 ' (LC-RM) (ATCC18915);裂壺菌（SR21);叢狀裂壺菌 - (Goldstein et Belsky) (ATCC28209);軟體裂壺菌屬（Honda et Yokochi) (IF032693);破囊壺菌（23B)(ATCC20891);紋 - 狀破囊壺菌（Schneider) (ATCC24473);黃金破囊壺菌 (Goldstein) (ATCC34304);粉紅破囊壺菌（Goldstein) (ATCC28210);及曰本壺菌（LI) (ATCC28207)。 • 根據本發明，名稱“轉形”習慣上指為任何將外源核酸分子（即，重組型核酸分子）嵌入微生物細胞（此破囊壺菌目微生物細胞）的方法《在微生物系統中，名稱“轉形’’使用來描述一種因微生物取得外源核酸之遺傳改變，而基本上與名稱“轉移”同義。合適的轉形技術包括(但是非為限制)粒子轟擊、電穿孔法、顯微注射法、微脂粒感染、吸附、感染及原生質體融合。在一個具體實施例中，欲使用本發明之方法製造的蛋 • 白質可在能有效產生蛋白質之條件下藉由培養能表現該蛋白質的細胞（即，重組的破囊壺菌目微生物）而製造。在某些例子中’該蛋白質可回收，及在其他中，該微生物可以整體或以溶成物形式收集及使用作為“生物量”。在另一個具體實施例中’標的基因可藉由在能有效地於細胞中重组之條件下培養且已以包含本發明之致標載體的重組分子轉形之細胞來刪除或失活化，而造成標的基因的刪除或失活化。較佳的培養細胞為本發明之重組細胞。有效的培養條 61 1377253 件包括(但是非為限制)有效的培養基、生物反應器、溫度、 pH及讓蛋自質製造威纽的氧狀態。有效的培養基指為任何破囊壺菌目細胞典型地培養在其中的培養基。=養基典型地包含—具有可同化的碳、氮及碟酸鹽來源之水性培養基，及適當的鹽類、礦物質、金屬及其它營養品（諸如維他命）。合it㈣養基及培養條件之實侧在實例部分詳細地討論。合適於破囊㈣目微生物之培養條件亦描述在美國專利案镜5,34()，742(觀年8月23日由巴克雷（B咖㈣發佈）’其全文以參考之方式併於本文。本發明之細胞可培養在習知的發酵生物反㈣、搖動燒瓶、試管、微滴盤及平淺培養皿t。該培養可在適合於重組細朗溫度、pH及氧含量下進行。此些培養條件為熟知技藝之人士的專門技術。依使用來製造的載體及宿主系統而定，本發明所產生的蛋白質可保持在重組細胞中、分泌進入發酵培養基中、分泌至二個細胞膜間之空間、或保留在細胞膜的外表面。措辭“回收蛋白質”指為收集含蛋白質的全部發酵培養基且不需額外的分離或純化步驟。由本發明之方法製造的蛋白質可使用多種標準蛋白質純化技術來純化，諸如（但是非為限制）親和色譜法、離子交換層析法、過濾法、電泳法、厭水交互層析法、凝膠過濾層析法、逆相層析法、刀豆素A 廣析法（concanavalin A chromatography)、色層焦集法 (chromatofocusing)及差分增溶作用（differential solubilization)。由本發明之方法製造的蛋白質較佳地以“實 62 1377253 質上純的”形式回收。如於本文中所使用“實質上純的，，指為其純度可讓該蛋白質有效地使用作為商業產品。本發明的更另一個具體實施例係關於一種破囊壺菌目 . 重組型微主物，其已以包含編碼本發明之乙醯乳酸合成酶的核酸序列之重組型核酸分子轉形。較佳地，該乙酿乳酸合成酶可授予微生物對選自於由下列所組成之群的化合物具有減低的敏感度：磺醯脲化合物類、咪唑啉酮種類抑制劑及氧基苯曱酸嘧啶酯類。合適使用於此一微生物之轉形鲁的重組型核酸分子及序列已在上述詳細地描述。此微生物可進一步以其它重組型核酸分子轉形，包括具基因選擇標記及破囊壺菌目轉錄控制序列的重組型核酸分子，如先前於本文描述。根據本發明之破囊壺菌目重組型微生物則描述在實例部分。根據本發明’本發明之重組的破囊壺菌目微生物可基因地設計’以使用在本文中描述的重組型載體來表現出有興趣的蛋白質（此些蛋白質實例已在上述討論），及/或可基因地設計以使用於本文中描述的重組型載體 • 來對標的基因目標地刪除或失活化。如於本文中所使用’重組型微生物具有已使用重組技術從其正常（即，野生型或天然發生）形式改性（即，突變或改變）的基因組。根據本發明之重組型微生物可包括一種已欲入、刪除或改性（即，突變，例如，藉由核苷酸之嵌入、刪除、取代及/或反轉）之核酸分子的微生物，以此方法該改性可在微生物中提供想要的效應。如於本文中所使用，造成在基因功能或在基因產物功能（即，由基因編碼的蛋白質） 63 1377253 中的基因表現減少之基因改性，可指為基因的失活化(完全或部分）、刪除、中斷、妨礙或向下調節。例如，在會造成由此基因編碼的蛋白質之功能減少的基因中之基因改性可為基因完全刪除（即’基因不存在，因此蛋白質不存在）；基因突變，其造成蛋白質不完整或無轉譯(例如，蛋白質不表現）；或基因突變，其會減少或徹底破壞蛋白質的天然功能 (例如，蛋白質的表現減少或無酵素活性或作用）的結果。可造成基因表現或功能增加的基因改性指為基因放大、過度產生、過度表現、活化、提尚、加入或向上調節。根據本發明，重組的破囊壺菌目微生物可使用任何破囊32鹵目微生物來製造。較佳的破囊壺菌目屬包括(但是非為限制）.破囊壺菌屬、類網菌屬、曰本壺菌屬及裂壺菌屬。在這些屬中，較佳的物種包括(但是非為限制）：任何裂壺菌屬物種’包括叢狀裂壺菌、軟體裂壺菌屬；任何破囊壺菌屬物種（包括任何先前的優肯菌物種，諸如υ·維斯兒均、 U..阿米巴、U.薩卡瑞那、U·普分達、υ·輻射狀、U.微小及優肯菌sp_ BP-5601)、紋狀破囊壺菌、黃金破囊壺菌、粉紅破囊壺菌；及任何日本壺菌屬物種。特別佳的破囊壺菌目.菌株包括（但是非為限制）：裂壺菌（S31) (ATCC20888);裂壺菌(S8) (ATCC20889);裂壺菌（LC_RM) (ATCC18915);裂壺菌（SR21);叢狀裂壺菌（Goldstein et

Belsky) (ATCC28209);軟體裂壺菌屬（Honda et Yokochi) (IFO. 32693);破囊壺菌（23B) (ATCC20891);紋狀破囊壺菌 (Schneider) (ATCC24473)，黃金破囊 gg 菌（Goldstein) 64 1377253 (ATCC34304);粉紅破囊壺菌（Goldstein) (ATCC28210);及曰本壺菌(11)(ATCC28207)。下列實例僅提供闡明目的而不意欲限制本發明之範圍。實例實例1 此實例說明重組質體pTUBZEOll-2之製造。重組質體pTUBZEOll-2的架構闡明在第1及2圖。此質體包括從印度斯坦鏈異壁菌來的办^基因其官能地耦合至分離自裂壺菌的α-微管蛋白基因啟動子。此質體可如下產生。將cDNA選殖物（CGNE0002-001-b6)從裂壺菌的cDNA 基因庫分離，且部分定序(序列辨識編號：1)，而作為大規模裂壺菌屬cDNA定序計劃的部分。核苷酸序列利用 BLASTX同源搜尋而決定以譯碼α-微管蛋白（季許(Gish)， W.及D. States. 1993，Genei. 3 : 266-272)。從鹼基 116 至550推衍來的胺基酸序列則93%相同於從帚狀沛維特菌 (Pe/vMca 基因銀行編號U58642)來的α-微管蛋白之第一 145個胺基酸。為了分離與此基因有關的啟動子，將基因組DNA從裂壺菌細胞分離，且使用“基因組瓦克（GenomeWalker)TM”工具箱（kit)(克隆科技實驗室有限公司（Clontech Laboratories， Inc.)，帕羅阿脫(Palo Alto)，CA)加工，其包括將基因組DNA 以限制核酸内切酶酵素地消化以產生平整末端（blunt end)，接著將該經消化的DNA連接至在工具箱中提供的特 65 1377253 定雙索DNA連接分子(adapter molecules)。然後，在α，微管蛋白譯碼序列的DNA上游使用於工具箱中提供的外部連接引子(API)及微管蛋白特定的引子PGR20(序列辨識編號： 2)，利用聚合酶連鎖反應（PCR)放大。該基因可使用在工具箱中提供的巢狀連接引子(AP2)及巢狀α-微管蛋白特定的引子PGR19(序列辨識編號：3)來進行進一步的放大。所產生的PCR產物次選殖進入質體PCR2.1-TOPO(因維戮郡公司，卡爾斯貝德，CA)。將所選殖的片段之一定序；立即地進行α-微管蛋白基因起始密碼子的725bp序列則提供為序列辨識編號：4。使用根據以此方法獲得的DNA序列之寡核苷酸引子，使用DNA聚合酶（博精（Perkin-Elmer)公司，諾沃克 (Norwalk)，CT)的PCR可使用來產生一經改性的α-微管蛋白啟動子區域，其中价〇1限制場址已併入DNA片段的3,末端；此場址包含一起始密碼子，其在α-微管蛋白譯碼區域中的相同位置處。在此反應中所使用的引子為 PGR33(序列辨識編號：5)及PGR34(序列辨識編號：6)，及該模板則分離自裂壺菌細胞的基因組DNA。使用下列反應條件：94EC 4分鐘；（94EC 1 分鐘、54EC 45秒、72EC 2分鐘）χ30 ; 72EC 7分鐘。將此片段選殖進入質體 PCR2.1-T0P0，以形成質體p7TUB(序列辨識編號：7)。以 Wcol消化質體p7TUB，且所產生的含裂壺菌屬α-微管蛋白啟動子區域之463-bp片段可利用瓊脂糖凝膠純化來分離。包含從印度斯坦鏈異壁菌來的、有SV40啟動子及終止子位 66 1377253 於旁側之We基因的質體pSV40/Zeo(因維戳郡公司，卡爾斯貝德，CA)亦以iVcoI消化，以產生3201-bp及314-bp片段。 3201-bp片段經環脂糖凝膠純化且連接至從"TUB來的 . 463-bp 片段，以產生pTUBZEO-ll(序列辨識編號：8)，描述在第1圖。其次，質體pTUBZEO-ΙΙ以消化，且將所產生的包含有裂壺菌屬α-微管蛋白啟動子及SV40終止子位於旁側之厶/e基因的1122-bp片段以瓊脂糖凝膠純化，並連接至質體籲 pUC19(美新(Messing) ’ J· 1983. 五似少则/. 1〇1 : 20)，其已利用以SpAI消化而線性化。所產生的質體命名為 pTUBZE011-2(序列辨識編號：9)，而描述在第2及4圖。質體pTUBZEOll-2亦指為ρΜΟΝ50000。在序列辨識編號：9 中，裂壺菌屬α-微管蛋白啟動子包括在核苷酸441-894中；厶/e基因譯碼區域包含在核苷酸895-1269中；及SV40終止子包括在核苷酸1270-1524中。實例2 φ 此實例說明重組質體PMON50200、pMON50201、 PMON50202及 pMON50203之製造。從裂壺菌來的天然乙醯乳酸合成酶-譯碼基因（ALS)可以下列方法分離。將cDNA選殖物(LIB81-028-Q1-E1-D9)從裂壺菌屬cDNA基因庫分離，且部分定序（序列辨識編號： 11)，以作為大規模裂壺菌cDNA定序計劃的部分。該核苷酸序列可利用BLASTX同源物決定以編碼乙醯乳酸合成酶；例如，從鹼基154至378推衍出的胺基酸序列與從裂殖 67 1377253 酵母菌（ScA&ojflcc/ia^Omyces 心)(基因銀行編號P36620) 來的ALS之胺基酸313至387有68%的相同度。然後可獲得此選殖的cDNA之全長序列，其指出該cDNA選殖物不包括全部的ALS譯碼區域。為了獲得全長的基因，使用標準規則以372-bp洋地黃素(digoxygenin)(DIG)-標定的DNA探針 (指為ALS2探針）來探測裂壺菌屬基因組基因庫（參見例如山姆布魯克等人，分子選殖：實驗室手冊。冷泉哈伯實驗室出版社，1989)。ALS2探針可經由PCR使用核苷酸混合物（其包括DIG-11-UTP(波新爵-曼漢生物化學（Boehringer Mannheim Biochemicfl/*?) GmbH，德國））、使用前置引子 PGR38(序列辨識編號：12)及反置引子PGR39(序列辨識編號：13)而產生，其以cDNA選殖物LIB81-028-Q-E1-D9序列為基準。可分離出一種以ALS2探針(標示為ALS-4A)鑑別的基因組選殖物，且進一步使用DIG-標定的ALS2探針利用南方雜交墨點法來標出特徵。從經乂WI-消化的ALS-4A • DNA來之4.9-kbp片段經發現可與ALS2探針雜交。此片段可利用瓊脂糖凝膠純化法來分離，以T4DNA聚合酶處理以產生平整末端，然後連接至經《S/ηαΙ-消化的pBluescriptll KS+(史崔塔基因公司（Stratagene Corp.)，La Jolla，CA)，以形成質體pMON50200(描述在第3-A圖）〇pMON50200序列提供為序列辨識編號：14。由裂壺菌屬α/j基因編碼的乙醯乳酸合成酶酵素之序列則提供為序列辨識編號：15。質體PMON50201、pMON50202及pMON50203(各別地描述在第3-B、3-C及3-D圖）可利用定點突變從質體 £ 68 1377253 pMON50200製造，如此已編碼的乙醯乳酸合成酶酵素不再由某些化合物抑制，包括嘧磺隆曱基(SMM)。這些質體如 • 下建構。使用“轉型a”(Transformera)定點突變工具箱（克隆 . 實驗室有限公司，帕羅阿脫，CA)來將下列突變引進質體

PMON502000，根據製造者的說明書。寡核苷酸選擇引子 (DM19(序列辨識編號：16))則使用在全部三種架構中；此引子可使在PMON50200的多重選殖區中獨特的EcoRV場址轉換成乂如11場址。當同時引進基因序列中的場址時， φ 引子DM14(序列辨識編號：17)可使用來將在已譯碼的ALS 酵素中之胺基酸殘基號碼595的色胺酸改變成纈胺酸；所產生的質體指為pMON50201(序列辨識編號：18)。同樣地，引子DM15(序列辨識編號：20)使用來將在已譯碼的ALS酵素中之胺基酸殘基號碼192的脯胺酸改變成麩醯胺酸，且引進在α/s基因中的場址（site)，可產生質體 pMON50202(序列辨識編號：21)。為了架構出質體 pMON50203(序列辨識編號：23)，使用DM14及DM15引子 • 二者’以產生一種包含上述描述的二胺基酸殘基取代物之已譯碼的ALS酵素。由質體pMON50201、pMON50202及 PMON50203編碼的突變的乙醯乳酸合成酶酵素之序列各別地提供為序列辨識編號：19、序列辨識編號：22，及序列辨識編號：24。實例3 此實例說明裂壺菌以在實例1及2中描述的重組分子之基因轉形。 69 1377253 在此實例中使用的菌株為裂壺菌N230D，一種美國型式培養收集（American Type Culture Collection)菌株20888 (ATCC，馬拉薩斯(Manassas)，VA)的衍生物。對液體培養物來說，細胞在M50-3培養基中，於30EC下，在200-300i*pm 之振動下純種地生長。M50-3培養基包括下列組分：NaCl， 12.5克；MgS04 · 7H20，2.5克；KC卜 0.5克；CaCl2，0.05 克；葡萄糖，30克；麩胺酸Na，3克；KH2P04，0.4克；酵母菌萃取物，1克；NaHC03，0.4克；Na2EDTA，30毫克； FeCl3 . 6H2〇，1.2毫克；H3B〇3，34.2毫克；ZnS04 · 7H20， 0.67毫克；CoCl2 . 6H20，0.13毫克；NaMo04.2H20，25 克；CuS04.5H20，10克；NiS04.6H20，〇·26毫克；硫胺素.HC1，100克；維生素Η，0.5克；氰銘胺，0.5克；及去離子水(至1升）；最後將pH調整至7.0。對在固態培養基上生長來說’細胞在30EC下，於藉由加入1.5%(w/v)的壤脂而固化的M50-3培養基或M1E-3培養基上生長。M1E-3培養基包括下列組分··葡萄糖，4克；（NH4)2S04，0.75克；Na2S04， 5克；MgS04.7H20，2克；KH2P〇4，0_5克；KC卜 0.5克； CaCl2· 2H20’ 0.1 克；MOPS緩衝劑，20.9克；FeS04· 4H20， 0.3毫克；MnCl2 . 4H20，0.1毫克；ZnS04 · 7H20，80克； C0CI2. 6H20，2克；NaMo04 · 2H20，1克；CuS04.5H20， 60克；NiS04.6H2〇，80克；硫胺素.HC1，320克；CA-泛酸鹽，320克；氰鈷胺，8克；及去離子水（至1升）；最後 pH調整至7.0。裂壺菌對肉辛tm&SMM的敏感度可利用下列方法來測 70 量，藉由將這些抑制劑以不同的濃度包含在已固化的 M1E-3培養基中，且將該些細胞以類似於在製程期間使用於重組細胞選擇所顯現的那些密度分佈在板上。裂壺菌屬細胞的基因轉形可利用粒子轟擊來進行（山福特（Sanford)，J.C.，F.D.史密斯，及J.A. RusseU，1993，

MeM.五叫则/· 217 : 483-509)，使用生物-雷德(Bi0_Rad)基因鎗(Bi〇listic)PDS-1000/He粒子傳遞系統（生物-雷德實驗室，赫庫勒斯(Hercules) ’ CA)。裂壺菌屬sp.N230D細胞在液體M50-3培養基中生長，至在680奈米（〇d68())之光學密度為0.4-0.8(10毫米的光學路徑長度）。將與丨〇〇D68〇相符的細胞之液份簡單地離心，移除上層溶液，且將小球化的細胞再懸浮於100 : 1的無菌水中。然後，將該再懸浮的細胞分佈在4至6公分包含瓊脂·固化的培養基（例如，M5〇_3或 M1E-3培養基）的圓形平淺培養皿上，且擱置3〇至6〇分鐘，所以過量的水可吸入固體培養基中；此指為標的板。將1.5毫克的黃金微載體(〇·6 :額定直徑，可從生物雷德實驗室有限公司，赫庫勒斯，CA購得）液份以2.5克的轉形質體DNA(即’質體pTUBZEOll-2、PMON50201 ' pMON50202或pMON50203)塗佈，如每個製造者的說明書 (基因#®PDS-1000/He粒子傳遞系統說明手冊；生物_雷德實驗室，赫庫勒斯，CA)。細胞以塗佈DNA的黃金微載體使用下列條件來轟擊：1100碎/平方英寸轟擊盤、槍中真空度25"Hg;微载體發射組合地放置在頂板上且標的板放置在中間板上，以提供1.5-2公分的轟擊盤停止遮擋距離及約7 71 1377253 公分的停止遮擋標的距離。在轟擊後，將該些細胞在30EC 下於標的板上回收4-6小時。然後以1.5毫升的無菌水將細胞沖洗出標的板，收集在微量離心管中，簡單地離心，再懸浮於400 : 1的無菌水中。將1〇〇微升的懸浮液分佈到四個包含150-200克/毫升的肉辛1^因維戳郡公司，卡爾貝德 (Carlbad)，CA)或25克/毫升的SMM之M1E-3板的每個上。含肉辛TM的板子使用來選擇已以質體pTUBZEOll-2轉形的細胞，然而含SMM的板子可使用來選擇已以質體 pMON502(H、pMON50202、orpMON50203轉形的細胞。然後將該些板子培養在30EC下7-10日。然後，將已顯示出可抵抗選擇性試劑的菌落貼到上新鮮的含相同選擇性試劑的 M1E-3板子上以確認其抵抗性。此方法典型地可於每次轟擊中產生100-1000抗肉辛TM或抗SMM菌株的世代。實例4 下列實例說明經轉形的裂壺菌屬細胞之PCR分析。 P C R使用來確認質體序列存在於推定的可抵抗選擇性試劑肉辛福或5厘]^之經轉形的菌株中。從推定的轉化株及非重組裂壺菌屬N230D細胞來的模板DNA可使用單一用途、成形的1 : 1接種環而獲得，以從已貼到瓊脂板上之抵抗菌落（如描述在實例3)移除小量細胞（1-2立方毫米）。然後將該些細胞再懸浮於具15-20:1之1% Triton X-100的微量離心管中，放置在沸水浴中分鐘，然後在14,000xg下離心5 分鐘。將這些萃取物（1-3·· L)的部分使用來提供作為使用 DNA聚合酶的25 : L PCR反應之模板DNA。為了读測 72 1377253 pTUBZEOll-2序列是否存在於裂壺菌屬DNA中，可使用引子DM20(序列辨識編號：25)及DM21(序列辨識編號：26); 這些引子可融合至質體pTUBZEOll-2中的基因且放大 346-bp DNA片段。使用如下的加熱曲線：94EC 4分鐘； (94EC 45秒、52EC 45秒、72EC 2分鐘）x30 ; 72EC 7分鐘》為了偵測ρΜΟΝ502(Η、ρΜΟΝ50202或pMONs0203序列是否存在於裂壺菌屬DNA中，可使用引子BLA1(序列辨識編號：27)及BLA2(序列辨識編號：28);這些引子可融合至在 % 載體骨架令發現的6/fl(抗氨比西林性)基因，且放大1229-bp DNA片段。使用如下的加熱曲線：94EC 4分鐘；（94EC 45 秒、55EC 45秒、72EC 2分鐘）χ30 ; 72EC 7分鐘。PCR產物可利用標準瓊脂糖凝膠電泳，接著以溴化乙錠染色而分析。這些分析結果確認大多數在這些條件下選擇的菌株確實為包含質體DNA的轉化株。當使用從控制裂壺菌N230D 細胞來的不以轉形質體轟擊的模板DNA時，並無產生具正確尺寸的PCR產物。 # 實例5 下列實例說明經轉形的裂壺菌屬細胞之南方墨點分析。南方雜交墨點可使用從親代裂壺菌屬N230D細胞分離的DNA及數種推定的轉化株來進行，以確認轉形載體DNA 序列存在於該轉形細胞中。南方墨點可使用由熟知此技藝之人士所熟知的技術而進行（參見例如山姆布魯克等人，分子選殖：實驗室手冊。冷泉哈伯實驗室出版社’ 73 1377253 則使用“QIAamp” DNA純化工具箱（奎阿金有限公司 (Qiagen Inc.)，伐倫西亞（Valencia)，CA)分離，以不同的限制酵素消化，藉由電泳經過瓊脂糖凝膠(0.8%-1.2%w/v)分離，然後利用鹼性毛細管搬移法搬移至耐綸薄膜。在以pTUBZEOl 1-2轉形的細胞中之載體DNA的偵測可使用“吉納斯(Genius)”DIG-基礎系統(波新爵-曼漢生物化學GmbH，德國）來進行，其使用經由PCR以引子DM20(序列辨識編號：25)及DM21(序列辨識編號：26)產生之346-bp DIG-標定的基因片段，及包含DIG-11-UTP之核苷酸混合物作為雜交探針。在68EC下，於在吉納斯工具箱中供應的雜交緩衝劑中，進行薄膜的預雜交1小時。在68EC下，於含办^基因探針（其已在9 4 °C下加熱變性5分鐘）的雜交緩衝劑中進行雜交18小時。然後以50毫升的2X SSC/0· 1 % SDS清洗該薄膜5分鐘兩次及以50毫升的0.1XSSC/0.1%SDS15分鐘兩次。雜交DNA的化學發光則以如在吉納斯工具箱說明書中所描述般進行偵測。從非轉形的裂壺菌屬N230D細胞來之DNA不與办/e基因探針雜交。相反地，從轉形細胞來的DNA可與如下之探針雜交：從包含與6/e基因探針雜交的〜1100-bp DNA片段之轉形的裂壺菌屬細胞來之办AI-消化的DNA;此片段(其亦可在分/ίΙ-消化的pTUBZEOll-2 DNA中觀察到）顯示出全部的6/e 基因表現匣（包括微管蛋白基因啟動子及SV40終止子）。 ^1:對每個試驗的轉化株來說，DNA的消化可 5 74 1377253 產生大於15-20 kbp的雜交片段。办〇1不在pTUBZEOll-2中切割，因此這些結果指示出pTUBZEOll-2在轉形細胞中似乎不存在為染色體外的元素，而是變成併入裂壺菌屬染色體中。

Hindlll ：此二酵素皆在pTUBZEOll-2中切割一次。以這些酵素任一種消化的轉化株DNA典型地導致一種顯著的雜交片段，其會與線性化的pTUBZEOll-2載體（即，〜3.8kbp)共泳動。此建議該載體可以銜接重覆形式併入染色體中。實例6 此實例說明裂壺菌屬中的同源重組。進行下列實驗以說明同源重組可發生在裂壺菌屬中之内生天然DNA序列與顯現在引進細胞的重組DNA分子中之同源DNA序列間。此型式的同源重組對製造具有想要的性質之重組菌株非常有益。例如，同源重組可藉由目標地嵌入外源基因序列而使内生基因失活化。額外地，同源重組可用來以一改變的基因形式取代一内生基因或其部分，如此該重組細胞具有新的性質。同源重組顯示出發生在以質體pMON50202轉形的裂壺菌屬細胞中，其包括在裂壺菌屬基因中的突變。此突變在譯碼區域的bp位置571處引進也gl場址。在^&譯碼區域的bp位置1324處已天然地發生瓜gI場址。因此，消化的裂壺菌屬DNA之南方墨點可使用來分辨天然的基因與重組犬變的α/s基因。對這些實驗來說，特定的雜交探 75 1377253 針可經由PCR使用包含DIG-11UTP(波新爵-曼漢生物化學 GmbH，德國）、前置引子PGR28(序列辨識編號：32)、反置引子PGR30(序列辨識編號：33)的核苷酸混合物及小量的 pMON50200(作為模板）而製造。所產生的323-bp DIG-標定之雜交探針指為ALS1 » 從非重組裂壺菌屬N230D細胞來的DNA分別地以及消化，接受瓊脂糖凝膠電泳，搬移至耐綸薄膜，然後使用基本上與在實例5中所描述的那些相同程序以ALS1 探針探測。該ALS1探針可標定出消化的DNA之 1.76-kbp片段及消化的DNA之4.9-kbp片段。從不同的已以PMON50202轉形的重組菌株來之5叹1-及Μί/Ι-消化的DNA之南方墨點亦以ALS1探針探測。在某些情況中，1.76-kbp的办gl片段並不會顯現，反而會標定出 0.75-kbp片段，而與顯現在pMON50202中的753-bp 5叹1片段相符合。在這些重組菌株中會標定出4.9-kbp 片段，但是’此指出該重組、突變的此基因已以天然的A基因經由雙交叉同源重組法來重組。單交叉同源重組亦觀察會發生在以pMON50202轉形的重組菌株中。在這些情況中，1.76-kbp及0.75-kbp5极I片段二者會在從重組菌株來的DNA之南方墨點中標定出，但是 4_9-kbpdM片段則由較大的標定片段取代，其指示出全部的pMON50202載體已嵌入天然的必基因，而為單一複製或為銜接重覆。同源重組在裂壺菌屬中的其它證據可藉由引進含一截 76 1377253 斷、突變的基因之重組DNA分子而獲得’如此由截斷基因編碼的不完整ALS酵素不具有功能性。此截斷基因可利用C7al及所m/III消化pMON50202以產生2.8-kbp片段而製造，因此移除沿著必終止子區域之A譯碼序列的最後 388bp。此2.8-kbp片段連接至已以C7al及消化的 pBluescriptll KS+(史崔塔基因公司，La Jolla，CA)，而產生質體pAR2。質體pAR2預計將僅授予轉形的裂壺菌屬細胞具抗SMM性，若具功能的突變基因在轉形的菌株中經由同源重組在天然的aAs基因與顯現於pAR2中的截斷突變fl/i 基因之間復原。此構造可藉由粒子轟擊引進裂壺菌屬 N230D細胞，且可如在實例3中描述般分離該抗SMM性菌株。從轉化株來之消化的DNA之南方墨點分析（如在此實例中較早的描述般進行）指出同源重組已明顯地發生在這些菌株中；即，1.76-kbp 片段已與在非重組細胞中的 ALS 1探針雜交，但是此可由已以pAR2轉形的細胞中之〇.75-kbp雜交片段取代。實例7 此實例說明使用轉形載體pTUBZE011-2或 PMON50202經由共轉形來產生含其它外源DNA分子（其不與選擇性標記基因連結）的菌株。

共轉形可藉由同時引進pTUBZE011-2及額外的含數種基因的任何一種之質體而達成。質體可如在實例3中描述般使用每個質體2.5克共沉澱在黃金粒子上。在以塗佈質體的 η金粒子轟擊標的細胞後，如在實例丨中描述般於含肉辛TM 77 1377253 壤脂板上選擇重組菌株。然後，利用PCR分析或南方墨點雜交法証實該第二、非選擇的質體之存在。典型地可達成非常同的共轉形頻率(例如，5〇 9〇%)。例如，質體pTR2〇2(其包括連結至裂壺菌屬微管蛋白基因啟動子及終止子的線蟲類泥蟲/αί-1基因（斯拜恰拉(Spychalla)等人，1997尸^^ dcW· Sci· [/·叉儿94，1142-1147))經由在此實例中所提供的方法引進’由PCR顯示出所產生的抗肉辛τΜ菌株約68〇/〇包含 /αΜ基因（參見表1) ^類似的結果可觀察到，當共引進 ΡΜΟΝ50202及額外的質體，接著在含的固體培養基上選擇轉形細胞°此共轉形方法可使用來引進任何外來想要的 DNA。表1.使用選擇標記質體pTUBZE〇丨丨_2及含不同#基因的質體之共·轉形辣率。抗肉辛R的轉化株經由PCR篩選/WDNA序列。引進的基因鮮雪株共轉形效率 syn fatl 17/25 68% nat fatl 24/25 96% mut fatl 21/25 84% desB 20/25 80% 在這些實例中描述的轉形系統顯示出在基因操縱裂壺菌屬（其熟知為發酵性製造脂質系化合物之最多產的有機體）的能力上之明顯發展。二種各自獨立的轉形系統之可利用性（與發生的高共轉形效率一起）應該可讓多重特性在設計的菌株中累積。再者，在此微藻類中同源重組的明顯存在應該可發展基因剔除程序，以鑑別在所製造的菌株中未知基因的功能及消除不想要的特性。本發明家現在使用這 78 1377253 些系統來改變裂壺菌屬中的脂肪酸新陳代謝，且探測到使用此物種及相關的微藻類(例如，破囊壺菌屬）來製造類胡蘿 . 蔔素類、留醇類及其它脂質樣的化合物類之可能性。同時本發明的不同具體實施例已詳細地描述，明顯的是將可由熟知此技藝之人士對那些具體實施例進行改質及調整。但是，需明顯了解的是此改質及調整皆包含在本發明如於下列申請專利範圍所提出之範圍中。 L圖式簡單說明3 第1圖闡明重組質體pTUBZEO-ll的架構。 ^ 第2圖闡明重組質體pTUBZE011-2的架構。第3A圖闡明重組質體pMON50200。 : 第3B圖闡明重組質體pMON50201。 - 第3C圖闡明重組質體pMON50202。第3D圖闡明重組質體pMON50203。【主要元件符號說明】益 ”》、 79 序列表 <110> Roess1er, Paul Matthews, T. Dave Ramseier, Tom Metz, James <120> 供破囊壺菌微生物之轉形用的產物與方法 <130> 2997-23-PCT <150> 60/284,116 <151> 2001-04-16 <160> 35 <170> Patentln version 3.1 <210> 1 <211> 551 <212> DNA <213>裂壺菌 <220> <221> misc_feature <222> (520),.(520) <223> n = a, c, g, or t <220> <221> misc_feature <222> (541)..(541) <223> n = at c, g, or t <400> 1 gtcgtgccta acaacacgcc g t t c t acccc gccttcttcg cgcccc t teg eg t ccaagca 60 tcc t tcaagt 11 a t c t c t c t agttcaactt caagaagaac aacaccacca aca aga t geg 120 t gagg t ca t c tccatccaca t cggccaggc cggtgttcag gtcggtaacg cctgctggga 180 gctctactgc ctcgagcatg gcatccagcc ggacggccag atgccctcgg acaagaccat 240 tggeggegge gatgatgcct tcaacacctt ct tctccgag act ggcgccg gcaagcacgt 300 gccccgcgcc gtgctcgt eg atctcgagcc caccgtctgt gacgaggtcc gcaccggcac 360 c t accgcgc t c 111 accacc ccgagcaga t ca t caccggc aaggaggacg c tgccaacaa 420 ctacgctcgt ggccac t aca ccatcggcaa ggaga t eg t c gacctcgtcc t cgaccgca t 480 ccgcaagc t c gccgacaact gcactggtct teagggettn c t c t gc 11 ca acgccgtcgg 540 nggtggtacc g 551 <210> 2 <211> 27 <212> DNA <213〉裂壺菌 <400> 2 gcgccagtct eggagaagaa ggtgttg 27 <210> 3 <21 1> 27 <212> DNA <213> 裂壺菌 <400〉 3 age t cccagc aggegt t acc gacc t ga 27 <210〉4 <21 1> 725 <212〉DNA <213〉裂壺菌 <400> 4 1 1377253

gagacgtgct tcgcaagacc gctgtgctcg cgccgcacgc Ϊ c t g t g t g 11 aca 11 aa 111 60 t 11 t g t aga t gaag 111 c t c t a 11 c t ctcg aaa 11 c t g t a gaa t g t t a t a g t c t c 11 cac 120 tcccgtgat t ggagagga t t c 11gc t tgt t ccctcccgcc cgggtagcgc t tggagcaac 180 get tgagege gege t egaaa geggaeggeg caacgagccg 111 cacgccg ege t g t ccaa 240 gtcccat 111 tctcct tacc ccatggccgt t gca t gccaa 1111 aggccc cccac t gacc 300 gaggtctgtc gataatccac t 11 tccattg a t c 11 ccagg 111 eg t t aac t ca t gccac t 360 gagcaaaac t t egg t c 11 t c c t aacaaaag c t c t cc t cac aaagea t ggc gcggcaacgg 420 aeg i g t cc t c a t ac t ccac t gccacacaag g t ega t aaac taagctcctc acaaa t agag 480 gagaa 11 cca c tgacaac tg aaaacaatgt atgagagacg atcaccactg gageggegeg 540 geggt tgggc geggaggt eg gcagcaaaaa caagcgac t c gccgagcaaa cccgaa t cag 600 cc11cagacg g t eg t gee t a acaacacgcc gt tctacccc gee 11 c t teg cgcccc 11 eg 660 eg t ccaagca tcct tcaagt 11 a t c t c t c t agt tcaact t caagaagaac aacaccacca 720 acaag 725 <210> 5 <211> 24 <212> DNA <213> 裂壺菌 cacccatggt gt tggtggtg t tgt <400> 5 24 <210〉 6 <211> 24 <212> DNA <2丨3> 裂壺菌 aaactcgaga cgtgct tege aaga <400> 6 24 <210> 7 <211> 4646 <212〉 DNA <213> 裂壺菌 <400> 7 aaactcgaga cgtgct tege aagaccgctg tgctcgcgcc gcacgc t c tg tgtgt tacat 60 t a a 1111111 g t aga t gaag 11 t c t c t a 11 c t c t egaaa t t c t g t agaa t g 11 a t ag t c t 120 c 11 cac t ccc gtgat tggag agga 11 c t tg c 11 g 11 ccc t cccgcccggg t agege 11 gg 180 agcaacgc 11 gagcgcgcgc tegaaagegg Hcggcgcaac gageeg 111 c acgccgcgc t 240 2 gtccaagtcc cat ttitctc c 11 acccca t ggccgt tgea tgccaat 111 aggcccccca 300 ctgaccgagg tctgtcgata atccact 111 cca 11 ga t c t t ccagg 111 c gt taactcat 360 gccactgagc aaaact tegg tel t icctaa caaaagc1c t cct cacaaag catggcgcgg 420 caacggacg t gtcctcatac tccac tgcca cacaagg teg ataaactaag c t cc t cacaa 480 a t agaggaga at tccactga caactgaaaa caa t g t a t ga gagaega t ca ccac t ggage 540 ggcgcggcgg t tgggcgcgg aggtcggcag caaaaacaag ceactcgccg agcaaacccg 600 aa t cagcc t t cagacggtcg tgee t aacaa cacgccgt t c taccccgcct t c t t cgcgcc 660 cc t t cgcg t c caagca t cc t t caag 111 a t c t c t c t ag 11 caac 11 caag aagaacaaca 720 ccaccaacac cat ggg t gaa gggegaa11 c t gcaga t a t c catcacactg gegge ege t c 780 gage a t gc a t c t agagggee c a a t t ege c c t a t ag t gag t eg t a 11 acaa 11 c a c t ggee 840 g t c g 1111 ac aacgtcgtga ctgggaaaac cctggcgtta cccaac 11 aa tegeet tgea 900 gcaca t cccc c 111 cgccag c tggcg t aa t agegaagagg cccgcaccga tcgccct tee 960 caacagt tgc gcagcc tgaa tggcgaatgg gacgcgccc t gtageggege a 11 aagcgcg 1020 gcgggtgtgg tggt taegeg cagcgtgacc gc t acac 11 g ccagcgccc i agcgcccgc t 1080 cc 111 ege 11 t c 11 ccc 11 c c 111 c t egee aeg 11 egeeg £C 111 ccccg tcaagctcta 1140 aa t cgggggc t ccc u t agg g 11 ccga 111 agage 111 ac ggcacc t ega ccgcaaaaaa 1200 c 11ga 111 gg gtgatggt tc acgtagtggg ccatcgccct ga t agaegg t 1111 cgccc t 1260 t tgacgt tgg ag t ccacg 11 c 111 aa t agt ggac tc t tg t tccaaac tgg aacaacac t c 1320 aaccctatcg eggtetat tc 1111 ga 111 a t aaggga 111 t geega t 11 c ggcctat tgg 1380 11 aaaaaa t g agetgat t ta acaaat tcag ggcgcaaggg ctgctaaagg aaccggaaca 1440 eg t agaaage cag t ccgcag aaacggtgct gaccccgga t gaa t gt cage tact ggge t a 1500 3 1377253 tc tggacaag ggaaaacgca agcgcaaaga gaaagcaggt aget tgcagt ggge 11 aca t 1560 ggcga t age t agac t gggcg g t 111 a tgga cagcaagcga accggaa 11 g ccagctgggg 1620 cgccc t c t gg taaggt tggg aagccc tgea aagtaaactg gat ggc 111 c 11 gccgccaa 1680 ggatctgatg gcgcagggga tcaaga tetg a t caagagac agga t gagga t eg 111 egea 1740 t ga 11 gaaca agatggat tg cacgcaggt t c t ccggccgc t tgggtggag agge t a t t eg 1800 gctatgactg ggcacaacag acaa t egge t gctctgatgc cgccgtgttc cggctgtcag I860 cgcaggggcg cccgg 11 c 11 111 g t caaga ccgacc t g t c cggtgccctg aa tgaac t gc 1920 aggaegagge agegegge t a tcgtggctgg ccacgacggg eg11 cc t tgc gcagc t g tgc 1980 tegaegt tgt cactgaagcg ggaagggact ggc tgc t a 11 gggcgaagtg ccggggcagg 2040 a t c t cc t g t c a t c t egee 11 gc t cc t geeg agaaag t a t c ca t ca t ggc t ga t gcaa t gc 2100 ggegge t gca t aege 11 ga t ccggc t acc t gccca 11 ega ccaccaagcg aaaca egea 2160 t egagegage aegt ac t egg a t ggaagccg g t c t tg t ega tcaggatgat c tggaegaag 2220 agea t caggg gctcgcgcca gccgaactgt t cgccaggc t caaggcgcgc a t gcccgacg 2280 gegagga t c t eg t eg t ga t c catggcgatg cc t gc 11 gee gaa t a t c a t g g t ggaaaa t g 2340 geege 1111 c t gga 11 caac gactgtggcc ggctgggtgt ggcggaccgc t a t caggaca 2400 tagcgttgga t acceg t ga t a11gc tgaag aget tggegg cgaatgggct gaccgc 11 cc 2460 t eg t gc 111 a egg t a t egee gc t cccga 11 cgcagcgcat egee t t c t a t egee 11 c t t g 2520 aegag 11 c 11 ctgaat tgaa aaaggaagag tatgagtat t caacat t tee gtgtcgccct 2580 t a 11 ccc 111 11 tgeggeat 111 gee 11 cc t g 11111 gc t cacccagaaa egetgg tgaa 2640 ag t aaaaga t gc t gaaga t c ag 11 ggg tgc acgagtgggt tacatcgaac tggatctcaa 2700 cagcggt aag a t cc 11 gaga gt 11 tcgccc egaagaaegt 111 ccaa t ga tgageae 111 2760 t aaag 11 c t g c t a t g t ca t a cac t a 11 atc ccg t a 11 gac gccgggcaag agcaac t egg 2820

4 t cgccgggcg egg tat Ic t c agaa t gac 11 ggt tgagtac tcaccag tea cagaaaagca 2S80 tct tacggat ggcatgacag taagagaat t a t gcag t gc t gccat aacca tgagtgataa 2940 cactgcggcc aacttact tc tgacaacgat cggaggaccg aaggage taa ccgct ttt 11 3000 gcacaacatg ggggatcatg taact egee t tgatcgttgg gaaccggagc tgaatgaage 3060 cataccaaac gaegagagtg acaccacga t gcc t g t agea atgccaacaa egt tgegcaa 3120 actat taact ggcgaac t ac 11 ac t c tage t icccggcaa caa 11 aa t ag actggatgga 3180 ggcggataaa gt tgeaggae cac 11 c t geg c t cggccc t t ccggctggct gg111at tgc 3240 t ga t aaa t cl ggagccggtg ageg t ggg t c t egegg t a t c a11gcagcac tggggccaga 3300 t gg t aagccc tcccgtatcg tagt tateta cacgacgggg agtcaggcaa ctatggatga 3360 acgaaataga cagatcgc tg aga t agg t gc ctcactgat t aageat tggt aac t g t caga 3420 c c aag 11 t ac t ca t a t a t ac t 11 aga 11 ga 111 aaa a c 11 ca 1111 t aa t 11 aaaagga t 3480 c t agg tgaag a t cc 111 t tg a t aa t c t ca t gaccaaaatc cc 11 aacg t g agt 11 tegt t 3540 ccactgagcg t cagaccc eg t agaaaaga t c a a agga t c t t c 11 gag a t c c t 11 1111 c t 3600 gcgcg t aa t c t gc t gc 11 gc aaacaaaaaa accaccgc t a ccagcgg t gg 111 g 11 t gcc 3660 gga t caagag c t accaac t c 11111 ccgaa ggtaactggc t teageagag egeaga t acc 3720 aaa t ac t g t c c 11 c tag t g t ageegtagt t aggccaccac t tcaagaac t c t g t agcacc 3780 gcc t aca t ac c t ege t c t gc t aa t cc tg t t accag tgge t gctgccagtg gega t aag t c 3840 gtgtct tacc ggg t tggac t caagacga t a gt taccggat aaggcgcagc ggtcgggctg 3900 aacgggggg t tcgtgcacac agcccagc 11 ggdgcgaacg acc t acaccg aac t gaga t a 3960 cctacagcgt gagcaitgag aaagcgccac get tcccgaa gggagaaagg cggacaggta 4020 t ccgg t aagc ggcaggg teg gaacaggaga gcgcacgagg gage 11 ccag ggggaaacgc 4080 5 1377253 ctggtatct t tatagtcctg tcgggt tteg ccacc t c t ga ct tgagcgtc gat 111 tgtg 4140 atgctcgtca ggggggcgga gee t a t ggaa aaacgccagc aacgcggcc t 1111 aegg 11 4200 cc tggcc 111 t gc t ggcc 11 11 gc t caca t g 11c 111cc t geg 11 a t ccc c t ga 11 c t g t 4260 ggataaccgt a 11 accgcc t t tgagtgagc t ga t accgc t cgccgcagcc gaacgaccga 4320 gcgcagcgag tcagtgagcg aggaagegga agagcgccca a t acgcaaac egee t c t ccc 4380 cgcgcgt tgg ccga 11 ca 11 aatgcagctg gcacgacagg 111 cccgac t ggaaagcggg 4440 cagtgagcgc aacgcaa 11 a atgtgagtta gc t cac t ca t taggcacccc agge 11 t aca 4500 c 111 a t gc 11 ccggc t eg t a tgt tgtgtgg aat tgtgagc gga t aacaa t 11 cacacagg 4560 aaacagc t a t ga cc a t ga t t acgccaagct tggtaccgag c t egga t cca c t ag t aaegg 4620 ccgccag t g t gctggaat tc gccc 11 4646 <210> 8 <21 1> 3664 <212〉 DNA <213〉裂壺菌 <400> 8 c c a t ggccg t tgcatgccaa 1111 aggccc cccactgacc gagg t c t g t c ga t aa t ccac 60 1111 cca 11 g a t c t t ccagg 11 t eg t t aac tcatgccact gagcaaaac t t egg t c 11 t c 120 ctaacaaaag ctctcctcac aaagcatggc gcggcaacgg aeg t g t cc t c a t ac t ccac t 180 gccacacaag gtcgataaac t aage t cc tc acaaatagag gagaa 11 cca ctgacaactg 240 aaaacaatgt a t gagagacg atcaccactg gageggegeg gegg 11 ggge geggagg t eg 300 gcagcaaaaa caagcgac t c gccgagcaaa cccgaa t cag cc 11 cagacg g t eg t gee t a 360 acaacacgcc g 11 c t acccc gcct let teg cgcccc t teg cgtccaagca t cc 11 caag t 420 11a tctctc t agt tcaact t caagaagaac aacaccacca acacca t ggc caagt tgacc 480 agtgccgt tc cggtgctcac cgcgcgcgac gtegeeggag cggtcgagti c t ggaccgac 540 cggc t cggg t t c t cccggga ct tcgtggag gaegae t teg ccggtgtggt ccgggacgac 600 gtgaccctgt tcatcagcgc ggtccaggac caggtggtgc cggacaacac cciggcctgg 660

6 gtgtgggtgc geggee tgga egage t g t ac geegag t gg t eggagg t eg t g t ccacgaac 720 t t ccgggacg cc t ccgggcc ggcca t gacc gaga t eggeg age age eg t g ggggcgggag 780 11 cgccc t gc gcgacccggc cggcaac t gc gtgcact teg tggccgagga gcaggactga 840 cacg t gc t ac gagat t tega 11 ccaccgcc gee 11 c t a t g aaagg t tggg ct teggaate 900 g 1111 ccggg acgccggc t g ga t ga t cc t c cagcgcgggg a t c t ca t gc t ggag 11 c 11 c 960 gcccacccca ac t tg 111 a t tgeaget tat aa t gg 11 aca aataaagcaa tagcatcaca 1020 aa 111 cacaa a t aaagea 11 11111 cac tg ca 11 c t ag 11 gtggt t tgtc caaactcatc 1080 aa t g t at c 11 atcatgtc tg aa 11 cccggg ga t cc t c t ag agtcgacctg caggcatgca 1140 age 11 ggcac t ggccg t eg t 11 t acaacg t cgtgactggg aaaaccc tgg cgt t acccaa 1200 c t t aa t egec t tgcagcaca t ccccc 111 c gccagc tgge g t aa t agega agaggcccgc 1260 accgatcgcc ct tcccaaca gt tgcgcagc cigaatggcg aatggcgcct gatgeggtat 1320 11 tc t cc 11 a cgcatctgtg eggt a 111 ca caccgcatat atggtgcact c t cag t acaa 1380 tctgctctga t geegea t ag 11aagccagc cccgacaccc gccaacaccc gctgacgcgc 1440 cctgacgggc 11gt ctgc tc ccggcatccg c 11 acagaca age t g t gacc gtctccggga 1500 gctgcatgtg tcagaggt 11 t caccg t ca t caccgaaacg egegagaega aagggcc t eg 1560 tgatacgcct a 11111 a t ag gt taatgtca tgataataat ggt t tc t tag acgtcaggtg 1620 gcac 1111 eg gggaaatgtg cgcggaaccc c t a 111 g 111 at 1111 c taa atacat tcaa 1680 a t a t g t a t cc gctcatgaga caa t aaccc t ga t aaa t gc t t caa t aa t a t tgaaaaagga 1740 agagtatgag t a 11 caaca t 11 ccg tgteg ccc 11 a 11 cc c 111111 geg gcat 11 tgee 1800 t tcctgt 111 tgctcaccca gaaacgc t gg t gaaag t aaa agatgctgaa £a t cag 11gg 1860 gtgcacgagt gggt tacatc gaac t gga t c tcaacagcgg taagatcct t gagag1111 c 1920 7 1377253 gccccgaaga aeg t 111 cca a t ga t gagea c 1111 aaag t tc tgc t a tg t ggcgcggtat 1980 tatcccgtat tgacgccggg caagagcaac t eggt egeeg catacactat t c t cagaa t g 2040 act tggt tga g t ac t caeca g t cacagaaa age a t c 11 ac ggatggcatg acag t aagag 2100 a a 11 a t gcag t gc t gcca t a ac ca t gagt g a t aacac tgc ggccaac 11 a c t t c t gacaa 2160 cgatcggagg accgaaggag c t aaccgct t 111 tgcacaa catgggggat ca t g t aac t c 2220 gcct tgatcg t tgggaaccg gage t gaat g aagcca t acc aaaegaegag cgtgacacca 2280 cga t gcc t g t agcaatggca acaacg t tgc gc a aac t a 11 aac t ggega a c t ac 11 ac t c 2340 t age 11 cccg gcaacaa 11 a a t agac tgga tggaggcgga t aaag 11 gca ggaccact tc 2400 t gege t egge cc 11 ccggc t ggc t gg 111 a t t gc t ga t a a atctggagcc gg t gageg t g 2460 gg t c t egegg t a t ca t tgea gc ac t ggggc cagatggtaa gccc t cccg t a t eg t ag 11 a 2520 t c t acacgac ggggag t cag gcaac t a tgg a tgaacgaaa t agac aga t c gc tgaga t ag 2580 g t gcc t cac t gat t aagea t tggtaactgt cagaccaagt 11 ac t ca t a t a t ac 111 aga 2640 t tgat t taaa ac 11 ca 1111 t aa 111 aaaa ggatctaggt gaagatcct t 11 tgat aatc 2700 tcatgaccaa aa t ccc 11 aa eg t gag 1111 cgt tccactg ageg t cagac cccg t agaaa 2760 aga t caaagg atettettga gatcc 11 tt t t tctgcgcgt aa t c t gc igc t tgcaaacaa 2820 aaaaaccacc gc t accagcg gtggt t t£tt tgeeggatea agage t acca actct 111 tc 2880 egaaggt aac t ggc 11 cage agagcgcaga taccaaatac t g t cc 11 c t a gtgtagccgt 2940 ag 11 aggcca ccac 11 caag aa c t c t g t ag caccgcctac a t ac c t ege t c t gc t aa t cc 3000 t g 11 accag t ggc t gc t gcc agtggcgata agtcgtgtct t accggg tig gac t caagac 3060 ga t ag 11 acc gga t aaggcg cagcggtcgg gctgaacggg gggt tcgtgc acacagccca 3120 get tggagcg aacgacctac accgaac tga ga t acc t aca gegtgageat t gagaaagcg 3180 ccacgc 11 cc egaagggaga aaggcggaca ggtatccggt aageggeagg g t cggaacag 3240

8 gagagcgcac gagggage 11 ccagggggaa acgcctggta t c 111 a t ag t cctgtcgggt 3300 11 cgccacc t ctgact tgag eglegat 111 t g t ga t gc t c gtcagggggg eggagee t a t 3360 ggaaaaacgc cagcaacgcg gee 11111 ac ggt tcctggc ct 11 tgctgg cct 11 tgctc 3420 aca t g t g t gc tgggcccagc cggccaga t c tgagctcgcg geegegatat ege t age t eg 3480 aggcaggcag aagtatgcaa agea t gca t c tcaat tagtc agcaaccagg tgtggaaagt 3540 ccccaggc t c cccagcaggc agaag t a t gc aaageatgea t c t caa 11 ag tcagcaacca 3600 lagtcccgcc cc t aac t ccg cccatcccgc ccctaactcc gcccagt tee gc c c a 11 c t c 3660 cgcc 3664 <210> 9 <211> 3808 <212> DNA <213> Artificial Sequence <220> <223> 裂壺菌及印度斯坦鏈異壁菌（Streptoalloteichus h industanus ) <220> <221> promoter <222> (441)..(894) <223> <220> <221> CDS <222> (895).. (1269) <223> <220> <221> terminator <222> (1270)..(1524) <223> <400> 9 t cgcgcg 111 cggtgatgac ggtgaaaacc tctgacacat gcage t cccg gagaegg tea 60 cage 11 g t c t gtaageggat geegggagea gacaagcccg t cagggcgcg tcagcgggtg 120 t tggcgggtg tcggggctgg c 11 aac t a t g eggea t caga gcagat tgta ctgagagtgc 180 accatatgcg g t g t gaaa t a ccgcacaga t geg t aaggag aaaa t accgc atcaggcgcc 240 a 11 cgcca 11 caggctgcgc aactgt tggg aagggcga t c ggtgcgggcc t c 11 ege t a t 300 t acgccagci ggcgaaaggg ggatgtgctg caaggega 11 aag 11gggta acgccagggt 360 111 cccag t c aegaegt tgt aaaacgacgg ccagtgaat t egage t egg t acccggggat 420 cc t c t agag t cgacctgcag gca t gccaa t 111 aggcccc ccactgaccg aggtctgtcg 480 9 ataatccact 111 cca 11 ga 111 tccaggt ttcgitaact catgccactg agcaaaactt 540 eggtc111cc taacaaaagc tctcctcaca aagcatggcg cggcaacgga cgtgtcctca 600 t ac t ccac t g ccacacaagg t ega t aaac t aagctcctca caaa t agagg agaattccac 660 tgacaac tga aaacaatgt a tgagagaega tcaccactgg ageggegegg egg 11gggcg 720 eggagg t egg cagcaaaaac aagegae teg ccgagcaaac ccgaa t cage c t t cagacgg 780 tcgtgcctaa caacacgccg t tctaccccg ccttcttcgc gcccc 11 ege g t ccaagca t 840 cct tcaagt t tateteteta gt tcaacttc aagaagaaca acaccaccaa cacc atg 897 Met 1 gee aag t tg acc agt gee gt t ccg gtg etc acc geg ege gac gtc gee 945 Ala Ly s Leu Thr Ser Ala Val Pro Val Leu Thr Ala Arg Asp Val Ala 5 10 15 gga geg g t c gag t t c tgg acc gac egg etc ggg 11 c tee egg gac 11 c 993 Gly Ala Val Glu Phe Trp Thr Asp Arg Leu Gly Phe Ser Arg Asp Phe 20 25 30 gtg gag gac gac 11 c gee ggt gtg gtc egg gac gac gtg acc ctg t t c 1041 Val Glu Asp Asp Phe Ala Gly Val Val Arg Asp Asp Val Thr Leu Phe 35 40 45 ate age geg gtc cag gac cag gtg gtg ccg gac aac acc ctg gee tgg 1089 lie Ser Ala Val Gin Asp Gin Val Val Pro Asp Asn Thr Leu Ala Trp 50 55 60 65 gtg tgg gtg ege ggc c tg gac gag c t g t ac gee gag tgg teg gag gtc 1137 Val Trp Val A rg Gly Leu Asp Glu Leu Tyr Ala Glu Trp Ser Glu Val 70 75 80 gtg tee aeg aac 11 c egg gac gee tee ggg ccg gee atg acc gag ate 1185 Val Ser Thr Asn Phe Arg Asp Ala Ser Gly Pro Ala Met Thr Glu Me 85 90 95 ggc gag cag ccg tgg ggg egg gag 11 c gee ctg ege gac ccg gee ggc 1233 Gly Glu Gin Pro Trp Gly Arg Glu Phe Ala Leu Arg Asp Pro Ala Gly 10 100 105 no aac tgc g t g cac 11 c gtg gcc gag Asn Cys Val His Phe Val Ala Glu 115 120 gag cag gac Glu Gin Asp t ga ca eg t gc t ac 1279 gaga 111 cga 11 ccaccgcc gcc 11 c t a t g aaaggt tggg ct teggaate g 1111 ccggg 1339 acgccggctg ga t ga t cc t c cagcgcgggg a t c t ca t gc t ggag 11 c 11 c gcccacccca 1399 act tgt t tat t gcagc 11 a t aa tgg 11 aca aataaagcaa t agea t caca aat t tcacaa 1459 ataaagcat t 11111cac t g cat tetagt t gtggt t tgtc caaactcatc aa t g t a t c 11 1519 a t c a t g t c t g a a 11 cccggg ga t cc t c t ag ag t cga cc t g caggea t gca aget tggcgt 1579 aa t ca t gg t c a t age t g t 11 cctgtgtgaa a 11 g 11 a t cc gcicacaat t ccacacaaca 1639 t acgagccgg aagea t aaag t g t aaagee t ggggtgccta a tgagtgagc t aac t caca t 1699 t aa 11 gcg t t gege t cac t g cccgc 111 cc ag t cgggaaa cctgtcgtgc cagetgea11 1759 aa t gaa t egg ccaacgcgcg gggagaggcg gt t tgegtat tgggcgctct teeget tect 1819 cgctcactga c t ege t gege tcggtcgt tc ggc tgcggcg agegg t a t ca gc t cac t caa 1879 aggegg t aa t a egg 11 a t c c acagaatcag ggga t aaege aggaaagaac atgtgagcaa 1939 aaggccagca aaaggccagg aaccgtaaaa aggeegeg t t gc t ggcg 111 t t cca t agge 1999 t ccgcccccc t gaegagea t cacaaaaa t c gaege t caag t cagagg t gg cgaaacccga 2059 caggac t a t a aagataccag gegt t tcccc ctggaagctc cc t eg t gege t c t cc t g 11 c 2119 cgaccc t gcc gc 11 accgga t acc t g t ceg cc 111 c t ccc 11 egggaage gt ggege t t t 2179 ctcaatgctc aege(gt agg tatct cag11 cggtgtaggt eg 11 ege t cc aagctgggct 2239 gtgtgcacga accccccgt t cagcccgacc gc tgegee 11 a t ccgg t aac tategtet tg 2299 ag t ccaaccc ggtaagacac gac 11 a t ege cactggcagc agccac t gg t aacagga 11 a 2359 gcagagcgag gtatgtaggc ggtgctacag agt tet tgaa gtggtggcct aac t aegge t 2419 11 1377253 acac t agaag gacagtat 11 ggtatctgcg c t c t gc t gaa gccag 11 acc 11 cggaaaaa 2479 gag 11 gg t ag c t c 11 ga t cc ggcaaacaaa ccaccgctgg t agegg t gg t 111111 g 111 2539 gcaagcagca gat tacgcgc agaaaaaaag ga t c t caaga aga t cc 111 g a t c t 11 t c t a 2599 cgggg t c t ga cgctcagtgg aacgaaaac t cacgt laagg ga t t 11 ggt c a t gaga t tat 2659 caaaaagga t c 11 cacc t ag atcct 11 taa a 11 aaaaa t g aag 1111 aaa t caa t c t aaa 2719 g t a t a t a t ga g t aaac 11 gg tctgacagt t accaatgct t aa t cag t gag gcacc t a t c t 2779 cagcgatctg t c t a 111 eg t tcatccatag t t gee t gac t ccccgtcgtg t aga t aac t a 2839 cga t acggga ggge11acca t c tggcccca gtgctgcaat ga t accgcga gacccacgc t 2899 caccggc t cc agat t tatca gcaat aaacc agccagccgg aagggccgag egeagaagtg 2959 gtcctgcaac t t tatccgcc tccatccagt ctat taat tg t tgccgggaa getagagtaa 3019 g t ag 11 cgcc ag 11 aa t ag t t tgcgcaacg 11 g 11 gcca t tgctacaggc atcgtggtgt 3079 cacgctcgtc gt t tggtatg gc t tea t tea gc t ccgg 11 c ccaacga tea aggegagt ta 3139 catgatcccc catgt tgtgc aaaaaagcgg 11 age t cc 11 cggtcctccg ategt tgtea 3199 gaag t aag 11 ggccgcag t g 11 a t cac t ca t gg 11 a t ggc age ac t gca t aa t t c t c t t a 3259 ctgtcatgcc a t ccg t aaga tget 11 tetg t gac t gg t ga g t ac t caacc aag t ca 11 c t 3319 gagaa t ag t g t a tgeggega ccgag11gct c t tgcccggc g t caa t aegg ga t aa t accg 3379 cgccaca tag cagaac 111 a aaagtgctca teat tggaaa aegt tet teg gggcgaaaac 3439 t c t caagga t ct taccgctg t tgagatcca gt tcgatgta acccac t eg t gcacccaac t 3499 gatct tcagc a t ct 11 tact 11 caccagcg 11 tctgggtg agcaaaaaca ggaaggcaaa 3559 a t gccgcaaa aaagggaa t a agggcgacac ggaaatgt tg aatactcata c t C I t cc 111 3619 11 caa t a 11 a 11 gaagea 11 tatcagggtt at tgtctcat gagegga tac atat t tgaat 3679

12 1377253

gtat tlagaa aaaiaaacaa atagggg11c cgcgcaca11 acgtctaaga aaccat tat t atcatgacat taacctataa cct ttcgtc tccccgaaaa gtgccacctg aaataggcgt atcacgaggc 3739 3799 3808 <210> 10 <21i> 124 <212> PRT Artificia丨 Sequence <220> <223> 裂壺菌及印度斯坦鍵異壁菌（S t r e p t o a J J o t e i c h u s /1 i n cf u s t a n u s ) <400> 10 Met Ala Lys Leu Thr Ser Aia Val Pro Val Leu Thr Ala Arg Asp Val 15 10 15

Ala Gly Ala Val Glu Phe Trp Thr Asp Arg Leu Gly Phe Ser Arg Asp 20 25 30

Phe Val Glu Asp Asp Phe Ala Gly Val Val Arg Asp Asp Val Thr Leu 35 40 45

Phe He Ser Ala Val Gin Asp Gin Val Val Pro Asp Asn Thr Leu Ala 50 55 60

Trp Val Trp Val Arg Gly Leu Asp Glu Leu Tyr Ala Glu Trp Ser Glu 65 70 75 80

Val Val Ser Thr Asn Phe Arg Asp Ala Ser Gly Pro Ala Met Thr Glu 85 90 95

He Gly Glu Gin Pro Trp Gly Arg Glu Phe Ala Leu Arg Asp Pro A1 100 105 110

Gly Asn Cys Val His Phe Val Ala Glu Glu Gin Asp 115 120 13 1377253 <210> 11 <211> 1416 <212> DNA <213> 裂壺菌 <400> 11 gcaaaagg t c gage 11 t t cc acaaggagcg ca 11 ggege t cc t ggcaegg ccgact tcaa 60 gc t ca 11 gcc gaga t ga t ca accgtgcgga gcgacccg t c a t c t a t gc t g gccaggg t g t 120 ca tgcagagc ccgt tgaatg gcccggctgt gc t caaggag t tegeggaga aggccaacat 180 t cccg tgacc accacca t gc agggtctcgg egge 111 gac gagegtagte ccc t c t ccc t 240 caaga t gc t c ggcatgcacg gc t c t gcct a cgccaac t ac tegatgeaga aegeega t c t 300 t a t cc tggcg ctcggtgccc gc111gatga tcgtgtgacg ggccgcgttg aegee 111 gc 360 t ccggaggc t cgccgtgccg agegegaggg ccgcgg t ggc a t eg 11 cac t t tgagat t tc 420 ccccaagaac c t ccacaagg tcgtccagcc caccg t egeg gtcctcggcg aeg t gg t ega 480 gaacctcgcc aacgtcacgc cccacg tgea gcgccaggag cgcgagccg t ggt t tgegea 540 gatcgccgat t ggaaggaga agcaccc 111 t c t gc t egag tctgt tgat t cggacgacaa 600 gg t t c t caag ccgcagcagg t cc t cacgga gc t t aacaag caga t t c teg aga 11 c agga 660 gaaggacgcc gaccaggagg t c t aca t cac cacgggcg t c ggaagccacc aga tgeagge 720 agcgcagt tc c 11 acc t gga ccaagccgcg ccag t gga t c tee t egggtg gcgccggcac 780 tatgggctac ggcct tccct cggcca 11 gg cgccaagat t gccaagcccg atgetat tgt 840 t a 11 gaca t c gatggtgatg c t t c 11 a 11 c ga t gaccgg t a tggaa t tga t cacagcagc 900 cgaat tcaag gt tggcgtga ag a 11 c 11 c t 111gcagaac aact t tcagg gc a t gg t c a a 960 gaactggcag ga t c t c 1111 acgacaagcg ctactcgggc accgcca t g t tcaacccgcg 1020 c 11 cgacaag gtcgccgatg ega t geg t gc caaggg t c t c t ac t gegega aacag t egga 1080 gc t caaggac aaga t caagg ag 111 c t ega gtaegatgag ggtcccgtcc tcctcgaggt 1140 t t tegtggac aaggacacgc tegtet tgee ca t gg t cccc gctggct t tc cgctccacga 1200 gatggtcctc gagee t cc t a agcccaagga cgcctaagt t ct 11111 cca tggcgggcga 1260

14 gcgagcgagc gcgcgagcgc gcaagtgcgc aagegee11g cct tgct t tg c11eget teg 1320 ct t tgct t tg c 11 cacacaa cc t aag t a t g aa t tcaag t t 11 c 11 gc t t g t cggcgaaaa 1380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1416 <210> 12 <211> 20 <212> DNA <213> 裂壺菌 <400> 12 gga tc tc 111 t acgacaagc 20 <210> 13 <211> 18 <212> DNA <2丨3> 裂壺菌 <400> 13 ggt tgtgtga agcaaagc 18 <210> 14 <211> 7S47 <212> DNA <213> 裂壺菌 <220> c221> pr im^t ransc r i pt <222> ( 1 ). .( 1 259) <223> <220> <221> CDS <222> (1260). (3314) <223> <220> <221> prim_t ranscript <222> (3315). .(4887) <223> <400> 14 11 g t cga cag caacttgcaa gt ta t aegeg accaccaggc aatctcagca cgcccagcga 60 gcacggagc t t gegaagagg g 11 t acaag t eg t eg 11 ca t t ege t c t caa gc 11 tgee tc 120 aacgcaac t a ggcccaggcc t ac t t tcac t gtgtct tgtc 11 gee 111 ca caccgaccga 180 g t g t gcacaa ccg t gt t t tg cacaaagcgc aagatgetea ctcgactgtg aagaaagg 11 240 gcgcgcaagc gac t gegae t gegaggatga ggatgactgg cagcc t g 11 c aaaaac t gaa 300 aa t ccgcga t gggtcagtgc cat tegegea tgacgcctgc gagagacaag t taactcgtg 360 t cac t ggca t gtee tagea t c 111 aegega gcaaaa 11 ca a t ege 111 a t 1111 tcagt t 420 t eg t aacc 11 c t cgcaaccg egaa t egeeg 111 cagcc t g ac t aa t c t gc agctgcgtgg 480 cactgtcagt cag t cag t ca gtcgtgcgcg c t g 11 ccagc accgagg teg egeg t egeeg 540 egee t ggacc gctgctgcta c t gc t ag t gg cacggcagg t aggage t t g t tgccggaaca 600 15 ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg egtcgaaggg agaggaagge 660 ggcgtgtgca aactaacgt t gaccac tgge gcccgccgac aegageagga ageaggeage 720 t gcagagcgc agcgcgcaag tgcagaatgc gegaaagat c cacttgcgcg cggcgggcgc 780 gcact tgegg gcgcggcgcg gaacagtgcg gaaaggagcg gtgeagaegg cgcgcagtga 840 cagtgggcgc aaagccgcgc agtaageage ggcggggaac ggtataegea gtgccgcggg 900 ccgccgcaca cagaagta t a cgcgggccga agtggggcgt cgcgcgcggg aag t geggaa 960 tggcgggcaa ggaaaggagg agaeggaaag agggcgggaa agagagagag agagagtgaa 1020 aaaagaaaga aagaaagaaa gaaagaaaga aageteggag ccacgccgcg gggagagaga 1080 gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg 1140 gaggagegeg cgcaggaccc gegeggegag egagegagea cggcgcgcga gegagegage 1200 gagegagege gegagegage aagge 11 gc t gegagega t c gagegagega gegggaagg 1259 atg age geg acc ege geg geg aeg agg aca geg geg geg ctg tee teg 1307 Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser 15 10 15 geg ctg aeg aeg cct gta aag cag cag cag cag cagcag ctg ege gta 1355 Ala Leu Thr Thr Pro Val Lys Gin Gin Gin Gin Gin Gin Leu Arg Val 20 25 30 ggc geg geg teg gca egg ctg geg gee geg geg t tc teg tee ggc aeg 1403 Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr 35 40 45 ggc gga gac geg gee aag aag geg gee geg geg agg geg ttc tee aeg 1451 Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr 50 55 60 ega ege ggc ccc aac geg aca ege gag aag age teg ctg gee aeg gtc 1499 Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val 65 70 75 80 16 1377253

cag geg geg aeg gac gat ECg ege t tc gtc ggc ctg acc ggc gee c a a 1547 Gin A1 a Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gin 85 90 95 ate 111 cat gag etc atg ege gag cac cag gtg gac acc ate 111 ggc 1595 He Phe His Glu Leu Met Arg G1 u His Gin Val Asp Thr lie Phe Gly 100 105 110 t ac cc t ggc ggc gee a 11 ctg ccc gt t 111 gat gee a 11 111 gag agt 1643 Tyr Pro Gly Gly Ala lie Leu Pro Val Phe Asp Ala lie Phe Glu Se r 115 120 125 gac gee 11 c aag t tc a 11 etc get ege cac gag cag ggc gee ggc cac 1691 Asp Ala Phe Ly s Phe lie Leu Ala Arg His Glu Gin Gly Ala Gly His 130 135 140 atg gee gag ggc t ac geg ege gee aeg ggc aag ccc ggc gt t gtc etc 1739 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Ly s Pro Gly Val Val Leu 145 150 155 160 g t c acc teg ggc cc t gga gee acc aac acc ate acc ccg ate atg gat 1787 Val Thr Se r Gly Pro Gly Ala Thr Asn Thr lie Thr Pro lie Met Asp 165 170 175 get t ac atg gac ggt aeg ccg ctg etc gtg t c acc ggc cag gtg ccc 1835 Ala Tyr Me t Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Pro 180 185 190 acc tet get gtc ggc aeg gac get 11 c cag gag tgt gac a 11 gt t ggc 1883 Thr Se r Ala Val Gly Thr Asp Ala Phe Gin Glu Cys Asp lie Val Gly 195 200 205 ate age ege geg tgc acc aag tgg aac glc atg gtc aag gac gtg aag 1931 lie Se r Arg Ala Cy s Thr Ly s Trp Asn Val Met Val Ly s Asp Val Ly s 210 215 220 gag etc ccg ege ege ate aa t gag gee 111 gag a 11 gee atg age ggc 1979 Glu Leu Pro Arg Arg He Asn Glu Ala Phe Glu lie Ala Met Se r Gly 225 230 235 240 ege ccg ggt ccc stg etc gtc gat c 11 cc t aag gat gtg acc gee gt t 2027 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Ly s Asp Val Thr Ala Val 245 250 255 17 gag etc aag gaa atg ccc gac age tee ccc cag gt t get gtg ege cag 2075 Glu Leu Ly s Glu Met Pro Asp Ser Ser Pro Gin Val Ala Val Arg Gin 260 265 270 aag caa aag g t c gag c t t 11 c cac aag gag ege a 11 gfic get cc t ggc 2123 Ly s Gin Lys Val Glu Leu Phe His Lys Glu Arg lie Gly Ala Pro Gly 275 280 285 acg gee gac t tc aag etc a 11 gee gag atg ate aac cgt geg gag ega 2171 Thr Ala Asp Phe Lys Leu lie Ala Glu Met lie Asn Arg Ala Glu Arg 290 295 300 ccc g t c ate tat get ggc cag ggt gtc atg cag age ccg t tg aa t ggc 2219 Pro Val lie Tyr Ala Gly Gin Gly Val Met Gin Ser Pro Leu Asa Gly 305 310 315 320 ccg get gtg etc aag gag 11 c geg gag aag gee aac a t t ccc gtg acc 2267 Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn lie Pro Val Thr 325 330 335 acc acc ate cag ggt etc ggc ggc 111 gac gag cgt ag t ccc etc tee 2315 Thr Thr Met Gin Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350 etc aag atg etc ggc atg cac ggc t c t gee t ac gee aac t a c t eg atg 2363 Leu Ly s Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met 355 360 365 cag aac gee gat c t ate c g geg etc sgt gee ege t t gat gat cgt 2411 Gin Asn Ala Asp Leu Me Leu Ala Leu Giy Ala Arg Phe Asp Asp Arg 370 375 380 gtg acg ggc ege gt t gac gee t t get ccg gag get ege eg t gee gag 2459 Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 ege gag ggc ege ggt ggc ate stt cac 111 gag at t lee ccc aag aac 2507 Arg Glu Gly Arg Giy Gly lie Val Hi s Phe Glu lie Ser Pro Lys Asn 405 410 415 etc cac aag g t c gtc cag ccc acc gtc geg gtc etc ggc gac gtg gtc 2555 Leu His Lys Val Val Gin Pro Thr Val Ala Val Leu Gly Asp Val Val 18 1377253

420 425 430 gag aac etc gee aac gtc aeg ccc cac gtg cag ege cag gag ege gag 2603 Glu Asn Leu Ala Asn Val Thr Pro His Val Gin Arg Gin Glu Arg Glu 435 440 445 ccg tgg 111 geg cag ate gee gat tgg aag gag aag cac cc t 111 ctg 2651 Pro Trp Phe Ala Gin lie A1 a Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460 etc gag tc t g 11 gat teg gac gac aag gt t etc aag ccg cag cag gtc 2699 Leu Glu Se r Val Asp Se r Asp Asp Lys Val Leu Lys Pro Gin Gin Val 465 470 475 480 etc aeg gag c 11 aac aag cag a 11 etc gag at t cag gag aag gac gee 2747 Leu Thr Glu Leu Asn Lys Gin He Leu Glu He Gin Glu Lys Asp Ala 485 490 495 gac cag gag gtc t ac ate acc aeg ggc gtc gga age cac cag atg cag 2795 Asp Gin Glu Val Tyr lie Thr Thr Gly Val Gly Se r His Gin Met Gin 500 505 510 gca geg cag 11 c c 11 acc tgg acc aag ccg ege cag tgg ate ICC teg 2843 AI a Ala Gin Phe Leu Thr Trp Thr Lys Pro Arg Gin Trp lie Se r Se r 515 520 525 ggt ggc gee ggc act atg ggc t ac ggc c 11 ccc teg gee ait ggc gee 2891 Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Se r Ala lie Gly Ala 530 535 540 aag at t gee aag ccc gat get a 11 gt t at t gac ate gat ggt gat get 2939 Ly s lie Ala Lys Pro Asp Ala lie Val lie Asp lie Asp Gly Asp Ala 545 550 555 560 t c t tat t eg a t g acc ggt atg gaa t tg ate aca gca gee gaa 11 c aag 2987 Se r Tyr Se r Met Thr Gly Met Glu Leu lie Thr A] a Ala Glu Phe Lys 565 570 575 g t t ggc gtg aag at t c 11 c t t t tg cag aac aac 111 cag ggc atg gtc 3035 Val Gly Val Lys lie Leu Leu Leu Gin Asn Asn Phe Gin Gly Met Val 580 585 590 aag aac tgg cag gat etc tit t ac gac aag ege t ac teg ggc acc gee 3083 19

Lys Asn Trp Gin Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 atg 11 c aac ccg cgc t tc gac aag g t c gcc gat gcg atg cgt gcc aag 3! 31 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 ggt etc tac tgc gcg aaa cag teg gag etc aag gac aag ate aag gag 3179 Gly Leu Tyr Cys Ala Lys Gin Ser Glu Leu Lys Asp Lys lie Lys Glu 625 630 635 640 ttt etc gag tac gat gag ggt ccc gtc etc etc gag gt t ttc gtg gac 3227 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 aag gac aeg etc gtc ttg ccc atg gtc ccc get ggc ttt ccg etc cac 3275 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670 gag atg gtc etc gag cct cct aag ccc aag gac gcc taa g 11 c 1 1 1 1 1 1 3324 Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 cca tggcggg egagegageg agegegegag cgcgcaagtg cgcaagcgcc t tgcct tget 3384 11 gc 11 cgc t tegetttget 11 gc t t caca caacctaagt a tgaa 11 caa gttttcttgc 3444 t tgteggega tgcctgcctg ccaaccagcc agccatccgg ccggccg tee t tgaegee 1 1 3504 cgc 11 ccggc gcggccatcg at tcaat tea cccatccgat acgttccgcc ccctcacgtc 3564 cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctea gctcagct tg 3624 tegaegagtc gcacgtcaca ta tctcagat gca111ggac tgtgagtgt t at tatgccac 3684 t agcacgcaa egatettegg ggtcctcgct cat tgcatcc g t t cgggccc tgcaggcgtg 3744 gaegegagte gccgccgaga cgctgcagca ggccgctccg aegegaggge tcgagctcgc 3804 cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc 3864 gaegegagga ggaccgaaga gagaege tgg ggtatgeagg atatacccgg ggcgggacat 3924 20 t eg 11 ccgca t acac tcccc ca 11egage t tgctcglcct t ggeagagee gagcgcgaac 39S4 gg 11 ccgaac gcggcaagga 111 tggetet ggtgggtgga c t ccga t ega ggcgcaggt t 4044 c tccgcaggt tctcgcaggc cggcagtggt cgt tagaaat agggagtgcc ggagtet tga 4104 cgcgcc 11 ag c t cac t c t cc gcccacgcgc gcatcgccgc ca t gccgccg tcccgtctgt 4164 ege t gege t g gccgcgaccg gc t gcgccag agtacgacag tgggacagag c tegaggega 4224 egegaa t ege tcgggt tgta agggt t tcaa gggtcgggcg tegtegegtg ccaaag t gaa 4284 aatagtaggg gggggggggg gtacccaccc cgggcaggt t ctcctcgcca gee t aag t gc 4344 c t aagggagc gtaggggt 11 eg 11 gaccag agaageggag aacc t geege ggegeggaga 4404 acctatcggc ggagaa c t t g ccaggcgcga ggcagt tctc caat t tgegg acagcggcgc 4464 gcccacgcga ggcggccgcg t ggcga t aca gegaggegae cgcgcggggc cgcgtggcga 4524 cacagctgcg egeggag t eg gctgcgagaa ggc 11 c t ege t ggc t t gg t t ggggtcgcgg 4584 gtggcagggg a t gga t gccc agg t aeg t eg geg t gegege gcccagggag aaaaggacag 4644 acgcgcgggc ctgcgatgcg ageaegega t gcgagcacgc gatgegagea egegatgega 4704 gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gt 1111 tgt t tggtgat t tc 4764 t a t g t a t geg gggagac 11 c ga t ggccgaa aggggtgcaa ggccaaaaga tgc tgacagc 4824 11 ega t egg t c t aeggegeg ageaggaaag ggagcaaggg geggaa 11 c t tctgeet tga 4884 cccggggga t ccac tag 11 c t agageggee gccaccgcgg t ggage t cca a 11 cgccc t a 4944 tagtgagteg tatt aegege gctcactggc cgt eg1111 a caacgtcgig actgggaaaa 5004 ccctggcgt t acccaac 11 a a t egee 11 gc agcacatccc cct t tcgcca gctggcgtaa 5064 t agegaagag gcccgcaccg a t cgccc 11 c ccaacagt tg cgcagcc tga atggcgaatg 5124 ggacgcgccc tgtagcggcg cat taagege ggcgggtgtg gtggt taege gcagcgtgac 5184 ege t acac 11 gccagcgccc t agcgcccgc t cc 111 ege t 11 c 11 ccc 11 cc 111 c t ege 5244 21 1377253 cacgt tcgcc ggct t tcccc gtcaagcict aaatcggggg c t ccc t 11 ag gg 11 ccga 11 5304 t ag t gc 111 a cggcacc t eg accccaaaaa ac 11 ga 11 ag gg t ga t gg 11 cacg t ag t gg 5364 gcca t cgccc t ga t agaegg 11111 cgccc 11 tgacgt tg gag t ccacg t t c 111 aa t ag 5424 tggac tc 11g 11 ccaaac t g gaacaacac t caaccc t a t c t egg t c t a t t c t 11 t g a 111 5484 ataagggat t t tgeegat 11 cggcctattg gi taaaaaat gage t ga 11 t aacaaaaa 11 5544 t aacgcgaa t 11 taacaaaa t a 11 aaege t t acaa 111 ag g t ggcac 111 tcggggaaat 5604 gtgcgcggaa cccc t a 11 t g 11 tat 11 ttc taaatacat t caaa t a t g t a tccgctcatg 5664 agacaataac cc t ga t aa a t gc 11 c a a t aa tat tgaaaaa ggaagagta t gag t a t t caa 5724 ca 111 ccg t g t egeec 11 a t t ccc 11 1111 geggea 1111 gee t t cc tg t 1111 gc t cac 5784 ccagaaacgc tggtgaaagt aaaaga t gc t gaagatcagt tgggtgcacg agtgggt tac 5844 a t cgaac t gg a t c t caacag eggtaagate c t t gagag t t t tcgccccga agaacg 1111 5904 ccaa t ga t ga gc ac 1111 a a ag 11 c t gc t a tgtggcgcgg t a t t a t cccg tat tgaegee 5964 gggcaagagc aactcggtcg ccgca t acac t a 11 c t caga a t gac t t gg t t gag t ac t ca 6024 ccagtcacag aaaagcat ct taeggatgge atgacagtaa gagaat tatg cag t gc t gee 6084 ataaccatga gtgataacac tgcggccaac 11 ac 11 c t ga caacga t egg aggaccgaag 6144 gagctaaccg c 11111 tgea caaca tgggg ga t ca t g t aa c t egee t tga tegt tgggaa 6204 ccggagc t ga a t gaagcca t accaaacgac gageg t gaca ccacga t gee t g t age aa t g 6264 gcaacaacgt tgcgcaaac t at t aac tggc gaac t ac 11 a c t c t age 11 c ccggcaacaa 6324 11 aa t agac t gga t ggagge ggataaagtt gcaggaccac 11 c t gege t c ggccc 11 ccg 6384 gctggctggt 11 a 11 gc t ga taaatctgga gccggtgagc gtgggtctcg egg t a t ca 11 6444 gcagcac t gg ggccagatgg t aageec t cc eg t a t eg t ag 11 a t c t acac gacggggag t 6504

22 caggcaac t a tggatgaacg aaa t agacag a t ege t gaga taggtgcctc ac tga11 aag 6564 ca 11 ggiaac tgtcagacca ag 111 ac t ca t a t a t ac 111 aga 11ga111 aaaact teat 6624 111 taat t ta aaagga t c t a ggtgaaga tc c 11111 ga t a atctcatgac caaaa t ccc t 6684 taacgtgagt 11 tcet tcca ctgagcgtca gaccccgtag aaaaga t caa agga t c 11 c t 6744 t gaga t cc t t 1111 tc t gcg eg t aa t c t gc tget tgcaaa caaaaaaacc accgc t acca 6804 gcgg t gg t t t g11 tgccgga tcaagagc ta ccaac t c 111 11 ccgaagg t aac tggc 11 c 6864 agcagagcgc agataccaaa t ac t g t cc t t c t ag t g t age eg t ag 11 agg ccaccact tc 6924 aagaactctg t agcaccgcc t aca t acc t c gc t c t gc t aa t cc t g 11 acc agtggctgct 6984 gccagtggcg a t aagt eg 1g ten accggg 11 ggac t caa gaega t ag 11 accggataag 7044 gcgcagcgg t cgggctgaac ggggggt teg tgcacacagc ccagc 11 gga gcgaacgacc 7104 tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgc t t cccgaaggg 7164 agaaaggcgg acaggt a t cc gg t aagegge aggg t eggaa caggagagcg caegagggag 7224 c 11 ccagggg gaaacgcc tg g t a t c 111 a t agtcctgtcg ggt t tcgcca cc t c tgac 11 7284 gagcgtcgat 111 tgtga tg c t eg t caggg gggeggagee t a t ggaaaaa cgccagcaac 7344 gcggcc 1111 t aeggt t cc t ggee 1111 gc tggcct 11 tg c tcaca tgt t c 111 cc t gcg 7404 t tatcccctg attctgtgga taaccgtat t accgcct t tg agtgagctga t accgc t ege 7464 cgcagccgaa cgaccgagcg cagcgag t ca gtgagegagg aageggaaga gcgcccaa t a 7524 cgcaaaccgc c t c t ccccgc gegt tggccg a 11 ca t t aa t gcagctggca cgacagg 111 7584 cccgactgga aagcgggcag tgagcgcaac gcaa 11 aa tg tgagt taget cact ca 11 ag 7644 gcaccccagg c 111 acac 11 t a t gc 11 ccg gc t eg t a tg t tgtgtggaat tgtgagcgga 7704 t aacaa 111 c acacaggaaa cage t a t gac ca t ga 11 aeg ccaagcgcgc aa 11 aaccc t 7764 cac t aaaggg aacaaaagc t gggtaccggg ccccccc teg aggtegaege t a t ega t aag 7824 23 1377253 c t tga t a teg aa t t c c t gc a gc c 7847 <210> 15 <211> 684 <212> PRT <213> 裂壺菌 <400〉 15 Met Se r Ala Thr Arg Ala A1 a Thr Arg Thr Ala Ala Ala Leu Se r Se r 1 5 10 15 Ala Leu Thr Thr Pro Val Ly s Gin Gin Gin Gin Gin Gin Leu Arg Val 20 25 30 Gly Ala Ala Se r A1 a Arg Leu A] a Ala Ala Ala Phe Se r S e r Gly Thr 35 40 45 G 1 y Gly Asp Ala A 1 a Ly s Ly s Ala Ala Ala Ala Arg Ala Phe S e r Thr 50 55 60 Gly Arg Gly Pro Asn Ala Thr Arg Glu Ly s Se r Se r Leu A a Thr Val 65 70 75 80 Gin Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gin 85 90 95 lie Phe His Glu Leu Met Arg Glu His Gin Val Asp Thr lie Phe Gly 100 105 110 Tyr Pro Gly Gly Ala lie Leu Pro Val Phe Asp Ala lie Phe Glu Se r 1 15 120 125 Asp Ala Phe Ly s Phe lie Leu Ala Arg His Glu Gin Gly A1 a Gly His 130 135 140 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Ly s Pro Gly Val Val Leu 24 1377253

145 150 Ϊ55 *60 Val Thr Ser Gly Pro Gly Ala Thr Asn Thr 〖le Thr Pro lie Met Asp 165 170

Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Pro 180 185 190

Thr Ser Ala Val Gly Thr Asp Ala Phe Gin GIu Cys Asp lie Val Gly j95 200 205 lie Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220

Glu Leu Pro Arg Arg lie Asn Glu Ala Phe Glu lie Ala Met Ser Gly 225 230 235 240

Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255

Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gin Val Ala Val Arg Gin 260 265 270

Lys Gin Lys Val Glu Leu Phe His Lys Glu Arg lie Gly Ala Pro Gly 275 280 285

Thr Ala Asp Phe Lys Leu lie Ala Glu Met lie Asn Arg Ala Glu Arg 290 295 300 pro Val lie Tyr Ala Gly Gin Gly Val Met Gin Ser Pro Leu Asn Gly 305 310 315 320 25 1377253

Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn lie Pro al Thi 325 330 335

Thr Thr Met Gin Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350

Leu Lys Met Leu Gly Met 355

His

Gly 360

Ser Ala Tyr Ala Asn Tyr 365

Ser Met

Gin Asn Ala Asp Leu 370

He Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 375 380

Val Thr Gly Arg Va! Asp Ala Phe Ala 385 390

Pro Glu Ala Arg Arg Ala Glu 395 400

Arg Glu Gly Arg Gly Gly lie Val His Phe Glu lie Ser Pro Lys Asn 405 410 415

Leu His Lys Val Val Gin Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430

Glu Asn Leu Ala Asn Val Thr Pro His Val Gin Arg Gin Glu Arg Glu 435 440 445

Pro Trp Phe Ala Gin lie Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460

Leu GJu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gin Gin Val 465 470 475 480

Leu Thr Glu Leu Asn Lys Gin lie Leu Glu Me Gin Glu Lys Asp Ala 485 490 495 26 1377253

Asp Gin G】u Val Tyr lie Thr Thr Gly Val Gly Ser His Gin Met Gin 500 505 510

Ala Ala Gin Phe Leu Thr Trp Thr Lys Pro Arg Gin Trp Me Ser Ser 515 520 525

Gly Gly Ala G]y Thr Met Gly Tyr Gly Leu Pro Ser Ala lie Gly Ala 530 535 540

Lys lie Ala Lys Pro Asp Ala lie Val lie Asp lie Asp Gly Asp Ala 545 550 555 560

Ser Tyr Ser Met Thr Gly Met Glu Leu lie Thr Ala Ala Glu Phe Lys 565 570 575

Val Gly Val Lys He Leu Leu Leu Gin Asn Asn Phe Gin Gly Met Val 580 585 590

Lys Asn Trp Gin Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605

Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620

Gly Leu Tyr Cys Ala Lys Gin Ser Glu Leu Lys Asp Lys Me Lys Glu 625 630 635 640

Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655

Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670 27 1377253

Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 6S0 <210> 16 <21 1> 30 <212〉DNA <213> 裂壺菌 <400> 16 t a t cga t aag c 11 gacg t eg aa 11 c c t gc a 30 <210> 17 <21 1> 32 <212> DNA <213> 裂壺菌 <400> 17 catggtcaag aacgt tcagg a t c t c 1111 a eg 32 <210> 18 <211> 7847 <212> DNA <213> 裂壺菌 <220> <221> prim_transcript <222> ( 1 ). .( 1259) <223> <220> <221> CDS <222> (1260). .(3314) <223> <220> <221> p r im_t ransc ri pt <222> (3315). .(4887) <223> <220> <221> mutation <222> (3042)..(3044) <223> <400> 18 t tgtcgacag caact tgcaa gt t a t aegeg accaccaggc aatctcagca cgcccagcga 60 gcacggagc t tgegaagagg gt t tacaagt eg t eg 11 ca t tcgctctcaa gc 11 tgee tc 120 aacgcaac t a ggcccaggcc t ac 111 cac t gtgtct tgtc t tgee 11 tea caccgaccga 180 gtgtgcacaa ccgtgt 11 tg cacaaagcgc aagatgetea ctcgactgtg aagaaaggt t 240 gcgcgcaagc gactgcgact gegagga tga ggatgactgg cagcctgt tc aaaaac t gaa 300 aa t ccgcga t gggtcagtgc ca 11 egegea tgaegee tgc gagagacaag t taactcgtg 360 t cac t ggca t g t cc t agea t ct t taegega gcaaaat tea a t ege 11 ta t 11111 cag 11 420 t eg t aacc 11 c t cgcaaccg egaa t egeeg 111cagcc tg ac t aa t c tgc agctgcgtgg 480 cac t g t cag t cagtcagtca gt cgtgcgcg c t g11 ccagc accgaggtcg cgcgtcgccg 540 egee iggacc gc t gc t gc t a ctgctagtgg cacggcagg t aggaget tgt tgccggaaca 600

28 ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg egtegaaggg agaggaagge 660 ggcgtgtgca aactaacgt t gaccactggc gcccgccgac aegageagga ageaggeage 720 tgeagagege agcgcgcaag tgcagaaigc gegaaagatc cacitgcgcg cggcgggcgc 780 gcact tgegg gcgcggcgcg gaacagtgcg gaaaggagcg gtgeagaegg cgcgcagtga 840 cagtgggege aaagccgcgc agtaageage ggcggggaac ggtataegea gtgccgcggg 900 ccgccgcaca cagaagtata cgcgggccga agtggggcgi cgcgcgcggg aagtgcggaa 960 tggcgggcaa ggaaaggagg agaeggaaag agggcgggaa agagagagag agagagtgaa 1020 aaaagaaaga aagaaagaaa gaaagaaaga aageteggag ccacgccgcg gggagagaga 1080 gaaa tgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg 1140 gaggagegeg cgcaggaccc gegeggegag egagegagea cggcgcgcga gegagegage 1200 gagegagege gegagegage aagge 11gct gegagegate gagegagega gegggaagg 1259 atg age geg acc ege geg geg aeg agg aca geg geg geg ctg tee teg 1307 Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser 15 10 15 geg ctg aeg aeg cct g t a aag cag cag cag cag cag cag ctg ege g t a 1355 Ala Leu Thr Thr Pro Val Lys Gin Gin Gin Gin Gin Gin Leu Arg Val 20 25 30 ggc geg geg teg gca egg ctg geg gee geg geg ttc teg tee ggc aeg 1403 Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr 35 40 45 ggc gga gac geg gee aag aag geg gee geg geg agg geg tie tee aeg 1451 Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr 50 55 60 gga ege ggc ccc aac geg aca ege gag aag age teg ctg gee aeg gtc 1499 Gly Arg Gly Pro Asn Ala Thr Arg GJu Lys Ser Ser Leu Ala Thr Val 65 70 75 80 29 1377253 cag geg geg aeg gac gat geg ege 11 c gtc ggc ctg acc ggc gee caa 1547 Gin Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gin 85 90 95 ate 111 cat gag etc atg ege gag cac cag gtg gac acc ate t t t ggc 1595 lie Phe His Glu Leu Met Arg Glu His Gin Val Asp Thr lie Phe Gly 100 105 110 t a c cc t ggc ggc gee a 11 c t g ccc gt t t t t gat gee a 11 t t t gag ag t 1643 Tyr Pro Gly Gly Ala Me Leu Pro Val Phe Asp Ala lie Phe Glu Se r 115 120 125 gac gee 11 c aag 11 c a 11 etc get ege cac gag cag ggc gee ggc cac 1691 Asp Ala Phe Ly s Phe lie Leu Ala Arg His Glu Gin Gly Ala Gly His 130 135 140 atg gee gag ggc t ac geg ege gee aeg ggc aag ccc ggc Et t gtc etc 1739 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu 145 150 155 160 g t c acc teg ggc c c t gga gee acc aac acc ate acc ccg ate atg gat 1787 Val Thr Se r Gly Pro Gly Ala Thr Asn Thr lie Thr Pro lie Met Asp 165 170 175 get t ac atg gac ggt aeg ccg ctg etc gtg t c acc ggc cag gtg ccc 1835 Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Pro 180 185 !90 acc t c t get gtc ggc aeg gac get t c cag gag tgt gac at t fit t ggc 1883 Thr Se r Ala Val Gly Thr Asp Ala Phe Gin Glu Cys Asp lie Val Gly 195 200 205 ate age ege geg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931 lie Se r Arg Ala Cys Thr Lys Trp Asn Val Me t Val Lys Asp Val Lys 210 215 220 gag etc ccg ege ege ate aa t gag gee 111 gag at t gee atg age ggc 1979 G1 u Leu Pro Arg Arg lie Asn Glu Ala Phe Glu Me Ala Met Se r Gly 225 230 235 240 ege ccg ggt ccc gtg etc gtc gat c 11 cc t aag gat gtg acc gee gt t 2027 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255

30 gag etc aag gaa a tg ccc gac age tee ccc cag gt t get gtg ege cag 2075 Glu Leu Lys Glu Met Pro Asp Se r Se r Pro Gin Val Ala Va! Arg Gin 260 265 270 aag caa aag g t c gag ct t 11 c cac aag gag ege a 11 ggc get cc t ggc 2123 Lys Gin Lys Val Glu Leu Phe His Lys Glu Arg lie Gly Ala Pro Gly 275 280 285 acg gee gac 11 c aag etc a t t gee gag atg ate aac cgt geg gag ega 2171 Thr Ala Asp Phe Lys Leu lie Ala Glu Met lie Asn Arg Ala Glu Arg 290 295 300 ccc gt c ate tat get ggc cag ggt gtc atg cag age ccg t tg aa t ggc 2219 Pro Val lie Tyr Ala Gly Gin Gly Val Met Gin Se r Pro Leu Asn Gly 305 310 315 320 ccg get gtg etc aag gag t c geg gag aag gee aac at t ccc gtg acc 2267 Pro Ala Val Leu Lys Glu Phe A a Glu Lys Ala Asn lie Pro Val Thr 325 330 335 acc acc a g cag ggt etc ggc ggc 111 gac gag cgt ag t ccc etc tee 2315 Thr Thr Met Gin Gly Leu Gly Gly Phe Asp Glu Arg Se r Pro Leu Se r 340 345 350 etc aag a tg etc ggc atg cac ggc t c t gee t ac gee aac t a c teg atg 2363 Leu Lys Met Leu Gly Met His Gly Set Ala Tyr Ala Asn Tyr Se r Met 355 360 365 cag aac gee gat ct t ate ctg geg etc ggt gee ege 111 gat gat eg t 241 1 Gin Asn Ala Asp Leu lie Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 gtg acg ggc ege gt t gac gee 111 get CCfi gag get ege cgt gee gag 2459 Val Thr Gly A rg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 ege gag ggc ege ggt ggc ate gt t cac 111 gag a 11 tee ccc aag aac 2507 Arg Glu Gly Arg Gly Gly lie Val His Phe Glu lie Se r Pro Lys Asn 405 410 415 etc cac aag gtc gtc cag ccc acc gtc gC£ gtc etc ggc gac gtg gtc 2555 Leu His Lys Val Val Gin Pro Thr Val Ala Va] Leu Gly Asp Val Val 31 420 425 430 gag aac etc gee aac g t c aeg ccc cac gtg cag ege cag gag ege gag 2603 Glu Asn Leu Ala Asn Val Thr Pro His Val Gin Arg Gin Glu Arg Glu 435 440 445 ccg tgg 111 geg cag ate gee gat tgg aag gag aag cac cc t 111 c tg 2651 Pro Trp Phe Ala Gin lie Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460 etc gag t c t gtt gat teg gac gac aag gt t etc aag ccg cag cag g t c 2699 Leu Glu Se r Val Asp Se r Asp Asp Lys Val Leu Lys Pro Gin Gin Val 465 470 475 480 etc aeg gag c 11 aac aag cag att etc gag att cag gag aag gac gee 2747 Leu Thr Glu Leu Asn Lys Gin lie Leu Glu lie Gin Glu Lys Asp Ala 485 490 495 gac cag gag g t c t ac ate acc aeg ggc g t c gga age cac cag atg cag 2795 Asp Gin Glu Val Tyr lie Thr Thr Gly Val Gly Se r His Gin Met Gin 500 505 510 gca geg cag 11 c c 11 acc tgg acc aag ccg ege cag tgg ate tee teg 2843 A1 a Ala Gin Phe Leu Thr Trp Thr Lys Pro Arg Gin Trp lie Se r Se r 515 520 525 ggt ggc gee ggc act a t g ggc t ac ggc c t t CCC teg gee att ggc gee 2891 Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Se r Ala lie Gly Ala 530 535 540 aag a 11 gee aag ccc gat get att gtt att gac ate gat ggt gat get 2939 Lys lie Ala Lys Pro Asp Ala lie Val Me Asp lie Asp Gly Asp Ala 545 550 555 560 t c t tat teg a t g acc ggt a t g gaa ttg ate aca gca gee gaa 11 c aag 2987 Se r Tyr Se r Met Thr Gly Met Glu Leu lie Thr Ala Ala Glu Phe Lys 565 570 575 gt t ggc gtg aag a 11 c 11 c 11 ttg cag aac aac 111 cag ggc atg gtc 3035 Val Gly Val Lys lie Leu Leu Leu Gin Asn Asn Phe Gin Gly Met Val 580 585 590 aag aac gtt cag gat etc 111 t ac gac aag ege tac teg ggc acc gee 3083 32

Lys Asn Val Gin Asp Leu Phe Tyr Asp Lys Arg Tyr Ser G!y Thr Ala 595 600 605 atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag 3131 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 ggt etc tac tgc gcg aaa cag teg gag etc aag gac aag ate aag gag 3179 Gly Leu Tyr Cys Ala Lys Gin Ser Glu Leu Lys Asp Lys 丨le Lys Glu 625 630 635 640 ttt etc gag tac gat gag ggt ccc gtc etc etc gag gtt ttc gtg gac 3227 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 aag gac aeg etc gtc ttg ccc atg gtc ccc get ggc ttt ccg etc cac 3275 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670 gag atg gtc etc gag cc t cct aag ccc aag gac gcc taa gttctttttt 3324 Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 ccatggcggg egagegageg agegegegag cgcgcaagtg cgcaagcgcc t tgcct tget 3384 t tget teget tegett tget t tget tcaca caacctaagt atgaat tcaa gttttcttgc 3444 11 g t eggega t gcc tgc c t g ccaaccagcc agccatccgg ccggccg tee t tgaegee 1 1 3504 cgc 11 ccggc gcggcca t eg attcaattca cccatccgat aegt tccgcc ccctcacgtc 3564 eg t c t gegea cgacccc tgc acgaccacgc caaggccaac gcgccgctca gc t c age t t g 3624 tegaegagte gcacgt caca tatctcagat gcatttggac tgtgagtgt t a 11 a t gccac 3684 t agcacgcaa ega t c 11 egg gg t cc t cgc t ca 11 gca t cc g 11 egggeec t gcaggeg t g 3744 gaegegagte gccgccgaga cgctgcagca ggeegetccg aegegaggge tcgagctcgc 3804 cgcgcccgcg ega t g t c t gc c t ggegeega ctgatctctg gagege a agg aagacacggc 3864 gaegegagga ggaccgaaga gagacgctgg ggtatgeagg atatacccgg ggcgggacat 3924 33 t eg t t cegea t acac t cccc ca 11 egage t t gc t eg t cc t tggeagagee gagcgcgaac 3984 ggt tccgaac gcggcaagga 111 tggctc t ggtgggtgga c t ccga t ega ggcgcaggtl 4044 c t ccgcagg t t c t egeagge cggcagtggt eg 11 agaaa t afiggagtgee ggagtc t tga 4104 cgcgcc t tag c t cac t c t cc gcccacgcgc gcatcgccgc ca tgccgccg t cccg t c t g t 4164 cgctgcgctg gccgcgaccg gc t gcgccag ag t acgacag tgggacagag ctcgaggcga 4224 egegaa t ege tcgggt tgta agggt t tcaa Sggtcgggcg tegtegegtg ccaaag t gaa 4284 aa t ag t aggg gggggggggg g t acccaccc egggeagg 11 c t cc t cgcca gcctaagtgc 4344 c t aagggagc gtaggggt t t eg t tgaccag agaageggag aacc t geege ggegeggaga 4404 acc t a t egge ggagaact tg ccaggcgcga ggcagt tctc caa 11 tgegg acagcggcgc 4464 gcccacgcga ggcggccgcg t ggega t aca gegaggegae cgcgcggggc cgcgtggcga 4524 cacagctgcg egeggagteg gc t gegagaa ggc 11 c t ege tgget tggt t ggggtcgcgg 4584 gtggcagggg a t gga t gccc agg t aeg t eg gcgtgcgcgc gcccagggag aaaaggacag 4644 acgcgcgggc ctgcgatgcg ageaegegat gcgagcacgc gatgegagea egegatgega 4704 gcacgcgagc gagcgcccga gcaaa tgcca cggaacacgc gt 1111 tgt t tggtgat t tc 4764 t a t g t a t geg gggagac 11 c gat ggccgaa aggggtgcaa ggccaaaaga t gc t gacagc 4824 11 ega t egg t c t aeggegeg ageaggaaag ggagcaaggg geggaa t tc t tc tgeet tga 4884 cccgggggat ccac tag11 c tagageggee gccaccgcgg tggage t cca a 11 cgccc t a 4944 tagtgagteg t a 11 aegege gc t cac t ggc cgtcgt 11 ta caacgtcgtg act gggaaaa 5004 ccc t ggcg 11 acccaac 11 a a t egee 11 gc agcaca t ccc cc 111 cgcca gctggcgtaa 5064 t agegaagag gcccgcaccg a t cgccc t tc ccaacagt tg cgcagcc tga a t ggcgaa t g 5124 ggacgcgccc tgtagcggcg cat taagege Sgcgggtgtg gtggt taege gcagcgtgac 5184 cgctacact t gccagcgccc t agcgcccgc tcc111 ege t t tc 11ccc 11 cc 111 c t ege 5244 34 cacg 11 cgcc gget 11 cccc g t caagc t c t aaa t cggggg c t ccc 111 ag gg 11 ccga 11 5304 t ag t gc 111 a cggcacctcg accccaaaaa ac t t ga 11 ag ggtgatggt t cacgtagtgg 5364 gcca i cgccc tgaiagacgg 11111 cgccc 11 tgacgt tg gagtccacgt t c t 11 aa t ag 5424 tggactct tg t tccaaactg gaacaacact caaccctatc t egg t c t a 11 c 1111 ga 111 5484 at aaggga 11 t tgeegat 11 eggee t a 11 g gt taaaaaat gagetgat 11 aacaaaaa\t 5544 taacgcgaat 111 aac aaaa t a 11 aaege t tacaat t tag gtggcact 11 tcggggaaat 5604 gtgcgcggaa ccccta 11 tg 111 a 1111 t c t aa a t ac a 11 caaa t a t gt a tccgctcatg 5664 agacaa t aac cc t ga t aaa t gc 11 c a a t a a tat tgaaaaa ggaagag t a t gagtat tcaa 5724 ca 111 ccg t g t cgccc 11 a t t c c c t 11111 geggeat 111 gee 11 cc tg t 1111 gc t cac 5784 ccagaaacgc tggtgaaagt aaaagatgct gaaga t cag t tgggtgcacg agtgggt tac 5844 atcgaactgg atctcaacag egg t aaga t c c 11 gagagt t t tcgccccga agaaegt 111 5904 ccaatgatga gcac 1111 aa agt tcigcta tgtggcgcgg t a 11 a t cccg t a 11 gaegee 5964 gggcaagagc aactcggtcg ccgcatacac t a 11 c t caga atgact tggt t gag t ac t ca 6024 ccag t cacag aaaagca t c t t aegga tgge a t gacag t aa gagaa 11 a t g cag t gc t gee 6084 a t aacca t ga g t ga taacac tgcggccaac 11 ac 11 c t ga caacga t egg aggaccgaag 6144 gage t aaccg c 111111 gca caacatgggg gatcatgtaa c t cgcc t tga t eg 11 gggaa 6204 ccggagctga atgaagccat accaaacgac gagcgtgaca ccacga t gee tg t agcaa tg 6264 gcaacaacg t tgcgcaaac t a t t aac tgge gaac t ac 11 a c t c t agc 11 c ccggcaacaa 6324 t t a a t agac t gga t ggagge gga t aaag t t gcaggaccac 11 c t gege t c ggccc 11 ccg 6384 gctggctggt 11 at tgc tga t aaa t c tgga gccggtgagc gtgggtctcg egg t a t ca 11 6444 gcagcac t gg ggccaga tgg t aagccc t cc egtategtag 11 a t c t acac gacggggagt 6504 35 caggcaac t a t gga t gaacg aa a t agacag a t ege t gaga t agg t gee t c ac t ga 11 a ag 6564 cat tggtaac tgtcagacca ag 111 ac tea t a t a t ac 111 agat tgat 11 aaaact teat 6624 1111 aa 111 a aaagga t c t a gg t gaagat c c 11111 ga t a a t c t ca t gac caaaa t ccc t 6684 taacgtgagt 111 eg 11 cc a ctgagcgtca gaccccgtag aaaaga t caa agga t c 11 c t 6744 t gaga t cc 11 11111 c tgcg eg t aa t c tgc t gc 11 gcaaa caaaaaaacc accgc t acca 6804 gcggtggt 11 gt t tgccgga tcaagagcta ccaac t c 111 t teegaaggt aac t ggc 11 c 6864 agcagagcgc agataccaaa t ac t g t cc 11 c t ag t g t age eg t ag t t agg ccaccac t t c 6924 aagaactctg t agcaccgcc t aca t acctc gc t c t gc t a a t cc t g t t acc ag t ggc t gc t 6984 gccag tggcg a t aag t eg t g t c 11 a c eggg t tggactcaa gaega t agt t accgga t aag 7044 gcgcagcgg t eggge t gaac ggggggt teg tgcacacagc ccagc t tgga gcgaacgacc 7104 t acaccgaac t gaga t acc t acagcg t gag c t a t gagaaa gcgccacgc t tcccgaaggg 7164 agaaaggcgg acagg t a t cc gg t aagegge agggt eggaa caggagagcg cacgagggag 7224 c 11 ccagggg gaaacgcc tg gt a t c 11 tat agtcctgtcg ggt t tcgcca cc t c tgac 11 7284 gagcgtcgat 1111 g t ga tg ctcgtcaggg gggeggagee t a t ggaaaaa cgccagcaac 7344 gcggcc 1111 taeggt tcct ggcct 11 tgc tggcct 11 tg ctcacatgt t ct t tcctgcg 7404 11 a t cccc t g a 11 c t g t gga taaccgtatt accgcct t tg agtgagctga t accgc t ege 7464 cgcagccgaa cgaccgagcg cagcgag tea gtgagegagg aageggaaga gcgcccaa t a 7524 cgcaaaccgc ctctccccgc gegt tggccg a 11 ca 11 aa t gcagc tggea cgacagg 111 7584 cccgac t gga aagcgggcag tgagcgcaac gcaat taatg tgagt taget cac t ca 11 ag 7644 gcaccccagg c 111 acac 11 t a t gc 11 ccg getegtatgt tgtgtggaat tg t gagegga 7704 t aacaa 111 c acacaggaaa cagctatgac catgat tacg ccaagcgcgc aat taaccct 7764 cactaaaggg aacaaaagc t gggtaccggg ccccccc teg aggtegaegg t a t ega t aag 7824 36 1377253

c 11 gacg t eg aattcctgca gee <210> 19 <211> 684 <212> PRT <213> 裂壺菌 <400> 19

Met Se r Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala A1 a Leu Se r Se r 1 5 10 15 Ala Leu Thr Thr Pro Val Lys Gin Gin Gin Gin Gin Gin Leu Arg Val 20 25 30 Gly Ala Ala Se r Ala Arg Leu Ala Ala A1 a Ala Phe Se r Se r Gly Thr 35 40 45 Gly Gly Asp Ala A1 a Lys Lys Ala Ala Ala Ala Arg Ala Phe Se r Thr 50 55 60 Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Se r Se r Leu Ala Thr Val 65 70 75 80 Gin Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gin 85 90 95 lie Phe His Glu Leu Met Arg Glu His Gin Val Asp Thr lie Phe Gly 100 105 110 Tyr Pro Gly Gly Ala lie Leu Pro Val Phe Asp Ala lie Phe Glu Se r 115 120 125

Asp Ala Phe Lys Phe lie Leu Ala Arg His Glu Gin Gly Ala Gly H 1 30 135 140

Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu 1377253 145 150 155 160

Val Thr Ser Gly Pro Gly Aia Thr Asn Thr lie Thr Pro lie Met Asp 165 170 175

Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Pro 180 185 190

Thr Ser Ala Val Gly Thr Asp Ala Phe Gin Glu Cys Asp lie Val Gly 195 200 205 lie Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220

Glu Leu Pro Arg Arg lie Asn Glu Ala Phe Glu lie Ala Met Ser Gly 225 230 235 240

Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255

Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gin Val Ala Val Arg Gin 260 265 270

Lys Gin Lys Val Glu Leu Phe His Lys Glu Arg lie Gly Ala Pro Gly 275 280 285

Thr Ala Asp Phe Lys Leu lie Ala Glu Met lie Asn Arg Ala Glu Arg 290 295 300

Pro Val lie Tyr Ala Gly Gin Gly Val Met Gin Ser Pro Leu Asn Gly 305 310 315 320 38 1377253

Pro Ala Val Leu Ly s Glu Phe Ala Glu Ly s Ala Asn lie Pro Val Thr 325 330 335 Thr Thr Met Gin Gly Leu Gly Gly Phe Asp Glu Arg Se r Pro Leu Se r 340 345 350 Leu Ly s Met Leu Gly Met His Gly Se r Ala Tyr Ala Asn Tyr Se r Met 355 360 365 Gin Asn Ala Asp Leu I le Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 Arg Glu Gly Arg Gly Gly lie Val His Phe Glu lie Se r Pro Ly s Asn 405 410 415 Leu His Ly s Val Val Gin Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430 Glu Asn Leu Ala Asn Val Thr Pro His Val Gin Arg Gin Glu Arg Glu 435 440 445 Pro Trp Phe Ala Gin lie Ala Asp Trp Ly s Glu Ly s His Pro Phe Leu 450 455 460 Leu Glu Se r Val Asp Se r Asp Asp Ly s Val Leu Ly s Pro Gin Gin Val 465 470 475 480 Leu Thr Glu Leu Asn Ly s Gin lie Leu Glu lie Gin Glu Ly s Asp Ala 485 490 495 39 1377253

Asp Gin Glu Val Tyr lie Thr Thr Gly Val Gly Ser His Gin Met Gin 500 505 510

Ala Ala Gin Phe Leu Thr Trp Thr Lys Pro Arg Gin Trp lie Ser Ser 515 520 525

Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala lie Gly Ala 530 535 540

Lys lie Ala Lys Pro Asp A1 a lie Val lie Asp lie Asp Gly Asp Ala 545 550 555 560 Ser Tyr Ser Met Thr Gly Met Glu Leu lie Thr A1 a Ala Glu Phe Lys 565 570 575 Val Gly Val Lys lie Leu Leu Leu Gin Asn Asn Phe Gin Gly Met Val 580 585 590 Lys Asn Val Gin Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 Gly Leu Tyr Cy s Ala Lys Gin Ser Glu Leu Lys Asp Lys lie Lys Glu 625 630 635 640 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670

40

Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 <210> 20 <21 1> 26 <212> DNA <213> 裂壺菌 <400〉20 ccggccaggt gcagacctct gctgtc 26 <210> 21 <21 1> 7847 <212> DNA <213> 裂壺菌 <220> <22l> pr i m_ t ransc r i pt <222> ( 1 )..( 1259) <223> <220> <221> mutation <222> (1834)..(1835) <223> <220> <221> CDS <222> (1260)..(3314) <223> <220> <221> prim一transcript <222> (3315)* *(4887) <223> <400> 21 11 g t cgacag caac t tgcaa g11 a t aegeg accaccaggc aa t c t cagca cgcccagcga 60 gcacggagc t tgegaagagg g 111 acaag t cgtcgt teat tcgctctcaa gel t tgcctc 120 aacgcaac t a ggcccaggcc t ac 111 cac t g t g t c 11 g t c 11 gcc 111ca caccgaccga 180 g t g t gcacaa ccgtgt 11 tg cacaaagcgc aaga t gc t ca ctcgactgtg aagaaagg 11 240 gcgcgcaagc gactgcgact gegaggatga ggatgactgg cagcctgt tc aaaaactgaa 300 aa t ccgcga t ggg t cag t gc cat t egegea tgacgcctgc gagagacaag 11 aac t eg t g 360 t cac t ggca t g t cc tagea t c 111 aegega gcaaaa t tea a t ege 111 a t 11111 cag 11 420 t eg t aacc 11 c t cgcaaccg egaa t egeeg t t t cagcc t g ac t aa t c t gc age t geg t gg 480 cac t g t cag t cag t cag t ca gtcgtgcgcg c t g 11 ccagc accgagg teg egeg tegeeg 540 egee tggacc gctgctgcta ctgctagtgg cacggcaggt aggaget tgt tgccggaaca 600 ccagcagccg ccag tegaeg ccagccaggg gaaag t ccgg cgtcgaaggg agaggaagge 660 ggcgtgtgca aac t aacg 11 gaccac tgge gcccgccgac aegageagga ageaggeage 720 41 1377253 tgcagagcgc agcgcgcaag tgcagaatgc gegaaaga t c cact tgcgcg cggcgggcgc 7S0 gcact tgcgg gcgcggcgcg gaacag tgcg gaaaggagcg etgeagaegg cgcgcag t ga 840 cagtgggcgc aaagccgcgc ag t aageage ggcggggaac ggt a t aegea gtgccgcggg 900 ccgccgcaca cagaag t a t a cgcgggccga ag t ggggcg t cgcgcgcggg aag t geggaa 960 tggcgggcaa ggaaaggagg agaeggaaag agggcgggaa agagagagag agagagtgaa 1020 aaaagaaaga aagaaagaaa gaaagaaaga aaget eggag ccacgccgcg gggagagaga 1080 gaaa t gaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg 1140 gaggagcgcg cgcaggaccc gegeggegag egagegagea cggcgcgcga gegagegage 1200 gagcgagcgc gegagegage aagget tgct gegagegate gagegagega geeggaagg 1259 a t g age geg acc ege geg geg aeg i igg aca geg geg geg ctg lee teg 1307

Met Se r Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser 1 5 10 15 geg ctg aeg aeg cc t gta aag cag cag cag cag cag cag ctg ege gta 1355 Ala Leu Thr Thr Pro Val Lys Gin Gin Gin Gin Gin Gin Leu Arg Val 20 25 30 ggc geg geg t eg gca egg ctg geg gee geg geg 11 c teg tee ggc aeg 1403 Gly Ala Ala Se r Ala Arg Leu Ala Ala Ala Ala Phe Se r Se r Gly Thr 35 40 45 ggc gga gac ECg gee aag aag geg gee geg agg geg 11 c tee aeg 1451 Gly Gly Asp Ala A1 a Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr 50 55 60 gga ege ggc ccc aac geg aca ege gag aag age leg ctg gee aeg gtc 1499 Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Se r Se r Leu Ala Thr Val 65 70 75 80 cag geg geg aeg gac gat geg ege t tc gtc ggc ctg acc ggc gee caa 1547 Gin Ala A1 a Thr Asp Asp A1 a Arg Phe Val Gly Leu Thr Gly Ala Gin 85 90 95

42 ate 111 cat gag etc atg ege gag cac cag gtg gac acc ate ttt ggc 1595 He Phe His Glu Leu Met Arg Glu His Gin Val Asp Thr lie Phe Gly 100 105 110 lac cc t ggc ggc gee at t ctg ccc fit t ttt gat gee a 11 ttt gag agt 1643 Tyr Pro G1 y Gly Ala lie Leu Pro Val Phe Asp Ala lie Phe Glu Se r 115 120 125 gac gee 11 c aag t c at t etc get ege cac gag cag ggc gee ggc cac 1691 Asp Ala Phe Ly s Phe lie Leu Ala Arg His Glu Gin Gly Ala Gly His 130 135 140 atg gee gag fige t ac geg ege gee aeg ggc aag ccc ggc gt t gtc etc 1739 Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Ly s Pro Gly Val Val Leu 145 150 155 160 g t c acc t eg ggc c c t gga gee acc aac acc ate acc ccg ate atg gat 1787 Val Thr Se r Gly Pro Gly Ala Thr Asn Thr lie Thr Pro lie Met Asp 165 170 175 get t ac atg gac ggt aeg ccg ctg etc gtg t c acc ggc cag gtg cag 1S35 Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Gin 180 185 190 acc t c t get g c ggc aeg gac get t c cag gag tgt gac a 11 gt t ggc 1883 Thr Se r Ala Val Gly Thr Asp Ala Phe Gin Glu Cy s Asp lie Val Gly 195 200 205 ate age ege geg t gc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931 lie Se r Arg Ala Cy s Thr Ly s Trp Asn Val Met Val Ly s Asp Val Ly s 210 215 220 gag etc ccg ege ege ate aa t gag gee ttt gag at t gee atg age ggc 1979 Glu Leu Pro Arg Arg lie Asn Glu A1 a Phe Glu lie Ala Met Se r Gly 225 230 235 240 ege ccg ggt ccc gtg etc gtc gat c t cc t aag gat gtg acc gee gt t 2027 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Ly s Asp Val Thr Ala Val 245 250 255 gag etc aag gaa atg ccc gac age tee ccc cag gt t get gtg ege cag 2075 Glu Leu Ly s Glu Met Pro Asp Se r Se r Pro Gin Val Ala Val Arg Gin 260 265 270 43 aag caa aag gtc gag ct t 11 c cac aag gag ege at t ggc get cc t ggc 2123 Ly s Gin Lys Val Glu Leu Phe His Lys Glu Arg lie Gly Ala Pro Gly 275 280 285 acg gee gac i tc aag etc at t gee gag atg ate aac cgt geg gag ega 2171 Thr Ala Asp Phe Lys Leu He Ala Glu Met Me Asn Arg Ala Glu Arg 290 295 300 ccc g t c ate tat get ggc cag ggt gtc atg cag age ccg t tg a a t ggc 2219 Pro Val lie Tyr Ala Gly Gin Gly Val Met Gin Se r Pro Leu Asn Gly 305 310 315 320 ccg get gtg etc aag gag 11 c geg gag aag gee aac a 11 ccc £tg acc 2267 Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn lie Pro Val Thr 325 330 335 a c c acc a tg cag ggt etc ggc ggc 111 gac gag cgt ag t ccc etc tee 2315 Thr Thr Met Gin Gly Leu Gly Gly Phe Asp Glu Arg Se r Pro Leu Se r 340 345 350 etc aag atg etc ggc atg cac ggc tet gee t ac gee aac l ac leg atg 2363 Leu Ly s Met Leu Gly Met His Gly Se r Ala Tyr Ala Asn Tyr Se r Met 355 360 365 cag aac gee gat ct t ate ctg geg etc ggt gee ege 111 gat gat cgt 2411 Gin Asn Ala Asp Leu lie Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 gtg acg ggc ege gt t gac gee t t get ccg gag get ege cgt gee gag 2459 Val Thr G1 y Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 ege gag ggc ege ggt ggc ate gtt cac 11 t gag at t tee ccc aag aac 2507 Arg Glu Gly Arg Gly Gly lie Val Hi s Phe Glu He Se r Pro Lys Asn 405 410 415 etc cac aag gtc gtc cag ccc acc gtc geg gtc etc ggc gac gtg gtc 2555 Leu His Lys Va】 Val Gin Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430 gag aac etc gee aac gtc acg ccc cac gtg cag ege cag gag ege gag 2603 Glu Asn Leu Ala Asn Val Thr Pro His Val Gin Arg Gin Glu Arg Glu 44 435 440 445 gee gat tgg aag gag aag Ala Asp Trp Lys Glu Lys 455 460 gac gac aag gtt etc aag Asp Asp Lys Val Leu Lys 475 cag a t t etc gag a 11 cag Gin lie Leu Glu lie Gin 490 acc aeg ggc gtc gga age Thr Thr Gly Val Gly Ser 505 tgg acc aag ccg ege cag Trp Thr Lys Pro Arg Gin 520 ggc tac ggc ett ccc teg Gly Tyr Gly Leu Pro Ser 535 540 get a 11 gt t a t t gac ate Ala lie Val lie Asp lie 555 atg gaa t tg ate aca gca Me t Glu Leu lie Thr Ala 570 ett t tg cag aac aac ttt Leu Leu Gin Asn Asn Phe 585 ttt tac gac aag ege tac Phe Tyr Asp Lys Arg Tyr 600 gac aag gtc gee gat gcg cac cct ttt ctg 2651 His Pro Phe Leu ccg tgg 111 gcg cag ate Pro Trp Phe Ala Gin lie 450 etc gag tct g11 gat teg Leu Glu Ser Val Asp Ser 465 470 etc aeg gag c 11 aac aag Leu Thr Glu Leu Asn Lys 485 gac cag gag gtc tac ate Asp Gin Glu Val Tyr lie 500 gca gcg cag t t c c 11 acc Ala Ala Gin Phe Leu Thr 515 ggt ggc gee ggc act atg Gly Gly Ala Gly Thr Met 530 aag a 11 gee aag ccc gat Lys lie Ala Lys Pro Asp 545 550 tet tat teg atg acc ggt Ser Tyr Ser Met Thr Gly 565 gt t ggc gtg aag at t ett Val Gly Val Lys He Leu 580 aag aac tgg cag gat etc Lys Asn Trp Gin Asp Leu 595 atg 11 c aac ccg ege ttc ccg cag cag gtc 2699

Pro Gin Gin Val 480 gag aag gac gee 2747 G1u Lys Asp Ala 495 cac cag atg cag 2795

His Gin Met Gin 510 tgg ate tee teg 2843

Trp lie Ser Ser 525 gee a t t ggc gee 2891

Ala lie Gly Ala gat ggt gat get 2939

Asp Gly Asp Ala 560 gee gaa ttc aag 2987

Ala Glu Phe Lys 575 cag ggc a tg gtc 3035

Gin Gly Met Val 590 teg ggc acc gee 3083

Ser Gly Thr Ala 605 a t g eg t gee aag 3131 45 1377253

Met Phe Asn 610 gg t c t c t ac G1y Leu Tyr 625 t 11 etc gag Phe Leu Glu

Pro Arg Phe aag gac aeg Lys Asp Thr gag atg gtc Glu Met Val 675 tgc geg aaa Cys Ala Lys 630 t ac gat gag Tyr Asp Glu 645 etc gtc t t g Leu Val Leu 660 etc gag cct Leu Glu Pro

Asp Lys Val 615 cag teg gag Gin Ser Glu ggt ccc gtc Gly Pro Val ccc atg gtc Pro Met Val 665 cc t aag ccc Pro Lys Pro 680

Ala Asp Ala 620 etc aag gac Leu Lys Asp 635 etc etc gag Leu Leu Glu 650 ccc get ggc Pro Ala Gly aag gac gee Lys Asp Ala

Met Arg Ala

Lys aag atc aag Lys lie Lys gt t t tc gtg Val Phe Val 655 111 ccg etc Phe Pro Leu 670 gag Glu 640 gac Asp 3179 3227 cac His 3275

taa gttctttttt 3324 ccatggcggg egagegageg agegegegag cgcgcaagtg cgcaagcgcc 11 gee 11 gc t 3384 t tget teget t ege 111 gc t 11gc 11 caca caacctaagt atgaat tcaa gt t t tet tgc 3444 t tgteggega t gee t gee t g ccaaccagcc agcca t ccgg ccggccg tee 11 gaegee 11 3504 ege 11 ccggc gcggccatcg a t t c a a t t ca ccca t cega t aeg 11 ccgcc ccctcacgtc 3564 eg t c t gegea cgacccctgc acgaccacgc caaggccaac gcgccgc tea gc t cage t t g 3624 t egaegag t c gcacgtcaca t a t c t caga t gca 11 tggac tgtgagtgt t a 11 a t gccac 3684 t agcacgcaa egatet tegg gg t cc teget cat tgcatcc gt tcgggccc tgcaggcgtg 3744 gaegegag t c gccgccgaga ege tgeagea ggeege t ccg aegegaggge t egage t ege 3804 cgcgcccgcg ega t g t c t gc c t ggegeega c t ga t c t c t g gagcgcaagg aagacacggc 3864 gaegegagga ggaccgaaga gagaege tgg ggt a t gcagg a t a t accegg ggcgggaca t 3924 t eg 11 ccgca t acac t cccc cat t egaget t gc teg t cc t tggeagagee gagcgcgaac 3984 ggt tccgaac gcggcaagga 1111 ggc t ct ggtgggtgga ctccgatcga ggcgcaggt t 4044

£ 46 c t ccgcagg t tctcgcaggc cggcagtggt cgt tagaaat ^gggagtgcc ggag t c 11 ga 4104 cgcgcc t tag c t cac t c t cc gcccacgcgc gca t cgccgc ca t gccgccg t cccg t c t g t 4164 cgctgcgctg gccgcgaccg gc tgcgccag ag t acgacag tgggacagag ctcgaggcga 4224 cgcgaa t cgc tcgggt tgta agggt t tcaa gggtcgggcg tegt egegtg ccaaagtgaa 4284 aa t ag t aggg gggggggggg gt acccaccc cgggcaggt t c t cc t cgcca gee t aag t gc 4344 c t aagggagc gtaggggt tt eg11gaccae agaageggag aaccigccec ggegeggaga 4404 acctatcggc ggagaac t tg ccaggcgcga ggcagt tctc caa 111 gegg acagcggcgc 4464 gcccacgcga ggcggccgcg tggcgataca gegaggegae cgcgcggggc egeg t ggega 4524 cacagctgcg cgcggag t eg gc t gegagaa ggc 11 c t cgc t ggc t t gg t t gggg t egegg 4584 gtggcagggg atggatgccc aggtaegteg gcgtgcgcgc geccagggag aaaaggacag 4644 acgcgcgggc ctgcgatgcg ageaegega t gcgagcacgc gatgegagea egega t gega 4704 gcacgcgagc gagcgcccga gcaaa tgcca cggaacacgc gt 1111 tgt t tgg tga 111c 4764 t a t g t a t gcg gggagac 11 c ga tggccgaa aggggtgcaa ggccaaaaga tgctgacagc 4824 t tcgatcggt c t aeggegeg ageaggaaag ggagcaaggg geggaa 11 c t t c t gee 11 ga 4884 cccgggggat ccactagt tc t agageggee gccaccgcgg tggage t cca a 11 cgc cc t a 4944 tagtgagtcg tat taegege gctcactggc eg t eg 1111 a caacgtcgtg ac t gggaaaa 5004 ccc t ggcg 11 acccaac t t a a t egee 11 gc agcaca t ccc cc t t t egee a gc t ggcg t aa 5064 t agcgaagag gcccgcaccg a t eg cc c t t c ccaacagttg cgcagcc tga atggcgaatg 5124 ggacgcgccc tgtagcggcg cat taagege ggcgggtgtg gtggt taege gcagcgtgac 5184 cgc t acac 11 gccagcgccc t agcgcccgc t cc 111 cgc t t tet tccct t cc 111 c t cgc 5244 cacgt tcgcc ggc 111 cccc g t caagc t c t aaa t cggggg ctccc11 tag ggt teegat t 5304 t ag t gc t t t a cggcacc t eg accccaaaaa act t ga t tag ggtgatggt t cacgtagtgg 5364 47 gcca t cgccc tgatagaegg 11 11 t cgccc 11 t gacg 11 g gag t cc aeg t t c t t t aa t ag 5424 t ggac t c 11 g t t ccaaac t g gaacaacac t caaccc t a t c t egg t c t a t t c t t t t ga t t t 5484 a t aaggga 11 t tgeegat 11 cggcctattg g 11 aaaaaa t gagetgatt t aacaaaaa 11 5544 laacgcgaat 11 taacaaaa t a 11 aaege t t acaa 111 ag g t ggcac 111 tcggggaaat 5604 gtgcgcggaa cccc t a 111 g 11 t a t t 111 c t aa a t ac a 11 caaa t a t gt a t cege t ca t g 5664 agacaataac cc t ga t aaa t gc t tcaataa tat t gaa aa a ggaagag ta t gag t a 11 caa 5724 ca t t t ccg t g t ege c c 11 a t t c cc t t 11 tt geggea 1111 gcc t t cc tg t t t t t gc t cac 5784 ccagaaacgc t gg t gaaag t aaaaga tgc t gaaga t cag t tgggtgcacg agtgggt tac 5844 a t cgaac t gg a t c t caacag eggtaagate ct tgagagt t 11 cgccccga agaacg 1111 5904 ccaatgatga gcac 1111 aa ag 11 c t get a tgtggcgcgg t a 11 a t cccg t a 11 gaegee 5964 gggcaagagc aac t egg t eg ccgca t acac t a 11 c t caga atgac t tggt tgag t ac t ca 6024 ccagtcacag aaaagcatct t aegga t ggc atgacagtaa gagaat tatg cag t gc t gcc 6084 ataaccatga g t ga t aacac tgcggccaac 11 ac 11 c tga caacga t egg aggaccgaag 6144 gage t aaccg c11111 tgea caacatgggg gatcatgtaa ctcgcct tga tegt tgggaa 6204 ccggagctga a t gaagcca t accaaacgac gagcgtgaca ccacga t gcc t g t agcaa t g 6264 gcaacaacg t tgcgcaaact a 11 aac tggc gaac t ac 11 a c t c t age 11 c ccggcaacaa 6324 t taatagact ggatggaggc ggataaagtt gcaggaccac 11 c t gege t c ggccc tccg 6384 gctggctggt t tat tgctga taaatctgga gccggtgagc gtgggtctcg egg t a t ca 11 6444 gcagcac tgg ggccagatgg taagccctcc egtategtag 11 a t c t acac gacggggagt 6504 caggcaac t a tggatgaacg aaa t agacag ategetgaga taggtgcctc actgat taag 6564 cat tggtaac tgtcagacca ag t 11 ac tea t a t a t ac 111 aga 11 ga 111 aaaac t teat 6624 48 11 t taat t ta aaagga t c t a gg t gaaga t c c 11111 ga t a atctcatgac caaaa t ccc t 6684 taacgtgagt 111 eg 11 cca ctgagcgtca gaccccgtag aaaaga t caa agga tc 11ct 6744 tgagatcct t 111 tietgcg cgt aa t c t gc tget tgcaaa caaaaaaacc accgc t acca 6804 gcggtggt 11 gt t tgccgga tcaagagcta ccaac t c 111 t teegaaggt aactggct tc 6864 agcagagcgc agataccaaa t ac t g tcc 11 ctagtgtagc cgtagt tagg ccaccac 11 c 6924 aagaactctg t agcaccgcc t aca t acc t c gc t c t gc t aa tcc tg11acc agtggctgct 6984 gccagtggcg a t aagt eg t g tet taccggg 11 ggac t caa gaegatagt t accgga t aag 7044 gcgcagcgg t cgggctgaac ggggggt teg tgcacacagc ccagct tgga gcgaacgacc 7104 t acaccgaac tgagaiacct acagcgtgag ctatgagaaa gcgccacgc t tcccgaaggg 7164 agaaaggcgg acagg t a t cc ggtaagegge aggg t eggaa caggagagcg cacgagggag 7224 c 11 c c agggg gaaacgcctg g t a t c t 11 a t ag t cc t g t eg ggt t tcgcca cct c tgac 11 7284 gagcgtcgat t t t tgtgatg c t eg t caggg gggeggagee t a t ggaaaaa cgccagcaac 7344 gcggcc 1111 t aegg 11 cc t ggee 111 tgc tggee 111 tg c t caca t g 11 c 111 cc t geg 7404 11 a t cccc t g a t tctgtgga t aaccg t a 11 accgcc 111 g agtgagctga t accgc t ege 7464 cgcagccgaa cgaccgagcg cagcgagtca gtgagegagg aageggaaga gcgcccaa t a 7524 cgcaaaccgc ctctccccgc gegt tggccg at teatlaat gcagctggca cgacaggt 11 7584 cccgactgga aagcgggcag tgagcgcaac gcaat taatg tgagt taget cac t ca 11 ag 7644 gcaccccagg c t t t acac t t t a t gc 11 c eg gc t eg t a t g t tgtgtggaat tgtgagcgga 7704 t aac a a 11 t c acacaggaaa cagctatgac ca t ga t t aeg ccaagcgcgc aa 11 aaccc t 7764 cac t aaaggg aacaaaagc t gggtaccggg ccccccctcg agg t egaegg t a t ega t aag 7824 c 11 gacg t eg a a t t cc t gc a gee 7847 49 1377253 <210> 22 <211> 684 <212> PRT <213> 裂壺菌 <400> 22 Me t Se r A1 a Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Se r Se r l 5 10 15 Ala Leu Thr Thr Pro Val Ly s Gin Gin Gin Gin Gin Gin Leu Arg Val 20 25 30 Gly Ala Ala Se r Ala Arg Leu Ala Ala Ala Ala Phe Se r Se r Gly Thr 35 40 45 Gly Gly Asp Ala Ala Ly s Ly s Ala AI a Ala Ala Arg Ala Phe Se r Thr 50 55 60 Gly Arg Gly Pro Asn Ala Thr Arg Glu Ly s Se r Se r Leu Ala Thr Val 65 70 75 80 Gin Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gin 85 90 95 lie Phe His Glu Leu Met Arg Glu His Gin Val Asp Thr I e Phe Gly 100 105 110 Tyr Pro Gly Gly Ala lie Leu Pro Val Phe Asp Ala lie Phe Glu Se r 115 120 125 Asp Ala Phe Ly s Phe lie Leu Ala Arg His Glu Gin Gly Ala Gly His 130 135 140 Met Ala Glu Gly Tyr A1 a Arg A 1 a Thr Gly Ly s Pro Gly Val Val Leu 145 150 155 160 Val Thr Se r Gly Pro Gly A1 a Thr Asn Thr lie Thr Pro lie Met Asp 50 1377253

165 170 175

Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Gin 180 185 190

Thr Ser Ala Vai Gly Thr Asp Ala Phe Gin Glu Cys Asp lie Val Gly 195 200 205 lie Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220

Glu Leu Pro Arg Arg lie Asn Glu Ala Phe Glu lie Ala Met Ser Gly 225 230 235 240

Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255

Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gin Val Ala Val Arg Gin 260 265 270

Lys Gin Lys Val Glu Leu Phe His Lys Glu Arg lie Gly Ala Pro Gly 275 280 285

Thr Ala Asp Phe Lys Leu lie Ala Glu Met He Asn Arg Ala Glu Arg 290 295 300

Pro Val Me Tyr Ala Gly Gin Gly Val Met Gin Ser Pro Leu Asn Gly 305 310 315 320

Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn 丨le Pro Val Thr 325 330 335 51 1377253

Thr Thr Met Gin Gly Leu Gly Gly 340

Phe Asp Glu Arg Ser Pro Leu Ser 345 350

Leu Lys Met Leu Gly Met His Gly 355 360

Ser Ala Tyr Ala Asn Tyr Ser Met 365

Gin Asn Ala Asp Leu lie Leu Ala 370 375

Leu Gly Ala Arg Phe Asp Asp Arg 380

Val Thr Gly Arg Val Asp Ala Phe 385 390

Ala Pro Glu Ala Arg Arg Ala Glu 395 400

Arg Glu Gly Arg Gly Gly lie Val 405

His Phe Glu He Ser Pro Lys Asn 410 415

Leu His Lys Val Val Gin Pro Thr 420

Val Ala Val Leu Gly Asp Val Val 425 430

Glu Asn Leu Ala Asn Val Thr Pro 435 440

His Val Gin Arg Gin Glu Arg Glu 445

Pro Trp Phe Ala Gin lie Ala Asp 450 455

Trp Lys Glu Lys His Pro Phe Leu 460

Leu Glu Ser Val Asp Ser Asp Asp 465 470

Lys Val Leu Lys Pro Gin Gin Val 475 480

Leu Thr Glu Leu Asn Lys Gin lie 485

Leu Glu lie Gin Glu Lys Asp Ala 490 495

Asp Gin Glu Val Tyr 500 lie Thr Thr Gly Val Gly Ser His Gin Met Gin 505 510 52 1377253

Ala Ala Gin Phe Leu Thr Trp 515

Gly Gly Ala Gly Thr Met Gly 530 535

Lys lie Ala Lys Pro Asp Ala 545 550

Ser Tyr Ser Met Thr Gly Met 565

Val Gly Val Lys lie Leu Leu 580

Lys Asn Trp Gin Asp Leu Phe 595

Met Phe Asn Pro Arg Phe Asp 610 615

Gly Leu Tyr Cys Ala Lys Gin 625 630

Phe Leu Glu Tyr Asp Glu Gly 645

Lys Asp Thr Leu Val Leu Pro 660

Glu Met Val Leu Glu Pro Pro 675

Thr Lys Pro Arg Gin Trp lie Ser Ser 520 525 Tyr Gly Leu Pro Ser Ala lie Gly Ala 540 lie Val lie Asp He Asp Gly Asp Ala 555 560

Glu Leu lie Thr Ala Ala Glu Phe Lys 570 575

Leu Gin Asn Asn Phe Gin Gly Met Val 585 590

Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 600 605

Lys Val Ala Asp Ala Met Arg Ala Lys 620

Ser Glu Leu Lys Asp Lys lie Lys Glu 635 640

Pro Val Leu Leu Glu Val Phe Val Asp 650 655

Met Val Pro Ala Gly Phe Pro Leu His 665 670

Lys Pro Lys Asp Ala 680 53 1377253 <210> 23 <211> 7847 <212> DNA <213> 裂壺菌 <220> prim_transcript <222> ( 1 )..( 1259) <223> <220> <221> CDS <222> (1260)..(3314) <223> <221> <220> <221> prim_transcript <222> (3315)..(4887) <223> <220> <221> mutation <222> (1S34)..(1835) <223> <220> <221> mutation <222> (3042)..(3044) <223> <400> 23 11 g t cgacag caac 11 gcaa g t t a t aegeg accaccaggc aa t c t cagca cgcccagcga 60 gcacggagc t t gcgaagagg gt t tacaagt eg t eg 11 ca t t ege t c t caa gc 111 gee t c 120 aacgcaac t a ggcccaggcc t ac 111 cac t g t g t c 11 g t c 11 gee t 11 ca caccgaccga 180 gtgtgcacaa ccg t g 1111 g cacaaagcgc aagatgetea ctcgac tgtg aagaaagg 11 240 gcgcgcaagc gac t gcgac t gegagga tga ggatgactgg cagcc t g 11 c aaaaac t gaa 300 aa t ccgcga t gggtcagtgc ca 11 egegea tgacgcctgc gagagacaag t taactcgtg 360 t cac t ggca t g t cc t age a t c t 11 aegega gcaaaa t tea ateget t tat 11111 cag 11 420 tcgtaacct t c t egeaaceg cgaatcgccg 11 tcagcctg ac t aa t c tgc agctgcgtgg 480 cactgtcagt cag t cag t ca g t eg t gegeg c t g 11 ccagc accgagg t eg cgcgtcgccg 540 cgcctggacc gctgctgcta ctgctagtgg cacggcagg t aggaget tgt tgccggaaca 600 ccagcagccg ccag t egaeg ccagccaggg gaaag t ccgg eg t egaaggg agaggaagge 660 ggcgtgtgca aac t aacg 11 gaccac t ggc gcccgccgac aegageagga ageaggeage 720 tgcagagcgc agegegea ag t gcagaa t gc gegaaaga t c cac 11 gegeg cggcgggcgc 780 gcac t tgcgg gcgcggcgcg gaacag t geg gaaaggagcg gtgeagaegg cgcgcag t ga 840 cag t gggcgc aaagccgcgc ag t aageage ggcggggaac gg t a t aegea gtgccgcggg 900

54 ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960 t ggcgggcaa ggaaaggagg agaeggaaag agggcgggaa agagagagag agagagtgaa 1020 aaaagaaaga aagaaagaaa gaaagaaaga aageteggag ccacgccgcg gggagagaga 1080 gaaa t gaaag cacggcacgg caaagcaaag caaagcaeac ccagccagac ccagccgagg 1140 gaggagcgcg cgcaggaccc gegeggegag egagegagea cggcgcgcga gegagegage 1200 gagcgagcgc gegagegage aagge t tgc t gegagegate gagegagega gegggaagg 1259 atg age gcg acc ege gcg gcg aeg agg aca gcg gcg gcg ctg tee teg 1307 Met Se r Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Se r Se r 1 5 10 15 gcg c tg aeg aeg c c t g t a aag cag cag cag cag cag cag ctg ege gta 1355 Ala Leu Thr Thr Pro Val Ly s Gin Gin Gin Gin Gin Gin Leu Arg Val 20 25 30 ggc gcg gcg teg gca egg ctg gcg gee gcg gcg t tc teg tee ggc aeg 1403 Gly Ala Ala Se r Ala Arg Leu Ala Ala Ala Ala Phe Se r Se r Gly Thr 35 40 45 ggc gga gac gcg gee aag aag gcg gee gcg £Cg agg gcg t t c tee aeg 1451 Gly Gly Asp Ala Ala Ly s Ly s Ala Ala Ala Ala Arg Ala Phe Se r Thr 50 55 60 gga ege ggc ccc aac gcg aca ege gag aag age teg ctg gee aeg gtc 1499 Gly Arg Gly Pro As n Ala Thr Arg Glu Ly s Se r Se r Leu Ala Thr Val 65 70 75 80 cag gcg gcg aeg gac gat gcg ege t c g c ggc ctg acc ggc gee caa 1547 Gin Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gin 85 90 95 ate t t cat gag etc atg ege gag cac cag gtg gac acc ate t t ggc 1595 lie Phe His G 1 u Leu Met Arg Glu His Gin Val Asp Thr He Phe Gly 100 105 110 t ac c c t ggc ggc gee at t ctg ccc gt t t t gat gee a 11 t t gag agt 1643 Tyr Pro Gly Gly Ala lie Leu Pro Val Phe Asp Ala lie Phe Glu Se r 55 1377253 115 120 125 gac gee t tc aag tie a 11 etc get ege cac gag cag ggc gee ggc cac 1691 Asp Ala Phe Ly s Phe He Leu Ala Arg His Glu Gin Gly A1 a Gly His 130 135 140 a t g gee gag ggc t ac geg ege gee aeg ggc aag ccc ggc gt t gtc etc 1739 Me t Ala Glu Gly Tyr Ala Arg Ala Thr Gly Ly s Pro Gly Val Val Leu 145 150 155 160 g t c acc teg ggc cc t gga gee acc aac acc ate acc ccg ate atg gat 1787 Val Thr Se r Gly Pro Gly Ala Thr Asn Thr lie Thr Pro lie Met Asp 165 170 175 get t ac atg gac ggt aeg ccg c tg etc gtg 11 c acc ggc cag gtg cag 1835 Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Gin 180 185 190 acc t C I get g t c ggc aeg gac get 11 c cag gag tgt gac a 11 gt t ggc 1883 Thr Se r Ala Val Gly Thr Asp Ala Phe Gin Glu Cy s Asp lie Val Gly 195 200 205 ate age ege geg igc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931 lie Se r Arg Ala Cy s Thr Ly s Trp Asn Val Met Val Ly s Asp Val Ly s 210 215 220 gag etc ccg ege ege ate aa t gag gee t t gag a t gee atg age ggc 1979 G1 u Leu Pro Arg Arg lie Asn Glu Ala Phe Glu lie Ala Met Ser Gly 225 230 235 240 ege ccg ggt ccc gtg etc gtc gat c 11 cc t aag gat gtg acc gee g " 2027 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Ly s Asp Val Thr Ala Val 245 250 255 gag etc aag gaa atg ccc gac age tee ccc cag gt t get gtg ege cag 2075 Glu Leu Ly s Glu Met Pro Asp Ser Ser Pro Gin Val Ala Val Arg Gin 260 265 270 aag caa aag g t c gag c t t 11 c cac aag gag ege at t ggc get cc t ggc 2123 Ly s Gin Ly s Val Glu Leu Phe His Ly s Glu Arg Me Gly Ala Pro Gly 275 280 285 aeg gee gac l ic aag etc a t \ gee gag atg ate aac cgt geg gag ega 2171

56

Thr Ala Asp Phe Ly s Leu lie Ala Glu Met lie Asn Arg Ala Glu Arg 290 295 300 ccc gtc ate tat get ggc cag ggt gtc atg cag age ccg t tg aa t ggc 2219 Pro Val lie Tyr Ala Gly Gin Gly Val Met Gin Ser Pro Leu Asn Gly 305 310 315 320 ccg get gtg etc aag gag t c geg gag aag gee aac at t ccc gtg acc 2267 Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn lie Pro Val Thr 325 330 335 acc acc a t g cag ggt etc ggc ggc t t gac gag cgt ag t ccc etc tee 2315 Thr Thr Met Gin Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350 c t c aag atg etc ggc atg cac ggc tet gee t ac gee aac t ac teg atg 2363 Leu Ly s Met Leu Gly Me t Hi s Gly Se r Ala Tyr Ala Asn Tyr Ser Met 355 360 365 cag aac gee gat ct t ate c g geg etc ggt gee cgc t t gat gat cgt 2411 Gin Asn Ala Asp Leu lie Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 380 gtg aeg ggc cgc gtt gac gee t t get ccg gag get cgc cgt gee gag 2459 Val Thr Gly Arg Val Asp Ala Phe A a Pro Glu Ala Arg Arg Ala Glu 385 390 395 400 cgc gag ggc cgc ggt ggc a c gtt cac 111 gag at t tee ccc aag aac 2507 Arg Glu Gly Arg Gly Gly lie Val His Phe Glu lie Ser Pro Lys Asn 405 410 415 etc cac aag gtc gtc cag ccc acc gtc geg gtc etc ggc gac gtg gtc 2555 Leu His Ly s Val Val Gin Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430 gag aac etc gee aac gtc aeg ccc cac gtg cag cgc cag gag cgc gag 2603 G1 u Asn Leu Ala Asn Val Thr Pro His Val Gin Arg Gin Glu Arg Glu 435 440 445 ccg tgg t 11 geg cag ate gee gat tgg aag gag aag cac eel 111 ctg 265! Pro Trp Phe Ala Gin lie Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460 57 etc gag t c t gt t gat t eg gac gac aag Et t etc aag ccg cag cag gtc Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gin Gin Val 465 470 475 480 etc aeg gag c i t aac aag cag at t etc gag at t cag gag aag gac gee Leu Thr Glu Leu Asn Lys Gin lie Leu Glu lie Gin Glu Lys Asp Ala 485 490 495 gac cag gag g t c t ac ate acc aeg ggc gtc gga age cac cag atg cag Asp Gin Glu Val Tyr lie Thr Thr Gly Val Gly Ser His Gin Met G 1 n 500 505 510 gca geg cag t t c c 11 acc tgg acc aag ccg ege cag tgg ate tee teg Ala Ala Gin Phe Leu Thr Trp Thr Ly s Pro Arg Gin Trp lie Ser Ser 515 520 525 ggt ggc gee ggc act atg ege tac ggc ct t ccc teg gee at t ggc gee Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala lie Gly Ala 530 535 540 aag a 11 gee aag c cc gat get att gt t att gac ate gat ggt gat get Ly s lie Ala Ly s Pro Asp Ala lie Val lie Asp lie Asp Gly Asp Ala 545 550 555 560 t c t tat t eg atg acc ggt atg gaa t tg ate aca gca gee gaa 11 c aag Ser Tyr Ser Met Thr Gly Met Glu Leu lie Thr Ala A1 a Glu Phe Lys 565 570 575 gt t ggc gtg aag a 11 c 11 ct t t tg cag aac aac 111 cag ggc atg gtc Val Gly Val Lys lie Leu Leu Leu Gin Asn Asn Phe Gin Gly Met Val 580 585 590 aag aac gt t cag gat etc 111 tac gac aag ege tac teg ggc acc gee Ly s Asn Val Gin Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 atg t tc aac ccg ege 11 c gac aag gtc gee gat geg atg eg t gee aag Met Phe Asn Pro Arg Phe Asp Lys Val AI a Asp Ala Met Arg Ala Lys 610 615 620 ggt etc t ac tgc geg aaa cag 1 eg gag etc aag gac aag ate aag gag Gly Leu Tyr Cys Ala Lys Gin Ser Glu Leu Lys Asp Lys lie Lys Glu 625 630 635 640 2699 2747 2795 2843 2891 2939 2987 3035 3083 3131 3179 58 tIt etc gag tac gat gag ggt ccc Phe Leu Glu Tyr Asp Glu Gly Pro 645 gtc etc etc Val Leu Leu 650 gag g 11 11 c g t g gac Glu Val Phe Val Asp 655 3227 aag gac aeg etc gtc ttg ccc atg Lys Asp Thr Leu Val Leu Pro Met 660 gtc ccc get Va1 Pro A1a 665 ggc ttt ccg etc cac Gly Phe Pro Leu His 670 3275 gag atg gtc etc gag cct cct aag Glu Met Val Leu Glu Pro Pro Lys 675 680 ccc aag gac Pro Lys Asp gee taa gt Ala tet ttt 11 3324 ccatggcggg egagegageg agegegegag cgcgcaagtg cgcaagcgcc t tgcct tget 3384 t tget teget t eget t t gc t 11 gc 11 caca caacc t aag t a tgaa t t caa gt 11 tet tgc 3444 11g t eggega tgcctgcc tg ccaaccagcc agcca t ccgg ccggccgtcc t tgaegee 11 3504 ege 11 ccggc gcggcca t eg a 11 caa 11 ca ccca t ccga t aeg 11 ccgcc ccctcacgtc 3564 eg t c t gegea cgacccctgc acgaccacgc caaggccaac gegeegc tea gctcagct tg 3624 tegaegagte gcacgt caca t a t c t c aga t gca 111 ggac tgtgagtgt t a 11 a t gccac 3684 t agcacgcaa ega t c 11 egg gg t cc t ege t c a 11 gc a t c c g 11 egggeec tgcaggcgtg 3744 gaegegag t c gccgccgaga ege t gcagca ggeege t ccg aegegaggge t egage t ege 3804 cecgcccgcg cgatgtctgc c t ggegeega c t ga t c t c t g gagcgcaagg aagacacggc 3864 gaegegagga ggaccgaaga gagaege t gg ggtatgeagg a t a t ac ccgg ggcgggaca t 3924 t eg 11 ccgca tacactcccc ca 11 egage t t gc t eg t cc t tggeagagee gagcgcgaac 3984 gg t t ccgaac gcggcaagga t ttt ggc t c t ggtgggtgga c t ccga t ega ggegcagg 11 4044 c t ccgcagg t t c t egeagge eggeag tgg t eg t t agaaa t agggag tgee ggag t c 11 ga 4104 cgcgcc t t ag c t cac t c t cc gcccacgcgc gca tcgccgc catgccgccg t cccg t c t g t 4164 cgctgcgctg gccgcgaccg gctgcgccag ag t acgacag tgggacagag c t egaggega 4224 59 1377253 cgcgaatcgc tcgggugia agggt t tcaa gggtcgggcg tegtegegtg ccaaagtgaa 4284 aatagtaggg gggggggggg gt acccaccc cgggcaggt t ctcctcgcca gee t aag t gc 4344 c t aagggagc gtaggggt 11 cgt tgaccag agaageggag aacc t geege ggegeggaga 4404 acctatcggc ggagaact tg ccaggcgcga ggcagt tctc caa 111 gegg acagcggcgc 4464 gcccacgcga ggcggccgcg tggega taca gegaggegae cgcgcggggc egeg t ggega 4524 cacagc t gcg egeggagteg gc tgcgagaa ggcttctcgc tgget tggt t ggggtcgcgg 4584 gtggcagggg atggatgccc aggtaegteg gcgtgcgcgc gcccagggag aaaaggacag 4644 acgcgcgggc c t gega t gcg ageaegega t gcgagcacgc gatgegagea egega t gega 4704 gcacgcgagc gagcgcccga gcaaa t gcca cggaacacgc gt 1111 tgt t tggtgat t tc 4764 t a t g t a t gcg gggagac 11 c ga tggccgaa agggg t gcaa ggccaaaaga tgc tgacagc 4824 11 cga t egg t c t aeggegeg ageaggaaag ggagcaaggg geggaa t tet t c t gee 11 ga 4884 cccggggga t c c ac t ag 11 c t agageggee gccaccgcgg tggage t cca at t c gc c c t a 4944 tagtgagteg t a 11 aegege gc t cac t ggc eg t eg 1111 a caacg t eg t g ac tgggaaaa 5004 ccc t ggcg t t acccaact ta a t egee t tgc agcaca t ccc cc 111 cgcca gc t ggcg t aa 5064 t agegaagag gcccgcaccg a t cgccc t tc ccaacagt tg cgcagcc tga atggcgaatg 5124 ggacgcgccc tgtagcggcg ca t taagege ggcgggtgtg gtggt taege gcageg t gac 5184 ege t acac 11 gccagcgccc tagcgcccgc t cc 111 ege t 11 c 11 ccc 11 cc t 11 c t ege 5244 cacg 11 egee ggc 111 cccc gt caagc t ct aaatcggggg ctccc 11 tag gg 11 ccga 11 5304 t ag t gc 111 a cggcacc t eg accccaaaaa ac t t ga t t ag ggtgatggt t cacgtagtgg 5364 gcca t cgccc tgatagaegg 1111 tcgccc 111 gacg 11 g gagtccacgt t c 111 aa t ag 5424 tggactct tg 11 ccaaac t g gaacaacact caaccc t a t c t egg t c t a 11 c 111 tga 111 5484 a t aaggga 11 11 geega 111 eggee t a t tg g 11 aaaaaa t gage t ga 111 aacaaaaatt 5544

60 t aacgcgaa t 11 taacaaaa t a t t aaege t t acaa t t t ag g t ggcac 111 t cggggaaa t 5604 g t gcgcggaa ccccta 11 tg 111at m tc t aaa t aca 11 caaatatgta tccgctcatg 5664 agacaa t aac cc t ga t aaa t gc 11 caa t aa tat tgaaaaa ggaagagtat gag ta 11 caa 5724 ca 111 ccg t g t cgccc 11 a t tccct t t t t t geggea 111 t gccticctgt 111 tgctcac 5784 ccagaaacgc tggtgaaagt aaaagatgct gaaga t cag t tggg丨gcacg agtgggt tac 5844 a t cgaac t gg a t c teaacag egg t aaga t c c 11 gagag 11 11 cgccccga agaaegt 111 5904 ccaa t ga t ga gcact 111 aa ag 11 c t gc t a tgtggcgcgg t a 11 aicccg t a 11 gaegee 5964 gggcaagagc aactcggtcg ccgca t acac tat tctcaga atgact tggt tgagt ac tea 6024 ccag t cacag aaaagca t c t taeggatgge atgacagtaa gagaa 11 a t g cagtgctgcc 6084 ataaccatga gtgataacac tgcggccaac 11 ac 11 c t ga caacga t egg aggaccgaag 6144 gage t aaccg c 111 tt tgea caacatgggg gatcatgtaa c t egee t tga tegt tgggaa 6204 ccggage t ga a t ga age c a t accaaacgac gagcgtgaca ccacga t gee t g t agcaa t g 6264 gcaacaacg t tgcgcaaact at taactggc gaac t ac 11 a c t c t age 11 c ccggcaacaa 6324 11 aa t agac t gga t ggagge gga t aaag 11 gcaggaccac 11 c t geget c ggc cc 11 ccg 6384 gc t ggc t gg t 11 a t tgc t ga t aaa t c t gga geegg t gage g tggg t c t eg egg t a t ca 11 6444 gcagcac t gg ggccaga tgg taagccctcc eg t a t eg t ag 11 a t c t acac gacggggagt 6504 caggcaac t a tggatgaacg aaa t agacag a t ege t gaga taggtgcctc ac t ga t t aag 6564 ca 11 gg t aac tgtcagacca agt t tactca t a t a t a c 11 t aga t tga 111 a a aa c t teat 6624 1111 aa 111 a aaagga t c t a ggtsaagatc c 11111 ga t a a t c t ca t gac caaaatccct 6684 taacgtgagt 111 cgt t cca ctgagcgtca gaccccgtag aaaagatcaa agga t c 11 c t 6744 t gaga t cc 11 1111 tctgcg eg t aa t c t gc tgc 11 gcaaa caaaaaaacc accgc t acca 6804 61 1377253 gcggtggt t t gt t tgccgga tcaagagct a ccaac t c 111 11 ccgaagg t a ac t ggc 11 c 6864 agcagagcgc agataccaaa t ac t g t cc t t ctagtgtagc cgtagt tagg ccaccac 11 c 6924 aagaactctg t agcaccgcc t aca t acct c gctctgctaa tcctgt tacc agtggctgct 6984 gccagtggcg a t aag t eg t g t c 11 accggg 11 ggac t caa gaega t ag t t accgga t aag 7044 gcgcagcggt eggge tgaac ggggggttcg tgcacacagc ccagc 11 gga gcgaacgacc 7104 tacaccgaac tgagatacct acagcg tgag ctatgagaaa gcgccacgc t t cccgaaggg 7164 agaaaggcgg acaggtatcc ggtaagegge agggt eggaa caggagagcg cacgagggag 7224 c 11 ccagggg gaaacgcctg g t a t c 111 a t agtcctgtcg gg 111 cgcca cc t c t gac 11 7284 gagcgtcgat 1111gtga tg ctcgtcaggg gggeggagee t a t ggaaaaa cgccagcaac 7344 gcggcct t t t t aeggt tee t ggee 111 tgc t ggee 1111 g c t cac a t gt t c t 11 cc t geg 7404 11 a t cccc t g at tctgtgga t aaccg t a11 accgcc 11 tg agtgagctga t accgc t ege 7464 cgcagccgaa cgaccgagcg cagcgagtca g t gagegagg aageggaaga gcgcccaa t a 7524 cgcaaaccgc ctctccccgc geg11ggccg a 11 ca 11 aa t gcagc tggea cgacagg 111 7584 cccgactgga aagcgggcag t gagcgcaac gcaa 11 aa tg tgagt taget cac t ca 11 ag 7644 gcaccccagg c t 11 acac t t t a t gc t t ccg gc t eg t a tg t tgtgtggaat t g t gagegga 7704 t aacaa t t t c acacaggaaa cage t a tgac ca t ga 11 aeg ccaagcgcgc aa t t aaccc t 7764 cac t aaaggg aacaaaagc t gggtaccggg ccccccctcg agg t egaegg t a t ega t aag 7824 c 11 gaeg t eg aa 11 cc t gca gee 7847 <210> 24 <211> 684 <212> PRT <213> 裂壺菌 <400> 24 Met S e r Ala 1 Thr Arg Ala Ala Thr Arg Thr Ala 5 10 Ala Ala Leu Se r Se r 15

62 1377253

Ala Leu Thr Thr Pro Val Lys Gin Gin Gin Gin Gin Gin Leu Arg Val20 25 30

Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser GlY Th,35 40 45

Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60

Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80

Gin Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gin85 90 95 ]e Phe His Glu Leu Met Arg Glu His Gin Val Asp Thr lie Phe Gl：100 105 110

Tyr Pro Gly Gly Ala He Leu Pro Val Phe Asp Ala lie Phe Glu Ser115 120 125

Asp Ala Phe Lys Phe lie Leu Ala Arg His Glu Gin Gly Ala Gly Hi;130 135 140

Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu,45 15〇 155 160

Val Thr Ser Gly Pro Gly Ala Thr Asn Thr lie Thr Pro lie Met Asp165 170 175

Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gin Val Gin 180 185 190 63 1377253

Thr Ser Ala Val Gly Thr Asp Ala Phe Gin Glu Cys Asp lie Val Gly 195 200 205 lie Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys 210 215 220 Glu Leu Pro Arg Arg lie Asn Glu Ala Phe Glu lie Ala Met Ser Gly 225 230 235 240 Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val 245 250 255 Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gin Val Ala Val Arg Gin 260 265 270 Lys Gin Lys Val Glu Leu Phe His Lys Glu Arg He Gly Ala Pro Gly 275 280 285 Thr Ala Asp Phe Lys Leu lie Ala Glu Met lie Asn Arg Ala Glu Arg 290 295 300

Pro Val lie Tyr Ala Gly Gin Gly Val Met Gin Ser Pro Leu Asn Gly 305 310 315 320

Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Me Pro Val Thr 325 330 335

Thr Thr Met Gin Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser 340 345 350

Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met 355 360 365 64 1377253

Gin Asn Ala Asp Leu lie Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg 370 375 3S0

Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu 385 390 395 400

Arg Glu Gly Arg Gly Gly lie Val His Phe Glu He Ser Pro Lys Asn 405 410 415

Leu His Lys Val Val Gin Pro Thr Val Ala Val Leu Gly Asp Val Val 420 425 430

Glu Asn Leu Ala Asn Val Thr Pro His Val Gin Arg Gin Glu Arg Glu 435 440 445

Pro Trp Phe Ala Gin He Ala Asp Trp Lys Glu Lys His Pro Phe Leu 450 455 460

Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gin Gin Val 465 470 475 480

Leu Thr Glu Leu Asn Lys Gin lie Leu Glu lie Gin Glu Lys Asp Ala 485 490 495

Asp Gin Glu Val Tyr lie Thr Thr Gly Val Gly Ser His Gin Met Gin 500 505 510

Ala Ala Gin Phe Leu Thr Trp Thr Lys Pro Arg Gin Trp lie Ser Ser 515 520 525

Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala lie Gly Ala 65 1377253 530 535 540 Lys lie Ala Lys Pro Asp Ala Me Val lie Asp lie Asp Giy Asp Ala 545 550 555 560 Se r Tyr Ser Met Thr Gly Met Glu Leu lie Thr Ala Ala Glu Phe Lys 565 570 575 Val Gly Val Lys lie Leu Leu Leu Gin Asn Asn Phe Gin Gly Met Val 580 5S5 590 Lys Asn Val Gin Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala 595 600 605 Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys 610 615 620 Gly Leu Tyr Cys Ala Lys Gin Ser Glu Leu Lys Asp Lys lie Lys Glu 625 630 635 640 Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp 645 650 655 Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His 660 665 670

Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala 675 680 <210> 25 <21 1> 18 <2I2> DNA <2Π> 裂壺菌 <400〉25 g 11 gaccag t gccg 11 cc 66 1377253

<210> 26 <211〉 18 <212> DNA <2Π> 裂壺菌 <400;> 26 cgaagtgcac gcagt tgc

IS <210> 27 <21 !> 31 <212> DNA <213> 裂壺菌 <400> 27 gcgccca t gg gacgtcaggt ggcacttttc g 3 j <2I0> 28 <211〉36 <212> DNA <213> 裂壺菌 <400> 28 gcgccca t gg ccgcggcaag cagcaga 11 a cgcgca 36 <2I0> 29 <211> 1263 <212> DNA <213> Caenorhabditis elegans <220> <221> CDS <222> (23)..( 1228) <223> <400> 29 gcggccgcga attcagatct cc atg gtc get cac teg teg gag ggt etc teg 52 Met Val Ala His Ser Ser Glu Gly Leu Ser 1 5 10 gee acc gee ccg gtc acc ggc ggc gac gtc etc gtc gac gee ege gee 100 Ala Thr Ala Pro Val Thr Gly Gly Asp Val Leu Val Asp Ala Arg Ala 15 20 25 teg etc gag gag aag gag gee ccg ege gac gtc aac gee aac acc aag 148 Ser Leu Glu Glu Lys Glu Ala Pro Arg Asp Val Asn Ala Asn Thr Lys 3〇 35 40 cag gee acc acc gag gag ccc ege ate cag ctg ccc acc gtc gac gee 196 Gin Ala Thr Thr Glu Glu Pro Arg lie Gin Leu Pro Thr Val Asp Ala 45 50 55 ttc ege ege gee ate ccc gee cac tgc Phe Arg Arg Ala lie Pro Ala His Cys 60 65 ttc gag ege gac etc g t c aag Phe Glu Arg Asp Leu Val Lys 70 244 eg ate ege tac etc gtc cag gac ttc gee gee etc acc ate etc tac 292 er lie Arg Tyr Leu Val Gin Asp Phe Ala Ala Leu Thr Me Leu Tyr 5 80 85 90 ttc Phe gee etc ccc gee ttc gag tac ttc ggc etc ttc ggc tac etc gtc Ala Leu Pro Ala Phe Glu Tyr Phe Gly Leu Phe Gly Tyr Leu Val 340 95 100 105 67 1377253 tgg aac ate 11 c a t g ggc gtc uc ggc ttc gee etc ttc gtc gtc ggc 388 Trp Asn lie Phe Met Gly Val Phe Gly Phe Ala Leu Phe Val Val Gly 110 115 120 cac gac tgc etc cac gga age ttc teg gac aac cag aac etc aac gac 436 His Asp Cy s Leu His Gly Ser Phe Ser Asp Asn Gin Asn Leu Asn Asp 125 no 135 11 c ate ggc cac ate gee ttc teg ccc etc 11 c teg ccc tac U c ccc 484 Phe lie Gly His lie Ala Phe Ser Pro Leu Phe Ser Pro Tyr Phe Pro 140 145 150 tgg cag aag teg cac aag etc cac cac gee ttc acc aac cac ate gac 532 Trp Gin Lys Se r His Lys Leu His Hi s Ala Phe Thr Asn His lie Asp 155 160 165 170 aag gac cac ggc cac gtc tgg ate cag gac aag gac tgg gag gee a t g 5S0 Ly s Asp His Gly His Val Trp lie Gin Asp Lys Asp Trp Glu A1 a Met 175 180 185 ccc teg tgg aag ege tgg ttc aac ccc ate ccc ttc teg ggc tgg etc 628 Pro Se r Trp Lys A rg Trp Phe Asn Pro lie Pro Phe Ser Gly Trp Leu 190 195 200 aag tgg t c ccc gtc t ac acc etc ttc ggc ttc tgc gac ggc teg cac 676 Ly s Trp Phe Pro Val Tyr Thr Leu Phe Gly Phe Cys Asp Gly Ser His 205 210 215 t tc tgg ccc t ac t eg teg etc ttc gtc ege aac teg gac ege gtc cag 724 Phe Trp Pro Tyr Ser Ser Leu Phe Val Arg Asn Ser Asp Arg Val Gin 220 225 230 tgc gtg ate age ggc ate tgc tgc tgc gtc tgc gee tac ate gee etc 772 Cy s Val lie Ser Gly lie Cys Cys Cys Val Cys A ] a Tyr lie Ala Leu 235 240 245 250 acc ate gee ggc t eg t ac teg aac tgg Uc tgg tac tac tgg gtc ccg 820 Thr lie Ala Gly Ser Tyr Ser Asn Trp Phe Trp Tyr Tyr Trp Val Pro 255 260 265 etc teg 11 c 11 c ggc etc a tg etc gtc ate gtc acc tac ctg cag cac 868 Leu Se r Phe Phe Gly Leu Me t Leu Val lie Val Thr Tyr Leu Gin His

68 1377253

270 gtc gac gac gtc Va1 Asp Asp Va1 285 cgc ggc cag acc Arg Gly Gin Thr 300 acc acc atg cac Thr Thr Met His 315 gcc gag gtc tac Ala Glu Val Tyr 290 cag acc ate gac Gin Thr lie Asp 305 cac ate acc gac His 11e Thr Asp 320 275 gag gcc gac gag Glu Ala Asp Glu cgc tac tac ggc Arg Tyr Tyr Gly 310 ggc cac gtg gee Gly His Val Ala 325 280 tgg teg t tc gtc Trp Se r Phe Val 295 etc ggc etc gac Leu Gly Leu Asp 916 964 cac cac t tc t tc His His Phe Phe 330 1012 aac aag Asn Lys aag gtc Lys Val gtc aac Val Asn ate ccg lie Pro etc gag Leu Glu 350 tac gac Tyr Asp 365 cac tac His Tyr 335 ccc etc Pro Leu 11 c 11 c Phe Phe cac etc His Leu teg gac Se r Asp gcc cgc A1a Arg 370 ate gag lie Glu 340 acc cag Thr Gin 355 11 c etc Phe Leu gcc acc Ala Thr tac ggc Tyr Gly tgg t tc Trp Phe gag ggc Glu Gly tac aag Tyr Lys 360 aac tac Asn Tyr 375 gtc aag Val Lys 345 teg cag Se r Gin aag etc Lys Leu 1060 1108 1156 gac tac etc gtg cac aag acc gcc ggc ate atg cag ttc cgc acc acc Asp Tyr Leu Val His Lys Thr Ala Gly lie Met Gin Phe Arg Thr Thr 1204 380 385 390 etc gag gag aag gee aag gcc aag t aacccgggg gtaccct taa ggcatgcgcg Leu Glu Glu Lys Ala Lys Ala Lys 395 400 1258 geege 1263 <21〇> 30 <211> 402 <212> PRT <213> Caenorhabditis elegans <400> Met Val Ala His Ser Ser Glu Gly Leu Ser Ala Thr Ala Pro Val Thr 1 5 10 15 30 69 1377253

Gly Gly Asp Val Leu Val Asp Ala Arg Ala Ser Leu GIu Glu Lys Glu 20 25 30

Ala Pro Arg Asp Val Asn Ala Asn Thr Lys Gin Ala Thr Thr Glu Glu 35 40 45

Pro Arg 丨le Gin Leu Pro Thr Val Asp Ala Phe Arg Arg Ala lie Pro 50 55 60 Ala His Cys Phe Glu Arg Asp Leu Val Lys Ser lie Arg Tyr Leu Val 65 70 75 80

Gin Asp Phe Ala Ala Leu Thr lie Leu Tyr Phe Ala Leu Pro Ala Phe 85 90 95

Glu Tyr Phe Gly Leu Phe Gly Tyr Leu Val Trp Asn lie Phe Met Gly 100 105 110

Val Phe Gly Phe Ala Leu Phe Val Val Gly His Asp Cys Leu His Gly 115 120 125

Ser Phe Ser Asp Asn Gin Asn Leu Asn Asp Phe lie Gly His lie Ala 130 135 140

Phe Ser Pro Leu Phe Ser Pro Tyr Phe Pro Trp Gin Lys Ser His Lys 145 150 155 160

Leu His His Ala Phe Thr Asn His Me Asp Lys Asp His Gly His Val 165 170 175

Trp lie Gin Asp Lys Asp Trp Glu Ala Met Pro Ser Trp Lys Arg Trp 180 1S5 190 70 <210> 34 <211> 4244 <212> DNA <2I3> 裂壺菌 <400> 34 111 c t c t c t c t egage tgt t gctgctgctg ctgctgctgc tget tcct tg ct gg 11 ct ca 60 egtccgt teg a t caagcgc t cgctcgctcg accgatcggt gcgtgcgtgc gtgcgtgagt 120 ct tgt tgcca ggcagccgca ggctgtctgt ctgt t tgtgt agt 111 accc tcggggt teg 180 ggg t c t gee t gee tee ege t cccgcccgcc gccgcccgt a t ccaccccgc tcgcctccgc 240 cca t egggec t egee t cc t c gcgccgcacg ca t cgcgcgc atcgcatgca tea t gc tgee 300 acgcacgggg ggacgcgcgc cccgcgtccc ccgccgccgc cgtcgtcgtc t ggega t gee 360 gtcgccgccc t c c 11 c c 11 c cctcgcctcc tet tcctccc gagcccccc t g t c 11 cc 11 c 420 gcccccgcag cggcgcgcag gaagcgagga gagcggggag gagagaagaa aagaaaagaa 480 aagaaaagaa a a t aac ageg ccg t c t egeg cagacgcgcg cggccgcgtg egaggeggeg 540 tgatggggct t c t cgt ggcg egge tgegge ctggcccggc c t egee 111 g aggtgcaggc 600 11 tgggagag aagagtggga egeggagaag ataagatggt gcca t ggege aggaeggaga 660 ggt tgctgaa ac t let t ega gcggcacagg egatggegag agaccgacag ctgccggcgc 720 ggaggggatg ga t acc t ccc gaggctggca t ggaegage t ggccgcgcgg atctggctgg 780 ccgcgcggcg g t gggt ccgg aggegegagg 11 gg 1111 c t t ca t acc tga t acca aegg 840 t a 11 c a 11 c t tcctctccag gaaggaagea agtcacatag agtatcacta gee t aatgat 900 ggac t c t a t g t 111 agggea egteggagea gaaggegega gega 11 egaa t gegagega t 960 aga t acagea cagagacc 11 gccggcgacg egga t gcagg cgagcacgca cgcaccgcac 1020 gcacggcagc gg t gcacgcg c t cc t eggea gatgeaeggt tctgcgccgc gcct t tacat 1080 t t t t tga t 11 1aggtgg t g t gcctgccact t tgaacatca tccacaagt c aacgcagcat 1140 caagaggcaa gcaagtacat aca t cca t t c gaa 11 caag t t caagagacg cagcaacagc 1200 cgccgc t ccg c t caage t gc age t age t gg ctgacagggc tcgctggctg tagtggaaaa 1260 73 11 cca 11 cac 111 tetgeat ccgcggccag caggcccgta egeaeg t tc t c t eg t 11 g t t 1320 tgt tcgt teg tgcgtgcgtg cgtgcgtccc age tgee t g t c t aa t c t gee gegega t cca 1380 acgaccc t eg gtcgtcgccg caagcgaaac ccgacgccga cc t ggccaa t gccgcaagaa 1440 tgetaagege gcagcaa tgc tgagag taat c 11 cagccca ccaag t cat t a t ege t gccc 1500 aagtctccat cgcagccaca 11 caggc 111 c t c t c t c t c t ccc t ccc tc t c t 11 c t geeg 1560 ggagagaagg aaagacccgc cgccgccgcc tctgcgcctg tgacgggctg tccg11g t aa 1620 gccc t c 11 ag acagt tecta gg tgccgggc gccgccgcgc c t ccg t egea ggcacacg t a 1680 ggcggccacg ggt tcccccc gcacc t tcca cacc 11 c 11 c ccccgcagcc ggaccgcgcg 1740 c eg t c t gc 1 t acgcac t teg cgcggccgcc gcccgcgaac ccgagcgcgt gctgtgggcg 1800 ccg t c 11 ccg gccgcgtcgg aggtcgtccc cgcgccgcgc tactccgggt cctgtgcggt 1860 aeg t ac 11 aa tat taacagt gggac c t ege acaggacc t g acggcagcac agacg t cgee 1920 gee t egea t c gc tggggacg caggcgaggc a t cccggcgc ggccccgcac cggggaggc t 1980 gcggggcggc c t c t t ccggc cggcggccgc a t caggcgga tgacgcaaga gccc t egeag 2040 tcgctcgctc gegggagege agcgcggcgc cagcgtggcc aage t cccgc ccc 11 c tgge 2100 tggctgcatg cc tgee tgee tgcctgcctg eg tgcgtgcg tgcgtgcgtg cc 11 eg t geg 2160 tgee tgee 11 eg tgcg tgcg tgcgtgagtg eggeggaaga ggga t ca t gc gagga t c a a t 2220 cacccgccgc acctcgactt t tgaagaage egega t gega t gega t gega t gega t gega 2280 egega t accg t gegagge t a egaagegagt ctggccggcc gtcatacaac gcacgt 11 tc 2340 gagaaggagg gc tggeggag geg tgea tgc cggcgacca t tgcgaacgcg geg t c t eg tg 2400 gctggcgaag g t gee t ggag ga t c t aaega t ege t gc t a t ga t gc t a t ag c t g t gc t ga t 2460 ccccgg t cca 11 ccaccacg tctgtgcctg ccgcc tgacc tgeget tgge 111 cc 11 caa 2520 74 gt tctcctcc gccgggcc t t caggaccgag acgagacctg cagctgcagc tagactcgcg 2580 ctcgctcgcg gaggat tege cggccgccgg geeggaeggg actcgcgagg tcacacggcc 2640 gccggcga i c gcgatggctg tgctgacgta ctcgtgcgtg gcagccgtac gtcagcgacg 2700 ccgcc t ccg t at tgtggat t cgt tagt tgg t tgt tggitg at t tgt tgat taat 11 m t 2760 gttcgtaggc t tggt tatag c t aa t ag 111 ag 111 a t ac t ggtgctct tc ggtgctgat t 2820 t age t egae t tgggtccaca ccactgcccc tctactgtga atggatcaat ggacgcacga 2880 cgggccgacg aaagtgcgcg agtgaggtaa cc t aagcaac ggcggt c 11 c agaggggacg 2940 cacgccc t cc g t egeag t ca gt ccagacag gcagaaaagc gtc t taggga ccacgcacgc 3000 acgcacgcac gcacgcacgc ccgcacgcac gctccctccc tcgcgtgcct a 1111111 ag 3060 gc 11 cc 11 cc gcacgggcc t acc t c tege t ccc t egee t c gccgcaccag geggeageag 3120 ega t a cc t gc cggtgccgcc t ccg t cacgc gc t cagccgc age t cagccc agccgcgagc . 3180 t aggg 111 £ t t eg t cc t gaa t t g t t t ga 11 tgat t tgat t t ga 111 ga t c ega t ccga t c 3240 ega t c tga t c t ga 111 gc 11 t gc t t t gc t t tgtctccctc ccggcgcgga ccaagcg t cc 3300 gtctgcgcgc egeage 11 cc c 11 c 11 c t cc cagccc t cc t t c t gc t cccg cc t c t egege 3360 aagcacgcag c t t cgccgcc gc a t ccgg t c gg t egg t egg t ega t egaec egee tgeege 3420 tgctgctgtg geeggge 11 t t c t cca t egg egae t c 111 c 11 c t cc a t ac g.t cc t ac t ac 3480 g t aca t aca t ac t geegge t t cc t cc tc 11 ccagcgcggc gaeggeggea ggc t gegaeg 3540 tcgtcgccgc cgcgggcgcc gcgcgcgccg ccgccgccgc ccgcgtcgca eggcctcgtc 3600 gccgccgccg c t ccgc t ccg c tccgaggcc gegagaggge cgcggcggcg cgatggatgg 3660 a t gga t gga t gga t gga t gg a t gga 1111 g t tgatcgatg gcggcgcatg ggcggagatg 3720 agegaggaeg agegegegag cgcggcagcc gga 11 egeag ggee t ege t c gcc t cgcgcc 3780 ege t geegeg cccgcct tgc gagee t gege egegagegag egagegageg agcggggc 11 3840 75 1377253 t c 111 g t c t c gcgcgccgc t tggcctcgtg t g t c 11 g t gc t tgcgt ageg ggcgccgcgg 3900 tggaaga tgg c t ca 11 caa t cgaccca 11 c acgcacgcac t ccggcgcgc agagaaggee 3960 gaggaggagc agcaagcaaa ccaaaagctc t egege t ege gg t c t eggge t egagegg t c 4020 t cggagagag aglet tgegg cgaccaccgg cagcagcagc ageageagea gege t g t ega 4080 gcacgagcac gageaegage aegageaega gca 11 egage aagaggacag acacggt tgt 4140 cagcgcctag c t ege t ega t acagaaagag geggg t tggg cgtaaaaaaa aaggagcacg 4200 caagccgcca gccagccagc t age t agcca gee tgee tgc caaa 4244 <210> 35 <211> 4244 <212> DNA <213> 裂壺菌 <400> 35 111 c t c t c t c t egage tgt t gctgctgctg ctgctgctgc t gc 11 cc 11 g c t gg 11 c t ca 60 eg t ccgt teg a t caagcgc t ege t ege teg accgatcggt gcgtgcgtgc gtgcgtgagt 120 c 11g t tgcca ggcagccgca ggctgtctfit ctgt t tgtgt ag1111accc tcggggt teg 180 gggtctgcct gcctcccgct cccgcccgcc gccgcccgta tccaccccgc tcgcctccgc 240 cca t egggee t egee t cc t c gcgccgcacg ca t cgcgcgc atcgcatgca t ca t gc t gee 300 acgcacgggg ggacgcgcgc cccgcg t ccc ccgccgccgc cgtcgtcgtc tggega tgee 360 g t cgccgccc t cc 11cc11 c cc tegee tee t c 11 cc t ccc gagcccccct g t c 11 cc 11 c 420 gcccccgcag cggcgcgcag gaagcgagga eagcggggag gagagaagaa aagaaaagaa 480 aagaaaagaa aa t aacagcg ccgt c t egeg cagacgcgcg cggccgcgtg egaggeggeg 540 tgatggggct tctcgtggcg cggctgcggc ctggcccggc ctegee 11 tg aggtgcaggc 600 111 gggagag aagagtggga egeggagaag ataagatggt gccatggcgc aggaeggaga 660 ggt tgctgaa ac 11 c 11 ega gcggcacagg ega tggegag agaccgacag ctgccggcgc 720 ggagggga tg gatacctccc gagge t ggea t ggaegage t ggccgcgcgg atctggctgg 780

76 ccgcgcggcg gtgggtccgg aggegegagg 11gg 1111 c t t ca t a cc t ga t acca t aegg 840 t a 11 ca 11 c t t cc tc ϊ ccag gaaggaagea ag t caca t ag ag t a t c ac t a gcc t aa t ga t 900 ggac t c t a t g 111 tagggea eg t eggagea gaaggegega gega 11 egaa tgegagegat 960 agatacagca cagagacc 11 gccggcgacg egga t gcagg cgagcacgca cgcaccgcac 1020 gcacggcagc gg t gca egeg c t cc t eggea gat gcacgg t tc tgcgccgc gc c 111 ac a t 1080 11 t t t ga t t t t aggtgg t g t gcc t gccac t t tgaacatca tccacaagtc aacgcagcat 1140 caagaggcaa gc aagt ac a t ac a t cc a 11 c gaat tcaagt tcaagagacg cagcaacagc 1200 cgccgc t ccg c t caagc t gc age t age t gg ctgacagggc tcgctggctg t ag t ggaaaa 126.0 11 cca 11 cac 111 tetgeat ccgcggccag caggcccgta egeaegt tet c t eg 111 g 11 1320 tgt tcgt teg tgcgtgcgtg cgtgcgtccc agctgcctgt ctaatctgcc gegega t cca 1380 acgaccc t eg g t cgtcgccg caagcgaaac ccgacgccga cctggccaat gccgcaagaa 1440 tgetaagege gcagcaa t gc tgagagtaat c 11 cagccca ccaagt cat t atcgctgccc 1500 aag t c t cca t cgcagccaca t teagget 11 c t c t c t c tc t ccc t ccc t c t c 111 c t geeg 1560 ggagagaagg aaagacccgc cgccgccgcc tctgcgcctg tgacgggctg t ccg 11 g t aa 1620 gccc t c 11 ag acag 11 cc t a ggtgccgggc gccgccgcgc c t ccg t egea ggcacacgta 1680 ggcggccacg gg 11 cccccc gcacc t tcca cacc 11 c 11 c ccccgcagcc ggaccgcgcg 1740 ccg t c igc 11 acgcact t eg cgcggccgcc gcccgcgaac ccgagcgcg t gctgtgggcg 1800 ccg t c 11 ccg geegegt egg agg t egiccc cgcgccgcgc t ac t ccggg t cctgtgcggt I860 aeg t ac 11 aa t a 11 aacag t gggacc t ege acaggacctg acggcagcac agacg t egee 1920 gee t egea t c gctggggacg caggegagge a t cccggcgc ggccccgcac cggggaggc t 1980 gcggggcggc c t c t teegge cggcggccgc a teaggegga tgacgcaaga gccc t egeag 2040 t ege t ege t c segggagege agcgcggcgc cagcg t ggee aage t cccgc ccc 11 c t ggc 2100 77 1377253 tggctgcatg cc t gcc t gcc t gcc t gcct g eg t geg t geg tgcg tgcgtg cc 11 eg t geg 2160 t gcc t gcc 11 eg t geg t geg tgcgtgagtg eggeggaaga gggatcatgc gaggatcaat 2220 cacccgccgc acc t egae t t 11 gaagaage egega t gega tgegatgega tgegatgega 2280 cgcgataccg t gegagge t a egaagegag t c t ggeeggec g t ca t acaac gcacg t t 11 c 2340 gagaaggagg gc tggeggag gcgtgcatgc cggcgacca t tgcgaacgcg gegtetegtg 2400 gctggcgaag g t gcc t ggag ga t c t a aega t ege t gc t a t ga t gc t a t ag c t g t gc t ga t 2460 ccccggtcca 11 ccaccacg tc tgtgcctg ccgcctgacc tgege t tgge 111 cc 11 caa 2520 g 11 c t cc t cc gccgggcc t t caggaccgag acgagacc tg cage t gcagc tagactcgcg 2580 ctcgctcgcg gaggat tege cggccgccgg geeggaeggg ac t egegagg t cacacggcc 2640 gccggcga t c gcgatggctg tgctgacgta ctcgtgcgtg gcagccgtac gtcagcgacg 2700 ccgcctccgt at tgtggat t eg 11 ag t tgg t tgt tggt tg a 111 g 11 ga t taat 111111 2760 g 11 eg t aggc 11 gg 11 a t ag c t a a t ag 111 ag t 11 a t a c t gg t gc t c 11 c gg t gc t ga 11 2820 t age t egae t t ggg t ccaca ccactgcccc t c t ac t g t ga a t gga t c aa t ggacgcacga 2880 cgggccgacg aaag t gegeg ag t gagg taa cc t aagcaac ggegg t c 11c agaggggacg 2940 cacgccc t cc g t egeag t ca g t ccagacag gcagaaaagc g t c 11 aggga ccacgcacgc 3000 acgcacgcac gcacgcacgc ccgcacgcac gctccctccc t egeg t gcc t a 1111111 ag 3060 gc t t cc t t cc gcacgggcct acc t c t ege t ccc t egec t c gccgcaccag geggeageag 3120 cgatacctgc cggtgccgcc tccgtcacgc gc t cagccgc age t cagccc agccgcgagc 3180 tagggt t tgt t eg t cc t gaa t tgt t tgatt t ga 111 ga 11 t ga 111 ga t c ega t ccga t c 3240 egatetgate tgat t tgett tgc 111get t tgtctccctc ccggcgcgga ccaagcg t cc 3300 gtctgcgcgc egeage t tee c 11 c 11 c t cc cagccc t cc t t c t gc t cccg cc t c t egege 3360

78 aagcacgcag c 11 cgc cgcc gca t ccgg t c ggtcggtcgg t cga t cgacc cgcc tgeege 3420 tgctgctgtg gccgggc t t t t c t cca t egg egae t c 111 c 11 c t cca t ac g t cc t ac t ac 3480 g t aca t aca t ac tgccggct t cc t cc t c 11 ccagcgcggc gaeggeggea ggctgcgacg 3540 t cgt cgccgc cgcgggcgcc gcgcgcgccg ccgccgccgc ccgcg t egea gggee t eg t c 3600 gccgccgccg c t ccgc t ccg c t ccgaggcc gegagaggge cgcggcggcg cgatggatgg 3660 atggatggat ggatggatgg atggat 11 tg t tgatcgatg gcggcgcatg ggeggaga tg 3720 agcgaggacg agcgcgcgag cgcggcagcc gga 11 egeag ggcctcgctc gee t cgcgcc 3780 cgc t gccgcg cccgcc 11 gc gagee tgege egegagegag egagegageg agcggggct t 3840 t c 11 t g t c t c gcgcgccgc t tggee tegtg tgtet tgtgc t tgcg t ageg ggcgccgcgg 3900 tggaagatgg c t ca 11 caa t cgaccca 11 c acgcacgcac tccggcgcgc agagaaggee 3960 gaggaggagc agcaagcaaa ccaaaagc t c t egege t cgc ggt c teggge tcgagcggtc 4020 t cggagagag agtcttgcgg cgaccaccgg cagcagcagc ageageagea gcgctgtcga 4080 gcacgagcac gagcacgagc aegageaega gc a 11 egage aagaggacag acacggt tgt 4140 cagcgcc tag c t cgc t cga t acagaaagag gcgggt tggg eg t aaaaaaa aaggagcacg 4200 caagccgcca gccagccagc t age t agcca gee tgee tgc caaa 4244 176 79

Claims

1377253 年破邡缺幻正冬第100112656號墙系再专會案卞莉蓄rti:

101.6.14 七、申請專利範圍： 1. 一種分離的核酸分子，其包含： a. —種破囊壺菌目乙醯乳酸合成酶啟動子，其包含一與序列辨識編號：14中之啟動子序列至少95%相同的核酸序列，其中該核酸序列具有至少基本的乙醯乳酸合成酶啟動子轉錄活性；

b. —種破囊壺菌目脂肪酸去飽和酶啟動子，其包含一與序列辨識編號：31中之啟動子序列至少95%相同性的核酸序列，其中該核酸序列具有至少基本的脂肪酸去飽和酶啟動子轉錄活性； c. 一種破囊壺菌目聚乙醯合成酶啟動子核酸序列，其係與序列辨識編號：34中之啟動子序列至少95%相同，其中該核酸序列具有至少基本的聚乙醯合成酶啟動子轉錄活性；

d. —種破囊壺菌目α-微管蛋白啟動子核酸序列，其係與序列辨識編號：9中之啟動子序列至少95%相同，其中該核酸序列具有至少基本的α-微管蛋白啟動子轉錄活性； e. —種破囊壺菌目α-微管蛋白啟動子核酸序列，其係與序列辨識編號：9之核苷酸441-894至少95%相同，其中該核酸序列具有至少基本的α-微管蛋白啟動子轉錄活性；或 f. 一種核酸序列，其係與(a)-(e)任一者的核酸序列完全互補。 1 1377253 101.6.14 第100112656號專利再審查案申請專利範圍替換本 2. 如申請專利範圍第1項之分離的核睃分子，其中該分離的核酸分子包含一破囊壺菌目乙醯乳酸合成酶啟動子，其包含序列辨識編號：14之核苷^M259。 3. 如申請專利範圍第1項之分離的核酸分子，其中該分離的核酸分子包含一序列辨識編號：31中之破囊壺菌目脂肪酸去飽和酶啟動子序列。 4. 如申清專利範圍第1項之分離的核酸分子，其中該分離的核酸分子包含一序列辨識編號：34中之破囊壺菌目聚乙醯合成酶啟動子序列。 5. 如申清專利範圍第1項之分離的核酸分子，其中_分離的核酸分子進一步包含一編碼蛋白質之核酸序列，該核酸序列被可操作地連結至該啟動子。 6. 如申請專利範圍第5項之分離的核酸分子，其中該蛋自質包含一與選自於由下列所組成的鮮組之序列至少 95%相同的胺基酸序列：序列辨識編號：μ、序列辨識編號：19、序列辨識編號：22及序列辨識編號：24，其中該蛋白質為乙醯乳酸合成酶。 7. 如申請專利範圍第6項之分離的核酸分子，其中該蛋白質包含一不同於序列辨識編號：15的胺基酸序列，其係藉由在選自於由下列所組成之群組的胺基酸位置處刪除、嵌入或取代一胺基酸：116G、117A、192P、200A、 251K、358M、383D、592V、595W及599F。 8. 如申請專利範圍第6項之分離的核酸分子，其中該蛋白質包含一選自於由下列所組成之群組的胺基酸序列：序 2 第100112656號專利再審查案申請專利範圍替換本 101.6.14 列辨識編號：15、序列辨識編號：19、序列辨識編號： 22及序列辨識編號：24 » 9. 如申請專利範圍第8項之分離的核酸分子，其中編碼該蛋白質之核酸序列係選自於由下列所組成之群組：序列辨識編號：14之核苷酸1260-3314、序列辨識編號：18 之核蒈酸1260-3314、序列辨識編號：21之核苷酸 1260-3314及序列辨識編號：23之核苷酸1260-3314。 10. 如申請專利範圍第5項之分離的核酸分子，其中該蛋白質與選自於由下列所組成之群組的脂肪酸之合成有關.廿二碳六稀酸(DHA)、廿二碳五烯酸(DPA)、廿十碳五稀酸(EPA)及花生四稀酸(ARA)。 11. 如申請專利範圍第5項之分離的核酸分子，其中該蛋白質係選自於由下列所組成之群組：脂肪酸合成酶、脂肪酸去飽和酶、脂肪酸鏈加長酶、與聚乙醯合成酶複合體有關的蛋白質及與將脂肪酸類併入磷脂類或併入甘油二醋分子有關的蛋白質0 12·如申請專利範圍第5項之分離的核酸分子，其中該蛋白質為ω·3脂肪酸去飽和酶，其包含序列辨識編號：3〇之胺基酸序列。 13. 如申請專利範圍第5項之分離的核酸分子，其中該蛋白質為一多烯脂肪醆異構酶。 14. 如申請專利範圍第5項之分離的核酸分子’其中該蛋白質係選自於由下列所組成之群組：HMG-CoA合成酶、 HMG-CoA還原酶、鯊烯合成酶、八氫番茄紅素合成酶、 1377253 第100112656號專利再審查案申請專利範圍替換本 101.6.14 八氫番茄紅素去飽和酶、類胡蘿蔔素環化酵素、類胡蘿蔔素羥化酶、類胡蘿蔔素酮酶、維他命E及硫辛酸。 15. 如申請專利範圍第5項之分離的核酸分子’其中該蛋白質係博菜黴素結合蛋白質。 16. 如申請專利範圍第15項之分離的核酸分子，其中該博菜黴素結合蛋白質包含序列辨識編號：10之胺基酸序列。 17. 如申請專利範圍第5至16項任一項之分離的核酸分子，其中該啟動子包含序列辨識編號：9之核苷酸441-894。 —種重組型載體，其包含申請專利範圍第17項之分離的核酸分子。 19·如申清專利範圍第18項之重組型載體，其中該重組型載體為一種表現載體。 20. 如申請專利範圍第18項之重組型载體，其中該重組型載體為一種致標載體。 21. —種重組型載體，其包含申請專利範圍第丨至16項任一項之分離的核酸分子。 22·如申專利範圍第21項之重組型载體其中該重組型載體為一種表現載體。 23.如申請專·圍第21項之重_載體其中該重組型載體為一種致標載體。種破囊3?菌目重組型微生物，其包含申請專利範圍第 1至16項任—項之分離的核酸分子。 β專利範圍第24項之重組型微生物，其中該微生物糸自於選自於由下列所組成的群組之物種：裂壺菌 4 101.6.14 第100112656號專利再審查案申請專利範圍替換本 (Schizochytrium sp.)、叢狀裂壺篦（Schizochytfium aggregaium)、軟體裂壺菌（Schizochyifium limacinum)、小裂壺菌少irzwm mzViMiMm)、破囊壺菌 (Thraustochytrium sp.)、致狀破囊壺菌（Thmustochytrium striatum)、黃金破囊壺菌（Thraustochytrium aureum)、粉紅破囊壺菌roseww)及曰本壺菌 [Japonochyifium sp.)。 26. —種破囊壺菌目重組型微生物，其包含申請專利範圍第 Π項之分離的核酸分子。 27. 如申請專利範圍第26項之重組型微生物，其中該微生物係來自於選自於由下列所組成的群組之物種：裂壺菌 (Schizochytrium sjj.)、叢狀裂壺菌（Schizochytrium 、軟體裂壺菌/imac/nwzw)、小裂壺菌、破囊壺菌 (Thraustochytrium sp.)、故狀破隻壺菌（Thraustochytrium siWaiwm) ' 黃金破囊壺菌（77irawsioc/i少iriwm awrewm)、粉紅破囊壺菌（TTiraMsioc/z少ir/ww ro«seww)及日本壺菌 (Japonochyirium sp.)。