本明細書で開示されるのは、ザイモモナス(Zymomonas)中で高度に活性であり、それを使用してキシロース利用とエタノール産生を増大させてもよい、キシロースイソメラーゼ酵素である。エタノールは、化石燃料の置き換えにおいて使用される、重要な化合物である。
特許請求の範囲および明細書の説明のために、以下の定義が使用されることもある。
本明細書での用法では、「comprises」、「comprising」、「includes」、「including」、「has」、「having」、「contains」または「containing」という用語、またはあらゆるその他のバリエーションは、非排他的包含を範囲に含むことが意図される。例えば要素の一覧を構成する組成物、混合物、工程、方法、物品、または装置は、必ずしもそれらの要素のみに限定されず、明示的に列挙されないその他の要素、またはこのような組成物、混合物、工程、方法、物品、または装置に固有のその他の要素を含んでもよい。さらに特に断りのない限り、「または」は包含的「または」を指し、排他的「または」を指さない。例えば条件AまたはBは、以下のいずれか1つによって満たされる。Aが真であり(または存在する)Bは偽である(または存在しない)、Aが偽であり(または存在しない)Bは真である(または存在する)、AおよびBの双方が真である(または存在する)。
また本発明の要素または構成要素に先行する不定冠詞「a」および「an」は、要素または構成要素の事例(すなわち発生)の数に関して非制限的であることが意図される。したがって「a」または「an」は、1つまたは少なくとも1つを含むものと解釈されるべきであり、要素または構成要素の単数語形は、数が明らかに単数形を意味する場合を除き複数形もまた含む。
「発明」または「本発明」という用語は、本明細書の用法では非限定的用語であり、特定の発明のいずれかの単一の実施形態を指すことは意図されず、本明細書および特許請求の範囲に記載される全ての可能な実施形態を網羅する。
本明細書の用法では、用いられる本発明の成分または反応物質の量を修飾する「約」という用語は、例えば、実際に濃縮物または調製溶液を作成するために使用される典型的な測定および液体取り扱い手順を通じて;これらの手順における不注意による誤りを通じて;組成物を作成しまたは方法を実施するのに用いられる成分の製造、原料、または純度の差違を通じて、生じ得る数量の変動を指す。「約」という用語は、特定の最初の混合物から得られる組成物の異なる平衡条件のために、異なる量もまた網羅する。「約」という用語によって修飾されているか否かを問わず、特許請求の範囲は量の同等物を含む。一実施形態では、「約」という用語は、報告される数値の10%以内、好ましくは報告される数値の5%以内を意味する。
「炭素基質」または「発酵性炭素基質」という用語は、本発明の宿主生物が代謝できる炭素源、特に単糖類、オリゴ糖類、および多糖類からなる群から選択される炭素源を指す。
「遺伝子」は特定タンパク質または機能的RNA分子を発現する核酸断片を指し、それはコード配列に先行する制御配列(5’非コード配列)と、コード配列に続く制御配列(3’非コード配列)を任意選択的に含んでもよい。「天然遺伝子」または「野性型遺伝子」は、それ自身の制御配列と共に自然界に見られる遺伝子を指す。「キメラ遺伝子」は、自然界に一緒には見られない制御配列およびコード配列を含んでなる、天然遺伝子でないあらゆる遺伝子を指す。したがってキメラ遺伝子は、異なる起源に由来する制御配列およびコード配列を含んでなってもよく、または同一起源に由来するが、自然界に見られるのとは異なる様式で配列する制御配列およびコード配列を含んでなってもよい。「内在性遺伝子」は、生物のゲノム中のその天然の位置にある天然遺伝子を指す。「外来性」遺伝子は、常態では宿主生物中に見られず、遺伝子移入によって宿主生物に導入された遺伝子を指す。外来遺伝子は、非天然生物に挿入された天然遺伝子またはキメラ遺伝子を含んでなり得る。
「遺伝子コンストラクト」という用語は、1つまたは複数の特定タンパク質または機能性RNA分子の発現をコードする、核酸断片を指す。遺伝子コンストラクト中では、遺伝子は天然、キメラ、または外来性であってもよい。典型的に遺伝子コンストラクトは、「コード配列」を含んでなる。「コード配列」は、特定のアミノ酸配列をコードするDNA配列を指す。
「プロモーター」または「開始制御領域」は、コード配列または機能性RNAの発現を制御できるDNA配列を指す。一般にコード配列は、プロモーター配列に対して3’側に位置する。プロモーターはその全体が天然遺伝子に由来してもよく、または自然界に見られる異なるプロモーターに由来する異なる要素から構成されてもよく、またはさらには合成DNAセグメントを含んでなってもよい。異なるプロモーターが、異なる組織または細胞型において、または異なる発達段階において、または異なる環境条件に応じて、遺伝子の発現を誘導してもよいことは、当業者によって理解される。ほとんどの場合にほとんどの細胞型で遺伝子を発現させるプロモーターは、一般に「構成的プロモーター」と称される。
「発現」という用語は、本明細書での用法では、遺伝子から誘導されるコーディング(mRNA)または機能性RNAの転写と安定した蓄積を指す。発現はまた、mRNAのポリペプチドへの翻訳も指す。「過剰発現」は、通常のまたは非形転換生物中の生成レベルを越える、遺伝子導入生物中における遺伝子産物の生成を指す。
「形質転換」という用語は、本明細書での用法では、遺伝的に安定した遺伝形質をもたらす宿主生物中への核酸断片の転移を指す。転移核酸は、宿主細胞中に保持されるプラスミドの形態であってもよく、またはいくつかの転移核酸は、宿主細胞のゲノムに組み込まれてもよい。形質転換された核酸断片を含有する宿主生物は、「遺伝子導入」または「組み換え」または「形質転換」生物と称される。
「プラスミド」および「ベクター」という用語は、本明細書での用法では、細胞の中央代謝の一部でなく、通常、環状二本鎖DNA分子の形態である遺伝子を保有することが多い染色体外の要素を指す。このような要素は、あらゆる起源に由来する直鎖または環状の一本鎖または二本鎖DNAまたはRNAの自己複製配列、ゲノム一体化配列、ファージまたはヌクレオチド配列であってもよく、その中ではいくつかのヌクレオチド配列が結合されまたは組み換えられて独自構造体になり、それは選択された遺伝子産物のために、適切な3’非翻訳配列と共にプロモーター断片およびDNA配列を細胞内に導入できる。
「作動的に連結する」という用語は、一方の機能が他方によって影響されるような単一核酸断片上の核酸配列の結合を指す。例えばプロモーターがコード配列の発現に影響を与えられる場合、それはコード配列と作動的に連結する(すなわちコード配列はプロモーターの転写制御下にある)。コード配列は、センスまたはアンチセンス方向で制御配列と作動的に連結し得る。
「選択可能なマーカー」という用語は、マーカー遺伝子の効果、すなわち抗生物質に対する耐性に基づいて選択できる、通常、抗生物質または耐薬品性遺伝子である識別因子を意味し、効果を使用して関心のある核酸の遺伝形質を追跡し、および/または関心のある核酸を受け継いだ細胞または生物を同定する。
本明細書での用法では「コドン縮重」という用語は、コードされるポリペプチドのアミノ酸配列に影響を与えることなく、ヌクレオチド配列のバリエーションを可能にする遺伝コード中の性質を指す。当業者は、所定のアミノ酸を特定するヌクレオチドコドンの使用において、特定の宿主細胞によって示される「コドンバイアス」を十分承知している。したがって宿主細胞中における改善された発現のために遺伝子を合成する場合、そのコドン使用頻度が宿主細胞の好ましいコドン使用頻度に近づくように、遺伝子をデザインすることが望ましい。
「コドン最適化された」という用語は、様々な宿主の形質転換のための遺伝子または核酸分子コード領域について言及される場合、DNAによってコードされるポリペプチドを変化させることのない、宿主生物の典型的なコドン使用頻度を反映する遺伝子または核酸分子コード領域中のコドンの改変を指す。
「発酵性糖」という用語は、発酵プロセス中で微生物によって炭素源として使用され得る、オリゴ糖類および単糖類を指す。
「リグノセルロース誘導体」という用語は、リグニンおよびセルロースの双方を含んでなる組成物を指す。リグノセルロース系材料はまた、ヘミセルロースを含んでなってもよい。
「セルロース誘導体」という用語は、セルロースと、ヘミセルロースをはじめとする追加的構成要素とを含んでなる組成物を指す。
「糖化」という用語は、多糖類からの発酵性糖の生成を指す。
「前処理バイオマス」という用語は、糖化に先だって、熱的、物理的および/または化学的に前処理されて、バイオマス中の多糖類へのアクセスしやすさが増大されているバイオマスを意味する。
「生物由来資源」は、あらゆるセルロースまたはリグノセルロース系材料を指し、セルロースを含んでなる材料、および任意にヘミセルロース、リグニン、デンプン、オリゴ糖類および/または単糖類をさらに含んでなる材料を含む。生物由来資源はまた、タンパク質および/または脂質などの追加的構成要素を含んでなってもよい。生物由来資源は単一原料に由来してもよく、または生物由来資源は1つを超える原料に由来する混合物を含んでなり得る。生物由来資源は、単一原料に由来してもよく、または生物由来資源は1つ以上の原料に由来する混合物からなり得て、例えば生物由来資源は、トウモロコシの穂軸とトウモロコシ茎葉の混合物、または草と葉の混合物を含んでなり得る。生物由来資源としては、バイオエネルギー作物、農業残渣、都市固形廃棄物、工業固形廃棄物、製紙業からの汚泥、庭ごみ、木材および森林廃棄物が挙げられるが、これに限定されるものではない。生物由来資源の例としては、トウモロコシ穂軸、トウモロコシ苞葉などの作物残渣、トウモロコシ茎葉、草、小麦、小麦藁、大麦藁、干し草、稲藁、スイッチグラス、古紙、サトウキビバガス、ソルガム、穀物製粉から得られる成分、木材、枝、根、葉、木くず、おがくず、灌木および低木、野菜、果物、花、および動物堆肥が挙げられるが、これに限定されるものではない。
「生物由来資源加水分解産物」は、生物由来資源の糖化から得られる生成物を指す。生物由来資源はまた、糖化に先だって前処理または前加工されてもよい。
「キシロースイソメラーゼ」という用語は、D−キシロースとD−キシルロースの相互変換を触媒する酵素を指す。キシロースイソメラーゼ(XI)は、EC5.3.1.5に分類される酵素群に属する。
バイオインフォマティクス技術分野で公知の「E値」という用語は、一致が偶発する確率を提供する「期待値」である。それは配列に対する一致の統計的有意性を提供する。E値が低いほど、ヒットの有意性がより高い。
「I群キシロースイソメラーゼ」という用語は、本明細書で、以下の基準の少なくとも1つによって定義されるI群に属する、キシロースイソメラーゼタンパク質を指す。a)それは、実施例4の分子系統学的バイオインフォマティクス解析を使用して作成される、A.ミズーリエンシス(A.missouriensis)XIを含む50%の配列一致度の閾値分類に含まれる;b)それは、実施例4の表6に示す分子系統学的解析から判定された、I群およびII群XIセットのGroupSim分析を使用して同定される、特異性決定位置(SDP)においてI群のアミノ酸に実質的に適合する;および/またはc)それは、配列番号2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、および142を使用して作成されたプロファイル隠れマルコフモデルを使用してクエリーした際に、1E−15以下のE値を有し、クエリーは実施例4と同様にZパラメータを10億に設定したhmmsearchアルゴリズムを使用して実施される。「1群」キシロースイソメラーゼは公知であり、文献で定義されているが、本明細書で提供される定義は、文献定義よりもさらに正確であり、以下の考察を与える定義であると理解される。したがって「I群」が本明細書の用法では出願人らの定義を指すのに対し、「II群」は、当該技術分野で一般に理解される定義を指す。
「異種性」という用語は、関心のある位置に天然では見られないことを意味する。例えば異種遺伝子は、宿主生物中には天然では見られず、遺伝子移入によって宿主生物内に導入された遺伝子を指す。さらに、キメラ遺伝子中に存在する異種性核酸分子は、天然では互いに付随しないコード領域およびプロモーターセグメントを有する核酸分子など、天然ではキメラ遺伝子のその他のセグメントに付随して見られない核酸分子である。
本明細書での用法では、「単離核酸分子」は、任意に合成、非自然的または改変ヌクレオチド塩基を含有する、一本鎖または二本鎖のRNAまたはDNAのポリマーである。DNAポリマーの形態の単離核酸分子は、cDNA、ゲノムDNAまたは合成DNAの1つ以上のセグメントを含んでなってもよい。
核酸断片は、適切な温度および溶液イオン強度条件下で、一本鎖形態の核酸断片が他の核酸断片とアニールし得る場合に、cDNA、ゲノムDNA、またはRNA分子などの別の核酸断片と「ハイブリダイズ可能」である。ハイブリダイゼーションおよび洗浄条件については良く知られており、(その内容全体を参照によって本明細書に援用する)Sambrook,J.,Fritsch,E.F.およびManiatis,T.Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989年)、特にその中の第11章および表11.1で例証されている。温度およびイオン強度条件は、ハイブリダイゼーションの「ストリンジェンシー」を決定する。ストリンジェンシー条件は、(遠縁の生物からの相同的配列などの)中程度に類似した断片から、(近縁関係にある生物からの機能性酵素を複製する遺伝子などの)類似性の高い断片までをスクリーンするために調節し得る。ハイブリダイゼーション後の洗浄が、ストリンジェンシー条件を決定する。好ましい条件の1つの組は、6×SSC、0.5%SDSで室温で15分間に始まり、次に2×SSC、0.5%SDSで45℃で30分間の繰り返し、次に0.2×SSC、0.5%SDSで50℃で30分間の2回の繰り返しの一連の洗浄を使用する。ストリンジェントな条件のより好ましい組はより高い温度を使用し、その中で洗浄は、0.2×SSC、0.5%SDS中での最後の2回の30分間の洗浄温度が60℃に増大されること以外は上と同一である。高度にストリンジェントな条件の別の好ましい組は、0.1×SSC、0.1%SDS中で65℃で2回の最終洗浄を使用する。追加的なストリンジェントな条件の組は、例えば0.1×SSC、0.1%SDS、65℃でのハイブリダイゼーション、および2×SSC、0.1%SDSでの洗浄後、0.1×SSC、0.1%SDSを含む。
ハイブリダイゼーションは2つの核酸が相補的配列を含有することを要するが、ハイブリダイゼーションのストリンジェンシー次第で、塩基間のミスマッチもあり得る。核酸をハイブリダイズさせる適切なストリンジェンシーは、当該技術分野で良く知られている変数である、核酸の長さおよび相補性の程度に左右される。2つのヌクレオチド配列間の類似性または相同性の程度が大きいほど、これらの配列を有する核酸ハイブリッドのTm値はより大きくなる。核酸ハイブリダイゼーションの相対安定性(より高いTmに対応する)は、以下の順に低下する:RNA:RNA、DNA:RNA、DNA:DNA。長さが100を超えるヌクレオチドのハイブリッドでは、Tmを計算する式が導かれている(Sambrookら、前出参照、9.50〜9.51)。より短い核酸、すなわちオリゴヌクレオチドのハイブリダイゼーションでは、ミスマッチの位置がより重要になり、オリゴヌクレオチドの長さがその特異性を決定する(Sambrookら、前出参照、11.7〜11.8)。一実施態様ではハイブリダイズ可能な核酸の長さは、少なくとも約10ヌクレオチドである。好ましくはハイブリダイズ可能な核酸の最小長さは、少なくとも約15ヌクレオチドであり、より好ましくは少なくとも約20ヌクレオチドであり、最も好ましくは長さは少なくとも約30ヌクレオチドである。さらに当業者は、プローブ長などの要素に準じて、温度および洗浄溶液塩濃度を必要に応じて調節してもよいことを認識するであろう。
「相補的」という用語は、互いにハイブリダイズできるヌクレオチド塩基間の関係を記載するのに使用される。例えばDNAに関して、アデノシンはチミンに相補的であり、シトシンはグアニンに相補的である。
「相同性」および「相同的」という用語は、本明細書で同義的に使用される。これらは、その中で1つ以上のヌクレオチド塩基の変更が、核酸断片が遺伝子発現を仲介し、または特定の表現型を生成する能力に影響を及ぼさない、核酸断片を指す。これらの用語はまた、最初の無修飾断片と比較して、得られる核酸断片の機能特性を実質的に変化させない、1つ以上のヌクレオチドの欠失または挿入などの本発明の核酸断片の修飾も指す。したがって当業者は理解するであろうように、本発明は、特定の具体的配列以上のものを包含すると理解される。
さらに当業者は、本発明に包含される相同的な核酸配列はまた、中程度にストリンジェントな条件(例えば0.5×SSC、0.1%SDS、60℃)下で、本明細書で例証される配列とハイブリダイズする、または本明細書で開示される核酸配列のいずれかと機能的に同等である本明細書で開示されるヌクレオチド配列のあらゆる部分とハイブリダイズする、それらの能力によって定義されることを認識する。
「%同一性」という用語は、当該技術分野で知られているように、配列を比較して判定される、2つ以上のポリペプチド配列または2つ以上のポリヌクレオチド配列間の関係である。当該技術分野で「同一性」はまた、場合によっては、このような配列ストリング間のマッチにより判定される、ポリペプチドまたはポリヌクレオチド配列間の配列関連性の程度を意味する。「同一性」および「類似性」は、以下に記載されるものをはじめとするが、これに限定されるものではない既知の方法によって容易に計算され得る。1.)Computational Molecular Biology(Lesk,A.M.編)Oxford University:NY(1988年);2.)Biocomputing:Informatics and Genome Projects(Smith,D.W.編)Academic:NY(1993年);3.)Computer Analysis of Sequence Data,Part I(Griffin,A.M.およびGriffin,H.G.編)Humania:NJ(1994年);4.)Sequence Analysis in Molecular Biology(von Heinje, G.編)Academic(1987年);および5.)Sequence Analysis Primer(Gribskov,M.およびDevereux,J.編)Stockton:NY(1991年)。
同一性を判定する好ましい方法は、試験される配列間に最良のマッチを与えるようにデザインされる。同一性および類似性を判定する方法は、公的に入手可能なコンピュータプログラム中で体系化される。配列アラインメントおよび%同一性の計算は、LASERGENEバイオインフォマティクス演算スイート(DNASTAR Inc.,Madison,WI)のMegAlign(商標)プログラムを使用して実施してもよい。
配列の多重アラインメントは、Clustal Vとラベルされるアラインメント法に相当し、LASERGENEバイオインフォマティクス演算スイート(DNASTAR Inc.)のMegAlign(商標)プログラムにある、「アラインメントのClustal V法」(HigginsおよびSharp,CABIOS.5:151〜153(1989年);Higgins,D.G.ら,Comput.Appl.Biosci.,8:189〜191(1992年)によって記載される)をはじめとする、アルゴリズムのいくつかのバラエティーを包含する「アラインメントのClustal法」を使用して実施される。多重アラインメントでは、デフォルト値は、GAP PENALTY=10およびGAP LENGTH PENALTY=10に相当する。Clustal法を使用したタンパク質配列のペアワイズアラインメントおよび%同一性計算のデフォルトパラメーターは、KTUPLE=1、GAPPENALTY=3、WINDOW=5、およびDIAGONALS SAVED=5である。核酸では、これらのパラメーターは、KTUPLE=2、GAP PENALTY=5、WINDOW=4、およびDIAGONALS SAVED=4である。Clustal Vプログラムを使用した配列のアラインメント後、同一プログラム中の「配列距離」表を見ることで「%同一性」得ることができる。
さらにClustal Wとラベルされるアラインメント法に相当して、LASERGENEバイオインフォマティクス演算スイート(DNASTAR Inc.)のMegAlign(商標)v6.1プログラムにある、「アラインメントのClustal W法」(HigginsおよびSharp,CABIOS.5:151〜153(1989年);Higgins,D.G.ら、Comput.Appl.Biosci.8:189〜191(1992年)によって記載される)を利用できる。多重アラインメントのデフォルトパラメーター(GAP PENALTY=10、GAP LENGTH PENALTY=0.2、Delay Divergen Seqs(%)=30、DNA Transition Weight=0.5、Protein Weight Matrix=Gonnet Series、DNA Weight Matrix=IUB)。Clustal Wプログラムを使用した配列のアラインメント後、同一プログラム中の「配列距離」表を見ることで、「%同一性」を得ることができる。
その他の種からのポリペプチドを同定する上で、多くのレベルの配列同一性が有用であることは、当業者によって良く理解され、このようなポリペプチドは同一のまたは類似した機能または活性を有する。%同一性の有用な例としては、50%、55%、60%、65%、70%、75%、80%、85%、90%、または95%が挙げられるが、これに限定されるものではなく、または本発明を説明するのに、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%などの50%から100%までのあらゆる整数百分率が有用であることもある。適切な核酸断片は、上の相同性を有するだけでなく、典型的に少なくとも50個のアミノ酸、好ましくは少なくとも100個のアミノ酸、より好ましくは少なくとも150個のアミノ酸、さらにより好ましくは少なくとも200個のアミノ酸、および最も好ましくは少なくとも250個のアミノ酸を有するポリペプチドをコードする。
「配列分析ソフトウェア」という用語は、ヌクレオチドまたはアミノ酸配列の分析のために有用なあらゆるコンピュータアルゴリズムまたはソフトウェアプログラムを指す。「配列分析ソフトウェア」は、市販のものでも、あるいは独立して開発されても良い。典型的な配列分析ソフトウェアとしては、1.)Genetics Computer Group(GCG)(Madison,WI)からのGCGプログラム一式(Wisconsin Package Version 9.0)、2.)BLASTP、BLASTN、BLASTX(Altschulら,J.Mol.Biol.215:403〜410(1990年))、および3.)DNASTAR,Inc.(Madison,WI)からのDNASTAR、4.)Gene Codes Corporation(Ann Arbor,MI)からのSequencher、および5.)スミス−ウォーターマン・アルゴリズムを組み入れたFASTAプログラム(W.R.Pearson、Comput.Methods Genome Res.[Proc.Int.Symp.](1994年),1992年会議,111〜20,編集者:Suhai,Sandor,Plenum,New York,NY)が挙げられるが、これに限定されるものではない。本明細書の文脈で分析のために配列分析ソフトウェアが使用される場合、特に断りのない限り、分析結果は言及されるプログラムの「デフォルト値」に基づくものと理解される。本明細書での用法では、「デフォルト値」とは、最初に初期化されるときにソフトウェアに元からロードされる、あらゆる値またはパラメータの組を意味する。
本明細書で使用される標準リコンビナントDNAおよび分子クローニング技術については当該技術分野で良く知られており、Sambrook,J.,Fritsch,E.F.,およびManiatis,T.,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York(1989年)(下文において「Maniatis」);Silhavy,T.J.,Bennan,M.L.およびEnquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory:Cold Spring Harbor,New York(1984年);およびAusubel,F.M.ら,Current Protocols in Molecular Biology,Greene Publishing and Wiley−Interscienceによる出版(1987年)に記載されている。
本発明は、キシロース含有培地中で発酵させると、改善されたキシロース利用を有する、キシロース利用ザイモモナス(Zymomonas)またはザイモバクター(Zymobacter)の遺伝子改変株に関する。典型的に生物由来資源の前処理および糖化によって生成される生物由来資源加水分解産物を含む培地における、生体触媒発酵によるエタノール生産改善の難しい課題は、キシロースースの最適な資化を得ることである。キシロースは、加水分解リグノセルロース系材料中の主要な五炭糖の1つであり、その他はアラビノースである。出願人らは、キシロース利用ザイモモナス(Zymomonas)株中で発現されると、キシロース含有培地中で発酵した際に、キシロース利用の効率増大およびエタノールの収率増大を提供する、1群のキシロースイソメラーゼを同定した。
高度に効果的なキシロースイソメラーゼの発見
キシロースからキシルロースへの変換を触媒するキシロースイソメラーゼ(XI)は、細菌細胞中で発現されると炭素源としてキシロースを利用する能力を提供する、4つの酵素の1つである。キシルロキナーゼ、トランスケトラーゼ、およびトランスアルドラーゼと共に、XIは、図1に示されるように、エタノール生合成中に供給される果糖−6−Pおよびグリセルアルデヒド−3−Pを生成する、キシロースからの経路を提供する。キシロース利用経路の第1の酵素として、キシロースイソメラーゼ活性は、究極的にキシロースをエタノールに変換する能力を提供する上で、特に重要である。出願人らは、エタノール産生細菌、ザイモモナス(Zymomonas)中で発現された際に、典型的に使用される大腸菌(E.coli)XIと比較して、より高い活性を有して改善されたキシロース利用およびエタノール産生を支援する、キシロースイソメラーゼを同定した。
大腸菌(E.coli)からのキシロースイソメラーゼは、キシロース利用のためにザイモモナス(Zymomonas)を遺伝子改変するのに使用されている。キシロースイソメラーゼは、それらのサイズ、アミノ酸配列類似性、および二価のカチオン選択性に基づいて、2つの群に分類される(Park and Batt(2004)Applied and Environmental Microbiology 70:4318−4325)。大腸菌(E.coli)XIはII群に属する。
出願人らは、I群(本明細書の定義による)に属するXIが、キシロース利用ザイモモナス(Zymomonas)中のキシロース利用およびエタノール産生に、改善された特性を提供することを発見した。アクチノプラネス・ミズーリエンシス(Actinoplanes missouriensis)XIは、下述するように、I群XIであることが分かった。コドン最適化コード配列(配列番号308)を使用してザイモモナス(Zymomonas)中で発現されると、アクチノプラネス・ミズーリエンシス(Actinoplanes missouriensis)からのXIは、(コドン最適化コード配列:配列番号310を使用して)同様に発現された大腸菌(E.coli)XIの比活性、または(コドン最適化コード配列:配列番号309を使用して)同様に発現されたラクトバチルス・ブレビス(Lactobacillus brevis)の他のII群XIの比活性よりも高い、キシロースイソメラーゼ比活性を有した。A.ミズーリエンシス(A.missouriensis)、大腸菌(E.coli)、およびL.ブレビス(L.brevis)XIのためのコドン最適化コード配列は、非最適化コード配列から発現された大腸菌(E.coli)キシロースイソメラーゼをはじめとする、キシロース利用のための4酵素全てを用いて遺伝子改変されたザイモモナス(Zymomonas)中でそれぞれ発現された。A.ミズーリエンシス(A.missouriensis)XIを発現する株は、大腸菌(E.coli)またはL.ブレビス(L.brevis)のどちらかからのXIを発現する株よりも、キシロース含有培地中でより良く成長し、より多くのキシロースを利用して、より多くのエタノールを産生した。
下述するように、I群に属すると同定された追加的なXIを発現するザイモモナス(Zymomonas)株もまた、大腸菌(E.coli)またはL.ブレビス(L.brevis)からのII群XIを発現する株よりも、キシロース含有培地中でより良く成長し、より多くのキシロースを利用して、より多くのエタノールを産生することが分かった。これらは、ゲオデルマトフィルス・オブスクルス(Geodermatophilus obscurus)(配列番号64)、マイコバクテリウム・スメグマチス(Mycobacterium smegmatis)(配列番号10)、サリニスポラ・アレニコーラ(Salinispora arenicola)(配列番号18)、およびキシラニモナス・セルシリティカ(Xylanimonas cellulosilytica)(配列番号40)からのXIを含有する株である。
I群XI発現株では、II群XI発現株と比較して、成長増大、キシロース利用改善、およびエタノール産生改善は、それぞれ程度が変動してもよい。差違は、特定XIをコードする遺伝子の発現特性、キシロースやその他の炭素源の量をはじめとする培地中の炭素源組成などの培養条件、およびキシロース利用および/またはエタノール産生に関与する追加的な遺伝子修飾などの株の特性などの要素に基づいてもよい。
I群キシロースイソメラーゼ
I群に属するあらゆるXIを検討中の株で使用して、キシロース利用を改善してもよい。I群XIは、それらの長さによってII群XIから区別される。I群XIは長さが典型的に約380〜390個のアミノ酸であるのに対し、II群XIは長さが典型的に約440〜460個のアミノ酸であることが分かった。I群XI中では少なくとも約50%のアミノ酸同一性があるのに対し、II群XIはI群XIと20〜30%のアミノ酸同一性のみを有する。したがってこれらの構造基準を使用して、XIはI群またはII群に属すると容易に分類され得る。
Park and Batt(前出)において、I群に属すると同定されたXIは、ストレプトミセス(Streptomyces)、アクチノプラーネス(Actinoplanes)、サーマス(Thermus)、およびアルスロバクター(Arthrobacter)からのものである一方、II群に属すると同定されたXIは、クレブシエラ(Klebsiella)、エシェリキア(Escherichia)、乳酸桿菌(Lactobacillus)、ラクトコッカス(Lactococcus)、クロストリジウム(Clostridium)、バチルス(Bacillus)、ブドウ球菌(Staphylococcus)、およびサーモアナエロバクター(Thermoanaerobacter)からのものである。
バイオインフォマティクス解析を使用して、II群XIとの対比でI群XIをより詳しく特性解析し、検討中の株で使用してもよいXIを同定する。XIアミノ酸配列の分子系統学的解析を使用して、I群キシロースイソメラーゼのメンバーが同定された。配列番号2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、142、および148〜306のSWISSPROTデータベースから取得した機能注解付きの180個のXIシード配列を使用して、複数クエリー配列BLAST分析(blastall)を使用して、公共データベースから収集された444個のXI配列に対して、分子系統学的解析を実施した。
図2に示される得られた系統樹では、I群と称される1系統学的分類内にA.ミズーリエンシス(A.missouriensis)XIを、II群と称される別個の分類に大腸菌(E.coli)XIを置く。I群およびII群は、Park and Bratt(前出)の分類と一致するようにラベルされる。本明細書の実施例3で試験され、大腸菌(E.coli)からのXIと同等の効果を有することが示されたラクトバチルス・ブレビス(Lactobacillus brevis)XIは、II群にもある。21個のシード配列(配列番号2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、および142)は、I群XIに属することが分かった。I群に属する同定されたXI配列は、実施例4に記載されるように、50%の一致度の閾値クラスターを形成する。II群に属するXI配列は、別個の50%の一致度の閾値クラスターを形成する。各同定されたI群XIは、以下の微生物の1つのゲノムによってコードされ、したがってそれに内在性である。アクチノプラーネス(Actinoplanes)、アルスロバクター(Arthrobacter)、ストレプトミセス(Streptomyces)、サーマス(Thermus)、サーモバキュラム(Thermobaculum)、ヘルペトシフォン(Herpetosiphon)、アシドバクテリア(Acidobacteria)、ロゼイフレクサス(Roseiflexus)、メイオサーマス(Meiothermus)、デイノコッカス(Deinococcus)、メイオサーマス(Meiothermus)、スタッケブランドチア(Stackebrandtia)、クリベラ(Kribbella)、キシラニモナス(Xylanimonas)、ノカルジオプシス(Nocardiopsis)、カテヌリスポラ(Catenulispora)、ストレプトスポランギウム(Streptosporangium)、ゲオデルマトフィルス(Geodermatophilus)、アクチノシネマ(Actinosynnema)、サッカロモノスポラ(Saccharomonospora)、アシドサーマス(Acidothermus)、サーモビフィダ(Tthermobifida)、ノカルジオイデス(Nocardiodes)、ジャニバクター(Janibacter)、マイコバクテリウム(Mycobacterium)、レイフソニア(Leifsonia)、クラビバクター(Clavibacter)、ミクロモノスポラ(Micromonospora)、サリニスポラ(Salinispora)、セルロモナス(Cellulomonas)、ジョネシア(Jonesia)、ナカムレラ(Nakamurella)、アクチノミセス(Actinomyces)、モビルンカス(Mobiluncus)、ブラキバクテリウム(Brachybacterium)、ボイテンベルギア(Beutenbergia)、フランキア(Frankia)、およびアクチノバクテリウム(Actinobacterium)。
本明細書の実施例4に記載される分子系統学的解析による測定によってI群XIに属するあらゆるXIは、検討中の株で使用されてもよい。I群XIの分子系統学は、図3により詳細に示される。図3中のI群XIは、2〜130の偶数と131〜147の配列番号を有するものとして、表3に列挙される。これらのタンパク質のコード領域は、1〜129の奇数の配列番号を有するものとして、表3に列挙される。本明細書の実施例4に記載される分子系統学的解析を使用してI群に属すると同定され得る、あらゆるその他の同定されたXIは、検討中の株で使用されてもよい。代案としては、検討中の株で使用されてもよいXIは、2〜130の偶数、および131〜147の配列番号のXIアミノ酸配列のいずれかと、少なくとも約70%〜75%、75%〜80%、80〜85%、85%〜90%、90%〜95%、または少なくとも約96%、97%、98%、または99%の配列同一性を有するアミノ酸配列がある、キシロースイソメラーゼタンパク質として同定されてもよい。一実施形態では、検討中の株で使用されてもよいXIは、キシロースイソメラーゼ活性があり、配列番号24、66、134、140、143、145、および147のXIアミノ酸配列と、少なくとも約70%〜75%、75%〜80%、80〜85%、85%〜90%、90%〜95%、または少なくとも約96%、97%、98%、または99%の配列同一性を有するアミノ酸配列がある、タンパク質として同定されてもよい。同一性は、GAP PENALTY=10、GAP LENGTH PENALTY=0.1、およびGonnet 250シリーズのタンパク質重量マトリックスのデフォルトパラメーターを使用した、アラインメントのClustal W法に基づく。
I群およびII群XIは、本明細書の実施例4に記載されるGroupSim分析を使用してさらに特性解析された。この分析を通じて、特定アミノ酸部分が、I群およびII群XIタンパク質の構造を区別するための特異性決定位置(SDP)として判定された。これらのSDPアミノ酸の位置は、本明細書で、アクチノプラネス・ミズーリエンシス(Actinoplanes missouriensis)(配列番号66)からの代表的I群タンパク質P12851中の対応する位置、およびサーモアナエロバクテリウム・サーモスルフリゲネス(Thermoanaerobacterium thermosulfurigenes)(配列番号267)からの代表的II群タンパク質P19148中の対応する位置において提示される。II群タンパク質中の位置は、一般にI群タンパク質よりも約51個多い。その他のI群およびIIタンパク質中の対応する位置は、配列アラインメントおよびコンテクストにより、当業者によって容易に同定され得る。スコア0.9以上のI群およびII群XI(完全スコア1は、群内の全てのタンパク質が指定位置で列挙されるアミノ酸を有し、群間ではアミノ酸が常に異なることを示す)を区別するSDP識別子は、P12851とP19148の対比における以下のアミノ酸(AA)位置である:
1)AA226はロイシンであり;AA277はヒスチジンである
2)AA223はメチオニンであり;AA274はロイシンである
3)AA191はイソロイシンであり;AA242はグルタミンである
4)AA195はスレオニン、セリン、またはバリンであり;AA246はアスパラギン酸である
5)AA88はメチオニン、スレオニン、またはグアニンであり;AA139はアルギニンまたはトリプトファンである
6)AA290はヒスチジンであり;AA337はアスパラギンまたはメチオニンである7)AA221はグルタミン酸またはアスパラギン酸であり;AA272はアラニン、スレオニン、またはグリシンである
8)AA242はフェニルアラニン、バリン、またはロイシンであり;A293はグリシン、システイン、またはトリプトファンである
9)AA243はヒスチジンであり;AA294はセリン、アスパラギン、グリシン、またはロイシンである
10)AA193はロイシン、フェニルアラニン、またはメチオニンであり;AA244はアスパラギン酸である
11)AA256はグルタミンであり;AA308はスレオニン、イソロイシン、バリン、ロイシン、メチオニン、チロシン、またはヒスチジンである
12)AA213はグリシンであり;AA264はリジン、アスパラギン、セリン、グルタミン酸、アラニン、ロイシン、アルギニン、またはグルタミンである
13)AA288はプロリン、チロシン、アラニン、またはセリンであり;AA335はバリンまたはグリシンである
14)AA249はグルタミンであり;AA301はアスパラギン酸、ヒスチジン、アスパラギン、アルギニン、セリン、またはアラニンである。
これらのアミノ酸位置識別子を使用して、I群XIは、当業者によって容易に同定され得る。実質的に上に列挙したようなI群アミノ酸位置識別子を有するXIは、本明細書で長さに関わりなくI群XIと見なされる。したがってII群XIについて示される実質的に全ての位置が、I群XIについて示されるアミノ酸で埋まれば、タンパク質は長さに関わりなくI群XIと見なされる。このパターンがその他のアミノ酸識別子に対しても保持されるなら、例えばヒスチジンの代わりに、277位置にI群AA226ロイシン識別子を有するXIは、I群XIである。実質的に、スコア1との対比でスコア0.9によって示されるように、全位置における完全に正確な一致がなくてもよいことが、意図される。I群XIは、SDPで、上の一覧と一致するアミノ酸の少なくとも90%を有する。
HMMERソフトウェアパッケージ(Janelia Farm Research Campus,Ashburn,VA)のhmmsearchアルゴリズムを使用して、I群XIの追加的なバイオインフォマティクス解析を実施した。hmmsearchアルゴリズムのZパラメータは、10億に設定した。タンパク質配列セットを使用したHMMER分析の出力は、プロファイル隠れマルコフモデル(プロファイルHMM)であった。どちらも参照によって本明細書に援用する、Durbin et al.(Biological sequence analysis:probabilistic models of proteins and nucleic acids,Cambridge University Press,1998)およびKrogh et al.(1994 J.Mol.Biol.235:1501−1531)に記載される、プロファイルHMMの背後にある理論は、タンパク質セットの配列比較における各位置の各アミノ酸の存在確率に基づく、タンパク質セットの特性解析である。
既知のキシロースイソメラーゼ活性を有して、上述の分子系統学的解析により群XIに属することが分かった21個のシード配列をタンパク質セットとして使用して、プロファイルHMMを作成した。これらのタンパク質は、配列番号2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、および142を有する。分子系統学的解析によってI群に属すると同定され表3に列挙される全てのXIは、Zパラメータを10億に設定して、E値スコアが2.2e−181以下のI群シード配列から作成されたプロファイルHMMに一致する。分子系統学的解析によってII群に属すると同定された全てのXIは、E値スコアが1.5e−07以上の同一プロファイルHMMに一致する。添付の表2は、各XI配列番号のE値スコアを列挙する。したがって作成されたプロファイルHMMは、機能的I群XIの構造的特性解析を与え、分子系統学的解析を裏付ける。したがって、I群XIの最大スコアとII群XIの最小スコアの間である1E−15以下のE値で、上述の21個のI群XIシード配列を使用して作成されたプロファイルHMMと一致するあらゆるXIタンパク質が、検討中の株で使用されてもよい。より低いE値スコアは、より良い一致を示す。
さらに、本明細書に記載され、または当該技術分野で記載されるI群XI配列を使用して、自然界のその他の相同体を同定してもよい。例えば本明細書に記載されるXIをコードする核酸断片のそれぞれを使用して、相同タンパク質をコードする遺伝子を単離してもよい。配列依存プロトコルを使用した相同遺伝子の単離については、当該技術分野で良く知られている。配列依存プロトコルの例としては以下が挙げられるが、これに限定されるものではない。1)核酸ハイブリダイゼーション法;2)核酸増幅技術の様々な使用[例えばポリメラーゼ連鎖反応(PCR)、Mullisらに付与された米国特許第4,683,202号明細書;リガーゼ連鎖反応(LCR)、Tabor,S.et al.,Proc.Acad.Sci.USA 82:1074(1985);または鎖置換増幅(SDA)、Walker,et al.,Proc.Natl.Acad.Sci.U.S.A.,89:392(1992)]によって例証される、DNAおよびRNA増幅法;および3)相補性によるライブラリー構築およびスクリーニング法。
当該技術分野で知られているように、遺伝コードの縮重の理由から、アミノ酸配列をコードするDNA配列中に多様性があってもよい。標的宿主細胞中におけるアミノ酸配列発現のためにコドンを最適化して、最適なコードされたタンパク質発現を提供してもよい。
I群XI発現
検討中の株では、Z.モビリス(Z.mobilis)やザイモバクター(Zymobacter)などのザイモモナス(Zymomonas)株または関連エタノロジェン中で、上述したようなキシルロキナーゼ、トランスケトラーゼ、およびトランスアルドラーゼをコードする遺伝子と共に、上述のI群XIのいずれかを発現させてもよく、次にそれは下述するようにキシロースを利用できる。ザイモバクター・パルメ(Zymobacter palmae)は、ザイモモナス(Zymomonas)について下述するように、Z.モビリス(Z.mobilis)グリセルアルデヒド−3−リン酸デヒドロゲナーゼおよびエノラーゼプロモーターを使用して、キシロース利用のための遺伝子発現によってキシロース利用のために遺伝子改変されている、エタノール産生細菌である(Yanase et al.Applied and Environmental Microbiology(2007)73:2592−2599)。
I群XIを発現するのに使用してもよいコード領域としては、1〜129の奇数配列番号として表1に列挙されるもの、2〜130の偶数および131〜147の配列番号として表1に列挙されるXIタンパク質をコードするその他の配列、ならびに本明細書に記載されるバイオインフォマティクスまたは実験法を使用して、I群XIをコードすると当該技術分野で同定された配列、および当該技術分野で周知のものが挙げられる。
発現のためには、キメラ遺伝子中で、作動可能に結合するプロモーターおよび典型的に終止配列と共に、I群XIコーディング領域が構築される。別法としては、I群XIコーディング領域が、プロモーターおよび終止配列と作動可能に結合して、1つまたは複数の追加的なコード領域を含む、オペロンの一部として構築される。使用されてもよいプロモーターは、superGAPプロモーターまたはPgapsと称されることもある、参照によって本明細書に援用する米国特許出願公開第20090246876号明細書で開示されるより高活性のGAPプロモーター変異体をはじめとする、Z.モビリス(Z.mobilis)グリセルアルデヒド−3−リン酸デヒドロゲナーゼ(GAPプロモーターまたはPgap)のプロモーターなどのザイモモナス(Zymomonas)またはザイモバクター(Zymobacter)細胞中で発現されるプロモーター、およびZ.モビリス(Z.mobilis)エノラーゼ(ENOプロモーター)遺伝子である。終結シグナルもまた、標的細胞中で発現されるものである。XI発現のためのキメラ遺伝子またはオペロンは、典型的にさらなる操作のために、ベクター中で構築され、またはそれに移転される。ベクターについては、当該技術分野で良く知られている。特定のベクターは、広範な宿主細菌中で自己複製でき、接合によって移転され得る。pRK404と、3つの関連ベクターpRK437、pRK442、およびpRK442(H)の完全なアノテート付き配列が利用できる。これらの誘導体は、グラム陰性細菌における遺伝子操作の有益なツールであることが判明している(Scott et al.,Plasmid 50(1):74−79(2003))。
ザイモモナス(Zymomonas)中における発現のために特に有用なのは、米国特許第5,514,583号明細書に記載されるpZB188などの大腸菌(E.coli)およびザイモモナス(Zymomonas)の双方の中で自己複製し得るベクターである。ベクターは、細胞内の自律複製のためのプラスミドと、細菌ゲノムに組み込まれるコンストラクトを保有するためのプラスミドを含んでもよい。DNA組み込みのためのプラスミドは、トランスポゾン、標的細菌ゲノムと相同的な核酸配列領域、または組み込みを支援するその他の配列を含んでもよい。追加的なタイプのベクターはまた、例えば商業的にEPICENTRE(登録商標)から入手できるシステムを使用して生成されるトランスポゾームであってもよい。所望の標的宿主および所望の機能のために、適切なベクターをどのように選択するかは良く知られている。
細菌細胞は、凍結解凍形質転換、カルシウム媒介形質転換、電気穿孔、または接合の使用などの周知の方法によって、キシロースイソメラーゼコーディング領域を含んでなるキメラ遺伝子を有するベクターを導入することで、遺伝子改変されてもよい。キシロースイソメラーゼ酵素を発現させることで、キシロース利用のために遺伝子改変されるあらゆる細菌細胞は、本明細書に記載される株を遺伝子改変するための形質転換の標的宿主細胞である。特に適切な宿主細胞は、ザイモモナス(Zymomonas)およびザイモバクター(Zymobacter)細胞である。導入されたキメラ遺伝子は、安定複製型プラスミド上で細胞中に維持されて、または導入に続いてゲノムに組み込まれてもよい。
細菌細胞ゲノム中に組み込まれたキシロースイソメラーゼキメラ遺伝子またはオペロンがある株を遺伝子操作するために、相同的組換え、トランスポゾン挿入、またはトランスポゾーム挿入などの当該技術分野で周知の方法を使用してもよい。相同的組換えでは、標的組み込み部位の側面に位置するDNA配列は、標的ゲノム部位への選択可能なマーカーおよびキシロースイソメラーゼキメラ遺伝子の挿入をもたらす、スペクチノマイシン耐性遺伝子、またはその他の選択可能なマーカー、およびキシロースイソメラーゼキメラ遺伝子と境を接して配置される。さらに選択可能なマーカーは、対応する部位特異的リコンビナーゼの発現後に耐性遺伝子がゲノムから切除されるように、部位特異的組み換え部位と境を接してもよい。
完全キシロース利用経路の遺伝子操作
I群XIコーディング領域を含んでなるキメラ遺伝子またはオペロンによる形質転換に加えて、検討中の株はまた、キシロースの利用に必要な3つのその他の酵素の発現のために遺伝子改変される。キシルロースをリン酸化してキシルロース5−リン酸を形成するキシルロキナーゼ;およびペントース代謝を解糖作用エントナー・ドウドロフ経路に連結してキシロースがエタノールに代謝できるようにする中間体に、キシルロース5−リン酸を変換するペントースリン酸経路の2つの酵素、トランスアルドラーゼおよびトランスケトラーゼ(図1参照)。キシロース利用ザイモモナス(Zymomonas)株は、米国特許第5514583号明細書、米国特許第5712133号明細書、米国特許第6566107号明細書、国際公開第95/28476号パンフレット、Feldmann et al.((1992)Appl Microbiol Biotechnol 38:354−361)、Zhang et al.((1995)Science 267:240−243に記載される。これらの株は、II群キシロースイソメラーゼをはじめとする大腸菌(E.coli)遺伝子からのコード配列によって形質転換された。
I群XIは、キシロース利用のために発現される唯一のXIであってもよく、またはそれは大腸菌(E.coli)からのものなどの発現されたII群XIに加えて発現されてもよい。したがってI群XIは、II群キシロースイソメラーゼをコードする遺伝子を含む完全キシロース利用経路を有してキシロースを利用できる、ザイモモナス(Zymomonas)またはザイモバクター(Zymobacter)株に導入されてもよい。代案としては、I群XIは、キシルロキナーゼ、トランスアルドラーゼ、およびトランスケトラーゼを発現し、キシロース利用のためのキシロースイソメラーゼ活性だけが欠如しているザイモモナス(Zymomonas)またはザイモバクター(Zymobacter)株に導入されてもよい。I群XIの導入によって、株はキシロースが利用できるようになる。
当業者に良く知られているように、個々のキメラ遺伝子から、または2つ以上のコーディング領域を含むオペロンから、追加的な3つの酵素が発現されてもよい。これらの酵素をコードするDNA配列は、腸内細菌、およびある種の酵母および真菌などのキシロースを代謝できる多数の微生物のいずれかから得られてもよい。コード領域の起源としては、キサントモナス(Xanthomonas)、クレブシエラ(Klebsiella)、エシェリキア(Escherichia)、ロドバクター(Rhodobacter)、フラボバクテリウム(Flavobacterium)、アセトバクター(Acetobacter)、グルコノバクター(Gluconobacter)、リゾビウム(Rhizobium)、アグロバクテリウム(Agrobacterium)、サルモネラ(Salmonella)、シュードモナス(Pseudomonads)、およびザイモモナス(Zymomonas)が挙げられる。特に有用なのは、大腸菌(E.coli)のコード領域である。
内在性遺伝子は、キシロース発酵経路の一部を提供してもよく、またはキシロース代謝に有用な酵素活性があるタンパク質を提供する、あらゆる公知の遺伝子操作技術によって改変されてもよい。例えば、内在性トランスケトラーゼは、キシロース利用経路の作成において、その他の導入された酵素機能を補足してもよい。
公知であり、使用されてもよいキシロース利用株の例としては、CP4(pZB5)(米国特許第5,514,583号明細書)、ATCC31821/pZB5(米国特許第6,566,107号明細書)、8b(米国特許出願公開第20030162271号明細書;Mohagheghi et al.,(2004)Biotechnol.Lett.25;321−325)、およびZW658(ATTCC#PTA−7858;米国特許第7,741,119号明細書)が挙げられる。
天然基質でないキシロースのようなその他の糖類を利用するようにさらに遺伝子改変されたザイモモナス(Zymomonas)またはザイモバクター(Zymobacter)株もまた、検討中のプロセスで使用されてもよい。アラビノース利用のために遺伝子改変されたZ.モビリス(Z.mobilis)の株の例は、参照によって本明細書に援用する、米国特許第5,843,760号明細書に記載される。株をその他の追加的な方法で改変して、キシロース利用およびエタノール産生を改善してもよい。
改善されたキシロース利用株の発酵
I群キシロースイソメラーゼキメラ遺伝子、およびキシルロキナーゼ、トランスアルドラーゼ、およびトランスケトラーゼ発現のための遺伝子またはオペロンを有する遺伝子改変キシロース利用株を発酵で使用して、株の天然生成物を生産し、または株がそれを産生するように遺伝子改変されている生成物を生産してもよい。例えばザイモモナス・モビリス(Zymomonas mobilis)およびザイモバクター・パルメ(Zymobacter palmae)は、天然のエタノロジェンである。一例として、発明のZ.モビリス(Z.mobilis)株によるエタノールの生産が記載される。
エタノール生産のために、I群キシロースイソメラーゼキメラ遺伝子を有する組換えキシロース利用Z.モビリス(Z.mobilis)をキシロースをはじめとする混合糖類を含有する培地に接触させる。典型的に培地は、アラビノース、キシロース、およびグルコースを含む混合糖を含有する。培地は、加工セルロース性またはリグノセルロース性バイオマスに由来する糖を含む、生物由来資源加水分解産物を含有してもよい。
米国特許第7,629,156号明細書で開示されるように、成長が阻害される程に混合糖の濃度が高い場合、培地はソルビトール、マンニトール、またはその混合物を含む。ガラクチトールまたはリビトールをソルビトールまたはマンニトールで置換してもよく、またはそれと組み合わせてもよい。Z.モビリス(Z.mobilis)は、発酵が起きてエタノールが生産される培地中で培養する。発酵は、空気、酸素、またはその他の気体の補給なしに(嫌気性、微有酸素性、または微好気性発酵などの条件を含んでもよい)、少なくとも約24時間実施され、30以上時間実施されてもよい。最大のエタノール生産に達するタイミングは、発酵条件次第で変動する。典型的に、培地中に阻害物質が存在するとより長い発酵時間が必要である。発酵は、約30℃〜約37℃の温度および約4.5〜約7.5のpHで実施されてもよい。
本Z.モビリス(Z.mobilis)は、実験室規模の発酵槽内で、および商業的な量のエタノールが生産される大規模発酵において、キシロースを含む混合糖を含有する培地中で培養してもよい。エタノールの商業生産が所望される場合、多様な培養法を応用してもよい。例えば本Z.モビリス(Z.mobilis)株からの大量生産は、バッチおよび連続培養法の双方によって生成されてもよい。古典的バッチ培養法は閉鎖系であり、培地組成物は培養開始時に設定され、培養過程中に人為的変更を受けない。したがって培養過程の開始時に所望の生物を培地に接種して、システムに何も添加することなく成長または代謝活性を生じさせる。しかし典型的に、「バッチ」培養は炭素源の添加に関してのバッチであり、pHおよび酸素濃度などの要素を制御する試みがなされることが多い。バッチシステムでは、システムの代謝産物および生物由来資源組成物は、培養が終結する時点まで常に変化する。バッチ培養中では、細胞は、静止遅滞期から高成長対数期を経て、最後に成長率が減少しまたは停止する定常期に至る。処置されない場合、定常期の細胞はやがて死滅する。対数期の細胞は、いくつかのシステムにおいて、最終産物または中間体の生成の大半の責を負うことが多い。その他のシステムでは、静止期または対数後期生産があり得る。
標準バッチシステムの変法が、流加システムである。流加培養過程もまた、本Z.モビリス(Z.mobilis)株の成長に適し、培養過程の進行に伴って基質が徐々に添加されることを除いては、典型的なバッチシステムを含んでなる。流加システムは、異化代謝産物抑制が細胞代謝を阻害する傾向がある場合、そして培地中に限定的量の基質を有することが望ましい場合に有用である。流加システム中の実際の基質濃度の測定は困難であり、したがってpHやCO2などの廃ガス分圧などの測定可能な要素の変化に基づいて推定される。バッチおよび流加培養法は一般的で、当該技術分野で良く知られており、参照によって本明細書に援用するBiotechnology:A Textbook of Industrial Microbiology,Crueger,Crueger,およびBrock,第2版(1989年)Sinauer Associates,Inc.,Sunderland,MA、またはDeshpande,Mukund V.,Appl.Biochem.Biotechnol.,36,227,(1992年)に例が見られる。
エタノールの商業生産はまた、連続培養を用いて達成されてもよい。連続培養は、規定培地がバイオリアクターに連続的に添加され、同時に加工のために等量の慣熟培地が取り出される開放系である。連続の培養は、一般に、細胞が主として対数成長期にある一定の高液相密度に細胞を保つ。代案としては、固定化細胞を用いて連続培養を実施してもよく、そこでは炭素および栄養素が連続的に添加され、価値ある生成物、副産物または老廃物は細胞集団から連続的に除去される。細胞固定化は、当業者に知られている天然および/または合成材料から構成される、多様な固体担体を使用して実施してもよい。
連続または半連続培養は、細胞成長または最終産物濃度に影響を及ぼす、1つの要素またはあらゆる数の要素の調節を可能にする。例えば1つの方法は、炭素源または窒素レベルなどの制限的栄養物質を定率に保ち、その他の全パラメーターを加減する。別のシステムでは、培地濁度によって測定される細胞濃度を一定に保ちながら、成長に影響を及ぼすいくつかの要素を連続的に変更し得る。連続系は恒常的成長条件を保つことを目指し、したがって培地の除去による細胞損失は、培養中の細胞成長率に対して平衡状態になくてはならない。連続培養過程のために栄養素および増殖因子を調節する方法、ならびに生成物形成速度を最大化する技術は工業微生物学の技術分野で良く知られており、多様な方法がBrock、前出で詳述されている。
エタノール生産に特に適するのは、次のような発酵計画である。本発明の所望のZ.モビリス(Z.mobilis)株を軌道振盪機内で約150rpmで振盪しながら約30℃〜約37℃の半天然培地中で振盪フラスコ内で培養し、次に同様の培地を含有する10Lの種発酵槽に移す。OD600が3〜6になるまで種培養物を種発酵槽内で嫌気的に培養してから、発酵パラメーターをエタノール生産のために最適化した生産発酵槽に移す。種タンクから生産タンクに移される典型的な接種体積は、約2%から約20%v/vの範囲に及ぶ。典型的な発酵培地は、リン酸カリウム(1.0〜10.0g/l)、硫酸アンモニウム(0〜2.0g/l)、硫酸マグネシウム(0〜5.0g/l)、酵母抽出物またはダイズベース製品などの複合窒素源(0〜10g/l)などの最少培地構成要素を含有する。最終濃度約5mMのソルビトールまたはマンニトールが培地中に存在する。最初の炭素源バッチ(50〜200g/l)の枯渇に際し、炭素源を提供するキシロースと、グルコース(またはスクロース)などの少なくとも1つの追加的糖とを含む混合糖が発酵容器に継続的に添加されて、エタノール速度と力価を最大化する。炭素源供給速度は動的に調節されて、酢酸などの毒性副産物の蓄積をもたらし得る過剰なグルコースを培養が蓄積しないようにする。資化される基質から生成するエタノールの収率を最大化するために、最初にバッチ供給され、または発酵過程中に供給される一定量のリン酸塩によって、バイオマス成長を制限する。発酵は、腐食性溶液(水酸化アンモニウム、水酸化カリウム、または水酸化ナトリウムなど)および硫酸またはリン酸のどちらかを使用して、pH5.0〜6.0に調節される。発酵槽の温度は30℃〜35℃に調節される。気泡を最小限にするために、消泡剤(シリコーン基剤、有機基剤などのあらゆる種類)を必要に応じて容器に添加する。株中にそれに対する抗生物質耐性マーカーがある場合、カナマイシンなどの抗生物質を任意に使用して汚染を最小限にしてもよい。
あらゆる上述の条件のセット、およびさらに当該技術分野で周知のこれらの条件のバリエーションが、キシロース利用組換えザイモモナス(Zymomonas)株によるエタノール生産のための適切な条件である。
本発明を以下の実施例でさらに定義する。実施例は、本発明の好ましい実施態様を示唆しながら、例証としてのみ提供されることを理解すべきである。上の考察およびこれらの実施例から、当業者は本発明の本質的特徴を見極め得て、その精神と範囲を逸脱することなく本発明に様々な変更と修正を加えて、それを様々な用途と条件に適応させ得る。
一般方法
略語の意味は次の通り。「kb」はキロベースを意味し、「bp」は塩基対を意味し、「nt」はヌクレオチドを意味し、「hr」は時間を意味し、「min」は分を意味し、「sec」は秒を意味し、「d」は日を意味し、「L」はリットルを意味し、「ml」または「mL」はミリリットルを意味し、「μL」はマイクロリットルを意味し、「μg」はマイクログラムを意味し、「ng」はナノグラムを意味し、「mg」はミリグラムを意味し、「mM」はミリモル濃度を意味し、「μM」はマイクロモル濃度を意味し、「nm」はナノメートルを意味し、「μmol」はマイクロモルを意味し、「pmol」はピコモルを意味し、「Cm」はクロラムフェニコールを意味し、「Cmr」はクロラムフェニコール耐性を意味し、「Cms」はクロラムフェニコール感受性を意味し、「Spr」はスペクチノマイシン耐性を意味し、「Sps」はスペクチノマイシン感受性を意味し、「XI」はキシロースイソメラーゼであり、「XK」はキシルロキナーゼであり、「TAL」はトランスアルドラーゼであり、「TKT」はトランスケトラーゼであり、「RM」は10g/Lの酵母抽出物プラス2g/LのKH2PO4を含有する富栄養培地を意味し、「MM」は10g/Lの酵母抽出物、5g/Lのトリプトン、2.5g/Lの(NH4)2SO4、および0.2g/LのKH2PO4を含有する交配培地を意味する。
実施例で使用する標準組み換えDNAおよび分子クローニング技術は、当該技術分野でよく知られており、Sambrook,J.,Fritsch,E.F.およびManiatis,T.,「Molecular Cloning:A Laboratory Manual」、Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989年)(下文において「Maniatis」);およびSilhavy,T.J.,Bennan,M.L.およびEnquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1984年);およびAusubel,F.M.ら,Current Protocols in Molecular Biology,Greene Publishing Assoc.and Wiley−Interscienceによる出版,Hoboken,NJ(1987年)に記載されている。
実施例1
キメラキシロースイソメラーゼ遺伝子の構築および二重交叉自殺ベクターのアセンブリー ザイモモナス・モビリス(Zymomonas mobilis)への組み込みおよび発現のために、アクチノプラネス・ミズーリエンシス(Actinoplanes missouriensis)(AMxylA)、ラクトバチルス・ブレビス(Lactobacillus brevis)(LBxylA)、および大腸菌(Escherichia coli)(ECxylA)からのキシロースイソメラーゼのコード領域のコンストラクトを作成した。コード配列は、GenScriptCorporation(Piscataway,NJ)によって、Z.モビリス(Z.mobilis)ZM4のコドンバイアスに従ってZ.モビリス(Z.mobilis)中の発現のために最適され、合成された。それぞれEcoRV部位でpUC57にクローンされ、プラスミドpUC57−AMxylA(コドン最適化AMxylAコーディング領域:配列番号308)、pUC57−LBxylA(コドン最適化LBxylAコーディング領域:配列番号309)、およびpUC57−ECxylA(コドン最適化ECxylAコーディング領域:配列番号310)として提供された。最適化xylAコード配列は、天然キシロースイソメラーゼ(XI)をコードする。
Z.モビリス(Z.mobilis)グリセルアルデヒド−3−リン酸デヒドロゲナーゼ遺伝子(Pgap;配列番号311)からの305bpのプロモーターと、大腸菌(E.coli)L−リブロース5リン酸4−エピメラーゼ遺伝子(araD3’UTR;配列番号312)からの166bpのターミネーターとの連結によって、xylAコード配列をPgap−xylA−araD3’UTR構造があるキメラ遺伝子に構築した。この目的で、PgapおよびaraD3’UTR重複断片をPCRによって合成した。1つのPCR反応は、50μLのAccuPrime Pfx SuperMix(Invitrogen,Carlsbad,CA)、テンプレート(配列番号313)としての1μLの40ng/μL pARA354、および1μLの10μM順方向および逆方向プライマーからなった。プラスミドpARA354(配列番号313)は、参照によって本明細書に援用する、同一譲受人同時係属米国特許出願第12/796025号明細書に記載され、それはpBS SK(+)ベクターであり、大腸菌(E.coli)からのaraB、araA、およびaraD(それぞれタンパク質L−リブロースキナーゼ、L−アラビノースイソメラーゼ、およびL−リブロース−5−リン酸−4−エピメラーゼをコードする)のコード領域に隣接するPgapプロモーターであるPgap−araBADオペロンを含む。オペロンは、araDコーディング領域に対して3’である3’非翻訳領域(UTR)を含む。pARA354については、下でさらに記載される。反応は、エッペンドルフMastercycler(Hemburg,Germany)上で、30サイクルの95℃で30秒間の変性/58℃で30秒間のアニーリング(araD3’UTRでは56℃)/68℃で2分間の伸長のホットスタートPCRプログラムに従って実施された。
プライマーara98およびara120(配列番号314および315)は、Pgap−AM重複断片を生成する。プライマーara98およびara121(配列番号314および316)は、Pgap−EC重複断片を生成する。プライマーara98およびara122(配列番号314および317)は、Pgap−LB重複断片を生成する。305bpのPgap配列に加えて、3つのPgap重複PCR断片は全て、StuIおよびSpeI部位を付加する17bpの5’配列と、プライマー中に提供されるそれらの対応xylAコード配列の最初の22ヌクレオチドに一致する22bpの3’配列を含んだ。
プライマーara96およびara97(配列番号318および319)は、210bpのaraD3’UTR重複断片を生成した。それは166bpのaraD3’UTRの他に、XbaI部位が末端にある24bpの5’配列、およびEcoRI、HindII、およびFseI部位を提供する20bpの3’配列を含んだ。同様のPCRもまた実施されてxylA重複断片が合成されたが、アニーリング温度は55℃に低下された。これらの反応では、プライマーara114およびara115(配列番号320および321)を使用して、1,229bpのAMxylA重複断片がpUC57−AMxylAから増幅された。プライマーara116およびara117(配列番号322および323)を使用して、1,367bpのECxylA重複断片がpUC57−ECxylAから増幅された。プライマーara118およびara119(配列番号324および325)を使用して、1,394bpのLBxylA重複断片がpUC57−LBxylAから増幅された。全てのxylA重複断片は、Pgapの最後の18ヌクレオチドと一致する18bpの5’配列、XbaI部位を提供してaraD3’UTRの最初の18ヌクレオチドに一致する24bpの3’配列、ならびにその間のxylAコード配列を有する。Pgap、araD3’UTR、およびxylA重複断片は、5μLの各PCRサンプルをアガロースゲル上で泳動し、次にQIAquick PCR精製キット(Qiagen,Valencia,CA)を使用して精製して確認された。
重複断片は、重複PCRによって共に結合された。第1の重複PCRは、以下のようにして、50μLのAccuPrime Pfx SuperMix、1μLの20ng/μL Pgap重複断片、2μLの10ng/μL対応xylA重複断片、および1μLの10μM順方向および逆方向プライマーを含むように構築された。反応は、30サイクルの95℃で30秒間の変性/55℃で30秒間のアニーリング/68℃で2分間の伸長のホットスタートPCRプログラムに従って実施された。その結果、プライマーara98およびara115(配列番号314および321)を使用して、Pgap−AMおよびAMxylA断片からPgap−AMxylA断片が合成され;プライマーara98およびara117(配列番号314および323)を使用して、Pgap−ECおよびECxylA断片からPgap−ECxylA断片が合成され;プライマーara98およびara119(配列番号314および325)を使用して、Pgap−LBおよびLBxylA断片からPgap−LBxylA断片が合成された。これらのPgap−xylA断片は、5μLの各PCRサンプルをアガロースゲル上で泳動し、次にQIAquick PCR精製キットを使用して精製して確認された。
第2の重複PCRを上と同様に構築した。それは、50μLのAccuPrime PfxSuperMix、1μLの20ng/μL araD3’UTR重複断片、2μLの10ng/μL Pgap−xylA断片、1μLの10μMプライマーara97(配列番号319)、および1μLの10μMプライマーara98(配列番号318)を含んだ。反応は、30サイクルの95℃で30秒間の変性/56℃で30秒間のアニーリング/68℃で2.5分間の伸長で実施された。得られたPCR産物の5μLをアガロースゲル上で検査した。Pgap−AMxylAおよびPgap−LBxylAを含有する反応は、それぞれ1,714bpのキメラAMxylAオペロン断片(Pgap−AMxylA−araD3’UTR)および1,879bpのキメラLBxylAオペロン断片(Pgap−LBxylA−araD3’UTR)を生成した。双方のキメラ遺伝子断片中で、最初の17ヌクレオチドがStuIおよびSpeI部位を提供するのに対し、最後の35ヌクレオチドはFesI、HindIII、およびEcoI部位を含有する。Pgap−ECxylAを含有するPCR反応は、キメラECxylA断片(Pgap−ECxylA−araD3’UTR)を生成できなかった。
AMxylAおよびLBxylAを含有するキメラ遺伝子は、同一譲受人同時係属米国特許出願第12/796025号明細書に記載されるpARA354(配列番号313)と称される二重交叉(DCO)ベクターに、それぞれライゲートされた。pARA354は、pBS SK(+)誘導プラスミド(Bluescriptプラスミド;Stratagene)であり、pBSベクターはザイモモナス(Zymomonas)中で自己複製できないので自殺ベクターとして使用され、上述したようなPgap−araBADオペロンと、DCO相同的組換え断片を含有して、ザイモモナス(Zymomonas)ゲノムのldhA遺伝子座中への境界のある断片(bounded fragment)の組み込みを誘導する。Z.モビリス(Z.mobilis)DNAをテンプレートとして使用し、DCO、LDH−L、およびLDH−Rのための2つのldhA DNA断片をPCRによって合成した。反応はAccuPrime Mixを使用して、標準PCR手順に従った。LDH−L DNA断片は、順方向プライマーara20(配列番号326)および逆方向プライマーara21(配列番号327)を使用して合成された。得られた生成物は、ldhAコード領域に対して5’の配列、およびldhAコード領域のヌクレオチド1〜493を含む895bpのDNA断片であり、5’SacI部位および3’SpeI部位があった(配列番号328)。LDH−R DNA断片は、順方向プライマーara22(配列番号329)および逆方向プライマーara23(配列番号330)を使用して合成された。得られた生成物は、ldhAコード領域のヌクレオチド494〜996、およびldhAコード領域に対して3’の配列を含む1169bpの断片であり、5’EcoRI部位および3’NotI部位があった(配列番号331)。LDH−LおよびLDH−Rは、それぞれldhAコード配列の最初の493塩基対と残りの503塩基対を含有したので、交叉型組み換えによって、ヌクレオチド#493と#494の間でZ.モビリス(Z.mobilis)のldhAコード配列にDNA断片を直接挿入するために、pARA354がデザインされた。
pARA354は大腸菌(E.coli)中のプラスミド増殖のためのf1(+)originと、アンピシリン耐性遺伝子とを有する。これに加えて、pARA354中のLDH−LおよびLDH−R相同的組換え断片の間には、野性型LoxP部位(LoxPw−aadA−LoxPw断片;配列番号307)およびPgap−araBADオペロンと境を接する(スペクチノマイシン耐性のための)aadAマーカーがある。
AMxylAおよびLBxylAキメラ遺伝子を含有するPCR断片をそれぞれSpeIおよびEcoRIで消化して、アガロースゲル電気泳動を実施し、QIAquickゲル精製キット(Qiagen)を使用して精製した。同時に、pARA354もまたSpeIおよびEcoRIで消化して、PgaparaBADオペロンを脱落させた。アガロースゲル電気泳動によってEcoRI−pARA354−SpeIプラスミド主鎖(6,023bp)を単離し、QIAquickゲル精製キットを使用して精製した。キメラAMxylAおよびLBxylA遺伝子は、5μLの消化AMxylAまたはLBxylAキメラ遺伝子断片、2μLの消化pARA354主鎖、3μLの5×リガーゼ緩衝液、および1μLのT4 DNAリガーゼ(Invitrogen)を含む15μLの標準連結反応中で、それぞれpARA354主鎖に構築され、7,714bpのDCOプラスミドpARA355および7,879bpのDCOプラスミドpARA356がそれぞれもたらされた。双方のプラスミドをDH5α大腸菌(E.coli)細胞中で増殖させて、QIAprep Spin Miniprepキット(Qiagen)を使用して調製した。
DCOベクター中でキメラECxylA遺伝子を構築するために、第1の重複PCR中で生成されたPgap−ECxylA重複断片をSpeIおよびXbaIで消化してアガロースゲル電気泳動を実施し、QIAquickゲル精製キットを使用して精製した。同時に、pARA355をSpecIおよびXbaIで消化した。XbaI−pARA355−SpeIプラスミド主鎖(6,220bp)をアガロースゲル電気泳動によって単離し、QIAquickゲル精製キットを使用して精製した。5μLの消化Pgap−ECxylA断片および2μLの消化pARA355主鎖断片を含む、上述したような15μL標準連結反応中で、Pgap−ECxylA断片をpARA355主鎖に組み立てた。得られた7,852bpのDCOプラスミドpARA357をDH5α大腸菌(E.coli)細胞中で増殖させて、QIAprep Spin Miniprepキットを使用して調製した。
実施例2
キメラAMxylA、LBxylA、およびECxylA遺伝子のザイモモナス・モビリス(Zymomonas mobilis)ZW641株への組み込み
ZW641株を使用して、キシロース利用ザイモモナス・モビリス(Zymomonas mobilis)中における、A.ミズーリエンシス(A.missouriensis)、L.ブレビス(L.brevis)または大腸菌(E.coli)XIの発現の効果をアッセイした。ZW641株の調製は、参照によって本明細書に援用する、米国特許第7,741,119号明細書の実施例1に記載される。その中に記載されるX13L3株は、後にZW641と改称された。ZW641は、クロラムフェニコール耐性選択可能マーカーと共に、2つのオペロンPgapxylABおよびPgaptaltktをザイモモナス・モビリス(Zymomonas mobilis)をZW1(ATCC#31821)ゲノムに逐次組み込むことで、調製された。キシロース含有培地中で成長させることで、形質転換体をキシロース利用にさらに適応させた。
ZW641中で、組み込まれたPgapxylABおよびPgaptaltktオペロン、xylA、xylB、tal、およびtktコード領域は大腸菌(E.coli)遺伝子からのものであった。ZW641は、キシロース代謝に必要な4つの遺伝子を全て有したが、キシロース利用は最適でない。したがってZW641中のキシロース利用のバックグラウンドレベルは、さらなるXI遺伝子の発現によって潜在的に改善され得る。
種細胞をMRM3G5(1%の酵母抽出物、15mMのKH2PO4、4mMのMgSO4、および50g/Lのグルコース)中で、150rpmで振盪しながら30℃で一晩、OD600値が5に近くなるまで成長させて、ZW641−1A株(ZW641分離株)のコンピテント細胞を調製した。OD600値は、島津UV−1200分光光度計(日本国京都市)を使用して測定した。細胞を収集して、新鮮培地に0.05のOD600値に再懸濁した。初期から中期対数期(0.5に近いOD600)と同一条件下で、細胞を培養した。細胞を収集して、氷冷水で2回、次に氷冷10%グリセロールで1回洗浄した。得られたコンピテント細胞を収集し、氷冷10%グリセロールにOD600値100近くに再懸濁した。Z.モビリス(Z.mobilis)の形質転換には、非メチル化DNAが必要であるため、DCOプラスミドpARA355、pARA356、およびpARA357を大腸菌(E.coli)SCS110コンピテント細胞(Stratagene,La Jolla,CA)にそれぞれ形質転換した。各形質転換では、1個の形質転換細胞コロニーを10mLのLB−Amp100(100mg/Lアンピシリンを含有するLBブロス)中で一晩37℃で培養した。QIAprep Spin DNA Miniprepキット(Qiagen)を使用して、10mLの培養物からDNAを調製した。
1MM電気穿孔キュベット(VWR,West Chester,PA)内で、およそ1μgの非メチル化プラスミドDNAを50μLのZW641−1Aコンピテント細胞と混合した。BT720 Transporater Plus(BTX−Genetronics,San Diego,CA)を使用して、プラスミドDNAを2.0KVで細胞中に電気穿孔した。1mLのMMG5培地(10g/Lのグルコース、10g/Lの酵母抽出物、5g/Lのトリプトン、2.5g/Lの(NH4) 2SO4、2g/LのK2HPO4、および1mMのMgSO4)中で、4時間にわたり30℃で形質転換細胞を回収し、嫌気ジャー内でAnaeroPack(MitsubishiGasChemical,NewYork,NY)と共に、MMG5−Spec250プレート(250mg/Lのスペクチノマイシンおよび15g/Lの寒天添加MMG5)上で3日間にわたり30℃で培養した。各形質転換で、約20個のスペクチノマイシン耐性コロニーが得られた。これらのコロニーは新鮮MMG5−Spec250プレート上に画線塗抹され、上述したのと同一条件下でのそれらの成長は、キメラxylA遺伝子/Spec−RコンストラクトがZW641のゲノムに組み込まれたことを示唆した。組み込みはPCRによって分析した。1つの反応は、25μLのPCR SuperMix(Invitrogen)、(下で指定されるような)0.5μLの10μM順方向プライマーおよび逆方向プライマー、およびコロニーからの少量のZ.モビリス(Z.mobilis)細胞を含んだ。反応は、エッペンドルフMastercycler上で、35サイクルの94℃で45秒間の変性/55℃で45秒間のアニーリング/72℃で1.5分間の伸長のハードスタートPCRプログラムに従って実施された。5μLをアガロースゲル上で泳動して、反応を検査した。ara46およびara43プライマー(配列番号332および333)を第1の検査で使用すると、1,521bpのPCR産物がほとんどのコロニーから増幅された。この生成物は、プラスミド中のSpec−RマーカーのaadAコーディング領域から、LDH−R断片下流のZ.モビリス(Z.mobilis)ゲノム配列に及び、LDH−R断片によって媒介される組み込み事象が実証される。第2の検査中で、順方向−逆方向プライマー対が、ara45−ara120(配列番号334および315)、ara45−ara122(配列番号334および317)、およびara45−ara121(配列番号334および316)である場合、1,289bpのPCR産物が、ZW641−ara355、ZW641−ara356、およびZW641−ara357のコロニーからそれぞれ増幅された。これらの生成物は、LDH−L断片上流のZ.モビリス(Z.mobilis)ゲノム配列から、pARA355中のAMxylA、pARA356中のLBxylA、またはpARA357中のECxylAに及ぶ。これらは、LDH−L断片によって媒介される組み込み事象を実証した。したがって、PCRの証拠は、キメラxylAオペロン/Spec−RコンストラクトがZW641−1Aのゲノムに組み込まれたことを立証した。pARA355、pARA356、およびpARA357で形質転換されたZW641−1A細胞は、それぞれZW641−ara355、ZW641−ara356、およびZW641−ara357と命名された。
実施例3
ザイモモナス・モビリス(Zymomonas mobilis)ZW641株中のAMxylA、LBxylA、およびECxylA発現の特性解析
ZW641は、低レベルで発現される天然大腸菌(E.coli)xylAコーディング領域のコピーを有する。ZW641株−ara355、ZW641−ara356、およびZW641−ara357は、コドン最適化xylAコーディング領域、すなわちAMxylA、LBxylA、およびECxylAの追加的コピーをそれぞれ含有する。株について、キシロース中におけるキシロース利用、エタノール産生、および成長の改善をアッセイした。
キシロース含有培地中におけるこれらの新しい株の成長を調べ、それらを親株ZW641−1A株と比較するために、先の実施例に記載されるMMG5−Spec250プレートからのZW641−ara355、ZW641−ara356、およびZW641−ara357のそれぞれの2つの株(#1および#2)をMMX5プレート上に再度画線塗抹した(グルコースをキシロースで置き換えたこと以外は同一培地)。ZW641もまた、対照としてプレート上に画線塗抹した。プレート上の細胞は、嫌気ジャー内でAnaeroPackと共に30℃で6日間培養した。3組の新しい株の全てで成長が観察されたが、ZW641対照では観察されなかった。AMxylAの追加的なコピーを含有する、ZW641−ara355の#1および#2株は、キシロース培地上で、ZW641−ara356およびZW641−ara357株よりも顕著により高い成長を示した。
キシロース中の成長を定量的に測定するために、これらの7株に96時間成長アッセイを実施した。アッセイでは、各株からの細胞を30℃の150rpm振盪機内において、3mLのMRM3G5中で一晩培養した。細胞を収集して、MRM3X10(MRM3G5と同一であるが、50g/Lグルコースを100g/Lキシロースで置き換えた)で洗浄し、MRM3X10に再懸濁して出発OD600値を0.1近くにした。25mLの懸濁液を50mLねじ蓋付きVWR遠心管に入れて150rpmで振盪しながら30℃で96時間にわたって培養した。時間経過中、0、4、24、48、72、および96時間目にOD600値を測定した。図4に成長曲線としてプロットされた結果は、xylAの第2のコピーが、キシロース含有培地中における遺伝子改変株の成長を実際改善することを示す。xylAの第2のコピーを含有する株間で比較すると、ZW641−ara355は、ZW641−ara357よりも顕著により早く成長した。それは96時間の成長後に、ZW641−ara357のほぼ2倍の細胞密度を有した。この結果は、AMxylAによってコードされるキシロースイソメラーゼが、ECxylAによってコードされるキシロースイソメラーゼよりもはるかに良好に機能し得ることを示す。ZW641−ara356は、ZW641−ara357と同様にまたはわずかにより遅く成長し、LBxylAによってコードされるキシロースイソメラーゼが、ECxylAによってコードされるキシロースイソメラーゼよりも良好に機能し得ないことを示唆する。
時間経過中、ZW641、ZW641−ara355−1、ZW641−ara356−2、およびZW641−ara357−2培養物の1mLのサンプルを72時間目に収集した。それらを10,000×gで遠心分離して、細胞を除去した。0.22μmのCostar Spin−X遠心管フィルターを通して上清を濾過し、Agilent 1100 HPLCシステム上で、0.01NのH2SO4と共に、55℃速度0.6mL/分でBioRad Aminex HPX−A7Hイオン排除カラムを通過させて分析し、エタノールおよびキシロース濃度を判定した。表5に示す結果は、ZW641における基底レベルのキシロース利用およびエタノール産生と比較して、ZW641−ara355中のAMxylAがキシロース消費を顕著に促進し、エタノール産生を3.5倍以上増大させたことを示す。ZW641−ara357中のECxylAが、キシロース代謝およびエタノール産生をわずかに増大させたのに対し、ZW641−ara356中のLBxylAはキシロース利用の最も小さい増大を提供し、エタノール産生に検出可能な変化を引き起こさなかった。これらの結果は、以前の成長の観察と一致し、株間の成長の差違が、キシロースイソメラーゼ活性の差違から帰結してもよい、キシロース代謝の差違によって引き起こされたことを示唆する。
AMxylA、LBxylA、およびECxylAによってコードされるキシロースイソメラーゼ酵素が、異なる活性を有するかどうかを判定するために、ZW641、ZW641−ara355−1、ZW641−ara356−2、およびZW641−ara357−2を30℃の150rpm振盪機上において、MRM3G5中で一晩培養した。細胞を10,000×gの遠心分離によって2mLの培養物から収集し、氷冷タンパク質抽出緩衝液(10mMのトリエタノールアミン塩酸塩、pH8.0、10mMのMgSO4、1mMのDTT、および5%のグリセロール)で洗浄して、500μLの氷冷タンパク質抽出緩衝液に再懸濁し、マイクロプレートホーン付きMisonix超音波処理器4000(Qsonica,Newtown,CT)を使用して、設定7で3分間の超音波処理に3回曝露させた。10,000×gの遠心分離によって、細胞残骸を除去した。上清をタンパク質抽出物として保存した。クーマシープラスタンパク質アッセイ試薬(Pierce,Rockford,IL)を使用してそれらのタンパク質濃度を測定し、キシロースイソメラーゼ活性は修正システイン−カルバゾール法によって測定した。100μLのシステイン−カルバゾールアッセイ反応は、10mMのトリエタノールアミン塩酸塩緩衝液、pH7.0、10mMのMgSO4、25mMのD−キシロース、および30μgの抽出タンパク質を含有した。32℃で15分間の培養後、25μlの50%トリクロロ酢酸の添加によって反応を停止した。次に、3mlの氷冷75%硫酸、100μlの2.4%システイン塩酸塩溶液、および100μlの0.12%カルバゾールエタノール溶液を逐次反応に添加した。混合物を室温に10分間保った。OD540値を島津UV−1200分光光度計上で測定した。D−キシルロース濃度対OD540値の標準曲線に基づいて、対応するD−キシルロース濃度を判定した。標準曲線は、様々な量のD−キシルロースを含有するがD−キシロースおよびタンパク質は含有しない、システイン−カルバゾールアッセイを実行して開発された。最終的に、1単位のキシロースイソメラーゼ酵素は、反応中で1マイクロモルのD−キシルロースを生じるのに必要な活性として定義された。比活性度は、タンパク質1ミリグラムあたりの単位として計算した。アッセイでは、タンパク質なしのブランク反応中で、D−キシロースのバックグラウンドOD540を測定した。活性計算に先だって、このバックグラウンドを最初のOD540読み取りから差し引いた。各アッセイを3回繰り返した。システイン−カルバゾールアッセイの結果は図5にグラフ表示され、ZW641、ZW641−ara355−1、ZW641−ara356−2、およびZW641−ara357−2のタンパク質抽出物中のキシロースイソメラーゼの比活性が示される。各活性バーは3つの平行反応の平均に相当し、標準偏差はそれらに基づいて計算される。この結果はZW641中のxylAの第2のコピーの発現が、追加的なキシロースイソメラーゼ活性を細胞に導入することを実証する。ZW641−ara355中のAMxylA、ZW641−ara356中のLBxylA、およびZW641−ara357中のECxylAは、XI活性をそれぞれおよそ20倍、3倍、および4倍に増大させた。これらの3つのxylA遺伝子は同一アプローチによってZW641中で構築されたので、細胞抽出物中のキシロースイソメラーゼ比活性の差違は、A.ミズーリエンシス(A.missouriensis) からのキシロースイソメラーゼが、L.ブレビス(L.brevis)および大腸菌(E.coli)からのキシロースイソメラーゼよりもはるかに良好に機能することを提案する。事実上、A.ミズーリエンシス(A.missouriensis)XIは約2.3の比活性を提示し、これはL.ブレビス(L.brevis)XIの6倍、大腸菌(E.coli)XIの5倍である。したがって、細胞成長、キシロース代謝、およびXI活性を調べることで、本実施例は、キシロース利用Z.モビリス(Z.mobilis)株中のキシロース利用を改善する優れたキシロースイソメラーゼとして、A.ミズーリエンシス(A.missouriensis)XIを同定した。
実施例4
キシロースイソメラーゼ酵素の構造的解析
キシロースイソメラーゼ(XI)活性を有することが知られているシード配列セットを最初に同定することで、潜在的キシロースイソメラーゼである、利用できるタンパク質配列のコレクションを作成した。シード配列は、高信頼度機能注解を有するタンパク質配列を含有する、SWISSPROTデータベースからのキシロースイソメラーゼとして取得した。SWISSPROT(Swiss Institute of Bioinformatics)から取得された180個のXIシード配列、配列番号2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、142、および148〜306があった。次に、BLASTのblastallラッパー中の1群の複数クエリー配列として、これらのシード配列を使用してNCBI(National Center for Biotechnology Information, Bethesda,MD)非重複性(nr)包括的タンパク質データベースを検索した。合計444配列が、XI活性タンパク質の配列空間として記載し得るセットを形成すると同定された。
配列同一性に基づくクラスター形成、および(PHYLIP(Phylogeny Inference Package)バージョン3.5cに実装されるような(Felsenstein(1989) Cladistics 5:164−166)PHYLIP近隣結合アルゴリズムを使用した分子系統学的解析は、上で作成されたXI活性のための配列空間が、図2に示されるようなI群およびII群と称される2群に分離されることを示した。I群セットは、82個の配列(2〜130の偶数および131〜147の配列番号)からなり、その内21個がシードであった(配列番号2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、および142)。同様に、I群セットは351個のメンバーからなり、その内159個がシードであった(配列番号148〜306)。図2に示されるように、L.ブレビス(L.brevis)および大腸菌(E.coli)XIタンパク質がII群に属するのに対し、A.ミズーリエンシス(A.missouriensis)XIタンパク質はI群に属する。
系統学的グループの形成に際しては、以下のプロセスに従った。
444個のXI配列から出発する:
ステップ1 70%同一性群を確立する:
444個の配列からの最長配列を第1のマスターと称した。第1のマスターと70%以上の配列同一性を有する444個の配列のその他の配列をグループ分けして、第1のref70クラスター(A)を形成した。残りの配列から、最長配列を第2のマスターに指定して使用し、同様に第2のref70クラスターを作り出した(B)。全ての配列がクラスターに入るまで、分類過程を継続した。クラスターのいくつかは、単集合であった。
ステップ2 70%閾値でのマージ:
クラスターAとBの全ての対で、Aの配列の3分の1が70%以上の配列同一性でBの配列に関連している場合、そして逆の場合も、クラスターAとBをマージさせた。70%の一致度の閾値を使用してマージし得る対がなくなるまで、この過程を継続した。
ステップ3 50%閾値でのマージ:
ステップ2と同一過程に従ったが、50%の配列一致度の閾値を使用した。
ステップ4 30%閾値でのマージ:
ステップ2と同一過程に従ったが、30%の配列一致度の閾値を使用した。
I群は、50%の一致度の閾値クラスターに相当する。II群は、別個の50%の一致度の閾値クラスターに相当する。
50%の同一性の閾値で、どちらの群ともクラスターしなかったため、I群またはII群に明白に割り当てられなかった11個の配列があった。
図3は、特定の属が標識されたI群XIの系統樹を示す。I群は、アルスロバクター(Arthrobacter)、ストレプトミセス(Streptomyces)、サーマス(Thermus)、サーモバキュラム(Thermobaculum)、ヘルペトシフォン(Herpetosiphon)、アシドバクテリア(Acidobacteria)、ロゼイフレクサス(Roseiflexus)、メイオサーマス(Meiothermus)、デイノコッカス(Deinococcus)、メイオサーマス(Meiothermus)、スタッケブランドチア(Stackebrandtia)、クリベラ(Kribbella)、キシラニモナス(Xylanimonas)、ノカルジオプシス(Nocardiopsis)、カテヌリスポラ(Catenulispora)、ストレプトスポランギウム(Streptosporangium)、ゲオデルマトフィルス(Geodermatophilus)、アクチノシネマ(Actinosynnema)、サッカロモノスポラ(Saccharomonospora)、アシドサーマス(Acidothermus)、サーモビフィダ(Thermobifida)、ノカルジオイデス(Nocardioides)、ジャニバクター(Janibacter)、マイコバクテリウム(Mycobacterium)、レイフソニア(Leifsonia)、クラビバクター(Clavibacter)、ミクロモノスポラ(Micromonospora)、サリニスポラ(Salinispora)、セルロモナス(Cellulomonas)、ジョネシア(Jonesia)、ナカムレラ(Nakamurella)、アクチノミセス(Actinomyces)、モビルンカス(Mobiluncus)、ブラキバクテリウム(Brachybacterium)、ボイテンベルギア(Beutenbergia)、フランキア(Frankia)、およびアクチノバクテリウム(Actinobacterium)からのXIタンパク質を含む。
I群とII群を区別する:
方法1
GroupSim分析(Capra and Singh(2008)Bioinformatics 24:1473−1480)によって、I群メンバーとII群メンバーの区別を実施した。GroupSim法は、タンパク質の機能的特異性を決定するアミノ酸残基を同定する。その配列が複数群に分けられる、タンパク質ファミリーの複数配列アラインメント(MSA)において、配列の官能基を区別するアミノ酸残基を同定し得る。方法は、複数配列アラインメント(MSA)を採用し、公知の特異性分類を入力して、MSA中の各アミノ酸位置にスコアを割り当てる。より高いスコアは、アミノ酸位置が特異性決定位置(SDP)であるより大きな可能性を示唆する。
上の系統学的解析によってI群とII群に分けられたXI配列のMSA上で実施されたGroupSim分析は、高度に判別的な位置を同定した。表6に列挙されるのは、0.9以上のスコアを有する位置(Pos)であり、1.0の完全スコアは、群内の全てのタンパク質が指定位置で列挙されるアミノ酸を有し、群間ではアミノ酸が常に異なることを示す。「残基」の列は、I群タンパク質とII群タンパク質中の位置(縦線|で区切られる)で対比させて、一文字コードでアミノ酸を示す。2列目のアミノ酸位置番号は、アクチノプラネス・ミズーリエンシス(Actinoplanes missouriensis)からのXIである代表的I群タンパク質P12581のものである。3列目のアミノ酸位置番号は、XIサーモアナエロバクテリウム・サーモスルフリゲネス(Thermoanaerobacterium thermosulfurigenes)(配列番号267)である代表的II群タンパク質P19148のものである。
I群とII群を区別する:
方法2
酵素のキシロースイソメラーゼファミリー群の代案の構造/機能特性解析は、HMMER(Janelia Farm Research Campus,Ashburn,VA)から入手できる利用者用ガイドに従って、HMMERソフトウェアパッケージを使用して実施された(プロファイルHMMの背後にある理論は、R.Durbin,S.Eddy,A.Krogh,and G.Mitchison,Biological sequence analysis:probabilistic models of proteins and nucleic acids,Cambridge University Press,1998;Krogh et al.,1994;J.Mol.Biol.235:1501−1531に記載される)。
I群中の21個のシード配列(配列番号2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、および142)の多配列アラインメントを使用して、I群メンバーを表すためのプロファイル隠れマルコフモデル(HMM)を作成した。利用者用ガイドに述べられるように、プロファイルHMMは多配列アラインメントの統計学的モデルである。それらは、配列比較の各カラムがどの程度保存されているか、そして各位置でどのアミノ酸残基が現れる見込みが高いかに関する、位置特異的情報を捕捉する。したがってHMMは、形式的確率論的基準を有する。PFAMデータベース(Janelia Farm Research Campus,Ashburn,VA)において、多数のタンパク質ファミリーのためのプロファイルHMMが公的に入手可能である。
プロファイルHMMは以下のように構築された:
ステップ1.配列アラインメントを構築する
Clustal Wをデフォルトパラメータで使用して、I群中の21個のシード配列(高信頼度注釈がある配列)を配列比較した。
ステップ2.プロファイルHMMを構築する
整合配列セット上で、デフォルトパラメータを使用してhmmbuildプログラムを実行した。hmmbuildは複数配列アラインメントファイルを読み取って、新しいプロファイルHMMを構築し、プロファイルHMMをファイルに保存する。このプログラムを使用して、上述のシード配列セットのために、多重アラインメントから未較正プロファイルを作成した。
HMMERソフトウェアの利用者用ガイドに基づく以下の情報は、hmmbuildプログラムがプロファイルHMMを作成する方法のいくらかの説明を与える。プロファイルHMMは、例えば挿入および欠失を含むギャップありアラインメントをモデル化でき、それはソフトウェアが(単なる小さなギャップなしモチーフでなく)完全保存ドメインを記述できるようにする。挿入および欠失は、挿入(I)状態および欠失(D)状態を使用してモデル化される。ギャップ文字が特定割合xを上回る全てのカラムは、挿入カラムとして割り当てられる。デフォルトで、xは0.5に設定される。各一致状態は、それに関連付けられているIおよびD状態を有する。HMMERでは、配列比較中の同一コンセンサス位置にある1群の3つの状態(M/D/I)を「ノード」と称する。これらの状態は、状態遷移確率と称される矢印で相互連結される。MおよびI状態がエミッターであるのに対し、D状態はサイレントである。遷移は、各ノードで、M状態が使用され(そして残基が整列されスコアされる)、またはD状態が使用される(そして整列される残基はなく、欠失ギャップ文字「−」がもたらされる)ように、アレンジされる。挿入はノード間で起きて、I状態は自己遷移を有して、コンセンサスカラムの間で、1つまたは複数の挿入残基が発生できるようにする。
一致状態(すなわち一致状態エミッションスコア)にある、または挿入状態(すなわち挿入状態エミッションスコア)にある残基のスコアは、Log_2(p_x)/(null_x)に比例する。p_xは、プロファイルHMMに準じた、配列比較における特定位置のアミノ酸残基の確率であり、Null_xはNullモデルに準じた確率である。Nullモデルは、SWISSPROTリリース24のアミノ酸分布から誘導された、20個の各アミノ酸の事前に計算されたエミッション確率セットを有する単純な1状態確率モデルである。
状態遷移スコアは対数オッズパラメータとしても計算され、Log_2(t_x)に比例する。_xは、エミッターまたは非エミッター状態に遷移する確率である。
ステップ3.プロファイルHMMを較正する
プロファイル(使用される合成配列のデフォルト数は5,000である)を有する多数の合成ランダム配列をスコアするhmmcalibrateを使用して、プロファイルHMMを読み取り、これらのスコアに対するヒストグラムに極値分布(EVD)を適合させ、この時点でEVDパラメータを含むHMMファイルを再度保存する。タンパク質配列データベースに対してプロファイルを検索する際に、これらのEVDパラメータ(μおよびλ)を使用して、ビットスコアのE値が計算される。hmmcalibrateは、HMMファイル中の「EVD」と標識された行に、2つのパラメータを書き出す。これらのパラメータは、SWISS−PROTとほぼ同じ長さおよび残基組成の無作為に生成された配列に対して計算されたスコアのヒストグラムに最も適合する、極値分布(EVD)のμ(位置)およびλ(尺度)パラメータである。この較正を各プロファイルHMMに対して1回行った。
I群セットの較正プロファイルHMMは、I群プロファイルHMMエクセルチャートとして、添付の表1に提供される。プロファイルHMMは、アミノ酸配列の各位置に現れる各アミノ酸の確率を与える、チャート内に提供される。最高確率は、各位置で強調表示される。表7は、I群プロファイルHMMの数行を示す。
各位置の1行目は、一致エミッションスコア、すなわち各アミノ酸がその状態にある確率を報告する(最高スコアが強調表示される)。2行目は挿入エミッションスコアを報告し、3行目は状態遷移スコア、すなわちM→M、M→I、M→D;I→M、I→I;D→M、D→D;B→M;M→Eを報告する。表7はI群プロファイルHMM中で、メチオニンが最高確率で第1の位置に存在する、4620の確率を有することを示す。
ステップ4.構築したプロファイルHMMの特異性および感度を試験する
Zパラメータを10億に設定したhmmsearchを使用して、II群からI群メンバーを識別する能力について、I群プロファイルHMMを評価した。hmmsearchプログラムは、I群プロファイルHMMのためのhmmファイル、および双方の群からの全配列を取って、各配列にE値スコアを割り当てる。このE値スコアはプロファイルHMMの適合の尺度であり、スコアが低いほどより良く適合する。得られたスコア割り当て一覧は、添付中で表2として提供される。最悪得点のI群メンバー(2.2e−181)と最良得点のII群メンバー(1.5e−07)の間に、E値の差違の大きなマージンがあったので、プロファイルHMMはII群メンバーからI群メンバーを明らかに区別する。
この分析は、I群XIタンパク質のために作成されたプロファイルHMMが、I群XIタンパク質をII群から区別することを示す。I群プロファイルHMMは、A.ミズーリエンシス(A.missouriensis)XIと機能的に類似した、XIタンパク質に関連する構造を提供する。
実施例5
1群XIのキメラPgapS−xylA遺伝子の構築および二重交叉自殺ベクターのアセンブリー
ゲオデルマトフィルス・オブスクルス(Geodermatophilus obscurus)DSM43160(GOxylA;配列番号64)、マイコバクテリウム・スメグマチス(Mycobacterium smegmatis)str.MC2155(MSxylA;配列番号10)、サリニスポラ・アレニコーラ(Salinispora arenicola)CNS−205(SAxylA;配列番号18)、およびキシラニモナス・セルシリティカ(Xylanimonas cellulosilytica)DSM15894(XCxylA;配列番号40)からのキシロースイソメラーゼは全て、実施例4に記載されるアミノ酸配列分析に基づいて、1群キシロースイソメラーゼに属する。これらのタンパク質をコードする配列(それぞれ配列番号335、336、337、および338)は、GenScript Corporation(Piscataway,NJ)によって、Z.モビリス(Z.mobilis)ZM4のコドンバイアスに従って、Z.モビリス(Z.mobilis)中での発現のためにそれぞれ最適化され、SpeIおよびXhoI部位と境を接するDNA断片として新規に合成されて、コーディング領域は変異Z.モビリス(Z.mobilis)グリセルアルデヒド−3−リン酸デヒドロゲナーゼ遺伝子プロモーター(PgapS;配列番号339)に隣接する。PgapSは、米国特許出願公開第2009−0246876号明細書で開示されるように、プロモーターからの発現を増大させる、天然プロモーター断片(Pgap)の位置116における「G」から「T」への変化の突然変異がある、改善されたPgapである。SpeI−PgapS−xylA−XhoI断片は、GenScript Corporation(Piscataway,NJ)によってEcoRV部位でpUC57にクローンされた。得られた中間体プラスミドは、pUC57−PgapSGOxylA、pUC57−PgapSMSxylA、pUC57−PgapSSAxylA、およびpUC57−PgapSXCxylAと称された。最適化xylAコード配列は、GOxylA(配列番号335)、MSxylA(配列番号336)、SAxylA(配列番号337)、およびXCxylA(配列番号338)である。
一般的分子クローニング法を使用して、DCO自殺ベクターを構築した。最初に、次のようにして、プラスミドpARA356(実施例1に記載される)を改変してLBxylAとaraD3’UTR配列の間にXhoI部位を付加した。最初に、順方向プライマーara368(配列番号345)および逆方向プライマーara97(配列番号319)を使用して、pARA356からaraD3’UTR断片をPCR増幅した。ara368プライマーはaraD3’UTRの5’末端にSpeIおよびXhoI部位を付加し、ara97はaraD3’UTRの3’末端にHindIII、FseI、およびEcoRI部位を付加した。PCR産物をSpeIおよびEcoRIで消化した。pARA356中のPgap−LBxylA−araD3’UTR断片は、5’SpeI部位および3’EcoRI部位を有する。この断片をSpeIおよびEcoRIで消化にして除去し、上記のSpeI−XhoI−araD3’UTR−HindIII−FseI−HindIII−EcoRI PCR産物によって置き換えた。得られた中間体プラスミドpARA356Dは、Pgap−LBxylAがXhoI部位によって置き換えられていること以外は、pARA356と同じ配列を有する。
上述の4つのPgapS−xylA断片は、SpeIおよびXhoI消化に続いてpUC57ベースのプラスミドから単離され、SpeIとXhoI部位の間でXhoI−改変pARA356Dにクローンされて、Pgap−LBxylA断片を置き換えた。得られた4つのDCO自殺ベクターは、pARA356−GOxylA、pARA356−MSxylA、pARA356−SAxylA、およびpARA356−XCxylAであった。これらのベクターは、それらのキメラxylA遺伝子がPgapSから発現されたこと以外は、pARA356と同一である。
対照として、pARA355中のAMxylAおよびpARA357中のECxylAをそれぞれI群およびII群xylAsの代表として使用した。しかし、4つの新しい1群xylA遺伝子を発現させるのにPgapSを用いたので、pARA355中のAMxylAおよびpARA357中のECxylAを制御するPgapプロモーターをPgapSに変更した。この目的で、順方向プライマーara10(配列番号340)および逆方向プライマーara401(配列番号341)を使用して、PCRによってpARA356−XCxylAから319bpのPgapSOLE−PCR断片を合成し;順方向プライマーara402(配列番号342)および逆方向プライマーara403(配列番号343)を使用して、PCRによってpARA355から1,229bpのPgapS−AMxylA OLE−PCR断片を合成し;順方向プライマーara402および逆方向プライマーara404(配列番号344)を使用して、PCRによってpARA357から1,367bpのPgapS−ECxylA OLE−PCR断片を合成した。1つのPCR反応は、50μLのAccuPrime Pfx SuperMix(Invitrogen,Carlsbad,CA)、1μLの40ng/μL DNAテンプレート、および1μLの10μM順方向および逆方向プライマーからなった。反応は、エッペンドルフMastercycler(Hemburg,Germany)上で、35サイクルの94℃で1分間の変性/56℃で1分間のアニーリング/72℃で2分間の伸長のホットスタートPCRプログラムに従って実施された。PgapSOLE−PCR断片は、PgapS全体、5’SpeI部位、および3’開始コドンを含んだ。PgapS−AMxylAおよびPgapS−ECxylA OLE−PCR断片は、それぞれAMxylAおよびECxylAコード配列を含有した。それぞれPgapSの最後の36ntと一致する36ntの5’配列と、3’XhoI部位とを有した。さらに、重複PCR(OLE−PCR)によって、SpeI−PgapS−AMxylA−XhoIおよびSpeI−PgapS−ECxylA−XhoI断片を合成した。PCR反応を上述したように設定したが、2つのテンプレートが含まれた。SpeI−PgapS−AMxylA−XhoIが、順方向プライマーara10および逆方向プライマーara403を使用して、PgapSおよびPgapS−AMxylA OLE−PCR断片から増幅されたのに対し、SpeI−PgapS−ECxylA−XhoIは、順方向プライマーara10および逆方向プライマーara404を使用して、PgapSおよびPgapS−ECxylA OLE−PCR断片から増幅された。SpeI−PgapS−AMxylA−XhoIおよびSpeI−PgapS−ECxylA−XhoIの双方をSpeIおよびXhoIで消化して、アガロースゲル電気泳動を実施してQIAquickゲル精製キット(Qiagen)を使用して精製した。DNA断片をSpeIとXhoI部位の間で改変pARA356(上述)にクローンして、Pgap−LBxylA断片を置き換えた。得られた2つのDCO自殺ベクターは、pARA356−AMxylAおよびpARA356−ECxylAと称された。全てのベクターをDH5α大腸菌(E.coli)細胞中で増殖させ、QIAprep Spin Miniprepキットを使用して調製した。
実施例6
ZW641へのキメラPgapS−xylA遺伝子の組み込みおよびそれらの発現の特性解析
本実施例は、実施例2に記載されるZW641株中のPgapS−xylAキメラ遺伝子の組み込みおよび発現について記載し、4つの試験されたI群XIが、Z.モビリス(Z.mobilis)中でII群XIよりも実際により良く機能することを実証する。
pARA356−AMxylA、pARA356−ECxylA、pARA356−GOxylA、pARA356−MSxylA、pARA356−SAxylA、またはpARA356−XCxylAを用いて、ZW641−1A株のコンピテント細胞を別々に作成して形質転換した。先に記載されているようにして(実施例2参照)、形質転換体をMMG5−Spec250プレート上で選択し、導入PgapS−xylA遺伝子の組み込みについてPCRによって分析した。得られた株をZW641−ara356−AMxylA、ZW641−ara356−ECxylA、ZW641−ara356−GOxylA、ZW641−ara356−MSxylA、ZW641−ara356−ASxylA、およびZW641−ara356−XCxylA株と命名した。実施例3によって、AMxylA 1群キシロースイソメラーゼがZ.モビリス(Z.mobilis)中で高度に活性であることが実証された一方、2つの試験されたII群キシロースイソメラーゼの中でECxylAがより良い酵素であったので、これらの株の内、ZW641−ara356−AMxylAおよびZW641−ara356−ECxylAを対照株にした。
キシロース中のこれらの6つの新しい株の成長を調べて、それらを親株ZW641−1Aと比較するために、全ての株をキシロース中で96時間振盪フラスコ発酵させた。アッセイでは、各株を3mLのMRM3G5中で150rpmで振盪しながら30℃で一晩培養した。細胞を収集して、MRM3X10(MRM3G5と同一であるが、50g/Lグルコースを100g/Lキシロースで置き換えた)で洗浄し、約0.1のOD600でMRM3X10に再懸濁した。25mLの懸濁液を50mLねじ蓋付きVWR遠心管に入れて、150rpmで振盪しながら30℃で96時間にわたって培養した。時間経過中、0、24、48、72、および96時間目にOD600を測定した。得られた成長曲線を図6に示す。実施例3で分析されたZW1−ara355およびZW1−ara357株と同様に、ZW641−ara356−AMxylAは、発酵終了時にZW641−ara356−ECxylAのおよそ3倍の細胞密度に成長することが示される。ZW641−ara356−AMxylAが3.43のOD600を有したのに対し、ZW641−ara356−ECxylAは1.18に達した。どちらの株もZW641より早く成長した。他の4つの株は、全てZW641−ara356−ECxylAよりも早く成長した。発酵終了時におけるそれらの細胞密度は、ZW641−ara356−AMxylAとZW641−ara356−ECxylAの間であった。
各株の代謝プロファイルを測定するために、各培養物の1mLサンプルを72時間目に収集した。それらを10,000xgで遠心分離して、細胞を除去した。0.22μmのCostar Spin−X遠心管フィルターを通して上清を濾過し、Agilent 1100 HPLCシステム上で、0.01NのH2SO4と共に、55℃速度0.6mL/分でBioRad Aminex HPX−A7Hイオン排除カラムを通過させて分析し、エタノールおよびキシロース濃度を判定した。表8に示される結果は、より早い成長が、より高いキシロース利用とより多くのエタノール産生に相関することを示す。これらの結果は、成長の差違がXI活性の差違に起因することを示唆する。全ての株が、ZW641対照よりもより良い成長、エタノール産生、およびキシロース利用を有し、1群XIがある全ての株は、II群大腸菌(E.coli)XIがある株よりもより良く機能した。
これらの6つの株が、それらの成長および代謝プロファイルに対応するXI活性レベルをそれぞれ有することをさらに立証するために、タンパク質抽出物を作成し、実施例3と同様に、タンパク質濃度およびキシロースイソメラーゼ活性についてアッセイした。活性の計算に先だって、D−キシロースのバックグラウンドOD540を最初のOD540読み取りから差し引いて、比活性度をタンパク質1ミリグラムあたりの単位として計算した。各アッセイを3回繰り返した。図7は、各タンパク質抽出物中の得られた平均XI比活性を示す。絶対比活性は実施例3よりも低く、これは異なる反応条件に起因する可能性が高い。しかし相対比活性の比較は、XI活性が、株の増殖率に対応することを明らかに示す。より早い成長は、より高いXI活性によって支援され、AMxylAは最高活性を有し、ECsylAは最低活性を有する。I群XIは全てII群ECxylAよりも高い平均活性を有する。