TW202330903A

TW202330903A - 用於重組蛋白產生之定製菌株

Info

Publication number: TW202330903A
Application number: TW111139536A
Authority: TW
Inventors: 凱文史密斯
Original assignee: 美商現代公司
Priority date: 2021-10-18
Filing date: 2022-10-18
Publication date: 2023-08-01
Also published as: WO2023069900A9; WO2023069900A1

Abstract

本文描述經基因修飾之微生物，其具有降低之使重組蛋白表現之蛋白酶活性，且無黏液表型。亦描述其製造及使用方法。

Description

用於重組蛋白產生之定製菌株

大腸埃希氏桿菌 (Escherichia coli) ( 大腸桿菌)在生物技術及藥物開發方面有著悠久的歷史，且多年來一直用作產生質體DNA之宿主。此係歸因於多種原因，其中包括大腸桿菌之基因簡單性( 例如，約4,400個較少數目之基因)、生長速率、安全性、成功作為外來DNA之宿主以及易於護理。 大腸桿菌使用之悠久歷史亦使其成為研究得很透徹之生物體，其已以多種方式進行操縱。例如，出於不同目的，包括選殖、質體DNA產生及蛋白質表現，已構築若干種不同菌株。 大腸桿菌K12衍生物(諸如DH5α、JM108、DH10β及其他)最常用於質體DNA選殖及產生，因為其具有選殖目的所需之特定基因組突變。此等主要引起編碼核酸酶、重組酶及降低菌株之DNA穩定性、純度及選殖效率之其他酶的基因失活。

由於其作為質體選殖及產生之宿主細菌之歷史， 大腸桿菌亦常用於重組蛋白之表現。然而， 大腸桿菌基因組編碼諸如OmpT及Lon之多種蛋白酶，該等蛋白酶可使細菌表現之蛋白質，尤其是突變或外來蛋白質裂解。此等蛋白酶之存在減少可自給定 大腸桿菌細胞中成功純化之重組蛋白之量。此外， 大腸桿菌之一些蛋白酶缺陷型變異體展現黏液表型，此會干擾細菌之基因操縱、發酵過程中細胞之混合及有氧環境之維持以及細菌細胞與培養基之分離。

本文描述用於增強質體DNA產生、重組蛋白表現及提高蛋白質產量之經工程改造之細菌菌株及載體。諸如OmpT及Lon之細菌蛋白酶可使蛋白質，尤其是突變及外來蛋白質裂解，此限制在細菌細胞中表現之重組蛋白之產量。許多常用於重組蛋白表現之細菌菌株，諸如 大腸埃希氏桿菌BL21細胞，經修飾而缺失 ompT基因，且諸如BL21之 大腸桿菌B菌株被認為由於lon基因之啟動子中的一或多個突變而天然缺乏 lon蛋白酶活性。然而，細菌染色體中完全缺失 lon基因可進一步提高蛋白質產量，但會導致細菌菌株出現黏液表型，此表明 lon基因仍在 大腸桿菌B菌株中表現。此黏液表型歸因於在缺乏Lon蛋白酶活性之情況下過量多醣之積累，干擾細菌之高效粒化及重組蛋白之後續純化。此黏液表型在缺乏 manA之菌株中不存在， manA催化GDP-甘露糖合成之第一步，因此為產生含有甘露糖之多醣所必需的。因此，相對於未經修飾之細菌菌株，缺少 ompT、 lon及細胞外多醣合成所需之一或多種基因( 例如 manA)的細菌菌株產生更大量之重組蛋白。

因此，本揭示案之一些態樣係關於一種經基因修飾之微生物，其包含 ompT基因及 lon基因已發生突變、失能或缺失之基因組。在一些實施例中，微生物不表現一或多種選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之蛋白質的功能形式。在一些實施例中，基因組包含選自由 pgi、 manA、 manB、 manC、 gmd、 fcl及 kduI組成之群之基因中的突變。在一些實施例中，基因組包含與選自由 pgi、 manA、 manB、 manC、 gmd、 fcl及 kduI組成之群之基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之碳水化合物代謝蛋白的核酸序列。

在一些實施例中，微生物不表現功能性ManA。在一些實施例中，基因組包含 manA基因或與該 manA基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼ManA之核酸序列。

在一些實施例中，基因組包含i)與SEQ ID NO: 23具有至少90%序列一致性之第一核酸序列，及ii)與SEQ ID NO: 25具有至少90%序列一致性之第二核酸序列。在一些實施例中，基因組進一步包含與SEQ ID NO: 24具有至少90%序列一致性之第三核酸序列。在一些實施例中，微生物未展現黏液表型。在一些實施例中，經基因修飾之微生物不能合成甘露糖。在一些實施例中，經基因修飾之微生物不能合成岩藻糖。

在一些實施例中，基因組不包含編碼 endA之核酸序列，基因組不包含編碼 recA之核酸序列，且EcoK1限制系統已失活。在一些實施例中，微生物之基因型為 ΔendA ΔrecA Δ( mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon。在一些實施例中，微生物為 大腸桿菌。在一些實施例中，微生物來源於 大腸桿菌MG1655。

在一些實施例中，經基因修飾之微生物包含編碼重組蛋白之核酸序列。在一些實施例中，編碼重組蛋白之核酸序列位於微生物之基因組中。在一些實施例中，編碼重組蛋白之核酸序列位於質體上。在一些實施例中，重組蛋白為RNA聚合酶。在一些實施例中，RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。

在一些實施例中，RNA聚合酶包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代；及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中，胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，在位置47處之胺基酸取代為G47A。在一些實施例中，相對於野生型RNA聚合酶，胺基酸修飾包含額外C端胺基酸。在一些實施例中，額外C端胺基酸為甘胺酸。在一些實施例中，RNA聚合酶包含胺基酸序列SEQ NO: 41。在一些實施例中，RNA聚合酶變異體包含相對於野生型RNA聚合酶，在位置350處之胺基酸取代，及/或在位置351處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，在位置350處之胺基酸取代為E350W。在一些實施例中，在位置351處之胺基酸取代為D351V。在一些實施例中，在位置350處之胺基酸取代為E350W，且在位置351處之胺基酸取代為D351V。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。

在一些態樣中，本揭示案係關於一種用於產生多肽或蛋白質之方法，其包括以下步驟：i)將包含編碼多肽或蛋白質之序列的核酸分子引入至本文所述之經基因修飾之微生物中的一者中；ii)在適於表現該多肽或蛋白質之條件下培養該經基因修飾之生物體；及iii)分離該多肽或蛋白質。

在一些態樣中，本揭示案係關於一種用於產生多肽或蛋白質之方法，其包括以下步驟：i)在適於表現該多肽或蛋白質之條件下培養本文所述之經基因修飾之微生物中的一者；及ii)分離該多肽或蛋白質。

在本文所述之方法的一些實施例中，多肽或蛋白質為RNA聚合酶。在一些實施例中，RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。在一些實施例中，RNA聚合酶包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代；及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中，胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，在位置47處之胺基酸取代為G47A。在一些實施例中，相對於野生型RNA聚合酶，胺基酸修飾包含額外C端胺基酸。在一些實施例中，額外C端胺基酸為甘胺酸。在一些實施例中，RNA聚合酶包含胺基酸序列SEQ NO: 42。在一些實施例中，RNA聚合酶變異體包含相對於野生型RNA聚合酶，在位置350處之胺基酸取代，及/或在位置351處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，在位置350處之胺基酸取代為E350W。在一些實施例中，在位置351處之胺基酸取代為D351V。在一些實施例中，在位置350處之胺基酸取代為E350W，且在位置351處之胺基酸取代為D351V。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。

相關申請案

本申請案根據35 U.S.C. § 119(e)主張2021年10月18日提出申請之美國臨時申請案第63/256,690號及2022年1月28日提出申請之美國臨時申請案第63/304,195號較早提出申請日期的權益，該等美國臨時申請案之內容以引用之方式整體併入本文中。經基因修飾之微生物

本揭示案之一些態樣係關於經基因修飾之微生物，其包含 ompT基因及 lon基因已發生突變、失能或缺失之基因組。如本文所用，微生物之基因組係指微生物之一或多個染色體，其為細胞存活及複製所需之長DNA分子。

ompT基因編碼蛋白質OmpT，該蛋白質為一種在 大腸埃希氏菌外膜中常見之天冬胺醯蛋白酶。當 大腸桿菌細胞溶解時，外膜中之OmpT會裂解在細胞質中穩定之蛋白質，諸如T7 RNA聚合酶，從而減少可自表現該蛋白質之 大腸桿菌細胞中分離之完整蛋白質之量( 參見例如Grodberg 等人 J Bacteriol.1988. 170(3):1245-1253)。因此，基因組中缺失ompT基因增加可自微生物細胞中純化之蛋白質之量。 ompT基因之DNA序列之一個實例由登錄號M23630.1給出且再現為SEQ ID NO: 27。OmpT蛋白之胺基酸序列之一個實例由登錄號P09169給出且再現為SEQ ID NO: 28。

lon基因編碼蛋白質Lon，該蛋白質為一種參與未折疊蛋白質(包括突變及異常蛋白質)之降解的ATP依賴性絲胺酸蛋白酶。因此，Lon在微生物細胞中之存在減少可自表現蛋白質之細胞中分離之蛋白質之量。 lon基因之DNA序列之一個實例由登錄號M38347.1給出且再現為SEQ ID NO: 29。Lon蛋白之胺基酸序列之一個實例由登錄號P0A9M0給出且再現為SEQ ID NO: 30。若基因或核酸序列相對於野生型序列包含一或多個修飾，諸如插入、缺失或取代，則稱其發生突變。插入為一種如下修飾，其中經修飾之核酸序列與野生型核酸序列之不同之處在於向野生型序列添加一或多個核苷酸。缺失係一種如下修飾，其中經修飾之核酸序列與野生型序列之不同之處在於移除一或多個核苷酸。取代係一種如下修飾，其中經修飾之核酸序列與野生型序列之不同之處在於序列位置上之一個核苷酸變為不同核苷酸。若基因或核酸序列編碼之蛋白質相對於野生型基因或核酸序列編碼之蛋白質具有降低之功能，則稱該基因或核酸序列失能。若包含基因或核酸序列之基因組經修飾使得在修飾後基因組不包含該基因或核酸序列，則稱該基因或核酸序列在基因組中缺失。與基因或核酸序列可操作地連接之啟動子之突變或缺失通常會降低基因之表現，但若基因或核酸序列存在於基因組中，則替代啟動子或RNA聚合酶之非特異性轉錄可能引起基因或核酸序列之轉錄，且因此產生編碼之蛋白質。基因組中缺失該基因或核酸序列可防止此類轉錄機制，且防止具有已缺失該基因或核酸序列之基因組之細胞產生蛋白質。

在本文所述之經基因修飾之微生物的一些實施例中，微生物不表現功能性ManA。ManA或甘露糖-6-磷酸異構酶係由 manA基因編碼之酶，其催化D-果糖-6-磷酸轉化為D-哌喃甘露糖6-磷酸或D-甘露糖-6-磷酸。此反應為合成GDP-甘露糖所需途徑之第一步。Lee 等人, Microb Cell Fact.2012. 11:48 ( 參見例如圖1)提供 大腸桿菌中此合成途徑之一個實例。因此，消除ManA功能可抑制甘露糖之合成，且因而抑制含有甘露糖之莢膜多醣之合成，莢膜多醣可在細菌中引起黏液表型。 manA基因之DNA序列之一個實例由登錄號M15380.1給出且再現為SEQ ID NO: 31。ManA蛋白之胺基酸序列之一個實例由登錄號P00946給出且再現為SEQ ID NO: 32。細胞中缺乏功能性ManA可阻止細胞產生GDP-甘露糖。功能性ManA係指能夠催化D-果糖-6-磷酸轉化為D-哌喃甘露糖6-磷酸或D-甘露糖-6-磷酸之ManA形式。若細胞表現不催化D-果糖-6-磷酸轉化為D-哌喃甘露糖6-磷酸或D-甘露糖-6-磷酸之ManA形式，或者若其不表現任何ManA蛋白，則稱細胞缺乏功能性ManA之表現或不表現功能性ManA。

在一些實施例中，基因組包含 manA基因或與該 manA基因可操作地連接之啟動子中的突變。如本文所用，突變係指對核酸序列之一種修飾，其中一或多個核苷酸經不同核苷酸取代(取代)，或者添加一或多個核苷酸(插入)或自序列中移除一或多個核苷酸(缺失)。編碼蛋白質之核酸序列中之突變可改變編碼之蛋白質之胺基酸序列。例如，將終止密碼子引入至編碼序列中之突變(無意義突變)引起蛋白質之截短形式之轉譯。引入或移除除三之倍數以外之多個核苷酸(例如1個、2個、4個或5個核苷酸)的突變可導致自插入或缺失點開始之核酸序列編碼不同胺基酸(框移突變)。將編碼第一個胺基酸之密碼子變為編碼不同胺基酸之密碼子的突變引起在對應於發生取代之密碼子之位置處具有不同胺基酸之蛋白質之轉譯(誤義突變)。啟動子中之突變可阻止RNA聚合酶與啟動子相互作用且啟動轉錄，且因此抑制與啟動子可操作地連接之核酸序列的表現。啟動子為控制與其可操作地連接之基因或核酸序列之表現的核酸序列。若啟動子控制基因表現之程度，則稱啟動子與基因可操作地連接。啟動子可為組成型啟動子，其引起可操作地連接之基因以一致之水準表現。啟動子可為條件型啟動子，其基於環境條件調節可操作地連接之基因之表現，該等條件諸如刺激物如小分子、蛋白質或核酸之存在、不存在或數量。在一些實施例中，基因組不包含編碼ManA之核酸序列。

在本文所述之經基因修飾之微生物的一些實施例中，微生物不表現功能性G6PI。G6PI或葡萄糖6-磷酸異構酶係由 pgi基因編碼之酶，其催化葡萄糖6-磷酸可逆異構化成果糖6-磷酸，此為GDP-甘露糖合成所需的。因此，消除G6PI功能可抑制甘露糖之合成，且因而抑制含有甘露糖之莢膜多醣之合成，莢膜多醣可在細菌中引起黏液表型。 pgi基因之DNA序列之一個實例由登錄號X15196給出且再現為SEQ ID NO: 49。G6PI蛋白之胺基酸序列之一個實例由登錄號P0A6T1給出且再現為SEQ ID NO: 50。細胞中缺乏功能性G6PI可阻止細胞將葡萄糖-6-磷酸異構化為果糖-6-磷酸。功能性G6PI係指能夠催化葡萄糖-6-磷酸異構化為果糖-6-磷酸之G6PI形式。若細胞表現不催化葡萄糖-6-磷酸異構化為果糖-6-磷酸之G6PI形式，或者其不表現任何G6PI蛋白，則稱該細胞缺乏功能性G6PI之表現或不表現功能性G6PI。在一些實施例中，基因組包含 pgi基因或與該 pgi基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼G6PI之核酸序列。

在本文所述之經基因修飾之微生物的一些實施例中，微生物不表現功能性ManB。ManB或磷酸甘露糖變位酶係由 manB基因編碼之酶，其催化D-甘露糖6-磷酸轉化為α-D-甘露糖1-磷酸，此為GDP-甘露糖合成所需的。因此，消除ManB功能可抑制甘露糖之合成，且因而抑制含有甘露糖之莢膜多醣之合成，莢膜多醣可在細菌中引起黏液表型。ManB在此項技術中亦稱為CpsG，其由 cpsG基因編碼。 manB基因之DNA序列之一個實例由登錄號AAC77847給出且再現為SEQ ID NO: 51。ManB蛋白之胺基酸序列之一個實例由登錄號P24175給出且再現為SEQ ID NO: 52。細胞中缺乏功能性ManB可阻止細胞產生α-D-甘露糖1-磷酸。功能性ManB係指能夠催化D-甘露糖6-磷酸轉化為α-D-甘露糖1-磷酸之ManB形式。若細胞表現不催化D-甘露糖-6-磷酸轉化為α-D-甘露糖1-磷酸之ManB形式，或者其不表現任何ManB蛋白，則稱該細胞缺乏功能性ManB之表現或不表現功能性ManB。在一些實施例中，基因組包含 manB基因或與該 manB基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼ManB之核酸序列。

在本文所述之經基因修飾之微生物的一些實施例中，微生物不表現功能性ManC。ManC或甘露糖-1-磷酸鳥苷酸轉移酶係由 manC基因編碼之酶，其催化α-D-甘露糖1-磷酸轉化為GDP-α-D-甘露糖，此為GDP-甘露糖合成所需的。因此，消除ManC功能可抑制甘露糖之合成，且因而抑制含有甘露糖之莢膜多醣之合成，莢膜多醣可在細菌中引起黏液表型。ManC在此項技術中亦稱為CpsB，其由 cpsB基因編碼。 manC基因之DNA序列之一個實例由登錄號AAC77846給出且再現為SEQ ID NO: 53。ManC蛋白之胺基酸序列之一個實例由登錄號P24174給出且再現為SEQ ID NO: 54。細胞中缺乏功能性ManC可阻止細胞產生GDP-α-D-甘露糖。功能性ManC係指能夠催化α-D-甘露糖1-磷酸轉化為GDP-α-D-甘露糖之ManC形式。若細胞表現不催化α-D-甘露糖1-磷酸轉化為GDP-α-D-甘露糖之ManC形式，或者其不表現任何ManC蛋白，則稱該細胞缺乏功能性ManC之表現或不表現功能性ManC。在一些實施例中，基因組包含 manC基因或與該 manC基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼ManC之核酸序列。

在本文所述之經基因修飾之微生物的一些實施例中，微生物不表現功能性Gmd。Gmd或GDP-甘露糖4,6-脫水酶係由 gmd基因編碼之酶，其催化GDP-α-D-甘露糖轉化為GDP-4-脫氫-6-去氧-D-甘露糖，此為GDP-L-岩藻糖合成所需的。因此，消除Gmd功能可抑制岩藻糖之合成，且因而抑制含有岩藻糖之莢膜多醣之合成，莢膜多醣可在細菌中引起黏液表型。 gmd基因之DNA序列之一個實例由登錄號AAC77842給出且再現為SEQ ID NO: 55。Gmd蛋白之胺基酸序列之一個實例由登錄號P0AC88給出且再現為SEQ ID NO: 56。細胞中缺乏功能性Gmd可阻止細胞產生GDP-4-脫氫-6-去氧-D-甘露糖。功能性Gmd係指能夠催化GDP-α-D-甘露糖轉化為GDP-4-脫氫-6-去氧-D-甘露糖之Gmd形式。若細胞表現不催化GDP-α-D-甘露糖轉化為GDP-4-脫氫-6-去氧-D-甘露糖之Gmd形式，或者若其不表現任何Gmd蛋白，則稱該細胞缺乏功能性Gmd之表現或不表現功能性Gmd。在一些實施例中，基因組包含 gmd基因或與該 gmd基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼Gmd之核酸序列。

在本文所述之經基因修飾之微生物的一些實施例中，微生物不表現功能性Fcl。Fcl或GDP-L-岩藻糖合酶係由 fcl基因編碼之酶，其催化GDP-4-脫氫-6-去氧-D-甘露糖轉化為GDP-岩藻糖，此為GDP-L-岩藻糖合成所需的。因此，消除Fcl功能可抑制岩藻糖之合成，且因而抑制含有岩藻糖之莢膜多醣之合成，莢膜多醣可在細菌中引起黏液表型。Fcl在此項技術中亦稱為WcaG，其由 wcaG基因編碼。 fcl基因之DNA序列之一個實例由登錄號AAC77843給出且再現為SEQ ID NO: 57。Fcl蛋白之胺基酸序列之一個實例由登錄號P32055給出且再現為SEQ ID NO: 58。細胞中缺乏功能性Fcl可阻止細胞產生GDP-岩藻糖。功能性Fcl係指能夠催化GDP-4-脫氫-6-去氧-D-甘露糖轉化為GDP-岩藻糖之Fcl形式。若細胞表現不催化GDP-4-脫氫-6-去氧-D-甘露糖轉化為GDP-岩藻糖之Fcl形式，或者若其不表現任何Fcl蛋白，則稱該細胞缺乏功能性Fcl之表現或不表現功能性Fcl。在一些實施例中，基因組包含 fcl基因或與該 fcl基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼Fcl之核酸序列。

在本文所述之經基因修飾之微生物的一些實施例中，微生物不表現功能性KduI。KduI或4-去氧-L-蘇-5-己酮糖-糖醛酸酮醇-異構酶係由 kduI基因編碼之酶，其催化5-脫氫-4-去氧-D-葡萄糖醛酸異構化為3-去氧-D-甘油-2,5-己二酮糖酸，此為細胞外多醣合成中所涉及之己糖醛酸代謝之第一步，該等多醣可引起細菌黏液表型。 kduI基因之DNA序列之一個實例由登錄號AAC75882給出且再現為SEQ ID NO: 59。KduI蛋白之胺基酸序列之一個實例由登錄號Q46938給出且再現為SEQ ID NO: 60。細胞中缺乏功能性KduI可阻止細胞產生3-去氧-D-甘油-2,5-己二酮糖酸。功能性KduI係指能夠催化5-脫氫-4-去氧-D-葡萄糖醛酸異構化為3-去氧-D-甘油-2,5-己二酮糖酸之KduI形式。若細胞表現不催化5-脫氫-4-去氧-D-葡萄糖醛酸異構化為3-去氧-D-甘油-2,5-己二酮糖酸之KduI形式，或者若其不表現任何KduI蛋白，則稱該細胞缺乏功能性KduI之表現或不表現功能性KduI。在一些實施例中，基因組包含 kduI基因或與該 kduI基因可操作地連接之啟動子中的突變。在一些實施例中，基因組不包含編碼KduI之核酸序列。

在一些實施例中，基因組包含與SEQ ID NO: 23具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或高達100%序列一致性之第一核酸序列及與SEQ ID NO: 25具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或高達100%序列一致性之第二核酸序列。在一些實施例中，基因組包含與SEQ ID NO: 24具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或高達100%序列一致性之第三核酸序列。

在本文所述之經基因修飾之微生物的一些實施例中，微生物未展現黏液表型。如本文所用，黏液表型係指以糖諸如多醣之過量產生為特徵之表型。具有黏液表型之微生物細胞比具有非黏液表型之細胞更容易相互黏附，且具有黏液表型之微生物在其中生長之液體具有與黏液相似之稠度( 參見例如Hamelin 等人 J Bacteriol.1975. 122(1):19-24)。液體培養基之此黏液樣稠度及存在於微生物細胞上之細胞外多醣可干擾發酵過程中之細菌混合，降低溶解氧含量，及微生物藉由離心之粒化。因此，與具有黏液表型之微生物相比，不具有黏液表型之微生物更容易自液體培養基中分離出來。 大腸埃希氏菌

在本文所述之經基因修飾之微生物的一些實施例中，微生物為 大腸埃希氏菌( 大腸桿菌)。在一些實施例中，微生物來源於 大腸桿菌MG1655。 大腸桿菌多年來一直用作產生質體DNA之宿主。出於許多不同目的，包括選殖、質體DNA產生及蛋白質表現，構築若干種不同菌株。所用之 大腸桿菌K12衍生物(諸如DH5α、JM108、DH10β及其他)最常用於質體DNA選殖及產生，因為其具有選殖目的所需之特定基因組突變。此等主要引起編碼核酸酶、重組酶及降低菌株之DNA穩定性、純度及選殖效率之其他酶的基因失活。

此外， 大腸桿菌以及其他生物體具有限制或調節可能需要大量存在之其他產物( 例如，核苷酸)表現之調節途徑。因此，雖然控制此等途徑之基因為活性的，但很難提高 大腸桿菌產生所需產物之效率。

在一些實施例中，基因組不包含編碼 endA之核酸序列，基因組不包含編碼recA之核酸序列，且EcoK1限制系統已失活。 endA基因編碼核酸內切酶-1蛋白，該蛋白質在表現時誘導雙鏈斷裂活性。此活性將退化且以其他方式損害由具有該基因之大腸桿菌產生之質體DNA。 recA基因編碼RecA蛋白，其為修復及維持DNA之關鍵蛋白。然而，RecA經由其促進DNA修復之特性，在DNA之同源重組以及介導同源配對、同源重組、DNA斷裂修復及SOS反應中起核心作用，其中DNA損傷觸發細胞週期停滯，啟動DNA修復及誘變。EndA及RecA之特性均不利於產生一致及相同之DNA質體。

原生 大腸桿菌具有EcoKI限制系統。EcoKI係一種限制修飾酶複合物，負責鑑別及限制未甲基化之外來DNA，以及藉由甲基化修飾原生半甲基化DNA以進行自我鑑別。若任其發展，EcoKI系統會將未甲基化DNA識別為外來物，且若該DNA亦具有獨特EcoKI識別位點，則將其降解。雖然使來自大腸桿菌之EcoKI系統失活並非選殖質體DNA必需的，但若所需質體DNA具有EcoKI識別位點，則缺失會顯著提高選殖及轉型效率。

在一些實施例中，微生物之基因型為 ΔendA ΔrecA Δ( mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon。 mrr編碼Mrr，Mrr係一種在特定識別位點使甲基化DNA裂解之限制性核酸內切酶。 hsdRMS操縱子編碼HsdR、HsdM及HsdS，該等蛋白質為在特定識別位點使未甲基化之DNA裂解之EcoK1限制系統之三種蛋白質組分。 symE編碼SymE，SymE係一種核糖核酸內切酶。 mcrBC編碼McrBC，McrBC係一種限制性核酸內切酶，其在特定識別位點使甲基化DNA裂解。編碼重組蛋白之載體

在一些實施例中，本文所述之經基因修飾之微生物包含編碼重組蛋白之核酸序列。如本文所用，「重組蛋白」係指由已選殖至表現載體(諸如質體)中且藉由自載體轉錄mRNA及轉譯所得到之mRNA而自該載體表現的核酸序列編碼之蛋白質。

在一些實施例中，編碼重組蛋白之核酸序列位於微生物之基因組中。若生物體之基因組包含核酸序列，則稱核酸位於基因組中。在一些實施例中，編碼重組蛋白之核酸序列位於質體上。質體係指與微生物之染色體分開之環狀DNA分子。

在一些實施例中，由核酸序列編碼之重組蛋白為RNA聚合酶。RNA聚合酶係結合於模板多核苷酸且合成包含與模板多核苷酸中之序列互補之RNA序列的RNA多核苷酸或轉錄本之蛋白質。在一些實施例中，RNA聚合酶為DNA依賴性RNA聚合酶，其自DNA模板多核苷酸合成RNA轉錄本。在一些實施例中，RNA聚合酶為RNA依賴性RNA聚合酶，其自RNA模板多核苷酸合成RNA轉錄本。RNA聚合酶包括但不限於噬菌體RNA聚合酶，例如T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、K11 RNA聚合酶及/或突變聚合酶，諸如但不限於能夠併入經修飾之核酸之聚合酶。作為一個非限制性實例，RNA聚合酶可經修飾以展現與未修飾之RNA聚合酶相比併入2'-修飾之三磷酸核苷酸之能力增加。

在一些實施例中，RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。編碼T7 RNA聚合酶之DNA序列之一實例由登錄號M38308.1給出且再現為SEQ ID NO: 33。T7 RNA聚合酶之胺基酸序列之一個實例由登錄號P00573給出且再現為SEQ ID NO: 34。編碼T3 RNA聚合酶之DNA序列之一實例由登錄號X02981.1給出且再現為SEQ ID NO: 35。T3 RNA聚合酶之胺基酸序列之一個實例由登錄號P07659給出且再現為SEQ ID NO: 36。編碼SP6 RNA聚合酶之DNA序列之一實例由登錄號Y00105.1給出且再現為SEQ ID NO: 37。SP6 RNA聚合酶之胺基酸序列之一個實例由登錄號P06221給出且再現為SEQ ID NO: 38。編碼K11 RNA聚合酶之DNA序列之一實例由登錄號X53238.1給出且再現為SEQ ID NO: 39。K11 RNA聚合酶之胺基酸序列之一個實例由登錄號P18147給出且再現為SEQ ID NO: 40。

在一些實施例中，RNA聚合酶為RNA聚合酶變異體。相對於野生型(WT) RNA聚合酶，RNA聚合酶變異體包括至少一個胺基酸取代。例如，參考具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶，位置47處之甘胺酸被視為「野生型胺基酸」，而位置47處之甘胺酸取代為丙胺酸被視為具有高螺旋傾向性之「胺基酸取代」。在一些實施例中，RNA聚合酶變異體為相對於WT RNA聚合酶( 例如，具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶)包含至少一個(一或多個)胺基酸取代之T7 RNA聚合酶變異體。

在一些實施例中，RNA聚合酶變異體包含包括(至少一個)胺基酸修飾之RNA聚合酶，該胺基酸修飾引起RNA聚合酶變異體之環結構隨著RNA聚合酶變異體自起始複合物轉變為延伸複合物而發生構形變化，變成螺旋結構。在一些實施例中，RNA聚合酶變異體包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代；及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中，胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，胺基酸取代為高傾向性胺基酸取代。高螺旋傾向性胺基酸之實例包括丙胺酸、異白胺酸、白胺酸、精胺酸、甲硫胺酸、離胺酸、麩醯胺酸及/或麩胺酸鹽。在一些實施例中，在位置47處之胺基酸取代為G47A。在一些實施例中，RNA聚合酶變異體包含相對於野生型RNA聚合酶，包括額外C端胺基酸之RNA聚合酶。在一些實施例中，額外C端胺基酸係選自甘胺酸、丙胺酸、蘇胺酸、脯胺酸、麩醯胺酸、絲胺酸。在一些實施例中，額外C端胺基酸( 例如，相對於包含SEQ ID NO: 34之胺基酸序列之野生型RNA聚合酶，在位置884處)為甘胺酸。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 41之胺基酸序列。在一些實施例中，RNA聚合酶變異體包含相對於野生型RNA聚合酶，在位置350處之胺基酸取代，及/或在位置351處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，在位置350處之胺基酸取代為E350W。在一些實施例中，在位置351處之胺基酸取代為D351V。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。重組蛋白產生方法

本揭示案之一些態樣係關於一種用於產生多肽或蛋白質之方法，其包括以下步驟：i)將包含編碼多肽或蛋白質之序列的核酸分子引入至本文所述之經基因修飾之微生物中的一者中；ii)在適於表現該多肽或蛋白質之條件下培養該經基因修飾之生物體；及iii)分離該多肽或蛋白質。

將載體引入至微生物中係指在引起載體併入微生物細胞中之條件下使微生物與載體或供體生物體接觸。可藉由轉型引入載體，轉型係細胞自環境中獲取細胞外DNA之過程。轉型可經由電穿孔或電透化(electropermeabilization)來完成，在該過程中，包含細胞外DNA及微生物細胞之組合物受到電脈衝，瞬時打開細胞壁及細胞膜中之孔，使DNA進入細胞之細胞質。轉型亦可藉由使包含細胞外DNA及勝任型微生物細胞之組合物經受熱休克來完成，其中組合物被快速加熱及冷卻，此導致細胞外DNA進入勝任型細胞之細胞質中。若細胞能夠自環境中獲取細胞外DNA，則稱該細胞為勝任型。細胞可為天然勝任型的，或能夠獲取細胞外DNA，或經誘導成為勝任型，例如藉由與一或多種促進DNA獲取過程之化合物一起培育進行。舉例而言，化學勝任型細胞為用鹽、二甲亞砜(DMSO)及/或聚乙二醇(PEG)處理之細胞。諸如RbCl、MgCl ₂及/或CaCl ₂之鹽中和細胞膜磷脂、DNA之磷酸骨架之負電荷，使DNA與細胞表面締合而非被排斥。DMSO削弱細胞膜之脂質雙層，降低其厚度且增加其滲透性。因此，藉由用鹽、DMSO及/或PEG處理而變成化學勝任型的細胞比未經修飾之細胞更有可能獲取細胞外DNA。

可藉由結合來引入載體，結合係供體生物體將載體引入至受體生物體例如微生物之細胞中的過程。在結合中，包含纖毛或毛髮樣附屬物之供體生物體細胞與受體生物細胞接觸，且纖毛形成連接兩個細胞內部之隧道。接著載體之一條DNA鏈經由纖毛轉移至受體細胞中。在此轉移之後，各含載體之單鏈形式之兩個細胞合成互補鏈，使各細胞均帶有載體之雙鏈形式。

可藉由轉導引入載體，轉導係藉由病毒或病毒載體將DNA引入至細胞中之過程。諸如噬菌體之病毒對微生物的感染將病毒DNA引入至微生物細胞之細胞質中。若噬菌體含有載體或質體之DNA序列，則微生物在感染後將含有載體質體，在細胞分裂期間維持及複製質體( 參見例如Ammann 等人 J Bacteriol.2008.190(8):3083-3087)。

培養微生物係指在允許微生物生長及複製之環境中培育微生物。允許微生物生長及複製之環境視微生物而定。環境可為含有微生物用於生長及複製之營養物的液體或固體培養基。可用於培養微生物之培養基的非限制性實例包括溶菌肉湯、盧貝氏(Luria-Bertani，LB)肉湯或瓊脂培養基、胰蛋白腖大豆(TS)肉湯或瓊脂培養基以及托休氏肉湯(Todd-Hewitt broth)或瓊脂培養基。

適合表現多肽或蛋白質之條件視微生物、載體及/或編碼多肽或蛋白質之核酸序列以及多肽或蛋白質本身而定。如前一段所述，培養微生物之環境必須支持其生長及複製，且可為此項技術已知之液體或固體培養基之一。

若編碼多肽或蛋白質之核酸序列存在於諸如質體之載體上，則該載體必須維持在微生物細胞中以表現多肽或蛋白質。將載體維持在微生物中之方法為此項技術所熟知。若載體編碼使細胞對抗生素作用產生抗性之蛋白質，則在微生物中維持載體之一種方法包括在抗生素存在之情況下培養微生物，該抗生素殺死不含該載體之細胞或抑制其生長，但允許含有該載體之細胞生長及複製。

若核酸序列可操作地連接於條件型啟動子，則多肽或蛋白質之表現需要在條件型啟動子具有活性之條件下培養微生物。舉例而言，只有當細胞中存在乳糖時，許多細菌中之 lac操縱子才具有活性。 lac阻遏蛋白複合物與 lac操縱子(位於 lac啟動子與由 lac操縱子編碼之基因之間的核酸序列)結合，且阻止 lac操縱子中編碼之基因轉錄。異乳糖(乳糖之一種異構體)與 lac阻遏子結合，誘導構形變化，導致操縱子釋放 lac阻遏子，從而允許所編碼基因之轉錄。若 lac操縱子存在於編碼待表現之基因或多肽之核酸序列的上游，則多肽或蛋白質將僅在異乳糖或類似化合物(諸如異丙基-β-D-硫代哌喃半乳糖苷(IPTG))存在之情況下表現，且可藉由調節培養環境中IPTG之量來控制表現( 參見例如Donovan 等人 J Ind Microbiol.1996.16(3):145-54)。

分離多肽或蛋白質之方法為此項技術所熟知( 參見例如Wingfield. Curr Protoc Protein Sci.2016.80:6.1.1-6.1.35)。通常，表現蛋白質之細菌藉由離心粒化以自液體培養基中分離細菌細胞。接著，諸如藉由機械法壓機或藉由溶菌酶處理來酶促溶解細菌細胞。將細菌溶解產物離心以粒化細胞組分。若重組蛋白存在於細菌細胞之細胞質或周質中，則自溶解產物上清液中純化蛋白質。若重組蛋白存在於包涵體中，則用Triton、EDTA及/或尿素處理溶解產物球粒以提取細胞壁組分，且其餘包涵體溶解。接著可自溶解之包涵體中純化變性蛋白質，且若需要，再折疊成所需構形。

本揭示案之一些態樣係關於一種用於產生多肽或蛋白質之方法，其包括以下步驟：i)在適於表現該多肽或蛋白質之條件下培養本文所述之經基因修飾之微生物中的一者；及ii)分離該多肽或蛋白質。

在本文所述之方法的一些實施例中，多肽或蛋白質為RNA聚合酶。在一些實施例中，RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。在一些實施例中，RNA聚合酶為RNA聚合酶變異體。相對於野生型(WT) RNA聚合酶，RNA聚合酶變異體包括至少一個胺基酸取代。例如，參考具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶，位置47處之甘胺酸被視為「野生型胺基酸」，而位置47處之甘胺酸取代為丙胺酸被視為具有高螺旋傾向性之「胺基酸取代」。在一些實施例中，RNA聚合酶變異體為相對於WT RNA聚合酶( 例如，具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶)包含至少一個(一或多個)胺基酸取代之T7 RNA聚合酶變異體。

在一些實施例中，RNA聚合酶變異體包含包括(至少一個)胺基酸修飾之RNA聚合酶，該胺基酸修飾引起RNA聚合酶變異體之環結構隨著RNA聚合酶變異體自起始複合物轉變為延伸複合物而發生構形變化，變成螺旋結構。在一些實施例中，RNA聚合酶變異體包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代；及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中，胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，胺基酸取代為高傾向性胺基酸取代。高螺旋傾向性胺基酸之實例包括丙胺酸、異白胺酸、白胺酸、精胺酸、甲硫胺酸、離胺酸、麩醯胺酸及/或麩胺酸鹽。在一些實施例中，在位置47處之胺基酸取代為G47A。

在一些實施例中，RNA聚合酶變異體包含相對於野生型RNA聚合酶，包括額外C端胺基酸之RNA聚合酶。在一些實施例中，額外C端胺基酸係選自甘胺酸、丙胺酸、蘇胺酸、脯胺酸、麩醯胺酸、絲胺酸。在一些實施例中，額外C端胺基酸( 例如，相對於包含SEQ ID NO: 34之胺基酸序列之野生型RNA聚合酶，在位置884處)為甘胺酸。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 41之胺基酸序列。在一些實施例中，RNA聚合酶變異體包含相對於野生型RNA聚合酶，在位置350處之胺基酸取代，及/或在位置351處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中，在位置350處之胺基酸取代為E350W。在一些實施例中，在位置351處之胺基酸取代為D351V。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中，RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。核酸

「核酸」係至少兩個共價連接在一起之核苷酸，且在一些情況下，可含有磷酸二酯鍵( 例如，磷酸二酯「骨架」)。如本文所用，術語「核酸序列」及「多核苷酸」可互換使用且不暗示任何長度限制。如本文所用，術語「核酸」及「核苷酸」可互換使用。術語「核酸序列」及「多核苷酸」涵蓋DNA (包括cDNA)及RNA序列。本文所述之核酸序列包括已自其天然存在之環境中移出之核酸序列、重組或經選殖之DNA分離物以及化學合成之類似物或由異源系統生物合成之類似物。

「經工程改造之核酸」係自然界中不存在之核酸。然而，應理解，雖然經工程改造之核酸整體並非天然存在的，但其可包括自然界中存在之核苷酸序列。在一些實施例中，經工程改造之核酸包含來自不同生物體( 例如，來自不同物種)之核苷酸序列。舉例而言，在一些實施例中，經工程改造之核酸包括細菌核苷酸序列、人類核苷酸序列及/或病毒核苷酸序列。經工程改造之核酸包括重組核酸及合成核酸。「重組核酸」係藉由接合核酸( 例如，經分離之核酸、合成核酸或其組合)而構築之分子且在一些實施例中，可在活細胞中複製。「合成核酸」係經擴增或化學合成或藉由其他方式合成之分子。合成核酸包括經化學修飾或以其他方式進行修飾、但可與天然存在之核酸分子進行鹼基配對的彼等核酸。重組及合成核酸亦包括由前述任一者複製產生之彼等分子。核酸可包含天然存在之核苷酸及/或非天然存在之核苷酸，諸如經修飾之核苷酸。

可使用標準分子生物學方法產生經工程改造之核酸。在一些實施例中，經工程改造之核酸係使用GIBSON ASSEMBLY®選殖產生( 參見例如Gibson, D.G. 等人Nature Methods, 343-345, 2009；及Gibson, D.G. 等人Nature Methods, 901-903, 2010)。GIBSON ASSEMBLY®通常在單管反應中使用三種酶活性：5 '核酸外切酶、DNA聚合酶之3 '延伸活性及DNA連接酶活性。5 '核酸外切酶活性回嚼(chew back)5 '末端序列且暴露互補序列以進行退火。接著聚合酶活性填充退火區域之間隙。接著DNA連接酶密封切口且將DNA片段共價連接在一起。相鄰片段之重疊序列比Golden Gate Assembly中使用之序列長得多，因此使得正確組裝之百分比更高。

本文所述之核酸載體亦可存在或移除一或多個終止子序列。終止子序列係發出表現卡匣或轉錄區末端信號之核酸序列。為有效轉錄，載體通常包括一或多個終止子序列。終止子序列包括例如T7及T4終止子序列。

本文所述之較佳載體亦可具有抗性標記物，或特定載體特有之標記物。舉例而言，載體最初可具有胺苄青黴素(ampicillin)抗性標記物。在本文所述之一些實施例中，胺苄青黴素標記物替換成不同標記物，諸如康黴素(kanamycin)抗性標記物。在一些實施例中，本文揭示之 大腸桿菌基因組可進一步表現基於第一環境因素之陽性選擇標記物或基於第二環境因素之陰性選擇標記物的基因，其中第一環境因素與第二環境因素不相同。在一些實施例中，本文揭示之 大腸桿菌基因組可進一步表現基於第一環境因素之陽性選擇標記物及基於第二環境因素之陰性選擇標記物的基因，其中第一環境因素與第二環境因素不相同。在一些實施例中，陽性選擇標記物為能夠賦予康黴素抗性之基因。在一些實施例中，陰性選擇標記物為能夠表現聚果糖蔗糖酶之基因。

本文揭示之載體亦可移除任何病原體來源序列。移除病原體來源序列可對產品產量產生積極影響。

複製起點(ori)包括在本文描述之核酸中且可如本文揭示進行修飾。在一些實施例中，核酸可含有若干個ori，例如2個ori。舉例而言，其可為低複本ori與溫度依賴性ori之組合，或者例如允許在各種宿主生物體中繁殖之ori。

核酸亦可含有來自其他已知載體之一或多種元件。舉例而言，其他載體包括噬菌體、黏接質體、質體、F型黏接質體(fosmid)、細菌人工染色體、酵母人工染色體、病毒及逆轉錄病毒(例如牛痘、腺病毒、腺相關病毒、慢病毒、單純疱疹病毒、愛普斯坦-巴爾病毒(Epstein-Barr virus)、禽痘病毒、偽狂犬病、桿狀病毒)及源自其之載體。在其他實施例中，本文描述之核酸不包括來自任一或多種其他載體之任何元件。

當應用於核酸序列時，術語「經分離」在本文所用之背景下表示多核苷酸序列已自其天然遺傳環境中移出且因此不含其他外來或不想要之編碼序列(但可包括天然存在之5′及3′未轉譯區，諸如啟動子及終止子)，且呈適合在經基因工程改造之蛋白質產生系統內使用之形式。此類經分離之分子係與其天然環境分離之彼等分子。

存在許多已建立之演算法可用於比對兩個核酸序列。通常，一個序列充當參考序列，可將測試序列與其進行比較。序列比較演算法基於指定之程式參數計算測試序列相對於參考序列之序列一致性百分比。用於比較之核酸序列比對可例如藉由電腦執行之演算法( 例如GAP、BESTFIT、FASTA或TFASTA)或BLAST及BLAST 2.0演算法進行。

在序列一致性比較中，一致性可存在於長度為至少10個核酸殘基( 例如長度為至少15個、20個、30個、40個、50個、75個、100個、150個、200個、250個、300個、350個、400個、450個、500個、550個、600個、650個或685個核苷酸，例如長達參考序列全長)之序列區域上。

基本上同源或基本上一致之核酸具有一或多個核苷酸取代、缺失或添加。在許多實施例中，彼等變化並不太重要，例如，僅涉及可產生在轉譯過程中編碼之相同胺基酸或產生不同但保守之胺基酸取代的保守核酸取代。保守胺基酸取代係藉由將一個胺基酸替換成以下組內之另一胺基酸而產生的胺基酸取代：鹼性：精胺酸、離胺酸、組胺酸；酸性：麩胺酸、天冬胺酸；極性：麩醯胺酸、天冬醯胺；疏水性：白胺酸、異白胺酸、纈胺酸；芳族：苯丙胺酸、色胺酸、酪胺酸；小：甘胺酸、丙胺酸、絲胺酸、蘇胺酸、甲硫胺酸。基本上同源之核酸亦涵蓋包含不顯著影響轉譯產物之折疊或活性之其他取代的彼等核酸。

本文所述之核酸載體可為空載體，或可包括插入物，該插入物可為表現卡匣或開放閱讀框架(ORF)。「開放閱讀框架」係以起始密碼子( 例如甲硫胺酸(ATG))開始且以終止密碼子( 例如TAA、TAG或TGA)結束之連續DNA區段且編碼蛋白質或肽。表現卡匣編碼至少包括以下元件之RNA：5′未轉譯區、編碼mRNA之開放閱讀框架區、3′未轉譯區及多聚A尾。開放閱讀框架可編碼任何mRNA序列。

「5′未轉譯區(UTR)」係指mRNA中直接位於起始密碼子( 亦即，由核糖體轉譯之mRNA轉錄本之第一個密碼子)上游( 亦即，5′)的區域，該區域不編碼蛋白質或肽。

「3′未轉譯區(UTR)」係指mRNA中直接位於終止密碼子( 亦即，mRNA轉錄本中發送轉譯終止信號之密碼子)下游( 亦即，3′)之區域，該區域不編碼蛋白質或肽。

「多聚A尾」係mRNA中在3′ UTR下游，例如直接下游( 亦即，3′)之區域，其含有多個連續之單磷酸腺苷。多聚A尾可含有10至300個單磷酸腺苷。例如，多聚A尾可含有10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、110個、120個、130個、140個、150個、160個、170個、180個、190個、200個、210個、220個、230個、240個、250個、260個、270個、280個、290個或300個單磷酸腺苷。在一些實施例中，多聚A尾含有50至250個單磷酸腺苷。在相關生物學背景中( 例如，在細胞中、在活體內等)，多聚(A)尾用於保護mRNA免於酶促降解( 例如在細胞質中)，且有助於轉錄終止、mRNA自細胞核中輸出以及轉譯。

熟習此項技術者理解不同物種展現「優先密碼子使用」。如本文所用，術語「優先密碼子使用」係指在特定物種之細胞中最常使用之密碼子，因此有利於編碼各胺基酸之可能密碼子之一個或幾個代表。例如，胺基酸蘇胺酸(Thr)可能由ACA、ACC、ACG或ACT編碼，但在哺乳動物宿主細胞中，ACC為最常用之密碼子；在其他物種中，不同Thr密碼子可能優先。可藉由此項技術已知之多種方法將特定宿主細胞物種之優先密碼子引入至本文所述之多核苷酸中。或者可使用非較佳密碼子。在一些實施例中，核酸序列經密碼子最佳化。密碼子最佳化之方法為此項技術已知的。

所關注多核苷酸之「片段」包含來自該全長多核苷酸序列之一連串連續核苷酸。舉例而言，所關注多核苷酸之「片段」可包含(或由以下組成)來自多核苷酸序列之至少30個連續核苷酸( 例如該多核苷酸之至少35個、50個、75個、100個、150個、200個、250個、300個、350個、400個、450個、500個、550個、600個、650個、700個、750個、800個、850個、900個、950個或1000個連續核酸殘基)。

「核酸載體」係攜帶至少一個外源或異源核酸片段之多核苷酸。核酸載體可如「分子載體」般發揮作用，將核酸、分別多核苷酸之片段遞送至宿主細胞中或作為IVT之模板。如本文所用，「活體外轉錄模板」(IVT模板)係指適合用於IVT反應以產生信使RNA (mRNA)之去氧核糖核酸(DNA)。在一些實施例中，IVT模板編碼5′未轉譯區，含有開放閱讀框架，且編碼3′未轉譯區及多聚A尾。IVT模板之特定核苷酸序列組成及長度將視由該模板編碼之所關注mRNA而定。

在一些實施例中，本文所述之核酸載體為環狀核酸，諸如質體。在其他實施例中，其為線性化核酸。根據一個實施例，核酸載體包含預定限制位點，其可用於載體線性化。線性化限制位點之明智置放係重要的，因為該限制位點決定載體核酸打開/線性化之位置。針對線性化而選擇之限制酶較佳應不在載體之關鍵組分內切割。

術語5′及3′在本文中用於描述與遺傳元件之位置及/或事件之方向(5′至3′)相關之核酸序列特徵，諸如在5′至3′方向上進行之RNA聚合酶之轉錄或核糖體之轉譯。同義詞為上游(5′)及下游(3′)。按慣例，DNA序列、基因圖譜、載體卡及RNA序列自左至右以5′至3′繪製，或用箭頭指示5′至3′方向，其中箭頭指向3′方向。因此，當遵循此慣例時，5′ (上游)指示朝向左手側定位之遺傳元件，且3′ (下游)指示朝向右手側定位之遺傳元件。實例實例1：在Lon、OmpT及ManA缺乏之經基因修飾之大腸桿菌菌株中T7 RNA聚合酶變異體1及T7 RNA聚合酶變異體2之產生。引言

本實例中描述之工作的目標係產生用於表現重組蛋白之大腸桿菌菌株。 lon與 ompTORF均自菌株2中完全移除，菌株2係一種接受及維持質體DNA之菌株，且由於自基因組中移除EcoKI限制系統 endA及 recA，因此可自宿主中純化。已成功產生一種用於進行質體攜帶之酶表現之穩健菌株，該菌株具有顯著降低之蛋白酶活性，且因此能夠產生高純度之重組酶。方法表1：本實例中使用之菌株.

菌株名稱	菌株基因型	質體
菌株1	ΔendA ΔrecA	無
菌株9	ΔendA ΔrecA	pStrain 21
菌株5	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC)::kan-sacB	pStrain 21
菌株2	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC)	無
菌株10	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT	無
菌株11	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT Δlon	無
菌株12	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT Δlon	pStrain 2
菌株13	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA::kan-sacB	pStrain 21
菌株14	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA	pStrain 21
菌株15	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon::kan-sacB	無
菌株16	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon::kan-sacB	pStrain 21
菌株17	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon	無
菌株18	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon	pStrain 2
菌株19	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon	pStrain 23
菌株20	ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon	pStrain 23

表2：本實例中使用之質體.

質體名稱	質體基因型
pStrain 21	\|＜repA101\|ori101_ts\|＜recA\|＜bla\|＜tetR\|＜P(tetR)\|P(tet)＞\|γ＞\|β＞\|exo＞\|60a＞\|
pStrain 22	\|R6K＞\|Ori_R6Kγ\|ompT UHR \| ompT DHR \| kanR＞\| SacB＞ \|
pStrain 2	\|pUC＞\|term_rpoC\|term_bla\|P(T5)＞\| T7 RNA聚合酶變異體1＞ \|P(amp)＞\|kan＞\|P(lacI)＞\|lacI\|
pStrain 23	\|pUC＞\|term_rpoC\|term_bla\|P(T5)＞\| T7 RNA聚合酶變異體2＞ \|P(amp)＞\|kan＞\|P(lacI)＞\|lacI\|
pStrain 24	\|pUC＞\|term_rpoC\|term_bla\|P(T5)＞\| T7 RNA聚合酶變異體3＞ \|P(amp)＞\|kan＞\|P(lacI)＞\|lacI\|

表3：本實例中使用之引子.

引子	序列 (5′ - 3′)	注釋
KS786	/5Phos/AAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTGTGTAGGCTGGAGCTGCTTC (SEQ ID NO: 1)	ompT之KO卡匣
KS787	TTCCCCGGGGCGATTTTCACCTCGGGGAAATTTTAGTTGGCGTTCTTAATTCTCATGTTTGACAG (SEQ ID NO: 2)	ompT之KO卡匣
KS651	AACGGATAAGACGGGCATAAATGAGG (SEQ ID NO: 3)	ΔompT::kan-sacB之彈出卡匣
KS652	GTTTAATAAAAAAAAGATTAAGGGATGAAGGAAC (SEQ ID NO: 4)	ΔompT::kan-sacB之彈出卡匣
KS1727	/5Phos/GCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCGTGTAGGCTGGAGCTGCTTCGG (SEQ ID NO: 5)	manA之KO卡匣
KS1728	CCTTTAATAAGCTTAGCAAGAGATGTTAATTTTTTCAGTAAGCTCTTAATTCTCATGTTTGACAGGGTACCCAT (SEQ ID NO: 6)	manA之KO卡匣
KS1729	/5Phos/GATGTCGGAGTTACGCAGGAATTG (SEQ ID NO: 7)	ΔmanA::kan-sacB之彈出卡匣
KS1730	TATCAAACAGTGGTTTGCTTACTTCGTTATTAAC (SEQ ID NO: 8)	ΔmanA::kan-sacB之彈出卡匣
KS1132	/5Phos/CCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTGTGTAGGCTGGAGCTGCTTCGG (SEQ ID NO: 9)	lon之KO卡匣
KS1133	GCCTGCCAGCCCTGTTTTTATTAGTGCATTTTGCGCGAGGTCACGTTAATTCTCATGTTTGACAGGGTACCCAT (SEQ ID NO: 10)	lon之KO卡匣
KS1260	/5Phos/TCTGATTCAGATCCTCAAAGAGCCG (SEQ ID NO: 11)	Δlon::kan-sacB之彈出卡匣
KS1261	GGCAGCACGCTCTTTAACGGC (SEQ ID NO: 12)	Δlon::kan-sacB之彈出卡匣
KS518	CATCAGTTCGAACTGCAATCCGTG (SEQ ID NO: 13)	PCR確認 endA
KS519	CATCTTCGCAAAGCGCGATG (SEQ ID NO: 14)	PCR確認 endA
KS520	GGCGGCAGTGAAGAGAAGCCT (SEQ ID NO: 15)	PCR確認 recA
KS521	GCAATAACGCGCTCGTAATCTTCTG（SEQ ID NO: 16）	PCR確認 recA
KS1431	CGGCGTACCGCAACACTTTTG (SEQ ID NO: 17)	PCR確認 purR
KS1432	TGTCGCCTGCGTTAACCTGGTT (SEQ ID NO: 18)	PCR確認 purR
KS1112	GCGTTGTTGGGATCAATTCTGAGAC (SEQ ID NO: 19)	PCR確認 EcoKI
KS1113	TGCTGACCAAAACCGACGTCG (SEQ ID NO: 20)	PCR確認 EcoKI
KS651	AACGGATAAGACGGGCATAAATGAGG (SEQ ID NO: 3)	PCR確認 ompT
KS652	GTTTAATAAAAAAAAGATTAAGGGATGAAGGAAC (SEQ ID NO: 4)	PCR確認 ompT
KS1729	GATGTCGGAGTTACGCAGGAATTG (SEQ ID NO: 7)	PCR確認 manA
KS1730	TATCAAACAGTGGTTTGCTTACTTCGTTATTAAC (SEQ ID NO: 8)	PCR確認 manA
KS979	GTCGCAACGTTGAATGAACTGAGC (SEQ ID NO: 21)	PCR確認 lon
KS980	AGCTCGGTACTTTAGCAGCAGCGA (SEQ ID NO: 22)	PCR確認 lon

『*』表示前面核苷酸之硫代磷酸酯修飾『/5Phos/』表示5'末端核苷酸之5'磷酸化表4：本實例中使用之gBlock

KS gBlock 編號	DNA 序列 (5’ - 3’)	注釋
KS gBlock 165	AACGGATAAGACGGGCATAAATGAGGAAGAAATGGCGCGCCCTGCAGGATTCGAACCTGCGGCCCACGACTTAGAAGTTCCTAGAACGACATTTTAAGTCAACAACTTACCGCGCCATCTCTGCGCTCACACGTCCCACTACCTCAAAACATGTAAAGCCTTGCAAGCCATTGCGAGGCCTTATGTGTCTCAGTTTTGTCCCTCTTTTTTGTACTAAAAAACATAGTAATTGAGGATAAACCTCATGCTATTTTCGCTTATATGCCTCTAAAGGCATGGCACTTAAATAGATAAAAGCACCACAAAAGCATAAAAAAACCACACAGTAAAACCGAAATATGAAACAATAACAGATAATTAAACCAAAAACAGATAGCGCATTGTGATAATCATTCAATACTAAACAAAATATAAACAGTGGAGCAATATGTAATTGACTCATTAAGTTAGATATAAAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTGAACGCCAACTAAAATTTCCCCGAGGTGAAAATCGCCCCGGGGAATAACTAGCCATTTCAATGTAACAATTAACCCTTAAAATAAACCCAGAAGGTTATTAACTAAATCACATAGAAAACCATCAATTATAGTATGTATAAAATAGGCGACAGCAACCCAATTACAAATTAATGGTTCCAGAATATCACATCAAAAAAAACGCTGTATAATATTATAATTAACATGTAGACAACTTGTAATAAACATTATCAGTCAATTGTTTTGTTTATTCCATCTGTGACGCCGATTATTTTCTCAAAATAATGAGATGGCGTGACACCATAATAATCTTTAAATGCACATATGAAATATGAAGTACTGTTATAGCCACATTTCTGGGCTACGACATTGATAGAATAAGAGTTTGAAGTTATGAGTTTTTTTGCATACCTCATCCTAGTATCTCTCAATATTTCAGTAAATGACGTTCCTTCATCCCTTAATCTTTTTTTTATTAAAC (SEQ ID NO: 23)	擴增 ompT彈出卡匣之模板
KS gBlock 659	ACGCCTTTCGCCGCGATGTCGGAGTTACGCAGGAATTGCAGCGCCACATATTTATCATTTTCGCTGGCCTCCGGGTCACGCAGAATGTCGGCCACCTGTTGTTGGTGCGCCGGACGCAGCATGAACGACGCATCATGAAACGCCTGGCGCGCCAACAGAGTTAACGCTTCGGGTGCGACTTTCAAAATCTCCTGCCCTTCAAATTCAGATACGCTAACGTGTTCGCTGGTTAGCAGGTAATACTCAGTATCATCTTTTTTGAGTGGAAAAGGAGCCTGATAATGAAAGGGTTTGTTTGACATTGTTCTCTCACTTACTGCCTGGTTTGGTTATGCTCTGGGCGGGTGTTCCGTTGCCCTGTTAAAAGCGAGTAACAATATCCTACACACTTTTTTAACAAAAACTGAGACTAGTACGACTTTTTGCGGCTCCAGGTTACTTCCCGTAGGATTCTTGCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCGAGCTTACTGAAAAAATTAACATCTCTTGCTAAGCTTATTAAAGGCTTATAACACCTTCAGGCGGCCAGTCCGCCTGATTTCATTTTATGGATAATCATTATGAATAAATCGCTGGTAGCGGTAGGCGTCATTGTTGCGCTAGGCGTAGTCTGGACAGGCGGCGCATGGTATACAGGCAAGAAGATTGAAACCCATCTCGAAGACATGGTCGCGCAGGCGAACGCGCAACTCAAACTGACAGCTCCTGAATCCAACCTGGAAGTGAGTTATCAAAACTATCATCGCGGCGTATTCAGCAGCCAGTTGCAACTGTTGGTGAAACCCATTGCCGGGAAAGAAAATCCGTGGATTAAAAGCGGTCAGAGCGTCATCTTCAACGAATCGGTTGATCATGGTCCCTTCCCGCTTGCCCAGCTTAAAAAACTGAACCTGATCCCGTCGATGGCATCAATTCAAACCACGCTGGTTAATAACGAAGTAAGCAAACCACTGTTTGATA (SEQ ID NO: 24)	擴增 manA彈出卡匣之模板
KS gBlock 166	TCTGATTCAGATCCTCAAAGAGCCGAAAAACGCCCTGACCAAGCAGTATCAGGCGCTGTTTAATCTGGAAGGCGTGGATCTGGAATTCCGTGACGAGGCGCTGGATGCTATCGCTAAGAAAGCGATGGCGCGTAAAACCGGTGCCCGTGGCCTGCGTTCCATCGTAGAAGCCGCACTGCTCGATACCATGTACGATCTGCCGTCCATGGAAGACGTCGAAAAAGTGGTTATCGACGAGTCGGTAATTGATGGTCAAAGCAAACCGTTGCTGATTTATGGCAAGCCGGAAGCGCAACAGGCATCTGGTGAATAATTAACCATTCCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTTAATTTTTCCTCTATTCTCGGCGTTGAATGTGGGGGAAACATCCCCATATACTGACGTACATGTTAATAGATGGCGTGAAGCACAGTCGTGTCATCTGATTACCTGGCGGAAATTAAACTAAGAGAGAGCTCTTGACCTCGCGCAAAATGCACTAATAAAAACAGGGCTGGCAGGCTAATTCGGGCTTGCCAGCCTTTTTTTGTCTCGCTAAGTTAGATGGCGGATCGGGCTTGCCCTTATTAAGGGGTGTTGTAAGGGGATGGCTGGCCTGATATAACTGCTGCGCGTTCGTACCTTGAAGGATTCAAGTGCGATATAAATTATAAAGAGGAAGAGAAGAGTGAATAAATCTCAATTGATCGACAAGATTGCTGCAGGGGCTGATATCTCTAAAGCTGCGGCTGGCCGTGCGTTAGATGCTATTATTGCTTCCGTAACTGAATCTCTGAAAGAAGGGGATGATGTAGCACTGGTAGGTTTTGGTACTTTTGCCGTTAAAGAGCGTGCTGCCCGTACTGGCCGCAACCCGCAGACCGGTAAAGAGATCACCATCGCTGCTGCTAAAGTACCGAGCTTCCGTGCAGGTAAAGCACTGAAAGACGCGGTAAACTAAGCGTTGTCCCCAGTGGGGA (SEQ ID NO: 25)	擴增 lon彈出卡匣之模板

剔除卡匣之構築

除用於陰性選擇之 sacB(編碼酶聚果糖蔗糖酶)外，用於菌株工程改造工作之基因剔除卡匣亦包括編碼康黴素抗性標記物( kan)之DNA卡匣。為允許將此 kan-sacB剔除卡匣整合至基因組之正確位置，使用PCR ( 圖 1)及Invitrogen Platinum SuperFi PCR預混液，將小的45 bp上游及下游同源區(分別為UHR及DHR)附加至剔除卡匣。剔除卡匣係自內部產生之含有kan-sacB表現卡匣之質體pStrain 22中擴增。在 大腸桿菌中引入無痕基因組缺失

待基因修飾之菌株首先用pStrain 21轉型，且藉由塗鋪至含有100 μg/ml卡本西林(carbenicillin)之LB無動物成分(LBAF)瓊脂對轉型體進行選擇。接著使單個轉型體在含有100 μg/ml卡本西林之LBAF肉湯中在30℃下成長，歷時16小時，接著將30 μl此隔夜培養物轉移至含有3 ml具有100 μg/ml卡本西林之LBAF肉湯之試管中且在30℃、250 rpm下培育2小時。培育2小時後，分別使用100 ng/ml脫水四環素及1 mM異丙基β-D-1-硫代哌喃半乳糖苷誘導編碼λ red系統之基因及密碼子優化之 大腸桿菌 recA的表現。在30℃下再震盪培育2-3小時後，當OD600為約0.6-1.0時，收穫1 ml培養物來製備0.1 ml電轉勝任型細胞。將50 ul電轉勝任型細胞與1 μg經純化之剔除卡匣混合，且在1 mm有缺口之比色管中在1800伏特下進行電穿孔。在1 ml SOC培養基中在30℃、300 rpm下挽救轉型2小時，接著塗鋪至含有50 μg/ml康黴素及100 μg/ml卡本西林之LBAF瓊脂上，且在30℃下培育隔夜。接著使用與康黴素抗性基因 kan結合之通用引子，以及與旨在剔除之基因上游結合之位置特異性引子，利用LongAmp Taq DNA聚合酶進行菌落PCR (cPCR)以篩選初級整合體。與cPCR同時，將相同純系點樣至含有35 μg/ml康黴素及100 μg/ml卡本西林之LBAF瓊脂及含有60 g/l蔗糖之LB瓊脂上。將此等培養盤在30℃下培育隔夜。藉由cPCR確認初級整合體後，藉由目視檢查「無生長」表型確認預期之蔗糖敏感性，其中將純系點樣至含有60 g/l蔗糖之LBAF瓊脂上。一旦藉由cPCR確認初級整合純系且亦確認其對蔗糖敏感，則使用如下所述之類似方法移除剔除卡匣。

為移除給定之剔除卡匣且獲得無痕缺失，自如表 1所示之gBlocks (IDT)及獨特引子組擴增僅含UHR及DHR區之線性dsDNA片段。為方便起見，此等用於移除 kan-sacB卡匣之線性dsDNA片段稱為『彈出卡匣』。使確認之初級整合體在含有100 μg/ml卡本西林及50 μg/ml康黴素之LBAF肉湯中在30℃下成長，歷時16小時，接著將30 ul此隔夜培養物轉移至含有具有100 μg/ml卡本西林及50 μg/ml康黴素之3 ml LBAF肉湯之試管中且在30℃、250 rpm下培育2小時。培育2小時後，分別使用100 ng/ml aTc及1 mM IPTG誘導編碼λ red系統之基因及密碼子最佳化之 大腸桿菌 recA的表現。在30℃下再震盪培育2-3小時後，當OD600為約0.6-1.0時，收穫1 ml培養物來製備0.1 ml電轉勝任型細胞。將50 ul電轉勝任型細胞與1 μg經純化之彈出卡匣混合，且在1 mm有缺口之比色管中在1800伏特下進行電穿孔。在1 ml SOC培養基中在30℃、300 rpm下挽救轉型2小時，接著轉移至含有9 ml LBAF肉湯之125 ml搖瓶中。接著使此經稀釋之培養物在30℃、300 rpm下生長5-16小時，接著將50 ul培養物轉移至含有5 ml含有蔗糖之LBAF-無鹽肉湯(10 g/l大豆腖、5 g/l酵母提取物、60 g/l蔗糖；用0.2 uM過濾器過濾滅菌)之試管。接著將此含蔗糖之培養物在30℃、250 rpm下培育隔夜(約16小時)。接著將成長之培養物在無菌LBAF肉湯中稀釋100萬倍，塗鋪至LBAF瓊脂(塗鋪200 μl)上，且在37℃下培育隔夜。

在LBAF瓊脂盤上獲得分離之菌落後，使用cPCR及與待剔除之基因上游及下游結合之引子篩選純系以成功移除剔除卡匣( kan-sacB)。同時，將純系複製點樣至LBAF瓊脂及含有100 μg/ml卡本西林之LBAF瓊脂。將此等培養盤在30℃下培育隔夜(16小時)，以確認基因組編輯所需之溫度敏感性質體pStrain 21喪失。用於構築菌株11及菌株17之線性彈出卡匣之DNA序列列在 示例性序列表中。菌株17之菌株確認

進行PCR以確認菌株17之基因型。使用來自菌株17甘油原液之刮取物分離模板DNA。使用適合各標靶基因之引子(表3)及LongAmp Taq DNA聚合酶(目錄號M0323S)設置PCR反應。在圖 3中對凝膠進行分析後，所有條帶圖案均與所編輯基因座處之預期分子量一致。此外，對PCR產物進行序列確認，以驗證預期突變是否已引入所需基因座處。表5：使用指示之引子(參見表3之引子序列)，親本菌株菌株2及定製蛋白表現菌株菌株17中各種基因組基因座之預期PCR擴增子尺寸。

藉由 PCR 進行身份驗證之標靶基因組基因座	正向引子	反向引子	菌株 2 之預期 PCR 產物長度 (bp)	菌株 17 之預期 PCR 產物長度 (bp)
endA	KS518	KS519	499	499
recA	KS520	KS521	500	500
purR	KS1431	KS1432	1226	1226
mrr-hsdRMS-symE-mcrBC (EcoKI)	KS1112	KS1113	1048	1048
ompT	KS651	KS652	1954	955
manA	KS1729	KS1730	2162	986
lon	KS979	KS980	3330	843

結果菌株11之T7 RNA聚合酶變異體1表現

將菌株11/pStrain 2及BL21/pStrain 2純系在30℃、300 rpm下培育隔夜。次日準備含有60 ml TBAF++及50 μg/ml康黴素之帶擋板之500 mL搖瓶。將各隔夜培養物之一部分轉移至燒瓶中以獲得初始OD600 = 0.05。接著在實驗期間將燒瓶在28℃、300 rpm下培育。在第12小時(大約OD600 = 15)用1 mM IPTG誘導燒瓶。誘導後每小時量測OD600，且保存1 OD600等效細胞球粒，用於-20℃下之溶解及蛋白質凝膠。

成功創建菌株11後，用質體pStrain 2對其進行轉型，創建菌株12，以實現T7 RNA聚合酶變異體1之高複本、IPTG誘導表現。如方法部分所述，最初在搖瓶中測定菌株12之T7 RNA聚合酶變異體1蛋白之生長概況、特徵、產量及純度。作為比較，攜帶pStrain 2之BL21亦包括在搖瓶研究中。如圖 4所示，菌株12之生長及T7 RNA聚合酶變異體1酶之表現與BL21相當。此外，BL21顯示展現T7 RNA聚合酶變異體1之降解產物，此在菌株11中未觀測到。不幸地，菌株11展現陰性生長表型，導致非常黏稠之漿狀培養物，此降低Ambr生物反應器之混合效能，導致氧質傳減少及維持目標%溶解氧之能力降低(資料未顯示)。

黏液表型似乎為 lon缺失之結果，因為菌株10中本身 ompT剔除具有正常之生長及培養外觀(資料未顯示)。不受理論之束縛，完全移除Lon可能引起RcsA過度積累，因此導致稱為可拉酸(colanic acid)之多醣過量產生。因此，基因組中缺失 manA，其為編碼甘露糖生物合成途徑第一步之基因。基因組中缺失該非必需基因以消除多醣之過量產生，從而消除黏液表型。 manA剔除引起不希望之黏液表型喪失

在構築菌株17後，證明 manA剔除移除由必要之 lon剔除產生的黏液表型。用pStrain 2 (用於表現T7 RNA聚合酶變異體1)轉型菌株11、BL21及菌株17，分別獲得菌株12、菌株24及菌株18。自圖 5A可清楚看出，菌株12 (菌株11/pStrain 2)展示緻密之黏液形成，由缺乏起泡及禁錮氣泡顯而易見。另一方面，在存在編碼T7 RNA聚合酶變異體1之質體下菌株24及菌株18 (分別為宿主菌株BL21及菌株17)之菌株展現正常表型。為進一步證明細胞形態之改善及其在工業製程中之效用，藉由在13,000×g下離心，使菌株12、菌株24及菌株18培養物粒化。如圖 5B所示，菌株24 (BL21/pStrain 2)產生緻密球粒。然而， manA完整之菌株12 (菌株11/pStrain 2)未充分粒化。但是， manA剔除菌株菌株18 (菌株17/pStrain 2)產生脆的緻密球粒，上清液清澈。此等搖瓶發酵結果支持進一步測試菌株17在搖瓶及Ambr250生物反應器中之重組蛋白表現。在宿主菌株17下T7 RNA聚合酶變異體1之表現

為進行搖瓶表現發酵，將菌株17/pStrain 2純系接種至3 ml具有50 μg/ml康黴素之LBAF的試管中且在30℃下在300 rpm下培育隔夜。確定各培養物之OD600且將獲得初始OD600 = 0.1所需之量的各種菌培養物轉移至含有30 ml TBAF + 50 μg/ml康黴素的無菌250 ml帶擋板之通氣搖瓶中。接著將接種之燒瓶在37℃、300 rpm下培育。在3小時時間點，添加0.5 mM IPTG以誘導T7 RNA聚合酶變異體1表現。誘導後4小時獲取OD600及1 OD等效細胞球粒。

本研究評估在菌株17中表現T7 RNA聚合酶變異體1之四個不同純系。在圖 6中，在所有純系中均觀測到T7 RNA聚合酶變異體1之過度表現，而純系1似乎具有最高之T7 RNA聚合酶變異體1表現。可能由於缺乏黏液表型，與使用菌株11作為宿主菌株之實驗相比，溶解更高效，從而產生純淨凝膠影像。表現T7 RNA聚合酶變異體2之菌株17在Ambr250生物反應器中之效能

用攜帶編碼T7 RNA聚合酶變異體2之IPTG誘導型DNA序列的pStrain 23轉型菌株17後，挑出兩個純系用於進一步篩选及表徵：菌株19及菌株20。一旦純系之質體及基因型得到確認，即可評估其在AMBR250生物反應器中之效能。此過程涉及使用TBAF培養基、酵母提取物(yeastolate)及甘油進料之有氧補料分批發酵。

在此實驗中，使用自甘油原液刮取至75 mL TBAF + 50 μg/mL康黴素之冰刮取物，接種一個500 mL搖瓶且在28℃下生長9.5小時。各生物反應器接種6.7%之接種物(初始OD ₆₀₀0.05)，此係基於200 mL之初始起始體積計算，且接著乘以0.8之種菌瓶目標OD600。接著藉由實際種菌瓶OD600對此值進行正規化。表6：來自28小時EFT時間點之濕細胞重量.

反應器編號	純系	濕細胞重量 (g/L)
1	菌株19	163
2	菌株19	151
3	菌株20	148
4	菌株20	157

線上概況與預期一致且在所有生物反應器之間一致( 圖 7)。CER在第9小時達到60之值，在IPTG大劑量添加下觸發所有四個生物反應器之誘導。CER在整個培養持續時間內繼續攀升，達到90之CER峰值。在整個培養持續時間內，溶解氧維持在50%，只有此等感測器典型之微小波動。pH值維持在6.95 ± 0.05之目標值。在觸發酸添加之指數階段，pH值攀升至7.0以上，直至pH值在第11小時左右穩定。一旦pH值停止上升且在第11小時開始穩定，即可觸發鹼，以接近恆定之速率進料以維持6.95之pH值。28小時時，收穫培養物且送去進行純化及LabChip分析(藉由毛細管電泳進行蛋白質定量)。菌株19及菌株20該兩個純系行為相似，生長至相似之最終濕細胞重量(表6)，且重要地，在高密度生物反應器發酵中使用宿主菌株菌株17進行重組蛋白表現未觀測到任何問題。

最後，對T7 RNA聚合酶變異體2之表現進行目測、定量且自上述Ambr發酵過程中取出之冷凍細胞球粒中純化。來自菌株19生物反應器之細胞球粒如下進行處理：在-80℃下冷凍，解凍至環境溫度，在存在Tris-HCl、NaCl、DTT、蛋白酶抑制劑、PMSF、溶菌酶、DNA酶、Triton-X 100之情況下溶解細菌細胞。過濾溶解產物，且藉由毛細管電泳分析濾液中存在之T7 RNA聚合酶變異體2。結果展示在圖 8中。由此產生之最終蛋白質產量為約2.5 g/L (每升培養物中之蛋白質公克數)且經由密度測定法，純度＞95%之純度。此處實現之T7 RNA聚合酶變異體2產量對於第一代菌株及發酵過程而言相當高，且若成功擴大至30 L發酵，預計將提供每個發酵批次＞60公克未純化之T7酶。就上下文而言，產生100-150 g mRNA需要大約1 g T7 RNA聚合酶。結論

已開發出一種用於表現重組蛋白之定製 大腸桿菌菌株。首先，選擇菌株2作為親本菌株，開始引入對重組蛋白表現特別有益之基因組修飾。菌株2具有若干個可用於工業蛋白表現菌株之突變。此等突變包括 endA及 recA剔除以提高純化後質體之穩定性及純度，以及EcoKI限制性系統之失活以提高轉型及選殖效率。此工作之一個目的為降低菌株2之蛋白酶活性，以提供可表現高純度重組酶之菌株。

基因組中缺失 ompT基因，該基因編碼在大腸桿菌外膜中發現之主要蛋白酶。其次，基因組中缺失一種主要管家蛋白酶Lon。發現菌株中之 lon剔除導致陰性黏液表型，此由多醣合成途徑之上調引起。此 lon剔除展現Ambr250生物反應器之效能較差，因為培養物黏度成為對培養物之攪拌及通氣之限制。根據大腸桿菌BL21之基因組序列(Genbank: CP053601.1)， lonORF在此菌株中保持完整。BL21可能展現一些殘留之Lon活性，因此未表現出黏液表型。為防止所需重組蛋白降解，需要一種完全缺乏Lon活性之菌株。為開發一種真正 lon剔除但亦不表現出黏液表型之菌株，引入額外基因剔除 ΔmanA以移除非必需多醣合成途徑之第一步。第一代蛋白表現菌株菌株17之最終基因型為大腸桿菌MG1655 ΔendA ΔrecA Δ( mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon。實例2：在Lon、OmpT及ManA缺乏之經基因修飾之 大腸桿菌菌株中T7 RNA聚合酶變異體3及T7 RNA聚合酶變異體3之產生.

藉由定點誘變對編碼IPTG誘導之編碼T7 RNA聚合酶變異體2之DNA序列的pStrain 23進行修飾，以便編碼序列改為編碼T7 RNA聚合酶變異體3。此經修飾之質體稱為pStrain 24。菌株17用pStrain 24轉型，pStrain 24攜帶IPTG誘導之編碼T7 RNA聚合酶變異體3之DNA序列。一旦確認細菌菌株及轉型質體之基因型，即將菌株接種至AMBR250生物反應器中以啟動T7 RNA聚合酶變異體3之發酵及產生。此過程涉及使用TBAF培養基、酵母提取物及甘油進料之有氧補料分批發酵。

將IPTG添加至各生物反應器中以觸發T7 RNA聚合酶變異體3表現之誘導。使細菌培養物生長，且接著收穫培養物且送去進行T7 RNA聚合酶變異體3純化及後續LabChip分析(藉由毛細管電泳進行蛋白質定量)。

最後，對T7 RNA聚合酶變異體3之表現進行目測、定量且自上述Ambr發酵過程中取出之冷凍細胞球粒中純化。來自菌株19生物反應器之細胞球粒如下進行處理：在-80℃下冷凍，解凍至環境溫度，在存在Tris-HCl、NaCl、DTT、蛋白酶抑制劑、PMSF、溶菌酶、DNA酶、Triton-X 100之情況下溶解細菌細胞。過濾溶解產物，且藉由毛細管電泳分析濾液中存在之T7 RNA聚合酶變異體3。若擴大至30 L發酵，預計發酵將提供每個發酵批次＞60公克未純化之T7 RNA聚合酶變異體3酶。就上下文而言，產生100-150 g mRNA需要大約1 g T7 RNA聚合酶。示例性序列

SEQ ID NO	序列	描述
26	TATTGAAGATCCGCTTCGATCAGGGGATGGGCTACTGGCGCATCAACTTTTCATCGCAATGGCATTACTTTGATTTCCGCGATGACGTTTCTTTCCAGTTAGTCAAAATGGCTCAGGCCTGCAAGGAAGGGAATGTCGCCAACAGCGAAGAGAGTTGGGCAACGGATGTGCTGGTGGAGGTGATCGCCTCCTGATGATGAGCCGCTCCCGATGTGGTGTCGGGAGCGGTATTTTCTATAAAACTTACCGCAATATCAGGCCGGATGCGGCTGCGCCTTATCCGGCCCATAACCCCTTACTTCCTCAACCCCGCAAACGCAGCCCGAATCTCTTCCTCCGGCAGCTGGATCCCGATAAACACCATCGTGCTATGCGGTTTTTCATCGCCCCACGGCCTGTCCCAGTCGGCGCTGTAGAGGCGCTGGACGCCCTGGAACAGCAGGCGGTTAGGTTCGCCGTCAATCCACAGCATCCCTTTGTAACGTAGCAGTTTATCCGCC	mcrC缺失卡匣
23	AACGGATAAGACGGGCATAAATGAGGAAGAAATGGCGCGCCCTGCAGGATTCGAACCTGCGGCCCACGACTTAGAAGTTCCTAGAACGACATTTTAAGTCAACAACTTACCGCGCCATCTCTGCGCTCACACGTCCCACTACCTCAAAACATGTAAAGCCTTGCAAGCCATTGCGAGGCCTTATGTGTCTCAGTTTTGTCCCTCTTTTTTGTACTAAAAAACATAGTAATTGAGGATAAACCTCATGCTATTTTCGCTTATATGCCTCTAAAGGCATGGCACTTAAATAGATAAAAGCACCACAAAAGCATAAAAAAACCACACAGTAAAACCGAAATATGAAACAATAACAGATAATTAAACCAAAAACAGATAGCGCATTGTGATAATCATTCAATACTAAACAAAATATAAACAGTGGAGCAATATGTAATTGACTCATTAAGTTAGATATAAAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTGAACGCCAACTAAAATTTCCCCGAGGTGAAAATCGCCCCGGGGAATAACTAGCCATTTCAATGTAACAATTAACCCTTAAAATAAACCCAGAAGGTTATTAACTAAATCACATAGAAAACCATCAATTATAGTATGTATAAAATAGGCGACAGCAACCCAATTACAAATTAATGGTTCCAGAATATCACATCAAAAAAAACGCTGTATAATATTATAATTAACATGTAGACAACTTGTAATAAACATTATCAGTCAATTGTTTTGTTTATTCCATCTGTGACGCCGATTATTTTCTCAAAATAATGAGATGGCGTGACACCATAATAATCTTTAAATGCACATATGAAATATGAAGTACTGTTATAGCCACATTTCTGGGCTACGACATTGATAGAATAAGAGTTTGAAGTTATGAGTTTTTTTGCATACCTCATCCTAGTATCTCTCAATATTTCAGTAAATGACGTTCCTTCATCCCTTAATCTTTTTTTTATTAAAC	ompT缺失卡匣
25	TCTGATTCAGATCCTCAAAGAGCCGAAAAACGCCCTGACCAAGCAGTATCAGGCGCTGTTTAATCTGGAAGGCGTGGATCTGGAATTCCGTGACGAGGCGCTGGATGCTATCGCTAAGAAAGCGATGGCGCGTAAAACCGGTGCCCGTGGCCTGCGTTCCATCGTAGAAGCCGCACTGCTCGATACCATGTACGATCTGCCGTCCATGGAAGACGTCGAAAAAGTGGTTATCGACGAGTCGGTAATTGATGGTCAAAGCAAACCGTTGCTGATTTATGGCAAGCCGGAAGCGCAACAGGCATCTGGTGAATAATTAACCATTCCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTTAATTTTTCCTCTATTCTCGGCGTTGAATGTGGGGGAAACATCCCCATATACTGACGTACATGTTAATAGATGGCGTGAAGCACAGTCGTGTCATCTGATTACCTGGCGGAAATTAAACTAAGAGAGAGCTCTTGACCTCGCGCAAAATGCACTAATAAAAACAGGGCTGGCAGGCTAATTCGGGCTTGCCAGCCTTTTTTTGTCTCGCTAAGTTAGATGGCGGATCGGGCTTGCCCTTATTAAGGGGTGTTGTAAGGGGATGGCTGGCCTGATATAACTGCTGCGCGTTCGTACCTTGAAGGATTCAAGTGCGATATAAATTATAAAGAGGAAGAGAAGAGTGAATAAATCTCAATTGATCGACAAGATTGCTGCAGGGGCTGATATCTCTAAAGCTGCGGCTGGCCGTGCGTTAGATGCTATTATTGCTTCCGTAACTGAATCTCTGAAAGAAGGGGATGATGTAGCACTGGTAGGTTTTGGTACTTTTGCCGTTAAAGAGCGTGCTGCCCGTACTGGCCGCAACCCGCAGACCGGTAAAGAGATCACCATCGCTGCTGCTAAAGTACCGAGCTTCCGTGCAGGTAAAGCACTGAAAGACGCGGTAAACTAAGCGTTGTCCCCAGTGGGGA	lon缺失卡匣
24	ACGCCTTTCGCCGCGATGTCGGAGTTACGCAGGAATTGCAGCGCCACATATTTATCATTTTCGCTGGCCTCCGGGTCACGCAGAATGTCGGCCACCTGTTGTTGGTGCGCCGGACGCAGCATGAACGACGCATCATGAAACGCCTGGCGCGCCAACAGAGTTAACGCTTCGGGTGCGACTTTCAAAATCTCCTGCCCTTCAAATTCAGATACGCTAACGTGTTCGCTGGTTAGCAGGTAATACTCAGTATCATCTTTTTTGAGTGGAAAAGGAGCCTGATAATGAAAGGGTTTGTTTGACATTGTTCTCTCACTTACTGCCTGGTTTGGTTATGCTCTGGGCGGGTGTTCCGTTGCCCTGTTAAAAGCGAGTAACAATATCCTACACACTTTTTTAACAAAAACTGAGACTAGTACGACTTTTTGCGGCTCCAGGTTACTTCCCGTAGGATTCTTGCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCGAGCTTACTGAAAAAATTAACATCTCTTGCTAAGCTTATTAAAGGCTTATAACACCTTCAGGCGGCCAGTCCGCCTGATTTCATTTTATGGATAATCATTATGAATAAATCGCTGGTAGCGGTAGGCGTCATTGTTGCGCTAGGCGTAGTCTGGACAGGCGGCGCATGGTATACAGGCAAGAAGATTGAAACCCATCTCGAAGACATGGTCGCGCAGGCGAACGCGCAACTCAAACTGACAGCTCCTGAATCCAACCTGGAAGTGAGTTATCAAAACTATCATCGCGGCGTATTCAGCAGCCAGTTGCAACTGTTGGTGAAACCCATTGCCGGGAAAGAAAATCCGTGGATTAAAAGCGGTCAGAGCGTCATCTTCAACGAATCGGTTGATCATGGTCCCTTCCCGCTTGCCCAGCTTAAAAAACTGAACCTGATCCCGTCGATGGCATCAATTCAAACCACGCTGGTTAATAACGAAGTAAGCAAACCACTGTTTGATA	manA缺失卡匣
27	GATTCGAACTCGGCCCACGACTTAGAAGTTCTAGAACGACATTTTAAGTCAACAACTTACCGCGCCATCTCTGCGCTCACACGTCCCACTACCTCAAAACATGTAAAGCCTTGCAAGCCATTGCGAGGCCTTATGTGTCTCAGTTTTGTCCCTCTTTTTTGTACTAAAAAACATAGTAATTGAGGATAAACCTCATGCTATTTTCGCTTATATGCCTCTAAAGGCATGGCACTTAAATAGATAAAAGCACCACAAAAGCATAAAAAAACCACACAGTAAAACCGAAATATGAAACAATAACAGATAATTAAACCAAAAACAGATAGCGCATTGTGATAATCATTCAATACTAAACAAAATATAAACAGTGGAGCAATATGTAATTGACTCATTAAGTTAGATATAAAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTATGCGGGCGAAACTTCTGGGAATAGTCCTGACAACCCCTATTGCGATCAGCTCTTTTGCTTCTACCGAGACTTTATCGTTTACTCCTGACAACATAAATGCGGACATTAGTCTTGGAACTCTGAGCGGAAAAACAAAAGAGCGTGTTTATCTAGCCGAAGAAGGAGGCCGAAAAGTCAGTCAACTCGACTGGAAATTCAATAACGCTGCAATTATTAAAGGTGCAATTAATTGGGATTTGATGCCCCAGATATCTATCGGGGCTGCTGGCTGGACAACTCTCGGCAGCCGAGGTGGCAATATGGTCGATCAGGACTGGATGGATTCCAGTAACCCCGGAACCTGGACGGATGAAAGTAGACACCCTGATACACAACTCAATTATGCCAACGAATTTGATCTGAATATCAAAGGCTGGCTCCTCAACGAACCCAATTACCGCCTGGGACTCATGGCCGGATATCAGGAAAGCCGTTATAGCTTTACAGCCAGAGGTGGTTCCTATATCTACAGTTCTGAGGAGGGATTCAGAGATGATATCGGCTCCTTCCCGAATGGAGAAAGAGCAATCGGCTACAAACAACGTTTTAAAATGCCCTACATTGGCTTGACTGGAAGTTATCGTTATGAAGATTTTGAACTCGGTGGCACATTTAAATACAGCGGCTGGGTGGAATCATCTGATAACGATGAACACTATGACCCGGGAAAAAGAATCACTTATCGCAGTAAGGTCAAAGACCAAAATTACTATTCTGTTGCAGTCAATGCAGGTTATTACGTCACACCTAACGCAAAAGTTTATGTTGAAGGCGCATGGAATCGGGTTACGAATAAAAAAGGTAATACTTCACTTTATGATCACAATAATAACACTTCAGACTACAGCAAAAATGGAGCAGGTATAGAAAACTATAACTTCATCACTACTGCTGGTCTTAAGTACACATTTTAAGAACGCCAACTAAAATTTCCCCGAGGTGAAAATCGCCCCGGGAATAACTAGCCATTTCAATGTAACAATTAACCCTTAAAATAAACCCAGAAGGTTATTAACTAAATCACATAGAAAACCATCAATTATAGTATGTATAAAATAGGCGACAGCAACCCAATTACAAATTAATGGTTCCAGAATATCACATCAAAAAAAACGCTGTATAATATTATAATTAACATGTAGACAACTTGTAATAAACATTATCAGTCAATTGTTTTGTTTATTCCATCTGTGACGCCGATTATTTTCTCAAAATAATGAGATGGCGTGAGACCATAATAATCTTTAAATGCACATATGAAATATGAAG	ompTDNA編碼序列
28	MRAKLLGIVLTTPIAISSFASTETLSFTPDNINADISLGTLSGKTKERVYLAEEGGRKVSQLDWKFNNAAIIKGAINWDLMPQISIGAAGWTTLGSRGGNMVDQDWMDSSNPGTWTDESRHPDTQLNYANEFDLNIKGWLLNEPNYRLGLMAGYQESRYSFTARGGSYIYSSEEGFRDDIGSFPNGERAIGYKQRFKMPYIGLTGSYRYEDFELGGTFKYSGWVESSDNDEHYDPGKRITYRSKVKDQNYYSVAVNAGYYVTPNAKVYVEGAWNRVTNKKGNTSLYDHNNNTSDYSKNGAGIENYNFITTAGLKYTF	OmpT胺基酸序列
29	GAATTCCGTGACGAGGCGCTGGATGCTATCGCTAAGAAAGCGATGGCGCGTAAAACCGGTGCCCGTGGCCTGCGTTCCATCGTAGAAGCCGCACTGCTCGATACCATGTACGATCTGCCGTCCATGGAAGATGTCGAAAAAGTGGTTATCGACGAGTCGGTAATTGATGGTCAAAGCAAACCGTTGCTGATTTATGGTAAGCCGGAAGCGCAACAGGCATCTGGTGAATAATTAACCATTCCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTTAATTTTTCCTCTATTCTCGGCGTTGAATGTGGGGGAAACATCCCCATATACTGACGTACATGTTAATAGATGGCGTGAAGCACAGTCGTGTCATCTGATTACCTGGCGGAAATTAAACTAAGAGAGAGCTCTATGAATCCTGAGCGTTCTGAACGCATTGAAATCCCCGTATTGCCGCTGCGCGATGTGGTGGTTTATCCGCACATGGTCATCCCCTTATTTGTCGGGCGGGAAAAATCTATCCGTTGTCTGGAAGCGGCGATGGACCATGATAAAAAAATTATGCTGGTCGCGCAGAAAGAAGCTTCAACGGATGAGCCGGGTGTAAACGATCTTTTCACCGTCGGGACCGTGGCCTCTATATTGCAGATGCTGAAACTGCCTGACGGCACCGTCAAAGTGCTGGTCGAGGGGTTACAGCGCGCGCGTATTTCTGCGCTCTCTGACAATGGCGAACACTTTTCTGCGAAGGCGGAGTATCTGGAGTCGCCGACCATTGATGAGCGGGAACAGGAAGTGCTGGTGCGTACTGCAATCAGCCAGTTCGAAGGCTACATCAAGCTGAACAAAAAAATCCCACCAGAAGTGCTGACGTCGCTGAATAGCATCGACGATCCGGCGCGTCTGGCGGATACCATTGCTGCACATATGCCGCTGAAACTGGCTGACAAACAGTCCGTTCTGGAGATGTCCGACGTTAACGAACGTCTGGAATATCTGATGGCAATGATGGAATCGGAAATCGATCTGCTGCAGGTTGAGAAACGCATTCGCAACCGCGTTAAAAAGCAGATGGAGAAATCCCAGCGTGAGTACTATCTGAACGAGCAAATGAAAGCTATTCAGAAAGAACTCGGTGAAATGGACGACGCGCCGGACGAAAACGAAGCCCTGAAGCGCAAAATCGACGCGGCGAAGATGCCGAAAGAGGCAAAAGAGAAAGCGGAAGCAGAGTTGCAGAAGCTGAAAATGATGTCTCCGATGTCGGCAGAAGCGACCGTAGTGCGTGGTTATATCGACTGGATGGTACAGGTACCGTGGAATGCGCGCAGCAAGGTCAAAAAAGACCTGCGTCAGGCGCAGGAAATCCTTGATACCGACCATTATGGTCTGGAGCGCGTGAAAGATCGCATCCTTGAGTACCTTGCGGTTCAAAGCCGTGTCAACAAAATCAAGGGACCAATCCTCTGCCTGGTAGGGCCGCCGGGGGTAGGTAAAACCTCTCTTGGTCAGTCCATTGCCAAAGCCACCGGGCGTAAATATGTCCGTATGGCGCTGGGCGGCGTGCGTGATGAAGCGGAAATCCGTGGTCACCGCCGTACTTACATCGGTTCTATGCCGGGTAAACTGATCCAGAAAATGGCGAAAGTGGGCGTGAAAAACCCGCTGTTCCTGCTCGATGAGATCGACAAAATGTCTTCTGACATGCGAGGCGATCCGGCCTCTGCACTGCTTGAAGTGCTGGATCCAGAGCAGAACGTAGCGTTCAGCGACCACTACCTGGAAGTGGATTACGATCTCAGCGACGTGATGTTTGTCGCGACGTCGAACTCCATGAACATTCCGGCACCGCTGCTGGATCGTATGGAAGTGATTCGCCTCTCCGGTTATACCGAAGATGAAAAACTGAACATCGCCAAACGTCACCTGCTGCCGAAGCAGATTGAACGTAATGCACTGAAAAAAGGTGAGCTGACCGTCGACGATAGCGCCATTATCGGCATTATTCGTTACTACACCCGTGAGGCGGGCGTGCGTGGTCTGGAGCGTGAAATCTCCAAACTGTGCCGCAAAGCGGTTAAGCAGTTACTGCTCGATAAGTCATTAAAACATATCGAAATTAACGGCGATAACCTGCATGACTACCTCGGTGTTCAGCGTTTCGACTATGGTCGCGCTGATAACGAAAACCGTGTCGGTCAGGTAACCGGTCTGGCGTGGACGGAAGTGGGCGGTGACTTGCTGACCATTGAAACCGCATGTGTTCCGGGTAAAGGCAAACTGACCTATACCGGTTCGCTCGGCGAAGTGATGCAGGAGTCTATTCAGGCGGCGTTAACGGTGGTTCGTGCGCGTGCGGAAAAACTGGGGATCAACCCTGATTTTTACGAAAAACGTGACATCCACGTCCACGTACCGGAAGGTGCGACGCCGAAAGATGGTCCGAGTGCCGGTATTGCTATGTGCACCGCGCTGGTTTCTTGCCTGACCGGTAACCCGGTTCGTGCCGATGTGGCAATGACCGGTGAGATCACTCTGCGTGGTCAGGTACTGCCGATCGGTGGTTTGAAAGAAAAACTCCTGGCAGCGCATCGCGGCGGGATTAAAACAGTGCTAATTCCGTTCGAAAATAAACGCGATCTGGAAGAGATTCCTGACAACGTAATTGCCGATCTGGACATTCATCCTGTGAAGCGCATTGAGGAAGTTCTGACTCTGGCGCTGCAAAATGAACCGTCCGGCATGCACCATTCCTTGCGGCGGCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAA	lonDNA編碼序列
30	MNPERSERIEIPVLPLRDVVVYPHMVIPLFVGREKSIRCLEAAMDHDKKIMLVAQKEASTDEPGVNDLFTVGTVASILQMLKLPDGTVKVLVEGLQRARISALSDNGEHFSAKAEYLESPTIDEREQEVLVRTAISQFEGYIKLNKKIPPEVLTSLNSIDDPARLADTIAAHMPLKLADKQSVLEMSDVNERLEYLMAMMESEIDLLQVEKRIRNRVKKQMEKSQREYYLNEQMKAIQKELGEMDDAPDENEALKRKIDAAKMPKEAKEKAEAELQKLKMMSPMSAEATVVRGYIDWMVQVPWNARSKVKKDLRQAQEILDTDHYGLERVKDRILEYLAVQSRVNKIKGPILCLVGPPGVGKTSLGQSIAKATGRKYVRMALGGVRDEAEIRGHRRTYIGSMPGKLIQKMAKVGVKNPLFLLDEIDKMSSDMRGDPASALLEVLDPEQNVAFSDHYLEVDYDLSDVMFVATSNSMNIPAPLLDRMEVIRLSGYTEDEKLNIAKRHLLPKQIERNALKKGELTVDDSAIIGIIRYYTREAGVRGLEREISKLCRKAVKQLLLDKSLKHIEINGDNLHDYLGVQRFDYGRADNENRVGQVTGLAWTEVGGDLLTIETACVPGKGKLTYTGSLGEVMQESIQAALTVVRARAEKLGINPDFYEKRDIHVHVPEGATPKDGPSAGIAMCTALVSCLTGNPVRADVAMTGEITLRGQVLPIGGLKEKLLAAHRGGIKTVLIPFENKRDLEEIPDNVIADLDIHPVKRIEEVLTLALQNEPSGMQVVTAK	Lon胺基酸序列
31	CCGGACGCAGCATGAACGACGCATCATGAAACGCCTGGCGCGCCAACAGAGTTAACGCTTCGGGTGCGACTTTCAAAATCTCCTGCCCTTCAAATTCAGATACGCTAACGTGTTCGCTGGTTAGCAGGTAATACTCAGTATCATCTTTTTTGAGTGGAAAAGGAGCCTGATAATGAAAGGGTTTGTTTGACATTGTTCTCTCACTTACTGCCTGGTTTGGTTATGCTCTGGGCGGGTGTTCCGTTGCCCTGTTAAAAGCGAGTAACAATATCCTACACACTTTTTTAACAAAAACTGAGACTAGTACGACTTTTTGCGGCTCCAGGTTACTTCCCGTAGGATTCTTGCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCATGCAAAAACTCATTAACTCAGTGCAAAACTATGCCTGGGGCAGCAAAACGGCGTTGACTGAACTTTATGGTATGGAAAATCCGTCCAGCCAGCCGATGGCCGAGCTGTGGATGGGCGCACATCCGAAAAGCAGTTCACGAGTGCAGAATGCCGCCGGAGATATCGTTTCACTGCGTGATGTGATTGAGAGTGATAAATCGACTCTGCTCGGAGAGGCCGTTGCCAAACGCTTTGGCGAACTGCCTTTCCTGTTCAAAGTATTATGCGCAGCACAGCCACTCTCCATTCAGGTTCATCCAAACAAACACAATTCTGAAATCGGTTTTGCCAAAGAAAATGCCGCAGGTATCCCGATGGATGCCGCCGAGCGTAACTATAAAGATCCTAACCACAAGCCGGAGCTGGTTTTTGCGCTGACGCCTTTCCTTGCGATGAACGCGTTTCGTGAATTTTCCGAGATTGTCTCCCTACTCCAGCCGGTCGCAGGTGCACATCCGGCGATTGCTCACTTTTTACAACAGCCTGATGCCGAACGTTTAAGCGAACTGTTCGCCAGCCTGTTGAATATGCAGGGTGAAGAAAAATCCCGCGCGCTGGCGATTTTAAAATCGGCCCTCGATAGCCAGCAGGGTGAACCGTGGCAAACGATTCGTTTAATTTCTGAATTTTACCCGGAAGACAGCGGTCTGTTCTCCCCGCTATTGCTGAATGTGGTGAAATTGAACCCTGGCGAAGCGATGTTCCTGTTCGCTGAAACACCGCACGCTTACCTGCAAGGCGTGGCGCTGGAAGTGATGGCAAACTCCGATAACGTGCTGCGTGCGGGTCTGACGCCTAAATACATTGATATTCCGGAACTGGTTGCCAATGTGAAATTCGAAGCCAAACCGGCTAACCAGTTGTTGACCCAGCCGGTGAAACAAGGTGCAGAACTGGACTTCCCGATTCCAGTGGATGATTTTGCCTTCTCGCTGCATGACCTTAGTGATAAAGAAACCACCATTAGCCAGCAGAGTGCCGCCATTTTGTTCTGCGTCGAAGGCGATGCAACGTTGTGGAAAGGTTCTCAGCAGTTACAGCTTAAACCGGGTGAATCAGCGTTTATTGCCGCCAACGAATCACCGGTGACTGTCAAAGGCCACGGCCGTTTAGCGCGTGTTTACAACAAGCTGTAAGAGCTTACTGAAAAAATTAACATCTCTTGCTAAGCTT	manADNA編碼序列
32	MQKLINSVQNYAWGSKTALTELYGMENPSSQPMAELWMGAHPKSSSRVQNAAGDIVSLRDVIESDKSTLLGEAVAKRFGELPFLFKVLCAAQPLSIQVHPNKHNSEIGFAKENAAGIPMDAAERNYKDPNHKPELVFALTPFLAMNAFREFSEIVSLLQPVAGAHPAIAHFLQQPDAERLSELFASLLNMQGEEKSRALAILKSALDSQQGEPWQTIRLISEFYPEDSGLFSPLLLNVVKLNPGEAMFLFAETPHAYLQGVALEVMANSDNVLRAGLTPKYIDIPELVANVKFEAKPANQLLTQPVKQGAELDFPIPVDDFAFSLHDLSDKETTISQQSAAILFCVEGDATLWKGSQQLQLKPGESAFIAANESPVTVKGHGRLARVYNKL	ManA胺基酸序列
33	TCGCGCTGCACTGGCGTAATGCTGACCGGATGGCTATCGCTAATGGTCTTACGCTCAACATTGATAAGCAACTTGACGCAATGTTAATGGGCTGATAGTCTTATCTTACAGGTCATCTGCGGGTGGCCTGAATAGGTACGATTTACTAACTGGAAGAGGCACTAAATGAACACGATTAACATCGCTAAGAACGACTTCTCTGACATCGAACTGGCTGCTATCCCGTTCAACACTCTGGCTGACCATTACGGTGAGCGTTTAGCTCGCGAACAGTTGGCCCTTGAGCATGAGTCTTACGAGATGGGTGAAGCACGCTTCCGCAAGATGTTTGAGCGTCAACTTAAAGCTGGTGAGGTTGCGGATAACGCTGCCGCCAAGCCTCTCATCACTACCCTACTCCCTAAGATGATTGCACGCATCAACGACTGGTTTGAGGAAGTGAAAGCTAAGCGCGGCAAGCGCCCGACAGCCTTCCAGTTCCTGCAAGAAATCAAGCCGGAAGCCGTAGCGTACATCACCATTAAGACCACTCTGGCTTGCCTAACCAGTGCTGACAATACAACCGTTCAGGCTGTAGCAAGCGCAATCGGTCGGGCCATTGAGGACGAGGCTCGCTTCGGTCGTATCCGTGACCTTGAAGCTAAGCACTTCAAGAAAAACGTTGAGGAACAACTCAACAAGCGCGTAGGGCACGTCTACAAGAAAGCATTTATGCAAGTTGTCGAGGCTGACATGCTCTCTAAGGGTCTACTCGGTGGCGAGGCGTGGTCTTCGTGGCATAAGGAAGACTCTATTCATGTAGGAGTACGCTGCATCGAGATGCTCATTGAGTCAACCGGAATGGTTAGCTTACACCGCCAAAATGCTGGCGTAGTAGGTCAAGACTCTGAGACTATCGAACTCGCACCTGAATACGCTGAGGCTATCGCAACCCGTGCAGGTGCGCTGGCTGGCATCTCTCCGATGTTCCAACCTTGCGTAGTTCCTCCTAAGCCGTGGACTGGCATTACTGGTGGTGGCTATTGGGCTAACGGTCGTCGTCCTCTGGCGCTGGTGCGTACTCACAGTAAGAAAGCACTGATGCGCTACGAAGACGTTTACATGCCTGAGGTGTACAAAGCGATTAACATTGCGCAAAACACCGCATGGAAAATCAACAAGAAAGTCCTAGCGGTCGCCAACGTAATCACCAAGTGGAAGCATTGTCCGGTCGAGGACATCCCTGCGATTGAGCGTGAAGAACTCCCGATGAAACCGGAAGACATCGACATGAATCCTGAGGCTCTCACCGCGTGGAAACGTGCTGCCGCTGCTGTGTACCGCAAGGACAGGGCTCGCAAGTCTCGCCGTATCAGCCTTGAGTTCATGCTTGAGCAAGCCAATAAGTTTGCTAACCATAAGGCCATCTGGTTCCCTTACAACATGGACTGGCGCGGTCGTGTTTACGCCGTGTCAATGTTCAACCCGCAAGGTAACGATATGACCAAAGGACTGCTTACGCTGGCGAAAGGTAAACCAATCGGTAAGGAAGGTTACTACTGGCTGAAAATCCACGGTGCAAACTGTGCGGGTGTCGATAAGGTTCCGTTCCCTGAGCGCATCAAGTTCATTGAGGAAAACCACGAGAACATCATGGCTTGCGCTAAGTCTCCACTGGAGAACACTTGGTGGGCTGAGCAAGATTCTCCGTTCTGCTTCCTTGCGTTCTGCTTTGAGTACGCTGGGGTACAGCACCACGGCCTGAGCTATAACTGCTCCCTTCCGCTGGCGTTTGACGGGTCTTGCTCTGGCATCCAGCACTTCTCCGCGATGCTCCGAGATGAGGTAGGTGGTCGCGCGGTTAACTTGCTTCCTAGTGAGACCGTTCAGGACATCTACGGGATTGTTGCTAAGAAAGTCAACGAGATTCTACAAGCAGACGCAATCAATGGGACCGATAACGAAGTAGTTACCGTGACCGATGAGAACACTGGTGAAATCTCTGAGAAAGTCAAGCTGGGCACTAAGGCACTGGCTGGTCAATGGCTGGCTCACGGTGTTACTCGCAGTGTGACTAAGCGTTCAGTCATGACGCTGGCTTACGGGTCCAAAGAGTTCGGCTTCCGTCAACAAGTGCTGGAAGATACCATTCAGCCAGCTATTGATTCCGGCAAGGGTCCGATGTTCACTCAGCCGAATCAGGCTGCTGGATACATGGCTAAGCTGATTTGGGAATCTGTGAGCGTGACGGTGGTAGCTGCGGTTGAAGCAATGAACTGGCTTAAGTCTGCTGCTAAGCTGCTGGCTGCTGAGGTCAAAGATAAGAAGACTGGAGAGATTCTTCGCAAGCGTTGCGCTGTGCATTGGGTAACTCCTGATGGTTTCCCTGTGTGGCAGGAATACAAGAAGCCTATTCAGACGCGCTTGAACCTGATGTTCCTCGGTCAGTTCCGCTTACAGCCTACCATTAACACCAACAAAGATAGCGAGATTGATGCACACAAACAGGAGTCTGGTATCGCTCCTAACTTTGTACACAGCCAAGACGGTAGCCACCTTCGTAAGACTGTAGTGTGGGCACACGAGAAGTACGGAATCGAATCTTTTGCACTGATTCACGACTCCTTCGGTACCATTCCGGCTGACGCTGCGAACCTGTTCAAAGCAGTGCGCGAAACTATGGTTGACACATATGAGTCTTGTGATGTACTGGCTGATTTCTACGACCAGTTCGCTGACCAGTTGCACGAGTCTCAATTGGACAAAATGCCAGCACTTCCGGCTAAAGGTAACTTGAACCTCCGTGACATCTTAGAGTCGGACTTCGCGTTCGCGTAACGCCAAATCAATACGACTCACTATAGAGGGACAAACTCAAGGTCATTCGCAAGAGTGGCC	T7 RNA聚合酶DNA編碼序列
34	MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFA	T7 RNA聚合酶胺基酸序列
35	GATGAGGTGCGCATTGTGGGGCAAACCGTTACACATAGACGCATACCTTGACAAGCGTCTACAAGGCTGATAGAGTCTTTTCTTACAGGTCATCATGAGGTGGCCTGAATAGGAACGATTTATTCACAATGAGGTAAGCAATGAACATCATCGAAAACATCGAAAAGAATGACTTCTCAGAAATCGAACTGGCTGCTATCCCGTTCAACACACTGGCTGACCACTACGGAAGCGCCTTGGCTAAAGAGCAGTTGGCTTTAGAACATGAGTCTTATGAGCTAGGCGAGCGCCGCTTCCTCAAGATGCTTGAGCGTCAAGCGAAAGCTGGTGAGATTGCAGACAACGCAGCCGCTAAGCCGTTACTCGCTACGCTTCTCCCTAAGTTAACCACACGTATCGTCGAGTGGCTCGAAGAGTACGCATCGAAGAAAGGCCGCAAGCCTAGCGCATACGCACCGCTCCAGTTACTCAAGCCGGAGGCCTCCGCGTTTATCACCCTGAAAGTTATCCTTGCGTCACTAACCAGTACGAACATGACAACCATTCAGGCCGCTGCTGGTATGCTGGGGAAAGCCATTGAGGACGAGGCACGATTTGGGCGCATCCGTGACCTAGAAGCGAAGCACTTCAAGAAGCACGTTGAGGAACAGCTTAACAAGCGCCACGGGCAAGTCTACAAGAAAGCATTTATGCAGGTGGTCGAGGCCGATATGATTGGTCGAGGTCTGCTTGGTGGCGAGGCGTGGTCTAGCTGGGATAAAGAAACCACGATGCACGTAGGGATTCGCCTGATTGAAATGCTGATTGAATCCACGGGTCTGGTGGAATTACAGCGCCACAACGCAGGTAACGCAGGCTCTGACCATGAGGCACTGCAACTGGCCCAAGAGTACGTGGACGTATTAGCGAAGCGTGCAGGCGCTCTGGCGGGTATCTCTCCGATGTTCCAGCCGTGTGTCGTACCGCCGAAACCTTGGGTAGCAATCACAGGGGGCGGCTATTGGGCTAACGGTCGCAGACCTTTGGCACTCGTTCGCACTCACTCTAAGAAGGGCTTGATGCGCTACGAAGACGTTTACATGCCAGAAGTCTACAAGGCTGTGAACCTCGCGCAAAACACCGCATGGAAAATCAACAAGAAAGTTCTTGCTGTTGTCAATGAGATTGTTAACTGGAAGAATTGCCCGGTAGCAGACATTCCATCGCTGGAGCGCCAAGAGTTACCGCCTAAGCCTGACGACATTGACACCAACGAGGCAGCGCTCAAGGAGTGGAAGAAAGCCGCTGCTGGTATCTATCGCTTGGACAAGGCACGAGTGTCTCGCCGTATCAGCTTAGAGTTCATGCTGGAGCAGGCCAACAAGTTCGCAAGTAAGAAAGCAATCTGGTTCCCTTACAACATGGACTGGCGCGGTCGTGTGTACGCTGTGCCGATGTTCAACCCGCAAGGCAACGACATGACGAAAGGTCTGCTGACCCTTGCTAAAGGCAAGCCAATCGGTGAGGAAGGTTTCTACTGGCTGAAAATCCACGGTGCGAACTGTGCGGGTGTTGATAAGGTTCCATTCCCGGAGCGCATCGCGTTCATTGAGAAGCACGTAGACGACATTCTGGCTTGCGCTAAAGACCCAATCAATAACACTTGGTGGGCTGAGCAGGATTCACCGTTCTGTTTCCTCGCGTTTTGCTTCGAGTATGCAGGCGTTACGCACCACGGTCTGAGCTACAATTGCTCTCTGCCGCTGGCGTTCGACGGGTCTTGCTCTGGTATCCAGCACTTCTCCGCGATGCTCCGCGATGAGGTAGGCGGTCGTGCGGTTAACCTGCTGCCAAGCGAAACCGTGCAGGACATTTACGGCATCGTTGCACAGAAAGTAAACGAGATTCTCAAACAGGATGCAATCAACGGCACGCCTAACGAGATGATTACCGTGACCGACAAGGACACCGGGGAAATCTCAGAGAAGCTCAAACTTGGAACCTCAACGCTGGCGCAACAGTGGCTGGCATATGGTGTAACCCGTAGCGTAACTAAACGTTCGGTCATGACGCTGGCTTACGGTTCCAAGGAGTTCGGCTTTCGTCAACAGGTATTGGATGACACCATTCAGCCTGCAATTGACAGCGGTAAGGGCTTGATGTTCACCCAACCGAACCAAGCGGCTGGCTATATGGCTAAGCTGATTTGGGATGCGGTAAGCGTGACCGTAGTTGCAGCGGTTGAGGCGATGAACTGGCTCAAATCTGCCGCTAAGCTGCTGGCTGCTGAGGTCAAGGACAAGAAGACCAAGGAGATTCTGCGCCACCGTTGCGCGGTTCACTGGACTACGCCGGACGGCTTCCCGGTCTGGCAGGAATACCGCAAGCCACTCCAGAAGCGTCTCGATATGATTTTCTTAGGGCAATTCCGTCTGCAACCGACGATTAATACCCTCAAGGATTCAGGCATTGACGCACACAAGCAGGAGTCTGGCATCGCTCCTAACTTTGTTCACTCACAGGACGGTAGCCACCTCCGCATGACAGTCGTTTATGCTCACGAGAAGTATGGCATTGAGTCCTTTGCGCTCATCCATGACAGCTTTGGGACTATCCCGGCAGACGCTGGTAAGCTCTTTAAGGCTGTGCGTGAAACGATGGTTATCACCTATGAGAACAACGATGTGCTGGCAGACTTCTACTCTCAGTTTGCCGACCAGCTACACGAGACCCAACTGGACAAGATGCCTCCGCTTCCGAAGAAAGGAAACCTGAACCTGCAAGACATTCTCAAGTCTGACTTTGCCTTTGCATAACAAGCACTTAGCATTAACCCTCACTAACGGGAGACTACTTAAGGTCTCCCACTTTAAGACACTTTAGGTACTAAGAGATTAAATTTATGATTAACATTAAG	T3 RNA聚合酶DNA編碼序列
36	MNIIENIEKNDFSEIELAAIPFNTLADHYGSALAKEQLALEHESYELGERRFLKMLERQAKAGEIADNAAAKPLLATLLPKLTTRIVEWLEEYASKKGRKPSAYAPLQLLKPEASAFITLKVILASLTSTNMTTIQAAAGMLGKAIEDEARFGRIRDLEAKHFKKHVEEQLNKRHGQVYKKAFMQVVEADMIGRGLLGGEAWSSWDKETTMHVGIRLIEMLIESTGLVELQRHNAGNAGSDHEALQLAQEYVDVLAKRAGALAGISPMFQPCVVPPKPWVAITGGGYWANGRRPLALVRTHSKKGLMRYEDVYMPEVYKAVNLAQNTAWKINKKVLAVVNEIVNWKNCPVADIPSLERQELPPKPDDIDTNEAALKEWKKAAAGIYRLDKARVSRRISLEFMLEQANKFASKKAIWFPYNMDWRGRVYAVPMFNPQGNDMTKGLLTLAKGKPIGEEGFYWLKIHGANCAGVDKVPFPERIAFIEKHVDDILACAKDPINNTWWAEQDSPFCFLAFCFEYAGVTHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAQKVNEILKQDAINGTPNEMITVTDKDTGEISEKLKLGTSTLAQQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLDDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWDAVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTKEILRHRCAVHWTTPDGFPVWQEYRKPLQKRLDMIFLGQFRLQPTINTLKDSGIDAHKQESGIAPNFVHSQDGSHLRMTVVYAHEKYGIESFALIHDSFGTIPADAGKLFKAVRETMVITYENNDVLADFYSQFADQLHETQLDKMPPLPKKGNLNLQDILKSDFAFA	T3 RNA聚合酶胺基酸序列
37	GCGCTCAATTAAGTTTTCTAGTACCGCATGAGGATACAAGATGCAAGATTTACACGCTATCCAGCTTCAATTAGAAGAAGAGATGTTTAATGGTGGCATTCGTCGCTTCGAAGCAGATCAACAACGCCAGATTGCAGCAGGTAGCGAGAGCGACACAGCATGGAACCGCCGCCTGTTGTCAGAACTTATTGCACCTATGGCTGAAGGCATTCAGGCTTATAAAGAAGAGTACGAAGGTAAGAAAGGTCGTGCACCTCGCGCATTGGCTTTCTTACAATGTGTAGAAAATGAAGTTGCAGCATACATCACTATGAAAGTTGTTATGGATATGCTGAATACGGATGCTACCCTTCAGGCTATTGCAATGAGTGTAGCAGAACGCATTGAAGACCAAGTGCGCTTTTCTAAGCTAGAAGGTCACGCCGCTAAATACTTTGAGAAGGTTAAGAAGTCACTCAAGGCTAGCCGTACTAAGTCATATCGTCACGCTCATAACGTAGCTGTAGTTGCTGAAAAATCAGTTGCAGAAAAGGACGCGGACTTTGACCGTTGGGAGGCGTGGCCAAAAGAAACTCAATTGCAGATTGGTACTACCTTGCTTGAAATCTTAGAAGGTAGCGTTTTCTATAATGGTGAACCTGTATTTATGCGTGCTATGCGCACTTATGGCGGAAAGACTATTTACTACTTACAAACTTCTGAAAGTGTAGGCCAGTGGATTAGCGCATTCAAAGAGCACGTAGCGCAATTAAGCCCAGCTTATGCCCCTTGCGTAATCCCTCCTCGTCCTTGGAGAACTCCATTTAATGGAGGGTTCCATACTGAGAAGGTAGCTAGCCGTATCCGTCTTGTAAAAGGTAACCGTGAGCATGTACGCAAGTTGACTCAAAAGCAAATGCCAAAGGTTTATAAGGCTATCAACGCATTACAAAATACACAATGGCAAATCAACAAGGATGTATTAGCAGTTATTGAAGAAGTAATCCGCTTAGACCTTGGTTATGGTGTACCTTCCTTCAAGCCACTGATTGACAAGGAGAACAAGCCAGCTAACCCGGTACCTGTTGAATTCCAACACCTGCGCGGTCGTGAACTGAAAGAGATGCTATCACCTGAGCAGTGGCAACAATTCATTAACTGGAAAGGCGAATGCGCGCGCCTATATACCGCAGAAACTAAGCGCGGTTCAAAGTCCGCCGCCGTTGTTCGCATGGTAGGACAGGCCCGTAAATATAGCGCCTTTGAATCCATTTACTTCGTGTACGCAATGGATAGCCGCAGCCGTGTCTATGTGCAATCTAGCACGCTCTCTCCGCAGTCTAACGACTTAGGTAAGGCATTACTCCGCTTTACCGAGGGACGCCCTGTGAATGGCGTAGAAGCGCTTAAATGGTTCTGCATCAATGGTGCTAACCTTTGGGGATGGGACAAGAAAACTTTTGATGTGCGCGTGTCTAACGTATTAGATGAGGAATTCCAAGATATGTGTCGAGACATCGCCGCAGACCCTCTCACATTCACCCAATGGGCTAAAGCTGATGCACCTTATGAATTCCTCGCTTGGTGCTTTGAGTATGCTCAATACCTTGATTTGGTGGATGAAGGAAGGGCCGACGAATTCCGCACTCACCTACCAGTACATCAGGACGGGTCTTGTTCAGGCATTCAGCACTATAGTGCTATGCTTCGCGACGAAGTAGGGGCCAAAGCTGTTAACCTGAAACCCTCCGATGCACCGCAGGATATCTATGGGGCGGTGGCGCAAGTGGTTATCAAGAAGAATGCGCTATATATGGATGCGGACGATGCAACCACGTTTACTTCTGGTAGCGTCACGCTGTCCGGTACAGAACTGCGAGCAATGGCTAGCGCATGGGATAGTATTGGTATTACCCGTAGCTTAACCAAAAAGCCCGTGATGACCTTGCCATATGGTTCTACTCGCTTAACTTGCCGTGAATCTGTGATTGATTACATCGTAGACTTAGAGGAAAAAGAGGCGCAGAAGGCAGTAGCAGAAGGGCGGACGGCAAACAAGGTACATCCTTTTGAAGACGATCGTCAAGATTACTTGACTCCGGGCGCAGCTTACAACTACATGACGGCACTAATCTGGCCTTCTATTTCTGAAGTAGTTAAGGCACCGATAGTAGCTATGAAGATGATACGCCAGCTTGCACGCTTTGCAGCGAAACGTAATGAAGGCCTGATGTACACCCTGCCTACTGGCTTCATCTTAGAACAGAAGATCATGGCAACCGAGATGCTACGCGTGCGTACCTGTCTGATGGGTGATATCAAGATGTCCCTTCAGGTTGAAACGGATATCGTAGATGAAGCCGCTATGATGGGAGCAGCAGCACCTAATTTCGTACACGGTCATGACGCAAGTCACCTTATCCTTACCGTATGTGAATTGGTAGACAAGGGCGTAACTAGTATCGCTGTAATCCACGACTCTTTTGGTACTCATGCAGACAACACCCTCACTCTTAGAGTGGCACTTAAAGGGCAGATGGTTGCAATGTATATTGATGGTAATGCGCTTCAGAAACTACTGGAGGAGCATGAAGTGCGCTGGATGGTTGATACAGGTATCGAAGTACCTGAGCAAGGGGAGTTCGACCTTAACGAAATCATGGATTCTGAATACGTATTTGCCTAATAGAACAATAAATATACAGGTCAGCCTTCGGGCTGGCCTTTTCTTTTAACTATTACCTGTAACATTTAATTAACAAGTCCAACGTGTTGGACAC	SP6 RNA聚合酶DNA編碼序列
38	MQDLHAIQLQLEEEMFNGGIRRFEADQQRQIAAGSESDTAWNRRLLSELIAPMAEGIQAYKEEYEGKKGRAPRALAFLQCVENEVAAYITMKVVMDMLNTDATLQAIAMSVAERIEDQVRFSKLEGHAAKYFEKVKKSLKASRTKSYRHAHNVAVVAEKSVAEKDADFDRWEAWPKETQLQIGTTLLEILEGSVFYNGEPVFMRAMRTYGGKTIYYLQTSESVGQWISAFKEHVAQLSPAYAPCVIPPRPWRTPFNGGFHTEKVASRIRLVKGNREHVRKLTQKQMPKVYKAINALQNTQWQINKDVLAVIEEVIRLDLGYGVPSFKPLIDKENKPANPVPVEFQHLRGRELKEMLSPEQWQQFINWKGECARLYTAETKRGSKSAAVVRMVGQARKYSAFESIYFVYAMDSRSRVYVQSSTLSPQSNDLGKALLRFTEGRPVNGVEALKWFCINGANLWGWDKKTFDVRVSNVLDEEFQDMCRDIAADPLTFTQWAKADAPYEFLAWCFEYAQYLDLVDEGRADEFRTHLPVHQDGSCSGIQHYSAMLRDEVGAKAVNLKPSDAPQDIYGAVAQVVIKKNALYMDADDATTFTSGSVTLSGTELRAMASAWDSIGITRSLTKKPVMTLPYGSTRLTCRESVIDYIVDLEEKEAQKAVAEGRTANKVHPFEDDRQDYLTPGAAYNYMTALIWPSISEVVKAPIVAMKMIRQLARFAAKRNEGLMYTLPTGFILEQKIMATEMLRVRTCLMGDIKMSLQVETDIVDEAAMMGAAAPNFVHGHDASHLILTVCELVDKGVTSIAVIHDSFGTHADNTLTLRVALKGQMVAMYIDGNALQKLLEEHEVRWMVDTGIEVPEQGEFDLNEIMDSEYVFA	SP6 RNA聚合酶胺基酸序列
39	ACGAGGTGTATCTTAGGTGTCTCCGAACGGTGAGGCACCCATAGATAAACTTTATCCACAAAGAGGCACACAATGAACGCATTAAACATTGGACGTAATGACTTCTCCGAGATTGAACTTGCTGCTATTCCGTACAACATCCTGAGCGAGCACTACGGGGACCAAGCGGCACGTGAGCAGTTAGCACTGGAGCATGAGGCATACGAGCTTGGCAGACAACGTTTCCTGAAGATGTTAGAACGTCAGGTGAAAGCTGGTGAGTTCGCTGACAACGCGGCCGCTAAGCCGCTGGTCTTAACGTTGCACCCACAGCTGACCAAGCGCATTGACGACTGGAAGGAGGAGCAAGCAAACGCTCGCGGTAAGAAGCCTCGCGCATACTACCCGATTAAGCACGGCGTCGCCTCAGAGTTAGCTGTTAGCATGGGCGCTGAGGTGCTAAAAGAGAAGCGCGGAGTGTCCAGTGAGGCAATCGCACTGCTGACCATTAAGGTCGTCTTGGGGAACGCTCACAGACCGCTCAAAGGCCACAATCCAGCAGTATCCTCTCAGTTAGGCAAGGCTCTTGAGGATGAGGCCCGCTTCGGTCGTATCCGTGAGCAGGAAGCCGCATACTTCAAGAAGAACGTAGCGGACCAGCTGGACAAGCGAGTAGGCCACGTGTACAAGAAGGCTTTCATGCAGGTAGTCGAGGCCGATATGATATCCAAAGGGATGCTGGGCGGCGACAACTGGGCGAGCTGGAAAACTGACGAGCAGATGCACGTAGGGACCAAGCTGCTGGAGCTACTCATTGAGGGAACTGGTCTGGTGGAAATGACCAAGAACAAGATGGCCGATGGCTCCGATGATGTAACCAGTATGCAGATGGTCCAGCTGGCTCCGGCCTTTGTGGAACTCCTGAGCAAACGGGCAGGCGCACTCGCGGGTATCAGCCCGATGCACCAGCCGTGCGTAGTCCCTCCGAAACCTTGGGTGGAGACCGTAGGCGGTGGCTACTGGTCAGTCGGTCGCCGTCCGCTGGCACTGGTGCGTACCCACTCCAAGAAGGCGCTGCGCCGCTACGCTGACGTGCACATGCCAGAGGTATACAAGGCGGTAAACCTCGCGCAAAACACGCCGTGGAAGGTGAACAAGAAGGTGCTGGCGGTAGTCAACGAGATTGTCAACTGGAAGCACTGCCCGGTAGGTGACGTCCCAGCGATTGAACGCGAAGAGTTACCGCCGCGCCCGGACGATATTGACACCAACGAGGTGGCACGTAAGGCATGGCGCAAGGAGGCCGCAGCGGTCTACCGTAAGGACAAGGCCCGCCAGTCTCGCCGTTGTCGATGTGAGTTCATGGTCGCACAGGCTAACAAGTTCGCTAACCACAAGGCCATTTGGTTCCCGTACAACATGGACTGGCGCGGGCGTGTGTACGCTGTGAGCATGTTCAACCCACAGGGTAACGATATGACCAAGGGGAGTCTGACGCTGGCCAAGGGTAAGCCAATTGGTCTCGACGGGTTCTACTGGCTGAAGATTCACGGCGCAAACTGTGCAGGTGTCGACAAGGTTCCCTTCCCTGAGCGCATCAAGTTCATCGAAGAGAACGAGGGCAACATTCTGGCGAGCGCAGCGGACCCGCTGAATAACACTTGGTGGACCCAGCAAGATTCGCCGTTCTGTTTCTTAGCGTTCTGCTTCGAGTACGCAGGTGTTAAGCATCACGGCCTGAATTACAACTGCTCGCTGCCGCTGGCGTTCGATGGGTCCTGCTCTGGGATTCAGCACTTCAGCGCGATGCTCCGAGATTCCATCGGTGGTCGTGCGGTTAACCTGCTGCCTTCTGATACCGTGCAGGATATCTACAAGATTGTGGCCGACAAGGTGAACGAAGTGCTCCACCAGCACGCCGTCAACGGGTCTCAGACCGTGGTCGAGCAGATTGCTGACAAAGAGACTGGCGAGTTTCACGAGAAGGTGACTCTGGGCGAGTCCGTACTGGCTGCGCAGTGGTTGCAATATGGTGTGACCCGCAAGGTGACTAAGCGTTCGGTCATGACGCTGGCATACGGTTCCAAAGAGTCGTTGGTCCGCCAGCAGGTTCTTGAGGACACCATTCAGCCTGCTATTGACAACGGCGAGGGCCTGATGTTTACGCACCCTAACCAAGCAGCTGGCTACATGGCTAAGCTGATTTGGGACGCTGTGACCGTGACCGTAGTGGCCGCTGTCGAGGCAATGAACTGGCTGAAGTCTGCCGCTAAGCTGCTGGCTGCTGAAGTCAAGGACAAGAAGACCAAAGAGGTGCTGCGTAAGCGCTGCGCAATCCACTGGGTAACACCCGATGGCTTCCCGGTGTGGCAGGAGTACCGCAAGCAGAACCAAGCGCGCCTGAAGCTGGTCTTCCTCGGGCAGGCCAACGTCAAGATGACGTATAACACTGGGAAGGACTCCGAGATTGATGCCCACAAGCAGGAATCCGGCATCGCTCCTAACTTTGTTCACTCACAGGATGGCAGTCACCTGCGCATGACTGTAGTACACGCCAACGAGGTCTACGGGATTGACTCCTTCGCACTCATTCACGACTCCTCTGGGACCATTCCGGCTGACGCTGGGAATCTCTTTAAGGCAGTCCGCGAGACGATGGTCAAGACCTACGAGGACAACGATGTAATTGCAGACTTCTACGACCAGTTTGCCGACCAGCTGCACGAGTCTCAACTGGACAAGATGCCTGCGGTTCCGGCCAAAGGTGACCTGAATCTGCGCGATATCTTGGAGTCTGACTTCGCGTTTGCGTAAGGTCTCAGGCAATTAGGGCACACTATAGGGAACCTTCGAATGACCGAGGG	K11 RNA聚合酶DNA編碼序列
40	MNALNIGRNDFSEIELAAIPYNILSEHYGDQAAREQLALEHEAYELGRQRFLKMLERQVKAGEFADNAAAKPLVLTLHPQLTKRIDDWKEEQANARGKKPRAYYPIKHGVASELAVSMGAEVLKEKRGVSSEAIALLTIKVVLGNAHRPLKGHNPAVSSQLGKALEDEARFGRIREQEAAYFKKNVADQLDKRVGHVYKKAFMQVVEADMISKGMLGGDNWASWKTDEQMHVGTKLLELLIEGTGLVEMTKNKMADGSDDVTSMQMVQLAPAFVELLSKRAGALAGISPMHQPCVVPPKPWVETVGGGYWSVGRRPLALVRTHSKKALRRYADVHMPEVYKAVNLAQNTPWKVNKKVLAVVNEIVNWKHCPVGDVPAIEREELPPRPDDIDTNEVARKAWRKEAAAVYRKDKARQSRRCRCEFMVAQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGSLTLAKGKPIGLDGFYWLKIHGANCAGVDKVPFPERIKFIEENEGNILASAADPLNNTWWTQQDSPFCFLAFCFEYAGVKHHGLNYNCSLPLAFDGSCSGIQHFSAMLRDSIGGRAVNLLPSDTVQDIYKIVADKVNEVLHQHAVNGSQTVVEQIADKETGEFHEKVTLGESVLAAQWLQYGVTRKVTKRSVMTLAYGSKESLVRQQVLEDTIQPAIDNGEGLMFTHPNQAAGYMAKLIWDAVTVTVVAAVEAMNWLKSAAKLLAAEVKDKKTKEVLRKRCAIHWVTPDGFPVWQEYRKQNQARLKLVFLGQANVKMTYNTGKDSEIDAHKQESGIAPNFVHSQDGSHLRMTVVHANEVYGIDSFALIHDSSGTIPADAGNLFKAVRETMVKTYEDNDVIADFYDQFADQLHESQLDKMPAVPAKGDLNLRDILESDFAFA	K11 RNA聚合酶胺基酸序列
41	MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMAEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFAG	T7 RNA聚合酶變異體1胺基酸序列
42	MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMAEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVWVIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFAG	T7 RNA聚合酶變異體2胺基酸序列
43	MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVWVIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFA	T7 RNA聚合酶變異體3胺基酸序列
44	MYRYLSIAAVVLSAAFSGPALAEGINSFSQAKAAAVKVHADAPGTFYCGCKINWQGKKGVVDLQSCGYQVRKNENRASRVEWEHVVPAWQFGHQRQCWQDGGRKNCAKDPVYRKMESDMHNLQPSVGEVNGDRGNFMYSQWNGGEGQYGQCAMKVDFKEKAAEPPARARGAIARTYFYMRDQYNLTLSRQQTQLFNAWNKMYPVTDWECERDERIAKVQGNHNPYVQRACQARKS	EndA胺基酸序列
45	MAIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGRIVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPDTGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAGNLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGSETRVKVVKNKIAAPFKQAEFQILYGEGINFYGELVDLGVKEKLIEKAGAWYSYKGEKIGQGKANATAWLKDNPETAKEIEKKVRELLLSNPNSTPDFSVDDSEGVAETNEDF	RecA胺基酸序列
46	MTVPTYDKFIEPVLRYLATKPEGAAARDVHEAAADALGLDDSQRAKVITSGQLVYKNRAGWAHDRLKRAGLSQSLSRGKWCLTPAGFDWVASHPQPMTEQETNHLAFAFVNVKLKSRPDAVDLDPKADSPDHEELAKSSPDDRLDQALKELRDAVADEVLENLLQVSPSRFEVIVLDVLHRLGYGGHRDDLQRVGGTGDGGIDGVISLDKLGLEKVYVQAKRWQNTVGRPELQAFYGALAGQKAKRGVFITTSGFTSQARDFAQSVEGMVLVDGERLVHLMIENEVGVSSRLLKVPKLDMDYFE	Mrr胺基酸序列
47	agagttgggcaacggatgtgctggtggaggtgatcgcctcctgatgatgagccgctcccgatgtggtgtcgggagcggtattttctataaaacttaccgc tcactcaaaatagtccatatccagtttcggcaccttcaacaaacgtgaagaaacccctacttcgttttcgatcattaagtgcaccaggcgttccccatcaaccaacaccataccctcgacggattgggcaaagtcacgcgcctgagaagtaaatccagaagtggtaataaacaccccacgtttcgctttttgcccagccagtgcgccgtaaaatgcctgtaattctggcctgcctacagtattctgccaacgttttgcctgaacataaactttctccaggccaagtttatcaagcgatatcacaccatcgatgccaccatctccagtaccgccaacacgctgcaaatcatcacggtggccgccataccccaggcgatgcaaaacatccagaacaatgacttcaaagcgcgaaggagaaacctgcaataagttttccagaacctcatcagccaccgcatcacgaagctcttttagcgcctgatctaaccgatcgtccgggctgctctttgcaagttcttcatgatcgggagagtcggctttcggatctaaatcgacggcatccggccgtgacttaagtttgacattcacaaaagcgaaggccagatggttcgtctcctgctccgtcattggctggggatgagacgcaacccagtcaaaacccgcaggagtcaggcaccatttgccacgcgacaaactttgcgacaacccggcacgttttaaacggtcatgcgcccagcctgcacgatttttataaacaagttgtccgctggtaatgactttcgctcgctggctgtcatccagtcctaatgcatccgcggcagcctcatgaacatcacgcgcggctgcaccttccggttttgttgccagataacgcagaacaggttcaataaatttgtcataggtaggaaccgtcatagtacatccttgcagaatcaggtagatgtttttcggctactatagcactacaaaaatagacgaacacgttagaaatgagtcagttgctgtgaccgtggtcattgcccggaaaggtacagaaagctaagatgagatgttatgggccttaaatatttggacaggcccgcacagcaatggattaataacaatgatgaataaatccaattttgaattcctgaagggcgtcaacgacttcacttatgccatcgcctgtgcggcggaaaataactacccggatgatcccaacacgacgctgattaaaatgcgtatgtttggcgaagccacagcgaaacatcttggtctgttactcaacatccccccttgtgagaatcaacacgatctcctgcgtgaactcggcaaaatcgcctttgttgatgacaacatcctctctgtatttcacaaattacgccgcattggtaaccaggcggtgcacgaatatcataacgatctcaacgatgcccagatgtgcctgcgactcgggttccgcctggctgtctggtactaccgtctggtcactaaagattatgacttcccggtgccggtgtttgtgttgccggaacgtggtgaaaacctctatcaccaggaagtgctgacgctaaaacaacagcttgaacagcaggtgcgagaaaaagcgcagactcaggcagaagtcgaagcgcaacagcagaagctggttgccctgaacggctatatcgccattctggaaggcaaacagcaggaaaccgaagcgcaaacccaggctcgccttgcggcactggaagcacagctcgccgagaagaacgcggaactggcaaaacagaccgaacaggaacgtaaggcttaccacaaagaaattaccgatcaggccatcaagcgcacactcaaccttagcgaagaagagagtcgcttcctgattgatgcgcaactgcgtaaagcaggctggcaggccgacagcaaaaccctgcgcttctccaaaggcgcacgtccggaacccggcgtcaataaagccattgccgaatggccgaccggaaaagatgaaacgggtaatcagggctttgcggattatgtgctgtttgtcggcctcaaacccatcgcggtggtagaggcgaaacgtaacaatatcgacgttcccgccaggctcaatgagtcgtatcgctacagtaaatgtttcgataatggcttcctgcgggaaaccttgcttgagcactactcaccggatgaagtgcatgaagcagtgccagagtatgaaaccagctggcaggacaccagcggcaaacaacggtttaaaatccccttctgctactcgaccaacgggcgcgaataccgcgcaacaatgaagaccaaaagcggcatctggtatcgcgacgtgcgtgatacccgcaatatgtcgaaagccttacccgagtggcaccgcccggaagagctgctggaaatgctcggcagcgaaccgcaaaaacagaatcagtggtttgccgataaccctggcatgagcgagctgggcctgcgttattatcaggaagatgccgtccgcgcggttgaaaaggcaatcgtcaaggggcaacaagagatcctgctggcgatggcgaccggtaccggtaaaacccgtacggcaatcgccatgatgttccgcctgatccagtcccagcgttttaaacgcattctcttccttgtcgaccgccgttctcttggcgaacaggcgctgggcgcgtttgaagatacgcgtattaacggcgacaccttcaacagcattttcgacattaaagggctgacggataaattcccggaagacagcaccaaaattcacgttgccaccgtacagtcgctggtgaaacgcaccctgcaatcagatgaaccgatgccggtggcccgttacgactgtatcgtcgttgacgaagcgcatcgcggctatattctcgataaagagcagaccgaaggcgaactgcagttccgcagccagctggattacgtctctgcctaccgtcgcattctcgatcacttcgatgcggtaaaaatcgctctcaccgccaccccggcgctacatactgtgcagattttcggcgagccggtttaccgttatacctaccgtaccgcggttatcgacggttttctgatcgaccaggatccgcctattcagatcatcacccgcaacgcgcaggagggggtttatctctccaaaggcgagcaggtagagcgcatcagcccgcagggagaagtgatcaatgacaccctggaagacgatcaggattttgaagtcgccgactttaaccgtggcctggtgatcccggcgtttaaccgcgccgtctgtaacgaactcaccaattatcttgacccgaccggatcgcaaaaaacgctggtcttctgcgtcaccaatgcccatgccgatatggtggtggaagagctgcgtgccgcgttcaagaaaaagtatccgcaactggagcacgacgcgatcatcaagatcaccggtgatgccgataaagacgcgcgcaaagtgcagaccatgatcacccgcttcaataaagagcggctgcccaatatcgtggtaaccgtcgacctgctgacgaccggcgtcgatattccgtcgatctgtaatatcgtgttcctgcgtaaagtacgcagccgcattctgtacgaacagatgaaaggccgcgccacgcgcttatgcccggaggtgaataaaaccagctttaagatttttgactgtgtcgatatctacagcacgctggagagcgtcgacaccatgcgtccggtggtggtgcgcccgaaggtggaactgcaaacgctggtcaatgaaattaccgattcagaaacctataaaatcaccgaagcggatggccgcagttttgccgagcacagccatgaacaactggtggcgaagctccagcgtatcatcggtctggccacgtttaaccgtgaccgcagcgaaacgatagataaacaggtgcgtcgtctggatgagctatgccaggacgcggcgggcgtgaactttaacggcttcgcctcgcgcctgcgggaaaaagggccgcactggagcgccgaagtctttaacaaactgcctggctttatcgcccgtctggaaaagctgaaaacggacatcaacaacctgaatgatgcgccgatcttcctcgatatcgacgatgaagtggtgagtgtaaaatcgctgtacggtgattacgacacgccgcaggatttcctcgaagcctttgactcgctggtgcaacgttccccgaacgcgcaaccggcattgcaggcagttattaatcgcccgcgcgatctcacccgtaaagggctggtcgagctacaggagtggtttgaccgccagcactttgaggaatcttccctgcgcaaagcatggaaagagacgcgcaatgaagatatcgccgcccggctgattggtcatattcgccgcgctgcggtgggcgatgcgctgaaaccgtttgaggaacgtgtcgatcacgcgctgacgcgcattaagggcgaaaacgactggagcagcgagcaattaagctggctcgatcgtttagcgcaggcgctgaaagagaaagtggtgctcgacgacgatgtcttcaaaaccggcaacttccaccgtcgcggcgggaaggcgatgctgcaaagaacctttgacgataatctcgataccctgctgggcaaattcagcgattatatctgggacgagctggcctgacacgtatacacttcatccttcaggctgcctctgcgttggctgcgctcgttcaccccggtcacgtacttctgtacgctcccggggattcactcacttgccgccttgatgcaacctgaatgattttgtgtatattaccctcggcaatttcttcttctgcggctcgatgaatttgggccgctgcttaatttacggaactcacaatgaacaataacgatctggtcgcgaagctgtggaagctgtgcgacaacctgcgcgatggcggcgtttcctatcaaaactacgtcaatgaactcgcctcgctgctgtttttgaaaatgtgtaaagagaccggtcaggaagcggaatacctgccggaaggttaccgctgggatgacctgaaatcccgcatcggccaggagcagttgcagttctaccgaaaaatgctcgtgcatttaggcgaagatgacaaaaagctggtacaggcagtttttcataatgttagtaccaccatcaccgagccgaaacaaataaccgcactggtcagcaatatggattcgctggactggtacaacggcgcgcacggtaagtcgcgcgatgacttcggcgatatgtacgaagggctgttgcagaagaacgcgaatgaaaccaagtctggtgcaggccagtacttcaccccgcgtccgctgattaaaaccattattcatctgctgaaaccgcagccgcgtgaagtggtgcaggacccggcggcaggtacggcgggctttttgattgaagccgaccgctatgttaagtcgcaaaccaatgatctggacgaccttgatggcgacacgcaggatttccagatccaccgcgcgtttatcggcctcgaactggtgcccggcacccgtcgtctggcactgatgaactgcctgctgcacgatattgaaggcaacctcgaccacggcggcgcaatccgtctgggcaacactctgggtagcgacggtgaaaacctgccgaaggcgcatattgtcgccactaacccgccgtttggcagcgccgcaggcaccaacattacccgcacctttgttcacccgaccagcaacaaacagttgtgctttatgcagcatattatcgaaacgctgcatcccggcggtcgtgcggcggtggtggtgccggataacgtgctgtttgaaggcggcaaaggcaccgacattcgtcgtgacctgatggataagtgtcatctgcacaccattctgcgtctgccgaccggtattttttacgctcagggcgtgaagaccaacgtgctgttctttaccaaagggacggtggcgaacccgaatcaggataagaactgtaccgatgatgtgtgggtgtatgacctgcgtaccaatatgccgagtttcggcaagcgcacaccgtttaccgacgagcatttgcagccgtttgagcgcgtgtatggcgaagacccgcacggtttaagcccgcgcactgaaggtgaatggagttttaacgccgaagagacggaagttgccgacagcgaagagaacaaaaacaccgaccagcatcttgctaccagccgctggcgcaagttcagccgtgagtggatccgcaccgcaaaatccgattcgctggatatctcctggctgaaagataaagacagtattgatgccgacagcctgccggagccggatgtattagcggcagaagcgatgggcgaactggtacaggcgctgtctgaactggatgcgctgatgcgtgaactgggggcgagcgatgaggccgatttgcagcgtcagttgctggaagaagcgtttggtggggtgaaggaatgagtgcggggaaattgccggaggggtgggttatcgccccagtatctacggtcacaactctaatccgaggagtaacgtataaaaaagagcaggcaataaattatctaaaagatgattatttgcctcttatccgtgcgaacaatattcagaatggcaagtttgatactacggacttggtttttgttcctaaaaatcttgttaaagaaagtcaaaaaatatctcctgaagatattgttattgcaatgtcatcagggagcaaatccgtagttggtaaatccgcacatcagcatctaccatttgaatgtagtttcggcgcattttgcggtgtattacgtcctgaaaaacttatattttctggttttattgctcatttcacaaaatcttctctttatcgaaacaaaatttcatcactttctgctggtgcaaatattaataatattaagccggcaagctttgatttgataaatataccaatcccaccacttgccgaacaaaaaatcatcgctgaaaaactcgatacgctgctggcgcaggtagacagcaccaaagcacgttttgagcaaatcccacaaatcctgaaacgttttcgtcaagcggtattggggggcgcagttaatggaaaattgacagaaaaatggcgtaattttgagccgcaacattctgtatttaagaagttaaattttgaatctatcttaactgaattacgtaatggtctttcatcaaagccaaatgaaagtggtgttggtcatccaatactacgcattagttctgtacgtgctggccatgtagatcaaaacgatattcggtttctagaatgttcagaaagtgaactaaaccgccacaaattacaagatggagatcttttatttactcgctataacggaagtttagaatttgttggtgtttgtgggttattgaaaaaattacaacatcaaaatttgctatatcctgataaacttattcgagctcgattaaccaaagatgctttaccagaatatatcgaaatatttttttcatccccctcagcacgaaatgcaatgatgaactgcgtgaaaacaacttctggtcaaaaaggtatttcaggaaaagatatcaaatcccaagttgttttattacctccagtaaaagaacaagccgaaatcgttcgccgcgtcgagcaactcttcgcctacgccgacaccatagaaaaacaggtcaacaacgccttagcccgcgtcaacaacctgacgcaatccatcctggcaaaagcgttccgtggtgaacttaccgcccagtggcgggccgaaaacccggatttgatcagcggagaaaacagcgccgccgcgttgctggaaaaaatcaaagctgaacgcgcagctagcgggggtaaaaaagcctcacgtaaaaaatcctgaacattattttctggcgcacctttccggtgcgctttttattatttcacgccaatcataacccacataaatatatttaaatcattccagaaattgcccattttattctatttttagctggactttccccatatttactgatgatatatacaggtatttagcgcggtgcggatgtgcgccaacacacccgcatcgctaatcacaatcactattcctggagaatagcagttatgactgacacgcattctattgcacaaccgttcgaagcagaagtctccccggcaaataaccgtcatgtcaccgtcggttatgcgagtcgctacccggattacagccgtattcccgccatcaccctgaaaggtcagtggctggaagccgccggttttgccactggcacggcggtagatgtcaaagtgatggaaggctgtattgtcctcaccgcccaaccacccgccgccgaggagagcgaactgatgcagtcgctacgccaggtgtgcaaactgtcggcgcgtaaacaaaagcaggtgcaggcgtttattggagtgattgccggtaaacagaaagtcgcgtaacagcgtttactcccggttaaccaccgggagccttccactgactcaatagaaactttccccctcagtaaatatttaccagtctgattttgcagtaaaaatctattgtttcagtacgttgcgaaagcgataatagaggcttagcaatgaggaaggcatatcttatggaatctattcaaccctggattgaaaaatttattaagcaagcacagcaacaacgttcgcaatccactaaagattatccaacgtcttaccgtaacctgcgagtaaaattgagtttcggttatggtaattttacgtctattccctggtttgcatttcttggagaaggtcaggaagcttctaacggtatatatcccgttattctctattataaagattttgatgagttggttttggcttatggtataagcgacacgaatgaaccacatgcccaatggcagttctcttcagacatacctaaaacaatcgcagagtattttcaggcaacttcgggtgtatatcctaaaaaatacggacagtcctattacgcctgttcccaaaaagtctcacagggtattgattacacccgatttgcctctatgctggacaacataatcaacgactataaattaatatttaattctggcaagagtgttattccacctatgtcaaaaactgaatcatactgtctggaagatgcgttaaatgatttgtttatccctgaaaccacaatagagacgatactcaaacgattaaccatcaaaaaaaatattatcctccaggggccgcccggcgttggaaaaacctttgttgcacgccgtctggcttacttgctgacaggagaaaaggctccgcaacgcgtcaatatggttcagttccatcaatcttatagctatgaggattttatacagggctatcgtccgaatggcgtcggcttccgacgtaaagacggcatattttacaatttttgtcagcaagctaaagagcagccagagaaaaagtatatttttattatagatgaaatcaatcgtgccaatctcagtaaagtatttggcgaagtgatgatgttaatggaacatgataaacgaggtgaaaactggtctgttcccctaacctactccgaaaacgatgaagaacgattctatgtcccggagaatgtttatatcatcggtttaatgaatactgccgatcgctctctggccgttgttgactatgccctacgcagacgattttctttcatagatattgagccaggttttgatacaccacagttccggaattttttactgaataaaaaagcagaaccttcatttgttgagtctttatgccaaaaaatgaacgagttgaaccaggaaatcagcaaagaggccactatccttgggaaaggattccgcattgggcatagttacttctgctgtgggttggaagatggcacctctccggatacgcaatggcttaatgaaattgtgatgacggatatcgcccctttactcgaagaatatttctttgatgacccctataaacaacagaaatggaccaacaaattattaggggactcatagtggaacagcccgtgatacctgtccgtaatatctattacatgcttacctatgcatggggttatttacaggaaattaagcaggcaaaccttgaagccatacccggtaacaatcttcttgatatcctggggtatgtattaaataaaggggttttacagctttcacgccgagggcttgagcttgattacaatcctaacaccgagatcattcctggcatcaaagggcgaatagagtttgctaaaacaatacgcggcttccatcttaatcatgggaaaaccgtcagtacttttgatatgcttaatgaagacacgctggctaaccgaattataaaaagcacattagccatattaattaagcatgaaaagttaaattcaactatcagagatgaagctcgttcactttatagaaaattaccgggcattagcactcttcatttaactccgcagcatttcagctatctgaatggcggaaaaaatacgcgttattataaattcgttatcagtgtctgcaaattcatcgtcaataattctattccaggtcaaaacaaaggacactaccgtttctatgattttgaaagaaacgaaaaagagatgtcattactttatcaaaagtttctttatgaattttgccgtcgtgaattaacgtctgcaaacacaacccgctcttatttaaaatgggatgcatcgagtatatcggatcagtcacttaatttgttacctcgaatggaaactgacatcaccattcgctcatcagaaaaaatacttatcgttgacgccaaatactataagagcattttttcacgacgaatgggaacagaaaaatttcattcgcaaaatctttatcaactgatgaattacttatggtcgttaaagcctgaaaatggcgaaaacataggggggttattaatatatccccacgtagataccgcagtgaaacatcgttataaaattaatggcttcgatattggcttgtgtaccgtcaatttaggtcaggaatggccgtgtatacatcaagaattactcgacattttcgatgaatatctcaaataa *aatatcaggccggatgcggctgcgccttatccggcccataaccccttacttcctcaaccccgcaaacgcagcccgaatctcttcctccggcagctggatc*	野生型大腸桿菌MG1655中之Mrr-hsdRMS-symRE-mcrBC基因座(待缺失區域上游(單下劃線)及下游(斜體)之序列)
48	caatttctacaaaacacttgatactgtatgagcatacagtataattgcttcaacagaacatattgactatccggtattacccggcatgacaggagtaaaa atggctatcgacgaaaacaaacagaaagcgttggcggcagcactgggccagattgagaaacaatttggtaaaggctccatcatgcgcctgggtgaagaccgttccatggatgtggaaaccatctctaccggttcgctttcactggatatcgcgcttggggcaggtggtctgccgatgggccgtatcgtcgaaatctacggaccggaatcttccggtaaaaccacgctgacgctgcaggtgatcgccgcagcgcagcgtgaaggtaaaacctgtgcgtttatcgatgctgaacacgcgctggacccaatctacgcacgtaaactgggcgtcgatatcgacaacctgctgtgctcccagccggacaccggcgagcaggcactggaaatctgtgacgccctggcgcgttctggcgcagtagacgttatcgtcgttgactccgtggcggcactgacgccgaaagcggaaatcgaaggcgaaatcggcgactctcacatgggccttgcggcacgtatgatgagccaggcgatgcgtaagctggcgggtaacctgaagcagtccaacacgctgctgatcttcatcaaccagatccgtatgaaaattggtgtgatgttcggtaacccggaaaccactaccggtggtaacgcgctgaaattctacgcctctgttcgtctcgacatccgtcgtatcggcgcggtgaaagagggcgaaaacgtggtgggtagcgaaacccgcgtgaaagtggtgaagaacaaaatcgctgcgccgtttaaacaggctgaattccagatcctctacggcgaaggtatcaacttctacggcgaactggttgacctgggcgtaaaagagaagctgatcgagaaagcaggcgcgtggtacagctacaaaggtgagaagatcggtcagggtaaagcgaatgcgactgcctggctgaaagataacccggaaaccgcgaaagagatcgagaagaaagtacgtgagttgctgctgagcaacccgaactcaacgccggatttctctgtagatgatagcgaaggcgtagcagaaactaacgaagatttttaa *tcgtcttgtttgatacacaagggtcgcatctgcggcccttttgcttttttaagttgtaaggatatgccatgacagaatcaacatcccgtcgcccggcata*	Mrr-hsdRMS-symRE-mcrBC基因座(缺失)(ORF上游序列：單下劃線；ORF下游序列：斜體；及ORF呈雙下劃線)

*除非另有說明，否則描繪及列出序列，且如下讀取：核苷酸序列為5'至3'；及胺基酸序列為N端至C端。**除非另有說明，否則NT表示核苷酸序列，且AA表示胺基酸序列等效物及範疇

儘管本文已描述且說明若干本發明之實施例，但熟習此項技術者將容易設想用於執行功能及/或獲得結果及/或一或多種本文所述之優勢的多種其他手段及/或結構，且此類變化及/或修改中之各者均應視為在本文所述之本發明實施例之範疇內。更一般而言，熟習此項技術者將容易瞭解，本文所述之所有參數、尺寸、材料及組態均意欲為示例性的，且實際參數、尺寸、材料及/或組態將視使用本發明教示之一或多種特定應用而定。熟習此項技術者將認識到，或能夠僅使用常規實驗即可確定本文所述之特定本發明實施例之許多等效物。因此，應理解，前述實施例僅藉助實例呈現，且在隨附申請專利範圍及其等效物之範疇內，本發明實施例可以不同於如特定描述及主張之其他方式來實踐。本揭示案之本發明實施例係針對本文所述之各個別特徵、系統、物品、材料、套組及/或方法。另外，若此類特徵、系統、物品、材料、套組及/或方法不相互矛盾，則兩個或更多個此類特徵、系統、物品、材料、套組及/或方法之任何組合均包括於本揭示案之發明範疇內。

應理解，如本文所定義且使用之所有定義均優先於字典定義、以引用之方式併入之文件中的定義及/或所定義術語之通常含義。

本文所揭示之所有參考文獻、專利及專利申請案就各自所引用之主題而言均以引用之方式併入，在一些情形下可涵蓋文件全部。

除非相反明確指示，否則在說明書及申請專利範圍中使用之不定冠詞「一(a)」及「一(an)」應理解為「至少一」。

如本文在說明書中及申請專利範圍中所用，片語「及/或」應理解為意謂如此結合之要素中之「任一者或兩者」，亦即，要素在一些情形下以結合方式存在且在其他情形下以分離方式存在。以「及/或」列出之多個要素應以相同方式解釋，亦即，如此結合之要素中之「一或多者」。可視情況存在除由「及/或」子句特定鑑別之要素以外的其他要素，無論與特定鑑別之彼等要素相關抑或不相關。因此，作為非限制性實例，當與諸如「包含」之開放式語言聯合使用時，對「A及/或B」之提及在一些實施例中可指僅A (視情況包括除B以外之要素)；在另一實施例中，可指僅B (視情況包括除A以外之要素)；在另一實施例中，可指A及B兩者(視情況包括其他要素)；等。如本文在說明書中及申請專利範圍中所用，「或」應理解為具有與如上文所定義之「及/或」相同之含義。舉例而言，在分開清單中之項目時，「或」或「及/或」應解釋為包括性的，亦即，包括多個要素或要素清單中之至少一者(而且包括一者以上)及視情況存在之額外未列出之項目。只有明確相反指示之術語，諸如「……中之僅一者」或「……中之恰好一者」，或在用於申請專利範圍中時，「由……組成」將指包括多個要素或要素清單中之恰好一個要素。一般而言，當前面有排他性術語(諸如「任一」、「……中之一者」、「……中之僅一者」或「……中之恰好一者」)時，如本文所用之術語「或」應僅解釋為指示排他性替代物( 亦即，「一者或另一者但非兩者」)。當在申請專利範圍中使用時，「基本上由……組成」應具有其在專利法領域中所用之通常含義。

如本文在說明書中及申請專利範圍中所用，在提及一或多個要素之清單時，片語「至少一個」應理解為意謂至少一個選自要素清單中之任一或多個要素之要素，但不一定包括要素清單內明確列出之每一及每個要素中之至少一者，且不排除要素清單中要素之任何組合。此定義亦容許可視情況存在除片語「至少一個」所指之要素清單內特定鑑別之要素以外的要素，無論與特定鑑別之彼等要素相關抑或不相關。因此，作為非限制性實例，「A及B中之至少一者」(或等效地，「A或B中之至少一者」，或等效地，「A及/或B中之至少一者」)在一些實施例中可指至少一個(視情況包括一個以上) A而不存在B (且視情況包括除B以外之要素)；在另一實施例中，可指至少一個(視情況包括一個以上) B而不存在A (且視情況包括除A以外之要素)；在另一實施例中，可指至少一個(視情況包括一個以上) A及至少一個(視情況包括一個以上) B (且視情況包括其他要素)；等。各種可能性代表本發明之單獨實施例。

應理解，除非明確相反指示，否則如熟習此項技術者所理解，本說明書中關於數值及數值範圍之揭示內容包括i)所說明之精確值或範圍，及ii)「約」為所說明之值或範圍之值( 例如，落入合理範圍內之值或範圍( 例如，約10%相似))。

亦應理解，除非明確相反指示，否則在本文所揭示之包括一個以上步驟或動作之任何方法中，該方法之步驟或動作之次序未必受限於揭示該方法之步驟或動作時之次序。

在申請專利範圍以及在上文說明書中，所有過渡性片語(諸如「包含」、「包括」、「攜帶」、「具有」、「含有」、「涉及」、「持有」、「由……構成」及其類似術語)均應理解為係開放式的，亦即意謂包括但不限於。如美國專利局專利審查程序手冊(United States Patent Office Manual of Patent Examining Procedures)第2111.03節中所陳述，僅過渡性片語「由……組成」及「基本上由……組成」應分別為封閉式或半封閉式過渡性片語。

附圖並不意欲按比例繪製。在圖式中，各個圖中所示之各相同或幾乎相同之組件由相似之數字表示。為清楚起見，並非每幅圖中之每個組件均被標記。在圖式中：圖 1展示用於將基因剔除引入至 大腸桿菌中之陽性及陰性選擇策略。圖 2展示實例中進行之 大腸桿菌菌株構築之譜系。圖 3展示菌株17基因型之PCR確認。使用菌株17菌落作為模板DNA進行7種不同PCR反應，以確認PCR擴增子具有如表 5所示之預期長度。1 kb + DNA階梯展示在泳道1左側之泳道中。圖 4A-4B展示商業BL21及菌株11菌株之T7 RNA聚合酶變異體1表現。圖 4A展示T7 RNA聚合酶變異體1過度表現之菌株11及BL21溶解產物之總蛋白質凝膠。圖 4B展示顯示菌株11與BL21兩者之最終細胞密度之生長概況。圖 5A-5B展示菌株12中之黏液表型以及菌株24及菌株18中黏液表型之缺乏。圖 5A展示搖瓶發酵後培養之菌株12、菌株24 (BL21宿主)及菌株18之外觀。圖 5B展示在微量離心管中離心100 uL培養物後菌株之外觀。圖 6展示由菌株17過度表現之T7 RNA聚合酶變異體1之總蛋白SDS-PAGE凝膠影像。圖 7A-7F展示來自發酵實驗之線上AMBR概況。圖 7A展示CER概況。圖 7B展示溶解氧%。圖 7C展示pH概況。圖 7D展示鹼添加。圖 7E展示抽吸之酸。圖 7F展示進料概況，其中誘導發生在第9小時，且進料在第13小時開始。圖 8A-8B展示菌株19 (用pStrain 23轉型之菌株17菌株)對T7 RNA聚合酶變異體2之表現。圖 8A展示自菌株19 (菌株17/pStrain 23)表現及純化之T7 RNA聚合酶變異體2之SDS-PAGE。圖 8B展示自菌株19細胞糊獲得之特定T7 RNA聚合酶變異體2產量(mg蛋白質/g生物質)及溶解產物中之T7 RNA聚合酶變異體2濃度。

TW202330903A_111139536_SEQL.xml

Claims

一種經基因修飾之微生物，其包含 ompT基因及 lon基因已發生突變、失能或缺失之基因組。
如請求項1之經基因修飾之微生物，其中該微生物不表現一或多種選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之蛋白質的功能形式。
如請求項1或2之經基因修飾之微生物，其中該基因組包含選自由 pgi、 manA、 manB、 manC、 gmd、 fcl及 kduI組成之群之基因中的突變。
如請求項1至3中任一項之經基因修飾之微生物，其中該基因組包含與選自由 pgi、 manA、 manB、 manC、 gmd、 fcl及 kduI組成之群之基因可操作地連接之啟動子中的突變。
如請求項1至4中任一項之經基因修飾之微生物，其中該基因組不包含編碼選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之碳水化合物代謝蛋白的核酸序列。
如請求項1至5中任一項之經基因修飾之微生物，其中該微生物不表現功能性ManA。
如請求項1至6中任一項之經基因修飾之微生物，其中該基因組包含 manA基因或與該 manA基因可操作地連接之啟動子中的突變。
如請求項1至7中任一項之經基因修飾之微生物，其中該基因組不包含編碼ManA之核酸序列。
如請求項1至8中任一項之經基因修飾之微生物，其中該基因組包含i)與SEQ ID NO: 23具有至少90%序列一致性之第一核酸序列，及ii)與SEQ ID NO: 25具有至少90%序列一致性之第二核酸序列。
如請求項9之經基因修飾之微生物，其中該基因組進一步包含與SEQ ID NO: 24具有至少90%序列一致性之第三核酸序列。
如請求項1至10中任一項之經基因修飾之微生物，其中該微生物未展現黏液表型。
如請求項1至11中任一項之經基因修飾之微生物，其中該微生物不能合成甘露糖。
如請求項1至12中任一項之經基因修飾之微生物，其中該微生物不能合成岩藻糖。
如請求項1至13中任一項之經基因修飾之微生物，其中 i) 該基因組不包含編碼endA之核酸序列； ii) 該基因組不包含編碼recA之核酸序列；且 iii) EcoK1限制系統已失活。
如請求項1至14中任一項之經基因修飾之微生物，其中該微生物之基因型為 ΔendA ΔrecA Δ( mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon。
如請求項1至15中任一項之經基因修飾之微生物，其中該微生物為 大腸桿菌( E. coli)。
如請求項16之經基因修飾之微生物，其中該微生物來源於 大腸桿菌MG1655。
如請求項1至17中任一項之經基因修飾之微生物，其進一步包含編碼重組蛋白之核酸序列。
如請求項18之經基因修飾之微生物，其中該編碼重組蛋白之核酸序列位於該微生物之該基因組中。
如請求項19之經基因修飾之微生物，其中該編碼重組蛋白之核酸序列位於質體上。
如請求項18至20中任一項之經基因修飾之微生物，其中該重組蛋白為RNA聚合酶。
如請求項21之經基因修飾之微生物，其中該RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。
如請求項22之經基因修飾之微生物，其中該RNA聚合酶包含 (a) 在用於從頭RNA合成之結合位點殘基處之胺基酸取代；及 (b) 相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。
如請求項23之經基因修飾之微生物，其中該胺基酸修飾為相對於該野生型RNA聚合酶在位置47處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
如請求項24之經基因修飾之微生物，其中在位置47處之該胺基酸取代為G47A。
如請求項23至25中任一項之經基因修飾之微生物，其中相對於該野生型RNA聚合酶，該胺基酸修飾包含額外C端胺基酸。
如請求項26之經基因修飾之微生物，其中該額外C端胺基酸為甘胺酸。
如請求項23至27中任一項之經基因修飾之微生物，其中該RNA聚合酶包含SEQ ID NO: 41之胺基酸序列。
如請求項21至27中任一項之經基因修飾之微生物，其中該RNA聚合酶包含相對於該野生型RNA聚合酶， (a) 在位置350處之胺基酸取代；及/或 (b) 在位置351處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
如請求項29之經基因修飾之微生物，其中在位置350處之該胺基酸取代為E350W。
如請求項29之經基因修飾之微生物，其中在位置351處之該胺基酸取代為D351V。
如請求項29之經基因修飾之微生物，其中在位置350處之該胺基酸取代為E350W，且在位置351處之該胺基酸取代為D351V。
如請求項29至32中任一項之經基因修飾之微生物，其中該RNA聚合酶包含SEQ ID NO: 42之胺基酸序列。
如請求項23或29至32中任一項之經基因修飾之微生物，其中該RNA聚合酶包含SEQ ID NO: 43之胺基酸序列。
一種用於產生多肽或蛋白質之方法，其包括以下步驟： i) 將包含編碼多肽或蛋白質之序列的核酸分子引入至如請求項1至17中任一項之經基因修飾之微生物中； ii) 在適於表現該多肽或蛋白質之條件下培養該經基因修飾之生物體；及 iii) 分離該多肽或蛋白質。
一種用於產生多肽或蛋白質之方法，其包括以下步驟： i) 在適於表現該多肽或蛋白質之條件下培養如請求項18至34中任一項之經基因修飾之生物體；及 ii) 分離該多肽或蛋白質。
如請求項35或36之方法，其中該多肽或蛋白質為RNA聚合酶。
如請求項37之方法，其中該RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。
如請求項38之方法，其中該RNA聚合酶包含 (a) 在用於從頭RNA合成之結合位點殘基處之胺基酸取代；及 (b) 相對於野生型RNA聚合酶，引起轉錄效率增加之胺基酸修飾。
如請求項39之方法，其中該胺基酸修飾為相對於該野生型RNA聚合酶在位置47處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
如請求項40之方法，其中在位置47處之該胺基酸取代為G47A。
如請求項39至41中任一項之方法，其中相對於該野生型RNA聚合酶，該胺基酸修飾包含額外C端胺基酸。
如請求項42之方法，其中該額外C端胺基酸為甘胺酸。
如請求項40至43中任一項之方法，其中該RNA聚合酶包含SEQ ID NO: 41之胺基酸序列。
如請求項37至43中任一項之方法，其中該RNA聚合酶包含相對於該野生型RNA聚合酶， (a) 在位置350處之胺基酸取代；及 (b) 在位置351處之胺基酸取代，其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
如請求項45之方法，其中在位置350處之該胺基酸取代為E350W。
如請求項45之方法，其中在位置351處之該胺基酸取代為D351V。
如請求項45之方法，其中在位置350處之該胺基酸取代為E350W，且在位置351處之該胺基酸取代為D351V。
如請求項45至48中任一項之方法，其中該RNA聚合酶包含SEQ ID NO: 42之胺基酸序列。
如請求項39或45至48中任一項之方法，其中該RNA聚合酶包含SEQ ID NO: 43之胺基酸序列。