JP2022533040A

JP2022533040A - 合成ゲノム

Info

Publication number: JP2022533040A
Application number: JP2021566246A
Authority: JP
Inventors: ジュリウスフレデンス; カイハンワン; ラトレダニエルデ; ルイーズエフ．エイチ．ファンケ; ウェスリーイー．ロバートソン; ジェイソンダブリュー．チン
Original assignee: UK Research and Innovation
Current assignee: UK Research and Innovation
Priority date: 2019-05-14
Filing date: 2020-05-14
Publication date: 2022-07-21
Also published as: US20240132874A1; BR112021022451A2; US20230392138A1; CA3135971A1; AU2020273571A1; WO2020229592A1; US20220282241A1; EP3969582A1; CN114026230A; GB201906775D0

Abstract

本発明は、１つ若しくは２つ以上のセンスコドンの５つ若しくは４つ以下の出現を含む合成原核生物ゲノム；及び／又は合成原核生物ゲノムが、親ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の、１つ若しくは２つ以上のセンスコドンの出現を含む、親ゲノムに由来する合成原核生物ゲノム；及び／又は１つ若しくは２つ以上のセンスコドンの出現がない、１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は１０００個若しくは１００１個以上の遺伝子を含む合成原核生物ゲノム；を提供する。

Description

本発明は、合成ゲノム及びそれを産生する方法に関する。

ゲノムの設計及び合成は、生物学を理解し、改変するための強力なアプローチを提供する。ゲノム合成は代謝工学を加速させる可能性がある。特に、ゲノム合成は、同義コドンの機能を解明し、遺伝的にコードされた非天然ポリマー合成を容易にする可能性がある（Wang, K., et al., 2016. Nature, 539(7627), 59-64）。

標準的な遺伝コードは、６１個のセンスコドンを使用して２０種のカノニカルアミノ酸をコードし、２０種のアミノ酸のうちの１８種は、１つより多い同義コドンによってコードされる。自然界は、遺伝子内の各位置において各アミノ酸をコードするために最大で６つまでの同義語から１つのセンスコドンを選択する。同義コドンの選択は、ｍＲＮＡフォールディング、転写及び翻訳調節配列、翻訳速度、共翻訳フォールディング、タンパク質レベルに影響を及ぼす可能性があり、新たな、未だに理解されていない役割を有する（Wang, K., et al., 2016. Nature, 539(7627), 59-64;及びCambray, G., et al., 2018. Nature biotechnology, 36(10), 1005-1015）。

標的コドンの同義コドンによるゲノムワイド置換（同義コドン圧縮）は、遺伝的にコードされた非カノニカルバイオポリマーのインビボでの生合成を容易にするためにセンスコドンを非カノニカルアミノ酸（又は他のモノマー）に再割当するための基礎を提供することができる（Chin, J.W., 2017. Nature, 550(7674), 53-60）。

部位特異的変異誘発アプローチが、大腸菌（E.coli）ゲノムにおける最大で３２１個までのアンバー終止コドンを置換するために使用されている（Mukai, T., et al., 2015. Scientific reports, 5, p.9699）。しかしながら、センスコドンは一般に終止コドンより数桁多く、変異誘発よりむしろ、ゲノム合成が、多くの場合においてセンスコドン除去に取り組むのに好ましい手段であり得る。

ゲノム合成は、合成ゲノムを有するマイコプラズマの作製を可能にし（Gibson, D.G., et al., 2010. Science, 329(5987), 52-56）、１６個の染色体のうちの１つ又は２つのＤＮＡが合成ＤＮＡに置換されているＳ．セレビシエ（S. cerevisiae）の９つの株の作製を可能にした（Zhang, W., et al., 2017. Science, 355(6329), eaaf3981;及びRichardson, S.M., et al., 2017. Science, 355(6329), 1040-1044）。これらの実験は個々の株において最大で１ＭｂまでのＤＮＡ（０．９９Ｍｂ、酵母；１．０８Ｍｂ、マイコプラズマ）を置換している。プログラムされた組換えによるゲノム改変強化のためのレプリコン切除（ＲＥＸＥＲ，replicon excision for enhanced genome engineering through programmed recombination）は、単一のステップにおいて１００ｋｂを超える大腸菌ゲノムを合成ＤＮＡで置換することについて報告している。さらに、ＲＥＸＥＲは、２２０ｋｂの大腸菌ゲノムを２３０ｋｂの合成ＤＮＡで置換するためにゲノム段階的交換合成（ＧＥＮＥＳＩＳ，genome stepwise interchange synthesis）によって反復され得ることが示されている（Wang, K., et al., 2016. Nature, 539(7627), 59-64;国際公開第２０１８／０２０２４８号パンフレット）。

ゲノム合成は、個々の遺伝子における同義コドン（Napolitano, M.G., et al., 2016. PNAS, 113(38), E5588-E5597）、ゲノム領域及び必須オペロン（Wang, K., et al., 2016. Nature, 539(7627), 59-64;及びLau, Y.H., et al. 2017. Nucleic acids research, 45(11), 6971-6980）を変更するために使用されている。例えば、Wangらは、必須遺伝子及び標的コドンの両方に豊富にある大腸菌ゲノムの２０ｋｂ領域を置換するために、定義された「書き換えスキーム」を使用した。

しかしながら、これらの研究は、単一の株のゲノムにおける標的化されたセンスコドンのほんの一部（最大で４．７％）しか変異していない。その結果として、これらの方法をゲノムワイド同義コドン圧縮に適用することにより、生存可能なゲノムを産生することができるかどうかは不明である。例えば、Wangらで試験した定義された書き換えスキームが、少数のセンスコドンが２０種のカノニカルアミノ酸をコードするために使用される生物を作製するためにゲノムワイドに適用され得るかどうかは不明である。

国際公開第２０１８／０２０２４８号パンフレット

Wang, K., et al., 2016. Nature, 539(7627), 59-64 Cambray, G., et al., 2018. Nature biotechnology, 36(10), 1005-1015 Chin, J.W., 2017. Nature, 550(7674), 53-60 Mukai, T., et al., 2015. Scientific reports, 5, p.9699 Gibson, D.G., et al., 2010. Science, 329(5987), 52-56 Zhang, W., et al., 2017. Science, 355(6329), eaaf3981 Richardson, S.M., et al., 2017. Science, 355(6329), 1040-1044 Napolitano, M.G., et al., 2016. PNAS, 113(38), E5588-E5597 Lau, Y.H., et al. 2017. Nucleic acids research, 45(11), 6971-6980

それ故、１つ又は２つ以上のセンスコドンが除去されている合成ゲノムが求められている。また、合成ゲノムを産生するための改善された方法も求められている。

本発明者らは、驚くべきことに、１つ又は２つ以上のセンスコドンが除去されている、生存可能な合成原核生物ゲノムが産生され得ることを見出した。特に、本発明者らは、細胞タンパク質をコードするために使用されるコドンの数が、２つのセンスコドン及び１つの終止コドンのゲノムワイド書き換えによって６４個から６１個まで減少している、生存可能な合成ゲノムを産生した。本発明者らはまた、前記合成ゲノムを含む大腸菌宿主細胞を産生した。

本発明者らはまた、驚くべきことに、定義された書き換え及びリファクタリングスキームが、標的コドンの９９．９％超についてゲノムワイド同義コドン圧縮を可能にすることができることを見出した。本発明者らは、許容されない位置における代替の書き換え及びリファクタリングが、ゲノムワイド同義コドン圧縮を可能にすることを見出した。

本発明者らはまた、驚くべきことに、組換えを介した遺伝子改変（例えば、ＲＥＸＥＲ及び／又はＧＥＮＥＳＩＳ）が、合成ゲノムを効果的に産生するために誘導コンジュゲーション（directed conjugation）と組み合わされ得ることを見出した。特に、本発明者らは、例えば、ＤＮＡの少なくとも約４Ｍｂが前記方法により効果的に置換され得ること、及び前記方法により、合成ＤＮＡの設計における失敗（許容されない位置）をコドンレベルの分解能で同定することができることを見出した。

したがって、一態様では、本発明は、１つ又は２つ以上のセンスコドンの５つ又は４つ以下の出現（occurrence）を含む合成原核生物ゲノムを提供する。一部の実施形態では、合成原核生物ゲノムは、１つ又は２つ以上のセンスコドンの４つ若しくは３つ以下、３つ若しくは２つ以下、２つ若しくは１つ以下、１つ若しくは０個の出現を含むか、又は出現を含まない。一部の実施形態では、１つ又は２つ以上のセンスコドンは、１つのセンスコドン又は２つのセンスコドン、好ましくは２つのセンスコドンからなる。一部の実施形態では、合成原核生物ゲノムは、２つ又は３つ以上のセンスコドン、好ましくは２つのセンスコドンの出現を含まず、１つの終止コドン、好ましくはアンバー終止コドン（ＴＡＧ）の出現を含まない。

合成原核生物ゲノムは、合成細菌ゲノム、好ましくは合成の大腸菌（Escherichia coli）ゲノム、サルモネラ・エンテリカ（Salmonella enterica）ゲノム、又は志賀赤痢菌（Shigella dysenteriae）ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、１００ｋｂ～１０Ｍｂ、又は１Ｍｂ～１０Ｍｂ、又は２Ｍｂ～６Ｍｂのサイズである。合成原核生物ゲノムは生存可能であり得る。一部の実施形態では、合成原核生物ゲノムは、１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は１０００個若しくは１００１個以上の遺伝子を含み、遺伝子は１つ又は２つ以上のセンスコドンの出現がなくてもよく、好ましくは遺伝子は必須遺伝子である。

一部の実施形態では、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択され、好ましくは１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択され、より好ましくは１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択され、最も好ましくは１つ又は２つ以上のセンスコドンは、ＴＣＧ及び／又はＴＣＡである。

一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン（ＴＡＧ）の１０個若しくは９個以下、５個若しくは４個以下の出現を含むか、又は出現を含まない。

さらなる態様では、本発明は、１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は１０００個若しくは１００１個以上の遺伝子を含む合成原核生物ゲノムを提供し、遺伝子は、１つ又は２つ以上のセンスコドンの５つ又は４つ以下の出現を合計で含み、好ましくは遺伝子は必須遺伝子である。一部の実施形態では、遺伝子は、１つ若しくは２つ以上のセンスコドンの４つ若しくは３つ以下、３つ若しくは２つ以下、２つ若しくは１つ以下、１つ若しくは０個の出現を合計で含むか、又は出現を含まない。一部の実施形態では、１つ又は２つ以上のセンスコドンは、１つのセンスコドン又は２つのセンスコドン、好ましくは２つのセンスコドンからなる。

合成原核生物ゲノムは、合成細菌ゲノム、好ましくは合成の大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、１００ｋｂ～１０Ｍｂ、又は１Ｍｂ～１０Ｍｂ、又は２Ｍｂ～６Ｍｂのサイズである。合成原核生物ゲノムは生存可能であり得る。

さらなる態様では、本発明は、親原核生物ゲノムに由来する合成原核生物ゲノムを提供し、その合成原核生物ゲノムは、親原核生物ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ若しくは２つ以上のセンスコドンの出現を含むか、又はその合成原核生物ゲノムは、１つ若しくは２つ以上のセンスコドンの出現を含まない。一部の実施形態では、１つ又は２つ以上のセンスコドンは、１つのセンスコドン又は２つのセンスコドン、好ましくは２つのセンスコドンからなる。

合成原核生物ゲノムは、細菌ゲノム、好ましくは大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、１００ｋｂ～１０Ｍｂ、又は１Ｍｂ～１０Ｍｂ、又は２Ｍｂ～６Ｍｂのサイズである。合成原核生物ゲノムは生存可能であり得る。

一部の実施形態では、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択され、好ましくは１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択され、より好ましくは１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択され、最も好ましくは１つ又は２つ以上のセンスコドンはＴＣＧ及び／又はＴＣＡであり、ＴＣＧ及び／又はＴＣＡは同義センスコドンで置換されていてもよい。

好ましくは、親原核生物ゲノムにおける１つ又は２つ以上のセンスコドンの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、同義センスコドンで置換されている。一部の実施形態では、親原核生物ゲノムにおけるＴＣＧ及び／又はＴＣＡの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、ＡＧＣ及び／又はＡＧＴで置換され、最も好ましくは親原核生物ゲノムにおけるＴＣＧの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、ＡＧＣで置換され、及び／又は親原核生物ゲノムにおけるＴＣＡの出現の９０％、９５％、９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、ＡＧＴで置換されている。

一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン（ＴＡＧ）の１０個若しくは９個以下、５個若しくは４個以下の出現を含むか、又は出現を含まず、好ましくは親原核生物ゲノムにおけるＴＡＧの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、又は全てが、ＴＡＡで置換されている。

一部の実施形態では、親原核生物ゲノムにおける２つ又は３つ以上のセンスコドン、好ましくは２つのセンスコドンの出現の９９．９％若しくはそれ以上、又は１００％が、同義センスコドンで置換され、親原核生物ゲノムにおけるＴＡＧの出現の全てが、ＴＡＡで置換されている。

親原核生物ゲノムにおける１つ又は２つ以上のセンスコドンを含む重複する領域を共有する１つ又は２つ以上の遺伝子対がリファクタリングされてもよく、好ましくは１つ又は２つ以上の遺伝子対が、センスコドンのうちの１つ又は２つ以上の同義センスコドンでの置換が、遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである。

一部の実施形態では、逆向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、合成挿入物が重複する領域を含み、及び／又は同じ向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、合成挿入物が、（ｉ）終止コドン、（ii）重複する領域の上流から約２０～２００ｂｐ、及び（iii）重複する領域を含む。

さらなる態様では、本発明は、１つ又は２つ以上のセンスコドンの出現がない、２０個又は２１個以上、３０個又は３１個以上、４０個又は４１個以上、５０個又は５１個以上、１００個又は１０１個以上の必須遺伝子を含むポリヌクレオチドを提供する。一部の実施形態では、１つ又は２つ以上のセンスコドンは、１つのセンスコドン又は２つのセンスコドン、好ましくは２つのセンスコドンからなる。

一部の実施形態では、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択され、好ましくは１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択され、より好ましくは１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択され、最も好ましくは１つ又は２つ以上のセンスコドンはＴＣＧ及び／又はＴＣＡである。

遺伝子の１つ又は２つ以上のセンスコドンの出現は、同義センスコドンで置換されていてもよく、好ましくはＴＣＧコドンはＡＧＣで置換され、及び／又はＴＣＡコドンはＡＧＴで置換されている。

必須遺伝子は、ｒｉｂＦ、ｌｓｐＡ、ｉｓｐＨ、ｄａｐＢ、ｆｏｌＡ、ｉｍｐ、ｙａｂＱ、ｆｔｓＬ、ｆｔｓＩ、ｍｕｒＥ、ｍｕｒＦ、ｍｒａＹ、ｍｕｒＤ、ｆｔｓＷ、ｍｕｒＧ、ｍｕｒＣ、ｆｔｓＱ、ｆｔｓＡ、ｆｔｓＺ、ｌｐｘＣ、ｓｅｃＭ、ｓｅｃＡ、ｃａｎ、ｆｏｌＫ、ｈｅｍＬ、ｙａｄＲ、ｄａｐＤ、ｍａｐ、ｒｐｓＢ、ｔｓｆ、ｐｙｒＨ、ｆｒｒ、ｄｘｒ、ｉｓｐＵ、ｃｄｓＡ、ｙａｅＬ、ｙａｅＴ、ｌｐｘＤ、ｆａｂＺ、ｌｐｘＡ、ｌｐｘＢ、ｄｎａＥ、ａｃｃＡ、ｔｉｌＳ、ｐｒｏＳ、ｙａｆＦ、ｈｅｍＢ、ｓｅｃＤ、ｓｅｃＦ、ｒｉｂＤ、ｒｉｂＥ、ｔｈｉＬ、ｄｘｓ、ｉｓｐＡ、ｄｎａＸ、ａｄｋ、ｈｅｍＨ、ｌｐｘＨ、ｃｙｓＳ、ｆｏｌＤ、ｅｎｔＤ、ｍｒｄＢ、ｍｒｄＡ、ｎａｄＤ、ｈｏｌＡ、ｒｌｐＢ、ｌｅｕＳ、ｌｎｔ、ｇｌｎＳ、ｆｌｄＡ、ｃｙｄＡ、ｉｎｆＡ、ｃｙｄＣ、ｆｔｓＫ、ｌｏｌＡ、ｓｅｒＳ、ｒｐｓＡ、ｍｓｂＡ、ｌｐｘＫ、ｋｄｓＢ、ｍｕｋＦ、ｍｕｋＥ、ｍｕｋＢ、ａｓｎＳ、ｆａｂＡ、ｍｖｉＮ、ｒｎｅ、ｆａｂＤ、ｆａｂＧ、ａｃｐＰ、ｔｍｋ、ｈｏｌＢ、ｌｏｌＣ、ｌｏｌＤ、ｌｏｌＥ、ｐｕｒＢ、ｍｉｎＥ、ｍｉｎＤ、ｐｔｈ、ｐｒｓＡ、ｉｓｐＥ、ｌｏｌＢ、ｈｅｍＡ、ｐｒｆＡ、ｐｒｍＣ、ｋｄｓＡ、ｔｏｐＡ、ｒｉｂＡ、ｆａｂＩ、ｔｙｒＳ、ｒｉｂＣ、ｙｄｉＬ、ｐｈｅＴ、ｐｈｅＳ、ｒｐｌＴ、ｉｎｆＣ、ｔｈｒＳ、ｎａｄＥ、ｇａｐＡ、ｙｅａＺ、ａｓｐＳ、ａｒｇＳ、ｐｇｓＡ、ｙｅｆＭ、ｍｅｔＧ、ｆｏｌＥ、ｙｅｊＭ、ｇｙｒＡ、ｎｒｄＡ、ｎｒｄＢ、ｆｏｌＣ、ａｃｃＤ、ｆａｂＢ、ｇｌｔＸ、ｌｉｇＡ、ｚｉｐＡ、ｄａｐＥ、ｄａｐＡ、ｄｅｒ、ｈｉｓＳ、ｉｓｐＧ、ｓｕｈＢ、ｔａｄＡ、ａｃｐＳ、ｅｒａ、ｒｎｃ、ｌｅｐＢ、ｒｐｏＥ、ｐｓｓＡ、ｙｆｉＯ、ｒｐｌＳ、ｔｒｍＤ、ｒｐｓＰ、ｆｆｈ、ｇｒｐＥ、ｃｓｒＡ、ｉｓｐＦ、ｉｓｐＤ、ｆｔｓＢ、ｅｎｏ、ｐｙｒＧ、ｃｈｐＲ、ｌｇｔ、ｆｂａＡ、ｐｇｋ、ｙｑｇＤ、ｍｅｔＫ、ｙｑｇＦ、ｐｌｓＣ、ｙｇｉＴ、ｐａｒＥ、ｒｉｂＢ、ｃｃａ、ｙｇｊＤ、ｔｄｃＦ、ｙｒａＬ、ｙｈｂＶ、ｉｎｆＢ、ｎｕｓＡ、ｆｔｓＨ、ｏｂｇＥ、ｒｐｍＡ、ｒｐｌＵ、ｉｓｐＢ、ｍｕｒＡ、ｙｒｂＢ、ｙｒｂＫ、ｙｈｂＮ、ｒｐｓＩ、ｒｐｌＭ、ｄｅｇＳ、ｍｒｅＤ、ｍｒｅＣ、ｍｒｅＢ、ａｃｃＢ、ａｃｃＣ、ｙｒｄＣ、ｄｅｆ、ｆｍｔ、ｒｐｌＱ、ｒｐｏＡ、ｒｐｓＤ、ｒｐｓＫ、ｒｐｓＭ、ｓｅｃＹ、ｒｐｌＯ、ｒｐｍＤ、ｒｐｓＥ、ｒｐｌＲ、ｒｐｌＦ、ｒｐｓＨ、ｒｐｓＮ、ｒｐｌＥ、ｒｐｌＸ、ｒｐｌＮ、ｒｐｓＱ、ｒｐｍＣ、ｒｐｌＰ、ｒｐｓＣ、ｒｐｌＶ、ｒｐｓＳ、ｒｐｌＢ、ｒｐｌＷ、ｒｐｌＤ、ｒｐｌＣ、ｒｐｓＪ、ｆｕｓＡ、ｒｐｓＧ、ｒｐｓＬ、ｔｒｐＳ、ｙｒｆＦ、ａｓｄ、ｒｐｏＨ、ｆｔｓＸ、ｆｔｓＥ、ｆｔｓＹ、ｙｈｈＱ、ｂｃｓＢ、ｇｌｙＱ、ｇｐｓＡ、ｒｆａＫ、ｋｄｔＡ、ｃｏａＤ、ｒｐｍＢ、ｄｆｐ、ｄｕｔ、ｇｍｋ、ｓｐｏＴ、ｇｙｒＢ、ｄｎａＮ、ｄｎａＡ、ｒｐｍＨ、ｒｎｐＡ、ｙｉｄＣ、ｔｎａＢ、ｇｌｍＳ、ｇｌｍＵ、ｗｚｙＥ、ｈｅｍＤ、ｈｅｍＣ、ｙｉｇＰ、ｕｂｉＢ、ｕｂｉＤ、ｈｅｍＧ、ｙｉｈＡ、ｆｔｓＮ、ｍｕｒＩ、ｍｕｒＢ、ｂｉｒＡ、ｓｅｃＥ、ｎｕｓＧ、ｒｐｌＪ、ｒｐｌＬ、ｒｐｏＢ、ｒｐｏＣ、ｕｂｉＡ、ｐｌｓＢ、ｌｅｘＡ、ｄｎａＢ、ｓｓｂ、ａｌｓＫ、ｇｒｏＳ、ｐｓｄ、ｏｒｎ、ｙｊｅＥ、ｒｐｓＲ、ｃｈｐＳ、ｐｐａ、ｖａｌＳ、ｙｊｇＰ、ｙｊｇＱ、及びｄｎａＣからなるリストのうちの１つ又は２つ以上から選択される必須遺伝子を含んでもよい。

さらなる態様では、本発明は、本発明による合成原核生物ゲノム又は本発明によるポリヌクレオチドを含む原核生物宿主細胞を提供する。

原核生物宿主細胞は生存可能であり得る。原核生物宿主細胞は、細菌の細胞、好ましくは大腸菌の細胞、サルモネラ・エンテリカの細胞、又は志賀赤痢菌の細胞であってもよい。好ましくは、宿主細胞は、１つ又は２つ以上の非タンパク質性アミノ酸、好ましくは２つ又は３つ以上の非タンパク質性アミノ酸、最も好ましくは３つ又は４つ以上の非タンパク質性アミノ酸を含むポリペプチドの産生に使用するのに適している。

さらなる態様では、本発明は、１つ又は２つ以上の非タンパク質性アミノ酸、好ましくは２つ又は３つ以上の非タンパク質性アミノ酸、最も好ましくは３つ又は４つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための本発明による原核生物宿主細胞の使用を提供する。

さらなる態様では、本発明は、合成ゲノムを産生するための方法であって、
（ａ）親ゲノムを準備するステップと、
（ｂ）親ゲノムに対して組換えを介した遺伝子改変の１回又は２回以上のラウンドを実行して、２つ又は３つ以上の異なる部分的合成ゲノムを産生するステップと、
（ｃ）２つ又は３つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの１回又は２回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含み、部分的合成ゲノムの各々が、１つ又は２つ以上のセンスコドンの各々の５０個若しくは４９個以下、２０個若しくは１９個以下、１０個若しくは９個以下、５個若しくは４個以下、又は０個の出現を有する合成領域を含むか、又は部分的合成ゲノムの各々が、親ゲノムにおける対応する領域と比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ又は２つ以上のセンスコドンの各々の出現を有する合成領域を含む、方法を提供する。

合成領域は、親ゲノムの９０％若しくはそれ以上、９５％若しくはそれ以上、９９％若しくはそれ以上又は１００％を合計で占めてもよい。一部の実施形態では、合成領域は、１０～１０００ｋｂ、５０～１０００ｋｂ、１００～１０００ｋｂ、又は１００～５００ｋｂのサイズである。

方法は、組換えを介した遺伝子改変の各ラウンド後及び／又は誘導コンジュゲーションの各ラウンド後に部分的合成ゲノムの生存能を試験するステップをさらに含んでもよい。

２つ又は３つ以上の異なる部分的合成ゲノムは、少なくとも１つの部分的合成ドナーゲノム及び少なくとも１つの部分的合成レシピエントゲノムを含んでもよい。一部の実施形態では、少なくとも１つの部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の２つの相同領域が隣接した第１の選択可能マーカーを含み、少なくとも１つの部分的合成レシピエントゲノムは、２つの対応する相同領域が隣接した第２の選択可能マーカーを含み、第１の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び／又は第２の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。一部の実施形態では、少なくとも１つの部分的合成レシピエントゲノムに存在する合成領域は、相同領域が隣接した領域の外側である。一部の実施形態では、方法は、選択可能マーカーについての選択の１回又は２回以上のラウンドをさらに含む。

組換えを介した遺伝子改変の１回又は２回以上のラウンドは、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除（ＲＥＸＥＲ）の１回又は２回以上のラウンドを含んでもよい。

合成ゲノムは、本発明による合成原核生物ゲノムであってもよい。

さらなる態様では、本発明は、本発明の方法によって産生される合成原核生物ゲノムを提供する。

～同義コドン圧縮のための定義された書き換えスキームを実装する合成ゲノムの設計を示す図である。ａ、同義コドン圧縮のための定義された書き換えスキームである。ＷＴ大腸菌のゲノムに使用される同義セリンコドン及び３つの終止コドンを示す。同義コドン圧縮のための定義された書き換えスキームを体系的に実装することにより、標的コドンを定義された同義語に書き換え、アンバー終止コドンＴＡＧをオーカー終止コドンＴＡＡで置換する。これにより、減少した数のセリン及び終結コドンを使用する書き換えられたゲノムを有する生物が作製される。ｂ、３’、３’重複のリファクタリングにより、それらの独立した書き換えが可能になる。２つのオープンリーディングフレーム（ＯＲＦ－１及びＯＲＦ－２）の間の重複が複製され、合成挿入物を作製する。これにより、ＯＲＦの独立した書き換えが可能になる。ｃ、５’、３’重複のリファクタリング。重複に２０ｂｐの上流を加えたものが合成挿入物を生成するために複製される。重複が上流のＯＲＦの末端において１ｂｐより長い場合、インフレームＴＡＡが合成挿入物の最初に導入され、このインフレーム終止コドンは元のＲＢＳからの翻訳の終結を確実にする。それ故、下流のＯＲＦの全ての全長の翻訳が合成挿入物における再構成されたＲＢＳから開始される。ｄ、ＴＣＧ、ＴＣＡ及びＴＡＧコドンの全てが除去された合成ゲノム設計のマップ。外側の環：ＴＣＧ→ＡＧＣ、ＴＣＡ→ＡＧＴ及びＴＡＧ→ＴＡＡ書き換えの全ての１８，２１８個の位置。灰色の環：重複における設計されたサイレント変異の１２個の位置、３’、３’重複の２１のリファクタリング（ｂ）及び５’５’重複の５８のリファクタリング（ｃ）。２つの内側の環はゲノム区画を例示する。外側の環：合成ゲノム設計の８個のゲノム区画（Ａ～Ｈ）。内側の環：各々およそ１００ｋｂの３７個の断片。断片３７は、最後のアセンブリを反映するために３７ａ及び３７ｂとして示す。ｏｒｉＣ：複製起点。～合成ゲノムの逆合成を示す図である。ａ、ゲノムを８つの区画に切断する。合成ゲノムを区画Ａ～Ｈに切断し、各区画はおよそ０．５Ｍｂに対応する（ステップ１）。複製起点ｏｒｉＣの位置（オレンジ色の四角）を示す。区画を、誘導コンジュゲーションによって完全に書き換えられたゲノム（フォワードセンスにおいて、逆合成矢印の逆方向）に組み立てた（図１０及び図１１）。ｂ、ゲノム区画を１００ｋｂの断片に切断する。区画を各々約１００ｋｂの４～５つの断片にさらに切断する。区画Ａを表示し、他の区画を同様に処理した。ほぼ全ての区画を、ＧＥＮＥＳＩＳ（図４）によって、連続したＲＥＸＥＲステップ（図３）を介して完全に構築した。各ステップは、約１００ｋｂの野生型ゲノム配列を１００ｋｂの合成断片で置換した（ステップ２及び３）。陰性選択マーカー－１（ｒｐｓＬ）、及び陽性選択マーカー＋１（Ｋａｎ^Ｒ）、及び陰性選択マーカー－２（ＳａｃＢ）、及び陽性選択マーカー＋２（Ｃｍ^Ｒ）から構成される二重選択マーカーを、ＧＥＮＥＳＩＳを実現するためにＲＥＸＥＲの交互のラウンドにおいて使用した。ｃ、各１００ｋｂの合成断片を１０ｋｂの合成ストレッチに切断する。各１００ｋｂの合成断片を、約１０ｋｂ長の９～１４個の短い合成ストレッチにさらに切断する（ステップ４）。１００ｋｂの合成断片を有するＢＡＣを酵母における相同組換えによって組み立てた。各ＢＡＣは、インビボで合成ＤＮＡの切除を可能にするＣａｓ９切断部位（黒色の三角形）、組換えを標的とするための相同領域（ＨＲ１及びＨＲ２）、ＲＥＸＥＲ及びＧＥＮＥＳＩＳの間に選択するための適切な二重選択カセット（＋２、－２で示した）、ＲＥＸＥＲ後の骨格の喪失を可能にするための陰性選択マーカー（－１で示した）、ＢＡＣＹＡＣ起点並びに大腸菌及びＳ．セレビシエにおける維持のためのＵＲＡ３マーカーを含有する。ＲＥＸＥＲによってゲノム内の対応する領域を置換するための合成ＤＮＡの１００ｋｂ断片の使用を示す図である。ＲＥＸＥＲ（プログラムされた組換えによるゲノム改変強化のためのレプリコン切除）は、ゲノムＤＮＡをエピソーム（ＢＡＣ）から提供される合成ＤＮＡで置換するためにＣＲＩＳＰＲ／Ｃａｓ９及びラムダ－レッドを介した組換えを利用する。これにより、ゲノムの大きな領域（１００ｋｂを超える）を合成ＤＮＡによって置換することができる（Wang, K., et al., 2016. Nature, 539(7627), 59-64;国際公開第２０１８／０２０２４８号パンフレット）。黒色の三角形は、相同領域（ＨＲ，homology region）が隣接したＢＡＣから合成ＤＮＡ（ピンク色）カセットを遊離させるためにＣａｓ９によって切断される、ＣＲＩＳＰＲプロトスペーサーの位置を示す。相同領域１及び２（ＨＲ１、ＨＲ２）は、大腸菌ゲノムへの組換えの位置をプログラムする。選択カセット－１／＋１は合成ＤＮＡの組み込みを確実にし、一方、ゲノム上の選択カセット－２／＋２は対応するｗｔＤＮＡの除去を確実にする。図に示した例では、＋１はＫａｎ^Ｒであり、－１はｒｐｓＬであり、＋２はＣｍ^Ｒであり、－２はｓａｃＢである。ＧＥＮＥＳＩＳが、書き換えられた区画を生成するために合成ＤＮＡによるゲノムＤＮＡの段階的な置換を可能にすることを示す図である。陽性及び陰性選択カセットを交互に選択する、ＲＥＸＥＲの反復サイクル（図３を参照のこと）により、ゲノム段階的交換合成（ＧＥＮＥＳＩＳ）が可能になる（Wang, K., et al., 2016. Nature, 539(7627), 59-64）。これにより、対応するゲノム配列を時計回りに置換する断片の反復付加によって合成ゲノムの大きな区画を組み立てることが可能になる。ＤＮＡの１００ｋｂの合成断片の最初のＲＥＸＥＲにより、－２／＋２選択カセットを保有する合成ＤＮＡの第２の断片の下流の組み込みのためのランディング部位として作用するゲノム上に－１／＋１選択カセットを残す。示した例では、＋１はＫａｎ^Ｒであり、－１はｒｐｓＬであり、＋２はＣｍ^Ｒであり、－２はｓａｃＢであるが、ゲノム及びＢＡＣ上のマーカーの異なる順列で同じ論理を使用することができる。断片１におけるｆｔｓＩ－ｍｕｒＥ及びｍａｐの書き換えを示す図である。ａ、断片１のランドスケープの書き換え。本発明者らは、ＲＥＸＥＲ後、６つのクローンを配列決定した。各点は、ゲノム内の示した位置（ｘ軸）における標的コドンについての配列決定したクローン内の書き換えの頻度（ｙ軸）を表す。黒色の点は、本発明者らが書き換えを観察しなかった位置を示す。ｆｔｓＩ－ｍｕｒＥの４つのコドン及びリファクタリング並びにｍａｐにおける１つのコドンは拒絶された。ｂ、１４ｂｐのｆｔｓＩ－ｍｕｒＥ重複のリファクタリング。コドン及び重複は、配列決定されたクローンにおけるそれらのＲＥＸＥＲ後の置換頻度によってスケーリングされた灰色である。本発明者らの最初のリファクタリングスキーム（１）を使用して、重複に上流配列の２０ｂｐを加えたものを複製し、本発明者らは合成ＤＮＡによる重複の置換を（ＲＥＸＥＲ後に配列決定した６個のクローンにおいて）観察しなかった。重複に上流配列の１８２ｂｐを加えたものを複製するリファクタリングスキーム２により、配列決定した１６個のＲＥＸＥＲ後のクローンのうちの１２個においてこの領域の完全な書き換えを得た。ｃ、ｍａｐにおけるＳｅｒ４での代替コドンの試験。構成的ＥＭ７プロモーター上の二重選択マーカーであるｐｈｅＳ^＊－Ｈｙｇ^Ｒをｍａｐの上流に導入し、続いてＲＢＳを導入した。本発明者らは、ラムダレッド組換え及びｐｈｅＳ^＊の喪失についての陰性選択によって４位に（示したように）代替コドンを導入する直鎖状二本鎖ＤＮＡを使用してカセットを置換した。ＡＧＣ及びＡＧＴを有するＤＮＡは組み込まなかった（０／１６クローン）；本発明者らはＡＧＣについて１つのクローンを回復させたが、配列決定により、それがミュータントＡＡＣ（Ａｓｎ）コドンを含有することが明らかになった。ＴＣＴ（６／８）、ＴＣＣ（６／１６）、ＡＣＡ（６／８）、及びＴＴＡ（４／８）が許容された。ｄ、ｆｔｓＩ－ｍｕｒＥ重複についてのリファクタリングスキーム２及びｍａｐの４位にＴＣＴを含有するＢＡＣでのＲＥＸＥＲ後の（ａ）に示したゲノム領域にわたるランドスケープの書き換え。２／７のＲＥＸＥＲ後のクローンを完全にリファクタリングし、書き換え、各標的コドンを少なくとも５／７のクローンにおいて置換した。（ａ）からのデータを比較のために示す。～断片９におけるｒｎｅ及びｙｃｅＱの書き換えを示す図である。ａ、断片９の書き換えランドスケープ。本発明者らの設計した断片９の合成配列をＲＥＸＥＲによってゲノムへ組み込み、１９個のクローンをＮＧＳによって完全に配列決定した。書き換えランドスケープグラフは、各標的コドンを１９個のクローンにわたって書き換えた頻度を示す。ほとんどのコドン置換は受け入れられたが、２６ｋｂ領域の書き換えは一貫して拒絶された；配列決定したクローンの全てにおける書き換え頻度がゼロであるコドン位置は黒色の点で示す。問題のある配列を正確に示すために、ゲノムの１０ｋｂストレッチ（Ｇ２～７）を合成断片９のエピソームコピーの存在下で削除した。合成配列は、Ｇ４（濃い灰色の箱）を除いて全てのストレッチの削除を支持するのに十分であり、内在する問題がこのストレッチ内にあることを示唆している。０／１９のクローンを完全に書き換えた。ｂ、ストレッチＧ４の書き換えランドスケープ。１０ｋｂのストレッチ「Ｇ４」にわたるＲＥＸＥＲ及び１０個のクローンの配列決定後、示した書き換えランドスケープを生成した。これにより、予測タンパク質をコードする「遺伝子」である、ｙｃｅＱにおける最小の明確な書き換えが明らかになったが、この遺伝子に関して、転写、タンパク質合成又は相同の証拠は存在していない（Pundir, S., et al., 2017. Methods Mol Biol, 1558, 41-55）。ｙｃｅＱにおける全ての標的コドンを個々のクローンにおいて少なくとも１回書き換えたが、決して同時には書き換えなかった；それ故、最低限の書き換えランドスケープはゼロにはならず、０／１０のクローンを完全に書き換えた。これは、標的化された位置の間のエピスタシスと一致する。書き換えランドスケープの下のマップにおいて、必須として注釈を付けた配列及び標的コドンを示す。配列位置（ｘ軸）はパネルａを基準にしている。ｃ、断片９におけるｒｎｅ周囲の領域の設計の変更。上部、ｙｃｅＱ書き換え及びｒｎｅ（ＲＮＡｓｅＥをコードする）調節配列の元の設計。標的コドンを示す。Ｐｒｎｅ１、２、３は、必須遺伝子ｒｎｅについてのプロモーターである；これらは仮定的遺伝子ｙｃｅＱ内及び周囲に見出される。主要プロモーターＰ１ｒｎｅの－１０配列は本発明者らの初期設計によって変異されている。転写産物分解を媒介するためにＲＮＡｓｅＥに結合するヘアピン１（ｈｐ１）及びヘアピン２（ｈｐ２）を含有する配列を示す；この配列は残りの標的コドンを包含し、本発明者らの初期設計によっても変異されている。下部、ｙｃｅＱにおける第２のコドンを終止コドンで置換し、残りの標的コドンはそれらの元の配列を保持した。配列位置（ｘ軸）はパネルａを基準にしている。ｄ、ｃからのこの修飾された断片９をゲノムに組み込み、配列決定した４／５のクローンは完全に書き換えられた。グラフの軸はパネルａのものと同じである。配列決定した５個のクローンに由来する、修飾された断片９についての書き換えランドスケープを紫色で示す。パネルａからのデータは比較のために複製している。～断片３７ａにおけるｙａａＹの書き換えを示す図である。ａ、断片３７ａの書き換えランドスケープ。本発明者らの設計した断片３７ａの合成配列をＲＥＸＥＲによってゲノムに組み込み、６個のクローンをＮＧＳによって完全に配列決定した。ほとんどのコドン置換は受け入れられたが、６．５ｋｂ領域の書き換えは一貫して拒絶された。配列決定した６個のクローンにおいて決して書き換えられなかった標的コドン位置を黒色の点で示す。ｂ、問題のある標的コドンの同定。同定した６．５ｋｂの問題のある領域内で、本発明者らは最初に、非必須遺伝子（薄い灰色の矢印）より必須遺伝子（濃い灰色の矢印）におけるコドンに焦点を当てた。２４個のクローンのサンガー配列決定（黒色のバー）により、２個のクローンが、必須遺伝子の小区画内で６個の全ての標的コドンにおいて書き換えられたことが示された。これらの２個のクローンの必須遺伝子における残りの標的コドンのサンガー配列決定により、１個のクローンが１７個の全ての標的コドンにおいて書き換えられたことが明らかになった。このクローンをＮＧＳによって完全に配列決定し、書き換えランドスケープを生成するために使用し、各標的コドンは、書き換えられたか、又は書き換えられなかったかのいずれかである。これにより、本発明者らは、（ａ）における書き換えランドスケープと組み合わせて、ｒｉｂＦの１．８ｋｂ上流の問題のある領域を同定することができた。ここで、本発明者らは、必須ｒｉｂＦ遺伝子に最も近いコドンとして遺伝子ｒｐｓＴ及びｙａａＹにおける４個の標的コドンに焦点を当てた。この配列にわたる３３個のクローンのサンガー配列決定により、仮定的遺伝子ｙａａＹにおけるＳｅｒ７０についてのコドンである、決して書き換えられなかった１個のコドンのみが明らかになった（配列決定の結果をｒｓｐＴ及びｙａａＹの遺伝子マップ上にスケーリングした灰色として示す）。したがって、本発明者らは、ｙａａＹにおける代替のコドン置換を調査した。ｃ、仮定的遺伝子ｙａａＹにおける代替のコドン置換。この遺伝子におけるＳｅｒ７０位において、ＡＧＴでのＴＣＡの置換は成功しなかった。代替のコドン置換スキームを調査するために、構成的ＥＭ７プロモーター上の二重選択マーカーであるｐｈｅＳ^＊－Ｈｙｇ^Ｒ、その後のＲＢＳを、Ｓｅｒ７０についてのコドンの１２ｂｐ上流であるｙａａＹに導入した。次いで、ラムダレッド組換えによって、７０位に代替のコドンを導入する直鎖状二本鎖ＤＮＡを使用してカセットを置換したクローンを選択するために陰性選択マーカーを使用した。ＡＧＴを有する直線状二本鎖ＤＮＡは組み込まなかったが（０／１６のクローン）、ＴＣＣ（２／１６）、ＴＣＧ（２／１６）、ＴＣＴ（６／１６）及びＡＧＣ（９／１６）を有するｄｓＤＮＡの組み込みは生存可能であることが証明された。ｄ、仮定的遺伝子ｙａａＹにおけるＳｅｒ７０位にＡＧＣを担持する、正確な型の断片３７ａを含有するＢＡＣでのＲＥＸＥＲの書き換えランドスケープ。ＲＥＸＥＲによって組み込んだ場合、本発明者らは、１／７の完全に書き換えられたクローンを同定した。ｙａａＹにおけるＳｅｒ７０位のＡＧＣは４／７のクローンに導入された。必須タンパク質ＲＮＡｓｅＥをコードするｒｎｅにおける調節エレメントでの仮定的遺伝子ｙｃｅＱ重複の置き換えを示す図である。ａ、本発明者らの元の設計では、仮定的遺伝子ｙｃｅＱにおけるＴＣＡからＡＧＴへのプログラムされた置き換えにより、Ｐ１ｒｎｅの－１０プロモーターエレメントの変異がもたらされる（箱で囲んでいる）。ｒｎｅ転写についてのこのプロモーターの転写開始部位（ｔｓｓ）は矢印で示す；これはｒｎｅ転写についての主要プロモーターである。ｂ、標的コドンの置き換えは、ｒｎｅ転写産物の長い５’ＵＴＲにおける重要な調節ヘアピンｈｐ２及びｈｐ３と重複し、それらを破壊する可能性があり得る。ｈｐ２及びｈｐ３は、ＲＮＡｓｅＥがその独自の転写産物の分解を促進するためにｍＲＮＡに動員される調節フィードバックループを媒介する。ｒｎｅ５’ＵＴＲの野生型二次構造の概略図が示される（Diwa, A., et al., 2000 Genes Dev 14, 1249-1260）。同義置換についての標的コドンは強調されている。～区画Ａ～Ｂ及びＨの完成を示す図である。ａ、ＧＥＮＥＳＩＳは断片４で開始し、本発明者らがｙｃｅＱを書き換えることができなかった断片９まで円滑に進行した。断片９の本発明者らの初期設計に関する問題の同定及び修正は、予測されるｙｃｅＱＯＲＦの開始時に終止コドンを導入することによって図６に記載されるように実行した。ｐｈｅＳ^＊－Ｈｙｇ^Ｒ（ｐＨ）二重選択カセットについての断片９の末端におけるｓａｃＢ－Ｃｍ^Ｒ（ｓＣ）二重選択カセットの交換後、この株を、断片４～１３（区画Ａ＋Ｂ）が完全に書き換えられる株を組み立てるためのコンジュゲーションについてのレシピエントとして作用させるように準備した。並行して、本発明者らは、書き換えられた断片４を含有する株を不完全な断片９にＧＥＮＥＳＩＳによって書き換え続けた；これにより、断片４～８及び１０～１３が完全に書き換えられ、断片９が部分的に書き換えられたアセンブリのための第２の株を生成した。次いで本発明者らは、断片４～１３（区間Ａ＋Ｂ）が完全に書き換えられる株を組み立てるためのコンジュゲーションについてのドナーを生成するために第２の株における断片１０の開始の３ｋｂ上流にｏｒｉＴを組み込んだ。ドナー及びレシピエント株のコンジュゲーションにより、区画Ａ及びＢが完全に書き換えられる株が得られた。ｂ、断片３７ａ及び１の個々のＲＥＸＥＲにより、不完全な書き換えが生じた。本発明者らは、両方のトラブルシューティングを独立して実行した（図５、図７）。修復を示す。次いで各株はＧＥＮＥＳＩＳの２つの独立したセットについての開始点として機能し、一方は、３７ａ～３７ｂ（左側）を生成し、ｒｐｓＬ－Ｋａｎ^Ｒ（ｒＫ）カセットで終了し、もう一方は、１～３（右側）を生成し、ｓａｃＢ－Ｃｍ^Ｒカセットおいて終了した。本発明者らは、断片１の開始の３ｋｂ上流のｏｒｉＴを組み込み、この株は、３７ａ～３７ｂへの１～３の誘導コンジュゲーションについてのドナーとして機能した。Ｃｍ^Ｒの獲得及びｒｐｓＬの喪失によって正確な産生物を選択した。これにより、単一の株において区画Ｈが完成した。書き換えられたゲノム区画のコンジュゲーションによる完全合成ゲノムを有する生物のアセンブリを示す図である。複数の個々の部分的に書き換えられたゲノムからの合成ゲノム区画を、コンジュゲーションによって単一の完全に書き換えられたゲノムに組み立てた（Ma, N. J., et al., 2014. Nat Protoc 9, 2285-2300）。ドナー（ｄ）及びレシピエント（ｒ）の株は固有の書き換えられたゲノム区画を保有する；書き換えられた重複する相同領域（３ｋｂ～４００ｋｂ）を、株を途切れなく組み換えるために利用した。３～５ｋｂの範囲の小さな相同領域をアスタリスク（^＊）で示す。本発明者らが５ｋｂより大きい相同（ＨＲ）を使用したコンジュゲーションは文字で示した。アセンブリのために、ドナーからの書き換えられたゲノム内容物を時計回りにコンジュゲートしてレシピエントにおける対応するｗｔゲノム区画を置換した。株ＡＢ及びＨの起源は図９に詳細に記載されているが、他の全ての個々の合成ゲノムはＧＥＮＥＳＩＳによって生成した（図４）。最後の完全に書き換えられたＡ～Ｈの株が組み立てられるまで、コンジュゲーションに続いて組換えを進行し、ＮＧＳ配列決定によって配列を検証した。書き換えられたゲノム区画の完全に書き換えられた生物へのアセンブリを示す図である。ａ、コンジュゲーションによる、部分的合成ドナー及びレシピエントゲノムの十分な合成ゲノムへの概略的なアセンブリ。レシピエント細胞において、書き換えられたゲノム区画を、ラムダレッドを介した組換え並びに陽性及び陰性選択によって、通常３～４ｋｂである、書き換えられたＤＮＡで伸長する；このステップは、ＧＥＮＥＳＩＳによって導入される書き換えられた配列の末端にゲノムマーカーを利用し、ドナー株において書き換えられた断片の末端との相同領域を提供する。ドナー株は、書き換えられたＤＮＡの末端に伝達起点（ｏｒｉＴ，origin of transfer）を組み込むことによって調製される。示した陽性及び陰性選択により、レシピエント株の生存を確実にし、ドナーから合成ＤＮＡを首尾よく組み込んだレシピエントを選択する。伝達を不可能にするｏｒｉＴ配列における変異を含有するＦ’プラスミドを使用して、ドナーゲノムのレシピエントへのコンジュゲーションを容易にした。＋２、Ｃｍ^Ｒ；－２、ＳａｃＢ；＋３、Ｈｙｇ^Ｒ；－３、ｐｈｅＳ^＊；＋４ゲンタマイシン^Ｒ；＋５、テトラサイクリン^Ｒ。ｂ、複数の個々の部分的に書き換えられたゲノムからの合成ゲノム区画を、コンジュゲーションの示した配列によって単一の完全に書き換えられたゲノムに組み立てた。ドナー（ｄ）及びレシピエント（ｒ）の株は固有の書き換えられたゲノム区画を保有する。ドナーからの書き換えられたゲノム内容物を時計回りにコンジュゲートしてレシピエントにおける対応するＷＴゲノム区画を置換した。最後の完全に書き換えられたＡ～Ｈの株を組み立てるまでコンジュゲーションを進行した。図１０は、全ての相同領域を含むプロセスをより詳細に示す。Ｓｙｎ６１における同義コドン圧縮の機能的結果を示す図である。ａ、ｐｒｆＡ、ｓｅｒＵ及びｓｅｒＴの同義コドン圧縮及び削除。灰色の箱は、ＷＴ大腸菌（ＷＴゲノム）におけるｔＲＮＡ及びそれらを解読する終結因子と一緒にセリンコドン及び終止コドンを示す。ｔＲＮＡアンチコドン及び終結因子は、それらが黒色の線で読み取られるコドンに結び付けられている。ｔＲＮＡ及び終結因子遺伝子は黒色の箱内に示される。ｓｅｒＴはＷＴ大腸菌におけるＴＣＡコドンを解読する唯一のｔＲＮＡであり、必要不可欠である。同義コドン圧縮（Ｓｙｎ．Ｃｏｄｏｎ．Ｃｏｍｐ．，Synonymous codon compression）により、ｉ）ＣＧＡアンチコドンを有するｔＲＮＡがコグネイトコドンを有するべきではなく、ii）ｓｅｒＴが非必須であるべきである、書き換えられたゲノムが得られる。標的コドンを読み取る全ての因子はＳｙｎ６１において非必須であるべきである。ｂ、直交ＭｍＰｙｌＲＳ／ｔＲＮＡ^Ｐｙｌ _ＣＧＡ対を使用した、非カノニカルアミノ酸（ｎｃＡＡ，non canonical amino acid）であるＮε－（（（２－メチルシクロプロパ－２－エン－１－イル）メトキシ）カルボニル）－Ｌ－リジン（ＣＹＰＫ，Nε-(((2-methylcycloprop-2-en-1-yl) methoxy) carbonyl)-L-lysine）の共翻訳取り込みは、ＭＤＳ４２において有毒であったが、Ｓｙｎ６１においては有毒ではなかった。ＣＹＰＫが提供されると、この対は用量依存的にＴＣＧコドンに応答してｎｃＡＡを取り込む。ＭＤＳ４２では、この取り込みは、プロテオームの誤った合成及び毒性を生じる。しかしながら、ＴＣＧコドンを含有しないＳｙｎ６１では、これは無毒性である。線は、各［ＣＹＰＫ］（０ｍＭ、０．５ｍＭ、１ｍＭ、２．５ｍＭ及び５ｍＭ）における３つの生物学的複製（各々点として示す）の平均に従う。「最大増殖％」は、ＣＹＰＫの非存在下で示した濃度のＣＹＰＫを最終ＯＤ_６００で割ることによって、最終ＯＤ_６００によって決定した。最終ＯＤ_６００は６００分後に決定した。ｃ、同義コドン圧縮により、Ｓｙｎ６１におけるｓｅｒＴの削除が可能となる。ＰｈｅＳ^＊－Ｈｙｇ^Ｒカセットでの置換の前（－）及び後（クローン１及び２）のｓｅｒＴ遺伝子座に隣接するＰＣＲ。図１４も参照のこと。図１６の完全なゲル。完全合成ゲノムを有する生物の特徴付けを示す図である。ａ、Ｓｙｎ６１及びＭＤＳ４２についての倍加時間。本発明者らの完全に合成の書き換えられた大腸菌Ｓｙｎ６１は、標準的な培地条件（ＬＢ＋２％グルコース中で９０．１分対５７．６分）で増殖させた場合、親株ＭＤＳ４２（Posfai, G. et al., 2006. Science 312, 1044-1046）のものより１．６倍多い倍加時間を有する。Ｓｙｎ６１とＭＤＳ４２との増殖速度の比は、３７℃でのＬＢ（炭素異化産物の抑制を低下させた）中で１．７であり、Ｍ９最少培地中で１．７であり、より豊富な培地（２ＸＴＹ）中で１．４であり、２５℃でのＬＢ中で２．５であり、４２℃でのＬＢ中で１．３である。異なる培地条件中でのＭＤＳ４２及びＳｙｎ６１のそれぞれについての倍加時間を記載する：３７℃でＬＢ、５８．３分、及び１００．６分；ＬＢ＋２％グルコース、５７．６分、及び９０．１分；Ｍ９最少培地、１３０．５分、及び２２１．１分；２ＸＴＹ、６８．２分、９２．６分；２５℃でＬＢ、８６．３分、及び２１８．４分；４２℃でＬＢ、７７．４分、及び９９．７分。ｓｅｒＶを有さない（－）又は有する（＋）プラスミドを保有するＳｙｎ６１は、０．９９の増殖速度の比（１３８．３分対１３６．２分）を提示した。倍加時間は、各株の１０個の独立して増殖させた生物学的複製の平均値±平均からの標準偏差を表す（方法を参照のこと）。ｂ、大腸菌株ＭＤＳ４２及びＳｙｎ６１の代表的な顕微鏡画像。試料を、63X 1.25NA Plan Neofluar位相対物レンズを使用して直立Zeiss Axiophot位相差顕微鏡で画像化した（方法を参照のこと）。ｃ、株ＭＤＳ４２及びＳｙｎ６１の顕微鏡画像から定量した細胞長のヒストグラム。ＭＤＳ４２についての平均細胞長は１．９７±０．５７μｍであり、Ｓｙｎ６１については２．３±０．７４μｍであった。両方の株についての指数増殖期の間にｎ＝５００の細胞の画像を撮影した。細胞長測定はNikon NIS Elementsソフトウェアで行った（方法を参照のこと）。ｄ、ＭＤＳ４２及びＳｙｎ６１プロテオームのラベルフリー定量。各株を、３つの生物学的複製で増殖させた。各生物学的複製を、技術的複製物のタンデム質量分析によって分析した。生物学的複製の技術的複製物を融合させた。試料全体で合計１，０８４個のタンパク質を定量した。存在量の差についてのＰ値を、少なくとも２つの生物学的複製において定量したタンパク質について２標本Ｔ検定によって計算した。データにより、株の間で３つのタンパク質の存在量が有意に（Ｐ＝０．０１）異なることが示された：アミノペプチダーゼＮ（Ｐ０４８２５）及びペプチダーゼＴ（Ｐ２９７４５）はＳｙｎ６１において大きな比率を占めたが、３０Ｓリボソームタンパク質Ｓ２０（Ｐ０Ａ７Ｕ７）は小さな比率を占めた。ＬＦＱ値によって判断すると、株の間で１．１４倍を超えてタンパク質の存在量は異ならなかった。～Ｓｙｎ６１における同義コドン圧縮の結果を示す図である。ａ、大腸菌におけるｐｒｆＡ、ｓｅｒＵ及びｓｅｒＴの同義コドン圧縮及び削除。灰色の箱は、大腸菌のセリンコドン及び終止コドンを、ＷＴ大腸菌（ＷＴゲノム）においてそれらを解読するｔＲＮＡ及び終結因子と一緒に示す。ｔＲＮＡアンチコドン及び終結因子は、それらが黒色の線で読み取られるコドンに結び付けられている。ｔＲＮＡ及び終結因子遺伝子は黒色の箱内に示される。同義コドン圧縮（Ｓｙｎ．Ｃｏｄｏｎ．Ｃｏｍｐ．）により、ＴＣＧ及びＴＣＡコドンが除去されている、書き換えられたゲノムを有するＳｙｎ６１細胞が得られる。各コドンの存在量はその箱内に記載される。ｂ、示したＭｍＰｙｌＲＳ／ｔＲＮＡ^ＰｙｌアンチコドンであるＵＧＡを除いて、図１２ｂと同様である。ＭＤＳ４２においてよりＳｙｎ６１においてこのｔＲＮＡに対するコグネイトコドンが少ないため、ＣＹＰＫ付加は、観察されるように、Ｓｙｎ６１において毒性が低いと予測され得る。ｃ、示したＭｍＰｙｌＲＳ／ｔＲＮＡ^ＰｙｌアンチコドンであるＧＣＵを除いて、図１２ｂと同様である。ＭＤＳ４２においてよりＳｙｎ６１においてこのｔＲＮＡに対するコグネイトコドンが多いため、ＣＹＰＫ付加は、観察されるように、Ｓｙｎ６１において毒性が高いと予測され得る。ｄ、ｓｅｒＴ（濃い灰色）は、ラムダ－レッドを介した組換えによるＰｈｅＳ^＊－Ｈｙｇ^Ｒカセット（黒色）の挿入によって削除されている。組換えにより、示されるように、新たなジャンクション１及び２が生じる。各組換えについて、両方のジャンクションはサンガー配列決定によって配列が検証された。サンガークロマトグラムの上にある矢印は、ジャンクションの正確な位置、選択カセットに対応する配列を示し、バーは選択カセットに隣接するゲノム配列に対応する。組換えのためのｓｅｒＵ、ｓｅｒＴ及びｐｒｆＡに対して適切な相同性を有する選択カセットを生成するために使用されるプライマーは、図２３に提供される。ｅ、ｐｒｆＡ（濃い灰色）は、ラムダ－レッドを介した相同組換えによるｒｐｓＬ－Ｋａｎ^Ｒ（黒色）の挿入によって削除される。アガロースゲルには、図１２ｃに記載されているように注釈が付けられており、データの残りには、パネルｄに記載されているように注釈が付けられている。完全なゲルは図１６において利用可能である。ｆ、ｓｅｒＵ（濃い灰色）は、ラムダ－レッドを介した組換えによるＰｈｅＳ^＊－Ｈｙｇ^Ｒカセット（黒色）の挿入によって削除されている。アガロースゲルには、図１２ｃに記載されているように注釈が付けられており、データの残りには、パネルｄに記載されているように注釈が付けられている。完全なゲルは図１６において利用可能である。ゲノム合成のスケール並びに書き換えのスケール及び忠実度を示す図である。ａ、ゲノム及び染色体合成。Ｍ．ジェニタリウム（M. genitalium）及びＭ．ミコイデス（M. mycoides）（Gibson, D. G. et al., 2008. Science 319, 1215-1220;及びGibson, D. G. et al., 2010. Science 329, 52-56）について産生された合成ゲノムのサイズ（Ｍｂ）及びいくつかのＳ．セレビシエ染色体（Shen, Y. et al., 2017. Science 355, aaf4791; Annaluru, N. et al., 2014. Science 344, 55-58; Xie, Z. X. et al., 2017. Science 355, aaf4704; Mitchell, L. A. et al., 2017. Science 355, aaf4831; Dymond, J. S. et al., 2011. Nature 477, 471-476; Wu, Y. et al., 2017. Science 355, aaf4706; Zhang, W. et al., 2017. Science 355, aaf3981;及びRichardson, S. M. et al., 2017. Science 355, 1040-1044）は薄い灰色で示される。ここに提示されている合成大腸菌ゲノムのサイズは濃い灰色で示される。ｂ、ゲノム書き換えの試行。Ｓ．ティフィムリウム（S. typhimurium）における標的コドンＴＴＡ及びＴＴＧ（Lau, Y. H. et al., 2017. Nucleic Acids Res 45, 6971-6980）；大腸菌におけるＡＧＣ、ＡＧＴ、ＴＴＧ、ＴＴＡ、ＡＧＡ、ＡＧＧ、及びＴＡＧ（Ostrov, N. et al., 2016. Science 353, 819-822）；大腸菌におけるＡＧＡ及びＡＧＧ（Napolitano, M. G. et al., 2016. Proc Natl Acad Sci USA 113, E5588-5597）を書き換える試み、並びに大腸菌における全てのＴＡＧの書き換え（Lajoie, M. J. et al., 2013. Science 342, 357-360）は、薄い灰色で示される。大腸菌におけるＴＣＡ、ＴＣＧ、及びＴＡＧの全ての除去との比較をここに提示した（濃い灰色）。単一の株において書き換えられたコドンの総数をグラフで示し、各試行の単一の株において書き換えられた標的コドンの最大パーセンテージを示す。ｃ、ｂに示した実験についての書き換えられた標的コドンの数の関数としての報告されたプログラムされていない変異及びインデルの数。図１２についての完全なゲルを示す図である。完全なゲルは対応する図のパネルで示す。分子サイズ標準には注釈が付けられており、関連する図に示される領域は白色の輪郭で示される。～大腸菌ゲノムにおけるコドン及びアンチコドン相互作用を示す図である。２８個のセンスコドンはアンバー終止コドンと共に灰色で強調されている。その他のセンスコドンではなく、これらのセンスコドンのゲノムワイド除去は、ゲノムに残存する１つ又は２つ以上のセンスコドンを解読する能力を除去することなく、それらのコグネイトｔＲＮＡ全ての削除を可能にする。これは、センスコドンを非天然のモノマーに再割当するために必要であるが、十分ではない。セリン、ロイシン及びアラニンのアミノ酸のための内在性アミノアシル－ｔＲＮＡ合成酵素はそれらのコグネイトｔＲＮＡのアンチコドンを認識しないので、セリン、ロイシン及びアラニンのコドンボックスを強調する。これは、内在性合成酵素による誤ったアミノアシル化を導かないコグネイトアンチコドンを担持するｔＲＮＡを導入することによって、これらのボックス内のコドンの新しいアミノ酸への割当を容易にすることができる。ＭＤＳ４２ゲノム（ジェンバンク受託番号ＡＰ０１２３０６）における全６４トリプレットコドンの総コドン数、ワトソン－クリック塩基対形成及びゆらぎの両方による公知のコドン－アンチコドン相互作用全て、ｔＲＮＡアンチコドンの塩基修飾、ｔＲＮＡ遺伝子、並びにインビボで測定されたｔＲＮＡ相対存在量が報告されている。この分析によって、セリン、ロイシン、及びアラニン群（セリンコドンＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ；ロイシンコドンＣＴＧ、ＣＴＡ、ＴＴＧ、ＴＴＡ；及びアラニンコドンＧＣＧ、ＧＣＡ）から１０個のコドンを同定し、コドン－アンチコドン相互作用及びコドン再割当のためのアミノアシル－ｔＲＮＡ合成酵素認識基準の両方を満たす。設計された合成大腸菌ゲノム（配列番号１）を示す図である。オープンリーディングフレーム（ＯＲＦ，open reading frames）内のセリンコドンＴＣＧ及びＴＣＡ並びに終止コドンＴＡＧが、それぞれ、それらの同義ＡＧＣ、ＡＧＴ、及びＴＡＡによって体系的に置換されている大腸菌ＭＤＳ４２ゲノムの型。同義コドン圧縮及びリファクタリングについての定義された規則を使用して、１８，２１８個の全ての標的コドンがそれらの標的同義語に書き換えられているゲノムを設計する。最終合成大腸菌ゲノム（Ｓｙｎ６１）（配列番号２）を示す図である。ゲノム内の１．８×１０^４個の全ての標的コドンが書き換えられている、大腸菌Ｓｙｎ６１の配列。本発明者らの書き換えられたゲノムの合成は８個のみのプログラムされていない変異を導入し（表６）、これらの変異のうちの４個は、１００ｋｂのＢＡＣを調製している間に生じ、４個は書き換えプロセスの間に生じた。～合成ゲノムを組み立てるためのＢＡＣを示す図である。Ａ、ＢＡＣ－ｓａｃＢ－ＣｍＲ－ｒｐｓＬ。５’相同領域（ＨＲ）及びＣＲＩＳＰＲ／Ｃａｓ９プロトスペーサー配列（スペーサー１）が上流で隣接したｓａｃＢ－ＣｍＲ選択カセットを保有する注釈付きのＢＡＣベクターについてのヌクレオチド配列。ｓａｃＢ－ＣｍＲカセットは、３’相同領域、ＣＲＩＳＰＲ／Ｃａｓ９プロトスペーサー配列（スペーサー２）、及びｒｐｓＬ選択マーカーが下流で隣接している。Ｂ、－ＢＡＣ－ｒｐｓＬ－ＫａｎＲ－ｓａｃＢ。５’相同領域（ＨＲ）及びＣＲＩＳＰＲ／Ｃａｓ９プロトスペーサー配列（スペーサー１）が上流で隣接したｒｐｓＬ－ＫａｎＲ選択カセットを保有する注釈付きのＢＡＣベクターについてのヌクレオチド配列。ｒｐｓＬ－ＫａｎＲカセットは、３’相同領域、ＣＲＩＳＰＲ／Ｃａｓ９プロトスペーサー配列（スペーサー２）、及びｓａｃＢ選択マーカーが下流で隣接している。Ｃ、ＢＡＣ－ｒｐｓＬ－ＫａｎＲ－ｐｈｅＳ^＊－ＨｙｇＲ。５’相同領域（ＨＲ）及びＣＲＩＳＰＲ／Ｃａｓ９プロトスペーサー配列（スペーサー１）が上流で隣接したｒｐｓＬ－ＫａｎＲ選択カセットを保有する注釈付きのＢＡＣベクターについてのヌクレオチド配列。ｒｐｓＬ－ＫａｎＲカセットは、３’相同領域、ＣＲＩＳＰＲ／Ｃａｓ９プロトスペーサー配列（スペーサー２）、及びｐｈｅＳ^＊－ＨｙｇＲ選択マーカーが下流で隣接している。Ｄ、ＢＡＣ構築の表。ＲＥＸＥＲのための合成ＤＮＡ及び合成ＤＮＡ断片の間の相同領域を用いてＢＡＣを構築するために使用したオリゴヌクレオチド及び選択マーカー。２番目のタブは、ＲＥＸＥＲのために使用したプラスミド骨格及びプロトスペーサー配列を記載している。～例示的なスペーサープラスミドマップを示す図である。Ａ、スペーサープラスミドマップ。ＲＥＸＥＲのための直線状又は環状スペーサーとして使用されるスペーサー配列を有するＣＲＩＳＰＲ挿入物を含有するｐＫＷ１＿ＭＢ１ａｍｐ＿スペーサー＿ＲＥＸＥＲ２の例示的なマップ。Ｂ、第２世代スペーサープラスミドマップ。ＲＥＸＥＲのための環状第２世代スペーサーとして使用されるスペーサー配列を有するＣＲＩＳＰＲ挿入物を含有するｐＫＷ３＿ＭＢ１ａｍｐ＿スペーサー＿ＲＥＸＥＲ２の例示的なマップ。～コンジュゲーションのためのコンストラクトを示す図である。Ａ、ゲンタマイシン耐性ＯｒｉＴカセット。Ｂ、コンジュゲーションコンストラクトのためのプライマー。コンジュゲーションのために使用したオリゴヌクレオチドプライマー。Ｃ、pJF146。自己伝達しないＦ’プラスミド。削除実験のためのプライマーを示す図である。Ｓｙｎ６１におけるｔＲＮＡｓｅｒＴ及びｓｅｒＵ並びに終結因子ｐｒｆＡの削除のために使用したオリゴヌクレオチドプライマー。

詳細な説明
本明細書で使用される場合、「含む（comprising）」、「含む（comprises）」及び「から構成される（comprised of）」という用語は、「包含する（including）」若しくは「包含する（includes）」、又は「含有する（containing）」若しくは「含有する（contains）」と同義であり、包括的又はオープンエンドであり、付加的な列挙されていない構成、要素又はステップを排除しない。「含む（comprising）」、「含む（comprises）」及び「から構成される（comprised of）」という用語は、「からなる（consisting of）」という用語も包含する。

合成ゲノム
ゲノム
本明細書で使用される場合、「ゲノム」は、遺伝子及び非コードＤＮＡの両方を包含する、生物の遺伝物質である。本明細書で使用される場合、「合成ゲノム」は、合成的に構築されたゲノムである。典型的に、合成ゲノムは、既存（すなわち、「親」）のゲノムの遺伝子修飾によって産生される。それ故、合成ゲノムは親ゲノムに由来し得る、すなわち、１つ又は２つ以上の遺伝子修飾を含むことを除いて親ゲノムと同一であり得る。当業者は、合成ゲノムの基になっている親ゲノム及び実行される遺伝子修飾を容易に同定することができるであろう。本明細書で使用される場合、「親ゲノム」は、任意の天然に存在する、市販の、寄託された、カタログに載っている若しくはそうでなければ周知のゲノム、又はそれらの誘導体であり得る。

本発明の合成ゲノムは合成原核生物ゲノムである。原核生物は、膜結合型核、ミトコンドリア、又は任意の他の膜結合型細胞小器官を欠く単細胞生物である。原核生物は、２つの領域である、古細菌及び細菌に分けられる。原核生物のゲノムは一般に、ＤＮＡの環状二本鎖片であり、その複数のコピーはいかなる時でも存在し得る。

好ましくは、本発明の合成ゲノムは合成細菌ゲノムである。好ましくは、合成細菌ゲノムは、異種タンパク質産生、特に１つ又は２つ以上の非タンパク質性アミノ酸を含むポリペプチド（例えば、Ferrer-Miralles, N. and Villaverde, A., 2013. Microbial Cell Factories, 12:113に記載されているもの）の産生に適している。適切な細菌ゲノムとしては、エシェリキア（escherichia）（例えば、大腸菌）、カウロバクテリア（caulobacteria）（例えば、カウロバクター・クレセンタス（Caulobacter crescentus））、光合成細菌（例えば、ロドバクター・スフェロイデス（Rodhobacter sphaeroides））、低温適応型細菌（例えば、シュードアルテロモナス・ハロプランクティス（Pseudoalteromonas haloplanktis）、シェワネラ属種（Shewanella sp.）株Ａｃ１０）、シュードモナス（pseudomonads）（例えば、シュードモナス・フルオレッセンス（Pseudomonas fluorescens）、シュードモナス・プチダ（Pseudomonas putida）、シュードモナス・エルギノーザ（Pseudomonas aeruginosa））、好塩性細菌（例えば、ハロモナス・エロンガタ（Halomonas elongate）、クロモハロバクター・サレキシゲンス（Chromohalobacter salexigens））、ストレプトミセテス（streptomycetes）（例えば、ストレプトマイセス・リビダンス（Streptomyces lividans）、ストレプトマイセス・グリゼウス（Streptomyces griseus））、ノカルディア（nocardia）（例えば、ノカルディア・ラクタムジュランス（Nocardia lactamdurans））、マイコバクテリア（mycobacteria）（例えば、マイコバクテリウム・スメグマティス（Mycobacterium smegmatis））、コリネフォーム細菌（coryneform bacteria）（例えば、コリネバクテリウム・グルタミクム（Corynebacterium glutamicum）、コリネバクテリウム・アンモニアゲネス（Corynebacterium ammoniagenes）、ブレビバクテリウム・ラクトファーメンタム（Brevibacterium lactofermentum））、バシラス（bacilli）（例えば、バシラス・サチリス（Bacillus subtilis）、バシラス・ブレビス（Bacillus brevis）、バシラス・メガテリウム（Bacillus megaterium）、バシラス・リケニフォルミス（Bacillus licheniformis）、バシラス・アミロリケファシエンス（Bacillus amyloliquefaciens））、及び乳酸菌（例えば、ラクトコッカス・ラクチス（Lactococcus lactis）、ラクトバチルス・プランタルム（Lactobacillus plantarum）、ラクトバチルス・カゼイ（Lactobacillus casei）、ラクトバチルス・ロイテリ（Lactobacillus reuteri）、ラクトバチルス・ガセリ（Lactobacillus gasseri））ゲノムが挙げられる。一部の実施形態では、合成ゲノムは合成グラム陰性細菌ゲノムである。

細菌ゲノムは、約１３０ｋｂ～１４Ｍｂ超の程度のサイズの範囲であり得る。それ故、一部の実施形態では、本発明の合成原核生物ゲノムは、１００ｋｂ～２０Ｍｂ、又は１３０ｋｂ～１５Ｍｂ、又は２００ｋｂ～１５Ｍｂ、又は３００ｋｂ～１５Ｍｂ、又は５００ｋｂ～１５Ｍｂ、又は１Ｍｂ～１５Ｍｂ、又は１Ｍｂ～１０Ｍｂ、又は１Ｍｂ～８Ｍｂ、又は１Ｍｂ～６Ｍｂ、又は２Ｍｂ～６Ｍｂ、又は２Ｍｂ～５Ｍｂ、又は３Ｍｂ～５Ｍｂ、又は約４Ｍｂのサイズである。合成原核生物ゲノムは、１００個若しくは１０１個以上、２００個若しくは２０１個以上、３００個若しくは３０１個以上、４００個若しくは４０１個以上、５００個若しくは５０１個以上、６００個若しくは６０１個以上、７００個若しくは７０１個以上、８００個若しくは８０１個以上、９００個若しくは９０１個以上、１０００個若しくは１００１個以上、１５００個若しくは１５０１個以上、又は２０００個若しくは２００１個以上の遺伝子、好ましくは１０００個若しくは１００１個以上の遺伝子を含むことができる。合成原核生物ゲノムは、１００個若しくは１０１個以上、２００個若しくは２０１個以上、３００個若しくは３０１個以上、４００個若しくは４０１個以上、５００個若しくは５０１個以上、６００個若しくは６０１個以上、７００個若しくは７０１個以上、８００個若しくは８０１個以上、９００個若しくは９０１個以上、１０００個若しくは１００１個以上、１５００個若しくは１５０１個以上、又は２０００個若しくは２００１個以上の遺伝子を含むことができ、それらの遺伝子について翻訳及び／又は予測タンパク質産物の証拠が存在し、好ましくは１０００個又は１００１個以上の遺伝子である。好ましくは、合成原核生物ゲノムは、１００個又は１０１個以上、２００個又は２０１個以上、３００個又は３０１個以上、４００個又は４０１個以上、５００個又は５０１個以上の必須遺伝子、好ましくは３００個又は３０１個以上の必須遺伝子を含む。

好ましくは、本発明の合成ゲノムは、合成の大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムである。これらは、Lukjancenko, O., et al., 2010. Microbial ecology, 60(4), pp.708-720; 及びKarberg, K.A., et al., 2011. PNAS, 108(50), pp.20154-20159に開示されているように系統学的に関連した種である。

より好ましくは、本発明の合成ゲノムは合成大腸菌ゲノムである。親ゲノムは、ＭＤＳ４２、Ｋ－１２、ＭＧ１６５５、ＢＬ２１、ＢＬ２１（ＤＥ３）、ＡＤ４９４、Ｏｒｉｇａｍｉ、ＨＭＳ１７４、ＢＬＲ（ＤＥ３）、ＨＭＳ１７４（ＤＥ３）、Ｔｕｎｅｒ（ＤＥ３）、Ｏｒｉｇａｍｉ２（ＤＥ３）、Ｒｏｓｅｔｔａ２（ＤＥ３）、Ｌｅｍｏ２１（ＤＥ３）、ＮｉＣｏ２１（ＤＥ３）、Ｔ７Ｅｘｐｒｅｓｓ、ＳＨｕｆｆｌｅＥｘｐｒｅｓｓ、Ｃ４１（ＤＥ３）、Ｃ４３（ＤＥ３）、及びｍ１５ｐＲＥＰ４又はそれらの誘導体を包含する任意の適切な大腸菌ゲノムであってもよい（Rosano, G.L. and Ceccarelli, E.A., 2014. Frontiers in microbiology, 5, p.172）。最も好ましくは、親ゲノムは、ＭＤＳ４２、ＭＧ１６５５、若しくはＢＬ２１又はそれらの誘導体である。ＭＧ１６５５は大腸菌の野生型株と見なされる。この株のゲノム配列のジェンバンクＩＤは、Ｕ０００９６である。ＢＬ２１は広範に市販されている。例えば、それは、カタログ番号Ｃ２５３０Ｈ（https://www.neb.com/products/c2530-bl21-competent-e-coli）でNew England BioLabs社から購入することができる。

一部の実施形態では、合成ゲノムは、少ない合成ゲノム又は最小合成ゲノムである。「少ないゲノム」は、親ゲノムのサイズが、非必須遺伝子及び／又は非コード領域を除去することによって低減しているものである。「最小ゲノム」は、例えば、ゲノムの全ての非必須領域の削除によって生存能を維持しながら、その最小サイズまで低減しているゲノムである。

本発明の合成ゲノムは生存可能なゲノムであり得る。本明細書で使用される場合、「生存可能なゲノム」とは、細胞の生存能を引き起こす及び／又は維持するのに十分な核酸配列を含有するゲノム、例えば、複製、転写、翻訳、エネルギー産生、輸送、膜及び細胞質成分の産生、並びに細胞分裂に必要とされる分子をコードするゲノムを指す。

好ましくは、１つ又は２つ以上のｔＲＮＡ又は終結因子が合成ゲノムから削除されてもよく、合成ゲノムは生存可能なままであり得る。例えば、置換（又は削除）されている１つ又は２つ以上のセンスコドンのみを解読するｔＲＮＡは非必須であり得る。同様に、ｔＲＮＡが解読する残りのセンスコドンが、代替のｔＲＮＡによっても解読され得る場合、置換（又は削除）されている１つ又は２つ以上のセンスコドンを解読するｔＲＮＡは非必須であり得る。例えば、ｔＲＮＡ^Ｓｅｒ _ＵＧＡをコードするｓｅｒＴは、大腸菌におけるＴＣＡコドンを解読する唯一のｔＲＮＡであるので、通常、必須である。しかしながら、合成ゲノムがＴＣＡコドンを含有しない場合、ｓｅｒＴは非必須であり得る。

センスコドン
本発明は、１つ若しくは２つ以上のセンスコドンの５つ若しくは４つ以下の出現を含む合成原核生物ゲノム；及び／又は合成原核生物ゲノムが、親ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ又は２つ以上のセンスコドンの出現を含む、親ゲノムに由来する合成原核生物ゲノム；及び／又は１つ若しくは２つ以上のセンスコドンの出現がない、１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は１０００個若しくは１００１個以上の遺伝子を含む合成原核生物ゲノムを提供する。

１つ又は２つ以上のセンスコドンは、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つのセンスコドンからなってもよい。好ましくは、１つ又は２つ以上のセンスコドンは、１つのセンスコドン又は２つのセンスコドン、最も好ましくは２つのセンスコドンからなる。

合成原核生物ゲノムは、１つ若しくは２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、若しくは８つ）のセンスコドンの５つ若しくは４つ以下（例えば、５つ、４つ、３つ、２つ、１つ）の出現を含んでもよいか、又は出現を含まなくてもよい。一部の実施形態では、合成原核生物ゲノムは、１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）のセンスコドンの各々の５つ又は４つ以下（例えば、５つ、４つ、３つ、２つ、１つ、０個）を含む。他の実施形態では、合成原核生物ゲノムは、合わせて（すなわち、全部で）１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）のセンスコドンの５つ又は４つ以下（例えば、５つ、４つ、３つ、２つ、１つ、０個）を含む。好ましい実施形態では、合成原核生物ゲノムは、１つのセンスコドンの出現を含まない。他の好ましい実施形態では、合成原核生物ゲノムは、２つのセンスコドンの出現を含まない。

合成原核生物ゲノムは、親ゲノムに由来してもよく、１つ若しくは２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、若しくは８つ）の天然センスコドンの５つ若しくは４つ以下（例えば、５つ、４つ、３つ、２つ、１つ）の出現を含むか、又は出現を含まない。一部の実施形態では、合成原核生物ゲノムは、１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）の天然センスコドンの各々の５つ又は４つ以下（例えば、５つ、４つ、３つ、２つ、１つ、０個）を含む。他の実施形態では、合成原核生物ゲノムは、合わせて（すなわち、全部で）１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）の天然センスコドンの５つ又は４つ以下（例えば、５つ、４つ、３つ、２つ、１つ、０個）を含む。好ましい実施形態では、合成原核生物ゲノムは、親ゲノムに由来し、１つの天然センスコドンの出現を含まない。他の好ましい実施形態では、合成原核生物ゲノムは、親ゲノムに由来し、２つの天然センスコドンの出現を含まない。

一部の実施形態では、合成原核生物ゲノムは、１００個若しくは１０１個以上、２００個若しくは２０１個以上、３００個若しくは３０１個以上、４００個若しくは４０１個以上、５００個若しくは５０１個以上、６００個若しくは６０１個以上、７００個若しくは７０１個以上、８００個若しくは８０１個以上、９００個若しくは９０１個以上、１０００個若しくは１００１個以上、１５００個若しくは１５０１個以上、又は２０００個若しくは２００１個以上の遺伝子、好ましくは１０００個若しくは１００１個以上の遺伝子を含む。一部の実施形態では、遺伝子は、翻訳及び／又は予測タンパク質産物の証拠が存在するものである。例えば、合成原核生物ゲノムは、１００個若しくは１０１個以上、２００個若しくは２０１個以上、３００個若しくは３０１個以上、４００個若しくは４０１個以上、５００個若しくは５０１個以上、６００個若しくは６０１個以上、７００個若しくは７０１個以上、８００個若しくは８０１個以上、９００個若しくは９０１個以上、１０００個若しくは１００１個以上、１５００個若しくは１５０１個以上、又は２０００個若しくは２００１個以上の遺伝子、好ましくは１０００個若しくは１００１個以上の遺伝子を含むことができ、それらの遺伝子について翻訳及び／又は予測タンパク質産物の証拠が存在する。好ましくは、合成原核生物ゲノムは、１００個又は１０１個以上、２００個又は２０１個以上、３００個又は３０１個以上、４００個又は４０１個以上、５００個又は５０１個以上の必須遺伝子、好ましくは３００個又は３０１個以上の必須遺伝子を含む。好ましくは、（必須）遺伝子は、１つ又は２つ以上のセンスコドンの出現を有さない。

合成原核生物ゲノムは、親ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）のセンスコドンの出現を含んでもよい。一部の実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）のセンスコドンの各々の出現を含む。他の実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、合わせて１０％、５％、２％、１％、０．５％、０．１％未満の１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）のセンスコドンの出現を含む。好ましい実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つのセンスコドンを含む。他の好ましい実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の２つのセンスコドンを含む。

合成原核生物ゲノムは、１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）のセンスコドンの出現がない、１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は１０００個若しくは１００１個以上の遺伝子を含んでもよい。好ましくは、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）のセンスコドンの出現を有さない。好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、１つのセンスコドンの出現を有さない。他の好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、２つのセンスコドンの出現を有さない。実質的に全てとは、１０個又は９個以下（例えば、１０個、９個、８個、７個、６個、５個、４個、３個、２個、１個、又は０個）の遺伝子を除いて全てが１つ又は２つ以上のセンスコドンの出現を含むことを意味する。

合成原核生物ゲノムは、１つ若しくは２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）の天然センスコドンの出現がない、１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は１０００個若しくは１００１個以上の遺伝子を含んでもよい。好ましくは、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、１つ又は２つ以上（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つ）の天然センスコドンの出現を有さない。好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、１つの天然センスコドンの出現を有さない。他の好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、２つの天然センスコドンの出現を有さない。実質的に全てとは、１０個又は９個以下（例えば、１０個、９個、８個、７個、６個、５個、４個、３個、２個、１個、又は０個）の遺伝子を除いて全てが１つ又は２つ以上の天然センスコドンの出現を含むことを意味する。

好ましくは、遺伝子はタンパク質をコードし（例えば、遺伝子は翻訳及び／又は予測タンパク質産物の証拠が存在するものである）、及び／又は遺伝子は必須遺伝子である。それ故、より好ましい実施形態では、合成原核生物ゲノムは、１つ又は２つのセンスコドンの出現がない、１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は１０００個若しくは１００１個以上のタンパク質をコードする遺伝子及び／又は１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は３００個若しくは３０１個以上の必須遺伝子を含む。他のより好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全てのタンパク質をコードする遺伝子及び／又は必須遺伝子は、１つ又は２つのセンスコドンの出現を含まない。

好ましい実施形態では、タンパク質は１つ若しくは２つ以上のセンスコドンの残りの出現のいずれかから翻訳されず、及び／又は１つ若しくは２つ以上のセンスコドンの残りの出現を含む遺伝子は推定若しくは非コード遺伝子である。一部の実施形態では、１つ又は２つ以上のセンスコドンの残りの出現を含む遺伝子の翻訳は低減及び／又は阻止される（例えば、遺伝子は５’配列において終止コドンを含んでもよい）。

センスコドンのいずれかの残りの出現が、合成原核生物ゲノムが生存可能であることを確保するために必要な場合がある。例えば、合成原核生物ゲノムにおける１つ若しくは２つ以上のセンスコドンの残りの出現の１つ若しくは２つ以上、好ましくは全てが、必須遺伝子の調節エレメントに存在してもよく、及び／又は１つ若しくは２つ以上のセンスコドンの残りの出現の１つ若しくは２つ以上、好ましくは全てが、翻訳若しくは予測タンパク質産物についての証拠が存在しない遺伝子（すなわち、推定又は非コード遺伝子）にあってもよい。

本明細書で使用される場合、「センスコドン」は、アミノ酸をコードするヌクレオチドトリプレットである。それ故、センスコドンは、遺伝子予測によって、すなわち、タンパク質をコードするゲノムの領域（すなわち、遺伝子）及び対応するオープンリーディングフレーム（ＯＲＦ）を同定することによってゲノム内で同定され得る。典型的に、ゲノムは天然に６１個のセンスコドンを含む：ＧＣＴ、ＧＣＣ、ＧＣＡ、ＧＣＧ、ＣＧＴ、ＣＧＣ、ＣＧＡ、ＣＧＧ、ＡＧＡ、ＡＧＧ、ＡＡＴ、ＡＡＣ、ＧＡＴ、ＧＡＣ、ＴＧＴ、ＴＧＣ、ＣＡＡ、ＣＡＧ、ＧＡＡ、ＧＡＧ、ＧＧＴ、ＧＧＣ、ＧＧＡ、ＧＧＧ、ＣＡＴ、ＣＡＣ、ＡＴＴ、ＡＴＣ、ＡＴＡ、ＴＴＡ、ＴＴＧ、ＣＴＴ、ＣＴＣ、ＣＴＡ、ＣＴＧ、ＡＡＡ、ＡＡＧ、ＡＴＧ、ＴＴＴ、ＴＴＣ、ＣＣＴ、ＣＣＣ、ＣＣＡ、ＣＣＧ、ＴＣＴ、ＴＣＣ、ＴＣＡ、ＴＣＧ、ＡＧＴ、ＡＧＣ、ＡＣＴ、ＡＣＣ、ＡＣＡ、ＡＣＧ、ＴＧＧ、ＴＡＴ、ＴＡＣ、ＧＴＴ、ＧＴＣ、ＧＴＡ、及びＧＴＧ（ＤＮＡのコード鎖上で５’から３’に読む）。標準的な遺伝コードは６１個のトリプレットコドンを使用して２０種のカノニカルアミノ酸をコードする。２０種のアミノ酸のうちの１８種は、１つより多い同義コドンによってコードされる（図１７を参照のこと）。１つ又は２つ以上のセンスコドンは１つ又は２つ以上の天然センスコドン、すなわち、親ゲノムに存在するセンスコドンであり得る。

ＤＮＡの６１個のセンスコドンは対応するｍＲＮＡに転写され、続いて１つ又は２つ以上のｔＲＮＡによって解読される。ｔＲＮＡは、ｍＲＮＡのセンスコドンによって指示されるようにリボソームにアミノ酸を運ぶ。ｔＲＮＡは、相補的アンチコドンによって１つ又は２つ以上のセンスコドンを認識することができる。続いて、センスコドンの配列はポリペプチド（すなわち、アミノ酸の配列）に翻訳される。大腸菌ゲノムにおけるコドン及びアンチコドン相互作用は図１７に示される。

好ましくは、他のセンスコドンではなく、１つ又は２つ以上のセンスコドンのゲノムワイド除去により、前記１つ又は２つ以上のセンスコドンに対応する全てのコグネイトｔＲＮＡを、ゲノムに残っている１つ又は２つ以上のセンスコドンを解読する能力を除去することなく削除することができる。それ故、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＴＧ、ＧＴＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、ＴＴＡ、ＡＣＧ、ＡＣＡ、ＣＣＧ、ＣＣＡ、ＣＧＧ、ＣＧＡ、ＣＧＴ、ＣＧＣ、ＡＧＧ、ＡＧＡ、ＧＧＧ、ＧＧＡ、ＧＧＴ、ＧＧＣ、ＡＴＴ、及びＡＴＣから選択され得る。

セリン、ロイシン及びアラニンについてのアミノアシル－ｔＲＮＡ合成酵素は、それらのコグネイトｔＲＮＡのアンチコドンを認識しない。これは、内在性合成酵素による誤ったアミノアシル化を導かないコグネイトアンチコドンを担持するｔＲＮＡを導入することによって、これらのボックス内のコドンの新しいアミノ酸への割当を容易にすることができる。それ故、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択され得る。

好ましくは、１つ又は２つ以上のセンスコドンはこれらの基準の両方を満たすので、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択され得る。より好ましくは、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択される。最も好ましくは、１つ又は２つ以上のセンスコドンはＴＣＧ及び／又はＴＣＡである。

好ましくは、ゲノムが非タンパク質性アミノ酸へのコドン再割当と適合するように１つ又は２つ以上のセンスコドンは除去される。それ故、１つ又は２つ以上のセンスコドンは、ＴＣＡ、ＣＴＡ、又はＴＴＡのうちの１つ又は２つ以上を含んでもよい。あるいは、２つ又は３つ以上のセンスコドンが除去され、その２つ又は３つ以上のセンスコドンは、ＧＣＧ及びＧＣＡ；ＧＣＴ及びＧＣＣ；ＴＣＧ及びＴＣＡ；ＡＧＴ及びＡＧＣ；ＴＣＴ及びＴＣＣ；ＣＴＧ及びＣＴＡ；ＴＴＧ及びＴＴＡ；並びにＣＴＴ及びＣＴＣからなる群から選択される、センスコドン対のうちの１つ又は２つ以上を含む。好ましくは、２つ又は３つ以上のセンスコドンが除去され、その２つ又は３つ以上のセンスコドンは、ＧＣＧ及びＧＣＡ；ＴＣＧ及びＴＣＡ；ＡＧＴ及びＡＧＣ；ＣＴＧ及びＣＴＡ；並びにＴＴＧ及びＴＴＡからなる群から選択される、センスコドン対のうちの１つ又は２つ以上を含む。より好ましくは、２つ又は３つ以上のセンスコドンはＴＣＧ及びＴＣＡを含む。

センスコドンの除去を達成するために、それらは同義センスコドンで置換され得る。これは、コードされたタンパク質配列が変化しないことを確保するために好ましい。例えば、本発明は、親ゲノムにおける１つ又は２つ以上のセンスコドンの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、同義センスコドンで置換されている、合成原核生物ゲノムを提供する。当業者は、適切な同義センスコドン置換を推定することができる。例えば、大腸菌では、典型的に、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ及びＡＧＣの全てはセリンをコードし、典型的に、ＧＣＧ、ＧＣＡ、ＧＣＴ及びＧＣＣの全てはアラニンをコードし、典型的に、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ及びＴＴＡの全てはロイシンをコードする。

一部の実施形態では、置換は定義された置換であり、すなわち、１つのセンスコドンが単一の同義センスコドンで置換されている。好ましくは、親ゲノムにおける１つ又は２つ以上のセンスコドンの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、定義された（すなわち、単一の）同義センスコドンで置換されている。

例えば、定義された置換は、ＧＣＴ若しくはＧＣＣのいずれかで置換されたＧＣＧ；ＧＣＴ若しくはＧＣＣのいずれかで置換されたＧＣＡ；ＴＣＴ、ＴＣＣ、ＡＧＴ、若しくはＡＧＣのいずれか１つで置換されたＴＣＧ；ＴＣＴ、ＴＣＣ、ＡＧＴ、若しくはＡＧＣのいずれか１つで置換されたＴＣＡ；ＴＣＧ、ＴＣＡ、ＴＣＴ、若しくはＴＣＣのいずれか１つで置換されたＡＧＴ；ＴＣＧ、ＴＣＡ、ＴＣＴ、若しくはＴＣＣのいずれか１つで置換されたＡＧＣ；ＣＴＴ、ＣＴＣ、ＴＴＧ若しくはＴＴＡのいずれか１つで置換されたＣＴＧ；ＣＴＴ、ＣＴＣ、ＴＴＧ若しくはＴＴＡのいずれか１つで置換されたＣＴＡ；ＣＴＧ、ＣＴＡ、ＣＴＴ若しくはＣＴＣのいずれか１つで置換されたＴＴＧ；又はＣＴＧ、ＣＴＡ、ＣＴＴ若しくはＣＴＣのいずれか１つで置換されたＴＴＡであってもよい。好ましくは、１つ又は２つ以上の定義されたセンスコドン置換は、ＧＣＧからＧＣＴ又はＧＣＣのいずれか；ＧＣＡからＧＣＴ又はＧＣＣのいずれか；ＴＣＧからＡＧＴ又はＡＧＣのいずれか；ＴＣＡからＡＧＴ又はＡＧＣのいずれか；ＡＧＴからＴＣＡ又はＴＣＴのいずれか；ＡＧＣからＴＣＧ又はＴＣＣ又はＴＣＡのいずれか；ＴＴＧからＣＴＴ；及びＴＴＡからＣＴＣのうちの１つ又は２つ以上から選択される。より好ましくは、ＴＣＧ及び／又はＴＣＡはＡＧＣ及び／又はＡＧＴで置換されている。最も好ましくは、ＴＣＧはＡＧＣで置換され、及び／又はＴＣＡはＡＧＴで置換されている。

好ましくは、定義された置換は、ゲノムが非タンパク質性アミノ酸へのコドン再割当と適合するようなものである。例えば、（ｉ）ＧＣＧは、ＧＣＴ若しくはＧＣＣのいずれかで置換されていてもよく、ＧＣＡは、ＧＣＴ若しくはＧＣＣのいずれかで置換されていてもよく；（ii）ＴＣＧは、ＴＣＴ、ＴＣＣ、ＡＧＴ、若しくはＡＧＣのいずれかで置換されていてもよく、ＴＣＡは、ＴＣＴ、ＴＣＣ、ＡＧＴ、若しくはＡＧＣのいずれかで置換されていてもよく；（iii）ＡＧＴは、ＴＣＧ、ＴＣＡ、ＴＣＴ、若しくはＴＣＣのいずれかで置換されていてもよく、ＡＧＣは、ＴＣＧ、ＴＣＡ、ＴＣＴ、若しくはＴＣＣのいずれかで置換されていてもよく；（iv）ＣＴＧは、ＣＴＴ、ＣＴＣ、ＴＴＧ若しくはＴＴＡのいずれかで置換されていてもよく、ＣＴＡは、ＣＴＴ、ＣＴＣ、ＴＴＧ若しくはＴＴＡのいずれかで置換されていてもよく；又は（ｖ）ＴＴＧは、ＣＴＧ、ＣＴＡ、ＣＴＴ若しくはＣＴＣのいずれかで置換されていてもよく、ＴＴＡは、ＣＴＧ、ＣＴＡ、ＣＴＴ若しくはＣＴＣのいずれかで置換されていてもよい。

好ましくは、定義された置換スキームは、以下の表に列挙されたもののうちの１つ又は２つ以上である：

好ましくは、これらのコドン置換のいずれも、大腸菌において高度に保存された調節配列であるリボソーム結合部位（ＡＧＧＡＧＧ）に影響を及ぼさない。選択されたコドン置換は、生存能を評価するために小さな試験領域（例えば、必須標的遺伝子及び標的コドンの両方が豊富なゲノムの２０ｋｂ領域）で試験されてもよい。コドン置換が小さな試験領域で生存可能でない場合、それらは無視され得る。

定義された置換同義センスコドンでの親ゲノムにおける１つ又は２つ以上のセンスコドンの置換が生存可能なゲノムを生じない場合、代替の置換同義センスコドンが使用され得る。例えば、親ゲノムにおける１つ又は２つ以上のセンスコドンの出現の９９．９％が定義された（すなわち、単一の）同義センスコドンで置換されていてもよく、残りの０．１％が代替の同義センスコドンで置換されていてもよい。例えば、ＴＣＧの出現の９９．９％がＡＧＣで置換されていてもよく、０．１％がＴＣＴ、ＴＣＣ、ＡＧＴ若しくはＡＧＣで置換されていてもよく；及び／又はＴＣＡの出現の９９．９％がＡＧＴで置換されていてもよく、０．１％がＴＣＴ、ＴＣＣ、ＡＧＴ若しくはＡＧＣで置換されていてもよい。

本明細書で使用される場合、「終止コドン」は、タンパク質への翻訳の終結をコードするヌクレオチドトリプレットである。典型的に、ゲノムは３つの終止コドン：ＴＡＡ（「オーカー」）、ＴＧＡ（「オパール」又は「ウンバー（umber）」）及びＴＡＧ（「アンバー」）を天然に含む。

一部の実施形態では、合成原核生物ゲノムは、１つ若しくは２つの終止コドンの１０個若しくは９個以下、５個若しくは４個以下の出現をさらに含むか、又は出現を含まず、好ましくはアンバー終止コドン（ＴＡＧ）の１０個若しくは９個以下、５個若しくは４個以下の出現を含むか、又は出現を含まない。好ましくは、親原核生物ゲノムにおけるＴＡＧの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、又は全ては、ＴＡＡ（オーカー終止コドン）で置換されている。好ましい実施形態では、合成原核生物ゲノムはアンバー終止コドン（ＴＡＧ）の出現を含まず、親原核生物ゲノムにおけるＴＡＧの出現の全てはＴＡＡ（オーカー終止コドン）で置換されていてもよい。

したがって、好ましい実施形態では、本発明の合成原核生物ゲノムは、１つ若しくは２つ以上、又は２つ若しくは３つ以上のセンスコドンの出現を含まず、１つの終止コドン、好ましくはアンバー終止コドン（ＴＡＧ）の出現を含まない。より好ましい実施形態では、本発明の合成原核生物ゲノムは、２つのセンスコドン、好ましくはＴＣＧ及びＴＣＡの出現を含まず、アンバー終止コドン（ＴＡＧ）の出現を含まず、親原核生物ゲノムにおけるＴＣＧ、ＴＣＡ及びＴＡＧは同義コドンで置換されていてもよく、例えば、親原核生物ゲノムにおけるＴＣＧの出現の９９．９％又はそれ以上はＡＧＣで置換され、親原核生物ゲノムにおけるＴＣＡの出現の９９．９％又はそれ以上はＡＧＴで置換され、親原核生物ゲノムにおけるＴＡＧの出現の全てはＴＡＡで置換されている。

一部の実施形態では、合成原核生物ゲノムは、配列番号１又は配列番号２に対して少なくとも８０％、８５％、９０％、９５％、９８％、９９％、９９．５％、９９．８％、又は９９．９％同一であるポリヌクレオチド配列を含む。

本発明は、配列番号１又は配列番号２に対して少なくとも９８％、９８．５％、９９％、９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、９９．９５％又は１００％同一である合成原核生物ゲノムを提供する。

配列比較は、目測で行われてもよいか、又はより通常は、容易に利用可能な配列比較プログラムを活用して行われてもよい。これらの公的及び商業的に利用可能なコンピュータープログラムは、２つ又は３つ以上の配列の間の配列同一性を計算することができる。

配列同一性は連続する配列にわたって計算することができる、すなわち、１つの配列を他の配列と整列させ、１つの配列における各アミノ酸を、一度に１残基ずつ他の配列における対応するアミノ酸と直接比較する。これは「ギャップなし」アラインメントと呼ばれる。典型的に、このようなギャップなしアラインメントは、比較的少数の残基（例えば、５０未満の連続するアミノ酸）にわたってのみ実施される。

これは非常に簡単で一貫した方法であるが、この方法は、例えば、他の点では同一の配列対において、１つの挿入又は欠失がそれに続くアミノ酸残基をアラインメントから除外することを考慮しておらず、それ故、グローバルアラインメントを実施した場合に相同性％の大幅な低下をもたらす可能性がある。それによって、ほとんどの配列比較方法は、全体的な相同性スコアに過度にペナルティを与えることなく起こり得る挿入及び欠失を考慮に入れた最適なアラインメントを生成するように設計される。これは、配列アラインメントに「ギャップ」を挿入して局所的相同性を最大化することを試みることにより達成される。

しかしながら、これらのより複雑な方法は、同数の同一アミノ酸に関して、できる限り少ないギャップ（２つの比較配列間のより高い関連性を反映する）を有する配列アラインメントが多くのギャップを有するものより高いスコアを獲得するように、アラインメント中に生じる各ギャップに「ギャップペナルティ」を割り当てる。典型的に、ギャップの存在に比較的高いコストを課し、ギャップ中の各後続残基にはより小さいペナルティを課す「アフィンギャップコスト」を使用する。これは最もよく使用されるギャップスコアリングシステムである。高いギャップペナルティは当然、より少数のギャップを有する最適化されたアラインメントを生成する。ほとんどのアラインメントプログラムは、ギャップペナルティを変更することができる。しかしながら、配列比較のためにこのようなソフトウェアを使用する場合、デフォルト値を使用することが好ましい。例えば、GCG Wisconsin Bestfitパッケージ（下記参照）を使用する場合、アミノ酸配列のデフォルトギャップペナルティは、１つのギャップに対しては－１２、また各伸長に対しては－４である。

そのため、配列同一性の最大％の計算には、最初に、ギャップペナルティを考慮した最適なアラインメントの生成が必要となる。このようなアラインメントを実行するための適切なコンピュータープログラムは、GCG Wisconsin Bestfitパッケージ（University of Wisconsin, U.S.A; Devereux et al., 1984, Nucleic Acids Research 12:387）である。配列比較を実施することができる他のソフトウェアの例としては、限定するものではないが、BLASTパッケージ（Ausubel et al., 1999 ibid - Chapter 18を参照のこと）、FASTA（Atschul et al., 1990, J. Mol. Biol., 403-410）及びGENEWORKS比較ツール一式が挙げられる。BLAST及びFASTAの両方は、オフライン及びオンライン検索に利用可能である（Ausubel et al., 1999 ibid, pages 7-58から7-60を参照のこと）。しかしながら、GCG Bestfitプログラムを使用することが好ましい。

適切には、配列同一性は配列の全体にわたって決定され得る。適切には、配列同一性は、本明細書中に列挙した配列と比較される候補配列の全体にわたって決定され得る。

最終的な配列同一性は同一性の観点から測定され得るが、アラインメントプロセスそれ自体は、典型的に、全か無かの対比較に基づくものではない。その代わり、化学的類似性又は進化距離に基づいて各ペアワイズ比較にスコアを割り当てる、スケーリングした類似性スコア行列が一般に使用される。慣用されるこのような行列の例は、BLOSUM62行列（BLASTプログラム一式のためのデフォルト行列）である。GCG Wisconsinプログラムは一般に、パブリックデフォルト値又は供給される場合、カスタムシンボル比較表のいずれかを使用する（さらなる詳細についてはユーザーマニュアルを参照のこと）。好ましくは、GCGパッケージにはパブリックデフォルト値、又は他のソフトウェアの場合にはデフォルト行列、例えばBLOSUM62が使用される。

ソフトウェアにより最適なアラインメントが生成されれば、配列同一性％を計算することができる。このソフトウェアは、典型的に、これを配列比較の一環として行い、数値結果をもたらす。

リファクタリング
ゲノムは、多数の重複するオープンリーディングフレーム（ＯＲＦ）を含有し、これは、３’、３’（逆向きのＯＲＦの間）又は５’、３’（同じ向きのＯＲＦの間）と分類され得る。１つ又は２つ以上のセンスコドン（すなわち、置換されるもの）は、親ゲノムにおける重複の両方のクラス内に見出され得る。

重複内の各ＯＲＦの１つ又は２つ以上のセンスコドンの置換が、いずれかのＯＲＦのコードされたタンパク質配列を変化させずに（すなわち、同義コドンを導入することによって）達成され得る場合、親ゲノムを編集（例えば、リファクタリング）する必要はなくてもよい。しかしながら、コードされたタンパク質配列が１つ又は２つ以上のセンスコドンの置換によって変化される（すなわち、１つ又は２つ以上の同義センスコドンがＯＲＦの一方又は両方に導入されない）場合、親ゲノムを編集（例えば、リファクタリングする）必要があり得る。

それ故、一部の実施形態では、親ゲノムにおける１つ又は２つ以上のセンスコドンを含む重複する領域を共有する１つ又は２つ以上の遺伝子対はリファクタリングされる。「リファクタリングされる」とは、遺伝子が、コードされたタンパク質配列に対する変化を阻止するために再編成されることを意味する。好ましくは、遺伝子対は、センスコドン置換（例えば、定義された同義コドン置換）が、遺伝子対の両方又はいずれかのコードされたタンパク質配列を変化させるものである。最も好ましくは、親ゲノムにおける１つ又は２つ以上のセンスコドンを含む重複する領域を共有する全ての遺伝子対はリファクタリングされ、その遺伝子対は、センスコドン置換（例えば、定義された同義コドン置換）が、遺伝子対の両方又はいずれかのコードされたタンパク質配列を変化させるものである。

３’、３’重複（すなわち、逆向きの遺伝子対）に関して、合成挿入物が遺伝子間に挿入されてもよい。３’、３’重複に関して、合成挿入物は重複する領域を含んでもよい。

５’、３’重複（すなわち、上流の遺伝子及び下流の遺伝子を含む、同じ向きの遺伝子対）に関して、合成挿入物が遺伝子間に挿入されてもよい。５’、３’重複に関して、合成挿入物は、（ｉ）終止コドン；（ii）重複する領域の上流から約２０～２００ｂｐ、又は２０～１００ｂｐ、又は２０～５０ｂｐ；及び（iii）重複する領域を含んでもよい。好ましくは、合成挿入物は、（ｉ）終止コドン；（ii）重複する領域の上流から約２０ｂｐ；及び（iii）重複する領域を含む。これにより、下流のＯＲＦについてのＲＢＳの配列及びこのＲＢＳとその開始コドンとの間の距離が保存される。

好ましい実施形態では、終止コドンは、下流の遺伝子について元の開始部位とインフレームである。好ましくは、終止コドンはＴＡＡである。

上記の特定の変異、すなわち、１つ又は２つ以上のセンスコドンの量を減少させることを目的とした変異（例えば、１つ若しくは２つ以上のセンスコドンの置換及び／又はリファクタリング）及びアンバー終止コドンの量を減少させることを目的とした変異とは別に、合成原核生物ゲノムは、親ゲノムと比較して、１０００個又は９９９個以下、１００個又は９９個以下、５０個又は４９個以下、２０個又は１９個以下、１０個又は９個以下の付加的（すなわち、プログラムされていない）変異を含んでもよい。好ましくは、合成原核生物ゲノムは、標的コドン当たり（すなわち、親ゲノムにおける１つ又は２つ以上のセンスコドンの出現当たり）２×１０^－４個又はそれ以下の付加的又はプログラムされていない変異を含む。

ポリヌクレオチド
本発明は、１つ又は２つ以上のセンスコドンの出現がない、１つ又は２つ以上の遺伝子を含むポリヌクレオチドを提供する。ポリヌクレオチドは、１つ又は２つ以上のセンスコドンの出現がない、２個若しくは３個以上、３個若しくは４個以上、４個若しくは５個以上、５個若しくは６個以上、１０個若しくは１１個以上、２０個若しくは２１個以上、３０個若しくは３１個以上、４０個若しくは４１個以上、５０個若しくは５１個以上、１００個若しくは１０１個以上、２００個若しくは２０１個以上、５００個若しくは５０１個以上、６００個若しくは６０１個以上、７００個若しくは７０１個以上、８００個若しくは８０１個以上、９００個若しくは９０１個以上、１０００個若しくは１００１個以上、１５００個若しくは１５０１個以上、又は２０００個若しくは２００１個以上の遺伝子を含んでもよい。好ましくは、ポリヌクレオチドは、１つ又は２つ以上のセンスコドンの出現がない、１００個又は１０１個以上の遺伝子を含む。より好ましくは、ポリヌクレオチドは、１つ又は２つ以上のセンスコドンの出現がない、１０００個又は１００１個以上の遺伝子を含む。

１つ又は２つ以上のセンスコドンは、１つ、２つ、３つ、４つ、５つ、６つ、７つ、又は８つのセンスコドンからなってもよい。好ましくは、１つ又は２つ以上のセンスコドンは、１つのセンスコドン又は２つのセンスコドン、最も好ましくは２つのセンスコドンからなる。それ故、好ましい実施形態では、ポリヌクレオチドは、１つ又は２つのセンスコドンの出現がない、１００個又は１０１個以上の遺伝子を含む。他の好ましい実施形態では、ポリヌクレオチドは、１つ又は２つのセンスコドンの出現がない、１０００個又は１００１個以上の遺伝子を含む。

１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＴＧ、ＧＴＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、ＴＴＡ、ＡＣＧ、ＡＣＡ、ＣＣＧ、ＣＣＡ、ＣＧＧ、ＣＧＡ、ＣＧＴ、ＣＧＣ、ＡＧＧ、ＡＧＡ、ＧＧＧ、ＧＧＡ、ＧＧＴ、ＧＧＣ、ＡＴＴ、及びＡＴＣから選択されてもよい。あるいは、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択されてもよい。好ましくは、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択される。より好ましくは、１つ又は２つ以上のセンスコドンは、ＴＣＧ、ＴＣＡ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択される。最も好ましくは、１つ又は２つ以上のセンスコドンはＴＣＧ及び／又はＴＣＡである。

遺伝子の１つ又は２つ以上のセンスコドンは同義センスコドンで置換され得る。好ましくは、置換は定義された置換であり、すなわち、１つのセンスコドンが単一の同義センスコドンで置換されている。

例えば、ＧＣＧは、ＧＣＴ若しくはＧＣＣで置換されていてもよく；ＧＣＡは、ＧＣＴ若しくはＧＣＣで置換されていてもよく；ＴＣＧは、ＴＣＴ、ＴＣＣ、ＡＧＴ、若しくはＡＧＣで置換されていてもよく；ＴＣＡは、ＴＣＴ、ＴＣＣ、ＡＧＴ、若しくはＡＧＣで置換されていてもよく；ＡＧＴは、ＴＣＧ、ＴＣＡ、ＴＣＴ、若しくはＴＣＣで置換されていてもよく；ＡＧＣは、ＴＣＧ、ＴＣＡ、ＴＣＴ、若しくはＴＣＣで置換されいててもよく；ＣＴＧは、ＣＴＴ、ＣＴＣ、ＴＴＧ若しくはＴＴＡで置換されいててもよく；ＣＴＡは、ＣＴＴ、ＣＴＣ、ＴＴＧ若しくはＴＴＡで置換されていてもよく；ＴＴＧは、ＣＴＧ、ＣＴＡ、ＣＴＴ若しくはＣＴＣで置換されていてもよく；又はＴＴＡは、ＣＴＧ、ＣＴＡ、ＣＴＴ若しくはＣＴＣで置換されていてもよい。好ましくは、１つ又は２つ以上の定義されたセンスコドン置換は、ＧＣＧからＧＣＴ又はＧＣＣ；ＧＣＡからＧＣＴ又はＧＣＣ；ＴＣＧからＡＧＴ又はＡＧＣ；ＴＣＡからＡＧＴ又はＡＧＣ；ＡＧＴからＴＣＡ又はＴＣＴ；ＡＧＣからＴＣＧ又はＴＣＣ又はＴＣＡ；ＴＴＧからＣＴＴ；及びＴＴＡからＣＴＣから選択される。より好ましくは、ＴＣＧ及び／又はＴＣＡは、ＡＧＣ及び／又はＡＧＴで置換されている。最も好ましくは、ＴＣＧはＡＧＣで置換され、及び／又はＴＣＡはＡＧＴで置換されている。

一部の実施形態では、遺伝子は、翻訳及び／又は予測タンパク質産物の証拠が存在するものである。

好ましい実施形態では、遺伝子は必須遺伝子である。必須遺伝子は、ｒｉｂＦ、ｌｓｐＡ、ｉｓｐＨ、ｄａｐＢ、ｆｏｌＡ、ｉｍｐ、ｙａｂＱ、ｆｔｓＬ、ｆｔｓＩ、ｍｕｒＥ、ｍｕｒＦ、ｍｒａＹ、ｍｕｒＤ、ｆｔｓＷ、ｍｕｒＧ、ｍｕｒＣ、ｆｔｓＱ、ｆｔｓＡ、ｆｔｓＺ、ｌｐｘＣ、ｓｅｃＭ、ｓｅｃＡ、ｃａｎ、ｆｏｌＫ、ｈｅｍＬ、ｙａｄＲ、ｄａｐＤ、ｍａｐ、ｒｐｓＢ、ｔｓｆ、ｐｙｒＨ、ｆｒｒ、ｄｘｒ、ｉｓｐＵ、ｃｄｓＡ、ｙａｅＬ、ｙａｅＴ、ｌｐｘＤ、ｆａｂＺ、ｌｐｘＡ、ｌｐｘＢ、ｄｎａＥ、ａｃｃＡ、ｔｉｌＳ、ｐｒｏＳ、ｙａｆＦ、ｈｅｍＢ、ｓｅｃＤ、ｓｅｃＦ、ｒｉｂＤ、ｒｉｂＥ、ｔｈｉＬ、ｄｘｓ、ｉｓｐＡ、ｄｎａＸ、ａｄｋ、ｈｅｍＨ、ｌｐｘＨ、ｃｙｓＳ、ｆｏｌＤ、ｅｎｔＤ、ｍｒｄＢ、ｍｒｄＡ、ｎａｄＤ、ｈｏｌＡ、ｒｌｐＢ、ｌｅｕＳ、ｌｎｔ、ｇｌｎＳ、ｆｌｄＡ、ｃｙｄＡ、ｉｎｆＡ、ｃｙｄＣ、ｆｔｓＫ、ｌｏｌＡ、ｓｅｒＳ、ｒｐｓＡ、ｍｓｂＡ、ｌｐｘＫ、ｋｄｓＢ、ｍｕｋＦ、ｍｕｋＥ、ｍｕｋＢ、ａｓｎＳ、ｆａｂＡ、ｍｖｉＮ、ｒｎｅ、ｆａｂＤ、ｆａｂＧ、ａｃｐＰ、ｔｍｋ、ｈｏｌＢ、ｌｏｌＣ、ｌｏｌＤ、ｌｏｌＥ、ｐｕｒＢ、ｍｉｎＥ、ｍｉｎＤ、ｐｔｈ、ｐｒｓＡ、ｉｓｐＥ、ｌｏｌＢ、ｈｅｍＡ、ｐｒｆＡ、ｐｒｍＣ、ｋｄｓＡ、ｔｏｐＡ、ｒｉｂＡ、ｆａｂＩ、ｔｙｒＳ、ｒｉｂＣ、ｙｄｉＬ、ｐｈｅＴ、ｐｈｅＳ、ｒｐｌＴ、ｉｎｆＣ、ｔｈｒＳ、ｎａｄＥ、ｇａｐＡ、ｙｅａＺ、ａｓｐＳ、ａｒｇＳ、ｐｇｓＡ、ｙｅｆＭ、ｍｅｔＧ、ｆｏｌＥ、ｙｅｊＭ、ｇｙｒＡ、ｎｒｄＡ、ｎｒｄＢ、ｆｏｌＣ、ａｃｃＤ、ｆａｂＢ、ｇｌｔＸ、ｌｉｇＡ、ｚｉｐＡ、ｄａｐＥ、ｄａｐＡ、ｄｅｒ、ｈｉｓＳ、ｉｓｐＧ、ｓｕｈＢ、ｔａｄＡ、ａｃｐＳ、ｅｒａ、ｒｎｃ、ｌｅｐＢ、ｒｐｏＥ、ｐｓｓＡ、ｙｆｉＯ、ｒｐｌＳ、ｔｒｍＤ、ｒｐｓＰ、ｆｆｈ、ｇｒｐＥ、ｃｓｒＡ、ｉｓｐＦ、ｉｓｐＤ、ｆｔｓＢ、ｅｎｏ、ｐｙｒＧ、ｃｈｐＲ、ｌｇｔ、ｆｂａＡ、ｐｇｋ、ｙｑｇＤ、ｍｅｔＫ、ｙｑｇＦ、ｐｌｓＣ、ｙｇｉＴ、ｐａｒＥ、ｒｉｂＢ、ｃｃａ、ｙｇｊＤ、ｔｄｃＦ、ｙｒａＬ、ｙｈｂＶ、ｉｎｆＢ、ｎｕｓＡ、ｆｔｓＨ、ｏｂｇＥ、ｒｐｍＡ、ｒｐｌＵ、ｉｓｐＢ、ｍｕｒＡ、ｙｒｂＢ、ｙｒｂＫ、ｙｈｂＮ、ｒｐｓＩ、ｒｐｌＭ、ｄｅｇＳ、ｍｒｅＤ、ｍｒｅＣ、ｍｒｅＢ、ａｃｃＢ、ａｃｃＣ、ｙｒｄＣ、ｄｅｆ、ｆｍｔ、ｒｐｌＱ、ｒｐｏＡ、ｒｐｓＤ、ｒｐｓＫ、ｒｐｓＭ、ｓｅｃＹ、ｒｐｌＯ、ｒｐｍＤ、ｒｐｓＥ、ｒｐｌＲ、ｒｐｌＦ、ｒｐｓＨ、ｒｐｓＮ、ｒｐｌＥ、ｒｐｌＸ、ｒｐｌＮ、ｒｐｓＱ、ｒｐｍＣ、ｒｐｌＰ、ｒｐｓＣ、ｒｐｌＶ、ｒｐｓＳ、ｒｐｌＢ、ｒｐｌＷ、ｒｐｌＤ、ｒｐｌＣ、ｒｐｓＪ、ｆｕｓＡ、ｒｐｓＧ、ｒｐｓＬ、ｔｒｐＳ、ｙｒｆＦ、ａｓｄ、ｒｐｏＨ、ｆｔｓＸ、ｆｔｓＥ、ｆｔｓＹ、ｙｈｈＱ、ｂｃｓＢ、ｇｌｙＱ、ｇｐｓＡ、ｒｆａＫ、ｋｄｔＡ、ｃｏａＤ、ｒｐｍＢ、ｄｆｐ、ｄｕｔ、ｇｍｋ、ｓｐｏＴ、ｇｙｒＢ、ｄｎａＮ、ｄｎａＡ、ｒｐｍＨ、ｒｎｐＡ、ｙｉｄＣ、ｔｎａＢ、ｇｌｍＳ、ｇｌｍＵ、ｗｚｙＥ、ｈｅｍＤ、ｈｅｍＣ、ｙｉｇＰ、ｕｂｉＢ、ｕｂｉＤ、ｈｅｍＧ、ｙｉｈＡ、ｆｔｓＮ、ｍｕｒＩ、ｍｕｒＢ、ｂｉｒＡ、ｓｅｃＥ、ｎｕｓＧ、ｒｐｌＪ、ｒｐｌＬ、ｒｐｏＢ、ｒｐｏＣ、ｕｂｉＡ、ｐｌｓＢ、ｌｅｘＡ、ｄｎａＢ、ｓｓｂ、ａｌｓＫ、ｇｒｏＳ、ｐｓｄ、ｏｒｎ、ｙｊｅＥ、ｒｐｓＲ、ｃｈｐＳ、ｐｐａ、ｖａｌＳ、ｙｊｇＰ、ｙｊｇＱ、及びｄｎａＣからなるリストのうちの１つ又は２つ以上から選択されてもよい。

好ましくは、必須遺伝子は、ｒｉｂＦ、ｌｓｐＡ、ｉｓｐＨ、ｄａｐＢ、ｆｏｌＡ、ｉｍｐ、ｙａｂＱ、ｌｐｘＣ、ｓｅｃＭ、ｓｅｃＡ、ｃａｎ、ｆｏｌＫ、ｈｅｍＬ、ｙａｄＲ、ｄａｐＤ、ｍａｐ、ｒｐｓＢ、ｔｓｆ、ｐｙｒＨ、ｆｒｒ、ｄｘｒ、ｉｓｐＵ、ｃｄｓＡ、ｙａｅＬ、ｙａｅＴ、ｌｐｘＤ、ｆａｂＺ、ｌｐｘＡ、ｌｐｘＢ、ｄｎａＥ、ａｃｃＡ、ｔｉｌＳ、ｐｒｏＳ、ｙａｆＦ、ｈｅｍＢ、ｓｅｃＤ、ｓｅｃＦ、ｒｉｂＤ、ｒｉｂＥ、ｔｈｉＬ、ｄｘｓ、ｉｓｐＡ、ｄｎａＸ、ａｄｋ、ｈｅｍＨ、ｌｐｘＨ、ｃｙｓＳ、ｆｏｌＤ、ｅｎｔＤ、ｍｒｄＢ、ｍｒｄＡ、ｎａｄＤ、ｈｏｌＡ、ｒｌｐＢ、ｌｅｕＳ、ｌｎｔ、ｇｌｎＳ、ｆｌｄＡ、ｃｙｄＡ、ｉｎｆＡ、ｃｙｄＣ、ｆｔｓＫ、ｌｏｌＡ、ｓｅｒＳ、ｒｐｓＡ、ｍｓｂＡ、ｌｐｘＫ、ｋｄｓＢ、ｍｕｋＦ、ｍｕｋＥ、ｍｕｋＢ、ａｓｎＳ、ｆａｂＡ、ｍｖｉＮ、ｒｎｅ、ｆａｂＤ、ｆａｂＧ、ａｃｐＰ、ｔｍｋ、ｈｏｌＢ、ｌｏｌＣ、ｌｏｌＤ、ｌｏｌＥ、ｐｕｒＢ、ｍｉｎＥ、ｍｉｎＤ、ｐｔｈ、ｐｒｓＡ、ｉｓｐＥ、ｌｏｌＢ、ｈｅｍＡ、ｐｒｆＡ、ｐｒｍＣ、ｋｄｓＡ、ｔｏｐＡ、ｒｉｂＡ、ｆａｂＩ、ｔｙｒＳ、ｒｉｂＣ、ｙｄｉＬ、ｐｈｅＴ、ｐｈｅＳ、ｒｐｌＴ、ｉｎｆＣ、ｔｈｒＳ、ｎａｄＥ、ｇａｐＡ、ｙｅａＺ、ａｓｐＳ、ａｒｇＳ、ｐｇｓＡ、ｙｅｆＭ、ｍｅｔＧ、ｆｏｌＥ、ｙｅｊＭ、ｇｙｒＡ、ｎｒｄＡ、ｎｒｄＢ、ｆｏｌＣ、ａｃｃＤ、ｆａｂＢ、ｇｌｔＸ、ｌｉｇＡ、ｚｉｐＡ、ｄａｐＥ、ｄａｐＡ、ｄｅｒ、ｈｉｓＳ、ｉｓｐＧ、ｓｕｈＢ、ｔａｄＡ、ａｃｐＳ、ｅｒａ、ｒｎｃ、ｌｅｐＢ、ｒｐｏＥ、ｐｓｓＡ、ｙｆｉＯ、ｒｐｌＳ、ｔｒｍＤ、ｒｐｓＰ、ｆｆｈ、ｇｒｐＥ、ｃｓｒＡ、ｉｓｐＦ、ｉｓｐＤ、ｆｔｓＢ、ｅｎｏ、ｐｙｒＧ、ｃｈｐＲ、ｌｇｔ、ｆｂａＡ、ｐｇｋ、ｙｑｇＤ、ｍｅｔＫ、ｙｑｇＦ、ｐｌｓＣ、ｙｇｉＴ、ｐａｒＥ、ｒｉｂＢ、ｃｃａ、ｙｇｊＤ、ｔｄｃＦ、ｙｒａＬ、ｙｈｂＶ、ｉｎｆＢ、ｎｕｓＡ、ｆｔｓＨ、ｏｂｇＥ、ｒｐｍＡ、ｒｐｌＵ、ｉｓｐＢ、ｍｕｒＡ、ｙｒｂＢ、ｙｒｂＫ、ｙｈｂＮ、ｒｐｓＩ、ｒｐｌＭ、ｄｅｇＳ、ｍｒｅＤ、ｍｒｅＣ、ｍｒｅＢ、ａｃｃＢ、ａｃｃＣ、ｙｒｄＣ、ｄｅｆ、ｆｍｔ、ｒｐｌＱ、ｒｐｏＡ、ｒｐｓＤ、ｒｐｓＫ、ｒｐｓＭ、ｓｅｃＹ、ｒｐｌＯ、ｒｐｍＤ、ｒｐｓＥ、ｒｐｌＲ、ｒｐｌＦ、ｒｐｓＨ、ｒｐｓＮ、ｒｐｌＥ、ｒｐｌＸ、ｒｐｌＮ、ｒｐｓＱ、ｒｐｍＣ、ｒｐｌＰ、ｒｐｓＣ、ｒｐｌＶ、ｒｐｓＳ、ｒｐｌＢ、ｒｐｌＷ、ｒｐｌＤ、ｒｐｌＣ、ｒｐｓＪ、ｆｕｓＡ、ｒｐｓＧ、ｒｐｓＬ、ｔｒｐＳ、ｙｒｆＦ、ａｓｄ、ｒｐｏＨ、ｆｔｓＸ、ｆｔｓＥ、ｆｔｓＹ、ｙｈｈＱ、ｂｃｓＢ、ｇｌｙＱ、ｇｐｓＡ、ｒｆａＫ、ｋｄｔＡ、ｃｏａＤ、ｒｐｍＢ、ｄｆｐ、ｄｕｔ、ｇｍｋ、ｓｐｏＴ、ｇｙｒＢ、ｄｎａＮ、ｄｎａＡ、ｒｐｍＨ、ｒｎｐＡ、ｙｉｄＣ、ｔｎａＢ、ｇｌｍＳ、ｇｌｍＵ、ｗｚｙＥ、ｈｅｍＤ、ｈｅｍＣ、ｙｉｇＰ、ｕｂｉＢ、ｕｂｉＤ、ｈｅｍＧ、ｙｉｈＡ、ｆｔｓＮ、ｍｕｒＩ、ｍｕｒＢ、ｂｉｒＡ、ｓｅｃＥ、ｎｕｓＧ、ｒｐｌＪ、ｒｐｌＬ、ｒｐｏＢ、ｒｐｏＣ、ｕｂｉＡ、ｐｌｓＢ、ｌｅｘＡ、ｄｎａＢ、ｓｓｂ、ａｌｓＫ、ｇｒｏＳ、ｐｓｄ、ｏｒｎ、ｙｊｅＥ、ｒｐｓＲ、ｃｈｐＳ、ｐｐａ、ｖａｌＳ、ｙｊｇＰ、ｙｊｇＱ、及びｄｎａＣからなるリストのうちの１つ又は２つ以上から選択されてもよい。

したがって、本発明は、ＴＣＧコドン及び／又はＴＣＡコドンがない、１つ又は２つ以上の必須遺伝子を含むポリヌクレオチドを提供し、その１つ又は２つ以上の必須遺伝子は、ｒｉｂＦ、ｌｓｐＡ、ｉｓｐＨ、ｄａｐＢ、ｆｏｌＡ、ｉｍｐ、ｙａｂＱ、ｌｐｘＣ、ｓｅｃＭ、ｓｅｃＡ、ｃａｎ、ｆｏｌＫ、ｈｅｍＬ、ｙａｄＲ、ｄａｐＤ、ｍａｐ、ｒｐｓＢ、ｔｓｆ、ｐｙｒＨ、ｆｒｒ、ｄｘｒ、ｉｓｐＵ、ｃｄｓＡ、ｙａｅＬ、ｙａｅＴ、ｌｐｘＤ、ｆａｂＺ、ｌｐｘＡ、ｌｐｘＢ、ｄｎａＥ、ａｃｃＡ、ｔｉｌＳ、ｐｒｏＳ、ｙａｆＦ、ｈｅｍＢ、ｓｅｃＤ、ｓｅｃＦ、ｒｉｂＤ、ｒｉｂＥ、ｔｈｉＬ、ｄｘｓ、ｉｓｐＡ、ｄｎａＸ、ａｄｋ、ｈｅｍＨ、ｌｐｘＨ、ｃｙｓＳ、ｆｏｌＤ、ｅｎｔＤ、ｍｒｄＢ、ｍｒｄＡ、ｎａｄＤ、ｈｏｌＡ、ｒｌｐＢ、ｌｅｕＳ、ｌｎｔ、ｇｌｎＳ、ｆｌｄＡ、ｃｙｄＡ、ｉｎｆＡ、ｃｙｄＣ、ｆｔｓＫ、ｌｏｌＡ、ｓｅｒＳ、ｒｐｓＡ、ｍｓｂＡ、ｌｐｘＫ、ｋｄｓＢ、ｍｕｋＦ、ｍｕｋＥ、ｍｕｋＢ、ａｓｎＳ、ｆａｂＡ、ｍｖｉＮ、ｒｎｅ、ｆａｂＤ、ｆａｂＧ、ａｃｐＰ、ｔｍｋ、ｈｏｌＢ、ｌｏｌＣ、ｌｏｌＤ、ｌｏｌＥ、ｐｕｒＢ、ｍｉｎＥ、ｍｉｎＤ、ｐｔｈ、ｐｒｓＡ、ｉｓｐＥ、ｌｏｌＢ、ｈｅｍＡ、ｐｒｆＡ、ｐｒｍＣ、ｋｄｓＡ、ｔｏｐＡ、ｒｉｂＡ、ｆａｂＩ、ｔｙｒＳ、ｒｉｂＣ、ｙｄｉＬ、ｐｈｅＴ、ｐｈｅＳ、ｒｐｌＴ、ｉｎｆＣ、ｔｈｒＳ、ｎａｄＥ、ｇａｐＡ、ｙｅａＺ、ａｓｐＳ、ａｒｇＳ、ｐｇｓＡ、ｙｅｆＭ、ｍｅｔＧ、ｆｏｌＥ、ｙｅｊＭ、ｇｙｒＡ、ｎｒｄＡ、ｎｒｄＢ、ｆｏｌＣ、ａｃｃＤ、ｆａｂＢ、ｇｌｔＸ、ｌｉｇＡ、ｚｉｐＡ、ｄａｐＥ、ｄａｐＡ、ｄｅｒ、ｈｉｓＳ、ｉｓｐＧ、ｓｕｈＢ、ｔａｄＡ、ａｃｐＳ、ｅｒａ、ｒｎｃ、ｌｅｐＢ、ｒｐｏＥ、ｐｓｓＡ、ｙｆｉＯ、ｒｐｌＳ、ｔｒｍＤ、ｒｐｓＰ、ｆｆｈ、ｇｒｐＥ、ｃｓｒＡ、ｉｓｐＦ、ｉｓｐＤ、ｆｔｓＢ、ｅｎｏ、ｐｙｒＧ、ｃｈｐＲ、ｌｇｔ、ｆｂａＡ、ｐｇｋ、ｙｑｇＤ、ｍｅｔＫ、ｙｑｇＦ、ｐｌｓＣ、ｙｇｉＴ、ｐａｒＥ、ｒｉｂＢ、ｃｃａ、ｙｇｊＤ、ｔｄｃＦ、ｙｒａＬ、ｙｈｂＶ、ｉｎｆＢ、ｎｕｓＡ、ｆｔｓＨ、ｏｂｇＥ、ｒｐｍＡ、ｒｐｌＵ、ｉｓｐＢ、ｍｕｒＡ、ｙｒｂＢ、ｙｒｂＫ、ｙｈｂＮ、ｒｐｓＩ、ｒｐｌＭ、ｄｅｇＳ、ｍｒｅＤ、ｍｒｅＣ、ｍｒｅＢ、ａｃｃＢ、ａｃｃＣ、ｙｒｄＣ、ｄｅｆ、ｆｍｔ、ｒｐｌＱ、ｒｐｏＡ、ｒｐｓＤ、ｒｐｓＫ、ｒｐｓＭ、ｓｅｃＹ、ｒｐｌＯ、ｒｐｍＤ、ｒｐｓＥ、ｒｐｌＲ、ｒｐｌＦ、ｒｐｓＨ、ｒｐｓＮ、ｒｐｌＥ、ｒｐｌＸ、ｒｐｌＮ、ｒｐｓＱ、ｒｐｍＣ、ｒｐｌＰ、ｒｐｓＣ、ｒｐｌＶ、ｒｐｓＳ、ｒｐｌＢ、ｒｐｌＷ、ｒｐｌＤ、ｒｐｌＣ、ｒｐｓＪ、ｆｕｓＡ、ｒｐｓＧ、ｒｐｓＬ、ｔｒｐＳ、ｙｒｆＦ、ａｓｄ、ｒｐｏＨ、ｆｔｓＸ、ｆｔｓＥ、ｆｔｓＹ、ｙｈｈＱ、ｂｃｓＢ、ｇｌｙＱ、ｇｐｓＡ、ｒｆａＫ、ｋｄｔＡ、ｃｏａＤ、ｒｐｍＢ、ｄｆｐ、ｄｕｔ、ｇｍｋ、ｓｐｏＴ、ｇｙｒＢ、ｄｎａＮ、ｄｎａＡ、ｒｐｍＨ、ｒｎｐＡ、ｙｉｄＣ、ｔｎａＢ、ｇｌｍＳ、ｇｌｍＵ、ｗｚｙＥ、ｈｅｍＤ、ｈｅｍＣ、ｙｉｇＰ、ｕｂｉＢ、ｕｂｉＤ、ｈｅｍＧ、ｙｉｈＡ、ｆｔｓＮ、ｍｕｒＩ、ｍｕｒＢ、ｂｉｒＡ、ｓｅｃＥ、ｎｕｓＧ、ｒｐｌＪ、ｒｐｌＬ、ｒｐｏＢ、ｒｐｏＣ、ｕｂｉＡ、ｐｌｓＢ、ｌｅｘＡ、ｄｎａＢ、ｓｓｂ、ａｌｓＫ、ｇｒｏＳ、ｐｓｄ、ｏｒｎ、ｙｊｅＥ、ｒｐｓＲ、ｃｈｐＳ、ｐｐａ、ｖａｌＳ、ｙｊｇＰ、ｙｊｇＱ、及びｄｎａＣからなるリストから選択される。好ましくは、ポリヌクレオチドは、ＴＣＧコドン及び／又はＴＣＡコドンがない、２つ若しくは３つ以上、３つ若しくは４つ以上、４つ若しくは５つ以上、５つ若しくは６つ以上、１０個若しくは１１個以上、２０個若しくは２１個以上、３０個若しくは３１個以上、４０個若しくは４１個以上、５０個若しくは５１個以上、１００個若しくは１０１個以上、又は２００個若しく２０１個以上の必須遺伝子を含む。

一部の実施形態では、ポリヌクレオチドは、配列番号１若しくは配列番号２に対して又は配列番号１若しくは配列番号２のいずれかの断片に対して少なくとも８０％、８５％、９０％、９５％、９８％、９９％、９９．５％、９９．８％、若しくは９９．９％、又は１００％同一であるポリヌクレオチド配列を含み、好ましくはその断片は、少なくとも１０ｋｂ、２０ｋｂ、５０ｋｂ、１００ｋｂ、又は５００ｋｂの長さである。

好ましくは、ポリヌクレオチドは生存可能である。すなわち、ポリヌクレオチドは、ゲノムが生存可能なゲノムであるようにゲノムに取り込まれ得る。好ましくは、ポリヌクレオチドは、親ゲノムの対応する領域を置換し、前記ゲノムの生存能を保持することができる。本明細書で使用される場合、「生存可能なゲノム」とは、細胞の生存能を引き起こし、及び／又は維持するのに十分な核酸配列を含有するゲノム、例えば、複製、転写、翻訳、エネルギー産生、輸送、膜及び細胞質成分の産生、並びに細胞分裂に必要とされる分子をコードするゲノムを指す。それ故、本発明はまた、本発明のポリヌクレオチドを含む生存可能な合成原核生物ゲノム（例えば、生存可能な合成大腸菌ゲノム）を提供する。

本発明は、配列番号１若しくは配列番号２に対して又は配列番号１若しくは配列番号２のいずれかの断片に対して少なくとも９８％、９８．５％、９９％、９９．５％、９９．６％、９９．７％、９９．８％、９９．９％、９９．９５％又は１００％同一であるポリヌクレオチドを提供し、好ましくはその断片は、少なくとも１０ｋｂ、２０ｋｂ、５０ｋｂ、１００ｋｂ、又は５００ｋｂの長さである。

宿主細胞及びその使用
宿主細胞
本発明はまた、本発明の合成原核生物ゲノム又はポリヌクレオチドを含む宿主細胞を提供する。宿主細胞は単離された宿主細胞であり得る。

本発明の宿主細胞は原核生物細胞である。より好ましくは、宿主細胞は細菌細胞である。好ましくは、細菌宿主細胞は、異種タンパク質産生、特に、１つ又は２つ以上の非タンパク質性アミノ酸（例えば、Ferrer-Miralles, N. and Villaverde, A., 2013. Microbial Cell Factories, 12:113に記載されているもの）を含むポリペプチドの産生に適している。適切な細菌宿主細胞としては、エシェリキア（例えば、大腸菌）、カウロバクテリア（例えば、カウロバクター・クレセンタス）、光合成細菌（例えば、ロドバクター・スフェロイデス）、低温適応型細菌（例えば、シュードアルテロモナス・ハロプランクティス、シェワネラ属種株Ａｃ１０）、シュードモナス（例えば、シュードモナス・フルオレッセンス、シュードモナス・プチダ、シュードモナス・エルギノーザ）、好塩性細菌（例えば、ハロモナス・エロンガタ、クロモハロバクター・サレキシゲンス）、ストレプトミセテス（例えば、ストレプトマイセス・リビダンス、ストレプトマイセス・グリゼウス）、ノカルディア（例えば、ノカルディア・ラクタムジュランス）、マイコバクテリア（例えば、マイコバクテリウム・スメグマティス）、コリネフォーム細菌（例えば、コリネバクテリウム・グルタミクム、コリネバクテリウム・アンモニアゲネス、ブレビバクテリウム・ラクトファーメンタム）、バシラス（例えば、バシラス・サチリス、バシラス・ブレビス、バシラス・メガテリウム、バシラス・リケニフォルミス、バシラス・アミロリケファシエンス）、及び乳酸菌（例えば、ラクトコッカス・ラクチス、ラクトバチルス・プランタルム、ラクトバチルス・カゼイ、ラクトバチルス・ロイテリ、ラクトバチルス・ガセリ）が挙げられる。一部の実施形態では、細菌宿主細胞はグラム陰性細菌である。

好ましくは、宿主細胞は、大腸菌、サルモネラ・エンテリカ、又は志賀赤痢菌である。より好ましくは、宿主細胞は大腸菌である。適切な大腸菌宿主細胞としては、ＭＤＳ４２、Ｋ－１２、ＭＧ１６５５、ＢＬ２１、ＢＬ２１（ＤＥ３）、ＡＤ４９４、Ｏｒｉｇａｍｉ、ＨＭＳ１７４、ＢＬＲ（ＤＥ３）、ＨＭＳ１７４（ＤＥ３）、Ｔｕｎｅｒ（ＤＥ３）、Ｏｒｉｇａｍｉ２（ＤＥ３）、Ｒｏｓｅｔｔａ２（ＤＥ３）、Ｌｅｍｏ２１（ＤＥ３）、ＮｉＣｏ２１（ＤＥ３）、Ｔ７Ｅｘｐｒｅｓｓ、ＳＨｕｆｆｌｅＥｘｐｒｅｓｓ、Ｃ４１（ＤＥ３）、Ｃ４３（ＤＥ３）、及びｍ１５ｐＲＥＰ４又はそれらの誘導体が挙げられる（Rosano, G.L. and Ceccarelli, E.A., 2014. Frontiers in microbiology, 5, p.172）。最も好ましくは、宿主細胞は、ＭＤＳ４２、ＭＧ１６５５、若しくはＢＬ２１又はそれらの誘導体である。ＭＧ１６５５は大腸菌の野生型株と見なされる。この株のゲノム配列のジェンバンクＩＤは、Ｕ０００９６である。ＢＬ２１は広範に市販されている。例えば、それは、カタログ番号Ｃ２５３０ＨでNew England BioLabs社から購入することができる。

宿主細胞は、好ましくは、合成原核生物ゲノム又はポリヌクレオチドが存在していたものからの（又は由来する）ものと同じであってもよい。例えば、合成原核生物ゲノムが合成大腸菌ゲノムである場合、宿主細胞は好ましくは大腸菌である。細胞の親ゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、宿主細胞は好ましくは同じ細胞であり、すなわち、好ましくは合成原核生物ゲノムを含む宿主細胞は親ゲノムの宿主細胞（親宿主細胞）と同じである。

宿主細胞は生存可能であり得る、すなわち、増殖及び複製することができる。

細胞のゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、好ましくは、親宿主細胞に存在する場合、増殖速度を実質的に減少させないものである。それ故、好ましくは、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較して増殖速度を実質的に減少させない。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞より４倍、３倍、２倍、又は約１．６倍未満遅い倍加時間を有する。倍加時間は、当業者に公知の任意の方法によって決定することができる。一部の実施形態では、倍加時間は、ＬＢ培地中で３７℃、２５℃又は４２℃で決定される。

細胞のゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、好ましくは、親宿主細胞に存在する場合、あらゆる実質的な表現型の変化を引き起こさないものである。それ故、好ましくは、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較してあらゆる実質的な表現型の変化を有さない。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞より１００％、５０％、又は約２０％未満長い平均細胞長を有する。例えば、細胞長は、約１．５～３ミクロンであってもよい。細胞長は当業者に公知の任意の方法によって決定することができる。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞のプロテオームと実質的に異ならないプロテオームを有する。プロテオームは、当業者に公知の任意の方法によって決定することができる。

代替のカノニカルアミノ酸への再割当
一部の実施形態では、１つ又は２つ以上のセンスコドン（すなわち、親ゲノムから除去されているもの）は、代替のカノニカルアミノ酸をコードするように再割当される。例えば、ＴＣＧ及びＴＣＡが除去されている場合、一方又は両方は、セリン以外のカノニカルアミノ酸（例えば、アラニン）をコードするように再割当され得る。

例えば、本発明の合成原核生物ゲノムは、１つ又は２つ以上のセンスコドンを実質的又は完全に欠いている。そのため、１つ又は２つ以上のｔＲＮＡ又は終結因子は合成ゲノムから削除されてもよい。例えば、置換（又は削除）されている１つ又は２つ以上のセンスコドンを解読するｔＲＮＡは合成原核生物ゲノムから削除されてもよい。置換（又は削除）されている１つ又は２つ以上のセンスコドンを解読するｔＲＮＡは削除されてもよく、ｔＲＮＡが、置換（又は削除）されている１つ又は２つ以上のセンスコドンのみを解読する場合、又は代替としてｔＲＮＡが、置換（又は削除）されている１つ若しくは２つ以上のセンスコドン及び置換（又は削除）されていない１つ若しくは２つ以上のセンスコドンを解読する場合、ｔＲＮＡが、置換（又は削除）されていない１つ若しくは２つ以上のセンスコドンについて非必須である（すなわち、ｔＲＮＡが解読する１つ若しくは残りのセンスコドンが１つ若しくは２つ以上の代替のｔＲＮＡによって解読される）場合、合成原核生物ゲノムは生存可能なままである。例えば、合成原核生物ゲノムがＴＣＡセンスコドンを欠く場合、ｔＲＮＡ^Ｓｅｒ _ＵＧＡをコードするｓｅｒＴは削除されてもよく、及び／又は合成原核生物ゲノムがＴＣＧセンスコドンを欠く場合、ｔＲＮＡ^Ｓｅｒ _ＣＧＡをコードするｓｅｒＵは削除されてもよい。１つ又は２つ以上のｔＲＮＡの削除は、例えば、再割当された内在性ｔＲＮＡ又は直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ対と組み合わせて使用されて、１つ又は２つ以上のセンスコドンを代替のアミノ酸へ再割当することができる。

例えば、ＴＣＧ及びＴＣＡが合成原核生物ゲノムから除去されている場合、ｔＲＮＡ^Ｓｅｒ _ＵＧＡをコードするｓｅｒＴ、及びｔＲＮＡ^Ｓｅｒ _ＣＧＡをコードするｓｅｒＵは、合成原核生物ゲノムから削除されてもよく、いずれかのｔＲＮＡ_ＣＧＡを（例えばｔＲＮＡ^Ａｌａ _ＣＧＡに）再割当することができ、直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＣＧＡ対を（例えば、異種核酸によって又は合成原核生物ゲノムへの取り込みによって）宿主細胞に導入してＴＣＧを代替のカノニカルアミノ酸へ再割当することができる。それ故、一部の実施形態では、本発明の宿主細胞は、１つ若しくは２つ以上の再割当されたｔＲＮＡ及び／又は１つの直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ，aminoacyl-tRNA synthetase）－ｔＲＮＡ対をコードする１つ若しくは２つ以上の異種ヌクレオチド（例えばプラスミド）をさらに含む。一部の実施形態では、本発明の宿主細胞は、直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対をコードするプラスミドをさらに含む。あるいは、直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対は、合成原核生物ゲノムへの取り込みによって宿主細胞に導入され得る。それ故、一部の実施形態では、合成原核生物ゲノムは直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対をコードし、好ましくは天然ｔＲＮＡをコードする遺伝子は親原核生物ゲノムから削除されている。好ましい実施形態では、本発明の宿主細胞は１つ又は２つ以上の再割当されたｔＲＮＡをさらに含む。ｔＲＮＡを再割当するための方法は当業者に周知である。

代替のカノニカルアミノ酸をコードするための再割当はバイオセーフティーを増加させることができる。それ故、一部の実施形態では、本発明の宿主細胞はバイオセーフティーを増加させている。したがって、本発明はバイオセーフティーが改善された宿主細胞を提供する。

例えば、代替のカノニカルアミノ酸をコードするための再割当は、合成原核生物ゲノムを含む宿主細胞をバクテリオファージ感染に対して耐性にすることができる。１つ又は２つ以上のバクテリオファージ遺伝子は典型的に１つ又は２つ以上のセンスコドンを含むので、１つ又は２つ以上のバクテリオファージ遺伝子が翻訳される場合、代替のカノニカルアミノ酸は、対応するバクテリオファージタンパク質に取り込まれ得る。代替のカノニカルアミノ酸の取り込みは、前記タンパク質の活性を不安定化し、破壊し、又は低減させ得るので、バクテリオファージの感染性を低減させ、宿主細胞をバクテリオファージ感染に対して耐性にする。

それ故、一部の実施形態では、本発明の宿主細胞はファージ感染に対して耐性がある。例えば、細胞のゲノムが本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、親宿主細胞に存在する場合、ファージ感染に対する耐性を増加させるものであり得る。それ故、一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較してファージ耐性が増加している。

したがって、本発明は、ファージ耐性宿主細胞及びファージ耐性が増加している宿主細胞を提供する。

また、代替のカノニカルアミノ酸をコードするための再割当により、遺伝物質、例えば、抗生物質耐性遺伝子を、それらが野生型株ではなく、書き換えられた株において機能的であるように設計することを可能にすることができる。例えば、宿主細胞がある特定の条件（例えば、抗生物質の存在下）で増殖するが、他の宿主細胞（例えば、親宿主細胞）は増殖しないように、遺伝物質は、（例えば、異種核酸によって又は合成原核生物ゲノムへの取り込みによって）本発明の宿主細胞に取り込まれ得る。それ故、一部の実施形態では、本発明の宿主細胞は、宿主細胞を含む組成物を、他の宿主細胞（例えば、他の原核生物）による夾雑に対して、より耐性にすることができる。

非タンパク質性アミノ酸への再割当
一部の実施形態では、１つ又は２つ以上のセンスコドン（すなわち、親ゲノムから除去されたもの）は、非カノニカルアミノ酸（非タンパク質性アミノ酸）をコードするように再割当される。

それ故、本発明は、１つ又は２つ以上の非タンパク質性アミノ酸、好ましくは２つ又は３つ以上の非タンパク質性アミノ酸、最も好ましくは３つ又は４つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための本発明による宿主細胞の使用を提供する。

本発明はまた、本発明による宿主細胞を使用することによって得られた又は得ることができるポリペプチドを提供する。一部の実施形態では、ポリペプチドは、１つ又は２つ以上の非タンパク質性アミノ酸、好ましくは２つ又は３つ以上の非タンパク質性アミノ酸、最も好ましくは３つ又は４つ以上の非タンパク質性アミノ酸を含む。それ故、本発明はまた、２つ又は３つ以上の非タンパク質性アミノ酸を含むポリペプチド及び３つ又は４つ以上の非タンパク質性アミノ酸を含むポリペプチドを提供する。

本明細書で使用される場合、「非タンパク質性アミノ酸」（「非コードアミノ酸」又は「非カノニカルアミノ酸」としても知られている）は、天然にコードされていないか、又は遺伝コードに見出されないアミノ酸である。タンパク質を組み立てるための翻訳機構による２２種のみのアミノ酸（タンパク質性アミノ酸、すなわち、標準的な遺伝コードの２０種及び特別な翻訳機構によって取り込まれ得る追加の２種）の使用にもかかわらず、１４０種を超えるアミノ酸が、タンパク質中に天然に存在することが知られており、さらに数千種が天然に存在し得るか、又は実験室で合成され得る。それ故、非タンパク質性アミノ酸は、Ｌ－アラニン、Ｌ－システイン、Ｌ－アスパラギン酸、Ｌ－グルタミン酸、Ｌ－フェニルアラニン、グリシン、Ｌ－ヒスチジン、Ｌ－イソロイシン、Ｌ－リジン、Ｌ－ロイシン、Ｌ－メチオニン、Ｌ－アスパラギン、Ｌ－プロリン、Ｌ－グルタミン、Ｌ－アルギニン、Ｌ－セリン、Ｌ－トレオニン、Ｌ－バリン、Ｌ－トリプトファン及びＬ－チロシン、並びに任意にＬ－ピロリジン及びＬ－セレノシステインを除外する任意のアミノ酸を含み得る。

一部の実施形態では、非タンパク質性アミノ酸は非天然アミノ酸（ＵＡＡ）である。

非タンパク質性アミノ酸又はＵＡＡは特に限定されない。適切な非タンパク質性アミノ酸及びＵＡＡは当業者に周知であり、例えば、Neumann, H., 2012. FEBS letters, 586(15), pp.2057-2064;及びLiu, C.C. and Schultz, P.G., 2010. Annual review of biochemistry, 79, pp.413-444に開示されているものがある。一部の実施形態では、非タンパク質性アミノ酸及び／又はＵＡＡは、ｐ－アセチルフェニルアラニン、ｍ－アセチルフェニルアラニン、Ｏ－アリルチロシン、フェニルセレノシステイン、ｐ－プロパルギルオキシフェニルアラニン、ｐ－アジドフェニルアラニン、ｐ－ボロノフェニルアラニン、Ｏ－メチルチロシン、ｐ－アミノフェニルアラニン、ｐ－シアノフェニルアラニン、ｍ－シアノフェニルアラニン、ｐ－フルオロフェニルアラニン、ｐ－ヨードフェニルアラニン、ｐ－ブロモフェニルアラニン、ｐ－ニトロフェニルアラニン、Ｌ－ＤＯＰＡ、３－アミノチロシン、３－ヨードチロシン、ｐ－イソプロピルフェニルアラニン、３－（２－ナフチル）アラニン、ビフェニルアラニン、ホモグルタミン、Ｄ－チロシン、ｐ－ヒドロキシフェニル乳酸、２－アミノカプリル酸、ビピリジルアラニン、ＨＱ－アラニン、ｐ－ベンゾイルフェニルアラニン、ｏ－ニトロベンジルシステイン、ｏ－ニトロベンジルセリン、４，５－ジメトキシ－２－ニトロベンジルセリン、ｏ－ニトロベンジルリジン、ｏ－ニトロベンジルチロシン、２－ニトロフェニルアラニン、ダンシルアラニン、ｐ－カルボキシメチルフェニルアラニン、３－ニトロチロシン、スルホチロシン、アセチルリジン、メチルヒスチジン、２－アミノノナン酸、２－アミノデカン酸、ピロリジン、Ｃｂｚ－リジン、Ｂｏｃ－リジン及びアリルオキシカルボニルリジンのうちの１つ又は２つ以上から選択される。

原核生物、例えば大腸菌は典型的に、ユビキチン化、グリコシル化及びリン酸化などの、ほとんどの真核生物の翻訳後修飾を取り込むことができず、また、それらは典型的に、他の真核生物成熟プロセス、及びタンパク質分解性のタンパク質成熟を行うこともできない。さらに、正確なジスルフィド結合形成及びリポ多糖夾雑が厄介になる可能性がある（Ovaa, H., 2014. Frontiers in chemistry, 2, p.15を参照のこと）。しかしながら、抗体、酵素及びサイトカインなどの治療用タンパク質は、通常、翻訳後修飾及びジスルフィド結合を保ち、多くの場合、それらの正確に折り畳まれた状態を達成するためにタンパク質分解性成熟を必要とする。それ故、大多数の治療用タンパク質は真核生物及び哺乳動物細胞系において産生される。しかしながら、原核生物宿主細胞、例えば大腸菌における発現は、一般に安価で、遺伝子修飾を受けやすく、変異ライブラリー開発に関して用途が広く、工業規模の発酵に適している（Ovaa, H., 2014. Frontiers in chemistry, 2, p.15）。

それ故、一部の実施形態では、ポリペプチドは治療用ポリペプチドであり、好ましくは、哺乳動物のタンパク質修飾が１つ又は２つ以上の非タンパク質性アミノ酸によって導入されている。例えば、アンバーコドン抑制が、１つ又は２つ以上の非タンパク質性アミノ酸（すなわち、哺乳動物のタンパク質修飾）を治療用ポリペプチドに取り込むために以前に使用されている。本発明は２つ又は３つ以上の非タンパク質性アミノ酸を取り込むことを可能にする。それ故、本発明は、２つ又は３つ以上の非タンパク質性アミノ酸を含む治療用ポリペプチドを提供する。

本発明の合成原核生物ゲノムは１つ又は２つ以上のセンスコドンを実質的又は完全に欠いているので、１つ又は２つ以上のｔＲＮＡ又は終結因子は合成ゲノムから削除されてもよい。例えば、置換（又は削除）されている１つ又は２つ以上のセンスコドンのみを解読するｔＲＮＡは合成原核生物ゲノムから削除されてもよい。例えば、合成原核生物ゲノムがＴＣＡセンスコドンを欠く場合、ｔＲＮＡ^Ｓｅｒ _ＵＧＡをコードするｓｅｔＴは削除されてもよく、及び／又は合成原核生物ゲノムがＴＣＧセンスコドンを欠く場合、ｔＲＮＡ^Ｓｅｒ _ＣＧＡをコードするｓｅｒＵは削除されてもよい。次いで合成原核生物ゲノムが、非タンパク質性アミノ酸のタンパク質への取り込みを導くために（直交アミノアシル－ｔＲＮＡ合成酵素－ｔＲＮＡ対と併せて）使用されてもよい。

遺伝子コード拡張は、所望の遺伝子における望ましい部位に導入された割り当てられていないコドン（例えば、アンバー終止コドン、ＵＡＧ）に応答して、非タンパク質性アミノ酸のタンパク質への取り込みを導くために直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対を使用する。直交合成酵素は内在性ｔＲＮＡを認識せず、細胞に提供される（又は細胞によって合成される）非タンパク質性アミノ酸で直交コグネイトｔＲＮＡ（内在性合成酵素の効果的な基質ではない）を特異的にアミノアシル化する（Chin, J.W., 2017. Nature, 550(7674), 53-60）。当業者は、適切な直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対を同定及び／又は生成することができる（例えば、Elliott, T. S. et al., 2014. Nat Biotechnol 32, 465-472; Elliott, T. S., et al., 2016. Cell Chem Biol 23, 805-815;及びKrogager, T. P. et al., 2018. Nat Biotechnol 36, 156-159）。それ故、一部の実施形態では、本発明の宿主細胞は、１つの直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対をコードする１つ又は２つ以上の異種ヌクレオチド（例えば、プラスミド）をさらに含む。好ましい実施形態では、本発明の宿主細胞は、直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対をコードするプラスミドをさらに含む。あるいは、直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対は、合成原核生物ゲノムへ取り込むことによって宿主細胞に導入され得る。それ故、一部の実施形態では、合成原核生物ゲノムは直交アミノアシル－ｔＲＮＡ合成酵素（ａａＲＳ）－ｔＲＮＡ対をコードし、好ましくは、天然ｔＲＮＡをコードする遺伝子は親原核生物ゲノムから削除されている。

それ故、一部の実施形態では、本発明の宿主細胞は、前記センスコドンを含む１つ又は２つ以上の遺伝子を含む１つ又は２つ以上の異種ヌクレオチド（例えば、プラスミド）をさらに含む。好ましい実施形態では、宿主細胞は、前記センスコドンを含む遺伝子を含むプラスミドをさらに含む。１つ又は２つ以上のセンスコドンは遺伝子の望ましい部位に存在し得、好ましくは、その望ましい部位により、１つ又は２つ以上の非タンパク質性アミノ酸（すなわち、哺乳動物のタンパク質修飾）のポリペプチド、好ましくは治療用ポリペプチドへの取り込みが可能になる。

他の実施形態では、前記センスコドンは、合成原核生物ゲノムにおける１つ又は２つ以上の遺伝子に存在し得る（例えば、異種ヌクレオチドは合成原核生物ゲノムに取り込まれ得る）。１つ又は２つ以上のセンスコドンは遺伝子の望ましい部位に存在し得、好ましくは、その望ましい部位により、１つ又は２つ以上の非タンパク質性アミノ酸（すなわち、哺乳動物のタンパク質修飾）のポリペプチド、好ましくは治療用ポリペプチドへの取り込みが可能になる。

例えば、ＴＣＧ及びＴＣＡが合成原核生物ゲノムから除去されている場合、ｔＲＮＡ^Ｓｅｒ _ＵＧＡをコードするｓｅｒＴ、及びｔＲＮＡ^Ｓｅｒ _ＣＧＡをコードするｓｅｒＵは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＣＧＡ対が、１つ又は２つ以上の非タンパク質性アミノ酸を含むポリペプチドをコードするように、ＴＣＧコドンを含む（異種）遺伝子と組み合わせて使用されてもよい。それ故、本発明の宿主細胞は、例えば、（ｉ）直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＣＧＡ対をコードするプラスミド；及び（ii）１つ又は２つ以上のＴＣＧコドンを含む遺伝子を含むプラスミドをさらに含んでもよい。同様に、ＡＧＴ及びＡＧＣが除去される場合、ｔＲＮＡ^Ｓｅｒ _ＧＣＵをコードするｓｅｒＶは合成原核生物ゲノムから削除されてもよく、直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＡＣＵ対及び／又は直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＧＣＵ対が使用されてもよい。同様に、ＣＴＧ及びＣＴＡが除去される場合、ｔＲＮＡ^Ｌｅｕ _ＣＡＧをコードするｌｅｕＰ、Ｑ、Ｔ、Ｖ、及びｔＲＮＡ^Ｌｅｕ _ＵＡＧをコードするｌｅｕＷは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＣＡＧ対が使用されてもよい。同様に、ＴＴＧ及びＴＴＡが除去される場合、ｔＲＮＡ^Ｌｅｕ _ＣＡＡをコードするｌｅｕＸ、及びｔＲＮＡ^Ｌｅｕ _ＵＡＡをコードするｌｅｕＺは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＣＡＡ対及び／又は直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＵＡＡ対が使用されてもよい。同様に、ＧＣＧ及びＧＣＡが除去される場合、ｔＲＮＡ^Ａｌａ _ＵＧＣをコードするａｌａＴ、Ｕ、Ｖは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＣＧＣ対が使用されてもよい。

一部の実施形態では、合成原核生物ゲノムは終結因子（例えば、ＲＦ１）をコードする遺伝子を欠き、及び／又は宿主細胞は非タンパク質性アミノ酸の組み込みの効率を増加させるために終結因子（例えば、ＲＦ１）を欠く。

合成ゲノムを産生するための方法
一態様では、本発明は、合成ゲノムを産生するための方法であって、
（ａ）親ゲノムを準備するステップと、
（ｂ）親ゲノムに対して組換えを介した遺伝子改変の１回又は２回以上のラウンドを実行して、２つ又は３つ以上の異なる部分的合成ゲノムを産生するステップと、
（ｃ）２つ又は３つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの１回又は２回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含む方法を提供する。

組換えを介した遺伝子改変
好ましくは、組換えを介した遺伝子改変の１回又は２回以上のラウンドが、２つ又は３つ以上の異なる部分的合成ゲノムを提供するために、親ゲノムの１０～１０００ｋｂ、５０～１０００ｋｂ、１００～１０００ｋｂ、又は１００～５００ｋｂを編集するために使用される。それ故、好ましい実施形態では、組換えを介した遺伝子改変の各ラウンドにより、親ゲノムのＤＮＡの１０ｋｂ若しくはそれ以上、５０ｋｂ若しくはそれ以上、１００ｋｂ若しくはそれ以上、又は約１００ｋｂが挿入又は置換されている。

本明細書で使用される場合、「組換えを介した遺伝子改変」（「リコンビニアリング」としても知られている）という用語は、相同組換え系に基づく遺伝子改変（すなわち、ゲノム編集）のための方法である。典型的に、リコンビニアリングは、バクテリオファージタンパク質である、Ｒａｃプロファージ由来のＲｅｃＥ／ＲｅｃＴ又はバクテリオファージラムダ由来のレッドαβδによって媒介される大腸菌における相同組換えに基づく。組換えを介した遺伝子改変の任意の適切な方法が使用されてもよい。組換えを介した遺伝子改変のための方法は当業者に周知である。

「古典的組換え」（大腸菌におけるラムダレッドを介した組換えによって例示される）では、合成ＤＮＡの短い領域がゲノムに挿入され得るか、又は２段階プロセス：ｉ）合成ＤＮＡのストレッチを保ち、陽性選択マーカーと連結し、ゲノムの標的領域の各末端に相同領域（ＨＲ）が隣接した直鎖状二本鎖ＤＮＡ（ｄｓＤＮＡ）による細胞の形質転換、及び（ii）相同領域によって媒介される組換え、その後の陽性選択マーカーによるゲノム組み込みについての選択においてゲノムＤＮＡを置換するために使用され得る。このアプローチは、ゲノムＤＮＡの２～３ｋｂを挿入又は置換するために使用され得る。それ故、古典的組換えが使用される場合、多くのラウンドの組換えを介した遺伝子改変が親ゲノムの１００～５００ｋｂを編集するために必要とされる。

それ故、好ましい実施形態では、組換えを介した遺伝子改変の１回又は２回以上のラウンドは、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除（ＲＥＸＥＲ）の１回又は２回以上のラウンドを含む。

ＲＥＸＥＲは、国際公開第２０１８／０２０２４８号パンフレット（参照により本明細書に組み込まれる）に記載されている。ＲＥＸＥＲの各ラウンドは、親ゲノムのＤＮＡの約５０ｋｂ～２５０ｋｂ、又は約１００ｋｂを挿入又は置換するために使用され得る。

それ故、組換えを介した遺伝子改変の１回又は２回以上のラウンドは、
ｉ）宿主細胞（例えば、大腸菌）を準備するステップであって、その宿主細胞はエピソームレプリコン（例えば、プラスミド又は細菌人工染色体）及び標的核酸（例えば、ゲノム）を含み、そのエピソームレプリコンはドナー核酸配列（すなわち、合成領域）を含み、そのドナー核酸配列は順番に、５’－相同組換え配列１－所望の配列－相同組換え配列２－３’を含み、その所望の配列は陽性選択可能マーカーを含み、その標的核酸は順番に、５’－相同組換え配列１－陰性選択可能マーカー－相同組換え配列２－３’を含む、ステップ、
ii）前記宿主細胞における核酸組換えを支持することができるヘルパータンパク質（例えば、ラムダレッドタンパク質）を準備するステップ、
iii）前記宿主細胞における核酸切除を支持することができるヘルパータンパク質及び／又はＲＮＡ（例えば、ＣＲＩＳＰＲ／Ｃａｓ９タンパク質／ＲＮＡ）を準備するステップ、
iv）前記ドナー核酸配列の切除を誘導するステップ、
ｖ）切除されたドナー核酸と前記標的核酸との間の組換えを可能にするようにインキュベートするステップ、並びに
vi）前記ドナー核酸を前記標的核酸へ取り込んだ組換え体を選択するステップ
を含んでもよい。

適切には、前記ドナー核酸を前記標的核酸へ取り込んだ組換え体を選択するステップは、ドナー核酸の陽性選択可能マーカーの獲得及び標的核酸の陰性選択可能マーカーの喪失の選択を含む。適切には、ドナー核酸の陽性選択可能マーカーの獲得及び標的核酸の陰性選択可能マーカーの喪失の選択は同時に実行される。適切には、前記所望の配列は陽性選択可能マーカー及び陰性選択可能マーカーの両方を含む。適切には、陰性選択可能マーカーは、ｓａｃＢ（スクロース感受性）、ｒｐｓＬ（Ｓ１２リボソームタンパク質－ストレプトマイシン感受性）、又はｐｈｅ^{ＳＴ２５１Ａ＿Ａ２９４Ｇ}（４－クロロフェニルアラニン感受性）からなる群から選択される。適切には、陽性選択可能マーカーは、Ｃｍ^Ｒ（クロラムフェニコール耐性）、Ｋａｎ^Ｒ（カナマイシン耐性）、Ｈｙｇ^Ｒ（ハイグロマイシン耐性）、ゲンタマイシン^Ｒ（ゲンタマイシン耐性）、又はテトラサイクリン^Ｒ（テトラサイクリン耐性）からなる群から選択される。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの連続選択、又は前記陰性及び陽性マーカーの連続選択を含む。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの同時選択を含む。

適切には、上記の前記方法は、標的核酸配列における少なくとも１つの二本鎖切断を誘導するステップであって、前記二本鎖切断は、前記相同組換え配列１と前記相同組換え配列２との間である、ステップをさらに含む。適切には、少なくとも２つの二本鎖切断は標的核酸配列において誘導され、各々の前記二本鎖切断は、前記相同組換え配列１と前記相同組換え配列２との間である。

適切には、前記切除されたドナー核酸は、前記相同組換え配列１から開始し、前記相同組換え配列２で終了する。

適切には、前記エピソームレプリコンはドナー核酸配列と独立した陰性選択可能マーカーを含む。適切には、前記方法は、ドナー核酸配列と独立した前記陰性選択可能マーカーの喪失を選択することによってエピソームレプリコンの喪失を選択するさらなるステップを含む。適切には、前記エピソームレプリコンは順番に、切除切断部位１－ドナー核酸配列－切除切断部位２を含む。適切には、前記標的核酸は、前記宿主細胞内で機能することができるその独自の複製起点を所有する。適切には、前記エピソームレプリコンはプラスミド核酸である。適切には、前記エピソームレプリコンは細菌人工染色体（ＢＡＣ，bacterial artificial chromosome）である。適切には、前記標的核酸は宿主細胞ゲノムである。

エピソームレプリコン（例えば、ＢＡＣ）は、例えば、Kouprina, N., et al., 2004. Methods Mol Biol 255, 69-89に記載されているように、Ｓ．セレビシエにおいて相同組換えによって組み立てられ得る。アセンブリは、合成ＤＮＡの７～１４個のストレッチ、各々６～１３ｋｂの長さ；選択コンストラクト（陰性選択マーカー及び／又は陽性選択マーカーを含む）；及びＢＡＣシャトルベクター骨格を組み合わせることができる。合成ＤＮＡのストレッチは、エピソームレプリコンにおけるドナー核酸配列（すなわち、合成領域）に全体的に対応し得、各ストレッチは８０～２００ｂｐの互いに重複しているＤＮＡ配列を含み、重複領域は書き換えられている標的を１つも含まない。ストレッチは、適切な制限部位（例えば、BsaI、AvrII、SpeI、又はXbaI）が隣接したpSC101又はpSTベクターに供給され得る。それ故、アセンブリの間、合成ＤＮＡストレッチは、対応する制限酵素での消化によって切除され得る。エピソームレプリコンのアセンブリは配列決定によって検証され得る。

適切には、２つの相同領域は、３０～１００ｂｐ、又は４０～５０ｂｐ、又は約５０ｂｐの長さであってもよい。

ＣＲＩＳＰＲ／Ｃａｓ９機構が切除のために使用されてもよい。一部の実施形態では、ＣＲＩＳＰＲ／Ｃａｓ９機構は、Ｃａｓ９、ｔｒａｃｒＲＮＡ及び２つのスペーサーＲＮＡを含み、そのスペーサーＲＮＡは切除のための２つの相同領域を標的とする。好ましい実施形態では、スペーサーＲＮＡは直鎖状二本鎖スペーサーである。他の実施形態では、ＣＲＩＳＰＲ／Ｃａｓ９機構はＣａｓ９及び２つのｓｇＲＮＡを含み、そのｓｇＲＮＡは切除のための２つの相同領域を標的とする。

ラムダレッド組換え機構が組換えのために使用されてもよい。ラムダレッド組換え機構はラムダアルファ／ベータ／ガンマを含んでもよい。

方法は、ＲＥＸＥＲの１回又は２回以上のラウンドを実施するステップ、すなわち、第１のドナー核酸配列を用いた上記のステップ、前記第１のドナー核酸配列と連続するさらなるドナー配列を選択するステップ、及び部分的合成ゲノムが組み立てられるまで前記さらなるドナー核酸配列を用いて前記ステップを反復するステップを含んでもよい。これは、Wang, K. et al., 2016. Nature 539, 59-64に記載されている、ゲノム段階交換合成（ＧＥＮＥＳＩＳ）として知られており、図４に概略的に示される。

好ましい実施形態では、ドナー配列は、本発明による合成ゲノムの領域及び／又は本発明によるポリヌクレオチドに対応する。

それ故、ドナー配列（すなわち、合成領域）は、１つ若しくは２つ以上のセンスコドンの２０個若しくは１９個以下の出現を含んでもよく、及び／又はドナー配列は、１つ若しくは２つ以上のセンスコドンの出現がない、１０個若しくは１１個以上、２０個若しくは２１個以上、又は１００個若しくは１０１個以上の遺伝子を含んでもよい。

ドナー配列（すなわち、合成領域）は、それらが、１つ若しくは２つ以上のセンスコドンの各々の５０個若しくは４９個以下、２０個若しくは１９個以下、１０個若しくは９個以下、５個若しくは４個以下、又は０個の出現を有すること、及び／又は親ゲノムにおける対応する領域と比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ若しくは２つ以上のセンスコドンの各々の出現を含むこと、及び／又は１つ若しくは２つ以上のセンスコドンの出現がない、１０個若しくは１１個以上、２０個若しくは２１個以上、又は１００個若しくは１０１個以上の遺伝子を含むことを除いて親ゲノムの配列（すなわち、非合成領域）と同一であってもよい。

ドナー配列（すなわち、合成領域）はまた、親ゲノムの配列（すなわち、非合成領域）に対してリファクタリングされてもよい。３’、３’重複（すなわち、逆向きの遺伝子対）に関して、合成挿入物が遺伝子間に挿入されてもよい。３’、３’重複に関して、合成挿入物は重複する領域を含んでもよい。５’、３’重複（すなわち、同じ向きの遺伝子対）に関して、合成挿入物が遺伝子間に挿入されてもよい。５’、３’重複に関して、合成挿入物は、（ｉ）終止コドン；（ii）重複する領域の上流から、約２０～２００ｂｐ、又は２０～１００ｂｐ、又は２０～５０ｂｐ；及び（iii）重複する領域を含んでもよい。好ましくは、合成挿入物は、（ｉ）終止コドン；（ii）重複する領域の上流から約２０ｂｐ；及び（iii）重複する領域を含む。好ましい実施形態では、終止コドンは下流の遺伝子について元の開始部位とインフレームである。好ましくは、終止コドンはＴＡＡである。

好ましくは、ドナー配列（すなわち、合成領域）は、合計で５０～１００００ｋｂ、１００～５０００ｋｂ、１００～２０００ｋｂ、１００～１０００ｋｂ、又は１００～５００ｋｂのサイズである。好ましくは、各ドナー配列は、５０～３００ｋｂ、１００～２００ｋｂ、又は約１００ｋｂのサイズである。

したがって、ドナー配列は、それらが、１つ又は２つ以上のセンスコドンの出現を含まないこと、及び親ゲノムにおける１つ又は２つ以上のセンスコドンを含む重複する領域を共有する全ての遺伝子対がリファクタリングされることを除いて、各々約１００ｋｂのサイズであってもよく、親ゲノムの対応する配列と同一であってもよく、遺伝子対は、センスコドン置換が遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである。

好ましい実施形態では、ゲノムの生存能は組換えを介した遺伝子改変の各ラウンド後に試験される。一部の実施形態では、ゲノムの配列は組換えを介した遺伝子改変の各ラウンド後に検証される。

部分的合成ゲノム
本発明は、２つ又は３つ以上の異なる部分的合成ゲノムを提供する。

本明細書で使用される場合、「部分的合成ゲノム」は、親ゲノムの１つ又は２つ以上の連続する領域が編集されているゲノム（すなわち、部分的合成ゲノムが１つ又は２つ以上の合成領域を含む）であり、１つ又は２つ以上の連続する（合成）領域は親ゲノムの全体を占めない。好ましくは、本発明の部分的合成ゲノムは１つの連続する（合成）領域を有する。対照的に、「合成ゲノム」は親ゲノムの実質的に全てを占めるゲノム編集を含んでもよい。

本発明の部分的合成ゲノムは原核生物ゲノムであってもよい。好ましくは、本発明の部分的合成ゲノムは細菌ゲノムである。より好ましくは、本発明の部分的合成ゲノムは、大腸菌、サルモネラ・エンテリカ、又は志賀赤痢菌ゲノムである。最も好ましくは、本発明の部分的合成ゲノムは大腸菌ゲノムである。一部の実施形態では、部分的合成ゲノムは少ない又は最小の部分的合成ゲノムである。好ましい実施形態では、部分的合成ゲノムは生存可能なゲノムである。

一部の実施形態では、本発明の部分的合成ゲノムは、１００ｋｂ～２０Ｍｂ、又は１３０ｋｂ～１５Ｍｂ、又は２００ｋｂ～１５Ｍｂ、又は３００ｋｂ～１５Ｍｂ、又は５００ｋｂ～１５Ｍｂ、又は１Ｍｂ～１５Ｍｂ、又は１Ｍｂ～１０Ｍｂ、又は１Ｍｂ～８Ｍｂ、又は１Ｍｂ～６Ｍｂ、又は２Ｍｂ～６Ｍｂ、又は２Ｍｂ～５Ｍｂ、又は３Ｍｂ～５Ｍｂ、又は約４Ｍｂのサイズである。

部分的合成ゲノムは、１つ又は２つ以上のセンスコドンの各々の５０個若しくは４９個以下、２０個若しくは１９個以下、１０個若しくは９個以下、５個若しくは４個以下、又は０個の出現を有する合成領域を含んでもよいか、又は部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ又は２つ以上のセンスコドンの各々の出現を有する合成領域を含んでもよい。

好ましくは、合成領域は、５０～１００００ｋｂ、１００～５０００ｋｂ、又は１００～５００ｋｂのサイズである。

それ故、部分的合成ゲノムは、１つ若しくは２つ以上のセンスコドンの各々の１０個若しくは９個以下、５個若しくは４個以下、又は０個の出現を有する１００～５０００ｋｂの１つ又は２つ以上の連続する領域を含んでもよく、及び／又は部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ若しくは２つ以上のセンスコドンの各々の出現を有する１００～５０００ｋｂの１つ若しくは２つ以上の連続する領域を含んでもよく、及び／又は部分的合成ゲノムは、１つ若しくは２つ以上のセンスコドンの出現がない、１０個若しくは１１個以上、２０個若しくは２１個以上、又は１００個若しくは１０１個以上の遺伝子を有する１００～５０００ｋｂの１つ若しくは２つ以上の連続する領域を含んでもよい。

部分的合成ゲノムの残り（すなわち、非合成領域）は、変更していないセンスコドンを有してもよい。それ故、部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、１００％若しくは９９％の各々のセンスコドンの出現を有する１つ若しくは２つ以上の非合成領域を含んでもよく、及び／又は部分的合成ゲノムは、各センスコドンの出現を有する１００個若しくは１０１個以上の遺伝子を有する１つ若しくは２つ以上の非合成領域を含んでもよい。非合成領域は、５００ｋｂ～２０Ｍｂ、又は５００ｋｂ～１０Ｍｂ、又は５００ｋｂ～５Ｍｂ、又は約３．５Ｍｂのサイズであってもよい。

例えば、部分的合成ゲノムは、１つ若しくは２つ以上のセンスコドンの出現がない、１０個若しくは１１個以上、２０個若しくは２１個以上、又は１００個若しくは１０１個以上の遺伝子を有する１００～５０００ｋｂの１つの連続する領域（すなわち、合成領域）及び各センスコドンの出現を有する１００個若しくは１０１個以上の遺伝子を有する５００ｋｂ～１００００ｋｂの１つの連続する領域（すなわち、非合成領域）を含んでもよい。

２つ又は３つ以上の異なる部分的合成ゲノムは同じ親ゲノムに由来してもよく、すなわち、実質的に同じ配列を含んでもよく、例えば、２つ又は３つ以上の異なる部分的合成ゲノムは、９０％、９５％、９９％、又は９９．５％の配列同一性を共有してもよい。

２つ又は３つ以上の異なる部分的合成ゲノムは、合成領域が親ゲノムの９０％若しくはそれ以上、９５％若しくはそれ以上、９９％若しくはそれ以上又は１００％を合計で占めるように１つ又は２つ以上の合成領域を含んでもよい。好ましくは、２つ又は３つ以上の異なる部分的合成ゲノムの各々は１つ又は２つ以上の合成領域を含み、その合成領域は実質的に重複しない（例えば、合成領域間の重複は１０ｋｂ又はそれ未満、好ましくは約３～４ｋｂである）。それ故、２つ又は３つ以上の異なる部分的合成ゲノムの各々は、１つの特有又は実質的に特有の合成領域を含んでもよい。

それ故、好ましい実施形態では、２つ又は３つ以上の異なる部分的合成ゲノムの各々は、１つ又は２つ以上のセンスコドンの出現がない、１０個若しくは１１個以上、２０個若しくは２１個以上、又は１００個若しくは１０１個以上の遺伝子を有する１００～５０００ｋｂの１つの連続する合成領域及び各センスコドンの出現を有する１００個又は１０１個以上の遺伝子を有する５００ｋｂ～１００００ｋｂの１つの非合成の連続する領域を含み、その合成領域は合計で親ゲノムの実質的に全てを占め、その合成領域は実質的に重複しない。

２つ又は３つ以上の異なる部分的合成ゲノムは誘導コンジュゲーションに適切であり得る。それ故、好ましい実施形態では、２つ又は３つ以上の異なる部分的合成ゲノムは、少なくとも１つの部分的合成ドナーゲノム及び少なくとも１つの部分的合成レシピエントゲノムを含む。本発明の方法は、少なくとも１つの部分的合成ドナーゲノム及び少なくとも１つの部分的合成レシピエントゲノムを提供するために、組換えを介した遺伝子改変、好ましくはラムダレッドを介した遺伝子改変（誘導コンジュゲーションの前）の１回又は２回以上のラウンドのさらなるステップを含んでもよい。方法は、少なくとも１つの部分的合成ドナーゲノム及び少なくとも１つの部分的合成レシピエントゲノムについての選択の１回又は２回以上のラウンドをさらに含んでもよい。

少なくとも１つの部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の２つの相同領域が隣接した第１の選択可能マーカーを含んでもよく、少なくとも１つの部分的合成レシピエントゲノムは、２つの対応する相同領域が隣接した第２の選択可能マーカーを含んでもよく、第１の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び／又は第２の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。

適切には、陰性選択可能マーカーは、ｓａｃＢ（スクロース感受性）、ｒｐｓＬ（Ｓ１２リボソームタンパク質－ストレプトマイシン感受性）、又はｐｈｅ^{ＳＴ２５１Ａ＿Ａ２９４Ｇ}（４－クロロフェニルアラニン感受性）からなる群から選択される。適切には、陽性選択可能マーカーは、Ｃｍ^Ｒ（クロラムフェニコール耐性）、Ｋａｎ^Ｒ（カナマイシン耐性）、Ｈｙｇ^Ｒ（ハイグロマイシン耐性）、ゲンタマイシン^Ｒ（ゲンタマイシン耐性）、又はテトラサイクリン^Ｒ（テトラサイクリン耐性）からなる群から選択される。選択可能マーカーは、組換えを介した遺伝子改変の１つ又は２つ以上のステップにおけるものと異なってもよい。

好ましくは、少なくとも１つの部分的合成レシピエントゲノムに存在する合成領域は、相同領域が隣接した領域の外側にある、すなわち、合成領域は実質的に重複しない。好ましくは、相同領域は、３ｋｂ～５００ｋｂの長さ、最も好ましくは約３～５ｋｂである。

誘導コンジュゲーション
誘導コンジュゲーションの１回又は２回以上のラウンドは、合成ゲノムを産生するために本発明の２つ又は３つ以上の異なる部分的合成ゲノムに対して実行されてもよい。

誘導コンジュゲーションの各ラウンドは、より大きな連続する合成領域を有する部分的合成ゲノムを提供するために使用され得る。例えば、組換えを介した遺伝子改変の１回又は２回以上のラウンド後、各々が約５００ｋｂの連続する合成領域を有する、８つの部分的合成ゲノムが存在し得る。誘導コンジュゲーションの１回目のラウンド後、部分的合成ゲノムの２つは、各々が約５００ｋｂの連続する合成領域を有する６つの部分的合成ゲノム、及び約１Ｍｂの連続する合成領域を有する１つの部分的合成ゲノムを提供するために組み合わされてもよい。２回目のラウンドは、各々が約５００ｋｂの連続する合成領域を有する５つの部分的合成ゲノム、及び約１．５Ｍｂの連続する合成領域を有する１つの部分的合成ゲノム；又は各々が約５００ｋｂの連続する合成領域を有する４つの部分的合成ゲノム、及び各々が約１Ｍｂの連続する合成領域を有する２つの部分的合成ゲノムを提供することができる。誘導コンジュゲーションの数回のラウンドの後、完全な合成ゲノム（すなわち、約４Ｍｂの連続する合成領域を有するもの）が提供され得る。例を図１０及び１１ｂに概略的に示す。

誘導コンジュゲーションの任意の適切な方法が使用されてもよい。誘導コンジュゲーションの方法は当業者に周知であり、例えば、Ma, N.J., Moonan, D.W. and Isaacs, F.J., 2014. Nature Protocols, 9(10), p.2285に記載されている。合成ゲノムへの経路は限定されない。

それ故、誘導コンジュゲーションの１回又は２回以上のラウンドは、
ｉ）部分的合成レシピエントゲノムを含む第１の宿主細胞、並びに部分的合成ドナーゲノム及びコンジュゲートプラスミドを含む第２の宿主細胞を準備するステップ、
ii）部分的合成レシピエントゲノム及び部分的合成ドナーゲノムのコンジュゲーションのステップ、並びに
iii）ドナーゲノムの合成領域が部分的合成レシピエントゲノムに取り込まれている組換え体を選択するステップ
を含んでもよい。

部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の２つの相同領域が隣接した第１の選択可能マーカーを含んでもよく、部分的合成レシピエントゲノムは、２つの対応する相同領域が隣接した第２の選択可能マーカーを含んでもよく、第１の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び／又は第２の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。それ故、ステップ（iii）は、前記選択可能マーカーの選択、すなわち、第１の選択可能マーカーの獲得及び第２の選択可能マーカーの喪失の選択を含んでもよい。

適切には、陰性選択可能マーカーは、ｓａｃＢ（スクロース感受性）、ｒｐｓＬ（Ｓ１２リボソームタンパク質－ストレプトマイシン感受性）、又はｐｈｅ^{ＳＴ２５１Ａ＿Ａ２９４Ｇ}（４－クロロフェニルアラニン感受性）からなる群から選択される。適切には、陽性選択可能マーカーは、Ｃｍ^Ｒ（クロラムフェニコール耐性）、Ｋａｎ^Ｒ（カナマイシン耐性）、Ｈｙｇ^Ｒ（ハイグロマイシン耐性）、ゲンタマイシン^Ｒ（ゲンタマイシン耐性）、又はテトラサイクリン^Ｒ（テトラサイクリン耐性）からなる群から選択される。選択可能マーカーは、組換えを介した遺伝子改変の１つ又は２つ以上のステップにおけるものと異なっていてもよい。

好ましくは、相同領域は、３ｋｂ～５００ｋｂの長さ、最も好ましくは約３～５ｋｂである。好ましくは、誘導コンジュゲーションのステップが誘導コンジュゲーションの最後のステップである場合、相同領域は５０ｋｂ～５００ｋｂである。

ステップ（ii）は、第１の宿主細胞及び第２の宿主細胞をインキュベートするステップを含んでもよい。例えば、第１の宿主細胞及び第２の宿主細胞は、混合され、適切な培地（例えば、寒天プレート）に移され、約３７℃で約１～３時間、インキュベートされてもよい。

コンジュゲートプラスミドはＦプラスミドであってもよく、好ましくはコンジュゲートプラスミドは伝達起点を含まない。（例えば、図２２ｃ）。

好ましい実施形態では、ゲノムの生存能は誘導コンジュゲーションの各ラウンドの後に試験される。有利には、これは、ゲノム編集（例えば、センスコドン置換）が生存可能なゲノムをもたらすことを検証し、許可されていない編集を修正することを可能にする。一部の実施形態では、ゲノムの配列は誘導コンジュゲーションの各ラウンドの後に検証される。

当業者は、開示されるように本発明の範囲から逸脱せずに本明細書に開示される本発明の全ての特徴を組み合わせることができることを理解するであろう。

本発明の好ましい特徴及び実施形態はここで非限定的な例として記載される。

本発明の実施は、他に示されない限り、化学、生化学、分子生物学、微生物学及び免疫学の従来の技術を利用し、それらは当業者の能力の範囲内である。そのような技術は文献に説明されている。例えば、Sambrook, J., Fritsch, E.F. and Maniatis, T. (1989) Molecular Cloning: A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press; Ausubel, F.M. et al. (1995 and periodic supplements) Current Protocols in Molecular Biology, Ch. 9, 13 and 16, John Wiley & Sons; Roe, B., Crabtree, J. and Kahn, A. (1996) DNA Isolation and Sequencing: Essential Techniques, John Wiley & Sons; Polak, J.M. and McGee, J.O’D. (1990) In Situ Hybridization: Principles and Practice, Oxford University Press; Gait, M.J. (1984) Oligonucleotide Synthesis: A Practical Approach, IRL Press;及びLilley, D.M. and Dahlberg, J.E. (1992) Methods in Enzymology: DNA Structures Part A: Synthesis and Physical Analysis of DNA, Academic Pressを参照のこと。
［実施例］

同義コドン圧縮を用いたゲノムの設計
本発明者らは最初に、オープンリーディングフレーム（ＯＲＦ）におけるセリンコドンＴＣＧ及びＴＣＡ並びに終止コドンＴＡＧが、それらの同義ＡＧＣ、ＡＧＴ、及びＴＡＡでそれぞれ体系的に置換されている、大腸菌ＭＤＳ４２ゲノム（Ｕｎｉｐｒｏｔ受託番号ＡＰ０１２３０６．１）の型を設計した（図１ａ、図１８、配列番号１）。本発明者らは、同義コドン圧縮のためのこの定義された書き換えスキームが、必須遺伝子が豊富な大腸菌ゲノムの２０ｋｂ領域で可能であることを以前に示した（Wang, K. et al., 2016. Nature 539, 59-64）。しかしながら、この領域は、ゲノム内の標的コドンの０．４６％しか占めていない。

大腸菌は多数の重複するオープンリーディングフレーム（ＯＲＦ）を含有し、本発明者らは、重複を、３’、３’（逆向きのＯＲＦの間）又は５’、３’（同じ向きのＯＲＦの間）に分類する。標的化されたコドンは重複の両方のクラス内に見出される。３’、３’重複内の各ＯＲＦの書き換えが、いずれかのＯＲＦのコードされたタンパク質配列を変化させずに、すなわち、同義コドンを導入することによって達成され得る場合、重複構造は維持され、配列は直接書き換えられた。しかしながら、これが不可能であった場合、本発明者らは、重複する領域を複製し、各ＯＲＦを個々に書き換えた（図１ｂ、表１）。

５’、３’重複に関して、本発明者らは、ＯＲＦの間の重複の領域及び重複の上流の２０ｂｐ配列の両方を複製することによってＯＲＦを分離した。このリファクタリングにより、本発明者らは、各ＯＲＦを独立して書き換えることが可能になる（図１ｃ、表１）。本発明者らのストラテジーは、下流ＯＲＦについてのＲＢＳの配列及びこのＲＢＳとその開始コドンとの間の距離を保存する。

同義コドン圧縮についての定義された規則及びリファクタリングを使用して、本発明者らは、１８，２１８個の全ての標的コドンがそれらの標的同義語に書き換えられるゲノムを設計した（図１ｄ）。

書き換えられた区画の合成
本発明者らは、設計されたゲノム上で、小分子への合成経路を設計するために一般的に使用されるものと同様の逆合成を実施した（図２）。本発明者らは、ゲノムを、８つの区画である、およそ０．５ＭｂのＡ～Ｈに切断し（図１ｄ、図２ａ、図１８、配列番号１）、次いで各区画を４～５つの断片に切断した（図２ｂ）。これにより、９１ｋｂ～１３６ｋｂの３７個の断片を得た（図１ｄ、表２）。本発明者らは、非必須遺伝子間の遺伝子間領域において、断片の間、及び区画の間に境界を配置した。断片を、およそ１０ｋｂの９～１４個のストレッチにさらに切断した（図２ｃ、表２）。

本発明者らは、Ｓ．セレビシエにおける相同組換えにより各断片を含有するＲＥＸＥＲのためのＢＡＣ（図２ｃ、図２０）を組み立てた（Wang, K. et al., 2016. Nature 539, 59-64;及びKouprina, N., et al., 2004. Methods Mol Biol 255, 69-89）。断片の３６については、ＢＡＣアセンブリは円滑に進行した（表３）。断片３７は組み立てるのが困難であったので、本発明者らは、２つの５０ｋｂの断片にそれを分割し（３７ａ及び３７ｂ）、組み立てるために真っすぐにした（表３）。

本発明者らは、ＲＥＸＥＲにより、７つの異なる株においてゲノム置換を開始した。各株のＲＥＸＥＲについての開始点は、区画Ａ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇ又はＨの始まりに対応し（図１ｄ、２ｂ、図３）、区画Ｂは、以下に記載されるように、後で区画Ａに設けた。本発明者らは、陽性及び陰性選択マーカーを担持するカセットを導入することによって各株におけるゲノム置換の開始点をマークした。本発明者らは、Ｃａｓ９（Jiang, W., et al., 2013. Nat Biotechnol 31, 233-239）、ラムダレッド組換え機構（Datsenko, K. A. & Wanner, B. L., 2000. Proc Natl Acad Sci USA 97, 6640-6645）、及び各区画について関連する株へ最初に書き換えられた断片を含有するＢＡＣを導入し、関連するＣａｓ９スペーサー（Jiang, W., et al., 2013. Nat Biotechnol 31, 233-239）をコードするＤＮＡの細胞への付加によってゲノムＤＮＡの置換を開始した。ＢＡＣからの書き換えられたＤＮＡのＣａｓ９を介した切除及びこのＤＮＡのゲノムへのラムダレッドを介した組換えにより、書き換えられたＤＮＡでのゲノムＤＮＡの区画の置換、ゲノムからの陽性及び陰性選択マーカーの除去、並びに新たな直交の陽性及び陰性選択マーカーの導入が生じた。標的領域にわたって組み換えられたクローンを、ゲノムから陰性選択マーカーが喪失したこと、及びＢＡＣから陽性選択マーカーを獲得したことに基づいて選択した。

各株において、最初のＲＥＸＥＲにおいて導入される陽性及び陰性選択マーカーは、次のラウンドのＲＥＸＥＲについての鋳型を提供し、ゲノム段階の交換合成（ＧＥＮＥＳＩＳ）を可能にする（図２ｂ、図４）。本発明者らは、初期のラウンドのＲＥＸＥＲについてスペーサーをコードしたプラスミドを使用した（表４、図２０ｄ、図２１）。しかしながら、本発明者らは、その後、ＲＥＸＥＲが、ＰＣＲによって生成した直鎖状二本鎖スペーサーのエレクトロポレーションによって開始され得ることを見出した（表４、図２１ａ）。これらのスペーサーは細胞分裂を介して伝播しないので、これにより、ＲＥＸＥＲの１つのステップからの細胞を、ＲＥＸＥＲの次のステップのためにより迅速に使用することが可能になった。この進歩はＧＥＮＥＳＩＳを加速させた。区画Ａ、Ｃ、Ｄ、Ｅ、Ｆ、及びＧについて、本発明者らが、およそ０．５ＭｂのゲノムＤＮＡを合成ＤＮＡで置換するまで、本発明者らは、ＲＥＸＥＲの４～５つのステップについて時計回りの方向にＧＥＮＥＳＩＳを進行させた。区画Ａを最初に開始し、他の区画の前に完了したので、本発明者らは、区画Ａの終わりに達すると、区画Ｂを介してＧＥＮＥＳＩＳを進行した。

各ＲＥＸＥＲ後、本発明者らは得られたゲノムの配列を決定して、ゲノムの標的化された領域にわたって完全に書き換えられた細胞を同定した（表４）。並行して、本発明者らは、多数の単一ステップのＲＥＸＥＲ（表４）を実行して、書き換えることが困難であり得るゲノムの１００ｋｂ領域を迅速に同定し、その後、本発明者らはＧＥＮＥＳＩＳを介してそれらに達した。区画Ａ、Ｃ、Ｄ、Ｅ、Ｆ及びＧの全てを含む、３８ステップのうちの３５について、本発明者らは、ＧＥＮＥＳＩＳによって標的化されたゲノム配列を完全に書き換えることができた。本発明者らは、区画Ｂにおける断片９について、並びに区画Ｈにおける断片３７ａ及び１について合成ＤＮＡによる対応するゲノム領域の不完全な置換のみを観察した（表４）。

設計上の欠陥の同定及び修復
ＲＥＸＥＲ後にいくつかのクローンを配列決定することにより、本発明者らは、各標的コドンが書き換えられる頻度をスコア付けし、それによってゲノム領域についての書き換えランドスケープを集約することが可能になる。断片１での書き換えランドスケープから、本発明者らは、本発明者らの定義したスキームにより書き換え難いような、メチオニンアミノペプチダーゼをコードする必須遺伝子である、ｍａｐにおける４番目のコドン（Ｓｅｒ４、ＴＣＡ）を直接同定した（図５ａ）。本発明者らはまた、必須遺伝子ｆｔｓＩ及びｍｕｒＥの１４ｂｐの重複、並びにｆｔｓＩ及びｍｕｒＥにおけるいくつかのセリンコドンを包含する第２の領域を同定し、これは、本発明者らの書き換えられ、リファクタリングされた配列によって置換されていなかった。本発明者らは、この領域を同じ書き換えスキームで以前に書き換えたので、ここで使用した２０ｂｐではなく重複に１８２ｂｐを加えたものを複製した場合（Wang, K. et al., 2016. Nature 539, 59-64）（図１ｃ）、本発明者らは、この領域についての合成ＤＮＡの不具合が、その書き換えにおいてではなく、そのリファクタリングにおいてであると結論付けている。拡張したリファクタリング（図５ｂ）及びｍａｐにおけるＳｅｒ４でのＴＣＡからＴＣＴの変異（図５ｃ、表５）の両方を含有した、新たな断片１のＢＡＣを用いたＲＥＸＥＲにより、ゲノムの標的化した１００ｋｂ領域の完全な書き換えが可能になった（図５ｄ）。

断片９についてのＲＥＸＥＲ後の書き換えランドスケープから、本発明者らは、書き換えられていなかった２６ｋｂのゲノム領域を同定した（図６）。書き換えられた断片９を含有するＢＡＣの存在下で、この領域内及び周囲のゲノムの１０ｋｂ領域を削除する試みにより、ゲノムの１０ｋｂに書き換えることが困難であった領域を絞り込んだ。１０ｋｂのゲノム領域にわたるＲＥＸＥＲにより、ｙｃｅＱにおいて得られた書き換えランドスケープ内の最小値が明らかになった。これにより、ｙｃｅＱ内の５つの標的コドンを書き換えることが問題であると同定された。同様に、断片３７ａでのＲＥＸＥＲ後の書き換えランドスケープ、その後のさらなる配列決定により、本発明者らは、書き換えられていなかった、ｙａａＹの３’末端における単一コドンを同定することができた（図７）。

ｙｃｅＱ及びｙａａＹの両方は「予測タンパク質」をコードし、ｙｃｅＱにおける複数の挿入物は生存可能であり、これらの予測遺伝子からのｍＲＮＡ産生及び／又はタンパク質合成の証拠は存在しない（Pundir, S., et al., 2017. Methods Mol Biol 1558, 41-55）。特に、ｙｃｅＱ及びｙａａＹ内で書き換え難いコドンの全ては、必須遺伝子の５’非翻訳領域（ＵＴＲ，untranslated region）内にある。本発明者らは、ｙｃｅＱ及びｙａａＹを書き換えることによって導入された配列変化が、隣接する必須遺伝子の調節に悪影響を及ぼすことを示唆している。実際に、ｙｃｅＱにおける標的コドンを、ＲＮＡ二次構造及びｒｎｅ（必須リボヌクレアーゼＲＮａｓｅＥをコードする）の５’ＵＴＲ内のプロモーターエレメントにマッピングし（図８）、これらの配列はＲＮＡｓｅＥ恒常性を制御するのに不可欠である（Schuck, A., et al. 2009. Mol Microbiol 72, 470-478）。

本発明者らは、ｙｃｅＱの５’配列に終止コドンを導入することによって断片９を修正し、これにより、いずれかの潜在的な翻訳を最小限に抑えるが、ｒｎｅ転写を調節するための天然配列を保持する（図６、表５）。この新たなＢＡＣでのＲＥＸＥＲにより、対応する１００ｋｂのゲノム領域が完全に書き換えられた（図６、表５）。ｙａａＹにおける問題のあるコドンにてＴＣＡからＡＧＣへ置き換えた断片３７ａを含有する、新たなＢＡＣでのＲＥＸＥＲにより、ゲノムの対応する領域が完全に書き換えられた（図７、表５）。

全ての最初に問題となった配列を特定し、修正することにより、本発明者らは、区画Ａ及びＢが完全に書き換えられる株のアセンブリ（図９）、及び区画Ｈが完全に書き換えられる株のアセンブリ（表５、図９）を完了した。これにより、７つの異なる株において全ての区画のアセンブリを完了した。

書き換えられたゲノムのアセンブリ
本発明者らは、書き換えられた区画を単一ゲノムに組み立てるためにコンジュゲーションベースのストラテジーを開発した（Isaacs, F. J. et al., 2011. Science 333, 348-353; Ma, N. J., et al., 2014. Nat Protoc 9, 2285-2300;及びLederberg, J. & Tatum, E. L., 1946. Nature 158, 558）。本発明者らのストラテジーは、伝達起点（ｏｒｉＴ）を含有する、書き換えられた「ドナー」区画を、ドナーとの相同性を提供するために伸長されている、それらの隣接する書き換えられた「レシピエント」区画にコンジュゲートすることによって時計回りに書き換えられたゲノムを組み立てる（図１０、図１１ａ、図２２ａ、ｂ）。これにより、ドナー及びレシピエントの両方の書き換えられた区画を含有する新たなゲノムを生成する。次いでこの新たなゲノムを含有する細胞は、次の書き換えられるドナーのためのレシピエントとして使用することができ、プロセスの反復により、書き換えられた区画を徐々に書き換えられたレシピエントに付加することにより、書き換えられたゲノムを組み立てることが可能になる（図１０、図１１ａ、ｂ）。ドナー細胞は、ドナーゲノムのレシピエント細胞への伝達を容易にするＦ’プラスミドの型を含有したが、標準的なＦ’プラスミドと異なり、それ自体をレシピエント細胞に伝達する能力はなく（図２２ｃ）、結果としてこのＦ’プラスミドは、全てのコンジュゲーション後、レシピエント細胞から喪失される必要はない。これにより、本発明者らのワークフローが加速された。

本発明者らは、ドナー及びレシピエント細胞を混合することによってコンジュゲーションを開始し、ドナーからレシピエントへのゲノム伝達の程度を制御するためにコンジュゲーションの時間及び条件を変化させた。ドナーとレシピエント細胞との間のコンジュゲーション後、本発明者らは、レシピエント細胞を選択し、次いでドナーからの書き換えられた配列の末端に陽性マーカーを獲得し、レシピエントの伸長の末端に陰性マーカーを喪失したそれらのレシピエントを選択した（図１１ａ）。

本発明者らは、区画Ａ～Ｅを通して書き換えられたゲノムの収束合成を実施した（図１０、図１１ｂ）。次いで本発明者らは、ＦについてのレシピエントとしてＡ～Ｅ株を使用し、書き換えられた株Ａ～Ｆを生成した。次いでＡ～ＦをＦ～Ｇについてのレシピエントとして使用し、Ａ～Ｇを生成し、このコンジュゲーションは、コンジュゲーション効率を増加させるためにドナーとレシピエント株との間で、かなり長い共有した書き換えられた配列（０．４Ｍｂ）を使用した。

完全に書き換えられたゲノムを作製するために、本発明者らは、Ａ～Ｇ－３７ａｂを作製するために３７ａ及び３７ｂをＡ～Ｇに導入することによってレシピエント株を最初に作製した（最終的なドナーに１１５ｋｂの相同領域を提供する）。本発明者らは、Ｈ株とＡＢ株との間のコンジュゲーションによって最終的なドナー株を作製し、これにより、Ｈ、Ａ及び区画Ｂからの断片９が書き換えられる、Ｈ－Ａ－０９株を得た（図１０、図１１ｂ）。Ａ及びＢからの追加の配列をＨに付加して、本発明者らは、最終的なコンジュゲーションにおけるＡの書き換えを消去しないことを確実にした。Ｈ－Ａ－０９ドナー株とＡ～Ｇ－３７ａｂレシピエント株との間の最終的なコンジュゲーションにより、大腸菌の合成が生じ、これを本発明者らは大腸菌Ｓｙｎ６１と命名し、その大腸菌Ｓｙｎ６１では、ゲノム内の１．８×１０^４個の全ての標的コドンが書き換えられている（図１９、配列番号２）。本発明者らの書き換えられたゲノムの合成は、８つのみのプログラムされていない変異を導入し（表６）、これらの変異のうちの４つは、１００ｋｂのＢＡＣの調製の間に発生し、４つは書き換えプロセスの間に発生した。

Ｓｙｎ６１における同義コドン圧縮の結果
Ｓｙｎ６１は、３７℃でＬＢにグルコースを加えたものでは、ＭＤＳ４２より１．６倍のみ遅く倍加し、この割合は２５℃で増加し、４２℃で減少した（図１３ａ）。Ｓｙｎ６１は、ＭＤＳ４２より６５％多いＡＧＴ及びＡＧＣコドンを含有するが、これらのコドンを解読するｔＲＮＡである、ｓｅｒＶのさらなるコピーを提供し（図１２ａ）、増殖を増加させず（図１３ａ）、これにより、ｓｅｒＶは制限されていないことが示唆される。Ｓｙｎ６１細胞の画像化により、それらがＭＤＳ４２よりわずかに長いことが示唆される（図１３ｂ、ｃ）。Ｓｙｎ６１のプロテオームは、ＭＤＳ４２のプロテオームと同等であった（図１３ｄ）。ＴＣＧコドンを標的化した、直交アミノアシル－ｔＲＮＡ合成酵素／ｔＲＮＡ_ＣＧＡ対を使用した、非カノニカルアミノ酸の共翻訳取り込みは、ＭＤＳ４２において極めて毒性が強かったが、Ｓｙｎ６１では完全に無毒であり、Ｓｙｎ６１におけるＴＣＧコドンの除去についての表現型の検証を提供した（図１２ｂ）。このアプローチはまた、さらなる洞察も提供した（図１４ａ、ｂ、ｃ）。ｔＲＮＡ^Ｓｅｒ _ＵＧＡをコードするｓｅｒＴは、大腸菌におけるＴＣＡコドンを解読するｔＲＮＡのみであるので、必須である。Ｓｙｎ６１はＴＣＡコドンを含有しないので、ｓｅｒＴは本発明者らの株では非必須であるべきである。実際に、本発明者らは、Ｓｙｎ６１においてｓｅｒＴ（図１２ｃ、図１４ｄ、図２３）、並びにｓｅｒＵ及びｐｒｆＡ（図１４ｅ、ｆ、図２３）を容易に除去することができることを実証した。これらのデータは、本発明者らが、ゲノムから標的コドンを除去した機能的な確認を提供し、ｔＲＮＡ及び標的コドンを解読する終結因子がＳｙｎ６１において除去され得ることを示し、書き換えから生じるＳｙｎ６１の特有の特性を実証する。

考察
本発明者らは、４Ｍｂのゲノム全体を合成ＤＮＡで置換した大腸菌を作製し、本発明者らの実験ではゲノム置換のスケールは、Ｓ．セレビシエの単一株でのマイコプラズマ又は染色体置換においてゲノム置換について以前に報告されていたものよりおよそ４倍大きい（図１５ａ）。

本発明者らは、大腸菌の単一株での全ての既知の１．８×１０^４個の標的コドン（２つのセンスコドンであるＴＣＧ及びＴＣＡ、アンバーコドンであるＴＡＧ）のゲノムワイド除去を実証した。本発明者らの研究は、部位特異的変異誘発によってアンバー終止コドンを除去する実験より６０倍多いコドンを除去する（図１５ｂ）。さらに、これは、全ての標的化されたセンスコドンの完全で、ゲノムワイドな書き換えを実証する（図１５ｂ）。それ故、本発明者らは、通常の６４個の代わりに６１個のコドンを使用する合成生物を作製した。新たな生物は、２０種のカノニカルアミノ酸をコードするために少ない数のセンスコドンを使用する。

本発明者らの合成ゲノムは、標的コドン当たり２×１０^－４個のみのプログラムされていない変異を含有する（図１５ｃ）。これは、有利には、部位特異的変異誘発法によってアンバーコドンを置換するために報告されている標的コドン当たり１．０５個のプログラムされていない変異に匹敵する（Lajoie, M. J. et al., 2013. Science 342, 357-360）（図１５ｃ）。

本発明者らの最終的な合成ゲノムは、本発明者らが、ゲノムの標的コドンの８３個（０．４３％）のみで以前に決定した書き換え規則を使用して、定義したリファクタリング及び書き換えスキームを使用して書き換えた（Wang, K. et al. 2016. Nature 539, 59-64）。書き換え規則はゲノムの１．８×１０^４個の標的コドンの９９．９％で行ったのに対して、リファクタリング規則は重複の９９％で行った。

本発明者らの最初の書き換えスキームの修正が、ゲノム全体の１．８×１０^４個の標的コドンの７つのみで必要であった。これらのコドンのうちの１つは必須遺伝子にあったが、その他の６つは必須遺伝子の５’ＵＴＲ内にあった。それ故、本発明者らの定義した書き換えスキームの変化の１つを除いて全ては、翻訳に対する変更した同義語の直接的な影響ではなく、必須遺伝子の５’ＵＴＲに対する意図していない変更を修正する。

本発明者らが、設計したゲノムを、区画、断片、及びストレッチに切断し、ＲＥＸＥＲ、ＧＥＮＥＳＩＳ及び誘導コンジュゲーションの収束的でシームレスでロバストな組み込みによる設計を実現するために開発したストラテジーは、将来のゲノム合成についての青写真を提供する。将来の研究では、本発明者らは、大腸菌Ｓｙｎ６１における同義コドン圧縮の結果をさらに特徴付け、大腸菌及び他の生物におけるさらなる書き換えスキームを試験する。さらに、本発明者らは、非カノニカルバイオポリマー合成のためのセンスコドン再割当を試験する。

方法
書き換えられたゲノム設計
本発明者らは、３５４７個の注釈付きのＣＤＳを有する、大腸菌ＭＤＳ４２ゲノム（２０１６年１０月０７日に公開された受託番号ＡＰ０１２３０６．１）の配列に対する本発明者らの合成ゲノム設計に基づいた。本発明者らは、開始ゲノムの注釈を手動でキュレートして３つのＣＤＳを除去し、別の１２個を追加した。除去した３つの予測ＣＤＳは、ｈｔｇＡ、ｙｂｂＶ、及びｙｚｆＡであり、これらの配列がタンパク質をコードするという証拠は存在せず（Pundir, S., et al., 2017. Methods Mol Biol 1558, 41-55）、これらの配列は、良好に特徴付けられた遺伝子と完全に又は大部分が重複しており、これにより、それらの重複する遺伝子を破壊することなく、又は大きな反復領域を作製することなくそれらを書き換えることは困難になる。反対に、偽遺伝子ｙｄｅＵ、ｙｇａＹ、ｐｂｌ、ｙｇｈＸ、ｙｇｈＹ、ａｇａＷ、ｙｈｉＫ、ｙｈｊＱ、ｒｐｈ、ｙｓｄＣ、ｇｌｖＧ、及びｃｙｂＣはＣＤＳに推奨された。ｒｐｓＬでの陰性選択を可能にするために、本発明者らは、ｒｐｓＬのゲノムコピーをｒｐｓＬ^Ｋ４３Ｒに変異させた。最後に、本発明者らの社内のＭＤＳ４２のディープシークエンシングにより、ＡＰ０１２３０６．１では報告されていなかった、ｍｒｃＢとｈｅｍＬとの間の５１ｂｐの挿入物が明らかになった。本発明者らは、本発明者らの開始ゲノム配列におけるこの挿入物を手動で導入し、注釈を付けた。

本発明者らは、ｉ）全ての標的コドンを同定し、書き換え、ii）標的コドンを含有する重複する遺伝子配列を同定し、分解するカスタムPythonスクリプトを作成した。本発明者らのキュレートしたＭＤＳ４２開始配列から、本発明者らは、ＴＣＧ、ＴＣＡ及びＴＡＧコドンの全てが、それぞれ、ＡＧＣ、ＡＧＴ及びＴＡＡで置換されている、新たな合成ゲノムを生成するためにスクリプトを使用した。このスクリプトは、標的コドンを含有する重複を有する９１個のＣＤＳを報告した。３３個の例では、遺伝子は尾－尾（３’、３’）で重複しており（表１）、これらのうちの１２個は、重複する遺伝子にサイレント変異を導入することによって書き換えることができたが、残りの２１個は遺伝子を分離するために複製した（図１ｂ）。頭－尾（５’、３’）で重複する遺伝子の５８個の例は、下流遺伝子の内在性発現を可能にするように、重複に上流配列の２０ｂｐを加えたものを複製することによって分解した（図１ｃ）。１ｂｐより長い重複に関して、インフレームＴＡＡを導入して、下流遺伝子について元のＲＢＳからの発現を終結させた。ｐｒｆＢ（終結因子ＲＦ－２）は、その調節内部終止コドンに起因して、本発明者らの開始ＭＤＳ４２ゲノムにおいてＣＤＳとして注釈が付けられていなかったため、本発明者らは、遺伝子内の全ての標的コドンを手動で書き換え、それによって内部終止コドンを維持した。得られたゲノム設計は、１，１５６，６２５個のコドンを有する３５５６個のＣＤＳを含有し、そのうちの１８，２１８個が書き換えられた（図１８、配列番号１）。

書き換えられたストレッチの逆合成
本発明者らは、設計したゲノムを９１～１３６ｋｂの３７個の断片に分割した。本発明者らは、ｉ）境界配列が、必要な場合、ＲＥＸＥＲ４を組み込みのために使用することができるように５’-NGG-３’ＰＡＭからなり、ii）ＰＡＭが標的コドンの５０ｂｐ内に位置せず、iii）ＰＡＭが非必須遺伝子の間にあり、iv）ＰＡＭがプロモーターなどのいずれかの注釈の付いた特徴を妨げないように、これらの断片を区切る境界配列を選択した。本発明者らは、これらの境界の上流及び下流の約５０～１００ｂｐの領域を「ランディング部位」と呼び、それらをＬxxとして注釈を付け、ここでxxは上流断片の数であり、例えば、Ｌ０１は、断片１と２の間のランディング部位である。本発明者らの設計において、ランディング部位配列は断片の３’末端及び次の５’末端に含有され、その結果として、３７個全ての断片は、それらの隣接する断片と５４～１５５ｂｐの重複する相同を含有する。

各断片を、４～１５ｋｂの７～１４個のストレッチにさらに分解した。本発明者らは、互いに８０～２００ｂｐの重複を含有するようにストレッチを設計し、重複領域を、あらゆる書き換え標的を含まない遺伝子間領域で定義した。合計４０９個のストレッチを合成し（GENEWIZ社、ＵＳＡ）、BsaI、AvrII、SpeI、又はXbaI制限部位が隣接したpSC101又はpSTベクターに供給した。合成ストレッチは天然では、これらの制限部位のうちの少なくとも１つを含有しなかった。

ＲＥＸＥＲ／ＧＥＮＥＳＩＳのための選択カセット及びプラスミドの構築
この節に記載しているクローニング手順は、ｒｐｓＬＫ４３Ｒ変異によってストレプトマイシンに耐性がある大腸菌ＤＨ１０ｂにおいて実施した。この研究全体にわたって使用したプラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAは、以前に記載されているように、アラビノース誘導プロモーターの制御下でＣａｓ９及びラムダ－レッド組換え成分アルファ／ベータ／ガンマ、並びにその天然プロモーター下でｔｒａｃｒＲＮＡをコードする（Wang, K. et al., 2016. Nature 539, 59-64）。

ＲＥＸＥＲのためのプロトスペーサーは、プラスミドpKW1_MB1_Amp_スペーサーにおいてコードされ（図２１ａ）、これは、以前に記載されているように、その内在性プロモーターの制御下でｐＭＢ１複製起点、アンピシリン耐性マーカー及びプロトスペーサーアレイを含有する（Wang, K. et al., 2016. Nature 539, 59-64）。このプラスミドから、本発明者らは、誘導体pKW3_MB1_Amp _Tracr^K_スペーサーを構築し（表５）、これは、プロトスペーサーアレイの上流にｔｒａｃｒＲＮＡをさらに含有する。このために、本発明者らは、その修飾された内在性プロモーターと共にｔｒａｃｒＲＮＡを含有するＰＣＲ産物を、NEBuilder HiFi Master Mixを使用したギブソンアセンブリによってpKW1_MB1_Amp_スペーサーのBamHI部位に導入した。このプラスミドから、また、ギブソンアセンブリによってＣａｓ９をさらにコードする誘導体を構築し、pKW5_MB1_Amp_Tracr^K_Cas9_スペーサーと命名した。

各ＲＥＸＥＲステップについて、これらの３つのプラスミドのうちの１つの誘導体を、ＢＡＣ及びゲノムを切断するための標的配列に対応する、２個（ＲＥＸＥＲ２）又は４個（ＲＥＸＥＲ４）のプロトスペーサーを含有するプロトスペーサー／直接反復アレイを保有するように構築した。異なるプロトスペーサーアレイを、複数ラウンドのＰＣＲにより重複しているオリゴから構築し、その産物を、pKW1_MB1_Amp_スペーサー、pKW3_MB1_Amp_Tracr^K_スペーサー又はpKW5_MB1_Amp_Tracr^K_Cas9_スペーサーの骨格における制限部位AccIとEcoRIとの間にギブソンアセンブリによって挿入した。各アセンブリから得られたプロトスペーサーアレイは、サンガー配列決定によって変異がないことを検証した。

ＲＥＸＥＲ及びＧＥＮＥＳＩＳにおいて使用した陽性－陰性選択カセットは、－１／＋１（ｒｐｓＬ－Ｋａｎ^Ｒ）、－２／＋２（ｓａｃＢ－Ｃｍ^Ｒ）及び－３／＋３（ｐｈｅＳ^{Ｔ２５１Ａ＿Ａ２９４Ｇ}－Ｈｙｇ^Ｒ）である。－１／＋１及び－２／＋２は以前に記載されている通りである（Wang, K. et al., 2016. Nature 539, 59-64）。－３／＋３では、ｐｈｅＳ^{Ｔ２５１Ａ＿Ａ２９４Ｇ}は、４－クロロフェニルアラニンの存在下で優性致死性であり、Ｈｙｇ^Ｒはハイグロマイシンに対する耐性を与える。両方のタンパク質は、ＥＭ７プロモーターの制御下でポリシストロン的に発現される。－３／＋３カセットはデノボ合成した。－３／＋３カセットは、ｐｈｅＳ^＊／Ｈｙｇ^Ｒとも称される。

ゲノムランディング部位に二重選択カセットを含有する大腸菌株の構築。
本発明者らの設計によれば、合成断片による置換のために標的化されるゲノムの各領域には、上流のランディング部位及び下流のランディング部位が隣接しており、これらのゲノムランディング部位配列は上記のランディング部位配列と同じである。ＲＥＸＥＲ／ＧＥＮＥＳＩＳを開始するには、上流のゲノムランディング部位に二重選択カセットの挿入を必要とする。本発明者らは、ラムダ－レッドを介した組換えによってランディング部位に二重選択カセットを挿入した。簡潔に説明すると、ｓａｃＢ－Ｃｍ^Ｒ又はｒｐｓＬ－Ｋａｎ^Ｒカセットのいずれかを、所望のゲノムランディング部位に対する相同領域を含有するプライマーを用いてＰＣＲ増幅させた。組換え実験のために、本発明者らは、以前に記載されているようにエレクトロコンピテントセルを調製し（Wang, K. et al., 2016. Nature 539, 59-64）、３μｇの精製したＰＣＲ産物を、ラムダ－レッドアルファ／ベータ／ガンマ遺伝子を発現するpKW20_CDFtet_pAraRedCas9_tracrRNAプラスミドを保有する１００μＬのＭＤＳ４２^{ｒｐｓＬＫ４３Ｒ}細胞にエレクトロポレーションした。アラビノースプロモーター（ｐＡｒａ）の制御下で、ＯＤ_６００＝０．２で開始して１時間、０．５％でＬ－アラビノースを添加して、組換え機構を誘導した。事前に誘導した細胞をエレクトロポレーションし、次いで４ｍＬのスーパーオプティマルブロス（ＳＯＢ，super optimal broth）培地中で３７℃にて１時間回収した。次いで細胞を、１０μｇ／ｍＬのテトラサイクリンを含む１００ｍＬのＬＢ培地で希釈し、３７℃、２００ｒｐｍで４時間増殖させた。その後、細胞を遠心沈殿させ、４ｍＬのＨ_２Ｏに再懸濁し、段階希釈し、播種し、１０μｇ／ｍＬのテトラサイクリン、１８μｇ／ｍＬのクロラムフェニコール（ｓａｃＢ－Ｃｍ^Ｒ用）又は５０μｇ／ｍＬのカナマイシン（ｒｐｓＬ－Ｋａｎ^Ｒ用）を含有するＬＢ寒天プレート上で３７℃にて一晩インキュベートした。

ＢＡＣアセンブリ及び送達
本発明者らは、９７～１３６ｋｂの合成ＤＮＡを含有する細菌人工染色体（ＢＡＣ，Bacterial Artificial Chromosomes）シャトルベクターを構築した。５’側では、合成ＤＮＡには、ゲノムに対する相同性領域（ＨＲ１）、及びＣａｓ９切断部位が隣接した。３’側では、合成ＤＮＡには、二重選択カセット、ゲノムに対する相同性領域（ＨＲ２）、及び第２のＣａｓ９切断部位が隣接した。ＢＡＣはまた、陰性選択マーカー、ＢＡＣ起点、ＵＲＡマーカー及びＹＡＣ起点（自己複製配列に融合したＣＥＮ６セントロメア（ＣＥＮ／ＡＲＳ））も含有した（図２ｃ、図２０ａ～ｃ）。

ＢＡＣは、Ｓ．セレビシエでの相同組換えによって組み立てた。各アセンブリは、ｉ）各々が６～１３ｋｂの長さである、合成ＤＮＡの７～１４個のストレッチを、ii）選択コンストラクト（以下を参照のこと）及びiii）ＢＡＣシャトルベクター骨格と組み合わせた（図２０ａ～ｃ、Wang, K. et al., 2016. Nature 539, 59-64）。

合成ＤＮＡストレッチは、ＧＥＮＥＷＩＺによって提供されたそれらのソースベクターからBsaI、AvrII、SpeI、又はXbaI制限部位での消化によって切除した。AvrII、SpeI、及びXbaIの場合、制限消化に続いて、Mung Beanヌクレアーゼ処理を行って付着末端を除去した。

選択コンストラクトは、断片の最も３’側のストレッチに対する相同性領域、二重選択カセット（ｓａｃＢ－Ｃｍ^Ｒ又はｒｐｓＬ－Ｋａｎ^Ｒ）、標的化されたゲノム遺伝子座に対する相同性領域（ＨＲ２）、陰性選択マーカー（ｒｐｓＬ、ｓａｃＢ又はｐｈｅＳ^＊－Ｈｙｇ^Ｒ）及びＹＡＣを含有した。特定の二重選択カセット、陰性選択マーカー、及び相同領域配列については、図２０ｄを参照のこと。本発明者らは、NEBuilder HiFi DNA Assembly Master Mixを用いて３つのＰＣＲ断片からpSC101骨格において選択コンストラクトのエピソーム型を組み立てた。このエピソーム型は、BsaIによる制限消化がＢＡＣアセンブリのためのＤＮＡ断片を生じるように設計した。

ＢＡＣ起点及びＵＲＡ３マーカーを含有するＢＡＣ骨格を、鋳型として以前に記載されているＢＡＣ（Wang, K. et al., 2016. Nature 539, 59-64）を使用してＰＣＲによって増幅させ、ＰＣＲ産物をＢＡＣアセンブリのために使用した。これらのＰＣＲアセンブリのために使用したプライマーを図２０ｄに列挙する。

ストレッチ、選択コンストラクト、及びＢＡＣ骨格を組み立てるために、３０～５０ｆｍｏｌのＤＮＡの各片をＳ．セレビシエスフェロプラストに形質転換し、これらは以前に記載されているように調製した（Kouprina, N.,et al., 2004. Methods Mol Biol 255, 69-89）。アセンブリ後、本発明者らは、重複している断片のジャンクション及びベクター挿入ジャンクションにおいてコロニーＰＣＲによって正確に組み立てられたＢＡＣを潜在的に保有する酵母クローンを同定した。コロニーＰＣＲによって正確であるように見えるクローンは、以下に記載するように、大腸菌への形質転換後にＮＧＳによって検証された配列であった。

組み立てられたＢＡＣは、製造業者の使用説明書に従ってGentra Puregene Yeast/Bact. Kit（Qiagen社）を用いて酵母から抽出した。エレクトロポレーションによってＭＤＳ４２^{ｒｐｓＬＫ４３Ｒ}細胞に組み立てられたＢＡＣを形質転換した。ＢＡＣの大きなサイズに起因して、本発明者らは、時々、標的細胞への非効率なエレクトロポレーションを観察した。その結果、本発明者らは、ラムダ－レッドを介した組換え（上記の通り）によって５０ｂｐの相同領域を有するＰＣＲ産物として提供されたｏｒｉＴ－アプラマイシンカセットを、アセンブリ後にいくつかのＢＡＣに導入した（図２０ａ～ｃ）。これにより、コンジュゲーションによって、首尾よく形質転換された大腸菌から他の株へのＢＡＣの伝達が促進された。

ＲＥＸＥＲ及びＧＥＮＥＳＩＳによる書き換えられた区画の合成
本発明者らは、連続ＲＥＸＥＲ実験（ＧＥＮＥＳＩＳ）のために種々のゲノム及びプラスミド選択マーカーを使用した（表４）。本発明者らは、選択のためのゲノムランディング部位においてｒｐｓＬ－Ｋａｎ^Ｒ（－１／＋１）又はｓａｃＢ－Ｃｍ^Ｒ（－２／＋２）カセットを使用した。本発明者らは、エピソーム選択マーカーとしてｒｐｓＬ－Ｋａｎ^Ｒ－ｓａｃＢ（－１／＋１、－２）、ｒｐｓＬ－Ｋａｎ^Ｒ－ｐｈｅＳ^＊－Ｈｙｇ^Ｒ（－１／＋１、－３／＋３）又はｓａｃＢ－Ｃｍ^Ｒ－ｒｐｓＬ（－２／＋２、－１）カセットを使用した。

各ＲＥＸＥＲについて、関連する上流のゲノムランディング部位においてpKW20_ CDFtet_pAraRedCas9_tracrRNA及び二重選択カセットを含有するＭＤＳ４２^{ｒｐｓＬＫ４３Ｒ}細胞に、関連するＢＡＣを形質転換した。本発明者らは、２％グルコース、５μｇ／ｍｌのテトラサイクリン及びＢＡＣのために選択した抗生物質（すなわち、１８μｇ／ｍｌのクロラムフェニコール又は５０μｇ／ｍｌのカナマイシン）を補足したＬＢ寒天に細胞を播種した。本発明者らは、５μｇ／ｍｌのテトラサイクリン及びＢＡＣ特異的抗生物質を含むＬＢ培地に個々のコロニーを接種し、３７℃、２００ｒｐｍで一晩細胞を増殖させた。一晩の培養物を、５μｇ／ｍｌのテトラサイクリン、及びＢＡＣ特異的抗生物質を含むＬＢ培地でＯＤ６００＝０．０５に希釈し、ＯＤ６００≒０．２まで約２時間振盪させながら３７℃で増殖させた。ラムダ－レッド発現を誘導するために、本発明者らは、０．５％の最終濃度になるようにアラビノース粉末を培養物に添加し、振盪させながら３７℃でさらに１時間培養物をインキュベートした。本発明者らは、ＯＤ６００≒０．６で細胞を採取し、以前に記載されているように細胞をエレクトロコンピテントにした（Wang, K. et al., 2016. Nature 539, 59-64）。

各ＲＥＸＥＲ実験のために、直鎖状ｄｓＤＮＡプロトスペーサーアレイを、ユニバーサルプライマーを使用してpKW1_MB1Amp_スペーサーからＰＣＲ増幅させた（図２１ａ）。およそ５～１０μｇの消化した得られたDpnI及び精製したＰＣＲ産物を１００μＬのエレクトロコンピテント及び誘導細胞に形質転換した。細胞を３７℃で１時間４ｍｌのＳＯＢ培地中で回収し、次いで５μｇ／ｍＬのテトラサイクリン及びＢＡＣのために選択した抗生物質を補足した１００ｍＬのＬＢで希釈し、振盪させながら３７℃でさらに４時間インキュベートした。あるいは、エレクトロコンピテント及び誘導細胞に、５μｇの環状プロトスペーサーアレイ（pKW1_MB1Amp_スペーサー又はpKW3_MB1Amp_スペーサープラスミド）を形質転換し、３７℃でＳＯＢ培地中で１時間回収した後、振盪させながら３７℃でさらに４時間、１００μｇ／ｍＬのアンピシリンを補足した１００ｍＬのＬＢに移した（図２１ａ、ｂ）。ＲＥＸＥＲ２が十分でなかった場合、本発明者らは、以前に記載されているようにpKW5_MB1Amp_スペーサープラスミドを使用してＲＥＸＥＲ４を実施した（Wang, K. et al., 2016. Nature 539, 59-64）。

本発明者らは、培養物を遠心沈殿させ、それを４ｍｌのMilli-Q濾過水に再懸濁し、５μｇ／ｍｌのテトラサイクリン、陰性選択マーカーに対して選択した薬剤及びＢＡＣに由来する陽性マーカーのために選択した抗生物質を含むＬＢ寒天の選択プレートに段階希釈で塗抹した。このプレートを３７℃で一晩インキュベートした。複数のコロニーを選び、Milli-Q濾過水に再懸濁し、５０μｇ／ｍｌのカナマイシン、１８μｇ／ｍｌのクロラムフェニコール、２００μｇ／ｍｌのストレプトマイシン、７．５％のスクロース又は２．５ｍＭの４－クロロ－フェニルアラニンを補足したいくつかのＬＢ寒天プレートに配置した。コロニーＰＣＲをまた、ランディング部位のゲノム遺伝子座に隣接するプライマー対及びＢＡＣから新たに組み込んだ選択カセットの位置の両方を使用して再懸濁したコロニーから実施した。ＲＥＸＥＲを介した組換えにより、上流のゲノム遺伝子座におよそ５００ｂｐのバンドが生じ、対照ＭＤＳ４２^ｒｋ／ＭＤＳ４２^ｓＣ株についての２．５ｋｂ（ｒｋ－ランディング部位）又は３．５ｋｂ（ｓＣ－ランディング部位）のバンドはゲノムからランディング部位の除去が成功していることを示す。置換したＤＮＡの３’末端に隣接するプライマー対は、およそ２．５ｋｂ（ｐＢＡＣ上のｒＫ選択カセット）又は３．５ｋｂ（ｐＢＡＣ上のｓＣ選択カセット）のバンド及び選択マーカーの組み込みの成功を示す対照ＭＤＳ４２^ｒｋ／ＭＤＳ４２^ｓＣ株についての５００ｂｐのバンドを生成する。

プラスミドに基づく環状プロトスペーサーアレイを以前のＲＥＸＥＲ実験に使用した場合、次の実験の前にプラスミドを喪失させなければならなかった。それ故、最初のＲＥＸＥＲ実験からの成功したクローンを、２％グルコース、５μｇ／ｍＬのテトラサイクリン及びゲノム内の陽性マーカーのために選択した抗生物質を補足したＬＢで、振盪させながら３７℃で高密度の培養物になるまで増殖させた。次いで２μＬの培養物を、同じ補足物を含むＬＢ寒天プレートに画線し、３７℃で一晩インキュベートした。いくつかのコロニーを、ＬＢ寒天プレート上のレプリカ及び１００μｇ／ｍＬのアンピシリンを補足したＬＢ寒天プレートに配置して、プラスミドの喪失をスクリーニングした。

ＢＡＣ編集
大腸菌におけるＢＡＣ上の選択カセットにおいて機能喪失変異に遭遇した場合、欠陥のあるカセットを、５０ｂｐの相同領域が隣接し、ラムダ－レッドを介した組換えによって組み込まれているＰＣＲ産物として提供される適切な二重選択カセットで置換した（図２０ｄ）。

自然変異を修正するか、又は書き換えられたコドンを変化させるかのいずれかのために、ＢＡＣの合成の書き換えられた配列の変化を２段階の置換アプローチによって導入した。書き換えられた配列の末端に選択カセット－２／＋２及び－１を含有するＢＡＣに関して、－３／＋３カセットを、望ましい遺伝子座を標的化する５０ｂｐの相同領域が隣接し、ラムダ－レッドを介した組換えによって組み込まれたＰＣＲ産物として提供し、続いて＋３について選択した。書き換えられたＤＮＡとゲノムとの間の相同性に起因して、得られたクローンの一部はＢＡＣ上に－３／＋３を含有し、一部はゲノム上に含有する。ＢＡＣ上のカセットでクローンを同定するために、クローンを、（１）＋３について、（２）－３に対して、並びに（３）＋２について及び－３に対して選択して寒天プレート上のレプリカに播種した。（３）ではなくプレート（１）及び（２）で生存したクローンのみが、ＢＡＣに組み込まれた－３／＋３カセットを有する。カセットの位置は、QIAprep Spin Miniprep Kitを使用してＢＡＣを精製し、続いてゲノタイピングすることによって検証した。第２のステップでは、５０ｂｐの相同領域が隣接し、ラムダ－レッドを介した組換えによって組み込まれた望ましい配列のＰＣＲ産物を提供することによって－３／＋３カセットを置換し、続いて＋２について及び－３に対して選択した。ＢＡＣを上記のようにゲノタイピングし、ＮＧＳによって配列を検証した。

伝達不可能なＦ’プラスミドの調製及びエピソームのコンジュゲート伝達
本発明者らは、ゲノムＤＮＡのコンジュゲーション、及び株間のＢＡＣの伝達のために使用するＦ’プラスミドの型を作製して、Ｆ’プラスミド自体を伝達せずにｏｒｉＴを担持する配列の伝達を可能にした（図２２ｃ）。本発明者らは、Ｆ’プラスミド自体内の伝達起点（ｏｒｉＴ）のニック部位を削除することによってこれを達成し、関連するアプローチは以前に報告されている（Strand, T. A., et al., 2014. PLoS One 9, e90372）。Ｆ’プラスミド誘導体であるpRK24（ａｄｄｇｅｎｅ＃５１９５０）を、５０ｂｐの相同領域が隣接したＰＣＲ産物として望ましいマーカーを組み込むことによって修飾し、組み込みを、Ｔｅｔ^Ｒの代わりにＫａｎ^Ｒを有するpKW20のバリアントを使用してラムダ－レッドを介した組換えによって実施した。最初に、pRK24においてアンピシリン耐性を与えるβ－ラクタマーゼ遺伝子を、感染した細菌細胞の視覚識別を可能にする生物発光を生成する人工T5-luxABCDEオペロン（Bryksin, A. V. & Matsumura, I., 2010. PLoS One 5, e13244）で置換した。次に、Ｔｅｔ^Ｒを、５０μｇ／ｍＬのアプラマイシンで選択するためにアミノグリコシド３－Ｎ－アセチルトランスフェラーゼIVを産生するＴ３－ａａｃ３で置換した。最後に、ｏｒｉＴのニック部位の２４ｂｐの削除を、ブラストサイジン－Ｓデアミナーゼを発現するＥＭ７－ｂｓｄを組み込むことによって行い、低塩ＴＹＥ／ＬＢ中で５０μｇ／ｍＬのブラストサイジンで選択することができる。pJF146と呼ばれる得られたＦ’プラスミド（図２２ｃ）を、QIAprep Spin Miniprep Kit (QIAgen社)を使用して抽出し、後のコンジュゲーションのためにドナー株にエレクトロポレーションによって形質転換した。

ｏｒｉＴを含有するエピソームＤＮＡの伝達をコンジュゲーションによって実施した（Isaacs, F. J. et al., 2011. Science 333, 348-353;及びMa, N. J., et al. 2014. Nat Protoc 9, 2285-2300）。ドナー株にpJF146及びｏｒｉＴを有する組み立てられたＢＡＣを二重形質転換した（上記を参照のこと）。レシピエント株にpKW20を形質転換した。５ｍｌのドナー及びレシピエント培養物を選択ＬＢ培地中で一晩飽和するまで増殖させ、続いて抗生物質を含まないＬＢ培地で３回洗浄した。再懸濁したドナー及びレシピエント株を４：１の比で合わせて、ＴＹＥ寒天プレートにスポットし、３７℃で１時間インキュベートした。細胞をプレートから洗い流し、２％のグルコース、レシピエント株のために選択した５μｇ／ｍｌのテトラサイクリン及びＢＡＣのために選択した抗生物質を含むＬＢ寒天プレートに段階希釈で塗抹した。ＢＡＣの伝達の成功を、ＢＡＣ－ベクター挿入ジャンクションのコロニーＰＣＲによって確認した。

書き換えられた区画からの合成ゲノムの組み立て
ゲノムＤＮＡの伝達を、その後のrecBCDを介した組換えと合わせて、部分的合成大腸菌ゲノムを合成ゲノムに組み立てた。ドナー及びレシピエント株の調製において、ｒｐｓＬ－ＨｙｇＲ－ｏｒｉＴ又はＧｍ^Ｒ－ｏｒｉＴカセットをＰＣＲ産物として供給し、ラムダ－レッドを介した組換えによってドナー株ゲノムに組み込んだ（図２２ａ、ｂ）。これとは別に、ｐｈｅＳ^＊－Ｈｙｇ^Ｒカセットを、ドナー株の合成ＤＮＡのおよそ３ｋｂ下流に組み込んだ。これにより、３’ｐｈｅＳ^＊－Ｈｙｇ^Ｒ選択カセットを有する３ｋｂの合成ＤＮＡセグメントのＰＣＲ増幅のための鋳型ゲノムＤＮＡが提供された。このＰＣＲ産物をレシピエント株に提供して、ラムダ－レッドを介した組換えでＷＴＤＮＡを置換した。それによって、合成セグメントの３’末端における選択マーカーを置換し、ドナー合成ＤＮＡに対する３ｋｂの相同領域を生成した。このストラテジーは、それらのそれぞれのドナーに対して３ｋｂの相同を有し、常に３’末端にｐｈｅＳ－Ｈｙｇ^Ｒを有するレシピエント株を体系的に生成するのに役立った。さらに、ドナー株にpJF146を形質転換し、テトラサイクリンに対する感受性を確認した。対照的に、pKW20をドナー株に維持してテトラサイクリン耐性を与えた。

コンジュゲーションのために、ドナー及びレシピエント株を、２％のグルコース、５μｇ／ｍｌのテトラサイクリン及び５０μｇ／ｍｌのカナマイシン又は２０μｇ／ｍｌのクロラムフェニコール（ドナー）及び５０μｇ／ｍｌのアプラマイシン及び２００μｇ／ｍＬのハイグロマイシンＢ（レシピエント）を含むＬＢ培地中で一晩飽和するまで増殖させた。一晩の培養物を同じ選択ＬＢ培地中で１：１０に希釈し、ＯＤ_６００＝０．５まで増殖させた。ドナー及びレシピエント培養物の両方の５０ｍｌを、２％のグルコースを含むＬＢ培地で３回洗浄し、次いで各々を、２％のグルコースを含む４００μｌのＬＢ培地に再懸濁した。３２０μｌのドナーを８０μｌのレシピエントと混合し、ＴＹＥ寒天プレートにスポットし、３７℃でインキュベートした。インキュベーション時間は、伝達した合成ＤＮＡの長さ及びレシピエント株の倍加時間に応じ、１時間～３時間まで変化させた。細胞をプレートから洗い流し、２％のグルコース及び５μｇ／ｍｌのテトラサイクリンを含む１００ｍｌのＬＢ培地に移し、振盪させながら３７℃で２時間インキュベートした。続いて、５０μｇ／ｍｌのカナマイシン又は２０μｇ／ｍｌのクロラムフェニコール（ドナーの伝達した陽性選択マーカーのための選択）を添加し、その後、３７℃でさらに２時間インキュベートした。培養物を遠心沈殿させ、４ｍｌのMilli-Q濾過水に再懸濁し、２％のグルコース、５μｇ／ｍｌのテトラサイクリン、２．５ｍＭの４－クロロ－フェニルアラニン及び５０μｇ／ｍｌのカナマイシン又は２０μｇ／ｍｌのクロラムフェニコールを含むＬＢ寒天の選択プレートに段階希釈で塗抹した。ＤＮＡ伝達及び組換えの成功を、ｐｈｅＳ^＊－Ｈｙｇ^Ｒカセットの喪失、ドナーの選択カセットの組み込み及びＧｍ－ｏｒｉＴカセットの非存在についてコロニーＰＣＲによって決定した。

全ゲノムの調製及び次世代シークエンシングのためのＢＡＣライブラリー
製造業者の使用説明書に従ってDNEasy Blood and Tissue Kit（QIAgen社）を使用して大腸菌ゲノムＤＮＡを精製した。製造業者の使用説明書に従ってQIAprep Spin Miniprep Kit（QIAgen社）を用いて細胞からＢＡＣを抽出した。本発明者らは、このキットが１３０ｋｂを超えるＢＡＣの精製に適していることを見出した。本発明者らは、ＤＮＡ剪断を低減させるように精製全体の間、試料の激しい振盪を回避した。

製造業者の使用説明書に従ってIllumina Nextera XT Kitを使用してPaired-end Illuminaシークエンシングライブラリーを調製した。MiSeq Reagent kit v3を用いて２×３００又は２×７５サイクルを実行して、シークエンシングデータをIllumina MiSeqで得た。

シークエンシングデータ分析
この研究における配列分析のための標準的なワークフローはiSeqパッケージに集約されている。簡潔に述べると、シークエンシングリードを、ソフトクリッピングをアクティブにしたbowtie2を使用して参照の書き換えられたゲノム又は野生型ゲノムにアラインメントした（Langmead, B. & Salzberg, S. L., 2012. Nat Methods 9, 357-359）。アラインメントしたリードを分類し、samtoolsを用いてインデックスを付けた（Li, H. et al., 2009. Bioinformatics 25, 2078-2079）。カスタマイズしたPythonスクリプトをsamtools及びigvtoolsの機能と合わせてサマリーを呼び出すバリアントを生じさせた。このスクリプトを使用して、Integrative Genomics Viewerでの視覚分析と組み合わせて変異、インデル及び構造変動を評価した（Thorvaldsdottir, H., et al., 2013. Brief Bioinform 14, 178-192）。

本発明者らは、標的ゲノム領域にわたって書き換えランドスケープを生成するためにカスタムPythonスクリプトを作成した。簡潔に述べると、スクリプトは、ＢＡＭアラインメントファイル、fastaの参照及び入力としてジェンバンクアノテーションファイルを受け取る。これは書き換えのための標的コドンを同定し、アラインメントファイル内のこれらの標的コドンとアラインメントするリードを集約する。次いでこれは各標的コドンにおける書き換え頻度を出力し、所望のゲノム領域の長さにわたってこれらの頻度をプロットする。

増殖率の測定及び分析
細菌コロニーを、２％のグルコース及び１００μｇ／ｍＬのストレプトマイシンを含むＬＢ中で３７℃にて一晩増殖させた。一晩の培養物を１：５０に希釈し、温度（２５℃、３７℃、又は４２℃）及び培地条件（ＬＢ、２％のグルコースを含むＬＢ、Ｍ９最少培地、２ＸＴＹ）を変化させながら増殖についてモニターした。ＯＤ_６００の測定を、高速で線形振盪させながらBiomek自動ワークステーションプラットフォームにおいて１８時間の間、５分毎に行った。

倍加時間を決定するために、増殖曲線をｌｏｇ２変換した。指数増殖の間の曲線の線形位相において、一次導関数を決定し（ｄ（ｌｏｇ２（ｘ））／ｄｔ）、最大のｌｏｇ２導関数を有する１０の連続する時点を使用して、各複製についての倍加時間を計算した。合計１０個の独立して増殖させた生物学的複製を、書き換えられたＳｙｎ６１株及びｗｔＭＤＳ４２^{ｒｐｓＬＫ４３Ｒ}について測定した。平均倍加時間及び平均からの標準偏差を、ｎ＝１０の全ての複製について計算した。

顕微鏡検査及び細胞サイズの測定
細胞を、１００μｇ／ｍＬのストレプトマイシンを補足したＬＢ中で振盪させながらおよそＯＤ_６００＝０．２まで増殖させた。細菌の薄層をアガロースパッドとカバースリップとの間に挟んだ。標準的な顕微鏡スライドを、１％のアガロースパッド（Sigma-Aldrich社のA4018-5G）を用いて調製した。２μｌ～４μｌの細菌培養物の試料をパッドの上部に滴下した。これを、パッドの約１ｍｍの高さに適合させたガラススペーサーによって両側で支持した＃１のカバースリップで覆った。試料を、６３Ｘ１．２５ＮＡのPlan Neofluar位相対物レンズ（Zeiss UK社、Cambridge、UK）を使用して直立Zeiss Axiophot位相差顕微鏡で画像化した。画像は、ueye cockpitソフトウェア（IDS Imaging Development Systems GmbH社、Obersulm、Germany）の制御下でIDS ueyeモノクロカメラを使用して撮影した。各試料の１０個の視野を撮影した。さらに定量するために、画像をNikon NIS Elementsソフトウェアにロードした（Nikon Instruments社、Surrey、UK）。一般的な分析ツールを使用して細菌をセグメント化するために強度閾値を適用した。１ミクロンのサイズ下限を課してバックグラウンド微粒子及びダストを除去した。続いて、一般的な分析定量ツールを使用して長さの測定をセグメント化した細菌で行った。

質量分析
各株について３つの生物学的複製を実施した。各大腸菌溶解物からのタンパク質を、５０ｍＭの重炭酸アンモニウム中に６Ｍの尿素を含有する緩衝液中で可溶化し、１０ｍＭのＤＴＴで還元し、５５ｍＭのヨードアセトアミドでアルキル化した。アルキル化後、タンパク質を５０ｍＭの重炭酸アンモニウムで１Ｍの尿素に希釈し、１：５０のタンパク質対酵素比にて３７℃で２時間、Lys-C（Promega社、UK）で消化し、続いて１：１００のタンパク質対酵素比にて３７℃で１２時間、トリプシン（Promega社、UK）で消化した。得られたペプチド混合物を、２％ｖ／ｖの最終濃度までギ酸を添加することによって酸性化した。およそ３００ｎＬ／分のフローを送達するためにUltimate U3000 HPLC（ThermoScientific Dionex社、San Jose, USA）を使用してナノスケールキャピラリーＬＣ－ＭＳ／ＭＳによって消化物を二連（１ｕｇの開始タンパク質／注入）で分析した。C18 Acclaim PepMap100 ３μｍ、７５μｍ×２５０ｍｍのnanoViper（ThermoScientific Dionex社、San Jose、USA）での分離前に、C18 Acclaim PepMap100 ５μｍ、１００μｍ×２０ｍｍのnanoViper（ThermoScientific Dionex社、San Jose、USA）によりペプチドを捕捉した。ペプチドをアセトニトリルの１００分の勾配（２％～６０％）で溶出した。分析カラム出口は、ナノフローエレクトロスプレーイオン化源を介して、ハイブリッド二重圧力線形イオントラップ質量分析計（Orbitrap Velos、ThermoScientific社、San Jose、USA）と直接接続させた。完全なＭＳスペクトルについて３０，０００、続いて線形イオントラップで１０のＭＳ／ＭＳスペクトルの分解能を使用して、データ依存分析を実行した。ＭＳスペクトルを３００～２０００のｍ／ｚ範囲にわたって収集した。ＭＳ／ＭＳスキャンは、衝突誘起解離について３５の閾値エネルギーを使用して収集した。標準的な設定を使用してMaxQuant 1.5.5.1で全ての生ファイルを処理し、MaxQuantソフトウェアスイートに組み込まれたAndromeda検索エンジンを用いて大腸菌株Ｋ－１２に対して検索した。酵素検索の特異性は、両方のエンドプロテイナーゼについてトリプシン／Ｐであった。各ペプチドについて最大で２つの誤った切断が許容された。システインのカルバミドメチル化を酸化メチオニンによる固定修飾として設定し、タンパク質Ｎ－アセチル化を可変修飾と見なした。この検索は、前駆イオンについて６ｐｐｍの初期質量許容差及びＣＩＤＭＳ／ＭＳスペクトルについて０．５Ｄａで実施した。偽発見率はペプチド及びタンパク質レベルで１％に固定した。MaxQuantのPerseus (1.5.5.3)モジュールを使用して統計的分析を実行した。統計的分析の前に、既知の夾雑物にマッピングしたペプチド、リバースヒット及び部位によってのみ同定されたタンパク質群を除去した。少なくとも２つのペプチドで同定したタンパク質群のみのうちの１つは特有であり、２つの定量事象をデータ分析のために考慮した。各株において少なくとも１回定量したタンパク質について、Ｓｙｎ６１の複製にわたる各タンパク質の平均存在量をＭＤＳ４２複製の存在量で割り、次いでｌｏｇ２変換した。株間の存在量の差についてのＰ値を、２標本ｔ検定（Perseus）によって計算した。

直交アミノアシル－ｔＲＮＡ合成酵素ｔＲＮＡ_xxxｓを使用したＣＹＰＫ取り込みの毒性（Elliott, T. S. et al., 2014. Nat Biotechnol 32, 465-472; Elliott, T. S., et al., 2016. Cell Chem Biol 23, 805-815;及びKrogager, T. P. et al., 2018. Nat Biotechnol 36, 156-159）
エレクトロコンピテントＭＤＳ４２及びＳｙｎ６１細胞に、ＰｙｌＲＳ及びｔＲＮＡ^Ｐｙｌ _xxxを発現させるためにプラスミドpKW1_MmPylS_PylT_XXXを形質転換し、ここで、XXXは示したアンチコドンである。ｔＲＮＡ^ＰｙｌのアンチコドンがＣＧＡ（pKW1_MmPylS_PylT_CGA）、ＵＧＡ（pKW1_MmPylS_PylT_UGA）又はＧＣＵ（pKW1_MmPylS_PylT_GCU）に変異した、このプラスミドの３つのバリアントを使用した。細胞を、７５μｇ／ｍｌのスペクチノマイシンを含むＬＢ培地中で一晩増殖させた。一晩の培養物を、０ｍＭ、０．５ｍＭ、１ｍＭ、２．５ｍＭ及び５ｍＭでＮε－（（（２－メチルシクロプロパ－２－エン－１－イル）メトキシ）カルボニル）－Ｌ－リジン（ＣＹＰＫ）を補足したＬＢで１：１００に希釈し、増殖を上記のように測定した。「最大増殖％」を、ＣＹＰＫの非存在下での最終ＯＤ_６００で割ったＣＹＰＫの示した濃度の存在下での最終ＯＤ_６００として決定した。最終ＯＤ_６００は６００分後に決定した。

相同組換えによるｐｒｆＡ、ｓｅｒＵ及びｓｅｒＴの削除
選択タンパク質の発現がｓｅｒＵ又はｓｅｒＴによる解読に依存しないように、図１ａに記載した書き換えスキームに従って、ｐｈｅＳ^＊－Ｈｙｇ^Ｒ及びｒｐｓＬ－Ｋａｎ^Ｒカセットの書き換えられた型をデノボ合成した。ｐｒｆＡを削除するために、書き換えられたｒｐｓＬ－Ｋａｎ^Ｒを、ｐｒｆＡ隣接ゲノム配列と約５０ｂｐの相同を含有するオリゴを用いて増幅させた。同じことを、書き換えられた選択カセットｐｈｅＳ^＊－Ｈｙｇ^Ｒを用いてｓｅｒＵ及びｓｅｒＴに対して行った。オリゴヌクレオチド配列を図２３に提供する。プラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAを保有するＳｙｎ６１細胞を、ＬＢの代わりに２ｘＴＹを使用して上記のようにコンピテントにした。細胞に約８μｇのＰＣＲ産物をエレクトロポレーションし、４ｍＬのＳＯＢで１時間回収し、次いで５μｇ／ｍｌのテトラサイクリンを補足した１００ｍＬの２ｘＴＹに移した。４時間後、細胞を遠心沈殿させ、５００μＬのＨ_２Ｏに再懸濁し、５μｇ／ｍｌのテトラサイクリン及び２００μｇ／ｍｌのハイグロマイシンＢ（ｐｈｅＳ^＊－Ｈｙｇ^Ｒ用）又は５０μｇ／ｍｌのカナマイシン（ｒｐｓＬ－Ｋａｎ^Ｒ用）を補足した２ｘＴＹ寒天プレートに段階希釈で播種した。各場合において、所望の遺伝子座に隣接するプライマーを用いたコロニーＰＣＲによって削除を検証した。

上記の明細書に述べられている全ての刊行物は、参照により本明細書に組み込まれる。本発明の開示された方法、細胞、組成物及び使用の様々な修正及び変形は、本発明の範囲及び趣旨から逸脱することなく、当業者に明らかであろう。本発明は特定の好ましい実施形態に関連して開示されてきたが、特許請求される本発明は、そのような特定の実施形態に過度に限定されるべきではないことが理解されるべきである。実際に、当業者に自明である、本発明を実行するための開示された方法の様々な修正は、添付の特許請求の範囲の範囲内であることが意図される。

Claims

１つ又は２つ以上のセンスコドンの５つ又は４つ以下の出現を含む合成原核生物ゲノム。
１つ又は２つ以上のセンスコドンの４つ若しくは３つ以下、３つ若しくは２つ以下、２つ若しくは１つ以下、１つ若しくは０個の出現を含むか、又は出現を含まない、請求項１に記載の合成原核生物ゲノム。
１００個若しくは１０１個以上、２００個若しくは２０１個以上、又は３００個若しくは３０１個以上の遺伝子を含む合成原核生物ゲノムであって、前記遺伝子が１つ又は２つ以上のセンスコドンの５つ又は４つ以下の出現を合計で含み、好ましくは、前記遺伝子が必須遺伝子である、前記合成原核生物ゲノム。
遺伝子が、１つ又は２つ以上のセンスコドンの４つ若しくは３つ以下、３つ若しくは２つ以下、２つ若しくは１つ以下、１つ若しくは０個の出現を合計で含むか、又は出現を含まない、請求項３に記載の合成原核生物ゲノム。
合成細菌ゲノム、好ましくは、合成の大腸菌ゲノム、合成のサルモネラ・エンテリカゲノム、又は合成の志賀赤痢菌ゲノムである、請求項１～４のいずれかに記載の合成原核生物ゲノム。
１つ又は２つ以上のセンスコドンが、１つのセンスコドン又は２つのセンスコドン、好ましくは２つのセンスコドンからなる、請求項１～５のいずれかに記載の合成原核生物ゲノム。
２つ又は３つ以上のセンスコドン、好ましくは２つのセンスコドンの出現を含まず、かつ、１つの終止コドン、好ましくはアンバー終止コドン（ＴＡＧ）の出現を含まない、請求項１～６のいずれかに記載の合成原核生物ゲノム。
１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択され、好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択され、より好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択され、最も好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ及び／又はＴＣＡである、請求項１～７のいずれかに記載の合成原核生物ゲノム。
アンバー終止コドン（ＴＡＧ）の１０個若しくは９個以下、５個若しくは４個以下の出現を含むか、又は出現を含まない、請求項１～８のいずれかに記載の合成原核生物ゲノム。
親原核生物ゲノムに由来する合成原核生物ゲノムであって、前記親原核生物ゲノムと比較して、１０％、５％、２％、１％、０．５％、０．１％未満の、１つ若しくは２つ以上のセンスコドンの出現を含むか、又は１つ若しくは２つ以上のセンスコドンの出現を含まない、前記合成原核生物ゲノム。
細菌ゲノム、好ましくは大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムである、請求項１０に記載の合成原核生物ゲノム。
１つ又は２つ以上のセンスコドンが、１つのセンスコドン又は２つのセンスコドン、好ましくは２つのセンスコドンからなる、請求項１０又は１１に記載の合成原核生物ゲノム。
１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択され、好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択され、より好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択され、最も好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ及び／又はＴＣＡであり、ＴＣＧ及び／又はＴＣＡが同義センスコドンで置換されていてもよい、請求項１０～１２のいずれかに記載の合成原核生物ゲノム。
親原核生物ゲノムにおける１つ又は２つ以上のセンスコドンの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、同義センスコドンで置換され、好ましくは前記親原核生物ゲノムにおけるＴＣＧ及び／又はＴＣＡの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、ＡＧＣ及び／又はＡＧＴで置換され、最も好ましくは前記親原核生物ゲノムにおけるＴＣＧの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、ＡＧＣで置換され、及び／又は前記親原核生物ゲノムにおけるＴＣＡの出現の９０％、９５％、９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、９９．５％若しくはそれ以上、９９．６％若しくはそれ以上、９９．７％若しくはそれ以上、９９．８％若しくはそれ以上、９９．９％若しくはそれ以上、又は１００％が、ＡＧＴで置換されている、請求項１０～１３のいずれかに記載の合成原核生物ゲノム。
アンバー終止コドン（ＴＡＧ）の１０個若しくは９個以下、５個若しくは４個以下の出現を含むか、又は出現を含まず、好ましくは親原核生物ゲノムにおけるＴＡＧの出現の９０％若しくはそれ以上、９５％若しくはそれ以上、９８％若しくはそれ以上、９９％若しくはそれ以上、又は全てが、ＴＡＡで置換されている、請求項１０～１４のいずれかに記載の合成原核生物ゲノム。
親原核生物ゲノムにおける２つ若しくは３つ以上のセンスコドン、好ましくは２つのセンスコドンの出現の９９．９％若しくはそれ以上、又は１００％が、同義センスコドンで置換され、かつ、親原核生物ゲノムにおけるＴＡＧの出現の全てがＴＡＡで置換されている、請求項１０～１５のいずれかに記載の合成原核生物ゲノム。
親原核生物ゲノムにおける１つ又は２つ以上のセンスコドンを含む重複する領域を共有する１つ又は２つ以上の遺伝子対がリファクタリングされ、好ましくは前記１つ又は２つ以上の遺伝子対が、その中の前記センスコドンのうちの１つ又は２つ以上の同義センスコドンでの置換が、前記遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである、請求項１０～１６のいずれかに記載の合成原核生物ゲノム。
逆向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、前記合成挿入物が重複する領域を含み、及び／又は同じ向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、前記合成挿入物が、（ｉ）終止コドン、（ii）前記重複する領域の上流から約２０～２００ｂｐ、及び（iii）前記重複する領域を含む、請求項１７に記載の合成原核生物ゲノム。
生存可能である、請求項１～１８のいずれかに記載の合成原核生物ゲノム。
１００ｋｂ～１０Ｍｂ、又は１Ｍｂ～１０Ｍｂ、又は２Ｍｂ～６Ｍｂのサイズである、請求項１～１９のいずれかに記載の合成原核生物ゲノム。
１つ又は２つ以上のセンスコドンの出現がない、２０個又は２１個以上、３０個又は３１個以上、４０個又は４１個以上、５０個又は５１個以上、１００個又は１０１個以上の必須遺伝子を含む、ポリヌクレオチド。
１つ又は２つ以上のセンスコドンが、１つのセンスコドン又は２つのセンスコドン、好ましくは２つのセンスコドンからなる、請求項２１に記載のポリヌクレオチド。
１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＴＣＴ、ＴＣＣ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＧＣＴ、ＧＣＣ、ＣＴＧ、ＣＴＡ、ＣＴＴ、ＣＴＣ、ＴＴＧ、及びＴＴＡから選択され、好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＧＣＧ、ＧＣＡ、ＣＴＧ、ＣＴＡ、ＴＴＧ、及びＴＴＡから選択され、より好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ、ＴＣＡ、ＡＧＴ、ＡＧＣ、ＴＴＧ、ＴＴＡ、ＧＣＧ及びＧＣＡから選択され、最も好ましくは前記１つ又は２つ以上のセンスコドンが、ＴＣＧ及び／又はＴＣＡである、請求項２１又は２２に記載のポリヌクレオチド。
遺伝子の１つ又は２つ以上のセンスコドンの出現が、同義センスコドンで置換され、好ましくはＴＣＧコドンがＡＧＣで置換され、及び／又はＴＣＡコドンがＡＧＴで置換されている、請求項２１～２３のいずれかに記載のポリヌクレオチド。
必須遺伝子が、ｒｉｂＦ、ｌｓｐＡ、ｉｓｐＨ、ｄａｐＢ、ｆｏｌＡ、ｉｍｐ、ｙａｂＱ、ｆｔｓＬ、ｆｔｓＩ、ｍｕｒＥ、ｍｕｒＦ、ｍｒａＹ、ｍｕｒＤ、ｆｔｓＷ、ｍｕｒＧ、ｍｕｒＣ、ｆｔｓＱ、ｆｔｓＡ、ｆｔｓＺ、ｌｐｘＣ、ｓｅｃＭ、ｓｅｃＡ、ｃａｎ、ｆｏｌＫ、ｈｅｍＬ、ｙａｄＲ、ｄａｐＤ、ｍａｐ、ｒｐｓＢ、ｔｓｆ、ｐｙｒＨ、ｆｒｒ、ｄｘｒ、ｉｓｐＵ、ｃｄｓＡ、ｙａｅＬ、ｙａｅＴ、ｌｐｘＤ、ｆａｂＺ、ｌｐｘＡ、ｌｐｘＢ、ｄｎａＥ、ａｃｃＡ、ｔｉｌＳ、ｐｒｏＳ、ｙａｆＦ、ｈｅｍＢ、ｓｅｃＤ、ｓｅｃＦ、ｒｉｂＤ、ｒｉｂＥ、ｔｈｉＬ、ｄｘｓ、ｉｓｐＡ、ｄｎａＸ、ａｄｋ、ｈｅｍＨ、ｌｐｘＨ、ｃｙｓＳ、ｆｏｌＤ、ｅｎｔＤ、ｍｒｄＢ、ｍｒｄＡ、ｎａｄＤ、ｈｏｌＡ、ｒｌｐＢ、ｌｅｕＳ、ｌｎｔ、ｇｌｎＳ、ｆｌｄＡ、ｃｙｄＡ、ｉｎｆＡ、ｃｙｄＣ、ｆｔｓＫ、ｌｏｌＡ、ｓｅｒＳ、ｒｐｓＡ、ｍｓｂＡ、ｌｐｘＫ、ｋｄｓＢ、ｍｕｋＦ、ｍｕｋＥ、ｍｕｋＢ、ａｓｎＳ、ｆａｂＡ、ｍｖｉＮ、ｒｎｅ、ｆａｂＤ、ｆａｂＧ、ａｃｐＰ、ｔｍｋ、ｈｏｌＢ、ｌｏｌＣ、ｌｏｌＤ、ｌｏｌＥ、ｐｕｒＢ、ｍｉｎＥ、ｍｉｎＤ、ｐｔｈ、ｐｒｓＡ、ｉｓｐＥ、ｌｏｌＢ、ｈｅｍＡ、ｐｒｆＡ、ｐｒｍＣ、ｋｄｓＡ、ｔｏｐＡ、ｒｉｂＡ、ｆａｂＩ、ｔｙｒＳ、ｒｉｂＣ、ｙｄｉＬ、ｐｈｅＴ、ｐｈｅＳ、ｒｐｌＴ、ｉｎｆＣ、ｔｈｒＳ、ｎａｄＥ、ｇａｐＡ、ｙｅａＺ、ａｓｐＳ、ａｒｇＳ、ｐｇｓＡ、ｙｅｆＭ、ｍｅｔＧ、ｆｏｌＥ、ｙｅｊＭ、ｇｙｒＡ、ｎｒｄＡ、ｎｒｄＢ、ｆｏｌＣ、ａｃｃＤ、ｆａｂＢ、ｇｌｔＸ、ｌｉｇＡ、ｚｉｐＡ、ｄａｐＥ、ｄａｐＡ、ｄｅｒ、ｈｉｓＳ、ｉｓｐＧ、ｓｕｈＢ、ｔａｄＡ、ａｃｐＳ、ｅｒａ、ｒｎｃ、ｌｅｐＢ、ｒｐｏＥ、ｐｓｓＡ、ｙｆｉＯ、ｒｐｌＳ、ｔｒｍＤ、ｒｐｓＰ、ｆｆｈ、ｇｒｐＥ、ｃｓｒＡ、ｉｓｐＦ、ｉｓｐＤ、ｆｔｓＢ、ｅｎｏ、ｐｙｒＧ、ｃｈｐＲ、ｌｇｔ、ｆｂａＡ、ｐｇｋ、ｙｑｇＤ、ｍｅｔＫ、ｙｑｇＦ、ｐｌｓＣ、ｙｇｉＴ、ｐａｒＥ、ｒｉｂＢ、ｃｃａ、ｙｇｊＤ、ｔｄｃＦ、ｙｒａＬ、ｙｈｂＶ、ｉｎｆＢ、ｎｕｓＡ、ｆｔｓＨ、ｏｂｇＥ、ｒｐｍＡ、ｒｐｌＵ、ｉｓｐＢ、ｍｕｒＡ、ｙｒｂＢ、ｙｒｂＫ、ｙｈｂＮ、ｒｐｓＩ、ｒｐｌＭ、ｄｅｇＳ、ｍｒｅＤ、ｍｒｅＣ、ｍｒｅＢ、ａｃｃＢ、ａｃｃＣ、ｙｒｄＣ、ｄｅｆ、ｆｍｔ、ｒｐｌＱ、ｒｐｏＡ、ｒｐｓＤ、ｒｐｓＫ、ｒｐｓＭ、ｓｅｃＹ、ｒｐｌＯ、ｒｐｍＤ、ｒｐｓＥ、ｒｐｌＲ、ｒｐｌＦ、ｒｐｓＨ、ｒｐｓＮ、ｒｐｌＥ、ｒｐｌＸ、ｒｐｌＮ、ｒｐｓＱ、ｒｐｍＣ、ｒｐｌＰ、ｒｐｓＣ、ｒｐｌＶ、ｒｐｓＳ、ｒｐｌＢ、ｒｐｌＷ、ｒｐｌＤ、ｒｐｌＣ、ｒｐｓＪ、ｆｕｓＡ、ｒｐｓＧ、ｒｐｓＬ、ｔｒｐＳ、ｙｒｆＦ、ａｓｄ、ｒｐｏＨ、ｆｔｓＸ、ｆｔｓＥ、ｆｔｓＹ、ｙｈｈＱ、ｂｃｓＢ、ｇｌｙＱ、ｇｐｓＡ、ｒｆａＫ、ｋｄｔＡ、ｃｏａＤ、ｒｐｍＢ、ｄｆｐ、ｄｕｔ、ｇｍｋ、ｓｐｏＴ、ｇｙｒＢ、ｄｎａＮ、ｄｎａＡ、ｒｐｍＨ、ｒｎｐＡ、ｙｉｄＣ、ｔｎａＢ、ｇｌｍＳ、ｇｌｍＵ、ｗｚｙＥ、ｈｅｍＤ、ｈｅｍＣ、ｙｉｇＰ、ｕｂｉＢ、ｕｂｉＤ、ｈｅｍＧ、ｙｉｈＡ、ｆｔｓＮ、ｍｕｒＩ、ｍｕｒＢ、ｂｉｒＡ、ｓｅｃＥ、ｎｕｓＧ、ｒｐｌＪ、ｒｐｌＬ、ｒｐｏＢ、ｒｐｏＣ、ｕｂｉＡ、ｐｌｓＢ、ｌｅｘＡ、ｄｎａＢ、ｓｓｂ、ａｌｓＫ、ｇｒｏＳ、ｐｓｄ、ｏｒｎ、ｙｊｅＥ、ｒｐｓＲ、ｃｈｐＳ、ｐｐａ、ｖａｌＳ、ｙｊｇＰ、ｙｊｇＱ、及びｄｎａＣからなるリストのうちの１つ又は２つ以上から選択される必須遺伝子を含む、請求項２１～２４のいずれかに記載のポリヌクレオチド。
請求項１～２０のいずれかに記載の合成原核生物ゲノム又は請求項２１～２５のいずれかに記載のポリヌクレオチドを含む原核生物宿主細胞。
生存可能である、請求項２６に記載の原核生物宿主細胞。
細菌の細胞、好ましくは大腸菌の細胞、サルモネラ・エンテリカの細胞、又は志賀赤痢菌の細胞である、請求項２６又は２７に記載の原核生物宿主細胞。
１つ又は２つ以上の非タンパク質性アミノ酸、好ましくは２つ又は３つ以上の非タンパク質性アミノ酸、最も好ましくは３つ又は４つ以上の非タンパク質性アミノ酸を含むポリペプチドの産生に使用するための、請求項２６～２８のいずれかに記載の原核生物宿主細胞。
１つ又は２つ以上の非タンパク質性アミノ酸、好ましくは２つ又は３つ以上の非タンパク質性アミノ酸、最も好ましくは３つ又は４つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための、請求項２６～２９のいずれかに記載の原核生物宿主細胞の使用。
合成ゲノムを産生するための方法であって、
（ａ）親ゲノムを準備するステップと、
（ｂ）前記親ゲノムに対して組換えを介した遺伝子改変の１回又は２回以上のラウンドを実行して、２つ又は３つ以上の異なる部分的合成ゲノムを産生するステップと、
（ｃ）前記２つ又は３つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの１回又は２回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含み、前記部分的合成ゲノムの各々が、１つ又は２つ以上のセンスコドンの各々の５０個若しくは４９個以下、２０個若しくは１９個以下、１０個若しくは９個以下、５個若しくは４個以下、又は０個の出現を有する合成領域を含むか、又は前記部分的合成ゲノムの各々が、前記親ゲノムにおける対応する領域と比較して、１０％、５％、２％、１％、０．５％、０．１％未満の１つ又は２つ以上のセンスコドンの各々の前記出現を有する合成領域を含む、前記方法。
合成領域が、親ゲノムの９０％若しくはそれ以上、９５％若しくはそれ以上、９９％若しくはそれ以上又は１００％を合計でカバーする、請求項３１に記載の合成ゲノムを産生するための方法。
合成領域が、１０～１０００ｋｂ、５０～１０００ｋｂ、１００～１０００ｋｂ、又は１００～５００ｋｂのサイズである、請求項３１又は３２に記載の合成ゲノムを産生するための方法。
部分的合成ゲノムの生存能が、組換えを介した遺伝子改変の各ラウンド後及び／又は誘導コンジュゲーションの各ラウンド後に試験される、請求項３１～３３のいずれかに記載の合成ゲノムを産生するための方法。
２つ又は３つ以上の異なる部分的合成ゲノムが、少なくとも１つの部分的合成ドナーゲノム及び少なくとも１つの部分的合成レシピエントゲノムを含む、請求項３１～３４のいずれかに記載の合成ゲノムを産生するための方法。
少なくとも１つの部分的合成ドナーゲノムが、合成領域及び伝達起点のすぐ下流の２つの相同領域が隣接した第１の選択可能マーカーを含み、少なくとも１つの部分的合成レシピエントゲノムが、２つの対応する相同領域が隣接した第２の選択可能マーカーを含み、かつ、前記第１の選択可能マーカーが陽性選択可能マーカーを含んでいてもよく、及び／又は前記第２の選択可能マーカーが陰性選択可能マーカーを含んでいてもよい、請求項３５に記載の合成ゲノムを産生するための方法。
少なくとも１つの部分的合成レシピエントゲノムに存在する合成領域が、相同領域が隣接した領域の外側である、請求項３６に記載の合成ゲノムを産生するための方法。
選択可能マーカーについての選択の１回又は２回以上のラウンドをさらに含む、請求項３６又は３７に記載の合成ゲノムを産生するための方法。
組換えを介した遺伝子改変の１回又は２回以上のラウンドが、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除（ＲＥＸＥＲ）の１回又は２回以上のラウンドを含む、請求項３１～３８のいずれかに記載の合成ゲノムを産生するための方法。
合成ゲノムが、請求項１～２０のいずれかに記載の合成原核生物ゲノムである、請求項３１～３９のいずれかに記載の合成ゲノムを産生するための方法。
請求項３１～４０のいずれかに記載の方法によって産生される合成原核生物ゲノム。