JP2022533040A - 合成ゲノム - Google Patents

合成ゲノム Download PDF

Info

Publication number
JP2022533040A
JP2022533040A JP2021566246A JP2021566246A JP2022533040A JP 2022533040 A JP2022533040 A JP 2022533040A JP 2021566246 A JP2021566246 A JP 2021566246A JP 2021566246 A JP2021566246 A JP 2021566246A JP 2022533040 A JP2022533040 A JP 2022533040A
Authority
JP
Japan
Prior art keywords
genome
synthetic
codons
sense
prokaryotic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021566246A
Other languages
English (en)
Other versions
JPWO2020229592A5 (ja
Inventor
ジュリウス フレデンス
カイハン ワン
ラ トレ ダニエル デ
ルイーズ エフ. エイチ. ファンケ
ウェスリー イー. ロバートソン
ジェイソン ダブリュー. チン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UK Research and Innovation
Original Assignee
UK Research and Innovation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UK Research and Innovation filed Critical UK Research and Innovation
Publication of JP2022533040A publication Critical patent/JP2022533040A/ja
Publication of JPWO2020229592A5 publication Critical patent/JPWO2020229592A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本発明は、1つ若しくは2つ以上のセンスコドンの5つ若しくは4つ以下の出現を含む合成原核生物ゲノム;及び/又は合成原核生物ゲノムが、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の、1つ若しくは2つ以上のセンスコドンの出現を含む、親ゲノムに由来する合成原核生物ゲノム;及び/又は1つ若しくは2つ以上のセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含む合成原核生物ゲノム;を提供する。

Description

本発明は、合成ゲノム及びそれを産生する方法に関する。
ゲノムの設計及び合成は、生物学を理解し、改変するための強力なアプローチを提供する。ゲノム合成は代謝工学を加速させる可能性がある。特に、ゲノム合成は、同義コドンの機能を解明し、遺伝的にコードされた非天然ポリマー合成を容易にする可能性がある(Wang, K., et al., 2016. Nature, 539(7627), 59-64)。
標準的な遺伝コードは、61個のセンスコドンを使用して20種のカノニカルアミノ酸をコードし、20種のアミノ酸のうちの18種は、1つより多い同義コドンによってコードされる。自然界は、遺伝子内の各位置において各アミノ酸をコードするために最大で6つまでの同義語から1つのセンスコドンを選択する。同義コドンの選択は、mRNAフォールディング、転写及び翻訳調節配列、翻訳速度、共翻訳フォールディング、タンパク質レベルに影響を及ぼす可能性があり、新たな、未だに理解されていない役割を有する(Wang, K., et al., 2016. Nature, 539(7627), 59-64;及びCambray, G., et al., 2018. Nature biotechnology, 36(10), 1005-1015)。
標的コドンの同義コドンによるゲノムワイド置換(同義コドン圧縮)は、遺伝的にコードされた非カノニカルバイオポリマーのインビボでの生合成を容易にするためにセンスコドンを非カノニカルアミノ酸(又は他のモノマー)に再割当するための基礎を提供することができる(Chin, J.W., 2017. Nature, 550(7674), 53-60)。
部位特異的変異誘発アプローチが、大腸菌(E.coli)ゲノムにおける最大で321個までのアンバー終止コドンを置換するために使用されている(Mukai, T., et al., 2015. Scientific reports, 5, p.9699)。しかしながら、センスコドンは一般に終止コドンより数桁多く、変異誘発よりむしろ、ゲノム合成が、多くの場合においてセンスコドン除去に取り組むのに好ましい手段であり得る。
ゲノム合成は、合成ゲノムを有するマイコプラズマの作製を可能にし(Gibson, D.G., et al., 2010. Science, 329(5987), 52-56)、16個の染色体のうちの1つ又は2つのDNAが合成DNAに置換されているS.セレビシエ(S. cerevisiae)の9つの株の作製を可能にした(Zhang, W., et al., 2017. Science, 355(6329), eaaf3981;及びRichardson, S.M., et al., 2017. Science, 355(6329), 1040-1044)。これらの実験は個々の株において最大で1MbまでのDNA(0.99Mb、酵母;1.08Mb、マイコプラズマ)を置換している。プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER,replicon excision for enhanced genome engineering through programmed recombination)は、単一のステップにおいて100kbを超える大腸菌ゲノムを合成DNAで置換することについて報告している。さらに、REXERは、220kbの大腸菌ゲノムを230kbの合成DNAで置換するためにゲノム段階的交換合成(GENESIS,genome stepwise interchange synthesis)によって反復され得ることが示されている(Wang, K., et al., 2016. Nature, 539(7627), 59-64;国際公開第2018/020248号パンフレット)。
ゲノム合成は、個々の遺伝子における同義コドン(Napolitano, M.G., et al., 2016. PNAS, 113(38), E5588-E5597)、ゲノム領域及び必須オペロン(Wang, K., et al., 2016. Nature, 539(7627), 59-64;及びLau, Y.H., et al. 2017. Nucleic acids research, 45(11), 6971-6980)を変更するために使用されている。例えば、Wangらは、必須遺伝子及び標的コドンの両方に豊富にある大腸菌ゲノムの20kb領域を置換するために、定義された「書き換えスキーム」を使用した。
しかしながら、これらの研究は、単一の株のゲノムにおける標的化されたセンスコドンのほんの一部(最大で4.7%)しか変異していない。その結果として、これらの方法をゲノムワイド同義コドン圧縮に適用することにより、生存可能なゲノムを産生することができるかどうかは不明である。例えば、Wangらで試験した定義された書き換えスキームが、少数のセンスコドンが20種のカノニカルアミノ酸をコードするために使用される生物を作製するためにゲノムワイドに適用され得るかどうかは不明である。
国際公開第2018/020248号パンフレット
Wang, K., et al., 2016. Nature, 539(7627), 59-64 Cambray, G., et al., 2018. Nature biotechnology, 36(10), 1005-1015 Chin, J.W., 2017. Nature, 550(7674), 53-60 Mukai, T., et al., 2015. Scientific reports, 5, p.9699 Gibson, D.G., et al., 2010. Science, 329(5987), 52-56 Zhang, W., et al., 2017. Science, 355(6329), eaaf3981 Richardson, S.M., et al., 2017. Science, 355(6329), 1040-1044 Napolitano, M.G., et al., 2016. PNAS, 113(38), E5588-E5597 Lau, Y.H., et al. 2017. Nucleic acids research, 45(11), 6971-6980
それ故、1つ又は2つ以上のセンスコドンが除去されている合成ゲノムが求められている。また、合成ゲノムを産生するための改善された方法も求められている。
本発明者らは、驚くべきことに、1つ又は2つ以上のセンスコドンが除去されている、生存可能な合成原核生物ゲノムが産生され得ることを見出した。特に、本発明者らは、細胞タンパク質をコードするために使用されるコドンの数が、2つのセンスコドン及び1つの終止コドンのゲノムワイド書き換えによって64個から61個まで減少している、生存可能な合成ゲノムを産生した。本発明者らはまた、前記合成ゲノムを含む大腸菌宿主細胞を産生した。
本発明者らはまた、驚くべきことに、定義された書き換え及びリファクタリングスキームが、標的コドンの99.9%超についてゲノムワイド同義コドン圧縮を可能にすることができることを見出した。本発明者らは、許容されない位置における代替の書き換え及びリファクタリングが、ゲノムワイド同義コドン圧縮を可能にすることを見出した。
本発明者らはまた、驚くべきことに、組換えを介した遺伝子改変(例えば、REXER及び/又はGENESIS)が、合成ゲノムを効果的に産生するために誘導コンジュゲーション(directed conjugation)と組み合わされ得ることを見出した。特に、本発明者らは、例えば、DNAの少なくとも約4Mbが前記方法により効果的に置換され得ること、及び前記方法により、合成DNAの設計における失敗(許容されない位置)をコドンレベルの分解能で同定することができることを見出した。
したがって、一態様では、本発明は、1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現(occurrence)を含む合成原核生物ゲノムを提供する。一部の実施形態では、合成原核生物ゲノムは、1つ又は2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を含むか、又は出現を含まない。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。一部の実施形態では、合成原核生物ゲノムは、2つ又は3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現を含まず、1つの終止コドン、好ましくはアンバー終止コドン(TAG)の出現を含まない。
合成原核生物ゲノムは、合成細菌ゲノム、好ましくは合成の大腸菌(Escherichia coli)ゲノム、サルモネラ・エンテリカ(Salmonella enterica)ゲノム、又は志賀赤痢菌(Shigella dysenteriae)ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである。合成原核生物ゲノムは生存可能であり得る。一部の実施形態では、合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含み、遺伝子は1つ又は2つ以上のセンスコドンの出現がなくてもよく、好ましくは遺伝子は必須遺伝子である。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンは、TCG及び/又はTCAである。
一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない。
さらなる態様では、本発明は、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含む合成原核生物ゲノムを提供し、遺伝子は、1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現を合計で含み、好ましくは遺伝子は必須遺伝子である。一部の実施形態では、遺伝子は、1つ若しくは2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を合計で含むか、又は出現を含まない。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。
合成原核生物ゲノムは、合成細菌ゲノム、好ましくは合成の大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである。合成原核生物ゲノムは生存可能であり得る。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンは、TCG及び/又はTCAである。
一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない。
さらなる態様では、本発明は、親原核生物ゲノムに由来する合成原核生物ゲノムを提供し、その合成原核生物ゲノムは、親原核生物ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ若しくは2つ以上のセンスコドンの出現を含むか、又はその合成原核生物ゲノムは、1つ若しくは2つ以上のセンスコドンの出現を含まない。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。
合成原核生物ゲノムは、細菌ゲノム、好ましくは大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである。合成原核生物ゲノムは生存可能であり得る。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンはTCG及び/又はTCAであり、TCG及び/又はTCAは同義センスコドンで置換されていてもよい。
好ましくは、親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換されている。一部の実施形態では、親原核生物ゲノムにおけるTCG及び/又はTCAの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGC及び/又はAGTで置換され、最も好ましくは親原核生物ゲノムにおけるTCGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGCで置換され、及び/又は親原核生物ゲノムにおけるTCAの出現の90%、95%、90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGTで置換されている。
一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まず、好ましくは親原核生物ゲノムにおけるTAGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、又は全てが、TAAで置換されている。
一部の実施形態では、親原核生物ゲノムにおける2つ又は3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現の99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換され、親原核生物ゲノムにおけるTAGの出現の全てが、TAAで置換されている。
親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する1つ又は2つ以上の遺伝子対がリファクタリングされてもよく、好ましくは1つ又は2つ以上の遺伝子対が、センスコドンのうちの1つ又は2つ以上の同義センスコドンでの置換が、遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである。
一部の実施形態では、逆向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、合成挿入物が重複する領域を含み、及び/又は同じ向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、合成挿入物が、(i)終止コドン、(ii)重複する領域の上流から約20~200bp、及び(iii)重複する領域を含む。
さらなる態様では、本発明は、1つ又は2つ以上のセンスコドンの出現がない、20個又は21個以上、30個又は31個以上、40個又は41個以上、50個又は51個以上、100個又は101個以上の必須遺伝子を含むポリヌクレオチドを提供する。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンはTCG及び/又はTCAである。
遺伝子の1つ又は2つ以上のセンスコドンの出現は、同義センスコドンで置換されていてもよく、好ましくはTCGコドンはAGCで置換され、及び/又はTCAコドンはAGTで置換されている。
必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択される必須遺伝子を含んでもよい。
さらなる態様では、本発明は、本発明による合成原核生物ゲノム又は本発明によるポリヌクレオチドを含む原核生物宿主細胞を提供する。
原核生物宿主細胞は生存可能であり得る。原核生物宿主細胞は、細菌の細胞、好ましくは大腸菌の細胞、サルモネラ・エンテリカの細胞、又は志賀赤痢菌の細胞であってもよい。好ましくは、宿主細胞は、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドの産生に使用するのに適している。
さらなる態様では、本発明は、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための本発明による原核生物宿主細胞の使用を提供する。
さらなる態様では、本発明は、合成ゲノムを産生するための方法であって、
(a)親ゲノムを準備するステップと、
(b)親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
(c)2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含み、部分的合成ゲノムの各々が、1つ又は2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する合成領域を含むか、又は部分的合成ゲノムの各々が、親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの各々の出現を有する合成領域を含む、方法を提供する。
合成領域は、親ゲノムの90%若しくはそれ以上、95%若しくはそれ以上、99%若しくはそれ以上又は100%を合計で占めてもよい。一部の実施形態では、合成領域は、10~1000kb、50~1000kb、100~1000kb、又は100~500kbのサイズである。
方法は、組換えを介した遺伝子改変の各ラウンド後及び/又は誘導コンジュゲーションの各ラウンド後に部分的合成ゲノムの生存能を試験するステップをさらに含んでもよい。
2つ又は3つ以上の異なる部分的合成ゲノムは、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを含んでもよい。一部の実施形態では、少なくとも1つの部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含み、少なくとも1つの部分的合成レシピエントゲノムは、2つの対応する相同領域が隣接した第2の選択可能マーカーを含み、第1の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び/又は第2の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。一部の実施形態では、少なくとも1つの部分的合成レシピエントゲノムに存在する合成領域は、相同領域が隣接した領域の外側である。一部の実施形態では、方法は、選択可能マーカーについての選択の1回又は2回以上のラウンドをさらに含む。
組換えを介した遺伝子改変の1回又は2回以上のラウンドは、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER)の1回又は2回以上のラウンドを含んでもよい。
合成ゲノムは、本発明による合成原核生物ゲノムであってもよい。
さらなる態様では、本発明は、本発明の方法によって産生される合成原核生物ゲノムを提供する。
同義コドン圧縮のための定義された書き換えスキームを実装する合成ゲノムの設計を示す図である。 a、同義コドン圧縮のための定義された書き換えスキームである。WT大腸菌のゲノムに使用される同義セリンコドン及び3つの終止コドンを示す。同義コドン圧縮のための定義された書き換えスキームを体系的に実装することにより、標的コドンを定義された同義語に書き換え、アンバー終止コドンTAGをオーカー終止コドンTAAで置換する。これにより、減少した数のセリン及び終結コドンを使用する書き換えられたゲノムを有する生物が作製される。 b、3’、3’重複のリファクタリングにより、それらの独立した書き換えが可能になる。2つのオープンリーディングフレーム(ORF-1及びORF-2)の間の重複が複製され、合成挿入物を作製する。これにより、ORFの独立した書き換えが可能になる。 c、5’、3’重複のリファクタリング。重複に20bpの上流を加えたものが合成挿入物を生成するために複製される。重複が上流のORFの末端において1bpより長い場合、インフレームTAAが合成挿入物の最初に導入され、このインフレーム終止コドンは元のRBSからの翻訳の終結を確実にする。それ故、下流のORFの全ての全長の翻訳が合成挿入物における再構成されたRBSから開始される。 d、TCG、TCA及びTAGコドンの全てが除去された合成ゲノム設計のマップ。外側の環:TCG→AGC、TCA→AGT及びTAG→TAA書き換えの全ての18,218個の位置。灰色の環:重複における設計されたサイレント変異の12個の位置、3’、3’重複の21のリファクタリング(b)及び5’5’重複の58のリファクタリング(c)。2つの内側の環はゲノム区画を例示する。外側の環:合成ゲノム設計の8個のゲノム区画(A~H)。内側の環:各々およそ100kbの37個の断片。断片37は、最後のアセンブリを反映するために37a及び37bとして示す。oriC:複製起点。 合成ゲノムの逆合成を示す図である。 a、ゲノムを8つの区画に切断する。合成ゲノムを区画A~Hに切断し、各区画はおよそ0.5Mbに対応する(ステップ1)。複製起点oriCの位置(オレンジ色の四角)を示す。区画を、誘導コンジュゲーションによって完全に書き換えられたゲノム(フォワードセンスにおいて、逆合成矢印の逆方向)に組み立てた(図10及び図11)。 b、ゲノム区画を100kbの断片に切断する。区画を各々約100kbの4~5つの断片にさらに切断する。区画Aを表示し、他の区画を同様に処理した。ほぼ全ての区画を、GENESIS(図4)によって、連続したREXERステップ(図3)を介して完全に構築した。各ステップは、約100kbの野生型ゲノム配列を100kbの合成断片で置換した(ステップ2及び3)。陰性選択マーカー-1(rpsL)、及び陽性選択マーカー+1(Kan)、及び陰性選択マーカー-2(SacB)、及び陽性選択マーカー+2(Cm)から構成される二重選択マーカーを、GENESISを実現するためにREXERの交互のラウンドにおいて使用した。 c、各100kbの合成断片を10kbの合成ストレッチに切断する。各100kbの合成断片を、約10kb長の9~14個の短い合成ストレッチにさらに切断する(ステップ4)。100kbの合成断片を有するBACを酵母における相同組換えによって組み立てた。各BACは、インビボで合成DNAの切除を可能にするCas9切断部位(黒色の三角形)、組換えを標的とするための相同領域(HR1及びHR2)、REXER及びGENESISの間に選択するための適切な二重選択カセット(+2、-2で示した)、REXER後の骨格の喪失を可能にするための陰性選択マーカー(-1で示した)、BAC YAC起点並びに大腸菌及びS.セレビシエにおける維持のためのURA3マーカーを含有する。 REXERによってゲノム内の対応する領域を置換するための合成DNAの100kb断片の使用を示す図である。 REXER(プログラムされた組換えによるゲノム改変強化のためのレプリコン切除)は、ゲノムDNAをエピソーム(BAC)から提供される合成DNAで置換するためにCRISPR/Cas9及びラムダ-レッドを介した組換えを利用する。これにより、ゲノムの大きな領域(100kbを超える)を合成DNAによって置換することができる(Wang, K., et al., 2016. Nature, 539(7627), 59-64;国際公開第2018/020248号パンフレット)。黒色の三角形は、相同領域(HR,homology region)が隣接したBACから合成DNA(ピンク色)カセットを遊離させるためにCas9によって切断される、CRISPRプロトスペーサーの位置を示す。相同領域1及び2(HR1、HR2)は、大腸菌ゲノムへの組換えの位置をプログラムする。選択カセット-1/+1は合成DNAの組み込みを確実にし、一方、ゲノム上の選択カセット-2/+2は対応するwt DNAの除去を確実にする。図に示した例では、+1はKanであり、-1はrpsLであり、+2はCmであり、-2はsacBである。 GENESISが、書き換えられた区画を生成するために合成DNAによるゲノムDNAの段階的な置換を可能にすることを示す図である。 陽性及び陰性選択カセットを交互に選択する、REXERの反復サイクル(図3を参照のこと)により、ゲノム段階的交換合成(GENESIS)が可能になる(Wang, K., et al., 2016. Nature, 539(7627), 59-64)。これにより、対応するゲノム配列を時計回りに置換する断片の反復付加によって合成ゲノムの大きな区画を組み立てることが可能になる。DNAの100kbの合成断片の最初のREXERにより、-2/+2選択カセットを保有する合成DNAの第2の断片の下流の組み込みのためのランディング部位として作用するゲノム上に-1/+1選択カセットを残す。示した例では、+1はKanであり、-1はrpsLであり、+2はCmであり、-2はsacBであるが、ゲノム及びBAC上のマーカーの異なる順列で同じ論理を使用することができる。 断片1におけるftsI-murE及びmapの書き換えを示す図である。 a、断片1のランドスケープの書き換え。本発明者らは、REXER後、6つのクローンを配列決定した。各点は、ゲノム内の示した位置(x軸)における標的コドンについての配列決定したクローン内の書き換えの頻度(y軸)を表す。黒色の点は、本発明者らが書き換えを観察しなかった位置を示す。ftsI-murEの4つのコドン及びリファクタリング並びにmapにおける1つのコドンは拒絶された。 b、14bpのftsI-murE重複のリファクタリング。コドン及び重複は、配列決定されたクローンにおけるそれらのREXER後の置換頻度によってスケーリングされた灰色である。本発明者らの最初のリファクタリングスキーム(1)を使用して、重複に上流配列の20bpを加えたものを複製し、本発明者らは合成DNAによる重複の置換を(REXER後に配列決定した6個のクローンにおいて)観察しなかった。重複に上流配列の182bpを加えたものを複製するリファクタリングスキーム2により、配列決定した16個のREXER後のクローンのうちの12個においてこの領域の完全な書き換えを得た。 c、mapにおけるSer4での代替コドンの試験。構成的EM7プロモーター上の二重選択マーカーであるpheS-Hygをmapの上流に導入し、続いてRBSを導入した。本発明者らは、ラムダレッド組換え及びpheSの喪失についての陰性選択によって4位に(示したように)代替コドンを導入する直鎖状二本鎖DNAを使用してカセットを置換した。AGC及びAGTを有するDNAは組み込まなかった(0/16クローン);本発明者らはAGCについて1つのクローンを回復させたが、配列決定により、それがミュータントAAC(Asn)コドンを含有することが明らかになった。TCT(6/8)、TCC(6/16)、ACA(6/8)、及びTTA(4/8)が許容された。 d、ftsI-murE重複についてのリファクタリングスキーム2及びmapの4位にTCTを含有するBACでのREXER後の(a)に示したゲノム領域にわたるランドスケープの書き換え。2/7のREXER後のクローンを完全にリファクタリングし、書き換え、各標的コドンを少なくとも5/7のクローンにおいて置換した。(a)からのデータを比較のために示す。 断片9におけるrne及びyceQの書き換えを示す図である。 a、断片9の書き換えランドスケープ。本発明者らの設計した断片9の合成配列をREXERによってゲノムへ組み込み、19個のクローンをNGSによって完全に配列決定した。書き換えランドスケープグラフは、各標的コドンを19個のクローンにわたって書き換えた頻度を示す。ほとんどのコドン置換は受け入れられたが、26kb領域の書き換えは一貫して拒絶された;配列決定したクローンの全てにおける書き換え頻度がゼロであるコドン位置は黒色の点で示す。問題のある配列を正確に示すために、ゲノムの10kbストレッチ(G2~7)を合成断片9のエピソームコピーの存在下で削除した。合成配列は、G4(濃い灰色の箱)を除いて全てのストレッチの削除を支持するのに十分であり、内在する問題がこのストレッチ内にあることを示唆している。0/19のクローンを完全に書き換えた。 b、ストレッチG4の書き換えランドスケープ。10kbのストレッチ「G4」にわたるREXER及び10個のクローンの配列決定後、示した書き換えランドスケープを生成した。これにより、予測タンパク質をコードする「遺伝子」である、yceQにおける最小の明確な書き換えが明らかになったが、この遺伝子に関して、転写、タンパク質合成又は相同の証拠は存在していない(Pundir, S., et al., 2017. Methods Mol Biol, 1558, 41-55)。yceQにおける全ての標的コドンを個々のクローンにおいて少なくとも1回書き換えたが、決して同時には書き換えなかった;それ故、最低限の書き換えランドスケープはゼロにはならず、0/10のクローンを完全に書き換えた。これは、標的化された位置の間のエピスタシスと一致する。書き換えランドスケープの下のマップにおいて、必須として注釈を付けた配列及び標的コドンを示す。配列位置(x軸)はパネルaを基準にしている。 c、断片9におけるrne周囲の領域の設計の変更。上部、yceQ書き換え及びrne(RNAse Eをコードする)調節配列の元の設計。標的コドンを示す。Prne1、2、3は、必須遺伝子rneについてのプロモーターである;これらは仮定的遺伝子yceQ内及び周囲に見出される。主要プロモーターP1rneの-10配列は本発明者らの初期設計によって変異されている。転写産物分解を媒介するためにRNAse Eに結合するヘアピン1(hp1)及びヘアピン2(hp2)を含有する配列を示す;この配列は残りの標的コドンを包含し、本発明者らの初期設計によっても変異されている。下部、yceQにおける第2のコドンを終止コドンで置換し、残りの標的コドンはそれらの元の配列を保持した。配列位置(x軸)はパネルaを基準にしている。 d、cからのこの修飾された断片9をゲノムに組み込み、配列決定した4/5のクローンは完全に書き換えられた。グラフの軸はパネルaのものと同じである。配列決定した5個のクローンに由来する、修飾された断片9についての書き換えランドスケープを紫色で示す。パネルaからのデータは比較のために複製している。 断片37aにおけるyaaYの書き換えを示す図である。 a、断片37aの書き換えランドスケープ。本発明者らの設計した断片37aの合成配列をREXERによってゲノムに組み込み、6個のクローンをNGSによって完全に配列決定した。ほとんどのコドン置換は受け入れられたが、6.5kb領域の書き換えは一貫して拒絶された。配列決定した6個のクローンにおいて決して書き換えられなかった標的コドン位置を黒色の点で示す。 b、問題のある標的コドンの同定。同定した6.5kbの問題のある領域内で、本発明者らは最初に、非必須遺伝子(薄い灰色の矢印)より必須遺伝子(濃い灰色の矢印)におけるコドンに焦点を当てた。24個のクローンのサンガー配列決定(黒色のバー)により、2個のクローンが、必須遺伝子の小区画内で6個の全ての標的コドンにおいて書き換えられたことが示された。これらの2個のクローンの必須遺伝子における残りの標的コドンのサンガー配列決定により、1個のクローンが17個の全ての標的コドンにおいて書き換えられたことが明らかになった。このクローンをNGSによって完全に配列決定し、書き換えランドスケープを生成するために使用し、各標的コドンは、書き換えられたか、又は書き換えられなかったかのいずれかである。これにより、本発明者らは、(a)における書き換えランドスケープと組み合わせて、ribFの1.8kb上流の問題のある領域を同定することができた。ここで、本発明者らは、必須ribF遺伝子に最も近いコドンとして遺伝子rpsT及びyaaYにおける4個の標的コドンに焦点を当てた。この配列にわたる33個のクローンのサンガー配列決定により、仮定的遺伝子yaaYにおけるSer70についてのコドンである、決して書き換えられなかった1個のコドンのみが明らかになった(配列決定の結果をrspT及びyaaYの遺伝子マップ上にスケーリングした灰色として示す)。したがって、本発明者らは、yaaYにおける代替のコドン置換を調査した。 c、仮定的遺伝子yaaYにおける代替のコドン置換。この遺伝子におけるSer70位において、AGTでのTCAの置換は成功しなかった。代替のコドン置換スキームを調査するために、構成的EM7プロモーター上の二重選択マーカーであるpheS-Hyg、その後のRBSを、Ser70についてのコドンの12bp上流であるyaaYに導入した。次いで、ラムダレッド組換えによって、70位に代替のコドンを導入する直鎖状二本鎖DNAを使用してカセットを置換したクローンを選択するために陰性選択マーカーを使用した。AGTを有する直線状二本鎖DNAは組み込まなかったが(0/16のクローン)、TCC(2/16)、TCG(2/16)、TCT(6/16)及びAGC(9/16)を有するdsDNAの組み込みは生存可能であることが証明された。 d、仮定的遺伝子yaaYにおけるSer70位にAGCを担持する、正確な型の断片37aを含有するBACでのREXERの書き換えランドスケープ。REXERによって組み込んだ場合、本発明者らは、1/7の完全に書き換えられたクローンを同定した。yaaYにおけるSer70位のAGCは4/7のクローンに導入された。 必須タンパク質RNAse Eをコードするrneにおける調節エレメントでの仮定的遺伝子yceQ重複の置き換えを示す図である。 a、本発明者らの元の設計では、仮定的遺伝子yceQにおけるTCAからAGTへのプログラムされた置き換えにより、P1rneの-10プロモーターエレメントの変異がもたらされる(箱で囲んでいる)。rne転写についてのこのプロモーターの転写開始部位(tss)は矢印で示す;これはrne転写についての主要プロモーターである。 b、標的コドンの置き換えは、rne転写産物の長い5’UTRにおける重要な調節ヘアピンhp2及びhp3と重複し、それらを破壊する可能性があり得る。hp2及びhp3は、RNAse Eがその独自の転写産物の分解を促進するためにmRNAに動員される調節フィードバックループを媒介する。rne 5’UTRの野生型二次構造の概略図が示される(Diwa, A., et al., 2000 Genes Dev 14, 1249-1260)。同義置換についての標的コドンは強調されている。 区画A~B及びHの完成を示す図である。 a、GENESISは断片4で開始し、本発明者らがyceQを書き換えることができなかった断片9まで円滑に進行した。断片9の本発明者らの初期設計に関する問題の同定及び修正は、予測されるyceQ ORFの開始時に終止コドンを導入することによって図6に記載されるように実行した。pheS-Hyg(pH)二重選択カセットについての断片9の末端におけるsacB-Cm(sC)二重選択カセットの交換後、この株を、断片4~13(区画A+B)が完全に書き換えられる株を組み立てるためのコンジュゲーションについてのレシピエントとして作用させるように準備した。並行して、本発明者らは、書き換えられた断片4を含有する株を不完全な断片9にGENESISによって書き換え続けた;これにより、断片4~8及び10~13が完全に書き換えられ、断片9が部分的に書き換えられたアセンブリのための第2の株を生成した。次いで本発明者らは、断片4~13(区間A+B)が完全に書き換えられる株を組み立てるためのコンジュゲーションについてのドナーを生成するために第2の株における断片10の開始の3kb上流にoriTを組み込んだ。ドナー及びレシピエント株のコンジュゲーションにより、区画A及びBが完全に書き換えられる株が得られた。 b、断片37a及び1の個々のREXERにより、不完全な書き換えが生じた。本発明者らは、両方のトラブルシューティングを独立して実行した(図5、図7)。修復を示す。次いで各株はGENESISの2つの独立したセットについての開始点として機能し、一方は、37a~37b(左側)を生成し、rpsL-Kan(rK)カセットで終了し、もう一方は、1~3(右側)を生成し、sacB-Cmカセットおいて終了した。本発明者らは、断片1の開始の3kb上流のoriTを組み込み、この株は、37a~37bへの1~3の誘導コンジュゲーションについてのドナーとして機能した。Cmの獲得及びrpsLの喪失によって正確な産生物を選択した。これにより、単一の株において区画Hが完成した。 書き換えられたゲノム区画のコンジュゲーションによる完全合成ゲノムを有する生物のアセンブリを示す図である。 複数の個々の部分的に書き換えられたゲノムからの合成ゲノム区画を、コンジュゲーションによって単一の完全に書き換えられたゲノムに組み立てた(Ma, N. J., et al., 2014. Nat Protoc 9, 2285-2300)。ドナー(d)及びレシピエント(r)の株は固有の書き換えられたゲノム区画を保有する;書き換えられた重複する相同領域(3kb~400kb)を、株を途切れなく組み換えるために利用した。3~5kbの範囲の小さな相同領域をアスタリスク()で示す。本発明者らが5kbより大きい相同(HR)を使用したコンジュゲーションは文字で示した。アセンブリのために、ドナーからの書き換えられたゲノム内容物を時計回りにコンジュゲートしてレシピエントにおける対応するwtゲノム区画を置換した。株AB及びHの起源は図9に詳細に記載されているが、他の全ての個々の合成ゲノムはGENESISによって生成した(図4)。最後の完全に書き換えられたA~Hの株が組み立てられるまで、コンジュゲーションに続いて組換えを進行し、NGS配列決定によって配列を検証した。 書き換えられたゲノム区画の完全に書き換えられた生物へのアセンブリを示す図である。 a、コンジュゲーションによる、部分的合成ドナー及びレシピエントゲノムの十分な合成ゲノムへの概略的なアセンブリ。レシピエント細胞において、書き換えられたゲノム区画を、ラムダレッドを介した組換え並びに陽性及び陰性選択によって、通常3~4kbである、書き換えられたDNAで伸長する;このステップは、GENESISによって導入される書き換えられた配列の末端にゲノムマーカーを利用し、ドナー株において書き換えられた断片の末端との相同領域を提供する。ドナー株は、書き換えられたDNAの末端に伝達起点(oriT,origin of transfer)を組み込むことによって調製される。示した陽性及び陰性選択により、レシピエント株の生存を確実にし、ドナーから合成DNAを首尾よく組み込んだレシピエントを選択する。伝達を不可能にするoriT配列における変異を含有するF’プラスミドを使用して、ドナーゲノムのレシピエントへのコンジュゲーションを容易にした。+2、Cm;-2、SacB;+3、Hyg;-3、pheS;+4 ゲンタマイシン;+5、テトラサイクリン。 b、複数の個々の部分的に書き換えられたゲノムからの合成ゲノム区画を、コンジュゲーションの示した配列によって単一の完全に書き換えられたゲノムに組み立てた。ドナー(d)及びレシピエント(r)の株は固有の書き換えられたゲノム区画を保有する。ドナーからの書き換えられたゲノム内容物を時計回りにコンジュゲートしてレシピエントにおける対応するWTゲノム区画を置換した。最後の完全に書き換えられたA~Hの株を組み立てるまでコンジュゲーションを進行した。図10は、全ての相同領域を含むプロセスをより詳細に示す。 Syn61における同義コドン圧縮の機能的結果を示す図である。 a、prfA、serU及びserTの同義コドン圧縮及び削除。灰色の箱は、WT大腸菌(WTゲノム)におけるtRNA及びそれらを解読する終結因子と一緒にセリンコドン及び終止コドンを示す。tRNAアンチコドン及び終結因子は、それらが黒色の線で読み取られるコドンに結び付けられている。tRNA及び終結因子遺伝子は黒色の箱内に示される。serTはWT大腸菌におけるTCAコドンを解読する唯一のtRNAであり、必要不可欠である。同義コドン圧縮(Syn.Codon.Comp.,Synonymous codon compression)により、i)CGAアンチコドンを有するtRNAがコグネイトコドンを有するべきではなく、ii)serTが非必須であるべきである、書き換えられたゲノムが得られる。標的コドンを読み取る全ての因子はSyn61において非必須であるべきである。 b、直交MmPylRS/tRNAPyl CGA対を使用した、非カノニカルアミノ酸(ncAA,non canonical amino acid)であるNε-(((2-メチルシクロプロパ-2-エン-1-イル)メトキシ)カルボニル)-L-リジン(CYPK,Nε-(((2-methylcycloprop-2-en-1-yl) methoxy) carbonyl)-L-lysine)の共翻訳取り込みは、MDS42において有毒であったが、Syn61においては有毒ではなかった。CYPKが提供されると、この対は用量依存的にTCGコドンに応答してncAAを取り込む。MDS42では、この取り込みは、プロテオームの誤った合成及び毒性を生じる。しかしながら、TCGコドンを含有しないSyn61では、これは無毒性である。線は、各[CYPK](0mM、0.5mM、1mM、2.5mM及び5mM)における3つの生物学的複製(各々点として示す)の平均に従う。「最大増殖%」は、CYPKの非存在下で示した濃度のCYPKを最終OD600で割ることによって、最終OD600によって決定した。最終OD600は600分後に決定した。 c、同義コドン圧縮により、Syn61におけるserTの削除が可能となる。PheS-Hygカセットでの置換の前(-)及び後(クローン1及び2)のserT遺伝子座に隣接するPCR。図14も参照のこと。図16の完全なゲル。 完全合成ゲノムを有する生物の特徴付けを示す図である。 a、Syn61及びMDS42についての倍加時間。本発明者らの完全に合成の書き換えられた大腸菌Syn61は、標準的な培地条件(LB+2%グルコース中で90.1分対57.6分)で増殖させた場合、親株MDS42(Posfai, G. et al., 2006. Science 312, 1044-1046)のものより1.6倍多い倍加時間を有する。Syn61とMDS42との増殖速度の比は、37℃でのLB(炭素異化産物の抑制を低下させた)中で1.7であり、M9最少培地中で1.7であり、より豊富な培地(2XTY)中で1.4であり、25℃でのLB中で2.5であり、42℃でのLB中で1.3である。異なる培地条件中でのMDS42及びSyn61のそれぞれについての倍加時間を記載する:37℃でLB、58.3分、及び100.6分;LB+2%グルコース、57.6分、及び90.1分;M9最少培地、130.5分、及び221.1分;2XTY、68.2分、92.6分;25℃でLB、86.3分、及び218.4分;42℃でLB、77.4分、及び99.7分。serVを有さない(-)又は有する(+)プラスミドを保有するSyn61は、0.99の増殖速度の比(138.3分対136.2分)を提示した。倍加時間は、各株の10個の独立して増殖させた生物学的複製の平均値±平均からの標準偏差を表す(方法を参照のこと)。 b、大腸菌株MDS42及びSyn61の代表的な顕微鏡画像。試料を、63X 1.25NA Plan Neofluar位相対物レンズを使用して直立Zeiss Axiophot位相差顕微鏡で画像化した(方法を参照のこと)。 c、株MDS42及びSyn61の顕微鏡画像から定量した細胞長のヒストグラム。MDS42についての平均細胞長は1.97±0.57μmであり、Syn61については2.3±0.74μmであった。両方の株についての指数増殖期の間にn=500の細胞の画像を撮影した。細胞長測定はNikon NIS Elementsソフトウェアで行った(方法を参照のこと)。 d、MDS42及びSyn61プロテオームのラベルフリー定量。各株を、3つの生物学的複製で増殖させた。各生物学的複製を、技術的複製物のタンデム質量分析によって分析した。生物学的複製の技術的複製物を融合させた。試料全体で合計1,084個のタンパク質を定量した。存在量の差についてのP値を、少なくとも2つの生物学的複製において定量したタンパク質について2標本T検定によって計算した。データにより、株の間で3つのタンパク質の存在量が有意に(P=0.01)異なることが示された:アミノペプチダーゼN(P04825)及びペプチダーゼT(P29745)はSyn61において大きな比率を占めたが、30Sリボソームタンパク質S20(P0A7U7)は小さな比率を占めた。LFQ値によって判断すると、株の間で1.14倍を超えてタンパク質の存在量は異ならなかった。 Syn61における同義コドン圧縮の結果を示す図である。 a、大腸菌におけるprfA、serU及びserTの同義コドン圧縮及び削除。灰色の箱は、大腸菌のセリンコドン及び終止コドンを、WT大腸菌(WTゲノム)においてそれらを解読するtRNA及び終結因子と一緒に示す。tRNAアンチコドン及び終結因子は、それらが黒色の線で読み取られるコドンに結び付けられている。tRNA及び終結因子遺伝子は黒色の箱内に示される。同義コドン圧縮(Syn.Codon.Comp.)により、TCG及びTCAコドンが除去されている、書き換えられたゲノムを有するSyn61細胞が得られる。各コドンの存在量はその箱内に記載される。 b、示したMmPylRS/tRNAPylアンチコドンであるUGAを除いて、図12bと同様である。MDS42においてよりSyn61においてこのtRNAに対するコグネイトコドンが少ないため、CYPK付加は、観察されるように、Syn61において毒性が低いと予測され得る。 c、示したMmPylRS/tRNAPylアンチコドンであるGCUを除いて、図12bと同様である。MDS42においてよりSyn61においてこのtRNAに対するコグネイトコドンが多いため、CYPK付加は、観察されるように、Syn61において毒性が高いと予測され得る。 d、serT(濃い灰色)は、ラムダ-レッドを介した組換えによるPheS-Hygカセット(黒色)の挿入によって削除されている。組換えにより、示されるように、新たなジャンクション1及び2が生じる。各組換えについて、両方のジャンクションはサンガー配列決定によって配列が検証された。サンガークロマトグラムの上にある矢印は、ジャンクションの正確な位置、選択カセットに対応する配列を示し、バーは選択カセットに隣接するゲノム配列に対応する。組換えのためのserU、serT及びprfAに対して適切な相同性を有する選択カセットを生成するために使用されるプライマーは、図23に提供される。 e、prfA(濃い灰色)は、ラムダ-レッドを介した相同組換えによるrpsL-Kan(黒色)の挿入によって削除される。アガロースゲルには、図12cに記載されているように注釈が付けられており、データの残りには、パネルdに記載されているように注釈が付けられている。完全なゲルは図16において利用可能である。 f、serU(濃い灰色)は、ラムダ-レッドを介した組換えによるPheS-Hygカセット(黒色)の挿入によって削除されている。アガロースゲルには、図12cに記載されているように注釈が付けられており、データの残りには、パネルdに記載されているように注釈が付けられている。完全なゲルは図16において利用可能である。 ゲノム合成のスケール並びに書き換えのスケール及び忠実度を示す図である。 a、ゲノム及び染色体合成。M.ジェニタリウム(M. genitalium)及びM.ミコイデス(M. mycoides)(Gibson, D. G. et al., 2008. Science 319, 1215-1220;及びGibson, D. G. et al., 2010. Science 329, 52-56)について産生された合成ゲノムのサイズ(Mb)及びいくつかのS.セレビシエ染色体(Shen, Y. et al., 2017. Science 355, aaf4791; Annaluru, N. et al., 2014. Science 344, 55-58; Xie, Z. X. et al., 2017. Science 355, aaf4704; Mitchell, L. A. et al., 2017. Science 355, aaf4831; Dymond, J. S. et al., 2011. Nature 477, 471-476; Wu, Y. et al., 2017. Science 355, aaf4706; Zhang, W. et al., 2017. Science 355, aaf3981;及びRichardson, S. M. et al., 2017. Science 355, 1040-1044)は薄い灰色で示される。ここに提示されている合成大腸菌ゲノムのサイズは濃い灰色で示される。 b、ゲノム書き換えの試行。S.ティフィムリウム(S. typhimurium)における標的コドンTTA及びTTG(Lau, Y. H. et al., 2017. Nucleic Acids Res 45, 6971-6980);大腸菌におけるAGC、AGT、TTG、TTA、AGA、AGG、及びTAG(Ostrov, N. et al., 2016. Science 353, 819-822);大腸菌におけるAGA及びAGG(Napolitano, M. G. et al., 2016. Proc Natl Acad Sci USA 113, E5588-5597)を書き換える試み、並びに大腸菌における全てのTAGの書き換え(Lajoie, M. J. et al., 2013. Science 342, 357-360)は、薄い灰色で示される。大腸菌におけるTCA、TCG、及びTAGの全ての除去との比較をここに提示した(濃い灰色)。単一の株において書き換えられたコドンの総数をグラフで示し、各試行の単一の株において書き換えられた標的コドンの最大パーセンテージを示す。 c、bに示した実験についての書き換えられた標的コドンの数の関数としての報告されたプログラムされていない変異及びインデルの数。 図12についての完全なゲルを示す図である。 完全なゲルは対応する図のパネルで示す。分子サイズ標準には注釈が付けられており、関連する図に示される領域は白色の輪郭で示される。 大腸菌ゲノムにおけるコドン及びアンチコドン相互作用を示す図である。 28個のセンスコドンはアンバー終止コドンと共に灰色で強調されている。その他のセンスコドンではなく、これらのセンスコドンのゲノムワイド除去は、ゲノムに残存する1つ又は2つ以上のセンスコドンを解読する能力を除去することなく、それらのコグネイトtRNA全ての削除を可能にする。これは、センスコドンを非天然のモノマーに再割当するために必要であるが、十分ではない。セリン、ロイシン及びアラニンのアミノ酸のための内在性アミノアシル-tRNA合成酵素はそれらのコグネイトtRNAのアンチコドンを認識しないので、セリン、ロイシン及びアラニンのコドンボックスを強調する。これは、内在性合成酵素による誤ったアミノアシル化を導かないコグネイトアンチコドンを担持するtRNAを導入することによって、これらのボックス内のコドンの新しいアミノ酸への割当を容易にすることができる。MDS42ゲノム(ジェンバンク受託番号AP012306)における全64トリプレットコドンの総コドン数、ワトソン-クリック塩基対形成及びゆらぎの両方による公知のコドン-アンチコドン相互作用全て、tRNAアンチコドンの塩基修飾、tRNA遺伝子、並びにインビボで測定されたtRNA相対存在量が報告されている。この分析によって、セリン、ロイシン、及びアラニン群(セリンコドンTCG、TCA、AGT、AGC;ロイシンコドンCTG、CTA、TTG、TTA;及びアラニンコドンGCG、GCA)から10個のコドンを同定し、コドン-アンチコドン相互作用及びコドン再割当のためのアミノアシル-tRNA合成酵素認識基準の両方を満たす。 設計された合成大腸菌ゲノム(配列番号1)を示す図である。 オープンリーディングフレーム(ORF,open reading frames)内のセリンコドンTCG及びTCA並びに終止コドンTAGが、それぞれ、それらの同義AGC、AGT、及びTAAによって体系的に置換されている大腸菌MDS42ゲノムの型。同義コドン圧縮及びリファクタリングについての定義された規則を使用して、18,218個の全ての標的コドンがそれらの標的同義語に書き換えられているゲノムを設計する。 最終合成大腸菌ゲノム(Syn61)(配列番号2)を示す図である。 ゲノム内の1.8×10個の全ての標的コドンが書き換えられている、大腸菌Syn61の配列。本発明者らの書き換えられたゲノムの合成は8個のみのプログラムされていない変異を導入し(表6)、これらの変異のうちの4個は、100kbのBACを調製している間に生じ、4個は書き換えプロセスの間に生じた。 合成ゲノムを組み立てるためのBACを示す図である。 A、BAC-sacB-CmR-rpsL。5’相同領域(HR)及びCRISPR/Cas9プロトスペーサー配列(スペーサー1)が上流で隣接したsacB-CmR選択カセットを保有する注釈付きのBACベクターについてのヌクレオチド配列。sacB-CmRカセットは、3’相同領域、CRISPR/Cas9プロトスペーサー配列(スペーサー2)、及びrpsL選択マーカーが下流で隣接している。 B、- BAC-rpsL-KanR-sacB。5’相同領域(HR)及びCRISPR/Cas9プロトスペーサー配列(スペーサー1)が上流で隣接したrpsL-KanR選択カセットを保有する注釈付きのBACベクターについてのヌクレオチド配列。rpsL-KanRカセットは、3’相同領域、CRISPR/Cas9プロトスペーサー配列(スペーサー2)、及びsacB選択マーカーが下流で隣接している。 C、BAC-rpsL-KanR-pheS-HygR。5’相同領域(HR)及びCRISPR/Cas9プロトスペーサー配列(スペーサー1)が上流で隣接したrpsL-KanR選択カセットを保有する注釈付きのBACベクターについてのヌクレオチド配列。rpsL-KanRカセットは、3’相同領域、CRISPR/Cas9プロトスペーサー配列(スペーサー2)、及びpheS-HygR選択マーカーが下流で隣接している。 D、BAC構築の表。REXERのための合成DNA及び合成DNA断片の間の相同領域を用いてBACを構築するために使用したオリゴヌクレオチド及び選択マーカー。2番目のタブは、REXERのために使用したプラスミド骨格及びプロトスペーサー配列を記載している。 例示的なスペーサープラスミドマップを示す図である。 A、スペーサープラスミドマップ。REXERのための直線状又は環状スペーサーとして使用されるスペーサー配列を有するCRISPR挿入物を含有するpKW1_MB1amp_スペーサー_REXER2の例示的なマップ。 B、第2世代スペーサープラスミドマップ。REXERのための環状第2世代スペーサーとして使用されるスペーサー配列を有するCRISPR挿入物を含有するpKW3_MB1amp_スペーサー_REXER2の例示的なマップ。 コンジュゲーションのためのコンストラクトを示す図である。 A、ゲンタマイシン耐性OriTカセット。 B、コンジュゲーションコンストラクトのためのプライマー。コンジュゲーションのために使用したオリゴヌクレオチドプライマー。 C、pJF146。自己伝達しないF’プラスミド。 削除実験のためのプライマーを示す図である。 Syn61におけるtRNA serT及びserU並びに終結因子prfAの削除のために使用したオリゴヌクレオチドプライマー。
詳細な説明
本明細書で使用される場合、「含む(comprising)」、「含む(comprises)」及び「から構成される(comprised of)」という用語は、「包含する(including)」若しくは「包含する(includes)」、又は「含有する(containing)」若しくは「含有する(contains)」と同義であり、包括的又はオープンエンドであり、付加的な列挙されていない構成、要素又はステップを排除しない。「含む(comprising)」、「含む(comprises)」及び「から構成される(comprised of)」という用語は、「からなる(consisting of)」という用語も包含する。
合成ゲノム
ゲノム
本明細書で使用される場合、「ゲノム」は、遺伝子及び非コードDNAの両方を包含する、生物の遺伝物質である。本明細書で使用される場合、「合成ゲノム」は、合成的に構築されたゲノムである。典型的に、合成ゲノムは、既存(すなわち、「親」)のゲノムの遺伝子修飾によって産生される。それ故、合成ゲノムは親ゲノムに由来し得る、すなわち、1つ又は2つ以上の遺伝子修飾を含むことを除いて親ゲノムと同一であり得る。当業者は、合成ゲノムの基になっている親ゲノム及び実行される遺伝子修飾を容易に同定することができるであろう。本明細書で使用される場合、「親ゲノム」は、任意の天然に存在する、市販の、寄託された、カタログに載っている若しくはそうでなければ周知のゲノム、又はそれらの誘導体であり得る。
本発明の合成ゲノムは合成原核生物ゲノムである。原核生物は、膜結合型核、ミトコンドリア、又は任意の他の膜結合型細胞小器官を欠く単細胞生物である。原核生物は、2つの領域である、古細菌及び細菌に分けられる。原核生物のゲノムは一般に、DNAの環状二本鎖片であり、その複数のコピーはいかなる時でも存在し得る。
好ましくは、本発明の合成ゲノムは合成細菌ゲノムである。好ましくは、合成細菌ゲノムは、異種タンパク質産生、特に1つ又は2つ以上の非タンパク質性アミノ酸を含むポリペプチド(例えば、Ferrer-Miralles, N. and Villaverde, A., 2013. Microbial Cell Factories, 12:113に記載されているもの)の産生に適している。適切な細菌ゲノムとしては、エシェリキア(escherichia)(例えば、大腸菌)、カウロバクテリア(caulobacteria)(例えば、カウロバクター・クレセンタス(Caulobacter crescentus))、光合成細菌(例えば、ロドバクター・スフェロイデス(Rodhobacter sphaeroides))、低温適応型細菌(例えば、シュードアルテロモナス・ハロプランクティス(Pseudoalteromonas haloplanktis)、シェワネラ属種(Shewanella sp.)株Ac10)、シュードモナス(pseudomonads)(例えば、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)、シュードモナス・プチダ(Pseudomonas putida)、シュードモナス・エルギノーザ(Pseudomonas aeruginosa))、好塩性細菌(例えば、ハロモナス・エロンガタ(Halomonas elongate)、クロモハロバクター・サレキシゲンス(Chromohalobacter salexigens))、ストレプトミセテス(streptomycetes)(例えば、ストレプトマイセス・リビダンス(Streptomyces lividans)、ストレプトマイセス・グリゼウス(Streptomyces griseus))、ノカルディア(nocardia)(例えば、ノカルディア・ラクタムジュランス(Nocardia lactamdurans))、マイコバクテリア(mycobacteria)(例えば、マイコバクテリウム・スメグマティス(Mycobacterium smegmatis))、コリネフォーム細菌(coryneform bacteria)(例えば、コリネバクテリウム・グルタミクム(Corynebacterium glutamicum)、コリネバクテリウム・アンモニアゲネス(Corynebacterium ammoniagenes)、ブレビバクテリウム・ラクトファーメンタム(Brevibacterium lactofermentum))、バシラス(bacilli)(例えば、バシラス・サチリス(Bacillus subtilis)、バシラス・ブレビス(Bacillus brevis)、バシラス・メガテリウム(Bacillus megaterium)、バシラス・リケニフォルミス(Bacillus licheniformis)、バシラス・アミロリケファシエンス(Bacillus amyloliquefaciens))、及び乳酸菌(例えば、ラクトコッカス・ラクチス(Lactococcus lactis)、ラクトバチルス・プランタルム(Lactobacillus plantarum)、ラクトバチルス・カゼイ(Lactobacillus casei)、ラクトバチルス・ロイテリ(Lactobacillus reuteri)、ラクトバチルス・ガセリ(Lactobacillus gasseri))ゲノムが挙げられる。一部の実施形態では、合成ゲノムは合成グラム陰性細菌ゲノムである。
細菌ゲノムは、約130kb~14Mb超の程度のサイズの範囲であり得る。それ故、一部の実施形態では、本発明の合成原核生物ゲノムは、100kb~20Mb、又は130kb~15Mb、又は200kb~15Mb、又は300kb~15Mb、又は500kb~15Mb、又は1Mb~15Mb、又は1Mb~10Mb、又は1Mb~8Mb、又は1Mb~6Mb、又は2Mb~6Mb、又は2Mb~5Mb、又は3Mb~5Mb、又は約4Mbのサイズである。合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子、好ましくは1000個若しくは1001個以上の遺伝子を含むことができる。合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子を含むことができ、それらの遺伝子について翻訳及び/又は予測タンパク質産物の証拠が存在し、好ましくは1000個又は1001個以上の遺伝子である。好ましくは、合成原核生物ゲノムは、100個又は101個以上、200個又は201個以上、300個又は301個以上、400個又は401個以上、500個又は501個以上の必須遺伝子、好ましくは300個又は301個以上の必須遺伝子を含む。
好ましくは、本発明の合成ゲノムは、合成の大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムである。これらは、Lukjancenko, O., et al., 2010. Microbial ecology, 60(4), pp.708-720; 及びKarberg, K.A., et al., 2011. PNAS, 108(50), pp.20154-20159に開示されているように系統学的に関連した種である。
より好ましくは、本発明の合成ゲノムは合成大腸菌ゲノムである。親ゲノムは、MDS42、K-12、MG1655、BL21、BL21(DE3)、AD494、Origami、HMS174、BLR(DE3)、HMS174(DE3)、Tuner(DE3)、Origami2(DE3)、Rosetta2(DE3)、Lemo21(DE3)、NiCo21(DE3)、T7 Express、SHuffle Express、C41(DE3)、C43(DE3)、及びm15 pREP4又はそれらの誘導体を包含する任意の適切な大腸菌ゲノムであってもよい(Rosano, G.L. and Ceccarelli, E.A., 2014. Frontiers in microbiology, 5, p.172)。最も好ましくは、親ゲノムは、MDS42、MG1655、若しくはBL21又はそれらの誘導体である。MG1655は大腸菌の野生型株と見なされる。この株のゲノム配列のジェンバンクIDは、U00096である。BL21は広範に市販されている。例えば、それは、カタログ番号C2530H(https://www.neb.com/products/c2530-bl21-competent-e-coli)でNew England BioLabs社から購入することができる。
一部の実施形態では、合成ゲノムは、少ない合成ゲノム又は最小合成ゲノムである。「少ないゲノム」は、親ゲノムのサイズが、非必須遺伝子及び/又は非コード領域を除去することによって低減しているものである。「最小ゲノム」は、例えば、ゲノムの全ての非必須領域の削除によって生存能を維持しながら、その最小サイズまで低減しているゲノムである。
本発明の合成ゲノムは生存可能なゲノムであり得る。本明細書で使用される場合、「生存可能なゲノム」とは、細胞の生存能を引き起こす及び/又は維持するのに十分な核酸配列を含有するゲノム、例えば、複製、転写、翻訳、エネルギー産生、輸送、膜及び細胞質成分の産生、並びに細胞分裂に必要とされる分子をコードするゲノムを指す。
好ましくは、1つ又は2つ以上のtRNA又は終結因子が合成ゲノムから削除されてもよく、合成ゲノムは生存可能なままであり得る。例えば、置換(又は削除)されている1つ又は2つ以上のセンスコドンのみを解読するtRNAは非必須であり得る。同様に、tRNAが解読する残りのセンスコドンが、代替のtRNAによっても解読され得る場合、置換(又は削除)されている1つ又は2つ以上のセンスコドンを解読するtRNAは非必須であり得る。例えば、tRNASer UGAをコードするserTは、大腸菌におけるTCAコドンを解読する唯一のtRNAであるので、通常、必須である。しかしながら、合成ゲノムがTCAコドンを含有しない場合、serTは非必須であり得る。
センスコドン
本発明は、1つ若しくは2つ以上のセンスコドンの5つ若しくは4つ以下の出現を含む合成原核生物ゲノム;及び/又は合成原核生物ゲノムが、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの出現を含む、親ゲノムに由来する合成原核生物ゲノム;及び/又は1つ若しくは2つ以上のセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含む合成原核生物ゲノムを提供する。
1つ又は2つ以上のセンスコドンは、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つのセンスコドンからなってもよい。好ましくは、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、最も好ましくは2つのセンスコドンからなる。
合成原核生物ゲノムは、1つ若しくは2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、若しくは8つ)のセンスコドンの5つ若しくは4つ以下(例えば、5つ、4つ、3つ、2つ、1つ)の出現を含んでもよいか、又は出現を含まなくてもよい。一部の実施形態では、合成原核生物ゲノムは、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの各々の5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。他の実施形態では、合成原核生物ゲノムは、合わせて(すなわち、全部で)1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。好ましい実施形態では、合成原核生物ゲノムは、1つのセンスコドンの出現を含まない。他の好ましい実施形態では、合成原核生物ゲノムは、2つのセンスコドンの出現を含まない。
合成原核生物ゲノムは、親ゲノムに由来してもよく、1つ若しくは2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、若しくは8つ)の天然センスコドンの5つ若しくは4つ以下(例えば、5つ、4つ、3つ、2つ、1つ)の出現を含むか、又は出現を含まない。一部の実施形態では、合成原核生物ゲノムは、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの各々の5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。他の実施形態では、合成原核生物ゲノムは、合わせて(すなわち、全部で)1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。好ましい実施形態では、合成原核生物ゲノムは、親ゲノムに由来し、1つの天然センスコドンの出現を含まない。他の好ましい実施形態では、合成原核生物ゲノムは、親ゲノムに由来し、2つの天然センスコドンの出現を含まない。
一部の実施形態では、合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子、好ましくは1000個若しくは1001個以上の遺伝子を含む。一部の実施形態では、遺伝子は、翻訳及び/又は予測タンパク質産物の証拠が存在するものである。例えば、合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子、好ましくは1000個若しくは1001個以上の遺伝子を含むことができ、それらの遺伝子について翻訳及び/又は予測タンパク質産物の証拠が存在する。好ましくは、合成原核生物ゲノムは、100個又は101個以上、200個又は201個以上、300個又は301個以上、400個又は401個以上、500個又は501個以上の必須遺伝子、好ましくは300個又は301個以上の必須遺伝子を含む。好ましくは、(必須)遺伝子は、1つ又は2つ以上のセンスコドンの出現を有さない。
合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現を含んでもよい。一部の実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの各々の出現を含む。他の実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、合わせて10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現を含む。好ましい実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つのセンスコドンを含む。他の好ましい実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の2つのセンスコドンを含む。
合成原核生物ゲノムは、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含んでもよい。好ましくは、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現を有さない。好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つのセンスコドンの出現を有さない。他の好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、2つのセンスコドンの出現を有さない。実質的に全てとは、10個又は9個以下(例えば、10個、9個、8個、7個、6個、5個、4個、3個、2個、1個、又は0個)の遺伝子を除いて全てが1つ又は2つ以上のセンスコドンの出現を含むことを意味する。
合成原核生物ゲノムは、1つ若しくは2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含んでもよい。好ましくは、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの出現を有さない。好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つの天然センスコドンの出現を有さない。他の好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、2つの天然センスコドンの出現を有さない。実質的に全てとは、10個又は9個以下(例えば、10個、9個、8個、7個、6個、5個、4個、3個、2個、1個、又は0個)の遺伝子を除いて全てが1つ又は2つ以上の天然センスコドンの出現を含むことを意味する。
好ましくは、遺伝子はタンパク質をコードし(例えば、遺伝子は翻訳及び/又は予測タンパク質産物の証拠が存在するものである)、及び/又は遺伝子は必須遺伝子である。それ故、より好ましい実施形態では、合成原核生物ゲノムは、1つ又は2つのセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上のタンパク質をコードする遺伝子及び/又は100個若しくは101個以上、200個若しくは201個以上、又は300個若しくは301個以上の必須遺伝子を含む。他のより好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全てのタンパク質をコードする遺伝子及び/又は必須遺伝子は、1つ又は2つのセンスコドンの出現を含まない。
好ましい実施形態では、タンパク質は1つ若しくは2つ以上のセンスコドンの残りの出現のいずれかから翻訳されず、及び/又は1つ若しくは2つ以上のセンスコドンの残りの出現を含む遺伝子は推定若しくは非コード遺伝子である。一部の実施形態では、1つ又は2つ以上のセンスコドンの残りの出現を含む遺伝子の翻訳は低減及び/又は阻止される(例えば、遺伝子は5’配列において終止コドンを含んでもよい)。
センスコドンのいずれかの残りの出現が、合成原核生物ゲノムが生存可能であることを確保するために必要な場合がある。例えば、合成原核生物ゲノムにおける1つ若しくは2つ以上のセンスコドンの残りの出現の1つ若しくは2つ以上、好ましくは全てが、必須遺伝子の調節エレメントに存在してもよく、及び/又は1つ若しくは2つ以上のセンスコドンの残りの出現の1つ若しくは2つ以上、好ましくは全てが、翻訳若しくは予測タンパク質産物についての証拠が存在しない遺伝子(すなわち、推定又は非コード遺伝子)にあってもよい。
本明細書で使用される場合、「センスコドン」は、アミノ酸をコードするヌクレオチドトリプレットである。それ故、センスコドンは、遺伝子予測によって、すなわち、タンパク質をコードするゲノムの領域(すなわち、遺伝子)及び対応するオープンリーディングフレーム(ORF)を同定することによってゲノム内で同定され得る。典型的に、ゲノムは天然に61個のセンスコドンを含む:GCT、GCC、GCA、GCG、CGT、CGC、CGA、CGG、AGA、AGG、AAT、AAC、GAT、GAC、TGT、TGC、CAA、CAG、GAA、GAG、GGT、GGC、GGA、GGG、CAT、CAC、ATT、ATC、ATA、TTA、TTG、CTT、CTC、CTA、CTG、AAA、AAG、ATG、TTT、TTC、CCT、CCC、CCA、CCG、TCT、TCC、TCA、TCG、AGT、AGC、ACT、ACC、ACA、ACG、TGG、TAT、TAC、GTT、GTC、GTA、及びGTG(DNAのコード鎖上で5’から3’に読む)。標準的な遺伝コードは61個のトリプレットコドンを使用して20種のカノニカルアミノ酸をコードする。20種のアミノ酸のうちの18種は、1つより多い同義コドンによってコードされる(図17を参照のこと)。1つ又は2つ以上のセンスコドンは1つ又は2つ以上の天然センスコドン、すなわち、親ゲノムに存在するセンスコドンであり得る。
DNAの61個のセンスコドンは対応するmRNAに転写され、続いて1つ又は2つ以上のtRNAによって解読される。tRNAは、mRNAのセンスコドンによって指示されるようにリボソームにアミノ酸を運ぶ。tRNAは、相補的アンチコドンによって1つ又は2つ以上のセンスコドンを認識することができる。続いて、センスコドンの配列はポリペプチド(すなわち、アミノ酸の配列)に翻訳される。大腸菌ゲノムにおけるコドン及びアンチコドン相互作用は図17に示される。
好ましくは、他のセンスコドンではなく、1つ又は2つ以上のセンスコドンのゲノムワイド除去により、前記1つ又は2つ以上のセンスコドンに対応する全てのコグネイトtRNAを、ゲノムに残っている1つ又は2つ以上のセンスコドンを解読する能力を除去することなく削除することができる。それ故、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、GTG、GTA、CTG、CTA、TTG、TTA、ACG、ACA、CCG、CCA、CGG、CGA、CGT、CGC、AGG、AGA、GGG、GGA、GGT、GGC、ATT、及びATCから選択され得る。
セリン、ロイシン及びアラニンについてのアミノアシル-tRNA合成酵素は、それらのコグネイトtRNAのアンチコドンを認識しない。これは、内在性合成酵素による誤ったアミノアシル化を導かないコグネイトアンチコドンを担持するtRNAを導入することによって、これらのボックス内のコドンの新しいアミノ酸への割当を容易にすることができる。それ故、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され得る。
好ましくは、1つ又は2つ以上のセンスコドンはこれらの基準の両方を満たすので、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され得る。より好ましくは、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択される。最も好ましくは、1つ又は2つ以上のセンスコドンはTCG及び/又はTCAである。
好ましくは、ゲノムが非タンパク質性アミノ酸へのコドン再割当と適合するように1つ又は2つ以上のセンスコドンは除去される。それ故、1つ又は2つ以上のセンスコドンは、TCA、CTA、又はTTAのうちの1つ又は2つ以上を含んでもよい。あるいは、2つ又は3つ以上のセンスコドンが除去され、その2つ又は3つ以上のセンスコドンは、GCG及びGCA;GCT及びGCC;TCG及びTCA;AGT及びAGC;TCT及びTCC;CTG及びCTA;TTG及びTTA;並びにCTT及びCTCからなる群から選択される、センスコドン対のうちの1つ又は2つ以上を含む。好ましくは、2つ又は3つ以上のセンスコドンが除去され、その2つ又は3つ以上のセンスコドンは、GCG及びGCA;TCG及びTCA;AGT及びAGC;CTG及びCTA;並びにTTG及びTTAからなる群から選択される、センスコドン対のうちの1つ又は2つ以上を含む。より好ましくは、2つ又は3つ以上のセンスコドンはTCG及びTCAを含む。
センスコドンの除去を達成するために、それらは同義センスコドンで置換され得る。これは、コードされたタンパク質配列が変化しないことを確保するために好ましい。例えば、本発明は、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換されている、合成原核生物ゲノムを提供する。当業者は、適切な同義センスコドン置換を推定することができる。例えば、大腸菌では、典型的に、TCG、TCA、TCT、TCC、AGT及びAGCの全てはセリンをコードし、典型的に、GCG、GCA、GCT及びGCCの全てはアラニンをコードし、典型的に、CTG、CTA、CTT、CTC、TTG及びTTAの全てはロイシンをコードする。
一部の実施形態では、置換は定義された置換であり、すなわち、1つのセンスコドンが単一の同義センスコドンで置換されている。好ましくは、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、定義された(すなわち、単一の)同義センスコドンで置換されている。
例えば、定義された置換は、GCT若しくはGCCのいずれかで置換されたGCG;GCT若しくはGCCのいずれかで置換されたGCA;TCT、TCC、AGT、若しくはAGCのいずれか1つで置換されたTCG;TCT、TCC、AGT、若しくはAGCのいずれか1つで置換されたTCA;TCG、TCA、TCT、若しくはTCCのいずれか1つで置換されたAGT;TCG、TCA、TCT、若しくはTCCのいずれか1つで置換されたAGC;CTT、CTC、TTG若しくはTTAのいずれか1つで置換されたCTG;CTT、CTC、TTG若しくはTTAのいずれか1つで置換されたCTA;CTG、CTA、CTT若しくはCTCのいずれか1つで置換されたTTG;又はCTG、CTA、CTT若しくはCTCのいずれか1つで置換されたTTAであってもよい。好ましくは、1つ又は2つ以上の定義されたセンスコドン置換は、GCGからGCT又はGCCのいずれか;GCAからGCT又はGCCのいずれか;TCGからAGT又はAGCのいずれか;TCAからAGT又はAGCのいずれか;AGTからTCA又はTCTのいずれか;AGCからTCG又はTCC又はTCAのいずれか;TTGからCTT;及びTTAからCTCのうちの1つ又は2つ以上から選択される。より好ましくは、TCG及び/又はTCAはAGC及び/又はAGTで置換されている。最も好ましくは、TCGはAGCで置換され、及び/又はTCAはAGTで置換されている。
好ましくは、定義された置換は、ゲノムが非タンパク質性アミノ酸へのコドン再割当と適合するようなものである。例えば、(i)GCGは、GCT若しくはGCCのいずれかで置換されていてもよく、GCAは、GCT若しくはGCCのいずれかで置換されていてもよく;(ii)TCGは、TCT、TCC、AGT、若しくはAGCのいずれかで置換されていてもよく、TCAは、TCT、TCC、AGT、若しくはAGCのいずれかで置換されていてもよく;(iii)AGTは、TCG、TCA、TCT、若しくはTCCのいずれかで置換されていてもよく、AGCは、TCG、TCA、TCT、若しくはTCCのいずれかで置換されていてもよく;(iv)CTGは、CTT、CTC、TTG若しくはTTAのいずれかで置換されていてもよく、CTAは、CTT、CTC、TTG若しくはTTAのいずれかで置換されていてもよく;又は(v)TTGは、CTG、CTA、CTT若しくはCTCのいずれかで置換されていてもよく、TTAは、CTG、CTA、CTT若しくはCTCのいずれかで置換されていてもよい。
好ましくは、定義された置換スキームは、以下の表に列挙されたもののうちの1つ又は2つ以上である:
Figure 2022533040000002
Figure 2022533040000003
Figure 2022533040000004
好ましくは、これらのコドン置換のいずれも、大腸菌において高度に保存された調節配列であるリボソーム結合部位(AGGAGG)に影響を及ぼさない。選択されたコドン置換は、生存能を評価するために小さな試験領域(例えば、必須標的遺伝子及び標的コドンの両方が豊富なゲノムの20kb領域)で試験されてもよい。コドン置換が小さな試験領域で生存可能でない場合、それらは無視され得る。
定義された置換同義センスコドンでの親ゲノムにおける1つ又は2つ以上のセンスコドンの置換が生存可能なゲノムを生じない場合、代替の置換同義センスコドンが使用され得る。例えば、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現の99.9%が定義された(すなわち、単一の)同義センスコドンで置換されていてもよく、残りの0.1%が代替の同義センスコドンで置換されていてもよい。例えば、TCGの出現の99.9%がAGCで置換されていてもよく、0.1%がTCT、TCC、AGT若しくはAGCで置換されていてもよく;及び/又はTCAの出現の99.9%がAGTで置換されていてもよく、0.1%がTCT、TCC、AGT若しくはAGCで置換されていてもよい。
本明細書で使用される場合、「終止コドン」は、タンパク質への翻訳の終結をコードするヌクレオチドトリプレットである。典型的に、ゲノムは3つの終止コドン:TAA(「オーカー」)、TGA(「オパール」又は「ウンバー(umber)」)及びTAG(「アンバー」)を天然に含む。
一部の実施形態では、合成原核生物ゲノムは、1つ若しくは2つの終止コドンの10個若しくは9個以下、5個若しくは4個以下の出現をさらに含むか、又は出現を含まず、好ましくはアンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない。好ましくは、親原核生物ゲノムにおけるTAGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、又は全ては、TAA(オーカー終止コドン)で置換されている。好ましい実施形態では、合成原核生物ゲノムはアンバー終止コドン(TAG)の出現を含まず、親原核生物ゲノムにおけるTAGの出現の全てはTAA(オーカー終止コドン)で置換されていてもよい。
したがって、好ましい実施形態では、本発明の合成原核生物ゲノムは、1つ若しくは2つ以上、又は2つ若しくは3つ以上のセンスコドンの出現を含まず、1つの終止コドン、好ましくはアンバー終止コドン(TAG)の出現を含まない。より好ましい実施形態では、本発明の合成原核生物ゲノムは、2つのセンスコドン、好ましくはTCG及びTCAの出現を含まず、アンバー終止コドン(TAG)の出現を含まず、親原核生物ゲノムにおけるTCG、TCA及びTAGは同義コドンで置換されていてもよく、例えば、親原核生物ゲノムにおけるTCGの出現の99.9%又はそれ以上はAGCで置換され、親原核生物ゲノムにおけるTCAの出現の99.9%又はそれ以上はAGTで置換され、親原核生物ゲノムにおけるTAGの出現の全てはTAAで置換されている。
一部の実施形態では、合成原核生物ゲノムは、配列番号1又は配列番号2に対して少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、又は99.9%同一であるポリヌクレオチド配列を含む。
本発明は、配列番号1又は配列番号2に対して少なくとも98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%又は100%同一である合成原核生物ゲノムを提供する。
配列比較は、目測で行われてもよいか、又はより通常は、容易に利用可能な配列比較プログラムを活用して行われてもよい。これらの公的及び商業的に利用可能なコンピュータープログラムは、2つ又は3つ以上の配列の間の配列同一性を計算することができる。
配列同一性は連続する配列にわたって計算することができる、すなわち、1つの配列を他の配列と整列させ、1つの配列における各アミノ酸を、一度に1残基ずつ他の配列における対応するアミノ酸と直接比較する。これは「ギャップなし」アラインメントと呼ばれる。典型的に、このようなギャップなしアラインメントは、比較的少数の残基(例えば、50未満の連続するアミノ酸)にわたってのみ実施される。
これは非常に簡単で一貫した方法であるが、この方法は、例えば、他の点では同一の配列対において、1つの挿入又は欠失がそれに続くアミノ酸残基をアラインメントから除外することを考慮しておらず、それ故、グローバルアラインメントを実施した場合に相同性%の大幅な低下をもたらす可能性がある。それによって、ほとんどの配列比較方法は、全体的な相同性スコアに過度にペナルティを与えることなく起こり得る挿入及び欠失を考慮に入れた最適なアラインメントを生成するように設計される。これは、配列アラインメントに「ギャップ」を挿入して局所的相同性を最大化することを試みることにより達成される。
しかしながら、これらのより複雑な方法は、同数の同一アミノ酸に関して、できる限り少ないギャップ(2つの比較配列間のより高い関連性を反映する)を有する配列アラインメントが多くのギャップを有するものより高いスコアを獲得するように、アラインメント中に生じる各ギャップに「ギャップペナルティ」を割り当てる。典型的に、ギャップの存在に比較的高いコストを課し、ギャップ中の各後続残基にはより小さいペナルティを課す「アフィンギャップコスト」を使用する。これは最もよく使用されるギャップスコアリングシステムである。高いギャップペナルティは当然、より少数のギャップを有する最適化されたアラインメントを生成する。ほとんどのアラインメントプログラムは、ギャップペナルティを変更することができる。しかしながら、配列比較のためにこのようなソフトウェアを使用する場合、デフォルト値を使用することが好ましい。例えば、GCG Wisconsin Bestfitパッケージ(下記参照)を使用する場合、アミノ酸配列のデフォルトギャップペナルティは、1つのギャップに対しては-12、また各伸長に対しては-4である。
そのため、配列同一性の最大%の計算には、最初に、ギャップペナルティを考慮した最適なアラインメントの生成が必要となる。このようなアラインメントを実行するための適切なコンピュータープログラムは、GCG Wisconsin Bestfitパッケージ(University of Wisconsin, U.S.A; Devereux et al., 1984, Nucleic Acids Research 12:387)である。配列比較を実施することができる他のソフトウェアの例としては、限定するものではないが、BLASTパッケージ(Ausubel et al., 1999 ibid - Chapter 18を参照のこと)、FASTA(Atschul et al., 1990, J. Mol. Biol., 403-410)及びGENEWORKS比較ツール一式が挙げられる。BLAST及びFASTAの両方は、オフライン及びオンライン検索に利用可能である(Ausubel et al., 1999 ibid, pages 7-58から7-60を参照のこと)。しかしながら、GCG Bestfitプログラムを使用することが好ましい。
適切には、配列同一性は配列の全体にわたって決定され得る。適切には、配列同一性は、本明細書中に列挙した配列と比較される候補配列の全体にわたって決定され得る。
最終的な配列同一性は同一性の観点から測定され得るが、アラインメントプロセスそれ自体は、典型的に、全か無かの対比較に基づくものではない。その代わり、化学的類似性又は進化距離に基づいて各ペアワイズ比較にスコアを割り当てる、スケーリングした類似性スコア行列が一般に使用される。慣用されるこのような行列の例は、BLOSUM62行列(BLASTプログラム一式のためのデフォルト行列)である。GCG Wisconsinプログラムは一般に、パブリックデフォルト値又は供給される場合、カスタムシンボル比較表のいずれかを使用する(さらなる詳細についてはユーザーマニュアルを参照のこと)。好ましくは、GCGパッケージにはパブリックデフォルト値、又は他のソフトウェアの場合にはデフォルト行列、例えばBLOSUM62が使用される。
ソフトウェアにより最適なアラインメントが生成されれば、配列同一性%を計算することができる。このソフトウェアは、典型的に、これを配列比較の一環として行い、数値結果をもたらす。
リファクタリング
ゲノムは、多数の重複するオープンリーディングフレーム(ORF)を含有し、これは、3’、3’(逆向きのORFの間)又は5’、3’(同じ向きのORFの間)と分類され得る。1つ又は2つ以上のセンスコドン(すなわち、置換されるもの)は、親ゲノムにおける重複の両方のクラス内に見出され得る。
重複内の各ORFの1つ又は2つ以上のセンスコドンの置換が、いずれかのORFのコードされたタンパク質配列を変化させずに(すなわち、同義コドンを導入することによって)達成され得る場合、親ゲノムを編集(例えば、リファクタリング)する必要はなくてもよい。しかしながら、コードされたタンパク質配列が1つ又は2つ以上のセンスコドンの置換によって変化される(すなわち、1つ又は2つ以上の同義センスコドンがORFの一方又は両方に導入されない)場合、親ゲノムを編集(例えば、リファクタリングする)必要があり得る。
それ故、一部の実施形態では、親ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する1つ又は2つ以上の遺伝子対はリファクタリングされる。「リファクタリングされる」とは、遺伝子が、コードされたタンパク質配列に対する変化を阻止するために再編成されることを意味する。好ましくは、遺伝子対は、センスコドン置換(例えば、定義された同義コドン置換)が、遺伝子対の両方又はいずれかのコードされたタンパク質配列を変化させるものである。最も好ましくは、親ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する全ての遺伝子対はリファクタリングされ、その遺伝子対は、センスコドン置換(例えば、定義された同義コドン置換)が、遺伝子対の両方又はいずれかのコードされたタンパク質配列を変化させるものである。
3’、3’重複(すなわち、逆向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。3’、3’重複に関して、合成挿入物は重複する領域を含んでもよい。
5’、3’重複(すなわち、上流の遺伝子及び下流の遺伝子を含む、同じ向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。5’、3’重複に関して、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から約20~200bp、又は20~100bp、又は20~50bp;及び(iii)重複する領域を含んでもよい。好ましくは、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から約20bp;及び(iii)重複する領域を含む。これにより、下流のORFについてのRBSの配列及びこのRBSとその開始コドンとの間の距離が保存される。
好ましい実施形態では、終止コドンは、下流の遺伝子について元の開始部位とインフレームである。好ましくは、終止コドンはTAAである。
上記の特定の変異、すなわち、1つ又は2つ以上のセンスコドンの量を減少させることを目的とした変異(例えば、1つ若しくは2つ以上のセンスコドンの置換及び/又はリファクタリング)及びアンバー終止コドンの量を減少させることを目的とした変異とは別に、合成原核生物ゲノムは、親ゲノムと比較して、1000個又は999個以下、100個又は99個以下、50個又は49個以下、20個又は19個以下、10個又は9個以下の付加的(すなわち、プログラムされていない)変異を含んでもよい。好ましくは、合成原核生物ゲノムは、標的コドン当たり(すなわち、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現当たり)2×10-4個又はそれ以下の付加的又はプログラムされていない変異を含む。
ポリヌクレオチド
本発明は、1つ又は2つ以上のセンスコドンの出現がない、1つ又は2つ以上の遺伝子を含むポリヌクレオチドを提供する。ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、2個若しくは3個以上、3個若しくは4個以上、4個若しくは5個以上、5個若しくは6個以上、10個若しくは11個以上、20個若しくは21個以上、30個若しくは31個以上、40個若しくは41個以上、50個若しくは51個以上、100個若しくは101個以上、200個若しくは201個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子を含んでもよい。好ましくは、ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、100個又は101個以上の遺伝子を含む。より好ましくは、ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、1000個又は1001個以上の遺伝子を含む。
1つ又は2つ以上のセンスコドンは、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つのセンスコドンからなってもよい。好ましくは、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、最も好ましくは2つのセンスコドンからなる。それ故、好ましい実施形態では、ポリヌクレオチドは、1つ又は2つのセンスコドンの出現がない、100個又は101個以上の遺伝子を含む。他の好ましい実施形態では、ポリヌクレオチドは、1つ又は2つのセンスコドンの出現がない、1000個又は1001個以上の遺伝子を含む。
1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、GTG、GTA、CTG、CTA、TTG、TTA、ACG、ACA、CCG、CCA、CGG、CGA、CGT、CGC、AGG、AGA、GGG、GGA、GGT、GGC、ATT、及びATCから選択されてもよい。あるいは、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択されてもよい。好ましくは、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択される。より好ましくは、1つ又は2つ以上のセンスコドンは、TCG、TCA、TTG、TTA、GCG及びGCAから選択される。最も好ましくは、1つ又は2つ以上のセンスコドンはTCG及び/又はTCAである。
遺伝子の1つ又は2つ以上のセンスコドンは同義センスコドンで置換され得る。好ましくは、置換は定義された置換であり、すなわち、1つのセンスコドンが単一の同義センスコドンで置換されている。
例えば、GCGは、GCT若しくはGCCで置換されていてもよく;GCAは、GCT若しくはGCCで置換されていてもよく;TCGは、TCT、TCC、AGT、若しくはAGCで置換されていてもよく;TCAは、TCT、TCC、AGT、若しくはAGCで置換されていてもよく;AGTは、TCG、TCA、TCT、若しくはTCCで置換されていてもよく;AGCは、TCG、TCA、TCT、若しくはTCCで置換されいててもよく;CTGは、CTT、CTC、TTG若しくはTTAで置換されいててもよく;CTAは、CTT、CTC、TTG若しくはTTAで置換されていてもよく;TTGは、CTG、CTA、CTT若しくはCTCで置換されていてもよく;又はTTAは、CTG、CTA、CTT若しくはCTCで置換されていてもよい。好ましくは、1つ又は2つ以上の定義されたセンスコドン置換は、GCGからGCT又はGCC;GCAからGCT又はGCC;TCGからAGT又はAGC;TCAからAGT又はAGC;AGTからTCA又はTCT;AGCからTCG又はTCC又はTCA;TTGからCTT;及びTTAからCTCから選択される。より好ましくは、TCG及び/又はTCAは、AGC及び/又はAGTで置換されている。最も好ましくは、TCGはAGCで置換され、及び/又はTCAはAGTで置換されている。
一部の実施形態では、遺伝子は、翻訳及び/又は予測タンパク質産物の証拠が存在するものである。
好ましい実施形態では、遺伝子は必須遺伝子である。必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択されてもよい。
好ましくは、必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択されてもよい。
したがって、本発明は、TCGコドン及び/又はTCAコドンがない、1つ又は2つ以上の必須遺伝子を含むポリヌクレオチドを提供し、その1つ又は2つ以上の必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストから選択される。好ましくは、ポリヌクレオチドは、TCGコドン及び/又はTCAコドンがない、2つ若しくは3つ以上、3つ若しくは4つ以上、4つ若しくは5つ以上、5つ若しくは6つ以上、10個若しくは11個以上、20個若しくは21個以上、30個若しくは31個以上、40個若しくは41個以上、50個若しくは51個以上、100個若しくは101個以上、又は200個若しく201個以上の必須遺伝子を含む。
一部の実施形態では、ポリヌクレオチドは、配列番号1若しくは配列番号2に対して又は配列番号1若しくは配列番号2のいずれかの断片に対して少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、若しくは99.9%、又は100%同一であるポリヌクレオチド配列を含み、好ましくはその断片は、少なくとも10kb、20kb、50kb、100kb、又は500kbの長さである。
好ましくは、ポリヌクレオチドは生存可能である。すなわち、ポリヌクレオチドは、ゲノムが生存可能なゲノムであるようにゲノムに取り込まれ得る。好ましくは、ポリヌクレオチドは、親ゲノムの対応する領域を置換し、前記ゲノムの生存能を保持することができる。本明細書で使用される場合、「生存可能なゲノム」とは、細胞の生存能を引き起こし、及び/又は維持するのに十分な核酸配列を含有するゲノム、例えば、複製、転写、翻訳、エネルギー産生、輸送、膜及び細胞質成分の産生、並びに細胞分裂に必要とされる分子をコードするゲノムを指す。それ故、本発明はまた、本発明のポリヌクレオチドを含む生存可能な合成原核生物ゲノム(例えば、生存可能な合成大腸菌ゲノム)を提供する。
本発明は、配列番号1若しくは配列番号2に対して又は配列番号1若しくは配列番号2のいずれかの断片に対して少なくとも98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%又は100%同一であるポリヌクレオチドを提供し、好ましくはその断片は、少なくとも10kb、20kb、50kb、100kb、又は500kbの長さである。
宿主細胞及びその使用
宿主細胞
本発明はまた、本発明の合成原核生物ゲノム又はポリヌクレオチドを含む宿主細胞を提供する。宿主細胞は単離された宿主細胞であり得る。
本発明の宿主細胞は原核生物細胞である。より好ましくは、宿主細胞は細菌細胞である。好ましくは、細菌宿主細胞は、異種タンパク質産生、特に、1つ又は2つ以上の非タンパク質性アミノ酸(例えば、Ferrer-Miralles, N. and Villaverde, A., 2013. Microbial Cell Factories, 12:113に記載されているもの)を含むポリペプチドの産生に適している。適切な細菌宿主細胞としては、エシェリキア(例えば、大腸菌)、カウロバクテリア(例えば、カウロバクター・クレセンタス)、光合成細菌(例えば、ロドバクター・スフェロイデス)、低温適応型細菌(例えば、シュードアルテロモナス・ハロプランクティス、シェワネラ属種株Ac10)、シュードモナス(例えば、シュードモナス・フルオレッセンス、シュードモナス・プチダ、シュードモナス・エルギノーザ)、好塩性細菌(例えば、ハロモナス・エロンガタ、クロモハロバクター・サレキシゲンス)、ストレプトミセテス(例えば、ストレプトマイセス・リビダンス、ストレプトマイセス・グリゼウス)、ノカルディア(例えば、ノカルディア・ラクタムジュランス)、マイコバクテリア(例えば、マイコバクテリウム・スメグマティス)、コリネフォーム細菌(例えば、コリネバクテリウム・グルタミクム、コリネバクテリウム・アンモニアゲネス、ブレビバクテリウム・ラクトファーメンタム)、バシラス(例えば、バシラス・サチリス、バシラス・ブレビス、バシラス・メガテリウム、バシラス・リケニフォルミス、バシラス・アミロリケファシエンス)、及び乳酸菌(例えば、ラクトコッカス・ラクチス、ラクトバチルス・プランタルム、ラクトバチルス・カゼイ、ラクトバチルス・ロイテリ、ラクトバチルス・ガセリ)が挙げられる。一部の実施形態では、細菌宿主細胞はグラム陰性細菌である。
好ましくは、宿主細胞は、大腸菌、サルモネラ・エンテリカ、又は志賀赤痢菌である。より好ましくは、宿主細胞は大腸菌である。適切な大腸菌宿主細胞としては、MDS42、K-12、MG1655、BL21、BL21(DE3)、AD494、Origami、HMS174、BLR(DE3)、HMS174(DE3)、Tuner(DE3)、Origami2(DE3)、Rosetta2(DE3)、Lemo21(DE3)、NiCo21(DE3)、T7 Express、SHuffle Express、C41(DE3)、C43(DE3)、及びm15 pREP4又はそれらの誘導体が挙げられる(Rosano, G.L. and Ceccarelli, E.A., 2014. Frontiers in microbiology, 5, p.172)。最も好ましくは、宿主細胞は、MDS42、MG1655、若しくはBL21又はそれらの誘導体である。MG1655は大腸菌の野生型株と見なされる。この株のゲノム配列のジェンバンクIDは、U00096である。BL21は広範に市販されている。例えば、それは、カタログ番号C2530HでNew England BioLabs社から購入することができる。
宿主細胞は、好ましくは、合成原核生物ゲノム又はポリヌクレオチドが存在していたものからの(又は由来する)ものと同じであってもよい。例えば、合成原核生物ゲノムが合成大腸菌ゲノムである場合、宿主細胞は好ましくは大腸菌である。細胞の親ゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、宿主細胞は好ましくは同じ細胞であり、すなわち、好ましくは合成原核生物ゲノムを含む宿主細胞は親ゲノムの宿主細胞(親宿主細胞)と同じである。
宿主細胞は生存可能であり得る、すなわち、増殖及び複製することができる。
細胞のゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、好ましくは、親宿主細胞に存在する場合、増殖速度を実質的に減少させないものである。それ故、好ましくは、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較して増殖速度を実質的に減少させない。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞より4倍、3倍、2倍、又は約1.6倍未満遅い倍加時間を有する。倍加時間は、当業者に公知の任意の方法によって決定することができる。一部の実施形態では、倍加時間は、LB培地中で37℃、25℃又は42℃で決定される。
細胞のゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、好ましくは、親宿主細胞に存在する場合、あらゆる実質的な表現型の変化を引き起こさないものである。それ故、好ましくは、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較してあらゆる実質的な表現型の変化を有さない。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞より100%、50%、又は約20%未満長い平均細胞長を有する。例えば、細胞長は、約1.5~3ミクロンであってもよい。細胞長は当業者に公知の任意の方法によって決定することができる。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞のプロテオームと実質的に異ならないプロテオームを有する。プロテオームは、当業者に公知の任意の方法によって決定することができる。
代替のカノニカルアミノ酸への再割当
一部の実施形態では、1つ又は2つ以上のセンスコドン(すなわち、親ゲノムから除去されているもの)は、代替のカノニカルアミノ酸をコードするように再割当される。例えば、TCG及びTCAが除去されている場合、一方又は両方は、セリン以外のカノニカルアミノ酸(例えば、アラニン)をコードするように再割当され得る。
例えば、本発明の合成原核生物ゲノムは、1つ又は2つ以上のセンスコドンを実質的又は完全に欠いている。そのため、1つ又は2つ以上のtRNA又は終結因子は合成ゲノムから削除されてもよい。例えば、置換(又は削除)されている1つ又は2つ以上のセンスコドンを解読するtRNAは合成原核生物ゲノムから削除されてもよい。置換(又は削除)されている1つ又は2つ以上のセンスコドンを解読するtRNAは削除されてもよく、tRNAが、置換(又は削除)されている1つ又は2つ以上のセンスコドンのみを解読する場合、又は代替としてtRNAが、置換(又は削除)されている1つ若しくは2つ以上のセンスコドン及び置換(又は削除)されていない1つ若しくは2つ以上のセンスコドンを解読する場合、tRNAが、置換(又は削除)されていない1つ若しくは2つ以上のセンスコドンについて非必須である(すなわち、tRNAが解読する1つ若しくは残りのセンスコドンが1つ若しくは2つ以上の代替のtRNAによって解読される)場合、合成原核生物ゲノムは生存可能なままである。例えば、合成原核生物ゲノムがTCAセンスコドンを欠く場合、tRNASer UGAをコードするserTは削除されてもよく、及び/又は合成原核生物ゲノムがTCGセンスコドンを欠く場合、tRNASer CGAをコードするserUは削除されてもよい。1つ又は2つ以上のtRNAの削除は、例えば、再割当された内在性tRNA又は直交アミノアシル-tRNA合成酵素/tRNA対と組み合わせて使用されて、1つ又は2つ以上のセンスコドンを代替のアミノ酸へ再割当することができる。
例えば、TCG及びTCAが合成原核生物ゲノムから除去されている場合、tRNASer UGAをコードするserT、及びtRNASer CGAをコードするserUは、合成原核生物ゲノムから削除されてもよく、いずれかのtRNACGAを(例えばtRNAAla CGAに)再割当することができ、直交アミノアシル-tRNA合成酵素/tRNACGA対を(例えば、異種核酸によって又は合成原核生物ゲノムへの取り込みによって)宿主細胞に導入してTCGを代替のカノニカルアミノ酸へ再割当することができる。それ故、一部の実施形態では、本発明の宿主細胞は、1つ若しくは2つ以上の再割当されたtRNA及び/又は1つの直交アミノアシル-tRNA合成酵素(aaRS,aminoacyl-tRNA synthetase)-tRNA対をコードする1つ若しくは2つ以上の異種ヌクレオチド(例えばプラスミド)をさらに含む。一部の実施形態では、本発明の宿主細胞は、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードするプラスミドをさらに含む。あるいは、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対は、合成原核生物ゲノムへの取り込みによって宿主細胞に導入され得る。それ故、一部の実施形態では、合成原核生物ゲノムは直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードし、好ましくは天然tRNAをコードする遺伝子は親原核生物ゲノムから削除されている。好ましい実施形態では、本発明の宿主細胞は1つ又は2つ以上の再割当されたtRNAをさらに含む。tRNAを再割当するための方法は当業者に周知である。
代替のカノニカルアミノ酸をコードするための再割当はバイオセーフティーを増加させることができる。それ故、一部の実施形態では、本発明の宿主細胞はバイオセーフティーを増加させている。したがって、本発明はバイオセーフティーが改善された宿主細胞を提供する。
例えば、代替のカノニカルアミノ酸をコードするための再割当は、合成原核生物ゲノムを含む宿主細胞をバクテリオファージ感染に対して耐性にすることができる。1つ又は2つ以上のバクテリオファージ遺伝子は典型的に1つ又は2つ以上のセンスコドンを含むので、1つ又は2つ以上のバクテリオファージ遺伝子が翻訳される場合、代替のカノニカルアミノ酸は、対応するバクテリオファージタンパク質に取り込まれ得る。代替のカノニカルアミノ酸の取り込みは、前記タンパク質の活性を不安定化し、破壊し、又は低減させ得るので、バクテリオファージの感染性を低減させ、宿主細胞をバクテリオファージ感染に対して耐性にする。
それ故、一部の実施形態では、本発明の宿主細胞はファージ感染に対して耐性がある。例えば、細胞のゲノムが本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、親宿主細胞に存在する場合、ファージ感染に対する耐性を増加させるものであり得る。それ故、一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較してファージ耐性が増加している。
したがって、本発明は、ファージ耐性宿主細胞及びファージ耐性が増加している宿主細胞を提供する。
また、代替のカノニカルアミノ酸をコードするための再割当により、遺伝物質、例えば、抗生物質耐性遺伝子を、それらが野生型株ではなく、書き換えられた株において機能的であるように設計することを可能にすることができる。例えば、宿主細胞がある特定の条件(例えば、抗生物質の存在下)で増殖するが、他の宿主細胞(例えば、親宿主細胞)は増殖しないように、遺伝物質は、(例えば、異種核酸によって又は合成原核生物ゲノムへの取り込みによって)本発明の宿主細胞に取り込まれ得る。それ故、一部の実施形態では、本発明の宿主細胞は、宿主細胞を含む組成物を、他の宿主細胞(例えば、他の原核生物)による夾雑に対して、より耐性にすることができる。
非タンパク質性アミノ酸への再割当
一部の実施形態では、1つ又は2つ以上のセンスコドン(すなわち、親ゲノムから除去されたもの)は、非カノニカルアミノ酸(非タンパク質性アミノ酸)をコードするように再割当される。
それ故、本発明は、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための本発明による宿主細胞の使用を提供する。
本発明はまた、本発明による宿主細胞を使用することによって得られた又は得ることができるポリペプチドを提供する。一部の実施形態では、ポリペプチドは、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含む。それ故、本発明はまた、2つ又は3つ以上の非タンパク質性アミノ酸を含むポリペプチド及び3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを提供する。
本明細書で使用される場合、「非タンパク質性アミノ酸」(「非コードアミノ酸」又は「非カノニカルアミノ酸」としても知られている)は、天然にコードされていないか、又は遺伝コードに見出されないアミノ酸である。タンパク質を組み立てるための翻訳機構による22種のみのアミノ酸(タンパク質性アミノ酸、すなわち、標準的な遺伝コードの20種及び特別な翻訳機構によって取り込まれ得る追加の2種)の使用にもかかわらず、140種を超えるアミノ酸が、タンパク質中に天然に存在することが知られており、さらに数千種が天然に存在し得るか、又は実験室で合成され得る。それ故、非タンパク質性アミノ酸は、L-アラニン、L-システイン、L-アスパラギン酸、L-グルタミン酸、L-フェニルアラニン、グリシン、L-ヒスチジン、L-イソロイシン、L-リジン、L-ロイシン、L-メチオニン、L-アスパラギン、L-プロリン、L-グルタミン、L-アルギニン、L-セリン、L-トレオニン、L-バリン、L-トリプトファン及びL-チロシン、並びに任意にL-ピロリジン及びL-セレノシステインを除外する任意のアミノ酸を含み得る。
一部の実施形態では、非タンパク質性アミノ酸は非天然アミノ酸(UAA)である。
非タンパク質性アミノ酸又はUAAは特に限定されない。適切な非タンパク質性アミノ酸及びUAAは当業者に周知であり、例えば、Neumann, H., 2012. FEBS letters, 586(15), pp.2057-2064;及びLiu, C.C. and Schultz, P.G., 2010. Annual review of biochemistry, 79, pp.413-444に開示されているものがある。一部の実施形態では、非タンパク質性アミノ酸及び/又はUAAは、p-アセチルフェニルアラニン、m-アセチルフェニルアラニン、O-アリルチロシン、フェニルセレノシステイン、p-プロパルギルオキシフェニルアラニン、p-アジドフェニルアラニン、p-ボロノフェニルアラニン、O-メチルチロシン、p-アミノフェニルアラニン、p-シアノフェニルアラニン、m-シアノフェニルアラニン、p-フルオロフェニルアラニン、p-ヨードフェニルアラニン、p-ブロモフェニルアラニン、p-ニトロフェニルアラニン、L-DOPA、3-アミノチロシン、3-ヨードチロシン、p-イソプロピルフェニルアラニン、3-(2-ナフチル)アラニン、ビフェニルアラニン、ホモグルタミン、D-チロシン、p-ヒドロキシフェニル乳酸、2-アミノカプリル酸、ビピリジルアラニン、HQ-アラニン、p-ベンゾイルフェニルアラニン、o-ニトロベンジルシステイン、o-ニトロベンジルセリン、4,5-ジメトキシ-2-ニトロベンジルセリン、o-ニトロベンジルリジン、o-ニトロベンジルチロシン、2-ニトロフェニルアラニン、ダンシルアラニン、p-カルボキシメチルフェニルアラニン、3-ニトロチロシン、スルホチロシン、アセチルリジン、メチルヒスチジン、2-アミノノナン酸、2-アミノデカン酸、ピロリジン、Cbz-リジン、Boc-リジン及びアリルオキシカルボニルリジンのうちの1つ又は2つ以上から選択される。
原核生物、例えば大腸菌は典型的に、ユビキチン化、グリコシル化及びリン酸化などの、ほとんどの真核生物の翻訳後修飾を取り込むことができず、また、それらは典型的に、他の真核生物成熟プロセス、及びタンパク質分解性のタンパク質成熟を行うこともできない。さらに、正確なジスルフィド結合形成及びリポ多糖夾雑が厄介になる可能性がある(Ovaa, H., 2014. Frontiers in chemistry, 2, p.15を参照のこと)。しかしながら、抗体、酵素及びサイトカインなどの治療用タンパク質は、通常、翻訳後修飾及びジスルフィド結合を保ち、多くの場合、それらの正確に折り畳まれた状態を達成するためにタンパク質分解性成熟を必要とする。それ故、大多数の治療用タンパク質は真核生物及び哺乳動物細胞系において産生される。しかしながら、原核生物宿主細胞、例えば大腸菌における発現は、一般に安価で、遺伝子修飾を受けやすく、変異ライブラリー開発に関して用途が広く、工業規模の発酵に適している(Ovaa, H., 2014. Frontiers in chemistry, 2, p.15)。
それ故、一部の実施形態では、ポリペプチドは治療用ポリペプチドであり、好ましくは、哺乳動物のタンパク質修飾が1つ又は2つ以上の非タンパク質性アミノ酸によって導入されている。例えば、アンバーコドン抑制が、1つ又は2つ以上の非タンパク質性アミノ酸(すなわち、哺乳動物のタンパク質修飾)を治療用ポリペプチドに取り込むために以前に使用されている。本発明は2つ又は3つ以上の非タンパク質性アミノ酸を取り込むことを可能にする。それ故、本発明は、2つ又は3つ以上の非タンパク質性アミノ酸を含む治療用ポリペプチドを提供する。
本発明の合成原核生物ゲノムは1つ又は2つ以上のセンスコドンを実質的又は完全に欠いているので、1つ又は2つ以上のtRNA又は終結因子は合成ゲノムから削除されてもよい。例えば、置換(又は削除)されている1つ又は2つ以上のセンスコドンのみを解読するtRNAは合成原核生物ゲノムから削除されてもよい。例えば、合成原核生物ゲノムがTCAセンスコドンを欠く場合、tRNASer UGAをコードするsetTは削除されてもよく、及び/又は合成原核生物ゲノムがTCGセンスコドンを欠く場合、tRNASer CGAをコードするserUは削除されてもよい。次いで合成原核生物ゲノムが、非タンパク質性アミノ酸のタンパク質への取り込みを導くために(直交アミノアシル-tRNA合成酵素-tRNA対と併せて)使用されてもよい。
遺伝子コード拡張は、所望の遺伝子における望ましい部位に導入された割り当てられていないコドン(例えば、アンバー終止コドン、UAG)に応答して、非タンパク質性アミノ酸のタンパク質への取り込みを導くために直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対を使用する。直交合成酵素は内在性tRNAを認識せず、細胞に提供される(又は細胞によって合成される)非タンパク質性アミノ酸で直交コグネイトtRNA(内在性合成酵素の効果的な基質ではない)を特異的にアミノアシル化する(Chin, J.W., 2017. Nature, 550(7674), 53-60)。当業者は、適切な直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対を同定及び/又は生成することができる(例えば、Elliott, T. S. et al., 2014. Nat Biotechnol 32, 465-472; Elliott, T. S., et al., 2016. Cell Chem Biol 23, 805-815;及びKrogager, T. P. et al., 2018. Nat Biotechnol 36, 156-159)。それ故、一部の実施形態では、本発明の宿主細胞は、1つの直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードする1つ又は2つ以上の異種ヌクレオチド(例えば、プラスミド)をさらに含む。好ましい実施形態では、本発明の宿主細胞は、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードするプラスミドをさらに含む。あるいは、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対は、合成原核生物ゲノムへ取り込むことによって宿主細胞に導入され得る。それ故、一部の実施形態では、合成原核生物ゲノムは直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードし、好ましくは、天然tRNAをコードする遺伝子は親原核生物ゲノムから削除されている。
それ故、一部の実施形態では、本発明の宿主細胞は、前記センスコドンを含む1つ又は2つ以上の遺伝子を含む1つ又は2つ以上の異種ヌクレオチド(例えば、プラスミド)をさらに含む。好ましい実施形態では、宿主細胞は、前記センスコドンを含む遺伝子を含むプラスミドをさらに含む。1つ又は2つ以上のセンスコドンは遺伝子の望ましい部位に存在し得、好ましくは、その望ましい部位により、1つ又は2つ以上の非タンパク質性アミノ酸(すなわち、哺乳動物のタンパク質修飾)のポリペプチド、好ましくは治療用ポリペプチドへの取り込みが可能になる。
他の実施形態では、前記センスコドンは、合成原核生物ゲノムにおける1つ又は2つ以上の遺伝子に存在し得る(例えば、異種ヌクレオチドは合成原核生物ゲノムに取り込まれ得る)。1つ又は2つ以上のセンスコドンは遺伝子の望ましい部位に存在し得、好ましくは、その望ましい部位により、1つ又は2つ以上の非タンパク質性アミノ酸(すなわち、哺乳動物のタンパク質修飾)のポリペプチド、好ましくは治療用ポリペプチドへの取り込みが可能になる。
例えば、TCG及びTCAが合成原核生物ゲノムから除去されている場合、tRNASer UGAをコードするserT、及びtRNASer CGAをコードするserUは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACGA対が、1つ又は2つ以上の非タンパク質性アミノ酸を含むポリペプチドをコードするように、TCGコドンを含む(異種)遺伝子と組み合わせて使用されてもよい。それ故、本発明の宿主細胞は、例えば、(i)直交アミノアシル-tRNA合成酵素/tRNACGA対をコードするプラスミド;及び(ii)1つ又は2つ以上のTCGコドンを含む遺伝子を含むプラスミドをさらに含んでもよい。同様に、AGT及びAGCが除去される場合、tRNASer GCUをコードするserVは合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNAACU対及び/又は直交アミノアシル-tRNA合成酵素/tRNAGCU対が使用されてもよい。同様に、CTG及びCTAが除去される場合、tRNALeu CAGをコードするleuP、Q、T、V、及びtRNALeu UAGをコードするleuWは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACAG対が使用されてもよい。同様に、TTG及びTTAが除去される場合、tRNALeu CAAをコードするleuX、及びtRNALeu UAAをコードするleuZは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACAA対及び/又は直交アミノアシル-tRNA合成酵素/tRNAUAA対が使用されてもよい。同様に、GCG及びGCAが除去される場合、tRNAAla UGCをコードするalaT、U、Vは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACGC対が使用されてもよい。
一部の実施形態では、合成原核生物ゲノムは終結因子(例えば、RF1)をコードする遺伝子を欠き、及び/又は宿主細胞は非タンパク質性アミノ酸の組み込みの効率を増加させるために終結因子(例えば、RF1)を欠く。
合成ゲノムを産生するための方法
一態様では、本発明は、合成ゲノムを産生するための方法であって、
(a)親ゲノムを準備するステップと、
(b)親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
(c)2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含む方法を提供する。
組換えを介した遺伝子改変
好ましくは、組換えを介した遺伝子改変の1回又は2回以上のラウンドが、2つ又は3つ以上の異なる部分的合成ゲノムを提供するために、親ゲノムの10~1000kb、50~1000kb、100~1000kb、又は100~500kbを編集するために使用される。それ故、好ましい実施形態では、組換えを介した遺伝子改変の各ラウンドにより、親ゲノムのDNAの10kb若しくはそれ以上、50kb若しくはそれ以上、100kb若しくはそれ以上、又は約100kbが挿入又は置換されている。
本明細書で使用される場合、「組換えを介した遺伝子改変」(「リコンビニアリング」としても知られている)という用語は、相同組換え系に基づく遺伝子改変(すなわち、ゲノム編集)のための方法である。典型的に、リコンビニアリングは、バクテリオファージタンパク質である、Racプロファージ由来のRecE/RecT又はバクテリオファージラムダ由来のレッドαβδによって媒介される大腸菌における相同組換えに基づく。組換えを介した遺伝子改変の任意の適切な方法が使用されてもよい。組換えを介した遺伝子改変のための方法は当業者に周知である。
「古典的組換え」(大腸菌におけるラムダレッドを介した組換えによって例示される)では、合成DNAの短い領域がゲノムに挿入され得るか、又は2段階プロセス:i)合成DNAのストレッチを保ち、陽性選択マーカーと連結し、ゲノムの標的領域の各末端に相同領域(HR)が隣接した直鎖状二本鎖DNA(dsDNA)による細胞の形質転換、及び(ii)相同領域によって媒介される組換え、その後の陽性選択マーカーによるゲノム組み込みについての選択においてゲノムDNAを置換するために使用され得る。このアプローチは、ゲノムDNAの2~3kbを挿入又は置換するために使用され得る。それ故、古典的組換えが使用される場合、多くのラウンドの組換えを介した遺伝子改変が親ゲノムの100~500kbを編集するために必要とされる。
それ故、好ましい実施形態では、組換えを介した遺伝子改変の1回又は2回以上のラウンドは、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER)の1回又は2回以上のラウンドを含む。
REXERは、国際公開第2018/020248号パンフレット(参照により本明細書に組み込まれる)に記載されている。REXERの各ラウンドは、親ゲノムのDNAの約50kb~250kb、又は約100kbを挿入又は置換するために使用され得る。
それ故、組換えを介した遺伝子改変の1回又は2回以上のラウンドは、
i)宿主細胞(例えば、大腸菌)を準備するステップであって、その宿主細胞はエピソームレプリコン(例えば、プラスミド又は細菌人工染色体)及び標的核酸(例えば、ゲノム)を含み、そのエピソームレプリコンはドナー核酸配列(すなわち、合成領域)を含み、そのドナー核酸配列は順番に、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を含み、その所望の配列は陽性選択可能マーカーを含み、その標的核酸は順番に、5’-相同組換え配列1-陰性選択可能マーカー-相同組換え配列2-3’を含む、ステップ、
ii)前記宿主細胞における核酸組換えを支持することができるヘルパータンパク質(例えば、ラムダレッドタンパク質)を準備するステップ、
iii)前記宿主細胞における核酸切除を支持することができるヘルパータンパク質及び/又はRNA(例えば、CRISPR/Cas9タンパク質/RNA)を準備するステップ、
iv)前記ドナー核酸配列の切除を誘導するステップ、
v)切除されたドナー核酸と前記標的核酸との間の組換えを可能にするようにインキュベートするステップ、並びに
vi)前記ドナー核酸を前記標的核酸へ取り込んだ組換え体を選択するステップ
を含んでもよい。
適切には、前記ドナー核酸を前記標的核酸へ取り込んだ組換え体を選択するステップは、ドナー核酸の陽性選択可能マーカーの獲得及び標的核酸の陰性選択可能マーカーの喪失の選択を含む。適切には、ドナー核酸の陽性選択可能マーカーの獲得及び標的核酸の陰性選択可能マーカーの喪失の選択は同時に実行される。適切には、前記所望の配列は陽性選択可能マーカー及び陰性選択可能マーカーの両方を含む。適切には、陰性選択可能マーカーは、sacB(スクロース感受性)、rpsL(S12リボソームタンパク質-ストレプトマイシン感受性)、又はpheST251A_A294G(4-クロロフェニルアラニン感受性)からなる群から選択される。適切には、陽性選択可能マーカーは、Cm(クロラムフェニコール耐性)、Kan(カナマイシン耐性)、Hyg(ハイグロマイシン耐性)、ゲンタマイシン(ゲンタマイシン耐性)、又はテトラサイクリン(テトラサイクリン耐性)からなる群から選択される。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの連続選択、又は前記陰性及び陽性マーカーの連続選択を含む。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの同時選択を含む。
適切には、上記の前記方法は、標的核酸配列における少なくとも1つの二本鎖切断を誘導するステップであって、前記二本鎖切断は、前記相同組換え配列1と前記相同組換え配列2との間である、ステップをさらに含む。適切には、少なくとも2つの二本鎖切断は標的核酸配列において誘導され、各々の前記二本鎖切断は、前記相同組換え配列1と前記相同組換え配列2との間である。
適切には、前記切除されたドナー核酸は、前記相同組換え配列1から開始し、前記相同組換え配列2で終了する。
適切には、前記エピソームレプリコンはドナー核酸配列と独立した陰性選択可能マーカーを含む。適切には、前記方法は、ドナー核酸配列と独立した前記陰性選択可能マーカーの喪失を選択することによってエピソームレプリコンの喪失を選択するさらなるステップを含む。適切には、前記エピソームレプリコンは順番に、切除切断部位1-ドナー核酸配列-切除切断部位2を含む。適切には、前記標的核酸は、前記宿主細胞内で機能することができるその独自の複製起点を所有する。適切には、前記エピソームレプリコンはプラスミド核酸である。適切には、前記エピソームレプリコンは細菌人工染色体(BAC,bacterial artificial chromosome)である。適切には、前記標的核酸は宿主細胞ゲノムである。
エピソームレプリコン(例えば、BAC)は、例えば、Kouprina, N., et al., 2004. Methods Mol Biol 255, 69-89に記載されているように、S.セレビシエにおいて相同組換えによって組み立てられ得る。アセンブリは、合成DNAの7~14個のストレッチ、各々6~13kbの長さ;選択コンストラクト(陰性選択マーカー及び/又は陽性選択マーカーを含む);及びBACシャトルベクター骨格を組み合わせることができる。合成DNAのストレッチは、エピソームレプリコンにおけるドナー核酸配列(すなわち、合成領域)に全体的に対応し得、各ストレッチは80~200bpの互いに重複しているDNA配列を含み、重複領域は書き換えられている標的を1つも含まない。ストレッチは、適切な制限部位(例えば、BsaI、AvrII、SpeI、又はXbaI)が隣接したpSC101又はpSTベクターに供給され得る。それ故、アセンブリの間、合成DNAストレッチは、対応する制限酵素での消化によって切除され得る。エピソームレプリコンのアセンブリは配列決定によって検証され得る。
適切には、2つの相同領域は、30~100bp、又は40~50bp、又は約50bpの長さであってもよい。
CRISPR/Cas9機構が切除のために使用されてもよい。一部の実施形態では、CRISPR/Cas9機構は、Cas9、tracrRNA及び2つのスペーサーRNAを含み、そのスペーサーRNAは切除のための2つの相同領域を標的とする。好ましい実施形態では、スペーサーRNAは直鎖状二本鎖スペーサーである。他の実施形態では、CRISPR/Cas9機構はCas9及び2つのsgRNAを含み、そのsgRNAは切除のための2つの相同領域を標的とする。
ラムダレッド組換え機構が組換えのために使用されてもよい。ラムダレッド組換え機構はラムダアルファ/ベータ/ガンマを含んでもよい。
方法は、REXERの1回又は2回以上のラウンドを実施するステップ、すなわち、第1のドナー核酸配列を用いた上記のステップ、前記第1のドナー核酸配列と連続するさらなるドナー配列を選択するステップ、及び部分的合成ゲノムが組み立てられるまで前記さらなるドナー核酸配列を用いて前記ステップを反復するステップを含んでもよい。これは、Wang, K. et al., 2016. Nature 539, 59-64に記載されている、ゲノム段階交換合成(GENESIS)として知られており、図4に概略的に示される。
好ましい実施形態では、ドナー配列は、本発明による合成ゲノムの領域及び/又は本発明によるポリヌクレオチドに対応する。
それ故、ドナー配列(すなわち、合成領域)は、1つ若しくは2つ以上のセンスコドンの20個若しくは19個以下の出現を含んでもよく、及び/又はドナー配列は、1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を含んでもよい。
ドナー配列(すなわち、合成領域)は、それらが、1つ若しくは2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有すること、及び/又は親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ若しくは2つ以上のセンスコドンの各々の出現を含むこと、及び/又は1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を含むことを除いて親ゲノムの配列(すなわち、非合成領域)と同一であってもよい。
ドナー配列(すなわち、合成領域)はまた、親ゲノムの配列(すなわち、非合成領域)に対してリファクタリングされてもよい。3’、3’重複(すなわち、逆向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。3’、3’重複に関して、合成挿入物は重複する領域を含んでもよい。5’、3’重複(すなわち、同じ向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。5’、3’重複に関して、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から、約20~200bp、又は20~100bp、又は20~50bp;及び(iii)重複する領域を含んでもよい。好ましくは、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から約20bp;及び(iii)重複する領域を含む。好ましい実施形態では、終止コドンは下流の遺伝子について元の開始部位とインフレームである。好ましくは、終止コドンはTAAである。
好ましくは、ドナー配列(すなわち、合成領域)は、合計で50~10000kb、100~5000kb、100~2000kb、100~1000kb、又は100~500kbのサイズである。好ましくは、各ドナー配列は、50~300kb、100~200kb、又は約100kbのサイズである。
したがって、ドナー配列は、それらが、1つ又は2つ以上のセンスコドンの出現を含まないこと、及び親ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する全ての遺伝子対がリファクタリングされることを除いて、各々約100kbのサイズであってもよく、親ゲノムの対応する配列と同一であってもよく、遺伝子対は、センスコドン置換が遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである。
好ましい実施形態では、ゲノムの生存能は組換えを介した遺伝子改変の各ラウンド後に試験される。一部の実施形態では、ゲノムの配列は組換えを介した遺伝子改変の各ラウンド後に検証される。
部分的合成ゲノム
本発明は、2つ又は3つ以上の異なる部分的合成ゲノムを提供する。
本明細書で使用される場合、「部分的合成ゲノム」は、親ゲノムの1つ又は2つ以上の連続する領域が編集されているゲノム(すなわち、部分的合成ゲノムが1つ又は2つ以上の合成領域を含む)であり、1つ又は2つ以上の連続する(合成)領域は親ゲノムの全体を占めない。好ましくは、本発明の部分的合成ゲノムは1つの連続する(合成)領域を有する。対照的に、「合成ゲノム」は親ゲノムの実質的に全てを占めるゲノム編集を含んでもよい。
本発明の部分的合成ゲノムは原核生物ゲノムであってもよい。好ましくは、本発明の部分的合成ゲノムは細菌ゲノムである。より好ましくは、本発明の部分的合成ゲノムは、大腸菌、サルモネラ・エンテリカ、又は志賀赤痢菌ゲノムである。最も好ましくは、本発明の部分的合成ゲノムは大腸菌ゲノムである。一部の実施形態では、部分的合成ゲノムは少ない又は最小の部分的合成ゲノムである。好ましい実施形態では、部分的合成ゲノムは生存可能なゲノムである。
一部の実施形態では、本発明の部分的合成ゲノムは、100kb~20Mb、又は130kb~15Mb、又は200kb~15Mb、又は300kb~15Mb、又は500kb~15Mb、又は1Mb~15Mb、又は1Mb~10Mb、又は1Mb~8Mb、又は1Mb~6Mb、又は2Mb~6Mb、又は2Mb~5Mb、又は3Mb~5Mb、又は約4Mbのサイズである。
部分的合成ゲノムは、1つ又は2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する合成領域を含んでもよいか、又は部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの各々の出現を有する合成領域を含んでもよい。
好ましくは、合成領域は、50~10000kb、100~5000kb、又は100~500kbのサイズである。
それ故、部分的合成ゲノムは、1つ若しくは2つ以上のセンスコドンの各々の10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する100~5000kbの1つ又は2つ以上の連続する領域を含んでもよく、及び/又は部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ若しくは2つ以上のセンスコドンの各々の出現を有する100~5000kbの1つ若しくは2つ以上の連続する領域を含んでもよく、及び/又は部分的合成ゲノムは、1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を有する100~5000kbの1つ若しくは2つ以上の連続する領域を含んでもよい。
部分的合成ゲノムの残り(すなわち、非合成領域)は、変更していないセンスコドンを有してもよい。それ故、部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、100%若しくは99%の各々のセンスコドンの出現を有する1つ若しくは2つ以上の非合成領域を含んでもよく、及び/又は部分的合成ゲノムは、各センスコドンの出現を有する100個若しくは101個以上の遺伝子を有する1つ若しくは2つ以上の非合成領域を含んでもよい。非合成領域は、500kb~20Mb、又は500kb~10Mb、又は500kb~5Mb、又は約3.5Mbのサイズであってもよい。
例えば、部分的合成ゲノムは、1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を有する100~5000kbの1つの連続する領域(すなわち、合成領域)及び各センスコドンの出現を有する100個若しくは101個以上の遺伝子を有する500kb~10000kbの1つの連続する領域(すなわち、非合成領域)を含んでもよい。
2つ又は3つ以上の異なる部分的合成ゲノムは同じ親ゲノムに由来してもよく、すなわち、実質的に同じ配列を含んでもよく、例えば、2つ又は3つ以上の異なる部分的合成ゲノムは、90%、95%、99%、又は99.5%の配列同一性を共有してもよい。
2つ又は3つ以上の異なる部分的合成ゲノムは、合成領域が親ゲノムの90%若しくはそれ以上、95%若しくはそれ以上、99%若しくはそれ以上又は100%を合計で占めるように1つ又は2つ以上の合成領域を含んでもよい。好ましくは、2つ又は3つ以上の異なる部分的合成ゲノムの各々は1つ又は2つ以上の合成領域を含み、その合成領域は実質的に重複しない(例えば、合成領域間の重複は10kb又はそれ未満、好ましくは約3~4kbである)。それ故、2つ又は3つ以上の異なる部分的合成ゲノムの各々は、1つの特有又は実質的に特有の合成領域を含んでもよい。
それ故、好ましい実施形態では、2つ又は3つ以上の異なる部分的合成ゲノムの各々は、1つ又は2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を有する100~5000kbの1つの連続する合成領域及び各センスコドンの出現を有する100個又は101個以上の遺伝子を有する500kb~10000kbの1つの非合成の連続する領域を含み、その合成領域は合計で親ゲノムの実質的に全てを占め、その合成領域は実質的に重複しない。
2つ又は3つ以上の異なる部分的合成ゲノムは誘導コンジュゲーションに適切であり得る。それ故、好ましい実施形態では、2つ又は3つ以上の異なる部分的合成ゲノムは、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを含む。本発明の方法は、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを提供するために、組換えを介した遺伝子改変、好ましくはラムダレッドを介した遺伝子改変(誘導コンジュゲーションの前)の1回又は2回以上のラウンドのさらなるステップを含んでもよい。方法は、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムについての選択の1回又は2回以上のラウンドをさらに含んでもよい。
少なくとも1つの部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含んでもよく、少なくとも1つの部分的合成レシピエントゲノムは、2つの対応する相同領域が隣接した第2の選択可能マーカーを含んでもよく、第1の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び/又は第2の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。
適切には、陰性選択可能マーカーは、sacB(スクロース感受性)、rpsL(S12リボソームタンパク質-ストレプトマイシン感受性)、又はpheST251A_A294G(4-クロロフェニルアラニン感受性)からなる群から選択される。適切には、陽性選択可能マーカーは、Cm(クロラムフェニコール耐性)、Kan(カナマイシン耐性)、Hyg(ハイグロマイシン耐性)、ゲンタマイシン(ゲンタマイシン耐性)、又はテトラサイクリン(テトラサイクリン耐性)からなる群から選択される。選択可能マーカーは、組換えを介した遺伝子改変の1つ又は2つ以上のステップにおけるものと異なってもよい。
好ましくは、少なくとも1つの部分的合成レシピエントゲノムに存在する合成領域は、相同領域が隣接した領域の外側にある、すなわち、合成領域は実質的に重複しない。好ましくは、相同領域は、3kb~500kbの長さ、最も好ましくは約3~5kbである。
誘導コンジュゲーション
誘導コンジュゲーションの1回又は2回以上のラウンドは、合成ゲノムを産生するために本発明の2つ又は3つ以上の異なる部分的合成ゲノムに対して実行されてもよい。
誘導コンジュゲーションの各ラウンドは、より大きな連続する合成領域を有する部分的合成ゲノムを提供するために使用され得る。例えば、組換えを介した遺伝子改変の1回又は2回以上のラウンド後、各々が約500kbの連続する合成領域を有する、8つの部分的合成ゲノムが存在し得る。誘導コンジュゲーションの1回目のラウンド後、部分的合成ゲノムの2つは、各々が約500kbの連続する合成領域を有する6つの部分的合成ゲノム、及び約1Mbの連続する合成領域を有する1つの部分的合成ゲノムを提供するために組み合わされてもよい。2回目のラウンドは、各々が約500kbの連続する合成領域を有する5つの部分的合成ゲノム、及び約1.5Mbの連続する合成領域を有する1つの部分的合成ゲノム;又は各々が約500kbの連続する合成領域を有する4つの部分的合成ゲノム、及び各々が約1Mbの連続する合成領域を有する2つの部分的合成ゲノムを提供することができる。誘導コンジュゲーションの数回のラウンドの後、完全な合成ゲノム(すなわち、約4Mbの連続する合成領域を有するもの)が提供され得る。例を図10及び11bに概略的に示す。
誘導コンジュゲーションの任意の適切な方法が使用されてもよい。誘導コンジュゲーションの方法は当業者に周知であり、例えば、Ma, N.J., Moonan, D.W. and Isaacs, F.J., 2014. Nature Protocols, 9(10), p.2285に記載されている。合成ゲノムへの経路は限定されない。
それ故、誘導コンジュゲーションの1回又は2回以上のラウンドは、
i)部分的合成レシピエントゲノムを含む第1の宿主細胞、並びに部分的合成ドナーゲノム及びコンジュゲートプラスミドを含む第2の宿主細胞を準備するステップ、
ii)部分的合成レシピエントゲノム及び部分的合成ドナーゲノムのコンジュゲーションのステップ、並びに
iii)ドナーゲノムの合成領域が部分的合成レシピエントゲノムに取り込まれている組換え体を選択するステップ
を含んでもよい。
部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含んでもよく、部分的合成レシピエントゲノムは、2つの対応する相同領域が隣接した第2の選択可能マーカーを含んでもよく、第1の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び/又は第2の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。それ故、ステップ(iii)は、前記選択可能マーカーの選択、すなわち、第1の選択可能マーカーの獲得及び第2の選択可能マーカーの喪失の選択を含んでもよい。
適切には、陰性選択可能マーカーは、sacB(スクロース感受性)、rpsL(S12リボソームタンパク質-ストレプトマイシン感受性)、又はpheST251A_A294G(4-クロロフェニルアラニン感受性)からなる群から選択される。適切には、陽性選択可能マーカーは、Cm(クロラムフェニコール耐性)、Kan(カナマイシン耐性)、Hyg(ハイグロマイシン耐性)、ゲンタマイシン(ゲンタマイシン耐性)、又はテトラサイクリン(テトラサイクリン耐性)からなる群から選択される。選択可能マーカーは、組換えを介した遺伝子改変の1つ又は2つ以上のステップにおけるものと異なっていてもよい。
好ましくは、相同領域は、3kb~500kbの長さ、最も好ましくは約3~5kbである。好ましくは、誘導コンジュゲーションのステップが誘導コンジュゲーションの最後のステップである場合、相同領域は50kb~500kbである。
ステップ(ii)は、第1の宿主細胞及び第2の宿主細胞をインキュベートするステップを含んでもよい。例えば、第1の宿主細胞及び第2の宿主細胞は、混合され、適切な培地(例えば、寒天プレート)に移され、約37℃で約1~3時間、インキュベートされてもよい。
コンジュゲートプラスミドはFプラスミドであってもよく、好ましくはコンジュゲートプラスミドは伝達起点を含まない。(例えば、図22c)。
好ましい実施形態では、ゲノムの生存能は誘導コンジュゲーションの各ラウンドの後に試験される。有利には、これは、ゲノム編集(例えば、センスコドン置換)が生存可能なゲノムをもたらすことを検証し、許可されていない編集を修正することを可能にする。一部の実施形態では、ゲノムの配列は誘導コンジュゲーションの各ラウンドの後に検証される。
当業者は、開示されるように本発明の範囲から逸脱せずに本明細書に開示される本発明の全ての特徴を組み合わせることができることを理解するであろう。
本発明の好ましい特徴及び実施形態はここで非限定的な例として記載される。
本発明の実施は、他に示されない限り、化学、生化学、分子生物学、微生物学及び免疫学の従来の技術を利用し、それらは当業者の能力の範囲内である。そのような技術は文献に説明されている。例えば、Sambrook, J., Fritsch, E.F. and Maniatis, T. (1989) Molecular Cloning: A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press; Ausubel, F.M. et al. (1995 and periodic supplements) Current Protocols in Molecular Biology, Ch. 9, 13 and 16, John Wiley & Sons; Roe, B., Crabtree, J. and Kahn, A. (1996) DNA Isolation and Sequencing: Essential Techniques, John Wiley & Sons; Polak, J.M. and McGee, J.O’D. (1990) In Situ Hybridization: Principles and Practice, Oxford University Press; Gait, M.J. (1984) Oligonucleotide Synthesis: A Practical Approach, IRL Press;及びLilley, D.M. and Dahlberg, J.E. (1992) Methods in Enzymology: DNA Structures Part A: Synthesis and Physical Analysis of DNA, Academic Pressを参照のこと。
[実施例]
同義コドン圧縮を用いたゲノムの設計
本発明者らは最初に、オープンリーディングフレーム(ORF)におけるセリンコドンTCG及びTCA並びに終止コドンTAGが、それらの同義AGC、AGT、及びTAAでそれぞれ体系的に置換されている、大腸菌MDS42ゲノム(Uniprot受託番号AP012306.1)の型を設計した(図1a、図18、配列番号1)。本発明者らは、同義コドン圧縮のためのこの定義された書き換えスキームが、必須遺伝子が豊富な大腸菌ゲノムの20kb領域で可能であることを以前に示した(Wang, K. et al., 2016. Nature 539, 59-64)。しかしながら、この領域は、ゲノム内の標的コドンの0.46%しか占めていない。
大腸菌は多数の重複するオープンリーディングフレーム(ORF)を含有し、本発明者らは、重複を、3’、3’(逆向きのORFの間)又は5’、3’(同じ向きのORFの間)に分類する。標的化されたコドンは重複の両方のクラス内に見出される。3’、3’重複内の各ORFの書き換えが、いずれかのORFのコードされたタンパク質配列を変化させずに、すなわち、同義コドンを導入することによって達成され得る場合、重複構造は維持され、配列は直接書き換えられた。しかしながら、これが不可能であった場合、本発明者らは、重複する領域を複製し、各ORFを個々に書き換えた(図1b、表1)。
5’、3’重複に関して、本発明者らは、ORFの間の重複の領域及び重複の上流の20bp配列の両方を複製することによってORFを分離した。このリファクタリングにより、本発明者らは、各ORFを独立して書き換えることが可能になる(図1c、表1)。本発明者らのストラテジーは、下流ORFについてのRBSの配列及びこのRBSとその開始コドンとの間の距離を保存する。
同義コドン圧縮についての定義された規則及びリファクタリングを使用して、本発明者らは、18,218個の全ての標的コドンがそれらの標的同義語に書き換えられるゲノムを設計した(図1d)。
Figure 2022533040000005
Figure 2022533040000006
Figure 2022533040000007
書き換えられた区画の合成
本発明者らは、設計されたゲノム上で、小分子への合成経路を設計するために一般的に使用されるものと同様の逆合成を実施した(図2)。本発明者らは、ゲノムを、8つの区画である、およそ0.5MbのA~Hに切断し(図1d、図2a、図18、配列番号1)、次いで各区画を4~5つの断片に切断した(図2b)。これにより、91kb~136kbの37個の断片を得た(図1d、表2)。本発明者らは、非必須遺伝子間の遺伝子間領域において、断片の間、及び区画の間に境界を配置した。断片を、およそ10kbの9~14個のストレッチにさらに切断した(図2c、表2)。
本発明者らは、S.セレビシエにおける相同組換えにより各断片を含有するREXERのためのBAC(図2c、図20)を組み立てた(Wang, K. et al., 2016. Nature 539, 59-64;及びKouprina, N., et al., 2004. Methods Mol Biol 255, 69-89)。断片の36については、BACアセンブリは円滑に進行した(表3)。断片37は組み立てるのが困難であったので、本発明者らは、2つの50kbの断片にそれを分割し(37a及び37b)、組み立てるために真っすぐにした(表3)。
本発明者らは、REXERにより、7つの異なる株においてゲノム置換を開始した。各株のREXERについての開始点は、区画A、C、D、E、F、G又はHの始まりに対応し(図1d、2b、図3)、区画Bは、以下に記載されるように、後で区画Aに設けた。本発明者らは、陽性及び陰性選択マーカーを担持するカセットを導入することによって各株におけるゲノム置換の開始点をマークした。本発明者らは、Cas9(Jiang, W., et al., 2013. Nat Biotechnol 31, 233-239)、ラムダレッド組換え機構(Datsenko, K. A. & Wanner, B. L., 2000. Proc Natl Acad Sci USA 97, 6640-6645)、及び各区画について関連する株へ最初に書き換えられた断片を含有するBACを導入し、関連するCas9スペーサー(Jiang, W., et al., 2013. Nat Biotechnol 31, 233-239)をコードするDNAの細胞への付加によってゲノムDNAの置換を開始した。BACからの書き換えられたDNAのCas9を介した切除及びこのDNAのゲノムへのラムダレッドを介した組換えにより、書き換えられたDNAでのゲノムDNAの区画の置換、ゲノムからの陽性及び陰性選択マーカーの除去、並びに新たな直交の陽性及び陰性選択マーカーの導入が生じた。標的領域にわたって組み換えられたクローンを、ゲノムから陰性選択マーカーが喪失したこと、及びBACから陽性選択マーカーを獲得したことに基づいて選択した。
各株において、最初のREXERにおいて導入される陽性及び陰性選択マーカーは、次のラウンドのREXERについての鋳型を提供し、ゲノム段階の交換合成(GENESIS)を可能にする(図2b、図4)。本発明者らは、初期のラウンドのREXERについてスペーサーをコードしたプラスミドを使用した(表4、図20d、図21)。しかしながら、本発明者らは、その後、REXERが、PCRによって生成した直鎖状二本鎖スペーサーのエレクトロポレーションによって開始され得ることを見出した(表4、図21a)。これらのスペーサーは細胞分裂を介して伝播しないので、これにより、REXERの1つのステップからの細胞を、REXERの次のステップのためにより迅速に使用することが可能になった。この進歩はGENESISを加速させた。区画A、C、D、E、F、及びGについて、本発明者らが、およそ0.5MbのゲノムDNAを合成DNAで置換するまで、本発明者らは、REXERの4~5つのステップについて時計回りの方向にGENESISを進行させた。区画Aを最初に開始し、他の区画の前に完了したので、本発明者らは、区画Aの終わりに達すると、区画Bを介してGENESISを進行した。
各REXER後、本発明者らは得られたゲノムの配列を決定して、ゲノムの標的化された領域にわたって完全に書き換えられた細胞を同定した(表4)。並行して、本発明者らは、多数の単一ステップのREXER(表4)を実行して、書き換えることが困難であり得るゲノムの100kb領域を迅速に同定し、その後、本発明者らはGENESISを介してそれらに達した。区画A、C、D、E、F及びGの全てを含む、38ステップのうちの35について、本発明者らは、GENESISによって標的化されたゲノム配列を完全に書き換えることができた。本発明者らは、区画Bにおける断片9について、並びに区画Hにおける断片37a及び1について合成DNAによる対応するゲノム領域の不完全な置換のみを観察した(表4)。
Figure 2022533040000008
Figure 2022533040000009
Figure 2022533040000010
Figure 2022533040000011
Figure 2022533040000012
Figure 2022533040000013
設計上の欠陥の同定及び修復
REXER後にいくつかのクローンを配列決定することにより、本発明者らは、各標的コドンが書き換えられる頻度をスコア付けし、それによってゲノム領域についての書き換えランドスケープを集約することが可能になる。断片1での書き換えランドスケープから、本発明者らは、本発明者らの定義したスキームにより書き換え難いような、メチオニンアミノペプチダーゼをコードする必須遺伝子である、mapにおける4番目のコドン(Ser4、TCA)を直接同定した(図5a)。本発明者らはまた、必須遺伝子ftsI及びmurEの14bpの重複、並びにftsI及びmurEにおけるいくつかのセリンコドンを包含する第2の領域を同定し、これは、本発明者らの書き換えられ、リファクタリングされた配列によって置換されていなかった。本発明者らは、この領域を同じ書き換えスキームで以前に書き換えたので、ここで使用した20bpではなく重複に182bpを加えたものを複製した場合(Wang, K. et al., 2016. Nature 539, 59-64)(図1c)、本発明者らは、この領域についての合成DNAの不具合が、その書き換えにおいてではなく、そのリファクタリングにおいてであると結論付けている。拡張したリファクタリング(図5b)及びmapにおけるSer4でのTCAからTCTの変異(図5c、表5)の両方を含有した、新たな断片1のBACを用いたREXERにより、ゲノムの標的化した100kb領域の完全な書き換えが可能になった(図5d)。
断片9についてのREXER後の書き換えランドスケープから、本発明者らは、書き換えられていなかった26kbのゲノム領域を同定した(図6)。書き換えられた断片9を含有するBACの存在下で、この領域内及び周囲のゲノムの10kb領域を削除する試みにより、ゲノムの10kbに書き換えることが困難であった領域を絞り込んだ。10kbのゲノム領域にわたるREXERにより、yceQにおいて得られた書き換えランドスケープ内の最小値が明らかになった。これにより、yceQ内の5つの標的コドンを書き換えることが問題であると同定された。同様に、断片37aでのREXER後の書き換えランドスケープ、その後のさらなる配列決定により、本発明者らは、書き換えられていなかった、yaaYの3’末端における単一コドンを同定することができた(図7)。
yceQ及びyaaYの両方は「予測タンパク質」をコードし、yceQにおける複数の挿入物は生存可能であり、これらの予測遺伝子からのmRNA産生及び/又はタンパク質合成の証拠は存在しない(Pundir, S., et al., 2017. Methods Mol Biol 1558, 41-55)。特に、yceQ及びyaaY内で書き換え難いコドンの全ては、必須遺伝子の5’非翻訳領域(UTR,untranslated region)内にある。本発明者らは、yceQ及びyaaYを書き換えることによって導入された配列変化が、隣接する必須遺伝子の調節に悪影響を及ぼすことを示唆している。実際に、yceQにおける標的コドンを、RNA二次構造及びrne(必須リボヌクレアーゼRNase Eをコードする)の5’UTR内のプロモーターエレメントにマッピングし(図8)、これらの配列はRNAse E恒常性を制御するのに不可欠である(Schuck, A., et al. 2009. Mol Microbiol 72, 470-478)。
本発明者らは、yceQの5’配列に終止コドンを導入することによって断片9を修正し、これにより、いずれかの潜在的な翻訳を最小限に抑えるが、rne転写を調節するための天然配列を保持する(図6、表5)。この新たなBACでのREXERにより、対応する100kbのゲノム領域が完全に書き換えられた(図6、表5)。yaaYにおける問題のあるコドンにてTCAからAGCへ置き換えた断片37aを含有する、新たなBACでのREXERにより、ゲノムの対応する領域が完全に書き換えられた(図7、表5)。
全ての最初に問題となった配列を特定し、修正することにより、本発明者らは、区画A及びBが完全に書き換えられる株のアセンブリ(図9)、及び区画Hが完全に書き換えられる株のアセンブリ(表5、図9)を完了した。これにより、7つの異なる株において全ての区画のアセンブリを完了した。
Figure 2022533040000014
Figure 2022533040000015
書き換えられたゲノムのアセンブリ
本発明者らは、書き換えられた区画を単一ゲノムに組み立てるためにコンジュゲーションベースのストラテジーを開発した(Isaacs, F. J. et al., 2011. Science 333, 348-353; Ma, N. J., et al., 2014. Nat Protoc 9, 2285-2300;及びLederberg, J. & Tatum, E. L., 1946. Nature 158, 558)。本発明者らのストラテジーは、伝達起点(oriT)を含有する、書き換えられた「ドナー」区画を、ドナーとの相同性を提供するために伸長されている、それらの隣接する書き換えられた「レシピエント」区画にコンジュゲートすることによって時計回りに書き換えられたゲノムを組み立てる(図10、図11a、図22a、b)。これにより、ドナー及びレシピエントの両方の書き換えられた区画を含有する新たなゲノムを生成する。次いでこの新たなゲノムを含有する細胞は、次の書き換えられるドナーのためのレシピエントとして使用することができ、プロセスの反復により、書き換えられた区画を徐々に書き換えられたレシピエントに付加することにより、書き換えられたゲノムを組み立てることが可能になる(図10、図11a、b)。ドナー細胞は、ドナーゲノムのレシピエント細胞への伝達を容易にするF’プラスミドの型を含有したが、標準的なF’プラスミドと異なり、それ自体をレシピエント細胞に伝達する能力はなく(図22c)、結果としてこのF’プラスミドは、全てのコンジュゲーション後、レシピエント細胞から喪失される必要はない。これにより、本発明者らのワークフローが加速された。
本発明者らは、ドナー及びレシピエント細胞を混合することによってコンジュゲーションを開始し、ドナーからレシピエントへのゲノム伝達の程度を制御するためにコンジュゲーションの時間及び条件を変化させた。ドナーとレシピエント細胞との間のコンジュゲーション後、本発明者らは、レシピエント細胞を選択し、次いでドナーからの書き換えられた配列の末端に陽性マーカーを獲得し、レシピエントの伸長の末端に陰性マーカーを喪失したそれらのレシピエントを選択した(図11a)。
本発明者らは、区画A~Eを通して書き換えられたゲノムの収束合成を実施した(図10、図11b)。次いで本発明者らは、FについてのレシピエントとしてA~E株を使用し、書き換えられた株A~Fを生成した。次いでA~FをF~Gについてのレシピエントとして使用し、A~Gを生成し、このコンジュゲーションは、コンジュゲーション効率を増加させるためにドナーとレシピエント株との間で、かなり長い共有した書き換えられた配列(0.4Mb)を使用した。
完全に書き換えられたゲノムを作製するために、本発明者らは、A~G-37abを作製するために37a及び37bをA~Gに導入することによってレシピエント株を最初に作製した(最終的なドナーに115kbの相同領域を提供する)。本発明者らは、H株とAB株との間のコンジュゲーションによって最終的なドナー株を作製し、これにより、H、A及び区画Bからの断片9が書き換えられる、H-A-09株を得た(図10、図11b)。A及びBからの追加の配列をHに付加して、本発明者らは、最終的なコンジュゲーションにおけるAの書き換えを消去しないことを確実にした。H-A-09ドナー株とA~G-37abレシピエント株との間の最終的なコンジュゲーションにより、大腸菌の合成が生じ、これを本発明者らは大腸菌Syn61と命名し、その大腸菌Syn61では、ゲノム内の1.8×10個の全ての標的コドンが書き換えられている(図19、配列番号2)。本発明者らの書き換えられたゲノムの合成は、8つのみのプログラムされていない変異を導入し(表6)、これらの変異のうちの4つは、100kbのBACの調製の間に発生し、4つは書き換えプロセスの間に発生した。
Figure 2022533040000016
Figure 2022533040000017
Syn61における同義コドン圧縮の結果
Syn61は、37℃でLBにグルコースを加えたものでは、MDS42より1.6倍のみ遅く倍加し、この割合は25℃で増加し、42℃で減少した(図13a)。Syn61は、MDS42より65%多いAGT及びAGCコドンを含有するが、これらのコドンを解読するtRNAである、serVのさらなるコピーを提供し(図12a)、増殖を増加させず(図13a)、これにより、serVは制限されていないことが示唆される。Syn61細胞の画像化により、それらがMDS42よりわずかに長いことが示唆される(図13b、c)。Syn61のプロテオームは、MDS42のプロテオームと同等であった(図13d)。TCGコドンを標的化した、直交アミノアシル-tRNA合成酵素/tRNACGA対を使用した、非カノニカルアミノ酸の共翻訳取り込みは、MDS42において極めて毒性が強かったが、Syn61では完全に無毒であり、Syn61におけるTCGコドンの除去についての表現型の検証を提供した(図12b)。このアプローチはまた、さらなる洞察も提供した(図14a、b、c)。tRNASer UGAをコードするserTは、大腸菌におけるTCAコドンを解読するtRNAのみであるので、必須である。Syn61はTCAコドンを含有しないので、serTは本発明者らの株では非必須であるべきである。実際に、本発明者らは、Syn61においてserT(図12c、図14d、図23)、並びにserU及びprfA(図14e、f、図23)を容易に除去することができることを実証した。これらのデータは、本発明者らが、ゲノムから標的コドンを除去した機能的な確認を提供し、tRNA及び標的コドンを解読する終結因子がSyn61において除去され得ることを示し、書き換えから生じるSyn61の特有の特性を実証する。
考察
本発明者らは、4Mbのゲノム全体を合成DNAで置換した大腸菌を作製し、本発明者らの実験ではゲノム置換のスケールは、S.セレビシエの単一株でのマイコプラズマ又は染色体置換においてゲノム置換について以前に報告されていたものよりおよそ4倍大きい(図15a)。
本発明者らは、大腸菌の単一株での全ての既知の1.8×10個の標的コドン(2つのセンスコドンであるTCG及びTCA、アンバーコドンであるTAG)のゲノムワイド除去を実証した。本発明者らの研究は、部位特異的変異誘発によってアンバー終止コドンを除去する実験より60倍多いコドンを除去する(図15b)。さらに、これは、全ての標的化されたセンスコドンの完全で、ゲノムワイドな書き換えを実証する(図15b)。それ故、本発明者らは、通常の64個の代わりに61個のコドンを使用する合成生物を作製した。新たな生物は、20種のカノニカルアミノ酸をコードするために少ない数のセンスコドンを使用する。
本発明者らの合成ゲノムは、標的コドン当たり2×10-4個のみのプログラムされていない変異を含有する(図15c)。これは、有利には、部位特異的変異誘発法によってアンバーコドンを置換するために報告されている標的コドン当たり1.05個のプログラムされていない変異に匹敵する(Lajoie, M. J. et al., 2013. Science 342, 357-360)(図15c)。
本発明者らの最終的な合成ゲノムは、本発明者らが、ゲノムの標的コドンの83個(0.43%)のみで以前に決定した書き換え規則を使用して、定義したリファクタリング及び書き換えスキームを使用して書き換えた(Wang, K. et al. 2016. Nature 539, 59-64)。書き換え規則はゲノムの1.8×10個の標的コドンの99.9%で行ったのに対して、リファクタリング規則は重複の99%で行った。
本発明者らの最初の書き換えスキームの修正が、ゲノム全体の1.8×10個の標的コドンの7つのみで必要であった。これらのコドンのうちの1つは必須遺伝子にあったが、その他の6つは必須遺伝子の5’UTR内にあった。それ故、本発明者らの定義した書き換えスキームの変化の1つを除いて全ては、翻訳に対する変更した同義語の直接的な影響ではなく、必須遺伝子の5’UTRに対する意図していない変更を修正する。
本発明者らが、設計したゲノムを、区画、断片、及びストレッチに切断し、REXER、GENESIS及び誘導コンジュゲーションの収束的でシームレスでロバストな組み込みによる設計を実現するために開発したストラテジーは、将来のゲノム合成についての青写真を提供する。将来の研究では、本発明者らは、大腸菌Syn61における同義コドン圧縮の結果をさらに特徴付け、大腸菌及び他の生物におけるさらなる書き換えスキームを試験する。さらに、本発明者らは、非カノニカルバイオポリマー合成のためのセンスコドン再割当を試験する。
方法
書き換えられたゲノム設計
本発明者らは、3547個の注釈付きのCDSを有する、大腸菌MDS42ゲノム(2016年10月07日に公開された受託番号AP012306.1)の配列に対する本発明者らの合成ゲノム設計に基づいた。本発明者らは、開始ゲノムの注釈を手動でキュレートして3つのCDSを除去し、別の12個を追加した。除去した3つの予測CDSは、htgA、ybbV、及びyzfAであり、これらの配列がタンパク質をコードするという証拠は存在せず(Pundir, S., et al., 2017. Methods Mol Biol 1558, 41-55)、これらの配列は、良好に特徴付けられた遺伝子と完全に又は大部分が重複しており、これにより、それらの重複する遺伝子を破壊することなく、又は大きな反復領域を作製することなくそれらを書き換えることは困難になる。反対に、偽遺伝子ydeU、ygaY、pbl、yghX、yghY、agaW、yhiK、yhjQ、rph、ysdC、glvG、及びcybCはCDSに推奨された。rpsLでの陰性選択を可能にするために、本発明者らは、rpsLのゲノムコピーをrpsLK43Rに変異させた。最後に、本発明者らの社内のMDS42のディープシークエンシングにより、AP012306.1では報告されていなかった、mrcBとhemLとの間の51bpの挿入物が明らかになった。本発明者らは、本発明者らの開始ゲノム配列におけるこの挿入物を手動で導入し、注釈を付けた。
本発明者らは、i)全ての標的コドンを同定し、書き換え、ii)標的コドンを含有する重複する遺伝子配列を同定し、分解するカスタムPythonスクリプトを作成した。本発明者らのキュレートしたMDS42開始配列から、本発明者らは、TCG、TCA及びTAGコドンの全てが、それぞれ、AGC、AGT及びTAAで置換されている、新たな合成ゲノムを生成するためにスクリプトを使用した。このスクリプトは、標的コドンを含有する重複を有する91個のCDSを報告した。33個の例では、遺伝子は尾-尾(3’、3’)で重複しており(表1)、これらのうちの12個は、重複する遺伝子にサイレント変異を導入することによって書き換えることができたが、残りの21個は遺伝子を分離するために複製した(図1b)。頭-尾(5’、3’)で重複する遺伝子の58個の例は、下流遺伝子の内在性発現を可能にするように、重複に上流配列の20bpを加えたものを複製することによって分解した(図1c)。1bpより長い重複に関して、インフレームTAAを導入して、下流遺伝子について元のRBSからの発現を終結させた。prfB(終結因子RF-2)は、その調節内部終止コドンに起因して、本発明者らの開始MDS42ゲノムにおいてCDSとして注釈が付けられていなかったため、本発明者らは、遺伝子内の全ての標的コドンを手動で書き換え、それによって内部終止コドンを維持した。得られたゲノム設計は、1,156,625個のコドンを有する3556個のCDSを含有し、そのうちの18,218個が書き換えられた(図18、配列番号1)。
書き換えられたストレッチの逆合成
本発明者らは、設計したゲノムを91~136kbの37個の断片に分割した。本発明者らは、i)境界配列が、必要な場合、REXER4を組み込みのために使用することができるように5’-NGG-3’PAMからなり、ii)PAMが標的コドンの50bp内に位置せず、iii)PAMが非必須遺伝子の間にあり、iv)PAMがプロモーターなどのいずれかの注釈の付いた特徴を妨げないように、これらの断片を区切る境界配列を選択した。本発明者らは、これらの境界の上流及び下流の約50~100bpの領域を「ランディング部位」と呼び、それらをLxxとして注釈を付け、ここでxxは上流断片の数であり、例えば、L01は、断片1と2の間のランディング部位である。本発明者らの設計において、ランディング部位配列は断片の3’末端及び次の5’末端に含有され、その結果として、37個全ての断片は、それらの隣接する断片と54~155bpの重複する相同を含有する。
各断片を、4~15kbの7~14個のストレッチにさらに分解した。本発明者らは、互いに80~200bpの重複を含有するようにストレッチを設計し、重複領域を、あらゆる書き換え標的を含まない遺伝子間領域で定義した。合計409個のストレッチを合成し(GENEWIZ社、USA)、BsaI、AvrII、SpeI、又はXbaI制限部位が隣接したpSC101又はpSTベクターに供給した。合成ストレッチは天然では、これらの制限部位のうちの少なくとも1つを含有しなかった。
REXER/GENESISのための選択カセット及びプラスミドの構築
この節に記載しているクローニング手順は、rpsLK43R変異によってストレプトマイシンに耐性がある大腸菌DH10bにおいて実施した。この研究全体にわたって使用したプラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAは、以前に記載されているように、アラビノース誘導プロモーターの制御下でCas9及びラムダ-レッド組換え成分アルファ/ベータ/ガンマ、並びにその天然プロモーター下でtracrRNAをコードする(Wang, K. et al., 2016. Nature 539, 59-64)。
REXERのためのプロトスペーサーは、プラスミドpKW1_MB1Amp_スペーサーにおいてコードされ(図21a)、これは、以前に記載されているように、その内在性プロモーターの制御下でpMB1複製起点、アンピシリン耐性マーカー及びプロトスペーサーアレイを含有する(Wang, K. et al., 2016. Nature 539, 59-64)。このプラスミドから、本発明者らは、誘導体pKW3_MB1Amp _TracrK_スペーサーを構築し(表5)、これは、プロトスペーサーアレイの上流にtracrRNAをさらに含有する。このために、本発明者らは、その修飾された内在性プロモーターと共にtracrRNAを含有するPCR産物を、NEBuilder HiFi Master Mixを使用したギブソンアセンブリによってpKW1_MB1Amp_スペーサーのBamHI部位に導入した。このプラスミドから、また、ギブソンアセンブリによってCas9をさらにコードする誘導体を構築し、pKW5_MB1Amp_TracrK_Cas9_スペーサーと命名した。
各REXERステップについて、これらの3つのプラスミドのうちの1つの誘導体を、BAC及びゲノムを切断するための標的配列に対応する、2個(REXER2)又は4個(REXER4)のプロトスペーサーを含有するプロトスペーサー/直接反復アレイを保有するように構築した。異なるプロトスペーサーアレイを、複数ラウンドのPCRにより重複しているオリゴから構築し、その産物を、pKW1_MB1Amp_スペーサー、pKW3_MB1Amp_TracrK_スペーサー又はpKW5_MB1Amp_TracrK_Cas9_スペーサーの骨格における制限部位AccIとEcoRIとの間にギブソンアセンブリによって挿入した。各アセンブリから得られたプロトスペーサーアレイは、サンガー配列決定によって変異がないことを検証した。
REXER及びGENESISにおいて使用した陽性-陰性選択カセットは、-1/+1(rpsL-Kan)、-2/+2(sacB-Cm)及び-3/+3(pheST251A_A294G-Hyg)である。-1/+1及び-2/+2は以前に記載されている通りである(Wang, K. et al., 2016. Nature 539, 59-64)。-3/+3では、pheST251A_A294Gは、4-クロロフェニルアラニンの存在下で優性致死性であり、Hygはハイグロマイシンに対する耐性を与える。両方のタンパク質は、EM7プロモーターの制御下でポリシストロン的に発現される。-3/+3カセットはデノボ合成した。-3/+3カセットは、pheS/Hygとも称される。
ゲノムランディング部位に二重選択カセットを含有する大腸菌株の構築。
本発明者らの設計によれば、合成断片による置換のために標的化されるゲノムの各領域には、上流のランディング部位及び下流のランディング部位が隣接しており、これらのゲノムランディング部位配列は上記のランディング部位配列と同じである。REXER/GENESISを開始するには、上流のゲノムランディング部位に二重選択カセットの挿入を必要とする。本発明者らは、ラムダ-レッドを介した組換えによってランディング部位に二重選択カセットを挿入した。簡潔に説明すると、sacB-Cm又はrpsL-Kanカセットのいずれかを、所望のゲノムランディング部位に対する相同領域を含有するプライマーを用いてPCR増幅させた。組換え実験のために、本発明者らは、以前に記載されているようにエレクトロコンピテントセルを調製し(Wang, K. et al., 2016. Nature 539, 59-64)、3μgの精製したPCR産物を、ラムダ-レッドアルファ/ベータ/ガンマ遺伝子を発現するpKW20_CDFtet_pAraRedCas9_tracrRNAプラスミドを保有する100μLのMDS42rpsLK43R細胞にエレクトロポレーションした。アラビノースプロモーター(pAra)の制御下で、OD600=0.2で開始して1時間、0.5%でL-アラビノースを添加して、組換え機構を誘導した。事前に誘導した細胞をエレクトロポレーションし、次いで4mLのスーパーオプティマルブロス(SOB,super optimal broth)培地中で37℃にて1時間回収した。次いで細胞を、10μg/mLのテトラサイクリンを含む100mLのLB培地で希釈し、37℃、200rpmで4時間増殖させた。その後、細胞を遠心沈殿させ、4mLのHOに再懸濁し、段階希釈し、播種し、10μg/mLのテトラサイクリン、18μg/mLのクロラムフェニコール(sacB-Cm用)又は50μg/mLのカナマイシン(rpsL-Kan用)を含有するLB寒天プレート上で37℃にて一晩インキュベートした。
BACアセンブリ及び送達
本発明者らは、97~136kbの合成DNAを含有する細菌人工染色体(BAC,Bacterial Artificial Chromosomes)シャトルベクターを構築した。5’側では、合成DNAには、ゲノムに対する相同性領域(HR1)、及びCas9切断部位が隣接した。3’側では、合成DNAには、二重選択カセット、ゲノムに対する相同性領域(HR2)、及び第2のCas9切断部位が隣接した。BACはまた、陰性選択マーカー、BAC起点、URAマーカー及びYAC起点(自己複製配列に融合したCEN6セントロメア(CEN/ARS))も含有した(図2c、図20a~c)。
BACは、S.セレビシエでの相同組換えによって組み立てた。各アセンブリは、i)各々が6~13kbの長さである、合成DNAの7~14個のストレッチを、ii)選択コンストラクト(以下を参照のこと)及びiii)BACシャトルベクター骨格と組み合わせた(図20a~c、Wang, K. et al., 2016. Nature 539, 59-64)。
合成DNAストレッチは、GENEWIZによって提供されたそれらのソースベクターからBsaI、AvrII、SpeI、又はXbaI制限部位での消化によって切除した。AvrII、SpeI、及びXbaIの場合、制限消化に続いて、Mung Beanヌクレアーゼ処理を行って付着末端を除去した。
選択コンストラクトは、断片の最も3’側のストレッチに対する相同性領域、二重選択カセット(sacB-Cm又はrpsL-Kan)、標的化されたゲノム遺伝子座に対する相同性領域(HR2)、陰性選択マーカー(rpsL、sacB又はpheS-Hyg)及びYACを含有した。特定の二重選択カセット、陰性選択マーカー、及び相同領域配列については、図20dを参照のこと。本発明者らは、NEBuilder HiFi DNA Assembly Master Mixを用いて3つのPCR断片からpSC101骨格において選択コンストラクトのエピソーム型を組み立てた。このエピソーム型は、BsaIによる制限消化がBACアセンブリのためのDNA断片を生じるように設計した。
BAC起点及びURA3マーカーを含有するBAC骨格を、鋳型として以前に記載されているBAC(Wang, K. et al., 2016. Nature 539, 59-64)を使用してPCRによって増幅させ、PCR産物をBACアセンブリのために使用した。これらのPCRアセンブリのために使用したプライマーを図20dに列挙する。
ストレッチ、選択コンストラクト、及びBAC骨格を組み立てるために、30~50fmolのDNAの各片をS.セレビシエスフェロプラストに形質転換し、これらは以前に記載されているように調製した(Kouprina, N.,et al., 2004. Methods Mol Biol 255, 69-89)。アセンブリ後、本発明者らは、重複している断片のジャンクション及びベクター挿入ジャンクションにおいてコロニーPCRによって正確に組み立てられたBACを潜在的に保有する酵母クローンを同定した。コロニーPCRによって正確であるように見えるクローンは、以下に記載するように、大腸菌への形質転換後にNGSによって検証された配列であった。
組み立てられたBACは、製造業者の使用説明書に従ってGentra Puregene Yeast/Bact. Kit(Qiagen社)を用いて酵母から抽出した。エレクトロポレーションによってMDS42rpsLK43R細胞に組み立てられたBACを形質転換した。BACの大きなサイズに起因して、本発明者らは、時々、標的細胞への非効率なエレクトロポレーションを観察した。その結果、本発明者らは、ラムダ-レッドを介した組換え(上記の通り)によって50bpの相同領域を有するPCR産物として提供されたoriT-アプラマイシンカセットを、アセンブリ後にいくつかのBACに導入した(図20a~c)。これにより、コンジュゲーションによって、首尾よく形質転換された大腸菌から他の株へのBACの伝達が促進された。
REXER及びGENESISによる書き換えられた区画の合成
本発明者らは、連続REXER実験(GENESIS)のために種々のゲノム及びプラスミド選択マーカーを使用した(表4)。本発明者らは、選択のためのゲノムランディング部位においてrpsL-Kan(-1/+1)又はsacB-Cm(-2/+2)カセットを使用した。本発明者らは、エピソーム選択マーカーとしてrpsL-Kan-sacB(-1/+1、-2)、rpsL-Kan-pheS-Hyg(-1/+1、-3/+3)又はsacB-Cm-rpsL(-2/+2、-1)カセットを使用した。
各REXERについて、関連する上流のゲノムランディング部位においてpKW20_ CDFtet_pAraRedCas9_tracrRNA及び二重選択カセットを含有するMDS42rpsLK43R細胞に、関連するBACを形質転換した。本発明者らは、2%グルコース、5μg/mlのテトラサイクリン及びBACのために選択した抗生物質(すなわち、18μg/mlのクロラムフェニコール又は50μg/mlのカナマイシン)を補足したLB寒天に細胞を播種した。本発明者らは、5μg/mlのテトラサイクリン及びBAC特異的抗生物質を含むLB培地に個々のコロニーを接種し、37℃、200rpmで一晩細胞を増殖させた。一晩の培養物を、5μg/mlのテトラサイクリン、及びBAC特異的抗生物質を含むLB培地でOD600=0.05に希釈し、OD600≒0.2まで約2時間振盪させながら37℃で増殖させた。ラムダ-レッド発現を誘導するために、本発明者らは、0.5%の最終濃度になるようにアラビノース粉末を培養物に添加し、振盪させながら37℃でさらに1時間培養物をインキュベートした。本発明者らは、OD600≒0.6で細胞を採取し、以前に記載されているように細胞をエレクトロコンピテントにした(Wang, K. et al., 2016. Nature 539, 59-64)。
各REXER実験のために、直鎖状dsDNAプロトスペーサーアレイを、ユニバーサルプライマーを使用してpKW1_MB1Amp_スペーサーからPCR増幅させた(図21a)。およそ5~10μgの消化した得られたDpnI及び精製したPCR産物を100μLのエレクトロコンピテント及び誘導細胞に形質転換した。細胞を37℃で1時間4mlのSOB培地中で回収し、次いで5μg/mLのテトラサイクリン及びBACのために選択した抗生物質を補足した100mLのLBで希釈し、振盪させながら37℃でさらに4時間インキュベートした。あるいは、エレクトロコンピテント及び誘導細胞に、5μgの環状プロトスペーサーアレイ(pKW1_MB1Amp_スペーサー又はpKW3_MB1Amp_スペーサープラスミド)を形質転換し、37℃でSOB培地中で1時間回収した後、振盪させながら37℃でさらに4時間、100μg/mLのアンピシリンを補足した100mLのLBに移した(図21a、b)。REXER2が十分でなかった場合、本発明者らは、以前に記載されているようにpKW5_MB1Amp_スペーサープラスミドを使用してREXER4を実施した(Wang, K. et al., 2016. Nature 539, 59-64)。
本発明者らは、培養物を遠心沈殿させ、それを4mlのMilli-Q濾過水に再懸濁し、5μg/mlのテトラサイクリン、陰性選択マーカーに対して選択した薬剤及びBACに由来する陽性マーカーのために選択した抗生物質を含むLB寒天の選択プレートに段階希釈で塗抹した。このプレートを37℃で一晩インキュベートした。複数のコロニーを選び、Milli-Q濾過水に再懸濁し、50μg/mlのカナマイシン、18μg/mlのクロラムフェニコール、200μg/mlのストレプトマイシン、7.5%のスクロース又は2.5mMの4-クロロ-フェニルアラニンを補足したいくつかのLB寒天プレートに配置した。コロニーPCRをまた、ランディング部位のゲノム遺伝子座に隣接するプライマー対及びBACから新たに組み込んだ選択カセットの位置の両方を使用して再懸濁したコロニーから実施した。REXERを介した組換えにより、上流のゲノム遺伝子座におよそ500bpのバンドが生じ、対照MDS42rk/MDS42sC株についての2.5kb(rk-ランディング部位)又は3.5kb(sC-ランディング部位)のバンドはゲノムからランディング部位の除去が成功していることを示す。置換したDNAの3’末端に隣接するプライマー対は、およそ2.5kb(pBAC上のrK選択カセット)又は3.5kb(pBAC上のsC選択カセット)のバンド及び選択マーカーの組み込みの成功を示す対照MDS42rk/MDS42sC株についての500bpのバンドを生成する。
プラスミドに基づく環状プロトスペーサーアレイを以前のREXER実験に使用した場合、次の実験の前にプラスミドを喪失させなければならなかった。それ故、最初のREXER実験からの成功したクローンを、2%グルコース、5μg/mLのテトラサイクリン及びゲノム内の陽性マーカーのために選択した抗生物質を補足したLBで、振盪させながら37℃で高密度の培養物になるまで増殖させた。次いで2μLの培養物を、同じ補足物を含むLB寒天プレートに画線し、37℃で一晩インキュベートした。いくつかのコロニーを、LB寒天プレート上のレプリカ及び100μg/mLのアンピシリンを補足したLB寒天プレートに配置して、プラスミドの喪失をスクリーニングした。
BAC編集
大腸菌におけるBAC上の選択カセットにおいて機能喪失変異に遭遇した場合、欠陥のあるカセットを、50bpの相同領域が隣接し、ラムダ-レッドを介した組換えによって組み込まれているPCR産物として提供される適切な二重選択カセットで置換した(図20d)。
自然変異を修正するか、又は書き換えられたコドンを変化させるかのいずれかのために、BACの合成の書き換えられた配列の変化を2段階の置換アプローチによって導入した。書き換えられた配列の末端に選択カセット-2/+2及び-1を含有するBACに関して、-3/+3カセットを、望ましい遺伝子座を標的化する50bpの相同領域が隣接し、ラムダ-レッドを介した組換えによって組み込まれたPCR産物として提供し、続いて+3について選択した。書き換えられたDNAとゲノムとの間の相同性に起因して、得られたクローンの一部はBAC上に-3/+3を含有し、一部はゲノム上に含有する。BAC上のカセットでクローンを同定するために、クローンを、(1)+3について、(2)-3に対して、並びに(3)+2について及び-3に対して選択して寒天プレート上のレプリカに播種した。(3)ではなくプレート(1)及び(2)で生存したクローンのみが、BACに組み込まれた-3/+3カセットを有する。カセットの位置は、QIAprep Spin Miniprep Kitを使用してBACを精製し、続いてゲノタイピングすることによって検証した。第2のステップでは、50bpの相同領域が隣接し、ラムダ-レッドを介した組換えによって組み込まれた望ましい配列のPCR産物を提供することによって-3/+3カセットを置換し、続いて+2について及び-3に対して選択した。BACを上記のようにゲノタイピングし、NGSによって配列を検証した。
伝達不可能なF’プラスミドの調製及びエピソームのコンジュゲート伝達
本発明者らは、ゲノムDNAのコンジュゲーション、及び株間のBACの伝達のために使用するF’プラスミドの型を作製して、F’プラスミド自体を伝達せずにoriTを担持する配列の伝達を可能にした(図22c)。本発明者らは、F’プラスミド自体内の伝達起点(oriT)のニック部位を削除することによってこれを達成し、関連するアプローチは以前に報告されている(Strand, T. A., et al., 2014. PLoS One 9, e90372)。F’プラスミド誘導体であるpRK24(addgene#51950)を、50bpの相同領域が隣接したPCR産物として望ましいマーカーを組み込むことによって修飾し、組み込みを、Tetの代わりにKanを有するpKW20のバリアントを使用してラムダ-レッドを介した組換えによって実施した。最初に、pRK24においてアンピシリン耐性を与えるβ-ラクタマーゼ遺伝子を、感染した細菌細胞の視覚識別を可能にする生物発光を生成する人工T5-luxABCDEオペロン(Bryksin, A. V. & Matsumura, I., 2010. PLoS One 5, e13244)で置換した。次に、Tetを、50μg/mLのアプラマイシンで選択するためにアミノグリコシド3-N-アセチルトランスフェラーゼIVを産生するT3-aac3で置換した。最後に、oriTのニック部位の24bpの削除を、ブラストサイジン-Sデアミナーゼを発現するEM7-bsdを組み込むことによって行い、低塩TYE/LB中で50μg/mLのブラストサイジンで選択することができる。pJF146と呼ばれる得られたF’プラスミド(図22c)を、QIAprep Spin Miniprep Kit (QIAgen社)を使用して抽出し、後のコンジュゲーションのためにドナー株にエレクトロポレーションによって形質転換した。
oriTを含有するエピソームDNAの伝達をコンジュゲーションによって実施した(Isaacs, F. J. et al., 2011. Science 333, 348-353;及びMa, N. J., et al. 2014. Nat Protoc 9, 2285-2300)。ドナー株にpJF146及びoriTを有する組み立てられたBACを二重形質転換した(上記を参照のこと)。レシピエント株にpKW20を形質転換した。5mlのドナー及びレシピエント培養物を選択LB培地中で一晩飽和するまで増殖させ、続いて抗生物質を含まないLB培地で3回洗浄した。再懸濁したドナー及びレシピエント株を4:1の比で合わせて、TYE寒天プレートにスポットし、37℃で1時間インキュベートした。細胞をプレートから洗い流し、2%のグルコース、レシピエント株のために選択した5μg/mlのテトラサイクリン及びBACのために選択した抗生物質を含むLB寒天プレートに段階希釈で塗抹した。BACの伝達の成功を、BAC-ベクター挿入ジャンクションのコロニーPCRによって確認した。
書き換えられた区画からの合成ゲノムの組み立て
ゲノムDNAの伝達を、その後のrecBCDを介した組換えと合わせて、部分的合成大腸菌ゲノムを合成ゲノムに組み立てた。ドナー及びレシピエント株の調製において、rpsL-HygR-oriT又はGm-oriTカセットをPCR産物として供給し、ラムダ-レッドを介した組換えによってドナー株ゲノムに組み込んだ(図22a、b)。これとは別に、pheS-Hygカセットを、ドナー株の合成DNAのおよそ3kb下流に組み込んだ。これにより、3’pheS-Hyg選択カセットを有する3kbの合成DNAセグメントのPCR増幅のための鋳型ゲノムDNAが提供された。このPCR産物をレシピエント株に提供して、ラムダ-レッドを介した組換えでWT DNAを置換した。それによって、合成セグメントの3’末端における選択マーカーを置換し、ドナー合成DNAに対する3kbの相同領域を生成した。このストラテジーは、それらのそれぞれのドナーに対して3kbの相同を有し、常に3’末端にpheS-Hygを有するレシピエント株を体系的に生成するのに役立った。さらに、ドナー株にpJF146を形質転換し、テトラサイクリンに対する感受性を確認した。対照的に、pKW20をドナー株に維持してテトラサイクリン耐性を与えた。
コンジュゲーションのために、ドナー及びレシピエント株を、2%のグルコース、5μg/mlのテトラサイクリン及び50μg/mlのカナマイシン又は20μg/mlのクロラムフェニコール(ドナー)及び50μg/mlのアプラマイシン及び200μg/mLのハイグロマイシンB(レシピエント)を含むLB培地中で一晩飽和するまで増殖させた。一晩の培養物を同じ選択LB培地中で1:10に希釈し、OD600=0.5まで増殖させた。ドナー及びレシピエント培養物の両方の50mlを、2%のグルコースを含むLB培地で3回洗浄し、次いで各々を、2%のグルコースを含む400μlのLB培地に再懸濁した。320μlのドナーを80μlのレシピエントと混合し、TYE寒天プレートにスポットし、37℃でインキュベートした。インキュベーション時間は、伝達した合成DNAの長さ及びレシピエント株の倍加時間に応じ、1時間~3時間まで変化させた。細胞をプレートから洗い流し、2%のグルコース及び5μg/mlのテトラサイクリンを含む100mlのLB培地に移し、振盪させながら37℃で2時間インキュベートした。続いて、50μg/mlのカナマイシン又は20μg/mlのクロラムフェニコール(ドナーの伝達した陽性選択マーカーのための選択)を添加し、その後、37℃でさらに2時間インキュベートした。培養物を遠心沈殿させ、4mlのMilli-Q濾過水に再懸濁し、2%のグルコース、5μg/mlのテトラサイクリン、2.5mMの4-クロロ-フェニルアラニン及び50μg/mlのカナマイシン又は20μg/mlのクロラムフェニコールを含むLB寒天の選択プレートに段階希釈で塗抹した。DNA伝達及び組換えの成功を、pheS-Hygカセットの喪失、ドナーの選択カセットの組み込み及びGm-oriTカセットの非存在についてコロニーPCRによって決定した。
全ゲノムの調製及び次世代シークエンシングのためのBACライブラリー
製造業者の使用説明書に従ってDNEasy Blood and Tissue Kit(QIAgen社)を使用して大腸菌ゲノムDNAを精製した。製造業者の使用説明書に従ってQIAprep Spin Miniprep Kit(QIAgen社)を用いて細胞からBACを抽出した。本発明者らは、このキットが130kbを超えるBACの精製に適していることを見出した。本発明者らは、DNA剪断を低減させるように精製全体の間、試料の激しい振盪を回避した。
製造業者の使用説明書に従ってIllumina Nextera XT Kitを使用してPaired-end Illuminaシークエンシングライブラリーを調製した。MiSeq Reagent kit v3を用いて2×300又は2×75サイクルを実行して、シークエンシングデータをIllumina MiSeqで得た。
シークエンシングデータ分析
この研究における配列分析のための標準的なワークフローはiSeqパッケージに集約されている。簡潔に述べると、シークエンシングリードを、ソフトクリッピングをアクティブにしたbowtie2を使用して参照の書き換えられたゲノム又は野生型ゲノムにアラインメントした(Langmead, B. & Salzberg, S. L., 2012. Nat Methods 9, 357-359)。アラインメントしたリードを分類し、samtoolsを用いてインデックスを付けた(Li, H. et al., 2009. Bioinformatics 25, 2078-2079)。カスタマイズしたPythonスクリプトをsamtools及びigvtoolsの機能と合わせてサマリーを呼び出すバリアントを生じさせた。このスクリプトを使用して、Integrative Genomics Viewerでの視覚分析と組み合わせて変異、インデル及び構造変動を評価した(Thorvaldsdottir, H., et al., 2013. Brief Bioinform 14, 178-192)。
本発明者らは、標的ゲノム領域にわたって書き換えランドスケープを生成するためにカスタムPythonスクリプトを作成した。簡潔に述べると、スクリプトは、BAMアラインメントファイル、fastaの参照及び入力としてジェンバンクアノテーションファイルを受け取る。これは書き換えのための標的コドンを同定し、アラインメントファイル内のこれらの標的コドンとアラインメントするリードを集約する。次いでこれは各標的コドンにおける書き換え頻度を出力し、所望のゲノム領域の長さにわたってこれらの頻度をプロットする。
増殖率の測定及び分析
細菌コロニーを、2%のグルコース及び100μg/mLのストレプトマイシンを含むLB中で37℃にて一晩増殖させた。一晩の培養物を1:50に希釈し、温度(25℃、37℃、又は42℃)及び培地条件(LB、2%のグルコースを含むLB、M9最少培地、2XTY)を変化させながら増殖についてモニターした。OD600の測定を、高速で線形振盪させながらBiomek自動ワークステーションプラットフォームにおいて18時間の間、5分毎に行った。
倍加時間を決定するために、増殖曲線をlog2変換した。指数増殖の間の曲線の線形位相において、一次導関数を決定し(d(log2(x))/dt)、最大のlog2導関数を有する10の連続する時点を使用して、各複製についての倍加時間を計算した。合計10個の独立して増殖させた生物学的複製を、書き換えられたSyn61株及びwt MDS42rpsLK43Rについて測定した。平均倍加時間及び平均からの標準偏差を、n=10の全ての複製について計算した。
顕微鏡検査及び細胞サイズの測定
細胞を、100μg/mLのストレプトマイシンを補足したLB中で振盪させながらおよそOD600=0.2まで増殖させた。細菌の薄層をアガロースパッドとカバースリップとの間に挟んだ。標準的な顕微鏡スライドを、1%のアガロースパッド(Sigma-Aldrich社のA4018-5G)を用いて調製した。2μl~4μlの細菌培養物の試料をパッドの上部に滴下した。これを、パッドの約1mmの高さに適合させたガラススペーサーによって両側で支持した#1のカバースリップで覆った。試料を、63X 1.25NAのPlan Neofluar位相対物レンズ(Zeiss UK社、Cambridge、UK)を使用して直立Zeiss Axiophot位相差顕微鏡で画像化した。画像は、ueye cockpitソフトウェア(IDS Imaging Development Systems GmbH社、Obersulm、Germany)の制御下でIDS ueyeモノクロカメラを使用して撮影した。各試料の10個の視野を撮影した。さらに定量するために、画像をNikon NIS Elementsソフトウェアにロードした(Nikon Instruments社、Surrey、UK)。一般的な分析ツールを使用して細菌をセグメント化するために強度閾値を適用した。1ミクロンのサイズ下限を課してバックグラウンド微粒子及びダストを除去した。続いて、一般的な分析定量ツールを使用して長さの測定をセグメント化した細菌で行った。
質量分析
各株について3つの生物学的複製を実施した。各大腸菌溶解物からのタンパク質を、50mMの重炭酸アンモニウム中に6Mの尿素を含有する緩衝液中で可溶化し、10mMのDTTで還元し、55mMのヨードアセトアミドでアルキル化した。アルキル化後、タンパク質を50mMの重炭酸アンモニウムで1Mの尿素に希釈し、1:50のタンパク質対酵素比にて37℃で2時間、Lys-C(Promega社、UK)で消化し、続いて1:100のタンパク質対酵素比にて37℃で12時間、トリプシン(Promega社、UK)で消化した。得られたペプチド混合物を、2%v/vの最終濃度までギ酸を添加することによって酸性化した。およそ300nL/分のフローを送達するためにUltimate U3000 HPLC(ThermoScientific Dionex社、San Jose, USA)を使用してナノスケールキャピラリーLC-MS/MSによって消化物を二連(1ugの開始タンパク質/注入)で分析した。C18 Acclaim PepMap100 3μm、75μm×250mmのnanoViper(ThermoScientific Dionex社、San Jose、USA)での分離前に、C18 Acclaim PepMap100 5μm、100μm×20mmのnanoViper(ThermoScientific Dionex社、San Jose、USA)によりペプチドを捕捉した。ペプチドをアセトニトリルの100分の勾配(2%~60%)で溶出した。分析カラム出口は、ナノフローエレクトロスプレーイオン化源を介して、ハイブリッド二重圧力線形イオントラップ質量分析計(Orbitrap Velos、ThermoScientific社、San Jose、USA)と直接接続させた。完全なMSスペクトルについて30,000、続いて線形イオントラップで10のMS/MSスペクトルの分解能を使用して、データ依存分析を実行した。MSスペクトルを300~2000のm/z範囲にわたって収集した。MS/MSスキャンは、衝突誘起解離について35の閾値エネルギーを使用して収集した。標準的な設定を使用してMaxQuant 1.5.5.1で全ての生ファイルを処理し、MaxQuantソフトウェアスイートに組み込まれたAndromeda検索エンジンを用いて大腸菌株K-12に対して検索した。酵素検索の特異性は、両方のエンドプロテイナーゼについてトリプシン/Pであった。各ペプチドについて最大で2つの誤った切断が許容された。システインのカルバミドメチル化を酸化メチオニンによる固定修飾として設定し、タンパク質N-アセチル化を可変修飾と見なした。この検索は、前駆イオンについて6ppmの初期質量許容差及びCID MS/MSスペクトルについて0.5Daで実施した。偽発見率はペプチド及びタンパク質レベルで1%に固定した。MaxQuantのPerseus (1.5.5.3)モジュールを使用して統計的分析を実行した。統計的分析の前に、既知の夾雑物にマッピングしたペプチド、リバースヒット及び部位によってのみ同定されたタンパク質群を除去した。少なくとも2つのペプチドで同定したタンパク質群のみのうちの1つは特有であり、2つの定量事象をデータ分析のために考慮した。各株において少なくとも1回定量したタンパク質について、Syn61の複製にわたる各タンパク質の平均存在量をMDS42複製の存在量で割り、次いでlog2変換した。株間の存在量の差についてのP値を、2標本t検定(Perseus)によって計算した。
直交アミノアシル-tRNA合成酵素tRNAxxxsを使用したCYPK取り込みの毒性(Elliott, T. S. et al., 2014. Nat Biotechnol 32, 465-472; Elliott, T. S., et al., 2016. Cell Chem Biol 23, 805-815;及びKrogager, T. P. et al., 2018. Nat Biotechnol 36, 156-159)
エレクトロコンピテントMDS42及びSyn61細胞に、PylRS及びtRNAPyl xxxを発現させるためにプラスミドpKW1_MmPylS_PylTXXXを形質転換し、ここで、XXXは示したアンチコドンである。tRNAPylのアンチコドンがCGA(pKW1_MmPylS_PylTCGA)、UGA(pKW1_MmPylS_PylTUGA)又はGCU(pKW1_MmPylS_PylTGCU)に変異した、このプラスミドの3つのバリアントを使用した。細胞を、75μg/mlのスペクチノマイシンを含むLB培地中で一晩増殖させた。一晩の培養物を、0mM、0.5mM、1mM、2.5mM及び5mMでNε-(((2-メチルシクロプロパ-2-エン-1-イル)メトキシ)カルボニル)-L-リジン(CYPK)を補足したLBで1:100に希釈し、増殖を上記のように測定した。「最大増殖%」を、CYPKの非存在下での最終OD600で割ったCYPKの示した濃度の存在下での最終OD600として決定した。最終OD600は600分後に決定した。
相同組換えによるprfA、serU及びserTの削除
選択タンパク質の発現がserU又はserTによる解読に依存しないように、図1aに記載した書き換えスキームに従って、pheS-Hyg及びrpsL-Kanカセットの書き換えられた型をデノボ合成した。prfAを削除するために、書き換えられたrpsL-Kanを、prfA隣接ゲノム配列と約50bpの相同を含有するオリゴを用いて増幅させた。同じことを、書き換えられた選択カセットpheS-Hygを用いてserU及びserTに対して行った。オリゴヌクレオチド配列を図23に提供する。プラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAを保有するSyn61細胞を、LBの代わりに2xTYを使用して上記のようにコンピテントにした。細胞に約8μgのPCR産物をエレクトロポレーションし、4mLのSOBで1時間回収し、次いで5μg/mlのテトラサイクリンを補足した100mLの2xTYに移した。4時間後、細胞を遠心沈殿させ、500μLのHOに再懸濁し、5μg/mlのテトラサイクリン及び200μg/mlのハイグロマイシンB(pheS-Hyg用)又は50μg/mlのカナマイシン(rpsL-Kan用)を補足した2xTY寒天プレートに段階希釈で播種した。各場合において、所望の遺伝子座に隣接するプライマーを用いたコロニーPCRによって削除を検証した。
上記の明細書に述べられている全ての刊行物は、参照により本明細書に組み込まれる。本発明の開示された方法、細胞、組成物及び使用の様々な修正及び変形は、本発明の範囲及び趣旨から逸脱することなく、当業者に明らかであろう。本発明は特定の好ましい実施形態に関連して開示されてきたが、特許請求される本発明は、そのような特定の実施形態に過度に限定されるべきではないことが理解されるべきである。実際に、当業者に自明である、本発明を実行するための開示された方法の様々な修正は、添付の特許請求の範囲の範囲内であることが意図される。

Claims (41)

  1. 1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現を含む合成原核生物ゲノム。
  2. 1つ又は2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を含むか、又は出現を含まない、請求項1に記載の合成原核生物ゲノム。
  3. 100個若しくは101個以上、200個若しくは201個以上、又は300個若しくは301個以上の遺伝子を含む合成原核生物ゲノムであって、前記遺伝子が1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現を合計で含み、好ましくは、前記遺伝子が必須遺伝子である、前記合成原核生物ゲノム。
  4. 遺伝子が、1つ又は2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を合計で含むか、又は出現を含まない、請求項3に記載の合成原核生物ゲノム。
  5. 合成細菌ゲノム、好ましくは、合成の大腸菌ゲノム、合成のサルモネラ・エンテリカゲノム、又は合成の志賀赤痢菌ゲノムである、請求項1~4のいずれかに記載の合成原核生物ゲノム。
  6. 1つ又は2つ以上のセンスコドンが、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる、請求項1~5のいずれかに記載の合成原核生物ゲノム。
  7. 2つ又は3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現を含まず、かつ、1つの終止コドン、好ましくはアンバー終止コドン(TAG)の出現を含まない、請求項1~6のいずれかに記載の合成原核生物ゲノム。
  8. 1つ又は2つ以上のセンスコドンが、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは前記1つ又は2つ以上のセンスコドンが、TCG及び/又はTCAである、請求項1~7のいずれかに記載の合成原核生物ゲノム。
  9. アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない、請求項1~8のいずれかに記載の合成原核生物ゲノム。
  10. 親原核生物ゲノムに由来する合成原核生物ゲノムであって、前記親原核生物ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の、1つ若しくは2つ以上のセンスコドンの出現を含むか、又は1つ若しくは2つ以上のセンスコドンの出現を含まない、前記合成原核生物ゲノム。
  11. 細菌ゲノム、好ましくは大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムである、請求項10に記載の合成原核生物ゲノム。
  12. 1つ又は2つ以上のセンスコドンが、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる、請求項10又は11に記載の合成原核生物ゲノム。
  13. 1つ又は2つ以上のセンスコドンが、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは前記1つ又は2つ以上のセンスコドンが、TCG及び/又はTCAであり、TCG及び/又はTCAが同義センスコドンで置換されていてもよい、請求項10~12のいずれかに記載の合成原核生物ゲノム。
  14. 親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換され、好ましくは前記親原核生物ゲノムにおけるTCG及び/又はTCAの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGC及び/又はAGTで置換され、最も好ましくは前記親原核生物ゲノムにおけるTCGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGCで置換され、及び/又は前記親原核生物ゲノムにおけるTCAの出現の90%、95%、90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGTで置換されている、請求項10~13のいずれかに記載の合成原核生物ゲノム。
  15. アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まず、好ましくは親原核生物ゲノムにおけるTAGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、又は全てが、TAAで置換されている、請求項10~14のいずれかに記載の合成原核生物ゲノム。
  16. 親原核生物ゲノムにおける2つ若しくは3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現の99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換され、かつ、親原核生物ゲノムにおけるTAGの出現の全てがTAAで置換されている、請求項10~15のいずれかに記載の合成原核生物ゲノム。
  17. 親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する1つ又は2つ以上の遺伝子対がリファクタリングされ、好ましくは前記1つ又は2つ以上の遺伝子対が、その中の前記センスコドンのうちの1つ又は2つ以上の同義センスコドンでの置換が、前記遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである、請求項10~16のいずれかに記載の合成原核生物ゲノム。
  18. 逆向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、前記合成挿入物が重複する領域を含み、及び/又は同じ向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、前記合成挿入物が、(i)終止コドン、(ii)前記重複する領域の上流から約20~200bp、及び(iii)前記重複する領域を含む、請求項17に記載の合成原核生物ゲノム。
  19. 生存可能である、請求項1~18のいずれかに記載の合成原核生物ゲノム。
  20. 100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである、請求項1~19のいずれかに記載の合成原核生物ゲノム。
  21. 1つ又は2つ以上のセンスコドンの出現がない、20個又は21個以上、30個又は31個以上、40個又は41個以上、50個又は51個以上、100個又は101個以上の必須遺伝子を含む、ポリヌクレオチド。
  22. 1つ又は2つ以上のセンスコドンが、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる、請求項21に記載のポリヌクレオチド。
  23. 1つ又は2つ以上のセンスコドンが、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは前記1つ又は2つ以上のセンスコドンが、TCG及び/又はTCAである、請求項21又は22に記載のポリヌクレオチド。
  24. 遺伝子の1つ又は2つ以上のセンスコドンの出現が、同義センスコドンで置換され、好ましくはTCGコドンがAGCで置換され、及び/又はTCAコドンがAGTで置換されている、請求項21~23のいずれかに記載のポリヌクレオチド。
  25. 必須遺伝子が、ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択される必須遺伝子を含む、請求項21~24のいずれかに記載のポリヌクレオチド。
  26. 請求項1~20のいずれかに記載の合成原核生物ゲノム又は請求項21~25のいずれかに記載のポリヌクレオチドを含む原核生物宿主細胞。
  27. 生存可能である、請求項26に記載の原核生物宿主細胞。
  28. 細菌の細胞、好ましくは大腸菌の細胞、サルモネラ・エンテリカの細胞、又は志賀赤痢菌の細胞である、請求項26又は27に記載の原核生物宿主細胞。
  29. 1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドの産生に使用するための、請求項26~28のいずれかに記載の原核生物宿主細胞。
  30. 1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための、請求項26~29のいずれかに記載の原核生物宿主細胞の使用。
  31. 合成ゲノムを産生するための方法であって、
    (a)親ゲノムを準備するステップと、
    (b)前記親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
    (c)前記2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
    を含み、前記部分的合成ゲノムの各々が、1つ又は2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する合成領域を含むか、又は前記部分的合成ゲノムの各々が、前記親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの各々の前記出現を有する合成領域を含む、前記方法。
  32. 合成領域が、親ゲノムの90%若しくはそれ以上、95%若しくはそれ以上、99%若しくはそれ以上又は100%を合計でカバーする、請求項31に記載の合成ゲノムを産生するための方法。
  33. 合成領域が、10~1000kb、50~1000kb、100~1000kb、又は100~500kbのサイズである、請求項31又は32に記載の合成ゲノムを産生するための方法。
  34. 部分的合成ゲノムの生存能が、組換えを介した遺伝子改変の各ラウンド後及び/又は誘導コンジュゲーションの各ラウンド後に試験される、請求項31~33のいずれかに記載の合成ゲノムを産生するための方法。
  35. 2つ又は3つ以上の異なる部分的合成ゲノムが、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを含む、請求項31~34のいずれかに記載の合成ゲノムを産生するための方法。
  36. 少なくとも1つの部分的合成ドナーゲノムが、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含み、少なくとも1つの部分的合成レシピエントゲノムが、2つの対応する相同領域が隣接した第2の選択可能マーカーを含み、かつ、前記第1の選択可能マーカーが陽性選択可能マーカーを含んでいてもよく、及び/又は前記第2の選択可能マーカーが陰性選択可能マーカーを含んでいてもよい、請求項35に記載の合成ゲノムを産生するための方法。
  37. 少なくとも1つの部分的合成レシピエントゲノムに存在する合成領域が、相同領域が隣接した領域の外側である、請求項36に記載の合成ゲノムを産生するための方法。
  38. 選択可能マーカーについての選択の1回又は2回以上のラウンドをさらに含む、請求項36又は37に記載の合成ゲノムを産生するための方法。
  39. 組換えを介した遺伝子改変の1回又は2回以上のラウンドが、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER)の1回又は2回以上のラウンドを含む、請求項31~38のいずれかに記載の合成ゲノムを産生するための方法。
  40. 合成ゲノムが、請求項1~20のいずれかに記載の合成原核生物ゲノムである、請求項31~39のいずれかに記載の合成ゲノムを産生するための方法。
  41. 請求項31~40のいずれかに記載の方法によって産生される合成原核生物ゲノム。
JP2021566246A 2019-05-14 2020-05-14 合成ゲノム Pending JP2022533040A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1906775.0A GB201906775D0 (en) 2019-05-14 2019-05-14 Synthetic genome
GB1906775.0 2019-05-14
PCT/EP2020/063445 WO2020229592A1 (en) 2019-05-14 2020-05-14 Synthetic genome

Publications (2)

Publication Number Publication Date
JP2022533040A true JP2022533040A (ja) 2022-07-21
JPWO2020229592A5 JPWO2020229592A5 (ja) 2023-05-18

Family

ID=67384685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021566246A Pending JP2022533040A (ja) 2019-05-14 2020-05-14 合成ゲノム

Country Status (9)

Country Link
US (2) US20220282241A1 (ja)
EP (1) EP3969582A1 (ja)
JP (1) JP2022533040A (ja)
CN (1) CN114026230A (ja)
AU (1) AU2020273571A1 (ja)
BR (1) BR112021022451A2 (ja)
CA (1) CA3135971A1 (ja)
GB (1) GB201906775D0 (ja)
WO (1) WO2020229592A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240117295A1 (en) 2021-05-28 2024-04-11 United Kingdom Research And Innovation Microorganisms and uses thereof
GB202110137D0 (en) 2021-07-14 2021-08-25 Res & Innovation Uk Methods for optimising protein production
WO2023034856A1 (en) * 2021-08-31 2023-03-09 New York University COMPOSITIONS AND METHODS FOR SWITCHING ANTIBIOTIC RESISTANCE MARKERS PROGRESSIVELY FOR INTEGRATION (mSwAP-In)
WO2023205267A1 (en) * 2022-04-20 2023-10-26 The Administrators Of The Tulane Educational Fund Enhanced cell-free bacteriophage synthesis by genetic modulation of bacterial transcription/translation machinery (txtl) machinery
WO2024017956A2 (en) 2022-07-19 2024-01-25 United Kingdom Research And Innovation Genetic codes

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012164083A1 (en) * 2011-06-01 2012-12-06 Actogenix N.V. Polycistronic expression system for bacteria
EP3149176B1 (en) * 2014-05-30 2019-10-23 The Trustees of Columbia University in the City of New York Methods for altering polypeptide expression
GB201613135D0 (en) * 2016-07-29 2016-09-14 Medical Res Council Genome editing

Also Published As

Publication number Publication date
US20240132874A1 (en) 2024-04-25
BR112021022451A2 (pt) 2022-02-15
US20230392138A1 (en) 2023-12-07
CA3135971A1 (en) 2020-11-19
AU2020273571A1 (en) 2021-10-14
WO2020229592A1 (en) 2020-11-19
US20220282241A1 (en) 2022-09-08
EP3969582A1 (en) 2022-03-23
CN114026230A (zh) 2022-02-08
GB201906775D0 (en) 2019-06-26

Similar Documents

Publication Publication Date Title
JP2022533040A (ja) 合成ゲノム
Arnaud et al. New vector for efficient allelic replacement in naturally nontransformable, low-GC-content, gram-positive bacteria
JP4658478B2 (ja) 縮小されたゲノムを有する細菌
JP6329554B2 (ja) 宿主細胞改変方法
WO2016210373A2 (en) Recombinant bacteria engineered for biosafety, pharmaceutical compositions, and methods of use thereof
US20240158736A1 (en) Microorganisms and uses thereof
CA2747462C (en) Systems and methods for the secretion of recombinant proteins in gram negative bacteria
Burdett tRNA modification activity is necessary for Tet (M)-mediated tetracycline resistance
KR102050870B1 (ko) 무항생제 플라스미드 유지 시스템에서 플라스미드 카피 수의 정량적 조절 방법
Hemmis et al. Thioredoxin-like proteins in F and other plasmid systems
Altenbuchner et al. Escherichia coli
US20240229013A9 (en) Synthetic genome
Dubey et al. An ECF41 family σ factor controls motility and biogenesis of lateral flagella in Azospirillum brasilense sp245
Gc et al. HicA toxin-based counterselection marker for allelic exchange mutations in Fusobacterium nucleatum
KR101349070B1 (ko) 외래 유전자 강제 발현 벡터
PL208884B1 (pl) Wektor do wytwarzania polipeptydu heterologicznego oraz sposoby zwiększania wytwarzania pełnej długości polipeptydu heterologicznego
Danchin The emergence of the first cells
WO2024017956A2 (en) Genetic codes
JP3058186B2 (ja) 新規なクローニング及び/又は発現ベクター、それらの製造方法及びそれらの使用
Coppinger Experimental Evolution of Peptidoglycan Biosynthesis in Vibrio fischeri
Armbruster et al. Identification and Characterization of the Lipoprotein N-acyltransferase in Bacteroides
Patil Crosstalk Between Prokaryotic Replication Initiation and Acidic Phospholipids
CA3203195A1 (en) Glycosyltransferase deficient corynebacterium for the production of fucosyllactose
Turner Autogenous transcriptional attenuation of de novo pyrimidine biosynthesis in Bacillus subtilis
CN110607318A (zh) 一种基于多元自动化基因组工程在类球红细菌中实现基因编辑的方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230510

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230510