JP6715374B2 - Htpゲノム操作プラットフォームによる微生物株の改良 - Google Patents

Htpゲノム操作プラットフォームによる微生物株の改良 Download PDF

Info

Publication number
JP6715374B2
JP6715374B2 JP2019094458A JP2019094458A JP6715374B2 JP 6715374 B2 JP6715374 B2 JP 6715374B2 JP 2019094458 A JP2019094458 A JP 2019094458A JP 2019094458 A JP2019094458 A JP 2019094458A JP 6715374 B2 JP6715374 B2 JP 6715374B2
Authority
JP
Japan
Prior art keywords
strain
genetic
microbial
strains
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019094458A
Other languages
English (en)
Other versions
JP2019162131A5 (ja
JP2019162131A (ja
Inventor
サーバー ザック
サーバー ザック
ジェデディア ディーン エリック
ジェデディア ディーン エリック
マンチェスター ショーン
マンチェスター ショーン
ゴラ キャサリン
ゴラ キャサリン
フラッシュマン マイケル
フラッシュマン マイケル
シェルマン エリン
シェルマン エリン
キンボール アーロン
キンボール アーロン
シィジカ ショーン
シィジカ ショーン
フレウェン バーバラ
フレウェン バーバラ
トレイナー トーマス
トレイナー トーマス
エス. ブルーノ ケネス
エス. ブルーノ ケネス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZYMERGEN INC.
Original Assignee
ZYMERGEN INC.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US15/140,296 external-priority patent/US11151497B2/en
Application filed by ZYMERGEN INC. filed Critical ZYMERGEN INC.
Publication of JP2019162131A publication Critical patent/JP2019162131A/ja
Publication of JP2019162131A5 publication Critical patent/JP2019162131A5/ja
Application granted granted Critical
Publication of JP6715374B2 publication Critical patent/JP6715374B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/20Heterogeneous data integration
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Ecology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

関連出願の相互参照
本願は、2015年12月7日に出願された米国仮出願第62/264,232号、2016年4月27日に出願された米国非仮出願第15/140,296号、および2016年7月29日に出願された米国仮出願第62/368,786号の優先権の利益を主張し、これらのそれぞれは、すべての目的のために、すべての記載、参照、図面および特許請求の範囲を含むその全体において参照によって本明細書に組み込まれる。
本開示は、ハイスループット(HTP)微生物ゲノム操作を対象とする。開示されるHTPゲノム操作プラットフォームは、コンピューターで駆動され、分子生物学、自動化、および高度な機械学習プロトコールを統合する。この統合プラットフォームは、一式のHTP分子ツールセットを利用して、HTP遺伝子設計ライブラリーを生み出す。これらのライブラリーは、とりわけ、科学的洞察および反復パターン認識から得られる。
配列表に関する陳述
本願に添付された配列表は、紙コピーの代わりにテキストフォーマットで提供されており、参照により本明細書に組み込まれている。配列表を含有するテキストファイルの名称は、ZYMR_001_01WO_SeqList_ST25.txtである。テキストファイルは、約5KBであり、2016年12月7日に作成されたものであり、EFS−Webを介して電子的に提出されている。
人間は、目的の産物を生成するのに千年間にわたって微生物細胞の生合成経路の力を利用してきており、その最古の例としては、アルコール、酢、チーズ、およびヨーグルトがある。これらの産物は、今日でも依然として大きな需要があり、また、微生物が産生可能な産物のレパートリーが増え続けている。遺伝子操作技術の出現により、科学者は、様々な生物体中に新規生合成経路を設計およびプログラムして、広い範囲の工業、医療用、および消費者向け製品を生産することが可能になった。実際に、微生物細胞培養が、低分子、抗生物質、ワクチン、殺虫剤、酵素、燃料、および工業用化学物質におよぶ産物を生産するのに現在使用されている。
最新の工業用微生物によって産生される多数の産物を考慮すると、エンジニアが、所与の微生物が標的産物を産生することができる速度および効率を改善するのに極めて大きいプレッシャーの下にあることは驚くに当たらない。
様々な手法が、関与する微生物を「改良する」ことによって生物学に基づく工業プロセスの経済性を改善するのに使用されてきた。例えば、多くの製薬工業および化学工業では、微生物培養の親株が化学物質またはUV放射線への曝露によって連続的に変異され、生産性、収率、および力価などの性能増大について引き続いてスクリーニングされる、微生物株改良プログラムを利用する。この変異誘発プロセスは、株が産物性能の適当な増大を実証するまで広範に繰り返される。次いで後続の「改善された」株は、商業生産で利用される。
上記に暗示したように、変異誘発による改善された工業用微生物株の同定は、時間がかかり、非効率である。このプロセスは、まさにその本質から、計画性のないものであり、産物産出について望ましい結果を有する変異の際の1つのつまずきを利用する。
伝統的な微生物株改良プログラムが非効率であるだけでなく、このプロセスは、高い程度の有害な変異誘発性ロード(mutagenic load)を有する工業用株に至る場合もある。
これらのタイプのプログラムに供された工業用株における変異の蓄積は、かなり大きなものとなり得、性能改善の速度における最終的な停滞に至り得る。
よって、伝統的な株改良プログラムに固有の上述した欠点を被らず、有益な変異を発見および統合するプロセスを大いに加速する工業用微生物を操作する新しい方法についての当技術分野における大きな必要性が存在する。
さらに、微生物株改良の分野において現在使用されている時代遅れの有害なプロセスによって開発された工業用株を「再建する」方法の緊急の必要性が存在する。
本開示は、伝統的な微生物株改良プログラムに関連した無数の問題を被らないハイスループット(HTP)微生物ゲノム操作プラットフォームを提供する。
さらに、本明細書で教示されるHTPプラットフォームは、数10年のランダム変異誘発に基づく株改良プログラムによって有益でない変異を蓄積してきた工業用微生物を再建する(rehabilitate)ことができる。
開示されるHTPゲノム操作プラットフォームは、コンピューターで駆動され、分子生物学、自動化、および高度な機械学習プロトコールを統合する。この統合プラットフォームは、一式のHTP分子ツールセットを利用して、HTP遺伝子設計ライブラリーを生み出す。これらのライブラリーは、とりわけ、科学的洞察および反復パターン認識から得られる。
教示されるHTP遺伝子設計ライブラリーは、微生物において試験するための特定のゲノム変更のライブラリーを提供することによって、ゲノム操作プロセスのドライバーとして機能する。特定のライブラリーまたはライブラリーの組合せを利用して操作された微生物は、結果として生じる成果、例えば、目的の産物の産生についてHTP様式で効率的にスクリーニングされる。HTP遺伝子設計ライブラリーを利用して微生物において試験するための特定のゲノム変更を明らかにし、次いでこれらの変更を内包する宿主微生物ゲノムを引き続いてスクリーニングするこのプロセスは、効率的な反復様式でインプリメントされる。一部の態様では、ゲノム操作キャンペーンの反復サイクルまたは「ラウンド」は、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、またはそれ超の反復/サイクル/ラウンドであり得る。
よって、一部の態様では、本開示は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、1000またはそれ超の「ラウンド」のHTP遺伝子操作(例えば、SNPスワップ、PROスワップ、STOPスワップ、またはこれらの組合せのラウンド)を行う方法を教示する。
一部の実施形態では、本開示は、各後続のHTP遺伝子操作ラウンドが先のラウンドの遺伝子操作で同定された遺伝的バリエーションに基づく線形手法を教示する。他の実施形態では、本開示は、各後続のHTP遺伝子操作ラウンドが先に行われた分析を含む任意の先のラウンドの遺伝子操作、および別個のHTP遺伝子操作ブランチで同定された遺伝的バリエーションに基づく非線形手法を教示する。
これらの反復サイクルからのデータは、大規模データ分析およびパターン認識を可能にし、それは統合プラットフォームによって利用され、HTP遺伝子設計ライブラリー実装の後続のラウンドを通知する。したがって、教示されるプラットフォームで利用されるHTP遺伝子設計ライブラリーは、大規模データパターン認識アルゴリズムから利益を得、各反復ラウンドの微生物操作によってより有益となる高度に動的なツールである。
一部の実施形態では、本開示の遺伝子設計ライブラリーは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、1000、またはそれ超の個々の遺伝子変化(例えば、少なくともXの数のPROスワップライブラリーにおけるプロモーター:遺伝子組合せの)を含む。
一部の実施形態では、本開示は、HTP株改良法の微生物株への適用を記述する実例およびテキストを提供する。一部の実施形態では、本開示の株改良法は、任意の宿主細胞に適用可能である。
一部の実施形態では、本開示は、所望の表現型を獲得するために微生物を進化させるゲノム操作のハイスループット(HTP)方法であって、a)同じ微生物株バックグラウンドを有する最初の複数の微生物のゲノムを撹乱することによって、ユニークな遺伝的バリエーションを有する個々の微生物株を含む最初のHTP遺伝子設計微生物株ライブラリーを生み出すステップと;b)所望の表現型について最初のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;c)それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のHTP遺伝子設計微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;d)所望の表現型について後続のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;e)微生物が所望の表現型を獲得するまで、線形または非線形様式でステップc)〜d)を1回または複数回繰り返すステップであって、各後続の反復により、先行するHTP遺伝子設計微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを内包する個々の微生物株を含む新しいHTP遺伝子設計微生物株ライブラリーが創製される、ステップとを含む、方法を教示する。
一部の実施形態では、本開示は、最初のHTP遺伝子設計微生物株ライブラリーが、プロモータースワップ微生物株ライブラリー、SNPスワップ微生物株ライブラリー、開始/停止コドン微生物株ライブラリー、最適化配列微生物株ライブラリー、ターミネータースワップ微生物株ライブラリー、またはこれらの任意の組合せからなる群から選択される少なくとも1つであることを教示する。
一部の実施形態では、本開示は、それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を作製する方法であって、組み合わされた遺伝的バリエーションのそれぞれが、最初のHTP遺伝子設計微生物株ライブラリーまたは先行するステップのHTP遺伝子設計微生物株ライブラリーに由来する、方法を教示する。
一部の実施形態では、後続の複数の微生物における遺伝的バリエーションの組合せは、最初のHTP遺伝子設計微生物株ライブラリーまたは先行するステップのHTP遺伝子設計微生物株ライブラリーにおける遺伝的バリエーションのすべての可能な組合せのサブセットを含むことになる。
一部の実施形態では、本開示は、後続のHTP遺伝子設計微生物株ライブラリーが、最初のHTP遺伝子設計微生物株ライブラリーまたは先行するステップのHTP遺伝子設計微生物株ライブラリーにおける遺伝的バリエーションに由来する完全コンビナトリアル微生物株ライブラリーであることを教示する。
例えば、先のHTP遺伝子設計微生物株ライブラリーが遺伝的バリエーションA、B、C、およびDのみを有している場合、前記バリエーションの部分的コンビナトリアルは、それぞれがAB、AC、またはADの遺伝的バリエーションのユニークな組合せのいずれかを含む3種の微生物を含む後続のHTP遺伝子設計微生物株ライブラリーを含むことができる(変異が表される順序は重要でない)。先行するステップのHTP遺伝子設計ライブラリーの遺伝的バリエーションに由来する完全コンビナトリアル微生物株ライブラリーは、それぞれがAB、AC、AD、BC、BD、またはCDの遺伝的バリエーションのユニークな組合せのいずれかを含む6種の微生物を含むはずである。
一部の実施形態では、本開示の方法は、ランダム変異誘発、標的とした配列挿入、標的とした配列欠失、標的とした配列置き換え、またはこれらの任意の組合せからなる群から選択される少なくとも1つの方法を利用してゲノムを撹乱することを教示する。
現在開示した方法の一部の実施形態では、最初の複数の微生物は、工業生産株微生物に由来するユニークな遺伝的バリエーションを含む。
現在開示した方法の一部の実施形態では、最初の複数の微生物は、SGenで表される工業生産株微生物、およびSGenで表されるこれらに由来する任意の数の後続の微生物世代を含む。
一部の実施形態では、本開示は、SNPスワップ微生物株ライブラリーを生成するための方法であって、a)参照微生物株および第2の微生物株を提供するステップであって、第2の微生物株は、参照微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;b)参照微生物株または第2の微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、前記複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、前記ユニークな遺伝的バリエーションのそれぞれは、参照微生物株と第2の微生物株との間の複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップとを含む、方法を教示する。
SNPスワップライブラリーの一部の実施形態では、参照微生物株のゲノムが撹乱されて、第2の微生物株内に見出される同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が付加される。
本開示のSNPスワップライブラリー方法の一部の実施形態では、第2の微生物株のゲノムが撹乱されて、参照微生物株内に見出されない同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が除去される。
一部の実施形態では、SNPスワップライブラリーの遺伝的バリエーションは、参照微生物株と第2の微生物株との間で同定されたすべての遺伝的バリエーションのサブセットを含む。
一部の実施形態では、SNPスワップライブラリーの遺伝的バリエーションは、参照微生物株と第2の微生物株との間の同定された遺伝的バリエーションのすべてを含む。
一部の実施形態では、本開示は、工業用微生物株の表現型性能を再建および改善するための方法であって、a)親系統微生物株およびそれに由来する工業用微生物株を提供するステップであって、工業用微生物株は、親系統微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;b)親系統微生物株または工業用微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、前記複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、前記ユニークな遺伝的バリエーションのそれぞれは、親系統微生物株と工業用微生物株との間の複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと;c)参照微生物株に対する表現型性能改善について最初のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、前記微生物株に表現型性能改善をもたらすユニークな遺伝的バリエーションを同定するステップと;d)それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のSNPスワップ微生物株ライブラリーを生み出すステップであって、前記遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;e)参照微生物株に対する表現型性能改善について後続のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、前記微生物株に追加の表現型性能改善をもたらす遺伝的バリエーションのユニークな組合せを同定するステップと;f)微生物株が、工業用微生物株の表現型性能と比較して、所望のレベルの表現型性能の改善を呈するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するSNPスワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを内包する個々の微生物株を含む新しいSNPスワップ微生物株ライブラリーが創製される、ステップとを含む、方法を教示する。
一部の実施形態では、本開示は、工業用微生物株の表現型性能を再建および改善するための方法であって、親系統微生物株のゲノムが撹乱されて、工業用微生物株内に見出される同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が付加される、方法を教示する。
一部の実施形態では、本開示は、工業用微生物株の表現型性能を再建および改善するための方法であって、工業用微生物株のゲノムが撹乱されて、親系統微生物株内に見出されない同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が除去される、方法を教示する。
一部の実施形態では、本開示は、プロモータースワップ微生物株ライブラリーを生成するための方法であって、a)基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、前記プロモーターラダーは、基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;b)基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、前記複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、前記ユニークな遺伝的バリエーションのそれぞれは、基準微生物株に内在する標的遺伝子の1つに作動可能に連結したプロモーターラダー由来のプロモーターの1つを含む、ステップとを含む、方法を教示する。
一部の実施形態では、本開示は、所望の表現型を獲得するために微生物を進化させるゲノム操作のプロモータースワップ方法であって、a)基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、前記プロモーターラダーは、基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;b)基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、前記複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、前記ユニークな遺伝的バリエーションのそれぞれは、基準微生物株に内在する標的遺伝子の1つに作動可能に連結したプロモーターラダー由来のプロモーターの1つを含む、ステップと;c)所望の表現型について最初のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;d)それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のプロモータースワップ微生物株ライブラリーを生み出すステップであって、前記遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;e)所望の表現型について後続のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;f)微生物が所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するプロモータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを内包する個々の微生物株を含む新しいプロモータースワップ微生物株ライブラリーが創製される、ステップとを含む、方法を教示する。
一部の実施形態では、本開示は、ターミネータースワップ微生物株ライブラリーを生成するための方法であって、a)基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、前記ターミネーターラダーは、基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;b)基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、前記複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、前記ユニークな遺伝的バリエーションのそれぞれは、ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した基準微生物株に内在する標的遺伝子の1つを含む、ステップとを含む、方法を教示する。
一部の実施形態では、本開示は、所望の表現型を獲得するために微生物を進化させるゲノム操作のターミネータースワップ方法であって、a)基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、前記ターミネーターラダーは、基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;b)基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、前記複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、前記ユニークな遺伝的バリエーションのそれぞれは、ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した基準微生物株に内在する標的遺伝子の1つを含む、ステップと;c)所望の表現型について最初のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;d)それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のターミネータースワップ微生物株ライブラリーを生み出すステップであって、前記遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;e)所望の表現型について後続のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;f)微生物が所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するターミネータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを内包する個々の微生物株を含む新しいターミネータースワップ微生物株ライブラリーが創製される、ステップとを含む、方法を教示する。
一部の実施形態では、本開示は、(a)(1)1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す入力、および(2)対応する性能尺度を含む訓練セットで設定された(populated with)予測モデルにアクセスするステップと;(b)遺伝子変
化を表す予測モデルに試験入力(test input)を適用するステップであって、試験入力
は、これらの遺伝子変化を組み入れる候補微生物株に対応する、ステップと;(c)予測モデルに少なくとも部分的に基づいて候補微生物株の表現型性能を予測するステップと;(d)これらの予測された性能に少なくとも部分的に基づいて候補微生物株の第1のサブセットを選択するステップと;(e)候補微生物株の第1のサブセットの測定された表現型性能を得るステップと;(f)これらの測定された表現型性能に少なくとも部分的に基づいて候補微生物株の第2のサブセットの選択物を得るステップと;(g)(2)選択された候補微生物株の第2のサブセットの対応する測定された性能とともに(1)選択された候補微生物株の第2のサブセットに対応する入力を予測モデルの訓練セットに加えるステップと;(h)少なくとも1つの候補微生物株の測定された表現型性能が性能測定基準を満たすまで、(b)〜(g)を繰り返すステップとによって候補微生物株の設計を反復して改善することを教示する。一部の場合では、予測モデルへの試験入力の第1の適用の間に、試験入力によって表される遺伝子変化が、1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を含み、試験入力の後続の適用の間に、試験入力によって表される遺伝子変化が、候補微生物株の先に選択された第2のサブセット内の候補微生物株に対する遺伝子変化を含む。
一部の実施形態では、第1のサブセットの選択は、上位性効果に基づき得る。これは、第1のサブセットの第1の選択の間に、1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す複数のそれぞれの入力の適用に応じて、1つまたは複数のバックグラウンド微生物株の性能尺度間の相違点の程度を決定するステップと、少なくとも2つの候補微生物株内に組み入れられる遺伝子変化の適用に応じて、1つまたは複数のバックグラウンド微生物株の性能尺度の相違点の程度に少なくとも部分的に基づいて、少なくとも2つの候補微生物株を第1のサブセットに含めるために選択するステップとによって達成することができる。
一部の実施形態では、本発明は、候補微生物株の反復改良において上位性効果を適用する方法であって、少なくとも1つの微生物バックグラウンド株に行われた対応する遺伝子変化に応じて、測定された性能を表すデータを得るステップと;少なくとも2つの遺伝子変化の対応する応答性能尺度間の相違点の程度に少なくとも部分的に基づいて、少なくとも2つの遺伝子変化の選択物を得るステップであって、相違点の程度が、少なくとも2つの遺伝子変化が異なる生物学的経路を通じたこれらの対応する応答性能尺度に影響する程度に関連する、ステップと;選択された遺伝子変化を含む微生物バックグラウンド株に対する遺伝子変化を設計するステップとを含む、方法を教示する。一部の場合では、少なくとも2つの選択された遺伝子変化が設計される微生物バックグラウンド株は、測定された応答性能を表すデータが得られた少なくとも1つの微生物バックグラウンド株と同じである。
一部の実施形態では、本開示は、単一タイプの遺伝子微生物ライブラリーのみを利用するHTP株改良法を教示する。例えば、一部の実施形態では、本開示は、SNPスワップライブラリーのみを利用するHTP株改良法を教示する。他の実施形態では、本開示は、PROスワップライブラリーのみを利用するHTP株改良法を教示する。一部の実施形態では、本開示は、STOPスワップライブラリーのみを利用するHTP株改良法を教示する。一部の実施形態では、本開示は、開始/停止コドンスワップライブラリーのみを利用するHTP株改良法を教示する。
他の実施形態では、本開示は、2つまたはそれ超のタイプの遺伝子微生物ライブラリーを利用するHTP株改良法を教示する。例えば、一部の実施形態では、本開示は、SNPスワップライブラリーおよびPROスワップライブラリーを組み合わせるHTP株改良法を教示する。一部の実施形態では、本開示は、SNPスワップライブラリーおよびSTOPスワップライブラリーを組み合わせるHTP株改良法を教示する。一部の実施形態では、本開示は、PROスワップライブラリーおよびSTOPスワップライブラリーを組み合わせるHTP株改良法を教示する。
他の実施形態では、本開示は、複数のタイプの遺伝子微生物ライブラリーを利用するHTP株改良法を教示する。一部の実施形態では、遺伝子微生物ライブラリーは、組合せ変異(例えば、1つまたは複数の遺伝子に適用されるプロモーター/ターミネーター組合せラダー)を生成するように組み合わせられる。さらに他の実施形態では、本開示のHTP株改良法は、1つまたは複数の伝統的な株改良法と組み合わせることができる。
一部の実施形態では、本開示のHTP株改良法は、改良された宿主細胞をもたらす。すなわち、本開示は、1つまたは複数の宿主細胞性質を改善する方法を教示する。一部の実施形態では、改善される宿主細胞性質は、宿主細胞によって産生される目的の産物の体積生産性、比生産性、収率、または力価からなる群から選択される。一部の実施形態では、改善される宿主細胞性質は、体積生産性である。一部の実施形態では、改善される宿主細胞性質は、比生産性である。一部の実施形態では、改善される宿主細胞性質は、収率である。
一部の実施形態では、本開示のHTP株改良法は、HTP株改良法に供されない対照宿主細胞に対して1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%、またはそれ超の少なくとも1つの宿主細胞性質の改善(例えば、これらの間の任意の範囲および部分範囲を組み入れての、目的の生体分子の収率または生産性のX%の改善)を呈する宿主細胞をもたらす。一部の実施形態では、本開示のHTP株改良法は、SNPスワップ、PROスワップ、STOPスワップ、およびこれらの組合せからなる群から選択される。
よって、一部の実施形態では、本開示のSNPスワップ方法は、SNPスワップ方法に供されない対照宿主細胞に対して、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%、またはそれ超の少なくとも1つの宿主細胞性質の改善(例えば、これらの間の任意の範囲および部分範囲を組み入れての、目的の生体分子の収率または生産性のX%の改善)を呈する宿主細胞をもたらす。
よって、一部の実施形態では、本開示のPROスワップ方法は、PROスワップ方法に供されない対照宿主細胞に対して、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%、またはそれ超の少なくとも1つの宿主細胞性質の改善(例えば、これらの間の任意の範囲および部分範囲を組み入れての、目的の生体分子の収率または生産性のX%の改善)を呈する宿主細胞をもたらす。
本発明は、例えば以下の項目を提供する。
(項目1)
所望の表現型を獲得するために微生物を進化させるゲノム操作のハイスループット(HTP)方法であって、
a.同じ微生物株バックグラウンドを有する最初の複数の微生物のゲノムを撹乱することによって、ユニークな遺伝的バリエーションを有する個々の微生物株を含む最初のHTP遺伝子設計微生物株ライブラリーを生み出すステップと;
b.該所望の表現型について該最初のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
c.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のHTP遺伝子設計微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
d.該所望の表現型について該後続のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
e.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップc)〜d)を1回または複数回繰り返すステップであって、各後続の反復により、先行するHTP遺伝子設計微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいHTP遺伝子設計微生物株ライブラリーが創製される、ステップと
を含む、ゲノム操作のHTP方法。
(項目2)
前記最初のHTP遺伝子設計微生物株ライブラリーが、プロモータースワップ微生物株ライブラリー、SNPスワップ微生物株ライブラリー、開始/停止コドン微生物株ライブラリー、最適化配列微生物株ライブラリー、ターミネータースワップ微生物株ライブラリー、およびこれらの任意の組合せからなる群から選択される少なくとも1つを含む、項目1に記載のゲノム操作のHTP方法。
(項目3)
前記後続のHTP遺伝子設計微生物株ライブラリーが、前記最初のHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーである、項目1に記載のゲノム操作のHTP方法。
(項目4)
前記後続のHTP遺伝子設計微生物株ライブラリーが、前記最初のHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーのサブセットである、項目1に記載のゲノム操作のHTP方法。
(項目5)
前記後続のHTP遺伝子設計微生物株ライブラリーが、先行するHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーである、項目1に記載のゲノム操作のHTP方法。
(項目6)
前記後続のHTP遺伝子設計微生物株ライブラリーが、先行するHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーのサブセットである、項目1に記載のゲノム操作のHTP方法。
(項目7)
前記ゲノムを撹乱するステップが、ランダム変異誘発、標的とした配列挿入、標的とした配列欠失、標的とした配列置き換え、およびこれらの任意の組合せからなる群から選択される少なくとも1つの方法を利用することを含む、項目1に記載のゲノム操作のHTP方法。
(項目8)
前記最初の複数の微生物が、工業生産株微生物に由来するユニークな遺伝的バリエーションを含む、項目1に記載のゲノム操作のHTP方法。
(項目9)
前記最初の複数の微生物が、SGenで表される工業生産株微生物、およびSGenで表されるこれらに由来する任意の数の後続の微生物世代を含む、項目1に記載のゲノム操作のHTP方法。
(項目10)
SNPスワップ微生物株ライブラリーを生成するための方法であって、
c.参照微生物株および第2の微生物株を提供するステップであって、該第2の微生物株は、該参照微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
d.該参照微生物株または該第2の微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該参照微生物株と該第2の微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと
を含む、方法。
(項目11)
前記参照微生物株のゲノムが撹乱されて、前記第2の微生物株内に見出される前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が付加される、項目10に記載のSNPスワップ微生物株ライブラリーを生成するための方法。
(項目12)
前記第2の微生物株のゲノムが撹乱されて、前記参照微生物株内に見出されない前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が除去される、項目10に記載のSNPスワップ微生物株ライブラリーを生成するための方法。
(項目13)
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、前記参照微生物株と前記第2の微生物株との間のすべての前記同定された遺伝的バリエーションの完全コンビナトリアルライブラリーを構成する、項目10に記載のSNPスワップ微生物株ライブラリーを生成するための方法。
(項目14)
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、前記参照微生物株と前記第2の微生物株との間のすべての前記同定された遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、項目10に記載のSNPスワップ微生物株ライブラリーを生成するための方法。
(項目15)
工業用微生物株の表現型性能を再建および改善するための方法であって、
a.親系統微生物株およびそれに由来する工業用微生物株を提供するステップであって、該工業用微生物株は、該親系統微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該親系統微生物株または該工業用微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該親系統微生物株と該工業用微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと;
c.参照微生物株に対する表現型性能改善について該最初のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該個々の微生物株に表現型性能改善をもたらすユニークな遺伝的バリエーションを同定するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のSNPスワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該参照微生物株に対する表現型性能改善について該後続のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に追加の表現型性能改善をもたらす遺伝的バリエーションのユニークな組合せを同定するステップと;
f.微生物株が、該工業用微生物株の表現型性能と比較して、所望のレベルの表現型性能の改善を呈するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するSNPスワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいSNPスワップ微生物株ライブラリーが創製される、ステップと
を含む、方法。
(項目16)
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、前記参照微生物株と前記第2の微生物株との間のすべての前記同定された遺伝的バリエーションの完全コンビナトリアルライブラリーを構成する、項目15に記載の工業用微生物株の表現型性能を再建および改善するための方法。
(項目17)
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、前記参照微生物株と前記第2の微生物株との間のすべての前記同定された遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、項目15に記載の工業用微生物株の表現型性能を再建および改善するための方法。
(項目18)
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップでスクリーニングされた前記個々の微生物株に存在するすべての前記遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、項目15に記載の工業用微生物株の表現型性能を再建および改善するための方法。
(項目19)
前記親系統微生物株のゲノムが撹乱されて、前記工業用微生物株内に見出される前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が付加される、項目15に記載の工業用微生物株の表現型性能を再建および改善するための方法。
(項目20)
前記工業用微生物株のゲノムが撹乱されて、前記親系統微生物株内に見出されない前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が除去される、項目15に記載の工業用微生物株の表現型性能を再建および改善するための方法。
(項目21)
プロモータースワップ微生物株ライブラリーを生成するための方法であって、
c.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
d.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと
を含む、方法。
(項目22)
所望の表現型を獲得するために微生物を進化させるゲノム操作のプロモータースワップ方法であって、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと;
c.該所望の表現型について該最初のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するプロモータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいプロモータースワップ微生物株ライブラリーが創製される、ステップと
を含む、方法。
(項目23)
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップでスクリーニングされた前記個々の微生物株に存在するすべての前記遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、項目22に記載の所望の表現型を獲得するために微生物を進化させるゲノム操作のプロモータースワップ方法。
(項目24)
ターミネータースワップ微生物株ライブラリーを生成するための方法であって、
c.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
d.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと
を含む、方法。
(項目25)
所望の表現型を獲得するために微生物を進化させるゲノム操作のターミネータースワップ方法であって、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと;
c.該所望の表現型について該最初のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するターミネータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいターミネータースワップ微生物株ライブラリーが創製される、ステップと
を含む、方法。
(項目26)
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップでスクリーニングされた前記個々の微生物株に存在するすべての前記遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、項目25に記載の所望の表現型を獲得するために微生物を進化させるゲノム操作のターミネータースワップ方法。
(項目27)
所望の表現型を獲得するために微生物を進化させるためのハイスループット(HTP)ゲノム操作システムであって、
1つまたは複数のプロセッサー、および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.同じ微生物株バックグラウンドを有する最初の複数の微生物のゲノムを撹乱することによって、ユニークな遺伝的バリエーションを有する個々の微生物株を含む最初のHTP遺伝子設計微生物株ライブラリーを生み出すステップと;
b.該所望の表現型について該最初のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
c.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のHTP遺伝子設計微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
d.該所望の表現型について該後続のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
e.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップc)〜d)を1回または複数回繰り返すステップであって、各後続の反復により、先行するHTP遺伝子設計微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいHTP遺伝子設計微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目28)
所望の表現型を獲得するために微生物を進化させるための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.同じ微生物株バックグラウンドを有する最初の複数の微生物のゲノムを撹乱することによって、ユニークな遺伝的バリエーションを有する個々の微生物株を含む最初のHTP遺伝子設計微生物株ライブラリーを生み出すステップと;
b.該所望の表現型について該最初のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
c.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のHTP遺伝子設計微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
d.該所望の表現型について該後続のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
e.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップc)〜d)を1回または複数回繰り返すステップであって、各後続の反復により、先行するHTP遺伝子設計微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいHTP遺伝子設計微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
(項目29)
SNPスワップ微生物株ライブラリーを生成するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.参照微生物株および第2の微生物株を提供するステップであって、該第2の微生物株は、該参照微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該参照微生物株または該第2の微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該参照微生物株と該第2の微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目30)
SNPスワップ微生物株ライブラリーを生成するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.参照微生物株および第2の微生物株を提供するステップであって、該第2の微生物株は、該参照微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該参照微生物株または該第2の微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該参照微生物株と該第2の微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと
をさせる、非一時的コンピューター可読媒体。
(項目31)
工業用微生物株の表現型性能を再建および改善するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.親系統微生物株およびそれに由来する工業用微生物株を提供するステップであって、該工業用微生物株は、該親系統微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該親系統微生物株または該工業用微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該親系統微生物株と該工業用微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと;
c.参照微生物株に対する表現型性能改善について該最初のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に表現型性能改善をもたらすユニークな遺伝的バリエーションを同定するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のSNPスワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該参照微生物株に対する表現型性能改善について該後続のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に追加の表現型性能改善をもたらす遺伝的バリエーションのユニークな組合せを同定するステップと;
f.微生物株が、該工業用微生物株の表現型性能と比較して、所望のレベルの表現型性能の改善を呈するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するSNPスワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいSNPスワップ微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目32)
工業用微生物株の表現型性能を再建および改善するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.親系統微生物株およびそれに由来する工業用微生物株を提供するステップであって、該工業用微生物株は、該親系統微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該親系統微生物株または該工業用微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該親系統微生物株と該工業用微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと;
c.参照微生物株に対する表現型性能改善について該最初のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に表現型性能改善をもたらすユニークな遺伝的バリエーションを同定するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のSNPスワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該参照微生物株に対する表現型性能改善について該後続のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に追加の表現型性能改善をもたらす遺伝的バリエーションのユニークな組合せを同定するステップと;
f.微生物株が、該工業用微生物株の表現型性能と比較して、所望のレベルの表現型性能の改善を呈するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するSNPスワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいSNPスワップ微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
(項目33)
プロモータースワップ微生物株ライブラリーを生成するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目34)
プロモータースワップ微生物株ライブラリーを生成するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと
をさせる、非一時的コンピューター可読媒体。
(項目35)
所望の表現型を獲得するためにプロモータースワッピングによって微生物を進化させるゲノム操作システムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと;
c.該所望の表現型について該最初のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するプロモータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいプロモータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目36)
所望の表現型を獲得するためにプロモータースワッピングによって微生物を進化させるための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと;
c.該所望の表現型について該最初のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するプロモータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいプロモータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
(項目37)
ターミネータースワップ微生物株ライブラリーを生成するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目38)
ターミネータースワップ微生物株ライブラリーを生成するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと
をさせる、非一時的コンピューター可読媒体。
(項目39)
所望の表現型を獲得するために微生物をターミネータースワッピングによって進化させるゲノム操作システムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと;
c.該所望の表現型について該最初のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するターミネータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいターミネータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目40)
所望の表現型を獲得するために微生物をターミネータースワッピングによって進化させるための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと;
c.該所望の表現型について該最初のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するターミネータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいターミネータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
(項目41)
候補微生物株の設計を反復して改善するためのコンピューター実装方法であって、
a.(1)1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す入力、および(2)対応する性能尺度を含む訓練セットで設定された予測モデルにアクセスするステップと;
b.遺伝子変化を表す該予測モデルに試験入力を適用するステップであって、該試験入力は、これらの遺伝子変化を組み入れる候補微生物株に対応する、ステップと;
c.該予測モデルに少なくとも部分的に基づいて該候補微生物株の表現型性能を予測するステップと;
d.これらの予測された性能に少なくとも部分的に基づいて該候補微生物株の第1のサブセットを選択するステップと;
e.該候補微生物株の該第1のサブセットの測定された表現型性能を得るステップと;
f.これらの測定された表現型性能に少なくとも部分的に基づいて該候補微生物株の第2のサブセットの選択物を得るステップと;
g.(2)該選択された候補微生物株の第2のサブセットの対応する測定された性能とともに、(1)該選択された候補微生物株の第2のサブセットに対応する入力を該予測モデルの該訓練セットに加えるステップと;
h.(b)〜(g)を繰り返すステップと
を含む、方法。
(項目42)
(b)〜(g)を繰り返すステップが、少なくとも1つの候補微生物株の測定された表現型性能が、性能測定基準を満たすまで(b)〜(g)を繰り返すことを含む、項目41に記載の方法。
(項目43)
前記予測モデルへの試験入力の第1の適用の間に、該試験入力によって表される前記遺伝子変化が、前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を含み;
試験入力の後続の適用の間に、該試験入力によって表される該遺伝子変化が、先に選択された候補微生物株の第2のサブセット内の候補微生物株に対する遺伝子変化を含む、項目41に記載の方法。
(項目44)
前記候補微生物株の前記第1のサブセットの前記選択が、上位性効果に少なくとも部分的に基づく、項目41に記載の方法。
(項目45)
上位性効果に少なくとも部分的に基づく前記第1のサブセットの前記選択が、
該第1のサブセットの第1の選択の間に、
前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す複数のそれぞれの入力の適用に応じて、該1つまたは複数のバックグラウンド微生物株の性能尺度間の相違点の程度を決定するステップと;
少なくとも2つの候補微生物株内に組み入れられる遺伝子変化の適用に応じて、該1つまたは複数のバックグラウンド微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
を含む、項目44に記載の方法。
(項目46)
前記第1のサブセットの後続の選択の間に、
遺伝子変化を表す複数のそれぞれの入力の適用に応じて、先の第1のサブセット候補微生物株の性能尺度間の相違点の程度を決定するステップであって、該先の第1のサブセット候補微生物株が、該第1のサブセットの先の選択の間に選択された株である、ステップと;
少なくとも2つの候補微生物株内に組み入れられる該遺伝子変化の適用に応じて、該先の第1のサブセット候補微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさらに含む、項目45に記載の方法。
(項目47)
候補微生物株の設計を反復して改善するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.(1)1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す入力、および(2)対応する性能尺度を含む訓練セットで設定された予測モデルにアクセスするステップと;
b.遺伝子変化を表す該予測モデルに試験入力を適用するステップであって、該試験入力は、これらの遺伝子変化を組み入れる候補微生物株に対応する、ステップと;
c.該予測モデルに少なくとも部分的に基づいて該候補微生物株の表現型性能を予測するステップと;
d.これらの予測された性能に少なくとも部分的に基づいて該候補微生物株の第1のサブセットを選択するステップと;
e.該候補微生物株の該第1のサブセットの測定された表現型性能を得るステップと;
f.これらの測定された表現型性能に少なくとも部分的に基づいて該候補微生物株の第2のサブセットの選択物を得るステップと;
g.(2)該選択された候補微生物株の第2のサブセットの対応する測定された性能とともに、(1)該選択された候補微生物株の第2のサブセットに対応する入力を該予測モデルの該訓練セットに加えるステップと;
h.(b)〜(g)を繰り返すステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目48)
前記命令が、前記1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、前記システムに、少なくとも1つの候補微生物株の測定された表現型性能が性能測定基準を満たすまで(b)〜(g)を繰り返させる、項目47に記載のシステム。
(項目49)
前記予測モデルへの試験入力の第1の適用の間に、該試験入力によって表される前記遺伝子変化が、前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を含み;
試験入力の後続の適用の間に、該試験入力によって表される該遺伝子変化が、先に選択された候補微生物株の第2のサブセット内の候補微生物株に対する遺伝子変化を含む、項目47に記載のシステム。
(項目50)
前記候補微生物株の前記第1のサブセットの前記選択が、上位性効果に少なくとも部分的に基づく、項目47に記載のシステム。
(項目51)
前記命令が、前記1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、前記システムに、前記第1のサブセットの第1の選択の間に、
前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す複数のそれぞれの入力の適用に応じて、該1つまたは複数のバックグラウンド微生物株の性能尺度間の相違点の程度を決定するステップと;
少なくとも2つの候補微生物株内に組み入れられる遺伝子変化の適用に応じて、該1つまたは複数のバックグラウンド微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、項目50に記載のシステム。
(項目52)
前記命令が、前記1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、前記システムに、前記第1のサブセットの後続の選択の間に、
遺伝子変化を表す複数のそれぞれの入力の適用に応じて、先の第1のサブセット候補微生物株の性能尺度間の相違点の程度を決定するステップであって、該先の第1のサブセット候補微生物株が、該第1のサブセットの先の選択の間に選択された株である、ステップと;
少なくとも2つの候補微生物株内に組み入れられる該遺伝子変化の適用に応じて、該先の第1のサブセット候補微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、項目51に記載のシステム。
(項目53)
候補微生物株の設計を反復して改善するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.(1)1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す入力、および(2)対応する性能尺度を含む訓練セットで設定された予測モデルにアクセスするステップと;
b.遺伝子変化を表す該予測モデルに試験入力を適用するステップであって、該試験入力は、これらの遺伝子変化を組み入れる候補微生物株に対応する、ステップと;
c.該予測モデルに少なくとも部分的に基づいて該候補微生物株の表現型性能を予測するステップと;
d.これらの予測された性能に少なくとも部分的に基づいて該候補微生物株の第1のサブセットを選択するステップと;
e.該候補微生物株の該第1のサブセットの測定された表現型性能を得るステップと;
f.これらの測定された表現型性能に少なくとも部分的に基づいて該候補微生物株の第2のサブセットの選択物を得るステップと;
g.(2)該選択された候補微生物株の第2のサブセットの対応する測定された性能とともに、(1)該選択された候補微生物株の第2のサブセットに対応する入力を該予測モデルの該訓練セットに加えるステップと;
h.(b)〜(g)を繰り返すステップと
をさせる、非一時的コンピューター可読媒体。
(項目54)
前記命令が、実行されるとき、前記1つまたは複数の演算デバイスの少なくとも1つに、少なくとも1つの候補微生物株の測定された表現型性能が性能測定基準を満たすまで(b)〜(g)を繰り返させる、項目53に記載のコンピューター可読媒体。
(項目55)
前記予測モデルへの試験入力の第1の適用の間に、該試験入力によって表される前記遺伝子変化が、前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を含み;
試験入力の後続の適用の間に、該試験入力によって表される該遺伝子変化が、先に選択された候補微生物株の第2のサブセット内の候補微生物株に対する遺伝子変化を含む、項目53に記載のコンピューター可読媒体。
(項目56)
前記候補微生物株の前記第1のサブセットの前記選択が、上位性効果に少なくとも部分的に基づく、項目53に記載のコンピューター可読媒体。
(項目57)
前記命令が、実行されるとき、前記1つまたは複数の演算デバイスの少なくとも1つに、前記第1のサブセットの第1の選択の間に、
前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す複数のそれぞれの入力の適用に応じて、該1つまたは複数のバックグラウンド微生物株の性能尺度間の相違点の程度を決定するステップと;
少なくとも2つの候補微生物株内に組み入れられる遺伝子変化の適用に応じて、該1つまたは複数のバックグラウンド微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、項目56に記載のコンピューター可読媒体。
(項目58)
前記命令が、実行されるとき、前記1つまたは複数の演算デバイスの少なくとも1つに、前記第1のサブセットの後続の選択の間に、
遺伝子変化を表す複数のそれぞれの入力の適用に応じて、先の第1のサブセット候補微生物株の性能尺度間の相違点の程度を決定するステップであって、該先の第1のサブセット候補微生物株が、該第1のサブセットの先の選択の間に選択された株である、ステップと;
少なくとも2つの候補微生物株内に組み入れられる該遺伝子変化の適用に応じて、該先の第1のサブセット候補微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、項目53に記載のコンピューター可読媒体。
(項目59)
候補微生物株の反復改良において上位性効果を適用するためのコンピューター実装方法であって、
少なくとも1つの微生物バックグラウンド株に行われた対応する遺伝子変化に応じて、測定された性能を表すデータを得るステップと;
少なくとも2つの遺伝子変化の対応する応答性能尺度間の相違点の程度に少なくとも部分的に基づいて、該少なくとも2つの遺伝子変化の選択物を得るステップであって、
相違点の該程度が、該少なくとも2つの遺伝子変化が異なる生物学的経路を通じたこれらの対応する応答性能尺度に影響する程度に関連する、ステップと;
該選択された遺伝子変化を含む微生物バックグラウンド株に対する遺伝子変化を設計するステップと
を含む、方法。
(項目60)
前記少なくとも2つの選択された遺伝子変化が設計される前記微生物バックグラウンド株が、測定された応答性能を表すデータが得られた前記少なくとも1つの微生物バックグラウンド株と同じである、項目59に記載の方法。
(項目61)
候補微生物株の反復改良において上位性効果を適用するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
少なくとも1つの微生物バックグラウンド株に行われた対応する遺伝子変化に応じて、測定された性能を表すデータを得るステップと;
少なくとも2つの遺伝子変化の対応する応答性能尺度間の相違点の程度に少なくとも部分的に基づいて、該少なくとも2つの遺伝子変化の選択物を得るステップであって、
相違点の該程度が、該少なくとも2つの遺伝子変化が異なる生物学的経路を通じたこれらの対応する応答性能尺度に影響する程度に関連する、ステップと;
該選択された遺伝子変化を含む微生物バックグラウンド株に対する遺伝子変化を設計するステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
(項目62)
前記少なくとも2つの選択された遺伝子変化が設計される前記微生物バックグラウンド株が、測定された応答性能を表すデータが得られた前記少なくとも1つの微生物バックグラウンド株と同じである、項目61に記載のシステム。
(項目63)
候補微生物株の反復改良において上位性効果を適用するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
少なくとも1つの微生物バックグラウンド株に行われた対応する遺伝子変化に応じて、測定された性能を表すデータを得るステップと;
少なくとも2つの遺伝子変化の対応する応答性能尺度間の相違点の程度に少なくとも部分的に基づいて、該少なくとも2つの遺伝子変化の選択物を得るステップであって、
相違点の該程度が、該少なくとも2つの遺伝子変化が異なる生物学的経路を通じたこれらの対応する応答性能尺度に影響する程度に関連する、ステップと;
該選択された遺伝子変化を含む微生物バックグラウンド株に対する遺伝子変化を設計するステップと
をさせる、非一時的コンピューター可読媒体。
(項目64)
前記少なくとも2つの選択された遺伝子変化が設計される前記微生物バックグラウンド株が、測定された応答性能を表すデータが得られた前記少なくとも1つの微生物バックグラウンド株と同じである、項目63に記載のコンピューター可読媒体。
図1は、多様性プール中のバリエーションを増加させるための本開示のDNA組換えの方法を示す。物理的または酵素的/化学的な手段により、DNA切片、例えば、関連のある種からのゲノム領域を切断することができる。切断したDNA領域を融解し、再アニールさせ、その結果、オーバーラップする遺伝子領域が、ポリメラーゼ伸長反応を開始する。産物が1つまたは複数の出発配列に由来するエレメントを含むキメラDNAに再アセンブルされるまで、後続の融解/伸長反応を実施する。
図2は、選択された配列の改変(例えば、スワップするための100個のSNP)を用いて、新しい宿主生物を生成するための本開示の方法の概要を示す。手短に述べると、方法は以下を含む:(1)所望のDNA挿入断片を、設計し、アセンブリー反応において1つまたは複数の合成オリゴを組み合わせることによって生成する、(2)DNA挿入断片を、形質転換プラスミド中にクローニングする、(3)完成したプラスミドを、所望の産生株中に移入させ、そのプラスミドが宿主株のゲノム中に組み込まれる、および、(4)選択マーカーおよび他の望まれないDNAエレメントを、宿主株からループアウトする。DNAアセンブリーの各ステップは、追加の、品質管理(QC)のステップ、例えば、増幅およびシーケンシングのためにプラスミドをE.coli細菌中にクローニングするステップも含むことができる。
図3は、本開示の形質転換プラスミドアセンブリー、および宿主生物中へのそのプラスミドの組込みを示す。挿入断片DNA(insert DNA)を、アセンブリー反応において1つまたは複数の合成オリゴを組み合わせることによって生成する。所望の配列を含有するDNA挿入断片に、ゲノムの標的領域に相同なDNAの領域を隣接させる。これらの相同領域は、ゲノムの組込みを促進し、一旦組み込まれると、続くステップでベクター骨格のDNAをループアウトするように設計されたダイレクトリピート領域を形成する。アセンブルされたプラスミドは、挿入断片DNAを含有し、任意選択で、1つまたは複数の選択マーカーも含有する。
図4は、選択された、宿主株に由来するDNAの領域をループアウトするための手順を示す。挿入されたDNAおよび宿主ゲノムのダイレクトリピート領域は、組換え事象において「ループアウトする」ことができる。選択マーカーについて対抗選択された細胞は、ダイレクトリピート領域が隣接するループDNAの欠失を含有する。
図5は、本開示の株改良プロセスの実施形態を示す。遺伝子改変を含有する宿主株配列(遺伝子設計)を、多様な株バックグラウンドにおいて、株性能の改善(株構築)について試験する。有益な変異を示す株を分析し(ヒットIDおよび分析)、データを、さらに分析するために、ライブラリー(とりわけ、例えば、SNPスワップライブラリー、PROスワップライブラリーおよびそれらの組合せ)に保存する。追加の反復分析のために、本開示の選択規則により、1つまたは複数のライブラリーに由来するエレメントの組合せについて予測される効果に基づいて新たに提案される宿主株配列が生成される。
図6は、本開示の実施形態のうちの1つのDNAアセンブリー、形質転換および株スクリーニングのステップを示す。図6Aは、DNA断片を構築するためのステップ、前記DNA断片をベクター中にクローニングするためのステップ、前記ベクターを宿主株中に形質転換するためのステップ、および選択配列を対抗選択によりループアウトするためのステップを示す。図6Bは、ハイスループット培養するためのステップ、スクリーニングするためのステップ、および選択された宿主株を評価するためのステップを示す。この図はまた、培養物タンク中の、選択された株の培養、スクリーニングおよび評価を行う任意選択のステップも示す。 図6は、本開示の実施形態のうちの1つのDNAアセンブリー、形質転換および株スクリーニングのステップを示す。図6Aは、DNA断片を構築するためのステップ、前記DNA断片をベクター中にクローニングするためのステップ、前記ベクターを宿主株中に形質転換するためのステップ、および選択配列を対抗選択によりループアウトするためのステップを示す。図6Bは、ハイスループット培養するためのステップ、スクリーニングするためのステップ、および選択された宿主株を評価するためのステップを示す。この図はまた、培養物タンク中の、選択された株の培養、スクリーニングおよび評価を行う任意選択のステップも示す。
図7は、本開示の自動化されたシステムの一実施形態を示す。本開示は、宿主生物のクローニング、形質転換、培養、スクリーニングおよび/またはシーケンシングが可能な多様なモジュールを有する自動化されたロボットシステムの使用を教示する。
図8は、本開示の宿主株改良プログラムの実施形態の概要を示す。
図9は、およそ3.2×10個の塩基対を含むCorynebacterium glutamicumのゲノムを描写する。
図10は、本開示の形質転換の実験結果を示す。0.5kb〜5.0kbの範囲のDNA挿入断片を、Corynebacterium glutamicumのゲノムの(相対的な位置1〜24として示す)多様な領域への挿入に対して標的化した。明るい色により、組込みの成功を示し、一方、より暗い色により、挿入の失敗を示す。
図11は、第2のラウンドのHTP操作PROスワッププログラムの結果を示す。PROスワップの第1のラウンドの間に同定したプロモーター::遺伝子の上位の組合せを、本開示の方法に従って分析して、宿主の性能に対して相加的またはコンビナトリアルに有益な効果を示す可能性があろう、前記変異の組合せを同定した。したがって、第2のラウンドのPROスワップ変異体は、多様なプロモーター::遺伝子の変異の対の組合せを含んだ。結果として得られた第2のラウンドの変異体を、選択された生体分子の宿主細胞の収率の差についてスクリーニングした。有益な効果を示すことが予測されていた、変異の組合せの対が、円を用いて強調されている。
図12は、E.coli中に形質転換したプラスミドに関するプラスミドアセンブリーの成功について試験した実験結果を示す。1kbおよび2kbの挿入配列を含有するプラスミドについては、4つのコロニーを選べば、13%の失敗率を実践するのに十分である。より大きな挿入は、一貫性のある結果をなしとげるのに、追加のコロニースクリーニングを必要とする場合がある。
図13は、Corynebacterium glutamicumの挿入ベクターによる形質転換の成功について試験した実験結果を示す。2kbおよび5kbのDNA挿入断片のサイズは、高い形質転換率を示し、アセンブリーの失敗率は低かった。
図14は、Corynebacterium glutamicumにおけるループアウト選択の結果を示す。形質転換された細菌のスクロース耐性により、sacB選択マーカーがループアウトされたことが示される。DNA挿入断片のサイズが、ループアウト効率に影響を及ぼすようには見えない。
図15は、相関性の尺度を使用して計算した類似性マトリックスである。マトリックスにより、SNPバリアント間の機能類似性が描写される。低い機能類似性を有するSNPの統合は、より高い機能類似性を有するSNPの統合とは対照的に、株性能を改善する可能性がより高いことが期待される。
図16A〜Bは、上位性マッピングの実験結果を示す。低い機能類似性を有するSNPスワップとPROスワップとの組合せにより、改良された株性能が得られる。図16Aは、すべてのSNP/PROスワップの機能類似性によりクラスター化された樹状図を示す。図16Bは、産物の収率により測定した場合の、宿主株の、統合したSNPの性能を示す。より大きなクラスターの距離が、宿主株の統合性能の改善と相関する。
図17A〜Bは、多様性プール中の株バリアント間のSNPの差を示す。図17Aは、この実験の株の間の関係を示す。株Aは、野生型の宿主株である。株Bは、中間の、操作された株である。株Cは、工業生産用の株である。図17Bは、各株において、ユニークなSNPおよび共有されているSNPの数を同定するグラフである。
図18は、本開示の方法に従う第1のラウンドのSNPスワッピングの実験を示す。(1)CからのSNPをすべて、基準株A中に個々および/またはコンビナトリアルにクローニングする(AからCへの「ウェーブアップ」)。(2)CからのSNPをすべて、市販株Cから個々および/またはコンビナトリアルに除去する(CからAへの「ウェーブダウン」)。(3)BからのSNPをすべて、基準株A中に個々および/またはコンビナトリアルにクローニングする(AからBへのウェーブアップ)。(4)BからのSNPをすべて、市販株Bから個々および/またはコンビナトリアルに除去する(BからAへのウェーブダウン)。(5)CにユニークなSNPをすべて、個々および/またはコンビナトリアルに市販株B中にクローニングする(BからCへのウェーブアップ)。(6)CにユニークなSNPをすべて、市販株Cから個々および/またはコンビナトリアルに除去する(CからBへのウェーブダウン)。
図19は、プロモータースワップのプロセスにおいて利用される遺伝子標的の例を示す。
図20は、同定した遺伝子標的についてプロモータースワップのプロセスを実施するために利用されている例示的なプロモーターライブラリーを示す。PROスワップ(すなわち、プロモータースワップ)のプロセスにおいて利用されるプロモーターは、P〜Pであり、それらの配列および同一性は、表1に見出すことができる。
図21は、プロモータースワッピングの遺伝子の結果は、標的とされる特定の遺伝子に依存することを示す。
図22は、リシンの収率に対する性能に有意に影響を及ぼす改変を示す、例示的なHTPプロモータースワッピングのデータを示す。X軸は、プロモータースワップ遺伝子設計微生物株ライブラリー内の異なる株を表し、Y軸は、各株についてのリシンの収率の相対的な値を含む。グラフ上の各文字が、PROスワップの標的遺伝子を表す。各データ点が、反復を表す。データは、本明細書に記載の、HTPの適用例に適応させた分子ツール(すなわち、PROスワップ)は、目的の化合物または分子を産生するために、効率的に、微生物株を創製し、その株性能を最適化することが可能であることを実証している。この場合、目的の化合物は、リシンであった;しかし、教示するPROスワップの分子ツールを利用して、任意の目的の化合物の産生を最適化し、かつ/または増加させることができる。当業者であれば、いかにして所望の化合物の産生をコードする標的遺伝子を選び、次いで、教示するPROスワップの手順を利用するかを理解するはずである。本明細書で教示するリシンの収率の増加を例示するのに示したデータと、本出願中に提示する詳細な開示とにより、PROスワップの分子ツールが、HTPゲノム操作の広く適用可能な進歩となり得ることを当業者は容易に認識するはずである。
図23は、検討中のインプットデータについての相対的な株性能の分布を示す。ゼロの相対的な性能は、操作された株がプレート中の基準株に等しく良好に機能したことを示す。本明細書に記載するプロセスは、ゼロを有意に上回って機能する可能性がある株を同定するように設計される。
図24は、相対的な株性能の平均変化(増加または減少)を示す線形回帰係数値を示し、該株性能は、表示する株中に組み入れている各遺伝子変化と関連がある。
図25は、予測される株の設計の上位100個についての変化の組成(composition of change)を示す。x軸に、潜在的な遺伝子変化(dss変異はSNPスワップであり、Pcg変異はPROスワップである)のプールを列挙し、y軸に、順位を示す。黒色のセルにより、候補の設計における特定の変化の存在を示し、一方、白色のセルにより、そうした変化の不在を示す。この特定の例では、上位100個の設計はすべて、pcg3121_pgi、pcg1860_pyc、dss_339およびpcg0007_39_lysaの変化を含有する。加えて、上位の候補の設計は、dss_034、dss_009の変化を含有する。
図26は、本開示の実施形態のうちの1つの、DNAアセンブリーおよび形質転換のステップを示す。フローチャートは、DNA断片を構築するためのステップ、前記DNA断片をベクター中にクローニングするためのステップ、前記ベクターを宿主株中に形質転換するためのステップ、および選択配列を対抗選択によりループアウトするためのステップを示す。
図27は、ハイスループット培養するためのステップ、スクリーニングするためのステップ、および選択された宿主株を評価するためのステップを示す。この図はまた、培養物タンク中の、選択された株の培養、スクリーニングおよび評価を行う任意選択のステップも示す。
図28は、本開示のプロモーターラダーに従って一連の調節性の発現を示す、例示的なプロモーターの発現プロファイルを示す。プロモーターAの発現は、細菌培養の誘導期にピークに達し、一方、プロモーターBおよびCはそれぞれ、対数期および定常期にピークに達する。
図29は、本開示のプロモーターラダーに従って一連の調節性の発現を示す、例示的なプロモーターの発現プロファイルを示す。プロモーターAの発現は、選択された基質を添加すると、即時にピークに達するが、基質の濃度が低下するにつれて、検出不能なレベルに急速に戻る。プロモーターBの発現は、選択された基質を添加すると、即時にピークに達し、基質の対応する低下と一緒に、ゆっくり低下して、検出不能なレベルに戻る。プロモーターCの発現は、選択された基質を添加すると、ピークに達し、培養全体を通して、基質が消散してしまった後でさえ、高度な発現状態を維持する。
図30は、本開示のプロモーターラダーに従って一連の構成性の発現レベルを示す、例示的なプロモーターの発現プロファイルを示す。プロモーターAは、最も低い発現を示し、それに続いて、プロモーターBおよびCがそれぞれ、発現レベルを増加させる。
図31は、株改良のための本開示のLIMSシステムの実施形態を図示する。
図32は、本開示のLIMSシステムの実施形態のクラウドコンピューティングの実装を図示する。
図33は、本開示の反復予測株設計ワークフローの実施形態を示す。
図34は、本開示の実施形態に従う、コンピューターシステムの実施形態を図示する。
図35は、本開示の一実施形態に従うDNAアセンブリーに関連するワークフローを示す。このプロセスは、4つの段階:重要部分(part)の生成、プラスミドアセンブリー、プラスミドのQC、および形質転換のためのプラスミドの調製に分けられる。重要部分の生成の間に、オリゴのシーケンシングのベンダーから、Laboratory Information Management System(LIMS)により設計されたオリゴを発注し、宿主生物から標的配列をPCRにより増幅するために使用する。これらのPCRの重要部分は、清浄して、混入物を除去し、断片の分析により、すなわち、観察される断片サイズと理論的な断片サイズとのin silicoでの品質管理比較、およびDNAの定量を行って、成功について評価する。重要部分を、酵母中にアセンブリーベクターと一緒に形質転換し、プラスミド中に相同組換えによりアセンブルする。アセンブルされたプラスミドを、酵母から単離し、E.coli中に形質転換して、続いて、アセンブリーの品質管理および増幅を行う。プラスミドアセンブリーの品質管理の間に、各プラスミドのいくつかの複製物を単離し、ローリングサークル増幅(RCA)を使用して増幅し、正確なアセンブリーについて酵素消化および断片の分析により評価する。QCプロセス中に同定した正確にアセンブルされたプラスミドをヒットピッキングし、恒久的なストックを生成し、プラスミドDNAを抽出し、定量してから、標的宿主生物中に形質転換する。
図36は、ターミネーターT1〜T8の効果を、2つの培地中で2つの時点にわたり特徴付けた実験結果を示す。条件Aおよび条件Cは、BHI培地についての2つの時点を表し、一方、B点およびD点は、HTP試験培地についての2つの時点を表す。
図37は、UV変異誘発などの従来の株改良アプローチの有効性と、本開示のHTP操作の方法論とを比較した実験結果を示す。圧倒的多数のUV変異は、宿主細胞の性能の目立った増加をもたらさなかった。対照的に、本開示のPROスワップの方法論は、宿主細胞の性能の1.2〜2倍の増加を示す変異体を高い比率で産生した。
図38は、第1のラウンドのHTP操作SNPスワッププログラムの結果を示す。186個の個別のSNP変異を同定し、基準株上に個々にクローニングした。結果として得られた変異体を、選択された生体分子の宿主細胞の収率の差についてスクリーニングした。
図39は、第2のラウンドのHTP操作SNPスワッププログラムの結果を示す。第1のラウンドのSNPスワッププログラムからの176個の個別のSNP変異を、第1のラウンドのSNPプログラムの間に同定した有益なSNPを含有する第2のラウンドの宿主細胞株中に個々にクローニングした。したがって、結果として得られた変異体は、2つの変異を組み合わせた対の効果を表す。選択された生体分子に関して、宿主細胞の収率(Y軸)および生産性(X軸)における差についてのスクリーニングの結果を示す。
図40は、タンク発酵のバリデーション実験の結果を示す。HTP SNPスワップの第2のラウンドからの変異の上位の対を、発酵タンク中で培養した。選択された生体分子(すなわち、リシン)に関して、宿主細胞の収率および生産性についての結果を示す。認め得るように、本発明者らは、1つのラウンドのゲノム操作において、PROスワップ手順を利用して、特定のPROスワップ変異体(zwf)が、基準株と比較して(すなわち、基準株と、基準株+zwfとを比較して)、選択された生体分子の収率の増加を示すことを決定した。次いで、本発明者らは、別のラウンドのゲノム操作を実施し、この場合、SNPスワップ手順を使用して、前記PROスワップ変異体と組み合わせた場合に、生体分子の収率に影響を及ぼすことができる有益なSNP変異を決定した。PROスワップ手順とSNPスワップ手順との組合せにより、これまでのPROスワップのみの変異体よりも(すなわち、基準株+zwf+SNP121と、これまでに論じた基準株+zwfとを比較して)、さらに高い収率を有する変異体が創製された。この図は、本開示のPROスワップ手順とSNPスワップ手順とを組み合わせることによってなしとげることができる収率の劇的な改善を示す。PROスワップゲノム操作キャンペーンとSNPスワップゲノム操作キャンペーンとを組み合わせる態様では、目的の生体分子/産物の収率および/または生産性を、基準株と比べて、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%、45%、50%またはそれ超だけ増加させることができる。
図41は、第1のラウンドのHTP操作PROスワッププログラムの結果を示す。本開示の方法に従って、宿主の性能と関連があると考えられる、選択された遺伝子を、プロモーターラダーと組み合わせて、第1のラウンドのPROスワップライブラリーを創製した。結果として得られた変異体を、選択された生体分子(すなわち、リシン)の宿主細胞の収率の差についてスクリーニングした。
図42は、本開示の実施形態に従って、微生物株を設計するための変異の選択における上位性効果の考慮事項を示すフローチャートである。
図43A〜Bは、本開示の方法に従うA.nigerの形質転換およびバリデーションの結果を示す。図43Aは、A.nigerの形質転換体の96ウェル培地プレートの写真である。形質転換された培養物は、aygAにおける変異を含み、このことにより、細胞が、黒色の代わりに、より薄い黄色に見えるようになる(形質転換されたウェルは、白色の円で囲まれている)。図43Bは、形質転換されたA.nigerの変異体の次世代シーケンシングの結果を示す。X軸は、形質転換されていない親株との標的DNAの配列同一性を表す。Y軸は、期待される変異との標的DNAの配列同一性を表す。チャートの右下辺りのデータ点は、親株との高い類似性、および期待される形質転換された配列との低い類似性を示す。チャートの左上辺りのデータ点は、期待される形質転換された配列に対する高い類似性、および親株との低い同一性を示す。中央にあるデータ点は、複数の核を有する異核共存体を表す可能性がある。
図44A〜Bは、A.nigerにおけるSNPスワップのインプリメンテーションを示す。図44Aは、SNPスワップの各SNPについての遺伝子の編集の設計を示す。図はさらに、pyrG遺伝子を、aygA野生型遺伝子の遺伝子座中に導入する共形質転換も示す。図44Bは、A.nigerの形質転換体をスクリーニングするための96ウェル培地プレートの2つの写真である。薄黄色のコロニーは、aygA遺伝子の破壊が成功している形質転換体を表わす。
図45は、次世代シーケンシングの結果に基づく、成功したA.niger変異体形質転換体(上のボックス)を同定する品質管理(QC)チャートを示す。培養プレートから選択された黄色コロニーのうち、全部で29.2%が、期待されるSNPの遺伝子変化を示す。
図46は、形質転換されたA.nigerの変異体の次世代シーケンシングの結果を示す。X軸は、形質転換されていない親株との標的DNAの配列同一性を表す。Y軸は、期待される変異との標的DNAの配列同一性を表す。チャートの右下辺りのデータ点は、親株との高い類似性、および期待される形質転換された配列との低い類似性を示す。チャートの左上辺りのデータ点は、期待される形質転換された配列に対する高い類似性、および親株との低い同一性を示す。中央にあるデータ点は、複数の核を有する異核共存体を表す可能性がある。
図47は、本開示の収率モデルに関して、訓練データの測定された性能と比した予測される性能のドットプロットである。基礎をなすモデルは、(4次多項式カーネルを用いる)カーネルリッジ回帰モデルである。モデルを、1864個のユニークな遺伝子構築物および関連する表現型の性能に対して訓練する。適合させたモデルは、0.52のr2値を有する。
図48は、本開示の予測アルゴリズムにより生成された候補の設計の遺伝子構成を示す。これらの候補の設計を、HTPの構築および分析に提出した。ここでは、候補の設計は、親株idと導入された変異(複数可)との組合せとして定義される。
図49は、本開示の予測アルゴリズムにより生成され、本開示のHTP構築法に従って構築した候補の設計の測定された性能と比した予測される性能のドットプロットである。この図は、モデルが、候補株の性能を許容できる精度内で予測することができることを示す。
図50は、親株に対する候補株の収率のパーセント変化を示す箱ひげ図である。y軸上では、0.01の値が、1%に相当する。この図は、コンピューターモデルにより設計された株(薄い灰色)が、それらに対応する親株を上回る測定可能な改善をなしとげることを示す。加えて、図は、これらのモデル基準株の改善の大きさが、ヒト専門家が設計した株によりなしとげられた改善に匹敵することも示す。
図51は、コンピューターモデルにより設計された株(暗灰色)およびヒト専門家により設計された株(薄い灰色)についての収率による性能の分布を示す。コンピューターにより設計された株は、より密な分布を示し、獲得中央値がより高かった。
図52は、コンピューターにより生成された候補株(薄い灰色)またはヒト専門家により生成された候補株(暗灰色)の絶対的な収率を示す箱ひげ図である。結果は、親株毎に総計されている。
定義
以下の用語は、当業者であればよく理解していると考えられるが、以下の定義を、本開示の主題の説明を容易にするために示す。
用語「a」または「an」は、そのエンティティの1つまたは複数を指し、すなわち、複数形の指示対象を指すことができる。したがって、用語「a」または「an」、「1つまたは複数」および「少なくとも1つ」は、本明細書で互換的に使用される。さらに、不定冠詞「a」または「an」による「要素」への言及は、文脈により唯一の要素が存在することが明確に要求されない限り、1つを超える要素が存在する可能性を除外しない。
本明細書で使用される場合、用語「細胞生物」、「微生物(microorganism)」、また
は「微生物(microbe)」は、広く解釈されるべきである。これらの用語は、互換的に使
用され、これらに限定されないが、2つの原核生物ドメイン、細菌および古細菌、ならびにある特定の真核真菌および原生生物を含む。一部の実施形態では、本開示は、本開示内に存在するリスト/表および図面の「微生物(microorganism)」または「細胞生物」ま
たは「微生物(microbe)」に言及する。この特徴付けは、表および図面の同定された分類学的な属だけでなく、同定された分類学的な種、ならびに前記表または図面内の任意の生物体の様々な新規のおよび新しく同定または設計された株も参照することができる。同じ特徴付けが、実施例などの本明細書の他の部分におけるこれらの用語の記述にも当てはまる。
用語「原核生物」は、当技術分野で認識されており、核または他の細胞小器官を含有しない細胞を指す。原核生物は一般に、2つのドメイン、細菌および古細菌の1つに分類される。古細菌と細菌ドメインの生物体間の決定的な差異は、16SリボソームRNA内のヌクレオチド塩基配列の基本的な差異に基づく。
用語「古細菌」は、Mendosicutes門の生物体のカテゴリー分類を指し、典型的には、珍しい環境内で見つかり、リボソームタンパク質の数および細胞壁におけるムラミン酸の欠如を含めたいくつかの判定基準によって原核生物の残りと区別される。ssrRNA分析に基づいて、古細菌は、2つの系統学的に別個の群:CrenarchaeotaおよびEuryarchaeotaからなる。これらの生理機能に基づいて、古細菌は、3つのタイプ:メタン生成菌(メタンを産生する原核生物);高度好塩菌(非常に高濃度の塩(NaCl)で生きる原核生物);および高度(超)好熱菌(thermophilus)(非常に高温で生きる原核生物)へと整理することができる。古細菌を細菌と区別する統一的古細菌フィーチャ(すなわち、細胞壁内にムレインが無いこと、エステル連結膜脂質など)に加えて、これらの原核生物は、これらをその特定の生息環境に適応させるユニークな構造的または生化学的属性を呈する。Crenarchaeotaは、超好熱性硫黄依存性原核生物から主になり、Euryarchaeotaは、メタン生成菌および高度好塩菌を含有する。
「細菌」または「真正細菌」は、原核生物体のドメインを指す。細菌は、以下の少なくとも11の別個の群を含む:(1)2つの主要な亜門:(1)高G+C群(Actinomycetes、Mycobacteria、Micrococcus、その他)(2)低G+C群(Bacillus、Clostridia、Lactobacillus、Staphylococci、Streptococci、Mycoplasmas)が存在するグラム陽性(グラム+)細菌;(2)Proteobacteria、例えば、紅色光合成+非光合成グラム陰性細菌(最も「一般的な」グラム陰性細菌を含む);(3)ラン藻類、例えば、酸素発生型光合成生物;(4)スピロヘータおよび関連種;(5)Planctomyces;(6)Bacteroides、Flavobacteria;(7)Chlamydia;(8)緑色硫黄細菌;(9)緑色非硫黄細菌(嫌気性光合成生物も);(10)放射線抵抗性ミクロコッカスおよび類縁体;(11)ThermotogaおよびThermosipho thermophiles。
「真核生物」は、細胞が、膜内に囲まれた核および他の小器官を含有する任意の生物体である。真核生物は、分類群EukaryaまたはEukaryotaに属する。真核細胞を原核細胞(上述の細菌および古細菌)から分離する決定的なフィーチャは、これらが膜結合型小器官、特に、遺伝物質を含有し、核包膜によって囲まれている核を有することである。
用語「遺伝的に改変された宿主細胞」、「組換え宿主細胞」、および「組換え株」は、本明細書で互換的に使用され、本開示のクローニングおよび形質転換方法によって遺伝的に改変された宿主細胞を指す。よって、この用語は、宿主細胞(例えば、細菌、酵母細胞、真菌細胞、CHO、ヒト細胞など)であって、それが由来した天然に存在する生物体と比較して、それが変更された、改変された、または異なる遺伝子型および/または表現型(例えば、遺伝子改変が微生物のコーディング核酸配列に影響するとき)を呈するように遺伝的に変更、改変、または操作された、宿主細胞を含む。一部の実施形態では、この用語は、問題の特定の組換え宿主細胞だけでなく、このような宿主細胞の子孫または潜在的な子孫も指すことが理解される。
用語「野生型微生物」または「野生型宿主細胞」は、天然に存在する細胞、すなわち、遺伝的に改変されていない細胞を記述する。
用語「遺伝子操作された」は、宿主細胞のゲノムの任意のマニピュレーション(例えば、核酸の挿入、欠失、変異、または置き換えによる)を指すことができる。
用語「対照」または「対照宿主細胞」は、遺伝子改変または実験処置の効果を決定するための適切な比較宿主細胞(comparator host cell)を指す。一部の実施形態では、対照宿主細胞は、野生型細胞である。他の実施形態では、対照宿主細胞は、処置宿主細胞を差別化する遺伝子改変(複数可)を除いて、遺伝的に改変された宿主細胞と遺伝的に同一である。一部の実施形態では、本開示は、対照宿主細胞としての親株(例えば、株改良プログラムの基礎として使用されたS株)の使用を教示する。他の実施形態では、宿主細胞は、処置宿主細胞において試験されている特異的プロモーターまたはSNPを欠く遺伝的に同一の細胞であり得る。
本明細書で使用される場合、用語「対立遺伝子(複数可)」は、遺伝子の1つまたは複数の代替形態のいずれかを意味し、これらの対立遺伝子すべては、少なくとも1つの形質または特性と関係する。二倍体細胞では、所与の遺伝子の2つの対立遺伝子は、一対の相同染色体上の対応する遺伝子座を占有する。
本明細書で使用される場合、用語「遺伝子座(locus)」(遺伝子座(loci)複数形)
は、例えば、遺伝子または遺伝子マーカーが見出される染色体上の具体的な1つもしくは複数の場所または部位を意味する。
本明細書で使用される場合、用語「遺伝的に連結された」は、2種またはそれ超の形質であって、これらが交雑によって分離するのが困難であるように、繁殖中に高い割合で共遺伝される、形質を指す。
本明細書で使用される「組換え」または「組換え事象」は、染色体交差または独立組合せを指す。
本明細書で使用される場合、用語「表現型」は、個々の遺伝子構造(すなわち、遺伝子型)と環境との間の相互作用から生じる個々の細胞、細胞培養物、生物体、または生物体の群の観察可能な特性を指す。
本明細書で使用される場合、用語「キメラの」または「組換えの」は、核酸配列またはタンパク質配列を記述するとき、少なくとも2つの異種ポリヌクレオチドもしくは2つの異種ポリペプチドを連結して単一の巨大分子にする、または少なくとも1つの天然の核酸もしくはタンパク質配列の1つもしくは複数のエレメントを再編成する核酸またはタンパク質配列を指す。例えば、用語「組換えの」は、例えば、化学合成による、または遺伝子操作技法による核酸の単離セグメントのマニピュレーションによる、配列の2つの別の方法で分離されたセグメントの人工の組合せを指すことができる。
本明細書で使用される場合、「合成ヌクレオチド配列」または「合成ポリヌクレオチド配列」は、天然に存在することが知られていない、または天然に存在しないヌクレオチド配列である。一般に、このような合成ヌクレオチド配列は、任意の他の天然に存在するヌクレオチド配列と比較したとき、少なくとも1つのヌクレオチド差異を含む。
本明細書で使用される場合、用語「核酸」は、リボヌクレオチドもしくはデオキシリボヌクレオチドのいずれか、またはこれらの類似体の、任意の長さのヌクレオチドのポリマー形態を指す。この用語は、分子の一次構造を指し、よって、二本鎖および一本鎖DNA、ならびに二本鎖および一本鎖RNAを含む。これは、修飾核酸、例えば、メチル化および/またはキャッピングされた核酸、修飾塩基、主鎖修飾を含有する核酸なども含む。用語「核酸」および「ヌクレオチド配列」は、互換的に使用される。
本明細書で使用される場合、用語「遺伝子」は、生物学的機能と関連したDNAの任意のセグメントを指す。よって、遺伝子は、これらに限定されないが、コード配列および/またはこれらの発現に要求される調節配列を含む。遺伝子は、例えば、他のタンパク質の認識配列を形成する非発現DNAセグメントも含み得る。遺伝子は、目的の源からのクローニング、または公知のもしくは予測された配列情報からの合成を含めた、様々な源から得ることができ、所望のパラメータを有するように設計された配列を含み得る。
本明細書で使用される場合、用語「相同の」または「相同体」または「オルソログ」は、当技術分野で公知であり、共通の祖先またはファミリーメンバーを共有し、配列同一性の程度に基づいて決定される関連配列を指す。用語「相同性」、「相同の」、「実質的に同様の」、および「実質的に対応する」は、本明細書で互換的に使用される。これらは、核酸断片であって、1つまたは複数のヌクレオチド塩基の変化が、遺伝子発現を媒介し、またはある特定の表現型を生じさせる核酸断片の能力に影響しない、核酸断片を指す。これらの用語は、本開示の核酸断片の修飾、例えば、最初の無修飾断片と比べて得られる核酸断片の機能的性質を実質的に変更しない1つまたは複数のヌクレオチドの欠失または挿入も指す。したがって、当業者が十分に理解するように、本開示は、具体的な例示的な配列より多くを包含することが理解される。これらの用語は、1つの種、亜種、種類、栽培品種、または株内に見出される遺伝子と、別の種、亜種、種類、栽培品種、または株内の対応するまたは等価な遺伝子との間の関係を記述する。本開示の目的に関して、相同配列が比較される。「相同配列」または「相同体」または「オルソログ」は、機能的に関連していると見なされ、考えられ、または知られている。機能的関係は、これらに限定されないが、(a)配列同一性の程度および/または(b)同じもしくは同様の生物学的機能を含めた、いくつかのやり方のいずれか1つにおいて示され得る。好ましくは、(a)および(b)の両方が示される。相同性は、当技術分野で容易に利用可能なソフトウェアプログラム、Current Protocols in Molecular Biology(F.M. Ausubelら編、1987
年)補遺30、セクション7.718、表7.71に論じられたものなどを使用して決定することができる。いくつかの整列プログラムは、MacVector(Oxford Molecular Ltd、Oxford、U.K.)、ALIGN Plus(Scientific and Educational Software、Pennsylvania)、およびAlignX(Vector NTI、Invitrogen、Carlsbad、CA)である。別の整列プログラムは、デフォルトパラメータを使用するSequencher(Gene Codes、Ann Arbor、Michigan)である。
本明細書で使用される場合、用語「内在性の」または「内在性遺伝子」は、天然に存在する遺伝子であって、それが宿主細胞ゲノム内に天然に見出される場所における天然に存在する遺伝子を指す。本開示との関連で、異種プロモーターを内在性遺伝子に作動可能に連結することは、既存の遺伝子であって、その遺伝子が天然に存在する場所における、既存の遺伝子の前に異種プロモーター配列を遺伝的に挿入することを意味する。本明細書に記載の内在性遺伝子は、本開示の方法のいずれかによって変異された天然に存在する遺伝子の対立遺伝子を含み得る。
本明細書で使用される場合、用語「外因性の」は、用語「異種の」と互換的に使用され、その生来の源(native source)以外の何らかの源に由来する物質を指す。例えば、用語「外因性タンパク質」または「外因性遺伝子」は、非生来の源または場所由来であり、生物系に人工的に供給されたタンパク質または遺伝子を指す。
本明細書で使用される場合、用語「ヌクレオチド変化」は、当技術分野でよく理解されているように、例えば、ヌクレオチド置換、欠失、および/または挿入を指す。例えば、変異は、サイレント置換、付加、または欠失を生じさせるが、コードされるタンパク質の性質もしくは活性、またはタンパク質が作製される方法を変更しない変更を含有する。
本明細書で使用される場合、用語「タンパク質修飾」は、当技術分野でよく理解されているように、例えば、アミノ酸置換、アミノ酸修飾、欠失、および/または挿入を指す。
本明細書で使用される場合、用語、核酸またはポリペプチドの「少なくとも一部」または「断片」は、このような配列の最小限のサイズ特性を有する部分、または最大で全長分子の、および全長分子を含めた、全長分子の任意のより大きい断片を意味する。本開示のポリヌクレオチドの断片は、遺伝子調節エレメントの生物活性部分をコードすることができる。遺伝子調節エレメントの生物活性部分は、遺伝子調節エレメントを含む本開示のポリヌクレオチドの1つの部分を単離し、本明細書に記載の活性を評価することによって調製することができる。同様に、ポリペプチドの部分は、4アミノ酸、5アミノ酸、6アミノ酸、7アミノ酸などであり得、最大で全長ポリペプチドまで伸び得る。使用される部分の長さは、特定の用途に依存する。ハイブリダイゼーションプローブとして有用な核酸の部分は、12ヌクレオチドという短さであり得;一部の実施形態では、それは、20ヌクレオチドである。エピトープとして有用なポリペプチドの部分は、4アミノ酸という短さであり得る。完全長ポリペプチドの機能を果たすポリペプチドの部分は一般に、4アミノ酸より長いはずである。
バリアントポリヌクレオチドは、DNAシャッフリングなどの変異誘発および組換え誘導(recombinogenic)手順に由来する配列も包含する。このようなDNAシャッフリングのストラテジーは、当技術分野で公知である。例えば、Stemmer(1994年)、PNAS、
91巻:10747〜10751頁;Stemmer(1994年)、Nature、370巻:38
9〜391頁;Crameriら(1997年)、Nature Biotech.、15巻:436〜438
頁;Mooreら(1997年)、J. Mol. Biol.、272巻:336〜347頁;Zhangら
(1997年)、PNAS、94巻:4504〜4509頁;Crameriら(1998年)、Nature、391巻:288〜291頁;ならびに米国特許第5,605,793号および同
第5,837,458号を参照。
本明細書に開示のポリヌクレオチドのPCR増幅に関して、オリゴヌクレオチドプライマーを、目的の任意の生物体から抽出されたcDNAまたはゲノムDNAから対応するDNA配列を増幅するためのPCR反応で使用するのに設計することができる。PCRプライマーを設計しPCRクローニングするための方法は、当技術分野で一般に公知であり、Sambrookら(2001年)、Molecular Cloning:A Laboratory Manual(3版、Cold Spring Harbor Laboratory Press、Plainview、New York)に開示されている。Innisら編(1990年)、PCR Protocols: A Guide to Methods and Applications(Academic Press、New York);InnisおよびGelfand編(1995年)、PCR Strategies(Academic Press、New York);ならびにInnisおよびGelfand編(1999年)PCR Methods Manual(Academic Press、New York)も参照。PCRの公知の方法としては、これらに限定されないが、対プライマー、ネステッドプライマー、単一特異的プライマー、縮重プライマー、遺伝子特異的プライマー、ベクター特異的プライマー、部分ミスマッチプライマーなどを使用する方法が挙げられる。
本明細書で使用される用語「プライマー」は、増幅標的にアニールし、DNAポリメラーゼを結合させ、それによって、プライマー伸長産物の合成が誘導される条件下で、すなわち、ヌクレオチド、およびDNAポリメラーゼなどの重合のための作用物質の存在下で、かつ適当な温度およびpHで配置されたとき、DNA合成の開始点として機能を果たすことができるオリゴヌクレオチドを指す。(増幅)プライマーは、好ましくは、増幅の効率を最大にするために一本鎖である。好ましくは、プライマーは、オリゴデオキシリボヌクレオチドである。プライマーは、重合のための作用物質の存在下で伸長産物の合成をプライムするのに十分長くなければならない。プライマーの正確な長さは、プライマーの温度および組成(A/T対G/C含有量)を含めた多くの因子に依存する。一対の双方向性プライマーは、PCR増幅などのDNA増幅の技術分野で一般に使用されるように、1つの順方向プライマーおよび1つの逆方向プライマーからなる。
本明細書で使用される場合、「プロモーター」は、コード配列または機能RNAの発現を制御することができるDNA配列を指す。一部の実施形態では、プロモーター配列は、近位およびより遠位の上流エレメントからなり、後者のエレメントは、エンハンサーと呼ばれることが多い。したがって、「エンハンサー」は、プロモーター活性を刺激することができるDNA配列であり、プロモーターの固有のエレメントまたはプロモーターのレベルもしくは組織特異性を増強するために挿入される異種エレメントであり得る。プロモーターは、その全体が生来の遺伝子に由来する場合があり、または天然に見出される異なるプロモーターに由来する異なるエレメントから構成される場合があり、または合成DNAセグメントを含むことさえできる。異なるプロモーターは、異なる組織もしくは細胞型における、または発達の異なる段階における、または異なる環境条件に応じて遺伝子の発現を指示することができることが当業者によって理解されている。ほとんどの場合、調節配列の正確な境界は、完全に画定されていないので、あるバリエーションのDNA断片は、同一のプロモーター活性を有し得ることがさらに認識されている。
本明細書で使用される場合、語句「組換えコンストラクト」、「発現コンストラクト」、「キメラコンストラクト」、「コンストラクト」、および「組換えDNAコンストラクト」は、本明細書で互換的に使用される。組換えコンストラクトは、核酸断片の人工の組合せ、例えば、天然に一緒に見出されない調節配列およびコード配列を含む。例えば、キメラコンストラクトは、異なる源に由来する調節配列およびコード配列、または同じ源に由来するが、天然に見出されるものと異なる様式で配列されている調節配列およびコード配列を含み得る。このようなコンストラクトは、それ自体で使用することができ、またはベクターと併せて使用することができる。ベクターが使用される場合、ベクターの選択は、当業者に周知であるように、宿主細胞を形質転換するのに使用される方法に依存する。例えば、プラスミドベクターを使用することができる。当業者は、本開示の単離核酸断片のいずれかを含む宿主細胞を順調に形質転換、選択、および増殖させるためにベクター上に存在しなければならない遺伝子エレメントをよく知っている。当業者は、異なる独立した形質転換事象は、異なるレベルおよびパターンの発現をもたらし(Jonesら(1985
年)、EMBO J.、4巻:2411〜2418頁;De Almeidaら(1989年)、Mol. Gen. Genetics、218巻:78〜86頁)、よって、所望の発現レベルおよびパターン
をディスプレイする系(line)を得るために、複数の事象がスクリーニングされなければならないことも認識する。このようなスクリーニングは、とりわけ、DNAのサザン分析、mRNA発現のノーザン分析、タンパク質発現のイムノブロッティング分析、または表現型分析によってなしとげることができる。ベクターは、自発的に複製する、または宿主細胞の染色体内に組み込むことができるプラスミド、ウイルス、バクテリオファージ、プロ−ウイルス、ファージミド、トランスポゾン、人工染色体などであり得る。ベクターは、自律複製していない裸のRNAポリヌクレオチド、裸のDNAポリヌクレオチド、同じ鎖内のDNAおよびRNAの両方から構成されるポリヌクレオチド、ポリリシンコンジュゲートDNAまたはRNA、ペプチドコンジュゲートDNAまたはRNA、リポソームコンジュゲートDNAなどでもあり得る。本明細書で使用される場合、用語「発現」は、機能的最終産物、例えば、mRNAまたはタンパク質(前駆体または成熟)の産生を指す。
「作動可能に連結した」は、本文脈において、本開示によるプロモーターポリヌクレオチドのさらなるオリゴヌクレオチドまたはポリヌクレオチドとの、前記さらなるポリヌクレオチドの転写をもたらす連続した配置を意味する。
本明細書で使用される用語「目的の産物」または「生体分子」は、供給原料から微生物によって産生される任意の産物を指す。一部の場合では、目的の産物は、低分子、酵素、ペプチド、アミノ酸、有機酸、合成化合物、燃料、アルコールなどであり得る。例えば、目的の産物または生体分子は、任意の一次または二次細胞外代謝産物であり得る。一次代謝産物は、とりわけ、エタノール、クエン酸、乳酸、グルタミン酸、グルタメート、リシン、トレオニン、トリプトファン、および他のアミノ酸、ビタミン、多糖などであり得る。二次代謝産物は、とりわけ、ペニシリンのような抗生物質化合物、またはシクロスポリンAのような免疫抑制剤、ジベレリンのような植物ホルモン、ロバスタチンのようなスタチン薬、グリセオフルビンのような殺真菌薬などであり得る。目的の産物、または生体分子は、微生物によって産生される任意の細胞内コンポーネント、例えば、カタラーゼ、アミラーゼ、プロテアーゼ、ペクチナーゼ、グルコースイソメラーゼ、セルラーゼ、ヘミセルラーゼ、リパーゼ、ラクターゼ、ストレプトキナーゼ、および多くのその他を含めた微生物酵素でもあり得る。細胞内コンポーネントとして、組換えタンパク質、例えば、インスリン、B型肝炎ワクチン、インターフェロン、顆粒球コロニー刺激因子、ストレプトキナーゼなども挙げることができる。
用語「炭素源」は一般に、細胞増殖のための炭素の源として使用されるのに適した物質を指す。炭素源としては、これらに限定されないが、バイオマス加水分解物、デンプン、スクロース、セルロース、ヘミセルロース、キシロース、およびリグニン、ならびにこれらの基質のモノマーコンポーネントが挙げられる。炭素源は、これらに限定されないが、ポリマー、炭水化物、酸、アルコール、アルデヒド、ケトン、アミノ酸、ペプチドなどを含めた様々な形態での様々な有機化合物を含み得る。これらとしては、例えば、様々な単糖、例えば、グルコース、デキストロース(D−グルコース)など、マルトース、オリゴ糖、多糖、飽和もしくは不飽和脂肪酸、スクシネート、ラクテート、アセテート、エタノールなど、またはこれらの混合物がある。光合成生物は、光合成の産物として炭素源をさらに産生することができる。一部の実施形態では、炭素源は、バイオマス加水分解物およびグルコースから選択され得る。
用語「供給原料」は、他の産物が作製され得る微生物または発酵プロセスに供給される原料または原料の混合物として定義される。例えば、バイオマスまたはバイオマスに由来する炭素化合物などの炭素源は、発酵プロセスにおいて目的の産物(例えば、低分子、ペプチド、合成化合物、燃料、アルコールなど)を産生する微生物の供給原料である。しかし、供給原料は、炭素源以外の栄養分を含有し得る。
用語「体積生産性」または「生産速度」は、単位時間当たり、媒体の体積当たりに形成される産物の量として定義される。体積生産性は、1時間当たり1リットル当たりのグラム(g/L/h)で報告することができる。
用語「比生産性」は、産物の形成の速度として定義される。比生産性は、1時間当たり細胞乾燥重量(CDW)1グラム当たりの産物のグラム(g/g CDW/h)での比生産性として本明細書でさらに定義される。所与の微生物のOD600に対するCDWの関係を使用して、比生産性を、1時間当たり600nmにおける培養ブロスの光学密度(OD)当たり培養培地1リットル当たりの産物のグラム(g/L/h/OD)として表現することもできる。
用語「収率」は、原料の単位重量当たりに得られる産物の量として定義され、基質1g当たりの産物のg(g/g)として表現することができる。収率は、理論的収率のパーセンテージとして表現することができる。「理論的収率」は、産物を作製するのに使用される代謝経路の化学量論比によって決まる所与の量の基質あたりに産生され得る産物の最大量として定義される。
用語「力価(titre)」または「力価(titer)」は、溶液の強度または溶液中の物質の濃度として定義される。例えば、発酵ブロス中の目的の産物(例えば、低分子、ペプチド、合成化合物、燃料、アルコールなど)の力価は、発酵ブロス1リットル当たりの溶液中の目的の産物のg(g/L)として記述される。
用語「総力価」は、プロセスにおける初期体積またはプロセスにおける操作体積に対する、プロセスから取り出され、回収される溶液中の目的の産物、適用可能な場合、気相中の目的の産物、および任意の目的の産物を含むがこれらに限定されない、プロセスにおいて産生されるすべての目的の産物の和として定義される。
本明細書で使用される場合、用語「HTP遺伝子設計ライブラリー」または「ライブラリー」は、本開示による遺伝子撹乱のコレクションを指す。一部の実施形態では、本発明のライブラリーは、i)データベースまたは他のコンピューターファイル中の配列情報のコレクション、ii)上述の一連の遺伝子エレメントをコードする遺伝子コンストラクトのコレクション、またはiii)前記遺伝子エレメントを含む宿主細胞株として顕在化させ得る。一部の実施形態では、本開示のライブラリーは、個々のエレメントのコレクション(例えば、PROスワップライブラリーのプロモーターのコレクションまたはSTOPスワップライブラリーのターミネーターのコレクション)を指すことができる。他の実施形態では、本開示のライブラリーは、遺伝子エレメントの組合せ、例えば、プロモーター::遺伝子、遺伝子:ターミネーター、またはさらにはプロモーター:遺伝子:ターミネーターの組合せも指すことができる。一部の実施形態では、本開示のライブラリーは、宿主生物におけるライブラリーの各メンバーを適用する効果と関連したメタデータをさらに含む。例えば、本明細書で使用されるライブラリーは、特定の種における1つまたは複数の表現型に対するこれらの組合せの結果として生じる効果と一緒に、プロモーター::遺伝子配列組合せのコレクションを含み、よって、将来のプロモータースワップにおいて前記組合せを使用することについて将来の予測値を改善することができる。
本明細書で使用される場合、用語「SNP」は、核内低分子多形(複数可)を指す。一部の実施形態では、本開示のSNPは、広く解釈されるべきであり、一塩基多型、配列挿入、欠失、反転、および他の配列置き換えを含む。本明細書で使用される場合、用語「非同義の」または「非同義SNP」は、宿主細胞タンパク質におけるコード変化をもたらす変異を指す。
ゲノム操作の「ハイスループット(HTP)」方法は、自動化設備(例えば、液体ハンドラーまたはプレートハンドラーマシン)の少なくとも1つのピースを利用して、前記方法の少なくとも1つのステップを実行することができる。
株改良の伝統的な方法
株改良の伝統的な手法は、2つのタイプの手法:指向株操作およびランダム変異誘発に広く分類され得る。
株改良の指向操作方法は、特定の生物体の少数の遺伝子エレメントの計画された撹乱を伴う。これらの手法は、典型的には、特定の生合成プログラムまたは発生プログラムをモジュレートすることに着目し、前記経路に影響する遺伝因子および代謝因子の先の知識を利用する。その最も単純な実施形態では、指向操作は、特徴付けられた形質(例えば、遺伝子、プロモーター、または測定可能な表現型を生じさせることができる他の遺伝子エレメント)を、1つの生物体から同じまたは異なる種の別の生物体への移入を伴う。
株操作のランダム手法は、性能改善を同定するように設計された広範なスクリーニングに加えて、親株のランダム変異誘発を伴う。これらのランダム変異を生じさせる手法には、紫外線への曝露、またはメタンスルホン酸エチルなどの変異誘発化学物質が含まれる。ランダムで概ね予測不可能であるが、株改良のこの伝統的手法は、より指向性の遺伝子マニピュレーションと比較していくつかの利点を有していた。第1に、多くの工業用生物体は、これらの遺伝子レパートリーおよび代謝レパートリーの観点からあまりよく特徴付けられておらず(かつあまりよく特徴付けられていないままであり)、代替の指向改善手法を不可能でなくとも困難にした。
第2に、比較的よく特徴付けられたシステムにおいてでさえ、工業的性能改善をもたらす遺伝子型の変化は、予測するのが困難であり、時に、既知および未知の機能の多くの遺伝子における累積的変異を必要とする上位性表現型として現れるだけである。
さらに、長年、所与の工業用生物体において指向ゲノム変異を引き起こすのに要求される遺伝的ツールは、利用可能でなく、または非常に遅く、かつ/もしくは使用するのが困難であった。
しかし、伝統的な株改良プログラムの適用の拡大により、所与の株系統における獲得が次第に低減し、最終的にさらなる株効率の可能性が枯渇する。有益なランダム変異は、相対的に希有な事象であり、大きいスクリーニングプールおよび高い変異率を必要とする。これは必然的に、「改善された」株における多くの中立のかつ/または有害な(もしくは部分的に有害な)変異の不慮の蓄積をもたらし、それは、最終的に将来の効率向上に対して重荷となる。
伝統的な累積的改善手法の別の制限事項は、任意の株測定基準に対する任意の特定の変異の効果について分かっている情報が皆無かそれに近いことである。これは基本的に、有益な変異を組み合わせ、統合し、または中立のもしくは有害な変異誘発の「荷物(baggage)」を除去する研究者の能力を制限する。
変異誘発系統内の株間で変異をランダムに組み換える他の手法および技術が存在する。例えば、DNAシャッフリング、進化、または分子育種と時に呼ばれる反復的配列組換えのいくつかのフォーマットおよび例は、1994年2月17日に出願された米国特許出願第08/198,431号、1995年2月17日に出願された第PCT/US95/02126号、1995年4月18日に出願された第08/425,684号、1995年10月30日に出願された第08/537,874号、1995年11月30日に出願された第08/564,955号、1996年3月25日に出願された第08/621,859号、1996年3月25日に出願された第08/621,430号、1996年4月18日に出願された第PCT/US96/05480号、1996年5月20日に出願された第08/650,400号、1996年7月3日に出願された第08/675,502号、1996年9月27日に出願された第08/721,824号、および1996年9月27日に出願された第08/722,660号;Stemmer、Science、270巻:1510頁(1995年);Stemmerら、Gene、164巻:49〜53頁(1995年);Stemmer、Bio/Technology、13巻:549〜553頁(1995年);Stemmer、Proc. Natl. Acad. Sci. U.S.A.、91巻:10747〜10751頁(1994年);Stemmer、Nature、370巻:389〜391頁(1994年);Crameriら、Nature Medicine、2巻(1号):1〜3頁(1996年);Crameriら、Nature Biotechnology、14巻:315〜319頁(1996年)に記載されている。これらのそれぞれは、すべての目的に関してその全体が参照により本明細書に組み込まれている。
これらとしては、プロトプラスト融合、および変異された株全体にわたるゲノム組換えを促進する全ゲノムシャッフリングなどの技法が挙げられる。酵母および糸状菌などの一部の工業用微生物について、天然の接合サイクル(mating cycle)もペアワイズゲノム
組換えのために活用することができる。このように、有害な変異を、変異体を親株で「戻し交配する」ことによって除去し、有益な変異を統合することができる。さらに、2つの異なる株系統由来の有益な変異を潜在的に組み合わせることができ、それにより、単一の株系統をそのままで変異させることから入手可能であり得るものよりもさらなる改善可能性がもたらされる。しかし、これらの手法は、多くの制限を受けやすく、それらは、本開示の方法を使用して回避される。
例えば、上述した伝統的な組換え手法は、遅く、変異をスワップするのに相対的に少数のランダム組換えクロスオーバー事象を利用し、したがって、任意の所与のサイクルまたは期間内に試みることができる組合せの数が限定される。さらに、先行技術における自然組換え事象は、本質的にランダムであるが、これらもゲノムの位置的バイアスを受けやすい。
最も重要なことに、伝統的な手法はまた、個々の変異の影響についてわずかな情報しか提供せず、組み換えられた変異のランダムな分配に起因して、多くの特定の組合せを生成および評価することができない。
伝統的な株改良プログラムに関連した上述の問題の多くを克服するために、本開示は、コンピューターで駆動され、分子生物学、自動化、データ分析、および機械学習プロトコールを統合するユニークなHTPゲノム操作プラットフォームを示す。この統合プラットフォームは、HTP遺伝子設計ライブラリーを構築するのに使用される一式のHTP分子ツールセットを利用する。これらの遺伝子設計ライブラリーは、以下で詳しく述べられる。
教示されるHTPプラットフォームおよびそのユニークな微生物遺伝子設計ライブラリーは、微生物株発生および進化のパラダイムを基本的にシフトする。例えば、工業用微生物株を開発する伝統的な変異誘発ベース方法は、最終的に、何年ものランダム変異誘発にわたって蓄積された重い変異誘発性ロードを背負った微生物に至る。
この問題を解決する(すなわち、これらの微生物によって蓄積された遺伝的荷物を除去する)能力は、数十年にわたって微生物研究者が成し遂げられなかった。しかし、本明細書に開示のHTPプラットフォームを利用すると、これらの工業用株を「再建する」ことができ、有害である遺伝子変異を同定および除去することができる。調和して、有益と同定される遺伝子変異を保持し、一部の場合では、改善することができる。結果として生じる微生物株は、これらの親株と比較して優れた表現型形質(例えば、目的の化合物の改善された産生)を実証する。
さらに、本明細書に教示のHTPプラットフォームは、微生物株性能に対して個々の変異が有する効果を同定し、特徴付け、定量することができる。この情報、すなわち、所与の遺伝子変化xが宿主細胞表現型yに対してどのような効果を有するか(例えば、目的の化合物または産物の産生)を生成することができ、次いで、以下で論じられる微生物HTP遺伝子設計ライブラリーに記憶することができる。すなわち、各遺伝子順列についての配列情報および宿主細胞表現型に対するその効果が1つまたは複数のデータベースに記憶され、後続の分析(例えば、以下で論じられる上位性マッピング(epistasis mapping))に利用可能である。本開示は、遺伝子挿入コンストラクトの形態で、または前記遺伝子順列を含有する1種または複数の宿主細胞生物体の形態で貴重な遺伝子順列を物理的に保存/記憶する方法も教示する(例えば、以下で論じられるライブラリーを参照)。
これらのHTP遺伝子設計ライブラリーをて洗練されたデータ分析および機械学習プロセスと統合された反復プロセスと結びつけると、宿主細胞を改善するための劇的に異なる方法が出現する。したがって、教示されるプラットフォームは、宿主細胞株を開発する先に論じられた伝統的な方法と基本的に異なる。教示されるHTPプラットフォームは、先の方法に関連した欠点の多くを被らない。これらおよび他の利点は、以下で論じられる、HTP分子ツールセットおよび得られる遺伝子設計ライブラリーを参照して明らかである。
遺伝子設計&微生物操作:一式のHTP分子ツールおよびHTP遺伝子設計ライブラリーを利用する株改良の系統的なコンビナトリアル手法
上述した通り、本開示は、株全体にわたる遺伝子変化の反復性系統的導入および除去によって微生物生物体を操作するための新規HTPプラットフォームおよび遺伝子設計ストラテジーを提供する。プラットフォームは、HTP遺伝子設計ライブラリーの創製を可能にし、所与の宿主株への遺伝子変更の効率的なインプリメンテーションを可能にする一式の分子ツールによって支持される。
本開示のHTP遺伝子設計ライブラリーは、特定の微生物株バックグラウンド内に導入され得る可能な遺伝子変更の源として機能を果たす。このように、HTP遺伝子設計ライブラリーは、所与の微生物株の初期のまたはさらなる操作に適用され得る遺伝的多様性の宝庫または遺伝子撹乱のコレクションである。宿主株へのインプリメンテーションのために遺伝子設計をプログラムするための技法は、本明細書にその全体が参照により組み込まれている「Microbial Strain Design System and Methods for Improved Large
Scale Production of Engineered Nucleotide Sequences」という表題の、係属中の米国特許出願第15/140,296号に記載されている。
このプラットフォームで利用されるHTP分子ツールセットは、とりわけ、(1)プロモータースワップ(PROスワップ)、(2)SNPスワップ、(3)開始/停止コドン交換、(4)STOPスワップ、および(5)配列最適化を含み得る。本開示のHTP方法は、(6)上位性マッピングプロトコール、を含めたHTPツールセットの統合/コンビナトリアル使用を指示するための方法も教示する。上述した通り、この一式の分子ツールは、単独または組合せのいずれかで、HTP遺伝子設計宿主細胞ライブラリーの創製を可能にする。
実証されるように、教示されるHTP微生物操作プラットフォームとの関連で上述のHTP遺伝子設計ライブラリーを利用すると、有益な「原因となる」変異または遺伝子区画の同定および統合、ならびにまた、受動変異または有害な変異または遺伝子区画の同定および除去が可能になる。この新しい手法は、伝統的なランダム変異誘発または指向遺伝子操作(directed genetic engineering)によって達成することができなかった株性能の急速な改善を可能にする。遺伝的荷重を除去し、または遺伝的荷重を有さない株内に有益な変化を統合すると、さらなる改善を可能にし得る追加のランダム変異誘発の新しい、ロバストな出発点も提供される。
一部の実施形態では、本開示は、オルソゴナルな有益な変化が、変異誘発株系統の様々な個別分岐にわたって同定されるので、これらを、より良好に働く株へと急速に統合することもできることを教示する。これらの変異はまた、変異誘発系統の一部でない株、例えば、指向遺伝子操作によって獲得される改良を有する株へと統合され得る。
一部の実施形態では、本開示は、それが、発現および非発現遺伝子エレメントを含む複数の異なるゲノム領域にわたって変異のゲノムワイドコンビナトリアル効果を分析し、集められた情報(例えば、実験結果)を使用して株を増強させることが予期される変異組合せを予測するという点で公知の株改良手法と異なる。
一部の実施形態では、本開示は、i)開示される発明を介した改良に適用できる工業用微生物および他の宿主細胞、ii)下流分析のための多様性プールの生成、iii)大きいバリアントプールをハイスループットスクリーニングおよびシーケンシングするための方法およびハードウェア、iv)ゲノムワイド変異の相乗効果の機械学習コンピューター分析および予測のための方法およびハードウェア、ならびにv)ハイスループット株操作のための方法を教示する。
以下の分子ツールおよびライブラリーは、例示的な微生物例の観点から論じられている。当業者は、本開示のHTP分子ツールは、真核細胞およびより高等の生命体を含めた任意の宿主細胞に適合することを認識する。
微生物操作プラットフォームで利用される様々なHTP遺伝子設計ライブラリーの創製を可能にする同定されたHTP分子ツールセットのそれぞれを、次に論じる。
1.プロモータースワップ:プロモータースワップ微生物株ライブラリーを得るための分子ツール
一部の実施形態では、本開示は、全宿主株表現型に対する有益な効果(例えば、収率または生産性)を生じさせるのに最適な発現性質を有するプロモーターを選択する方法を教示する。
例えば、一部の実施形態では、本開示は、一連の発現強度(例えば、以下に論じられるプロモーターラダー)、または優れた調節性質(例えば、選択された遺伝子のより厳格な調節制御)を呈する、宿主細胞内の1つもしくは複数のプロモーターを同定し、かつ/または1つもしくは複数のプロモーターのバリアントを生成する方法を教示する。これらの同定および/または生成されるプロモーターの特定の組合せを、以下でより詳細に説明されるプロモーターラダーとして一緒にグループ化することができる。
次いで、問題のプロモーターラダーは、目的の所与の遺伝子と関連させられる。よって、プロモーターP〜P(一連の発現強度を呈するように同定および/または生成された8つのプロモーターを表す)を有し、プロモーターラダーを微生物中の目的の単一遺伝子と関連させる(すなわち、所与の標的遺伝子に作動可能に連結した所与のプロモーターで微生物を遺伝的に操作する)場合、8つのプロモーターの各組合せの効果を、操作された微生物が標的遺伝子と関連した特定のプロモーター(複数可)を除いて他の点では同一の遺伝的バックグラウンドを有することを考慮して、各コンビナトリアル取り組みの結果として生じる操作された株のそれぞれを特徴付けることによって確認することができる。
このプロセスを介して操作された結果として生じる微生物は、HTP遺伝子設計ライブラリーを形成する。
HTP遺伝子設計ライブラリーは、このプロセスを介して形成される実際の物理的な微生物株コレクションを指すことができ、各メンバー株は、他の点では同一の遺伝的バックグラウンドにおいて、特定の標的遺伝子に作動可能に連結した所与のプロモーターを代表し、前記ライブラリーは、「プロモータースワップ微生物株ライブラリー」と呼ばれる。
さらに、HTP遺伝子設計ライブラリーは、遺伝子撹乱のコレクションを指すことができ、この場合、所与のプロモーターxは、所与の遺伝子yに作動可能に連結しており、前記コレクションは、「プロモータースワップライブラリー」と呼ばれる。
さらに、プロモーターP〜Pを含む同じプロモーターラダーを利用して微生物を操作することができ、ここで、8つプロモーターのそれぞれは、10の異なる遺伝子標的に作動可能に連結される。この手順の結果は、目的の標的遺伝子に作動可能に連結した特定のプロモーターを除いて、他の点では遺伝的に同一と仮定される80の微生物である。これらの80の微生物は、適切にスクリーニングし、特徴付け、別のHTP遺伝子設計ライブラリーを生じさせることができる。HTP遺伝子設計ライブラリー内の微生物株を特徴付けると、リレーショナルデータベース、オブジェクト指向データベース、または大規模分散NoSQLデータベースを含めた任意のデータ記憶コンストラクトに記憶することができる情報およびデータが生じる。このデータ/情報は、例えば、所与の遺伝子標的に作動可能に連結しているときの所与のプロモーター(例えば、P〜P)の効果であり得る。このデータ/情報は、プロモーターP〜Pのうちの2つまたはそれ超を所与の遺伝子標的に作動可能に連結することから生じるより広いセットのコンビナトリアル効果でもあり得る。
8のプロモーターおよび10の標的遺伝子の上述の例は、単に例示的であり、その理由は、この概念は、一連の発現強度および任意の所与の数の標的遺伝子の呈示に基づいて一緒にグループ化された任意の所与の数のプロモーターを用いて適用することができるためである。当業者は、任意の遺伝子標的の前に2つまたはそれ超のプロモーターを作動可能に連結する能力も認識する。よって、一部の実施形態では、本開示は、プロモーターラダー由来の1、2、3、またはそれ超のプロモーターが1つまたは複数の遺伝子に作動可能に連結したプロモータースワップライブラリーを教示する。
要約すると、様々なプロモーターを利用して生物体内の様々な遺伝子の発現を駆動することは、目的の形質を最適化する強力なツールである。本発明者らが開発したプロモータースワッピングの分子ツールは、少なくとも1つの条件下で少なくとも1つの遺伝子座の発現を変更することが実証されたプロモーター配列のラダーを使用する。次いでこのラダーは、ハイスループットゲノム操作を使用して生物体内の遺伝子の群に系統的に適用される。この群の遺伝子は、いくつかの方法のいずれか1つに基づいて目的の形質に影響を与える高い見込みを有すると決定される。これらは、目的の形質に対する公知の機能もしくは影響に基づく選択物、または先に決定された有益な遺伝的多様性に基づくアルゴリズム選択物を含み得る。一部の実施形態では、遺伝子の選択物は、所与の宿主内のすべての遺伝子を含み得る。他の実施形態では、遺伝子の選択物は、ランダムに選択された所与の宿主内のすべての遺伝子のサブセットであり得る。
次いで、遺伝子に連結したプロモーター配列を含有する生物体の結果として生じるHTP遺伝子設計微生物株ライブラリーが、ハイスループットスクリーニングモデルにおいて性能について評価され、性能を増大させるプロモーター−遺伝子連鎖が決定され、情報がデータベースに記憶される。遺伝子撹乱(すなわち、所与の遺伝子yに作動可能に連結した所与のプロモーターx)のコレクションは、「プロモータースワップライブラリー」を形成し、これは、微生物操作処理で利用される潜在的な遺伝子変更の源として利用することができる。経時的に、より大きいセットの遺伝子撹乱は、より多様な宿主細胞バックグラウンドに対してインプリメントされるので、各ライブラリーは、実験的に確認されたデータのコーパスとしてより強力になり、それを使用して目的の任意のバックグラウンドに対する標的とした変化をより正確かつ予想通りに設計することができる。
生物体内の遺伝子の転写レベルは、生物体挙動に影響するための重要な管理点である。転写は、翻訳(タンパク質発現)としっかりと共役し、このタンパク質は、生物体挙動を決定する量で発現される。細胞は、数千の異なるタイプのタンパク質を発現し、これらのタンパク質は、多数の複雑なやり方で相互作用して機能を生み出す。一連のタンパク質の発現レベルを系統的に変更することによって、機能は、複雑性のために、予測することが困難であるように変更され得る。一部の変更は、性能を増大させることができ、したがって、性能を評価するための機構と連関して、この技法は、機能が改善された生物体の生成を可能にする。
低分子合成経路との関連で、酵素は、基質で始まり、目的の低分子で終わる、直鎖または分岐鎖中で該酵素の低分子基質および産物を介して相互作用する。これらの相互作用は、順次連結されるので、このシステムは、分散制御を呈し、1つの酵素の発現の増大は、別の酵素が律速となるまで経路フラックスを増大させることができるだけである。
代謝制御分析(MCA)は、実験データおよび第1原理から、どの1つまたは複数の酵素が律速であるかを決定するための方法である。しかし、MCAは、それが新しい律速な酵素を決定するのに各発現レベル変化後に広範な実験を必要とするので、限定されている。プロモータースワッピングは、この状況において有利であり、その理由は、プロモーターラダーを経路内の各酵素に適用することによって、律速の酵素が見出され、同じことを後続のラウンドで行って律速となる新しい酵素を見出すことができるためである。さらに、機能の読み取りは、目的の低分子のより良好な産生であるので、どの酵素が律速であるかを決定する実験は、産生を増大させる操作と同じであり、よって開発時間を短縮する。一部の実施形態では、本開示は、多ユニット酵素の個々のサブユニットをコードする遺伝子へのPROスワップの適用を教示する。さらに他の実施形態では、本開示は、個々の酵素、または生合成経路全体の調節を担う遺伝子にPROスワップ技法を適用する方法を教示する。
一部の実施形態では、本開示のプロモータースワップツールを使用して、選択された遺伝子標的の最適の発現を同定することができる。一部の実施形態では、プロモータースワップの目標は、標的遺伝子の発現を増大させて代謝経路または遺伝経路における障壁を低減することであり得る。他の実施形態では、プロモータースワップの目標は、標的遺伝子の発現が要求されないとき、前記標的遺伝子の発現を低減して宿主細胞内の不要なエネルギー消費を回避することであり得る。
転写、輸送、またはシグナル伝達のような他の細胞系という状況で、様々な合理的な方法を使用して、どのタンパク質が発現変化の標的であり、その変化が何であるべきかを経験的に試みて見出すことができる。これらの合理的な方法は、性能を改善するものを見出すのに試験されなければならない撹乱の数を低減するが、これらは、かなりのコストでそれを行う。遺伝子欠失スタディにより、その存在が特定の機能に極めて重要であるタンパク質が同定され、次いで重要な遺伝子を過剰発現させることができる。タンパク質相互作用の複雑性に起因して、これは、性能の増大において効果的でないことが多い。細胞におけるタンパク質レベルの関数として転写またはシグナル伝達挙動を第1原理から記述することを試みる異なるタイプのモデルが開発された。これらのモデルは、多くの場合、発現変化が異なる機能または改善された機能をもたらし得る標的を示唆する。これらのモデルの根底をなす仮定は、過度に単純化されており、パラメータは、測定するのが困難であり、したがって、これらが行う予測は、特に非モデル生物体について誤っていることが多い。遺伝子欠失およびモデル化の両方を用いると、ある特定の遺伝子にどのように影響するかを決定するのに要求される実験は、性能を改善する変化を起こすための後続の仕事と異なる。プロモータースワッピングは、これらの課題を回避し、その理由は、特定の撹乱の重要性を強調する構築された株も、すでに改良された株であるためである。
よって、特定の実施形態では、プロモータースワッピングは、
1.「ラダー」として作用する一連の「x」プロモーターを選択するステップ。理想的にはこれらのプロモーターは、多重ゲノム遺伝子座全体にわたって高度に多様な発現をもたらすことが示されているが、唯一の要件は、これらが遺伝子発現を何らかのやり方で撹乱することである。
2.標的にする一連の「n」遺伝子を選択するステップ。このセットは、ゲノム内のあらゆるオープンリーディングフレーム(ORF)、またはORFのサブセットであり得る。サブセットは、先に実証された有益な撹乱(先のプロモータースワップもしくは先のSNPスワップ)との関連によって、先に生成された撹乱間の上位性相互作用に基づくアルゴリズム選択、標的にする有益なORFに関する仮説に基づく他の選択判定基準によって、またはランダム選択を介して、機能に関連したORFについてのアノテーションを使用して選択することができる。他の実施形態では、「n」標的化遺伝子は、非コードRNAを含めた非タンパク質コード遺伝子を含み得る。
3.以下の遺伝子改変を迅速に、かつ一部の実施形態では、並行して実行するためのハイスループット株操作:生来のプロモーターが標的遺伝子nの前に存在し、その配列が公知であるとき、生来のプロモーターをラダー内のxプロモーターのそれぞれで置き換える。生来のプロモーターが存在せず、またはその配列が未知であるとき、ラダー内のxプロモーターのそれぞれを遺伝子nの前に挿入する(例えば、図21を参照)。このように、株の「ライブラリー」(HTP遺伝子設計ライブラリーとも呼ばれる)が構築され、ライブラリーの各メンバーは、他の点では同一の遺伝子状況(genetic context)においてn標的に作動可能に連結したxプロモーターの一事例である。先に記載したように、プロモーターの組合せを挿入し、ライブラリーが構築される組み合わせの可能性(combinatorial
possibility)の範囲を拡張することができる。
4.1つまたは複数の測定基準に対する株の性能が最適化されている性能を示す状況における株のライブラリーのハイスループットスクリーニング。
を含むマルチステッププロセスである。
この基本プロセスを拡張して、とりわけ、(1)相互作用プロセスにおいて1つずつ、または単一ステップにおける複数の変化として、単一株バックグラウンド内に複数の有益な撹乱を統合することによって、株性能をさらに改善することができる。複数の撹乱は、確定した変化の特定のセット、または変化の部分的にランダム化されたコンビナトリアルライブラリーのいずれかであり得る。例えば、標的のセットが経路内のあらゆる遺伝子である場合、撹乱のライブラリーを株の先のライブラリーの改善された1つまたは複数のメンバー内に逐次再生すると、任意の所与の反復においてどの遺伝子が律速であるかにかかわらず経路内の各遺伝子の発現レベルを最適化することができ;(2)ライブラリーの個々のおよびコンビナトリアル生成の結果として生じる性能データを、そのデータを使用して各撹乱の相互作用に基づいて撹乱の最適のセットを予測するアルゴリズムに送り;(3)上記2つの手法の組合せをインプリメントする(図20を参照)。
上記に論じた分子ツールまたは技法は、プロモータースワッピングとして特徴付けられるが、プロモーターに限定されず、一連の標的の発現レベルを系統的に変更する他の配列変化を含み得る。一連の遺伝子の発現レベルを変更するための他の方法は、a)リボソーム結合部位(または真核生物内のコザック配列)のラダー;b)各標的の開始コドンの他の開始コドンのそれぞれでの置き換え(すなわち、以下に論じられる開始/停止コドン交換);c)転写物の5’もしくは3’末端への、または任意の他の場所における配列を安定化し、または不安定にする様々なmRNAの結合、d)タンパク質中の任意の場所における配列を安定化し、または不安定にする様々なタンパク質の結合を含み得る。
手法は、工業用微生物を用いて本開示において例示されているが、所望の形質が遺伝子変異体の集団において同定され得る任意の生物体に適用可能である。例えば、これは、CHO細胞、酵母、昆虫細胞、藻類、および植物などの多細胞生物の性能を改善するのに使用することができる。
2.SNPスワップ:SNPスワップ微生物株ライブラリーを得るための分子ツール
ある特定の実施形態では、SNPスワッピングは、微生物株の改良のランダム変異誘発手法ではなく、むしろ、株全体にわたる個々の核内低分子多形ヌクレオチド変異(Small
Nuclear Polymorphism nucleotide mutation)(すなわち、SNP)の系統的な導
入または除去を伴う(それが名称「SNPスワッピング」の由来である)。
このプロセスを介して操作される結果として生じる微生物は、HTP遺伝子設計ライブラリーを形成する。
HTP遺伝子設計ライブラリーは、このプロセスを介して形成される実際の物理的な微生物株コレクションを指すことができ、各メンバー株は、他の点では同一の遺伝的バックグラウンドにおいて、所与のSNPの存在または非存在を代表し、前記ライブラリーは、「SNPスワップ微生物株ライブラリー」と呼ばれる。
さらに、HTP遺伝子設計ライブラリーは、遺伝子撹乱のコレクションを指すことができ、この場合、所与のSNPが存在し、または所与のSNPが存在せず、前記コレクションは、「SNPスワップライブラリー」と呼ばれる。
一部の実施形態では、SNPスワッピングでは、同定された有益な性能効果を有する標的SNP「ビルディングブロック」の最適な組合せを用いて宿主生物を再構築する。よって、一部の実施形態では、SNPスワッピングでは、反復プロセスにおいて1つずつ、または単一ステップにおける複数の変化としてのいずれかで、単一株バックグラウンド内に複数の有益な変異を統合することを伴う。複数の変化は、確定した変化の特定のセット、または変異の部分的にランダム化されたコンビナトリアルライブラリーのいずれかであり得る。
他の実施形態では、SNPスワッピングでは、反復プロセスにおいて1つずつ、または単一ステップにおける複数の変化としてのいずれかで、株から有害と同定された複数の変異の除去も関与する。複数の変化は、規定された変化の特定のセット、または変異の部分的にランダム化されたコンビナトリアルライブラリーのいずれかであり得る。一部の実施形態では、本開示のSNPスワッピング方法は、有益なSNPの付加ならびに有害なおよび/または中立の変異の除去の両方を含む。
SNPスワッピングは、変異誘発および目的とする形質改善のための選択に供された株の系統における有益および有害な変異の両方を同定および活用する強力なツールである。SNPスワッピングは、ハイスループットゲノム操作技法を利用して、変異誘発系統における個々の変異の影響を系統的に決定する。ゲノム配列は、既知の性能改善を有する変異誘発系統の1つまたは複数の世代にわたる株について決定される。次いでハイスループットゲノム操作が系統的に使用されて、より早期の系統株における改良された株由来の変異を反復し、かつ/またはより後期の株内の変異をより早期の株配列に戻す。次いでこれらの株の性能が評価され、目的の改善された表現型に対する各個々の変異の寄与を決定することができる。上述した通り、このプロセスから生じる微生物株が分析され/特徴付けられ、宿主株全体にわたる微生物株改良を通知することができるSNPスワップ遺伝子設計ライブラリーの基礎を形成する。
有害な変異を除去すると、即時に性能を改善することができ、変異誘発荷重に供されていない株バックグラウンド内の有益な変異を統合すると、株性能を迅速かつ大いに改善することができる。SNPスワッピングプロセスを介して生成される様々な微生物株は、HTP遺伝子設計SNPスワッピングライブラリーを形成し、それは、様々な付加/欠失/または統合されたSNPを含むが、他の点では同一の遺伝的バックグラウンドを有する微生物株である。
先に論じた通り、性能改善のためのランダム変異誘発および後続のスクリーニングは、工業用株改良のために一般に使用される技法であり、大規模製造に現在使用されている多くの株は、長年、時に数十年の期間にわたって反復してこのプロセスを使用して開発されてきた。ゲノム変異の生成のランダム手法、例えば、UV放射線またはメタンスルホン酸エチルなどの化学的変異誘発物質への曝露は、工業用株改良の好適な方法であった。その理由は、1)工業用生物体は、遺伝的または代謝的にあまりよく特徴付けられておらず、指向改善手法のための標的選択を困難または不可能にする場合があり、2)相対的に十分に特徴付けられたシステムにおいてでさえ、工業的性能改善をもたらす変化は、予測するのが困難であり、既知の機能を有さない遺伝子の撹乱を必要とする場合があり、3)所与の工業用生物体において指向ゲノム変異を作製するための遺伝的ツールは、利用可能でなく、または非常に遅く、かつ/もしくは使用するのが困難である場合があるためである。
しかし、このプロセスの上述の利益にもかかわらず、いくつかの公知の不利点も存在する。有益な変異は、相対的に希有な事象であり、定まったスクリーニング能力を用いてこれらの変異を見出すために、変異率は、十分に高くなければならない。これにより、望まれない中立のおよび部分的に有害な変異が有益な変化とともに株内に組み入れられることが多い。経時的に、この「変異誘発荷重」が蓄積し、全体的なロバスト性、および増殖速度などの重要な形質が欠損した株を生じる。最終的に、「変異誘発荷重」は、ランダム変異誘発による性能のさらなる改善を得ることをますます困難または不可能にする。適当なツールを用いない場合、株系統の個別分岐および並列分岐に見出される有益な変異を統合することが不可能である。
SNPスワッピングは、変異誘発系統内の株を比較するとき観察される一部またはすべての変異を系統的に反復し、または戻すことによってこれらの制限事項を克服する一手法である。このように、有益な(「原因となる」)変異を同定および統合することもでき、かつ/または有害な変異を同定および除去することもできる。これにより、さらなるランダム変異誘発または標的化遺伝子操作によって達成することができなかった株性能の迅速な改善が可能になる。
遺伝的荷重を除去し、または有益な変化を遺伝的荷重が無い株内に統合すると、さらなる改善を可能にすることができる追加のランダム変異誘発の新しいロバストな出発点ももたらされる。
さらに、オルソゴナルな有益な変化が、変異誘発株系統の様々な個別分岐にわたって同定されるので、これらを、より良好に働く株へと急速に統合することができる。これらの変異はまた、変異誘発系統の一部でない株、例えば、指向遺伝子操作によって獲得される改良を有する株へと統合され得る。
変異誘発系統内の株間の変異をランダムに組み換える他の手法および技術が存在する。これらとしては、プロトプラスト融合、および変異された株全体にわたるゲノム組換えを促進する全ゲノムシャッフリングなどの技法が挙げられる。酵母および糸状菌などの一部の工業用微生物について、天然の接合サイクルもペアワイズゲノム組換えのために活用することができる。このように、有害な変異を、変異体を親株で「戻し交配する」ことによって除去し、有益な変異を統合することができる。しかし、これらの手法は、多くの制限を受けやすく、それは、本開示のSNPスワッピング方法を使用して回避される。
例えば、これらの手法は、変異をスワップするのに相対的に少数のランダム組換えクロスオーバー事象を利用するので、株性能を最適化するのに組換えおよびスクリーニングの多くのサイクルを要し得る。さらに、天然の組換え事象は、本質的にランダムであるが、これらもゲノムの位置的偏りを受けやすく、一部の変異は、対処するのが困難であり得る。これらの手法はまた、追加のゲノムシーケンシングおよび分析を伴わない個々の変異の影響についてわずかな情報しか提供しない。SNPスワッピングは、これらの基本的な制限事項を克服し、その理由は、それがランダム手法ではなく、むしろ、株全体にわたる個々の変異の系統的な導入または除去であるためである。
一部の実施形態では、本開示は、多様性プールの生物体の中に存在するSNP配列多様性を同定するための方法を教示する。多様性プールは、分析に利用される所与の数nの微生物であり得、前記微生物のゲノムは、「多様性プール」を代表する。
特定の態様では、多様性プールは、特定の時点における「ベースライン」または「参照」遺伝子配列を有する元の親株(S)(SGen)、および次いで前記S株に由来し/それから開発された、かつSのベースラインゲノムに関して異なるゲノムを有する任意の数の後続の子孫株(S2−n)(S2−nGen2−n)であり得る。
例えば、一部の実施形態では、本開示は、多様性プール内の微生物ゲノムをシーケンシングして各株内に存在するSNPを同定することを教示する。一実施形態では、多様性プールの株は、歴史的な微生物産生株である。よって、本開示の多様性プールは、例えば、工業用参照株、および伝統的な株改良プログラムを介して産生された1つまたは複数の変異工業用株を含み得る。
一部の実施形態では、多様性プール内のSNPは、「参照株」を参照して決定される。一部の実施形態では、参照株は、野生型株である。他の実施形態では、参照株は、任意の変異誘発に供される前の元の工業用株である。参照株は、専門家が定義することができ、元の野生型株または元の工業用株である必要はない。基準株は、前記参照株に由来し、またはそれから開発された後続の株が比較される「基準」、「参照」、または元の遺伝的バックグラウンドと見なされるものを単に代表する。
多様性プール内のすべてのSNPが同定されると、本開示は、SNPスワッピングの方法およびスクリーニング方法を教示して、個々にかつ/または群内でSNPの効果(例えば、目的の表現型の創製)を描写する(すなわち、定量し、特徴付ける)。
一部の実施形態では、本開示のSNPスワッピング方法は、変異株(例えば、S2−nGen2−nの中からの株)内で同定された1つまたは複数のSNPを参照株(SGen)または野生型株に導入する(「ウェーブアップ」)ステップを含む。
他の実施形態では、本開示のSNPスワッピング方法は、変異株(例えば、S2−nGen2−nの中からの株)内で同定された1つまたは複数のSNPを除去する(「ウェーブダウン」)ステップを含む。
一部の実施形態では、1つまたは複数のSNP変化(導入または除去のいずれか)を含むそれぞれの生成された株は、培養され、本開示の1つまたは複数の判定基準(例えば、目的の化学物質または産物の産生)下で分析される。分析された宿主株のそれぞれからのデータは、宿主株内に存在する特定のSNPまたはSNPの群と関連付けられ、または相関付けられ、将来使用するために記録される。よって、本開示は、任意の数の目的の微生物遺伝的または表現型形質に対する所与のSNPの効果を同定することができる、大きい、高度にアノテートされたHTP遺伝子設計微生物株ライブラリーの創製を可能にする。これらのHTP遺伝子設計ライブラリーに記憶された情報は、HTPゲノム操作プラットフォームの機械学習アルゴリズムに知らせ、プロセスの将来の反復を指示し、それは最終的に、高度に望ましい性質/形質を有する進化した微生物生物体をもたらす。
3.開始/停止コドン交換:開始/停止コドン微生物株ライブラリーを得るための分子ツール
一部の実施形態では、本開示は、開始および停止コドンバリアントをスワップする方法を教示する。例えば、S.cerevisiaeおよび哺乳動物の典型的な停止コドンは、それぞれTAA(UAA)およびTGA(UGA)である。単子葉植物の典型的な停止コドンは、TGA(UGA)であり、一方、昆虫およびE.coliは一般に、停止コドンとしてTAA(UAA)を使用する(Dalphinら(1996年)、Nucl. Acids Res.
、24巻:216〜218頁)。他の実施形態では、本開示は、TAG(UAG)停止コドンの使用を教示する。
本開示は、開始コドンをスワップすることを同様に教示する。一部の実施形態では、本開示は、ほとんどの生物体(特に真核生物)によって利用されているATG(AUG)開始コドンの使用を教示する。一部の実施形態では、本開示は、原核生物は、ATG(AUG)を最も多く使用し、その後にGTG(GUG)およびTTG(UUG)が続くことを教示する。
他の実施形態では、本発明は、ATG開始コドンをTTGで置き換えることを教示する。一部の実施形態では、本発明は、ATG開始コドンをGTGで置き換えることを教示する。一部の実施形態では、本発明は、GTG開始コドンをATGで置き換えることを教示する。一部の実施形態では、本発明は、GTG開始コドンをTTGで置き換えることを教示する。一部の実施形態では、本発明は、TTG開始コドンをATGで置き換えることを教示する。一部の実施形態では、本発明は、TTG開始コドンをGTGで置き換えることを教示する。
他の実施形態では、本発明は、TAA停止コドンをTAGで置き換えることを教示する。一部の実施形態では、本発明は、TAA停止コドンをTGAで置き換えることを教示する。一部の実施形態では、本発明は、TGA停止コドンをTAAで置き換えることを教示する。一部の実施形態では、本発明は、TGA停止コドンをTAGで置き換えることを教示する。一部の実施形態では、本発明は、TAG停止コドンをTAAで置き換えることを教示する。一部の実施形態では、本発明は、TAG停止コドンをTGAで置き換えることを教示する。
4.Stopスワップ:最適化配列微生物株ライブラリーを得るための分子ツール
一部の実施形態では、本開示は、細胞遺伝子転写の最適化によって宿主細胞生産性を改善する方法を教示する。遺伝子転写は、転写開始(RNAp動員および転写複合体形成)、伸長(鎖合成/拡張)、ならびに転写終結(RNAp脱離および終結)を含めたいくつかの別個の生物学的現象の結果である。多くの関心が、遺伝子の転写モジュレーションによる(例えば、プロモーターを変更し、または調節転写因子を誘導することによる)遺伝子発現の制御に注がれているが、比較的少ない取り組みが遺伝子ターミネーター配列のモジュレーションを介した転写のモジュレーションに向けて行われている。
転写が遺伝子発現レベルに影響を与える最も明白なやり方は、Pol II開始の速度によるものであり、これは、プロモーターまたはエンハンサー強度およびトランス活性化因子の組合せによってモジュレートすることができる(Kadonaga, JT.、2004年、「Regulation of RNA polymerase II transcription by sequence-specific DNA binding factors」、Cell.、2004年1月23日;116巻(2号):247〜57
頁)。真核生物では、伸長速度も、オルタナティブスプライシングに影響を与えることによって遺伝子発現パターンを決定する場合がある(Cramer P.ら、1997年、「Functional association between promoter structure and transcript alternative splicing.」、Proc Natl Acad Sci U S A.、1997年10月14日;94巻(2
1号):11456〜60頁)。遺伝子上の終結の失敗は、プロモーターのPol IIへのアクセシビリティを低減することによって下流遺伝子の発現を損なわせ得る(Greger
IH.ら、2000年、「Balancing transcriptional interference and initiation
on the GAL7 promoter of Saccharomyces cerevisiae.」、Proc Natl Acad Sci U S A.、2000年7月18日;97巻(15号):8415〜20頁)。このプロセスは、転写干渉として公知であり、下等真核生物において特に関連しており、その理由は、これらが密集した遺伝子を有することが多いためである。
終結配列も、配列が属する遺伝子の発現に影響し得る。例えば、スタディは、真核生物における非効率な転写終結は、スプライスされていないプレmRNAを蓄積させることを示す(West, S.およびProudfoot, N.J.、2009年、「Transcriptional Termination Enhances Protein Expression in Human Cells」、Mol Cell.、2009年2月13日;33巻(3〜9号);354〜364頁を参照)。他のスタディも、3’末端プロセシングが非効率な終結によって遅延され得ることを示した(West, Sら、2008年、「Molecular dissection of mammalian RNA polymerase II transcriptional termination.」、Mol Cell.、2008年3月14日;29巻(5号):600〜10頁)。転写終結も、合成の部位から転写物を放出することによってmRNA安定性に影響し得る。
真核生物における転写機構の終結
真核生物における転写終結は、RNAポリメラーゼIIに関連したタンパク質因子によって認識されるターミネーターシグナルを介して働く。一部の実施形態では、切断・ポリアデニル化特異性因子(CPSF)および切断刺激因子(CstF)は、RNAポリメラーゼIIのカルボキシル末端ドメインからポリAシグナルに移動する。一部の実施形態では、CPSF因子およびCstF因子はまた、終結部位に他のタンパク質を動員し、次いでこれは、転写物を切断し、転写複合体からmRNAを解放する。終結は、mRNA転写物のポリアデニル化も誘発する。バリデートされた真核生物終結因子の実例およびこれらの保存構造は、本文書の後の部分で論じられている。
原核生物における転写の終結
原核生物では、Rho非依存性およびRho依存性終結と呼ばれる2つの主要機構が転写終結を媒介する。Rho非依存性終結シグナルは、外因性転写終結因子を要求せず、その理由は、一連のウリジン(U)残基とともにこれらの配列から転写されるRNAにおけるステムループ構造の形成が、転写複合体からのRNA鎖の放出を促進するためである。一方、Rho依存性終結は、mRNA上でRhoと呼ばれる転写終結因子およびシス作用エレメントを必要とする。Rhoの最初の結合部位、Rho利用(rut)部位は、実際のターミネーター配列の上流の、高シチジン/低グアノシン含有量、および合成されているRNAにおける相対的に小さい二次構造によって特徴付けられる伸長された(約70ヌクレオチド、時に80〜100ヌクレオチド)一本鎖領域である。ポリメラーゼ休止部位と遭遇すると、終結が起こり、転写物がRhoのヘリカーゼ活性によって放出される。
ターミネータースワッピング(STOPスワップ)
一部の実施形態では、本開示は、最適な発現性質を有する終結配列(「ターミネーター」)を選択して、全体的な宿主株生産性に対して有益な効果を生じさせる方法を教示する。
例えば、一部の実施形態では、本開示は、一連の発現強度を呈する、宿主細胞内の1つもしくは複数のターミネーターを同定し、かつ/または1つもしくは複数のターミネーターのバリアントを生成する(例えば、以下に論じられるターミネーターラダー)方法を教示する。これらの同定および/または生成されるターミネーターの特定の組合せを、以下でより詳細に説明されるターミネーターラダーとして一緒にグループ化することができる。
次いで、問題のターミネーターラダーは、目的の所与の遺伝子と関連させられる。よって、ターミネーターT〜T(1つまたは複数のプロモーターと組み合わされるとき、一連の発現強度を呈するように同定および/または生成された8つのターミネーターを表す)を有し、ターミネーターラダーを宿主細胞内の目的の単一遺伝子と関連させる(すなわち、所与の標的遺伝子の3’末端に作動可能に連結した所与のターミネーターで宿主細胞を遺伝的に操作する)場合、ターミネーターの各組合せの効果を、操作された宿主細胞が標的遺伝子と関連した特定のプロモーター(複数可)を除いて他の点では同一の遺伝的バックグラウンドを有することを考慮して、各コンビナトリアル取り組みの結果として生じる操作された株のそれぞれを特徴付けることによって確認することができる。このプロセスを介して操作される結果として生じる宿主細胞は、HTP遺伝子設計ライブラリーを形成する。
HTP遺伝子設計ライブラリーは、このプロセスを介して形成される実際の物理的な微生物株コレクションを指すことができ、各メンバー株は、他の点では同一の遺伝的バックグラウンドにおいて、特定の標的遺伝子に作動可能に連結した所与のターミネーターを代表し、前記ライブラリーは、「ターミネータースワップ微生物株ライブラリー」または「STOPスワップ微生物株ライブラリー」と呼ばれる。
さらに、HTP遺伝子設計ライブラリーは、遺伝子撹乱のコレクションを指すことができ、この場合、所与のターミネーターxは、所与の遺伝子yに作動可能に連結しており、前記コレクションは、「ターミネータースワップライブラリー」または「STOPスワップライブラリー」と呼ばれる。
さらに、プロモーターT〜Tを含む同じターミネーターラダーを利用して微生物を操作することができ、ここで、8つのターミネーターそれぞれは、10の異なる遺伝子標的に作動可能に連結している。この手順の結果は、目的の標的遺伝子に作動可能に連結した特定のターミネーターを除いて、他の点では遺伝的に同一と仮定される80の宿主細胞株である。これらの80の宿主細胞株は、適切にスクリーニングし、特徴付け、別のHTP遺伝子設計ライブラリーを生じさせることができる。HTP遺伝子設計ライブラリー内の微生物株を特徴付けると、リレーショナルデータベース、オブジェクト指向データベース、または大規模分散NoSQLデータベースを限定することなく含めた任意のデータベースに記憶することができる情報およびデータが生じる。このデータ/情報は、例えば、所与の遺伝子標的に作動可能に連結しているときの所与のターミネーター(例えば、T〜T)の効果を含み得る。このデータ/情報は、プロモーターT〜Tのうちの2つまたはそれ超を所与の遺伝子標的に作動可能に連結することから生じるより広いセットのコンビナトリアル効果でもあり得る。
8のターミネーターおよび10の標的遺伝子の上述の例は、単に例示的であり、その理由は、この概念は、一連の発現強度および任意の所与の数の標的遺伝子の呈示に基づいて一緒にグループ化された任意の所与の数のプロモーターを用いて適用することができるためである。
要約すると、様々なターミネーターを利用して生物体内の様々な遺伝子の発現をモジュレートすることは、目的の形質を最適化する強力なツールである。本発明者らが開発したターミネータースワッピングの分子ツールは、少なくとも1つの条件下で少なくとも1つの遺伝子座の発現を変更することが実証されたターミネーター配列のラダーを使用する。次いでこのラダーは、ハイスループットゲノム操作を使用して生物体内の遺伝子の群に系統的に適用される。この群の遺伝子は、いくつかの方法のいずれか1つに基づいて目的の形質に影響を与える高い見込みを有すると決定される。これらは、公知の機能に基づく選択、または目的の形質に対する影響、または先に決定された有益な遺伝的多様性に基づくアルゴリズムによる選択を含み得る。
次いで、遺伝子に連結したターミネーター配列を含有する生物体の結果として生じるHTP遺伝子設計微生物ライブラリーが、ハイスループットスクリーニングモデルにおいて性能について評価され、性能を増大させるプロモーター−遺伝子連鎖が決定され、情報がデータベースに記憶される。遺伝子撹乱(すなわち、所与の遺伝子yに連結した所与のターミネーターx)のコレクションは、「ターミネータースワップライブラリー」を形成し、これは、微生物操作処理で利用される潜在的な遺伝子変更の源として利用することができる。経時的に、より大きいセットの遺伝子撹乱は、より大きい多様性の微生物バックグラウンドに対してインプリメントされるので、各ライブラリーは、実験的に確認されたデータのコーパスとしてより強力になり、それを使用して目的の任意のバックグラウンドに対する標的とした変化をより正確かつ予想通りに設計することができる。すなわち、一部の実施形態では、本開示は、本発明の遺伝子設計ライブラリーのいずれかと関連したメタデータ内に埋もれた先の実験結果に基づく、宿主細胞内への1つまたは複数の遺伝子変化の導入を教示する。
よって、特定の実施形態では、ターミネータースワッピングは、以下を含むマルチステッププロセスである。
1.「ラダー」として作用する一連の「x」ターミネーターを選択するステップ。理想的にはこれらのターミネーターは、多重ゲノム遺伝子座全体にわたって高度に多様な発現をもたらすことが示されているが、唯一の要件は、これらが遺伝子発現を何らかのやり方で撹乱することである。
2.標的にする一連の「n」遺伝子を選択するステップ。このセットは、ゲノム内のあらゆるORF、またはORFのサブセットであり得る。サブセットは、先に実証された有益な撹乱(先のプロモータースワップ、STOPスワップもしくはSNPスワップ)との関連によって、先に生成された撹乱間の上位性相互作用に基づくアルゴリズム選択、標的にする有益なORFに関する仮説に基づく他の選択判定基準によって、またはランダム選択を介して、機能に関連したORFについてのアノテーションを使用して選択することができる。他の実施形態では、「n」標的化遺伝子は、非コードRNAを含めた非タンパク質コード遺伝子を含み得る。
3.以下の遺伝子改変を迅速に、かつ並行して実行するためのハイスループット株操作:生来のターミネーターが標的遺伝子nの3’末端に存在し、その配列が公知であるとき、生来のターミネーターをラダー内のxターミネーターのそれぞれで置き換える。生来のターミネーターが存在せず、またはその配列が未知であるとき、ラダー内のxターミネーターのそれぞれを遺伝子停止コドンの後に挿入する。
このように、株の「ライブラリー」(HTP遺伝子設計ライブラリーとも呼ばれる)が構築され、ライブラリーの各メンバーは、他の点では同一の遺伝子状況においてn標的に連結したxターミネーターの一事例である。先に記載したように、ターミネーターの組合せを挿入し、ライブラリーが構築される組み合わせの可能性の範囲を拡張することができる。
4.1つまたは複数の測定基準に対する株の性能が最適化されている性能を示す状況における株のライブラリーのハイスループットスクリーニング。
この基本プロセスを拡張して、とりわけ、(1)相互作用プロセスにおいて1つずつ、または単一ステップにおける複数の変化としてのいずれかで、単一株バックグラウンド内に複数の有益な撹乱を統合することによって、株性能をさらに改善することができる。複数の撹乱は、確定した変化の特定のセット、または変化の部分的にランダム化されたコンビナトリアルライブラリーのいずれかであり得る。例えば、標的のセットが経路内のあらゆる遺伝子である場合、撹乱のライブラリーを株の先のライブラリーの改善された1つまたは複数のメンバー内に逐次再生すると、任意の所与の反復においてどの遺伝子が律速であるかにかかわらず経路内の各遺伝子の発現レベルを最適化することができ;(2)ライブラリーの個々のおよびコンビナトリアル生成の結果として生じる性能データを、そのデータを使用して各撹乱の相互作用に基づいて撹乱の最適のセットを予測するアルゴリズムに送り;(3)上記2つの手法の組合せをインプリメントする。
手法は、工業用微生物を用いて本開示において例示されているが、所望の形質が遺伝子変異体の集団において同定され得る任意の生物体に適用可能である。例えば、これは、CHO細胞、酵母、昆虫細胞、藻類、および植物などの多細胞生物の性能を改善するのに使用することができる。
5.配列最適化:最適化配列微生物株ライブラリーを得るための分子ツール
一実施形態では、提供した開示の方法は、宿主生物が発現する1つまたは複数のコドン最適化遺伝子を含む。様々な宿主内での発現を改善するためにコドンを最適化するための方法は、当技術分野で公知であり、文献において記載されている(その全体が参照により本明細書に組み込まれている米国特許出願公開第2007/0292918号を参照)。特定の原核生物宿主または真核生物宿主に好適なコドンを含有する最適化されたコード配列(Murrayら、(1989年)、Nucl. Acids Res.、17巻:477〜508頁も参照)を調製して、例えば、翻訳の速度を増大させ、または非最適配列から産生される転写物と比較して、より長い半減期などの望ましい性質を有する組換えRNA転写物を生成することができる。
タンパク質発現は、転写、mRNAプロセシング、ならびに翻訳の安定性および開始に影響するものを含めた多数の因子によって支配される。よって、最適化は、任意の特定の遺伝子のいくつかの配列フィーチャのいずれかに対処することができる。具体例として、希少コドン誘導翻訳休止は、タンパク質発現を低減し得る。希少コドン誘導翻訳休止は、宿主生物において稀に使用される目的のポリヌクレオチド中のコドンの存在が、利用可能なtRNAプールにおけるその不足に起因してタンパク質翻訳に対して負の効果を有し得ることを含む。
代替の翻訳開始も、異種タンパク質発現を低減し得る。代替翻訳開始は、リボソーム結合部位(RBS)として機能することができるモチーフを偶然に含有する合成ポリヌクレオチド配列を含み得る。これらの部位は、遺伝子内部部位から短縮タンパク質の翻訳を開始することができる。精製中に除去することが困難であり得る短縮タンパク質を産生する可能性を低減する一方法は、最適化ポリヌクレオチド配列から推定上の内部RBS配列を排除するステップを含む。
リピート誘導ポリメラーゼのスリッページは、異種タンパク質発現を低減し得る。リピート誘導ポリメラーゼのスリッページは、フレームシフト変異をもたらし得るDNAポリメラーゼのスリッページまたはスタッタリングを引き起こすことが示されているヌクレオチド配列リピートを伴う。このようなリピートは、RNAポリメラーゼのスリッページも引き起こし得る。高いG+C含有量偏りを有する生物体では、GまたはCヌクレオチドリピートから構成されるより高い程度のリピートが存在し得る。したがって、RNAポリメラーゼのスリッページを誘導する可能性を低減する一方法は、GまたはCヌクレオチドの長いリピートを変更するステップを含む。
二次構造の干渉も異種タンパク質発現を低減し得る。二次構造は、RBS配列または開始コドンを隔離することができ、タンパク質発現の低減と相関している。ステムループ構造も、転写休止および減衰に関与することができる。最適化ポリヌクレオチド配列は、ヌクレオチド配列のRBSおよび遺伝子コード領域内に最小限の二次構造を含有して、転写および翻訳の改善を可能にすることができる。
例えば、最適化プロセスは、宿主が発現する所望のアミノ酸配列を同定することによって始めることができる。アミノ酸配列から、候補ポリヌクレオチドまたはDNA配列を設計することができる。合成DNA配列の設計中に、コドン使用の頻度を、宿主発現生物体のコドン使用と比較することができ、希有な宿主コドンを合成配列から除去することができる。さらに、合成候補DNA配列を、望ましくない酵素制限部位を除去し、任意の所望のシグナル配列、リンカー、または非翻訳領域を付加または除去するために修飾することができる。合成DNA配列は、翻訳プロセスを妨害し得る二次構造、例えば、G/Cリピートおよびステムループ構造の存在について分析することができる。
6.上位性マッピング − 有益な遺伝子統合(genetic consolidation)を可能にする予測的分析用ツール
一部の実施形態では、本開示は、宿主細胞内に有益な遺伝子変更を予測し、組み合わせるための上位性マッピング法(epistasis mapping method)を教示する。遺伝子変更は、上述のHTP分子ツールセット(例えば、プロモータースワップ、SNPスワップ、開始/停止コドン交換、配列最適化)のいずれかによって生み出すことができ、これらの遺伝子変更の効果は、得られたHTP遺伝子設計微生物株ライブラリーの特徴付けから分かる。よって、本明細書で使用される場合、用語の上位性マッピングは、宿主性能の増大を生じさせる可能性のある遺伝子変更の組合せ(例えば、有益なSNPまたは有益なプロモーター/標的遺伝子の関連付け)を同定する方法を含む。
諸実施形態では、本開示の上位性マッピング法は、2つの異なる機能群からの有益な変異の組合せは、同じ機能群からの変異の組合せと比較して、宿主性能を改善する可能性が高いというアイデアに基づく。例えば、Costanzo、The Genetic Landscape of a Cell、Science、327巻、5964号、2010年1月22日、425〜431頁を参照
(その全体が本明細書に参照により組み込まれている)。
同じ機能群からの変異は、同じ機構によって働く可能性が高く、よって、全体的な宿主性能に対して負または中立の上位性を呈する可能性が高い。対照的に、異なる機能群からの変異は、独立した機構によって働く可能性が高く、それは、宿主性能の改善、および一部の事例では相乗効果をもたらし得る。例えば、図19を参照すると、lysAおよびzwfは、異なる経路で働いてリシンの産生を達成する遺伝子である。これらの遺伝子の個々の性能の相違点に基づくと、これらの遺伝子を使用する遺伝子変化は、相加的な統合効果をもたらすはずである。これは、図16Bおよび実施例6に示した通り、lysAおよびzwfの組合せの統合効果を実際に測定して裏付けられた。
よって、一部の実施形態では、本開示は、SNP変異を分析して、異なる機能群に属すると予測されるSNPを同定する方法を教示する。一部の実施形態では、SNP機能群類似度は、変異相互作用プロファイルの余弦類似度(相関係数と類似、図16Aを参照)を計算することによって決定される。本開示は、変異類似度マトリックス(図15を参照)またはデンドログラム(図16Aを参照)を介してSNPを比較することも例示する。
よって、上位性マッピング手順は、1つまたは複数の遺伝的バックグラウンドにおいて適用される遺伝子変異の多様性を、1つまたは複数の遺伝的バックグラウンド内に前記変異を効率的かつ有効に統合する目的で、グループ化および/またはランク付けするための方法を提供する。
諸態様では、統合は、標的生体分子を産生させるのに最適化された新規株を生み出す目的で実施される。教示した上位性マッピング手順によって、変異の機能分類を同定することが可能であり、このような機能分類は、望ましくない上位性効果を最小限にする統合ストラテジーを可能にする。
先に説明した通り、工業発酵で使用するための微生物の最適化は、経済、社会、および自然界に関する広い暗示を含む重要で困難な問題である。伝統的に、微生物操作は、ランダム変異誘発の遅く不確かなプロセスによって実施されてきた。このような手法は、細胞の自然進化能力を活用して、人工的に課された選択圧に適応させる。このような手法はまた、有益な変異の珍しさ、基礎をなす適応度地形の荒削りさによって制限されており、より一般に、細胞生物学および分子生物学における現況技術を十分に利用しない。
最新の手法は、機構レベルでの細胞機能の新しい理解および特定の表現型目標への標的化遺伝子マニピュレーションを実施する新しい分子生物学ツールを活用する。実際には、このような合理的手法は、生物学の根本的な複雑性によって混乱する。原因となる機構は、特に、それぞれに有益な効果が観察された2つまたはそれ超の変化を組み合わせようと試みる場合、理解が不十分である。時に、遺伝子変化のこのような統合は、正の結果(所望の表現型活性の増大によって測定される)を生じるが、正味の正の結果は、予期されたものより低くなり得、一部の場合では、予期されたものより高くなり得る。他の事例では、このような組合せは、正味の中立効果または正味の負の効果を生む。この現象は、上位性と呼ばれ、微生物操作(および一般に遺伝子操作)の基本的な課題の1つである。
上述した通り、本HTPゲノム操作プラットフォームは、伝統的な微生物操作手法に関連した問題の多くを解決する。本HTPプラットフォームは、自動化技術を使用して、数百または数千の遺伝子変異を一度に実施する。特定の態様では、上述した合理的手法と異なり、開示したHTPプラットフォームは、その全体が本明細書に参照により組み込まれている、Microbial Strain Design System And Methods For Improved Large-Scale Production Of Engineered Nucleotide Sequencesという表題の米国出願第15/140,296号に開示されている通り、数千の変異体の並列構築を可能にして、関連したゲノム空間の大きいサブセットをより有効に探索する。「あらゆること」を試すことによって、本HTPプラットフォームは、本発明者らの限られた生物学的理解によって誘導される困難を回避する。
しかし同時に、本HTPプラットフォームは、ゲノム空間の組合せによる爆発的サイズ、および遺伝的相互作用の複雑性を考慮して生成されたデータセットを解明する計算手法の有効度によって基本的に制限されるという問題に直面する。所望の結果を生じる組合せの非ランダム選択を最大にするやり方で広大なコンビナトリアル空間のサブセットを探索する技法が必要とされる。
いくぶん類似のHTP手法が、酵素最適化の場合において有効であると証明された。このニッチな問題において、目的のゲノム配列(1000塩基の程度の)は、物理的構成が幾分複雑なタンパク質鎖をコードする。正確な構成は、その構成要素の原子成分間の集団電磁相互作用によって決定される。短いゲノム配列および物理的に制約された折り畳み問題のこの組合せは、貪欲最適化ストラテジーに具体的に役に立つ。すなわち、あらゆる残基において配列を個々に変異させ、結果として生じる変異体をシャッフルして、配列活性応答モデル化(Sequence Activity Response modeling)に適合する分解能で局所的配列空間を有効にサンプリングすることが可能である。
しかし、生体分子の完全ゲノム最適化に関して、このような残基中心の手法は、いくつかの重要な理由で不十分である。第1に、生体分子のゲノム最適化に伴う関連した配列空間の指数関数的増大のため。第2に、生体分子合成における調節、発現、および代謝相互作用の複雑性の追加のため。本発明者らは、教示される上位性マッピング手順を介してこれらの問題を解決した。
変異のコレクション間の上位性相互作用を、前記変異を1つまたは複数の遺伝的バックグラウンド内により効率的かつ有効に統合する目的で、モデル化するための教示される方法は、当技術分野において革新的であり、高度に必要とされる。
上位性マッピング手順を記述する場合、用語「より効率的な」および「より有効な」は、特定の表現型の目的に関して統合株の中での望ましくない上位性相互作用の回避を指す。
プロセスを上記で一般に詳しく述べてきたので、より具体的なワークフロー例を次に記載する。
第1に、M個の変異のライブラリーおよび1つまたは複数の遺伝的バックグラウンド(例えば、親菌株)から始める。ライブラリーの選択も遺伝的バックグラウンドの選択も、ここに記載した方法に特異的でない。しかし特定のインプリメンテーションでは、変異のライブラリーは、もっぱら、または組合せで:SNPスワップライブラリー、プロモータースワップライブラリー、または本明細書に記載の任意の他の変異ライブラリーを含み得る。
一インプリメンテーションでは、単一の遺伝的バックグラウンドのみが提供される。この場合、別個の遺伝的バックグラウンド(微生物変異体)のコレクションが、この単一のバックグラウンドから最初に生成される。これは、変異の一次ライブラリー(またはそのあるサブセット)を所与のバックグラウンドに適用して、例えば、特定のSNPのHTP遺伝子設計ライブラリーまたは特定のプロモーターのHTP遺伝子設計ライブラリーを所与の遺伝的バックグラウンドに適用して、それに組み入れられている所与のHTP遺伝子設計ライブラリーからの特定の遺伝子変更を除いて同一の遺伝的バックグラウンドを有する微生物変異体の集団(おそらく100または1,000)を生み出すことによって達成され得る。以下に詳述する通り、この実施形態は、コンビナトリアルライブラリーまたはペアワイズライブラリーをもたらし得る。
別のインプリメンテーションでは、別個の公知の遺伝的バックグラウンドのコレクションを単に与えることができる。以下に詳述する通り、この実施形態は、コンビナトリアルライブラリーのサブセットをもたらし得る。
特定のインプリメンテーションでは、遺伝的バックグラウンドの数およびこれらのバックグラウンド間の遺伝的多様性(変異の数または配列編集距離などで測定した)は、この方法の有効度を最大にするように決定される。
遺伝的バックグラウンドは、天然の、生来の、もしくは野生型株、または変異された、操作された株であり得る。N個の別個のバックグラウンド株は、ベクトルbで表すことができる。一例では、バックグラウンドbは、N個の一次変異m=(m、m、… m)を野生型バックグラウンド株bに適用して、N個の変異されたバックグラウンド株b=m=(m、m、… m)(式中、mは、変異mのバックグラウンド株bへの適用を表す)を形成することによって形成される操作されたバックグラウンドを表すことができる。
いずれの場合にも(すなわち、単一の提供された遺伝的バックグラウンドまたは遺伝的バックグラウンドのコレクション)、結果は、N個の遺伝的に別個のバックグラウンドのコレクションである。関連した表現型が各バックグラウンドについて測定される。
第2に、M個の変異のコレクションm内の各変異が、N個のバックグラウンド株bのコレクション内の各バックグラウンドに適用されて、M×N個の変異体のコレクションが形成される。N個のバックグラウンドが変異の一次セットm(上述した)を適用することによってそれ自体得られたインプリメンテーションでは、変異体の結果として生じるセットは、時に、コンビナトリアルライブラリーまたはペアワイズライブラリーと呼ばれる。公知のバックグラウンドのコレクションが明示的に提供された別のインプリメンテーションでは、変異体の結果として生じるセットは、コンビナトリアルライブラリーのサブセットと呼ぶことができる。操作されたバックグラウンドベクトルの生成と同様に、諸実施形態では、入力インターフェース202は、変異ベクトルmおよびバックグラウンドベクトルb、ならびに外積などの指定されたオペレーションを受け取る。
上記操作されたバックグラウンド例を続けて、M×Nコンビナトリアルライブラリーの形成は、m×m、b=mのN個のバックグラウンドに適用されたmの外積によって形成された行列によって表すことができ、この場合、m中の各変異は、b内の各バックグラウンド株に適用される。結果として生じるM×N行列の各i番目の行は、バックグラウンドコレクションb内のすべての株へのm内のi番目の変異の適用を表す。一実施形態では、m=mであり、行列は、出発株bへの同じ変異のペアワイズ適用を表す。その場合、行列は、その対角線回りで対称であり(M=N)、対角線は、任意の分析において無視することができ、その理由は、それが同じ変異の2回の適用を表すためである。
諸実施形態では、M×N行列の形成は、入力インターフェース202に化合物発現m×mを入力することによって達成することができる。発現のコンポーネントベクトルは、直接入力することができ、これらの要素は、1つもしくは複数のDNA仕様を介して、またはインタープリター204によるインタープリテーション中にベクトルの検索を可能にするライブラリー206への呼出しとして明示的に指定される。「Microbial Strain Design System and Methods for Improved Large Scale Production of Engineered Nucleotide Sequences」という表題の米国特許出願第15/140,29
6号に記載されている通り、インタープリター204、実行エンジン207、発注エンジン(order placement engine)208、およびファクトリー210を介して、LIMSシステム200は、入力された発現によって指定された微生物株を生成する。
第3に、図42を参照すると、分析装置214は、M×Nコンビナトリアルライブラリー行列(4202)内の各変異体について表現型応答を測定する。したがって、応答のコレクションは、M×N応答行列Rと解釈することができる。Rの各要素は、rij=y(m,m)として表すことができ、式中、yは、変異mによって変異された、操作されたコレクションb内のバックグラウンド株bの応答(性能)を表す。単純性および実用性のために、本発明者らは、ペアワイズ変異を仮定し、この場合、m=mである。今回の場合のように、変異のセットがペアワイズ変異ライブラリーを表す場合、結果として生じる行列は、遺伝子相互作用行列、またはより特定すれば、変異相互作用行列とも呼ばれる場合がある。
当業者は、一部の実施形態では、上位性効果および予測的株設計に関するオペレーションは、LIMSシステム200の自動手段を通じて、例えば、分析装置214によって、または人によるインプリメンテーションによって、または自動化手段およびマニュアル手段の組合せを通じて完全に実施することができることを認識する。オペレーションが完全に自動化されていない場合、LIMSシステム200のエレメント、例えば、分析装置214は、例えば、その独自のオペレーション可能な能力を通じた結果を生成するのではなく、オペレーションを人が遂行した結果を受け取ることができる。本明細書の他の場所で記載されている通り、分析装置214などのLIMSシステム200のコンポーネントは、1つまたは複数のコンピューターシステムによって完全または部分的にインプリメントすることができる。一部の実施形態では、特に、予測的株設計に関するオペレーションが自動化手段およびマニュアル手段の組合せによって実施される場合、分析装置214は、コンピューターハードウェア、ソフトウェア、もしくはファームウェア(またはこれらの組合せ)だけでなく、以下の表5に列挙されたもの、例えば、「性能を評価する」のカテゴリー下に列挙された装置などの人のオペレーターが運転する装置も含み得る。
第4に、分析装置212は、応答行列を正規化する。正規化は、バイアスを除去し、かつ/またはこの方法に特異的な効果の関連した部分を単離する目的で測定された応答値を調整するマニュアルおよび/またはこの実施形態では、自動化プロセスからなる。図42に関して、第1のステップ4202は、正規化された測定データを得ることを含み得る。一般に、予測的株設計および上位性マッピングを対象とする請求項において、用語「性能尺度」または「測定された性能」などは、未処理であっても、何らかの様式で処理された、例えば、正規化データであっても測定データを反映する測定基準を記述するのに使用され得る。特定のインプリメンテーションでは、正規化は、測定された応答値から先に測定されたバックグラウンド応答を減じることによって実施することができる。そのインプリメンテーションでは、結果として生じる応答要素は、rij=y(m,m)−y(m)として形成することができ、式中、y(m)は、一次変異mを親株bに適用することによって引き起こされた操作されたコレクションb内の操作されたバックグラウンド株bの応答である。正規化された応答行列の各行は、その対応する変異の応答プロファイルとして扱われることに留意されたい。すなわち、i番目の行は、j=1〜Nについてすべてのバックグラウンド株bに適用された対応する変異mの相対的効果を記述する。
ペアワイズ変異の例に関して、2つの変異の結果として生じる株の組み合わされた性能/応答は、個々に、変異のそれぞれに対する株の性能/応答より大きい、小さい、またはそれに等しい場合がある。この効果は、「上位性」として公知であり、一部の実施形態では、eij=y(m,m)−(y(m)+y(m))として表すことができる。この数学的表現の変形は、可能であり、例えば、どのように個々の変化が生物学的に相互作用するかに依存し得る。上述したように、同じ機能群からの変異は、同じ機構によって働く可能性が高く、よって、全体的な宿主性能に対して負または中立の上位性を呈する可能性が高い。対照的に、異なる機能群からの変異は、独立した機構によって働く可能性が高く、それは、例えば、重複する変異効果を低減することによって宿主性能の改善をもたらし得る。よって、同じでない応答を生じる変異は、同様の応答を生じる変異より相加的な様式で組み合わさる可能性が高い。これは、次ステップにおける類似度の計算につながる。
第5に、分析装置214は、応答の中の類似度、ペアワイズ変異例では、応答行列(4204)内のi番目の変異の効果とj番目(例えば、一次)変異の効果との間の類似度を測定する。Rのi番目の行は、N個のバックグラウンド株上のi番目の変異mの性能効果を表し、そのそれぞれは、それ自体上述した操作された変異の結果であり得ることを想起されたい。よって、i番目の変異の効果とj番目の変異の効果との間の類似度は、i番目の行とj番目の行との間の類似度sij、それぞれρおよびρによって表されて類似度行列Sを形成することができ、その一例は、図15に例示されている。類似度は、多くの公知の技法、例えば、相互相関または絶対余弦類似度、例えば、sij=abs(cos(ρ,ρ))を使用して測定され得る。
余弦類似度のような測定基準の代替または補足として、応答プロファイルをクラスター化して類似度の程度を決定することができる。クラスタリングは、適当な距離尺度(例えば、Euclidean、Hammingなど)と併せて距離に基づくクラスタリングアルゴリズム(例えば、k−平均、階層的凝縮型など)を使用することによって実施することができる。代替として、クラスタリングは、適当な類似度尺度(例えば、余弦、相関など)とともに類似度に基づくクラスタリングアルゴリズム(例えば、スペクトル、ミンカットなど)を使用して実施することができる。もちろん、任意の数の標準的な機能的なオペレーション(例えば、指数関数)を介して類似度尺度にマッピングすることができ、逆もまた同様である。一インプリメンテーションでは、階層的凝縮型クラスタリングを絶対余弦類似度と併せて使用することができる(図16Aを参照)。
クラスタリングの一例として、Cを変異mのk個の別個クラスターへのクラスタリングとする。Cを、cijが、変異iがクラスターjに属する程度、0から1の値であるクラスターメンバーシップ行列とする。そのとき、変異iとjとの間のクラスターに基づく類似度は、C×C(Cのi番目の行とj番目の行とのドット積)によって与えられる。一般に、クラスターに基づく類似度行列は、CC(すなわち、C×C−転置行列)によって与えられる。ハードクラスタリング(変異が正確に1つのクラスターに属する)の場合では、2つの変異間の類似度は、これらが同じクラスターに属する場合、1であり、そうでない場合、0である。
Costanzo、The Genetic Landscape of a Cell、Science、327巻、5964号
、2010年1月22日、425〜431頁(その全体が本明細書に参照により組み込まれている)に記載されている通り、変異応答プロファイルのこのようなクラスタリングは、細胞の根本的な機能的な機構のおおよそのマッピングに関係する。すなわち、一緒にクラスター化する変異は、根本的な生物学的プロセスまたは代謝経路に関係付けられる傾向がある。このような変異は、「機能群」と本明細書で呼ばれる。この方法の重要な知見は、2つの変異が同じ生物学的プロセスまたは経路によって働く場合、観察される効果(特に観察される利益)は、重複し得ることである。反対に、2つの変異が遠位機構によって働く場合、有益な効果が重複する可能性は低い。
第6に、上位性効果に基づいて、分析装置214は、図42(4206)に示した通り、同じでない応答に至る変異の対を選択し、例えば、これらの余弦類似度測定基準は、類似度閾値未満に入り、またはこれらの応答は、十分に分離したクラスター内に入る(例えば、図15および図16Aにおける)。これらの相違点に基づいて、選択された変異の対は、同様の対より良好にバックグラウンド株内に統合するはずである。
十分に異なった応答に至る選択された変異の対に基づいて、LIMSシステム(例えば、インタープリター204、実行エンジン207、発注依頼者(order placer)208
、およびファクトリー210のすべて、またはある組合せ)を使用して、これらの選択された変異を有する微生物株を設計することができる(4208)。諸実施形態では、本明細書で以下に、かつ他の場所で記載する通り、上位性効果を、予測モデルに組み入れる、またはそれと併せて使用して株選択を重み付けまたは選別することができる。
ある好適な予測モデルを介してライブラリーからの変異のコレクションを特定のバックグラウンド内に統合することによって得られる仮定の株の性能(別名スコア)を推定することが可能であると仮定される。教示される方法で利用される代表的な予測モデルは、「ゲノムワイド遺伝子設計判定基準の効果のコンピューター分析および予測」というより大きいセクションに見出される「予測的株設計」という表題の以下のセクションに提供されている。
線形回帰などの予測的株設計技法を使用する場合、分析装置214は、例えば、回帰結果を選別して十分に同じでない変異のみを保存することによって、低い類似度尺度を有する変異にモデルを制限することができる。代替として、予測モデルは、類似度行列を用いて重み付けることができる。例えば、一部の実施形態は、類似度行列を使用する重み付き最小二乗回帰を使用して、提案された変異の相互依存性を特徴付けることができる。一例として、重み付けは、回帰モデルに「カーネル」トリックを施すことによって実施することができる。(「カーネルトリック」が多くの機械学習モデル化手法に一般的である程度に、この再重み付けストラテジーは、線形回帰に制限されない)。
このような方法は、当業者に公知である。諸実施形態では、カーネルは、要素1−w*sijを有する行列であり、式中、1は、恒等行列の要素であり、wは、0から1の間の実数値である。w=0であるとき、これは、標準回帰モデルに変換される。実際には、wの値は、ペアワイズコンビナトリアルコンストラクトおよびこれらの付随効果y(m,m)に対して評価されるとき、予測モデルの精度(r値または二乗平均平方根誤差(RMSE))に関係する。1つの単純なインプリメンテーションでは、wは、w=1−rと定義される。この場合、モデルが完全に予測的であるとき、w=1−r=0であり、統合は、予測モデルだけに基づき、上位性マッピング手順は、役割を果たさない。一方、予測モデルがまったく予測的でない場合、w=1−r=1であり、統合は、上位性マッピング手順だけに基づく。各反復中、精度を評価してモデル性能が改善しているかどうかを決定することができる。
本明細書に記載の上位性マッピング手順は、どのモデルが分析装置214によって使用されているかに依存しないことが明らかであるはずである。このような予測モデルを考慮すると、コンビナトリアル統合(combinatorial consolidation)を介して変異ライブラリーにアクセス可能なすべての仮定の株をスコア付けおよびランク付けすることが可能である。
一部の実施形態では、上位性効果を説明するために、同じでない変異応答プロファイルを分析装置214が使用して、予測モデルからの各仮定の株に関連したスコアおよびランクを強化することができる。この手順は、同じでない応答プロファイルを有する候補株(例えば、多様なクラスターから引き出される株)を支持するための、スコアの再重み付けとして広く考えることができる。1つの単純なインプリメンテーションでは、株は、相違点閾値を満たさない、または同じクラスターから引き出された構成要素の変異(適当な重み付けを有する)の数によって低減されたそのスコアを有し得る。特定のインプリメンテーションでは、仮定の株の性能推定値は、仮定の株に関連した構成要素の変異(やはり適当な重み付けを有する)のすべての対に関連した類似度行列の項の和によって低減され得る。仮定の株は、これらの強化されたスコアを使用して再ランク付けすることができる。実際には、このような再重み付け算出は、最初のスコア推定値と併せて実施することができる。
結果は、混乱させる上位性相互作用をより有効に回避するように強化されたスコアおよびランクを有する仮定の株のコレクションである。仮定の株をこの時構築することができ、またはこれらは、続いて分析または使用するために別の計算方法に送ることができる。
当業者は、本明細書に記載の上位性マッピングおよび反復性予測的株設計は、ペアワイズ変異のみを使用することに限定されず、はるかに多くの変異をバックグラウンド株に同時に適用するように拡張することができることを認識する。別の実施形態では、追加の変異を、本明細書に記載の予測方法に従って選択された変異を使用して既に変異された株に順次適用することができる。別の実施形態では、上位性効果は、互いにわずかに異なるいくつかの株バックグラウンドに同じ遺伝子変異を適用し、改変された株バックグラウンドの中の正の応答プロファイルにおける任意の有意差に留意することによってインピュートされる。
遺伝子設計に受け入れられる生物体
開示されるHTPゲノム操作プラットフォームは、工業用微生物細胞培養物(例えば、CorynebacteriumおよびA.niger)で例示されるが、所望の形質を遺伝子変異体の集団内で同定することができる任意の宿主細胞生物体に適用可能である。
よって、本明細書で使用される場合、用語「微生物」は、広く解釈されるべきである。これは、これらに限定されないが、2つの原核生物ドメイン、細菌および古細菌、ならびにある特定の真核真菌および原生生物を含む。しかし、ある特定の態様では、「高等」真核生物、例えば、昆虫、植物、および動物を本明細書に教示の方法において利用することができる。
本開示は、原核宿主細胞(実施例1〜9)および真核宿主細胞(実施例10〜11)の両方についての実施例を提供する。
適当な宿主細胞としては、これらに限定されないが、細菌細胞、藻類細胞、植物細胞、真菌細胞、昆虫細胞、および哺乳動物細胞が挙げられる。一例示的な実施形態では、適当な宿主細胞には、E.coli(例えば、New England BioLabs in Ipswich、Mass.から入手可能なSHuffle(商標)コンピテントE.coli)が含まれる。
本開示の他の適当な宿主生物としては、Corynebacterium属の微生物が挙げられる。一部の実施形態では、好適なCorynebacterium株/種としては、寄託基準株がDSM44549であるC.efficiens、寄託基準株がATCC13032であるC.glutamicum、および寄託基準株がATCC6871であるC.ammoniagenesが挙げられる。一部の実施形態では、本開示の好適な宿主は、C.glutamicumである。
Corynebacterium属の、特に、Corynebacterium glutamicum種の適当な宿主株は、特に、公知の野生型株:Corynebacterium glutamicum ATCC13032、Corynebacterium acetoglutamicum ATCC15806、Corynebacterium acetoacidophilum ATCC13870、Corynebacterium melassecola ATCC17965、Corynebacterium thermoaminogenes FERM BP−1539、Brevibacterium flavum ATCC14067、Brevibacterium lactofermentum ATCC13869、およびBrevibacterium divaricatum ATCC14020;ならびにこれらから調製されるL−アミノ酸産生変異体または株、例えば、L−リシン産生株:Corynebacterium glutamicum FERM−P 1709、Brevibacterium flavum FERM−P 1708、Brevibacterium lactofermentum FERM−P 1712、Corynebacterium
glutamicum FERM−P 6463、Corynebacterium glutamicum FERM−P 6464、Corynebacterium glutamicum DM58−1、Corynebacterium glutamicum DG52−5、Corynebacterium glutamicum DSM5714、およびCorynebacterium glutamicum DSM12866などである。
用語「Micrococcus glutamicus」も、C.glutamicumについて使用されている。C.efficiens種のいくつかの代表は、例えば、株FERM BP−1539など、先行技術においてC.thermoaminogenesとも呼ばれている。
一部の実施形態では、本開示の宿主細胞は、真核細胞である。適当な真核宿主細胞としては、これらに限定されないが、真菌細胞、藻類細胞、昆虫細胞、動物細胞、および植物細胞が挙げられる。適当な真菌宿主細胞としては、これらに限定されないが、Ascomycota、Basidiomycota、Deuteromycota、Zygomycota、Fungi imperfectiが挙げられる。ある特定の好適な真菌宿主細胞には、酵母細胞および糸状菌細胞が含まれる。適当な糸状菌宿主細胞としては、例えば、EumycotinaおよびOomycota亜門の任意のフィラメント形が挙げられる。(例えば、参照により本明細書に組み込まれている、Hawksworthら、In Ainsworth and Bisby's Dictionary of The Fungi、8版、1995年、CAB International、University Press、Cambridge、UKを参照)。糸状菌は、キチン、セルロース、およ
び他の複合多糖から構成される細胞壁を有する栄養菌糸体によって特徴付けられる。糸状菌宿主細胞は、酵母と形態学的に別個のものである。
ある特定の例示的であるが限定されない実施形態では、糸状菌宿主細胞は、Achlya、Acremonium、Aspergillus、Aureobasidium、Bjerkandera、Ceriporiopsis、Cephalosporium、Chrysosporium、Cochliobolus、Corynascus、Cryphonectria、Cryptococcus、Coprinus、Coriolus、Diplodia、Endothis、Fusarium、Gibberella、Gliocladium、Humicola、Hypocrea、Myceliophthora(例えば、Myceliophthora thermophila)、Mucor、Neurospora、Penicillium、Podospora、Phlebia、Piromyces、Pyricularia、Rhizomucor、Rhizopus、Schizophyllum、Scytalidium、Sporotrichum、Talaromyces、Thermoascus、Thielavia、Tramates、Tolypocladium、Trichoderma、Verticillium、Volvariella、またはこれらのテレオモルフもしくはアナモルフおよび同義語もしくは分類学的均等物の種の細胞であり得る。一実施形態では、糸状菌は、A.nidulans、A.oryzae、A.sojae、およびA.niger群のAspergilliからなる群から選択される。一実施形態では、糸状菌は、Aspergillus nigerである。
別の実施形態では、真菌種の特定の変異体が、本明細書に提供される方法およびシステムのために使用される。一実施形態では、本明細書に提供されるハイスループットおよび/または自動化方法およびシステムに適した真菌種の特定の変異体が使用される。このような変異体の例は、プロトプラストが非常に良好な株(strains that protoplast very well);主として、またはより好ましくは、単核を有するプロトプラストのみを産生
する株;マイクロタイタープレート中で効率的に再生する株、より速く再生する株および/またはポリヌクレオチド(例えば、DNA)分子を効率的に取り込む株、低粘度の培養物、例えば、培養において、単一クローンの単離を防止し、かつ/または培養物の粘性を上昇させるほどもつれていない菌糸を産生する細胞などを産生する株、ランダム組込みが低減された(例えば、障害のある非相同末端接合経路)株、またはこれらの組合せであり得る。
さらに別の実施形態では、本明細書に提供される方法およびシステムにおいて使用するための特定の変異体株は、例えば、ウリジン要求性変異体株などの選択可能マーカー遺伝子を欠く株であり得る。これらの変異体株は、それぞれpyrGまたはpyrE遺伝子によってコードされるオロチジン5ホスフェートデカルボキシラーゼ(OMPD)またはオロテートp−リボシルトランスフェラーゼ(OPRT)のいずれかを欠損している場合がある(T. Goosenら、Curr Genet.、1987年、11巻:499〜503頁;J. Begueretら、Gene.、1984年、32巻:487〜92頁)。
一実施形態では、本明細書に提供される方法およびシステムにおいて使用するための具体的な変異体株は、より短い菌糸およびより酵母様の外観によって特徴付けられる緻密な細胞形態を有する株である。
適当な酵母宿主細胞としては、これらに限定されないが、Candida、Hansenula、Saccharomyces、Schizosaccharomyces、Pichia、Kluyveromyces、およびYarrowiaが挙げられる。一部の実施形態では、酵母細胞は、Hansenula polymorpha、Saccharomyces cerevisiae、Saccaromyces carlsbergensis、Saccharomyces diastaticus、Saccharomyces norbensis、Saccharomyces kluyveri、Schizosaccharomyces pombe、Pichia pastoris、Pichia finlandica、Pichia trehalophila、Pichia kodamae、Pichia membranaefaciens、Pichia opuntiae、Pichia thermotolerans、Pichia salictaria、Pichia quercuum、Pichia pijperi、Pichia stipitis、Pichia methanolica、Pichia angusta、Kluyveromyces lactis、Candida albicans、またはYarrowia lipolyticaである。
ある特定の実施形態では、宿主細胞は、藻類細胞、例えば、Chlamydomonas(例えば、C.Reinhardtii)およびPhormidium(P.sp.ATCC29409)である。
他の実施形態では、宿主細胞は、原核細胞である。適当な原核細胞としては、グラム陽性、グラム陰性、およびグラム不定細菌細胞が挙げられる。宿主細胞は、Agrobacterium、Alicyclobacillus、Anabaena、Anacystis、Acinetobacter、Acidothermus、Arthrobacter、Azobacter、Bacillus、Bifidobacterium、Brevibacterium、Butyrivibrio、Buchnera、Campestris、Camplyobacter、Clostridium、Corynebacterium、Chromatium、Coprococcus、Escherichia、Enterococcus、Enterobacter、Erwinia、Fusobacterium、Faecalibacterium、Francisella、Flavobacterium、Geobacillus、Haemophilus、Helicobacter、Klebsiella、Lactobacillus、Lactococcus、Ilyobacter、Micrococcus、Microbacterium、Mesorhizobium、Methylobacterium、Methylobacterium、Mycobacterium、Neisseria、Pantoea、Pseudomonas、Prochlorococcus、Rhodobacter、Rhodopseudomonas、Rhodopseudomonas、Roseburia、Rhodospirillum、Rhodococcus、Scenedesmus、Streptomyces、Streptococcus、Synecoccus、Saccharomonospora、Saccharopolyspora、Staphylococcus、Serratia、Salmonella、Shigella、Thermoanaerobacterium、Tropheryma、Tularensis、Temecula、Thermosynechococcus、Thermococcus、Ureaplasma、Xanthomonas、Xylella、Yersinia、およびZymomonasの種であり得るが、これらに限定されない。一部の実施形態では、宿主細胞は、Corynebacterium glutamicumである。
一部の実施形態では、細菌宿主株は、工業用株である。多数の細菌工業用株が公知であり、本明細書に記載の方法および組成物において適している。
一部の実施形態では、細菌宿主細胞は、Agrobacterium種(例えば、A.radiobacter、A.rhizogenes、A.rubi)、Arthrobacterspecies(例えば、A.aurescens、A.citreus、A.globformis、A.hydrocarboglutamicus、A.mysorens、A.nicotianae、A.paraffineus、A.protophonniae、A.roseoparaffinus、A.sulfureus、A.ureafaciens)、Bacillus種(例えば、B.thuringiensis、B.anthracis、B.megaterium、B.subtilis、B.lentus、B.circulars、B.pumilus、B.lautus、B.coagulans、B.brevis、B.firmus、B.alkaophius、B.licheniformis、B.clausii、B.stearothermophilus、B.halodurans、およびB.amyloliquefaciens)のものである。特定の実施形態では、宿主細胞は、これらに限定されないが、B.subtilis、B.pumilus、B.licheniformis、B.megaterium、B.clausii、B.stearothermophilus、およびB.amyloliquefaciensを含めた工業用Bacillus株である。一部の実施形態では、宿主細胞は、工業用Clostridium種(例えば、C.acetobutylicum、C.tetani E88、C.lituseburense、C.saccharobutylicum、C.perfringens、C.beijerinckii)である。一部の実施形態では、宿主細胞は、工業用Corynebacterium種(例えば、C.glutamicum、C.acetoacidophilum)である。一部の実施形態では、宿主細胞は、工業用Escherichia種(例えば、E.coli)である。一部の実施形態では、宿主細胞は、工業用Erwinia種(例えば、E.uredovora、E.carotovora、E.ananas、E.herbicola、E.punctata、E.terreus)である。一部の実施形態では、宿主細胞は、工業用Pantoea種(例えば、P.citrea、P.agglomerans)である。一部の実施形態では、宿主細胞は、工業用Pseudomonas種(例えば、P.putida、P.aeruginosa、P.mevalonii)である。一部の実施形態では、宿主細胞は、工業用Streptococcus種(例えば、S.equisimiles、S.pyogenes、S.uberis)である。一部の実施形態では、宿主細胞は、工業用Streptomyces種(例えば、S.ambofaciens、S.achromogenes、S.avermitilis、S.coelicolor、S.aureofaciens、S.aureus、S.fungicidicus、S.griseus、S.lividans)である。一部の実施形態では、宿主細胞は、工業用Zymomonas種(例えば、Z.mobilis、Z.lipolytica)である、などである。
本開示は、哺乳動物細胞、例えば、ヒト(293、WI38、PER.C6、およびBowes黒色腫細胞を含む)、マウス(3T3、NS0、NS1、Sp2/0を含む)、ハムスター(CHO、BHK)、サル(COS、FRhL、Vero)、およびハイブリドーマ細胞株を含めて、様々な動物細胞型での使用にも適している。
様々な実施形態では、原核生物株および真核生物株の両方を含めた本開示の実践において使用され得る株は、いくつかの培養株コレクション、例えば、American Type Culture Collection(ATCC)、Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)、およびAgricultural Research Service Patent Culture Collection、Northern Regional Research Center(NRRL)から公的に容易にアクセス可能である。
一部の実施形態では、本開示の方法は、多細胞生物にも適用可能である。例えば、プラットフォームは、作物の性能を改善するのに使用することができる。生物体は、複数の植物、例えば、Gramineae、Fetucoideae、Poacoideae、Agrostis、Phleum、Dactylis、Sorgum、Setaria、Zea、Oryza、Triticum、Secale、Avena、Hordeum、Saccharum、Poa、Festuca、Stenotaphrum、Cynodon、Coix、Olyreae、Phareae、Compositae、またはLeguminosaeを含み得る。例えば、植物は、トウモロコシ、イネ、ダイズ、綿、コムギ、ライムギ、カラスムギ、オオムギ、エンドウマメ、マメ、レンズマメ、ピーナッツ、ヤムビーン、ササゲ、ハッショウマメ、クローバー、アルファルファ、ルピナス、カラスノエンドウ、ハス、スイートクローバー、フジ、スイートピー、モロコシ、キビ、ヒマワリ、キャノーラなどであり得る。同様に、生物体は、複数の動物、例えば、非ヒト哺乳動物、魚、昆虫などを含み得る。
遺伝子設計&HTP微生物操作プラットフォームにおいて利用するための遺伝的多様性プールの生成
一部の実施形態では、本開示の方法は、遺伝子設計として特徴付けられる。本明細書で使用される場合、用語の遺伝子設計は、新しい優れた宿主細胞を設計および生み出すために特定の遺伝子、遺伝子の部分、プロモーター、停止コドン、5’UTR、3’UTR、または他のDNA配列の最適のバリアントを同定および選択することによる宿主生物のゲノムの再構築または変更を指す。
一部の実施形態では、本開示の遺伝子設計法における第1のステップは、新しい宿主ゲノムを再構築することができる複数の配列バリエーションを有する最初の遺伝的多様性プール集団を得ることである。
一部の実施形態では、本明細書に教示の遺伝子設計法における後続のステップは、上述のHTP分子ツールセット(例えば、SNPスワッピングまたはプロモータースワッピング)の1つまたは複数を使用して、HTP遺伝子設計ライブラリーを構築することであり、次いでこのライブラリーは、宿主細胞において試験するための特定のゲノム変更のライブラリーを提供することによってゲノム操作プロセスのドライバーとして機能する。
既存の野生型株からの多様性プールの利用
一部の実施形態では、本開示は、所与の野生型集団の微生物の中に存在する配列多様性を同定するための方法を教示する。したがって、多様性プールは、分析に利用される所与の数nの野生型微生物であり得、前記微生物のゲノムは、「多様性プール」を代表する。
一部の実施形態では、多様性プールは、前記野生型微生物の中で天然の遺伝的バリエーション中に存在する既存の多様性の結果であり得る。このバリエーションは、所与の宿主細胞の株バリアントから生じる場合があり、または完全に異なる種である微生物の結果である場合がある。遺伝的バリエーションは、天然に存在するか否かにかかわらず、株の遺伝子配列の任意の差異を含み得る。一部の実施形態では、遺伝的バリエーションは、とりわけ、SNPスワップ、PROスワップ、開始/停止コドンスワップ、またはSTOPスワップを含み得る。
既存の工業用株バリアントからの多様性プールの利用
本開示の他の実施形態では、多様性プールは、伝統的な株改良プロセスの間に創製された株バリアント(例えば、ランダム変異を介して生成され、長年にわたって収率改善のために選択された1種または複数の宿主生物株)である。よって、一部の実施形態では、多様性プールまたは宿主生物は、歴史的な産生株のコレクションを含み得る。
特定の態様では、多様性プールは、特定の時点で「ベースライン」遺伝子配列を有する元の親微生物株(S)(SGen)、およびさらに、前記S株に由来し、/それから開発された、かつSのベースラインゲノムに関して異なるゲノムを有する任意の数の後続の子孫株(S、S、S、Sなど、S2−nに一般化可能)(S2−nGen2−n)であり得る。
例えば、一部の実施形態では、本開示は、多様性プール内の微生物ゲノムをシーケンシングして各株に存在するSNPを同定することを教示する。一実施形態では、多様性プールの株は、歴史的な微生物産生株である。よって、本開示の多様性プールは、例えば、工業用基準株、および伝統的な株改良プログラムを介して産生された1種または複数の変異工業用株を含み得る。
多様性プール内のすべてのSNPが同定されたら、本開示は、個々にかつ群において、SNPの効果(例えば、目的の表現型の創製)を描写する(すなわち、定量し、特徴付ける)ためのSNPスワッピングの方法およびスクリーニング方法を教示する。よって、上述した通り、教示したプラットフォームにおける最初のステップは、複数の配列バリエーション、例えば、SNPを有する最初の遺伝的多様性プール集団を得ることであり得る。次いで、教示したプラットフォームにおける後続のステップは、上述のHTP分子ツールセット(例えば、SNPスワッピング)の1つまたは複数を使用して、HTP遺伝子設計ライブラリーを構築することであり得、次いでこのライブラリーは、微生物において試験するための特定のゲノム変更のライブラリーを提供することによってゲノム操作プロセスのドライバーとして機能する。
一部の実施形態では、本開示のSNPスワッピング方法は、変異株(例えば、S2−nGen2−nの中からの株)内で同定された1つまたは複数のSNPを基準株(SGen)または野生型株に導入するステップを含む。
他の実施形態では、本開示のSNPスワッピング方法は、変異株(例えば、S2−nGen2−nの中からの株)内で同定された1つまたは複数のSNPを除去するステップを含む。
変異誘発を介した多様性プールの創製
一部の実施形態では、細胞の所与の多様性プール集団における目的の変異は、変異誘発化学物質または放射線を含めた、株を変異させる任意の手段によって人工的に生成することができる。用語「変異誘発させること」は、細胞核酸材料において1つまたは複数の遺伝子改変を誘導するための方法を指すのに本明細書で使用される。
用語「遺伝子改変」は、DNAの任意の変更を指す。代表的な遺伝子改変は、ヌクレオチド挿入、欠失、置換、およびこれらの組合せを含み、単一塩基という小さいものまたは数万塩基という大きいものであり得る。よって、用語「遺伝子改変」は、染色体の領域を含むDNAの位置または配向が変更されるヌクレオチド配列の反転および他の染色体再配列を包含する。染色体再配列は、染色体内再配列または染色体間再配列を含むことができる。
一実施形態では、本主張の主題において使用される変異誘発方法は、実質的にランダムであり、その結果、遺伝子改変は、変異誘発される核酸材料内の任意の利用可能なヌクレオチド位置で行うことができる。別の言い方をすれば、一実施形態では、変異誘発させることは、特定のヌクレオチド配列における出現の優先または頻度の増加を示さない。
本開示の方法は、これらに限定されないが、紫外光、X線照射、ガンマ照射、N−エチル−N−ニトロソ尿素(ENU)、メチルニトロソ尿素(methyinitrosourea)(MNU
)、プロカルバジン(PRC)、トリエチレンメラミン(TEM)、アクリルアミドモノマー(AA)、クロラムブシル(CHL)、メルファラン(MLP)、シクロホスファミド(CPP)、硫酸ジエチル(DES)、エチルメタンスルホネート(EMS)、メチルメタンスルホネート(MMS)、6−メルカプトプリン(6−MP)、マイトマイシン−C(MMC)、N−メチル−N’−ニトロ−N−ニトロソグアニジン(MNNG)、O、およびウレタン(UR)を含めた任意の変異誘発剤を使用することができる(例えば、Rinchik、1991年;Markerら、1997年;およびRussell、1990年を参照)。追加の変異誘発剤は、http://www.iephb.nw.ru/〜spirov/hazard/mutagen_lst.htmlに
記載されているものを含めて当業者に周知である。
用語「変異誘発させること」は、細胞機能を変更(例えば、標的化変異によって)またはモジュレートすることによって、変異誘発の速度、品質、または程度を増強する方法も包含する。例えば、細胞を変質させ、またはモジュレートすることによって、DNA修復、変異誘発物質代謝、変異誘発物質感受性、ゲノム安定性、またはこれらの組合せが機能していない、または欠損しているようにすることができる。よって、通常ゲノム安定性を維持する遺伝子機能の破壊を使用して変異誘発を増強することができる。破壊の代表的な標的としては、これらに限定されないが、DNAリガーゼI(Bentleyら、2002年)
およびカゼインキナーゼI(米国特許第6,060,296号)が挙げられる。
一部の実施形態では、本開示の切断酵素をコードする核酸を生成するために、部位特異的変異誘発(例えば、トランスフォーマー部位指向変異誘発キット(Clontech)などの市販キットを使用するプライマー指向変異誘発)を使用して、核酸配列全体にわたって複数の変化をもたらす。
1種または複数の変異誘発剤に曝露した際の遺伝子改変の頻度は、処置の用量および/または繰り返しを変更することによってモジュレートすることができ、特定の用途に合わせることができる。
よって、一部の実施形態では、本明細書で使用される「変異誘発」は、エラープローンPCR変異誘発、オリゴヌクレオチド指向性変異誘発、部位指向変異誘発、および本明細書に記載の技法のいずれかによる反復的配列組換えを含めて、変異を誘導するためのすべての当技術分野で公知の技法を含む。
多様性を生成するための単一遺伝子座変異
一部の実施形態では、本開示は、ゲノムDNAの選択された部分を導入し、欠失させ、または置き換えることによって細胞集団を変異させることを教示する。よって、一部の実施形態では、本開示は、特定の遺伝子座に変異を標的化するための方法を教示する。他の実施形態では、本開示は、標的DNA領域を選択的に編集するための遺伝子編集技術、例えば、ZFN、TALENS、またはCRISPRの使用を教示する。
他の実施形態では、本開示は、宿主生物の外で選択されたDNA領域を変異させ、次いで変異配列を宿主生物内に挿入して戻すことを教示する。例えば、一部の実施形態では、本開示は、生来のプロモーターまたは合成プロモーターを変異させて、様々な発現性質を有する一連のプロモーターバリアント(以下のプロモーターラダーを参照)を生成することを教示する。他の実施形態では、本開示は、ProSARなどの単一遺伝子最適化技法に適合する(本明細書に参照により組み込まれている、Foxら、2007年、「Improving
catalytic function by ProSAR-driven enzyme evolution.」、Nature Biotechnology、25巻(3号)、338〜343頁)。
一部の実施形態では、DNAの選択された領域は、自然バリアントの遺伝子シャッフリング、または合成オリゴでのシャッフリング、プラスミド−プラスミド組換え、ウイルスプラスミド組換え、ウイルス−ウイルス組換えを介してin vitroで生成される。他の実施形態では、ゲノム領域は、エラープローンPCRを介して生成される(例えば、図1を参照)。
一部の実施形態では、選択された遺伝子領域内で変異を生成するステップは、「リアセンブリーPCR」によって実践される。簡単に言えば、オリゴヌクレオチドプライマー(オリゴ)が、目的の核酸配列のセグメントをPCR増幅するために合成され、その結果、オリゴヌクレオチドの配列は、2つのセグメントの接合部と重複する。重複領域は、典型的には、長さが約10〜100ヌクレオチドである。セグメントのそれぞれは、一連のこのようなプライマーで増幅される。次いでPCR産物は、アセンブリープロトコールに従って「リアセンブルされる」。簡単に説明すると、アセンブリープロトコールでは、PCR産物は、例えば、ゲル電気泳動またはサイズ排除クロマトグラフィーによって最初に精製されてプライマーから離れる。精製産物は、一緒に混合され、追加のプライマーの非存在下で(「セルフプライミング」)、ポリメラーゼおよびデオキシヌクレオシドトリホスフェート(dNTP)および適切な緩衝塩の存在下で、約1〜10サイクルの変性、リアニーリング、および伸長に供される。遺伝子に隣接するプライマーを用いた後続のPCRが使用されて、完全にリアセンブルおよびシャッフルされた遺伝子の収量が拡大される。
本開示の一部の実施形態では、上記に論じたものなどの変異DNA領域は、変異体配列について富化され、その結果、複数の変異体スペクトル、すなわち、変異の可能な組合せが、より効率的にサンプリングされる。一部の実施形態では、変異配列は、アセンブリー反応の前に、in vitroで親和性精製材料を増幅する好適なステップを用いて、mutSタンパク質親和性マトリックスを介して同定される(Wagnerら、Nucleic Acids Res.、23巻(19号):3944〜3948頁(1995年);Suら、Proc. Natl. Acad. Sci.(U.S.A.)、83巻:5057〜5061頁(1986年))。次いでこの増
幅された材料は、本願の後の部分に記載されているアセンブリーまたはリアセンブリーPCR反応にかけられる。
プロモーターラダー
プロモーターは、遺伝子が転写される速度を調節し、様々なやり方で転写に影響を与えることができる。構成的プロモーターは、例えば、内部または外部の細胞条件にかかわらず、定速でこれらの関連する遺伝子の転写を指示し、一方、調節可能プロモーターは、内部および/または外部の細胞条件、例えば、増殖速度、温度、具体的な環境化学物質に対する応答などに応じて遺伝子が転写される速度を増減する。プロモーターは、これらの正常な細胞コンテクストから単離することができ、操作されて、実質的に任意の遺伝子の発現を調節することができ、細胞増殖、産物収率、および/または目的の他の表現型の有効な改変を可能にする。
一部の実施形態では、本開示は、下流の遺伝子設計法で使用するためのプロモーターラダーライブラリーを生成するための方法を教示する。例えば、一部の実施形態では、本開示は、一連の発現強度または優れた調節性質を呈する、1つもしくは複数のプロモーターを同定し、かつ/または宿主細胞内で1つもしくは複数のプロモーターのバリアントを生成する方法を教示する。これらの同定および/または生成されたプロモーターの特定の組合せは、以下でより詳細に説明されるプロモーターラダーとして一緒にグループ化することができる。
一部の実施形態では、本開示は、プロモーターラダーの使用を教示する。一部の実施形態では、本開示のプロモーターラダーは、連続した範囲の発現プロファイルを呈するプロモーターを含む。例えば、一部の実施形態では、プロモーターラダーは、刺激に応答して、または構成的発現を通じて一連の発現強度を呈する天然の、生来の、または野生型プロモーターを同定することによって創製される(例えば、図20および図28〜30を参照)。これらの同定されたプロモーターは、プロモーターラダーとして一緒にグループ化することができる。
他の実施形態では、本開示は、異なる条件にわたって一連の発現プロファイルを呈するプロモーターラダーの創製を教示する。例えば、一部の実施形態では、本開示は、発現ピークが発酵の異なる段階全体にわたって広がったプロモーターのラダーを生み出すことを教示する(例えば、図28を参照)。他の実施形態では、本開示は、特異的刺激に応答して異なる発現ピークダイナミクスを有するプロモーターのラダーを生み出すことを教示する(例えば、図29を参照)。当業者は、本開示の調節プロモーターラダーは、任意の1つまたは複数の調節プロファイルの代表であり得ることを認識する。
一部の実施形態では、本開示のプロモーターラダーは、応答の連続的な範囲にわたって予測可能な様式で遺伝子発現を撹乱するように設計される。一部の実施形態では、プロモーターラダーの連続的な特質は、株改良プログラムに追加の予測力を付与する。例えば、一部の実施形態では、選択された代謝経路のスワッピングプロモーターまたは終結配列は、非常に最適の発現比またはプロファイルを同定する宿主細胞性能曲線を生成することができ、標的とした遺伝子が特定の反応または遺伝的カスケードにとってもはや制限因子でない一方、不適切な環境下で不要な過剰発現または誤発現も回避する株を生成する。一部の実施形態では、プロモーターラダーは、所望のプロファイルを呈する天然の、生来の、または野生型プロモーターを同定することによって創製される。他の実施形態では、プロモーターラダーは、天然に存在するプロモーターを変異させて複数の変異プロモーター配列を得ることによって創製される。これらの変異プロモーターのそれぞれは、標的遺伝子発現に対する効果について試験される。一部の実施形態では、編集されたプロモーターは、様々な条件にわたって発現活性について試験され、その結果、各プロモーターバリアントの活性が記録され/特徴付けられ/アノテートされ、かつデータベース内に記憶される。結果として生じる編集されたプロモーターバリアントは、引き続いて組織化されて、これらの発現の強度に基づいて配列されたプロモーターラダーにされる(例えば、頂部付近に高度発現バリアントおよび底部付近に減弱された発現を有し、したがって、用語「ラダー」をもたらす)。
一部の実施形態では、本開示は、同定された天然に存在するプロモーターおよび変異されたバリアントプロモーターの組合せであるプロモーターラダーを教示する。
一部の実施形態では、本開示は、以下の判定基準:1)構成的プロモーターのラダーを表した;および2)短いDNA配列、理想的には100塩基対未満によってコードされ得る、の両方を満たした天然の、生来の、または野生型プロモーターを同定する方法を教示する。一部の実施形態では、本開示の構成的プロモーターは、2つの選択された成長条件(典型的には、工業的な培養中に経験した条件の間で比較した)にわたって一定の遺伝子発現を呈する。一部の実施形態では、本開示のプロモーターは、約60塩基対のコアプロモーターおよび長さが26から40塩基対の間の5’UTRからなる。
一部の実施形態では、上述の同定した天然に存在するプロモーター配列の1つまたは複数が、遺伝子編集のために選択される。一部の実施形態では、天然のプロモーターは、上述した変異方法のいずれかを介して編集される。他の実施形態では、本開示のプロモーターは、所望の配列を有する新しいプロモーターバリアントを合成することによって編集される。
2015年12月7日に出願された米国特許出願第62/264,232号の開示全体は、すべての目的に関してその全体が参照により本明細書に組み込まれている。
本開示のプロモーターの非網羅的なリストを、以下の表1に提供する。プロモーター配列のそれぞれは、異種プロモーターまたは異種プロモーターポリヌクレオチドと呼ぶことができる。
一部の実施形態では、本開示のプロモーターは、上記表由来のプロモーターと少なくとも100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、または75%の配列同一性を呈する。
ターミネーターラダー
一部の実施形態では、本開示は、RNAコードエレメントの末端の3’位で1つまたは複数の転写終結配列を提供することによって、遺伝子操作された宿主株を改良する方法を教示する。一部の実施形態では、本開示は、終結配列を付加すると、遺伝子操作された宿主内の選択された遺伝子のRNA転写の効率が改善されることを教示する。他の実施形態では、本開示は、終結配列を付加すると、遺伝子操作された宿主内の選択された遺伝子のRNA転写の効率が低減されることを教示する。よって、一部の実施形態では、本開示のターミネーターラダーは、一連の転写効率を呈する一連のターミネーター配列(例えば、1つの弱いターミネーター、1つの平均のターミネーター、および1つの強いプロモーター)を含む。
転写終結配列は、転写で、オープンリーディングフレームをコードするヌクレオチド配列の下流に配置されたとき、オープンリーディングフレームの転写を終了させる任意のヌクレオチド配列であり得る。このような配列は、当技術分野で公知であり、原核生物、真核生物、またはファージ起源のものであり得る。ターミネーター配列の例としては、これらに限定されないが、PTH−ターミネーター、pET−T7ターミネーター、T3−Tφターミネーター、pBR322−P4ターミネーター、水疱性口内炎(vesicular stomatitus)ウイルスターミネーター、rrnB−T1ターミネーター、rrnCターミネ
ーター、TTadc転写ターミネーター、ならびに酵母認識終結配列、例えば、Matα(α−因子)転写ターミネーター、生来のα−因子転写終結配列、ADR1転写終結配列、ADH2転写終結配列、およびGAPD転写終結配列が挙げられる。転写ターミネーター配列の非網羅的なリストは、iGEMレジストリにおいて見出すことができ、これは、http://partsregistry.org/Terminators/Catalogで利用可能である。
一部の実施形態では、転写終結配列は、ポリメラーゼ特異的であっても非特異的であってもよいが、本実施形態において使用するために選択される転写ターミネーターは、選択されたプロモーターとの「機能的組合せ」を形成するべきであり、ターミネーター配列は、プロモーターで開始するRNAポリメラーゼのタイプによって転写を終結することができるべきであることを意味する。例えば、一部の実施形態では、本開示は、真核生物RNA pol IIプロモーターおよび真核生物RNA pol IIターミネーター、T7プロモーターおよびT7ターミネーター、T3プロモーターおよびT3ターミネーター、酵母認識プロモーターおよび酵母認識終結配列などは一般に、機能的組合せを形成するはずであることを教示する。使用される転写終結配列の実体(identity)は、転写が所与のプロモーターから終結される効率に基づいて選択することもできる。例えば、異種転写ターミネーター配列は、RNAコードエレメントの転写的に下流に提供されて、所与のプロモーターから少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%の終結効率を達成することができる。
一部の実施形態では、操作された発現コンストラクトからのRNA転写の効率は、RNAコードエレメントの末端の3’位で2つまたはそれ超のヘアピンを含む二次構造を形成する核酸配列を提供することによって改善することができる。特定の理論によって束縛されることを望むことなく、二次構造は、転写伸長複合体を不安定化させ、ポリメラーゼをDNA鋳型から解離した状態にし、それによって、非機能的配列の非生産的転写を最小限にし、所望のRNAの転写を増大させる。したがって、2つまたはそれ超の隣接するヘアピンを含む二次構造を形成する終結配列を提供することができる。一般に、ヘアピンは、それ自体で折り返してアームが一本鎖ループによって接続されている対を成したステム領域を形成することができるパリンドロームヌクレオチド配列によって形成することができる。一部の実施形態では、終結配列は、2、3、4、5、6、7、8、9、10、またはそれ超の隣接するヘアピンを含む。一部の実施形態では、隣接するヘアピンは、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15の対を成していないヌクレオチドによって分離されている。一部の実施形態では、ヘアピンステムは、長さが4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれ超の塩基対を含む。ある特定の実施形態では、ヘアピンステムは、長さが12〜30塩基対である。ある特定の実施形態では、終結配列は、約9〜25塩基対を含むステム領域を有する2つまたはそれ超の中型のヘアピンを含む。一部の実施形態では、ヘアピンは、1、2、3、4、5、6、7、8、9、または10ヌクレオチドのループ形成領域を含む。一部の実施形態では、ループ形成領域は、4〜8ヌクレオチドを含む。特定の理論によって束縛されることを望むことなく、二次構造の安定性は、終結効率と相関し得る。ヘアピン安定性は、その長さ、それが含有するミスマッチまたはバルジの数、および対を成した領域の塩基組成によって決定される。グアニンとシトシンとの間の対合は、3つの水素結合を有し、2つしか有さないアデニン−チミン対合と比較してより安定である。ヘアピン形成パリンドロームヌクレオチド配列のG/C含有量は、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%またはそれ超であり得る。一部の実施形態では、ヘアピン形成パリンドロームヌクレオチド配列のG/C含有量は、少なくとも80%である。一部の実施形態では、終結配列は、原核生物、真核生物、またはファージ起源の1つまたは複数の転写ターミネーター配列に由来する。一部の実施形態では、一連の4、5、6、7、8、9、10またはそれ超のアデニン(A)をコードするヌクレオチド配列が、終結配列の3’に提供される。
一部の実施形態では、本開示は、一連のタンデム終結配列の使用を教示する。一部の実施形態では、一連の2、3、4、5、6、7、またはそれ超の第1の転写ターミネーター配列を、dsRNAコードエレメントの最終ヌクレオチドの3’に直接、またはdsRNAコードエレメントの最終ヌクレオチドの3’に、少なくとも1〜5、5〜10、10〜15、15〜20、20〜25、25〜30、30〜35、35〜40、40〜45、45〜50、50〜100、100〜150、150〜200、200〜300、300〜400、400〜500、500〜1,000、もしくはそれ超のヌクレオチドの距離で配置することができる。タンデム転写ターミネーター配列間のヌクレオチドの数は、様々であり得、例えば、転写ターミネーター配列は、0、1、2、3、4、5、6、7、8、9、10、10〜15、15〜20、20〜25、25〜30、30〜35、35〜40、40〜45、45〜50、またはそれ超のヌクレオチドによって分離され得る。一部の実施形態では、転写ターミネーター配列は、構造予測アルゴリズムによって決定されるこれらの予測された二次構造に基づいて選択することができる。構造予測プログラムは、当技術分野で周知であり、例えば、CLC Main Workbenchを含む。
当業者は、本開示の方法は、任意の終結配列に適合することを認識する。一部の実施形態では、本開示は、Pfeifer-Sancarら、2013年「Comprehensive analysis of the
Corynebacterium glutamicum transcriptome using an improved RNAseq technique」、Pfeifer-Sancarら、BMC Genomics、2013年、14巻:888頁)に開示さ
れたアノテートされたCorynebacterium glutamicumターミネーターの使用を教示する。他の実施形態では、本開示は、http://partsregistry.org/Terminators/Catalogで利用可能であるiGEMレジストリにおいて見出される転写ターミネーター配列の使用を教示する。本開示の転写ターミネーター配列の非網羅的なリストを以下の表1.1に提供する。
仮説主導型多様性プールおよびヒルクライミング
本開示は、本開示のHTPゲノム操作方法は、宿主細胞性能の有意な獲得を達成するのに先の遺伝的知識を必要としないことを教示する。実際に、本開示は、ランダム変異誘発、および既存の宿主細胞バリアントの中での遺伝的多様性の同定(例えば、野生型宿主細胞と工業用バリアントとの間の比較など)を含めたいくつかの機能にとらわれない(functionally agnostic)手法を介して多様性プールを生成する方法を教示する。
しかし、一部の実施形態では、本開示は、下流のHTP操作に使用される遺伝的多様性変異を設計する仮説主導方法も教示する。すなわち、一部の実施形態では、本開示は、選択された変異の指向設計を教示する。一部の実施形態では、指向変異が、本開示の操作ライブラリー(例えば、SNPスワップ、PROスワップ、またはSTOPスワップ)中に組み入れられる。
一部の実施形態では、本開示は、遺伝子アノテーション、仮定された(もしくは確認された)遺伝子機能、またはゲノム内の場所に基づく指向変異の創製を教示する。本開示の多様性プールは、文献において宿主細胞の性能の増大に関連した特異的代謝経路または遺伝経路に関与すると仮定された遺伝子内の変異を含み得る。他の実施形態では、本開示の多様性プールは、宿主性能の改善に関連したオペロン内に存在する遺伝子への変異も含み得る。さらに他の実施形態では、本開示の多様性プールは、アルゴリズムが予測した機能または他の遺伝子アノテーションに基づく遺伝子への変異も含み得る。
一部の実施形態では、本開示は、仮説主導型変異の標的に優先順位をつけるための「シェル」ベースの手法を教示する。標的優先順位付けのシェルメタファーは、少数の主要遺伝子のみが宿主細胞の性能の特定の態様(例えば、単一生体分子の産生)のほとんどを担うという仮説に基づく。これらの主要遺伝子は、シェルのコアに位置しており、その後、第2の層における二次効果遺伝子、第3のシェルにおける三次効果などが続く。例えば、一実施形態では、シェルのコアは、選択された代謝経路内の極めて重要な生合成酵素(例えば、クエン酸の産生)をコードする遺伝子を含み得る。第2のシェルに位置した遺伝子は、産物転換またはフィードバックシグナル伝達を担う生合成経路内の他の酵素をコードする遺伝子を含み得る。この例示的なメタファー下の第3の段の遺伝子は、生合成経路の発現のモジュレーションまたは宿主細胞内の全般的な炭素フラックスの調節を担う調節遺伝子を含みやすい。
本開示は、あらゆる同定された変異からの性能獲得を最適化するための「ヒルクライム」法も教示する。一部の実施形態では、本開示は、HTP多様性ライブラリー内のランダム、天然の、または仮説主導型変異が、宿主細胞性能に関連した遺伝子の同定をもたらすことができることを教示する。例えば、本方法は、遺伝子コード配列に、またはその付近に位置した1つまたは複数の有益なSNPを同定することができる。この遺伝子は、宿主細胞性能に関連している場合があり、その同定は、生物体のコンビナトリアル遺伝子変異空間における性能「ヒル」の発見に類似し得る。
一部の実施形態では、本開示は、SNP変異において具現化された同定されたヒル周囲のコンビナトリアル空間を探索する方法を教示する。すなわち、一部の実施形態では、本開示は、その遺伝子ノード(すなわち、ヒルクライミング)から得られる性能獲得を最適化するための同定された遺伝子および関連した調節配列の撹乱を教示する。よって、本開示の方法によれば、遺伝子は、ランダム変異誘発から供給された多様性ライブラリー内で最初に同定することができるが、同じ遺伝子内の別の配列の指向変異によって株改良プログラムにおいて使用するために後に改善され得る。
ヒルクライミングの概念は、単一遺伝子配列を囲繞するコンビナトリアル空間の探索を超えて拡張することもできる。一部の実施形態では、特定の遺伝子内の変異は、宿主細胞性能に対する特定の代謝経路または遺伝経路の重要性を明らかにすることができる。例えば、一部の実施形態では、単一RNA分解遺伝子内の変異が有意な宿主性能獲得をもたらしたという発見を、宿主生物から追加の性能獲得を引き出すための手段として関連したRNA分解遺伝子を変異させるための基礎として使用することができる。当業者は、上記のバリアントが指向遺伝子設計へのシェルおよびヒルクライム手法を記述することを認識する。ハイスループットスクリーニング。
細胞培養および発酵
本開示の細胞は、任意の所望の生合成反応または選択に適切に改変された慣例的な栄養培地中で培養することができる。一部の実施形態では、本開示は、プロモーターを活性化するための誘導培地中での培養を教示する。一部の実施形態では、本開示は、形質転換体(例えば、抗生物質)の選択剤、または阻害条件(例えば、高エタノール条件)下で増殖させるのに適した生物体の選択を含めた選択剤を含む培地を教示する。一部の実施形態では、本開示は、細胞増殖のために最適化された培地中の増殖細胞培養を教示する。他の実施形態では、本開示は、産物収率のために最適化された培地中の増殖細胞培養を教示する。一部の実施形態では、本開示は、細胞増殖を誘導することができ、最終産物産生に必要な前駆体(例えば、エタノール産生のための高レベルの糖)も含有する培地中の増殖培養を教示する。
例えば、温度、pHなどの培養条件は、発現のために選択された宿主細胞とともに使用するのに適したものであり、当業者に明らかである。述べたように、多くの参考文献が、細菌、植物、動物(哺乳動物を含む)、および古細菌起源の細胞を含めた多くの細胞の培養および産生に利用可能である。例えば、Sambrook、Ausubel(すべて上記)、ならびにBerger、Guide to Molecular Cloning Techniques、Methods in Enzymology、15
2巻、Academic Press, Inc.、San Diego、CA;ならびにFreshney(1994年)、Culture of Animal Cells、a Manual of Basic Technique、3版、Wiley-Liss、New
York、およびそれに引用された参考文献;DoyleおよびGriffiths(1997年)、Mammalian Cell Culture:Essential Techniques、John Wiley and Sons、NY;Humason
(1979年)、Animal Tissue Techniques、4版、W.H. Freeman and Company;
ならびにRicciardelleら、(1989年)、In Vitro Cell Dev. Biol.、25巻:1016〜1024頁を参照。これらのすべては、参照により本明細書に組み込まれている。植物細胞培養および再生について、Payneら(1992年)、Plant Cell and Tissue Culture in Liquid Systems、John Wiley & Sons, Inc.、New York、N.Y.;GamborgおよびPhillips(編)(1995年)、Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual、Springer-Verlag(Berlin Heidelberg N.Y.);Jones編(1984年)、Plant Gene Transfer and Expression Protocols、Humana Press、Totowa、N.J.、ならびにPlant Molecular Biology(19
93年)、R. R. D. Croy編、Bios Scientific Publishers、Oxford、U.K. ISBN 0 12 198370 6。これらのすべては、参照により本明細書に組み込まれている。一般に細胞培養培地は、AtlasおよびParks(編)、The Handbook of Microbiological Media(1993年)、CRC Press、Boca Raton、Fla.に示されており、これは、参照により本明細書に組み込まれている。細胞培養の追加の情報は、Sigma-Aldrich, Inc(St Louis、Mo.)からのLife Science Research Cell Culture Catalogue(「Sigma-LSRCCC」)、および例えば、やはりSigma-Aldrich, Inc(St Louis、Mo.)からのThe Plant
Culture Catalogue and supplement(「Sigma-PCCS」)などの入手可能な市販の文
献に見出され、これらのすべては、参照により本明細書に組み込まれている。
使用される培養培地は、適当な様式で、それぞれの株の要求を満たさなければならない。様々な微生物の培養培地の記載は、American Society for Bacteriologyの「Manual
of Methods for General Bacteriology」(Washington D.C.、USA、1981年)に存在する。
本開示は、目的の産物を発酵調製するためのプロセスであって、a)適当な培地中で本開示による微生物を培養し、発酵ブロスをもたらすステップと;b)a)の発酵ブロス中、かつ/または微生物の細胞内で目的の産物を濃縮するステップとを含む、プロセスをさらに提供する。
一部の実施形態では、本開示は、生成される微生物を、所望の有機−化学化合物を産生させる目的で、例えば、WO05/021772に記載されているように連続的に、あるいはバッチプロセス(バッチ培養)またはフェドバッチもしくは繰り返しフェドバッチプロセスで不連続に培養することができることを教示する。公知の培養方法についての全般的な特質の概要は、Chmiel(Bioprozesstechnik. 1: Einfuehrung in die Bioverfahrenstechnik(Gustav Fischer Verlag、Stuttgart、1991年))による教科書、またはStorhas(Bioreaktoren and periphere Einrichtungen(Vieweg Verlag、Braunschweig/Wiesbaden、1994年))による教科書において入手可能である。
一部の実施形態では、本開示の細胞は、バッチまたは連続発酵条件下で増殖される。
古典的なバッチ発酵は、クローズドシステムであり、培地の組成は、発酵の開始時に設定され、発酵中に人為的な変更に供されない。バッチシステムの変形は、フェドバッチ発酵であり、これは、本開示においても使用を見出す。この変形では、基質は、発酵が進行するにつれて徐々に添加される。フェドバッチシステムは、異化産物抑制が細胞の代謝を阻害する可能性がある、および培地中の基質の量が限定されていることが望ましい場合、有用である。バッチ発酵およびフェドバッチ発酵は、一般的であり、当技術分野で周知である。
連続発酵は、目的の所望の生体分子産物を処理および回収するために、規定された発酵培地がバイオリアクターに連続的に添加され、等量の馴化培地が同時に除去されるシステムである。一部の実施形態では、連続発酵は一般に、一定の高密度で培養物を維持し、この場合、細胞は、主に、対数期増殖にある。一部の実施形態では、連続発酵は一般に、静止または後期対数/静止期増殖で培養物を維持する。連続発酵システムは、定常状態増殖条件を維持しようと努める。
連続発酵プロセスのための栄養分および成長因子をモジュレートするための方法、ならびに産物形成の速度を最大化するための技法は、工業微生物学の技術分野で周知である。
例えば、本開示の培養のための炭素源の限定されないリストとしては、糖および炭水化物、例えば、グルコース、スクロース、ラクトース、フルクトース、マルトース、糖蜜、サトウダイコンまたはサトウキビ加工からのスクロース含有溶液、デンプン、デンプン加水分解物、およびセルロースなど;油脂、例えば、ダイズ油、ヒマワリ油、落花生油、およびココナツ脂肪など;脂肪酸、例えば、パルミチン酸、ステアリン酸、およびリノール酸など;アルコール、例えば、グリセロール、メタノール、およびエタノールなど;ならびに有機酸、例えば、酢酸または乳酸などが挙げられる。
本開示の培養のための窒素源の限定されないリストとしては、有機窒素含有化合物、例えば、ペプトン、酵母エキス、肉エキス、麦芽エキス、トウモロコシ浸出液、ダイズ粉、および尿素;または無機化合物、例えば、硫酸アンモニウム、アンモニウムクロリド、リン酸アンモニウム、炭酸アンモニウム、および硝酸アンモニウムが挙げられる。窒素源は、個々に、または混合物として使用され得る。
本開示の培養のための可能なリン源の限定されないリストとしては、リン酸、リン酸二水素カリウムもしくはリン酸水素二カリウム、または対応するナトリウム含有塩が挙げられる。
培養培地は、例えば、金属、例えば、ナトリウム、カリウム、マグネシウム、カルシウム、および鉄などの塩化物または硫酸塩、例えば、硫酸マグネシウムまたは硫酸鉄などの形態で塩をさらに含み得、これらは、増殖に必要である。
最後に、アミノ酸などの必須の成長因子、例えば、ホモセリンおよびビタミン、例えば、チアミン、ビオチン、またはパントテン酸を、上述した物質に加えて使用することができる。
一部の実施形態では、培養物のpHは、これらに限定されないが、水酸化ナトリウム、水酸化カリウム、アンモニア、もしくはアンモニア水を含めた任意の酸もしくは塩基または緩衝塩;あるいは適当な様式でのリン酸または硫酸などの酸性化合物によって制御することができる。一部の実施形態では、pHは一般に、6.0〜8.5、好ましくは6.5〜8の値に調整される。
一部の実施形態では、本開示の培養物は、例えば、脂肪酸ポリグリコールエステルなどの消泡剤を含み得る。一部の実施形態では、本開示の培養物は、例えば、抗生物質などの適当な選択物質を添加することによって、培養物のプラスミドを安定化するように改変される。
一部の実施形態では、培養は、好気性条件下で実行される。これらの条件を維持するために、酸素または酸素含有気体混合物、例えば、空気などが、培養物に導入される。過酸化水素を富化させた液体を使用することが同様に可能である。発酵は、適切な場合、高圧で、例えば、0.03〜0.2MPaの高圧で実行される。培養物の温度は、通常20℃〜45℃、好ましくは25℃〜40℃、特に好ましくは30℃〜37℃である。バッチプロセスまたはフェドバッチプロセスでは、培養は、好ましくは、回収されるのに十分な目的の所望の産物(例えば、有機−化学化合物)の量が形成されるまで継続される。この目的は通常、10時間〜160時間以内に達成することができる。連続プロセスでは、より長い培養時間が可能である。微生物の活動により、発酵培地中で、かつ/または前記微生物の細胞内で目的の産物が濃縮(蓄積)される。
一部の実施形態では、培養は、嫌気性条件下で実行される。
スクリーニング
一部の実施形態では、本開示は、ハイスループット初期スクリーニングを教示する。他の実施形態では、本開示は、性能データのロバストなタンクベースの検証も教示する(図6Bを参照)。
一部の実施形態では、ハイスループットスクリーニングプロセスが、バイオリアクター内の株の性能を予測するのに設計される。先に記載した通り、培養条件は、生物体に適しており、バイオリアクター条件を反映しているように選択される。個々のコロニーが精選され、96ウェルプレート中に移され、適当な量の時間にわたってインキュベートされる。細胞は、追加のシード培養のために新しい96ウェルプレートに、または産生培養に引き続いて移される。培養物は、様々な長さの時間にわたってインキュベートされ、この場合、複数の測定を行うことができる。これらは、産物、バイオマス、またはバイオリアクター内の株の性能を予測する他の特性の測定を含み得る。ハイスループット培養結果は、バイオリアクター性能を予測するのに使用される。
一部の実施形態では、タンクベースの性能検証が使用されて、ハイスループットスクリーニングによって単離された株の性能が確認される。発酵プロセス/条件は、クライアントサイトから得られる。候補株は、生産性または収率などの関連した株性能特性について、ベンチスケール発酵反応器(例えば、本開示の表5に開示した反応器)を使用してスクリーニングされる。
産物回収および定量
目的の産物の産生についてスクリーニングするための方法は、当業者に公知であり、本明細書全体にわたって論じられている。このような方法は、本開示の株をスクリーニングするとき使用することができる。
一部の実施形態では、本開示は、非分泌型細胞内産物を産生するように設計された株を改善する方法を教示する。例えば、本開示は、細胞内酵素、油、医薬品、または他の貴重な低分子もしくはペプチドを産生する細胞培養物のロバスト性、収率、効率、または全体的な望ましさを改善する方法を教示する。非分泌型細胞内産物の回収または単離は、本明細書に記載のものを含めて当技術分野で周知である溶解技法および回収技法によって達成することができる。
例えば、一部の実施形態では、本開示の細胞は、遠心分離、濾過、沈殿、または他の方法によって回収することができる。次いで回収された細胞は、当業者に周知である凍結融解サイクリング、超音波処理、機械的破壊、もしくは細胞溶解剤の使用、または他の方法を含めた任意の好都合な方法によって破壊される。
結果として生じる目的の産物、例えば、ポリペプチドは、当技術分野で公知のいくつかの方法のいずれかによって回収/単離および任意選択で精製することができる。例えば、産物ポリペプチドは、これらに限定されないが、遠心分離、濾過、抽出、噴霧乾燥、蒸発、クロマトグラフィー(例えば、イオン交換、親和性、疎水性相互作用、クロマトフォーカシング、およびサイズ排除)、または沈降を含めた慣例的な手順によって栄養培地から単離することができる。最後に、高速液体クロマトグラフィー(HPLC)を、最終精製ステップで使用することができる。(例えば、ともに参照により本明細書に組み込まれている、Parryら、2001年、Biochem. J.、353巻:117頁、およびHongら、20
07年、Appl. Microbiol. Biotechnol.、73巻:1331頁に記載の細胞内タンパ
ク質の精製を参照)。
上述した参考文献に加えて、様々な精製方法は、例えば、Sandana(1997年)、Bioseparation of Proteins、Academic Press, Inc.;Bollagら(1996年)、Protein Methods、2版、Wiley-Liss、NY;Walker(1996年)、The Protein Protocols
Handbook、Humana Press、NJ;HarrisおよびAngal(1990年)、Protein Purification Applications: A Practical Approach、IRL Press at Oxford、Oxford、England;HarrisおよびAngal Protein Purification Methods:A Practical Approach
、IRL Press at Oxford、Oxford、England;Scopes(1993年)、Protein Purification: Principles and Practice、3版、Springer Verlag、NY;JansonおよびRyden(1998年)、Protein Purification: Principles, High Resolution Methods
and Applications、2版、Wiley-VCH、NY;ならびにWalker(1998年)、Protein
Protocols on CD-ROM、Humana Press、NJに示されたものを含めて、当技術分野で周知である。これらの文献のすべては、参照により本明細書に組み込まれている。
一部の実施形態では、本開示は、分泌産物を産生させるように設計された株を改良する方法を教示する。例えば、本開示は、貴重な低分子またはペプチドを産生する細胞培養物のロバスト性、収率、効率、または全体的な望ましさを改善する方法を教示する。
一部の実施形態では、免疫学的方法は、本開示の細胞によって産生される分泌型または非分泌型産物を検出および/または精製するのに使用することができる。一例示的手法では、従来の方法を使用して産物分子に対して(例えば、インスリンポリペプチドまたはその免疫原性断片に対して)産生される抗体は、ビーズ上に固定化され、エンドグルカナーゼが結合している条件下で細胞培養培地と混合され、沈降される。一部の実施形態では、本開示は、酵素結合免疫吸着測定法(ELISA)の使用を教示する。
他の関連した実施形態では、米国特許第5,591,645号、米国特許第4,855,240号、米国特許第4,435,504号、米国特許第4,980,298号、およびSe-Hwan Paekら、「Development of rapid One-Step Immunochromatographic assay, Methods」、22巻、53〜60頁、2000年)に開示された免疫クロマトグラ
フィーが使用される。これらの文献のそれぞれは、本明細書に参照により組み込まれている。一般的な免疫クロマトグラフィーは、2つの抗体を使用することによって検体を検出する。第1の抗体は、試験溶液中に、または試験溶液が滴下される、多孔質膜から作製されたおよそ矩形状をした試験片の末端の部分に存在する。この抗体は、ラテックス粒子または金コロイド粒子で標識される(この抗体は、以下で標識抗体と呼ばれる)。滴下された試験溶液が検出されるべき検体を含むとき、標識抗体は、検体を認識して検体と結合する。検体と標識抗体との複合体は、アブソーバーに向けて毛管現象によって流れ、このアブソーバーは、濾紙から作製され、標識抗体を含んだ末端と反対の末端に結合している。流れている間に、検体と標識抗体との複合体は、多孔質膜の中間に存在している第2の抗体(これは、以下でタッピング抗体(tapping antibody)と呼ばれる)によって認識お
よび捕捉され、この結果として、複合体は、可視シグナルとして多孔質膜上の検出部分に現れ、検出される。
一部の実施形態では、本開示のスクリーニング方法は、測光検出技法(吸収、蛍光)に基づく。例えば、一部の実施形態では、検出は、抗体に結合したGFPなどのフルオロフォア検出剤の存在に基づき得る。他の実施形態では、測光検出は、細胞培養からの所望の産物の蓄積に基づき得る。一部の実施形態では、産物は、培養物または前記培養物からの抽出物のUVを介して検出可能であり得る。
当業者は、本開示の方法が、目的の任意の望ましい生体分子産物を産生する宿主細胞に適合することを認識する。以下の表2は、本開示の範囲内に含まれる産物カテゴリー、生体分子、および宿主細胞の限定されないリストを提示する。これらの例は、例示的な目的で提供されており、決して本開示の技術の適用性を限定するように意味していない。
選択判定基準および目標
本開示の方法に適用される選択判定基準は、株改良プログラムの具体的な目標によって変動する。本開示は、任意のプログラム目標を満たすように適応させることができる。例えば、一部の実施形態では、プログラム目標は、差し迫った期限を伴わずに反応の単一バッチ収率を最大化することであり得る。他の実施形態では、プログラム目標は、生合成収率をリバランスして、特異的な産物を産生させ、または特定の比の産物を産生させることであり得る。他の実施形態では、プログラム目標は、産物の化学構造を改変すること、例えば、ポリマーの炭素鎖を長くすることであり得る。一部の実施形態では、プログラム目標は、性能特性、例えば、収率、力価、生産性、副生成物排除、プロセスエクスカーションに対する寛容性、最適な増殖温度、および増殖速度を改善することであり得る。一部の実施形態では、プログラム目標は、微生物によって産生される目的の産物の体積生産性、比生産性、収率、または力価によって測定した宿主性能の改善である。
他の実施形態では、プログラム目標は、入力量当たりの最終産物収率(例えば、スクロース1ポンド当たりに産生されるエタノールの合計量)の観点から市販の株の合成効率を最適化することであり得る。他の実施形態では、プログラム目標は、例えば、バッチ完了率、または連続培養システムにおける歩留まり率の観点から測定した、合成速度を最適化することであり得る。他の実施形態では、プログラム目標は、特定のファージに対する株の耐性を増大させること、またはさもなければ培養条件下で株の活力/ロバスト性を増大させることであり得る。
一部の実施形態では、株改良プロジェクトは、1つを超える目標を対象とする場合がある。一部の実施形態では、株プロジェクトの目標は、品質、信頼性、または全体的な収益性次第であり得る。一部の実施形態では、本開示は、上述した株性質の1つまたは複数を有する関連した選択された変異または変異の群の方法を教示する。
当業者は、特定のプロジェクト目標を満たすように株選択判定基準をどのように合わせるかを認識する。例えば、反応が飽和しているときの株の単一バッチ最大収量の選択は、単一バッチ収量が高い株を同定するのに適切であり得る。一連の温度および条件にわたる収率の一貫性に基づく選択は、ロバスト性および信頼性が増大した株を同定するのに適切であり得る。
一部の実施形態では、初期のハイスループットフェーズおよびタンクベースの検証の選択判定基準は、同一となる。他の実施形態では、タンクベースの選択は、追加のおよび/または異なる選択判定基準下で働き得る。例えば、一部の実施形態では、ハイスループット株選択は、単一バッチ反応完了収率に基づき得る一方、タンクベースの選択は、反応速度に対する収率に基づく選択を含むように拡張することができる。
シーケンシング
一部の実施形態では、本開示は、本明細書に記載の生物体の全ゲノムシーケンシングを教示する。他の実施形態では、本開示は、本開示の方法の品質対照としてのプラスミド、PCR産物、および他のオリゴのシーケンシングも教示する。大および小プロジェクトのためのシーケンシング法は、当業者に周知である。
一部の実施形態では、核酸をシーケンシングするための任意のハイスループット技法を、本開示の方法において使用することができる。一部の実施形態では、本開示は、全ゲノムシーケンシングを教示する。他の実施形態では、本開示は、遺伝的バリエーションを同定するためのアンプリコンシーケンシング、ウルトラディープシーケンシングを教示する。一部の実施形態では、本開示は、タグメンテーションを含めたライブラリー調製の新規方法も教示する(WO/2016/073690を参照)。DNAシーケンシング技法としては、標識ターミネーターまたはプライマー、およびスラブまたはキャピラリーにおけるゲル分離を使用する古典的ジデオキシシーケンシング反応(サンガー法);可逆的に終止される標識ヌクレオチドを使用する合成によるシーケンシング、ピロシーケンシング;454シーケンシング;標識オリゴヌクレオチドプローブのライブラリーへの対立遺伝子特異的ハイブリダイゼーション;ライゲーションが後に続く標識クローンのライブラリーへの対立遺伝子特異的ハイブリダイゼーションを使用する合成によるシーケンシング;重合ステップ中の標識ヌクレオチドの組み入れのリアルタイムモニタリング;ポロニーシーケンシング;およびSOLiDシーケンシングが挙げられる。
本開示の一態様では、固体表面上の個々の分子を空間的に単離するステップであって、個々の分子が並行してシーケンシングされる、ステップを含むシーケンシングのハイスループット方法が使用される。このような固体表面として、非多孔性表面(Solexaシーケンシング、例えば、Bentleyら、Nature、456巻:53〜59頁(2008年)ま
たはComplete Genomicsシーケンシング、例えば、Drmanacら、Science、327巻:78〜81頁(2010年)などにおける)、ビーズ結合鋳型または粒子結合鋳型を含み得るウェルのアレイ(454、例えば、Marguliesら、Nature、437巻:
376〜380頁(2005年)、またはイオントレントシーケンシング、米国特許公開2010/0137143号もしくは同第2010/0304982号を用いてなど)、微細加工膜(SMRTシーケンシング、例えば、Eidら、Science、323巻:133〜138頁(2009年)を用いてなど)、またはビーズアレイ(SOLiDシーケンシングまたはポロニーシーケンシング、例えば、Kimら、Science、316巻:1481〜1414頁(2007年)を用いるような)を挙げることができる。
別の実施形態では、本開示の方法は、単離分子が固体表面上で空間的に単離される前または後のいずれかに単離分子を増幅するステップを含む。事前の増幅は、エマルジョンPCRなどのエマルジョンに基づく増幅、またはローリングサークル増幅を含み得る。Solexaに基づくシーケンシングも教示されており、この場合、Bentleyら(上記に引用
した)に、かつ製造者の指示(例えば、TruSeq(商標)試料調製キットおよびデータシート、Illumina,Inc.、San Diego、Calif.、2010年)に;かつさらに、参照により組み込まれている以下の参考文献:米国特許第6,090,592号;同第6,300,070号;同第7,115,400号;およびEP0972081B1に記載されている通り、個々の鋳型分子が固体表面上で空間的に単離され、その後これらがブリッジPCRによって並行して増幅されて別個のクローン集団またはクラスターを形成し、次いでシーケンシングされる。
一実施形態では、固体表面上で配置および増幅された個々の分子は、1cm当たり少なくとも10クラスターの密度で;または1cm当たり少なくとも5×10の密度で;または1cm当たり少なくとも10クラスターの密度でクラスターを形成する。一実施形態では、相対的に高い誤り率を有するシーケンシング化学反応が使用される。このような実施形態では、このような化学反応によって生じる平均品質スコアは、配列リード長の単調低下関数である。一実施形態では、このような低下は、配列リードの0.5パーセントが1〜75位に少なくとも1つの誤差を有し;配列リードの1パーセントが76〜100位に少なくとも1つの誤差を有し;配列リードの2パーセントが101〜125位に少なくとも1つの誤差を有することに対応する。
ゲノムワイド遺伝子設計判定基準の効果のコンピューター分析および予測
一部の実施形態では、本開示は、所与の宿主株内に組み入れている特定の遺伝子変更の効果を予測する方法を教示する。さらなる態様では、本開示は、所与の宿主株内に、前記宿主が特定の表現型形質または株パラメータを有するために組み入れるべきである提案された遺伝子変更を生成するための方法を提供する。所与の態様では、本開示は、新規宿主株を設計するのに利用することができる予測モデルを提供する。
一部の実施形態では、本開示は、各ラウンドのスクリーニングの性能結果を分析する方法、およびその後のラウンドのスクリーニングで株性能を増強すると予測される新しく提案されたゲノムワイド配列修飾をおこすための方法を教示する。
一部の実施形態では、本開示は、システムが、先のスクリーニング結果に基づいて宿主株に提案された配列修飾をおこすことを教示する。一部の実施形態では、本システムの推奨は、直前のスクリーニングからの結果に基づく。他の実施形態では、本システムの推奨は、先行するスクリーニングのうちの1つまたは複数の累積的結果に基づく。
一部の実施形態では、本システムの推奨は、先に開発されたHTP遺伝子設計ライブラリーに基づく。例えば、一部の実施形態では、本システムは、同じまたは異なる宿主生物において、先のスクリーニングからの結果を保存し、異なるプロジェクトにこれらの結果を適用するように設計される。
他の実施形態では、本システムの推奨は、科学的洞察に基づく。例えば、一部の実施形態では、推奨は、遺伝子の公知の性質(アノテートされた遺伝子データベースおよび関連した文献などの源からの)、コドン最適化,転写スリップ、uORF、または他の仮説主導型配列、および宿主最適化に基づく。
一部の実施形態では、システムまたは予測モデルが推奨した宿主株への提案された配列修飾は、(1)プロモータースワップ、(2)SNPスワップ、(3)開始/停止コドン交換、(4)配列最適化、(5)Stopスワップ、および(5)上位性マッピングを含む開示した分子ツールセットの1つまたは複数の利用によって実行される。
本明細書に記載のHTP遺伝子操作プラットフォームは、任意の特定の微生物または表現型形質(例えば、特定の化合物の産生)に関してとらわれない。すなわち、本明細書に教示のプラットフォームおよび方法は、任意の宿主細胞とともに利用して、任意の所望の表現型形質を有するように前記宿主細胞を操作することができる。さらに、1つの新規宿主細胞を生み出すのに使用される所与のHTP遺伝子操作プロセスから学習した教訓を、教示された方法の間に行われる無数のプロセスパラメータの記憶、特徴付け、および分析の結果として、任意の数の他の宿主細胞に適用することができる。
上位性マッピングセクションにおいて言及したように、HTP遺伝子設計ライブラリーからの変異のコレクションをある好適な予測モデルを介して特定のバックグラウンド内に統合することによって得られる仮定の株の性能(別名スコア)を推定することが可能である。このような予測モデルを考慮すると、コンビナトリアル統合を介して変異ラブラリーにアクセス可能なすべての仮定の株をスコア付けおよびランク付けすることが可能である。以下のセクションは、本HTPプラットフォームにおいて利用される特定のモデルを概説する。
予測的株設計
遺伝子変化および株性能を記述し、株内の変化の組成に基づいて株性能を予測し、高い予測された性能を有する候補設計を推奨し、予測を選別して二次の考慮事項、例えば、既存の株に対する類似度、上位性、または予測における信頼度を最適化する方法を含む、予測的株設計の手法が本明細書に記載されている。
株設計モデルへの入力
一実施形態では、例示を容易にする目的で、入力データは、2つのコンポーネント:(1)遺伝子変化のセットおよび(2)相対的株性能を含み得る。当業者は、このモデルは、オーバーフィッティングの対抗する考慮事項に留意しながら、容易に拡張して多種多様な入力を考慮することができることを認識する。遺伝子変化に加えて、調整され得る入力パラメータ(独立変数)の一部は、細胞型(属、種、株、系統発生的特徴付けなど)、および発酵が細胞を用いて行われている下でのプロセスパラメータ(例えば、環境条件、装置のハンドリング、修飾技法など)である。
遺伝子変化のセットは、HTP遺伝子設計ライブラリーと呼ばれる遺伝子撹乱の先に論じたコレクションに由来し得る。相対的株性能は、任意の所与のパラメータまたは目的の表現型形質(例えば、目的の化合物、低分子、または産物の産生)に基づいて評価することができる。
細胞型は、一般的なカテゴリー、例えば、原核生物システムおよび真核生物システム、属、種、株、組織培養物(分散細胞に対して)などにおいて指定され得る。調整され得るプロセスパラメータは、温度、圧力、反応器構成、および培地組成が挙げられる。反応器構成の例には、プロセスがバッチであっても連続であっても、反応器の体積、および連続である場合、体積流量などが含まれる。もしあれば、細胞が存在する、支持構造体を指定することもできる。培地組成の例としては、電解質の濃度、栄養分、老廃物、酸、pHなどが挙げられる。
予測的株設計モデルを生み出すのに次に使用される最初の線形回帰モデルにおいて利用される選択されたHTP遺伝子設計ライブラリーからの遺伝子変化のセット
遺伝子変化の表からのエントリーの一例示的セットを以下の表3に示す。各行は、株7000051473における遺伝子変化、および変化の機構についてのメタデータ、例えば、プロモータースワップまたはSNPスワップを示す。aceE、zwf、およびpycは、すべて、クエン酸サイクルに関連する。
この場合、株7000051473は、合計7つの変化を有する。「最後の変化」は、この株内の変化がこの株系統における最近の修飾を表すことを意味する。よって、この株の性能をその親の性能と比較することは、「最後の変化」の変異の性能に関するデータ点を表す。
構築された株(built strain)性能評価
教示したモデルの目標は、株に導入される遺伝子変化の組成に基づいて株性能を予測することである。比較のための標準を構築するために、株性能をアッセイプレート1つ当たり、株1つ当たりの性能の中央値を最初に算出することによって一般的な参照株と比べて算出する。次いで、相対的性能を、同じプレート内の操作された株と一般的な参照株との間の平均性能の差異として計算する。プレート内の比較に算出を制限することにより、検討中の試料がすべて同じ実験条件を受けたことを保証する。
図23は、検討中の入力データについての相対的株性能の分布を示す。ゼロの相対的性能は、操作された株がプレート内基準または「参照」株と同等によく働いたことを示す。ゼロを有意に上回って働きやすい株を同定する予測モデルの能力が目的のものである。さらに、かつより一般的に、いくつかの判定基準によって任意の所与の株がその親より性能が優れているかどうかが、目的のものである。実際には、判定基準は、親レベルを超えるある閾値を満たす、または超える産物力価であり得るが、所望の方向で親からの統計的に有意な差異を有することも、代替としてまたは追加的に使用することができる。基準株または「参照」株の役割は、プレート内またはプレート間で比較を行うための付加された正規化因子として単に機能を果たすことである。
留意すべき概念は、親株と参照株との間の差異のものである。親株は、現在のラウンドの変異誘発について使用したバックグラウンドである。参照株は、特にプレート間で比較を促進するためにあらゆるプレートで実行される対照株であり、典型的には、上記に言及した「基準株」である。しかし、基準株(例えば、全体的な性能をベンチマークするのに使用される野生型株または工業用株)は、所与のラウンドの株改良において変異誘発標的であるという意味において必ずしも「基準」である必要はないので、より記述的な用語は、「参照株」である。
要約すると、基準/参照株は、一般に、構築された株の性能をベンチマークするのに使用され、一方、親株は、関連した遺伝的バックグラウンドにおける特異的な遺伝子変化の性能をベンチマークするのに使用される。
線形回帰を用いた構築された株の性能のランク付け
開示したモデルの目標は、構築された株内に導入される遺伝子変化の組成の関数として相対的株性能を記述することによって構築された株の性能をランク付けることである。本開示全体にわたって論じられるように、様々なHTP遺伝子設計ライブラリーは、操作された株内に導入される可能な遺伝子変化(例えば、遺伝子撹乱/変更)のレパートリーを提供する。線形回帰は、現在記載されている例示的な予測モデルの基礎である。
以下の表は、回帰に基づくモデル化のための例示的な入力を含有する。株性能は、株内に含有される遺伝子変化の組成の関数として、一般的な基準株と比べてランク付けされる。
各列の見出しは、遺伝子変化を表し、「1」は、変化の存在を表し、「0」は、変化の非存在を表す。「DSS」は、特定のライブラリー(相対的性能(relative _perf)後
の最初の3列)からのSNPスワップを指す。最後の3列は、プロモータースワップであり、この場合、pcgXXXXは、特定のプロモーターを表し、最後の3文字は、プロモーターが適用されている遺伝子を表す。遺伝子は、中央代謝に関連している。プロモーターは、Corynebacterium glutamicum由来である(したがって「cg」表示)。利用されるプロモーターについてのさらなる情報は、プロモーターP1〜P8を列挙する表1、および本願の配列表に見出すことができる。さらに、各プロモーターP1〜P8についての詳細な情報は、2015年12月7日に出願され、「Promoters from Corynebacterium glutamicum」という表題の米国仮出願第62/264,232号に見出すことができ、これは、参照により本明細書に組み込まれている。参照の容易さのために、以下の表において、pcg3121=P8;pcg0755=P4;およびpcg1860=P3である。
構築された株を特徴付けるための線形回帰
線形回帰は、インプリメンテーションおよび解釈の容易さのために、記載されたHTPゲノム操作プラットフォームにとって魅力的な方法である。結果として生じる回帰係数は、各遺伝子変化の存在に帰することができる相対的株性能の平均の増大または低下として解釈することができる。
例えば、図24で分かるように、本技法は、本発明者らに、pgiプロモーターをpcg3121に変化させると、任意の負の上位性相互作用の非存在下で、相対的株性能が平均でおよそ5ユニット改善され、よって潜在的に高度に望ましい変化であると結論付けることを可能にする(注意:入力は、無単位正規化値である)。
したがって、教示した方法は、様々な教示したライブラリーからの自己のゲノム内に導入された様々な遺伝子撹乱を有する構築された株を記述し/特徴付け、ランク付けるための線形回帰モデルを使用する。
予測的設計モデル化
構築した株からのデータを利用した上述した線形回帰モデルは、まだ構築されていない株についての性能予測を行うのに使用することができる。
手順は、以下の通り要約することができる:遺伝子変化のすべての可能な構成をin silicoで生成する、それに続き、回帰モデルを使用して相対的株性能を予測する、それに続き、性能による候補株設計を注文する。よって、未だ構築されていない株の性能を予測するための回帰モデルを利用することによって、本方法は、より少ない実験を同時に行いながらより高い性能の株の産生を可能にする。
構成の生成
まだ構築されていない株の性能を予測するモデルを構築するとき、第1のステップは、設計候補の配列を生成することである。これは、株内の遺伝子変化の総数を固定し、次いで遺伝子変化のすべての可能な組合せを明確にすることによって行われる。例えば、潜在的な遺伝子変化/撹乱の総数を29(例えば、29の可能なSNP、もしくは29の異なるプロモーター、または遺伝子撹乱のユニバースが29である限り、これらの任意の組合せ)に設定し、次いで29の潜在的な遺伝子変化のすべての可能な3メンバー組合せを設計する決定を下すことができ、3,654の候補株設計がもたらされる。
上述の3,654候補株にコンテクストを提供するために、n!/((n−r)!r!)を使用してnの可能なメンバーからサイズrの非重複グループの数を算出することができることを考慮されたい。r=3である場合、n=29は、3,654を与える。よって、29の潜在的な変化のすべての可能な3メンバー組合せを設計する場合、結果は、3,654候補株である。29の潜在的な遺伝子変化は、図25のx軸に存在する。
新しい株設計の性能の予測
入力としてコンビナトリアル構成を用いて上で構築した線形回帰を使用して、次いで、各候補設計の予期される相対的性能を予測することができる。図25は、上位100の予測された株設計についての変化の組成を要約する。x軸は、潜在的な遺伝子変化(29の可能な遺伝子変化)のプールを列挙し、y軸は、ランク順序を示す。黒色セルは、候補設計における特定の変化の存在を示し、一方、白色セルは、その変化の非存在を示す。この特定の例では、上位100設計のすべては、変化pcg3121_pgi、pcg1860_pyc、dss_339、およびpcg0007_39_lysaを含有する。さらに、最上位候補設計は、変化dss_034、dss_009を含有する。
予測精度は、新しい知見がモデルを反復して保持および再フィットするにつれて経時的に増大するはずである。本発明者らによるスタディからの結果は、予測モデルを反復して保持および改善することができる方法を例示する。図47は、モデル予測を観測された測定値と比較するものである。モデル予測の品質は、予測値と観測値との間の関連性の強度を示す相関係数、または平均モデル誤差の尺度である二乗平均平方根誤差を含めたいくつかの方法によって評価することができる。モデル評価のための選択された測定基準を使用して、システムは、モデルが保持されるべきときの規則を定義することができる。
上記モデルに対して2つの述べられていない仮定は、(1)上位性相互作用が存在しないこと、および(2)予測モデルを構築する(例えば、図24に例示された構築された株のデータ、またはモデルを構築するための参照として使用されるあらゆるデータセットから)利用される遺伝子変化/撹乱はすべて、遺伝子変化の提案された組合せとして、同じバックグラウンドにおいて作製されたこと(例えば、図25に例示された)を含む。
二次フィーチャのフィルタリング
上記実例は、予測された宿主細胞性能に基づく線形回帰予測に着目した。一部の実施形態では、本線形回帰方法は、非生体分子因子、例えば、飽和バイオマス、耐性、または他の測定可能な宿主細胞フィーチャに適用することもできる。よって、本開示の方法は、構築するための候補に優先順位を付けるとき、予測された性能以外の他のフィーチャを考慮することも教示する。追加の関連したデータが存在すると仮定して、非線形項も、回帰モデルに含められる。
既存の株との密接な関係
すでに構築されたものと同様である予測された株は、最上位の予測された候補でないにもかかわらず、時間およびコスト削減をもたらすことができる。
変化の多様性
上述のモデルを構築するとき、遺伝子変化は、上位性相互作用の存在に起因して真に相加的となる(線形回帰によって仮定し、上記仮定として述べた通り)と確認することができない。したがって、遺伝子変化相違点の知識は、正の相加性の見込みを増大させるのに使用することができる。例えば、上記の最上位にランク付けされた株由来の変化dss_034およびdss_009(これらはSNPスワップである)が同じ代謝経路上にあり、同様の性能特性を有すると分かると、その情報を使用して、変化の同じでない組成を有する別の最上位ランクの株を選択することができる。上位性マッピングに関して上記セクションに記載した通り、予測された最良の遺伝子変化を選別して十分に同じでない応答プロファイルを有する変異に選択を制限することができる。代替として、線形回帰は、予測に重み付けするために類似度行列を使用する重み付き最小二乗回帰であり得る。
予測された性能の多様性
最後に、予測モデルを検証し、引き続いて改善するために、中程度のまたは不満足な予測された性能を有する株を設計するように選択することができる。
反復株設計最適化
上記例について記載したように、上位100の株設計のすべては、変化pcg3121_pgi、pcg1860_pyc、dss_339、およびpcg0007_39_lysaを含有する。さらに、最上位の候補株設計は、変化dss_034、dss_009を含有する。
諸実施形態では、発注エンジン208は、最上位の候補変異を組み入れている微生物株を製造するために工場注文(factory order)をファクトリー210に出す。フィードバック−ループ様式では、結果を分析装置214によって分析して、どの微生物が所望の表現型性質を呈するかを決定することができる(314)。分析フェーズ中に、修飾された株培養物が評価されて、これらの性能、すなわち、工業規模で産生される能力を含めて、これらの所望の表現型性質の発現が決定される。例えば、分析フェーズでは、とりわけ、プレートの画像データが使用されて、コロニー健康の指標として微生物コロニー増殖が測定される。分析装置214が使用されて、遺伝子変化が表現型性能と相関付けられ、結果として生じる遺伝子型−表現型相関データをライブラリー内に保存して(それは、ライブラリー206内に記憶され得る)、将来の微生物産生を知らせる。
特に、十分に高い測定された性能を実際にはもたらす候補変化を、上記表4などの表にデータベース中の行として加えることができる。このようにして、最良に働く変異が、教師付き機械学習様式で予測的株設計モデルに加えられる。
LIMSは、先のファクトリーランから発生した相関に基づいて、設計/構築/試験/分析サイクルを反復する。後続のサイクル中に、分析装置214は、単独で、または人のオペレーターと併せて、相関データを使用して遺伝子改変を微調整することによってより微細な粒度を有するより良好な表現型性能を達成して、入力インターフェース202に入力して戻すための基準株としての最良候補を選択することができる。このようにして、本開示の実施形態の実験室情報管理システム(laboratory information management system)は、品質改善フィードバックループをインプリメントする。
つまり、図33のフロー図を参照して、反復予測的株設計ワークフローを以下の通り記述することができる。
・入出力変数、例えば、入力として遺伝子変化および出力として性能フィーチャの訓練セットを生成する(3302)。生成は、先の遺伝子変化およびこれらの遺伝子変化を組み入れている微生物株の対応する測定された性能に基づいて分析装置214によって実施することができる。
・訓練セットに基づいて初期モデル(例えば、線形回帰モデル)を開発する(3304)。これは、分析装置214によって実施することができる。
・設計候補株を生成する(3306)
○一実施形態では、分析装置214は、変化の組合せの形態でバックグラウンド株に行われる遺伝子変化の数を固定することができる。これらの変化を表すために、分析装置214は、インタープリター204に、変化のこれらの組合せを表す1つまたは複数のDNAの仕様を提供することができる。(これらの遺伝子変化またはこれらの変化を組み入れる微生物株は、「試験入力」と呼ばれる場合がある)。インタープリター204は、1つまたは複数のDNAの仕様を解釈し、エグゼキューションエンジン207は、DNAの仕様を実行してこれらの変化について個々の候補設計株を表す分解された出力を有するDNAの仕様をポピュレートする。
・モデルに基づいて、分析装置214は、各候補設計株の予期される性能を予測する(3308)。
・分析装置214は、最高の予測された性能を有する限られた数の候補設計、例えば100を選択する(3310)。
○上位性マッピングに関して本明細書の他の場所で記載したように、分析装置214は、例えば、上位性効果について上位の設計を選別し、または予測モデル内に、上位性を計算に入れることによって上位性などの二次効果について説明することができる。
・発注エンジン208によって作成された工場注文に基づいて選別された候補株を構築する(ファクトリー210で)(3312)。
・分析装置214は、選択された株の実際の性能を測定し、これらの優れた実際の性能に基づいて限られた数のこれらの選択された株を選択し(3314)、設計変化およびこれらの結果として生じる性能を予測モデルに加える(3316)。線形回帰の例において、設計変化およびこれらの関連した性能のセットを表4中の新しい行として加える。
・次いで分析装置214は、新しい設計候補株の生成に戻って反復し(3306)、停止条件が満たされるまで反復し続ける。停止条件は、例えば、性能測定基準、例えば、収率、増殖速度、または力価を満たす少なくとも1つの微生物株の測定された性能を含み得る。
上記例では、株設計の反復最適化は、フィードバックおよび線形回帰を使用して機械学習をインプリメントする。一般に、機械学習は、限られた数の標識データの例を使用し、次いで未知のデータに対して同じタスクを実施して、情報タスク(分類または回帰など)の性能における性能判定基準、例えば、パラメータ、技法、または他のフィーチャの最適化として記述することができる。上記線形回帰の例のものなどの教師付き機械学習では、機械(例えば、演算デバイス)は、例えば、訓練データが呈するパターン、カテゴリー、統計的関係、または他の属性を同定することによって学習する。次いで学習の結果が使用されて、新しいデータが、同じパターン、カテゴリー、統計的関係、または他の属性を呈するかどうかが予測される。
本開示の実施形態は、訓練データが入手可能であるとき、他の教師付き機械学習技法を使用することができる。訓練データの非存在下で、諸実施形態では、教師なし機械学習が使用される場合がある。代替として、諸実施形態では、少量の標識データおよび大量の未標識データを使用して、半教師付き機械学習が使用され得る。諸実施形態では、フィーチャ選択が使用されて最も関連したフィーチャのサブセットが選択されることによって機械学習モデルの性能が最適化される場合もある。選択される機械学習手法のタイプに応じて、線形回帰の代替として、またはそれに加えて、諸実施形態では、例えば、ロジスティック回帰、ニューラルネットワーク、サポートベクターマシン(SVM)、デシジョンツリー、隠れマルコフモデル、ベイジアンネットワーク、グラムシュミット、強化ベースの学習、階層的クラスタリングを含めたクラスターに基づく学習、遺伝的アルゴリズム、および当技術分野で公知の任意の他の適当な学習機械が使用され得る。特に、諸実施形態では、ロジスティック回帰が使用されて分類自体とともに分類(例えば、異なる機能群への遺伝子の分類)の確率が提供され得る。例えば、Shevade、A simple and efficient algorithm for gene selection using sparse logistic regression、Bioinformatics、19巻、17号、2003年、2246〜2253頁、Lengら、Classification using functional data analysis for temporal gene expression data、Bioinformatics、22巻、1号、Oxford University Press(2006年)、68〜76頁を参
照。これらのすべては、その全体が参照により本明細書に組み込まれている。
諸実施形態では、グラフィックスプロセシングユニット(GPU)加速アーキテクチャが使用される場合があり、これは、特に、ディープニューラルネットワーク(DNN)として公知の形態で、機械学習タスクの実施において評判が増大していることが見出されている。本開示の実施形態では、GPUに基づく機械学習、例えば、GPU-Based Deep Learning Inference: A Performance and Power Analysis、NVidia Whitepaper、2
015年11月、Dahlら、Multi-task Neural Networks for QSAR Predictions、コンピューターサイエンス学科、トロント大学、2014年6月(arXiv:1406.1231 [stat.ML])に記載されているものが使用され得る。これらの文献のすべては、本明細書にその全体が参照により組み込まれている。本開示の実施形態に適用可能な機械学習技法は、他の参考文献の中でも、Libbrechtら、Machine learning applications in genetics and genomics、Nature Reviews: Genetics、16巻、2015年6月、Kashyapら、Big Data Analytics in Bioinformatics: A Machine Learning Perspective、Journal of Latex Class Files、13巻、9号、2014年9月、Prompramoteら、Machine Learning in Bioinformatics、Bioinformatics Technologiesの第5章、117〜153頁、Springer Berlin Heidelberg、2005年にも見出すことができ、これらのすべては、本明細書にその全体が参照により組み込まれている。
反復予測的株設計:例
以下は、上記に概説した反復予測的株設計ワークフローの例示的用途を提供するものである。
訓練入力変数および出力変数の初期セットを調製した。このセットは、確定した遺伝子組成を有する1864のユニークな操作された株を含んでいた。各株は、5から15の間の操作された変化を含有していた。合計336のユニークな遺伝子変化が該訓練に存在した。
初期の予測コンピューターモデルを開発した。インプリメンテーションは、一般化線形モデル(4次多項式カーネルを用いたカーネルリッジ回帰)を使用した。インプリメンテーションは、2つの個別の表現型(収率および生産性)をモデル化する。これらの表現型を、以下に示す通り、加重和として組み合わせてランク付けのための単一スコアを得た。様々なモデルパラメータ、例えば、正則化係数を、指定された訓練データに対してk倍交差検証を介してチューニングした。
インプリメンテーションは、上記上位性マッピングセクションに記載した相互作用効果のいずれの明確な分析も組み入れない。しかし、当業者が理解するはずであるように、インプリメントされる一般化線形モデルは、カーネルの2、3、および4次項を通じて暗黙的に相互作用効果を捕捉することができる。
モデルを訓練セットに対して訓練した。フィットされたモデルは、収率に関して0.52のR値(決定の係数)および生産性に関して0.67のR値を有する。図47は、収率モデルの訓練データへの有意な品質フィッティングを実証する。
候補株を生成した。本例は、親株への新しい遺伝子変化の導入に関連した連続構築制約(serial build constraint)を含む(本例では、ただ1つの新しい変異を操作して同
時に株内に入れた)。ここでは、候補は、所望の数の変化の関数として単に見なされない。代わりに、分析装置214は、出発点として、高性能測定基準を有すると分かっている先に設計された株(「シード株」)のコレクションを選択した。分析装置214は個々に、遺伝子変化をシード株のそれぞれに適用した。導入された遺伝子変化は、シード株内に既に存在するものを含まなかった。様々な技術的、生物学的、または他の理由で、ある特定の変異、例えば、opca_4が明示的に要求され、または例えば、dss_422が明示的に除外された。166の入手可能なシード株およびモデルによって特徴付けられた336の変化を使用して、6239の新規候補株を設計した。
モデルに基づいて、分析装置214は、候補株設計の性能を予測した。分析装置214は、目的の2つの表現型(収率および生産性)に関する予測された性能に基づいて「最良」から「最悪」に候補をランク付けた。具体的には、分析装置214は、加重和を使用して候補株をスコア付けした:
スコア=0.8yield/max(yields)+0.2prod/max(prods)、
式中、yieldは、候補株について予測された収率を表し、
max(yields)は、すべての候補株に対する最大収率を表し、
prodは、候補株についての生産性を表し、
max(prods)は、すべての候補株に対する最大収率を表す。
分析装置214は、能力の制約およびオペレーションの制約の両方を課すことによって候補のランク付けされたリストから推奨の最終セットを生成した。本例では、能力限界は、48のコンピューター生成候補設計株で設定した。オペレーションの制約に起因して、本例では、ただ1つのシード株を96ウェルプレートの1列当たりに使用した。これは、シード株を選択した後、その株に対して最大で8つの変化を構築することができたが、わずか6のシード株しか任意の所与の週内に選択することができなかったことを意味する。
訓練されたモデル(上述した)を使用して各候補株の予期される性能(収率および生産性についての)を予測した。分析装置214は、上記に与えたスコア付関数を使用して候補株をランク付けた。能力およびオペレーションの制約を適用して48の候補株の選別されたセットを得た。選別された候補株のこのセットを図48に表す。
選別された候補株を、発注エンジン208が作成した工場注文に基づいて構築した(ファクトリー210において)(3312)。注文は、候補株に対応するDNAの仕様に基づいた。
実際には、ビルドプロセスは、予期された失敗率を有し、それによって株のランダムセットを構築しない。このビルドサイクルについて、候補株のおおよそ20%が構築するのに失敗し、37の構築された株(built strain)をもたらした。
分析装置214を使用して選択された株の実際の収率および生産性性能を測定した。分析装置214は、3つの判定基準:モデル精度;株性能の改善;および人間の専門家が作成した設計との同等性(または改善)に基づいてモデルおよび推奨株を評価した。
収率および生産性表現型を、推奨株について測定し、モデルが予測した値と比較した。図49に示した通り、モデルは、有用な予測的有用性を実証する。特に、推奨株について予測された収率値は、対応する観察結果と0.59のピアソン−r相関係数を有する。
次に、分析装置214は、推奨株のそれぞれの親株からのパーセンテージ性能変化を計算した。このデータを図50に(薄灰色で)示す。本発明者らは、予測された株の多くが、実際には、これらの直接の親に対して予期された性能獲得を呈することを見出した。特に、最良の予測された株は、その直接の親に対して6%の収率の改善を示した。
上述したモデルに基づく株設計プロセスと並行して、48の株のコレクションを、人間の専門家が独立に設計した。これらの株のうち、37を順調に構築し、試験した。このデータは、モデルに基づく株設計が、人間の専門家が設計した株と同等に働くことを実証した。これらの専門家は、本発明の譲受人が雇用した、または別段に従事させている本開示の実施形態に精通している高度に熟練した(例えば、Ph.D.レベル)科学者である。2つの方法を比較するために、本発明者らは、各群の性能分布を最初に検査した(図51)。この実験では、モデルに基づく株の平均収率は、人間の専門家が作成した設計に対して1%の増大を示した。
次いで本発明者らは、バックグラウンドによってグループ化された人間の専門家が設計した、およびコンピューターモデルが設計した株、すなわち、同じ親をもつ新しい株を比較した(図52)。やはり、本発明者らは、コンピューターが作成した設計は、人間の専門家が作成した設計と同等に、かつ一部の場合では、それより良好に働き、さらに、より少ないばらつきを生じる傾向があることを見出した。最後に、本発明者らは、人間の専門家およびモデルが設計した株の親株に対する変化率を比較した(図50)。やはり、これらの集団は、同等の獲得を示した。
表にした要約統計については表4.1を参照。
予測、それに続く構築、それに続く試験サイクルの各ラウンドの最後に、本発明者らは、モデル予測の品質の評価および新しいデータの先のモデルへの反復組み入れに興味を持った。前者、モデル評価について、本発明者らは、モデル予測を実験的測定値と比較することによって予測精度を測定することに着目した。予測精度は、予測値と観測値との間の関連性の強度を示す相関係数、または平均モデル誤差の尺度である二乗平均平方根誤差を含めたいくつかの方法によって評価することができる。
実験の多くのラウンドにわたって、モデル予測がずれる場合があり、新しい遺伝子変化を訓練入力に加えて予測精度を改善することができる。本例に関して、設計変化およびこれらの結果として生じる性能を予測モデルに加えた(3316)。
サービスとしてのゲノム設計および操作
本開示の実施形態では、図31のLIMSシステムソフトウェア3210を、図32のクラウドコンピューティングシステム3202において実装して、複数のユーザーが本開示の実施形態によって微生物株を設計および構築するのを可能にすることができる。図32は、本開示の実施形態によるクラウドコンピューティング環境3204を例示する。図34に例示したものなどのクライアントコンピューター3206は、インターネットなどのネットワーク3208を介してLIMSシステムにアクセスする。諸実施形態では、LIMSシステムアプリケーションソフトウェア3210は、クラウドコンピューティングシステム3202内に存在する。LIMSシステムは、図34に例示したタイプの1つまたは複数のプロセッサーを使用して1つまたは複数のコンピューターシステムを使用することができる。クラウドコンピューティングシステム自体は、ネットワーク3208を介してLIMSシステムアプリケーション3210をクライアントコンピューター3206にインターフェースをとるためのネットワークインターフェース3212を含む。ネットワークインターフェース3212は、アプリケーションプログラミングインターフェース(API)を含むことによって、クライアントコンピューター3206におけるクライアントアプリケーションがLIMSシステムソフトウェア3210にアクセスするのを可能にすることができる。特に、APIを通じて、クライアントコンピューター3206は、限定することなく、入力インターフェース202、インタープリター204、エグゼキューションエンジン207、発注エンジン208、ファクトリー210をランさせるソフトウェア、ならびに試験装置212および分析装置214を含めたLIMSシステム200のコンポーネントにアクセスすることができる。サービス型ソフトウェア(SaaS)のソフトウェアモジュール3214は、クライアントコンピューター3206へのサービス型LIMSシステムソフトウェア3210を提供する。クラウド管理モジュール3216は、クライアントコンピューター3206によるLIMSシステム3210へのアクセスを管理する。クラウド管理モジュール3216は、マルチテナントアプリケーションを使用するクラウドアーキテクチャ、当技術分野で公知の仮想化または他のアーキテクチャが、複数のユーザーにサービスすることを可能にし得る。
ゲノム自動化
本開示の方法を自動化すると、同時に複数の試験株バリアントからの標的産物のハイスループット表現型スクリーニングおよび同定が可能になる。
上述のゲノム操作予測モデルリングプラットフォームは、数百および数千の変異体株がハイスループット様式で構築される事実を前提としている。以下に記載のロボットシステムおよびコンピューターシステムは、このようなハイスループットプロセスを実行することができる構造機構である。
一部の実施形態では、本開示は、宿主細胞生産性を改善し、または工業用株を再建する方法を教示する。このプロセスの一部として、本開示は、DNAをアセンブルし、新しい株を構築し、プレート中の培養物をスクリーニングし、タンク発酵のモデルにおける培養物をスクリーニングする方法を教示する。一部の実施形態では、本開示は、新しい宿主株を創製および試験する上述の方法の1つまたは複数は、自動化ロボットによって助けられることを教示する。
一部の実施形態では、本開示は、図6に表したハイスループット株操作プラットフォームを教示する。
HTPロボットシステム
一部の実施形態では、本開示の自動化された方法は、ロボットシステムを含む。本明細書に概説したシステムは一般に、96−または384−ウェルマイクロタイタープレートの使用を対象とするが、当業者が十分に理解するように、任意の数の異なるプレートまたは構成を使用することができる。さらに、本明細書に概説したステップのいずれか、またはすべてを自動化することができ、よって例えば、システムは、完全または部分的に自動化され得る。
一部の実施形態では、本開示の自動化システムは、1つまたは複数の作業モジュールを含む。例えば、一部の実施形態では、本開示の自動化システムは、DNA合成モジュール、ベクタークローニングモジュール、株形質転換モジュール、スクリーニングモジュール、およびシーケンシングモジュールを含む(図7を参照)。
当業者が十分に理解するとおり、自動化システムは、これらに限定されないが、液体ハンドラー;1つまたは複数のロボットアーム;マイクロプレートを適所配置するためのプレートハンドラー;プレートシーラー、プレートピアサー、非交差汚染プレート上のウェルの蓋を除去および交換するための自動化蓋ハンドラー;使い捨てチップを用いて試料分配するための使い捨てチップアセンブリー;試料分配のための洗浄可能なチップアセンブリー;96ウェルローディングブロック;一体型サーマルサイクラー;冷却された試薬ラック;マイクロタイタープレートピペットポジション(任意選択で冷却された);プレートおよびチップのためのスタッキングタワー;磁気ビーズ処理ステーション;濾過システム;プレートシェーカー;バーコードリーダーおよびアプリケーター;ならびにコンピューターシステムを含めた多種多様なコンポーネントを含み得る。
一部の実施形態では、本開示のロボットシステムは、ハイスループットピペット操作を可能にして遺伝子標的化および組換え用途のプロセスにおけるすべてのステップを実施する自動化液体および粒子ハンドリングを含む。これは、液体および粒子マニピュレーション、例えば、吸引、分注、混合、希釈、洗浄、正確な容量移送;ピペットチップの取戻しおよび廃棄;ならびに単一試料吸引からの複数の送達についての同一体積の繰り返しピペット操作などを含む。これらのマニピュレーションは、交差汚染のない液体、粒子、細胞、および生物体移送である。機器は、フィルター、膜、および/または娘プレートへのマイクロプレート試料の自動化複製、高密度移送、フルプレート連続希釈、ならびに大容量オペレーションを遂行する。
一部の実施形態では、本開示の特注自動化液体ハンドリングシステムは、TECAN機械(例えば、特注TECAN Freedom Evo)である。
一部の実施形態では、本開示の自動化システムは、マルチウェルプレート、ディープウェルプレート、スクウェアウェルプレート、試薬トラフ、試験管、ミニチューブ、マイクロチューブ、クライオバイアル、フィルター、マイクロアレイチップ、光ファイバー、ビーズ、アガロースゲルおよびアクリルアミドゲルのためのプラットフォームに適合し、他の固相マトリックスまたはプラットフォームは、アップグレード可能なモジュラーデッキ上に収容されている。一部の実施形態では、本開示の自動化システムは、ソースおよび産出試料、試薬、試料および試薬希釈、アッセイプレート、試料および試薬リザーバー、ピペットチップ、ならびにアクティブチップ洗浄ステーションを配置するための多位置作業面のための少なくとも1つのモジュラーデッキを含有する。
一部の実施形態では、本開示の自動化システムは、ハイスループット電気穿孔システムを含む。一部の実施形態では、ハイープット電気穿孔システムは、96または384−ウェルプレート内で細胞を形質転換することができる。一部の実施形態では、ハイスループット電気穿孔システムとしては、VWR(登録商標)ハイスループット電気穿孔システム、BTX(商標)、Bio−Rad(登録商標)Gene Pulser MXcell(商標)、または他のマルチウェル電気穿孔システムが挙げられる。
一部の実施形態では、一体型サーマルサイクラーおよび/または温度調節器が、制御ブロックまたはプラットフォームなどの熱交換器の温度を安定化させるのに使用されて、0℃〜100℃に試料をインキュベートする正確な温度制御をもたらす。
一部の実施形態では、本開示の自動化システムは、液体、粒子、細胞、および多細胞生物をロボット制御でマニピュレートすることができる、単一もしくは複数の磁気プローブ、親和性プローブ、レプリケーター、またはピペッタを有する交換可能なマシンヘッド(単一またはマルチチャネル)に適合する。マルチウェルまたはマルチチューブ磁気分離器および濾過ステーションは、単一または複数の試料フォーマットにおいて液体、粒子、細胞、および生物体をマニピュレートする。
一部の実施形態では、本開示の自動化システムは、カメラビジョンおよび/または分光計システムに適合する。よって、一部の実施形態では、本開示の自動化システムは、進行中の細胞培養における色および吸収の変化を検出およびロギングすることができる。
一部の実施形態では、本開示の自動化システムは、複数のハードウェアアドオンに柔軟であり、適応できることによって、システムが複数のアプリケーションを実行することを可能にするように設計される。ソフトウェアプログラムモジュールは、方法の創製、改変、および試行を可能にする。システムの診断モジュールは、セットアップ、機器整列、およびモータ動作を可能にする。特注のツール、実験機器、ならびに液体および粒子移送パターンは、異なるアプリケーションをプログラムおよび実施することを可能にする。データベースは、方法およびパラメータ記憶を可能にする。ロボットインターフェースおよびコンピューターインターフェースは、機器間の通信を可能にする。
よって、一部の実施形態では、本開示は、図26に表したハイスループット株操作プラットフォームを教示する。
当業者は、本開示のHTP操作方法を実行することができる様々なロボットプラットフォームを認識する。以下の表5は、図26に記載した本開示のHTP操作ステップの各ステップを実行することができる科学的装置の非排他的リストを提供する。
コンピューターシステムハードウェア
図34は、本開示の実施形態による非一時的コンピューター可読媒体(例えば、メモリー)内に記憶されたプログラムコードを実行するのに使用され得るコンピューターシステム800の一例を例示する。コンピューターシステムは、入力/出力サブシステム802を含み、これは、アプリケーションに応じて人間のユーザーおよび/または他のコンピューターシステムとインターフェースで接続するのに使用することができる。I/Oサブシステム802は、例えば、キーボード、マウス、グラフィカルユーザーインターフェース、タッチスクリーン、または入力のための他のインターフェース、および例えば、LEDもしくは他のフラットスクリーンディスプレイ、あるいはアプリケーションプログラムインターフェース(API)を含めた出力のための他のインターフェースを含み得る。LIMSシステムのコンポーネントなどの本開示の実施形態の他のエレメントは、コンピューターシステム800のもののようなコンピューターシステムで実装することができる。
プログラムコードは、二次メモリー810もしくはメインメモリー808または両方内の永続記憶装置などの非一時的媒体内に記憶することができる。メインメモリー808として、ランダムアクセスメモリー(RAM)などの揮発性メモリー、またはリードオンリーメモリー(ROM)などの不揮発性メモリー、ならびに指示およびデータにより速くアクセスするための異なるレベルのキャッシュメモリーを挙げることができる。二次メモリーとして、永続記憶装置、例えば、ソリッドステートドライブ、ハードディスクドライブ、または光ディスクなどを挙げることができる。1つまたは複数のプロセッサー804は、1つまたは複数の非一時的媒体からのプログラムコードを読み込み、コードを実行してコンピューターシステムが本明細書の実施形態によって実施される方法をなしとげることを可能にする。当業者は、プロセッサー(複数可)は、ソースコードを取り込み、ソースコードを解釈またはコンパイルして、プロセッサー(複数可)804のハードウェアゲートレベルで理解可能であるマシンコードにすることができることを理解する。プロセッサー(複数可)804は、計算集約型タスクを扱うためのグラフィックスプロセシングユニット(GPU)を含み得る。特に、機械学習では、1つまたは複数のCPU 804は、大量のデータの処理を1つまたは複数のGPU 804にオフロードすることができる。
プロセッサー(複数可)804は、1つまたは複数の通信インターフェース807、例えば、ネットワークインターフェースカード、WiFiトランシーバーなどを介して外部ネットワークと通信することができる。バス805は、I/Oサブシステム802、プロセッサー(複数可)804、周辺デバイス806、通信インターフェース807、メモリー808、および永続記憶装置810を通信可能にカップルする。本開示の実施形態は、この代表的なアーキテクチャに限定されない。代替の実施形態は、異なる配置およびタイプのコンポーネント、例えば、入出力コンポーネントおよびメモリーサブシステムのための別個のバスを使用することができる。
当業者は、本開示の実施形態のエレメントの一部またはすべて、およびこれらの付随するオペレーションは、コンピューターシステム800のもののような1つまたは複数のプロセッサーおよび1つまたは複数のメモリーシステムを含む1つまたは複数のコンピューターシステムによって完全または部分的にインプリメントされ得ることを理解する。特に、本明細書に記載のLIMSシステム200ならびに任意のロボットおよび他の自動化システムまたはデバイスのエレメントは、コンピューター実装することができる。一部のエレメントおよび機能性は、ローカルにインプリメントすることができ、他のものは、例えば、異なるサーバーを通じたネットワークにわたって分散様式で、例えば、クライアント−サーバー様式でインプリメントすることができる。特に、図32に示したように、サーバーサイドオペレーションを、サービス型ソフトウェア(SaaS)様式で複数のクライアントに利用可能にすることができる。
本文脈における用語のコンポーネントは、ソフトウェア、ハードウェア、もしくはファームウェア(またはこれらの任意の組合せ)コンポーネントを広く指す。コンポーネントは、典型的には、指定された入力(複数可)を使用して有用なデータまたは他の出力を生成することができる機能コンポーネントである。コンポーネントは、自己充足型であってもよく、または自己充足型でなくてもよい。アプリケーションプログラム(「アプリケーション」とも呼ばれる)は、1つもしくは複数のコンポーネントを含み得、またはコンポーネントは、1つもしくは複数のアプリケーションプログラムを含むことができる。
一部の実施形態は、他のモジュールまたはアプリケーションコンポーネントとともにコンポーネントの一部、すべてを含み、またはどれも含まない。なおさらに、様々な実施形態は、これらのコンポーネントの2つもしくはそれ超を単一モジュール内に組み入れ、かつ/またはこれらのコンポーネントの1つもしくは複数の機能性の一部を異なるコンポーネントと結びつけることができる。
用語「メモリー」は、情報を記憶させるのに使用される任意のデバイスまたは機構であり得る。本開示の一部の実施形態によれば、メモリーは、これらに限定されないが、揮発性メモリー、不揮発性メモリー、およびダイナミックメモリーの任意のタイプを包含するように意図されている。例えば、メモリーは、ランダムアクセスメモリー、メモリー記憶デバイス、光学メモリーデバイス、磁気媒体、フロッピー(登録商標)ディスク、磁気テープ、ハードドライブ、SIMM、SDRAM、DIMM、RDRAM、DDR RAM、SODIMMS、消去可能プログラム可能リードオンリーメモリー(EPROM)、電気的消去可能プログラム可能リードオンリーメモリー(EEPROM)、コンパクトディスク、DVDなどであり得る。一部の実施形態によれば、メモリーは、1つまたは複数のディスクドライブ、フラッシュドライブ、データベース、ローカルキャッシュメモリー、プロセッサーキャッシュメモリー、リレーショナルデータベース、フラットデータベース、サーバー、クラウドベースプラットフォームなどを含み得る。さらに、当業者は、情報を記憶するための多くの追加のデバイスおよび技法をメモリーとして使用することができることを十分に理解する。
メモリーは、プロセッサー上の1つまたは複数のアプリケーションまたはモジュールをランさせるための指示を記憶させるのに使用され得る。例えば、メモリーは、一部の実施形態では、本願に開示のモジュールおよび/またはアプリケーションの1つまたは複数の機能性を実行するのに必要な指示のすべてまたは一部を収納するのに使用することができる。
遺伝子設計予測に基づくHTP微生物株操作:例示的なワークフロー
一部の実施形態では、本開示は、本開示のコンピューター分析システムの推奨に基づく新しい宿主生物の指向操作を教示する。
一部の実施形態では、本開示は、すべての遺伝子設計およびクローニング方法に適合する。すなわち、一部の実施形態では、本開示は、伝統的なクローニング技法、例えば、ポリメラーゼ連鎖反応、制限酵素消化、ライゲーション、相同組換え、RT PCR、および当技術分野で一般に公知であり、例えば、参照により本明細書に組み込まれている、Sambrookら(2001年)、Molecular Cloning: A Laboratory Manual(3版、Cold Spring Harbor Laboratory Press、Plainview、New York)に開示されているその他
のものなどの使用を教示する。
一部の実施形態では、クローン化された配列は、本明細書に教示のHTP遺伝子設計ライブラリーのいずれか由来の可能なもの、例えば、プロモータースワップライブラリー由来のプロモーター、SNPスワップライブラリー由来のSNP、開始コドンもしくは停止コドン交換ライブラリー由来の開始コドンもしくは停止コドン、STOPスワップライブラリー由来のターミネーター、または配列最適化ライブラリー由来の配列最適化を含み得る。
さらに、特定の構築物内に含まれるべき正確な配列組合せは、上位性マッピング機能によって知らされ得る。
他の実施形態では、クローン化された配列は、合理的な設計(仮説主導型)に基づく配列および/または科学刊行物などの他のソースに基づく配列も含むことができる。
一部の実施形態では、本開示は、i)カスタムメイドSNP特異的DNAを生成するステップと、ii)SNP特異的プラスミドをアセンブルするステップと、iii)SNP特異的DNAで標的宿主細胞を形質転換するステップと、iv)任意の選択マーカーをループアウトさせるステップとを含む、指向操作の方法を教示する(図2を参照)。
図6Aは、DNAを取得およびアセンブルステップと、ベクターをアセンブルするステップと、宿主細胞を形質転換するステップと、選択マーカーを除去するステップとを含む、本開示の株操作法の一般的なワークフローを表す。
特異的DNAオリゴヌクレオチドを構築する
一部の実施形態では、本開示は、宿主細胞生物体のDNAセグメントを挿入することおよび/または置き換えることおよび/または変更することおよび/または欠失させることを教示する。一部の態様では、本明細書に教示の方法は、宿主生物のゲノム内に組み入れる目的のオリゴヌクレオチド(すなわち、標的DNAセグメント)を構築することを伴う。一部の実施形態では、本開示の標的DNAセグメントは、公知の鋳型からのコピーもしくはカット、変異、またはDNA合成を含む、当技術分野で公知の任意の方法を介して得ることができる。一部の実施形態では、本開示は、標的DNA配列を生成するための市販の遺伝子合成産物(例えば、GeneArt(商標)、GeneMaker(商標)、GenScript(商標)、Anagen(商標)、Blue Heron(商標)、Entelechon(商標)、GeNOsys,Inc.、またはQiagen(商標))に適合する。
一部の実施形態では、標的DNAセグメントは、宿主生物の選択されたDNA領域内にSNPを組み入れる(例えば、有益なSNPを付加する)ように設計されている。他の実施形態では、DNAセグメントは、宿主生物のDNAからSNPを除去する(例えば、有害なまたは中立のSNPを除去する)ように設計されている。
一部の実施形態では、本発明の方法で使用されるオリゴヌクレオチドは、当技術分野で公知の酵素合成または化学合成の方法のいずれかを使用して合成することができる。オリゴヌクレオチドは、固体支持体、例えば、制御細孔ガラス(CPG)、ポリスチレンビーズ、またはCPGを含有し得る熱可塑性ポリマーから構成される膜上で合成することができる。オリゴヌクレオチドは、アレイ上で、マイクロフルイディクスを使用して並列のマイクロスケールで(Tianら、Mol. BioSyst.、5巻、714〜722頁(2009年))、または両方の組合せを提供する公知の技術で(Jacobsenら、米国特許出願第2011/0172127号を参照)合成することもできる。
アレイ上の、またはマイクロフルイディクスによる合成は、より低い試薬使用を通じてコストを低減することによって、慣例的な固体支持体合成に対して利点を提供する。遺伝子合成に要求される規模は低く、したがって、アレイから、またはマイクロフルイディクスを通じて合成されるオリゴヌクレオチド産物の規模は、許容される。しかし、合成されるオリゴヌクレオチドは、固体支持体合成を使用するときより低い品質のものである(Tian、以下を参照;Staehlerら、米国特許出願第2010/0216648号も参照)。
多数の進歩が、それが1980年代に最初に記載されて以来、伝統的な4ステップホスホラミダイト化学において達成されている(例えば、ペルオキシアニオンの脱保護を使用するSierzchalaら、J. Am. Chem. Soc.、125巻、13427〜13441頁(2003年);代替の保護基についてHayakawaら、米国特許第6,040,439号;ユニバーサル支持体についてAzhayevら、Tetrahedron、57巻、4977〜4986頁(2001年);大孔CPGの使用によるより長いオリゴヌクレオチドの改善された合成についてKozlovら、Nucleosides, Nucleotides, and Nucleic Acids、24巻(5〜7号)、
1037〜1041頁(2005年);および改善された誘導体化についてDamhaら、NAR、18巻、3813〜3821頁(1990年)を参照)。
合成のタイプにかかわらず、次いで結果として生じるオリゴヌクレオチドは、より長いオリゴヌクレオチドのためのより小さいビルディングブロックを形成することができる。一部の実施形態では、より小さいオリゴヌクレオチドは、当技術分野で公知のプロトコール、例えば、ポリメラーゼ鎖アセンブリー(PCA)、リガーゼ連鎖反応(LCR)、および熱力学的にバランスの取れたインサイドアウト合成(thermodynamically balanced
inside-out synthesis)(TBIO)を使用して一緒に繋ぐことができる(Czarら、Trends in Biotechnology、27巻、63〜71頁(2009年)を参照)。PCAでは、所望のより長い産物の全長にまたがるオリゴヌクレオチドが、複数のサイクル(典型的には約55サイクル)においてアニールおよび伸長されて完全長産物を最終的に達成する。LCRは、リガーゼ酵素を使用して2つのオリゴヌクレオチドを繋ぎ、これらはともにアニールされて第3のオリゴヌクレオチドになる。TBIO合成は、所望の産物の中心から開始し、遺伝子の5’末端における順方向鎖と、かつ遺伝子の3’末端における逆方向鎖と相同である重複オリゴヌクレオチドを使用することによって両方向で漸次伸長される。
より大きい二本鎖DNA断片を合成する別の方法は、トップストランドPCR(TSP)によってより小さいオリゴヌクレオチドを組み合わせることである。本方法では、複数のオリゴヌクレオチドが所望の産物の全長にわたり、隣接するオリゴヌクレオチド(複数可)に対して重複領域を含有する。増幅は、ユニバーサル順方向プライマーおよび逆方向プライマーを用いて、かつ複数のサイクルの増幅を介して実施することができ、全長の二本鎖DNA産物が形成される。次いでこの産物は、任意選択の誤差補正およびさらなる増幅を受けることができ、それにより、所望の二本鎖DNA断片最終産物がもたらされる。
TSPの一方法では、全長の所望の産物を形成するのに組み合わされるより小さいオリゴヌクレオチドのセットは、40〜200塩基の間の長さであり、互いに少なくとも約15〜20塩基重複する。実用的な目的のために、重複領域は、オリゴヌクレオチドの特異的アニーリングを保証するために最低でも十分長く、使用される反応温度でアニールするために十分高い融解温度(T)を有するべきである。重複は、所与のオリゴヌクレオチドが隣接するオリゴヌクレオチドによって完全に重複されるポイントまで伸長することができる。重複の量は、最終産物の品質に対していずれの効果も有さないようである。アセンブリー内の最初および最後のオリゴヌクレオチドビルディングブロックは、順方向および逆方向の増幅プライマーのための結合部位を含有するべきである。一実施形態では、最初および最後のオリゴヌクレオチドの末端側終端配列は、同じ相補性を有する配列を含有してユニバーサルプライマーの使用を可能にする。
特注プラスミドアセンブリング/クローニング
一部の実施形態では、本開示は、宿主生物のゲノム内に所望の標的DNA切片(例えば、特定のSNPを含有する)を挿入することができるベクターを構築するための方法を教示する。一部の実施形態では、本開示は、標的DNA、相同アーム、および少なくとも1つの選択マーカーを含むベクターをクローニングする方法を教示する(図3を参照)。
一部の実施形態では、本開示は、宿主生物内への形質転換に適した任意のベクターに適合する。一部の実施形態では、本開示は、宿主細胞に適合するシャトルベクターの使用を教示する。一実施形態では、本明細書に提供される方法において使用するためのシャトルベクターは、E.coliおよび/またはCorynebacterium宿主細胞に適合するシャトルベクターである。本明細書に提供される方法において使用するためのシャトルベクターは、本明細書に記載の選択および/または対抗選択のためのマーカーを含み得る。マーカーは、当技術分野で公知のかつ/または本明細書に提供される任意のマーカーであり得る。シャトルベクターは、任意の調節配列(複数可)および/または当技術分野で公知の前記シャトルベクターのアセンブリーにおいて有用な配列をさらに含み得る。シャトルベクターは、例えば、E.coliまたはC.glutamicumなど本明細書に提供される宿主細胞内での繁殖に必要とされ得る任意の複製起点をさらに含むことができる。調節配列は、当技術分野で公知の、または本明細書に提供される任意の調節配列、例えば、宿主細胞の遺伝機構によって使用される、プロモーター、開始、停止、シグナル、分泌、および/または終結配列などであり得る。ある特定の事例では、標的DNAは、任意のリポジトリまたはカタログ製品から入手可能なベクター、コンストラクト、またはプラスミド、例えば、市販のベクター(例えば、DNA2.0特注またはGATEWAY(登録商標)ベクターを参照)内に挿入することができる。ある特定の事例では、標的DNAは、任意のリポジトリまたはカタログ製品から入手可能なベクター、コンストラクト、またはプラスミド、例えば、市販のベクター(例えば、DNA2.0特注またはGATEWAY(登録商標)ベクターを参照)内に挿入することができる。
一部の実施形態では、本開示のアセンブリー/クローニング方法は、以下のアセンブリーストラテジー:i)II型慣習的クローニング、ii)II S型媒介または「ゴールデンゲート」クローニング(例えば、Engler, C.、R. Kandzia、およびS. Marillonnet、2008年、「A one pot, one step, precision cloning method with high-throughput capability」、PLos One、3巻:e3647頁;Kotera, I.およびT. Nagai、2008年、「A high-throughput and single-tube recombination of crude PCR products using a DNA polymerase inhibitor and type IIS restriction enzyme」、J Biotechnol、137巻:1〜7頁;Weber, E.、R. Gruetzner、S. Werner、C. Engler、およびS. Marillonnet、2011年、Assembly of Designer TAL Effectors by Golden Gate Cloning、PloS One、6巻:e19722頁を参照)、iii)GATEWAY(登録商標)組換え、iv)TOPO(登録商標)クローニング、エキソヌクレアーゼ媒介アセンブリー(Aslanidisおよびde Jong、1990年、「Ligation-independent cloning of PCR products (LIC-PCR)」、Nucleic Acids Research、18巻、20号、6069頁)、v)相同組換え、vi)非相同末端結合、vii)ギブソンアセンブリー(Gibsonら、2009年、「Enzymatic assembly of DNA molecules up to several hundred kilobases」、Nature Methods、6巻、343〜345頁)、またはこれらの組合せの少なくとも1つを使用することができる。モジュラーIIS型ベースアセンブリーストラテジーは、PCT公開WO2011/154147に開示されており、その開示は、参照により本明細書に組み込まれている。
一部の実施形態では、本開示は、少なくとも1つの選択マーカーを有するベクターをクローニングすることを教示する。選択圧下で原核細胞(例えば、アンピシリン、カナマイシン、テトラサイクリン、クロラムフェニコール、ゼオシン、スペクチノマイシン/ストレプトマイシンに対する)、または真核細胞(例えば、ジェネテシン、ネオマイシン、ハイグロマイシン、ピューロマイシン、ブラストサイジン、ゼオシン)内の選択について抗生物質耐性機能をコードすることが多い様々な選択マーカー遺伝子が当技術分野で公知である。他のマーカーシステム、例えば、順調に形質導入された宿主細胞において発現されるX−galまたは緑色もしくは赤色蛍光タンパク質などの蛍光レポーターの存在下で陽性クローンを選択するのに細菌において使用される周知のブルー/ホワイトスクリーニングシステムは、望まれるまたは望まれない細胞のスクリーニングおよび同定を可能にする。そのほとんどが原核生物系内でのみ機能的である選択マーカーの別のクラスは、産生細胞を死滅させる毒性遺伝子産物を発現する、「デス遺伝子(death gene)」とも呼ばれることが多い対抗選択可能マーカー遺伝子に関する。このような遺伝子の例としては、sacB、rpsL(strA)、tetAR、pheS、thyA、gata−1、またはccdBが挙げられ、その機能は、(Reyratら、1998年、「Counterselectable Markers: Untapped Tools for Bacterial Genetics and Pathogenesis」、Infect Immun.、66巻(9号):4011〜4017頁)に記載されている。
プロトプラスト形成法
一実施形態では、本明細書に提供される方法およびシステムは、糸状菌細胞由来のプロトプラストの生成を使用する。プロトプラストを調製するための適当な手順は、例えば、EP238,023およびYeltonら(1984年、Proc. Natl. Acad. Sci. USA、81巻:1470〜1474頁)に記載されたものを含めて任意の当技術分野で公知のものであり得る。一実施形態では、プロトプラストは、1種または複数の溶菌酵素またはこれらの混合物を用いて糸状菌細胞の培養物を処理することによって生成される。溶菌酵素は、ベータ−グルカナーゼおよび/またはポリガラクツロナーゼであり得る。一実施形態では、プロトプラストを生成するための酵素混合物は、VinoTaste濃縮物である。酵素処理の後、プロトプラストは、例えば、遠心分離などの当技術分野で公知の方法を使用して単離することができる。
前培養および実際のプロトプラスト形成(protoplasting)ステップを変えて、プロト
プラストの数および形質転換効率を最適化することができる。例えば、接種量の変動、接種方法、前培養培地、前培養時間、前培養温度、混合条件、洗浄緩衝液組成、希釈比、溶菌酵素処理中の緩衝液組成、使用される溶菌酵素のタイプおよび/または濃度、溶菌酵素とのインキュベーションの時間、プロトプラスト洗浄手順および/または緩衝液、実際の形質転換中のプロトプラストおよび/またはポリヌクレオチドおよび/または形質転換試薬の濃度、形質転換中の物理的パラメータ、最大で得られる形質転換体までの形質転換後の手順が存在し得る。
プロトプラストは、浸透圧安定化緩衝液中に再懸濁させることができる。このような緩衝液の組成は、種、アプリケーション、および必要性に応じて変動し得る。しかし、典型的には、これらの緩衝液は、0.5から2Mの間のスクロース、シトレート、マンニトール、またはソルビトールのようないずれかの有機成分を含有する。より好ましくは、0.75から1.5Mの間;1Mが最も好適である。さもなければ、これらの緩衝液は、0.1から1.5Mの濃度でKCl、MgSO、NaCl、またはMgClのような無機浸透圧安定化成分を含有する。好ましくは0.2から0.8Mの間;より好ましくは0.3から0.6Mの間、最も好ましくは0.4Mである。最も好適な安定化緩衝液は、STC(ソルビトール、0.8M;CaCl、25mM;Tris、25mM;pH8.0)またはKCl−シトレート(KCl、0.3〜0.6M;シトレート、0.2%(w/v))である。プロトプラストは、1×10から1×1010細胞/mlの間の濃度で使用することができる。好ましくは、濃度は、1×10から1×10の間であり;より好ましくは、濃度は、1×10から5×10の間であり;最も好ましくは、濃度は、1×10細胞/mlである。DNAは、0.01から10μgの間;好ましくは0.1から5μgの間、さらにより好ましくは0.25から2μgの間;最も好ましくは0.5から1μgの間の濃度で使用される。トランスフェクションの効率を増大させるため、キャリアDNA(サケ精子DNAまたは非コードベクターDNAのような)を形質転換混合物に添加することができる。
一実施形態では、生成および後続の単離の後、プロトプラストは、1種または複数の凍結保護物質と混合される。凍結保護物質は、グリコール、ジメチルスルホキシド(DMSO)、ポリオール、糖、2−メチル−2,4−ペンタンジオール(MPD)、ポリビニルピロリドン(PVP)、メチルセルロース、C−連結凍結防止糖タンパク質(C−AFGP)、またはこれらの組合せであり得る。本明細書に提供される方法およびシステムにおいて凍結保護物質として使用するためのグリコールは、エチレングリコール、プロピレングリコール、ポリプロピレングリコール(PEG)、グリセロール、またはこれらの組合せから選択することができる。本明細書に提供される方法およびシステムにおいて凍結保護物質として使用するためのポリオールは、プロパン−1,2−ジオール、プロパン−1,3−ジオール、1,1,1−トリス−(ヒドロキシメチル)エタン(THME)、および2−エチル−2−(ヒドロキシメチル)−プロパン−1,3−ジオール(EHMP)、またはこれらの組合せから選択することができる。本明細書に提供される方法およびシステムにおいて凍結保護物質として使用するための糖は、トレハロース、スクロース、グルコース、ラフィノース、デキストロース、またはこれらの組合せから選択することができる。一実施形態では、プロトプラストは、DMSOと混合される。DMSOは、少なくとも、多くて、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、12.5%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、または75%w/vまたはv/v、それ未満、それ超、それに等しい、または約その値の最終濃度でプロトプラストと混合することができる。プロトプラスト/凍結保護物質(例えば、DMSO)混合物は、貯蔵前にマイクロタイタープレートに分配することができる。プロトプラスト/凍結保護物質(例えば、DMSO)混合物は、本明細書に提供される長期貯蔵(例えば、数時間、数日、数週間、数カ月、数年)にわたって、本明細書に提供される任意の温度、例えば、−20℃または−80℃などで貯蔵することができる。一実施形態では、追加の凍結保護物質(例えば、PEG)が、プロトプラスト/DMSO混合物に添加される。さらに別の実施形態では、追加の凍結保護物質(例えば、PEG)が、貯蔵前にプロトプラスト/DMSO混合物に添加される。PEGは、本明細書に提供される任意のPEGであり得、本明細書に提供される任意の濃度(例えば、w/vまたはv/v)で添加することができる。
プロトプラスト形質転換方法
一実施形態では、本明細書に提供される方法およびシステムは、本明細書に記載の糸状菌細胞に由来するプロトプラストへの核酸の移送を必要とする。別の実施形態では、本明細書に提供される方法およびシステムによって利用される形質転換は、本明細書に記載した通り、本質的にハイスループットであり、かつ/または部分的もしくは完全に自動化されている。本実施形態に付け加えて、形質転換は、本明細書に記載のコンストラクトまたは発現コンストラクトをマイクロタイタープレートのウェルに添加し、その後、本明細書に提供される方法によって生成されたプロトプラストをマイクロタイタープレートの各ウェルにアリコートすることによって実施される。プロトプラストの形質転換/トランスフェクションの適当な手順は、例えば、国際特許出願PCT/NL99/00618号、同PCT/EP99/202516号、FinkelsteinおよびBall(編)、Biotechnology of
filamentous fungi, technology and products、Butterworth-Heinemann(199
2年)、BennettおよびLasure(編)、More Gene Manipulations in fungi、Academic Press(1991年)、Turner :Puhler(編)、Biotechnology、完全に改訂された
第2版、VHC(1992年)protoplast fusion に記載されたもの、ならびにEP63
5574Bに記載されたCa−PEG媒介プロトプラスト形質転換を含めて、任意の当技術分野で公知のものであり得る。代替として、糸状菌宿主細胞またはこれらに由来するプロトプラストの形質転換は、電気穿孔、例えば、ChakrabortyおよびKapoor、Nucleic Acids Res.、18巻:6737頁(1990年)によって記載された電気穿孔など、Ag
robacterium tumefaciens媒介形質転換、例えば、Christiansenら、Curr. Genet.、29巻:100〜102頁(1995年);Durandら、Curr. Genet.、31巻:158〜161頁(1997年);およびBarcellosら、Can. J. Microbiol.、44巻:1137〜1141頁(1998年)に記載されたものなどのDNAの微
粒子導入、または細胞の「磁気微粒子銃(magneto-biolistic)」トランスフェクション
、例えば、米国特許第5,516,670号および同第5,753,477号に記載されたものなどによっても実施することができる。一実施形態では、本明細書に提供される方法およびシステムで使用される形質転換手順は、本明細書に提供されるハイスループットおよび/または自動化を受けやすいもの、例えば、PEG媒介形質転換などである。
本明細書に記載の方法を使用して生成されるプロトプラストの形質転換は、当技術分野で公知の任意の形質転換試薬を使用することによって促進することができる。適当な形質転換試薬は、ポリエチレングリコール(PEG)、FUGENE(登録商標)HD(Roche製)、Lipofectamine(登録商標)またはOLIGOFECTAMINE(登録商標)(Invitrogen製)、TRANSPASS(登録商標)D1(New England Biolabs製)、LYPOVEC(登録商標)またはLIPOGEN(登録商標)(Invivogen製)から選択することができる。一実施形態では、PEGが最も好適な形質転換/トランスフェクション試薬である。PEGは、異なる分子量で入手可能であり、異なる濃度で使用することができる。好ましくは、PEG4000が、10%から60%の間、より好ましくは20%から50%の間、最も好ましくは30%で使用される。一実施形態では、PEGは、本明細書に記載した通り、貯蔵前にプロトプラストに添加される。
宿主細胞の形質転換
一部の実施形態では、本開示のベクターは、形質転換、トランスフェクション、形質導入、ウイルス感染、遺伝子銃、またはTi媒介遺伝子移入を含めた様々な技法のいずれかを使用して宿主細胞内に導入することができる(Christie, P.J.およびGordon, J.E.、2014年、「The Agrobacterium Ti Plasmids」、Microbiol SPectr.、2014年;2巻(6号);10.1128頁を参照)。特定の方法としては、リン酸カルシウムトランスフェクション、DEAE−デキストラン媒介トランスフェクション、リポフェクション、または電気穿孔が挙げられる(Davis, L.、Dibner, M.、Battey, I.、1986年、「Basic Methods in Molecular Biology」)。形質転換の他の方法としては、例えば、酢酸リチウム形質転換および電気穿孔が挙げられる。例えば、Gietzら、Nucleic Acids Res.、27巻:69〜74頁(1992年);Itoら、J. Bacterol.、153巻
:163〜168頁(1983年);ならびにBeckerおよびGuarente、Methods in Enzymology、194巻:182〜187頁(1991年)を参照。一部の実施形態では、形
質転換宿主細胞は、組換え宿主株と呼ばれる。
一部の実施形態では、本開示は、本開示の96−ウェルプレートロボットプラットフォームおよび液体ハンドリング機械を使用する細胞のハイスループット形質転換を教示する。
一部の実施形態では、本開示は、上述した1種または複数の選択マーカーを有する形質転換細胞をスクリーニングすることを教示する。このような一実施形態では、カナマイシン耐性マーカー(KanR)を含むベクターで形質転換された細胞を、有効量のカナマイシン抗生物質を含有する培地に蒔く。カナマイシンが入った培地上で目に見えるコロニー形成単位は、ベクターカセットをこれらのゲノム内に組み入れたと推定される。所望の配列の挿入は、関連した挿入部位のPCR、制限酵素分析、および/またはシーケンシングを介して確認することができる。
選択された配列のループアウト
一部の実施形態では、本開示は、宿主生物からDNAの選択された領域をループアウトする方法を教示する。ループアウト法は、Nakashimaら、2014年、「Bacterial Cellular Engineering by Genome Editing and Gene Silencing.」、Int. J. Mol.
Sci.、15巻(2号)、2773〜2793頁に記載された通りのものであり得る。一部の実施形態では、本開示は、陽性形質転換体から選択マーカーをループアウトすることを教示する。ループアウト欠失技法は、当技術分野で公知であり、(Tearら、2014年、「Excision of Unstable Artificial Gene-Specific inverted Repeats Mediates Scar-Free Gene Deletions in Escherichia coli.」、Appl. Biochem. Biotech.、175巻:1858〜1867頁)に記載されている。本明細書に提供される方法
で使用されるループアウト法は、シングルクロスオーバー相同組換えまたはダブルクロスオーバー相同組換えを使用して実施することができる。一実施形態では、本明細書に記載の選択された領域のループアウトは、本明細書に記載のシングルクロスオーバー相同組換えを使用することを必然的に伴い得る。
第1に、ループアウトベクター(loop out vector)が、宿主生物のゲノム内の選択
された標的領域内に挿入される(例えば、相同組換え、CRISPR、または他の遺伝子編集技法を介して)。一実施形態では、シングルクロスオーバー相同組換えが、図3に表したものなどの環状プラスミドまたはベクターをループインするために、環状プラスミドまたはベクターと宿主細胞ゲノムとの間に使用される。挿入されるベクターは、既存のまたは導入される近傍の宿主配列のダイレクトリピートである配列を用いて設計することができ、その結果、ダイレクトリピートがルーピングおよび欠失を予定しているDNAの領域に隣接する。挿入されると、ループアウトプラスミドまたはベクターを含有する細胞を、選択領域の欠失について対抗選択することができる(例えば、図4;選択遺伝子に対する耐性の欠如を参照)。
当業者は、ループアウト手順の記載は、ゲノムから望まれない領域を欠失させるための一例示的方法を代表するにすぎないことを認識する。実際に、本開示の方法は、これらに限定されないが、CRISPR、TALENS、FOK、または他のエンドヌクレアーゼを介した遺伝子編集を含めて、ゲノム欠失の任意の方法に適合する。当業者は、相同組換え技法を介してゲノムの望まれない領域を置き換える能力も認識する。
以下の実施例は、本開示の種々の実施形態を例証するために提供するのであって、それらには、いかなる場合であっても、本開示を制限する意図はない。特許請求の範囲により定義される、本開示の精神の範囲内に包含されるその変化および他の使用は、当業者により認識される。
簡潔な目次を、下記に提供するが、これはもっぱら、読者を支援するためである。
この目次により、本出願の実施例または開示の範囲を制限する意図は全くない。
(実施例1)
CorynebacteriumのHTP形質転換およびSNPライブラリー創製の実証
この実施例は、本開示のHTP遺伝子操作法の実施形態を示す。宿主細胞を、異なるサイズの多様なSNP配列を用いて形質転換し、すべて、ゲノムの異なるエリアを標的化する。結果から、本開示の方法により、任意の種類の迅速な遺伝子変化を、宿主細胞のゲノム全体にわたり生成することが可能であることが示されている。
A.形質転換ベクターのクローニング
「カスタムプラスミドアセンブリー/クローニング」のセクションにおける上記の記載の通り、および図3に示すように、多様なSNPを、Corynebacterium glutamicum(ATCC21300)からランダムに選び、Corynebacteriumクローニングベクター中に、酵母相同組換えクローニングの技法を使用してクローニングして、各SNPがダイレクトリピート領域に隣接する、ベクターをアセンブルした。
この実施例のためのSNPカセットは、0.5Kb、1Kb、2Kbおよび5Kbの範囲のダイレクトリピートホモロジーアームの様々な長さを含むように設計した。さらに、SNPカセットは、下記でより詳細に記載する通り、ゲノムの種々の明確に異なる領域を標的とする相同組換えのために設計した。
C.glutamicumのゲノムのサイズは、3,282,708bpである(図9を参照されたい)。ゲノムを、24個の等しいサイズの遺伝子領域に恣意的に分け、SNPカセットを、24個の領域のそれぞれを標的とするように設計した。したがって、この実施例のために、全部で96個の明確に異なるプラスミドをクローニングした(4つの異なる挿入断片サイズ×24個の明確に異なるゲノム領域)。
各DNA挿入断片を、相同領域のPCR増幅により、商業的に供給されているオリゴ、および鋳型としての、上に記載した宿主株のゲノムDNAを使用して産生した。ゲノム中に導入しようとするSNPを、オリゴのテールにコードした。酵母において、PCR断片を、ベクターの骨格中に相同組換えを使用してアセンブルした。
ベクター中への各SNPおよびホモロジーアームのクローニングを、図6、図3および表5に記載するHTP操作のワークフローに従って実施した。
B.E.coli中へのアセンブルされたクローンの形質転換
最初に、標準的な熱ショック形質転換の技法を使用して、ベクターをE.coli中へ形質転換して、正確にアセンブルされたクローンを同定し、Corynebacteriumの形質転換のためのベクターDNAを増幅した。
例えば、形質転換したE.coli細菌を、アセンブリーの成功について試験した。各E.coli形質転換プレートからの4つのコロニーを培養し、正確なアセンブリーについてPCRにより試験した。このプロセスを、24個の形質転換の場所のそれぞれおよび4つの異なる挿入断片サイズのそれぞれ(すなわち、この実施例の96個の形質転換体のすべて)について繰り返した。この実験からの結果を、各処理(挿入断片サイズおよびゲノムの場所)について試験した4つのコロニーから同定した正確なコロニーの数として表した(図12を参照されたい)。より長い5kbの挿入断片は、より短い対応物と比較して、アセンブリー効率の減少を示した(n=96)。
C.Corynebacterium中へのアセンブルされたクローンの形質転換
バリデートしたクローンを、電気穿孔によりCorynebacterium glutamicum宿主細胞に形質転換した。各形質転換について、1μgのDNA当たりのコロニー形成単位(CFU)の数を、挿入断片サイズの関数として決定した(図13を参照されたい)。また、Coryneのゲノムへの組込みを、ホモロジーアームの長さの関数としても分析し、結果は、より短いアームは、より低い効率を有することを示した(図13を参照されたい)。
また、C.glutamicum形質転換体中の標的化したゲノムの場所に関するゲノムへの組込み効率も分析した。ゲノムの1位および2位は、ゲノムの残りの部分と比較して、若干より低い組込み効率を示した(図10を参照されたい)。
D.選択マーカーのループアウト
挿入断片カセットの組込みに成功したことが同定されたCorynebacteriumの培養物を、5%のスクロースを含有する培地上で培養し、対抗選択して、sacb選択遺伝子をループアウトした。種々のダイレクトリピートホモロジーアームについてのスクロース耐性の頻度は、アームの長さに関して有意には変化しなかった(図14を参照されたい)。これらの結果から、ループアウト効率が、0.5kb〜5kbのホモロジーアームの長さにわたり一様に維持されることが示唆された。
ループアウト事象をさらにバリデートするために、スクロース耐性を示すコロニーを培養し、シーケンシングにより分析した。
挿入断片のゲノム領域のシーケンシングについての結果を、下記の表6に要約する。
シーケンシングの結果から、ループアウトの10〜20%の効率が示された。実際のループアウトはおそらく、挿入断片配列に若干依存する。しかし、10〜20個のスクロース耐性のコロニーを選ぶことによって、高い成功率がもたらされる。
E.要約
下記の表7に、本発明のHTPゲノム操作法の効率の定量的な評価を示す。酵母ホモロジーの方法論についての構築物のアセンブリーの率として、期待されるDNA構築物を、10個の試験したコロニーのうちの約9個において得た。2kbのホモロジーアームを有するSNP構築物によるCoryneの形質転換により、平均して1マイクログラムのDNA当たり51コロニー形成単位(CFU/μg)が得られ、前記コロニーの98%が、正確に組み込まれたSNP挿入断片を示した(標的化効率)。ループアウト効率として、スクロースに曝露する場合に、耐性となる細胞が0.2%に留まり、これらの13%が、正確にループアウトされた配列を示した。
(実施例2)
HTPゲノム操作−工業用微生物株を再建/改良するための、SNPライブラリーのインプリメンテーション
この実施例は、本開示のHTP株改良プログラムのSNPスワップライブラリーのいくつかの態様を例示する。具体的には、実施例は、現時点で存在する工業用株を再建するためのいくつかの想定されるアプローチを示す。この実施例は、「基準」株と「中間」株と工業用株との間に存在し得る遺伝子の複数の差により生み出される表現型の解空間を探索する、ウェーブアップおよびウェーブダウンのアプローチについて記載する。
A.多様性プール中のSNPの同定
本開示の方法を使用する例示的な株改良プログラムを、工業生産用微生物株に対して実施した;これを、本明細書では「C」と呼ぶ。このプログラムについての多様性プールの株を、A、BおよびCにより表す。株Aは、あらゆる変異誘発の前の、元々の、産生のための宿主株を表した。株Cは、現在の工業用株を表し、従来の株改良プログラムによる長年の変異誘発および選択を受けている。株Bは、「中位」の株を表し、何らかの変異誘発を受けており、株Cの先行株であった。(図17Aを参照されたい)。
株A、株Bおよび株Cについて、シーケンシングし、それらのゲノムを、株間の遺伝子の差について分析した。全部で332個の非同義SNPを同定した。これらのうち、133個のSNPがCにユニークであり、加えて、153個がBおよびCにより共有され、46個が株Bにユニークであった(図17Bを参照されたい)。これらのSNPを、下流の株改良サイクルのために多様性プールとして使用する。
B.SNPスワッピングの分析
実施例2のパートAの多様性プールから同定したSNPを分析して、宿主細胞の性能に対するそれらの効果を決定する。株性能の最初の「学習」のラウンドを、下に記載し、図18に図示した通り、6つのステップに分解する。
第1に、CからのSNPをすべて、基準株A中に個々および/またはコンビナトリアルにクローニングする。これは、最少286個の個別の形質転換体に相当する。これらの形質転換体の目的は、有益なSNPを同定することである。
第2に、CからのSNPをすべて、市販株Cから個々および/またはコンビナトリアルに除去する。これは、最少286個の個別の形質転換体に相当する。これらの形質転換体の目的は、中立のSNPおよび有害なSNPを同定することである。また、追加の任意選択のステップ3〜6についても、下に記載する。2つの遺伝的な時点(genetic time point)(基準株Aおよび工業用株C)からのSNPを付加および減じる、第1および第2のステップを、本明細書では「ウェーブ」と呼び、ウェーブは、「ウェーブアップ」(基準株へのSNPの付加、第1のステップ)および「ウェーブダウン」(工業用株からのSNPの除去、第2のステップ)を含む。ウェーブの概念を、SNPのさらなる付加/削減に拡張する。
第3に、BからのSNPをすべて、基準株A中に個々および/またはコンビナトリアルにクローニングする。これは、最少199個の個別の形質転換体に相当する。これらの形質転換体の目的は、有益なSNPを同定することである。形質転換体のうちのいくつかはまた、第1のステップで産生する形質転換体についてのバリデーションデータとしても役立つ。
第4に、BからのSNPをすべて、市販株Bから個々および/またはコンビナトリアルに除去する。これは、最少199個の個別の形質転換体に相当する。これらの形質転換体の目的は、中立のSNPおよび有害なSNPを同定することである。形質転換体のうちのいくつかはまた、第2のステップで産生する形質転換体についてのバリデーションデータとしても役立つ。
第5に、CにユニークなSNP(すなわち、B中には存在しない)をすべて、個々および/またはコンビナトリアルに市販株B中にクローニングする。これは、最少46個の個別の形質転換体に相当する。これらの形質転換体の目的は、有益なSNPを同定することである。形質転換体のうちのいくつかはまた、第1および第3のステップで産生する形質転換体についてのバリデーションデータとしても役立つ。
第6に、CにユニークなSNPをすべて、市販株Cから個々および/またはコンビナトリアルに除去する。これは、最少46個の個別の形質転換体に相当する。これらの形質転換体の目的は、中立のSNPおよび有害なSNPを同定することである。形質転換体のうちのいくつかはまた、第2および第4のステップで産生する形質転換体についてのバリデーションデータとしても役立つ。
これらのステップのそれぞれから収集するデータを使用して、各SNPを、疎明の、有益、中立または有害として分類する。
C.SNPの有益な組合せを決定するための、上位性マッピングの利用
実施例2のパートBで同定した有益なSNPを、組み合わせた場合に、宿主の性能を改善する可能性があるSNPを同定するために、本開示の上位性マッピング法により分析する。
実施例1の操作法を使用して、新たに操作された株バリアントを創製して、SNPの組合せを、上位性マッピングによる予測に従って試験する。SNPの統合は、逐次的に行うことができ、または代替的に、複数の分枝にわたって行うこともでき、したがって、1つ超の改良された株が、有益なSNPのサブセットを伴い存在し得る。SNPの統合は、株改良の複数のラウンドにわたり、有益なSNPの最適な組合せを含有する最終の株を産生するまで続け、最終の株は、中立のSNPまたは有害なSNPの荷物をいずれも有さない。
(実施例3)
HTPゲノム操作−Corynebacterium中でのリシンの産生における株性能を改善するための、SNPスワップライブラリーのインプリメンテーション
この実施例では、実施例2のSNPスワップHTP設計株改良プログラムの一部を例示的に実行し、目標は、Corynebacterium中でのリシンの産生の収率および生産性の改善をもたらすことである。
この実施例のセクションBは、本開示のHTP株改良プログラムの、変異を統合するステップをさらに示す。したがって、この実施例は、本開示のHTP株改良法の第1、第2および第3のラウンドの統合についての実験結果を提供する。
第2および第3のラウンドの統合のための変異は、別個の遺伝子ライブラリースワップに由来する。したがってまた、これらの結果により、HTP株プログラムの、多分枝平行トラック(multi-branch parallel tracks)を実施する能力、および本開示の種々の形態の遺伝子設計ライブラリーに伴うメタデータ中に埋め込むことができる有益な変異の「メモリー」も示される。
上記のように、提供された参照の基準参照株(株A)および第2の「操作された」株(株C)のゲノムについてシーケンシングし、遺伝子の差をすべて同定した。基準株は、UV変異誘発を経験したことがないCorynebacterium glutamicumバリアントであった。操作された株もまた、C.glutamicum株であり、これは、従来の変異改善プログラムの数ラウンド後に基準株から産生されていた。この実施例は、186個の明確に異なる非同義SNPの、株Aと株Cとの間で同定した差についてのSNPスワップの結果を提供する。
A.HTP操作およびハイスループットスクリーニング
本開示のクローニングおよび形質転換の方法に従って、186個の同定したSNPのそれぞれを個々に、基準株中に付加して戻した。単一のSNPを含む新たに創製した株をそれぞれ、リシンの収率について、産物力価での性能を評価するように設計した小規模の培養において試験した。小規模の培養は、工業規模の培養からの培地を使用して実施した。標準的な比色分析アッセイを用いて、産物力価を光学的に炭素消耗時に測定した(すなわち、単一バッチの収率を表す)。手短に述べると、濃縮アッセイ混合物を調製し、これを発酵試料に、試薬の最終濃度が、160mMのリン酸ナトリウム緩衝液、0.2mMのAmplex Red、0.2U/mLの西洋ワサビペルオキシダーゼ、および0.005U/mLのリシンオキシダーゼとなるように添加した。反応を終点まで進行させ、Tecan M1000プレート分光光度計を使用して、光学密度を560nmの波長において測定した。実験の結果を、下記の表8に要約し、図38に示す。
B.第2のラウンドのHTP操作およびハイスループットスクリーニング−SNPスワップライブラリーと選択されたPROスワップヒットとの統合
本開示のHTP方法の強みの1つは、HTP遺伝子設計ライブラリーを、宿主細胞の表現型に対する各SNP/プロモーター/ターミネーター/開始コドンの効果と関連がある情報と一緒に保存する能力である。本発明者らは先に、プロモータースワップの実験を実施したことがあり、この実験で、生合成の収率に対してプラス効果を有する、C.glutamicum中でのいくつかのzwfプロモータースワップを同定した(例えば、図22中の標的「N」についての結果を参照されたい)。
本発明者らは、実施例5から、先に同定したzwfプロモータースワップのうちの1つもまた含むように、この実施例の基準株Aを改変した。表8中の、上に記載した最初のスクリーニングから同定した上位の176個のSNPを、この新しい基準株中に再導入して、新しいSNPスワップ遺伝子設計微生物ライブラリーを創製した。これまでのステップと同様に、単一のSNPを含む新たに創製した各株も、リシンの収率について試験した。また、選択されたSNP変異体株を、上に記載した比色分析法を使用して、24時間時のリシンの産生を測定することによって、生産性のプロキシについても試験した。このステップからの結果を、下記の表9に要約し、図39に示す。
SNPスワップのこの第2のラウンドからの結果から、zwfプロモータースワップ変異を含む基準株において、基準株のリシンの収率および生産性を増加させることが可能ないくつかのSNPが同定された(例えば、図39の右手上部の隅にあるSNP084およびSNP121を参照されたい)。
C.タンク培養のバリデーション
上記のHTPのステップの間に同定した上位のSNPを含有する株を、中型の試験発酵タンク中に培養した。手短に述べると、各株の小型の100mlの培養物を、一晩成長させ、次いで、等しい播種量を有する試験発酵タンクに5リットルの培養物を播種するために使用した。播種物は、OD600の測定値に従って同じ細胞密度を含有するように基準に合わせた(normalized)。
結果として得られたタンク培養物は、培養を3日間進行させてから収集した。収率および生産性の測定値を、発酵全体を通して種々の点でタンクから採取した試料中の基質および産物の力価から計算した。試料を、特定の低分子の濃度について、高圧液体クロマトグラフィーにより、適切な標準物質を使用して分析した。この実験についての結果を、下記の表10に要約し、図40に示す。
小規模のハイスループット培養物により予測されるように、zwfプロモータースワップとSNP121との組合せを含む株についてのより大きなタンク培養物は、参照の基準株に対して、収率および生産性の有意な増加を示した。例えば、この株の生産性は、基準株の生産性、3.29g/L/時間と比較して、4.5g/L/時間に急増した(2ラウンドのSNPスワップだけで、生産性が37.0%増加した)。
(実施例4)
HTPゲノム操作−工業用微生物株を改良するための、プロモータースワップライブラリーのインプリメンテーション
これまでの実施例は、工業用株を再建するために、本開示のHTP株改良プログラムの力を実証してきた。実施例2および3は、種々の基準株、中間株および工業用株における、現存する遺伝子の多様性を探索する、SNPスワップの技法およびライブラリーのインプリメンテーションについて記載した。
この実施例は、本開示のPROスワップの技法を使用するHTP株改良プログラムの実施形態を示す。実施例3とは異なり、この実施例は、PROスワップライブラリーの生成による変異のデノボ生成のための方法を教示する。
A.プロモータースワッピングのための標的の同定
前述のように、プロモータースワッピングは、標的とするための「n個」の遺伝子のセットを選択するステップを含む、多段階ステップのプロセスである。
この実施例では、発明者らは、潜在的な経路遺伝子23個の群を同定して、本開示のプロモーターラダー法により、モジュレートした(分子リシンを産生する例示的な代謝経路における、過剰発現に対して19個の遺伝子および下方制御に対して4+個の転用遺伝子(diverting gene))(図19を参照されたい)。
B.プロモーターラダーの創製
プロモータースワップのプロセスのインプリメンテーションにおける別のステップは、「ラダー」として働く「x個」のプロモーターのセットの選択である。これらのプロモーターが複数のゲノム遺伝子座にわたって高度に変動する発現をもたらすことが示されていれば理想的であるが、それらが遺伝子の発現を何らかの様式で撹乱させることが唯一の要件である。
特定の実施形態では、目的の標的遺伝子と関連がある天然の、生来のまたは野生型のプロモーターを同定し、次いで、前記プロモーターを変異させて、複数の変異プロモーター配列を得ることによって、これらのプロモーターラダーを生み出す。これらの変異プロモーターのそれぞれは、標的遺伝子の発現に対する効果について試験される。一部の実施形態では、編集されたプロモーターは、様々な条件にわたって発現活性について試験され、その結果、各プロモーターバリアントの活性が記録され/特徴付けられ/アノテートされ、かつデータベース内に記憶される。結果として生じる編集されたプロモーターバリアントは、引き続いて組織化されて、これらの発現の強度に基づいて配列された「ラダー」にされる(例えば、頂部付近に高度発現バリアントおよび底部付近に減弱された発現を有し、したがって、用語「ラダー」をもたらす)。
例示的な本実施形態では、発明者らは、図19中の同定した標的遺伝子のそれぞれについて、プロモーターラダー:ORFの組合せを創製した。
C.ラダーからのプロモーターと標的遺伝子との関連性
プロモータースワップのプロセスのインプリメンテーションにおける別のステップは、種々の株のHTP操作であり、これらの株は、特定の標的遺伝子と関連があるプロモーターラダーからの所与のプロモーターを含む。
生来のプロモーターが標的遺伝子nの前に存在し、その配列が分かっている場合には、生来のプロモーターを、ラダー中のxプロモーターのそれぞれでの置換えを実施することができる。生来のプロモーターが存在しないかまたはその配列が分かっていない場合には、遺伝子nの前に、ラダー中のxプロモーターのそれぞれの挿入を実施することができる。このようにして、株のライブラリーを構築し、この場合、ライブラリーの各メンバーが、n標的に作動可能に連結しているxプロモーターの一例であり、は、他の点では同一の遺伝子状況である(例えば、図20を参照されたい)。
D.株のHTPスクリーニング
プロモータースワップのプロセスにおける最後のステップは、上記のライブラリーにおける株のHTPスクリーニングである。得られた株のそれぞれが、n標的に連結しているxプロモーターの一例を表し、他の点では同一の遺伝的バックグラウンドである。
発明者らは、1つまたは複数の測定基準に対するそれらの性能を特徴付けるシナリオにおいて、各株のHTPスクリーニングをインプリメントすることによって、所与の測定基準(例えば、目的の分子の産生の最適化)に関して、プロモーター/標的遺伝子のどの関連性が最も有益であるかを決定することができる。図20(プロモーターP1〜P8の、目的の遺伝子に対する効果)を参照されたい。
図19〜22に示す例示的な実施形態では、発明者らは、プロモータースワップのプロセスを利用して、リシンの産生を最適化した。上に記載したProスワップ方法の適用例を、下の実施例5に記載する。
(実施例5)
HTPゲノム操作−リシンの産生に関して、株性能を改善するためのPROスワップライブラリーのインプリメンテーション
以下のセクションは、実施例4に記載の、本開示のPROスワップHTP設計株改良プログラムツールの例示的なインプリメンテーションを示す。この実施例では、宿主細胞のリシンの収率を増加させるために、Corynebacterium株を、本開示のPROスワップ方法に供した。
A.プロモータースワップ
プロモータースワップを、実施例4の記載の通り実施した。図19中のリシン生合成経路から選択した遺伝子を、プロモーターP1〜P8を使用してプロモータースワップに対して標的化した。
B.HTP操作およびハイスループットスクリーニング
プロモータースワップのHTP操作を、実施例1および3に記載の通り実施した。結果として得られたプロモータースワップ株のHTPスクリーニングを、実施例3に記載の通り実施した。全部で145個のPROスワップを実施した。実験の結果を、下記の表11に要約し、図41に示す。
プロモータースワップライブラリーのスクリーニングの結果は、可視化すると、測定している性能の測定基準と最も密接に相関する遺伝子標的を同定するのに役立つ。この場合、遺伝子標的pgi、zwf、ppc、pck、fbpおよびddhは、プロモータースワップにより、基準株に対して、収率の大きなゲインがもたらされる遺伝子と同定された。
表11から選択した株を、上記の通り、小型のプレート中で再培養し、リシンの収率について試験した。この二次スクリーニングからの結果を、図22に示す。
(実施例6)
上位性マッピング−変異の有益な統合を予測するためのアルゴリズムツール
この実施例は、本開示のHTP株改良プログラムの一部として利用する予測モデリング技法の実施形態を記載する。本開示は、(上に記載の、遺伝子設計ライブラリーの使用による)潜在的に有益な変異の最初の同定の後の、HTP株改良の第2、第3、第4のおよびさらにそれらに続くラウンドにおける、有益な変異を統合する方法を教示する。一部の実施形態では、本開示は、変異の統合が、前記変異それぞれの個々の性能に基づき得ることを教示する。他の実施形態では、本開示は、2つまたはそれ超の変異が、単一の宿主細胞中に統合する場合に、相加効果または相乗効果を示す可能性を予測するための方法を教示する。下記の実施例は、本開示の予測ツールの実施形態を示す。
実施例3および5のSNPスワップライブラリーおよびプロモータースワッピング(PROスワップ)ライブラリーから選択した変異を分析して、宿主の株性能の改善をもたらす可能性が最も高いSNP/PROスワップの組合せを同定した。
本開示の「上位性マッピング」のセクションの記載の通り、SNPスワップライブラリーの配列を、コサイン類似性マトリックスを使用して相互に比較した。分析の結果から、各SNP/PROスワップの組合せについて、機能類似性スコアを得た。すべてのSNP/PROスワップの間の機能類似性の視覚的表現を、図15にヒートマップに示す。また、結果として得られた、機能類似性スコアを使用して、それぞれのSNP/PROスワップ間の類似性の距離を示す樹状図も展開した(図16A)。
同じまたは類似の機能群(すなわち、高い機能類似性を有するSNP/PROスワップ)からの変異は、同じ機構により働く可能性が高く、したがって、組み合わせた場合に、全般的な宿主の性能に対して、負または中立の上位性を示す可能性が高い。対照的に、異なる機能群からの変異は、独立の機構により働く可能性がより高く、したがって、宿主の性能に対して、有益な相加的またはコンビナトリアルな効果をもたらす可能性が高い。
上位性に対する生物学的経路の効果を示すために、多様な機能類似性を示すSNPスワップとPROスワップとを組み合わせ、宿主株において試験した。実施例1の記載の通り、SNP/PROスワップの3つの組合せ:i)Pcg0007::zwfのPROスワップ+Pcg1860::pycのPROスワップ、ii)Pcg0007::zwfのPROスワップ+SNP309、およびiv)Pcg0007::zwfのPROスワップ+Pcg0007::lysAのPROスワップを、Corynebacterium
glutamicumのゲノム中に操作した(機能類似性の関係については、図15および図16Aを参照されたい)。
SNP/PROスワップの組合せを含有するそれぞれの宿主細胞の性能を、実施例3の記載の通り試験し、zwfのPROスワップのみを含有する対照の宿主細胞の性能と比較した。下記の表12および13に、それぞれの株について、宿主細胞の収率(96時間における測定)および生産性(24時間における測定)の結果を要約する。
各SNP/PROスワップの組合せについての宿主の収率による性能の結果はまた、図16Bにも示す。24時間時の測定および96時間時の測定の両方で、より低い機能類似性を示すSNP/PROスワップを組み合わせた宿主株が、組み合わせたSNPがより高い機能類似性を示す株より性能が優れていた。
したがって、上位性マッピングの手順は、設計した遺伝子変化の有効なおよび/またはプラスの統合について予測/プログラミング/情報提供を行うのに有用である。上位性マッピングの手順による分析的洞察から、微生物株の開発のその後のラウンドを導くことができる予測規則のセットの創製が可能になる。上位性ライブラリーから得られる予測のための洞察は、微生物のタイプおよび標的分子のタイプにわたって使用することができる。
(実施例7)
HTPゲノム操作−Proスワップ変異の統合および多因子のコンビナトリアル試験
これまで実施例は、少数の事前選択したPROスワップ変異とSNPスワップライブラリーとを統合するための方法を示してきた(実施例3)。他の実施例は、相加的または相乗的に有益な宿主細胞の特性をもたらす可能性が最も高い変異の統合を選択するための上位性による方法を示してきた(実施例6)。この実施例は、本開示のHTP方法により、複数の遺伝子/遺伝子設計ライブラリーの組合せ(例えば、PROスワップライブラリー×SNPライブラリー、またはPROスワップライブラリー内の組合せ)のコンビナトリアルな統合により創製される大きな解空間を有効に探索することが可能になることを示す。
本開示のHTP株改良法のこの例示的な適用例では、実施例5で宿主の性能に対してプラス効果を有することが同定されているプロモータースワップを元々のPROスワップライブラリーと二次の組合せで統合する。PROスワップ変異を統合する決定は、収率または生産性に対するそれぞれの変異の全般的な効果、および2つの変異の組合せが相加的または相乗的な効果をもたらす可能性に基づいた。
例えば、出願人らは、実施例6の上位性マッピングの結果に基づいて、Pcg0007::zwfおよびPcg0007::lysAの組み合わせを選択したことについて言及する。
A.PROスワップ株操作のための統合のラウンド
先の実施例1の記載の通り、株を形質転換した。手短に述べると、所望のPROスワップ変異を1つすでに含有する株をもう一度、第2の所望のPROスワップ変異を用いて形質転換した。全部で145個の、実施例5からの試験済のPROスワップを、53個の第2のラウンドの統合株へと統合して、それらはそれぞれ、有益な相加効果または相乗効果を示すことが期待される2つのPROスワップ変異を含んだ。
結果として得られた第2のラウンドの株を、実施例3の記載の通りもう一度スクリーニングした。この実験からの結果を、下記の表14に要約し、図11に示す。
上位性モデルにより予測されたように、Pcg0007::zwf変異およびPcg0007::lysA変異を含む、第2のラウンドのPROスワップ株は、最高の収率改善のうちの1つを示し、収率を、Pcg0007::lysA単独に対してほぼ30%改善し、基準株に対して35.5%改善した(図11上の円で囲んだデータ点を参照されたい)。
単一の変異および統合した二重の変異の解空間を探索するためのHTP方法はまた、第3、第4およびその後の変異の統合にも適用することができる。また、例えば、開示する、zwf、pycおよびlysaに対応する3つの変化の統合株にも注目されたい;この株は、上記の表14に示す2つの変化の統合において同定した上位のヒットの中から作製し、これらのヒットは、本開示の上位性による方法によって同定されたものである。この3つの変化の統合株について、タンク中で妥当性をさらにバリデートしたところ、親、または親+zwfと比較して有意に改善されていた(上記の表10および図40を参照されたい)。
(実施例8)
HTPゲノム操作−工業用宿主株を改善するための、ターミネーターライブラリーのインプリメンテーション
本実施例では、本開示のHTP方法を、STOPスワップを含む追加のHTP遺伝子設計ライブラリーに適用する。実施例は、本開示によれば、(例えば、PROスワップ、SNPスワップ、STOPスワップ等の)基本の遺伝子設計ライブラリーからのエレメントを組み合わせて、より複雑な遺伝子設計ライブラリー(例えば、プロモーターおよびターミネーターの両方が組み入れられているPRO−STOPのスワップライブラリー)を生み出すことができることをさらに示す。本開示は、一部の実施形態では、これまでに開示した遺伝子設計ライブラリーのうちのいずれかの組合せから得られるライブラリーを含めた、一切の可能な遺伝子設計ライブラリーを教示する。
この実施例では、小規模の実験を実施して、遺伝子の発現に対する本発明のSTOPスワップ方法の効果を実証した。下に記載するように、本開示のターミネーターT1〜T8と、Corynebacterium glutamicumの2つの生来のプロモーターのうちの1つとの対を形成し、蛍光タンパク質の発現に影響を及ぼすそれらの能力について分析した。
A.DNA構築物のアセンブリー
ターミネーターT1〜T8とCorynebacterium glutamicumの2つの生来のプロモーターのうちの1つ(例えば、Pcg0007またはPcg0047)との、黄色蛍光タンパク質(YFP)を発現する対を形成した。DNAの増幅およびアセンブリーを促進するために、プロモーター−YFP−ターミネーターの最終の配列を、2つの部分に分けて合成した。第1の部分は、(5’から3’へ)i)ベクターのホモロジーアーム、ii)選択されたプロモーター、およびiii)YFP遺伝子の2/3をコードした。第2の部分は、(5’から3’へ)iv)YFP遺伝子の次の2/3、v)選択されたターミネーター、およびvi)第2の、ベクターのホモロジーアームをコードした。各部分を、合成オリゴヌクレオチドを使用して増幅し、ゲル上で精製した。酵母相同組換えを使用して、ゲル上で精製したアンプリコンをベクターの骨格とアセンブルした。
B.E.coli中へのアセンブルされたクローンの形質転換
正確にアセンブルされたクローンを同定し、Corynebacteriumの形質転換のためのベクターDNAを増幅するために、プロモーター−YFP−ターミネーターの配列を含有するベクターのそれぞれを個々に、E.coli中へ形質転換した。正確にアセンブルされたベクターを、制限酵素消化およびサンガーシーケンシングにより確認した。陽性クローンを、後に使用するために−20℃で保存した。
C.Corynebacterium中へのアセンブルされたクローンの形質転換
Corynebacterium glutamicum宿主細胞中へ、ベクターの検証したクローンを個々に、電気穿孔により形質転換した。各ベクターを、異種の黄色蛍光タンパク質の発現を可能にするが、宿主細胞にとって有害にならないように経験的に決定されたCorynebacterium glutamicumゲノム内の中立の組込み部位に組み込まれるように設計した。組込みを促進するために、発現ベクターは、所望の組込み部位に相同な約2kbpの配列(すなわち、ホモロジーアーム)をさらに含み、それによって、上に記載した各遺伝子カセットが、ホモロジーアーム(homology am)の下流に挿入された。ゲノム中への組込みは、シングルクロスオーバーによる組込みにより行った。次いで、形質転換したCorynebacteriumを、正確な組込みについてPCRにより試験した。各遺伝子構築物について実施した形質転換のそれぞれについて、このプロセスを繰り返した。
D.Corynebacterium中の個々のターミネーター構築物の評価
次いで、プロモーター−YFP−ターミネーターの構築物を含有する各Corynebacterium形質転換体の表現型を、発現を評価するために、培地の2つのタイプ(ブレインハートインフュージョン−BHI培地およびHTP試験培地)中で、2つの時点において試験した。手短に述べると、PCRにより確認した形質転換体4〜6つを選び、96ウェルフォーマット中の選択培地中で培養した。次いで、最初の培養物を、選択BHI培地または選択種培地中に分割した。48時間時に、種培地中の培養物を、選択HTP試験培地またはBHI培地中に播種し、2つの時点において分析し、これらの時点は、成長曲線の異なる部分を表した。HTP試験培地の培養物の場合の時点は、播種してから48および96時間後であった。選択BHI培地中の培養物は、播種してから48および72時間後に分析した。
培養物の分析は、ベンチトップ型フローサイトメーターを使用して実施した。手短に述べると、培養物を、200μlのリン酸緩衝食塩水(PBS)中に1:100で希釈した。各培養物に関して、3000〜5000個の個別事象(すなわち、細胞)の間で、黄色の蛍光について分析した。ベンチトップ型フローサイトメーターが、各「事象」の黄色の蛍光のヒストグラムをプロットし、各ウェル内の蛍光の中央値を計算する。図36は、(4〜6つの生物学的複製物にわたる)各構築物についての蛍光の中央値の平均を示す。エラーバーは、各データ点の95%信頼区間を示す。条件A〜Dはそれぞれ、単一の培地および単一の時点を指す。したがって、条件Aおよび条件Bは、BHI培地についての2つの時点を表し、一方、C点およびD点は、HTP試験培地についての2つの時点を表す。任意単位(例えば、AU)は、ベンチトップ型フローサイトメーターが記録した蛍光の中央値を表すことに留意されたい。
結果から、STOPスワップ遺伝子設計ライブラリーのターミネーター1〜8は、YFP発現を連続的な範囲でもたらすことが示されている。したがって、これらのターミネーターにより、ターミネーターラダーが形成され、このラダーは、本開示のHTP方法に従って、後の遺伝子設計ライブラリー中にインプリメントすることができる。
(実施例9)
HTPツールセットと従来のUV変異との比較
この実施例は、本開示のHTP遺伝子設計ライブラリーが、従来の変異による株改良プログラムよりも有益であることを実証する。本明細書のこの部分における実験では、本開示のHTP方法によりなしとげる表現型の改善について、改善の大きさおよびスピードを、従来のUV変異誘発に対して定量する。
本開示は、宿主細胞の株改良プログラムを加速させるための新しい方法を教示する。一部の実施形態では、本開示のHTP株改良プログラムは、遺伝子の撹乱を生成し、同定するHTPツールセットの能力に依存する。本発明者らは、本開示のプロモータースワップ技法と従来のUV変異アプローチとを比較する小型の平行追跡型の株改良プログラムを実施することによって、HTPツールセットの利益を定量することを試みた。
UVおよびプロモータースワップの両方による遺伝子の撹乱についての出発点として、目的の生化学的代謝産物を産生する参照基準株を選んだ。
A.UV変異
基準株の培養物を、10のOD600に基準に合わせたODである培養物においてBHI培地中で成長させた。この培養物を、無菌のペトリ皿中にアリコートし、小型の磁気撹拌棒を使用してかき混ぜた。次いで、254nmの波長のUVトランスイルミネーターを、UV曝露の5および9分時に培養物上で反転させ、一定分量を採取した。これらの試料を10倍段階希釈して、各希釈物を、BHI培地のQ−tray上に蒔いた。自動化コロニーピッキング機器を使用して、これらのQ−trayから、各UV曝露点からのコロニーをおよそ2500個選び取り、下記の通り性能を評価した。
B.プロモータースワップ
15個の遺伝子標的について、基準株中に、PROスワップ構築物を、表1に記載したP1、P3、P4およびP8から選択されるプロモーターの全部またはサブセットのいずれかを使用して生成した。目的の産物の生合成における最後のステップは、律速補助因子の可能性があるS−アデノシルメチオニンを利用するO−メチルトランスフェラーゼ酵素によって触媒される。したがって、PROスワップのための遺伝子標的は、それらがこの補助因子または上流の代謝産物の生合成に直接関与するということに基づいて選択された。
C.UVおよびプロモータースワップライブラリーの評価
この実施例のために開発した各Corynebacterium株の表現型を、選択された生体分子を産生するその能力について試験した。手短に述べると、各PROスワップ株からの、配列が確認されたコロニー4〜6つ、および各UV株についての単一のコロニーを選び、液体産生培地中、96ウェルフォーマット中の選択培地中で増殖した。
96ウェルマイクロウェルプレート中でバイオマスを増殖させた後に、細胞塊を、96ウェルマイクロウェルプレート中の基質を含有する発酵培地に添加し、生物変換を24時間進行させた。各株について、24時間時に採取した試料から、産物の力価を、高速液体クロマトグラフィーを使用して決定した。各遺伝子の撹乱(UVおよびPROスワップ)についての力価の結果を分析した。各複製物についての結果を平均し、前記株の全般的な性能を表すために割り当てた。次いで、基準株の収率に対する比として表現する、測定した収率に対する各変異の効果に基づいて、株をカテゴリーに分けた。
図37に、この実験の結果を要約し、i)収率を変化させなかった、ii)1.2〜1.4倍の収率の改善をもたらした、iii)1.4〜1.6倍の収率の改善をもたらした、iv)1.6〜1.8倍の収率の改善をもたらした、またはv)1.8〜2倍の収率の改善をもたらした各株改良の技法について、株の数を提示する。
結果は、本開示のHTPツールセットは、従来のUV変異誘発アプローチに対して有益であることを示している。例えば、PROスワップ株は、収率のプラスの変化をより高い率で示し、したがって、株を有意に改良することができる変異を提供する可能性がより高かったことを、図37の結果は実証している。最も特筆すべきは、PROスワップライブラリーにおいては、1.6、1.8および2倍の増加を示す優れた改良株の発生率が高く、UVライブラリーにおいては、改善がほとんど〜全く同定されなかったことである。
また、結果により、本開示のPROスワップ方法の加速された改善速度が強調されることからも、結果は重要である。実際に、PROスワップライブラリーについての結果は、100個未満の、プロモーター::遺伝子の撹乱に基づき、一方、UV変異の結果は、4,000個超の明確に異なる変異体株のスクリーニングを含んだ。したがって、本開示の方法は、性能における大きなゲインを株に付与することが可能な遺伝子の撹乱を同定する前にスクリーニングしなければならない変異体の数を劇的に低下させる。
(実施例10)
真核生物におけるHTP操作法の適用
これまでの実施例は、原核細胞に対するHTP株改良プログラムの適用を示している。この実施例は、同じ技法を真核細胞に適用できることを実証する。具体的には、実施例10および11は、クエン酸の工業生産用のAspergillus nigerのためのSNPスワップ株改良プログラムについて記載する。
A.Aspergillus nigerのプロトプラストの形成および形質転換
真核生物の真菌株Aspergillus niger、ATCC1015のプロトプラストの大きな体積(500ml)を、ベータ−グルカナーゼ活性を含有する市販の酵素混合物を使用して生成した。プロトプラストを、酵素混合物から遠心分離により単離し、最終的に、塩化カルシウムを含有する緩衝液中に再懸濁させた。
ジメチルスルホキシドおよびポリエチレングリコール(PEG)の懸濁液を含有する容器中に、プロトプラストをアリコートし、−80℃で凍結した。一部の実施形態では、本開示は、各ウェル中に、25〜50マイクロリットルのプロトプラストを含有する96ウェルマイクロタイタープレートのストックを、この技法を使用するゲノム編集の大規模なキャンペーンのための大きなバッチ中で調製し、凍結することができることを教示する。
従来のPEGカルシウム媒介型形質転換を、96ウェル中でDNAとプロトプラスト−PEGの混合物とを組み合わせる自動化された液体ハンドラーにより実施した。形質転換の後に、液体を取り扱う追加の自動化されたステップを使用して、選択培地上に形質転換体(transformation)を蒔いた。
B.形質転換体の自動化されたスクリーニング
下記でより詳細に論じるように、A.niger細胞は、機能性のpyrG遺伝子により形質転換されていた;このことにより、形質転換された細胞は、ウラシルの非存在下で成長することが可能であった。この実施例のpyrG遺伝子を、さらに設計して、A.nigerの野生型aygA遺伝子の場所に組み入れ、したがって、天然に存在するaygA遺伝子中に、変異を組み入れた。さらに、aygA遺伝子の破壊により、胞子の色が黄色になり、このことから、形質転換体を同定するための二次スクリーニングの方法も提供される。
ウラシルを有さない選択培地上で成長させた形質転換体を単離し、第2のマイクロタイタープレートの個々のウェル中に入れた。第2のマイクロタイタープレート中の形質転換体を2〜3日間成長および胞子形成させた後、水および少量の洗剤からなる液体中に再懸濁させて、保存および下流の自動化されたスクリーニングに適切な胞子のストックを生成した。
次いで、上記の胞子のストックのそれぞれの少量の一定分量を使用して、第3の96ウェルPCRプレート中の液体培地に播種した。これら少量の培養物を、据置型インキュベーター中で一晩成長させ、その結果、黄色色素を含有する胞子が出芽し、選択および下流のステップにより適している菌糸を形成する。
培養するステップの後に、第3のPCRプレートの菌糸を、市販の緩衝液を添加し、培養物を99℃に20分間加熱することによって溶解した。次いで、プレートを遠心分離して、DNA懸濁液の上清を細胞/オルガネラのペレットから分離した。次いで、DNA抽出物を使用して、PCR分析を行って、所望のDNA改変を含む細胞株を同定した。
C.SNPの組込みのための共形質転換−SNPの設計
Aspergillus niger遺伝子aygAのDNA配列を得、適切なリーディングフレームを決定した。4つの明確に異なるタイプの変異を設計し、これらは、組み込まれた場合には、ヌル変異という結果になった。
変異は、停止コドンをインフレームに組み入れている単一の塩基対の変化;小さな、2つの塩基対の欠失:3つの塩基対の組込み;およびより大きな、100個の塩基対の欠失を含んだ;これらはいずれも、適切に組み込まれた場合には、aygA活性を排除する。aygA活性を欠く株は、黄色胞子の表現型を有する。設計を、ギブソンアセンブリーを使用して構築物を構築するために使用したオリゴマーのセットを予測したin silicoの構築物として生成した。
D.共形質転換による、SNPの組込み
上に記載した形質転換のアプローチを使用して、小さな変化を含有するアンプリコンを、Aspergillus niger株1015のゲノム中に組み入れた。これまでに論じたように、Aspergillus nigerのこの株は、非機能性のpyrG遺伝子を含み、したがって、外因性ウラシルの非存在下で成長することは不可能であった。pyrG遺伝子の組込みに成功している細胞は、この時点では、ウラシルの非存在下で成長することが可能であった。これらのpyrG+形質転換体のうち、aygA遺伝子中に小さな変異もまた組み込んだ分離株は、黄色胞子の表現型を示した。(図43A)。変異の存在はまた、SNPの交換について標的化される領域を含有する小さなアンプリコンのシーケンシングによっても検出される(図43B)。
(実施例11)
HTPゲノム操作−真核生物Aspergillus niger ATCC11414においてクエン酸の産生を改善するための、HTP SNPライブラリー株改良プログラムのインプリメンテーション
上記の実施例10は、本開示の遺伝子操作技法をハイスループットの様式で自動化するための技法について記載した。この実施例は、上に記載した技法を、Aspergillus niger株ATCC11414の特定のHTP株改良に適用する。
Aspergillus nigerは、発酵によるクエン酸の大規模産生のために使用される、糸状菌の種である。この種の複数の株は、単離され、クエン酸および他の有機酸を産生する種々の能力を有することが示されている。クエン酸の産生を改善するために、本開示のHTP株操作法を使用して、原因となる対立遺伝子を組み合わせ、有害な対立遺伝子を排除することができる。
A.天然のA.niger株バリアントに由来するSNPについての遺伝子設計ライブラリーのライブラリーの同定
20世紀前半に、A.niger株ATCC1015は、クエン酸の産生体であることが同定された。後に、ATCC11414と名付けられた、この株の分離株は、その親に対して、クエン酸の収率の増加を示すことが見出された。例えば、A.niger株ATCC1015は、硝酸アンモニウムを含有するが、鉄カチオンおよびマンガンカチオンの両方を欠く培地中で、140グラムのグルコースから平均して7グラムのクエン酸を産生する。他方、分離株ATCC11414は、同じ条件下で、収率の10倍の増加を示す(70グラムのクエン酸)。さらに、クエン酸産生培地中で、株ATCC11414の胞子は、株1015の胞子よりも良好に出芽および成長する。
表現型のこれらの差について潜在的な遺伝子源を同定するために、株ATCC1015および株ATCC11414の両方のゲノムについて、シーケンシングおよび分析した。結果として得られた分析から、株1015と株11414とを区別する42個のSNPを同定した。
B.原因となる対立遺伝子の交換
形質転換のために、プロトプラストを株ATCC1015(「基準株」)から調製した。次いで、本開示の遺伝子編集の技法(「ウェーブアップ」、図44A)により、上記で同定した42個のSNPのそれぞれを、基準株中に個々に導入した。各SNPを、上に記載した機能性のpyrGおよびaygA遺伝子変異と共に共形質転換した。aygA遺伝子座への遺伝子の標的化に成功した形質転換体は、黄色の胞子をもたらした(図44B)。
C.成功した組込みについてのスクリーニング
上述の通り、推定SNPを含有する形質転換体を単離し、胞子のストックを増殖させた。推定SNPを含有するDNA領域を含有するアンプリコンを、次世代シーケンシングにより分析した。このアプローチを使用すれば、親DNAの存在下であっても、各形質転換体内で、成功した組込みの事象を決定することが可能である。こうすることが可能であることは、同じ細胞中に異なる遺伝子型を有する核を含有する異核共存体として成長することができる真菌中で標的化を決定するのに必須である。
所望のSNP変化の存在について、形質転換体をさらにバリデートした。分離株のおよそ30%において、黄色胞子の表現型を有する共形質転換体はまた、クエン酸SNPの適切な組込みも含有した(図45および46)。
クエン酸の産生に有益なSNPを同定するために、創製したSNPスワップ微生物株ライブラリーを表現型によりスクリーニングすることを本発明者らは期待している。本発明者らは、本明細書に記載するゲノム操作のHTP方法の状況でこの情報を利用して、クエン酸の産生が増加するA.niger株を得る。
本発明のさらなる実施形態
本開示が企図する他の主題を、以下の番号を付けた実施形態において示す。
1.
所望の表現型を獲得するために微生物を進化させるゲノム操作のハイスループット(HTP)方法であって、
a.同じ微生物株バックグラウンドを有する最初の複数の微生物のゲノムを撹乱することによって、ユニークな遺伝的バリエーションを有する個々の微生物株を含む最初のHTP遺伝子設計微生物株ライブラリーを生み出すステップと;
b.該所望の表現型について該最初のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
c.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のHTP遺伝子設計微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
d.該所望の表現型について該後続のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
e.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップc)〜d)を1回または複数回繰り返すステップであって、各後続の反復により、先行するHTP遺伝子設計微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいHTP遺伝子設計微生物株ライブラリーが創製される、ステップと
を含む、ゲノム操作のHTP方法。
2.
前記最初のHTP遺伝子設計微生物株ライブラリーが、プロモータースワップ微生物株ライブラリー、SNPスワップ微生物株ライブラリー、開始/停止コドン微生物株ライブラリー、最適化配列微生物株ライブラリー、ターミネータースワップ微生物株ライブラリー、およびこれらの任意の組合せからなる群から選択される少なくとも1つを含む、実施形態1に記載のゲノム操作のHTP方法。
3.
前記後続のHTP遺伝子設計微生物株ライブラリーが、前記最初のHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーである、実施形態1〜2のいずれか1つに記載のゲノム操作のHTP方法。
4.
前記後続のHTP遺伝子設計微生物株ライブラリーが、前記最初のHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーのサブセットである、実施形態1〜2のいずれか1つに記載のゲノム操作のHTP方法。
5.
前記後続のHTP遺伝子設計微生物株ライブラリーが、先行するHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーである、実施形態1〜2のいずれか1つに記載のゲノム操作のHTP方法。
6.
前記後続のHTP遺伝子設計微生物株ライブラリーが、先行するHTP遺伝子設計微生物株ライブラリーの完全コンビナトリアル微生物株ライブラリーのサブセットである、実施形態1〜5のいずれか1つに記載のゲノム操作のHTP方法。
7.
前記ゲノムを撹乱するステップが、ランダム変異誘発、標的とした配列挿入、標的とした配列欠失、標的とした配列置き換え、およびこれらの任意の組合せからなる群から選択される少なくとも1つの方法を利用することを含む、実施形態1〜5のいずれか1つに記載のゲノム操作のHTP方法。
8.
前記最初の複数の微生物が、工業生産株微生物に由来するユニークな遺伝的バリエーションを含む、実施形態1〜6のいずれか1つに記載のゲノム操作のHTP方法。
9.
前記最初の複数の微生物が、SGenで表される工業生産株微生物、およびSGenで表されるこれらに由来する任意の数の後続の微生物世代を含む、実施形態1〜6のいずれか1つに記載のゲノム操作のHTP方法。
10.
SNPスワップ微生物株ライブラリーを生成するための方法であって、
a.参照微生物株および第2の微生物株を提供するステップであって、該第2の微生物株は、該参照微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該参照微生物株または該第2の微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該参照微生物株と該第2の微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと
を含む、方法。
11.
前記参照微生物株のゲノムが撹乱されて、前記第2の微生物株内に見出される前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が付加される、実施形態10に記載のSNPスワップ微生物株ライブラリーを生成するための方法。
12.
前記第2の微生物株のゲノムが撹乱されて、前記参照微生物株内に見出されない前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が除去される、実施形態10に記載のSNPスワップ微生物株ライブラリーを生成するための方法。
13.
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、前記参照微生物株と前記第2の微生物株との間のすべての前記同定された遺伝的バリエーションの完全コンビナトリアルライブラリーを構成する、実施形態10〜12のいずれか1つに記載のSNPスワップ微生物株ライブラリーを生成するための方法。
14.
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、前記参照微生物株と前記第2の微生物株との間のすべての前記同定された遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、実施形態10〜12のいずれか1つに記載のSNPスワップ微生物株ライブラリーを生成するための方法。
15.
工業用微生物株の表現型性能を再建および改善するための方法であって、
a.親系統微生物株およびそれに由来する工業用微生物株を提供するステップであって
、該工業用微生物株は、該親系統微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該親系統微生物株または該工業用微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該親系統微生物株と該工業用微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと;
c.参照微生物株に対する表現型性能改善について該最初のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該個々の微生物株に表現型性能改善をもたらすユニークな遺伝的バリエーションを同定するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のSNPスワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該参照微生物株に対する表現型性能改善について該後続のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に追加の表現型性能改善をもたらす遺伝的バリエーションのユニークな組合せを同定するステップと;
f.微生物株が、該工業用微生物株の表現型性能と比較して、所望のレベルの表現型性能の改善を呈するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するSNPスワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいSNPスワップ微生物株ライブラリーが創製される、ステップと
を含む、方法。
15.1.
同定された遺伝的バリエーションが、プロモータースワップライブラリー由来の人工プロモータースワップ遺伝的バリエーションをさらに含む、実施形態15に記載の工業用微生物株の表現型性能を再建または改善するための方法。
16.
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、参照微生物株と第2の微生物株との間のすべての同定された遺伝的バリエーションの完全コンビナトリアルライブラリーを構成する、実施形態15〜15.1のいずれか1つに記載の工業用微生物株の表現型性能を再建または改善するための方法。
17.
結果として生じるユニークな遺伝的バリエーションを有する複数の個々の微生物株が、一緒に、前記参照微生物株と前記第2の微生物株との間のすべての前記同定された遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、実施形態15〜15.1のいずれか1つに記載の工業用微生物株の表現型性能を再建および改善するための方法。
18.
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップでスクリーニングされた前記個々の微生物株に存在するすべての前記遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、実施形態15〜17のいずれか1つに記載の工業用微生物株の表現型性能を再建および改善するための方法。
19.
前記親系統微生物株のゲノムが撹乱されて、前記工業用微生物株内に見出される前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が付加される、実施形態15〜18のいずれか1つに記載の工業用微生物株の表現型性能を再建および改善するための方法。
20.
前記工業用微生物株のゲノムが撹乱されて、前記親系統微生物株内に見出されない前記同定された一塩基多型、DNA挿入、またはDNA欠失の1つまたは複数が除去される、実施形態15〜18のいずれか1つに記載の工業用微生物株の表現型性能を再建および改善するための方法。
21.
プロモータースワップ微生物株ライブラリーを生成するための方法であって、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと
を含む、方法。
22.
所望の表現型を獲得するために微生物を進化させるゲノム操作のプロモータースワップ方法であって、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと;
c.該所望の表現型について該最初のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するプロモータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいプロモータースワップ微生物株ライブラリーが創製される、ステップと
を含む、方法。
23.
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップでスクリーニングされた前記個々の微生物株に存在するすべての前記遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、実施形態22に記載の所望の表現型を獲得するために微生物を進化させるゲノム操作のプロモータースワップ方法。
23.1.
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップにおいてスクリーニングされた個々の微生物株中に存在するすべての遺伝的バリエーションの完全コンビナトリアルライブラリーを構成する、実施形態22に記載の所望の表現型を獲得するために微生物を進化させるゲノム操作のプロモータースワップ方法。
24.
ターミネータースワップ微生物株ライブラリーを生成するための方法であって、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと
を含む、方法。
25.
所望の表現型を獲得するために微生物を進化させるゲノム操作のターミネータースワップ方法であって、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと;
c.該所望の表現型について該最初のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するターミネータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいターミネータースワップ微生物株ライブラリーが創製される、
ステップと
を含む、方法。
26.
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップでスクリーニングされた前記個々の微生物株に存在するすべての前記遺伝的バリエーションの完全コンビナトリアルライブラリーのサブセットを構成する、実施形態25に記載の所望の表現型を獲得するために微生物を進化させるゲノム操作のターミネータースワップ方法。
26.1.
結果として生じる遺伝的バリエーションのユニークな組合せを有する後続の複数の個々の微生物株が、一緒に、先行するステップにおいてスクリーニングされた個々の微生物株に存在するすべての遺伝的バリエーションの完全コンビナトリアルライブラリーを構成する、実施形態25に記載の所望の表現型を獲得するために微生物を進化させるゲノム操作のターミネータースワップ方法。
27.
所望の表現型を獲得するために微生物を進化させるためのハイスループット(HTP)ゲノム操作システムであって、
1つまたは複数のプロセッサー、および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.同じ微生物株バックグラウンドを有する最初の複数の微生物のゲノムを撹乱することによって、ユニークな遺伝的バリエーションを有する個々の微生物株を含む最初のHTP遺伝子設計微生物株ライブラリーを生み出すステップと;
b.該所望の表現型について該最初のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
c.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のHTP遺伝子設計微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
d.該所望の表現型について該後続のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
e.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップc)〜d)を1回または複数回繰り返すステップであって、各後続の反復により、先行するHTP遺伝子設計微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいHTP遺伝子設計微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
28.
所望の表現型を獲得するために微生物を進化させるための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.同じ微生物株バックグラウンドを有する最初の複数の微生物のゲノムを撹乱することによって、ユニークな遺伝的バリエーションを有する個々の微生物株を含む最初のHTP遺伝子設計微生物株ライブラリーを生み出すステップと;
b.該所望の表現型について該最初のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
c.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のHTP遺伝子設計微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
d.該所望の表現型について該後続のHTP遺伝子設計微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
e.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップc)〜d)を1回または複数回繰り返すステップであって、各後続の反復により、先行するHTP遺伝子設計微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいHTP遺伝子設計微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
29.
SNPスワップ微生物株ライブラリーを生成するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.参照微生物株および第2の微生物株を提供するステップであって、該第2の微生物株は、該参照微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該参照微生物株または該第2の微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該参照微生物株と該第2の微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
30.
SNPスワップ微生物株ライブラリーを生成するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.参照微生物株および第2の微生物株を提供するステップであって、該第2の微生物株は、該参照微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該参照微生物株または該第2の微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該参照微生物株と該第2の微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと
をさせる、非一時的コンピューター可読媒体。
31.
工業用微生物株の表現型性能を再建および改善するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.親系統微生物株およびそれに由来する工業用微生物株を提供するステップであって、該工業用微生物株は、該親系統微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該親系統微生物株または該工業用微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該親系統微生物株と該工業用微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと;
c.参照微生物株に対する表現型性能改善について該最初のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に表現型性能改善をもたらすユニークな遺伝的バリエーションを同定するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のSNPスワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該参照微生物株に対する表現型性能改善について該後続のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に追加の表現型性能改善をもたらす遺伝的バリエーションのユニークな組合せを同定するステップと;
f.微生物株が、該工業用微生物株の表現型性能と比較して、所望のレベルの表現型性能の改善を呈するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するSNPスワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいSNPスワップ微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
32.
工業用微生物株の表現型性能を再建および改善するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.親系統微生物株およびそれに由来する工業用微生物株を提供するステップであって、該工業用微生物株は、該親系統微生物株内に存在しない一塩基多型、DNA挿入、およびDNA欠失から選択される複数の同定された遺伝的バリエーションを含む、ステップと;
b.該親系統微生物株または該工業用微生物株のいずれかのゲノムを撹乱することによって、複数の個々の微生物株を含む最初のSNPスワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該親系統微生物株と該工業用微生物株との間の該複数の同定された遺伝的バリエーションから選択される単一の遺伝的バリエーションに対応する、ステップと;
c.参照微生物株に対する表現型性能改善について該最初のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に表現型性能改善をもたらすユニークな遺伝的バリエーションを同定するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のSNPスワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該参照微生物株に対する表現型性能改善について該後続のSNPスワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択することによって、該微生物株に追加の表現型性能改善をもたらす遺伝的バリエーションのユニークな組合せを同定するステップと;
f.微生物株が、該工業用微生物株の表現型性能と比較して、所望のレベルの表現型性能の改善を呈するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するSNPスワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいSNPスワップ微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
33.
プロモータースワップ微生物株ライブラリーを生成するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
34.
プロモータースワップ微生物株ライブラリーを生成するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと
をさせる、非一時的コンピューター可読媒体。
35.
所望の表現型を獲得するためにプロモータースワッピングによって微生物を進化させるゲノム操作システムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと;
c.該所望の表現型について該最初のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するプロモータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいプロモータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
36.
所望の表現型を獲得するためにプロモータースワッピングによって微生物を進化させるための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびプロモーターラダーを提供するステップであって、該プロモーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のプロモーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該基準微生物株に内在する該標的遺伝子の1つに作動可能に連結した該プロモーターラダー由来のプロモーターの1つまたは複数を含む、ステップと;
c.該所望の表現型について該最初のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のプロモータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のプロモータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するプロモータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいプロモータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
37.
ターミネータースワップ微生物株ライブラリーを生成するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
38.
ターミネータースワップ微生物株ライブラリーを生成するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと
をさせる、非一時的コンピューター可読媒体。
39.
所望の表現型を獲得するために微生物をターミネータースワッピングによって進化させるゲノム操作システムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと;
c.該所望の表現型について該最初のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するターミネータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいターミネータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
40.
所望の表現型を獲得するために微生物をターミネータースワッピングによって進化させるための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.基準微生物株に内在する複数の標的遺伝子、およびターミネーターラダーを提供するステップであって、該ターミネーターラダーは、該基準微生物株において異なる発現プロファイルを呈する複数のターミネーターを含む、ステップと;
b.該基準微生物株のゲノムを操作することによって、複数の個々の微生物株を含む最初のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該複数の個々の微生物株の各株内にユニークな遺伝的バリエーションが見出され、該ユニークな遺伝的バリエーションのそれぞれは、該ターミネーターラダー由来のターミネーターの1つまたは複数に作動可能に連結した該基準微生物株に内在する該標的遺伝子の1つを含む、ステップと;
c.該所望の表現型について該最初のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
d.それぞれが遺伝的バリエーションのユニークな組合せを含む後続の複数の微生物を提供することによって、後続のターミネータースワップ微生物株ライブラリーを生み出すステップであって、該遺伝的バリエーションは、先行するステップにおいてスクリーニングされた少なくとも2つの個々の微生物株に存在する遺伝的バリエーションから選択される、ステップと;
e.該所望の表現型について該後続のターミネータースワップ微生物株ライブラリーの個々の微生物株をスクリーニングおよび選択するステップと;
f.微生物が該所望の表現型を獲得するまで、線形または非線形様式でステップd)〜e)を1回または複数回繰り返すステップであって、各後続の反復により、先行するターミネータースワップ微生物株ライブラリーの少なくとも2つの個々の微生物株の中から選択される遺伝的バリエーションの組合せであるユニークな遺伝的バリエーションを宿す個々の微生物株を含む新しいターミネータースワップ微生物株ライブラリーが創製される、ステップと
をさせる、非一時的コンピューター可読媒体。
41.
候補微生物株の設計を反復して改善するためのコンピューター実装方法であって、
a.(1)1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す入力、および(2)対応する性能尺度を含む訓練セットで設定された予測モデルにアクセスするステップと;
b.遺伝子変化を表す該予測モデルに試験入力を適用するステップであって、該試験入力は、これらの遺伝子変化を組み入れる候補微生物株に対応する、ステップと;
c.該予測モデルに少なくとも部分的に基づいて該候補微生物株の表現型性能を予測するステップと;
d.これらの予測された性能に少なくとも部分的に基づいて該候補微生物株の第1のサブセットを選択するステップと;
e.該候補微生物株の該第1のサブセットの測定された表現型性能を得るステップと;
f.これらの測定された表現型性能に少なくとも部分的に基づいて該候補微生物株の第2のサブセットの選択物を得るステップと;
g.(2)該選択された候補微生物株の第2のサブセットの対応する測定された性能とともに、(1)該選択された候補微生物株の第2のサブセットに対応する入力を該予測モデルの該訓練セットに加えるステップと;
h.(b)〜(g)を繰り返すステップと
を含む、方法。
42.
(b)〜(g)を繰り返すステップが、少なくとも1つの候補微生物株の測定された表現型性能が、性能測定基準を満たすまで(b)〜(g)を繰り返すことを含む、実施形態41に記載の方法。
43.
前記予測モデルへの試験入力の第1の適用の間に、該試験入力によって表される前記遺伝子変化が、前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を含み;
試験入力の後続の適用の間に、該試験入力によって表される該遺伝子変化が、先に選択された候補微生物株の第2のサブセット内の候補微生物株に対する遺伝子変化を含む、実施形態41に記載の方法。
44.
前記候補微生物株の前記第1のサブセットの前記選択が、上位性効果に少なくとも部分的に基づく、実施形態41に記載の方法。
45.
上位性効果に少なくとも部分的に基づく前記第1のサブセットの前記選択が、
該第1のサブセットの第1の選択の間に、
前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す複数のそれぞれの入力の適用に応じて、該1つまたは複数のバックグラウンド微生物株の性能尺度間の相違点の程度を決定するステップと;
少なくとも2つの候補微生物株内に組み入れられる遺伝子変化の適用に応じて、該1つまたは複数のバックグラウンド微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
を含む、実施形態44に記載の方法。
46.
前記第1のサブセットの後続の選択の間に、
遺伝子変化を表す複数のそれぞれの入力の適用に応じて、先の第1のサブセット候補微生物株の性能尺度間の相違点の程度を決定するステップであって、該先の第1のサブセット候補微生物株が、該第1のサブセットの先の選択の間に選択された株である、ステップと;
少なくとも2つの候補微生物株内に組み入れられる該遺伝子変化の適用に応じて、該先の第1のサブセット候補微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさらに含む、実施形態45に記載の方法。
47.
候補微生物株の設計を反復して改善するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
a.(1)1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す入力、および(2)対応する性能尺度を含む訓練セットで設定された予測モデルにアクセスするステップと;
b.遺伝子変化を表す該予測モデルに試験入力を適用するステップであって、該試験入力は、これらの遺伝子変化を組み入れる候補微生物株に対応する、ステップと;
c.該予測モデルに少なくとも部分的に基づいて該候補微生物株の表現型性能を予測するステップと;
d.これらの予測された性能に少なくとも部分的に基づいて該候補微生物株の第1のサブセットを選択するステップと;
e.該候補微生物株の該第1のサブセットの測定された表現型性能を得るステップと;
f.これらの測定された表現型性能に少なくとも部分的に基づいて該候補微生物株の第2のサブセットの選択物を得るステップと;
g.(2)該選択された候補微生物株の第2のサブセットの対応する測定された性能とともに、(1)該選択された候補微生物株の第2のサブセットに対応する入力を該予測モデルの該訓練セットに加えるステップと;
h.(b)〜(g)を繰り返すステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
48.
前記命令が、前記1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、前記システムに、少なくとも1つの候補微生物株の測定された表現型性能が性能測定基準を満たすまで(b)〜(g)を繰り返させる、実施形態47に記載のシステム。
49.
前記予測モデルへの試験入力の第1の適用の間に、該試験入力によって表される前記遺伝子変化が、前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を含み;
試験入力の後続の適用の間に、該試験入力によって表される該遺伝子変化が、先に選択された候補微生物株の第2のサブセット内の候補微生物株に対する遺伝子変化を含む、実施形態47に記載のシステム。
50.
前記候補微生物株の前記第1のサブセットの前記選択が、上位性効果に少なくとも部分的に基づく、実施形態47に記載のシステム。
51.
前記命令が、前記1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、前記システムに、前記第1のサブセットの第1の選択の間に、
前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す複数のそれぞれの入力の適用に応じて、該1つまたは複数のバックグラウンド微生物株の性能尺度間の相違点の程度を決定するステップと;
少なくとも2つの候補微生物株内に組み入れられる遺伝子変化の適用に応じて、該1つまたは複数のバックグラウンド微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、実施形態50に記載のシステム。
52.
前記命令が、前記1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、前記システムに、前記第1のサブセットの後続の選択の間に、
遺伝子変化を表す複数のそれぞれの入力の適用に応じて、先の第1のサブセット候補微生物株の性能尺度間の相違点の程度を決定するステップであって、該先の第1のサブセット候補微生物株が、該第1のサブセットの先の選択の間に選択された株である、ステップと;
少なくとも2つの候補微生物株内に組み入れられる該遺伝子変化の適用に応じて、該先の第1のサブセット候補微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、実施形態51に記載のシステム。
53.
候補微生物株の設計を反復して改善するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
a.(1)1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す入力、および(2)対応する性能尺度を含む訓練セットで設定された予測モデルにアクセスするステップと;
b.遺伝子変化を表す該予測モデルに試験入力を適用するステップであって、該試験入力は、これらの遺伝子変化を組み入れる候補微生物株に対応する、ステップと;
c.該予測モデルに少なくとも部分的に基づいて該候補微生物株の表現型性能を予測するステップと;
d.これらの予測された性能に少なくとも部分的に基づいて該候補微生物株の第1のサブセットを選択するステップと;
e.該候補微生物株の該第1のサブセットの測定された表現型性能を得るステップと;
f.これらの測定された表現型性能に少なくとも部分的に基づいて該候補微生物株の第2のサブセットの選択物を得るステップと;
g.(2)該選択された候補微生物株の第2のサブセットの対応する測定された性能とともに、(1)該選択された候補微生物株の第2のサブセットに対応する入力を該予測モデルの該訓練セットに加えるステップと;
h.(b)〜(g)を繰り返すステップと
をさせる、非一時的コンピューター可読媒体。
54.
前記命令が、実行されるとき、前記1つまたは複数の演算デバイスの少なくとも1つに、少なくとも1つの候補微生物株の測定された表現型性能が性能測定基準を満たすまで(b)〜(g)を繰り返させる、実施形態53に記載のコンピューター可読媒体。
55.
前記予測モデルへの試験入力の第1の適用の間に、該試験入力によって表される前記遺伝子変化が、前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を含み;
試験入力の後続の適用の間に、該試験入力によって表される該遺伝子変化が、先に選択された候補微生物株の第2のサブセット内の候補微生物株に対する遺伝子変化を含む、実施形態53に記載のコンピューター可読媒体。
56.
前記候補微生物株の前記第1のサブセットの前記選択が、上位性効果に少なくとも部分的に基づく、実施形態53に記載のコンピューター可読媒体。
57.
前記命令が、実行されるとき、前記1つまたは複数の演算デバイスの少なくとも1つに、前記第1のサブセットの第1の選択の間に、
前記1つまたは複数のバックグラウンド微生物株に対する遺伝子変化を表す複数のそれぞれの入力の適用に応じて、該1つまたは複数のバックグラウンド微生物株の性能尺度間の相違点の程度を決定するステップと;
少なくとも2つの候補微生物株内に組み入れられる遺伝子変化の適用に応じて、該1つまたは複数のバックグラウンド微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、実施形態56に記載のコンピューター可読媒体。
58.
前記命令が、実行されるとき、前記1つまたは複数の演算デバイスの少なくとも1つに、前記第1のサブセットの後続の選択の間に、
遺伝子変化を表す複数のそれぞれの入力の適用に応じて、先の第1のサブセット候補微生物株の性能尺度間の相違点の程度を決定するステップであって、該先の第1のサブセット候補微生物株が、該第1のサブセットの先の選択の間に選択された株である、ステップと;
少なくとも2つの候補微生物株内に組み入れられる該遺伝子変化の適用に応じて、該先の第1のサブセット候補微生物株の該性能尺度の相違点の該程度に少なくとも部分的に基づいて、該少なくとも2つの候補微生物株を該第1のサブセットに含めるために選択するステップと
をさせる、実施形態53に記載のコンピューター可読媒体。
59.
候補微生物株の反復改良において上位性効果を適用するためのコンピューター実装方法であって、
少なくとも1つの微生物バックグラウンド株に行われた対応する遺伝子変化に応じて、測定された性能を表すデータを得るステップと;
少なくとも2つの遺伝子変化の対応する応答性能尺度間の相違点の程度に少なくとも部分的に基づいて、該少なくとも2つの遺伝子変化の選択物を得るステップであって、
相違点の該程度が、該少なくとも2つの遺伝子変化が異なる生物学的経路を通じたこれらの対応する応答性能尺度に影響する程度に関連する、ステップと;
該選択された遺伝子変化を含む微生物バックグラウンド株に対する遺伝子変化を設計するステップと
を含む、方法。
60.
前記少なくとも2つの選択された遺伝子変化が設計される前記微生物バックグラウンド株が、測定された応答性能を表すデータが得られた前記少なくとも1つの微生物バックグラウンド株と同じである、実施形態59に記載の方法。
61.
候補微生物株の反復改良において上位性効果を適用するためのシステムであって、
1つまたは複数のプロセッサー;および
該1つまたは複数のプロセッサーの少なくとも1つに作用的にカップリングされ、該1つまたは複数のプロセッサーの少なくとも1つによって実行されるとき、該システムに、
少なくとも1つの微生物バックグラウンド株に行われた対応する遺伝子変化に応じて、測定された性能を表すデータを得るステップと;
少なくとも2つの遺伝子変化の対応する応答性能尺度間の相違点の程度に少なくとも部分的に基づいて、該少なくとも2つの遺伝子変化の選択物を得るステップであって、
相違点の該程度が、該少なくとも2つの遺伝子変化が異なる生物学的経路を通じたこれらの対応する応答性能尺度に影響する程度に関連する、ステップと;
該選択された遺伝子変化を含む微生物バックグラウンド株に対する遺伝子変化を設計するステップと
をさせる、記憶された命令を有する1つまたは複数のメモリー
を備える、システム。
62.
前記少なくとも2つの選択された遺伝子変化が設計される前記微生物バックグラウンド株が、測定された応答性能を表すデータが得られた前記少なくとも1つの微生物バックグラウンド株と同じである、実施形態61に記載のシステム。
63.
候補微生物株の反復改良において上位性効果を適用するための命令を記憶している1つまたは複数の非一時的コンピューター可読媒体であって、該命令は、1つまたは複数の演算デバイスによって実行されるとき、該1つまたは複数の演算デバイスの少なくとも1つに、
少なくとも1つの微生物バックグラウンド株に行われた対応する遺伝子変化に応じて、測定された性能を表すデータを得るステップと;
少なくとも2つの遺伝子変化の対応する応答性能尺度間の相違点の程度に少なくとも部分的に基づいて、該少なくとも2つの遺伝子変化の選択物を得るステップであって、
相違点の該程度が、該少なくとも2つの遺伝子変化が異なる生物学的経路を通じたこれらの対応する応答性能尺度に影響する程度に関連する、ステップと;
該選択された遺伝子変化を含む微生物バックグラウンド株に対する遺伝子変化を設計するステップと
をさせる、非一時的コンピューター可読媒体。
64.
前記少なくとも2つの選択された遺伝子変化が設計される前記微生物バックグラウンド株が、測定された応答性能を表すデータが得られた前記少なくとも1つの微生物バックグラウンド株と同じである、実施形態63に記載のコンピューター可読媒体。
*****
参照による組込み
本明細書に引用したすべての参考文献、論文、刊行物、特許、特許公開、および特許出願は、すべての目的に関してその全体が参照により組み込まれている。しかし、本明細書に引用した任意の参考文献、論文、刊行物、特許、特許公開、および特許出願の言及は、これらが有効な先行技術を構成するか、または世界のいずれかの国における共通の一般的知識の一部を形成するという承認または何らかの形式の示唆として解釈されず、かつそのように解釈されるべきでない。

Claims (19)

  1. 改善された表現型性能を有するように宿主細胞を操作するためのハイスループット方法であって、
    a.1つ以上の遺伝子変化入力変数と、1つ以上の測定された表現型性能出力変数とを含む訓練データセットにアクセスするステップであって、
    i.前記1つ以上の遺伝子変化入力変数は、宿主細胞に導入された1つ以上の遺伝子変化を表し、
    ii.前記1つ以上の測定された表現型性能出力変数は、前記導入された1つ以上の遺伝子変化に関連する1つ以上の表現型性能尺度を表す、ステップと、
    b.前記訓練データセットによって設定された予測機械学習モデルを開発するステップと、
    c.前記1つ以上の遺伝子変化を組み込んだ設計候補宿主細胞のプールを、in silicoで生成するステップと、
    d.前記予測機械学習モデルを使用して、前記設計候補宿主細胞のプールの各メンバーの予期される表現型性能を予測するステップであって、
    i.少なくとも1つの設計候補宿主細胞は、ゲノム配列中に、ステップ(a)の遺伝子変化内からの遺伝子変化の統合された組み合わせを含み
    ii.前記機械学習モデルによって予測される、予期される表現型性能が、ステップ(a)の導入される遺伝子変化と、その関連する表現型性能尺度とに基づいており、前記遺伝子変化のいずれに関連するさらなる機能的情報も必要としない、ステップと、
    e.前記設計候補宿主細胞のサブセットを、それらの予測される表現型性能に基づいて選択するステップと、
    f.前記設計候補宿主細胞の前記サブセットからの宿主細胞を製造し、それによって、操作された宿主細胞を生み出すステップと、
    g.in vitroアッセイにおいて、前記操作された宿主細胞の表現型性能を測定するステップと、
    h.(a)の訓練データセットに、i.前記操作された宿主細胞に導入された1つ以上の遺伝子変化を表す1つ以上の遺伝子変化入力変数と、ii.前記操作された宿主細胞の前記表現型性能尺度を表す1つ以上の測定された表現型性能出力変数とを加えるステップ
    を含む、方法。
  2. (a)〜(h)が、操作された宿主細胞が所望のレベルの改善された表現型性能を呈するまで繰り返される、請求項1に記載の方法。
  3. 前記予測機械学習モデルが、上位性効果を組み込んでいる、請求項1に記載の方法。
  4. 前記予測機械学習モデルが、以下:線形回帰、カーネルリッジ回帰、ロジスティック回帰、ニューラルネットワーク、サポートベクターマシン(SVM)、デシジョンツリー、隠れマルコフモデル、ベイジアンネットワーク、グラムシュミット過程、強化ベースの学習、クラスターに基づく学習、階層的クラスタリング、遺伝的アルゴリズム、およびそれらの組み合わせのうちの少なくとも1つを組み込んでいる、請求項1に記載の方法。
  5. 前記予測機械学習モデルが、教師付き、半教師付き、または教師なしである、請求項1に記載の方法。
  6. 前記1つ以上の遺伝子変化が、単一ヌクレオチド多型、ヌクレオチド配列挿入、ヌクレオチド配列欠失、およびヌクレオチド配列置換からなる群から選択される少なくとも1つの遺伝子変化を含む、請求項1に記載の方法。
  7. 前記1つ以上の遺伝子変化が、内在性標的遺伝子に作動可能に連結したプロモーターラダーからの1つ以上の異種プロモーターを含み、前記プロモーターラダーは、異なる発現プロファイルを呈する複数のプロモーターを含む、請求項1に記載の方法。
  8. 前記改善された表現型性能が、目的の産物の増加した、またはより効率的な産生であり、前記目的の産物は、低分子、酵素、タンパク質、ペプチド、アミノ酸、有機酸、合成化合物、燃料、アルコール、一次細胞外代謝物、二次細胞外代謝物、細胞内コンポーネント分子、およびそれらの組み合わせからなる群から選択される、請求項1に記載の方法。
  9. 改善された表現型性能を有するように微生物株を操作するためのハイスループット方法であって、
    a.1つ以上の遺伝子変化入力変数と、1つ以上の測定された表現型性能出力変数とを含む訓練データセットにアクセスするステップであって、
    i.前記1つ以上の遺伝子変化入力変数は、微生物株に導入された1つ以上の遺伝子変化を表し、
    ii.前記1つ以上の測定された表現型性能出力変数は、前記導入された1つ以上の遺伝子変化に関連する1つ以上の表現型性能尺度を表す、ステップと、
    b.前記訓練データセットによって設定された予測機械学習モデルを開発するステップと、
    c.前記1つ以上の遺伝子変化を組み込んだ設計候補微生物株のプールを、in silicoで生成するステップと、
    d.前記予測機械学習モデルを使用して、前記設計候補微生物株のプールの各メンバーの予期される表現型性能を予測するステップであって、
    i.少なくとも1つの設計候補微生物株は、ゲノム配列中に、ステップ(a)の遺伝子変化内からの遺伝子変化の統合された組み合わせを含み
    ii.前記機械学習モデルによって予測される、予期される表現型性能が、ステップ(a)の導入される遺伝子変化と、その関連する表現型性能尺度とに基づいており、前記遺伝子変化のいずれに関連するさらなる機能的情報も必要としない、ステップと、
    e.前記設計候補微生物株のサブセットを、それらの予測される表現型性能に基づいて選択するステップと、
    f.前記設計候補微生物株の前記サブセットからの微生物株を製造し、それによって、操作された微生物株を生み出すステップと、
    g.in vitroアッセイにおいて、前記操作された微生物株の表現型性能を測定するステップと、
    h.それらの測定された表現型性能に基づいて前記操作された微生物株のサブセットを選択するステップと、
    i.(a)の訓練データセットに、
    i.前記操作された微生物株のサブセットに導入された1つ以上の遺伝子変化を表す1つ以上の遺伝子変化入力変数と、
    ii.前記操作された微生物株のサブセットの前記表現型性能尺度を表す1つ以上の測定された表現型性能出力変数とを加えるステップと、
    j.操作された微生物株が、所望のレベルの改善された表現型性能を呈するまでステップ(a)〜(i)を繰り返すステップと
    を含む、方法。
  10. 前記改善された表現型性能が、目的の産物の増加した、またはより効率的な産生であり、前記目的の産物は、低分子、酵素、タンパク質、ペプチド、アミノ酸、有機酸、合成化合物、燃料、アルコール、一次細胞外代謝物、二次細胞外代謝物、細胞内コンポーネント分子、およびそれらの組み合わせからなる群から選択される、請求項9に記載の方法。
  11. 前記改善された表現型性能が、リシンまたはクエン酸の増加した、またはより効率的な産生である、請求項9に記載の方法。
  12. 改善された表現型性能を有するように宿主細胞を操作するためのハイスループット方法であって、
    a.1つ以上の遺伝子変化入力変数と、1つ以上の測定された表現型性能出力変数とを含む訓練データセットにアクセスするステップであって、
    i.前記1つ以上の遺伝子変化入力変数は、1つ以上のライブラリーの適用を通じて宿主細胞に導入された1つ以上の遺伝子変化を表し、
    ii.前記1つ以上の測定された表現型性能出力変数は、前記導入された遺伝子変化に関連する1つ以上の表現型性能尺度を表す、ステップと、
    b.前記訓練データセットによって設定された予測機械学習モデルを開発するステップと、
    c.前記1つ以上の遺伝子変化を組み込んだ設計候補宿主細胞のプールを、in silicoで生成するステップと、
    d.前記予測機械学習モデルを使用して、前記設計候補宿主細胞のプールの各メンバーの予期される表現型性能を予測するステップであって、
    i.少なくとも1つの設計候補宿主細胞は、ゲノム配列中に、ステップ(a)の遺伝子変化内からの遺伝子変化の統合された組み合わせを含み
    ii.前記機械学習モデルによって予測される、予期される表現型性能が、ステップ(a)の導入される遺伝子変化と、その関連する表現型性能尺度とに基づいており、前記遺伝子変化のいずれに関連するさらなる機能的情報も必要としない、ステップと、
    e.操作された宿主細胞を生み出すのに使用するための前記設計候補宿主細胞のサブセットを提供するステップと、
    f.ステップ(e)の操作された宿主細胞を製造するステップと
    を含む、方法。
  13. 前記1つ以上のライブラリーが、プロモータースワップライブラリー、SNPスワップライブラリー、開始/停止コドンライブラリー、最適化配列ライブラリー、ターミネータースワップライブラリー、およびそれらの組み合わせからなる群から選択される、請求項
    12に記載の方法。
  14. 前記予測機械学習モデルが、上位性効果を組み込んでいる、請求項12に記載の方法。
  15. 前記予測機械学習モデルが、以下:線形回帰、カーネルリッジ回帰、ロジスティック回帰、ニューラルネットワーク、サポートベクターマシン(SVM)、デシジョンツリー、隠れマルコフモデル、ベイジアンネットワーク、グラムシュミット過程、強化ベースの学習、クラスターに基づく学習、階層的クラスタリング、遺伝的アルゴリズム、またはそれらの組み合わせのうちの少なくとも1つを組み込んでいる、請求項12に記載の方法。
  16. 前記予測機械学習モデルが、教師付き、半教師付き、または教師なしである、請求項12に記載の方法。
  17. 前記1つ以上の遺伝子変化が、単一ヌクレオチド多型、ヌクレオチド配列挿入、ヌクレオチド配列欠失、およびヌクレオチド配列置換からなる群から選択される少なくとも1つの遺伝子変化を含む、請求項12に記載の方法。
  18. 前記1つ以上の遺伝子変化が、内在性標的遺伝子に作動可能に連結したプロモーターラダーからの1つ以上の異種プロモーターを含む、請求項12に記載の方法。
  19. 前記改善された表現型性能が、目的の産物の増加した、またはより効率的な産生であり、前記目的の産物は、低分子、酵素、タンパク質、ペプチド、アミノ酸、有機酸、合成化合物、燃料、アルコール、一次細胞外代謝物、二次細胞外代謝物、細胞内コンポーネント分子、およびそれらの組み合わせからなる群から選択される、請求項12に記載の方法。
JP2019094458A 2015-12-07 2019-05-20 Htpゲノム操作プラットフォームによる微生物株の改良 Active JP6715374B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201562264232P 2015-12-07 2015-12-07
US62/264,232 2015-12-07
US15/140,296 2016-04-27
US15/140,296 US11151497B2 (en) 2016-04-27 2016-04-27 Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences
US201662368786P 2016-07-29 2016-07-29
US62/368,786 2016-07-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017558440A Division JP6605042B2 (ja) 2015-12-07 2016-12-07 Htpゲノム操作プラットフォームによる微生物株の改良

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020078103A Division JP6798056B2 (ja) 2015-12-07 2020-04-27 Htpゲノム操作プラットフォームによる微生物株の改良

Publications (3)

Publication Number Publication Date
JP2019162131A JP2019162131A (ja) 2019-09-26
JP2019162131A5 JP2019162131A5 (ja) 2019-12-12
JP6715374B2 true JP6715374B2 (ja) 2020-07-01

Family

ID=59013271

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2017558440A Active JP6605042B2 (ja) 2015-12-07 2016-12-07 Htpゲノム操作プラットフォームによる微生物株の改良
JP2019094458A Active JP6715374B2 (ja) 2015-12-07 2019-05-20 Htpゲノム操作プラットフォームによる微生物株の改良
JP2020078103A Active JP6798056B2 (ja) 2015-12-07 2020-04-27 Htpゲノム操作プラットフォームによる微生物株の改良
JP2020183613A Active JP7119048B2 (ja) 2015-12-07 2020-11-02 Htpゲノム操作プラットフォームによる微生物株の改良
JP2022036403A Pending JP2022066521A (ja) 2015-12-07 2022-03-09 Htpゲノム操作プラットフォームによる微生物株の改良

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017558440A Active JP6605042B2 (ja) 2015-12-07 2016-12-07 Htpゲノム操作プラットフォームによる微生物株の改良

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2020078103A Active JP6798056B2 (ja) 2015-12-07 2020-04-27 Htpゲノム操作プラットフォームによる微生物株の改良
JP2020183613A Active JP7119048B2 (ja) 2015-12-07 2020-11-02 Htpゲノム操作プラットフォームによる微生物株の改良
JP2022036403A Pending JP2022066521A (ja) 2015-12-07 2022-03-09 Htpゲノム操作プラットフォームによる微生物株の改良

Country Status (7)

Country Link
EP (2) EP3858996B1 (ja)
JP (5) JP6605042B2 (ja)
KR (2) KR20190090081A (ja)
CN (2) CN108027849B (ja)
CA (4) CA3007840C (ja)
ES (2) ES2928728T3 (ja)
WO (1) WO2017100377A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102496984B1 (ko) 2014-02-11 2023-02-06 더 리전츠 오브 더 유니버시티 오브 콜로라도, 어 바디 코퍼레이트 Crispr 이용의 다중화된 게놈 조작
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
KR20180084756A (ko) 2015-12-07 2018-07-25 지머젠 인코포레이티드 코리네박테리움 글루타미컴으로부터의 프로모터
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
US10017760B2 (en) 2016-06-24 2018-07-10 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
JP2019519241A (ja) 2016-06-30 2019-07-11 ザイマージェン インコーポレイテッド グルコース透過酵素ライブラリーを生成するための方法およびその使用
JP2019519242A (ja) 2016-06-30 2019-07-11 ザイマージェン インコーポレイテッド 細菌ヘモグロビンライブラリーを生成するための方法およびその使用
JP2020503037A (ja) * 2016-12-30 2020-01-30 ザイマージェン インコーポレイテッド 遺伝子操作および株精製のための自動化ステップを使用する真菌産生株を構築する方法
CA3061731A1 (en) 2017-05-19 2018-11-22 Zymergen Inc. Genomic engineering of biosynthetic pathways leading to increased nadph
CA3064612A1 (en) * 2017-06-06 2018-12-13 Zymergen Inc. A htp genomic engineering platform for improving escherichia coli
US20200102554A1 (en) 2017-06-06 2020-04-02 Zymergen Inc. High throughput transposon mutagenesis
CN110719956A (zh) 2017-06-06 2020-01-21 齐默尔根公司 用于改良真菌菌株的高通量基因组工程改造平台
JP7350659B2 (ja) * 2017-06-06 2023-09-26 ザイマージェン インコーポレイテッド Saccharopolyspora spinosaの改良のためのハイスループット(HTP)ゲノム操作プラットフォーム
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US11450121B2 (en) * 2017-06-27 2022-09-20 The Regents Of The University Of California Label-free digital brightfield analysis of nucleic acid amplification
SI3645719T1 (sl) * 2017-06-30 2022-07-29 Inscripta, Inc., Postopki, moduli, instrumenti in sistemi za avtomatizirano obdelavo celic
US10557216B2 (en) * 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
WO2019236848A1 (en) * 2018-06-06 2019-12-12 Zymergen Inc. Manipulation of genes involved in signal transduction to control fungal morphology during fermentation and production
JP2021530211A (ja) * 2018-07-03 2021-11-11 ザイマージェン インコーポレイテッド 液体に基づく選択及び細胞単離
US11951610B2 (en) 2018-07-31 2024-04-09 Mjnn Llc Opening apparatus for use with a multi-piece, hinged, hydroponic tower
MX2021005028A (es) 2018-10-31 2021-08-24 Zymergen Inc Ensamble determinista multiplexado de genotecas de adn.
AU2020218745A1 (en) * 2019-02-05 2021-08-19 Pivot Bio, Inc. Improved consistency of crop yield through biological nitrogen fixation
US11053515B2 (en) 2019-03-08 2021-07-06 Zymergen Inc. Pooled genome editing in microbes
JP2022524043A (ja) 2019-03-08 2022-04-27 ザイマージェン インコーポレイテッド 微生物の反復ゲノム編集
EP3963589A4 (en) * 2019-04-30 2023-01-25 Amgen Inc. DATA-DRIVEN PREDICTIVE MODELING FOR CELL LINE SELECTION IN BIOPHARMACEUTICAL PRODUCTION
US11723328B2 (en) 2019-05-08 2023-08-15 Mjnn Llc Cleaning apparatus for use with a plant support tower
AU2020344624A1 (en) * 2019-09-13 2022-03-31 The University Of Chicago Method and apparatus using machine learning for evolutionary data-driven design of proteins and other sequence defined biomolecules
WO2021061694A1 (en) 2019-09-23 2021-04-01 Zymergen Inc. Method for counterselection in microorganisms
US11479779B2 (en) 2020-07-31 2022-10-25 Zymergen Inc. Systems and methods for high-throughput automated strain generation for non-sporulating fungi
CN116917474A (zh) 2020-11-13 2023-10-20 特里普巴尔生物公司 多参数发现和优化平台
WO2022175878A1 (en) * 2021-02-20 2022-08-25 Kcat Enzymatic Private Limited Insilico guided crispr-cas driven enzyme engineering framework
CN113393900B (zh) * 2021-06-09 2022-08-02 吉林大学 基于改进Transformer模型的RNA状态推断研究方法
CN116072227B (zh) * 2023-03-07 2023-06-20 中国海洋大学 海洋营养成分生物合成途径挖掘方法、装置、设备和介质
CN116665763B (zh) * 2023-05-18 2024-05-03 中南大学 一种基于多视图多标签学习的代谢途径推断方法

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4435504A (en) 1982-07-15 1984-03-06 Syva Company Immunochromatographic assay with support having bound "MIP" and second enzyme
GB8406752D0 (en) 1984-03-15 1984-04-18 Unilever Plc Chemical and clinical tests
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
CA1303983C (en) 1987-03-27 1992-06-23 Robert W. Rosenstein Solid phase assay
US4855240A (en) 1987-05-13 1989-08-08 Becton Dickinson And Company Solid phase assay employing capillary flow
JPH01225487A (ja) * 1988-03-04 1989-09-08 Sakai Eng Kk セルロースのアスペルギルス ニガーによるクエン酸若しくはグルコン酸生産を目的としたバイオリアクター担体への利用方法
US6060296A (en) 1991-07-03 2000-05-09 The Salk Institute For Biological Studies Protein kinases
US5516670A (en) 1991-09-30 1996-05-14 Kuehnle; Adelheid R. Magnetophoretic particle delivery method and apparatus for the treatment of cells
EP0635574B1 (en) 1993-07-23 2003-04-23 Dsm N.V. Selection marker gene free recombinant strains, a method for obtaining them and the use of these strains
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
AU723619B2 (en) * 1995-04-24 2000-08-31 Chromaxome Corporation Methods for generating and screening novel metabolic pathways
US5753477A (en) 1996-03-19 1998-05-19 University Technology Corporation Magneto-biolistic methods
US6326204B1 (en) * 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
EP2327797B1 (en) 1997-04-01 2015-11-25 Illumina Cambridge Limited Method of nucleic acid sequencing
JPH1180185A (ja) 1997-09-05 1999-03-26 Res Dev Corp Of Japan オリゴヌクレオチドの化学合成法
US6713073B1 (en) * 1998-07-24 2004-03-30 Megan Health, Inc. Method of vaccination of newly hatched poultry
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
EP1236173A2 (en) * 1999-10-27 2002-09-04 Biowulf Technologies, LLC Methods and devices for identifying patterns in biological systems
EP1415160A2 (en) * 2000-09-30 2004-05-06 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
WO2005021772A1 (en) 2003-08-29 2005-03-10 Degussa Ag Process for the preparation of l-lysine
EP2434015B1 (en) * 2004-09-09 2013-11-20 Research Institute Of Innovative Technology For The Earth DNA fragment having promoter function
WO2007142954A2 (en) 2006-05-30 2007-12-13 Dow Global Technologies Inc. Codon optimization method
CN101434910A (zh) * 2007-11-13 2009-05-20 科兹莫弗姆有限公司 产生鞘脂碱的微生物菌株
DE102007047933B3 (de) 2007-12-20 2009-02-26 Vistec Semiconductor Systems Gmbh Verfahren zur Inspektion von einer Oberfläche eines Wafers mit Bereichen unterschiedlicher Detektionsempfindlichkeit
WO2010025310A2 (en) 2008-08-27 2010-03-04 Westend Asset Clearinghouse Company, Llc Methods and devices for high fidelity polynucleotide synthesis
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8783382B2 (en) 2009-01-15 2014-07-22 Schlumberger Technology Corporation Directional drilling control devices and methods
WO2010094772A1 (en) 2009-02-20 2010-08-26 Febit Holding Gmbh Synthesis of sequence-verified nucleic acids
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
CN101628296A (zh) * 2009-07-31 2010-01-20 中国科学院南京土壤研究所 一种利用拮抗微生物菌剂修复沙门氏菌污染土壤的方法
TWI371374B (en) 2009-09-14 2012-09-01 Compal Electronics Inc Production method of three dimensional pattern
EP2540728B1 (en) 2010-02-17 2019-04-10 Takeda Pharmaceutical Company Limited Heterocyclic compound
EP2395087A1 (en) 2010-06-11 2011-12-14 Icon Genetics GmbH System and method of modular cloning
US20120115734A1 (en) * 2010-11-04 2012-05-10 Laura Potter In silico prediction of high expression gene combinations and other combinations of biological components
US8621430B2 (en) 2011-03-03 2013-12-31 International Business Machines Corporation Method for code transformation supporting temporal abstraction of parameters
WO2012142591A2 (en) * 2011-04-14 2012-10-18 The Regents Of The University Of Colorado Compositions, methods and uses for multiplex protein sequence activity relationship mapping
JP6158170B2 (ja) * 2011-04-27 2017-07-12 アミリス, インコーポレイテッド ゲノム修飾のための方法
US20140180660A1 (en) * 2012-12-14 2014-06-26 Life Technologies Holdings Pte Limited Methods and systems for in silico design
CN103279689B (zh) * 2013-05-20 2016-08-17 天津大学 基于fk506生产菌筑波链霉菌基因组尺度代谢网络模型指导下次级途径改造方法
ES2947757T3 (es) 2014-11-05 2023-08-18 Illumina Inc Composiciones de transposasas para reducir el sesgo de inserción
KR102356072B1 (ko) 2015-09-10 2022-01-27 에스케이하이닉스 주식회사 메모리 시스템 및 그 동작 방법
WO2020004190A1 (ja) 2018-06-26 2020-01-02 東京エレクトロン株式会社 溶射装置

Also Published As

Publication number Publication date
ES2878014T3 (es) 2021-11-18
CN111223527A (zh) 2020-06-02
KR20190090081A (ko) 2019-07-31
JP2018523968A (ja) 2018-08-30
JP6798056B2 (ja) 2020-12-09
CA3105722A1 (en) 2017-06-15
CA3090392C (en) 2021-06-01
EP3387571A4 (en) 2019-03-20
CN111223527B (zh) 2022-07-26
EP3387571A1 (en) 2018-10-17
JP2021010384A (ja) 2021-02-04
JP7119048B2 (ja) 2022-08-16
ES2928728T3 (es) 2022-11-22
JP2020115890A (ja) 2020-08-06
CN108027849B (zh) 2020-03-20
EP3858996A1 (en) 2021-08-04
EP3387571B1 (en) 2021-03-31
CA3088654A1 (en) 2017-06-15
CA3007840C (en) 2020-09-15
CA3090392A1 (en) 2017-06-15
JP6605042B2 (ja) 2019-11-13
CN108027849A (zh) 2018-05-11
CA3105722C (en) 2022-10-11
EP3858996B1 (en) 2022-08-03
KR102006320B1 (ko) 2019-08-02
JP2022066521A (ja) 2022-04-28
CA3088654C (en) 2021-05-18
CA3007840A1 (en) 2017-06-15
WO2017100377A1 (en) 2017-06-15
KR20180012280A (ko) 2018-02-05
JP2019162131A (ja) 2019-09-26

Similar Documents

Publication Publication Date Title
JP6715374B2 (ja) Htpゲノム操作プラットフォームによる微生物株の改良
US11155807B2 (en) Automated system for HTP genomic engineering
US11208649B2 (en) HTP genomic engineering platform
JP2020524494A (ja) ハイスループットトランスポゾン変異誘発

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191028

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191028

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20191028

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20191113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191211

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200608

R150 Certificate of patent or registration of utility model

Ref document number: 6715374

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250