JP2019520622A - ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム - Google Patents

ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム Download PDF

Info

Publication number
JP2019520622A
JP2019520622A JP2018555880A JP2018555880A JP2019520622A JP 2019520622 A JP2019520622 A JP 2019520622A JP 2018555880 A JP2018555880 A JP 2018555880A JP 2018555880 A JP2018555880 A JP 2018555880A JP 2019520622 A JP2019520622 A JP 2019520622A
Authority
JP
Japan
Prior art keywords
level
array
dna
operations
operand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2018555880A
Other languages
English (en)
Other versions
JP2019520622A5 (ja
Inventor
バーバラ フレウェン,
バーバラ フレウェン,
アーロン キンボール,
アーロン キンボール,
ザカリー パルチック,
ザカリー パルチック,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zymergen Inc
Original Assignee
Zymergen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zymergen Inc filed Critical Zymergen Inc
Publication of JP2019520622A publication Critical patent/JP2019520622A/ja
Publication of JP2019520622A5 publication Critical patent/JP2019520622A5/ja
Priority to JP2021161095A priority Critical patent/JP2022008679A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Chemical & Material Sciences (AREA)
  • Biochemistry (AREA)
  • Automation & Control Theory (AREA)
  • General Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

遺伝子製造システムによるヌクレオチド配列の産生を制御する製造指示の生成は、それぞれ少なくとも1つのヌクレオチド配列部分を表す配列オペランドの演算を示す式を受け取るステップ、配列仕様に対して式を評価するステップであって、配列仕様が1つもしくは複数の第1レベルの演算と、1つもしくは複数の第2レベルの演算とを含むデータ構造を含むステップ、および1つもしくは複数の第1レベルの演算と1つもしくは複数の第2レベルの演算の実行に基づく製造指示を生成するステップを含む。反復的な形で、1つもしくは複数の第1レベルの演算が少なくとも1つの第1レベルの配列オペランドを演算し、その値は1つもしくは複数の第2レベルの演算の実行によって解決される。次いで、製造指示を遺伝子製造システムに提供して、配列部分を配列仕様によって表されたヌクレオチド配列にアセンブルすることができる。

Description

この出願は、2016年4月27日に出願された米国仮出願第15/140,296号(これは、全ての目的のために、全記載、参考文献、図面および特許請求の範囲を含めたその全体が参考として本明細書に援用される)に対する優先権の利益を主張する。
本開示は、一般に、ハイスループット微生物ゲノム工学、より詳細には、遺伝子製造システムによるヌクレオチド配列の産生を制御する製造指示(factory order)を生成するためのプロセス、システム、およびデータ構造を対象とする。
微生物工学は、新規化学物質、先端材料、および医薬品の作成を可能にする。1つのビジネスモデルでは、株設計会社は、代わりにまたは第三者が、先に記載したDNAセグメントを改変し、出力特性、例えば収量、生産性、最適な増殖温度、増殖速度、および力価などを改善することにより、微生物宿主の代謝的産生を増強することができる。多くの従来の試みは、小バッチの研究収量に注目されてきた。しかしながら、工業規模での微生物工学を達成するためには、膨大な量のDNA配列情報の保管および共有が必要である。複数のチームが設計案を共有できなければならず、科学者らは生産技術者と意思疎通できなければならず、プロジェクトマネージャーは概念の早い段階から評価の最終段階まで詳細を追跡できなければならない。
改変微生物のハイスループット産生にはハイスループット株設計が必要である。ロボットは数百から数千個の株を一度に構成することができ、設計ツールがこの能力に合っていなければならない。数種の同じ要素の異なる組み合わせを探索することにより、または基本的な設計に多くの小さな変更を試みることにより、大規模な実験が想像できる。理想的な保存および交換フォーマットは、これらの関係が維持され、設計、構築、または評価の範囲で他のソフトウェアツールによって解釈され得るような構造データである。
特に、開発者らはDNA部分、DNAアセンブリー、および工学的に作成した細胞系のレベルでの設計概念を意思疎通する課題に直面する:(1)株設計会社とビジネスパートナーの間、ならびに(2)株設計会社内の開発部門と運用部門の間。
以前の試みは、DNA部分の標準化した記載法の提案をもたらした。例えば、合成生物学オープンランゲージビジュアル(SBOL Visual)は、遺伝部分、装置、モジュール、およびシステムを指定する概略「図」を使用するオープンソースのグラフィカル表記である。その全体が参照により本明細書に組み込まれる、BBF RFC 108: Synthetic Biology Open Language (SBOL) Version 2.0.0、編集者Bartleyら、2015年7月31日も参照。
SBOL標準機構は、DNAレベル設計の仕様についての「コアデータモデル」である。このSBOLコアは生物学的構成単位をDNA成分として定義し、それらの階層的な組成の各設計成分の下部構造および構築の仕様を可能にする。DNA成分は、DNAの領域を記載する実体である。根本的な情報は、根底にあるDNA配列である。その配列の装飾は、配列アノテーション(メタデータ)である。配列アノテーションは、例えばプロモーターおよび配向など、その配列におけるヌクレオチドの領域を記載する。各配列アノテーションは、DNA成分としても表すことができる。
SBOLコアは、「コレクション」データ構造も提示し、DNA成分をライブラリーおよびカタログへとグループ分けする。例えば、Bartleyら、BBF RFC 108:Synthetic Biology Open Language (SBOL) Version 2.0.0、5.2、6、7.10節参照。
SBOLは視覚的な記号のセットおよび遺伝子配列の構造および機能に相当するデータフォーマットを提供する。その目的は、新規の合成設計の通信のための標準化フォーマットを提供することである。しかしながら、SBOLそれ自体は所与のゲノムまたは遺伝子配列に特定の変更を実行するためのプログラミングモデルではない。SBOLはDNAセグメントの構造および成分部分の機能的挙動を記載するが、DNA配列に実施される演算を記載するための圧縮表記を提供しない。演算は、DNA配列自体のアノテーションによって、またはSBOLのXML言語内の拡張データモデル要素によって定義されるべきである。いずれの場合でも、これらのアノテーションまたは拡張データモデル要素は、それらを定義および挿入する各組織またはユーザーの所有であり、いずれにせよそれらを非標準拡張とする。これらのアノテーションまたはデータ構造は、最終DNA出力配列に置かれ、その配列を生じる入力を区別する。この構造のため、配列の産生と関連する演算の論理的または物理的順序は、データ自体の構造に本質的に取り込まれない。
さらに、SBOLは、Genbankおよび明示的なDNA配列の通信用の他のファイルフォーマットのように、作成または提案される各DNA配列の別々のSBOL記載をユーザーが提供することを必要とする。例えば、1000個のゲノム編集は、1000個のバリアントDNA配列を数え上げることによって記載され;編集のコレクションは、その根底にある部分およびそれらの様々な組み合わせに関して記載されない。このフォーマットは、ユーザーが特化したツールを使わずに直接編集するには扱いにくく、他のシリアル化フォーマット(例えば、Avroなどのバイナリフォーマット)と比較して保存スペースが非効率的である。
TeselaGen Biotechnologyによって提供されるj5ソフトウェアパッケージは、他の特徴の中でも、どのDNA部分がDNA構築物を構成するために必要か確定するための自動化方法を提供する多くのDNA編集パッケージの1例である。典型的には、これらのツールは、入力として、各行が構成される1つの構築物を表し、各列がその構成に組み入れるべきピースを含有する情報の表を用いる。次いで、ツールは、これらの配列が一般的な研究所のプロトコールでどのように使用されるべきかについての情報と共にDNA配列のリストを出力する。
j5システムは、いくつかのCSV(スプレッドシート)ファイルに依存し、その出力を構築する。これらのスプレッドシートにおいて、各行はDNA部分(配列と名付ける)または他の出力に相当する。SBOL、GHSまたは他のシステムとは異なり、j5は、その標的部分指示リストファイルにおける「コンビナトリアルビン」を参照することにより、簡潔なコンビナトリアルアセンブリーを可能にする。しかしながら、j5は、アセンブリー方法(LHR、Gibson等)に特有の形で部分を使用する、ならびにコードおよびアレンジするためのアセンブリー方法の特定の知識を科学者が有することを必要とする。j5は、その変更を達成する物理的手段からDNAへの論理的(構文的)変更のデカップリングを許可しない。
さらに、j5は、その厳正なスプレッドシートベースの入力フォーマットによって制限される。j5「スクリプト」は、互いに連結する項目のリストを指定するスプレッドシートのコレクションである。ユーザーが、一連の個々の部分として完全なアセンブリーを指定することが必要である。j5は、任意の様式(挿入、欠失、置換等)で既存のDNA配列を改変する方法により、任意のフレキシブルな編集(例えば個々の塩基対を変更するなど)を許可しない。
最終的に、j5は、アセンブリー技術のためのパラメーターの一定のセットが使用されることを必要とする。単一の「パラメーターファイル」スプレッドシートは、完全なアセンブリーを達成する反応のためのグローバルなパラメーター(融解温度、PCR産物サイズ等)を提供する。j5は、全体的なアセンブリープロセスのサブアセンブリーを仲介する、パラメーターまたは異なるアセンブリー技術の適用を企図しない。
GSLは、新しい株の定義を生じる編集のコレクションを指定する目的のためのAmyris,Incによって開発された所有権のある言語である。GSLは、ユーザーが高および低レベル配列編集演算子の両方を提供する言語を使用する編集を定義することを可能にする。各場合において、ユーザーは、組み合わされるサブ配列の組み合わせを明確に記載しなければならない。GSLは、ユーザーがコンビナトリアル様式で入力引数またはDNA要素を組み合わせるスクリプトを記載することを可能にする、リストまたはループ構築物を提供しない;スクリプト自体は、所望の出力配列の数に関してはO(n)である。さらに、GSLは、Amyrisによって使用される特定の宿主生物と関連する編集部位に作用する編集技術の特定のコレクションを使用して編集が実施されることを予期し、宿主DNA配列の公知の部位に挿入される連結する要素に優先的に集中する。GSLは、株、プラスミド、または宿主非依存的な任意のDNA配列もしくはサブ配列にわたり、ユーザーが将来的に実施することを望み得る様々なDNA改変パターンに拡張可能ではない。
Eugene言語は、そのpermute()関数の使用により、コンビナトリアルDNA設計を可能にする。L. Bilitchenkoら、Eugene - A Domain Specific Language for Specifying and Constraining Synthetic Biological Parts, Devices, and Systems、PLoS ONE、6巻、4号、2011年4月29日、(http://iournals.plos.org/plosone/article?id=10.1371/journal.pone.0018882)参照。これは、出力の数よりも、入力部分および結合子の数に関してサイズがO(n)である、より簡潔なスクリプトを可能にする。したがって、それは、GSLまたは他のシステム(例えばSBOL)よりも多くの配列の生成を可能にする。Eugeneは、ユーザーに、様々な特性のフィルタリングを可能にするRule述語を提供する。さらに、複数のDeviceが、DNAの特徴(アノテーション)にアラインメントを使用してまたは他の特性に基づく様々な順序で共に連結され得る。Rule構文は論理的プログラミング構造を使用して、PROLOGのような証明言語と同じようなやり方で制約充足言語を使用する、全ての規則を満たすだけの順序でまとめてDeviceを共に結合する様々な制約を定義する。それらを定義するために使用する規則および特定の構文の数は、ソフトウェア開発経験のない科学的なユーザーには厄介である。特に、述語論理的な構文は、命令型言語、例えばPerlまたはPython(多くの微生物学者に予想され得る)にわずかに精通しているだけであるユーザーが、コンピュータ科学において以前に正式な訓練を受けずに非常に異質であるプログラミングスタイルで考え、入力を入れることを必要とする。
Eugeneは基本的に遺伝子製造プロセスへの入力として、製造されるヌクレオチド配列を提供する。その情報から、ゲノムのアセンブラーは、最良のヌクレオチド部分および配列を製造するためのワークフローの決定を任される。大規模演算では、何千もの配列がEugeneのようなゲノム設計プログラムによって生成され得る。例えば、プログラムは10000個の改変ゲノムを生成することができ、それは保存スペースのおよそ50〜100GBを占める。この情報は現時点での典型的なメモリに合わず、代わりに例えば、より遅いディスクベースのアクセスを必要とする。実施形態は、例えばSBOLを用い、出力DNA成分を表すことができる。現在の市販のコンピュータシステムは、50〜100GBのSBOLファイルを効率よくロードおよび演算できない。そのような演算は処理において、破損または容認できない遅延を起こし得る。したがって、コンピュータシステムにおいて大規模配列設計を実行する場合、コンピュータ技術に根付いた課題を克服する手段の開発が望まれる。
Bartleyら、BBF RFC 108:Synthetic Biology Open Language (SBOL) Version 2.0.0、5.2、6、7.10節 L. Bilitchenkoら、Eugene - A Domain Specific Language for Specifying and Constraining Synthetic Biological Parts, Devices, and Systems、PLoS ONE、6巻、4号、2011年4月29日、(http://iournals.plos.org/plosone/article?id=10.1371/journal.pone.0018882)
本発明の実施形態は、複数の変異を複数の親ヌクレオチド配列に同時に導入し、それらを変異配列の大きなセットへとトランスフォームするためのプロセス、システム、およびデータ構造を提供する。本発明の実施形態は、例えばヌクレオチド配列の設計および構成の時間および複雑さの削減により、工業規模のゲノム設計および製造を改善する。
しかしながら、ゲノム設計および製造へのデータ科学の適用は、背景技術節に上述したような課題を生じる。特に、ハイスループットヌクレオチド配列設計は、管理不可能な数の出力配列の生成をもたらし、単一のコンピュータメモリには多すぎるデータを作成し、より複雑なメモリ管理システムの使用を必要とし、例えば、ディスクベースの保存を組み入れる。さらに、そのような多数の出力配列の処理は、容認できないほど遅い処理時間または処理の失敗さえももたらし得る。本発明の実施形態は、設計および製造の間の、複雑なメモリ管理スキームおよび容認できないほど遅い配列データの処理の必要性を避ける、管理可能な量の配列データを生成する能力を提供することによって部分的にこれらの技術的な障害を克服する。
本発明の実施形態はまた、開始および中間ヌクレオチド部分の遺伝子製造プロセス、他のヌクレオチド配列合成入力(例えば、プライマー、酵素、試薬)、および環境因子(例えば、温度)を伝える反復データ構造も提供する。データ構造はまた、所望の遺伝子製造プロセスにおいて、開始および中間ステップのワークフローも指定し得る。この情報の検討は、製造プロセスをよりよく伝え、それによりいくつかの条件(例えば、部分およびプロモーターの価格および入手可能性、ワークフロー選択の効率)にわたる製造の最適化を可能にし、すなわち大規模コンピュータ支援設計ならびに微生物株および他の宿主細胞におけるゲノムの製造によりもたらされる課題を克服するため、収量、スケーラビリティ、処理時間、および他の因子の改善をもたらす。
本明細書の実施形態のいくつかのまたはすべての特徴を使用して、科学者らは非常に大きなセットのヌクレオチド配列(例えば、100万またはそれよりも大きい桁)を簡潔なプログラミングフォーマットにおいて定義することができるが、直観に反した方法で、アセンブリープロセスの低レベルのより細かく細分された詳細も効率的に制御できる。この制御の一部は、配列のより管理可能なサブセットの生成を提供し、そうでなければゲノム設計および製造システムにおいて保存および処理能力にかかる負荷を避ける。
特に、本発明の実施形態は、遺伝子製造システムによるヌクレオチド配列の産生を制御する製造指示の生成を含む。それぞれ少なくとも1つのヌクレオチド配列部分を表している、配列オペランドの演算を示す式を受け取る;1つもしくは複数の第1レベルの演算と、1つもしくは複数の第2レベルの演算とを含むデータ構造を含む配列仕様に対して式を評価する;ならびに1つもしくは複数の第1レベルの演算および1つもしくは複数の第2レベルの演算の実行に基づく製造指示を生成するシステム、方法、コンピュータ読み取り可能媒体が本明細書に記載される。反復的な形で、1つもしくは複数の第1レベルの演算が少なくとも1つの第1レベルの配列オペランドに作用し、その値は1つもしくは複数の第2レベルの演算の実行によって解決される。次いで、製造指示を遺伝子製造システムに提供して、配列部分を配列仕様によって表されるヌクレオチド配列にアセンブルすることができる。
本発明の実施形態では、製造指示は、1つもしくは複数の第1レベルの演算または1つもしくは複数の第2レベルの演算が、遺伝子製造システムによってどのように具体化される(物理的に達成される)かに関する、仕様データ構造に含まれるパラメーターに基づき得る。いくつかの実施形態では、パラメーターは、1つもしくは複数の第2レベルの演算の最初の第2レベルの演算の具体化において遺伝子製造システムにより使用される第1のパラメーター、および1つもしくは複数の第2レベルの演算の2番目の第2レベルの演算の具体化において遺伝子製造システムにより使用される第1のパラメーターと異なり、第1のパラメーターと同じカテゴリーのパラメーターを表す第2のパラメーターを含み得る。例として、それぞれ第1のパラメーターは、第1のアセンブリー法、温度、配列部分ソース、またはプライマーソースを示し、第2のパラメーターは第2の、異なるアセンブリー法、温度、配列部分ソース、またはプライマーソースを示し得る。
本発明の実施形態では、サンプリングは配列仕様、例えば、データ構造が1レベル高い配列仕様のための入力/オペランドとして作用する反復データ構造における中間または低レベルでの「子」配列仕様のサブセットのみの実行のための選択による大きな保存能力および重い処理力の必要性を低減するために用いられ得る。(本明細書の上記および他に記載される配列仕様における「第1レベルの演算」は、データ構造階層のトップレベルに属する必要は必ずしもないが、代わりにトップレベルの下の子配列仕様に属し得ることに留意されたい。)実行のための配列仕様のサブセットの選択は、例えば無作為化サンプリング、firstKまたはlastK仕様のみの選択、または仕様の重みづけに基づき得る。重みづけは、先の製造指示の結果としてアセンブルされたヌクレオチド配列の表現型特性に基づき得る。先の工場生産中にアセンブルした配列は、程度の高い所望の表現型特性を示すことが観察され得る。それらの配列は、例えば、特定のプロモーターを指定する子配列仕様から生成され得る。この情報は、それらのプロモーターを指定する子仕様を有利に重みづけするために使用され、それらが実行され、現行の製造指示に組み込まれる機会を増加し得る。
本発明の実施形態では、反復データ構造は、プロモーター−遺伝子−ターミネーター配列における遺伝子と関連するプロモーターの置換のような有用な演算を指定するために使用され得る。例えば、第1レベル関数は、配列中にプロモーターを配置する第2レベルの位置−解決関数の実行によって解決されるオペランドを有する置換関数であり得る。特にこの例では、置換/位置−解決式の評価は、第2の配列オペランドによって表される置換プロモーターを有する第1の配列オペランドによって表される複数のプロモーター−遺伝子−ターミネーター配列を含む配列の置換可能なプロモーター領域の置換を表す配列仕様の作成を含む。第1の配列オペランドの実行は置換可能な領域を識別する。
製造指示を生成するプロセスでは、反復データ構造は、これらの設計の構築に使用されるであろう入力および中間部とともに出力株またはDNA設計のコレクションを抽出するために横断され得る。本発明の実施形態では、これらの入力、中間、および最終DNA配列を持つデータ構造は、「工場ビルドグラフ(factory build graph)」と示される。この工場ビルドグラフ(以降、「ビルドグラフ」と交換可能に呼ぶ)は、物理的形態の所望の出力設計を産生する、DNA配列アセンブリーワークを実施するための事前に定義されているワークフローとともに使用され得る。
これらおよび他の実施形態は、以下により完全に記載する。
図1は、ヌクレオチド配列の設計、構成、試験、および分析のための本発明の実施形態の研究所情報管理システムを示す。
図2は、本発明の実施形態による、ヌクレオチド配列の設計および構成のためのプロセスを示すフローチャートである。
図3は、本発明の実施形態により可能な反復連結関数の例を示す。
図4は、本発明の実施形態による、プロモーター、遺伝子、およびターミネーターの2つのセットを含む、アノテーションしたDNA配列の例を示す。
図5は、本発明の実施形態による、図4の配列に適用されるプロモータースワップ演算を示す。
図6は、本発明の実施形態による、置換−位置クロス乗積関数(replace-locate cross-product function)のDNA仕様のグラフ表示を示す。
図7は、本発明の実施形態を実行するために使用され得るコンピュータシステムの例を示す。
図8は、本発明の実施形態による、工場ビルドグラフの例を示す。
本記載は、添付の図面を参照し、ここでは様々な例の実施形態が示される。しかしながら、多くの異なる例の実施形態が使用でき、したがって本記載は本明細書に記載の例の実施形態に限定されると考えられるべきではない。むしろ、これらの例の実施形態は、本開示が完全および完璧であるように提供される。例示的な実施形態への様々な改変は、当業者には容易に明らかであり、本明細書で定義した一般原理は他の実施形態および出願に、本開示の精神および範囲から逸脱することなく適用され得る。したがって、本開示は示した実施形態に限定されることを意図しないが、本明細書に開示した原理および特徴と一貫する最大の範囲と一致する。
システム概要
図1は、DNA配列の設計、構成、試験、および分析のための本発明の実施形態の実験室情報管理システム(LIMS)200の体系図である。図2は、対応する流れ図である。LIMSの実施形態では、1つもしくは複数の変更が同時に入力DNA配列になされ、各変更または変更のセットの単一の出力配列を生じる。株を最適化するため(例えば、高収量で有機化合物を効率的に産生する微生物を製造)、LIMSは多くのそのようなDNA出力配列を同時に産生し、それらは同じ時間枠内で分析され、どの宿主細胞が、したがって入力配列へのどの改変が所望の特性を最良に達成するか決定され得る。以下に示されるように、本発明の実施形態のゲノム設計言語は、簡潔な、ヒト−読み取り可能式を提供し、平行して多くのゲノム設計を生成する。
いくつかの実施形態では、システムは複数のヌクレオチド配列構築物(例えば、プロモーター、コドン、または遺伝子のようなDNA構築物)の設計を可能にし、それぞれ1つもしくは複数の変更を伴い、作業指示(概して、本明細書では「製造指示」と呼ぶ)を作成し、遺伝子製造システムまたは工場210に指示して構築物を担持する微生物の形態でヌクレオチド配列構築物を構成する。本発明の実施形態により、製造指示は事前に定義されている製造実行ワークフローにそって工場ビルドグラフに具体化され得る。構成され得る微生物の例としては、限定はされないが、細菌、真菌、および酵母などの宿主が挙げられる。システムにより、微生物は次いでそれらの特性を試験される(例えば収量、力価)。フィードバックループ様式で、結果を分析し、先の世代の設計を反復して改善し、より最適な微生物の性能を達成する。
本開示は主にDNA構築物について言及するが、当業者は、本明細書の実施形態が任意のヌクレオチド配列/核酸配列(例えば、メッセンジャーRNA、IUPACアルファベットでの任意のそのような配列)に容易に拡張され得ること、およびDNA配列だけに限定されないことを認識する。さらに、設計、構成、試験、および分析プロセスは、主に微生物ゲノム改変の文脈で本明細書に記載されるが、当業者は、このプロセスが所望の遺伝子改変および任意の型の宿主細胞における発現目的のために使用され得ることを認識する。
図1および2をより詳細に参照すると、入力インターフェース202、例えばプログラムエディターを実行するコンピュータは、1つもしくは複数のDNA出力配列(図2の302参照)の設計を開発するために使用されるプログラム/スクリプトの文を受け取る。そのようなゲノム設計プログラム言語は、本発明の出願人によって開発された「Codon」プログラミング言語と本明細書では呼ばれ得る。本発明の実施形態の強力な特徴は、同じプログラム内でほんのわずかな手続き文により非常に大量のDNA配列の設計を開発できることである(例えば、微生物株、プラスミド)。
プログラム文は、キーワード、演算の指定、および少なくとも1つの引数、ゼロまたはそれよりも大きい引数の前に呼び出す関数名によって指定される関数呼び出し(その戻り値は、次いで評価時に破棄される)、または変数名によって後続の式に含まれ得る変数への式または値の割り当てを含み得る。式は、値へと評価(解決)され得る記号のコレクションである。関数呼び出しは、文または式として使用され得る。
ここで、例えば、図7に関して記載したように、計算デバイスのキーボードおよびマウスを使用して、グラフィカルもしくはテキスト入力により、またはメニューもしくはフォームによって、エディターはユーザーがプログラムに入力および編集するのを可能にする。当業者らは、他の入力インターフェース202がユーザーの直接入力の必要性なく用いられ得ることを認識し、例えば、入力インターフェース202はアプリケーションプログラミングインターフェース(API)を用い、別の計算デバイスからのプログラムを含むファイル中の文を受け取ることができる。入力インターフェース202は、ローカルまたはリモート接続によりシステムの他の要素と通信し得る。
インタープリタまたはコンパイラ/実行ユニット204は、本発明の実施形態の新規のDNA仕様データ構造へのプログラム文を評価する(304)。データ構造の詳細を以下に記載する。(「DNA仕様(DNA specification)」は、そのデータ型により「DnaSpecification」とも本明細書において呼ばれる。さらに用語「DNA仕様」は、DNA配列だけに限定されず、むしろ任意のヌクレオチド配列に適用される。本明細書で使用する場合、「DNA仕様」は、入力引数から1つもしくは複数のDNA/ヌクレオチド配列を作成する方法の仕様および「連結する」などの命令を指す。DNA仕様が評価される場合、それは以下に記載するように、その出力配列も記録し得る。)
本発明がインタープリタまたはコンパイラのいずれかによって実行され得る場合;プログラム文が解釈またはコンパイルされ得るため、用語「インタープリタ」および「コンパイラ/実行ユニット」は、本明細書において交換可能に使用されるべきである。コンパイラが用いられる場合、本発明のシステムにおいて実行ユニットが続く。
典型的には、最後には、プログラムスクリプトは、「設計キャンペーン」に含まれるプログラムの最終出力を表すDnaSpecificationを識別する「create」文を含む。設計キャンペーン自体は、DNA配列の産生のための製造指示の前身であり、以下に記載する。1つもしくは複数のcreate文が提供され得る;複数のそのような文が使用される場合、DNA仕様のコレクションは、トップレベルの「list」仕様に一緒に保持される。
インタープリタ204は、DnaSpecificationデータ型によって表される設計キャンペーンへのcreate文のDNA仕様引数を評価する。create文自体は、create文の引数が、引数によって識別される配列を産生するための製造指示を生成するために使用されることを示す発注エンジン208によって読み取るインジケーター(例えば、フラグまたは他のインジケーター)を含み得る。
本発明の実施形態では、この段階では、インタープリタ204は、そのデータ構造が解決した出力を含むようなDNA仕様によって指定される演算を実行し得る。しかしながら、他の実施形態では、インタープリタ204はそれらの演算を実行せず、出力DNA仕様データ構造は解決された任意の出力を含まない。代わりに、以下に記載したように、実行エンジン207は出力を解決する。
式の評価において、インタープリタ204は、例えば、カスタム/ローカルデータベース、公共データベース、またはユーザー提供のファイル(利便性のため、本明細書では「ライブラリー」と総称して呼ぶ)など、DNA配列データの1つもしくは複数のソースを指し得る。電子回路の設計と同様に、合成生物学設計は、再利用できる成分のライブラリーから階層的に構成され得る。ライブラリー206はDNA配列および微生物の特性を反映するデータ(例えば、アノテーション)を含み得る。例えば、ライブラリーは、E.coliの異なる株のDNA配列、公知のDNA配列内のプロモーターおよびターミネーターの位置、ならびに微生物株内の遺伝子の位置を表すデータを含み得る。例えば、ライブラリーは、数千のDNA成分を含有するデータベースを含み得る−そのいくつかは微生物株ゲノム全体、そのいくつかはより小さい遺伝子部分である。Codon文は、固有IDによってこれらのいずれかを指し得る。ライブラリー206は、先のCodon評価の実行の出力−設計キャンペーンまたは製造指示−も指し、その両方ともDnaSpecificationデータ型に具体化され得る。特に、ライブラリー206は、本明細書に記載の分析段階から生じる遺伝子型−表現型相関データの「ライブラリー」を保存し、新しい工場生産のための所望の表現型特性を達成する候補としてベース株および遺伝子改変の選択を可能にし得る。
DnaSpecificationはIDによっても示され得る。本発明の実施形態により、IDはDnaComponentおよびDnaSpecificationに同じように非オーバーラップの配列においてインタープリタ204によって発行され、それらはライブラリー内の入力として交換可能に使用され得る。しかしながら、DnaComponentおよびDnaSpecificationに別々のルックアップ関数を使用することにより、同じIDが各型のコレクション内でDnaComponentまたはDnaSpcificationのいずれかに有効な識別子である場合でさえも、システムおよびユーザーはDnaComponentとDnaSpecificationの間を区別できる。さらに、ライブラリーはDNA配列を、Codonスクリプトに使用され得るファイルに保存できる(典型的には、FASTAまたはgenbankフォーマットで)。
実施形態では、インタープリタ204の代わりに、実行エンジン207がDNA仕様を実行し得る(307)。例えば、実行エンジン207は、DNA仕様によって指定された1つもしくは複数の演算子を実行でき、DNA仕様によって指定された適切な入力に演算子を適用する。この時点で、DNA仕様データ構造は生じる解決された出力、ならびに1つもしくは複数の演算子および入力(および以下で議論するパラメーター)を含む。これらの出力はDNA成分の順序リストとして表され得る(例えば、以下の実施例に記載のクロス乗積要素)。
実施形態では、発注エンジン(あるいは、仕様/キャンペーンインタープリタまたは工場発注装置と呼ばれる)208は、設計キャンペーンを表すDNA仕様を解釈し、どの中間DNA部分が産生され、または工場210への入力として必要とされるか決定する(308)。一般に、いくつかの実施形態では、工場発注装置208は2つの入力:DnaSpecificationおよびワークフロー情報を必要とし、何が構成され(DnaSpec)、どのようにユーザーがそれを構成しようと意図しているかを示す(ワークフロー)。それに基づき、工場発注装置208は、既知のヒューリスティックおよび他の特性に従う既知のアルゴリズムを使用する(例えば、一般的な装置での実行に最適な融解温度)ワークフロープロセスに必要とされる中間部分を計算できる。本発明の実施形態では、配列仕様自体は中間入力ならびにワークフローを示すパラメーターならびに開始、中間、および最終演算のための特性を指定し得る。
工場ビルドグラフにより、発注エンジン208はDNA仕様を論理的仕様から物理的製造プロセスへと変換する。上記の形で発注エンジン208によって識別された場合、ワークフロープロセスに必要とされる前駆および中間部分は、実行されたDnaSpecificationにおいて識別された出力とともに、工場ビルドグラフと呼ばれるデータ構造に発注エンジン208によって記録される。(前駆ヌクレオチド配列部分、例えばプライマーは、ヌクレオチド配列アセンブリープロセスの開始部分−中間部分/アセンブリーまたは最終部分/株以外の部分−であり、ビルドグラフ中の他の配列に依存しない。)実施形態では、これは有向非巡回グラフ(DAG)であり、ここで:各ノードはヌクレオチド配列部分、例えば前駆配列部分、中間配列部分、または最終配列部分、または最終株を表し;エッジは特定のさらなる中間または出力部分を作成するプロセスへどの成分が入力であるか通信するために使用される。その後続物の産生における各前駆または中間部分の特定の「役割」は、発注エンジン208によるビルドグラフの各エッジにも記録される(すなわちエッジを表すデータ構造の部分)。ビルドグラフの特定の形は、ユーザー提供のワークフローによって定義され、一連の変更により最終的な所望の設計を産生する特定の実験室プロトコールにおいて実施される実際の物理的なステップの表示である。発注エンジン208は、ワークフローに必要な役割の先験的知識からの各役割を決定し得る。
結果生じる製造指示は、ステップの規定のセット、ならびに構築される各DNA配列のそれらのステップのそれぞれのパラメーター、入力、および出力、の組み合わせを含み得る。製造指示は、開始微生物ベース株を含むDNA部分リスト、プライマーのリスト、ガイドRNA配列、または他の鋳型成分もしくはワークフローへ作用するのに必要な試薬仕様を、以下にさらに議論するように、DNA仕様内の異なる演算のための1つもしくは複数の製造ワークフロー仕様とともに含み得る。これらの初期、中間、および最終部分または株は、工場ビルドグラフに具体化され得る;ワークフローステップは、様々な役割のビルドグラフの要素を指す。発注エンジン208は、上記の情報のためのライブラリー206を指し得る。この情報は、ヌクレオチド配列合成の従来技術ならびにユーザーまたはその他によって開発されたカスタム技術に基づき工場210において物理的(in silicoと対照的に)形態で設計キャンペーン演算を具体化するために使用される。
例えば、反復DNA仕様が環状のトップレベル関数を有し、その入力が連結仕様の鎖であると仮定する。工場発注装置208は、従来技術またはユーザーによって開発されたカスタム/改善した技術により、実験室のヒトまたはロボットがPCR反応を実施し、それぞれの入力を増幅し、次いで環状プラスミドにそれらをアセンブルするように一連の入力を解釈し得る。製造指示は、アセンブリーを行うために作成されるべきPCR産物を特定し得る。製造指示は、PCRを実施するために購入されるべきプライマーも提供し得る。
別の例では、DNA仕様は置換のトップレベル関数を指定すると仮定する。工場発注装置208は、これを細胞の形質転換と解釈し得る(ゲノムの1つのセクションを、生細胞中の別のものと置換するプロセス)。さらに、置換関数への入力はDNAのソースを示すパラメーターを含み得る(例えば、いくつかの他の株から増幅された別のプラスミドの除外)。
発注エンジン208は、ローカルまたはリモート接続にわたり製造指示を工場210に通信し得る。製造指示に基づき、工場210は、外部業者および内部記憶装置から短いDNA部分を獲得し、GibsonアセンブリープロトコールまたはGolden Gateアセンブリープロトコールなど当技術分野で公知の技術を用いて、入力設計に相当するDNA配列をアセンブルできる(310)。工場ビルドグラフに関して以下により詳細に議論したように、グラフのエッジに与えられた役割は、様々な技術に使用される(例えば、Gibsonアセンブリー)ビルドグラフの要素およびどのようにそれらが多重化操作に組み合わされるか(96ウェルプレートで起こるなど)を指定する。製造指示自体は、製造の開始、中間、および最終段階中にどの技術を用いるか指定し得る。例えば、多くの実験室プロトコールは、鋳型配列および2つのプライマー配列を必要とするPCR増幅ステップを含む。工場210は部分的にまたは完全にロボットの自動化を使用して実行され得る。
本発明の実施形態により、製造指示は工場210においてそれぞれ異なる遺伝子構造を伴う数百または数千のDNA構築物の産生を指定し得る。DNA構築物は、典型的にはベース株への挿入のために環状にしてプラスミドを形成する。工場210において、ベース株はアセンブルしたプラスミドを受け取るために調製され、次いで挿入される。
工場210でアセンブルした結果生じるDNA配列は、試験装置212を使用して試験される(312)。試験の間、微生物株は、サイズおよびシークエンシング法に基づく品質管理(QC)評価に供される。生じる、QCを合格した改変株は、次いで液体またはコロニー培養からプレート上に移され得る。産生条件をモデルとする環境条件下で、株を増殖し、次いで試験性能をアッセイする(例えば、所望の産物濃度)。同じ試験プロセスはフラスコまたはタンクで実施され得る。
フィードバックループ様式で、結果は分析装置214によって分析され、どの微生物が所望の表現型特性を示すか決定し得る(314)。分析段階の間、改変株培養はそれらの性能、すなわち工業規模で産生される能力を含む、所望の表現型特性のそれらの発現を決定するために評価される。分析段階は、とりわけ、コロニーの健康の指標として微生物コロニーの増殖を測定するため、プレートの画像データを使用する。分析装置214は、遺伝的変更を表現型性能と相関させるために使用され、生じる遺伝型表現型相関データ(ライブラリー206で保管され得る)をライブラリーに保存し、将来の微生物産生を伝える。
LIMSは、先の工場生産から開発された相関に基づく設計/構成/試験/分析サイクルを繰り返す。続くサイクル中、分析装置214は、単独でまたはヒト操作者と併せて、より微細な粒度(granularity)で、より良い表現型性能を達成するために遺伝的改変を微調整する相関データを使用して入力インターフェース202に入力し戻すためのベース株として最良の候補を選択し得る。この形で、本発明の実施形態の実験室情報管理システムは、品質改善フィードバックループを実行する。
データ構造
ヌクレオチド配列アセンブリーのいくつかの従来の技術とは違い、本発明の実施形態は、所望の配列を直接表すリテラル文字列(literal string)の入力を必要としない。エディターまたは他の入力インターフェースは、代わりに、または加えて、本発明の実施形態の高位のゲノム記載言語で表される文を受け取る。上記に示したように、本発明の実施形態において、各高位の文は、データ型DnaSpecificationを有する「DNA仕様」を評価する。DNA仕様は、少なくとも1つのDNAオペランド(データ型DnaInputの)によって表される少なくとも1つのDNA部分における少なくとも1つの演算を示すデータ構造である。(本明細書のDNA「部分」は、DNA配列、例えばプロモーター、遺伝子、ターミネーター、またはそれらの任意の組み合わせを指す。より一般的に、本発明は任意のヌクレオチド配列部分に適用する。)DnaInputは、DnaComponent(単一のDNA配列の一義的な表現)または別のDnaSpecificationのいずれかであり得る。入力自体は、スクリプト内の先のCodon文の出力またはスクリプトの先の実行/評価からのCodonスクリプト出力であってよく、DnaSpecificationへの引数として指定される他のDnaInputに実施する演算の順序セットを記載する反復データ構造を生じる。
いくつかの実施形態では、DNA仕様は、DNA部分に実施される単項の演算(例えば、環状化)、または2つもしくはそれよりも多いDNA部分に実施される2項演算(例えば、連結、置換)を示し得る。いくつかの実施形態では、DNA仕様はDNA配列のコンビナトリアルアセンブリーを記載する。
要するに、DNA仕様は:
・DNA成分の構築されたコレクション
・DNA配列関係の簡潔な表現
・コンビナトリアル設計の簡潔な記載
・詳細および抽象の変化する層の入れ子型組織化
・DNAアセンブリーの設計者および製造業者の間の交換フォーマット
を提供し得る。
DNA仕様は、いくつかの実施形態では、3つの部分:
・1つもしくは複数の順序入力のセット
・1つもしくは複数の改変動作
・1セットの順序出力
を有する。
circularize関数など、「単項」入力を扱う関数の場合でさえも、「単項」入力はそれ自体入力のリストであり得ることに留意されたい。この場合、関数の実行は環状DNA配列のリストを送り、それぞれリストからの単一線状入力配列から作成される。バイナリ関数(例えば、concatenate)は2つのそのようなリストを演算し、2つのリストの要素が「ジッパー」(内積)演算(入力リストLおよびR、全「i」について、L[i] OP R[i]、ここで「OP」は内積演算を表す)により、または「クロス乗積」演算(入力リストLおよびR、全「i」、全「j」について、L[i] OP R[j]、ここで「OP」はクロス乗積演算を表す)により組み合わされるかどうか示す関数モディファイアー(DOT(内積)またはCROSS(クロス乗積))によって指定される各リストの要素を組み合わせ得る。各リストの結果は、それぞれベクターまたはマトリクスと見なされ得る。
いくつかの実施形態では、DNA仕様内のDNAオペランドは、DNA仕様自体またはDNA成分としてのいずれかとして表され、DNA成分はヌクレオチドの配列を直接表すリテラル英数字文字列の列によりDNA部分を表し得る。いくつかの実施形態では、上記のように、DNA成分は、例えば識別番号、ソース、分子形態(例えば、線状、環状)などのDNA部分の特性を記載するメタデータアノテーションも含み得る。
とりわけ、上記のように、いくつかの実施形態では、DNA仕様のDNAオペランドはDNA部分のリストを表し得る。部分のこれらのリストはDNA成分のリスト、DNA仕様、またはDNA仕様のリストであり得る。
DNA成分
DNA仕様の議論の前置きとして、DNA成分の例は、以下のdna()関数を使用する:
この例では、インタープリタは:
を返す。
DNA成分を使用して、インタープリタ204は、スクリプト内で直接、またはライブラリーからそれをロードすることによりDNA配列を指定することを可能にする。例えば、ユーザーはdna()関数自体、例えば
内の短いDNA配列を直接指定できる。
代わりに、ユーザーは、dnaComponent()関数を使用して、そのIDまたはその名称によりDNA成分をライブラリーからロードし得る:
別の代替策として、ユーザーは、dnaForStrain()関数を使用して、微生物株の配列を表すDNA成分をライブラリーからロードし得る:
より一般的に、ローカルソース(ファイル、データベース)からまたは公共ソース(例えばNCBI)から、DNA配列は明確に識別され得る(すなわち文字列から)。
DNA仕様
DNA仕様に関して、インタープリタ204はまた、例えばdnaSpecification()関数を使用して、ライブラリーからロードすることにより、全DNA仕様を含むDNA仕様をユーザーに識別させることを可能にする:
この最後の例はDNA仕様を返すが、先の例はDNA成分を返した。これらの両方ともがDnaInput型のデータを表すため(これら2つの型の「上位型」)、これらはDNA改変関数に交換可能であることが多い。すなわち、引数としてDNA成分またはDNA仕様のいずれかを参照することにより、プログラムはキャンペーンのためのより複雑なDNA仕様を作成し得る。本明細書で議論するように、複雑な仕様でさえも、DNA仕様は多くの配列の取り扱いおよび作成を可能にする簡潔な、ヒト読み取り可能データ構造を提供する。
DnaInput値は、DnaComp(DNA成分;「DnaComp」および「DnaComponent」は本明細書において交換可能に使用され、「DnaComponent」型の変数または値を指す)、DnaSpec(DNA仕様;「DnaSpec」および「DnaSpecification」は本明細書において交換可能に使用され、「DnaSpecification」型の変数または値を指す)、LocatedDnaSpec、List[DnaComp](DNA成分のリスト)、またはList[DnaSpec](DNA仕様のリスト)であり得ることに留意されたい。)
連結関数
ゲノム設計プログラミング言語および本発明の実施形態の演算は多くの異なる関数を支持する。例としては、CodonはDNA部分を連結し大きなアセンブリーの作成を可能にする。Codonは、dna()、dnaForStrain()、およびdnaComponent()などのDNA成分関数による個々の配列の仕様を可能にする。個々の(スカラー)値によって作業する場合の例としては、Codonは2つのスカラー文字列(「+」連結関数を使用する)を以下のように連結することができる:
しかしながら、LIMSは、同時に複数のDNA配列を設計、構成、試験、および分析するように具体的に設計される。したがって、Codonは、例えば、dnaSpecification()関数で複数のDNA配列を表すDNA仕様(DnaSpec)をロードすることにより、ユーザーがDNA配列のリストで作業することを可能にする。プログラムは、例えば、公知のGenbankまたはCSVフォーマットのファイルをライブラリーにアップロードすることにより、配列のリストを表すDNA仕様(DnaSpec)を作成し得る。
配列のリストの連結は、少なくとも2つの方法で実施され得る。リストが同じ長さの場合、DNA仕様は、要素ごとの項目の連結を指定し得る。インタープリタ204によるDNA仕様の実行(または他の実施形態では、実行エンジン207)は[a,b,c]および[d,e,f]を、ad、be、cfのように連結する。この関数は、「内積」を意味する。代わりに、DNA仕様は、それらのデカルトクロス乗積産物による任意の長さのリストの連結を指定し、全ての可能な対を連結し得る。同じ例のリストを使用して、インタープリタ204(または他の実施形態では、実行エンジン207)はクロス乗積出力を、ad、ae、af、bd、be、bf、cd、ce、およびcfとして連結する。これらの出力は、DNA成分として表され得る。本明細書に記載のように、クロス乗積が、メモリ容量に対して非常に多くの出力をもたらす場合、システム200はサンプリングを用い、産生された出力の数を減らす。以下にさらに記載するように、試料セットの重みづけを含む異なるサンプリング技術が用いられ、有益な表現型特性を産生するまたは影響する構成前および試験サイクルの間に決定された遺伝子部分を含み得る。発注エンジン208は、次いで出力に基づく製造指示を作成する。
Codonは、異なる方法で連結関数を表す。concat()関数は、2つのDnaInput引数をとり、要素を連結する。関数は、関数名および引数リストの間に関数モディファイアー[]または[x]を含み、以下の例のようにそれが内積またはクロス乗積であるかどうか示す:
DNA連結は文字列連結(典型的には現在のプログラミング言語において数学様2項演算子を使用して行われるもの)に非常に類似しているため、Codonは連結の省略表現を提供する:以下の例に示すように連結を示すためにまたはxを直接使用する。
反復
図3を参照すると、以下は、本発明の実施形態によって可能な反復的連結関数の実行の例である。ここで、反復は情報の組織化またはレベルもしくは層の関数を指し、ここではオブジェクトは他の類似のオブジェクトを含有し、または関数の評価は他の、類似のサブ関数の評価に依存する。この例では、連結関数、ならびにDNA仕様は、反復的である。
以下の出力「total」のプラスミド形態への「環状化」前に、線状形態の例示的な関数は:
ここでalpha=p1xp2およびbeta=p3xp4、ならびにp1、p2、p3およびp4はプロモーターを表す
として表され得る。
ここで、alphaおよびbetaのクロス乗積連結は外関数(outer function)であり、ここで各alphaおよびbetaは2つのプロモーターの内クロス乗積(inner cross product)を表す。クロス乗積関数へのいずれの入力も、入力のリストであり、単に単一の入力ではないことに留意されたい。
本発明の実施形態のプログラミング言語におけるこの機能性を実行するため、入力インターフェース202は、ユーザーまたは別の計算デバイスから以下のスクリプトを受け取り得る。(以下のコードでは、環状化後、totalは「myplasmid」と改称され、alphaおよびbetaはそれぞれ、「left side」および「right side」と改称される。したがって、my plasmid=circularized(left side x right side)である。)また、プログラムコード中のコメントは、ここでは「//」または「#」のいずれかによって表され得ることに留意されたい。
この例では、インタープリタ204は関数/演算子、入力およびパラメーターによってDNA仕様を事前設定する(populate)が、出力を解決する関数を実行しない。生じるDNA仕様「my plasmid」は以下に従い、図3のツリーデータ構造350として示される。myplasmid DNA仕様データ構造は反復的であり、子DNA仕様(「Child DnaSpec」)を含み、子DNA仕様はこの例では、入力配列オペランドを表すDNA成分を含むことに留意されたい。
サンプリングがないと仮定して、実行エンジン207は、以下の16の配列(DNA成分として表され得る)を産生するオペランドに対してDNA仕様クロス乗積演算子を実行する。配列リストは本開示の他の場所に提供される。
本発明の実施形態の有利な特徴は、発注エンジン208が上記のようなDNA仕様データ構造を用い、工場210が産生する出力ヌクレオチド配列を単に提供するだけでなく製造指示の生成を伝え得ることである。上記のように、データ構造は図3に示すようなツリー形態である。発注エンジン208は、葉(例えば356、358に相当する)から枝へ、開始の根ノード(例えば352に相当する)へツリー構造を上方へ横断し、実行の各段階で実施される演算、ならびに入力、工場ワークフロー、および各段階で用いられる他のパラメーターを決定する。発注エンジン208は、この情報を製造指示に組み入れ得る。(本明細書における演算の「性能」は、実行エンジン207またはインタープリタ204(実施形態に依存する)による演算のin silicoでの実行、または当業者によって認識されるように、本明細書において議論した文脈に依存して、遺伝子製造システムにおける演算の相当する物理的なin vivoまたはin vitroでの物理的具体化を交互に指し得ることに留意されたい。例えば、2つのヌクレオチド配列への連結演算は、コンピュータデバイスによって論理的に実施されるが、工場で2つの物理的な配列を一緒に合わせることによって物理的に具体化される。)
したがって、従来の配列設計実行とは異なり、本発明の実施形態は、単に最終配列出力だけでなく、同様に設計開発の開始、中間、および終了段階での演算および文脈上の情報の工場発注装置(ここでは発注エンジン208)に伝える配列設計のためのデータ構造を提供する。この情報の進展は、工場210への負荷を軽減し、開始および中間部分、ワークフローおよび他のパラメーター全てを決定し、したがって、所望の配列の産生効率を改善する。例えば、DNA仕様におけるこの情報に基づき、発注エンジン208は、改変される最初のベース株、ならびに最終の、所望のヌクレオチド配列をアセンブルするプロセスの異なる中間段階で、工場210において使用される、可能性のある異なるプロモーター、ワークフロー、温度設定およびプライマーを決定し得る。例えば、アニーリング温度の許容範囲は、プラスミドDNAから増幅するよりも、ゲノムDNAから増幅するために異なり得る。
DNA仕様のsetparamキーワードは、任意の作成されたDNA仕様ならびにどのように工場稼働が実施されるかを管理する他の属性の名称および説明をセットするために使用され得る。setparam文は、2つの引数、パラメーター名およびそれに割り当てられた値を取る。いくつかのパラメーターは、単一の文字列値を使用し、その他は単一の文字列または文字列のリストを使用し得る。「name」および「description」パラメーターは、DnaSpecの最も明らかにユーザーが理解できる特性をセットする。以下は、setparamを使用して指定され得るパラメーターの、非網羅的リストである:
amplifyPart−その部分が増幅されるべきかどうか指定する「true」または「false」のブール値。
assemblyMethod−構築物をアセンブルするために工場で使用する構築方法。例えば、「酵母相同組換え」、「gibson」、または「LCR」の1つ
description−DnaSpec/キャンペーンに割り当てる説明
groupName−特定のDnaSpecificationによって産生されたアセンブリー部分のコレクションに割り当てる名称。amplifyPartと併せて使用され得る。
leftTailLenおよびrightTailLen−増幅のために生成する最大テール長を指定する整数値
name−DnaSpec/キャンペーンに割り当てる名称
notes−ヒト参照のキャンペーンについての注記の長いフリーフォームセット。これは文字列のリストであり得る。
outputName−このパラメーター名で作成されるDnaSpecによって生成されるDnaComponentを割り当てる名称を指定する文字列または文字列のリスト。(例えば、入力のセットを環状化する場合、「outputName」、[「myCircular1」、「myCircular2」、...]をsetparamし、異なる環状化構築物を名付けることができる。
primerSource−例えば、キャンペーンのためのプライマーのソースを指定する「IDT」(Integrated DNA Technologies,Inc.)または「library」の1つ
plasmidSource−例えば、キャンペーンのためのプラスミドのソースを指定する「build」または「library」の1つ
targetAnnealingTemperature−構築物を増幅する工場で用いられる所望の温度
置換関数
別の特に適切な関数は、置換関数である。微生物株のDNA配列の遺伝子の前に位置するプロモーターを置換するプログラムの例としては、まず図4のDNA成分を指す。図4は、プロモーター402A、402B、遺伝子404A、404B、およびターミネーター406A、406B(一般的に「p−g−t」配列)の2つのセットを含むアノテートしたDNA配列400、それぞれp1(配列番号17)−YFG1(配列番号18)−t1およびp2−YFG2−t2の例を示す。(アノテーションはプロモーターp1(配列番号17)および遺伝子YFG1(配列番号18)に関して示される。)
図5は、図4のp−g−t配列に適用されるプロモータースワップ演算500を示す。コンビナトリアルクロス乗積(「x」)演算を使用して、プログラムは、p1’、p2’、およびp3’と1つずつ置換したオリジナルのp−g−t配列中のプロモーターとの全てのp−g−t配列の全ての組み合わせを生成し、設計キャンペーンへと変換される6つの出力配列を生じる。(最初の4つの出力配列502を図に示す。)
この演算を実施するためのプログラムコードは以下の通りである。関数の説明はコメント中に与える。
replacePromoter()関数は、所与の遺伝子を制御するとアノテートしたプロモーターを置換する。モディファイアー「x」を呼び出すクロス乗積関数によって示されるように、ここではreplacePromoter()は、「promoters」によって識別されたプロモーター配列の表示によって置換された遺伝子のアノテートしたプロモーターの表示による「genes」によって識別される全てのアノテーション(ゲノム内の位置)の表示を生成する。このcreate関数は、「replace」関数を伴うDnaSpecificationを生成し、パラメーターは「replace−promoter」モードで実施されるべきであることを示しており、1つの引数リストはプロモーターであり、その他の引数リストはLocated DnaSpecification(ここでは「genes」)、すなわち1つもしくは複数のDnaSpecificationであり、その関数は「locate」であり、そのプロモーターがスワップされるべきである名称によって遺伝子のコレクションを示す。「create」関数は、DNA配列の生成のための工場への入力のための設計キャンペーンを作成する。
本発明の実施形態の1つの特徴は、ゲノム設計言語がゲノムアウェア(genome-aware)編集演算を含むことである。例えば、インタープリタ204(またはいくつかの実施形態では、実行エンジン207)はreplacePromoter()を実行し、p−g−t配列の遺伝子を制御するとアノテートされたプロモーターの位置の知識を得る。ライブラリー中のp−g−t配列を読み取ることにより、インタープリタ204(またはいくつかの実施形態では、実行エンジン207)は、そのDNA成分アノテーションから各遺伝子の適切なプロモーターを識別し、次いでプロモーターの置換を可能にする。BBF RFC 108: Synthetic Biology Open Language (SBOL) Version 2.0.0, editors Bartleyら、2015年7月31日(アノテーション)参照。
replacePromoter()は、プロモーターアノテーションを使用して、遺伝子を制御するプロモーターを配置するだけではないことに留意されたい。それは、アノテートしたプロモーターの上流端から遺伝子の開始コドンまでの全配列を置換する。目的の遺伝子のプロモーターアノテーションが存在しない場合、新しいプロモーターが遺伝子の前に挿入される。プロモーターの領域にオーバーラップするアノテーションがある場合、方法はユーザーに警告する、または衝突の修正を試みることがある。
図6は、指定した遺伝子602A、602B、602Cによって置換されるその挿入領域を有するプラスミドの3つの組み合わせ606全てを示すことにより、遺伝子(newGenes)602A、602B、602Cをプラスミド604に挿入するため、replace[x](locateTerm[x](plasmids,”insertion−site”),newGenes)クロス乗積関数のDNA仕様のグラフィカル表示を提供する。関数は、プラスミド挿入領域を有する遺伝子のリストのクロス乗積を用い(スカラーDNA成分によって表され得る)、改変プラスミドを表すDNA仕様を出力する。代わりに、プラスミドはDNA成分として表され得る。関数はまず、locateTerm[x](plasmids,”insertion−site”)を呼び出すことによって置換される配列のプラスミド内の位置を指定する。代わりに、挿入部位は部位の位置の名称を識別することにより配置され得る、例えばlocateName[x](plasmid,”MseI cut site”)。これらの関数は、LocatedDnaSpecificationsを返す。置換関数は次いで、LocatedDnaSpecificationsによって指定される位置へとnewGenesのリストのクロス乗積置換を実施する。
上記の例は、本発明の実施形態のプログラミング言語およびデータ構造の反復的能力の別の利点を実証する。言語は、演算、入力、および製造の各段階で使用される条件を指定することにより、配列製造プロセス(開始、中間、および最終)の全ての段階をユーザーが独立して制御することを可能にする。上記の例では、仕様は、DNA仕様のツリー構造の異なるレベル(ノード)でのクロス乗積演算を指定する:位置解決内部関数ならびに置換関数外側関数でのクロス乗積演算はさらにツリー構造を生じる。同様に、異なる段階/レベルで、点およびクロス演算子の異なる組み合わせ、異なるパラメーター(例えば温度および他の環境条件)、ならびに異なる入力(例えばプロモーター)をユーザーは指定し得る。
非決定的関数
本発明の実施形態は、確率的、非決定的関数を提供し、そのいくつかは、確率的な結果を作成する実験室法の実在の結果を反映する。一般に、確率的な関数は、非決定的な形でヌクレオチド配列への変更をもたらす。例は、配列の無作為な位置への転移因子の挿入、配列のいずれかの場所で1つもしくは複数の単一のヌクレオチド変化(例えば、化学またはUV変異を反映する)、コード配列中の任意の1つのコドンの3番目の位置での1つの単一のヌクレオチド変化(例えば、NNKライブラリーの産生による)、公知の位置での1つまたは2つのヌクレオチド変化(例えば、縮重プライマーによるPCRから)、または定向進化による変化の未知のセットである。
以下の2つの例は、ヌクレオチド配列の生成において条件付き無作為化を可能にする確率的関数を実行する。
プラスミドの作成
別の例としては、以下のプログラムはいくつかのプロモーター、いくつかの遺伝子、ターミネーター、およびプラスミド骨格をロードする。クロス乗積連結関数を使用して、プログラムはプロモーターおよび遺伝子(およびターミネーター)の全ての可能な組み合わせを作成し、それらをそれぞれ骨格に取り付け、それらをプラスミドへと環状化し、全てのこれらの設計を示すキャンペーンを作成する:
サンプリング
上述したように、本発明の実施形態のもののような合成生物学システムは、複数の演算を、複数のDNAオペランドによって表される複数のDNA部分に実施することを可能にする。したがって、生じる設計キャンペーンは何千ものDNA配列の表示を含み得る。例えば、プログラムは10000個の改変ゲノムを生成でき、それは保存スペースのおよそ50〜100GBを占める。この情報は現時点での典型的な従来のメモリにおいて効率的に管理できず、代わりに例えば、より遅いディスクベースのアクセスを必要とする。現在の市販のコンピュータシステムは、ゲノムを表示する50〜100GBのSBOLファイルを効率よくロードおよび演算できない。そのような演算は処理において、破損または容認できない遅延を起こし得る。
本発明の実施形態は、サンプリングによるこれらの保管および処理の問題の可能性を回避する。いくつかの実施形態では、発注エンジン208は、製造指示への組み入れのための出力のサブセットのみを選択し得る。この演算は、多くの異なる技術、例えばN構築物を産生する無作為サンプリング、または最初もしくは最後のK DNA構築物のサンプリングを用いることができる。保存の要件を減らすため、この手法は製造指示への組み入れのためのサンプリングした出力のみを保存し得る。
代わりに、実行エンジン207がDNA仕様を実行し、DNA仕様を事前設定する出力を生成する実施形態では、実行エンジン207自体がインタープリタ204からDNA仕様を任意選択によりサンプリングし、実行のためのDNA仕様のサブセットを選択し得る。この手法は、インタープリタ204のより大きく、反復的なDNA仕様出力データ構造内の、中間の演算(例えば、子DNA仕様)を表すDNA仕様に特に適用可能である。結果として、実行エンジン207は、選択され、実行されたDNA仕様のためのみの出力を産生する。実行エンジン207による実行からのインタープリタ204による解釈のデカップリングは、実行のためのサンプリングの出力のサイズを何桁も低減し、それにより非常に大きな保存能力および重い処理の必要性を減らすことができる。
直前の実施形態のサンプリング演算は、多くの異なる技術、例えば無作為サンプリング、または実行のための最初もしくは最後のK DNA仕様のサンプリングを用いることができる。さらに、実行エンジン207は、実行の前により賢明にDNA仕様をサンプリングできる。1つの手法は、実行のためのDNA仕様を重みづけすることである。例えば、DNA仕様データ構造内で、プロモーターおよび他のパラメーター化因子は、例えば、それらのコスト、入手可能性、または公知の有効性に依存して異なる重みに割り当てられ得る。例えば、DNA仕様データ構造が連結クロス乗積関数を2つの入力オペランド−遺伝子のリストおよびプロモーターのリストに適用すると仮定する。この例では、各プロモーターは、実行のためのDNA仕様のその選択において、実行エンジン207に伝える0と1の間の重みづけパラメーター(params)を割り当てられ得る。リスト中のプロモーターの重みが高いほど、実行エンジン207は(連結クロス乗積演算子を適用する)そのようなプロモーターのためにDNA仕様を実行する可能性がより高い。
重み自体は、DNA仕様のパラメーターとして加えられ、他のパラメーターを重みづけする。例えば、子DNA仕様(すなわちトップレベルDNA仕様より下位)は、子DNA仕様内の単一のプロモーターのweightPromoter=p、または同じ子DNA仕様内のプロモーターのリストのweightPromoter=[p,p,...p]として表される確率的な重みを割り当てた重みづけパラメーターを含み得る。パラメーター(例えばプロモーター)、特に反復的DNA仕様の階層ツリー構造内の同じレベルの演算でのパラメーターの重みの合計は、値1まで加えられ得る。
別の戦略は、実験方法の設計を用い、各々の効率を学習するためにプロモーター−遺伝子の可能な組み合わせを指定した数だけ賢明に選択することである。この実施の一部として、実行エンジン207は、一実施形態では、適切な仕様を実行し、組み合わせにおいて各プロモーターが少なくとも一度は使用されることを確かめ得るが、組み合わせの総数は制限される。
DNA成分さえも重みづけされ、DNA成分へのその演算子の実行において実行エンジン207を誘導し得る。例えば、入力としてDNA成分のリストを有するDNA仕様は、DNA成分のリストのための重みベクトルweightVector=[p,p,...p]を含み得る。
キャッシング
本発明の実施形態では、実行エンジン207(またはインタープリタがDNA仕様を実行する実施形態ではインタープリタ204)は、キャッシングを用い、DNA仕様の実行の間に再使用され得る結果の再計算を避けることができる。例えば、仕様はクロス乗積連結Ax(BxC)を指定でき、ここではA、B、Cはヌクレオチド配列の長いリストである。実行エンジン207は、Aの各要素と、クロス乗積BxCから生じる全ての要素とを連結する。Aの各項目との各連結のためのBxC出力を再計算することは冗長であり、時間がかかるため、実行エンジン207は、BxCの最初の計算後、それらのBxCの結果を代わりにキャッシュし、次いでそれらの結果を使用してAの要素とのにクロス乗積計算をもたらす。したがって、キャッシングは処理時間を減らし、処理速度を上げる。
キャッシングは、同じ実行内だけでなく(例えば指示の生成)、異なる実行に渡って使用が見出される。例えば、ユーザーは、以前の指示から生成された配列と比較してより良いまたは異なる結果が望まれることを決定し得る。したがって、ユーザーは、プログラムを再実行し、別の製造指示を置き、おそらく今度はサンプリングを、実行するDNA仕様の異なるサブセットの選択に向ける。しかしながら、そうすることで、スクリプトは先の指示生成実行と同じ中間演算のいくつかの実行を依然として必要とし得る。右側および左側プロモーターの入れ子型連結の本明細書における例を参照して、ユーザーは、より高レベル(トータル)連結関数を再実行し、異なる右側配列出力を得るが左側演算は変更しないことを望み得る。したがって、システムは、高レベル関数の再実行の間に、低レベルの、後で使用するための左側の中間結果をキャッシュし得る。一般に、低レベル演算の出力(例えば階層ツリー構造の葉において)は、より高いレベルの演算よりも繰り返し必要とされ、実行エンジン207は、保存が条件付きである場合、高レベルからのものよりも低レベル出力のキャッシングを好み得る。前述のものに基づき、本発明の実施形態の実行エンジン207は、ツリー構造内の異なるレベルの演算からのDNA仕様結果をキャッシュし、続く実行中の再実行を回避し、したがって処理時間を減らし、処理スピードを上げる。
工場ビルドグラフ
工場ビルドグラフは、事前に定義されている工場製造ワークフローと共に、製造指示の実施形態である。工場発注エンジン208は、要約の形態で、1つもしくは複数の所望のDNA設計を作成する論理命令のコレクションを記載するDnaSpecificationを受け取ることができ、これは、典型的には微生物または他の宿主細胞内で具体化される。特定の所望のアセンブリー技術、または出力設計もしくは細胞宿主の制約によって必要とされるアセンブリー技術に依存して、特定の製造ワークフローが選択され(発注エンジン208により、またはユーザーによって供給された場合)、作業を実施する。DNA仕様においてまだ指定されていないワークフロー、ならびに製造パラメーター(例えばプライマー)は、産業界では公知の、または開発者に所有権のある、物理的なワークフローに基づき決定され、所与の入力配列に基づく中間または最終のヌクレオチド配列を合成する実験により開発された。このワークフローは、各特定の出力設計を製造する各ステップにおいて実施する作業を記載する入力のセットと対になる。
工場ビルドグラフは、有向非巡回グラフ(DAG)を持つデータ構造(補遺2を参照)の形態をとり得る。グラフは、ゼロまたはそれよりも多くの性質とともに、2つの型、ノードおよびエッジの記録のコレクションである。各ノードは、ノードIDを有し、それから発するエッジを追跡する。各ノードは、本発明の実施形態によりヌクレオチド配列(例えばDNA)部分、または細胞株を表す。これらの部分は、前駆体(例えば、第三者の業者から指示されたプライマー)、中間部分(例えば、連結の結果であるより長いDNAセグメント、または最終株のDNA配列に変更を組み入れるために使用されるプラスミド)、または最終DNA配列、株、またはその生物自体であり得る。
発注エンジン208は、上方の葉からのDnaSpecificationを横断し(上記のように)、どのようにツリーのレベルでの中間、または最終結果が先の従属部分から作成されるか計算する機会として各接合部を使用する。発注装置208は、この情報をDAGのデータ構造に記載する。この情報は、演算を物理的に実施するために使用される特定のワークフローステップの文脈で記録され、したがってビルドグラフのノードにおけるステップの入力および出力の記録に加えて、各エッジは、ソースノードが特定の標的の構築において果たす「役割」によってもアノテートされる。グラフのデータ構造におけるノードおよびエッジは、ワークフローをパラメーター化するために必要とされるであろう他のパラメーターも保持する(例えば、PCR反応で使用されるサーモサイクラーの温度設定)。
工場ビルドグラフの要素は、DnaSpecificationに文字通りに記載される配列またはサブ配列の組み合わせ、ならびに工場発注エンジン208自体によって算出される他の配列、例えば図8に示すようにPCRプロセスにおいてより長い鋳型配列の特定のサブ配列を増幅するために使用されるプライマーである。この場合、発注装置208は、グラフのノードによってより長い鋳型配列を表し得る。発注装置208は、この鋳型配列ノードから、「鋳型配列」などの役割を有するPCR産物を表すノードへエッジをアノテートし得る。発注装置208は、他のノードで算出したプライマーを保管し、「増幅プライマー」などの役割を有するPCR産物にそれらのエッジをアノテートし得る。これらのノードの全ては、PCR増幅サブ配列を表す4番目のノードにアウトバウンドエッジを有する。
特に、図8は、工場ビルドグラフ例の図である。簡単のために、この例は部分ビルドグラフである;完全なグラフは全ての根の前駆体から全ての最終設計までの全ての情報を含有するであろう。図8において、ノード902はDNA配列を表す。エッジ904は、ノード906の出力DNA配列への工場ワークフロープロセスを通してノード902の入力DNA配列に連結し、特定の出力906の産生において特定の入力902の役割(904では「プライマー」)を指定する。ノード906の出力配列はPCRプロセスの増幅配列を含む。ノード908のような他のノード(発注エンジン208によって計算されるまたはユーザーによって提供される)は、ノード908の配列の物理的またはメタデータ処理に必要なさらなるパラメーターおよび情報を含有し得る。補遺2は、図8に示す上位5つのノードのデータ構造表示の例を提供する(JSONシリアル化形態で、ノード1 902、ノード2 914、ノード3 916、ノード4 906、ノード5 912)。
図8では、グラフはプラスミド骨格の役割に作用することが示されている、ノード910の配列と連結される、ノード906から発するエッジに示されるように、ペイロード領域の役割に作用するノード906の配列を表す。発注装置208は、ノード912に示されるように、これら2つの入力を、「ペイロード領域をプラスミド骨格と連結し、結果を環状化する」の物理的な製造ワークフローと関連させる。発注エンジン208によって支持される演算は、特定の前駆体または中間配列が同じ指示の部分として産生される複数の所望の出力配列の製造に使用され得る場合を認識する能力である。発注エンジン208は、それに直接依存するすべての中間または最終配列をもたらす複数の出力エッジで、グラフの単一のノードによってそのような配列(例えば、共通のプラスミド骨格910)を表し得る。発注エンジン208は、この情報を使用して容積、濃度、または完全な指示に相当するサブワークフローの製造を実施するのに必要な他の量を計算し得る。ノードのアウトバウンドエッジの数も発注エンジン208によって使用され、異なるサブワークフローの相当する配列の処理を指定することができる。例えば、高頻度使用のアンプリコンは、1度だけ現れるアンプリコンとは異なる手段によって処理され得る。また、ビルドグラフの各パスは一意的に索引づけられ、異なる製造指示ビルドグラフからの他のパスと独立して組み合わされ得る。この構築は、遺伝子製造システムが、単一の製造指示で指定されるヌクレオチド配列の特定のセットからデカップリングされる形で複数のヌクレオチド配列の配列部分をアセンブルすることを可能にする。
コンピュータシステム
図7は、本発明の実施形態により、固定コンピュータ読み取り可能媒体(例えばメモリ)に保管されるプログラムコードを実行するために使用され得るコンピュータシステム800の例を示す。コンピュータシステムは、入力/出力サブシステム802を含み、これは、入力インターフェース202を実行するために使用されて、ヒトユーザーおよび/またはアプリケーションに依存的な他のコンピュータシステムとインターフェースで接続し得る。例えば、本発明の実施形態のエディターは、使用されるI/Oサブシステム802によるシステム800におけるプログラムコードで実行され、ヒトユーザーからの入力プログラム文を受け取る(例えば、GUIまたはキーボードにより)およびそれらをユーザーに戻すことを示すことができる。I/Oサブシステム802は、例えば、キーボード、マウス、グラフィカルユーザーインターフェース、タッチスクリーン、または他の入力のためのインターフェース、および例えばLEDもしくは他のフラットスクリーンディスプレイ、または出力のための他のインターフェースを含み得る。本発明の実施形態の他の要素、例えば発注エンジン208は、しかしながらおそらくI/O無しのコンピュータシステム800のようなコンピュータシステムにより実行され得る。
プログラムコードは、持続保存装置810もしくはメモリ808または両方など固定媒体に保存され得る。プロセッサ804は、1つもしくは複数の固定媒体からプログラムコードを読み取り、コードを実行して、コンピュータシステムに図2のフローチャートによって表されるものなど、本明細書の実施形態によって実施される方法を達成させる。当業者は、プロセッサが、例えば本発明の実施形態の高レベルゲノム設計言語で示される文などのソースコードを取り入れ、プロセッサのハードウェアゲートレベルで理解可能な機械コードへとソースコードを解釈またはコンパイルし得ることを理解する。バスはI/Oサブシステム802、プロセッサ804、周辺デバイス806、メモリ808、および持続保存装置810を連結する。
当業者は、図1に示すような本発明の実施形態の要素のいくつかまたはすべて(例えば、インタープリタ、実行エンジン、発注エンジン、工場、試験装置、分析装置)、および図2に示すようなそれらの付随的な演算が、コンピュータシステム800のもののような1つもしくは複数のプロセッサおよび1つもしくは複数のメモリシステムを含む1つもしくは複数のコンピュータシステムに完全にまたは部分的に実行され得ることを理解する。いくつかの要素および機能性は局所的に実行され、その他は異なるサーバ、例えばクライアントサーバ様式によるネットワークに渡る分配様式で実行され得る。
本発明は、例示的な実施形態に関して特に記載してきたが、様々な変更、改変および適合が本開示に基づいてなされ、本発明の範囲内であることが意図されることが認識されるだろう。本発明は開示した実施形態に関して記載されるが、本発明は開示される実施形態に限定されないと理解されるが、反対に、請求項の範囲内に含まれる様々な改変および等価な並び替えもカバーすることを意図する。
補遺1:関数参照
この補遺はLIMSのCodon言語のための組み込みライブラリーにおいていくつかの利用可能な関数を記載する。
ベース株の指定した位置において、その位置で識別されたサブ配列を、「insertions」によって指定された新しい配列で置換する。
「insertions」において、複数の挿入を指定し得る。クロス(「[x]」)または点(「[]」)演算子のどちらが選択されるかにより、「baseStrain」でそれぞれの生じた位置に1つの挿入を置き、またはそれぞれの挿入をそれぞれの可能な位置に適用する。
置換演算は、置換配列部分「insertions」で空の置換可能領域を置換する厳密な挿入演算を指定し得る。代わりに、置換演算は、空の置換配列部分で置換可能領域を置換する厳密な欠失演算を指定し得る。
いくつかのDnaInputを考慮して、その周りを取り囲むLocatedDnaSpecを返す。LocatedDnaSpecは同じ出力を含有するが、識別した領域についての位置情報により、出力パラメーターに返される。LocatedDnaSpecは、その関数がLOCATEであるDnaSpecificationである。領域の識別は、DnaSpecification内のパラメーターマップによって行われる。
位置は単一の塩基または多くの塩基にわたって伸びる領域のいずれかであり得る。
位置は単一のオフセット、または「offset」から「offset+length」、または「offset+len(subseq)」に伸長する領域のいずれかとして指定される。後者の場合、「subseq」は、「offset」で開始する確実にマッチングするDNA配列でなければならない。
位置は、各ベース株要素においてアノテートした領域の(一意的な)名称としても与えられ得る。位置領域はアノテーションの全範囲である。
複数のアノテーションまたはoffset/offset+length/offset+subseq値が与えられる場合、それぞれ点(「[]」)またはクロス(「[x]」)演算子が選択されるかどうかによって、これらは、「baseStrain」の個々の要素に一時に一つ適用される、または全てが「baseStrain」の全ての要素に適用される。
アノテーションベースの位置は、返すための特定のアノテーション名(この場合、それらは入力ゲノム当たり1つの位置に返されるべきである)またはアノテーションの配列特徴項名(この場合、入力ゲノム当たり多くの位置が返され得る)のいずれかとして指定され得る。
LocatedDnaSpecは、「insert」、「replace」、および「delete」など関数への入力として使用され得る。DNA配列から塩基を取り除く場合(例えば、「replace」および「delete」として)、塩基対の数、または取り除かれる特定のサブ配列のいずれかにおいて、取り除かれる量は「locate()」へのパラメーターとして指定される。すなわち、配置された領域全体が「replace」または「delete」によって取り除かれる。
空のサブ配列または0の長さを指定し、欠失がないことを示し得る。(例えば、「replace()」関数は純粋な挿入に使用される)。
オフセットは1で開始し、「|the DNA sequence|」に達するおよび含む。以下の例を検討する:
ベース株の指定した位置において、指定した挿入を挿入する
「baseStrain」または「insertions」が複数の入力である場合、挿入は、関数呼び出しモディファイアーにつき「baseStrain」の要素での内積またはクロス乗積において実施される。
アノテーションの方向に対して、ベース株において指定したアノテーションの直後に「insertions」によって指定したDNAを挿入する。すなわち、「順方向」アノテーションでは、アノテートした配列の右に挿入し(5’から3’へ読み取る);逆方向のアノテーションでは、左に挿入する。
「baseStrain」または「insertions」DnaInputsが複数の入力を表す場合、挿入は、関数呼び出しモディファイアーにつき全ての「insertions」例と全ての「baseStrain」例の内積またはクロス乗積としてなされる。
アノテーションの方向に対して、ベース株において指定したアノテーションの直前に「insertions」によって指定したDNAを挿入する。すなわち、「順方向」アノテーションでは、アノテートした配列の左に挿入し(5’から3’へ読み取る);逆方向のアノテーションでは、右に挿入する。
「baseStrain」または「insertions」DnaInputsが複数の入力を表す場合、挿入は、関数呼び出しモディファイアーにつき全ての「insertions」例と全ての「baseStrain」例の内積またはクロス乗積としてなされる。
補遺2:データ構造
この補遺は、本発明の実施形態によって用いられ得るデータ構造の例を提供する。それはDnaSpecificationおよびDnaComponent、Avro仕様フォーマットで以下によって指定およびシリアル化され得るデータ構造を参照する:(http://avro.apache.org/docs/current/spec.htmlを参照)
以下は図8に示す上位5つのノードのデータ構造表示の例である(JSONシリアル化形態で、ノード1 902、ノード2 914、ノード3 916、ノード4 906、ノード5 912):

Claims (21)

  1. 遺伝子製造システムによるヌクレオチド配列の産生を制御する製造指示を生成するためのコンピュータ実行方法であって、
    第1の配列オペランドおよび第2の配列オペランドの演算を示す式を計算デバイスにおいて受け取るステップであって、配列オペランドがヌクレオチド配列部分を表し、前記第1の配列オペランドおよび前記第2の配列オペランドがそれぞれ少なくとも1つのヌクレオチド配列部分を表す、ステップ;
    配列仕様に対して前記式を評価する命令を計算デバイスによって実行するステップであって、前記配列仕様が、(a)前記第1の配列オペランドおよび前記第2の配列オペランドと、(b)少なくとも1つの第1レベルの配列オペランドに実施される1つもしくは複数の第1レベルの演算と、(c)1つもしくは複数の第2レベルの演算とを含むデータ構造を含み、その実行が、前記少なくとも1つの第1レベルの配列オペランドの値を解決する、ステップ;ならびに
    前記第1レベルの演算の1つもしくは複数および前記第2レベルの演算の1つもしくは複数の計算デバイスによる実行に基づく製造指示であって、配列部分を少なくとも1つのヌクレオチド配列にアセンブルする前記遺伝子製造システムによる使用のための製造指示を生成するステップ
    を含む、コンピュータ実行方法。
  2. 前記データ構造が、前記1つもしくは複数の第1レベルの演算の少なくとも1つまたは前記1つもしくは複数の第2レベルの演算の少なくとも1つが前記遺伝子製造システムによってどのように具体化されるかに関する複数のパラメーターをさらに含み、
    製造指示を生成するステップは、前記複数のパラメーターにさらに基づく、
    請求項1に記載の方法。
  3. 前記複数のパラメーターが、
    前記1つもしくは複数の第2レベルの演算の最初の第2レベルの演算の具体化において前記遺伝子製造システムにより使用される第1のパラメーター、および
    前記1つもしくは複数の第2レベルの演算の2番目の第2レベルの演算の具体化において前記遺伝子製造システムにより使用される、前記第1のパラメーターと異なりかつ前記第1のパラメーターと同じカテゴリーのパラメーターを表す第2のパラメーター
    を含む、請求項2に記載の方法。
  4. 前記データ構造が1つもしくは複数の第2レベルの配列仕様を含み、各第2レベルの配列仕様が1つもしくは複数の第2レベルの配列演算を含み、
    製造指示を生成するステップが、前記1つもしくは複数の第2レベルの配列仕様から第2レベルの配列仕様のサブセットを実行するために選択することを含む、
    請求項1から3のいずれか一項に記載の方法。
  5. 第2レベルの配列仕様を選択することが第2レベルの配列オペランドの重みづけに基づく、請求項4に記載の方法。
  6. 前記第2レベルの配列仕様が、前記製造指示より以前に生成された少なくとも1つの先行製造指示の結果としてアセンブルされたヌクレオチド配列の表現型特性とのそれらの関連に基づく実行のために、重みづけられる、請求項4または5に記載の方法。
  7. 有向グラフが前記製造指示の生成に使用される、請求項1から6のいずれか一項に記載の方法。
  8. 遺伝子製造システムによってヌクレオチド配列の産生を制御する製造指示を生成するためのシステムであって、
    1つもしくは複数のプロセッサと;
    前記1つもしくは複数のプロセッサの少なくとも1つに動作可能に接続されている1つもしくは複数のメモリであって、前記1つもしくは複数のプロセッサの少なくとも1つによって実行される場合、前記システムに、以下:
    第1の配列オペランドおよび第2の配列オペランドの演算を示す式を受け取らせることであって、配列オペランドがヌクレオチド配列部分を表し、前記第1の配列オペランドおよび前記第2の配列オペランドがそれぞれ少なくとも1つのヌクレオチド配列部分を表す、受け取らせること;
    配列仕様に対して前記式を評価させることであって、前記配列仕様が、(a)前記第1の配列オペランドおよび前記第2の配列オペランドと、(b)少なくとも1つの第1レベルの配列オペランドへ実施される1つもしくは複数の第1レベルの演算と、(c)1つもしくは複数の第2レベルの演算とを含むデータ構造を含み、その実行が、前記少なくとも1つの第1レベルの配列オペランドの値を解決する、評価させること;ならびに
    前記第1レベルの演算の1つもしくは複数および前記第2レベルの演算の1つもしくは複数の実行に基づく製造指示であって、配列部分を少なくとも1つのヌクレオチド配列にアセンブルする前記遺伝子製造システムによる使用のための製造指示を生成させること、
    を行わせる命令が保存されているメモリと
    を含む、システム。
  9. 前記データ構造が、前記1つもしくは複数の第1レベルの演算の少なくとも1つまたは前記1つもしくは複数の第2レベルの演算の少なくとも1つが前記遺伝子製造システムによってどのように具体化されるかに関する複数のパラメーターをさらに含み、
    製造指示を生成するステップが前記複数のパラメーターにさらに基づく、
    請求項8に記載のシステム。
  10. 前記複数のパラメーターが、
    前記1つもしくは複数の第2レベルの演算の最初の第2レベルの演算の具体化において前記遺伝子製造システムにより使用される第1のパラメーター、および
    前記1つもしくは複数の第2レベルの演算の2番目の第2レベルの演算の具体化において前記遺伝子製造システムにより使用される前記第1のパラメーターと異なりかつ前記第1のパラメーターと同じカテゴリーのパラメーターを表す第2のパラメーター
    を含む、請求項9に記載のシステム。
  11. 前記データ構造が1つもしくは複数の第2レベルの配列仕様を含み、各第2レベルの配列仕様が1つもしくは複数の第2レベルの配列演算を含み、
    製造指示を生成するステップが、前記1つもしくは複数の第2レベルの配列仕様から第2レベルの配列仕様のサブセットを実行するために選択することを含む、
    請求項8から10のいずれか一項に記載のシステム。
  12. 第2レベルの配列仕様の前記サブセットを選択することが第2レベルの配列オペランドの重みづけに基づく、請求項11に記載のシステム。
  13. 前記第2レベルの配列仕様が、前記製造指示より以前に生成された少なくとも1つの先行製造指示の結果としてアセンブルされたヌクレオチド配列の表現型特性とのそれらの関連に基づく実行のために、重みづけられる、請求項11または12に記載のシステム。
  14. 前記システムに製造指示を生成させる前記命令が、有向グラフを使用する命令を含む、請求項8から13のいずれか一項に記載のシステム。
  15. 遺伝子製造システムによるヌクレオチド配列の産生を制御する製造指示を生成するための命令を保存する1つもしくは複数のコンピュータ読み取り可能媒体であって、
    1つもしくは複数の計算デバイスによって実行される場合、前記命令が、前記1つもしくは複数の計算デバイスの少なくとも1つに、以下:
    第1の配列オペランドおよび第2の配列オペランドの演算を示す式を受け取らせることであって、配列オペランドがヌクレオチド配列部分を表し、前記第1の配列オペランドおよび前記第2の配列オペランドがそれぞれ少なくとも1つのヌクレオチド配列部分を表す、受け取らせること;
    配列仕様に対して前記式を評価させることであって、前記配列仕様が、(a)前記第1の配列オペランドおよび前記第2の配列オペランド、(b)少なくとも1つの第1レベルの配列オペランドに実施される1つもしくは複数の第1レベルの演算、ならびに(c)1つもしくは複数の第2レベルの演算を含むデータ構造を含み、その実行が前記少なくとも1つの第1レベルの配列オペランドの値を解決する、評価させること;ならびに
    前記第1レベルの演算の1つもしくは複数および前記第2レベルの演算の1つもしくは複数の実行に基づく製造指示であって、配列部分を少なくとも1つのヌクレオチド配列にアセンブルする前記遺伝子製造システムによる使用のための製造指示を生成させること、を行わせる、
    コンピュータ読み取り可能媒体。
  16. 前記データ構造が、前記1つもしくは複数の第1レベルの演算の少なくとも1つまたは前記1つもしくは複数の第2レベルの演算の少なくとも1つが前記遺伝子製造システムによってどのように具体化されるかに関する複数のパラメーターをさらに含み、
    製造指示を生成するステップが前記複数のパラメーターにさらに基づく、
    請求項15に記載のコンピュータ読み取り可能媒体。
  17. 前記複数のパラメーターが、
    前記1つもしくは複数の第2レベルの演算の最初の第2レベルの演算の具体化において前記遺伝子製造システムにより使用される第1のパラメーター、および
    前記1つもしくは複数の第2レベルの演算の2番目の第2レベルの演算の具体化において前記遺伝子製造システムにより使用される前記第1のパラメーターと異なりかつ前記第1のパラメーターと同じカテゴリーのパラメーターを表す第2のパラメーター
    を含む、請求項16に記載のコンピュータ読み取り可能媒体。
  18. 前記データ構造が1つもしくは複数の第2レベルの配列仕様を含み、各第2レベルの配列仕様が1つもしくは複数の第2レベルの配列演算を含み、
    製造指示を生成するステップが、前記1つもしくは複数の第2レベルの配列仕様から第2レベルの配列仕様のサブセットを実行するために選択することを含む、
    請求項15から17のいずれか一項に記載のコンピュータ読み取り可能媒体。
  19. 第2レベルの配列仕様の前記サブセットを選択することが第2レベルの配列オペランドの重みづけに基づく、請求項18に記載のコンピュータ読み取り可能媒体。
  20. 前記第2レベルの配列仕様が、前記製造指示より以前に生成された少なくとも1つの先行製造指示の結果としてアセンブルされたヌクレオチド配列の表現型特性とのそれらの関連に基づく実行のために、重みづけられる、請求項18または19に記載のコンピュータ読み取り可能媒体。
  21. 前記少なくとも1つの計算デバイスに製造指示を生成させる前記命令が、有向グラフを使用する命令を含む、請求項15から20のいずれか一項に記載のコンピュータ読み取り可能媒体。
JP2018555880A 2016-04-27 2017-04-26 ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム Ceased JP2019520622A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021161095A JP2022008679A (ja) 2016-04-27 2021-09-30 ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/140,296 2016-04-27
US15/140,296 US11151497B2 (en) 2016-04-27 2016-04-27 Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences
PCT/US2017/029725 WO2017189784A1 (en) 2016-04-27 2017-04-26 Methods and systems for generating factory order forms to control production of nucleotide sequences

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021161095A Division JP2022008679A (ja) 2016-04-27 2021-09-30 ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム

Publications (2)

Publication Number Publication Date
JP2019520622A true JP2019520622A (ja) 2019-07-18
JP2019520622A5 JP2019520622A5 (ja) 2019-08-29

Family

ID=58672782

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018555880A Ceased JP2019520622A (ja) 2016-04-27 2017-04-26 ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム
JP2021161095A Pending JP2022008679A (ja) 2016-04-27 2021-09-30 ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021161095A Pending JP2022008679A (ja) 2016-04-27 2021-09-30 ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム

Country Status (7)

Country Link
US (2) US11151497B2 (ja)
EP (1) EP3449404A1 (ja)
JP (2) JP2019520622A (ja)
KR (1) KR20190003578A (ja)
CN (1) CN109313741A (ja)
CA (1) CA3022423A1 (ja)
WO (1) WO2017189784A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11293029B2 (en) 2015-12-07 2022-04-05 Zymergen Inc. Promoters from Corynebacterium glutamicum
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
KR102345899B1 (ko) 2016-06-30 2021-12-31 지머젠 인코포레이티드 박테리아 헤모글로빈 라이브러리를 생성하는 방법 및 이의 용도
KR102345898B1 (ko) 2016-06-30 2022-01-03 지머젠 인코포레이티드 글루코오스 투과 효소 라이브러리를 생성하는 방법 및 이의 용도
US10319465B2 (en) 2016-11-16 2019-06-11 Seven Bridges Genomics Inc. Systems and methods for aligning sequences to graph references
JP2020520645A (ja) 2017-05-19 2020-07-16 ザイマージェン インコーポレイテッド Nadphの増大を導く生合成経路のゲノム工学
JP2020524494A (ja) 2017-06-06 2020-08-20 ザイマージェン インコーポレイテッド ハイスループットトランスポゾン変異誘発
CA3064619A1 (en) * 2017-06-06 2018-12-13 Zymergen Inc. A high-throughput (htp) genomic engineering platform for improving saccharopolyspora spinosa
EP3635112A2 (en) 2017-06-06 2020-04-15 Zymergen, Inc. A htp genomic engineering platform for improving fungal strains
ES2875579T3 (es) * 2017-06-06 2021-11-10 Zymergen Inc Plataforma de ingeniería genómica de HTP para mejorar Escherichia coli
PT3645719T (pt) 2017-06-30 2022-05-18 Inscripta Inc Métodos, módulos, instrumentos e sistemas automatizados de processamento de células
US10435713B2 (en) 2017-09-30 2019-10-08 Inscripta, Inc. Flow through electroporation instrumentation
EP3707234A1 (en) 2017-11-09 2020-09-16 Zymergen Inc. Optimization of organisms for performance in larger-scale conditions based on performance in smaller-scale conditions
KR20200092989A (ko) 2017-12-01 2020-08-04 지머젠 인코포레이티드 아웃라이어 감지를 위한 비지도 파라미터 러닝을 이용한 생산용 유기체 식별
CN111902540A (zh) 2018-03-20 2020-11-06 齐默尔根公司 用于中国仓鼠卵巢细胞基因工程改造的htp平台
KR20210018219A (ko) 2018-06-06 2021-02-17 지머젠 인코포레이티드 발효 및 생산 중 곰팡이 형태를 제어하기 위한 신호 전달에 포함된 유전자의 조작
SG11202104409YA (en) 2018-10-31 2021-05-28 Zymergen Inc Multiplexed deterministic assembly of dna libraries
CN111338986B (zh) * 2020-03-13 2023-08-04 北京艾克斯特科技有限公司 一种获取三维模型数据结构中数据的方法
US11479779B2 (en) 2020-07-31 2022-10-25 Zymergen Inc. Systems and methods for high-throughput automated strain generation for non-sporulating fungi

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002318992A (ja) * 2000-12-27 2002-10-31 Olympus Optical Co Ltd 分子計算装置、分子計算計画設計装置、分子計算方法及び分子計算プログラム及び分子計算結果解析プログラム
JP2003536117A (ja) * 1999-01-18 2003-12-02 マキシジェン, インコーポレイテッド 進化シュミレーションにおける使用のためにデータ構造を居住させる方法
JP2004357502A (ja) * 2003-05-30 2004-12-24 Olympus Corp 核酸分子を使用した情報処理方法
US8332160B1 (en) * 2011-11-17 2012-12-11 Amyris Biotechnologies, Inc. Systems and methods for engineering nucleic acid constructs using scoring techniques

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7826975B2 (en) 2002-07-10 2010-11-02 The Penn State Research Foundation Method for redesign of microbial production systems
DE602004026338D1 (de) 2003-11-04 2010-05-12 Applied Biosystems Llc Konkatamere ligationsprodukte: zusammensetzungen, verfahren und kits dafür
CN101821744B (zh) * 2007-10-09 2013-05-22 阿森尼克斯公司 合成基因设计的计算方法
US10541046B2 (en) 2009-09-02 2020-01-21 Microsoft Technology Licensing, Llc Creating genetic devices
US10192024B2 (en) * 2012-05-18 2019-01-29 454 Life Sciences Corporation System and method for generation and use of optimal nucleotide flow orders
WO2014015186A1 (en) 2012-07-18 2014-01-23 Labminds Ltd. Automated solution dispenser
US9679104B2 (en) 2013-01-17 2017-06-13 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
CN104651491B (zh) 2014-12-23 2017-02-01 中国科学院上海高等研究院 一种dna四面体纳米结构信号探针及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003536117A (ja) * 1999-01-18 2003-12-02 マキシジェン, インコーポレイテッド 進化シュミレーションにおける使用のためにデータ構造を居住させる方法
JP2002318992A (ja) * 2000-12-27 2002-10-31 Olympus Optical Co Ltd 分子計算装置、分子計算計画設計装置、分子計算方法及び分子計算プログラム及び分子計算結果解析プログラム
JP2004357502A (ja) * 2003-05-30 2004-12-24 Olympus Corp 核酸分子を使用した情報処理方法
US8332160B1 (en) * 2011-11-17 2012-12-11 Amyris Biotechnologies, Inc. Systems and methods for engineering nucleic acid constructs using scoring techniques

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BEALほか: ""An End-to-End Workflow for Engineering of Biological Networks from High-Level Specifications"", ACS SYNTHETIC BIOLOGY, vol. Issue 1, JPN7021002516, 10 July 2012 (2012-07-10), pages 317 - 331, ISSN: 0004649488 *
BILITCHENKOほか: ""Eugene - A Domain Specific Language for Specifying and Constructing Sythetic Biological Parts, Devi", PLOS ONE, vol. Vol. 6, Issue 4, JPN7021002517, 29 April 2011 (2011-04-29), ISSN: 0004649489 *
WILSONほか: ""Genotype Specification Language"", ACS SYNTHETIC BIOLOGY, vol. Issue 5, JPN7021002515, 17 February 2016 (2016-02-17), pages 471 - 478, ISSN: 0004649490 *

Also Published As

Publication number Publication date
US20170316353A1 (en) 2017-11-02
CA3022423A1 (en) 2017-11-02
JP2022008679A (ja) 2022-01-13
WO2017189784A1 (en) 2017-11-02
EP3449404A1 (en) 2019-03-06
US11151497B2 (en) 2021-10-19
KR20190003578A (ko) 2019-01-09
WO2017189784A8 (en) 2018-07-12
CN109313741A (zh) 2019-02-05
US20220076177A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
JP2019520622A (ja) ヌクレオチド配列の生産を制御するための製造指示フォームを生成するための方法およびシステム
Blankenberg et al. Galaxy: a web‐based genome analysis tool for experimentalists
Appleton et al. Design automation in synthetic biology
Wattam et al. Assembly, annotation, and comparative genomics in PATRIC, the all bacterial bioinformatics resource center
Harper et al. MaizeGDB: the maize genetics and genomics database
Arendsee et al. phylostratr: A framework for phylostratigraphy
WO2008121911A2 (en) Software for design and verification of synthetic genetic constructs
Roesch et al. Julia for biologists
Hérisson et al. The automated Galaxy-SynBioCAD pipeline for synthetic biology design and engineering
Sun et al. The E. coli whole-cell modeling project
Singh et al. AlnC: An extensive database of long non-coding RNAs in angiosperms
Clark et al. It's all GO for plant scientists
US11581064B2 (en) Device-agnostic system for planning and executing high-throughput genomic manufacturing operations
Wee et al. GALAXY Workflow for Bacterial Next‐Generation Sequencing De Novo Assembly and Annotation
Vuong et al. Ten simple rules for investigating (meta) genomic data from environmental ecosystems
Tran et al. OpenOmics: A bioinformatics API to integrate multi-omics datasets and interface with public databases.
Rocha et al. MuDoGeR: Multi‐Domain Genome recovery from metagenomes made easy
Fajiculay et al. BioSANS: A software package for symbolic and numeric biological simulation
Oberortner et al. An integrated computer-aided design and manufacturing workflow for synthetic biology
López-Fenández et al. Auto-phylo: A Pipeline Maker for Phylogenetic Studies
Yanarella et al. GWAS from spoken phenotypic descriptions: a proof of concept from maize field studies
Stracquadanio et al. Computer Aided Assembly and Verification of Synthetic Chromosomes
Kosiński et al. AGouTI–Flexible Annotation of Genomic and Transcriptomic Intervals
Elizabeth Enable authors to share the provenance of biological material in spreadsheets
García S et al. CitrusGenome: Applying User Centered Design for Evaluating the Usability of Genomic User Interfaces

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190710

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220304

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20220721