JP2022181213A

JP2022181213A - 生物学的配列の自動アノテーションとスクリーニングのためのシステムおよび方法

Info

Publication number: JP2022181213A
Application number: JP2022142326A
Authority: JP
Inventors: ディガンズ，ジェームズ; Diggans James
Original assignee: Twist Bioscience Corp
Current assignee: Twist Bioscience Corp
Priority date: 2016-06-10
Filing date: 2022-09-07
Publication date: 2022-12-07
Also published as: US20170357752A1; CN109564769A; JP2019523940A; KR20190017932A; EP3469499A4; KR102476915B1; WO2017214574A1; SG11201811025VA; EP3469499A1; CA3027127A1

Abstract

【課題】コミュニティー知識および参加に基づく有効なバイオセキュリティーのためのソフトウェアツールを提供する。【解決手段】ツールは、生物学的配列情報を含むクエリファイルを受信し、さらに同定された配列情報を有するタンパク質データベースと通信し、照会された生物学的配列と関連する、同定された同一および類似の配列の一部あるいは全部を列挙して、ＢＬＡＳＴレポートを作成する。ＢＬＡＳＴレポートは、「制限された」リストとも呼ばれる有害な生物学的配列（タンパク質または核酸）に関連する配列を同定する配列アノテーションを含むデータベースに照会される。スクリーニングレポートは、これらのプロセスの結果を要約するユーザーインターフェースの形で作成される。【選択図】図３Ａ

Description

相互参照
本出願は、２０１６年６月１０日に出願された米国仮特許出願番号６２／３４８，７８６、および２０１６年８月１６日に出願された米国仮特許出願番号６２／３７５，８５８の利益を主張し、各々の利益は全体において、参照により明細書に組み込まれる。

公共の安全および／または環境に対して潜在的な脅威を生み出すことができる、個々のタンパク質および生物システムに関する私たちの集合知の成長速度はすさまじい。しかし、この知識は、種々の研究組織、機関およびジャーナルなどによって広く知れ渡っている。所定のタンパク質が害を引き起こす可能性、及びその害がどのような状況で発生するのかについてアノテーションすることに重点が置かれた一元化された情報源がない。したがって、新しいシステムおよび方法がその課題に取り組むために必要である。

本明細書には、データベースをホストするためのサーバーを含む、増強されたポリヌクレオチド合成を提供するためのコンピュータ化システムが提供され、ここで、そのデータベースは、有害な生物学的配列のリストと；ネットワーク接続と；汎用コンピュータに対する命令を含むコンピュータ可読媒体と；を表わすことに適しており、ここで、上記コンピュータ化システムは：１）１つ以上の設計命令を受信する方法であって、ここで、設計命令は複数の生物学的配列を含み、生物学的配列の各々はせいぜい５００の塩基の長さであり、および複数の生物学的配列は核酸またはアミノ酸配列を含む、方法；２）複数の生物学的配列の少なくとも２つの生物学的配列がまとめて、データベース中の有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する方法；および３）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる方法で動作するよう構成されるコンピュータ化されたシステム。さらに本明細書には、警告が発生されない場合、１つ以上の配列が合成されることを含むコンピュータ化システムが提供される。さらに本明細書には、有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当する複数の生物学的配列の少なくとも２つの生物学的配列を変更するための命令を受信することを含む、コンピュータ化システムが提供される。さらに本明細書には、複数の受信された設計命令が１つ以上の時点で受信されるコンピュータ化システムが提供される。さらに本明細書には、複数の受信された設計命令が３つ以上の様々なソースからのものであるコンピュータ化システムが提供される。さらに本明細書には、複数の受信された設計命令が５つ以上の様々なソースからのものであるコンピュータ化システムが提供される。さらに本明細書には、複数の受信された設計命令が１０以上の様々なソースからのものであるコンピュータ化システムを提供する。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい２００の塩基の長さであるコンピュータ化システムが提供される。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい１００の塩基の長さであるコンピュータ化システムが提供される。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい５０の塩基の長さであるコンピュータ化システムが提供される。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい２０の塩基の長さであるコンピュータ化システムが提供される。

本明細書には、増強されたポリヌクレオチド合成を提供するための方法が記載され、その方法は：１）１つ以上の設計命令を受信する工程であって、ここで、設計命令は複数の生物学的配列を含み、生物学的配列の各々はせいぜい５００の塩基の長さであり、および複数の生物学的配列は核酸またはアミノ酸配列を含む工程；２）複数の生物学的配列の少なくとも２つの生物学的配列がまとめて、データベース中の有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する工程；および３）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる工程を含む、方法。さらに本明細書には、警報が発生されない場合、１つ以上の配列が合成されることを含む方法が提供される。さらに本明細書には、有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当する複数の生物学的配列の少なくとも２つの生物学的配列を変更するための命令を受信する工程を含む方法が提供される。

本明細書には、データベースをホストするためのサーバーを含む、増強されたポリヌクレオチド合成を提供するためのコンピュータ化システムが提供され、ここで、そのデータベースは、配列のリストと；ネットワーク接続と；汎用コンピュータに対する命令を含むコンピュータ可読媒体と；を表すことに適しており、ここで、上記コンピュータ化システムは：１）１つ以上の設計命令を受信する方法であって、ここで、設計命令はベクター配列である複数の生物学的配列および複数の追加の挿入配列を含む、方法；２）ベクター配列及び複数の生物学的配列の少なくとも１つがまとめて、データベース中の有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する方法；および３）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる方法で動作するよう構成されるコンピュータ化されたシステム。さらに本明細書には、物理的核酸サンプルの配列決定から、生物学的配列が取得されるコンピュータ化システムが提供される。さらに本明細書には、警報が発生されない場合、１つ以上の生物学的配列が合成されることを含むコンピュータ化システムが提供される。さらに本明細書には、有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当するベクター配列および複数の挿入配列の少なくとも１つを変更するための命令を受信することを含むコンピュータ化システムを提供する。さらに本明細書には、増強されたポリヌクレオチド合成を提供するためのコンピュータ化システムが提供され、ここで、複数の受信された設計命令は一つ以上の時点で受信される。さらに本明細書には、複数の受信された設計命令が、様々なソースから受信されるコンピュータ化システムが提供される。さらに本明細書には、複数の受信された設計命令が、３つ以上の様々なソースからのものであるコンピュータ化システムが提供される。さらに本明細書には、複数の受信された設計命令が、５つ以上の様々なソースからのものであるコンピュータ化システムが提供される。さらに本明細書には、複数の受信された設計命令が、１０以上の様々なソースからのものであるコンピュータ化システムが提供される。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい２００の塩基の長さであるコンピュータ化システムが提供される。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい１００の塩基の長さであるコンピュータ化システムが提供される。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい５０の塩基の長さであるコンピュータ化システムが提供される。さらに本明細書には、１つ以上の生物学的配列が、各々せいぜい２０の塩基の長さであるコンピュータ化システムが提供される。

本明細書には、増強されたポリヌクレオチド合成を提供するための方法が記載され、その方法は：１）１つ以上の設計命令を受信する工程であって、ここで、設計命令はベクター配列である複数の生物学的配列および複数の追加の挿入配列を含む、工程；２）ベクター配列及び複数の生物学的配列の少なくとも１つがまとめて、データベース中の有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する工程；および３）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる工程、を含む。本明細書には、物理的核酸またはタンパク質のサンプルの配列決定から生物学的配列が取得される方法が提供される。さらに本明細書には、警告が発生されない場合、１つ以上の生物学的配列が合成されることを含む方法が提供される。さらに本明細書には、有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当するベクター配列、および複数の挿入配列の少なくとも１つを変更するための命令を受信する工程を含む方法を提供する。

引用による組み込み
個々の刊行物、特許、または特許出願が全体として、参照により組み込まれることが具体的にかつ個々に示されたのと同じ程度に、本明細書で言及される全ての刊行物、特許、および特許出願は、参照により本明細書に組み込まれる。

本開示の技術的特徴は、添付の請求項で詳細に記載される。本開示の特徴および利点のより良い理解は、開示の原理が利用される例示的な実施形態を記載する下記の詳細な記述、および付随する下記の図面への参照によって得られる。

タンパク質配列および関連する種、宿主、病原体、害をもたらす経路、結果およびタンパク質の種類の情報を含むユーザーインターフェースを例示する。さらに、配列登録番号、同一のタンパク質のリスト、配列記録を含むデータベースへのリンク、および類似のタンパク質へのリンクが含まれる。タンパク質変異体および典型的なタンパク質“ヘマグルチニンノイラミニダーゼ・ニューカッスル病ウイルス”の部分的なリストを含むユーザーインターフェースを例示する。クエリファイル、タンパク質データベース、ＢＬＡＳＴレポート、制限されたリスト（有害な配列のリスト）およびスクリーニングレポートからの情報を含むフローチャートを図示する。インプット（核酸材料、核酸あるいはタンパク質配列）、意思決定（制限されたリスト、制限されていないリスト、エキスパートレビュー）およびアウトプット（警報の発生）の様々な形態を含むフローチャートを図示する。スクリーニングで検索するためのデータベースのリストを含むユーザーインターフェースを例示する。役割、型、名称、記載、加えられた日付およびアクティブ状態の欄が含まれる。配列提出スクリーンを含むユーザーインターフェースを例示する。名称、データベース、記載およびＦＡＳＴＦＡファイルの記入フォーム、および「Ｓｕｂｍｉｔ」ボタンが含まれる。データベースフォームは、「Ｓｅｑｓｈｉｅｌｄ」、「ｎｒ」および「ＰｅｒｓｏｎａｌＤａｔａｂａｓｅ」を含むサブカテゴリがクリック時に現われるドロップダウン列を含む。スクリーニングステータスの概要を含むユーザーインターフェースを例示する。スクリーニングされた配列が、「未チェック」、「懸念がある」または「懸念がない」ものかを選択するためのプルダウンメニューを含むユーザーインターフェースを例示する。コンピューティングシステムを例示する。コンピュータシステムを例示する。コンピュータシステムのアーキテクチャーを例示するブロック図である。複数のコンピュータシステム、複数の携帯電話と携帯情報端末、およびネットワークアタッチトストレージ（ＮＡＳ）を組込むように構成されたネットワークを例証する図である。共有される仮想アドレスメモリ空間を用いた、マルチプロセッサコンピュータシステムのブロック図である。

合成生物学における設計機能の急成長に伴い、元々由来した引用配列に直接的には似ていない突然変異の大きい配列をしばしば使用して、多くの構築物を生成することが現在可能である。同時に、（様々な宿主および生物学的背景における）病原性の背後にあるプロセスについての理解における科学的な進歩は、文脈依存方法で、ヒト、特定の植物または動物に害を与えうるタンパク質配列、または環境に害をより広くもたらしうるタンパク質配列についての新しい知識を急速に生み出している。

倫理的な責任のある合成生物学者は、害をもたらすことができる構築物を無意識に生み出すかもしれないが、生物系の合成設計を実証する前に、その機能を予測すること、または理解することができないかもしれない。一次配列のみから機能を予測することが実現可能でないため、以下のものを利用することで、これらの科学者の役に立つだろう：１）どのような配列が、制限ステータスと共に害をもたらすのかについてのメタデータのレポジトリ、および２）そのメタデータに対してＤＮＡまたはタンパク質配列をチェックし、いかなる潜在的な懸念もユーザーに警告するための効果的なスクリーニングシステム。さらに、これらのニーズに対処することが可能なスクリーニングシステムは、それ自体がハイスループット設計／構造／テスト・ワークフローにシームレスに適合するように自動化に適していなければならない。本開示は、病原性に関する公的に利用可能な遺伝子レベルのメタデータの不足、および有効なスクリーニングのためのオープンソース・ツールの不足の両方に対処するためのソフトウェアツールを提供する。

定義

様々な実施形態が本明細書中に示され記述されている一方、そのような実施形態が一例として提供されているにすぎないことは当業者にとって明白だろう。本明細書に開示される装置、システム及び方法から逸脱することなく、当業者は多くの変更、変化および置換を思い浮かべることができる。本明細書に記載される実施形態への様々な代替案が利用され得ることを理解されたい。

特に定義されない限り、本明細書に使用される全ての技術用語は、本発明が属する分野における当業者によって一般的に理解されるのと同じ意味を有する。明細書および添付の請求項内で用いられる通り、単数形「ａ」、「ａｎ」および「ｔｈｅ」は、文脈が他に明確に命令していない限り、複数の引用文を含む。本明細書の「または」へのあらゆる言及は、特に他に明記されていない限り、「および／または」を包含するように意図される。

具体的に明示されていない、又は文脈から明白ではない限り、本明細書で使用されるように、数又はその範囲に関して用語「約」とは、明示された数及びその＋／－１０％の数を意味し、あるいは、範囲について列挙された値に対する下限より１０％低いかつ上限より１０％高い数を意味する。

配列アノテーション
ある種の害をもたらす任意の単一の配列の能力に関する知識は、極端に知れ渡ってしまうこともある。研究者の個々のコミュニティーは、有機体が宿主細胞に侵入し、宿主細胞機構を乗っ取り、宿主免疫システムから隠れる能力、そしてさらに宿主免疫応答を増強する能力を含む病原性の広く様々な態様に注目する。典型的な有害な生物学的配列は、病原性の配列をコードするもの、例えば、有害でありかつウイルス性起原のもの、細菌性起原のもの、あるいは寄生性起原のものを含む。有害な生物学的配列は、病原性の効果があると知られている野生型配列の突然変異型を含んでもよい。有害な生物学的配列は、転写または翻訳後に有害な配列産物を産生するか、有害な配列産物への前駆体として作用する配列を含む。有害な生物学的配列は、有害なタンパク質をコードする配列を含む。

他の様相のうち、本発明は、病原性における役割のタグベースのアノテーションと共にユーザーが配列を提出することを可能にする、Ｍｅｄｉａｗｉｋｉベースのユーザーインターフェースを提供する。ユーザーは、次のようにモデル化された所定の配列に関連する害の一般的なパターンを記述するために、各々の配列についていくつかのタグを提出するように促され得る：
宿主＋背景＝結果＋懸念の程度

単一の統制語彙を先験的に課さないために、本システムはタグベースのアプローチをとることができる。コミュニティーアノテーションから生じるタグの収集は、より長期間にわたってそのような統制語彙の基礎を形成することができるだろう。

各々の配列がアップロードされる時、ユーザーは４つのカテゴリーのそれぞれにタグを加えるように求められることもある。「宿主」及び「懸念の程度」をタグ付けすることは必須である；さらなる複雑さおよびドメイン知識が要求されることを考慮すると、「背景」および「結果」に対するタグを加えることは任意である。

一例として、毒素リシンをコードする配列は、ユーザーによって以下のようにタグ付けされることもある：

目標は、一般的な完全性よりも、長期にわたるメタデータの蓄積である。システムは一元的にホストされ、スクリーニングで使用されるＦＡＳＴＡとしてダウンロードされるキュレートされた配列の全体集合（またはタグによるクエリに基づく部分集合）を提供する。

本明細書には、アノテーション配列のための方法が提供され、ここで、データベースは、生物学的配列または生物学的な構築物（例えば、ヌクレオチド配列またはタンパク質配列）に関連する特性のリストを受信する。典型的な特性としては、限定されないが以下が挙げられる：核酸配列、タンパク質配列、タンパク質の名称、菌株の起源、配列データベースへのリンク（例えばＮＣＢＩ）、配列データベース登録番号、同一の配列（タンパク質または核酸）、類似の配列（タンパク質または核酸）、疾病の種類（例えばウイルス、細菌あるいは真菌）、宿主情報（例えばヒト、哺乳動物、鳥、昆虫）、有害な相互作用の背景または経路（例えば摂取、吸入）及び懸念の程度。さらに本明細書には、各特性またはそのような特性の追加情報へのリンクを表すユーザーインターフェースが提供される。図１を参照。場合によっては、特定の菌株に対するウイルス配列が選択される。例えば、図２は、アノテーション用の赤血球凝集素ノイラミニダーゼ・ニューカッスル病ウイルスの６７９つの利用可能な菌株の一部を示す。

典型的な種は、動物種を含む。本明細書で使用されるような「動物」としては、限定されないが、哺乳動物、有袋動物、鳥、昆虫、節足動物、両生動物および爬虫類動物が挙げられる。典型的な哺乳動物としては、限定されないが、ヒツジ、ウシ、ヤギ、ブタ、ウサギ、野ウサギ、シカ、ヤギ、マウス、ラット、コウモリおよびオポッサムなどが挙げられる。典型的な疾病の種類は、以下のクラスからの病原体を含む：ウイルス、細菌、真菌および他の有害な病原体。有害な発現産物を有する典型的なウイルスとしては、限定されないが、マールブルグウイルス、エボラウイルス、ハンタウィルス、鳥インフルエンザ（例えばＨ５Ｎ１株）、ラッサ熱ウイルス、フニンウィルス、クリミア・コンゴ出血熱、マクポウイルス、キャサヌル森林病ウイルス、デング熱およびチクングニヤウィルスが挙げられる。有害な発現産物を有する典型的な細菌としては、限定されないが、多剤耐性黄色ブドウ球菌（ＭＲＳＡ）、大腸菌、リステリア、サルモネラ菌、淋菌、連鎖球菌およびブドウ球菌が挙げられる。有害な発現産物を有する典型的な真菌としては、限定されないが、アマニタ・アーキア（Ａｍａｎｉｔａａｒｏｃｈｅａｅ）、アマニタ・ビスポリゲラ（Ａｍａｎｉｔａｂｉｓｐｏｒｉｇｅｒａ）、アマニタ・エクシティアリス（Ａｍａｎｉｔａｅｘｉｔｉａｌｉｓ）、アマニタ・マグニヴェラリス（Ａｍａｎｉｔａｍａｇｎｉｖｅｌａｒｉｓ）、アマニタ・オクレアータ（Ａｍａｎｉｔａｏｃｒｅａｔａ）、シロタマゴテングタケ、クリトサイブ・デールバータ（Ｃｌｉｔｏｃｙｂｅｄｅａｌｂａｔａ）、コーティナリウス・ジェンティルズ（Ｃｏｒｔｉｎａｒｉｕｓｇｅｎｔｉｌｉｓ）、レピオタ・ブルネオインカーナタ（Ｌｅｐｉｏｔａｂｒｕｎｎｅｏｉｎｃａｒｎａｔａ）、レピオタ・ブルネオインカーナタ（Ｌｅｐｉｏｔａｂｒｕｎｎｅｏｉｎｃａｒｎａｔａ）、レピオタ・ブルネオインカーナタ（Ｌｅｐｉｏｔａｂｒｕｎｎｅｏｉｎｃａｒｎａｔａ）、レピオタ・ブルネオインカーナタ（Ｌｅｐｉｏｔａｂｒｕｎｎｅｏｉｎｃａｒｎａｔａ）が挙げられる。典型的な害をもたらす経路としては、限定されないが、摂取、吸入、皮膚接触および性感染が挙げられる。典型的な結果としては、限定されないが、熱、頭痛、吐き気、めまいおよび下痢が挙げられる。典型的なタンパク質データベースは、米国国立医療図書館および国立衛生研究所のタンパク質および遺伝子データベースを含む。典型的な疾病の懸念の程度は、低い、中程度、高いおよび最も高いを含む。

本明細書には、有機体の名称およびまたは分類群によってクエリに関連する配列を同定するといった、基本的なキュレーションのための方法が提供される。一旦同定されれば、配列アノテーションは任意に更新され、そして任意に、特定の記述的な特徴について再分類され得る。同定された配列は、任意にＦＡＳＴＡフォーマットを用いて、単数またはバッチ形式でのダウンロードにさらに利用可能である。

データ品質および市民参加は両方とも、公的に利用可能なデータベースに関連する懸念になり得る。有用性を即座に最大化するために、開示されたシステムは、制限されている可能性が最も高い配列または有害であると知られる他の配列を含もうとして、多くの病原性のタンパク質をデータベースに加える初期のキュレーションプロセスを実行することができる。該システムは、無害であると考えられ得る遺伝子に対応するＮＣＢＩＧＩ同定子の「制限されていない」リストをキュレーションすることができる。さらに、その制限されていないリストも、キュレーションに利用できる。

ＣＡＰＴＣＨＡの仕組みは、ボットで駆動されるキュレーションを防ぐために、そしてページの作成前または編集前に、ユーザー登録を要求するために使用され得る。ＧＩ同定子は、（存在有無について）定期的に確認され、そして失敗した場合、人間によるレビューのためにレコードがタグ付けされ得る。さらにユーザーは、コミュニティーあるいは管理者によるレビューを要求するために、レコードにフラグを立てることができる。

本開示は、少なくとも１つの生物学的配列をアノテートするおよび／またはスクリーニングするシステム及び方法を提供する。場合によっては、生物学的配列は核酸配列である。核酸配列は、１；１０；１００；２００；３００；４００；５００；６００；７００；８００；９００；１，０００；２，０００；５，０００；７，０００；１０，０００、またはそれ以上の核酸残基を含んでもよい。場合によっては、核酸配列は１００～５００の核酸残基を含む。場合によっては、核酸配列は５０～１０００の核酸残基を含む。場合によっては、核酸配列は２０～２００の核酸残基を含む。場合によっては、核酸配列は２００の残基を含む。場合によっては、生物学的配列はＤＮＡまたはＲＮＡであってもよい。場合によっては、生物学的配列はタンパク質配列である。生物学的配列はアデニン（Ａ）、シトシン（Ｃ）、グアニン（Ｇ）、チミン（Ｔ）あるいはウラシル（Ｕ）を含んでもよい。場合によっては、生物学的配列はタンパク質配列である。タンパク質は、１；１０；１００；２００；３００；４００；５００；６００；７００；８００；９００；１，０００；２，０００、またはそれ以上のアミノ酸を含んでもよい。場合によっては、タンパク質配列は１００～３００のアミノ酸を含む。場合によっては、核酸配列は５０～５００のアミノ酸を含む。場合によっては、核酸配列は１０～２００のアミノ酸を含む。場合によっては、核酸配列は６０のアミノ酸を含む。場合によっては、せいぜい２、５、１０、２０、５０あるいは２００残基の核酸断片が、インシリコで核酸配列にアセンブルされる。場合によっては、核酸断片は、１つ以上のソース、あるいは同じソースからの１つ以上のオーダーから得られる。

スクリーニングツール
所定の配列がバイオセキュリティーリスクをもたらすか否かを決定することができるスクリーニングシステムの構築は、時間へのある程度の投資およびすべての合成生物学者、あるいは合成生物学に関連するすべての企業でも利用でない専門知識を含み得る。危険な配列のデータベースを利用できると仮定したとしても、アライナーの基礎的なパラメーター化および結果処理（より短い領域への相同性を隠さないように、類似領域へのアライメント数（ａｌｉｇｎｍｅｎｔｃｏｕｎｔｓ）を選び取ること含む）は、ドメイン専門知識を含み得る。

例示的なワークフローが、図３Ａで提供される。図３Ａを参照すると、プロセッサは、生物学的配列情報を含むクエリファイルを受信し、さらに同定された配列情報を有するタンパク質データベースと通信する。照会された生物学的配列と関連する、同定された同一および類似の配列の一部あるいは全部を列挙して、ＢＬＡＳＴレポートが作成される。それから、ＢＬＡＳＴレポートは、「制限された」リストとも呼ばれる有害な生物学的配列（タンパク質または核酸）に関連する配列を同定する配列アノテーションを含むデータベースに照会される。スクリーニングレポートは、これらのプロセスの結果を要約するユーザーインターフェースの形で作成される。

例示的なロジックワークフローが、図３Ｂで提供される。図３Ｂを参照すると、（配列決定され得る）物理的核酸あるいはタンパク質材料などのデータ入力ソース、（タンパク質配列に翻訳され得る）核酸配列、あるいはタンパク質配列などのデータ入力ソースが、制限されたリストにあるか否かを決定するために、１つ以上のデータベースを検索するアルゴリズムを用いて評価され得る。典型的なアルゴリズムとしては、制限されないが、ＢＬＡＳＴ、ＤＩＡＭＯＮＤ、スミス－ウォーターマン（Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ）、あるいは配列情報を比較するための他のアルゴリズムが挙げられる。制限されたリストにあることが分かった配列は、既知の偽陽性を含む制限されていないリストに対してさらに評価される。偽陽性と同定されない場合、配列はエキスパートレビューの対象となる。配列が無害であるとわかった場合、偽陽性としてさらに同定されることを防ぐために、該配列は制限されないリストに配置される。配列が有害であるとわかった場合、アウトプット警報が発生される。場合によっては、無害な配列が合成される。場合によっては、配列は有害な配列を取り除くために修飾される。場合によっては、修飾された配列は再度スクリーニングされる。場合によっては、修飾された無害な配列が発見されるまで、このプロセスは反復して繰り返される。場合によっては、修飾された無害な配列が合成される。

図４を参照すると、ユーザーインターフェースは、スクリーニングプロセスの選択に利用可能な制限されたリストを表示する。図５を参照すると、例示的なユーザーインターフェースが、提出フォーム「Ｓｕｂｍｉｔａｓｃｒｅｅｎ」を示す。該フォームは、オープン・データベース、例えば公的に利用可能な情報の集合、に対するスクリーニング、または公的に利用可能でない選択基準に基づき得る個人データベースに対するスクリーニングの選択を可能にする。さらに、提出フォームは、アップロードするための生物学的配列ファイルの選択を可能にする。

図６を参照すると、例示的なユーザーインターフェースは、ステータス情報、スクリーニングされた配列、レビューステータス、懸念の有無についてのステータス、配列追加の日付、およびＢＬＡＳＴ結果を見るためのリンクを伴う、実施されたバイオセキュリティースクリーニングの概要を示す。図７を参照すると、例示的なユーザーインターフェースは、スクリーン中にアクセスされたリストの概要、スクリーニングされた配列、および配列に対する有害な（制限された）配列の割り当てを表示する。

本明細書に開示される技術は、スクリーニングシステムのＰｙｔｈｏｎベースのレファレンス実装を含み得る。クエリヌクレオチド配列を考慮すると、該システムは、前段落で説明されたインターフェースによって生成される、アノテーションされたコレクションに由来するタンパク質配列のセットと（例えばＢＬＡＳＴ経由の）配列を、比較することができる。

結果は、相同性、Ｅ－スコアおよびアライメントの長さの程度によってフィルタリングされ得る。パッシングヒット（Ｐａｓｓｉｎｇｈｉｔｓ）は、それらの配列に関連するタグの分布、そして問題が発見されたクエリの領域によって集約され得る。ユーザーがより詳細なフォローアップができるように、元のデータベースエントリへのリンクが提供され得る。あらかじめ定義されたガイダンスに従って、いくつかの例は、アルゴリズムが１００％の感度であることを示し、レポートがアーカイブの使用のためにダウンロードされる。短い（例えば、約２００が塩基未満の）配列のスクリーニングは、多くの偽陽性の発見をもたらし得る。より短いポリヌクレオチド配列の効果的なスクリーニングは、アルゴリズム的アプローチを含み得る。

スクリーニングシステムはデータベース上に位置し、グラフィカルユーザインターフェースと同様に、スクリーンリクエスト提出（ｓｃｒｅｅｎｒｅｑｕｅｓｔｓｕｂｍｉｓｓｉｏｎ）および結果検索のためのＲＥＳＴｆｕｌアプリケーションプログラマブルインタフェース（ＡＰＩ）を含み得る。該アプリケーションは、ラップトップコンピュータにインストールされ、動作することができ、さらにＡＰＩコールを介してハイスループットの使用にまで合理的に拡張することができる。

累積的生物学的配列または構築物スクリーニング
特に、複数のソースを通じ、かつ複数の時点で生物学的配列あるいは構築物が得られる場合、個々にスクリーニングされた時に有害な配列の同定をもたらさない生物学的配列の断片および構築物を得ることが可能である。場合によっては、ソースは顧客であってもよい。例えば、指定病原体（ｓｅｌｅｃｔａｇｅｎｔ）が規制する細菌あるいはウイルスのいずれかのゲノムの実質的な部分の蓄積は、より小さな断片で得られ、次いで、有害な生物学的配列または構築物がアセンブルされ得る。これに対処するために、場合によっては、各々のリクエストが受信された後のバックグラウンドプロセスは、生物学的配列または構築物の要求元からの以前のオーダーすべてについてデータベースへ照会し、任意の有害な生物学的配列または構築物への高い相同性を持った任意のセグメントの記録を収集する。これにより、たとえそれらのセグメントが個々のオーダーの間に正式な警報あるいは所有の拒否を引き起こすのに不十分だったとしても、評価および警報が保証される。場合によっては、これらの高い相同性のセグメントは、懸念のある指定病原体（ｓｅｌｅｃｔａｇｅｎｔ）のゲノムに区間として表わされ、次いで、生物学的配列または構築物の要求元ごとおよびゲノムごとのすべての区間の結合が、生物学的配列または構築物の要求元ごとにこれらの有機体の最大の理論構成を決定するために生成される。場合によっては、一旦、生物学的配列または構築物の要求元が、所定の指定病原体（ｓｅｌｅｃｔａｇｅｎｔ）ゲノムの２０％以上を設計しようとすると、上記生物学的配列または構築物の要求元を用いた人間によるレビューおよびフォローアップのために警報が意図的に発生される。場合によっては、一旦、生物学的配列または構築物の要求元が、少なくとも５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、あるいはそれ以上の有害な生物学的配列または構築物を生成することができると、配列構成を認可する前に、人間によるレビューのための警報が発生される。場合によっては、一旦、生物学的配列または構築物の要求元が、５％～５０％、１０％～７５％、２０％～９０％、３０％～１００％、１０％～３０％、５％～５０％、あるいは１５％～６０％の有害な生物学的配列または構築物を生成することができると、配列構成を認可する前に、人間によるレビューのための警報が発生される。

本明細書に記載された核の設計および／または構築する方法およびシステムについてスクリーニングされた生物学的配列は、１つ以上の核酸あるいはタンパク質配列を含み得る。せいぜい２００塩基しか含まないような、より短い核酸配列については、既存のスクリーニング方法は非常に高い偽陽性率を有する。場合によっては、より短い核酸配列は、せいぜい２０００、１０００、５００、２００、１００、７５、５０、４０、３０の塩基を含むか、あるいはせいぜい２０の塩基を含む。場合によっては、より短い核酸配列は、１０～１０００、２０～５００、３０～３００、４０～２００、５０～２００、２０～２００、１０～１００、あるいは１００～３００の塩基を含む。場合によっては、核酸配列は、せいぜい３００、２００、１００、７５、５０、４０、３０、２０、１０、５、あるいは５以下のアミノ酸を含むより短いタンパク質をコードする。場合によっては、より短い核酸配列は１０～３００、２０～２００、３０～１００、１０～２００、２０～１００、５～５０、１０～１００、あるいは２５～７５のアミノ酸を含む。一実施例では、生物学的配列または構築物の要求元が、制限されたあるいは有害な生物学的配列を潜在的にアセンブルするのに十分なポリヌクレオチドへの要求をいつ提出したか決定するために、ポリヌクレオチドのセットを調べる代替スクリーニングアプローチが用いられる。場合によっては、オーダーの間に、１つ以上のソース内のバックグラウンドプロセスは、アセンブリアルゴリズムを用いて、指定有害有機体のゲノムに対するオーダーでポリヌクレオチドをアセンブルする。場合によっては、アセンブリアルゴリズムは次世代シーケンシング・アセンブリアルゴリズムを含む。これらのアセンブリは、１つ以上のオーダーを１つ以上のソースに結び付ける仮説生成を可能にする。例えば、ソースＡおよびＢからのオーダーＸ、ＹおよびＺは、有害な有機体から１つ以上の遺伝子をアセンブルするために組み合わせられる。場合によっては、ソースの数は少なくとも２、３、４、５、８、１０、１５、２０、３０、あるいはそれ以上である。場合によっては、ソースの数は、２～３０、５～５０、１０～１００、５～２０、２～１０、４～４０、あるいは１５～７５である。場合によっては、仮説生成は、人間によるレビューのために警告し、また生物学的配列または構築物の要求元との後続議論を任意に引き起こし、あるいは法執行機関（ｌａｗｅｎｆｏｒｃｅｍｅｎｔ）へ直接報告する。遺伝子長の配列への高い相同性の可能性が低いことを考慮すると、偽陽性率は低いままでまければならない。場合によっては、さらなる偽陽性の削減は、適切な重複が１つ以上の有害な生物学的配列または構築物のアセンブリを許可するか否かを決定するために、仮定された配列の集合のアライメント構造を評価する形でもたらされる。

場合によっては、ベクターあるいはインサートのような物理的核酸サンプルは、合成される１つ以上の核酸配列を伴うアセンブリのためのソースによって提供される。場合によっては、これらの物理的核酸材料は、ＮＧＳを用いるなどして初めに配列決定され、そして１つ以上のベクターおよびインサートの配列の仮説アセンブリが、スクリーニングの対象となる。場合によっては、少なくとも２つの配列の組み合わせがスクリーニングされる。場合によっては、少なくとも２、３、４、５、１０、１５、２０、３０、あるいは３０より多い配列の組み合わせが、有害な生物学的配列または構築物についてスクリーニングされる。場合によっては、スクリーニングされた配列の数が、２～３０、５～５０、１０～１００、５～２０、２～１０、４～４０、あるいは１５～７５の配列であり、有害な生物学的配列または構築物についてスクリーニングされる。

デジタル処理装置
ある実施形態では、本明細書に記載されたプラットフォーム、システム、媒体、および方法は、デジタル処理装置、あるいはその使用を含み得る。ある実施形態では、デジタル処理装置は、装置の機能を実行する１つ以上のハードウェア中央処理装置（ＣＰＵ）あるいは汎用グラフィック処理装置（ＧＰＧＰＵ）を含み得る。ある実施形態では、デジタル処理装置はさらに、実行可能な命令を実施するように構成されたオペレーティングシステムを含み得る。デジタル処理装置は、任意にコンピュータネットワークに接続されてもよい。デジタル処理装置は、ワールドワイドウェブにアクセスするように、インターネットに任意に接続されてもよい。デジタル処理装置は、クラウドコンピューティング・インフラストラクチャに任意に接続されてもよい。デジタル処理装置は、イントラネットに任意に接続されてもよい。デジタル処理装置は、データ記憶装置に任意に接続されてもよい。

本明細書の記載に従って、適切なデジタル処理装置は、非限定的な例として、サーバーコンピュータ、デスクトップコンピューター、ラップトップコンピュータ、ノート型コンピュータ、サブノート型コンピュータ、ネットブックコンピュータ、ネットパッドコンピュータ、セットトップコンピュータ、メディアストリーミングデバイス、ハンドヘルドコンピュータ、インターネットアプライアンス、モバイルスマートフォン、タブレットコンピュータ、携帯情報端末、ビデオゲーム機および媒体を含み得る。多くのスマートフォンが、本明細書に記載されたシステムの使用に適し得る。任意のコンピュータネットワーク接続を伴う、テレビ、ビデオプレーヤーおよびデジタル音楽プレーヤーは、本明細書に記載されたシステムの使用に適し得る。適切なタブレットコンピュータは、当業者に既知のブックレット、スレートおよび変換可能な構成を有するものを含んでもよい。

デジタル処理装置は、実行可能命令を実施するように構成されたオペレーティングシステムを含んでもよい。オペレーティングシステムは、例えば、装置のハードウェアを制御し、アプリケーションの遂行のためのサービスを提供する、プログラムおよびデータを含むソフトウェアであってもよい。適切なサーバーオペレーティングシステムは、非限定的な例として、ＦｒｅｅＢＳＤ、ＯｐｅｎＢＳＤ、ＮｅｔＢＳＤ（登録商標）、リナックス（登録商標）、Ａｐｐｌｅ（登録商標）、ＭａｃＯＳＸＳｅｒｖｅｒ（登録商標）、Ｏｒａｃｌｅ（登録商標）、Ｓｏｌａｒｉｓ（登録商標）、ＷｉｏｄｏｗｓＳｅｒｖｅｒ（登録商標）、およびＮｏｖｅｌｌ（登録商標）、ＮｅｔＷａｒｅ（登録商標）を含み得る。適切なパソコンオペレーティングシステムは、非限定的な例として、Ｍｉｃｒｏｓｏｆｔ（登録商標）、Ｗｉｎｄｏｗｓ（登録商標）、Ａｐｐｌｅ（登録商標）、ＭａｃＯＳＸ（登録商標）、ＵＮＩＸ（登録商標）、およびＧＮＵ／Ｌｉｎｕｘ（登録商標）などのＵＮＩＸ（登録商標）のようなオペレーティングシステムを含み得る。いくつかの実施例において、オペレーティングシステムはクラウドコンピューティングによって提供され得る。装置は、記憶装置および／またはメモリ装置を含んでもよい。記憶装置および／またはメモリ装置は、一時的または永久的にデータまたはプログラムを保存するために使用される１つ以上の物理的な機器であってもよい。装置は、揮発性メモリであってもよいし、記憶された情報を維持するパワーを必要することもある。装置は、不揮発性メモリであってもよいし、パワーがデジタル処理装置に供給されない時、記憶された情報を保持する。不揮発性メモリは、フラッシュメモリ、ダイナミック・ランダム・アクセス・メモリ（ＤＲＡＭ）、強誘電体メモリ（ＦＲＡＭ（登録商標））、相変化メモリ（ＰＲＡＭ）を含んでもよい。

デジタル処理装置は、ユーザーへ視覚情報を送るディスプレイを含み得る。ディスプレイは、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、ＴＦＴ液晶（ＴＦＴ－ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、パッシブマトリクスＯＬＥＤ（ＰＭＯＬＥＤ）あるいはアクティブマトリクスＯＬＥＤ（ＡＭＯＬＥＤ）ディスプレイ、プラズマ・ディスプレイ、および／または、ビデオプロジェクターであってもよい。

デジタル処理装置は、ユーザーからの情報を受信するための入力装置を含み得る。入力装置は、キーボードであってもよい。入力装置は、非限定的な例として、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラーあるいはスタイラスを含むポインティングデバイスであってもよい。入力装置は、タッチスクリーンまたはマルチタッチスクリーンであってもよい。入力装置は、音声入力あるいは他の音入力をとらえるためのマイクロフォンであってもよい。入力装置は、動作入力あるいは視覚入力をとらえるためのビデオカメラあるいは他のセンサーであってもよい。入力装置は、Ｋｉｎｅｃｔ（キネクト）、ＬｅａｐＭｏｔｉｏｎ（リープモーション）などであってもよい。入力装置は、本明細書に開示されるもののような装置の組み合わせであってもよい。

図８を参照すると、特定の実施形態では、典型的なデジタル処理装置（８０１）はプログラムされるか、そうでなければアノテーションまたはスクリーニングを実行するように構成される。本実施例では、デジタル処理装置（８０１）は、シングルコアまたはマルチコア・プロセッサーであり得る中央処理装置（ＣＰＵ、さらに本明細書における「プロセッサ」および「コンピュータプロセッサ」）（８０５）、あるいは並行処理のための複数のプロセッサを含む。デジタル処理装置（８０１）は、メモリまたは記憶場所（８１０）（例えばランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ）、電子記憶装置（８１５）（例えばハードディスク）、１つ以上の他のシステムと通信するための通信インターフェース（８２０）（例えばネットワークアダプタ）、およびキャッシュ、他のメモリ、データ記憶装置、および／または電子ディスプレイアダプターなどの周辺機器（８２５）も含有する。メモリ（８１０）、記憶装置（８１５）、インターフェース（８２０）、および周辺機器（８２５）は、マザーボードなどの通信バス（実線）を通じて、ＣＰＵ（８０５）と通信する。記憶装置（８１５）は、データを記憶するためのデータ記憶装置（またはデータリポジトリ）であってもよい。デジタル処理装置（８０１）は、通信インターフェース（８２０）の助けを借りてコンピュータネットワーク（「ネットワーク」）（８３０）に動作可能に結合される。ネットワーク（８３０）は、インターネット、インターネットおよび／またはエクストラネット、またはインターネットと通信しているイントラネットおよび／またはエクストラネット、であり得る。ネットワーク（８３０）は、場合によっては、電気通信および／またはデータネットワークである。ネットワーク（８３０）は、クラウドコンピューティングのような分散コンピューティングを可能にすることができる１つ以上のコンピュータサーバを含むことができる。ネットワーク（８３０）は、場合によっては、装置（８０１）の助けを借りて、装置（８０１）に連結された装置が、クライアントまたはサーバーとして挙動することを可能にするピアツーピア・ネットワークを実装することができる。

引き続き図８を参照すると、ＣＰＵ（８０５）は、プログラムかソフトウェアで具体化することができる機械可読な命令の配列を実行することができる。命令は、メモリ（８１０）などの記憶場所に保存されてもよい。命令はＣＰＵ（８０５）に向けられ、これは本開示の方法を実行するためのＣＰＵ（８０５）を引き続きプログラムするか、そうでなければ構成することができる。ＣＰＵ（８０５）によって実行された動作の例は、フェッチ、デコード、実行、ライトバックを含みうる。ＣＰＵ（８０５）は、集積回路などの回路の一部であってもよい。装置（８０１）の１つ以上の他のコンポーネントが、回路に含まれうる。場合によっては、回路は、特定用途向け集積回路（ＡＳＩＣ）あるいはフィールドプログラマブルゲートアレイ（ＦＰＧＡ）である。

引き続き図８を参照すると、記憶装置（８１５）は、ドライバ、ライブラリーおよび保存されたプログラムのようなファイルを保存することができる。記憶装置（８１５）は、ユーザーデータ、例えばユーザーの好み、およびユーザープログラムを保存できる。場合によっては、デジタル処理装置（８０１）は、イントラネットまたはインターネットを通じて通信するリモートサーバ上に位置するような、外部の１つ以上の追加のデータ記憶装置を含むことができる。

引き続き図８を参照すると、デジタル処理装置（８０１）はネットワーク（８３０）を通じて、１つ以上のリモートコンピュータシステムと通信することができる。例えば、装置（８０１）は、ユーザーのリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例は、パーソナルコンピュータ（例えば、ポータブルＰＣ）、スレートＰＣまたはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）、アンドロイド対応の装置、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、または携帯情報端末を含有する。

本明細書に記載される方法は、例えばメモリ（８１０）あるいは電子記憶装置ユニット（８１５）などの、デジタル処理装置（８０１）の電子記憶場所に保存された機械（例えばコンピュータプロセッサ）実行可能なコードによって実行され得る。機械実行可能なまたは機械可読なコードは、ソフトウェアの形で提供されうる。使用中に、コードはプロセッサ（８０５）によって実行され得る。場合によっては、コードは、記憶装置（８１５）から検索され、プロセッサー（８０５）によって、容易なアクセスのためにメモリ（８１０）に保存されうる。ある状況においては、電子記憶装置（８１５）は排除され、記憶実行可能命令がメモリ（８１０）に保存され得る。

追加のコンピュータシステム

本明細書に記載されるシステムのいずれも、コンピュータに動作可能に接続されてもよいし、コンピュータを介してローカルまたはリモートで自動化されても良い。様々な場合において、本開示の方法およびシステムは、さらにコンピュータシステム上のソフトウェアプログラムおよびその使用を含むこともある。従って、堆積材料装置（ｔｈｅｍａｔｅｒｉａｌｄｅｐｏｓｉｔｉｏｎｄｅｖｉｃｅ）の動作、分配動作および真空操作を調整し同期するというような、分配／真空／補充機能の同期のためのコンピュータ制御は、本開示の範囲内である。コンピュータシステムは、基板の指定領域に適切な試剤を提供するために、ユーザー指定の塩基配列と材料堆積装置（ａｍａｔｅｒｉａｌｄｅｐｏｓｉｔｉｏｎｄｅｖｉｃｅ）の位置をインターフェースで接続するようプログラムされ得る。

図９に例示されるコンピュータシステム（９００）は、固定媒体（９１２）を有するサーバー（９０９）に任意に接続され得るネットワークポート（９０５）および／または媒体（９１１）からの命令を読み取ることができる論理装置として理解され得る。図９に示されるようなシステムは、ＣＰＵ（９０１）、ディスクドライブ（９０３）、キーボード（９１５）および／またはマウス（９１６）などの任意の入力装置、ならびに任意のモニター（９０７）を含んでも良い。示された通信媒体を介して、ローカル位置またはリモート位置でのサーバーへのデータ通信が可能になる。通信媒体は、データの送信および／または受信ための任意の手段を含むことができる。例えば、通信媒体は、ネットワーク接続、無線接続またはインターネット接続であってもよい。そのような接続は、ワールドワイドウェブ上での通信を提供することができる。本開示に関連するデータは、図９に例示される当事者（９２２）による受信および／またはチェックのために、そのようなネットワークあるいは接続を通じて送信され得ると想定される。

図１０は、本開示の実施例に関連して使用され得るコンピュータシステム（１０００）の第１の典型的な例となるアーキテクチャーを例示するブロック図である。図１０に図示されるように、例示的なコンピュータシステムは、命令を処理するためのプロセッサ（１００２）を含むことができる。プロセッサの限定しない例としては、以下が挙げられる：ＩｎｔｅｌＸｅｏｎ（商標）プロセッサ、ＡＭＤＯｐｔｅｒｏｎ（商標）プロセッサ、Ｓａｍｓｕｎｇ３２－ｂｉｔＲＩＳＣＡＲＭ１１７６ＪＺ（Ｆ）－Ｓｖ１．０（商標）プロセッサ、ＡＲＭＣｏｒｔｅｘ－Ａ８ＳａｍｓｕｎｇＳ５ＰＣ１００（商標）プロセッサ、ＡＲＭＣｏｒｔｅｘ－Ａ８ＡｐｐｌｅＡ４（商標）プロセッサ、ＭａｒｖｅｌｌＰＸＡ９３０（商標）プロセッサ、または機能的に同等のプロセッサ。実行の複数のスレッドは、並列処理に使用され得る。場合によっては、単一のコンピュータシステム内、クラスタ内、あるいは複数のコンピュータ、携帯電話、および／または携帯情報端末装置を含むネットワーク上の分散型システム内であろうと、複数のプロセッサあるいは複数のコアを有するプロセッサが使用され得る。

図１０に例示されるように、プロセッサ（１００２）によって最近使用された、または頻繁に使用される命令あるいはデータのための高速メモリを提供するために、高速キャッシュ（１００４）がプロセッサ（１００２）に接続されるか、組み込まれ得る。プロセッサ（１００２）は、プロセッサバス（１００８）によってノースブリッジ（１００６）に接続される。ノースブリッジ（１００６）はメモリーバス（１０１２）によってランダムアクセスメモリ（ＲＡＭ）（１０１０）に接続され、プロセッサ（１００２）によってＲＡＭ（１０１０）へのアクセスを管理する。また、ノースブリッジ（１００６）は、チップセットバス（１０１６）によってサウスブリッジ（１０１４）に接続される。次に、サウスブリッジ（１０１４）は、周辺バス（１０１８）に接続される。周辺バスは、例えば、ＰＣＩ、ＰＣＩ－Ｘ、ＰＣＩＥｘｐｒｅｓｓ、または他の周辺バスであってもよい。ノースブリッジおよびサウスブリッジは、しばしばプロセッサチップセットと呼ばれ、プロセッサ、ＲＡＭ、および周辺バス（１０１８）上の周辺コンポーネントの間のデータ転送を管理する。幾つかの代替的なアーキテクチャーでは、ノースブリッジの機能性は、別のノースブリッジチップを使用する代わりに、プロセッサに組み込まれ得る。場合によっては、システム（１０００）は、周辺バス（１０１８）に取り付けられたアクセラレータカード（１０２２）を含むことができる。アクセラレータは、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）または特定の処理を加速するための他のハードウェアを含むことができる。例えば、アクセラレータは、適応データの再構成のために、または拡張された設定処理に使用される代数式を評価するために使用されてもよい。

ソフトウェアおよびデータは、外部記憶装置（１０２４）に保存され、プロセッサによる使用のために、ＲＡＭ（１０１０）および／またはキャッシュ（１００４）にロードされ得る。システム（１０００）は、システムリソースを管理するためのオペレーティングシステムを含み、オペレーティングシステムの非限定な例としては、以下が挙げられる：Ｌｉｎｕｘ（登録商標）、Ｗｉｎｄｏｗｓ（商標）、ＭＡＣＯＳ（商標）、ＢｌａｃｋＢｅｒｒｙＯＳ（商標）、ｉＯＳ（商標）、および他の機能的に同等のオペレーティングシステム、ならびに本開示の典型的な例に従ってデータの記憶および最適化を管理するためのオペレーティングシステム上で実行するアプリケーションソフトウェア。本実施例では、システム（１０００）はさらに、ネットワークアタッチトストレージ（ＮＡＳ）および分散並行処理に使用される他のコンピュータシステムなどの、外部記憶装置へネットワークインターフェースを提供するための周辺バスに接続されたネットワークインターフェースカード（ＮＩＣ）（１０２０）および（１０２１）を含む。

図１１は、複数のコンピュータシステム（１１０２ａ）および（１１０２ｂ）、複数の携帯電話および携帯情報端末（１１０２ｃ）、ならびにネットワークアタッチトストレージ（ＮＡＳ）（１１０４ａ）および（１１０４ｂ）を備えるネットワーク（１１００）を示す図である。典型的な例では、システム（１１０２ａ）、（１１０２ｂ）および（１１０２ｃ）は、データ記憶を管理し、ネットワークアタッチトストレージ（ＮＡＳ）（１１０４ａ）および（１１０４ｂ）に保存されたデータのためにデータアクセスを最適化することができる。数学的モデルがデータに使用され、コンピュータシステム（１１０２ａ）および（１１０２ｂ）、および携帯電話と携帯情報端末のシステム（１１０２ｃ）にわたる分散並行処理を用いて評価され得る。コンピュータシステム（１１０２ａ）と（１１０２ｂ）および携帯電話と携帯情報端末システム（１１０２ｃ）はさらに、ネットワークアタッチトストレージ（ＮＡＳ）（１１０４ａ）および（１１０４ｂ）に保存されたデータの適応データ再構成（ａｄａｐｔｉｖｅｄａｔａｒｅｓｔｒｕｃｔｕｒｉｎｇ）のために平行処理を提供することができる。図１１は、一例を例示したものにすぎず、多種多様な他のコンピューターアーキテクチャーおよびシステムが、本開示の様々な例と共に使用され得る。例えば、並列処理を提供するためにブレードサーバーが使用されても良い。並列処理を提供するために、プロセッサブレードがバックプレーンで接続されても良い。また記憶装置は、バックプレーンに接続されても良いし、あるいは別のネットワークインターフェースを介してネットワークアタッチトストレージ（ＮＡＳ）として接続されても良い。いくつかの典型的例では、プロセッサは、別のメモリ空間を維持することができ、ネットワークインターフェース、バックプレーン、また他のプロセッサによる並列処理のための他のコネクターを介してデータを送信することができる。他の例では、プロセッサの一部または全てが、共有の仮想アドレスメモリ空間に使用することができる。

図１２は、典型的な例に従って共有の仮想アドレスメモリ空間を使用するマルチプロセッサコンピュータシステム（１２００）のブロック図である。システムは、共有メモリサブシステム（１２０４）にアクセスすることができる複数のプロセッサ（１２０２ａ）－（１２０２ｆ）を含む。システムは、複数のプログラマブルハードウェアメモリアルゴリズムプロセッサ（ＭＡＰ）（１２０６ａ）－（１２０６ｆ）を共有メモリサブシステム（１２０４）に組み込む。ＭＡＰ（１２０６ａ）－（１２０６ｆ）はそれぞれ、メモリ（１２０８ａ）－（１２０８ｆ）および１つ以上のフィールドプログラマブルゲートアレイ（ＦＰＧＡ）（１２１０ａ）－（１２１０ｆ）を含むことができる。ＭＡＰは、設定可能な機能ユニットを提供し、特定のアルゴリズムまたはアルゴリズムの一部が、それぞれのプロセッサと緊密に連携して処理を行うためにＦＰＧＡ（１２１０ａ）－（１２１０ｆ）に提供され得る。例えば、ＭＡＰは、データモデルに関する代数式を評価するために、および例における適応データ再編成を実行するために使用され得る。この例では、各々のＭＡＰは、これらの目的のための全てのプロセッサによって地球規模で利用可能である。１つの構成では、各々のＭＡＰは、関連するメモリ（１２０８ａ）－（１２０８ｆ）にアクセスするために直接メモリアクセス（ＤＭＡ）を用いることができ、それぞれのマイクロプロセッサ（１２０２ａ）－（１２０２ｆ）とは無関係および非同期にタスクを実行することを可能にする。この構成では、ＭＡＰは、アルゴリズムのパイプライン処理および並列実行のために、他のＭＡＰに結果を直接供給することができる。

上記のコンピューターアーキテクチャーおよびシステムは一例にすぎず、汎用プロセッサ、コプロセッサ、ＦＰＧＡおよび他のプログラマブルロジックデバイス、システムオンチップ（ＳＯＣ）、特定用途向け集積回路（ＡＳＩＣ）、ならびに他の処理素子および論理素子の任意の組み合わせを用いたシステムを含む、多種多様な他のコンピュータ、携帯電話、携帯情報端末アーキテクチャーおよびシステムが、例に関連して使用され得る。場合によっては、コンピュータシステムのすべてあるいは一部が、ソフトウェアまたはハードウェアにおいて実装されることもある。ランダムアクセスメモリ、ハードドライブ、フラッシュメモリ、テープドライブ、ディスクアレイ、ネットワークアタッチトストレージ（ＮＡＳ）および他のローカルまたは分散型データストレージデバイスおよびシステを含む、あらゆる種類のデータ記憶媒体が例に関連して使用されても良い。

典型的な例では、コンピュータシステムは、上記あるいは他のコンピューターアーキテクチャーおよびシステムのいずれかで実行するソフトウェアモジュールを用いて実装されても良い。他の場合では、システムの機能は、ファームウェア、図１２で参照されるフィールドプログラマブルゲートアレイ（ＦＰＧＡ）などのプログラマブルロジックデバイス、システムオンチップ（ＳＯＣ）、特定用途向け集積回路（ＡＳＩＣ）、あるいは他の処理素子および論理素子において部分的にまたは完全に実装され得る。例えば、図１０に例示されるアクセラレータカード（１０２２）などのハードウェアアクセラレータカードを用いることで、セットプロセッサおよびオプティマイザがハードウェアアクセラレーションで実装されることもある。

非一時的コンピュータ可読記憶媒体
本明細書に開示されるプラットフォーム、システム、媒体および方法は、任意にネットワーク化されたデジタル処理デバイスのオペレーティングシステムによって実行可能な命令を含むプログラムでコードされた１つ以上の非一時的なコンピュータ可読記憶媒体を含み得る。コンピュータ可読記憶媒体は、デジタル処理デバイスの有形要素であっても良い。コンピュータ可読記憶媒体は、デジタル処理デバイスから任意に取り外し可能である。コンピュータ可読記憶媒体は、非限定的な例として、ＣＤ－ＲＯＭ、ＤＶＤ、フラッシュメモリ装置、ソリッドステートメモリ、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、クラウドコンピューティングシステムおよびサービスなどを含む。場合によっては、プログラムおよび命令は、媒体上で永久に、実質的に永久に、半永久に、または非一時的にコードされる。

コンピュータプログラム
いくつかの実施形態では、本明細書に開示されるプラットフォーム、システム、媒体および方法は、少なくとも１つのコンピュータプログラム、あるいはその使用を含むこともある。コンピュータプログラムは、特定のタスクを実行するために書き込まれた、デジタル処理デバイスのＣＰＵにおいて実行可能な一連の命令を含む。コンピュータ可読命令は、特定のタスクを実行するか特定の抽象データ型を実施する、機能、オブジェクト、アプリケーションプログラムインターフェース（ＡＰＩ）、データ構造などのプログラムモジュールとして実行されてもよい。本明細書で提供される開示に照らして、コンピュータプログラムは、様々な言語の様々なバージョンで書き込まれても良い。

ウェブアプリケーション
コンピュータプログラムは、ウェブアプリケーションを含んでも良い。本明細書で提供される開示に照らして、ウェブアプリケーションは１つ以上のソフトウェアフレームワークおよび１つ以上のデータベースシステムを利用しても良い。ウェブアプリケーションは、Ｍｉｃｒｏｓｏｆｔ（登録商標）．ＮＥＴ、またはＲｕｂｙｏｎＲａｉｌｓ（ＲｏＲ）などのソフトウェアフレームワーク上で作成され得る。ウェブアプリケーションは、非限定的な例として、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、連想型データベース、およびＸＭＬデータベースのシステムを含む、１つ以上のデータベースシステムを利用することもある。さらなる実施形態では、適切なリレーショナルデータベースシステムは、非限定的な例として、Ｍｉｃｒｏｓｏｆｔ（登録商標）ＳＱＬＳｅｒｖｅｒ、ｍｙＳＱＬ（商標）、およびＯｒａｃｌｅ（登録商標）を含む。当業者は、ウェブアプリケーションが様々な実施形態において１つ以上の言語の１つ以上のバージョンで書かれていることを認識するであろう。ウェブアプリケーションは、１つ以上のマークアップ言語、プレゼンテーション定義言語、クライアント側スクリプト言語、サーバー側コーディング言語、データベースクエリ言語、またはこれらの組み合わせで書かれてもよい。いくつかの実施形態では、ウェブアプリケーションは、ハイパーテキストマークアップ言語（ＨＴＭＬ）、拡張可能ハイパーテキストマークアップ言語（ＸＨＴＭＬ）、または拡張可能マークアップ言語（ＸＭＬ）などのマークアップ言語である程度までは書かれている。ウェブアプリケーションは、カスケーディング・スタイル・シート（ＣＳＳ）などのプレゼンテーション定義言語である程度まで書かれても良い。ウェブアプリケーションは、エイジャックス（ＡｓｙｎｃｈｒｏｎｏｕｓＪａｖａｓｃｒｉｐｔａｎｄＸＭＬ（ＡＪＡＸ）、Ｆｌａｓｈ（登録商標）Ａｃｔｉｏｎｓｃｒｉｐｔ、Ｊａｖａｓｃｒｉｐｔ、またはＳｉｌｖｅｒｌｉｇｈｔ（登録商標）などの、クライアント側スクリプト言語である程度まで書かれても良い。ウェブアプリケーションは、アクティブサーバーページ（ＡＳＰ）、ＣｏｌｄＦｕｓｉｏｎ（登録商標）、Ｐｅｒｌ、Ｊａｖａ（商標）、ＪａｖａＳｅｒｖｅｒＰａｇｅｓ（ＪＳＰ）、ハイパーテキストプリプロセッサ（ＰＨＰ）、Ｐｙｔｈｏｎ（商標）、Ｒｕｂｙ、Ｔｃｌ、スモールトーク、ＷｅｂＤＮＡ（登録商標）、またはＧｒｏｏｖｙなどのサーバー側コーディング言語である程度までは書かれても良い。ウェブアプリケーションは、構造化クエリ言語（ＳＱＬ）などのデータベースクエリ言語である程度までは書かれても良い。

モバイルアプリケーション
コンピュータプログラムは、モバイルデジタル処理デバイスに提供されるモバイルアプリケーションを含むこともある。モバイルアプリケーションは、製造時にモバイルデジタル処理デバイスに提供されても良い。モバイルアプリケーションは、本明細書に記載されるコンピュータネットワークを介してモバイルデジタル処理デバイスに提供されても良い。

モバイルアプリケーションは、例えばハードウェア、言語および開発環境を用いて作成されても良い。モバイルアプリケーションは、様々なプログラミング言語で書かれても良い。適切なプログラミング言語は、非限定的な例として、Ｃ、Ｃ＋＋、Ｃ＃、Ｏｂｊｅｃｔｉｖｅ－Ｃ、Ｊａｖａ（商標）、Ｊａｖａｓｃｒｉｐｔ、Ｐａｓｃａｌ、ＯｂｊｅｃｔＰａｓｃａｌ、Ｐｙｔｈｏｎ（商標）、Ｒｕｂｙ、ＶＢ．ＮＥＴ、ＷＭＬ、およびＣＳＳを含むまたは含まないＸＨＴＭＬ／ＨＴＭＬ、あるいはこれらの組み合わせを含む。

適切なモバイルアプリケーションの開発環境は、いくつかのソースから利用可能である。市販の開発環境は、非限定的な例として、ＡｉｒｐｌａｙＳＤＫ、ａｌｃｈｅＭｏ、Ａｐｐｃｅｌｅｒａｔｏｒ（登録商標）、Ｃｅｌｓｉｕｓ、Ｂｅｄｒｏｃｋ、ＦｌａｓｈＬｉｔｅ、．ＮＥＴＣｏｍｐａｃｔＦｒａｍｅｗｏｒｋ、Ｒｈｏｍｏｂｉｌｅ、およびＷｏｒｋＬｉｇｈｔＭｏｂｉｌｅＰｌａｔｆｏｒｍを含む。他の開発環境は、コストをかけずに利用可能であり、非限定的な例として、Ｌａｚａｒｕｓ、ＭｏｂｉＦｌｅｘ、ＭｏＳｙｎｃ、およびＰｈｏｎｅｇａｐを含む。さらに、モバイルデバイスのメーカーは、非限定的な例として、ｉＰｈｏｎｅ（登録商標）およびｉＰａｄ（登録商標）（ｉＯＳ）ＳＤＫ、アンドロイド（商標）ＳＤＫ、ＢｌａｃｋＢｅｒｒｙ（登録商標）ＳＤＫ、ＢＲＥＷＳＤＫ、Ｐａｌｍ（登録商標）ＯＳＳＤＫ、ＳｙｍｂｉａｎＳＤＫ、ｗｅｂＯＳＳＤＫ、およびＷｉｎｄｏｗｓ（登録商標）モバイルＳＤＫを含むソフトウェア開発者キットを販売する。

スタンドアロンアプリケーション
コンピュータプログラムは、既存プロセスへのアドオン、例えばプラグイン、ではない独立したコンピュータプロセスとして実行されるプログラムである、スタンドアロンアプリケーションを含むことができる。スタンドアロンアプリケーションは、コンパイルされ得る。コンパイラは、プログラミング言語で書かれたソースコードをアセンブリ言語または機械コードなどのバイナリーオブジェクトコードに変換するコンピュータプログラムである。適切なコンパイルされたプログラミング言語は、非限定的な例として、Ｃ、Ｃ＋＋、Ｏｂｊｅｃｔｉｖｅ－Ｃ、ＣＯＢＯＬ、Ｄｅｌｐｈｉ、Ｅｉｆｆｅｌ、Ｊａｖａ（商標）、Ｌｉｓｐ、Ｐｙｔｈｏｎ（商標）、ＶｉｓｕａｌＢａｓｉｃ、およびＶＢ．ＮＥＴ、またはこれらの組み合わせを含む。コンパイルは、実行可能プログラムを作成するために少なくとも部分的に実行されることが多い。

ウェブブラウザプラグイン
コンピュータプログラムは、ウェブブラウザプラグインを含むことができる。コンピューティングにおいて、プラグインは、より大きなソフトウェアアプリケーションに特定の機能を加える１つ以上のソフトウエアコンポーネントであっても良い。ソフトウェアアプリケーションのメーカーは、第三者の開発者が、アプリケーションを拡張する能力を生み出し、容易に新しい特徴の追加を支援し、そしてアプリケーションのサイズを縮小することができるようにプラグインをサポートする。プラグインがサポートされている場合、プラグインはソフトウェアアプリケーションの機能のカスタマイズを可能にし得る。例えば、プラグインは、ビデオの再生、インタラクティビティーの生成、ウイルスのスキャン、および特定のファイルタイプの表示のために、ウェブブラウザで一般的に使用される。ウェブブラウザプラグインとしては、限定されないが、Ａｄｏｂｅ（登録商標）Ｆｌａｓｈ（登録商標）プレーヤー、Ｍｉｃｒｏｓｏｆｔ（登録商標）Ｓｉｌｖｅｒｌｉｇｈｔ（登録商標）、およびＡｐｐｌｅ（登録商標）ＱｕｉｃｋＴｉｍｅ（登録商標）が挙げられる。ツールバーは、１つ以上のウェブブラウザ拡張機能、アドイン、またはアドオンを含むことができる。いくつかの実施形態では、ツールバーは、１つ以上のエクスプローラバー、ツールバンド、またはデスクバンドを含む。

非限定的な例として、Ｃ＋＋、Ｄｅｌｐｈｉ、Ｊａｖａ（商標）、ＰＨＰ、Ｐｙｔｈｏｎ（商標）、またＶＢ．ＮＥＴ、あるいはそれらの組み合わせを含む、様々なプログラミング言語におけるプラグインの開発を可能にし得るいくつかのプラグイン・フレームワークが利用できる。

ウェブブラウザ（インターネットブラウザとも呼ばれる）は、ワールドワイドウェブ上の情報資源を検索し、表示し、トラバースするためのソフトウェアアプリケーションであり、それは、ネットワーク接続されたデジタル処理デバイスと共に使用するために構成されても良い。適切なウェブブラウザは、非限定的な例として、Ｍｉｃｒｏｓｏｆｔ（登録商標）ＩｎｔｅｒｎｅｔＥｘｐｌｏｒｅｒ（登録商標）、Ｍｏｚｉｌｌａ（登録商標）Ｆｉｒｅｆｏｘ（登録商標）、Ｇｏｏｇｌｅ（登録商標）Ｃｈｒｏｍｅ、Ａｐｐｌｅ（登録商標）Ｓａｆａｒｉ（登録商標）、ＯｐｅｒａＳｏｆｔｗａｒｅ（登録商標）Ｏｐｅｒａ（登録商標）、およびＫＤＥＫｏｎｑｕｅｒｏｒを含む。いくつかの実施形態では、ウェブブラウザは、モバイルのウェブブラウザである。モバイルのウェブブラウザ（マイクロブラウザ、ミニブラウザ、およびワイヤレスブラウザとも呼ばれる）は、限定しない例として、ハンドヘルドコンピュータ、タブレットコンピュータ、ネットブックコンピュータ、サブノートブックコンピュータ、スマートフォン、ミュージックプレーヤー、携帯情報端末（ＰＤＡ）、およびハンドヘルドビデオゲームシステムを含む、モバイルのデジタル処理デバイス上で使用されるために設計され得る。適切なモバイルのウェブブラウザは、非限定的な例として、Ｇｏｏｇｌｅ（登録商標）Ａｎｄｒｏｉｄ（登録商標）ブラウザ、ＲＩＭＢｌａｃｋＢｅｒｒｙ（登録商標）Ｂｒｏｗｓｅｒ、Ａｐｐｌｅ（登録商標）Ｓａｆａｒｉ（登録商標）、Ｐａｌｍ（登録商標）Ｂｌａｚｅｒ、Ｐａｌｍ（登録商標）ＷｅｂＯＳ（登録商標）Ｂｒｏｗｓｅｒ、携帯用のＭｏｚｉｌｌａ（登録商標）Ｆｉｒｅｆｏｘ（登録商標）、Ｍｉｃｒｏｓｏｆｔ（登録商標）ＩｎｔｅｒｎｅｔＥｘｐｌｏｒｅｒ（登録商標）Ｍｏｂｉｌｅ、Ａｍａｚｏｎ（登録商標）Ｋｉｎｄｌｅ（登録商標）ＢａｓｉｃＷｅｂ、Ｎｏｋｉａ（登録商標）Ｂｒｏｗｓｅｒ、ＯｐｅｒａＳｏｆｔｗａｒｅ（登録商標）Ｏｐｅｒａ（登録商標）Ｍｏｂｉｌ、およびＳｏｎｙ（登録商標）ＰＳＰ（商標）ブラウザを含む。

ソフトウェアモジュール
本明細書に記載されるシステム、媒体、ネットワークおよび方法は、ソフトウェア、サーバー、および／またはデータベースモジュールあるいはそれらの使用を含むこともある。ソフトウェアモジュールは、様々な機械、ソフトウェアおよびプログラミング言語を用いて作成されても良い。本明細書に開示されるソフトウェアモジュールは、多くの方法で実施される。ソフトウェアモジュールは、ファイル、コードのセクション、プログラミングオブジェクト、プログラミング構造、またはそれらの組み合わせを含んでも良い。ソフトウェアモジュールは、複数のファイル、コードの複数のセクション、複数のプログラミングオブジェクト、複数のプログラミング構造、またはそれらの組み合わせを含んでも良い。１つ以上のソフトウェアモジュールは、非限定的な例として、ウェブアプリケーション、モバイルアプリケーション、およびスタンドアロンアプリケーションを含んでも良い。いくつかの実施形態では、ソフトウェアモジュールは、１つのコンピュータプログラムまたはアプリケーション中にある。ソフトウェアモジュールは、１つを超えるコンピュータプログラムあるいはアプリケーション中にあっても良い。ソフトウェアモジュールは、１つの機械上でホストされても良い。ソフトウェアモジュールは、１つを超える機械上でホストされても良い。ソフトウェアモジュールは、クラウドコンピューティングプラットフォーム上でホストされても良い。ソフトウェアモジュールは、１つの場所において１つ以上の機械上でホストされても良い。ソフトウェアモジュールは、１つを超える場所において１つ以上の機械上でホストされても良い。

データベース
本明細書に開示されるプラットフォーム、システム、媒体および方法は、１つ以上のデータベース、あるいはそれらの使用を含むこともある。本明細書に提供される開示を考慮すると、多くのデータベースが生理学的データの記憶および検索に適している。様々な実施形態では、適切なデータベースは、非限定的な例として、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向型データベース、オブジェクトデータベース、実体関連モデルデータベース、連想型データベース、およびＸＭＬデータベースを含む。さらに非限定的な例としては、ＳＱＬ、ＰｏｓｔｇｒｅＳＱＬ、ＭｙＳＱＬ、Ｏｒａｃｌｅ、ＤＢ２、およびＳｙｂａｓｅが挙げられる。いくつかの実施形態では、データベースはインターネットを利用したものである。データベースは、ウェブを利用したものであっても良い。データベースは、クラウドコンピューティングを利用したものであっても良い。データベースは、１つ以上のローカルコンピュータ記憶デバイスに基づくこともある。

以下の実施例は、本明細書に開示される実施形態の原理および実践をより明確に当業者に例証するために示されており、任意の主題の実施形態の範囲を限定するものとして解釈されるべきではない。特段の定めのない限り、すべての部およびパーセントは重量ベースである。

アルゴリズム
本明細書に開示されるプラットフォーム、システム、媒体、および方法は、１つ以上のアルゴリズムまたはその使用を含む。本明細書で提供される本開示の観点から、多くのアルゴリズムが配列データの検索および比較に適している。様々な実施形態では、適切なアルゴリズムとしては、非限定的な例として、ＢＬＡＳＴ、ＤＩＡＭＯＮＤ、ＢＬＡＴ、ＢＷＴ、ＰＬＡＳＴ、スミス－ウォーターマン、あるいは他の配列の検索とアライメントのためのアルゴリズムが挙げられる。アルゴリズムは、既存のアルゴリズムの高速化版または拡張版、あるいはこうしたアルゴリズムを使用するソフトウェアツールを含むこともある。いくつかの例では、適切な高速化あるいは拡張化アルゴリズムおよびソフトウェアツールとしては、非限定的な例として、ＣＳ－ＢＬＡＳＴ、Ｔｅｒａ－ＢＬＡＳＴ、ＧＰＵ－Ｂｌａｓｔ、Ｇ－ＢＬＡＳＴＮ、ＭＰＩＢＬＡＳＴ、ＰａｒａｃｅｌＢＬＡＳＴ、ＣａＢＬＡＳＴ、あるいはＢＬＡＳＴアルゴリズムを高速化する任意の他のさらなるアルゴリズムまたはソフトウェアツールが挙げられる。

バイオセイフティーとバイオセキュリティーを増強させた生物学的配列あるいは構築物を設計および合成するためのシステムおよび方法が本明細書で提供される。いくつかの例では、バイオセイフティーとは、例えば、製造中または製造に由来する有害な生物学的製剤との接触を防ぐことを目的とする予防手段による個々の増強された安全性を指す。いくつかの例では、バイオセキュリティーとは、例えば、有害な生物学的製剤の使用または拡散を防ぐことを目的とする予防手段によって集団の安全を守ることを指す。いくつかの例では、１以上の生物学的配列を含む１以上の生物学的構築物が受信され、データベースを用いてバイオセキュリティーのリスクについてスクリーニングされ、および、生物学的配列あるいは構築物の１以上が有害な発現構築物または有害な生成物であると判定されると警報が発生される。いくつかの例では、生物学的配列または構築物とは合成配列を指す。いくつかの例では、生物学的配列または構築物とは自然発生配列を指す。いくつかの例では、生物学的配列または構築物とは核酸またはアミノ酸を含む。いくつかの例では、生物学的配列とは合成配列を指す。いくつかの例では、生物学的配列とは自然発生配列を指す。いくつかの例では、生物学的配列は核酸またはアミノ酸を含む。いくつかの例では、ユーザーアノテーションは、データベース中の生物学的配列または構築物の特性に関する追加情報を提供するために使用される。いくつかの例では、該方法および該システムは、ハイスループット設計／構築／テストのワークフローにシームレスに適合するように自動化に適している。いくつかの例では、生物学的構築物のスクリーニングは、複数の時点で単一のソースあるいは複数のソースから得られた小さな生物学的配列の組み合わせの比較を含む。いくつかの例では、有害であると判定された生物学的配列あるいは構築物は、将来の偽陽性を減らすために人間の専門家によってさらに評価される。いくつかの例では、こうしたシステムと方法は、コンピュータ、ソフトウェアアプリケーション、およびユーザー並びにデータベースとインターフェース接続するためのネットワークを含む。

以下を含むシステムが、本明細書で提供される：プロセッサおよびメモリ；生物学的な構築物のバイオセキュリティーを評価するための機械の命令であって、生物学的な構築物に関連する複数のタグのデータベース、を含む機械の命令；アノテーションツール；および、随意に、スクリーニングツール。さらに、生物学的配列あるいは構築物が１以上の生物学的配列を含むシステムが、本明細書で提供される。さらに、生物学的配列が核酸配列であるシステムが、本明細書で提供される。さらに、生物学的配列がタンパク質配列であるシステムが、本明細書で提供される。さらに、アノテーションツールが、生物学的な構築物の配列の１以上のアノテーションされたタグをユーザーが提供することができるように構成されたシステムが、本明細書で提供される。さらに、１以上のアノテーションされたタグが少なくとも宿主と懸念の程度を含むシステムが、本明細書で提供される。さらに、１以上のアノテーションされたタグが結果を含むシステムが、本明細書で提供される。さらに、結果が疾患を含むシステムが、本明細書で提供される。さらに、１以上のアノテーションされたタグが背景を含むシステムが、本明細書で提供される。さらに、１以上のアノテーションされたタグが病原性を含むシステムが、本明細書で提供される。さらに、１以上のアノテーションされたタグが害を含むシステムが、本明細書で提供される。さらに、１以上のアノテーションされたタグが１以上のターム（ｔｅｒｍｓ）に基づくシステムが、本明細書で提供される。さらに、１以上のアノテーションされたタグが１以上の文の記載に基づくシステムが、本明細書で提供される。さらに、アノテーションツールが１以上のアノテーションされたタグの統制語彙を作成するようにさらに構成されるシステムが、本明細書で提供される。さらに、アノテーションツールがキュレーションプロセスを含むシステムが、本明細書で提供される。さらに、キュレーションプロセスが外部データベースからデータベースまでの生物学的配列または構築物の情報を統合する工程を含むシステムが、本明細書で提供される。さらに、キュレーションプロセスが生物学的な構築物の無害な特徴を判定する工程を含むシステムが、本明細書で提供される。さらに、アノテーションツールが配列をデータベース中の生物学的の配列または構築物の配列とアライメントする工程を含むシステムが、本明細書で提供される。さらに、スクリーニングツールが生物学的な構築物の所定の配列のバイオセキュリティーリスクをユーザーが調べることを可能にするように構成されるシステムが、本明細書で提供される。さらに、所定の配列がヌクレオチド配列を含むシステムが、本明細書で提供される。さらに、所定の配列がタンパク質配列を含むシステムが、本明細書で提供される。さらに、スクリーニングツールが所定の配列をデータベース中の生物学的配列あるいは構築物の配列とアライメントするための配列アライナー（ｓｅｑｕｅｎｃｅａｌｉｇｎｅｒ）を含むシステムが、本明細書で提供される。さらに、バイオセキュリティーリスクの調査が相同性の程度によるフィルタリングことを含む検索システムが、本明細書で提供される。さらに、バイオセキュリティーリスクの調査が配列アラインメント長さを評価することを含む検索システムが、本明細書で提供される。さらに、バイオセキュリティーリスクが評価スコアを生成することを含む検索システムが、本明細書で提供される。さらに、スクリーニングツールがアプリケーションプログラマブルインタフェースをさらに含むシステムが、本明細書で提供される。さらに、機械の命令がアノテーションとスクリーニングのためのグラフィカルユーザインターフェースを含むシステムが、本明細書で提供される。

バイオセキュリティーリスクを評価するためのコンピュータで実施される方法が本明細書で提供され、該方法は：生物学的な構築物に関連する複数のタグを保存するデータベースをプロセッサによって使用する工程と、生物学的な構築物の特徴をアノテーションするためのアノテーションツールをプロセッサによって使用する工程と、随意に、生物学的な構築物の特徴を調べるためのるスクリーニングツールをプロセッサによって使用する工程とを含む。さらに、生物学的な構築物が生物学的配列を含む方法が、本明細書で提供される。さらに、生物学的配列が核酸配列である方法が、本明細書で提供される。さらに、生物学的配列がタンパク質配列である方法が、本明細書で提供される。さらに、アノテーションツールが、生物学的な構築物の配列の１以上のアノテーションされたタグをユーザーが提供することができるように構成された方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが少なくとも宿主と懸念の程度を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが結果を含む方法が、本明細書で提供される。さらに、結果が疾患を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが背景を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが病原性を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが害を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが１以上の項に基づく方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが１以上の文の記載に基づく方法が、本明細書で提供される。さらに、アノテーションツールが１以上のアノテーションされたタグの統制語彙を作成するようにさらに構成される方法が、本明細書で提供される。さらに、アノテーションツールがキュレーションプロセスを含む方法が、本明細書で提供される。さらに、キュレーションプロセスが外部データベースからデータベースまでの生物学的配列または構築物の情報を統合する工程を含む方法が、本明細書で提供される。さらに、キュレーションプロセスが生物学的な構築物の無害な特徴を判定する工程を含む方法が、本明細書で提供される。さらに、アノテーションツールが配列をデータベース中の生物学的な構築物の配列とアライメントする工程を含む方法が、本明細書で提供される。さらに、スクリーニングツールが生物学的な構築物の所定の配列のバイオセキュリティーリスクをユーザーが調べることを可能にするように構成される方法が、本明細書で提供される。さらに、所定の配列がヌクレオチド配列を含む方法が、本明細書で提供される。さらに、所定の配列がタンパク質配列を含む方法が、本明細書で提供される。さらに、スクリーニングツールが所定の配列をデータベース中の生物学的な構築物の配列とアライメントするための配列アライナー（ｓｅｑｕｅｎｃｅａｌｉｇｎｅｒ）を含む方法が、本明細書で提供される。さらに、バイオセキュリティーリスクの調査が相同性の程度によるフィルタリングことを含む検索システムが、本明細書で提供される。さらに、バイオセキュリティーリスクの調査が配列アラインメント長さを評価することを含む検索システムが、本明細書で提供される。さらに、バイオセキュリティーリスクが評価スコアを生成することを含む検索システムが、本明細書で提供される。さらに、スクリーニングツールがアプリケーションプログラマブルインタフェースを含む方法が、本明細書で提供される。さらに、機械の命令がアノテーションとスクリーニングのためのグラフィカルユーザインターフェースを含む方法が、本明細書で提供される。

バイオセキュリティーリスクを評価するためのコンピュータで実施される方法が本明細書で提供され、該方法は、生物学的な構築物に関連する複数のタグを保存するデータベースに、プロセッサによってアクセスする工程と、生物学的な構築物の特徴を調べるためのスクリーニングツールに、プロセッサによってアクセスする工程と、スクリーニングツールの調査結果を送るための報告ツールを、プロセッサによって送信する工程とを含む。さらに、生物学的な構築物が生物学的配列を含む方法が、本明細書で提供される。さらに、生物学的配列が核酸配列である方法が、本明細書で提供される。さらに、生物学的配列がタンパク質配列である方法が、本明細書で提供される。さらに、生物学的な構築物の配列の１以上のアノテーションされたタグをユーザーが提供することができるように構成されたアノテーションツールを含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが少なくとも宿主と懸念の程度を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが結果を含む方法が、本明細書で提供される。さらに、結果が疾患を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが背景を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが病原性を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが害の程度を含む方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが１以上の項に基づく方法が、本明細書で提供される。さらに、１以上のアノテーションされたタグが１以上の文の記載に基づく方法が、本明細書で提供される。さらに、アノテーションツールが１以上のアノテーションされたタグの統制語彙を作成するようにさらに構成される方法が、本明細書で提供される。さらに、アノテーションツールがキュレーションプロセスを含む方法が、本明細書で提供される。さらに、キュレーションプロセスが外部データベースからデータベースまでの生物学的配列または構築物の情報を統合する工程を含む方法が、本明細書で提供される。さらに、キュレーションプロセスが生物学的な構築物の無害な特徴を判定する工程を含む方法が、本明細書で提供される。さらに、アノテーションツールが配列をデータベース中の生物学的な構築物の配列とアライメントする工程を含む方法が、本明細書で提供される。さらに、スクリーニングツールが生物学的な構築物の所定の配列のバイオセキュリティーリスクをユーザーが調べることを可能にするように構成される方法が、本明細書で提供される。さらに、所定の配列がヌクレオチド配列を含む方法が、本明細書で提供される。さらに、所定の配列がタンパク質配列を含む方法が、本明細書で提供される。さらに、スクリーニングツールが所定の配列をデータベース中の生物学的な構築物の配列とアライメントするための配列アライナー（ｓｅｑｕｅｎｃｅａｌｉｇｎｅｒ）を含む方法が、本明細書で提供される。さらに、バイオセキュリティーリスクの調査が相同性の程度によるフィルタリングことを含む検索システムが、本明細書で提供される。さらに、バイオセキュリティーリスクの調査が配列アラインメント長さを評価することを含む検索システムが、本明細書で提供される。さらに、バイオセキュリティーリスクが評価スコアを生成することを含む検索システムが、本明細書で提供される。さらに、スクリーニングツールがアプリケーションプログラマブルインタフェースを含む方法が、本明細書で提供される。さらに、アノテーションのためのグラフィカルユーザインターフェース用の機械の命令を送信する工程をさらに含む方法が、本明細書で提供される。さらに、スクリーニングのためのグラフィカルユーザインターフェース用の機械の命令を送信する工程をさらに含む方法が、本明細書で提供される。さらに、報告のためのグラフィカルユーザインターフェース用の機械の命令を送信する工程をさらに含む方法が、本明細書で提供される。さらに、生物学的な構築物が有害な発現産物（例えば翻訳に起因するタンパク質）あるいは有害な生成物（例えば転写に起因するＲＮＡ）に関連する生物学的配列を含む方法が、本明細書で提供される。さらに、生物学的配列がウイルス、細菌、または真菌である方法が、本明細書で提供される。さらに、生物学的な構築物に関連する複数のタグを保存するためにデータベースにアクセスするという受信された機械の命令を含む方法が、本明細書で提供される。さらに、機械の命令が生物学的な構築物に関連する情報を含む方法が、本明細書で提供される。さらに、生物学的配列あるいは構築物に関連する情報が核酸配列あるいはタンパク質配列を含む方法が、本明細書で提供される。さらに、生物学的配列または構築物に関連する情報がデータベース登録番号を含む方法が、本明細書で提供される。

本開示の様々な態様は個々に、まとめて、あるいは互いに組み合わせて評価可能であることが理解されよう。本明細書に記載される本開示の様々な態様は以下で説明される特定の用途のいずれかに適用され得る。本開示の他の目的と特徴は、明細書、請求項、および添付の図面を精査することによって明白になる。

実施例１：配列アノテーション

生物学的配列はプロセッサユニットによって受信された。本実施例では、生物学的配列はタンパク質配列である。プロセッサユニットはタンパク質データベースにアクセスし、受信されたタンパク質配列に一致するタンパク質配列を同定した。プロセッサユニットは、タンパク質配列の様々な特性に関連する情報を受信した。特性は以下のものを含んでいた：タンパク質配列に関連する核酸配列、タンパク質配列、タンパク質の名称、株ソース情報、配列データベース（例えば、ＮＣＢＩ）へのリンク、配列データベース登録番号、同一配列（タンパク質または核酸）、類似配列（タンパク質または核酸）、疾患源（例えば、ウイルス、細菌）、有機体の分類学的な記載（例えば、界、門、綱、目、科、属、種）、宿主情報（例えば、ヒト、哺乳動物、鳥、昆虫）、有害な相互作用の文脈または経路（例えば、摂取、吸入）、徴候、および懸念の程度。本実施例では、利用したタンパク質はニューカッスル病ウイルス－３であった。典型的なユーザーインターフェースにより提供されたアノテーションのための特性が図１で提供されている。機械の命令が生物学的配列に関連する特性の情報とともにプロセッサによって受け取られると、生物学的配列に関連するタグ情報が更新された。例えば、図１を参照すると、ニューカッスル病ウイルス－３は、タンパク質配列、同一タンパク質（ＡＨＬ４５１９．１．１とＡＨＬ４５１９３．１）、宿主型（鳥）、有害な相互作用の手段（吸入）、および徴候（呼吸不全）のタグ情報を有する。

プロセッサユニットが「赤血球凝集素ノイラミニダーゼ－ニューカッスル病ウイルス」ファミリーに関する選択を受信すると、ウイルス株情報のリストがアクセスされ、随意に、菌株を表示するというユーザーインターフェースに対する機械の命令とともに送信された。例えば、アノテーションのための赤血球凝集素ノイラミニダーゼ－ニューカッスル病ウイルスの６７９の利用可能な菌株の一部のリストを提供している図２を参照する。

本明細書と一致するさらなるタグ情報は、限定されないが、連邦政府の指定生物剤プログラム（ＦＳＡＰ）管理あるいは輸出管理（ＥｘｐｏｒｔＣｏｎｔｒｏｌ）を含むいくつかの例でも使用される。

実施例２：配列スクリーニング

図３Ａを参照すると、プロセッサは、生物学的配列情報、この場合は核酸情報を含むクエリファイルの形態の機械の命令を受信した。プロセッサは核酸やタンパク質データベースとも通信していた。プロセッサは核酸とタンパク質データベースにアクセスした。ＢＬＡＳＴ処理されたレポートは、照会された生物学的配列と部分的または全体的に関連があると同定された同じおよび類似する配列を表記して作成される。ＢＬＡＳＴ処理されたレポートからの配列は、その後、「制限された」リストとも呼ばれる、有害な生物学的配列（タンパク質または核酸）に関連する配列を同定する配列アノテーションを含むデータベースに照会された。スクリーニングレポートは、これらの処理の結果を要約するユーザーインターフェースの形態で作成された。スクリーニングレポートはユーザーインターフェースに対する機械の命令の形態で送信された。プロセッサは、制限されたリスト情報にアクセスするというデータベースに対する特別な命令を受けた。図４を参照。制限されたリストは、インターネット上で開いていることもあれば、閉じられていることもあり、認証を用いてのみアクセス可能であることもある。スクリーニングレポートも生物学的配列のスクリーニングの要約を含むように作成された。５回のスクリーニングを行った。図６を参照。スクリーニングレポートは「制限された割り当て」つまり、有害な生物学的配列のリストを含むように作成された。図７を参照。スクリーニングレポートは－Ｂｒｕｃｅｌｌａｓｕｉｓ－２タンパク質を同定した。

実施例３：特定のゲノムに対するプレスクリーニング

大痘瘡または小痘瘡のゲノムの５００を超えるヌクレオチドへのアクセスは、世界保健機構（ＷＨＯ）の政策によって制限されている。もっと長い配列を希望する者は申請を行い、合成の前にＷＨＯにより許可を受けなければならない。痘瘡の固有の性質ゆえに、ワクシニアおよび他の密接に関連するオルソポックスウイルスとともに、大痘瘡と小痘瘡のゲノムのみに対するプレスクリーニングを行う。核酸配列は、実施例２の一般的なバイオセキュリティースクリーニング法とオルソポックスウイルスのゲノムを使用して評価された。このスクリーニングは（商品ハードウェア上でｂｌａｓｔｘによって）１秒未満で実行された。ワクシニアと他のオルソポックスの基準配列は、要求された配列の相同性が警報前に痘瘡に対して最も大きくなる（２０１０ＨＨＳガイダンス「最良」基準に類似する）ことを確かめるために含まれた。これは、有害な配列が検出されると製造を開始する前に人間によるレビューを求める警報が発生されるオーダー見積（ｏｒｄｅｒｑｕｏｔｅ）生成プロセスの間に、随意に実施することが可能である。

実施例４：ライブラリー鋳型スクリーニング

約２００のアミノ酸をコードする遺伝子をコードする約６００のヌクレオチドの遺伝子長さの核酸配列を、変異体ライブラリーの産生のために選択した。配列を得て、実施例２の一般的なバイオセキュリティースクリーニング法に晒すことで、変異体ライブラリーが確実に有害な配列を含まないようにした。プログラムは、有害な配列が検出されると人間によるレビューを求める警報を発生させるように設計された。

実施例５：カスタム核酸スクリーニング

ベクターなどの物理的な核酸含有材料が次世代シーケンシング（ＮＧＳ）により得られ、配列決定された。ＮＧＳから得られたコンセンサス配列データを、実施例２の一般的なバイオセキュリティースクリーニング法に晒した。これにより、核酸材料は、使用するための挿入部位から離れてベクター骨格中の毒素の発現をコードするなどしてバイオセキュリティーまたはバイオセイフティーの懸念を引き起こさず、大腸菌への形質転換が毒素などの有害な薬剤の発現を引き起こすことになる。プログラムは、有害な配列が検出されると人間によるレビューを求める警報を発生させるように設計された。

実施例６：指定病原体のゲノムに対する同じクエリ内のクロスオーダーアセンブリ

要求者（顧客などの生物学的配列あるいは構築物の要求元）が、経時的に、および個々のオーダーに沿って、指定病原体（ｓｅｌｅｃｔａｇｅｎｔ）により規制される細菌あるいはウイルスのいずれかのゲノムのかなりの部分を蓄積させる可能性があるというリスクを管理するために、各要求者の後のバックグラウンドプロセスは、その要求者からのすべての事前のオーダーのデータベースを照会し、かつ、実施例２の一般的な方法を用いて指定病原体の細菌あるいはウイルスのいずれかに対する相同性が高い任意のセグメントの記録を集める。これにより、たとえ上記のような領域が個々のオーダーの間に正式な警報あるいは所有の拒否を引き起こすのに不十分であったとしても、評価および警報が保証される。これらの相同性の高いセグメントは、懸念のある指定病原体のゲノム上の区間として表され、その後、要求者ごとおよびゲノムごとのすべての区間の結合が、要求者ごとにこうした有機体の最大の理論構成を決定するために生成される。いったん任意の要求者が所定の指定病原体のゲノムの２０％以上を生成することができるようになると、人間によるレビューと要求者のフォローアップを求める警報が意図的に発生される。

実施例７：仮説生成のための指定病原体のゲノムに対するポリヌクレオチドプールアセンブリ

せいぜい２００の塩基しか含んでいない配列などの短いポリヌクレオチド配列について、既存のスクリーニング方法は非常に高い偽陽性率を誇る。要求者（生物学的配列または構築物の要求元、つまり、顧客）が、制御されたあるいは有害な配列を潜在的にアセンブルするのに十分なポリヌクレオチドをいつオーダーしたのかを判定するために、ポリヌクレオチドのセットを調べる代替的なスクリーニングアプローチが用いられる。オーダーの間に、バックグラウンドプロセスは、１以上の要求元の内部で、ＮＧＳからのアセンブリアルゴリズムを使用して、指定病原体の細菌とウイルスのゲノムに対するオーダーにわたってポリヌクレオチドをアセンブルする。これらのアセンブリは、「要求者ＡおよびＢのオーダーＸ、Ｙ、およびＺを組み合わせると、痘瘡の３つの遺伝子を完全にアセンブルすることができる」などといった仮説の生成を可能にする。こうした仮説は、人間によるレビューを求める警報を発生させ、随意に、要求者との継続的な議論を引き起こし、あるいは法執行機関（ｌａｗｅｎｆｏｒｃｅｍｅｎｔ）へ直接報告する。遺伝子長の配列に対する高い相同性の可能性が低いことを考慮すると、偽陽性率は低いままでなければならず、さらなる偽陽性の減少は、容易なアセンブリを可能にする適切な重複が存在する（つまり、それを念頭に設計されたように見える）かどうかを判定するために、仮定されたポリヌクレオチド集合のアライメント構造を評価する形態でもたらされる。

実施例８：機械学習によりガイドされたリスクアノテーション

スクリーニングプラットフォームと人間によるレビューにより、広範な制限されていないリストと、真陽性の警報のケースのセットとが作られ、ここで、生物学的配列または構築物の要求元が懸念のある制限された配列をオーダーしたことが確認された。機械学習アルゴリズムを、配列自体（例えば、隠れマルコフモデル（ＨＭＭ）タイプの文脈を意識した状態モデル）および／またはＧｅｎＢａｎｋ記録アノテーション（例えば、あらかじめ制限されなかった配列を列挙した記録を用いて、共有された言語および意味に基づいて、将来の制限されていない配列割り当ての可能性を予測するための自然言語処理（ＮＬＰ）タイプのモデル）の両方で学習させる。

本開示の好ましい実施形態が本明細書で示され記載されているが、こうした実施形態はほんの一例として与えられているに過ぎないということは当業者には明白であろう。多くの変形、変更、および置換が、本開示から逸脱することなく、当業者によって想到される。本明細書に記載される本開示の実施形態の様々な代案が本開示の実施の際に利用され得ることを理解されたい。

Claims

増強されたポリヌクレオチド合成を提供するためのコンピュータ化されたシステムであって：前記コンピュータ化されたシステムは、
ａ）有害な生物学的配列のリストを表わすことに適しているデータベースをホストするためのサーバー；
ｂ）ネットワーク接続；および
ｃ）汎用コンピュータに対する命令を含むコンピュータ可読媒体を含み；
前記コンピュータ化されたシステムは、：
ｉ）１つ以上の設計命令を受信する方法であり、ここで、設計命令は複数の生物学的配列を含み、生物学的配列の各々はせいぜい５００の塩基の長さであり、そして複数の生物学的配列は核酸またはアミノ酸配列を含む、方法；
ｉｉ）複数の生物学的配列の少なくとも２つの生物学的配列がまとめて、データベース中の有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する方法；および、
ｉｉｉ）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる方法で動作するよう構成されるコンピュータ化されたシステム。
警報が発生されない場合、１つ以上の配列が合成されることを特徴とする、請求項１に記載のコンピュータ化されたシステム。
有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当する複数の生物学的配列の少なくとも２つの生物学的配列を変更するための命令を受信することを特徴とする、請求項１に記載のコンピュータ化されたシステム。
複数の受信された設計命令が１つ以上の時点で受信されることを特徴とする、請求項１または３に記載のコンピュータ化されたシステム。
複数の受信された設計命令は、様々なソースからのものであることを特徴とする、請求項１～４のいずれか１つに記載のコンピュータ化されたシステム。
複数の受信された設計命令は、３つ以上の様々なソースからのものであることを特徴とする、請求項５に記載のコンピュータ化されたシステム。
複数の受信された設計命令は、５つ以上の様々なソースからのものであることを特徴とする、請求項５に記載のコンピュータ化されたシステム。
複数の受信された設計命令は、１０以上の様々なソースからのものであることを特徴とする、請求項５に記載のコンピュータ化されたシステム。
１つ以上の生物学的配列は、各々せいぜい２００の塩基の長さであることを特徴とする、請求項１～８のいずれか１つに記載のコンピュータ化されたシステム。
１つ以上の生物学的配列は、各々せいぜい１００の塩基の長さであることを特徴とする、請求項９に記載のコンピュータ化されたシステム。
１つ以上の生物学的配列は、各々せいぜい５０の塩基の長さであることを特徴とする、請求項９に記載のコンピュータ化されたシステム。
１つ以上の生物学的配列は、各々せいぜい２０の塩基の長さであることを特徴とする、請求項９に記載のコンピュータ化されたシステム。
増強されたポリヌクレオチド合成を提供するための方法であって：前記方法は
ａ）１つ以上の設計命令を受信する工程であって、ここで、設計命令は複数の生物学的配列を含み、生物学的配列の各々はせいぜい５００の塩基の長さであり、および複数の生物学的配列は核酸またはアミノ酸配列を含む、工程；
ｂ）複数の生物学的配列の少なくとも２つの生物学的配列がまとめて、データベースにおける有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する工程；および、
ｃ）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる工程、を含む、方法。
警報が発生されない場合、１つ以上の配列が合成されることを特徴とする、請求項１３に記載の方法。
有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当する複数の生物学的配列の少なくとも２つの生物学的配列を変更するための命令を受信することを特徴とする、含請求項１３に記載の方法。
増強されたポリヌクレオチド合成を提供するためのコンピュータ化されたシステムであって：前記コンピュータ化されたシステムは、
ａ）配列のリストを表わすことに適しているデータベースをホストするためのサーバー；
ｂ）ネットワーク接続；および
ｃ）汎用コンピュータに対する命令を含むコンピュータ可読媒体を含み、
前記コンピュータ化されたシステムは、：
ｉ）１つ以上の設計命令を受信する方法であり、ここで、設計命令は複数の生物学的配列を含み、複数の生物学的配列はベクター配列を含み、および複数の追加の挿入配列を含む、方法；
ｉｉ）ベクターおよび複数の挿入配列の少なくとも１つがまとめて、データベースにおける有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する方法；および、
ｉｉｉ）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる方法で動作するよう構成されるコンピュータ化されたシステム。
警報が発生されない場合、１つ以上の生物学的配列が合成されることを特徴とする、請求項１６に記載のコンピュータ化されたシステム。
有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当するベクターおよび複数の挿入配列少なくとも１つを変更するための命令を受信することを特徴とする、請求項１６に記載のコンピュータ化されたシステム。
複数の受信された設計命令は、１つ以上の時点において受信されることを特徴とする、請求項１６～１８に記載のいずれか１つのシステム。
複数の受信された設計命令は、様々なソースから受信されることを特徴とする、請求項１６～１９のいずれか１つに記載のシステム。
複数の受信された設計命令は、３つ以上の様々なソースからのものであることを特徴とする、請求項２０に記載のコンピュータ化されたシステム。
複数の受信された設計命令は、５つ以上の様々なソースからのものであることを特徴とする、請求項２０に記載のコンピュータ化されたシステム。
複数の受信された設計命令は、１０以上の様々なソースからのものであることを特徴とする、請求項２０に記載のコンピュータ化されたシステム。
１つ以上の生物学的配列は、せいぜい２００の塩基の長さであることを特徴とする、請求項１６～２３のいずれか１つに記載のシステム。
１つ以上の生物学的配列は、各々せいぜい１００の塩基の長さであることを特徴とする、請求項２４に記載のコンピュータ化されたシステム。
１つ以上の生物学的配列は、各々せいぜい５０の塩基の長さであることを特徴とする、請求項２４に記載のコンピュータ化されたシステム。
１つ以上の生物学的配列は、各々せいぜい２０の塩基の長さであることを特徴とする、請求項２４に記載のコンピュータ化されたシステム。
増強されたポリヌクレオチド合成を提供するための方法であって：前記方法は
ａ）１つ以上の設計命令を受信する工程であって、ここで、設計命令はベクター配列である複数の生物学的配列および複数の追加の挿入配列を含む、工程；
ｂ）ベクターおよび少なくとも１つの複数の挿入配列がまとめて、データベースにおける有害な生物学的配列の少なくとも２０％に相当するか否かを自動的に決定する工程；および、
ｃ）有害な生物学的配列の少なくとも２０％が検出された場合に、自動的に警報を発生させる工程、を含む、方法。
生物学的配列は、物理的な核酸またはタンパク質サンプルの配列決定から得られることを特徴とする、請求項２８に記載の方法。
有害な生物学的配列を取り除くために、有害な生物学的配列の少なくとも２０％に相当するベクターおよび複数の挿入配列の少なくとも１つを変更するための命令を受信することを特徴とする、請求項２８に記載の方法。
警報が発生されない場合、１つ以上の生物学的配列が合成されることを特徴とする、請求項２８～３０のいずれか１つに記載の方法。