JP2021510435A - 生ゲノムデータに基づく構成可能テキスト文字列の生成 - Google Patents

生ゲノムデータに基づく構成可能テキスト文字列の生成 Download PDF

Info

Publication number
JP2021510435A
JP2021510435A JP2020537765A JP2020537765A JP2021510435A JP 2021510435 A JP2021510435 A JP 2021510435A JP 2020537765 A JP2020537765 A JP 2020537765A JP 2020537765 A JP2020537765 A JP 2020537765A JP 2021510435 A JP2021510435 A JP 2021510435A
Authority
JP
Japan
Prior art keywords
text
gene
configurable
group
sequencer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020537765A
Other languages
English (en)
Other versions
JP7074861B2 (ja
Inventor
アフメット ゼヒル
アフメット ゼヒル
ジョン スコット ジーグラー
ジョン スコット ジーグラー
Original Assignee
メモリアル スローン ケタリング キャンサー センター
メモリアル スローン ケタリング キャンサー センター
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メモリアル スローン ケタリング キャンサー センター, メモリアル スローン ケタリング キャンサー センター filed Critical メモリアル スローン ケタリング キャンサー センター
Publication of JP2021510435A publication Critical patent/JP2021510435A/ja
Application granted granted Critical
Publication of JP7074861B2 publication Critical patent/JP7074861B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ゲノムデータ翻訳システムを、次世代配列決定情報を処理するように構成することができる。システムは、生ゲノムデータを含む出力ファイルを受信することができる。システムは、出力ファイルを解析して、個々の染色体に対応するセグメントを判定することができる。システムは、ヌクレオチドの範囲を特定し、ヒト参照ゲノムリストに含まれる、範囲内の第1の遺伝子群を判定することができる。システムは、遺伝子の遺伝子リストを維持し、遺伝子リストと第1の遺伝子群とに含まれる一致遺伝子群を判定することもできる。システムは、構成不能領域および構成可能領域を含む構成可能テキスト文字列を生成することができる。構成可能領域に、生ゲノムデータ、翻訳規則群、および翻訳テキスト文字列群に基づくテキストを追加することができる。

Description

関連出願の相互参照
本出願は、参照により本明細書に全体が組み込まれている、2018年1月10に出願された米国仮特許出願第62/615,743号の優先権を主張する。
本開示は、一般に、生ゲノムデータを可読テキスト出力に変換することに関する。
ゲノムデータ処理は、次世代シーケンサから受信したゲノム出力をグラフィック表示することを含み得る。グラフィック表示は、試験した核酸配列内における特定の遺伝子変化の読取回数を表示することを含み得る。しかしながら、グラフィック表示は、次世代シーケンサによって生成された生ゲノムデータで利用可能なさらなる有益な情報を提供することはない。
一態様において、本開示は、次世代配列決定情報を処理するシステムを含む。システムは、1つまたは複数のプロセッサと、命令を含む1つまたは複数のメモリ素子とを備え、この命令は、実行されると、1つまたは複数のプロセッサにいくつかの動作を実行させる。動作は、次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信することを含む。動作は、出力ファイル内の、染色体数、サイトバンド(cytoband)情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定することをさらに含む。動作は、ヒト参照ゲノムリストに含まれる、ヌクレオチド範囲内の第1の遺伝子群を判定することも含む。動作は、第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定することをさらに含む。一部の実施形態において、遺伝子リストに現れる少なくとも1つの遺伝子は、がん関連である。動作は、構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成することも含む。動作は、染色体数に基づく第1の構成可能テキスト領域の第1のテキスト、コピー数群に基づく第2の構成可能テキスト領域の第2のテキスト、および一致遺伝子群に基づく第3の構成可能テキスト領域の第3のテキストを含むことも含む。動作は、構成可能テキスト文字列を出力インターフェースに提供することをさらに含む。
別の態様において、本開示は、次世代配列決定情報を処理する方法を含む。方法は、1つまたは複数のプロセッサにおいて、次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信するステップを含む。方法は、1つまたは複数のプロセッサにおいて、出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定するステップも含む。方法は、1つまたは複数のプロセッサにおいて、ヒト参照ゲノムリストに含まれる、ヌクレオチド範囲内の第1の遺伝子群を判定するステップをさらに含む。方法は、1つまたは複数のプロセッサにおいて、第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定するステップをさらに含む。方法は、1つまたは複数のプロセッサにおいて、構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成するステップをさらに含む。方法は、染色体数に基づく第1の構成可能テキスト領域の第1のテキスト、コピー数群に基づく第2の構成可能テキスト領域の第2のテキスト、および一致遺伝子群に基づく第3の構成可能テキスト領域の第3のテキストを含むステップをさらに含む。方法は、1つまたは複数のプロセッサによって、構成可能テキスト文字列を出力インターフェースに提供するステップも含む。
さらに別の態様において、本開示は、プロセッサが実行可能な命令を格納するコンピュータ可読記憶媒体に関し、この命令は、少なくとも1つのプロセッサによって実行されると、少なくとも1つのプロセッサにいくつかの動作を実行させる。動作は、次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信することを含む。動作は、出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定することをさらに含む。動作は、ヒト参照ゲノムリストに含まれる、ヌクレオチド範囲内の第1の遺伝子群を判定することも含む。動作は、第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定することをさらに含む。一部の実施形態において、遺伝子リストに現れる少なくとも1つの遺伝子はがん関連である。動作は、構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成することも含む。動作は、染色体数に基づく第1の構成可能テキスト領域の第1のテキスト、コピー数群に基づく第2の構成可能テキスト領域の第2のテキスト、および一致遺伝子群に基づく第3の構成可能テキスト領域の第3のテキストを含むことも含む。動作は、構成可能テキスト文字列を出力インターフェースに提供することをさらに含む。
本開示の前記およびその他の目的、態様、特徴、および利点が、添付図面と共に以下の説明を参照することによって、さらに明らかになり、より十分に理解されるだろう。
サーバデバイスと通信するクライアントデバイスを含むネットワーク環境の実施形態を示すブロック図である。 クラウドサービスプロバイダと通信するクライアントデバイスを含むクラウドコンピューティング環境を示すブロック図である。 本明細書に記載の方法およびシステムに関連して有用なコンピューティングデバイスの実施形態を示すブロック図である。 本明細書に記載の方法およびシステムに関連して有用なコンピューティングデバイスの実施形態を示すブロック図である。 次世代シーケンサによって生成された生ゲノムデータを、人間が読めるテキスト文字列に翻訳するためのコンピュータ環境を示す図である。 次世代シーケンサによって生成された生ゲノムデータの例を示す図である。 生ゲノムデータを翻訳するプロセスのフロー図である。 図3に示す生ゲノムデータからゲノムデータ翻訳システムによって特定された様々なセグメントを示す図である。 構成可能テキスト文字列の例を示す図である。 生ゲノムデータ、翻訳規則、および遺伝子リストに基づく翻訳エンジンの翻訳済み出力の例を示す図である。
以下の様々な実施形態の説明を読むために、明細書のセクションおよびそれぞれの内容についての以下の説明が有用となり得る。
セクションAは、本明細書に記載の実施形態を実施するのに有用となり得るネットワーク環境およびコンピューティング環境を説明する。
セクションBは、次世代シーケンサによって生成された生ゲノムデータを、人間が読めるテキスト文字列に翻訳するためのシステムおよび方法の実施形態を説明する。
A コンピュータおよびネットワーク環境
本解決策の特定の実施形態について述べる前に、本明細書に記載の方法およびシステムに関連する動作環境および関連システム部品(例えば、ハードウェア要素)の態様を説明することが有用であり得る。図1Aを参照すると、ネットワーク環境の実施形態が示される。簡単に言うと、ネットワーク環境は、1つまたは複数のネットワーク104を介して1つまたは複数のサーバ106a〜106n(一般に、サーバ106、ノード106、またはリモートマシン106とも呼ばれる)と通信する、1つまたは複数のクライアント102a〜102n(一般に、ローカルマシン102、クライアント102、クライアントノード102、クライアントマシン102、クライアントコンピュータ102、クライアントデバイス102、エンドポイント102、またはエンドポイントノード102とも呼ばれる)を含む。一部の実施形態において、クライアント102は、サーバによって提供されるリソースへのアクセスを求めるクライアントノードと、他のクライアント102a〜102nにホストリソースへのアクセスを与えるサーバとの両方として機能する能力を有する。
図1Aは、クライアント102とサーバ106との間にあるネットワーク104を示すが、クライアント102とサーバ106とが同一のネットワーク104上にあってもよい。一部の実施形態において、クライアント102とサーバ106との間に複数のネットワーク104があってもよい。これらの実施形態のうちの1つにおいて、ネットワーク104’(図示せず)がプライベートネットワークであり、ネットワーク104がパブリックネットワークであり得る。これらの実施形態のうちの別の1つにおいて、ネットワーク104がプライベートネットワークであり、ネットワーク104’がパブリックネットワークであり得る。これらの実施形態のうちのさらに別の1つにおいて、ネットワーク104、104’がいずれもプライベートネットワークであり得る。
ネットワーク104を、有線または無線リンクを介して接続することができる。有線リンクは、デジタル加入者線(DSL)、同軸ケーブル線、または光ファイバ線を含むことができる。無線リンクは、ブルートゥース、Wi−Fi、世界規模相互運用マイクロ波アクセス(WiMAX)、赤外線チャネル、または衛星帯を含むことができる。無線リンクは、1G、2G、3G、または4Gに該当する標準規格を含む、モバイル機器間の通信に使用されるセルラネットワーク標準規格を含むこともできる。ネットワーク標準規格は、国際電気通信連合により維持される仕様などの仕様または標準規格を満たすことによって、1つまたは複数の世代のモバイル通信標準規格に該当し得る。例えば、3G標準規格は国際モバイル電気通信−2000(IMT−2000)仕様に対応し得、4G標準規格は国際モバイル電気通信アドバンスト(IMT−Advanced)仕様に対応し得る。セルラネットワーク標準規格の例として、AMPS、GSM、GPRS、UMTS、LTE、LTE Advanced、Mobile WiMAX、およびWiMAX−Advancedが挙げられる。セルラネットワーク標準規格は、様々なチャネルアクセス方法、例えばFDMA、TDMA、CDMA、またはSDMAを使用することができる。一部の実施形態において、異なる種類のデータを、異なるリンクおよび標準規格を介して伝送することができる。他の実施形態において、同一の種類のデータを異なるリンクおよび標準規格を介して伝送することができる。
ネットワーク104は、任意の種類および/または形態のネットワークであつてよい。ネットワーク104の地理的範囲は様々であり、ネットワーク104は、ボディエリアネットワーク(BAN)、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、例えばイントラネット、メトロポリタンエリアネットワーク(MAN)、広域ネットワーク(WAN)、またはインターネットであってよい。ネットワーク104のトポロジーは任意のものであってよく、例えば、ポイントツーポイント、バス、スター、リング、メッシュ、またはツリーのうちのいずれかを含むことができる。ネットワーク104は、仮想的で、他のネットワーク104’の1つまたは複数の層の上に構築されたオーバレイネットワークであってよい。ネットワーク104は、本明細書に記載の動作をサポート可能な、当業者に公知のネットワークトポロジーを有していてもよい。ネットワーク104は、例えば、イーサネットプロトコル、インターネットプロトコルスイート(TCP/IP)、非同期転送モード(ATM)技法、同期型光ネットワーク(SONET)プロトコル、または同期デジタル階層(SDH)プロトコルを含む、異なる技法および層またはスタックのプロトコルを使用することができる。TCP/IPインターネットプロトコルスイートは、アプリケーション層、トランスポート層、インターネット層(例えば、IPv6を含む)、またはリンク層を含むことができる。ネットワーク104は、ある種類の放送ネットワーク、電気通信ネットワーク、データ通信ネットワーク、またはコンピュータネットワークであってよい。
一部の実施形態において、システムは、論理的にグループ化された複数のサーバ106を含むことができる。これらの実施形態のうちの1つにおいて、サーバの論理グループを、サーバファーム38またはマシンファーム38と呼ぶことができる。これらの実施形態のうちの別の1つにおいて、サーバ106を地理的に分散させることができる。他の実施形態において、マシンファーム38を単一のエンティティとして管理することができる。さらに他の実施形態において、マシンファーム38は複数のマシンファーム38を含む。各マシンファーム38内のサーバ106は異種であってよく、すなわち、1つまたは複数のサーバ106またはマシン106は一種類のオペレーティングシステムプラットフォーム(例えば、Redmond、WashingtonのMicrosoft Corp.により製造されたWINDOWS NT)に従って動作することができるが、1つまたは複数の他のサーバ106は別の種類のオペレーティングシステムプラットフォーム(例えば、Unix、Linux(登録商標)、またはMac OS X)に従って動作することができる。
一実施形態において、マシンファーム38のサーバ106を、関連するストレージシステムと共に高密度ラックシステムに格納し、企業データセンタに設置することができる。本実施形態において、サーバ106をこのように統合すると、サーバ106および高性能ストレージシステムを高性能ローカルネットワークに設置することによって、システム管理性、データセキュリティ、システムの物理的セキュリティ、およびシステム性能を向上させることができる。サーバ106とストレージシステムとを集中させ、これらを高度システム管理ツールに接続することによって、サーバリソースをより効率的に使用することができる。
各マシンファーム38のサーバ106は、同一のマシンファーム38の別のサーバ106に物理的に近接している必要はない。したがって、マシンファーム38として論理的にグループ化されたサーバ106のグループを、広域ネットワーク(WAN)接続またはメトロポリタンエリアネットワーク(MAN)接続を使用して相互接続することができる。例えば、マシンファーム38は、異なる大陸、または大陸、国、州、都市、キャンパス、もしくは部屋の異なる領域に物理的に設置されたサーバ106を含むことができる。サーバ106をローカルエリアネットワーク(LAN)接続またはある形態の直接接続を使用して接続すると、マシンファーム38のサーバ106間のデータ伝送速度を増加させることができる。加えて、異種マシンファーム38は、ある種類のオペレーティングシステムに従って動作する1つまたは複数のサーバ106を含むことができ、1つまたは複数の他のサーバ106は、オペレーティングシステムではなく1つまたは複数の種類のハイパーバイザを実行する。これらの実施形態において、ハイパーバイザを使用して、仮想ハードウェアをエミュレートし、物理ハードウェアを分割し、物理ハードウェアを仮想化し、コンピュータ環境へのアクセスを与える仮想マシンを実行することにより、複数のオペレーティングシステムがホストコンピュータで同時に動作することができる。ネイティブハイパーバイザは、ホストコンピュータで直接動作することができる。ハイパーバイザは、Palo Alto、CaliforniaのVMWare,Inc.により製造されたVMware ESX/ESXi、Citrix Systemse,Inc.が開発を統括しているオープンソース製品であるXenハイパーバイザ、Microsoft他により提供されるHYPER−Vハイパーバイザを含むことができる。ホストハイパーバイザは、第2のソフトウェアレベルのオペレーティングシステム内で動作することができる。ホストハイパーバイザの例として、VMware WorkstationおよびVIRTUALBOXが挙げられる。
マシンファーム38の管理を分散させてもよい。例えば、1つまたは複数のサーバ106は、マシンファーム38の1つまたは複数の管理サービスをサポートするためのコンポーネント、サブシステム、およびモジュールを含むことができる。これらの実施形態のうちの1つにおいて、1つまたは複数のサーバ106は、フェイルオーバの処理、データ複製、およびマシンファーム38のロバスト性向上のための技法を含む、動的データを管理する機能を提供する。各サーバ106は、持続ストア、および一部の実施形態においては、動的ストアと通信することができる。
サーバ106は、ファイルサーバ、アプリケーションサーバ、ウェブサーバ、プロキシサーバ、アプライアンス、ネットワークアプライアンス、ゲートウェイ、ゲートウェイサーバ、仮想化サーバ、展開サーバ、SSL VPNサーバ、またはファイアウォールであってよい。一実施形態において、サーバ106をリモートマシンまたはノードと呼ぶことができる。別の実施形態において、複数のノード290が任意の2つの通信サーバ間の経路にあってもよい。
図1Bを参照すると、クラウドコンピューティング環境が示されている。クラウドコンピューティング環境は、ネットワーク環境によって与えられる1つまたは複数のリソースをクライアント102に提供する。クラウドコンピューティング環境は、1つまたは複数のネットワーク104上のクラウド108と通信する1つまたは複数のクライアント102a〜102nを含むことができる。クライアント102は、例えば、シッククライアント、シンクライアント、およびゼロクライアントを含むことができる。シッククライアントは、クラウド108またはサーバ106から切断されても、少なくとも一部の機能を提供することができる。シンクライアントまたはゼロクライアントは、クラウド108またはサーバ106への接続に依存して機能を提供することができる。ゼロクライアントは、クラウド108または他のネットワーク104またはサーバ106に依存して、クライアントデバイスのためのオペレーティングシステムデータを検索することができる。クラウド108は、バックエンドプラットフォーム、例えば、サーバ106、ストレージ、サーバファーム、またはデータセンタを含むことができる。
クラウド108は、パブリック、プライベート、またはハイブリッドであってよい。パブリッククラウドは、クライアント102またはクライアントの所有者に対するサードパーティによって維持されるパブリックサーバ106を含むことができる。サーバ106は、前述したように、または他の方法で、遠隔地理的位置に離れて設置することができる。パブリッククラウドを、パブリックネットワークを通じてサーバ106に接続することができる。プライベートクラウドは、クライアント102またはクライアントの所有者によって物理的に維持されるプライベートサーバ106を含むことができる。プライベートクラウドを、プライベートネットワーク104を通じてサーバ106に接続することができる。ハイブリッドクラウド108は、プライベートネットワーク104およびパブリックネットワーク104の両方とサーバ106とを含むことができる。
クラウド108は、クラウドベースの配信、例えばサービスとしてのソフトウェア(SaaS)110、サービスとしてのプラットフォーム(PaaS)112、およびサービスとしてのインフラストラクチャ(IaaS)114を含むこともできる。IaaSは、ユーザが料金を払って特定の期間に必要なインフラストラクチャリソースを使用することを指すことができる。IaaSプロバイダは、大きいプールからストレージ、ネットワークキング、サーバ、または仮想化リソースを提供することによって、ユーザが必要に応じてより多くのリソースにアクセスすることにより迅速にスケールアップできるようにする。IaaSの例として、Montreal、Quebec、CanadaのOVH HOSTINGにより提供されるインフラストラクチャおよびサービス(例えば、EG−32)、Seattle、WashingtonのAmazon.com,Inc.により提供されるAMAZON WEB SERVICES、San Antonio、TexasのRackspace US,Inc.により提供されるRACKSPACE CLOUD、Mountain View、CaliforniaのGoogle Inc.により提供されるGoogle Compute Engine、またはSanta Barbara、CaliforniaのRightScale,Inc.により提供されるRIGHTSCALEが挙げられる。PaaSプロバイダは、例えば、ストレージ、ネットワーキング、サーバ、または仮想化を含む、IaaSが提供する機能の他に、さらなるリソース、例えば、オペレーティングシステム、ミドルウェア、またはランタイムリソースを提供することができる。PaaSの例としては、Redmond、WashingtonのMicrosoft Corporationにより提供されるWINDOWS AZURE、Google Inc.により提供されるGoogle App Engine、およびSan Francisco、CaliforniaのHeroku、Inc.により提供されるHEROKUが挙げられる。SaaSプロバイダは、ストレージ、ネットワーキング、サーバ、仮想化、オペレーティングシステム、ミドルウェア、またはランタイムリソースを含む、PaaSが提供するリソースを提供することができる。一部の実施形態において、SaaSプロバイダは、例えば、データおよびアプリケーションリソースを含むさらなるリソースを提供することができる。SaaSの例として、Google Inc.により提供されるGOOGLE APPS、San Francisco、CaliforniaのSalesforce.com Inc.により提供されるSALESFORCE、またはMicrosoft Corporationにより提供されるOFFICE 365が挙げられる。SaaSの例としては、データストレージプロバイダ、例えばSan Francisco、CaliforniaのDropbox,Inc.により提供されるDROPBOX、Microsoft Corporationにより提供されるMicrosoft SKYDRIVE、Google Inc.により提供されるGoogle Drive、またはCupertino、CaliforniaのApple Inc.により供されるApple ICLOUDも挙げられる。
クライアント102は、例えば、Amazon Elastic Compute Cloud(EC2)、オープンクラウドコンピューティングインターフェース(OCCI)、クラウドインフラストラクチャ管理インターフェース(CIMI)、またはOpenStack標準規格を含む1つまたは複数のIaaS標準規格によってIaaSリソースにアクセスすることができる。一部のIaaS標準規格によって、クライアントはHTTPを通じてリソースにアクセスすることができ、Representational State Transfer(REST)プロトコルまたはSimple Object Access Protocol(SOAP)を使用することができる。クライアント102は、異なるPaaSインターフェースによってPaaSリソースにアクセスすることができる。一部のPaaSインターフェースは、HTTPパッケージ、標準Java API、JavaMail API、Java Data Objects(JDO)、Java Persistence API(JPA)、Python API、例えばRack for Ruby、WSGI for Python、もしくはPSGI for Perlを含む異なるプログラミング言語のためのウェブインテグレーションAPI、またはREST、HTTP、XML、もしくは他のプロトコルに構築可能な他のAPIを使用する。クライアント102は、ウェブブラウザ(例えば、GOOGLE CHROME、Microsoft INTERNET EXPLORER、またはMountain View、CaliforniaのMozilla Foundationにより提供されるMozilla Firefox)によって提供されるウェブベースのユーザインターフェースを使用してSaaSリソースにアクセスすることができる。クライアント102は、例えばSalesforce Sales CloudまたはGoogle Drive appを含むスマートフォンまたはタブレットアプリケーションを通じてSaaSリソースにアクセスすることもできる。クライアント102は、例えばDROPBOX用Windowsファイルシステムを含むクライアントオペレーティングシステムを通じてSaaSリソースにアクセスすることもできる。
一部の実施形態において、IaaS、PaaS、またはSaaSリソースへのアクセスを認証することができる。例えば、サーバまたは認証サーバが、セキュリティ証明書、HTTPS、またはAPIキーを介してユーザを認証することができる。APIキーは、例えばAdvanced Encryption Standard(AES)などの様々な暗号化標準規格を含むことができる。データリソースを、Transport Layer Security(TLS)またはSecure Sockets Layer(SSL)を通じて送ることができる。
クライアント102およびサーバ106を、任意の種類および形態のネットワーク上で通信可能かつ本明細書に記載の動作を実行可能な、任意の種類および形態のコンピューティングデバイス、例えばコンピュータ、ネットワークデバイス、またはアプライアンスで展開および/または実行することができる。図1C、図1Dは、クライアント102またはサーバ106の実施形態を実施するのに有用なコンピューティングデバイス100のブロック図である。図1Cおよび図1Dに示すように、各コンピューティングデバイス100は、中央処理装置121とメインメモリ装置122とを備える。図1Cに示すように、コンピューティングデバイス100は、記憶装置128、インストールデバイス116、ネットワークインターフェース118、I/Oコントローラ123、ディスプレイデバイス124a〜124n、キーボード126、およびポインティングデバイス127、例えばマウスを備えることができる。記憶装置128は、限定されないが、オペレーティングシステム、ソフトウェア、およびゲノムデータ翻訳システム120のソフトウェアを含むことができる。図1Dに示すように、各コンピューティングデバイス100は、追加の任意選択の要素、例えばメモリポート103、ブリッジ170、1つまたは複数の入力/出力デバイス130a〜130n(通常、参照符号130を用いて示す)、および中央処理装置121と通信するキャッシュメモリ140を備えていてもよい。
中央処理装置121は、メインメモリ装置122から取り出した命令に応答し、これを処理する任意の論理回路である。多くの実施形態において、中央処理装置121は、例えば、Mountain View、CaliforniaのIntel Corporationにより製造されたマイクロプロセッサユニット、Schaumburg、IllinoisのMotorola Corporationにより製造されたマイクロプロセッサユニット、Santa Clara、CaliforniaのNvidiaにより製造されたARMプロセッサおよびTEGRAシステムオンチップ(SoC)、White Plains、New YorkのInternational Business Machinesにより製造されたPower7プロセッサ、またはSunnyvale、CaliforniaのAdvanced Micro Devicesにより製造されたマイクロプロセッサユニットによって提供される。コンピューティングデバイス100は、これらのプロセッサのうちのいずれか、または本明細書に記載の通りに動作可能な任意の他のプロセッサに基づいていてもよい。中央処理装置121は、命令レベルの並列性、スレッドレベルの並列性、異なるレベルのキャッシュ、およびマルチコアプロセッサを使用することができる。マルチコアプロセッサは、1つのコンピューティングコンポーネントに2つ以上の処理装置を含むことができる。マルチコアプロセッサの例として、AMD PHENOM IIX2、INTEL CORE i5、およびINTEL CORE i7が挙げられる。
メインメモリ装置122は、データを格納することができ、かつマイクロプロセッサ121が記憶場所に直接アクセスできるようにする1つまたは複数のメモリチップを含むことができる。メインメモリ装置122は揮発性で、記憶装置128より高速であり得る。メインメモリ装置122は、ダイナミックランダムアクセスメモリ(DRAM)、あるいは、スタティックランダムアクセスメモリ(SRAM)、バーストSRAMもしくは同期バーストSRAM(BSRAM)、高速ページモードDRAM(FPM DRAM)、エンハンストDRAM(EDRAM)、拡張データ出力RAM(EDO RAM)、拡張データ出力DRAM(EDO DRAM)、バースト拡張データ出力DRAM(BEDO DRAM)、シングルデータレートシンクロナスDRAM(SDR SDRAM)、ダブルデータレートSDRAM(DDR SDRAM)、ダイレクトラムバスDRAM(DRDRAM)、またはエクストリームデータレートDRAM(XDR DRAM)を含む任意の変形体であってよい。一部の実施形態において、メインメモリ122または記憶装置128は不揮発性であり、例えば、不揮発性リードアクセスメモリ(NVRAM)、フラッシュメモリ不揮発性スタティックRAM(nvSRAM)、強誘電RAM(FeRAM)、磁気抵抗RAM(MRAM)、相変化メモリ(PRAM)、導電性ブリッジRAM(CBRAM)、シリコン−酸化物−窒化物−酸化物−シリコン(SONOS)、抵抗RAM(RRAM(登録商標))、レーストラック、ナノRAM(NRAM)、またはMillipedeメモリであってよい。メインメモリ122は、前述したメモリチップのうちのいずれか、または本明細書に記載の通りに動作可能な任意の他の使用可能なメモリチップに基づいていてもよい。図1Cに示す実施形態において、プロセッサ121は、システムバス150(以下で、より詳細に説明する)を介してメインメモリ122と通信する。図1Dは、プロセッサがメモリポート103を介してメインメモリ122と直接通信するコンピューティングデバイス100の実施形態を示す。例えば、図1Dで、メインメモリ122はDRDRAMであってよい。
図1Dは、メインプロセッサ121が、バックサイドバスと呼ばれることもある二次バスを介してキャッシュメモリ140と直接通信する実施形態を示す。他の実施形態において、メインプロセッサ121は、システムバス150を使用してキャッシュメモリ140と通信する。キャッシュメモリ140は、通常、メインメモリ122よりも高速の応答時間を有し、通常、SRAM、BSRAM、またはEDRAMによって提供される。図1Dに示す実施形態において、プロセッサ121は、ローカルシステムバス150を介して様々なI/Oデバイス130と通信する。様々なバスを使用して、中央処理装置121を、PCIバス、PCI−Xバス、PCI−Expressバス、またはNuBusを含むI/Oデバイス130のうちのいずれかに接続することができる。I/Oデバイスがビデオディスプレイ124である実施形態の場合、プロセッサ121は、Advanced Graphics Port(AGP)を使用してディスプレイ124またはディスプレイ124用のI/Oコントローラ123と通信することができる。図1Dは、メインプロセッサ121が、I/Oデバイス130bまたは他のプロセッサ121’とHYPERTRANSPORT、RAPIDIO、またはINFINIBAND通信技術を介して直接通信するコンピュータ100の実施形態を示す。図1Dはまた、ローカルバスと直接通信とを組み合わせ、プロセッサ121がローカル相互接続バスを使用してI/Oデバイス130aと通信するが、I/Oデバイス130bとは直接通信する実施形態を示す。
様々なI/Oデバイス130a〜130nがコンピューティングデバイス100内に存在してもよい。入力デバイスは、キーボード、マウス、トラックパッド、トラックボール、タッチパッド、タッチマウス、マルチタッチタッチパッドおよびタッチマウス、マイクロフォン、マルチアレイマイクロフォン、ドローイングタブレット、カメラ、一眼レフカメラ(SLR)、デジタルSLR(DSLR)、CMOSセンサ、加速度計、赤外線光センサ、圧力センサ、磁力計センサ、角速度センサ、深度センサ、近接センサ、周囲光センサ、ジャイロセンサ、または他のセンサを含むことができる。出力デバイスは、ビデオディスプレイ、グラフィックディスプレイ、スピーカ、ヘッドフォン、インクジェットプリンタ、レーザプリンタ、および3Dプリンタを含むことができる。
デバイス130a〜130nは、例えば、Microsoft KINECT、WII用Nintendo Wiimote、Nintendo WII U GAMEPAD、またはApple IPHONEを含む複数の入力または出力デバイスの組合せを含むことができる。一部のデバイス130a〜130nは、入力および出力のいくつかを組み合わせることによってジェスチャ認識入力を可能にする。一部のデバイス130a〜130nは、認証および他のコマンドを含む異なる目的のための入力として使用可能な顔認識を提供する。一部のデバイス130a〜130nは、例えば、Microsoft KINECT、AppleによるIPHONE用SIRI、Google NowまたはGoogle Voice Searchを含む音声認識および入力を提供する。
さらなるデバイス130a〜130nは、例えば、触覚フィードバックデバイス、タッチスクリーンディスプレイ、またはマルチタッチディスプレイを含む入力能力および出力能力の両方を有する。タッチスクリーン、マルチタッチディスプレイ、タッチパッド、タッチマウス、または他の接触感知デバイスは、例えば、静電容量式、表面静電容量式、投影静電容量式タッチ(PCT)、インセル静電容量式、抵抗、赤外線、導波路、分散信号タッチ(DST)、インセル光学、表面音響波(SAW)、屈曲波タッチ(BWT)、または力ベースの感知技術を含む異なる技術を使用して、接触を感知することができる。一部のマルチタッチデバイスにより、表面との2つ以上の接触点が可能になるため、例えば、ピンチ、スプレッド、回転、スクロール、または他のジェスチャを含む高度な機能が可能になり得る。例えばMicrosoft PIXELSENSEまたはMulti−Touch Collaboration Wallを含む一部のタッチスクリーンデバイスは、テーブルトップまたはウォールなどの大きい表面を有することができ、他の電子デバイスと対話することもできる。一部のI/Oデバイス130a〜130n、ディスプレイデバイス124a〜124n、またはデバイスの群は、拡張現実デバイスであってもよい。図1Cに示すように、I/OデバイスをI/Oコントローラ123によって制御することができる。I/Oコントローラは、例えば、キーボード126およびポインティングデバイス127、例えばマウスまたは光学ペンなどの1つまたは複数のI/Oデバイスを制御することができる。さらに、I/Oデバイスは、コンピューティングデバイス100の記憶装置および/またはインストール媒体116を提供することもできる。さらに他の実施形態において、コンピューティングデバイス100は、携帯用USB記憶装置を受け入れるUSB接続部(図示せず)を提供することができる。さらなる実施形態において、I/Oデバイス130は、システムバス150と外部通信バス、例えばUSBバス、SCSIバス、ファイアワイヤバス、イーサネットバス、ギガビットイーサネットバス、ファイバチャネルバス、またはサンダーボルトバスとのブリッジであってもよい。
一部の実施形態において、ディスプレイデバイス124a〜124nをI/Oコントローラ123に接続することができる。ディスプレイデバイスは、例えば、液晶ディスプレイ(LCD)、薄膜トランジスタLCD(TFT−LCD)、ブルー相LCD、電子ペーパ(e−インク)ディスプレイ、フレキシブルディスプレイ、発光ダイオードディスプレイ(LED)、デジタル光処理(DLP)ディスプレイ、シリコン上液晶(LCOS)ディスプレイ、有機発光ダイオード(OLED)ディスプレイ、アクティブマトリクス有機発光ダイオード(AMOLED)ディスプレイ、液晶レーザディスプレイ、時分割光シャッタ(TMOS)ディスプレイ、または3Dディスプレイを含むことができる。3Dディスプレイの例として、例えば立体視、偏光フィルタ、アクティブシャッタ、または裸眼立体視を使用することができる。ディスプレイデバイス124a〜124nは、頭部装着ディスプレイ(HMD)であってもよい。一部の実施形態において、ディスプレイデバイス124a〜124nまたは対応するI/Oコントローラ123は、OPENGLまたはDIRECTX APIまたは他のグラフィックライブラリによって制御されてもよく、またはこれらのハードウェアサポートを有していてもよい。
一部の実施形態において、コンピューティングデバイス100は、それぞれ同一もしくは異なる種類および/または形態であり得る複数のディスプレイデバイス124a〜124nを含むことができ、またはこれらに接続することができる。このようにして、I/Oデバイス130a〜130nおよび/またはI/Oコントローラ123のうちのいずれかが、コンピューティングデバイス100による複数のディスプレイデバイス124a〜124nの接続および使用をサポートし、可能にし、または提供するための、任意の種類および/もしくは形態の適切なハードウェア、ソフトウェア、またはハードウェアおよびソフトウェアの組合せを含むことができる。例えば、コンピューティングデバイス100は、ディスプレイデバイス124a〜124nをインターフェース接続、通信、接続、またはその他の方法で使用するための、任意の種類および/もしくは形態のビデオアダプタ、ビデオカード、ドライバ、ならびに/またはライブラリを含むことができる。一実施形態において、ビデオアダプタは、複数のディスプレイデバイス124a〜124nにインターフェース接続するための複数のコネクタを含むことができる。他の実施形態において、コンピューティングデバイス100は、ディスプレイデバイス124a〜124nのうちの1つまたは複数にそれぞれ接続された複数のビデオアダプタを含むことができる。一部の実施形態において、コンピューティングデバイス100のオペレーティングシステムの任意の部分を、複数のディスプレイ124a〜124nを使用するように構成することができる。他の実施形態において、ディスプレイデバイス124a〜124nのうちの1つまたは複数を、ネットワーク104を介してコンピューティングデバイス100に接続された1つまたは複数の他のコンピューティングデバイス100aまたは100bによって提供することができる。一部の実施形態において、ソフトウェアを、別のコンピュータのディスプレイデバイスをコンピューティングデバイス100の第2のディスプレイデバイス124aとして使用するように設計および構成することができる。例えば、一実施形態において、Apple iPadは、コンピューティングデバイス100に接続され、デバイス100のディスプレイを、拡張デスクトップとして使用可能な追加のディスプレイスクリーンとして使用することができる。当業者は、複数のディスプレイデバイス124a〜124nを有するようにコンピューティングデバイス100を構成することのできる様々な方法および実施形態を認識し理解するだろう。
再び図1Cを参照すると、コンピューティングデバイス100は、オペレーティングシステムまたは他の関連ソフトウェアを格納するため、およびゲノムデータ翻訳システム120用ソフトウェアに関連するプログラムなどのアプリケーションソフトウェアプログラムを格納するための記憶装置128(例えば、1つまたは複数のハードディスクドライブまたはリダンダントアレイオブインディペンデントディスク)を含むことができる。記憶装置128の例として、例えば、ハードディスクドライブ(HDD)、CDドライブ、DVDドライブ、もしくはBLU−RAYドライブを含む光学ドライブ、ソリッドステートドライブ(SSD)、USBフラッシュドライブ、またはデータの格納に適した任意の他のデバイスが挙げられる。一部の記憶装置は、例えば、ハードディスクとソリッドステートキャッシュとを組み合わせたソリッドステートハイブリッドドライブを含む複数の揮発性および不揮発性メモリを含むことができる。一部の記憶装置128は、不揮発性、可変、また読取専用記憶装置であってよい。一部の記憶装置128は、内部記憶装置であり、バス150を介してコンピューティングデバイス100に接続することができる。一部の記憶装置128は、外部記憶装置であり、外部バスを提供するI/Oデバイス130を介してコンピューティングデバイス100に接続することができる。一部の記憶装置128は、例えばAppleによるMACBOOK AIR用リモートディスクを含む、ネットワーク104上のネットワークインターフェース118を介して、コンピューティングデバイス100に接続することができる。一部のクライアントデバイス100は、不揮発性記憶装置128を必要としなくてもよく、シンクライアントまたはゼロクライアント102であってもよい。一部の記憶装置128は、インストールデバイス116として使用することもでき、ソフトウェアおよびプログラムのインストールに適していてもよい。加えて、オペレーティングシステムおよびソフトウェアは、ブート可能媒体、例えば、ブート可能CD、例えば、knoppix.netのGNU/Linuxディストリビューションとして利用可能なGNU/Linux用ブート可能CDであるKNOPPIXから起動することができる。
クライアントデバイス100は、アプリケーション配布プラットフォームからソフトウェアまたはアプリケーションをインストールすることもできる。アプリケーション配布プラットフォームの例として、Apple,Inc.により提供されるiOS用App Store、Apple,Inc.により提供されるMac App Store、Google Inc.により提供されるAndroid OS用GOOGLE PLAY、Google Inc.により提供されるCHROME OS用Chrome WebStore、およびAmazon.com,Incにより提供されるAndroid OSおよびKINDLE FIRE用Amazon AppStoreが挙げられる。アプリケーション配布プラットフォームにより、クライアントデバイス102へのソフトウェアのインストールを容易にすることができる。アプリケーション配布プラットフォームは、クライアント102a〜102nがネットワーク104を通じてアクセス可能な、サーバ106またはクラウド108上のアプリケーションのリポジトリを含むことができる。アプリケーション配布プラットフォームは、様々な開発者により開発され提供されるアプリケーションを含むことができる。クライアントデバイス102のユーザは、アプリケーション配布プラットフォームを介してアプリケーションを選択、購入、および/またはダウンロードすることができる。
さらに、コンピューティングデバイス100は、標準電話線LANまたはWANリンク(例えば、802.11、T1、T3、ギガビットイーサネット、インフィニバンド)、ブロードバンド接続(例えば、ISDN、フレームリレー、ATM、ギガビットイーサネット、イーサネットオーバーSONET、ADSL、VDSL、BPON、GPON、FiOSを含む光ファイバ)、無線接続、または前記のいずれかもしくはすべてのいくつかの組合せを含むが、これらに限定されない様々な接続を通じて、ネットワーク104にインターフェース接続するネットワークインターフェース118を含むことができる。様々な通信プロトコル(例えば、TCP/IP、イーサネット、ARCNET、SONET、SDH、ファイバ分散データインターフェース(FDDI)、IEEE 802.11a/b/g/n/ac CDMA、GSM、WiMax、および直接非同期接続)を使用して、接続を確立することができる。一実施形態において、コンピューティングデバイス100は、任意の種類および/もしくは形態のゲートウェイまたはトンネルプロトコル、例えばSecure Socket Layer(SSL)もしくはTransport Layer Security(TLS)、またはFt.Lauderdale、FloridaのCitrix Systems,Inc.により製造されたCitrix Gateway Protocolを介して他のコンピューティングデバイス100’と通信する。ネットワークインターフェース118は、内蔵ネットワークアダプタ、ネットワークインターフェースカード、PCMCIAネットワークカード、EXPRESSCARDネットワークカード、カードバスネットワークアダプタ、無線ネットワークアダプタ、USBネットワークアダプタ、モデム、または通信および本明細書に記載の動作を実行可能なコンピューティングデバイス100を任意の種類のネットワークにインターフェース接続するのに適した任意の他のデバイスを含むことができる。
図1Bおよび図1Cに示す種類のコンピューティングデバイス100は、タスクのスケジューリングおよびシステムリソースへのアクセスを制御するオペレーティングシステムの制御によって動作することができる。コンピューティングデバイス100は、任意のバージョンのMICROSOFT WINDOWS(登録商標)オペレーティングシステム、異なるリリースのUnixおよびLinuxオペレーティングシステム、任意のバージョンのMacintoshコンピュータ用MAC OS、任意の組込みオペレーティングシステム、任意のリアルタイムオペレーティングシステム、任意のオープンソースオペレーティングシステム、任意の専用オペレーティングシステム、モバイルコンピューティングデバイス用の任意のオペレーティングシステム、またはコンピューティングデバイスで動作可能かつ本明細書に記載の動作を実行可能な任意の他のオペレーティングシステムなどの任意のオペレーティングシステムで動作することができる。一般的なオペレーティングシステムとして、Redmond、WashingtonのMicrosoft Corporationにより製造されたWINDOWS 2000、WINDOWS Server 2022、WINDOWS CE、WINDOWS Phone、WINDOWS XP、WINDOWS VISTA、WINDOWS 7、WINDOWS RT、およびWINDOWS 8、Cupertino、CaliforniaのApple,Inc.により製造されたMAC OSおよびiOS、無料で利用できるオペレーティングシステムであるLinux、例えばLondon、United KingdomのCanonical Ltd.により配布されたLinux Mint ディストリビューション(「distro」)またはUbuntu、Unixもしくは他のUnix等由来のオペレーティングシステム、ならびに、特にMountain View、CaliforniaのGoogleにより設計されたAndroidが挙げられるが、これらに限定されない。例えばGoogleによるCHROME OSを含む一部のオペレーティングシステムを、例えば、CHROMEBOOKSを含むゼロクライアントまたはシンクライアントで使用してもよい。
コンピュータシステム100は、任意のワークステーション、電話、デスクトップコンピュータ、ラップトップまたはノート型コンピュータ、ネットブック、ウルトラブック、タブレット、サーバ、携帯用コンピュータ、携帯電話、スマートフォン、または他の携帯型電気通信デバイス、メディアプレイデバイス、ゲームシステム、モバイルコンピューティングデバイス、または任意の他の種類および/もしくは形態の通信可能なコンピューティングデバイス、電気通信デバイス、またはメディアデバイスであってよい。コンピュータシステム100は、本明細書に記載の動作を実行するのに十分なプロセッサ電力およびメモリ容量を有する。一部の実施形態において、コンピューティングデバイス100は、デバイスに適合する異なるプロセッサ、オペレーティングシステム、および入力デバイスを有することができる。例えば、Samsung GALAXYスマートフォンは、Google,Inc.により開発されたAndroidオペレーティングシステムの制御によって動作する。GALAXYスマートフォンは、タッチインターフェースを介して入力を受ける。
一部の実施形態において、コンピューティングデバイス100はゲームシステムである。例えば、コンピュータシステム100は、日本、東京都のソニー株式会社により製造されたPLAYSTATION 3またはPERSONAL PLAYSTATION PORTABLE(PSP)またはPLAYSTATION VITAデバイス、日本、京都府の任天堂株式会社により製造されたNINTENDO DS、NINTENDO 3DS、NINTENDO WII、またはNINTENDO WII Uデバイス、Redmond、WashingtonのMicrosoft Corporationにより製造されたXBOX(登録商標)360デバイスを含むことができる。
一部の実施形態において、コンピューティングデバイス100は、Cupertino、CaliforniaのApple Computerにより製造されたApple IPOD、IPOD Touch、およびIPOD NANOラインのデバイスなどのデジタルオーディオプレーヤである。一部のデジタルオーディオプレーヤは、例えば、デジタルアプリケーション配布プラットフォームからのアプリケーションによって利用可能になるゲームシステムまたは任意の機能を含む他の機能を有することができる。例えば、IPOD TouchはApple App Storeにアクセスすることができる。一部の実施形態において、コンピューティングデバイス100は、MP3、WAV、M4A/AAC、WMA、Protected AAC、AIFF、Audible audiobook、Appleロスレスオーディオファイルフォーマット、.mov、.m4v、および.mp4 MPEG−4(H.264/MPEG−4AVC)ビデオファイルフォーマットを含むがこれらに限定されないファイルフォーマットをサポートする、携帯型メディアプレーヤまたはデジタルオーディオプレーヤである。
一部の実施形態において、コンピューティングデバイス100は、タブレット、例えば、AppleによるIPAD(登録商標)ラインのデバイス、SamsungによるGALAXY TABファミリーのデバイス、またはSeattle、WashingtonのAmazon.com,Inc.によるKINDLE FIREである。他の実施形態において、コンピューティングデバイス100は、電子書籍リーダ、例えば、Amazon.comによるKINDLEファミリーのデバイス、またはNew York City、New YorkのBarnes&Noble,Inc.のNOOKファミリーのデバイスである。
一部の実施形態において、通信デバイス102は、デバイスの組合せ、例えば、デジタルオーディオプレーヤまたは携帯型メディアプレーヤと組み合わせたスマートフォンを含む。例えば、これらの実施形態のうちの1つはスマートフォンであり、例えば、Apple,Inc.により製造されたIPHONEファミリーのスマートフォン、Samsung,Inc.により製造されたSamsung GALAXYファミリーのスマートフォン、またはMotorola DROIDファミリーのスマートフォンである。さらに別の実施形態において、通信デバイス102は、ウェブブラウザおよびマイクロフォンおよびスピーカシステム、例えばテレフォニーヘッドセットを備えたラップトップまたはデスクトップコンピュータである。これらの実施形態において、通信デバイス102は、ウェブ対応で、電話を受け、電話をかけることができる。一部の実施形態において、ラップトップまたはデスクトップコンピュータは、ビデオチャットおよびビデオ通話を可能にするウェブカメラまたは他のビデオキャプチャデバイスも備える。
一部の実施形態において、一般にネットワーク管理の一部として、ネットワーク104における1つまたは複数のマシン102、106のステータスをモニタする。これらの実施形態のうちの1つにおいて、マシンのステータスは、負荷情報(例えば、マシン上のプロセスの数、CPUおよびメモリの利用)、ポート情報(例えば、利用可能な通信ポートおよびポートアドレスの数)、またはセッションステータス(例えば、プロセスの持続時間および種類、プロセスがアクティブであるかアイドルであるか)の特定を含むことができる。これらの実施形態のうちの別の1つにおいて、この情報を複数の測定基準で特定することができ、複数の測定基準を、負荷分散の決定、ネットワークトラフィック管理、ネットワーク障害回復、および本明細書に記載の本解決策の動作のいずれかの態様に少なくとも部分的に適用することができる。前述した動作環境およびコンポーネントの態様は、本明細書に開示されるシステムおよび方法の文脈において明らかになろう。
B 生ゲノムデータの処理
図2は、図1Cに示すゲノムデータ翻訳システム120と同様のゲノムデータ翻訳システム200を示す。以下で説明するように、ゲノムデータ翻訳システム200は、(例えば、スプレッドシートまたはコンマ区切りのテキストファイルの)生ゲノムデータを受信し、生ゲノムデータにおいて特定された遺伝子および染色体レベルの異常を示すデータを生成することができる。ゲノムデータ翻訳システム200は、翻訳エンジン202、グラフィカルユーザインターフェース(GUI)エンジン204、およびデータストレージ218を含む。データストレージ218は、遺伝子リスト206、翻訳規則208、再構成可能テキストストレージ210、およびヒト参照ゲノムリスト212を格納することができる。GUIエンジン204は、モニタまたは他のディスプレイデバイスに表示するGUIを提供することができる。GUIエンジン204は、キーボード、マウス、タッチスクリーン、ジェスチャ検出器、または他の入力デバイスなどの1つまたは複数の入力デバイスから、ユーザ入力を受けることもできる。GUIエンジン204は、ユーザがゲノムデータ翻訳システム200の動作を制御するために入力できるようにする対話型インターフェースを提供することができる。ゲノムデータ翻訳システム200を、1つまたは複数の有線または無線ネットワーク、例えば、イーサネット、インターネット、WiFiネットワーク、ブルートゥース(登録商標)ネットワークなどを含み得るコンピュータネットワーク214に接続することもできる。ゲノムデータ翻訳システム200を、図1A〜1Dに関して前述したコンピューティングシステムを使用して実施することができる。
ゲノムデータ翻訳システム200は、次世代ゲノムシーケンサ(「NGシーケンサ」)216、例えば、Illuminaシーケンサ、Ion Torrentシーケンサ、および454パイロシーケンサからデータを受信することができる。NGシーケンサ216は、詳細な染色体分析を行うことができ、アレイ比較ゲノムハイブリダイゼーション(CGH)、マイクロアレイ、オリゴアレイ、単ヌクレオチド多型(SNP)アレイ、全ゲノムアレイ(WGA)などの技法を使用することができる。NGシーケンサ216は、生ゲノムデータをゲノムデータ翻訳システム200に提供することができる。特に、NGシーケンサ216は、サイトバンド情報を含む生ゲノムデータを生成することができる。一部の実施において、ゲノムデータ翻訳システム200は、NGシーケンサ216から生ゲノムデータを直接受信する代わりに、GUIエンジン204を介して、NGシーケンサ216によって生成された生ゲノムデータをアップロードする能力を提供することができる。
図3は、次世代シーケンサによって生成された生ゲノムデータ300の例を示す。特に、生ゲノムデータ300はサイトバンド情報を含むことができる。サイトバンド情報は、異常を示す1つまたは複数の染色体に対応し得る。このようにして、生ゲノムデータ300は、遺伝子変化を示す染色体のみのサイトバンドゲノム情報を含むことができる。生ゲノムデータ30は、染色体特定データ、ヌクレオチド範囲、染色体のヌクレオチド範囲内にある対応する遺伝子領域のコピーの数を示すコピー数を含むこともできる。
図4は、生ゲノムデータを翻訳するプロセス400のフロー図である。このプロセス400を使用して、例えば、図3に示す生ゲノムデータ300を翻訳することができる。プロセス400を、例えば、図2に示すゲノムデータ翻訳システム200、特に翻訳エンジン202によって実行することができる。プロセス400は、生ゲノムデータを含むNGシーケンサによって生成された出力ファイルを受信することを含む(ステージ402)。再び図2を参照すると、ゲノムデータ翻訳システム200は、生ゲノムデータ300をNGシーケンサ216から直接受信することができる。例えば、ゲノムデータ翻訳システム200は、NGシーケンサ216に接続された1つまたは複数のシリアルまたはパラレル通信ポートを含むことができ、通信ポートを通じてNGシーケンサ216から生ゲノムデータ300を受信することができる。一部の実施において、ゲノムデータ翻訳システム200は、生ゲノムデータ300を含むデータファイルなどのファイルを、ユーザからGUIエンジン204を介して受信することができる。
プロセス400は、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む、出力ファイル内の少なくとも1つのセグメントを判定することをさらに含む(ステージ404)。セグメントは、染色体に関連付けられたゲノムデータを含むことができる。生ゲノムデータ300は、いくつかの遺伝子に関連付けられたゲノムデータを含む。翻訳エンジン202は、生ゲノムデータ300を解析して、生ゲノムデータにゲノム異常情報がある染色体を特定する。翻訳エンジン202は、「arr[hg19]」などのファイル開始識別子を検索することによってファイルの開始を判定することができる。この識別子は、使用するNGシーケンサ216に固有のものであり得、使用するNGシーケンサ216の種類に基づいて変化し得る。図3に示す生ゲノムデータ300において、識別子「arr[hg19]」は、ゲノム分析がアレイ技法(アレイ−CGHまたはSNPアレイなど)を使用して行われ、「ヒトゲノムビルド19」を使用して符号化されることを示す。生ゲノムデータ300を生成するために、「hg38」、「hg18」、「hg17」などの他のビルドを使用してもよい。翻訳エンジン202は、ファイル開始識別子後の、生ゲノムデータ300の残りの部分を解析して、セグメントの開始を判定することができる。例えば、翻訳エンジン202は、1〜22の整数または文字「X」および「Y」とそれに続く文字「p」または「q」を検索することができる。整数1〜22は染色体数に対応し、「X」および「Y」はX染色体およびY染色体に対応し、「p」および「q」は染色体の短腕および長腕にそれぞれ対応する。翻訳エンジンは、文字「x」とそれに続く1つまたは複数の整数、例えば「x2」または「x1−2」により示されるコピー情報を検索することによって、セグメントの終了を判定することができる。
図5は、図3に示す生ゲノムデータからゲノムデータ翻訳システム200によって特定された様々なセグメントを示す。特に、翻訳エンジン202は、15のセグメント、すなわち、染色体1のセグメント501、染色体3のセグメント503、染色体5のセグメント505、染色体6のセグメント506、染色体7のセグメント507、染色体9のセグメント509、染色体11のセグメント511、染色体12のセグメント512、染色体16のセグメント516、染色体17のセグメント517、染色体19のセグメント519、染色体20のセグメント520、染色体21のセグメント521、染色体Xのセグメント522、および染色体Yのセグメント524を特定する。
各セグメントは染色体数を含み、例えば、セグメントの最初の整数「1」が染色体数を示す。各セグメントはサイトバンド情報も含み、例えば、「1p36.33p11.2」および「1q21.1q44」は、1番染色体の短腕および長腕内のサイトバンドを特定する。各セグメントはヌクレオチド範囲も含み、例えば、「(849,466−121,343,783)」は、参照ゲノムビルドと比較して奇形または異常がある塩基対の範囲を示す。さらに、各セグメントはコピー数も含み、例えば、「x1」は、対応するヌクレオチド範囲内の塩基対が、健常者には2度見られるはずであるが、1度しか見られないことを示す。「x1−2」などの他のコピー数は、対応するヌクレオチド範囲内の塩基対が1度または2度見られることを示す。
プロセス400は、ヒト参照ゲノムに含まれる、ヌクレオチド範囲内の第1の遺伝子群を判定することも含む。翻訳エンジン202は、ヒト参照ゲノムリスト212を調べて、各ヌクレオチド範囲にある遺伝子を判定することができる。ヒト参照ゲノムは、いくつかのバージョンまたはビルドを有する。翻訳エンジン202は、図3に示す例においてヒトゲノムリストの「hg19」バージョンと呼ばれる識別子「arr[hg19]」に基づいて、調べるバージョンを判定することができる。翻訳エンジン202は、例えば、ヒト参照ゲノムリスト212の第1のセグメント501に現れるヌクレオチド範囲(849,466−121,343,783)、(882,802−121,339,317)、および(143,932,349−249,224,684)を調べることができる。ヒト参照ゲノムリスト212は、これらのヌクレオチド範囲の各々にある第1の遺伝子群を返すことができる。一部の実施において、ヒト参照ゲノムリスト212は、ゲノムデータ翻訳システム200から離れてサーバに設置され、コンピュータネットワーク214を通じて通信することができる。一部のそのような実施において、翻訳エンジン202はヌクレオチド範囲をサーバに送信することができ、サーバがヒト参照ゲノムリスト212内のヌクレオチド範囲を調べ、それに応じて、これらのヌクレオチド範囲の各々にある第1の遺伝子群を翻訳エンジン202に送信することができる。
プロセス400は、第1の遺伝子群のサブセットに一致する遺伝子リスト206に現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定することも含む(ステージ408)。遺伝子リスト206は、臨床医が対象とする遺伝子の同一性を含む。遺伝子リスト206は、ある病気または異常に関連する遺伝子を含むことができる。例えば、TNFRSF14、TP53、NOTCH4、DAXX、およびLTBを含むがこれらに限定されない遺伝子が、遺伝子リスト206に含まれていてもよい。遺伝子リスト206は、がん抑制遺伝子、がん遺伝子、細胞信号伝達タンパク質、アダプタタンパク質、細胞表面受容体、可溶性および/または膜結合リガンド、酵素(例えば、プロテアーゼ)、シャペロンタンパク質、転写因子、構造タンパク質、細胞骨格タンパク質、血管新生、細胞分裂、細胞粘着、および細胞周期の進行などを調節するタンパク質などの遺伝子を含むこともできる。遺伝子リスト206は、がん関連遺伝子および/または非がん関連遺伝子を含むこともできる。一部の実施形態において、遺伝子リスト206は、肺、皮膚、心臓、肝臓、腎臓、膵臓、腸、脳、眼、耳、鼻などを含むがこれらに限定されない特定臓器の機能に影響を与える遺伝子を含む。一部の実施形態において、遺伝子リスト206は、ニューロン、上皮細胞、内皮細胞、横紋筋細胞、平滑筋細胞、心筋細胞、腎細胞、膵臓細胞、腸細胞、眼の細胞、血球、感覚細胞、間質細胞、生殖細胞、細胞外基質細胞、分泌上皮細胞、ホルモン分泌細胞、グリア細胞などを含むがこれらに限定されない、特定の細胞型の機能に影響を与える遺伝子を含む。一部の実施形態において、遺伝子リスト206は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、少なくとも85、少なくとも90、少なくとも95、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも450、または少なくとも500の遺伝子を含む。
前述したように、第1の遺伝子群は、ヌクレオチド範囲およびヒト参照ゲノムリスト212を使用して判定される。翻訳エンジン202は、遺伝子リスト206を第1の遺伝子群と比較して、遺伝子リスト206の遺伝子のいずれかが第1の遺伝子群に現れているかどうかを判定することができる。例えば、翻訳エンジン202は、第1の遺伝子群において遺伝子リスト206の各遺伝子を調べることができ、一致があれば、遺伝子の同一性を一致遺伝子群に加えることができる。遺伝子リスト206の遺伝子に対応する第1の遺伝子群における異常の存在は、臨床的関連の遺伝子マーカを含み、NGシーケンサ216を使用して配列決定された患者の核酸サンプルに対応する生ゲノム出力に基づいて、患者の病状(例えば、がん)の性質および/または予後を示すことができる。遺伝子異常は、欠失、挿入、転座、マイナークローン、コピー数変化などを含む。
プロセス400は、構成不能テキスト領域と構成可能テキスト領域とを含む構成可能テキスト文字列を生成することをさらに含む(ステージ410)。図6は、構成可能テキスト文字列600の例を示す。構成可能テキスト文字列600は、第1の構成不能テキスト領域602、第2の構成不能テキスト領域614、ならびに構成可能テキスト領域、すなわち、染色体#フィールド604、マイナークローンフィールド606、獲得/喪失フィールド608、一致遺伝子フィールド610、および染色体/セグメント識別子フィールド612を含む。第1の構成不能テキスト領域602はテキスト「染色体」を含み、第2の構成不能テキスト領域614はテキスト「:」を含む。第1の構成不能テキスト領域601および第2の構成不能テキスト領域614は、生ゲノムデータ300のデータによって変化しないままであり得る。しかしながら、翻訳エンジン202は、図6に示すテキストの代わりに他のテキストを使用することができる。翻訳エンジン202は、生ゲノムデータ300に基づいて、かつ翻訳規則208(図2)に基づいて構成可能テキスト領域を追加することができる。翻訳規則208は、各構成可能領域に関連付けられた1つまたは複数の翻訳規則を含むことができる。構成可能領域についての翻訳規則208は、生ゲノムデータ300に基づいてその構成可能領域に入るテキストの同一性を提供する。テキストの同一性は、各構成可能領域に挿入可能なテキストのリストを含み得る再構成可能テキストストレージ210に含まれていてもよい。
プロセスは、染色体数、コピー数群、および一致遺伝子群に基づいて構成可能テキスト領域を追加することをさらに含む(ステージ412)。図7は、生ゲノムデータ300のデータ、翻訳規則208、および遺伝子リスト206に基づく翻訳エンジン202の翻訳済み出力700の例を示す。特に、翻訳済み出力700は、生ゲノムデータ300において特定された各染色体に対応する構成可能テキスト文字列、または図5において特定された各セグメントに対応する構成可能テキスト文字列を含む。
染色体#フィールド604に、染色体数に対応するテキスト、例えば「1」、「6」などを追加することができる。染色体#フィールドについての翻訳規則は、セグメントの染色体数に対応する数のテキストを含むことを規定することができる。図7に示すように、翻訳済み出力700は、染色体ごとに染色体#フィールドの適切な数を含む。
染色体に「p」腕または「q」腕がないことに基づいて、マイナークローンフィールド606にテキスト「minor clone with」を追加してもよく、またはテキストを追加しなくてもよい。例えば、図5に示す9番染色体509のセグメントを参照すると、長腕「q」がない。したがって、翻訳エンジン202は、翻訳済み出力700の染色体9に対応する構成可能テキスト文字列に示すように、マイナークローンフィールドにテキスト「minor clone with」を含むことができる。
コピー数に基づいて、獲得/喪失フィールド608にテキスト「loss of」または「gain of」を追加してもよく、またはテキストを追加しなくてもよい。例えば、獲得/喪失フィールド608についての翻訳規則は、コピー数が2より小さい場合には、獲得/喪失フィールドにテキスト「loss of」を追加することができ、一方、コピー数が2より大きい場合には、獲得/喪失フィールドにテキスト「gain of」を追加することができることを規定し得る。例えば、図5に示す9番染色体509のセグメントを参照すると、コピー数は2より小さい「1−2」である。したがって、獲得/喪失フィールド608にテキスト「loss of」を追加することができる。
一致遺伝子フィールド610に、一致遺伝子に対応するテキストを追加することができる。例えば、図5に示す1番染色体の第1のセグメント501を参照すると、一致リストは遺伝子「TNFRSF14」を含む。さらに、ヘテロ接合性の喪失を示す「hmz」を含むセグメントは、「p」腕に関連付けられる。したがって、一致遺伝子フィールド610に、テキスト「heterozygosity of 1p overlapping TNFRSF14 gene」を追加することができる。図7に示す翻訳済み出力700は、一致遺伝子フィールド610に挿入されたテキストのいくつかの例を示し、そのうちの2つが染色体1および染色体17に対応するテキストを含む。
染色体/セグメント識別子フィールド612は、獲得もしくは喪失を示す染色体、セグメント、またはサイトバンドを特定する。このフィールドに、染色体数、長腕/短腕識別子、またはサイトバンド識別子のうちの1つを追加することができる。例えば、再び図5に示す9番染色体509のセグメントを参照すると、コピー数は2より小さく、したがって、図7に示すように、染色体/セグメント識別子フィールド612にテキスト「chromosome 9」が追加される。別の例では、図5の染色体6に対応するセグメント506が、「q」腕の完全な喪失を示すコピー数「×0」を示す。したがって、図7の翻訳済み出力700に示すように、染色体6に対応する染色体/セグメント識別子フィールド612に「6q」を追加することができる。
翻訳エンジン202は、図6および図7に示す構成可能フィールドおよび構成不能フィールドの数および種類を生成することに限定されず、追加の構成可能フィールドまたはより少ない構成可能フィールドを使用してもよいことを理解されたい。
一部の実施において、翻訳エンジン202は、染色体のヌクレオチド範囲の塩基対の数に基づいて構成可能テキストの内容を判定することができる。例えば、ヌクレオチド範囲の塩基対の数が5 106塩基対(Mb)より小さい場合には、翻訳エンジンは、翻訳済み出力を第1の部分702に示す形態で提供するのではなく、翻訳済み出力を第2の部分704に示す方法で提供することができる。第2の部分704では、翻訳エンジン202は、一致リストにある遺伝子およびその対応するセグメントのリストを提供することができる。

Claims (20)

  1. 次世代配列決定情報を処理するシステムであって、
    1つまたは複数のプロセッサと、
    命令を含む1つまたは複数のメモリ素子とを備え、前記命令が、実行されると、前記1つまたは複数のプロセッサに、
    次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信させ、
    前記出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定させ、
    ヒト参照ゲノムリストに含まれる、前記ヌクレオチド範囲内の第1の遺伝子群を判定させ、
    前記第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定させ、
    構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成させ、
    前記染色体数に基づく前記第1の構成可能テキスト領域の第1のテキスト、前記コピー数群に基づく前記第2の構成可能テキスト領域の第2のテキスト、および前記一致遺伝子群に基づく前記第3の構成可能テキスト領域の第3のテキストを含ませ、
    前記構成可能テキスト文字列を出力インターフェースに提供させる、システム。
  2. 前記次世代シーケンサが、Illuminaシーケンサ、Ion Torrentシーケンサ、または454パイロシーケンサのうちの少なくとも1つを含む、請求項1に記載のシステム。
  3. 前記1つまたは複数のメモリ素子が命令を含み、前記命令が、実行されると、前記1つまたは複数のプロセッサに、
    前記少なくとも1つのセグメントの開始位置および終了位置を判定させ、前記開始位置が前記染色体数を含み、前記終了位置が前記コピー数群を示す、請求項1に記載のシステム。
  4. 前記少なくとも1つのセグメントが、前記染色体数によって特定された染色体の短腕(p)、長腕(q)、または短腕および長腕の組合せのうちの少なくとも1つに対応する、請求項3に記載のシステム。
  5. 前記1つまたは複数のメモリ素子が命令を含み、前記命令が、実行されると、前記1つまたは複数のプロセッサに、
    前記コピー数群に基づく前記第2の構成可能テキスト領域の前記第2のテキストと、メモリに格納された遺伝子喪失−獲得規則とを含ませ、前記コピー数群が2より小さい数を含むときに、前記遺伝子喪失−獲得規則が前記第2のテキストを「喪失」と規定する、請求項1に記載のシステム。
  6. 前記ヒト参照ゲノムリストが、GRCh38、GRCh37、NCBIビルド36.1、NCBIビルド35、NCBIビルド34、hg38、hg19、hg18、hg17、およびhg16のうちの少なくとも1つを含む、請求項1に記載のシステム。
  7. 前記遺伝子リストが少なくとも1つのがん関連遺伝子を含む、請求項1に記載のシステム。
  8. 次世代配列決定情報を処理する方法であって、
    1つまたは複数のプロセッサにおいて、次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信するステップと、
    前記1つまたは複数のプロセッサにおいて、前記出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定するステップと、
    前記1つまたは複数のプロセッサにおいて、ヒト参照ゲノムリストに含まれる、前記ヌクレオチド範囲内の第1の遺伝子群を判定するステップと、
    前記1つまたは複数のプロセッサにおいて、前記第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定するステップと、
    前記1つまたは複数のプロセッサにおいて、構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成するステップと、
    前記染色体数に基づく前記第1の構成可能テキスト領域の第1のテキスト、前記コピー数群に基づく前記第2の構成可能テキスト領域の第2のテキスト、および前記一致遺伝子群に基づく前記第3の構成可能テキスト領域の第3のテキストを含むステップと、
    前記1つまたは複数のプロセッサによって、前記構成可能テキスト文字列を出力インターフェースに提供するステップとを含む方法。
  9. 前記次世代シーケンサが、Illuminaシーケンサ、Ion Torrentシーケンサ、または454パイロシーケンサのうちの少なくとも1つを含む、請求項8に記載の方法。
  10. 前記1つまたは複数のプロセッサにおいて、前記少なくとも1つのセグメントの開始位置および終了位置を判定するステップをさらに含み、前記開始位置が前記染色体数を含み、前記終了位置が前記コピー数群を示す、請求項8に記載の方法。
  11. 前記少なくとも1つのセグメントが、前記染色体数によって特定された染色体の短腕(p)、長腕(q)、または短腕および長腕の組合せのうちの少なくとも1つに対応する、請求項10に記載の方法。
  12. 前記コピー数群に基づく前記第2の構成可能テキスト領域の前記第2のテキストと、メモリに格納された遺伝子喪失−獲得規則とを含むステップをさらに含み、前記コピー数群が2より小さい数を含むときに、前記遺伝子喪失−獲得規則が前記第2のテキストを「喪失」と規定する、請求項8に記載の方法。
  13. 前記ヒト参照ゲノムリストが、GRCh38、GRCh37、NCBIビルド36.1、NCBIビルド35、NCBIビルド34、hg38、hg19、hg18、hg17、およびhg16のうちの少なくとも1つを含む、請求項8に記載の方法。
  14. 前記遺伝子リストが少なくとも1つのがん関連遺伝子を含む、請求項8に記載の方法。
  15. プロセッサが実行可能な命令を格納するコンピュータ可読記憶媒体であって、
    前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
    次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信させ、
    前記出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定させ、
    ヒト参照ゲノムリストに含まれる、前記ヌクレオチド範囲内の第1の遺伝子群を判定させ、
    前記第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定させ、
    構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成させ、
    前記染色体数に基づく前記第1の構成可能テキスト領域の第1のテキスト、前記コピー数群に基づく前記第2の構成可能テキスト領域の第2のテキスト、および前記一致遺伝子群に基づく前記第3の構成可能テキスト領域の第3のテキストを含ませ、
    前記構成可能テキスト文字列を出力インターフェースに提供させる、コンピュータ可読記憶媒体。
  16. 前記次世代シーケンサが、Illuminaシーケンサ、Ion Torrentシーケンサ、または454パイロシーケンサのうちの少なくとも1つを含む、請求項15に記載のコンピュータ可読記憶媒体。
  17. 命令をさらに含み、前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
    前記少なくとも1つのセグメントの開始位置および終了位置を判定させ、前記開始位置が前記染色体数を含み、前記終了位置が前記コピー数群を示す、請求項15に記載のコンピュータ可読記憶媒体。
  18. 前記少なくとも1つのセグメントが、前記染色体数によって特定された染色体の短腕(p)、長腕(q)、または短腕および長腕の組合せのうちの少なくとも1つに対応する、請求項15に記載のコンピュータ可読記憶媒体。
  19. 命令をさらに含み、前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
    前記コピー数群に基づく前記第2の構成可能テキスト領域の前記第2のテキストと、メモリに格納された遺伝子喪失−獲得規則とを含ませ、前記コピー数群が2より小さい数を含むときに、前記遺伝子喪失−獲得規則が前記第2のテキストを「喪失」と規定する、請求項15に記載のコンピュータ可読記憶媒体。
  20. 前記ヒト参照ゲノムリストが、GRCh38、GRCh37、NCBIビルド36.1、NCBIビルド35、NCBIビルド34、hg38、hg19、hg18、hg17、およびhg16のうちの少なくとも1つを含む、請求項15に記載のコンピュータ可読記憶媒体。
JP2020537765A 2018-01-10 2019-01-09 生ゲノムデータに基づく構成可能テキスト文字列の生成 Active JP7074861B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862615743P 2018-01-10 2018-01-10
US62/615,743 2018-01-10
PCT/US2019/012913 WO2019139994A1 (en) 2018-01-10 2019-01-09 Generating configurable text strings based on raw genomic data

Publications (2)

Publication Number Publication Date
JP2021510435A true JP2021510435A (ja) 2021-04-22
JP7074861B2 JP7074861B2 (ja) 2022-05-24

Family

ID=67218744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020537765A Active JP7074861B2 (ja) 2018-01-10 2019-01-09 生ゲノムデータに基づく構成可能テキスト文字列の生成

Country Status (6)

Country Link
US (1) US11264119B2 (ja)
EP (1) EP3738123A4 (ja)
JP (1) JP7074861B2 (ja)
CN (1) CN111566741B (ja)
CA (1) CA3088012A1 (ja)
WO (1) WO2019139994A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006114037A (ja) * 2004-10-12 2006-04-27 Agilent Technol Inc 比較ゲノムハイブリダイゼーション(cgh)データの見かけ上の異常を統計的に分析しプロットするためのシステムおよび方法
JP2014529109A (ja) * 2011-06-06 2014-10-30 コーニンクレッカ フィリップス エヌ ヴェ 核酸配列データのアセンブリに関する方法
JP2016516237A (ja) * 2013-03-15 2016-06-02 バセトラ メディカル テクノロジー カンパニー リミテッド 疾患関連ヒトゲノム変異体の解析とレポート作成のシステムと方法
US9798855B2 (en) * 2010-01-07 2017-10-24 Affymetrix, Inc. Differential filtering of genetic data
WO2017220508A1 (en) * 2016-06-22 2017-12-28 Sophia Genetics S.A. Methods for processing next-generation sequencing genomic data

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6005566A (en) * 1994-05-19 1999-12-21 Apple Computer, Inc. Aspect and style elements of an improved graphical user interface
EP2912587A4 (en) * 2012-10-24 2016-12-07 Complete Genomics Inc GENOME EXPLORATION SYSTEM FOR TREATING AND PRESENTING NUCLEOTIDE VARIATIONS IN GENOMIC SEQUENCE DATA
SG10202009015SA (en) 2012-12-10 2020-10-29 Resolution Bioscience Inc Methods for targeted genomic analysis
US9734284B2 (en) 2013-03-15 2017-08-15 Micron Technology, Inc. Hardware acceleration of short read mapping for genomic and other types of analyses
CA2961563C (en) * 2014-09-17 2023-04-04 Battelle Memorial Institute Methods of analyzing massively parallel sequencing data
US10734117B2 (en) * 2015-03-02 2020-08-04 Strand Life Sciences Private Limited Apparatuses and methods for determining a patient's response to multiple cancer drugs
EP3636777A1 (en) * 2015-07-13 2020-04-15 Agilent Technologies Belgium NV System and methodology for the analysis of genomic data obtained from a subject

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006114037A (ja) * 2004-10-12 2006-04-27 Agilent Technol Inc 比較ゲノムハイブリダイゼーション(cgh)データの見かけ上の異常を統計的に分析しプロットするためのシステムおよび方法
US9798855B2 (en) * 2010-01-07 2017-10-24 Affymetrix, Inc. Differential filtering of genetic data
JP2014529109A (ja) * 2011-06-06 2014-10-30 コーニンクレッカ フィリップス エヌ ヴェ 核酸配列データのアセンブリに関する方法
JP2016516237A (ja) * 2013-03-15 2016-06-02 バセトラ メディカル テクノロジー カンパニー リミテッド 疾患関連ヒトゲノム変異体の解析とレポート作成のシステムと方法
WO2017220508A1 (en) * 2016-06-22 2017-12-28 Sophia Genetics S.A. Methods for processing next-generation sequencing genomic data

Also Published As

Publication number Publication date
JP7074861B2 (ja) 2022-05-24
EP3738123A4 (en) 2021-10-13
CN111566741A (zh) 2020-08-21
CA3088012A1 (en) 2019-07-18
WO2019139994A1 (en) 2019-07-18
US20200388352A1 (en) 2020-12-10
US11264119B2 (en) 2022-03-01
CN111566741B (zh) 2023-06-23
EP3738123A1 (en) 2020-11-18

Similar Documents

Publication Publication Date Title
CN111417961B (zh) 弱监督的图像分类器
EP3217270B1 (en) A scalable pooled nvme storage box
CN102272726A (zh) 便于异构处理器池虚拟化的系统和方法
US11552991B2 (en) Systems and methods for performing a simulated phishing attack
US11683365B2 (en) Service correlation across hybrid cloud architecture to support container hybridization
EP3256953B1 (en) Multi-mode system on a chip
US20240160549A1 (en) Systems and methods for identifying and monitoring solution stacks
US20170339223A1 (en) Adding and removing virtual disks remotely to a streaming machine
US11683165B2 (en) Quantum key distribution networking as a service
US11582287B2 (en) Hidden desktop session for remote access
JP7074861B2 (ja) 生ゲノムデータに基づく構成可能テキスト文字列の生成
US20220107965A1 (en) Systems and methods for asset fingerprinting
AU2021355460A1 (en) System and method for assessing operational states of a computer environment
US11249804B2 (en) Affinity based optimization of virtual persistent memory volumes
US10152266B1 (en) Systems and methods for providing data backup services in a virtual environment
US20230229474A1 (en) Plug-in management in virtualized computing environment
US20230195757A1 (en) Systems and methods for data abstraction for transmission
US20200385806A1 (en) System and methods for primer extraction and clonality detection
US20160182455A1 (en) Method and apparatus for threat isolation and remote resolution for computer systems
WO2022072770A1 (en) System and method for reconnaissance of a computer environment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220105

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220512

R150 Certificate of patent or registration of utility model

Ref document number: 7074861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150