JP6846459B2 - ヘルスケア解析ストリーム管理 - Google Patents

ヘルスケア解析ストリーム管理 Download PDF

Info

Publication number
JP6846459B2
JP6846459B2 JP2019088988A JP2019088988A JP6846459B2 JP 6846459 B2 JP6846459 B2 JP 6846459B2 JP 2019088988 A JP2019088988 A JP 2019088988A JP 2019088988 A JP2019088988 A JP 2019088988A JP 6846459 B2 JP6846459 B2 JP 6846459B2
Authority
JP
Japan
Prior art keywords
analysis
data
stream
genomic
engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019088988A
Other languages
English (en)
Other versions
JP2019149196A (ja
Inventor
ソン‐シオン,パトリック
Original Assignee
ナント ホールディングス アイピー,エルエルシー
ナント ホールディングス アイピー,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナント ホールディングス アイピー,エルエルシー, ナント ホールディングス アイピー,エルエルシー filed Critical ナント ホールディングス アイピー,エルエルシー
Publication of JP2019149196A publication Critical patent/JP2019149196A/ja
Application granted granted Critical
Publication of JP6846459B2 publication Critical patent/JP6846459B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Physiology (AREA)
  • Ecology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本出願は、2012年7月6日出願の米国仮出願第61/668941号、2012年7月20日出願の米国仮出願第61/673943号、ならびに2013年7月2日出願の米国仮出願第61/842316号、同第61/842323号および同第61/842325号に対する優先権の利益を主張する。ここに記載された付帯的な内容および他のすべての付帯的な内容は、その全体が参照により援用される。
本発明の分野は、ゲノム解析技術である。
ゲノム解析手法の進歩に伴い、大量の生配列データを処理する能力が、情報を迅速に提供して、予後、診断および他のゲノムに基づく解析をケアの現場、患者またはヘルスケア提供元に提供するのに追いつかなくなっている。効果的なゲノム解析をもたらすためにある程度の努力が行なわれてきたが、これらの努力は、個人および集団と連関した多数のデータセットにわたってこの種の解析を提供するということにはすべて失敗している。
Hytopoulosによる国際出願第PCT/US2002/014665号は、データネットワークに関するクライアントサーバー環境中で遺伝子解析を実行するための装置および方法について記載する。しかしながら、Hytopoulosは、大規模または大陸全域の光ファイバーネットワークの長所を利用して、解析のためのゲノム情報のセグメントを並列に構造解析することに失敗している。
Sanbornによる米国特許出願公開第2012/0066001A1号は、参照ゲノム配列と比較した部分列の公知の位置を使用して、配列文字列の増分同期を経由する部分列のアライメントに基づいて差異的遺伝子配列物を導出する方法について記載している。しかしながら、Sanbornは、解析ネットワーク上に接続している複数の解析ノードを利用して、複数の患者からの配列データを並列に処理することについて記載してないように思われる。
Stewardによる国際出願第PCT/US1999/020449号は、遺伝子データベースを提供すること、少なくとも10遺伝子を選択すること、選択された遺伝子についての知識を解明すること、複数の遺伝子についてこれらの工程を反復すること、および知識がすべての選択された遺伝子について実質的に並列に解明されるようにすべての工程を反復することによる、ゲノムデータ解明の方法について記載している。しかしながら、Stewardは、解析ネットワークおよび複数の解析ノードを利用して、ケアの現場、患者またはヘルスケア提供元に迅速で効果的な結果を提供することについて記載してないように思われる。
Dyerによる国際出願第PCT/US2000/042469号は、ゲノムの解析における使用のためのコンピューター検索ツールおよびデータベースのサポートについて記載している。しかしながら、Dyerは、複数のシーケンシングデバイスからの配列データを取得することも、解析ネットワークに接続している複数の解析ノードを利用して患者からの配列データを並列に処理することについても記載してないように思われる。
ここに記載された付帯的な内容および他のすべての付帯的な内容は、それらの全体が参照により援用される。援用された参照中の用語の定義または使用が一貫しないか、またはその用語の定義に反して本明細書において提供される場合、本明細書において提供されるその用語の定義を適用し、参照中のその用語の定義は適用しない。
文脈が相反することを規定しない限り、本明細書において説明されたすべての範囲はそれらの終点を包括すると解釈されるべきであり、非制限的範囲は商業上実用的価値を含むと解釈されるべきである。同様に、文脈が相反することを示さない限り、値のすべてのリストは中間値が包括されるものとして考慮されるべきである。
今日まで、ゲノム解析から実行可能な情報を導出する能力は、(1)集中化されたデータセンターに設置された処理コンピューターおよびストレージコンピューターに大きなゲノムデータを迅速に伝送すること、(2)患者の癌組織のDNA中で見出されるすべての変動を正確に評価すること、(3)不均一な疾患(癌等)において多くのクローンを同定すること、および(4)細胞シグナル経路上の各クローンの各変動の全身性影響を予測することが不可能であることによって、等しく妨害されている。
したがって、大規模ネットワークおよび大陸全域の光ファイバーネットワークを利用して、ゲノム解析ストリーム管理を提供する必要性が今もなお存在している。
本発明の主題は、コンピューター/サーバーに基づくシステムを使用して、ネットワークにわたって分散された解析システムを介してゲノムデータを解析することができる、装置、システムおよび方法を提供する。本発明の主題の一態様には、シーケンシングデバイスインターフェース、解析ネットワーク、および解析ネットワークを介して接続される複数の解析ノードの使用によって、多くの患者からのゲノム配列データを並列に処理する、ゲノム解析システムが含まれる。シーケンシングデバイスインターフェースは、画像認識プログラムもしくはデバイスおよび/または配列情報を記憶する1つ以上のデータベースから、多くのシーケンシングデバイスからのシーケンシングデータを並列に得るように構成されてよい。ゲノム解析システムの解析ノードには、エンジン管理ノード、ネットワークスイッチ、高性能計算設備(HPC)またはゲノムストリーム管理ノードが含まれて、いくつかの配列データおよびゲノムデータを交換することができる。ゲノムストリーム管理ノードは、ストリーム管理機能性に基づく解析エンジンを管理するように構成されてよい。解析ネットワークおよび複数の解析ノードは、ゲノム解析エンジン、および所望される場合、以前のシーケンシングラン、参照配列などからの配列情報を記憶する1つ以上のデータベースを含む。解析エンジンは、配列データを処理して個々の患者のゲノムデータまたは患者の人口統計の生成し、正規化されたゲノム配列または患者の集団からの統計サンプルに対してデータを比較することができる。解析エンジンは、配列データ画像認識プログラムまたはデバイスを処理することができる。解析ネットワークは、光ファイバーデータリンク、地理的に分散された光ファイバーネットワークまたは大陸に広がるネットワークでさえ含むことができる。
ゲノム解析システムは、ゲノムデータ、処理ステータスもしくは解析ステータス、アラートもしくはアラーム、配列デバイスの命令、解析推奨、予後もしくは診断、またはさらなる解析のための要求に基づく通知を生成する。通知システムは、ケアの現場、シーケンシングデバイス、患者、ヘルスケアサービス提供元またはそのいくつかの組み合わせに通知が送信されることを可能にするように解析ネットワーク内の通知のためのルートを確立することができる。解析エンジンは、解析ノードの中での処理ルートを確立するようにも構成されてよく、その結果、各ノードが異なる解析を行うことができる。処理ルート(例えばストリームルート、解析ルート、通知ルートなど)は、予想される診断、優先度、緊急度、配列注釈、またはネットワーク負荷のバランスをとる他の因子の関数として確立することができる。ゲノム解析システムは、ユーザーがフィードバックおよびシーケンスデバイス命令を提供することを可能にする管理インターフェースを含むことができる。
本発明の主題の別の態様は、生配列データを事前解析し、配列注釈を生成し、加えてこれらの配列注釈に従って事前解析されたデータを組み立て、配列解析設備(高性能計算設備等)に転送する、シーケンシングシステムへのアドオンモジュールを含む。生配列データには、ゲノム配列データ、プロテオームの配列データ、RNAおよび低分子RNA配列データ、ならびにエピジェネティック配列データが含まれ得る。配列注釈には、様々な処理パラメーター、配列情報、または患者情報が含まれ得る。アドオンモジュールは、解析設備が許容可能な形式で事前解析された配列データをパッケージングするように構成されてよい。アドオンモジュールはライセンスマネージャーも含むことができ、それは解析設備とアドオンモジュールとの間のコミュニケーションを管理するものである。アドオンモジュールは、解析設備からの命令に基づいて、コマンドをシーケンスデバイスに送信するシーケンスデバイスコントローラーをさらに含むことができる。アドオンモジュールは、事前解析された配列データに基づいて、コマンドをストレージ設備に送信するストレージデバイスコントローラーを含むことができる。アドオンモジュールは、従来のシーケンスデバイスと結合されるように構成されたハードウェアモジュールであってよい。他の実施形態において、シーケンスデバイスまたは解析設備自体はアドオンモジュールとして機能することができる。
本発明の主題のさらなる態様は、先験的知識ベースおよび前処理エンジン(それは生データを受信および前処理し、配列注釈を生配列データと関連付けて前処理された配列データを生成し、前処理された配列データを配列ゲノム解析設備に転送する)へのアクセスを提供する、生配列データを前処理する方法を含む。前処理する方法には、染色体と比較した位置および染色体内の位置、公知の対立遺伝子、マーカーもしくは突然変異との連関性、またはそのいくつかの組み合わせに基づく先験的知識ベースからの公知のゲノムマップに対して生データリードを大まかにアライメントさせる工程も含まれ得る。ラフなアライメントを生成するこの工程は配列注釈の一部であってよい。配列注釈は、公知の遺伝的マーカーもしくは疾患マーカー、運営コード、ルーティング情報、患者情報、人口統計、地理的座標、チェーン・オブ・カストディ(CoC)、推定診断、解析優先順位、またはアラートトリガーも含まれ得る。生配列データを前処理する方法には、生配列データの受信と実質的にリアルタイムで、解析設備によりインバンドで前処理することがさらに含まれ得る。
本発明の主題の追加の態様は、対話型の配列解析システムを含み、当該システムにおいて、1つ以上のシーケンスデバイスアダプターを1つ以上の解析エンジンに結合して、少なくとも1つの解析エンジンおよび標的のシーケンスデバイスと双方向でデータを交換する。配列データは前処理された配列データであってよい。シーケンスデバイスアダプターは複数のシーケンスデバイスアダプターを含むことができ、各アダプターは異なるタイプのシーケンシングマシンを標的とし、その結果、シーケンサーの混合物は単一の一般的なコア解析エンジンで動作させることができる。解析エンジンは複数の解析ノードを有する分散型解析エンジンを含むことができ、ノード自体を地理的に分散させることができる。解析エンジンは、シーケンシングデバイスアダプターを経由して、ネットワークまたは光ファイバーネットワークにわたって、標的のシーケンシングデバイスにシーケンシング命令を発行するように構成される。患者または疾患の情報に基づいて、配列の命令は、シーケンシングを反復、開始、もしくは停止する、データを削除、送信、もしくは転送する、シーケンシング命令に対する優先順位付けもしくはスケジューリングを行う、またはライセンス管理命令を与えるという、標的のシーケンシングデバイスおよび解析エンジンへの命令またはコマンドを含む。
本発明の主題の一態様には、分散型ゲノムデータベースおよびゲノム検索エンジンを備えたゲノムストレージ設備が含まれる。ゲノムデータベースは、患者の集団と関連付けたゲノムデータレコードを記憶することができ、多くの種類の一意識別子、人口統計識別子、または医学的識別子によってインデックス付けすることができる。ゲノムデータは、患者の配列と、時間、人口統計、正規化された配列、疾患または外部因子に基づく参照配列との間の差異を含むことができる。ゲノムデータベースは、ゲノム解析ノードにわたって分散されたメモリ(ネットワークまたは光ファイバーのネットワークにわたる高性能計算設備等)に記憶することができる。ゲノム検索エンジンは、自然言語またはマシンクエリーに応答してデータベースからレコードを戻すように構成されてよい。
本発明の主題の様々な目的、特色、態様および長所は、添付の図面の図と共に、好ましい実施形態の以下の詳細な説明からより明らかになるであろう。図面において、同じ構成要素には同様の符号を付す。
ゲノム解析システムのためのバックボーンとして機能できるNational LambdaRail(商標)の図である。 1つ以上のシーケンシングデバイスを経由してシーケンシングデバイスとインターフェースすることができるゲノム解析エンジンの概略図である。 ゲノム解析設備と対話するシーケンシングデバイスを構成されてよいアドオンモジュールの概略図である。 ゲノム配列データを事前解析するための方法の概略図である。 対話型のシーケンシングシステムの概略図であり、解析設備はシーケンシングデバイスにシーケンシング命令を提供することができる。 ゲノムストレージ設備の概略図である。 ヘルスケア解析ストリーム管理エコシステムの概略図である。 ヘルスケア解析ストリーム管理エコシステムの概略図である。 ヘルスケア解析ストリーム管理エコシステムの概略図である。 ヘルスケア解析ストリーム管理エコシステムの概略図である。
以下の説明はコンピューター/サーバーに基づくゲノム解析システムに対して描かれているが、様々な代替の構成も好適であると考えられ、様々な計算デバイス(サーバー、インターフェース、システム、データベース、エージェント、ピア、エンジン、モジュール、コントローラー、または個別もしくは集合的に操作する他のタイプの計算デバイスが含まれる)を用いることができるということが、言及されるべきである。かかる用語は、有形の非一時的なコンピューター読み取り可能なストレージメディア(例えばハードドライブ、ソリッドステートドライブ、RAM、フラッシュ、ROM、メモリ、分散型メモリなど)で記憶されたソフトウェア命令を実施するように構成された、少なくとも1つのプロセッサー(おそらくマルチコアプロセッサー)を含む、計算デバイスを表わすと見なされるということが、認識されるべきである。ソフトウェア命令は、好ましくは、開示した装置に関して以下に論じられるような役割、責任、または他の機能性を提供する、計算デバイスを構成またはプログラムする。特に好ましい実施形態において、様々なサーバー、システム、データベースまたはインターフェースは、おそらく,HTTP、HTTPS、AES、公開鍵−秘密鍵交換、ウェブサービスAPI、公知の金融取引プロトコル、または他の電子情報交換方法に基づいて、規格化されたプロトコルまたはアルゴリズムを使用して、データを交換する。データ交換は、好ましくは、パケットスイッチネットワーク、インターネット、LAN、WAN、VPNまたは他のタイプのパケットスイッチネットワークにわたって行われる。
開示した手法は、多くの有利な手法的効果(ゲノム解析デバイスを構成する1つ以上のシグナルを生成してゲノム解析に参加することが含まれる)を提供するということが、認識されるべきである。シグナルは遺伝子配列から導出された情報に従って生成することができる。さらに、シグナルは、解析、ルーティング、ストレージ、通知、ライセンス管理、管理、アラート、インベントリ、ロギング、レポーティング、セキュリティ、メタデータ、ダッシュボード、解析ストリームフロー、またはゲノム解析の他の態様に影響するパラメーターがおそらく含まれる、構成パラメーターを表わすことができる。
以下の考察は、本発明の主題の多くの実施形態例を提供する。各実施形態は発明の要素の単一の組み合わせを表わすが、本発明の主題は開示した要素のすべての組み合わせを含むと判断される。したがって、一実施形態が要素A、BおよびCを含み、第2の実施形態が要素BおよびDを含むならば、その時、本発明の主題は、たとえ明確に開示されなかったとしても、A、B、CまたはDの他の残りの組み合わせも含むと判断される。
本明細書における説明において、および続く特許請求の範囲にわたって使用されるように、「1つの(a)」、「1つの(an)」および「その(the)」の意味には、文脈が明確に指示しない限り、複数の参照が含まれる。さらに、本明細書における説明中で使用されるように、「〜中(in)」の意味には、文脈が明確に指示しない限り、「〜中(in)」および「〜上(on)」が含まれる。
本明細書において開示される本発明の代替の要素または実施形態の群分けは、限定として解釈するべきできない。各群メンバーを、個別に、または群の他のメンバーもしくは本明細書において見出される他の要素との任意の組み合わせで、参照および請求することができる。群のうちの1つ以上のメンバーは、利便性および/または特許性の理由のために群中に包含または削除することできる。任意のかかる包含または削除が起こる場合、本明細書は、添付の請求項中で使用されるすべてのマーカッシュ群の書面の説明を満たすように修飾された群を含有すると本明細書において見なされる。
本明細書において使用される時、および文脈が規定しない限り、「〜に結合された」という用語には、直接的結合(相互に結合された2つの要素が互いに接触する)および間接的結合(少なくとも1つの追加の要素は2つの要素の間に設置される)の両方が含まれることが意図される。したがって、「〜に結合された」および「〜と結合された」という用語は、同義的に使用される。さらに、「〜に結合された」および「〜と結合結合された」という用語は、「〜と通信可能に結合され」、ネットワークデバイスがおそらく1つ以上の中間デバイスを経由してネットワークにわたって互いと通信できることを意味するように婉曲に使用される。
概要
好ましいゲノム解析ストリーム管理システムは、生配列データを事前解析、注釈または解析して、ゲノムデータの解析結果を生成するための大規模にスケーラブルなシステムを含む。企図されたシステムは、ゲノムデータ上のリアルタイムで利用可能な即時の情報を、ヘルスケア提供元、患者、科学者または他のユーザーに対して提供するために有用である。以前の手法は、およそ30億塩基対のヒトゲノムをシーケンスし、20,000〜25,000遺伝子をマップするには、数日、数週間または数か月かかり得るが、このゲノム解析システムは数分または数時間で応答の早い目標を達成することができる。システムは、生遺伝子データを前注釈すること、複数の解析ノードに対して注釈された遺伝子データのパケットを構造解析すること、大規模な大陸全域の解析ネットワーク上で並列にこれらの解析を実行すること、およびおそらくケアの現場、患者、ヘルスケア提供元、科学者もしくは研究者または他のユーザーに対して、通知を送受信することによってこの目標を達成する。このシステムの効率性および迅速性は、ハイスループットネットワークを経由して複数の解析ノード上で操作される平行な解析に起因する。ゲノムデータ結果は、配列データ上での予後、診断または他の解析を非常にタイムリーな様式で提供することができる。
ゲノム解析ストリーム管理システムは、ネットワークを通してデータストリームも管理する。管理システムは、処理ルートを確立すること、トラフィック負荷もしくは解析負荷に基づいてルートを調整すること、解析エンジンを管理すること、解析を開始もしくは改変すること、配列データ結果においてより高い信頼レベルを獲得するために追加の解析を要求すること、またはインプット、処理、解析もしくは出力を効率的に管理する他のアクション行うことができる。
ゲノムデータは、大規模な遺伝的データ(例えば、倍数性/核型、ヘテロ接合性、対立遺伝子頻度などのデータが含まれる静的ゲノム情報に加えて、静的情報における変化の時間経過、進化解析データなどが含まれる動的ゲノム情報)、高解像度のデータ(例えばゲノムDNA、コンティグに対するcDNAデータ、組み立てられたコンティグ、染色体、遺伝子、および/または疾患関連配列情報、部分的または完全なトランスクリプトームデータ、hnRNA、mRNA、snRNA、siRNA、スプライスバリアントが含まれる様々なタイプのRNAデータなど)に加えて、核酸の群(複数可)の情報(例えばコドン使用頻度、特にRNAについてのまれな核酸塩基)であってよい。さらに、ゲノムデータは文脈情報も含み得ること、および特に好ましい文脈上の情報は、配列が従属するか参加する制御経路に関連するデータを含むこと、そこで制御経路は、複製レベル、アポトーシスレベル、転写レベル、翻訳レベルまたは翻訳後レベル上であってよいことが認識されるべきである。したがって、情報が、核酸配列によってコードされたタンパク質産物の活性または機能とも関係/連関し得るおよび/またはプロテオミクスデータに関連し得ることが指摘されるべきである。なおさらなる企図された態様において、ゲノムデータは疾患関係情報(例えば病原体または病態生理学と関連付けた配列および/または調節性データ)も含むかまたは関連し得る。
分散型解析システムネットワークは、コンピューター/サーバーに基づくゲノム解析システムまたは計算デバイスの任意の構成(サーバー、インターフェース、システム、データベース、エージェント、ピア、エンジン、コントローラー、または個別もしくは集合的に操作する他のタイプの計算デバイスが含まれる)であってよい。解析システムは複数の解析ノードを有することができ、当該システムにおいてノード自体を地理的に分散させることができる。開示した分散型ゲノム解析ストリーム管理システムにおける使用に適合させることができる分散型ネットワークシステムの一例には、National LambdaRail(商標)(NLR)が含まれる。
ノードは、大学または連邦研究所に加えて、解析を行う可能性のある国際設備において国にわたって分散させることができる。NLRは、その13のメンバー(CENIC、Florida LambdaRail、Front Range GigaPoP/University Corporation for Atmospheric Research、Lonestar Education and Research Network、Mid−Atlantic Terascale Partnership:MATP / Virginia Tech Foundation、North Carolina Light Rail、Oak Ridge National Laboratory、Oklahoma State Regents for Higher Education、Pacific Northwest Gigapop、Pittsburgh Supercomputing Center / University of Pittsburgh、Southeastern Universities Research Association、Southern Light Rail、およびUniversity of New Mexico(ニューメキシコ州を代表して))と連関した地域ネットワークを有する。
図1中で、本出願人によるアクセス可能なNational LambdaRail(商標)(NLR)190が提示される。
NLR190は、企図された分散型解析システムのためのバックボーンとして機能することができる全国的で先進的光ネットワークインフラストラクチャーである。NLR190は、米国一帯で12,000マイルおよび21州をカバーする高速光ファイバーネットワークインフラストラクチャーである。NLR190は商業的な回線事業者が行うような使用上の制約を課さず、ユーザーに全体的なフレキシビリティおよび制御を提供する。1600Gbpsの総容量、40Gを実装した製品、および100Gのために進行中のプランニング(2012年時点で)を備えて、NLR190は、広範囲の先進的研究プロジェクトおよび官民のパートナーシップのための最先端のネットワークプラットフォームである。280を超える参加大学および連邦研究所がNLR190を使用する。NLR190は最初の大陸横断型の10ギガビットのイーサネット(登録商標)ネットワーク製品である。NLR190は、5つの国際的な交換ポイントを有し、Global Lambda Integrated Facilityとの提携を経由して世界中の他のネットワークへのリンクを有する。
ゲノム解析ストリーム管理システム
図2は、ゲノム解析システム200の概要を示す。
解析エンジン240は、ネットワーク(NLR290、光ファイバーネットワーク、統合もしくはスタンドアロンの広域ネットワーク、都市規模ネットワーク、企業プライベートネットワーク、仮想プライベートネットワーク、イントラネット、無線ネットワーク、または他のネットワーク等)によって相互に接続された多くのノード(例えば、ノード230,231,232,233,234,235はノードの種類および数の例示であり、それらは図2中で図示されるものに限定されない)にわたって、分散させることができる。
ノード230、231、232、233、234または235には、コンピューター、クライアント、サーバー、ピアが含まれるか、または好ましくは高性能計算設備(HPC)231が含まれ得る。ノードには、ネットワークインフラストラクチャー自体、スイッチ(例えばCisco(登録商標)、Juniper(登録商標)など)、モデム、リピーター、ハブ、ブリッジ、アプリケーション層ゲートウエイ、ルーター、多層スイッチ、コンバータ、ホストバスアダプター、ハブ、ファイアウォール、または他のネットワーク要素も含まれ得る。ノード230、231、232、233、234または235は、各ノードが配列データを解析できる1つ以上のゲノム解析モジュールを含むことができる場合に、ゲノム解析を行うことに関して代替可能であると判断することができるということが、認識されるべきである。
ノード230、231、232、233、234または235は、一般的なゲノム解析ノード、ゲノム解析のために構成またはプログラムされた一般的な目的のノード、特異的なゲノム解析の役割または責任(ルーティング、処理、シーケンシング、転送、データクレンジング、マッピングまたは他の機能等)に専用のノードであってよい。特異的なノードの役割または責任にかかわらず、一部の実施形態において、ノードの消失により、失われたノードの機能性が別のノードへシフトされることが要求されるならば、役割または責任はノードからノードに移動することができる。
ノード230、231、232、233、234または235には、特異的な解析(DNAおよびRNAの配列解析、遺伝子発現解析、アライメント解析、ゲノム比較解析、パターン検索、DNAモチーフ解析、DNAプロモーター解析、DNAおよび/もしくはRNAの二次構造および三次構造の解析、DNAコピー数多型、DNAメチル化、マイクロRNA解析、mRNA発現プロファイリング、スプライスバリアント解析、タンパク質配列(およびいくつかの事例において構造)解析、または他のゲノム解析ツールおよび方法(例えば系統樹アセンブリー、進化距離の計算、突然変異率の決定など)等)を支配する解析管理ノード230が含まれ得る。
ノードの1つの許容可能な形態には、2012年7月20日に出願されたシリアル番号61/673943を有する共有の米国仮出願(本明細書において参照としてその全体を援用し、それに対して本出願は優先権を主張する)中で記載されるような、グラフィックプロセッサーユニット(GPU)上で操作される1つ以上のモデリングエンジンが含まれ得る。
ノード230、231、232、233、234または235には、システムの一部またはゲノム解析システムのすべてを支配する解析設備管理能力が含まれ得る。マネージャーノード230を、自動ダッシュボードまたはユーザー生成ダッシュボードによりシステムへのインターフェースとして操作して、ゲノムデータストリームまたはゲノム解析フローをモニタリングまたは管理することができる。マネージャーノード230を使用して、データ上での注釈もしくは表記を作成するか、処理命令を作成するか、データもしくは解析を正規化するか、メモリを管理するか、または他の機能を行うことができる。マネージャーノード230は、定数、命名規則、プロパティ、ナビゲーション方法、マニュピレータ方法、ユーティリティ方法、データおよび解析の品質制御パラメーター、ならびに他の機能を定義することができる。マネージャーノード230は、ユーザー(例えばシステムマネージャー、管理者、エンドユーザーなど)が機能または解析を要求するために使用できるインターフェースを提供できるということが、認識されるべきである。マネージャーノード230は、API、クライアントコンピューターもしくはサーバー、ラップトップ、タブレット、モバイルデバイス、ブラウザ、または他のインターフェースを介して構成またはプログラムされてよい。マネージャーノード230を使用して、解析を追加、反復、改変、もしくは解除することができるか、シーケンスされたデータのプロパティを確認もしくは設定することができるか、ゲノムデータベースリポジトリ中で見出されるデータとシーケンスされたデータを融合もしくはアライメントさせることができるか、解析をリルーティングすることができるか、または他の機能を行うことができる。
ノード230、231、232、233、234または235は、所望される解析に従って単独でまたは総体で操作することができる。ノード230、231、232、233、234または235は、連続で、反復して、並列に、またはそのいくつかの組み合わせで、操作することができる。ノードが、ゲノムデータの一般的な目的の処理またはカスタマイズされた処理を扱う特異的な構成またはトポロジーにノードをアレンジすることを可能にするので、かかるアプローチは有利であると判断される。例えば、各々のノードが患者配列データの異なる部分で操作される場合、または各々のノードが配列データに異なる解析方式を適用する場合、ノード230〜235を患者に特異的なトポロジーに構成されてよい。特異的な解析もしくは緊急度が患者に要求される場合、または特定のデータ解析が実質的な処理時間/リソースを要求する場合、かかるアプローチは有利であると判断される。
解析エンジン240は、ノード230、231、232、233、234または235、およびマネージャーノード230の支配下でおそらく操作されるネットワーク290からなることができる。解析エンジン240は、シーケンシングデバイス210、211または212から遺伝的データを得る(シーケンシングデバイス210,211,212はシーケンシングデバイスの種類および数の例示であり、それらは図2中で図示されたものに限定されない)。シーケンシングデバイス210、211または212は、解析エンジン240と通信するように構成またはプログラムされてよい(例えば、エンジン240全体として、個々のノード230〜235、マネージャーノード230経由で、など)。シーケンシングデバイス210、211または212は、シーケンシングデバイスインターフェース220、221もしくは222または他のインターネット、ネットワークもしくは通信プロトコルおよびインターフェースを介して、解析エンジン240と通信することができる。例示的なインターフェースは、1つ以上のプロトコル(トランスミッション制御プロトコル(TCP)、ハイパーテキスト転送プロトコル(HTTP)、共通インターネットファイルシステム(CIFS)、ネットワークファイルシステム(NFS)、ファイル転送プロトコル(FTP)、セキュアファイル転送プロトコル(SFTP)、ハイパーテキスト転送プロトコルセキュア(HTTPS)、ネットワークアドレス変換(NAT)、セキュアコピープロトコル(SCP)、または公知のもしくはまだ実装されていない他のプロトコルのうちの1つ以上がおそらく含まれる)を活用することができる。例えば、シーケンシングデバイス210〜212は、1つ以上のファイアウォールの後ろで操作されるように構成されてよい。それらの対応するプロバイダーのオフィスでの配備に際して、シーケンシングデバイス210〜212は、デバイスインタフェース220〜222のうちの1つ以上(それはHTTPサーバとして構成され得る)に、ファイアウォールを介して、HTTP要求を送信することができる。要求の受信に際して、デバイスインタフェース220〜222は、おそらくファイアウォールを介してNAT接続を経由して、対応するシーケンスデバイスとの接続(例えばTCP/IPセッション、SSLセッションなど)を確立することができる。次いで、シーケンシングデバイス210〜212は、おそらく生データストリームとして、FTP経由のファイルとして、XMLストリームとして、または他の形式で、インターフェース220〜222を経由して、ノード230〜235に、それらのゲノムデータを送信することができる。
例として、解析ストリーム管理の初期実験は、「トランスポーター」(そこでデータストリームはAES−128を使用して暗号化される)と呼ばれるプロプライエタリなUDPに基づくクライアントサーバーの構造を利用する。初期実装はトランスポータークライアントの20のインスタンスを含み、各々はサニーヴェール(カリフォルニア)において実行され、各々は2スレッド、9000の最大転送単位(MTU)および240mb/秒/スレッドの速度制限であった。すべてのトランスポータークライアントのインスタンスは、フェニックス(アリゾナ)において実行されるトランスポーターサーバの3つのインスタンスに同時に接続された。すべての転送および処理統計はZabbixモニタリングパッケージを使用して収集された。フェニックスにおけるファイアウォールで測定されるように中央の転送スピードは8.232Gb/秒であり、トラフィックの上位1%は9.55Gb/秒を超えるピーク転送速度を達成した。この全体的な転送スピードは、17.4秒ごとに1つのエクソームのスループットを表わす。実験的なセットアップにおいて、ストリームオブジェクトは、各々の患者について1つのエンドポイントから別のもの(例えばトランスポーターのスレッドおよびインスタンス)へのデータのフローに加えて、データの解析およびトランスポートを表わした。さらに、ストリームオブジェクトは収集またはモニタリングされた統計も表わすと判断することができる。
シーケンシングデバイス210、211または212は、典型的には遠隔地の設備またはヘルスケア提供元250、251もしくは252に(ケアの現場、モール、医院、薬局、研究(または臨床的な)研究所、または他の場所等に)設置される。シーケンシングデバイス210、211または212は、生物学的サンプルにおけるヌクレオチドの配列を決定する。企図された解析システム200とインターフェースする能力を欠く従来のシーケンシングデバイスは、シーケンシングデバイスインターフェース220、221または222を経由して解析エンジン240とインターフェースするように構成されてよい。シーケンシングデバイスインターフェースは、解析エンジン240に結合するようにシーケンシングデバイスを構成するかまたはそうでなければ適合するアフターマーケットモジュールとして構築することができる。例示的なゲノムデバイスインタフェースとして構成できる技術には、Digi International Inc.(URL www.digi.comを参照、Digi Connect ME、Digi Connect Wi−ME、PortServerなど)またはLantronix Inc.(URL www.lantronix.comを参照、XPort(登録商標)、xPico(商標)、UDS1100、WiPort(登録商標)など)によって、提供されるデバイスサーバー製品が含まれ得る。かかるデバイスサーバーは、ゲノム解析モジュールを搭載して、シーケンシングデバイスインターフェース220〜222として操作することができるか、またはシーケンシングデバイス210〜212に統合することができる。
シーケンシングデバイス210、211または212は、ケアの現場、モール、医院、薬局、研究所または他の提供元の場所250、251または252に設置することができる。シーケンシングデバイス210,211,212が普及し、コスト効率が向上するのに伴い、どのような場所にも設置することができる。シーケンシングデバイス210、211または212は、モバイルの携帯型のデバイス、運輸保安局によって使用することができるセキュリティデバイス、研究所でのポータブルデバイス、ラップトップまたは他のデバイス上でアクセス可能かもしれない。シーケンシングデバイス210、211または212は、疾病対策センター(CDC)または類似の公衆衛生当局によって同定された疾患アウトブレイクの本質を確認すること、開発途上国または先進国での新興伝染病を追跡すること、またはテロリスト、戦争時もしくは衝突状態における生物学的脅威を検討することが、緊急に必要であり得る非常事態の領域に配達することができる。
ネットワーク自体290またはプロバイダー250、251もしくは252は、レポートサーバ(例えばMicrosoft Reporting Services Report Server)または他のレポーティングエンジン(図2に不図示)を有して、レポーティングテンプレート、ユーザー定義レポート、ゲノムドローイングツール、視覚的な出力または他の情報の提供することができる。レポートビルダー、レポートデザイナーまたはレポートを生成する他の手法があり得る。
シーケンシングデバイスインターフェース220、221または222を「アダプター」として操作して、解析エンジン240によって表わされる「クラウド」にシーケンシングデバイスを接続することができる。シーケンシングデバイスインターフェース220、221または222は、シーケンシングデバイス(それが所望される通信能力を欠く従来のデバイス(不図示)であるか、パッシブか、またはそれが接続される他のデバイスについて知らない場合)に対してローカルであってよい。単一のシーケンシングデバイスインターフェース220、221または222は1つ以上の他のデバイスと接続して、解析要求に従ってデータを交換することができる。シーケンシングデバイスインターフェース220、221または222は、メーカー、モデル、所属、医療グループまたは他の分類に従って管理することができる。したがって、マネージャーノード230はシーケンシングデバイスと通信して、各々のデバイスは適切にエコシステム内で操作されるかまたは所望される解析に従って参加することを保証することができる。
システム200全体は、並列に操作するように好ましくは構築される。ゲノム解析システム200は何百、何千およびまたはそれ以上のシーケンシングデバイスの処理を同時にサポートすることができ、システム200は何百、何千およびまたはそれ以上の患者を同時に解析することができる。システム200は、集団または群のサンプルの処理または遺伝子解析もサポートすることができる。
ゲノム解析システム200は高速度で並列に多くの患者を処理することができる。処理速度は、単位時間あたりのどのくらい多くの患者が所定の時間で処理される(おそらく完了まで処理される)かに基づき得る。例えば、ゲノム解析システム200は1日あたり少なくとも5人の患者の速度で配列データをゲノムデータに処理するように構成されてよい。例示的な実施形態において、ゲノム解析システム200は1日で少なくとも10人の患者、より好ましくは1時間で少なくとも10人の患者、さらにより好ましくは1日で少なくとも100人の患者、またはなおより好ましくは1時間で少なくとも100人の患者の速度で配列データをゲノムデータに処理することができる。
解析エンジン240はゲノムデータを処理する。解析エンジン240は患者からのゲノムデータを個別に処理することができ、解析エンジン240は、患者からのゲノムデータを、類似の人口統計または他の群を備えた集団データセットまたはサンプルに対して比較することができる。本出願人は、患者データを比較することができるヒトの統計的またはベースラインのゲノムデータを表わす「Homo Statisticus」という用語を造語する。Homo Statisticus表示には、連続的にデータを収集したデータベース、プライベートデータベースまたは正規化された配列を発展させた、公共ゲノムデータベース中で見出されるデータが含まれ得る。解析エンジン240は配列データを処理して、正規化されたゲノム配列の関数としてゲノムデータを生成することができる。正規化された遺伝子配列は、患者の集団もしくはサブ集団または他のデータソースからの統計的なコンパイルであってよい。正規化されたゲノム配列に基づいて、ゲノムデータは、ホットスポット、重み付き参照点、または解析のための優先順位を含むことができる。解析エンジン240は、正規化された配列に基づく差異的配列またはラフなアライメントも生成することができる。
解析エンジン240は、シーケンシングデバイス210、211または212にフィードバックを提供することができる。解析エンジン240はインターフェースとして管理ノード230を利用することができ、ユーザーがシーケンシングデバイス210、211または212との間のフィードバックを提供するように構成またはプログラムされることを可能にする。ユーザーは、シーケンシングデバイス命令(シーケンシングを反復する要求、シーケンシングを開始もしくは停止する要求、データを送信もしくは受信する要求、データを削除する要求、ライセンス管理する要求、または他の命令等)を提供することができる。
ゲノム解析ストリームは、シーケンシングデバイス210、211または212から、解析エンジン240を介する、通知のポイント(プロバイダー250または251または252等)へのデータのストリームと判断することができる。したがって、解析ストリームは、制御、操作、またはそうでなければ管理することができる別個の管理可能なオブジェクトと判断することができる。ストリームオブジェクトは、ストリームの本質を記載するストリーム属性を含むことができる。例示的な属性には、ストリーム識別子(例えばGUID、UUID、名称など)、解析トポロジー、ソースポイントの情報(例えばケアの現場識別子、シーケンシングデバイス識別子)、通知ポイントの情報(例えばヘルスケア提供元識別子など)、患者情報、通知トリガー基準、ビリングコード、ビリングもしくはインボイシング情報、またはストリームに関連する他の情報が含まれる。マネージャーノード230またはシステム内の他の要素はストリーム属性を活用して、解析、ルーティング、レポーティング、アラート生成または他の管理機能に関してストリームを適切に管理する。ストリームオブジェクトには、解析の様々なステージで実際に処理されているゲノムデータがさらに含まれ得る。ストリームオブジェクトは、ゲノムデータのデータフローも表わすと判断されるということが、認識されるべきである。したがって、データのストリームは、バッチで同時に処理することができるか、またはエンドツーエンドの完全なストリームとして管理することができる。データまたは結果が収集され、ユーザーにデリバーされると、ゲノム解析は同時に行うことができる。ストリームはマネージャーノード230によって管理される管理可能なオブジェクトであってよい。マネージャーノード230は、1つ以上の管理機能性(解析ルートの変更、ストリームオブジェクトに従う解析ストリームのインスタンス生成、解析ストリームオブジェクトに基づくトランザクションの実行、解析の改変、解析ストリームオブジェクトに基づく通知トリガー基準の構築、解析ストリームの脱構築、または解析ストリームを管理する他の管理機能性がおそらく含まれる)に従って少なくとも1つの解析ストリームオブジェクト(例えば解析データストリーム、配列データに適用された解析ルートなど)を管理することによって、解析エンジン240を管理することができる。
解析エンジン240は、ゲノム解析のために必要に応じて、その処理構成、解析構成またはルーティング構成を変化させることができる動的システムと判断される。マネージャーノード230は、ユーザーによって制御することができるか、または解析操作における他のノードを自動的に管理および構成するように構成されてよい。これらの構成変化または命令は解析ストリームを管理し、それらには、ストリーム管理機能性(ゲノムデータの関数としての通知、処理ステータス、解析エンジン管理ステータス、アラート、アラーム、シーケンシングデバイス命令、解析推奨、予後、診断、ノード間通信、より高い信頼レベルを得ることを求める要求、または他の通知の生成等)が含まれ得る。マネージャーノードは解析ネットワーク内のルートを構成する通知も生成することができる。さらに、マネージャーノードはストリームをリルーティングできるだけでなく、ノードのチェーンを処理して全体の解析ストリームを管理することができる。
管理ノード230は、解析ノード230、231、232、233、234または235、解析ストリームおよび解析エンジン240を管理する1つ以上のツールを提供する。管理ノード230はダッシュボードを含み、全体のシステム、特定のグループのためにダッシュボード、加入者のためにダッシュボード、シグナル解析のためのダッシュボード、ユーザー定義のダッシュボード、解析のレポートおよび出力をデザインするダッシュボード、インプットおよび出力解析のためのダッシュボード、システムをモニターする視覚的なダッシュボード、または他のダッシュボードを管理することができる。オーバービューが収集したストリームオブジェクトがどのくらい処理されているかを知らせる(おそらくリアルタイムで観察される)ことを提示できる場合、企図されるダッシュボードは、ゲノム解析ストリームオブジェクトに関して情報を提示できるということが、認識されるべきである。さらに、ストリームオブジェクトは、ストリームのインスタンス生成、ストリームの脱構築、ストリームの脱アクティブ化、ストリームに関してのシステム効率のモニター、または他の制御の適用によって、かかるダッシュボードを経由して制御することができる。
解析システム200は、データまたは解析ストリームをルーティングするように構成またはプログラムされてよい。解析エンジン240は、シーケンスされたデータの状態、他のゲノムデータがどのくらいルーティングされるか、および解析システムにどのくらい負荷がかるかに依存して、解析ノード230、231、232、233または234、または235の中で処理ルートを確立するように構成されてよい。解析エンジン240は、予想される診断、予後、優先度、緊急度、配列注釈、トラフィック負荷、解析負荷、演算帯域幅、メモリ制約、アラートステータス、解析のステータス、ユーザー定義のインプット、ゲノム解析のタイプ、要求もしくは要求される解析反復の数、信頼レベル、または他の解析パラメーターの関数として処理ルートを確立することができる。かかる実施形態において、解析エンジン240は、現在の解析を適合させる特異的な構成をとることができる。例えば、優先的なデータは高ボリュームの処理ノードにルーティングすることができ、一方でそれほど緊急でないデータは低ボリュームノード上でのバッチ処理として実行することができる。患者が所望されない突然変異を示す確率が低い特定の人口統計に関連付けられた場合のシナリオを考慮されたい。マネージャーノード230は、高ボリュームに従う1つ以上の他のノード、人口統計の情報に基づくハイスループットトポロジーまたはゲノムプロファイル情報を構成されてよい。高ボリューム、ハイスループットのトポロジーは、対応する患者データをそれが入ってくると処理し、おそらくストリームの1つ以上のFIFOバッファを形成する。特に興味深い患者データストリームが導入される場合、おそらく緊急度または非常事態に起因して、マネージャーノード230は専用トポロジーとして1つ以上のノードを割り当てて急患のデータを解析する。かかるリソースの取得は、高ボリューム、ハイスループットのトポロジーに影響を与え得る。しかしながら、急患のデータはタイムリーな様式で処理して緊急度または緊急事態に取り組むことができる。
解析エンジン240は有料サービスとして操作することができ、それは加入者が登録するか、支払情報を発行するか、またはゲノム解析能力にアクセスするためにシステムにログインすることを要求する。ノード230、231、232、233、234または235(管理ノード230等)は、加入者リスト、ライセンス要求、ログイン機能性、決済手段および他の有料関連機能を管理することができる。ゲノム解析ストリームオブジェクトが解析エンジン240によって処理されると、マネージャーノード230のうちの1つ以上はリソースの程度をモニターすることができるか、またはサービスは解析に適用される。計算された使用に基づいて、マネージャーノード230は、与えられたサービスの提供と交換して、1つ以上のアカウント(例えばヘルスケア提供元アカウント、保険アカウント、患者アカウントなど)に料金をチャージすることができる。解析、緊急度、優先順位、解析のために使用されるアルゴリズム、または他のゲノム解析ストリームオブジェクト属性に要求されるリソースの中のものに基づいて、料金を適用することができるということが、認識されるべきである。
解析エンジン240は画像認識に基づいて配列データを処理するようにさらに構成されてよい。シーケンシングデバイス210、211または212も画像認識に基づいて配列データを処理するように構成されてよい。ゲノム出力または連続時間符号化振幅顕微鏡法(STEAM)もしくは他のプロセスからの他のデータ出力は、DNA塩基に翻訳できることが企図される。塩基呼び出し工程で、データ出力からの各々の画像は特定のDNA塩基のためのインディケーターとして操作することができる。例えば、画像は認識することができるバーコードの形態と判断することができる。さらに、画像は解析システムを介してトランスポートされた解析ストリームの一部であってよい。
STEAMはハイスループット画像化の方法である。電荷結合素子(CCD)および相補型金属酸化膜半導体(CMOS)デバイスなどの従来の画像センサーとは異なり、STEAMは高輝度照明なしに非常に速いシャッタースピードを提供することができる。STEAM方法は二次元画像を一次元の増幅された連続的な時間ドメイン波形にマップする。STEAMは、広帯域光パルスのスペクトル上に最初に情報をスタンプし、次いで時間ドメインの連続的なストリームにスペクトルをマップすることによって、これを達成する。この方法は画像ストリーミングおよび増幅の両方を提供するように構成され、高速下で迅速な物理的現象を取得するように構成される。STEAMは従来のCCDより少なくとも1,000速く、610万フレーム/秒ほどの高いフレーム速度を有する。さらに、この方法は、27ps(ピコセカンド)のシャッタースピードを提供する。
ハイスループット画像化の方法として、STEAMを使用して、まれな疾患細胞、癌細胞または他の生物学的もしくはゲノムの材料を同定することができる。この細胞同定法は、解析システム200における多数のアプリケーション(癌スクリーニングおよび他の診断試験が含まれる)を有することができる。
解析システム200はスケール不変特徴変換(SIFT)等のアルゴリズムまたは画像認識を実行する他のアルゴリズムを使用できることがさらに企図される。SIFTは、照明、画像ノイズ、スケーリング、翻訳、ビューポイント、変換および回転に対して不変である局所画像特徴ベクトルのクラスを使用する、画像認識のための広く公知のアルゴリズムである。特徴は、段階的なフィルタリング(すなわちスケールスペース極値検出、キーポイント局所化、オリエンテーション割り当て、キーポイント説明子の生成など)を介して検出され、画像キーはそれらについて作成される。したがって、解析システムから得られた画像を解析して、それらが公知のオブジェクトに関連する特徴に対応する画像特徴(例えばSIFT特徴など)を有するかどうかを決定することができる。
ゲノム解析を行うために使用することができる例示的手法には、米国特許出願公開第2012/0066001号および国際公開第2013/086424号、国際公開第2013/086355号、国際公開第2013/062505号、国際公開第2013/052937号および国際公開第2011/139345号に記載されに記載されるようなFive3 Genomics LLC(URL five3genomics.comを参照)によって提供されるものが含まれる。追加の手法には、連続時間符号化振幅顕微鏡法(STEAM)およびSanborn et al.による2012/0059670号に記載された手法が含まれる。
アドオンモジュール経由のゲノム解析ストリーム管理
図3は本発明の主題の別の態様を図示し、アドオンモジュール370を使用してシーケンシングデバイス310を構成されてよい。
アドオンモジュール370はアフターマーケットデバイスであってよいか、またはアドオンモジュール370はシーケンシングデバイス310自体に統合することができる。あるいは、アドオンモジュール370は、解析クラウド300(例えばウェブサービス、サービス型ソフトウェア(SaaS)、サービス型インフラストラクチャー(IaaS)、サービス型プラットフォーム(PaaS)など)または他の構成に統合することができる。アドオンモジュール370は、1つ以上のハードウェアプラットフォーム上で実行されるアプリケーションパッケージまたはクラウドに基づくアプリケーションも含むことができる。
アドオンモジュール370は、デバイス、解析ストリームまたは解析の中の間で、および解析システム300(例えばNLR390およびHPC330、331、332、333、334または335)の間で通信を促進する多様な手法で構成または組み込むことができる。アドオンモジュール370は、多くの転送形式(転送形式は各々の解析設備/ノード330、331、332、333、334または335によって定義することができる)に従って事前解析された配列データをパッケージングするように構成されてよい。アドオンモジュール370は、シーケンスデバイスとして操作される従来のシーケンスデバイス310と結合されるか、既存のシーケンシングデバイス内の従来のデバイス310と結合されるか、または他のデバイスと従来のデバイスを結合するように構成されたハードウェアモジュールであってよい。シーケンシングデバイス310自体は、アドオンモジュール370として操作することができる。シーケンシングデバイス310は、アドオンモジュール370の機能性を含む記憶命令のためのストレージメディア301も含むことができる。アドオンモジュール370もしくはその機能性は、解析ノード330、331、332、333、334もしくは335中で統合することができるか、またはアドオンモジュール370は、リモートネットワーク対応のシーケンサー310と通信するソフトウェアアダプターとして操作することができる。アドオンモジュール370、シーケンシングデバイス310および他のデバイスの他の構成が、統合デバイス、入れ子デバイス、統合機能性を備えたデバイス、または分離されたデバイスもしくは機能性としてであるかに関わらず、企図される。
アドオンモジュール370は好ましくは前処理を遂行して、さらなる解析のために生データを注釈する。生データの配列注釈は、解析システム300がどのくらいデータを解析しなければならないかを説明することを支援する。配列注釈は、多くの種類の注釈(解析ノードの所有権、データの所有権、生インプットデータ、事前解析および注釈された配列、出力、解析およびデータストリームのルーティング、ならびに他の因子等)を組み込むことができる。配列注釈は、生データと既存のゲノムデータベースまたは公共のゲノムデータベースとの間のラフなアライメントを提供して、予備的診断、予後または他の解析結果を得ることができる。例えば、配列注釈には、患者特異的なデータ、疾患または診断関係または関連データ(ゲノムにおける推定または実際の配列場所を同定するデータなどが含まれ得る。したがって、配列注釈はより大規模な予備的解析(生データがどのくらいより大きな解析内でフィットするかを注釈すること、優先度情報(例えば、どの遺伝子またはどのホットスポットを最初におよびどこで解析しなければならないか)、緊急度情報、または他の因子等)も提供することができる。例えば、アドオンモジュール370はシーケンシングデバイス310から配列データを受信し、配列データを事前解析することができる。事前解析器306は、XMLファイルストリーム内の配列データをパッケージングし、注釈を含むことができ、様々なルール、要求、またはXMLファイルストリーム内のタグとしての他の因子を知らせる。
アドオンモジュール370は、1つ以上の有線または無線の接続を経由して、解析システム300、解析エンジン240、シーケンシングデバイス310または解析ノード330、331、332、333、334もしくは335と所望されるように通信することができる。アドオンモジュール370は、有線接続または無線接続のすべての形態を利用して、解析エンジン240および解析ノード/設備330、331、332、333、334または335に接続することができる(携帯電話接続(例えばGSM(登録商標)、CDMAなど)WiMAX、WiGIG、Wi−Fi、Wi−Fi Directまたは他のタイプ無線インフラストラクチャーが含まれる)。アドオンモジュール370は、有線接続または無線接続のすべての形態を使用して、シーケンシングマシン310にも接続することができる(イーサネット、WiFi、WiGIG、USB、W−USB、ブルートゥース(登録商標)または接続の他のすべての形態等)。
アドオンモジュール370は、解析設備300またはシーケンシングデバイス310とモジュールが対話することを可能にする多数の追加のコンポーネントを含むことができる。例示的コンポーネントには、ライセンスマネージャー304、コントローラー303、メモリ305および事前解析器306が含まれる。生データがシーケンシングデバイス310から得られると、事前解析器306はデータを前処理して、1つ以上の事前解析された配列307を形成することができる。
コントローラー303はシーケンシングデバイス310と結合される。あるいは、コントローラー303はポート360を介してシーケンシングデバイス310と結合されてよい。コントローラー303は、シーケンシングデバイス310とアドオンモジュール370と解析システム300との間で、コマンド、命令、生データ、注釈、解析ストリームおよび他の情報が交換することができる、双方向データパスを提供する。コントローラー303は、解析システム300および解析設備/ノード330、331、332、333、334または335からコマンドをさらに受信して、シーケンシングデバイス310を制御することができる。
アドオンモジュール370は生データ(すなわちシーケンシングデバイス310から直接受信されたデータ)を得る事前解析器306も含み、事前解析を行って事前解析された配列307を提供することができる。事前解析は、シーケンシングデバイス310のメモリ301、アドオンモジュールのメモリ305、分散型解析ネットワークからのメモリ300、解析設備/ノード330、331、332、333、334もしくは335、公共のデータソース、または他のデータソース中の配列または他のゲノムデータに基づいて、配列注釈を生成することができる。アドオンモジュール370は事前解析された配列307を生成し、それには、生配列から導出された他のデータと共に配列注釈(予備的遺伝子同定(例えば名称または機能によって)、ゲノムホットスポット、ゲノム比較(例えば参照配列への、または以前の試験への)、患者vs集団の比較、生データを公共のゲノムデータベースまたは他のデータベースからのシーケンスされたゲノムデータおよび他のデータと比較するラフなアライメント等)が含まれ得る。他の注釈には、推定場所、疾患連関性、相対的存在量情報、遺伝子連関性、核酸のクラス、チェーン・オブ・カストディ、組織もしくは組織サンプルのソース、患者情報、患者識別子、人口統計の情報、地理情報、診断情報、ヘルスケア提供元情報、配列解析の意図、アカウント情報、家族情報、患者既往歴、心理学的情報、生殖細胞系または他のものも含まれ得る。
アドオンモジュール370は、解析システム300および解析設備/ノード330、331、332、333、334または335とシーケンシングデバイス310が通信することを可能にする。アドオンモジュール370は、さらなる処理のために、事前解析されたデータ307を解析設備/ノード330、331、332、333、334または335に転送し、事前解析されたデータ307を配列注釈307に基づいて設備/ノード330、331、332、333、334または335に転送することができる。例えば、アドオンモジュール370は、ルーチンまたは緊急のデータを、疾病対策センター(CDC)、研究施設、他の施設330、331、332、333、334または335に転送することができる。
アドオンモジュール370は、同じシーケンシングデバイス310内でのデータの処理または他の解析ノード/設備330、331、332、333、334もしくは335でのデータの処理を制御する配列注釈307を生成することもできる。これらの注釈は、処理パラメーター(ルーティングパラメーター、解析パラメーター、パスパラメーター、デスティネーションパラメーター、ソースパラメーター、優先度パラメーター、緊急度パラメーター、サービスパラメーターのクラス、ビリングパラメーター、支払いパラメーター、ライセンス制御パラメーター、運営処理パラメーター、または他の処理パラメーター等)を作成する。
ライセンスマネージャー304は、モジュール370が、解析システム300を介してアクセス可能な解析設備またはノード330、331、332、333、334もしくは335への操作上のアクセスを制御することを可能とする。ライセンスマネージャー304には、1つ以上のキー(例えば加入キー)が含まれ、それに加えて、認可または認証の異なる情報または方法が組み込まれ得る(加入識別子、可能な使用の数、ライセンス期限、サービスのタイプまたは解析のタイプについての許可レベル、可能なタイプのサービスまたは解析についてのインディケーター、解析アカウント、および解析管理モジュールを有すること等)。
ライセンスマネージャー304は権利管理実施モジュールとして操作することができる。一部の実施形態において、ライセンスマネージャー304は、ライセンスルールセットに従って、解析エンジン300に問い合わせて、シーケンシングデバイス310がアクセスサービスに十分な権利または特権を解析エンジン300によって提供するかを決定するように、構成またはプログラムされる。例えば、シーケンシングデバイス310は医師のオフィス内に配備することができる。医師は加入料金を払って、ゲノム解析エンジン300の1つ以上のサービスにアクセスすることができる。ライセンスマネージャー304は、医師の加入アカウントに問い合わせて、医師が納入済みであるかどうかを決定するか、または医師がアクセスするサービスのレベルを決定することができる。シーケンシングデバイス310が解析エンジン300にデータを供給すると、ライセンスマネージャー304は、医師の解析エンジン300との対話を適切に清算することができる。
ライセンスマネージャー305が、アカウントに関してシーケンシングデバイス310に関連する1つ以上のゲノム解析ストリームオブジェクトをモニターまたはそうでなければ管理できるということも、認識されるべきである。アカウントには、ケアの現場プロバイダーのアカウント、患者のアカウント、保険アカウント、または他のアカウントが含まれ得る。配列データがシーケンスデバイス310経由で生成されると、ライセンスマネージャー304は、解析エンジン300が適切にルーティングするかまたはそうでなければ解析を指令することを可能にする注釈として配列データにストリームオブジェクト識別子を添付することができる。
配列データの前処理ゲノム解析ストリーム
図4は、図3のアドオンモジュール370と併用することができるゲノムデータを前処理する方法400を図示し、図3からのアドオンモジュール370は前処理エンジンとして操作することができる。
方法400は、前処理エンジンにアクセスを提供することが含まれ得る工程410で開始することができる。例えば、前処理エンジンには、図3を参照して論じられるアドオンモジュール370のうちの1つ以上が含まれ得る。工程410は、サービスもしくはライセンスへの加入、アクセスのロック解除、ソフトウェアのインストール、アクセスの認証、アクセスの認可、または前処理エンジンにアクセスするための認証の他の形態の利用もユーザーに要求することができる。アクセスの提供は、アクションの広範囲のスペクトル(前処理エンジンを販売すること、前処理エンジンをインストールすること、前処理エンジンを従来のデバイスデザインに組込むこと、またはそうでなければ前処理エンジンを利用可能にすることが含まれる)をカバーできるということが、認識されるべきである。
工程420には、公知の解析関係情報を記憶する先験的知識ベースへのアクセスを提供することが含まれ得る。知識ベースには、公知の配列についての解析関係データまたは解析データの他の形態が含まれ得る。知識ベースは、図3中で示されるように解析設備300で設置することができ、公共のゲノムデータベース、研究所データベース、プロプライエタリなデータベース、ユーザー定義もしくは作成されたデータベース、または他の知識ベースである。データを前処理エンジンによって使用して、さらなる解析のために配列データを適切に注釈することができる。知識ベースは、図3中で示されるようにアドオンモジュール370のメモリ305中に存在することができるか、遠隔地のメモリ中で利用可能になり得るか、図3中で示されるように配列マシン310のメモリ301中に存在することができるか、加入するデータベースであってよいか、または任意の種類またはメモリの形態であってよい。
工程430で、前処理エンジンは、図3中で示されるようにシーケンシングデバイス310から典型的には直接生配列データを受信する。生配列データは、メモリ、バッファ、データベースまたは他のソースからのものであってよい。生データ配列データは、任意の形式(例えばAxt、BAM、BAMBAM、BED、MAF、マイクロアレイ、SAM、WIG、XMLまたは他の形式)であってよい。生配列データは、シーケンシングデバイスから受信されて完全解析の前に前処理されるデータを含むことができる。
前処理方法400には、任意の先験的知識ベースからの公知のゲノムマップに対する生データのラフなアライメントを実行して、配列注釈を生成する工程440も含まれ得る。生データのラフなアライメントは、染色体と比較した位置、染色体内の相対的位置、公知の対立遺伝子との連関性、公知のマーカーとの連関性、公知の突然変異との連関性、または先験的知識ベースもしくは経験的データコレクションからの任意の公知のパターンもしくは配列との連関性に基づいて、生データを大まかにアライメントさせることによって、ゲノムデータの処理および解析を促進する。
生データの前処理は、図3中で示されるように解析システム300を通して起こる解析と並列に起こり得る。既に事前解析されたデータストリームの一部は図3中で示されるように解析システム300を介する解析のために転送することができ、一方でデータストリームのより新しいセクションが前処理されている。この並列処理はシーケンサー出力に基づいてリアルタイムで行うことができる。
工程450には、生配列と配列注釈とを関連付けて前処理された配列データを生成することが含まれ得る。この工程には、前処理して生配列データのいくつかのレベルの内容を決定することが含まれる。配列注釈の生配列との関連性は、生配列データを適切に注釈するために、知識ベースからの情報に従う1つ以上のポリシーまたはルールに基づき得る。
配列注釈は、ゲノム内の位置(例えば特異的な染色体または染色分体上、染色体外など)、公知の疾患マーカー、突然変異(例えば点突然変異/移行/塩基転換、挿入、欠失、転座など)、診断コード、手順コード、ビリングコード、解析ルーティング情報、統計情報、患者情報、人口統計、地理的座標、チェーン・オブ・カストディおよびその他を含むことができる。配列注釈は、ヘルスケア提供元への推奨、処置推奨、予防処置もしくは治療処置のための推奨、推定診断、推測予後、解析優先順位、アラートトリガー、アラート通知、さらなる解析のための要求、より高いレベルの信頼のための要求、起こり得る転帰のリスト、要求もしくは随意の処置の経過、特定の条件に対するリスクまたは素因の徴候、または他の情報も含むことができる。
工程460には、さらなるより詳細な解析のために前処理された配列データを配列解析設備に転送することが含まれ得る。前処理された配列を転送するプロセスには、図3中で示されるように、注釈された前処理された配列データを解析設備330、331、332、333、334または335に送信することが含まれ得る。これらの前処理された配列は図3中で示されるように設備330、331、332、333、334または335に好ましくはプッシュされるが、前処理された配列を図3中で示されるように設備330、331、332、333、334または335によってプルすることができる。前処理された配列の伝達は、好適なプロトコル(HTTP、FTP、SSL、HTTPS、プロプライエタリ、XMLまたは他のもの等)経由であってよい。
対話型のゲノム解析ストリーム管理システム
図5は、解析設備500が1つ以上のシーケンシングデバイス(例えばシーケンシングデバイス510または511)と対話することができる本発明の主題のさらに別の態様を図示する。設備500はアダプター571またはアダプター572を経由してシーケンシングデバイスにアクセスまたは制御することができる。以前に言及されるように、図3中のアドオンモジュール370はアダプターに好適な候補である。アダプター571およびアダプター572は、それぞれ、シーケンシングデバイス510,511の外部に存在するものとして図示されるが、今度登場するシーケンシングデバイス510〜511にアダプターの役割または責任を統合または組み込むことができることも企図される。
図5中の企図された解析システムには、解析エンジン(例えばNLR590およびHPC 530、531、532、533、534または535)およびアダプター571または572が含まれる。上記のように、アダプター571,572または図3中で示されるようなアドオンモジュール300は、シーケンシングデバイス510に添付されたデバイスであってよいか、シーケンシングデバイス510または511内で統合することができるか、シーケンシングデバイス511自体であるか、またはNLR590および解析ノード530、531、532、533、534もしくは535上に構築される解析クラウド(おそらく500)の一部としてのアダプター572として利用可能もしくは操作することができる。他の実施形態において、アダプター571,572は、ポート561または562を介してシーケンシングデバイス510または511と通信することができる。アダプター571または572は、図示されるような標的のシーケンシングデバイスに依存して異なる形態をとることができるということが、認識されるべきである。
解析エンジン500は、図5中の解析システムを経由してゲノム配列の部分的または完全な解析を行うことができる。
アダプター571はシーケンシングデバイス510と結合し、デバイス510と解析設備530、531、532、533、534または535との間の、またはエコシステム500中の他の要素の中ででさえ、双方向通信を可能にする。アダプター571は、複数のシーケンシングデバイスが調整される様式で並列に操作することを可能にすることができる。
アダプター571または572は、コマンドまたは命令501を設備がシーケンシングマシン510または511に発行することを可能にすることもできる。一部の実施形態において、アダプター571または572は、命令501を、「設備」形式からシーケンシングデバイス510または511によって理解し得るコマンドに転換する。
アダプター571は、シーケンシングデバイス510の近くに、またはシーケンシングデバイス511から遠いアダプター572の場合はこれから遠くに設置することができる。図5はシーケンシングデバイス510または511あたり単一のアダプター571または572を図示するが、図5中のシステムは、1つのシーケンシングデバイスあたり複数のアダプター、1つのアダプターにつき複数のシーケンシングデバイス、または複数のシーケンシングデバイスと対話する複数のアダプターを有することもできる。例えば、シーケンシングデバイス510に近い1つのアダプター571は、認証のためのライセンスマネージャーを含むことができ、一方で遠いアダプター572はコマンド形式変換を提供する。
アダプター571または572は、コマンドおよび応答の発行を支配するように確立されたルールセットによる1つ以上のポリシーを含むことができる。アダプター571または572のためのルールセットは、タイミング問題、バッファ、キー、トークン、事前解析命令、コマンド、先験的知識ベース、および図5中のゲノム解析システムにおける他の要素を管理することができる。
各々のクラスのアダプターは、シーケンシングデバイスの異なる形またはモデルを標的とすることができる。さらに、シーケンシングデバイスの不均一な混合物は、複数のシーケンシングデバイスアダプターを経由して単一の共通コア解析エンジンにより動作できることが企図される。複数のシーケンシングデバイスアダプターは複数のシーケンシングデバイスを標的とするように構成されてよい。例えば、アダプター571は解析エンジン500によって理解される共通の正規化されたプロトコル形式に従って操作されるように構成されてよい。さらに、適合された571は、共通の正規化されたプロトコルからシーケンシングデバイス510によって消費することができるデバイス特異的プロトコルへ転換する1つ以上の転換モジュールを含むことができる。
シーケンシングデバイス510または511に発行することができる例示的な命令には、シーケンシングを反復する(例えば、ゲノム中の特異的な領域または全体的にシーケンシング深度を増加させる)か、中断するか、開始するか、または異なるデバイス中の同じ患者サンプルの平行なシーケンシングを調整する命令501が含まれる。命令501は、データを送信するか、データを削除するか、またはシーケンシングに優先順位を付ける命令でもあり得る。命令501は、データがシーケンシングのために転送または予定されるべきであるということを知らせることができる。命令501にはライセンス管理命令も含まれ得る。さらに、命令501は、多数の因子(患者データ、ヘルスケア提供元、疾患情報、または他の因子が含まれる)に基づいて導出され得る。
分散型ゲノムストレージ設備
図6は分散型ゲノムストレージ設備600の図を示す。一部の実施形態において、ゲノムレコードは、データベース680、681、682、683、684もしくは685または図示されるようにゲノム解析システム600における他の設備に関連付けられた解析ノード630、631、632、633、634または635に記憶される。National Center for Biotechnology Information(NCBI)、European Molecular Biology Laboratory−European Bioinformatics Institute(EMBL−EBI)、DNA Databank of Japan(DDBJ)、International Nucleotide Sequence Database Collaboration(INSDC)、NCBI Reference Sequence(RefSeq)、Vertebrate Genome Annotation Database(VEGA)、Consensus coding sequences(CCDS)、または他のリポジトリが含まれるが、これらに限定されない、複数のゲノミクスデータベースリポジトリがある。
データベース680、681、682、683、684または685に記憶されたレコードは、任意の所望の形式に従って記憶することができる。レコードはゲノム全体、ゲノムの部分、関心のある遺伝子または領域についての配列(例えば、公知のSNP、突然変異、または転座および重複が含まれるゲノム中の他の変化をカバーする)、メタデータ(例えば特異的な配列についての科学的および/または医学的な注釈)、解析結果、医師、統計の指図によるコメント、またはデータの他の部分であってよい。好ましくは、680、681、682、683、684または685に記憶されたレコードを患者の集団に関連させ、人口統計にわたる研究または解析を可能にする。
レコードデータベース680、681、682、683、684または685に記憶されたレコードは、ゲノムデータ間の差異的データ、患者と標準的なヒトとの間の差異的データ、患者と集団との間の差異的データを記憶することができる。参照因子または人口統計因子は、サンプル時間、組織、人、性別、家族、コミュニティー、人口統計、正規化された配列、疾患、食餌、環境、年齢、および他の人口統計因子に基づくことができる。最も好ましくは、かかる差異はBAMBAM形式および/または系統樹形式で表現される。
好ましい実施形態はゲノム検索エンジン630を含み、ユーザーがエンジン630にクエリーを発行することを可能にする。検索エンジン630は、レコードデータベース680、681、682、683、684または685の中でマッチするレコードを見出し、検索エンジン630を配列または他の因子によってインデックス付けし、レコード索引680に記憶することができる。分散型ゲノムデータベース600についての索引は、多くの識別子(患者識別子、集団識別子、人口統計、疾患、診断、性別、年齢、場所、職業、危険因子、配列、遺伝子、経路、対立遺伝子、予後、または他の識別子等)に基づき得る。
端末(コンピューター650等)経由のネットワーク690を介する、レコード索引640の検索エンジン630へのクエリーは、様々な形態をとることができる。それらは、自然言語クエリー、キーワード検索、配列検索、マシンコマンド、API、またはデータを問い合わせる他の形態であってよい。
解析ストリームk
これまでに提示された開示の発明の主題は、主にゲノム解析ストリーム管理に注目してきた。しかしながら、開示した大陸に広がる解析ストリーム管理システムは、ゲノム解析を超えるケアのより幅広い分野へ適用できるということが、認識されるべきである。開示の手法が、以前は組み合わせることが不可能だった解析エンゲージメントポイントの統合システムを効果的に構築することによって、既存の公知のゲノム解析を追い越すということが、認識されるべきである。
図7は、変換可能なヘルスケアを提供することができる包括的な学習システムを示す。解析ストリームは、エンゲージメントポイントの中で管理可能なコンピューターに基づくオブジェクトとしてエコシステムを介してフローする。例えば、データのヘルスケアストリームは、知識ドメインの要素(例えばモデル、人工知能など)からの解析データを搭載することができる。個人のヘルスケアストリームのインスタンスが作成され、生データ(例えばゲノム情報、バイオメトリクス、保険プランデータなど)が入れられると、対応するストリームオブジェクトは、対応する解析データ(例えば診断、予後、推奨、促進など)をオーバーレイまたは埋め込んだ1つ以上の適切な解析体へデータをルーティングすることができる。
次いで、個人のストリームは、個人(または場合によっては個人の生活も)を表す、組み立てられたヒトシグナルエンジン標本とみなすことができる。したがって、ストリームオブジェクトはデリバリードメインを介してストリームデータを送ることができ、ヘルスケア提供元ネットワーク、ケア設備、研究所、薬局、ホスピスまたは他の事業体へ個人のストリームデータを提供することができる。デリバードメイン中の各々の要素は個人のヘルスケアストリーム内のデータを増大させることもできるということが、認識されるべきである。
個人のヘルスケアストリームが、特異的なトピック(例えば特異的な疾患状態)に関してまたは包括的な生命に関して発展を経て成熟するにつれて、次いでストリームオブジェクトは、支払人ドメイン内のアウトカム駆動性設備へデータをルーティングすることができる。したがって、開示のストリーム管理エンジンは、関係データをストリーム解析の最終的な配置に関与する利害関係者に直接送ることができる。例えば、ストリームオブジェクトは、相対的ストリームデータを、雇用者、政府、金融機関、給付担当マネージャー、または他の事業体に提供することができる。
開示のエコシステムは、ゲノミクスを超えて、他のタイプのストリームデータを処理することができる。例えば、開示した解析エンジンは、推測プロテオミクス(Five3(商標)URL five3genomics.com/technologies/paradigmを参照)または実際の定量的プロテオミクス(OncoplexDx(商標)URL www.oncoplexdx.comを参照)も、解析ストリームに搭載することができる。なおさらに、かかるデータは、様々な癌タイプのために無数の臨床プロトコルを結合した1つ以上の臨床プロトコルデータベース(Eviti(商標)URL www.eviti.comを参照)と相関させるかまたは結び付けることができ、それは様々な疾患状態に悩まされる患者を治療する何千もの癌専門医とさらに組み合わされる。ストリーム解析ノード(例えばPARADIGM、Oncoplexなど)を実際の治療およびヘルスケア提供元と相関させることは、疾患状態が生じた後ではなく、生涯にわたる個人のための最適なケアの主要なインディケーターとして、より高い洞察を提供するということが、認識されるべきである。したがって、個人のヘルスケア解析ストリームは生まれる時に開始し、子孫とまとめることを介して死亡後にもおそらく存在し得る。非常に実際的な意味において、開示したエコシステムは、「生涯にわたるケア」、またはより特に癌に関してはストリームに基づく「生涯にわたる癌ケア」を生み出すと判断することができる。
人の生涯は、ストリームデータを解析ノードから解析ノードへ向けた、ゆりかごから墓場までのストリームオブジェクトとして表わすことができるとういう考え方において、開示したシステムは生涯にわたってその人に関して総体として学習する(すなわち、相関性を確立するかまたは解明を同定する)ということが、認識されるべきである。したがって、システムは現在の疾患状態の範囲を超えて学習することができる。人の疾患状態(過去、現在または未来)は、健康な状態の画像化(URL www.qiimaging.comでQi Imaging(商標)を参照)が含まれるか、または「ビッグデータ」に関するアウトカムレベル(場合によってはnet.orange(商標)を参照、URL www.ndorange.comを参照)が含まれる他の情報とも相関させることができる。なおさらに、ストリームオブジェクトが同時期の家族メンバーの中で、または世代にわたって相互相関される場合、ストリームオブジェクトは、家族マネージャーの世代にわたって記憶することができる。かかる実施形態において、解析ストリームはエピジェネティックレベルでの洞察を提供する。
図7中で図示されるすべての動的要素の中での統合は、1つ以上の解析ストリームオブジェクトの生涯のスパンにわたってエピジェネティック効果を評価する能力を生じさせるということが、認識されるべきである。例えば、リアルタイムの処置プロトコルは、子孫に連関する解析ストリームに加えて、現在の解析ストリームに関する処置の正、負または中立の効果と相関させることができる。一部の実施形態において、解析ストリームオブジェクトは、エピジェネティックストリームオブジェクトまたは世代を超えたエピジェネティックストリームオブジェクトと判断することができる。
開示した、学習に基づく生涯にわたるケアまたは生涯にわたる癌ケアの解析ストリームは、より特異的な情報(特異的なゲノム情報が含まれる)に関して得られたデータによってさらに増大され得る。一部の実施形態において、シーケンシングデバイスは、二重微小染色体、マイクロRNA、循環腫瘍細胞に関連するゲノム情報、または他の情報を表わす配列データにより解析ストリームを増大することができる。かかるデータは1つ以上の解析ストリーム、特にエピジェネティックストリームにわたって相関させることもできる。
解析ストリームは、バイオメトリクスデータ(1つ以上の解析ストリームに統合されるバイタルサインモニタリングデータが含まれる)も活用することができる。人が1つ以上のヘルスケア提供元(例えば医院、病院、救急車など)と連動されると、ヘルスケア提供元は、多くの場合データの1つ以上のポイントを収集する。従来は、収集されたすべてのデータのうちの99%以上は廃棄される。開示したエコシステムにおいて、すべてのデータはその人のヘルスケア解析ストリームに保存または統合することができる。例えば、患者のバイタルサインデータはiSirona(商標)DeviceConX(商標)技術経由で収集することができ、次いでそれは電子カルテ交換を介して送ることができる。さらに、バイタルサインデータは解析ストリームオブジェクトへ結合するかまたはその内で統合することができる。したがって、リアルタイムバイタルサインデータは他のストリーム関連データと相関させることができる(例えばマルチバリアント解析、因子分析、推論など)。例えば、リアルタイムのパルス酸素濃度計データは、1つ以上のエピジェネティックストリームオブジェクトにわたってゲノムデータと相関させることができる。
本発明の主題のさらに別の態様には、ストリームオブジェクト内のストリームの管理から導出された解析データに基づくソーシャルネットワークの形成が含まれると判断される。1つ以上のストリームオブジェクトと連関したストリームが解析ノードを介して通過すると、ストリームオブジェクトは解析プロファイルにより注釈することができ、そこで解析プロファイルは、ストリームオブジェクトストリームと連関した可能なヘルスケアコンテキストを表わすと判断することができる。次いで、解析エンジンは、エンドユーザー(例えば患者、利害関係者、ヘルスケア提供元、サービス提供元、支払人など)への推奨を提供して、類似のプロファイルに基づいて、互いの中で、ソーシャルネットワークを連結するかまたはインスタンスを作成する。例として、患者の群がBRCA突然変異を有する類似のゲノムプロファイル(おそらく類似の表現型のプロファイルを有する)に関連付けられた場合のシナリオを考慮されたい。解明に応答して、ソーシャルネットワークエンジンとして操作する解析エンジンは、患者または他の利害関係者に利用可能なソーシャルネットワークのインスタンスを作成することができ、それを介して利害関係者は通信するかまたはエクスペリエンスを共有することができる。ソーシャルネットワークは、おそらく分子的フィンガープリント法の本質に依存して、共通ネットワーク、または個々のスタンドアロンのネットワークとしてインスタンスを作成することができる。したがって、ストリーム基づいてインスタンスを作成したソーシャルネットワークは、公共に開放するか、特異的なゲノムプロファイルを示す個人へのみ開放するか、または特異的なゲノムプロファイルを有する特異的な患者と連関した利害関係者のみに限定される。ソーシャルネットワークは、患者の間の相互サポート、ケア提供元の間での知識シェア、利害関係者の間でのエビデンスベースケアの中での調整されたデリバリー、決断のサポート、ホームケアの統合、ホスピスのサポート、または利害関係者の間での他のタイプの連続的な情報交換を提供できるということが、認識されるべきである。
上記のソーシャルネットワーク例はヘルスケア環境に基づくソーシャルネットワークについて記載したが、ソーシャルネットワークは、他のアクティビティ(解析プロファイル情報に基づく情報または解析プロファイル情報の関数としての情報の共有が含まれる)もサポートできるということが、認識されるべきである。例えば、人の好き嫌いをゲノム特性と相関させることができ、類似の特性を有する他の人と推奨として共有することができる。参加者の「総体的な(omic)」(例えば、ゲノム、プロテオーム、経路などの)情報が解析され、音楽または他のコンテンツに対する彼らの好き嫌いの指標が提供される、ゲノムに基づくソーシャルネットワークを考慮されたい。開示の解析エンジンは、ゲノム特性と音楽属性の中の相関性を確立することを試みることができる。次いで、エンジンは、彼らの特性に基づいて他の参加者への音楽の推奨を提供することができる。さらに別の例には、ゲノム特性に基づいて人々をマッチングさせることが含まれ得る。例えば、人々は、相補的な特性、類似の特性または他の特性に基づいて、ともにマッチングさせることができる。ソーシャルネットワークは、ヘルスケア、音楽およびマッチングを参照するが、ソーシャルネットワークはかかる市場を超えて広がることができるということが、認識されるべきである。例示的な追加のゲノムに基づくソーシャルネットワークには、ゲームネットワーク、ショッピングネットワーク、芸能もしくは娯楽ネットワーク(例えばワイン試飲会、映画クラブなど)、教育もしくは学術ネットワーク(例えば、個人指導、勉強グループなど)、趣味ネットワーク、または他のタイプのネットワークが含まれ得る。
本出願人は、参照された事業体または技術との既存の提携関係または協力関係を介して、および上で検討した実験的なセットアップによって証明されるように、上記のシステム解析管理をデリバーする、独特の能力を有することが認識されるべきである。さらに、2013年7月2日に出願された譲受人共通の米国仮出願第61/842316号、第61/842323号および第61/842325号は、ヘルスケア解析ストリームを介して統一ヘルスケア管理の様々な態様を記載する。例えば、第61/842323号は、人の生涯にわたるヘルスケア解析ストリームデータの視覚的提示を表わすエネルギーバランスを開示する。エネルギーバランスは花として提示され、そこで花の各々の花弁は1つ以上のストリームオブジェクトメトリクスに対応する。例示的メトリクスは、活動レベル、睡眠、栄養、運動、カロリー、病原体への曝露のリスク、または人の対応するストリームオブジェクトに関連する他のストリームデータを表わすことができる。サイズ、色、形状、または他の花弁属性は、対応するメトリクスの態様を表わすことができる。緑色はメトリクス許容可能な範囲中であることを知らせ、一方で赤色は、メトリクスが許容可能ではないということを知らせることができる。
追加の考慮
以下の表は請求項の観点から上記の発明の主題を示す。表1は、シーケンシングデバイスが分散型ゲノム解析システムと通信することを可能にするように構成またはプログラムされたアドオンモジュールに結合されたシーケンスデバイスを含むシーケンシングシステムに関する請求項を含む。
Figure 0006846459
Figure 0006846459
表1:アドオンモジュールを備えたシーケンシングシステム
表2は、生配列データを前処理し、前処理されたデータをゲノム解析設備に転送できる方法を略述する。
Figure 0006846459
表2:配列データの前処理
表3は、ゲノム解析エンジンは双方向交換を介してシーケンシングデバイスと対話式に動作して、ゲノム解析ストリームを管理することができる、配列解析システムを示す。シーケンシングデバイスは1つ以上のアダプターを活用することができる。
Figure 0006846459
表3:解析エンジンおよびシーケンシングデバイスの中での対話型シーケンシング
表4は、分散型データおよびゲノム検索エンジンを有するゲノムストレージ設備を示す。上記のように、(1)集中化されたデータセンターに設置された処理コンピューターおよびストレージコンピューターに大きなゲノムデータを迅速に伝送する能力、(2)患者の癌組織のDNA中で見出されるすべての変動を正確に評価する能力、(3)不均一な疾患(癌等)において多くのクローンを同定する能力、および(4)細胞シグナル経路上の各クローンの各変動の全身性影響を予測するの能力を妨害する複数の問題がある。開示した分散型システムは、実行可能な情報を導出する大規模なスケーリングを提供する。さらに、本出願人は、4つの障害をすべて克服する能力および適切な時間での適切な患者のための適切な治療を予測する能力の実証に成功した。高速の大陸レベルでの広がりの実証として、本出願人の実験は、700マイルのトランスポート、処理、および1人の患者あたり69時間または82秒で6,000エクソームの突然変異解析をもたらした。トランスポートは、National LambdaRail(米国一帯の病院、クリニックおよび大学にわたって、帯域幅クラッシングデータを迅速に確実に伝送することに優れている、12,000マイルの光ファイバーネットワーク)によって促進された。
Figure 0006846459
表4:分散型ゲノムストレージ設備
本明細書における発明概念から逸脱することなく、上記したものの他にさらに多くの修飾が可能であることは、当業者に明らかであるべきである。したがって、本発明の主題は添付の請求項の範囲以外では限定することができない。さらに、明細書および請求項の両方の解釈において、すべての用語は、文脈と矛盾しないで可能な限り広範囲の様式で解釈されるべきである。特に、「含む」および「含むこと」という用語は、非独占的な様式で要素、構成要素または工程を指すと解釈されるべきであり、参照された要素、構成要素または工程は、明示的に参照されない他の要素、構成要素または工程と共に存在または利用または組み合わせることができることを示す。明細書請求項がA、B、C....およびNからなる群から選択されるもののうちの少なくとも1つを指す場合、この文言は、A+NまたはB+Nなどではなく、群から1要素のみを要求すると解釈されるべきである。
本願は以下の発明をも包含する。
(1)
複数のシーケンシングデバイスから、複数の患者の配列データを取得するように構成されたシーケンシングデバイスインターフェースと、
解析ネットワークと、
シーケンシングデバイスインターフェースに結合されたゲノム解析エンジンを形成する解析ネットワークを経由して相互接続され、患者からの配列データをゲノムデータに並列に処理するように構成された複数の解析ノードと
を含む、ゲノム解析システム。
(2)
前記解析エンジンが、少なくとも10人の患者からの配列データを並列に処理するように構成される、(1)に記載のシステム。
(3)
前記解析エンジンが、少なくとも100人の患者からの配列データを並列に処理するように構成される、(2)に記載のシステム。
(4)
前記解析エンジンが、少なくともYの時間単位あたりX人の患者の速度で配列データをゲノムデータに処理するように構成され、Xが少なくとも3人であり、Yが多くとも1日である、(1)に記載のシステム。
(5)
Xが10人であり、Yが1日である、(4)に記載のシステム。
(6)
Xが10人であり、Yが1時間である、(4)に記載のシステム。
(7)
Xが100人であり、Yが1日である、(4)に記載のシステム。
(8)
Xが100人であり、Yが1時間である、(4)に記載のシステム。
(9)
前記解析ネットワークが光ファイバーデータリンクを含む、(1)に記載のシステム。
(10)
前記解析ネットワークが大陸に広がるネットワークを含む、(9)に記載のシステム。
(11)
前記シーケンシングデバイスインターフェースが、少なくとも5台のシーケンシングデバイスから並列に前記配列データを得るように構成される、(1)に記載のシステム。
(12)
前記シーケンシングデバイスインターフェースが、少なくとも10台のシーケンシングデバイスから並列に前記配列データを得るように構成される、(11)に記載のシステム。
(13)
前記シーケンシングデバイスインターフェースが、少なくとも100台のシーケンシングデバイスから並列に前記配列データを得るように構成される、(1)に記載のシステム。
(14)
前記ゲノムデータが患者のゲノムデータを個別に含む、(1)に記載のシステム。
(15)
前記ゲノムデータが患者の人口統計と関連付けたゲノムデータを含む、(1)に記載のシステム。
(16)
前記解析エンジンが、前記ゲノムデータの関数として通知を生成するように構成される、(1)に記載のシステム。
(17)
前記通知が、処理ステータス、解析エンジン管理ステータス、アラート、アラーム、シーケンシングデバイス命令、解析推奨、予後、診断およびノード間通信のうちの少なくとも1つを含む、(16)に記載のシステム。
(18)
前記通知が、シーケンスされたデータに関してより高い信頼レベルを得ることを求める要求を含む、(16)に記載のシステム。
(19)
前記通知が解析ネットワーク内のルートを構成する、(16)に記載のシステム。
(20)
前記ルートが、ケアの現場、シーケンシングデバイス、患者およびヘルスケアサービス提供元のうちの少なくとも1つに通知が送信されることを可能にする、(19)に記載のシステム。
(21)
前記解析エンジンが、前記解析ノードの中の処理ルートを確立し、それに従って、前記シーケンスされたデータおよびゲノムデータのうちの少なくとも1つがルーティングされるように構成されることを特徴とする(1)に記載のシステム。
(22)
前記処理ルートが予想される診断の関数として確立される、(21)に記載のシステム。
(23)
前記処理ルートが優先度の関数として確立される、(21)に記載のシステム。
(24)
前記処理ルートが緊急度の関数として確立される、(21)に記載のシステム。
(25)
前記処理ルートが、前記シーケンスされたデータおよびゲノムデータのうちの少なくとも1つ内の配列注釈の関数として確立される、(21)に記載のシステム。
(26)
前記処理ルートが、トラフィック負荷、解析負荷、演算帯域幅およびメモリ制約のうちの少なくともの1つの関数として確立される、(21)に記載のシステム。
(27)
前記解析ノードが、前記配列データおよび前記ゲノムデータのうちのいくつかを少なくとも交換するように構成される、(1)に記載のシステム。
(28)
前記解析エンジンを管理するように構成されたエンジン管理ノードをさらに含む、(1)に記載のシステム。
(29)
前記エンジン管理ノードが、解析ステータスをユーザーに送信するように構成される、(28)に記載のシステム。
(30)
前記エンジン管理ノードが、解析ダッシュボードを生成するように構成される、(28)に記載のシステム。
(31)
前記エンジン管理ノードが、解析エンジンダッシュボードを生成するように構成される、(28)に記載のシステム。
(32)
前記解析ノードがネットワークスイッチを含む、(1)に記載のシステム。
(33)
前記解析ノードが高性能計算設備を含む、(1)に記載のシステム。
(34)
前記解析ノードが少なくとも5台の高性能計算設備を含む、(33)に記載のシステム。
(35)
前記解析エンジンが、前記配列データを処理して、正規化されたゲノム配列の関数として前記ゲノムデータを生成する、(1)に記載のシステム。
(36)
前記正規化されたゲノム配列が患者の集団からの統計的なコンパイルを含む、(35)に記載のシステム。
(37)
前記ゲノムデータが、前記正規化されたゲノム配列に対して、ホットスポット、重み付き参照点、および解析のための優先順位のうちの少なくとも1つを含む、(35)に記載のシステム。
(38)
少なくとも1つの解析ストリームオブジェクトに関する少なくとも1つのストリーム管理機能性に従って、前記解析エンジンを管理するように構成されたゲノムストリーム管理ノードをさらに含む、(1)に記載のシステム。
(39)
前記解析ストリームオブジェクトの各々が、前記ゲノムデータへの処理を介して、前記配列データの解析データストリームを含む、(38)に記載のシステム。
(40)
前記解析データストリームが、シーケンシングデバイスからシーケンシングデバイスインターフェースおよび解析エンジンを介して、出力デバイスに延びる、(39)に記載のシステム。
(41)
前記解析ストリームオブジェクトが、前記配列データに適用される少なくとも1つの解析ルートを含む、(38)に記載のシステム。
(42)
前記少なくとも1つのストリーム管理機能性が、解析ルートの変更、ストリームオブジェクトに従う解析ストリームのインスタンス生成、解析ストリームオブジェクトに基づくトランザクションの実行、解析の改変、解析ストリームオブジェクトに基づく通知トリガー基準の構築、および解析ストリームの脱構築のうちの1つを含む、(38)に記載のシステム。
(43)
ユーザーが前記シーケンシングデバイスインターフェースを経由して前記シーケンシングデバイスにフィードバックを提供することを可能にするように構成された管理インターフェースをさらに含む、(1)に記載のシステム。
(44)
前記フィードバックがシーケンシングデバイス命令を含む、(43)に記載のシステム。
(45)
前記シーケンシングデバイス命令が、標的の配列領域のシーケンスを反復すること、シーケンシングを中断すること、シーケンスを開始すること、充分なトリガーでデータを送信すること、シーケンシングデバイスから配列データを削除すること、管理命令にライセンスを与えること、配列イベントに優先順位を付けること、配列データの命令を転送すること、およびシーケンスのスケジューリングを行うことのうちの少なくとも1つを含む、(44)に記載のシステム。
(46)
前記ユーザーが、解析ノード、ヘルスケア提供元、研究者、シーケンシングデバイスマネージャー、解析システムマネージャー、および患者のうちの少なくとも1つを含む、(43)に記載のシステム。
(47)
前記シーケンシングデバイスインターフェースが、配列データを表わす画像データに適用された画像認識アルゴリズムを介して、配列データを取得するように構成される、(1)に記載のシステム。
(48)
前記画像認識アルゴリズムがスケール不変特徴変換の関数として操作される、(47)に記載のシステム。
(49)
前記シーケンシングデバイスが、連続時間符号化振幅顕微鏡法(STEAM)を経由して前記画像データをDNA塩基に翻訳するようにさらに構成される、(47)に記載のシステム。
(50)
前記解析エンジンが、配列データを表わす画像データに適用された画像認識アルゴリズムを介して、配列データを取得するように構成される、(1)に記載のシステム。
(51)
前記画像認識アルゴリズムがスケール不変特徴変換の関数として操作される、(50)に記載のシステム。
(52)
前記解析エンジンが、連続時間符号化振幅顕微鏡法(STEAM)を経由して前記画像データをDNA塩基に翻訳するようにさらに構成される、(50)に記載のシステム。

Claims (24)

  1. 複数のシーケンシングデバイスから、複数の患者の配列データを取得するように構成されたシーケンシングデバイスインターフェースと、
    解析ネットワークと、
    前記シーケンシングデバイスインターフェースに結合された、患者特異的な解析ネットワークトポロジーを有するゲノム解析エンジンを形成する前記解析ネットワークを経由して相互接続され、前記複数の患者からの前記配列データを、前記患者特異的な解析ネットワークトポロジーの処理経路にしたがって、患者特異的なゲノムデータに並列に処理するように構成された複数の解析計算ノードと
    を含む、ゲノム解析システム。
  2. 前記解析エンジンが、少なくとも10人の患者からの配列データを並列に処理するように構成される、請求項1に記載のシステム。
  3. 前記解析エンジンが、少なくともYの時間単位あたりX人の患者の速度で配列データを前記ゲノムデータに処理するように構成され、Xが少なくとも3であり、Yが多くとも1日である、請求項1に記載のシステム。
  4. 前記解析エンジンが、少なくともYの時間単位あたりX人の患者の速度で配列データを前記ゲノムデータに処理するように構成され、Xが10であり、Yが多くとも1時間である、請求項1に記載のシステム。
  5. 前記解析ネットワークが光ファイバーデータリンクを含む、請求項1に記載のシステム。
  6. 前記解析ネットワークが、相互接続された前記複数の解析計算ノードが地理的に分散されたネットワークを含む、請求項5に記載のシステム。
  7. 前記シーケンシングデバイスインターフェースが、少なくとも100台のシーケンシングデバイスから並列に前記配列データを得るように構成される、請求項1に記載のシステム。
  8. 前記ゲノムデータが前記複数の患者の人口統計と関連付けたゲノムデータを含む、請求項1に記載のシステム。
  9. 前記解析エンジンが、前記ゲノムデータの関数として通知を生成するように構成され、前記通知が、処理ステータス、解析エンジン管理ステータス、アラート、アラーム、シーケンシングデバイス命令、解析推奨、予後、診断およびノード間通信のうちの少なくとも1つを含む、請求項1に記載のシステム。
  10. 前記解析エンジンが、前記ゲノムデータの関数として通知を生成するように構成され、前記通知が、前記解析ネットワーク内のルートを構成し、前記ルートが、ケアの現場、シーケンシングデバイス、患者およびヘルスケアサービス提供元のうちの少なくとも1つに通知が送信されることを可能にする、請求項1に記載のシステム。
  11. 前記解析エンジンを管理するように構成されたエンジン管理ノードをさらに含む、請求項1に記載のシステム。
  12. 前記エンジン管理ノードが、解析ステータスをユーザーに送信するように構成される、請求項11に記載のシステム。
  13. 前記エンジン管理ノードが、解析ダッシュボードを生成するように構成される、請求項11に記載のシステム。
  14. 前記解析計算ノードがネットワークスイッチを含む、請求項1に記載のシステム。
  15. 少なくとも1つの解析ストリームオブジェクトに関する少なくとも1つのストリーム管理機能性に従って、前記解析エンジンを管理するように構成されたゲノムストリーム管理ノードをさらに含み、
    前記解析ストリームオブジェクトの各々が、前記ゲノムデータへの処理を介して、前記配列データの解析データストリームを含む、請求項1に記載のシステム。
  16. 前記解析データストリームが、シーケンシングデバイスから前記シーケンシングデバイスインターフェースおよび前記解析エンジンを介して、出力デバイスに延びる、請求項15に記載のシステム。
  17. 少なくとも1つの解析ストリームオブジェクトに関する少なくとも1つのストリーム管理機能性に従って、前記解析エンジンを管理するように構成されたゲノムストリーム管理ノードをさらに含み、
    前記解析ストリームオブジェクトが、前記配列データに適用される少なくとも1つの解析ルートを含む、請求項1に記載のシステム。
  18. 少なくとも1つの解析ストリームオブジェクトに関する少なくとも1つのストリーム管理機能性に従って、前記解析エンジンを管理するように構成されたゲノムストリーム管理ノードをさらに含み、
    前記少なくとも1つのストリーム管理機能性が、解析ルートの変更、ストリームオブジェクトに従う解析ストリームのインスタンス生成、前記解析ストリームオブジェクトに基づくトランザクションの実行、解析の改変、前記解析ストリームオブジェクトに基づく通知トリガー基準の構築、および解析ストリームの脱構築のうちの1つを含む、請求項1に記載のシステム。
  19. 前記シーケンシングデバイスインターフェースが、配列データを表わす画像データに適用された画像認識アルゴリズムを介して、前記配列データを取得するように構成され、
    前記画像認識アルゴリズムがスケール不変特徴変換の関数として操作される、請求項1に記載のシステム。
  20. 前記シーケンシングデバイスインターフェースが、配列データを表わす画像データに適用された画像認識アルゴリズムを介して、前記配列データを取得するように構成され、
    前記シーケンシングデバイスが、連続時間符号化振幅顕微鏡法(STEAM)を経由して前記画像データをDNA塩基に翻訳するようにさらに構成される、請求項1に記載のシステム。
  21. 前記解析エンジンが、配列データを表わす画像データに適用された画像認識アルゴリズムを介して、前記配列データを取得するように構成され、
    前記画像認識アルゴリズムがスケール不変特徴変換の関数として操作される、請求項1に記載のシステム。
  22. 前記解析エンジンが、配列データを表わす画像データに適用された画像認識アルゴリズムを介して、前記配列データを取得するように構成され、
    前記解析エンジンが、連続時間符号化振幅顕微鏡法(STEAM)を経由して前記画像データをDNA塩基に翻訳するようにさらに構成される、請求項1に記載のシステム。
  23. シーケンシングデバイスインターフェースに結合された、患者特異的な解析ネットワークトポロジーを有するゲノム解析エンジンを形成する解析ネットワークを経由して、複数の解析計算ノードと相互接続され、複数の患者からの配列データを、前記患者特異的な解析ネットワークトポロジーの処理経路にしたがって、患者特異的なゲノムデータに並列に処理するように構成された解析計算ノードを含む、ゲノム解析装置。
  24. 複数のシーケンシングデバイスから、複数の患者に対応する配列データを受信することと、
    複数の解析計算ノードを有し、ゲノム解析エンジンの患者特異的な解析ネットワークトポロジーを形成する解析ネットワークを構築することと、を含み、
    前記ゲノム解析エンジンは、前記患者からの前記配列データを、前記患者特異的な解析ネットワークトポロジーの処理経路にしたがって、患者特異的なゲノムデータに並列に処理する、ゲノム解析方法。
JP2019088988A 2012-07-06 2019-05-09 ヘルスケア解析ストリーム管理 Active JP6846459B2 (ja)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US201261668941P 2012-07-06 2012-07-06
US61/668,941 2012-07-06
US201261673943P 2012-07-20 2012-07-20
US61/673,943 2012-07-20
US201361842323P 2013-07-02 2013-07-02
US201361842325P 2013-07-02 2013-07-02
US201361842316P 2013-07-02 2013-07-02
US61/842,325 2013-07-02
US61/842,316 2013-07-02
US61/842,323 2013-07-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017251135A Division JP6527222B2 (ja) 2012-07-06 2017-12-27 ヘルスケア解析ストリーム管理

Publications (2)

Publication Number Publication Date
JP2019149196A JP2019149196A (ja) 2019-09-05
JP6846459B2 true JP6846459B2 (ja) 2021-03-24

Family

ID=49879307

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015520695A Active JP6471091B2 (ja) 2012-07-06 2013-07-03 ヘルスケア解析ストリーム管理
JP2017251135A Active JP6527222B2 (ja) 2012-07-06 2017-12-27 ヘルスケア解析ストリーム管理
JP2019088988A Active JP6846459B2 (ja) 2012-07-06 2019-05-09 ヘルスケア解析ストリーム管理

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015520695A Active JP6471091B2 (ja) 2012-07-06 2013-07-03 ヘルスケア解析ストリーム管理
JP2017251135A Active JP6527222B2 (ja) 2012-07-06 2017-12-27 ヘルスケア解析ストリーム管理

Country Status (9)

Country Link
US (5) US9953137B2 (ja)
EP (1) EP2870581B1 (ja)
JP (3) JP6471091B2 (ja)
KR (1) KR102197428B1 (ja)
CN (2) CN110491449B (ja)
AU (2) AU2013286622B2 (ja)
CA (1) CA2878455C (ja)
IN (1) IN2015MN00089A (ja)
WO (1) WO2014008434A2 (ja)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9215423B2 (en) 2009-03-30 2015-12-15 Time Warner Cable Enterprises Llc Recommendation engine apparatus and methods
US11076189B2 (en) 2009-03-30 2021-07-27 Time Warner Cable Enterprises Llc Personal media channel apparatus and methods
US8813124B2 (en) 2009-07-15 2014-08-19 Time Warner Cable Enterprises Llc Methods and apparatus for targeted secondary content insertion
US8701138B2 (en) 2010-04-23 2014-04-15 Time Warner Cable Enterprises Llc Zone control methods and apparatus
US20130227283A1 (en) 2012-02-23 2013-08-29 Louis Williamson Apparatus and methods for providing content to an ip-enabled device in a content distribution network
US9426123B2 (en) 2012-02-23 2016-08-23 Time Warner Cable Enterprises Llc Apparatus and methods for content distribution to packet-enabled devices via a network bridge
US8838149B2 (en) 2012-04-02 2014-09-16 Time Warner Cable Enterprises Llc Apparatus and methods for ensuring delivery of geographically relevant content
US9467723B2 (en) 2012-04-04 2016-10-11 Time Warner Cable Enterprises Llc Apparatus and methods for automated highlight reel creation in a content delivery network
US9444880B2 (en) * 2012-04-11 2016-09-13 Illumina, Inc. Cloud computing environment for biological data
WO2014008434A2 (en) 2012-07-06 2014-01-09 Nant Holdings Ip, Llc Healthcare analysis stream management
US10425355B1 (en) * 2013-02-04 2019-09-24 HCA Holdings, Inc. Data stream processing for dynamic resource scheduling
US11985075B1 (en) 2013-02-04 2024-05-14 C/Hca, Inc. Data stream processing for dynamic resource scheduling
US10114925B2 (en) * 2013-07-26 2018-10-30 Nant Holdings Ip, Llc Discovery routing systems and engines
US9594777B1 (en) * 2013-08-15 2017-03-14 Pivotal Software, Inc. In-database single-nucleotide genetic variant analysis
EP2854059A3 (en) * 2013-09-27 2015-07-29 Orbicule BVBA Method for storage and communication of personal genomic or medical information
US10114851B2 (en) 2014-01-24 2018-10-30 Sachet Ashok Shukla Systems and methods for verifiable, private, and secure omic analysis
CN106462337B (zh) * 2014-02-13 2019-11-01 Illumina公司 综合式消费者基因组服务
US10380645B2 (en) * 2014-03-07 2019-08-13 DO-THEDOC Inc. System for securely transmitting medical records and for providing a sponsorship opportunity
AU2015311866B2 (en) 2014-09-03 2018-06-07 Nant Holdings Ip, Llc Synthetic genomic variant-based secure transaction devices, systems and methods
US10116676B2 (en) 2015-02-13 2018-10-30 Time Warner Cable Enterprises Llc Apparatus and methods for data collection, analysis and service modification based on online activity
WO2016134258A1 (en) * 2015-02-20 2016-08-25 Ibis Biosciences, Inc. SYSTEMS AND METHODS FOR IDENTIFICATION AND USE OF SMALL RNAs
US10541938B1 (en) 2015-04-06 2020-01-21 EMC IP Holding Company LLC Integration of distributed data processing platform with one or more distinct supporting platforms
US10812341B1 (en) 2015-04-06 2020-10-20 EMC IP Holding Company LLC Scalable recursive computation across distributed data processing nodes
US10776404B2 (en) 2015-04-06 2020-09-15 EMC IP Holding Company LLC Scalable distributed computations utilizing multiple distinct computational frameworks
US10348810B1 (en) 2015-04-06 2019-07-09 EMC IP Holding Company LLC Scalable distributed computations utilizing multiple distinct clouds
US10404787B1 (en) 2015-04-06 2019-09-03 EMC IP Holding Company LLC Scalable distributed data streaming computations across multiple data processing clusters
US10331380B1 (en) 2015-04-06 2019-06-25 EMC IP Holding Company LLC Scalable distributed in-memory computation utilizing batch mode extensions
US10122806B1 (en) 2015-04-06 2018-11-06 EMC IP Holding Company LLC Distributed analytics platform
US10505863B1 (en) 2015-04-06 2019-12-10 EMC IP Holding Company LLC Multi-framework distributed computation
US10366111B1 (en) 2015-04-06 2019-07-30 EMC IP Holding Company LLC Scalable distributed computations utilizing multiple distinct computational frameworks
US10791063B1 (en) 2015-04-06 2020-09-29 EMC IP Holding Company LLC Scalable edge computing using devices with limited resources
US10511659B1 (en) 2015-04-06 2019-12-17 EMC IP Holding Company LLC Global benchmarking and statistical analysis at scale
US10528875B1 (en) 2015-04-06 2020-01-07 EMC IP Holding Company LLC Methods and apparatus implementing data model for disease monitoring, characterization and investigation
US10509684B2 (en) 2015-04-06 2019-12-17 EMC IP Holding Company LLC Blockchain integration for scalable distributed computations
US10706970B1 (en) 2015-04-06 2020-07-07 EMC IP Holding Company LLC Distributed data analytics
US10496926B2 (en) 2015-04-06 2019-12-03 EMC IP Holding Company LLC Analytics platform for scalable distributed computations
US10515097B2 (en) 2015-04-06 2019-12-24 EMC IP Holding Company LLC Analytics platform for scalable distributed computations
US10860622B1 (en) 2015-04-06 2020-12-08 EMC IP Holding Company LLC Scalable recursive computation for pattern identification across distributed data processing nodes
US10425350B1 (en) 2015-04-06 2019-09-24 EMC IP Holding Company LLC Distributed catalog service for data processing platform
US10277668B1 (en) * 2015-04-06 2019-04-30 EMC IP Holding Company LLC Beacon-based distributed data processing platform
US10541936B1 (en) 2015-04-06 2020-01-21 EMC IP Holding Company LLC Method and system for distributed analysis
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
US10656861B1 (en) 2015-12-29 2020-05-19 EMC IP Holding Company LLC Scalable distributed in-memory computation
US9984454B2 (en) * 2016-04-22 2018-05-29 Kla-Tencor Corporation System, method and computer program product for correcting a difference image generated from a comparison of target and reference dies
TW201803598A (zh) 2016-06-30 2018-02-01 南特細胞公司 Nant癌症疫苗
SG11201900220RA (en) * 2016-07-18 2019-02-27 Nantomics Inc Distributed machine learning systems, apparatus, and methods
CN115550043A (zh) * 2016-09-23 2022-12-30 伯克顿迪金森公司 用于医疗设备的加密系统
US11212593B2 (en) 2016-09-27 2021-12-28 Time Warner Cable Enterprises Llc Apparatus and methods for automated secondary content management in a digital network
US10374968B1 (en) 2016-12-30 2019-08-06 EMC IP Holding Company LLC Data-driven automation mechanism for analytics workload distribution
US20180268001A1 (en) * 2017-03-16 2018-09-20 International Business Machines Corporation Managing a database management system using a set of stream computing data
US11424023B2 (en) 2017-03-23 2022-08-23 International Business Machines Corporation Scalable and traceable healthcare analytics management
JP6362242B1 (ja) * 2017-09-19 2018-07-25 雅晴 古川 情報管理装置
WO2019070375A1 (en) * 2017-10-03 2019-04-11 National Cardiac, Inc. COMPUTER SYSTEMS AND METHODS FOR MONITORING THE CARDIAC MUSCLE OF A PATIENT USING CONTEXTUAL CONTROL
US20190156923A1 (en) 2017-11-17 2019-05-23 LunaPBC Personal, omic, and phenotype data community aggregation platform
NL2020419B1 (en) 2017-12-11 2019-06-19 Sensor Kinesis Corp Field portable, handheld, recirculating surface acoustic wave and method for operating the same
NL2020538B1 (en) * 2018-03-06 2019-09-13 Sensor Kinesis Corp Method and apparatus for connecting human biological information and data to the cloud
JP6420513B1 (ja) * 2018-03-19 2018-11-07 雅晴 古川 情報管理装置
US11210573B2 (en) 2018-03-20 2021-12-28 Nant Holdings Ip, Llc Volumetric descriptors
US20190304578A1 (en) * 2018-03-23 2019-10-03 LunaPBC Omic data aggregation with data quality valuation
US11380424B2 (en) * 2018-06-15 2022-07-05 Xact Laboratories Llc System and method for genetic based efficacy testing
CN109616156B (zh) * 2018-12-03 2021-07-06 郑州云海信息技术有限公司 一种基因测序数据存储方法和装置
JP2022523621A (ja) 2018-12-28 2022-04-26 ルナピービーシー コミュニティデータの集約、完成、修正、および使用
JP2022530671A (ja) * 2019-04-30 2022-06-30 ユニバーシティ オブ サザン カリフォルニア アルツハイマー病(ad)の介入のための断食模倣食(fmd)
US20210095336A1 (en) * 2019-09-30 2021-04-01 Koninklijke Philips N.V. Methodology for real-time visualization of genomics-based antibiotic resistance profiles

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5132842A (en) 1989-07-21 1992-07-21 Rockwell International Corporation Optical image transformation system
US5386507A (en) 1991-07-18 1995-01-31 Teig; Steven L. Computer graphics system for selectively modelling molecules and investigating the chemical and physical properties thereof
US6789069B1 (en) * 1998-05-01 2004-09-07 Biowulf Technologies Llc Method for enhancing knowledge discovered from biological data using a learning machine
US6882990B1 (en) * 1999-05-01 2005-04-19 Biowulf Technologies, Llc Methods of identifying biological patterns using multiple data sets
WO2000015847A2 (en) * 1998-09-11 2000-03-23 Gene Logic, Inc. Genomic knowledge discovery
US6909700B1 (en) * 1998-11-24 2005-06-21 Lucent Technologies Inc. Network topology optimization methods and apparatus for designing IP networks with performance guarantees
DE00941722T1 (de) * 1999-06-25 2004-04-15 Genaissance Pharmaceuticals Inc., New Haven Verfahren für erhaltung und anwendung von haplotype daten
US6941323B1 (en) 1999-08-09 2005-09-06 Almen Laboratories, Inc. System and method for image comparison and retrieval by enhancing, defining, and parameterizing objects in images
NZ518022A (en) * 1999-08-27 2004-01-30 Iris Biotechnologies Inc Analysis and diagnosis by intelligent processing of remotely generated genetic hybridization profiles
WO2001043051A2 (en) 1999-11-30 2001-06-14 Board Of Trustees Of Wheaton College Computer method and apparatus for revealing promotor motifs
US20010051879A1 (en) 1999-12-01 2001-12-13 Johnson Robin D. System and method for managing security for a distributed healthcare application
JP2001167072A (ja) * 1999-12-06 2001-06-22 World Fusion Co Ltd ネットワークを用いた遺伝子データ解析システム
US7510834B2 (en) * 2000-04-13 2009-03-31 Hidetoshi Inoko Gene mapping method using microsatellite genetic polymorphism markers
US7923542B2 (en) * 2000-04-28 2011-04-12 Sangamo Biosciences, Inc. Libraries of regulatory sequences, methods of making and using same
DE10021849A1 (de) 2000-05-05 2001-11-08 Solutia Germany Gmbh & Co Kg Aminoharzgemisch zur Herstellung von Folien und Kanten mit reduzierter Formaldehydabspaltung
WO2001097076A2 (en) * 2000-06-14 2001-12-20 Parabon Computation, Inc. Apparatus and method for providing sequence database comparison
US8260635B2 (en) * 2000-10-11 2012-09-04 Healthtrio Llc System for communication of health care data
JP2002153271A (ja) * 2000-11-17 2002-05-28 Jeol Ltd Dnaあるいはrnaの塩基配列決定方法およびdnaシーケンサー
WO2002044967A1 (fr) 2000-11-30 2002-06-06 Hitachi, Ltd. Procede et systeme permettant de delivrer des informations d'analyse genetique et procede d'identification permettant une authentification
JP3440270B2 (ja) * 2000-12-18 2003-08-25 エヌシーアンドエス株式会社 生理現象関連遺伝子情報の提供装置、その提供方法及びその提供を行うためのプログラムを格納した記録媒体
WO2002093453A2 (en) * 2001-05-12 2002-11-21 X-Mine, Inc. Web-based genetic research apparatus
AU2003217190A1 (en) * 2002-01-10 2003-07-30 Massively Parallel Technologies, Inc. Parallel processing systems and method
WO2003065247A2 (en) * 2002-02-01 2003-08-07 Devgen Nv Analysis of biochemical sequence data
US7809510B2 (en) * 2002-02-27 2010-10-05 Ip Genesis, Inc. Positional hashing method for performing DNA sequence similarity search
JP2003271735A (ja) * 2002-03-12 2003-09-26 Yokogawa Electric Corp 遺伝子診断分析装置およびそれを用いた遺伝子診断支援システム
JP2004147640A (ja) * 2002-09-06 2004-05-27 Celestar Lexico-Sciences Inc insituハイブリダイゼーション解析管理方法およびinsituハイブリダイゼーション解析管理装置
JP3876817B2 (ja) 2002-10-25 2007-02-07 株式会社デンソー 車両用電源制御装置
US20040122705A1 (en) * 2002-12-18 2004-06-24 Sabol John M. Multilevel integrated medical knowledge base system and method
JP2004240541A (ja) * 2003-02-04 2004-08-26 Hitachi Ltd 並列分散環境におけるネットワーク回路のシミュレーション方法および装置
US20050027564A1 (en) 2003-06-18 2005-02-03 Yantis David Brook Term management system suitable for healthcare and other use
US20050210044A1 (en) 2004-01-21 2005-09-22 Davin Hills Software for generating documents using an object-based interface and item/property data storage
EP1607898A3 (en) 2004-05-18 2006-03-29 Neal E. Solomon A bioinformatics system for functional proteomics modelling
US9820658B2 (en) 2006-06-30 2017-11-21 Bao Q. Tran Systems and methods for providing interoperability among healthcare devices
WO2006052242A1 (en) 2004-11-08 2006-05-18 Seirad, Inc. Methods and systems for compressing and comparing genomic data
US20060226957A1 (en) 2004-11-15 2006-10-12 Miller Ronald H Health care operating system with radio frequency information transfer
US7646887B2 (en) * 2005-01-04 2010-01-12 Evolution Robotics Retail, Inc. Optical flow for object recognition
JP4291281B2 (ja) * 2005-02-03 2009-07-08 富士通株式会社 情報処理システム、計算ノード、情報処理システムの制御方法
WO2006116455A2 (en) 2005-04-26 2006-11-02 Applera Corporation System for genetic surveillance and analysis
US20060293925A1 (en) 2005-06-22 2006-12-28 Leonard Flom System for storing medical records accessed using patient biometrics
US20070239482A1 (en) 2005-07-22 2007-10-11 Siemens Medical Solutions Health Services Corporation Vision Based Data Acquisition System and Method For Acquiring Medical and Other Information
US7733224B2 (en) 2006-06-30 2010-06-08 Bao Tran Mesh network personal emergency response appliance
US7539532B2 (en) 2006-05-12 2009-05-26 Bao Tran Cuffless blood pressure monitoring appliance
US7558622B2 (en) 2006-05-24 2009-07-07 Bao Tran Mesh network stroke monitoring appliance
US7539533B2 (en) 2006-05-16 2009-05-26 Bao Tran Mesh network monitoring appliance
US8486635B2 (en) 2006-05-30 2013-07-16 Mayo Foundation For Medical Education And Research Detecting and treating dementia
JP2008052524A (ja) * 2006-08-25 2008-03-06 Sony Corp ネットワーク分析支援装置および方法、プログラム並びに記録媒体
US8122073B2 (en) 2006-09-29 2012-02-21 The Invention Science Fund I Computational systems for biomedical data
JP4286858B2 (ja) 2006-11-06 2009-07-01 シャープ株式会社 測定データ通信装置、情報取得装置、およびシステム
US9355273B2 (en) 2006-12-18 2016-05-31 Bank Of America, N.A., As Collateral Agent System and method for the protection and de-identification of health care data
US8315817B2 (en) * 2007-01-26 2012-11-20 Illumina, Inc. Independently removable nucleic acid sequencing system and method
US8099298B2 (en) * 2007-02-14 2012-01-17 Genelex, Inc Genetic data analysis and database tools
US20080228699A1 (en) * 2007-03-16 2008-09-18 Expanse Networks, Inc. Creation of Attribute Combination Databases
US20080281819A1 (en) 2007-05-10 2008-11-13 The Research Foundation Of State University Of New York Non-random control data set generation for facilitating genomic data processing
US20090006125A1 (en) 2007-06-29 2009-01-01 Robert Lee Angell Method and apparatus for implementing digital video modeling to generate an optimal healthcare delivery model
US20090005650A1 (en) 2007-06-29 2009-01-01 Robert Lee Angell Method and apparatus for implementing digital video modeling to generate a patient risk assessment model
US20120322675A1 (en) * 2007-08-31 2012-12-20 Florida State University Research Foundation Genome-scale analysis of replication timing
JP5466163B2 (ja) * 2007-11-08 2014-04-09 ジェネティック ファイナンス (バルバドス) リミテッド コンピュータタスクを行う方法、及びネットワークコンピュータシステム
US8478544B2 (en) 2007-11-21 2013-07-02 Cosmosid Inc. Direct identification and measurement of relative populations of microorganisms with direct DNA sequencing and probabilistic methods
EP2229587B1 (en) 2007-11-21 2016-08-03 Cosmosid Inc. Genome identification system
WO2009101639A1 (en) * 2008-02-14 2009-08-20 Decode Genetics Ehf. Susceptibility variants for lung cancer
WO2009117122A2 (en) 2008-03-19 2009-09-24 Existence Genetics Llc Genetic analysis
JP5430654B2 (ja) * 2008-06-18 2014-03-05 コーニンクレッカ フィリップス エヌ ヴェ ユビキタス患者監視のための個人セキュリティマネージャ
US20090326832A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Graphical models for the analysis of genome-wide associations
CN201294149Y (zh) 2008-09-11 2009-08-19 宜宾金川电子有限责任公司成都分公司 组合一匝线圈骨架
KR20100092596A (ko) 2009-02-13 2010-08-23 건국대학교 산학협력단 분자 도킹 시뮬레이션 방법 및 그 장치
US20110125520A1 (en) 2009-10-02 2011-05-26 Rabin Chandra Kemp Dhoble Apparatuses, methods and systems for a mobile healthcare manager-based patient adherence monitor
CN102193830B (zh) * 2010-03-12 2014-06-11 复旦大学 面向众核环境的分治映射/归约并行编程模型
CA3007805C (en) * 2010-04-29 2019-11-26 The Regents Of The University Of California Pathway recognition algorithm using data integration on genomic models (paradigm)
US10192641B2 (en) 2010-04-29 2019-01-29 The Regents Of The University Of California Method of generating a dynamic pathway map
US9646134B2 (en) 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
KR101952965B1 (ko) 2010-05-25 2019-02-27 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Bambam:고처리율 서열분석 데이터의 병렬 비교 분석
US8446593B1 (en) * 2010-06-16 2013-05-21 The Board Of Trustees Of The Leland Stanford Junior University Optical coherence tomography system and method therefor
KR101278652B1 (ko) * 2010-10-28 2013-06-25 삼성에스디에스 주식회사 협업 기반 염기서열 데이터의 관리, 디스플레이 및 업데이트 방법
US8924323B2 (en) 2011-06-21 2014-12-30 Infosys Limited System and method for managing information of biological entities
WO2013052937A1 (en) 2011-10-06 2013-04-11 Nant Holdings Ip, Llc Healthcare object recognition systems and methods
KR20200044149A (ko) 2011-12-08 2020-04-28 파이브3 제노믹스, 엘엘씨 게놈 데이터의 동적 인덱싱 및 시각화를 제공하는 분산 시스템
KR101768652B1 (ko) 2011-12-08 2017-08-16 파이브3 제노믹스, 엘엘씨 Mdm2-포함 이중 소염색체들 및 그의 방법들
CN102521529A (zh) 2011-12-09 2012-06-27 北京市计算中心 基于blast的分布式基因序列比对方法
WO2014008434A2 (en) 2012-07-06 2014-01-09 Nant Holdings Ip, Llc Healthcare analysis stream management
US10621411B2 (en) * 2015-01-19 2020-04-14 Leica Microsystems Cms Gmbh Method for laser microdissection

Also Published As

Publication number Publication date
IN2015MN00089A (ja) 2015-10-16
CN104854617B (zh) 2019-09-17
JP2019149196A (ja) 2019-09-05
EP2870581A2 (en) 2015-05-13
US10580523B2 (en) 2020-03-03
AU2013286622B2 (en) 2018-10-04
KR102197428B1 (ko) 2021-01-04
CN104854617A (zh) 2015-08-19
AU2013286622A1 (en) 2015-01-29
US10095835B2 (en) 2018-10-09
EP2870581B1 (en) 2023-11-29
US20160306920A1 (en) 2016-10-20
JP6527222B2 (ja) 2019-06-05
JP2015529881A (ja) 2015-10-08
AU2019200054B2 (en) 2020-09-03
CA2878455C (en) 2020-12-22
AU2019200054A1 (en) 2019-01-24
CN110491449A (zh) 2019-11-22
CA2878455A1 (en) 2014-01-09
JP2018077886A (ja) 2018-05-17
US20140012843A1 (en) 2014-01-09
US10957429B2 (en) 2021-03-23
US20190006028A1 (en) 2019-01-03
US9953137B2 (en) 2018-04-24
EP2870581A4 (en) 2016-03-09
WO2014008434A3 (en) 2014-03-13
US20200273549A1 (en) 2020-08-27
JP6471091B2 (ja) 2019-02-13
US20170076050A1 (en) 2017-03-16
KR20150054760A (ko) 2015-05-20
CN110491449B (zh) 2023-08-08
WO2014008434A2 (en) 2014-01-09
US10055546B2 (en) 2018-08-21

Similar Documents

Publication Publication Date Title
JP6846459B2 (ja) ヘルスケア解析ストリーム管理
Muthanna et al. Secure and reliable IoT networks using fog computing with software-defined networking and blockchain
Good et al. Organizing knowledge to enable personalization of medicine in cancer
Gonzalez et al. Innovative genomic collaboration using the GENESIS (GEM. app) platform
US20210217496A1 (en) Discovery routing systems and engines
Ejaz et al. Health-blockedge: Blockchain-edge framework for reliable low-latency digital healthcare applications
CN105389619A (zh) 用于改进健康护理生态系统内的连接的方法和系统
Pang et al. Patient assignment optimization in cloud healthcare systems: a distributed genetic algorithm
Wei et al. A self-supervised learning model for unknown internet traffic identification based on surge period
Biswas et al. Revolutionizing biological science: The synergy of genomics in health, bioinformatics, agriculture, and artificial intelligence
Guo et al. Internet of things based intelligent techniques in workable computing: an overview
Cruz-Chávez et al. A grid-based genetic approach to solving the vehicle routing problem with time windows
Jia et al. Effectiveness evaluation method of application of mobile communication system based on factor analysis
Mohd Ali et al. A Systematic Mapping: Exploring Internet of Everything Technologies and Innovations
Chakraborty et al. Healthcare data monitoring under Internet of Things
Team Cloud Computing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190520

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20190619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210301

R150 Certificate of patent or registration of utility model

Ref document number: 6846459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250