JP2022544991A - 配列決定デバイスの制御のための方法 - Google Patents

配列決定デバイスの制御のための方法 Download PDF

Info

Publication number
JP2022544991A
JP2022544991A JP2022510953A JP2022510953A JP2022544991A JP 2022544991 A JP2022544991 A JP 2022544991A JP 2022510953 A JP2022510953 A JP 2022510953A JP 2022510953 A JP2022510953 A JP 2022510953A JP 2022544991 A JP2022544991 A JP 2022544991A
Authority
JP
Japan
Prior art keywords
assay
server system
sequencing
local server
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022510953A
Other languages
English (en)
Inventor
ガオ,ジン
クドリンガー,ヴィドヤ
ライ,ディレンダラクマール
Original Assignee
ライフ テクノロジーズ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ライフ テクノロジーズ コーポレーション filed Critical ライフ テクノロジーズ コーポレーション
Publication of JP2022544991A publication Critical patent/JP2022544991A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/40ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management of medical equipment or devices, e.g. scheduling maintenance or upgrades
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Abstract

配列決定デバイスを制御し、アッセイのための配列決定実行から得られる配列決定データを処理するために、ローカルサーバシステムのためのクラウドベースリソースおよびアッセイ定義ファイルを使用する方法ならびにシステムが、記載されている。方法は、ローカルサーバシステムで、クラウドコンピューティングおよびストレージシステムのサーバからアッセイ定義ファイルを受信することを含み得る。アッセイ定義ファイルは、アッセイを構成するためのコードモジュールを含み得る。コードモジュールは、ローカルサーバシステムのメモリに格納され得る。サーバシステムは、配列決定デバイスから配列決定データを受信し得る。配列決定デバイスは、アッセイのために行われる配列決定実行中に配列決定データを生成し得る。サーバシステムは、アッセイのための分析パイプラインを配列決定データに適用し得る。分析パイプラインは、アッセイ分析結果を生成するためにアッセイ定義ファイルからのコードモジュールに従って実行される分析ステップを含む。【選択図】図4

Description

(関連出願の相互参照)
この出願は、2019年8月20日に出願された米国仮出願第62/889,109号および2020年5月29日に出願された米国仮出願第62/704,806号の米国特許法第119条(e)に基づく利益を主張する。前述の出願の全内容は、参照により本明細書に組み込まれる。
本開示は、クラウドベースコンピューティングおよびストレージシステムリソースからのアッセイワークフローを包含するモジュール式ソフトウェアコンポーネントのデジタル配信を含む、次世代配列決定(NGS)のための配列決定デバイスの制御に関する。
生物学的および医学的な学術調査は、生物学的研究および医学を強化するために、ますます核酸配列決定に注目している。例えば、生物学者および動物学者は、動物の移動、種の進化、および特性の起源を研究するために、配列決定に注目している。医学界は、疾患の起源、医薬品への感受性、および感染の起源を研究するために配列決定を使用している。そのため、配列決定は、生物学、治療、診断、法医学、および学術調査の実質的にすべての局面に広く適用可能性を有する。
それにもかかわらず、配列決定の使用は、アッセイの可用性、配列決定実行の時間、調製時間、およびコストによって制限される可能性がある。追加的に、品質配列決定は、歴史的に高価なプロセスであったため、その実践が制限されている。
実験室による分子病理検査は、NGS配列決定デバイスなどの配列決定デバイスのために開発されたアッセイの大規模な選択によって強化され得る。配列決定デバイスを制御するように構成されたサーバシステムは、分子検査メニューの迅速な拡張を支持するモジュール式ソフトウェアプラットフォームを実装し得、実験室によるアッセイの迅速な採用を可能にする。アッセイ内容および対応するワークフローは、クラウドベースコンピューティングおよびストレージシステムリソース(例えば、Thermo Fisher Cloud、Thermo Fisher Scientific、マサチューセッツ州ウォルサム(Waltham))からモジュール式ソフトウェアコンポーネントとして配信され得る。アッセイ構成内容および対応するワークフローは、アッセイ定義ファイル(ADF)におけるモジュール式ソフトウェアコンポーネントとしてユーザーのサーバシステムに配信される。アッセイ定義ファイルは、ワークフローソフトウェアモジュールの後方互換性、およびサーバシステムのプラットフォームソフトウェアからのワークフローソフトウェアモジュールの分離を支持する。
サーバシステムおよびモジュール式ソフトウェアコンポーネントは、学術調査使用専用(RUO)またはアッセイ開発(AD)モード、およびインビトロ診断用(IVD)またはDxモードを含む、複数の機能モードを制御するように構成され得る。RUOまたはADモードは、アッセイの学術調査アプリケーションおよびサードパーティ開発のためのアッセイの開発ならびにデジタル配信を支持する(RUOおよびADは、交換可能に使用される)。IVDまたはDxモードは、診断アプリケーションのためのローカル要件を満たした分子診断アッセイのデジタル配信を支持する(IVDおよびDxは、交換可能に使用される)。複数の機能モードは、同じNGS配列決定デバイスがRUOアッセイおよびIVDアッセイの両方のために利用されることを可能にする。
例示的な実施形態によれば、ローカルサーバシステムで、クラウドコンピューティングおよびストレージシステムのサーバからアッセイ定義ファイルを受信することであって、アッセイ定義ファイルが、アッセイを構成するためのコードモジュールを含む、受信することと、ローカルサーバシステムのメモリにコードモジュールを格納することと、ローカルサーバシステムで、配列決定デバイスから配列決定データを受信することであって、配列決定データがアッセイのための配列決定実行中に配列決定デバイスによって生成されている、受信することと、アッセイのための分析パイプラインを配列決定データに適用することであって、分析パイプラインが、アッセイ分析結果を生成するためにアッセイ定義ファイルからのコードモジュールに従ってローカルサーバシステムのプロセッサによって実行される分析ステップを含む、適用することと、を含む、方法が提供されている。
例示的な実施形態によれば、ローカルサーバシステムであって、メモリと、プロセッサであって、プロセッサによって実行されるとき、ローカルサーバシステムに、ローカルサーバシステムで、クラウドコンピューティングおよびストレージシステムのサーバからアッセイ定義ファイルを受信することであって、アッセイ定義ファイルが、アッセイを構成するためのコードモジュールを含む、受信することと、ローカルサーバシステムのメモリにコードモジュールを格納することと、ローカルサーバシステムで、配列決定デバイスから配列決定データを受信することであって、配列決定データがアッセイのための配列決定実行中に配列決定デバイスによって生成されている、受信することと、アッセイのための分析パイプラインを配列決定データに適用することであって、分析パイプラインが、アッセイ分析結果を生成するためにアッセイ定義ファイルからのコードモジュールに従ってローカルサーバシステムのプロセッサによって実行される分析ステップを含む、適用することと、を含む、方法を行うようにさせる命令を実行するように構成された、プロセッサと、を備える、ローカルサーバシステムが提供されている。
新規の特徴は、添付の特許請求の範囲に具体的に明らかにされている。特徴および利点のより良好な理解は、例示的な実施形態および添付の図面を明らかにする以下の詳細な記載を参照することによって取得されるであろう。
実施形態による、サーバシステムコンポーネントの概略図を示す。 実施形態による、分析パイプラインのブロック図である。 実施形態による、アッセイ定義ファイルを生成する概略図である。 アッセイ定義ファイルのパッケージの例の概略図である。 配列決定機器の例の図である。 図5の配列決定機器の機器デッキの例の図である。 配列決定機器のワークフローの例を表す図である。 配列決定チップの例の図である。 配列決定チップの複数のレーンからの配列決定データを処理する例のブロック図である。
本明細書で使用される場合、DNA(デオキシリボ核酸)は、4種類のヌクレオチド、A(アデニン)、T(チミン)、C(シトシン)、およびG(グアニン)からなるヌクレオチドの鎖と呼ばれ得、そのRNA(リボ核酸)は、4種類のヌクレオチド、A、U(ウラシル)、G、およびCを含む。ヌクレオチドの特定の対は、相補的な方法で互いに特異的に結合する(相補的な塩基対と呼ばれる)。つまり、アデニン(A)は、チミン(T)と対になり(しかしながら、RNAの場合、アデニン(A)は、ウラシル(U)と対になりる)、シトシン(C)は、グアニン(G)と対になりる。第1の核酸鎖が、第1の鎖のヌクレオチドと相補的なヌクレオチドで構成される第2の核酸鎖と結合すると、2つの鎖は、結合して二重鎖を形成する。様々な実施形態では、「核酸配列決定データ」、「核酸配列決定情報」、「核酸配列」、「ゲノム配列」、「遺伝子配列」、または「フラグメント配列」、「核酸配列読み取り」または「核酸配列決定読み取り」は、DNAまたはRNAの分子(例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、フラグメントなど)におけるヌクレオチド塩基(例えば、アデニン、グアニン、シトシン、およびチミン/ウラシル)の順番を示す任意の情報またはデータを示す。本教示は、キャピラリー電気泳動、マイクロアレイ、ライゲーションベースシステム、ポリメラーゼベースシステム、ハイブリダイゼーションベースシステム、直接的または間接的なヌクレオチド同定システム、パイロ配列決定、イオンまたはpHベースの検出システム、電子署名ベースのシステムなどを含むが、これらに限定されない、利用可能なすべての種類の技術、プラットフォームまたは技術を使用して取得される配列情報を企図することを理解されるべきである。
「ポリヌクレオチド」、「核酸」、または「オリゴヌクレオチド」は、ヌクレオシド間結合によって連結されたヌクレオシド(デオキシリボヌクレオシド、リボヌクレオシド、またはそれらの類似体を含む)の直鎖状ポリマーを指す。典型的には、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。通常、オリゴヌクレオチドのサイズは、数個のモノマー単位、例えば、3~4個から数百個のモノマー単位の範囲である。オリゴヌクレオチドなどのポリヌクレオチドが「ATGCCTG」などの文字配列によって表されるときはいつでも、別段に示されない限り、ヌクレオチドは、左から右へ5’~3’の順序であり、「A」は、デオキシアデノシンを示し、「C」は、デオキシシチジンを示し、「G」は、デオキシグアノシンを示し、「T」は、チミジンを示すことが理解されるであろう。文字A、C、G、およびTは、当該技術分野で標準的であるように、塩基自体、ヌクレオシド、または塩基を含むヌクレオチドを指すために使用され得る。
「変異体」、「ゲノム(genomic)変異体」または「ゲノム(genome)変異体」という句は、変異、組換え/交差または遺伝的浮動のために、特定の種または特定の種内の亜集団に対して参照されるように変化を受けた(DNAまたはRNAにおける)配列の単一のものまたはグループを示す。ゲノム変異体の種類の例は、一塩基多型(SNP)、コピー数変動(CNV)、挿入/欠失(インデル)、単一ヌクレオチド変異体(SNV)、複数ヌクレオチド変異体(MNV)、逆位などを含むが、これらに限定されない。
様々な実施形態では、ゲノム変異体は、核酸配列決定システムおよび/または配列決定データの分析を使用して検出されることができる。配列決定ワークフローは、検査サンプルが、核酸配列読み取りなどの数百、数千、または数百万の配列読み取りを提供するために、核酸配列決定装置で配列決定された数百、数千、または数百万の小さなフラグメントに剪断または消化されることから始めることができる。次いで、各読み取りは、参照または標的ゲノムにマッピングされることができ、メイト対(mate-pair)フラグメントの場合では、読み取りは、対にされることができ、それによってゲノムの反復領域の問い合わせを可能にする。マッピングおよびペアリングの結果は、様々な独立型または統合型ゲノム変異体(例えば、SNP、CNV、Indel、逆位など)分析ツールのための入力として使用されることができる。
「サンプルゲノム」という句は、生物の全または部分ゲノムを示すことができる。
本明細書で使用される場合、「標的化パネル」は、サンプルにおける標的遺伝子配列の選択的増幅のために設計された標的特異的プライマーのセットを指す。いくつかの実施形態では、少なくとも1つの標的配列の選択的増幅に続いて、ワークフローは、増幅された標的配列の核酸配列決定をさらに含む。
本明細書で使用される場合、「標的配列」または「標的遺伝子配列」およびその派生語は、サンプルにおいて存在することが疑われるまたは予想される任意の核酸配列を含む、本開示に従って増幅または合成されることができる任意の一本または二本鎖核酸配列を指す。いくつかの実施形態では、標的配列は、二本鎖形態で存在し、標的特異的プライマーまたは付加されたアダプターの添加前に、増幅または合成される特定のヌクレオチド配列の少なくとも一部、またはその相補体を含む。標的配列は、増幅または合成反応において有用なプライマーが、ポリメラーゼによる伸長の前にハイブリダイズすることができる核酸を含むことができる。いくつかの実施形態では、この用語は、ヌクレオチドの配列同一性、順序付けまたは場所が、本開示の方法のうちの1つ以上によって決定される核酸配列を指す。
本明細書で使用される場合、「標的特異的プライマー」およびその派生語は、標的配列を含む核酸分子の少なくとも一部分に対して、少なくとも50%相補的、典型的には少なくとも75%相補的、もしくは少なくとも85%相補的、より典型的には少なくとも90%相補的、より典型的には少なくとも95%相補的、より典型的には少なくとも98%、もしくは少なくとも99%相補的、または同一である少なくとも1つの配列を含む、一本鎖または二本鎖ポリヌクレオチド、典型的にはオリゴヌクレオチドを指す。そのような事例では、標的特異的プライマーおよび標的配列は、互いに「対応する」と記載されている。いくつかの実施形態では、標的特異的プライマーは、その対応する標的配列の少なくとも一部分(または標的配列の相補体)にハイブリダイズすることができ、そのようなハイブリダイゼーションは、任意選択で、標準的なハイブリダイゼーション条件下または厳密なハイブリダイゼーション条件下で任意に行われることができる。いくつかの実施形態では、標的特異的プライマーは、標的配列またはその相補体にハイブリダイズすることができないが、標的配列またはその相補体を含む核酸鎖の一部分にハイブリダイズすることができる。いくつかの実施形態では、順方向標的特異的プライマーおよび逆方向標的特異的プライマーは、テンプレート依存的プライマー伸長を介して標的配列を増幅するために使用されることができる標的特異的プライマー対を定義する。典型的には、標的特異的プライマー対の各プライマーは、対応する標的配列を含む核酸分子の少なくとも一部分と実質的に相補的であるが、サンプルにおける少なくとも1つの他の標的配列と50%未満相補的である少なくとも1つの配列を含む。いくつかの実施形態では、増幅は、単一の増幅反応において複数の標的特異的プライマー対を使用して行われることができ、各プライマー対が、順方向標的特異的プライマーおよび逆方向標的特異的プライマーを含み、各々が、サンプル中の対応する標的配列と実質的に相補的または実質的に同一である少なくとも1つの配列を含み、各プライマー対が、異なる対応する標的配列を有する。様々な実施形態では、核酸分子の集団からの複数の標的特異的配列の増幅によって生成された標的核酸は、配列決定されることができる。いくつかの実施形態では、増幅は、1つ以上の標的特異的プライマー対を標的配列にハイブリダイズすることと、プライマー対の第1のプライマーを伸長することと、核酸分子の集団からの伸長された第1のプライマー産物を変性することと、伸長された第1のプライマー産物にプライマー対の第2のプライマーをハイブリダイズすることと、二本鎖産物を形成するために第2のプライマーを伸長することと、複数の増幅された標的配列を生成するために二本鎖産物から離れて標的特異的プライマー対を消化することとを含むことができる。いくつかの実施形態では、増幅された標的配列は、1つ以上のアダプターに連結されることができる。いくつかの実施形態では、アダプターは、1つ以上のヌクレオチドバーコードまたはタグ付け配列を含むことができる。いくつかの実施形態では、一旦アダプターに連結された増幅された標的配列は、アダプターに連結された増幅された標的配列のライブラリを生成するために、ニックトランスレーション反応および/またはさらなる増幅を受けることができる。
様々な実施形態では、マルチプレックスPCR増幅を行う方法は、複数のテンプレート/プライマー二重鎖を形成するために、順方向および逆方向プライマーを有する複数の標的特異的プライマー対を標的配列の集団と接触することと、DNAポリメラーゼおよびdNTPの混合物を複数のテンプレート/プライマー二重鎖に十分な時間および十分な温度で添加して、テンプレート依存性合成を介して各標的特異的プライマー対の順方向および逆方向プライマーのいずれか(または両方)を伸長し、それによって複数の拡張プライマー製品/テンプレート二重鎖を生成することと、拡張プライマー製品/テンプレート二重鎖を変性することと、標的特異的プライマー対からの相補的プライマーを拡張プライマー産物にアニーリングすることと、複数の標的特異的二本鎖核酸分子を形成するために、DNAポリメラーゼおよびdNTPの存在下でアニーリングされたプライマーを伸長することと、を含む。
本明細書で使用される場合、「テンプレート化」という用語は、例えば、合成による配列決定などの核酸配列決定を含む、核酸分析法においてテンプレートとして使用されることができる、実質的に同一のポリヌクレオチドの2つ以上または複数もしくは集団を生成するプロセス、もしくは核酸の実質的に単クローン性の集団を生成するプロセスを指す。テンプレート化プロセスで生成されたポリヌクレオチドは、典型的には核酸テンプレートと呼ばれる。
いくつかの実施形態では、核酸配列決定機器は、配列決定機器の様々なコンポーネントの制御および配列決定機器での配列決定実行からのデータ出力の処理のためにサーバシステムとインターフェース接続され得る。サーバシステムソフトウェアは、ウェブアプリケーション、データベース、および分析パイプラインを含み得、配列決定機器からの接続を支持し得る(図5)。サーバシステムソフトウェアは、以下の主要な機能およびアプリケーションプログラムインターフェース(API)を提供し得る。
1.ユーザー認証、試薬追跡のためのAPIが、情報を実行し、追跡/ロギングを実行する。支持された機器は、配列決定機器および抽出機器を含み得る。
2.サンプル、ライブラリ、計画の作成のためのLIMS(実験室情報管理システム)のためのAPIが、実行し、計画の実行ステータスを引き出す。
3.サンプルおよび実行データの管理を支持する。
4.データ分析および報告作成のためのアッセイ構成ならびに分析パイプラインの実行を支持する。
5.ソフトウェアの更新および保守のためのソフトウェア更新サーバへインターフェース接続する。
6.クラウドベースシステムまたはローカルシステムに展開されたThermo Fisher Scientific社のIon Reporterなどの注釈および報告システムへ接続するために構成を支持し、マッピングされたまたはマッピングされていないBAMファイルを転送するためにクラウドベースシステムとの安全な認証接続を確立する。
7.Thermo Fisher Cloudなどのクラウドコンピューティング環境におけるリソースシステムに接続するために構成を支持し、ソフトウェアおよびシステム内容をダウンロードするため、およびテレメトリデータを送信するために、クラウドリソースシステムとの安全および認証された接続を確立する。
図1は、サーバシステムコンポーネントの概略図を示す。いくつかの実施形態では、基本的なソフトウェアアーキテクチャは、ウェブインターフェース、リモート監視エージェント、データベース、機器へのAPI、分析パイプライン、分析パイプラインのコンテナ化(例えば、Dockerを使用)、注釈および報告システム(例えば、Thermo Fisher ScientificからのIon Reporter)への接続、ならびにクラウドベースの支持およびリソースシステム(例えば、Thermo Fisher Cloud)を含み得る。クラウドベースの支持およびリソースシステム、またはクラウドベースのリソースシステムは、クラウドコンピューティングおよびストレージシステムにおいて実装され得る。クラウドベースの支持およびリソースシステムは、アッセイ定義ファイルを含む内容を格納する。クラウドコンピューティングおよびストレージシステムのサーバは、アッセイ定義ファイルなどの内容をローカルサーバシステムにダウンロードし得る。クラウドベースの支持およびリソースシステムは、ローカルサーバシステムからテレメトリデータを受信し得る。サーバシステム、ローカルサーバシステム、およびユーザーのサーバシステムは、本明細書で交換可能に使用される。
いくつかの実施形態では、ユーザーインターフェース(UI)は、ウェブアプリケーションソフトウェアを介して実装され得る。UIは、サンプル管理ページを提供し得る。サンプル管理UIページは、ユーザーがサンプル情報をシステムに入力することを可能にする。サンプル情報は、一意のサンプル識別子(ID)、サンプル名、およびサンプル調製試薬追跡情報を含む。検証ロジックは、サンプル調製ステップを事前定義されたアッセイワークフローにロックするサンプル管理フローに構築される。UIは、アッセイ管理ページを提供し得る。アッセイ管理UIページは、ユーザーがアッセイを表示し、およびアッセイを作成することを可能にする。アッセイは、ワークフローをプロセスの各ステップのために事前定義されたパラメータにロックする。検証ロジックは、アッセイ構成を確実にするために構築され得る。UIは、実行計画および監視ページを提供し得る。実行計画および監視UIページは、ユーザーが実行を計画し、進行中の実行を監視することを可能にする。UIは、出力データページを提供し得る。出力データのUIページは、ユーザーが、生成された結果の品質管理(QC)メトリック評価、ログ、および監査証跡と共に分析結果を表示することを可能にする。UIは、構成ページを提供し得る。構成UIページは、ユーザーがシステムを表示および構成することを可能にする。
いくつかの実施形態では、アプリケーションプログラミングインターフェース(API)は、Java(登録商標)プラットフォームを通して提供され得る。例えば、Javaプラットフォームは、ウェブベースのアプリケーションのためのWeb ARchive(WAR)ファイルを構築するために使用され得るTomcatサーバを含み得る。
分析パイプラインの様々なステップのためのコードモジュールは、Keplerワークフローエンジンのコンテキストにおけるアクターと呼ばれ得る。例えば、分析ステップのためのコードモジュールは、アクター(actor)jarに含まれるJavaプログラムのバイナリコードによって実装され得る。Keplerワークフローエンジンは、ワークフローの処理コンポーネントを「アクター」として定義し、アルゴリズムまたは分析パイプラインのプロセッサによる実行ためのステップを連鎖させる。(https://kepler-project.org)。例えば、Keplerワークフローエンジンは、図1における分析パイプラインのワークフローを構成するために使用され得る。
サーバシステムは、1つ以上のデータベースを含み得る。例えば、サーバシステムは、サンプルデータ、実行データ、およびシステム/ユーザー構成を格納するためのリレーショナルデータベースを含み得る。リレーショナルデータベースは、アッセイ開発データベースとDxデータベースの2つの別個のデータベースを含み得る。アッセイ開発データベースは、サンプルデータ、実行データ、および操作のRUOまたはアッセイ開発モードのためのシステム/ユーザー構成を格納し得る。Dxデータベースは、サンプルデータ、実行データ、および操作のIVDまたはDxモードのためのシステム/ユーザー構成を格納し得る。
サーバシステムは、注釈ソースデータを格納するための注釈データベース、AnnotationDBを含み得る。例えば、注釈データベースは、NoSQL、または非リレーショナルデータベース、例えば、MongoDBデータベースとして実装され得る。各注釈ソースは、ソース名およびバージョンを示すメタ情報を含むJSON(JavaScript Object Notation)文字列として格納され得る。各注釈ソースは、注釈IDにキー設定された注釈のリストを含有し得る。サーバシステムは、変異体情報を格納するためのバリオーム(variome)データベース、VariomeDBを含み得る。例えば、バリオームデータベースは、NoSQL、または非リレーショナルデータベース、例えば、MongoDBデータベースとして実装され得る。VariomeDBは、特定のサンプル上の変異体呼び出し結果のコレクションを格納し得る。例えば、JSON形式のレコードは、サンプルを識別するためのメタ情報を含有し得る。
例えば、AnnotationDBデータベースは、以下の注釈ソースのうちの1つ以上を格納し得る。
1.RefGeneモデル:hg19_refgene_63、バージョン63
2.RefGene機能正規トランスクリプトスコア:hg19_refgeneScores_4、バージョン4
3.dbSNP:dbsnp_138、バージョン138
4.Canonical RefSeqトランスクリプト:hg19_refgene_63、バージョン63
5.5000Exomes:hg_esp6500_1、バージョン1
6.ClinVar:clinvar_1、バージョン1
7.DGV:dgv_20130723、バージョン20130723
8.OMIM:omim_03022014、バージョン03022014
他の注釈ソースは、含まれ得る。上記の注釈ソースの他のバージョンは、含まれ得る。注釈ソースは、公衆注釈情報内容または独自注釈情報内容を提供し得る。
Variomeデータベースにおける各呼び出しについて、各注釈ソースは、変異体に一致する注釈について照会され得、一致する注釈は、変異体と共にVariomeデータベースにキー値の対として格納され得る。注釈付きの変異体は、ユーザーのための結果ファイル、例えば、注釈付きのVCFファイルに含まれ得る。VCFファイルは、遺伝子配列の変異体を格納するために使用されるタブ区切りされたテキストファイルである。いくつかの実施形態では、本教示での使用のための注釈方法は、その全体が本明細書に組み込まれる、2016年1月28日に公開された米国出願公開第2016/0026753号に記載された1つ以上の特徴を含み得る。
いくつかの実施形態では、サーバシステムは、配列決定機器によって行われるアッセイのための配列決定実行中に生成された配列決定データを処理するために分析パイプラインを含み得る。配列決定装置は、配列決定データファイルおよび実験ログファイルを、例えば、生のdatファイル、ブロックワイズ1.wellsファイルを生成する処理済みの.datファイル、およびサムネイルデータでサーバシステムメモリに転送する。分析パイプラインは、メモリからデータファイルにアクセスし、実行のためのデータ分析を開始する。
いくつかの実施形態では、DockerコンテナおよびDocker画像は、分析パイプラインおよびオペレーティングシステム固有のバイナリをパッケージ化するために使用され得る。Dockerは、コンテナを使用することによってアプリケーションを作成、展開、および実行するために使用されるツールである。コンテナは、ライブラリおよびその他の依存関係など、必要なすべての部分を有するアプリケーションが1つのパッケージとしてバンドルされることを可能にする。これは、アプリケーションソフトウェアがホストシステムとして同じLinux(登録商標)カーネルを使用することを可能にする。Docker画像ファイルは、分析パイプラインコードによって必要とされるライブラリおよびバイナリと共にパッケージ化され得る。Dockerは、アプリケーションまたはアルゴリズムを新しいバージョンまたは異なるバージョンのオペレーティングシステム(OS)に適応させ、OSバージョンと互換性のあるアプリケーションのDocker画像を作成するために使用され得る。
いくつかの実施形態では、サーバシステムは、配列決定機器から分析パイプラインへのデータ転送のためのクローラー(crawler)サービスを含み得る。クローラーは、JAVA NIO watcher API(アプリケーションプログラミングインターフェース)を使用して開発され得るイベントベースのサービスである。NIO(ノンブロッキングI/O)は、集中的な入出力(I/O)操作のための機能を提供するJavaプログラミング言語APIのコレクションである。クローラーは、実行データを配列決定機器から分析パイプラインに転送するために、配列決定機器のために構成されたFTPディレクトリーを監視し得る。
図2は、実施形態による、分析パイプラインのブロック図である。配列決定機器は、アッセイのための配列決定実行中に生のデータファイル(DATまたは.datファイル)を生成する。信号処理は、実行のログ情報と共にサーバのFTP場所に転送される、1.wellsファイルなどのファイルのための組み込み信号測定データを生成するために、生のデータに適用され得る。信号処理ステップは、ウェルに対応するバックグラウンド信号を導き出し得る。バックグラウンド信号は、対応するウェルのための測定信号から差し引かれ得る。残りの信号は、各ウェルのための各ヌクレオチドフローでの取り込みを推定するために取り込み信号モデルによって適合され得る。上記の信号処理からの出力は、ウェル当たりおよびフロー当たりの信号測定値であり、1.wellsファイルなどのファイルに格納され得る。
いくつかの実施形態では、塩基呼び出しステップは、位相推定、正規化を実行し得、最良の部分配列適合を識別し、塩基呼び出しを行うために、ソルバーアルゴリズムを行い得る。配列読み取りの塩基配列は、マッピングされていないBAMファイルに格納される。塩基呼び出しステップは、塩基呼び出し品質を示すためのQC測定値として、読み取りの総数、塩基の総数、および平均読み取り長を生成し得る。塩基呼び出しは、任意の好適な信号特性(例えば、信号の振幅または強度)を分析することによって行われ得る。本教示での使用のための信号処理および塩基呼び出しは、その全体が参照により本明細書に各々組み込まれる、2013年4月11日に公開された米国出願公開第2013/0090860号、2014年2月20日に公開された米国出願公開第2014/0051584号、および2012年5月3日に公開された米国出願公開第2012/0109598号に記載された1つ以上の特徴を含み得る。
一旦、配列読み取りのための塩基配列が決定されると、配列読み取りは、例えば、マッピングされていないBAMファイルでは、整列ステップに提供され得る。整列ステップは、整列された配列読み取りおよび関連するマッピング品質パラメータを決定するために、配列読み取りを参照ゲノムにマッピングする。整列ステップは、整列の品質を示すQC指標として、マッピング可能な読み取りの割合を生成し得る。整列の結果は、マッピングされたBAMファイルに格納され得る。本教示での使用のための配列読み取りを整列するための方法は、その全体が参照により本明細書に組み込まれる、2012年8月2日に公開された米国出願公開第2012/0197623号に記載された1つ以上の特徴を含み得る。
BAMファイル形式の構造は、2014年9月12日の「Sequence Alignment/Map Format Specification」(https://github.com/samtools/hts-specs)に記載されている。本明細書で記載されるように、「BAMファイル」は、BAM形式と互換性のあるファイルを指す。本明細書で記載されるように、「マッピングされていない」BAMファイルは、整列された配列読み取り情報およびマッピング品質パラメータを含有しないBAMファイルを指し、「マッピングされた」BAMファイルは、整列された配列読み取り情報およびマッピング品質パラメータを含有するBAMファイルを指す。
いくつかの実施形態では、変異体呼び出しステップは、一塩基多型(SNP)、挿入および欠失(InDel)、多塩基多型(MNP)、および複合ブロック置換イベントの検出を含み得る。様々な実施形態では、変異体コーラーは、サンプルゲノムに対して呼び出された変異体を*.vcf、*.gff、または*.hdfデータファイルとして通信するように構成されることができる。呼び出された変異体情報は、呼び出された変異体情報が分析のために解析および/または抽出されることができる限り、任意のファイル形式を使用して通信されることができる。本教示での使用のための変異体検出方法は、その全体が参照により本明細書に各々組み込まれる、2013年12月26日に公開された米国出願公開第2013/0345066号、2014年10月2日に公開された米国出願公開第2014/0296080号、および2014年2月20日に公開された米国出願公開第2014/0052381号、ならびに2018年4月24日に発行された米国特許第9,953,130号に記載された1つ以上の特徴を含み得る。いくつかの実施形態では、変異体呼び出しステップは、分子タグ付き核酸配列データに適用され得る。分子タグ付き核酸配列データのための変異体検出方法は、その全体が参照により本明細書に各々組み込まれる、2018年11月22日に公開された米国出願公開第2018/0336316号に記載された1つ以上の特徴を含み得る。
いくつかの実施形態では、分析パイプラインは、融合検出のための融合分析パイプラインを含み得る。融合検出方法は、その全体が参照により本明細書に組み込まれる、2016年1月21日に公開された米国出願公開第2016/0019340号に記載された1つ以上の特徴を含み得る。いくつかの実施形態では、融合分析パイプラインは、分子タグ付き核酸配列データに適用され得る。分子タグ付き核酸配列データのための融合検出方法は、その全体が参照により本明細書に各々組み込まれる、2019年03月21日に公開された米国出願公開第2019/0087539号に記載された1つ以上の特徴を含み得る。
いくつかの実施形態では、分析パイプラインは、コピー数変動を検出するためのコピー数変異体分析パイプラインを含み得る。コピー数変動の検出のための方法は、その全体が参照により本明細書に各々組み込まれる、2014年9月11日に公開された米国出願公開第2014/0256571号、2012年2月23日に公開された米国出願公開第2012/0046877号、および2016年4月14日に公開された米国出願公開第2016/0103957号に記載された1つ以上の特徴を含み得る。
いくつかの実施形態では、サーバシステムソフトウェアは、アッセイ名、アッセイの種類、パネル、あればホットスポットファイル、参照名、あれば制御名、品質管理QC閾値、あればアッセイの記載、データ分析パラメータおよび値、機器実行スクリプト名、ならびにアッセイを定義する他の構成を含むカプセル化されたアッセイ構成を支持し得る。情報のセット全体は、アッセイ定義と呼ばれている。アッセイ構成内容および対応するワークフローは、アッセイ定義ファイル(ADF)におけるモジュール式ソフトウェアコンポーネントとしてユーザーに配信され得る。サーバシステムソフトウェアは、アッセイ構成を含有するアッセイ定義ファイルをインポートし得る。インポートプロセスは、暗号化されたDebianファイルを含み、インストールプロセスをトリガーするzipファイルのインポートによって開始され得る。ユーザーインターフェースは、ユーザーがインポートのためのADFを選択するためのページを提供し得る。クラウドベースの支持およびリソースシステムにおけるアプリケーションストアは、ユーザーのローカルサーバシステムへのダウンロードのためにユーザーによる選択のために可能である様々なアッセイ、パネル、およびワークフローを支持するADFを格納し得る。
アッセイ定義ファイル(ADF)は、アッセイ名、テクノロジープラットフォーム構成(例えば、次世代配列決定(NGS)、チップの種類、化学の種類)、ワークフローステップ(サンプル調製、機器スクリプト、分析、報告)、分析アルゴリズム、規制ラベル(例えば、学術調査使用専用(RUO)、インビトロ診断用(IVD)、中央ヨーロッパインビトロ診断用(CE-IVD、内部使用専用(IUO)、など)、標的化マーカー(パネル)、参照ゲノムバージョン、消耗品、制御値、QC閾値、報告遺伝子および変異体を含む、分子検査またはアッセイのための構成を定義するカプセル化されたファイルである。ADFは、ローカル配列決定機器のためのアッセイ機能を構築するためのモジュール式アプローチを提供する。アッセイソフトウェアは、配列決定機器のプラットフォームソフトウェアとは別にADFによって提供され得る。
アッセイ構成のためにADFを使用する利点は、以下を含む。
・アッセイワークフローおよび分析のカプセル化
・シングルクリックでインストール
・プラットフォームソフトウェアからの分離を可能にするDocker実装によるソフトウェアのモジュール式構造のため、アッセイ構成のためのソフトウェア更新後に再検証が必要ない
・安全な配信のための多層暗号化
・相手先ブランド供給(OEM)のためのアッセイ構成の合理化された支持
・報告の合理化されたカスタマイズ
・地域の規制要件の支持
・プラグアンドプレイ形式は、テクノロジーにとらわれないワークフローを支持する
・分子検査メニューの迅速な拡張および実験室でのアッセイの採用を可能にする
いくつかの実施形態では、アッセイ定義ファイル(ADF)は、以下のステップ、1)ライブラリ調製、2)テンプレート化、3)配列決定、4)分析、5)変異体解釈、および6)報告生成のためのソフトウェアコードモジュールのうちの1つ以上を含み得る。ライブラリ調製およびテンプレート化のワークフローステップ(図7)について、ADFは、ライブラリ調製、テンプレート化およびテンプレート化されたビーズの濃縮のためのスクリプトを含み得る。配列決定および分析のワークフローステップについて、ADFは、図2に関して記載された分析パイプラインのためのアルゴリズムバイナリコードおよびパラメータのDocker画像パッケージを含み得る。変異体解釈のワークフローステップについて、ADFは、変異体の分析および注釈付けのために使用され得る注釈ソースのリストを含み得る。報告生成のワークフローステップについて、ADFは、報告を生成するときに使用のための報告テンプレートおよび画像ファイルを含み得る。
ADFは、配列決定機器上のワークフローステップを制御するための機器スクリプトを含み得る。例えば、スクリプトは、ピペッティングおよびロボット制御の量を制御するパラメータを含み得る。機器スクリプトは、特定のアッセイのためにカスタマイズされ得る。
例えば、配列決定および分析のステップについて、ADFは、エンドツーエンドの分析パイプラインのDocker画像を含み得るDocker画像は、分析パイプラインの各ステップのアルゴリズムのためのOS固有のライブラリおよびバイナリを含み得る。アルゴリズムバイナリは、図2および図9に関して記載されたものなどの、信号処理、塩基呼び出し、整列、および変異体呼び出しを含む分析パイプラインのステップを含み得る。別の例では、ADF Debianファイルは、信号処理、塩基呼び出し、およびRNACountsのためのコードモジュールなど、特定のアッセイのための特定のコードモジュールをパッケージ化し得る。
ADFは、試薬キットを構成するためのスクリプトを含み得る。これらのスクリプトは、表1に関して以下でさらに記載されるように、配列決定実行のために必要とされる消耗品の計算を支持する。ADFに含まれる構成スクリプトは、以下のうちの1つ以上を含み得る。
・バーコードセットおよびチップ
・サンプル制御構成(例えば、サンプルインライン制御)およびそのQCパラメータを関連付ける機能を含む、ライブラリキットおよび消耗品
・内部制御値とQCパラメータを関連付ける機能を含む、テンプレートキットおよび消耗品
・内部制御値とQCパラメータを関連付ける機能を含む、配列決定キット
ADFは、1つ以上の参照ゲノムファイルを含み得る。参照ゲノムの例は、hg19およびGRCH38を含む。参照ゲノムファイルは、ワークフロー情報と共にメインADFにパッケージ化され得る。代替的に、参照ゲノムファイルは、メインADFを補足する別のADFにパッケージ化され得る。
ADFは、融合パネルおよび融合標的領域パネルのワークフローのためのコードモジュールを含み得る。ADFは、分析のための融合標的領域参照ファイルおよびホットスポットファイルを含み得る。
ADFは、ユーザーによって構成され得るワークフローの様々なポイントでアッセイパラメータを含み得る。構成可能なパラメータは、ユーザーによる調整のためのユーザーインターフェースにおいて表示され得る。新しいパラメータは、任意のアクターレベルで追加され得る。構成可能なパラメータは、分析パイプラインに渡され得る。構成可能なアッセイパラメータのための入力形式は、単一文字列テキスト、ブール値(Boolean)、複数行テキスト、浮動小数点、ラジオボタン、ドロップダウン、およびファイルアップロードのうちの1つ以上を含み得る。例えば、ファイルアップロードは、.propertiesおよび.jsonなどのファイル形式を使用し得る。
ADFは、ワークフローにおける様々なポイントで品質管理およびアッセイの性能閾値のために使用されるQCパラメータを含み得る。例えば、QCパラメータの種類は、実行QCパラメータ、サンプルQCパラメータ、内部制御QCパラメータ、およびアッセイ固有のQCパラメータを含む。QCパラメータは、データ型(例えば、整数、浮動小数点)、下限、上限、およびデフォルト値のうちの1つ以上によって定義され得る。
ADFは、所与のアッセイのためのデータベースから選択された結果提示のための指定されたデータタブ列を含み得る。選択されたデータタブ列は、結果のユーザーインターフェース表示の構成、およびアッセイのためのPDF報告に含まれる列を支持する。ADFは、所与のアッセイのための結果提示のための画像ファイルを含み得る。ADFは、PDF報告のための複数言語のための支持を含み得る。ADFは、所与のアッセイのための分析パイプラインによって生成される任意のファイルのためのダウンロードファイルリストを含み得る。サンプルまたは実行のためのファイルリストは、ユーザーインターフェースに表示され得る。ADFは、遺伝子リストを含み得る。遺伝子リストは、所与のがんの種類のための既知の遺伝子リストを、ユーザーインターフェースおよびPDF報告に表示するために、使用され得る。
ADFは、所与のためのアッセイに使用されるプラグインのセットを含み得る。ADFは、プラグインのセットおよびそれらのバージョンを指定し得る。ADFがプラグインのバージョンを指定していない場合、サーバシステムにインストールされているプラグインの最新バージョンは、所与のアッセイのために使用され得る。
ADFは、カスタムアッセイの作成を支持するための新しいワークフローテンプレートを含み得る。新しいワークフローテンプレートは、アッセイシェブロン(chevron)ステップのセットを含み得る。ステップのためのパラメータは、表示され得る。
ADFは、新しい注釈セットの構成を支持するための注釈ソースおよびセットのリストを含み得る。ADFは、所与のアッセイの分析パイプラインによって検出された変異体に適用されるフィルターチェーンを含み得る。ADFは、変異体の注釈のためのルールセットを含み得る。
ADFは、様々な種類のアッセイを支持するように構成されることができる。例は、腫瘍学関連のアッセイ(例えば、Thermo Fisher ScientificのOncomineアッセイ)、免疫腫瘍学関連のアッセイ(例えば、T細胞受容体(TCR)、マイクロサテライト不安定性(MSI)、腫瘍変異負荷(TML))、感染性疾患関連アッセイ(例えば、微生物叢)、生殖健康関連アッセイ、およびエクソーム関連アッセイを含むが、これらに限定されない。ADFはまた、カスタムアッセイのために構成されることができる。
図3は、実施形態による、アッセイ定義ファイルを生成する概略図である。アッセイ定義は、Debianファイルを形成するためにアッセイ情報のファイルのコピーおよびデータベース集団を開始する、build.sh、debscripts、およびmakedeb.shによって生成され得る。アッセイ定義の内容は、アッセイパラメータ、BEDファイル(染色体の位置または領域を定義するブラウザー拡張可能データファイル-BEDファイル)、パネルファイル、遺伝子リスト、ホットスポットファイル(典型的には、変異体を含有する遺伝子における領域を定義するBEDまたはVCFファイル)、および許容試薬を含有するシードデータを含み得る。アッセイ定義の内容は、異なる言語でのアッセイ情報表示を支持するアッセイ名、記載、および報告メッセージのローカライズバージョンを含有し得る。アッセイ定義ファイルは、新しい分析パイプラインのパッケージ化を支持し得る。ADFは、アッセイの種類に基づいて、変異体呼び出し、融合呼び出し、およびCNV呼び出しのために実行され得る、任意選択の後処理スクリプトを含み得る。ADFは、特定の分析パイプラインのためのバイナリへの更新の任意選択のDockerコンテナ画像を含み得る。Dockerコンテナ画像は、オペレーティングシステムまたはサードパーティライブラリのようなプラットフォームの変更が、アッセイの結果またはシステムの機能に強い影響を与えないことを確実にするために、ADFと共にパッケージ化され得る。
Debianファイルは、不正な改変を防止するためにシリアル化され得る。シリアル化されたアッセイ定義は、対称鍵アルゴリズムであるAdvanced Encryption Standard(AES)を使用してさらに暗号化され得る。アッセイメタ情報を含有するテキストファイルはまた、AESおよび同じ暗号化キーを使用して暗号化され得る。暗号化されたアッセイ定義ファイルは、暗号化されたメタ情報ファイルと共にzip形式に圧縮され得る。他の暗号化形式はまた、シリアル化されたアッセイ定義情報に適用され得る。例えば、メタ情報は、以下のうちの1つ以上を含み得る。
・分析パイプラインバージョン、
・参照ゲノムファイル場所のための参照ゲノムパス、
・システムにおける一意の発生をチェックするためのアッセイの内部名である、アッセイの一意の名前、
・分析の起動およびアッセイに依存するファイル参照のインストールのために使用される、Docker画像名、
・分析パイプライン起動のために必要とされる依存関係パッケージ名。
図4は、アッセイ定義ファイルのパッケージングの例の概略図である。ZIP形式40で圧縮されたアッセイ定義ファイルは、シリアル化および暗号化されたアッセイ定義Debianパッケージング41、シリアル化および暗号化されたメタ情報テキストファイル42、およびシリアル化および暗号化された任意選択のDocker画像Debianパッケージング43を含み得る。サーバシステムは、アッセイ定義Debianファイルをインストールする前に、メタ情報テキストファイル42およびアッセイ定義シリアル化ファイル41の両方を復号化し得る。
サーバシステムおよびモジュール式ソフトウェアコンポーネントは、RUOまたはADモード、およびIVDまたはDxモードを含む、複数の機能モードを制御するように構成され得る。図1を参照すると、Tomcat Serverは、RUOモードのためのWeb ARchive (WAR)ファイルおよびIVDモードのためのWARファイルを含むように構成され得る。サーバシステムは、RUOアッセイによって検出された変異体のためのRUOバリオームデータベース、およびIVDアッセイによって検出された変異体のためのIVDバリオームデータベースを含むように構成され得る。サーバシステムは、RUOモードおよびIVDモードのために個別の分析パイプラインならびに関連するKeplerワークフローエンジンを含むように構成され得る。RUOアッセイのためのRUO Docker画像ファイルは、IVDアッセイのためのIVD Docker画像ファイルとは別のファイルとして構成され得る。リレーショナルデータベースは、RUOモードのためのアッセイ開発(AD)データベースおよびIVDモードのためのDxデータベースの、別々のデータベースを有するように構成され得る。最初に、RUOモードのみを支持するサーバシステムは、ソフトウェアアップデートによってRUOおよびIVDモードを支持するように構成され得る。
ADFは、RUOモードアッセイおよびIVDモードアッセイのために別々に生成され得る。RUOモードのADFは、学術調査で使用されるアッセイのためのアッセイ定義を含み得る。RUOモードのADFは、サードパーティによって開発され得る。IVDモードのADFは、診断使用のために地域の規制要件に準拠したアッセイのためのアッセイ定義を含む。
図5は、3軸ピペッティングロボットを組み込んだ例示的な機器500の図を含む。一例では、機器500は、サンプル調製調製プラットフォームを組み込んだ配列決定装置であることができる。例えば、機器500は、上部および下部を含むことができる。上部は、サンプル、試薬コンテナ、および他の消耗品が置かれるデッキ510にアクセスするためのドア506を含むことができる。下部は、追加の試薬溶液および機器500の他の部品を格納するためのキャビネットを含むことができる。さらに、機器は、タッチスクリーンディスプレイ508などのユーザーインターフェースを含むことができる。
特定の例では、機器500は、配列決定機器(交換可能に使用される配列決定機器、配列決定デバイス、および配列決定装置)であることができる。いくつかの実施形態では、配列決定機器は、上部セクション、表示画面、および下部セクションを含む。いくつかの実施形態では、上部セクションは、テンプレートセクション、配列決定チップ、ならびに試薬ストリップチューブおよびキャリアを含む、配列決定機器および消耗品のコンポーネントを支持するデッキを含み得る。いくつかの実施形態では、下部セクションは、配列決定のために使用される試薬を含む試薬ボトル、および廃棄物コンテナを収容し得る。
いくつかの実施形態では、機器の上部セクションのキャビネットに取り付けられたカメラは、配列決定実行のための調製としてどのアイテムが配置されているかを監視するためにデッキに向けられている。カメラは、時間間隔で画像を取得し得る。例えば、画像は、3~4秒間隔または任意の好適な間隔で取得され得る。プロセッサは、ユーザーによるタスクの完了を検出ために、画像を分析する。プロセッサは、表示画面を介して調製における次のタスクのためのフィードバックおよび指示を提供し得る。表示画面は、ユーザーのための指示を示すために、機器コンポーネントおよび消耗品のグラフィック表現を表示し得る。
例示的な機器デッキ510は、機器デッキ600として図6に示されている。機器デッキ600は、1つのカメラまたは複数のカメラの視野で機器の上部セクションに収容されている。サンプル調製デッキは、試薬ストリップ、補給品、配列決定チップ、および他の消耗品を受容するように構成された複数の場所を含み得る。本明細書で使用されるように、消耗品は、それらが使用される場合に定期的に交換される、機器によって使用されるコンポーネントである。例えば、消耗品は、試薬および溶液のストリップまたはコンテナ、ピペットチップ、マイクロウェルアレイ、ならびに機器の恒久的なコンポーネントの一部ではない他の使い捨てコンポーネントの中の、フローセルおよび関連するセンサーを含む。
例では、機器デッキシステム600は、試験を実装するために、様々な試薬ストリップおよびコンテナ、ピペットチップ、マイクロウェルアレイ、ならびに他の消耗品にアクセスする、ピペッティングロボット602を含む。さらに、システムは、試験を実施するための機構604を含むことができる。例示的な機構604は、機械的コンベヤまたはスライドおよび流体システムを含む。
例では、機器デッキ600は、特定の構成の溶液または試薬ストリップを受容するためのトレイ606または608を含む。配列決定機器の例では、トレイ606は、適切に構成されたストリップにおけるライブラリおよびテンプレート溶液のために使用されることができ、トレイ608は、適切な構成におけるライブラリおよびテンプレート試薬を受容することができる。
さらに、機器は、デッキ上の特定の場所でマイクロウェルアレイ610および612を含む配列決定チップを受容するように構成されることができる。例えば、サンプルは、配列決定チップ612のマイクロウェルのアレイにおいて供給されることができる。別の例では、システムは、異なるストリップ構成において追加の試薬614を受容するように構成されることができる。別の例では、試薬溶液は、アレイ616において提供されることができる。さらなる例では、コンテナアレイ620は、サーモサイクラーなどの計装と組み合わせて提供されることができる。さらに、システムは、チューブなどの消耗品と共に供給され得る、遠心分離機などの他の機器を含むことができる。さらに、トレイは、ピペッティングチップ622を受容するために提供されることができる。
これらの各場所における消耗品の適切なプロビジョニングは、1つ以上のカメラを含むビジョンシステムによって監視されることができる。デッキは、試薬および他の消耗品のプロビジョニングならびに保護を追跡するための1つ以上のカメラで提供され得る。1つの計画を行うために利用されるべき試薬が不足しているとき、または試薬の消耗品が使用済み状態で存在するとき、ユーザーは、ユーザーインターフェースを通してプロンプトされることができる。
図7は、配列決定機器のワークフローを表す図である。トップレベルのステップは、ライブラリ調製、テンプレート作成、配列決定を含む。
配列決定機器のコンポーネントは、センサーアレイと流体通信するマイクロウェルアレイを含む配列決定チップ(交換可能に、マイクロチップ、チップまたはセンサーデバイス)と、複数のレーンを有するフローセルとを含み得る。図8は、4つのレーン701、702、703および704を有する配列決定チップ700の例の図である。各レーンは、それぞれの流体入口710および流体出口712によって個別にアクセスされる。代替的に、センサーデバイス700は、4つ未満のレーンまたは4つを超えるレーンを含むことができる。例えば、センサーデバイス700は、2~8レーン、または4~6レーンなど、1~10レーンを含むことができる。レーンは、互いに流体的に分離されることができる。そのため、レーンは、実行計画の態様に応じて、別々の時間に、並行して、または同時に使用されることができる。
複数のアッセイのために配列決定チップのレーンの使用を最適化することが有利である。所与のレーンは、2つ以上のサンプルを収容し得る。いくつかの実施形態では、サーバシステムソフトウェアは、以下のルールのうちの1つ以上を適用することによって、チップ使用の最適化のために提供され得る。
・単一の計画実行に含めることが可能であるアッセイの最大数は、利用可能なチップレーンの数に同じである。このルールは、新品および中古の両方のチップに適用可能である。
〇単一の計画実行において可能であるアッセイの最大数は、アッセイによって必要とされるレーンの数に応じて調整され得る。レーンの数を決定するためのルールは、以下のものを含み得る。
■レーン当たりに1つのアッセイ
■サンプル当たりのアッセイの最小読み取り数がレーン容量を超える場合は、必要とされるレーンの数、すなわち、(最小読み取り数/レーン容量)例えば、2000000/1300000=1.54レーンを計算し、2に切り上げ、それで、アッセイは、2レーンが必要である。
・選択されたアッセイの結合されたプールサイズは、8を超え得ない
〇結合されたプールサイズ=合計(各アッセイのプールサイズ)
〇AmpliSeqパネル(Thermo Fisher Scientific)について、AmpliSeqアッセイのプールサイズ=合計(DNAプールの数、RNAプールの数)
〇AmpliSeq HDパネル(Thermo Fisher Scientific)について、AmpliSeq HDアッセイのプールサイズ=TNAプールの数
・以下のルールは、PCRプロファイルのために適用され得る
〇単一の計画実行における個別のPCRプロファイル(サーモサイクリング)の数は、2を超え得ない
〇DNAおよびFusionアッセイについて、DNAサンプルおよびFusionサンプルは、別々のゾーンに割り当てられなければならない。このルールは、単一の計画実行において支持されるPCRプロファイルの数を制限する。
〇TNA、DNA、およびFusionsアッセイは、単一の計画において実行されることができる。この場合、TNAおよびRNAのためのPCRプロファイルが同じであれば、TNAおよびRNAは、同じゾーンに入って行くことができる。DNAは、別のゾーンにあり得る。
■PCRプロファイルは、アッセイ当たりに定義される。
■PCRプロファイルは、アッセイを格納するとき、データベースに格納されるアッセイ属性である
■工場出荷時のアッセイについて、PCRプロファイルは、事前にシードされている
■カスタムアッセイについて、ユーザーは、アッセイ作成中にPCRプロファイルを編集し得、これについては、アッセイ作成においてユーザーストーリーで詳しく説明される
・単一の計画実行におけるアッセイは、同じまたは異なる分析パイプラインバージョンを有することができる。
・単一の計画実行におけるアッセイは、同じまたは異なるアプリケーションの種類(DNAのみ、RNAのみ、DNA+RNAなど)にすることができる。
・単一の計画におけるすべてのアッセイのためのフローの数は、同じである必要はない。最大数のフローは、実行のために使用される。分析パイプラインは、アッセイで構成されたフローの数のためのデータのみを分析するべきである。アッセイに対応するフロー制限パラメータを設定することは、信号処理がアッセイで構成されたフローの数に制限され得る。
・単一の計画実行におけるアッセイは、異なるテンプレートサイズを有することができる。
いくつかの実施形態では、ソフトウェアは、チップの種類または容量が進行中の計画と一致しない場合に、警告メッセージを表示するように構成され得る。以下の例示的なシナリオでは、警告メッセージ付きの確認ダイアログは、ユーザーに表示されることができる。ユーザーの確認選択は、維持され、残りの検証は、新しいチップ、またはオンデッキチップを考慮するユーザーの選択に基づいて起こり得る。
・選択されたアッセイチップの種類がデッキ上のものと一致しないと、警告メッセージ「デッキ上のチップの種類が選択されたアッセイと一致しない」と共に確認ダイアログを示し、[はい]および[キャンセル]のオプションがあり、新しいチップを考慮するには[はい]をクリックし、デッキチップを使用するには[キャンセル]をクリックするか?
・選択されたアッセイの数が利用可能なレーン容量を超えていると、確認メッセージ「デッキ上のチップは、N個のアッセイのみを処理することができる、N個のレーンのみを有する」を示し、新しいチップを考慮するか?
・1つのアッセイが選択されたが、サンプル当たりの読み取り数が使用可能なレーン容量を超えていると、確認メッセージ「選択したアッセイがチップの使用可能なレーン容量を超えているため、サンプル当たりの最小読み取り数を達成できません」を示し、新しいチップを考慮するか?
〇[はい]の場合、新しいチップ検証に切り替える
〇[いいえ]の場合、ユーザーが選択されたオプションを続行することを可能にする
・[次へ]をクリックすると、ソフトウェアは、選択された各アッセイのためにレーンを割り当てなければならない。レーン割り当てルールは、以下の様になり得る。
〇レーン当たりに1つのアッセイ
〇サンプル当たりのアッセイの最小読み取り数がレーン容量を超える場合は、必要とされるレーン、すなわち、(最小読み取り数/レーン容量)例えば、2000000/1300000=1.54レーンを計算し、2に切り上げ、それで、アッセイは、2レーンが必要である。
チップレーン割り当てルールは、以下のものを含み得る。
・アッセイに割り当てられたレーン数=上限((選択されたサンプル数+制御値)xサンプル当たりの最小読み取り/レーン当たりの読み取り)
・複数のレーンがアッセイに割り当てられている場合、割り当てられたレーンは、連続していなければならない。サンプルページ上で、アッセイのために必要とされる最終レーン数が決定された後、ソフトウェアは、連続したレーン割り当てを有するために、レーン割り当てを再調整しなければならない。
図9は、配列決定チップの複数のレーンからの配列決定データを処理するためのブロック図の例である。前処理は、レーンに割り当てられたアッセイに従って、各チップレーンに対応する分析を調製し得る。例えば、サーバソフトウェアは、個々のレーンに対応するアッセイのためのパイプラインフォルダー構造および各レーンにおける各サンプルのためのフォルダー構造などのデータ構造を作成し得る。図2に関して記載されたように、信号処理、例えば、1.wellsファイルから生じる信号測定値は、並列プロセスブロック810に入力され得る。塩基呼び出しステップ820は、レーンのための複数の配列読み取りの塩基配列を決定するために、各レーンに対応する複数の信号測定に適用され得る。ステップ830では、レーン当たりのサンプル当たりの配列読み取りは、整列ステップ840に提供されている。配列読み取りは、例えば、レーン当たりのサンプル当たりのマッピングされていないBAMファイルにおいて、整列ステップに提供され得る。整列ステップ830は、配列読み取りを参照ゲノムにマッピングする。レーン当たりのサンプル当たりのマッピングされた読み取りは、サンプルおよびレーンに対応するマッピングされたBAMファイルに格納され得る。変異体呼び出しステップ850は、サンプルおよびレーンに対応するマッピングされた読み取りに、アッセイの種類に従って適用され得る。塩基呼び出しステップ820、整列ステップ840、および変異体呼び出しステップ850は、図2に関して記載されている。Keplerワークフローエンジンは、図9のステップのうちの1つ以上の処理フローを制御するために、適用され得る。変異体呼び出しステップ850がサンプルおよびレーンについて完了すると、結果は、ステップ860で報告することのために調製され得る。例えば、結果は、特定のアッセイのために、固有のPDFファイルにデータ入力し、画像ファイルを生成するために、使用され得る。ステップ870で、結果は、ユーザーに表示されるか、またはPDFファイルに提供され得る。
いくつかの実施形態では、サーバソフトウェアは、配列決定実行のために必要とされる消耗品を計算し得る。表1は、消耗品計算の例を列挙する。
Figure 2022544991000002
例示的な実施形態によれば、ローカルサーバシステムで、クラウドコンピューティングおよびストレージシステムのサーバからアッセイ定義ファイルを受信することであって、アッセイ定義ファイルが、アッセイを構成するためのコードモジュールを含む、受信することと、ローカルサーバシステムのメモリにコードモジュールを格納することと、ローカルサーバシステムで、配列決定デバイスから配列決定データを受信することであって、配列決定データがアッセイのための配列決定実行中に配列決定デバイスによって生成されている、受信することと、アッセイのための分析パイプラインを配列決定データに適用することであって、分析パイプラインが、アッセイ分析結果を生成するためにアッセイ定義ファイルからのコードモジュールに従ってローカルサーバシステムのプロセッサによって実行される分析ステップを含む、適用することと、を含む、方法が提供されている。分析パイプラインのためのコードモジュールは、塩基呼び出しステップのためのコードモジュールを含み得、塩基呼び出しステップが配列読み取りを生成する。分析パイプラインのためのコードモジュールは、整列ステップのためのコードモジュールを含み、整列ステップが整列された配列読み取りを生成する。分析パイプラインのためのコードモジュールは、変異体呼び出しステップのためのコードモジュールを含み、変異体呼び出しステップが変異体呼び出し結果を生成するために整列された配列読み取りに適用される。本方法は、変異体呼び出し結果をローカルサーバシステムのバリオームデータベースに格納することをさらに含み得る。本方法は、アッセイ分析結果を表示することをさらに含み得、表示が、アッセイのための結果提示のための画像ファイルを含む。アッセイ定義ファイルは、アッセイのための結果提示のための画像ファイルを含み得る。アッセイ定義ファイルは、参照ゲノムファイルを含み得る。アッセイ定義ファイルは、注釈ソースのリストを含み得る。分析パイプラインは、記配列決定デバイスにインストールされた配列決定チップの複数のレーンに対応する配列決定データに対して並行に適用され得る。複数のレーンの各レーンは、それぞれのアッセイに対応し得、分析パイプラインを適用するステップが、それぞれのアッセイの分析ステップをレーンのための配列決定データに適用する。本方法は、クラウドコンピューティングおよびストレージシステムからローカルサーバシステムにインポートするためのアッセイ定義ファイルの選択のために、ローカルサーバシステムのユーザーインターフェースでユーザーにページを表示することをさらに含み得る。本方法は、複数のアッセイ定義ファイルをさらに含み得、複数のアッセイ定義ファイルが、学術調査使用専用(RUO)モードアッセイ定義ファイルおよびインビトロ診断用(IVD)モードアッセイ定義ファイルを含む。
例示的な実施形態によれば、ローカルサーバシステムであって、メモリと、プロセッサであって、プロセッサによって実行されるとき、ローカルサーバシステムに、ローカルサーバシステムで、クラウドコンピューティングおよびストレージシステムのサーバからアッセイ定義ファイルを受信することであって、アッセイ定義ファイルが、アッセイを構成するためのコードモジュールを含む、受信することと、ローカルサーバシステムのメモリにコードモジュールを格納することと、ローカルサーバシステムで、配列決定デバイスから配列決定データを受信することであって、配列決定データがアッセイのための配列決定実行中に配列決定デバイスによって生成されている、受信することと、アッセイのための分析パイプラインを配列決定データに適用することであって、分析パイプラインが、アッセイ分析結果を生成するためにアッセイ定義ファイルからのコードモジュールに従ってローカルサーバシステムのプロセッサによって実行される分析ステップを含む、適用することと、を含む、方法を行うようにさせる命令を実行するように構成された、プロセッサと、を備える、ローカルサーバシステムが提供されている。分析パイプラインのためのコードモジュールは、塩基呼び出しステップのためのコードモジュールを含み得、塩基呼び出しステップが配列読み取りを生成する。分析パイプラインのためのコードモジュールは、整列ステップのためのコードモジュールを含み、整列ステップが整列された配列読み取りを生成する。分析パイプラインのためのコードモジュールは、変異体呼び出しステップのためのコードモジュールを含み、変異体呼び出しステップが変異体呼び出し結果を生成するために整列された配列読み取りに適用される。サーバシステムは、変異体呼び出し結果を格納するためのバリオームデータベースをさらに備え得る。本方法は、アッセイ分析結果を表示することをさらに含み得、表示が、アッセイのための結果提示のための画像ファイルを含む。アッセイ定義ファイルは、アッセイのための結果提示のための画像ファイルを含み得る。アッセイ定義ファイルは、参照ゲノムファイルを含み得る。アッセイ定義ファイルは、注釈ソースのリストを含み得る。分析パイプラインは、記配列決定デバイスにインストールされた配列決定チップの複数のレーンに対応する配列決定データに対して並行に適用され得る。複数のレーンの各レーンは、それぞれのアッセイに対応し得、分析パイプラインを適用するステップが、それぞれのアッセイの分析ステップをレーンのための配列決定データに適用する。本方法は、クラウドコンピューティングおよびストレージシステムからローカルサーバシステムにインポートするためのアッセイ定義ファイルの選択のために、ローカルサーバシステムのユーザーインターフェースでユーザーにページを表示することをさらに含み得る。ローカルサーバシステムは、複数のアッセイ定義ファイルをさらに含み得、複数のアッセイ定義ファイルが、学術調査使用専用(RUO)モードアッセイ定義ファイルおよびインビトロ診断用(IVD)モードアッセイ定義ファイルを含む。ローカルサーバシステムは、第1のデータベースと第2のデータベースとをさらに備え得、第1のデータベースが、操作の学術調査使用専用(RUO)モードのための情報を格納し、第2のデータベースが、操作のインビトロ診断用(IVD)モードのための情報を格納する。
様々な例示的な実施形態によれば、上記の教示および/または例示的な実施形態のうちの任意の1つ以上のうちの1つ以上の特徴は、適切に構成および/またはプログラムされたハードウェアおよび/またはソフトウェア要素を使用して行われ、または実装され得る。実施形態がハードウェアおよび/またはソフトウェア要素を使用して実装されるかどうかの判定は、任意の要因、例えば、所望の計算速度、出力レベル、耐熱性、処理サイクル予算、入力データ速度、出力データ速度、メモリリソース、データバススピードなど、および他の設計または性能の制約に基づき得る。
ハードウェア要素の例は、プロセッサ、マイクロプロセッサ、ローカルインターフェース回路を介して通信可能に連結した入力および/または出力(I/O)デバイス(または周辺機器)、回路要素(例えば、トランジスタ、抵抗器、コンデンサ、インダクタなど)、集積回路、特定用途向け集積回路(ASIC)、プログラム可能論理デバイス(PLD)、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、論理ゲート、レジスタ、半導体デバイス、チップ、マイクロチップ、チップセットなどを含み得る。ローカルインターフェースは、例えば、ハードウェアコンポーネント間の適切な通信を可能にするために、1つ以上のバスまたは他の有線もしくは無線接続、制御器、バッファ(キャッシュ)、ドライバ、リピータ、および受信機などを含み得る。プロセッサは、ソフトウェア、特にメモリに格納されているソフトウェアを実行するためのハードウェアデバイスである。プロセッサは、任意のカスタムメイドまたは市販のプロセッサ、中央処理ユニット(CPU)、コンピュータに関連付けられたいくつかのプロセッサのうちの補助プロセッサ、半導体ベースのマイクロプロセッサ(例えば、マイクロチップまたはチップセットの形態において)、マクロプロセッサ、またはソフトウェア命令を実行するための、概して任意のデバイスであることができる。プロセッサはまた、分散型処理アーキテクチャを表すことができる。I/Oデバイスは、入力デバイス、例えば、キーボード、マウス、スキャナー、マイクロフォン、タッチスクリーン、様々な医療デバイスおよび/または実験機器のためのインターフェース、バーコード読み取り機、スタイラス、レーザ読み取り機、無線周波デバイス読み取り機などを含むことができる。さらに、I/Oデバイスはまた、出力デバイス、例えば、プリンタ、バーコードプリンタ、ディスプレイなどを含むことができる。最後に、I/Oデバイスはまた、入力および出力の両方として通信するデバイス、例えば、変調器/復調器(モデム;別のデバイス、システム、またはネットワークにアクセスするため)、無線周波(RF)トランシーバまたは他のトランシーバ、電話インターフェース、ブリッジ、ルータなどをさらに含むことができる。
ソフトウェアの例は、ソフトウェアコンポーネント、プログラム、アプリケーション、コンピュータプログラム、アプリケーションプログラム、システムプログラム、マシンプログラム、オペレーティングシステムソフトウェア、ミドルウェア、ファームウェア、ソフトウェアモジュール、ルーチン、サブルーチン、関数、方法、手続き、ソフトウェアインターフェース、アプリケーションプログラムインターフェース(API)、命令セット、演算コード、コンピュータコード、コードセグメント、コンピュータコードセグメント、ワード、値、記号、またはそれらの任意の組み合わせを含み得る。メモリにおけるソフトウェアは、論理関数を実装するための実行可能な命令が順序付けられたリストを含み得る1つ以上の別個のプログラムを含み得る。メモリにおけるソフトウェアは、本教示に従ってデータ流を識別するためのシステム、ならびにシステムなどの他のコンピュータプログラムの実行を制御し得、スケジューリング、入出力制御、ファイルおよびデータ管理、メモリ管理、通信制御などを提供する任意の好適なカスタムメイドまたは市販のオペレーティングシステム(O/S)を含み得る。
様々な例示的な実施形態によれば、上記の教示および/または例示的な実施形態のうちの任意の1つ以上のうちの1つ以上の特徴は、機械によって実行された場合、例示的な実施形態による方法および/または動作を機械が行わせ得る命令または命令のセットを格納し得る、適切に構成および/またはプログラムされた非一時的機械可読媒体または物品を使用して行われ、または実装され得る。そのような機械は、例えば、任意の好適な処理プラットフォーム、コンピューティングプラットフォーム、コンピューティングデバイス、処理デバイス、コンピューティングシステム、処理システム、コンピュータ、プロセッサ、科学機器または実験機器などを含み得、ハードウェアおよび/またはソフトウェアの任意の好適な組み合わせを使用して実装され得る。機械可読媒体または物品は、例えば、任意の好適な種類のメモリユニット、メモリデバイス、メモリ物品、メモリ媒体、記憶デバイス、記憶物品、記憶媒体、および/または記憶ユニット、例えば、メモリ、取り外し可能または取り外し不可能な媒体、消去可能または消去不可能な媒体、書き込み可能または書き換え可能な媒体、デジタルまたはアナログ媒体、ハードディスク、フロッピーディスク、読み出し専用コンパクトディスク(CD-ROM)、記録可能コンパクトディスク(CD-R)、書き換え可能コンパクト(CD-RW)、光ディスク、磁気媒体、光磁気媒体、リムーバブルメモリカードまたはディスク、様々な種類のデジタル多用途ディスク(DVD)、テープ、カセットなどを含み得、コンピュータにおける使用に好適な任意の媒体を含む。メモリは、揮発性メモリ素子(例えば、ランダムアクセスメモリ(RAM、例えば、DRAM、SRAM、SDRAMなど))および不揮発性メモリ素子(例えば、ROM、EPROM、EEROM、フラッシュメモリ、ハードドライブ、テープ、CDROMなど)のうちの任意の1つまたは組み合わせを含むことができる。さらに、メモリは、電気、磁気、光、および/または他の種類の格納媒体を組み込みことができる。メモリは、様々なコンポーネントが互いから離れて位置しているが、依然としてプロセッサによってアクセスされる分散型アーキテクチャを有することができる。命令は、任意の好適な種類のコード、例えば、任意の好適な高レベル、低レベル、オブジェクト指向、ビジュアル、コンパイル済み、および/または解釈されたプログラミング言語を使用して実装された、ソースコード、コンパイル済みコード、解釈されたコード、実行可能コード、静的コード、動的コード、暗号化されたコードなどを含み得る。
様々な例示的な実施形態によれば、上記の教示および/または例示的な実施形態のうちの任意の1つ以上のうちの1つ以上の特徴は、分散型、クラスタ、リモート、またはクラウドコンピューティングおよびストレージシステムを少なくとも部分的に使用して行われ、または実装され得る。いくつかの実施形態では、1人以上のユーザーは、イントラネットおよび/またはインターネットを介して、クラウドコンピューティングおよびストレージシステムのコンピュータ、またはサーバにアクセスすることができる。いくつかの実施形態では、ユーザーは、ウェブクライアントを通じてクラウドコンピューティングおよびストレージシステムサーバに遠隔的にアクセスし得る。
様々な例示的な実施形態によれば、上記の教示および/または例示的な実施形態のうちの任意の1つ以上のうちの1つ以上の特徴は、ソースプログラム、実行可能プログラム(目的コード)、スクリプト、または行われる命令のセットを含む任意の他のエンティティを使用して行われ、または実装され得る。ソースプログラムであるときに、プログラムは、O/Sと接続して正常に動作するように、メモリ内に含まれ得る、または含まれない場合がある、コンパイラ、アセンブラ、インタープリタなどを介して翻訳されることができる。命令は、(a)データおよび方法のクラスを有するオブジェクト指向プログラミング言語、または(b)例えば、C、C++、R、Pascal、Basic、Fortran、Cobol、Perl、Python、Java、およびAdaを含み得る、ルーチン、サブルーチン、および/または機能を有する手続き型プログラミング言語を使用して書き込まれ得る。
様々な例示的な実施形態によれば、上記の例示的な実施形態のうちの1つ以上は、ユーザーインタフェースデバイス、コンピュータ可読記憶媒体、ローカルコンピュータシステム、またはリモートコンピュータシステムに、そのような例示的な実施形態によって生成、アクセス、または使用された任意の情報、信号、データ、および/または中間もしくは最終結果を伝達、表示、保存、印刷、または出力することを含み得る。そのような伝送、表示、格納、印刷、または出力された情報は、例えば、実行および報告、画像、表、チャート、グラフ、スプレッドシート、相関、配列、ならびにそれらの組み合わせの検索可能および/またはフィルタリング可能なリストの形式を取ることができる。
好ましい実施形態が本明細書において示され、記載されてきたが、そのような実施形態が単に例として提供されることは、当業者には明らかであろう。多数の変動、変更、および置換は、本発明から逸脱することなく当業者には思いつくであろう。本明細書に記載の本発明の実施形態に対する様々な代替案が、本発明を実施することにおいて採用され得ることを理解されたい。以下の特許請求の範囲は、本発明の範囲を定義し、これらの特許請求の範囲の範囲内の方法および構造、ならびにそれらの等価物が、それによって網羅されることが意図される。

Claims (20)

  1. ローカルサーバシステムで、クラウドコンピューティングおよびストレージシステムのサーバからアッセイ定義ファイルを受信することであって、前記アッセイ定義ファイルが、アッセイを構成するためのコードモジュールを含む、受信することと、
    前記ローカルサーバシステムのメモリに前記コードモジュールを格納することと、
    前記ローカルサーバシステムで、配列決定デバイスから配列決定データを受信することであって、前記配列決定データが前記アッセイのための配列決定実行中に前記配列決定デバイスによって生成されている、受信することと、
    前記アッセイのための分析パイプラインを前記配列決定データに適用することであって、前記分析パイプラインが、アッセイ分析結果を生成するために前記アッセイ定義ファイルからの前記コードモジュールに従って前記ローカルサーバシステムのプロセッサによって実行される分析ステップを含む、適用することと、を含む、
    方法。
  2. 前記分析パイプラインのための前記コードモジュールが、塩基呼び出しステップのためのコードモジュールを含み、前記塩基呼び出しステップが配列読み取りを生成する、請求項1に記載の方法。
  3. 前記分析パイプラインのための前記コードモジュールが、整列ステップのためのコードモジュールを含み、前記整列ステップが整列された配列読み取りを生成する、請求項2に記載の方法。
  4. 前記分析パイプラインのための前記コードモジュールが、変異体呼び出しステップのためのコードモジュールを含み、前記変異体呼び出しステップ、が変異体呼び出し結果を生成するために前記整列された配列読み取りに適用される、請求項3に記載の方法。
  5. 前記変異体呼び出し結果を前記ローカルサーバシステムのバリオームデータベースに格納することをさらに含む、請求項4に記載の方法。
  6. 前記アッセイ分析結果を表示することをさらに含み、前記表示が、前記アッセイのための結果提示のための画像ファイルを含む、請求項1に記載の方法。
  7. 前記アッセイ定義ファイルが、前記アッセイのための前記結果提示のための前記画像ファイルを含む、請求項6に記載の方法。
  8. 前記アッセイ定義ファイルが、参照ゲノムファイルを含む、請求項1に記載の方法。
  9. 前記アッセイ定義ファイルが、注釈ソースのリストを含む、請求項1に記載の方法。
  10. 前記分析パイプラインが、前記配列決定デバイスにインストールされた配列決定チップの複数のレーンに対応する前記配列決定データに対して並行に適用されている、請求項1に記載の方法。
  11. 前記複数のレーンの各レーンが、それぞれのアッセイに対応し、分析パイプラインを適用するステップが、前記それぞれのアッセイの前記分析ステップを前記レーンのための前記配列決定データに適用する、請求項10に記載の方法。
  12. 前記クラウドコンピューティングおよび前記ストレージシステムから前記ローカルサーバシステムにインポートするための前記アッセイ定義ファイルの選択のために、前記ローカルサーバシステムのユーザーインターフェースでユーザーにページを表示することをさらに含む、請求項1に記載の方法。
  13. 複数のアッセイ定義ファイルをさらに含み、前記複数のアッセイ定義ファイルが、学術調査使用専用(RUO)モードアッセイ定義ファイルおよびインビトロ診断用(IVD)モードアッセイ定義ファイルを含む、請求項1に記載の方法。
  14. ローカルサーバシステムであって、
    メモリと、
    プロセッサであって、前記プロセッサによって実行されるとき、前記ローカルサーバシステムに、
    前記ローカルサーバシステムで、クラウドコンピューティングおよびストレージシステムのサーバからアッセイ定義ファイルを受信することであって、前記アッセイ定義ファイルが、アッセイを構成するためのコードモジュールを含む、受信することと、
    前記ローカルサーバシステムの前記メモリに前記コードモジュールを格納することと、
    前記ローカルサーバシステムで、配列決定デバイスから配列決定データを受信することであって、前記配列決定データが前記アッセイのための配列決定実行中に前記配列決定デバイスによって生成されている、受信することと、
    前記アッセイのための分析パイプラインを前記配列決定データに適用することであって、前記分析パイプラインが、アッセイ分析結果を生成するために前記アッセイ定義ファイルからの前記コードモジュールに従って前記ローカルサーバシステムの前記プロセッサによって実行される分析ステップを含む、適用することと、を含む、方法を行うようにさせる命令を実行するように構成された、
    プロセッサと、を備える、
    ローカルサーバシステム。
  15. 前記分析パイプラインのための前記コードモジュールが、塩基呼び出しステップのためのコードモジュールを含み、前記塩基呼び出しステップが、配列読み取りを生成する、請求項14に記載のローカルサーバシステム。
  16. 前記分析パイプラインのための前記コードモジュールが、整列ステップのためのコードモジュールを含み、前記整列ステップが、整列された配列読み取りを生成する、請求項15に記載のローカルサーバシステム。
  17. 前記分析パイプラインのための前記コードモジュールが、変異体呼び出しステップのためのコードモジュールを含み、前記変異体呼び出しステップが、変異体呼び出し結果を生成するために前記整列された配列読み取りに適用される、請求項16に記載のローカルサーバシステム。
  18. 前記変異体呼び出し結果を格納するためのバリオームデータベースをさらに備える、請求項17に記載のローカルサーバシステム。
  19. 複数のアッセイ定義ファイルをさらに含み、前記複数のアッセイ定義ファイルが、学術調査使用専用(RUO)モードアッセイ定義ファイルおよびインビトロ診断用(IVD)モードアッセイ定義ファイルを含む、請求項14に記載のローカルサーバシステム。
  20. 第1のデータベースと第2のデータベースとをさらに備え、前記第1のデータベースが、操作の学術調査使用専用(RUO)モードのための情報を格納し、前記第2のデータベースが、操作のインビトロ診断用(IVD)モードのための情報を格納する、請求項14に記載のローカルサーバシステム。
JP2022510953A 2019-08-20 2020-07-31 配列決定デバイスの制御のための方法 Pending JP2022544991A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962889109P 2019-08-20 2019-08-20
US62/889,109 2019-08-20
US202062704806P 2020-05-29 2020-05-29
US62/704,806 2020-05-29
PCT/US2020/044534 WO2021034484A1 (en) 2019-08-20 2020-07-31 Methods for control of a sequencing device

Publications (1)

Publication Number Publication Date
JP2022544991A true JP2022544991A (ja) 2022-10-24

Family

ID=72139707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022510953A Pending JP2022544991A (ja) 2019-08-20 2020-07-31 配列決定デバイスの制御のための方法

Country Status (5)

Country Link
US (1) US20210057090A1 (ja)
EP (1) EP4018452A1 (ja)
JP (1) JP2022544991A (ja)
CN (1) CN114223035A (ja)
WO (1) WO2021034484A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024063995A1 (en) * 2022-09-20 2024-03-28 Illumina, Inc. Multi-version processing using a monitor subsystem

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2591433A4 (en) 2010-07-06 2017-05-17 Life Technologies Corporation Systems and methods to detect copy number variation
US10273540B2 (en) 2010-10-27 2019-04-30 Life Technologies Corporation Methods and apparatuses for estimating parameters in a predictive model for use in sequencing-by-synthesis
EP3141614B1 (en) 2010-10-27 2018-11-28 Life Technologies Corporation Predictive model for use in sequencing-by-synthesis
US20130090860A1 (en) 2010-12-30 2013-04-11 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
US8594951B2 (en) 2011-02-01 2013-11-26 Life Technologies Corporation Methods and systems for nucleic acid sequence analysis
WO2013055822A2 (en) 2011-10-11 2013-04-18 Life Technologies Corporation Systems and methods for analysis and interpretation of nucleic acid sequence data
US20130345066A1 (en) 2012-05-09 2013-12-26 Life Technologies Corporation Systems and methods for identifying sequence variation
US20140052381A1 (en) 2012-08-14 2014-02-20 Life Technologies Corporation Systems and Methods for Detecting Homopolymer Insertions/Deletions
US20140222349A1 (en) * 2013-01-16 2014-08-07 Assurerx Health, Inc. System and Methods for Pharmacogenomic Classification
US9805407B2 (en) * 2013-01-25 2017-10-31 Illumina, Inc. Methods and systems for using a cloud computing environment to configure and sell a biological sample preparation cartridge and share related data
CN105359151B (zh) 2013-03-06 2019-04-05 生命科技股份有限公司 用于确定拷贝数变异的系统和方法
US20140296080A1 (en) 2013-03-14 2014-10-02 Life Technologies Corporation Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood
US9953130B2 (en) 2013-10-01 2018-04-24 Life Technologies Corporation Systems and methods for detecting structural variants
US9890424B2 (en) * 2014-06-17 2018-02-13 Life Technologies Corporation Sequencing device
WO2016011378A1 (en) 2014-07-18 2016-01-21 Life Technologies Corporation Systems and methods for detecting structural variants
US20160048608A1 (en) * 2014-08-15 2016-02-18 Good Start Genetics, Inc. Systems and methods for genetic analysis
CN107111692B (zh) 2014-10-10 2021-10-29 生命科技股份有限公司 用于计算经校正扩增子覆盖度的方法、系统及计算机可读媒体
CN110914911B (zh) 2017-05-16 2023-09-22 生命科技股份有限公司 压缩分子标记的核酸序列数据的方法
JP6997287B2 (ja) * 2017-07-10 2022-02-03 ジェン-プローブ・インコーポレーテッド 試料割り当てパラメータを使用した核酸増幅のための分析システムおよび方法
JP7171709B2 (ja) 2017-09-20 2022-11-15 ライフ テクノロジーズ コーポレイション 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法
EP3721232A1 (en) * 2017-12-05 2020-10-14 DiscernDx, Inc. Robust panels of colorectal cancer biomarkers
WO2020061524A1 (en) * 2018-09-20 2020-03-26 13.8, Inc. METHODS OF MULTIPLEX dPCR ASSAYS AND SHORT-READ SEQUENCING ASSAYS
US20200157600A1 (en) * 2018-11-19 2020-05-21 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification

Also Published As

Publication number Publication date
US20210057090A1 (en) 2021-02-25
WO2021034484A1 (en) 2021-02-25
CN114223035A (zh) 2022-03-22
EP4018452A1 (en) 2022-06-29

Similar Documents

Publication Publication Date Title
US20210265012A1 (en) Systems and methods for use of known alleles in read mapping
Strom Current practices and guidelines for clinical next-generation sequencing oncology testing
Aziz et al. College of American Pathologists' laboratory standards for next-generation sequencing clinical tests
US20190172549A1 (en) Systems and methods for analysis and interpretation of nucliec acid sequence data
De et al. Bioinformatics challenges in genome-wide association studies (GWAS)
Zook et al. Reproducible integration of multiple sequencing datasets to form high-confidence SNP, indel, and reference calls for five human genome reference materials
Korpelainen et al. RNA-seq data analysis: a practical approach
Sante et al. ViVar: a comprehensive platform for the analysis and visualization of structural genomic variation
Sboner et al. A primer on precision medicine informatics
Agapito et al. DMET-Miner: Efficient discovery of association rules from pharmacogenomic data
Ulintz et al. Bioinformatics analysis of whole exome sequencing data
Ganschow et al. toaSTR: A web application for forensic STR genotyping by massively parallel sequencing
WO2018106884A1 (en) Methods for detecting mutation load from a tumor sample
Schnekenberg et al. Next-generation sequencing in childhood disorders
Roy et al. SeqReporter: automating next-generation sequencing result interpretation and reporting workflow in a clinical laboratory
Ahmed et al. JWES: a new pipeline for whole genome/exome sequence data processing, management, and gene‐variant discovery, annotation, prediction, and genotyping
SoRelle et al. Assembling and validating bioinformatic pipelines for next-generation sequencing clinical assays
US20200075122A1 (en) Methods for detecting mutation load from a tumor sample
JP2022544991A (ja) 配列決定デバイスの制御のための方法
Yuan et al. One Size Doesn't Fit All-RefEditor: Building Personalized Diploid Reference Genome to Improve Read Mapping and Genotype Calling in Next Generation Sequencing Studies
Dhiman et al. Next-generation sequencing: a transformative tool for vaccinology
Nodehi et al. Selection of optimal bioinformatic tools and proper reference for reducing the alignment error in targeted sequencing data
Crockett et al. Bioinformatics tools in clinical genomics
Li et al. Multi-platform and cross-methodological reproducibility of transcriptome profiling by RNA-seq in the ABRF next-generation sequencing study
Guzzi et al. Micro-Analyzer: Automatic preprocessing of Affymetrix microarray data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230714