JP2021530203A

JP2021530203A - 試料同一性保証のための方法およびシステム

Info

Publication number: JP2021530203A
Application number: JP2020571427A
Authority: JP
Inventors: ヤンディン; セルゲイバタロフ
Original assignee: レディチルドレンズホスピタルリサーチセンター
Priority date: 2018-06-29
Filing date: 2019-06-28
Publication date: 2021-11-11
Also published as: EP3815091A4; US20200005894A1; IL279770A; AU2019291926A1; EP3815091A1; WO2020006431A1

Abstract

本開示は、対立遺伝子型決定を含む遺伝子解析のための方法、ならびにそのような解析を実装するためのシステムを提供する。

Description

関連出願の相互参照
本出願は、米国特許法第１１９条（ｅ）の下で、２０１８年６月２９日に出願された、米国特許仮出願第６２／６９２，３６６号の優先権の利益を主張し、その全体内容が、参照によりその全体において本明細書に組み込まれる。

配列表の組み込み
添付の配列表のデータは、本明細書において、参照により本出願に組み込まれる。添付の配列表テキストファイルＲＡＤＹ＿１ＷＯ＿Ｓｅｑｕｅｎｃｅ＿Ｌｉｓｔｉｎｇ．ｔｘｔは、２０１９年６月２５日に作成され、８ｋｂである。ファイルは、ＷｉｎｄｏｗｓＯＳを使用しているコンピュータでＭｉｃｒｏｓｏｆｔＷｏｒｄを使用してアクセスすることができる。

発明の分野
本発明は、概して、遺伝子解析に関し、より具体的には、試料同一性を確実にするための対立遺伝子型決定のための方法およびシステムに関する。

次世代配列決定（ＮＧＳ）プラットフォームを使用する全ゲノム配列決定（ＷＧＳ）、全エクソーム配列決定（ＷＥＳ）、および標的遺伝子パネル配列決定は、複数の手順ステップを伴う複雑なプロセスである。ＮＧＳにおけるプロセス中の試料交換または汚染は、偽陽性バリアント検出および遺伝子型誤分類をもたらし得る。プロセス全体の試料同一性の保証は、重要な品質管理コンポーネントである。正しい試料同一性を確実にするプロセスは、配列決定施設の課題である。

現在、いくつかのＮＧＳ施設は、アレイベースの遺伝子型決定を実施し、一塩基多型（ＳＮＰ）を使用して、ＮＧＳデータから呼び出される遺伝子型プロファイリングと、アレイベースの遺伝子型データ（ＳＮＰマイクロアレイ）から呼び出される遺伝子型プロファイリングとの間の一致を取得している。特定のプロセスに関連する、または関連しないエラーは、アレイベース遺伝子型決定において発生し得、ＳＮＰアレイデータとＮＧＳデータとの間の不整合な遺伝子型呼び出しをもたらし得ることが知られている。一方、ＮＧＳの深度カバレッジは、ＮＧＳデータからのＳＮＰ呼び出し、特に低マイナー対立遺伝子頻度（ＭＡＦ）ＳＮＰに影響を与える。ＮＧＳパネル配列決定のために、カスタム設計されたアレイワークフローは、ＮＧＳパネルデータとＳＮＰマイクロアレイデータとの間の一致を最適化するように、作成されなければならない。ワークフローは、完了するのに２〜３日を必要とする。追加的に、比較的試料量が少ない研究所では、初期計測、コストの修正、および人員配置モデルを開発する必要があり得る。

正しい試料同一性を保証するための改善された方法は、遺伝子解析を実施するときに、必要とされる。

本発明は、対立遺伝子型決定を介して遺伝子解析を行うための方法およびシステムを提供する。本方法は、正しい試料同一性を確実にするために、異なるタイプの対立遺伝子型決定技術の組み合わせを利用する。

したがって、一態様において、本発明は、遺伝子解析を実施するための方法を提供する。本方法は、
（ａ）短鎖縦列反復（ＳＴＲ）増幅を介して試料の第１の対立遺伝子型を決定することと、
（ｂ）遺伝子配列決定を介して試料の第２の対立遺伝子型を決定することと、
（ｃ）第１の対立遺伝子型と第２の対立遺伝子型との間の対立遺伝子一致を決定することと、を含む。

実施形態において、本方法は、対立遺伝子プロファイリング一致表を生成することをさらに含む。一実施形態において、本方法は、第１の対立遺伝子型および第２の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することを含む。

様々な実施形態において、遺伝子配列決定は、全ゲノム配列決定（ＷＧＳ）または急速全ゲノム配列決定（ｒＷＧＳ）または全エクソーム配列決定（ＷＥＳ）、次世代配列（ＮＧＳ）、標的遺伝子パネル配列決定、またはそれらの組み合わせを含む。

配列決定が、ＷＥＳまたは標的遺伝子パネル配列決定を含む実施形態において、これらの用途において対立遺伝子型決定を可能にする、配列番号１〜４１から選択される１つ以上のオリゴヌクレオチドを有するパネルが、利用される。

したがって、本発明は、配列番号１〜４１から選択される１つ以上のオリゴヌクレオチドを有するパネルをさらに提供する。実施形態において、各オリゴヌクレオチドは、約５０〜１２０ヌクレオチドの長さである。一実施形態において、各オリゴヌクレオチドは、約５０ヌクレオチド以上の長さである。一実施形態において、各オリゴヌクレオチドは、１２０ヌクレオチド以下の長さである。

一実施形態において、本発明は、本開示の方法を実施するように構成されている遺伝子解析システムを提供する。システムは、（ａ）メモリに動作可能に接続されている少なくとも１つのプロセッサと、（ｂ）ＤＮＡ試料中のＤＮＡのＰＣＲ増幅から生成された配列情報を含むＤＮＡ解析情報を受信するように構成されている受信機コンポーネントと、（ｃ）少なくとも１つのプロセッサによって実行され、本開示の方法、例えば、対立遺伝子型を決定して、対立遺伝子プロファイリング一致表を生成し、そして、第１の対立遺伝子型および第２の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することを実施するように構成されている、解析コンポーネントと、を含む。

別の実施形態において、本発明は、本発明の方法を実施するためのシステムを提供する。システムは、少なくとも１つのプロセッサと、非一時的メモリとを有するコントローラを含む。コントローラは、本明細書に記載される方法のプロセスのうちの１つ以上を実施するように構成されている。

さらに別の実施形態において、本発明は、コンピュータプログラムで符号化された非一時的なコンピュータ可読格納媒体を提供する。プログラムは、１つ以上のプロセッサによって実行されるときに、１つ以上のプロセッサに、本開示の方法を実装する動作を実施させる、命令を含む。

また別の実施形態において、本発明は、コンピューティングシステムを提供する。システムは、メモリと、メモリに結合された１つ以上のプロセッサとを含み、１つ以上のプロセッサは、本開示の方法を実装する動作を実施するように構成される。

発明の詳細な説明
本発明は、複数の対立遺伝子型決定技術の組み合わせを含む、試料同一性を確実にするための革新的な方法に基づく。本開示の方法論は、試料同一性を保証して、異なる試料間の潜在的な交差汚染を検出するために、ＧｌｏｂａｌＦｉｌｅｒ（商標）ＰＣＲ増幅キットによって、およびＬｏｂＳＴＲ（商標）ソフトウェアを使用してＮＧＳによって生成されたＳＴＲ（短鎖縦列反復）対立遺伝子プロファイリングの一致を比較することを含む。

ＧｌｏｂａｌＦｉｌｅｒ（商標）パネルは、ヒトゲノム内の２４の位置の対立遺伝子状態の決定、ならびに２つ以上の試料の汚染（混合）の事象の特定を可能にする。ＷＧＳまたはＷＥＳまたはＮＧＳパネル上の計算ワークフロー（配列番号１〜４１のオリゴヌクレオチドがプールダウンプローブ設計に含まれている）データセットは、コンピュータ上での（ｉｎｓｉｌｉｃｏ）ＳＴＲ推論ソフトウェア（ｌｏｂＳＴＲ（商標）など）を使用して、ヒトゲノム内の同じ２４の位置の対立遺伝子状態の独立した決定を可能にする。２４の位置のうち１８以上が一致しているならば２つの試料は同じ個体由来であったという統計的枠組みは、いかなる合理的な疑いも排除する（１／１，０００，０００，０００，０００，０００未満の誤差の確率）ことを可能にするものである。

ＳＴＲによって予測された対立遺伝子型プロファイリングと、ＷＧＳまたはＷＥＳによって予測された対立遺伝子型プロファイリングとの間の一致は、高い一貫性がある。ＧｌｏｂａｌＦｉｌｅｒ（商標）を使用したＳＴＲ遺伝子型決定は、高精度および高感度で一貫した遺伝子座プロファイリングを生成することができる。ワークフローは、比較的シンプルかつ簡単であり、実験室の技術者は４〜６時間以内に完了させる。ＳＴＲ反応を設定することは、マイクロアレイほど大きなバッチセットを必要としない。さらに、バッチ中の比較的小さな試料セットにより、試薬は失われない。

本組成物および方法を記載する前に、本発明は、記載される特定の方法および実験条件に限定されず、そのような組成物、方法および条件は、変動し得ることを理解されたい。また、本明細書で使用される用語は、特定の実施形態を記載することのみを目的としており、本発明の範囲は、添付の特許請求の範囲にのみ限定されるため、限定することを意図するものではないことも理解されたい。

本明細書および添付の特許請求の範囲で使用されるように、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈が明示的に別段の指示に示さない限り、複数形の参照を含む。したがって、例えば、「方法」への参照は、この開示などを読むと当業者に明らかになるであろう、本明細書に記載されるタイプの１つ以上の方法、および／またはステップを含む。

別段の定義がない限り、本明細書で使用される全ての技術用語および科学用語は、本発明が属する当業者によって一般に理解される意味と同じ意味を有する。本明細書に記載されるものと類似または同等の任意の方法および材料は、本発明の実践または試験に使用されることができるが、好ましい方法および材料は、ここに記載される。

方法
本発明は、対立遺伝子型決定を介して遺伝子解析を行うための方法を提供する。本方法は、試料同一性を確実にするために、異なるタイプの対立遺伝子型決定技術の組み合わせを利用する。

本開示の方法は、対立遺伝子型を生成するための遺伝子配列決定を企図する。

配列決定は、当該技術分野で既知の任意の方法によって行われ得る。配列決定方法は、Ｍａｘａｍ−Ｇｉｌｂｅｒｔ配列決定に基づく技法、鎖終了に基づく技法（ｃｈａｉｎ−ｔｅｒｍｉｎａｔｉｏｎ−ｂａｓｅｄｔｅｃｈｎｉｑｕｅｓ）、ショットガン配列決定、架橋ＰＣＲ配列決定、単一分子リアルタイム配列決定、イオン半導体配列決定（ＩｏｎＴｏｒｒｅｎｔ（商標）配列決定）、ナノポア配列決定、パイロシークエンス（４５４）、合成による配列決定、ライゲーションによる配列決定（ＳＯＬｉＤ（商標）配列決定）、電子顕微鏡による配列決定、ジデオキシ配列決定反応（Ｓａｎｇｅｒ法）、大規模並列配列決定、ポロニー配列決定、およびＤＮＡナノボール配列決定を含むが、これらに限定されない。いくつかの実施形態において、配列決定は、プライマーをテンプレートにハイブリダイズしてテンプレート／プライマー二本鎖を形成すること、ポリメラーゼがテンプレート依存的な様式でプライマーにヌクレオチドを付加するのを可能にする条件下で、検出可能に標識されたヌクレオチドの存在下で二本鎖をポリメラーゼ酵素と接触させること、組み込まれた標識ヌクレオチドからのシグナルを検出すること、少なくとも１回、接触および検出ステップを連続的に繰り返すことを含み、組み込まれた標識ヌクレオチドの連続検出は、核酸の配列を決定する。いくつかの実施形態において、配列決定は、対の末端リードを取得することを含む。

いくつかの実施形態において、核酸の配列決定は、全ゲノム配列決定（ＷＧＳ）、急速ＷＧＳ、全エクソーム配列決定（ＷＥＳ）、標的遺伝子パネル配列決定、次世代配列決定（ＮＧＳ）、またはそれらの任意の組み合わせを使用して実施される。いくつかの実施形態において、標的配列決定が実施されており、ＤＮＡまたはＲＮＡ配列決定のいずれかであり得る。標的配列決定は、全ゲノムのサブセットに対するものであり得る。いくつかの実施形態において、標的配列決定は、イントロン、エクソン、非コード配列、またはそれらの組み合わせに対するものである。ＤＮＡは、大規模並列配列決定であるＮＧＳプラットフォームを使用して配列決定される。ＮＧＳ技術は高スループット配列情報を提供し、目的の配列に整列する各配列リードがカウント可能であるという点で、デジタル定量情報を提供する。特定の実施形態において、クローン増幅されたＤＮＡテンプレートまたは単一のＤＮＡ分子は、フローセル内で（例えば、国際公開第ＷＯ２０１４／０１５０８４号に記載されるように）大規模並列様式で配列決定される。高スループット配列情報に加えて、ＮＧＳは、各配列リードがカウント可能であり、個々のクローナルＤＮＡテンプレートまたは単一のＤＮＡ分子を表すという点で、定量的情報を提供する。ＮＧＳの配列決定技術は、パイロシークエンス、可逆的ダイターミネーターを用いた合成による配列決定、オリゴヌクレオチドプローブライゲーションによる配列決定、およびイオン半導体配列決定を含む。個々の試料由来のＤＮＡを個別に配列決定することができ（すなわち、単一配列決定）、または複数の試料由来のＤＮＡをプールして、一回の配列決定ランでインデックス化ゲノム分子として配列決定して（すなわち、多重配列決定）、最大数億リードのＤＮＡ配列を生成することができる。市販のプラットフォームに、例えば、合成による配列決定、イオン半導体配列決定、パイロシークエンス、可逆的ダイターミネーター配列決定、ライゲーションによる配列決定、単一分子配列決定、ハイブリダイゼーションによる配列決定、およびナノポア配列決定のためのプラットフォームを含む。実施形態において、本開示の方法論は、Ｉｌｌｕｍｉｎａ，Ｉｎｃ（ＨｉＳｅｑ（商標）Ｘ１０、ＨｉＳｅｑ（商標）１０００、ＨｉＳｅｑ（商標）２０００、ＨｉＳｅｑ（商標）２５００、ＨｉＳｅｑ（商標）４０００、ＮｏｖａＳｅｑ（商標）５０００、ＮｏｖａＳｅｑ（商標）６０００、ＧｅｎｏｍｅＡｎａｌｙｚｅｒｓ（商標）、ＭｉＳｅｑ（商標）システム）、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＡＢＩＰＲＩＳＭ（商標）配列検出システム、ＳＯＬｉＤ（商標）システム、ＩｏｎＰＧＭ（商標）シーケンサー、イオンＰｒｏｔｏｎ（商標）シーケンサーなどのシステムを利用する。

「ポリヌクレオチド」、「ヌクレオチド配列」、「核酸」、および「オリゴヌクレオチド」という用語は、同義に使用される。これらは、デオキシリボヌクレオチドもしくはリボヌクレオチド、またはその誘導体のいずれかの任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の三次元構造を有し得、既知または未知の任意の機能を実施し得る。ポリヌクレオチドは、一本鎖もしくは多本鎖（例えば、一本鎖、二本鎖、および三重らせん）であり得、修飾ヌクレオチドまたは塩基もしくはそれらの誘導体を含む、デオキシリボヌクレオチド、リボヌクレオチド、および／またはデオキシリボヌクレオチドもしくはリボヌクレオチドの誘導体もしくは修飾形態を含有する。遺伝子コードが縮重しているため、２つ以上のコドンは、特定のアミノ酸をコードするために使用され得、本発明は、特定のアミノ酸配列をコードするポリヌクレオチドを包含する。ヌクレアーゼ耐性を増加させる修飾（例えば、デオキシ、２’−Ｏ−Ｍｅ、ホスホロチオエートなど）を含む使用条件下でポリヌクレオチドが所望の官能性を保持する限り、任意のタイプの修飾ヌクレオチドまたはヌクレオチド誘導体が使用され得る。標識は、検出または捕捉、例えば、放射性もしくは非放射性標識またはアンカー、例えば、ビオチンの目的のために組み込まれ得る。ポリヌクレオチドという用語はまた、ペプチド核酸（ＰＮＡ）も含む。ポリヌクレオチドは、天然に存在し得るか、または非天然に存在し得る。ポリヌクレオチドは、ＲＮＡ、ＤＮＡ、またはその両方、および／または修飾形態および／またはそれらの誘導体を含有し得る。ヌクレオチドの配列は、非ヌクレオチドコンポーネントによって中断され得る。１つ以上のホスホジエステル結合は、代替の連結基によって置き換えられ得る。これらの代替の連結基は、リン酸塩が、Ｐ（Ｏ）Ｓ（「チオエート」）、Ｐ（Ｓ）Ｓ（「ジチオエート」）、（Ｏ）ＮＲ_２（「アミデート」）、Ｐ（Ｏ）Ｒ、Ｐ（Ｏ）ＯＲ’、ＣＯまたはＣＨ_２（「ホルムアセタール」）で置き換えられる実施形態を含むが、これらに限定されず、各ＲまたはＲ’は、独立して、Ｈ、または任意にエーテル（−−Ｏ−−）連結、アリール、アルケニル、シクロアルキル、シクロアルケニル、もしくはアラルジルを含有する、置換もしくは非置換アルキル（１〜２０Ｃ）である。以下は、ポリヌクレオチドの非限定的な例である：遺伝子または遺伝子断片のコード領域または非コード領域、遺伝子間ＤＮＡ、結合解析から定義される遺伝子座（遺伝子座）、エクソン、イントロン、メッセンジャーＲＮＡ（ｍＲＮＡ）、トランスファーＲＮＡ、リボソームＲＮＡ、短い干渉ＲＮＡ（ｓｉＲＮＡ）、短いヘアピンＲＮＡ（ｓｈＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、小ヌクレオラールＲＮＡ、リボザイム、ｃＤＮＡ、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたＤＮＡ、任意の配列の単離されたＲＮＡ、核酸プローブ、アダプター、およびプライマー。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド誘導体などの修飾ヌクレオチドを含み得る。存在する場合、ヌクレオチド構造への修飾は、ポリマーの組立の前または後に得られ得る。ヌクレオチドの配列は、非ヌクレオチドコンポーネントによって中断され得る。ポリヌクレオチドは、標識コンポーネント、タグ、反応性部分、または結合パートナーとのコンジュゲーションなどにより、重合後にさらに修飾され得る。特に明記しない限り、ポリヌクレオチド配列は、提供される場合、５’〜３’方向に列挙される。

実施形態において、配列決定は、オリゴヌクレオチドのパネルの使用を含む。例えば、パネルは、配列決定が、ＷＥＳまたは標的遺伝子パネル配列決定を含む場合に、有用である。

したがって、本発明は、１つ以上のオリゴヌクレオチドを有するパネルを提供する。実施形態において、オリゴヌクレオチドは、表Ｉに示すように、配列番号１〜４１から選択される１つ以上のオリゴヌクレオチドを含む。

本発明のポリヌクレオチド、例えば、本発明のパネルのオリゴヌクレオチドは、任意の好適な長さのＤＮＡまたはＲＮＡ分子であり得る。例えば、当業者は、標的遺伝子パネルで利用されるオリゴヌクレオチドに好適な長さを理解するだろう。かかる分子は、典型的には、約５０〜１５０、５０〜１４０、５０〜１３０、５０〜１２０、５０〜１１０、５０〜１００、５０〜１００、５０〜９０、５０〜８０、５０〜７０、または５０〜６０ヌクレオチドの長さである。例えば、分子は、約５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１０５、１１０、１１５、または１２０ヌクレオチドの長さであり得る。かかるポリヌクレオチドは、少なくとも約５０ヌクレオチド、少なくとも約５５ヌクレオチド、少なくとも約６０ヌクレオチド、少なくとも約６５ヌクレオチド、少なくとも約７０ヌクレオチド、少なくとも約７５ヌクレオチド、少なくとも約８０ヌクレオチド、少なくとも約８５ヌクレオチド、少なくとも約９０ヌクレオチド、少なくとも約９５ヌクレオチド、少なくとも約１００ヌクレオチド、少なくとも約１１０ヌクレオチド、少なくとも約１２０ヌクレオチドまたは１２０ヌクレオチド超を含む、少なくとも約５０〜約１２０ヌクレオチド以上を含み得る。

本明細書で使用される場合、「ポリペプチド」は、アミノ酸から構成され、当業者によってタンパク質として認識される組成物を指す。アミノ酸残基のための従来の１文字または３文字のコードは、本明細書で使用される。「ポリペプチド」および「タンパク質」は、本明細書では、任意の長さのアミノ酸のポリマーを指すように同義に使用される。ポリマーは、直鎖状、または分岐状であり得、修飾アミノ酸を含み得、非アミノ酸によって中断され得る。この用語はまた、天然にまたは介入によって修飾されたアミノ酸ポリマー、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、または任意の他の操作もしくは修飾、例えば、標識コンポーネントとのコンジュゲーションも包含する。また、定義には、例えば、アミノ酸（例えば、非天然アミノ酸、合成アミノ酸などを含む）の１つ以上の誘導体を含有するポリペプチド、ならびに当該技術分野で既知の他の修飾も含まれる。

本明細書で使用される場合、本明細書で「試料」という用語は、核酸を含有するか、または核酸を含有すると推定される任意の物質を指す。試料は、被験者から得られた生体試料であり得る。核酸は、ＲＮＡ、ＤＮＡ、例えば、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、ウイルスＤＮＡ、合成ＤＮＡ、またはＲＮＡから逆転写されたｃＤＮＡであることができる。核酸試料中の核酸は、概して、ハイブリダイズされたプライマーの伸長のためのテンプレートとして仕える。いくつかの実施形態において、生体試料は、生体流体試料である。流体試料は、全血、血漿、血清、腹水、脳脊髄液、汗、尿、涙、唾液、口腔試料、腔洗浄液（ｃａｖｉｔｙｒｉｎｓｅ）、排泄物、または器官洗浄液（ｏｒｇａｎｒｉｎｓｅ）であり得る。流体試料は、実質的に細胞を含まない液体試料（例えば、血漿、血清、汗、尿、および涙）であることができる。他の実施形態において、生体試料は、固体生体試料、例えば、排泄物または組織生検、例えば、腫瘍生検である。試料はまた、インビトロ細胞培養成分（細胞培養培地中の細胞の成長から生じる条件付き培地、組換え細胞、および細胞コンポーネントを含むが、これらに限定されない）を含むことができる。いくつかの実施形態において、試料は、複数の供給源由来の核酸の混合物である生体試料であり、すなわち、１つの生体試料に２つ以上の寄与因子、例えば、２つ以上の個体が存在する。一実施形態において、生体試料は、乾燥した血斑である。

本発明において、被験者は、典型的にはヒトであるが、イヌ、ネコ、ウサギ、ウシ、鳥、ラット、ウマ、ブタ、またはサルを含むが、これらに限定されない、そのゲノム上にメチル化マークを有する任意の種であることができる。

コンピュータシステム
本発明は、機能的コンポーネントおよび様々な処理ステップの観点から部分的に記載される。そのような機能的コンポーネントおよび処理ステップは、指定された機能を実施して、様々な結果を達成するように構成されている任意の数のコンポーネント、動作、および技術によって実現され得る。例えば、本発明は、様々な機能を実行し得る、様々な生物学的試料、バイオマーカー、要素、材料、コンピュータ、データソース、格納システムおよび媒体、情報収集技術およびプロセス、データ処理基準、統計解析、回帰解析などを用い得る。追加的に、本発明は、遺伝子解析に関連して記載されているが、本発明は、任意の数の用途、環境、およびデータ解析と併せて実践され得、本明細書に記載されるシステムは、本発明のための単なる例示的な用途である。

本発明の様々な態様による遺伝子解析の方法は、例えば、コンピュータシステム上で動作するコンピュータプログラムを使用して、任意の好適な方法で実装され得る。本発明の様々な態様に従った、例示的な遺伝子解析システムは、コンピュータシステム、例えば、プロセッサおよびランダムアクセスメモリ、例えば、リモートアクセス可能なアプリケーションサーバ、ネットワークサーバ、パーソナルコンピュータまたはワークステーションを含む、従来のコンピュータシステムと併せて実装され得る。コンピュータシステムはまた、大量格納システムおよびユーザインターフェース、例えば、従来のモニタ、キーボード、およびトラッキングデバイスなどの追加のメモリデバイスまたは情報格納システムを適切に含む。しかしながら、コンピュータシステムは、任意の好適なコンピュータシステムおよび関連する機器を含み得、任意の好適な様式で構成され得る。一実施形態において、コンピュータシステムは、スタンドアロンシステムを含む。別の実施形態において、コンピュータシステムは、サーバおよびデータベースを含むコンピュータのネットワークの一部である。

遺伝子情報を受信、処理、および解析するために必要とされるソフトウェアは、単一のデバイスに実装され得るか、または複数のデバイスに実装され得る。ソフトウェアは、情報の格納および処理がユーザに対して遠隔で行われるように、ネットワークを介してアクセス可能であり得る。本発明の様々な態様による遺伝子解析システムおよびその様々な要素は、データ収集、処理、および／または解析などの遺伝子解析を容易にするための機能および動作を提供する。本遺伝子解析システムは、試料に関連する情報を維持して、解析を容易にする。例えば、本実施形態において、コンピュータシステムは、ゲノムに関連する情報を受信、格納、検索、解析、および報告し得る、コンピュータプログラムを実行する。コンピュータプログラムは、生データを処理し、補足データを生成するための処理モジュール、ならびに生データおよび補足データを解析して遺伝子解析を実施するための解析モジュールなどの、様々な機能または動作を実施する複数のモジュールを含み得る。

遺伝子解析システムによって実施される手順は、遺伝子解析を容易にするための任意の好適なプロセスを含み得る。一実施形態において、遺伝子解析システムは、対立遺伝子の一致を決定するように構成される。

遺伝子解析システムはまた、様々な追加のモジュールおよび／または個々の機能を提供し得る。例えば、遺伝子解析システムは、例えば、処理および解析機能に関連する情報を提供するための、報告機能を含み得る。遺伝子解析システムはまた、アクセスを制御して、他の管理機能を実施するなどの、様々な管理および管理機能を提供し得る。

以下の実施例は、本発明の利点および特徴をさらに例示するために提供されるが、本発明の範囲を限定することを意図しない。この実施例は、使用され得るものの典型であるが、当業者に既知の他の手順、方法論、または技術は、代替的に、使用され得る。

実施例Ｉ
ＮＧＳＷＧＳ試料同一性保証
以下の方法論は、試料同一性を決定するために利用される。

ステップ１．ＳＴＲ増幅ワークフロー
１．ＴｈｅｒｍｏＦｉｓｈｅｒＧｌｏｂａｌＦｉｌｅｒ（商標）ＰＣＲ増幅キットを用いて、ゲノムＤＮＡまたは血斑（１．２ｍｍ）を使用してＳＴＲＰＣＲ増幅を設定する。
２．ＡＢＶｅｒｉｔｉ（商標）ＰＣＲマシンを使用してサイクリングを実行する。
３．ＡＢＧｅｎｅｔｉｃＡｎａｌｙｚｅｒ（商標）で電気泳動を設定する。
４．ＧｅｎｅＭａｐｐｅｒ（商標）ソフトウェアを使用して、ＳＴＲ対立遺伝子プロファイリングを生成する。
５．ＳＴＲ対立遺伝子プロファイリングを報告する。

ＳＴＲ増幅ワークフローの結果：２４対の数字−現在、個々のＤＮＡのデジタル指紋を含む、対立遺伝子型としても知られている。

追加的に、試料がＤＮＡを含有しない、非ヒトＤＮＡを含有する、または２つ以上の個々のＤＮＡを含有する場合、警告フラグが立ち得る。

ステップ２．ＷＧＳまたはＷＥＳワークフロー（ステップ１と並行して実施され得る）
１．同じ試料（または同じ個体由来の別の試料）を使用して、ＰＣＲを含まないＩｌｌｕｍｉｎａＷＧＳ（商標）ライブラリ（ＷＧＳ（商標）ライブラリは、生体認証マーカーＤＮＡ断片を自然に含む）を作製する。代替的に、またはそれに追加的に、同じ試料（または同じ個体由来の別の試料）を使用して、溶液捕捉標的アプローチを使用して、ＩＤＴｘＧＥＮ（商標）ＷＥＳプローブ、ミトコンドリアパネル、および／または表Ｉに示されるカスタム生体認証マーカープローブと結合した市販のＫＡＰＡＨｙｐｅｒ（商標）バーコード化ペアエンドライブラリを使用してＷＥＳ（商標）ライブラリを作製する。表Ｉのカスタム生体認証マーカープローブは、ＷＥＳ（商標）ライブラリのバイオマーカーの近辺で試料ＤＮＡを捕捉する。
２．ＨｉＳｅｑ（商標）２５００もしくは４０００、またはＮｏｖａＳｅｑ（商標）６０００、または他のハイスループットシーケンサ上で試料をロードする。
３．脱多重化、マッピング、および診断バリアント呼び出しを含む、配列決定後解析を実施する。
４．（ｌｏｂＳＴＲ（商標）などの、特殊なソフトウェアを使用して）ＳＴＲ対立遺伝子プロファイルを計算的に決定する。
５．ＷＧＳデータによって呼び出されるＳＴＲを報告する。

ＷＧＳワークフローからの結果：少なくとも２１対の数字（および追加のＮ／Ｄ（「未定」）呼び出し）−個々のＤＮＡの独立したデジタル指紋を含む対立遺伝子型。

ステップ３．ＧｌｏｂａｌＦｉｌｅｒ（商標）によって呼び出されて、ＷＧＳまたはＷＥＳまたはパネル配列決定によって呼び出されるＳＴＲ対立遺伝子プロファイリングを使用して一致を生成する。

過去の試料から統計的に導き出された推論（ならびに前述のワークフローの両方の広範な科学的検証）を使用して、その後、２つの対立遺伝子型が同じ個体に由来し、個々のＤＮＡの処理中に偶発的なスワップ、混合物、または他の干渉が発生しないことを保証する可能性がある。これは、ステップ２で産生される臨床遺伝子診断が意図される個体のためであることを保証する。

以下に示される対立遺伝子プロファイリング一致表は、本明細書に記載される方法を使用して生成される。

コア生体認証ＤＮＡ捕捉試薬配列は、表Ｉに示されるように合成されて、遺伝子標的配列パネル（ＷＥＳを含む）ＤＮＡ捕捉試薬に添加され得る。いくつかの実施形態において、より長いＤＮＡ試薬配列は、上に示されるコアＤＮＡ配列を取り囲む、参照ヒトゲノム配列を使用して、設計されることができる。一実施形態において、ＩＤＴｘＧＥＮ（商標）エクソーム研究パネルｖ１．０とＩＤＴｘＧＥＮ（商標）ロックダウンカスタムプローブを使用して、長さ１２０のオリゴヌクレオチドは、上記の表Ｉに示されるコア生体認証ＤＮＡ捕捉試薬配列を含む配列が使用される。

本発明は、上記の実施例を参照して記載されてきたが、修正および変形は、本発明の趣旨および範囲内に包含されることを理解されたい。したがって、本発明は、以下の特許請求の範囲によってのみ限定される。

Claims

（ａ）短鎖縦列反復（ＳＴＲ）増幅を介して試料の第１の対立遺伝子型を決定することと、
（ｂ）遺伝子配列決定を介して前記試料の第２の対立遺伝子型を決定することと、
（ｃ）前記第１の対立遺伝子型と前記第２の対立遺伝子型との間の対立遺伝子一致を決定することと
を含む、方法。
（ｃ）が、対立遺伝子プロファイリング一致表を生成することを含む、請求項１に記載の方法。
前記第１の対立遺伝子型および前記第２の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することをさらに含む、請求項１に記載の方法。
前記被験者が、ヒトである、請求項３に記載の方法。
前記第１の対立遺伝子型が、ＧｅｎｅＭａｐｐｅｒ（商標）を介して生成される、請求項１に記載の方法。
前記第２の対立遺伝子型が、ｌｏｂＳＴＲ（商標）を介して生成される、請求項１に記載の方法。
前記試料が、生体試料である、請求項１に記載の方法。
前記試料が、全血、血漿、血清、腹水、脳脊髄液、汗、尿、涙、唾液、口腔試料、腔洗浄液（ｃａｖｉｔｙｒｉｎｓｅ）、排泄物、器官洗浄液（ｏｒｇａｎｒｉｎｓｅ）、毛または皮膚である、請求項１に記載の方法。
前記試料が、血液である、請求項１に記載の方法。
遺伝子配列決定が、全ゲノム配列決定（ＷＧＳ）、急速全ゲノム配列決定（ｒＷＧＳ）、全エクソーム配列決定（ＷＥＳ）、次世代配列（ＮＧＳ）、標的遺伝子パネル配列決定、またはそれらの組み合わせを含む、請求項１に記載の方法。
ＷＥＳまたは標的遺伝子パネル配列決定が、配列番号１〜４１からなる群から選択される１つ以上のオリゴヌクレオチドを有するパネルを含む、請求項１０に記載の方法。
各オリゴヌクレオチドが、約５０〜１２０ヌクレオチドの長さである、請求項１１に記載の方法。
各オリゴヌクレオチドが、５０ヌクレオチド以上の長さである、請求項１１に記載の方法。
各オリゴヌクレオチドが、１２０ヌクレオチド以下の長さである、請求項１１に記載の方法。
（ａ）および（ｂ）が、並行して実施される、請求項１に記載の方法。
配列番号１〜４１からなる群から選択される１つ以上のオリゴヌクレオチドを含む、パネル。
各オリゴヌクレオチドが、約５０〜１２０ヌクレオチドの長さである、請求項１６に記載のパネル。
各オリゴヌクレオチドが、５０ヌクレオチド以上の長さである、請求項１６に記載のパネル。
各オリゴヌクレオチドが、１２０ヌクレオチド以下の長さである、請求項１６に記載のパネル。
（ａ）メモリに動作可能に接続されている少なくとも１つのプロセッサと、（ｂ）ＤＮＡ試料中のＤＮＡのＰＣＲ増幅から生成された配列情報を含むＤＮＡ解析情報を受信するように構成されている受信機コンポーネントと、（ｃ）前記少なくとも１つのプロセッサによって実行され、（ｉ）前記配列情報から対立遺伝子型を決定し、（ｉｉ）対立遺伝子プロファイリング一致表を生成し、そして、（ｉｉｉ）第１の対立遺伝子型および第２の対立遺伝子型が単一の対象由来であるかどうかを決定するために統計的確率を計算するように、構成されている、解析コンポーネントと、を備える、遺伝子解析システム。
（ａ）メモリに動作可能に接続されている少なくとも１つのプロセッサと、（ｂ）ＤＮＡ試料中のＤＮＡのＰＣＲ増幅から生成された配列情報を含むＤＮＡ解析情報を受信するように構成されている受信機コンポーネントと、（ｃ）前記少なくとも１つのプロセッサによって実行され、請求項１に記載の（ａ）〜（ｃ）を実施するように構成されている、解析コンポーネントと、を備える、遺伝子解析システム。