JP2022531017A

JP2022531017A - 核酸バリアントを検出するための方法

Info

Publication number: JP2022531017A
Application number: JP2021565779A
Authority: JP
Inventors: ヨアヴエツィオーニ，; シムチョンフェイグラー，; ギラッドアルモジー，; マークプラット，; フロリアンオーバーストラス，
Original assignee: ウルティマジェノミクス，インコーポレイテッド
Priority date: 2019-05-03
Filing date: 2020-05-01
Publication date: 2022-07-05
Also published as: EP3963105A1; EP3963105A4; KR20220031860A; US11763915B2; US20240120025A1; CA3138986A1; WO2020227137A1; IL287706A; US20200372971A1; CN114072523A; AU2020267365A1

Abstract

試験試料中の短い遺伝子バリアントを検出するための方法が、本明細書に記載される。一部の例示的方法では、短い遺伝子バリアントは、試験核酸分子から得られる１または複数のシークエンシングデータセットを使用して決定されるものまたはマッチスコアを使用してコールされ、試験シークエンシングデータセットは、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定される。１フローサイクル当り２つもしくはそれより多くの異なるフローサイクル順序、および／または５つもしくはそれより多くのヌクレオチオフローを有する延長フローサイクル順序を使用して、試験核酸分子をシークエンシングする方法も、本明細書に記載される。

Description

関連出願への相互参照
本願は、２０１９年３月３日に出願した米国特許仮出願第６２／８４２，５３４号および２０２０年２月７日に出願した米国特許仮出願第６２／９７１，５３０号に基づく優先権の利益を主張しており、前記仮出願の各々の内容は、それら全体が参照により本明細書に援用される。

ＡＳＣＩＩテキストファイルでの配列表の提出
ＡＳＣＩＩテキストファイルでの以下の提出内容は、その全体が参照により本明細書に取り込まれる：コンピュータ可読形式（ＣＲＦ）の配列表（ファイル名：１６５２７２０００５４０ＳＥＱＬＩＳＴ．ＴＸＴ、記録日：２０２０年４月２７日、サイズ：５ＫＢ）。

発明の分野
遺伝子バリアントの検出を含む、シークエンシングデータを生成および／または解析する方法を含む、ポリヌクレオチドをシークエンシングする方法が、本明細書に記載される。

背景
ＤＮＡ試料中の遺伝子バリアントは、試料中のＤＮＡをシークエンシングすること、配列を参照配列とアラインメントすること、および差を評価することにより、検出することができる。シークエンシングされたＤＮＡと参照配列との信頼度の高い差は、ＤＮＡ試料が由来する生物のバリアントとしてコールされる。次世代シークエンシングは、単一試料中の多くの異なる核酸分子の同時シークエンシングに必要なツールを、研究および臨床研究室にもたらし、解析すべき大量のデータを生じさせた。

加えて、可逆的ターミネーターを用いた合成によるシークエンシング（例えば、可逆的に終結される、色素標識シークエンシング法）は、各塩基について単一の異なるシグナルを提供し、したがって、単一シグナルシークエンシングエラーは、エラーのバリアントコールを生じさせる結果となり得る。一部のケースでは、これは、真の陽性シグナルを以て、エラーのコールを有効に圧倒する高深度シークエンシングにより克服することができるが、そのような高深度でのシークエンシングは、費用がかかり、時間がかかる。

非常に効率的で正確な塩基コーリングおよびバリアントコーリングプロトコールへの要求が、当技術分野には依然としてある。

簡単な要旨
核酸分子を含有する試験試料中の短い遺伝子バリアントを検出するための方法であって、ある特定の実施形態では、コンピュータ実装方法であり得る方法が、本明細書に記載される。そのような方法を遂行するためのシステムも本明細書に記載される。さらに、核酸分子をシークエンシングする方法が記載される。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。

上記方法の一部の実施形態では、得るステップは、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることを含む。

上記方法の一部の実施形態では、短い標的遺伝子バリアントは、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの前に事前選択される。一部の実施形態では、短い標的遺伝子バリアントは、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの後にコールの信頼度に基づいて選択される。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップを含み、バイオマーカーパネルは、短い標的遺伝子バリアントを含む。

上記方法の一部の実施形態では、方法は、フローサイクル順序を選択するステップをさらに含む。

一部の実施形態では、標的シークエンシングデータセットは、予想標的シークエンシングデータセットであり、または参照シークエンシングデータセットは、予想参照シークエンシングデータセットである。一部の実施形態では、標的シークエンシングデータセットおよび予想参照シークエンシングデータセットは、標的配列および参照配列をｉｎｓｉｌｉｃｏでシークエンシングすることにより得られる。

上記方法の一部の実施形態では、標的シークエンシングデータセットと参照シークエンシングデータとは、２カ所より多くの非連続のフロー位置において異なる。一部の実施形態では、標的シークエンシングデータセットと参照シークエンシングデータとは、２カ所より多くの連続するフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、Ｘカ所の塩基位置において異なり、標的シークエンシングデータセットと参照シークエンシングデータとは、（Ｘ＋２）カ所またはそれより多くの連続するフロー位置において異なる。一部の実施形態では、（Ｘ＋２）カ所のフロー位置の相違は、実質的にゼロに等しい値と実質的にゼロより大きい値の間の相違を含む。一部の実施形態では、標的シークエンシングデータセットと参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。一部の実施形態では、フローシグナルは、各フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す塩基カウントを含む。

上記方法の一部の実施形態では、フローシグナルは、各フロー位置における少なくとも１塩基カウントの尤度を示す統計パラメーターを含み、塩基カウントは、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す。一部の実施形態では、フローシグナルは、各フロー位置における複数の塩基カウントの尤度を示す統計パラメーターを含み、各塩基カウントは、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す。

上記方法の一部の実施形態では、ステップ（ｃ）は、（ｉ）試験シークエンシングデータセット内の各フロー位置における統計パラメーターであって、そのフロー位置における標的配列の塩基カウントに対応する統計パラメーターを選択すること、および試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコアを決定すること；または（ｉｉ）試験シークエンシングデータセット中の各フロー位置における統計パラメーターであって、そのフロー位置における参照配列の塩基カウントに対応する統計パラメーターを選択すること、および試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定することを含む。一部の実施形態では、ステップ（ｃ）で決定されるマッチスコアは、試験シークエンシングデータセット内のフロー位置にわたっての選択された統計パラメーターの組み合わされた値である。一部の実施形態では、ステップ（ｃ）は、試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコアを決定することを含む。一部の実施形態では、ステップ（ｃ）は、試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定することを含む。

上記方法の一部の実施形態では、１つまたは複数の試験シークエンシングデータセットは、複数の試験シークエンシングデータセットを含む。一部の実施形態では、短い標的遺伝子バリアントの存在または非存在は、１つまたは複数の試験シークエンシングデータセットの各々について別々にコールされる。一部の実施形態では、複数の試験シークエンシングデータセットの少なくとも一部分は、異なる試験シークエンシング開始位置を有する異なる試験核酸分子に関連する。

上記方法の一部の実施形態では、フローサイクル順序は、同じ順序で反復される４つの別々のフローを含む。一部の実施形態では、フローサイクル順序は、５つまたはそれより多くの別々のフローを含む。

上記方法の一部の実施形態では、方法は、コンピュータ実装方法である。例えば、一部の実施形態では、コンピュータ実装方法は、１または複数台のプロセッサーを使用して短い標的遺伝子バリアントを選択するステップ；１つまたは複数の試験シークエンシングデータセットを１または複数台のプロセッサーで受信することにより、１つまたは複数の試験シークエンシングデータセットを得るステップ；１または複数台のプロセッサーを使用して１つまたは複数のマッチスコアを決定するステップ；および１または複数台のプロセッサーを使用して試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。

１または複数台のプロセッサーと、上記の方法を実行するための命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムも本明細書に提供される。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｂ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、第１のフローサイクル順序と第２のフローサイクル順序が異なり、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットの各々について、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列のマッチする尤度を示す、ステップ；および（ｄ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。

上記方法の一部の実施形態では、方法は、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングするステップ、および第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングするステップを含む。

上記方法の一部の実施形態では、マッチスコアは、第１の試験シークエンシングデータセットが候補配列にマッチする尤度、または第２の試験シークエンシングデータセットが候補配列にマッチする尤度を示す。一部の実施形態では、マッチスコアは、第１の試験シークエンシングデータセットと第２のシークエンシングデータセット両方が候補配列にマッチする尤度を示す。

上記方法の一部の実施形態では、１つまたは複数の候補配列は、２つまたはそれより多くの異なる候補配列を含み、方法は、第１のシークエンシングデータセットおよび第２のシークエンシングデータセットに関連する核酸分子の各々について：２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列は、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの非連続のフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの非連続のフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの連続のフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの連続のフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、３カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、３カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、Ｘカ所の塩基位置において異なり、試験核酸分子に関連する試験シークエンシングデータセットと、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、（Ｘ＋２）カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、Ｘカ所の塩基位置において異なり、試験核酸分子に関連する試験シークエンシングデータセットと、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、（Ｘ＋２）カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、（Ｘ＋２）カ所のフロー位置の相違は、実質的にゼロに等しい値と実質的にゼロより大きい値の間の相違を含む。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、１または複数のフローサイクルにわたって異なる。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、１または複数のフローサイクルにわたって異なる。

上記方法の一部の実施形態では、フローシグナルは、各フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す塩基カウントを含む。一部の実施形態では、フローシグナルは、各フロー位置における少なくとも１塩基カウントの尤度を示す統計パラメーターを含み、塩基カウントは、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す。一部の実施形態では、フローシグナルは、各フロー位置における複数の塩基カウントの尤度を示す統計パラメーターを含み、各塩基カウントは、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す。一部の実施形態では、マッチスコアを決定するステップは、第１の試験シークエンシングデータセットおよび第２の試験シークエンシングデータセットにおける各フロー位置における統計パラメーターであって、候補配列のそのフロー位置における塩基カウントに対応する統計パラメーターを、１つまたは複数の異なる候補配列の各々について選択することを含む。上記方法の一部の実施形態では、方法は、１つまたは複数の異なる候補配列について、各フロー位置における候補配列の塩基カウントを含む候補シークエンシングデータセットを生成するステップを含む。一部の実施形態では、候補シークエンシングデータセットは、ｉｎｓｉｌｉｃｏで生成される。一部の実施形態では、マッチスコアは、第１の試験シークエンシングデータセットおよび第２の試験シークエンシングデータセットにおけるフロー位置にわたって選択された統計パラメーターの組み合わされた値である。

上記方法の一部の実施形態では、試験核酸分子の少なくとも一部分は、異なるシークエンシング開始位置を有する。

上記方法の一部の実施形態では、方法は、短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとは、標的シークエンシングデータセットおよび参照シークエンシングデータセットは、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップをさらに含み、１つまたは複数の候補配列は、標的配列および参照配列を含む。一部の実施形態では、短い標的遺伝子バリアントは、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの前に事前選択される。一部の実施形態では、短い標的遺伝子バリアントは、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの後にコールの信頼度に基づいて選択される。一部の実施形態では、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップを含み、バイオマーカーパネルは、試験試料中に存在する短い標的遺伝子バリアントを含む。一部の実施形態では、参照シークエンシングデータセットは、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のフローで提供される非終結ヌクレオチドを使用して参照配列がシークエンシングされた場合の予想参照シークエンシングデータセットを決定することにより得られる。一部の実施形態では、参照シークエンシングデータセットは、第１のフローサイクル順序および第２のフローサイクル順序の両方に従って別々のフローで提供される非終結ヌクレオチドを使用して参照配列がシークエンシングされた場合の予想参照シークエンシングデータセットを決定することにより得られる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの非連続のフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの非連続のフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの連続であるフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの連続であるフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、３カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、３カ所またはそれより多くのフロー位置において異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くのフローサイクルにわたって異なる。一部の実施形態では、標的配列と参照配列とは、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くのフローサイクルにわたって異なる。

上記方法の一部の実施形態では、第１のフローサイクル順序または第２のフローサイクル順序は、同じ順序で反復される４つの別々のフローを含む。一部の実施形態では、第１のフローサイクル順序または第２のフローサイクル順序は、同じ順序で反復される５つまたはそれより多くの別々のフローを含む。

上記方法の一部の実施形態では、方法は、試験核酸分子をシークエンシングするステップであって、第１のフローサイクル順序に従って別々のヌクレオチドフローで非終結ヌクレオチドを提供することと、シークエンシングプライマーを伸長することと、各ヌクレオチドフローの後にシークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して第１の試験シークエンシングデータセットを生成することとを含むステップ；伸長されたシークエンシングプライマーを除去するステップ；および同じ試験核酸分子をシークエンシングするステップであって、第２のフローサイクル順序に従って別々のヌクレオチドフローで非終結ヌクレオチドを提供することと、シークエンシングプライマーを伸長することと、各ヌクレオチドフローの後にシークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して第２の試験シークエンシングデータセットを生成することとを含むステップを含む。

上記方法の一部の実施形態では、方法は、コンピュータ実装方法である。例えば、一部の実施形態では、コンピュータ実装方法は、１つまたは複数の第１のシークエンシングデータセットを１または複数台のプロセッサーで受信するステップ；１つまたは複数の第１のシークエンシングデータセットを１または複数台のプロセッサーで受信するステップ；１または複数台のプロセッサーを使用してマッチスコアを決定するステップ；および１または複数台のプロセッサーを使用して試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。

１または複数台のプロセッサーと、上記の方法のいずれかを実行するための命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムも本明細書に記載される。

上記の方法またはシステムのいずれかの一部の実施形態では、別々のフローは、単一の塩基タイプを含む。

上記の方法またはシステムのいずれかの一部の実施形態では、別々のフローのうちの少なくとも１つは、２つまたは３つの異なる塩基タイプを含む。

上記の方法またはシステムのいずれかの一部の実施形態では、方法は、試験試料中の短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示すバリアントコールファイルを生成またはアップデートするステップを含む。

上記の方法またはシステムのいずれかの一部の実施形態では、方法は、試験試料中の短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示すレポートを生成するステップを含む。一部の実施形態では、レポートは、試験試料中の短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示す、テキスト出力、確率的出力、数値出力またはグラフィック出力を含む。一部の実施形態では、方法は、レポートを患者にまたは患者の医療担当者に提供するステップを含む。

上記の方法またはシステムのいずれかの一部の実施形態では、短い遺伝子バリアントは、一塩基多型またはインデルを含む。

上記の方法またはシステムのいずれかの一部の実施形態では、短い遺伝子バリアントは、インデルを含む。

上記の方法またはシステムのいずれかの一部の実施形態では、試験試料は、断片化ＤＮＡを含む。

上記の方法またはシステムのいずれかの一部の実施形態では、試験試料は、無細胞ＤＮＡを含む。一部の実施形態では、無細胞ＤＮＡは、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含む。

一部の実施形態では、核酸分子をシークエンシングする方法は、核酸分子をプライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成するステップ；５つまたはそれより多くの別々のヌクレオチドフローを含む反復フローサイクル順序に従って別々のヌクレオチドフローで提供される標識された非終結ヌクレオチドを使用してプライマーを伸長するステップ；および取り込まれた標識ヌクレオチドからのシグナルを検出する、またはプライマーがヌクレオチドフローにより伸長された場合のシグナルの非存在を検出するステップを含む。一部の実施形態では、方法は、シグナル、またはシグナルの非存在を、各ヌクレオチドフロー後に検出するステップを含む。一部の実施形態では、方法は、複数の核酸分子をシークエンシングするステップを含む。一部の実施形態では、複数のうちの核酸分子は、ある遺伝子座に対して異なるシークエンシング開始位置を有する。一部の実施形態では、試験試料は、無細胞ＤＮＡである。一部の実施形態では、無細胞ＤＮＡは、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含む。一部の実施形態では、フローサイクル順序は、２カ所より多くのフロー位置において、ランダムシークエンシング開始位置の５％またはそれより多くにおける可能なＳＮＰパーミュテーションの５０％またはそれより多くについてのシグナル変化を誘導する。一部の実施形態では、誘導されるシグナル変化は、シグナル強度の変化、または新しい実質的にゼロ（もしくは新しいゼロ）もしくは新しい実質的に非ゼロ（もしくは新しい非ゼロ）シグナルである。一部の実施形態では、誘導されるシグナル変化は、新しい実質的にゼロ（もしくは新しいゼロ）または新しい実質的に非ゼロ（もしくは新しい非ゼロ）シグナルである。一部の実施形態では、前記フローサイクル順序は、１フロー当り０．６のまたはそれを超える塩基取り込みの効率を有する。

図１Ａは、Ｔ－Ａ－Ｃ－Ｇの反復フローサイクル順序を使用してＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）の配列でプライマーを伸長させることにより得られたシークエンシングデータを示す。このシークエンシングデータは、伸長されたプライマー鎖を代表しており、容易に決定され得る相補鋳型鎖のシークエンシング情報は、実効的に等価である。

図１Ｂは、各フロー位置における最高尤度に基づいて選択された、最も可能性が高い配列であって、シークエンシングデータが得られた配列（星印により示されている通り）を伴う、図１Ａに示されているシークエンシングデータを示す。

図１Ｃは、２つの異なる候補配列：ＴＡＴＧＧＴＣＡＴＣＧＡ（配列番号２）（黒塗りの丸印）およびＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）（白抜きの丸印）を表すトレースを伴う、図１Ａに示されているシークエンシングデータを示す。シークエンシングデータが所与の配列にマッチする尤度は、各フロー位置が候補配列にマッチする尤度の積として決定することができる。

図２Ａは、２つの候補配列Ｈ１（配列番号５）およびＨ２（配列番号６）（それらの相補配列により各々表されている）とアラインされた、シークエンシングリードＲ１（配列番号１）、Ｒ２（配列番号３）およびＲ３（配列番号４）（伸長されたプライマーの配列により各々表されている）のアラインメントを示す。図２Ｂは、Ｈ１（黒塗りの丸印）およびＨ２（白抜きの丸印）を表すトレースを伴う、Ｒ１に対応するシークエンシングデータを示す。図２Ｃは、Ｈ１（黒塗りの丸印）およびＨ２（白抜きの丸印）を表すトレースを伴う、Ｒ２に対応するシークエンシングデータを示す。図２Ｄは、Ｈ１（黒塗りの丸印）およびＨ２（白抜きの丸印）を表すトレースを伴う、Ｒ３に対応するシークエンシングデータを示す。図２Ａは、２つの候補配列Ｈ１（配列番号５）およびＨ２（配列番号６）（それらの相補配列により各々表されている）とアラインされた、シークエンシングリードＲ１（配列番号１）、Ｒ２（配列番号３）およびＲ３（配列番号４）（伸長されたプライマーの配列により各々表されている）のアラインメントを示す。図２Ｂは、Ｈ１（黒塗りの丸印）およびＨ２（白抜きの丸印）を表すトレースを伴う、Ｒ１に対応するシークエンシングデータを示す。図２Ｃは、Ｈ１（黒塗りの丸印）およびＨ２（白抜きの丸印）を表すトレースを伴う、Ｒ２に対応するシークエンシングデータを示す。図２Ｄは、Ｈ１（黒塗りの丸印）およびＨ２（白抜きの丸印）を表すトレースを伴う、Ｒ３に対応するシークエンシングデータを示す。

図３は、試験試料中の短い遺伝子バリアントを検出するための例示的方法のフローチャートを示す。

図４Ａは、第１のフローサイクル順序（Ｔ－Ａ－Ｃ－Ｇ）を使用して核酸分子をシークエンシングすることにより得られた、ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）の伸長されたプライマー配列を有する核酸分子からのシークエンシングデータを示し、図４Ｂは、第２のフローサイクル順序（Ａ－Ｇ－Ｃ－Ｔ）を使用して同じ核酸分子をシークエンシングすることにより得られたシークエンシングデータを示す。さらに、図４Ａおよび図４Ｂ各々は、第１の候補配列ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）（黒塗りの丸印）および第２の候補配列ＴＡＴＧＧＴＣＡＴＣＧＡ（配列番号２）（白抜きの丸印）からのトレースを示す。図４Ａおよび図４Ｂに示されているように、フローサイクル順序の差は、所与のフロー位置において検出されるシグナルを大きく変化させ得るので、バリアントのコンテキストにとってより良いフローサイクルを使用すると、より有意なシグナルの相違を検出することができる。

図５は、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための別の例示的方法を示す。

図６は、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための別の例示的方法を示す。

図７は、本明細書に記載される方法を実行するために使用することができる、一実施形態によるコンピュータデバイスの例を説明する。

図８は、Ａ－Ｔ－Ｇ－Ｃフローサイクル順序を使用してシークエンシングされた仮想核酸分子からのシークエンシングデータを示す。可能性のあるハプロタイプ配列ＴＡＴＧＧＴＣＧ－ＴＣＧＡ（配列番号７）（Ｈ１）およびＴＡＴＧＧＴＣＧＡＴＣＧ（配列番号８）（Ｈ２）を使用して、トレースを生成することができ、Ｈ１は、Ｈ２と比較して１塩基欠失を有する。シークエンシングデータは、Ｈ２候補配列とのより良いマッチを有し、インデルは、この配列ではコールされない。

図９は、４つの例示的フローサイクル順序（これらのうちの、延長フローサイクル順序である、３つを含む）について、ランダムシークエンシング開始位置が得られるＳＮＰパーミュテーションの検出の感度を示す。図９中、ｘ軸は、フロー相（または断片化開始位置）の分率を示し、ｙ軸は、２カ所より多くのフロー位置においてシグナル変化を誘導したＳＮＰパーミュテーションの分率を示す。

対象に由来する試験試料中の１つまたは複数の短い遺伝子バリアント、例えば、一塩基多型（ＳＮＰ）、多塩基多型（ＭＮＰ）またはインデルを検出するための方法が、本明細書に記載される。試験試料からの試験核酸分子に関連する試験シークエンシングデータは、試験シークエンシングデータと別の配列［例えば、試験配列、候補配列（または候補ハプロタイプ配列および／もしくは参照配列）］とのマッチを判定するために解析され、マッチの近似性を示すマッチスコア（例えば、試験シークエンシングデータを考えると、試験シークエンシングデータが比較配列の核酸分子から生じる尤度）を決定することにより表され得る。したがって、マッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在もしくはアイデンティティー、または非存在をコールすることができる。

試験シークエンシングデータセットは、計算効率の良い解析をもたらすように独特に構造化される。例えば、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより、試験シークエンシングデータセットを生成することができる。したがって、核酸分子の試験シークエンシングデータセットは、特定のヌクレオチドのフローに各々が対応するフロー位置にあるフローシグナルを含む。この独特に構造化されたデータセットを使用して、核酸分子（単数）［または分子（複数）］を、「塩基空間」（「ヌクレオチド空間」または「配列空間」とも呼ばれる）ではなく「フロー空間」で解析することができる。フロー空間データは、塩基空間データが保有しない、フローサイクル順序に関する追加情報に依存する。フロー空間で収集されるデータの解析は、塩基空間に変換されるデータまたは塩基空間で収集されるデータの解析に勝る利点を少なくとも２つ提供する。第１に、試験核酸分子中に最も多く見られるバリアントタイプ（置換ＳＮＰ）は、フロー空間で参照配列と比較すると２つまたはそれより多くの明確に異なるフローシグナル（これらは全フローサイクルにわたって、またはそれを超えて、伝播し得る）を生じさせる結果となるが、塩基空間で配列を解析するとデータシグナルを１つだけしか入手できない。つまり、塩基空間では、各塩基位置が単一シグナルと関連付けられ、バリアント塩基は、バリアント塩基のシグナルのみに影響を与え、隣接シグナルには影響を与えない。フロー空間では、バリアントは、複数のフロー位置に影響を与えることができ、ある特定のバリアントについては、バリアントは、参照配列と比較してその後のフローグラムシグナルのシフトを誘導することができ、それによって実質的にバリアント検出を継続的に強化し得る。第２に、試験核酸分子の配列と１つまたは複数の候補配列とを直接アラインメントしなくても、フロー空間データを解析して１つまたは複数の候補フロー空間配列とのマッチを判定することができる。配列アラインメントは計算コストが高いが、本明細書に記載されるマッチ解析を使用してそれを単純化することができる。

所与の遺伝子バリアントについてのフロー空間における多重シグナルインジケーターは、塩基空間解析で同定され得る単一シグナルインジケーターと比べてバリアントコール正確度を増加させる。さらに、フローシグナルの相違の数が多いほど、バリアントコールが検出されることになる尤度が増加する。本明細書中でさらに論じられるように、ある特定の状況では、信頼度が高い事前選択されたバリアントをコールすることが望ましく、それらのバリアントおよび／またはフロー順序を、所望の数のフローシグナルの相違が確実に生成されるように選択して、遺伝子バリアントを高い信頼性でコールすることができる。核酸分子のシークエンシングデータセットを候補配列と比較して、試験シークエンシングデータセットが候補配列にマッチする尤度を示すマッチスコアを決定することができる。

決定された配列と候補配列（例えば、候補ハプロタイプ配列）の塩基空間におけるアラインメントは、計算コストが高く、現在のところ、ゲノム解析ツールキット（ＧＡＴＫ）ＨａｐｌｏｔｙｐｅＣａｌｌｅｒでのほぼ計算集約的なステップである。ＨａｐｌｏｔｙｐｅＣａｌｌｅｒの中のＰａｉｒＨＭＭは、各シークエンシングリードと各ハプロタイプのアラインメントを行い、塩基の品質をエラーの推定値として使用して、シークエンシングリードが得られハプロタイプの尤度を判定する。しかし、本明細書に記載される方法で使用されるデータセットの構造は、エラーモード尤度を保持し、それによってバリアントコーリングの計算効率がより良くなる。例えば、所与の遺伝子型の尤度を、その遺伝子型を有する配列とアラインする各フロー位置における尤度の積として、簡単に決定することができる。このフロー空間決定尤度は、ＨａｐｌｏｔｙｐｅＣａｌｌｅｒのＰａｉｒＨＭＭモジュールを、より計算効率の良いバリアントコールに置き換えることができる。

シークエンシングデータセット内の任意のフロー位置のフローシグナルは、任意の塩基位置の核酸分子をシークエンシングするために使用されるフロー順序がその位置におけるフローシグナルに影響を与え得ることから、フロー順序依存性である。本明細書中でさらに説明されるように、この発見を１つまたは複数の方法で利用することができる。第１に、同じ遺伝子座で重複する核酸分子のランダム断片化（ｉｎｖｉｖｏ断片化、例えば無細胞ＤＮＡ、あるいはｉｎｖｉｔｒｏ断片化、例えば超音波処理もしくは酵素的消化によるもの）は、それらの核酸分子についての複数の異なるシークエンシング開始部位（遺伝子座に関連して）を生じさせる結果となる。一部のケースでは、異なるフローコンテキストが遺伝子座で入手可能である（例えば、異なるフロー順序で再シークエンシングした場合、または準周期的なフロー順序を使用した場合）。したがって、たとえ他の核酸分子が信頼度のより低いシグナル（例えば、単一フローシグナル変化）を生じさせる結果となっても、バリアントについての高感度フローシグナルを用いて（例えば、参照または非選択候補配列と比較して２つまたはそれより多くのフローシグナルの相違を用いて）単一核酸分子に基づいて、遺伝子座にあるバリアントを正確に検出することができる。第２に、所与の核酸分子を、第１のフロー順序を使用してシークエンシングし、第２の（異なる）フロー順序を使用して再シークエンシングすることができ、この結果として、その核酸分子にわたって異なるフロー配列コンテキストが得られる。１つのフロー順序を使用して、バリアントを有する核酸分子とそのバリアントを有する候補配列との尤度マッチが低かったとしても、第２のフロー順序を使用して、その核酸分子とその候補配列との尤度マッチが高いことがある。第３に、フロー順序は、延長フローサイクル（例えば、サイクル内に４つより多くの塩基タイプがある）であることがあり、これは、そのフロー順序が、単に、４つの塩基タイプＡ、Ｃ、ＴおよびＧの周期的な４フロー反復でないことを意味する。一部のケースでは、反復単位は、４塩基より長く、例えば、すべての可能な２塩基フロー配列（すなわち、すべてのＸ－Ｙペアが反復単位内にあり、ここでのＸは、４つすべての塩基であり、Ｙは、非Ｘ塩基の各々である）または３塩基フロー配列（すなわち、すべての可能なＸ－Ｙ－Ｚパーミュテーションが反復単位内にある）を含むパターンである。第４に、フローシークエンシング順序を、特異的な遺伝子バリアントを標的とするように選択することができる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験試料に由来する試験核酸分子に関連し、試験シークエンシングデータセットが、フロー順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより生成され、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｂ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、試験シークエンシングデータセットが１つまたは複数の候補配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｃ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。

本明細書に記載される方法は、コンピュータ実装方法であり得、方法の１つまたは複数のステップを、例えば、１または複数台のコンピュータプロセッサーを使用して遂行することができる。

１つまたは複数のプログラムを記憶する非一過性コンピュータ可読記憶媒体であって、１つまたは複数のプログラムが、電子デバイスの１または複数台のプロセッサーにより実行されたとき、電子デバイスに、本明細書に記載される方法のいずれか１つまたは複数を遂行させる命令を含む、非一過性コンピュータ可読記憶媒体も、本明細書で提供される。

１または複数台のプロセッサーと、メモリーと、そのメモリーに記憶された１つまたは複数のプログラムとを含む、電子デバイスであって、１つまたは複数のプログラムが、１または複数台のプロセッサーにより実行されるように構成されている、電子デバイスが、本明細書にさらに記載される。１つまたは複数のプログラムは、本明細書に記載される方法のいずれか１つまたは複数を遂行するための命令を含み得る。

核酸分子をシークエンシングする方法も、本明細書に記載される。例えば、核酸分子をシークエンシングする方法は、核酸分子をプライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成するステップ；５つまたはそれより多くの別々のヌクレオチドフローを含む反復フローサイクル順序に従って別々のヌクレオチドフローで提供される標識された非終結ヌクレオチドを使用してプライマーを伸長するステップ；および取り込まれた標識ヌクレオチドからのシグナルを検出する、またはプライマーがヌクレオチドフローにより伸長された場合のシグナルの非存在を検出するステップを含み得る。
定義

本明細書で使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」および「その（ｔｈｅ）」は、文脈による別段の明白な指示がない限り、複数形の言及対象を含む。

本明細書での「約」ある値またはパラメーターへの言及は、その値またはパラメーター自体に関する変動を含む（および記載する）。例えば、「約Ｘ」に言及する記載は、「Ｘ」の記載を含む。

所与の配列についての「予想シークエンシングデータ」または「予想シークエンシングデータセット」は、フロー順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して配列がシークエンシングされた場合に生成されることになる、計算されたシークエンシングデータを指す。予想シークエンシングデータセットまたは予想シークエンシングデータセットを、例えばコンピュータモデリングにより（すなわち、ｉｎｓｉｌｉｃｏ）、決定することができる。

「フロー順序」は、非終結ヌクレオチドを使用して核酸分子をシークエンシングするために使用される別々のヌクレオチドフローの順序を指す。フロー順序を反復単位のサイクルに分けることができ、反復単位のフロー順序は、「フローサイクル順序」と呼ばれる。「フロー位置」は、シークエンシングプロセス中の所与の別々のヌクレオチドフローの逐次的位置を指す。

用語「個体」、「患者」および「対象」は、同義語として使用され、ヒトを含む動物を指す。

用語「標識」は、本明細書で使用される場合、別の部分、例えばヌクレオチドまたはヌクレオチドアナログ、とカップリングされる、またはカップリングされ得る、検出可能な部分を指す。標識は、標識に送達されたシグナルを放出することまたはシグナルを変更することができ、したがって、標識の存在または非存在を検出することができる。一部のケースでは、カップリングは、リンカーを介してのカップリングであり得、リンカーは、切断可能、例えば、光切断可能（例えば、紫外線下で切断可能）、化学的に切断可能（例えば、ジチオトレイトール（ＤＴＴ）、トリス（２－カルボキシエチル）ホスフィン（ＴＣＥＰ）などの、還元剤によって）、または酵素的に切断可能（例えば、エステラーゼ、リパーゼ、ペプチダーゼもしくはプロテアーゼによって）であり得る。一部の実施形態では、標識は、フルオロフォアである。

「非終結ヌクレオチド」は、ポリメラーゼまたはトランスクリプターゼを使用してポリヌクレオチドの３’末端に結合させることができる、およびポリメラーゼまたはトランスクリプターゼを使用してそれに結合された別の非終結核酸を有することができ、そのヌクレオチドから保護基または可逆的ターミネーターを除去する必要がない、核酸部分である。天然に存在する核酸は、非終結核酸の一種である。非終結核酸は、標識されていることがあり、または未標識であることもある。

「ヌクレオチドフロー」は、一連の１つまたは複数の非終結ヌクレオチド（標識されていることがあり、またはその一部分が標識されていることもある）を指す。

「短い遺伝子バリアント」は、長さが連続する１０塩基またはそれ未満（すなわち、長さが１０、９、８、７、６、５、４、３、２または１塩基）である遺伝的多型（すなわち、突然変異）を指す。この用語は、長さが連続する１０塩基またはそれ未満である、一塩基多型（ＳＮＰ）、多塩基多型（ＭＮＰ）およびインデルを含む。

本明細書に記載される本発明の態様および変形形態が、態様および変形形態「からなること」および／または「から本質的になること」を含むことは理解されよう。

値の範囲が提供される場合、その範囲の上限値と下限値の間に介在する各々の値、およびその述べられている範囲内の、任意の他の述べられているまたは介在する値が、本開示の範囲内に包含されることは、理解されるはずである。述べられている範囲が上限値または下限値を含む場合、これらの含まれる限界値のどちらかを含まない範囲もまた、本開示に含まれる。

本明細書に記載される解析方法の一部は、配列を参照配列にマッピングすること、配列情報を判定すること、および／または配列情報を解析することを含む。相補配列を容易に決定および／または解析することができること、ならびに本明細書で提供される説明が、相補配列に関して遂行される解析方法を包含することは、当技術分野では十分に理解されよう。

本明細書で使用される節の見出しは、単に構成のためのものであり、記載される主題を限定するものと解釈すべきでない。この説明は、当業者による本発明の実施および使用を可能にするために提供され、特許出願およびその要件に関連して提供される。記載される実施形態の様々な修飾形態が当業者には容易に分かることになり、本明細書における一般原理を他の実施形態に応用することができる。したがって、本発明は、示される実施形態に限定されるように意図されたものではなく、本発明には、本明細書に記載される原理および特徴に対応する最も広い範囲が与えられる。

図は、様々な実施形態によるプロセスを例証する。これらの例示的プロセスでは、一部のブロックは、必要に応じて組み合わせられ、一部のブロックの順序は、必要に応じて変更され、一部のブロックは、必要に応じて割愛される。一部の例では、追加のステップが例示的プロセスと組み合わせて遂行され得る。したがって、例証される（および下記でより詳細に説明される）ような操作は、本質的に例示的なものであり、したがって、限定と見なすべきではない。

本明細書で言及されるすべての公表文献、特許および特許出願の開示は、これにより各々その全体が参照により本明細書に取り込まれる。参照により取り込まれるいずれかの参考文献が本開示と矛盾する場合には、本開示が優先されるものとする。
フローシークエンシング法

任意の所与のフロー位置において単一のタイプのヌクレオチドが伸長プライマーに到達できる所定のフローサイクルに従って鋳型ポリヌクレオチド分子に結合されたプライマーを伸長するステップを含む、フローシークエンシング法を使用して、シークエンシングデータを生成することができる。一部の実施形態では、特定のタイプのヌクレオチドの少なくとも一部は、標識を含み、標識されたヌクレオチドが伸長プライマーに取り込まれると、この標識が検出可能なシグナルをもたらす。そのようなヌクレオチドが伸長されたプライマーに取り込まれることにより得られる配列は、鋳型ポリヌクレオチド分子の配列の逆相補配列であるはずである。一部の実施形態では、例えば、シークエンシングデータは、標識されたヌクレオチドを使用してプライマーを伸長するステップ、および伸長プライマーに取り込まれた標識されたヌクレオチドの存在または非存在を検出するステップを含むフローシークエンシング法を使用して生成される。フローシークエンシング法は、「自然な合成によるシークエンシング」または「非終結型の合成によるシークエンシング」方法と呼ばれることもある。例示的な方法は、その全体が参照により本明細書に取り込まれる米国特許第８，７７２，４７３号に記載されている。以下の説明は、フローシークエンシング法に関して提供されるが、シークエンシングされる領域のすべてまたは一部分をシークエンシングするために他のシークエンシング法が使用され得ることは、理解されよう。例えば、本明細書で論じられるシークエンシングデータを、パイロシークエンシング法を使用して生成することができる。

フローシークエンシングは、ポリヌクレオチドとハイブリダイズされたプライマーを伸長するためのヌクレオチドの使用を含む。所与の塩基タイプのヌクレオチド（例えば、Ａ、Ｃ、Ｇ、Ｔ、Ｕなど）をハイブリダイズされた鋳型と混合して、相補的塩基が鋳型鎖内に存在する場合には、プライマーを伸長することができる。ヌクレオチドは、例えば、非終結ヌクレオチドであり得る。ヌクレオチドが、非終結ヌクレオチドであるとき、１つより多くの連続する相補的塩基が鋳型鎖内に存在する場合には、１つより多くの連続する塩基を伸長プライマー鎖に取り込むことができる。非終結ヌクレオチドは、３’可逆的ターミネーターを有するヌクレオチドと対照をなし、一般に、連続ヌクレオチドが結合される前にブロッキング基は除去される。相補的塩基が鋳型鎖内に存在しない場合、鋳型鎖内の次の塩基と相補的であるヌクレオチドが導入されるまで、プライマー伸長は停止する。ヌクレオチドの少なくとも一部分に標識することができ、その結果、取り込みを検出することができる。最も一般的には、単一のヌクレオチドタイプのみが一度に導入される（すなわち、個々に付加される）が、ある特定の実施形態では、２つまたは３つの異なるタイプのヌクレオチドが同時に導入されることもある。この方法論は、あらゆる単一塩基の伸長後、ターミネーターが反転されて次に続く塩基の取り込みが可能になるまで、プライマー伸長が停止される、可逆的ターミネーターを使用するシークエンシング法と対比され得る。

プライマー伸長の過程でヌクレオチドをフロー順序で導入することができ、この過程をフローサイクルにさらに分けることができる。フローサイクルは、反復されるヌクレオチドフロー順序であり、任意の長さのものであり得る。ヌクレオチドが段階的に付加され、これにより、付加されたヌクレオチドを鋳型鎖内に存在する相補的塩基のシークエンシングプライマーの末端に取り込むことが可能になる。単に例として、フローサイクルのフロー順序は、Ａ－Ｔ－Ｇ－Ｃであることもあり、またはフローサイクル順序は、Ａ－Ｔ－Ｃ－Ｇであることもある。代替順序を当業者は容易に企図することができる。フローサイクル順序は、いずれの長さのものであってもよいが、４つの固有の塩基タイプ（任意の順序でＡ、Ｔ、ＣおよびＧ）を含有するフローサイクルが最も一般的である。一部の実施形態では、フローサイクルは、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０またはそれより多くの別々のヌクレオチドフローをフローサイクル順序で含む。単に例として、フローサイクル順序は、Ｔ－Ｃ－Ａ－Ｃ－Ｇ－Ａ－Ｔ－Ｇ－Ｃ－Ａ－Ｔ－Ｇ－Ｃ－Ｔ－Ａ－Ｇであり得、これら１６の別々に提供されるヌクレオチドが数サイクルにわたってこのフローサイクル順序で提供される。異なるヌクレオチドの導入と導入の間に、例えば洗浄液でシークエンシングプラットフォームを洗浄することにより、取り込まれていないヌクレオチドを除去することができる。

ポリメラーゼを使用して、１つまたは複数のヌクレオチドをプライマーの末端に鋳型依存的に取り込むことによりシークエンシングプライマーを伸長させることができる。一部の実施形態では、ポリメラーゼは、ＤＮＡポリメラーゼである。ポリメラーゼは、天然に存在するポリメラーゼであることもあり、または合成（例えば、突然変異型）ポリメラーゼであることもある。ポリメラーゼをプライマー伸長の最初のステップで付加させることができるが、補足ポリメラーゼを、必要に応じて、シークエンシング中に、例えば、ヌクレオチドの段階的付加を用いて、またはいくつかのフローサイクル後に、付加させることができる。例示的なポリメラーゼとしては、ＤＮＡポリメラーゼ、ＲＮＡポリメラーゼ、熱安定性ポリメラーゼ、野生型ポリメラーゼ、改変ポリメラーゼ、ＢｓｔＤＮＡポリメラーゼ、Ｂｓｔ２．０ＤＮＡポリメラーゼ、Ｂｓｔ３．０ＤＮＡポリメラーゼ、ＢｓｕＤＮＡポリメラーゼ、Ｅ．ｃｏｌｉＤＮＡポリメラーゼＩ、Ｔ７ＤＮＡポリメラーゼ、バクテリオファージＴ４ＤＮＡポリメラーゼ Φ２９（ファイ２９）ＤＮＡポリメラーゼ、Ｔａｑポリメラーゼ、Ｔｔｈポリメラーゼ、Ｔｌｉポリメラーゼ、Ｐｆｕポリメラーゼ、およびＳｅｑＡｍｐＤＮＡポリメラーゼが、挙げられる。

導入されるヌクレオチドは、鋳型鎖の配列を決定する場合、標識ヌクレオチドを含むことができ、取り込まれた標識核酸の存在または非存在を検出して配列を決定することができる。標識は、例えば、光学活性標識（例えば、蛍光標識）または放射性標識であることがあり、標識により放出または変更されたシグナルを、検出器を使用して検出することができる。鋳型ポリヌクレオチドとハイブリダイズされたプライマーに取り込まれた標識ヌクレオチドの存在または非存在を検出することができ、このことによって配列の決定が（例えば、フローグラムを生成することにより）可能になる。一部の実施形態では、標識ヌクレオチドは、蛍光部分、発光部分、または他の光出射部分で標識される。一部の実施形態では、標識は、リンカーを介してヌクレオチドに結合される。一部の実施形態では、リンカーは、例えば、光化学的または化学的切断反応によって、切断可能である。例えば、標識を、検出後かつ連続ヌクレオチドの取り込み前に切断することができる。一部の実施形態では、標識（またはリンカー）は、ヌクレオチド塩基に結合されるか、または新生ＤＮＡ鎖の延長に干渉しないヌクレオチド上の別の部位に結合される。一部の実施形態では、リンカーは、ジスルフィドまたはＰＥＧ含有部分を含む。

一部の実施形態では、導入されるヌクレオチドは、非標識ヌクレオチドのみを含み、一部の実施形態では、ヌクレオチドは、標識ヌクレオチドと非標識ヌクレオチドの混合物を含む。例えば、一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約９０％もしくはそれ未満、約８０％もしくはそれ未満、約７０％もしくはそれ未満、約６０％もしくはそれ未満、約５０％もしくはそれ未満、約４０％もしくはそれ未満、約３０％もしくはそれ未満、約２０％もしくはそれ未満、約１０％もしくはそれ未満、約５％もしくはそれ未満、約４％もしくはそれ未満、約３％もしくはそれ未満、約２．５％もしくはそれ未満、約２％もしくはそれ未満、約１．５％もしくはそれ未満、約１％もしくはそれ未満、約０．５％もしくはそれ未満、約０．２５％もしくはそれ未満、約０．１％もしくはそれ未満、約０．０５％もしくはそれ未満、約０．０２５％もしくはそれ未満、または約０．０１％もしくはそれ未満である。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約１００％であり、約９５％であるかもしくはそれより多く、約９０％であるかもしくはそれより多く、約８０％であるかもしくはそれより多く、約７０％であるかもしくはそれより多く、約６０％であるかもしくはそれより多く、約５０％であるかもしくはそれより多く、約４０％であるかもしくはそれより多く、約３０％であるかもしくはそれより多く、約２０％であるかもしくはそれより多く、約１０％であるかもしくはそれより多く、約５％であるかもしくはそれより多く、約４％であるかもしくはそれより多く、約３％であるかもしくはそれより多く、約２．５％であるかもしくはそれより多く、約２％であるかもしくはそれより多く、約１．５％であるかもしくはそれより多く、約１％であるかもしくはそれより多く、約０．５％であるかもしくはそれより多く、約０．２５％であるかもしくはそれより多く、約０．１％であるかもしくはそれより多く、約０．０５％であるかもしくはそれより多く、約０．０２５％であるかもしくはそれより多く、または約０．０１％であるかまたはそれより多い。一部の実施形態では、全ヌクレオチドと比較して標識ヌクレオチドの部分は、約０．０１％～約１００％、例えば、約０．０１％～約０．０２５％、約０．０２５％～約０．０５％、約０．０５％～約０．１％、約０．１％～約０．２５％、約０．２５％～約０．５％、約０．５％～約１％、約１％～約１．５％、約１．５％～約２％、約２％～約２．５％、約２．５％～約３％、約３％～約４％、約４％～約５％、約５％～約１０％、約１０％～約２０％、約２０％～約３０％、約３０％～約４０％、約４０％～約５０％、約５０％～約６０％、約６０％～約７０％、約７０％～約８０％、約８０％～約９０％、約９０％～１００％未満、または約９０％～約１００％である。

シークエンシングデータを生成する前に、ポリヌクレオチドは、ハイブリダイズされた鋳型を生成するためにシークエンシングプライマーとハイブリダイズされる。ポリヌクレオチドをシークエンシングライブラリー調製中にアダプターにライゲーションすることができる。アダプターは、シークエンシングプライマーとハイブリダイズするハイブリダイゼーション配列を含むことができる。例えば、アダプターのハイブリダイゼーション配列は、複数の異なるポリヌクレオチドにわたって一様な配列であることがあり、シークエンシングプライマーは、一様なシークエンシングプライマーであることがある。これは、シークエンシングライブラリー内の異なるポリヌクレオチドの多重シークエンシングを可能にする。

ポリヌクレオチドをシークエンシングのために表面（例えば、固体支持体）に結合させることができる。ポリヌクレオチドを（例えば、ブリッジ増幅または他の増幅技法により）増幅させて、ポリヌクレオチドシークエンシングコロニーを生成することができる。クラスター内の増幅されたポリヌクレオチドは、実質的に同一または相補的である（増幅プロセス中に多少のエラーが導入されることがあり、その結果、ポリヌクレオチドの一部分は、元のポリヌクレオチドと必ずしも同一でないことがある）。コロニー形成により、検出器が標識ヌクレオチド取り込みをコロニーごとに正確に検出することができるようなシグナル増幅が可能になる。一部のケースでは、コロニーは、エマルジョンＰＣＲを使用してビーズ上に形成され、ビーズがシークエンシング面全体に分配される。シークエンシングのためのシステムおよび方法の例は、その全体が参照により本明細書に取り込まれる米国特許出願第１０，３４４，３２８号において見つけることができる。

ポリヌクレオチドとハイブリダイズされたプライマーは、フロー順序に従って別々のヌクレオチドフロー（これらは、フローサイクル順序に従って周期的であり得る）を使用して核酸分子を通して伸長され、ヌクレオチドの取り込みを上記の通り検出することができ、それによって、核酸分子についてのシークエンシングデータセットを生成することができる。

フローシークエンシングを使用するプライマー伸長は、長さが数百またはさらには数千ほどもの塩基のロングレンジシークエンシングを可能にする。フローステップまたはサイクルの数を増加または減少させて、所望のシークエンシング長を得ることができる。プライマーの伸長は、１つまたは複数の異なる塩基タイプを有するヌクレオチドを使用するプライマーの段階的伸長のための１つまたは複数のフローステップを含むことができる。一部の実施形態では、プライマー伸長は、１～約１０００ステップの間のフローステップ、例えば、１～約１０ステップの間のフローステップ、約１０～約２０ステップの間のフローステップ、約２０～約５０ステップの間のフローステップ、約５０～約１００ステップの間のフローステップ、約１００～約２５０ステップの間のフローステップ、約２５０～約５００ステップの間のフローステップ、または約５００～約１０００ステップの間のフローステップを含む。フローステップを同一のまたは異なるフローサイクルに分割することができる。プライマーに取り込まれる塩基の数は、シークエンシングされる領域の配列、およびプライマーを伸長するために使用されるフロー順序に依存する。一部の実施形態では、シークエンシングされる領域は、長さ約１塩基～約４０００塩基、例えば、長さ約１塩基～約１０塩基、長さ約１０塩基～約２０塩基、長さ約２０塩基～約５０塩基、長さ約５０塩基～約１００塩基、長さ約１００塩基～約２５０塩基、長さ約２５０塩基～約５００塩基、長さ約５００塩基～約１０００塩基、長さ約１０００塩基～約２０００塩基、または長さ約２０００塩基～約４０００塩基である。

本明細書に記載される方法で使用されるポリヌクレオチドは、任意の好適な生物源、例えば、組織試料、血液試料、血漿試料、唾液試料、糞便試料、または尿試料から得ることができる。ポリヌクレオチドは、ＤＮＡポリヌクレオチドであることもあり、またはＲＮＡポリヌクレオチドであることもある。一部の実施形態では、ＲＮＡポリヌクレオチドは、ポリヌクレオチドをシークエンシングプライマーとハイブリダイズする前にＤＮＡポリヌクレオチドに逆転写される。一部の実施形態では、ポリヌクレオチドは、無細胞ＤＮＡ（ｃｆＤＮＡ）、例えば、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）または胎児無細胞ＤＮＡである。核酸分子を、例えばｉｎｖｉｖｏで（例えば、ｃｆＤＮＡにおけるように）またはｉｎｖｉｔｒｏで（例えば、超音波処理または酵素的断片化により）、ランダムに断片化することができる。

ポリヌクレオチドのライブラリーを公知の方法によって調製することができる。一部の実施形態では、ポリヌクレオチドをアダプター配列にライゲーションすることができる。アダプター配列は、カップリングされたシークエンシングリードペアの生成中に伸長されたプライマーとハイブリダイズしたハイブリダイゼーション配列を含み得る。

一部の実施形態では、シークエンシングデータは、シークエンシングコロニー（シークエンシングクラスターとも呼ばれる）を確立する前に核酸分子を増幅することなく得られる。シークエンシングコロニーを生成するための方法としては、ブリッジ増幅またはエマルジョンＰＣＲが挙げられる。ショットガンシークエンシング、およびコンセンサス配列のコーリングに頼る方法は、一般に、固有分子識別子（ＵＭＩ）を使用して核酸分子を標識し、その核酸分子を増幅させて、独立してシークエンシングされる同じ核酸分子の非常に多数のコピーを生成する。次いで、増幅された核酸分子を表面に結合させ、ブリッジ増幅させて、独立してシークエンシングされるシークエンシングクラスターを生成し得る。次いで、ＵＭＩを使用して、独立してシークエンシングされた核酸分子を関連付けることができる。しかし、増幅プロセスは、例えばＤＮＡポリメラーゼの限られた忠実度に起因して、核酸分子にエラーを導入し得る。一部の実施形態では、核酸分子は、シークエンシングデータを得るためのコロニーを生成するための増幅の前に増幅されない。一部の実施形態では、核酸シークエンシングデータは、固有分子識別子（ＵＭＩ）を使用せずに得られる。
シークエンシングデータセットおよびバリアント検出

シークエンシングデータを、取り込まれたヌクレオチドの検出およびヌクレオチド導入の順序に基づいて生成することができる。以下の伸長される配列（すなわち、対応する鋳型配列の各逆相補配列）：ＣＴＧ、ＣＡＧ、ＣＣＧ、ＣＧＴ、およびＣＡＴ（先行する配列も後続の配列もシークエンシング法に供されないと仮定して）、ならびにＴ－Ａ－Ｃ－Ｇの反復フローサイクル（つまり、反復サイクル中のＴ、Ａ、ＣおよびＧヌクレオチドの逐次的付加）を例にとる。所与のフロー位置における特定のタイプのヌクレオチドは、相補的塩基が鋳型ポリヌクレオチド中に存在する場合にのみプライマーに取り込まれることになる。結果として生じる例示的なフローグラムが表１に示され、この表中の１は、導入されたヌクレオチドが取り込まれること示し、０は、導入されたヌクレオチドが取り込まれないことを示す。フローグラムを使用して、鋳型鎖の配列を導出することができる。例えば、本明細書で論じられるシークエンシングデータ（例えば、フローグラム）は、伸長されたプライマー鎖およびその逆相補鎖を表し、この逆相補鎖は、鋳型鎖の配列を表すために容易に決定され得る。表１中のアスタリスク（＊）は、伸長されたシークエンシング鎖（例えば、より長い鋳型鎖）に追加のヌクレオチドが取り込まれた場合にシグナルがシークエンシングデータ中に存在し得ることを示す。

フローグラムは、バイナリであることもあり、ノンバイナリであることもある。バイナリフローグラムは、取り込まれたヌクレオチドの存在（１）または非存在（０）を検出する。ノンバイナリフローグラムは、各々の段階的導入から取り込まれたヌクレオチドの数をより定量的に決定することができる。例えば、ＣＣＧの伸長された配列は、同じＣフローの中の（例えば、フロー位置３における）伸長プライマー内への２つのＣ塩基の取り込みを含むことになり、標識された塩基により放出されるシグナルは、単一塩基取り込みに相当する強度レベルより高い強度を有することになる。このことが表１に示されている。ノンバイナリフローグラムはまた、塩基の存在または非存在を示し、所与のフロー位置における各伸長プライマーに取り込まれる可能性が高い塩基の数を含む追加情報を提供することができる。値が整数である必要はない。一部のケースでは、値は、所与のフロー位置に取り込まれる塩基の数の不確実性および／または確率を反映していることもある。

一部の実施形態では、シークエンシングデータセットは、各フロー位置に取り込まれているシークエンシングされた核酸分子中の塩基の数を示す塩基カウントを表すフローシグナルを含む。例えば、表１に示されているように、Ｔ－Ａ－Ｃ－Ｇフローサイクル順序を使用してＣＴＧ配列で伸長されたプライマーは、位置３に１の値を有し、これは、その位置における１の塩基カウントを示す（この１塩基は、シークエンシングされた鋳型鎖内のＧと相補的であるＣである）。また表１において、Ｔ－Ａ－Ｃ－Ｇフローサイクル順序を使用してＣＣＧ配列で伸長されたプライマーは、位置３に２の値を有し、これは、このフロー位置にある間の伸長プライマーのその位置における２の塩基カウントを示す。ここで、２塩基は、伸長プライマー配列内のＣＣＧ配列の最初のＣ－Ｃ配列を指し、この配列は、鋳型鎖内のＧ－Ｇ配列と相補的である。

シークエンシングデータセット内のフローシグナルは、各フロー位置における１または複数の塩基カウントについての尤度または信頼区間を示す１つまたは複数の統計パラメーターを含み得る。一部の実施形態では、フローシグナルは、シークエンシング中にシークエンシングプライマーに取り込まれる１つまたは複数の塩基の蛍光シグナルなどの、シークエンシングプロセス中に検出されるアナログシグナルから決定される。一部のケースでは、アナログシグナルを処理して統計パラメーターを生成することができる。例えば、その全体が参照により本明細書に取り込まれる公開国際特許出願ＷＯ２０１９０８４１５８Ａ１に記載されているように、機械学習アルゴリズムを使用してアナログシークエンシングシグナルのコンテキスト効果について補正することができる。ゼロまたはそれを超える整数の塩基がいずれかの所与のフロー位置に取り込まれるが、所与のアナログシグナルは、そのアナログシグナルと完全にマッチしないことがある。したがって、検出されたシグナルを考えれば、フロー位置に取り込まれる塩基の数の尤度を示す統計パラメーターを決定することができる。単に例として、表１のＣＣＧ配列について、フローシグナルがフロー位置３に取り込まれた２塩基を示す尤度は、０．９９９であり得、フローシグナルがフロー位置３に取り込まれた１塩基を示す尤度は、０．００１であり得る。フローシグナルが、各フロー位置における複数の塩基カウントについての尤度を示す統計パラメーターを含む場合、シークエンシングデータセットを疎行列としてフォーマットすることができる。単に例として、Ｔ－Ａ－Ｃ－Ｇの反復フローサイクル順序を使用してＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）の配列で伸長されたプライマーは、図１Ａに示されているシークエンシングデータセットを生じさせる結果となり得る。統計パラメーターまたは尤度値は、例えば、シークエンシング中のアナログシグナルの検出中に存在するノイズまたは他のアーチファクトによって、異なり得る。一部の実施形態では、統計パラメーターまたは尤度が所定の閾値よりも下であった場合、実質的にゼロである所定の非ゼロ値（すなわち、何らかの非常に小さい値または無視できる値）にパラメーターを設定して、真のゼロ値を用いると計算誤差が生じるか、または可能性の低さのレベル同士、例えば、非常に可能性の低いレベル（０．０００１）とあり得ないレベル（０）とが十分に区別されなくなる可能性がある、本明細書でさらに論じられる統計解析を補助することができる。

所与の配列についてのシークエンシングデータセットの尤度を示す値を、配列アラインメントなしにシークエンシングデータセットから決定することができる。例えば、データが得られる可能性の最も高い配列を、図１Ｂに（図１Ａに示されているのと同じデータを使用して）星印により示されているように、各フロー位置において最高尤度を有する塩基カウントを選択することにより決定することができる。したがって、プライマー伸長の配列を、各フロー位置において可能性の最も高い塩基カウントに従って決定することができる：ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）。このことから、逆相補配列（すなわち、鋳型鎖）を容易に決定することができる。さらに、ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）配列（または逆相補配列）が得られる、このシークエンシングデータセットの尤度を、各フロー位置における選択尤度の積として決定することができる。

核酸分子に関連するシークエンシングデータセットを１つまたは複数の（例えば、２、３、４、５、６もしくはそれより多くの）可能性のある候補配列と比較することができる。シークエンシングデータセットと候補配列との（下記で論じられるような、マッチスコアに基づく）近似マッチは、そのシークエンシングデータセットが、近似マッチする候補配列と同じ配列を有する核酸分子から生じた可能性が高いことを示す。一部の実施形態では、シークエンシングされた核酸分子の配列を、参照配列に（例えば、バローズ・ホイーラーアラインメント（ＢＷＡ）アルゴリズムまたは他の好適なアラインメントアルゴリズムを使用して）マッピングして、その配列についての遺伝子座（または１つもしくは複数の遺伝子座）を決定することができる。上記で論じられたように、フロー空間におけるシークエンシングデータセットを塩基空間に（またはフロー順序が既知である場合には、その逆に）容易に変換することができ、マッピングをフロー空間または塩基空間において行なうことができる。マッピングされた配列に対応する遺伝子座（単数）［または遺伝子座（複数）］を、本明細書に記載される解析方法のための候補配列（またはハプロタイプ配列）として動作することができる１つまたは複数のバリアント配列と、関連付けることができる。本明細書に記載される方法の１つの利点は、一部のケースではアラインメントアルゴリズムを使用するシークエンシングされた核酸分子の配列と各候補配列との一般に計算コストの高いアラインメントを必要としない点である。その代わりに、フロー空間におけるシークエンシングデータを使用して候補配列の各々についてマッチスコアを決定することができ、この操作のほうが、計算効率が良い。

マッチスコアは、シークエンシングデータセットがいかに良く候補配列を支持するかを示す。例えば、シークエンシングデータセットが候補配列にマッチする尤度を示すマッチスコアは、各フロー位置における統計パラメーター（例えば、尤度）であって、候補配列についての予想シークエンシングデータが得られたそのフロー位置における塩基カウントに対応する統計パラメーターを選択することにより、決定することができる。選択された統計パラメーターの積によりマッチスコアを得ることができる。例えば、伸長されたプライマーについて図１Ａに示されているシークエンシングデータセット、およびＴＡＴＧＧＴＣＡＴＣＧＡ（配列番号２）の候補プライマー伸長配列を仮定する。図１Ｃ（図１Ａにおける同じシークエンシングデータセットを示す）は、候補配列（塗りつぶした丸印）についてのトレースを示す。比較として、ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）配列のトレース（図１Ｂを参照されたい）が、図１Ｃに白抜きの丸印を使用して示されている。シークエンシングデータが第１の候補配列ＴＡＴＧＧＴＣＡＴＣＧＡ（配列番号２）に対応する尤度を示すマッチスコアと、シークエンシングデータが第２の候補配列ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）にマッチする尤度を示すマッチスコアとには、たとえこれらの配列が単一塩基変動分しか変わらなかったとしても、大きな差がある。図１Ｃで見られるように、トレース間の差は、フロー位置１２に見られ、少なくとも９フロー位置（およびシークエンシングデータがさらなるフロー位置にわたって伸長する場合にはより長い可能性がある）にわたって伝播する。１または複数のフローサイクルにわたって継続するこの伝播は、「フローシフト」または「サイクルシフト」と呼ばれることがあり、シークエンシングデータセットが候補配列にマッチする場合、一般に、非常に可能性の低い事象である。

したがって、各シークエンシングデータセットと候補配列（または各候補配列）とのマッチスコアを決定することができる。例えば、シークエンシングデータセットが、所与の候補配列に一致する尤度Ｌ（Ｒ_ｊ｜Ｈ_ｉ）は、所与の候補配列についての各フロー位置における選択された塩基カウントの尤度（例えば、その積）を使用して、決定することができる。

マッチスコアを使用して、試験シークエンシングデータ、および／または試験シークエンシングデータに関連する核酸分子を分類することができる。分類子は、核酸分子がバリアント（例えば、候補配列に含まれるバリアント）を含むことを示すこともあり、核酸分子が、バリアントを含まないこと示すこともあり、またはヌルコールを示すこともある。ヌルコールは、試験シークエンシングデータに関連する核酸分子におけるバリアントの存在も非存在も示さず、それどころか、マッチスコアを使用して所望の統計的信頼度でコールを行なうことができないことを示す。試験シークエンシングデータまたは核酸分子は、例えば、マッチスコアが所望の信頼度閾値よりも上であった場合、バリアントを有するものとして分類され得る。逆に、試験シークエンシングデータまたは核酸分子は、例えば、マッチスコアが所望の信頼度閾値よりも下であった場合、バリアントを有さないものとして分類され得る。

上記の解析を応用して、２つまたはそれより多くの異なる候補配列から候補配列を選択することができる。シークエンシングデータセットが各候補配列にマッチする尤度を示すマッチスコアを決定することができる。例えば、シークエンシングデータセット内の各フロー位置における統計パラメーターであって、そのフロー位置における候補配列の塩基カウントに対応する統計パラメーターを、候補配列ごとに選択することができる。一部の実施形態では、この解析は、シークエンシングされた試験核酸分子についてのシークエンシングデータセットを生成するために使用されたのと同じフロー順序を使用して候補配列がシークエンシングされることを仮定して、候補シークエンシングについての予測シークエンシングデータを生成することを含む。このデータは、候補配列を有する核酸分子をシークエンシングすることにより、または候補配列およびフロー順序に基づいて候補シークエンシングデータセットをｉｎｓｉｌｉｃｏで生成することにより、生成することができる。例示的な候補シークエンシングデータセットは、図１Ｃの試験データシークエンシングデータセットの下に示されており、第１の候補配列［ＴＡＴＧＧＴＣＡＴＣＧＡ（配列番号２）］は塗りつぶした丸印トレースに対応し、第２の候補配列［ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）］は白抜きの丸印トレースに対応する。一部の実施形態では、例えば、マッチスコアが２つまたはそれより多くの異なる候補配列について決定される場合、試験シークエンシングデータまたは核酸分子は、２つもしくはそれより多くの候補配列のうちの１つについてのバリアントを有するもの、２つもしくはそれより多くの候補配列のうちの１つについてのバリアントを有さないものとして分類されることがあり、またはヌルコールが２つもしくはそれより多くの候補配列間で得られることもある（例えば、候補配列のいずれについてのコールも得ることができなかった場合、もしくはマッチスコアが、同じ遺伝子座で２つもしくはそれより多くの異なるバリアントを示した場合）。

シークエンシングデータセットのマッチスコアが、候補配列について決定されると、マッチスコアに基づいて短い遺伝子バリアントを有する候補配列（例えば、２つまたはそれより多くの候補配列の中から最高尤度マッチを有するマッチスコアをもたらす候補配列）を選択することができる。短い遺伝子バリアントは、例えば、個体の亜集団内に見られるバリアントもしくは突然変異であることもあり、または単一もしくは特異的個体に固有のバリアントもしくは突然変異であることもある。短い遺伝子バリアントは、生殖細胞系列バリアントであることもあり、または体細胞バリアントであることもある。短い遺伝子バリアントを有する核酸分子の配列から生じるシークエンシングデータは、短い遺伝子バリアントを有する候補配列にマッチすることになり、その候補配列を選択することができるが、棄却された（または非選択）候補配列は、より小さい尤度マッチ（これらの候補配列について決定されたマッチスコアに基づいて）により示されるように、短い遺伝子バリアントを含まない。非選択候補配列と、選択候補配列（シークエンシングされた核酸分子シークエンシングデータセットに最も良くマッチする）とは、２カ所またはそれより多くのフロー位置において異なることがあり、これらの位置は、２カ所もしくはそれより多くの連続するフロー位置であることもあり、または２カ所もしくはそれより多くの非連続のフロー位置であることもある。一部の実施形態では、非選択候補配列と、選択候補配列とは、３カ所もしくはそれより多くの、４カ所もしくはそれより多くの、５カ所もしくはそれより多くの、６カ所もしくはそれより多くの、７カ所もしくはそれより多くの、８カ所もしくはそれより多くの、９カ所もしくはそれより多くの、または１０カ所もしくはそれより多くのフロー位置において異なる。一部の実施形態では、非選択候補配列と、選択候補配列とは、１もしくは複数の、２もしくはそれより多くの、３もしくはそれより多くの、４もしくはそれより多くの、または５もしくはそれより多くのフローサイクルにわたって異なる。一部の実施形態では、非選択候補配列と選択候補配列とは、Ｘカ所の塩基位置において異なり、この場合、核酸分子の配列に関連するシークエンシングデータセットと、非選択候補配列とは、（Ｘ＋２）カ所またはそれより多くのフロー位置において異なる。シークエンシングされた核酸分子シークエンシングデータセットが選択候補配列に最も良くマッチする、選択候補配列と非選択候補配列とで異なるフロー位置の数の増加は、シークエンシングされた核酸分子シークエンシングデータセットが、非選択候補配列を有する核酸分子のシークエンシングから得られた尤度を低下させる。

シークエンシングされた核酸分子のシークエンシングデータセットが非選択候補配列にマッチする尤度は、好ましくは低く、例えば、０．０５未満、０．０４未満、０．０３未満、０．０２未満、０．０１未満、０．００５未満、０．００１未満、０．０００５未満、または０．０００１未満である。シークエンシングされた核酸分子のシークエンシングデータセットが選択候補配列にマッチする尤度は、好ましくは高く、例えば、０．９５より高く、０．９６より高く、０．９７より高く、０．９８より高く、０．９９より高く、０．９９５より高く、または０．９９９より高い。

試験試料中の短い遺伝子バリアントを検出するための方法は、一部の実施形態では、各試験シークエンシングデータセットが試験試料中の別々の試験核酸分子に関連している、複数の試験シークエンシングデータセットを解析するステップを含み得る。核酸分子は、例えば、核酸分子の配列が参照配列とアラインメントされた場合、ある遺伝子座において少なくとも部分的に重複する。核酸分子の少なくとも一部分は、異なるシークエンシング開始位置（ある遺伝子座に対して）を有することができ、その結果、配列内の所与の塩基について異なるフロー位置、および／または異なるフロー順序コンテキストが生じることになる。このようにして、同じ候補配列を使用して、上記複数のうちの試験シークエンシングデータセットを解析することができる。候補配列ごとに、複数の試験シークエンシングデータセットが候補配列にマッチする尤度を示すマッチスコアを決定することができ、最高尤度マッチを有する（したがって、短い遺伝子バリアントを含む）候補配列を選択することができる。複数の試験シークエンシングデータセットを使用して短い遺伝子バリアントを検出するための例示的解析が、図２Ａ～２Ｄに示されている。図２Ａでは、３つのシークエンシングされた試験核酸分子に対応する配列（伸長されたプライマーの配列により各々表されている、Ｒ１、Ｒ２およびＲ３）が、２つの候補配列（Ｈ１およびＨ２）に関連する重複遺伝子座において参照配列とアラインメントされている。図２Ｂ、図２Ｃおよび図２Ｄは、それぞれ、Ｒ１、Ｒ２およびＲ３についての例示的シークエンシングデータセットを、Ｈ１の塩基（黒塗りの丸印）またはＨ２の塩基（白抜きの丸印）に対応するシークエンシングデータセット内の各フロー位置における選択統計パラメーターとともに示す。

１つまたは複数の決定されたマッチスコアを使用して、試験試料についての短い遺伝子バリアントの存在（もしくはアイデンティティー）または非存在をコールすることができる。一部の実施形態では、例えば、バリアントを有するものとして分類される単一核酸分子（または関連試験シークエンシングデータセット）は、例えば、マッチスコアが、所望の信頼度または事前設定された信頼度で候補配列とのマッチを示す場合、バリアントの存在、アイデンティティーまたは非存在をコールするのに十分なものであり得る。一部の実施形態では、所定数の（例えば、１つまたは複数の、２つまたはそれより多くの、３つまたはそれより多くの、４つまたはそれより多くの、５つまたはそれより多くの、などの）核酸分子（または核酸分子に関連する試験シークエンシングデータセット）は、バリアントが試験試料についてコールされる前にバリアントを有するものとして分類される。一部の実施形態では、核酸分子（または核酸分子に関連する試験シークエンシングデータセット）の数は、マッチスコアに依存して動的に選択され、例えば、高い信頼度マッチスコアでバリアントを有するものとして分類された単一核酸分子を使用してバリアントをコールすることもあり、またはより低い信頼度マッチスコアでバリアントを有するものとして分類された２つまたはそれより多くの核酸分子を使用してバリアントをコールすることもある。

必要に応じて、シークエンシングデータセットについての別々のマッチスコアは、複数の試験シークエンシングデータセットのマッチスコアを決定するためにまとめて解析される。例えば、候補配列ごとに各試験シークエンシングデータセットについてのマッチスコアが、本明細書に記載される方法を使用して決定されると、公知のベイズ法を使用して、例えば、ゲノム解析ツールキット（ＧＡＴＫ）に含まれているＨａｐｌｏｔｙｐｅＣａｌｌｅｒアルゴリズムを使用して、複数の試験シークエンシングデータセットが候補配列にマッチする尤度を示すマッチスコアを決定することができ、最高尤度マッチを有する候補配列を選択することができる。例えば、ＤｅＰｒｉｓｔｏｅｔａｌ．，Ａｆｒａｍｅｗｏｒｋｆｏｒｖａｒｉａｔｉｏｎｄｉｓｃｏｖｅｒｙａｎｄｇｅｎｏｔｙｐｉｎｇｕｓｉｎｇｎｅｘｔ－ｇｅｎｅｒａｔｉｏｎＤＮＡｓｅｑｕｅｎｃｉｎｇｄａｔａ，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ４３，４９１－４９８（２０１１）；およびＰｏｐｌｉｎｅｔａｌ．，Ｓｃａｌｉｎｇａｃｃｕｒａｔｅｇｅｎｅｔｉｃｖａｒｉａｎｔｄｉｓｃｏｖｅｒｙｔｏｔｅｎｓｏｆｔｈｏｕｓａｎｄｓｏｆｓａｍｐｌｅｓ，ｂｉｏＲｘｉｖ，ｗｗｗ．ｂｉｏｒｘｉｖ．ｏｒｇ／ｃｏｎｔｅｎｔ／１０．１１０１／２０１１７８ｖ３（Ｊｕｌｙ２４，２０１８）；Ｈｗａｎｇｅｔａｌ．，Ｓｙｓｔｅｍａｔｉｃｃｏｍｐａｒｉｓｏｎｏｆｖａｒｉａｎｔｃａｌｌｉｎｇｐｉｐｅｌｉｎｅｓｕｓｉｎｇｇｏｌｄｓｔａｎｄａｒｄｐｅｒｓｏｎａｌｅｘｏｍｅｖａｒｉａｎｔｓ，ＳｃｉｅｎｔｉｆｉｃＲｅｐｏｒｔｓ，ｖｏｌ．５，ｎｏ．１７８７５（２０１５）を参照されたく、これらの各々の内容は、本明細書に取り込まれる。
標的バリアントおよび／またはフローサイクル順序の選択

短い標的遺伝子バリアントを、例えば、フロー順序および／もしくは候補配列を選択するための基礎として（すなわち、短い標的遺伝子バリアントを事前選択することにより）、または下流の解析のための基礎として役立つように、選択することができる。下流の解析は、例えば、同定された短い遺伝子バリアントを含むバイオマーカーパネルをアセンブルすることを含み得る。バイオマーカーパネルを試験試料に関連する個々の対象用に個別化することができる。例として、バイオマーカーパネルは、疾患（例えば、がん）に関連する１つまたは複数の短い遺伝子バリアント、例えば、バリアントシグネチャーを含み得る。別の例では、バイオマーカーパネルは、対象用に個別化され、対象からの試料において以前に検出された１つまたは複数の短い遺伝子バリアントを含み、このバリアントは、対象における疾患（例えば、がん）に起因すると考えられ得る。

本明細書に記載の短い遺伝子バリアントを同定するための方法は、１つまたは複数の短い標的遺伝子バリアントが事前選択される場合、特に有用であり得る。所与の短い遺伝子バリアントの検出限界（ＬＯＤ）は、核酸分子をシークエンシングするために、および核酸分子のシークエンシングデータセットを生成するために使用される、短い遺伝子バリアントの配列コンテキスト（例えば、短い標的遺伝子バリアント遺伝子座に隣接する核酸分子の配列）、およびフロー順序（またはフローサイクル順序）に依存し得る。つまり、所与のフロー順序、短い遺伝子バリアント、および短い遺伝子バリアントコンテキストを使用して、短い遺伝子バリアントを有する核酸分子および短い遺伝子バリアントを有さない核酸分子（例えば、参照配列）の間の、フロー空間におけるフロー位置のバリアンスの数を決定することができる。これにより、特に感度の良いバリアントの選択、または高感度で特定のバリアントを検出することができるフロー順序の選択が、可能になる。短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットを、短い標的遺伝子バリアントを有さない参照配列に関連する参照シークエンシングデータセットと比較して、標的配列と参照配列間に存在するフロー位置の相違の数を決定することができる。つまり、参照配列は、短い標的遺伝子バリアントを除いて標的配列と同一である。より多いフロー位置の相違数は、そのバリアントに対してより高い感度（すなわち、より低い検出限界）を示す。標的および参照シークエンシングデータセットは、標的配列を有する核酸分子および／もしくは参照配列を有する核酸分子を実際にシークエンシングすることにより決定されることがあり、またはデータセットは、予想シークエンシングデータセット（例えば、ｉｎｓｉｌｉｃｏで決定されるような）であることがある。

一例では、特定の対象またはがんの遺伝子指紋が所望されることがあるが、対象のまたはがんのゲノムにおける各々のおよびあらゆる短い遺伝子バリアントを検出する必要はない。その代わりに、所与のフロー順序に対して特に高感度である１つまたは複数の短い遺伝子バリアントを事前選択することができる。感度の良いバリアントを事前選択することにより、試験試料に対してより低いシークエンシング深度を使用してバリアントを高い信頼性でコールすることができる。

一部の実施形態では、試験試料中の短い標的遺伝子バリアントを検出するための方法は、短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、フロー位置がヌクレオチドフローに対応する、ステップを含み得る。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータとは、２カ所またはそれより多くの非連続のフロー位置において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータとは、２カ所またはそれより多くの連続するフロー位置において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータとは、３カ所またはそれより多くのフロー位置において異なり、これらのフロー位置は、連続していることもあり、または非連続であることもある。一部の実施形態では、標的配列と参照配列とは、Ｘカ所の塩基位置において異なり、標的シークエンシングデータセットと参照シークエンシングデータとは、（Ｘ＋２）カ所またはそれより多くの連続するフロー位置において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い標的遺伝子バリアントを検出するための方法は、短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列および参照配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、フロー位置がヌクレオチドフローに対応する、ステップを含み得る。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータとは、２カ所またはそれより多くの非連続のフロー位置において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータとは、２カ所またはそれより多くの連続するフロー位置において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータとは、３カ所またはそれより多くのフロー位置において異なり、これらのフロー位置は、連続していることもあり、または非連続であることもある。一部の実施形態では、標的配列と参照配列とは、Ｘカ所の塩基位置において異なり、標的シークエンシングデータセットと参照シークエンシングデータとは、（Ｘ＋２）カ所またはそれより多くの連続するフロー位置において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

選択された、標的となる短い遺伝子バリアントの検出は、一般に上記で論じられたように進行し得る。例えば、一部の実施形態では、短い標的遺伝子バリアントの遺伝子座を有する試験核酸分子に関連する試験シークエンシングデータセットを得ることができる。シークエンシングデータは、標的および参照シークエンシングデータセットを生成するために使用されたのと同じフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより生成される。試験シークエンシングデータセットが短い遺伝子バリアントを有する標的配列にマッチする尤度を示すマッチスコア（または、代替的にもしくは加えて、試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコア）が決定され、決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールすることができる。

一部の実施形態では、各試験シークエンシングデータセットが試験試料中の異なる試験核酸分子に関連している、複数の試験シークエンシングデータセットを使用して、試験試料中の短い標的遺伝子バリアントが検出される。解析される試験核酸分子は、短い標的遺伝子バリアント遺伝子座において重複しており、データセットは、短い標的遺伝子バリアントを選択するために使用されたのと同じフローサイクル順序を使用して標的核酸分子をシークエンシングすることにより生成される。複数の試験シークエンシングデータセットが短い遺伝子バリアントを有する標的配列にマッチする尤度を示すマッチスコア（または、代替的にもしくは加えて、複数の試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコア）が決定され、決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールすることができる。

一部の実施形態では、シークエンシングデータを生成するために使用されるフロー順序またはフローサイクル順序は、事前選択される。本明細書で論じられるように、フロー順序におけるバリアントのコンテキストは、バリアント配列と比較（例えば、参照）配列とのシグナルの相違に影響を与え得る。選択された標的バリアントを検出する尤度を増加させるように、フロー順序またはフローサイクル順序を事前選択することができる。

図３は、試験試料中の短い遺伝子バリアントを検出するための例示的方法のフローチャートを示す。ステップ３０２で、短い標的遺伝子バリアントが選択される。短い標的遺伝子バリアントは、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なるように選択され、フロー位置は、ヌクレオチドフローに対応する。ステップ３０４で、１つまたは複数の試験シークエンシングデータセットは、例えば、１つもしくは複数の試験核酸分子をシークエンシングして１つもしくは複数の試験シークエンシングデータセットを得ることにより、または１つもしくは複数の試験シークエンシングデータセットを受信することにより、得られる。試験シークエンシングデータセットの各々は、試験試料に由来する試験核酸分子に関連している。選択された短い標的遺伝子バリアントの解析のために、試験核酸分子は、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なる。試験シークエンシングデータセットが複数のフロー位置におけるフローシグナルを含む場合、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより、シークエンシングデータセットを決定することができる（または前以て決定しておいてもよい）。ステップ３０６で、試験シークエンシングデータセットに関連する試験核酸分子ごとに、マッチスコアが決定される。マッチスコアは、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示す。あるいは、マッチスコアは、核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すこともある。ステップ３０８で、１つまたは複数の決定されたマッチスコアは、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするために使用される。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングして、複数のフロー位置におけるフローシグナルを含む１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来する、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）短い標的遺伝子バリアントを事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）短い標的遺伝子バリアントを事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングして、複数のフロー位置におけるフローシグナルを含む１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来する、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）短い標的遺伝子バリアントおよびフローサイクル順序を事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するための方法は、（ａ）短い標的遺伝子バリアントおよびフローサイクル順序を事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングして、複数のフロー位置におけるフローシグナルを含む１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来する、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。
標的バリアントおよび／またはフローサイクル順序の選択

フローサイクル順序は、必ずしも４塩基フローサイクル（例えば、Ａ、Ｇ、ＣおよびＴを１つずつ、任意の反復順序で）に限定される必要はなく、サイクル内の塩基タイプが４タイプより多い延長フローサイクルであってもよい。延長サイクル順序を所望のサイクル数、反復して、シークエンシングプライマーを伸長することができる。例として、一部の実施形態では、延長フロー順序は、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０またはそれより多くの別々のヌクレオチドフローをフローサイクル順序で含む。サイクルは、Ａ、Ｇ、ＣおよびＴを少なくとも１つずつ含むことができるが、サイクルが反復される前にサイクル内の１または複数の塩基タイプを反復する。

延長フローサイクル順序は、４塩基が反復されるフローサイクル順序よりも小さいゲノムバリアント（例えばＳＮＰ）のより大きな割合を検出するのに有用であり得る。例えば、形式ＸＹＺ→ＸＱＺ［ここで、Ｑ≠Ｙ（およびＱ、Ｘ、ＹおよびＺは、各々、Ａ、Ｃ、ＧおよびＴのいずれかを１つである）］の置換ＳＮＰについて１９２の有効な配置がある。これらの中で、１６８は、シークエンシングデータセット（例えば、フローグラム）において新しいシグナル（すなわち、新しい非ゼロシグナルまたは新しいゼロシグナル）を生じさせることができる。感度の良いフロー順序と組み合わせられた新しいゼロまたは非ゼロシグナルは、複数のフロー位置にわたって伝播されるシグナル（例えば、サイクルの長さよりも長く延長することができる、フローシフトまたはサイクルシフト）を生じさせることができ、このことにより、バリアントにおいて参照と比較して同一の末尾の配列が得られる。ホモポリマー長変化ではなく、ホモポリマーの挿入または欠失が、シグナルの相違の伝播を生じさせる結果となり得ることは注目される。残りの２４のバリアントは、影響を受けたフロー位置においてホモポリマー長変化を引き起こすが、そのような変化は、シグナル変化の伝播を引き起こさない。したがって、ＳＮＰの理論上最大８７．５％は、２カ所より多くのフロー位置について参照（または候補）配列とは異なる新しいシグナルを生じさせる結果となり得る。上記で論じられたように、シグナルの相違の伝播は、試験シークエンシングデータセットと誤ってマッチした候補配列との尤度差を増加させる。さらに、シグナル変化の伝播は、バリアントに及ぶフロー順序に依存する。

ランダムに断片化された試験試料中の核酸分子のシークエンシングは、シークエンシングプライマーがフロー順序を使用して伸長された場合、バリアントのフロー順序コンテキストのランダムシフトを生じさせる結果となる。つまり、バリアントのフロー位置は、シークエンシングされる核酸分子の開始位置によって変わり得る。たとえ核酸分子配列中のすべてのシークエンシング開始位置が用いられたとしても、ＳＮＰの８７．５％すべてについて、すべてのフローサイクルの組合せが２カ所より多くのフロー位置においてシグナル変化を検出できるとは限らない。例えば、４塩基フローサイクル順序Ｔ－Ａ－Ｃ－Ｇは、ＳＮＰの４１．７％について２カ所より多くのフロー位置において参照シークエンシングデータセットと異なる試験シークエンシングデータセットを生じさせる結果となり得る。本明細書中でさらに論じられるように、延長フローサイクル順序は、ＳＮＰの理論上最大量（すなわち、可能なＳＮＰの８７．５％、またはホモポリマー長の変化を生じさせる結果となるもの以外のすべてのＳＮＰ）のすべてが、２カ所より多くの位置において試験シークエンシングデータセットと参照シークエンシングデータセットとの差を生じさせることができるように設計されており、このことにより十分な高さのシークエンシング深度（すなわち、十分多い数の出発位置のサンプリング）が得られる。

延長シークエンシングフロー順序は、異なる効率（すなわち、ヒト参照ゲノム配列に使用された場合のフローごとの平均取り込み数）を有し得る。一部の実施形態では、フロー順序は、約０．６のまたはそれを超える（例えば、約０．６２もしくはそれを超える、約０．６４もしくはそれを超える、約０．６５もしくはそれを超える、約０．６６もしくはそれを超える、または約０．６７もしくはそれを超える）効率を有する。一部の実施形態では、フロー順序は、約０．６～約０．７の効率を有する。フローサイクル順序および対応する推定効率の例は、表２に示されている。

一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも５％についてのＳＮＰパーミュテーションの約５０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置（すなわち、「フロー相」）の少なくとも５％についてのＳＮＰパーミュテーションの約６０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも５％についてのＳＮＰパーミュテーションの約７０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所またはそれより多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも５％についてのＳＮＰパーミュテーションの約８０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。

一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも１０％についてのＳＮＰパーミュテーションの約５０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも１０％についてのＳＮＰパーミュテーションの約６０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも１０％についてのＳＮＰパーミュテーションの約７０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所またはそれより多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも１０％についてのＳＮＰパーミュテーションの約８０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。

一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも２０％についてのＳＮＰパーミュテーションの約５０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも２０％についてのＳＮＰパーミュテーションの約６０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも２０％についてのＳＮＰパーミュテーションの約７０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所またはそれより多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも２０％についてのＳＮＰパーミュテーションの約８０％～８７．５％がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。

一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも３０％についてのＳＮＰパーミュテーションの約５０％～８７．５％（または約５０％～約８０％）がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも３０％についてのＳＮＰパーミュテーションの約６０％～８７．５％（または約６０％～約８０％）がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所より多くのフロー位置において生じさせるように選択される。一部の実施形態では、延長シークエンシングフロー順序は、ランダムシークエンシング開始位置の少なくとも３０％についてのＳＮＰパーミュテーションの約７０％～８７．５％（または約７０％～約８０％）がＳＮＰによって異なる、核酸分子に関連する２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を、２カ所またはそれより多くのフロー位置において生じさせるように選択される。

一部の実施形態では、延長シークエンシングフロー順序は、表２における延長シークエンシングフロー順序のうちのいずれか１つである。「シフト感度」は、すべての可能なＳＮＰパーミュテーションにわたって２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間のシグナルの相違を２カ所より多くのフロー位置において生じさせる最大感度を指す。「最大シフト感度」は、その感度が維持されるフロー相の最高分率ですべての可能なＳＮＰパーミュテーションにわたって２つのシークエンシングデータセット（例えば、試験または標的シークエンシングデータセットと候補または参照シークエンシングデータセット）間でシグナルの相違を２カ所より多くのフロー位置において生じさせる最大感度を指す。

一部の実施形態では、核酸分子をシークエンシングする方法は、（ａ）核酸分子をプライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成するステップ；（ｂ）５つまたはそれより多くの別々のヌクレオチドフローを含む反復フローサイクル順序に従って別々のヌクレオチドフローで提供される標識された非終結ヌクレオチドを使用してプライマーを伸長するステップ；および（ｃ）取り込まれた標識ヌクレオチドからのシグナルを検出する、またはプライマーがヌクレオチドフローにより伸長された場合のシグナルの非存在を検出するステップを含む。一部の実施形態では、フローサイクル順序は、２カ所より多くのフロー位置において、ランダムシークエンシング開始位置の５％における可能なＳＮＰパーミュテーションの５０％またはそれより多くについてのシグナル変化を誘導する。一部の実施形態では、誘導されるシグナル変化は、シグナル強度の変化、または新しい実質的にゼロ（もしくは新しいゼロ）もしくは新しい実質的に非ゼロ（もしくは新しい非ゼロ）シグナルである。一部の実施形態では、誘導されるシグナル変化は、新しい実質的にゼロ（もしくは新しいゼロ）または新しい実質的に非ゼロ（もしくは新しい非ゼロ）シグナルである。一部の実施形態では、前記フローサイクル順序は、１フロー当り０．６のまたはそれを超える塩基取り込みの効率を有する。一部の実施形態では、フローサイクルは、表２に収載されているフローサイクル順序のうちのいずれか１つである。
異なるフロー順序での再シークエンシング

検出される短い遺伝子バリアントの感度は、核酸分子のシークエンシングに使用されるフローサイクル順序に依存するので、本明細書に記載される方法を、２つまたはそれより多くの異なるフローサイクル順序を使用してシークエンシングされた試験核酸分子（または遺伝子座が重複している複数の核酸分子）の解析に適応させることができる。マッチスコアは、２つまたはそれより多くの異なるシークエンシングデータセット（異なるフローサイクル順序の結果として生じる）と１つまたは複数の候補配列とのマッチに基づいて決定することができる。上記で論じられたようなマッチスコアに基づいて、バリアントの存在または非存在をコールすることおよび／または選択候補配列をコールすることができる。

方法は、第１のフローサイクル順序を使用してシークエンシングされた試験試料に由来する試験核酸分子に関連する第１の試験シークエンシングデータセット、および第２のフローサイクル順序を使用してシークエンシングされた同じ試験核酸分子に関連する第２の試験シークエンシングデータセットを得るステップを含み得る。例えば、試験核酸分子を、第１のフローサイクル順序に従って別々のヌクレオチドフローで非終結核酸分子を提供すること、シークエンシングプライマーを伸長すること、および各ヌクレオチドフローの後にシークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して第１の試験シークエンシングデータセットを生成することにより、シークエンシングし；伸長されたシークエンシングプライマーを除去し；同じ試験核酸分子を、第２のフローサイクル順序に従って別々のヌクレオチドフローで非終結ヌクレオチドを提供すること、シークエンシングプライマーを伸長すること、および各ヌクレオチドフローの後にシークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して第２の試験シークエンシングデータセットを生成することにより、シークエンシングすることができる。

核酸分子は、異なるフローサイクル順序を使用してシークエンシングされるため、シークエンシングデータセットは異なる。図４Ａおよび図４Ｂは、第１のフローサイクル順序（Ｔ－Ａ－Ｃ－Ｇ）（図４Ａ）および第２のフローサイクル順序（Ａ－Ｇ－Ｃ－Ｔ）（図４Ｂ）を使用して決定されたＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）の伸長されたプライマー配列を有する核酸分子についての例示的シークエンシングデータセットを示す。見られる通り、図４Ａおよび図４Ｂのシークエンシングデータセットは、たとえ核酸分子配列が変化しなかったとしても、フローサイクル順序の差に起因して異なる。シークエンシングデータセット内で、第１の候補の伸長されたプライマー配列ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）（黒塗りの丸印）および第２の候補の伸長されたプライマー配列ＴＡＴＧＧＴＣＡＴＣＧＡ（配列番号２）（白抜きの丸印）の塩基カウントに対応する各フロー位置における統計パラメーターを選択することができる。図４Ａおよび図４Ｂは、フローサイクル順序がバリアント検出感度の有意な変化を来すことを実証する。例えば、第１のフローサイクル順序を使用する第１の候補配列と第２の候補配列間の差がフロー位置１２～２０で明らかである（図４Ａ）一方で、第１のフローサイクル順序を使用する第１の候補配列と第２の候補配列間の差が位置１７および１８でのみ明らかである（図４Ｂ）。

第１のシークエンシングデータセットおよび第２のシークエンシングデータセットが１つまたは複数の候補配列［例えば、事前選択された短い標的遺伝子バリアントを有する標的配列、事前選択された短い標的遺伝子バリアントのない配列を有する参照配列、または他の可能性のある候補配列（例えば、ハプロタイプ）］にマッチする尤度を示すマッチスコアを決定することができ、短い標的遺伝子バリアントの存在または非存在をコールすることまたは選択候補配列をコールすることができる。

本明細書中で論じられるように、このプロセスは、共通の遺伝子座で重複している複数の異なる試験核酸分子をシークエンシングする場合に使用することができる。例えば、各々が、第１のフローサイクル順序を使用してシークエンシングされた試験核酸分子に関連する試験シークエンシングデータセットである、複数の第１の試験シークエンシングデータセットを得ることができ、各々が、第２のフローサイクル順序を使用してシークエンシングされた同じ核酸分子に関連する試験シークエンシングデータセットである、複数の第２の試験シークエンシングデータセットを得ることができる。第１のフローサイクル順序と第２のフローサイクル順序は、異なる。複数の第１のシークエンシングデータセットおよび複数の第２のシークエンシングデータセットが１つまたは複数の候補配列［例えば、事前選択された短い標的遺伝子バリアントを有する標的配列、事前選択された短い標的遺伝子バリアントのない配列を有する参照配列、または他の可能性のある候補配列（例えば、ハプロタイプ）］にマッチする尤度を示すマッチスコアを決定することができ、短い標的遺伝子バリアントの存在または非存在をコールすることまたは選択候補配列をコールすることができる。

図５は、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための例示的方法を示す。ステップ５０２で、１つまたは複数の第１の試験シークエンシングデータセットが得られる。１つまたは複数の第１の試験シークエンシングデータセットは、例えば、１つもしくは複数の第１のシークエンシングデータセットを受信することにより、または１つもしくは複数の核酸分子をシークエンシングすることにより、得ることができる。第１の試験シークエンシングデータセットの各々は、試験試料に由来する異なる核酸分子に関連している。第１のシークエンシングデータセットは、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定される。得られた１つまたは複数の第１の試験シークエンシングデータセットの各々は、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む。ステップ５０４で、１つまたは複数の第２の試験シークエンシングデータセットが得られる。１つまたは複数の第２の試験シークエンシングデータセットは、例えば、１つもしくは複数の第２の試験シークエンシングデータセットを受信することにより、または１つもしくは複数の核酸分子をシークエンシングすることにより、得ることができる。第２の試験シークエンシングデータセットの各々は、第１の試験シークエンシングデータセットと同じ核酸分子に関連している。つまり、核酸分子は、第１のシークエンシングデータセットと第２のシークエンシングデータセットの両方に関連している。第２のシークエンシングデータセットは、第１のフローサイクル順序とは異なる第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定される。得られた１つまたは複数の第２の試験シークエンシングデータセットの各々は、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む。ステップ５０６で、第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、マッチスコアが決定される。マッチスコアは、第１の試験シークエンシングデータセット、試験シークエンシングデータセット、または両方が、１つまたは複数の候補配列からの候補配列にマッチすることを示す。ステップ５０８で、決定されたマッチスコアを使用して試験試料中の短い遺伝子バリアントの存在または非存在がコールされる。

図６は、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための別の例示的方法を示す。ステップ６０２で、短い標的遺伝子バリアントが選択される。短い標的遺伝子バリアントは、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータと、参照配列に関連するシークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序または両方に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なるように選択され、第１のフローサイクル順序と第２のフローサイクル順序は異なり、フロー位置はヌクレオチドフローに対応する。ステップ６０４で、１つまたは複数の第１の試験シークエンシングデータセットが得られる。１つまたは複数の第１の試験シークエンシングデータセットは、例えば、１つもしくは複数の第１のシークエンシングデータセットを受信することにより、または１つもしくは複数の核酸分子をシークエンシングすることにより、得ることができる。第１の試験シークエンシングデータセットの各々は、試験試料に由来する異なる核酸分子に関連している。第１のシークエンシングデータセットは、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定される。得られた１つまたは複数の第１の試験シークエンシングデータセットの各々は、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む。ステップ６０６で、１つまたは複数の第２の試験シークエンシングデータセットが得られる。１つまたは複数の第２の試験シークエンシングデータセットは、例えば、１つもしくは複数の第２の試験シークエンシングデータセットを受信することにより、または１つもしくは複数の核酸分子をシークエンシングすることにより、得ることができる。第２の試験シークエンシングデータセットの各々は、第１の試験シークエンシングデータセットと同じ核酸分子に関連している。つまり、核酸分子は、第１のシークエンシングデータセットと第２のシークエンシングデータセットの両方に関連している。第２のシークエンシングデータセットは、第１のフローサイクル順序とは異なる第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定される。得られた１つまたは複数の第２の試験シークエンシングデータセットの各々は、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む。ステップ６０８で、第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、マッチスコアが決定される。マッチスコアは、第１の試験シークエンシングデータセット、試験シークエンシングデータセット、または両方が、１つまたは複数の候補配列（これは参照配列を含み得る）からの候補配列にマッチすることを示す。ステップ６１０で、決定されたマッチスコアを使用して試験試料中の短い遺伝子バリアントの存在または非存在がコールされる。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｂ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、第１のフローサイクル順序と第２のフローサイクル順序が異なり、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットの各々について、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列のマッチする尤度を示す、ステップ；および（ｄ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｂ）第１のフローサイクル順序と異なる第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および（ｄ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｂ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、第１のフローサイクル順序および第２のフローサイクル順序は異なり、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｄ）２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｅ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｂ）第１のフローサイクル順序と異なる第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｄ）２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｅ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および（ｅ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｃ）第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および（ｅ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列（これは参照配列を含み得る）についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｅ）２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｆ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントの存在または非存在を検出するための方法は、（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｃ）第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｅ）２つまたはそれより多くの異なる候補配列（これらは参照配列を含み得る）から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｆ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。
システム、デバイスおよびレポート

図に関連して説明されたものを含む、上記で説明された操作は、図７に描かれている１つまたは複数の構成要素により、必要に応じて実行される。どのようにすれば他のプロセス、例えば、上記で説明された操作のすべてまたは一部の組合せまたは部分的組合せを図７に描かれている構成要素に基づいて実行することができるのかは、当業者には明らかであろう。どのようにすれば本明細書に記載される方法、技法、システムおよびデバイスを互いに、全体として、または部分的に組み合わせることができるのかもまた、それらの方法、技法、システムおよび／またはデバイスが、図７に描かれている構成要素により実行されるか否か、および／または提供されるか否かを問わず、当業者には明らかであろう。

図７は、一実施形態に従ってコンピュータデバイスの例を説明する。デバイス７００は、ネットワークに接続されたホストコンピュータであることがある。デバイス７００は、クライアントコンピュータまたはサーバーであることもある。図７に示されているように、デバイス７００は、任意の好適なタイプのマイクロプロセッサーベースのデバイス、例えば、パーソナルコンピュータ、ワークステーション、サーバー、またはハンドヘルドコンピュータデバイス（携帯用電子デバイス）、例えば電話機もしくはタブレットであり得る。デバイスは、例えば、プロセッサー７１０、入力デバイス７２０、出力デバイス７３０、記憶装置７４０、および通信デバイス７６０のうちの１つまたは複数を含み得る。入力デバイス７２０および出力デバイス７３０は、一般に、上記のものに対応することができ、コンピュータと接続可能または一体型のどちらかであり得る。

入力デバイス７２０は、入力を行なう任意の好適なデバイス、例えば、タッチスクリーン、キーボードもしくはキーパッド、マウス、または音声認識デバイスであり得る。出力デバイス７３０は、出力を行なう任意の好適なデバイス、例えば、タッチパネル、触覚デバイス、またはスピーカーであり得る。

記憶装置７４０は、ＲＡＭ、キャッシュメモリー、ハードドライブまたは脱着式保存ディスクを含む、電子、磁気または光メモリーなどの、記憶域を提供する任意の好適なデバイスであり得る。通信デバイス７６０は、ネットワークを用いてシグナルを送信および受信することができる任意の好適なデバイス、例えば、ネットワークインターフェースチップまたはデバイスを含み得る。コンピュータの構成要素を、任意の好適な方法で、例えば物理的バスを介してまたは無線で、接続することができる。

記憶装置７４０に記憶され、プロセッサー７１０により実行され得る、ソフトウェア７５０は、例えば、本開示の機能性を具現化する（例えば、上記のデバイスで具現化されるような）プログラミングを含むことができる。

上記のものなどの命令実行システム、装置もしくはデバイスで使用するための、またはそれと接続している、任意の非一過性コンピュータ可読記憶媒体であって、ソフトウェアに関連する命令を命令実行システム、装置またはデバイスから取り出し、命令を実行することができる可読記憶媒体の中に、ソフトウェア７５０を記憶および／またはトランスポートすることもできる。本開示に関して、コンピュータ可読記憶媒体は、命令実行システム、装置もしくはデバイスで使用するための、またはそれと接続している、プログラミングを収容または記憶することができる任意の媒体、例えば、記憶装置７４０であり得る。

上記のものなどの命令実行システム、装置もしくはデバイスで使用するための、またはそれと接続している、任意のトランスポート媒体であって、ソフトウェアに関連する命令を命令実行システム、装置またはデバイスから取り出し、命令を実行することができるトランスポート媒体の中に、ソフトウェア７５０を伝播することもできる。本開示に関して、トランスポート媒体は、命令実行システム、装置もしくはデバイスで使用するための、またはそれと接続している、プログラミングを伝える、伝播するまたはトランスポートすることができる、任意の媒体であり得る。トランスポート可読媒体としては、電子、磁気、光、電磁または赤外有線もしくは無線伝播媒体を挙げることができるが、これらに限定されない。

デバイス７００をネットワークに接続することができ、これは任意の好適なタイプの相互接続通信システムであり得る。ネットワークは、任意の好適な通信プロトコルを実行することができ、ネットワークを任意の好適なセキュリティープロトコルにより保護することができる。ネットワークは、ネットワークシグナルの通信および受信を実行することができる任意の好適な構成のネットワークリンク、例えば、無線ネットワーク接続、Ｔ１もしくはＴ３ライン、ケーブルネットワーク、ＤＳＬ、または電話線を含むことができる。

デバイス７００は、ネットワークでの操作に好適な任意の操作システムを実装することができる。ソフトウェア７５０を任意の好適なプログラミング言語、例えば、Ｃ、Ｃ＋＋、Ｊａｖａ（登録商標）またはＰｙｔｈｏｎで書くことができる。様々な実施形態では、本開示の機能性を具現化するアプリケーションソフトウェアを、例えば、異なる配置で、例えばクライアント／サーバー構成で、またはウェブベースのアプリケーションもしくはウェブサービスのようなウェブブラウザによって、展開することができる。

本明細書に記載される方法は、解析方法を使用して決定された情報を報告するステップ、および／または解析方法を使用して決定された情報を含むレポートを生成するステップを、必要に応じてさらに含む。例えば、一部の実施形態では、方法は、対象に由来する（例えば、対象のゲノム内の）ポリヌクレオチドにおけるバリアントの同定に関する＿＿を報告するステップまたはそれを含むレポートを生成するステップをさらに含む。報告される情報、またはレポートの中の情報は、例えば、参照配列にマッピングされたカップリングされたシークエンシングリードペアの遺伝子座、検出されたバリアント（例えば、検出された構造バリアントまたは検出されたＳＮＰ）、１つもしくは複数のアセンブルされたコンセンサス配列、および／または１つもしくは複数のアセンブルされたコンセンサス配列についての検証統計量に関連し得る。受信者、例えば、臨床医、対象または研究者に、レポートを配布することができ、または情報を報告することができる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）１または複数台のプロセッサーで、短い標的遺伝子バリアントを選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングして、複数のフロー位置におけるフローシグナルを含む１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来する、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントを事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントを事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングして、複数のフロー位置におけるフローシグナルを含む１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来する、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントおよびフローサイクル順序を事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントおよびフローサイクル順序を事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングして、複数のフロー位置におけるフローシグナルを含む１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来する、ステップ；（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｂ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、第１のフローサイクル順序および第２のフローサイクル順序は異なり、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および（ｄ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｂ）第１のフローサイクル順序と異なる第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および（ｄ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｂ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、第１のフローサイクル順序および第２のフローサイクル順序は異なり、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｄ）２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｅ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｂ）第１のフローサイクル順序と異なる第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｄ）２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｅ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および（ｅ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｃ）第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および（ｅ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列（これは参照配列を含み得る）についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｅ）２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｆ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。

一部の実施形態では、１または複数台のプロセッサーと、以下についての命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体とを含むシステムが存在する：（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ；（ｂ）第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各々の第１の試験シークエンシングデータセットが、異なる試験核酸分子に関連している、ステップ；（ｃ）第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験試料に由来する同じ１つまたは複数の試験核酸分子をシークエンシングして、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各々の第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットの１つと同じ試験核酸分子に関連している、ステップ；（ｄ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットごとに、１つまたは複数の候補配列に対するマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；（ｅ）２つまたはそれより多くの異なる候補配列（これらは参照配列を含み得る）から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および（ｆ）選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ。一部の実施形態では、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とは、第１のフローサイクル順序および／または第２のフローサイクル順序によれば、２カ所またはそれより多くの（または３カ所もしくはそれより多くの、または１もしくは複数のフローサイクルにわたっての）フロー位置（これらの位置は、連続的であることもあり、または非連続であることもある）において異なる。

一部の実施形態では、本明細書に記載される方法は、図７で説明される構成要素のうちの１つまたは複数を使用して遂行され得る、コンピュータ実装方法である。例えば、一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するためのコンピュータ実装方法は、（ａ）１または複数台のプロセッサーを使用して、短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１または複数台のプロセッサーで、１つまたは複数の試験シークエンシングデータセットを受信するステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１または複数台のプロセッサーを使用して、試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１または複数台のプロセッサーおよび１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するためのコンピュータ実装方法は、（ａ）１または複数台のプロセッサーを使用して、短い標的遺伝子バリアントを事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１または複数台のプロセッサーで、１つまたは複数の試験シークエンシングデータセットを受信するステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１または複数台のプロセッサーで、試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１または複数台のプロセッサーで、１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するためのコンピュータ実装方法は、（ａ）１または複数台のプロセッサーを使用して、短い標的遺伝子バリアントおよびフローサイクル順序を事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１または複数台のプロセッサーで、１つまたは複数の試験シークエンシングデータセットを受信するステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１または複数台のプロセッサーで、試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１または複数台のプロセッサーで、１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するためのコンピュータ実装方法は、（ａ）１または複数台のプロセッサーで、短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１または複数台のプロセッサーで、１つまたは複数の試験シークエンシングデータセットを受信するステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１または複数台のプロセッサーで、試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１または複数台のプロセッサーで、１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するためのコンピュータ実装方法は、（ａ）１または複数台のプロセッサーで、短い標的遺伝子バリアントを事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１または複数台のプロセッサーで、１つまたは複数の試験シークエンシングデータセットを受信するステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１または複数台のプロセッサーで、試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１または複数台のプロセッサーで、１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。

一部の実施形態では、試験試料中の短い遺伝子バリアントを検出するためのコンピュータ実装方法は、（ａ）１または複数台のプロセッサーで、短い標的遺伝子バリアントおよびフローサイクル順序を事前選択するステップであって、事前選択された短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；（ｂ）１または複数台のプロセッサーで、１つまたは複数の試験シークエンシングデータセットを受信するステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、事前選択された短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、事前選択されたフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；（ｃ）１または複数台のプロセッサーで、試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および（ｄ）１または複数台のプロセッサーで、１つまたは複数の決定されたマッチスコアを使用して、試験試料中の事前選択された短い標的遺伝子バリアントの存在または非存在をコールするステップを含む。一部の実施形態では、方法は、試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップをさらに含み、このバイオマーカーパネルは、短い標的遺伝子バリアントを含む。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、２カ所より多くのフロー位置（例えば、２カ所より多くの連続するフロー位置、または２カ所より多くの非連続のフロー位置）において異なる。一部の実施形態では、標的シークエンシングデータセットと、参照シークエンシングデータセットとは、１または複数のフローサイクルにわたって異なる。
例示的実施形態

以下の実施形態は、例示的なものであり、請求項記載の本発明の範囲を限定するように意図されたものではない。

実施形態１．試験試料中の短い遺伝子バリアントを検出するための方法であって、
（ａ）短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットがフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、フロー位置が、ヌクレオチドフローに対応する、ステップ；
（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ試験試料に由来し、１つまたは複数の試験シークエンシングデータセットが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることにより決定され、試験シークエンシングデータセットが、複数のフロー位置におけるフローシグナルを含む、ステップ；
（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、核酸分子に関連する試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコア、または核酸分子に関連する試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および
（ｄ）１つまたは複数の決定されたマッチスコアを使用して、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップ
を含む方法。

実施形態２．得るステップが、フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングすることを含む、実施形態１の方法。

実施形態３．短い標的遺伝子バリアントが、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの前に事前選択される、実施形態１または実施形態２の方法。

実施形態４．短い標的遺伝子バリアントが、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの後にコールの信頼度に基づいて選択される、実施形態１または実施形態２に記載の方法。

実施形態５．試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップを含み、バイオマーカーパネルが、短い標的遺伝子バリアントを含む、実施形態１から４のいずれか１つの方法。

実施形態６．フローサイクル順序を選択するステップを含む、実施形態１から５のいずれか１つの方法。

実施形態７．標的シークエンシングデータセットが、予想標的シークエンシングデータセットであり、または参照シークエンシングデータセットが、予想参照シークエンシングデータセットである、実施形態１から６のいずれか１つの方法。

実施形態８．標的シークエンシングデータセットおよび予想参照シークエンシングデータセットが、標的配列および参照配列をｉｎｓｉｌｉｃｏでシークエンシングすることにより得られる、実施形態７の方法。

実施形態９．標的シークエンシングデータセットと参照シークエンシングデータとが、２カ所より多くの非連続のフロー位置において異なる、実施形態１から８のいずれか１つの方法。

実施形態１０．標的シークエンシングデータセットと参照シークエンシングデータとが、２カ所より多くの連続するフロー位置において異なる、実施形態１から９のいずれか１つの方法。

実施形態１１．標的配列と参照配列とが、Ｘカ所の塩基位置において異なり、標的シークエンシングデータセットと参照シークエンシングデータとが、（Ｘ＋２）カ所またはそれより多くの連続するフロー位置において異なる、実施形態１から１０のいずれか１つの方法。

実施形態１２．（Ｘ＋２）カ所のフロー位置の相違が、実質的にゼロに等しい値と実質的にゼロより大きい値の間の相違を含む、実施形態１１の方法。

実施形態１３．標的シークエンシングデータセットと参照シークエンシングデータセットとが、１または複数のフローサイクルにわたって異なる、実施形態１から１２のいずれか１つの方法。

実施形態１４．フローシグナルが、各フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す塩基カウントを含む、実施形態１から１３のいずれか１つの方法。

実施形態１５．フローシグナルが、各フロー位置における少なくとも１塩基カウントの尤度を示す統計パラメーターを含み、塩基カウントが、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す、実施形態１から１４のいずれか１つの方法。

実施形態１６．フローシグナルが、各フロー位置における複数の塩基カウントの尤度を示す統計パラメーターを含み、各塩基カウントが、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す、実施形態１から１５のいずれか１つの方法。

実施形態１７．ステップ（ｃ）が、
試験シークエンシングデータセット内の各フロー位置における統計パラメーターであって、そのフロー位置における標的配列の塩基カウントに対応する統計パラメーターを選択すること、および試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコアを決定すること；または
試験シークエンシングデータセット中の各フロー位置における統計パラメーターであって、そのフロー位置における参照配列の塩基カウントに対応する統計パラメーターを選択すること、および試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定すること
を含む、実施形態１６の方法。

実施形態１８．ステップ（ｃ）で決定されるマッチスコアが、試験シークエンシングデータセット内のフロー位置にわたっての選択された統計パラメーターの組み合わされた値である、実施形態１７の方法。

実施形態１９．ステップ（ｃ）が、試験シークエンシングデータセットが標的配列にマッチする尤度を示すマッチスコアを決定することを含む、実施形態１から１８のいずれか１つの方法。

実施形態２０．ステップ（ｃ）が、試験シークエンシングデータセットが参照配列にマッチする尤度を示すマッチスコアを決定することを含む、実施形態１から１９のいずれか１つの方法。

実施形態２１．１つまたは複数の試験シークエンシングデータセットが、複数の試験シークエンシングデータセットを含む、実施形態１から２０のいずれか１つの方法。

実施形態２２．短い標的遺伝子バリアントの存在または非存在が、１つまたは複数の試験シークエンシングデータセットの各々について別々にコールされる、実施形態２１の方法。

実施形態２３．複数の試験シークエンシングデータセットの少なくとも一部分が、異なる試験シークエンシング開始位置を有する異なる試験核酸分子に関連する、実施形態２１または２２の方法。

実施形態２４．フローサイクル順序が、同じ順序で反復される４つの別々のフローを含む、実施形態１から２３のいずれか１つの方法。

実施形態２５．フローサイクル順序が、５つまたはそれより多くの別々のフローを含む、実施形態１から２４のいずれか１つの方法。

実施形態２６．１または複数台のプロセッサーを使用して短い標的遺伝子バリアントを選択するステップ；
１つまたは複数の試験シークエンシングデータセットを１または複数台のプロセッサーで受信することにより、１つまたは複数の試験シークエンシングデータセットを得るステップ；
１または複数台のプロセッサーを使用して１つまたは複数のマッチスコアを決定するステップ；および
１または複数台のプロセッサーを使用して試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップ
を含むコンピュータ実装方法である、実施形態１から２５のいずれか１つの方法。

実施形態２７．１または複数台のプロセッサーと、
実施形態１から２６のいずれか１つの方法を実行するための命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体と
を含むシステム。

実施形態２８．試験試料中の短い遺伝子バリアントを検出するための方法であって、
（ａ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、試験試料に由来する異なる試験核酸分子に関連し、第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、１つまたは複数の第１の試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；
（ｂ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、第１のフローサイクル順序と第２のフローサイクル順序が異なり、試験シークエンシングデータセットが、ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；
（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットの各々について、１つまたは複数の候補配列についてのマッチスコアを決定するステップであって、マッチスコアが、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方が１つまたは複数の候補配列からの候補配列のマッチする尤度を示す、ステップ；および
（ｄ）決定されたマッチスコアを使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ
を含む方法。

実施形態２９．第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングするステップ、および第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して試験核酸分子をシークエンシングするステップを含む、実施形態２８の方法。

実施形態３０．マッチスコアが、第１の試験シークエンシングデータセットが候補配列にマッチする尤度、または第２の試験シークエンシングデータセットが候補配列にマッチする尤度を示す、実施形態２８または２９の方法。

実施形態３１．マッチスコアが、第１の試験シークエンシングデータセットと第２のシークエンシングデータセット両方が候補配列にマッチする尤度を示す、実施形態２８または２９の方法。

実施形態３２．１つまたは複数の候補配列が、２つまたはそれより多くの異なる候補配列を含み、方法が、第１のシークエンシングデータセットおよび第２のシークエンシングデータセットに関連する核酸分子の各々について：
２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、第１の試験シークエンシングデータセット、第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および
選択候補配列を使用して、試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ
を含む、実施形態２８から３１のいずれか１つの方法。

実施形態３３．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くのフロー位置において異なる、実施形態３２の方法。

実施形態３４．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くのフロー位置において異なる、実施形態３２の方法。

実施形態３５．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの非連続のフロー位置において異なる、実施形態３２の方法。

実施形態３６．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの非連続のフロー位置において異なる、実施形態３２の方法。

実施形態３７．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの連続のフロー位置において異なる、実施形態３２の方法。

実施形態３８．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの連続のフロー位置において異なる、実施形態３２の方法。

実施形態３９．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、３カ所またはそれより多くのフロー位置において異なる、実施形態３２の方法。

実施形態４０．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、３カ所またはそれより多くのフロー位置において異なる、実施形態３２の方法。

実施形態４１．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、Ｘカ所の塩基位置において異なり、試験核酸分子に関連する試験シークエンシングデータセットと、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、（Ｘ＋２）カ所またはそれより多くのフロー位置において異なる、実施形態３２の方法。

実施形態４２．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、Ｘカ所の塩基位置において異なり、試験核酸分子に関連する試験シークエンシングデータセットと、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、（Ｘ＋２）カ所またはそれより多くのフロー位置において異なる、実施形態３２の方法。

実施形態４３．（Ｘ＋２）カ所のフロー位置の相違が、実質的にゼロに等しい値と実質的にゼロより大きい値の間の相違を含む、実施形態４１または４２の方法。

実施形態４４．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、１または複数のフローサイクルにわたって異なる、実施形態３２の方法。

実施形態４５．２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、選択候補配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、１または複数のフローサイクルにわたって異なる、実施形態３２の方法。

実施形態４６．フローシグナルが、各フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す塩基カウントを含む、実施形態２８から４５のいずれか１つの方法。

実施形態４７．フローシグナルが、各フロー位置における少なくとも１塩基カウントの尤度を示す統計パラメーターを含み、塩基カウントが、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す、実施形態２８から４６のいずれか１つの方法。

実施形態４８．フローシグナルが、各フロー位置における複数の塩基カウントの尤度を示す統計パラメーターを含み、各塩基カウントが、フロー位置におけるシークエンシングされた試験核酸分子の塩基の数を示す、実施形態２８から４７のいずれか１つの方法。

実施形態４９．マッチスコアを決定するステップが、第１の試験シークエンシングデータセットおよび第２の試験シークエンシングデータセットにおける各フロー位置における統計パラメーターであって、候補配列のそのフロー位置における塩基カウントに対応する統計パラメーターを、１つまたは複数の異なる候補配列の各々について選択することを含む、実施形態４８の方法。

実施形態５０．１つまたは複数の異なる候補配列について、各フロー位置における候補配列の塩基カウントを含む候補シークエンシングデータセットを生成するステップを含む、実施形態４９の方法。

実施形態５１．候補シークエンシングデータセットが、ｉｎｓｉｌｉｃｏで生成される、実施形態５０の方法。

実施形態５２．マッチスコアが、第１の試験シークエンシングデータセットおよび第２の試験シークエンシングデータセットにおけるフロー位置にわたって選択された統計パラメーターの組み合わされた値である、実施形態４９から５１のいずれか１つの方法。

実施形態５３．試験核酸分子の少なくとも一部分が、異なるシークエンシング開始位置を有する、実施形態２８から５２のいずれか１つの方法。

実施形態５４．短い標的遺伝子バリアントを選択するステップであって、短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、標的シークエンシングデータセットおよび参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、第１のフローサイクル順序と第２のフローサイクル順序とが異なり、フロー位置がヌクレオチドフローに対応する、ステップ
を含み、
１つまたは複数の候補配列が、標的配列および参照配列を含む、
実施形態２８から５２のいずれか１つの方法。

実施形態５５．短い標的遺伝子バリアントが、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの前に事前選択される、実施形態５４の方法。

実施形態５６．短い標的遺伝子バリアントが、試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップの後にコールの信頼度に基づいて選択される、実施形態５４の方法。

実施形態５７．試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップを含み、バイオマーカーパネルが、試験試料中に存在する短い標的遺伝子バリアントを含む、実施形態５６の方法。

実施形態５８．参照シークエンシングデータセットが、第１のフローサイクル順序または第２のフローサイクル順序に従って別々のフローで提供される非終結ヌクレオチドを使用して参照配列がシークエンシングされた場合の予想参照シークエンシングデータセットを決定することにより得られる、実施形態５４から５７のいずれか１つの方法。

実施形態５９．参照シークエンシングデータセットが、第１のフローサイクル順序および第２のフローサイクル順序の両方に従って別々のフローで提供される非終結ヌクレオチドを使用して参照配列がシークエンシングされた場合の予想参照シークエンシングデータセットを決定することにより得られる、実施形態５４から５７のいずれか１つの方法。

実施形態６０．標的配列と参照配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くのフロー位置において異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６１．標的配列と参照配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの非連続のフロー位置において異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６２．標的配列と参照配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの非連続のフロー位置において異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６３．標的配列と参照配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くの連続であるフロー位置において異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６４．標的配列と参照配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くの連続であるフロー位置において異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６５．標的配列と参照配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、３カ所またはそれより多くのフロー位置において異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６６．標的配列と参照配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、３カ所またはそれより多くのフロー位置において異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６７．標的配列と参照配列とが、第１のフローサイクル順序または第２のフローサイクル順序によれば、２カ所またはそれより多くのフローサイクルにわたって異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６８．標的配列と参照配列とが、第１のフローサイクル順序および第２のフローサイクル順序の両方によれば、２カ所またはそれより多くのフローサイクルにわたって異なる、実施形態５４から５７のいずれか１つの方法。

実施形態６９．第１のフローサイクル順序または第２のフローサイクル順序が、同じ順序で反復される４つの別々のフローを含む、実施形態２８から６８のいずれか１つの方法。

実施形態７０．第１のフローサイクル順序または第２のフローサイクル順序が、同じ順序で反復される５つまたはそれより多くの別々のフローを含む、実施形態２８から６８のいずれか１つの方法。

実施形態７１．試験核酸分子をシークエンシングするステップであって、第１のフローサイクル順序に従って別々のヌクレオチドフローで非終結ヌクレオチドを提供することと、シークエンシングプライマーを伸長することと、各ヌクレオチドフローの後にシークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して第１の試験シークエンシングデータセットを生成することとを含むステップ；
伸長されたシークエンシングプライマーを除去するステップ；および
同じ試験核酸分子をシークエンシングするステップであって、第２のフローサイクル順序に従って別々のヌクレオチドフローで非終結ヌクレオチドを提供することと、シークエンシングプライマーを伸長することと、各ヌクレオチドフローの後にシークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して第２の試験シークエンシングデータセットを生成することとを含むステップ
を含む、実施形態２８から７０のいずれか１つの方法。

実施形態７２．１つまたは複数の第１のシークエンシングデータセットを１または複数台のプロセッサーで受信するステップ；
１つまたは複数の第１のシークエンシングデータセットを１または複数台のプロセッサーで受信するステップ；
１または複数台のプロセッサーを使用してマッチスコアを決定するステップ；および
１または複数台のプロセッサーを使用して試験試料中の短い標的遺伝子バリアントの存在または非存在をコールするステップ
を含むコンピュータ実装方法である、実施形態２８から７１のいずれか１つの方法。

実施形態７３．１または複数台のプロセッサーと、
実施形態２８から７２のいずれか１つの方法を実行するための命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体と
を含むシステム。

実施形態７４．別々のフローが、単一の塩基タイプを含む、実施形態１から７３のいずれか１つの方法またはシステム。

実施形態７５．別々のフローのうちの少なくとも１つが、２つまたは３つの異なる塩基タイプを含む、実施形態１から７４のいずれか１つの方法またはシステム。

実施形態７６．試験試料中の短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示すバリアントコールファイルを生成またはアップデートするステップを含む、実施形態１から７５のいずれか１つの方法またはシステム。

実施形態７７．試験試料中の短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示すレポートを生成するステップを含む、実施形態１から７６のいずれか１つの方法またはシステム。

実施形態７８．レポートが、試験試料中の短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示す、テキスト出力、確率的出力、数値出力またはグラフィック出力を含む、実施形態７７の方法またはシステム。

実施形態７９．レポートを患者にまたは患者の医療担当者に提供するステップを含む、実施形態７７または７８の方法またはシステム。

実施形態７８．短い遺伝子バリアントが、一塩基多型またはインデルを含む、実施形態１から７７のいずれか１つの方法またはシステム。

実施形態７９．短い遺伝子バリアントが、インデルを含む、実施形態１から７７のいずれか１つの方法またはシステム。

実施形態８０．試験試料が、断片化ＤＮＡを含む、実施形態１から７９のいずれか１つの方法またはシステム。

実施形態８１．試験試料が、無細胞ＤＮＡを含む、実施形態１から８０のいずれか１つの方法またはシステム。

実施形態８２．無細胞ＤＮＡが、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含む、実施形態８１の方法またはシステム。

実施形態８３．核酸分子をシークエンシングする方法であって、
核酸分子をプライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成するステップ；
５つまたはそれより多くの別々のヌクレオチドフローを含む反復フローサイクル順序に従って別々のヌクレオチドフローで提供される標識された非終結ヌクレオチドを使用してプライマーを伸長するステップ；および
取り込まれた標識ヌクレオチドからのシグナルを検出する、またはプライマーがヌクレオチドフローにより伸長された場合のシグナルの非存在を検出するステップ
を含む、方法。

実施形態８４．シグナル、またはシグナルの非存在を、各ヌクレオチドフロー後に検出するステップを含む、実施形態８３の方法。

実施形態８５．複数の核酸分子をシークエンシングするステップを含む、実施形態８３または８４の方法。

実施形態８６．複数のうちの核酸分子が、ある遺伝子座に対して異なるシークエンシング開始位置を有する、実施形態８５の方法。

実施形態８７．試験試料が、無細胞ＤＮＡである、実施形態８３から８６のいずれか１つの方法。

実施形態８８．無細胞ＤＮＡが、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を含む、実施形態８３から８６のいずれか１つの方法。

実施形態８９．フローサイクル順序が、２カ所より多くのフロー位置において、ランダムシークエンシング開始位置の５％またはそれより多くにおける可能なＳＮＰパーミュテーションの５０％またはそれより多くについてのシグナル変化を誘導する、実施形態８３から８６のいずれか１つの方法。

実施形態９０．フローサイクル順序が、フロー当り０．６のまたはそれを超える塩基取り込みの効率を有する、実施形態８３から８６のいずれか１つの方法。

本願の例示的実施形態として提供する以下の非限定的実施例を参照することにより、本願をよりよく理解することができる。以下の実施例を、実施形態をより十分に説明するために提示するが、いかなる点においても本願の広い範囲を限定するものと解釈すべきでない。本願のある特定の実施形態を本明細書で示し、説明したが、このような実施形態を単なる例として提供することは明らかであろう。本発明の趣旨および範囲から逸脱しない非常に多くの変形形態、変更形態および置換形態に当業者なら想到するであろう。本明細書に記載する実施形態の様々な代替形態を、本明細書に記載する方法を実施する際に利用することができることは、理解されるはずである。
（実施例１）
ＳＮＰ検出

フローサイクル順序Ａ－Ｔ－Ｇ－Ｃに従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して仮想核酸分子をシークエンシングし、その結果、図１Ａに示す試験シークエンシングデータセットを得た。シークエンシングデータセットにおける各値は、各フロー位置における示されている塩基カウントが正しい尤度を示す。シークエンシングデータセットに基づいて、予備配列をＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）として決定し、これを参照ゲノムの遺伝子座にマッピングする。参照ゲノムに遺伝子座を、可能性のあるハプロタイプ配列ＴＡＴＧＧＴＣＧＴＣＧＡ（配列番号１）（Ｈ１）およびＴＡＴＧＧＴＣＡＴＣＧＡ（配列番号２）（Ｈ２）と関連付ける。各フロー位置についてのハプロタイプ配列の塩基カウントに関連する尤度値を、ハプロタイプごとに選択する。各ハプロタイプに付与されるシークエンシングデータセットの尤度を、各フロー位置についてのハプロタイプ配列の塩基カウントに関連する尤度値を乗じることにより決定する。Ｈ１が正しい配列である場合のシークエンシングデータセットのｌｏｇ尤度は、－０．０１５であり、Ｈ２が正しい配列である場合のシークエンシングデータセットのｌｏｇ尤度は、－２７．００８である。したがって、Ｈ１の配列をこの核酸分子に選択する。
（実施例２）
インデル検出

フローサイクル順序Ａ－Ｔ－Ｇ－Ｃに従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して仮想核酸分子をシークエンシングし、その結果、図８に示す試験シークエンシングデータセットを得た。シークエンシングデータセットにおける各値は、各フロー位置における示されている塩基カウントが正しい尤度を示す。シークエンシングデータセットに基づいて（すなわち、各フロー位置において最も可能性の高い塩基カウントを選択することにより）、予備配列をＴＡＴＧＧＴＣＧＡＴＣＧ（配列番号８）として決定し、これを参照ゲノムの遺伝子座にマッピングする。参照ゲノムの遺伝子座を、可能性のあるハプロタイプ配列ＴＡＴＧＧＴＣＧ－ＴＣＧＡ（配列番号７）（Ｈ１）およびＴＡＴＧＧＴＣＧＡＴＣＧ（配列番号８）（Ｈ２）と関連付ける。各フロー位置についてのハプロタイプ配列の塩基カウントに関連する尤度値を、ハプロタイプごとに選択する。各ハプロタイプに付与されるシークエンシングデータセットの尤度を、各フロー位置についてのハプロタイプ配列の塩基カウントに関連する尤度値を乗じることにより決定する。Ｈ１が正しい配列である場合のシークエンシングデータセットのｌｏｇ尤度は、－２４．００９であり、Ｈ２が正しい配列である場合のシークエンシングデータセットのｌｏｇ尤度は、－０．０１５である。したがって、Ｈ２の配列をこの核酸分子に選択する。
（実施例３）
延長シークエンシングフロー順序

１００万を超える延長シークエンシングフロー順序を、すべての可能なＳＮＰのセットにわたって２カ所より多くのフロー位置においてシグナル変化［ＸＹＺ→ＸＱＺ、ここで、Ｑ≠Ｙ（およびＱ、Ｘ、ＹおよびＺは、各々、Ａ、Ｃ、ＧおよびＴのいずれかを１つである）］を誘導するそれらの尤度について、ｉｎｓｉｌｉｃｏで検定した。すべての有効な２塩基フローパーミュテーションで最低１２塩基の配列を有するように延長フロー順序を設計し、逐次的塩基反復を有するフロー順序を除去した。フロー順序のすべての可能な開始位置を検定して、２カ所より多くのフロー位置においてシグナル変化を誘導する延長フロー順序の感度を評定した。図９および表２は、この解析の例示的結果を示す。図９中のｘ軸は、フロー相（または断片化開始位置）の分率を示し、ｙ軸は、２カ所より多くのフロー位置においてシグナル変化を誘導したＳＮＰパーミュテーションの分率を示す。いくつかのフロー順序は、リード（またはフロー開始位置）のおおよそ１０％についてすべての可能な（８７．５％）ＳＮＰパーミュテーションで２つまたはそれより多くのシグナルの相違を誘導する。４塩基周期的フローは、可能なＳＮＰのたった４２％でサイクルシフトを誘導するだけであるが、すべてのリードまたはフロー相でこれを行なう。効率の最終評価をヒト参照ゲノムの１００万塩基サブセットに対して遂行して、実行可能性を確立した。これは、現実の生物にはパターンおよび偏りがある配列をフロー順序がいかに効率的に伸長するかの実際的な評価基準である。
（実施例４）
ＳＮＰ検出精度

ＤＮＡ試料ＮＡ１２８７８（コリエル医学研究所（ＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅｆｏｒＭｅｄｉｃａｌＲｅｓｅａｒｃｈ）から入手可能な試料）のゲノムを、４フローサイクル（Ｔ－Ａ－Ｃ－Ｇ）に従って非終結蛍光標識ヌクレオチドを使用してシークエンシングした。シークエンシング実行により、平均長が１７６塩基である４１５，９００，００２のリードが生成された。３９９，８０４，９２５リードをｈｇ３８参照ゲノムと（ＢＷＡ、バージョン０．７．１７－ｒ１１８８で）アラインメントした。

アラインメント後、参照ゲノムと完全にアラインしたリード（１７８，６３４，６２５リード）、または参照ゲノムとの単一ミスマッチを有し、２０のもしくはそれを超えるマッピング品質スコアでアラインしたリード（２７，２６５，６６１リード）を選択した。つまり、１９３，９０４，６３９は、例えば、インデル、複数のミスマッチ、または参照ゲノムとの誤っている（アーチファクトの）可能性のあるアラインメントを有するため、さらなる解析に含めなかった。したがって、２７，２６５，６６１リードは、真の陽性ＮＡ１２８７８ＳＮＰはもちろん、シークエンシングエラーから生じるあらゆる偽陽性ＳＮＰも含むと推定した。２７，２６５，６６１リードのこのプールから、真の陽性ＮＡ１２８７８ＳＮＰバリアントの効果を低下させる１回より多くミスマッチ遺伝子座に及んだシークエンシングリードを除去し、その結果、深度１のミスマッチを有する合計３，４１３，７００リードを得た。

残りの３，４１３，７００リード各々は、（１）フローグラムフローシグナルがフローサイクル順序に基づいて参照に対して１フルサイクル（例えば、４フロー位置）シフトした場合、サイクルシフトを誘導すると予想されるミスマッチ、（２）異なるフローサイクルを使用した場合、サイクルシフトを誘導し得る（例えば、それが、フローグラムで新しいゼロもしくは新しい非ゼロシグナルを生成する）可能性のあるミスマッチ、または（３）フローサイクル順序に関係なくサイクルシフトを誘導することができないであろうミスマッチを含んだ。３，４１３，７００ミスマッチのうち、１，１８４，９５４（３４％）は、サイクルシフトを誘導したが、１，５４６，５８８（４３％）は、異なるフロー順序でサイクルシフト（すなわち、「可能性のあるサイクルシフト」）を誘導することがあった。比較して、ランダムミスマッチの理論的予想は、名目上、サイクルシフト４２％および可能性のあるサイクルシフトミスマッチ４６％を示唆した。全体的に見て、サイクルシフトを誘導するミスマッチ率は、３．７×１０^－５事象／塩基であり、可能性のあるサイクルシフトを誘導するミスマッチ率は、４．８×１０^－５事象／塩基であった。表３は、サイクルシフトを誘導する１０の最高頻度単一ミスマッチ、および発生率の相対パーセンテージを示す。

次いで、３つの異なるクラス（すなわち、サイクルシフトを誘導する、サイクルシフトを誘導する可能性がある、またはサイクルシフトを誘導しないおよび誘導することができない）の各々におけるミスマッチに基づくバリアントコーリングの性能を評価した。ＢＷＡを用いてリードを参照ゲノムとアラインメントし、ＧＡＴＫ（バージョン４）のＨａｐｌｏｔｙｐｅＣａｌｌｅｒツールを使用してバリアントコーリングを遂行した。得られたミスマッチコールを、１０塩基より長いホモポリマー内のバリアントコール、または１０塩基もしくはそれを超える長さを有するホモポリマーに隣接する１０塩基以内のバリアントコールを捨てることにより、フィルター処理した。

ミスマッチコールを、ｇｅｎｏｍｅ－ｉｎ－ｔｈｅｂｏｔｔｌｅ（ＧＩＡＢ）プロジェクトによって同じＮＡ１２８７８について生成されたコールと比較して、ミスマッチのクラスごとに精度＃ＴＰ／（＃ＦＰ＋＃ＦＮ＋＃ＴＰ）を決定した。シークエンシングデータを、示した平均ゲノム深度にランダムにダウンサンプリングした。サイクルシフトを誘導するミスマッチ、およびサイクルシフトを誘導する可能性のあるミスマッチは、表４で実証されるように、サイクルシフトを誘導しないミスマッチよりも高い精度を有した。

Claims

試験試料中の短い遺伝子バリアントを検出するための方法であって、
（ａ）短い標的遺伝子バリアントを選択するステップであって、前記短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、前記標的シークエンシングデータセットおよび前記参照シークエンシングデータセットが複数のフロー位置を含むフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して前記標的配列をシークエンシングすることにより得られた場合、２カ所より多くのフロー位置において異なり、前記フロー位置が、前記ヌクレオチドフローに対応する、ステップ；
（ｂ）１つまたは複数の試験シークエンシングデータセットを得るステップであって、各試験シークエンシングデータセットが、試験核酸分子に関連し、各試験核酸分子が、前記短い標的遺伝子バリアントに関連する遺伝子座に少なくとも部分的に重なり、かつ前記試験試料に由来し、前記１つまたは複数の試験シークエンシングデータセットが、前記フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用してそれぞれの試験核酸分子をシークエンシングすることにより決定され、各試験シークエンシングデータセットが、前記複数のフロー位置におけるフローシグナルを含む、ステップ；
（ｃ）試験シークエンシングデータセットに関連する試験核酸分子の各々について、前記核酸分子に関連する前記試験シークエンシングデータセットが前記標的配列にマッチする尤度を示すマッチスコア、または前記核酸分子に関連する前記試験シークエンシングデータセットが前記参照配列にマッチする尤度を示すマッチスコアを決定するステップ；および
（ｄ）１つまたは複数の決定されたマッチスコアを使用して、前記試験試料中の前記短い標的遺伝子バリアントの存在または非存在をコールするステップ
を含む方法。
前記得るステップが、前記フローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して前記試験核酸分子をシークエンシングすることを含む、請求項１に記載の方法。
前記短い標的遺伝子バリアントが、前記試験試料中の前記短い標的遺伝子バリアントの存在または非存在をコールするステップの前に事前選択される、請求項１または請求項２に記載の方法。
前記短い標的遺伝子バリアントが、前記試験試料中の前記短い標的遺伝子バリアントの存在または非存在をコールするステップの後に前記コールの信頼度に基づいて選択される、請求項１または請求項２に記載の方法。
前記試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップを含み、前記バイオマーカーパネルが、前記短い標的遺伝子バリアントを含む、請求項１から４のいずれか一項に記載の方法。
前記フローサイクル順序を選択するステップを含む、請求項１から５のいずれか一項に記載の方法。
前記標的シークエンシングデータセットおよび前記参照シークエンシングデータセットが、前記標的配列および前記参照配列をｉｎｓｉｌｉｃｏでシークエンシングすることにより得られる、請求項１から６のいずれか一項に記載の方法。
前記標的シークエンシングデータセットと前記参照シークエンシングデータとが、２カ所より多くの非連続のフロー位置において異なる、請求項１から７のいずれか一項に記載の方法。
前記標的シークエンシングデータセットと前記参照シークエンシングデータとが、２カ所より多くの連続するフロー位置において異なる、請求項１から８のいずれか一項に記載の方法。
前記標的配列と前記参照配列とが、Ｘカ所の塩基位置において異なり、前記標的シークエンシングデータセットと前記参照シークエンシングデータとが、（Ｘ＋２）カ所またはそれより多くの連続するフロー位置において異なる、請求項１から９のいずれか一項に記載の方法。
前記標的シークエンシングデータセットと前記参照シークエンシングデータセットとが、１または複数のフローサイクルにわたって異なる、請求項１から１０のいずれか一項に記載の方法。
前記フローシグナルが、各フロー位置におけるシークエンシングされた前記試験核酸分子の塩基の数を示す塩基カウントを含む、請求項１から１１のいずれか一項に記載の方法。
前記フローシグナルが、各フロー位置における少なくとも１塩基カウントの尤度を示す統計パラメーターを含み、前記塩基カウントが、前記フロー位置におけるシークエンシングされた前記試験核酸分子の塩基の数を示す、請求項１から１２のいずれか一項に記載の方法。
前記フローシグナルが、各フロー位置における複数の塩基カウントの尤度を示す統計パラメーターを含み、各塩基カウントが、前記フロー位置におけるシークエンシングされた前記試験核酸分子の塩基の数を示す、請求項１から１３のいずれか一項に記載の方法。
ステップ（ｃ）が、
前記試験シークエンシングデータセット内の各フロー位置における統計パラメーターであって、そのフロー位置における前記標的配列の塩基カウントに対応する統計パラメーターを選択すること、および前記試験シークエンシングデータセットが前記標的配列にマッチする尤度を示す前記マッチスコアを決定すること；または
前記試験シークエンシングデータセット中の各フロー位置における統計パラメーターであって、そのフロー位置における前記参照配列の塩基カウントに対応する統計パラメーターを選択すること、および前記試験シークエンシングデータセットが前記参照配列にマッチする尤度を示す前記マッチスコアを決定すること
を含む、請求項１４に記載の方法。
ステップ（ｃ）で決定される前記マッチスコアが、前記試験シークエンシングデータセット内の前記フロー位置にわたっての選択された統計パラメーターの組み合わされた値である、請求項１５に記載の方法。
ステップ（ｃ）が、前記試験シークエンシングデータセットが前記標的配列にマッチする尤度を示す前記マッチスコアを決定することを含む、請求項１から１６のいずれか一項に記載の方法。
ステップ（ｃ）が、前記試験シークエンシングデータセットが前記参照配列にマッチする尤度を示す前記マッチスコアを決定することを含む、請求項１から１７のいずれか一項に記載の方法。
前記１つまたは複数の試験シークエンシングデータセットが、複数の試験シークエンシングデータセットを含む、請求項１から１８のいずれか一項に記載の方法。
前記短い標的遺伝子バリアントの存在または非存在が、前記１つまたは複数の試験シークエンシングデータセットの各々について別々にコールされる、請求項１９に記載の方法。
前記複数の試験シークエンシングデータセットの少なくとも一部分が、異なる試験シークエンシング開始位置を有する異なる試験核酸分子に関連する、請求項１９または２０に記載の方法。
前記フローサイクル順序が、同じ順序で反復される４つの別々のフローを含む、請求項１から２１のいずれか一項に記載の方法。
前記フローサイクル順序が、５つまたはそれより多くの別々のフローを含む、請求項１から２２のいずれか一項に記載の方法。
１または複数台のプロセッサーを使用して前記短い標的遺伝子バリアントを選択するステップ；
前記１つまたは複数の試験シークエンシングデータセットを前記１または複数台のプロセッサーで受信することにより、前記１つまたは複数の試験シークエンシングデータセットを得るステップ；
前記１または複数台のプロセッサーを使用して前記１つまたは複数のマッチスコアを決定するステップ；および
前記１または複数台のプロセッサーを使用して前記試験試料中の前記短い標的遺伝子バリアントの存在または非存在をコールするステップ
を含むコンピュータ実装方法である、請求項１から２３のいずれか一項に記載の方法。
試験試料中の短い遺伝子バリアントを検出するための方法であって、
（ａ）１つまたは複数の第１の試験シークエンシングデータセットを得るステップであって、各第１の試験シークエンシングデータセットが、前記試験試料に由来する異なる試験核酸分子に関連し、前記第１の試験シークエンシングデータセットが、第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、前記１つまたは複数の第１の試験シークエンシングデータセットが、前記ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；
（ｂ）１つまたは複数の第２の試験シークエンシングデータセットを得るステップであって、各第２の試験シークエンシングデータセットが、第１の試験シークエンシングデータセットと同じ試験核酸分子に関連し、前記第２の試験シークエンシングデータセットが、第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して前記１つまたは複数の試験核酸分子をシークエンシングすることにより決定され、前記第１のフローサイクル順序と前記第２のフローサイクル順序が異なり、前記試験シークエンシングデータセットが、前記ヌクレオチドフローに対応するフロー位置におけるフローシグナルを含む、ステップ；
（ｃ）第１のシークエンシングデータセットおよび第２のシークエンシングデータセットの各々について、１つまたは複数の候補配列とのマッチスコアを決定するステップであって、前記マッチスコアが、前記第１の試験シークエンシングデータセット、前記第２の試験シークエンシングデータセット、または両方が前記１つまたは複数の候補配列からの候補配列にマッチする尤度を示す、ステップ；および
（ｄ）決定されたマッチスコアを使用して、前記試験試料中の短い遺伝子バリアントの存在または非存在をコールするステップ
を含む方法。
前記第１のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して前記試験核酸分子をシークエンシングするステップ、および前記第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して前記試験核酸分子をシークエンシングするステップを含む、請求項２５に記載の方法。
前記マッチスコアが、前記第１の試験シークエンシングデータセットが前記候補配列にマッチする尤度、または前記第２の試験シークエンシングデータセットが前記候補配列にマッチする尤度を示す、請求項２５または２６に記載の方法。
前記マッチスコアが、前記第１の試験シークエンシングデータセットと前記第２のシークエンシングデータセット両方が前記候補配列にマッチする尤度を示す、請求項２５または２６に記載の方法。
前記１つまたは複数の候補配列が、２つまたはそれより多くの異なる候補配列を含み、前記方法が、第１のシークエンシングデータセットおよび第２のシークエンシングデータセットに関連する核酸分子の各々について：
前記２つまたはそれより多くの異なる候補配列から候補配列を選択するステップであって、選択候補配列が、前記第１の試験シークエンシングデータセット、前記第２の試験シークエンシングデータセット、または両方との最高尤度マッチを有する、ステップ；および
前記選択候補配列を使用して、前記試験試料中の前記短い遺伝子バリアントの存在または非存在をコールするステップ
を含む、請求項２５から２８のいずれか一項に記載の方法。
前記２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、前記選択候補配列とが、前記第１のフローサイクル順序または前記第２のフローサイクル順序によれば、２カ所またはそれより多くのフロー位置において異なる、請求項２９に記載の方法。
前記２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、前記選択候補配列とが、前記第１のフローサイクル順序または前記第２のフローサイクル順序によれば、２カ所またはそれより多くの非連続のフロー位置において異なる、請求項２９に記載の方法。
前記２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、前記選択候補配列が、前記第１のフローサイクル順序または前記第２のフローサイクル順序によれば、３カ所またはそれより多くのフロー位置において異なる、請求項２９に記載の方法。
前記２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、前記選択候補配列とが、Ｘカ所の塩基位置において異なり、前記試験核酸分子に関連する試験シークエンシングデータセットと、２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列とが、前記第１のフローサイクル順序または前記第２のフローサイクル順序によれば、（Ｘ＋２）カ所またはそれより多くのフロー位置において異なる、請求項２９に記載の方法。
前記２つまたはそれより多くの異なる候補配列からの少なくとも１つの非選択候補配列と、前記選択候補配列とが、前記第１のフローサイクル順序または前記第２のフローサイクル順序によれば、１または複数のフローサイクルにわたって異なる、請求項２９に記載の方法。
前記フローシグナルが、各フロー位置におけるシークエンシングされた前記試験核酸分子の塩基の数を示す塩基カウントを含む、請求項２２から３４のいずれか一項に記載の方法。
前記フローシグナルが、各フロー位置における少なくとも１塩基カウントの尤度を示す統計パラメーターを含み、前記塩基カウントが、前記フロー位置におけるシークエンシングされた前記試験核酸分子の塩基の数を示す、請求項２５から３５のいずれか一項に記載の方法。
前記フローシグナルが、各フロー位置における複数の塩基カウントの尤度を示す統計パラメーターを含み、各塩基カウントが、前記フロー位置におけるシークエンシングされた前記試験核酸分子の塩基の数を示す、請求項２５から３６のいずれか一項に記載の方法。
前記マッチスコアを決定するステップが、前記第１の試験シークエンシングデータセットおよび前記第２の試験シークエンシングデータセットにおける各フロー位置における統計パラメーターであって、前記候補配列のそのフロー位置における塩基カウントに対応する統計パラメーターを、前記１つまたは複数の異なる候補配列の各々について選択することを含む、請求項３７に記載の方法。
前記１つまたは複数の異なる候補配列について、各フロー位置における前記候補配列の塩基カウントを含む候補シークエンシングデータセットを生成するステップを含む、請求項３７に記載の方法。
前記候補シークエンシングデータセットが、ｉｎｓｉｌｉｃｏで生成される、請求項３９に記載の方法。
前記マッチスコアが、前記第１の試験シークエンシングデータセットおよび前記第２の試験シークエンシングデータセットにおけるフロー位置にわたって選択された統計パラメーターの組み合わされた値である、請求項３７から４０のいずれか一項に記載の方法。
前記試験核酸分子の少なくとも一部分が、異なるシークエンシング開始位置を有する、請求項２５から４１のいずれか一項に記載の方法。
短い標的遺伝子バリアントを選択するステップであって、前記短い標的遺伝子バリアントを含む標的配列に関連する標的シークエンシングデータセットと、参照配列に関連する参照シークエンシングデータセットとが、前記標的シークエンシングデータセットおよび前記参照シークエンシングデータセットが、前記第１のフローサイクル順序または前記第２のフローサイクル順序に従って別々のヌクレオチドフローで提供される非終結ヌクレオチドを使用して前記標的配列をシークエンシングすることにより得られた場合、２カ所またはそれより多くのフロー位置において異なり、前記第１のフローサイクル順序と前記第２のフローサイクル順序とが異なり、前記フロー位置が前記ヌクレオチドフローに対応する、ステップ
を含み、
前記１つまたは複数の候補配列が、前記標的配列および前記参照配列を含む、
請求項２５から４２のいずれか一項に記載の方法。
前記短い標的遺伝子バリアントが、前記試験試料中の前記短い標的遺伝子バリアントの存在または非存在をコールするステップの前に事前選択される、請求項４３に記載の方法。
前記短い標的遺伝子バリアントが、前記試験試料中の前記短い標的遺伝子バリアントの存在または非存在をコールするステップの後に前記コールの信頼度に基づいて選択される、請求項４３に記載の方法。
前記試験試料に関連する対象についての個別化バイオマーカーパネルを生成するステップを含み、前記バイオマーカーパネルが、前記試験試料中に存在する前記短い標的遺伝子バリアントを含む、請求項４３から４５に記載の方法。
前記参照シークエンシングデータセットが、前記第１のフローサイクル順序または前記第２のフローサイクル順序に従って別々のフローで提供される非終結ヌクレオチドを使用して前記参照配列がシークエンシングされた場合の予想参照シークエンシングデータセットを決定することにより得られる、請求項４３から４６のいずれか一項に記載の方法。
前記標的配列と前記参照配列とが、前記第１のフローサイクル順序および前記第２のフローサイクル順序の両方によれば、２カ所またはそれより多くのフロー位置において異なる、請求項４３から４６のいずれか一項に記載の方法。
前記標的配列と前記参照配列とが、前記第１のフローのフローサイクル順序によれば、２カ所またはそれより多くの非連続のフロー位置において異なる、請求項４３から４６のいずれか一項に記載の方法。
前記標的配列と前記参照配列とが、前記第１のフローサイクル順序または前記第２のフローサイクル順序によれば、３カ所またはそれより多くのフロー位置において異なる、請求項４３から４６のいずれか一項に記載の方法。
前記標的配列と、前記参照配列とが、前記第１のフローサイクル順序または前記第２のフローサイクル順序によれば、１または複数のフローサイクルにわたって異なる、請求項４３から４６のいずれか一項に記載の方法。
前記第１のフローサイクル順序または前記第２のフローサイクル順序が、同じ順序で反復される４つの別々のフローを含む、請求項４３から５１のいずれか一項に記載の方法。
前記第１のフローサイクル順序または前記第２のフローサイクル順序が、同じ順序で反復される５つまたはそれより多くの別々のフローを含む、請求項４３から５１のいずれか一項に記載の方法。
前記試験核酸分子をシークエンシングするステップであって、前記第１のフローサイクル順序に従って別々のヌクレオチドフローで非終結ヌクレオチドを提供することと、シークエンシングプライマーを伸長することと、各ヌクレオチドフローの後に前記シークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して前記第１の試験シークエンシングデータセットを生成することとを含むステップ；
伸長されたシークエンシングプライマーを除去するステップ；および
同じ試験核酸分子をシークエンシングするステップであって、前記第２のフローサイクル順序に従って別々のヌクレオチドフローで非終結ヌクレオチドを提供することと、シークエンシングプライマーを伸長することと、各ヌクレオチドフローの後に前記シークエンシングプライマーへのヌクレオチド取り込みの存在または非存在を検出して前記第２の試験シークエンシングデータセットを生成することとを含むステップ
を含む、請求項２５から５３のいずれか一項に記載の方法。
前記１つまたは複数の第１のシークエンシングデータセットを１または複数台のプロセッサーで受信するステップ；
前記１つまたは複数の第１のシークエンシングデータセットを前記１または複数台のプロセッサーで受信するステップ；
前記１または複数台のプロセッサーを使用して前記マッチスコアを決定するステップ；および
前記１または複数台のプロセッサーを使用して前記試験試料中の前記短い標的遺伝子バリアントの存在または非存在をコールするステップ
を含むコンピュータ実装方法である、請求項２５から５４のいずれか一項に記載の方法。
前記別々のフローが、単一の塩基タイプを含む、請求項１から５５のいずれか一項に記載の方法またはシステム。
前記別々のフローのうちの少なくとも１つが、２つまたは３つの異なる塩基タイプを含む、請求項１から５６のいずれか一項に記載の方法またはシステム。
前記試験試料中の前記短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示すバリアントコールファイルを生成またはアップデートするステップを含む、請求項１から５７のいずれか一項に記載の方法またはシステム。
前記試験試料中の前記短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示すレポートを生成するステップを含む、請求項１から５８のいずれか一項に記載の方法またはシステム。
前記レポートが、前記試験試料中の前記短い遺伝子バリアントの存在、アイデンティティーまたは非存在を示す、テキスト出力、確率的出力、数値出力またはグラフィック出力を含む、請求項５９に記載の方法またはシステム。
前記レポートを患者にまたは前記患者の医療担当者に提供するステップを含む、請求項５９または６０に記載の方法またはシステム。
前記短い遺伝子バリアントが、一塩基多型またはインデルを含む、請求項１から６１のいずれか一項に記載の方法またはシステム。
核酸分子をシークエンシングする方法であって、
前記核酸分子をプライマーとハイブリダイズして、ハイブリダイズされた鋳型を形成するステップ；
５つまたはそれより多くの別々のヌクレオチドフローを含む反復フローサイクル順序に従って別々のヌクレオチドフローで提供される標識された非終結ヌクレオチドを使用して前記プライマーを伸長するステップ；および
取り込まれた標識ヌクレオチドからのシグナルを検出する、または前記プライマーが前記ヌクレオチドフローにより伸長された場合のシグナルの非存在を検出するステップ
を含む、方法。
前記シグナル、または前記シグナルの非存在を、各ヌクレオチドフロー後に検出するステップを含む、請求項６３に記載の方法。
複数の核酸分子をシークエンシングするステップを含む、請求項６３または６４に記載の方法。
前記複数のうちの前記核酸分子が、ある遺伝子座に対して異なるシークエンシング開始位置を有する、請求項６５に記載の方法。
前記フローサイクル順序が、２カ所より多くのフロー位置において、ランダムシークエンシング開始位置の５％またはそれより多くにおける可能なＳＮＰパーミュテーションの５０％またはそれより多くについてのシグナル変化を誘導する、請求項６３から６６のいずれか一項に記載の方法。
前記フローサイクル順序が、フロー当り０．６のまたはそれを超える塩基取り込みの効率を有する、請求項６３から６７のいずれか一項に記載の方法。
１または複数台のプロセッサーと、
請求項１から６２のいずれか一項に記載の方法を実行するための命令を含む１つまたは複数のプログラムを記憶する非一過性コンピュータ可読媒体と
を含むシステム。