JP6966052B2

JP6966052B2 - 稀な配列変異体を検出するための組成物および方法

Info

Publication number: JP6966052B2
Application number: JP2019508937A
Authority: JP
Inventors: サン，ザオフイ; ウェン，リ; リン，シェンロン
Original assignee: アキュラーゲンホールディングスリミテッド
Priority date: 2016-08-15
Filing date: 2017-08-15
Publication date: 2021-11-10
Anticipated expiration: 2037-08-15
Also published as: US20230357836A1; WO2018035170A1; US20190119743A1; CA3033749A1; US20180057871A1; US10155980B2; JP2022025083A; US11643683B2; EP3497245A1; CN109844133A; JP2019531710A; JP7365382B2; EP3497245A4; SG10202111825YA; US20210355531A1; JP2024012298A; US10724088B2; WO2018035170A8; SG11201901296TA

Description

本出願は、２０１６年８月１５日に出願された米国仮特許第６２／３７５，３９６号の相互参照利益を主張するものであり、当該出願はすべての目的のためそのまま参照することにより本明細書に組み込まれる。

複合体集団内の配列変異の同定は、特に大規模並列核酸配列決定の到来とともに、飛躍的に成長している分野である。しかしながら、大規模並列配列決定は、一般に使用された技術の固有誤差頻度が集団の実際の配列変異の多くの頻度よりも大きいという点で著しく制限されている。例えば、０．１−１％の誤差率が標準のハイスループット配列決定で報告されている。変異体の頻度が誤差率または誤差率以下などと低い場合、稀な配列変異体の検出は無病誤診率が高い。

稀な配列変異体を検出する差し迫った必要性がしばしば存在する。例えば、稀な特性配列の検出は、細菌分類群などの有害な環境の汚染物質の存在を同定かつ識別するために使用可能である。細菌分類群を特徴づける一般的な方法は、ｒＲＮＡ配列などの高度に保存された配列の差を同定することである。しかしながら、これに対する典型的な配列決定に基づくアプローチは、所定のサンプル中の非常に多くの様々なゲノムやメンバー間の相同性の程度に関する難題に直面し、今でも面倒な手順に複雑な問題を提示する。手順の改善により、様々な設定で汚染検出を増強する可能性がある。例えば、人工衛星および他の宇宙船の構成要素を組み立てるために使用される無菌室は、どんな微生物群が存在しているかを理解し、および、他の惑星への地球上の微生物あるいはそのサンプルの導入を防ぐためによりよい汚染除去および清掃の技術を開発し、あるいは地球上の微生物の汚染により生成されたデータと、推定上の地球外微生物によって生成されたデータを識別するための方法を開発するための、本システムおよび方法を用いて調査可能である。食物監視用途としては、食品加工工場での生産ラインの周期的な試験、屠畜場の調査、レストラン、病院、学校、刑務所のキッチンと食品貯蔵領域の検査、およびそれ以外の食品媒介病原体の機関が挙げられる。水保存量や加工工場もモニタリングされることがある。

稀な変異体の検出は病的な突然変異の早期発見にとって重要となりうることもある。例えば、臨床サンプル中の癌に関連する点突然変異の検出は、化学療法中の微小残存病変の同定を改善し、再発患者の腫瘍細胞の外観を発見することができる。稀な点突然変異の検出は、環境変異原への暴露を評価し、内因性のＤＮＡ修復をモニタリングし、かつ年老いた個体の体細胞突然変異の蓄積を研究するためにも重要である。さらに、稀な変異体を検出するための高感度の方法は出生前診断を増強することができ、母体の血液中の胎児の細胞の特徴づけを可能にする。

前述を考慮して、稀な配列変異体を検出する改良された方法のニーズがある。本開示の組成物と方法はこのニーズに対処し、同様に追加の利点をもたらす。とりわけ、本開示の様々な態様は、稀な変異体または低頻度の核酸配列変異体（しばしば突然変異と呼ばれる）の高感度な検出をもたらす。これは、配列決定誤差の背景における低頻度の変異の同定と同様に、正常な配列の背景に低い量の変異体配列を含むことがあるサンプル中の低頻度の核酸変異（置換、挿入、および欠失を含む）の同定および解明を含む。

一態様では、本開示は、ローリングサークル増幅を実施する方法を提供し、該方法は、（ａ）リガーゼ酵素を使用して複数の環状ポリヌクレオチドを形成するために、複数のポリヌクレオチド中の個々のポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドのそれぞれのポリヌクレオチドはライゲーションの前に５’末端と３’末端を有する、工程と、（ｂ）リガーゼ酵素を分解する工程と、（ｃ）増幅されたポリヌクレオチドを生成するために、リガーゼ酵素を分解した後に、環状ポリヌクレオチドを増幅する工程を含み、ポリヌクレオチドが工程（ａ）と（ｃ）との間では精製または単離されない。いくつかの実施形態において、該方法は、工程（ａ）と（ｃ）との間に線状ポリヌクレオチドを分解する工程をさらに含む。いくつかの実施形態において、複数のポリヌクレオチドが一本鎖ポリヌクレオチドを含む。いくつかの実施形態において、個々の環状ポリヌクレオチドは、環状化したポリヌクレオチドのなかで特徴的な接合部を有する。いくつかの実施形態において、環状化する工程は、複数のポリヌクレオチド中のポリヌクレオチドの５’末端、３’末端、あるいは５’末端と３’末端の両方へアダプターポリヌクレオチドを接合する工程を含む。いくつかの実施形態において、増幅する工程は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物にさらす工程を含む。いくつかの実施形態において、増幅する工程は、環状ポリヌクレオチドを、１つ以上のプライマーを含む増幅反応混合物にさらす工程を含み、その各々は配列相補性によって異なる標的配列に特異的にハイブリダイズする。いくつかの実施形態では、サンプルは被験体からのサンプルである。いくつかの実施形態において、サンプルは、尿、便、血液、唾液、組織、あるいは体液である。いくつかの実施形態では、サンプルは腫瘍細胞を含む。いくつかの実施形態では、サンプルは、ホルマリン固定パラフィン包埋サンプルである。いくつかの実施形態において、方法はさらに、コール工程（ｃａｌｌｉｎｇｓｔｅｐ）に基づいて上記被験体を診断し、および、随意に処置する工程を含む。いくつかの実施形態において、配列変異体は原因遺伝子変異体である。いくつかの実施形態において、配列変異体は癌のタイプまたはステージに関連付けられる。いくつかの実施形態において、複数のポリヌクレオチドは無細胞のポリヌクレオチドを含む。いくつかの実施形態において、無細胞のポリヌクレオチドは循環腫瘍ＤＮＡを含む。いくつかの実施形態において、無細胞のポリヌクレオチドは循環腫瘍ＲＮＡを含む。いくつかの実施形態において、方法はさらに、複数の配列決定リードを生成するために、増幅されたポリヌクレオチドを配列決定する工程を含む。いくつかの実施形態において、方法はさらに、配列決定リードと参照配列との間の配列の差異を同定する工程を含む。いくつかの実施形態において、方法はさらに、（ｉ）配列の差異が二本鎖入力分子の両方の鎖の上で同定され、（ｉｉ）配列の差異がローリングサークル増幅によって形成されたコンカテマーのコンセンサス配列で生じ、および／または、（ｉｉｉ）配列の差異が２つの異なる分子で生じるときにのみ、配列の差異を、複数のポリヌクレオチド中の配列変異体とコールする工程を含む。いくつかの実施形態において、配列の差異が５’末端と３’末端との間で形成された異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じるとき、配列の差異は２つの異なる分子で生じるものとして同定される。いくつかの実施形態において、２つの異なる分子に対応するリードが異なる５’末端と異なる３’末端を有するとき、配列の差異は２つの異なる分子で生じるものとして同定される。

他の態様では、本開示は、各々が５’末端と３’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供し、該方法が：（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、ポリヌクレオチドの各々は５’末端と３’末端との間に接合部を有する、工程と、（ｂ）増幅されたポリヌクレオチドを生成するために（ａ）の環状ポリヌクレオチドを増幅する工程と、（ｃ）切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが５’末端および／または３’末端に１つ以上の切断点を含む、工程と、（ｄ）複数の配列決定リードを生成するために切断されたポリヌクレオチドを配列決定する工程と、（ｅ）配列決定リードと参照配列との間の配列の差異を同定する工程と、（ｆ）配列の差異が少なくとも２つの異なる切断されたポリヌクレオチドで生じるとき、配列の差異を配列変異体としてコールする工程とを含む。いくつかの実施形態において、配列の差異を配列変異体としてコールする工程は、（ｉ）配列の差異が異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じ、（ｉｉ）配列の差異が二本鎖入力分子の両方の鎖の上で同定され、および／または（ｉｉｉ）配列の差異がローリングサークル増幅を含む増幅によって形成されたコンカテマーのコンセンサス配列で生じるときをさらに含む。いくつかの実施形態において、複数のポリヌクレオチドは一本鎖ポリヌクレオチドを含む。いくつかの実施形態において、環状化する工程は、複数のポリヌクレオチドをライゲーション反応にさらすことにより達成される。いくつかの実施形態において、配列変異体は一塩基多型である。いくつかの実施形態において、参照配列は、互いに配列決定リードをアラインすることにより形成されたコンセンサス配列である。いくつかの実施形態において、参照配列は配列決定リードである。いくつかの実施形態において、環状化する工程は、複数のポリヌクレオチド中のポリヌクレオチドの５’末端、３’末端、あるいは５’末端と３’末端の両方へアダプターポリヌクレオチドを接合する工程を含む。いくつかの実施形態において、増幅する工程は鎖置換活性を有するポリメラーゼの使用により達成される。いくつかの実施形態において、増幅する工程は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物にさらす工程を含む。いくつかの実施形態において、増幅する工程は、環状ポリヌクレオチドを、１つ以上のプライマーを含む増幅反応混合物にさらす工程を含み、その各々は配列相補性によって異なる標的配列に特異的にハイブリダイズする。いくつかの実施形態において、増幅されたポリヌクレオチドは、富化を伴わない配列決定工程にさらされる。いくつかの実施形態において、方法は、配列決定の前に富化工程を実施することにより、増幅されたポリヌクレオチド中の１つ以上の標的ポリヌクレオチドを富化する工程をさらに含む。いくつかの実施形態において、微生物汚染物質はコール工程に基づいて同定される。いくつかの実施形態では、サンプルは被験体からのサンプルである。いくつかの実施形態において、サンプルは、尿、便、血液、唾液、組織、あるいは体液である。いくつかの実施形態では、サンプルは腫瘍細胞を含む。いくつかの実施形態では、サンプルは、ホルマリン固定パラフィン包埋サンプルである。いくつかの実施形態において、方法はさらに、コール工程（ｃａｌｌｉｎｇｓｔｅｐ）に基づいて上記被験体を診断し、および、随意に処置する工程を含む。いくつかの実施形態において、配列変異体は原因遺伝子変異体である。いくつかの実施形態において、配列変異体は癌のタイプまたはステージに関連付けられる。いくつかの実施形態において、複数のポリヌクレオチドは無細胞のポリヌクレオチドを含む。いくつかの実施形態において、無細胞のポリヌクレオチドは循環腫瘍ＤＮＡを含む。図１４は例示的なワークフローの概略図を提供する。

他の態様では、本開示は、本明細書の方法のいずれかに係る方法を実施するための反応混合物を提供し、反応混合物は、（ａ）複数のコンカテマーであって、複数のコンテカマーの個々のコンカテマーが、５’末端と３’末端を有する個々のポリヌクレオチドを環状化することにより形成された異なる接合部を含む、複数のコンカテマーと、（ｂ）配列Ａ’を含む第１のプライマーであって、第１のプライマーが配列Ａと配列Ａ’との間の配列相補性によって標的配列の配列Ａに特異的にハイブリダイズする、第１のプライマーと、（ｃ）配列Ｂを含む第２のプライマーであって、第２のプライマーが配列Ｂと配列Ｂ’との間の配列相補性によって標的配列の補体を含む相補的なポリヌクレオチド中に存在する配列Ｂ’に特異的にハイブリダイズする、第２のプライマーと、および；（ｄ）増幅されたポリヌクレオチドを生成するために第１のプライマーと第２のプライマーを伸長するポリメラーゼを含み、標的配列の配列Ａの５’末端と配列Ｂの３’末端との間の距離が７５ｎｔ以下である。いくつかの実施形態において、第１のプライマーは配列Ａ’に対して配列Ｃ５’を含み、第２のプライマーは配列Ｂに対して配列Ｄ５’を含み、および、配列Ｃも配列Ｄも増幅反応の第１の増幅工程の間に２つ以上のコンカテマーにハイブリダイズしない。

他の態様では、本開示は、配列変異体を検出するためのシステムを提供し、該システムは、（ａ）サンプル上で検出反応を実施するというユーザーのリクエストを受け取るように構成されたコンピューターと、（ｂ）ユーザーのリクエストに応じてサンプルまたはその一部上で核酸増幅反応を実施する増幅システムであって、増幅反応が（ｉ）リガーゼ酵素を使用して複数の環状ポリヌクレオチドを形成するために、複数のポリヌクレオチド中の個々のポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドのそれぞれのポリヌクレオチドはライゲーションの前に５’末端と３’末端を有する、工程と、（ｉｉ）リガーゼ酵素を分解する工程と、（ｉｉｉ）増幅されたポリヌクレオチドを生成するために、リガーゼ酵素を分解した後に、環状ポリヌクレオチドを増幅する工程であって、ポリヌクレオチドが工程（ｉ）と（ｉｉｉ）との間では精製または単離されない、工程、を含む、増幅システムと、（ｃ）増幅システムによって増幅されたポリヌクレオチドの配列決定リードを生成し、配列決定リードと参照配列との間の配列の差異を同定し、および、様々な接合部を有する少なくとも２つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする配列決定システムと、（ｄ）レシピエントへ報告書を送信する報告書作成装置であって、報告書が配列変異体の検出の結果を含む、報告書作成装置とを備える。いくつかの実施形態において、レシピエントはユーザーである。

他の態様では、本開示は、１つ以上のプロセッサーによる実施時に配列変異体を検出する方法を実施するコードを含むコンピューター可読媒体を提供し、実施される該方法が：（ａ）サンプル上で検出反応を実施するという顧客のリクエストを受け取る工程と、（ｂ）顧客のリクエストに応じてサンプルまたはその一部上で核酸増幅反応を行う工程であって、増幅反応が（ｉ）リガーゼ酵素を使用して複数の環状ポリヌクレオチドを形成するために、複数のポリヌクレオチド中の個々のポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドのそれぞれのポリヌクレオチドがライゲーションの前に５’末端と３’末端を有する、工程と、（ｉｉ）リガーゼ酵素を分解する工程と、（ｉｉｉ）増幅されたポリヌクレオチドを生成するために、リガーゼ酵素を分解した後に、環状ポリヌクレオチドを増幅する工程であって、ポリヌクレオチドが工程（ｉ）と（ｉｉｉ）との間では精製または単離されない、工程、を含む、核酸増幅反応を行う工程と、（ｃ）（ｉ）増幅反応で増幅されたポリヌクレオチドの配列決定リードを生成する工程と、（ｉｉ）配列決定リードと参照配列との間の配列の差異を同定する工程と、（ｉｉｉ）異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする工程を含む、配列決定分析を行う工程と、（ｄ）配列変異体の検出の結果を含む報告書を作成する工程とを含む。

他の態様では、本開示は、各々が５’末端と３’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供し、該方法が：（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、ポリヌクレオチドの各々は５’末端と３’末端との間に接合部を有する、工程と、（ｂ）リガーゼ酵素を分解する工程と、（ｃ）増幅されたポリヌクレオチドを生成するためにランダムプライマーを用いて（ａ）の環状ポリヌクレオチドを増幅する工程と、（ｄ）増幅されたポリヌクレオチドを切断する工程と、（ｅ）複数の配列決定リードを生成するために切断されたポリヌクレオチドを配列決定する工程と、（ｆ）配列決定リードと参照配列との間の配列の差異を同定する工程と、（ｇ）（ｉ）配列の差異が二本鎖入力分子の両方の鎖の上で同定され、（ｉｉ）配列の差異がローリングサークル増幅によって形成されたコンカテマーのコンセンサス配列で生じ、（ｉｉｉ）配列の差異が少なくとも２つの異なる切断されたポリヌクレオチドで生じるときに配列の差異を配列変異体としてコールし、および／または、（ｉｖ）配列の差異が２つの異なる分子で生じるとき、配列の差異を配列変異体としてコールする工程であって、配列の差異が５’末端と３’末端との間で形成された異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じるとき、配列の差異は２つの異なる分子で生じるものとして同定される、工程を含む。

他の態様では、本開示は、各々が５’末端と３’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供し、該方法が：（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、ポリヌクレオチドの各々は５’末端と３’末端との間に接合部を有する、工程と、（ｂ）リガーゼ酵素を分解する工程と、（ｃ）１つ以上のプライマーを用いて（ａ）の環状ポリヌクレオチドを増幅する工程であって、その各々が増幅されたポリヌクレオチドを生成するために、配列相補性によって異なる標的配列に特異的にハイブリダイズする、工程と、（ｄ）増幅されたポリヌクレオチドを切断する工程と、（ｅ）複数の配列決定リードを生成するために切断されたポリヌクレオチドを配列決定する工程と、（ｆ）配列決定リードと参照配列との間の配列の差異を同定する工程と、（ｇ）（ｉ）配列の差異が二本鎖入力分子の両方の鎖の上で同定され、（ｉｉ）配列の差異がローリングサークル増幅によって形成されたコンカテマーのコンセンサス配列で生じ、および／または、（ｉｉｉ）配列の差異が２つの異なる分子で生じるときに、配列の差異を配列変異体としてコールする工程と、配列の差異が５’末端と３’末端との間で形成された異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じるとき、配列の差異は２つの異なる分子で生じるものとして同定される、工程を含む。

一態様では、本開示は、各々が５’末端と３’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供し、該方法は、（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドの所定の環状ポリヌクレオチドは環状化に起因する接合配列を有する、工程と、（ｂ）複数の増幅されたポリヌクレオチドを生成するために（ａ）の環状ポリヌクレオチドを増幅する工程であって、複数のポリヌクレオチドの第１の増幅されたポリヌクレオチドと複数のポリヌクレオチドの第２の増幅されたポリヌクレオチドが、接合配列を含むが、それぞれの５’末端および／または３’末端で異なる配列を含む、工程と、（ｃ）第１の増幅されたポリヌクレオチドと第２の増幅されたポリヌクレオチドに対応する複数の配列決定リードを生成するために複数の増幅されたポリヌクレオチドまたはその増幅産物を配列決定する工程と、（ｄ）配列の差異が第１の増幅されたポリヌクレオチドと第２の増幅されたポリヌクレオチドの両方に対応する配列決定リードで生じるときに、配列決定リードで検出された配列の差異を配列変異体としてコールする工程とを含む。

いくつかの実施形態において、（ａ）における個々のポリヌクレオチドを環状化する工程は、リガーゼ酵素によって達成される。いくつかの実施形態において、（ｂ）の前に、リガーゼ酵素が分解される。いくつかの実施形態において、非環状化ポリヌクレオチドは（ｂ）の前に分解される。いくつかの実施形態において、複数の環状ポリヌクレオチドは（ｂ）の前には精製または単離されない。

いくつかの実施形態において、（ａ）における環状化する工程は、複数のポリヌクレオチド中のポリヌクレオチドの５’末端、３’末端、あるいは５’末端と３’末端の両方へアダプターポリヌクレオチドを接合する工程を含む。

いくつかの実施形態において、（ｂ）における環状ポリヌクレオチドを増幅する工程は、鎖置換活性を有するポリメラーゼによって達成される。いくつかの実施形態において、（ｂ）における環状ポリヌクレオチドを増幅する工程は、ローリングサークル増幅（ＲＣＡ）を含む。いくつかの実施形態において、（ｂ）における増幅する工程は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物にさらす工程を含む。いくつかの実施形態において、個々のランダムプライマーは、互いに異なるそれぞれの５’末端および／または３末端に配列を含む。いくつかの実施形態において、（ｂ）における増幅する工程は、環状ポリヌクレオチドを、標的特異的なプライマーを含む増幅反応混合物にさらす工程を含む。いくつかの実施形態において、増幅する工程は、変性、プライマー結合、およびプライマー伸長の複数のサイクルを含む。

いくつかの実施形態において、増幅されたポリヌクレオチドは、富化のない（ｃ）の配列決定にさらされる。いくつかの実施形態において、方法はさらに、（ｃ）の配列決定の前に、富化工程を実施することによって増幅されたポリヌクレオチドまたはその増幅産物中の１つ以上の標的ポリヌクレオチドを富化する工程を含む。

いくつかの実施形態において、複数のポリヌクレオチドは一本鎖ポリヌクレオチドを含む。いくつかの実施形態において、配列変異体は一塩基多型である。いくつかの実施形態では、サンプルは被験体からのサンプルである。いくつかの実施形態において、サンプルは、尿、便、血液、唾液、組織、あるいは体液を含む。いくつかの実施形態では、サンプルは腫瘍細胞を含む。いくつかの実施形態では、サンプルは、ホルマリン固定パラフィン包埋サンプルを含む。いくつかの実施形態において、複数のポリヌクレオチドは無細胞のポリヌクレオチドを含む。いくつかの実施形態において、無細胞のポリヌクレオチドは無細胞ＤＮＡを含む。いくつかの実施形態において、無細胞のポリヌクレオチドは無細胞ＲＮＡを含む。いくつかの実施形態において、無細胞のポリヌクレオチドは循環腫瘍ＤＮＡを含む。いくつかの実施形態において、無細胞のポリヌクレオチドは循環腫瘍ＲＮＡを含む。

いくつかの実施形態において、（ｄ）では、方法は、配列決定リードで検出された配列の差異が第１の増幅されたポリヌクレオチドからの配列決定リードの少なくとも５０％、および第２の増幅されたポリヌクレオチドからの配列決定リードの少なくとも５０％で生じるとき、配列決定リードで検出された配列の差異を配列変異体としてコールする工程を含む。

一態様では、本開示は、各々が５’末端と３’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供し、該方法は、（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドの所定の環状ポリヌクレオチドは環状化に起因する接合配列を有する、工程と、（ｂ）複数の増幅されたポリヌクレオチドを生成するために（ａ）の環状ポリヌクレオチドを増幅する工程と、（ｃ）切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが５’末端および／または３’末端に１つ以上の切断点を含む、工程と、（ｄ）複数の配列決定リードを生成するために切断されたポリヌクレオチドの増幅産物を配列決定する工程と、（ｅ）配列決定リードで検出された配列の差異が第１の切断されたポリヌクレオチドに対応する配列決定リードと第２の切断されたポリヌクレオチドに対応する配列決定リードで生じるときに、配列決定リードで検出された配列の差異を配列変異体としてコールする工程とを含む。

いくつかの実施形態において、（ｂ）における環状ポリヌクレオチドを増幅する工程は、鎖置換活性を有するポリメラーゼによって達成される。いくつかの実施形態において、（ｂ）における環状ポリヌクレオチドを増幅する工程は、ローリングサークル増幅（ＲＣＡ）を含む。いくつかの実施形態において、（ｂ）における増幅する工程は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物にさらす工程を含む。いくつかの実施形態において、個々のランダムプライマーは、互いに異なるそれぞれの５’末端および／または３末端に配列を含む。いくつかの実施形態において、（ｂ）における増幅する工程は、環状ポリヌクレオチドを、標的特異的なプライマーを含む増幅反応混合物にさらす工程を含む。

いくつかの実施形態において、切断されたポリヌクレオチドの増幅産物は、富化のない配列決定にさらされる。いくつかの実施形態において、方法はさらに、（ｄ）の配列決定の前に、富化工程を実施することによって切断されたポリヌクレオチドの増幅産物中の１つ以上の標的ポリヌクレオチドを富化する工程を含む。いくつかの実施形態において、（ｃ）における切断する工程は増幅されたポリヌクレオチドを超音波処理にさらす工程を含む。いくつかの実施形態において、（ｃ）における切断する工程は増幅されたポリヌクレオチドを酵素切断にさらす工程を含む。

いくつかの実施形態において、（ｅ）では、方法は、配列決定リードで検出された配列の差異が第１の切断されたポリヌクレオチドからの配列決定リードの少なくとも５０％、および第２の切断されたポリヌクレオチドからの配列決定リードの少なくとも５０％で生じるとき、配列決定リードで検出された配列の差異を配列変異体としてコールする工程を含む。引用による組み込み

本明細書で挙げられる全ての刊行物、特許、および特許出願は、あたかも個々の刊行物、特許、または特許出願がそれぞれ参照により本明細書に具体的且つ個別に組み込まれるのと同じ程度にまで、参照により本明細書に組み込まれている。

本発明の新規な特徴はとりわけ添付の請求項で説明される。本発明の特徴および利点のより良い理解は、本発明の原理が用いられる実施形態を説明する以下の詳細な説明と、以下の添付図面とを引用することによって得られるであろう。
本開示に係る方法の１つの実施形態の概略図を描く。ＤＮＡ鎖は環状化され、調査中の遺伝子に対応する標的特異的なプライマーは、ローリングサークル増幅（ＲＣＡ）が鋳型ＤＮＡ（例えば「単量体」）のコンカテマー（例えば「多量体」）を形成するように生じるように、ポリメラーゼ、ｄＮＴＰｓ、緩衝液などとともに追加される。コンカテマーは対応する相補鎖を合成するように処理され、その後、配列決定ライブラリを作るためにアダプターが追加される。この結果として生じるライブラリは、その後、標準的な技術を駆使して配列決定されるが、通常は３つの種：稀な配列変異体（例えば突然変異）を含んでいないｎＤＮＡ（「正常な」ＤＮＡ）；酵素配列決定誤差を含むｎＤＮＡ、および、増幅前のサンプルポリヌクレオチド中に前から存在していた「現実の」または実際の配列変異体の多量体を含むＤＮＡを含んでいる。効果的に稀な突然変異の複数のコピーの存在により、配列変異体の検出と同定が可能となる。図１と同様の戦略であるが、ポリヌクレオチド環状化を促すためにアダプターを追加したものを描く。図２は標的特異的なプライマーの使用も示す。アダプタープライマーが増幅で使用されている点を除けば図２に似ている。Ａ−Ｃは環状化した一本鎖（ｓｓ）ＤＮＡの形成に関連する３つの実施形態を描く。上図では、一本鎖ＤＮＡ（ｓｓＤＮＡ）がアダプターのない状態で環状化されているが、中央の概略図はアダプターの使用を描いており、下図は２つのアダプターオリゴ（各末端で異なる配列をもたらす）を利用しており、２つの末端を接近させるために両方のアダプターにハイブリダイズするスプリントオリゴ（ｓｐｌｉｎｔｏｌｉｇｏ）をさらに含み得る。ライゲーションのために一本鎖ＤＮＡの２つの末端を空間的に近接させるために「分子クランプ（ｍｏｌｅｃｕｌａｒｃｌａｍｐ）」の使用により特定の標的を環状化するための実施形態を描く。ＡおよびＢは、核酸の閉塞末端を使用するアダプターの追加の２つの図を描く。Ａ−Ｃは、ローリングサークル増幅（ＲＣＡ）反応を刺激する３つの様々な方法を描く。Ａは、標的特異的なプライマー（例えば、特定の標的遺伝子または所望の標的配列）の使用を示す。これは通常、増幅されている標的配列のみをもたらす。Ｂは全体のゲノム増幅（ＷＧＡ）を実施するためのランダムプライマーの使用を描いており、これは通常すべてのサンプル配列を増幅し、配列は処理の間に生物情報学的に分類される。Ｃは、アダプターが使用されるときのアダプタープライマーの使用を描いており、一般的な非標的特異的な増幅ももたらす。一実施形態に係る、両方の鎖が増幅されるような、二本鎖ＤＮＡ環状化および増幅の例を描いている。Ａ−Ｄは、後の配列決定のための相補鎖合成を実現するための様々なスキームを描く。Ａは、標的鎖のランダムプライミングの使用とその後のライゲーションを描く。Ｂは、標的鎖のアダプタープライミングの使用とその後のライゲーションを描く。Ｃは「ループ」アダプターの使用を描いており、アダプターは、ループ（例えば、ステムループ構造）を形成するために互いにハイブリダイズするように相補的な配列の２つの部分を有する。コンカテマーの末端へのライゲーションに際して、ループの遊離末端は相補鎖のプライマーとして役立つ。Ｄは、第２の鎖合成を実現するためのハイパーブランチランダムプライマーの使用を示す。標的配列の単量体内でアラインされるときに互いから離れて配向される（「背中合わせ（ｂａｃｋｔｏｂａｃｋ）」とも呼ばれ、例えば、２つの方向であるが、増幅されるドメインの末端上ではないように配向される）１組のプライマーを用いて、標的核酸配列の少なくとも２つのコピーを含む環状のポリヌクレオチドまたは鎖の配列決定を促す実施形態に係るＰＣＲ方法を示す。いくつかの実施形態において、コンカテマーがアンプリコンを標的配列の高次多量体（例えば、二量体、三量体など）にするように形成された後、これらのプライマーセットは使用される。任意に、方法はさらに、二量体よりも小さなアンプリコンを取り除くためにサイズ選別を含むことができる。Ａ−Ｄは、短い産物（単量体など）の増幅があまり好ましくないように、背中合わせ（Ｂ２Ｂ）のプライマーが「タッチアップ（ｔｏｕｃｈｕｐ）」ＰＣＲ工程とともに使用される実施形態を描いている。この場合、プライマーは２つのドメイン；標的配列にハイブリダイズする第１のドメイン（灰色または黒色の矢印）、および、もとの標的配列にハイブリダイズしない「ユニバーサルプライマー」結合ドメイン（曲げられた長方形；しばしばアダプターとも呼ばれる）である第２のドメインを有する。いくつかの実施形態において、ＰＣＲの第１のラウンドは、遺伝子特異的配列が接合するような低温アニーリング工程（Ａ）で行われる。低温での実行により、短い産物を含む様々な長さのＰＣＲ産物がもたらされる（Ｂ）。数回のラウンド後、プライマー全体のハイブリダイゼーションが、両方のドメインで好ましくなるように、アニーリング温度は上げられる（Ｃ）。描かれているように、これらが鋳型の末端で見られるが、内部結合はそれほど安定していない。ゆえに、短い産物は両方のドメインでは低温よりも高温で好ましくなく、あるいは単一ドメインのみでは好ましくない（Ｄ）。ＡとＢは配列決定ライブラリ構造の２つの異なる方法を描く。Ａは、ＩｌｌｕｍｉｎａＲＮｅｘｔｅｒａサンプル調製システムの一例を例証しており、これにより、ＤＮＡを、単一の工程において配列決定アダプターを用いて同時に断片化およびタグ付け可能である。Ｂでは、コンカテマーは超音波処理によって断片化され、その後、（例えば、ＫＡＰＡＢｉｏｓｙｓｔｅｍｓによるキットを使用して）両末端にアダプターを加え、ＰＣＲ増幅を行う。他の方法も利用可能である。Ａ−Ｃは、従来のＰＣＲプライマー設計と比較して、背中合わせ（Ｂ２Ｂ）のプライマー設計の例となる利点の図を提供する。従来のＰＣＲプライマー設計（左）は、突然変異のホットスポットであり得る（黒色の星）標的配列に隣接する領域にプライマー（矢印、ＡとＢ）を置き、それらは典型的には別々の少なくとも６０の塩基対（ｂｐ）であり、約１００ｂｐの典型的なフットプリントをもたらす。この図では、Ｂ２Ｂプライマー設計（右）は標的配列の一方にプライマーを置く。２つのＢ２Ｂプライマーは逆方向を向いており、一部が重複することがある（例えば、約１２ｂｐ以下、約１０ｂｐ以下、約５ｂｐ以下、あるいはそれよりも少ない）。Ｂ２Ｂプライマーの長さによって、この図のフットプリントの合計は２８−５０ｂｐの間であり得る。大きなフットプリントによっては、断片化事象は従来の設計のプライマー結合を破壊する可能性が高く、線形の断片（Ａ）、環状化ＤＮＡ（Ｂ）、あるいは増幅産物（Ｃ）であれ、配列情報の喪失を引き起こす。さらに、Ｃで示されるように、Ｂ２Ｂプライマー設計は、異なるポリヌクレオチドを識別するために使用することができる接合配列（「天然のバーコード」とも呼ばれる）を捕捉する。一実施形態（例えば、環状化したポリヌクレオチドを使用するプロセスの例となる実施）に係る、配列変異体を検出するための鋳型を生成する方法を例証する。ＤＮＡ入力は、ライゲーションによって環状化されたｓｓＤＮＡへ変性され、非環状化ＤＮＡはエキソヌクレアーゼ消化によって分解される。ライゲーション効率は、定量ＰＣＲ（ｑＰＣＲ）によって定量化され、入力ＤＮＡと環状化されたＤＮＡ量を比較し、典型的には少なくとも約８０％のライゲーション効率をもたらす。環状化されたＤＮＡは、緩衝液を交換するために精製され、その後、ランダムプライマーとＰｈｉ２９ポリメラーゼを用いて全ゲノム増幅（ＷＧＡ）が行われる。ＷＧＡ産物は精製され、産物は（例えば、超音波処理によって）約４００ｂｐ以下の短い断片に断片化される。増幅されたＤＮＡのオンターゲット（ｏｎ−ｔａｒｇｅｔ）率は、同じ量の参照ゲノムＤＮＡを増幅されたＤＮＡと比較するｑＰＣＲによって定量化され、典型的には約９５％以上の平均的なオンターゲット率を示す。Ａ−Ｃは、尾部付加（ｔａｉｌｅｄ）Ｂ２Ｂプライマーを用いて、および、高温でＰＣＲの「タッチアップ」第２段階を実施する増幅のさらなる実施を例証している。Ｂ２Ｂプライマーは配列特異的な領域（黒い太字線）およびアダプター配列（開いたボックス）を含む。低温で第１段階アニーリング温度では、標的特異的な配列が鋳型にアニーリングされることで、初期の単量体を生じ、ＰＣＲ産物は縦列反復を含む（Ａ）。高温での第２の増幅段階では、標的特異的なかつアダプターの両方の配列のハイブリダイゼーションは、標的特異的な配列のハイブリダイゼーションのみよりも好ましく、短い産物が優先的に生成される程度を減少させる（Ｂ）。全プライマーを支持することなく、標的特異的な配列を用いる内部アニーリングは迅速に単量体の分画を増やす（Ｃ、左）。変異体として数えられる２つの異なるポリヌクレオチド（例えば、異なる接合部によって同定される）上で配列の差異が生じることを必要として（下部線）、および、必要としないで（上部線）、Ｑ３０フィルタを使用する標的配列決定方法によって検出されたバックグラウンドノイズ（変異体の頻度）間の比較を例証している。ヒトゲノムＤＮＡ（１２８７８、ＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅ）は１００−２００ｂｐに断片化され、既知のＳＮＰ（ＣＹＰ２Ｃ１９）を含有するゲノムＤＮＡ（１９２４０、ＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅ）の２％のスパイクイン（ｓｐｉｋｅ−ｉｎ）を含んでいた。真の変異体シグナル（印の付いたピーク）は、バックグラウンドを著しく上回るものではなかった（上部、薄灰色のプロット）。バックグラウンドノイズはバリデーション・フィルタ（下部、黒のプロット）を適用することにより約０．１まで減少した。ポリヌクレオチドの集団での様々な低頻度（２％、０．２％、および０．０２％）でスパイクした配列変異体の検出を例証しており、それにもかかわらず、これらは本開示の方法を適用すると、バックグラウンドを有意に上回っている。ＡとＢは、本開示の実施形態のライゲーション効率とオンターゲット率の分析の結果を例証する。本開示の実施形態に係る方法において、対立遺伝子頻度の保持およびバイアスの実質的な欠如を例証する。一実施形態にしたがって、小さな入力サンプル中の配列変異体の検出のための結果を例証する。標準的な配列決定方法に従って、配列の差異が２つの異なるポリヌクレオチド上で生じることを必要とせずに得られた配列変異体の検出の結果における高いバックグラウンドの一例を例証する。ゲノムのＧＣ含有量分布と、本開示の一実施形態に係る方法（本明細書に開示される方法；左）に従って生成された配列決定結果のＧＣ含有量分布との間の比較を例証するグラフを提供し、配列決定結果は、代替的な配列決定ライブラリ構築キット（Ｒｕｂｉｃｏｎ、ＲｕｂｉｃｏｎＧｅｎｏｍｉｃｓ；真ん中）と、３２ｎｇに関する文献で一般的に報告されるような無細胞ＤＮＡ（ｃｆＤＮＡ）（右）とを使用する。一実施形態に係る方法の配列決定リードから得られた入力ＤＮＡのサイズ分布を例証するグラフを提供する。一実施形態に係るランダムプライミング方法による複数標的にわたる均一な増幅を例証するグラフを提供する。ＡとＢは、環状化のない状態で、同定可能な接合部を有するポリヌクレオチド多量体の形成に関する実施形態を例証する。ポリヌクレオチド（ポリヌクレオチド断片または無細胞ＤＮＡなど）は接合することで、本開示の実施形態にしたがって独立したポリヌクレオチドを識別する際に役立つ非天然の接合部を有する多量体を形成する（本明細書では「自己タグ（ａｕｔｏ−ｔａｇ）」とも呼ばれる）。Ａでは、ポリヌクレオチドは、平滑末端ライゲーションによって互いに直接接合される。Ｂでは、ポリヌクレオチドは、バーコード配列も含み得る１つ以上の介在性のアダプターオリゴヌクレオチドによって接合される。その後、多量体は、ランダムプライマー（全ゲノム増幅）、アダプタープライマー、または１つ以上の標的特異的なプライマーあるいはプライマー対などによって、様々な方法のいずれかによって増幅にさらされる。図２５のプロセス上での例となる変動を例証する。ポリヌクレオチド（例えば、ｃｆＤＮＡまたは他のポリヌクレオチド断片）は、（例えば、ＫＡＰＡＢｉｏｓｙｓｔｅｍｓのキットなどの標準キットを使用して）末端修復され、Ａ尾部付加（Ａ−ｔａｉｌｅｄ）され、アダプターでライゲートされる。内部ウラシル（Ｕ）で標識された担体ＤＮＡは、全ＤＮＡ入力を所望のレベル（例えば、約２０ｎｇ以上）にまで上げるために補充され得る。検出される配列変異体は「星形」によって示される。ライゲーションが完了すると、担体ＤＮＡは、ウラシルＤＮＡグリコシラーゼ（ＵＤＧ）およびＤＮＡグリコシラーゼリアーゼ末端ヌクレアーゼＶＩＩＩの混合物である、ウラシル特異的除去試薬（Ｕｒａｃｉｌ−ＳｐｅｃｉｆｉｃＥｘｃｉｓｉｏｎＲｅａｇｅｎｔ）（ＵＳＥＲ）酵素の追加によって分解可能である。産物は担体ＤＮＡの断片を除去するために精製される。精製された産物は（例えば、アダプター配列を対象としたプライマーを使用するＰＣＲによって）増幅される。任意の残存する担体ＤＮＡは、分解によって、および少なくとも１つの末端でのアダプターからの分離によって、増幅されない可能性が高い。増幅された産物は短いＤＮＡ断片を除去するために精製可能である。Ａ−Ｅは、図２５のプロセス中の例となる変動を例証する。標的特異的な増幅プライマーは、アダプターとして機能する共通の５’「テール」を含む（灰色の矢印）。初期の増幅（例えばＰＣＲによる）は、少数のサイクル（例えば、少なくとも約５、１０、またはそれ以上のサイクル）続く。ＰＣＲ産物は、同定可能な接合部を有するコンカテマーを生成するために（例えば、アニーリング温度が第２段階で下がるときに）他のＰＣＲ産物にアニーリングされ、プライマーとして同様に役立つことができる。第２段階はサイクル数（例えば、５、１０、１５、または２０以上のサイクル）を含むことができ、コンカテマー形成および増幅に有利な選別または条件の変化を含み得る。この概略に係る方法は「ＲｅｌａｙＡｍｐＳｅｑ」とも呼ばれ、仕切られた設定での特定の使用（例えば、ドロップレットで）で見られ得る。Ａ−Ｅはポリヌクレオチドを環状化するための方法の非限定的な例を例示する。Ａでは、二本鎖ポリヌクレオチド（例えば、ｄｓＤＮＡ）は一本鎖へ変性され、その後、直接的な環状化（例えば、ＣｉｒｃＬｉｇａｓｅによる自己接合ライゲーション）をうける。Ｂでは、ポリヌクレオチド（例えば、ＤＮＡ断片）は末端修復され、Ａ尾部付加される（３’末端に対するアデノシンの一塩基伸長を加える）ことでライゲーション効率を改善し、その後、一本鎖への変性および環状化を行う。Ｃでは、ポリヌクレオチドは末端修復され、Ａ尾部付加され（二本鎖である場合）、チミジン（Ｔ）伸長を有するアダプターに接合され、一本鎖へ変性され、環状化される。Ｄでは、ポリヌクレオチドは末端修復されて、Ａ−尾部付加され（二本鎖である場合）、両方の末端は、３つの要素（ライゲーションのためのＴ伸長、アダプター間の相補性、および３’尾部）を有するアダプターにライゲートされ、鎖は変性され、一本鎖ポリヌクレオチドは環状化される（アダプター配列間の相補性で容易になる）。Ｅでは、二本鎖ポリヌクレオチドは一本鎖形態に変性され、接合を容易にするためにポリヌクレオチドの末端を近づける分子クランプの存在下で環状化される。とりわけ、環状化されたポリヌクレオチドに関して、本開示の方法に係る配列変異体を同定するための増幅システムの例となるワークフロー設計を例証する。とりわけ、環状化工程のない線状ポリヌクレオチド入力に関して、本開示の方法に係る配列変異体を同定するための増幅システムの例となるワークフロー設計を例証する。本開示の方法に係る配列変異体を同定するための例となるワークフローの簡略な図を提供する。「線状ポリヌクレオチド分析」（上部）の分岐に沿って、分析はデジタルＰＣＲ（例えば、デジタルドロップレットＰＣＲ、ｄｄＰＣＲ）、リアルタイムＰＣＲ、接合配列（自己タグ）の分析を伴うプローブ捕捉（ｃａｐｔｕｒｅｓｅｑ）による富化、挿入されたアダプター配列（バーコードを付けた挿入）に基づく配列決定、またはＲｅｌａｙＡｍｐ配列決定を含み得る。「環状化されたポリヌクレオチド分析」（下部）の分岐に沿って、分析は、デジタルＰＣＲ（例えば、デジタルドロップレットＰＣＲ、ｄｄＰＣＲ）、リアルタイムＰＣＲ、接合配列（天然のバーコード）の分析を伴うプローブ捕捉（ｃａｐｔｕｒｅｓｅｑ）による富化、プローブ捕捉（ｃａｐｔｕｒｅｓｅｑ）または標的とされた増幅（例えば、Ｂ２Ｂ増幅）による富化、および、２つの異なるポリヌクレオチド（例えば、異なる接合部を有するポリヌクレオチド）で生じる違いとして配列変異体を同定するバリデーション工程を伴う配列分析を含み得る。一実施形態に係るシステムの図である。一例にかかる標的領域に沿った捕捉および適用範囲の効率を例証する。標的とする塩基の＞９０％が２０ｘ以上でカバーされ、標的とされた塩基の＞５０％が＞５０ｘの適用範囲を有する。ＡとＢは例示的な単一反応アッセイワークフローを例証する。接合部情報を使用する配列変異コールを例証する。本発明の様々な実施形態の工程を例証する。本発明の様々な実施形態の工程を例証する。本発明の様々な実施形態の工程を例証する。本発明の様々な実施形態の工程を例証する。本発明の様々な実施形態の工程を例証する。本発明の様々な実施形態の工程を例証する。本発明の様々な実施形態の工程を例証する。本発明の様々な実施形態の工程を例証する。標的ポリヌクレオチドが一本鎖ポリヌクレオチドを含む実施形態を例証する。標的ポリヌクレオチドが一本鎖ポリヌクレオチドを含む実施形態を例証する。本明細書に記載された様々なワークフローのライブラリの複雑度を示す。同じ起原から増幅されたリードに一意的にインデックスを付けるために、コンカテマー切断点と接合配列が使用される例示的な概略図を例証する。同じ起原から増幅されたリードに一意的にインデックスを付けるために、増幅中のランダムプライミングに由来するコンカテマー’５および３’の配列と接合配列が用いられる例示的な概略図を例証する。リードファミリーを生成するために、接合配列および増幅されたポリヌクレオチドの５’／３’末端が用いられる、例示的な概略図を例証する。図４１Ａでは、グループは、グループ中のすべてのリードがコンカテマー確認によって変異体（「ｘ」）を示すことから、「変異体」として数えられる。リードファミリーを生成するために、接合配列および増幅されたポリヌクレオチドの５’／３’末端が用いられる、例示的な概略図を例証する。図４１Ｂでは、変異体が拒絶され、リードファミリーのコンセンサスは、ファミリー内のリードの大部分が変異体（「ｘ」）を示さないため、野生型として分類される。リードファミリーを生成するために、接合配列および増幅されたポリヌクレオチドの５’／３’末端が用いられる、例示的な概略図を例証する。図４１Ｃでは、同じ配列の差異（「ｘ」）が少なくとも２つの異なるリードファミリーで検出されるときに、変異体が呼ばれる。少なくとも２つの異なるリードファミリーで検出されない配列の差異（円）は、変異体とは呼ばれない。

本明細書で開示されるいくつかの実施形態の実施は、特段の定めのない限り、当業者の考え得る範囲内にある、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組み換えＤＮＡの従来技術を利用する。例えば、ＳａｍｂｒｏｏｋａｎｄＧｒｅｅｎ，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，４ｔｈＥｄｉｔｉｏｎ（２０１２）；ｔｈｅｓｅｒｉｅｓＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（Ｆ．Ｍ．Ａｕｓｕｂｅｌ，ｅｔａｌ．ｅｄｓ．）；ｔｈｅｓｅｒｉｅｓＭｅｔｈｏｄｓＩｎＥｎｚｙｍｏｌｏｇｙ（ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃ．），ＰＣＲ２：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（Ｍ．Ｊ．ＭａｃＰｈｅｒｓｏｎ，Ｂ．Ｄ．ＨａｍｅｓａｎｄＧ．Ｒ．Ｔａｙｌｏｒｅｄｓ．（１９９５）），ＨａｒｌｏｗａｎｄＬａｎｅ，ｅｄｓ．（１９８８）Ａｎｔｉｂｏｄｉｅｓ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ａｎｄＣｕｌｔｕｒｅｏｆＡｎｉｍａｌＣｅｌｌｓ：ＡＭａｎｕａｌｏｆＢａｓｉｃＴｅｃｈｎｉｑｕｅａｎｄＳｐｅｃｉａｌｉｚｅｄＡｐｐｌｉｃａｔｉｏｎｓ，６ｔｈＥｄｉｔｉｏｎ（Ｒ．Ｉ．Ｆｒｅｓｈｎｅｙ，ｅｄ．（２０１０））を参照のこと。

用語「約（ａｂｏｕｔ）」または「およそ（ａｐｐｒｏｘｉｍａｔｅｌｙ）」は、当業者によって決定されるような特定の値の許容可能な誤差範囲内であることを意味し、これは、その値がどのように測定または決定されるか、つまり、測定システムの制限に部分的に依存している。例えば、「約」とは、当該技術分野での実践につき１または１を超える標準偏差を意味し得る。代替的に、「約」とは所定の値の最大で２０％、最大で１０％、最大で５％、または最大で１％の範囲内を意味し得る。代替的に、とりわけ生体系または生物学的プロセスに関して、この用語は１桁以内、好ましくはある値の５倍、より好ましくは２倍以内を意味することがある。特定の値が本出願と請求項に記載されている場合、特段の定めのない限り、特定の値の許容可能な誤差範囲内を意味する「約」との用語が仮定されなければならない。

用語「ポリヌクレオチド」、「ヌクレオチド」、「ヌクレオチド配列」、「核酸」、および「オリゴヌクレオチド」は、交換可能に使用される。これらは、あらゆる長さのヌクレオチドの高分子形態、デオキシリボヌクレオチドまたはリボヌクレオチドのいずれか、あるいはそれらのアナログを指す。ポリヌクレオチドは任意の三次元構造を有し得、任意の未知または既知の機能を行い得る。下記はポリヌクレオチドの限定しない実施例である：遺伝子または遺伝子断片のコード領域またはノンコーディング領域、連鎖解析から定義された遺伝子座、エクソン、イントロン、メッセンジャーＲＮＡ（ｍＲＮＡ）、転移ＲＮＡ（ｔＲＮＡ）、リボソームＲＮＡ（ｒＲＮＡ）、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、ショートヘアピンＲＮＡ（ｓｈＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、リボザイム、ｃＤＮＡ、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、あらゆる配列の単離されたＤＮＡ、あらゆる配列の単離されたＲＮＡ、核酸プローブ、およびプライマー。ポリヌクレオチドは、メチル化されたヌクレオチドおよびヌクレオチドアナログなどの１つ以上の修飾されたヌクレオチドを含むこともある。存在するとき、ヌクレオチド構造に対する修飾は、ポリマーのアセンブリーの前または後で与えられ得る。ヌクレオチドの配列は、非ヌクレオチド構成要素によって阻止され得る。ポリヌクレオチドは、標識化構成要素との抱合によってなど、重合の後にさらに修飾され得る。

概して、用語「標的ポリヌクレオチド」とは、その存在、量、および／またはヌクレオチド配列、あるいはこれらの１つ以上の変化が決定されるのが望ましい標的配列を有する核酸分子の開始集団中の核酸分子またはポリヌクレオチドを指す。概して、用語「標的配列」とは、核酸の一本鎖上の核酸配列を指す。標的配列は、遺伝子、制御配列、ゲノムＤＮＡ、ｃＤＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ｒＲＮＡ、またはそれ以外のものを含むＲＮＡの一部であってもよい。標的配列は、サンプルからの標的配列、または、増幅反応の産物などの第２の標的であってもよい。

「ハイブリダイゼーション」は、１つ以上のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合によって安定する複合体を形成する反応を指す。水素結合は、ワトソン−クリック型塩基対、Ｈｏｏｇｓｔｅｉｎ結合、あるいは塩基の相補性に従って他の配列に特異的な方法で生じ得る。複合体は、二重構造を形成する２つの鎖、複数鎖の複合体を形成する３つ以上の鎖、１つの自己ハイブリダイズ鎖、またはこれらの任意の組み合わせを含み得る。ハイブリダイゼーション反応は、ＰＣＲの開始、またはエンドヌクレアーゼによるポリヌクレオチドの酵素的切断などの大規模なプロセスにおける工程を構成し得る。第１の配列に相補的な第２の配列は第１の配列の「補体」と呼ばれる。ポリヌクレオチドに適用されるように用語「ハイブリダイズ可能な（ｈｙｂｒｉｄｉｚｅｄ）」とは、ハイブリダイゼーション反応におけるヌクレオチド残基物の塩基間の水素結合によって安定化する複合体を形成するポリヌクレオチドの能力を指す。

「相補性」とは、従来のワトソン−クリックまたは他の非伝統的なタイプのいずれかによって別の核酸配列との水素結合を形成するための核酸の能力を指す。パーセント相補性とは、第２の核酸配列（例えば、１０のうちの５、６、７、８、９、１０がそれぞれ５０％、６０％、７０％、８０％、９０％、また１００％相補的である）と水素結合（例えば、ワトソン−クリック型塩基対）を形成することができる核酸分子中の残基の割合を示す。「完全に相補的な」とは、核酸配列の隣接する残基のすべてが、第２の核酸配列中の同数の隣接する残基と水素接合することを意味する。本明細書で使用されるように「実質的に相補的」とは、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、３５、４０、４５、５０、またはそれ以上のヌクレオチドの領域にわたって少なくとも６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９７％、９８％、９９％、または１００％である相補性の程度を指すか、あるいはストリンジェントな条件下でハイブリダイズする２つの核酸を指す。パーセント相補性を評価する目的などのための配列同一性は、限定されないが、Ｎｅｅｄｌｅｍａｎ−Ｗｕｎｓｃｈアルゴリズム（例えば、ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ／Ｔｏｏｌｓ／ｐｓａ／ｅｍｂｏｓｓ＿ｎｅｅｄｌｅ／ｎｕｃｌｅｏｔｉｄｅ．ｈｔｍｌで入手可能なＥＭＢＯＳＳＮｅｅｄｌｅアライナー、随意にデフォルト設定で）、ＢＬＡＳＴアルゴリズム（例えば、ｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／Ｂｌａｓｔ．ｃｇｉで入手可能なＢＬＡＳＴアラインメントツール、随意にデフォルト設定で）、あるいはＳｍｉｔｈ−Ｗａｔｅｒｍａｎアルゴリズム（例えば、ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ／Ｔｏｏｌｓ／ｐｓａ／ｅｍｂｏｓｓ＿ｗａｔｅｒ／ｎｕｃｌｅｏｔｉｄｅ．ｈｔｍｌで入手可能なＥＭＢＯＳＳＷａｔｅｒアライナー、随意にデフォルト設定で）を含む任意の適切なアラインメントアルゴリズムによって測定されてもよい。最適なアラインメントは、デフォルトパラメータを含む選択されたアルゴリズムの任意の適切なパラメータも使用して評価されてもよい。

概して、ハイブリダイゼーションのための「ストリンジェント条件」とは、標的配列に対して相補性を有する核酸が標的配列に優勢的にハイブリダイズし、非標的配列に実質的にハイブリダイズしない条件を指す。ストリンジェント条件は通常配列依存性であり、多くの因子に依存して変わる。概して、配列が長ければ長いほど、配列がその標的配列に特異的にハイブリダイズする温度はますます高くなる。ストリンジェント条件の非限定的な例は、Ｔｉｊｓｓｅｎ（１９９３），ＬａｂｏｒａｔｏｒｙＴｅｃｈｎｎｉｑｕｅｓＩｎＢｉｏｃｈｅｍｉｓｔｒｙＡｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ−ＨｙｂｒｉｄｉｚａｔｉｏｎＷｉｔｈＮｕｃｌｅｉｃＡｃｉｄＰｒｏｂｅｓＰａｒｔＩ，ＳｅｃｏｎｄＣｈａｐｔｅｒ “Ｏｖｅｒｖｉｅｗｏｆｐｒｉｎｃｉｐｌｅｓｏｆｈｙｂｒｉｄｉｚａｔｉｏｎａｎｄｔｈｅｓｔｒａｔｅｇｙｏｆｎｕｃｌｅｉｃａｃｉｄｐｒｏｂｅａｓｓａｙ”，Ｅｌｓｅｖｉｅｒ，Ｎ．Ｙ．に詳しく記載されている。

一態様では、本開示は、各々が５’末端と３’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供する。場合によっては、上記方法は：（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドの所定の環状ポリヌクレオチドが上記環状化に起因する接合配列を有する、工程と、（ｂ）複数の増幅されたポリヌクレオチドを生成するために（ａ）の環状化されたポリヌクレオチドを増幅する工程と、（ｃ）切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが５’末端および／または３’末端に１つ以上の切断点を含む、工程と、（ｄ）複数の配列決定リードを生成するために切断されたポリヌクレオチドおよび／または増幅産物を配列決定する工程と、（ｅ）配列決定リードで検出された配列の差異が第１の切断されたポリヌクレオチドと第２の切断されたポリヌクレオチドに対応する配列決定リードで生じるときに、配列決定リードで検出された配列の差異を配列変異体としてコールする工程とを含む。

場合によっては、上記方法は、（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、ポリヌクレオチドの各々が５’末端と３’末端との間に接合部を有する、工程と、（ｂ）増幅されたポリヌクレオチドを生成するために（ａ）の環状ポリヌクレオチドを増幅する工程と、（ｃ）切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが５’末端および／または３’末端に１つ以上の切断点を含む、工程と、（ｄ）複数の配列決定リードを生成するために切断されたポリヌクレオチドを配列決定する工程と、（ｅ）配列決定リードと参照配列との間の配列決定差を同定する工程と、（ｆ）配列の差異が少なくとも２つの異なる切断されたポリヌクレオチドで生じるとき、配列の差異を配列変異体としてコールする工程とを含む。

概して、環状ポリヌクレオチドを形成するために（直接的に、または、１つ以上の中間アダプターオリゴヌクレオチドを用いて）ポリヌクレオチドの末端を互いに接合することにより、接合配列を有する接合部が生成される。ポリヌクレオチドの５’末端および３’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター（例えば５’末端接合部または３’末端接合部の１つ）との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの５’末端と３’末端との間の接合部を指すことがある。ポリヌクレオチドの５’末端と３’末端が介在性のアダプター（例えば、一本鎖ＤＮＡの５’末端と３’末端）なしで接合される場合、用語「接合部」とはこれらの２つの末端が接合される点を指す。接合部は接合部を含むヌクレオチドの配列（「接合配列」とも呼ばれる）によって同定されることがある。

いくつかの実施形態において、サンプルは、天然の分解プロセス（細胞溶解、細胞死、および、例えば、無細胞のポリヌクレオチド、例えば、無細胞ＤＮＡおよび無細胞のＲＮＡなどのＤＮＡやＲＮＡなどのポリヌクレオチドが細胞からその周辺環境（そこでさらに分解されることもある）に放出される他のプロセス）、サンプル処理（固定、染色、および／または保管手順）の副産物である断片化、ならびに、ＤＮＡを制限なく特定の標的配列に切断する方法による断片化（例えば、超音波処理などによる機械的な断片化；ＤＮａｓｅＩ、フラグメンターゼ（ｆｒａｇｍｅｎｔａｓｅ）などの非配列特異的なヌクレアーゼ処置）によって形成された末端の混合物を有するポリヌクレオチドを含む。サンプルが末端の混合物を有するポリヌクレオチドを含む場合、同じ５’末端または３’を有する２つのポリヌクレオチドの可能性は低く、２つのポリヌクレオチドが同じ５’末端と３’末端の両方を独立して有している可能性はもっと低い。これに応じて、いくつかの実施形態では、接合部は異なるポリヌクレオチドを識別するために使用されてもよく、この場合、２つのポリヌクレオチドは同じ標的配列を有する部分を含むことさえある。ポリヌクレオチド末端が介在性のアダプターなしで接合される場合、接合配列は参照配列へのアラインメントによって同定されることがある。例えば、２つの成分配列の順序が参照配列と逆であるように見える場合、その逆転が生じているように見える点はその点での接合部を示唆するものであり得る。ポリヌクレオチド末端が１つ以上のアダプター配列によって接合される場合、接合部は既知のアダプター配列への近接によって、あるいは、配列決定リードが環状化したポリヌクレオチドの５’末端と３’末端の両方の配列を得るのに十分な長さである場合には上のようなアラインメントによって同定されてもよい。いくつかの実施形態において、特定の接合部の形成は、それがサンプルの環状化したポリヌクレオチドの中で特有なものとなるような十分に稀な事象である。

いくつかの実施形態において、（ａ）において個々のポリヌクレオチドを環状化する工程は、複数のポリヌクレオチドをライゲーション反応へ晒すことによって達成される。ライゲーション反応はリガーゼ酵素を含んでもよい。いくつかの実施形態において、リガーゼ酵素は（ｂ）における増幅の前に分解される。（ｂ）における増幅の前のリガーゼの分解は、増幅可能なポリヌクレオチドの回収率を増大させることができる。いくつかの実施形態において、複数の環状化したポリヌクレオチドは（ｂ）の前には精製または単離されない。いくつかの実施形態において、非環状化線状ポリヌクレオチドは増幅前に分解される。

場合によっては、（ａ）における環状化する工程は、複数のポリヌクレオチド中のポリヌクレオチドの５’末端、３’末端、あるいは５’末端と３’末端の両方へアダプターポリヌクレオチドを接合する工程を含む。ポリヌクレオチドの５’末端および３’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター（例えば５’末端接合部または３’末端接合部の１つ）との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの５’末端と３’末端との間の接合部を指すことがある。

環状化したポリヌクレオチドは、例えば、リガーゼ酵素の分解後に増幅されることで、増幅されたポリヌクレオチドをもたらすことができる。（ｂ）における環状ポリヌクレオチドを増幅する工程は、鎖置換活性を有するポリメラーゼによって達成可能である。場合によっては、ポリメラーゼはＰｈｉ２９ＤＮＡポリメラーゼである。場合によっては、増幅はローリングサークル増幅（ＲＣＡ）を含む。ＲＣＡ由来の増幅されたポリヌクレオチドは、線状コンカテマー、あるいは鋳型ポリヌクレオチドからの標的配列（例えばサブユニット配列）の２つ以上のコピーを含むポリヌクレオチドを含むことができる。いくつかの実施形態において、増幅する工程は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物にさらす工程を含む。場合によっては、増幅する工程は、環状ポリヌクレオチドを１つ以上のプライマーを含む増幅反応混合物にさらす工程を含み、１つ以上のプライマーの各々は配列相補性によって異なる標的配列に特異的にハイブリダイズする。

増幅されたポリヌクレオチドは、場合によっては、切断されることで、未切断のポリヌクレオチドに対する長さが短い切断されたポリヌクレオチドを生成する。同じ線状コンカテマーから始まる２つ以上の切断されたポリヌクレオチドは、同じ接合配列を有することもあるが、異なる５’末端および／または３’末端を有することができる（例えば、末端を切断する）。

増幅されたポリヌクレオチドは、限定されないが、物理的な断片化、酵素法、および化学的な断片化などの任意の様々な方法を用いて切断可能である。増幅されたポリヌクレオチドの断片化に使用することができる物理的な断片化方法の非限定的な例は、音響切断（ａｃｏｕｓｔｉｃｓｈｅａｒｉｎｇ）、超音波処理、および流体力学的切断（ｈｙｄｒｏｄｙｎａｍｉｃｓｈｅａｒｉｎｇ）を含む。場合によっては、音響切断と超音波処理が好ましいこともある。増幅されたポリヌクレオチドの断片化に使用することができる酵素の断片化方法の非限定的な例は、ＤＮａｓｅＩ、および非特異的ヌクレアーゼやトランスポゼースを含む他の制限エンドヌクレアーゼなどの酵素の使用を含む。増幅されたポリヌクレオチドの断片化に使用することができる化学的な断片化方法の非限定的な例は、熱と二価金属のカチオンの使用を含む。

未切断のポリヌクレオチドと比較して長さが短い切断されたポリヌクレオチド（断片化されたポリヌクレオチドとも呼ばれる）は、配列リードとも呼ばれる配列決定リードを生成するために使用される配列決定機器の能力を一致させることが望ましいこともある。例えば、増幅されたポリヌクレオチドは、下流配列決定プラットフォームによって決定された最適な長さに、断片化、例えば切断されることもある。本明細書にさらに記載される様々な配列決定機器は、異なる長さの核酸を収容することができる。場合によっては、増幅されたポリヌクレオチドは、例えば、フローセル取り付けあるいは配列決定プライマー結合において、下流の配列決定プラットフォームで役立つアダプターを取り付けるプロセスで切断される。場合によっては、切断されたポリヌクレオチドは、配列決定の前に切断されたポリヌクレオチドの増幅産物を生成するために増幅に晒される。追加の増幅は、例えば、下流分析、例えば、配列決定分析のための十分な量のポリヌクレオチドを生成することが望ましいこともあり得る。結果として生じる増幅産物は、個々の切断されたポリヌクレオチドの複数のコピーを含むことができる。

配列決定中に、同じ増幅されたポリヌクレオチドから始まる切断されたポリヌクレオチドあるいはその増幅産物は配列決定可能である。配列決定に起因する配列決定リードは、リードファミリーへとグループ化可能である。リードファミリーは任意の適切な数の配列リードを含むことができる。場合によっては、リードファミリーは、少なくとも５、１０、１５、２０、２５、５０、７５、あるいは１００の配列リードを含む。場合によっては、最小数の配列リードが存在していなければ、配列リードのグループはリードファミリーとして同定されないこともある。例えば、リードファミリーは少なくとも２、３、４、５、７、８、９、あるいは１０の配列リードを含むことができる。場合によっては、リードファミリーは少なくとも２５のリード配列を含む。場合によっては、配列リードは、共有される接合配列、および５’末端と３’末端の共有される配列に基づいてリードファミリーとして分類されてもよい。いくつかの実施形態において、リードファミリーの配列リードは同じ接合配列を有する。いくつかの実施形態において、リードファミリーの配列リードは、５’末端と３’末端で同じ配列を有し、例えば、配列は、５’末端と３’末端のそれぞれで少なくとも５つの塩基、６つの塩基、７つの塩基、８つの塩基、９つの塩基、あるいは１０の塩基で同一となることもある。場合によっては、５’末端と３’末端の配列は、増幅および／または配列決定誤差に起因する誤差によりリードファミリーのすべての配列リードで同一ではない。例えば、アラインメントによって比較すると、リードファミリーの配列決定リードはオーバーラップを示すことがある。場合によっては、最適にアラインしたとき、リードファミリーの配列決定リードは少なくとも７５％の同一性を示す。用語「パーセント（％）同一性」とは、必要に応じて、最大のパーセント同一性を達成するために、配列をアラインしてギャップを導入した後に２つの配列、例えば、候補配列と参照配列との間で共有される同一の残基の割合を指す（つまり、ギャップは、最適なアラインメントのための候補と参照配列の両方に導入可能であり、場合によっては、比較目的で非相同配列を無視することができる）。パーセント同一性を決定する目的のためのアラインメントは、例えば、ＢＬＡＳＴ、ＡＬＩＧＮ、またはＭｅｇａｌｉｇｎ（ＤＮＡＳＴＡＲ）ソフトウェアなどの、公に利用可能なコンピュータソフトウェアを使用して、様々な方法で達成することができる。２つの配列のパーセント同一性は、ＢＬＡＳＴを使用して試験配列を比較配列にアラインし、比較配列の同じ位置のアミノ酸あるいはヌクレオチドと同一であるアラインされた試験配列のアミノ酸あるいはヌクレオチドの数を決定し、比較配列中のアミノ酸あるいはヌクレオチドの数で同一のアミノ酸あるいはヌクレオチドの数を割ることによって計算することができる。最適にアラインするとき、ファミリーの２つの配列決定リードは任意の適切な長さの塩基で少なくとも７５％の同一性（例えば、少なくとも８０％、８５％、９０％、あるいは９５％の同一性）を示すことができる。リードファミリー中の配列決定リード第１の対は、中の配列決定リードの第２の対とは異なる％同一性を示す場合がある。場合によっては、％同一性が、少なくとも５０の塩基（例えば、少なくとも６０の塩基、７０の塩基、８０の塩基、９０の塩基、１００の塩基、１１０の塩基、１２０の塩基、１３０の塩基、１４０の塩基、あるいは１５０の塩基）の長さにわたるアラインメントのために決定される。場合によっては、アラインメントは、約２５−２５０の塩基、約５０−２００の塩基、約７５−１７５の塩基、あるいは約１００−１５０の塩基の長さにわたる。場合によっては、アラインメントは、試験配列あるいは比較配列の全長上にわたる。いくつかの実施形態において、リードファミリーの２つの配列決定リードは、最適にアラインするとき、少なくとも５０の塩基（例えば、少なくとも６０の塩基、７０の塩基、８０の塩基、９０の塩基、１００の塩基、１１０の塩基、１２０の塩基、１３０の塩基、１４０の塩基、あるいは１５０の塩基）の長さにわたって少なくとも７５％の同一性（例えば、少なくとも８０％、８５％、９０％、あるいは９５％の同一性）を示す。

環状ポリヌクレオチド鋳型の線状コンカテマーを含む増幅されたポリヌクレオチドは、環状ポリヌクレオチド鋳型配列の多重反復あるいはコピーを含むことができる。増幅されたポリヌクレオチドから生成された切断されたポリヌクレオチドは、環状ポリヌクレオチド鋳型配列の様々なコピーを有することができる。切断されたポリヌクレオチドは、反復配列の１つ未満のコピー、反復配列の少なくとも１つのコピー、反復配列の少なくとも２つのコピー、あるいは反復配列の少なくとも３つのコピーを有することができる。切断されたポリヌクレオチド中の反復の数は、反復配列の長さに依存することがあり得る。例えば、およそ同じサイズの切断された断片について、比較的短い長さの反復を有するコンカテマーは、長い長さの反復を有するコンカテマーと比較して、反復配列のより多くのコピーを有する切断された断片を生成することができる。

切断されたポリヌクレオチドまたはその増幅産物の配列決定リードは、場合によっては、反復配列の少なくとも１つのコピーを含むことができる。場合によっては、配列決定リードは、反復配列の少なくとも２つのコピー（例えば、少なくとも３つのコピー、４つのコピー、あるいは５つのコピー）を含む。リードファミリーの配列リードからの反復配列のコピーの平均数は、核酸サンプルのポリヌクレオチドの長さに依存することがあり得る。

配列決定リードは、環状ポリヌクレオチド鋳型の配列に相当するコンカテマー中の反復されたセグメントの長さおよび／または配列を最初に同定することによりリードファミリーへ分類される。場合によっては、反復されたセグメントの長さおよび／または配列の同定は、他のリードへのリードのアラインメント、あるいは参照配列へのアラインメントを含む。次に、接合配列は、例えば、参照配列へのアラインメントによって同定することができる。ポリヌクレオチドの５’末端と３’末端の配列、および接合部からのそれらの相対的な距離（例えば、塩基中の）を決定することができる。５’末端と３’末端で同じ接合配列と共有される配列とを有するリードは、同じ切断されたポリヌクレオチドから始まる増幅産物の配列決定リードを表すリードファミリーへ分類可能である。

リードファミリーで観察される配列の差異は、場合によっては、その配列の差異がそれぞれの５’末端と３’末端で同じ接合配列であるが異なる配列を有する（例えば、少なくとも２つの切断されたポリヌクレオチド）第２のリードファミリーで生じることを確認することによって、増幅および／または配列決定誤差の結果とは反対に、真の配列の差異とコールすることができる。同じ接合配列であるが異なる５’末端および／または３’末端を有する２つのリードファミリーは、同じ線状コンカテマーの２つの切断されたポリヌクレオチドに対応することができる。同じ増幅されたポリヌクレオチドの２つの切断されたポリヌクレオチドに対応する２つのリードファミリーにおける配列の差異の観察は、その配列の差異が他の環状ポリヌクレオチド上で本当に存在し、かつ、切断されたポリヌクレオチドの１つにおける増幅および／または配列決定誤差の結果ではないことを確認するための一つの方法である。

場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの大部分で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの少なくとも５０％（例えば、配列決定リードの少なくとも６０％、７０％、８０％、９０％、あるいは９５％）で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの１００％で生じる場合に、配列の差異とみなされる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第１の切断されたポリヌクレオチドからの配列決定リードの大部分と、第２の切断されたポリヌクレオチドからの配列決定リードの大部分で生じるときに、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が第１の切断されたポリヌクレオチドからの配列決定リードの少なくとも５０％（例えば、配列決定リードの少なくとも６０％、７０％、８０％、９０％、あるいは９５％）と、第２の切断されたポリヌクレオチドからの配列決定リードの少なくとも５０％（例えば、少なくとも６０％、７０％、８０％、９０％、あるいは９５％）で生じる場合に、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第１の切断されたポリヌクレオチドからの配列決定リードの１００％と、第２の切断されたポリヌクレオチドからの配列決定リードの１００％で生じるときに、配列変異体と呼ばれる。

サンプル中の配列決定リードから同定された配列の差異の存在を確認するために、同じ接合配列であるが異なる切断末端を有する２つの切断されたポリヌクレオチドである２つの異なる切断されたポリヌクレオチドを使用することによって、配列変異体の検出を改善することができる。真の配列変異体は、同じ増幅されたポリヌクレオチドから始まる少なくとも２つの切断されたポリヌクレオチドで見つかると予想されるが、誤差は２つ未満の切断されたポリヌクレオチドで見つかることが予想される。場合によっては、変異体検出の誤差率は減少する。いくつかの実施形態において、変異体検出の誤差率は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、あるいは５０％減少する。場合によっては、変異体検出の感度および／または特異性は増加する。いくつかの実施形態において、変異体検出の感度は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、あるいは５０％増加する。いくつかの実施形態において、変異体検出の特異性は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、あるいは５０％増加する。場合によっては、無病誤診率が減少する。

場合によっては、さらに（ｉ）配列の差異が異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じ、（ｉｉ）配列の差異が二本鎖入力分子の両方の鎖の上で同定され、および／または（ｉｉｉ）配列の差異がローリングサークル増幅（ＲＣＡ）を含む増幅によって形成されたコンカテマーのコンセンサス配列で生じるときに、配列の差異を配列変異体としてコールする工程が生じる。場合によっては、参照配列は配列決定リードである。場合によっては、参照配列は、互いに配列決定リードをアラインすることにより形成されたコンセンサス配列である。

場合によっては、切断されたポリヌクレオチドは富化のない配列決定にさらされる。しかしながら、必要に応じて、増幅されたポリヌクレオチドおよび／または切断されたポリヌクレオチド中の１つ以上の標的ポリヌクレオチドを富化する工程は、配列決定の前に富化工程で実施可能である。例示的な富化工程は、標的配列に相補的な配列とともに核酸を使用することを含み得る。

配列変異体は、本明細書にさらに記載されるように、参照配列に対する任意の変動であり得る。本明細書に記載される方法を用いて検出可能な配列変異体の非限定的な例としては、一塩基多型（ＳＮＰ）、欠失／挿入多型（ＤＩＰ）、コピー数多型（ＣＮＶ）、短いタンデム反復（ＳＴＲ）、単純反復配列（ＳＳＲ）、可変数のタンデム反復（ＶＮＴＲ）、増幅断片長多型（ＡＦＬＰ）、レトロトランスポゾンベースの挿入多型、配列特異的な増幅多型、および配列変異体として検出可能なエピジェネティックマークの差（例えば、メチル化差）が挙げられる。場合によっては、配列変異体は一塩基多型などの多型である。場合によっては、配列変異体は原因遺伝子変異体である。場合によっては、配列変異体は癌のタイプまたはステージに関連付けられる。

核酸サンプルは被験体からのサンプルであり得る。場合によっては、サンプルはヒト被験体からのものである。場合によっては、サンプルは、ヒト被験体などの被験体の尿、便、血液、唾液、組織、あるいは体液を含む。場合によっては、サンプルは腫瘍細胞を含む。場合によっては、サンプルは、ホルマリン固定パラフィン包埋サンプルを含む。場合によっては、サンプルの複数のポリヌクレオチドは無細胞のポリヌクレオチドを含む。無細胞のポリヌクレオチドは無細胞ＤＮＡを含むことがあり、場合によっては、循環腫瘍ＤＮＡおよび／または循環腫瘍ＲＮＡを含むことがある。無細胞のポリヌクレオチドは無細胞のＲＮＡを含むことがある。いくつかの実施形態において、上記方法はさらに、配列変異コールに基づいて、被験体を診断し、および、随意に処置する工程を含む。場合によっては、サンプル中の微生物汚染物質は配列変異コールに基づいて同定される。そのような場合、サンプルは被験体からのものであり得るが、土サンプルまたは食物サンプルなどの非被験体サンプルからのものであってもよい。

複数のポリヌクレオチドは一本鎖であり得る。場合によっては、ポリヌクレオチドは二本鎖形態であり、例えば、変性によって処置されることで、環状化を進める前に一本鎖をもたらす。場合によっては、二本鎖ポリヌクレオチドが環状化されることで二本鎖の環が得られ、二本鎖の環は例えば、変性によって処置されることで一本鎖の環が得られる。

別の態様では、本開示は、各々が５’末端と３’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供する。いくつかの実施形態では、方法は：（ａ）複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、所定の環状ポリヌクレオチドが上記環状化に起因する接合配列を有する、工程と、（ｂ）複数の増幅されたポリヌクレオチドを生成するために（ａ）の環状ポリヌクレオチドを増幅する工程であって、複数のポリヌクレオチドの第１の増幅されたポリヌクレオチドと複数のポリヌクレオチドの第２の増幅されたポリヌクレオチドが、接合配列を含むが、それぞれの５’末端および／または３’末端で異なる配列を含む、工程と、（ｃ）第１の増幅されたポリヌクレオチドと第２の増幅されたポリヌクレオチドに対応する複数の配列決定リードを生成するために複数の増幅されたポリヌクレオチドおよび／またはその増幅産物を配列決定する工程と、（ｄ）配列の差異が第１の増幅されたポリヌクレオチドと第２の増幅されたポリヌクレオチドの両方に対応する配列決定リードで生じるときに、配列決定リードで検出された配列の差異を配列変異体としてコールする工程とを含む。いくつかの実施形態において、（ａ）における個々のポリヌクレオチドを環状化する工程は、リガーゼ酵素によって達成される。いくつかの実施形態において、リガーゼ酵素は（ｂ）における増幅の前に分解される。（ｂ）における増幅の前のリガーゼの分解は、増幅可能なポリヌクレオチドの回収率を増大させることができる。いくつかの実施形態において、複数の環状化したポリヌクレオチドは（ｂ）の前には精製または単離されない。

環状化の後で、環状ポリヌクレオチドが増幅される。（ｂ）における環状ポリヌクレオチドを増幅する工程は、鎖置換活性を有するポリメラーゼによって達成可能である。場合によっては、ポリメラーゼはＰｈｉ２９ＤＮＡポリメラーゼである。場合によっては、（ｂ）における環状ポリヌクレオチドを増幅する工程は、ローリングサークル増幅（ＲＣＡ）を含む。ローリングサークル増幅は、鋳型環状ポリヌクレオチド配列の線状コンカテマーを含む増幅ポリヌクレオチドにもたらすことができる。場合によっては、（ｂ）における増幅する工程は、ランダムプライマーを用いて、環状ポリヌクレオチドを、増幅反応混合物にさらす工程を含む。ランダムプライマーは、（ｂ）の増幅の間に環状ポリヌクレオチドに非特異的に（例えばランダムに）ハイブリダイズすることができる。環状ポリヌクレオチドに非特異的にハイブリダイズすることができるランダムプライマーは、共通の環状ポリヌクレオチド、複数の環状ポリヌクレオチド、あるいはその両方にハイブリダイズすることができる。場合によっては、２つ以上のランダムプライマーは、同じ環状ポリヌクレオチド（例えば、同じ環状ポリヌクレオチドの異なる領域）にハイブリダイズし、同じ標的配列（あるいはサブユニット配列）の反復を有する増幅されたポリヌクレオチドをもたらすことができる。同じ鋳型の増幅されたポリヌクレオチド（例えば、環状ポリヌクレオチド）は同じ接合配列を有することができる。いくつかの実施形態において、個々のランダムプライマーは、互いに異なるそれぞれの５’末端および／または３’末端で配列を含み、結果として生じた増幅されたポリヌクレオチドは、互いに異なるそれぞれの５’末端および／または３’末端で配列を含むことができる。同じ鋳型の増幅されたポリヌクレオチドは、場合によっては、プライマーが最初に結合された場所、および、ヌクレオチド取り込みが終了した場所に依存して、異なる５’末端および／または３’末端を有する。場合によっては、（ｂ）における増幅する工程は、環状ポリヌクレオチドを、標的特異的なプライマーを含む増幅反応混合物にさらす工程を含む。標的特異的なプライマーは、特定の遺伝子配列を標的とするプライマーを指すこともあれば、場合によっては、アダプターポリヌクレオチド配列を標的とするプライマーを指すこともあり得る。標的特異的なプライマーの使用に起因する増幅されたポリヌクレオチドは、共通の第１の末端（例えばプライマー）を共有することができ、ヌクレオチド取り込みが終了した場所次第では第２の末端を共有しないこともある。増幅する工程は、変性、プライマー結合、およびプライマー伸長の複数のサイクルを含むことができる。場合によっては、増幅されたポリヌクレオチドの増幅産物を生成するために、増幅されたポリヌクレオチドが、さらなる増幅にさらされる場合がある。追加の増幅は、例えば、下流分析、例えば、配列決定分析のための十分な量のポリヌクレオチドを生成することが望ましいこともあり得る。結果として生じる増幅産物は、個々の増幅されたポリヌクレオチドの複数のコピーを含むことができる。

増幅されたポリヌクレオチドおよび／または増幅産物はその後、配列決定されることで、配列決定リードが得られる。場合によっては、増幅されたポリヌクレオチドおよび／または増幅産物は、富化のない配列決定にさらされる。しかしながら、必要に応じて、増幅されたポリヌクレオチドおよび／または増幅産物中の１つ以上の標的ポリヌクレオチドを富化する工程は、配列決定の前に富化工程で実施可能である。

配列決定リードはリードファミリーへ分類可能である。リードファミリーは任意の適切な数の配列リードを含むことができる。場合によっては、リードファミリーは、少なくとも５、１０、１５、２０、２５、５０、７５、あるいは１００の配列リードを含む。場合によっては、最小数の配列リードが存在していなければ、配列リードのグループはリードファミリーとして同定されないこともある。例えば、リードファミリーは少なくとも２、３、４、５、６、７、８、９、あるいは１０の配列リードを含む。場合によっては、リードファミリーは少なくとも２５のリード配列を含む。いくつかの実施形態において、リードファミリーの配列リードは同じ接合配列を有する。いくつかの実施形態において、リードファミリーの配列リードは、５’末端と３’末端で同じ配列を有し、例えば、配列は、５’末端と３’末端のそれぞれで少なくとも５つの塩基、６つの塩基、７つの塩基、８つの塩基、９つの塩基、あるいは１０の塩基で同一となることもある。場合によっては、５’末端と３’末端の配列は、増幅および／または配列決定に起因する誤差によりリードファミリーのすべての配列リードで同一ではない。例えば、アラインメントによって比較すると、リードファミリーの配列決定リードはオーバーラップを示すことがある。場合によっては、最適にアラインしたとき、リードファミリーの配列決定リードは少なくとも７５％の同一性を示す。最適にアラインするとき、ファミリーの２つの配列決定リードは任意の適切な長さの塩基で少なくとも７５％の同一性（例えば、少なくとも８０％、８５％、９０％、あるいは９５％の同一性）を示すことができる。リードファミリー中の配列決定リード第１の対は、リードファミリー中の配列決定リードの第２の対とは異なる％同一性を示す場合がある。場合によっては、％同一性が、少なくとも５０の塩基（例えば、少なくとも６０の塩基、７０の塩基、８０の塩基、９０の塩基、１００の塩基、１１０の塩基、１２０の塩基、１３０の塩基、１４０の塩基、あるいは１５０の塩基）の長さにわたるアラインメントのために決定される。場合によっては、アラインメントは、約２５−２５０の塩基、約５０−２００の塩基、約７５−１７５の塩基、あるいは約１００−１５０の塩基の長さにわたる。場合によっては、アラインメントは、試験配列あるいは比較配列の全長上にわたる。いくつかの実施形態において、リードファミリーの２つの配列決定リードは、最適にアラインするとき、少なくとも５０の塩基（例えば、少なくとも６０の塩基、７０の塩基、８０の塩基、９０の塩基、１００の塩基、１１０の塩基、１２０の塩基、１３０の塩基、１４０の塩基、あるいは１５０の塩基）の長さにわたって少なくとも７５％の同一性（例えば、少なくとも８０％、８５％、９０％、あるいは９５％の同一性）を示す。

共有される環状ポリヌクレオチド鋳型の線状コンカテマーを含む増幅されたポリヌクレオチドは、同じ環状ポリヌクレオチド配列であるが複数の個々の分子上の複数の線状コンカテマーを生成することができる。増幅されたポリヌクレオチドまたはその増幅産物の配列決定リードは、場合によっては、反復配列の少なくとも１つのコピーを含むことができる。場合によっては、配列決定リードは、反復配列の少なくとも２つのコピー（例えば、少なくとも３つのコピー、４つのコピー、あるいは５つのコピー）を含む。リードファミリーの配列リードからの反復配列のコピーの平均数は、核酸サンプルのポリヌクレオチドの長さに依存することがあり得る。例えば、比較的長いポリヌクレオチドを含むサンプルは、コンカテマーが同様の長さの場合に、比較的短いポリヌクレオチドを含むサンプルと比較して、反復の少ないコンカテマーをもたらすこともある。

配列決定リードは、環状ポリヌクレオチド鋳型の配列に相当するコンカテマー中の反復されたセグメントの長さおよび／または配列を最初に同定することによりリードファミリーへ分類される。場合によっては、反復されたセグメントの長さおよび／または配列の同定は、他のリードへのリードのアラインメント、あるいは参照配列へのアラインメントを含む。次に、接合配列は、例えば、参照配列へのアラインメントによって同定することができる。ポリヌクレオチドの５’末端と３’末端の配列、および接合部からのそれらの相対的な距離（例えば、塩基中の）を決定することができる。５’末端と３’末端で同じ接合配列と共有される配列とを有するリードは、同じ増幅されたポリヌクレオチドまたは環状ポリヌクレオチドの同じ分子コピーから始まる増幅産物の配列決定リードを表すリードファミリーへ分類可能である。

リードファミリーで観察される配列の差異は、場合によっては、その配列の差異がそれぞれの５’末端と３’末端で同じ接合配列であるが異なる配列を有する第２のリードファミリーで生じることを確認することによって、増幅および／または配列決定誤差の結果とは反対に、真の配列の差異とコールすることができる。同じ接合配列であるが異なる５’末端および／または３’末端を有する２つのリードファミリーは、同じ環状ポリヌクレオチドの２つの増幅されたポリヌクレオチドに対応することができる。同じ環状ポリヌクレオチドに対応する２つのリードファミリーにおける配列の差異の観察は、その配列の差異が環状ポリヌクレオチド上に本当に存在し、かつ、増幅されたポリヌクレオチドの１つにおける増幅および／または配列決定誤差の結果ではないことを確認するための一つの方法であり得る。

場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの大部分で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの少なくとも５０％（例えば、配列決定リードの少なくとも６０％、７０％、８０％、９０％、あるいは９５％）で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの１００％で生じる場合に、配列の差異とみなされる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第１の増幅されたポリヌクレオチドからの配列決定リードの大部分と、第２の増幅されたポリヌクレオチドからの配列決定リードの大部分で生じるときに、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が第１の増幅されたポリヌクレオチドからの配列決定リードの少なくとも５０％（例えば、配列決定リードの少なくとも６０％、７０％、８０％、９０％、あるいは９５％）と、第２の増幅されたポリヌクレオチドからの配列決定リードの少なくとも５０％（例えば、配列決定リードの少なくとも６０％、７０％、８０％、９０％、または９５％）で生じる場合に、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第１の増幅されたポリヌクレオチドからの配列決定リードの１００％と、第２の増幅されたポリヌクレオチドからの配列決定リードの１００％で生じるときに、配列変異体と呼ばれる。

本明細書に記載された方法を実行する際に、複数のポリヌクレオチドを含むサンプル中の変異体検出は改善可能である。場合によっては、変異体検出の誤差率は減少する。いくつかの実施形態において、変異体検出の誤差率は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、あるいは５０％減少する。場合によっては、変異体検出の感度および／または特異性は増加する。いくつかの実施形態において、変異体検出の感度は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、あるいは５０％増加する。いくつかの実施形態において、変異体検出の特異性は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、あるいは５０％増加する。場合によっては、無病誤診率が減少する。

配列変異体は、本明細書にさらに記載されるように、参照配列に対する任意の変動であり得る。本明細書に記載される方法を用いて検出可能な配列変異体の非限定的な例としては、一塩基多型（ＳＮＰ）、欠失／挿入多型（ＤＩＰ）、コピー数多型（ＣＮＶ）、短いタンデム反復（ＳＴＲ）、単純反復配列（ＳＳＲ）、可変数のタンデム反復（ＶＮＴＲ）、増幅断片長多型（ＡＦＬＰ）、レトロトランスポゾンベースの挿入多型、配列特異的な増幅多型、および配列変異体として検出可能なエピジェネティックマークの差（例えば、メチル化差）が挙げられる。場合によっては、配列変異体は一塩基多型などの多型である。

核酸サンプルは被験体からのサンプルであり得る。場合によっては、サンプルはヒト被験体からのものである。場合によっては、サンプルは、ヒト被験体などの被験体の尿、便、血液、唾液、組織、あるいは体液を含む。場合によっては、サンプルは腫瘍細胞を含む。場合によっては、サンプルは、ホルマリン固定パラフィン包埋サンプルを含む。場合によっては、サンプルの複数のポリヌクレオチドは無細胞のポリヌクレオチドを含む。無細胞のポリヌクレオチドは無細胞ＤＮＡを含むことがあり、場合によっては、循環腫瘍ＤＮＡを含むことがある。無細胞のポリヌクレオチドは無細胞ＲＮＡを含むことがあり、場合によっては、循環腫瘍ＲＮＡを含むことがある。

前に記載されたように、複数のポリヌクレオチドが一本鎖であり得る。場合によっては、ポリヌクレオチドは二本鎖形態であり、例えば、変性によって処置されることで、環状化を進める前に一本鎖をもたらす。場合によっては、二本鎖ポリヌクレオチドが環状化されることで二本鎖の環が得られ、二本鎖の環は例えば、変性によって処置されることで一本鎖の環が得られる。

他の態様では、本開示は、複数のポリヌクレオチドを含む核酸サンプルなどにおいてローリングサークル増幅を実施する方法を提供する。いくつかの実施形態において、複数のポリヌクレオチドの各々のポリヌクレオチドは５’末端と３’末端を有し、該方法は：（ａ）リガーゼ酵素を使用して複数の環状ポリヌクレオチドを形成するために、複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、各々のポリヌクレオチドが５’末端と３’末端との間に接合部を有する、工程と、（ｂ）リガーゼ酵素を分解する工程と、および、（ｃ）リガーゼ酵素を分解した後に（ａ）の環状ポリヌクレオチドを増幅する工程を含み、ポリヌクレオチドが工程（ａ）と（ｃ）との間では精製または単離されない。いくつかの実施形態において、方法は、（ｄ）複数の配列決定リードを生成するために、増幅されたポリヌクレオチドを配列決定する工程と、（ｅ）配列決定リードと参照配列との間の配列の差異を同定する工程と、（ｆ）異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする工程の、追加の工程を含む。いくつかの実施形態では、方法は：配列決定リードと参照配列との間の配列の差異を同定する工程と、異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする工程を含み、式中、（ａ）配列決定リードは、少なくとも２つの環状ポリヌクレオチドの増幅産物に対応し、（ｂ）少なくとも２つの環状ポリヌクレオチドの各々は、それぞれのポリヌクレオチドの５’末端と３’末端をライゲートすることにより形成された異なる接合部を含む。

他の態様では、本開示は、複数のポリヌクレオチドを含む核酸サンプルなどにおいてローリングサークル増幅を実施する方法を提供する。いくつかの実施形態において、複数のポリヌクレオチドの各々のポリヌクレオチドは５’末端と３’末端を有し、該方法は：（ａ）複数の環状ポリヌクレオチドを形成するためにリガーゼ酵素を用いて複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、各々のポリヌクレオチドが５’末端と３’末端との間に接合部を有する、工程と、（ｂ）リガーゼ酵素を分解する工程と、（ｃ）増幅されたポリヌクレオチドを生成するために、リガーゼ酵素を分解した後に（ａ）の環状ポリヌクレオチドを増幅する工程であって、ポリヌクレオチドが工程（ａ）と（ｃ）との間では精製または単離されない、工程と、（ｄ）切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが５’末端および／または３’末端に１つ以上の切断点を含む、工程を含む。いくつかの実施形態において、方法は、（ｅ）複数の配列決定リードを生成するために、切断されたポリヌクレオチドを配列決定する工程と、（ｆ）配列決定リードと参照配列との間の配列の差異を同定する工程と、（ｇ）配列の差異が少なくとも２つの異なる切断されたポリヌクレオチドで生じるとき、配列の差異を配列変異体としてコールする工程とを含む。（ｃ）における増幅の前のリガーゼの分解は、増幅可能なポリヌクレオチドの回収率を増大させることができる。

いくつかの実施形態では、方法は、配列決定リードと参照配列との間の配列の差異を同定する工程と、異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする工程を含み、式中、（ａ）配列決定リードは、少なくとも２つの環状ポリヌクレオチドの増幅産物に対応し、（ｂ）少なくとも２つの環状ポリヌクレオチドの各々は、それぞれのポリヌクレオチドの５’末端と３’末端をライゲートすることにより形成された異なる接合部を含む。いくつかの実施形態では、方法は：（ｉ）配列の差異が異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じる場合に、配列の差異を配列変異体としてコールする工程と、（ｉｉ）配列の差異が二本鎖入力分子の両方の鎖の上で同定され、および／または（ｉｉｉ）配列の差異がローリングサークル増幅を含む増幅によって形成されたコンカテマーのコンセンサス配列で生じるときをさらに含む。

概して、用語「配列変異体」は、１つ以上の参照配列に対する配列の任意の変動を指す。典型的には、配列変異体は、その参照配列が知られている既知の個体の所定の集団の参照配列よりも低い頻度で生じる。例えば、特定の細菌属は、１６ＳｒＲＮＡ遺伝子のコンセンサス参照配列を有していることもあるが、その属内の個々の種は、細菌の集団中のその種を同定するのに役立つ遺伝子（あるいはその一部）内の１つ以上の配列変異体を有することもある。さらなる例として、同じ種（あるいは同じ個体の複数の配列決定リード）の複数の個体の配列は、最適にアラインされると、コンセンサス配列を生成することもあり、そのコンセンサスに対する配列変異体は危険な汚染を示す集団中の突然変異体を同定するために使用されてもよい。概して、「コンセンサス配列」は、一連の関連する核酸が様々な配列アラインメントアルゴリズムのいずれかに係る最適な配列アラインメントなどの徹底した数学的分析および／または配列分析にさらされた場合に、配列中の各位置の塩基の最も共通する選択を反映するヌクレオチド配列を指す。様々なアラインメントアルゴリズムは利用可能であり、その一部が本明細書に記載されている。いくつかの実施形態において、参照配列は、一人の個体のゲノム配列などの単一の既知の参照配列である。いくつかの実施形態において、参照配列は、参照集団として役立つ複数の個体のゲノム配列などの複数の既知の配列、あるいは同じ個体からのポリヌクレオチドの複数の配列決定リードをアラインすることにより形成されたコンセンサス配列である。いくつかの実施形態において、参照配列は、配列変異体が同じサンプル中の対応する配列に対しる変動を表わすように、分析中のサンプルからの配列を最適にアラインすることにより形成されたコンセンサス配列である。いくつかの実施形態において、配列変異体は、集団（「稀な」配列変異体とも呼ばれる）において低頻度で生じる。例えば、配列変異体は、約５％、４％３％２％、１．５％、１％、０．７５％、０．５％、０．２５％、０．１％、０．０７５％、０．０５％、０．０４％、０．０３％、０．０２％、０．０１％、０．００５％、０．００１％、あるいはそれ以下の頻度で生じることもある。いくつかの実施形態において、配列変異体は、約０．１％以下の頻度で生じる。

配列変異体は参照配列に対する任意の変動であり得る。配列変異は、単一のヌクレオチドあるいは複数のヌクレオチド（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上のヌクレオチド）の変化、挿入、あるいは欠失からなることもある。配列変異体が２つ以上のヌクレオチド差を含む場合、異なるヌクレオチドは互いに隣接していることもあれば、不連続なこともある。配列変異体の種類の非限定的な例としては、一塩基多型（ＳＮＰ）、欠失／挿入多型（ＤＩＰ）、コピー数多型（ＣＮＶ）、短いタンデム反復（ＳＴＲ）、単純反復配列（ＳＳＲ）、可変数のタンデム反復（ＶＮＴＲ）、増幅断片長多型（ＡＦＬＰ）、レトロトランスポゾンベースの挿入多型、配列特異的な増幅多型、および配列変異体として検出可能なエピジェネティックマークの差（例えば、メチル化差）が挙げられる。

本明細書に記載される方法にさらされてもよい核酸サンプルは任意の適切なソースに由来し得る。いくつかの実施形態では、使用されるサンプルは環境試料である。環境試料は、任意の環境ソース、例えば、自然発生雰囲気または人工雰囲気、水道、土、または任意の他の所望のサンプルからのものであり得る。いくつかの実施形態において、環境試料は、例えば、大気の病原体回収システム、表面下の堆積物、地下水、地中深くの古水、草原の植物根土壌界面、沿岸水、および下水処理場から得られてもよい。

サンプルからのポリヌクレオチドは、限定されないが、ＤＮＡ、ＲＮＡ、リボソームＲＮＡ（ｒＲＮＡ）、転移ＲＮＡ（ｔＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、メッセンジャーＲＮＡ（ｍＲＮＡ）、これらのいずれかの断片、あるいはこれらの任意の２つ以上の組み合わせを含む様々なポリヌクレオチドのいずれかであり得る。いくつかの実施形態において、サンプルはＤＮＡを含む。いくつかの実施形態において、サンプルはゲノムＤＮＡを含む。いくつかの実施形態において、サンプルは、ミトコンドリアＤＮＡ、葉緑体ＤＮＡ、プラスミドＤＮＡ、バクテリア人工染色体、酵母人工染色体、オリゴヌクレオチドタグ、またはそれらの組み合わせを含む。いくつかの実施形態において、サンプルは、限定されないが、ポリメラーゼ連鎖反応（ＰＣＲ）、逆転写、およびこれらの組み合わせを含む、プライマーとＤＮＡポリメラーゼとの適切な組み合わせを使用したプライマー伸張反応などによる増幅によって生成されたＤＮＡを含む。プライマー伸張反応のための鋳型がＲＮＡである場合、逆転写の産物は相補的ＤＮＡ（ｃＤＮＡ）と呼ばれる。プライマー伸張反応に有用なプライマーは、１つ以上の標的に特異的な配列、ランダムシーケンス、部分的ランダムシーケンス、およびそれらの組み合わせを含み得る。一般に、サンプルのポリヌクレオチドは、サンプル中にポリヌクレオチドを含み、これは標的ポリヌクレオチドを含むこともあれば、含まない場合もある。ポリヌクレオチドは一本鎖、二本鎖で、またはこれらの組み合わせであり得る。いくつかの実施形態において、本開示の方法にさらされたポリヌクレオチドは一本鎖ポリヌクレオチドであり、これは二本鎖ポリヌクレオチドの存在下にあることもあれば、ないこともある。いくつかの実施形態において、ポリヌクレオチドは一本鎖ＤＮＡである。一本鎖ＤＮＡ（ｓｓＤＮＡ）は、一本鎖形態で単離されるｓｓＤＮＡであってもよく、または、二本鎖形態で単離され、その後、本開示の方法の１つ以上の工程の目的のために一本鎖にされるＤＮＡであってもよい。

いくつかの実施形態において、ポリヌクレオチドは、抽出工程を伴わない、および／または精製工程を伴わない、その後の工程（例えば、環状化と増幅）にさらされる。例えば、流体サンプルは、精製された流体サンプルと細胞サンプルを生成する抽出工程なく細胞を撤去するために処置され、その後、精製された流体サンプルからＤＮＡが単離されてもよい。沈澱または非特異的な結合などや、その後の結合したポリヌクレオチドを放出するための基質の洗浄などのポリヌクレオチドの単離のための様々な手順が利用可能である。ポリヌクレオチドが細胞抽出工程なくサンプルから単離される場合、ポリヌクレオチドは大部分が細胞外ポリヌクレオチドであるか、または死細胞あるいは損傷を受けた細胞に相当し得る無細胞ＤＮＡと無細胞ＲＮＡなどの「無細胞」ポリヌクレオチドである。そのような細胞の同一性は、腫瘍細胞（例えば、癌検出中）、胎児細胞（例えば、出生前診断中）、移植組織からの細胞（例えば、移植失敗の早期発見中）、あるいは微生物群のメンバーなどの、それらが由来する細胞または細胞の集団を特徴づけるために使用されてもよい。

サンプルがサンプル中の細胞などのポリヌクレオチドを抽出するために処置される場合、様々な抽出法が利用可能である。例えば、核酸は、フェノール、フェノール／クロロホルム／イソアミルアルコール、あるいはＴＲＩｚｏｌおよびＴｒｉＲｅａｇｅｎｔを含む同様の製剤での有機抽出により精製され得る。抽出技術の他の限定されない例は、以下を含む：（１）自動核酸抽出器、例えばＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ（ＦｏｓｔｅｒＣｉｔｙ，Ｃａｌｉｆ．）から入手可能なＭｏｄｅｌ３４１ＤＮＡＥｘｔｒａｃｔｏｒの使用を伴うまたは伴わない、例えばフェノール／クロロホルムの有機試薬（Ａｕｓｕｂｅｌｅｔａｌ．，１９９３）を使用する、エタノール沈殿が後続する有機抽出；（２）固定相吸着法（米国特許第５，２３４，８０９号；Ｗａｌｓｈｅｔａｌ．，１９９１）；および（３）典型的に「塩析」方法と称される沈澱法などの、塩で誘導された核酸沈澱法（Ｍｉｌｌｅｒｅｔａｌ．，（１９８８））。核酸の単離および／または精製の別の例は磁性粒子の使用を含み、核酸は特異的または非特異的に磁性粒子に結合し、その後磁石を使用してビーズを単離し、洗浄し、そしてビーズから核酸を溶出することができる（例えば米国特許第５，７０５，６２８号を参照）。いくつかの実施形態において、上記の単離方法は、サンプルから不要なタンパク質を取り除くのに役立つ酵素消化工程、例えばプロテイナーゼＫまたは他のプロテアーゼによる消化より始められてもよい。例えば、米国特許第７，００１，７２４号を参照。望ましい場合、ＲＮａｓｅ阻害剤を、溶解緩衝液に追加することができる。特定の細胞またはサンプル型について、前記プロトコルにタンパク質変性／消化の工程を加えることが望ましい場合もある。精製方法は、ＤＮＡ、ＲＮＡ、またはその両方を単離することを目的とし得る。抽出手順の間またはその後にＤＮＡとＲＮＡの両方が一緒に単離されると、更なる工程を利用して、一方または両方を他とは別々に精製することができる。例えば、サイズ、配列、または他の物理的若しくは化学的特性による精製により、抽出した核酸の細画分を生成することもできる。最初の核酸単離工程に加えて、過剰または不要な試薬、反応物、あるいは産物を除去するなどのために、開示された方法における任意の工程の後に核酸の精製を実施することができる。サンプル中の核酸の量および／または純度を決定する様々な方法は、ラベル（例えば、ＳＹＢＲｇｒｅｅｎ、ＳＹＢＲｂｌｕｅ、ＤＡＰＩ、ヨウ化プロピジウム、Ｈｏｅｃｈｓｔ染色、ＳＹＢＲｇｏｌｄ、エチジウムブロマイドなどの蛍光染料および挿入剤）の吸光度（例えば、２６０ｎｍ、２８０ｎｍでの光の吸光度とこれらの比率）および検出によるなどして利用可能である。

望ましい場合、サンプルからのポリヌクレオチドはさらなる処理の前に断片化されてもよい。断片化は、化学的、酵素的、および機械的な断片化を含む、様々な方法のいずれかにより達成されてもよい。いくつかの実施形態において、断片は、１０−８００、１０−５００、５０−５００、９０−２００、あるいは５０−１５０のヌクレオチドなどの長さが約１０〜約１，０００のヌクレオチドの平均長または中央長を有する。いくつかの実施形態において、断片は、約１００、２００、３００、５００、６００、８００、１０００、あるいは１５００以下のヌクレオチドの平均長または中央長を有する。いくつかの実施形態において、断片は約９０−２００のヌクレオチドに及び、および／または、約１５０のヌクレオチドの平均長を有する。いくつかの実施形態において、断片化は、サンプルのポリヌクレオチドの音響超音波処理への暴露を含んで機械的に遂行される。いくつかの実施形態において、断片化は、ニ本鎖核酸切断を生成するために、１以上の酵素に適切な条件下で１以上の酵素でサンプルポリヌクレオチドを処理する工程を含む。ポリヌクレオチド断片の生成に有用な酵素の例は、配列に特異的な及び配列に非特異的なヌクレアーゼを含んでいる。ヌクレアーゼの非限定的な例は、ＤＮａｓｅＩ、フラグメンターゼ、制限エンドヌクレアーゼ、それらの変異体、及びそれらの組み合わせを含む。例えば、ＤＮａｓｅＩでの消化は、Ｍｇ＋＋が無い状態及びＭｎ＋＋がある状態で、ＤＮＡ中のランダムなニ本鎖切断を誘導することができる。いくつかの実施形態において、断片化は、１以上の制限エンドヌクレアーゼでサンプルポリヌクレオチドを処理する工程を含む。断片化は、５’オーバーハング、３’オーバーハング、平滑末端、またはそれらの組み合わせを有する断片を生成することができる。いくつかの実施形態において、断片化が１以上の制限エンドヌクレアーゼの使用を含む場合などには、サンプルポリヌクレオチドの切断は、予測可能な配列を有するオーバーハングを残す。断片化ポリヌクレオチドは、アガロースゲルからのカラム精製または単離などの標準的な方法を介して断片のサイズを選択する工程にさらされることもある。

いくつかの実施形態に従って、サンプルからの複数のポリヌクレオチド中のポリヌクレオチドが環状化される。環状化は、ポリヌクレオチドの５’末端を、同じポリヌクレオチドの３’末端に、別のポリヌクレオチドの３’末端に、あるいは、異なるソース（例えば、オリゴヌクレオチドアダプターなどの人工ポリヌクレオチド）のポリヌクレオチドの３’末端に接合することを含み得る。いくつかの実施形態において、ポリヌクレオチドの５’末端は同じポリヌクレオチドの３’末端に接合される（「自己接合（ｓｅｌｆ−ｊｏｉｎｉｎｇ）」とも呼ばれる）。いくつかの実施形態では、環状化反応の条件は、特定の平均長の環状化したポリヌクレオチドの集団を生成するために、特定の長さの範囲内のポリヌクレオチドの自己接合を支持するように選択される。例えば、環状化反応条件は、長さが約５０００、２５００、１０００、７５０、５００、４００、３００、２００、１５０、１００、５０、またはそれ以下のヌクレオチドよりも短いポリヌクレオチドの自己接合を支持するように選択されてもよい。いくつかの実施形態において、５０−５０００のヌクレオチド、１００−２５００のヌクレオチド、あるいは１５０−５００のヌクレオチドの長さを有する断片は、環状化したポリヌクレオチドの平均長がそれぞれの範囲に含まれるように、好まれる。いくつかの実施形態において、環状化した断片の８０％以上は、長さが５０−２００のヌクレオチドなどの長さが５０−５００のヌクレオチドである。最適化され得る反応条件としては、接合反応に割り当てられる時間の長さ、様々な試薬の濃度、および接合されるポリヌクレオチドの濃度が挙げられる。いくつかの実施形態において、環状化反応は、環状化の前にサンプル中に存在する断片長さの分布を維持する。例えば、環状化の前のサンプル中の断片長さ、および環状化したポリヌクレオチドの平均値、中央値、モード、および標準偏差の１つ以上は、互いの７５％、８０％、８５％、９０％、あるいは９５％またはそれ以上の範囲内である。

場合によっては、自己接合環状化産物を優先的に形成するよりもむしろ、１つ以上のアダプターオリゴヌクレオチドが使用され、サンプル中のポリヌクレオチドの５’末端と３’末端が環状ポリヌクレオチドを形成するために１つ以上の介在性のアダプターオリゴヌクレオチドによって接合されるようになる。例えば、ポリヌクレオチドの５’末端は、アダプターの３’末端に接合可能であり、同じアダプターの５’末端は同じポリヌクレオチドの３’末端に接合可能である。アダプターオリゴヌクレオチドは、サンプルポリヌクレオチドに接合可能な配列（その少なくとも一部は既知である）を有する任意のオリゴヌクレオチドを含む。アダプターオリゴヌクレオチドは、ＤＮＡ、ＲＮＡ、ヌクレオチドアナログ、非標準のヌクレオチド、標識されたヌクレオチド、修飾されたヌクレオチド、またはこれらの組み合わせを含み得る。アダプターオリゴヌクレオチドは、一本鎖、二本鎖、または部分的に二重であり得る。一般に、部分的に二重のアダプターは、１つ以上の一本鎖領域及び１つ以上の二本鎖領域を含む。二本鎖アダプターは、互いにハイブリダイズされた２つの別個のオリゴヌクレオチド（「オリゴヌクレオチドデュプレックス」とも称される）を含み、ハイブリダイゼーションは、１つ以上の平滑末端、１つ以上の３’オーバーハング、１つ以上の５’オーバーハング、ミスマッチおよび／または非対合のヌクレオチドに由来する１つ以上のバルジ、またはこれらの任意の組み合わせを含み得る。アダプターの２つのハイブリダイズされた領域がハイブリダイズされていない領域によって互いに分離されと、「バブル」構造が結果として生じる。異なる配列のアダプターなどの様々な種類のアダプターが組み合わせて使用可能である。異なるアダプターは、連続反応で、あるいは同時に、サンプルポリヌクレオチドに接合することができる。いくつかの実施形態において、同一のアダプターが標的ポリヌクレオチドの両末端に追加される。例えば、第１及び第２のアダプターを同じ反応に加えることができる。アダプターは、サンプルポリヌクレオチドと接合する前に、操作可能である。例えば、末端リン酸塩が追加または除去され得る。

アダプターオリゴヌクレオチドが使用される場合、アダプターオリゴヌクレオチドは様々な配列因子の１つ以上を含み、限定されないが、配列またはその補体をアニールする１つ以上の増幅プライマー、配列またはその補体をアニールする１つ以上の配列決定プライマー、１つ以上のバーコード配列、多数の異なるアダプターまたは異なるアダプターのサブセット中で共有される１つ以上の共通配列、１つ以上の制限酵素認識部位、１つ以上の標的ポリヌクレオチドオーバーハングに相補的な１つ以上のオーバーハング、１つ以上のプローブ結合部位（例えば、Ｉｌｌｕｍｉｎａ，Ｉｎｃ．により開発されたフローセルなどの大規模並列配列決定のためのフローセルなどの配列決定プラットフォームへ接合するためのもの）、１つ以上のランダムまたはほぼランダムな配列（例えば、１つ以上の位置で２つ以上の異なるヌクレオチドのセットから無作為に選択された１つ以上のヌクレオチドであり、異なるヌクレオチドの各々はランダム配列を含むアダプターのプールの中で表される１つ以上の位置で選択される）、及びこれらの組み合わせが挙げられる。場合によっては、アダプターは、例えば、アダプターに相補的な配列を含むオリゴヌクレオチドでコーティングされるビーズ（とりわけ、取り扱いやすいため、磁気ビーズ）を使用することによりアダプターを含むこうした環を精製するために使用されてもよく、アダプターは、ハイブリダイゼーションにより適切なアダプターで閉じた環を「捕捉し」、アダプターやライゲートされていない成分を含まない環を洗い流し、その後、ビーズから捕捉した環を放出することができる。加えて、場合によっては、ハイブリダイズされたキャプチャプローブと標的の環の複合体は、直接ローリングサークル増幅（ＲＣＡ）などによってコンカテマーを生成するために直接使用可能である。いくつかの実施形態において、環のアダプターも配列決定プライマーとして使用することができる。２つ以上の配列因子は、互いに隣接しておらず（例えば、１つ以上のヌクレオチドにより分離される）、互いに隣接し、部分的に重複し、または完全に重複し得る。例えば、配列をアニールする増幅プライマーは、配列をアニールする配列決定プライマーとしても役立つことができる。配列因子を、３’末端またはその付近に、５’末端またはその付近に、あるいはアダプターオリゴヌクレオチドの内部に位置付けることができる。配列要素は、長さが約３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０または以上のヌクレオチド以下など、任意の適切な長さであってもよい。アダプターオリゴヌクレオチドは、それらが構成される１つ以上の配列因子を収容するのに少なくとも十分な、任意の適切な長さを有し得る。いくつかの実施形態において、アダプターは、長さが約１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、９０、１００、２００またはそれ以上のヌクレオチドである。いくつかの実施形態において、アダプターオリゴヌクレオチドは、長さが約１５〜３５のヌクレオチドなど、長さが約１２〜４０のヌクレオチドの範囲である。

いくつかの実施形態において、１つのサンプルからの断片化されたポリヌクレオチドに接合されたアダプターオリゴヌクレオチドは、すべてのアダプターオリゴヌクレオチドに共通の１つ以上の配列と、その特定のサンプルのポリヌクレオチドに接合されたアダプターに特有のバーコードとを含み、バーコード配列は、１つのサンプルあるいはアダプター接合反応から始まるポリヌクレオチドを、別のサンプルあるいはアダプター接合反応から始まるポリヌクレオチドと区別するために、使用可能となる。いくつかの実施形態において、アダプターオリゴヌクレオチドは、１つ以上の標的ポリヌクレオチドオーバーハングに相補的な５’オーバーハング、３’オーバーハング、またはその両方を含む。相補的なオーバーハングは、長さが１以上のヌクレオチドであり、限定されないが、長さが１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５以上のヌクレオチドが挙げられる。相補的なオーバーハングは固定配列を含み得る。アダプターオリゴヌクレオチドの相補的なオーバーハングは、１つ以上のヌクレオチドのランダム配列を含んでもよく、１つ以上のヌクレオチドが１つ以上の位置で２つ以上の異なるヌクレオチドのセットから無作為に選択されるようになり、異なるヌクレオチドの各々は、ランダム配列を含む相補的なオーバーハングを備えたアダプターのプールの中で表される１つ以上の位置で選択される。いくつかの実施形態において、アダプターのオーバーハングは、制限エンドヌクレアーゼ消化によって生成された標的ポリヌクレオチドのオーバーハングに相補的である。いくつかの実施形態において、アダプターのオーバーハングはアデニンまたはチミンからなる。

ポリヌクレオチドを環状化する様々な方法が利用可能である。図２８のＡ−Ｅはポリヌクレオチドを環状化するための方法の非限定的な例を例示する。いくつかの実施形態において、環状化は、リガーゼ（例えば、ＲＮＡまたはＤＮＡリガーゼ）の使用などの酵素反応を含む。限定されないが、Ｃｉｒｃｌｉｇａｓｅ（商標）（Ｅｐｉｃｅｎｔｒｅ；Ｍａｄｉｓｏｎ，ＷＩ）、ＲＮＡリガーゼ、Ｔ４ＲＮＡリガーゼ１（ｓｓＲＮＡリガーゼ、これはＤＮＡとＲＮＡの両方に作用する）を含む様々なリガーゼが利用可能である。加えて、ｄｓＤＮＡ鋳型が存在しない場合、Ｔ４ＤＮＡリガーゼはさらにｓｓＤＮＡをライゲートすることができるが、これは通常はゆっくりとした反応である。リガーゼの他の非限定的な例としては、ＴａｑＤＮＡリガーゼ、Ｔｈｅｒｍｕｓｆｉｌｉｆｏｒｍｉｓ（サーマス・フィリフォルミス）ＤＮＡリガーゼ、エシェリキア・コリＤＮＡリガーゼ、ＴｔｈＤＮＡリガーゼ、サーマス・スコトダクタス（Ｔｈｅｒｍｕｓｓｃｏｔｏｄｕｃｔｕｓ）ＤＮＡリガーゼ（ＩおよびＩＩ）、熱安定リガーゼ、Ａｍｐｌｉｇａｓｅ熱安定ＤＮＡリガーゼ、ＶａｎＣ型リガーゼ、９°ＮＤＮＡリガーゼ、ＴｓｐＤＮＡリガーゼ、及びバイオプロスペクティングにより発見された新しいリガーゼを含む、ＮＡＤ−依存性リガーゼ；Ｔ４ＲＮＡリガーゼ、Ｔ４ＤＮＡリガーゼ、Ｔ３ＤＮＡリガーゼ、Ｔ７ＤＮＡリガーゼ、ＰｆｕＤＮＡリガーゼ、ＤＮＡリガーゼ１、ＤＮＡリガーゼＩＩＩ、ＤＮＡリガーゼＩＶ、及びバイオプロスペクティングにより発見された新しいリガーゼを含む、ＡＴＰ依存性リガーゼ；並びに、それらの野生型、突然変異体アイソフォーム、及び遺伝的に設計された変異体が挙げられる。自己接合が望ましい場合、ポリヌクレオチドと酵素の濃度は、分子間構造よりもむしろ、分子内の環の形成を促進するために調節可能である。反応温度と時間は同様に調節することができる。いくつかの実施形態において、分子内の環を促進するために６０°Ｃが使用される。いくつかの実施形態において、反応時間は１２−１６時間である。反応条件は選択された酵素のメーカーによって指定されたものであってもよい。いくつかの実施形態において、エキソヌクレアーゼ工程は、環状化反応の後に任意のライゲートされていない核酸を消化するために含まれることがある。すなわち、閉じた環は遊離５’末端または３’末端を含まず、したがって、５’または３’エキソヌクレアーゼの導入は、閉じた環を消化しないが、ライゲートされていない成分を消化する。これは多重な系で特定の用途を見出されることもある。

概して、環状ポリヌクレオチドを形成するために（直接的に、または、１つ以上の中間アダプターオリゴヌクレオチドを用いて）ポリヌクレオチドの末端を互いに接合することにより、接合配列を有する接合部が生成される。ポリヌクレオチドの５’末端および３’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター（例えば５’末端接合部または３’末端接合部の１つ）との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの５’末端と３’末端との間の接合部を指すことがある。ポリヌクレオチドの５’末端と３’末端が介在性のアダプター（例えば、一本鎖ＤＮＡの５’末端と３’末端）なしで接合される場合、用語「接合部」とはこれらの２つの末端が接合される点を指す。接合部は接合部を含むヌクレオチドの配列（「接合配列」とも呼ばれる）によって同定されることがある。いくつかの実施形態において、サンプルは、天然の分解プロセス（細胞溶解、細胞死、および、ＤＮＡが細胞からその周辺環境（そこで、無細胞のポリヌクレオチド、無細胞ＤＮＡ、および無細胞のＲＮＡなどでさらに分解されることもある）に放出される他のプロセス）、サンプル処理（固定、染色、および／または保管手順）の副産物である断片化、ならびに、ＤＮＡを制限なく特定の標的配列に切断する方法による断片化（例えば、超音波処理などによる機械的な断片化；ＤＮａｓｅＩ、フラグメンターゼ（ｆｒａｇｍｅｎｔａｓｅ）などの非配列特異的なヌクレアーゼ処置）によって形成された末端の混合物を有するポリヌクレオチドを含む。サンプルが末端の混合物を有するポリヌクレオチドを含む場合、２つのポリヌクレオチドが同じ５’末端または３’を有する可能性は低く、２つのポリヌクレオチドが同じ５’末端と３’末端の両方を独立して有している可能性は著しく低い。これに応じて、いくつかの実施形態では、接合部は異なるポリヌクレオチドを識別するために使用されてもよく、この場合、２つのポリヌクレオチドは同じ標的配列を有する部分を含むことさえある。ポリヌクレオチド末端が介在性のアダプターなしで接合される場合、接合配列は参照配列へのアラインメントによって同定されることがある。例えば、２つの成分配列の順序が参照配列と逆であるように見える場合、その逆転が生じているように見える点はその点での接合部を示唆するものであり得る。ポリヌクレオチド末端が１つ以上のアダプター配列によって接合される場合、接合部は既知のアダプター配列への近接によって、あるいは、配列決定リードが環状化したポリヌクレオチドの５’末端と３’末端の両方の配列を得るのに十分な長さである場合には上のようなアラインメントによって同定されてもよい。いくつかの実施形態において、特定の接合部の形成は、それがサンプルの環状化したポリヌクレオチドの中で特有なものとなるような十分に稀な事象である。

図４のＡ−Ｃはポリヌクレオチドを環状化する方法の３つの非限定的な例を例示する。上（図４のＡ）では、ポリヌクレオチドはアダプターがない状態で環状化され、中央のスキーム（図４のＢ）はアダプターの使用を描き、下のスキーム（図４のＣ）は２つのアダプターを利用する。２つのアダプターが使用される場合、１つはポリヌクレオチドの５’末端に接合され、もう一方のアダプターは同じポリヌクレオチドの３’末端に接合可能である。いくつかの実施形態において、アダプターライゲーションは、ライゲーションを促進する２つのアダプターに相補的な「副木（ｓｐｌｉｎｔ）」核酸と共に、２つの異なるアダプターの使用を含むことがある。分岐した、あるいは、「Ｙ」のアダプターも使用されることがある。２つのアダプターが使用される場合、両末端に同じアダプターを有するポリヌクレオチドは、自己アニーリングにより後の工程で除去されることがある。図１−３は、アダプターのない状態（図１）で、およびアダプターのある状態（図２および３）で、ポリヌクレオチドが環状化される、本開示の方法の実施形態を描く。アダプターを有する（図２および３）環状化したポリヌクレオチドは、標的特異的なプライマー（図２）、あるいはアダプター配列にハイブリダイズするプライマー（図３）を使用して、ローリングサークル増幅（ＲＣＡ）によって増幅可能である。

図６のＡ−Ｂは、一本鎖ＤＮＡなどのポリヌクレオチドを環状化するさらなる非限定的な例となる方法を例証する。アダプターはポリヌクレオチドの５’または３’の末端のいずれかに非対称的に追加可能である。図６のＡで示されるように、一本鎖ＤＮＡ（ｓｓＤＮＡ）は３’末端に遊離ヒドロキシル基を有することができ、アダプターは、リガーゼの存在下で、好ましい反応がアダプターの５’末端にｓｓＤＮＡの３’末端を接合するように、閉塞した３’末端を有することができる。この実施形態では、環を形成する分子内ライゲーションの前に、単一のｓｓＤＮＡ断片および単一のアダプターの分子間ライゲーションを駆り立てるために、ポリエチレングリコール（ＰＥＧ）などの薬剤を使用することが有用なこともある。末端の逆の順序でも行うことができる（閉塞した３’、遊離５’など）。いったん線形ライゲーションが遂行されると、ライゲートされた部分は、キナーゼあるいは他の適切な酵素の使用あるいは化学的作用を介するなどして、閉塞部分を取り除くために酵素で処置可能である。いったん閉塞部分が取り除かれると、ＣｉｒｃＬｉｇａｓｅなどの環状化酵素の追加により、分子内反応は環状化したポリヌクレオチドを形成することができる。図６のＢで示されるように、５’末端または３’末端が閉塞された１つの鎖を有する二本鎖アダプターを使用することにより、二本鎖構造を形成することができ、これは、ライゲーション時にニックを有する二本鎖断片を生成する。その後、２つの鎖を分離させることができ、閉塞部分を取り除き、一本鎖断片を環状化することで環状化したポリヌクレオチドが形成される。場合によっては、図８で示されるように、二本鎖ＤＮＡ（ｄｓＤＮＡ）が環状化されることで、環状化した二本鎖環がもたらされる。二本鎖環は、両方の鎖のプライマー結合と増幅を可能にするために、変性され得る。

いくつかの実施形態において、分子内の環状化の速度を増強するために、分子クランプを用いてポリヌクレオチド（例えば、一本鎖ＤＮＡ）の２つの末端を１つにする。１つのこうしたプロセスの例図が図５で提供される。これはアダプターを用いても用いなくても行うことができる。分子クランプの使用は、平均ポリヌクレオチド断片が、長さが約１００のヌクレオチドよりも大きいときに特に役立つことがある。いくつかの実施形態において、分子クランププローブは３つのドメイン：第１のドメイン、介在性ドメイン、および第２のドメインを含む。第１と第２のドメインは、配列相補性によって標的ポリヌクレオチド中の対応する配列にハイブリダイズする。分子クランププローブの介在性ドメインは、標的配列とは有意にハイブリダイズしないことがある。標的ポリヌクレオチドを用いるクランプのハイブリダイゼーションは、標的配列の２つの末端を接近させることができ、これにより、環状化酵素の存在下において標的配列の分子内環状化が促される。いくつかの実施形態において、分子クランプが増幅プライマーとして同様に役立つことができるとき、これはさらに有用である。

環状化の後、ライゲーション酵素はタンパク質分解工程を使用して、反応産物から取り除かれる。いくつかの実施形態において、タンパク質分解は、環状化反応で使用されるリガーゼを除去または分解するための処置を含む。いくつかの実施形態において、リガーゼを分解する処置は、プロテイナーゼＫなどのプロテアーゼを用いる処置を含む。プロテイナーゼＫによる処置は、メーカーのプロトコル、または、標準的なプロトコル（例えば、ＳａｍｂｒｏｏｋａｎｄＧｒｅｅｎ，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，４ｔｈＥｄｉｔｉｏｎ（２０１２）で提供される）に従ってもよい。いくつかの実施形態において、タンパク質分解は、低いｐＨあるいは酸性溶液または緩衝液を用いる処置を含む。いくつかの実施形態において、タンパク質分解は、例えば、５５°Ｃよりも高く、６０°Ｃよりも高く、６５°Ｃよりも高く、７０°Ｃよりも高く、あるいはそれ以上に反応を加熱するなど、反応を加熱することを含む。いくつかの実施形態において、線状ポリヌクレオチドは環状化の後に分解される。いくつかの実施形態において、線状ポリヌクレオチドはエキソヌクレアーゼを使用して分解される。いくつかの実施形態では、エキソヌクレアーゼはラムダエクソヌクレアーゼを含む。いくつかの実施形態では、エキソヌクレアーゼはＲｅｃＪｆヌクレアーゼを含む。いくつかの実施形態において、エキソヌクレアーゼは、ＥｘｏＩ、ＥｘｏＩＩＩ、ＥｘｏＶ、ＥｘｏＶＩＩ、およびＥｘｏＴの少なくとも１つから選択される。

環状化は、環状化したポリヌクレオチドの配列決定を直接伴うこともある。代替的に、配列決定は、１つ以上の増幅反応に先行することがある。概して、「増幅」とは、１つ以上のコピーが標的ポリヌクレオチドまたはその一部で作られるプロセスを指す。ポリヌクレオチド（例えば、ＤＮＡおよび／またはＲＮＡ）を増幅する様々な方法が利用可能である。増幅は線状であるか、指数関数的であるか、または多相の増幅プロセスにおいて直線位相と指数関数位相の両方を含むこともある。増幅方法は、熱変性工程などの温度の変動を含むこともあれば、あるいは熱変性を必要としない等温過程であることもある。ポリメラーゼ連鎖反応（ＰＣＲ）は、変性の複数のサイクル、反対の鎖へのプライマー対のアニーリング、および標的配列のコピー数を指数関数的に増大させるプライマー伸長を使用する。アニールされた核酸鎖の変性は、加熱、局所的な金属イオン濃度の増加（例えば、米国特許第６，２７７，６０５号）、超音波放射（例えば、ＷＯ／２０００／０４９１７６）、電圧の印加（例えば、米国特許第５，５２７，６７０号、米国特許第６，０３３，８５０号、米国特許第５，９３９，２９１号、および米国特許第６，３３３，１５７号）、ならびに、磁気反応性材料に結合されたプライマーと組み合わせた電磁場の適用（例えば、米国特許第５，５４５，５４０号）によって達成されてもよい。ＲＴ−ＰＣＲと呼ばれるバリエーションでは、逆転写酵素（ＲＴ）はＲＮＡから相補的ＤＮＡ（ｃＤＮＡ）を作るために使用され、その後、ＤＮＡ（例えば、米国特許第５，３２２，７７０号と米国特許第５，３１０，６５２号）の複数のコピーを生成するためにｃＤＮＡはＰＣＲによって増幅される。等温の増幅方法の１つの例は一般にＳＤＡと呼ばれる鎖置換増幅であり、これは、標的配列の反対側の鎖に対してプライマー配列をアニールするサイクル、二重のヘミホスホロチオエート化した（ｈｅｍｉｐｈｏｓｐｈｏｒｏｔｈｉｏａｔｅｄ）プライマー伸長産物を生成するためのｄＮＴＰの存在下におけるプライマー伸長、ヘミ修飾された（ｈｅｍｉｍｏｄｉｆｉｅｄ）制限エンドヌクレアーゼ認識部位のエンドヌクレアーゼ媒介性のニッキング、および、産物の幾何学的な増幅をもたらす、プライマーのアニーリング、ニッキング、ならびに、鎖置換の次のラウンドのために、既存の鎖を置き換えて鎖を生成するべくニックの３’末端からのポリメラーゼ媒介性のプライマー伸長（例えば、米国特許第５，２７０，１８４号と米国特許第５，４５５，１６６号）を用いる。好熱性ＳＤＡ（ｔＳＤＡ）は、本質的に同じ方法でより高温度で好熱性のエンドヌクレアーゼとポリメラーゼを使用する（欧州特許第０，６８４３１５）。他の増幅方法は、ローリングサークル増幅（ＲＣＡ）（例えば、Ｌｉｚａｒｄｉ， “ＲｏｌｌｉｎｇＣｉｒｃｌｅＲｅｐｌｉｃａｔｉｏｎＲｅｐｏｒｔｅｒＳｙｓｔｅｍｓ，”米国特許第５，８５４，０３３号）；ヘリカーゼ依存性増幅（ＨＤＡ）（例えば、Ｋｏｎｇｅｔａｌ．，“ＨｅｌｉｃａｓｅＤｅｐｅｎｄｅｎｔＡｍｐｌｉｆｉｃａｔｉｏｎＮｕｃｌｅｉｃＡｃｉｄｓ，” 米国特許出願公開２００４−００５８３７８Ａ１）；および、ループ媒介性の等温増幅（ＬＡＭＰ）（例えば、Ｎｏｔｏｍｉｅｔａｌ．， “ＰｒｏｃｅｓｓｆｏｒＳｙｎｔｈｅｓｉｚｉｎｇＮｕｃｌｅｉｃＡｃｉｄ，”米国特許第６，４１０，２７８号）を含む。場合によっては、等温増幅は、オリゴヌクレオチドプライマーに組み入れられることもあるような、プロモーター配列からのＲＮＡポリメラーゼによる転写を利用する。転写に基づく増幅方法は、ＮＡＳＢＡと呼ばれる核酸配列ベースの増幅（例えば、米国特許第５，１３０，２３８号）；Ｑβレプリカーゼと一般に呼ばれる、プローブ分子自体を増幅するためのＲＮＡ複製酵素の使用に依存する方法（例えば、Ｌｉｚａｒｄｉ，Ｐ．ｅｔａｌ．（１９８８）ＢｉｏＴｅｃｈｎｏｌ．６，１１９７−１２０２）；自家持続配列複製法（例えば、Ｇｕａｔｅｌｌｉ，Ｊ．ｅｔａｌ．（１９９０）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８７，１８７４−１８７８；Ｌａｎｄｇｒｅｎ（１９９３）ＴｒｅｎｄｓｉｎＧｅｎｅｔｉｃｓ９，１９９−２０２；および、ＨＥＬＥＮＨ．ＬＥＥｅｔａｌ．，ＮＵＣＬＥＩＣＡＣＩＤＡＭＰＬＩＦＩＣＡＴＩＯＮＴＥＣＨＮＯＬＯＧＩＥＳ（１９９７））；ならびに、追加の転写鋳型を生成するための方法（例えば、米国特許第５，４８０，７８４号と米国特許第５，３９９，４９１号）を含む。等温の核酸増幅のさらなる方法は、追加のプライマー（例えば、米国特許第６，２５１，６３９号、米国特許第６，９４６，２５１号、および米国特許第７，８２４，８９０号）の結合部位を露出させるために非標準のヌクレオチド（例えば、ＤＮＡグリコシラーゼまたはＲＮａｓｅＨ）で核酸を切断する酵素と組み合わせて、非標準のヌクレオチド（例えば、ウラシルあるいはＲＮＡヌクレオチド）を含有するプライマーの使用を含む。等温の増幅プロセスは線状であってもよく、あるいは指数関数的であってもよい。

いくつかの実施形態では、増幅はローリングサークル増幅（ＲＣＡ）を含む。典型的なＲＣＡ反応混合物は、１つ以上のプライマー、ポリメラーゼ、およびｄＮＴＰを含み、コンカテマーを生成する。典型的には、ＲＣＡ反応でのポリメラーゼは鎖置換活性を有するポリメラーゼである。様々なこうしたポリメラーゼが利用可能であり、その非限定的な例としては、エキソヌクレアーゼｍｉｎｕｓＤＮＡポリメラーゼＩｌａｒｇｅ（Ｋｌｅｎｏｗ）断片、Ｐｈｉ２９ＤＮＡポリメラーゼ、ＴａｑＤＮＡポリメラーゼなどが挙げられる。概して、コンカテマーは、鋳型ポリヌクレオチドからの標的配列の２つ以上のコピー（例えば、標的配列の約２、３、４、５、６、７、８、９、１０、あるいはそれ以上のコピー；いくつかの実施形態では、約２つ以上のコピー）を含むポリヌクレオチド増幅産物である。増幅プライマーは、約または少なくとも約５、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、９０、１００、またはそれ以上のヌクレオチドなど、任意の適切な長さであってもよく、その一部または全ては、プライマーがハイブリダイズする対応する標的配列に相補的であってもよい（例えば、約または少なくとも約５、１０、１５、２０、２５、３０、３５、４０、４５、５０、またはそれ以上のヌクレオチド）。図７のＡ−Ｃは、適切なプライマーの３つの非限定的な例を描く。図７のＡは、アダプターおよび標的特異的なプライマーのない使用を示しており、これは、特定の標的配列内の配列変異体の存在または不在の検出に使用することができる。いくつかの実施形態において、複数の標的のための複数の標的特異的なプライマーが同じ反応で使用される。例えば、約または少なくとも約１０、５０、１００、１５０、２００、２５０、３００、４００、５００、１０００、２５００、５０００、１００００、１５０００、またはそれ以上の異なる標的配列のための標的特異的なプライマーは、対応する数の標的配列（存在する場合）を並行して増幅するために、単一の増幅反応で使用されてもよい。複数の標的配列は、同じ遺伝子、異なる遺伝子、あるいは非遺伝子の配列の様々な部分に相当することがある。複数のプライマーが単一の遺伝子中の複数の標的配列を標的とする場合、プライマーは、すべてあるいは標的遺伝子のすべてまたは指定された部分をカバーするために遺伝子配列に沿って一定間隔で配置されてもよい（例えば、約または少なくとも約５０のヌクレオチド、５０−１５０のヌクレオチドごと、あるいは５０−１００のヌクレオチドごとに配される）。図７のＣは、アダプター配列にハイブリダイズするプライマーの使用（場合によっては、アダプターオリゴヌクレオチド自体であってもよい）を例証する。

図７のＢは、ランダムプライマーによる増幅の例を例証する。概して、ランダムプライマーは１つ以上のランダムな、またはほぼランダムな配列（例えば、１つ以上の位置で２つ以上の様々なヌクレオチドのセットからランダムに選択された１つ以上のヌクレオチドであって、１つ以上の位置で選択された様々なヌクレオチドの各々はランダムな配列を含むアダプターのプールで表される）を含む。このように、ポリヌクレオチド（例えば、すべて、あるいは実質的にすべての環状化したポリヌクレオチド）は、配列に非特異的な方法で増幅可能である。こうした手順は「全ゲノム増幅」（ＷＧＡ）と呼ばれることがある；しかしながら、典型的なＷＧＡプロトコル（環状化工程を含む）は、本開示によって企図されたポリヌクレオチド断片などの短いポリヌクレオチドを効率的に増幅しない。ＷＧＡ手順のさらなる例証的な議論については、例えば、Ｌｉｅｔａｌ（２００６）ＪＭｏｌ．Ｄｉａｇｎ．８（１）：２２−３０を参照。

環状化したポリヌクレオチドが配列決定の前に増幅される場合、増幅された産物は富化なく直接配列決定にさらされることもあれば、あるいはその後、１つ以上の富化工程にさらされることもある。富化は、増幅産物の保持あるいは１つ以上の試薬の除去などの１つ以上の反応成分を精製することを含んでもよい。例えば、増幅産物は、基質に結合した複数のプローブへのハイブリダイゼーションによって精製されてもよく、その後、洗浄工程などによって捕捉されたポリヌクレオチドの放出を伴うこともある。代替的に、増幅産物は、結合対のメンバーを用いて標識され、その後、基質に結合された結合対の別のメンバーへの結合と、増幅産物を放出するための洗浄とを伴うこともあり得る。可能性のある基質としては、限定されないが、改良ガラスまたは機能化ガラス、プラスチック（アクリル樹脂、スチレンおよび他の材料のポリスチレンおよびコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、Ｔｅｆｌｏｎ（商標）などを含む）、多糖類、ナイロンまたはニトロセルロース、セラミックス、樹脂剤、シリコンおよび変性シリコンを含む、シリカあるいはシリカベースの材料、炭素、金属、無機ガラス、プラスチック、光ファイバー束、および様々な他のポリマーなどが挙げられる。いくつかの実施形態において、基質は、ビーズあるいは他の小さな離散した粒子の形態であり、これは、磁場の適用を介して単離を促すための磁気ビーズまたは常磁性ビーズであってもよい。概して、「結合対」とは、第１と第２の部分の１つを指し、第１と第２の部分は互いに対して特異的な結合親和性を有する。適切な結合対としては、限定されないが、抗原／抗体（例えば、ジゴキシゲニン／抗ジゴキシゲニン、ジニトロフェニル（ＤＮＰ）／抗ＤＮＰ、ダンシル−Ｘ−抗ダンシル、フルオレセイン／抗フルオレセイン、ルシファーイエロー／抗ルシファーイエロー、およびローダミン抗ローダミン）；ビオチン／アビジン（あるいはビオチン／ストレプトアビジン）；カルモジュリン結合タンパク質（ＣＢＰ）／カルモジュリン；ホルモン／ホルモン受容体；レクチン／炭水化物；ペプチド／細胞膜受容体；プロテインＡ／抗体；ハプテン／抗ハプテン；酵素／補助因子；ならびに、酵素／基板が挙げられる。

いくつかの実施形態において、環状化したポリヌクレオチドの増幅後の富化は、１つ以上の追加の増幅反応を含む。いくつかの実施形態において、富化は増幅反応混合物中に配列Ａと配列Ｂ（５’から３’の方向に配向した）を含む標的配列を増幅することを含み、増幅反応混合物は、（ａ）増幅されたポリヌクレオチドと、（ｂ）配列Ａ’を含む第１のプライマーであって、第１のプライマーが配列Ａと配列Ａ’との間の配列相補性によって標的配列の配列Ａに特異的にハイブリダイズする、第１のプライマーと；（ｃ）配列Ｂを含む第２のプライマーであって、第２のプライマーが配列Ｂと配列Ｂ’との間の配列相補性によって標的配列の補体を含む相補的なポリヌクレオチド中に存在する配列Ｂ’に特異的にハイブリダイズする、第２のプライマーと、（ｄ）増幅されたポリヌクレオチドを生成するために第１のプライマーと第２のプライマーを伸長するポリメラーゼを含み、標的配列の配列Ａの５’末端と配列Ｂの３’末端との間の距離が７５ｎｔ以下である。図１０は、単一の反復（環状でない限り典型的には増幅されない）および標的配列の複数のコピーを含むコンカテマーの文脈で標的配列に対して第１と第２のプライマーの例となる配置を例証する。標的配列の単量体に対してプライマーの配向を考慮すると、この配置は、「背中合わせ」（Ｂ２Ｂ）プライマーあるいは「逆方向の」プライマーと呼ばれてもよい。Ｂ２Ｂプライマーを用いる増幅は、環状のおよび／または鎖状体（ｃｏｎｃａｔｅｍｅｒｉｃ）の増幅産物の富化を促す。さらに、比較的な小さなフットプリント（１対のプライマーが及ぶ全距離）と組み合わせたこの配向は、標的配列のまわりの多種多様な断片化事象の増幅を可能にする。なぜなら、接合部は典型的な増幅反応（互いに面して、標的配列に及ぶ）で見られるプライマーの配置よりも、プライマー間で生じる可能性が低いからである。背中合わせのプライマーのさらなる実施形態および利点は図１３のＡ−Ｃで例証される。

いくつかの実施形態において、配列Ａの５’末端と配列Ｂの３’末端との間の距離は、約約２００、１５０、１００、７５、５０、４０、３０、２５、２０、１５、あるいはそれより少ないヌクレオチド以下である。いくつかの実施形態において、配列Ａは配列Ｂの補体である。いくつかの実施形態において、複数の様々な標的配列に方向付けられた複数の対のＢ２Ｂプライマーは、複数の様々な標的配列（例えば、約または少なくとも約１０、５０、１００、１５０、２００、２５０、３００、４００、５００、１０００、２５００、５０００、１００００、１５０００、あるいはそれ以上の様々な標的配列）を平行して増幅するために、同じ反応中で使用される。プライマーは本明細書に別記されるような、任意の適切な長さであり得る。増幅は、本明細書に記載された増幅反応などの適切な条件下の任意の適切な増幅反応も含むことがある。いくつかの実施形態において、増幅はポリメラーゼ連鎖反応である。

いくつかの実施形態において、Ｂ２Ｂプライマーは少なくとも２つの配列要素、配列相補性によって標的配列にハイブリダイズする第１の要素、および、（例えば、第１の要素が接合する場所に対して３’のすぐそばで、尾部と標的配列の一部との間の配列相補性の不足により）第１の要素がハイブリダイズする第１のハイブリダイゼーション温度での第１の増幅段階中に標的配列にハイブリダイズしない５’尾部を含む。例えば、第１のプライマーは、配列Ａ’に対して配列Ｃ５’を含み、第２のプライマーは配列Ｂに対して配列Ｄ５’を含み、配列Ｃと配列Ｄのいずれも、第１のハイブリダイゼーション温度で第１の増幅段階中に複数のコンカテマーにハイブリダイズしない。いくつかの実施形態において、そのような尾部付加されたプライマーが使用され、増幅は第１の段階と第２段階を含むことがあり、第１段階は、第１の温度でのハイブリダイゼーション工程を含み、この工程の間、第１と第２のプライマーはコンカテマー（あるいは環状化したポリヌクレオチド）とプライマー伸長にハイブリダイズし、および、第２段階は、第１の温度よりも高い第２の温度でのハイブリダイゼーション工程を含み、この工程の間、第１と第２のプライマーは、伸長された第１と第２のプライマーまたはその補体とプライマー伸長を含む増幅産物にハイブリダイズする。高い温度は、プライマー中の第１の要素のみとコンカテマー内の内部標的配列との間のハイブリダイゼーションによって形成された短い断片よりも、プライマー伸長産物中のプライマーの第１の要素と尾部要素との間のハイブリダイゼーションを好む。これに応じて、二段階増幅を用いて、短い増幅産物が他の方法で好まれることもある程度を減少させることもあり、これによって、標的配列の２つ以上のコピーを有する増幅産物の比較的より高い割合を維持する。例えば、第２の温度およびプライマー伸長のハイブリダイゼーションの５つのサイクル（例えば、少なくとも５、６、７、８、９、１０、１５、２０、あるいはそれ以上のサイクル）の後に、反応混合物中の増幅されたポリヌクレオチドの少なくとも５％（例えば、少なくとも５％、６％、７％、８％、９％、１０％、１５％、２０％、２５％、３０％、あるいはそれ以上）は、標的配列の２つ以上のコピーを含む。この二段階の尾部付加されたＢ２Ｂプライマー増幅プロセスに係る実施形態の実例が、図１１のＡ−Ｄで例証される。

いくつかの実施形態において、富化は、コンカテマーからのアンプリコンの長さを増大させるために歪めた条件下での増幅を含む。例えば、すべてのプライミング部位がプライマーをハイブリダイズするとは限らないように、プライマー濃度を低下させて、それにより、ＰＣＲ産物をより長くすることができる。同様に、サイクル中のプライマーハイブリダイゼーション時間を減少させることにより、少数のプライマーがハイブリダイズすることを可能にし、それにより、平均ＰＣＲアンプリコンサイズを増大させる。さらに、サイクルの温度および／または伸長時間を増大させることにより、同様にＰＣＲアンプリコンの平均長が増大することがある。こうした技術の任意の組み合わせも使用することができる。

いくつかの実施形態において、特にＢ２Ｂプライマーを用いる増幅が実施された場合、増幅産物は、コンカテマーを含む混合物である単量体の数を減らすおよび／または除去するべく、サイズに基づいて結果として生じるアンプリコンを濾過するために処置される。これは、限定されないが、ゲルからの断片切除、およびゲルろ過（例えば、長さが約３００、４００、５００、またはそれ以上のヌクレオチドよりも大きな断片について富化するための）を含む様々な利用可能な技術や、同様に、結合緩衝液濃度の微調整によるサイズ選別のためのＳＰＲＩビーズ（ＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰ）を用いて、行うことができる。例えば、ＤＮＡ断片と混合する間の０．６ｘ結合緩衝液の使用は、約５００の塩基対（ｂｐ）よりも大きなＤＮＡ断片を優先的に接合するために使用されてもよい。

いくつかの実施形態において、増幅が一本鎖コンカテマーをもたらす場合、一本鎖は、配列決定反応のために生成される配列決定ライブラリの形成の前に、またはその形成の一部として、二本鎖構築物に変換される。一本鎖核酸から二本鎖構築物を生成する様々な適切な方法が利用可能である。同様に、多くの他の方法を使用することができるが、多くの可能性のある方法が図９のＡ−Ｄで描かれている。図９のＡで示されるように、例えば、ランダムプライマー、ポリメラーゼ、ｄＮＴＰ、およびリガーゼの使用は二重鎖をもたらす。図９のＢは、コンカテマーが、反応中でプライマーとして使用することができるアダプター配列を含むときの第２の鎖合成を描いている。図９のＣは、ループアダプターの１つの末端がコンカテマーの末端へ追加される場合の、「ループ」の使用を描いており、ループアダプターは自己ハイブリダイズする核酸の小さな部分を有する。この場合、ループアダプターのライゲーションは、自己ハイブリダイズされ、かつ、ポリメラーゼプライマー鋳型として役立つ、ループをもたらす。図９のＤは、標的配列が既知であり、複数の鎖が形成される場合、とりわけ、強力な鎖置換機能を用いるポリメラーゼが使用されるときの、一般に最も使用されているもののハイパーブランチプライマーの使用を示している。

いくつかの実施形態に従って、環状化したポリヌクレオチド（あるいは随意に富化されているかもしれないその増幅産物）は、配列決定リードを生成するために配列決定反応にさらされる。そのような方法によって生成された配列決定リードは、本明細書で開示される他の方法と合わせて使用されてもよい。様々な配列決定方法、とりわけ、ハイスループットシーケンシング方法が利用可能である。例としては、限定されないが、Ｉｌｌｕｍｉｎａ（ＨｉＳｅｑ（登録商標）とＭｉＳｅｑ（登録商標）などの配列決定システム）、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＩｏｎＴｏｒｒｅｎｔ（登録商標）、ＳＯＬｉＤ（登録商標）など）、Ｒｏｃｈｅの４５４ＬｉｆｅＳｃｉｅｎｃｅｓｓｙｓｔｅｍｓ、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓｓｙｓｔｅｍｓなどによって製造された配列決定システムが挙げられる。いくつかの実施形態において、配列決定は、長さが約５０、７５、１００、１２５、１５０、１７５、２００、２５０、３００、またはそれ以上のヌクレオチドのリードを生成するためにＨｉＳｅｑ（登録商標）とＭｉＳｅｑ（登録商標）のシステムの使用を含む。いくつかの実施形態において、配列決定は合成プロセスによる配列決定を含み、個々のヌクレオチドは、成長しているプライマー伸長産物に追加されるにつれ、反復して同定される。パイロシークエンシングは、シーケンシング反応の副産物（すなわち、ピロリン酸塩）の存在について結果として生じる合成混合物をアッセイすることにより、ヌクレオチドの取り込みを同定する合成プロセスによる配列の例である。とりわけ、プライマー／鋳型／ポリメラーゼ複合体は単一のタイプのヌクレオチドに接触させる。そのヌクレオチドが取り込稀ない場合、重合反応は三リン酸鎖のαとβのリン酸塩間のヌクレオシド三リン酸を切断して、ピロリン酸塩を放出する。放出されたピロリン酸塩の存在は、ＡＭＰでピロリン酸塩をＡＴＰへ変換し、その後、測定可能な光信号を生成するためにルシフェラーゼ酵素を使用してＡＴＰを測定する、化学発光酵素レポーターシステムを使用して、同定される。光が検出される場合には塩基が取り込まれ、光が検出されない場合には塩基は取り込稀ない。適切な洗浄工程の後、様々な塩基を複合体に周期的に接触させることで、鋳型配列中の連続した塩基を連続して同定する。例えば、米国特許第６，２１０，８９１号を参照。

関連する配列決定プロセスでは、プライマー／鋳型／ポリメラーゼ複合体は基質で固定され、複合体は標識されたヌクレオチドに接触する。複合体の固定はプライマー配列、鋳型配列および／またはポリメラーゼ酵素によってなされることもあり、共有結合または非共有結合であってもよい。例えば、複合体の固定は、ポリメラーゼまたはプライマーと基質表面との間の結合を介することがある。代替的な配置では、ヌクレオチドは除去可能なターミネーター群とともに、または伴わずに提供される。取り込みの際、ラベルは複合体に接合するため、検出可能である。ヌクレオチドを有するターミネーターの場合、個々に同定可能なラベルを有する４つの異なるヌクレオチドはすべて複合体と接する。標識されたヌクレオチドの取り込みはターミネーターの存在によって伸長を阻止し、複合体に標識を加えて、取り込まれたヌクレオチドの同定を可能にする。その後、標識とターミネーターは取り込まれたヌクレオチドから除去され、適切な洗浄ステップの後、プロセスは反復される。非末端ヌクレオチドの場合には、単一のタイプの標識されたヌクレオチドが複合体に加えられることで、パイロシークエンシングでのように、それが取り込まれるかどうかを判定する。ヌクレオチドでの標識グループの除去と適切な洗浄工程の後、様々な異なるヌクレオチドは同じプロセス中で反応混合物によって循環される。例えば、すべての目的のために全体が引用により本明細書に組み込まれる米国特許第６，８３３，２４６号を参照。例えば、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒＳｙｓｔｅｍはＷＯ９８／４４１５１に記載される技術に基づいており、ＤＮＡ分子はアンカープローブ結合部位（他の方法ではフローセル結合部位と呼ばれる）によって配列決定プラットフォーム（フローセル）に結合され、スライドガラス上においてインサイツで増幅される。ＤＮＡ分子が増幅される固体表面は典型的には複数の第１と第２の結合されたオリゴヌクレオチドを含み、第１の結合されたオリゴヌクレオチドは標的ポリヌクレオチドの１つの末端の近くまたはその末端にある配列に相補的であり、第２の結合されたオリゴヌクレオチドは標的ポリヌクレオチドのもう一方の末端の近くまたはその末端にある配列に相補的である。この配置はＵＳ２０１４０１２１１１６に記載されるように、架橋の増幅を可能にする。その後、ＤＮＡ分子は配列決定プライマーにアニールされ、可逆的なターミネーターアプローチを使用して、塩基ごとに平行に配列決定される。配列決定プライマーのハイブリダイゼーションの前に、架橋を固定する結合されたオリゴヌクレオチドの１つにおいて切断部位の二本鎖架橋ポリヌクレオチドの１つの鎖の切断が先行することがあり、したがって、、１つの鎖を、変性により除去されることがある固体の基質には結合させず、もう一本の鎖を結合させて配列決定プライマーへのハイブリダイゼーションに利用可能なようにする。典型的には、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒＳｙｓｔｅｍは、８つのチャネルのフローセルを利用し、長さが１８〜３６の塩基の配列決定リードを生成し、実行するたびに＞１．３Ｇｂｐの高品質データを生成する（ｗｗｗ．ｉｌｌｕｍｉｎａ．ｃｏｍを参照）。

合成プロセスによるまたさらなる配列において、異なるように標識されたヌクレオチドの取り込みは、鋳型に依存した合成が行なわれるとリアルタイムで観察される。特に、蛍光標識されたヌクレオチドが取り込まれると、個々の固定されたプライマー／鋳型／ポリメラーゼ複合体が観察され、各々の追加された塩基のリアルタイムの同定が追加時に可能となる。このプロセスでは、標識グループは取り込みの間に切断されるヌクレオチドの一部に結合される。例えば、取り込みの間に除去されたリン酸塩鎖の一部、つまり、ヌクレオシドポリリン酸塩上のβ、γ、あるいは他の末端のリン酸基に、標識グループを接合することによって、標識は新生鎖には取り込まれず、その代わりに天然のＤＮＡが生成される。個々の分子についての観察は、典型的には非常に小さな照明量内での複合体の光閉じ込めを含む。光学的に複合体を閉じ込めることにより、当業者は、ランダムに拡散するヌクレオチドが非常に短い時間だけ存在する監視領域を作り、一方で、取り込まれたヌクレオチドは取り込まれるにつれてより長い間観察量内で保持される。これは取り込み事象に関連した特徴的なシグナルをもたらし、これも追加される塩基の特性であるシグナルプロフィールを特徴とする。関連する態様では、蛍光共鳴エネルギー移動（ＦＲＥＴ）色素対などの相互作用する標識成分は、ポリメラーゼあるいは複合体の他の部分、および取り込みヌクレオチドに提供され、取り込み事象が相互作用するほど標識成分を近接させるようになり、特徴的なシグナルが生じ、これも再度取り込まれる塩基の特徴である（例えば、米国特許番号６，９１７，７２６、７，０３３，７６４、７，０５２，８４７、７，０５６，６７６、７，１７０，０５０、７，３６１，４６６、および７，４１６，８４４；ならびに米国特許第２００７０１３４１２８を参照）。

いくつかの実施形態において、サンプル中の核酸はライゲーションによって配列決定可能である。例えば、ポロニー方法およびＳＯＬｉＤ技術（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ、今ではＩｎｖｉｔｒｏｇｅｎ）で使用されるように、この方法は、標的配列を同定するために典型的にはＤＮＡリガーゼ酵素を使用する。概して、固定長のあらゆる起こりうるオリゴヌクレオチドのプールは配列決定された位置に従って標識される。オリゴヌクレオチドはアニールされてライゲートされる；配列を一致させるためのＤＮＡリガーゼによる優先的なライゲーションは、その位置で相補的配列に対応するシグナルをもたらす。

いくつかの実施形態において、配列決定ライブラリは配列決定分析の前に増幅されたＤＮＡコンカテマーから構築される。増幅されたＤＮＡコンカテマーは、図１２のＡで例証されるように、同時に断片化され、配列決定アダプターでタグ付け可能である。場合によっては、増幅されたＤＮＡコンカテマーは、例えば、超音波処理によって断片化され、アダプターは、図１２のＢで例証されるように断片の両末端へ追加される。

いくつかの実施形態にしたがって、配列決定リードと参照配列との間の配列の差異は、少なくとも２つの様々なポリヌクレオチド（例えば、異なる接合部を有するため識別可能な２つの異なる環状ポリヌクレオチドで生じる場合に、純粋な配列変異体（例えば、増幅または配列決定の前のサンプル中で存在し、これらのプロセスのいずれかの結果ではない）とコールされる。増幅または配列決定の誤差の結果である配列変異体が同じ標的配列を含む２つの異なるポリヌクレオチド上では正確に（例えば、位置とタイプ）複製されない可能性他あるため、このバリデーションパラメータを追加することで、誤った配列変異体のバックグラウンドを大幅に減少させ、サンプル中の実際の配列変異を検出する感度と精度を同時に増大させる。いくつかの実施形態では、約５％、４％３％２％、１．５％、１％、０．７５％、０．５％、０．２５％、０．１％、０．０７５％、０．０５％、０．０４％、０．０３％、０．０２％、０．０１％、０．００５％、０．００１％、あるいはそれ以下の頻度を有する配列変異体は、正確なコールを可能にするほどバックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体は、約０．１％以下の頻度で生じる。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率（例えば、約０．０５、０．０１、０．００１、０．０００１以下のｐ値）を統計的に有意なほど上回る場合に、バックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率よりも約または少なくとも約２倍、３倍、４倍、５倍、６倍、７倍、８倍、９倍、１０倍、２５倍、５０倍、１００倍、またはそれ以上である場合に、バックグラウンドよりも十分に高い（例えば、少なくとも５倍高い）。いくつかの実施形態において、所定の位置で配列を正確に決定する際のバックグラウンド誤差率は、約１％、０．５％０．１％、０．０５％、０．０１％、０．００５％、０．００１％、０．０００５％以下である。いくつかの実施形態では、誤差率は０．００１％よりも低い。

いくつかの実施形態において、純粋な配列変異体を同定する（「コールする（ｃａｌｌｉｎｇ）または（ｍａｋｉｎｇａｃａｌｌ）」とも呼ばれる）ことは、２つの間の差を同定するために、および、接合部を同定するために参照配列に１つ以上の配列決定リードを最適にアラインすることを含む。概して、アラインメントは、１つの配列を別の配列に沿って置き、各配列に沿ってギャップを反復して導入し、２つの配列がどれくらいよく一致しているかスコア化し、参照配列に沿って様々な位置について好ましくは反復することを含む。最良のスコアの一致がアラインメントであると思われ、配列間の関係の程度に関する推論を表している。いくつかの実施形態において、配列決定リードが比較される参照配列は、被験体と同じ種のメンバーのゲノムなどの参照ゲノムである。参照ゲノムは完全なこともあれば不完全なこともある。いくつかの実施形態において、参照ゲノムは、参照ゲノムから、あるいは分析中の配列決定リードから生成されたコンセンサスからなど、標的ポリヌクレオチドを含む領域のみからなる。いくつかの実施形態において、参照配列は、１つ以上の細菌、古細菌、ウイルス、原生生物、菌類あるいはその他の生物からの配列など、１つ以上の生物のポリヌクレオチドの配列を含み、または該配列からなる。いくつかの実施形態において、参照配列は、分析中の１つ以上の標的配列に対応する領域（例えば１つ以上の遺伝子あるいはその一部）などの参照ゲノムの一部のみからなる。例えば、（汚染検出の場合などでは）病原体の検出のために、参照ゲノムは、特定の株または血清型のなどの特定で役立つ、病原体（例えば、ＨＩＶ、ＨＰＶ、あるいは有害な菌株、例えば、大腸菌）の全ゲノムあるいはその一部である。いくつかの実施形態において、複数の様々な生物あるいは菌株についてスクリーニングするなどのために、配列決定リードは複数の様々な参照配列にアラインされる。

典型的なアラインメントでは、参照配列中の一致しない塩基の側の配列決定リード中の塩基は、置換突然変異がその時点で生じたことを示す。同様に、１つの配列が別の配列の塩基のそばにギャップが含む場合、挿入または欠失の突然変異（「インデル」）が生じたと推論される。１つの配列がもう１つの配列にアラインされていることを明示することが望ましい場合、アラインメントはしばしば対でのアラインメントと呼ばれる。多くの配列アラインメントは通常、例えば、一連の対でのアラインメントによるものを含む、２つ以上の配列のアラインメントを指す。いくつかの実施形態において、アラインメントのスコア化は、置換とインデルの可能性について設定された値を含む。個々の塩基がアラインされる場合、マッチまたはミスマッチは置換確率によるアラインメントスコアに寄与し、これは、例えば、マッチで１、ミスマッチで０．３３となり得る。インデルはギャップペナルティによってアラインメントスコアから差し引かれ、これは例えば−１であり得る。ギャップペナルティおよび置換確率は、配列がどのように変化するかに関する経験的知識または演繹的な仮定に基づくことがある。その値は結果として生じるアラインメントに影響を与える。アラインメントを実施するためのアルゴリズムの例としては、限定されないが、Ｓｍｉｔｈ−Ｗａｔｅｒｍａｎ（ＳＷ）アルゴリズム、Ｎｅｅｄｌｅｍａｎ−Ｗｕｎｓｃｈ（ＮＷ）アルゴリズム、Ｂｕｒｒｏｗｓ−ＷｈｅｅｌｅｒＴｒａｎｓｆｏｒｍ（ＢＷＴ）に基づくアルゴリズム、および、Ｎｏｖｏａｌｉｇｎ（ＮｏｖｏｃｒａｆｔＴｅｃｈｎｏｌｏｇｉｅｓ；ｗｗｗ．ｎｏｖｏｃｒａｆｔ．ｃｏｍで入手可能），ＥＬＡＮＤ（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．），ＳＯＡＰ（ｓｏａｐ．ｇｅｎｏｍｉｃｓ．ｏｒｇ．ｃｎで入手可能）、ならびに、Ｍａｑ（ｍａｑ．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔで入手可能）などのハッシュ関数アライナーが挙げられる。ＢＷＴアプローチを実行する１つの例示的なアラインメントプログラムは、Ｇｅｅｋｎｅｔ（Ｆａｉｒｆａｘ、Ｖａ。）によって維持されるＳｏｕｒｃｅＦｏｒｇｅウェブサイトから利用可能なＢｕｒｒｏｗｓ−ＷｈｅｅｌｅｒＡｌｉｇｎｅｒ（ＢＷＡ）である。ＢＷＴは典型的には１つのヌクレオチド当たりの２ビットのメモリを占め、典型的なデスクトップまたはラップトップコンピュータを用いて４Ｇ塩基対ほどの長さのヌクレオチド配列にインデックスを付けることを可能にする。前処理は、ＢＷＴ（つまり、参照にインデックスを付ける）の構築と、予備の支持データ構造を含む。ＢＷＡは両方ともＢＷＴに基づく２つの異なるアルゴリズムを含む。ＢＷＡによるアラインメントは、アルゴリズムｂｗａ−ｓｈｏｒｔを用いて処理され、低い誤差率（＜３％）で最大約２００までの短いクエリのために設計可能である（ＬｉＨ．ａｎｄＤｕｒｂｉｎＲ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２５：１７５４−６０（２００９））。第２のアルゴリズムＢＷＡ−ＳＷは、より誤差が多く長いリード向けに設計されている（ＬｉＨ．ａｎｄＤｕｒｂｉｎＲ．（２０１０）．Ｆａｓｔａｎｄａｃｃｕｒａｔｅｌｏｎｇ−ｒｅａｄａｌｉｇｎｍｅｎｔｗｉｔｈＢｕｒｒｏｗｓ−ＷｈｅｅｌｅｒＴｒａｎｓｆｏｒｍ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，Ｅｐｕｂ．）。ｂｗａ−ｓｗアライナーはしばしば「ｂｗａ−ｌｏｎｇ」、「ｂｗａｌｏｎｇアルゴリズム」、あるいは類似したように呼ばれる。Ｓｍｉｔｈ−Ｗａｔｅｒｍａｎアルゴリズムのあるバージョンを実行するアラインメントプログラムがＭＵＭｍｅｒであり、Ｇｅｅｋｎｅｔ（Ｆａｉｒｆａｘ、Ｖａ．）によって維持されるＳｏｕｒｃｅＦｏｒｇｅウェブサイトから入手可能である。ＭＵＭｍｅｒは、完全な形態であろうとドラフト形態であろうと、全ゲノムを迅速にアラインするためのシステムである（Ｋｕｒｔｚ，Ｓ．，ｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌｏｇｙ，５：Ｒ１２（２００４）；Ｄｅｌｃｈｅｒ，Ａ．Ｌ．，ｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．，２７：１１（１９９９））。例えば、ＭＵＭｍｅｒ３．０は、２．４ＧＨｚのリナックス（登録商標）のデスクトップコンピュータ上で、７８ＭＢのメモリを使用して、１３．７秒で１対の５−メガベースのゲノム間でのすべての２０以上の塩基対またはそれ以上の正確なマッチを見つけることができる。ＭＵＭｍｅｒはさらに不完全なゲノムをアラインすることができる；これは、ショットガン配列決定プロジェクトからの数百または数千のコンティグを取り扱うことができ、システムに含まれるＮＵＣｍｅｒプログラムを使用して、コンティグまたはゲノムの別のセットにそれらをアラインする。アラインメントプログラムの他の非限定的な例は以下を含む：ＫｅｎｔＩｎｆｏｒｍａｔｉｃｓ（ＳａｎｔａＣｒｕｚ，Ｃａｌｉｆ．）からのＢＬＡＴ（Ｋｅｎｔ，Ｗ．Ｊ．，ＧｅｎｏｍｅＲｅｓｅａｒｃｈ４：６５６−６６４（２００２））；ＢｅｉｊｉｎｇＧｅｎｏｍｉｃｓＩｎｓｔｉｔｕｔｅ（Ｂｅｉｊｉｎｇ，Ｃｏｎｎ．）ｏｒＢＧＩＡｍｅｒｉｃａｓＣｏｒｐｏｒａｔｉｏｎ（Ｃａｍｂｒｉｄｇｅ，Ｍａｓｓ．）からのＳＯＡＰ２；Ｂｏｗｔｉｅ（Ｌａｎｇｍｅａｄ，ｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌｏｇｙ，１０：Ｒ２５（２００９））；ＥｆｆｉｃｉｅｎｔＬａｒｇｅ−ＳｃａｌｅＡｌｉｇｎｍｅｎｔｏｆＮｕｃｌｅｏｔｉｄｅＤａｔａｂａｓｅｓ（ＥＬＡＮＤ）ｏｒｔｈｅＥＬＡＮＤｖ２ｃｏｍｐｏｎｅｎｔｏｆｔｈｅＣｏｎｓｅｎｓｕｓＡｓｓｅｓｓｍｅｎｔｏｆＳｅｑｕｅｎｃｅａｎｄＶａｒｉａｔｉｏｎ（ＣＡＳＡＶＡ）ｓｏｆｔｗａｒｅ（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．）；ＲｅａｌＴｉｍｅＧｅｎｏｍｉｃｓ，Ｉｎｃ．（ＳａｎＦｒａｎｃｉｓｃｏ，Ｃａｌｉｆ．）からのＲＴＧＩｎｖｅｓｔｉｇａｔｏｒ；Ｎｏｖｏｃｒａｆｔ（Ｓｅｌａｎｇｏｒ，Ｍａｌａｙｓｉａ）からのＮｏｖｏａｌｉｇｎ；Ｅｘｏｎｅｒａｔｅ，ＥｕｒｏｐｅａｎＢｉｏｉｎｆｏｒｍａｔｉｃｓＩｎｓｔｉｔｕｔｅ（Ｈｉｎｘｔｏｎ，ＵＫ）（Ｓｌａｔｅｒ，Ｇ．，ａｎｄＢｉｒｎｅｙ，Ｅ．，ＢＭＣＢｉｏｉｎｆｏｒｍａｔｉｃｓ６：３１（２００５）），ＣｌｕｓｔａｌＯｍｅｇａ，ｆｒｏｍＵｎｉｖｅｒｓｉｔｙＣｏｌｌｅｇｅＤｕｂｌｉｎ（Ｄｕｂｌｉｎ，Ｉｒｅｌａｎｄ）（ＳｉｅｖｅｒｓＦ．，ｅｔａｌ．，ＭｏｌＳｙｓｔＢｉｏｌ７，ａｒｔｉｃｌｅ５３９（２０１１））；ＣｌｕｓｔａｌＷｏｒＣｌｕｓｔａｌＸｆｒｏｍＵｎｉｖｅｒｓｉｔｙＣｏｌｌｅｇｅＤｕｂｌｉｎ（Ｄｕｂｌｉｎ，Ｉｒｅｌａｎｄ）（ＬａｒｋｉｎＭ．Ａ．，ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２３，２９４７−２９４８（２００７））；ａｎｄＦＡＳＴＡ，ＥｕｒｏｐｅａｎＢｉｏｉｎｆｏｒｍａｔｉｃｓＩｎｓｔｉｔｕｔｅ（Ｈｉｎｘｔｏｎ，ＵＫ）（ＰｅａｒｓｏｎＷ．Ｒ．，ｅｔａｌ．，ＰＮＡＳ８５（８）：２４４４−８（１９８８）；Ｌｉｐｍａｎ，Ｄ．Ｊ．，Ｓｃｉｅｎｃｅ２２７（４６９３）：１４３５−４１（１９８５））．

いくつかの実施形態に係るプロセスの実例が図３６Ａ−Ｈで提供され、とりわけ、３’尾部付加（ｔａｉｌｉｎｇ）反応を使用する実施形態に対して提供される。図３６Ａは、サンプルの無細胞の二本鎖ポリヌクレオチド１、２、３…Ｋ（１０１）を示し、これらの各々は「Ｇ」あるいは稀な変異体「Ａ」によって占められ得る単一のヌクレオチドからなる遺伝子座（１００）を含む。こうしたポリヌクレオチドを含むサンプルは、血液または血漿のサンプルなどの患者組織サンプルであってもよい。典型的には、（例えば、ヒトゲノムデータベース中の）参照配列は、ポリヌクレオチド配列と比較するのに利用可能である。各々のポリヌクレオチドは各末端に２つの相補鎖の配列に対応する４つの配列領域を有する。したがって、例えば、図３６Ａの標的ポリヌクレオチド１は鎖の各末端に配列領域ｎ１（１１０）およびｎ２（１１２）を有し、相補鎖（１２０）の末端に相補的配列領域ｎ１’（１１６）とｎ２’（１０８）を有する。様々なポリヌクレオチド鎖の配列領域は鎖の小さな部分として例証されているが、配列領域は鎖の末端から遺伝子座（１００）への全セグメントを含み得る。

いくつかの実施形態において、１つ以上のＡ’で３’末端を伸長する尾部付加反応（１２５）を実行するために、核酸単量体および／または他の反応成分に沿って３’尾部付加活性がサンプルの標的ポリヌクレオチドに追加される。この実施形態では、あらかじめ定められたヌクレオチドの伸長は、「Ａ…Ａ」として示され、１つ以上のヌクレオチドが追加されるか、あるいは、各鎖へ追加される正確な数が決定されないことがある（以下に注記されるように、エキソ−ポリメラーゼが使用されなければ）ことを示唆している。「Ａ…Ａ」による追加されたヌクレオチドの表現は、追加されたヌクレオチドの種類をＡだけに制限しようとするものではない。尾部付加反応で使用されたヌクレオチド前駆体の種類が既知であり、アッセイ設計選択として選択されるという意味で、追加されたヌクレオチドはあらかじめ決められる。例えば、特定の実施形態のあらかじめ定められたヌクレオチドの種類の選別における因子は、選択されたヌクレオチドの種類の点から見て環状化工程の効率であることがある。いくつかの実施形態において、ヌクレオチド前駆体は、別々に、４つのヌクレオチドのいずれかのヌクレオシド三リン酸であってもよく、その結果、ホモポリマー尾部が生成されるか、あるいは混合物であり、その結果、ｂｉ−ヌクレオチド尾部あるいはトリ−ヌクレオチド尾部が生成される。場合によっては、ウラシル、および／またはヌクレオチドアナログは、４つの天然のＤＮＡ塩基に加えて、あるいはその代わりに使用されてもよい。ＣｉｒｃＬｉｇａｓｅ（商標）酵素が用いられているいくつかの実施形態において、あらかじめ定められたヌクレオチドはＡ’および／またはＴ’であってもよい。いくつかの実施形態において、エキソ−ポリメラーゼは尾部付加反応で使用され、単一のデオキシアデニル酸だけが３’末端へ追加される。

尾部付加後、および反応混合物からの反応産物の随意の分離後、個々の鎖は、図３６Ｂで示されるように、環（１３２）を生成するために環状化反応を使用して環状化され、各々は「ｎｊ−Ａ…Ａ−ｎｊ＋１」（１３３）の形態の配列要素を含む。環状化の後、および反応混合物からの環（１３２）の随意の分離後、プライマー（１３４）は環（１３２）の１つ以上のプライマー結合部位にアニールされ、その後、それらは伸長されることで、図３６Ｅで例証されるように、それぞれのｎｊ−Ａ…Ａ−ｎｊ＋１配列要素のコピーを各々が含むコンカテマーが生成される。配列決定の後、（１３６）と（１３８）などの相補鎖は、配列要素成分ｎｊとｎｊ＋１を、そのそれぞれの補体ｎｊ’とｎｊ＋１’に一致させることによって同定されることがある。環（１３２）上のプライマー結合部位の選別は、設計選択の問題であり、あるいは、代替的に、ランダムな配列プライマーが使用されてもよい。いくつかの実施形態において、単一のプライマー結合部位は遺伝子座（１００）に隣接して選択される；他の実施形態では、複数のプライマー結合部位は、たとえ境界がプライマー結合部位の１つで偶然生じたとしても確実に増幅をもたらすように、別々のプライマーに各々が選択される。いくつかの実施形態において、別々のプライマー結合部位を有する２つのプライマーがコンカテマーを生成するために使用される。

相補鎖を含む対のコンカテマーの同定後、コンカテマー配列はアラインされてもよく、２つの鎖の位置の一致する位置にある塩基コールが比較されることがある。コンカテマー対のいくつかの位置では、図３６Ｆで（１４０）によって例証されるように、ある対の１つメンバーの所定の位置においてコールされた塩基は、その対の別のメンバー上でコールされた塩基と相補的ではないことがあり、このことは、例えば、増幅誤差、配列決定誤差などによって不正確なコールが行われたことを示す。この場合、所定の位置での不確定性は、コンカテマー対内の他のコピーの対応する位置での塩基コールを調べることにより解決することもある。例えば、所定の位置での塩基コールは、１対のコンカテマー中の個々のコピーについて行われた塩基コールと一致し、またはほぼ一致するように得られることがある。こうした決定を下す他の方法は当業者に利用可能であり、これは、相補鎖間の配列情報が相補的でないときに、塩基コールを解決しようとする努力を補うためのこれらの方法の代わりに、または上記方法に加えて、用いられてもよい。場合によっては、（例えば、３’および５’の末端の配列によって同定されるように）同じ二本鎖分子から始まる相補鎖中の特定の位置の塩基が相補的でない場合、塩基コールはサンプル配列が比較される参照配列を支持して解決され、その違いがそのような参照配列に対して真の配列変異体として同定されないようになる。

他の状況では、図３６Ｇで（１４５）によって例証されるように、同じ誤差がコンカテマー内の標的ポリヌクレオチドの各コピーで現れてもよい。こうしたデータは、標的ポリヌクレオチドが増幅または配列決定の前に破損されたことを示唆することになる。

さらに別の状況では、単一のコンカテマーだけが同定されることがある；すなわち、あらかじめ定められたヌクレオチドのセグメントの長さ、隣接する３’と５’末端の配列など境界情報に基づいてマッチが発見されないコンカテマー。このような状況が図３７ＡとＢで例証される。ここで、標的ポリヌクレオチド（２０１）は、一本鎖ポリヌクレオチド１と二本差ポリヌクレオチド２を含み、各々は遺伝子座（２００）を包含する。あらかじめ定められたヌクレオチド（例えば、アデニレート）は、３’尾部付加ポリヌクレオチド（２２０）を形成するために尾部付加反応（２２５）中の両方のポリヌクレオチド１および２に結合されてもよい。上に記載されたように、その後、ポリヌクレオチド（２２０）は環状化され、ＲＣＡによって増幅され、および配列決定されることで、図３７Ｂで示されるコンカテマー配列（２３０）が得られることもある。観察された変異体がＤＮＡ損傷において共通する（例えば、Ｃ対ＴまたはＧ対Ｔ）場合、対のないコンカテマーからのそうした情報は、それが真の突然変異対単なるＤＮＡ損傷かどうか決定する際に依然として役に立つ。

いくつかの実施形態において、図３６ＣおよびＤで例証されるように、各々が分子タグ、例えば、ＭＴ１（１５０）、ＭＴ２などを含むプライマーは、各々が特有のタグを有するコンカテマーを生成するためにあらかじめ定められたプライマー結合部位でそれぞれの一本鎖の環にアニールされることがある。特有の分子タグの存在は、同じ境界あるいはｎｊ−Ａ…Ａ−ｎｊ＋１配列要素を偶然有する一本鎖の環の産物を識別する。こうしたタグも、例えば、参照により本明細書に組み込まれるＢｒｅｎｎｅｒｅｔａｌ、米国特許７，５３７，８９７号などに記載される方法に従って、遺伝子座でコピー数の変動を決定するべく分子を数えるために使用されてもよい。いくつかの実施形態において、分子タグを有するコンカテマーが標的ポリヌクレオチドの２つの鎖の１つだけを表すように、標的ポリヌクレオチドの１つの鎖のみに結合部位を有する分子タグを備えたプライマーが選択されてもよい。他の実施形態では、標的ポリヌクレオチドの相補鎖の環は各々、分子タグを有するプライマーを使用して増幅されてもよい（図３６Ｃで示されるように）。

いくつかの実施形態において、標的ポリヌクレオチドの相補鎖を同定するための上記の工程は、遺伝子座で稀な変異体を検出する方法に取り込まれてもよい。いくつかの実施形態では、上記方法は以下の工程を含む：（ａ）ポリヌクレオチドの３’末端を１つ以上のあらかじめ定められたヌクレオチドだけ伸長する工程と、（ｂ）一本鎖ポリヌクレオチド環を形成するためにポリヌクレオチドの個々の鎖を環状化する工程であって、１つ以上のあらかじめ定められたヌクレオチドが、それぞれの一本鎖ポリヌクレオチド環の３’配列と５’配列との間の境界を定義する、工程と、（ｃ）コンカテマーを形成するために、ローリングサークル複製（ＲＣＲ）によって一本鎖ポリヌクレオチド環を増幅する工程と、（ｄ）コンカテマーを配列決定する工程と、（ｅ）１つ以上のあらかじめ定められたヌクレオチドに隣接する３’配列と５’配列を同定することによって、ポリヌクレオチドの相補鎖を含むコンカテマーの対を同定する工程と、（ｆ）同じポリヌクレオチドの相補鎖を含む対のコンカテマーの配列から遺伝子座の配列を決定する工程。他の実施形態では、ＲＣＲによって一本鎖の環を増幅する工程は、一本鎖の環に対して５’−非相補的な尾部を有するプライマーをアニールする工程であって、そのようなプライマーが５’−非相補的な尾部中に特有の分子タグを含む、工程と、ＲＣＲプロトコルにしたがって上記プライマーを伸長する工程とを含む。結果として生じる産物は特有の分子タグを含むコンカテマーであり、これは、遺伝子座のコピー数測定をもたらすために同じ遺伝子座からの環に結合した他の分子タグと共に数えられてもよい。

いくつかの実施形態において、伸長する工程は、尾部付加反応中のポリヌクレオチドの３’末端を、１つ以上のあらかじめ定められたヌクレオチドだけ尾部付加することにより実行されてもよい。いくつかの実施形態において、こうした尾部付加は、ＴｄＴ活性、エキソ−ポリメラーゼ活性などの非鋳型（ｕｎｔｅｍｐｌａｔｅｄ）３’ヌクレオチド追加活性によって実行されてもよい。

上に記載された工程を使用して、コンカテマー配列はポリヌクレオチド配列から同定可能である。大規模並列配列決定（「次世代シーケンシング」あるいはＮＧＳとも呼ばれる）では、コンカテマーを含むリードを同定および使用して、誤差修正を実施し、かつ配列変異体を見つけることができる。元々の入力分子の接合部（ＤＮＡ／ＲＮＡ配列の始まりと終わり）は、参照配列にコンカテマーをアラインすることによりコンカテマーから再構築可能である。そして、その接合部を用いて、元々の入力分子を同定し、かつより正確な計測のために配列決定の重複を取り除くことができる。コンカテマーを含み得る各リードの鎖同一性は、リードを参照配列へアラインし、図３６Ａに記載されるように、配列要素成分ｎｊとｎｊ＋１をチェックすることにより計算可能である。相補鎖として標識された両方のコンカテマーで見られる変異体は、高い統計信頼度を備えており、これを用いてさらなる誤差修正を実施することができる。鎖同一性を使用する変異体確認は、（限定されないが）以下の工程によって行われてもよい：ａ）相補鎖同一性を有するリードで見られる変異体は、より信頼度が高いと考えられる；ｂ）変異体を運ぶリードはその接合部の同定によって分類可能であり、相補鎖同一性が同じ接合部の同定を有するリードのグループ内のリードで見られる場合、変異体はより信頼度が高い；ｃ）変異体を運ぶリードは、その分子バーコード、またはその分子バーコードと接合部の同定の組み合わせによって分類可能である。相補性鎖の同一性が同じ分子バーコードおよび／または接合部の同定を有するリードのグループ内のリードで見られる場合、変異体はより信頼度が高い。

分子バーコードおよび接合部の同定を使用する誤差修正は、独立的に使用可能であるか、あるいは前の工程で記載されるようなコンカテマー配列決定との誤差修正と組み合わせることができる。ａ）様々な分子バーコード（あるいは接合部同定）を有するリードは、様々な入力分子に由来するリードを表す様々なリードファミリーへ分類可能である；ｂ）コンセンサス配列はリードのファミリーから構築可能である；ｃ）コンセンサスは変異コールに使用可能である；ｄ）分子バーコードおよび接合部同定を組み合わせてリード用の合成ＩＤを形成することができ、これは元々の入力分子を同定するのを助ける。いくつかの実施形態において、様々なリードファミリーで見られる塩基コール（例えば、参照配列に対する配列の差異）には、より高い信頼度が与えられる。場合によっては、配列の差異は、上に記載されたような塩基コールの信頼度を高める１つ以上のフィルタを通ると、（サンプル処理あるいは分析の誤差に対立するものとして）元々のソースのポリヌクレオチドを表す真の配列変異体として同定される。いくつかの実施形態において、配列の差異は、もし、（ａ）配列の差異が二本鎖入力分子の両方の鎖上で同定され、（ｂ）配列の差異が由来するコンカテマーのためのコンセンサス配列で生じ（例えば、コンカテマー内の反復の５０％、８０％、あるいは９０％以上は配列の差異を含む）、および／または、（ｃ）配列の差異が２つの異なる分子で生じる（例えば、異なる３’と５’のエンドポイントによって、および／または外因性のタグ配列によって同定されるように）ときに、真の配列変異体としてのみ同定される。

鎖同一性の決定：１）元々の入力分子の接合部は、参照配列へ配列をアラインすることによりコンカテマー配列を含み得るリードから再構築可能である；２）アラインメントを使用して接合部をリードに位置付けることができる；３）鎖同一性を表わす配列要素成分ｎｊとｎｊ＋１は、図３６Ａに記載されるように、リード中の接合部位置に基づいて配列から抽出可能である；および、コンカテマーの場合には、配列は、コンカテマー配列中の接合部間で見られることがある；４）工程３で同定されたリード内の鎖同一性配列と組み合わされて、リードがアラインされる参照配列の鎖（正または負）を用いて、配列ライブラリへ取り込まれ配列決定された元々の鎖をもとの鎖を同定し、かつ、配列変異体が由来する元の鎖を同定することができる。例えば、元々の入力ＤＮＡ断片の鎖の末端へ鎖同一性配列「ＡＡ」が追加されると仮定する；配列決定後、ＤＮＡ断片のリードは参照配列の「＋」鎖へアラインされ、リード中の鎖同一性配列は「ＡＡ」であり、我々は元々の入力鎖が「＋」であることを知っている；鎖同一性配列が「ＴＴ」である場合、リードは元々の入力鎖に対して逆相補性であり、および元々の入力鎖は「−」鎖である。鎖同一性決定により、配列変異体を、その逆相補性対応物と区別し、例えば、Ｃ＞Ｔ置換を、Ｇ＞Ａ置換と区別することが可能となる。対立遺伝子の変化の正確な同定を用いて、変異コールにおける対立遺伝子に特有の誤差低減を実行することができる。例えば、ある対立遺伝子が変化するにつれてＤＮＡ損傷がしばしば生じ、対立遺伝子に特有の誤差低減はこうした損傷を抑えるために実行可能である；そのような誤差低減は、例えば、１）配列決定データ（ベースライン）の様々な対立遺伝子変化の分布の計算と、その後の、２）観察された対立遺伝子の変化がベースライン分布とは異なるか否かを決定するためのｚ−検定あるいは他の統計的検定によって、行うことができる。

いくつかの実施形態において、本開示は、測定された配列、または、１つ以上のヌクレオチドの頻度を、測定された配列と同じ配列、または１つ以上のヌクレオチドを結果として生じるヌクレオチド損傷のベースライン頻度と比較することにより、遺伝子座での特定の鎖上で遺伝子変異体を同定する方法を提供する。いくつかの実施形態では、上記方法は以下の工程を含み得る：（ａ）ポリヌクレオチドの３’末端を１つ以上のあらかじめ定められたヌクレオチドだけ伸長する工程と、（ｂ）伸長したポリヌクレオチドの個々の鎖を増幅する工程と、（ｃ）伸長したポリヌクレオチドの増幅された個々の鎖を配列決定する工程と、（ｄ）１つ以上のあらかじめ定められたヌクレオチドに隣接する３’配列および／または５’配列の同一性によってポリヌクレオチドの相補鎖を同定し、および、遺伝子座で各鎖のヌクレオチドを同定する工程と、（ｅ）遺伝子変異体を同定するために同定されたコンカテマーからの遺伝子座の１つ以上のヌクレオチドの各々の頻度を決定する工程。いくつかの実施形態において、この方法は、以下の工程によって、遺伝子変異体を、ヌクレオチド損傷と区別するために使用されてもよい：少なくとも１つのヌクレオチドを表示する鎖の上記頻度が、あらかじめ定められた因子によって、同じヌクレオチドを生じさせるヌクレオチド損傷を有する鎖のベースライン頻度を超える場合は常に、１つ以上のあらかじめ定められたヌクレオチドによって上記遺伝子変異体として同定された上記鎖の上での上記遺伝子座で上記１つ以上のヌクレオチドの少なくとも１つをコールする工程。

上に言及されるように、いくつかの実施形態では、増幅する工程は、（ｉ）一本鎖ポリヌクレオチド環を形成するためにポリヌクレオチドの個々の鎖を環状化する工程であって、１つ以上のあらかじめ定められたヌクレオチドが、それぞれの一本鎖ポリヌクレオチド環のポリヌクレオチドの３’配列と５’配列との間の境界を定義する、工程と、（ｉｉ）一本鎖ポリヌクレオチド環のコンカテマーを形成するために、ローリングサークル複製によって一本鎖ポリヌクレオチド環を増幅する工程によって実行される。

ヌクレオチド損傷を有する鎖のベースライン頻度は、上記方法によって試験されている同じ個体からのサンプルの以前の測定に基づくこともあれば、ベースライン頻度は、試験されている個体以外の個体の集団の以前の測定に基づくこともある。ベースライン頻度はさらに、本開示の方法による分析のためにサンプルを調製する際に使用される工程またはプロトコルの種類に依存し、および／または特有であってもよい。測定された頻度をベースライン頻度と比較することによって、統計的尺度は、測定または決定された配列が純粋な遺伝子変異体であり、損傷でも処理による誤差でもないという可能性（あるいは信頼度）で得られることがある。

典型的には、配列決定データは大規模並列配列決定反応から獲得される。他のフォーマットが使用されることもあるが、次世代ハイスループットシーケンシングシステムの多くはＦＡＳＴＱファイルとしてデータをエクスポートする。いくつかの実施形態において、配列は典型的には配列アラインメントによって、反復単位長さ（例えば、単量体長さ）、環状化によって形成された接合部、および参照配列に対する任意の真の変化を同定するように分析される。反復単位長さの同定は、反復単位の領域を計算すること、参照遺伝子座（例えば、１つ以上の配列が増幅、富化、および／または配列決定とりわけ対象としているとき）、個々の反復された領域の境界、および／または、各々の配列決定実行内での反復の数を発見することを含む。配列分析は、二重鎖の両方の鎖に関する配列データを分析することを含む。上で明記されるように、いくつかの実施形態では、サンプル（例えば、異なる接合部を有する環状化したポリヌクレオチド）からの異なるポリヌクレオチドのリードの配列のように見える同一の変異体は、確認された変異体であるとみなされる。いくつかの実施形態において、配列変異体は、同じポリヌクレオチドの１つを超える反復単位で生じた場合に、確認された、または、真の変異体であるとみなされることもある。なぜなら、同じ配列変異は同じコンカテマー内の反復された標的配列の同じ位置で同様に生じる可能性が低いからである。配列の品質スコアは、変異体や確認された変異体を同定する際に考慮されることも有り、例えば、閾値よりも低い品質スコアの配列と塩基は除外されることもある。他の生物情報科学的方法を用いて、変異コールの感度と特異性を増大させることができる。

いくつかの実施形態において、統計的分析は変異体（突然変異）の決定に適用されてもよく、完全なＤＮＡサンプル中の変異体の比率を定量化することもある。特定の塩基の完全な測定は配列決定データを使用して計算可能である。例えば、以前の工程で計算されたアラインメント結果から、「有効なリード」の数、すなわち、各遺伝子座の確認されたリードの数を計算することができる。変異体の対立遺伝子頻度は、遺伝子座のための有効なリード数によって正規化可能である。すべての遺伝子座で観察された変異体の平均的な割合である全体的なノイズレベルを計算することができる。他の因子と組み合わせた変異体の頻度および全体的なノイズレベルは、変異コールの信頼区間を決定するために使用することができる。ポアソン分布などの統計モデルは変異コールの信頼区間を評価するために使用することができる。変異体の対立遺伝子頻度も、完全なサンプル中の変異体の相対的な量のインジケータとして使用することができる。

いくつかの実施形態において、微生物汚染物質はコール工程に基づいて同定される。例えば、特定の配列変異体は、潜在的に感染性の微生物によって汚染を示すことがある。配列変異体は微生物を同定する目的で高度に保存されたポリヌクレオチド内で同定されることがある。微生物の系統発生的な特徴づけと同定に役立つ例示的な高度に保存されたポリヌクレオチドは、１６ＳｒＲＮＡ遺伝子、２３ＳｒＲＮＡ遺伝子、５ＳｒＲＮＡ遺伝子、５．８ＳｒＲＮＡ遺伝子、１２ＳｒＲＮＡ遺伝子、１８ＳｒＲＮＡ遺伝子、２８ＳｒＲＮＡ遺伝子、ｇｙｒＢ遺伝子、ｒｐｏＢ遺伝子、ｆｕｓＡ遺伝子、ｒｅｃＡ遺伝子、ｃｏｘｌ遺伝子、およびｎｉｆＤ遺伝子で見られるヌクレオチド配列を含む。真核生物では、ｒＲＮＡ遺伝子は、核、ミトコンドリア、あるいはその両方であり得る。いくつかの実施形態において、１６Ｓ−２３ＳｒＲＮＡ遺伝子内部転写スペーサー（ＩＴＳ）中の配列変異体は、他のｒＲＮＡ遺伝子を用いて、または、用いずに、密接に関連する分類群の分化と同定に使用可能である。１６ＳｒＲＮＡの構造的な制約により、非構造的なセグメントは高い変動率を有することがあるが、遺伝子全体にわたる特定の範囲には高度に保存されたポリヌクレオチド配列がある。配列変異体の同定を用いて、亜属、属、亜科、科、亜目、目、亜綱、綱、亜門、門、亜界、あるいは界を表す操作的分類単位（ＯＴＵ）を同定し、随意に集団中のそれらの頻度を決定することができる。特定の配列変異体の検出は、汚染を示す微生物の存在および随意に量（相対的または絶対的）の検出に使用することができる。例となる用途は、糞便または他の汚染向けの水質試験、動物またはヒトの病原体のための試験、水質汚染の源を正確に示すこと、再生水または回収水の試験、海洋放水上昇流を含む下水放水流の試験、病原体に関する水産養殖施設の監視、海岸、遊泳領域、または他の水に関連するレクリエーション施設の監視、および藻類ブルームの予測を含む。食物監視の用途は、食品加工工場の生産ラインの周期的な試験、屠畜場の調査、レストラン、病院、学校、刑務所のキッチンと食品貯蔵領域の検査、および、大腸菌株Ｏ１５７：Ｈ７あるいはＯ１１１：Ｂ４、リステリア菌、腸炎菌（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａｓｕｂｓｐ．ｅｎｔｅｒｉｃａｓｅｒｏｖａｒＥｎｔｅｒｉｔｉｄｉｓ）などのそれ以外の食品媒介病原体の機関を含む。甲殻類および水を生成する甲殻類は、麻ひ性貝中毒、神経毒性貝中毒、下痢性貝中毒、および健忘性貝中毒に関与する藻類について調査され得る。さらに、輸入食料品は、食糧の安全性を確実に保障するために放出前の関税で選別可能である。植物病原体の監視用途は、園芸および育児室の監視（例えば、Ｐｈｙｔｏｐｈｔｈｏｒａｒａｍｏｒｕｍの監視、サドンオークデス（ＳｕｄｄｅｎＯａｋＤｅａｔｈ）に関与する微生物、作物病原体の監視と疾病管理、および森林の病原体監視と疾病管理を含む。微生物汚染が安全性に対する大きな懸念である場合、医薬品、医療機器、および他の消耗品または重大な成分の生産環境は、緑膿菌または黄色ブドウ球菌などの特定の病原体の存在、ヒトに関連するもっと一般的な微生物、その特定の環境または類似する環境で以前に同定されたバイオバーデンを表す水またはそれ以外のものの存在に関連する微生物の存在について、調査可能である。同様に、宇宙船を含む高精度の装置のための構造および組み立て領域は、生息することが知られている、または、そのような環境へ最も一般に導入される、あらかじめ同定された微生物について監視可能である。

いくつかの実施形態において、方法は、５０ｎｇ未満のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する工程を含み、各ポリヌクレオチドは５’末端と３’末端を含む。いくつかの実施形態では、方法は：（ａ）環状ポリヌクレオチドを形成するために、サンプル中の個々のポリヌクレオチドをリガーゼで環状化する工程と、（ｂ）上記環状ポリヌクレオチドからのリガーゼの分離の際に、コンカテマーを形成するために上記環状ポリヌクレオチド増幅する工程と、（ｃ）複数の配列決定リードを生成するためにコンカテマーを配列決定する工程と、（ｄ）複数の配列決定リードと参照配列との間の配列の差異を同定する工程と、（ｅ）５０ｎｇ未満ポリヌクレオチドの上記核酸サンプルからの複数のリードにおいて０．０５％以上の頻度で生じる配列の差異を、配列変異体としてコールする工程を含む。

サンプル中のポリヌクレオチドの出発量は小さくてもよい。いくつかの実施形態では、出発ポリヌクレオチドの量は１００ｎｇ未満である。いくつかの実施形態では、出発物質の量は７５ｎｇ未満である。いくつかの実施形態において、出発物質の量は、４５ｎｇ、４０ｎｇ３５ｎｇある、３０ｎｇ、２５ｎｇ、２０ｎｇ、１５ｎｇ、１０ｎｇ、５ｎｇ、４ｎｇ、３ｎｇ、２ｎｇ、１ｎｇ、０．５ｎｇ、０．１ｎｇ未満などの５０ｎｇ未満である。いくつかの実施形態において、出発ポリヌクレオチドの量は、１−７５ｎｇ、５−５０ｎｇ、あるいは１０−２０ｎｇなど０．１−１００ｎｇの範囲である。概して、より低い出発物質は、様々な処理工程からの回収の増加の重要性を増大させる。その後の反応への関与のためにサンプル中のポリヌクレオチドの量を減らすプロセスは、稀な突然変異を検出することができる感度を減少させる。例えば、Ｌｏｕｅｔａｌ．（ＰＮＡＳ，２０１３，１１０（４９））によって記載された方法は、出発物質のわずか１０−２０％しか回収しないと予想される。大量の出発物質（例えば、研究所で培養された細菌から精製されるなど）については、これは実質的な障害ではないことがある。しかしながら、出発物質が著しく低いサンプルについては、この低い範囲の回収は十分に稀な変異体の検出への実質的な障害になりえる。これに応じて、いくつかの実施形態では、本開示（例えば、その後の増幅工程あるいは配列決定工程の入力に利用可能な環状化工程への入力の質量分率）の方法において１つの工程から別の工程へのサンプル回収は、約５０％、６０％、７５％、８０％、８５％、９０％、９５％、あるいは、それ以上である。特定の工程からの回収は１００％近くなることもある。回収は、非円形のポリヌクレオチドの入力からの環状ポリヌクレオチドの回収など、特定の形態に対することもある。

ポリヌクレオチドは、本開示の様々な態様に対して本明細書に記載されたサンプルなど、任意の適切なサンプル由来のものであってもよい。サンプルからのポリヌクレオチドは、限定されないが、ＤＮＡ、ＲＮＡ、リボソームＲＮＡ（ｒＲＮＡ）、転移ＲＮＡ（ｔＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、メッセンジャーＲＮＡ（ｍＲＮＡ）、これらのいずれかの断片、あるいはこれらの任意の２つ以上の組み合わせを含む様々なポリヌクレオチドのいずれかであり得る。いくつかの実施形態において、サンプルはＤＮＡを含む。いくつかの実施形態において、ポリヌクレオチドは、獲得されるような、あるいは処置（例えば変性）による、一本鎖である。さらに、適切なポリヌクレオチドの例は、本開示の様々な態様のいずれかに対するなどして本明細書に記載されている。いくつかの実施形態において、ポリヌクレオチドは、抽出工程を伴わない、および／または精製工程を伴わない、その後の工程（例えば、環状化と増幅）にさらされる。例えば、流体サンプルは、精製された流体サンプルと細胞サンプルを生成する抽出工程なく細胞を撤去するために処置され、その後、精製された流体サンプルからＤＮＡが単離されてもよい。沈澱または非特異的な結合などや、その後の結合したポリヌクレオチドを放出するための基質の洗浄などのポリヌクレオチドの単離のための様々な手順が利用可能である。ポリヌクレオチドが細胞抽出工程なくサンプルから単離される場合、ポリヌクレオチドは大部分が細胞外ポリヌクレオチドであるか、または死細胞あるいは損傷を受けた細胞に相当し得る無細胞ＤＮＡと無細胞ＲＮＡなどの「無細胞」ポリヌクレオチドである。こうした細胞の同一性は、微生物群などの、それらが由来する細胞または細胞集団を特徴づけるために使用されてもよい。サンプル中の細胞などから、ポリヌクレオチドを抽出するためにサンプルが処置される場合、様々な抽出法が利用可能であり、それらの例が（例えば、本開示の様々な態様のいずれかに関して）本明細書で提供される。

核酸サンプル中の配列変異体は様々な配列変異体のいずれかでありえる。配列変異体の複数の非限定的な例は、本開示の様々な態様のいずれかに対するなどして本明細書に記載されている。いくつかの実施形態において、配列変異体は一塩基多型（ＳＮＰ）である。いくつかの実施形態において、配列変異体は、集団（「稀な」配列変異体とも呼ばれる）において低頻度で生じる。例えば、配列変異体は、約５％、４％３％２％、１．５％、１％、０．７５％、０．５％、０．２５％、０．１％、０．０７５％、０．０５％、０．０４％、０．０３％、０．０２％、０．０１％、０．００５％、０．００１％、あるいはそれ以下の頻度で生じることもある。いくつかの実施形態において、配列変異体は、約０．１％以下の頻度で生じる。

いくつかの実施形態に従って、サンプルのポリヌクレオチドはリガーゼの使用などによって環状化される。環状化は、ポリヌクレオチドの５’末端を、同じポリヌクレオチドの３’末端に、別のポリヌクレオチドの３’末端に、あるいは、異なるソース（例えば、オリゴヌクレオチドアダプターなどの人工ポリヌクレオチド）のポリヌクレオチドの３’末端に接合することを含み得る。いくつかの実施形態において、ポリヌクレオチドの５’末端は同じポリヌクレオチドの３’末端に接合される（「自己接合（ｓｅｌｆ−ｊｏｉｎｉｎｇ）」とも呼ばれる）。環状化プロセス（例えば、アダプターオリゴヌクレオチドを用いる、および用いない）、試薬（例えば、アダプターのタイプおよびリガーゼの使用）、反応条件（例えば、自己接合を支持する）、および随意の追加の処理（例えば、反応後の精製）の非限定的な例が、本開示の様々な態様のいずれかに関するなどして本明細書で提供される。

以前に記載されたように、環状ポリヌクレオチドを形成するために（直接的に、または、１つ以上の中間アダプターオリゴヌクレオチドを用いて）ポリヌクレオチドの末端を互いに接合することにより、一般に、接合配列を有する接合部が生成される。ポリヌクレオチドの５’末端および３’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター（例えば５’末端接合部または３’末端接合部の１つ）との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの５’末端と３’末端との間の接合部を指すことがある。ポリヌクレオチドの５’末端と３’末端が介在性のアダプター（例えば、一本鎖ＤＮＡの５’末端と３’末端）なしで接合される場合、用語「接合部」とはこれらの２つの末端が接合される点を指す。接合部は接合部を含むヌクレオチドの配列（「接合配列」とも呼ばれる）によって同定されることがある。いくつかの実施形態において、サンプルは、天然の分解プロセス（細胞溶解、細胞死、および、ＤＮＡが細胞からその周辺環境（そこで、無細胞のポリヌクレオチド、無細胞ＤＮＡ、および無細胞のなどでさらに分解されることもある）に放出される他のプロセス）、サンプル処理（固定、染色、および／または保管手順）の副産物である断片化、ならびに、ＤＮＡを制限なく特定の標的配列に切断する方法による断片化（例えば、超音波処理などによる機械的な断片化；ＤＮａｓｅＩ、フラグメンターゼ（ｆｒａｇｍｅｎｔａｓｅ）などの非配列特異的なヌクレアーゼ処置）によって形成された末端の混合物を有するポリヌクレオチドを含む。サンプルが末端の混合物を有するポリヌクレオチドを含む場合、２つのポリヌクレオチドが同じ５’末端または３’を有する可能性は低く、２つのポリヌクレオチドが同じ５’末端と３’末端の両方を独立して有している可能性は著しく低い。これに応じて、いくつかの実施形態では、接合部は異なるポリヌクレオチドを識別するために使用されてもよく、この場合、２つのポリヌクレオチドは同じ標的配列を有する部分を含むことさえある。ポリヌクレオチド末端が介在性のアダプターなしで接合される場合、接合配列は参照配列へのアラインメントによって同定されることがある。例えば、２つの成分配列の順序が参照配列と逆であるように見える場合、その逆転が生じているように見える点はその点での接合部を示唆するものであり得る。ポリヌクレオチド末端が１つ以上のアダプター配列によって接合される場合、接合部は既知のアダプター配列への近接によって、あるいは、配列決定リードが環状化したポリヌクレオチドの５’末端と３’末端の両方の配列を得るのに十分な長さである場合には上のようなアラインメントによって同定されてもよい。いくつかの実施形態において、特定の接合部の形成は、それがサンプルの環状化したポリヌクレオチドの中で特有なものとなるような十分に稀な事象である。

環状化の後、反応産物が増幅または配列決定の前に精製されることで、その後の工程（例えば、環状ポリヌクレオチドの単離、あるいは反応における１つ以上の他の分子の除去）に関与するために利用可能な環状化したポリヌクレオチドの相対的濃度または純度を増大させることもある。例えば、環状化反応あるいはその成分を処理することで、エキソヌクレアーゼを用いる処置などによって一本鎖（非環状化）ポリヌクレオチドを除去することもある。さらなる例として、環状化反応またはその一部を立体排除クロマトグラフィーにさらすこともあり、それによって小さな試薬が保持および廃棄される（例えば、未反応アダプター）か、あるいは、環状化産物が別々の量で保持および放出される。ＺｙｍｏＲｅｓｅａｒｃｈ製のＺｙｍｏオリゴ精製キットによって提供されるキットなどの、ライゲーション反応を清浄するための様々なキットが利用可能である。いくつかの実施形態において、精製は、環状化反応で使用されるリガーゼを除去または分解するための、および／または、環状化したポリヌクレオチドをそのようなリガーゼから精製するための処置を含む。いくつかの実施形態において、リガーゼを分解する処理はプロテアーゼを用いる処理を含む。適切なプロテアーゼは、前核生物、ウイルス、および真核生物から入手可能である。プロテアーゼの例としては、プロテイナーゼＫ（Ｔｒｉｔｉｒａｃｈｉｕｍａｌｂｕｍからの）、プロナーゼＥ（ストレプトマイセス−グリセウスからの）、バチルス−ポリミキサプロテアーゼ、サーモリシン（高温細菌からの）、トリプシン、サブチリシン、フューリンなどが挙げられる。いくつかの実施形態では、プロテアーゼは、プロテイナーゼＫである。プロテアーゼによる処置は、メーカーのプロトコルに従うこともあれば、標準的な条件（例えば、ＳａｍｂｒｏｏｋａｎｄＧｒｅｅｎ，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，４ｔｈＥｄｉｔｉｏｎ（２０１２）で提供される）にさらされることもある。プロテアーゼ処置には抽出と沈澱を伴うこともある。１つの例では、環状化したポリヌクレオチドは、０．１％のＳＤＳと２０ｍＭのＥＤＴＡの存在下においてプロテイナーゼＫ（Ｑｉａｇｅｎ）処置によって精製され、１：１のフェノール／クロロホルムとクロロホルムで抽出され、エタノールまたはイソプロパノールで沈殿される。いくつかの実施形態では、沈殿はエタノール中である。

本開示の他の態様に対して記載されたように、環状化は、その後の環状化したポリヌクレオチドの配列決定を直接伴うこともある。代替的に、配列決定は、１つ以上の増幅反応に先行することがある。ポリヌクレオチド（例えば、ＤＮＡおよび／またはＲＮＡ）を増幅する様々な方法が利用可能である。増幅は線状であるか、指数関数的であるか、または多相の増幅プロセスにおいて直線位相と指数関数位相の両方を含むこともある。増幅方法は、熱変性工程などの温度の変動を含むこともあれば、あるいは熱変性を必要としない等温過程であることもある。適切な増幅プロセスの非限定的な例は、本開示の様々な態様のいずれかに関して本明細書に記載されている。いくつかの実施形態では、増幅はローリングサークル増幅（ＲＣＡ）を含む。本明細書の他の場所で記載されるように、典型的なＲＣＡ反応混合物は、１つ以上のプライマー、ポリメラーゼ、およびｄＮＴＰを含み、コンカテマーを生成する。典型的には、ＲＣＡ反応でのポリメラーゼは鎖置換活性を有するポリメラーゼである。様々なこうしたポリメラーゼが利用可能であり、その非限定的な例としては、エキソヌクレアーゼｍｉｎｕｓＤＮＡポリメラーゼＩｌａｒｇｅ（Ｋｌｅｎｏｗ）断片、Ｐｈｉ２９ＤＮＡポリメラーゼ、ＴａｑＤＮＡポリメラーゼなどが挙げられる。概して、コンカテマーは、鋳型ポリヌクレオチドからの標的配列の２つ以上のコピー（例えば、標的配列の約２、３、４、５、６、７、８、９、１０、あるいはそれ以上のコピー；いくつかの実施形態では、約２つ以上のコピー）を含むポリヌクレオチド増幅産物である。増幅プライマーは、約または少なくとも約５、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、９０、１００、またはそれ以上のヌクレオチドなど、任意の適切な長さであってもよく、その一部または全ては、プライマーがハイブリダイズする対応する標的配列に相補的であってもよい（例えば、約または少なくとも約５、１０、１５、２０、２５、３０、３５、４０、４５、５０、またはそれ以上のヌクレオチド）。ランダムプライマー、標的特異的なプライマー、およびアダプターを標的とするプライマーの使用などの様々なＲＣＡプロセスの例が本明細書に記載されており、その一部が図７のＡ−Ｃで例示されている。

環状化したポリヌクレオチドが（例えば、コンカテマーを生成するために）配列決定の前に増幅される場合、増幅された産物は富化なく直接配列決定にさらされることもあれば、あるいはその後、１つ以上の富化工程にさらされることもある。適切な富化プロセスの非限定的な例は、本開示の様々な態様のいずれかに関して本明細書に記載されている（例えば、第２の増幅工程のＢ２Ｂプライマーの使用）。いくつかの実施形態に従って、環状化したポリヌクレオチド（あるいは随意に富化されているかもしれないその増幅産物）は、配列決定リードを生成するために配列決定反応にさらされる。そのような方法によって生成された配列決定リードは、本明細書で開示される他の方法と合わせて使用されてもよい。様々な配列決定方法、とりわけ、ハイスループット配列決定方法が利用可能である。例としては、限定されないが、Ｉｌｌｕｍｉｎａ（ＨｉＳｅｑ（登録商標）とＭｉＳｅｑ（登録商標）などの配列決定システム）、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＩｏｎＴｏｒｒｅｎｔ（登録商標）、ＳＯＬｉＤ（登録商標）など）、Ｒｏｃｈｅの４５４ＬｉｆｅＳｃｉｅｎｃｅｓｓｙｓｔｅｍｓ、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓｓｙｓｔｅｍｓなどによって製造された配列決定システムが挙げられる。いくつかの実施形態において、配列決定は、長さが約５０、７５、１００、１２５、１５０、１７５、２００、２５０、３００、またはそれ以上のヌクレオチドのリードを生成するためにＨｉＳｅｑ（登録商標）とＭｉＳｅｑ（登録商標）のシステムの使用を含む。増幅プラットフォームおよび方法の追加の非限定的な例が、本開示の様々な態様のいずれかに関して本明細書で記載されている。

いくつかの実施形態にしたがって、配列決定リードと参照配列との間の配列の差異は、少なくとも２つの様々なポリヌクレオチド（例えば、異なる接合部を有するため識別可能な２つの異なる環状ポリヌクレオチド、あるいは、異なる５’末端および／または異なる３’末端を有する２つの異なるポリペプチド）で生じる場合に、純粋な配列変異体（例えば、増幅または配列決定の前のサンプル中で存在し、これらのプロセスのいずれかの結果ではない）と呼ばれる。増幅または配列決定の誤差の結果である配列変異体が同じ標的配列を含む２つの異なるポリヌクレオチド上では正確に（例えば、位置とタイプ）複製されない可能性他あるため、このバリデーションパラメータを追加することで、誤った配列変異体のバックグラウンドを大幅に減少させ、サンプル中の実際の配列変異を検出する感度と精度を同時に増大させる。いくつかの実施形態では、約５％、４％３％２％、１．５％、１％、０．７５％、０．５％、０．２５％、０．１％、０．０７５％、０．０５％、０．０４％、０．０３％、０．０２％、０．０１％、０．００５％、０．００１％、あるいはそれ以下の頻度を有する配列変異体は、正確なコールを可能にするほどバックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体は、約０．１％以下の頻度で生じる。いくつかの実施形態において、方法は、０．００１％−２％または０．０１％−１％など約０．０００５％−約３％の範囲の頻度を有する配列の差異を、純粋な配列変異体とコールする工程を含む。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率（例えば、約０．０５、０．０１、０．００１、０．０００１以下のｐ値）を統計的に有意なほど上回る場合に、バックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率よりも約または少なくとも約２倍、３倍、４倍、５倍、６倍、７倍、８倍、９倍、１０倍、２５倍、５０倍、１００倍、またはそれ以上である場合に、バックグラウンドよりも十分に高い（例えば、少なくとも５倍高い）。いくつかの実施形態において、所定の位置で配列を正確に決定する際のバックグラウンド誤差率は、約１％、０．５％０．１％、０．０５％、０．０１％、０．００５％、０．００１％、０．０００５％以下である。いくつかの実施形態では、誤差率は０．００１％よりも低い。頻度および誤差率を決定するための方法は、本開示の様々な態様のいずれかに関して本明細書で記載されている。

いくつかの実施形態において、純粋な配列変異体を同定する（「コールする（ｃａｌｌｉｎｇ）または（ｍａｋｉｎｇａｃａｌｌ）」とも呼ばれる）ことは、２つの間の差を同定するために、および、接合部を同定するために参照配列に１つ以上の配列決定リードを最適にアラインすることを含む。概して、アラインメントは、１つの配列を別の配列に沿って置き、各配列に沿ってギャップを反復して導入し、２つの配列がどれくらいよく一致しているかスコア化し、参照配列に沿って様々な位置について好ましくは反復することを含む。最良のスコアの一致がアラインメントであると思われ、配列間の関係の程度に関する推論を表している。それらを実行する様々なアラインメントアルゴリズムおよびアライナーが利用可能であり、その非限定的な例が、本開示の様々な態様のいずれかに関して本明細書で記載されている。いくつかの実施形態において、配列決定リードが比較される参照配列は、参照ゲノム（例えば、被験体と同じ種のメンバーのゲノム）などの既知の参照配列である。参照ゲノムは完全なこともあれば不完全なこともある。いくつかの実施形態において、参照ゲノムは、参照ゲノムから、あるいは分析中の配列決定リードから生成されたコンセンサスからなど、標的ポリヌクレオチドを含む領域のみからなる。いくつかの実施形態において、参照配列は、１つ以上の細菌、古細菌、ウイルス、原生生物、菌類あるいはその他の生物からの配列など、１つ以上の生物のポリヌクレオチドの配列を含み、または該配列からなる。いくつかの実施形態において、参照配列は、分析中の１つ以上の標的配列に対応する領域（例えば１つ以上の遺伝子あるいはその一部）などの参照ゲノムの一部のみからなる。例えば、（汚染検出の場合などでは）病原体の検出のために、参照ゲノムは、特定の株または血清型のなどの特定で役立つ、病原体（例えば、ＨＩＶ、ＨＰＶ、あるいは有害な菌株、例えば、大腸菌）の全ゲノムあるいはその一部である。いくつかの実施形態において、複数の様々な生物あるいは菌株についてスクリーニングするなどのために、配列決定リードは複数の様々な参照配列にアラインされる。配列の差異が同定され得る参照配列（および、コールされた配列変異体）の追加の非限定的な例が、本開示の様々な態様のいずれかに関して本明細書で記載されている。

１つの態様では、本開示は、反応混合物において、標的配列の２つ以上のコピーを含む複数の様々なコンカテマーを増幅する方法を提供し、標的配列は５’〜３’の方向に配向された配列Ａと配列Ｂを含む。いくつかの実施形態において、方法は反応混合物を核酸増幅反応にさらす工程を含み、反応混合物は、（ａ）複数のコンカテマーであって、複数のコンテカマーの個々のコンカテマーが、５’末端と３’末端を有する個々のポリヌクレオチドを環状化することにより形成された異なる接合部を含む、複数のコンカテマーと、（ｂ）配列Ａ’を含む第１のプライマーであって、第１のプライマーが配列Ａと配列Ａ’との間の配列相補性によって標的配列の配列Ａに特異的にハイブリダイズする、第１のプライマーと；（ｃ）配列Ｂを含む第２のプライマーであって、第２のプライマーが配列Ｂと配列Ｂ’との間の配列相補性によって標的配列の補体を含む相補的なポリヌクレオチド中に存在する配列Ｂ’に特異的にハイブリダイズする、第２のプライマーと、（ｄ）増幅されたポリヌクレオチドを生成するために第１のプライマーと第２のプライマーを伸長するポリメラーゼを含み、標的配列の配列Ａの５’末端と配列Ｂの３’末端との間の距離が７５ｎｔ以下である。

関連する態様において、本開示は、標的配列を含む複数の異なる環状ポリヌクレオチドを反応混合物中で増幅する方法を提供し、標的配列は、５’から３’方向に配向される配列Ａ及び配列Ｂを含む。幾つかの実施形態において、前記方法は、反応混合物を核酸増幅反応にさらす工程を含み、反応混合物は以下を含む：（ａ）複数の環状ポリヌクレオチドであって、その中の個々の環状ポリヌクレオチドは５’末端及び３’末端を持つ個々のポリヌクレオチドの環状化により形成された異なる接合部を含む、複数の環状ポリヌクレオチド；（ｂ）配列Ａ’を含む第１のプライマーであって、配列Ａと配列Ａ’との間の配列相補性を介して標的配列の配列Ａに特異的にハイブリダイズする、第１のプライマー；（ｃ）配列Ｂを含む第２のプライマーであって、配列ＢとＢ’との間の配列相補性を介して標的配列の補体を含む相補的ポリヌクレオチドに存在する配列Ｂ’に特異的にハイブリダイズする、第２のプライマー；及び（ｄ）増幅されたポリヌクレオチドを産生するために第１のプライマーと第２のプライマーを伸長するポリメラーゼ；ここで、配列Ａ及び配列Ｂは内因的な配列であり、配列Ａの５’末端と標的配列の配列Ｂの３’末端との間の距離は７５ｎｔ以下である。

環状ポリヌクレオチド又はコンカテマーの何れかを増幅しても、そのようなポリヌクレオチドは、（直接的に、或いは増幅などにより間接的に）任意の適切なサンプルソースから由来し得る。様々な適切なサンプルソース、随意の抽出プロセス、ポリヌクレオチドのタイプ、及び配列変異体のタイプが、本開示の様々な態様の何れかなどに対して、本明細書で記載される。環状ポリヌクレオチドは非環状ポリヌクレオチドの環状化に由来し得る。環状化プロセス（例えば、アダプターオリゴヌクレオチドを用いる及び用いない）、試薬（例えば、アダプターのタイプ、及びリガーゼの使用）、反応条件（例えば、自己接合を好む）、随意の追加の処理（例えば、反応後の精製）、及びそれらによって形成された接合部の非限定的な例は、本開示の様々な態様の何れかに関するものなど、本明細書で提供される。コンカテマーは環状ポリヌクレオチドの増幅に由来し得る。ポリヌクレオチド（例えばＤＮＡ及び／又はＲＮＡ）を増幅する様々な方法が利用可能である、その非限定的な例も本明細書で記載されている。幾つかの実施形態において、コンカテマーは環状ポリヌクレオチドのローリングサークル増幅によって生成される。

図１０は、標的配列の多数のコピーを含む単一の反復（典型的に環状でなければ増幅されない）及びコンカテマーの状況における標的配列に対する第１及び第２のプライマーの配置の一例を例示する。本明細書に記載される他の態様に関して注記されるように、このプライマーの配置は、「背中合わせ（Ｂ２Ｂ）」又は「逆転した」プライマーと称され得る。Ｂ２Ｂプライマーでの増幅は、環状及び／又はコンカテマーの鋳型の富化を促進する。更に、接合部が、（互いに面する、標的配列におよぶ）典型的な増幅反応に見出されるプライマー配置におけるほどプライマー間には恐らく生じないことから、比較的小さなフットプリント（プライマーの対におよぶ総距離）と組み合わされたこの配向は、標的配列周囲のより広範囲の断片化イベントを可能にする。幾つかの実施形態において、配列Ａの５’末端と配列Ｂの３’末端との間の距離は、約２００、１５０、１００、７５、５０、４０、３０、２５、２０、１５、或いはそれ以下のヌクレオチドである。幾つかの実施形態において、配列Ａは配列Ｂの補体である。幾つかの実施形態において、複数の異なる標的配列に向けられるＢ２Ｂプライマーの多数の対は、並行して複数の異なる標的配列（例えば、約、或いは少なくとも約１０、５０、１００、１５０、２００、２５０、３００、４００、５００、１０００、２５００、５０００、１００００、１５０００、又はそれ以上の異なる標的配列）を増幅させるために同じ反応で使用される。プライマーは、本明細書に別記されるものなどの適切な長さであり得る。増幅は、本明細書に記載される増幅反応など、適切な条件下での適切な増幅反応を含み得る。幾つかの実施形態において、増幅はポリメラーゼ連鎖反応である。

幾つかの実施形態において、Ｂ２Ｂプライマーは、少なくとも２つの配列要素、配列相補性を介して標的配列にハイブリダイズする第１の要素、及び、（例えば、尾部と第１の要素が結合する場所に対して３’に隣接する標的配列の部分との間の配列相補性の不足による）第１の要素がハイブリダイズする第１のハイブリダイゼーション温度での第１の増幅段階中に標的配列にハイブリダイズしない５’「尾部」を含む。例えば、第１のプライマーは配列Ａ’に対して配列Ｃ５’を含み、第２のプライマーは配列Ｂに対して配列Ｄ５’を含み、及び配列Ｃと配列Ｄは何れも、第１のハイブリダイゼーション温度での第１の増幅段階中に複数のコンカテマー（又は環状ポリヌクレオチド）にハイブリダイズする。そのような尾部付加プライマー（ｔａｉｌｅｄｐｒｉｍｅｒ）が使用される幾つかの実施形態において、増幅は第１の段階と第２の段階を含むことができ；第１の段階は第１の温度でのハイブリダイゼーション工程を含み、その間に、第１及び第２のプライマーは、コンカテマー（又は環状ポリヌクレオチド）及びプライマー伸長にハイブリダイズし；第２の段階は、第１の温度よりも高い第２の温度でのハイブリダイゼーション工程を含み、その間に、第１及び第２のプライマーは、伸長された第１又は第２のプライマー、又はその補体、及びプライマー伸長を含む増幅産物にハイブリダイズする。２つの温度の各々での増幅サイクルの数は、望ましい産物に基づいて調整することができる。典型的に、第１の温度は、約１５、１０、９、８、７、６、５、又はそれ以下のサイクルなど、比較的少ない数のサイクルのために使用される。より高温度でのサイクルの数は、第１の温度でのサイクルの数とは無関係に選択することができるが、典型的には、約、又は少なくとも約５、６、７、８、９、１０、１５、２０、２５、又はそれ以上のサイクルなど、同じくらい又はより多くのサイクルである。より高温度では、プライマー中の第１の要素のみとコンカテマー内の内部標的配列との間のハイブリダイゼーションによって形成された、より短い断片にわたって、プライマー伸長産物におけるプライマーの第１の要素と尾部要素との間のハイブリダイゼーションが好まれる。従って、二段階の増幅が、短い増幅産物が他の場合に好まれる程度を減らして、それにより標的配列の２つ以上のコピーを持つ増幅産物の比較的高い比率を維持するために使用され得る。例えば、第２の温度及びプライマー伸長でのハイブリダイゼーションの５つのサイクル（例えば少なくとも５、６、７、８、９、１０、１５、２０、又はそれ以上のサイクル）の後、反応混合物中の増幅されたポリヌクレオチドの少なくとも５％（例えば、少なくとも５％、６％、７％、８％、９％、１０％、１５％、２０％、２５％、３０％、又はそれ以上）は、標的配列の２つ以上のコピー含む。この二段階に従った実施形態の例示として、尾部付加Ｂ２Ｂプライマー増幅プロセスは、図１１のＡ−Ｄに例示される。更なる実施の例示が図１５のＡ−Ｃで提供される。

幾つかの実施形態において、増幅は、コンカテマーからのアンプリコンの長さを増大させるために歪められる条件下で行われる。例えば、プライマー濃度は、どの刺激部位もプライマーをハイブリダイズせず、故にＰＣＲ産物をより長くするように、少なくすることができる。同様に、サイクル中のプライマーハイブリダイゼーション時間の減少は、より少数のプライマーがハイブリダイズすることを可能にし、故に平均ＰＣＲアンプリコンのサイズを増大させる。更に、サイクルの温度及び／又は伸長時間の増大は、同様にＰＣＲアンプリコンの平均長さを増大させる場合がある。これら技術のあらゆる組み合わせも使用することができる。

幾つかの実施形態において、特にＢ２Ｂプライマーでの増幅が実行された場合、増幅産物は、コンカテマーを含む混合物のモノマーの数を減らす及び／又は除去するために、サイズに基づいて結果として生じるアンプリコンをフィルタリングするために処理される。これは、（例えば、長さ約３００、４００、５００、又はそれ以上のヌクレオチドよりも大きな断片を富化するための）ゲルからの断片切除及びゲル濾過を含むがこれらに限定されない様々な利用可能な技術；同様に、結合緩衝液濃度の微調整によるサイズ選択のためのＳＰＲＩビーズ（ＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰ）を用いて行うことができる。例えば、ＤＮＡ断片との混合中の０．６ｘ結合緩衝液の使用が、優先的に約５００塩基対（ｂｐ）よりも大きなＤＮＡ断片を結合するために使用されてもよい。

幾つかの実施形態において、第１のプライマーは配列Ａ’に対して配列Ｃ５’を含み、第２のプライマーは配列Ｂに対して配列５’を含み、配列Ｃと配列Ｄは何れも、第１のハイブリダイゼーション温度での第１の増幅段階中に複数の環状ポリヌクレオチドにハイブリダイズしない。増幅は第１の段階及び第２の段階を含む場合があり；ここで、第１の段階は第１の温度でのハイブリダイゼーション工程を含み、その間に、第１及び第２のプライマーは、プライマー伸長の前にそれらの環状ポリヌクレオチド又は増幅産物にハイブリダイズし；第２の段階は、第１の温度よりも高い第２の温度でのハイブリダイゼーション工程を含み、その間に、第１及び第２のプライマーは、伸長された第１又は第２のプライマー或いはその補体を含む増幅産物にハイブリダイズする。例えば、第１の温度は、配列Ａ’、配列Ｂ、又はこれらの平均のおよそのＴｍ又はそれ以上として、或いは、１℃、２℃、３℃、４℃、５℃、６℃、７℃、８℃、９℃、１０℃、又はこれらＴｍの１つよりも高い温度として選択され得る。この例において、第２の温度は、組み合わせた配列（Ａ’＋Ｃ）、組み合わせた配列（Ｂ＋Ｄ）、又はこれらの平均のおよそのＴｍ又はそれ以上として、或いは、１℃、２℃、３℃、４℃、５℃、６℃、７℃、８℃、９℃、１０℃、又はこれらＴｍの１つよりも高い温度として選択され得る。用語「Ｔｍ」は「融解温度」とも称され、一般的には、参照配列（実際にはより大きなポリヌクレオチド内のサブ配列でもよい）及びその相補的配列から成るオリゴヌクレオチドの５０％がハイブリダイズされる（又は分離される）温度を表わす。一般的に、Ｔｍは長さの増大により増大し、そのため、配列Ａ’のＴｍは組み合わせ配列（Ａ’＋Ｃ）のＴｍより低いと推測される。

一態様において、本開示は、配列変異体を検出するためのシステムを提供する。幾つかの実施形態において、システムは、（ａ）サンプル上で検出反応を実行するためのユーザーリクエストを受信するように構成されたコンピュータ；（ｂ）ユーザーリクエストに応じてサンプル又はその一部の上で核酸増幅反応を実行する増幅システムであって、増幅反応は、（ｉ）リガーゼ酵素を使用して複数の円形のポリヌクレオチドを形成するために複数のポリヌクレオチドにおいて個々のポリヌクレオチドに環状化する工程であって、複数のポリヌクレオチドの各々がライゲーションの前に３’末端と５’端部との間に接合部を持つ、工程；（ｉｉ）リガーゼ酵素を分解する工程；及び（ｉｉ）増幅されたポリヌクレオチドを産生するためにリガーゼ酵素を分解した後に環状ポリヌクレオチドを増幅する工程を含み；ポリヌクレオチドは工程（ｉ）と（ｉｉｉ）の間には精製又は単離されない、増幅システム；（ｃ）増幅システムによって増幅されたポリヌクレオチドのために配列決定リードを生成し、配列決定リードと参照配列との間の配列の差異を同定し、且つ異なる接合部を持つ少なくとも２つの環状ポリヌクレオチドに生じる配列の差異を配列変異体としてコールする、配列決定システム；及び（ｄ）配列変異体の検出に関する結果を含む報告書をレシピエントに送信する報告書作成装置を備えている。幾つかの実施形態において、レシピエントはユーザーである。図３２は、本開示の方法において有用なシステムの非限定的な例を説明する。図２９と３０は、例示的なワークフロー設計の例示的な概要を提供する。

本システムで使用されるコンピュータは１つ以上のプロセッサを含むことができる。プロセッサは、１つ以上の制御装置、計算ユニット、及び／又はコンピュータシステムの他のユニットに関連付けられるか、又は所望されるようにファームウェアに埋め込まれてもよい。ソフトウェアに実施されれば、ルーチンは、ＲＡＭ、ＲＯＭ、フラッシュメモリ、磁気ディスク、レーザーディスク（登録商標）、又は他の適切な記憶媒体などの任意のコンピュータ可読メモリに記憶され得る。同様に、このソフトウェアは、例えば、電話回線、インターネット、ワイヤレス接続などの通信チャネル上、或いはコンピュータ可読ディスク、フラッシュドライブなどの移動式媒体を介して等が挙げられる、あらゆる既知の送達方法を介してコンピューティングに送達され得る。様々な工程が、順番にハードウェア、ファームウェア、ソフトウェア、或いはハードウェア、ファームウェア、及び／又はソフトウェアの任意の組み合わせに実装され得る様々なブロック、操作、ツール、モジュール、及び技術として実施されてもよい。ハードウェアで実施されるとき、ブロック、操作、技術などの幾つか又は全ては、例えば、カスタム集積回路（ＩＣ）、特定用途向け蓄積回路（ＡＳＩＣ）、カスタム（フィールドプログラマブルロジックアレイ（ＦＰＧＡ）、プログラマブルロジックアレイ（ＰＬＡ）などで実施され得る。クライアントサーバーリレーショナルデータベース構造が、本システムの実施形態に使用することができる。クライアントサーバーアーキテクチャは、ネットワーク上のコンピュータ又はプロセスがそれぞれ、クライアント又はサーバーのいずれかである、ネットワークアーキテクチャである。サーバーコンピュータは典型的に、ディスクドライブ（ファイルサーバー）、プリンター（プリントサーバー）、又はネットワークトラフィック（ネットワークサーバー）の管理に対する専用の高性能コンピュータであり得る。クライアントコンピュータは、ＰＣ（パーソナルコンピュータ）又はユーザーがアプリケーションを実行するワークステーションの他に、本明細書に開示されるような例となる出力デバイスを含むことができる。クライアントコンピュータは、ファイル、デバイス、及び更に処理パワーなどのリソースのためのサーバーコンピュータに依存する。サーバーコンピュータは、データベース機能性の全てを処理する。クライアントコンピュータは、フロントエンドのデータ管理全てを処理するソフトウェアを有することができ、ユーザーからデータ入力を受信することができる。

本システムはサンプル上で検出反応を実行するためのユーザーリクエストを受信するように構成され得る。ユーザーリクエストは直接的又は間接的でもよい。直接リクエストの例には、キーボード、マウス、又はタッチスクリーンなどの入力デバイスによって送信されるものが挙げられる。間接リクエストの例には、インターネット（有線又は無線）上などの通信媒体を介した送信が挙げられる。

本システムは、ユーザーリクエストに応じてサンプル又はその一部の上で核酸増幅反応を実行する増幅システムを更に含み得る。ポリヌクレオチド（例えばＤＮＡ及び／又はＲＮＡ）を増幅する様々な方法が利用可能である。増幅は線状、指数関数的であるか、又は多重フェーズ増幅プロセスにおいて線状と指数関数的の両方に関与し得る。増幅方法は、熱変性工程などの温度変化に関与し、或いは熱変性を必要としない等温プロセスであり得る。適切な増幅プロセスの非限定的な例は、本開示の様々な態様の何れかに関するものなど、本明細書に記載される。幾つかの実施形態において、増幅はローリングサークル増幅（ＲＣＡ）を含む。ポリヌクレオチドを増幅するための様々なシステムが利用可能であり、実行される増幅反応のタイプに基づいて変動し得る。例えば、温度変化のサイクルを含む増幅方法に関しては、増幅システムはサーモサイクラーを含み得る。増幅システムは、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ、Ｒｏｃｈｅ、及びＳｔｒａｔｅｇｅｎｅによって製造されたシステムなどのリアルタイム増幅及び検出器機を含み得る。幾つかの実施形態において、増幅反応は、（ｉ）複数の環状ポリヌクレオチドを形成するために個々のポリヌクレオチドを環状化する工程であって、環状ポリヌクレオチドの各々が５’末端と３’末端との間に接合部を有する、工程；及び（ｉｉ）環状ポリヌクレオチドを増幅する工程を含む。サンプル、ポリヌクレオチド、プライマー、ポリメラーゼ、及び他の試薬は、様々な態様の何れかに関するものなど、本明細書に記載されるものの何れかであり得る。環状化プロセス（例えば、アダプターオリゴヌクレオチドを用いる及び用いない）、試薬（例えば、アダプターのタイプ、及びリガーゼの使用）、反応条件（例えば、自己接合を好む）、随意の追加の処理（例えば、反応後の精製）、及びそれらによって形成された接合部の非限定的な例は、本開示の様々な態様の何れかに関するものなど、本明細書で提供される。そのような方法を実行するためのシステムが選択及び設計され得る。

システムはさらに、増幅システムによって増幅されたポリヌクレオチドのために配列決定リードを生成し、配列決定リードと参照配列との間の配列の差異を同定し、且つ異なる接合部を持つ少なくとも２つの環状ポリヌクレオチドに生じる配列の差異を配列変異体としてコールする、配列決定システムを含んでもよい。配列決定システム及び増幅システムは同じであるか、又は重なり合う機器を含み得る。例えば、増幅システム及び配列決定システムは共に同じサーモサイクラーを利用し得る。本システムで使用するための様々な配列決定プラットフォームが利用可能であり、選択された配列決定法に基づいて選択され得る。配列決定法の例が本明細書に記載される。増幅及び配列決定は、液体ハンドラーの使用を含み得る。様々な市販されている液体ハンドラーシステムは、これらプロセスの自動化を実行するために利用することができる（例えば、例としてＰｅｒｋｉｎ−Ｅｌｍｅｒ、ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、ＣａｌｉｐｅｒＬｉｆｅＳｃｉｅｎｃｅｓ、Ｔｅｃａｎ、Ｅｐｐｅｎｄｏｒｆ、ＡｐｒｉｃｏｔＤｅｓｉｇｎ、Ｖｅｌｏｃｉｔｙ１１製の液体ハンドラーを参照）。様々な自動配列決定機械が市販で入手可能であり、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＳＯＬｉＤプラットフォーム、及びｐＨベースの検出）、Ｒｏｃｈｅ（４５４プラットフォーム）、Ｉｌｌｕｍｉｎａ（例えば、フローセルベースのシステム、ＧｅｎｏｍｅＡｎａｌｙｚｅｒｄｅｖｉｃｅｓなど）によって製造されたシーケンサーが挙げられる。２、３、４、５、又はそれ以上の自動装置間（例えば、液体ハンドラー及び配列決定装置の１つ以上の間）での伝達は、手動又は自動であり得る。

配列の差異を同定し且つ参照配列に対して配列変異体をコールするための方法が、本開示の様々な態様の何れかなどに関して、本明細書に記載される。配列決定システムは典型的に、配列決定データの入力、及び望ましいパラメータ（例えば参照ゲノムの選択）の入力に応じて、これら工程を実施するためのソフトウェアを含む。これらアルゴリズムを実施するアラインメントアルゴリズム及びアライナーの例が本明細書で記載され、限定されないがＮｅｅｄｌｅｍａｎ−Ｗｕｎｓｃｈアルゴリズム（例えば、随意にデフォルト設定を伴う、ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ／Ｔｏｏｌｓ／ｐｓａ／ｅｍｂｏｓｓ＿ｎｅｅｄｌｅ／ｎｕｃｌｅｏｔｉｄｅ．ｈｔｍｌにて利用可能なＥＭＢＯＳＳＮｅｅｄｌｅアライナーを参照）、ＢＬＡＳＴアルゴリズム（例えば、随意にデフォルト設定を伴う、ｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／Ｂｌａｓｔ．ｃｇｉにて利用可能なＢＬＡＳＴアラインメントツールを参照）、又はＳｍｉｔｈ−Ｗａｔｅｒｍａｎアルゴリズム（例えば、随意にデフォルト設定を伴うｗｗｗ．ｅｂｉ．ａｃ．ｕｋ／Ｔｏｏｌｓ／ｐｓａｅｍｂｏｓｓ＿ｗａｔｅｒ／ｎｕｃｌｅｏｔｉｄｅ．ｈｔｍｌにて利用可能なＥＭＢＯＳＳＷａｔｅｒアライナーを参照）が挙げられる。最適なアラインメントは、デフォルトパラメータを含む選択されたアルゴリズムのあらゆる適切なパラメータを使用して評価され得る。そのようなアラインメントアルゴリズムは、配列決定システムの一部を形成し得る。

本システムは、配列変異体の検出に関する結果を含む報告書をレシピエントに送信する報告書作成装置を更に備えている。報告書は、プロセスの進行として周期的な更新と共に、配列決定リード中、又は配列決定データが分析されている間などで、リアルタイムで生成され得る。加えて、又は代替的に、報告書は分析の終わりに生成され得る。報告書は自動的に生成されてもよく、そのような場合、配列決定システムは全ての配列変異体をコールする工程を完了する。幾つかの実施形態において、報告書はユーザーからの指示に応じて生成される。配列変異体の検出の結果に加えて、報告書はまた、１つ以上の配列変異体に基づく分析を含み得る。例えば、１つ以上の配列変異体が特定の不純物又は表現型に関連付けられる場合、報告書は、不純物又は表現型が存在する可能性、どのようなレベルかなどのこの関連性に関する情報、及び随意にこの情報に基づく示唆（例えば追試、モニタリング、又は改善策）を含み得る。報告書は様々な形態の何れかをとることができる。本開示に関するデータは、受信者による受信及び／又は確認のためにそのようなネットワーク又は通信（ｃｏｎｎｅｃｔｉｏｎｓ）（或いは、限定されないがプリントアウトなどの物理報告書の郵送を含む、情報を送信するための他の適切な手段）上で送信することができる。受信者は、個人、又は電子装置（例えば１つ以上のコンピュータ、及び／又は１つ以上のサーバー）であり得るが、これらに限定されない。

一態様において、本開示は、１つ以上のプロセッサによる実行に際して、配列変異体を検出する方法を実施するコードを含むコンピュータ可読媒体を提供する。幾つかの実施形態において、実施された方法は、（ａ）サンプル上で検出反応を実行するためのカスタマーリクエストを受信する工程；（ｂ）カスタマーリクエストに応じてサンプル又は一部の上で核酸増幅反応を実行する工程であって、増幅反応は、（ｉ）リガーゼ酵素を使用して複数の円形のポリヌクレオチドを形成するために複数のポリヌクレオチドにおいて個々のポリヌクレオチドに環状化する工程であって、複数のポリヌクレオチドの各々がライゲーションの前に５’端部と３’末端を有する、工程；（ｉｉ）リガーゼ酵素を分解する工程；及び（ｉｉ）増幅されたポリヌクレオチドを産生するためにリガーゼ酵素を分解した後に環状ポリヌクレオチドを増幅する工程を含み；ポリヌクレオチドは工程（ｉ）と（ｉｉｉ）の間には精製又は単離されない、増幅システム；（ｃ）配列決定分析を行う工程であって、（ｉ）増幅反応で増幅されたポリヌクレオチドの配列決定リードを生成すること；（ｉｉ）配列決定リードと参照配列との差を同定すること；及び（ｉｉｉ）異なる接合部を持つ少なくとも２つの環状ポリヌクレオチドに生じる配列の差異を配列変異体としてコールすること、を含む工程；及び（ｄ）配列変異体の検出に関する結果を含む報告書を生成する工程を含む。

コンピュータ実行可能コードを含むマシン可読媒体は、有形ストレージ媒体、搬送波媒体、又は物理的伝送媒体を含むが、これらに限定されない、多くの形態をとってもよい。不揮発性記憶媒体には、例えば、データベースなどを実装するために使用することができるような、コンピュータなどにおける記憶装置のいずれかなどの光ディスク又は磁気ディスクが含まれる。揮発性記憶媒体は、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリを含む。有形送信媒体は、同軸ケーブル；コンピュータシステム内のバスを含むワイヤーを含む、銅線及び光ファイバーを含んでいる。搬送波送信媒体は、無線周波（ＲＦ）及び赤外線（ＩＲ）データ通信中に生成されたものなどの、電気信号又は電磁気信号、或いは音波又は光波の形態をとり得る。それ故、コンピュータ可読媒体の共通の形態は、例えば：フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤ若しくはＤＶＤ−ＲＯＭ、他の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の物理的な記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭ及びＥＰＲＯＭ、ＦＬＡＳＨ−ＥＰＲＯＭ、他のメモリチップ若しくはカートリッジ、データ若しくは命令を輸送する搬送波、そのような搬送波を伝達するケーブル若しくはリンク、又はコンピュータがプログラミングのコード及び／又はデータを読み取り得る他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサに１つ以上の命令の１つ以上のシーケンスを運ぶことに関係し得る。

主題のコンピュータ実行可能コードは、サーバー、ＰＣ、又はスマートフォン又はタブレットなどのモバイルデバイスが挙げられる、プロセッサを含む任意の適切な装置上で実行することができる。あらゆる制御装置又はコンピュータが随意に、ブラウン管（「ＣＲＴ」）ディスプレイ、平面パネルディスプレイ（例えばアクティブマトリクス型液晶ディスプレイ、液晶ディスプレイ等）、或いはその他であり得るモニターを含む。コンピュータ回路は多くの場合、マイクロプロセッサ、メモリ、インターフェース回路、及びその他などの多数の集積回路チップを含むボックス内に配される。ボックスはまた随意に、ハードディスクドライブ、フロッピーディスクドライブ、書き込み可能なＣＤ−ＲＯＭなどの高容量の取り外し可能なドライブ、及び他の共通の周辺要素も含む。キーボード、マウス、又はタッチセンススクリーンなどの入力装置は随意にユーザーからの入力を提供する。コンピュータは、パラメータフィールドのセットへのユーザー入力の形態、例えばＧＵＩで、或いは、予めプログラムされた命令の形態、例えば様々な異なる特定の操作のために予めプログラムされたもので、ユーザーの命令を受信するのに適切なソフトウェアを含み得る。

本明細書に開示される様々な態様の何れかの幾つかの実施形態において、方法、組成物、及びシステムは、患者サンプルの特徴づけ及び随意に被験体の疾病の診断などにおける治療用途を持つ。治療用途はまた、本明細書に記載される方法の結果に基づいて、患者が最も反応し得る治療（「セラノスティック」とも称される）、及び必要とする被験体の実際の処置の選択を知らせる工程を含み得る。特に、本明細書に開示される方法及び組成物は、特に分析されたポリヌクレオチドがｃｆＤＮＡ、ｃｔＤＮＡ、ｃｆＲＮＡ、又は断片化された腫瘍ＤＮＡを含む、或いはそれらから成るときに、腫瘍の存在、進行、及び／又は腫瘍の転移を診断するために使用されてもよい。幾つかの実施形態において、被験体は処置効果のためにモニタリングされる。例えば、経時的にｃｔＤＮＡをモニタリングすることによって、ｃｔＤＮＡの減少は効果的な処置の指標として使用することができ、一方で増加は異なる処置又は異なる用量の選択を促進することができる。他の使用は、移植レシピエントの臓器拒絶の評価（この場合、移植ドナーゲノムに対応する循環ＤＮＡの量の増加が移植拒絶反応の初期の徴候として使用される）、及びウイルス又は細菌感染などの病原体感染症の遺伝子型判定／アイソタイピング（ｉｓｏｔｙｐｉｎｇ）を含む。循環胎児ＤＮＡの配列変異体の検出が胎児の疾病を診断するために使用されてもよい。

本明細書で使用されるように、「処置」又は「処置すること」或いは「緩和すること」又は「寛解させること」は互換的に使用される。これらの用語は、限定されないが治療効果及び／又は予防効果を含む、有益な又は所望の結果を得るための方法を指す。治療効果は、処置の下での１つ以上の疾患、疾病、又は症状における治療に関連する改善、或いはそれらに対する効果を意味する。予防効果に関して、組成物は、特定の疾患、疾病、又は症状が未だに明らかになっていなくとも、疾患、疾病、又は症状を進行する危険のある被験体に、又は、疾患の生理学的な症状の１つ以上を報告する被験体に投与され得る。典型的に、予防効果は、（例えば、処置集団と未処置集団の間、或いは被験体の処置状態と未処置状態の間として）処置の下での１つ以上の疾患、疾病、又は症状の発生及び／又は悪化を減らすことを含む。治療結果の改善は、１つ以上の治療薬、又は他の治療介入（手術など）による処置から利益を得る、又は得ない者として被験体を同定するために、被験体の状態を診断することを含み得る。そのような診断用途において、１つ以上の治療薬による処置の成功の全体的な割合は、本開示の方法に従い診断なしにグループ分けされた患者間の有効性に比べて、改善され得る（例えば、少なくとも約１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、又はそれ以上の治療効果の測定値の改善として）。

用語「被験体」、「個体」、及び「患者」は、脊椎動物、好ましくは哺乳動物、より好ましくはヒトを指すために本明細書で互換的に使用される。哺乳動物には限定されないが、マウス、サル、ヒト、家畜、スポーツ動物（ｓｐｏｒｔａｎｉｍａｌｓ）、及びペットが挙げられる。インビボで得られたか又はインビトロで培養された組織、細胞、及びそれらの生物学的実体の子孫も包含される。

用語「治療薬」、「治療可能な薬剤」、又は「処置剤」は互換的に使用され、被験体の投与に際してある程度の有益な効果を与える分子又は化合物を指す。有益な効果は、診断上の判定の可能性；疾患、症状、障害、又は病理学的疾病の改善；疾患、症状、障害、又は疾病の発症の軽減又は予防；及び一般的に、疾患、症状、障害、又は病理学的疾病を中和することを含む。

本明細書に記載された様々な方法の幾つかの実施形態において、サンプルは被験体由来である。被験体はあらゆる生物であり、その非限定的な例として、植物、動物、真菌、原生生物、モネラ、ウイルス、ミトコンドリア、及び葉緑体が挙げられる。サンプルポリヌクレオチドは、細胞サンプル、組織サンプル、体液サンプル、又は臓器サンプル（或いはこれらの何れかに由来する細胞培養物）など、被験体から単離されるものであり、例えば、培養細胞株、生検、血液サンプル、口腔粘膜検体採取物、又は細胞を含む流体サンプル（例えば唾液）が挙げられる。場合によっては、サンプルは無傷細胞を含まず、細胞を除去するために処置され、或いはポリヌクレオチドは、細胞の抽出工程（例えば、無細胞ＤＮＡなどの無細胞ポリヌクレオチドを単離すること）を用いることなく単離される。サンプルのソースの他の例には、血液、尿、糞便、鼻孔、肺、腸、他の体液又は排泄物、それらから得られるもの、或いはそれらの組み合わせに由来するものが挙げられる。被験体は、限定されないがウシ、ブタ、マウス、ラット、トリ、ネコ、イヌなどを含む動物であり、且つ通常はヒトなどの哺乳動物である。幾つかの実施形態において、サンプルは被験体からの腫瘍組織のサンプルなどの中の腫瘍細胞を含む。幾つかの実施形態において、サンプルは、血液サンプル又はその一部（例えば血漿又は血清）である。血清と血漿は、そのような組織間での高割合の悪性細胞死に関連する腫瘍ＤＮＡの相対的な富化により、特に興味深いものであり得る。サンプルは、新鮮なサンプル、又は１つ以上の保管プロセスにさらされるサンプル（例えばパラフィン包埋サンプル、特にホルマリン固定パラフィン包埋（ＦＦＰＥ）サンプル）であり得る。幾つかの実施形態において、一人の個体からのサンプルは、２回、３回、４回、又はそれ以上繰り返される分析などの、本開示の方法に独立してさらされる、複数の別個のサンプル（例えば２、３、４、５、６、７、８、９、１０、又はそれ以上の別個のサンプル）に分割される。サンプルが被験体由来である場合、参照配列も被験体由来であってもよく、分析中のサンプルのコンセンサス配列、或いは同じ被験体の別のサンプル又は組織由来のポリヌクレオチドの配列などである。例えば、血液サンプルはｃｔＤＮＡ突然変異のために分析され得るが、別のサンプル（例えば頬側又は皮膚サンプル）からの細胞内ＤＮＡは参照配列を判定するために分析される。

ポリヌクレオチドは、適切な方法に従い、サンプル中の細胞からの抽出を用いて又は用いることなく、サンプルから抽出され得る。様々なキットが、ポリヌクレオチドの抽出、サンプルのタイプに依存し得るものの選択、或いは単離される核酸のタイプのために利用可能である。抽出方法の例は、本明細書に開示される様々な態様の何れかに対して記載されるものなど、本明細書で提供される。一例において、サンプルは、ＥＤＴＡ管（例えばＢＤヴァキュテイナー）において採取されたサンプルなどの血液サンプルでもよい。血漿は、遠心分離（例えば４℃で１９００×ｇを１０分）によって末梢血細胞から分離することができる。６ｍＬの血液サンプル上でこのような方法で実行された血漿分離は典型的に、２．５から３ｍＬの血漿をもたらす。循環する無細胞ＤＮＡは、製造者のプロトコルに従って、ＱＩＡｍｐＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄＫｉｔ（Ｑｉａｇｅｎｅ）を使用するなどにより、血漿サンプルから抽出されてもよい。その後、ＤＮＡは定量化され得る（例えば、Ａｇｉｌｅｎｔ２１００ＢｉｏａｎａｌｙｚｅｒｗｉｔｈＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＤＮＡｋｉｔ（Ａｇｉｌｅｎｔ）上で）。一例として、健康なヒトからのそのような血漿サンプルの循環ＤＮＡの収量は、血漿１ｍＬ当たり１ｎｇから１０ｎｇに及び、癌患者サンプルにおいて有意に多い。

ポリヌクレオチドはまた、保管されたサンプル、凍結された又はアーカイブ保管されたサンプルに由来し得る。サンプルを保管するための１つの共通の方法は、それらをホルマリン固定及びパラフィン包埋することである。しかし、このプロセスは核酸の分解にも関連付けられる。ＦＦＰＥサンプルから処理及び分析されたポリヌクレオチドは、５０−２００の塩基対又はそれよりも短い範囲における断片などの、短いポリヌクレオチドを含み得る。多数の技術が、固定されたパラフィン包埋サンプルからの核酸の精製のために存在し、ＷＯ２００７１３３７０３に記載されるもの、及びＦｏｓｓ，ｅｔａｌＤｉａｇｎｏｓｔｉｃＭｏｌｅｃｕｌａｒＰａｔｈｏｌｏｇｙ，（１９９４）３：１４８−１５５並びにＰａｓｋａ，Ｃ．，ｅｔａｌＤｉａｇｎｏｓｔｉｃＭｏｌｅｃｕｌａｒＰａｔｈｏｌｏｇｙ，（２００４）１３：２３４−２４０に記載される方法などがある。市販されているキットは、ＦＦＰＥサンプルからポリヌクレオチドを精製するために使用されてもよく、Ａｍｂｉｏｎ’ｓＲｅｃｏｖｅｒａｌｌＴｏｔａｌＮｕｃｌｅｉｃａｃｉｄＩｓｏｌａｔｉｏｎｋｉｔなどがある。典型的な方法は、キシレン又は他の有機溶媒による抽出、その後、熱、及び組織とタンパク質を切断し且つ組織からゲノム材料を放出するのを支援するプロテアーゼ様プロテイナーゼＫによる処理を介して、組織からパラフィンを除去する工程から始まる。その後、放出された核酸は、膜上で捕捉又は溶液から沈殿させ、洗浄して不純物を除去することができ、ｍＲＮＡ単離の場合には、ＤＮａｓｅ処置工程が時折、不要なＤＮＡを分解するために加えられる。ＦＦＰＥＤＮＡを抽出するための他の方法が利用可能であり、本開示の方法に使用することができる。

幾つかの実施形態において、複数のポリヌクレオチドは、無細胞ＤＮＡ（ｃｆＤＮＡ）、無細胞ＲＮＡ（ｃｆＲＮＡ）、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）、又は循環腫瘍ＲＮＡ（ｃｔＲＮＡ）などの無細胞ポリヌクレオチドを含む。無細胞ＤＮＡは健康な個体及び病気の個体において循環する。無細胞ＲＮＡは健康な個体及び病気の個体において循環する。腫瘍（ｃｔＤＮＡ）からのｃｆＤＮＡは、あらゆる特異的な癌タイプには制限されないが、異なる悪性病変にわたる共通の所見であると考えられる。幾つかの測定に従い、血漿中の遊離循環ＤＮＡ濃度は、対照被験体では約１４−１８ｎｇ／ｍｌ、及び腫瘍形成を伴う患者では約１８０−３１８ｎｇ／ｍｌである。アポトーシス及び壊死の細胞死は、体液中の無細胞循環ＤＮＡに起因する。例えば、有意に増大した循環ＤＮＡレベルは、前立腺癌患者、及び良性の前立腺肥大及び前立腺炎（Ｐｒｏｓｔａｔｉｔｓ）などの他の前立腺疾患患者の血漿において観察された。加えて、循環腫瘍ＤＮＡは、原発性腫瘍が生じる臓器から生じる流体に存在する。故に、乳癌検出は、乳管洗浄；便の大腸癌検出；唾液の肺癌検出、及び尿又は射精液の前立腺癌検出において達成することができる。無細胞ＤＮＡは様々なソースから得られる場合がある。１つの共通のソースは被験体の血液サンプルである。しかし、ｃｆＤＮＡ又は他の断片化されたＤＮＡは様々な他のソースに由来する場合もある。例えば、尿及び糞便サンプルはｃｔＤＮＡを含むｃｆＤＮＡのソースであり得る。無細胞ＲＮＡは様々なソースから得られる場合もある。

幾つかの実施形態において、ポリヌクレオチドは、抽出工程の無い、及び／又は精製工程のない後の工程（例えば環状化及び増幅）にさらされる。例えば、流体サンプルは、精製された液体サンプル及び細胞サンプルを産生するための抽出工程、その後の精製された流体サンプルからのＤＮＡの単離無しに細胞を除去するために処理され得る。ポリヌクレオチドの単離のための様々な手順が、沈殿又は基質への非特異的結合、その後の結合されたポリヌクレオチドを放出するための基質の洗浄などにより、利用可能である。ポリヌクレオチドが細胞抽出工程なしにサンプルから単離される場合、ポリヌクレオチドの大部分は細胞外又は「無細胞」のポリヌクレオチドである。例えば、無細胞ポリヌクレオチドは、無細胞ＤＮＡ（「循環」ＤＮＡとも称される）を含み得る。幾つかの実施形態において、循環ＤＮＡは、体液又は排泄物（例えば血液サンプル）などからの腫瘍細胞由来の循環腫瘍ＤＮＡ（ｃｔＤＮＡ）である。無細胞ポリヌクレオチドは無細胞ＲＮＡ（「循環」ＲＮＡとも称される）を含み得る。幾つかの実施形態において、循環ＲＮＡは、腫瘍細胞由来の循環腫瘍ＲＮＡ（ｃｔＲＮＡ）である。腫瘍は頻繁にアポトーシス又は壊死を示し、それにより腫瘍核酸は、異なる形態及び異なるレベルで、様々なメカニズムを介して、被験体の血流を含む身体へと放出される。典型的に、ｃｔＤＮＡのサイズは、より小さな断片のより高い濃度、通常は長さ７０から２００のヌクレオチドから、最大数千キロベースの大きな断片のより低い濃度に及び得る。

本明細書に記載される様々な態様の何れかの幾つかの実施形態において、配列変異体を検出することは、参照配列に対して、或いは突然変異の無いバックグラウンドにおいて突然変異（例えば、稀な体細胞突然変異）を検出することを含み、ここで配列変異体は疾患に関連する。一般的に、疾患又は形質との関連性の統計的、生物学的、及び／又は機能的な証拠が存在する配列変異体は、「原因遺伝子変異体」と称される。単一の原因遺伝子変異体は、１より多くの疾患又は形質に関連付けられ得る。幾つかの実施形態において、原因遺伝子変異体は、メンデル形質、非メンデル形質、又はその両方に関連付けられ得る。原因遺伝子変異体は、１、２、３、４、５、６、７、８、９、１０、２０、５０、又はそれ以上の配列の差異（原因遺伝子変異体を含むポリヌクレオチドと、同じ相対的なゲノム位置にて原因遺伝子変異体を欠くポリヌクレオチドとの間など）など、ポリヌクレオチドにおける変形として現れ得る。原因遺伝子変異体のタイプの非限定的な例は、一塩基多型（ＳＮＰ）、欠失／挿入多型（ＤＩＰ）、コピー数多型（ＣＮＶ）、短いタンデム反復（ＳＴＲ）、制限酵素断片長多型（ＲＦＬＰ）、単純反復配列（ＳＳＲ）、長さが様々なタンデム反復（ＶＮＴＲ）、ランダム増幅多型ＤＮＡ（ＲＡＰＤ）、増幅断片長多型（ＡＦＬＰ）、レトロトランスポゾン間増幅多型（ＩＲＡＰ）、長分散型核内反復配列及び分散型核内反復配列（ＬＩＮＥ／ＳＩＮＥ）、長いタンデム反復（ＬＴＲ）、可動要素、レトロトランスポゾン−マイクロサテライト増幅多型、レトロトランスポゾンベースの挿入多型、配列特異的増幅多型、及び遺伝性の後成的修飾（例えばＤＮＡメチル化）を含む。原因遺伝子変異体はまた、密接に関連する原因遺伝子変異体のセットであり得る。幾つかの原因遺伝子変異体は、ＲＮＡポリヌクレオチドにおける配列の変形として影響を及ぼす場合もある。このレベルで、幾つかの原因遺伝子変異体は、一種のＲＮＡポリヌクレオチドの有無によっても示される。また、幾つかの原因遺伝子変異体はタンパク質ポリペプチドにおける配列の変形を結果としてもたらす。多数の原因遺伝子変異体が報告されている。ＳＮＰである原因遺伝子変異体の一例は、鎌状赤血球貧血を引き起こすヘモグロビンのＨｂＳ変異体である。ＤＩＰである原因遺伝子変異体の一例は、嚢胞性繊維症を引き起こすＣＦＴＲ遺伝子のデルタ５０８突然変異である。ＣＮＶである原因遺伝子変異体の一例は、ダウン症候群を引き起こすトリソミー２１である。ＳＴＲである原因遺伝子変異体の一例は。ハンチントン病を引き起こすタンデム反復である。原因遺伝子変異体及びそれらが関連する疾患の非限定的な例は、表１で提供される。原因遺伝子変異体の追加の非限定的な例はＷＯ２０１４０１５０８４に記載される。突然変異が疾患に関連付けられ、且つ配列変異体が本開示の方法に従い検出され得る、遺伝子の更なる例は、表２で提供される。

幾つかの実施形態において、方法は更に、検出された原因遺伝子変異体に関連付けられる疾患を抱える被験体を診断すること、或いは患者がそのような疾患を抱える又は進行させる可能性を報告することなど、コール工程に基づいて被験体を診断する工程を含む。疾患、関連する遺伝子、及び関連する配列変異体の例は本明細書で提供される。幾つかの実施形態において、結果は、本明細書に記載されるような報告書作成装置を介して報告される。

幾つかの実施形態において、１つ以上の原因遺伝子変異体は、癌、或いは特定の特徴（例えば転移可能性、薬物耐性、薬物反応性）を持つ癌の、特定のタイプ或いは段階に関連付けられる配列変異体である。幾つかの実施形態において、本開示は、特定の突然変異が患者の結果に関連付けられると知られるものなど、予後の判定のための方法を提供する。例えば、ｃｔＤＮＡは、従来の癌抗原５３（ＣＡ−５３）及び循環腫瘍細胞の一覧よりも優れた、乳癌に関するバイオマーカーであると示されている（例えばＤａｗｓｏｎ，ｅｔａｌ．，ＮＥｎｇｌＪＭｅｄ３６８：１１９９（２０１３）を参照）。加えて、本開示の方法は、治療上の決定、ガイダンス、及びモニタリングの他、癌治療の進行及び臨床試験において使用することができる。例えば、処置効果は、分子標的療法（単クローン薬物）、化学療法薬、放射プロトコルなど、或いはこれらの組み合わせなどの特定の治療による処置の前、間、及び後からの患者のｃｔＤＮＡサンプルを比較することによってモニタリングすることができる。例えば、ｃｔＤＮＡは、患者の症状を追跡するモニターの方法によってもたらされるよりも遥かに短い期間で医師が処置を改変（例えば、処置を継続、停止、又は変更）することを可能にする処置後に、特定の突然変異が増加するか又は減少するかどうか、新たな突然変異が現れるかどうかなどを確かめるのにモニタリングすることができる。幾つかの実施形態において、方法は更に、検出された配列変異体に関連付けられる特定の段階又はタイプの癌を抱える被験体を診断すること、或いは患者がそのような癌を抱える又は進行させる可能性を報告することなど、コール工程に基づいて被験体を診断する工程を含む。

例えば、分子マーカー（例えばハーセプチン及びｈｅｒ２／ｎｅｕ状態）に基づいて患者に特異的に標的とされる治療のために、患者は、特定の突然変異が腫瘍に存在するかどうかを見出すために試験され、このような突然変異は、治療に対する反応又は耐性を予測し、且つ治療を用いるかどうかの決定を導くために使用され得る。それ故、処置中にｃｔＤＮＡを検出及びモニタリングすることは、処置の選択を導く際に非常に有用であり得る。幾つかの第１（処置前）又は第２（処置後）の癌突然変異は、幾つかの治療に対する癌の耐性に起因する事がわかっている（Ｍｉｓａｌｅｅｔａｌ．，Ｎａｔｕｒｅ４８６（７４０４）：５３２（２０１２））。

診断、予後、又は処置の決定に有用かもしれない癌の１つ以上の種類に関連付けられる様々な配列変異体が知られている。
本開示の方法での使用を見出す腫瘍学的有意性の適切な標的配列は、限定されないが、ＴＰ５３遺伝子、ＡＬＫ遺伝子、ＫＲＡＳ遺伝子、ＰＩＫ３ＣＡ遺伝子、ＢＲＡＦ遺伝子、ＥＧＦＲ遺伝子、及びＫＩＴ遺伝子における改変を含む。特異的に増幅され、及び／又は配列変異体のために特異的に分析され得る標的配列は、癌に関連する遺伝子の全て又は一部であり得る。幾つかの実施形態において、１つ以上の配列変異体はＴＰ５３遺伝子において同定される。ＴＰ５３はヒト癌における最も頻繁に変異した遺伝子の１つであり、例えば、ＴＰ５３突然変異は、卵巣癌の４５％、大腸癌の４３％、及び上気道消化管の癌の４２％に見出される（例えば、Ｍ．Ｏｌｉｖｉｅｒ，ｅｔ，ａｌ．ＴＰ５３ＭｕｔａｔｉｏｎｓｉｎＨｕｍａｎＣａｎｃｅｒｓ：Ｏｒｉｇｉｎｓ，Ｃｏｎｓｅｑｕｅｎｃｅｓ，ａｎｄＣｌｉｎｉｃａｌＵｓｅ．ＣｏｌｄＳｐｒｉｎｇＨａｒｂＰｅｒｓｐｅｃｔＢｉｏｌ．２０１０Ｊａｎｕａｒｙ；２（１）を参照）。ＴＰ５３の突然変異状態の特性付けは、臨床診断を補助し、予後の値を提供し、癌患者の処置に影響を及ぼし得る。例えば、ＴＰ５３突然変異は、グリア細胞由来のＣＮＳ腫瘍における患者に関する予後不良の予測因子、及び慢性リンパ性白血病の患者の急速な疾患進行の予言者として使用されてもよい（例えば、ＭｃＬｅｎｄｏｎＲＥ，ｅｔａｌ．Ｃａｎｃｅｒ．２００５Ｏｃｔ１５；１０４（８）：１６９３−９；ＤｉｃｋｅｒＦ，ｅｔａｌ．Ｌｅｕｋｅｍｉａ．２００９Ｊａｎ；２３（１）：１１７−２４を参照）。配列の変形が、遺伝子内のあらゆる場所に生じ得る。故に、ＴＰ５３遺伝子の全て又は一部は本明細書中で評価され得る。即ち、本明細書のあらゆる場所に記載されるように、標的特異的成分（例えば標的特異的プライマー）が使用されると、複数のＴＰ５３特異的配列は、例えば、選択された標的のために使用され得るような単に１つ以上の選択されたサブ配列（突然変異の「ホットスポット」など）ではなく、遺伝子に及ぶ断片を増幅且つ検出するために使用することができる。代替的に、１つ以上の選択されたサブ配列の上流又は下流をハイブリダイズする、標的特異的プライマーが設計されてもよい（用語「ホットスポット」により含まれる、被験体の分類のなかの突然変異の割合の増加に関連付けられるヌクレオチド又はヌクレオチド領域など）。そのようなサブ配列に及ぶ標準プライマーが設計され、及び／又は、そのようなサブ配列の上流又は下流をハイブリダイズするＢ２Ｂプライマーが設計されてもよい。

幾つかの実施形態において、１つ以上の配列変異体はＡＬＫ遺伝子の全て又は一部において同定される。ＡＬＫ融合は、肺腫瘍の７％もの数において報告され、その幾つかは、ＥＧＦＲチロシンキナーゼ阻害剤（ＴＫＩ）耐性に関連付けられる（例えば、Ｓｈａｗｅｔａｌ．，ＪＣｌｉｎＯｎｃｏｌ．Ｓｅｐ１０，２００９；２７（２６）：４２４７−４２５３を参照）。最大２０１３の、ＡＬＫチロシンキナーゼドメイン全体にわたる様々な異なる点突然変異が、ＡＬＫチロシンキナーゼ阻害剤（ＴＫＩ）に対する第２の耐性を持つ患者において見出されている（ＫａｔａｙａｍａＲ２０１２ＳｃｉＴｒａｎｓｌＭｅｄ．２０１２Ｆｅｂ８；４（１２０））。故に、ＡＬＫ遺伝子における突然変異検出は、癌治療の決定を補助するために使用することができる。

幾つかの実施形態において、１つ以上の配列変異体はＫＲＡＳ遺伝子の全て又は一部において同定される。肺腺癌患者のおよそ１５−２５％、及び大腸癌患者の４０％が、腫瘍に関連するＫＲＡＳ突然変異を抱えると報告されている（例えばＮｅｕｍａｎ２００９，ＰａｔｈｏｌＲｅｓＰｒａｃｔ．２００９；２０５（１２）：８５８−６２を参照）。突然変異の大半は、ＫＲＡＳ遺伝子のコドン１２、１３、及び６１に位置する。これら突然変異は、腫瘍細胞の成長と増殖を引き起こすＫＲＡＳシグナル伝達経路を活性化する。一部の研究は、ＫＲＡＳの突然変異を抱える腫瘍を持つ患者が抗ＥＧＦＲ抗体療法単独、或いは化学療法と組み合わせて恐らく利益を得ることを示す（例えば、Ａｍａｄｏｅｔａｌ．２００８ＪＣｌｉｎＯｎｃｏｌ．２００８Ａｐｒ１；２６（１０）：１６２６−３４，Ｂｏｋｅｍｅｙｅｒｅｔａｌ．２００９ＪＣｌｉｎＯｎｃｏｌ．２００９Ｆｅｂ１０；２７（５）：６６３−７１を参照）。配列変異体を同定するために標的とされ得る配列の変形のための１つの特定の「ホットスポット」は、遺伝子の位置３５にある。ＫＲＡＳ配列変異体の同定は、大腸癌被験体のための処置選択などの処置選択において使用することができる。

幾つかの実施形態において、１つ以上の配列変異体はＰＩＫ３ＣＡ遺伝子の全て又は一部において同定される。ＰＩＫ３ＣＡの体細胞突然変異は頻繁に、様々なタイプの癌、例えば大腸癌の１０−３０％において見出されている（例えばＳａｍｕｅｌｓｅｔａｌ．２００４Ｓｃｉｅｎｃｅ．２００４Ａｐｒ２３；３０４（５６７０）：５５４．を参照）。これら突然変異は最も一般的に、エクソン９（螺旋状ドメイン）及びエクソン２０（キナーゼドメイン）内の２つの「ホットスポット」領域内にあり、これらは検出配列変異体のための増幅及び／又は分析のために特異的に標的とされ得る。位置３１４０も特異的に標的とされ得る。

幾つかの実施形態において、１つ以上の配列変異体はＢＲＡＦ遺伝子の全て又は一部において同定される。全ての悪性黒色腫の約５０％が、ＢＲＡＦの体細胞突然変異を抱えると報告されている（例えば、Ｍａｌｄｏｎａｄｏｅｔａｌ．，ＪＮａｔｌＣａｎｃｅｒＩｎｓｔ．２００３Ｄｅｃ１７；９５（２４）：１８７８−９０を参照）。ＢＲＡＦ突然変異は全ての黒色腫性の亜型で発見されたが、慢性の太陽により誘発される損傷を伴わない皮膚に由来した黒色腫において最も頻繁に見出された。黒色腫における最も共通のＢＲＡＦ突然変異は、グルタミンを伴う位置６００でバリンを置換する、ミスセンス突然変異Ｖ６００Ｅである。ＢＲＡＦＶ６００Ｅ突然変異はＢＲＡＦ阻害剤治療の臨床効果に関連付けられる。ＢＲＡＦ突然変異の検出は、黒色腫の処置の選択、及び標的療法に対する耐性の研究に使用することができる。

幾つかの実施形態において、１つ以上の配列変異体はＥＧＦＲ遺伝子の全て又は一部において同定される。ＥＧＦＲ突然変異は頻繁に、非小細胞肺癌に関連付けられる（米国では約１０％、東アジアでは３５％；例えば、Ｐａｏｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００４Ｓｅｐ７；１０１（３６）：１３３０６−１１を参照）。これら突然変異は典型的にＥＧＦＲエクソン１８−２１内で生じ、通常はヘテロ接合である。これら突然変異のおよそ９０％は、エクソン１９欠失又はエクソン２１Ｌ８５８Ｒ点突然変異である。

幾つかの実施形態において、１つ以上の配列変異体はＫＩＴ遺伝子の全て又は一部において同定される。消化管間質腫瘍（ＧＩＳＴ）の約８５％が、ＫＩＴ突然変異を抱えると報告されている（例えばＨｅｉｎｒｉｃｈｅｔａｌ．２００３ＪＣｌｉｎＯｎｃｏｌ．２００３ＤｅｃＩ；２１（２３）：４３４２−９を参照）。ＫＩＴ突然変異の大部分は、膜近傍ドメイン（エクソン１１、７０％）、細胞外二量化モチーフ（エクソン９、１０−１５％）、チロシンキナーゼ、Ｉ（ＴＫＩ）ドメイン（エクソン１３、１−３％）、及びチロシンキナーゼ２（ＴＫ２）ドメイン並びに活性化ループ（エクソン１７、１−３％）に見出される。第２のＫＩＴ突然変異は一般に、標的の治療薬であるイマチニブの後、及び患者が治療に対する耐性を発達させた後に同定される。

癌に関連付けられる遺伝子、本明細書に記載される方法に従い配列変異体について分析され得るその全て又は一部の更なる非限定的な例は、限定されないが、ＰＴＥＮ；ＡＴＭ；ＡＴＲ；ＥＧＦＲ；ＥＲＢＢ２；ＥＲＢＢ３；ＥＲＢＢ４；Ｎｏｔｃｈ１；Ｎｏｔｃｈ２；Ｎｏｔｃｈ３；Ｎｏｔｃｈ４；ＡＫＴ；ＡＫＴ２；ＡＫＴ３；ＨＩＦ；ＨＩＦ１ａ；ＨＩＦ３ａ；Ｍｅｔ；ＨＲＧ；Ｂｃｌ２；ＰＰＡＲα；ＰＰＡＲγ；ＷＴ１（ウィルムス腫瘍）；ＦＧＦ受容体ファミリーメンバー（５つのメンバー：１、２、３、４、５）；ＣＤＫＮ２ａ；ＡＰＣ；ＲＢ（網膜芽細胞腫）；ＭＥＮ１；ＶＨＬ；ＢＲＣＡ１；ＢＲＣＡ２；ＡＲ；（アンドロゲン受容体）；ＴＳＧ１０１；ＩＧＦ；ＩＧＦ受容体；Ｉｇｆ１（４つの変異体）；Ｉｇｆ２（３つの変異体）；Ｉｇｆ１受容体；Ｉｇｆ２受容体；Ｂａｘ；Ｂｃｌ２；カスパーゼファミリー（９つのメンバー：１、２、３、４、６、７、８、９、１２）；Ｋｒａｓ；及びＡｐｃを含む。更なる例が本明細書のあらゆる場所で提供される。本明細書に開示される方法に従って１つ以上の配列変異体をコールすることに基づいて診断され得る癌の例は、限定されないが、棘細胞腫、腺房細胞腫、聴神経腫、末端性黒子性黒色腫、先端汗腺、急性好酸球性白血病、急性リンパ芽球性白血病、急性巨核芽球性白血病、急性単球性白血病、成熟による急性骨髄芽球白血病、急性骨髄性樹状細胞白血病、急性骨髄性白血病、急性前骨髄球性白血病、アダマンチノーム、腺癌、腺様嚢胞癌、腺腫、腺様歯原性腫瘍、副腎皮質癌、成人Ｔ細胞白血病、侵襲性ＮＫ細胞白血病、ＡＩＤＳ関連性癌、ＡＩＤＳ関連性リンパ腫、胞巣状軟部肉腫、エナメル芽細胞線維腫、肛門癌、未分化大細胞リンパ腫、組織非形成性甲状腺癌、血管免疫芽球性Ｔ細胞リンパ腫、血管筋脂肪腫、血管肉腫、虫垂癌、星細胞腫、非定型奇形腫様ラブドイド腫瘍、基底細胞癌、基底様癌、Ｂ細胞白血病、Ｂ細胞リンパ腫、ベリニ管癌、胆道癌、膀胱癌、芽細胞腫、骨癌、骨腫瘍、脳幹神経膠腫、脳腫瘍、乳癌、ブレンナー腫瘍、気管支腫瘍、細気管支肺胞上皮癌、褐色腫、バーキットリンパ腫、原発部位不明の癌、カルチノイド腫瘍、癌腫、上皮内癌、陰茎癌腫、原発部位不明の癌腫、癌肉腫、カストルマン病、中枢神経系胚芽腫、小脳星状細胞腫、大脳星細胞腫、子宮頚癌、肝内胆管癌、軟骨腫、軟骨肉腫、脊索腫、絨毛癌、脈絡叢乳頭腫、慢性リンパ性白血病、慢性単球性白血病、慢性骨髄性白血病細胞、慢性骨髄増殖性疾患、慢性好中球性白血病、明細胞腫瘍、結腸癌、大腸癌、頭蓋咽頭腫、皮膚Ｔ細胞リンパ腫、デゴス病、隆起性皮膚線維肉腫、類皮嚢胞、線維形成性小円形細胞腫瘍、びまん性大細胞型Ｂ細胞リンパ腫、胚芽異形成性神経上皮腫瘍、胎児性癌、内胚葉洞腫瘍、子宮内膜癌、子宮内膜子宮癌、子宮内膜性腫瘍、腸疾患関連性Ｔ細胞性リンパ腫、上衣芽細胞腫、上衣腫、類上皮肉腫、赤白血病、食道癌、感覚神経芽腫、腫瘍のユーイングファミリー、ユーイングファミリー肉腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管癌、乳腺外ページェット病、ファロピウス管癌、封入奇形胎児、繊維腫、繊維肉腫、濾胞性リンパ腫、濾胞性甲状腺癌、胆嚢癌、胆嚢癌、神経細胞神経膠腫、節神経腫、胃癌、胃リンパ腫、消化器系癌、消化管カルチノイド腫瘍、消化管間質腫瘍、消化管間質腫瘍、胚細胞腫瘍、胚細胞腫、妊娠性絨毛癌、妊娠性絨毛腫瘍、骨巨細胞腫、多形神経膠芽腫、神経膠腫、神経膠腫症、グロムス腫瘍、グルカゴノーマ、性腺芽細胞腫、顆粒膜細胞腫、ヘアリー細胞白血病、ヘアリー細胞白血病、頭頚部癌、頭頚部癌、心臓癌、血管芽細胞腫、血管周皮腫、血管肉腫、血液学的悪性腫瘍、肝細胞癌、肝脾Ｔ細胞リンパ腫、遺伝性乳房卵巣癌症候群、ホジキンリンパ腫、ホジキンリンパ腫、下咽頭癌、視床下部神経膠腫、炎症性乳癌、眼球内黒色腫、島細胞癌、島細胞腫、若年性骨髄単球性白血病、カポジ肉腫、カポジ肉腫、腎臓癌、クラッツキン腫瘍、クルッケンベルク腫瘍、喉頭癌、喉頭癌、悪性黒子型黒色腫、白血病、白血病、口唇癌及び口腔癌、脂肪肉腫、肺癌、黄体腫、リンパ管腫、リンパ管肉腫、リンパ上皮腫、リンパ性白血病、リンパ腫、マクログロブリン血症、悪性線維性組織球腫、悪性線維性組織球腫、骨悪性線維性組織球腫、悪性神経膠腫、悪性中皮腫、悪性末梢神経鞘腫瘍、悪性ラブドイド腫瘍、悪性トリトン腫瘍、ＭＡＬＴリンパ腫、マントル細胞リンパ腫、マスト細胞白血病、縦隔胚細胞腫瘍、縦隔腫瘍、骨髄甲状腺癌、髄芽腫、髄芽腫、髄様上皮腫、黒色腫、黒色腫、髄膜腫、メルケル細胞腫、中皮腫、中皮腫、原発不明の転移性頸部扁平上皮癌、転移性尿路上皮癌、ミュラー管混合腫瘍、単球性白血病、口腔癌、ムチン性腫瘍、多発性内分泌腫瘍症候群、多発性骨髄腫、多発性骨髄腫、菌状息肉腫、菌状息肉腫、骨髄異形成疾患、骨髄異形成症候群、骨髄性白血病、骨髄性肉腫、骨髄増殖性疾患、粘液腫、鼻腔癌、上咽頭癌、上咽頭癌、新生物、ノイリノーマ、神経芽細胞腫、神経芽細胞腫、神経繊維腫、神経腫、結節型黒色腫、非ホジキンリンパ腫、非ホジキンリンパ腫、非黒色腫性皮膚癌、非小細胞肺癌、眼腫瘍、乏突起星細胞腫、乏突起神経膠腫、膨大細胞腫、視神経鞘髄膜腫、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、骨肉腫、卵巣癌、卵巣癌、卵巣上皮癌、卵巣性胚細胞腫瘍、低悪性度卵巣癌、乳房のパジェット病、パンコースト腫瘍、膵臓癌、膵臓癌、乳頭状甲状腺癌、乳頭腫症、傍神経節腫、副鼻腔癌、副甲状腺癌、陰茎癌、血管周囲類上皮細胞腫瘍、咽頭癌、クロム親和性細胞腫、中間型松果体実質腫瘍、松果体芽腫、下垂体細胞腫、下垂体腺腫、下垂体腫瘍、形質細胞腫瘍、胸膜肺芽腫、多胚腫、前駆体Ｔ−リンパ芽球性リンパ腫、原発性中枢神経系リンパ腫、原発性滲出性リンパ腫、原発性肝細胞性癌、原発性肝臓癌、原発性腹膜癌、原始神経上皮腫瘍、前立腺癌、腹膜偽性粘液腫、直腸癌、腎細胞癌、染色体１５上のＮＵＴ遺伝子に関与する気道癌腫、網膜芽細胞腫、横紋筋腫、横紋筋肉腫、リヒター形質転換、仙尾部奇形腫、唾液腺癌、肉腫、神経鞘腫症、脂腺癌、続発性新生物、精上皮腫、漿液性腫瘍、セルトリ−ライディッヒ細胞腫、性器索間質腫瘍、セザリー症候群、シグネット環細胞癌、皮膚癌、小円形青色細胞腫瘍、小細胞癌、小細胞肺癌、小細胞リンパ腫、小腸癌、軟部組織肉腫、ソマトスタチン産生腫瘍、煤煙性疣贅、脊髄腫瘍、脊椎腫瘍、脾辺縁帯リンパ腫、扁平上皮癌、胃癌、表在拡大型黒色腫、テント上原始神経上皮腫瘍、表層上皮性間質性腫瘍、滑膜肉腫、Ｔ細胞急性リンパ芽球性白血病、Ｔ細胞大顆粒リンパ球白血病、Ｔ細胞白血病、Ｔ細胞性リンパ腫、Ｔ細胞前リンパ球性白血病、奇形腫、末梢リンパ腺癌（Ｔｅｒｍｉｎａｌｌｙｍｐｈａｔｉｃｃａｎｃｅｒ）、精巣癌、莢膜腫、喉頭癌、胸腺癌、胸腺腫、甲状腺癌、腎盂及び尿管の移行性細胞癌、移行上皮癌、尿膜管癌、尿管癌、泌尿生殖器腫瘍、子宮肉腫、ブドウ膜黒色腫、膣癌、ヴァーナー−モリソン症候群、疣状癌、視神経膠腫、外陰癌、ヴァルデンストレームマクログロブリン血症、ワルチン腫瘍、ウィルムス腫瘍、及びそれらの組み合わせを含む。癌に関連付けられる特定の配列変異体の非限定的な例は表３で提供される。

加えて、本明細書に開示される方法及び組成物は、１つ以上の癌のタイプ、段階、又は癌の特徴に関連付けられる新規で稀な突然変異を発見するのに有用であり得る。例えば、分析中の特徴（例えば、特定の疾患、癌のタイプ、癌の段階など）を共有する個体の集団は、配列変異体又は配列変異体のタイプ（例えば、特定の遺伝子又は遺伝子の部分における突然変異）を同定するために、本開示に従う配列変異体の検出方法にさらされてもよい。特徴のない個体におけるよりも統計的に有意に大きな頻度で特徴を共有する個体の群の中に生じると同定される配列変異体は、その特徴とのある程度の関連性を割り当てられる場合もある。そのように同定された配列変異体又は配列変異体のタイプはその後、それらを抱えると発見された個体を診断又は処置する際に使用されるかもしれない。

他の治療用途は、非侵襲性の胎児の診断法における使用を含む。胎児のＤＮＡは妊婦の血液中で見つけることができる。本明細書に記載される方法及び組成物は、循環胎児ＤＮＡにおける配列変異体を同定するために使用することができ、故に、１つ以上の原因遺伝子変異体に関連付けられるものなど、胎児における１つ以上の遺伝病を診断するために使用されてもよい。原因遺伝子変異体の非限定的な例は本明細書に記載されており、三染色体性、嚢胞性繊維症、鎌状赤血球貧血、及びテイ−サックス病が挙げられる。本実施形態において、母親は、比較のために使用される対照サンプル及び血液サンプルを提供してもよい。対照サンプルは適切な組織であり、典型的には細胞内ＤＮＡを抽出するためのプロセスであり、これは後に参照配列を提供するために配列決定され得る。その後、胎児のゲノムＤＮＡに対応するｃｆＤＮＡの配列は、母親の参照に対する配列変異体として同定することができる。父親も、胎児の配列、及び配列変異体の同定を補助するために参照サンプルを提供してもよい。

また更なる治療用途は、情報が診断及び処置方法の選択を通知し得る、病原体（例えば細菌、ウイルス、真菌、及び微生物）などからの外因性ポリヌクレオチドの検出を含む。例えば、幾つかのＨＩＶ亜型は、薬物耐性に相関する（例えばｈｉｖｄｂ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｐａｇｅｓ／ｇｅｎｏｔｙｐｅ−ｒｘを参照）。同様に、ＨＣＶの分類、細分類、及びアイソタイプ突然変異も本開示の方法及び組成物を使用して行うことができる。更に、ＨＰＶ亜型が子宮頚癌のリスクと相関される場合、そのような診断は更に癌のリスクの評価を通知する。更に、検出され得るウイルスの非限定的な例は、ヘパドナウイルス科Ｂ型肝炎ウイルス（ＨＢＶ）、ウッドチャック肝炎ウイルス、リス（ヘパドナウイルス科）肝炎ウイルス、アヒルＢ型肝炎ウイルス、アオサギＢ型肝炎ウイルス、ヘルペスウイルス単純疱疹ウイルス（ＨＳＶ）１型及び２型、水痘−帯状疱疹ウイルス、サイトメガロウイルス（ＣＭＶ）、ヒト−サイトメガロウイルス（ＨＣＭＶ）、マウス−サイトメガロウイルス（ＭＣＭＶ）、モルモット−サイトメガロウイルス（ＧＰＣＭＶ）、エプスタイン−バーウイルス（ＥＢＶ）、ヒト−ヘルペスウイルス６（ＨＨＶ変異体Ａ及びＢ）、ヒト−ヘルペスウイルス７（ＨＨＶ−７）、ヒト−ヘルペスウイルス８（ＨＨＶ−８）、カポジ肉腫関連ヘルペスウイルス（ＫＳＨＶ）、Ｂウイルス・ポックスウイルス・ワクシニアウイルス、痘瘡ウイルス、天然痘ウイルス、サル痘ウイルス、牛痘ウイルス、ラクダ痘ウイルス、エクトロメリアウイルス、マウス痘ウイルス、ウサギ痘ウイルス、アライグマ痘ウイルス、伝染性軟属腫ウイルス、オルフウイルス、ミルカー結節ウイルス、ウシ丘疹性口内炎ウイルス、ヒツジ痘ウイルス、ヤギ痘ウイルス、ランピースキン病ウイルス、鶏痘ウイルス、カナリア痘ウイルス、鳩痘ウイルス、スズメ痘ウイルス、粘液腫ウイルス、野兎線維腫ウイルス、ウサギ線維腫ウイルス、リス線維腫ウイルス、豚痘ウイルス、タナ痘ウイルス、ヤナ痘ウイルス、フラビウイルス、デングウイルス、Ｃ型肝炎ウイルス（ＨＣＶ）、ＧＢ肝炎ウイルス（ＧＢＶ−Ａ、ＧＢＶ−Ｂ、及びＧＢＶ−Ｃ）、西ナイルウイルス、黄熱ウイルス、セントルイス脳炎ウイルス、日本脳炎ウイルス、ポワサンウイルス、ダニ媒介性脳炎ウイルス、キャサヌール森林病ウイルス、トガウイルス、ベネズエラウマ脳炎（ＶＥＥ）ウイルス、チクングンヤウイルス、ロスリバーウイルス、マヤロウイルス、シンドビスウイルス、風疹ウイルス、レトロウイルス、ヒト免疫不全ウイルス（ＨＩＶ）１型及び２型、ヒトＴ細胞白血球ウイルス（ＨＴＬＶ）１、２、及び５型、マウス乳腺腫瘍ウイルス（ＭＭＴＶ）、ラウス肉腫ウイルス（ＲＳＶ）、レンチウイルス、コロナウイルス、重症急性呼吸器症候群（ＳＡＲＳ）ウイルス、フィロウイルス、エボラウイルス、マールブルグウイルス、ヒトメタニューモウイルス（ＨＭＰＶ）などのメタニューモウイルス（ＭＰＶ）、ラブドウイルス、狂犬病ウイルス、水疱性口内炎ウイルス、ブンヤウイルス、クリミア・コンゴ出血熱ウイルス、リフトバレー熱ウイルス、ラクロスウイルス、ハンタウイルス、オルソミクソウイルス、インフルエンザウイルス（Ａ、Ｂ、及びＣ型）、パラミクソウイルス、パラインフルエンザウイルス（ＰＩＶ１、２、及び３型）、呼吸系発疹ウイルス（Ａ及びＢ型）、麻疹ウイルス、ムンプスウイルス、アレナウイルス属、リンパ球脈絡髄膜炎ウイルス、フニンウイルス、マクポウイルス、グアナリトウイルス、ラッサ熱ウイルス、Ａｍｐａｒｉウイルス、Ｆｌｅｘａｌウイルス、イッピーウイルス、Ｍｏｂａｌａウイルス、モペイアウイルス、ラチノウイルス、パラナウイルス、ピキンデウイルス、プンタトロウイルス（ＰＴＶ）、タカリベウイルス、及びタミアミウイルスを含む。

本開示の方法によって検出され得る病原菌の例、病原菌の特定の例は、限定されないが、アシネトバクター・バウマンニ、アクチナバチルスｓｐ．、放線菌、アクチノミセスｓｐ．（イスラエル放線菌及びネスルンド放線菌など）、エロモナスｓｐ．、（エロモナス・ハイドロフィラ、エロモナス・ベロニ次亜種ソブリア（エロモナス・ソブリア）、及びエロモナス・キャビエなど）、アナプラズマ・ファゴサイトフィルム、アクロモバクター・キシロソキシダンス、アシネトバクター・バウマニ、アクチノバシラス・アクチノミセテムコミタンス、バチルスｓｐ．（バシラス・アンスラシス、バチルス・セレウス、バチルス・スブチリス、バチルス・スリンギエンシス、及びバチルス・ステアロテルモフィルスなど）、バクテロイデスｓｐ．（バクテロイデス・フラジリスなど）、バルトネラｓｐ．（バルトネラ・バシリホルミス及びバルトネラ・ヘンセラなど）、ビフィドバクテリウムｓｐ．、ボルデテラｓｐ．（ボルデテラ・パータッシス、ボルデテラ・パラパータシス、及びボルデテラ・ブロンキセプチカなど）、ボレリアｓｐ．（回帰熱ボレリア及びボレリア・ブルグドルフェリなど）、ブルセラｓｐ．（ブルセラ・アボルタス、ブルセラ・カニス、ブブルセラ・メリテンシス、及びブルセラ・スイスなど）、バークホルデリアｓｐ．（バークホルデリア・シュードマレイ及びバークホルデリア・セパシアなど）、カンピロバクターｓｐ．（カンピロバクター・ジェジュニ、カンピロバクター・コリ、カンピロバクター・ラリ、及びカンピロバクター・フィタスなど）、カプノシトファガｓｐ．、カルジオバクテリウム・ホミニス、クラミジア・トラコマーティス、クラミドフィラ・ニューモニエ、クラミドフィラ・シタッシ、シトロバクターｓｐ．、コクシエラ・ブルネッティ、コリネバクテリウムｓｐ．（コリネバクテリウム・ジフテリエ、コリネバクテリウム・ジェイケウム、及びコリネバクテリウムなど）、クロストリジウムｓｐ．（クロストリジウム・パーフリンジェンス、クロストリジウム・ディフィシレ、クロストリディウム・ボツリナム、及びクロストリジウム・テタニなど）、エイケネラ・コローデンス、エンテロバクターｓｐ．（エンテロバクター・エロゲネス、エンテロバクター・アグロメランス、エンテロバクター・クロアカエ、及び、日和見性大腸菌、腸内毒素原性大腸菌、腸管侵入性大腸菌、病原大腸菌、腸管出血性大腸菌、腸管凝集性大腸菌、並びに尿路疾患性大腸菌を含む大腸菌など）、エンテロコッカスｓｐ．（エンテロコッカス・フェカーリス及びエンテロコッカス・フェシウムなど）、エーリキアｓｐ．（エーリキア・シャフェンシス及びエーリキア・カニスなど）、ブタ丹毒菌、ユーバクテリウムｓｐ．、フランシセラ・ツラレンシス、フソバクテリウム・ヌクレアトゥム、ガードネレラ・バギナリス、ゲメラ・モルビロルム、ヘモフィルスｓｐ．、（ヘモフィルス・インフルエンザエ、ヘモフィルス・デュクレイ、ヘモフィルス・エジプチウス、ヘモフィルス・パラインフルエンザ、ヘモフィルス・ヘモリチカス、及びヘモフィルス・パラヘモリティクス）、ヘリコバクターｓｐ．（ヘリコバクター・ピロリ、ヘリコバクター・シネディ、及びヘリコバクター・フェネリエなど）、キンゲラ・キンギイ、クレブシェラｓｐ．（クレブシエラ・ニューモニエ、クレブシエラ・グラニュロマティス、及びクレブシエラ・オキシトカなど）、ラクトバチルスｓｐ．、リステリア・モノサイトゲネス、レプトスピラ・インターロガンス、レジュネラ・ニューモフィラ、レプトスピラ・インターロガンス、ペプトストレプトコッカスｓｐ．、モラクセラ・カタラーリス、モルガネラｓｐ．、モビルンカスｓｐ．、ミクロコッカスｓｐ．、マイコバクテリウムｓｐ．（らい菌、マイコバクテリウム・ツベルクローシス、マイコバクテリウム・イントラセルラーレ、マイコバクテリウム・アビウム、マイコバクテリウム・ボビス、及びマイコバクテリウム・マリヌムなど）、マイコプラズマｓｐ．（マイコプラズマ・ニューモニエ、マイコプラズマ・ホミニス、及びマイコプラズマ・ゲニタリウムなど）、ノカルジアｓｐ．（ノカルジア・アステロイデス、ノカルジア・シリアシゲオルジカ、及びノカルジア・ブラジリエンシスなど）、ナイセリアｓｐ．（ナイセリア・ゴノレア及びナイセリア・メニンギティディスなど）、パスツレラ・マルトシダ、プレジオモナス・シゲロイデス、プレボテラｓｐ．、ポルフィロモナスｓｐ．、プレボテラ・メラニノゲニカ、プロテウスｓｐ．（プロテウス・ブルガリス及びプロテウス・ミラビリスなど）、プロビデンシアｓｐ．（プロビデンシア・アルカリファシエンス、プロビデンシア・レットゲリ、及びプロビデンシア・スチュアルティイなど）、シュードモナス・エルジノーサ、プロピオニバクテリウム・アクネス、ロドコッカス・エクイ、リケッチアｓｐ．（リケッチア・リケッチイ、リケッチア・アカリ及びリケッチア・プロワツェキイ、オリエンティア・ツツガムシ（以前は：リケッチア・ツツガムシ）及びリケッチア・チフィ）、ロドコッカスｓｐ、セラチア・マルセスセンス、ステノトロホモナス・マルトフィリア、サルモネラｓｐ．（サルモネラ・エンテリカ、サルモネラ・チフィ、サルモネラ・パラチフィ、サルモネラ・エンテリティディス、サルモネラ・コレレスイス、及びサルモネラ・ティフィムリウムなど）、セラチアｓｐ．（セラチア・マルセセンス及びセラチア・リクファシエンスなど）、シゲラｓｐ．（志賀赤痢菌、シゲラ・フレックスネリ、シゲラ・ボイディ、及びシゲラ・ソネイなど）、スタフィロコッカスｓｐ．（スタフィロコッカス・アウレウス、スタフィロコッカス・エピデルミデス、スタフィロコッカス・ヘモリチカス、スタフィロコッカス−サプロフィティクスなどの）、連鎖球菌ｓｐ.（ストレプトコッカス・ニューモニエ（例えば、クロラムフェニコール耐性セロタイプ４肺炎連鎖球菌、スペクチノマイシン耐性セロタイプ６Ｂ肺炎連鎖球菌、ストレプトマイシン耐性セロタイプ９Ｖ肺炎連鎖球菌、エリスロマイシン耐性セロタイプ１４肺炎連鎖球菌、オプトヒン耐性セロタイプ１４肺炎連鎖球菌、リファンピシン耐性セロタイプ１８Ｃ肺炎連鎖球菌、テトラサイクリン耐性セロタイプ１９Ｆ肺炎連鎖球菌、ペニシリン耐性セロタイプ１９Ｆ肺炎連鎖球菌、及びトリメトプリム耐性セロタイプ２３Ｆ肺炎連鎖球菌、クロラムフェニコール耐性セロタイプ４肺炎連鎖球菌、スペクチノマイシン耐性セロタイプ６Ｂ肺炎連鎖球菌、ストレプトマイシン耐性セロタイプ９Ｖ肺炎連鎖球菌、オプトヒン耐性セロタイプ１４肺炎連鎖球菌、リファンピシン耐性セロタイプ１８Ｃ肺炎連鎖球菌、ペニシリン耐性セロタイプ１９Ｆ肺炎連鎖球菌、又はトリメトプリム耐性セロタイプ２３Ｆ肺炎連鎖球菌）、ストレプトコッカス・アガラクティエ、ストレプトコッカス・ミュータンス、ストレプトコッカス・ピオゲネス、Ａ群溶連菌、ストレプトコッカス・ピオゲネス、Ｂ群溶連菌、ストレプトコッカス・アガラクティエ、Ｃ群溶連菌、ストレプトコッカス・アンギノスス、ストレプトコッカス・エキシミリス、Ｄ群溶連菌、ストレプトコッカス・ボビス、Ｆ群溶連菌、及びストレプトコッカス・アンギノスス、Ｇ群溶連菌など）、鼠咬症スピリルム、ストレプトバチルス・モニリホルム、トレポネーマｓｐ．（ピンタフランベンジア、トレポネーマ・ペルテニュ、梅毒トレポネーマ、及びトレポネーマ・エンデミカムなど）、トロフェリマ・ホウィップリ、ウレアプラズマ・ウレアリチカム、ベイヨネラｓｐ．、ビブリオｓｐ．（ビブリオ・コレラエ、ビブリオ・パラヘモリチカス、ビブリオ・バルニフィカス、ビブリオ・パラヘモリチカス、ビブリオ・バルニフィカス、ビブリオ・アルギノリチカス、ビブリオ・ミミカス、ビブリオ・ホリセ、ビブリオ・フルビアリス、ビブリオ・メチニコフィイ、ビブリオ・ダムセラ、及びビブリオ・ファーニシイ）、エルジニアｓｐ．（エルシニア・エンテロコリチカ、エルシニア・ペスチス、及びエルシニア・シュードツベルクローシスなど）、及びザントモナス・マルトフィリアなどの１つ以上（或いはそれらの組み合わせ）を含む。

幾つかの実施形態において、本開示の方法及び組成物は臓器移植レシピエントをモニタリング際に使用される。典型的に、ドナー細胞からのポリヌクレオチドは、受容細胞からのポリヌクレオチドのバックグラウンドにおける循環に見出される。ドナー循環ＤＮＡのレベルは通常、臓器が十分に受け入れられた場合に安定し、ドナーＤＮＡ（例えば、与えられたサンプルにおける頻度として）の急速な増加は、移植拒絶反応の初期兆候として使用することができる。処置は移植の失敗を予防するためにこの段階で与えることができる。ドナー臓器の拒絶は血液中のドナーＤＮＡの増加を結果としてもたらすと示されている；Ｓｎｙｄｅｒｅｔａｌ．，ＰＮＡＳ１０８（１５）：６６２９（２０１１）を参照。本開示は、この分野における以前の技術にわたって著しい感度の改善を提供する。本実施形態において、レシピエント対照サンプル（例えば口腔粘膜検体採取物など）及びドナー対照サンプルは、比較のために使用することができる。レシピエントサンプルはその参照配列を提供するために使用することができ、一方でドナーのゲノムに対応する配列はその参照に対する配列変異体として同定することができる。モニタリングは、一定期間にわたりレシピエントからサンプル（例えば血液サンプル）を得る工程を含み得る。初期のサンプル（例えば最初の数週間以内）はドナーｃｆＤＮＡの分画のためのベースラインを確立するために使用することができる。後のサンプルはベースラインと比較することができる。幾つかの実施形態において、約、又は少なくとも約１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、１００％、２５０％、５００％、１０００％、又はそれ以上のドナーｃｆＤＮＡの分画の増加は、レシピエントがドナー組織を反映するプロセスにいることの指標として役立ち得る。

幾つかの実施形態において、検出の方法が提供される。

以下の例は、本発明の様々な実施形態を例証する目的で与えられ、いかなるやり方でも本発明を制限することを意図していない。本明細書に記載される方法とともに、本実施例は、好ましい実施形態の代表例である且つ典型的なものであり、本発明の範囲を限定するものとして意図されない。請求項の範囲によって定義される本発明の精神内に包含されるその変化および他の使用が、当業者に想定される。

実施例１：突然変異検出のための縦列反復の配列決定ライブラリの調製
１２μＬの水の中の＞１０ｎｇの〜１５０ｂｐＤＮＡ断片或いは１０ｍＭのＴｒｉｓ−ＨＣｌｐＨ８．０から始めて、２μＬの１０ＸＣｉｒｃＬｉｇａｓｅ緩衝液混合物を加え、混合物を２分かけて９５℃に加熱し、５分間氷の上で冷やした。これに、４μＬの５Ｍベタイン、１μＬの５０ｍＭＭｎＣｌ_２、及び１μＬのＣｉｒｃＬｉｇａｓｅＩＩを加えた。反応物を少なくとも１２時間、６０℃でインキュベートした。次に、２μＬのＲＣＡプライマー混合物（それぞれ５０ｎＭ、５ｎＭの最終濃度まで）を加えて、混合した。混合を２分かけて９５℃に加熱し、２時間かけて４２℃に冷ました。ＣｉｒＬｉｇａｔｉｏｎ産物を、Ｚｙｍｏオリゴヌクレオチド精製キットにより精製した。製造者の指示に従って、２８μＬの水を５０μＬの全容積のために２２μＬのＣｉｒｃＬｉｇａｔｉｏｎ産物に加えた。これを１００μＬのオリゴ結合緩衝液及び４００μＬのエタノールと混合した。これを３０秒間＞１０，０００ｘｇで回転させ、通過画分を捨てた。７５０μＬのＤＮＡ洗浄緩衝液を加え、次いで＞１０，０００ｘｇで３０秒間回転させ、通過画分を捨て、全速力で更に１分間回転させた。カラムを新たなエッペンドルフ管に移し、１７μＬの水で溶出した（最終の溶出された容量はおよそ１５μＬであった）。

ローリングサークル増幅を約５０μＬの量で行った。１５μＬの溶出サンプルに、５μＬの１０ＸＲｅｐｌｉＰＨＩ緩衝液（Ｅｐｉｃｅｎｔｒｅ）、１μＬの２５ｍＭｄＮＴＰｓ、２μＬの１００ｍＭＤＴＴ、１μＬの１００Ｕ／μＬＲｅｐｌｉＰＨＩＰｈｉ２９、及び２６μＬの水を加えた。反応混合物を３０℃で１時間インキュベートした。残りの洗浄工程のために製造業者の指示に従い、８０μＬのＡｍｐｕｒｅビーズを加えることによりＲＣＡ産物を精製した。溶出のために、２２．５μＬの溶出緩衝液を加え、ビーズを６５℃で５分間インキュベートした。簡単に回転させた後、管を磁石に戻した。

ＲＣＡ反応からの約２０μＬの溶離された産物を、２５μＬの２ＸＰｈｕｓｉｏｎＭａｓｔｅｒｍｉｘ、２．５μＬのＤＭＳＯ、及び、０．５μＬの１０μＭ各Ｂ２Ｂプライマー混合物と混合させた。増幅は以下のＰＣＲプログラムを使用した：９５℃で１分間、５回のサイクルの拡大（９５℃で１５秒間、５５℃で１５秒間、７２℃で１分間）、１３−１８回のサイクルの複製（９５℃で１５秒間、６８℃で１５秒間、７２℃で１分間）、及び７２℃で７分間の最終の拡大。ＰＣＲ産物のサイズをＥ−ゲルの実行により確認した。範囲が１００−５００ｂｐであった場合、０．６ＸＡｍｐｕｒｅビーズの精製を行い、３００−５００ｂｐに富化して、小型ＲＮＡライブラリアダプタープライマーでＰＣＲをもう１回行うために１−２ｎｇを得た。産物のサイズ範囲が＞１０００ｂｐであった場合、産物を１．６ＸＡｍｐｕｒｅビーズで生成し、ＮｅｘｔｅｒａＸＴアンプリコンライブラリ調製のために２−３ｎｇを得て、０．６ＸＡｍｐｕｒｅビーズ精製によって４００−１０００ｂｐの範囲でサイズを富化した。

配列決定データ上でバイオインフォマティクスを実行するために、ＦＡＳＴＱファイルをＭｉＳｅｑランから得た。配列を、ＢＷＡを使用して標的とされた配列（例えばＫＲＡＳ及びＥＧＦＲ）を含む参照ゲノム配列へと、ＦＡＳＴＱファイルにおいて整列させた。反復単位及びその参照位置の領域と長さを、アラインメント結果を使用して各配列（両方のリード）について見出した。全ての遺伝子座における変異体を、各配列の反復単位のアラインメント結果及び情報を使用して見出した。２つのリードの結果を組み合わせた。変異体の標準化された頻度及びノイズレベルを計算した。確認された変異体からの変異体コールにおける複数のさらなる基準を適用し、これにはｑスコア＞３０及びｐ値＜０．０００１が含まれる。これら基準を通過した、確認された変異体は、真の変異体（突然変異）として報告された。プロセスをコンピュータ言語（例えばパイソン）によって自動化することができる。

実施例２：配列変異体の検出のための縦列反復配列決定ライブラリの作成
１２μＬの容量において１５０ｂｐの平均長さを持つ１０ｎｇのＤＮＡ断片を、縦列反復配列決定ライブラリ構築のために使用した。ＤＮＡを前もってＴ４ポリヌクレオチドキナーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）で処理し、５’末端にてリン酸基を加え、３’末端にてヒドロキシル基を残した。ＤＮａｓｅＩ又は酵素断片化から生成され、或いは血清又は血漿から抽出されたＤＮＡ断片に関して、終点処理工程をスキップした。ＤＮＡを２μＬの１０ＸＣｉｒｃＬｉｇａｓｅ緩衝液（ＥｐｉｃｅｎｔｒｅＣＬ９０２１Ｋ）と混合した。混合物を２分かけて９５℃に加熱し、５分間氷の上で冷まし、その後、４μＬのベタイン、１μＬの５０ｍＭＭｎＣｌ_２、及び１μＬのＣｉｒｃＬｉｇａｓｅＩＩ（ＥｐｉｃｅｎｔｒｅＣＬ９０２１Ｋ）を加えた。ライゲーション反応を少なくとも１２時間、６０℃で行った。２００ｎＭで１μＬの各ＲＣＡプライマー混合物（１０ｎＭの最終濃度の最終まで）をライゲーション産物に加えて混合し、１分かけて９６℃に加熱し、４２℃に冷まし、４２℃で２時間インキュベートした。

ハイブリダイズされたＲＣＡプライマーを有するＣｉｒｃＬｉｇａｔｉｏｎ産物を、Ｚｙｍｏオリゴヌクレオチド精製キット（ＺｙｍｏＲｅｓｅａｒｃｈ，Ｄ４０６０）により精製した。これを行うために、２１μＬの産物を、２８μＬの水及び１μＬの担体ＲＮＡ（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、Ｒ５６３６、１ＸＴＥ緩衝液により２００ｎｇ／μＬで希釈）で５０μＬに希釈した。希釈したサンプルを、１００μＬのオリゴ結合緩衝液及び４００μＬの１００％エタノールと混合した。混合物をカラムに載せ、＞１０，０００ｘｇで３０秒間、遠心分離を行った。通過画分を捨てた。＞１０，０００ｘｇで３０秒間遠心分離し、通過画分を捨て、且つ全速力で更に１分間遠心分離することにより、７５０μＬのＤＮＡ洗浄緩衝液によりカラムを洗浄した。カラムを新たな１．５ｍＬのエッペンドルフ管に移し、ＤＮＡを１７μＬの溶出緩衝液（１０ｍＭＴｒｉｓ＝ＣｌｐＨ８．０、最終の溶出量約１５μＬ）で溶出した。

５μＬの１０ＸＲｅｐｌｉＰＨＩ緩衝液、２μＬの２５ｍＭｄＮＴＰｓ、２μＬの１００ｍＭＤＴＴ、１μＬの１００Ｕ／μＬＲｅｐｌｉＰＨＩＰｈｉ２９、及び２５μＬの水（Ｅｐｉｃｅｎｔｒｅ，ＲＨ０４０２１０）を、５０μＬの総反応量のために、カラムからの１５μＬの溶出サンプルに加えた。反応混合物を３０℃で２時間インキュベートした。ＲＣＡ産物を、８０μＬのＡｍｐｕｒｅＸＰビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ａ６３８８１）を加えることにより精製した。洗浄工程は製造業者の指示に従った。ＲＣＡ産物を、２２．５μＬ溶出緩衝液中の６５℃で５分間のインキュベーションの後に溶出した。磁石に戻す前に管を簡単に遠心分離した。

ＲＣＡ反応からの約２０μＬの溶出産物を、２５μＬの２ＸＰｈｕｓｉｏｎＭａｓｔｅｒｍｉｘ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＭ０５３１Ｓ）、２．５μＬの水、２．５μＬのＤＭＳＯ、及び０．５μＬのＢ２Ｂプライマー（各々１０μＭ）と混合した。増幅を、以下の熱循環プログラムで実行した：９５℃で２分間、５回のサイクルの拡大（９５℃で３０秒間、５５℃で１５秒間、７２℃で１分間）、１８回のサイクルの複製（９５℃で１５秒間、６８℃で１５秒間、７２℃で１分間）、及び７２℃で７分間の最終の拡大。ＰＣＲ産物のサイズを電気泳動によって確認した。一旦長いＰＣＲ産物が電気泳動によって確認されると、ＰＣＲ産物を、精製のために３０μＬのＡｍｐｕｒｅビーズ（０．６Ｘ容量）と混合し、＞５００ｂｐのＰＣＲ産物を富化した。精製された産物を、Ｑｕｂｉｔ２．０ＱｕａｎｔｉｆｉｃａｔｉｏｎＰｌａｔｆｏｒｍ（Ｉｎｖｉｔｒｏｇｅｎ）で定量化した。約１ｎｇの精製ＤＮＡを、ＮｅｘｔｅｒａＸＴＡｍｐｌｉｃｏｎライブラリ調製物（ＩｌｌｕｍｉｎａＦＣ−１３１−１０２４）のために使用した。＞５００ｂｐの挿入物サイズを持つライブラリ要素を、０．６ＸＡｍｐｕｒｅビーズでの精製によって富化した。

増幅されたライブラリの濃度及びサイズ分布を、ＡｇｉｌｅｎｔＤＮＡＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＫｉｔｆｏｒｔｈｅ２１００Ｂｉｏａｎａｌｙｚｅｒ（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓＩｎｃ．，ＳａｎｔａＣｌａｒａ，ＣＡ）を使用して分析した。配列決定を、２−２５０ｂｐのＭｉＳｅｑ配列決定キットを伴うＩｌｌｕｍｉｎａＭｉＳｅｑを使用して実行した。ＭｉＳｅｑマニュアルに従って、１２ｐＭの変性ライブラリを配列決定ランに載せた。

この手順に対する変形において、Ｉｌｌｕｍｉｎａアダプターを、Ｎｅｘｔｅｒａ調製物の代わりにライブラリ調製物に使用した。これを行うために、約１ｎｇの同様に精製されたＤＮＡを、Ｂ２Ｂプライマーの普遍的部分及びＩｌｌｕｍｉｎａアダプター配列（Ｐ５及びＰ７；５’ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡ３’及び５’ＡＣＡＣＴＣＴＴＴＣＣＣＴＡＣＡＣＧＡＣＧＣＴＣＴＴＣＣＧＡＴＣＴ３’）を含む１対のプライマーでのＰＣＲ増幅のために使用した。ＰｈｕｓｉｏｎＭａｓｔｅｒＭｉｘを使用して、１２回のサイクルの複製工程（９５℃で３０秒間、５５℃で１５秒間、７２℃で６０秒間）を行った。この増幅工程の目的はアンプリコン配列決定のためにＩｌｌｕｍｉｎａアダプターを加えることであった。長さ＞５００ｂｐのアンプリコンを０．６ＸＡｍｐｕｒｅビーズにより富化した。アンプリコンライブラリの濃度及びサイズ分布を、ＡｇｉｌｅｎｔＤＮＡＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＫｉｔｆｏｒｔｈｅ２１００Ｂｉｏａｎａｌｙｚｅｒ（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓＩｎｃ．，ＳａｎｔａＣｌａｒａ，ＣＡ）を使用して分析した。配列決定を、２×２５０ｂｐのＭｉＳｅｑ配列決定キットを伴うＩｌｌｕｍｉｎａＭｉＳｅｑを使用して実行した。Ｂ２Ｂプライマーの普遍的部分はまた、配列決定プライマー配列として機能し、プライマーがＩｌｌｕｍｉｎａｋｉｔに含まれなかった場合にカスタム配列決定プライマーが加えられる。１２ｐＭの変性ライブラリを配列決定ランに載せた。

一例の分析における標的領域の被覆率を図３３で例示する。下記の表６は標的領域の分析に関する結果を記載する。

表４は、本開示の方法において有用なＲＣＡプライマーの例を提供する。表５は、本開示の方法において有用なＢ２Ｂプライマーの例を提供する。

実施例３：配列決定ライブラリ構築のためのゲノムＤＮＡの断片形成
１μＬのゲノムＤＮＡを、製造者のプロトコルを従って、ＮＥＢＮｅｘｔｄｓＤＮＡＦｒａｇｍｅｎｔａｓｅキット（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を使用して処理した。インキュベーション時間を３７℃で４５分に延ばした。断片化反応を、５μＬの０．５ＭＥＤＴＡｐＨ８．０を加えることにより止め、製造者のプロトコルに従いＡｍｐｕｒｅＸＰビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ａ６３８８１）の２倍容量を加えることによって精製した。断片化されたＤＮＡを、ＢｉｏａｎａｌｙｚｅｒｗｉｔｈａＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙＤＮＡｋｉｔ（Ａｇｉｌｅｎｔ）上で分析した。断片化されたＤＮＡのサイズ範囲は典型的に約１００ｂｐから約２００ｂｐであり、ピークは約１５０ｂｐであった。

実施例４：ライブラリ調製手順
この実施例では、ＫＡＰＡライブラリ調製キット（ＫＫ８２３０）を例示目的のために使用した。

ビーズ精製に関与する工程のために、ＡＭＰｕｒｅＸＰビーズ（ｃａｔ＃Ａ６３８８１）を室温に平衡化し、サンプルと混合する前に徹底的に再撹拌した。ボルテックス・ミキサー上でサンプルと徹底的に混合した後、これを室温で１５分間インキュベートし、ＤＮＡがビーズに結合することを可能にした。その後、液体が透明になるまでビーズを磁気スタンドに置いた。その後、ビーズを２００ｕｌの８０％エタノールで２回洗浄し、室温で１５分間乾燥させた。

端部修復反応（ｅｎｄ−ｒｅｐａｉｒｒｅａｃｔｉｏｎ）を行うために、最大５０μＬ（２−１０ｎｇ）の無細胞ＤＮＡを、２０μＬの端部修復ｍａｓｔｅｒｍｉｘ（８μＬの水、７μＬの１０ＸＫＡＰＡ端部修復緩衝液、及び５μＬのＫＡＰＡ端部修復酵素混合物）と混合し、２０℃で３０分間インキュベートした。その後、１２０μＬのＡＭＰｕｒｅＸＰビーズを７０μＬ端部修復反応物に加えた。その後、サンプルを上記のように精製した。

Ａ尾部付加反応（Ａ−ｔａｉｌｉｎｇｒｅａｃｔｉｏｎ）を行うために、端部修復したＤＮＡ断片を含んでいる乾燥ビーズを、Ａ尾部付加ｍａｓｔｅｒｍｉｘ（４２μＬの水、５μＬの１０ＸＫＡＰＡＡテーリング緩衝液、及びＫＡＰＡＡ尾部付加酵素）と混合した。反応混合物を３０℃で３０分間インキュベートした。９０μＬのＰＥＧ溶液（２０％のＰＥＧ８０００、２．５ＭＮａＣｌ）を加えた後、混合物を、上記のビーズ精製プロトコルに従い洗浄した。このＡ尾部付加工程は、平滑末端ライゲーション反応ではスキップされた。

リンカーライゲーションのために、以下の配列を持つ２つのオリゴ（５’から３’）を使用し、アダプターポリヌクレオチド複製を形成した：／５Ｐｈｏｓ／ＣＣＡＴＴＴＣＡＴＴＡＣＣＴＣＴＴＴＣＴＣＣＧＣＡＣＣＣＧＡＣＡＴＡＧＡＴ^＊Ｔ及び／５Ｐｈｏｓ／ＡＴＣＴＡＴＧＴＣＧＧＧＴＧＣＧＧＡＧＡＡＡＧＡＧＧＴＡＡＴＧＡＡＡＴＧＧ^＊Ｔ。端部修復（平滑ライゲーションのために）又はＡ尾部付加（リンカーに基づくライゲーションのために）を含む乾燥ビーズを、４５μＬのライゲーションマスターミックス（３０μＬの水、１０μＬの５ｘＫＡＰＡライゲーション緩衝液、及び５μＬのＫＡＰＡＴ４ＤＮＡリガーゼ）、及び５μＬの水（平滑末端ライゲーションのために）、又は５μＬのモル当量混合物のリンカーオリゴヌクレオチド（リンカーに基づくライゲーションのために）と混合した。ビーズを徹底的に再懸濁し、２０℃で１５分間インキュベートした。５０μＬのＰＥＧ溶液（上記参照）を加えた後、混合物を上述のビーズ精製プロトコルに従い洗浄した。

多置換増幅（ＭＤＡ）を、ＩｌｌｕｓｔｒａＧｅｎｏｍｉｐｈｉＶ２ＤＮＡ増幅キットを使用して実行した。ライゲートされた断片鎖を含む乾燥ビーズを、９μＬのランダムヘキサマー含有緩衝液において再懸濁し、３分かけて９５℃に加熱し、その後氷の上で急速冷却した。１μＬの酵素混合物を加えた後、冷却されたサンプルを３０℃で９０分間インキュベートした。その後、反応を、６５℃で１０分間加熱することにより止めた。３０μＬのＰＥＧ溶液（上記参照）を加えた後、混合物を、上記の精製プロトコルに従って洗浄し、（６５℃で５分間のインキュベーションにより）２００μＬのＴＥの中で再懸濁した。望ましい場合、精製した産物を、定量的ＰＣＲ、デジタルドロップレットＰＣＲ（ｄｄＰＣＲ）で定量化することができ、或いは次世代配列決定（ＮＧＳ）を提案する。

ＭＤＡの後、長いライゲートされた断片鎖（例えば＞２ｋｂ）を、１３０μＬの全容積でＣｏｖａｒｉｓＳ２２０を使用して、〜３００ｂｐにまで超音波処理した。製造者のプロトコルは１４０Ｗのピーク電力、１０％のデューティファクタ、１つのバースト当たり２００サイクル、及び８０秒の処置時間を示した。〜３００ｂｐの断片長を選択し、無傷の初期の無細胞ＤＮＡ断片を維持する可能性を増大させた。標準ライブラリ調製プロトコルを使用して、望ましい場合に配列決定のために超音波処理されたＤＮＡ断片上にアダプターを置くことができる。様々なリード組成物を、Ｉｌｌｕｍｉｎａシーケンサー（ＨｉＳｅｑ又はＭｉＳｅｑの何れか）上でのペアエンド配列決定ランから元に戻した。接合部（自己接合部、或いは、アダプターがライゲーション工程に含まれる場合にはアダプター接合部）がリード（非アダプター配列によって５’及び３’に隣接）に対し内部にあるものを使用して、目的の配列にバーコードを付けた。

実施例５：環状化及び増幅
これは、本明細書中の方法に従う環状化及び増幅の手順の一例を提供する。この手順は以下の供給部を使用した：ＰＣＲＭａｃｈｉｎｅ（例えば、ＭＪｒｅｓｅａｒｃｈＰＴＣ−２００Ｐｅｌｔｉｅｒｔｈｅｒｍａｌｃｙｃｌｅｒ）；ＣｉｒｃｌｉｇａｓｅＩＩ，ｓｓＤＮＡｌｉｇａｓｅＥｐｉｃｅｎｔｒｅｃａｔ＃ＣＬ９０２５Ｋ；エキソヌクレアーゼ（例えば、Ｅｘｏｌ，ＮＥＢＢｉｏｌａｂｓｃａｔ＃Ｍ０２９３Ｓ；Ｅｘｏｌｌｌ，ＮＥＢｂｉｏｌａｂｓｃａｔ＃Ｍ０２０６Ｓ）；Ｔ４ポリヌクレオチドキナーゼ（ＮＥＢＢｉｏｌａｂｃａｔ＃Ｍ０２０１Ｓ）；全ゲノム増幅キット（例えば、ＧＥＨｅａｌｔｈｃａｒｅ，Ｉｌｌｕｓｔｒａ，Ｒｅａｄｙ−Ｔｏ−Ｇｏ，Ｇｅｎｏｍｉｐｈｉ，Ｖ３ＤＮＡ増幅キット）；ＧｌｙｃｏＢｌｕｅ（例えばＡｍｂｉｏｎｃａｔ＃ＡＭ９５１５）；マイクロ遠心分離機（例えばＥｐｐｅｎｄｒｏｆ５４１５Ｄ）；ＤＮＡ精製ビーズ（例えばＡｇｅｎｃｏｕｒｔ，ＡＭｐｕｒｅＸＰ，ＢｅｃｋｍａｎＣｏｕｌｔｅｒｃａｔ＃Ａ６３８８１）；磁気スタンド（例えば、ＴｈｅＭａｇｎａＲａｃｋ（商標）Ｉｎｖｉｔｒｏｇｅｎｃａｔ＃ＣＳ１５０００）；ＱｕｂｉｔＲ２．０フルオロメーター（Ｉｎｖｉｔｒｏｇｅｎ，ｃａｔ＃Ｑ３２８６６）；分子プローブｄｓＤＮＡＨＳアッセイキット（ＬｉｆｅＴｅｃｈｎｏｌｏｇｙｃａｔ＃０３２８５４）；及びバイオアナライザー（Ａｇｉｌｅｎｔ２１００）、並びに高感度ＤＮＡ試薬（ｃａｔ＃５０６７−４６２６）。

５’末端リン酸塩を欠くＤＮＡ断片（例えば無細胞ＤＮＡ）の増幅のために、第１の工程は一本鎖の端部の修復及び形成であった。ＤＮＡを（例えばＰＣＲＭａｃｈｉｎｅ上で）９６℃で３０秒間変性させた。ポリヌクレオチドキナーゼ（ＰＮＫ）反応物を、４０μＬのＤＮＡと５μＬの１０ＸＰＮＫ反応緩衝液とを組み合わせ、その後３７℃で３０分間のインキュベーションにより、調製した。１ｍＭのＡＴＰ及びＰＮＫ酵素を反応物に加え、３７℃で４５分間インキュベートした。緩衝液の交換はＤＮＡの沈殿及び再懸濁により行われた。ＰＮＫ反応物からの５０μＬのＤＮＡ、５μＬの酢酸ナトリウム０．５ＭｐＨ５．２、１μＬのＧｌｙｃｏＢｌｕｅ、１μＬのオリゴ（１００ｎｇ／μＬ）、及び１５０μＬの１００％エタノールを組み合わせた。混合物を−８０℃で３０分間インキュベートし、１６ｋｒｐｍで５分間遠心分離して、ＤＮＡをペレット上にした。ＤＮＡペレットを５００μＬの７０％エタノールで洗浄し、室温で５分間風乾させ、ＤＮＡを１２μＬの１０ｍＭＴｒｉｓ＝ＣｌｐＨ８．０において懸濁させた。

その後、再懸濁されたＤＮＡをライゲーションによって環状化した。ＤＮＡを９６℃で３０秒間変性させ、サンプルを氷の上で２分間冷やし、リガーゼ混合物（２μＬの１０ＸＣｉｒｃＬｉｇａｓｅ緩衝液、４μＬの５Ｍベタイン、１μＬの５０ｍＭＭｎＣｌ_２、１μＬのＣｉｒｃＬｉｇａｓｅＩＩ）を加えた。ライゲーション反応物を、ＰＣＲｍａｃｈｉｎｅ上で、６０℃で１６時間インキュベートした。ライゲートされていないポリヌクレオチドをエキソヌクレアーゼ消化によって分解した。このために、ＤＮＡを８０℃で４５秒間変性させ、１μＬのエキソヌクレアーゼ混合物（ＥｘｏＩ２０Ｕ／μＬ：ＥｘｏＩＩＩ１００Ｕ／μＬ＝１：２）を各管に加えた。これを、５回のピペットでの吸い上げと吐き出しにより混合し、簡単に回転させた。消化混合物を３７℃で４５分間インキュベートした。容量を３０μＬの水で５０μＬにし、更なる緩衝液交換を上述のような沈殿と再懸濁により行った。

全ゲノム増幅（ＷＧＡ）を行うために、精製ＤＮＡを最初に６５℃で５分間変性させた。ＧＥＷＧＡキットからの１０μＬの変性緩衝液を１０μＬの精製ＤＮＡに加えた。ＤＮＡを２分間、冷たいブロック又は氷の上で冷やした。２０μＬのＤＮＡをＲｅａｄｙ−Ｔｏ−ＧｏＧｅｎｏｍｉＰｈｉＶ３ケーク（ＷＧＡ）に加えた。ＷＧＡ反応物を３０℃で１．５時間インキュベートし、その後６５℃で１０分間の熱不活性化を行った。

ＡｍｐｕｒｅＸＰ磁気ビーズ（１．６Ｘ）を使用してサンプルを精製した。ビーズを攪拌し、８０μＬを１．５ｍＬの管において等分した。その後、３０μＬの水、２０μＬの増幅ＤＮＡ、及び８０μＬのビーズを組み合わせ、室温で３分間インキュベートした。管を２分間、磁気スタンドに配置し、透明な溶液をピペットで取り出した。ビーズを８０％のエタノールで２回洗浄した。２００μＬの１０ｍＭＴｒｉｓ−ＣｌｐＨ８．０を加えることによりＤＮＡを溶出した。ＤＮＡビーズ混合物を６５℃で５分間インキュベートした。管を２分間、磁気スタンドに戻した。１９５μＬのＤＮＡを新たな管に移した。１μＬｗをＱｂｉｔによる定量化のために使用した。最後に、１３０μＬのＷＧＡ産物を、ＣｏｖａｒｉｓＳ２２０を使用して超音波処理して、約４００ｂｐのサイズに到達させた。

実施例６：ライゲーション効率及びオンターゲット率の分析
上記実施例におけるように環状化され且つ全ゲノム増幅にさらされたｃｆＤＮＡを、定量的ＰＣＲ（ｑＰＣＲ）によって分析した。（ＫＲＡＳプライマーを使用して）サンプル標的に関するｑＰＣＲ増幅曲線の結果を、図１８のＡとＢに示す。図１８のＡに示されるように、インプットｃｆＤＮＡの１／１０のｑＰＣＲ増幅は３１．７５の平均Ｃｔ（サイクル閾値）をもたらし、サンプルのライゲーション産物の１／１０は３１．９２７の平均Ｃｔをもたらし、このことは、約８８％の高ライゲーション効率を示している。ライゲーション効率は、約７０％、８０％、９０％、９５％、又は約１００％に及ぶ場合もある。円形からほぼ全てのＤＮＡを増幅することができるように、環状化されなかった線状のＤＮＡは幾つかの例において取り除かれる。各サンプルは３回複製して実行された。図１８のＢに示されるように、１０ｎｇのＷＧＡ産物及び参照ゲノムＤＮＡ（ｇＤＮＡ）（１２８７８、１０ｎｇ）の増幅曲線は、互いに実質的に重複する。ＷＧＡサンプルの平均Ｃｔは２６．６５５であり、一方でｇＤＮＡサンプルの平均は２６．６０５であり、このことは９６％以上の高いオンターゲット率を示している。与えられた量の増幅ＤＮＡにおけるＫＲＡＳの数は増幅されていないｇＤＮＡと比較可能であり、このことは偏見がない増幅プロセスを示している。各サンプルは３回複製して試験された。対比の点として、Ｌｏｕｅｔａｌ．（ＰＮＡＳ，２０１３，１１０（４９））で提供される環状化プロトコルも試験した。記載される実施例の沈殿及び精製の工程を欠いたＬｏｕの方法を使用して、わずか１０−３０％の線状インプットＤＮＡを環状ＤＮＡに変換した。そのような低い回復は、下流配列決定及び変異体検出に対する障害を提示する。

実施例７：ｄｄＰＣＲによる増幅された環状化ＤＮＡの分析
ドロップレットデジタルＰＣＲ（ｄｄＰＣＲ）を使用して、環状化されたポリヌクレオチドから生成された全ゲノム増幅産物における対立遺伝子頻度の保存とバイアスを評価した。一般的に、ｄｄＰＣＲは、ＰＣＲ増幅を支援する別個の、容積測定的に定義された油中水型ドロップレット区分に封入される核酸分子を計数することにより、絶対量を測定するデジタルＰＣＲアッセイを指す。（Ｈｉｎｓｏｎｅｔａｌ，２０１１，Ａｎａｌ．Ｃｈｅｍ．８３：８６０４−８６１０；Ｐｉｎｈｅｉｒｏｅｔａｌ，２０１２，Ａｎａｌ．Ｃｈｅｍ．８４：１００３−１０１１）。単一のｄｄＰＣＲ反応は、１つのウェル当たり少なくとも２０，０００の区分されたドロップレットで構成されてもよい。ドロップレットデジタルＰＣＲは、ＰＣＲ増幅を支援する別個の、容積測定的に定義された油中水型ドロップレット区分に封入される核酸分子を計数することにより、絶対量を測定するデジタルＰＣＲアッセイを実行するプラットフォームを用いて、実行されてもよい。ドロップレットデジタルＰＣＲに関する典型的な戦略を以下のように要約してもよい：サンプルを希釈し、数千から数百万の別個の反応槽（油中水型ドロップレット）へと区分し、それにより、各々が目的の核酸分子の１つ以上のコピーを含まなくなる。標的アンプリコン（目的の核酸分子）を含まない「負の」ドロップレットの数に対する、標的アンプリコン（目的の核酸分子）を含む「正の」検出されたドロップレットの数を使用して、元のサンプル中にある目的の核酸分子のコピー数を判定してもよい。ドロップレットデジタルＰＣＲシステムの例は、核酸鋳型を含むサンプルを２０，０００ナノリットルのサイズのドロップレットへと区分するものである、Ｂｉｏ−ＲａｄのＱＸ１００（商標）ＤｒｏｐｌｅｔＤｉｇｉｔａｌＰＣＲＳｙｓｔｅｍ；及び、核酸鋳型を含むサンプルを１，０００，０００から１０，０００，０００ピコリットルのサイズのドロップレットへと区分するＲａｉｎＤａｎｃｅのＲａｉｎＤｒｏｐ（商標）デジタルＰＣＲシステムを含む。ｄｄＰＣＲのための方法の更なる例がＷＯ２０１３１８１２７６Ａ１で提供される。

この例において、黒色腫細胞株由来のＢＲＡＦＶ６００ＥゲノムＤＮＡ（ｇＤＮＡ）を、特異的な割合（０％、０．６７％、２．０％、６．６７％、２０％、又は１００％）で参照ゲノムＤＮＡ１２８７８と混合し、断片化して、ｃｆＤＮＡで見出されたものと同様のサイズ（この場合には約１５０ｂｐ）の断片を生成した。混合されたＤＮＡサンプル（１０ｎｇ）を実施例２に従い環状化し、増幅した。４０ｎｇの増幅ＤＮＡを、ＢＲＡＦＶ６００Ｅ及び野生型のためにｄｄＰＣＲにさらした。観察された突然変異対立遺伝子頻度を図で示し、図１９において表にした。示されるように、増幅を伴う観察された突然変異対立遺伝子頻度（図１９の表の中央の行）は、インプット変異遺伝子頻度（上の行）の他、増幅のない１００ｎｇのゲノムＤＮＡからのｄｄＰＣＲ結果（下の行）を反映している。ｄｄＰＣＲアウトプットによる対立遺伝子頻度を、ドロップレットを含む突然変異体及び野生型の両方の合計に対する、ドロップレットを含むＢＲＡＦ突然変異の数として算出する。増幅を伴うＤＮＡは白丸として示され、増幅のないものは小さな黒丸として示される。０．６７％での小さな偏差を除いて、２つのデータセットは完全に重なっている。これは、実質的にバイアスを用いることなく、変異遺伝子頻度の真の表現の保存を実証する。

実施例８：バックグラウンドより上の配列変異体の検出
１０ｎｇの超音波処理されたｇＤＮＡ（１５０ｂｐ、Ｍｕｌｔｉ−ＧｅｎｅＭｕｌｔｉｐｌｅｘの参照ＤＮＡ、Ｈｏｒｉｚｏｎ）を環状化し、実施例２に記載されるように増幅し、その後超音波処理を行った。その後、断片化されたＤＮＡをＲｕｂｉｃｏｎ配列決定ライブラリ構築にさらした。捕捉配列決定の後、参照ホットスポットから５０ｂｐ以内の変異体をプロットした。変異体のコールが異なる接合部により区別される２つの異なるポリヌクレオチドにおける検出を必要とする、変異体検出に関する結果を、図２０に示す。７つの予想される参照ホットスポット（ＫＩＴＤ８１６Ｖ、ＥＧＦＲＧ７１９Ｓ、ＥＧＦＲＴ７９０Ｍ、ＥＧＦＲＬ８５８Ｒ、ＫＲＡＳＧ１３Ｄ、ＫＲＡＳＧ１２Ｄ、ＮＲＡＳＱ６１Ｋ）を位置０にてプロットする。他の２つの変異体も確認し、図２０で白い三角形及び菱形として示した。

比較のために、ｇＤＮＡを上記のように超音波処理したが、１０ｎｇの超音波処理されたｇＤＮＡを、環状化、及び２つの異なるポリヌクレオチドでの配列変異体の確認を必要とすることなく、共通の慣習に従いＲｕｂｉｃｏｎ配列決定ライブラリ構築に直接さらした。捕捉配列決定の後、参照ホットスポットから５０ｂｐ以内の変異体を再びプロットし、結果を図２１に示す。７つの予想される参照ホットスポット（ＫＩＴＤ８１６Ｖ、ＥＧＦＲＧ７１９Ｓ、ＥＧＦＲＴ７９０Ｍ、ＥＧＦＲＬ８５８Ｒ、ＫＲＡＳＧ１３Ｄ、ＫＲＡＳＧ１２Ｄ、ＮＲＡＳＱ６１Ｋ）を位置０にてプロットする。他の位置での変異体は予想されず、これはおそらく配列決定の誤差によるものである。図２０を作成するのに利用される方法の結果と対照的に、図２１の結果は、標準的な配列決定法が、対立遺伝子頻度が低いとき（５％未満など）、真の突然変異シグナルを覆うことが可能なかなり高い偶然誤差率を持つことを示している。

２つの異なるポリヌクレオチドにおける検出を必要とする、及び必要としない配列決定法によって検出された感度及び背景雑音の別個の分析の結果を、図１６−１７に例示する。
これらの図が例示するように、検証の要件は背景雑音を大幅に減らし、感度を増大させる。

実施例９：ＧＣ組成物及びサイズ分布の分析
１０ｎｇの超音波処理されたｇＤＮＡ（１５０ｂｐ、Ｍｕｌｔｉ−ＧｅｎｅＭｕｌｔｉｐｌｅｘの参照ＤＮＡ、Ｈｏｒｉｚｏｎ）を環状化し、実施例５のように増幅し、配列決定し、２つのポリヌクレオチド検証フィルタ（左）をコールする変異体で分析した。ＣＧ割合の範囲を持つ配列の数を、図２２に示されるように表にして、図でプロットした。左端のプロットに示されるように、実施例５に従い調製されたサンプルの配列は、（基礎的なゲノムの全ＧＣ含有量に相当する）中央のピークを除いて理論的分布に大いに類似している。対照的に、同じ量のｇＤＮＡがＲｕｂｉｃｏｎ配列決定ライブラリ構築キットを使用する増幅なしに配列決定ライブラリを構築するために直接使用されたとき、配列決定結果と理論的分布との違いはかなり明らかである（中央のプロットを参照）。この直接のＲｕｂｉｃｏｎ配列決定の中央のピークは理論的分布よりも高い。Ｎｅｗｍａｎｅｔａｌ．（２０１４；ＮａｔｕｒｅＭｅｄｉｃｉｎｅ，（２０）：５４８−５４）は、３２ｎｇのｃｆＤＮＡが使用されたとき、ｃｆＤＮＡ配列決定ＧＣ含有量の分布が理論的分布と同様であることを報告した。これは右端のプロットで例示される。

ＤＮＡサイズ分布を、実施例５のように環状化、増幅、及び配列決定されたｃｆＤＮＡのために評価した。図２３に示されるように、配列決定結果により示される断片長の分布のピークは約１５０−１８０ｂｐであり、これはｃｆＤＮＡの典型的な分散パターンに類似する。

実施例１０：増幅の均一性の評価
実施例５に従い環状化且つ増幅された１０の産物のｑＰＣＲ結果を、増幅されていない参照ＤＮＡ（１２８７８の細胞株のｇＤＮＡ、ＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅ）と比較した。１０ｎｇのゲノム参照ＤＮＡ又は増幅産物を各リアルタイムのｑＰＣＲ反応のために使用し、比率をゲノムに対する増幅産物の相対的定量化によって生成した。図２４に示されるように、各ＰＣＲの比率は２倍の変化以内であり、このことは、増幅されたＤＮＡプール中のこれら標的のコピー数が増幅されていない参照ＤＮＡと非常に類似することを示唆している。６つの遺伝子（ＢＲＡＦ、ｃＫＩＴ、ＥＧＦＲ、ＫＲＡＳ、ＮＲＡＳ、ＰＩ３ＫＣＡ）からのＰＣＲプライマーの１０のペアを設計し、前もって検証した。

実施例１１：ＤＮＡ断片の増幅収量の定量化
ｃｆＤＮＡを、４人の患者（患者１−４）及び１人の健康な対照から単離した。ゲノムＤＮＡ（ｇＤＮＡ、Ｍｕｌｔｉ−ＧｅｎｅＭｕｌｔｉｐｌｅｘＨｏｒｉｚｏｎ）を、およそ１５０ｂｐの断片に超音波処理した。ＤＮＡを環状化し、ランダムプライマーで増幅させた。表７は、増幅反応へのＤＮＡインプットの量、及び増幅によって産生されたＤＮＡの量を示す。有意な増幅が最も小さなサンプル（０．４ｎｇ）でも得られ、全てのサンプルが少なくとも６００倍増幅された。

実施例１２：癌患者のｃｆＤＮＡからの低頻度突然変異の検出
工程１において、ｃｆＤＮＡを環状化した。環状のライゲーション混合物を室温でＰＣＲ管の中に調製した。４ｎｇ−１０ｎｇのｃｆＤＮＡを、１２μｌの容量のＰＣＲ管へピペットで移した。ＤＮＡｗｐ９６℃で３０秒間変性させ、その後、ＰＣＲ管を２分間氷の上で冷やした。ライゲーション混合物（２μｌの１０ＸＣｉｒｃＬｉｇａｓｅ緩衝液、４μｌの５Ｍベタイン、１μｌの５０ｍＭＭｎＣｌ_２、１μｌのＣｉｒｃＬｉｇａｓｅＩＩ）を各管に加え、反応をＰＣＲｍａｃｈｉｎｅ上で、６０℃で１６時間勧めた。

工程２において、ライゲーション反応物を処理して、ライゲートされていない線状ＤＮＡを取り除いた。１μｌのエキソヌクレアーゼ混合物（ＮＥＢＭ０２０６Ｓ、Ｍ０２９３Ｓ；ＥｘｏＩ２０ｕ／μｌ：ＥｘｏＩＩＩ１００ｕ／μｌ＝１：２）を各管に加え、混合し、ＰＣＲｍａｃｈｉｎｅ上で、３７℃で３０分間インキュベートした。

工程３において、ライゲーション反応物を緩衝液交換のために精製した。ライゲーション産物を、ＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒ（ＺｙｍｏＲｅｓｅａｒｃｈ）で精製した。結合混合物（３０μｌの１０ｍＭＴｒｉｓ、１００μｌのオリゴ結合緩衝液、４００μｌ１００％エタノール）を、エキソヌクレアーゼ処理後にライゲーション反応物に加え、混合し、簡単に回転させた。Ｚｙｍｏ−ｓｐｉｎカラムを充填し、１０，０００ｘｇ以上で３０秒間回転させた。カラムを７５０μｌのＤＮＡ洗浄緩衝液で洗浄し、１４，０００ｘｇで１分間遠心分離した。１０，０００ｘｇ以上で３０秒間の遠心分離により、ＤＮＡを１５μｌの１０ｍＭＴｒｉｓで溶出した。

工程４において、ＤＮＡをランダムプライミングにより増幅した。全ゲノム増幅（ＷＧＡ）を、Ｒｅａｄｙ−Ｔｏ−ＧｏＧｅｎｏｍｉｐｈｉＶ３ＤＮＡ増幅キット（ＧＥＨｅａｌｔｈｃａｒｅ）で行った。１０μｌの精製されたライゲーションを１０μｌの２ｘ変性緩衝液と混合し、９５℃で３分間インキュベートし、その後氷の上で４℃に冷やした。２０μｌの変性ＤＮＡをＷＧＡプレミックス（ｐｒｅ−ｍｉｘ）に加えて、サンプルを３０℃で１．５時間インキュベートし、その後６５℃で１０分間不活性化させた。

工程５において、増幅産物を、ＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰＰｕｒｉｆｉｃａｔｉｏｎ（１．６Ｘ）（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を使用してきれいにした。３０μｌの１０ｍＭＴｒｉｓ及び８０μｌのＡＭｐｕｒｅビーズを２０μｌのＷＧＡ反応物に加えた。混合物を室温で２分間インキュベートした。管を磁石スタンドに入れ、２分間インキュベートした。上清を除去し、廃棄した。サンプルを２００μｌのエタノール（８０％）で２回洗浄し、５分間風乾して、ＤＮＡを２００μｌの１０ｍＭＴｒｉｓｐＨ８．０で溶出した。

工程６において、ＷＧＡＤＮＡを断片化した。１３０μｌのＷＧＡ産物を、ＣｏｖａｒｉｓＳ２２０ソニケーターを使用して超音波処理し、およそ４００ｂｐの断片サイズを得た。ＣｏｖａｒｉｓＳ２２０の設定は以下のとおりであった：ピーク入射電力＝１４０Ｗ、デューティファクタ＝１０％、バースト当たりのサイクル＝２００、処置時間＝５５秒。

工程７において、サンプルをｑＰＣＲによって定量化した。ライゲーションインプット及びライゲーション産物の１／１０を、ライゲーション効率を測定するための３つの複製でのｑＰＣＲ反応のために使用した。１０ｎｇの参照ｇＤＮＡ（１２８７８の細胞株）を加えた１０ｎｇの断片化ＷＧＡ産物をｑＰＣＲのために使用し、オンターゲット率を測定した。反応物は、５μｌの２ｘマスターミックス（ＴａｑＭａｎＦａｓｔＵｎｉｖｅｒｓａｌＰＣＲマスターミックス（２ｘ），ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ；Ｅｖａｇｒｅｅｎｄｙｅ，Ｂｉｏｔｉｕｍ）、０．５μｌのプライマー（５μＭ）、１．２μｌのＨ_２Ｏ、１０μｌのＤＮＡを含んでいた。増幅を以下のプログラムに従い進めた：９５℃、２分；及び［９５℃、１０秒；６０℃、２０秒］の４０回のサイクル。

工程８において、配列決定ライブラリを構築した。配列決定ライブラリを、標準ＰＣＲライブラリ（ＫＫ８２００）を用いるＡＰＡＨｙｐｅｒＰｒｅｐＫｉｔ（ＫＫ８５００）又はＫＡＰＡライブラリ調製キットを使用して、５００−１０００ｎｇの超音波処理した増幅ＤＮＡから調製した。アダプターライゲーション（１ｕＭのアダプター最終濃度を有する）を製造者のプロトコルに従って調製した。ライゲートされた産物のアダプターライゲートされた洗浄物である、３０μｌ（０．３ｘ）の２０％ＰＥＧ８０００／２．５ＭＮａＣｌ溶液を、１００μｌの再懸濁されてライゲートされた産物に加えた。ビーズをライゲートされた産物と共に徹底的に混合し、室温で１５分間インキュベートした。その後、液体が透明になるまでビーズを磁石の上で捕捉した。その後、１３０μｌの上清を、ＡｍｐｕｒｅＸＰビーズを使用するサイズ選択にさらした。サンプルを新しいプレートに移し、その後、２０μｌのＡｍｐｕｒｅＸＰビーズ（０．５ｘ）を加えた。ここでライゲートされた産物はビーズの中で補足され、２００μｌの８０％エタノールで２回洗浄された。その後、ライゲートされた産物を再懸濁し、２０μｌのＥＢ緩衝液の中で溶出した。サイズ選択及び精製の後、２０μｌのライゲートされた産物を、２５μｌの２ｘＫＡＰＡＨｉＦｉＨｏｔｓｔａｒｔｒｅａｄｙｍｉｘ、及び５μｌ−１０μＭのＰ５＋Ｐ７プライマー（５’ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡ３’、５’ＡＣＡＣＴＣＴＴＴＣＣＣＴＡＣＡＣＧＡＣＧＣＴＣＴＴＣＣＧＡＴＣＴ３’）に加え、以下のサイクルプログラムを使用してライブラリを増幅した：９８℃、４５秒；（９８℃、１５秒；６０℃、３０秒；７２℃、３０秒）の５回のサイクル；７２℃、６０秒。増幅されたライブラリを、定量化のために断片アナライザー又はバイオアナライザー（高感度チップ）に充填する前に２０倍に希釈した。更なるサイズ選択を、ゲルサイズ選別機（ＢｌｕｅＰｉｐｐｉｎｐｒｅｐｆｒｏｍＳａｇｅＳｃｉｅｎｃｅ）を介して行った。

工程９において、配列決定ライブラリを、ｘＧＥＮＰａｎ−ＣａｎｃｅｒＰａｎｅｌｖ１．５，１２７９０８５９７（ＩＤＴ）からのプローブを使用するプローブ捕捉富化によって濃縮した。工程１０において、ライブラリをＨｉＳｅｑ２５００において配列決定し、平均深度は１０００ｘであった。

工程１１において、配列決定データを分析し、変異体コールを作成した。変異体コールは、変異体として計数される２つの異なるポリヌクレオチド（例えば、異なる接合部により同定される）上に配列の差異が生じることをコールする工程を含んでいた。様々な体細胞突然変異を検出し、これらを公共のデータベース（ＣＯＳＭＩＣ（ＣａｔａｌｏｇｏｆＳｏｍａｔｉｃＭｕｔａｔｉｏｎｓｉｎＣａｎｃｅｒ））においても報告した。同定された突然変異は０．０５％の対立遺伝子頻度を有するＢＲＡＦＶ６００Ｍであり、これはインプットが低いときにもこのシステムの高感度を実証するものである。サンプル中の頻度を含む様々な突然変異の検出に関する結果を表８に示す。

実施例１３：ＦＦＰＥサンプルの多重参照ＤＮＡからの正確な突然変異検出
ＤＮＡを、製造者のプロトコル（ＣｏｖａｒｉｓｔｒｕＸＴＲＡＣ（商標）ＦＦＰＥＤＮＡＫｉｔ）に従って、サンプルのＨｏｒｉｚｏｎＦＦＰＥ−ｍｕｌｔｉｐｌｅｘ（ＨＤ２００）から抽出した。ＣｏｖａｒｉｓＳ２２０ソニケーターを使用して１３０μｌのＦＦＰＥｇＤＮＡを超音波処理し、およそ１５０ｂｐの断片サイズを得た（ＣｏｖａｒｉｓＳ２２０の設定：ピーク入射電力＝１７５Ｗ、デューティファクタ＝１０％、バースト当たりのサイクル＝２００、処置時間＝４３０秒）。１１μｌ容量での５０ｎｇのＤＮＡを９５℃で３０秒間変性させた。１０．５μｌのＨ_２Ｏ、２．５μｌのリガーゼ緩衝液（ＮＥＢＢ０２０２Ｓ）、及び１μｌのＴ４ポリヌクレオチドキナーゼ（ＮＥＢＭ０２０１Ｓ）を加えた。反応物をリン酸化のために３７℃で３０分間インキュベートした。

サンプルをライゲートし、その後ＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒ（ＺｙｍｏＲｅｓｅａｒｃｈ）で精製した。結合混合物（３０μｌの１０ｍＭＴｒｉｓ、１００μｌのオリゴ結合緩衝液、４００μｌ１００％エタノール）を、エキソヌクレアーゼ処理後にライゲーション反応物に加え、ボルテックスにより混合し、簡単に回転させた。サンプルをＺｙｍｏ回転カラムに充填し、１０，０００ｘｇ以上で３０秒間回転させた。カラムを７５０μｌのＤＮＡ洗浄緩衝液で洗浄し、１４，０００ｘｇで１分間遠心分離した。１０，０００ｘｇ以上で３０秒間の遠心分離により、ＤＮＡを１５μｌの１０ｍＭＴｒｉｓで溶出した。

サンプルを、実施例１３の工程５−１１に従い更に処理且つ分析した。結果を表９にまとめる。Ｈｏｒｉｚｏｎの多数の突然変異標準ＤＮＡにおける９つの突然変異の表現をこのプロセスにより大まかに保持し、一方でＤＮＡの量は少なくとも６００倍増加した。

実施例１４：癌突然変異細胞株ｇＤＮＡマルチマーからの低頻度の突然変異の検出
この実施例において、超音波処理されたゲノムＤＮＡをライゲートしてマルチマーを形成し、これを後に増幅、断片化、及び分析にさらした。図２５のＡとＢは、このプロセスの実施例を説明する。例示的なワークフローを図３１で提供する。

メラノーマ細胞株ＳＫ−−ｍｅｌ−２８（ＡＴＣＣ）含有ＢＲＡＦＶ６００Ｅ突然変異からのｇＤＮＡを参照ｇＤＮＡ（１２８７８ＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅ）と混合し、１％ＢＲＡＦＶ６００Ｅを達成した。実施例１４におけるようにＤＮＡを超音波処理して、およそ１５０ｂｐの断片サイズを得た。１１μｌ容量での１００ｎｇのＤＮＡを９５℃で３０秒間変性させた。１０．５μｌのＨ_２Ｏ、２．５μｌのリガーゼ緩衝液（ＮＥＢＢ０２０２Ｓ）、及び１μｌのＴ４ポリヌクレオチドキナーゼ（ＮＥＢＭ０２０１Ｓ）を加え、その後３７℃で３０秒間インキュベートし、ＤＮＡをリン酸化した。

サンプルをＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒ（ＺｙｍｏＲｅｓｅａｒｃｈ）で精製した。これは、エキソヌクレアーゼ処理後にライゲーションに結合混合物（２５μｌの１０ｍＭＴｒｉｓ、１００μｌのオリゴ結合緩衝液、４００μｌの１００％エタノール）を加える工程を含んでいた。これをボルテックスにより混合し、簡単に回転させた。Ｚｙｍｏ回転カラムを充填し、１０，０００ｘｇ以上で３０秒間回転させ、７５０μｌのＤＮＡ洗浄緩衝液で洗浄し、１４，０００ｘｇで１分間遠心分離した。１０，０００ｘｇ以上で３０秒間の遠心分離により、ＤＮＡを１５μｌの１０ｍＭＴｒｉｓで溶出した。

ライゲートするために、４μｌ容量で６ｎｇのＤＮＡを、０．４５μｌの１０ｘ端部修復緩衝液（Ｅｎｙｚｙｍａｔｉｃｓ）、０．０５μｌのｄＮＴＰ２５ｍＭ、０．５μｌのＡＴＰ１０ｍＭ、端部修復酵素混合物（Ｅｎｙｚｙｍａｔｉｃｓ）、及びＴ４リガーゼ２０００単位／μｌと混合した。反応物を２５℃で３０分間、その後７５℃で２０分間インキュベートした。

全ゲノム増幅を、Ｒｅａｄｙ−Ｔｏ−ＧｏＧｅｎｏｍｉｐｈｉＶ３ＤＮＡ増幅キット（ＧＥＨｅａｌｔｈｃａｒｅ）で行った。８μｌのＨ_２Ｏ及び１０μｌの精製されたライゲーションを１０μｌの２ｘ変性緩衝液と混合した。ＤＮＡを９５℃で３分間変性させ、その後氷の上で４℃に冷やした。２０μｌの変性ＤＮＡをＷＧＡプレミックス（ｐｒｅ−ｍｉｘ）に加えて、３０℃で１．５時間インキュベートし、その後６５℃で１０分間不活性化させた。

その後、増幅反応物を、ＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰＰｕｒｉｆｉｃａｔｉｏｎ（１．６Ｘ）（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を使用してきれいにした。３０μｌの１０ｍＭＴｒｉｓ及び８０μｌのＡＭｐｕｒｅビーズを２０μｌのＷＧＡ反応物に加えた。これを室温で２分間インキュベートした。管を磁石スタンドに入れ、２分間インキュベートした。上清を除去し、廃棄した。ビーズを２００μｌのエタノール（８０％）で２回洗浄し、その後５分間風乾した。２００μＬの１０ｍＭＴｒｉｓｐＨ８．０でＤＮＡを溶出した。その後、ＣｏｖａｒｉｓＳ２２０ソニケーターを使用して１３０μｌのＷＧＡ産物を断片化し、およそ４００ｂｐの断片サイズを得た（ＣｏｖａｒｉｓＳ２２０の設定：ピーク入射電力＝１４０Ｗ、デューティファクタ＝１０％、バースト当たりのサイクル＝２００、処置時間＝５５秒）。

ＢｉｏＲａｄＰｒｉｍｅＰＣＲｄｄＰＣＲ突然変異検出アッセイを使用するｄｄＰＣＲにより突然変異を検出した。突然変異検出ｄｄＰＣＲ反応を、室温でＰＣＲ管に組み込んだ（８０ｎｇの増幅ＤＮＡ、プローブ用の１０μｌの２ｘｄｄＰＣＲスーパーミックス、１μｌの２０ｘ標的（ＢＲＡＦＶ６００Ｅ，ＢｉｏＲａｄ）プライマー（９μＭ）／プローブ（ＦＡＭ；５μＭ、１μｌの２０ｘ野生型プライマー（９μＭ）／プローブ（ＨＥＸ；５μＭ）、８μｌのＤＮＡサンプル（５０ｎｇ））。５回のピペットでの吸い上げと吐き出しにより反応物を混合し、その後、ドロップレット発生装置カートリッジに移した。ＱＸ２００ドロップレット発生装置を使用してドロップレットを生成し、９６ウェルのＰＣＲプレートに移し、以下のＰＣＲプログラムを使用して増幅させた：９５℃、１０分；［９４℃、３０秒、５５℃、１分］の４０回のサイクル；９８℃、１０分。ＰＣＲ反応プレートをＱＸ２００ドロップレットリーダーに移し、結果を定量化した。インプットＤＮＡに基づいて、ＢＲＡＦＶ６００Ｅ突然変異の期待度数は１％であった。このライゲーション及び増幅の手順によって、この度数は大まかに維持され（ｄｄＰＣＲ分析に従い１．４１％）、一方でＤＮＡの量は約２００倍増加した。

図２６と２７は図２５のプロセスに対する例示的な変形を説明する。

実施例１５：単一反応アッセイにおける稀な突然変異の検出
ＮＧＳを使用する無細胞ＤＮＡの循環における稀な突然変異を検出する性能は２つの要因に限定される：１つ目は配列決定技術の正確性であり；２つ目はアッセイの全体的な変換速度である。本明細書には、正確な変異体コールのための単一反応アッセイのワークフロー及びアルゴリズムを使用して、標的領域における稀な変異体の敏感な検出のための方法が記載される。単一反応アッセイのための例示的なワークフローを図３４のＡとＢに提供する。

線状の単鎖ポリヌクレオチドを末端接合により環状化する。単鎖の環が望ましい場合、ポリヌクレオチドは最初に単離される単鎖ポリヌクレオチドであり、或いは、（例えば変性によって）ポリヌクレオチドに単鎖を与えるように処理されてもよい。この実施例において、ポリヌクレオチドを環状化するための方法は、リガーゼ（例えばＲＮＡリガーゼ又はＤＮＡリガーゼ）の使用など、酵素に関与している。反応条件は、選択された酵素の製造者によって特定されたものである。環状ポリヌクレオチドを形成するためにポリヌクレオチドの端部を接合することで（それ自体に直接、或いは、１つ以上の他のポリヌクレオチド、例えば２つの標的ポリヌクレオチドを含む環状標的ポリヌクレオチドに）、接合部配列を持つ接合部を産生する。

環状化の後、環状化反応の後にライゲートされていない核酸を消化するためにエキソヌクレアーゼ工程が含まれる。即ち、閉鎖式循環は、遊離した５’又は３’末端を含まず、故に、５’又は３’エキソヌクレアーゼの導入は閉鎖式循環を消化しないが、ライゲートされていない成分を消化する。場合によっては、これは多重システムにおける特定の使用を見出す。

環状化の後、リガーゼは、ライゲートされた分子上で結合されたままでもよい。ライゲーション接合部のリガーゼの存在は。重合反応中にプライマー伸長を阻害し、且つ増幅効率を減らすこともある（図３４のＡに例示されるように）。分解による環状化反応に使用されるリガーゼの除去は、ポリメラーゼが接合部を通って伸長し、且つコンカテマーとして環状化された標的分子を効果的に増幅することを可能にする。リガーゼの分解は、７０℃で１５分間のインキュベーションにより加熱不活性化（ｈｅａｄ−ｉｎａｃｔｉｖａｔｅｄ）され得る、Ｑｉａｇｅｎプロテアーゼなどの非耐熱性プロテアーゼでの処置を含む。

リガーゼの除去後、環状化ＤＮＡ分子を、全ゲノム増幅のためのランダムプライマー又は標的にされた増幅のための特異的プライマーによって増幅することができる。増幅されたコンカテマーを無作為に超音波処理して、ＮＧＳライブラリ構築及び配列決定のためにサイズ範囲〜５００ｂｐ−１０００ｂｐで断片を作成する。

この実施例でのアルゴリズムの改善を図３５に例示する。コンカテマー配列における接合部（参照における開始及び端部位置を特徴とする）を、参照配列へのアラインメントを介して同定することができ、且つ元のインプットＤＮＡ断片のタグとして使用することができる。しかし、接合部のタイプの数（参照における開始と端部の組み合わせ）を与えられた標的領域において制限してもよく；及び、多数のインプットＤＮＡ断片が存在すると、２つの独立したインプットＤＮＡ断片の接合部において比較的高い不一致の可能性が存在する。結果的に、「接合部タグ」は、多くの用途における固有のタグとして扱われない場合があり、この種のタグに基づく誤差の補正と分子の計数は固有に区別を行わない場合がある。

コンカテマー寸断点をコンカテマー配列中の接合部と組み合わせることによって、より多くの特徴的なタグをインプット分子のために作成することができる。図３５に例示されるように、環ライゲーション及びＲＣＡの後に生成され得る一連の長いコンカテマーは、より短いコンカテマーを形成するために超音波処理或いは他の断片化の方法（例えば酵素切断）を使用して寸断される。これらは異なる構造を持つ多くのコンカテマーをもたらす：例えば、接合部に対する、リードにおける異なる数の反復或いは異なる開始／末端位置、即ち２つの端部にあるコンカテマー寸断点。

特徴的なタグを作成するためにコンカテマー寸断点を組み込むことによって、特徴的なタグによって同定されたリードファミリーから構築されたコンセンサス配列に基づいて追加の誤差補正を効果的に実行することが可能である。様々な投票方式を使用して、リードのファミリーからコンセンサス配列を構築し、且つ様々な変異体コールを行い、例えば、ファミリーにおける全てのリードが同じ変異体を報告する場合にのみ変異体がコールされる。２つ目に、特徴的なタグを使用して、インプット分子を集計し、対立遺伝子頻度を計算することを支援することができる。

コンカテマー寸断点を同定するための一例のアルゴリズムは以下のとおりである。１）自己アラインメント、参照配列へのアラインメント、或いは他の計算方法と共に行うことが可能な、コンカテマー配列（リード）において、反復長さ、反復領域、及び接合部を同定；２）参照配列のリードを整列させることによりリード内の接合部の位置を判定；３）変更される塩基の数を隣接接合部のリード位置により判定する一方、接合部の参照開始又は末端位置から位置を変えることによりコンカテマー寸断点（両端にある）の位置を計算。

実施例１６：リガーゼ除去を用いる、又は用いない、リガーゼ処理したｃｆＤＮＡ分子のｑＰＣＲ分析
様々な条件下で環状化且つ精製された、リガーゼ処理したｃｆＤＮＡサンプルをｑＰＣＲによって分析した。３つの精製条件が試験に含まれていた：１．クロマトグラフィーカラムにより精製された、Ｃｉｒｃ−ライゲートされたＤＮＡ；２．フェノールクロロホルムによって精製された、Ｃｉｒｃ−ライゲートされたＤＮＡ；及び３．クロマトグラフィーカラムによる精製の前にリガーゼを取り除くためにプロテイナーゼＫで処理された、Ｃｉｒｃ−ライゲートされたＤＮＡ。１０ｎｇのｃｆＤＮＡを各条件（１、２及び３）のために使用した。ｃｆＤＮＡを９６℃で３０秒間変性させ、２分間氷ブロックの上で冷やし、その後ライゲーション混合物（２μＬの１０ＸＣｉｒｃｌｉｇａｓｅ緩衝液、４μＬの５Ｍベタイン、１μＬの５０ｍＭＭｎＣｌ_２、１μｌのＣｉｒｃｌｉｇａｓｅＩＩ（Ｅｐｉｃｅｎｔｒｅ＃ＣＬ９０２５Ｋ））を加えた。「リガーゼ対照なし」（４）、及び「ＤＮＡ対照なし」（５）を同時にセットアップした。「リガーゼ対照」は、２μＬの１０ＸＣｉｒｃｌｉｇａｓｅ緩衝液、４μＬの５Ｍベタイン、１μＬの５０ｍＭＭｎＣｌ_２と混合した１０ｎｇのｃｆＤＮＡを含んでいたが、リガーゼは含まなかった。「ＤＮＡ対照」は全てのライゲーション試薬を含んでいたが、ｃｆＤＮＡは含まなかった。全ての反応物を６０℃で１時間インキュベートした。

ライゲーションの後、「リガーゼ対照なし」（４）、「ＤＮＡ対照なし」（５）、及び条件１（クロマトグラフィーカラムによって精製された、Ｃｉｒｃ−ライゲートされたＤＮＡ）を、クロマトグラフィーカラムによって精製した。各反応物を、１０ｍＭのＴｒｉｓ−ＣｌｐＨ８．０で事前に洗浄したマイクロバイオ−スピンＰ−６カラムに充填し、１，０００ｘ（ｇ）で４分間のカラムの遠心分離により溶出した。

条件２（フェノールクロロホルムによって精製された、Ｃｉｒｃ−ライゲートされたＤＮＡ）を、フェノールクロロホルム抽出及びエタノール沈澱によって精製した。１８０μＬの１０ｍＭＴｒｉｓを、エキソヌクレアーゼ処理から２０μＬのＤＮＡに加えて、２００μＬの量を作り出し、２００μＬのフェノールを使用してＤＮＡを抽出した。水層を集め、ＤＮＡをエタノール沈澱によって回収した。エタノール共沈殿混合物（フェノール抽出後の２００μＬのＤＮＡ溶液、２０μＬの酢酸ナトリウム０．５ＭｐＨ５．２、１μＬのＧｌｙｃｏＢｌｕｅ、１μＬの担体オリゴ（１００ｎｇ／μＬ）、６００μＬの１００％エタノール）を、−８０℃で３０分間インキュベートし、１６ｋｒｐｍで５分間遠心分離して、ＤＮＡを沈殿させた。ＤＮＡペレットを５００μＬの７０％エタノールで洗浄した。ＤＮＡペレットを室温で５分間風乾し、１１μＬの１０ｍＭＴｒｉｓ−ＣｌｐＨ８．０で再懸濁した。

条件３（プロテイナーゼＫで処理された、Ｃｉｒｃ−ライゲートされたＤＮＡ）を最初に３７℃で３０分間、プロテイナーゼＫで処理し、その後、クロマトグラフィーカラムを使用して精製した。反応物を、１０ｍＭのＴｒｉｓ−ＣｌｐＨ８．０で事前に洗浄したマイクロバイオ−スピンＰ−６カラムに充填し、１，０００ｘ（ｇ）で４分間のカラムの遠心分離により溶出した。

その後、各条件（１−５）の産物を定量的ＰＣＲ（ｑＰＣＲ）によって分析した。３つの複製ｑＰＣＲ反応を各サンプルのためにセットアップし、平均Ｃｔを算出した。表１０に示されるように、ＤＮＡ対照なし（５）のｑＰＣＲ増幅は、４０の平均Ｃｔ（サイクル閾値）をもたらし、リガーゼ対照なし（４）の産物は３０．７９の平均Ｃｔをもたらし、このことは、リガーゼ処置のない条件下でのインプットＤＮＡの高い回復を示している。条件１と２はそれぞれ３４．８０と３５．１８の平均Ｃｔをもたらした。リガーゼ対照なし（４）と比較して、条件１と２は、両方の産物が遊離酵素を取り除くために精製されたとしても、リガーゼ処置後の増幅可能なＤＮＡの有意な損失を示した。精製前にリガーゼが酵素分解により除去された条件３の産物は、リガーゼ対照なし（４）に匹敵する、３０．４２の平均Ｃｔを示し、このことは、リガーゼの除去が増幅可能なＤＮＡの効率的な回復に重要であることを示している。

実施例１７：ＮＧＳライブラリの複雑性の比較
この実施例は、異なるワークフローによって調製されたＮＧＳライブラリの複雑性を比較する。
この実施例で比較されたワークフローは以下を含む：
１．増幅前にフェノールクロロホルム抽出工程による環状化と精製を介して調製されたライブラリ；
２．精製なしに環状化及び直接の増幅を介して調製されたライブラリ；
３．１５分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ；
４．２０分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ；
５．３０分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ；
６．６０分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ；

各条件のために、１２μＬの２０ｎｇｃｆＤＮＡをライブラリ構築のためにインプットとして使用した。ＤＮＡサンプルを９６℃で３０秒間変性させ、２分間氷ブロックの上で冷やした。ライゲーション混合物（１２μＬのｃｆＤＮＡ、２μＬの１０ＸＣｉｒｃｌｉｇａｓｅ緩衝液、４μＬの５Ｍベタイン、１μＬの５０ｍＭＭｎＣｌ_２、１μＬのＣｉｒｃｌｉｇａｓｅＩＩ（Ｅｐｉｃｅｎｔｒｅ＃ＣＬ９０２５Ｋ））の追加を冷たいブロックの上でセットアップし、ライゲーションを６０℃で３時間行った。ライゲーションＤＮＡ混合物をＰＣＲｍａｃｈｉｎｅ上で、８０℃で４５秒間インキュベートし、その後エキソヌクレアーゼ処理を行った。１μＬのエキソヌクレアーゼ混合物（Ｅｘｏｌ２０Ｕ／μＬ：ＥｘｏＩＩＩ１００Ｕ／μＬ＝１：２）を各管に加え、反応物を３７℃で３０分間インキュベートした。

ワークフロー１のために、ライゲーション産物を、フェノールクロロホルムで抽出し、且つ塩とエタノールで沈殿させた。１８０μＬの１０ｍＭＴｒｉｓを、エキソヌクレアーゼ処理から２０μＬのＤＮＡに加えて、２００μＬの量を作り出し、２００μＬのフェノールを使用してＤＮＡを抽出した。水層を集め、ＤＮＡをエタノール沈澱によって回収した。エタノール共沈殿混合物（フェノール抽出後の２００μＬのＤＮＡ溶液、２０μＬの酢酸ナトリウム０．５ＭｐＨ５．２、１μＬのＧｌｙｃｏＢｌｕｅ、１μＬの担体オリゴ（１００ｎｇ／μＬ）、６００μＬの１００％エタノール）を、−８０℃で３０分間インキュベートし、１６ｋｒｐｍで５分間遠心分離して、ＤＮＡを沈殿させた。ＤＮＡペレットを５００μＬの７０％エタノールで洗浄した。

ＤＮＡペレットを室温で５分間風乾し、１１μＬの１０ｍＭＴｒｉｓ−ＣｌｐＨ８．０で再懸濁した。全ゲノム増幅（ＷＧＡ）を行うために、精製ＤＮＡを最初に６５℃で５分間変性させた。ＧＥＷＧＡキットからの１０μＬの変性緩衝液を１０μＬの精製ＤＮＡに加えた。ＤＮＡを２分間、冷たいブロック又は氷の上で冷やした。２０μＬのＤＮＡをＲｅａｄｙ−Ｔｏ−ＧｏＧｅｎｏｍｉＰｈｉＶ３ケーク（ＷＧＡ）に加えた。ＷＧＡ反応物を３０℃で１．５時間インキュベートし、その後６５℃で１０分間の熱不活性化を行った。

ワークフロー２のために、０．１２μＬの０．５ＭＥＤＴＡ及び０．５８μＬの１ＭＫＣｌを、エキソヌクレアーゼ処理したライゲーション産物に加え、十分に混合した。ライゲーション混合物を９５℃で２分間変性させ、Ｒｅａｄｙ−Ｔｏ−ＧｏＧｅｎｏｍｉＰｈｉＶ３ケーク（ＷＧＡ）に加える前に氷の上で４℃に冷えた。ＷＧＡ反応物を３０℃で４．５時間インキュベートし、その後６５℃で１０分間の熱不活性化を行った。

ワークフロー３−６のために、エキソヌクレアーゼ処理したライゲーション産物を、最初にプロテアーゼで処理し、ｃｉｒｃｌｉｇａｓｅＩＩを取り除いた。１μＬのセリンプロテアーゼを各反応物に加え、５５℃でのインキュベーション時間を１５分から６０分に漸増し（条件３：１５分；条件４：２０分；条件５：３０分；条件６：６０分）、その後、７０℃で１５分間の熱不活性化を行い、０．１２μＬの０．５ＭＥＤＴＡ及び０．５８μＬの１ＭＫＣｌを、処理されたライゲーション産物に加えた。その後、ライゲーション混合物を９５℃で２分間変性させ、Ｒｅａｄｙ−Ｔｏ−ＧｏＧｅｎｏｍｉＰｈｉＶ３ケーク（ＷＧＡ）に加える前に氷の上で４℃に冷えた。ＷＧＡ反応物を３０℃で４．５時間インキュベートし、その後６５℃で１０分間の熱不活性化を行った。

全ての条件のために、ＷＧＡ産物を、ＡｍｐｕｒｅＸＰ磁気ビーズを使用してビーズ精製し、８００ｂｐの平均サイズに超音波処理した。その後、超音波処理されたＤＮＡサンプルを、ＫＡＰＡライブラリ調製物キットを使用した標準配列決定ライブラリ構築のために、インプットとして使用した。その後、ライブラリをＩｌｌｕｍｉｎａＨｉＳｅｑ２５００によって配列決定し、ライブラリ複雑性を、各ライブラリで検知された固有の分子の数を算出することにより評価した。ライブラリ複雑性の比較を以下の図面で示し、固有分子の数を相対的な基準で調整した。ワークフロー１は最低の複雑性を示し；ワークフロー２はワークフロー１よりもわずかに高いライブラリ複雑性を示し、このことは、精製をスキップすることによる分子欠損があまりないことを示し；リガーゼの除去（ワークフロー３−６）の除去はライブラリにおける固有の分子の数を大幅に増大し、より長いプロテアーゼ処理時間が検出されたより多くの固有の分子に通じる。検出された分子の増加は、この実験での３０分のインキュベーションの後に安定水準に達し始めた。結果を図３８に表す。

実施例１８：変異体コール
この実施例は、本明細書に記載される方法を使用して変異体コールを評価し、ここで、少なくとも２つの異なる切断されたポリヌクレオチドに生じる配列変異体は真の配列変異体として同定される。

９つの細胞株からのゲノムＤＮＡを〜１５０ｂｐの平均サイズに断片化し、混合して、ＤＮＡ混合物を産生した。ＤＮＡ混合物は、０．１％の対立遺伝子頻度（ＡＦ）で８つの癌ホットスポット（表１１）を占めている。１２μＬの２０ｎｇＤＮＡ混合物を各反応のライブラリ構築のためにインプットとして使用した。ＤＮＡサンプルを９６℃で３０秒間変性させ、２分間氷ブロックの上で冷やした。ライゲーション混合物（１２μＬのｃｆＤＮＡ、２μＬの１０ＸＣｉｒｃｌｉｇａｓｅ緩衝液、４μＬの５Ｍベタイン、１μＬの５０ｍＭＭｎＣｌ_２、１μＬのＣｉｒｃｌｉｇａｓｅＩＩ（Ｅｐｉｃｅｎｔｒｅ＃ＣＬ９０２５Ｋ））の追加後、反応物を冷たいブロックの上でセットアップし、ライゲーションを６０℃で３時間行った。ライゲーションＤＮＡ混合物をＰＣＲｍａｃｈｉｎｅ上で、８０℃で４５秒間インキュベートし、その後エキソヌクレアーゼ処理を行った。１μＬのエキソヌクレアーゼ混合物（Ｅｘｏｌ２０Ｕ／μＬ：ＥｘｏＩＩＩ１００Ｕ／μＬ＝１：２）を各管に加え、反応物を３７℃で３０分間インキュベートした。ＣｉｒｃｌｉｇａｓｅＩＩをプロテアーゼ処理によって取り除き、０．１２μＬの０．５ＭＥＤＴＡ／０．５８μＬの１ＭＫＣｌを反応物に加えた。その後、ライゲーション混合物を９５℃で２分間変性させ、Ｒｅａｄｙ−Ｔｏ−ＧｏＧｅｎｏｍｉＰｈｉＶ３ケーク（全ゲノム増幅、ＷＧＡ）に加える前に氷の上で４℃に冷えた。ＷＧＡ反応物を３０℃で４．５時間インキュベートし、その後６５℃で１０分間の熱不活性化を行った。

ＷＧＡ産物を、ＡｍｐｕｒｅＸＰ磁気ビーズを使用してビーズ精製し、〜８００ｂｐの平均サイズに超音波処理した。その後、超音波処理されたＤＮＡサンプルを、ＫＡＰＡライブラリ調製物キットを使用した標準配列決定ライブラリ構築のために、インプットとして使用した。図３９に例示されるように、超音波処理又は他の断片化方法（例えば酵素切断）を使用して、ＲＣＡから結果として生じる一連の長いコンカテマーからより短いコンカテマーを生成することができる。結果として生じるコンカテマーには様々な構造があり得る。形成されたより短いコンカテマーには異なる数の反復、又はインプットＤＮＡ配列のコピー、接合部に対するリードにおける異なる開始／末端位置（例えばコンカテマー寸断点）がある場合がある。場合によっては、様々な構造を持つコンカテマーは、ランダムプライミングによって産生される（図４０）。

ライブラリをＩｌｌｕｎｉｍａＨｉＳｅｑ２５００によって配列決定し、配列決定リードを配列分析にさらした。配列分析において、コンカテマー寸断点を配列決定リードの接合部配列と組み合わせて、配列決定リードに関連しうる固有のタグを作成することができる。固有のタグによって同定されたリードファミリーから構築されたコンセンサス配列を使用して、追加の誤差補正を実行することができる。

様々な投票方式を使用して、リードのファミリーからコンセンサス配列を構築し、変異体コールを実行してもよい。コンセンサスは、例えば、同じ変異体を報告するファミリーの大多数のリードに基づいて作成することができる。配列の差異をリードファミリーのコンセンサス配列と参照配列との間で同定することができ、場合によっては、同じ配列の差異が少なくとも２つの異なるリードファミリーに生じるときに変異体をコールする。固有タグを使用して、インプット分子を集計し、対立遺伝子頻度を計算することを支援することもできる。

コンカテマー寸断点を同定し且つ変異体コールを実行するための例示的なアルゴリズムにおいて、
１）例えば自己アラインメント、参照配列へのアラインメント、或いは他の計算方法により、コンカテマー配列（リード）において、反復長さ、反復領域、及び接合部を同定。
２）参照配列のリードを整列させることによりリード内の接合部の位置を判定。
３）変更される基部の数を隣接接合部のリード位置により判定する一方、接合部の参照開始又は末端位置から位置を変えることによりコンカテマー寸断点（両端にある）の位置を計算。
４）「接合部タグ」（例えば固有のタグ）と組み合わせて寸断点に基づいてリードをグループ分けし、各々が固有のタグを持つリードの異なるリードファミリーを作成。
５）リードファミリーにおけるリードの大部分が変異体を全体一致で支持、即ち、全てのリードがコンカテマー確認により変異体を報告した場合、このファミリーは変異体ファミリーとして計数される（図４１Ａ）；それ以外では、このファミリーは変異体ファミリーとして計数されない（図４１Ｂ）。
６）変異体ファミリーの数を使用して、「接合部タグ」により同定されたインプット分子が、様々なカットオフが適用される「変異体分子」として計数することが可能かどうかを判定することができる。例えば、図４１Ｃにおいて、同じ配列の差異（開始）が少なくとも２つの異なるリードファミリーに生じたときに、変異体がコールされる。場合によっては、「変異体分子」の数を使用して、変異体がコールされるべきかどうかを判定し、且つ、対立遺伝子頻度を算出することができる。

本明細書に記載される方法を使用した変異体検出の改善を判定するために、配列の差異が第１の切断されたポリヌクレオチドからの配列決定リードの大多数且つ第２の切断されたポリヌクレオチドからの配列決定リードの大多数に生じるときに、配列決定リードにおいて検出される配列の差異を変異体としてコールすることにより同定される変異体の数は、そのような要求を必要としない方法により同定された変異体と比較された。表１２に示されるように、少なくとも２つの異なる切断されたポリヌクレオチドに生じる配列変異体の要件は、非特異的偽陽性変異体を〜２３．３９％減らし、一方で真の陽性コールはどれも取り除かれず（取り除かれた特異的な真の変異体は０％である）、このことは、感度に影響を及ぼすことのない特異性の有意な改善を示す。

本発明の好ましい実施形態が本明細書中で示され且つ記載されてきたが、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。多数の変形、変更、及び置き換えは、本発明から逸脱することなく、当業者によって現在想到されるものである。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用されるかもしれないことを理解されたい。以下の特許請求の範囲は本発明の範囲を定義するものであり、この特許請求の範囲及びその同等物の範囲内の方法及び構造は、それにより包含されることが、意図されている。

Claims

ローリングサークル増幅を実施する方法であって、
該方法は、
（ａ）リガーゼ酵素を使用して複数の環状ポリヌクレオチドを形成するために、反応混合物において、複数の開始鋳型ポリヌクレオチド中の開始鋳型ポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドのそれぞれのポリヌクレオチドは環状化の前に５’末端と３’末端を有する、工程と、
（ｂ）リガーゼ酵素を分解するために、非耐熱性プロテアーゼを前記反応混合物に加える工程と、
（ｃ）増幅されたポリヌクレオチドを生成するために、工程（ａ）と（ｃ）との間で環状ポリヌクレオチドを前記反応混合物から単離することなく、工程（ｂ）の後に環状ポリヌクレオチドを増幅する工程とを含み、
前記方法は、工程（ａ）と（ｃ）のみを含むローリングサークル増幅の実行と比較して、開始鋳型ポリヌクレオチドのより高いレベルの回収をもたらし、
前記方法は、工程（ｃ）の前であるが工程（ｂ）の後に、非耐熱性プロテアーゼを熱不活性化する工程をさらに含み、
より高いレベルの回収はライブラリ複雑性の増加により証明され、ならびに
ライブラリ複雑性の増加は、前記開始鋳型ポリヌクレオチドから増幅された固有の配列の数の増加により表される、
方法。
工程（ｂ）または工程（ｃ）の前に、線状開始鋳型ポリヌクレオチドを分解する工程をさらに含む、請求項１に記載の方法。
複数の開始鋳型ポリヌクレオチドが一本鎖である、請求項１に記載の方法。
個々の環状ポリヌクレオチドは、環状化したポリヌクレオチドのなかで特徴的な接合部を有する、請求項１に記載の方法。
環状化する工程は、複数の鋳型ポリヌクレオチド中の鋳型ポリヌクレオチドの５’末端、３’末端、あるいは５’末端と３’末端の両方へアダプターポリヌクレオチドを接合する工程を含む、請求項１に記載の方法。
増幅する工程は、環状ポリヌクレオチドを、複数のプライマーを含む増幅反応にさらす工程を含み、その各々は配列相補性によって異なる標的配列に特異的にハイブリダイズする、請求項１に記載の方法。
サンプルは被験体からのサンプルである、請求項１に記載の方法。
サンプルは、尿、便、血液、唾液、組織、あるいは体液である、請求項７に記載の方法。
サンプルは腫瘍細胞を含む、請求項７に記載の方法。
サンプルは、ホルマリン固定パラフィン包埋（ＦＦＰＥ）サンプルである、請求項７に記載の方法。
複数の開始鋳型ポリヌクレオチドが無細胞のポリヌクレオチドを含む、請求項１に記載の方法。
増幅されたヌクレオチドを切断する工程をさらに含む、請求項１に記載の方法。
無細胞のポリヌクレオチドが無細胞ＤＮＡあるいは無細胞ＲＮＡである、請求項１１に記載の方法。
無細胞のポリヌクレオチドが無細胞腫瘍ＤＮＡあるいは無細胞腫瘍ＲＮＡである、請求項１３に記載の方法。
複数の配列決定リードを生成するために増幅されたポリヌクレオチドを配列決定する工程をさらに含む、請求項１に記載の方法。
配列決定リードと参照配列との間の配列の差異を同定する工程をさらに含む、請求項１５に記載の方法。
（ｉ）配列の差異がローリングサークル増幅によって形成されたコンカテマーのコンセンサス配列で生じ、（ｉｉ）配列の差異が二本鎖入力分子の両方の鎖で同定され、および／または、（ｉｉｉ）配列の差異が２つの異なる分子で生じるときにのみ、配列の差異を、複数の開始鋳型ポリヌクレオチド中の配列変異体としてコールする工程をさらに含む、請求項１６に記載の方法。
配列の差異が５’末端と３’末端との間で形成された異なる接合部を有する少なくとも２つの環状ポリヌクレオチドで生じるとき、配列の差異は２つの異なる分子で生じるものとして同定される、請求項１７に記載の方法。
２つの異なる分子に対応するリードが異なる５’末端と異なる３’末端を有するとき、配列の差異は２つの異なる分子で生じるものとして同定される、請求項１７に記載の方法。
配列変異体は原因遺伝子変異体である、請求項１７に記載の方法。
配列変異体は癌のタイプまたはステージに関連付けられる、請求項１７に記載の方法。
非耐熱性プロテアーゼは所定の温度で非活性化され、前記所定の温度は７０°Ｃであるか、またはその値の最大２０％の範囲内にある、請求項１に記載の方法。
配列決定ライブラリを生成する方法であって、
（ａ）リガーゼ酵素を使用して複数の環状ポリヌクレオチドを形成するために、反応混合物において、複数の開始鋳型ポリヌクレオチド中の個々の開始鋳型ポリヌクレオチドを環状化する工程であって、複数の開始鋳型ポリヌクレオチドのそれぞれのポリヌクレオチドは環状化の前に５’末端と３’末端を有する、工程と、
（ｂ）リガーゼ酵素を分解するために、非耐熱性プロテアーゼを前記反応混合物に加える工程と、
（ｃ）増幅されたポリヌクレオチドを含む配列決定ライブラリを生成するために、工程（ａ）と（ｃ）との間で環状ポリヌクレオチドを前記反応混合物から単離することなく、工程（ｂ）の後に環状ポリヌクレオチドを増幅する工程とを含み、
前記方法は、工程（ｃ）の前であるが工程（ｂ）の後に、非耐熱性プロテアーゼを熱不活性化する工程をさらに含み、
前記方法は、工程（ｂ）を行わずに、工程（ａ）と（ｃ）のみを含む方法を実行することによって生成される対照ライブラリより少なくとも１倍大きな複雑性を有する配列決定ライブラリを生成する、
方法。
生成された配列決定ライブラリは、対照ライブラリより少なくとも２倍大きな複雑性を有する、請求項２３に記載の方法。
複数の開始鋳型ポリヌクレオチドが無細胞のポリヌクレオチドを含む、請求項２３に記載の方法。
非耐熱性プロテアーゼは所定の温度で非活性化され、前記所定の温度は７０°Ｃであるか、またはその値の最大２０％の範囲内にある、請求項２３に記載の方法。