JP2024038164A

JP2024038164A - 変異を導入するための方法

Info

Publication number: JP2024038164A
Application number: JP2023221021A
Authority: JP
Inventors: ジーモナハン，レイ; ト，ジョイス; エムバーク，キャサリン; イメルフォート，マイケル; イーダーリン，アーロン
Original assignee: Illumina Singapore Pte Ltd
Current assignee: Illumina Singapore Pte Ltd
Priority date: 2018-02-20
Filing date: 2023-12-27
Publication date: 2024-03-19
Also published as: JP7413283B2; CN112088219A; EP4008792A1; KR20200123458A; GB201802744D0; US20210010008A1; JP2021514205A; US20220348940A1; EP3673084A1; DK3673084T3; EP3673084B1; ES2889548T3; CA3091770A1; AU2019223315A1; SG11202007924TA; US11421238B2; WO2019162657A1

Abstract

【課題】1つ以上の核酸分子に変異を導入するための方法を提供する。【解決手段】以下(a)および(b)、すなわち(a)少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、および(b)低バイアスDNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅すること、を含む、少なくとも1つの標的核酸分子に変異を導入するための方法を提供する。さらに、1つ以上の核酸分子に変異を導入するための方法における低バイアスDNAポリメラーゼの使用、サンプルタグ群、該サンプルタグ群を設計するための方法、コンピュータ可読媒体、および標的核酸分子を選択的に増幅するための方法を提供する。【選択図】なし

Description

本発明は、1つ以上の核酸分子に変異を導入するための方法、1つ以上の核酸分子に変異を導入するための方法における低バイアスDNAポリメラーゼの使用、サンプルタグ群、該サンプルタグ群を設計するための方法、コンピュータ可読媒体および標的核酸分子を選択的に増幅するための方法に関する。

DNAポリメラーゼは、核酸配列に変異を導入するために使用することができる。このことは、複数の用途において有用でありうる。例えば、突然変異誘発技術は、突然変異誘発技術により支援される配列決定(SAM)を含む用途において、およびタンパク質配列に変異を導入して該タンパク質の活性に影響を及ぼす変異を見出すために、有用でありうる。

変異は、低い忠実度(fidelity)を示すDNAポリメラーゼを使用して導入してもよい。低忠実度DNAポリメラーゼは複製中にミスを生じ、これが変異の導入をもたらす。しかし、多くの低忠実度DNAポリメラーゼは変異反応(1ラウンドの複製)当たり2％未満という割合で変異を導入するにすぎず、また一部の用途に関しては、より高い突然変異誘発率が有用である。加えて、低忠実度DNAポリメラーゼは偏った形で変異を導入する場合がある。かかるDNAポリメラーゼは高バイアスDNAポリメラーゼと称されることがある。

変異は、dPTPなどのヌクレオチド類似体の存在下で、DNAポリメラーゼを使用して、配列を複製することにより導入してもよい。DNAポリメラーゼは、天然ヌクレオチドの代わりにヌクレオチド類似体を組み込む場合がある。その結果、その後の複製サイクルにおいて、該ヌクレオチド類似体は、元の配列には存在していなかった天然ヌクレオチドと対を形成し、それによって変異を導入することができる。ヌクレオチド類似体の存在下で配列を複製することによる変異の導入を利用すれば、より高い変異率を達成することができる。

慣用されるDNAポリメラーゼ(例えば、Taqポリメラーゼ)を使用することにより、天然ヌクレオチドの代わりにヌクレオチド類似体を組み込むことができる。しかし、これらのポリメラーゼは高バイアスポリメラーゼである。高バイアスDNAポリメラーゼは2つの考えうるバイアス、すなわち変異バイアスおよび鋳型増幅バイアスを示す場合がある。

一部の高バイアスポリメラーゼは高い変異バイアスを有するが、これは該ポリメラーゼが4種の天然ヌクレオチド(アデニン、シトシン、グアニンおよびチミン)全てを一様にランダムに変異させることはないからである。例えば、高バイアスDNAポリメラーゼは、一部のヌクレオチドを他のものより高い頻度で変異させる場合がある。アデニン／チミン対は2つの水素結合で繋がっているが、グアニン／シトシン対は3つの水素結合で繋がっている。従って、高バイアスDNAポリメラーゼはグアニン／シトシン対よりもアデニン／チミン対に変異を導入する可能性が高い場合がある。

高い変異バイアスを有する高バイアスポリメラーゼは、ヌクレオチド類似体をランダムに組み込めない場合がある。例えば、高バイアスポリメラーゼは、特定の塩基とヌクレオチド類似体との置き換えに有利に働く場合がある。dPTPは、2つの異なる互変異性型であるイミノ型とアミノ型の間で相互転換可能である。イミノ互変異性体はアデニンとWatson-Crick塩基対を形成することが可能であり、アミノ型はグアニンとWatson-Crick塩基対を形成することが可能である(Kong Thoo Lin P, Brown D M (1989). “Synthesis and duplex stability of oligonucleotides containing cytosine-thymine analogues”. Nucleic Acids Research. 17：10373-10383；Stone M Jら (1991). “Molecular basis for methoxyamine-initiated mutagenesis：¹H nuclear magnetic resonance studies of base-modified oligodeoxynucleotides.” Journal of Molecular Biology. 222：711-723；Nedderman A N Rら (1993). “Molecular basis for methoxyamine initiated mutagenesis：¹H nuclear magnetic resonance studies of oligonucleotide duplexes containing base-modified cytosine residues”. Journal of Molecular Biology. 230：1068-1076；Moore M Hら (1995). “Direct observation of two base-pairing modes of a cytosine-thymine analogue with guanine in a DNAZ-form duplex. Significance for base analogue mutagenesis”. Journal of Molecular Biology. 251：665-673)。これは実質的に、dPTPの存在下での複製を利用することにより、ヌクレオチド配列にアデニン、シトシン、グアニンまたはチミンの代わりに置換体を導入できることを意味する。しかし、水溶液中では、dPTPのイミノ型とアミノ型の割合は約10：1であることが示されている(Harris V Hら (2003). “The effect of tautomeric constant on the specificity of nucleotide incorporation during DNA replication：support for the rare tautomer hypothesis of substitution mutagenesis”. Journal of Molecular Biology. 326：1389-1401)。従って、dPTPを使用して変異を導入するためにTaqポリメラーゼなどのポリメラーゼを使用する場合、該ポリメラーゼはグアニンおよびシトシンの置換体よりもずっと頻繁にアデニンおよびチミンの置換体を導入する(Zaccolo Mら (1996). “An approach to random mutagenesis of DNA using mixtures of triphosphate derivatives of nucleoside analogues”. Journal of Molecular Biology. 255：589-603；Harris V Hら (2003). “The effect of tautomeric constant on the specificity of nucleotide incorporation during DNA replication：support for the rare tautomer hypothesis of substitution mutagenesis”. Journal of Molecular Biology. 326：1389-1401)。

第二に、高バイアスポリメラーゼは鋳型増幅バイアスを示す場合がある、すなわち、それらは一部の鋳型核酸分子をPCRサイクル当たりに他のものより高い成功率で複製する場合がある。多サイクルのPCRを通して、このバイアスは鋳型間にコピー数の極端な差を生み出す可能性がある。鋳型核酸分子の領域は二次構造を形成していてもよいし、または一部のヌクレオチド(例えばグアニンまたはシトシンヌクレオチド)を他のものより高い割合で含有していてもよい。高バイアスポリメラーゼは、例えば、アデニンおよびチミンに富む鋳型核酸分子と比較して、グアニンおよびシトシンに富む鋳型核酸分子を増幅するのにより有効であるかもしれず、または二次構造を形成しない鋳型核酸分子を増幅するのにより有効であるかもしれない。

突然変異誘発の用途の多くは、突然変異誘発を低バイアス(変異バイアスおよび鋳型増幅の両方)で実施できる場合により有効である。

多くの第二世代の配列決定用プラットフォームは短い核酸断片を配列決定することしかできず、また配列決定ステップに十分な核酸分子を提供するためには配列決定の過程で標的核酸配列が増幅される必要があるため、ゲノム配列の正確なアセンブリは困難であることが判明している。使用者がより大きな核酸配列を配列決定することを望む場合、これは標的核酸分子の複数領域を配列決定することにより達成できる。使用者はその際、該領域の配列から全核酸配列の配列をコンピュータによって組み立てなければならない。

複数領域の配列を利用して核酸配列を組み立てることは困難でありうる。特に、該配列の長い領域が互いに極めて似ている場合、2つの領域の配列が共に同一の元の鋳型核酸分子の複製物の配列であるか、または2つの異なる元の鋳型核酸分子から得た配列に相当するかを判定することは困難であろう。同様に、2つの領域の配列が鋳型核酸分子の同一部分の複製物の配列に相当するか、または鋳型核酸分子内の2つの異なる反復配列に実際に相当するかを判定することは困難であろう。これらの困難は、増幅の前に標的核酸分子に変異を導入することにより回避できる。使用者は次に、同一の変異パターンを有する断片は同一の元の鋳型核酸分子の同一部分に由来する可能性があることを確認してもよい。このタイプの配列決定方法は、突然変異誘発により支援される配列決定(SAM)と称されることがある。

Kong Thoo Lin P, Brown D M (1989). "Synthesis and duplex stability of oligonucleotides containing cytosine-thymine analogues". Nucleic Acids Research. 17：10373-10383 Stone M Jら (1991). "Molecular basis for methoxyamine-initiated mutagenesis：1H nuclear magnetic resonance studies of base-modified oligodeoxynucleotides." Journal of Molecular Biology. 222：711-723 Nedderman A N Rら (1993). "Molecular basis for methoxyamine initiated mutagenesis：1H nuclear magnetic resonance studies of oligonucleotide duplexes containing base-modified cytosine residues". Journal of Molecular Biology. 230：1068-1076 Moore M Hら (1995). "Direct observation of two base-pairing modes of a cytosine-thymine analogue with guanine in a DNAZ-form duplex. Significance for base analogue mutagenesis". Journal of Molecular Biology. 251：665-673 Harris V Hら (2003). "The effect of tautomeric constant on the specificity of nucleotide incorporation during DNA replication：support for the rare tautomer hypothesis of substitution mutagenesis". Journal of Molecular Biology. 326：1389-1401 Zaccolo Mら (1996). "An approach to random mutagenesis of DNA using mixtures of triphosphate derivatives of nucleoside analogues". Journal of Molecular Biology. 255：589-603 Harris V Hら (2003). "The effect of tautomeric constant on the specificity of nucleotide incorporation during DNA replication：support for the rare tautomer hypothesis of substitution mutagenesis". Journal of Molecular Biology. 326：1389-1401

上記の配列決定方法は、標的核酸分子に導入する変異が一様にランダムである場合により有効である。該変異が一様にランダムであるならば、その際、例えば、鋳型核酸分子の任意の所与の部分が固有の変異パターンを有する可能性はより高い。従って、一様にランダムに変異を導入することができる(低変異バイアスを有する)DNAポリメラーゼの同定が必要とされている。

加えて、高鋳型増幅バイアスを有するDNAポリメラーゼを使用する配列決定方法は限定的でありうる。高鋳型増幅バイアスを有するDNAポリメラーゼは一部の標的核酸分子を他のものより多く複製する、かつ／または変異させるであろうし、またそのために、かかる高バイアスDNAポリメラーゼを使用する配列決定方法は一部の標的核酸分子を十分に配列決定できない場合がある。

本発明者らは、低バイアスポリメラーゼ(低鋳型増幅バイアスと低変異バイアスの両方を有する)であり、またそのために少なくとも1つの標的核酸分子に変異を導入するための方法において特に有用であるポリメラーゼを同定した。

使用者は、一度に2つ以上のサンプルに対して本発明の方法を使用することを望むかもしれない。そうした場合には、どの標的核酸分子がどの元サンプルに由来するかを同定できることが使用者にとって有利であろう。かかる同定は、標的核酸分子をサンプルタグで標識することにより達成できるだろう。しかし、サンプルタグは、それ自体が前記方法の最中に変異する場合があるため、本発明者らは、サンプルタグが変異しても互いに区別できる該サンプルタグを設計する方法を決定した。

使用者はまた、本発明の方法を利用することにより短い標的核酸分子と比較して優先的に長い標的核酸分子が変異しかつ増幅されるよう保証することを望むかもしれない。本発明者らは、これが標的核酸分子の各末端に特殊なプライマー結合部位を導入することにより達成できることを見出した。

従って、本発明の第1態様では、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.低バイアスDNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅すること
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法が提供される。

本発明の第2態様では、少なくとも1つの標的核酸分子に変異を導入するための方法における、低バイアスDNAポリメラーゼの使用が提供される。

本発明の第3態様では、本発明の変異を導入するための方法を含む、少なくとも1つの標的核酸分子の配列を決定するための方法が提供される。

本発明の第4態様では、本発明の変異を導入するための方法を含む、タンパク質を操作するための方法が提供される。

本発明の第5態様では、サンプルタグ群であって、各サンプルタグが、少なくとも1の低確率変異差または少なくとも3の高確率変異差により該群の実質的に全ての他のサンプルタグと異なっている該サンプルタグ群が提供される。

本発明の第6態様では、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子に変異を導入するための方法を解析し、かつこの少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数を決定すること、および
b.少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数より多い低確率差により各サンプルタグがサンプルタグ群の実質的に全てのサンプルタグと異なっている該群について、配列を決定すること
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法における使用に適したサンプルタグ群を設計するための方法が提供される。

本発明の第7態様では、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.DNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅することにより、この少なくとも1つの標的核酸分子に変異を導入して変異した少なくとも1つの標的核酸分子を用意すること、
ここでステップb.は不均一濃度のdNTPを使用して実行するものとする、
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法が提供される。

本発明の第8態様では、本発明のサンプルタグ群を設計するための方法により取得可能なサンプルタグ群が提供される。

本発明の第9態様では、本発明のサンプルタグ群を設計するための方法を実施するために構成されたコンピュータ可読媒体が提供される。

本発明の第10態様では、以下a.～c.、すなわち
a.標的核酸分子を含む少なくとも1つのサンプルを用意すること、
b.標的核酸分子の3’末端に第1アダプターを導入し、かつ標的核酸分子の5’末端に第2アダプターを導入すること、および
c.第1アダプターの一部に相補的であるプライマーを使用して標的核酸分子を増幅すること、
ここで該第1アダプターと該第2アダプターは互いにアニーリングできるものとする、
を含む、1 kbp長より大きい標的核酸分子を選択的に増幅するための方法が提供される。

図1は、dPTPの存在下または非存在下で3つの異なるポリメラーゼを用いて達成された変異のレベル示す図である。パネルAはTaq (Jena Biosciences)を使用して取得したデータを示し、パネルBはLongAmp (New England Biolabs)を使用して取得したデータを示している。濃グレーのバーはdPTPの非存在下で取得した結果を示しており、また薄グレーのバーは0.5 mM dPTPの存在下で取得した結果を示している。図1は、dPTPの存在下または非存在下で3つの異なるポリメラーゼを用いて達成された変異のレベル示す図である。パネルCはPrimestar GXL (Takara)を使用したデータを示している。濃グレーのバーはdPTPの非存在下で取得した結果を示しており、また薄グレーのバーは0.5 mM dPTPの存在下で取得した結果を示している。図2は、多様なG＋C含量の鋳型に対してサーモコッカス属古細菌(Thermococcus)のポリメラーゼ(Primestar GXL；Takara)を使用したdPTP突然変異誘発により取得した変異率を記載した図である。観察された変異の中央値は、黄色ブドウ球菌(S. aureus)から得た低GC鋳型(33％GC)に関しては7％以下であったが、他の鋳型に関するする中央値は約8％であった。図3は、配列表を示す図である。図3は、配列表を示す図である。図3は、配列表を示す図である。図3は、配列表を示す図である。図3は、配列表を示す図である。図3は、配列表を示す図である。図3は、配列表を示す図である。サンプルタグの配列を示す。図４－１の続きである。図４－１の続きである。図４－１の続きである。図４－１の続きである。図5は、互いにアニーリングする第1プライマー結合部位および第2プライマー結合部位を使用した場合の、核酸分子の自己アニーリングを表した図である。図6は、互いにアニーリングするアダプター(右の線)を使用して、または標準的なアダプター(左の線)を使用して増幅した、標的核酸分子のサイズを表した図である。図7は、ヌクレオチド類似体dPTP(図7中では「P」と記載する)を使用した変異の図解を示す図である。

一般的定義
他に定義する場合を除き、本明細書中で使用する技術的および科学的用語は、本発明が属する分野の熟練者により通常理解されるものと同じ意味を有する。

一般に、「含む」という用語は、包含するがそれらに限定されないことを意味するものとする。例えば、ある特定のステップ「を含む少なくとも1つの標的核酸分子に変異を導入するための方法」という表現は、該方法が列挙されたステップを包含すること、ただし追加のステップを実施する場合があることを意味すると解釈すべきである。

本発明の幾つかの実施形態では、「含む」という単語は「からなる」という表現と置き換えられる。「からなる」という用語は、限定的であることを意図する。例えば、ある特定のステップ「からなる、少なくとも1つの標的核酸分子に変異を導入するための方法」という表現は、該方法が列挙されたステップを包含すること、および追加のステップを実施しないことを意味すると理解すべきである。

本発明の目的上、2つの配列(例えば、2つのポリヌクレオチド配列)の同一性％を決定するために、該配列を、最適な比較を目的として整列させる(例えば、第2配列との最適アラインメントのために第1配列にギャップを導入することができる)。次に、各位置におけるヌクレオチドまたはアミノ酸残基を比較する。第1配列中のある位置が第2配列中の対応する位置と同じ残基で占められている場合、その際は、該残基はその位置において同一である。2配列間の同一性％は、該配列が共有する同一位置の数の関数である(すなわち、同一性％＝同一位置の数／位置の総数×100)。典型的には、配列比較は、参照配列の全長にわたって実行する。例えば、試験配列が配列番号2(参照配列)と少なくとも95％同一であるかどうかを評価するためには、当業者であれば、配列番号2の全長にわたりアラインメントを実行し、試験配列中のどれだけ多くの位置が配列番号2の位置と同一であるかを同定するだろう。該位置のうちの少なくとも80％が同一である場合、該試験配列は配列番号2と少なくとも80％同一である。該配列が配列番号2より短い場合、ギャップを同一ではない位置とみなすべきである。

当業者であれば、2配列間の相同性または同一性を決定するために利用可能な種々のコンピュータプログラムを認識している。例えば、配列の比較および2配列間の同一性％の決定は、数学的アルゴリズムを利用して達成できる。ある実施形態では、2つのアミノ酸または核酸配列間の同一性％は、Accelrys GCGソフトウェアパッケージ(http://www.accelrys.com/products/gcg/で入手可能)中のGAPプログラムに組み込まれているNeedlemanおよびWunsch (1970)のアルゴリズムを利用し、Blosum 62マトリックスまたはPAM250マトリックス、ならびにギャップ重み(gap weight)16、14、12、10、8、6、または4および長さ重み(length weight)1、2、3、4、5、または6を使用して決定する。

少なくとも1つの標的核酸分子に変異を導入するための方法
ある態様では、本発明は、少なくとも1つの標的核酸分子に変異を導入するための方法を提供する。さらなる態様では、本発明は、少なくとも1つの標的核酸分子に変異を導入するための方法における、低バイアスDNAポリメラーゼの使用を提供する。

変異は、置換変異、挿入変異または欠失変異であってもよい。本発明の目的上、「置換変異」という用語は、あるヌクレオチドが別のヌクレオチドと置き換えられていることを意味すると解釈すべきである。例えば、配列ATCCの配列AGCCへの変換は置換変異である。本発明の目的上、「挿入変異」という用語は、少なくとも1つのヌクレオチドが配列に付加されていることを意味すると解釈すべきである。例えば、配列ATCCの配列ATTCCへの変換は、挿入変異の一例である(付加的なTヌクレオチドが挿入されている)。本発明の目的上、「欠失変異」という用語は、少なくとも1つのヌクレオチドが配列から除去されていることを意味すると解釈すべきである。例えば、配列ATTCCのATCCへの変換は欠失変異の一例である(Tヌクレオチドが除去されている)。好ましくは、変異は置換変異である。

本発明の目的上、「核酸分子」は、任意の長さを有するヌクレオチドのポリマー形態を指す。ヌクレオチドはデオキシリボヌクレオチド、リボヌクレオチドまたはその類似体であってもよい。好ましくは、標的核酸分子はデオキシリボヌクレオチドまたはリボヌクレオチドで構成されている。さらにより好ましくは、標的核酸分子はデオキシリボヌクレオチドで構成されている、すなわち、標的核酸分子はDNA分子である。

少なくとも1つの「標的核酸分子」は、前記方法の使用者が変異を導入することを望む任意の核酸分子でありうる。標的核酸分子は、染色体などのより大きな核酸分子の一部を形成していてもよい。標的核酸分子は1遺伝子、複数の遺伝子または遺伝子の断片を含んでいてもよい。標的核酸分子は、そのサイズが1 kbp超、1.5 kbp超、2 kbp超、4 kbp超、5 kbp超、7 kbp超、8 kbp超、1 kbp～50 kbp、または1 kbp～20 kbpであってもよい。

「少なくとも1つの標的核酸分子（molecule）」という用語は、「少なくとも1つの標的核酸分子(複数)（molecules）」という用語と互換可能であるとみなされる。

「少なくとも1つの標的核酸分子」は一本鎖でありうるし、または二本鎖複合体の一部であってもよい。例えば、該少なくとも1つの標的核酸分子がデオキシリボヌクレオチドで構成されているならば、該標的核酸分子は二本鎖DNA複合体の一部を形成していてもよい。その場合、一方の鎖(例えばコード鎖)は該少なくとも1つの標的核酸分子と見なされ、かつ他方の鎖はこの少なくとも1つの標的核酸分子に相補的な核酸分子である。

少なくとも1つの標的核酸分子に変異を導入するための方法は、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することを含んでいてもよい。

少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること
少なくとも1つの標的核酸分子に変異を導入するための方法は、少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意するステップを含んでいてもよい。

該少なくとも1つのサンプルは、少なくとも1つの標的核酸分子を含む任意のサンプルを含んでいてもよい。該少なくとも1つのサンプルは、任意の供給源から取得してもよい。例えば、該少なくとも1つのサンプルは、ヒトに由来する核酸のサンプル、例えばヒト患者の皮膚検体から抽出したサンプルを含んでいてもよい。あるいは、該少なくとも1つのサンプルは、給水から得たサンプルなどの他の供給源に由来するものであってもよい。かかるサンプルは、何十億もの鋳型核酸分子を含有している可能性がある。これらの何十億もの標的核酸分子それぞれを、本発明の方法を利用して同時に変異させることが可能であろうし、またそのために、本発明の方法に使用しうる標的核酸分子の数に上限は存在しない。

ある実施形態では、ステップa.は2つ以上のサンプルを用意することを含む。例えば、ステップa.は、2、3、4、5、6、7、8、9、10、11、15、20、25、50、75、または100のサンプルを用意することを含んでいてもよい。状況に応じて、ステップa.は2000未満、1000未満、750未満、または500未満のサンプルを用意することを含む。さらなる実施形態では、ステップa.は2～100、2～75、2～50、2～25、5～15、または7～15のサンプルを用意することを含む。

低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅すること
本発明の方法は、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することを含んでいてもよい。

該少なくとも1つの標的核酸分子を増幅するとは、該少なくとも1つの標的核酸分子を複製することにより、該少なくとも1つの標的核酸分子、および／または該少なくとも1つの標的核酸分子の複製物に相補的である少なくとも1つの核酸分子を提供すること（用意すること）を指す。低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することで、該少なくとも1つの標的核酸分子の複製物の数が増加し、また該少なくとも1つの標的核酸分子に変異が導入される。変異が導入されるため、複製物は、元の少なくとも1つの標的核酸分子と必ずしも同一ではない。元の少なくとも1つの標的核酸分子と、該少なくとも1つの標的核酸分子の複製物は、一括して「少なくとも1つの変異した標的核酸分子」と称される場合がある。

例えば、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することは、該少なくとも1つの標的核酸分子を含むサンプルを、低バイアスDNAポリメラーゼおよび適切なプライマーと共に、該低バイアスDNAポリメラーゼが該少なくとも1つの標的核酸分子の複製物の生成を触媒するのに適した条件下でインキュベートすることを含んでいてもよい。

適切なプライマーは、該少なくとも1つの標的核酸分子に隣接する領域、または該少なくとも1つの標的核酸分子に相補的である核酸分子に隣接する領域に相補的な短い核酸分子を含む。例えば、標的核酸分子が染色体の一部である場合、プライマーは該標的核酸分子の3’末端のすぐ3’側にある該染色体の領域、および該標的核酸分子の5’末端のすぐ5’側にある領域に相補的な核酸分子に相補的であってもよく、またはプライマーは、該標的核酸分子に相補的な核酸分子の3’末端のすぐ3’側にある染色体の領域、および該標的核酸分子に相補的な核酸分子の5’末端のすぐ5’側にある領域に相補的な核酸分子に相補的である。あるいは、使用者は、該少なくとも1つの標的核酸分子に隣接する領域にプライマー結合部位(短い核酸配列)を導入してもよい。これについては、「バーコード、サンプルおよびアダプター」と題した項により詳細に記載する。

適切な条件には、低バイアスDNAポリメラーゼが該少なくとも1つの標的核酸分子の複製物の生成を触媒できる温度が含まれる。例えば、40℃～90℃、50℃～80℃、60℃～70℃、または約68℃の温度を使用してもよい。

該少なくとも1つの標的核酸分子を増幅するステップは、複数ラウンドの複製を含んでいてもよい。例えば、該少なくとも1つの標的核酸分子を増幅するステップは、好ましくは以下i)およびii)、すなわち
i) 該少なくとも1つの標的核酸分子に相補的である少なくとも1つの核酸分子を提供するために、該少なくとも1つの標的核酸分子を複製するラウンド、および
ii) 該少なくとも1つの標的核酸分子の複製物を提供するために、該少なくとも1つの標的核酸分子を複製するラウンド
を含む。

状況に応じて（場合により）、該少なくとも1つの標的核酸分子を増幅するステップは、この少なくとも1つの標的核酸分子を、少なくとも2、少なくとも4、少なくとも6、少なくとも8、または少なくとも10ラウンド複製することを含む。該少なくとも1つの標的核酸分子を複製するこれらのラウンドの一部を、ヌクレオチド類似体の存在下で実施してもよい。状況に応じて、該少なくとも1つの標的核酸分子を増幅するステップは、60℃～80℃の温度での複製を、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、または少なくとも6回含む。

状況に応じて（任意選択的に）、該少なくとも1つの標的核酸分子を増幅するステップを、ポリメラーゼ連鎖反応(PCR)を利用して実行する。PCRは、核酸分子を複製するために複数ラウンドの下記ステップa)～d)、すなわち
a)融解、
b)アニーリング、
c)伸長(extension)、および
d)延長(elongation)
を必要とするプロセスである。

核酸分子(例えば、該少なくとも1つの標的核酸分子)を適切なプライマーおよびポリメラーゼ、例えば本発明の低バイアスDNAポリメラーゼと混合する。融解ステップでは、核酸分子を、二本鎖核酸分子が変性する(2本の鎖に分離する)ように、90℃超の温度まで加熱する。アニーリングステップでは、核酸分子を75℃未満の温度、例えば55℃～70℃、約55℃、または約68℃まで冷却することにより、プライマーが該核酸分子にアニーリングできるようにする。伸長ステップでは、核酸分子を60℃超の温度まで加熱することにより、DNAポリメラーゼがプライマー伸長、鋳型鎖に相補的なヌクレオチドの付加を触媒できるようにする。延長ステップでは、核酸分子を、DNAポリメラーゼが高い活性を示す温度、例えば60℃～70℃の温度まで加熱することにより、新規核酸鎖を完成させるためにさらなる相補的核酸の付加を触媒する。

状況に応じて、本発明の方法は、低バイアスDNAポリメラーゼを使用する複数ラウンドのPCRを含む。

低バイアスDNAポリメラーゼ
本発明の方法は、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを含んでいてもよい。

本発明によれば、「低バイアスDNAポリメラーゼ」は、(a)低変異バイアスを呈する、および／または(b)低鋳型増幅バイアスを呈する、DNAポリメラーゼである。

低変異バイアス
低変異バイアスを呈する低バイアスDNAポリメラーゼは、アデニンおよびチミン、アデニンおよびグアニン、アデニンおよびシトシン、チミンおよびグアニン、チミンおよびシトシン、またはグアニンおよびシトシンを同様の割合で変異させることができるDNAポリメラーゼである。ある実施形態では、低バイアスDNAポリメラーゼはアデニン、チミン、グアニン、およびシトシンを同様の割合で変異させることができる。

状況に応じて、低バイアスDNAポリメラーゼは、アデニンおよびチミン、アデニンおよびグアニン、アデニンおよびシトシン、チミンおよびグアニン、チミンおよびシトシン、またはグアニンおよびシトシンを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で変異させることができる。好ましくは、低バイアスDNAポリメラーゼは、グアニンおよびアデニンを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で変異させることができる。好ましくは、低バイアスDNAポリメラーゼは、チミンおよびシトシンを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で変異させることができる。

かかる実施形態では、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップにおいて、該DNAポリメラーゼは、該少なくとも1つの標的核酸分子中のアデニンおよびチミン、アデニンおよびグアニン、アデニンおよびシトシン、チミンおよびグアニン、チミンおよびシトシン、またはグアニンおよびシトシンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で変異させる。好ましくは、低バイアスDNAポリメラーゼは、該少なくとも1つの標的核酸分子中のグアニンおよびアデニンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で変異させる。好ましくは、低バイアスDNAポリメラーゼは、該少なくとも1つの標的核酸分子中のチミンおよびシトシンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で変異させる。

状況に応じて、低バイアスDNAポリメラーゼは、アデニン、チミン、グアニン、およびシトシンを、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で変異させることができる。好ましくは、低バイアスDNAポリメラーゼは、アデニン、チミン、グアニンおよびシトシンを0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で変異させることができる。

かかる実施形態では、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップにおいて、該DNAポリメラーゼは、該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、およびシトシンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で変異させる場合がある。好ましくは、低バイアスDNAポリメラーゼは、該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、およびシトシンヌクレオチドを0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で変異させる。

アデニン、チミン、シトシン、および／またはグアニンを別のヌクレオチドで置換してもよい。例えば、低バイアスDNAポリメラーゼがアデニンを変異させうる場合、該低バイアスDNAポリメラーゼの存在下で該少なくとも1つの標的核酸分子を増幅することで、該核酸分子中の少なくとも1つのアデニンヌクレオチドをチミン、グアニン、またはシトシンと置換してもよい。同様に、低バイアスDNAポリメラーゼがチミンを変異させうる場合、該低バイアスDNAポリメラーゼの存在下で該少なくとも1つの標的核酸分子を増幅することで、少なくとも1つのチミンヌクレオチドをアデニン、グアニン、またはシトシンと置換してもよい。低バイアスDNAポリメラーゼがグアニンを変異させうる場合、該低バイアスDNAポリメラーゼの存在下で少なくとも1つの標的ヌクレオチドを増幅することで、少なくとも1つのグアニンヌクレオチドをチミン、アデニン、またはシトシンと置換してもよい。低バイアスDNAポリメラーゼがシトシンを変異させうる場合、該低バイアスDNAポリメラーゼの存在下で少なくとも1つの標的ヌクレオチドを増幅することで、少なくとも1つのシトシンヌクレオチドをチミン、グアニン、またはアデニンと置換してもよい。

低バイアスDNAポリメラーゼはヌクレオチドを直接置換できない場合があるが、それでもなお、相補鎖上の対応ヌクレオチドを置き換えることによりそのヌクレオチドを変異させうる場合がある。例えば、標的核酸分子がチミンを含む場合、該少なくとも1つの標的核酸分子に相補的である該少なくとも1つの核酸分子の対応する位置にはアデニンヌクレオチドが存在するであろう。低バイアスDNAポリメラーゼは、該少なくとも1つの標的核酸分子に相補的である該少なくとも1つの核酸分子のアデニンヌクレオチドをグアニンと置き換えることができる場合があり、またそのために、該少なくとも1つの標的核酸分子に相補的である該少なくとも1つの核酸分子が複製されると、これにより、元はチミンが存在した、対応する複製された少なくとも1つの標的核酸分子中にシトシンが存在するようになる(チミンからシトシンへの置換)。

ある実施形態では、低バイアスDNAポリメラーゼは、少なくとも1つの標的核酸中のヌクレオチドの1％～15％、2％～10％、または約8％を変異させる。かかる実施形態では、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを、該少なくとも1つの標的核酸中のヌクレオチドの1％～15％、2％～10％、または約8％が変異するような形で実行する。例えば、使用者が標的核酸分子中のヌクレオチドの約8％を変異させることを望み、かつ低バイアスDNAポリメラーゼが1ラウンドの複製当たりに該ヌクレオチドの約1％を変異させる場合、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップは8ラウンドの複製を含む場合がある。

ある実施形態では、低バイアスDNAポリメラーゼは、1ラウンドの複製当たりに該少なくとも1つの標的核酸分子中のヌクレオチドの0％～3％、0％～2％、0.1％～5％、0.2％～3％、または約1.5％を変異させることができる。ある実施形態では、低バイアスDNAポリメラーゼは、1ラウンドの複製当たりに該少なくとも1つの標的核酸分子中のヌクレオチドの0％～3％、0％～2％、0.1％～5％、0.2％～3％、または約1.5％を変異させる。各ラウンドで生じる実際の変異量は変動する場合があるが、平均すると0％～3％、0％～2％、0.1％～5％、0.2％～3％、または約1.5％になるだろう。

DNAポリメラーゼがヌクレオチドを変異させうるかどうか、またそうであれば、どのくらいの割合か
低バイアスDNAポリメラーゼが1ラウンドの複製当たりに該少なくとも1つの標的核酸分子中のヌクレオチドのある一定の割合を変異させうるかどうかは、一定数の複製ラウンドの間、低バイアスDNAポリメラーゼの存在下で既知配列の核酸分子を増幅することにより判定できる。得られた増幅核酸分子を次に配列決定し、1ラウンドの複製当たりに変異したヌクレオチドの割合を算出することができる。例えば、既知配列の核酸分子は、低バイアスDNAポリメラーゼの存在下で10ラウンドのPCRを利用して増幅することができる。得られた核酸分子は次に配列決定することができる。得られた核酸分子が元の既知配列中の対応ヌクレオチドとは異なるヌクレオチドを10％含む場合、その際使用者は、低バイアスDNAポリメラーゼが1ラウンドの複製当たりに平均して該少なくとも1つの標的核酸分子中のヌクレオチドの1％を変異させることができると理解するであろう。同様に、低バイアスDNAポリメラーゼが所与の方法で該少なくとも1つの標的核酸分子中のヌクレオチドのある一定の割合を変異させるかどうかを調べるために、使用者は、既知配列の核酸分子に対して該方法を実施することができるであろうし、また該方法が終了し次第、変異したヌクレオチドの割合を決定するために配列決定法を利用することができるだろう。

低バイアスDNAポリメラーゼがアデニンなどのヌクレオチドを変異させることができるのは、核酸分子を増幅するために使用した際に、該低バイアスDNAポリメラーゼが、該ヌクレオチドの一部の例が置換されたかまたは欠失した核酸分子を提供する場合である。好ましくは、「変異する(させる)」という用語は置換変異の導入を指し、また幾つかの実施形態では、「変異する(させる)」という用語は「～の置換を導入する」と置き換えることができる。

低バイアスDNAポリメラーゼが本発明の方法において少なくとも1つの標的核酸分子中のアデニンなどのヌクレオチドを変異させるのは、低バイアスDNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅するステップを実行した際に、このステップが変異した少なくとも1つの標的核酸分子(該ヌクレオチドの一部の例が変異している)をもたらす場合である。例えば、低バイアスDNAポリメラーゼが該少なくとも1つの標的核酸分子中のアデニンを変異させる場合、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを実行した際に、このステップは変異した少なくとも1つの標的核酸分子(少なくとも1つのアデニンが置換されているかまたは欠失している)をもたらす。

DNAポリメラーゼがある特定の変異を導入できるかどうかを判定するためには、当業者は既知配列の核酸分子を使用して該DNAポリメラーゼを試験するだけでよい。既知配列を有する適切な核酸分子は、大腸菌(E.coli)MG1655などの、既知配列を有する細菌ゲノムから得た断片である。当業者であれば、低バイアスDNAポリメラーゼの存在下でPCRを利用して、既知配列の核酸分子を増幅することができる。当業者であれば、次に、増幅した核酸分子を配列決定し、さらにその配列が元の既知配列と同じであるかどうかを判定できるだろう。そこまでではないとしても、当業者であれば変異の性質を判定することができる。例えば、当業者が、DNAポリメラーゼがヌクレオチド類似体を使用してアデニンを変異させうるかどうかを判定することを望む場合、当業者はヌクレオチド類似体の存在下でPCRを利用して既知配列の核酸分子を増幅し、得られた増幅核酸分子を配列決定することができる。増幅されたDNAが既知配列中のアデニンヌクレオチドに対応する位置に変異を有する場合、当業者は、DNAポリメラーゼがヌクレオチド類似体を使用してアデニンを変異させうることを理解するであろう。

率比は同様の方法で算出することができる。例えば、当業者が、グアニンおよびシトシンヌクレオチドが変異するその率比を決定することを望む場合、当業者は低バイアスDNAポリメラーゼの存在下でPCRを利用して既知配列を有する核酸分子を増幅することができる。当業者であれば、次に、得られた増幅核酸分子を配列決定し、いかに多くのグアニンヌクレオチドが置換された、または欠失したか、およびいかに多くのシトシンヌクレオチドが置換された、または欠失したかを確認することができる。率比は、置換されたかまたは欠失したグアニンヌクレオチドの数と、置換されたかまたは欠失したシトシンヌクレオチドの数との比である。例えば、16個のグアニンヌクレオチドが置き換えられているかまたは欠失しており、かつ8個のシトシンヌクレオチドが置き換えられているかまたは欠失している場合、グアニンおよびシトシンヌクレオチドはそれぞれ16：8または2：1の率比で変異している。

ヌクレオチド類似体を使用する
低バイアスDNAポリメラーゼはヌクレオチドを他のヌクレオチドと直接置き換えられない場合がある(少なくとも高頻度ではない)が、該低バイアスDNAポリメラーゼはそれでもヌクレオチド類似体を使用すれば核酸分子を変異させうる場合がある。低バイアスDNAポリメラーゼは、ヌクレオチドを他の天然ヌクレオチド(すなわちシトシン、グアニン、アデニンもしくはチミン)またはヌクレオチド類似体と置き換えることができる場合がある。

例えば、低バイアスDNAポリメラーゼは、高忠実度DNAポリメラーゼであってもよい。高忠実度DNAポリメラーゼは、それらが高度に正確であるために、一般的には変異をほとんど導入しない傾向がある。しかし、本発明者らは、一部の高忠実度DNAポリメラーゼは、それらが標的核酸分子にヌクレオチド類似体を導入できる場合があるため、依然として標的核酸分子を変異させうる場合があることを見出した。

ある実施形態では、ヌクレオチド類似体の非存在下で、高忠実度DNAポリメラーゼは1ラウンドの複製当たりに0.01％未満、0.0015％未満、0.001％未満、0％～0.0015％、または0％～0.001％の変異を導入する。

ある実施形態では、低バイアスDNAポリメラーゼは、該少なくとも1つの標的核酸分子にヌクレオチド類似体を組み込むことができる。ある実施形態では、低バイアスDNAポリメラーゼは、該少なくとも1つの標的核酸分子にヌクレオチド類似体を組み込む。ある実施形態では、低バイアスDNAポリメラーゼは、ヌクレオチド類似体を使用してアデニン、チミン、グアニン、および／またはシトシンを変異させることができる。ある実施形態では、低バイアスDNAポリメラーゼは、ヌクレオチド類似体を使用して、該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、および／またはシトシンを変異させる。ある実施形態では、該DNAポリメラーゼは、グアニン、シトシン、アデニンおよび／またはチミンをヌクレオチド類似体と置き換える。ある実施形態では、該DNAポリメラーゼは、グアニン、シトシン、アデニンおよび／またはチミンをヌクレオチド類似体と置き換えることができる。

該少なくとも1つの標的核酸分子へのヌクレオチド類似体の組み込みは、ヌクレオチド類似体が既存のヌクレオチドの代わりに組み込まれる場合があり、またヌクレオチド類似体が対向鎖(opposite strand)中のヌクレオチドと対を形成する場合があることから、ヌクレオチドを変異させるために利用することができる。例えばdPTPを、ピリミジンヌクレオチドの代わりに核酸分子に組み込むことができる(チミンまたはシトシンを置き換える場合がある)(図7を参照されたい)。核酸鎖に組み込まれると、dPTPはイミノ互変異性型である場合にアデニンと対を形成しうる。従って、相補鎖が形成される場合、その相補鎖はdPTPに相補的な位置に存在するアデニンを有する場合がある。同様に、核酸鎖に組み込まれると、dPTPはアミノ互変異性型である場合にグアニンと対を形成しうる。従って、相補鎖が形成される場合、その相補鎖はdPTPに相補的な位置に存在するグアニンを有する場合がある。

例えば、dPTPを本発明の該少なくとも1つの標的核酸分子に導入する場合、少なくとも1つの標的核酸分子に相補的な少なくとも1つの核酸分子が形成されると、この少なくとも1つの標的核酸分子に相補的な該少なくとも1つの核酸分子は、該少なくとも1つの標的核酸分子中のdPTPに相補的な位置にアデニンまたはグアニンを含む(dPTPがそのアミノ型であるかイミノ型であるかに依存する)。該少なくとも1つの標的核酸分子に相補的な該少なくとも1つの核酸分子を複製する場合、得られる該少なくとも1つの標的核酸分子の複製物は、該少なくとも1つの標的核酸分子中のdPTPに対応する位置にチミンまたはシトシンを含む。従って、チミンまたはシトシンへの変異を、変異させる少なくとも1つの標的核酸分子に導入することができる。

あるいは、dPTPを該少なくとも1つの標的核酸分子に相補的な少なくとも1つの核酸分子に導入する場合、該少なくとも1つの標的核酸分子の複製物が形成されると、この少なくとも1つの標的核酸分子の複製物は、該少なくとも1つの標的核酸分子に相補的な該少なくとも1つの核酸分子中のdPTPに相補的な位置にアデニンまたはグアニンを含む(dPTPの互変異性型に依存する)。従って、アデニンまたはグアニンへの変異を、該変異させた少なくとも1つの標的核酸分子に導入することができる。

ある実施形態では、低バイアスDNAポリメラーゼはシトシンまたはチミンをヌクレオチド類似体と置き換えることができる。さらなる実施形態では、低バイアスDNAポリメラーゼは、ヌクレオチド類似体を使用して、グアニンまたはアデニンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で導入する。グアニンまたはアデニンヌクレオチドは、dPTPなどのヌクレオチド類似体と向かい合ってそれらを対にする低バイアスDNAポリメラーゼにより導入してもよい。さらなる実施形態では、低バイアスDNAポリメラーゼは、ヌクレオチド類似体を使用して、グアニンまたはアデニンヌクレオチドをそれぞれ 0.7～1.3：0.7～1.3の率比で導入する。

当業者であれば、従来法を利用して、低バイアスDNAポリメラーゼが該少なくとも1つの標的核酸分子にヌクレオチド類似体を組み込めるかどうか、または従来法を利用しヌクレオチド類似体を使用して該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、および／もしくはシトシンを変異させうるかどうかを判定（決定）することができる。

例えば、低バイアスDNAポリメラーゼが該少なくとも1つの標的核酸分子にヌクレオチド類似体を組み込めるかどうかを判定するためには、当業者であれば、2ラウンドの複製に低バイアスDNAポリメラーゼを使用して核酸分子を増幅することができるだろう。第1ラウンドの複製はヌクレオチド類似体の存在下で行うべきであり、また第2ラウンドの複製はヌクレオチド類似体の非存在下で行うべきである。得られた増幅核酸分子を配列決定することにより、変異が導入されたかどうか、またそうであれば、いかに多くの変異が導入されたかを調べることができる。使用者は、ヌクレオチド類似体を用いずにこの実験を繰り返して、ヌクレオチド類似体の使用時および不使用時に導入された変異の数を比較すべきである。ヌクレオチド類似体を用いて導入した変異の数がヌクレオチド類似体を用いずに導入した変異の数より有意に多い場合、使用者は、低バイアスDNAポリメラーゼはヌクレオチド類似体を組み込むことができると結論付けることができる。同様に、当業者であれば、DNAポリメラーゼがヌクレオチド類似体を組み込むかどうか、またはヌクレオチド類似体を使用してアデニン、チミン、グアニン、および／もしくはシトシンを変異させるかどうかを判定することができる。当業者は、ヌクレオチド類似体の存在下で前記方法を実施し、前記方法が元はアデニン、チミン、グアニン、および／またはシトシンが占めていた位置に変異をもたらすかどうかを調べるだけでよい。

使用者がヌクレオチド類似体を使用して該少なくとも1つの標的核酸分子を変異させることを望む場合、前記方法は低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを含んでいてもよく、その際、この低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップはヌクレオチド類似体の存在下で実行し、また該少なくとも1つの標的核酸分子を増幅するステップによりヌクレオチド類似体を含む少なくとも1つの標的核酸分子を提供する。

適切なヌクレオチド類似体としては、dPTP (2’デオキシ-P-ヌクレオシド-5’-三リン酸)、8-オキソ-dGTP (7,8-ジヒドロ-8-オキソグアニン)、5Br-dUTP (5-ブロモ-2’-デオキシ-ウリジン-5’-三リン酸)、2OH-dATP (2-ヒドロキシ-2’-デオキシアデノシン-5’-三リン酸)、dKTP (9-(2-デオキシ-β-D-リボフラノシル)-N6-メトキシ-2,6,-ジアミノプリン-5’-三リン酸)およびdITP (2’-デオキシイノシン5’-三リン酸)が挙げられる。ヌクレオチド類似体はdPTPであってもよい。ヌクレオチド類似体を使用することにより、表1に記載の置換変異を導入してもよい。

種々のヌクレオチド類似体を単独で、または組み合わせて使用することにより、該少なくとも1つの標的核酸分子に種々の変異を導入することができる。従って、低バイアスDNAポリメラーゼは、ヌクレオチド類似体を使用してグアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を導入してもよい。低バイアスDNAポリメラーゼは、状況に応じてヌクレオチド類似体を使用して、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を導入できる場合がある。

低バイアスDNAポリメラーゼは、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で導入できる場合がある。好ましくは、低バイアスDNAポリメラーゼは、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で導入することができる。低バイアスDNAポリメラーゼが置換変異を導入できるかどうか、およびどんな率比かを判定するための適切な方法は、「DNAポリメラーゼがヌクレオチドを変異させうるかどうか、またそうであれば、どのくらいの割合か」の表題で記載する。

幾つかの方法では、低バイアスDNAポリメラーゼは、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で導入する。好ましくは、低バイアスDNAポリメラーゼは、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で導入する。置換変異が導入されたかどうか、およびどんな率比かを判定するための適切な方法は、「DNAポリメラーゼがヌクレオチドを変異させうるかどうか、またそうであれば、どのくらいの割合か」の表題で記載する。

一般に、低バイアスDNAポリメラーゼがヌクレオチド類似体を使用して変異を導入する場合、これには2ラウンド以上の複製が必要とされる。第1ラウンドの複製で低バイアスDNAポリメラーゼがヌクレオチドの代わりにヌクレオチド類似体を導入し、さらに第2ラウンドの複製で、該ヌクレオチド類似体が天然ヌクレオチドと対を形成することにより相補鎖に置換変異を導入する。第2ラウンドの複製をヌクレオチド類似体の存在下で実行してもよい。しかし、この方法は、ヌクレオチド類似体の非存在下で、ヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するステップをさらに含んでいてもよい。ヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するステップは、低バイアスDNAポリメラーゼを使用して実行してもよい。

状況に応じて、前記方法は変異した少なくとも1つの標的核酸分子を提供し、また該方法は、低バイアスDNAポリメラーゼを使用してこの変異した少なくとも1つの標的核酸分子を増幅するさらなるステップを含む。

低鋳型増幅バイアス
低バイアスDNAポリメラーゼは低鋳型増幅バイアスを有していてもよい。低バイアスDNAポリメラーゼは、該低バイアスDNAポリメラーゼが異なる標的核酸分子を1サイクル当たり同様の成功度合で増幅できるならば、低鋳型増幅バイアスを有する。高バイアスDNAポリメラーゼでは、高G：C含量であるかまたは二次構造の程度が大きい鋳型核酸分子を増幅するのに苦労する場合がある。ある実施形態では、本発明の低バイアスDNAポリメラーゼは、25 000未満、10 000未満、1～15 000、または1～10 000のヌクレオチド長である鋳型核酸分子に対して低鋳型増幅バイアスを有する。

ある実施形態では、DNAポリメラーゼが低鋳型増幅バイアスを有するかどうかを判定するために、当業者であれば、該DNAポリメラーゼを使用して広範な異なる配列を増幅し、得られた増幅DNAを配列決定することによりそれらの異なる配列が異なるレベルで増幅されたかどうかを調べることができる。例えば、当業者であれば、異なる特徴を有する広範な短い(場合によっては50ヌクレオチドの)核酸分子、例えば、高GC含量を示す核酸分子、低GC含量を示す核酸分子、二次構造の程度が大きい核酸分子および二次構造の程度が低い核酸分子を選択することができる。使用者は次に、それらの配列をDNAポリメラーゼを使用して増幅し、該核酸分子の各々が増幅されるそのレベルを定量化することができる。ある実施形態では、該レベルが互いの25％、20％、10％、または5％以内である場合、その際のDNAポリメラーゼは低鋳型増幅バイアスを有する。

あるいは、ある実施形態では、DNAポリメラーゼは、該DNAポリメラーゼが7～10 kbpの断片を増幅できるならば低鋳型増幅バイアスを有する(コルモゴロフ・スミルノフのD＝0.1未満、0.09未満、または0.08未満)。特定の低バイアスDNAポリメラーゼが7～10 kbpの断片を増幅できるコルモゴロフ・スミルノフのDは、実施例４に記載するアッセイを利用して決定してもよい。

低バイアスDNAポリメラーゼは高忠実度DNAポリメラーゼであってもよい。高忠実度DNAポリメラーゼは、高度に誤りやすい(error-prone)ものではなく、またそのためヌクレオチド類似体の非存在下で標的核酸分子を増幅するために使用した場合、通常は多数の変異を導入しないDNAポリメラーゼである。高忠実度DNAポリメラーゼが変異を導入するための方法に通常使用されないのは、誤りやすいDNAポリメラーゼがより有効だと一般に考えられているからである。しかし、本出願は、特定の高忠実度ポリメラーゼがヌクレオチド類似体を使用して変異を導入できること、およびそれらの変異はDNATaqポリメラーゼなどの誤りやすいポリメラーゼと比較してより低いバイアスで導入される場合があることを実証するものである。

高忠実度DNAポリメラーゼは追加の利点を有する。高忠実度DNAポリメラーゼを使用することにより、ヌクレオチド類似体と共に使用した場合に変異を導入することができるが、ヌクレオチド類似体の非存在下では、高忠実度DNAポリメラーゼは標的核酸分子を非常に正確に複製することができる。これは、使用者が、該少なくとも1つの標的核酸分子を非常に効果的に変異させてから、この変異した少なくとも1つの標的核酸分子を同じDNAポリメラーゼを使用して高い精度で増幅できることを意味している。低忠実度DNAポリメラーゼを使用することにより標的核酸分子を変異させる場合、標的核酸分子を増幅する前に該低忠実度DNAポリメラーゼを反応混合物から除去する必要があるかもしれない。

高忠実度DNAポリメラーゼは校正活性を有していてもよい。校正（proof-reading）活性は、DNAポリメラーゼが標的核酸配列を高い精度で増幅するのに役立つ場合がある。例えば、低バイアスDNAポリメラーゼは校正ドメインを含んでいてもよい。校正ドメインにより、該ポリメラーゼにより付加されたヌクレオチドが正しいかどうかを確認してもよく(該ヌクレオチドが相補鎖の対応核酸と正確に対を形成することを確かめる)、また正しくなければ、該ヌクレオチドを核酸分子から削除する。本発明者らは、驚いたことに、一部のDNAポリメラーゼでは、校正ドメインが天然ヌクレオチドとヌクレオチド類似体との対形成を容認することを見出した。適切な校正ドメインの構造および配列は当業者に公知である。校正ドメインを含むDNAポリメラーゼとしては、DNAポリメラーゼファミリーI、IIおよびIIIのメンバー、例えば、Pfuポリメラーゼ(パイロコッカス・フリオサス(Pyrococcus furiosus)由来)、T4ポリメラーゼ(バクテリオファージT4由来)および以下により詳細に記載するサーモコッカス目古細菌(Thermococcal)のポリメラーゼが挙げられる。

加えて、低バイアスDNAポリメラーゼは、プロセッシビティ増強ドメイン（処理能力増強ドメイン）を含んでいてもよい。プロセッシビティ増強ドメインにより、DNAポリメラーゼは標的核酸分子をより迅速に増幅できるようになる。このことは、本発明の方法をより迅速に実施できるようになるため、有利である。

サーモコッカス目古細菌のポリメラーゼ
ある実施形態では、低バイアスDNAポリメラーゼは、配列番号2、配列番号4、配列番号6または配列番号7を含むポリペプチドの断片または変異体である。配列番号2、4、6および7のポリペプチドはサーモコッカス目古細菌のポリメラーゼである。配列番号2、配列番号4、配列番号6または配列番号7のポリメラーゼは高い忠実度を示す低バイアスDNAポリメラーゼであり、またそれらはdPTPなどのヌクレオチド類似体を組み込むことにより標的核酸分子を変異させることができる。配列番号2、配列番号4、配列番号6または配列番号7のポリメラーゼは、それらが低変異バイアスおよび低鋳型増幅バイアスを有しているため、特に有利である。それらはまた高度にプロセッシブであって、かつ校正ドメインを含む高忠実度ポリメラーゼであり、このことは、ヌクレオチド類似体の非存在下で、それらが変異標的核酸分子を迅速かつ正確に増幅できることを意味している。

低バイアスDNAポリメラーゼは、以下a.～h.、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列
の少なくとも400、少なくとも500、少なくとも600、少なくとも700、または少なくとも750個の連続したアミノ酸の断片を含んでいてもよい。

好ましくは、低バイアスDNAポリメラーゼは、以下a～h、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも98％、もしくは少なくとも99％同一である配列
の少なくとも700個の連続したアミノ酸の断片を含む。

低バイアスDNAポリメラーゼは、以下a.～h.、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列
を含んでいてもよい。

好ましくは、低バイアスDNAポリメラーゼは、以下a.～h.、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも98％、もしくは少なくとも99％同一である配列
を含む。

低バイアスDNAポリメラーゼは、サーモコッカス目古細菌のポリメラーゼ、またはその誘導体であってもよい。配列番号2、4、6および7のDNAポリメラーゼはサーモコッカス目古細菌のポリメラーゼである。サーモコッカス目古細菌のポリメラーゼは、それらが一般に、低変異および鋳型増幅バイアスにて、ヌクレオチド類似体を使用して変異を導入するためにできる高忠実度ポリメラーゼであることから、有利である。

サーモコッカス目古細菌のポリメラーゼは、サーモコッカス属の菌株から単離されたポリメラーゼのポリペプチド配列を有するポリメラーゼである。サーモコッカス目古細菌のポリメラーゼの誘導体は、サーモコッカス目古細菌のポリメラーゼの少なくとも400、少なくとも500、少なくとも600、少なくとも700、もしくは少なくとも750個の連続したアミノ酸の断片であってもよいし、またはサーモコッカス目古細菌のポリメラーゼの少なくとも400、少なくとも500、少なくとも600、少なくとも700、もしくは少なくとも750個の連続したアミノ酸の断片と少なくとも95％、少なくとも98％、少なくとも99％、もしくは100％同一であってもよい。サーモコッカス目古細菌のポリメラーゼの誘導体は、サーモコッカス目古細菌のポリメラーゼと少なくとも95％、少なくとも98％、少なくとも99％、または100％同一であってもよい。サーモコッカス目古細菌のポリメラーゼの誘導体は、サーモコッカス目古細菌のポリメラーゼと少なくとも98％同一であってもよい。

どの菌株由来のサーモコッカス目古細菌のポリメラーゼも、本発明に関しては有効でありうる。ある実施形態では、サーモコッカス目古細菌のポリメラーゼは、T.コダカレンシス(T. kodakarensis)、T.セレル(T. celer)、T.シクリ(T. siculi)、およびT.エスピー(T. sp) KS-1からなる群より選択したサーモコッカス目の菌株に由来する。これらの菌株から得たサーモコッカス目古細菌のポリメラーゼを、配列番号2、配列番号4、配列番号6および配列番号7として記載する。

状況に応じて、低バイアスDNAポリメラーゼは、50℃～90℃、60℃～80℃、または約68℃の温度で高い触媒活性を示すポリメラーゼである。

バーコード、サンプルタグおよびアダプター
前記方法は、標的核酸分子にバーコードを導入することをさらに含んでいてもよい。本発明の目的上、バーコードは縮重した、またはランダムに生成されたヌクレオチド配列である。「バーコード」という用語は、「固有の分子識別子」(UMI)または「固有の分子タグ」(UMT)という用語と同義である。前記方法は、標的核酸分子に1、2またはそれ以上のバーコードを導入することを含んでいてもよい。好適な実施形態では、前記方法は標的核酸分子に様々なバーコードを導入することを含み、その結果、該バーコードが導入された後は、元の標的核酸分子の大部分が他の元の標的核酸分子と比較して固有のバーコードを含む。

標的核酸分子へのバーコードの導入は、本発明の変異を導入するための方法を配列を決定するための方法の一環として利用する場合、有用でありうる。バーコードの使用は、該元の少なくとも1つの標的核酸分子のいずれから、少なくとも1つの標的核酸分子(または増幅もしくは断片化した少なくとも1つの標的核酸分子)の各配列が由来するかを、使用者が同定するのに役立ち得る。元の標的核酸分子各々に使用するバーコードが異なる場合、使用者は該バーコードまたは該標的核酸分子を配列決定することが可能であり、また同一バーコードを含む標的核酸分子の配列は、同一の元の標的核酸分子から生じた標的核酸分子の配列である可能性が高い。

少なくとも1つの標的核酸分子に変異を導入するための方法は、標的核酸分子にサンプルタグを導入することを含んでいてもよい。サンプルタグは、既知(特定)配列を有する一連の短い核酸である。例えば、本発明の方法を、異なるサンプルから採取した複数の標的核酸分子に対して実施してもよい。それらのサンプルをプールしてもよいが、プール作製の前に、サンプルタグをサンプル中の標的核酸分子に導入してもよい(標的核酸分子をサンプルタグで標識する)。異なるサンプルから得た標的核酸分子を異なるサンプルタグで標識してもよい。状況に応じて、同一サンプルから得た標的核酸分子を、同一サンプルタグ、または同一のサンプルタグ部分群から得たサンプルタグで標識する。例えば、使用者が2つのサンプルを使用すると決めた場合、第1サンプル中の標的核酸分子を特定配列を有する第1サンプルタグで標識してもよく、また第2サンプル中の標的核酸分子を第2特定配列を有する第2サンプルタグでタグ付けしてもよい。同様に、使用者が2つのサンプルを使用すると決めた場合、第1サンプル中の標的核酸分子をサンプルタグの第1部分群から得たサンプルタグで標識してもよく、かつ第2サンプル中の標的核酸分子をサンプルタグの第2部分群から得たサンプルタグで標識してもよい。使用者は、第1サンプルタグまたはサンプルタグの第1部分群から得たサンプルタグを含むあらゆる標的核酸分子が第1サンプルから生じ、また第2サンプルタグまたはサンプルタグの第2部分群から得たサンプルタグを含むあらゆる標的核酸分子が第2サンプルから生じたことを理解するだろう。どのタグが標的核酸配列を標識するために使用されたのかは、該標的核酸配列を配列決定することにより判定できる。適切な配列決定方法を以下により詳細に記載する。

ある実施形態では、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップの前に、サンプルタグを導入する(標的核酸分子をサンプルタグで標識する)。これは、前記方法の初期段階でサンプルをプールし、処理時間、必要な試薬の数およびサンプル処理時のミスをもたらす可能性を低減しうることを意味するため、有利である。しかし、低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップの前にサンプルタグを導入する場合、該サンプルタグが低バイアスDNAポリメラーゼにより変異する可能性がある。本発明者らは、サンプルタグが変異したとしてもそれらを互いに区別しうるように設計されたサンプルタグ群を設計した。

ある実施形態では、サンプルタグ群を使用し、異なるサンプルからの標的核酸分子を該群からの異なるサンプルタグで標識する。同一サンプルから得た標的核酸分子を、サンプルタグ群からの同一サンプルタグで、またはサンプルタグ群からのサンプルタグの同一部分群からのサンプルタグで標識してもよい。例えば、サンプルタグ群がA、B、CおよびDと名付けたサンプルタグを含む場合、第1サンプル中の全標的核酸分子をAまたはA／Bを使用して標識してもよく、また第2サンプル中の全標的核酸分子をCまたはC／Dを使用して標識してもよい。サンプルタグ群の各サンプルタグは、該群の実質的に全ての他のサンプルタグと、少なくとも1の低確率変異差により異なっていてもよい。サンプルタグ群の各サンプルタグは、該群の全ての他のサンプルタグと、少なくとも1の低確率変異差により異なっていてもよい。

ある態様では、本発明はサンプルタグ群を提供し、ここで該群の各サンプルタグは、該群の実質的に全ての他のサンプルタグと、少なくとも1の低確率変異差により異なっているものとする。各サンプルタグは、該群の全ての他のサンプルタグと、少なくとも1の低確率変異差により異なっていてもよい。

「群の実質的に全ての他のサンプルタグと少なくとも1の低確率変異差により異なる」という用語により、本発明者らは、サンプルタグが少なくとも1の低確率変異により変異している場合に、該タグが依然として互いに殆ど(実質的に全て、または全ての他のタグと)異なるように、各タグが設計されていることを意味する。ある実施形態では、「実質的に全ての他のサンプルタグ」という用語は、他のサンプルタグの少なくとも90％、少なくとも95％、または少なくとも98％を指す。低確率変異は、本発明の変異を導入するための方法においてまれに生じる変異である。例えば、低確率変異は、トランスバージョン変異、またはインデル変異であってもよい。トランスバージョン変異およびインデル変異は、本発明の変異を導入するための方法を、ヌクレオチド類似体としてdPTPを使用して実施した場合にまれに生じる。トランスバージョン変異は、プリンヌクレオチドのピリミジンヌクレオチドとの置き換え(アデニンからシトシン、アデニンからチミン、グアニンからシトシンもしくはグアニンからチミン)、またはピリミジンヌクレオチドのプリンヌクレオチドとの置き換え(シトシンからアデニン、シトシンからグアニン、チミンからアデニン、もしくはチミンからグアニン)である。インデル変異は欠失変異または挿入変異である。適切なタグを、統計的手法を用いてコンピュータにより設計してもよい。例えば、当業者であれば、どのタイプの変異が本発明の変異を導入するための方法における低確率変異であるかを判定できるであろう。当業者であれば、本発明の変異を導入するための方法を実施し、核酸分子産物を配列決定することにより導入された変異のタイプを判定することができる。最も頻繁に生じる変異は高確率変異であり、また最も低い頻度で生じる変異は低確率変異である。

使用者は、本発明のサンプルタグ群を設計するための方法を利用して適切なサンプルタグを作成することができる。

状況に応じて、各サンプルタグは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、3～50、3～25、または3～10の低確率変異差によりサンプルタグ群の実質的に全ての他のサンプルタグと異なる。状況に応じて、各サンプルタグは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、3～50、3～25、または3～10の低確率変異差によりサンプルタグ群の全ての他のサンプルタグと異なる。

各サンプルタグは、少なくとも2の高確率変異差によりサンプルタグ群の実質的に全ての他のサンプルタグと異なっていてもよい。高確率変異差は、本発明の変異を導入するための方法において頻繁に生じる変異である。例えば、高確率変異差はトランジション変異であってもよい。トランジション変異は、プリンヌクレオチドの、別のプリンヌクレオチドとの置き換え(アデニンからグアニンもしくはグアニンからアデニン)、またはピリミジンヌクレオチドの、別のピリミジンヌクレオチドとの置き換え(シトシンからチミンもしくはチミンからシトシン)である。

各サンプルタグは、少なくとも2の高確率変異差によりサンプルタグ群の全ての他のサンプルタグと異なっていてもよく、すなわち、各サンプルタグは、該サンプルタグが少なくとも2の高確率変異により変異しても、該タグが依然として互いに異なるように設計されている。

状況に応じて、各サンプルタグは、少なくとも3、2～50、3～25、または3～10の高確率変異差によりサンプルタグ群の実質的に全ての他のサンプルタグと異なる。状況に応じて、各サンプルタグは、少なくとも3、2～50、5～25、または5～10の高確率変異差によりサンプルタグ群の全ての他のサンプルタグと異なる。

ある実施形態では、各サンプルタグは、少なくとも8ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも12ヌクレオチド長、8～50ヌクレオチド長、10～50ヌクレオチド長、または10～50ヌクレオチド長である。

適切なサンプルタグは配列番号8～136のものである。

前記方法は、標的核酸分子の各々にアダプターを導入することをさらに含んでいてもよい。アダプターはプライマー結合部位を含んでいてもよい。本発明の目的上、プライマー結合部位は、プライマーが特異的にハイブリダイズするのに十分長いヌクレオチドの既知配列である。状況に応じて、プライマー結合部位は少なくとも8、少なくとも10、少なくとも12、8～50、または10～25ヌクレオチド長である。

前記方法は、該少なくとも1つの標的核酸分子の3’末端に第1アダプターを導入し、かつ該少なくとも1つの標的核酸分子の5’末端に第2アダプターを導入することを含んでもよく、ここで該第1アダプターと該第2アダプターは互いにアニーリングできるものとする。

ある態様では、本発明は、以下a.～c.、すなわち
a.標的核酸分子を含む少なくとも1つのサンプルを用意すること、
b.標的核酸分子の3’末端に第1アダプターを、かつ標的核酸分子の5’末端に第2アダプターを導入すること、および
c.第1アダプターの一部に相補的であるプライマーを使用して標的核酸分子を増幅すること、
ここで第1アダプターと第2アダプターは互いにアニーリングできるものとする、
を含む、1 kbp長より大きい核酸分子を選択的に増幅するための方法を提供する。

第2アダプターは第1プライマー結合部位に相補的である部分を含んでいてもよく、また第1アダプターは第1プライマー結合部位を含んでいてもよい。

本発明者らは、互いにアニーリングできる第1アダプターおよび第2アダプターを該少なくとも1つの標的核酸分子に導入することにより、本発明の方法が長い標的核酸分子を選択的に増幅する、および／または変異させることをそれらが保証できることを見出した。第1アダプターが第2アダプターにアニーリングできる場合、その際それらは本発明の方法においてそうすることで(図5に示すように)自己アニーリングした少なくとも1つの標的核酸分子を生じる場合がある。自己アニーリングした標的核酸分子は複製されないため、本発明の方法により増幅されず、および／または変異しない。第1アダプターと第2アダプターが本発明の方法の最中に互いにアニーリングする見込み（可能性）は、より長い標的核酸分子に対してよりも、より短い核酸分子に対しての方が高い。これらの理由から、本発明の該少なくとも1つの標的核酸分子への第1アダプターおよび第2アダプターの付加は、より大きな少なくとも1つの標的核酸分子を選択的に増幅するために利用することができる。

核酸分子を選択的に増幅するための方法は、1.5 kbpより長い標的核酸分子を選択的に増幅するための方法であり得る。該方法は、標的核酸分子を配列決定するステップをさらに含んでいてもよい。考えられる配列決定方法の具体例としては、マキシマム・ギルバート法、サンガー法、ナノポアシーケンシングまたはブリッジPCRを含む配列決定法が挙げられる。典型的な実施形態では、配列決定ステップはブリッジPCRを伴う。状況に応じて、ブリッジPCRステップは、5秒超、10秒超、15秒超または20秒超の伸長時間を利用して実行する。ブリッジPCRの利用の一例は、Illumina Genome Analyzer Sequencersである。

使用者は、第1アダプターと第2アダプターが互いにアニーリングできるかどうかを判定することが可能である。ある実施形態では、使用者は、第1アダプターと第2アダプターが互いにアニーリングできるかどうかを、第1アダプターを含む核酸分子を用意し、さらに第2アダプターを含むプライマーがPCR条件下で該核酸分子の複製を開始できるかどうかを調べることにより確認してもよい。

あるいは、ある実施形態では、第1アダプターおよび第2アダプターを、それらが次の条件下：等モル濃度の2つのプライマーを混合し(例えば50μM)、次いで95℃などの高温で5分間インキュベートすることにより該プライマーが一本鎖であることを保証する、でハイブリダイズする場合に、互いにアニーリングできると見なすことができる。この溶液を次に、約45分間かけて室温(25℃)まで徐冷する。

前記方法は、互いに同一であるか、または互いに実質的に同一であるプライマーを使用して標的核酸分子を増幅することを含んでいてもよい。該プライマーは、第1アダプターの一部に相補的であってもよい。2つのプライマーは、それらが同一の配列、または1、2もしくは3個のヌクレオチドが異なる配列を有している場合に、互いに「実質的に同一」である。好適な実施形態では、本発明の方法は、配列が同一であるかまたは単一ヌクレオチドの違いにより異なるプライマーを使用して標的核酸分子を増幅することを含む。

ある実施形態では、第1アダプターおよび第2アダプターは、互いに相補的であるかまたは互いに実質的に相補的である配列を含む。第1アダプターは、該第1アダプターが第2アダプターと少なくとも80％、少なくとも90％、少なくとも95％、または少なくとも99％同一である核酸分子に相補的である場合、該第2アダプターに実質的に相補的でありうる。

使用者はプライマー結合部位を含むプライマーを使用してもよく、またこれらのプライマーを使用することにより、最終ラウンドの複製で生成した該少なくとも1つの標的核酸分子の複製物を選択的に増幅してもよい。例えば、第3プライマー結合部位を含む第1セットのプライマーを1ラウンドの複製に使用してもよい。複製のさらなるラウンドにおいて、該第3プライマー結合部位に結合する第2セットのプライマーを使用してもよい。第2セットのプライマーは、第1セットのプライマーを使用して、先のラウンドの複製で生成した該少なくとも1つの標的核酸分子の複製物を複製するのみである。

第3およびさらなるセットのプライマーを使用してもよい。先のラウンドの複製の複製物を選択的に複製することは、各増幅標的核酸分子が高レベルの変異を含むことを保証できる(低バイアスDNAポリメラーゼにより少なくとも1回の増幅を受けた少なくとも1つの標的核酸分子のみが複製されるため)ので、有利である。

従って、本発明の方法は、以下(a)～(c)、すなわち
(a) 該少なくとも1つの標的核酸分子または複数の標的核酸分子の3’末端に第1プライマー結合部位を含む第1アダプターを導入し、かつ該少なくとも1つの標的核酸分子または複数の標的核酸分子の5’末端に該第1プライマー結合部位に相補的である部分を含む第2アダプターを導入すること、ここで該第1アダプターと該第2アダプターは互いにアニーリングできるものとする、
(b)第1プライマー結合部位に相補的でありかつ第2プライマー結合部位を含む第1セットのプライマーを使用し、状況に応じて低バイアスDNAポリメラーゼを使用して、標的核酸分子を増幅すること、および
(c)第2プライマー結合部位に相補的である第2セットのプライマーを使用し、状況に応じて低バイアスDNAポリメラーゼを使用して、標的核酸分子を増幅すること
を含んでいてもよい。

第2セットのプライマーは第3プライマー結合部位を含んでいてもよく、またさらなる増幅ステップは、第3またはさらなるプライマー結合部位に相補的である第3またはさらなるセットのプライマーを使用して実行してもよい。

バーコード、サンプルタグおよび／またはアダプターは、任意の適切な方法、例えば、標的核酸のPCR、タグメンテーションおよび物理的剪断または制限消化を、その後のアダプターライゲーション(付着末端ライゲーションであってもよい)と組み合わせて利用して導入してもよい。例えば、PCRは、該少なくとも1つの標的核酸分子にハイブリダイズできる第1セットのプライマーを使用し、少なくとも1つの標的鋳型核酸分子に対して実行することができる。バーコード、サンプルタグおよびアダプターは、PCRにより、バーコード、サンプルタグおよび／またはアダプターを含む部分(5’末端部分)、ならびに該少なくとも1つの標的核酸分子にハイブリダイズできる(相補的であってもよい)配列を有する部分(3’末端部分)を含むプライマーを使用して、該少なくとも1つの標的核酸分子の各々に導入してもよい。かかるプライマーは標的核酸分子にハイブリダイズし、次いでPCRプライマー伸長により、バーコード、サンプルタグおよび／またはアダプターを含む核酸分子が提供される。これらのプライマーを用いるPCRのさらなるサイクルを利用することで、バーコード、サンプルタグおよび／またはアダプターを、該少なくとも1つの標的核酸分子の他方の末端に付加することができる。プライマーは縮重していてもよい、すなわち、該プライマーの3’末端部分は互いに類似しているが同一ではない場合がある。

バーコード、サンプルタグおよび／またはアダプターは、タグメンテーションを利用して導入してもよい。バーコード、サンプルタグおよび／またはアダプターは、直接的なタグメンテーションを利用して、またはタグメンテーションによる規定配列の導入と、それに続く、該規定配列にハイブリダイズできる部分ならびにバーコード、サンプルタグおよび／またはアダプターを含む部分を含むプライマーを利用した2サイクルのPCRにより、導入することができる。バーコード、サンプルタグおよび／またはアダプターは、該元の少なくとも1つの標的核酸分子の制限消化と、それに続くバーコード、サンプルタグおよび／またはアダプターを含む核酸のライゲーションにより導入することができる。該元の少なくとも1つの核酸分子の制限消化は、消化により配列決定する領域を含む核酸分子(少なくとも1つの標的鋳型核酸分子)が生じるように実施すべきである。バーコード、サンプルタグおよび／またはアダプターは、該少なくとも1つの標的核酸分子の剪断と、それに続く末端修復、A-テーリングならびにその後のバーコード、サンプルタグおよび／またはアダプターを含む核酸のライゲーションにより導入してもよい。

少なくとも1つの標的核酸分子の配列を決定するための方法
本発明の一態様は、本発明の変異を導入するための方法を含む、少なくとも1つの標的核酸分子の配列を決定するための方法に関する。

上記の通り、本発明の変異を導入するための方法は、該変異により当業者が配列を組み立てることが可能となりうるため、少なくとも1つの標的核酸分子の配列を決定するための方法の一環として有用でありうる。

背景技術の項目に記載した通り、配列決定方法は、配列決定すべき少なくとも1つの標的核酸分子に変異を導入するステップを組み込むことにより改善できる。使用者は、少なくとも1つの標的核酸分子を配列決定する前に該標的核酸分子を増幅および／または断片化することが多い。使用者は次に、標的核酸分子の少なくとも1つに対するコンセンサス配列を、増幅または断片化された少なくとも1つの標的核酸分子の領域の配列から組み立てる。増幅または断片化の前に少なくとも1つの標的核酸分子に変異を導入することは、元の少なくとも1つの鋳型核酸分子のうちのどれに増幅または断片化された少なくとも1つの標的核酸分子の領域の各配列が由来するかを使用者が同定するのに役立ち、またそのため、コンセンサス配列の精度を改善するのに役立つ可能性がある。

導入される変異がよりランダムであるほど、該元の少なくとも1つの標的核酸分子のうちのどれに増幅または断片化された少なくとも1つの標的核酸分子の各配列が由来するかを同定することが容易になる。本発明の変異を導入する方法は、低バイアスDNAポリメラーゼを使用するものであり、該方法を利用することで実質的にランダムな形で変異を導入できるため、少なくとも1つの標的核酸分子の配列を決定するための方法に含めるには理想的である。

少なくとも1つの標的核酸分子の配列を決定するための方法は、以下のステップa.～c.、すなわち
a.本発明の少なくとも1つの標的核酸分子に変異を導入するための方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b.少なくとも1つの変異した標的核酸分子の領域を配列決定することにより、変異した配列リードを用意するステップ、および
c.変異した配列リードを使用して、少なくとも1つの標的核酸分子の少なくとも一部に対して配列を組み立てるステップ
を含んでもよい。

一般に、配列決定ステップは、任意の配列決定方法を利用して実行することができる。考えられる配列決定方法の具体例としては、マキシマム・ギルバート法、サンガー法、ナノポアシーケンシング、またはブリッジPCRを含む配列決定法が挙げられる。典型的な実施形態では、配列決定ステップはブリッジPCRを伴う。状況に応じて、ブリッジPCRステップは、5秒超、10秒超、15秒超または20秒超の伸長時間を用いて実行する。ブリッジPCRの使用の一例は、Illumina Genome Analyzer Sequencersである。

前記方法は、少なくとも1つの変異した標的核酸分子の領域を配列決定することにより、変異した配列リードを用意することを含んでいてもよい。該領域は、少なくとも1つの変異した標的核酸分子の実質的な部分を含みうる断片に相当する場合がある。少なくとも1つの変異した標的核酸分子の全部を何らかの理由で配列決定することができないが、使用者はそれでも、該少なくとも1つの変異した標的核酸分子の一部の配列が有用であることを見出すこともあり得る。該少なくとも1つの変異した標的核酸分子の領域は、該少なくとも1つの変異した標的核酸分子の全長を含んでいてもよい。

前記方法は、変異した配列リードから少なくとも1つの標的核酸分子の少なくとも一部に対して配列を組み立てることを含んでいてもよい。該配列は、変異した配列リードを整列させて、同じ変異パターンを共有するリードをひとまとめにすることにより組み立ててもよい。配列は同一グループ内の変異した配列リードから組み立てられる。組み立ては、Clustal W2、IDBA-UDまたはSOAPdenovoなどのソフトウェアを利用して実行してもよい。

少なくとも1つの標的核酸分子の配列を決定するための方法は、以下のステップa.～d.、すなわち
a.本発明の少なくとも1つの標的核酸分子に変異を導入するための方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b.該少なくとも1つの変異した標的核酸分子を断片化および／または増幅することにより、少なくとも1つの断片化および／または増幅された変異標的核酸分子を用意するステップ、
c. 該少なくとも1つの断片化および／または増幅された変異標的核酸分子の領域を配列決定することにより、変異した配列リードを用意するステップ、ならびに
d.変異した配列リードを使用して、該少なくとも1つの標的核酸分子の少なくとも一部に対して配列を組み立てるステップ
を含んでいてもよい。

該少なくとも1つの変異した標的核酸分子を増幅するステップは、PCRなどの任意の適切な増幅技術により実施することができる。適宜、「低バイアスDNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅する」という表題で記載したものなどの条件下で低バイアスDNAポリメラーゼを使用して、PCRを実行する。

該少なくとも1つの変異した標的核酸分子を断片化するステップは、任意の適当な方法を利用して実行することができる。例えば、断片化は、制限消化を利用して、または少なくとも1つの変異した標的核酸分子の少なくとも1つの内部領域に相補的なプライマーを用いるPCRを利用して、実行することができる。好ましくは、断片化は、任意断片を生じる技術を利用して実行する。「任意断片」という用語は、ランダムに作成した断片、例えばタグメンテーションにより作成した断片を指す。制限酵素を使用して作成した断片は、使用する制限酵素によって定義される特定のDNA配列で制限消化が起こるため、「任意」ではない。さらにより好ましくは、断片化をタグメンテーションにより実行する。断片化をタグメンテーションにより実行する場合、タグメンテーション反応により、状況に応じて、該少なくとも1つの変異した標的核酸分子にアダプター領域が導入される。このアダプター領域は、例えば、該少なくとも1つの変異した標的核酸分子をIllumina技術を利用して配列決定できるようにするアダプターをコードしていてもよい、短いDNA配列である。

断片化ステップは、該少なくとも1つの変異した断片化標的核酸分子を富化するさらなるステップを含んでいてもよい。該少なくとも1つの変異した断片化標的核酸分子を富化するステップは、PCRにより実行してもよい。適宜、「低バイアスDNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅する」という表題で記載したものなどの条件下で低バイアスDNAポリメラーゼを使用して、PCRを実行する。

タンパク質を操作するための方法
本発明の変異を導入するための方法は、タンパク質を操作するための方法の一環として有用でありうる。例えば、タンパク質操作は、タンパク質の活性を増大もしくは低下させる変異、またはその構造を変更する変異を探索することを伴う場合がある。タンパク質操作の一環として、使用者は、タンパク質をランダムに変異させて、該変異が該タンパク質の活性または構造にどのように影響を与えるかを調べることを望む場合がある。本発明の方法は、非常にランダムな突然変異誘発をもたらし、またそのために、タンパク質を操作するための方法の一環として有利に使用できる方法である。

従って、本発明の一態様では、本発明の変異を導入するための方法を含む、タンパク質を操作するための方法が提供される。

前記方法は、以下のステップa.～c.、すなわち
a.本発明の変異を導入するための方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b. 該少なくとも1つの変異した標的核酸分子をベクターに挿入するステップ、および
c. 該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップ
を含んでいてもよい。

前記方法は、以下のステップa.～e.、すなわち
a.本発明の変異を導入するための方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b.ヌクレオチド類似体の存在下で低バイアスDNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅することにより、ヌクレオチド類似体を含む標的核酸分子を用意するステップ、
c.ヌクレオチド類似体の非存在下でヌクレオチド類似体を含む標的核酸分子を増幅することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
d. 該少なくとも1つの変異した標的核酸分子をベクターに挿入するステップ、および
e. 該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップ
を含んでいてもよい。

任意の適切なベクターを使用することができる。状況に応じて、ベクターはプラスミド、ウイルス、コスミドまたは人工染色体である。典型的には、ベクターは、挿入した配列に動作可能に連結されている制御配列をさらに含み、結果としてポリペプチドの発現が可能となる。好ましくは、本発明のベクターは、ポリペプチドの発現を可能にするために、適当なイニシエーター、プロモーター、エンハンサーおよび必要とされる場合がありかつ正しい向きに配置された他のエレメントをさらに含む。

状況に応じて、該少なくとも1つの変異した標的核酸分子を発現させるステップを、ベクターを用いて細菌細胞を形質転換するか、真核細胞をトランスフェクトするかまたは真核細胞に形質導入することにより達成する。状況に応じて、細菌細胞は大腸菌(E.coli)細胞である。

例えば、該少なくとも1つの変異した標的核酸分子を発現させるステップは、該少なくとも1つの変異した標的核酸分子をプラスミドベクターに挿入し、かつ該プラスミドで大腸菌を形質転換することを含んでいてもよい。プラスミドは、大腸菌で発現させるのに適した制御エレメント、例えばlacまたはT7プロモーター(Dubendorff JW, Studier FW (1991). "Controlling basal expression in an inducible T7 expression system by blocking the target T7 promoter with lac repressor". Journal of Molecular Biology. 219 (1)：45-59.))を含んでいてもよい。適切な発現技術はSambrook, J.ら, (1989) Molecular Cloning：A Laboratory Manual Second Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New Yorkに記載されている。

あるいは、該少なくとも1つの変異した標的核酸分子を発現させるステップは、in vitro法を利用して標的核酸分子を増幅するステップで直接生成した断片を発現させることを含んでいてもよい。

前記方法は、該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質の活性を試験するステップまたは該タンパク質の構造を評価するステップをさらに含んでいてもよい。

少なくとも1つの変異した標的核酸分子によりコードされるタンパク質の活性を試験するステップまたは該タンパク質の構造を評価するステップは、あらゆる周知技術を利用して実行しうる。例えば、当業者であれば、タンパク質の構造を評価するための適切な技術、例えば、核磁気共鳴(NMR)技術、低温電子顕微鏡法などの顕微鏡検査技術、小角X線散乱技術、またはX線結晶構造解析を認識しているだろう。

同様に、当業者であれば、タンパク質の活性を評価するために使用できる技術を認識しているだろう。使用する方法は、該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質によって異なる。例えば、該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質が血液凝固因子である場合、当業者であれば、例えば発色凝固アッセイ(chromogenic clotting assay)を利用し、凝固活性について該タンパク質を試験するだろう。あるいは、少なくとも1つの変異した標的核酸分子によりコードされるタンパク質が酵素である場合、当業者であれば、該酵素がその反応を触媒する速度を測定することにより、例えば、該酵素により触媒される反応の開始物質の濃度の低下または最終生成物の濃度の増大を測定することにより、該酵素の活性を試験することができる。

サンプルタグ群を設計するための方法
ある態様では、本発明は、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子に変異を導入するための方法を解析し、かつこの少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数を決定すること、および
b.少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数より多い低確率変異差により各サンプルタグがサンプルタグ群の実質的に全てのサンプルタグと異なっている該群について、配列を決定すること
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法における使用に適したサンプルタグ群を設計するための方法をさらに提供する。

例えば、使用者は、ランダム配列を作成するためのコンピュータプログラムを利用して第1推定サンプルタグを作成してもよい。第1推定サンプルタグをサンプルタグ群に加える。使用者は次に、第2推定サンプルタグを同じ方法で作成し、さらに該第2推定サンプルタグの配列を第1推定サンプルタグと比較することにより、妥当な数の低確率変異が第2推定サンプルタグに導入されたとしても該第2推定サンプルタグが依然として該第1推定サンプルタグと異なるよう第2サンプルタグが第1サンプルタグと異なるかどうかを調べてもよい。異なるのであれば、第2推定サンプルタグをサンプルタグ群に加える。異ならないのであれば、この第2推定サンプルタグを廃棄する。これを第3およびその後の推定サンプルタグについて繰り返してもよい。

上述の通り、サンプルタグに関しては、少なくとも1つの標的核酸分子に変異を導入するための方法において少なくとも1つの標的核酸分子に加えることは有利である。しかし、変異を導入する前にサンプルタグを加えると、これは該サンプルタグが変異し、結果として同じサンプルまたは異なるサンプルから生じた標的核酸分子を識別する際に使用できないことを意味しうる。これは、サンプルタグが変異しても使用者にとってそれらを識別できるほどそれらが互いに十分異なるように該サンプルタグを設計することにより、回避することができる。

前記方法は、以下a.(i)および(ii)、すなわち
a.(i)少なくとも1つの標的核酸分子に変異を導入するための方法を解析し、かつこの少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる高確率変異の平均数を決定すること、および
(ii)少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる高確率変異の平均数より多い高確率変異差により各サンプルタグがサンプルタグ群の実質的に全てのサンプルタグと異なっている該群について配列を決定すること
をさらに含んでいてもよい。

低確率変異は、トランスバージョン変異またはインデル変異であってもよい。高確率変異はトランジション変異であってもよい。

前記方法はコンピュータにより実装される方法であってもよい。

本発明のさらなる態様では、少なくとも1つの標的核酸分子に変異を導入するための方法における使用に適したサンプルタグ群を設計するための方法を実施するために構成された、コンピュータ可読媒体が提供される。本発明のさらなる態様では、本発明のサンプルタグを設計するための方法により取得可能なサンプルタグ群が提供される。状況に応じて、該サンプルタグ群を、本発明のサンプルタグを設計するための方法により取得する。

不均一(unequal)濃度のdNTPを使用する
低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸を増幅するステップは、不均一濃度のdNTPを使用して実行してもよい。

本発明のある態様では、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.DNAポリメラーゼを用いて該少なくとも1つの標的核酸分子を増幅することにより、該少なくとも1つの標的核酸分子に変異を導入して、変異した少なくとも1つの標的核酸分子を用意すること、
ここでステップb.は不均一濃度のdNTPを使用して実行するものとする、
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法が提供される。

DNAポリメラーゼ(例えば、低バイアスDNAポリメラーゼ)を使用して該少なくとも1つの標的核酸を増幅できるようにするために、該標的核酸を、例えばPCR装置内で、DNA複製が生じるのに適した条件下で該DNAポリメラーゼおよびdNTPに曝露してもよい。該少なくとも1つの標的核酸を増幅するステップを不均一濃度のdNTPを使用して実行する場合、該標的核酸をDNAポリメラーゼ(例えば、低バイアスDNAポリメラーゼ)およびdNTPに曝露するが、該dNTPの濃度は互いに対して異なるものとする。

dNTPという用語は、デオキシヌクレオチドを指すものとする。具体的に言えば、本出願の文脈において、「dNTP」という用語は、dTTP (デオキシチミジン三リン酸)またはdUTP (デオキシウリジン)、dGTP (デオキシグアニジン三リン酸)、dCTP (デオキシシチジン三リン酸)、およびdATP (デオキシアデノシン三リン酸)を含む溶液を指すものとする。状況に応じて、「dNTP」はdTTP (デオキシチミジン三リン酸)、dGTP (デオキシグアニジン三リン酸)、dCTP (デオキシシチジン三リン酸)、およびdATP (デオキシアデノシン三リン酸)を含む溶液を指す。

「不均一濃度のdNTP」という表現は、4種のdNTPが互いに対して異なる濃度で溶液中に存在することを意味する。例えば、1種のdNTPが他の3種のdNTPと比較して(よりも)高い濃度で存在していてもよく、2種のdNTPが他の2種のdNTPと比較して(よりも)高い濃度で存在していてもよく、または3種のdNTPが他の1種のdNTPと比較して(よりも)高い濃度で存在していてもよい。

dGTPはdCTP、dTTPおよびdATPと比較して(よりも)高い濃度で存在していてもよく、dGTPはdTTPおよびdATPと比較して(よりも)高い濃度で存在していてもよく、dGTPはdATPと比較して(よりも)高い濃度で存在していてもよく、dGTPはdTTPと比較して(よりも)高い濃度で存在していてもよく、dCTPはdGTP、dTTPおよびdATPと比較して(よりも)高い濃度で存在していてもよく、dCTPはdTTPおよびdATPと比較して(よりも)高い濃度で存在していてもよく、dCTPはdATPと比較して(よりも)高い濃度で存在していてもよく、dCTPはdTTPと比較して(よりも)高い濃度で存在していてもよく、dTTPはdGTP、dCTPおよびdATPと比較して(よりも)高い濃度で存在していてもよく、dTTPはdGTPおよびdCTPと比較して(よりも)高い濃度で存在していてもよく、dTTPはdCTPと比較して(よりも)高い濃度で存在していてもよく、dTTPはdGTPと比較して(よりも)高い濃度で存在していてもよく、dATPはdGTP、dTTPおよびdCTPと比較して(よりも)高い濃度で存在していてもよく、dATPはdGTPおよびdCTPと比較して(よりも)高い濃度で存在していてもよく、dATPはdGTPと比較して(よりも)高い濃度で存在していてもよく、dATPはdGTPと比較して高い濃度で存在していてもよく、dCTPおよびdATPはdGTPおよびdCTPと比較して(よりも)高い濃度で存在していてもよく、またはdGTPおよびdCTPはdATPおよびdTTPと比較して(よりも)高い濃度で存在していてもよい。

使用者は、任意の簡便な方法で不均一濃度のdNTPの溶液を調製してもよい。dATP、dTTP、dGTPおよびdTTPの溶液は市販品を容易に入手できるため、使用者はこれらを適当な比で混合するだけでよい。

状況に応じて、前記方法は、以下(i)または(ii)である、すなわち
(i)ヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを含み、かつこのヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを不均一濃度のdNTPを使用して実行するか、または
(ii)変異した少なくとも1つの標的核酸分子を用意し、かつ、この変異した少なくとも1つの標的核酸分子を低バイアスDNAポリメラーゼを使用して増幅するさらなるステップを含み、かつ、この変異した少なくとも1つの標的核酸分子を低バイアスDNAポリメラーゼを使用して増幅するさらなるステップを不均一濃度のdNTPを使用して実行する。

状況に応じて、変異した少なくとも1つの標的核酸分子を用意するためにDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することによってこの少なくとも1つの標的核酸分子に変異を導入することを、ヌクレオチド類似体の存在下で実行する。状況に応じて、少なくとも1つの標的核酸分子に変異を導入するための方法は、ヌクレオチド類似体の非存在下で該変異した少なくとも1つの標的核酸分子を増幅するステップを含み、また状況に応じて、このステップを不均一濃度のdNTPを使用して実行する。

ヌクレオチド類似体を使用することにより少なくとも1つの標的核酸分子に変異を導入する場合、これは一般に、2つの増幅ステップを伴う。第1増幅ステップでは、ヌクレオチド類似体を標的核酸分子に組み込む(変異ステップ)。第2増幅ステップでは、ヌクレオチド類似体が天然ヌクレオチドと対を形成し、それによって変異が標的核酸分子の一方の鎖に導入される(回復ステップ)。該標的核酸分子をさらに増幅すると、この変異は該標的核酸分子の両鎖に伝達される。状況に応じて、第1 (変異)増幅ステップおよび第2 (回復)増幅ステップを共に、不均一濃度のdNTPを使用して実行してもよい。状況に応じて、不均一濃度のdNTPは、第1 (変異)増幅ステップおよび第2 (回復)増幅ステップで異なる。例えば、不均一濃度のdNTPは、第1 (変異)増幅ステップにおいて他のdNTPより低い濃度のdTTPを含んでいてもよく、また不均一濃度のdNTPは、第2 (回復)増幅ステップにおいて他のdNTPより低い濃度のdATPを含んでいてもよい。低バイアスDNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅するステップ、または変異した少なくとも1つの標的核酸分子を用意するステップは、1つ以上の「変異ステップ」に相当しうる。ヌクレオチド類似体の非存在下でヌクレオチド類似体を含む少なくとも1つの標的核酸分子を増幅するさらなるステップ、または変異した少なくとも1つの標的核酸分子を増幅するさらなるステップは、1つ以上の「回復ステップ」に相当しうる。

状況に応じて、ヌクレオチド類似体はdPTPである。

ある実施形態では、不均一濃度のdNTPを使用することにより、導入する変異のプロファイルを変更する。不均一濃度のdNTPは、少なくとも1つの標的核酸分子に変異を導入することを含む方法に使用する。従って、該方法により、変異を含む標的核酸分子(例えば、本明細書中に記載する、変異した標的核酸分子)が生じる。該方法により所与の標的核酸分子に導入される変異の数、変異のタイプ、および各変異の位置を、導入される「変異のプロファイル」と称する場合がある。「変異のタイプ」という用語は、変異の性質、すなわち、置換変異、付加変異または欠失変異なのか、ならびにそれが置換変異であるならば開始ヌクレオチドは何であったか、および開始ヌクレオチドを何に変異させたか(例えばAからGへの変異は、Gに変異させるA開始ヌクレオチドを有する)を指すものとする。

使用者は、試験標的核酸分子を複製し、次にその複製物の一部を本発明の変異を導入することを含む方法に供する(ただし、該複製物の一部は(それらを変異させることなく)取っておく)ことにより所与の方法で導入される「変異のプロファイル」を決定してもよい。使用者は次に、本発明の変異を導入することを含む方法に供した複製物、および取っておいた複製物を配列決定してもよい。最後に、使用者は、本発明の変異を導入することを含む方法に供した複製物の配列と、取っておいた複製物の配列を整列させることにより、導入された変異の数、変異のタイプおよび各変異の位置を決定することができる。あるいは、使用者は、既知配列の試験標的核酸分子を使用してもよい。使用者はその際、該試験標的核酸分子を本発明の変異を導入することを含む方法に供し、次いで得られた変異標的核酸分子を配列決定することにより、どの変異のプロファイルが導入されたかを調べるだけでよい。

使用者は多くの手段で変異プロファイルを変更することを望む場合がある。例えば、上述の通り、変異バイアスを低減できることは有利である。従って、ある実施形態では、不均一濃度のdNTPを使用することにより、導入する変異のプロファイルのバイアスを低減する。さらなる実施形態では、この方法は、低バイアスの変異プロファイルに変異を導入するための方法である。

本出願は、不均一濃度のdNTPの使用を利用することにより、導入する変異のプロファイルのバイアスを低減できることを実証するものである。例えば、DNAポリメラーゼ(例えば、上記の低バイアスDNAポリメラーゼ)を使用することにより標的核酸分子を変異させて、他の変異と比較してより多くの数のGからAへの変異を導入する場合、使用者はdATPの濃度を他のdNTPと比べて低減することが可能であり、またこれにより、AヌクレオチドがdGTPの代わりに組み込まれる頻度が減少し、そのためGからAへの変異の数が減少する場合がある。

同様に、標的核酸分子に変異を導入する際にヌクレオチド類似体を使用する場合、dNTPの相対濃度の変更を利用して変異プロファイルを変更することができる。例えば、dPTPを使用することにより、GからA、CからT、AからGおよびTからCへの変異を導入することができる。先により詳細に記載したように、dPTPはTヌクレオチドまたはCヌクレオチドを置き換えることが可能であり、またdPTPがそのアミノまたはイミノ型であるかどうかに応じて、該dPTPは後にAヌクレオチドまたはGヌクレオチドと対を形成することができる。これは2つのシナリオにつながる。第1シナリオでは、dPTPは(例えば)センス鎖中のTに取って代わり(変異ステップ)、次いで該dPTPはアンチセンス鎖中のA (変異なし)またはG (AからGへの変異)と対を形成することができる。dPTPがTに取って代わりかつアンチセンス鎖中のGと対を形成する場合、この変異体GはCと対を形成することにより、センス鎖の複製物にTからCへの変異を導入する(回復ステップ)。逆に、dPTPはアンチセンス鎖中のTに取って代わる場合があり、これはセンス鎖にAからGへの変異、およびアンチセンス鎖の複製物にTからCへの変異をもたらす場合がある。第2シナリオでは、dPTPは(例えば)センス鎖中のCに取って代わり、次いで該dPTPはアンチセンス鎖中のA (GからAへの変異)またはG (変異なし)と対を形成することができる(変異ステップ)。dPTPがCに取って代わりかつアンチセンス鎖中のAと対を形成する場合、この変異体AはTと対を形成することにより、センス鎖の複製物にCからTへの変異を導入する(回復ステップ)。逆に、dPTPはアンチセンス鎖中のCに取って代わる場合があり、これはセンス鎖にGからAへの変異、およびアンチセンス鎖の複製物にCからTへの変異をもたらす場合がある。

本出願は、GからAおよびCからTへの変異の割合がAからGおよびTからCへの変異の割合よりも高い場合、その際dTTPの濃度を他のdNTPと比較して(および好ましくはdCTPの濃度と比較して)低下させることは、dPTPがdTTPの代わりに組み込まれることを促進し、第2シナリオに対して上記第1シナリオの事例を増大させる(第1シナリオで導入されるAからGおよびTからCへの変異が増大することを意味する)ことを実証するものである。同様に、本出願は、dATPのレベルが回復ステップの最中に低下する場合、その際GからAおよびCからTへの変異のレベルは増大することを実証するものである。これは何故かと言うと、上記シナリオ2において、dATPが他のdNTPと比較して(および好ましくはdGTPの濃度と比較して)より低い濃度で存在する場合、これはCヌクレオチドの代わりに組み込まれたdPTPがGとより頻繁に対を形成し、かつより少ないGからAまたはCからTへの変異が導入されることを意味するからである。前記の2つのシナリオを図7に示す。

本明細書中に開示した低バイアスDNAポリメラーゼでさえ、小さいバイアスで標的核酸分子に変異を導入する。本出願は、不均一濃度のdNTPを低バイアスDNAポリメラーゼと共に使用すると任意の変異バイアスを実質的に排除できることを実証するものである。

本出願において提供した情報を基にすると、あるヌクレオチド類似体を使用するか、および使用するならばどのdNTPを使用するかによって、様々なdNTPの濃度の変更が変異プロファイルにどのような影響を与えるかを判定する（決定する）ことは、当業者の能力の範囲内である。従って、幾つかの実施形態では、不均一濃度のdNTPを使用する前記方法は、導入する変異のプロファイルのバイアスを低減するためにそのレベルを増大または低下させるべきdNTPを同定するステップを含む。

状況に応じて、不均一濃度のdNTPは、他のdNTPより低い濃度のdTTPを含む。上記の通り、これにより、dPTPをヌクレオチド類似体として使用する場合に導入されるTからCおよびAからGへの変異の割合を増大させることができる。状況に応じて、不均一濃度のdNTPは、dATP、dCTPまたはdGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdTTPを含む。状況に応じて、不均一濃度のdNTPは、dCTPの濃度の60％未満の濃度のdTTPを含む。状況に応じて、不均一濃度のdNTPは、dCTPの濃度の25％～60％の濃度のdTTPを含む。

状況に応じて、不均一濃度のdNTPは、他のdNTPと比較してより低い濃度のdATPを含む。上記の通り、これにより、dPTPをヌクレオチド類似体として使用する場合に導入されるGからAまたはCからTへの変異の割合を増大させることができる。状況に応じて、不均一濃度のdNTPは、dTTP、dCTPまたはdGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdATPを含む。状況に応じて、不均一濃度のdNTPは、dGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdATPを含む。状況に応じて、不均一濃度のdNTPは、dGTPの濃度の60％未満の濃度のdATPを含む。状況に応じて、不均一濃度のdNTPは、dGTPの濃度の25％～60％の濃度のdATPを含む。

上記の2つのシナリオに記載したように、ヌクレオチド類似体としてdPTPを使用する場合、dTTPを減少させることは、標的核酸分子中のTヌクレオチドのdPTPとの置き換えを促進することにより、TからCおよびAからGへの変異を増大させる。従って、他のdNTPより低い濃度のdTTPを含む不均一濃度のdNTPは、突然変異誘発ステップ(例えば、dPTPの存在下でのPCRのステップ)において使用することが好ましい。同様に、ヌクレオチド類似体としてdPTPを使用する場合、dATPを減少させることは、Cヌクレオチドに取って代わりdATPと対を形成するdPTPの数を減少させるため、GからAおよびCからTへの変異を増大させる。dPTPのdATPとの対形成は回復ステップの最中に起こる傾向があるため、該回復ステップの最中のdATPを減少させることは、GからAおよびCからTへの変異の数を増大させる。従って、状況に応じて、ヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するステップ、またはヌクレオチド類似体の非存在下で該変異した少なくとも1つの標的核酸分子を増幅するステップは、不均一濃度のdNTPを使用して実行し、また不均一濃度のdNTPは、他のdNTPと比較してより低い濃度のdATPを含む。

実施例１－他のポリメラーゼのPrimeStar GXLを使用して核酸分子を変異させる
DNA分子を断片化して適当なサイズ(例えば10 kb)とし、さらにタグメンテーションを利用して規定配列プライミング部位(アダプター)を各末端に結合した。

第1ステップは、DNAを断片化するためのタグメンテーション反応である。4μL以下の容量の1種以上の菌株中50 ngの高分子量ゲノムDNAを下記条件下でタグメンテーションに供した。50 ngのDNAを、4μLのNextera Transposase (1：50に希釈)、および8μLの2X タグメンテーション緩衝液(20mM Tris [pH7.6]、20mM MgCl、20％(v／v)ジメチルホルムアミド)と合わせて総量を16μLとした。反応物を55℃で5分間インキュベートし、4μLのNT緩衝液(または0.2％SDS)を該反応物に添加してから、該反応物を室温で5分間インキュベートした。

前記のタグメンテーション反応物を、SPRIselectビーズ(Beckman Coulter)を使用し、製造業者の指示に従ってレフトサイドサイズセレクションのために0.6容量のビーズを使用して精製してから、DNAを分子生物学グレードの水に溶出させた。

この後、標準的なdNTPとdPTPの組み合わせを用いてPCRを6サイクルだけ行った。Primestar GXLを使用し、12.5 ngのタグメント化しかつ精製したDNAを添加して、1 x GXL緩衝液、各200μMのdATP、dTTP、dGTPおよびdCTP、ならびに0.5 mMのdPTP、および0.4μMのカスタムプライマー(表2)を含有する25μLの総反応物量とした。

前記反応物をPrimestar GXLの存在下で下記熱サイクルに供した。68℃で3分間の初期ギャップ伸長、続いて98℃で10秒間、55℃で15秒間および68℃で10分間のサイクルを6回行った。

次の段階は、鋳型由来のdPTPを除去しかつそれらをトランジション変異により置き換えるための、dPTPを使用しないPCRである(「回復PCR」)。PCR反応物をSPRIselectビーズで精製することにより過剰なdPTPおよびプライマーを除去し、次いでdPTP組み込みサイクルの最中に導入された断片末端とアニーリングするプライマー(表3)を使用してさらなる10ラウンド(最少1ラウンド、最多20)の増幅に供した。

この後、所望のサイズ範囲(例えば7～10 kb)内にある増幅されかつ変異した断片をサイズ選択するためのゲル抽出ステップを行った。ゲル抽出は手動で、またはBluePippinなどの自動化されたシステムを介して行うことができる。この後、16～20サイクルの追加ラウンドのPCRを行った(「富化PCR」)。

長い変異鋳型を規定数増幅した後、該鋳型のランダム断片化を実行することにより、配列決定用の重複するより短い断片群を作成した。断片化はタグメンテーションにより実施した。

先のステップで得た長いDNA断片を、反応物をPCR増幅用に3つのプールに分けたことを除き、標準的なタグメンテーション反応(例えばNextera XTまたはNextera Flex)に供した。これにより、元の鋳型の各末端に由来する断片(例えば、サンプルのバーコードを含む)、ならびに前記の長い鋳型由来の、両末端で新たにタグメント化された内部断片の選択的増幅が可能となる。これにより、Illumina装置(例えばMiSeqまたはHiSeq)での配列決定用の3つのプールが効果的に創出される。

前記方法を、標準的なTaq (Jena Biosciences)、およびLongAmp (New England Biolabs)と呼ばれるTaqと校正ポリメラーゼ(DeepVent)とのブレンドを使用して繰り返した。

本実験で取得したデータを図1に示す。dPTPは対照として使用しなかった。リードを大腸菌ゲノムに対してマッピングしたところ、約8％という変異率の中央値(median mutation rate)が達成された。

実施例２－種々のDNAポリメラーゼの変異頻度の比較
突然変異誘発を、広範な種々のDNAポリメラーゼを用いて実施した(表4)。大腸菌株MG1655から得たゲノムDNAを、実施例１の方法にて記載した通りにタグメント化して長い断片を作製し、ビーズ精製した。この後、0.5 mM dPTP存在下での6サイクルの「突然変異誘発PCR」、SPRIselectビーズ精製、およびdPTP非存在下での追加の14～16サイクルの「回復PCR」を行った。結果として生じた長い変異鋳型を次に標準的なタグメンテーション反応(実施例１を参照されたい)に供し、さらに「内部」断片を増幅してMiSeq装置で配列決定した。

変異率を表4に記載するが、これらは既知参照ゲノムから得たDNAのIlluminaシーケンシングを利用して測定した、dPTP突然変異誘発反応を介した塩基置換の頻度を正規化したものである。Taqポリメラーゼに関しては、サーモコッカス属古細菌のポリメラーゼ用に最適化した緩衝液中で使用した場合でさえ、鋳型G＋C部位で生じるのは変異の12％以下にすぎない。サーモコッカス様(Thermococcus-like)ポリメラーゼは鋳型G＋C部位に変異の58～69％を生じ、一方でパイロコッカス属古細菌(Pyrococcus)由来のポリメラーゼは鋳型G＋C部位に変異の88％を与えた。

酵素はJena Biosciences (Taq)、Takara (Primestar各種)、Merck Millipore (KOD DNAポリメラーゼ)およびNew England Biolabs (Phusion)から入手した。

Taqは、本実験のために、添付緩衝液と、さらにPrimestar GXL Buffer (Takara)を用いて試験した。全ての他の反応は、各ポリメラーゼ用の標準的な添付緩衝液を用いて実行した。

実施例３ dPTP突然変異誘発率を決定する
本発明者らは、単一セットの反応条件下でサーモコッカス属古細菌のポリメラーゼ(Primestar GXL；Takara)を使用して、種々のレベルのG＋C含量(33～66％)を示す広範なゲノムDNAサンプルに対してdPTP突然変異誘発を実施した。突然変異誘発および配列決定は、10サイクルの「回復PCR」を実施したことを除き、実施例３の方法にて記載した通りに実施した。予想通り、変異率はG＋C含量の多様性にもかかわらずサンプル間でほぼ同様であった(変異率の中央値7～8％)(図2)。

実施例４－鋳型増幅バイアスを測定する
鋳型増幅バイアスを、2つのポリメラーゼ、すなわちIlluminaシーケンシングプロトコルで慣用される校正ポリメラーゼであるKapa HiFi、および長い断片を増幅するその能力で知られるKODファミリーのポリメラーゼであるPrimeStar GXLについて測定した。最初の実験では、Kapa HiFiを使用することにより、約2kbpの大きさを有する限られた数の大腸菌ゲノムDNA鋳型を増幅した。これらの増幅断片の末端を次に配列決定した。同様の実験を、大腸菌から得た約7～10kbpの断片に対して、PrimeStar GXLを用いて行った。各末端配列リードの位置は、大腸菌参照ゲノムにマッピングすることにより決定した。隣接する断片末端間の距離を測定した。これらの距離を、一様分布からランダムに抽出した一連の距離と比較した。該比較はノンパラメトリックコルモゴロフ・スミルノフ検定のDを介して実行した。2つのサンプルが同じ分布に由来する場合、Dの値はゼロに近付く。低バイアスPrimeStarポリメラーゼに関しては、本発明者らは、50,000の断片末端について50,000のゲノム位置の均一なランダムサンプルと比較して測定した際に、D＝0.07を観察した。Kapa HiFiポリメラーゼに関しては、本発明者らは50,000の断片末端についてD＝0.14を観察した。

実施例５－より長い鋳型の選択的増幅のために2つの同一プライマー結合部位および単一プライマー配列を使用する
上記の通り、タグメンテーションを利用することにより、DNA分子を断片化すると同時にその断片の末端にプライマー結合部位(アダプター)を導入することができる。Nexteraタグメンテーション系(Illumina)は、2つの固有アダプター(本明細書中ではXおよびYと称する)のうちの1つを持つトランスポザーゼ酵素を利用する。これにより、一部は同一の末端配列(X-X、Y-Y)を有し、また一部は固有末端(X-Y)を有する、増幅産物のランダムな混合物が生成する。標準的なNexteraプロトコルでは、2つの別個のプライマー配列を利用することにより、各末端に異なるアダプターを含有する「X-Y」生成物を選択的に増幅する(Illumina技術によるシーケンシングに必要な場合)。しかし、単一プライマー配列を使用することにより同一末端アダプターを有する「X-X」または「Y-Y」断片を増幅することも可能である。

同一末端アダプターを含有する長い変異鋳型を作成するために、実施例１に記載したように、50 ngの高分子量ゲノムDNA (大腸菌株MG1655)を最初にタグメンテーションに供し、次いでSPRIselectビーズで精製した。この後、標準的なdNTPおよびdPTPの組み合わせを用いて5サイクルの「突然変異誘発PCR」を行い、該PCRは単一プライマー配列を使用したことを除き実施例１に詳述した通りに実施した(表5)。

前記のPCR反応物をSPRIselectビーズで精製することにより過剰なdPTPおよびプライマーを除去し、次にdPTPの非存在下でさらなる10サイクルの「回復PCR」に供することで、トランジション変異により鋳型中のdPTPを置き換えた。回復PCRは、dPTP組み込みサイクルの最中に導入した断片末端にアニーリングする単一プライマーを用いて実施し、それによって先のPCRステップで生成した変異鋳型の選択的増幅が可能となった。

対照として、各末端に異なるアダプターを有する変異鋳型を、2つの別個のプライマー配列を突然変異誘発PCR(表2に示す)と回復PCR(表3)の両方において使用したことを除いては上記のものと同一のプロトコルを利用して作成した。最終PCR産物をSPRIselectビーズで精製し、さらに2100 Bioanalzyer System (Agilent)を利用して高感度DNAチップで解析した。図xxxに示すように、同一末端アダプターを用いて作成した鋳型は、二重アダプターを含有する対照サンプルより平均して有意に長かった。対照鋳型は約800 bpの最小サイズに至るまで検出できたが、一方で単一アダプターサンプルに関しては2000 bp未満の鋳型は認められなかった。

同一末端アダプターを有する変異鋳型(青色)および二重アダプターを有する対照鋳型をAgilent 2100 Bioanalyzer (高感度DNAキット)に使用することにより、サイズのプロファイルを比較した。同一末端アダプターの使用は2 kbp未満の鋳型の増幅を阻害する。このデータを図6に示す。

実施例８－PCRの最中に天然dNTPレベルを変更することによりサーモコッカス属古細菌のポリメラーゼの変異バイアスをさらに低減する
サーモコッカス属古細菌のポリメラーゼは他のDNAポリメラーゼと比較するとはるかにバランスのとれた変異プロファイルを生成するが、それらはGおよびC部位における変異に対してわずかなバイアスを呈する(表4を参照されたい)。この残留バイアスを排除するため、本発明者らは、種々のヌクレオチドの相対的組み込み率に影響を与えるために突然変異誘発および回復PCRステップの最中に天然のdNTPの濃度を変更することの効果を検証した。

最初に、PCR反応物中の個々のヌクレオチドの濃度を変えたことを除いては実施例５に概説した手法を利用して、細菌のゲノムDNA(大腸菌株MG1655)から長い変異鋳型を調製した。これは、4種の天然ヌクレオチドの個々の溶液(New England Biolabsから購入)を、200μMという標準的な最終濃度で、または160μM (標準に対して80％)もしくは100μM (50％)というより低い濃度でPCR混合物に別々に添加することにより達成した。1つの反応につきヌクレオチドを1種だけ変更した。対照として、Primestar GXLポリメラーゼ(Takara)を加えた等モルdNTP混合物を使用して、全ての天然ヌクレオチドを200μMの同一最終濃度まで添加した。5回の突然変異誘発PCRサイクルおよび12回の回収サイクルを、表5に示すプライマーを使用して実施した。得られた長い変異鋳型を次に標準的なタグメンテーション反応(実施例１を参照されたい)に供し、さらに「内部」断片を増幅してから、Illumina MiSeq装置で配列決定した。変異頻度は、既知参照配列に対する比較により決定した。

表6に示すように、突然変異誘発および／または回復PCRの最中の個々のdNTPの濃度における変化は、観察される変異のプロファイルを変更した。重要なことに、突然変異誘発の間dTTPの量を50％まで制限すると、各ヌクレオチドに実質的に同一の変異頻度をもたらすことが判明した(表3)。これは、サーモコッカス属古細菌のポリメラーゼの残留変異バイアスはdNTPレベルの変化を通じて排除できることを裏付けるものである。

本開示は以下の配列情報を包含する。
SEQUENCE LISTING

<110> ILLUMINA SINGAPORE PTE. LTD.

<120> Method for Introducing Mutations

<130> PA23-680

<140>
<141> 2019-02-19

<150> GB 1802744.1
<151> 2018-02-20

<160> 142

<170> PatentIn version 3.5

<210> 1
<211> 2325
<212> DNA
<213> Artificial Sequence

<220>
<223> DNA polymerase from Thermococcus sp. KS-1

<400> 1
atgatcctcg acactgacta cataactgag aatggaaaac ccgtcataag gattttcaag 60

aaggagaacg gcgagtttaa gattgagtac gataggactt ttgaacccta catttacgcc 120

ctcctgaagg acgattctgc cattgaggag gtcaagaaga taaccgccga gaggcacgga 180

acggttgtaa cggttaagcg ggctgaaaag gttcagaaga agttcctcgg gagaccagtt 240

gaggtctgga aactctactt tactcaccct caggacgtcc cagcgataag ggacaagata 300

cgagagcatc cagcagttat tgacatctac gagtacgaca tacccttcgc caagcgctac 360

ctcatagaca agggattagt gccaatggaa ggcgacgagg agctgaaaat gcttgccttt 420

gatatcgaga cgctctacca tgagggcgag gagttcgccg aggggccaat ccttatgata 480

agctacgccg acgaggaagg ggccagggtg ataacgtgga agaacgcgga tctgccctac 540

gttgacgtcg tctcgacgga gagggagatg ataaagcgct tcctaaaggt ggtcaaagag 600

aaagatcctg acgtcctaat aacctacaac ggcgacaact tcgacttcgc ctacctaaaa 660

aaacgctgtg aaaagcttgg aataaacttc acgctcggaa gggacggaag cgagccgaag 720

attcagagga tgggcgacag gtttgccgtc gaagtgaagg gacggataca cttcgatctc 780

tatcctgtga taagacggac gataaacctg cccacataca cgcttgaggc cgtttatgaa 840

gccgtcttcg gtcagccgaa ggagaaggtc tacgctgagg agatagctac agcttgggag 900

agcggtgaag gccttgagag agtagccaga tactcgatgg aagatgcgaa ggtcacatac 960

gagcttggga aggagttttt ccctatggag gcccagcttt ctcgcttaat cggccagtcc 1020

ctctgggacg tctcccgctc cagcactggc aacctcgttg agtggttcct cctcaggaag 1080

gcctacgaga ggaatgagct ggccccgaac aagcccgatg aaaaggagct ggccagaaga 1140

cgacagagct atgaaggagg ctatgtaaaa gagcccgaga gagggttgtg ggagaacata 1200

gtgtacctag attttagatc tctgtacccc tcaatcatca tcacccacaa cgtctcgccg 1260

gatactctca acagggaagg atgcaaggaa tatgacgttg ccccccaggt cggtcaccgc 1320

ttctgcaagg acttcccagg atttatcccg agcctgcttg gagacctcct agaggagagg 1380

cagaagataa agaagaagat gaaggccacg attgacccga tcgagaggaa gctcctcgat 1440

tacaggcaga gggccatcaa gatcctggcc aacagctact acggttacta cggctatgca 1500

agggcgcgct ggtactgcaa ggagtgtgca gagagcgtaa cggcctgggg aagggagtac 1560

ataacgatga ccatcagaga gatagaggaa aagtacggct ttaaggtaat ctacagcgac 1620

accgacggat tttttgccac aatacctgga gccgatgctg aaaccgtcaa aaagaaggcg 1680

atggagttcc tcaagtatat caacgccaaa ctcccgggcg cgcttgagct cgagtacgag 1740

ggcttctaca aacgcggctt cttcgtcacg aagaagaagt acgcggtgat agacgaggaa 1800

ggcaagataa caacgcgcgg acttgagatt gtgaggcgcg actggagcga gatagcgaaa 1860

gagacgcagg cgagggttct tgaagctttg ctaaaggacg gtgacgtcga gaaggccgtg 1920

aggatagtca aagaagttac cgaaaagctg agcaagtacg aggttccgcc ggagaagctg 1980

gtgatccacg agcagataac gagggattta aaggactaca aggcaaccgg tccccacgtt 2040

gccgttgcca agaggttggc cgcgagagga gtcaaaatac gccctggaac ggtgataagc 2100

tacatcgtgc tcaagggctc tgggaggata ggcgacaggg cgataccgtt cgacgagttc 2160

gacccgacga agcacaagta cgacgccgag tactacattg agaaccaggt tctcccagcc 2220

gttgagagaa ttctgagagc cttcggttac cgcaaggaag acctgcgcta ccagaagacg 2280

agacaggttg gtctgggagc ctggctgaag ccgaagggaa cttga 2325

<210> 2
<211> 774
<212> PRT
<213> Artificial Sequence

<220>
<223> DNA polymerase from Thermococcus sp. KS-1

<400> 2

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile
1 5 10 15

Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30

Thr Phe Glu Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45

Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr
50 55 60

Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95

Arg Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125

Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe Asp Ile Glu Thr
130 135 140

Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160

Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Ala
165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys
180 185 190

Arg Phe Leu Lys Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220

Lys Leu Gly Ile Asn Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285

Lys Val Tyr Ala Glu Glu Ile Ala Thr Ala Trp Glu Ser Gly Glu Gly
290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320

Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335

Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365

Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg Arg Gln Ser Tyr
370 375 380

Glu Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430

Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460

Lys Lys Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480

Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Tyr Tyr Gly Tyr
485 490 495

Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Arg Glu Ile
515 520 525

Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540

Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560

Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys Lys
580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620

Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640

Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700

Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720

Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735

Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750

Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Gly Ala Trp
755 760 765

Leu Lys Pro Lys Gly Thr
770

<210> 3
<211> 2325
<212> DNA
<213> Artificial Sequence

<220>
<223> DNA polymerase from Thermococcus celer

<400> 3
atgatcctcg acgctgacta catcaccgaa gatgggaagc ccgtcgtgag gatattcagg 60

aaggagaagg gcgagttcag aatcgactac gacagggact tcgagcccta catctacgcc 120

ctcctgaagg acgattcggc catcgaggag gtgaagagga taaccgttga gcgccacggg 180

aaggccgtca gggttaagcg ggtggagaag gtcgaaaaga agttcctcaa caggccgata 240

gaggtctgga agctctactt caatcacccg caggacgttc cggcgataag ggacgagata 300

aggaagcatc cggccgtcgt tgatatctac gagtacgaca tccccttcgc caagcgctac 360

ctcatcgata aggggctcgt cccgatggag ggggaggagg agctcaaact gatggccttc 420

gacatcgaga ccctctacca cgagggagac gagttcgggg aggggccgat cctgatgata 480

agctacgccg acggggacgg ggcgagggtc ataacctgga agaagatcga cctcccctac 540

gtcgacgtcg tctcgaccga gaaggagatg ataaagcgct tcctccaggt ggtgaaggag 600

aaggacccgg acgtgctcgt aacttacaac ggcgacaact tcgacttcgc ctacctgaag 660

agacgctccg aggagcttgg attgaagttc atcctcggga gggacgggag cgagcccaag 720

atccagcgca tgggcgaccg cttcgccgtc gaggtgaagg ggaggataca cttcgacctc 780

tacccggtga taaggcgcac cgtgaacctg ccgacctaca cgctcgaggc ggtctacgag 840

gccatcttcg ggaggccaaa ggagaaggtc tacgccgggg agatagtgga ggcctgggaa 900

accggcgagg gtcttgagag ggttgcccgc tactccatgg aggacgcaaa ggttaccttc 960

gagctcggga gggagttctt cccgatggag gcccagctct cgaggctcat cggccagggt 1020

ctctgggacg tctcccgctc gagcaccggc aacctggtcg agtggttcct cctgaggaag 1080

gcctacgaga ggaacgaact ggccccgaac aagccgagcg gccgggaagt ggagatcagg 1140

aggcgtggct acgccggtgg ttacgttaag gagccggaga ggggtttatg ggagaacatc 1200

gtgtacctcg actttcgctc tctttacccc tccatcatca taacccacaa cgtctcgccc 1260

gataccctaa acagggaggg ctgtgagaac tacgacgtcg ccccccaggt ggggcataag 1320

ttctgcaaag attttccggg cttcatcccg agcctgctcg gaggcctgct tgaggagagg 1380

cagaagataa agcggaggat gaaggcctct gtggatcccg ttgagcggaa gctcctcgat 1440

tacaggcaga gggccatcaa gatactggcc aacagcttct acggatacta cggctacgcg 1500

agggcgaggt ggtactgcag ggagtgcgcg gagagcgtta ccgcctgggg cagggagtac 1560

atcgataggg tcatcaggga gctcgaggag aagttcggct tcaaggtgct ctacgcggac 1620

acggacggac tgcacgccac gatccccggg gcggacgccg ggaccgtcaa ggagagggcg 1680

agggggttcc tgagatacat caaccccaag ctccccggcc tcctggagct cgagtacgag 1740

gggttctacc tgaggggttt cttcgtgacg aagaagaagt acgcggtcat agacgaggag 1800

ggcaagataa ccacgcgcgg cctcgagata gtcaggcggg actggagcga ggtggccaag 1860

gagacgcagg cgagggtcct ggaggcgata ctgaggcacg gtgacgtcga ggaggccgtt 1920

agaatcgtca gggaggtaac cgaaaagctg agcaagtacg aggttccgcc ggagaaactg 1980

gtgatccacg agcagataac gagggatttg agggactaca aagccacggg accgcacgtg 2040

gcggtggcga agcgcctggc cgggaggggg gtaaggatac gccccgggac ggtgataagc 2100

tacatcgtcc tcaagggctc cggaaggata ggggacaggg cgattccctt cgacgagttc 2160

gacccgacta agcacaggta cgacgccgac tactacatcg agaaccaggt tctgccagcc 2220

gtcgagagga tcctgaaggc cttcggctac cgcaaggagg acctgaaata ccagaagacg 2280

aggcaggtgg gcctgggtgc gtggctcaac gcggggaagg ggtga 2325

<210> 4
<211> 774
<212> PRT
<213> Artificial Sequence

<220>
<223> DNA polymerase from Thermococcus celer

<400> 4

Met Ile Leu Asp Ala Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Val
1 5 10 15

Arg Ile Phe Arg Lys Glu Lys Gly Glu Phe Arg Ile Asp Tyr Asp Arg
20 25 30

Asp Phe Glu Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45

Glu Glu Val Lys Arg Ile Thr Val Glu Arg His Gly Lys Ala Val Arg
50 55 60

Val Lys Arg Val Glu Lys Val Glu Lys Lys Phe Leu Asn Arg Pro Ile
65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile
85 90 95

Arg Asp Glu Ile Arg Lys His Pro Ala Val Val Asp Ile Tyr Glu Tyr
100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125

Met Glu Gly Glu Glu Glu Leu Lys Leu Met Ala Phe Asp Ile Glu Thr
130 135 140

Leu Tyr His Glu Gly Asp Glu Phe Gly Glu Gly Pro Ile Leu Met Ile
145 150 155 160

Ser Tyr Ala Asp Gly Asp Gly Ala Arg Val Ile Thr Trp Lys Lys Ile
165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys
180 185 190

Arg Phe Leu Gln Val Val Lys Glu Lys Asp Pro Asp Val Leu Val Thr
195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Arg Arg Ser Glu
210 215 220

Glu Leu Gly Leu Lys Phe Ile Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Val Asn Leu Pro Thr
260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Arg Pro Lys Glu
275 280 285

Lys Val Tyr Ala Gly Glu Ile Val Glu Ala Trp Glu Thr Gly Glu Gly
290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Phe
305 310 315 320

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335

Ile Gly Gln Gly Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365

Pro Asn Lys Pro Ser Gly Arg Glu Val Glu Ile Arg Arg Arg Gly Tyr
370 375 380

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Glu Asn Tyr Asp
420 425 430

Val Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445

Ile Pro Ser Leu Leu Gly Gly Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460

Arg Arg Met Lys Ala Ser Val Asp Pro Val Glu Arg Lys Leu Leu Asp
465 470 475 480

Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr
485 490 495

Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Arg Glu Cys Ala Glu Ser
500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Asp Arg Val Ile Arg Glu Leu
515 520 525

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu
530 535 540

His Ala Thr Ile Pro Gly Ala Asp Ala Gly Thr Val Lys Glu Arg Ala
545 550 555 560

Arg Gly Phe Leu Arg Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu
565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Leu Arg Gly Phe Phe Val Thr Lys Lys
580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Val Ala Lys Glu Thr Gln Ala
610 615 620

Arg Val Leu Glu Ala Ile Leu Arg His Gly Asp Val Glu Glu Ala Val
625 630 635 640

Arg Ile Val Arg Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp
660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Gly
675 680 685

Arg Gly Val Arg Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700

Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720

Asp Pro Thr Lys His Arg Tyr Asp Ala Asp Tyr Tyr Ile Glu Asn Gln
725 730 735

Val Leu Pro Ala Val Glu Arg Ile Leu Lys Ala Phe Gly Tyr Arg Lys
740 745 750

Glu Asp Leu Lys Tyr Gln Lys Thr Arg Gln Val Gly Leu Gly Ala Trp
755 760 765

Leu Asn Ala Gly Lys Gly
770

<210> 5
<211> 2328
<212> DNA
<213> Artificial Sequence

<220>
<223> DNA polymerase from Thermococcus siculi

<400> 5
atgatcctcg acacggacta catcacggaa gatgggaaac ccgtcataag gatattcaag 60

aaagagaacg gcgagttcaa gatcgagtac gacaggactt ttgaacccta catctacgcc 120

ctcctgaagg acgactccgc gattgaggat gttaaaaaga taaccgccga gaggcacgga 180

acggtggtga aggtcaagcg cgccgaaaag gtgcagaaga agttcctagg caggccggtt 240

gaagtctgga agctctactt cacccacccc caagatgtcc cggcgataag ggacaagatt 300

aggaagcatc cagctgtaat tgacatctac gagtacgaca taccattcgc caagcgctac 360

ctcatcgaca agggcctgat tccgatggag ggtgaagaag agcttaagat gctcgccttc 420

gacattgaga cgctctacca tgagggtgag gagttcgccg aggggcctat tctgatgata 480

agctacgccg acgagagcga ggcacgcgtc atcacctgga agaaaatcga cctcccctac 540

gttgacgtcg tctcaacgga gaaggagatg ataaagcgct tcctccgcgt tgtgaaggag 600

aaagatcccg atgtcctcat aacctacaac ggcgacaact tcgacttcgc ctacctgaag 660

aagcgctgtg aaaagcttgg aataaacttc ctccttggaa gggacgggag cgagccgaag 720

atccagagaa tgggtgaccg cttcgccgtt gaggtgaagg ggaggataca cttcgacctc 780

tatcctgtaa taaggcgcac gataaacctg ccgacctaca tgcttgaggc agtctacgag 840

gccatctttg ggaagccaaa ggagaaggtt tacgccgagg agatagccac cgcttgggaa 900

accggagagg gccttgagag ggtggctcgc tactctatgg aggacgcgaa ggtcacgttt 960

gagcttggaa aggagttctt cccgatggag gcccaacttt cgaggttggt cggccagagc 1020

ttctgggatg tcgcgcgctc aagcacgggc aatctggtcg agtggttcct cctcaggaag 1080

gcctacgaga ggaacgagct ggctccaaac aagccctctg gaagggaata tgacgagagg 1140

cgcggtggat acgccggcgg ctacgtcaag gaaccggaaa agggcctgtg ggagaacata 1200

gtctacctcg actataaatc tctctacccc tcaatcatca tcacccacaa cgtctcgccc 1260

gataccctca accgcgaggg ctgtaaggag tatgacgtag ctccacaggt cggccaccgc 1320

ttctgcaagg actttccagg cttcatcccg agcctgctcg gggatctcct ggaggagagg 1380

cagaagataa agaggaagat gaaggcaaca attgacccga tcgagagaaa gctccttgat 1440

tacaggcaac gggccatcaa gatccttcta aatagttttt acggctacta cggctacgca 1500

agggctcgct ggtactgcaa ggagtgtgcc gagagcgtta cggcatgggg aagggaatat 1560

atcaccatga caatcaggga aatagaagag aagtatggct ttaaagtact ttatgcggac 1620

actgacggct tcttcgcgac gattcccggg gaagatgccg agaccatcaa aaagagggcg 1680

atggagttcc tcaagtacat aaacgccaaa ctccccggtg cgctcgaact tgagtacgag 1740

gacttctaca ggcgcggctt cttcgtcacc aagaagaaat acgcggttat cgacgaggag 1800

ggcaagataa caacgcgcgg gctggagatc gtcaggcgcg actggagcga gatagccaag 1860

gagacgcagg cgcgggttct ggaggccctt ctgaaggacg gtgacgtcga agaggccgtg 1920

agcatagtca aagaagtgac cgagaagctg agcaagtacg aggttccgcc ggagaagctc 1980

gttatccacg agcagataac gcgcgagctg aaggactaca aggcaacggg accacacgtg 2040

gcgatagcga agaggttagc cgcgagaggc gtcaaaatcc gccccgggac agtcatcagc 2100

tacatcgtgc tcaagggctc cgggaggata ggcgacaggg cgattccctt cgacgagttc 2160

gaccccacga agcacaagta cgatgcagag tactacatcg agaaccaggt tctacctgcc 2220

gtcgagagga ttctgaaggc cttcggctat cgcggtgagg agctcagata ccagaagacg 2280

aggcaggttg gacttggggc gtggctgaag ccgaagggga aggggtga 2328

<210> 6
<211> 775
<212> PRT
<213> Artificial Sequence

<220>
<223> DNA polymerase from Thermococcus siculi

<400> 6

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15

Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30

Thr Phe Glu Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45

Glu Asp Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Lys
50 55 60

Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95

Arg Asp Lys Ile Arg Lys His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125

Met Glu Gly Glu Glu Glu Leu Lys Met Leu Ala Phe Asp Ile Glu Thr
130 135 140

Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160

Ser Tyr Ala Asp Glu Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile
165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys
180 185 190

Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220

Lys Leu Gly Ile Asn Phe Leu Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270

Tyr Met Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285

Lys Val Tyr Ala Glu Glu Ile Ala Thr Ala Trp Glu Thr Gly Glu Gly
290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Phe
305 310 315 320

Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335

Val Gly Gln Ser Phe Trp Asp Val Ala Arg Ser Ser Thr Gly Asn Leu
340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365

Pro Asn Lys Pro Ser Gly Arg Glu Tyr Asp Glu Arg Arg Gly Gly Tyr
370 375 380

Ala Gly Gly Tyr Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn Ile
385 390 395 400

Val Tyr Leu Asp Tyr Lys Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430

Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460

Arg Lys Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480

Tyr Arg Gln Arg Ala Ile Lys Ile Leu Leu Asn Ser Phe Tyr Gly Tyr
485 490 495

Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Arg Glu Ile
515 520 525

Glu Glu Lys Tyr Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Phe
530 535 540

Phe Ala Thr Ile Pro Gly Glu Asp Ala Glu Thr Ile Lys Lys Arg Ala
545 550 555 560

Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575

Leu Glu Tyr Glu Asp Phe Tyr Arg Arg Gly Phe Phe Val Thr Lys Lys
580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620

Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Glu Ala Val
625 630 635 640

Ser Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Glu Leu Lys Asp
660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Ile Ala Lys Arg Leu Ala Ala
675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700

Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720

Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735

Val Leu Pro Ala Val Glu Arg Ile Leu Lys Ala Phe Gly Tyr Arg Gly
740 745 750

Glu Glu Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Gly Ala Trp
755 760 765

Leu Lys Pro Lys Gly Lys Gly
770 775

<210> 7
<211> 774
<212> PRT
<213> Artificial Sequence

<220>
<223> DNA polymerase from Thermococcus kodakarensis

<400> 7

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15

Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30

Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45

Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr
50 55 60

Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95

Arg Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125

Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe Asp Ile Glu Thr
130 135 140

Leu Tyr Glu Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160

Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val
165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys
180 185 190

Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220

Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285

Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320

Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335

Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365

Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg Arg Gln Ser Tyr
370 375 380

Glu Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430

Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460

Lys Lys Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480

Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Tyr Tyr Gly Tyr
485 490 495

Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile
515 520 525

Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540

Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560

Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Glu Arg Gly Phe Phe Val Thr Lys Lys
580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620

Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640

Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700

Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720

Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735

Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750

Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Trp
755 760 765

Leu Lys Pro Lys Gly Thr
770

<210> 8
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 8
tagaattgaa gaa 13

<210> 9
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 9
tggccatagc tac 13

<210> 10
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 10
gtcatctgcg acc 13

<210> 11
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 11
ttcgcgcttg gac 13

<210> 12
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 12
cgcgaaccgt tag 13

<210> 13
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 13
ttgcagcctc taa 13

<210> 14
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 14
tctactagta cga 13

<210> 15
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 15
gtaggttcta ctg 13

<210> 16
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 16
gccaatatca agt 13

<210> 17
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 17
ctatcttgct ggt 13

<210> 18
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 18
gttctcatag gta 13

<210> 19
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 19
gtctatgaac caa 13

<210> 20
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 20
cggagcgctt att 13

<210> 21
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 21
tatgccatga gga 13

<210> 22
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 22
atacgactcg gag 13

<210> 23
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 23
gatggaactc agc 13

<210> 24
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 24
ggacctgcat gaa 13

<210> 25
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 25
tagactggaa ctt 13

<210> 26
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 26
gaattacctc gtt 13

<210> 27
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 27
aggatcaggc tac 13

<210> 28
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 28
acgcgtagaa gag 13

<210> 29
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 29
cttcgagact tac 13

<210> 30
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 30
gacggctaac tcc 13

<210> 31
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 31
ttagcattct ctt 13

<210> 32
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 32
gcaaggcata gta 13

<210> 33
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 33
acctagatat gga 13

<210> 34
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 34
acgccaaggc gta 13

<210> 35
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 35
tatgacggat ccg 13

<210> 36
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 36
cctccattag aga 13

<210> 37
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 37
attgaatact ctg 13

<210> 38
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 38
gagatgagaa gaa 13

<210> 39
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 39
tctgagtagc cgg 13

<210> 40
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 40
aataggtagt acg 13

<210> 41
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 41
gtcgaagaag tcc 13

<210> 42
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 42
tactgcatct cgt 13

<210> 43
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 43
gacgtattag agc 13

<210> 44
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 44
cctgcattat tcg 13

<210> 45
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 45
acgaatgatg ctc 13

<210> 46
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 46
tactagcaga gat 13

<210> 47
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 47
ctcctcatct tcc 13

<210> 48
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 48
tcctctgcgc tgc 13

<210> 49
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 49
ccttctcagt ccg 13

<210> 50
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 50
cagcttcata gcg 13

<210> 51
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 51
ttgactctcg cgc 13

<210> 52
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 52
tatcctgagc gat 13

<210> 53
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 53
aacgcctagc cga 13

<210> 54
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 54
ccgaagacgt cat 13

<210> 55
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 55
gagttctcca gat 13

<210> 56
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 56
tgcatccgcg ctt 13

<210> 57
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 57
cctgaactca agt 13

<210> 58
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> sample tag sequence

<400> 58
ggtcgtatgc gta 13

<210> 59
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 59
aggcctctct acc 13

<210> 60
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 60
gtactccatc caa 13

<210> 61
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 61
cagcggacgc gct 13

<210> 62
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 62
atctctctta gca 13

<210> 63
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 63
aagcaataat aat 13

<210> 64
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 64
aaggcgactc cga 13

<210> 65
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 65
acgtctctag gag 13

<210> 66
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 66
ccatcagacc tct 13

<210> 67
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 67
acttaatcgt act 13

<210> 68
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 68
tggaattctc caa 13

<210> 69
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 69
ccatacgatc agg 13

<210> 70
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 70
ttatggagca ata 13

<210> 71
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 71
gctcggcgtt cga 13

<210> 72
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 72
ttggccagtc gct 13

<210> 73
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 73
cagatacgta gag 13

<210> 74
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 74
aatgctatta tcc 13

<210> 75
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 75
gcagcatgcc gat 13

<210> 76
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 76
ggagagttac ctc 13

<210> 77
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 77
gagagtccat gat 13

<210> 78
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 78
caatctattc tga 13

<210> 79
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 79
gctcttagta tcc 13

<210> 80
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 80
ccatagttat ggt 13

<210> 81
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 81
tgcgagatcg aag 13

<210> 82
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 82
agagaagtcg agt 13

<210> 83
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 83
ggtaactcca tat 13

<210> 84
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 84
tgctattcca ggc 13

<210> 85
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 85
aaccgcgagg ctc 13

<210> 86
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 86
ttctagagat acc 13

<210> 87
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 87
ttcgctcaag tat 13

<210> 88
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 88
cagagaaggc gca 13

<210> 89
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 89
tagaattggc ctc 13

<210> 90
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 90
ggccattctc cag 13

<210> 91
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 91
tccaacgcgc gtt 13

<210> 92
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 92
gccgcagatt acg 13

<210> 93
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 93
gcagttcgaa cgc 13

<210> 94
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 94
ttctctctgc agg 13

<210> 95
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 95
taagctacca gcg 13

<210> 96
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 96
ctgcatgagg ttg 13

<210> 97
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 97
ttgcctagcg agg 13

<210> 98
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 98
caactgaatt agg 13

<210> 99
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 99
aagcggtcct ctt 13

<210> 100
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 100
aatggaagga ccg 13

<210> 101
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 101
gagttagtaa gtt 13

<210> 102
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 102
ttcctaattc caa 13

<210> 103
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 103
gttctggttc gct 13

<210> 104
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 104
gttcatctct tcc 13

<210> 105
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 105
attccgagga aga 13

<210> 106
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 106
cttagccgag aga 13

<210> 107
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 107
gtctgctacg ctt 13

<210> 108
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 108
atggcgccgc gca 13

<210> 109
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 109
taattggtta tct 13

<210> 110
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 110
tcggttataa gtc 13

<210> 111
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 111
tgcctgagaa cgt 13

<210> 112
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 112
agatgcggtt aac 13

<210> 113
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 113
atggaatagg cga 13

<210> 114
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 114
agagatgcga tcg 13

<210> 115
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 115
ctccaactaa cgt 13

<210> 116
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 116
gccttgctac tgg 13

<210> 117
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 117
cttcgtctct acg 13

<210> 118
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 118
acgctcatag cct 13

<210> 119
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 119
gtcgaagata agg 13

<210> 120
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 120
gccggagtcc tcg 13

<210> 121
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 121
tatacggcga cct 13

<210> 122
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 122
aggtagatat tcg 13

<210> 123
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 123
ttaaggtact gct 13

<210> 124
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 124
cggatctggt ata 13

<210> 125
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 125
gaggtctcgg agg 13

<210> 126
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 126
ggcatcgatg gac 13

<210> 127
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 127
gatctccgat ata 13

<210> 128
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 128
gattcggaat act 13

<210> 129
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 129
ctgcgatccg gcc 13

<210> 130
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 130
gatccggttg caa 13

<210> 131
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 131
cgtcaggctt gac 13

<210> 132
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 132
tcggcaaggc gag 13

<210> 133
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 133
gaacggcgaa cgc 13

<210> 134
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 134
cctcaagcgg act 13

<210> 135
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 135
gaagccagat ggt 13

<210> 136
<211> 13
<212> DNA
<213> Artificial Sequence

<220>
<223> Sample tag sequence

<400> 136
tgctcatacc aat 13

<210> 137
<211> 51
<212> DNA
<213> Artificial Sequence

<220>
<223> i7 custom index primer (Table 2)

<220>
<221> misc_feature
<222> (25)..(36)
<223> n is a, c, g, or t

<400> 137
caagcagaag acggcatacg agatnnnnnn nnnnnngtct cgtgggctcg g 51

<210> 138
<211> 55
<212> DNA
<213> Artificial Sequence

<220>
<223> i5 custom index primer (Table 2)

<220>
<221> misc_feature
<222> (30)..(41)
<223> n is a, c, g, or t

<400> 138
aatgatacgg cgaccaccga gatctacacn nnnnnnnnnn ntcgtcggca gcgtc 55

<210> 139
<211> 21
<212> DNA
<213> Artificial Sequence

<220>
<223> i7 flow cell primer (Table 3)

<400> 139
caagcagaag acggcatacg a 21

<210> 140
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> i5 flow cell primer (Table 3)

<400> 140
aatgatacgg cgaccaccga 20

<210> 141
<211> 51
<212> DNA
<213> Artificial Sequence

<220>
<223> single_mut for mutagenesis (Table 5)

<220>
<221> misc_feature
<222> (19)..(34)
<223> n is a, c, g, or t

<400> 141
tcggtctgcg cctctagcnn nnnnnnnnnn nnnngtctcg tgggctcgga g 51

<210> 142
<211> 42
<212> DNA
<213> Artificial Sequence

<220>
<223> single_rec primer for recovery (Table 5)

<400> 142
caagcagaag acggcatacg agattcggtc tgcgcctcta gc 42

本開示は以下の実施形態を包含する。
[１] 以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することを含む、少なくとも1つの標的核酸分子に変異を導入するための方法。
[２] 少なくとも1つの標的核酸分子に変異を導入するための方法における、低バイアスDNAポリメラーゼの使用。
[３] 前記の少なくとも1つの標的核酸分子に変異を導入するための方法が、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することを含む、実施形態2記載の使用。
[４] 前記変異が置換変異である、実施形態1～3のいずれかに記載の方法または使用。
[５] 前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、およびシトシンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で変異させる、実施形態1～4のいずれかに記載の方法または使用。
[６] 前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、およびシトシンヌクレオチドを、それぞれ0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で変異させる、実施形態1～5のいずれかに記載の方法または使用。
[７] 前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子中のヌクレオチドの1％～15％、2％～10％、または約8％を変異させる、実施形態1～6のいずれかに記載の方法または使用。
[８] 前記低バイアスDNAポリメラーゼが、1ラウンドの複製当たりに、該少なくとも1つの標的核酸分子中のヌクレオチドの0％～3％、または0％～2％を変異させる、実施形態1～7のいずれかに記載の方法または使用。
[９] 前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子にヌクレオチド類似体を組み込む、実施形態1～8のいずれかに記載の方法または使用。
[１０] 前記低バイアスDNAポリメラーゼが、ヌクレオチド類似体を使用して該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、および／またはシトシンを変異させる、実施形態1～9のいずれかに記載の方法または使用。
[１１] 前記低バイアスDNAポリメラーゼが、グアニン、シトシン、アデニン、および／またはチミンをヌクレオチド類似体と置き換える、実施形態1～10のいずれかに記載の方法または使用。
[１２] 前記低バイアスDNAポリメラーゼが、ヌクレオチド類似体を使用して、グアニンまたはアデニンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で導入する、実施形態1～11のいずれかに記載の方法または使用。
[１３] 前記低バイアスDNAポリメラーゼが、ヌクレオチド類似体を使用して、グアニンまたはアデニンヌクレオチドを、それぞれ0.7～1.3：0.7～1.3の率比で導入する、実施形態1～12のいずれかに記載の方法または使用。
[１４] 前記方法が低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを含み、この低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップがヌクレオチド類似体の存在下で実行され、かつこの少なくとも1つの標的核酸分子を増幅するステップにより該ヌクレオチド類似体を含む少なくとも1つの標的核酸分子が提供される、実施形態9～13のいずれかに記載の方法または使用。
[１５] 前記ヌクレオチド類似体がdPTPである、実施形態9～14のいずれかに記載の方法または使用。
[１６] 前記低バイアスDNAポリメラーゼが、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を導入する、実施形態15記載の方法または使用。
[１７] 前記低バイアスDNAポリメラーゼが、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で導入する、実施形態16記載の方法または使用。
[１８] 前記低バイアスDNAポリメラーゼが、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で導入する、実施形態16または17記載の方法または使用。
[１９] 前記低バイアスDNAポリメラーゼが高忠実度DNAポリメラーゼである、実施形態1～18のいずれかに記載の方法または使用。
[２０] ヌクレオチド類似体の非存在下で、前記高忠実度DNAポリメラーゼが、1ラウンドの複製当たり0.01％未満、0.0015％未満、0.001％未満、0％～0.0015％、または0％～0.001％の変異を導入する、実施形態19記載の方法または使用。
[２１] 前記方法が、ヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを含む、実施形態14または15記載の方法または使用。
[２２] 前記のヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するステップを、低バイアスDNAポリメラーゼを使用して実行する、実施形態21記載の方法または使用。
[２３] 前記方法が変異した少なくとも1つの標的核酸分子を提供し、かつ前記方法が、この変異した少なくとも1つの標的核酸分子を低バイアスDNAポリメラーゼを使用して増幅するさらなるステップをさらに含む、実施形態1～22のいずれかに記載の方法または使用。
[２４] 前記低バイアスDNAポリメラーゼが低鋳型増幅バイアスを有する、実施形態1～23のいずれかに記載の方法または使用。
[２５] 前記低バイアスDNAポリメラーゼが、校正ドメインおよび／またはプロセッシビティ増強ドメインを含む、実施形態1～24のいずれかに記載の方法または使用。
[２６] 前記低バイアスDNAポリメラーゼが、以下a.～h.、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列
の少なくとも400、少なくとも500、少なくとも600、少なくとも700、または少なくとも750個の連続したアミノ酸の断片を含む、実施形態1～25のいずれかに記載の方法または使用。
[２７] 前記低バイアスDNAポリメラーゼが、以下a.～h.、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列
を含む、実施形態26記載の方法または使用。
[２８] 前記低バイアスDNAポリメラーゼが、配列番号2と少なくとも98％同一である配列を含む、実施形態27記載の方法または使用。
[２９] 前記低バイアスDNAポリメラーゼが、配列番号4と少なくとも98％同一である配列を含む、実施形態27記載の方法または使用。
[３０] 前記低バイアスDNAポリメラーゼが、配列番号6と少なくとも98％同一である配列を含む、実施形態27記載の方法または使用。
[３１] 前記低バイアスDNAポリメラーゼが、配列番号7と少なくとも98％同一である配列を含む、実施形態27記載の方法または使用。
[３２] 前記低バイアスDNAポリメラーゼがサーモコッカス目古細菌のポリメラーゼ(thermococcal polymerase)、またはその誘導体である、実施形態1～31のいずれかに記載の方法または使用。
[３３] 前記低バイアスDNAポリメラーゼがサーモコッカス目古細菌のポリメラーゼである、実施形態32記載の方法または使用。
[３４] 前記のサーモコッカス目古細菌のポリメラーゼが、T.コダカレンシス(T.kodakarensis)、T.シクリ(T.siculi)、T.セレル(T.celer)およびT.エスピー(T.sp)KS-1からなる群より選択されるサーモコッカス目古細菌の菌株に由来するものである、実施形態32または33記載の方法または使用。
[３５] 前記の少なくとも1つの標的核酸分子にバーコードを導入することをさらに含む、実施形態1～34のいずれかに記載の方法または使用。
[３６] 前記の少なくとも1つの標的核酸分子にサンプルタグを導入することをさらに含む、実施形態1～35のいずれかに記載の方法または使用。
[３７] サンプルタグ群を使用し、かつ異なるサンプルからの標的核酸分子を該群からの異なるサンプルタグで標識する、実施形態36記載の方法または使用。
[３８] 各サンプルタグが、少なくとも1の低確率変異差または少なくとも3の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態37記載の方法または使用。
[３９] 各サンプルタグが、少なくとも3の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態38記載の方法または使用。
[４０] 各サンプルタグが、3～25、または3～10の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態38または39記載の方法または使用。
[４１] 前記低確率変異がトランスバージョン変異またはインデル変異である、実施形態38～40のいずれかに記載の方法または使用。
[４２] 各サンプルタグが、少なくとも5の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態37～41のいずれかに記載の方法または使用。
[４３] 各サンプルタグが、5～25、または5～10の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態42記載の方法または使用。
[４４] 前記高確率変異がトランジション変異である、実施形態38～43のいずれかに記載の方法または使用。
[４５] 前記サンプルタグ群が、実施形態71～75のいずれかに記載の方法で取得可能である、実施形態37～44のいずれかに記載の方法または使用。
[４６] 前記の少なくとも1つの標的核酸分子の各々にアダプターを導入することをさらに含む、実施形態1～45のいずれかに記載の方法または使用。
[４７] 前記の少なくとも1つの標的核酸分子の3’末端に第1アダプターを導入し、かつ前記の少なくとも1つの標的核酸分子の5’末端に第2アダプターを導入することを含み、該第1アダプターと該第2アダプターは互いにアニーリングできるものとする、実施形態46記載の方法または使用。
[４８] 前記の少なくとも1つの標的核酸分子を、互いに同一でありかつ前記第1アダプターの一部に相補的であるプライマーを使用して増幅する、実施形態47記載の方法または使用。
[４９] 前記第1アダプターが、前記第2アダプターと少なくとも80％、少なくとも90％、少なくとも95％、少なくとも99％、または100％同一である核酸分子に相補的である、実施形態47または48記載の方法または使用。
[５０] 前記プライマーが第2プライマー結合部位を含み、かつ前記方法が前記プライマーを使用して前記の少なくとも1つの標的核酸分子を増幅すること、前記プライマーを除去すること、および該第2プライマー結合部位とアニーリングする第2セットのプライマーを使用して前記の少なくとも1つの標的核酸分子をさらに増幅することを含む、実施形態48または49記載の方法または使用。
[５１] 前記方法が、前記標的核酸分子の各々にバーコード、サンプルタグおよびアダプターを導入することをさらに含む、実施形態1～50のいずれかに記載の方法または使用。
[５２] 前記のバーコード、サンプルタグおよび／またはアダプターを、タグメンテーションにより、または剪断およびライゲーションにより導入する、実施形態1～51のいずれかに記載の方法または使用。
[５３] 前記の少なくとも1つの標的核酸分子が、1 kbp超、1.5 kbp超、2 kbp超、4 kbp超、5 kbp超、7 kbp超、または8 kbp超である、実施形態1～52のいずれかに記載の方法または使用。
[５４] 実施形態1または3～53のいずれかに記載の変異を導入するための方法を含む、少なくとも1つの標的核酸分子の配列を決定するための方法。
[５５] 以下a.～c.のステップ、すなわち、
a.実施形態1または3～53のいずれかに記載の方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b.少なくとも1つの変異した標的核酸分子の領域を配列決定することにより、変異した配列リードを用意するステップ、および
c.変異した配列リードを使用して、少なくとも1つの標的核酸分子の少なくとも一部に対して配列を組み立てるステップ
を含む、実施形態54記載の方法。
[５６] 以下a.～d.のステップ、すなわち
a.実施形態1または3～53のいずれかに記載の方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b.該少なくとも1つの変異した標的核酸分子を断片化および／または増幅することにより、少なくとも1つの断片化および／または増幅された変異標的核酸分子を用意するステップ、
c. 該少なくとも1つの断片化および／または増幅された変異標的核酸分子の領域を配列決定することにより、変異した配列リードを用意するステップ、ならびに
d.変異した配列リードを使用して、該少なくとも1つの標的核酸分子の少なくとも一部に対して配列を組み立てるステップ
を含む、実施形態54記載の方法。
[５７] 実施形態1または3～53のいずれかに記載の変異を導入するための方法を含む、タンパク質を操作するための方法。
[５８] 以下a.～c.のステップ、すなわち
a.実施形態1または3～53のいずれかに記載の方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b. 該少なくとも1つの変異した標的核酸分子をベクターに挿入するステップ、および
c. 該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップ
を含む、実施形態57記載の方法。
[５９] 以下a.～e.のステップ、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意するステップ、および
b.ヌクレオチド類似体の存在下で低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することにより、該ヌクレオチド類似体を含む少なくとも1つの標的核酸分子を用意するステップ、
c.ヌクレオチド類似体の非存在下で該ヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
d. 該少なくとも1つの変異した標的核酸分子をベクターに挿入するステップ、および
e. 該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップ
を含む、実施形態58記載の方法。
[６０] 前記方法が、前記の少なくとも1つの変異した標的核酸分子によりコードされるタンパク質の活性を試験するかまたは該タンパク質の構造を評価するステップをさらに含む、実施形態58または59記載の方法。
[６１] 前記ベクターがプラスミド、ウイルス、コスミド、または人工染色体である、実施形態58～60のいずれかに記載の方法。
[６２] 前記の少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップが、前記ベクターを用いて細菌細胞を形質転換すること、真核細胞をトランスフェクトすること、または真核細胞に形質導入することにより達成される、実施形態58～61のいずれかに記載の方法。
[６３] サンプルタグ群であって、各サンプルタグが、少なくとも1の低確率変異差または少なくとも3の高確率変異差により該群の実質的に全ての他のサンプルタグと異なっている、該サンプルタグ群。
[６４] 各サンプルタグが、少なくとも3の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態63記載のサンプルタグ群。
[６５] 各サンプルタグが、3～25、または3～10の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態63または64記載のサンプルタグ群。
[６６] 前記低確率変異がトランスバージョン変異またはインデル変異である、実施形態63～65のいずれかに記載のサンプルタグ群。
[６７] 各サンプルタグが、少なくとも5の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態63～66のいずれかに記載のサンプルタグ群。
[６８] 各サンプルタグが、5～25、または5～10の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、実施形態63～67のいずれかに記載のサンプルタグ群。
[６９] 前記高確率変異がトランジション変異である、実施形態63～68のいずれかに記載のサンプルタグ群。
[７０] 各サンプルタグが、少なくとも8ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも12ヌクレオチド長、8～50ヌクレオチド長、10～50ヌクレオチド長、または10～50ヌクレオチド長である、実施形態63～69のいずれかに記載のサンプルタグ群。
[７１] 以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子に変異を導入するための方法を解析し、かつこの少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数を決定すること、および
b.少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数より多い低確率差により各サンプルタグがサンプルタグ群の実質的に全てのサンプルタグと異なっている該群について、配列を決定すること
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法における使用に適したサンプルタグ群を設計するための方法。
[７２] 以下a.(i)および(ii)、すなわち
a.(i)前記の少なくとも1つの標的核酸分子に変異を導入するための方法を解析し、かつこの少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる高確率変異の平均数を決定すること、および
(ii)前記の少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる高確率変異の平均数より多い高確率差により、各サンプルタグがサンプルタグ群の実質的に全てのサンプルタグと異なっている該群について、配列を決定すること
をさらに含む、実施形態71記載の方法。
[７３] 前記低確率変異がトランスバージョン変異またはインデル変異である、実施形態71または72記載の方法。
[７４] 前記高確率変異がトランジション変異である、実施形態72～73のいずれかに記載の方法。
[７５] コンピュータにより実装される方法である、実施形態71～74のいずれかに記載の方法。
[７６] 前記の低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを、不均一濃度のdNTPを使用して実行する、実施形態1～75のいずれかに記載の方法または使用。
[７７] 以下(i)または(ii)である、すなわち
(i)前記方法がヌクレオチド類似体の非存在下で、ヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを含み、かつこのヌクレオチド類似体の非存在下で、ヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを不均一濃度のdNTPを使用して実行するか、または
(ii)前記方法が変異した少なくとも1つの標的核酸分子を提供し、前記方法がこの変異した少なくとも1つの標的核酸分子を前記低バイアスDNAポリメラーゼを使用して増幅するさらなるステップを含み、かつこの変異した少なくとも1つの標的核酸分子を前記低バイアスDNAポリメラーゼを使用して増幅するさらなるステップを不均一濃度のdNTPを使用して実行する、
実施形態1～76のいずれかに記載の方法。
[７８] 以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.DNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅することにより、この少なくとも1つの標的核酸分子に変異を導入して変異した少なくとも1つの標的核酸分子を用意すること、
ここでステップb.は不均一濃度のdNTPを使用して実行するものとする、
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法。
[７９] ステップb.をヌクレオチド類似体の存在下で実行する、実施形態78記載の方法。
[８０] 前記ヌクレオチド類似体がdPTPである、実施形態79記載の方法。
[８１] 前記方法が、ヌクレオチド類似体の非存在下で、前記の変異した少なくとも1つの標的核酸分子を増幅するさらなるステップc.を含む、実施形態79または80記載の方法。
[８２] ステップc.を不均一濃度のdNTPを使用して実行する、実施形態81記載の方法。
[８３] 不均一濃度のdNTPを使用することにより、導入する変異のプロファイルを変更する、実施形態76～82のいずれかに記載の方法。
[８４] 不均一濃度のdNTPを使用することにより、導入する変異のプロファイルにおけるバイアスを低減する、実施形態83記載の方法。
[８５] 前記方法が、低バイアス変異プロファイルで変異を導入するための方法である、実施形態1～84のいずれかに記載の方法。
[８６] 前記の不均一濃度のdNTPがdATP、dCTP、dTTPおよびdGTPを含み、かつdATP、dCTP、dTTPまたはdGTPのうちの1つまたは2つが他のdNTPと比較してより低い濃度である、実施形態76～85のいずれかに記載の方法。
[８７] 不均一濃度のdNTPの使用が、導入する変異のプロファイルにおけるバイアスを低減するためにそのレベルを増大または減少させるべきdNTPを同定するステップを含む、実施形態76～86のいずれかに記載の方法。
[８８] 前記の不均一濃度のdNTPが、他のdNTPより低い濃度のdTTPを含む、実施形態76～87のいずれかに記載の方法。
[８９] 前記の不均一濃度のdNTPが、dATP、dCTPまたはdGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdTTPを含む、実施形態88記載の方法。
[９０] 前記の不均一濃度のdNTPが、dCTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdTTPを含む、実施形態89記載の方法。
[９１] 前記の不均一濃度のdNTPが、dCTPの濃度の60％未満の濃度のdTTPを含む、実施形態90記載の方法。
[９２] 前記の不均一濃度のdNTPが、dCTPの濃度の25％～60％の濃度のdTTPを含む、実施形態87記載の方法。
[９３] 前記のヌクレオチド類似体の非存在下で、ヌクレオチド類似体を含む少なくとも1つの標的核酸分子を増幅するステップ、またはヌクレオチド類似体の非存在下で、変異した少なくとも1つの標的核酸分子を増幅するステップを、不均一濃度のdNTPを使用して実行する、実施形態77、または81～92のいずれかに記載の方法。
[９４] 前記の不均一濃度のdNTPが、他のdNTPと比較してより低い濃度のdATPを含む、実施形態93記載の方法。
[９５] 前記の不均一濃度のdNTPが、dTTP、dCTPまたはdGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdATPを含む、実施形態94記載の方法。
[９６] 前記の不均一濃度のdNTPが、dGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdATPを含む、実施形態95記載の方法。
[９７] 前記の不均一濃度のdNTPが、dGTPの濃度の60％未満の濃度のdATPを含む、実施形態96記載の方法。
[９８] 前記の不均一濃度のdNTPが、dGTPの濃度の25％～60％の濃度のdATPを含む、実施形態96または97記載の方法。
[９９] 実施形態71～74のいずれかに記載の方法により取得可能なサンプルタグ群。
[１００] 実施形態71～74のいずれかに記載の方法を実施するために構成されたコンピュータ可読媒体。
[１０１] 以下a.～c.、すなわち
a.標的核酸分子を含む少なくとも1つのサンプルを用意すること、
b.標的核酸分子の3’末端に第1アダプターを導入し、かつ標的核酸分子の5’末端に第2アダプターを導入すること、および
c.第1アダプターの一部に相補的であるプライマーを使用して標的核酸分子を増幅すること、
ここで第1アダプターと第2アダプターは互いにアニーリングできるものとする、
を含む、1 kbp長より大きい標的核酸分子を選択的に増幅するための方法。
[１０２] 前記プライマーが互いに同一である、実施形態101記載の方法。
[１０３] 前記第1アダプターが、前記第2アダプターと少なくとも80％、少なくとも90％、少なくとも95％、少なくとも99％、または100％同一である核酸分子に相補的である、実施形態101または102記載の方法。
[１０４] 前記方法が、1.5 kbp長より大きい標的核酸分子を選択的に増幅するための方法である、実施形態101～103のいずれかに記載の方法。
[１０５] 前記標的核酸分子を配列決定するステップをさらに含む、実施形態101～104のいずれかに記載の方法。

Claims

以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することを含む、少なくとも1つの標的核酸分子に変異を導入するための方法。
少なくとも1つの標的核酸分子に変異を導入するための方法における、低バイアスDNAポリメラーゼの使用。
前記の少なくとも1つの標的核酸分子に変異を導入するための方法が、以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することを含む、請求項2記載の使用。
前記変異が置換変異である、請求項1～3のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、およびシトシンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で変異させる、請求項1～4のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、およびシトシンヌクレオチドを、それぞれ0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で変異させる、請求項1～5のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子中のヌクレオチドの1％～15％、2％～10％、または約8％を変異させる、請求項1～6のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、1ラウンドの複製当たりに、該少なくとも1つの標的核酸分子中のヌクレオチドの0％～3％、または0％～2％を変異させる、請求項1～7のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、該少なくとも1つの標的核酸分子にヌクレオチド類似体を組み込む、請求項1～8のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、ヌクレオチド類似体を使用して該少なくとも1つの標的核酸分子中のアデニン、チミン、グアニン、および／またはシトシンを変異させる、請求項1～9のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、グアニン、シトシン、アデニン、および／またはチミンをヌクレオチド類似体と置き換える、請求項1～10のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、ヌクレオチド類似体を使用して、グアニンまたはアデニンヌクレオチドを、それぞれ0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2、または約1：1の率比で導入する、請求項1～11のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、ヌクレオチド類似体を使用して、グアニンまたはアデニンヌクレオチドを、それぞれ0.7～1.3：0.7～1.3の率比で導入する、請求項1～12のいずれか1項に記載の方法または使用。
前記方法が低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを含み、この低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップがヌクレオチド類似体の存在下で実行され、かつこの少なくとも1つの標的核酸分子を増幅するステップにより該ヌクレオチド類似体を含む少なくとも1つの標的核酸分子が提供される、請求項9～13のいずれか1項に記載の方法または使用。
前記ヌクレオチド類似体がdPTPである、請求項9～14のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を導入する、請求項15記載の方法または使用。
前記低バイアスDNAポリメラーゼが、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.5～1.5：0.5～1.5：0.5～1.5：0.5～1.5、0.6～1.4：0.6～1.4：0.6～1.4：0.6～1.4、0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3、0.8～1.2：0.8～1.2：0.8～1.2：0.8～1.2、または約1：1：1：1の率比で導入する、請求項16記載の方法または使用。
前記低バイアスDNAポリメラーゼが、グアニンからアデニンへの置換変異、シトシンからチミンへの置換変異、アデニンからグアニンへの置換変異、およびチミンからシトシンへの置換変異を、それぞれ0.7～1.3：0.7～1.3：0.7～1.3：0.7～1.3の率比で導入する、請求項16または17記載の方法または使用。
前記低バイアスDNAポリメラーゼが高忠実度DNAポリメラーゼである、請求項1～18のいずれか1項に記載の方法または使用。
ヌクレオチド類似体の非存在下で、前記高忠実度DNAポリメラーゼが、1ラウンドの複製当たり0.01％未満、0.0015％未満、0.001％未満、0％～0.0015％、または0％～0.001％の変異を導入する、請求項19記載の方法または使用。
前記方法が、ヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを含む、請求項14または15記載の方法または使用。
前記のヌクレオチド類似体の非存在下でヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するステップを、低バイアスDNAポリメラーゼを使用して実行する、請求項21記載の方法または使用。
前記方法が変異した少なくとも1つの標的核酸分子を提供し、かつ前記方法が、この変異した少なくとも1つの標的核酸分子を低バイアスDNAポリメラーゼを使用して増幅するさらなるステップをさらに含む、請求項1～22のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが低鋳型増幅バイアスを有する、請求項1～23のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、校正ドメインおよび／またはプロセッシビティ増強ドメインを含む、請求項1～24のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、以下a.～h.、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列
の少なくとも400、少なくとも500、少なくとも600、少なくとも700、または少なくとも750個の連続したアミノ酸の断片を含む、請求項1～25のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼが、以下a.～h.、すなわち
a.配列番号2の配列、
b.配列番号2と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
c.配列番号4の配列、
d.配列番号4と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
e.配列番号6の配列、
f.配列番号6と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列、
g.配列番号7の配列、または
h.配列番号7と少なくとも95％、少なくとも98％、もしくは少なくとも99％同一である配列
を含む、請求項26記載の方法または使用。
前記低バイアスDNAポリメラーゼが、配列番号2と少なくとも98％同一である配列を含む、請求項27記載の方法または使用。
前記低バイアスDNAポリメラーゼが、配列番号4と少なくとも98％同一である配列を含む、請求項27記載の方法または使用。
前記低バイアスDNAポリメラーゼが、配列番号6と少なくとも98％同一である配列を含む、請求項27記載の方法または使用。
前記低バイアスDNAポリメラーゼが、配列番号7と少なくとも98％同一である配列を含む、請求項27記載の方法または使用。
前記低バイアスDNAポリメラーゼがサーモコッカス目古細菌のポリメラーゼ(thermococcal polymerase)、またはその誘導体である、請求項1～31のいずれか1項に記載の方法または使用。
前記低バイアスDNAポリメラーゼがサーモコッカス目古細菌のポリメラーゼである、請求項32記載の方法または使用。
前記のサーモコッカス目古細菌のポリメラーゼが、T.コダカレンシス(T.kodakarensis)、T.シクリ(T.siculi)、T.セレル(T.celer)およびT.エスピー(T.sp)KS-1からなる群より選択されるサーモコッカス目古細菌の菌株に由来するものである、請求項32または33記載の方法または使用。
前記の少なくとも1つの標的核酸分子にバーコードを導入することをさらに含む、請求項1～34のいずれか1項に記載の方法または使用。
前記の少なくとも1つの標的核酸分子にサンプルタグを導入することをさらに含む、請求項1～35のいずれか1項に記載の方法または使用。
サンプルタグ群を使用し、かつ異なるサンプルからの標的核酸分子を該群からの異なるサンプルタグで標識する、請求項36記載の方法または使用。
各サンプルタグが、少なくとも1の低確率変異差または少なくとも3の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項37記載の方法または使用。
各サンプルタグが、少なくとも3の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項38記載の方法または使用。
各サンプルタグが、3～25、または3～10の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項38または39記載の方法または使用。
前記低確率変異がトランスバージョン変異またはインデル変異である、請求項38～40のいずれか1項に記載の方法または使用。
各サンプルタグが、少なくとも5の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項37～41のいずれか1項に記載の方法または使用。
各サンプルタグが、5～25、または5～10の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項42記載の方法または使用。
前記高確率変異がトランジション変異である、請求項38～43のいずれか1項に記載の方法または使用。
前記サンプルタグ群が、請求項71～75のいずれか1項に記載の方法で取得可能である、請求項37～44のいずれか1項に記載の方法または使用。
前記の少なくとも1つの標的核酸分子の各々にアダプターを導入することをさらに含む、請求項1～45のいずれか1項に記載の方法または使用。
前記の少なくとも1つの標的核酸分子の3’末端に第1アダプターを導入し、かつ前記の少なくとも1つの標的核酸分子の5’末端に第2アダプターを導入することを含み、該第1アダプターと該第2アダプターは互いにアニーリングできるものとする、請求項46記載の方法または使用。
前記の少なくとも1つの標的核酸分子を、互いに同一でありかつ前記第1アダプターの一部に相補的であるプライマーを使用して増幅する、請求項47記載の方法または使用。
前記第1アダプターが、前記第2アダプターと少なくとも80％、少なくとも90％、少なくとも95％、少なくとも99％、または100％同一である核酸分子に相補的である、請求項47または48記載の方法または使用。
前記プライマーが第2プライマー結合部位を含み、かつ前記方法が前記プライマーを使用して前記の少なくとも1つの標的核酸分子を増幅すること、前記プライマーを除去すること、および該第2プライマー結合部位とアニーリングする第2セットのプライマーを使用して前記の少なくとも1つの標的核酸分子をさらに増幅することを含む、請求項48または49記載の方法または使用。
前記方法が、前記標的核酸分子の各々にバーコード、サンプルタグおよびアダプターを導入することをさらに含む、請求項1～50のいずれか1項に記載の方法または使用。
前記のバーコード、サンプルタグおよび／またはアダプターを、タグメンテーションにより、または剪断およびライゲーションにより導入する、請求項1～51のいずれか1項に記載の方法または使用。
前記の少なくとも1つの標的核酸分子が、1 kbp超、1.5 kbp超、2 kbp超、4 kbp超、5 kbp超、7 kbp超、または8 kbp超である、請求項1～52のいずれか1項に記載の方法または使用。
請求項1または3～53のいずれか1項に記載の変異を導入するための方法を含む、少なくとも1つの標的核酸分子の配列を決定するための方法。
以下a.～c.のステップ、すなわち、
a.請求項1または3～53のいずれか1項に記載の方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b.少なくとも1つの変異した標的核酸分子の領域を配列決定することにより、変異した配列リードを用意するステップ、および
c.変異した配列リードを使用して、少なくとも1つの標的核酸分子の少なくとも一部に対して配列を組み立てるステップ
を含む、請求項54記載の方法。
以下a.～d.のステップ、すなわち
a.請求項1または3～53のいずれか1項に記載の方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b.該少なくとも1つの変異した標的核酸分子を断片化および／または増幅することにより、少なくとも1つの断片化および／または増幅された変異標的核酸分子を用意するステップ、
c. 該少なくとも1つの断片化および／または増幅された変異標的核酸分子の領域を配列決定することにより、変異した配列リードを用意するステップ、ならびに
d.変異した配列リードを使用して、該少なくとも1つの標的核酸分子の少なくとも一部に対して配列を組み立てるステップ
を含む、請求項54記載の方法。
請求項1または3～53のいずれか1項に記載の変異を導入するための方法を含む、タンパク質を操作するための方法。
以下a.～c.のステップ、すなわち
a.請求項1または3～53のいずれか1項に記載の方法を実施することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
b. 該少なくとも1つの変異した標的核酸分子をベクターに挿入するステップ、および
c. 該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップ
を含む、請求項57記載の方法。
以下a.～e.のステップ、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意するステップ、および
b.ヌクレオチド類似体の存在下で低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅することにより、該ヌクレオチド類似体を含む少なくとも1つの標的核酸分子を用意するステップ、
c.ヌクレオチド類似体の非存在下で該ヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅することにより、少なくとも1つの変異した標的核酸分子を用意するステップ、
d. 該少なくとも1つの変異した標的核酸分子をベクターに挿入するステップ、および
e. 該少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップ
を含む、請求項58記載の方法。
前記方法が、前記の少なくとも1つの変異した標的核酸分子によりコードされるタンパク質の活性を試験するかまたは該タンパク質の構造を評価するステップをさらに含む、請求項58または59記載の方法。
前記ベクターがプラスミド、ウイルス、コスミド、または人工染色体である、請求項58～60のいずれか1項に記載の方法。
前記の少なくとも1つの変異した標的核酸分子によりコードされるタンパク質を発現させるステップが、前記ベクターを用いて細菌細胞を形質転換すること、真核細胞をトランスフェクトすること、または真核細胞に形質導入することにより達成される、請求項58～61のいずれか1項に記載の方法。
サンプルタグ群であって、各サンプルタグが、少なくとも1の低確率変異差または少なくとも3の高確率変異差により該群の実質的に全ての他のサンプルタグと異なっている、該サンプルタグ群。
各サンプルタグが、少なくとも3の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項63記載のサンプルタグ群。
各サンプルタグが、3～25、または3～10の低確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項63または64記載のサンプルタグ群。
前記低確率変異がトランスバージョン変異またはインデル変異である、請求項63～65のいずれか1項に記載のサンプルタグ群。
各サンプルタグが、少なくとも5の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項63～66のいずれか1項に記載のサンプルタグ群。
各サンプルタグが、5～25、または5～10の高確率変異差により前記サンプルタグ群の実質的に全ての他のサンプルタグと異なっている、請求項63～67のいずれか1項に記載のサンプルタグ群。
前記高確率変異がトランジション変異である、請求項63～68のいずれか1項に記載のサンプルタグ群。
各サンプルタグが、少なくとも8ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも12ヌクレオチド長、8～50ヌクレオチド長、10～50ヌクレオチド長、または10～50ヌクレオチド長である、請求項63～69のいずれか1項に記載のサンプルタグ群。
以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子に変異を導入するための方法を解析し、かつこの少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数を決定すること、および
b.少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる低確率変異の平均数より多い低確率差により各サンプルタグがサンプルタグ群の実質的に全てのサンプルタグと異なっている該群について、配列を決定すること
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法における使用に適したサンプルタグ群を設計するための方法。
以下a.(i)および(ii)、すなわち
a.(i)前記の少なくとも1つの標的核酸分子に変異を導入するための方法を解析し、かつこの少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる高確率変異の平均数を決定すること、および
(ii)前記の少なくとも1つの標的核酸分子に変異を導入するための方法の最中に生じる高確率変異の平均数より多い高確率差により、各サンプルタグがサンプルタグ群の実質的に全てのサンプルタグと異なっている該群について、配列を決定すること
をさらに含む、請求項71記載の方法。
前記低確率変異がトランスバージョン変異またはインデル変異である、請求項71または72記載の方法。
前記高確率変異がトランジション変異である、請求項72～73のいずれか1項に記載の方法。
コンピュータにより実装される方法である、請求項71～74のいずれか1項に記載の方法。
前記の低バイアスDNAポリメラーゼを使用して該少なくとも1つの標的核酸分子を増幅するステップを、不均一濃度のdNTPを使用して実行する、請求項1～75のいずれか1項に記載の方法または使用。
以下(i)または(ii)である、すなわち
(i)前記方法がヌクレオチド類似体の非存在下で、ヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを含み、かつこのヌクレオチド類似体の非存在下で、ヌクレオチド類似体を含む該少なくとも1つの標的核酸分子を増幅するさらなるステップを不均一濃度のdNTPを使用して実行するか、または
(ii)前記方法が変異した少なくとも1つの標的核酸分子を提供し、前記方法がこの変異した少なくとも1つの標的核酸分子を前記低バイアスDNAポリメラーゼを使用して増幅するさらなるステップを含み、かつこの変異した少なくとも1つの標的核酸分子を前記低バイアスDNAポリメラーゼを使用して増幅するさらなるステップを不均一濃度のdNTPを使用して実行する、
請求項1～76のいずれか1項に記載の方法。
以下a.およびb.、すなわち
a.少なくとも1つの標的核酸分子を含む少なくとも1つのサンプルを用意すること、およびb.DNAポリメラーゼを使用して少なくとも1つの標的核酸分子を増幅することにより、この少なくとも1つの標的核酸分子に変異を導入して変異した少なくとも1つの標的核酸分子を用意すること、
ここでステップb.は不均一濃度のdNTPを使用して実行するものとする、
を含む、少なくとも1つの標的核酸分子に変異を導入するための方法。
ステップb.をヌクレオチド類似体の存在下で実行する、請求項78記載の方法。
前記ヌクレオチド類似体がdPTPである、請求項79記載の方法。
前記方法が、ヌクレオチド類似体の非存在下で、前記の変異した少なくとも1つの標的核酸分子を増幅するさらなるステップc.を含む、請求項79または80記載の方法。
ステップc.を不均一濃度のdNTPを使用して実行する、請求項81記載の方法。
不均一濃度のdNTPを使用することにより、導入する変異のプロファイルを変更する、請求項76～82のいずれか1項に記載の方法。
不均一濃度のdNTPを使用することにより、導入する変異のプロファイルにおけるバイアスを低減する、請求項83記載の方法。
前記方法が、低バイアス変異プロファイルで変異を導入するための方法である、請求項1～84のいずれか1項に記載の方法。
前記の不均一濃度のdNTPがdATP、dCTP、dTTPおよびdGTPを含み、かつdATP、dCTP、dTTPまたはdGTPのうちの1つまたは2つが他のdNTPと比較してより低い濃度である、請求項76～85のいずれか1項に記載の方法。
不均一濃度のdNTPの使用が、導入する変異のプロファイルにおけるバイアスを低減するためにそのレベルを増大または減少させるべきdNTPを同定するステップを含む、請求項76～86のいずれか1項に記載の方法。
前記の不均一濃度のdNTPが、他のdNTPより低い濃度のdTTPを含む、請求項76～87のいずれか1項に記載の方法。
前記の不均一濃度のdNTPが、dATP、dCTPまたはdGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdTTPを含む、請求項88記載の方法。
前記の不均一濃度のdNTPが、dCTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdTTPを含む、請求項89記載の方法。
前記の不均一濃度のdNTPが、dCTPの濃度の60％未満の濃度のdTTPを含む、請求項90記載の方法。
前記の不均一濃度のdNTPが、dCTPの濃度の25％～60％の濃度のdTTPを含む、請求項87記載の方法。
前記のヌクレオチド類似体の非存在下で、ヌクレオチド類似体を含む少なくとも1つの標的核酸分子を増幅するステップ、またはヌクレオチド類似体の非存在下で、変異した少なくとも1つの標的核酸分子を増幅するステップを、不均一濃度のdNTPを使用して実行する、請求項77、または81～92のいずれか1項に記載の方法。
前記の不均一濃度のdNTPが、他のdNTPと比較してより低い濃度のdATPを含む、請求項93記載の方法。
前記の不均一濃度のdNTPが、dTTP、dCTPまたはdGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdATPを含む、請求項94記載の方法。
前記の不均一濃度のdNTPが、dGTPの濃度の75％未満、70％未満、60％未満、55％未満、25％～75％、25％～70％、25％～60％、または約50％の濃度のdATPを含む、請求項95記載の方法。
前記の不均一濃度のdNTPが、dGTPの濃度の60％未満の濃度のdATPを含む、請求項96記載の方法。
前記の不均一濃度のdNTPが、dGTPの濃度の25％～60％の濃度のdATPを含む、請求項96または97記載の方法。
請求項71～74のいずれか1項に記載の方法により取得可能なサンプルタグ群。
請求項71～74のいずれか1項に記載の方法を実施するために構成されたコンピュータ可読媒体。
以下a.～c.、すなわち
a.標的核酸分子を含む少なくとも1つのサンプルを用意すること、
b.標的核酸分子の3’末端に第1アダプターを導入し、かつ標的核酸分子の5’末端に第2アダプターを導入すること、および
c.第1アダプターの一部に相補的であるプライマーを使用して標的核酸分子を増幅すること、
ここで第1アダプターと第2アダプターは互いにアニーリングできるものとする、
を含む、1 kbp長より大きい標的核酸分子を選択的に増幅するための方法。
前記プライマーが互いに同一である、請求項101記載の方法。
前記第1アダプターが、前記第2アダプターと少なくとも80％、少なくとも90％、少なくとも95％、少なくとも99％、または100％同一である核酸分子に相補的である、請求項101または102記載の方法。
前記方法が、1.5 kbp長より大きい標的核酸分子を選択的に増幅するための方法である、請求項101～103のいずれか1項に記載の方法。
前記標的核酸分子を配列決定するステップをさらに含む、請求項101～104のいずれか1項に記載の方法。