JP2023516827A

JP2023516827A - 高配列忠実度の核酸合成およびアセンブリ

Info

Publication number: JP2023516827A
Application number: JP2022578942A
Authority: JP
Inventors: ロバートポッター; ニコライネトゥシル
Original assignee: ライフテクノロジーズコーポレイション; サーモフィッシャーサイエンティフィックジーンアートゲゼルシャフトミットベシュレンクテルハフツング
Priority date: 2020-03-06
Filing date: 2021-03-05
Publication date: 2023-04-20
Also published as: EP4114972A1; US20240025939A1; WO2021178809A1; WO2021178809A9; CN115244189A

Abstract

本開示は、概して、低エラー率を有する核酸分子の合成のための組成物および方法に関する。例として、多くの場合では、高配列忠実度を有する核酸分子のハイスループット合成およびアセンブリのための組成物および方法が提供される。多くの場合では、熱安定性不一致認識タンパク質（例えば、熱安定性不一致結合タンパク質、熱安定性不一致エンドヌクレアーゼ）が組成物中に存在し、提供される方法を使用する。【選択図】図２

Description

本開示は、概して、低エラー率を有する核酸分子の合成のための組成物および方法に関する。例として、多くの場合では、高配列忠実度を有する核酸分子のハイスループット合成およびアセンブリのための組成物および方法が提供される。多くの場合では、熱安定性不一致認識タンパク質（例えば、熱安定性不一致結合タンパク質、熱安定性不一致エンドヌクレアーゼ）が組成物中に存在し、提供される方法を使用する。

長年にわたり、遺伝子合成は、より費用対効果が高くなり、産生される核酸分子が高配列忠実度を有するハイスループット合成プラットフォームを開発する努力がなされてきた。

高配列忠実度を有する産生される核酸分子を生成するためのプロセスにおいて使用され得る生物学的物質は、これらの物質を産生する生物とともに進化してきた。かかる生物学的物質には、プルーフリーディング能力を有するＤＮＡポリメラーゼ、および核酸配列エラーの訂正のための様々な経路に関与する物質（例えば、不一致エンドヌクレアーゼ、不一致結合タンパク質など）が含まれる。

遺伝子工学の進歩に伴い、より大きな核酸分子の生成が必要になってきた。多くの場合では、核酸アセンブリ方法は、比較的短い核酸分子の合成（例えば、化学合成されたオリゴヌクレオチド）から始まり、続いて二本鎖断片または亜アセンブリの生成（例えば、複数の重複オリゴヌクレオチドのアニーリングおよび伸長による）、そして多くの場合では、遺伝子、オペロン、さらには機能的な生物学的経路などのより大きなアセンブリの構築に進む（例えば、ライゲーション、酵素的伸長、組換え、またはそれらの組み合わせによる）。本開示は、概して、高配列忠実度を有する核酸分子のアセンブリのための組成物および方法に関する。

本開示は、部分的に、高ヌクレオチド配列忠実度を有する核酸分子のアセンブリ（例えば、アセンブリＰＣＲによる）および増幅のための組成物および方法に関する。本明細書に記載の組成物および方法は、エラーを含有する核酸分子を検出および／または除去し得るタンパク質（例えば、ＤＮＡポリメラーゼ、不一致エンドヌクレアーゼ、不一致結合タンパク質など）を含有し得るか、または用い得る。

いくつかの態様では、本明細書において提供されるのは、核酸分子のエラー訂正された集団を生成するための方法である。かかる方法は、（ａ）一次アセンブリＰＣＲによって、末端配列相補性の領域（ハイブリダイゼーション時に、約１０～約３０、約１２～約３０、約１５～約３０、約２０～約３０、約１５～約４０、約６～約２０、約８～約２５などの塩基対長の二本鎖領域を形成する一本鎖領域）を有するオリゴヌクレオチドをアセンブルして、アセンブルされた核酸分子の集団を形成すること、および（ｂ）ステップ（ａ）において形成されたアセンブルされた核酸分子の集団を一次増幅によって増幅して、増幅されたアセンブルされた核酸分子の集団を形成すること、を含み得る。いくつかの場合では、増幅されたアセンブルされた核酸分子の集団は、１，０００塩基対当たり２つ未満のエラーを含有し得る（例えば、１，０００塩基対当たり、約２～約０．０１、約２～約０．０５、約２～約０．０８、約２～約０．１、約２～約０．５、約２～約０．７５、約１～約０．０１、約１～約０．０５、約１～約０．１、約２～約０．００１、約１～約０．００１、約０．５～約０．００１、約０．１～約０．００１などのエラー）。いくつかの場合では、上記のステップ（ａ）および／または（ｂ）は、１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）の熱安定性不一致認識タンパク質の存在下で実施され得る。いくつかの態様では、１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つは、例えば、表１３または表１５に記載のアミノ酸配列を有する不一致結合タンパク質から選択される熱安定性不一致結合タンパク質などの熱安定性不一致結合タンパク質である。いくつかの態様では、１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つは、表１２または表１５に記載のアミノ酸配列を有する不一致エンドヌクレアーゼから選択される不一致エンドヌクレアーゼなどの熱安定性不一致エンドヌクレアーゼである（例えば、ＴｋｏＥｎｄｏＭＳ、ＰｆｕＥｎｄｏＭＳなど）。

いくつかの場合では、本明細書に記載の方法において高忠実度ＤＮＡポリメラーゼが使用され得る。さらにより特定の場合では、高忠実度ＤＮＡポリメラーゼは、核酸分子のエラー訂正された集団を生成するための上記方法において記載されたステップ（ａ）および／または（ｂ）において使用され得る。さらに、高忠実度ＤＮＡポリメラーゼは、エラー低減ポリメラーゼ試薬の構成要素であり得る。エラー低減ポリメラーゼ試薬は、（ａ）ジメチルアミン塩酸塩、（ｂ）ジイソプロピルアミン塩酸塩、（ｃ）エチル（メチル）アミン塩酸塩、（ｄ）トリメチルアミン塩酸塩からなる群から選択される１つ以上のアミン化合物などの１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）のアミン化合物を含み得る。

本明細書に記載の方法の特定のバリエーション、および核酸分子のエラー訂正された集団を生成するための上記の方法では、１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つは、ステップ（ａ）に存在し得る。さらに、いくつかの場合では、１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つは、ステップ（ｂ）に存在し得る。さらに、１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）のエラー訂正ステップは、一次増幅後に実施され得る。増幅されたアセンブルされた核酸分子の集団の一次後増幅は、ステップ（ｂ）の後に実施され得る。いくつかの場合では、増幅されたアセンブルされた核酸分子の集団を、一次後増幅の前に、１つ以上の不一致認識タンパク質と接触させ得る。加えて、１つ以上の不一致認識タンパク質のうちの少なくとも１つは、１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）の非熱安定性不一致エンドヌクレアーゼ（例えば、Ｔ７エンドヌクレアーゼＩ、ＣＥＬＩＩヌクレアーゼ、ＣＥＬＩヌクレアーゼ、および／またはＴ４エンドヌクレアーゼＶＩＩ）などの不一致エンドヌクレアーゼであり得る。

本明細書に記載の方法はまた、より大きな核酸分子の亜断片を含む、増幅されたアセンブルされた核酸分子の集団の生成に関する。さらに、いくつかの場合では、かかる増幅されたアセンブルされた核酸分子の集団は、より大きな核酸分子の亜断片でもある１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）の追加の核酸分子と組み合わされて、核酸分子プールを形成し得る。いくつかの場合では、かかる核酸分子プールの核酸分子は、二次アセンブリＰＣＲによってアセンブルされて、より大きな核酸分子を形成し得る。いくつかの場合では、亜断片を、二次アセンブリＰＣＲによるアセンブリの前またはアセンブリ中に、１つ以上の不一致認識タンパク質と接触させ得る。さらに、より大きな核酸分子は、熱変性され、次いで再生され、続いて１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）の不一致認識タンパク質と接触し得る。さらに、１つ以上の不一致認識タンパク質のうちの少なくとも１つ（例えば、１～１０、１～８、１～５、１～３、１～２など）は、固体支持体に結合された不一致結合タンパク質などの不一致結合タンパク質であり得る。したがって、本明細書に記載の方法は、エラーを含まない核酸分子からエラーを含む核酸分子を分離する方法を含む。いくつかの場合では、増幅されたアセンブルされた核酸分子の集団は、配列決定され得る。かかる配列決定は、エラーが存在するかどうか、存在する場合はエラーの数およびエラーのタイプを決定するために実施され得る。

本明細書で提供されるのは、本明細書に記載の方法において使用され得る組成物などの組成物である。いくつかの場合では、本明細書に記載の組成物は、１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）の熱安定性不一致認識タンパク質、１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）のＤＮＡポリメラーゼ、および１つ以上（例えば、１～１０、１～８、１～５、１～３、１～２など）のアミン化合物を含み得る。さらに、１つ以上のアミン化合物のうちの少なくとも１つは、（ａ）ジメチルアミン塩酸塩、（ｂ）ジイソプロピルアミン塩酸塩、（ｃ）エチル（メチル）アミン塩酸塩、および／または（ｄ）トリメチルアミン塩酸塩からなる群から選択され得る。

本明細書に記載の組成物は、２つ以上の核酸分子をさらに含み得る（例えば、２つ以上の核酸分子は、より大きな核酸分子の亜断片である）。さらに、２つ以上の核酸分子は、一本鎖であり得る。かかる一本鎖核酸分子は、長さは大きく変化し得るが、多くの場合では、１００ヌクレオチド長未満（例えば、約３５～約９０、約３５～約８０、約３５～約７０、約３５～約６５、約４０～約９０、約３０～約６０、約３０～約６５など）の間である。

本明細書に記載の組成物は、２つ以上の核酸分子をさらに含み得、２つ以上の核酸分子のうちの少なくとも１つは、一本鎖であり、２つ以上の核酸分子のうちの少なくとも１つは、二本鎖である。

本明細書に記載のいくつかの組成物では、熱安定性不一致認識タンパク質のうちの少なくとも１つは、表１２または表１５に記載のアミノ酸配列を有する熱安定性不一致エンドヌクレアーゼ（例えば、ＴｋｏＥｎｄｏＭＳ、ＰｆｕＥｎｄｏＭＳなど）などの熱安定性不一致エンドヌクレアーゼ、およびそれらと少なくとも８０％（例えば、少なくとも約８０％～約９９％、約８０％～約９５％、約８０％～約９０％、約８５％～約９５％、約９０％～約９９％、約９２％～約９９％、約９５％～約９９％、約９７％～約９９％など）の配列同一性を有するそれらのバリアントであり得る。

いくつかの特定の場合では、本明細書で提供される組成物および方法は、ＴｋｏＥｎｄｏＭＳ（配列番号３）と少なくとも３０％、４０％、５０％、または６０％（例えば、約３０％～約７０％、約３０％～約６０％、約３０％～約５０％、約３０％～約４５％、約３０％～約４０％など）のアミノ酸配列同一性を共有する不一致特異的エンドヌクレアーゼを含有し得るか、または使用し得る。かかる不一致特異的エンドヌクレアーゼの例は、ＰｉｓＥｎｄｏＭＳ（配列番号１１）またはＳａｃＥｎｄｏＭＳ（配列番号１２）である。

本明細書に記載のいくつかの組成物では、熱安定性不一致認識タンパク質のうちの少なくとも１つは、表１３または表１５に記載のアミノ酸配列を有する熱安定性不一致認識タンパク質などの熱安定性不一致認識タンパク質、およびそれらと少なくとも８０％（例えば、少なくとも約８０％～約９９％、約８０％～約９５％、約８０％～約９０％、約８５％～約９５％、約９０％～約９９％、約９２％～約９９％、約９５％～約９９％、約９７％～約９９％など）の配列同一性を有するそれらのバリアントであり得る。

所定の配列を有する核酸分子を生成する方法もまた、本明細書に記載される。いくつかの場合では、かかる方法は、（ａ）相補的重複領域を有する複数の一本鎖オリゴヌクレオチドを提供することであって、一本鎖オリゴヌクレオチドの各々が標的核酸分子の配列領域を含み、複数の一本鎖オリゴヌクレオチドは、（ｉ）複数において２つの他のオリゴヌクレオチドと重複する配列領域を有する複数の内部オリゴヌクレオチド、ならびに（ｉｉ）全長核酸分子の５’および３’末端に位置するように設計され、複数において内部オリゴヌクレオチドのうちの１つと重複する配列領域を有する、２つの末端オリゴヌクレオチドを含む、提供すること、（ｂ）一次アセンブリＰＣＲによって複数のオリゴヌクレオチドをアセンブルして、アセンブルされた二本鎖核酸アセンブリ産物を得ること、（ｃ）ステップ（ｂ）において得られたアセンブリ産物の少なくとも一部分を一対のプライマーと組み合わせることを含み得る。いくつかの場合では、対のプライマーは、アセンブリ産物の５’および３’末端に結合し、ＰＣＲ増幅反応を実施して増幅されたアセンブリ産物を産生するように設計され得る。さらに、いくつかの場合では、ステップ（ｂ）および／またはステップ（ｃ）は、１つ以上の熱安定性不一致認識タンパク質の存在下で実施され得る。

さらに本明細書で記載されるのは、（ｄ）１つ以上のエラー訂正ステップを実施することをさらに含む、所定の配列を有する核酸分子を生成する方法である。いくつかの場合では、かかるエラー訂正ステップは、（ｉ）ステップ（ｃ）の増幅されたアセンブリ産物を変性および再アニーリングして、二本鎖核酸を含有する１つ以上の不一致を生成すること、（ｉｉ）二本鎖核酸を含有する不一致を、１つ以上の不一致認識タンパク質で処理すること、ならびに（ｉｉｉ）任意選択で、増幅反応を実施することを含み得る。いくつかの場合では、ステップ（ｄ）において使用される不一致認識タンパク質は、不一致エンドヌクレアーゼ（例えば、Ｔ７エンドヌクレアーゼＩ）または不一致結合タンパク質（例えば、ＭｕｔＳ）である。さらに、用いられる熱安定性不一致エンドヌクレアーゼは、超好熱性古細菌に由来し得、任意選択で、超好熱性古細菌は、ＰｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓまたはＰｙｒｏｃｏｃｃｕｓａｂｙｓｓｉである。加えて、熱安定性不一致認識タンパク質は、表１２、１３、または１５に記載のアミノ酸配列を有するタンパク質、およびそれらと少なくとも８０％（例えば、少なくとも約８０％～約９９％、約８０％～約９５％、約８０％～約９０％、約８５％～約９５％、約９０％～約９９％、約９２％～約９９％、約９５％～約９９％、約９７％～約９９％など）の配列同一性を有するそれらのバリアントの群から選択され得る。

いくつかの場合では、用いられる熱安定性不一致認識タンパク質のうちの１つ以上は、インビトロ転写／翻訳によって産生および／または取得され得る。他の場合では、用いられる熱安定性不一致認識タンパク質のうちの１つ以上は、細胞発現によって産生および／または取得され得る。

ポリメラーゼが組成物中に存在し、本明細書に記載の方法において使用される場合、これらのポリメラーゼは、高忠実度ＤＮＡポリメラーゼであり得る。したがって、本明細書で提供されるのは、上に記載の所定の配列を有する核酸分子を生成する方法などの方法であり、ステップ（ｂ）、（ｃ）および（ｄ）（ｉｉｉ）のうちの１つ以上が、高忠実度ＤＮＡポリメラーゼの存在下で実施され、任意選択で、ポリメラーゼは、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ（ＰＨＵＳＩＯＮ（商標））、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ（ＳＵＰＥＲＦＩ（商標）ＩＩ）、Ｑ５ＤＮＡポリメラーゼ、およびＰＲＩＭＥＳＴＡＲＧＸＬＤＮＡポリメラーゼからなる群から選択され得る。加えて、ステップ（ｂ）、（ｃ）および（ｄ）（ｉｉｉ）のうちの１つ以上が、高忠実度ＤＮＡポリメラーゼの存在下で実施され得、任意選択で、ポリメラーゼは、表１４に記載の（１）ＤＮＡポリメラーゼ１、（２）ＤＮＡポリメラーゼ２、（３）ＤＮＡポリメラーゼ３、（４）ＤＮＡポリメラーゼ４、（５）ＤＮＡポリメラーゼ５、（６）ＤＮＡポリメラーゼ６、（７）ＤＮＡポリメラーゼ７からなる群から選択されるアミノ酸配列を有するポリメラーゼである。

例えば、所定の配列を有する核酸分子を生成する上記の方法のいくつかのバリエーションでは、２つ以上の増幅されたアセンブリ産物は、１つ以上のエラー訂正ステップを実施する前にプールされ得る。追加のバリエーションは、１つ以上のエラー訂正ステップの前に、増幅されたアセンブリ産物をエキソヌクレアーゼで処理することをさらに含み得、任意選択で、エキソヌクレアーゼは、エキソヌクレアーゼＩである。

本明細書に記載の主題の特徴および利点のより良い理解は、本明細書に記載の主題の原理が利用される、例示的な実施形態を記載する以下の詳細な説明、および添付の図面を参照することにより得ることができる。

２つの核酸アセンブリワークフローの比較を示す。図１Ａは、オリゴヌクレオチド合成、オリゴヌクレオチドアセンブリＰＣＲ、および亜断片を生成する反応混合物のアセンブリＰＣＲ（まとめて一次アセンブリＰＣＲ）；アセンブリ産物の増幅（一次増幅）；増幅された産物の精製；ヌクレアーゼ処理、一例として、相補的オーバーハングを生成する（例えば、ＩＩｓ型エンドヌクレアーゼ媒介切断によって生成される）；ならびにベクターの挿入および変換のステップを含む、一本鎖重複オリゴヌクレオチドから核酸分子をアセンブリするための標準のワークフローの概略図である。図１Ｂは、本明細書に記載の方法による配列伸長およびライゲーション反応の１つのバリエーションの概略図である。アセンブリＰＣＲ（一次アセンブリＰＣＲ）、増幅（一次増幅）、およびベクター挿入のステップは、単一の密閉容器（例えば、単一の密封チューブ）で実施できるため、かかる反応は、多くの場合「ワンポット」反応として実施される。図１Ｂのワークフローでは、ベクター末端が増幅プライマーとして機能する。核酸分子をアセンブルし、増幅するためのＰＣＲベースのプロセスの概略図である。（ａ）重複するフォワードおよびリバースオリゴヌクレオチドは、第１のＰＣＲサイクルにおいて伸長される。（ｂ）伸長されたアセンブリ産物は互いにアニーリングし、第２のサイクルにおいてさらに伸長される。（ｃ）後続のＰＣＲサイクルにおいてさらなる伸長が起こり、アセンブリ産物が蓄積する。この図のアセンブリプロセスは、本明細書では「一次アセンブリＰＣＲ」（「Ａ」と標識）と称される。２つの末端オリゴヌクレオチド（１）および（２）もユニバーサルプライマーであり得る。さらに、末端オリゴヌクレオチドを一次アセンブリＰＣＲ産物に添加し得る、または一次アセンブリＰＣＲ産物を別のチューブに添加し、次いで末端プライマーと混合し得る。さらに、末端オリゴヌクレオチドの代わりにベクター末端が使用され得る（図１Ｂを参照されたい）。２つの末端オリゴヌクレオチドを使用するこの図の最終増幅ステップは、本明細書では「一次増幅」（「Ｂ」と標識）と称される。エラー訂正された核酸分子合成の例示的なワークフローの概略図である。オリゴヌクレオチドが増幅され、次いでエラーが訂正され、より長い核酸分子にアセンブルされるワークフロー概略図を示す。ＰＣＲによって生成された核酸分子（例えば、以前にアセンブルされた核酸分子）の二重エラー訂正および増幅ベースのアセンブリを含むワークフロー概略図を示す。１つのバリエーション（図５Ａ）では、エラー訂正は、ワークフローにおける２つの位置において１つ以上のエンドヌクレアーゼを使用して実施される。明細書における参照のために、図５Ａには９つのライン番号標識が含まれている。別のバリエーション（図５Ｂ）では、ワークフローにおける２つの異なる位置におけるエラー訂正が、第１のラウンドにおいて１つ以上のエンドヌクレアーゼを使用して実施され、第２ラウンドにおいて不一致結合タンパク質を使用して実施される。図５Ａと同様に、明細書における参照のために、図５Ｂにも９つのライン番号標識が含まれている。不一致を含有しない核酸分子から不一致を含有する核酸分子を分離するために、不一致結合タンパク質を結合させたビーズを用いるワークフローの概略図表示を示す。ＮＭＭは、非不一致核酸分子を指し、ＭＭは、不一致核酸分子を指す。実験により決定された様々な条件を使用して生成されたエラー率データ（合計エラー）を示す。この図に関して、「アセンブリ」という用語は、一次アセンブリＰＣＲを指す（例えば、Ａと標識された図２の上部を参照されたい）。「増幅」という用語は、アセンブルされた核酸分子のプライマーベースの一次増幅を指す（例えば、Ｂと標識された図２下部を参照されたい）。「エラー訂正」という用語は、この場合は二次増幅である、一次後増幅Ｔ７エンドヌクレアーゼＩ（Ｔ７ＮＩ）媒介エラー訂正ステップが実施されたかどうかを指す。「アセンブリ」および「増幅」列の表記は、Ｉｓｈｉｎｏｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．４４：２９７７－２９８９（２０１６））のＴｈｅｒｍｏｃｏｃｃｕｓｋｏｄａｋａｒｅｎｓｉｓ由来の野生型不一致エンドヌクレアーゼ（本明細書では「ＴｋｏＥｎｄｏＭＳ」と称される）が、アセンブリＰＣＲおよび／または増幅中に含まれていたかどうかを示す。「配列決定された断片」と標識された列は、試験された異なる配列を有する断片のセットの数を指す。示されている「エラー率」は、データの平均である。「ベンチマーク」という用語は、別の実験において決定された、同一のオリゴヌクレオチドであるがエラー訂正なしのエラー率を指す。表には、８つのベンチマーク値すべての数値平均も示されている。注：実行番号１～８は、各々、単一の実行、次世代シーケンシングが可能となるようにヌクレオチド配列が異なるオリゴヌクレオチドのセットで実施された。図７のデータを生成するために使用された総エラーデータポイントを示すグラフ表示である。図８の下軸の数字および文字の記述は、図７の左側の２つの列と相関している。各データポイントは、分析された核酸分子集団の各々の塩基対当たりのエラー数を表す。各垂直線上のボックスは、データポイントの半分が該当する垂直線の領域を表す。ボックス内の水平線は中央値を表す。この図は、個々の核酸分子に存在するエラーの総数を示す。したがって、各データ点は、同じヌクレオチド配列を有するように設計された核酸分子の平均エラー数を表す。分析によると、下の軸から離れるほど、存在するエラーの数は少なくなる。図８と同様のグラフ表示であるが、総エラーの代わりに、欠失の数を表す。図８と同様のグラフ表示であるが、総エラーの代わりに、挿入の数を表す。図８と同様のグラフ表示であるが、総エラーの代わりに、置換の数を表す。２つの試料に存在する特定のタイプのエラーを示す。１つの試料（図１２Ａおよび１２Ｂ）では、核酸分子は、アセンブルされ、エラー訂正なしで増幅された。他の試料（図１２Ｃおよび１２Ｄ）では、核酸分子は、アセンブルされ、ＴｋｏＥｎｄｏＭＳエラー訂正を伴い増幅された。どちらの試料でもＴ７ＮＩエラー訂正は、実施されなかった。図１２Ｂおよび１２Ｄに記載の不一致のタイプは、以下のとおりである：ＴＳ１＝Ｇ－Ｔ、Ｃ－Ａ、ＴＳ２＝Ａ－Ｃ、Ｇ－Ｔ、ＴＶ１＝Ｃ－Ｔ、Ｇ－Ａ、ＴＶ２＝Ａ－Ａ、Ｔ－Ｔ、ＴＶ３＝Ｇ－Ｇ、Ｃ－Ｃ、およびＴＶ４＝Ｔ－Ｃ、Ａ－Ｇ。「ＴＳ」は、トランジションを指し、「ＴＶ」は、トランスバージョンを指す。全体的なエラー率は、以下のとおりであった：図１２Ａ－３４９塩基中１つ（標準偏差（ＳＤ）：９９塩基中１つ）および図１２Ｃ－４８８塩基中１つ（ＳＤ：２１０塩基中１つ）。全体の置換率は、以下のとおりであった：図１２Ｂ－６４７．８塩基中１つ、図１２Ｄ－２４２．５塩基中１つ。核酸分子の試料セットが、アセンブルされ、エラー訂正なしおよびＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号Ｆ５３０Ｓ）（Ａ～Ｃ）で増幅された場合、ならびにＴｋｏＥｎｄｏＭＳがアセンブリＰＣＲおよび増幅中に使用され、かつＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号１２３６１０１０）（Ｄ～Ｆ）がアセンブリＰＣＲおよび増幅の両方に使用された場合の生成されたデータを示す。どちらの試料でもＴ７ＮＩエラー訂正は、実施されなかった。２つの試料に存在する特定のタイプのエラーを示す。１つの試料（図１４Ａおよび１４Ｂ）では、核酸分子は、アセンブルされ（一次アセンブリＰＣＲ）、増幅された（エラー訂正なしの一次増幅およびＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ使用。他の試料（図１４Ｃおよび１４Ｄ）では、核酸分子は、アセンブルされ、ＴｋｏＥｎｄｏＭＳエラー訂正およびＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼを伴い増幅された。どちらの試料でもＴ７ＮＩエラー訂正は、実施されなかった。全体的なエラー率は、以下のとおりであった：図１４Ａ－２５１塩基中１つ（標準偏差（ＳＤ）：２５塩基中１つ）および図１４Ｃ－６７０塩基中１つ（ＳＤ：１１２塩基中１つ）。全体の置換率は、以下のとおりであった：図１４Ｂ－４６２．４塩基中１つ、図１４Ｄ－５６５．２塩基中１つ。Ｎ末端シグナルペプチドおよびＣ末端ヒスチジン精製タグを有するＴｋｏＥｎｄｏＭＳのアミノ酸配列（配列番号１）、およびこのタンパク質をコードするコドン最適化核酸分子のヌクレオチド配列（配列番号２）を示す。ＴｈｅｒｍｏｃｏｃｃｕｓｋｏｄａｋａｒｅｎｓｉｓＥｎｄｏＭＳ（本明細書において「ＴｋｏＥｎｄｏＭＳ」と称する）（配列番号３）およびＰｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓＥｎｄｏＭＳ（本明細書において「ＰｆｕＥｎｄｏＭＳ」と称する）（配列番号４）のアミノ酸配列アラインメントを示す。これら２つのタンパク質のアミノ酸配列は、６９％の配列同一性を共有している。ＰＨＵＳＩＯＮ（商標）（「前」）またはＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩ（「後」）ＤＮＡポリメラーゼを使用してアセンブルされた３０個の核酸分子由来のデータを示す。この図は、前対後の個々の断片のエラー率の相対的な変化を示す。個々の断片の実際のエラー率および標準偏差は、前については３３９±５２塩基対（ｂｐｓ）中１つ、後について４４７±８９ｂｐｓ中１つであり、エラー率の平均改善率は、３２．３±２０．１％である。ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼは、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼと比較して、より低いエラー率をもたらすことが示される。図１７Ａと同じデータをエラーのタイプ（削除、挿入、置換）に分けて示す。ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩポリメラーゼは、すべてのエラーのタイプに対して同様のプラスの効果があることが示されている。全体の削除率の変化は、４０．４±５５．１％（１／１１５７±８４０ｂｐｓ～１／１４２９±５４７ｂｐｓ）である。全体の挿入率の変化は、４１．９±９０．６％（１／２８７５±１２０１ｂｐｓ～１／３８０３±２８４１ｂｐｓ）である。全体の置換率の変化は、３２．７±２１．２％（１／６６６±１１５ｂｐｓ～１／８７３±１５２ｂｐｓ）である。ＰＨＵＳＩＯＮ（商標）（「前」）またはＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩ（「後」）ＤＮＡポリメラーゼおよびＴｋｏＥｎｄｏＭＳ（「後」）を使用してアセンブルされた２５個の核酸分子由来のデータを示す。これらの２５個の断片は、図１７Ａおよび図１７Ｂに記載のデータを生成するために使用された３０個の断片とは異なった。この図は、前対後の個々の断片のエラー率の相対的な変化を示す。個々の断片の実際のエラー率および標準偏差は、前については３３２±６８ｂｐ中１つ、後について５３４±１６１ｂｐ中１つであり、エラー率の平均改善率は、６０．３±３２．９％である。ＴｋｏＥｎｄｏＭＳを追加すると、エラー率がさらに改善されることが示されている。図１７Ｃと同じデータをエラーのタイプ（削除、挿入、置換）に分けて示す。ＴｋｏＥｎｄｏＭＳを追加すると、挿入および置換に対するプラスの効果が高まることが示されている。全体の削除変化率は、４４．４±５１．３％（１／１０１９±２６１ｂｐｓ～１／１３９７±３９２ｂｐｓ）である。全体の挿入変化率は、７８．３±１０９．７％（１／２６９０±１１９１ｂｐｓ～１／４０７５±１５１７ｂｐｓ）である。全体の置換変化率は、７７．６±３６．５％（１／６８１±１５０ｂｐｓ～１／１２１７±３８０ｂｐｓ）である。

定義
「核酸分子」という用語は、本明細書で使用する場合、ヌクレオチドまたは塩基の共有結合で連結された配列を指し（例えば、ＲＮＡのリボヌクレオチドおよびＤＮＡのデオキシリボヌクレオチドであるが、ＤＮＡが別々の鎖または同じ鎖にあるＤＮＡ／ＲＮＡハイブリッドも含む）、１つのヌクレオチドのペントースの３’位は、ホスホジエステル連結により、次のヌクレオチドのペントースの５’位に接合する。核酸分子は、一本鎖もしくは二本鎖または部分的に二本鎖であり得る。核酸分子は、平滑末端または粘着末端を有するスーパーコイルまたは弛緩形態で線状または環状形態であらわれてもよく、「ニック」を含んでもよい。核酸分子は、完全に相補的な一本鎖、または少なくとも１つの塩基不一致を形成する部分的に相補的な一本鎖で構成されてもよい。核酸分子は、任意選択でループ配列により一端で分離した二本鎖ステム領域を形成し得る、２つの自己相補的配列をさらに含んでもよい。二本鎖ステム領域を含む核酸分子の２つの領域は、互いに実質的に相補的であり、その結果、自己ハイブリダイゼーションが生じる。しかしながら、ステムには、１つ以上の不一致、挿入、または欠失が含まれ得る。

核酸分子は、化学的、酵素的、または代謝的に修飾された形態のヌクレオチドまたはそれらの組み合わせを含み得る。化学的に合成された核酸分子は、典型的には長さが２００ヌクレオチド以下（例えば、５～２００、１０～１５０、１５～１００または２０～５０ヌクレオチド長）の核酸を指し得、一方、酵素的に合成された核酸分子は、本明細書の他の箇所に記載のより小さな核酸分子およびより大きな核酸分子を含み得る。核酸分子の酵素合成は、ポリメラーゼ、リガーゼ、エキソヌクレアーゼ、エンドヌクレアーゼ、リコンビナーゼなど、またはそれらの組み合わせなどの酵素を使用する段階的プロセスを含み得る。したがって、化学的に合成された核酸分子の酵素的なアセンブリに関連する組成物および組み合わせた方法が、本明細書において部分的に提供される。

核酸分子ホスホジエステル連結が置換モノヌクレオチドのペントース環の５’炭素と３’炭素との間で生じるため、核酸分子は、「５’末端」および「３’末端」を有する。新しい連結が５’炭素となる核酸分子の末端は、その５’末端ヌクレオチドである。新しい連結が３’炭素となる核酸分子の末端は、その３’末端ヌクレオチドである。本明細書で使用する末端ヌクレオチドまたは塩基は、３’または５’末端の末端位置にあるヌクレオチドである。核酸分子領域は、より大きな核酸分子の内部であっても（例えば、核酸分子内の配列領域）、５’末端および３’末端を有すると言うことができる。核酸分子はまた、短い核酸分子を指し、多くの場合、例えばプライマーまたはプローブと称される。また、「５’－」および「３’－」という用語は、核酸分子の鎖を指す。したがって、線状の一本鎖核酸分子は、５’末端および３’末端を有する。しかし、線状の二本鎖核酸分子は、各鎖の５’末端と３’末端を有する。したがって、タンパク質をコードする核酸分子については、例えば、センス鎖の３’末端を参照することができる。

「オリゴヌクレオチド」という用語は、本明細書で使用される場合、ＤＮＡおよびＲＮＡ、ならびに典型的にはＤＮＡであるがプリンまたはピリミジン塩基のＮ－グリコシドである任意の他のタイプの核酸分子を指す。したがって、オリゴヌクレオチドは、核酸分子サブセットであり、一本鎖または二本鎖であり得る。オリゴヌクレオチド（下記のプライマーを含む）は、所与の核酸配列に関する方向を示すために「フォワード」または「リバース」と称される場合がある。例えば、フォワードオリゴヌクレオチドは、核酸分子の第１の鎖（例えば、「センス」鎖）の配列の一部分を表し得るのに対し、リバースオリゴヌクレオチドは、当該核酸分子の第２の鎖（例えば、「アンチセンス」鎖）の配列の一部分を表し得るか、またはその逆であり得る。多くの場合では、より長い核酸分子をアセンブルするために使用されるオリゴヌクレオチドのセットは、相補的領域を介して互いにハイブリダイゼーションできるフォワードおよびリバースオリゴヌクレオチドの両方を含む。オリゴヌクレオチドは、典型的には２００ヌクレオチド長未満、より典型的には１００ヌクレオチド長未満である。したがって、「プライマー」は、概してオリゴヌクレオチドのカテゴリーに入る。オリゴヌクレオチドは、Ｎａｒａｎｇｅｔａｌ．，Ｍｅｔｈ．Ｅｎｚｙｍｏｌ．６８：９０－９９（１９７９）のホスホトリエステル法、Ｂｒｏｗｎｅｔａｌ．，Ｍｅｔｈ．Ｅｎｚｙｍｏｌ．６８：１０９－１５１（１９７９）のホスホジエステル法、Ｂｅａｕｃａｇｅｅｔａｌ．，ＴｅｔｒａｈｅｄｒｏｎＬｅｔｔｅｒｓ２２：１８５９－１８６２（１９８１）のジエチルホスホラミダイト法、および米国特許第４，４５８，０６６号の固体支持法などの方法による直接化学合成を含む任意の好適な方法によって調製され得る。オリゴヌクレオチドおよび修飾ヌクレオチドのコンジュゲートの合成方法の総説は、Ｇｏｏｄｃｈｉｌｄ，ＢｉｏｃｏｎｊｕｇａｔｅＣｈｅｍｉｓｔｒｙ１：１６５－１８７（１９９０）において提供されている。必要に応じて、オリゴヌクレオチドという用語は、プライマーまたはプローブを指し得、これらの用語は、本明細書では交換可能に使用され得る。

「プライマー」という用語は、本明細書で使用される場合、好適な条件下で核酸合成の開始点として作用することができる短い核酸分子を指す。かかる条件には、核酸鎖に相補的なプライマー伸長産物の合成が、適切な緩衝液中および好適な温度で、異なるヌクレオシド三リン酸（例えば、Ａ、Ｃ、Ｇ、Ｔおよび／またはＵ）および伸長のための薬剤（例えば、ＤＮＡポリメラーゼまたは逆転写酵素）の存在下で誘導される条件を含む。プライマーは、概して一本鎖ＤＮＡからなるが、特定の用途（例えば、平滑末端ライゲーション）のために二本鎖分子として提供されることもできる。任意選択で、プライマーは、天然に生じ得るか、または組換え手順の化学合成を使用して合成され得る。プライマーの適切な長さは、プライマーの使用目的に依存するが、典型的には、約１０～約５０ヌクレオチド、約１５～約３５ヌクレオチド、約１８～約７５ヌクレオチドおよび約２５～約１５０ヌクレオチドなどの中間範囲を含む、約６～約２００ヌクレオチドの範囲である。所与の標的配列の増幅に好適なプライマーの設計は、当技術分野で周知であり、文献に記載されている（例えば、ＯＬＩＧＯＰＥＲＦＥＣＴ（商標）Ｄｅｓｉｇｎｅｒ、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃを参照されたい）。プライマーは、プライマーの検出または固定化を可能にするが、ＤＮＡ合成の開始点として作用するというプライマーの基本的な特性を変更しない、追加の特徴を組み込むことができる。したがって、プライマーは、検出可能な部分または標識を含み得る。例えば、標識は、蛍光性、発光性、または放射性の部分を含み得る。

同じ増幅反応において使用されるプライマーのセットは、実質的に同じ融解温度を有し得、融解温度は、互いに約１０～５℃以内、または互いに約５～２℃以内、または互いに約２～０．５℃以内、または互いに約０．５℃未満である。

「相補的」または「相補性」という用語は、本明細書で使用される場合、塩基対合による許容の塩および温度条件下での核酸分子（プライマー、オリゴヌクレオチドまたはポリヌクレオチドなど）の自然な結合を指す。例えば、配列「Ａ－Ｇ－Ｔ」は、相補的な配列「Ｔ－Ｃ－Ａ」に結合する。２つの一本鎖分子間の相補性は、核酸の一部のみが結合する「部分的」であるか、一本鎖分子間に完全な相補性が存在する「完全」であり得る。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に顕著に影響を与える。これは、核酸鎖間の結合に依存する増幅反応において特に重要である。オリゴヌクレオチドなどの核酸分子間の相補的領域は、以下に定義する「重複」または「重複する」領域と称される場合もある。

「ハイブリダイゼーション」という用語は、本明細書で使用される場合、塩基対合を介して核酸の鎖が相補鎖と結合する任意のプロセスを指す。ハイブリダイゼーションおよびハイブリダイゼーションの強さ（例えば、核酸間の会合の強さ）は、核酸間の相補性の程度、関連する条件のストリンジェンシー、形成されたハイブリッドのＴ_m、および核酸内のＧ：Ｃ比などの因子によって影響を受ける。

「相同」という用語は、本明細書で使用される場合、相補性の程度を指す。核酸配列は、部分的または完全に相同（同一）であり得る。部分的に相補的な配列は、完全に相補的な配列が標的核酸にハイブリダイゼーションするのを少なくとも部分的に阻害するものであり、「実質的に相同」という機能用語を使用して言及される。

「重複」または「重複する」という用語は、本明細書で使用される場合、２つ以上のオリゴヌクレオチドの一部分によって共有される配列相同性または配列同一性を指す。

「遺伝子」または「遺伝子配列」という用語は、本明細書で使用される場合、概して、別個の細胞産物をコードする核酸配列を指す。多くの場合では、遺伝子または遺伝子配列は、オープンリーディングフレーム（ＯＲＦ）を含むＤＮＡ配列を含み、ポリペプチド鎖に翻訳され得るｍＲＮＡに転写され得るか、ｒＲＮＡもしくはｔＲＮＡに転写され得るか、または酵素ならびにＤＮＡの複製、転写、および調節に関与するタンパク質の認識部位として機能し得る。これらの遺伝子には、構造遺伝子、免疫遺伝子、調節遺伝子、および分泌（輸送）遺伝子などが含まれるが、これらに限定されない。しかしながら、本明細書で使用される場合、「遺伝子」は、特定のタンパク質をコードするヌクレオチド配列だけでなく、目的の遺伝子によってコードされるタンパク質の発現の調節に関与する任意の隣接する５’および３’非コードヌクレオチド配列も指す。これらの非コード配列には、ターミネーター配列、プロモーター配列、上流アクチベーター配列、調節タンパク質結合配列などが含まれる。多くの場合では、遺伝子は、より短いオリゴヌクレオチドまたは核酸断片からアセンブルされる。

「断片」、「亜断片」、「セグメント」もしくは「構成要素」という用語、または類似の用語は、核酸分子または配列に関連して本明細書で使用される場合、１つ以上のプロセスステップ（例えば、合成、アセンブリＰＣＲ、増幅など）から得られる産物または中間産物のいずれかを指すか、または１つ以上のプロセスステップ（例えば、アセンブリＰＣＲ、増幅、ライゲーション、クローニング）によって得られるための、より長いまたは修飾された核酸産物の一部分、一部、またはテンプレートを指す。いくつかの場合では、核酸断片または亜断片は、アセンブリ産物（例えば、複数のオリゴヌクレオチドからアセンブルされた）および高次アセンブリのための開始化合物（例えば、複数の断片からアセンブルされた遺伝子または複数の亜断片からアセンブルされた断片など）の両方を表し得る。

本明細書で使用される場合、「アミン」または「アミン化合物」は、本明細書で使用される場合、直下の式Ｉの化学物質、またはその塩を含む：

式中、Ｒ１はＨであり、Ｒ２は、アルキル、アルケニル、アルキニル、または（ＣＨ₂）ｎ－Ｒ５から選択され、ｎ＝１～３であり、Ｒ５は、アリール、アミノ、チオール、メルカプタン、ホスフェート、ヒドロキシ、アルコキシであり、Ｒ３およびＲ４は同じか、または異なってもよく、独立して、Ｈまたはアルキルから選択され、ただし、Ｒ２が、（ＣＨ₂）ｎ－Ｒ５である場合、Ｒ３および／またはＲ４のうちの少なくとも１つは、アルキルである。したがって、アミンには、ジエチルアミン塩酸塩、ジイソプロピルアミン塩酸塩、エチル（メチル）アミン塩酸塩、トリメチルアミン塩酸塩、およびジメチルアミン塩酸塩が含まれる。

「ベクター」という用語は、本明細書で使用される場合、遺伝物質を宿主生物に移すことができる任意の核酸分子を指す。ベクターは、トポロジーにおいて線状または環状であり得、プラスミド、ウイルス、バクテリオファージを含むがこれらに限定されない。ベクターは、増幅遺伝子、エンハンサーまたは選択マーカーを含み得、宿主生物のゲノムに組み込まれてもよく、または組み込まれなくてもよい。

「プラスミド」という用語は、本明細書で使用される場合、１つ以上の核酸分子（例えば、アセンブリ産物）を挿入するために遺伝子改変され得るベクターを指す。プラスミドは、典型的には、少なくとも１つの細胞型において複製できるようにする１つ以上の領域を含む。

「増幅」という用語は、本明細書で使用される場合、核酸分子の追加のコピーの産生を指す。増幅は、多くの場合、当技術分野で周知のポリメラーゼ連鎖反応（ＰＣＲ）技術を使用して実施される（例えば、Ｄｉｅｆｆｅｎｂａｃｈ，Ｃ．Ｗ．ａｎｄＧ．Ｓ．Ｄｖｅｋｓｌｅｒ（１９９５）ＰＣＲＰｒｉｍｅｒ，ａＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ，Ｐｌａｉｎｖｉｅｗ，Ｎ．Ｙ．を参照されたい）が、例えば、転写媒介増幅、鎖置換増幅、ローリングサークル増幅、ループ媒介等温増幅、ヘリカーゼ依存性増幅、単一プライマー等温増幅またはリコンビナーゼポリメラーゼ増幅などの等温増幅法を含む他の手段によって実施されてもよい（例えば、Ｆａｋｒｕｄｄｉｎｅｔａｌ．，“Ｎｕｃｌｅｉｃａｃｉｄａｍｐｌｉｆｉｃａｔｉｏｎ：Ａｌｔｅｒｎａｔｉｖｅｍｅｔｈｏｄｓｏｆｐｏｌｙｍｅｒａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ”，Ｊ．ＰｈａｒｍＢｉｏａｌｌｉｅｄＳｃｉ，２０１３，ｖ．５（４），２４５－２５２、またはＧｉｌｌａｎｄＧｈａｅｍｉ，“Ｎｕｃｌｅｉｃａｃｉｄｉｓｏｔｈｅｒｍａｌａｍｐｌｉｆｉｃａｔｉｏｎｔｅｃｈｎｏｌｏｇｉｅｓ：ａｒｅｖｉｅｗ”，ＮｕｃｌｅｏｓｉｄｅｓＮｕｃｌｅｏｔｉｄｅｓＮｕｃｌｅｉｃＡｃｉｄｓ．２００８２７（３），２２４－４３を参照されたい）。変性された二本鎖核酸分子の各鎖を再構築するために、末端プライマーを使用して増幅反応を実施することができる。

本明細書で「アセンブリＰＣＲ」とも呼ばれる「アセンブリ連鎖反応」という用語は、本明細書で使用される場合、重複する部分的に相補的な核酸分子のポリメラーゼ媒介伸長による、より小さい核酸分子からのより大きい核酸分子のアセンブリを指す。重複する部分的に相補的な核酸分子は、一本鎖または二本鎖であり得る。さらに、二本鎖核酸分子は、典型的には、アセンブリ連鎖反応における使用の前または一部として変性される。アセンブリ連鎖反応の例が図２の上部に記載されており、重複する部分的に相補的な核酸分子を使用して、各ポリメラーゼ媒介伸長ステップでより大きな核酸分子を生成する。

「一次後増幅エラー訂正」という用語は、本明細書で使用される場合、図２に示されるワークフローの終了後に生じる増幅ベースのエラー訂正ステップを指す。図２のワークフローでは、オリゴヌクレオチドが最初にアセンブルされ（一次アセンブリＰＣＲ）、次いで末端プライマーを使用して増幅される（一次増幅）。これが生じると、追加のエラー訂正ラウンド（例えば、ＰＣＲベースの断片アセンブリおよび増幅を含むエラー訂正）が生じる可能性がある。例えば、図５Ａのワークフローでは、ステップ１の３つの亜断片／ＰＣＲ産物が図２のワークフローを使用して作製された場合、次いで図５Ａのすべてのエラー訂正ステップは、一次後増幅エラー訂正である。

エラー訂正には、多くの場合、不一致エンドヌクレアーゼの使用が含まれる。例示的なエラー訂正プロセスが図４に記載されている。この図では、増幅されたオリゴヌクレオチドからアセンブルされた二本鎖核酸分子が変性され、次いで再アニーリングされる（ライン４および５）。次いで、そのいくつかが１つ以上の不一致を含有し得る再アニーリングされた核酸分子を、例えば不一致エンドヌクレアーゼ（ライン６）と接触させて、核酸分子を不一致の部位で、またはその近くで切断する。次いで、ライン６の反応混合物中の切断された核酸分子は、重複伸長ＰＣＲによって再アセンブルされ、増幅されて、「訂正されていない」出発核酸分子（ライン３）と同じ長さであることを意図したエラーのない核酸分子が得られる（ライン７におけるプロセスの出力）。

「非増幅エラー訂正」という用語は、本明細書で使用される場合、核酸増幅を含まないエラー訂正プロセスを指す。かかる方法の例は、核酸鎖を互いにハイブリダイゼーションさせ、続いて不一致結合タンパク質を用いて不一致を含有する二本鎖核酸分子を除去する方法である（例えば、図３を参照されたい）。

「隣接する」という用語は、本明細書で使用される場合、参照領域のすぐ５’側または３’側の核酸分子における位置を指す。

「配列忠実度」という用語は、本明細書で使用される場合、参照配列と比較した核酸分子の配列同一性のレベルを指す。配列同一性についてスコアリングされる核酸分子の全長にわたって１００％同一である完全な同一性。配列忠実度は、多くの方法で、例えば、核酸分子の実際のヌクレオチド配列を所望のヌクレオチド配列（例えば、核酸分子を生成するために使用したいヌクレオチド配列）と比較することによって測定され得る。配列忠実度を測定し得る別の方法は、反応混合物中の２つの核酸分子の配列の比較によるものである。多くの場合では、塩基基準ごとの差は平均して同じである。

ＤＮＡポリメラーゼのエラー率は、合計エラーまたは異なるタイプのエラーの定量化によって測定され得る。本明細書に記載の高忠実度ＤＮＡポリメラーゼに関して、エラー率「ベンチマーク」は、置換率に基づいて設定される。特に、高忠実度ＤＮＡポリメラーゼは、塩基当たり１．０×１０^-5置換のより低い置換エラー率を示す。高忠実度ポリメラーゼの例としては、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ、Ｑ５（登録商標）ＤＮＡポリメラーゼ、およびＰＲＩＭＥＳＴＡＲ（登録商標）ＧＸＬＤＮＡポリメラーゼ（Ｔａｋａｒａ）が挙げられる。エラー率を決定する方法は当技術分野で既知であり、例えば、Ｐｏｔａｐｏｖｅｔａｌ．，“ＥｘａｍｉｎｉｎｇＳｏｕｒｃｅｓｏｆＥｒｒｏｒｉｎＰＣＲｂｙＳｉｎｇｌｅＭｏｌｅｃｕｌｅＳｅｑｕｅｎｃｉｎｇ”，ＰＬＯＳＯＮＥ，ＤＯＩ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．０１６９７７４Ｊａｎｕａｒｙ６，２０１７において記載されている。

「トランジション」という用語は、核酸分子のヌクレオチド配列に関して使用される場合、プリンヌクレオチドを別のプリンへ

「トランスバージョン」という用語は、核酸分子のヌクレオチド配列に関して使用される場合、（一環）ピリミジンに対する（二環）プリンの置換または（二環）プリンに対する（一環）ピリミジンの置換を含む点変異を指す。

「インデル」という用語は、本明細書で使用される場合、核酸分子における１つ以上の塩基の挿入または欠失を指す。

「不一致」という用語は、本明細書で使用される場合、ワトソン－クリック塩基対合を形成しないが、異なる核酸鎖の周囲の塩基は配列相補性を有し、形成するワトソン－クリック塩基対合塩基を形成する、二本鎖核酸分子の異なる鎖における２つの塩基を指す。相補的領域の長さは変化し得るが、多くの場合、少なくとも２０塩基対のものである。４つの標準のＤＮＡ塩基のみを含有する核酸分子の各鎖に関して、４つの正しい（ワトソン－クリック塩基対合）相補的一致（すなわち、Ａ／Ｔ、Ｔ／Ａ／Ｇ／Ｃ、およびＣ／Ｇ）および１２個の「不一致」（すなわち、Ａ／Ａ、Ａ／Ｃ、Ａ／Ｇ、Ｔ／Ｔ、Ｔ／Ｃ、Ｔ／Ｇ、Ｇ／Ｇ、Ｇ／Ａ、Ｇ／Ｔ、Ｃ／Ｃ、Ｃ／Ｔ、およびＣ／Ａ）が存在する。塩基対合に関して、鎖の参照がない場合では、２つの正しい相補的一致（すなわち、Ａ／ＴおよびＧ／Ｃ）と８つの「不一致」（すなわち、Ａ／Ａ、Ａ／Ｃ、Ａ／Ｇ、Ｔ／Ｔ、Ｔ／Ｃ、Ｔ／Ｇ、Ｇ／Ｇ、およびＣ／Ｃ）が存在する。置換に関して、これらの不一致は、（１）ＡからＧおよびＴからＣ、（２）ＧからＡおよびＣからＴ、（３）ＡからＣおよびＴからＧ、（４）ＡからＴおよびＴからＡ、（５）ＧからＣおよびＣからＧ、および（６）ＧからＴおよびＣからＡとして表され得る。

「熱安定性」という用語は、タンパク質に関して本明細書で使用される場合、９５℃で５分間加熱した後、タンパク質の生物学的活性を少なくとも８５％保持するタンパク質を指す。熱安定性タンパク質は、９５℃で生物学的活性を有してもよく、または有しなくてもよい。したがって、タンパク質に応じて、保持された生物学的活性のアッセイは、９５℃で５分間加熱されていない同じタンパク質の「ベンチマーク」として使用して、９５℃で５分間または別の（例えば、より低い）温度でのインキュベーション後に実施され得る。

「不一致認識タンパク質」という用語は、本明細書で使用される場合、二本鎖ＤＮＡにおける不一致塩基に対して特異的な生物学的活性を有するタンパク質を指す。これらの活性には、ヌクレアーゼ活性および／または結合活性が含まれ得る。かかるタンパク質には、リゾルバーゼ、ＭｕｔＳおよびＭｕｔＳホモログ、ＭｕｔＭおよびＭｕｔＭホモログ、ＭｕｔＹおよびＭｕｔＹホモログ、ならびにタンパク質のＲｅｃＢヌクレアーゼファミリーのメンバーが含まれる。不一致結合タンパク質および不一致エンドヌクレアーゼは、両方とも不一致認識タンパク質である。不一致認識タンパク質は、熱安定性または非熱安定性であり得る。いくつかの例示的な不一致認識タンパク質は、表１５、および本明細書に提供される他の表に記載されている。

「不一致エンドヌクレアーゼ」または「ＭＭＥ」（「不一致修復エンドヌクレアーゼ」とも称される）という用語は、本明細書で使用される場合、不一致部位で、またはその近くで（例えば、約１～約５塩基対以内）二本鎖核酸分子を切断する（一方または両方の鎖）活性を有するヌクレアーゼを指す。不一致エンドヌクレアーゼ活性には、不一致塩基対を形成するヌクレオチドで、またはその近くでホスホジエステル結合を切断する能力、および不一致塩基対から１～５、多くの場合、１～３塩基対離れた位置にあるヌクレオチドに隣接するホスホジエステル結合を切断する活性が含まれる。不一致エンドヌクレアーゼ活性を有するタンパク質の例を、以下の表１３および１５に記載する。不一致エンドヌクレアーゼの具体的な例としては、ＣＥＬＩ（Ｔｉｌｌｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄＲｅｓ．３２：２６３２－２６４１（２００４））およびＣＥＬＩＩ（米国特許第７，１２９，０７５号）、Ｔ７ＮＩおよびＴ４エンドヌクレアーゼＶＩＩなどのバクテリオファージリゾルバーゼ（Ｍａｓｈａｌ，ｅｔａｌ．，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ９：１７７－１８３（１９９５））、Ｅ．ｃｏｌｉエンドヌクレアーゼＶ（ＹａｏａｎｄＫｏｗ，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２７２：３０７７４－３０７７９（１９９７））、ＴｋｏＥｎｄｏＭＳ（Ｉｓｈｉｎｏｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．４４：２９７７－２９８６（２０１６））、およびＰｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓＥｎｄｏＭＳ（本明細書では「ＰｆｕＥｎｄｏＭＳ」と称される）が挙げられる。不一致エンドヌクレアーゼは、熱安定性（ＴｓＭＭＥ）または非熱安定性であり得る。

「ＥｎｄｏＭＳ」という用語は、本明細書で使用される場合、表１５に記載のＥｎｄｏＭＳタンパク質のうちの１つ以上と少なくとも５０％のアミノ酸配列同一性を共有し、不一致特異的エンドヌクレアーゼ活性を有する不一致特異的エンドヌクレアーゼを指す。「Ｎｕｃｓ」は、ＥｎｄｏＭＳの代替用語として当技術分野で使用されてきた。したがって、「ＥｎｄｏＭＳ」および「Ｎｕｃｓ」という用語は、互換的に使用され得る。

「不一致結合タンパク質」（「不一致修復結合タンパク質」とも称される）という用語は、本明細書で使用される場合、二本鎖ＤＮＡにおける不一致塩基に対する特異的結合活性を有するタンパク質を指す。かかるタンパク質の例は、以下の表１２および１５に記載されている。これらのタンパク質の多くは、ＭｕｔＳホモログである。不一致結合タンパク質は、熱安定性または非熱安定性であり得る。

「エラー訂正」という用語は、本明細書で使用される場合、集団の核酸分子におけるヌクレオチド配列の欠陥の総数を減少させるように設計されたプロセスを指す。これらの欠陥は、不一致、挿入、欠失、および／または置換であり得る。欠陥は、（例えば、化学合成または酵素合成によって）生成された核酸分子が、各々ある位置に特定の塩基を含有することを意図しているが、１つ以上の核酸分子におけるその位置に異なる塩基が存在する場合に生じ得る。

エラー訂正の例は、以下のとおりである。１００塩基対の所望の長さを有する二本鎖核酸分子の集団があると仮定する。また、二本鎖核酸分子の２つの鎖が各々別個に合成され、互いにハイブリダイゼーションして、集団の二本鎖核酸分子を形成すると仮定する。さらに、核酸合成は、平均２００ヌクレオチド当たり１エラーをもたらすと仮定する。かかる場合、１００塩基対当たり１つの「エラー」がある。したがって、平均して、集団の各二本鎖核酸分子には１つのエラーが含まれる。もちろん、集団における二本鎖核酸分子のいくつかにはエラーがなく、他の二本鎖核酸分子には１つより多くのエラーがある。エラー訂正プロセスによって核酸分子の半分が集団から除去され、エラーのない核酸分子がまったく除去されなかった場合、集団における残りの二本鎖核酸分子のエラー率は２００塩基対中１つ未満になる。これは、上で示唆したように、除去された核酸分子がいくつかに１つより多くのエラーを有し、「正しい」核酸分子が除去されなかったためである。

本明細書で使用される場合、「エラー訂正ラウンド」および「エラー訂正のラウンド」という語句は、核酸分子の集団からのエラーを有する核酸分子の切断または除去をもたらす一連のステップを指す。説明の目的で図４を使用すると、ライン４～７は、エラー訂正の１ラウンドを記載している。図４に記載のプロセスは、一連の増幅反応（例えば、ＰＣＲサイクル）を含むが、エラー訂正のラウンドは必ずしもこれを必要としない。例えば、図４に記載のプロセスの改変は、不一致結合タンパク質を使用して、不一致を有しない核酸分子から不一致を有する核酸分子を分離し得る場合（ライン５を参照されたい）である。

本明細書で使用される場合、「エラー低減ポリメラーゼ試薬」は、ポリメラーゼ（例えば、ＤＮＡポリメラーゼ）、および増幅された核酸分子におけるエラーの数を低減する（例えば、約５％～約３０％、約５％～約３０％、約５％～約３０％、約１０％～約４０％、約１０％～約７０％など）追加構成要素を含む組成物であり、追加構成要素は不一致認識タンパク質ではない。このような化合物の１つのカテゴリーは、本明細書に記載のアミンなどのアミンである。

「形質転換」という用語は、本明細書で使用される場合、外因性核酸分子がレシピエント細胞に入り、変化させるプロセスを説明する。それは、当技術分野で周知の様々な方法を使用して、自然または人工の条件下で生じ得る。形質転換は、外来核酸配列を原核または真核宿主細胞に挿入するための任意の既知の方法に依存し得る。この方法は、形質転換される宿主細胞に基づいて選択され、ウイルス感染、エレクトロポレーション、リポフェクション、および粒子衝撃を含み得るが、これらに限定されない。かかる「形質転換された」細胞には、挿入された核酸が自律的に複製するプラスミドとして、または宿主染色体の一部として複製することができる、安定に形質転換された細胞が含まれる。また、それらには、挿入されたＤＮＡまたはＲＮＡを限られた期間、一過性に発現する細胞も含まれる。

「固体支持体」という用語は、本明細書で使用される場合、オリゴヌクレオチドもしくは核酸分子などのポリマーが合成および／または固定され得る多孔性または非多孔性物質を指す。本明細書で使用される場合、「多孔質」とは、物質が、不均一または均一な直径（例えば、ｎｍ範囲で）のものであり得る細孔を含有することを意味する。多孔質物質には、紙、合成フィルターなどが含まれる。かかる多孔質物質では、反応は細孔内で起こり得る。固体支持体は、ピン、細長い片、プレート、ディスク、棒、繊維、ベンド、円筒構造、平面、凹面もしくは凸面、またはキャピラリーもしくはカラムなどの多くの形状のうちのいずれか１つを有し得る。固体支持体は、ビーズ、マイクロ粒子、ナノ粒子などを含む粒子であり得る。固体支持体は、類似サイズの非ビーズ型粒子（例えば、フィラメント）であり得る。支持体は、幅およびサイズは可変であり得る。例えば、本明細書に記載の方法の態様の実施において使用され得るビーズ（例えば、磁気ビーズ）のサイズは、広く変化し得るが、０．０１μｍ～１００μｍ、０．００５μｍ～１００μｍ、０．００５μｍ～１０μｍ、０．０１μｍ～１００μｍ、０．０１μｍ～１，０００μｍ、１．０μｍ～２．０μｍ、１．０μｍ～１００μｍ、１５２．０μｍ～１００μｍ、３．０μｍ～１００μｍ、０．５μｍ～５０μｍ、０．５μｍ～２０μｍ、１．０μｍ～１０μｍ、１．０μｍ～２０μｍ、１．０μｍ～３０μｍ、１０μｍ～４０μｍ、１０μｍ～６０μｍ、１０μｍ～８０μｍ、または０．５μｍ～１０μｍの直径を有するビーズを含み得る。

支持体は、疎水性であるか、または疎水性相互作用を介して分子に結合することができる。支持体は、親水性であるか、または親水性であることができ、シリカ、硫酸マグネシウム、およびアルミナなどの無機粉末、天然高分子物質、特にろ紙、クロマトグラフィー紙などの紙を含有する繊維などのセルロース物質およびセルロース由来物質が含まれる。支持体は、例えばマルチウェルプレートまたはマイクロチップなどの担体のアドレス指定可能な位置に固定化され得る。支持体は、ばらばらまたは粒子状（例えば、樹脂物質またはウェル中のビーズなど）であり得るか、または担体に可逆的に固定化または連結され得る（例えば、切断可能な化学結合または磁力などによって）。いくつかの態様では、固体支持体は断片化可能であり得る。固体支持体は、ニトロセルロース、炭素、酢酸セルロース、ポリ塩化ビニル、ポリアクリルアミド、架橋デキストラン、アガロース、ポリアクリレート、ポリエチレン、ポリプロピレン、ポリ（４－メチルブテン）、ポリスチレン、ポリメタクリレート、ポリ（エチレンテレフタレート）、ナイロン、ポリ（酪酸ビニル）、二フッ化ポリビニリデン（ＰＶＤＦ）膜、ガラス、制御細孔ガラス、磁気制御細孔ガラス、磁気もしくは非磁気ビーズ、セラミック、金属などの合成または修飾された天然ポリマーであり得、単独で使用される、他の素材と組み合わせて使用され得る。いくつかの態様では、支持体は、チップ、アレイ、マイクロアレイ、またはマイクロウェルプレート形式であり得る。多くの場合では、本明細書に記載の方法または組成物で使用される支持体は、支持体上に特徴（すなわち、個々の核酸分子を含有する位置）を生成するために、個々の核酸分子が別個で、または別個の領域で合成される支持体である。いくつかの態様では、定義された特徴のサイズは、特徴上に微小体積の液滴または反応体積を形成できるように選択され、各液滴または反応体積は互いに分離された状態に保たれる。本明細書に記載されるように、特徴は、液滴もしくは反応体積または隣接する２つの特徴間を融合しないように、典型的には中間特徴空間によって分離されるが、必ずしもそうである必要はない。中間特徴は、典型的には、その表面上に核酸分子を担持せず、不活性空間に対応する。いくつかの態様では、特徴および中間特徴は、それらの親水性または疎水性の特性が異なり得る。いくつかの態様では、特徴および中間特徴は修飾子を含み得る。本明細書に記載のいくつかの場合では、特徴は、ウェルまたはマイクロウェルまたはノッチである。核酸分子は、共有結合または非共有結合で表面に結合され得るか、または表面に沈着もしくは合成もしくはアセンブルされ得る。

単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈上明確に別段指示されない限り、複数形の参照を含む。

概要
本明細書に記載の組成物および方法は、部分的に、高配列忠実度を有する核酸分子の調製に関する。多数の態様およびバリエーションが用いられ得るが、多くの場合では、核酸分子は合成される（例えば、化学的、酵素的など）。次いで、これらの合成された核酸分子は、任意選択で、例えばアセンブリＰＣＲ（例えば、一次アセンブリＰＣＲ）によってアセンブルされて、１つ以上のより大きな核酸分子を形成し得る。図１Ａおよび図１Ｂは、本明細書に記載の方法において使用され得る例示的なアセンブリＰＣＲステップを示す概略図である。

概して、合成されたオリゴヌクレオチドにおける配列エラーの存在量は比較的低く、半ランダムな分布がある。多くの場合では、エラーの塩基（例えば、欠失、挿入、置換）を有する核酸分子が正しい塩基を有する核酸分子とハイブリダイゼーションする場合、標準のワトソン－クリック塩基対を示さない領域が形成される。これらの「非標準」領域は、エラーを含有する核酸分子の認識に使用され得る。さらに、これらの「非標準」領域が核酸分子の集団において検出されると、これらの領域を含有する核酸分子は集団から除去され得るか、またはそれらの増幅を防止するか、もしくはそれらの増幅される能力を低下させるような方法で修飾され得る。

集団におけるエラー（例えば、欠失、挿入、置換）を含有する核酸分子のパーセンテージを低減させるために、多くの方法を使用し得る。これらの方法は、以下が含まれる。
１．エラーを含有する核酸分子の切断、
２．エラーを含有しない核酸分子からのエラーを含有する核酸分子の分離、
３．エラーを含有しない核酸分子と比較して、エラーを含有する核酸分子の増幅を抑制／阻害すること。

さらに、上の方法のうちの２つ以上を使用して、核酸分子に存在するエラーの数を低減させ得る。

本明細書に記載の開示の多くは、核酸分子の合成、アセンブリ（例えば、アセンブリＰＣＲ）および増幅のための組成物および方法に関する。本明細書で提供されるのは、高配列忠実度を有する核酸分子を生成するための組成物および方法である。

いくつかのアプリケーションの場合、低エラー率を有する核酸分子の使用が重要である。説明のために、１００個の核酸分子がアセンブルされる状況を考えてもらいたい。各分子は１００塩基対長であり、２００塩基対ごとに１つのエラーがある。正味の結果は、アセンブルされた核酸分子の各１０，０００塩基対中、平均で５０個の配列エラーがある。例えば、アセンブルされた核酸分子から１つ以上のタンパク質を発現させることを意図する場合、したがってアミノ酸配列エラーの数が高すぎると考えられる可能性がある。さらに、多くのタンパク質コード領域のヌクレオチド配列エラーは、概して望ましくないタンパク質が得られる「フレームシフト」変異をもたらす。また、非フレームシフトコード領域は、点変異を伴うタンパク質の形成をもたらす場合がある。これらのすべては、所望のタンパク質発現産物の「純度を低下させ」、産生された「夾雑」タンパク質の多くは、たとえアフィニティー精製を用いたとしても、最終的な発現産物混合物に持ち越される。

高配列忠実度は、アセンブリ前の核酸断片または部分的にアセンブルされた核酸分子の配列決定、正しい配列を有する核酸分子を識別するための完全にアセンブルされた核酸分子の配列決定、および／またはエラー訂正を含むいくつかの手段によって達成され得る。

エラーは、多くの方法で核酸分子に入る場合がある。かかる方法の例には、化学合成エラー、増幅／ポリメラーゼ媒介エラー（特にプルーフリーディングポリメラーゼが使用される場合）、およびアセンブリＰＣＲ媒介エラー（通常は核酸断片接合部で生じる）が含まれる。

核酸分子における配列エラーは、多くの方法で参照され得る。例として、合成核酸分子に関連するエラー率、エラー訂正および／または選択後の核酸分子に関連するエラー率、ならびに最終産物核酸分子に関連するエラー率（例えば、（１）正しい配列について選択されたいずれかを有する合成核酸分子、または（２）アセンブルされた化学的に合成された核酸分子のエラー率）がある。これらのエラーは、化学合成プロセス、アセンブリプロセス、および／または増幅プロセスに起因する可能性がある。エラーは、正しい配列を有する核酸分子の選択、エラー訂正、および／または改善された化学合成方法などの方法によって除去または防止され得る。

いくつかの場合では、本明細書に記載の方法は、エラー除去および防止方法を組み合わせて、エラーの数が比較的少ない核酸分子を産生し得る。したがって、本明細書に記載の方法によって産生されるアセンブルされた核酸分子は、１，５００中約１塩基～３０，０００中約１塩基、２，０００中約１塩基～３０，０００中約１塩基、４，０００中約１塩基～３０，０００中約１塩基、８，０００中約１塩基～３０，０００中約１塩基、１０，０００中約１塩基～３０，０００中約１塩基、１５，０００中約１塩基～３０，０００中約１塩基、１０，０００中約１塩基～２０，０００中約１塩基などのエラー率を有し得る。

アセンブルされた核酸分子におけるエラー数を低くする２つの方法は、（１）正しい配列を有するアセンブリのための核酸分子（例えば、オリゴヌクレオチド、亜断片など）の選択、および（２）核酸分子、部分的にアセンブルされた亜アセンブリ、または完全にアセンブルされた核酸分子のエラーの訂正によるものである。

エラーは、核酸分子が生成される方法に関係なく、核酸分子に組み込まれる場合がある。正しい配列を持つことが既知の核酸分子をアセンブリＰＣＲに使用した場合でさえも、エラーが最終的なアセンブリ産物に入る可能性がある。したがって、多くの場合では、エラーの低減が望まれる。

多くの場合では、化学合成されたオリゴヌクレオチドからより大きな核酸分子を生成する方法に関係なく、化学合成プロセス由来のエラーが存在する。エラーのない核酸分子を同定および選択するために個々の核酸分子の配列決定が実施され得るが、代替アプローチは、１つ以上のエラー訂正または除去ステップを含み得る。したがって、多くの場合では、エラー訂正が望ましい。エラー訂正は、様々な方法で達成され得る。典型的には、かかるエラー除去ステップは、アセンブリＰＣＲの第１のラウンドの後に実施される。したがって、いくつかの態様では、本明細書に記載の方法は、以下を（この順序または異なる順序で）含み得る：（ｉ）断片増幅および／またはアセンブリＰＣＲ（例えば、本明細書に記載の方法による）、（ｉｉ）エラー訂正、（ｉｉｉ）最終アセンブリ（例えば、本明細書に記載のインビトロまたはインビボ方法による、例えば、図１Ａまたは１Ｂに記載のようなプロトコルを使用して）。

これらの分子を生成するために使用されるワークフローにおける１つ以上の位置で、核酸分子からエラーを除去し得るか、そうでなければ回避し得る。説明のために図１Ａに記載したワークフローを使用すると、配列エラーがほとんど導入されない条件下でオリゴヌクレオチド合成が実施され得る。核酸アセンブリＰＣＲ（例えば、オリゴヌクレオチドアセンブリ）は、不一致認識ベースのエラー訂正と併せて実施され得る。アセンブルされた核酸分子は、不一致認識ベースのエラー訂正と併せて増幅され得る。アセンブルされた核酸分子は、アセンブリＰＣＲまたは増幅がない場合で、不一致認識ベースのエラー訂正を受けてもよい。これは、多くの場合、対象の核酸分子の熱変性、続く核酸分子の再生によって行われ、続いてそれを１つ以上の不一致認識タンパク質と接触させる。

さらに、核酸分子へのエラーの導入は、多くの方法で回避または軽減され得る。これらの方法のいくつかには、エラーをほとんど含有しない核酸出発物質の使用が含まれる。実施例２ならびに表１０および１１に記載されるように、エラーをほとんど含有しない核酸出発物質の使用により、アセンブルされたエラー訂正された分子に存在するエラーが少なくなる。これは、エラー訂正方法が存在するエラーを常に１００％訂正できるとは限らないためであると考えられている。したがって、概して、訂正のために存在するエラーが少ないほど、エラー訂正後のエラーも少なくなる。

多くの場合では、核酸分子出発物質は、２５０個中約１つ～２，０００個中約１つ（例えば、２５０個中約１つ～１，９００個中約１つ、２５０個中約１つ～１，５００個中約１つ、２５０個中約１つ～１，２００個中約１つ、２５０個中約１つ～１，０００個中約１つ、２５０個中約１つ～８００個中約１つ、４００個中約１つ～１，９００個中約１つ、４００個中約１つ～１，５００個中約１つ、４００個中約１つ～１，１００個中約１つ、６５０個中約１つ～２，０００個中約１つ、６５０個中約１つ～１，７００個中約１つ、６５０個中約１つ～１，５００個中約１つなど）である配列エラーの初期平均数を有する。

実施例２にも記載されているように、エラー訂正効率は、使用される熱サイクル条件である程度変化する。したがって、低エラー数を有する産物核酸分子を得るために変更され得る１つの因子は、熱サイクル条件である。

核酸分子へのエラーの導入を回避する別の方法は、例えば、少ないエラーを有する核酸サブユニットを生成するための合成方法の使用によるものである。別の方法は、核酸分子の低エラー複製アセンブリおよび増幅のための高忠実度ポリメラーゼおよび高忠実度増幅方法を使用することである。

説明のために図２のワークフローを使用すると、合成的に産生されたオリゴヌクレオチドは、一連の加熱および冷却ステップを介してＤＮＡポリメラーゼによってアセンブルされ、各アセンブリＰＣＲサイクルで大きな核酸分子をもたらす。一本鎖核酸分子の相補的領域のハイブリダイゼーションは、各アセンブリＰＣＲサイクル中に生じる。これらのハイブリダイゼーション反応中に、標準のワトソン－クリック塩基対を示さない領域が形成される可能性があり、これが生じると、これらの結果として生じる二本鎖核酸分子は、エラーを含有するものとして「マーク付け」される。本明細書に記載の核酸分子の「エラー訂正された」集団を生成するための方法は、混合集団からのエラーを含有する核酸分子の普及を排除または減少させる（「エラー訂正」）ために、ＤＮＡポリメラーゼおよび不一致認識タンパク質を使用する。

説明のために図２のワークフローを再び使用すると、エラー訂正は、任意の１つ以上のステップおよびより大きなワークフローにおける他の場所（例えば、示される一次増幅の後）で実施され得、複数のエラー訂正試薬およびエラー訂正メカニズム、ならびにその他のエラー低減方法を含み得る。さらに、図２は、一連のアセンブリＰＣＲおよび増幅反応を示す。エラー訂正は、これらのステップのいずれにおいても生じないか、これらのステップのいくつか、またはすべてで生じ得る。例えば、図２は、アセンブリＰＣＲ反応の４つの重複伸長サイクルを示す（示された下向き矢印（ａ）～（ｃ）の数に基づく）。例えば、熱安定性不一致認識タンパク質が使用される場合、それは、第１のアセンブリＰＣＲサイクルの前に追加され得るか、アセンブリＰＣＲ反応中に（すなわち、伸長サイクルのうちの１つ以上が完了した後に）追加され得る。使用され得るエラー訂正試薬の例には、不一致エンドヌクレアーゼおよび不一致結合タンパク質が挙げられる。

エラー訂正を実施するために使用され得る試薬には、不一致エンドヌクレアーゼ、不一致結合タンパク質、ならびに高忠実度ポリメラーゼ、および高忠実度ポリメラーゼを含む試薬が含まれる。さらに、本明細書に記載の方法において使用されるタンパク質は、熱安定性または非熱安定性であり得る。高忠実度ポリメラーゼを含有する試薬の一例は、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号１２３６１０１０）である。

核酸分子のエラー訂正の１つの一般的なワークフローは、配列相補性の領域を有する一本鎖核酸分子が互いにハイブリダイゼーションされるか、または二本鎖核酸分子が変性され、次いで互いにハイブリダイゼーションされるかのいずれかである。かかる場合では、ヌクレオチド配列が１つ以上のヌクレオチドが異なる２つの核酸鎖が互いにハイブリダイゼーションする場合、得られる二本鎖核酸分子は、概して、ワトソン－クリック塩基対合が示されない領域を形成する。いくつかの場合では、エラー訂正プロセスは、ワトソン－クリック塩基対合が示されていない領域の認識に基づき得る。したがって、多くの場合では、エラー訂正プロセスは、二本鎖核酸分子を形成するための一本鎖核酸分子のハイブリダイゼーションを含む。エラー訂正はＤＮＡポリメラーゼの非存在下で実施され得るが、エラー訂正を含み得るアセンブリＰＣＲおよび増幅プロセスを図１Ａ、図１Ｂおよび図２に示す。

本明細書に記載の方法は、アセンブリＰＣＲおよび／または増幅ステップに関連するエラー低減、エラー訂正の様々な組み合わせを含む。さらに、エラー訂正プロセスは、かかるステップに統合されるか、またはかかるステップの前もしくは後に生じ得る。

本明細書に記載の方法は、本明細書に記載のワークフローの任意の数のステップおよび組み合わせを含み得る。本明細書に記載の方法の例示的な態様を説明するために図１Ａ、図２、ならびに図５Ａおよび５Ｂのワークフローを使用すると、重複配列相補性の末端を有するオリゴヌクレオチドが生成され得る（図１Ａ）。次いで、これらのオリゴヌクレオチドは、一連のアセンブリＰＣＲサイクルによってアセンブルされ得、一次アセンブリＰＣＲと呼ばれる（図１Ａおよび図２）。次いで、末端プライマーを使用してアセンブリ産物が増幅され、一次増幅と呼ばれる（図１Ａおよび図２）。例えば、図２に記載されるように、相補的な末端配列を有する別々のアセンブリＰＣＲ反応において生成されたアセンブリ産物は、図５Ａおよび５Ｂの上部に記載のようにさらにアセンブルされ得、二次アセンブリＰＣＲと呼ばれる。これらの例では、亜断片ＰＣＲ産物Ａ、Ｂ、およびＣを容器に組み合わせて、１カップ不一致切断ベースエラー訂正を実施し、続いて、エラー訂正された断片を融合および伸長するためのＰＣＲステップを実施し（それぞれライン３における第３のＰＣＲと称される）、その結果、断片Ａ、Ｂ、およびＣを含むより長い核酸アセンブリ産物が得られる。エラー訂正は、各アセンブリおよび／または増幅ステップの前および／または後に生じ得る。

説明のために図７に記載のデータを使用すると、一次アセンブリＰＣＲはＴｋｏＥｎｄｏＭＳの存在下または非存在下で実施された。各場合では、ＴｋｏＥｎｄｏＭＳの存在下または非存在下でも続いて一次増幅が行われた。次いで、Ｔ７ＮＩを使用したエラー訂正が行われ、これには、二次増幅が含まれる。

図１Ｂは、一次アセンブリＰＣＲおよび一次増幅のみ生じるワークフローを示す。

要約すると、いくつかの態様では、本明細書で提供されるのは、アセンブリＰＣＲおよび／または増幅ステップの組み合わせを含む方法であり、エラー訂正は、かかるステップ中またはかかるステップのうちのいずれかの間で生じ得る。多くの場合では、１つ以上の熱安定性不一致認識タンパク質が、アセンブリＰＣＲおよび／または増幅ステップ中に存在し得る。

「一次アセンブリＰＣＲ」という用語は、一本鎖核酸分子がアセンブルされて、個々の一本鎖核酸分子よりも長さが長い二本鎖核酸分子を形成するアセンブリＰＣＲ反応を指す。図１Ｂのワークフローは、一本鎖核酸分子が二本鎖核酸分子（すなわち、ベクター）でアセンブルされるアセンブリ反応を示しているが、これは、ベクター挿入物が一本鎖核酸分子から形成されるため、一次アセンブリＰＣＲを含むと考えられる。したがって、かかる場合では、ベクター挿入物は、一次アセンブリＰＣＲを介してアセンブルされる。

「二次アセンブリＰＣＲ」という用語は、最初の二本鎖核酸分子がアセンブルされて、最初の二本鎖核酸分子よりも長さが長い産物二本鎖核酸分子を形成するアセンブリＰＣＲ反応を指す。

「一次増幅」という用語は、一本鎖核酸分子がアセンブルされて二本鎖核酸分子を形成するアセンブリＰＣＲ反応の産物に対して実施される第１のセットの増幅反応を指す。後の増幅サイクルは、「二次」、「三次」、「四次」などと称される。例として、図５Ａのステップ３は二次増幅である。一次増幅後の増幅サイクルは、開始核酸分子よりも長さが異なる増幅産物をもたらしてもよく、またはもたらさなくてもよい。ワークフローは、増幅サイクルを互いに区別する。例えば、図７は、ＴｋｏＥｎｄｏＭＳの存在下または非存在下で生じる一次増幅から得られるデータを示す。さらに、図７は、Ｔ７ＮＩを使用したエラー訂正と続く二次増幅を含むデータを示す。

核酸分子の生成
目的の核酸分子またはタンパク質を産生する際の第１のステップのうちの１つは、分子が同定された後の核酸分子の設計である。合成される核酸配列および核酸分子を生成するために使用されるオリゴヌクレオチドの設計には、多くの因子が関与する。これらの因子には、以下のうちの１つ以上が含まれる：（１）核酸分子（例えば、コード領域）の全部または一部のＡＴ／ＧＣ含有量、（２）制限エンドヌクレアーゼ切断部位の存在または非存在（制限部位の付加および／または除去を含む）、（３）用いられる特定のタンパク質産生または宿主発現系のための好ましいコドン使用法、（４）アセンブルされるオリゴヌクレオチドの接合部、（５）所望の核酸分子を産生するために使用されるオリゴヌクレオチドの数および長さ、（６）望ましくない領域（例えば、「ヘアピン」配列、細胞核酸との配列相同領域、反復配列、抑制性シス作用要素、制限酵素切断部位、内部スプライシング部位など）の最小化、ならびに（７）５’および３’構成要素の結合に使用され得るコーディング領域隣接セグメント（例えば、制限エンドヌクレアーゼ部位、プライマー結合部位、配列決定アダプターまたはバーコード、組換え部位など）。

多くの場合では、パラメータはコンピュータに入力され、ソフトウェアは入力パラメータのバランスをとるインシリコヌクレオチド配列を生成する。ソフトウェアは、例えば、入力基準のいくつかに厳密に一致する核酸分子であるとみなされるものは、アセンブルするのが困難または不可能である可能性があるという点で、入力パラメータに「重み付け」を配置する場合がある。例示的な核酸設計方法は、米国特許第８，２２４，５７８号に記載されている。下でさらに説明するように、配列設計は、産物核酸分子の異なる亜断片に属するオリゴヌクレオチドの多重化の要件も考慮に入れることができる。

さらに、核酸分子の設計因子は、核酸分子の長さにわたって、または分子の特定の領域において考慮され得る。例えば、分子内の特定の位置に起因する合成の「失敗」を防止するために、核酸分子の長さにわたってＧＣ含有量を制限してもよい。したがって、核酸分子の合成可能性は、領域的な「アセンブルの失敗」が、設計された核酸分子がアセンブルされなということをもたらす点で、核酸分子全体の特徴である。領域的な観点から、最適な翻訳のためのコドンが選択され得るが、これは、例えばＧＣ含有量の局所的な制限と競合する場合がある。

アセンブリの成功には、多くの場合、目的の核酸分子の複数のパラメータおよび領域的な特性が関与する。全体および領域的なＧＣ含有量は、パラメータの一例にすぎない。例えば、核酸分子の総ＧＣ含有量は５０％であり得るが、同じ核酸分子の特定の領域におけるＧＣ含有量は７５％であり得る。したがって、多くの場合では、ＧＣ含有量は核酸分子全体にわたって「バランスがとれて」おり、領域的に総ＧＣ含有量から１５％、１０％、８％、７％、または５％未満変化し得る。

したがって、目的は、様々な要件を満たす中で可能な限り最適な妥協点に到達することである。産物核酸分子がタンパク質をコードする場合、タンパク質における多数のアミノ酸が、遺伝子コードの縮重に基づいて、原則として、目的のタンパク質を発現できる可能なＤＮＡ配列の数の組み合わせ爆発に至る。このため、最適なコドン配列を確認するために、様々なコンピュータ支援方法が提案されている。

所望の核酸分子のアセンブリＰＣＲに使用されるオリゴヌクレオチドまたは核酸亜断片は、多くの供給源から得ることができ、例えば、それらは、クローニング、ポリメラーゼ連鎖反応由来、化学合成または購入され得る。多くの場合では、化学的に合成された核酸は、１００ヌクレオチド長未満のものになる傾向がある。ＰＣＲおよびクローニングを使用して、はるかに長い核酸を生成し得る。さらに、核酸（例えば、核酸断片）に存在するエラーの塩基のパーセンテージは、それが作られる方法にある程度関係している。典型的には、化学合成された核酸は、エラー率が最も高くなる。

オリゴヌクレオチドの化学合成のための多くの方法が既知である。多くの場合では、オリゴヌクレオチド合成は、所望の長さおよび配列のオリゴヌクレオチドが得られるまで、伸長する鎖の５’末端にヌクレオチドを段階的に付加することによって実施される。さらに、各ヌクレオチド付加は合成サイクルと称され得、多くの場合、４つの化学反応、（１）脱ブロッキング／脱保護、（２）カップリング、（３）キャッピング、および（４）酸化からなる。

ＥＧＡおよびＰＧＡ脱保護試薬およびかかる酸を生成するための方法、ならびにオリゴヌクレオチド合成におけるそれらの使用は、例えばＭａｕｒｅｒｅｔａｌ．，“ＥｌｅｃｔｒｏｃｈｅｍｉｃａｌｌｙＧｅｎｅｒａｔｅｄＡｃｉｄａｎｄＩｔｓＣｏｎｔａｉｎｍｅｎｔｔｏ１００ＭｉｃｒｏｎＲｅａｃｔｉｏｎＡｒｅａｓｆｏｒｔｈｅＰｒｏｄｕｃｔｉｏｎｏｆＤＮＡＭｉｃｒｏａｒｒａｙｓ”，ＰＬｏＳ，Ｉｓｓｕｅ１，ｅ３４（２００６）、またはＰＣＴ公開第２０１３／０４９２２７号および同第２０１６／０９４５１２号に記載されている。したがって、いくつかの場合では、ＥＧＡは脱保護プロセスの一部として生成される。さらに、特定の場合では、オリゴヌクレオチド合成反応のすべてまたは一部は、水溶液中で実施され得る。他の例では、有機溶媒が使用される。

多くの場合では、典型的な核酸アセンブリＰＣＲプロトコルは、例えば、一本鎖オーバーハングエキソヌクレアーゼ媒介生成、それに続くＰＣＲベースのアセンブリ（「標準のワークフロー」）などの本明細書に記載の方法の組み合わせを含み得る。いくつかの態様では、かかる標準のワークフローは、少なくとも以下のステップを含み得る：（ｉ）所望のアセンブリ産物の配列を含む一本鎖オリゴヌクレオチドを一緒に合成することであって、各オリゴヌクレオチドは、別のオリゴヌクレオチドの配列領域に相補的である配列領域を有する、合成すること、（ｉｉ）オリゴヌクレオチドをそれらの相補的配列領域を介してハイブリダイゼーションさせ、重複伸長ＰＣＲ反応（一次アセンブリＰＣＲ）でオリゴヌクレオチドを伸長させて、１つ以上の二本鎖核酸分子をアセンブルすること、（ｉｉｉ）末端プライマーの存在下でアセンブルされた核酸分子を増幅すること（一次増幅）、（ｉｖ）増幅された核酸分子を精製すること、（ｖ）増幅された１つ以上の核酸分子の末端で一本鎖オーバーハングを生成し、任意選択で、後続のクローニングのための線形化された標的ベクターの末端（例えば、制限エンドヌクレアーゼおよび／またはエキソヌクレアーゼでの断片の処理による）で一本鎖オーバーハングを生成すること、（ｖｉ）１つ以上の核酸分子を、相補的な一本鎖オーバーハングを介して標的ベクターに挿入し、任意選択で、続いてライゲーションステップを行うこと、および（ｖｉｉ）得られるベクター構築物で宿主細胞（例えば、Ｅ．ｃｏｌｉ）を形質転換すること。いくつかの態様では、アセンブルされた核酸分子は、形質転換された細胞の内因性酵素活性によって「インビボ」でライゲーションされ得る。例えば、ギャップまたはニックの入ったアセンブリ産物をＥ．ｃｏｌｉに直接形質転換し得、ギャップまたはニックはＥ．ｃｏｌｉ内因性修復機構によって修復され得る。

核酸分子をアセンブルするための２つの方法を図１Ａおよび１Ｂに示す。これらの方法は両方とも、ＰＣＲを使用して、概して、これらの相補的配列領域を介して一緒に「縫い合わされた」末端で重複する配列を含有するオリゴヌクレオチドまたは亜断片から開始することを含む。いくつかの態様では、重複は約１０塩基対であり、他の態様では、重複は、１５、２５、３０、５０、６０、７０、８０または１００塩基対など（例えば、約１０～約１２０、約１５～約１２０、約２０～約１２０、約２５～約１２０、約３０～約１２０、約４０～約１２０、約１０～約４０、約１５～約５０、約４０～約８０、約６０～約９０、約２０～約５０、約１５～約３５などの塩基対）であり得る。アセンブリのミスを避けるために、個々の重複は、典型的には、亜断片間で複製されていないか、または密接に一致しない。ハイブリダイゼーションは関与する核酸分子または領域間で１００％の配列同一性を必要としないため、アセンブリのミスを防ぐために各末端は十分に異なっている必要がある。さらに、互いに相同組換えを受けることを意図した末端は、少なくとも９０％、９３％、９５％、または９８％の配列同一性を共有する必要がある。

さらに、複数サイクルのポリメラーゼ連鎖反応を使用して、連続的により大きな核酸分子を生成し得る。多くの場合では、縫い合わされたオリゴヌクレオチドは化学的に合成され、１００ヌクレオチド長未満（例えば、約４０～１００、約５０～１００、約６０～１００、約４０～９０、約４０～８０、約４０～７５、約５０～８５などのヌクレオチド）である。クローニングベクターへの挿入が望まれる場合には、制限部位を含有するプライマーが使用され得る。望ましい場合、アセンブルされた核酸分子は、ベクターおよび宿主細胞に直接挿入され得る。所望の構築物がかなり小さい場合（例えば、５キロベース未満）、標的ベクターへのＰＣＲベースの挿入が適切な場合がある。

標準のワークフローは、オリゴヌクレオチド合成、オリゴヌクレオチドをアセンブルするための一次アセンブリＰＣＲ、アセンブルされた産物を増幅するための一次増幅、続く増幅された産物の精製、精製された挿入物および標的ベクター間での一本鎖重複を生成するためのヌクレアーゼでの処理、標的ベクターへの挿入物の挿入、続く形質転換ステップの基本的なステップによって図１Ａに表されている。

別のアセンブリＰＣＲ法は、組み合わせた配列伸長およびライゲーション反応を含み（図１Ｂ）、上記の標準のワークフローのステップ（ｉｉ）、（ｉｉｉ）および（ｖｉ）を単一（「ワンポット」）反応に組み合わせ、一方で、他のステップ（ステップ（ｉｖ）および（ｖ）など）は省略されてもよい。特に、かかる方法は、単一ステップでの得られる亜断片－ベクター融合構築物の重複伸長ＰＣＲおよび増幅（一次増幅）を介した線状化された標的ベクターへの一本鎖重複オリゴヌクレオチドの直接アセンブリ（一次アセンブリＰＣＲ）を含む。いくつかの態様によれば、ベクター挿入前に二本鎖亜断片を生成するために別個のＰＣＲ反応は必要とされない。代わりに、アセンブルされるポリヌクレオチドの少なくとも一部を一緒に表す一本鎖オリゴヌクレオチドが、重複伸長反応に直接使用され得る。所与の線状化されたベクターの鎖を分離するための最初の変性ステップの後、一本鎖オリゴヌクレオチドは、それらの相補的な末端を介してアニーリングされる。オリゴヌクレオチドのうちの２つは、変性ベクター鎖の１つの末端とのハイブリダイゼーションを可能にするベクター骨格との配列相同性を保持するように設計されている。アニーリングされたオリゴヌクレオチドの３’末端および／またはベクター鎖の３’末端は、相補的核酸鎖の合成のためのプライマーとして機能する。ハイブリダイゼーションしたオリゴヌクレオチドの５’末端に遭遇すると、ポリメラーゼによる伸長が停止し、ニックの入った環状化された二本鎖核酸分子の産生がもたらされる。融合および増幅されたアセンブリ産物は、さらに精製することなく宿主細胞に直接形質転換され得る。いくつかの態様では、形質転換の前にライゲーションステップは実施されない。ニックの入った融合構築物の最終ライゲーションは、宿主細胞内で内因的に達成される。

アセンブリ連鎖反応では、オリゴヌクレオチドの変性、アニーリング、および相互伸長の連続サイクルによって、重複オリゴヌクレオチドが線状二本鎖ＤＮＡ断片にアセンブルされる（一次アセンブリＰＣＲ）（図２を参照されたい）。後続の増幅反応では、アセンブリＰＣＲによって形成された核酸分子は、末端プライマーを使用してＰＣＲによって増幅され、アセンブルされた核酸分子を生成および／または増幅し（一次増幅）、「そのまま」または下流のプロセス（例えば、ベクターへの挿入、図１Ａを参照されたい）において使用され得る。

本明細書に記載のいくつかの態様では、１つ以上の熱安定性不一致認識タンパク質が、アセンブリＰＣＲおよび／または増幅反応に存在する（例えば、図２を参照されたい）。熱安定性不一致認識タンパク質を含めることで、変性ステップ後に不一致認識タンパク質を追加する必要があり、複数ラウンドのエラー訂正および／またはエラー抑制を実施できる。したがって、不一致認識タンパク質を用いて、正しい核酸分子およびエラーを含有する核酸分子を含む集団中の核酸分子の数および／またはパーセンテージを減少させ得る。

増幅中の核酸分子のエラーを訂正するための１つのプロセスの概略図（プライマーは示していない）を図３に示す。この概略図は、上部左に一本鎖核酸分子を示しており、そのうちのいくつかは点変異を含有する（楕円および円で示されている）。ハイブリダイゼーションの際に、点変異を有する一本鎖核酸分子が、同じ点変異を含有しない核酸分子とハイブリダイゼーションする可能性が高い。これの正味の結果は「不一致」である。次いで、二本鎖核酸分子の集団を、認識された不一致を含有する核酸分子を切断する不一致エンドヌクレアーゼと接触させ、切断核酸分子を対数増幅に好適でないようにする。もちろん、他の方法を使用して、不一致を含有する核酸分子の対数増幅を阻害することもできる。例えば、不一致結合タンパク質を使用して、不一致を含有する核酸分子を除去するか、またはそのような核酸分子の増幅を阻害することができる。さらに、エラー低減ポリメラーゼ試薬が増幅中に使用され得る。

より詳細には、図３は、エラーが最小化された核酸分子の合成のための例示的なプロセスのワークフローを示している。第１のステップでは、アセンブルされた核酸分子よりも短い長さの核酸分子が得られる。より小さい核酸分子の各々は、アセンブルされた核酸分子の一部を含む所望のヌクレオチド配列を有することが意図される。図３に記載のプロセスの第２～最後のステップでは、アニーリングされた核酸分子を、エラー訂正プロセスの一部として、１つ以上のエキソヌクレアーゼと反応させる。このプロセスのいくつかのバリエーションは以下のとおりである。第一に、２回以上（例えば、２回、３回、４回、５回、６回など）のエラー訂正が、実施され得る。第二に、１回以上のエラー訂正において、１つより多くのエンドヌクレアーゼが使用され得る。例えば、Ｔ７ＮＩおよびＣｅｌＩＩは、エラー訂正の各ラウンドにおいて使用され得る。第三に、異なるエンドヌクレアーゼが異なるエラー訂正ラウンドにおいて使用され得る。例えば、Ｔ７ＮＩおよびＣｅｌＩＩは、エラー訂正の第１ラウンドにおいて使用され得、ＴｋｏＥｎｄｏＭＳは、エラー訂正の第２ラウンドにおいて単独で使用され得る。

多くの場合では、エラー訂正中にリガーゼが反応混合物中に存在してもよい。エラー訂正プロセスにおいて使用されるいくつかのエンドヌクレアーゼは、ニッカーゼ活性を有すると考えられる。１つ以上のリガーゼを含めると、かかる酵素によって密封ニックが引き起こされ、増幅後のエラー訂正された核酸分子の収量が増加すると考えられる。使用され得る例示的なリガーゼは、Ｔ４ＤＮＡリガーゼ、Ｔａｑリガーゼ、およびＰＢＣＶ－１ＤＮＡリガーゼである。本明細書に記載の方法の実施において使用されるリガーゼは、熱不安定性または熱安定性であり得る（例えば、Ｔａｑリガーゼ）。熱不安定性リガーゼを使用する場合、典型的には、各エラー訂正ラウンドで反応混合物に再添加する必要がある。熱安定性リガーゼは、温度が変性点以下に保たれている限り、典型的には、各ラウンド中に再添加する必要はない。

多くの場合では、核酸分子のエラー訂正は、１つ以上の異なる不一致認識タンパク質によって媒介され得る。かかるタンパク質のカテゴリーの例は、不一致結合タンパク質および不一致エンドヌクレアーゼである。さらに、不一致結合タンパク質および不一致エンドヌクレアーゼは、熱安定性または非熱安定性であり得、これは多くの場合、タンパク質が使用される条件および特定のタンパク質の生物学的活性（例えば、認識されるエラーのタイプ）の因子に依存する。

本明細書に記載の方法で使用され得るエラー訂正の１つの例示的な方法を、図４および５Ａに記載する。図４は、エラーが最小化された核酸分子の合成のための例示的なプロセスのフローチャートである。第１のステップ（ライン１）では、それからアセンブルされた核酸分子よりも短い長さの核酸分子（例えば、オリゴヌクレオチド）が得られる。各オリゴヌクレオチドは、アセンブルされた核酸分子のヌクレオチド配列の一部を含む所望のヌクレオチド配列を有することが意図される。各オリゴヌクレオチドはまた、以下のうちの１つ以上を含むヌクレオチド配列を有することを意図し得る：（１）核酸分子のＰＣＲ増幅のためのアダプタープライマー、制限酵素の認識部位、（２）マイクロチップまたは固体支持体への結合のためのテザリング配列、または（３）実験目的またはその他の意図によって決定された任意のその他のヌクレオチド配列。オリゴヌクレオチドは、本明細書の他の箇所に記載されているように、例えば、合成、購入などを介して、１つ以上の方法のうちのいずれかで得ることができる。

任意選択の第２のステップ（図４、ライン２）では、オリゴヌクレオチドを増幅して、各オリゴヌクレオチドをより多く得る。しかしながら、多くの場合では、十分な数のオリゴヌクレオチドが産生されるため、増幅は必要ない。用いられる場合、増幅は、当技術分野で既知の任意の方法、例えば、ＰＣＲ、ローリングサークル増幅（ＲＣＡ）、ループ媒介等温増幅（ＬＡＭＰ）、核酸配列ベースの増幅（ＮＡＳＢＡ）、鎖置換増幅（ＳＤＡ）、リガーゼ連鎖反応（ＬＣＲ）、自己維持配列複製（３ＳＲ）、またはブリッジＰＣＲなどの固相ＰＣＲ反応（ＳＰ－ＰＣＲ）などによって達成され得る（例えば、様々な増幅技術の概要については、Ｆａｋｒｕｄｄｉｎｅｔａｌ．，Ｊ．Ｐｈａｒｍ．Ｂｉｏａｌｌｉｅｄ．Ｓｃｉ．５（４）：２４５－２５２（２０１３）を参照されたい）。核酸分子のうちのいずれかのヌクレオチド配列への追加のエラーの導入は、増幅中に生じ得る。いくつかの場合では、合成後の増幅を避けることが好ましい場合がある。ステップ１で核酸分子が十分な収率で産生された場合、任意選択の増幅ステップは省略されてもよい。これは、例えば、ＰＣＴ公開第２０１６／０９４５１２号に記載されているように、十分な収量および品質で核酸分子の合成を可能にするように設計された、例えば最適化されたビーズ形式を使用することによって達成され得る。

第３のステップ（図４のライン３）では、任意選択で、増幅された核酸分子が、所望の長さを有することを意図した核酸分子の第１のセットにアセンブルされる（一次アセンブリＰＣＲ）。もちろん、いくつかの場合では、ライン３の核酸分子は、さらに大きな核酸分子の亜断片であってもよい。

第４のステップ（図４のライン４）では、アセンブルされた核酸分子の第１のセットを変性する。変性は、二本鎖分子から一本鎖分子にする。変性は、任意の手段によって達成され得る。いくつかの態様では、変性は、分子を加熱することによって達成される。

第５のステップ（図４のライン５）では、変性された分子をアニーリングする。アニーリングは、一本鎖分子から二本鎖核酸分子の第２のセットにする。アニーリングは、任意の手段によって達成され得る。いくつかの態様では、アニーリングは、分子を冷却することによって達成される。アニーリングされた分子のいくつかは、配列エラーの部位を表す１つ以上の不一致を含む場合がある。

第６のステップ（図４のライン６）では、分子の第２のセットを１つ以上の不一致切断エンドヌクレアーゼと反応させて、完全な所望の遺伝子配列の長さよりも短い長さを有することが意図された核酸分子の第３のセットを得る。例示的な不一致結合および／または切断酵素は、本明細書の別の場所に記載されているが、Ｔ７ＮＩ、エンドヌクレアーゼＶＩＩ（Ｔ４遺伝子４９によってコードされる）、ＲＥＳＩエンドヌクレアーゼ、ＣＥＬＩエンドヌクレアーゼ、ＥｎｄｏＭＳ（例えば、ＰｆｕＥｎｄｏＭＳ、ＴｋｏＥｎｄｏＭＳなど）、およびＳＰエンドヌクレアーゼまたは酵素複合体を含有するエンドヌクレアーゼが挙げられる。これらのエンドヌクレアーゼは、概して、第２セットの分子のうちの１つ以上をより短い分子に切断（一本鎖または二本鎖切断）することによって機能する。エラー部位で切断された１つ以上の分子の断片のアセンブリが、プロセスの最終ステップで切断エラーを除去する可能性を提供するという点で、任意のヌクレオチド配列エラーの部位での切断が特に望ましい。

第７のステップ（図４のライン７）では、分子の第３のセットが、所望のヌクレオチド配列の全長であることを意図した長さの分子の第４のセットにアセンブルされる。典型的には、重複伸長ＰＣＲに基づく第７のステップでは、ＤＮＡポリメラーゼの３’－＞５’エキソヌクレアーゼ活性が、不一致の部位で第６のステップにおいてエンドヌクレアーゼ切断によって生成された３’オーバーハングを除去し、それによってエラーを除去する。したがって、ＤＮＡポリメラーゼの固有のエキソヌクレアーゼ活性を使用して、ステップ６において除去されなかったアセンブリ中のエラーを除去し得る（例えば、不一致切断およびエキソヌクレアーゼ活性を有するヌクレアーゼの組み合わせを使用することにより）。この原理は、例えば、Ｓａａｅｍら（“ＥｒｒｏｒｃｏｒｒｅｃｔｉｏｎｏｆｍｉｃｒｏｃｈｉｐｓｙｎｔｈｅｓｉｚｅｄｇｅｎｅｓｕｓｉｎｇＳｕｒｖｅｙｏｒｎｕｃｌｅａｓｅ”，Ｎｕｃｌ，ＡｃｉｄｓＲｅｓ．，４０：ｅ２３（２０１２））において概説されている。かかる最終アセンブリステップは、末端プライマーの存在下で実施され得、それにより、クローニングまたはタンパク質発現などの下流プロセスに必要な機能が含まれる。それぞれのＰＣＲ反応は、末端プライマーの非存在下での変性、アニーリング、および伸長の約１５サイクルでの完全長への重複伸長、続く末端プライマー存在下での追加の２０サイクルによって、最初にエラー訂正された断片をアセンブルすることができるように設定され得る。

上記および図４に記載のプロセスは、米国特許第７，７０４，６９０号にも記載されている。さらに、上述のプロセスは、プロセッサ実行可能命令としてコンピュータ可読媒体上にコード化され得る。

図５Ａに記載の方法において使用され得る１つの代表的なワークフロー。このワークフローでは、３つの核酸亜断片（ライン１）がプールされ、酵素Ｔ７エンドヌクレアーゼＩ（「Ｔ７ＮＩ」）を使用してエラー訂正に供される（ライン２）。次いで、得られる産物は、ＰＣＲによってアセンブルされ（ライン３）、次いでエラー訂正の第２のラウンドに供される（ライン４）。ＰＣＲの別のラウンド（ライン５）の後、得られる核酸分子をＥ．ｃｏｌｉへ形質転換し（ステップ６）、次いで、完全長のものをスクリーニングし（ライン７）、続いてＤＮＡ調製を行う（ライン８）。次いで、これらの核酸分子は、例えば配列決定によって残りのエラーについてスクリーニングされ得る（ライン９）。図５Ａのワークフローの第１のバリエーションでは、プールされた亜断片は、エラー訂正プロセスに供される前に、エキソヌクレアーゼ（例えば、エキソヌクレアーゼＩなど）で処理され得る。エキソヌクレアーゼ処理は、後続のＰＣＲ反応を妨害し、非特異的な増幅産物を生成する可能性があるＰＣＲ反応産物に残った一本鎖プライマー分子を除去する。ワークフローの第２のバリエーションでは、第１のエラー訂正ステップは、例えば、ＲＥＳＩと組み合わせたＴ７ＮＩなどの２つ以上のエンドヌクレアーゼを使用し得る。任意選択で、ワークフローは、断片融合ＰＣＲ後に残っている不一致を排除するために、第３のエラー訂正またはエラー除去ステップを含み得る。かかる第３のステップは、例えば、ＭｕｔＳなどの不一致結合タンパク質で実施され得る。当業者は、アセンブルされた核酸分子のエラー率をさらに減少させるために、第１、第２および／または第３の、場合によってはさらなるエラー訂正および／または除去ラウンドの様々な順序および組み合わせが適用され得ることを理解するであろう。

本明細書に記載の方法で使用され得る、化学的に合成された核酸分子のエラー訂正を達成するための別のプロセスは、ＥＲＲＡＳＥ（商標）（ＮｏｖｉｃｉＢｉｏｔｅｃｈ）と称される商業的プロセスによるものである。

図５Ａのワークフローのバリエーションは、図５Ｂに概説されている。この実施形態では、３つの亜断片（図５Ｂ、ライン１）がプールされ、エキソヌクレアーゼ（例えば、エキソヌクレアーゼＩなど、右側のワークフローのライン２ａ）で処理されて、二重エラー訂正処理に供される（図５Ｂ、ライン２ｂおよび４）。エキソヌクレアーゼは、後続のＰＣＲ反応（ライン３）を妨害し、非特異的な増幅産物を生成する可能性があるＰＣＲ反応産物に残った一本鎖プライマー分子を除去する。ワークフローの別のバリエーションでは、第１のエラー訂正ステップは、例えば、ＲＥＳＩと組み合わせたＴ７ＮＩなどの１つより多くのエンドヌクレアーゼを使用し得る（図５Ｂ、ライン２ｂ）。任意選択で、ワークフローは、セグメントアセンブリＰＣＲの後に残っている不一致を排除するための第３のエラー訂正ステップを含み得る（ライン３、この例３では二次アセンブリＰＣＲ）。かかる第３のエラー訂正ステップは、例えば、ＭｕｔＳなどの不一致結合タンパク質で実施され得る（ライン４）。もちろん、アセンブルされた核酸分子のエラー率をさらに減少させるために、第１、第２および／または第３の、場合によってはさらなるエラー訂正のラウンドの様々な順序および組み合わせが適用され得る。

説明のために図５Ａに示したワークフローを使用すると、エラーを含有する核酸分子は、１つ以上のステップで除去され得る。例えば、「不一致」の核酸分子は、図５Ａのステップ１と２との間および／またはステップ１の前に除去され得る。これは、不一致エンドヌクレアーゼでの核酸分子の「予め選択された」集団の処理をもたらす。さらに、これらなどの２つのエラー訂正ステップは組み合わせて使用され得る。一例として、核酸分子を変性させ、次いで再アニーリングさせ、続いて固定化ＭｕｔＳとの結合を介して不一致を有する核酸分子を除去し、次いで続いてＭｕｔＳ結合により分離されなかった核酸分子を、変性および再アニーリングのステップ介在することなく不一致エンドヌクレアーゼと接触させ得る。理論に拘束されることを望まないが、核酸分子の増幅は、増幅される分子にエラーを導入すると考えられている。増幅媒介エラーの導入を回避する、および／またはかかるエラーを除去するための１つの手段は、ほとんどまたはすべての増幅ステップが実施された後に正しい配列を有する核酸分子の選択によるものである。説明のために図５Ｂに記載のワークフローを再度使用すると、ステップ５の後に、不一致結合タンパク質を使用する追加の分離ステップによって、不一致を有する核酸分子が不一致を有しない核酸分子から分離され得る（図５Ｂには示していない）。

このプロセスのバリエーションは、以下のとおりである。第一に、２回以上（例えば、２回、３回、４回、５回、６回など）のエラー訂正が、実施され得、各回で熱安定性不一致認識タンパク質が使用され得る。第二に、１回以上のエラー訂正において、１つより多くのエンドヌクレアーゼが使用され得る。例えば、Ｔ７ＮＩおよびＣｅｌＩＩは、エラー訂正の各ラウンドにおいて使用され得る。第三に、異なるエンドヌクレアーゼを、異なるエラー訂正ラウンドで使用し得るか、不一致結合タンパク質を使用するエラーフィルタリングのステップと組み合わせ得る。例えば、再アニーリングされたオリゴヌクレオチドのプールは、不一致結合タンパク質（ＭｕｔＳなど）を使用するエラーフィルタリングステップに供され、プールからエラーを有する第１の複数のオリゴヌクレオチドを除去し（図５Ｂを参照されたい）、次いで、残りの「結合していない」）オリゴヌクレオチドは、例えばＴ７ＮＩなどのエンドヌクレアーゼを使用してエラー訂正ステップに供されて、残りのエラーを訂正し得る。

いくつかの場合では、例えば、Ｔ７ＮＩおよびＣｅｌＩＩは、エラー訂正の第１ラウンドにおいて使用され得、ＣｅｌＩＩは、エラー訂正の第２ラウンドにおいて単独で使用され得る。もちろん、他の不一致エンドヌクレアーゼも使用され得る。別の例示的な実施形態では、分子は、１つのエンドヌクレアーゼ（緑豆エンドヌクレアーゼなどの一本鎖ヌクレアーゼもしくはＴ７ＮＩなどのリゾルバーゼまたは同様の機能の別のエンドヌクレアーゼであり得る）のみで切断される。さらに別の実施形態では、同じエンドヌクレアーゼ（例えば、Ｔ７ＮＩ）が、２つの後続のエラー訂正ラウンドにおいて使用され得る（図５Ａのライン４）。さらに別の実施形態では、不一致切断活性を有する酵素を、エキソヌクレアーゼ活性を有する酵素と組み合わせて、不一致切断後の一本鎖オーバーハングに含有されるエラーの除去が可能にし得る。特定の態様では、固有のエキソヌクレアーゼ活性を有する不一致エンドヌクレアーゼを使用して、切断および後続のエラー除去を単一ステップにおいて達成し得る。エンドヌクレアーゼおよびエキソヌクレアーゼの両方の活性を有する酵素には、例えば緑豆ヌクレアーゼ、ＣｅｌＩまたはＳＰ１エンドヌクレアーゼが含まれる。他の態様では、エラーの除去は、例えばＰＣＴ公開第２００５／０９５６０５（Ａ１）号に記載されているように、さらなるエキソヌクレアーゼ処理を含む分離ステップによって達成され得る。

多くの場合では、エラー訂正中に１つ以上のリガーゼが反応中に存在してもよい。エラー訂正プロセスにおいて使用されるいくつかのエンドヌクレアーゼは、ニッカーゼ活性を有すると考えられる。１つ以上のリガーゼを含めると、かかる酵素によって密封ニックが引き起こされ、増幅後のエラー訂正された核酸分子の収量が増加すると考えられる。使用され得る例示的なリガーゼは、Ｔ４ＤＮＡリガーゼ、Ｔａｑリガーゼ、およびＰＢＣＶ－１ＤＮＡリガーゼである。本明細書に記載の方法の実施において使用されるリガーゼは、熱不安定性または熱安定性であり得る（例えば、Ｔａｑリガーゼ）。熱不安定性リガーゼを使用する場合、典型的には、各エラー訂正ラウンドで反応混合物に添加する必要がある。熱安定性リガーゼは、温度が変性点以下に保たれている限り、典型的には、各ラウンド中に再添加する必要はない。

分子の第２のセットがより大きな核酸分子の亜断片を表す場合、一緒になってより大きな核酸分子を表す２つ以上の亜断片（例えば、２つまたは３つまたはそれ以上の亜断片）を組み合わせて、単一の反応混合物中で１つ以上の不一致切断エンドヌクレアーゼと反応させ得る。例えば、アセンブルされるオープンリーディングフレームが１ｋｂよりも長い場合、図５Ａに示されるように、ステップ３において並行反応で別々にアセンブルされた２つ以上の亜断片に分割され、得られる２つ以上の亜断片が組み合わされて、単一の反応においてエラー訂正され得る。単回のエラー訂正ラウンドで組み合わされる亜断片の量は、個々の亜断片の長さに依存する場合がある。例えば、長さ約１ｋｂの亜断片を最大３つまで、単一の反応混合物において効率的に組み合わせることができる。もちろん、３つ以上（例えば、４、５、６、７、８、９つなど）の亜断片を組み合わせてもよい。少なくとも１つの正確にアセンブルされた増幅可能および／または複製可能な核酸分子が得られる限り、アセンブリ効率が減少する可能性がある。したがって、多数の亜断片（例えば、長さ約１ｋｂの亜断片）は、正確にアセンブルされた産物核酸分子がアセンブリプロセスから得られる限り、アセンブルされ得る。

不一致を有する核酸分子は、多くの方法で不一致結合剤と結合することにより、不一致を有しない核酸分子から分離され得る。例えば、いくらかが不一致を有する、核酸分子の混合物は、（１）結合された不一致結合タンパク質を含有するカラムを通過させるか、または（２）不一致結合タンパク質が結合された表面（例えば、ビーズ（磁気ビーズなど）、プレート表面など）と接触させ得る。

例示的な形式および関連する方法には、不一致結合タンパク質が結合されたビーズまたは他の支持体を使用するものが含まれる。例えば、核酸分子の溶液を、不一致結合タンパク質が結合されたビーズと接触させ得る。次いで、不一致結合タンパク質に結合した核酸分子は、表面に連結し、溶液から容易に除去または移動されない。

図６に記載の特定の形式では、不一致結合タンパク質が結合されたビーズを、不一致結合タンパク質への不一致を有する核酸分子の結合が可能になる条件下で（例えば、５ｍＭのＭｇＣｌ₂、１００ｍＭのＫＣｌ、２０ｍＭのＴｒｉｓ－ＨＣｌ（ｐＨ７．６）、１ｍＭのＤＴＴ、２５℃で１０分間）、核酸分子が溶液中に存在する容器（例えば、マルチウェルプレートのウェル）に入れることができる。次いで、ビーズおよび／または不一致核酸分子を移すことなく、流体を別の容器（例えば、マルチウェルプレートのウェル）に移すことができる。使用できる特定のタイプのビーズの１つは、磁気不一致結合ビーズ（Μ２Β２）、ＭＡＧＤＥＴＥＣＴ（商標）（ＵｎｉｔｅｄＳｔａｔｅｓＢｉｏｌｏｇｉｃａｌ、Ｓａｌｅｍ，ΜΑ、カタログ番号Ｍ９５５７－０１Ａ）である。さらに、図６に記載のものと同様または同一のワークフローにおいて使用される不一致結合タンパク質は、熱安定性または非熱安定性であり得る。

一例として、不一致を含有する二本鎖核酸分子に結合することが示されているタンパク質は、Ｅ．ｃｏｌｉＭｕｔＳである（Ｗａｇｎｅｒｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，２３：３９４４－３９４８（１９９５））。Ｗａｎｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，４２：ｅ１０２（２０１４）は、エラーを含有する化学的に合成された核酸分子が、エラーを含有しない核酸分子が保持されないＭｕｔＳ固定化セルロースカラム上に保持され得ることを実証した。

したがって、本明細書に記載の主題は、核酸分子が変性され、続いて再アニーリングされ、続いて不一致を含有する再アニーリングされた核酸分子が分離される方法および関連する組成物を含む。いくつかの態様では、使用される不一致結合タンパク質は、ＭｕｔＳ（例えば、Ｅ．ｃｏｌｉＭｕｔＳ）である。もちろん、表１２および１５に記載のものなどの他の不一致結合タンパク質も使用され得る。

さらに、不一致結合タンパク質の混合物は、本明細書に記載の方法の実施において使用され得る。異なる不一致結合タンパク質は、それらが結合する不一致のタイプに関して異なる活性を有することが見出されている。例えば、ＴｈｅｒｍｕｓａｑｕａｔｉｃｕｓＭｕｔＳは挿入／欠失エラーを効果的に除去することが示されているが、Ｅ．ｃｏｌｉＭｕｔＳよりも置換エラーを除去する効果が低い。さらに、２つのＭｕｔＳホモログの組み合わせは、置換および挿入／欠失エラーの両方の除去に関してエラー訂正の効率をさらに改善し、バイアスがかかった結合の影響も軽減することが示された。したがって、本明細書に記載の主題は、２つ以上（例えば、約２～約１０、約３～約１０、約４～約１０、約２～約５、約３～約５、約４～約６、約３～約７など）の不一致結合タンパク質混合物を含む。

本明細書に記載の主題は、不一致結合タンパク質を使用したエラー訂正の複数のラウンド（例えば、約２～約１０、約３～約１０、約４～約１０、約２～約５、約３～約５、約４～約６、約３～約７など）の使用をさらに含む。エラー訂正のこれらのラウンドのうちの１つ以上は、２つ以上の不一致結合タンパク質の使用を用い得る。あるいは、単一の不一致結合タンパク質をエラー訂正の第１のラウンドにおいて使用し、同じまたは別の不一致結合タンパク質をエラー訂正の第２のラウンドにおいて使用し得る。

オリゴヌクレオチド合成が完了すると、得られるオリゴヌクレオチドは、典型的には、以下のうちの１つ以上を含む一連の後処理ステップに供される：（ａ）オリゴヌクレオチドの切断もしくはそれらが合成された支持体からの溶出、（ｂ）濃度測定、（ｃ）各オリゴヌクレオチド種の均等に濃縮された希釈液を得るために、多くの場合、「正規化」と呼ばれる、オリゴヌクレオチド溶液の濃度調整または希釈、および／または（ｄ）２つ以上の正規化されたオリゴヌクレオチド試料のアリコートをプールもしくは混合し、１つ以上の特定の核酸分子をアセンブルするのに必要なすべてのオリゴヌクレオチドの等モル混合物を得ることであり、前述のステップは異なる順序で組み合わされ得る。

本明細書に記載の主題の態様で使用され得る核酸合成中のエラーを低減するためのさらに別のプロセスは、環状アセンブリ増幅と称され、ＰＣＴ公開第２００８／１１２６８３（Ａ２）号に記載されている。

合成で生成された核酸分子は、典型的には、３００～５００塩基中約１塩基のエラー率を有する。合成エラーが、３００～５００塩基中１塩基より実質的に低くなるように条件が調整され得る。さらに、多くの場合では、エラーの８０％超が、単一の塩基フレームシフトの欠失および挿入である。また、高忠実度ＰＣＲ増幅が用いられた場合、ポリメラーゼの作用により２％未満のエラーがもたらされる。したがって、上述のＰＣＲベースのアセンブリステップを使用するエラー訂正プロセスを、ポリメラーゼ活性を含まない１つ以上のエラー訂正方法と組み合わせることができる。多くの場合では、不一致エンドヌクレアーゼ（ＭＭＥ）訂正は、固定されたタンパク質：ＤＮＡ比を使用して実施される。非ＰＣＲベースのエラー訂正は、例えば、多くの方法で不一致結合剤と結合することにより、不一致を有する核酸分子を不一致を有しない核酸分子から分離することにより達成され得る。例えば、いくらかが不一致を有する、核酸分子の混合物は、（１）結合された不一致結合タンパク質を含有するカラムを通過させるか、または（２）不一致結合タンパク質が結合された表面（例えば、ビーズ（磁気ビーズなど）、プレート表面など）と接触させ得る。

例示的な形式および関連する方法は、不一致結合タンパク質が結合された表面または支持体（例えば、ビーズ）を使用するものが含まれる。例えば、核酸分子の溶液を、不一致結合タンパク質が結合されたビーズと接触させ得る。本明細書に記載の方法の様々な態様において使用され得る１つの不一致結合タンパク質は、Ｔｈｅｒｍｕｓａｑｕａｔｉｃｕｓ由来のＭｕｔＳであり、その遺伝子配列は、ＢｉｓｗａｓａｎｄＨｓｉｅｈ，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２７１：５０４０－５０４８（１９９６）に記載されており、ＧｅｎＢａｎｋ、アクセッション番号Ｕ３３１１７で入手可能である。さらに、ＥｎｄｏＭＳ（例えば、ＰｆｕＥｎｄｏＭＳ、ＴｋｏＥｎｄｏＭＳなど）、例えばセロリ由来のＴ７ＮＩまたはＣｅｌＩなどの不一致切断エンドヌクレアーゼを遺伝子操作して、不一致結合に基づくエラーフィルタリングプロセスにおいての使用のための切断機能を不活性化することができる。不一致結合タンパク質に結合される核酸分子は、核酸分子のプールから能動的に除去されるか（例えば、不一致結合タンパク質でコーティングされた磁気ビーズが使用される磁力を介して）、または未結合の核酸は試料から（ピペッティング、音響液体処理などによって）除去または移動されるが、それらは試料中に残るように表面に固定化もしくは連結され得る。かかる方法は、例えば、ＰＣＴ公開第２０１６／０９４５１２号に記載されている。

上記のように、不一致認識タンパク質は、核酸分子のハイブリダイゼーションと組み合わせて使用され得る。組成物中に含まれ、本明細書に記載の方法において使用される不一致認識タンパク質は、熱安定性または非熱安定性であり得る。さらに、本明細書に記載の方法は、核酸関連のワークフロー（例えば、アセンブリＰＣＲ、増幅、エラー訂正単独、またはこれらのプロセスの１つ以上の組み合わせ）において、１つより多くの不一致認識タンパク質が１つより多くの位置で使用される方法を含む。

熱安定性不一致認識タンパク質（例えば、１つ以上の熱安定性不一致エンドヌクレアーゼ）により、各熱変性ステップ後に不一致認識タンパク質を再添加する必要なく、アセンブリＰＣＲ、増幅、およびエラー訂正などのプロセス中に配列エラーを排除することができる。したがって、本明細書に記載の組成物および方法は、不一致認識タンパク質が各核酸変性ステップ後に添加されない複数ラウンドのエラー訂正を可能にする。もちろん、非熱安定性不一致認識タンパク質もかかるワークフローにおいて使用され得るが、かかるタンパク質の不一致認識活性は、概して、各熱変性サイクルによって排除されるか、実質的に減少する。多くの場合では、各熱変性サイクルで非熱安定性不一致認識タンパク質をさらに追加することが必要または望ましい。

ワークフローで使用される不一致認識タンパク質のタイプは、変化し得る。いくつかの場合では、ワークフローにおける１つ以上の場所でエラー訂正が実施され得る。いくつかの場合では、熱安定性不一致認識タンパク質が、多くの場合、非熱安定性不一致認識タンパク質と組み合わせて使用される。

エラーを有する核酸分子を除去するための１つの方法は、エラーを含有しない核酸分子からかかる核酸分子を分離することによるものである。したがって、本明細書では、エラーを含有する核酸分子に結合する薬剤、およびエラーを含まない核酸分子からのそれらの分離を使用するワークフロー、ならびにかかるワークフローで使用される組成物が提供される。かかる薬剤の例は、不一致結合タンパク質である。

不一致結合タンパク質は、支持体に結合され得、例えば、不一致を有する核酸分子が支持体に結合される条件下で、不一致を有する核酸分子および不一致を有しない核酸分子を含有する試料と接触され得る。次いで、不一致を有する核酸分子が結合される支持体を不一致を有しない核酸分子との接触から除去し得、それによって不一致を有する核酸分子を不一致のない核酸分子から分離することができる。

組成物中の正しい核酸分子のパーセンテージを増加させるための別の方法は、エラー（例えば、欠失、挿入、不一致など）を含有する核酸分子の増幅を抑制することによるものである。いくつかの場合では、１つ以上のエラーを含有する核酸分子のアセンブリＰＣＲおよび／または増幅を阻害することによって、核酸分子の集団におけるエラーの数を低減させる、１つ以上のタンパク質（例えば、１つ以上の不一致結合タンパク質）が使用され得る。いくつかの場合では、１つ以上のエラーを含有する核酸分子のアセンブリＰＣＲおよび／または増幅を冷遇することによって、核酸分子の集団におけるエラーの数を低減させる、ポリメラーゼ試薬が使用され得る。

実施され得るワークフローのいくつかの例を表１に記載する。

例えば、表１に記載のワークフローバリエーションによって示されるように、本明細書で提供されるのは、核酸分子の集団を生成するための組成物および方法である。いくつかのかかる方法では、これらのワークフローは、一本鎖核酸分子が互いにハイブリダイゼーションして二本鎖核酸分子を形成する、２つ以上の異なるタイプのプロセス（例えば、核酸アセンブリ、核酸増幅、核酸変性／再生など）を含む。かかるワークフローのすべてまたは一部で、エラー訂正またはエラー低減のいずれかが生じ得る。いくつかの場合では、表１で参照されているステップ間でエラー訂正が生じ得る。例えば、１つ以上の非熱安定性不一致エンドヌクレアーゼ（例えば、Ｔ７ＮＩ）が一次増幅後に使用される場合、典型的には二次増幅の前に増幅産物と接触される。これは、通常、熱サイクルが非熱安定性不一致エンドヌクレアーゼを変性させるためである。不一致結合タンパク質はまた、不一致結合タンパク質を用いて不一致核酸分子を不一致していない核酸分子から分離する増幅ステップ間に使用され得る。

いくつかの場合では、本明細書に記載のプロセスの集合的効果により、５００塩基対当たり１未満のエラー（例えば、５００塩基対当たり約１つ～２，０００塩基対当たり約１つ、６００塩基対当たり約１つ～２，０００塩基対当たり約１つ、７００塩基対当たり約１つ～２，０００塩基対当たり約１つ、８００塩基対当たり約１つ～２，０００塩基対当たり約１つ、９００塩基対当たり約１つ～２，０００塩基対当たり約１つ、１，０００塩基対当たり約１つ～２，０００塩基対当たり約１つ、７００塩基対当たり約１つ～１，５００塩基対当たり約１つ、７００塩基対当たり約１つ～１，２００塩基対当たり約１つ、７００塩基対当たり約１つ～１，０００塩基対当たり約１つ、８００塩基対当たり約１つ～１，２００塩基対当たり約１つなど）を含有する核酸分子の集団がもたらされ得る。

１つ以上の不一致結合タンパク質（例えば、熱安定性不一致結合タンパク質）のアセンブリＰＣＲ混合物への添加は、不一致結合タンパク質がアニーリング中に形成された不一致に結合する場合、ポリメラーゼによる伸長を遮断することにより、配列エラーを含有するオリゴヌクレオチドの機能的除去に使用され得る（Ｆｕｋｕｉｅｔａｌ．，“ＳｉｍｕｌｔａｎｅｏｕｓＵｓｅｏｆＭｕｔＳａｎｄＲｅｃＡｆｏｒＳｕｐｐｒｅｓｓｉｏｎｏｆＮｏｎｓｐｅｃｉｆｉｃＡｍｐｌｉｆｉｃａｔｉｏｎｄｕｒｉｎｇＰＣＲ”Ｊ．ＮｕｃｌｅｉｃＡｃｉｄｓ，Ｖｏｌｕｍｅ２０１３，ＡｒｔｉｃｌｅＩＤ８２３７３０を参照されたい）。

不一致結合タンパク質および不一致エンドヌクレアーゼは、多くの場合、特定のタイプの不一致に対して特異性を示す。したがって、いくつかの場合では、１つより多くの不一致認識タンパク質が、本明細書に記載のワークフローで使用され得る。さらに、１つより多くの不一致認識タンパク質が存在する場合、多くの場合では、タンパク質のエラー認識活性が異なる。例えば、不一致エンドヌクレアーゼＴｋｏＥｎｄｏＭＳおよびＴ７ＮＩは、Ｔ７ＮＩがＴｋｏＥｎｄｏＭＳよりも欠失および挿入に関して高い活性を有すると考えられるという点で異なる（図９～１１を参照されたい）。さらに、１つより多くの不一致認識タンパク質が使用される場合、これらのタンパク質は、異なるタイプの不一致に関して異なる活性を有する場合がある。

図７は、オリゴヌクレオチドが一次アセンブリＰＣＲによってアセンブルされたデータを示す。次いで、アセンブルされた核酸分子を、ＴｋｏＥｎｄｏＭＳの存在下での一次増幅、およびＴ７ＮＩとともに、またはＴ７ＮＩを含まず一次増幅産物のインキュベーション後の二次増幅のいずれかに供した。次いで、得られた核酸分子を配列決定して、エラー率を決定した。

試料番号１（Ｓｔｄ－ＥＣなし）は、エラー訂正なしで６６個の断片がアセンブルされた対照実行であった。この図からわかり得るように、試料番号１のエラー率の中央値は、３０８中１である。これは、一次後増幅Ｔ７ＮＩ媒介エラー訂正を使用した場合（試料番号２）、４５６中１に増加する。試料番号１および２は、エラー訂正なしの条件、およびアセンブルされた断片のＴ７ＮＩ一次後増幅を使用したエラー訂正の条件のエラー訂正ベースラインを表す。

図７の試料番号３および４のデータは、熱安定性不一致エンドヌクレアーゼ（ＴｋｏＥｎｄｏＭＳ）が増幅プロセスのみに存在し、アセンブリＰＣＲプロセスには存在しない条件下で生成された。さらに、試料番号４については、一次後増幅後Ｔ７ＮＩ媒介エラー訂正が使用され、試料番号３については、一次後増幅Ｔ７ＮＩ媒介エラー訂正は使用されなかった。図７からわかり得るように、試料番号３のエラー率は、３５３中１である。これは、一次後増幅Ｔ７ＮＩ媒介エラー訂正を使用した場合（試料番号４）、７１６中１に増加する。

図７の試料番号５および６のデータは、熱安定性不一致エンドヌクレアーゼ（ＴｋｏＥｎｄｏＭＳ）がアセンブリＰＣＲプロセスに存在するが増幅プロセスには存在しない条件下で生成された。さらに、試料番号６については、一次後増幅後Ｔ７ＮＩ媒介エラー訂正が使用され、試料番号５については、一次後増幅Ｔ７ＮＩ媒介エラー訂正は使用されなかった。図７からわかり得るように、試料番号５のエラー率の中央値は、３９８中１である。これは、一次後増幅Ｔ７ＮＩ媒介エラー訂正を使用した場合（試料番号６）、８３０中１に増加する。

図４の試料番号７および８のデータは、熱安定性不一致エンドヌクレアーゼ（ＴｋｏＥｎｄｏＭＳ）がアセンブリＰＣＲおよび増幅プロセスの両方に存在する条件下で生成された。さらに、試料番号８については、一次後増幅後Ｔ７ＮＩ媒介エラー訂正が使用され、試料番号７については、一次後増幅Ｔ７ＮＩ媒介エラー訂正は使用されなかった。図７からわかり得るように、試料番号７のエラー率の中央値は、４８８中１である。これは、一次後増幅Ｔ７ＮＩ媒介エラー訂正を使用した場合（試料番号８）、８０３中１に増加する。

図７に記載のデータは、熱安定性不一致エンドヌクレアーゼを使用して調製され、Ｔ７ＮＩ媒介エラー訂正に供されたアセンブルされ増幅された核酸分子が、最低の総エラー率を有することを示す。

以下の表１は、図７から導き出されたデータを示す。表２から、以下の実施例１に記載のＴｋｏＥｎｄｏＭＳ方法を使用して調製された核酸分子に存在する総エラーの最低レベルは、試料番号４、６、および８において見出されたことがわかり得る。これらの試料は、（１）アセンブリＰＣＲプロセス、（２）増幅プロセス、または（３）アセンブリＰＣＲおよび増幅プロセスの両方中にＴｋｏＥｎｄｏＭＳが存在したという共通点を共有している。さらに、これらの試料の３つすべては、一次後増幅Ｔ７ＮＩ媒介エラー訂正にも供された。

図７および表２のデータは、（１）アセンブリＰＣＲプロセス単独における不一致エンドヌクレアーゼの存在は、増幅プロセス単独における不一致エンドヌクレアーゼの存在よりも低いエラー率をもたらすこと、ならびに（２）一次後増幅不一致エンドヌクレアーゼ媒介エラー訂正ステップを含めることは、アセンブリＰＣＲプロセスおよび／または増幅プロセスにおける熱安定性不一致エンドヌクレアーゼ活性の使用と組み合わせて使用される場合、エラー訂正強化を提供することを示唆している。

本明細書では、アセンブルされ増幅された核酸分子のエラー率が、５００塩基対中約１つ～５，０００塩基対中約１つ（例えば、５５０塩基対中約１つ～１，５００塩基対中約１つ、６００塩基対中約１つ～１，５００塩基対中約１つ、６５０塩基対中約１つ～１，５００塩基対中約１つ、７００塩基対中約１つ～１，５００塩基対中約１つ、８００塩基対中約１つ～１，５００塩基対中約１つ、５００塩基対中約１つ～１，４００塩基対中約１つ、５００塩基対中約１つ～１，３５０塩基対中約１つ、５００塩基対中約１つ～１，３００塩基対中約１つ、５００塩基対中約１つ～１，２５０塩基対中約１つ、５００塩基対中約１つ～１，２００塩基対中約１つ、５００塩基対中約１つ～１，１５０塩基対中約１つ、５００塩基対中約１つ～１，０００塩基対中約１つ、６００塩基対中約１つ～１，０００塩基対中約１つ、６５０塩基対中約１つ～１，０００塩基対中約１つ、６００塩基対中約１つ～９００塩基対中約１つ、６５０塩基対中約１つ～９００塩基対中約１つ、７００塩基対中約１つ～８５０塩基対中約１つ、５５０塩基対中約１つ～２，０００塩基対中約１つ、５５０塩基対中約１つ～２，５００塩基対中約１つ、５５０塩基対中約１つ～３，５００塩基対中約１つ、５５０塩基対中約１つ～４，５００塩基対中約１つ、９００塩基対中約１つ～３，５００塩基対中約１つ、１，５００塩基対中約１つ～５，０００塩基対中約１つ、２，０００塩基対中約１つ～５，０００塩基対中約１つ、２，５００塩基対中約１つ～５，０００塩基対中約１つなど）である組成物および方法が提供される。かかる核酸分子は、一次アセンブリＰＣＲおよび一次アセンブリ、任意選択で、続く二次増幅によって生成され得る。

本明細書では、単一の対照／「ベンチマーク」試料実行または対照／「ベンチマーク」試料実行の平均のいずれかを使用して、エラー訂正なしでアセンブルされ増幅された核酸分子のエラー率と比較した場合、アセンブルされ増幅された核酸分子のエラー率の倍率減少（「Ｘ」）が、１．７５より大きい（例えば、約１．７５～約８、約１．７５～約７、約１．７５～約８、約１．７５～約５、約１．７５～約４、約１．７５～約３、約２．０～約８、約２．１～約８、約２．２～約８、約２．３～約８、約２．５～約８、約２．７５～約８、約２．０～約７、約２．０～約６、約２．０～約５、約２．０～約４．５、約２．２～約８、約２．２～約７、約２．２～約６、約２．２～約５、約２．２～約３、約２．２～約２．８、約２．１～約２．８など）組成物および方法が提供される（図７および表２のデータを参照されたい）。エラー率の倍率減少を計算するために使用され得る式は、以下のとおりである。

式中、Ｘは、エラーの倍率減少、Ｙは、エラー訂正ステップ後のエラー率の数、Ｚはエラー訂正ステップ前のエラー率の数である。図７のライン８は、８０３中１のエラー率（Ｙ）を示している。図７のライン１は、３０８中１のエラー率（Ｙ）を示している。これらの数値を使用すると、エラー率の倍率減少（Ｘ）は、２．６である。

図９、１０、および１１は、図７および８を生成するために使用された実験データを使用する、欠失、挿入、および置換に関連するエラー率に関連する詳細なデータを示す。

試料番号８、６、４、および２（Ｔ７ＮＩ処理）はすべて、図９および１０において同様に低レベルの欠失および挿入を示している。これらのデータは、アセンブリＰＣＲおよび増幅中にＴｋｏＥｎｄｏＭＳによって除去されなかった欠失および挿入が、一次後増幅Ｔ７ＮＩ媒介エラー訂正によって除去されることを示している。

図１０は、ＴｋｏＥｎｄｏＭＳが、アセンブリＰＣＲプロセス、増幅プロセス、またはアセンブリＰＣＲおよび増幅プロセスの両方に含まれる場合、置換エラーを排除することを示す。

二本鎖核酸分子においては、多くの異なるタイプの置換が見出され得る。さらに、不一致認識タンパク質は、多くの場合、それらが活性を示す置換のタイプの特異性が変わる。この特異性は、二価金属イオンの存在または非存在、および周囲の核酸領域などの特定の条件によって変わり得る。ＥｎｄｏＭＳのこれらのバリエーションのいくつかは、Ｉｓｈｉｎｏｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．４４：２９７７－２９８９（２０１６）に記載されている。追加のＥｎｄｏＭＳタンパク質を表１５に記載する。また、Ｐｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓ由来の野生型熱安定性不一致エンドヌクレアーゼの改変された形態が生成された（米国特許第１０，１９６，６１８号および米国特許公開第２０１７／２５３９０９号を参照されたい）。さらに、不一致認識活性が変わるように野生型不一致認識タンパク質（例えば、不一致エンドヌクレアーゼ）の改変された形態が生成され得る。野生型不一致認識タンパク質のかかる改変された形態は、本明細書に記載の方法に含まれ、および／またはそれらにおいて使用され得る。

図１２Ａ～１２Ｄは、実施例１において使用された条件下でのＴｋｏＥｎｄｏＭＳのいくつかのエラー訂正特性を示す。図１２Ａおよび１２Ｃは、エラー訂正がない場合（図１２Ａ）およびＴｋｏＥｎｄｏＭＳがアセンブリＰＣＲプロセスおよび増幅プロセスの両方に含まれた場合（図１２Ｃ）に生成されたアセンブルおよび増幅された核酸分子において見出された欠失、挿入および置換レベルを比較する。わかり得るように、欠失および挿入の数は、両方のセットの条件下で類似している。データにはかなりの変動があるが、これらのデータから、ＴｋｏＥｎｄｏＭＳが存在する場合は置換率が低いことがわかる。

図１２Ｂおよび１２Ｄは、特定の置換に関するＴｋｏＥｎｄｏＭＳのいくつかのエラー訂正活性を示す。ＴｋｏＥｎｄｏＭＳは、ほとんどのトランジションおよびトランスバージョンを訂正するのに効果的であるようだが、ＴＶ１（Ｃ－ＴおよびＧ－Ａ）およびＴＶ４（Ｃ－ＴおよびＧ－Ａ）不一致に関連した活性が低いようである（図１２Ｄ）。さらに、Ｔ７ＮＩはまた、ＴＶ１（Ｃ－ＴおよびＧ－Ａ）およびＴＶ４（Ｃ－ＴおよびＧ－Ａ）不一致に関連する活性が低いようである（図１２Ｂ）。

ＳＵＲＶＥＹＯＲ（登録商標）ヌクレアーゼはすべてのタイプの不一致を切断するが、いくつかは他よりも優先されると考えられている。特に、Ｃ－Ｔ、Ａ－Ｃ、およびＣ－Ｃは、等しくＴ－Ｔよりも優先され、Ａ－ＡおよびＧ－Ｇが続き、最後に最も優先度の低いＡ－ＧおよびＧ－Ｔが続く。

多くの不一致認識タンパク質（例えば、表１５に記載の不一致認識タンパク質）は、異なるタイプの不一致に対する認識活性を有することが既知である。いくつかの不一致認識タンパク質のエラー訂正特異性を表３に示す。

本明細書に記載の方法には、１つより多くの不一致認識タンパク質を組み合わせて使用する方法が含まれる。説明のために図１Ａに示すワークフローを使用すると、ＰｆｕＥｎｄｏＭＳおよびＴｋｏＥｎｄｏＭＳは、オリゴヌクレオチドアセンブリプロセスにおいて一緒に使用され得る。これは、重複しているが異なるエラー認識活性を有する２つの異なる不一致エンドヌクレアーゼの存在をもたらす。さらに、ＴａｑＭｕｔＳおよびＴｔｈＭｕｔＳの一方または両方は、互いに、または例えば、ＰｆｕＥｎｄｏＭＳおよびＴｋｏＥｎｄｏＭＳと組み合わせて、それらによって認識されるエラーを含有する二本鎖核酸分子を除去するため使用され得る。

本明細書では、認識されるエラーのタイプが異なる不一致認識タンパク質の配列または同時使用を含む、核酸分子のエラーの訂正のための方法が提供される。

本明細書で提供される方法における使用に好適なエラー訂正方法および試薬は、米国特許第７，８３８，２１０号および同第７，８３３，７５９号、米国特許公開第２００８／０１４５９１３（Ａ１）号（不一致エンドヌクレアーゼ）、ＰＣＴ公開第２０１１／１０２８０２（Ａ１）号、ならびにＭａｅｔａｌ．，ＴｒｅｎｄｓｉｎＢｉｏｔｅｃｈｎｏｌｏｇｙ，３０（３）：１４７－１５４（２０１２）に記載されている。さらに、当業者は、エラー訂正および／またはエラーフィルタリング（すなわち、エラーを含有する分子を特異的に除去する）の他の方法、例えば米国特許公開第２００６／０１２７９２０（ＡＡ）号、同第２００７／０２３１８０５（ＡＡ）号、同第２０１０／０２１６６４８（Ａ１）号、または同第２０１１／０１２４０４９（Ａ１）号に記載されているものなどが、本明細書に記載されている主題の特定の態様において実施され得ることを認識するであろう。

本明細書で提供されるのは、多くの異なるエラー訂正剤を含有および使用する組成物および方法である。かかるエラー訂正剤は、不一致とも称される以下のエラーのタイプ：欠失、挿入および置換のうちの１つ以上の訂正に関連する活動を有する。さらに、置換に関しては、活性は、概して異なるタイプの置換に指向される。

多くの異なるポリメラーゼおよび異なるタイプのポリメラーゼが、本明細書に記載の組成物および方法に含有され、使用され得る。アセンブリＰＣＲおよび増幅ワークフローの１つ以上のステップにおいて使用されるポリメラーゼのタイプは、アセンブルされた核酸分子に存在するエラーの数に影響を与えると考えられている。

図１３および１４Ａ～１４Ｄは、異なるタイプのポリメラーゼを使用して生成されたデータを示す。図１３は、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼと組み合わせて、エラー訂正なしで生成されたデータを示し、アセンブリＰＣＲおよび増幅エラーの訂正は、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ試薬と組み合わせたＴｋｏＥｎｄｏＭＳを使用して実施された。

本明細書で提供される方法の代表的なワークフローを図５Ａに記載する。このワークフローでは、３つの核酸セグメント（「亜断片」と称される）をプールし、酵素Ｔ７エンドヌクレアーゼＩ（「Ｔ７ＮＩ」）を使用してエラー訂正に供する（図５Ａ、ライン２）。次いで、３つの核酸セグメントをＰＣＲ（二次アセンブリＰＣＲ）によってアセンブルし（図５Ａ、ライン３）、次いで、エラー訂正の第２のラウンドに供する（図５Ａ、ライン４）。ＰＣＲの別のラウンド（三次アセンブリＰＣＲ）（ライン５）の後、得られる核酸分子を全長のものに対してスクリーニングする（図５Ａ、ライン７）。次いで、これらの核酸分子を、例えばヌクレオチド配列決定によって残りのエラーについてスクリーニングし得る。

合成後、オリゴヌクレオチドは、段階的により大きな核酸分子にアセンブルされ（一次アセンブリＰＣＲ）、任意選択で増幅され得る。核酸分子をアセンブルするために使用される方法は、変化し得る（例えば、図１Ａおよび１Ｂを参照されたい）。さらに、エラー訂正は、使用される方法に関係なく、好適なアセンブリプロセスに統一され得る。多くの場合では、エラー訂正は、不一致認識タンパク質（例えば、不一致結合タンパク質および不一致エンドヌクレアーゼなどの熱安定性不一致認識タンパク質）を使用して実施され得る。

いくつかの態様では、アセンブルされた核酸分子の長さは、約２０塩基対～約１０，０００塩基対、約１００塩基対～約５，０００塩基対、約１５０塩基対～約５，０００塩基対、約２００塩基対～約５，０００塩基対、約２５０塩基対～約５，０００塩基対、約３００塩基対～約５，０００塩基対、約３５０塩基対～約５，０００塩基対、約４００塩基対～約５，０００塩基対、約５００塩基対～約５，０００塩基対、約７００塩基対～約５，０００塩基対、約８００塩基対～約５，０００塩基対、約１，０００塩基対～約５，０００塩基対、約１００塩基対～約４，０００塩基対、約１５０塩基対～約４，０００塩基対、約２００塩基対～約４，０００塩基対、約３００塩基対～約４，０００塩基対、約５００塩基対～約４，０００塩基対、約５０塩基対～約３，０００塩基対、約１００塩基対～約３，０００塩基対、約２００塩基対～約３，０００塩基対、約２５０塩基対～約３，０００塩基対、約３００塩基対～約３，０００塩基対、約４００塩基対～約３，０００塩基対、約６００塩基対～約３，０００塩基対、約８００塩基対～約３，０００塩基対、約１００塩基対～約２，０００塩基対、約２００塩基対～約２，０００塩基対、約３００塩基対～約１，５００塩基対など変化し得る。

核酸の増幅およびアセンブリのために、任意の数の方法が使用され得る。１つの例示的な方法は、Ｙａｎｇｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ２１：１８８９－１８９３（１９９３）および米国特許第５，５８０，７５９号に記載されている。Ｙａｎｇらに記載されたプロセスでは、線状ベクターが、末端で配列相同性を共有する二本鎖核酸分子と混合される。エキソヌクレアーゼ活性を有する酵素（すなわち、Ｔ４ＤＮＡポリメラーゼ、Ｔ５エキソヌクレアーゼ、Ｔ７エキソヌクレアーゼなど）が添加され、それは混合物中に存在するすべての末端の一本鎖オーバーハングを生成する。次いで、一本鎖オーバーハングを有する核酸分子をアニーリングし、一本鎖ギャップの充填を可能にする条件下でＤＮＡポリメラーゼおよびデオキシヌクレオチド三リン酸とともにインキュベーションする。得られる核酸分子におけるニックは、分子を細胞に導入することによって、またはリガーゼを添加することによって修復され得る。もちろん、用途およびワークフローによってベクターを省略してもよい。さらに、得られる核酸分子またはその亜部分は、ポリメラーゼ連鎖反応によって増幅され得る。

核酸アセンブリの他の方法には、米国特許公開第２０１０／００６２４９５（Ａ１）号、同第２００７／０２９２９５４（Ａ１）号、同第２００３／０１５２９８４（ＡＡ）号、および同第２００６／０１１５８５０（ＡＡ）号、米国特許第６，０８３，７２６号、同第６，１１０，６６８号、同第５，６２４，８２７号、同第６，５２１，４２７号、同第５，８６９，６４４号、および同第６，４９５，３１８号ならびにＷＯ２０２０／００１７８３（Ａ１）に記載のものが含まれる。

核酸分子の等温アセンブリのための方法は、米国特許公開第２０１２／００５３０８７号に記載されている。この方法の一態様では、アセンブリのための核酸分子は、エキソヌクレアーゼ活性を有する熱不安定性タンパク質（例えば、Ｔ５ポリメラーゼ）と接触され、任意選択で、エキソヌクレアーゼ活性が時間とともに減少する条件下（例えば、５０℃）で、熱安定性ポリメラーゼおよび／または熱安定性リガーゼと接触される。エキソヌクレアーゼは、核酸分子の１本の鎖を「噛み返し」、配列の相補性がある場合、核酸分子は互いにアニールする。一実施形態では、熱安定性ポリメラーゼを使用してギャップを埋めることができ、熱安定性リガーゼを提供してニックを密封することができる。別の実施形態において、アニーリングされた核酸産物は、宿主細胞を形質転換するために直接使用され得、ギャップおよびニックは、形質転換された細胞の内因性酵素活性によって「インビボ」で修復される。

Ｔ４遺伝子３２タンパク質およびＲｅｃＡなどの一本鎖結合タンパク質、ならびに当技術分野で既知の他の核酸結合タンパク質または組換えタンパク質が、例えば、核酸分子のアニーリングを容易にするために含まれ得る。

いくつかの場合では、部分的および完全にアセンブルされた核酸分子の標準的なリガーゼベースの結合が使用され得る。例えば、アセンブルされた核酸分子は、それらの末端近くに制限酵素部位を有するように生成され得る。次いで、これらの核酸分子をより好適な制限酵素のうちの１つで処理して、例えば、１つまたは２つのいずれかの「粘着末端」を生成し得る。次いで、これらの粘着末端分子は、標準の制限酵素－リガーゼ法によってベクターに導入され得る。不活性核酸分子が粘着末端を１つだけ有する場合、「非粘着」末端の平滑末端ライゲーションのためにリガーゼが使用され得る。

核酸分子の多重アセンブリ
オリゴヌクレオチド集団の複雑さは、部分的に、存在する異なるオリゴヌクレオチドの数によって決定される。いくつかの場合では、異なるヌクレオチド配列を有するように設計された存在するオリゴヌクレオチドの数は、約２，０００～約２０，０００個であり得る（例えば、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個、約２，０００～約２０，０００個など）。

さらに、反応混合物中のオリゴヌクレオチドは、１つより多くのより大きな核酸分子の亜断片を表し得る。例として、１つの反応混合物中で３つのアセンブルされた核酸分子をアセンブルすることが望まれ、アセンブルされた核酸分子の各々をアセンブルするために１０個のオリゴヌクレオチドが必要である場合、反応混合物は最初に少なくとも３０個のオリゴヌクレオチドを含むであろう。

本明細書において提供されるのは、１つより多くのアセンブルされてエラー訂正された核酸をアセンブルするのに有用な組成物および方法である。いくつかの場合では、これらの方法によって生成されるアセンブルされたエラー訂正された核酸分子の数は、約２～約１００個である（例えば、約２～約９０個、約２～約８０個、約２～約７０個、約２～約５０個、約５～約９０個、約５～約６０個、約８～約９０個、約８～約５０個、約８～約３５個、約１０～約９０個、約２～約６０個、約１５～約９０個、約１５～約５５など）。

ポリメラーゼおよびポリメラーゼ試薬
多くの異なるタイプのＤＮＡポリメラーゼがある。例として、多くの原核細胞は、ＤＮＡポリメラーゼＩ型、ＩＩ型およびＩＩＩ型を含有する。ＤＮＡポリメラーゼには、プルーフリーディング活性を有する場合があるか、または有しない場合がある。プルーフリーディングＤＮＡポリメラーゼは、典型的には、３’から５’へのエキソヌクレアーゼ活性も有している。さらに、ＤＮＡポリメラーゼは、熱安定性または非熱安定性であり得る。

任意のタイプのＤＮＡポリメラーゼが、本明細書に記載の組成物および方法に含有され、使用され得るが、多くの場合では、プルーフリーディングポリメラーゼが本明細書で用いられる。いくつかの場合では、ＤＮＡポリメラーゼは「ホットスタート」用に製剤化され、この場合、ＤＮＡポリメラーゼは、加熱するとＤＮＡポリメラーゼを放出する抗体に結合する。

本明細書に記載の組成物および方法に含有され、使用され得るＤＮＡポリメラーゼ。例示的なＤＮＡポリメラーゼおよびＤＮＡポリメラーゼ試薬には、Ｐｈｉ２９ＤＮＡポリメラーゼもしくはその誘導体、Ｂｓｍ、Ｂｓｔ、Ｔ４、Ｔ７、ＤＮＡＰｏｌＩ、もしくはＫｌｅｎｏｗＦｒａｇｍｅｎｔ、またはそれらの変異体、バリアントおよび誘導体が挙げられる。さらなる例示的なＤＮＡポリメラーゼおよびＤＮＡポリメラーゼ試薬には、Ｔａｑ、Ｔｂｒ、Ｔｆｌ、Ｔｔｈ、Ｔｌｉ、Ｔｆｉ、Ｔｎｅ、Ｔｍａ、Ｐｆｕ、Ｐｗｏ、およびＫｏｄＤＮＡポリメラーゼ、ならびにＶＥＮＴ（登録商標）ＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、ＤＥＥＰＶＥＮＴ（登録商標）ＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ、ＰＨＵＳＩＯＮ（商標）ＵＤＮＡポリメラーゼ、ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ、ＳＵＰＥＲＦＩ（商標）ＵＤＮＡポリメラーゼ、もしくはそれらの変異体、バリアントおよび誘導体、ならびに／またはＧｏＴａｑＧ２ホットスタートポリメラーゼ（Ｐｒｏｍｅｇａ）、ＯＮＥＴＡＱ（登録商標）ホットスタートＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、ＴＡＫＡＲＡＴＡＱ（商標）ＤＮＡポリメラーゼホットスタートＴａｋａｒａ）、ＫＡＰＡ２Ｇ堅牢ホットスタートＤＮＡポリメラーゼ（ＫＡＰＡ）、ＦＡＳＴＳＴＡＲＴ（商標）ＴａｑＤＮＡポリメラーゼ（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）、ホットスタートＴａｑＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、Ｑ５（登録商標）ＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、ＫＡＰＡＨｉＦｉＤＮＡポリメラーゼ（Ｒｏｃｈｅ）、ＰＲＩＭＥＳＴＡＲ（登録商標）ＭａｘＤＮＡポリメラーゼ（Ｔａｋａｒａ）、およびＰＲＩＭＥＳＴＡＲ（登録商標）ＧＸＬＤＮＡポリメラーゼ（Ｔａｋａｒａ）が挙げられる。

いくつかの場合では、ＤＮＡポリメラーゼは、キメラＤＮＡポリメラーゼを含み得る。さらに、キメラＤＮＡポリメラーゼは、配列非特異的二本鎖ＤＮＡ（ｄｓＤＮＡ）結合ドメインを含み得る。いくつかの場合では、ｄｓＤＮＡ結合ドメインは、Ｓｕｌｆｏｌｏｂｕｓｓｏｌｆａｔａｒｉｃｕｓ由来のＳｓｏ７ｄ；Ｓ．ａｃｉｄｏｃａｌｄａｒｉｕｓ由来のＳａｃ７ｄ、Ｓａｃ７ａ、Ｓａｃ７ｂ；およびＳａｃ７ｅ、Ｓｕｌｆｏｌｏｂｕｓｓｈｉｂａｔａｅ由来のＳｓｈ７ａおよびＳｓｈ７ｂ；Ｐａｅ３１９２；Ｐａｅ０３８４；Ａｐｅ３１９２；ＨＭｆファミリー古細菌ヒストンドメイン；または古細菌の増殖細胞核抗原（ＰＣＮＡ）ホモログを含み得る。加えて、本明細書に記載の組成物中に存在し、本明細書に記載の方法において使用されるＤＮＡポリメラーゼは、エキソヌクレアーゼ活性および／またはエキソヌクレアーゼドメインも含み得る。

さらに、本明細書に記載の組成物および方法に含有され、使用され得るＤＮＡポリメラーゼには、表１４に記載のＤＮＡポリメラーゼの全部または一部、およびかかるポリメラーゼの修飾された形態（例えば、表１４に記載のＤＮＡポリメラーゼと少なくとも９０％、少なくとも９５％、または少なくとも９７．５％同一であるＤＮＡポリメラーゼ）を含む。

ＰＨＵＳＩＯＮ（商標）ＵＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号Ｆ５５５Ｓ）は、融合技術を使用して開発された、設計された高忠実度酵素である。ＰＨＵＳＩＯＮ（商標）ＵのｄＵＴＰ結合ポケットの変異により、ＰＨＵＳＩＯＮ（商標）Ｕは、ｄＵＴＰを組み込み、ＤＮＡテンプレートに存在するウラシルを読み取ることができるという点で、プルーフリーディング酵素の制限を克服している。この特性に加えて、ＰＨＵＳＩＯＮ（商標）Ｕは、２０ｋｂまでの長いアンプリコンを増幅できる。

本明細書に記載の組成物中に存在し得、本明細書に記載の方法において使用され得るＤＮＡポリメラーゼには、阻害物質の効果を低減するように修飾されたもの、および／または阻害物質の効果を低減する１つ以上の化合物が製剤化されたものが含まれる。例として、ＰＬＡＴＩＮＵＭ（商標）ＩＩＴａｑホットスタートＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号１４９６６００１）は、ＤＮＡポリメラーゼが干渉化合物（例えば、フミン酸、キシラン、ヘミンなど）の影響を低減するように修飾された「ホットスタート」ポリメラーゼ製剤である。さらに、これは６０℃でのプライマーのアニーリングを可能にするように製剤化されている。

ＤＮＡポリメラーゼ試薬は、干渉化合物の影響を軽減するように製剤化され得る。かかる製剤に使用され得る化合物の１つのカテゴリーは「アミン」である。アミンは、（１）核酸合成産物の収率および／または（２）核酸合成の阻害剤に対する耐性を改善することが見出された。アミンは、式Ｉの１つ以上のアミンまたはそれらの塩を含む化合物を含む、本明細書に記載の組成物および方法に含有および使用され得る化合物を含有し、

式中、Ｒ１はＨであり、Ｒ２は、アルキル、アルケニル、アルキニル、または（ＣＨ₂）ｎ－Ｒ５から選択され、ｎ＝１～３であり、Ｒ５は、アリール、アミノ、チオール、メルカプタン、ホスフェート、ヒドロキシ、アルコキシであり、Ｒ３およびＲ４は同じか、または異なってもよく、独立して、Ｈまたはアルキルから選択され、ただし、Ｒ２が、（ＣＨ₂）ｎ－Ｒ５である場合、Ｒ３および／またはＲ４のうちの少なくとも１つは、アルキルである。

本明細書に記載の組成物および方法に含有され、使用され得る特定のアミン含有化合物には、ジメチルアミン塩酸塩、ジエチルアミン塩酸塩、ジイソプロピルアミン塩酸塩、エチル（メチル）アミン塩酸塩、および／またはトリメチルアミン塩酸塩が含まれる。

１つ以上のアミン化合物が製剤中に存在する場合、この化合物またはこれらの化合物の濃度は、概して５ｍＭ～５００ｍＭの範囲である（例えば、約５ｍＭ～約５００ｍＭ、約１０ｍＭ～約５００ｍＭ、約２０ｍＭ～約５００ｍＭ、約３０ｍＭ～約５００ｍＭ、約４０ｍＭ～約５００ｍＭ、約５ｍＭ～約３００ｍＭ、約５ｍＭ～約２５０ｍＭ、約５ｍＭ～約２００ｍＭ、約５ｍＭ～約１００ｍＭ、約１０ｍＭ～約２５０ｍＭ、約２０ｍＭ～約２００ｍＭ、約２５ｍＭ～約１８０ｍＭ、約５０ｍＭ～約１１０ｍＭなど）。

本明細書に記載の方法で使用され得るＤＮＡポリメラーゼ試薬の１つの特定の例は、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号１２３６１０１０）である。

ベクター
本明細書に記載の方法で使用され得るベクターは、宿主細胞のクローニングおよび形質転換に好適な任意のベクターであり得る。多くの場合では、所望のポリヌクレオチドを高収量で得るために、高コピー数ベクターが使用され得る。一般的な高コピー数ベクターには、ｐＵＣ（約５００～約７００コピー）、ＰＢＬＵＥＳＣＲＩＰＴ（登録商標）もしくはＰＧＥＭ（登録商標）（それぞれ約３００～約５００コピー）またはその派生物が挙げられる。いくつかの場合では、例えば所与の挿入物の高発現が形質転換された細胞にとって有毒である可能性がある場合、低コピー数ベクターを使用してもよい。約５～約３０のコピー数を有するかかる低コピー数ベクターには、例えば、ｐＢＲ３２２、様々なｐＥＴベクター、ｐＧＥＸ、ｐＣｏｌＥ１、ｐＲ６Ｋ、ｐＡＣＹＣまたはｐＳＣ１０１が含まれる。

本明細書に開示されるアセンブリまたはクローニング方法のうちのいずれかにおいて使用され得るベクターの例示的なリストには、以下が挙げられる：ＢＡＣＵＬＯＤＩＲＥＣＴ（商標）線状、ＤＮＡクローニング断片ＤＮＡ、ＢＡＣＵＬＯＤＩＲＥＣＴ（商標）Ｎ末端線状ＤＮＡ、ＢＡＣＵＬＯＤＩＲＥＣＴ（商標）Ｃ末端Ｂａｃｕｌｏｖｉｒｕｓ線状ＤＮＡ、ＢＡＣＵＬＯＤＩＲＥＣＴ（商標）Ｎ末端Ｂａｃｕｌｏｖｉｒｕｓ線状ＤＮＡ、ＣＨＡＭＰＩＯＮ（商標）ｐＥＴ１００／Ｄ－ＴＯＰＯ（登録商標）、ＣＨＡＭＰＩＯＮ（商標）ｐＥＴ１０１／Ｄ－ＴＯＰＯ（登録商標）、ＣＨＡＭＰＩＯＮ（商標）ｐＥＴ１０４－ＤＥＳＴ、ＣＨＡＭＰＩＯＮ（商標）ｐｃＤＮ３．１Ａ／５－Ｈｉｓ－ＴＯＰＯ、ｐｃＤＮＡ３．１（－）、ｐｃＤＮＡ３．１（＋）、ｐｃＤＮＡ３．１（＋）／ｍｙｃ－ＨｉｓＡ、ｐｃＤＮＡ３．１（＋）／ｍｙｃ－Ｈｉｓシリーズ、ｐｃＤＮＡ３．１／Ｈｉｓシリーズ、ｐｃＤＮＡ３．１／Ｈｙｇｒｏ（－）、ｐｃＤＮＡ３．１／Ｈｙｇｒｏ（＋）、ｐｃＤＮＡ３．１／ＮＴ－ＧＦＰ－ＴＯＰＯ、ｐｃＤＮＡ３．１／ｎＶ５－ＤＥＳＴ、ｐｃＤＮＡ３．１Ａ／５－Ｈｉｓシリーズ、ｐｃＤＮＡ３．１／Ｚｅｏ（＋）、ｐｃＤＮＡ３．１／Ｚｅｏ（＋）、ｐｃＤＮＡ３．１ＤＡ／５－Ｈｉｓ－ＴＯＰＯ、ｐｃＤＮＡ３．２／Ｖ５－ＤＥＳＴ、ｐｃＤＮＡ３．２－ＤＥＳＴ、ｐｃＤＮＡ４／Ｈｉｓシリーズ、ｐｃＤＮＡ４／ＨｉｓＭａｘ－ＴＯＰＯ、ｐｃＤＮＡ４／ＨｉｓＭａｘ－ＴＯＰＯ、ｐｃＤＮＡ４／ｍｙｃ－Ｈｉｓシリーズ、ｐｃＤＮＡ４／ＴＯ、ｐｃＤＮＡ４／ＴＯ、ｐｃＤＮＡ４／ＴＯ／ｍｙｃ－Ｈｉｓシリーズ、ｐｃＤＮＡ４／Ｖ５－Ｈｉｓシリーズ、ｐｃＤＮＡ５／ＦＲＴ、ｐｃＤＮＡ５／ＦＲＴ／ＴＯ／ＣＡＴ、ｐｃＤＮＡ５／ＦＲＴ／ＴＯ－ＴＯＰＯ、ｐｃＤＮＡ－ＤＥＳＴ４７、ｐｃＤＮＡ－ＤＥＳＴ５３、ＰＤＥＳＴ（商標）１０、ＰＤＥＳＴ（商標）１４、ＰＤＥＳＴ（商標）１５、ｐＤＥＳＴ（商標）１７、ｐＤＥＳＴ（商標）２０、ｐＤＥＳＴ（商標）２２、ＰＤＥＳＴ（商標）２４、ｐＤＥＳＴ（商標）２６、ｐＤＥＳ（商標）２７、ｐＤＥＳＴ（商標）３２、ｐＤＥＳＴ（商標）８、ｐＤＥＳＴ（商標）３８、ｐＤＥＳＴ（商標）３９、ｐＤｉｓｐｌａｙ、ｐＤＯＮＲ（商標）Ｐ２ＲＰ３、ＰＤＯＮＲ（商標）Ｐ２Ｒ－Ｐ３、ｐＤＯＮＲ（商標）Ｐ４－Ｐ１Ｒ、ｐＤＯＮＲ（商標）Ｐ４－Ｐ１Ｒ、ｐＤＯＮＲ（商標）／Ｚｅｏ、ｐＤＯＮＲ（商標）２０１、ｐＤＯＮＲ（商標）２０７、ｐＤＯＮＲ（商標）２２１、ｐＥＦ／ｍｙｃ／ｃｙｔｏ、ｐＥＦ／ｍｙｃ／ｍｉｔｏ、ｐＥＦ／ｍｙｃ／ｎｕｃ、ｐＥＦｉ／Ｈｉｓシリーズ、ｐＥＦ４／Ｖ５－Ｈｉｓシリーズ、ｐＥＦ５／ＦＲＴＶ５Ｄ－ＴＯＰＯ、ｐＥＦ５／ＦＲＴ／Ｖ５－ＤＥＳＴ（商標）、ｐＥＦ６／Ｈｉｓシリーズ、ｐＥＦ６／ｍｙｃ－Ｈｉｓシリーズ、ｐＥＦ６Ａ／５－Ｈｉｓ－ＴＯＰＯ、ｐＥＦ－ＤＥＳＴ５１、ｐＥＮＴＲ－ＴＥＶ／Ｄ－ＴＯＰＯ、ｐＥＮＴＲ（商標）／Ｄ－ＴＯＰＯ、ｐＥＮＴＲ（商標）／Ｄ－ＴＯＰＯ、ｐＨｙｂＬｅｘ／Ｚｅｏ、ｐＨｙＢＬｅｘ／Ｚｅｏ－ＭＳ２、ｐＩＢ／Ｈｉｓシリーズ、ｐＩＢＡ／５－ＨｉｓＴｏｐｏ、ｐＹＥＳ２．１Ａ／５－Ｈｉｓ－ＴＯＰＯ、ｐＹＥＳ２／ＣＴ、ｐＹＥＳ２／ＮＴ、ｐＹＥＳ２／ＮＴシリーズ、ｐＹＥＳ３／ＣＴ、ｐＹＥＳ６／ＣＴ、ｐＹＥＳ－ＤＥＳＴ（商標）５２、ｐＹＥＳＴｒｐ、ｐＹＥＳＴｒｐ２、ｐＺｅｏＳＶ２、ｐＺｅｏＳＶ２（＋）、ｐＺＥｒＯ－１、およびｐＺＥｒＯ－２。

いくつかの態様では、ベクターは、全長融合構築物のＰＣＲ媒介伸長を可能にするために制限されたサイズを有し得る。特定の条件下では、融合構築物の全長伸長および／または増幅は、必要ない場合がある。かかる状況では、標的ベクターのサイズは制限されない場合がある。したがって、いくつかの態様では、標的ベクターは、約０．５～約５ｋｂ、または約１ｋｂ～約３ｋｂのサイズを有し得るが、他の態様では、標的ベクターは、約２ｋｂ～約１０ｋｂまたは約５ｋｂ～約２０ｋｂのサイズを有し得る。

アセンブルされた核酸分子はまた、望ましい特性を付与する機能的要素を含み得る。これらの要素は、複数のオリゴヌクレオチドまたは標的ベクターのいずれかによって提供され得る。かかる要素の例には、複製起点、長い末端反復、耐性マーカー（抗生物質耐性遺伝子など）、選択可能なマーカーおよび解毒剤コード配列（例えば、ｃｃｄＢの毒性効果に対抗するためのｃｃｄＡコード配列）、プロモーター、エンハンサー、ポリアデニル化シグナルコード配列、５’および３’ＵＴＲ、ならびに核酸分子の特定の使用（例えば、ｍＲＮＡまたはタンパク質産生効率の増強）に好適な他の構成要素が挙げられる。核酸分子がアセンブルされてオペロンを形成する態様では、アセンブルされた核酸産物は、多くの場合、プロモーターおよびターミネーター配列を含有する。さらに、アセンブルされた核酸分子は、例えばＩＩ型またはＩＩｓ型切断部位および／またはＧＡＴＥＷＡＹ（登録商標）組換え部位、ならびに核酸分子の相互接続のための他の部位などの複数のクローニング部位を含有し得る。

ベクターは、閉鎖環状テンプレートベクター分子のＰＣＲ増幅を含む任意の手段によって線状化され得る。あるいは、ベクターは、平滑末端または付着末端のいずれかを産生する１つ以上の酵素での制限酵素切断によって線状化することができる。かかる酵素には、その認識配列に関して固定された位置で核酸を切断するＩＩ型の制限エンドヌクレアーゼが含まれる。二本鎖核酸の切断時に「平滑」末端または「粘着」末端のいずれかを産生するように選択され得る制限酵素は、当業者に既知であり、ベクター配列およびアセンブリ要件に応じて当業者によって選択され得る。いくつかの場合では、ベクターは、平滑末端を生成する制限エンドヌクレアーゼを使用して線状化され得る。

切断後、ベクターは、例えば、アセンブリＰＣＲ反応（例えば、配列伸長およびライゲーション反応）で直接使用され得るか、またはゲル抽出を使用して精製され得るか、またはアセンブリＰＣＲ反応で使用する前にＰＣＲ反応で増幅され得るかのいずれかである。ＰＣＲ増幅によって生成された線形化されたベクターの精製は、多くの場合、必要なく、ＰＣＲ産物はアセンブリＰＣＲ反応において直接使用され得る。あるいは、ＩＩＳ型制限酵素切断部位を含む環状ベクターを使用し、１ステップの切断およびライゲーションプロセスに供して、１つ以上のアセンブルされた核酸分子を以下で説明するゴールデンゲートクローニングシステムとして一般的に既知であるベクターにシームレスでクローニングすることができる。

アセンブリＰＣＲの後、アセンブルされた環状構築物またはそのアリコートを含む反応混合物を直接使用して、標準プロトコルに従って、例えば一般的なＥ．ｃｏｌｉ株などの好適なコンピテント宿主細胞を形質転換することができる。当業者は、構築物のサイズおよびヌクレオチド組成、プラスミドのコピー数、選択基準などに応じて、好適な宿主細胞を選択することができる。有用な株は、ＡｍｅｒｉｃａｎＴｙｐｅＣｕｌｔｕｒｅＣｏｌｌｅｃｔｉｏｎおよびＹａｌｅのＥ．ｃｏｌｉＧｅｎｅｔｉｃＳｔｏｃｋＣｅｎｔｅｒ、ならびにＡｇｉｌｅｎｔ、Ｐｒｏｍｅｇａ、Ｍｅｒｃｋ、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃおよびＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓなどのサプライヤーを介して、それぞれ、商業的に入手可能である。

多くの場合では、本明細書で提供される方法によって調製された核酸分子は複製可能である。さらに、これらの複製可能な核酸分子の多くは環状である（例えば、プラスミド）。複製可能な核酸分子は、それらが環状であるかどうかに関係なく、概して、２つ以上（例えば、３、４、５、８、１０、１２個など）の核酸断片のアセンブリから形成される。いくつかの場合では、本明細書で提供される方法は、異なる核酸断片の連結から生じる１つ以上（例えば、２、３、４個など）の選択マーカーまたは１つ以上（例えば、２、３、４個など）の複製起点の再構成に基づく選択を使用する。複製に環状性が必要な場合には、環状核酸分子の形成からさらなる選択がもたらされる場合がある。

別の実施形態では、配列伸長およびライゲーション反応（図１Ｂ）において使用される一本鎖オリゴヌクレオチドは、相補的な末端を有する１つ以上の二本鎖核酸断片によって置き換えられて、線形化された標的ベクター（および２つ以上の断片が標的ベクターに同時にアセンブルされる場合は、断片間）での重複伸長ＰＣＲを可能にし得る。相補的末端（すなわち重複）は、例えば４０ｂｐなどの約１５ｂｐ～約５０ｂｐ、約２０ｂｐ～約４０ｂｐのサイズを有し得る。必要な重複のサイズは、融合される断片のサイズおよびその融解温度に依存する場合がある。二本鎖断片は、最初に一本鎖オリゴヌクレオチドからアセンブルされ、図１Ａに記載のものなどのワークフローの上記のステップ（ｉｉ）および（ｉｉｉ）においてそれぞれ説明されているように、末端プライマーの存在下で増幅される。次いで、増幅された断片を、１回以上のエラー訂正および／またはエラー除去ラウンド（例えば、上記の不一致エンドヌクレアーゼ処理による）に供し、その後、上記の配列伸長およびライゲーション反応についての記載のように、挿入、伸長反応と組み合わせて使用することができる。いくつかの態様では、相互接続された隣接断片の重複および／または線状化ベクターへの末端断片の重複は、約１５～約４０または約１８～約３０ヌクレオチド長であり得る。アセンブリの成功を保証するために、より長い領域にわたるハイブリダイゼーションが必要とされる態様では、重複は、約３０～約６０ヌクレオチド長、またはさらに６０ヌクレオチド長を超える場合がある。

アセンブリワークフローによって得られたアセンブルされた構築物は、他のアセンブリワークフロー産物または他の供給源から得られた核酸分子とさらに組み合わせて、より大きな核酸分子（例えば、遺伝子）をアセンブルすることができる。より大きなサイズの構築物は、当業者に既知の任意の手段によってアセンブルされ得る。例えば、より大きな構築物（例えば、５～１００キロ塩基）が望まれる場合、ＩＩｓ型制限部位媒介アセンブリ法を使用して、複数の断片（例えば、２、３、５、８、１０個など）をアセンブルすることができる。１つの好適なクローニングシステムは、ゴールデンゲートと称され、米国特許公開第２０１０／０２９１６３３（Ａ１）号およびＰＣＴ公開第２０１０／０４０５３１号において様々な形で記載されている。

本明細書で提供されるワークフロー中の多くの時点で、反応混合物構成要素（例えば、ｄＮＴＰ、プライマー、短縮型オリゴヌクレオチド、ｔＲＮＡ分子、緩衝液、塩、タンパク質など）から核酸分子またはアセンブリ産物を分離することが望ましい場合がある。これは、例えば、上記のエキソヌクレアーゼ、制限酵素またはＵＮＧグリコシラーゼを用いて望ましくない核酸副産物を酵素的に除去することによるなど、多くの方法で行うことができる。いくつかの場合では、核酸分子を固体支持体（例えば、磁気ビーズ）に沈殿または結合させ得る。プロセス（例えば、選択されたオリゴヌクレオチドのプールまたは多重化、核酸合成、エラー訂正など）を促進するために反応構成要素から分離されると、次いで、核酸分子は、追加の反応（例えば、アセンブリＰＣＲ反応、増幅、クローニングなど）において使用され得る。

より大きな核酸分子もインビボでアセンブルされ得る。インビボアセンブリ方法では、標準のトランスフェクション技術を使用して、宿主細胞をトランスフェクションするために、多くの場合、アセンブルされるすべての亜断片の混合物が使用される。トランスフェクションされる培養物中の細胞数に対する混合物中の亜断片の分子数の比率は、混合物中に異なる亜断片が存在するよりも、少なくともいくつかの細胞でより多くの亜断片分子を取り込めるように十分に高い必要がある。したがって、ほとんどの場合、トランスフェクションの効率が高いほど、最終的な所望のアセンブリ産物を形成するために必要な核酸亜断片のすべてを含有する細胞の数が多くなる。これらのラインに沿った技術パラメータは、米国特許公開第２００９／０２７５０８６（Ａ１）号に記載されている。

大きな核酸分子は比較的壊れやすく、したがって容易に剪断される。かかる分子を安定化するための１つの方法は、それらを細胞内に維持することによるものである。したがって、いくつかの態様では、本明細書に記載の主題は、宿主細胞における大きな核酸分子のアセンブリおよび／または維持を含む。大きな核酸分子は、典型的には２０ｋｂ以上である（例えば、２５ｋｂ超、３５ｋｂ超、５０ｋｂ超、７０ｋｂ超、８５ｋｂ超、１００ｋｂ超、２００ｋｂ超、５００ｋｂ超、７００ｋｂ超、９００ｋｂ超など）。

大きな核酸分子を産生し、さらに分析するための方法は、当技術分野で既知である。例えば、Ｋａｒａｓｅｔａｌ．，“Ａｓｓｅｍｂｌｙｏｆｅｕｋａｒｙｏｔｉｃａｌｇａｌｃｈｒｏｍｏｓｏｍｅｓｉｎｙｅａｓｔ，ＪｏｕｒｎａｌｏｆＢｉｏｌｏｇｉｃａｌＥｎｇｉｎｅｅｒｉｎｇ７：３０（２０１３）は、酵母における藻類染色体のアセンブリおよび、かかる大きな核酸分子のパルスフィールドゲル分析を示している。

上で示唆されたように、かなり効率的に相同組換えを実施すると既知の生物の１つのグループは、酵母である。したがって、本明細書に記載の方法の実施において使用される宿主細胞は、酵母細胞（例えば、Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ、Ｓｃｈｉｚｏｓａｃｃｈａｒｏｍｙｃｅｓｐｏｍｂｅ、Ｐｉｃｈｉａ，ｐａｓｔｏｒｉｓなど）であり得る。

酵母宿主は、独自の遺伝子操作ツールセットのため、ドナーゲノム物質の操作に特に好適である。酵母細胞の自然な能力および数十年にわたる研究により、酵母のＤＮＡを操作するための豊富なツールのセットが作成された。これらの利点は、当技術分野で周知である。例えば、豊富な遺伝子システムを有する酵母は、相同組換えによってヌクレオチド配列をアセンブルおよび再アセンブルすることができ、これは、多くの容易に入手可能な生物によって共有されていない能力である。酵母細胞は、ＤＮＡのより大きな断片、例えば、他の生物ではクローニングできない細胞全体、細胞小器官、およびウイルスゲノムのクローニングに使用され得る。したがって、いくつかの態様では、大きな核酸分子を生成する酵母遺伝学の膨大な能力（例えば、合成ゲノミクス）は、アセンブリおよび維持のための宿主細胞として酵母を使用することによって利用され得る。

実施例１
アミノ末端シグナルペプチド（ＭＥＴＤＴＬＬＬＷＶＬＬＬＷＶＰＧＳＴＧＳＫＤＫＶＴＶＩＴ（配列番号５））およびカルボキシ末端６ヒスチジン精製タグ（図１５）を含有するＴｋｏＥｎｄｏＭＳのコドン最適化コード配列を、以下のパラメータを使用して設計した。コドンの使用法は、ホモサピエンス遺伝子のコドンバイアスに対して調整された。加えて、ＧＣ含有量が非常に高い（＞８０％）または非常に低い（＜３０％）領域は、可能な限り回避された。

最適化プロセス中、該当する場合、以下のシス作用性配列モチーフは回避された：（１）内部ＴＡＴＡボックス、カイ部位およびリボソーム侵入部位、（２）ＡＴリッチまたはＧＣリッチ配列ストレッチ、（３）ＲＮＡ不安定性モチーフ、（４）反復配列およびＲＮＡ二次構造、ならびに（５）高等真核生物における（不可解な）スプライシングドナーおよびアクセプター部位。結果は図１５に示されるヌクレオチド配列であり、図１５に示されるアミノ酸配列を有するタンパク質をコードする。

図１５に記載のヌクレオチド配列を、ＥＸＰＩ（商標）２９３細胞にトランスフェクションし、発現させた。ＥＸＰＩ（商標）２９３細胞をトランスフェクション後６日間培養し、続いて発現したタンパク質を回収した。分泌されたＴｋｏＥｎｄｏＭＳタンパク質を、Ｔｒｉｓ－ＨＣｌ、５００ｍＭのＮａＣｌ中の２０～５００ｍＭイミダゾールの直線勾配を使用して、ＨｉｓＴｒａｐカラムによってＨｉｓタグを使用して精製した。精製されたＴｋｏＥｎｄｏＭＳタンパク質を、５０ｍＭのＴｒｉｓ－ＨＣｌｐＨ８．０、０．５ｍＭのＤＴＴ、０．１ｍＭのＥＤＴＡ、０．５ＭのＮａＣｌに対して１６時間透析した。クーマシーブルー染色によって純度を評価し、得られたＴｋｏＥｎｄｏＭＳは、９５％の純度であると決定された。ＴｋｏＥｎｄｏＭＳは、５０ｍＭのＴｒｉｓ－ＨＣｌｐＨ８．０、０．５ｍＭのＤＴＴ、０．１ｍＭのＥＤＴＡ、０．５ＭのＮａＣｌ、５０％のグリセロール中、１３０ｎｇ／μｌの最終濃度で保管された。

ベンチマークオリゴヌクレオチドアセンブリプロトコル
アセンブリＰＣＲ

アセンブリのためのオリゴヌクレオチドの混合物を除いて、すべての反応構成要素のマスター混合物を作成した。７３０ｎｌのマスター混合物を、ＥＣＨＯ（登録商標）５５５リキッドハンドラー（ＬａｂｃｙｔｅＩｎｃ．）を使用して３８４ウェルプレートのウェルに移した。次いで、５００ｎｌのオリゴヌクレオチドの混合物を、ＥＣＨＯ（登録商標）５５５を使用して添加した。次いで、以下に示すサイクラープロトコルを使用して熱サイクルを実施した。

増幅

アセンブリＰＣＲ産物を除くすべての構成要素のマスター混合物を準備した。次いで、８．８μｌのマスター混合物を、マルチステップピペッターを使用して、アセンブリＰＣＲ産物を含有する３８４ウェルプレートのウェルに移した。次いで、以下に示すサイクラープロトコルを使用して熱サイクルを実施した。

ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼを使用したＥｎｄｏＭＳオリゴヌクレオチドアセンブリプロトコル
Ａ．アセンブリＰＣＲ
ベンチマークプロトコルと同じであるが、反応液には０．０２０μｌのＴｋｏＥｎｄｏＭＳ（１３０ｎｇ／μｌ）が含有されている。したがって、Ｈ₂Ｏは、０．４２０μｌである。

Ｂ．増幅
ベンチマークプロトコルと同じであるが、反応液には０．１４０μｌのＴｋｏＥｎｄｏＭＳ（１３０ｎｇ／μｌ）が含有されている。したがって、Ｈ₂Ｏは、６．３８６μｌである。

ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼを使用したオリゴヌクレオチドアセンブリプロトコル（ＥｎｄｏＭＳ任意選択）
Ａ．アセンブリＰＣＲ

アセンブリのためのオリゴヌクレオチドの混合物を除いて、すべての反応構成要素のマスター混合物を作成した。７３０ｎｌのマスター混合物を、ＥＣＨＯ（登録商標）５５５リキッドハンドラーを使用して３８４ウェルプレートのウェルに移した。次いで、５００ｎｌのオリゴヌクレオチドの混合物を、ＥＣＨＯ（登録商標）５５５を使用して添加した。次いで、以下に示すサイクラープロトコルを使用して熱サイクルを実施した。

Ｂ．増幅

Ｔ７エンドヌクレアーゼＩ（Ｔ７ＮＩ）を使用したエラー訂正プロトコル
Ａ．エラー訂正Ｉ（変性および再アニーリング）

エラー訂正ＩＩ（不一致切断）

Ｂ．エラー訂正ＩＩＩ（増幅）

実施例２
熱安定性不一致エンドヌクレアーゼ（ＴｓＭＭＥ）
アセンブリおよび／または増幅中のＴｋｏＥｎｄｏＭＳの使用により、エラー率が減少した核酸分子の生成がもたらされることを実施例１で示した後、エラー率のさらなる低減のための条件を試験した。これらの条件には、ＴｋｏＥｎｄｏＭＳの相同体、異なるＤＮＡポリメラーゼ、および異なるサイクラープロトコルなど、異なる熱安定性不一致エンドヌクレアーゼ（本明細書では「ＴｓＭＭＥ」と略記する）の使用が含まれた。

材料および方法：
表１５に示されるこれらの酵素のアミノ酸配列とともに、表４に記載され、この実施例で記載の実験において使用される「ＴｓＭＭＥ」を、熱安定エラー訂正（本明細書では「ＴｓＥＣ」と略される）のためにＥｘｐｉ２９３で産生した。ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃＧｅｎｅＡｒｔＧｍｂＨ（Ｒｅｇｅｎｓｂｕｒｇ，ＤＥ）によって産生されたこれらの酵素は、９５％超の純度であり、以下の緩衝液：５０ｍＭのＴｒｉｓ－ＨＣｌｐＨ８．０、０．５ｍＭのＤＴＴ、０．１ｍＭのＥＤＴＡ、０．５ＭのＮａＣｌ、５０％のグリセロール中で各々保管された。

この実施例で設定された実験において、Ｔ７エンドヌクレアーゼＩを使用したエラー訂正は実施されなかった。

ベンチマークオリゴヌクレオチドアセンブリプロトコル
この実施例に記載のベンチマークデータは、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼおよびエラー訂正なし、または指定された熱安定性酵素を使用して媒介されるエラー訂正のいずれかを使用して生成された。別段明記しない限り、「ベンチマーク」データは、エラー訂正なしでＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼを使用して生成された。エラー訂正が実施される前に、異なる配列を有するオリゴヌクレオチドには異なる数のエラーが含有されていたため、ベンチマークが行われた。この変数を訂正するために、ベンチマークデータは、本明細書で別段の記載がない限り、比較データの生成に使用したものと同じオリゴヌクレオチドを使用して生成された。

アセンブリＰＣＲ

オリゴヌクレオチド混合物を除くすべての構成要素を含有するマスター混合物を作製した。７３０ｎｌのマスター混合物を、ＬａｂｃｙｔｅＥＣＨＯ（登録商標）５５５アコースティックリキッドハンドラーを使用して３８４ウェルプレートの個々のウェルに移した。次いで、ＬａｂｃｙｔｅＥＣＨＯ（登録商標）５５５アコースティックリキッドハンドラーを使用して、５００ｎｌのオリゴヌクレオチド混合物も同じウェルに添加した。

増幅

アセンブリ反応産物を除くすべての構成要素を含有するマスター混合物を調製した。次いで、８．８μｌのこのマスター混合物を、マルチステップピペッターで、アセンブリ反応産物を含有する３８４ウェルプレートの個々のウェルに移した。

ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼを使用したＴｓＥＣオリゴヌクレオチドアセンブリプロトコル
アセンブリ
使用した方法は、この実施例で先に記載したベンチマークプロトコルと同じであるが、反応混合物には０．０２０μｌのＴｋｏＥｎｄｏＭＳ（１３０ｎｇ／μｌ）および０．４２０μｌのＨ₂Ｏが含有されていた。

増幅
使用した方法は、上記のベンチマークプロトコルと同じであるが、反応混合物には０．１４０μｌのＴｋｏＥｎｄｏＭＳ（１３０ｎｇ／μｌ）および６．３８６μｌのＨ₂Ｏが含有されていた。

ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼを使用したオリゴヌクレオチドアセンブリプロトコル（ＴｓＭＭＥ任意選択）

増幅

アセンブリ反応産物を除くすべての構成要素を含有するマスター混合物を調製した。次いで、８．８μｌのこのマスター混合物を、マルチステップピペッターで、アセンブリ反応産物を含有する３８４ウェルプレートのウェルに移した。

結果：
「ベンチマークオリゴヌクレオチドアセンブリプロトコル」およびＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ（ＰＨＵＳＩＯＮ（商標））を使用した２０個の個々の断片のアセンブリを使用して、「ベンチマーク」／エラーの参照数を確立した。同じ２０の個々の断片をまた、ＰｈｏＮｕｃＳまたはＳａｃＥｎｄｏＭＳおよびサイクラープロトコルＣを使用したエラー訂正を伴って、「オリゴヌクレオチドアセンブリプロトコル」、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ（「ＳＵＰＥＲＦＩ（商標）ＩＩ」）を使用してアセンブルした。得られたデータを以下の表５および６に示す。

表５に記載のデータは、ＳＵＰＥＲＦＩ（商標）ＩＩおよびＰｈｏＮｕｃＳでの処理が、ＳＵＰＥＲＦＩ（商標）ＩＩおよびＳａｃＥｎｄｏＭＳでの処理よりも全体的なエラー率が平均的に改善されることを示している。ＳａｃＥｎｄｏＭＳは主に置換を訂正し、削除および挿入への効果は小さいが、ＰｈｏＮｕｃＳは、置換に対するより高い活性に加えて、削除および挿入に対する顕著なエラー訂正活性を有していることが見出された。データはまた、いくつかの核酸断片における配列エラーは、他の断片よりも容易に訂正できることを示している。例えば、ＳＵＰＥＲＦＩ（商標）ＩＩおよびＰｈｏＮｕｃＳでの処理は、２つの断片について全体的なエラー率を１００％改善し、３つの断片については２７５％改善し、ＳＵＰＥＲＦＩ（商標）ＩＩおよびＳａｃＥｎｄｏＭＳでの処理は、１つの断片について全体的なエラー率を２５％改善し、４つの断片については１００％改善した。この変動性は、部分的に核酸断片の配列の違いによるものであると考えられている。ヌクレオチド配列の違いは、核酸断片における異なるエラーのタイプの普及の変化をもたらす可能性があり、本明細書の他の場所で論じるように、エラー訂正酵素は、異なるエラーのタイプを認識して相互作用する（例えば、結合および／または切断する）能力が異なる。

表６に記載のデータは、ＰｈｏＮｕｃＳおよびＳａｃＥｎｄｏＭＳ酵素によって媒介されるエラー訂正を伴うＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼを使用してアセンブルおよび増幅された核酸分子は、６つの置換タイプのうちの４つをほぼ完全に欠いているが、ベンチマーク試料には６つの置換タイプすべての顕著な量が含有されている。野生型分子とハイブリダイゼーションすると、酵素によって除去される置換は、それらのホモログＴｋｏＥｎｄｏＭＳが顕著な切断活性を有する不一致を形成する（Ｉｓｈｉｎｏｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．４４：２９７７－２９８９（２０１６））。

表６に記載のデータは、ＰｈｏＮｕｃＳおよびＳａｃＥｎｄｏＭＳ酵素が、（１）Ａ＞ＣおよびＴ＞Ｇならびに（２）Ｇ＞ＴおよびＣ＞Ａトランスバージョンに対して高レベルの切断活性を示さないことも示唆している。野生型分子とハイブリダイゼーションすると、これらのトランスバージョンは、それらのホモログＴｋｏＥｎｄｏＭＳが低い切断活性を有する不一致を形成する（Ｉｓｈｉｎｏｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．４４：２９７７－２９８９（２０１６））。

表７は、ＳＵＰＥＲＦＩ（商標）ＩＩ対ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼによる核酸断片のアセンブリおよび増幅のエラー率データの比較を示している。２つの異なる熱サイクラープロトコルが使用された（プロトコルＡおよびＣ）。データからわかり得るように、表７に記載の２回の実行では、ＳＵＰＥＲＦＩ（商標）ＩＩによる核酸断片のアセンブリおよび増幅は、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼの場合と比較して、低いエラー率をもたらすことが見出された。このデータはまた、表５に見られるエラー率の改善は、ＳＵＰＥＲＦＩ（商標）ＩＩの使用による部分が小さいようであることを示している。これは、表５に見られるエラー率の改善の大部分がＴｓＭＭＥの使用によるものであることを示唆している。

表８に見られるように、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼおよびエラー訂正のためのＴｋｏＥｎｄｏＭＳを伴う「ベンチマークオリゴヌクレオチドアセンブリプロトコル」の使用は、生成された産物核酸分子における配列エラー数の実質的な減少をもたらした。

表９に記載のデータは、６つのすべての置換タイプを顕著な量を含有するベンチマーク試料と比較して、ＴｋｏＥｎｄｏＭＳ酵素によって媒介されるエラー訂正を伴うＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼを使用してアセンブルおよび増幅された核酸分子は、６つの置換タイプのうちの４つについての比率が大幅に低減した。野生型分子とハイブリダイゼーションすると、ＴｋｏＥｎｄｏＭＳによって除去される置換は、その酵素が顕著な切断活性を有する不一致を形成する（Ｉｓｈｉｎｏｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．４４：２９７７－２９８９（２０１６））。

表９に記載のデータは、ＴｋｏＥｎｄｏＭＳ酵素が、（１）Ａ＞ＣおよびＴ＞Ｇならびに（２）Ｇ＞ＴおよびＣ＞Ａトランスバージョンに対して高レベルの切断活性を示さないことも示唆している。野生型分子とハイブリダイゼーションすると、これらのトランスバージョンは、ＴｋｏＥｎｄｏＭＳが低い切断活性を有する不一致を形成する（Ｉｓｈｉｎｏｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．４４：２９７７－２９８９（２０１６））。

表１０において多くの効果が見られ、１つは、異なる熱安定性エラー訂正酵素の使用が、アセンブリおよび増幅後の産物核酸分子の異なるエラー率をもたらすことである。また、アセンブリおよび増幅後の核酸分子に存在するエラーの数は、使用するサイクラープロトコルによってある程度変化する。したがって、低エラー率を有するアセンブルされ増幅された核酸分子を得るために変更され得る２つの因子は、（１）使用するエラー訂正酵素（または複数のエラー訂正酵素）、および（２）核酸分子の亜構成要素をアセンブルし、増幅する方法（例えば、熱サイクラープロトコル、使用／存在する緩衝液および緩衝液構成要素など）である。

表１１のデータは、初期エラー率とは無関係にエラー率の効率的な低減が達成されることも示している。ＳＵＰＥＲＦＩ（商標）ＩＩポリメラーゼおよびＰｈｏＮｕｃＳを使用したアセンブリおよび増幅の場合では、ベンチマークのエラー率が２２２中１～３０３中１の場合に、２．１～２．６倍のエラー低減が達成され（表１０）、ベンチマークのエラー率が１０９２中１の場合に１．９倍のエラー低減が達成された。ＳＵＰＥＲＦＩ（商標）ＩＩポリメラーゼおよびＴｋｏＥｎｄｏＭＳを使用したアセンブリおよび増幅の場合では、ベンチマークのエラー率が２０５中１～２８３中１の場合に、１．５～１．８倍のエラー低減が達成され（表１０）、ベンチマークのエラー率が１０９２中１の場合に２．１倍のエラー低減が達成された。

本明細書に記載の主題の特定の態様が本明細書に示され、説明されてきたが、かかる態様が例としてのみ提供されることは当業者には明らかであろう。当業者は、本明細書に記載の主題から逸脱することなく、多数のバリエーション、変更、および置換を想起するであろう。本明細書に記載の本明細書に記載の主題の態様に対する様々な代替物が、本明細書に記載の主題を実施する際に使用され得ることが理解されるべきである。以下の特許請求の範囲は、本明細書に記載の主題の範囲を定義し、これらの特許請求の範囲の範囲内の方法および構造、ならびにそれらの等価物が、それによって網羅されることが意図される。

参照による組み込み
本明細書に言及されるすべての公開物、特許、および特許出願は、各個別の公開物、特許、または特許出願が、具体的かつ個別に参照により組み込まれることが示されるのと同程度に、参照により本明細書に組み込まれる。これには、以下の特許文書が含まれる：米国特許公開第２００３／０１５２９８４号、同第２００６／０１１５８５０号、同第２００６／０１２７９２０号、同第２００７／０２３１８０５号、同第２００７／０２９２９５４号、同第２００９／０２７５０８６号、同第２０１０／００６２４９５号、同第２０１０／０２１６６４８号、同第２０１０／０２９１６３３号、同第２０１１／０１２４０４９号、同第２０１２／００５３０８７号、および同第２０１７／２５３９０９号。米国特許第５，５８０，７５９号、同第５，６２４，８２７号、同第５，８６９，６４４号、同第６，１１０，６６８号、同第６，４９５，３１８号、同第６，５２１，４２７号、同第７，７０４，６９０号、同第７，８３３，７５９号、同第７，８３８，２１０号、同第８，２２４，５７８号、同第１０，６２６，３８３号、および同第１０，１９６，６１８号。ＰＣＴ公開第２００５／０９５６０５号、同第２０１０／０４０５３１号、同第２０１１／１０２８０２号、同第２０１３／０４９２２７号、同第２０１６／０９４５１２号、および同第２０２０／００１７８３号。

本発明の例示的な主題を、以下の条項によって表す。

条項１．核酸分子のエラー訂正された集団を生成するための方法であって、方法が、
（ａ）一次アセンブリＰＣＲによって末端配列相補性の領域を有するオリゴヌクレオチドをアセンブルして、アセンブルされた核酸分子の集団を形成することと、
（ｂ）ステップ（ａ）において形成されたアセンブルされた核酸分子の集団を一次増幅によって増幅して、増幅されたアセンブルされた核酸分子の集団を形成することと、を含み、
ステップ（ａ）および／または（ｂ）は、１つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。

条項２．１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、熱安定性不一致結合タンパク質である、条項１に記載の方法。

条項３．熱安定性不一致結合タンパク質が、表１３または表１５に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、条項２に記載の方法。

条項４．１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、熱安定性不一致エンドヌクレアーゼある、条項１に記載の方法。

条項５．熱安定性不一致エンドヌクレアーゼが、表１２または表１５に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、条項１または４に記載の方法。

条項６．熱安定性不一致エンドヌクレアーゼが、ＴｋｏＥｎｄｏＭＳである、条項４または５に記載の方法。

条項７．高忠実度ＤＮＡポリメラーゼが、ステップ（ａ）および／または（ｂ）において使用される、条項１～６のいずれか一項に記載の方法。

条項８．高忠実度ＤＮＡポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、条項７に記載の方法。

条項９．高忠実度ＤＮＡポリメラーゼが、表１４に記載の（１）ＤＮＡポリメラーゼ１、（２）ＤＮＡポリメラーゼ２、（３）ＤＮＡポリメラーゼ３、（４）ＤＮＡポリメラーゼ４、（５）ＤＮＡポリメラーゼ５、（６）ＤＮＡポリメラーゼ６、（７）ＤＮＡポリメラーゼ７からなる群から選択されるアミノ酸配列を有するポリメラーゼである、条項７または８に記載の方法。

条項１０．エラー低減ポリメラーゼ試薬が、１つ以上のアミン化合物を含む、条項８または９に記載の方法。

条項１１．１つ以上のアミン化合物が、
（ａ）ジメチルアミン塩酸塩
（ｂ）ジイソプロピルアミン塩酸塩、
（ｃ）エチル（メチル）アミン塩酸塩、および
（ｄ）トリメチルアミン塩酸塩からなる群から選択される、条項１０に記載の組成物。

条項１２．１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、ステップ（ａ）に存在する、条項１～１１のいずれか一項に記載の方法。

条項１３．１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、ステップ（ｂ）に存在する、条項１～１２のいずれか一項に記載の方法。

条項１４．１つ以上のエラー訂正ステップが、一次増幅の後に実施される、条項１～１３のいずれか一項に記載の方法。

条項１５．増幅されたアセンブルされた核酸分子の集団の一次後増幅が、ステップ（ｂ）の後に実施される、条項１～１４のいずれか一項に記載の方法。

条項１６．増幅されたアセンブルされた核酸分子の集団を、一次後増幅の前に、１つ以上の不一致認識タンパク質と接触させる、条項１～１５のいずれか一項に記載の方法。

条項１７．１つ以上の不一致認識タンパク質のうちの少なくとも１つが、不一致エンドヌクレアーゼである、条項１６に記載の方法。

条項１８．不一致エンドヌクレアーゼが、非熱安定性不一致エンドヌクレアーゼである、条項１７に記載の方法。

条項１９．非熱安定性不一致エンドヌクレアーゼが、
（ａ）Ｔ７エンドヌクレアーゼＩ、
（ｂ）ＣＥＬＩＩヌクレアーゼ、
（ｃ）ＣＥＬＩヌクレアーゼ、および
（ｄ）Ｔ４エンドヌクレアーゼＶＩＩからなる群から選択される、条項１８に記載の方法。

条項２０．増幅されたアセンブルされた核酸分子の集団が、より大きな核酸分子の亜断片を含み、かつより大きな核酸分子の亜断片でもある別の核酸分子と組み合わされて、核酸分子プールを形成する、条項１～１９のいずれか一項に記載の方法。

条項２１．核酸分子プールの核酸分子が、二次アセンブリＰＣＲによってアセンブルされて、より大きな核酸分子を形成する、条項２０に記載の方法。

条項２２．亜断片を、二次アセンブリＰＣＲによるアセンブリの前またはアセンブリ中に、１つ以上の不一致認識タンパク質と接触させる、条項２１に記載の方法。

条項２３．より大きな核酸分子が、熱変性され、次いで再生され、続いて１つ以上の不一致認識タンパク質と接触する、条項２０～２２のいずれか一項に記載の方法。

条項２４．１つ以上の不一致認識タンパク質のうちの少なくとも１つが、不一致結合タンパク質である、条項２３に記載の方法。

条項２５．不一致結合タンパク質が、固体支持体に結合されている、条項２４に記載の方法。

条項２６．増幅されたアセンブルされた核酸分子の集団が、配列決定される、条項１～２５のいずれか一項に記載の方法。

条項２７．増幅されたアセンブルされた核酸分子の集団が、１，０００塩基対当たり２つ未満のエラーを含有する、条項１～２６のいずれか一項に記載の方法。

条項２８．熱安定性不一致認識タンパク質、ＤＮＡポリメラーゼ、および１つ以上のアミン化合物を含む組成物。

条項２９．ＤＮＡポリメラーゼが、高忠実度ＤＮＡポリメラーゼである、条項２８に記載の組成物。

条項３０．高忠実度ＤＮＡポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、条項２９に記載の組成物。

条項３１．高忠実度ＤＮＡポリメラーゼが、表１４に記載のアミノ酸配列を含む、条項２９または３０に記載の組成物。

条項３２．１つ以上のアミン化合物が、
（ａ）ジメチルアミン塩酸塩、
（ｂ）ジイソプロピルアミン塩酸塩、
（ｃ）エチル（メチル）アミン塩酸塩、および
（ｄ）トリメチルアミン塩酸塩からなる群から選択される、条項２８に記載の組成物。

条項３３．２つ以上の核酸分子をさらに含む、条項２８～３２のいずれか一項に記載の組成物。

条項３４．２つ以上の核酸分子が、より大きな核酸分子の亜断片である、条項３３に記載の組成物。

条項３５．２つ以上の核酸分子が、一本鎖である、条項３３または３４に記載の組成物。

条項３６．２つ以上の一本鎖核酸分子が、１００ヌクレオチド長未満である、条項３５に記載の組成物。

条項３７．２つ以上の一本鎖核酸分子が、約３５～約９０ヌクレオチド長である、条項３５に記載の組成物。

条項３８．２つ以上の一本鎖核酸分子が、約３０～約６５ヌクレオチド長である、条項３５に記載の組成物。

条項３９．熱安定性不一致認識タンパク質が、不一致エンドヌクレアーゼである、条項２８～３８のいずれか一項に記載の組成物。

条項４０．熱安定性不一致エンドヌクレアーゼが、表１２または表１５に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、条項３９に記載の組成物。

条項４１．熱安定性不一致エンドヌクレアーゼが、ＴｋｏＥｎｄｏＭＳである、条項４０に記載の組成物。

条項４２．熱安定性不一致認識タンパク質が、不一致結合タンパク質である、条項２８～３８のいずれか一項に記載の組成物。

条項４３．熱安定性不一致結合タンパク質が、表１３または表１５に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、条項４２に記載の組成物。

条項４４．２つ以上の核酸分子のうちの少なくとも１つが、一本鎖であり、２つ以上の核酸分子のうちの少なくとも１つが、二本鎖である、条項３３または３４に記載の組成物。

条項４５．所定の配列を有する核酸分子を生成する方法であって、方法が、
（ａ）相補的重複領域を有する複数の一本鎖オリゴヌクレオチドを提供することであって、一本鎖オリゴヌクレオチドの各々が、標的核酸分子の配列領域を含み、複数の一本鎖オリゴヌクレオチドが、
（ｉ）複数の内部オリゴヌクレオチドであって、複数において２つの他のオリゴヌクレオチドと重複する配列領域を有する、複数の内部オリゴヌクレオチド、ならびに
（ｉｉ）全長核酸分子の５’および３’末端に位置するように設計され、複数において内部オリゴヌクレオチドのうちの１つと重複する配列領域を有する、２つの末端オリゴヌクレオチドを含む、提供すること、
（ｂ）一次アセンブリＰＣＲによって複数のオリゴヌクレオチドをアセンブルして、アセンブルされた二本鎖核酸アセンブリ産物を得ること、
（ｃ）ステップ（ｂ）において得られたアセンブリ産物の少なくとも一部分を、一対のプライマーと組み合わせることであって、プライマーが、アセンブリ産物の５’および３’末端に結合するように設計された、組み合わせること、ならびにＰＣＲ増幅反応を実施して、増幅されたアセンブリ産物を産生すること、を含み、
ステップ（ｂ）および／またはステップ（ｃ）が、１つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。

条項４６．（ｄ）１つ以上のエラー訂正ステップを実施することをさらに含み、エラー訂正ステップが、
（ｉｉｉ）ステップ（ｃ）の増幅されたアセンブリ産物を変性および再アニーリングして、二本鎖核酸を含有する１つ以上の不一致を生成すること、ならびに
（ｉｖ）二本鎖核酸を含有する不一致を、１つ以上の不一致認識タンパク質で処理すること、ならびに
（ｖ）任意選択で、増幅反応を実施すること、を含む、条項４５に記載の方法。

条項４７．ステップ（ｄ）において使用される不一致認識タンパク質が、不一致エンドヌクレアーゼまたは不一致結合タンパク質である、条項４６に記載の方法。

条項４８．不一致エンドヌクレアーゼが、Ｔ７エンドヌクレアーゼＩである、条項４７に記載の方法。

条項４９．不一致結合タンパク質が、ＭｕｔＳである、条項４７に記載の方法。

条項５０．熱安定性不一致認識タンパク質が、熱安定性不一致エンドヌクレアーゼとしてである、条項４５または４６に記載の方法。

条項５１．熱安定性不一致エンドヌクレアーゼが、超好熱性古細菌に由来し、任意選択で、超好熱性古細菌が、ＰｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓまたはＰｙｒｏｃｏｃｃｕｓａｂｙｓｓｉである、条項５０に記載の方法。

条項５２．熱安定性不一致認識タンパク質が、表１２、１３、または１５に示されるアミノ酸配列を有するタンパク質、およびそれらと少なくとも９５％の配列同一性を有するそれらのバリアントの群から選択される、条項４５または４６に記載の方法。

条項５３．熱安定性不一致認識タンパク質が、インビトロ転写／翻訳によって得られる、条項４９～５２のいずれか一項に記載の方法。

条項５４．ステップ（ｂ）、（ｃ）および（ｄ）（ｉｉｉ）のうちの１つ以上が、高忠実度ＤＮＡポリメラーゼの存在下で実施され、任意選択で、ポリメラーゼが、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ、Ｑ５ＤＮＡポリメラーゼ、およびＰＲＩＭＥＳＴＡＲＧＸＬＤＮＡポリメラーゼからなる群から選択される、条項４５～５３のいずれか一項に記載の方法。

条項５５．ステップ（ｂ）、（ｃ）および（ｄ）（ｉｉｉ）のうちの１つ以上が、高忠実度ＤＮＡポリメラーゼの存在下で実施され、任意選択で、ポリメラーゼが、表１４に記載の（１）ＤＮＡポリメラーゼ１、（２）ＤＮＡポリメラーゼ２、（３）ＤＮＡポリメラーゼ３、（４）ＤＮＡポリメラーゼ４、（５）ＤＮＡポリメラーゼ５、（６）ＤＮＡポリメラーゼ６、（７）ＤＮＡポリメラーゼ７からなる群から選択されるアミノ酸配列を有するポリメラーゼである、条項４５～５３のいずれか一項に記載の方法。

条項５６．２つ以上の増幅されたアセンブリ産物が、１つ以上のエラー訂正ステップを実施する前にプールされる、条項４５～５３のいずれか一項に記載の方法。

条項５７．１つ以上のエラー訂正ステップの前に、増幅されたアセンブリ産物をエキソヌクレアーゼで処理することをさらに含み、任意選択で、エキソヌクレアーゼが、エキソヌクレアーゼＩである、条項４６～５３のいずれか一項に記載の方法。

Claims

核酸分子のエラー訂正された集団を生成するための方法であって、前記方法が、
（ａ）一次アセンブリＰＣＲによって末端配列相補性の領域を有するオリゴヌクレオチドをアセンブルして、アセンブルされた核酸分子の集団を形成することと、
（ｂ）ステップ（ａ）において形成された前記アセンブルされた核酸分子の集団を一次増幅によって増幅して、増幅されたアセンブルされた核酸分子の集団を形成することと、を含み、
ステップ（ａ）および／または（ｂ）は、１つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。
前記１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、熱安定性不一致結合タンパク質である、請求項１に記載の方法。
前記熱安定性不一致結合タンパク質が、表１３または表１５に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、請求項２に記載の方法。
前記１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、熱安定性不一致エンドヌクレアーゼある、請求項１に記載の方法。
前記熱安定性不一致エンドヌクレアーゼが、表１２または表１５に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、請求項１または４に記載の方法。
前記熱安定性不一致エンドヌクレアーゼが、ＴｋｏＥｎｄｏＭＳである、請求項４または５に記載の方法。
高忠実度ＤＮＡポリメラーゼが、ステップ（ａ）および／または（ｂ）において使用される、請求項１～６のいずれか一項に記載の方法。
前記高忠実度ＤＮＡポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、請求項７に記載の方法。
前記高忠実度ＤＮＡポリメラーゼが、表１４に記載の（１）ＤＮＡポリメラーゼ１、（２）ＤＮＡポリメラーゼ２、（３）ＤＮＡポリメラーゼ３、（４）ＤＮＡポリメラーゼ４、（５）ＤＮＡポリメラーゼ５、（６）ＤＮＡポリメラーゼ６、（７）ＤＮＡポリメラーゼ７からなる群から選択されるアミノ酸配列を有するポリメラーゼである、請求項７または８に記載の方法。
前記エラー低減ポリメラーゼ試薬が、１つ以上のアミン化合物を含む、請求項８または９に記載の方法。
前記１つ以上のアミン化合物が、
（ａ）ジメチルアミン塩酸塩
（ｂ）ジイソプロピルアミン塩酸塩、
（ｃ）エチル（メチル）アミン塩酸塩、および
（ｄ）トリメチルアミン塩酸塩からなる群から選択される、請求項１０に記載の方法。
前記１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、ステップ（ａ）に存在する、請求項１～１１のいずれか一項に記載の方法。
前記１つ以上の熱安定性不一致認識タンパク質のうちの少なくとも１つが、ステップ（ｂ）に存在する、請求項１～１２のいずれか一項に記載の方法。
１つ以上のエラー訂正ステップが、一次増幅の後に実施される、請求項１～１３のいずれか一項に記載の方法。
前記増幅されたアセンブルされた核酸分子の集団の一次後増幅が、ステップ（ｂ）の後に実施される、請求項１～１４のいずれか一項に記載の方法。
前記増幅されたアセンブルされた核酸分子の集団を、前記一次後増幅の前に、１つ以上の不一致認識タンパク質と接触させる、請求項１～１５のいずれか一項に記載の方法。
前記１つ以上の不一致認識タンパク質のうちの少なくとも１つが、不一致エンドヌクレアーゼである、請求項１６に記載の方法。
前記不一致エンドヌクレアーゼが、非熱安定性不一致エンドヌクレアーゼである、請求項１７に記載の方法。
前記非熱安定性不一致エンドヌクレアーゼが、
（ａ）Ｔ７エンドヌクレアーゼＩ、
（ｂ）ＣＥＬＩＩヌクレアーゼ、
（ｃ）ＣＥＬＩヌクレアーゼ、および
（ｄ）Ｔ４エンドヌクレアーゼＶＩＩからなる群から選択される、請求項１８に記載の方法。
前記増幅されたアセンブルされた核酸分子の集団が、より大きな核酸分子の亜断片を含み、かつ前記より大きな核酸分子の亜断片でもある別の核酸分子と組み合わされて、核酸分子プールを形成する、請求項１～１９のいずれか一項に記載の方法。
前記核酸分子プールの前記核酸分子が、二次アセンブリＰＣＲによってアセンブルされて、前記より大きな核酸分子を形成する、請求項２０に記載の方法。
前記亜断片を、二次アセンブリＰＣＲによるアセンブリの前またはアセンブリ中に、前記１つ以上の不一致認識タンパク質と接触させる、請求項２１に記載の方法。
前記より大きな核酸分子が、熱変性され、次いで再生され、続いて前記１つ以上の不一致認識タンパク質と接触する、請求項２０～２２のいずれか一項に記載の方法。
前記１つ以上の不一致認識タンパク質のうちの前記少なくとも１つが、不一致結合タンパク質である、請求項２３に記載の方法。
前記不一致結合タンパク質が、固体支持体に結合されている、請求項２４に記載の方法。
前記増幅されたアセンブルされた核酸分子の集団が、配列決定される、請求項１～２５のいずれか一項に記載の方法。
前記増幅されたアセンブルされた核酸分子の集団が、１，０００塩基対当たり２つ未満のエラーを含有する、請求項１～２６のいずれか一項に記載の方法。
熱安定性不一致認識タンパク質、ＤＮＡポリメラーゼ、および１つ以上のアミン化合物を含む、組成物。
前記ＤＮＡポリメラーゼが、高忠実度ＤＮＡポリメラーゼである、請求項２８に記載の組成物。
前記高忠実度ＤＮＡポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、請求項２９に記載の組成物。
前記高忠実度ＤＮＡポリメラーゼが、表１４に記載のアミノ酸配列を含む、請求項２９または３０に記載の組成物。
前記１つ以上のアミン化合物が、
（ａ）ジメチルアミン塩酸塩、
（ｂ）ジイソプロピルアミン塩酸塩、
（ｃ）エチル（メチル）アミン塩酸塩、および
（ｄ）トリメチルアミン塩酸塩からなる群から選択される、請求項２８に記載の組成物。
２つ以上の核酸分子をさらに含む、請求項２８～３２のいずれか一項に記載の組成物。
前記２つ以上の核酸分子が、より大きな核酸分子の亜断片である、請求項３３に記載の組成物。
前記２つ以上の核酸分子が、一本鎖である、請求項３３または３４に記載の組成物。
前記２つ以上の一本鎖核酸分子が、１００ヌクレオチド長未満である、請求項３５に記載の組成物。
前記２つ以上の一本鎖核酸分子が、約３５～約９０ヌクレオチド長である、請求項３５に記載の組成物。
前記２つ以上の一本鎖核酸分子が、約３０～約６５ヌクレオチド長である、請求項３５に記載の組成物。
前記熱安定性不一致認識タンパク質が、不一致エンドヌクレアーゼである、請求項２８～３５のいずれか一項に記載の組成物。
前記熱安定性不一致エンドヌクレアーゼが、表１２または表１５に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、請求項３９に記載の組成物。
前記熱安定性不一致エンドヌクレアーゼが、ＴｋｏＥｎｄｏＭＳである、請求項４０に記載の組成物。
前記熱安定性不一致認識タンパク質が、不一致結合タンパク質である、請求項２８～３８のいずれか一項に記載の組成物。
前記熱安定性不一致結合タンパク質が、表１３または表１５に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、請求項４２に記載の組成物。
前記２つ以上の核酸分子のうちの少なくとも１つが、一本鎖であり、前記２つ以上の核酸分子のうちの少なくとも１つが、二本鎖である、請求項３３または３４に記載の組成物。
所定の配列を有する核酸分子を生成する方法であって、前記方法が、
（ａ）相補的重複領域を有する複数の一本鎖オリゴヌクレオチドを提供することであって、前記一本鎖オリゴヌクレオチドの各々が、標的核酸分子の配列領域を含み、前記複数の一本鎖オリゴヌクレオチドが、
（ｉ）複数の内部オリゴヌクレオチドであって、前記複数において２つの他のオリゴヌクレオチドと重複する配列領域を有する、複数の内部オリゴヌクレオチド、ならびに
（ｉｉ）全長核酸分子の５’および３’末端に位置するように設計され、前記複数において前記内部オリゴヌクレオチドのうちの１つと重複する配列領域を有する、２つの末端オリゴヌクレオチドを含む、提供すること、
（ｂ）一次アセンブリＰＣＲによって前記複数のオリゴヌクレオチドをアセンブルして、アセンブルされた二本鎖核酸アセンブリ産物を得ること、
（ｃ）ステップ（ｂ）において得られた前記アセンブリ産物の少なくとも一部分を、一対のプライマーと組み合わせることであって、前記プライマーが、前記アセンブリ産物の５’および３’末端に結合するように設計された、組み合わせること、ならびにＰＣＲ増幅反応を実施して、増幅されたアセンブリ産物を産生すること、を含み、
ステップ（ｂ）および／またはステップ（ｃ）が、１つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。
（ｄ）１つ以上のエラー訂正ステップを実施することをさらに含み、エラー訂正ステップが、
（ｉｉｉ）ステップ（ｃ）の前記増幅されたアセンブリ産物を変性および再アニーリングして、二本鎖核酸を含有する１つ以上の不一致を生成すること、ならびに
（ｉｖ）前記二本鎖核酸を含有する不一致を、１つ以上の不一致認識タンパク質で処理すること、ならびに
（ｖ）任意選択で、増幅反応を実施すること、を含む、請求項４５に記載の方法。
ステップ（ｄ）において使用される前記不一致認識タンパク質が、不一致エンドヌクレアーゼまたは不一致結合タンパク質である、請求項４６に記載の方法。
前記不一致エンドヌクレアーゼが、Ｔ７エンドヌクレアーゼＩである、請求項４７に記載の方法。
前記不一致結合タンパク質が、ＭｕｔＳである、請求項４７に記載の方法。
前記熱安定性不一致認識タンパク質が、熱安定性不一致エンドヌクレアーゼとしてである、請求項５０に記載の方法。
前記熱安定性不一致エンドヌクレアーゼが、超好熱性古細菌に由来し、任意選択で、前記超好熱性古細菌が、ＰｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓまたはＰｙｒｏｃｏｃｃｕｓａｂｙｓｓｉである、請求項５０に記載の方法。
前記熱安定性不一致認識タンパク質が、表１２、１３、または１５に記載のアミノ酸配列を有するタンパク質、およびそれらと少なくとも９５％の配列同一性を有するそれらのバリアントの群から選択される、請求項４５または４６に記載の方法。
前記熱安定性不一致認識タンパク質が、インビトロ転写／翻訳によって得られる、請求項４９～５２のいずれか一項に記載の方法。
ステップ（ｂ）、（ｃ）および（ｄ）（ｉｉｉ）のうちの１つ以上が、高忠実度ＤＮＡポリメラーゼの存在下で実施され、任意選択で、前記ポリメラーゼが、ＰＨＵＳＩＯＮ（商標）ＤＮＡポリメラーゼ、ＰＬＡＴＩＮＵＭ（商標）ＳＵＰＥＲＦＩ（商標）ＩＩＤＮＡポリメラーゼ、Ｑ５ＤＮＡポリメラーゼ、およびＰＲＩＭＥＳＴＡＲＧＸＬＤＮＡポリメラーゼからなる群から選択される、請求項４５～５３のいずれか一項に記載の方法。
ステップ（ｂ）、（ｃ）および（ｄ）（ｉｉｉ）のうちの１つ以上が、高忠実度ＤＮＡポリメラーゼの存在下で実施され、任意選択で、前記ポリメラーゼが、表１４に記載の（１）ＤＮＡポリメラーゼ１、（２）ＤＮＡポリメラーゼ２、（３）ＤＮＡポリメラーゼ３、（４）ＤＮＡポリメラーゼ４、（５）ＤＮＡポリメラーゼ５、（６）ＤＮＡポリメラーゼ６、（７）ＤＮＡポリメラーゼ７からなる群から選択されるアミノ酸配列を有するポリメラーゼである、請求項４５～５３のいずれか一項に記載の方法。
２つ以上の増幅されたアセンブリ産物が、前記１つ以上のエラー訂正ステップを実施する前にプールされる、請求項４５～５３のいずれか一項に記載の方法。
前記１つ以上のエラー訂正ステップの前に、前記増幅されたアセンブリ産物をエキソヌクレアーゼで処理することをさらに含み、任意選択で、前記エキソヌクレアーゼが、エキソヌクレアーゼＩである、請求項４６～５３のいずれか一項に記載の方法。