JP2023506569A

JP2023506569A - 遺伝子変異ライブラリを構築するための方法

Info

Publication number: JP2023506569A
Application number: JP2022537822A
Authority: JP
Inventors: ダイ，シャオフイ; リー，イーファン; ウー，ジョンシェン
Original assignee: Nanjing Jinsirui Science and Technology Biology Corp
Current assignee: Nanjing Jinsirui Science and Technology Biology Corp
Priority date: 2019-12-19
Filing date: 2020-12-18
Publication date: 2023-02-16
Also published as: US20230348894A1; EP4079945A1; WO2021121391A1; CN114829685A

Abstract

蓄積容量が大きい遺伝子変異ライブラリを作製するために、比較的少ないオリゴマー配列を合成し、次にそれを組み立てることが可能な、蓄積容量が大きい遺伝子変異ライブラリの構築方法が提供される。

Description

本発明は、遺伝子工学の分野、及び特に蓄積容量が大きい遺伝子変異ライブラリの構築に関する。本発明において、比較的少ないオリゴマー配列を合成し、次にそれを組み立てることによって、蓄積容量が大きい遺伝子変異ライブラリが作製される。

インビトロ分子最適化は、改善された又は新規の変異タンパク質を作製し、制御配列を同定し、構造及び機能に対する重大な残基を探索するために、非常に効果的に使用され得る。インビトロ分子最適化の方法を使用した合成ライブラリの構築は、タンパク質の特性、制御及び機能を体系的に調べるための非常に有効な方法である。異なる下流発現系に従い、遺伝子変異ライブラリの構築のために理論的に必要とされる全てのプライマーを合成するためにハイスループット半導体精密プライマープールを使用することによって、コドン最適化を行い得、予想外のコドン又は停止コドンを導入する問題を根本的に排除するために、各変異位置での異なるコドン分布率が設定され得る。ライブラリは、その後のスクリーニングに対する時間及び労力を削減するために、必要とされる変異体のみを含有する。しかし現在、ハイスループット半導体精密プライマープールにより合成されるオリゴマーの数は限定的であり、半導体チップにより蓄積容量が大きいライブラリ（１０^５～１０^１０）を合成するための費用は非常に高額になる。

ＫｉｔｚｍａｎＪＯ，ＳｔａｒｉｔａＬＭ，ＬｏＲＳｅｔａｌ．，Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｎｇｌｅ－ａｍｉｎｏ－ａｃｉｄｍｕｔａｇｅｎｅｓｉｓ［Ｊ］．ＮａｔｕｒｅＭｅｔｈｏｄｓ，２０１５，１２（３）：２０３－２０６．ＫｏｓｕｒｉＳ，ＥｒｏｓｈｅｎｋｏＮ，ＬｅｐｒｏｕｓｔＥＭｅｔａｌ．，ＳｃａｌａｂｌｅｇｅｎｅｓｙｎｔｈｅｓｉｓｂｙｓｅｌｅｃｔｉｖｅａｍｐｌｉｆｉｃａｔｉｏｎｏｆＤＮＡｐｏｏｌｓｆｒｏｍｈｉｇｈ－ｆｉｄｅｌｉｔｙｍｉｃｒｏｃｈｉｐｓ［Ｊ］．ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，２０１０，２８（１２）：１２９５－１２９９．ＥｎｇｌｅｒＣｅｔａｌ．，ＰＬｏＳＯＮＥ，２００８，３（１１）：ｅ３６４７ＥｎｇｌｅｒＣｅｔａｌ．，ＰＬｏＳＯＮＥ，２００９，４（５）：ｅ５５５３Ｓａｍｂｒｏｏｋｅｔａｌ．，１９８９，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（ＳｅｃｏｎｄＥｄｉｔｉｏｎ），ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，ＮｅｗＹｏｒｋＶｌａｄｉｍｉｒＰ，ＯｎｇＪＬ，ＫｕｃｅｒａＲＢｅｔａｌ．，ＯｐｔｉｍｉｚａｔｉｏｎｏｆＧｏｌｄｅｎＧａｔｅａｓｓｅｍｂｌｙｔｈｒｏｕｇｈａｐｐｌｉｃａｔｉｏｎｏｆｌｉｇａｔｉｏｎｓｅｑｕｅｎｃｅ－ｄｅｐｅｎｄｅｎｔｆｉｄｅｌｉｔｙａｎｄｂｉａｓｐｒｏｆｉｌｉｎｇ［Ｊ］．ＢｉｏＲｘｉｖ，２０１８：３２２２９７

これを考慮して、蓄積容量が大きい遺伝子変異ライブラリを得るために、比較的少ないオリゴマー配列を合成し、次いでそれを組み立てることが可能である、蓄積容量が大きい
ライブラリの構築方法が発明され、これによって大容量ライブラリ構築に対する費用が大きく削減される。

具体的に、本発明は、次の態様に関する：
本発明の第１の態様は、蓄積容量が大きい遺伝子変異ライブラリを構築するための方法に関し、この方法は、
（１）ライブラリ構築を必要とするアミノ酸配列をコードするヌクレオチド配列に従い、設計される２つの隣接するオリゴマープールが消化後に同じ粘着末端を生成させる、変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有する２つ以上のオリゴマープールを設計し、合成し；
（２）前記オリゴマープールを増幅させ；
（３）組み立てられたオリゴマープールを得るために、反応系において前記オリゴマープールを組み立て；
（４）前記蓄積容量が大きい遺伝子変異ライブラリを得るために、前記組み立てられたオリゴマープールを増幅させること
を含む。

一実施形態では、本発明の方法における段階（２）は、増幅された各オリゴマープールを得るために、それぞれ各オリゴマープールを鋳型として使用し、各オリゴマープールの配列に従い設計したフォワードプライマー及びリバースプライマーをプライマー対として使用し、ハイフィデリティーＤＮＡポリメラーゼを使用することによって、各オリゴマープールにおいてＰＣＲ増幅を実施することを含む。好ましくは、ＰＣＲ増幅系にウシ血清アルブミンがさらに含まれる。

一実施形態では、本発明の方法の段階（３）は、増幅された各オリゴマープールを添加し、制限エンドヌクレアーゼ及びＤＮＡリガーゼを同時に添加し、組み立てられたオリゴマープールを得るために制限ライゲーション法を使用することにより、増幅された各オリゴマープールを組み立てることを含む。

一実施形態では、本発明の方法の段階（４）は、ＰＣＲを実施するために、組み立てられたオリゴマープールを鋳型として使用し、第１のオリゴマープールのフォワードプライマー及び最後のオリゴマープールのリバースプライマーをプライマー対として使用し、ハイフィデリティーＤＮＡポリメラーゼを使用することによって、組み立てられたオリゴマープールにおいてＰＣＲ増幅を実施して、蓄積容量が大きい遺伝子変異ライブラリを得ることを含む。

一実施形態では、本発明の遺伝子変異ライブラリの蓄積容量は、最大１０^５、好ましくは最大１０^６、より好ましくは最大１０^７、より好ましくは最大１０^８、より好ましくは最大１０^９、より好ましくは最大１０^１０である。

一実施形態では、本発明で使用される制限エンドヌクレアーゼはＩＩＳ制限エンドヌクレアーゼであり、消化後、隣接する２つのオリゴマープールが同じ粘着末端を生成させる。ＩＩＳ型制限エンドヌクレアーゼは、ＡｃｕＩ、ＡｌｗＩ、ＢｂｓＩ、ＢｂｖＩ、ＢｃｃＩ、ＢｃｅＡＩ、ＢｃｉＶＩ、ＢｆｕＡＩ、ＢｍｒＩ、ＢｐｍＩ、ＢｐｕＥＩ、ＢｓａＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＡＩ、ＢｓｍＢＩ、ＢｓｍＦＩ、ＢｓｐＭＩ、ＢｓｐＱＩ、ＢｓｒＤＩ、ＢｔｇＺＩ、ＢｔｓＣＩ、ＢｔｓＩ、ＥａｒＩ、ＥｃｉＩ、ＥｃｏＰ１５Ｉ、ＦａｕＩ、ＦｏｋＩ、ＨｇａＩ、ＨｐｈＩ、ＨｐｙＡＶ、ＭｂｏＩＩ、ＭｍｅＩ、ＭｎｌＩ、ＰｌｅＩ、ＳａｐＩ及びＳｆａＮＩのうち１つ以上から選択される。好ましくは、ＩＩＳ型制限エンドヌクレアーゼはＢｓａＩである。

一実施形態では、本発明の方法の段階（１）は、次のことを含む：
（ｉ）コードヌクレオチド配列において粘着末端を同定し、その配列を粘着末端の３’末端に従い２つ以上のオリゴマープールに対応する２つ以上の断片に分割し、
（ｉｉ）配列が２つの断片に分割される場合、
オリゴマープール１を得るために、第１の断片の粘着末端の後に３’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列１を連続的に導入し、オリゴマープール２を得るために、第２の断片の５’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列２を連続的に導入するか；
又は、配列がｎ個の断片に分割される場合（ｎは３以上の正の整数）、
オリゴマープール１を得るために、第１の断片の粘着末端の後に３’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列１を連続的に導入し；オリゴマープール２を得るために、第２の断片の５’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列２を連続的に導入し、第２の断片の粘着末端の後に３’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列３を連続的に導入するなどし、同様に、オリゴマープールｎを得るために、ｎ番目の断片の５’末端で、粘着末端、制限エンドヌクレアーゼの認識配列及び特定配列２ｎ－２を連続的に導入し、ｎ番目の断片の粘着末端の後に３’末端で制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列２ｎ－１を連続的に導入する。

一実施形態では、特定配列１～特定配列２ｎ－１は、元のコードヌクレオチド配列と相同ではないランダム配列であり得る。

一実施形態では、粘着末端は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）又は縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）である。一実施形態では、粘着末端は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）であり、オリゴマープールの数は２～６、好ましくは２つである。別の実施形態では、粘着末端が縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）であり、オリゴマープールの数は２つである。一実施形態では、粘着末端のＧＣ含量は５０％～７５％である。一実施形態では，粘着末端はパリンドローム構造を含有しない。

一実施形態では、本発明の方法の段階（３）の制限ライゲーション法はＧｏｌｄｅｎＧａｔｅクローニングである。

一実施形態では、本発明の方法は、（５）最終的なライブラリ産物を得るために、段階（４）で得た遺伝子変異ライブラリ産物を回収及び／又は精製することをさらに含む。好ましくは、段階（４）で得た遺伝子変異ライブラリ産物をゲル電気泳動により回収及び／又は精製する。

一実施形態では、本発明の方法は、（６）配列分布を検証する、及び／又はアミノ酸分布を検出するために、段階（５）で得た最終ライブラリ産物をシーケンシングすることをさらに含む。好ましくは、シーケンシングは、サンガーシーケンシング及び／又はＮＧＳシーケンシングである。

一実施形態では、段階（１）で合成される各オリゴマープール中の変異ヌクレオチドの数は、１～１０８、好ましくは１～２１である。一実施形態では、本発明の方法の段階（１）で合成される各オリゴマープール中の変異ヌクレオチドは、１～３６個、好ましくは１～７個の変異アミノ酸をコードする。一実施形態では、段階（１）で合成される各オリゴマープール中の変異ヌクレオチドによりコードされる変異アミノ酸は、隣接又は非隣の何れかである。

一実施形態では、本発明の方法で使用されるハイフィデリティーＤＮＡポリメラーゼは、ＰｈｕｓｉｏｎＤＮＡポリメラーゼ、Ｑ５ポリメラーゼ及びｐｒｉｍｅｒＳＴＡＲポリメラーゼのうち１つ以上から選択される。好ましい実施形態では、使用されるハイフィデリティーＤＮＡポリメラーゼはＰｈｕｓｉｏｎＤＮＡポリメラーゼである。

本発明の第２の態様は、遺伝子変異ライブラリを構築するために本発明による方法を使用することに関する。

本発明の第３の態様は、タンパク質又はポリペプチドのスクリーニングにおける、本発明による方法により構築される遺伝子変異ライブラリの使用に関する。

本発明の第４の態様は、次の段階を含む、タンパク質中のアミノ酸変異とそのタンパク質の特性、制御及び／又は機能との関係を分析するための方法に関する：
（１）遺伝子変異ライブラリを構築するために本発明による方法を使用すること；
（２）構築された遺伝子変異ライブラリ中の変異遺伝子によりコードされるタンパク質の特性、制御及び／又は機能を非変異タンパク質と比較すること；及び
（３）そのタンパク質中のアミノ酸変異とそのタンパク質の、特性、制御及び／又は機能との間の関係を分析すること。

本発明により解決しようとする技術的問題及び本発明により達成される技術的効果
変異ライブラリは、タンパク質工学及び抗体薬物工学にとって非常に重要である。変異ライブラリを構築するために本発明の方法を使用することによって、その後のスクリーニングのための多くの時間、エネルギー及び金銭が節約され得る。現在、先行技術（オリゴマープールのハイスループット半導体精密合成を含む）により合成されるオリゴマーの数は限定的であり、蓄積容量が大きい（蓄積容量は１０^５を超える）遺伝子変異ライブラリを合成することは非常に困難であるか又は費用が非常に高くなる。蓄積容量が大きい遺伝子変異ライブラリを作製するために、比較的少ないオリゴマー配列を合成し、次いでそれを組み立てることが可能な、蓄積容量が大きいライブラリの構築方法が本発明で開示される。蓄積容量は、最大１０^７～１０^１０であり得、これは、蓄積容量が大きいライブラリを構築する費用を大きく削減し、蓄積容量が大きいライブラリを合成する高コストの問題を解決する。

添付の図面と一緒に合わせて次の詳細な説明から本発明がより完全に理解されよう。

図１は、オリゴマープールを設計するためのライブラリ作製手順のインターフェースである。図２は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を有するオリゴマープール１及びプール２の増幅産物の電気泳動図である（レーン１：ＤＬ３０００；レーン２：オリゴマープール－１；レーン３：オリゴマープール－２）。図３は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）が組み立てられた後のオリゴマープールのピークマップである。図４は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）が組み立てられた後のオリゴマープールの増幅産物の電気泳動図である（レーン１：増幅されたオリゴマープール；レーン２：ＤＬ３０００）。図５は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のサンガーシーケンシングの結果である。図６は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングの配列分布図である。図７は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングのアミノ酸分布である。図８は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）が組み立てられた後のオリゴマープールの増幅産物の電気泳動図である（レーン１：ＤＬ３０００；レーン２：増幅されたオリゴマープール）。図９は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のサンガーシーケンシングの結果である。図１０は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングの配列分布図である。図１１は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングのアミノ酸分布である。

本記載及び添付の特許請求の範囲で使用される場合、単数形「ａ」、「ａｎ」及び「ｔｈｅ」は、文脈から別段明確に示されない限り、複数の指示物を指す。従って、例えば「分子（ｍｏｌｅｃｕｌｅ）」に対する言及は、任意選択的にこのような分子の２つ以上の組み合わせなどを含む。

本明細書中で使用される場合、「約」という用語は、当業者により容易に知られる対応する数値の従来からのエラー範囲を指す。「約」ある特定の値又はパラメーターに対する本明細書中での言及は、値又はパラメーターそれ自身を含む実施形態を含む（及び説明する）。

本明細書中に記載の本発明の態様及び実施形態は、「含む（ｃｏｍｐｒｉｓｅ）」、「からなる（ｃｏｎｓｉｓｔｏｆ）」及び「基本的にからなる（ｅｓｓｅｎｔｉａｌｌｙ
ｃｏｎｓｉｓｔｏｆ）」を含む態様及び実施形態を含むと理解される。

「遺伝子変異ライブラリ」という用語は、大量のＤＮＡ変異体配列の組み合わせを指し、これは、遺伝子合成、遺伝子変異及び／又は定方向進化研究の産物である。遺伝子変異ライブラリは、ハイスループット薬物標的スクリーニング、タンパク質工学による定方向進化、高親和性及び特異性で変異体抗体をスクリーニングするための多様性抗体ライブラリの合成など、研究分野において次第に使用されるようになってきた。遺伝子変異ライブラリの構築は、天然の選択過程を模倣するために部位特異的突然変異誘発及び定方向性進化などの技術を使用し、それにより元のタンパク質のアミノ酸配列を変化させ、特異的な機能を有する変異タンパク質を得ることを含む。遺伝子変異ライブラリは、アラニンスキャニングライブラリ、縮重変異ライブラリ、トリマーライブラリ、部位特異的飽和変異ライブラリ、ランダム変異ライブラリなどを含む。

「遺伝子変異ライブラリの蓄積容量」という用語は、遺伝子変異ライブラリの最大容量サイズを指し、即ち遺伝子変異ライブラリ中に含有されるＤＮＡ変異体配列の数である。言い換えると、遺伝子変異ライブラリの蓄積容量が大きいほど、ライブラリ中に含有されるＤＮＡ変異体配列の数が多くなる。

「オリゴマー」という用語は一般に、比較的少ない反復単位から構成されるポリマーを指し、その相対的分子量は、低分子と巨大分子との間である。本発明のオリゴマーは、ある特定の数のヌクレオチドを含有するヌクレオチドオリゴマーを指し、オリゴヌクレオチドと交換可能に使用され得る。本発明のオリゴマー中に含有されるヌクレオチド数は、２～２００、３～１５０、４～１００、４～５０及び４～３０であり得る。「オリゴマープール」という用語は、本発明において、複数の異なるオリゴマーを含有する混合物を指す
。

「変異ヌクレオチド」という用語は、ポリヌクレオチド又はオリゴヌクレオチド配列中の１つ以上の（例えばいくつかの）位置で変更されているヌクレオチドを指す。この変更は置換、欠失及び挿入から選択される。置換は、ある位置を占有するヌクレオチドを異なるヌクレオチドで置き換えることを意味し；欠失は、ある位置を占有するヌクレオチドを除去することを意味し；挿入は、ある位置を占有するヌクレオチドに隣接する、及びある位置を占有するヌクレオチドにすぐに続く位置でヌクレオチドを付加することを意味する。同様に、「変異アミノ酸」という用語は、タンパク質又はポリペプチド配列中の１つ以上の（例えばいくつかの）位置で変更されているアミノ酸を指す。この変更は置換、欠失及び挿入から選択される。置換は、ある位置を占有するアミノ酸を異なるアミノ酸で置き換えることを意味し；欠失はある位置を占有するアミノ酸を除去することを意味し；挿入は、ある位置を占有するアミノ酸に隣接する、及びある位置を占有するアミノ酸にすぐに続く位置にアミノ酸を付加することを意味する。

「制限エンドヌクレアーゼ」という用語は、特異的なヌクレオチド配列を認識し、各鎖の特異的な位置で２個のヌクレオチド間のホスホジエステル結合を切断する活性タンパク質のクラスを指す。制限エンドヌクレアーゼは広く分布し、ほぼ全ての細菌属及び種が少なくとも１つの制限エンドヌクレアーゼを有する。一般的な制限部位としては、ＡｇｅＩ、ＢａｍＨＩ、ＢｇｌＩＩ、ＥｃｏＲＩ、ＥｃｏＲＶ、ＦｓｅＩ、ＨｉｎｄＩＩＩ、ＭａｕＢＩ、ＭｌｕＩ、ＮｈｅＩ、ＮｏｔＩ、ＰａｃＩ、ＰｍｅＩ、ＰｓｔＩ、ＳａｃＩ、ＳａｃＩＩ、ＳａｌＩ、ＳｍａＩ、ＳｐｅＩ、ＳｆｉＩなどが挙げられるが限定されない。ＤＮＡ配列への制限部位の導入は、ＤＮＡ配列上での分子生物学的操作を促進し得る。

制限エンドヌクレアーゼは、構造／機能特性、サイズ、必要な補因子及びその作用形式に従い、次のタイプ：Ｉ型制限エンドヌクレアーゼ、ＩＩ型制限エンドヌクレアーゼ及びＩＩＩ型制限エンドヌクレアーゼに分けられ得る。Ｉ型制限エンドヌクレアーゼの分子量は比較的大きく、反応過程においてＭｇ^２＋に加えてＳ－アデノシル－Ｌ－メチオニン、ＡＴＰなどを必要とする。これは宿主ＤＮＡのメチル化（即ち修飾）を触媒し得、これは非メチル化ＤＮＡの加水分解も触媒し得る（即ち認識及び酵素性消化）。通常、Ｉ型制限エンドヌクレアーゼの制限部位は、認識配列から数千塩基離れている。ＩＩ型制限エンドヌクレアーゼは通常、分子量が比較的小さく、反応のためにＭｇ^２＋のみを要する。これは、非メチル化ＤＮＡの加水分解しか触媒せず、認識配列上に特異的な制限部位を有する（特異的な短いパリンドローム配列）。従って、これは遺伝子工学において広く使用される。ＩＩＩ型制限エンドヌクレアーゼはＩ型制限エンドヌクレアーゼと同様であり、修飾、認識及び酵素性消化の機能を有する。しかし、これは短い非対称配列を認識し、制限部位と認識配列との間の距離はおよそ２０～３０塩基対である。さらにＩＩＳ型制限エンドヌクレアーゼがある。これは、連続的な非対称配列を認識し、制限部位と認識配列との間の距離はおよそ１～６塩基対である。ＩＩＳ制限エンドヌクレアーゼのサイズは中程度であり、約４００～６５０アミノ酸である。ＩＩＳ型制限エンドヌクレアーゼは主に単量体形態でＤＮＡに結合するが、隣接する酵素と合わせて二量体を形成し、ＤＮＡ鎖を協同的に切断することが一般的に認められている。従って、一部のＩＩＳ型酵素は、複数の認識配列があるＤＮＡ分子の切断においてより活性があり得る。一般的なＩＩＳ型制限エンドヌクレアーゼとしては、ＡｃｕＩ、ＡｌｗＩ、ＢｂｓＩ、ＢｂｖＩ、ＢｃｃＩ、ＢｃｅＡＩ、ＢｃｉＶＩ、ＢｆｕＡＩ、ＢｍｒＩ、ＢｐｍＩ、ＢｐｕＥＩ、ＢｓａＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＡＩ、ＢｓｍＢＩ、ＢｓｍＦＩ、ＢｓｐＭＩ、ＢｓｐＱＩ、ＢｓｒＤＩ、ＢｔｇＺＩ、ＢｔｓＣＩ、ＢｔｓＩ、ＥａｒＩ、ＥｃｉＩ、ＥｃｏＰ１５Ｉ、ＦａｕＩ、ＦｏｋＩ、ＨｇａＩ、ＨｐｈＩ、ＨｐｙＡＶ、ＭｂｏＩＩ、ＭｍｅＩ、ＭｎｌＩ、ＰｌｅＩ、ＳａｐＩ、ＳｆａＮＩなどが挙げられるが限定されない。

「ＤＮＡリガーゼ」という用語は、１本のＤＮＡ鎖の末端３’－ＯＨと別のＤＮＡ鎖の末端５’－Ｐとの間にホスホジエステル結合を形成し、それにより２本の隣接するＤＮＡ鎖を連結し得る酵素を指す。リガーゼの触媒性はＡＴＰの消費を必要とする。Ｔ４ＤＮＡリガーゼは、ＤＮＡ－ＤＮＡ、ＤＮＡ－ＲＮＡ、ＲＮＡ－ＲＮＡ及び２本鎖ＤＮＡの粘着末端又は平滑末端を連結し得るリガーゼである。その分子量は約６２ｋＤであり、その活性は、０．２ｍｏｌ／ＬＫＣｌ及びスペルミンにより容易に阻害される。

「制限ライゲーション」という用語は、１つの反応で指定の順序で複数の断片を互いに連結し得る組み立て方法を指す。組み立てようとする断片上で相補的粘着末端を構築し、次いで組み立てようとする断片を制限エンドヌクレアーゼ（特にＩＩＳ型制限エンドヌクレアーゼ）及びＤＮＡリガーゼと混合し、高温（制限エンドヌクレアーゼに対する最適温度、例えば３７℃）から低温（リガーゼに対する最適温度、例えば１６℃）の間で複数回繰り返す。高温は酵素性消化に好都合であり、低温はライゲーションに好都合である。各サイクルの結果、連結されないか又は元のプラスミドに連結し戻された断片の再消化が起こり得、それによって、より高い確率で正しく組み立てられたプラスミドを保持する。両酵素は最終的に不活性化される。ＩＩＳ型制限エンドヌクレアーゼＢｓａＩ及びリガーゼを使用したＧｏｌｄｅｎＧａｔｅにより最初に考案された制限ライゲーションの組み立て方法は、ＧｏｌｄｅｎＧａｔｅクローニングと呼ばれる。具体的な操作については、例えば非特許文献３及び非特許文献４を参照。

「導入する」という用語は、ＤＮＡ鎖への外来ポリヌクレオチド配列の挿入を指す。挿入された外来ポリヌクレオチド配列は通常、正常に発現され得る。

「発現」という用語は、情報（遺伝子によりコードされる及び／又はエピジェネティックな情報など）が、細胞中に存在し、作動する構造に変換される工程を指す。従って、本明細書中で使用される場合、「発現」は、ポリヌクレオチドへの転写、ポリペプチドへの翻訳又はポリヌクレオチド及び／又はポリペプチド修飾（例えばポリペプチドの翻訳後修飾）さえも指し得る。オルタナティブスプライシングにより生成される転写産物若しくは分解された転写産物から生じるか又はポリペプチドの翻訳後プロセシング（例えばタンパク質分解による）から生じるかにかかわらず、転写されたポリヌクレオチドの断片、翻訳されたポリペプチドの断片又はポリヌクレオチド及び／又はポリペプチド修飾の断片（例えばポリペプチドの翻訳後修飾）もまた発現されるものとみなされるべきである。「発現される遺伝子」には、ポリヌクレオチド（ｍＲＮＡなど）に転写され、次いでポリペプチドに翻訳される遺伝子、並びにＲＮＡに転写されるがポリペプチドに翻訳されない遺伝子（例えばトランスファー及びリボソームＲＮＡ）が含まれる。

「ＰＣＲ増幅」という用語はポリメラーゼ連鎖反応を指し、これは、特異的なＤＮＡ断片を増幅するための分子生物学的技術である。これはインビトロでの特別なＤＮＡ複製とみなされ得る。ＰＣＲの最大の特性は、微量のＤＮＡを大幅に増加させ得ることである。具体的には、ＰＣＲ技術の基本原理は、ＤＮＡの天然の複製工程と同様であり、その特異性は、増幅しようとする配列の両端と相補的なオリゴヌクレオチドプライマーに依存する。「ＰＣＲ鋳型」という用語は、増幅しようとする特異的なＤＮＡ断片を指す。「ＰＣＲプライマー（対）」という用語は、オリゴヌクレオチド配列の対を指し、フォワードプライマー（Ｆ）は、鋳型としての２本鎖ＤＮＡにおけるセンス鎖の５’末端塩基に相補的なオリゴヌクレオチド配列であり（ＡはＴに相補的であり、ＣはＧに相補的及びその逆）、リバースプライマー（Ｒ）は、鋳型としての２本鎖ＤＮＡにおけるアンチセンス鎖の３’末端塩基に相補的なオリゴヌクレオチド配列である（ＡはＴに相補的であり、ＣはＧに相補的及びその逆）。ＰＣＲ増幅は、３つの基本的な反応段階：変性、アニーリング及び伸長から構成され、（１）鋳型ＤＮＡの変性：ある一定の時間、９０℃を上回る温度に鋳型ＤＮＡを加熱し、次いで２本鎖鋳型ＤＮＡ又はＰＣＲ増幅により形成された２本鎖ＤＮＡ
を解離させて１本鎖にして、この１本鎖がプライマーと結合して、次の反応ラウンドに対する準備をするようになり得ること；（２）鋳型ＤＮＡ及びプライマーのアニーリング（再生）：加熱により鋳型ＤＮＡを変性させて１本鎖にした後、約５０℃に温度を低下させ、ここでプライマーが対形成し、１本鎖鋳型ＤＮＡの相補的配列と結合する；（３）プライマーの伸長：鋳型に基づいて、及び相補的塩基対形成及び半保存的な複製の原理に従い、反応原料としてｄＮＴＰを使用して、約７０℃でのＤＮＡポリメラーゼの作用下でＤＮＡ鋳型－プライマー複合体から鋳型ＤＮＡ鎖に相補的な新しい半保存的な複製鎖を合成することを含む。変性－アニーリング－伸長の３つの工程のサイクルを反復することによって、より多くの「半保存的な複製鎖」を得ることができ、この新しい鎖は、次のサイクルのための鋳型になり得る。「ＤＮＡポリメラーゼ」という用語は、親ＤＮＡを鋳型として使用し、娘ＤＮＡを形成するために基質ｄＮＴＰ分子の重合を触媒する酵素のクラスを指す。ＤＮＡポリメラーゼの共通する特性は、（１）ＤＮＡポリメラーゼが５’→３’ポリメラーゼ活性を有し、これによってＤＮＡが５’→３’方向にしか合成され得ないことが決定され；（２）ＤＮＡポリメラーゼが新しいＤＮＡ鎖のデノボ合成を触媒できず、ヌクレオチド鎖の末端３’－ＯＨへのｄＮＴＰの付加しか触媒し得ず、従ってＤＮＡプライマーが合成のための開始点として必要とされることである。ハイフィデリティーＤＮＡポリメラーゼは、忠実度がより高く、それにより合成されるＤＮＡが他のＤＮＡポリメラーゼにより合成されるものよりも鋳型に対する同一性がより高くなるＤＮＡポリメラーゼを指す。ＰｈｕｓｉｏｎＤＮＡポリメラーゼ、Ｑ５ポリメラーゼ、ｐｒｉｍｅｒＳＴＡＲポリメラーゼなど、当技術分野で公知のあらゆるハイフィデリティーＤＮＡポリメラーゼが本発明において使用され得る。

本発明の遺伝子変異ライブラリを構築するために様々な分子生物学的操作が行われている場合、使用される手順及び方法（合成、酵素消化、ライゲーション、ＰＣＲ、回収、精製などを含むが限定されない）は全て、当業者にとって周知である（例えば非特許文献５を参照）。

本発明は、蓄積容量が大きい遺伝子変異ライブラリを構築するための方法を提供し、これは、先行技術における大容量の遺伝子変異ライブラリの構築のための費用が非常に高額となる問題を解決する。本発明により構築される遺伝子変異ライブラリの蓄積容量は、最大１０^５、好ましくは最大１０^６、より好ましくは最大１０^７、より好ましくは最大１０^８、より好ましくは最大１０^９、より好ましくは最大１０^１０であり得る。具体的な一実施形態では、遺伝子変異ライブラリの蓄積容量は１．２５ｘ１０^７である。

ライブラリ構築を必要とするアミノ酸配列が提供され、そこで変異させることが必要なアミノ酸の位置及びタイプが決定される。蓄積容量は計算により得られ、アミノ酸配列をコードするヌクレオチド配列が決定される。コードヌクレオチド配列における粘着末端の配列及び位置が決定され、コードヌクレオチド配列が、粘着末端に従い２つ以上の（３～１０など、好ましくは３～６個などの）オリゴマープールに対応する２つ以上の（３～１０など、好ましくは３～６個などの）断片に分けられる。粘着末端は、その配列の数に従い、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）（１つしか配列を持たない）及び連続した変異点の間で２つの断片に配列を分割し得る縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）（縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙ
ｅｎｄ）は多くの異なる配列を持ち、具体的な配列の数は粘着末端での変異に依存する）に分けられる。単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）は、２、３、４、５、６、７、８、９及び１０個の断片など、２つを超える断片にコードヌクレオチド配列を分割するために適切であり得る。粘着末端に対する配列選択は次の基準に基づく：１）粘着末端はコードヌクレオチド配列の中央にあり、従ってオリゴマープールにおける配列は、それぞれおよそ同じ長さの２つの断片として合成され得る；２）粘着末端の配列中にはパリンドローム配列がない；３）粘着末端配列のＧＣ含量は５０％～７５％である；
及び４）粘着末端の長さは選択されるＩＩＳ型制限エンドヌクレアーゼの制限部位と適合する。粘着末端の選択は、非特許文献６などの文献も参照し得る。各オリゴマープールは、適切な粘着末端／粘着末端を用いて低いミスマッチ率で組み立てられ、次いで最終的な断片を得るために第１のオリゴマープールのフォワードプライマー及び最後のオリゴマープールのリバースプライマーを使用して増幅される。

本発明の合成されたオリゴマープールに含有される制限エンドヌクレアーゼの制限部位は、ＩＩＳ型制限エンドヌクレアーゼの制限部位であり、これは通常、認識配列から１～６ｂｐ、好ましくは１～４ｂｐ離れている。ＩＩＳ型制限エンドヌクレアーゼは、ＡｃｕＩ、ＡｌｗＩ、ＢａｅＩ、ＢｂｓＩ、ＢｂｖＩ、ＢｃｃＩ、ＢｃｅＡＩ、ＢｃｇＩ、ＢｃｉＶＩ、ＢｆｕＡＩ、ＢｍｒＩ、ＢｐｍＩ、ＢｐｕＥＩ、ＢｓａＩ、ＢｓａＸＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＡＩ、ＢｓｍＢＩ、ＢｓｍＦＩ、ＢｓｐＭＩ、ＢｓｐＱＩ、ＢｓｒＤＩ、ＢｔｇＺＩ、ＢｔｓＣＩ、ＢｔｓＩ、ＥａｒＩ、ＥｃｉＩ、ＥｃｏＰ１５Ｉ、ＦａｕＩ、ＦｏｋＩ、ＨａｅＩＩＩ、ＨｇａＩ、ＨｐｈＩ、ＨｐｙＡＶ、ＭｂｏＩＩ、ＭｌｙＩ、ＭｍｅＩ、ＭｎｌＩ、ＮｍｅＡＩＩＩ、ＰｌｅＩ、ＳａｐＩ及びＳｆａＮＩから選択される。好ましくは、ＩＩＳ型制限エンドヌクレアーゼはＢｓａＩであり、その認識配列はＧＧＴＣＴＣである。

一例として２つの断片を用いて以下で本発明の方法を詳細にさらに説明する：
コードヌクレオチド配列を２つの断片に分割した後、上で決定された粘着末端が酵素消化後に保持され得るように、ＩＩＳ型制限エンドヌクレアーゼ（ＢｓａＩなど）の認識配列の逆相補配列を第１のＤＮＡ断片の３’末端で付加し、次に、その後の増幅を促進するために１５～３０ｂｐ、好ましくは１５～２５ｂｐ、より好ましくは１８～２１ｂｐの特定配列を認識配列が導入されたＤＮＡ配列の３’末端で付加し；酵素消化後に第１のＤＮＡ断片と同じ粘着末端が保持され得るようにするために、第２のＤＮＡ断片の５’末端でＩＩＳ型制限エンドヌクレアーゼ（ＢｓａＩなど）の認識配列及び上で決定された粘着末端配列を連続的に付加し、その後の増幅を促進するために、１５～３０ｂｐ、好ましくは１５～２５ｂｐ、より好ましくは１８～２１ｂｐの特定配列を認識配列及び粘着末端が導入されたＤＮＡ配列の５’末端で付加する。特定配列は、元のコードヌクレオチド配列と相同ではないランダム配列であり得る。

第１及び第２のオリゴマー配列は、当技術分野で公知の何らかの方法を使用して、例えばライブラリ作製手順を使用して、設計及び合成され得る。第１及び第２の配列の数は、合成されたプライマーの比率及び総数に従い計算され得る。合成されたオリゴマーの量が少なすぎてその後の操作のニーズに合わないので、第１及び第２のオリゴマーを増幅する必要がある。オリゴマープール－１及びオリゴマープール－２のための増幅プライマーは、当技術分野で公知の方法により設計される。オリゴマープール－１のためのフォワードプライマーを１Ｆと名付け、リバースプライマーを１Ｒと名付ける。オリゴマープール－２のためのフォワードプライマーを２Ｆと名付け、リバースプライマーを２Ｒと名付ける。プライマーの長さは、１５～３０ｂｐ、好ましくは１５～２５ｂｐ、より好ましくは１８～２１ｂｐであり得る。それぞれ、合成されたオリゴマープールは、合成されたオリゴマープール－１を鋳型として使用し、１Ｆ／１Ｒをプライマーとして使用するか、又はオリゴマープール－２を鋳型として使用し、２Ｆ／２Ｒをプライマーとして使用し、ハイフィデリティーＤＮＡポリメラーゼ（ＰｈｕｓｉｏｎＤＮＡポリメラーゼなど）、ｄＮＴＰ、ＰＣＲ緩衝液及び任意選択的なウシ血清アルブミン（ＢＳＡ）を添加することにより増幅させる。増幅されたオリゴマープール－１は、プライマー１Ｆ／１Ｒを用いて得られ、増幅されたオリゴマープール－２は、プライマー２Ｆ／２Ｒで得られる。増幅完了後、ゲル電気泳動を使用して、バンドが単一か否かを検出する。バンドが単一である場合、増幅産物をカラムにより精製するか；又は増幅されたバンドが単一でない場合、再増幅のためにＰＣＲ条件を変更する必要がある。変更する必要があるＰＣＲ条件としては、鋳型と
プライマーとの比率、アニーリング温度、アニーリング時間、サイクル数などが挙げられる。

精製増幅産物を得た後、制限ライゲーション法を使用することによって２つのオリゴマーを組み立て、制限ライゲーション法は、好ましくはＧｏｌｄｅｎＧａｔｅクローニングを使用することにより行われる。組み立て系の調製は、精製した第１のオリゴマー及び第２のオリゴマーを系に添加し、制限エンドヌクレアーゼ及びＤＮＡリガーゼ（及び／又はその緩衝液）を同時に添加することを含む。組み立て反応の手順は、２つの段階（３７℃で３分及び１６℃で５分）を２０回繰り返している。３７℃は制限エンドヌクレアーゼに対する最適反応温度であり、１６℃はＤＮＡリガーゼに対する最適反応温度である。組み立て工程において、混合物を３７℃で３分間反応させ、ここで制限エンドヌクレアーゼが制限部位を認識し、切断して、上で決定された粘着末端を生成させ、次に混合物を１６℃で５分間反応させ、ＤＮＡリガーゼが、同じ粘着末端配列を有する２個のオリゴマーを連結する。正しく連結された断片は、制限エンドヌクレアーゼの認識配列を含有せず、不正確に連結された断片は制限エンドヌクレアーゼの認識配列を含有する。次のサイクルの３７℃で、制限エンドヌクレアーゼは、断片が正確に連結されるまで、不正確に連結された断片を再び切断し得る。最後に混合物を８０℃で１５分間反応させて、その後の反応に影響を与えないように２つの酵素を不活性化した。組み立て系におけるＤＮＡの量は非常に少なく、精製後にＤＮＡを殆ど得ることができず、この系は、組み立てられていない断片を含有し得る。従って、組み立てられた配列のＰＣＲ増幅が必要である。

ＰＣＲを行うために鋳型として組み立てられた未精製産物、第１のオリゴマーのフォワードプライマー１Ｆ及び第２のオリゴマーのリバースプライマー２Ｒ及びハイフィデリティーＤＮＡポリメラーゼ（ＰｈｕｓｉｏｎＤＮＡポリメラーゼなど）を使用することによって、組み立てられた配列のプールを増幅させて、蓄積容量が大きい遺伝子変異ライブラリを得る。次に、最終産物を得るために、ＰＣＲ産物を回収及び／又は精製し得る。回収及び／又は精製は好ましくはゲル電気泳動による。平滑末端を介して最終産物を連結し、直線状にしたプラスミド（Ｐｕｃ５７－ＥＶなど）に連結し、ユニバーサルプライマー（Ｍ１３Ｆプライマーなど）を使用して最終産物に対してサンガーシーケンシングを行って、配列が正しいか否かを調べ；同時に、最終産物をハイスループットシーケンシング技術（ＮＧＳ）に供して、配列分布、アミノ酸分布などを検出する。

配列の説明

実施例によって、及び添付の図面と合わせて、本発明の技術的解決法をより詳細にさらに例示するが、本発明は次の実施例に限定されない。

具体的な実施例
実施例１．変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有するオリゴマープールの設計
１．１ライブラリ構築を必要としたアミノ酸配列の提供及びその中で変異させる必要があるアミノ酸の位置及びタイプの決定
ライブラリ構築を必要としたアミノ酸配列は次のとおり：

であり、配列中、Ｘ１～Ｘ７は、変異させる必要があったアミノ酸であり、Ｘ１は２０個のアミノ酸のうち４個に変異させられ、Ｘ２～Ｘ６は２０個のアミノ酸のうち１６個に変異させられ、Ｘ７は２０個のアミノ酸のうち３個に変異させられ、従って、ライブラリの蓄積容量は、４ｘ１６ｘ１６ｘ１６ｘ１６ｘ１６ｘ３＝１２５８２９１２であった。このアミノ酸配列をコードするヌクレオチド配列は次のとおり：

であり、Ｘ１～Ｘ７のそれぞれは、変異対象の１つのコドン（３ヌクレオチド）を表した。

１．２断片への配列の分割
一例として単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を挙げることによって配列を断片に分割するための方法を詳細に説明した。

単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）に従い、コードヌクレオチド配列を２つの断片に分割した。次の基準に基づき、変異ヌクレオチドの位置に従い、粘着末端の配列を選択した：１）粘着末端はオリゴマー配列の中央にあり、個別の合成のためにオリゴマープール中の配列をおよそ同じ長さの２つの断片に分割し得る；２）粘着末端の配列中にパリンドローム配列がなかった；３）粘着末端配列のＧＣ含量が５０％～７５％であった；及び４）粘着末端の長さは選択されたＩＩＳ型制限エンドヌクレアーゼの制限部位と適合した。

１．１のコードヌクレオチド配列に対して、及び上の基準に基づき、１）ＣＣＴＧは、１２０ヌクレオチドの位置４８～５１に位置し；２）ＣＣＴＧ中にパリンドローム構造がなく；３）ＣＣＴＧのＧＣ含量は７５％であり；４）ＣＣＴＧは、４個のヌクレオチドを有し、ＩＩＳ型制限エンドヌクレアーゼＢｓａＩの制限部位に対応し、従って、配列を２つの断片に分けるために粘着末端としてＣＣＴＧ（上の配列中で太字で示される）を選択した。

１．３断片化を介した各オリゴマープールの設計
第１のオリゴマーは５１ｂｐ長であり、その具体的な配列は次のとおり：

であった。ＢｓａＩの認識配列ＧＧＴＣＴＣの逆相補配列ＧＡＧＡＣＣ（配列番号４）を第１のＤＮＡ配列の３’末端で付加した。ＢｓａＩの特異的な制限部位に従い、ＢｓａＩでの消化後、選択された粘着末端ＣＣＴＧを生成させるためにＢｓａＩの認識配列の逆相補配列ＧＡＧＡＣＣの５’末端で塩基Ａをさらに付加した。制限部位が導入された配列は、

であった。その後の増幅のために、上記配列の３’末端で１８～２１ｂｐの特定配列をさらに付加した。その特定配列は、例えば

であった。第１のオリゴマーの最終的な配列は、

であり、これをオリゴマープール－１と名付けた。

第２のオリゴマーの長さは６９ｂｐであり、その具体的な配列は次のとおり：

であった。第２のＤＮＡ配列の５’末端で粘着末端配列ＣＣＴＧ及び制限エンドヌクレアーゼＢｓａＩの認識配列ＧＧＴＣＴＣ（配列番号９）を連続的に付加した。ＢｓａＩの特異的な制限部位に従い、ＢｓａＩでの消化後、選択された粘着末端ＣＣＴＧを生成させるためにＢｓａＩの認識配列ＧＧＴＣＴＣの３’末端で塩基Ｇをさらに付加した。得られた配列は、

であった。その後の増幅のために、１８～２１ｂｐの特定配列を上記配列の５’末端でさらに付加した。この特定配列は、例えば

であった。第２のオリゴマーの最終的な配列は、

であり、これをオリゴマープール－２と名付けた。

実施例２．ライブラリ作製手順によるオリゴマープールの設計
単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を一例として挙げた。オリゴマープールは通常はライブラリ作製手順により設計した。

ライブラリ作製手順のウェブサイトは、ｈｔｔｐ：／／１０．１．１．２５／ｃｇｉ－ｂｉｎ／ａａ＿ｌｉｂ＿ｇｅｎｅｒａｔｅ．ｐｙであり、オリゴマープールを設計するためのライブラリ作製手順のインターフェースを図１で示す。

この手順は１回の操作あたり１つのオリゴマープールを設計し得、オリゴマープール－１及びオリゴマープール－２は個別に設計する必要があった。オリゴマープール－１のための代表的な設計工程は次のとおりであった：
アミノ酸配列（Ａｍｉｎｏａｃｉｄｓｅｑｕｅｎｃｅ）入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ＜１＞、＜２＞、＜３＞などの番号により表され、１つの番号は１つのアミノ酸を表し、オリゴマープール－１に対して、入力されたアミノ酸配列はＲＰＤＶＮＡＳ＜１＞＜２＞＜３＞Ｇ＜４＞ＴＰＬＨＬＲＤＨＬＲＰＮＲＬであり；
ＤＮＡ配列（ＤＮＡｓｅｑｕｅｎｃｅ）入力ボックスにおいてアミノ酸配列をコードするＤＮＡ配列を入力し、配列中、変異部位はそれぞれ番号＜１＞、＜２＞、＜３＞などにより表され、１つの番号は１つのコドンを表し、オリゴマープール－１に対して、入力されたＤＮＡ配列は、
ＡＧＡＣＣＴＧＡＣＧＴＴＡＡＣＧＣＴＡＧＣ＜１＞＜２＞＜３＞ＧＧＴ＜４＞ＡＣＴＣＣＧＣＴＧＣＡＣＣＴＧＡＧＡＧＡＣＣＡＣＣＴＡＣＧＴＣＣＡＡＡＴＣＧＧＣＴＧであり；
ライブラリのサイズ（Ｓｉｚｅｏｆｔｈｅｌｉｂｒａｒｙ）入力ボックスにおいてライブラリ中の配列の数を入力し、ここで、オリゴマープール－１について、＜１＞は、２０個のアミノ酸のうち４個に変異させられ、＜２＞～＜４＞は、２０個のアミノ酸のうち１６個に変異させられ、オリゴマープール－１中の合成対象のオリゴマーの数は、４ｘ１６ｘ１６ｘ１６＝１６３８４となり、従って１６３８４を入力し；
発現系（Ｅｘｐｒｅｓｓｉｎｇｓｙｓｔｅｍ）入力ボックスにおいて所望の発現系を選択し、例えば、アミノ酸配列がＥ．コリ（Ｅ．ｃｏｌｉ）で発現された場合は「Ｅ．コリ（Ｅ．ｃｏｌｉ）」を選択し、アミノ酸配列がヒト細胞で発現された場合は「ヒト」を選択するなどし、ここでオリゴマープール－１に対して、ヒトコドンを使用し、「ヒト」を選択し；
任意選択的に「エクセルファイルにおいて予想発生率をアップロード（Ｕｐｌｏａｄｔｈｅｅｘｐｅｃｔｅｄｏｃｃｕｒｒｅｎｃｅｒａｔｅｓｉｎｅｘｃｅｌｆｉｌｅ）」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで
オリゴマープール－１における各変異アミノ酸の出現頻度をファイルにおいて設定し得る。

同様に、オリゴマープール－２に対する代表的な設計工程は次のとおりであった：
アミノ酸配列（Ａｍｉｎｏａｃｉｄｓｅｑｕｅｎｃｅ）入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ＜１＞、＜２＞、＜３＞などの番号によって表され、１つの番号は１つのアミノ酸を表し、オリゴマープール－２に対して、入力されたアミノ酸配列は、ＬＬＳＫＭＣＲＳＲＬＡＡ＜１＞＜２＞ＧＨＬＥＩＶＥＶＬＬＫ＜３＞ＧＡＤＶＲＰＤであり；
ＤＮＡ配列（ＤＮＡｓｅｑｕｅｎｃｅ）入力ボックスにおいてアミノ酸配列をコードするＤＮＡ配列を入力し、配列中、変異部位はそれぞれ番号＜１＞、＜２＞、＜３＞などにより表され、１つの番号は１つのコドンを表し、オリゴマープール－２に対して、入力されたＤＮＡ配列は、ＣＴＣＣＴＡＡＧＴＡＡＡＡＴＧＴＧＣＡＧＧＴＣＴＣＧＣＣＴＧＧＣＴＧＣＴ＜１＞＜２＞ＧＧＴＣＡＣＣＴＧＧＡＡＡＴＣＧＴＴＧＡＡＧＴＴＣＴＧＣＴＧＡＡＧ＜３＞ＧＧＴＧＣＴＧＡＣＧＴＧＡＧＡＣＣＴＧＡＣである。
ライブラリのサイズ（Ｓｉｚｅｏｆｔｈｅｌｉｂｒａｒｙ）入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール－２に対して、＜１＞～＜２＞は２０個のアミノ酸のうち１６個に変異させられ、＜３＞は２０個のアミノ酸のうち３個に変異させられ、オリゴマープール－２中の合成対象のオリゴマーの数は、１６ｘ１６ｘ３＝７６８となり、従って７６８を入力し；
発現系（Ｅｘｐｒｅｓｓｉｎｇｓｙｓｔｅｍ）入力ボックスにおいて所望の発現系を選択し、ここでオリゴマープール－２に対して、ヒトコドンを使用し、「ヒト」を選択し；
任意選択的に「エクセルファイルにおいて予想発生率をアップロード（Ｕｐｌｏａｄｔｈｅｅｘｐｅｃｔｅｄｏｃｃｕｒｒｅｎｃｅｒａｔｅｓｉｎｅｘｃｅｌｆｉｌｅ）」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで、オリゴマープール－２における各変異アミノ酸の出現頻度（予想値）はファイルにおいて設定され得る。

実施例３．オリゴマープールの合成
当技術分野で公知の様々な合成方法によって、実施例１又は実施例２で設計したオリゴマープール１及びオリゴマープール－２を合成した。方法としては、ホスホトリエステル法、ホスホラミダイト法、水素リン酸法（ｈｙｄｒｏｇｅｎｐｈｏｓｐｈｏｒｉｃａｃｉｄｍｅｔｈｏｄ）、チップによる合成などが挙げられるが限定されない。

本発明において、半導体チップ（ＣｕｓｔｏｍＡｒｒａｙからのＢ３Ｐ合成装置）を使用して、オリゴマープール１及びオリゴマープール２を合成した。オリゴマープールの合成に必要とされたのは、２つの断片に分割される場合は９２ｋの容量（９２，０００配列）のチップの合成のみであった。２つの断片に分割しない場合、蓄積容量が１．２６ｘ１０^７である長い配列に対するオリゴマープールを合成するために複数のチップが必要であった。チップは高価であった。従って、断片化を介したオリゴマープールの構築によって構築費用が大きく削減された。

実施例４．ハイフィデリティーＤＮＡポリメラーゼを用いた、合成されたオリゴマープールの増幅
上で得られたオリゴマープール－１及びオリゴマープール－２のヌクレオチド配列に従い、当技術分野で公知の方法によってオリゴマープール－１及びオリゴマープール－２用の増幅プライマーを設計した。オリゴマープール－１用のフォワードプライマーを１Ｆと名付け、リバースプライマーを１Ｒと名付けた。オリゴマープール－２用のフォワードプライマーを２Ｆと名付け、リバースプライマーを２Ｒと名付けた。各プライマーの配列は次のとおりであった：
１Ｆ：ＡＧＡＣＣＴＧＡＣＧＴＴＡＡＣＧＣＴＡＧ（配列番号１３）
１Ｒ：ＣＡＧＣＣＧＡＴＴＴＧＧＡＣＧＴＡＧＧＴ（配列番号１４）
２Ｆ：ＡＣＴＣＣＴＡＡＧＴＡＡＡＡＴＧＴＧＣＡ（配列番号１５）
２Ｒ：ＧＴＣＡＧＧＴＣＴＣＡＣＧＴＣＡＧＣＡＣ（配列番号１６）

ＰＣＲ反応系を次のように形成した：合成されたオリゴマープールを鋳型として使用し、１Ｆ／１Ｒ又は２Ｆ／２Ｒをプライマーとして使用し、ハイフィデリティーＤＮＡポリメラーゼ（ＰｈｕｓｉｏｎＤＮＡポリメラーゼなど）、ｄＮＴＰｓ、５ｘＨＦ緩衝液及びウシ血清アルブミン（ＢＳＡ）を添加し、水を使用してその系が５０μｌになるようにし；合成されたオリゴマープールを増幅させ、プライマー１Ｆ／１Ｒにより、増幅されたオリゴマープール－１を得て、プライマー２Ｆ／２Ｒにより、増幅されたオリゴマープール－２を得た。

反応系は次のとおりであった：

反応手順は次のとおりであった：

実施例５．ＧｏｌｄｅｎＧａｔｅを使用した２つのオリゴマープールの組み立て
ＧｏｌｄｅｎＧａｔｅ組み立て系の調製は：オリゴマープール－１及びオリゴマープール－２を添加し、ＩＩＳ型制限エンドヌクレアーゼＢｓａＩ及びＴ４ＤＮＡリガーゼ及び１０ｘＴ４ＤＮＡリガーゼ緩衝液を反応系に同時に添加し、反応系を水で２０μｌにして、２つのオリゴマープールを組み立てることを含む。組み立てられた産物をＡｇｉｌｅｎｔ２１００によって検出し、検出結果を図３で示した。

反応系は次のとおりであった：

制限エンドヌクレアーゼＢｓａＩに対しては３７℃が最適反応温度であり、Ｔ４ＤＮＡリガーゼに対しては１６℃が最適反応温度であった。反応手順において、混合物を３７℃で３分間反応させ、ここで制限エンドヌクレアーゼＢｓａＩは、オリゴマープール－１及びオリゴマープール－２中の配列におけるＢｓａＩ制限部位を認識して切断し、各配列において４ｂｐ粘着末端を残し、次いで混合物を１６℃で５分間反応させ、ここでＴ４ＤＮＡリガーゼは、粘着末端で２つのオリゴマープールを連結した。正しく連結された断片（即ち、オリゴマープール－２とのオリゴマープール－１のライゲーションにより形成された断片）は、ＢｓａＩ認識配列を含有せず、不正確に連結された断片（即ち、オリゴマープール－１とオリゴマープール－１又はオリゴマープール－２とオリゴマープール－２のライゲーションにより形成された断片）はＢｓａＩ認識配列を含有した。混合物を３７℃で再び反応させた場合、制限エンドヌクレアーゼＢｓａＩは、断片が正確に連結されるまで、不正確に連結された断片を再び切断し得る。２０サイクル後、その後の反応に影響を及ぼさないように、混合物を８０℃で１５分間反応させて、ＢｓａＩ及びＴ４ＤＮＡリガーゼを不活性化させた。最終的に、組み立てられたオリゴマープールを得た。

反応手順は次のとおりであった：

実施例６．組み立てられたオリゴマープールの増幅
組み立てられたオリゴマープールの配列を配列番号１７で示した。しかし、組み立て後の系中のＤＮＡの量は非常に少なく、精製後、ＤＮＡは殆ど得ることができず、この系は、組み立てられなかった断片を含有し得る。従って、組み立てられた配列のＰＣＲ増幅が求められた。ＰＣＲ反応系を次のように形成した：組み立てられたオリゴマープールを鋳型として使用し、１Ｆ／２Ｒをフォワード及びリバースプライマーとして使用し、ハイフィデリティーＤＮＡポリメラーゼ（ＰｈｕｓｉｏｎＤＮＡポリメラーゼなど）、ｄＮＴＰｓ及び５ｘＨＦ緩衝液を添加し、水を使用して系が５０μｌになるようにして、組み立てられたオリゴマープールを増幅させた。

反応系は次のとおりであった：

反応手順は次のとおりであった：

最後に、遺伝子変異ライブラリ産物を得た。

実施例７．遺伝子変異ライブラリ産物の精製及びシーケンシング
実施例６で得られた産物を回収し、最終ライブラリ産物を得るためにアガロースゲル電気泳動によって精製した。最終ライブラリ産物の電気泳動図を図４で示す。

単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られた最終ライブラリ産物の平滑末端を直線化したプラスミドＰｕｃ５７－ＥＶに連結し、配列が正確か否かを調べるために、ユニバーサルプライマーＭ１３Ｆを用いて最終産物に対してサンガーシーケンシングを行い；配列分布、アミノ酸分布などを検出するために、ハイスループットシーケンシング（ＮＧＳ）を行った。シーケンシング結果を図５～図７及び以下の表１で示す。

図５は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のサンガーシーケンシング結果であり、これは、所望の遺伝子変異ライブラリが得られていることを証明する。

図６は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングの配列分布図であり、表１は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングの配列分布表である。

図７は、単一粘着末端（ｓｉｎｇｌｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングのアミノ酸分布である。上のデータから、ライブラリ配列におけるアミノ酸変異の位置の分布、タイプ及び頻度が、予想される設計と完全に一致することが分かり得る。

実施例８．組み立てのために縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を使用することにより遺伝子変異ライブラリを得ること
８．１ライブラリ構築を必要としたアミノ酸配列を提供し、そこで変異させる必要であったアミノ酸の位置及びタイプを決定すること
ライブラリ構築を必要としたアミノ酸配列は次のとおり：ＫＴＥＤＴＡＶＹＹＣＳＲＤ１０２１０３１０４１０５１０６１０７ＤＡＷＧＱＧＴＬＶＴＶＳＳ（配列番号１８）であり、配列中、ＡＡ１０２～ＡＡ１０７は、変異させることが必要であったアミノ酸であり、ＡＡ１０２～ＡＡ１０６は２０個のアミノ酸のうち１８個に変異させられ、ＡＡ１０７は２０個のアミノ酸のうち４個に変異させられ、従って、ライブラリの蓄積容量は１
８ｘ１８ｘ１８ｘ１８ｘ１８ｘ４＝７５５８２７２となった。アミノ酸配列をコードするヌクレオチド配列は次のとおり：ＡＡＡＡＣＣＧＡＧＧＡＣＡＣＧＧＣＣＧＴＧＴＡＴＴＡＣＴＧＴＡＧＴＡＧＡＧＡＴ１０２１０３１０４１０５１０６１０７ＧＡＣＧＣＣＴＧＧＧＧＣＣＡＡＧＧＡＡＣＣＣＴＧＧＴＣＡＣＣＧＴＣＴＣＣＴＣＧ（配列番号１９）であり、配列中、ＡＡ１０２～ＡＡ１０７のそれぞれは、変異対象の１コドン（３個のヌクレオチド）を表した。

８．２断片化を介した各オリゴマープールの設計
コードヌクレオチド配列を２つの断片に分割し、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅ
ｓｔｉｃｋｙｅｎｄ）をＡＡ１０４の最後の塩基及びＡＡ１０５の３個の塩基として選択した。

第１のオリゴマーは５１ｂｐ長であり、その具体的な配列は次のとおり：５’－ＡＡＡＡＣＣＧＡＧＧＡＣＡＣＧＧＣＣＧＴＧＴＡＴＴＡＣＴＧＴＡＧＴＡＧＡＧＡＴ１０２１０３１０４１０５－３’（配列番号２０）であった。ＢｓａＩの認識配列ＧＧＴＣＴＣの逆相補配列ＧＡＧＡＣＣ（配列番号４）を第１のＤＮＡ配列の３’末端で付加した。正確に切断し、不必要な配列の導入を回避するために、ＢｓａＩの認識配列の逆相補配列ＧＡＧＡＣＣの５’末端で塩基Ａをさらに付加した。制限部位が導入された配列は、ＡＡＡＡＣＣＧＡＧＧＡＣＡＣＧＧＣＣＧＴＧＴＡＴＴＡＣＴＧＴＡＧＴＡＧＡＧＡＴ１０２１０３１０４１０５ＡＧＡＧＡＣＣ（配列番号２１）であった。その後の増幅のために、１８～２１ｂｐの特定配列を上記配列の３’末端でさらに付加した。その特定配列は、例えば

であった。第１のオリゴマーの最終配列は、

であり、オリゴマープール－１と名付けた。

ライブラリ作製による配列設計は、アミノ酸配列及びＤＮＡ配列の入力を必要とし、第２のオリゴマーを設計する場合、ＡＡ１０４の最初の２塩基を付加することが必要とされ、従って第２のオリゴマーは５１ｂｐ長であり、その具体的な配列は次のとおり：５’－１０４１０５１０６１０７ＧＡＣＧＣＣＴＧＧＧＧＣＣＡＡＧＧＡＡＣＣＣＴＧＧＴＣＡＣＣＧＴＣＴＣＣＴＣＧ－３’（配列番号２３）であった。配列の設計後、ＡＡ１０４の最初の２塩基を除去した。ライブラリ作製を使用することによって全配列を設計すべきであり、次に、第２のオリゴヌクレオチドの特殊性ゆえにＢｓａＩ制限部位／特定配列などのＤＮＡ配列を添加すべきである（ＡＡ１０４の最初の２塩基を除去する必要がある）。

８．３．ライブラリ作製手順によるオリゴマープールの設計
ライブラリ作製手順のウェブサイトはｈｔｔｐ：／／１０．１．１．２５／ｃｇｉ－ｂｉｎ／ａａ＿ｌｉｂ＿ｇｅｎｅｒａｔｅ．ｐｙであり、オリゴマープールを設計するためのライブラリ作製手順のインターフェースを図１で示す。

この手順は、１回の操作あたり１つのオリゴマープールを設計し得、オリゴマープール－１及びオリゴマープール－２は個別に設計する必要がある。オリゴマープール－１に対する代表的な設計工程は次のとおりであった：
アミノ酸配列（Ａｍｉｎｏａｃｉｄｓｅｑｕｅｎｃｅ）入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ＜１＞、＜２＞、＜３＞などの番号で表され、１つの番号は１つのアミノ酸を表し、オリゴマープール－１に対して、入力されたアミノ酸配列はＫＴＥＤＴＡＶＹＹＣＳＲＤ＜１＞＜２＞＜３＞＜４＞ＲＤＨＬＲＰＮＲＬであり；
ＤＮＡ配列（ＤＮＡｓｅｑｕｅｎｃｅ）入力ボックスにおいてアミノ酸配列をコードするＤＮＡ配列を入力し、配列中、変異部位はそれぞれ番号＜１＞、＜２＞、＜３＞などにより表され、１つの番号は１つのコドンを表し、オリゴマープール－１に対して、入力されたＤＮＡ配列は、ＡＡＡＡＣＣＧＡＧＧＡＣＡＣＧＧＣＣＧＴＧＴＡＴＴＡＣＴＧＴＡＧＴＡＧＡＧＡＴ＜１＞＜２＞＜３＞＜４＞ＡＧＡＧＡＣＣＡＣＣＴＡＣＧＴＣＣＡＡＡＴＣＧＧＣＴＧ
であり；
ライブラリのサイズ（Ｓｉｚｅｏｆｔｈｅｌｉｂｒａｒｙ）入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール－１に対して、＜１＞～＜４＞は２０個のアミノ酸のうち１８個に変異させられ、オリゴマープール－１中の合成対象のオリゴマーの数は、１８ｘ１８ｘ１８ｘ１８＝１０４９７６となり、従って１０４９７６を入力し；
発現系（Ｅｘｐｒｅｓｓｉｎｇｓｙｓｔｅｍ）入力ボックスにおいて所望の発現系を選択し、例えば、アミノ酸配列がＥ．コリ（Ｅ．ｃｏｌｉ）で発現された場合は「Ｅ．コリ（Ｅ．ｃｏｌｉ）」を選択し、アミノ酸配列がヒト細胞で発現された場合は「ヒト」を選択するなどし、ここでオリゴマープール－１に対して、ヒトコドンを使用し、「ヒト」を選択し；
任意選択的に「エクセルファイルにおいて予想発生率をアップロード（Ｕｐｌｏａｄｔｈｅｅｘｐｅｃｔｅｄｏｃｃｕｒｒｅｎｃｅｒａｔｅｓｉｎｅｘｃｅｌｆｉｌｅ）」オプションにおいて予め保存したエクセルファイルをアップロードし、ここでオリゴマープール－１における各変異アミノ酸の出現頻度はファイルにおいて設定され得る。

ＢｓａＩでの消化後の配列１の粘着末端は、ＡＡ１０４の最後の塩基及びＡＡ１０５の３個の塩基に位置し、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）であり、具体的には、
ＣＡＡＣ／ＣＡＡＧ／ＣＡＣＣ／ＣＡＧＣ／ＣＡＴＣ／ＣＣＡＣ／ＣＣＡＧ／ＣＣＣＣ／ＣＣＧＧ／ＣＣＴＧ／ＣＧＡＣ／ＣＧＡＧ／ＣＧＣＣ／ＣＧＧＣ／ＣＧＴＧ／ＣＴＡＣ／ＣＴＧＧ／ＣＴＴＣ／ＧＡＡＣ／ＧＡＡＧ／ＧＡＣＣ／ＧＡＧＣ／ＧＡＴＣ／ＧＣＡＣ／ＧＣＡＧ／ＧＣＣＣ／ＧＣＧＧ／ＧＣＴＧ／ＧＧＡＣ／ＧＧＡＧ／ＧＧＣＣ／ＧＧＧＣ／ＧＧＴＧ／ＧＴＡＣ／ＧＴＧＧ／ＧＴＴＣで、全部で３６種類であった。

同様に、オリゴマープール－２に対する代表的な設計工程は次のとおりであった：
アミノ酸配列（Ａｍｉｎｏａｃｉｄｓｅｑｕｅｎｃｅ）入力ボックスにおいてライブラリ構築を必要としたアミノ酸配列を入力し、配列中、変異部位はそれぞれ＜１＞、＜２＞、＜３＞などの番号により表され、１つの番号は１つのアミノ酸を表し、オリゴマープール－２に対して、入力されたアミノ酸配列は＜１＞＜２＞＜３＞＜４＞ＤＡＷＧＱＧＴＬＶＴＶＳＳであり；
ＤＮＡ配列（ＤＮＡｓｅｑｕｅｎｃｅ）入力ボックスにおいてアミノ酸配列をコードするＤＮＡ配列を入力し、配列中、変異部位はそれぞれ番号＜１＞、＜２＞、＜３＞などにより表され、１つの番号は１つのコドンを表し、オリゴマープール－２に対して、入力
されたＤＮＡ配列は、＜１＞＜２＞＜３＞＜４＞ＧＡＣＧＣＣＴＧＧＧＧＣＣＡＡＧＧＡＡＣＣＣＴＧＧＴＣＡＣＣＧＴＣＴＣＣＴＣＧであり；
ライブラリのサイズ（Ｓｉｚｅｏｆｔｈｅｌｉｂｒａｒｙ）入力ボックスにおいてライブラリ中の配列の数を入力し、ここでオリゴマープール－２に対して、＜１＞～＜３＞は２０個のアミノ酸のうち１８個に変異させられ、＜４＞は２０個のアミノ酸のうち４個に変異させられ、オリゴマープール－２中の合成対象のオリゴマーの数は、１８ｘ１８ｘ１８ｘ４＝２３３２８となり、従って２３３２８を入力し；
発現系（Ｅｘｐｒｅｓｓｉｎｇｓｙｓｔｅｍ）入力ボックスにおいて所望の発現系を選択し、ここでオリゴマープール－２に対して、ヒトコドンを使用し、「ヒト」を選択し；
任意選択的に「エクセルファイルにおいて予想発生率をアップロード（Ｕｐｌｏａｄｔｈｅｅｘｐｅｃｔｅｄｏｃｃｕｒｒｅｎｃｅｒａｔｅｓｉｎｅｘｃｅｌｆｉｌｅ）」オプションにおいて予め保存したエクセルファイルをアップロードし、ここで、オリゴマープール－２における各変異したアミノ酸の出現頻度（予想値）はファイルにおいて設定され得る。

配列のソフトウェア出力後、エクセルを使用して、得られたデータを処理した。エクセルにおけるカラム機能を使用して、ＡＡ１０４の最初の２個の塩基及びその後の配列を分離した。最初の２個の塩基が欠失したＡＡ１０４を１０４’として記録した。次に、第２のＤＮＡ配列の５’末端で、粘着末端配列ＣＣＴＧ及び制限エンドヌクレアーゼＢｓａＩの認識配列ＧＧＴＣＴＣ（配列番号９）を連続的に導入した。正確に切断し、不必要な配列の導入を回避するために、ＢｓａＩの認識配列ＧＧＴＣＴＣの３’末端で塩基Ｇをさらに付加した。得られた配列は、

であった。その後の増幅のために、上記配列の５’末端で１８～２１ｂｐの特定配列をさらに付加した。この特定配列は、例えば

であった。第２のオリゴマーの最終配列は、

であり、オリゴマープール－２と名付けた。ＢｓａＩでの消化後、オリゴマープール－２により生成された粘着末端は、オリゴマープール－１により生成したものと同じであり、具体的には
ＣＡＡＣ／ＣＡＡＧ／ＣＡＣＣ／ＣＡＧＣ／ＣＡＴＣ／ＣＣＡＣ／ＣＣＡＧ／ＣＣＣＣ／ＣＣＧＧ／ＣＣＴＧ／ＣＧＡＣ／ＣＧＡＧ／ＣＧＣＣ／ＣＧＧＣ／ＣＧＴＧ／ＣＴＡＣ／ＣＴＧＧ／ＣＴＴＣ／ＧＡＡＣ／ＧＡＡＧ／ＧＡＣＣ／ＧＡＧＣ／ＧＡＴＣ／ＧＣＡＣ／ＧＣＡＧ／ＧＣＣＣ／ＧＣＧＧ／ＧＣＴＧ／ＧＧＡＣ／ＧＧＡＧ／ＧＧＣＣ／ＧＧＧＣ／
ＧＧＴＧ／ＧＴＡＣ／ＧＴＧＧ／ＧＴＴＣ
であり、全部で３６種類であった。同じ粘着末端を介してオリゴマープール－１及びオリゴマープール－２を連結した。

８．４縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を用いた遺伝子ライブラリの構築
本発明の実施例３の方法に従い、オリゴマープールを合成した。上で得られたオリゴマープール－１及びオリゴマープール－２のヌクレオチド配列に従い、当技術分野で公知の方法によって、オリゴマープール－１及びオリゴマープール－２用の増幅プライマーを設計した。オリゴマープール－１のフォワード及びリバースプライマーをそれぞれ１ｓＦ及び１ｓＲと名付けた。オリゴマープール－２のフォワード及びリバースプライマーをそれぞれ２ｓＦ及び２ｓＲと名付けた。各プライマーの配列は次のとおりであった：
１ｓＦ：ＡＡＡＡＣＣＧＡＧＧＡＣＡＣＧＧＣＣＧＴ（配列番号２６）
１ｓＲ：ＣＡＧＣＣＧＡＴＴＴＧＧＡＣＧＴＡＧＧＴ（配列番号１４）
２ｓＦ：ＡＣＴＣＣＴＡＡＧＴＡＡＡＡＴＧＴＧＣＡ（配列番号１５）
２ｓＲ：ＣＧＡＧＧＡＧＡＣＧＧＴＧＡＣＣＡＧＧＧ（配列番号２７）

合成されたオリゴマープールを鋳型として使用し、１ｓＦ／１ｓＲ又は２ｓＦ／２ｓＲをプライマーとして使用し、ハイフィデリティーＤＮＡポリメラーゼ（ＰｈｕｓｉｏｎＤＮＡポリメラーゼなど）を添加することによって、本発明の実施例４の方法に従い、合成されたオリゴマープールを増幅させた。増幅されたオリゴマープール－１は、プライマー１ｓＦ／１ｓＲを用いて得られ、増幅されたオリゴマープール－２は、プライマー２ｓＦ／２ｓＲを用いて得られた。

本発明の実施例５の方法に従い、ＧｏｌｄｅｎＧａｔｅｓ法を使用して、２つのオリゴマープールを組み立てた。本発明の実施例６の方法に従い、組み立てられたオリゴマー
プールを増幅し、最終的なライブラリ産物の電気泳動図を図８で示す。遺伝子ライブラリ産物を精製し、本発明の実施例７の方法に従い、シーケンシングした。シーケンシング結果を図９～図１１及び下の表２で示す。

図９は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のサンガーシーケンシングの結果であり、これは、所望の遺伝子変異ライブラリが得られていることを証明する。

図１０は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングの配列分布図であり、表２は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を組み立てることにより得られたライブラリ配列のＮＧＳシーケンシングの配列分布表である。

図１１は、縮重粘着末端（ｄｅｇｅｎｅｒａｔｅｓｔｉｃｋｙｅｎｄ）を組み立て
ることにより得られたライブラリ配列のＮＧＳシーケンシングのアミノ酸分布である。上のデータから、ライブラリ配列におけるアミノ酸変異の位置の分布、タイプ及び頻度が予想される設計と完全に一致することが分かり得る。

本記載において技術的解決策の構成パートとして記載される何らかの技術特性又は技術特性の組み合わせは、それが実行され得、本発明の主旨を明らかに破らないことを前提として、他の技術的解決策にも適用され得；さらに、異なる技術的解決策の構成部分として記載される技術特性も、それが実行され得、本発明の主旨を明らかに破らないことを前提として、他の技術的解決策を形成するために、形はどうあれ、組み合わせられ得ることにも注意すべきである。本発明は、上記のケースを組み合わせることにより得られる技術的解決策も含み、これらの技術的解決策は、本発明に記載されるものと同等である。

具体的な実施形態及び実施例により本発明を上記で説明したが、当業者は、これらが本発明の範囲を限定するものではないことを理解すべきである。本発明の範囲は、特許請求の範囲により決定されるべきである。

本発明は、蓄積容量が大きいライブラリとなるように、比較的少数のオリゴマー配列を合成し、次いでそれらを組み立てることが可能な蓄積容量が大きいライブラリ構築方法を提供し、これにより、大容量ライブラリ構築のための費用が大きく削減され、蓄積容量が大きいライブラリの合成が高価であるという問題が解決される。

Claims

蓄積容量が大きい遺伝子変異ライブラリを構築するための方法であって、
（１）ライブラリ構築を必要とするアミノ酸配列をコードするヌクレオチド配列に従い、消化後に、設計される２つの隣接するオリゴマープールが同じ粘着末端を生成させる、変異ヌクレオチド及び制限エンドヌクレアーゼの制限部位を有する２つ以上のオリゴマープールを設計し、合成し；
（２）前記各オリゴマープールを増幅させ；
（３）組み立てられた各オリゴマープールを得るために反応系において前記増幅させた各オリゴマープールを組み立て；
（４）前記蓄積容量が大きい遺伝子変異ライブラリを得るために前記組み立てられた各オリゴマープールを増幅させること、
を含む方法。
段階（２）が、増幅させた各オリゴマープールを得るために、前記各オリゴマープールを鋳型として用い、前記各オリゴマープールの配列に従い設計したフォワードプライマー及びリバースプライマーをプライマー対として用いることによって、ハイフィデリティーＤＮＡポリメラーゼを使用して、前記各オリゴマープールにおいてＰＣＲ増幅を行うことを含む、請求項１に記載の方法。
段階（３）が、組み立てられた各オリゴマープールを得るために、前記増幅させた各オリゴマープールを添加し、前記制限エンドヌクレアーゼ及びＤＮＡリガーゼを同時に添加し、制限ライゲーション法を使用することによって、前記増幅させた各オリゴマープールを組み立てることを含む、請求項１又は２に記載の方法。
段階（４）が、前記蓄積容量が大きい遺伝子変異ライブラリを得るために、前記組み立てられた各オリゴマープールを鋳型として用い、第１のオリゴマープールのフォワードプライマー及び最後のオリゴマープールのリバースプライマーをプライマー対として用いることによって、ハイフィデリティーＤＮＡポリメラーゼを使用して、前記組み立てられた各オリゴマープールにおいてＰＣＲ増幅を行うことを含む、請求項１～３の何れか１項に記載の方法。
前記遺伝子変異ライブラリの蓄積容量が最大１０^５、好ましくは最大１０^６、より好ましくは最大１０^７、より好ましくは最大１０^８、より好ましくは最大１０^９、より好ましくは最大１０^１０である、請求項１～４の何れか１項に記載の方法。
前記制限エンドヌクレアーゼがＩＩＳ型制限エンドヌクレアーゼである、請求項１～５の何れか１項に記載の方法。
前記ＩＩＳ型制限エンドヌクレアーゼが、ＡｃｕＩ、ＡｌｗＩ、ＢｂｓＩ、ＢｂｖＩ、ＢｃｃＩ、ＢｃｅＡＩ、ＢｃｉＶＩ、ＢｆｕＡＩ、ＢｍｒＩ、ＢｐｍＩ、ＢｐｕＥＩ、ＢｓａＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＡＩ、ＢｓｍＢＩ、ＢｓｍＦＩ、ＢｓｐＭＩ、ＢｓｐＱＩ、ＢｓｒＤＩ、ＢｔｇＺＩ、ＢｔｓＣＩ、ＢｔｓＩ、ＥａｒＩ、ＥｃｉＩ、ＥｃｏＰ１５Ｉ、ＦａｕＩ、ＦｏｋＩ、ＨｇａＩ、ＨｐｈＩ、ＨｐｙＡＶ、ＭｂｏＩＩ、ＭｍｅＩ、ＭｎｌＩ、ＰｌｅＩ、ＳａｐＩ及びＳｆａＮＩのうち１つ以上から選択される、請求項６に記載の方法。
前記ＩＩＳ型制限エンドヌクレアーゼがＢｓａＩである、請求項７に記載の方法。
段階（１）が、
（ｉ）コードヌクレオチド配列中の粘着末端を同定し、前記粘着末端の３’末端に従い、前記２つ以上のオリゴマープールに対応する２つ以上の断片に前記配列を分割し、
（ｉｉ）前記配列が２つの断片に分割される場合、オリゴマープール１を得るために、第１の断片の粘着末端の後に３’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列１を連続的に導入し、オリゴマープール２を得るために、第２の断片の５’末端で、粘着末端、前記制限エンドヌクレアーゼの認識配列及び特定配列２を連続的に導入するか；
又は、前記配列がｎ個の断片に分割される場合（ｎは３以上の正の整数である）、
オリゴマープール１を得るために、第１の断片の粘着末端の後に３’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列１を連続的に導入し；オリゴマープール２を得るために、第２の断片の５’末端で、粘着末端、前記制限エンドヌクレアーゼの認識配列及び特定配列２を連続的に導入し、第２の断片の粘着末端の後に３’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列３を連続的に導入するなどし；同様に、オリゴマープールｎを得るために、ｎ番目の断片の５’末端で、粘着末端、前記制限エンドヌクレアーゼの認識配列及び特定配列２ｎ－２を連続的に導入し、ｎ番目の断片の粘着末端の後に３’末端で前記制限エンドヌクレアーゼの認識配列の逆相補配列及び特定配列２ｎ－１を連続的に導入すること、
を含む、請求項１～８の何れか１項に記載の方法。
前記特定配列１～前記特定配列２ｎ－１が元のコードヌクレオチド配列と相同ではないランダム配列である、請求項９に記載の方法。
前記粘着末端が、単一粘着末端又は縮重粘着末端である、請求項６～１０の何れか１項に記載の方法。
前記粘着末端が単一粘着末端であり、前記オリゴマープールの数が２～６、好ましくは２である、請求項１１に記載の方法。
前記粘着末端が縮重粘着末端であり、前記オリゴマープールの数が２である、請求項１１に記載の方法。
前記粘着末端のＧＣ含量が５０％～７５％である、請求項６～１３の何れか１項に記載の方法。
前記粘着末端がパリンドローム構造を含有しない、請求項６～１４の何れか１項に記載の方法。
段階（３）の前記制限ライゲーション法がＧｏｌｄｅｎＧａｔｅクローニングである、請求項２～１５の何れか１項に記載の方法。
段階（２）の前記ＰＣＲ増幅系がウシ血清アルブミンをさらに含む、請求項２～１６の何れか１項に記載の方法。
最終的なライブラリ産物を得るために、（５）段階（４）で得られた遺伝子変異ライブラリの産物を回収及び／又は精製することをさらに含む、請求項１～１７の何れか１項に記載の方法。
段階（４）で得られた遺伝子変異ライブラリの産物がゲル電気泳動により回収及び／又は精製される、請求項１８に記載の方法。
（６）配列分布を検証する、及び／又はアミノ酸分布を検出するために、段階（５）で得られた最終ライブラリ産物をシーケンシングすることをさらに含む、請求項１８又は１９に記載の方法。
前記シーケンシングがサンガーシーケンシング及び／又はＮＧＳシーケンシングである、請求項２０に記載の方法。
段階（１）で合成される各オリゴマープールにおける前記変異ヌクレオチドの数が１～１０８、好ましくは１～２１である、請求項１～２１の何れか１項に記載の方法。
段階（１）で合成される各オリゴマープールにおける前記変異ヌクレオチドが１～３６個、好ましくは１～７個のアミノ酸の変異をコードする、請求項１～２２の何れか１項に記載の方法。
段階（１）で合成される各オリゴマープールにおける前記変異ヌクレオチドによりコードされる変異アミノ酸が、隣接又は非隣接の何れかである、請求項１～２３の何れか１項に記載の方法。
前記ハイフィデリティーＤＮＡポリメラーゼが、ＰｈｕｓｉｏｎＤＮＡポリメラーゼ、Ｑ５ポリメラーゼ及びｐｒｉｍｅｒＳＴＡＲポリメラーゼのうち１つ以上から選択される、請求項２～２４の何れか１項に記載の方法。
請求項１～２５の何れか１項に記載の方法により構築される、遺伝子変異ライブラリ。
タンパク質又はポリペプチドをスクリーニングするための、請求項１～２５の何れか１項に記載の方法により構築される遺伝子変異ライブラリの使用。
次の段階を含む、タンパク質中のアミノ酸変異と、前記タンパク質の特性、制御及び／又は機能と、の間の関係を分析するための方法：
（１）請求項１～２５の何れか１項に記載の方法を使用することによって遺伝子変異ライブラリを構築し；
（２）構築された前記遺伝子変異ライブラリにおいて変異遺伝子によりコードされるタンパク質の特性、制御及び／又は機能を非変異タンパク質と比較し；
（３）前記タンパク質におけるアミノ酸変異と、前記タンパク質の特性、制御及び／又は機能と、の間の関係を分析すること。