JP2004504014A

JP2004504014A - 配列に基づくスクリーニング

Info

Publication number: JP2004504014A
Application number: JP2001584578A
Authority: JP
Inventors: ショート　ジェイ　エム．
Original assignee: ディベルサ　コーポレーション
Priority date: 2000-05-15
Filing date: 2001-05-15
Publication date: 2004-02-12
Also published as: US20030008319A1; AU782529C; AU6314801A; AU782529B2; WO2001088196A3; US6455254B1; EP1356090A2; CA2375082A1; WO2001088196A2; US20020037505A1; IL147637A0

Abstract

試料の核酸プロフィールを得るための方法が提供される。方法は、生物体の混合集団の複数の核酸配列からＤＮＡライブラリーを作製する段階、及びＤＮＡライブラリー中の少なくとも１つのクローンの配列決定をする段階を含む。配列をデータベースと比較して、ライブラリー中のクローンと相同性を持つ、データベース中の配列を同定し、それにより生物体の混合集団の核酸プロフィールを得る。

Description

【０００１】
発明の分野
本発明は一般的に、生物体の混合集団のスクリーニング、より具体的には環境試料の配列に基づくプロファイリングに関する。
【０００２】
背景
現代生物学の中心となる核とは、遺伝情報は核酸ゲノムに存在し、そのようなゲノムに具体化される情報（すなわち遺伝型）が細胞の機能を指揮するというものである。これは、生物体のゲノム中の様々な遺伝子の発現と、そのような遺伝子発現の調節によって起きる。細胞または生物体中の遺伝子発現は、細胞または生物体の物理的特徴（すなわち表現型）を規定する。これは遺伝子のタンパク質への翻訳を介して行われる。
【０００３】
種々の生物体のための潜在的な治療薬、抗生物質、および生物製剤をさらに理解し、決定するために、いくつかの生物体のゲノムの配列を決定する努力がなされてきた。例えば、ヒトゲノムプロジェクトは、ヒトのゲノムの完全な配列を決定し、各遺伝子の生化学的機能を決定するという具体的目標をもって開始された。現在までに、このプロジェクトはヒトゲノムの多くの部分の配列を決定している（Ｊ．Ｒｏａｃｈ、ｈｔｔｐ：／／ｗｅｂｅｒ．ｕ．Ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ／￣ｒｏａｃｈ／ｈｕｍａｎ＿ｇｅｎｏｍｅ＿ｐｒｏｇｒｅｓｓ２．ｈｔｍｌ）（Ｇｉｂｂｓ、１９９５）。例えば、Ｍ．ゲニタリウム（ｇｅｎｉｔａｌｉｕｍ）（Ｆｒａｓｅｒら、１９９５）、Ｍ．ジャナスチー（ｊａｎｎａｓｃｈｉｉ）（Ｂｕｌｔら、１９９６）、インフルエンザ菌（Ｈ．ｉｎｆｌｕｅｎｚａｅ）（Ｆｌｅｉｓｃｈｍａｎｎら、１９９５）、大腸菌（Ｅ．ｃｏｌｉ）（Ｂｌａｔｔｎｅｒら、１９９７）および酵母（Ｓ．ｃｅｒｅｖｉｓｉａｅ）（Ｍｅｗｅｓら、１９９７）を含む、少なくとも２１の他のゲノムがすでに配列決定されている。マウス、線虫（Ｃ．ｅｌｅｇａｎｓ）、アラビドプシス（Ａｒａｂｉｄｏｐｓｉｓ）種およびキイロショウジョウバエ（Ｄ．ｍｅｌａｎｏｇａｓｔｅｒ）のようなモデル生物のゲノムの配列決定においては、有意な進歩が見られている。たとえば以下のような、いくつかの機能情報で注釈されたゲノム情報を含むいくつかのデータベースが、種々の団体によって維持され、インターネット経由でアクセスされうる：ｈｔｔｐ：／／ｗｗｗｔｉｇｒ．ｏｒｇ／ｔｄｂ；ｈｔｔｐ．／／ｗｗｗ．ｇｅｎｅｔｉｃｓ．ｗｉｓｃ．ｅｄｕ；ｈｔｔｐ：／／ｇｅｎｏｍｅ−ｗｗｗ．ｓｔａｎｆｏｒｄ．ｅｄｕ／￣ｂａｌｌ；ｈｔｔｐ：／／ｈｉｖ−ｗｅｂ．ｌａｎｌ．ｇｏｖ；ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ；ｈｔｔｐ：／／ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ；ｈｔｔｐ；／／Ｐａｓｔｅｕｒ．ｆｒ／ｏｔｈｅｒ／ｂｉｏｌｏｇｙ；およびｈｔｔｐ；／／ｗｗｗ．ｇｅｎｏｍｅ．ｗｉ．ｍｉｔ．ｅｄｕ。ゲノム中の生（ｒａｗ）核酸配列は、いくつかの利用可能なアルゴリズムの１つを経て、タンパク質のアミノ酸配列に転換され、このタンパク質が細胞中の様々な過程を実行する。残念ながら、これらのタンパク質配列の生データは、そのまま細胞中のタンパク質の機能や、生体試料中での関係や役割を表すわけではない。種々の細胞過程の詳細（例えば、代謝経路、分子間のシグナル伝達、細胞分裂など）およびこれらの過程をどのタンパク質が担うかを理解することは、現代の細胞生物学の中心的なゴールである。
【０００４】
したがって、環境試料中に存在する生物体、タンパク質、核酸配列のプロフィールを決定することは、環境中のこれらの生物体やタンパク質の役割について、価値のある情報を提供し得る。さらにそのような情報は、生物製剤、診断薬、治療薬、および産業的応用性のある組成物の開発に役立ち得る。
【０００５】
発明の概要
本発明は、複数の核酸配列を得ることによって、生物体の混合集団を含む試料から試料の核酸プロフィールを得る方法を提供することによって、当技術分野における多くの問題を解決する。本方法には、複数の核酸配列から核酸ライブラリーを作製し、そのライブラリーの少なくとも１つのクローンの配列を決定することが含まれる。配列情報は、少なくとも１つのクローンの配列と、複数の生物体由来の複数の核酸配列を含むデータベースとを比較するアルゴリズムを用いて、少なくとも１つのクローンに相同性を持つデータベース中の配列を同定する、データベース検索に使用される。これを必要ならば繰り返し実行し、試料の核酸プロフィールを得ることができる。１つの態様では、生物体の混合集団は、環境試料のような、非培養または培養微生物に由来する。別の態様では、核酸はＲＮＡ、ＤＮＡ（例えば、ゲノムＤＮＡまたはその断片）であり得る。
【０００６】
本発明は、植物の混合集団を含む試料から複数の核酸配列を得ることによって、試料の核酸プロフィールを得る方法も提供する。本方法には、複数の核酸配列からＤＮＡライブラリーを作製し、そのＤＮＡライブラリーの少なくとも１つのクローンの配列を決定することが含まれる。配列情報は、少なくとも１つのクローンの配列と、複数の生物体由来の複数の核酸配列を含むデータベースとを比較するアルゴリズムを用いて、少なくとも１つのクローンに相同性を持つデータベース中の配列を同定する、データベース検索に使用される。これを必要ならば繰り返し実行し、試料の核酸プロフィールを得ることができる。１つの態様では、植物の混合集団は、環境試料のような、非培養または培養植物に由来する。別の態様では、核酸はＲＮＡ、ＤＮＡ（例えば、ゲノムＤＮＡまたはその断片）であり得る。
【０００７】
発明の詳細な説明
本発明は、試料中に存在するポリヌクレオチド配列に基づいて、環境試料のフィンガープリンティングまたはプロファイリングを行なうための方法および組成物を提供する。それにより本発明は、生物体が特定の環境に対応するための進化および生物多様性を理解するために有用で、方向づけられた進化、分子生物学、バイオテクノロジー、および産業的応用に役立つ方法および組成物を提供する。
【０００８】
本発明は生物体の混合集団または生物体の混合集団由来の核酸配列を含む試料中で、配列を素早くスクリーニングして同定する方法を提供する。試料中に存在する核酸配列のスクリーニングおよび同定を行なうことにより、本発明は診断薬、治療薬、または産業的応用のための分子の開発に使用可能な配列のレパートリーを増大させる。したがって、本発明の方法により機能の既知および未知のタンパク質またはポリペプチドをコードする新規の核酸配列を同定できる。
【０００９】
また、本発明は既知の活性を持つ配列に対応する核酸配列、または既知の活性を持つタンパク質またはペプチドをコードする配列が、試料中に存在するか否かを素早く同定する方法を提供する。
【００１０】
本明細書および添付の特許請求の範囲で使用される単数形「１つの」および「その」は、そうでないことが内容から明らかである場合を除き、複数形の物も含む。したがって、「１つのクローン」は複数のクローンを含み、「その核酸配列は」一般的に１つまたは複数の核酸配列および当技術分野で周知の同等物を含む。
【００１１】
特に明確に定義されないかぎり、本明細書に使用されるすべての技術的および科学的用語は、本発明の関連する当業者によって通常理解されているのと同じ意味を持つ。本発明の実施または試験においては、本明細書記載の方法および材料と類似した、または同等の任意の方法、装置および材料を使用できるが、好ましい方法、装置および材料は、本明細書に記載されている。
【００１２】
本明細書に記載される全ての出版物は、本明細書に記載される発明に関連して使用される可能性のある出版物中に記載されるデータベース、タンパク質および方法を記述し開示するために、その全体が参照として本明細書に組み入れられる。上述およびテキスト全体に記述される出版物は、本出願の出願日以前の開示のためのみに提供される。先行発明のおかげで、発明者にはそのような開示に先行する資格がないことを認めると解釈されてはならない。
【００１３】
「アミノ酸」とは、中心の炭素原子（α炭素原子）が水素原子、カルボン酸基（本明細書ではその炭素原子を「カルボキシル炭素原子」と呼ぶ）、アミノ基（本明細書ではその窒素原子を「アミノ窒素原子」と呼ぶ）、および側鎖のＲ基に結合している構造を持つ分子である。ペプチド、ポリペプチド、またはタンパク質に組み込まれると、１つのアミノ酸を別のアミノ酸に結合する脱水反応において、アミノ酸は、アミノ酸カルボキシル基の１つまたは複数の原子を失う。その結果、タンパク質に組み込まれたときには、アミノ酸は「アミノ酸残基」と呼ばれる。
【００１４】
「タンパク質」とは、２つまたはそれ以上の個々の（天然又は非天然の）アミノ酸がペプチド結合で結合した任意のポリマーを意味し、１つのアミノ酸（またはアミノ酸残基）のα炭素に結合したカルボン酸基のカルボキシル炭素原子が、隣接するアミノ酸のα炭素に結合するアミノ基のアミノ窒素原子に共有結合されると発生する。「タンパク質」という用語は、その意味の中に「ポリペプチド」および「ペプチド」（これらは本明細書では時折互換的に使用される可能性がある）という用語を含むと理解される。さらに、複数のポリペプチドサブユニット（例えば、ＤＮＡポリメラーゼＩＩＩ、ＲＮＡポリメラーゼＩＩ）または他の成分（例えば、テロメラーゼにおけるＲＮＡ分子）を含むタンパク質も、本明細書で使用される「タンパク質」の意味に含まれると理解される。同様に、タンパク質やポリペプチドの断片も、本発明の範囲内であり、本明細書では「タンパク質」と呼ばれうる。
【００１５】
あるタンパク質の特定のアミノ酸配列（すなわちアミノ末端からカルボキシ末端まで書かれた時のポリペプチドの「一次構造」）は、ｍＲＮＡのコード部分のヌクレオチド配列によって決定され、ｍＲＮＡは、通常はゲノムＤＮＡ（例えばミトコンドリアまたはクロロプラストＤＮＡのようなオルガネラＤＮＡを含む）である遺伝情報によって規定されている。このように、遺伝子の配列の決定は、対応するポリペプチドの一次配列、およびより具体的にはその遺伝子またはポリヌクレオチド配列によってコードされているポリペプチドまたはタンパク質の役割または活性を予測するのに役立つ。
【００１６】
「単離された」という用語は、天然状態から「人間の手によって」変化を受けたことを意味する；すなわち、それが天然に発生する場合には、元々の環境から変えられたもしくは取り出された、またはその両方である。本明細書で用いられる用語では、例えば、天然状態の生きている動物、生物試料または環境試料に天然に存在するポリヌクレオチドまたはポリペプチドは、「単離されて」はいないが、天然状態で共存する物質から分離された同じポリヌクレオチドまたはポリペプチドは、「単離されて」いる。本明細書で用いられる用語では、そのようなポリヌクレオチドは、培養宿主細胞または生物体全体に導入された場合、天然に発生する形または環境ではないので、まだ単離されていることになる。同様に、ポリヌクレオチドおよびポリペプチドは、培地製剤（例えば、細胞にポリヌクレオチドまたはポリペプチドを導入するための溶液、または化学反応または酵素反応のための溶液）のような組成物中にも存在しうる。
【００１７】
「ポリヌクレオチド」または「核酸配列」とは、ヌクレオチドのポリマー型を意味する。場合によっては、ポリヌクレオチドは、それが由来する生物体で天然に存在するゲノムでは直接に隣接する（５’末端で１つおよび３’末端で１つ）コード配列のいずれとも直接には隣接しない配列を指す。したがってこの用語は例えば、ベクター；自律的に複製するプラスミドまたはウイルス；または原核生物または真核生物のゲノムＤＮＡに組み込まれた組み換えＤＮＡ、または他の配列とは独立した、分離した分子（例えば、ｃＤＮＡ）として存在する組み換えＤＮＡも含む。本発明のヌクレオチドは、リボヌクレオチド、デオキシリボヌクレオチド、またはそのいずれかのヌクレオチドの修飾された形であり得る。本明細書におけるポリヌクレオチドは、特に、一本鎖および二本鎖ＤＮＡ、一本鎖と二本鎖の領域が混在するＤＮＡ、一本鎖および二本鎖ＲＮＡ、および一本鎖と二本鎖の部分が混在するＲＮＡ、一本鎖またはより通常には二本鎖であるか、一本鎖と二本鎖の部分が混在する、ＤＮＡおよびＲＮＡのハイブリッド分子を指す。
【００１８】
また、本明細書におけるポリヌクレオチドは、ＲＮＡもしくはＤＮＡまたはＲＮＡおよびＤＮＡの両方を含む三本鎖領域を指す。そのような領域の鎖は、同一の分子または異なる分子に由来しうる。そのような領域には、１つまたは複数の分子の全体が含まれる可能性があるが、より一般的には分子のうちのある領域のみを含む。三重鎖領域の分子の１つはしばしばオリゴヌクレオチドである。ポリヌクレオチドまたは核酸という用語は、ゲノムＤＮＡまたはＲＮＡ（生物体による、例えば、ウイルスのＲＮＡゲノム）、およびゲノムＤＮＡにコードされるｍＲＮＡ、およびｃＤＮＡが含まれる。このように、本発明のライブラリーは、本明細書に記載されるような任意の核酸分子を用いて作製できる。
【００１９】
上述のように、バイオテクノロジーおよび化学業界では現在、生物過程または化学過程を最適に実行できる分子（例えば、酵素）が求められている。環境試料中で新規の酵素を同定することは、この問題の１つの解決法である。環境試料中に存在する生物体、タンパク質および核酸配列のプロフィールを決定することによって、環境中におけるこれらの生物体またはタンパク質の役割に関する価値のある情報が提供できる。さらに、そのような情報は、産業的応用のための生物製剤、診断薬、治療薬および組成物の開発にも役立つ。確立されたおよび新興の化学、製薬、繊維、食品、飼料、洗剤市場で利用される全てのクラスの分子および化合物は、厳格な経済的および環境の基準に適合しなくてはならない。ポリマー、医薬品、天然製品、および農薬の合成は、有害な副産物を生成し、悪いまたは非効率的な触媒に影響される高価な過程によってしばしば妨げられている。例えば、酵素には触媒反応においてこれらの問題を克服できるいくつかの目覚ましい利点がある：単一の官能基にしか反応しない、単一の分子上の類似した官能基を区別する、および鏡像異性体の区別をする。さらに、生分解性であり、反応液中で、非常に低いモル比で機能する。その化学的特異性、部位特異性、および立体特異性のために、所望の選択的変換を最適に行なう独特な機会を与える。これらはしばしば、特に単一段階で、化学的に再現するのは非常に困難である。保護基が不要であること、選択性、単一の反応容器中で複数段階の変換を行なえること、同時に環境負荷が低減できることのために、化学および製薬業界において酵素の需要が増加してきた。酵素に基づく過程は、多くの従来の化学に基づく方法をしだいに置き換えてきた。さらに広範囲に産業用に使用されるための現在の弱みは、主に比較的少数の酵素が商業的に利用できることである。現在までに記述された＞３０００の非ＤＮＡ修飾酵素のうち、約３００の酵素（ＤＮＡ修飾酵素を除く）が商業的に利用できるのみである。
【００２０】
技術的な用途への酵素の利用も、要求の厳しい産業条件における性能が必要となる。これには、現在既知の酵素の集積が進化的に選択されなかった環境におけるまたは基質に対する活性が含まれる。しかし、天然の環境は、例えば極端な温度およびｐＨを含む極端な条件を提供する。いくつもの生物体が、部分的にはこれらの極端な条件に堪えられるポリペプチドを選択することによって、これらの条件に適合してきた。
【００２１】
酵素は、生物体の環境内、温度、ｐＨ、塩濃度の条件下で、非常に特定の生物機能を発揮するという選択的圧力によって、進化してきた。多くの場合、これまでに記述された非ＤＮＡ修飾酵素の活性は、利用できる系統発生の多様性の非常に小さな部分である、中温性の生物体から単離されてきた。生物触媒の動的な分野は、極端な環境で成育する微生物から単離された酵素の助けをもって、新しい次元を獲得する。そのような酵素は、地上の温泉および深海の熱水噴出口では１００℃以上の温度、北極海では０℃以下の温度、死海では飽和塩濃度の環境、石炭鉱床および地熱の硫黄泉では０に近いｐＨ、または下水汚泥では１１以上のｐＨで機能する必要がある。例えば、生物体、ポリヌクレオチドおよびポリペプチド（例えば、酵素）を含む、極端な条件から得られた環境試料は、生物触媒に新しい分野を開拓する。また、試料中に存在するポリヌクレオチド配列に基づく環境試料のフィンガープリンティングまたはプロファイリングを行なうことによって、本発明は方向づけられた進化に役立つ進化の理解、生物多様性、分子生物学、バイオテクノロジーおよび産業的応用を提供する。
【００２２】
産業用の新しい酵素に対するニーズに加え、新規の活性を持つ生理活性化合物に対するニーズも劇的に高まってきた。この需要は、主に全世界の人口統計的変化および現在使用できる抗生物質に耐性の病原体の数が増加する傾向に起因する。例えば、若年人口の高い新興国では抗菌薬の需要が上昇しているのに対し、米国のような高齢化の進行する国では、癌、糖尿病、関節炎、および他の衰弱性の疾病に対する薬のレパートリーを広げる必要がある。感染症による死亡率は、１９８０年から１９９２年までに５８％増加しており、抗生物質に耐性の微生物の出現は、米国だけでも年間３００億ドル以上も医療費を押し上げている。（Ａｄａｍｓら、ＣｈｅｍｉｃａｌａｎｄＥｎｇｉｎｅｅｒｉｎｇＮｅｗｓ、１９９５；Ａｍａｎｎら、ＭｉｃｒｏｂｉｏｌｏｇｉｃａｌＲｅｖｉｅｗｓ、５９、１９９５）。このような傾向に対応して、製薬会社は独特の活性または特異性を持つ化合物を求めて微生物の多様性のスクリーニングをかなり強化している。したがって本発明は、たとえば種々の微生物の消化管に存在する感染性微生物から、配列特異的な情報を得るために使用できる。
【００２３】
したがって、本発明は感染因子および関連する生理活性化合物の供給源をプロファイリングおよび同定する方法を提供する。この情報は、特定の環境試料によって拡散または媒介される特定の疾病の治療における、化合物、治療薬および診断薬を開発するための重要な情報を提供する。例えば、冷却塔に存在する微生物および関連生理活性化合物の同定は、レジオネラおよび関連病原体の同定に役立ち得る。
【００２４】
別の態様では、本発明の方法および組成物は、環境試料中に存在する薬剤のリード化合物の同定に役立つ。本発明の方法は、新規の薬剤を求めて環境を調べ、種々の微生物に含まれる関連薬物を同定する能力を提供する。例えば、海綿に見られる微生物のような海洋共生生物は、薬物化合物の貴重な供給源であり、本発明の方法の核酸供給源だと想像される。環境の調査の結果として同定または開発されたヌクレオチド、ペプチド、または他のポリマー分子のようなリード化合物（薬物候補）には、天然産物の集合、合成化学物質の集合、合成コンビナトリアルライブラリーを含め、いくつかの共通の供給源がある。各供給源にはそれぞれ長所と短所がある。これらの候補のスクリーニングプログラムの成功は、プログラムに入れる化合物の数に大きく依存しており、製薬会社は今日までにリード化合物を求めて何十万もの合成および天然の化合物のスクリーニングをしてきた。残念ながら、以前に発見された化合物に対する新規化合物の比は、時間とともに低下してきた。新規化合物の発見率は、製薬会社の最善の努力にもかかわらず、需要に追いついてはいない。潜在的薬物候補の新しい供給源を評価するニーズは非常に大きい。したがって、本発明は新規の薬物化合物を含む可能性のある環境試料の同定および解析のための素早く効率の良い方法を提供する。
【００２５】
現在使用されている生理活性化合物の大部分は、土壌の微生物に由来する。土壌および他の複雑な生態的コミュニティに生息する多くの微生物は、その生存および繁栄能力を高めるような種々の化合物を作製する。これらの化合物は、一般に生物体の成長には必須ではないと考えられ、中間的代謝に関与する遺伝子の助けによって合成され、そのために「二次産物」という名を持つ。他の生物体の成長または生存に影響を与える二次代謝産物は、「生理活性」化合物として知られており、微生物およびマクロ生物のいずれにとっても、化学的防御の鍵となる化合物となる。ヒトは、広範囲の原核および真核病原体に対する活性を持つ抗生物質、抗感染薬、および他の生理活性化合物として、これらの化合物を活用してきた。微生物由来の約６，０００の生理活性化合物が解析されており、その６０％以上はＳｔｒｅｐｔｏｍｙｃｅｓ属のグラム陰性土壌細菌によって作製される（Ｂａｒｎｅｓら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９１、１９９４）。これらの中で、少なくとも７０は生物医学および農業の用途に現在使用されている。生理活性化合物の最大のクラスであるポリケチドには、合わせると年商５０億ドルを越す広範囲の抗生物質、免疫抑制剤および抗がん剤が含まれる。
【００２６】
見掛け上は数多くの生理活性化合物が利用できるにもかかわらず、現代の生物医学の直面する最大の課題の１つが抗生物質耐性病原体の増殖であることは明らかである。世代時間が短く、遺伝情報を容易に交換する能力があるため、病原微生物は迅速に進化し、ほぼ全ての抗生物質のクラスに対する抵抗性の機構を広めた。例えば、現在ではただ１つの抗生物質、バンコマイシンでのみ治療できるヒト病原菌ブドウ球菌（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓ）および連鎖球菌（Ｓｔｒｅｐｔｏｃｏｃｃｕｓ）の毒性株があり、この化合物に対する耐性は、耐性の腸球菌（Ｅｎｔｅｒｏｃｏｃｃｕｓ）種からただ１つの遺伝子ｖａｎＡが伝達されると発生する（Ｂａｔｅｓｏｎら、Ｓｙｓｔｅｍ．Ａｐｐｌ．Ｍｉｃｒｏｂｉｏｌ．１２、１９８９）。新規の抗菌化合物に対する重要なニーズと、酵素阻害剤、免疫抑制剤、および抗がん剤に対する需要の増加を合わせると、どうして製薬会社が新規の性質を持つ生理活性化合物を求めて、多様な微生物のスクリーニングを強化してきたかが容易に理解できる。
【００２７】
本発明は既知または未知の機能を持つ新規のポリペプチドをコードする新規の核酸配列を同定する方法を提供する。例えば、微生物ゲノムの多様性の多くは、微生物ゲノムにおける遺伝子クラスターの再配列の結果である。これらの遺伝子クラスターは、種を越えて存在したり、系統発生的に他の生物体と関連し得る。
【００２８】
例えば、細菌および多くの真核生物は、その産物が関連する過程に関与する関連する遺伝子に、協調した機構を持っている。遺伝子は単一の染色体上で「遺伝子クラスター」と呼ばれる構造となって密集し、クラスター全体の転写を開始する単一のプロモーターを含む単一の調節配列の制御下で一緒に転写される。遺伝子クラスター、プロモーターおよび調節に機能する他の配列は、合わせて「オペロン」と呼ばれ、通常は２から６、最高２０またはそれ以上の遺伝子を含む。このように、遺伝子クラスターは、通常は機能に関して、関連するまたは同一の隣接する遺伝子群である。
【００２９】
いくつかの遺伝子ファミリーが、同一のメンバーからなる。集団になっている遺伝子は、必ずしも同一ではないが、集団化は遺伝子間の同一性を維持するための必要条件である。遺伝子クラスターは隣接する関連遺伝子が重複した極端なものから、何百もの同一の遺伝子が縦列しているものまである。特定の遺伝子の繰り返しに、意義が見いだされない場合もある。その代表例は、哺乳類の他の種では単一のインスリン遺伝子が適切であるのに、ある種ではインスリン遺伝子が重複して発現するものである。
【００３０】
さらに、遺伝子クラスターは継続的に再構成されている。そのため、例えば細菌または他の原核生物から遺伝子クラスターの非均質ライブラリーを作製する能力は、新規のタンパク質、特に例えば数多くの有用な活性を持つポリケチドの合成を担うポリケチド合成酵素のような酵素の供給源を決定するために価値がある。例えば、抗生物質、抗ウイルス薬、抗腫瘍薬およびインスリンのような調節タンパク質を含む、他の種類の遺伝子クラスターの産物のタンパク質も予測される。
【００３１】
一例として、ポリケチド合成酵素は、１つの遺伝子クラスターにある。ポリケチドは、抗生物質（テトラサイクリンやエリスロマイシンなど）、抗がん剤（ダウノマイシン）、免疫抑制剤（ＦＫ５０６およびラパマイシン）、および動物薬（モネンシン）を含む生理活性の非常に豊かな供給源となる分子である。多くのポリケチド（ポリケチド合成酵素に作製される）は、治療薬として価値が高い。ポリケチド合成酵素は、長さおよび機能や環化のパターンが異なる多様な炭素鎖の生合成を触媒する、多機能酵素である。ポリケチド合成酵素遺伝子は、遺伝子クラスターとなっており、少なくとも１つのタイプ（タイプＩと呼ばれる）のポリケチド合成酵素は、大きなサイズの遺伝子および酵素を持っており、遺伝子操作やこれらの遺伝子／タンパク質のインビトロ研究を複雑なものにしている。
【００３２】
研究する新規のポリケチドを作製するために、ポリケチドおよびポストポリケチド生合成遺伝子のライブラリーから所望の成分を選択し組み合せる能力は、魅力的である。本発明の方法では、大きな挿入物（特にＦ因子ベースのベクターを使用する場合）を含むクローンで遺伝子バンクを作製できるので、遺伝子クラスターのクローニングが容易になるため、本発明の方法は新規のポリケチド合成酵素のクローニングを可能にし、容易にする。
【００３３】
例えば、遺伝子クラスターの核酸をベクターに連結する。ベクターはさらに、連結された遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレイの活性の作製を制御および調節する発現調節配列も含み得る。外来核酸の導入収容力が特に大きいベクターは、そのような遺伝子クラスターに使用するのに特に適しており、本明細書では大腸菌（Ｅ．ｃｏｌｉ）のＦ因子（または稔性因子）を含む例によって記述されている。大腸菌（Ｅ．ｃｏｌｉ）のこの因子は接合時に高頻度で起こるそれ自身の移動に影響を与えるプラスミドで、微生物の混合試料由来の遺伝子クラスターのような、大きな核酸断片を安定的に増やすために理想的である。
【００３４】
これらの試料（例えば、微生物の混合集団）由来またはこれから単離された核酸は、好ましくはポリヌクレオチドのスクリーニングまたはハイスループットシーケンシングの前にベクターまたはプラスミドに挿入される。そのようなベクターまたはプラスミドは、通常はプロモーター、エンハンサーなどを含む発現調節配列を含んでいる。
【００３５】
したがって、本発明はインビトロで関心対象の酵素活性および生理活性を求めて環境試料をクローニングしスクリーニングする新規のシステムを提供する。本発明の方法では、インビトロで新規の生理活性分子、特に非培養および培養試料由来の新規の生理活性分子のクローンニングおよび発見が可能になる。本発明の方法を用いると、大きなサイズの遺伝子クラスター、遺伝子および遺伝子断片がクローニング、配列決定、およびスクリーニング可能である。以前の戦略とは異なり、本発明の方法によると、広範囲の環境試料から、インビトロでポリヌクレオチドおよびこれらのポリヌクレオチドにコードされるポリペプチドをクローニング、同定、プロファイリング、および利用できる。
【００３６】
本発明は、関心対象の酵素活性および生理活性をコードする遺伝子の、複雑な環境試料からのスクリーニングおよび同定を可能にする。これらの試料から作製されたＤＮＡライブラリーは、試料中に存在する核酸の集団を表す。ライブラリーは、核酸配列を含むかぎり、無細胞試料から作製可能であり、細胞性の生物体またはウイルス粒子を含む試料からも作製可能である。ライブラリーを調製できる元になる生物体には、真正細菌（Ｅｕｂａｃｔｅｒｉａ）および古細菌（Ａｒｃｈａｅｂａｃｔｅｒｉａ）のような原核微生物、真菌、ある種の藻類およびプロトゾアのような下等真核微生物、ならびに植物、植物胞子および花粉の混合物が含まれる。生物体は環境試料から得られた培養生物体または非培養生物体でよく、そのような生物体は好熱菌、超好熱菌、好冷菌、低温細菌のようなエクストレモフィルでよい。
【００３７】
以前に示されたように、ライブラリーは環境試料から作製でき、この場合は核酸は生物体の培養なしに回収するか、培養生物体から回収できる。
【００３８】
ＤＮＡライブラリーを構築するために使用する核酸供給源は、北極および南極の氷、水、永久凍土層から得られた微生物試料、火山由来の材料、熱帯の土壌または植物由来の材料、哺乳類、無脊椎動物を含む種々の生物体の糞、ならびに死体および腐敗物などのような環境試料が含まれるがこれらに限定されることはないと予想される。したがって、例えば培養または非培養生物体から核酸を回収し、適切なＤＮＡライブラリー（例えば、組み換え発現ライブラリー）を作製し、その後、特定のポリヌクレオチド配列を同定したり、酵素活性をスクリーニングしたりできる。
【００３９】
以下は、培養および非培養生物体ならびに生物体の混合集団からライブラリーを作製する一般的な手順の概要を示す。ライブラリーは同定されたまたは予測される生物活性（例えば、酵素活性）を持つ核酸配列を選択するために、プロービング、配列決定、およびスクリーニングできる。
【００４０】
環境試料、核酸供給源、および単離
本明細書では、環境試料は生物体またはポリヌクレオチドまたはその組み合せを含む任意の試料である。したがって、環境試料は、例えば昆虫の糞を含む任意の数の供給源（上記）から得られる。精製または非精製の核酸の任意の供給源が開始材料として使用できる。したがって、核酸は生物体が汚染している任意の供給源、または細胞を含む任意の試料から得られる。環境試料は、任意の哺乳類の血液、尿、脊髄液、組織、膣スワブ、糞、羊水、または口内うがい液のような体液試料から抽出できる。非哺乳類（例えば、無脊椎動物）では、試料は、組織試料、唾液試料、糞または生物体の消化管中の材料でよい。環境試料には、例えば、硫黄泉、火山口、凍土帯の様な極端な環境から得られた試料も含まれる。また、試料は多様な供給源由来であり得る。例えば、園芸および農業試験では、試料は植物、肥料、土壌、液体、または他の園芸もしくは農業産物でよい；食品試験では、試料は生の食品または加工食品（例えば、乳児用ミルク、海産物、生鮮食料品、および包装された食品）でよい；環境試験では、試料は液体、土壌、下水処理、汚泥、および生物体またはポリヌクレオチドを含むと考えられるまたは疑われる任意の他の環境中の試料で良い。
【００４１】
試料が、例えば血液、土壌および汚泥のような物質の混合物（例えば、生物体の混合集団）である場合には、細胞を開き、核酸の鎖を露出または分離するために有効な適切な試薬で処理できる。この溶菌および核酸変性段階は必ずしも必要ではないが、これによりクローニング、増幅、または配列決定がより容易に行なえる。さらに、特定の集団を精製するために、混合群を分析前に培養して純粋な試料が得られるようにしても良い。しかし、これは必ずしも必要ではない。
【００４２】
したがって、試料は、例えば生物体の多様な混合集団（例えば、昆虫の消化管に存在する微生物）に由来する核酸を含む。核酸は、任意の数のＤＮＡおよびＲＮＡ単離方法を用いて、試料から単離される。そのような核酸単離方法は、当技術分野で実施されている。核酸がＲＮＡの場合には、当技術分野で周知のプライマーを用いてＲＮＡをＤＮＡに逆転写できる。ＤＮＡがゲノムＤＮＡの場合には、２５ゲージの針を用いて、ＤＮＡを剪断する。
【００４３】
クローニングおよび形質転換
その後、適切なベクターを用いて核酸をクローニングする。使用されるベクターは、ＤＮＡが発現されるか、増幅されるか、配列決定されるか等に依存する（例えば、ハイスループットシーケンシングベクターを開示する米国特許第６，０２２，７１６号参照）。クローニング技術は当技術分野で周知であるか、過度の実験なしに当業者によって開発され得る。ベクターの選択も、ポリヌクレオチド配列のサイズおよび本発明の方法に使用される宿主細胞に依存する。したがって、本発明で使用されるベクターは、プラスミド、ファージ、コスミド、ファージミド、ウイルス（例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど）、またはその一部（例えば、コートタンパク質、スパイク糖タンパク質、コスミドタンパク質）である可能性がある。例えば、コスミドおよびファージミドは、大きなポリヌクレオチドを安定的に増殖できるので、分析または修飾する特定の核酸配列がより大きな場合に好ましい。
【００４４】
核酸配列の混合物がベクターにクローニングされると、各ベクターを宿主細胞に導入し、宿主細胞にベクターを増幅させることによって、クローンの増幅ができる。これは、核酸配列の絶対数は増加するものの、ハイブリッドの数は増えないので、クローン増幅と呼ばれる。
【００４５】
クローニングされたＤＮＡ配列を含むベクターは、その後適切な宿主細胞にベクターをトランスフェクトすることにより増幅できる（例えば、大腸菌（Ｅ．ｃｏｌｉ）宿主にファージ）。または（または増幅の後に）、クローニングされたＤＮＡ配列を用いて、適切な生物体を形質転換することによってスクリーニングまたは配列決定するためのライブラリーを調製する。標的核酸を含むベクターを、形質転換を助ける条件下で接種することにより人工的に導入して、当技術分野で周知の宿主を形質転換する。二本鎖の環状または直線状の核酸により形質転換したり、場合によっては一本鎖の環状または直線状核酸配列により形質転換することができる。形質転換という用語は、新しいＤＮＡ（すなわち、細胞にとって外来のＤＮＡ）の組み込み後に、細胞中で永久または一過性の遺伝的変化が導入されることを意味する。細胞が哺乳類細胞の場合には、永久の遺伝的変化は、通常、ＤＮＡが細胞のゲノムに導入されることで起きる。形質転換された細胞または宿主細胞というのは、一般的に、宿主生物体に通常は存在しないＤＮＡ分子が組み換えＤＮＡ技術によってそれに（またはその祖先に）導入された細胞（例えば、原核または真核）を指す。
【００４６】
本発明で使用される特定のタイプのベクターには、Ｆ因子の複製開始点が含まれている。大腸菌（Ｅ．ｃｏｌｉ）のＦ因子（または稔性因子）はプラスミドで、これのおかげで接合中にＦ因子自身は高頻度で移動し、細菌の染色体自身はより低い頻度で移動する。ある特定の態様では、「フォスミド」またはＢＡＣ（バクテリア人工染色体）ベクターと呼ばれるクローニングベクターが使用される。これらは大腸菌（Ｅ．ｃｏｌｉ）のＦ因子由来で、大きなＤＮＡ部分を安定的に組み込むことができる。非培養環境混合試料のＤＮＡを組み込むと、安定な「環境ＤＮＡライブラリー」の形で大きなゲノム断片が得られる。
【００４７】
混合集団または試料由来の核酸は、種々の手法によってベクター中に挿入できる。一般に、核酸配列は当技術分野で周知の手順により適切な制限エンドヌクレアーゼ部位に挿入される。そのような手順および他の手順は、当業者の範囲だと考えられる。典型的なクローニングシナリオは、適切なヌクレアーゼ（例えば、ヤエナリヌクレアーゼ）を用いてＤＮＡを「ブラント」にし、例えばＥｃｏＲＩメチラーゼなどでメチル化し、ＥｃｏＲＩリンカー

に連結する。リンカーはその後ＥｃｏＲＩ制限エンドヌクレアーゼで消化し、ＤＮＡサイズを分画する（例えば、蔗糖勾配を用いる）。得られたサイズ分画したＤＮＡを、それから配列決定、スクリーニング、または発現のために適切なベクターに連結する（例えば、λベクター、インビトロλパッケージングエキストラクトを用いてパッケージングする）。
【００４８】
組み換えＤＮＡを用いた宿主細胞の形質転換は、当業者に周知の通常の方法で実行できる。宿主が大腸菌（Ｅ．ｃｏｌｉ）のような原核生物の場合には、ＤＮＡの取り込み能力のあるコンピテント細胞は、指数増殖期の後で採集し、その後当技術分野で周知の手順でＣａＣｌ_２処理を行なって調製できる。または、ＭｇＣｌ_２またはＲｂＣｌが使用できる。形質転換は、宿主細胞のプロトプラスト形成後、または電気穿孔法によっても行なえる。
【００４９】
宿主が真核生物の場合には、ＤＮＡのトランスフェクションまたは形質転換法には、リン酸カルシウム共沈、マイクロインジェクションのような通常の機械的方法、電気穿孔法、リポソームにつつまれたプラスミドの導入、ウイルスベクター、ならびに他の当技術分野で周知の方法が含まれる。真核細胞は、単純ヘルペスウイルスチミジンキナーゼ遺伝子のような選択マーカーをコードする第２の外来ＤＮＡ分子と共にトランスフェクトしても良い。また別の方法は、シミアンウイルス４０（ＳＶ４０）またはウシパピローマウイルスのような真核ウイルスベクターを用いて、真核細胞を一時的に感染または形質転換させ、タンパク質を発現するものである。（「真核ウイルスベクター（ＥｕｋａｒｙｏｔｉｃＶｉｒａｌＶｅｃｔｏｒｓ）」ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ、Ｇｌｕｚｍａｎ編、１９８２）。通常は、真核宿主が宿主細胞として利用される。真核細胞は酵母細胞（例えば、Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ）、昆虫細胞（例えば、ショウジョウバエ（Ｄｒｏｓｏｐｈｉｌａ）種）、またはヒト細胞を含む哺乳類細胞で良い。
【００５０】
真核生物系、および哺乳類発現系では、発現された哺乳類タンパク質の翻訳後修飾が可能である。一次転写物のプロセッシング、グリコシル化、リン酸化、および好ましくは遺伝子産物の分泌のための細胞機構を持った真核細胞が使われると良い。そのような宿主細胞株には、ＣＨＯ、ＶＥＲＯ、ＢＨＫ、ＨｅＬａ、ＣＯＳ、ＭＤＣＫ、Ｊｕｒｋａｔ、ＨＥＫ−２９３およびＷＩ３８が含まれる可能性があるが、これらに限定されるわけではない。
【００５１】
本明細書に記載されるライブラリーは、細菌、真菌、植物細胞、昆虫細胞および動物細胞中に含まれ得る。例えば、宿主細胞には、大腸菌（Ｅ．ｃｏｌｉ）、バチルス（Ｂａｃｉｌｌｕｓ）、連鎖球菌（Ｓｔｒｅｐｔｏｍｙｃｅｓ）、またはネズミチフス菌（Ｓａｌｍｏｎｅｌｌａｔｙｐｈｉｍｕｒｉｕｍ）細胞；Ｓｃｃｈａｒｏｍｙｃｅｓｓｐ．のような酵母細胞；ショウジョウバエ（Ｄｒｏｓｏｐｈｉｌａ）Ｓ２細胞またはスポドプテラ（Ｓｐｏｄｏｐｔｅｒａ）Ｓ９細胞；またはＣＨＯ細胞、ＣＯＳ細胞またはＢｏｗｅｓメラノーマ細胞が含まれるがこれらに限定されることはない。
【００５２】
本発明の方法で利用されるライブラリーには、少なくとも約１０^４クローン、および好ましくは約１０^４から１０^１０クローンが含まれる。ライブラリーは、少なくとも約１０^５、１０^６、１０^７、１０^８、１０^９または１０^１０クローンまたはその間の任意の数のクローンが含まれ得る。
【００５３】
本発明の方法で利用されるライブラリーは、約０．０１から１０^１０の、好ましくは約０．１から１０^９の；約０．１を上回る；および約１．０を上回る多様度指数を持つ。
【００５４】
ライブラリーのクローンには、約０．５ｋｂから１０ｋｂ；約１ｋｂから８ｋｂ；約１ｋｂから７ｋｂ等の核酸挿入物が含まれる。当業者はクローン挿入物の片端または挿入物の両端から配列決定を開始できることを理解する必要がある。
【００５５】
配列決定
ライブラリーの適切な数のクローン（例えば、１〜１０００またはそれ以上のクローン、通常は約１００）を入手し、ハイスループットシーケンシング法を用いてその配列を決定する。配列決定の方法は、本発明の限定因子ではない。特定のクローニングされたＤＮＡ配列の配列を同定するために役立つ任意の方法が使用できる。一般に、配列決定は、ＤＮＡ複製の自然な過程を応用したものである。したがって、鋳型（例えば、ベクター）およびプライマー配列が使用される。１つの一般的な鋳型調製および配列決定プロトコールは、細菌のコロニーの自動ピッキングから始まるが、この各コロニーには配列決定反応の鋳型の働きをする別個のＤＮＡクローンが含まれている。選択されたコロニーを培地に入れて、一晩増殖させる。その後、細胞からＤＮＡ鋳型を精製し、水に懸濁する。ＤＮＡの定量後、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ、Ｉｎｃ．、Ｐｒｉｓｍ３７７ＤＮＡシーケンサーのようなシーケンサーを用いてハイスループットシーケンシングが行われる。その後、得られた配列データは、データベースの検索に使用される。
【００５６】
データベース検索およびアライメントアルゴリズム
特定のポリヌクレオチド配列によってコードされる活性を同定または決定するために、本発明では、核酸配列および／または推定アミノ酸配列を含むいくつかのデータベースが利用できる。調べる配列の全てまたは代表的な部分（例えば、約１００の個別クローン）を用いて、同時または別個に配列データベース（例えば、ＧｅｎＢａｎｋ、ＰＦＡＭまたはＰｒｏＤｏｍ）の検索を行なう。そのような配列検索の実施方法は、当技術分野でいくつか知られている。データベースは特定の生物体または生物体の集合に特異的なものであり得る。例えば、線虫（Ｃ．ｅｌｅｇａｎｓ）、アラビドプシス（Ａｒａｂｉｄｏｐｓｉｓ）種、Ｍ．ゲニタリウム（ｇｅｎｉｔａｌｉｕｍ）、Ｍ．ジャナスチー（ｊａｎｎａｓｃｈｉｉ）、大腸菌（Ｅ．ｃｏｌｉ）、インフルエンザ菌（Ｈ．ｉｎｆｌｕｅｎｚａｅ）、酵母（Ｓ．ｃｅｒｅｖｉｓｉａｅ）およびその他用のデータベースが存在する。それから、２つまたはそれ以上の配列の間の相同性を測定するように設計されたアルゴリズムを用いて、クローンの配列データをデータベースの配列と比較する。
【００５７】
そのような配列アラインメント法には、例えばＢＬＡＳＴ（Ａｌｔｓｃｈｕｌら、１９９０）、ＢＬＩＴＺ（ＭＰｓｒｃｈ）（ＳｔｕｒｒｏｃｋおよびＣｏｌｌｉｎｓ、１９９３）、およびＦＡＳＴＡ（ＰｅｒｓｏｎおよびＬｉｐｍａｎ、１９８８）が含まれる。プローブ配列（例えば、クローンの配列データ）は任意の長さで良く、相同性の閾値に基づいて、相同と認識される。閾値は事前に決定することができるが、そうでなくても良い。閾値は特定のポリヌクレオチドの長さに基づき得る。配列のアライメントには、いくつかの異なる手順が使用できる。通常は、Ｓｍｉｔｈ−ＷａｔｅｒｍａｎまたはＮｅｅｄｌｅｍａｎ−Ｗｕｎｓｃｈアルゴリズムが使用される。しかし、上記のようにＢＬＡＳＴ、ＦＡＳＴＡ、ＰＳＩ−ＢＬＡＳＴも使用できる。
【００５８】
例えば、比較ウィンドウを並べるための最適の配列アライメントは、Ｓｍｉｔｈの局所的相同性アルゴリズム（ＳｍｉｔｈおよびＷａｔｅｒｍａｎ、ＡｄｖＡｐｐｌＭａｔｈ、１９８１；ＳｍｉｔｈおよびＷａｔｅｒｍａｎ、ＪＴｅｏｒＢｉｏｌ、１９８１；ＳｍｉｔｈおよびＷａｔｅｒｍａｎ、ＪＭｏｌＢｉｏｌ、１９８１；Ｓｍｉｔｈら、ＪＭｏｌＥｖｏｌ、１９８１）、Ｎｅｅｄｌｅｍａｎの相同性アライメント法（ＮｅｅｄｌｅｍａｎおよびＷｕｎｓｃｈ、１９７０）、Ｐｅａｒｓｏｎの類似性の検索法（ＰｅａｒｓｏｎおよびＬｉｐｍａｎ、１９８８）、これらのアルゴリズムのコンピュータによる実行（ＷｉｓｃｏｎｓｉｎＧｅｎｅｔｉｃｓＳｏｆｔｗａｒｅＰａｃｋａｇｅＲｅｌｅａｓｅ７．０、ＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐ、５７５ＳｃｉｅｎｃｅＤｒ．、Ｍａｄｉｓｏｎ、ＷＩまたはＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐ、ＵｎｉｖｅｒｓｉｔｙｏｆＷｉｓｃｏｎｓｉｎ、Ｍａｄｉｓｏｎ、ＷＩのＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＳｏｆｔｗａｒｅＰａｃｋａｇｅのＧＡＰ、ＢＥＳＴＦＩＴ、ＦＡＳＴＡ、およびＴＦＡＳＴＡ）、または観察によって行い、種々の方法によって作製された最適のアライメント（すなわち、比較ウィンドウに渡って最高の割合の相同性が得られる）を選択する。そして２つの配列（すなわちプローブ配列およびデータベース配列）の類似性が予測できる。
【００５９】
そのようなソフトウェアは、相同性の度合いを種々の欠失、置換、および他の修飾に割り当てて、類似の配列を合わせる。２つまたはそれ以上の核酸またはポリペプチド配列における「相同性」および「同一性」は、任意の数の配列比較アルゴリズムを用いるか、手で並べて目視して測定した場合に、比較ウィンドウまたは指定の領域に渡って、対応が最大になるように比較及び整列させたときに、同一であるか特定の割合で同一のアミノ酸残基またはヌクレオチドを持つ、２つまたはそれ以上の配列またはサブ配列を指す。
【００６０】
配列の比較には、通常は１つの配列が参照配列となり、試験配列がこれと比較される。配列比較アルゴリズムを使用するときは、試験および参照配列をコンピュータに入力し、必要ならばサブ配列座標を指定し、配列アルゴリズムプログラムのパラメータを指定する。デフォルトのプログラムパラメータを使用するか、別のパラメータを指定することができる。そして配列比較アルゴリズムはプログラムパラメータに基づいて、参照配列と比較した試験配列の配列の同一性の割合を計算する。
【００６１】
本明細書における「比較ウィンドウ」は、２０から６００、通常は約５０から２００、さらに通常は約１００から約１５０からなる群から選択される任意の数の連続する位置の区画を指し、ここで１つの配列が同数の連結する位置を持つ参照配列と最適に並べられた後、２つの配列が比較される。
【００６２】
有用なアルゴリズムの一例は、ＢＬＡＳＴおよびＢＬＡＳＴ２．０アルゴリズムであり、これらはＡｌｔｓｃｈｕｌら、Ｎｕｃ．ＡｃｉｄｓＲｅｓ．２５：３３８９−３４０２（１９９７）およびＡｌｔｓｃｈｕｌら、Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３−４１０（１９９０）にそれぞれ記述されている。ＢＬＡＳＴ分析を行なうためのソフトウェアは、ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ｈｔｔｐ：／／ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／）から一般に公開されている。このアルゴリズムでは、まずデータベース配列中の同じ長さのワードと並べたときに一致するか、ある正の値の閾値Ｔを満足する長さＷの短いワードをクエリー配列において同定することにより、高スコア配列ペア（ＨＳＰ）を同定する。Ｔは近傍ワードスコア閾値と呼ばれる（Ａｌｔｓｃｈｕｌら、上記）。これらの初期の近傍ワードヒットは、これらを含むさらに長いＨＳＰを見つけるための検索を開始するシードとなる。ワードのヒットは累積アライメントスコアが増加するかぎり、各配列に沿って両方向に延長される。累積スコアは、ヌクレオチド配列の場合には、パラメータＭ（一致する残基のペアの報酬スコア；常に＞０）を用いて計算される。ＢＬＡＳＴアリゴリズムのパラメータＷ、ＴおよびＸは感度およびアライメントのスピードを決定する。ＢＬＡＳＴＮプログラム（ヌクレオチド配列用）は、デフォルトとしてワード長は１１、期待（Ｅ）は１０、Ｍ＝５、Ｎ＝４、および両鎖の比較を用いる。
【００６３】
ＢＬＡＳＴアルゴリズムは、２つの配列の類似性の統計解析も行なう（ＫａｒｌｉｎおよびＡｌｔｓｃｈｕｌ、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９０：５８７３（１９９３）参照）。ＢＬＡＳＴアルゴリズムが提供する類似性の１つの尺度は、最小合計率（ｓｍａｌｌｅｓｔｓｕｍｐｒｏｂａｂｉｌｉｔｙ）（Ｐ（Ｎ））で、これは２つのヌクレオチド配列の一致が偶然に発生する確率の指標となる。例えば、試験核酸と参照核酸の比較において最小合計率が約０．２未満、より好ましくは約０．０１未満、最も好ましくは約０．００１未満であれば、その核酸は参照核酸と類似していると認められる。
【００６４】
配列の相同性は、２つのポリヌクレオチド配列が比較ウィンドウに渡って相同（ヌクレオチドごとに）であることを意味する。配列の同一性または相同性の割合は、比較ウィンドウに渡って最適に並べられた２つの配列を比較し、両方の配列で同一の核酸塩基（例えば、Ａ、Ｔ、Ｃ、Ｇ、ＵまたはＩ）がある位置の数を決定して一致する位置の数を求め、一致した位置の数を比較ウィンドウ内の位置の合計数（ウィンドウサイズ）で割り、その結果を１００倍して配列の相同性の百分率を求めて計算される。この実質的な相同性は、ポリヌクレオチド配列の特性を意味し、このポリヌクレオチドは少なくとも２５〜５０ヌクレオチドの比較ウィンドウの参照配列と比較して、少なくとも６０％の配列相同性、通常は少なくとも７０％、しばしば８０から９０％、最も一般的には少なくとも９９％の配列相同性を持つが、配列の相同性は、比較ウィンドウに渡って参照配列の合計２０％またはそれ以下の欠失または付加を含む可能性のあるポリヌクレオチド配列を、参照配列と比較して計算される。
【００６５】
十分な相同性を持つ配列は、例えば種および活性の情報を含む、データベース中の注釈によってさらに同定できる。したがって、通常の環境試料では、複数の核酸配列が獲得、クローニング、配列決定され、データベースから対応する相同配列が同定される。この情報は、データベース情報に基づくとその配列またはその配列にコードされる任意のポリペプチドに関連する生物体および活性を含め、ポリヌクレオチドに関連する１つまたは複数の特徴を含む、試料中に存在するポリヌクレオチドのプロフィールを提供する。本明細書で使用される「フィンガープリント」または「プロフィール」は、各試料は、試料およびそれが由来する環境に特徴的なポリヌクレオチドのセットを持つという事実を意味する。そのようなプロフィールは、試料中に存在する配列の量と種類、ならびにポリヌクレオチドが由来する生物体およびそのポリヌクレオチドによってコードされる潜在的活性に関する情報を含み得る。この独特のパターンが各試料のプロフィールまたはフィンガープリントである。
【００６６】
場合によっては、特定のクローニングされたポリヌクレオチド配列の正体および活性が決定されるか示唆される正体または活性がポリヌクレオチドと関連づけられると、その配列を発現するのが望ましいことがある。そのような場合、所望のクローンがまだ発現ベクターにクローニングされていなければ、これを調節制御要素（例えば、プロモーターまたはエンハンサー）の下流に連結し、適切な宿主細胞にクローニングする。発現ベクターは、本発明で使用される対応する宿主細胞とともに、市販されている。
【００６７】
使用できる発現ベクターの代表例としては、ウイルス粒子、バキュロウイルス、ファージ、プラスミド、ファージミド、コスミド、フォスミド、バクテリア人工染色体、ウイルス核酸（例えば、ワクシニア、アデノウイルス、鶏痘ウイルス、偽狂犬病、およびＳＶ４０の誘導体）、Ｐ１ベースの人工染色体、酵母プラスミド、酵母人工染色体、および関心対象の特定の宿主（バチルス、アスペルギルス、酵母等）に特異的な任意の他のベクターがある。したがって、例えばポリペプチドの発現のために種々の発現ベクターの任意の１つにＤＮＡを導入できる。そのようなベクターには、染色体性、非染色体性、および合成のＤＮＡ配列が含まれる。当業者には数多くの適切なベクターが知られており、市販されている。以下のベクターは、例として挙げられる；細菌用：ｐＱＥ７０、ｐＱＥ６０、ｐＱＥ−９（Ｑｉａｇｅｎ）、ｐｓｉＸ１７４、ｐＢｌｕｅｓｃｒｉｐｔＳＫ、ｐＢｌｕｅｓｃｒｉｐｔＫＳ、ｐＮＨ８Ａ、ｐＮＨ１６ａ、ｐＮＨ１８Ａ、ｐＮＨ４６Ａ（Ｓｔｒａｔａｇｅｎｅ）；ｐＴＲＣ９９ａ、ｐＫＫ２２３−３、ｐＫＫ２３３−３、ｐＤＲ５４０、ｐＲＩＴ５（Ｐｈａｒｍａｃｉａ）；真核細胞用：ｐＷＬＮＥＯ、ｐＳＶ２ＣＡＴ、ｐＯＧ４４、ｐＸＴ１、ｐＳＧ（Ｓｔｒａｔａｇｅｎｅ）、ｐＳＶＫ３、ｐＢＰＶ、ｐＭＳＧ、ｐＳＶＬ（Ｐｈａｒｍａｃｉａ）。しかし、宿主中で複製可能で生存できるかぎり、任意の他のプラスミドまたはベクターも使用できる。
【００６８】
発現ベクター中の核酸配列は、ｍＲＮＡ合成を指揮するために、適切な発現制御配列（プロモーター）に機能的に連結される。特に名前が付けられた細菌のプロモーターには、ｌａｃＩ、ｌａｃＺ、Ｔ３、Ｔ７、ｇｐｔ、λＰＲ、ＰＬおよびｔｒｐが含まれる。真核細胞のプロモーターには、ＣＭＶＩＥプロモーター、ＨＳＶチミジンキナーゼ、ＳＶ４０初期および後期プロモーター、レトロウイルスのＬＴＲ、およびマウスメタロチオネイン−Ｉが含まれる。適切なベクターおよびプロモーターの選択は、当業者のレベルの範囲内である。発現ベクターは、翻訳開始のためのリボソーム結合部位および転写終結因子も含む。ベクターには、発現の増幅のために適切な配列も含まれることがある。プロモーター領域は、ＣＡＴ（クロラムフェニコールトランスフェラーゼ）ベクターまたは選択可能マーカーを持つ他のベクターを用いて、任意の遺伝子から選択することができる。
【００６９】
また、発現ベクターは、真核細胞培養ではジヒドロ葉酸レダクターゼまたはネオマイシン耐性、または大腸菌（Ｅ．ｃｏｌｉ）ではテトラサイクリンまたはアンピシリン耐性のような、形質転換した宿主細胞の選択のための表現型の形質を提供する１つまたは複数の選択可能マーカー遺伝子を好ましくは含む。
【００７０】
上述のようにして選択、クローニング、および配列決定した核酸配列は、さらに所望の酵素活性のスクリーニングを行なうライブラリーの調製のために、適切な宿主に導入できる。選択された核酸は、好ましくはすでに適当な制御配列を含むベクター中にあり、そのため、酵素をコードする選択された核酸は、所望の活性を検出するために発現できることになる。宿主細胞は、哺乳類細胞のような高等真核細胞、または酵母細胞のような下等真核細胞、または宿主は細菌細胞のような原核細胞であり得る。適切な宿主の選択は、本明細書の教えから、当業者の範囲であると考えられる。
【００７１】
ライブラリーは、当技術分野で周知の手順によって特定の酵素活性に関してスクリーニングできる。例えば、６つのＩＵＶクラス；酸化還元酵素、転移酵素、加水分解酵素、脱離酵素、異性化酵素、および合成酵素のうちの１つまたは複数についてスクリーニングできる。１つまたは複数のＩＵＢクラスに陽性であること判断された組み換え酵素は、その後さらに具体的な酵素活性についてスクリーニングされる。または、さらに特化した酵素活性についてライブラリーのスクリーニングができる。例えば、加水分解酵素活性の一般的なスクリーニングの代わりに、より具体化した活性、すなわち加水分解酵素が作用する結合の種類についてスクリーニングができる。このようにして、例えば、（ａ）アミド（ペプチド結合）、すなわちプロテアーゼ；（ｂ）エステル結合、すなわちエステラーゼおよびリパーゼ；（ｃ）アセタール、すなわちグリコシダーゼのような１つまたは複数のさらに特定の化学的機能に作用する加水分解酵素を確実にするためにスクリーニングできる。
【００７２】
場合によっては、試料中に存在する核酸配列または単離された特定のクローンの増幅を行なうことが望ましい場合がある。この態様では、核酸配列はＰＣＲ反応または当業者に周知の他の類似反応によって増幅される。そのような増幅反応を行なうために、増幅キットが市販されている。
【００７３】
さらに、アライメントアルゴリズムおよび検索可能なデータベースが、コンピュータのハードウェア、ソフトウェア、またはその組み合せで実行できることを認識することが重要である。結果的に、核酸配列およびその配列にコードされる対応するポリペプチドの単離、処理、および同定は、自動化システムで実行できる。
【００７４】
または、本発明の方法にしたがって獲得、同定、およびクローニングしたポリヌクレオチド配列を変化させることが望ましい場合がある。そのような変化によって、コードされるポリペプチドの活性、特異性、親和性、機能等を修飾（例えば、増加または減少）させるために、ポリヌクレオチド配列を修飾できる。特定の試料中の多様性を増加させるために、ＤＮＡシャッフリングが使用できる。ＤＮＡシャッフリングは、実質的に相同であるが同一ではない配列の間の組み換えを示すが、一部の態様では、ｃｅｒ／ｌｏｘおよび／またはｆｌｐ／ｆｒｔシステムなどのようなＤＮＡシャッフリングは非相同組み換えによるクロスオーバーを伴う可能性がある（例えば、１９９９年８月１７日にＤｒ．ＪａｙＳｈｏｒｔに付与され、ＤｉｖｅｒｓａＣｏｒｐｏｒａｔｉｏｎに譲渡された米国特許第５，９３９，２５０号参照、この開示は参照として本明細書に組み入れられる）。シャッフリング、変異導入またはポリヌクレオチド配列を変化させる種々の方法は、以下に論じられている。
【００７５】
核酸シャッフリングは、ポリヌクレオチドを作製するための、より短いまたは小さいポリヌクレオチドのプールのインビトロまたはインビボ相同組み換えの方法である。関連する核酸配列またはポリヌクレオチドの混合物にセクシャルＰＣＲを施し、ランダムなポリヌクレオチドを提供し、リアセンブリーさせてライブラリーまたは組み換えハイブリッド核酸分子またはポリヌクレオチドの混合集合を作り出す。
【００７６】
カセット変異法とは対照的に、シャッフリングおよびエラープローンＰＣＲのみが、配列のプールに盲目的に（プライマー以外の配列情報なしに）変異を誘導できる。
【００７７】
繰り返し選択に関して、本発明のシャッフリング変異法がエラープローンＰＣＲ単独よりも優れている点は、以下のように説明できる。エラープローンＰＣＲ（セクシャルＰＣＲではない）とＤＮＡシャッフリングを比較する。選択されたプール配列の最初のライブラリーは、多様な起源の関連する配列からなり、単一の遺伝子の任意のタイプの変異誘導（シャッフリングを含む）によって導かれうる。選択された配列の集合は、第１回の活性選択後に得られる。シャッフリングによると、例えば関連する配列全ての自由なコンビナトリアルな会合が可能になる。
【００７８】
この方法は、逆連鎖反応であるという点で、エラープローンＰＣＲとは異なる。エラープローンＰＣＲでは、ポリメラーゼ開始部位の数および分子数は対数的に増加する。しかし、ポリメラーゼ開始部位の配列および分子の配列は、基本的に同じである。これとは対照的に、ランダムなポリヌクレオチドの核酸リアセンブリーまたはシャッフリングでは、開始部位の数およびランダムなポリヌクレオチドの数（サイズではない）は、時間が経つと低下する。プラスミド全体に由来するポリヌクレオチドでは、理論的な終点は単一の大きなコンカテマー分子である。
【００７９】
クロスオーバーは相同部位で起きるため、組み換えは主に同一の配列ファミリーのメンバー間で発生する。これにより著しく不適合（例えば、異なる活性または特異性を持つ）の配列間の組み合せが起こりにくくなる。複数の配列ファミリーを同一の反応でシャッフリングできると考えられる。さらに、一般にシャッフリングは相対的な順序を保存する。
【００８０】
珍しいシャフラントは最良の分子（例えば、活性または特異性が最大）を数多く含んでおり、これらの珍しいシャフラントはその優れた活性または特異性に基づいて選択できる。
【００８１】
１００の異なるポリペプチド配列のプールには、最高１０^３の異なる並べ替え方があり得る。この大きな順列数は、単一のＤＮＡ配列ライブラリーでは表せない。したがって、配列の長さと、望む配列多様性に応じて、複数回のＤＮＡシャッフリングおよび選択が必要だと考えられる。
【００８２】
これとは対照にエラープローンＰＣＲは全ての選択された配列を、同じ相対的方向に保存するので、はるかに小さな変異群を生成することになる。
【００８３】
本発明の方法で使用できる鋳型ポリヌクレオチドは、ＤＮＡまたはＲＮＡでよい。遺伝子のサイズまたは組み合せもしくはリアセンブリーするより短いポリヌクレオチドに応じて、種々の長さであり得る。好ましくは、鋳型ポリヌクレオチドは５０ｂｐから５０ｋｂである。関心対象のタンパク質をコードする核酸を含むベクター全体を本発明の方法で使用できると予測され、実際に使用して成功を収めている。
【００８４】
鋳型ポリヌクレオチドはＰＣＲ反応（米国特許第４，６８３，２０２号および米国特許第４，６８３，１９５号）または他の増幅またはクローニング方法によって得られる。しかし、ＰＣＲ産物のプーリングおよびセクシャルＰＣＲの前にＰＣＲ産物から遊離プライマーを除去するほうが、より効率の良い結果となる可能性がある。セクシャルＰＣＲの前に元のプールからプライマーを適切に除去しないと、クロスオーバークローンの発生頻度が低下する。
【００８５】
鋳型ポリヌクレオチドはしばしば二本鎖である。得られる一本鎖ポリヌクレオチドの領域が互いに相補的であり、ハイブリダイズして二本鎖分子を形成するように、二本鎖核酸分子が推奨される。
【００８６】
鋳型ポリヌクレオチドと同一の領域および鋳型ポリヌクレオチドと異種の領域を持つ一本鎖または二本鎖核酸ポリヌクレオチドを、この段階で鋳型ポリヌクレオチドに添加できる。異なるが関連する２つのポリヌクレオチド鋳型も、この段階で混合できると考えられる。
【００８７】
二本鎖ポリヌクレオチド鋳型および任意の添加された二本鎖または一本鎖ポリヌクレオチドは、約５ｂｐから５ｋｂまたはそれ以上の混合物を提供するために、減速または停止を含めたセクシャルＰＣＲにかけられる。好ましくはランダムポリヌクレオチドのサイズは約１０ｂｐから１０００ｂｐ、さらに好ましくはポリヌクレオチドのサイズは約２０ｂｐから５００ｂｐである。
【００８８】
または、複数のニックを持つ二本鎖核酸も本発明の方法に使用できる。ニックとは、二本鎖核酸のうちの一本鎖に裂け目が入ったものである。そのようなニックの間の距離は、好ましくは５ｂｐから５ｋｂ、より好ましくは１０ｂｐと１０００ｂｐの間である。これによって、セルフプライミングの領域が提供され、より短いポリヌクレオチドが生成して、例えばランダムプライマーから得られるポリヌクレオチドとともに含まれることになる。
【００８９】
任意の特定のポリヌクレオチドの濃度は、ポリヌクレオチド全体の重量の１％以下、より好ましくは任意の特定の核酸配列は、全核酸重量の０．１％以下である。
【００９０】
混合物中の異なるポリヌクレオチドの数は、少なくとも約１００、好ましくは少なくとも約５００、およびさらに好ましくは少なくとも約１０００である。
【００９１】
この段階で、ポリヌクレオチドの混合物の異質性を高めるために、ランダムの二本鎖のより短いポリヌクレオチドに、合成または天然の一本鎖または二本鎖ポリヌクレオチドを添加しても良い。
【００９２】
またこの段階で、セクシャルＰＣＲプロセスで得られたポリヌクレオチドに、無作為に破壊した二本鎖ポリヌクレオチド群を混合し、選択的にさらに１回またはそれ以上のセクシャルＰＣＲサイクルを行なっても良い。
【００９３】
鋳型ポリヌクレオチドに変異を導入することが望ましい場合には、鋳型ポリヌクレオチドと同一の領域、および鋳型ポリヌクレオチドと異種の領域を持つ一本鎖または二本鎖ポリヌクレオチドを、総核酸量と比較して最高２０倍の重量で、より好ましくは一本鎖ポリヌクレオチドを総核酸量と比較して１０倍の重量で、添加することができる。
【００９４】
異なるが関連する鋳型ポリヌクレオチドが望ましい場合には、各鋳型のポリヌクレオチド群を約１：１００以下、より好ましくは約１：４０以下の比で組み合せることができる。例えば、自然変異（例えば、選択している表現型の性質に実質的ではない変化を生じる変異）を除去するために、変異ポリヌクレオチド群を野生型ポリヌクレオチドに戻し交雑することが望ましい場合がある。そのような例では、ランダムに提供されるセクシャルＰＣＲサイクルハイブリッドポリヌクレオチドに添加できるランダムに提供される野生型ポリヌクレオチドの比率は、約１：１から約１００：１、より好ましくは１：１から４０：１である。
【００９５】
ランダムポリヌクレオチドの混合群を変性して一本鎖ポリヌクレオチドを形成させ、再アニーリングさせる。他の一本鎖ポリヌクレオチドと相同領域を持つ一本鎖ポリヌクレオチドのみが、再アニーリングする。
【００９６】
ランダムポリヌクレオチドは、加熱によって変性できる。当業者は二本鎖核酸を完全に変性するために必要な条件を決定できる。好ましくは温度は８０℃から１００℃、より好ましくは温度は９０℃から９６℃である。ポリヌクレオチドの変性に使用できる他の方法には、圧力とｐＨが含まれる。
【００９７】
ポリヌクレオチドは冷却によって再アニーリングされうる。好ましくは温度は２０℃から７５℃、より好ましくは温度は４０℃から６５℃である。平均わずか４つの相同塩基の連続に基づいて高頻度のクロスオーバーが必要ならば、プロセスはより困難にはなるが、低いアニーリング温度を用いて組み換えを起こさせることができる。再生の度合いは、一本鎖ポリヌクレオチド群の間の相同性の度合いに依存する。
【００９８】
ポリエチレングリコール（ＰＥＧ）または塩を添加することによって、再生を加速できる。塩濃度は好ましくは０ｍＭから２００ｍＭ、より好ましくは塩濃度は１０ｍＭから１００ｍＭである。塩はＫＣｌまたはＮａＣｌでよい。ＰＥＧの濃度は好ましくは０％から２０％、より好ましくは５％から１０％である。
【００９９】
アニーリングしたポリヌクレオチドを、次に核酸ポリメラーゼおよびｄＮＴＰ（すなわちｄＡＴＰ、ｄＣＴＰ、ｄＧＴＰおよびｄＴＴＰ）の存在下でインキュベーションする。核酸ポリメラーゼはクレノウフラグメント、Ｔａｑポリメラーゼまたは当技術分野で周知の他の任意のＤＮＡポリメラーゼで良い。
【０１００】
アセンブリーに用いる方法は、クロスオーバーを生じる最低の相同性の度合いに依存する。同一部分が大きい場合には、アニーリング温度４５〜６５℃でＴａｑポリメラーゼが使用できる。同一部分が小さい場合には、アニーリング温度２０〜３０℃でクレノウフラグメントが使用できる。当業者は、クロスオーバーの数を増やすためにアニーリング温度を変えることができる。
【０１０１】
ポリメラーゼを、アニーリング前、アニーリングと同時、またはアニーリング後にランダムなポリヌクレオチドプライマーに添加できる。
【０１０２】
変性、再生、およびポリメラーゼ存在下のインキュベーションのサイクルは、本明細書において核酸のシャッフリングまたはリアセンブリーと呼ばれる。このサイクルは、所望の回数、繰り返される。好ましくはサイクルは２〜５０回、より好ましくは１０から４０回繰り返される。
【０１０３】
得られる核酸は、約５０ｂｐから約１００ｋｂ、好ましくは５００ｂｐから５０ｋｂのより大きな二本鎖ポリヌクレオチドである。
【０１０４】
このより大きなポリヌクレオチドには、鋳型ポリヌクレオチドと同じサイズのポリヌクレオチドが数コピー縦につながったものが含まれている可能性がある。このコンカテマーポリヌクレオチドを変性させて、鋳型ポリヌクレオチドの単一コピーにする。その結果、鋳型ポリヌクレオチドとほぼ同じサイズのポリヌクレオチド群になる。このポリヌクレオチド群は、シャッフリングの前に同一および異種の部分を持った一本鎖または二本鎖ポリヌクレオチドが鋳型ポリヌクレオチドに添加された、混合群になる。これらのポリヌクレオチドは、その後適当なベクターにクローニングされ、その連結反応液は細菌の形質転換に使用される。
【０１０５】
コンカテマーを消化するかわりに、ＰＣＲ（米国特許第４，６８３，１９５号および米国特許第４，６８３，２０２号）を含む種々の方法によって、クローニングの前に単一のポリヌクレオチドの増幅を行なうことにより、より大きなコンカテマーポリヌクレオチドから単一のポリヌクレオチドが得られると考えられる。
【０１０６】
クローニングに使用されるベクターは、所望のサイズのポリヌクレオチドを受け入れるかぎり、特に重要ではない。特定のポリヌクレオチドの発現が望まれる場合には、クローニング媒体は、宿主細胞中でポリヌクレオチドの発現を行なうために、ポリヌクレオチドの挿入部位の隣の転写および翻訳シグナルも含む必要がある。
【０１０７】
得られる細菌集合には、ランダムな変異を持ついくつかの組み換えポリヌクレオチドが含まれている。この混合集合を用いて、所望の組み換えポリヌクレオチドを同定できる。選択の方法は、所望のポリヌクレオチドに依存する。
【０１０８】
例えば、本発明に記述される方法によって同定されたポリヌクレオチドが、第１の結合親和性を持つタンパク質をコードしている場合は、リガンドに対する結合親和性の増加したその後の変異（例えば、シャッフリングされた）配列が望まれる場合がある。そのような場合、その集合またはライブラリー中のポリヌクレオチドの部分の各々によって発現されるタンパク質について、当技術分野で周知の方法によって、リガンドに対する結合能力を試験することができる（パンニング、アフィニティクロマトグラフィー）。薬剤耐性の増加したタンパク質をコードするポリヌクレオチドが望まれる場合には、その集合またはライブラリーのポリヌクレオチドの各々によって発現されるタンパク質の持つ、宿主生物体に薬剤耐性を与える能力について、試験できる。当業者は、所望のタンパク質に関する知識があれば、タンパク質に望ましい性質を与えるポリヌクレオチドを同定するためにその集合を試験することができる。
【０１０９】
当業者は、タンパク質の断片がファージ表面上に融合タンパク質として発現される、ファージディスプレイシステム（Ｐｈａｒｍａｃｉａ、ＭｉｌｗａｕｋｅｅＷＩ）を使用できると考えられる。組み換えＤＮＡ分子は、組み換えＤＮＡ分子によってその一部がコードされている融合タンパク質の転写を誘導するような部位で、ファージＤＮＡにクローニングされる。組み換え核酸分子を含むファージは、細胞中で複製および転写される。融合タンパク質のリーダー配列は、融合タンパク質をファージ粒子の先端に輸送するように指示する。こうして、組み換えＤＮＡ分子が一部をコードする融合タンパク質は、ファージ粒子上にディスプレイされ、上述の方法で検出と選択が可能になる。
【０１１０】
さらに、最初の集合のうち、所望の組み換えタンパク質をコードするＤＮＡをふくむサブ集合のポリヌクレオチドを用いて、核酸シャッフリングのサイクルを何回か実行できると考えられる。このようにして、より高い結合親和性または酵素活性を持つタンパク質も得られる。
【０１１１】
サブ集合からサイレント変異を除去するために、最初またはその後の回の核酸シャッフリングからの核酸サブ集合および野生型ポリヌクレオチドの混合物を用いて、核酸シャッフリングのサイクルを何回か実行できると考えられる。
【０１１２】
開始核酸として、精製された形の任意の核酸供給源が利用できる。したがって、この過程は一本鎖または二本鎖の、メッセンジャーＲＮＡを含むＲＮＡまたはＤＮＡを使用しうる。また、ＤＮＡとＲＮＡを各々一本ずつ含むＤＮＡ−ＲＮＡハイブリッドも利用できる。核酸配列の長さは、変異させる核酸配列のサイズに応じて異なる。好ましくは、特定の核酸配列は５０から５００００塩基対である。関心対象のタンパク質をコードする核酸を含むベクター全体が、本発明の方法で使用できると考えられる。
【０１１３】
任意の特定の核酸配列を用いて本過程によってハイブリッド群を作製できる。本方法のために、特定の核酸配列のハイブリッド配列の小さな集合が存在するまたは利用できることのみが、必要である。
【０１１４】
変異を持つ特定の核酸配列群を、いくつかの異なる方法で作製できる。エラープローンＰＣＲで変異が作製できる。エラープローンＰＣＲは、長い配列に渡って、ランダムに低いレベルで点変異を導入するために、忠実度の低い重合条件を使用する。または、オリゴヌクレオチド指定変異導入によって、鋳型ポリヌクレオチドに変異を導入することもできる。オリゴヌクレオチド指定変異導入では、制限酵素による消化を用いて、短い配列のポリヌクレオチドがポリヌクレオチドから除去され、元の配列から種々の塩基が変化している合成ポリヌクレオチドで置換される。化学的変異導入によってもポリヌクレオチドの配列を変化できる。化学的変異原には、例えば、亜硫酸水素ナトリウム、亜硝酸、ヒドロキシルアミン、ヒドラジンまたは蟻酸が含まれる。ヌクレオチド前駆体のアナログである他の物質には、ニトロソグアニジン、５−ブロモウラシル、２−アミノプリン、またはアクリジンが含まれる。一般に、これらの物質はヌクレオチド前駆体の代わりにＰＣＲ反応に添加され、配列に変異を誘導することになる。プロフラビン、アクリフラビン、キナクリン等のようなインターカレーションする薬剤も使用できる。ポリヌクレオチド配列のランダムな変異導入は、Ｘ線または紫外線の照射によっても誘導できる。一般に、このように変異が誘導されたプラスミドポリヌクレオチドを大腸菌（Ｅ．ｃｏｌｉ）に導入し、ハイブリッドプラスミドのプールまたはライブラリーとして増殖させる。
【０１１５】
または、特定の核酸の小さな混合集合は天然に見られ、同じ遺伝子の異なる対立遺伝子または異なる関連する種由来の同じ遺伝子（すなわち同族遺伝子）を含む可能性もある。または、例えば免疫グロブリン遺伝子のように、１つの種の中に見られる関連ＤＮＡ配列である可能性もある。
【０１１６】
特定の核酸配列の混合集合が作製されたら、当技術分野で周知のテクニックを用いてポリヌクレオチドは直接使用されるか、適当なクローニングベクターに挿入される。
【０１１７】
ベクターの選択は、本発明の方法で使用されるポリヌクレオチド配列のサイズおよび宿主細胞に依存する。本発明の鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス（例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルス等）、またはその選択された部分（例えば、コートタンパク、スパイク糖タンパク質、キャプシドタンパク質）である可能性がある。例えば、コスミドおよびファージミドは、大きなポリヌクレオチドを安定的に増殖できるので、変異させる特定の核酸配列が、より大きい場合に好ましい。
【０１１８】
特定の核酸配列の混合集合がベクターにクローニングされたら、クローン増幅できる。発現されたポリペプチドをスクリーニングすることによって、有用性は容易に決定できる。
【０１１９】
本発明のＤＮＡシャッフリング法は、未知の配列のプールに対して盲目的に実行できる。リアセンブリー混合物にオリゴヌクレオチド（リアセンブリーしている配列と相同な末端を持つ）を添加することによって、任意の配列混合物を、任意の特定の位置で、別の配列混合物に組み込むことができる。したがって、合成オリゴヌクレオチド、ＰＣＲポリヌクレオチドまたは遺伝子全体の混合物でも、定められた位置で別の配列ライブラリー中に混合できる。１つの配列（混合物）の挿入は、鋳型の別の部分における配列の挿入とは独立している。したがって、組み換えの度合い、必要な相同性、およびライブラリーの多様性は、リアセンブリーされるＤＮＡの長さとともに、独立して同時に変化させられる。
【０１２０】
シャッフリングには、多様性領域を分離する相同領域の存在が必要である。シャッフリングには、骨組みのようなタンパク質構造が特に適している可能性がある。保存された骨組みは、自己集合によって全体の折畳みを決定し、特定の結合を仲介する比較的制限の少ないループを提示する。そのような骨組みの例には、当技術分野で周知の免疫グロブリンβバレル、および４ヘリックスバンドルがある。このシャッフリングは、結合のための種々の変異配列の組み合せを用いて、骨組み様タンパク質を作製するために使用できる。
【０１２１】
インビトロシャッフリング
インビトロシャッフリングによって、標準的な遺伝的交配と同等なものも行なうことができる。例えば、ハイブリッドの核酸を野生型核酸と繰返し混合し、関心対象の変異を選択することによって、「分子戻し交雑」が行なえる。従来の育種と同様に、このアプローチを用いて、選択したバックグラウンドに種々の供給源からの表現型を組み合せることができる。これは例えば、選択されない特徴（例えば、免疫原性）に影響を与える中立変異を除去するために、有用である。したがって、これはタンパク質中のどの変異が向上した生物活性に関与していて、どれが関与していないかを決定するために有用であるが、これはエラープローン変異導入またはカセット変異法にはない利点である。
【０１２２】
小さなランダムポリヌクレオチドの混合物から、大きな機能的遺伝子を正しく組み立てることが可能である。この反応は、化石の高度に断片化されたＤＮＡの遺伝子のリアセンブリーに有用である。また、化石のランダムな核酸断片は、関連する種の類似した遺伝子のポリヌクレオチドと組み合せることができる。
【０１２３】
本発明の方法は、種々の研究および診断用途に必要とされる、単一の細胞のゲノム全体のインビトロ増幅にも使用できる。ＰＣＲによるＤＮＡ増幅は、通常約４０ｋｂの配列を含む。ＰＣＲによって大腸菌（Ｅ．ｃｏｌｉ）（５，０００ｋｂ）のようなゲノム全体を増幅するためには約２５０のプライマーが必要であり、１２５の４０ｋｂポリヌクレオチドが産生される。一方で、セクシャルＰＣＲサイクルを用いたゲノムのポリヌクレオチドのランダム作製後に小さなポリヌクレオチドをゲル精製すると、多数の潜在的プライマーが提供される。この小さなランダムポリヌクレオチド混合物を、単独または鋳型としてのゲノム全体と共にＰＣＲ反応で使用すると、逆連鎖反応が起こり、その理論的終点はゲノムの多数のコピーを含む単一のコンカテマーとなる。
【０１２４】
ランダムポリヌクレオチドのみを使用すると、コピー数は１００倍増幅、平均ポリヌクレオチドサイズは５０ｋｂ以上が得られる。多くの小さなポリヌクレオチドの重複によって、より大きなコンカテマーが得られると考えられる。合成プライマーを用いて得られた特定のＰＣＲ産物の質は、増幅されないＤＮＡから得られた産物と区別がつかないようになる。このアプローチは、ゲノムのマッピングに有用になると期待される。
【０１２５】
シャッフリングするポリヌクレオチドは、実施者の裁量によって、ランダムまたは非ランダムポリヌクレオチドとして作製できる。さらに、本発明は広範囲のポリヌクレオチドサイズおよびタイプに応用できるシャッフリング法を提供し、これにはより大きなポリヌクレオチドのリアセンブリーにおける構成単位として用いるポリヌクレオチドモノマーの作製段階が含まれる。例えば、構成単位は遺伝子断片であったり、遺伝子全体、遺伝子経路、またはその任意の組み合せを含む可能性がある。
【０１２６】
インビボシャッフリング
インビボシャッフリングの１つの態様では、特定の核酸配列の混合群が、少なくとも２つの異なる核酸配列が各宿主細胞に存在するような条件で、細菌または真核細胞中に導入される。ポリヌクレオチドは、種々の方法で宿主細胞に導入できる。宿主細胞は、例えば塩化カルシウム処理のような当技術分野で周知の方法を用いて、より小さなポリヌクレオチドで形質転換できる。ポリヌクレオチドがファージゲノムに挿入される場合は、特定の核酸配列を持つ組み換えファージゲノムを宿主細胞にトランスフェクトできる。または、電気穿孔、トランスフェクション、リポフェクション、バイオリスティック、接合等を用いて核酸配列を宿主細胞に導入できる。
【０１２７】
一般に、この態様では、宿主細胞中で安定に配列を複製できるベクター中に、特定の核酸配列が存在する。また、ベクターを持つ宿主細胞が選択できるように、ベクターにはマーカー遺伝子がコードされていると考えられる。これにより、変異を受けた特定の核酸配列が、宿主細胞への導入後に回収できるようになる。しかし、特定の核酸配列の混合群全体が、ベクター配列に存在する必要はないと考えられる。むしろ、ポリヌクレオチドの宿主細胞への導入後に、各宿主細胞がその中に少なくとも１つの特定の核酸配列を持つために十分な数の配列のみがベクターにクローニングされればよい。また、特定の核酸配列の集合のサブセットをベクターにクローニングするよりも、このサブセットは既に宿主細胞中に安定に組み入れられている可能性もある。
【０１２８】
宿主細胞中に同一領域を持つ２つのポリヌクレオチドが挿入されると、２つのポリヌクレオチドの間で相同組み換えが起きることが分かっている。２つの変異した核酸配列の間のそのような組み換えは、場合によっては二重または三重ハイブリッドを生じることがある。
【０１２９】
変異した核酸配列のいくつかが、直線状の核酸分子上に存在すると、組換え頻度が高まることも分かっている。したがって、１つの態様では、特定の核酸配列のいくつかは、直線状ポリヌクレオチド上に存在する。
【０１３０】
形質転換後、宿主細胞形質転換体は、所望の性質を持つ変異した核酸配列を含む宿主細胞形質転換体を同定するために、選択を受ける。例えば、特定の薬剤に対する耐性の増加が望まれる場合には、形質転換した宿主細胞を、濃度を上げたその特定の薬剤にさらし、薬剤耐性の上昇を与える変異タンパクを作製する形質転換体が選択される。特定のタンパク質が受容体に結合する能力を強化したい場合には、形質転換体のタンパク質の発現を誘導し、得られたタンパク質を当技術分野で周知の方法によりリガンド結合アッセイで検定し、リガンドに対する結合が強化した変異群のサブセットを同定する。または、正しいプロセッシングを保証するためにタンパク質を別のシステムで発現しても良い。
【０１３１】
所望の特徴を持つ第１の組み換え核酸配列（娘配列）のサブセットが同定されたら、２回の組み換えを行なう。第２ラウンドの組み換えでは、組み換えられた核酸配列を、元の変異導入された核酸配列（親配列）と混合し、上述のサイクルを繰り返すことができる。このようにして、増強した特徴を持つまたは増強した特性を持つタンパク質をコードする第２の組み換え核酸配列のセットが同定できる。このサイクルは、所望の回数繰り返すことができる。
【０１３２】
第２またはその後の組み換えサイクルにおいては、戻し交雑が行われると考えられる。分子の戻し交雑は、所望の核酸配列を、多数の野生型配列と混合し、少なくとも１つの野生型核酸配列および変異核酸配列が、形質転換後の同一の宿主細胞に存在するようにすることで実行できる。野生型の核酸配列との組み換えによって、免疫原性のような選択されない特徴に影響を与える中立変異は除去されるが、選択される特徴は除去されない。
【０１３３】
本発明の別の態様では、第１ラウンドの間に、宿主細胞への導入前にＰＣＲ増幅を減速または停止することにより、より小さなポリヌクレオチドとして特定の核酸配列のサブセットが作製できると考えられる。ポリヌクレオチドのサイズは、他の配列と相同組み換えを起こすように、他の配列と同一の領域をいくつか含むほど大きい必要がある。ポリヌクレオチドのサイズは０．０３ｋｂから１００ｋｂ、より好ましくは０．２ｋｂから１０ｋｂである。その後のラウンドでは、宿主細胞への導入前にＰＣＲポリヌクレオチドを作製するために、前ラウンドより選択された配列以外の、全ての特定の核酸配列が使用できると考えられる。
【０１３４】
より短いポリヌクレオチド配列は、一本鎖または二本鎖である。核酸の鎖を分離するために適当な反応条件は、当技術分野で周知である。
【０１３５】
このプロセスの段階は、無限に繰り返すことができ、作製可能な潜在的ハイブリッドの数でのみ限定される。
【０１３６】
したがって、変異した鋳型核酸の最初のプールまたは集合は、大腸菌（Ｅ．ｃｏｌｉ）のような細菌中で複製可能なベクター中にクローニングされる。この特定のベクターは、大腸菌（Ｅ．ｃｏｌｉ）中で自己複製が可能でありさえすれば、特に重要ではない。１つの態様では、ベクターはベクターに結合された変異核酸によってコードされる任意のタンパク質の発現および作製ができるように設計されている。またベクターが選択可能マーカーをコードする遺伝子を含むことも好ましい。
【０１３７】
変異核酸配列のプールを含むベクターの集合は、大腸菌（Ｅ．ｃｏｌｉ）宿主細胞に導入される。ベクターの核酸配列は、ファージの場合は形質転換、トランスフェクション、または感染によって導入できる。細菌の形質転換に使用するベクターの濃度は、各細胞にいくつかのベクターが導入されるようにする。細胞中に入ると、相同組み換えの効率は、種々のベクターの間で相同組み換えが起きるようになっている。その結果、元の親変異配列とは異なる変異の組み合せを持つハイブリッド（娘）が生成する。その後、宿主細胞をクローン複製し、ベクター上に存在するマーカー遺伝子の選択をする。プラスミドを持つ細胞のみが、選択条件下で増殖する。ベクターを含む宿主細胞は、好ましい変異が存在するか検定する。
【０１３８】
所望の特徴を与える特定の娘変異核酸配列が同定されたら、すでにベクターに結合しているまたはベクターから分離している核酸が単離される。その後この核酸は、核酸の第１または親集合と混合され、サイクルが繰り返される。
【０１３９】
ポリヌクレオチドとしてまたは同一のベクターにクローニングされた、親変異核酸集合は、既に娘核酸を含んでいる宿主細胞に導入される。細胞中で組み換えを起こすようにし、次の世代の組み換え体、孫が上述の方法で選択される。このサイクルは、所望の特徴を持つ核酸またはタンパク質が得られるまで、何度も繰り返される。その後のサイクルでは、ハイブリッドに添加される変異配列の集合は、親ハイブリッドまたはその後の世代に由来すると考えられる。
【０１４０】
別の態様では、本発明は、中立変異を除去するために、得られた組み換え核酸の「分子」戻し交雑を行なう方法を提供する。中立変異とは、核酸またはペプチドに所望の性質を与えない変異である。しかし、そのような変異は望ましくない特徴を核酸またはペプチドに与えうる。したがって、そのような中立変異を除去することが望ましい。本発明の方法は、その方法を提供する。
【０１４１】
この態様では、本発明の方法で所望の特徴を持つハイブリッド核酸が得られたら、核酸、核酸を持つベクター、またはベクターおよび核酸を含む宿主細胞が単離される。
【０１４２】
その後、核酸またはベクターは、過剰量の野生型核酸とともに宿主細胞に導入される。ハイブリッドの核酸および野生型配列の核酸の組み換えが起きる。得られた組み換え体に、ハイブリッド核酸と同じ選択が行われる。所望の特徴を保持する組み換え体のみが、選択される。所望の特徴を提供しない任意のサイレント変異は、野生型ＤＮＡとの組み換えで失われる。このサイクルは、全てのサイレント変異が除去されるまで繰り返すことができる。
【０１４３】
エキソヌクレアーゼ媒介性リアセンブリー
別の態様では、本発明は、子孫ポリヌクレオチド（例えば、ポリペプチドまたは遺伝子経路を作製するように発現できるキメラ子孫ポリヌクレオチド）を形成するために、少なくとも２つのポリヌクレオチドを、シャッフリング、アセンブリー、リアセンブリー、組み換え、および／または連結する方法を提供する。ある１つの態様では、二本鎖ポリヌクレオチド（例えば、ハイブリダイゼーションパートナーとして、２つの一本鎖配列が互いにハイブリダイズしたもの）をエキソヌクレアーゼで処理して、２本の鎖のうちの１本からヌクレオチドを遊離させ、別のパートナーとのハイブリダイゼーションに残りの鎖が使用できるように、残りの鎖からパートナーを除去する。
【０１４４】
ある特定の局面では、二本鎖ポリヌクレオチドの末端（ポリヌクレオチド配列または非ポリヌクレオチド配列の一部またはこれに結合している可能性がある）をエキソヌクレアーゼ活性の供給源にさらす。エキソヌクレアーゼ活性の有用な供給源は、３’エキソヌクレアーゼ活性を持つ酵素、５’エキソヌクレアーゼ活性を持つ酵素、３’エキソヌクレアーゼ活性および５’エキソヌクレアーゼ活性の両方をもつ酵素、およびその任意の組み合せである。エキソヌクレアーゼは、直線状の二重鎖ポリヌクレオチドの片方または両方の末端、および２つ以上の末端を持つ分岐ポリヌクレオチドの１つ又は全ての末端から、ヌクレオチドを遊離させるために使用できる。
【０１４５】
反対に、ポリヌクレオチド構成単位のシャッフリング、アセンブリー、リアセンブリー、組み換えおよび／または連結のために非酵素段階も使用でき、これは作業試料を変性（または「溶解」）条件（例えば、温度、ｐＨ、および／または塩条件の変化による）にさらし、二本鎖ポリヌクレオチドの作業セットを一本鎖に溶解することを含む。シャッフリングのためには、単一のポリヌクレオチド鎖が異なるハイブリダイゼーションパートナーとのアニールにある程度参加することが望ましい（変性ステップ前の元のパートナーとの排他的アニールに戻るだけではなく）。しかし、反応容器中に元のハイブリダイゼーションパートナーが存在することは、一本鎖ポリヌクレオチドが元のパートナーとアニールし、元の二本鎖ポリヌクレオチドを再生することを排除するものではなく、時にはこれを有利にする。
【０１４６】
二本鎖ポリヌクレオチド構成単位を変性させアニーリングさせるこの非酵素シャッフリングステップとは反対に、本発明は変性を必要としない、エキソヌクレアーゼに基づく手法を提供する。むしろ、変性条件を避け、二本鎖ポリヌクレオチド基質をアニールした（すなわち非変性）状態で維持することは、エキソヌクレアーゼ（例えば、エキソヌクレアーゼＩＩＩおよびレッドα遺伝子産物）の作用のための必要条件である。また、反対に、他の一本鎖ポリヌクレオチド配列にハイブリダイズできる一本鎖ポリヌクレオチドの生成は、ハイブリダイゼーションパートナーの１つにおける共有結合の開裂および配列の破壊の結果である。例えば、エキソヌクレアーゼＩＩＩ酵素を用いて１つのハイブリダイゼーション鎖における３’末端ヌクレオチドを遊離させることができ（そのポリヌクレオチド鎖における共有加水分解を行なう）；これにより残りの一本鎖が新しいパートナーとハイブリダイゼーションするのが容易になる（元のパートナーが共有開裂を受けたため）。
【０１４７】
特に本開示の手法のために、より好適な速度および／またはより強い特異性および／または望まない活性のより少ない酵素が、発見、最適化（例えば、方向づけられた進化による操作）、または発見および最適化の両方をなされることができるのは、特に認識される。実際、本発明はそのようなデザイナー酵素の発見および／または開発を促進する可能性があると期待される。
【０１４８】
さらに、必要に応じて、二重鎖ポリヌクレオチドの末端を保護したり、使えるエキソヌクレアーゼの所望の酵素活性に感受性にしたりできることは認識され得る。例えば、３’がオーバーハングしている二重鎖ポリヌクレオチド末端は、エキソヌクレアーゼＩＩＩのエキソヌクレアーゼ活性に感受性はない。しかし、種々の方法でこれをエキソヌクレアーゼＩＩＩのエキソヌクレアーゼ活性に感受性にできる；例えば、ポリメラーゼ処理をしてブラントにする、ブラントエンドまたは５’のオーバーハングを提供するように開裂する、他の二重鎖ポリヌクレオチドと結合（連結またはハイブリダイズ）させてブラントエンドまたは５’オーバーハングを提供する、一本鎖ポリヌクレオチドとハイブリダイズさせてブラントエンドまたは５’オーバーハングを提供するようにする、または任意の種々の手法によって修飾できる。
【０１４９】
１つの局面では、直線状二重鎖ポリヌクレオチドの片端または両端にエキソヌクレアーゼを作用させ、完成、完成近く、または部分的完成まで進ませる。エキソヌクレアーゼ活性が完成まで進むと、その結果は各５’オーバーハング部分の長さは「ランデブーポイント」（ポリヌクレオチドの中点の近く）と考えられるものの方向に、ポリヌクレオチドの中央領域に向かって伸長する。最終的には、各々が元の二重鎖ポリヌクレオチドの長さの約半分である、一本鎖ポリヌクレオチド（分離できる）が形成される。
【０１５０】
したがってこのエキソヌクレアーゼを介する手法は、ポリヌクレオチド構成単位のシャッフリング、アセンブリーおよび／またはリアセンブリー、組み換えおよび、連結に有用で、そのポリヌクレオチド構成単位は、最高１０塩基、または数１０塩基、または数１００塩基、または数１０００塩基、または数万塩基、または数十万塩基、または数百万塩基、またはそれ以上の長さであり得る。
【０１５１】
エキソヌクレアーゼの基質は、二重鎖ポリヌクレオチドを断片化して作製できる。断片化は、機械的手法（例えば、剪断、超音波処理等）、酵素的手法（例えば、制限酵素を使用）、およびその組み合せによって、実行できる。より大きなポリヌクレオチドの断片は、ポリメラーゼを介する合成によっても作製できる。
【０１５２】
エキソヌクレアーゼ活性を持つ酵素の別の例には、レッドαおよびヘビ毒ホスホジエステラーゼが含まれる。レッドα遺伝子産物（λエキソヌクレアーゼとも呼ばれる）は、バクテリオファージλに由来する。レッドα遺伝子産物は、５’リン酸化末端から漸進的に作用し、二重鎖ＤＮＡからモノヌクレオチドを遊離させる（ＴａｋａｈａｓｈｉおよびＫｏｂａｙａｓｈｉ、１９９０）。ヘビ毒ホスホジエステラーゼ（Ｌａｓｋｏｗｓｋｉ、１９８０）はスーパーコイルＤＮＡを素早く開くことができる。
【０１５３】
非確率的連結リアセンブリー
１つの局面では、本発明は合成連結リアセンブリー（ＳＬＲ）と呼ばれる非確率的方法を提供する。これは核酸構成単位がランダムにシャッフリング、連結、またはキメラ化されるのではなく、非確率的に組み立てられるという点以外は、確率的シャッフリングにある程度関連している。
【０１５４】
ＳＬＲ法はシャッフリングされるポリヌクレオチド間の高レベルの相同性の存在に依存しない。本発明は１０^１００以上のキメラからなる子孫分子のライブラリー（セット）を非確率的に作製するために使用できる。おそらく、ＳＬＲは１０^１０００以上の異なる子孫キメラからなるライブラリーの作製にも使用できる。
【０１５５】
したがって、本発明は１つの局面では、設計によって選択された全体の組立順序を持つ完成したキメラ核酸分子のセットを作製する非確率的方法を提供する。この方法は、相互に適合する連結可能な末端を持った複数の特定の核酸構成単位を設計によって作製し、設計した全体の組立順序が実現するようにこれらの核酸構成単位を組み立てる段階を含む。
【０１５６】
組み立てられる核酸構成単位の相互に適合する連結可能な末端は、事前に定められた順序で構成単位を結合させることができるならば、この順序立った組立で「使用できる」と考えられる。したがって１つの局面では、核酸構成単位が結合される全体の組立順序は、連結可能末端の設計によって指定され、複数の組立段階が使用される場合には、核酸構成単位が結合される全体の組立順序は、やはり組立段階の逐次的順序によって指定される。本発明の１つの態様では、アニールされた構成単位は、リガーゼ（例えば、Ｔ４ＤＮＡリガーゼ）等の酵素で処理され、構成単位の共有結合が作製される。
【０１５７】
別の態様では、核酸構成単位の設計は、完成したキメラ核酸分子の子孫セットを作製する基礎となる、祖先核酸鋳型のセットの配列分析により得られる。したがってこれらの祖先核酸鋳型は、変異導入、すなわちキメラ化またはシャッフリングする、核酸構成単位の設計に役立つ配列情報源となる。
【０１５８】
１つの具体例では、本発明は関連する遺伝子ファミリーおよびそれにコードされる関連する産物ファミリーのキメラ化を提供する。１つの特定の具体例では、コードされる産物は酵素である。本発明の局面にしたがって変異導入できる酵素ファミリーの代表例には、以下の酵素およびその機能がある：リパーゼ／エステラーゼ、プロテアーゼ、グリコシダーゼ／グリコシルトランスフェラーゼ、ホスファターゼ／キナーゼ、モノ／ジオキシゲナーゼ、ハロペルオキシダーゼ、リグニン、ペルオキシダーゼ／ジアリールプロパンペルオキシダーゼ、エポキシドヒドロラーゼ、ニトリルヒドラターゼ／ニトリラーゼ、トランスアミナーゼ、アミダーゼ／アシラーゼ。これらの具体例は、本発明の特定の局面を説明するものであるが、限定したり、開示される発明の範囲を制限するものではない。
【０１５９】
したがって本発明の１つの局面によると、１つまたは複数の境界点を選択するために、本発明の方法を用いて同定された複数の先祖核酸鋳型の配列を並べ、境界点を相同領域に見つけることができる。境界点は、作製する核酸構成単位の境界を明らかにするために使用できる。したがって、先祖分子中に同定され選択された境界点は、子孫分子の組立の潜在的キメラ化ポイントになる。
【０１６０】
通常利用できる境界点は、少なくとも２つの祖先鋳型が共有する相同領域（少なくとも１つのヌクレオチド塩基からなる）であるが、祖先鋳型の少なくとも半数、祖先鋳型の少なくとも３分の２、祖先鋳型の少なくとも４分の３、および好ましくはほぼ全ての祖先鋳型に共通の相同領域であり得る。さらに好ましくは、役立つ境界点は、全ての祖先鋳型に共通の相同領域である。
【０１６１】
好ましい態様では、網羅的なライブラリーを作製するために、連結組立プロセスは網羅的に行われる。つまり、核酸構成単位の全ての可能な順序の組み合せが、完成したキメラ核酸分子セット中に表される。同時に、各組み合せにおける組立順序（すなわち、各完成したキメラ核酸の５’から３’配列に向けての、各構成単位の組立順序）は設計（または非確率的）による。本発明の非確率的性質のために、望ましくない副産物の可能性は非常に低くなっている。
【０１６２】
別の好ましい態様では、本発明は、例えば、体系的に、例えば、１つずつ、スクリーニングできる区画を持つ、体系的に区画化したライブラリーを作製するために、連結リアセンブリープロセスが、体系的に行われることを規定する。つまり、特定の核酸構成単位の選択的および賢明な使用と、逐次的な段階的組立反応の選択的および賢明な使用により、いくつかの反応容器の各々において子孫産物の特定のセットが作製される実験設計が実現することを、本発明は規定する。これにより、体系的な試験およびスクリーニング手順が実行される。したがって、小さなグループにおいて、非常に多数の子孫分子を体系的に試験することが可能になる。
【０１６３】
特に祖先分子間の相同性が非常に低い場合に、非常に柔軟でかつ網羅的で体系的なキメラ化を実行する能力があるため、本発明は多数の子孫分子を含むライブラリー（またはセット）の作製を提供する。本連結リアセンブリー発明の非確率的性質のために、作製される子孫分子は好ましくは、設計によって選択された全体の組立順序を持つ完成したキメラ核酸分子のライブラリーを含む。１つの特定の態様では、そのような作製されたライブラリーには１０^３から１０^１０００以上の異なる子孫分子種が含まれる。
【０１６４】
１つの局面では、上述のようにして作製された完成したキメラ核酸分子のセットは、ポリペプチドをコードするポリヌクレオチドを含む。１つの態様では、このポリヌクレオチドは遺伝子であり、人工の遺伝子である可能性もある。別の態様では、このポリヌクレオチドは遺伝子経路であり、人工の遺伝子経路である可能性もある。本発明は、本発明によって作製された１つまたは複数の人工遺伝子が、真核生物（植物を含む）中で作用できる経路のような、人工遺伝子経路に組み入れられることを規定する。
【０１６５】
別の具体例では、構成単位が作製されるステップの合成的な性質のために、後に選択的にインビトロプロセス（例えば、変異導入による）またはインビボプロセス（例えば、宿主生物体の遺伝子スプライシング能力を利用）によって除去できるヌクレオチド（例えば、例えばコドンまたはイントロンまたは調節配列のような、１つまたは複数のヌクレオチド）の導入と設計が可能である。多くの場合、役立つ境界点を作製する潜在的利点に加えて、他の多くの理由のためにこれらのヌクレオチドの導入が望ましい場合があることが認識される。
【０１６６】
したがって、別の態様では、本発明はイントロンを導入するために核酸構成単位が使用できることを規定する。したがって、本発明は本発明の人工遺伝子に機能的イントロンを導入できることを規定する。本発明は機能的イントロンは本発明の遺伝子経路にも導入できることを規定する。したがって、本発明は１つ（またはそれ以上）の人工的に導入されたイントロンを含む人工遺伝子である、キメラポリヌクレオチドの作製を提供する。
【０１６７】
したがって、本発明は１つ（またはそれ以上）の人工的に導入されたイントロンを含む人工遺伝子経路である、キメラポリヌクレオチドの作製も提供する。好ましくは、自然に発生するイントロンが遺伝子スプライシングにおいて機能するのと同様に、人工的に導入されたイントロンは、１つまたは複数の宿主細胞中で遺伝子スプライシングにおいて機能する。本発明は組み換えおよび／またはスプライシングのために、宿主生物体に導入される人工イントロン含有ポリヌクレオチドを作製する過程を提供する。
【０１６８】
本発明を用いて作製される人工遺伝子は、別の核酸との組み換えの基質にもなる。同様に、本発明を用いて作製される人工遺伝子経路は、別の核酸との組み換えの基質にもなる。好ましい例では、組み換えは、人工イントロン含有遺伝子と組み換えパートナーとなる核酸との間の相同領域によって促進されるか、ここで起きる。特に好ましい例では、組み換えパートナーも、人工遺伝子または人工遺伝子経路を含め、本発明によって作製された核酸である。組み換えは、人工遺伝子中に人工的に導入された１つ（またはそれ以上）のイントロンに存在する相同領域によって促進されるか、ここで起きる。
【０１６９】
本発明の合成連結リアセンブリー法は、複数の核酸構成単位を使用するが、その各々は好ましくは２つの連結可能末端を持つ。各核酸構成単位の２つの連結可能末端は、２つのブラントエンド（オーバーハングしたヌクレオチドがない）、または好ましくは１つのブラントエンドおよび１つのオーバーハング、より好ましくは２つのオーバーハングである。
【０１７０】
この目的に利用できるオーバーハングは、３’オーバーハングまたは５’オーバーハングである。したがって、核酸構成単位は、１つの３’オーバーハングまたは１つの５’オーバーハングまたは２つの３’オーバーハングまたは２つの５’オーバーハングを持つ可能性がある。核酸構成単位が組み立てられて、完成したキメラ核酸分子になる全体の順序は、目的を持った実験設計によって決定されるのであり、ランダムではない。
【０１７１】
１つの好ましい態様では、核酸構成単位は、２つの一本鎖核酸（一本鎖オリゴとも呼ばれる）を化学合成し、この２つがアニーリングして二本鎖核酸構成単位を形成するようにこれらを接触させることによって、作製される。
【０１７２】
二本鎖核酸構成単位は、種々のサイズであり得る。これらの構成単位のサイズは、小さいか、大きい可能性がある。構成単位の好ましいサイズは、１塩基対（オーバーハングを含まないで）から１００，０００塩基対（オーバーハングを含まないで）に渡る。他の好ましいサイズも提供され、下限は１ｂｐから１０，０００ｂｐ（その間の全ての整数値を含む）、および上限は２ｂｐから１００，０００ｂｐ（その間の全ての整数値を含む）である。
【０１７３】
本発明に役立つ二本鎖核酸構成単位を作製するために、多くの方法が存在する；これらは当技術分野で周知であり、当業者によって容易に実行できる。
【０１７４】
１つの態様では、二本鎖核酸構成単位は、まず２本の一本鎖核酸を作製し、これらをアニールさせて二本鎖核酸構成単位を形成させる。二本鎖核酸構成単位の２つの鎖は、オーバーハングを形成する部分以外は全てのヌクレオチドが相補的であり、オーバーハング以外はミスマッチが含まれない可能性がある。別の態様では、二本鎖核酸構成単位の２本の鎖は、オーバーハングを形成する部分以外の全てのヌクレオチドよりも少ない部分で相補的である。したがって、この態様では二本鎖核酸構成単位はコドンの縮重を導入するために使用できる。好ましくはコドンの縮重は、１つまたはそれ以上のＮ，Ｎ，Ｇ／Ｔカセットまたは１つまたはそれ以上のＮ，Ｎ，Ｎカセットを用いて、本明細書に記述される部位飽和変異導入を用いて導入される。
【０１７５】
本発明のインビボ組み換え法は、特定のポリヌクレオチドまたは配列の、未知のハイブリッドまたは対立遺伝子のプールに盲目的に実行できる。しかし、特定のポリヌクレオチドの実際のＤＮＡまたはＲＮＡ配列を知ることは必要ではない。
【０１７６】
遺伝子の混合集団内で組み換えを使用する手法は、例えば、インターロイキンＩ、抗体、ｔＰＡ、および成長ホルモンのような任意の有用なタンパク質の作製に役立ち得る。この手法は、特異性または活性が変化したタンパク質を作製するために使用できる。この手法は、例えば、遺伝子のプロモーター領域、イントロン、エクソン、エンハンサー配列、３１非翻訳領域または５１非翻訳領域のような、ハイブリッド核酸配列の作製にも有用な可能性がある。したがって、この手法は発現率が上昇した遺伝子を作製するために使用できる。この手法は、ＤＮＡの繰り返し配列の研究にも有用である可能性がある。最後に、この手法はリボザイムまたはアプタマーを変異させるために役立つ可能性がある。
【０１７７】
末端選択
本発明はポリヌクレオチドの開始セットからポリヌクレオチドのサブセットを選択する方法を提供するが、その方法は、作業ポリヌクレオチドのどこかに存在する１つまたは複数の選択可能な特徴（または選択マーカー）を区別する能力に基づき、各選択可能ポリヌクレオチドを（正の選択）および／または選択可能ポリヌクレオチドではないものを（負の選択）の選択ができるものである。好ましい局面では、選択可能ポリヌクレオチドの末端領域に一部または全体が存在する選択マーカーを利用する末端選択と呼ばれる方法が提供され、そのような選択マーカーは「末端選択マーカー」と呼ばれる。
【０１７８】
末端選択は、同じポリヌクレオチドの中でさえも、自然に発生する配列の検出、実験的に導入された配列（本明細書に記述されるおよび記述されない任意の変異導入手法によるものを含む）の検出、またはその両方に基づくものであり得る。末端選択マーカーは、構造的選択マーカーまたは機能的選択マーカー、または構造と機能の両方の選択マーカーであり得る。末端選択マーカーは、放射能、酵素活性、蛍光、光学的特徴、磁気的性質（例えば、磁気ビーズの使用）、免疫反応性、およびハイブリダイゼーションの検出に基づく方法を用いて選択されるマーカーを含む、ポリヌクレオチド配列、またはポリペプチド配列、または任意の化学構造、または生物学的もしくは生化学的タグを含み得る。
【０１７９】
末端選択は、変異を導入する任意の方法と組み合せて行なうことができる。そのような変異導入法には、本明細書（上記および下記）に記述される方法が含まれるが、これらに限定されるわけではない。そのような方法の、限定することのない具体例として、本明細書または当技術分野において以下の任意の用語で呼ばれる任意の方法が含まれる：「飽和変異導入」、「シャッフリング」、「組み換え」、「リアセンブリー（ｒｅａｓｓｅｍｂｌｙ）」、「エラープローンＰＣＲ」、「アセンブリーＰＣＲ」、「セクシャルＰＣＲ」、「クロスオーバーＰＣＲ」、「オリゴヌクレオチドプライマー指定変異導入」、「再帰的（および／または指数的）集合（ｅｎｓｅｍｂｌｅ）変異導入（ＡｒｋｉｎおよびＹｏｕｖａｎ、１９９２参照）」、「カセット変異導入」、「インビボ変異導入」、および「インビトロ変異導入」。また、末端選択は、任意の変異導入および／または増幅法（例えば、Ａｒｎｏｌｄ、１９９３；ＣａｌｄｗｅｌｌおよびＪｏｙｃｅ、１９９２；Ｓｔｅｍｍｅｒ、１９９４参照）によって生成する分子に対して行なうことができるが、そのような方法の後に望ましい子孫分子を選択（存在のスクリーニングを含む）することが望ましい。
【０１８０】
また、末端選択は、変異導入方法とは別にポリヌクレオチドに施すこともできる。１つの態様では、本明細書で提供される末端選択は、別のポリヌクレオチドへの連結（ベクターへの連結を含む）の段階のような、クローニング段階を促進するために使用できる。したがって、本発明は、ライブラリーの作製、望ましいポリヌクレオチドの選択および／または濃縮、およびクローニング全般を容易にするために役立つ手段として、末端選択を提供する。
【０１８１】
別の態様では、末端選択はポリヌクレオチドの（正の）選択に基づき得る；または、末端選択はポリヌクレオチドの（負の）選択に基づき得る；または、末端選択はポリヌクレオチドの（正の）選択および（負の）選択の両方に基づき得る。他の選択および／またはスクリーニング方法とともに、類似または非類似の選択および／またはスクリーニング法および役立つ変異導入法との任意の組み合せで、末端選択は反復して実行でき、これらの全ては反復して、任意の順序、組み合せ、および順列で実行できる。また、末端選択は、環状（例えば、プラスミドまたは任意の他の環状ベクターまたは他の任意の部分的に環状のポリヌクレオチド）、および／または分岐、および／または任意の化学基もしくは部分で修飾または置換されたポリヌクレオチドの選択にも使用できることが認識される。
【０１８２】
１つの限定的でない局面では、直線状ポリヌクレオチドの末端選択は、ポリヌクレオチドの末端（５’または３’末端のいずれでも）またはその付近に存在する少なくとも１つの末端選択マーカーの存在に基づく一般的手法を用いて行われる。１つの特定の限定的でない具体例では、末端選択は、ポリヌクレオチド配列を認識する酵素によって認識される配列のような、末端またはその付近の特定の配列の選択に基づく。ポリヌクレオチドの化学的修飾を認識および触媒する酵素は、本明細書ではポリヌクレオチド作用酵素と呼ばれる。好ましい態様では、役立つポリヌクレオチド作用酵素の非排他的具体例には、ポリヌクレオチド開裂活性を持つ酵素、ポリヌクレオチドメチル化活性を持つ酵素、ポリヌクレオチド連結活性を持つ酵素、複数の区別可能な酵素活性（例えばポリヌクレオチド切断活性およびポリヌクレオチド連結活性が含まれるが、これらに限定されるわけではない）を持つ酵素が含まれる。
【０１８３】
適切なポリヌクレオチド作用酵素には、当業者によって同定可能な任意の酵素（例えば、市販の酵素）、または現在は使用できないが将来開発される可能性のあるもの、ポリヌクレオチドの連結に適合する末端、好ましくは粘着末端を作製するために役立つものが含まれることが認識される。末端選択を行なうポリヌクレオチドの内部に含まれない、または含まれないと期待される、または含まれる可能性の少ない（例えば、作業ポリヌクレオチドに関する配列情報が不完全な場合）制限部位を使用することが好ましい可能性がある。内部の望ましくない制限部位を除去するために種々の方法（例えば、変異導入法）が使用できると認識される。また、末端領域における認識部位で消化を行なうために部分的消化反応（すなわち部分的な完成にまで進行する消化反応）を用い、ポリヌクレオチドの内部に存在し、同じ酵素で認識される感受性の制限部位を残すこともできる。１つの局面では、一部の酵素は、認識配列の存在する位置および環境に応じて、同じ認識配列の選択的開裂を行なうことが認識されるので、部分的消化は有用である。
【０１８４】
また保護方法を用いて、その部位が存在するために作業ポリペプチドが切断されるような、望ましくない酵素消化から、特定の制限部位（例えば、内部の部位）を選択的に保護することもできると認識される；そのような保護方法には、望ましくない酵素活性を阻害する、メチル化および塩基の置換（例えば、Ｔの代わりにＵ）が含まれる。
【０１８５】
本発明の別の態様では、役立つ末端選択マーカーは、特定のポリヌクレオチド配列を認識するポリヌクレオチド作用酵素によって認識される末端配列である。本発明の１つの局面では、役立つポリヌクレオチド作用酵素には、古典的なタイプＩＩ制限酵素に加えて、他の酵素も含まれる。本発明のこの好ましい局面では、役立つポリヌクレオチド作用酵素には、ジャイレース（例えば、トポイソメラーゼ）、ヘリカーゼ、レコンビナーゼ、リラクセース、およびこれらに関連する任意の酵素も含まれる。
【０１８６】
子孫分子（例えば、変異導入によって作製された）から親鋳型分子（例えば、変異導入を行なう）を区別および分離するために、末端選択が使用できると認識される。例えば、トポイソメラーゼＩ認識部位を持たないプライマーの第１のセットを用いて、親分氏の末端領域を修飾できる（例えば、ポリメラーゼベースの増幅）。その後、プライマーの第２の異なるセット（例えば、トポイソメラーゼＩ認識部位を持つ）を用いて、増幅された鋳型分子から、変異した子孫分子（例えば、中断した合成、鋳型を切り替えるポリメラーゼベースの増幅、または中断した合成；または飽和変異導入を使用；または変異導入した子孫分子にトポイソメラーゼＩ認識部位を導入するための他の任意の方法のような、任意のポリヌクレオチドキメラ化法を使用）が作製できる。トポイソメラーゼＩに基づく末端選択を使用すると、所望の子孫分子の識別のみならず、その選択的なトポイソメラーゼＩに基づく連結が容易になる。
【０１８７】
トポイソメラーゼに基づくニッキングおよび連結を用いた末端選択手法は、以前に利用された選択方法と比較して、いくつかの利点があることが認識される。要するに、この手法によると、方向を定めたクローニング（発現クローニングを含む）が可能になる。
【０１８８】
ペプチドディスプレイ法
本方法を用いて、ペプチドディスプレイ法によって選択されたポリヌクレオチド配列を、開示された任意の方法および任意の組み合せによるインビトロおよび／またはインビボ組み換えによって、シャッフリングすることができる。ここで、関連するポリヌクレオチドは、表現型（例えば、事前に定められた受容体（リガンド）に対する親和性）のスクリーニングをする、ディスプレイされるペプチドをコードしている。
【０１８９】
バイオ医薬品の開発と分子生物学で重要度を増しつつある局面は、生体高分子と相互作用するペプチドまたはペプチド様物質のアミノ酸の一次配列を含む、ペプチド構造の同定である。事前に定められた生体高分子（例えば、受容体）に対する結合のような、所望の構造または機能的性質を持つペプチドを同定する１つの方法は、ペプチドのアミノ酸配列によって与えられる所望の構造または機能的性質を持つ個々のライブラリーメンバーを求めて、ペプチドの大きなライブラリーをスクリーニングすることである。
【０１９０】
ペプチドライブラリーの作製のために、直接の化学合成法に加えて、いくつかの組み換えＤＮＡ法も報告されている。１つのタイプでは、バクテリオファージ粒子または細胞の表面に、ペプチド配列、抗体、または他のタンパク質をディスプレイするものである。一般に、これらの方法では、各バクテリオファージまたは細胞は、天然のバクテリオファージまたは細胞タンパク質配列に加えて、単一の種のペプチドをディスプレイする個々のライブラリーメンバーの役割を果たす。各バクテリオファージまたは細胞には、特定のディスプレイされたペプチド配列をコードするヌクレオチド配列情報が含まれている；したがって、ディスプレイされた配列は、単離されたライブラリーメンバーのヌクレオチド配列を決定することで確認できる。
【０１９１】
周知のペプチドディスプレイ法では、通常はバクテリオファージのコートタンパクとの融合タンパク質として、糸状バクテリオファージの表面上にペプチド配列を提示する。バクテリオファージのライブラリーを、固定化した事前に決められた高分子または小分子（例えば、受容体）とインキュベートして、固定化した高分子に結合したペプチド配列を提示するバクテリオファージ粒子が、事前に決められた高分子に結合するペプチド配列を提示しない粒子から、差別的に分けられるようにする。その後、固定化した高分子に結合したバクテリオファージ粒子（すなわちライブラリーメンバー）を回収および複製して、次のアフィニティ濃縮およびファージ複製のラウンドのために、選択されたバクテリオファージサブ集合を増幅しておく。アフィニティ濃縮およびファージ複製を数ラウンドした後、このように選択されたバクテリオファージライブラリーメンバーを単離し、ディスプレイされたペプチド配列をコードするヌクレオチド配列を決定し、それにより事前に決められた高分子（例えば、受容体）に結合するペプチド配列を同定する。このような方法は、国際公開公報第９１／１７２７１号、９１／１８９８０号、９１／１９８１８号、および９３／０８２７８号にさらに記述されている。
【０１９２】
本発明は、受容体分子、関心対象のエピトープ、望ましいやり方でペプチドまたはＲＮＡを修飾する遺伝子産物に結合する有用な化合物（例えば、一本鎖抗体を含むペプチド）を同定するために、ランダム、疑似ランダム、および定義された配列のフレームワークペプチドライブラリー、ならびにそのようなライブラリーの作製およびスクリーニング法も提供する。ランダム、疑似ランダム、および定義された配列フレームワークのペプチドは、ディスプレイされたペプチドがそれから合成されたポリヌクレオチド鋳型に結合した、ディスプレイされた一本鎖抗体、またはディスプレイされたペプチドを含む、ペプチドライブラリーメンバーのライブラリーから作製される。結合の方法は、選択された本発明の態様に応じて異なり、ファージ粒子の被包または細胞への取り込みを含み得る。
【０１９３】
本発明の有意な利点は、関心対象のペプチドリガンドまたは抗体を単離するために、期待されるリガンドの構造に関して、何も事前の情報が必要ではないということである。同定されるペプチドは、生物活性を持つ可能性があり、これは少なくとも選択された受容体分子に対する特異的な結合親和性を含み、さらに場合によっては、他の化合物の結合を阻止する能力、代謝経路を刺激または阻害する能力、シグナルまたはメッセンジャーとして作用する能力、細胞活性を刺激または阻害する能力等も含む。
【０１９４】
本発明は、事前に決められた受容体（例えば、ペプチドホルモン受容体、細胞表面受容体、他のタンパク質と結合してヘテロダイマー等のような細胞内タンパク質複合体を形成する細胞内タンパク質のような哺乳類のタンパク質受容体）またはエピトープ（例えば、固定化されたタンパク質、糖タンパク質、オリゴ糖等）に結合するライブラリーメンバーを探すために、本発明の方法により同定され、新生ペプチド（一本鎖抗体を含む）をディスプレイするポリソームのライブラリーの親和性スクリーニングによって選択された、ポリヌクレオチド配列のプールをシャッフリングする方法も提供する。
【０１９５】
これらの任意の方法により１回目の選択ラウンド（通常は受容体（例えば、リガンド）への結合の親和性の選択）で選択されたポリヌクレオチド配列は、プールされ、このプールはインビトロおよび／またはインビボ組み換えによってシャッフリングされて、組み換えられた選択済ポリヌクレオチド配列の集合を含むシャッフリング済プールが作製される。組み換えられた選択済ポリヌクレオチド配列は、少なくとも１回の引き続く選択ラウンドにかけられる。以後の選択ラウンドで選択されるポリヌクレオチド配列は、直接使用する、配列決定する、および／またはさらにもう１度またはそれ以上のシャッフリングラウンドと引き続く選択にかけることができる。選択された配列は、中立配列（すなわち、結合には非実質的な機能効果を持つ）をコードするポリヌクレオチド配列と戻し交雑できる。例えば、選択された配列と実質的に同一の自然発生配列または野生型と戻し交雑して、免疫原性の少ない天然様機能的ペプチドを生成する。一般に、戻し交雑の間、引き続く選択は、事前に決められて受容体（リガンド）への結合する性質を保持するために行われる。
【０１９６】
選択された配列のシャッフリング前またはそれと同時に、配列に変異を導入できる。１つの態様では、選択されたライブラリーメンバーを原核ベクター（例えば、プラスミド、ファージミド、またはバクテリオファージ）にクローニングし、別々のライブラリーメンバーを表す個々のコロニー（またはプラーク）の集合が作製される。その後、個々の選択されたライブラリーメンバーを操作して（例えば、部位指定突然変異導入、カセット変異導入、化学的変異導入、ＰＣＲ変異導入等）、選択されたライブラリーメンバーの配列に基づく配列多様性の中核（ｋｅｒｎａｌ）を表すライブラリーメンバーの集合が作製できる。個々の選択されたライブラリーメンバーまたはプールを操作して、部分的または個々の選択されたライブラリーメンバー配列の全長に渡って、ランダム変異、疑似ランダム変異、規定のカーナル変異（すなわち、変異および不変の残基位置を含む、および／または規定のアミノ酸残基サブセットから選択された残基を含む変異残基位置を含む）、コドンベースの変異等を組み込むようにできる。その後、変異導入した選択されたライブラリーメンバーは、本明細書に開示されるようにインビトロおよび／またはインビボ組み換えシャッフリングによってシャッフリングできる。
【０１９７】
本発明はまた、本発明の複数の個々のライブラリーメンバーを含むペプチドライブラリーを提供するが、（１）各複数の個々のライブラリーメンバーは、選択された配列プールのシャッフリングによって作製された配列を含み、（２）各個々のライブラリーメンバーは可変のペプチド部分配列または一本鎖抗体部分配列を含み、（一部のライブラリーメンバーは、不均一な増幅、確率等のために、１ライブラリー当たり複数のコピーで存在するにもかかわらず、）これは該複数における他の個々のライブラリーメンバーの一本鎖抗体配列または可変ペプチド部分配列とは異なる。
【０１９８】
本発明はプロダクトバイプロセス（ｐｒｏｄｕｃｔ−ｂｙ−ｐｒｏｃｅｓｓ）も提供する。ここで、事前に決められた結合特異性を持つ（または、持つペプチドをコードする）選択されたポリヌクレオチド配列は、以下のプロセスによって形成される：（１）事前に決められた受容体（例えば、リガンド）またはエピトープ（例えば、抗原高分子）に対するディスプレイされた一本鎖抗体またはディスプレイされたペプチドのライブラリーをスクリーニングし、事前に決められた受容体またはエピトープに結合するライブラリーメンバーを同定および／または濃縮して、選択されたライブラリーメンバーのプールを作製する、（２）事前に決められたエピトープに結合し、そのためにライブラリーから単離および／または濃縮された、選択されたライブラリーメンバー（またはその増幅またはクローニングされたコピー）を組み換えによりシャッフリングして、シャッフリング済ライブラリーを作製する、および（３）事前に決められた受容体（例えば、リガンド）またはエピトープ（例えば、抗原高分子）に対してシャッフリング済ライブラリーをスクリーニングして、事前に決められた受容体またはエピトープに結合するシャッフリング済ライブラリーメンバーを同定および／または濃縮して、選択されたシャッフリング済ライブラリーメンバーのプールを作製する。
【０１９９】
抗体ディスプレイおよびスクリーニング法
本発明は、抗体ディスプレイ法によって選択されたポリヌクレオチド配列を、開示された任意の方法およびその任意の組み合せによって、インビトロおよび／またはインビボ組み換えによりシャッフリングするために使用できる。ここで、関連するポリヌクレオチドは、表現型（例えば、事前に決められた抗原（リガンド）に結合する親和性）のスクリーニングをするディスプレイされた抗体をコードしている。
【０２００】
免疫グロブリン鎖中に存在し得る、非常に多くの異なる可変領域によって表される広範囲の免疫レパートリーを獲得するために、種々の分子遺伝学的手法が考案されてきた。自然に存在する生殖細胞系免疫グロブリンＨ鎖の遺伝子座は、縦に並ぶ多様性部分遺伝子の上流に位置する、縦に並ぶ可変部分の遺伝子からなり、前者は連結（ｉ）領域遺伝子の上流に位置しており、これはＣ領域遺伝子の上流に位置している。Ｂリンパ球の発生において、Ｖ−Ｄ−Ｊの再配列が起こり、ここでＨ鎖可変領域遺伝子（ＶＨ）は、融合したＤ部分を形成し、その後に可変部分との再配列が生じ、Ｖ−Ｄ−Ｊ連結産物遺伝子を形成する再配列によって形成されるが、これは作製的に再配列された場合には、Ｈ鎖の機能的な可変領域（ＶＨ）をコードしている。同様に、Ｌ鎖の遺伝子座では、いくつかの可変部分のうちの１つと、いくつかのＪ部分のうちの１つが再配列して、Ｌ鎖の可変領域（ＶＬ）をコードする遺伝子が形成される。
【０２０１】
免疫グロブリンで可能な可変領域の広範囲のレパートリーは、部分的には、Ｂ細胞の発生時におけるＶおよびｉ部分（およびＨ鎖の遺伝子座の場合はＤ部分）の数多くの組み合せの可能性に起因する。Ｈ鎖の可変領域の更なる配列多様性は、Ｖ−Ｄ−Ｊ連結におけるＤ部分の不均一な再配列と、Ｎ領域の付加から産生される。さらに、特定のＢ細胞の抗原選択は、Ｈ鎖およびＬ鎖の可変領域の１つまたは両方における非生殖細胞系突然変異を持つ高親和性の変異体を選択する；これは「親和性成熟」または「親和性尖鋭化」と呼ばれる現象である。通常は、これらの「親和性尖鋭化」変異は、可変領域の特定の部分、多くの場合相補性決定領域（ＣＤＲ）に集まっている。
【０２０２】
抗原刺激されたＢ細胞の発生（すなわち、免疫化）を通して高親和性の免疫グロブリンを作製および同定する際の多くの制限を克服するために、特定の抗原に対する高親和性抗体のスクリーニングができるコンビナトリアル抗体ライブラリーを作製するために操作できる、種々の原核発現システムが開発されてきた。大腸菌（Ｅ．ｃｏｌｉ）およびバクテリオファージ系における抗体の発現の最近の進歩（「別のペプチドディスプレイ法」、下記参照）によって、解析されたハイブリドーマから抗体遺伝子をクローニングするか、抗体遺伝子ライブラリー（例えば、ＩｇｃＤＮＡから）を用いた新規の選択によって、ほぼどんな特異性でも得られる可能性が生じてきた。
【０２０３】
バクテリオファージプラークとして、または溶原菌のコロニーとしてスクリーニングできる抗体のコンビナトリアルライブラリーは、バクテリオファージλ発現システムにおいて作製されてきた（Ｈｕｓｅら、１９８９；ＣａｔｏｎおよびＫｏｐｒｏｗｓｋｉ、１９９０；Ｍｕｌｌｉｎａｘら、１９９０；Ｐｅｒｓｓｏｎら、１９９１）。バクテリオファージ抗体ディスプレイライブラリーおよびλファージ発現ライブラリーの様々な態様は、記述されてきた（Ｋａｎｇら、１９９１；Ｃｌａｃｋｓｏｎら、１９９１；ＭｃＣａｆｆｅｒｔｙら、１９９０；Ｂｕｒｔｏｎら、１９９１；Ｈｏｏｇｅｎｂｏｏｍら、１９９１；Ｃｈａｎｇら、１９９１；Ｂｒｅｉｔｌｉｎｇら、１９９１；Ｍａｒｋｓら、１９９１、ｐ５８１；Ｂａｒｂａｓら、１９９２；ＨａｗｋｉｎｓおよびＷｉｎｔｅｒ、１９９２；Ｍａｒｋｓら、１９９２、ｐ７７９；Ｍａｒｋｓら、１９９２、ｐ１６００７；およびＬｏｗｍａｎら、１９９１；Ｌｅｒｎｅｒら、１９９２；全てが参照として本明細書に組み入れられている）。通常は、バクテリオファージ抗体ディスプレイライブラリーは、固定され（例えば、アフィニティクロマトグラフィーによって反応性ファージを濃縮するためのクロマトグラフィー樹脂に共有結合）、および／または標識された（例えば、プラークのスクリーニングまたはコロニーのリフトのため）受容体（例えば、ポリペプチド、炭化水素、糖タンパク質、核酸）によってスクリーニングする。
【０２０４】
１つの特に有利な手法は、いわゆる一本鎖可変領域抗体（ｓｃｆｖ）ライブラリーを用いることである（Ｍａｒｋｓら、１９９２、ｐ７７９；ＷｉｎｔｅｒおよびＭｉｌｓｔｅｉｎ、１９９１；Ｃｌａｃｋｓｏｎら、１９９１；Ｍａｒｋｓら、１９９１、ｐ５８１；Ｃｈａｕｄｈａｒｙら、１９９０；Ｃｈｉｓｗｅｌｌら、１９９２；ＭｃＣａｆｆｅｒｔｙら、１９９０；およびＨｕｓｔｏｎら、１９８８）。バクテリオファージコートタンパク上にディスプレイされたｓｃｆｖライブラリーの種々の態様は、記述されている。
【０２０５】
１９８８年からは、抗体工学の方法によりＦｖ断片の一本鎖アナログおよびその融合タンパク質は信頼性高く作製されてきている。一般に、その第１段階は所望の結合特性を持つＶＨおよびＶＬドメインをコードする遺伝子を入手することである；これらのＶ遺伝子は、特定のハイブリドーマ細胞株から単離したり、コンビナトリアルＶ遺伝子ライブラリーから選択したり、Ｖ遺伝子合成によって作製したりできる。一本鎖Ｆｖは、Ｖ遺伝子成分を、（Ｇｌｙ−Ｇｌｙ−Ｇｌｙ−Ｇｌｙ−Ｓｅｒ）または同等なリンカーペプチドのように、適切に設計されたリンカーペプチドをコードするオリゴヌクレオチドと結合させて形成できる。リンカーは第１のＶ領域のＣ末端と、第２の領域のＮ末端を、ＶＨ−リンカー−ＶＬまたはＶＬ−リンカー−ＶＨの順につなぐ。原則的に、ｓｃｆｖ結合部位は、その親抗体結合部位の親和性と特異性の両方を忠実に再現できる。
【０２０６】
したがって、ｓｃｆｖ断片は、ＶＨとＶＬドメインが、柔軟なリンカーペプチドによって連結されて１本のポリペプチド鎖になったものである。ｓｃｆｖ遺伝子を組み立てた後、ファージミドにクローニングし、バクテリオファージＰＩＩＩ（遺伝子３）コートタンパクとの融合タンパク質として、Ｍ１３ファージ（または類似の糸状バクテリオファージ）の先端に発現させる。関心対象の抗体を発現するファージの濃縮は、事前に決められたエピトープ（例えば、標的抗原、受容体）への結合を探して集合ｓｃｆｖをディスプレイする組み換えファージをパンニングして行われる。
【０２０７】
ライブラリーメンバーの結合ポリヌクレオチドは、スクリーニングまたは選択の後にライブラリーメンバーを複製する基礎を提供し、またヌクレオチド配列決定によって、ディスプレイされたペプチド配列、またはＶＨおよびＶＬアミノ酸配列を同定する基礎を提供する。ディスプレイされたペプチドまたは一本鎖抗体（例えば、ｓｃｆｖ）および／またはそのＶＨおよびＶＬドメインまたはそのＣＤＲは、適当な発現系にクローニングして発現できる。しばしば単離されたＶＨおよびＶＬドメインをコードするポリヌクレオチドは、Ｃ領域（ＣＨおよびＣＬ）をコードするポリヌクレオチドと連結されて、完全な抗体（例えば、キメラまたは完全にヒト）、抗体断片等をコードするポリヌクレオチドが作製される。しばしば単離されたＣＤＲをコードするポリヌクレオチドは、適切な可変領域フレームワーク（および選択的にＣ領域）をコードするポリヌクレオチドに移植され、完全な抗体（例えば、ヒト化または完全にヒト）、抗体断片等をコードするポリヌクレオチドが作製される。抗体は、免疫親和性クロマトグラフィーによって調製用の量の抗原を単離するために使用できる。そのような抗体の他の種々の用途には、疾病の診断および／または病期の判断（例えば、新形成）、および例えば新形成、自己免疫疾患、ＡＩＤＳ、心臓血管疾患、感染等のような疾病の治療がある。
【０２０８】
結合種（イディオタイプスペクトラム）のレパートリーを広げるために、ｓｃｆｖライブラリーのコンビナトリアルな多様性を増加させるために、種々の方法が報告されている。ＰＣＲを使用することで、特定のハイブリドーマ源から、または非免疫細胞からの遺伝子ライブラリーとして可変領域が速やかにクローニングできるようになり、組み合せることのできるＶＨおよびＶＬカセットの種類にコンビナトリアルな多様性が生じた。さらに、ＶＨおよびＶＬカセットは、ランダム、疑似ランダム、または指定変異導入などによって、それ自身を多様化できる。通常は、ＶＨおよびＶＬカセットは、相補性決定領域（ＣＤＲＳ）、しばしば３番目のＣＤＲであるＣＤＲ３においてまたはその付近で多様化される。酵素による逆ＰＣＲ変異導入は、ｓｃｆｖ部位指定ハイブリッドの比較的大きなライブラリーを作製するために簡単で信頼できる方法であることが示されており（Ｓｔｅｍｍｅｒら、１９９３）、エラープローンＰＣＲおよび化学的変異導入（Ｄｅｎｇら、１９９４）も同様である。Ｒｉｅｃｈｍａｎｎ（Ｒｉｅｃｈｍａｎｎら、１９９３）は、縮重オリゴヌクレオチドＰＣＲおよびそれに引き続くｓｃｆｖハイブリッドのファージディスプレイによる部位指定ランダム化を用いて、抗体ｓｃｆｖ断片の準合理的設計を示した。Ｂａｒｂａｓ（Ｂａｒｂａｓら、１９９２）は、偏りのある可変領域配列を用いるために生じるレパートリーサイズの制限の問題を、ヒト破傷風毒素結合Ｆａｂの合成ＣＤＲ領域の配列をランダム化することによって回避しようとした。
【０２０９】
ＣＤＲランダム化は、Ｈ鎖のＣＤＲ３のみでも約１×１０^２０のＣＤＲ、ならびにＨ鎖ＣＤＲ１およびＣＤＲ２、およびＬ鎖ＣＤＲ１−３でも、ほぼ同じ数の変異体を作製する可能性を持つ。別々または合わせて、Ｈ鎖および／またはＬ鎖のＣＤＲランダム化の組み合せの可能性には、全ての可能性の組み合せを表すクローンライブラリーを作製するために、法外な数のバクテリオファージクローンを作製する必要があるが、その内の大部分は結合しないものである。そのような多数の一次形質転換体を作製することは、現在の形質転換技術およびバクテリオファージディスプレイシステムでは実現性に乏しい。例えば、Ｂａｒｂａｓ（Ｂａｒｂａｓら、１９９２）は５×１０^７の形質転換体を作製したのみであり、これは完全にランダム化したＣＤＲＳのライブラリーの潜在的多様性のごく一部を表すのみである。
【０２１０】
このような実質的な制約にもかかわらず、ｓｃｆｖのバクテリオファージディスプレイは、すでに様々な有用な抗体および抗体融合タンパク質を生み出している。二重特異性一本鎖抗体は、効率の良い腫瘍細胞溶解を仲介することが示されている（Ｇｒｕｂｅｒら、１９９４）。抗Ｒｅｖｓｃｆｖの細胞内発現は、インビトロでＨＩＶ−１ウイルス複製を阻害することが示されており（Ｄｕａｎら、１９９４）、抗ｐ２１ｒａｒ、ｓｃｆｖの細胞内発現は、アフリカツメガエルの卵母細胞の成熟分裂を阻害することが示されている（Ｂｉｏｃｃａら、１９９３）。ＨＩＶ感染を診断できる組み換えｓｃｆｖも報告されており、ｓｃｆｖが診断に利用できることが示された（Ｌｉｌｌｅｙら、１９９４）。ｓｃＦｖが毒素または線維素溶解活性化タンパク質のような第２のポリペプチドに連結される融合タンパク質も報告されている（Ｈｏｌｖｏｓｔら、１９９２；Ｎｉｃｈｏｌｌｓら、１９９３）。
【０２１１】
抗体の多様性がより高く、潜在的な組み合せのごく一部しかカバーできないという通常のＣＤＲ変異導入およびランダム化法の多くの限界を克服するｓｃｆｖライブラリーの作成が可能ならば、治療と診断に使用できるｓｃｆｖ抗体の数と質は大きく改善されるだろう。これに対処するために、本発明のインビトロおよびインビボシャッフリング法を用いて、選択されたディスプレイされた抗体から得られた核酸から得られたＣＤＲ（通常はＰＣＲ増幅またはクローニングによる）の組み換えが行われる。そのようなディスプレイされた抗体は、細胞、バクテリオファージ粒子、ポリソーム、または抗体がそのコードする核酸に関連付けされる任意の抗体ディスプレイシステム上でディスプレイされることができる。１つのバリエーションでは、ＣＤＲは最初は、抗体産生細胞（それに由来するハイブリドーマを含む）（例えば、国際公開公報第９２／０３９１８号、国際公開公報第９３／１２２２７号、国際公開公報第９４／２２５８５号のような免疫された野生型マウス、ヒト、またはヒト抗体を作製する能力のあるトランスジェニックマウス由来の形質細胞／脾細胞）のｍＲＮＡ（またはｃＤＮＡ）から得られる。
【０２１２】
組み換え選択済ポリヌクレオチド配列群を含むシャッフリングされたプールを作製するために、これらの任意の方法によって１回目の選択で選択されたポリヌクレオチド（通常は、抗原（例えば、リガンド）に結合する、ディスプレイされる抗体の親和性選択による）はプールされ、このプールはインビトロおよび／またはインビボ組み換えによってシャッフリング、特に、ＣＤＲ（通常はＨ鎖ＣＤＲを他のＨ鎖ＣＤＲと、Ｌ鎖ＣＤＲを他のＬ鎖ＣＤＲとシャッフリング）のシャッフリングがなされる。組み換えられた選択済ポリヌクレオチド配列は、ディスプレイされた抗原として選択フォーマットで発現され、その後、少なくとも１回の選択が行われる。その後の選択ラウンドで選択されたポリヌクレオチド配列は、直接に使用したり、配列決定したり、および／または所望の結合親和性を持つ抗体が得られるまでさらに１回またはそれ以上のシャッフリングと選択を行なえる。選択された配列は、例えば、ヒト可変領域フレームワークと戻し交雑してヒト様配列抗体を作製するなど、中立の抗体フレームワーク配列（すなわち、抗原結合に機能的影響を実質的に持たない）をコードするポリヌクレオチド配列と戻し交雑してもよい。一般に、事前に決められた抗原に結合する性質を保持するために、戻し交雑後に選択を行なう。
【０２１３】
代わりに、または記述されたバリエーションとの組み合せで、選択されたｓｃｆｖライブラリーメンバーの平均結合親和性をコントロールするために、標的エピトープの結合価を変化させることもできる。標的エピトープは、例えば競合エピトープを含めたり、希釈したり、当業者に周知の他の方法によって、様々な密度で表面または基質に結合させることができる。高い密度（結合価）の事前に決められたエピトープは、比較的低い親和性を持つｓｃｆｖライブラリーメンバーの濃縮に使用できるが、低い密度（結合価）は、高い親和性のｓｃｆｖライブラリーメンバーを選択的に濃縮できる。
【０２１４】
多様な可変部分を作製するために、ペプチド配列のランダム、疑似ランダム、または規定された配列カーナルセットをコードする合成オリゴヌクレオチドの集合が、連結によって、事前に決められた部位（例えば、ＣＤＲ）に挿入できる。同様に、一本鎖抗体カセットの１つまたはそれ以上のＣＤＲの配列多様性は、部位指定変異導入、ＣＤＲ置換等によってＣＤＲを変異させることによって、拡張できる。得られたＤＮＡ分子は、シャッフリングの前にクローニングと増幅のために宿主中で増殖させるか、直接使用して（すなわち、宿主細胞で増殖させた際の多様性の損失を避けるため）、選択されたライブラリーメンバーをその後シャッフリングできる。
【０２１５】
関心対象の可変部分ペプチド配列または関心対象の一本鎖抗体をコードする、ディスプレイされたペプチド／ポリヌクレオチド複合体（ライブラリーメンバー）は、親和性濃縮テクニックによってライブラリーから選択される。これは、受容体、他の高分子、または他のエピトープ種のような、関心対象のペプチド配列に特異的な固定化した高分子またはエピトープを用いて行なう。親和性選択手順を繰り返すと、所望の配列をコードするライブラリーメンバーが濃縮でき、その後これはプールとシャッフリング用、配列決定用、および／または更なる増殖と親和性濃縮用に、単離できる。
【０２１６】
所望の特異性を持たないライブラリーメンバーは、洗浄して除去する。必要な洗浄の度合いと厳密度は、関心対象の各ペプチド配列または一本鎖抗体、および固定化された事前に決められた高分子またはエピトープごとに決定される。結合インキュベーションおよびその後の洗浄の条件を調整することによって、回収される新生ペプチド／ＤＮＡ複合体の結合特性に関して、ある程度のコントロールが可能である。温度、ｐＨ、イオン強度、二価陽イオン濃度、および洗浄の体積と時間によって、固定された高分子に対する特定の範囲の親和性を持つ新生ペプチド／ＤＮＡ複合体が選択される。通常は高い親和性を予期させるゆっくりした解離速度に基づく選択は、しばしば最も実際的なルートである。これは、遊離の事前に決められた高分子の飽和量の存在下で連続的にインキュベートするか、洗浄の体積、数、および時間を増加させるかによって、行なえる。いずれの場合も、解離した新生ペプチド／ＤＮＡまたはペプチド／ＲＮＡ複合体の再結合が予防され、時間を増やしていくと、より高い親和性を持つ新生ペプチド／ＤＮＡまたはペプチド／ＲＮＡ複合体が回収される。
【０２１７】
結合および洗浄手順をさらに変更すると、特別な特性を持つペプチドが得られる場合がある。一部のペプチドの親和性は、イオン強度または陽イオン濃度に依存する。これは、ペプチドからタンパク質を除去するために穏やかな条件が必要な場合に、種々のタンパク質の親和性による精製に使用できる、ペプチドの有用な特徴である。
【０２１８】
１つのバリエーションでは、複数の結合標的（複数のエピトープ種、複数の受容体種）を用いて、ｓｃｆｖライブラリーを、異なる結合特性を持つ複数のｓｃｆｖについて同時にスクリーニングする。ｓｃｆｖライブラリーのサイズがしばしば潜在的なｓｃｆｖ配列の多様性の限界となることを考えると、普通はできる限り大きなサイズのｓｃｆｖライブラリーを使用することが望ましい。いくつもの非常に大きなポリソームｓｃＦｖディスプレイライブラリーを作製するための時間と費用は、膨大なものになり得る。この大きな問題を避けるため、単一のライブラリーで、複数の事前に決められたエピトープ種（受容体種）を同時にスクリーニングしたり、いくつかのエピトープ種に関して順次スクリーニングしたりできる。１つのバリエーションでは、各々別のビーズ（またはビーズのサブセット）上にコードされた複数の標的エピトープ種を、適当な結合条件下でポリソームディスプレイｓｃｆｖライブラリーと混合し、インキュベートできる。そして、複数のエピトープ種を含むビーズの集合を用いて、ｓｃｆｖライブラリーメンバーを親和性選択によって単離できる。一般に、引き続く親和性スクリーニングのラウンドには、同じビーズ混合物、そのサブセット、または１つまたは２つの個々のエピトープ種のみを含むビーズが使用できる。この方法によると効率良いスクリーニングが可能になり、これは実験室の自動化、バッチプロセッシング、およびハイスループットスクリーニングに適合する。
【０２１９】
本発明では種々のテクニックを使って、ペプチドライブラリーもしくは一本鎖抗体ライブラリーを多様化したり、またはシャッフリングの前または同時に、初期のパンニングのラウンドで事前に決められた高分子またはエピトープに対して十分な結合活性を持つことが分かった可変部分セグメントのペプチドを多様化することができる。１つの手法では、陽性の選択されたペプチド／ポリヌクレオチド複合体（親和性濃縮の初期のラウンドで同定されたもの）の配列決定をして、活性ペプチドの同定をする。その後これらの活性ペプチド配列に基づいてオリゴヌクレオチドを合成するが、各段階で低レベルの全ての塩基を組み込んで、オリゴヌクレオチドの一次配列にわずかな変化をつける。そして、この（わずかに）縮重したオリゴヌクレオチドの混合物を、可変部分配列に適切な位置でクローニングする。この方法では、開始ペプチド配列に体系的にコントロールした変化をつけられ、これはその後にシャッフリングできる。しかし、変異導入の前に、個々の陽性新生ペプチド／ポリヌクレオチド複合体の配列決定が必要であり、そのために少数の回収された複合体の多様性を拡張したり、より高い結合親和性および／またはより高い結合特異性を持つ変異体の選択に有用である。１つのバリエーションである、選択された陽性ペプチド／ポリヌクレオチド複合体（特に可変領域配列）の変異導入ＰＣＲの増幅では、インビトロおよび／またはインビボでシャッフリングされ、配列決定の前に１つまたはそれ以上の更なるスクリーニングラウンドが行われる。同じ一般的な手法は、多様性を拡張し、結合親和性／特異性を増強するために、一本鎖抗体でも使用でき、通常はシャッフリングの前または同時にＣＤＲまたは隣接フレームワーク領域が多様化される。望むならば、シャッフリング反応では、選択されたライブラリーメンバーとインビトロで組み換え可能な変異導入オリゴヌクレオチドをスパイクすることができる。したがって、合成オリゴヌクレオチドおよびＰＣＲで作製されたポリヌクレオチド（エラープローンまたは高忠実度の方法で合成）の混合物をインビトロのシャッフリング混合物に添加し、得られるシャッフリング済ライブラリーメンバー（シャフラント）に組み入れることができる。
【０２２０】
シャッフリングの発明は、ＣＤＲ異型一本鎖抗体の巨大なライブラリーの作製を可能にする。そのような抗体を作製する１つの方法は、合成ＣＤＲを一本鎖抗体に挿入する、および／またはシャッフリング前または同時のＣＤＲランダム化である。合成ＣＤＲカセットの配列は、ヒトＣＤＲの既知の配列を参照にして選択され、以下のガイドラインにしたがって実施者の裁量で選択される：合成ＣＤＲは既知のＣＤＲ配列と少なくとも４０％の位置上の配列同一性を持ち、好ましくは既知のＣＤＲ配列と少なくとも５０から７０％の位置上の配列同一性を持つ。例えば、合成ＣＤＲ配列の集合は、Ｋａｂａｔ（Ｋａｂａｔら、１９９１）にリストされている自然に存在するヒトＣＤＲ配列に基づいて、オリゴヌクレオチド配列の集合を合成することによって作製できる；合成ＣＤＲ配列のプールは、少なくとも１つの既知の自然に存在するヒトＣＤＲ配列と、少なくとも４０％の配列同一性を持つＣＤＲペプチド配列をコードすると計算される。または、自然に存在するＣＤＲの集合を比較して、コンセンサス配列を作製し、１つの残基位置で頻繁に（すなわち、既知のＣＤＲの少なくとも５％）使用されるアミノ酸が対応する位置で合成ＣＤＲに組み込まれるようにする。通常は、いくつかの（例えば、３から約５０）の既知のＣＤＲ配列が比較され、既知のＣＤＲの間に観察される自然配列の変異を表にして、観察される自然の配列変異の順列の全てまたは大部分を包含するＣＤＲペプチド配列をコードするオリゴヌクレオチドの集合が合成される。例えば、ヒトＶＨＣＤＲ配列の集合のカルボキシ末端のアミノ酸がＴｙｒ、Ｖａｌ、ＰｈｅまたはＡｓｐのいずれかであれば、カルボキシ末端ＣＤＲ残基がこれらのアミノ酸のいずれかであるように、合成ＣＤＲオリゴヌクレオチド配列が設計される。いくつかの態様では、ＣＤＲ配列の集合において、１つの残基位置に自然に存在する残基以外の残基が組み込まれる：保存的なアミノ酸置換はしばしば組み込まれ、既知の自然に存在するＣＤＲ配列と比較して、最高５つの残基位置まで、非保存的アミノ酸置換を組み込むために変化できる。そのようなＣＤＲ配列は、一次ライブラリーメンバー（第１回のスクリーニング前）で使用したり、および／または選択されたライブラリーメンバー配列のインビトロシャッフリング反応にスパイクするために使用できる。そのような規定されたおよび／または縮重の配列のプールの作製は、当業者によって容易に実施される。
【０２２１】
合成ＣＤＲ配列の集合には、自然に存在するＣＤＲ配列ではないことが知られているメンバーが少なくとも１つ含まれる。Ｈ鎖ＣＤＲ中でＮ領域付加に対応するランダムまたは疑似ランダム配列を含めるか否かは、実施者の裁量である。Ｎ領域配列は、１ヌクレオチドから約４ヌクレオチドで、Ｖ−ＤおよびＤ−Ｊ接合部で発生する。合成Ｈ鎖ＣＤＲ配列は、少なくとも約１００のユニークなＣＤＲ配列、通常は少なくとも約１，０００のユニークなＣＤＲ配列、好ましくは少なくとも約１０，０００のユニークなＣＤＲ配列、しばしば５０，０００以上のユニークなＣＤＲ配列を含む；しかし、通常１×１０６以下のユニークなＣＤＲ配列がこの集合には含まれるが、特に、自然に存在するヒトＣＤＲでは保存的アミノ酸置換体が存在しないまたはまれな（すなわち０．１％未満）位置で、保存的アミノ酸置換が許可される場合には、時には１×１０７から１×１０８のユニークなＣＤＲ配列が存在する。一般に、ライブラリーに含まれるユニークなＣＤＲ配列の数は、ライブラリー中の期待される一次形質転換体の数の１０倍を超えないほうが良い。そのような一本鎖抗体は、一般に少なくとも１×１０ｍ−、好ましくは少なくとも５×１０^７Ｍ−１の親和性、より好ましくは少なくとも１×１０^８Ｍ−１から１×１０^９Ｍ−１またはそれ以上、時折最高１×１０^１０Ｍ−１またはそれ以上の親和性で結合する。しばしば、事前に決められた抗原はヒトタンパク質であり、例えばヒト細胞表面抗原（例えば、ＣＤ４、ＣＤ８、ＩＬ−２受容体、ＥＧＦ受容体、ＰＤＧＦ受容体）、他のヒト生体高分子（例えば、トロンボモジュリン、プロテインＣ、炭化水素抗原、シアリルルイス抗原、Ｌセレクチン）、または非ヒト疾病関連高分子（例えば、細菌ＬＰＳ、ビリオンキャプシドタンパク質、またはエンベロープ糖タンパク質）などがある。
【０２２２】
所望の特異性を持つ高親和性一本鎖抗体は種々の系で操作および発現できる。例えば、ｓｃｆｖは植物で作製され（Ｆｉｒｅｋら、１９９３）、原核システムでも容易に作製できる（ＯｗｅｎｓおよびＹｏｕｎｇ、１９９４；ＪｏｈｎｓｏｎおよびＢｉｒｄ、１９９１）。また、一本鎖抗体は、抗体全体またはその断片を作製する基礎として使用できる（Ｋｅｔｔｌｅｂｏｒｏｕｇｈら、１９９４）。可変領域をコードする配列を単離して（例えば、ＰＣＲ増幅またはサブクローニングによる）、所望のヒトＣ領域をコードする配列にスプライスし、好ましくは免疫原性が低下し、ヒトの治療により適したヒトの配列の抗体をコードするようにできる。得られた完全にヒトの配列をコードするポリヌクレオチドは、宿主細胞（例えば、哺乳類細胞中で発現ベクターから）で発現し、薬学的組成物を精製することができる。
【０２２３】
本発明の抗体、個々の変異免疫グロブリン鎖、変異抗体断片、および他の免疫グロブリンポリペプチドが発現されたら、硫酸アンモニウム沈殿、分画カラムクロマトグラフィー、ゲル電気泳動などの当技術分野の標準的な方法にしたがって、精製できる（一般にＳｃｏｐｅｓ、１９８２参照）。望むように部分的または均一にまで精製されたら、ポリペプチドを治療に使用したり、アッセイ手順、免疫蛍光染色等の開発および実行に使用したりできる（一般にＬｅｆｋｏｖｉｔｓおよびＰｅｒｎｉｓ、１９７９および１９８１；Ｌｅｆｋｏｖｉｔｓ、１９９７参照）。
【０２２４】
本発明の方法で作製された抗体は、診断および治療に使用できる。限定ではなく実例として、これらは癌、自己免疫疾患、またはウイルス感染の治療に使用できる。癌の治療には、抗体は通常、ｅｒｂＢ−２、ＣＥＡ、ＣＤ３３および当業者に周知の他の多くの抗原および結合メンバーのような、癌細胞に選択的に発現される抗原に結合する。
【０２２５】
シャッフリングを用いて、事前に決められたポリペプチド配列に結合するライブラリーメンバーを同定するために、ツーハイブリッドスクリーニングシステムによるスクリーニングで得られた選択されたライブラリーメンバーのプールを多様化できる。選択されたライブラリーメンバーは、プールされ、インビトロおよび／またはインビボ組み換えによってシャッフリングされる。そして、シャッフリングされたプールを酵母のツーハイブリッドシステムでスクリーニングして、該事前に決められたポリペプチド配列（例えば、ＳＨ２ドメイン）に結合するか、別の事前に決められたポリペプチド配列（例えば、別のタンパク質種のＳＨ２ドメイン）に結合するライブラリーメンバーを選択する。
【０２２６】
事前に決められたポリペプチド配列に結合するポリペプチド配列の同定するための１つの方法は、いわゆる「ツーハイブリッド」システムを使用するもので、そこでは、事前に決められたポリペプチド配列が融合タンパク質として存在する（Ｃｈｉｅｎら、１９９１）。この手法では、転写活性化因子（ＦｉｅｌｄｓおよびＳｏｎｇ、１９８９）、酵母Ｇａｌ４転写タンパク質の再生を通して、インビボでタンパク質−タンパク質相互作用を同定する。通常は、この方法は酵母Ｇａｌ４タンパク質の性質に基づいており、このタンパク質はＤＮＡ結合ドメインと転写活性化ドメインという分離可能なドメインからなる。１つは既知のタンパク質のポリペプチド配列に融合した酵母のＧａｌ４ＤＮＡ結合ドメインからなり、もう１つは第２のタンパク質のポリペプチド配列に融合したＧａｌ４活性化ドメインからなる２つのハイブリッドタンパク質をコードするポリヌクレオチドが作製され、酵母宿主細胞に導入される。２つの融合タンパク質の間の分子間結合が産生されると、Ｇａｌ４ＤＮＡ結合ドメインがＧａｌ４活性化ドメインと再構成され、Ｇａｌ４結合部位に機能的に連結されているレポーター遺伝子（例えば、ｌａｃｚ、ＨＩＳ３）の転写が活性化する。通常は、ツーハイブリッド法は既知のタンパク質と相互作用する新規のポリペプチドを同定するために使用される（ＳｉｌｖｅｒおよびＨｕｎｔ、１９９３；Ｄｕｒｆｅｅら、１９９３；Ｙａｎｇら、１９９２；Ｌｕｂａｎら、１９９３；Ｈａｒｄｙら、１９９２；Ｂａｒｔｅｌら、１９９３；およびＶｏｊｔｅｋら、１９９３）。しかし、第２の既知のタンパク質への結合に影響を与える既知タンパク質中の変異を同定するために、ツーハイブリッド法のバリエーションが使用されてきた（ＬｉおよびＦｉｅｌｄｓ、１９９３；Ｌａｌｏら、１９９３；Ｊａｃｋｓｏｎら、１９９３；およびＭａｄｕｒａら、１９９３）。ツーハイブリッドシステムは、２つの既知のタンパク質の相互作用する構造のドメインや（Ｂａｒｄｗｅｌｌら、１９９３；Ｃｈａｋｒａｂａｒｔｙら、１９９２；Ｓｔａｕｄｉｎｇｅｒら、１９９３；およびＭｉｌｎｅおよびＷｅａｖｅｒ１９９３）、または単一のタンパク質のオリゴマー化をになうドメインの同定（Ｉｗａｂｕｃｈｉら、１９９３；Ｂｏｇｅｒｄら、１９９３）にも使用されている。ツーハイブリッドシステムのバリエーションは、タンパク質分解酵素のインビボ活性の研究に使用された（Ｄａｓｍａｈａｐａｔｒａら、１９９２）。または、大腸菌（Ｅ．ｃｏｌｉ）／ＢＣＣＰ相互作用スクリーニングシステム（Ｇｅｒｍｉｎｏら、１９９３；Ｇｕａｒｅｎｔｅ、１９９３）を用いて、相互作用するタンパク質配列（すなわち、ヘテロダイマーまたは、より高次のヘテロ多量体を形成するタンパク質配列）を同定することができる。ツーハイブリッドシステムによって選択された配列は、事前に決められた結合配列を含むハイブリッドに結合するポリペプチド配列を同定するためのスクリーニングを、さらに１回またはそれ以上行なうために、プールし、シャッフリングし、ツーハイブリッドシステムに導入することができる。このようにして同定された配列は、コンセンサス配列およびコンセンサス配列カーナルを同定するために比較される。
【０２２７】
鋳型ＤＮＡの１μｇの試料を入手して、ＵＶ光で処理して、ＴＴ二量体を含む二量体、特にプリン二量体の形成を誘導する。ＵＶ照射は鋳型ＤＮＡ試料上で１つの遺伝子当たり数コの光化学反応生成物のみが生成するように、制限される。複数の試料に異なる時間ＵＶ照射を行い、ＵＶ照射によって、種々の数の二量体を持つ鋳型ＤＮＡが得られるようにする。
【０２２８】
プルーフリーディング活性を持たないポリメラーゼを利用するランダムプライミングキット（例えば、ＳｔｒａｔａｇｅｎｅＣｌｏｎｉｎｇＳｙｓｔｅｍｓによるＰｒｉｍｅ−ＩｔＩＩＲａｎｄｏｍＰｒｉｍｅｒＬａｂｅｌｉｎｇキット）を用いて、ＵＶ光によって調製された鋳型（上述）上のランダムな部位でプライミングし、鋳型に沿って伸長することによって、種々のサイズのポリヌクレオチドが生成する。Ｐｒｉｍｅ−ＩｔＩＩＲａｎｄｏｍＰｒｉｍｅｒＬａｂｅｌｉｎｇキットに記述されているようなプライミングプロトコールは、プライマーの伸長に利用できる。ＵＶ照射によって形成された二量体は、プルーフリーディング活性を持たないポリメラーゼによる伸長の妨害物の役割を果たす。こうして、ランダムプライマーによる伸長が終了した後で、ランダムなサイズのポリヌクレオチドのプールが存在することになる。
【０２２９】
本発明は、通常は増幅および／またはクローニングされたポリヌクレオチドの形で、選択された変異ポリヌクレオチド配列（または選択されたポリヌクレオチド配列の集合）を作製する方法にも使用できる。ここで、選択されたポリヌクレオチド配列は、選択可能な、少なくとも１つの所望の表現型の特徴（例えば、ポリペプチドをコードする、連結されたポリヌクレオチドの転写を促進する、タンパク質に結合する等）を持っている。事前に決められた生体高分子に結合する（例えば、受容体）といった所望の構造または機能の特性を持つハイブリッドポリペプチドを同定する１つの方法は、ポリペプチドのアミノ酸配列によって与えられる所望の構造または機能の特性を持つ個々のライブラリーメンバーを探すために、大きなポリペプチドライブラリーをスクリーニングすることである。
【０２３０】
１つの態様では、本発明は、親和性相互作用スクリーニングまたは表現型スクリーニングに適した、ディスプレイされたポリペプチドまたは抗体のライブラリーを作製する方法を提供する。本方法では、（１）ディスプレイされたポリペプチドまたは抗体、および該ディスプレイされたポリペプチドまたは抗体をコードする関連するポリヌクレオチドを含む複数の選択されたライブラリーメンバーを手に入れ、該関連ポリヌクレオチドが実質的に同一の配列を含むような、該関連ポリヌクレオチドまたはそのコピーを手に入れ、該ポリヌクレオチドまたはコピーに最適に変異を導入し、（２）ポリヌクレオチドまたはコピーをプールし、（３）ランダムまたは特殊化したプライミングおよび合成プロセスまたは増幅プロセスによる中断によって、より小さいまたは短いポリヌクレオチドを作製し、および（４）増幅、好ましくはＰＣＲ増幅を行ない、選択的に変異導入を行なって、新しく合成されたポリヌクレオチドを相同組み換えする。
【０２３１】
以下を含む一連の段階によって、有用なハイブリッドポリペプチドを発現するハイブリッドポリヌクレオチドを作製するプロセスを提供することは、本発明の目的である：
（ａ）増幅または合成プロセスを阻止または中断する手段を用いて、ポリヌクレオチドの増幅または合成プロセスを中断することによってポリヌクレオチドを作製し、種々の完成段階にあるポリヌクレオチドの複製のために、複数のより小さなまたは短いポリヌクレオチドを提供する；
（ｂ）得られた一本鎖または二本鎖ポリヌクレオチド集合に、１つまたは複数の一本鎖または二本鎖オリゴヌクレオチドを添加する。ここで、該添加されたオリゴヌクレオチドは、集合の１つまたは複数の一本鎖または二本鎖ポリヌクレオチドに対する非相同性領域中に同一の領域を含む；
（ｃ）得られた一本鎖または二本鎖オリゴヌクレオチドを変性させて、一本鎖ポリヌクレオチドの混合物を作製し、選択的により短いまたは小さいポリヌクレオチドを種々の長さを持つポリヌクレオチドのプールに分離し、さらに選択的に、該ポリヌクレオチドをＰＣＲ手順を施して、少なくとも１つの該ポリヌクレオチドプールに含まれる１つまたはそれ以上のオリゴヌクレオチドを増幅する；
（ｄ）複数の該ポリヌクレオチドまたは少なくとも１つの該ポリヌクレオチドのプールを、一本鎖ポリヌクレオチドの間で同一の領域において該一本鎖ポリヌクレオチドがアニーリングするような条件下で、ポリメラーゼとインキュベートして、それによって変異導入された二本鎖ポリヌクレオチド鎖を形成させる；
（ｅ）選択的に段階（ｃ）および（ｄ）を繰り返す；
（ｆ）該ポリヌクレオチド鎖から、少なくとも１つのハイブリッドポリペプチドを発現させる；
（ｇ）該少なくとも１つのハイブリッドポリペプチドから有用な活性をスクリーニングする。
【０２３２】
本発明の１つの好ましい局面では、増幅または合成プロセスの阻止または中断方法は、ＵＶ光、ＤＮＡ付加物、ＤＮＡ結合タンパク質の利用である。
【０２３３】
本発明の１つの態様では、ＤＮＡ付加物、またはＤＮＡ付加物を含むポリヌクレオチドは、ＤＮＡ断片を含む溶液の加熱を含むプロセスなどによって、さらに処理する前にポリヌクレオチドまたはポリヌクレオチドプールから除去される。
【０２３４】
１つの局面では、核酸はスクリーニングまたは配列決定の前に標準化できる。
【０２３５】
ＤＮＡ単離
環境試料から標準化されたＤＮＡライブラリーを作製する時の重要なステップは、試料からの核酸の調製である。ＤＮＡは、当技術分野で周知の様々なテクニックを用いて試料から調製できる（「環境中の核酸、方法および応用（ＮｕｃｌｅｉｃＡｃｉｄｓｉｎｔｈｅＥｎｖｉｒｏｎｍｅｎｔＭｅｔｈｏｄｓ＆Ａｐｐｌｉｃａｔｉｏｎｓ）」、Ｊ．Ｔ．Ｔｒｅｖｏｒｓ、Ｄ．Ｄ．ｖａｎＥｌｓａｓ、ＳｐｒｉｎｇｅｒＬａｂｏｒａｔｏｒｙ、１９９５）。好ましくは、得られたＤＮＡのサイズは大きく、酵素阻害剤および他の汚染物質を含まない。ＤＮＡは環境試料から直接単離することもできるが（直接の溶解）、ＤＮＡ回収の前に細胞を収集することもできる（細胞の分離）。細胞の分離に基づくプロトロールに比較して、直接溶解手順には、いくつかの利点がある。直接溶解テクニックでは、細胞分離テクニックで回収されるＤＮＡと比較して、一般に微生物のコミュニティをより広く代表するＤＮＡがより多く得られるが、サイズはより小さいことがあり、酵素阻害剤を含む可能性がより高い。高分子量および高純度のＤＮＡを提供する、非常に有用な直接溶解テクニックが最近記述された（Ｂａｒｎｓ、１９９４；Ｈｏｌｂｅｎ、１９９４）。阻害剤存在する場合には、採用できる細胞単離を利用するプロトコールがいくつかある（Ｈｏｌｂｅｎ、１９９４）。また、以下に記述するビスベンジミド分離（塩化セシウム単離）のような分画テクニックを用いてＤＮＡの純度を改善することもできる。
【０２３６】
標準化の前にＤＮＡ試料を分画すると、サンプリングした生物体プールに少数しか存在しない種のＤＮＡをクローニングする確率が高くなる。本発明では、好ましくはＤＮＡは密度遠心テクニックを用いて分画される。そのようなテクニックの一例は、塩化セシウム勾配である。好ましくは、このテクニックはＤＮＡの領域に結合して核酸の浮遊密度を変化させる、核酸インターカレート剤の存在下で行なう。より好ましくは、核酸インターカレート剤は、ＤＮＡの領域（ビスベンジミドの場合にはＡＴ）（Ｍｕｌｌｅｒ、１９７５；Ｍａｎｕｅｌｉｄｉｓ、１９７７）に選択的に結合するビスベンジミドのような色素である。ビスベンジミドのようなインターカレート剤と複合体を作った核酸は、適当な塩化セシウム勾配で分離されるので、核酸は分画される。インターカレート剤がＧＣまたはＡＴ領域のようなＤＮＡ領域に選択的に結合すると、核酸はＤＮＡの相対的な塩基含量によって分離される。複数の生物体の核酸は、このようにして分離できる。
【０２３７】
密度勾配は、現在、核酸を分画するために利用されている。例えば、土壌のタイピングおよび生物環境浄化に使用する微生物核酸の分離には、ビスベンジミド密度勾配の利用が記述されている。これらの実験では、生物環境浄化処理の前後で、固定されたベンジミド勾配におけるＡ．ｓｕｂ．２６０ピークの相対量を評価して、細菌群がどのように影響されたかを検討する。このテクニックは、平均して種のＧＣ含量は相対的に一定であるという前提に基づいている。本発明ではこのテクニックはゲノムの複雑な混合物の分画に利用される。試料由来の核酸を超遠心して分画し、発表された手順にしたがってＡ．ｓｕｂ．２６０を測定する。
【０２３８】
本発明の１つの局面では、各ピークから等量のＡ．ｓｕｂ．２６０ユニットが取り出され、以下に説明するものを含め当技術分野で周知の種々の増幅プロトコールを用いて核酸が増幅され、遺伝子ライブラリーが調製される。または、各ピークから等量のＡ．ｓｕｂ．２６０が取り出され、この核酸から直接に遺伝子ライブラリーが調製される。このようにして遺伝子ライブラリーは、各ピークからの同じ量のＤＮＡの組み合せから調製される。この戦略によって、分画しないＤＮＡ試料全体からライブラリーが作製されていたなら、生物体が非常に少量しか存在しないために表されないか失われる場合もあるような、環境試料および濃縮物内に少量存在する生物体からも、遺伝子を得ることができる。または、以下に説明するテクニックを用いて分画後にＤＮＡを標準化できる。その後、この分画済／標準化ＤＮＡからＤＮＡライブラリーを作製できる。
【０２３９】
分画された核酸の複数の画分の組成は、当技術分野で周知のＰＣＲ関連増幅分類法を用いて決定できる。
【０２４０】
以前の標準化プロトコールは、標準化ｃＤＮＡライブラリーの作製のために設計された（国際公開公報第９５／０８６４７号、国際公開公報第９５／１１９８６号）。これらのプロトコールは、もともとＭＲＮＡ由来のまれなｃＤＮＡのクローニングと単離のために開発された。本発明は非培養または環境試料からの、標準化したゲノムＤＮＡ遺伝子ライブラリーの作製に関する。
【０２４１】
環境試料または初代濃縮培養から直接単離された核酸試料は、通常多数の微生物由来のゲノムを含む。このような複雑な生物コミュニティは、１つの集合内に存在する種の絶対数、および試料内の各生物体の相対量によって記述することができる。試料内の各生物体の全体の標準化は、非常に困難である。光ピンセットのような分離テクニックは、試料中で形態学的に異なるメンバーを選ぶために使用できる。各メンバーの細胞を同じ数ずつ合わせるか、試料中の各メンバーの純粋培養を調製して、各純粋培養の細胞を同じ数ずつ合わせることで、標準化を行なう。実際には、これは特にハイスループットでは非常に困難な作業である。
【０２４２】
本発明は、環境試料中に存在するゲノムの標準化、標準化した核酸からのＤＮＡの作製、および関心対象の活性に関するライブラリーのスクリーニングのためのテクニックの使用に関する。
【０２４３】
本発明の１つの局面では、試料からＤＮＡが単離され、分画される。そして核酸の鎖を溶解して、一定条件で選択的にアニーリングさせる（Ｃ．ｓｕｂ．ｏｔ駆動のハイブリダイゼーション）。または、この溶解プロセスの前にＤＮＡを分画しない。核酸断片の混合物が溶解され、厳密条件下でアニールされると、頻度の高い配列は、低い配列よりも速く相補鎖を見つける。選択的に一本鎖核酸単離を行なった後、まれな配列の濃縮物を表す一本鎖核酸を増幅して、遺伝子リブラリーを作製する。この手順によって、まれまたは量の少ない核酸分子が増幅されることになる。これらの分子を用いて、ライブラリーが作製される。全てのＤＮＡが回収されると、もともとＤＮＡを含んでいた生物体の識別が失われうる。この方法では、「クローニングできない供給源」からＤＮＡを回収することができる。
【０２４４】
以前に記述されたテクニックを用いて得られた核酸試料を増幅して、標準化プロセスを完了する。例えば、試料はＫｏら（Ｋｏ、１９９０ｂ；Ｋｏ、１９９０ａ、Ｔａｋａｈａｓｈｉ、１９９４）によって記述されたようなＰＣＲ増幅プロトコール、またはより好ましくはＢａｒｎｅｓ（１９９４）またはＣｈｅｎｇ（１９９４）に記述された長いＰＣＲプロトコールを用いて、増幅される。
【０２４５】
標準化は直接行なうか、標準化プロセスの前に核酸プールの複雑度を減らすための手順を踏んでから行なう。複雑度を低下させることは、あまり表されていない生物体から核酸を回収するために有益である。
【０２４６】
ライブラリーを調製する元になる微生物には、真正細菌（Ｅｕｂａｃｔｅｒｉａ）および古細菌（Ａｒｃｈａｅｂａｃｔｅｒｉａ）のような原核微生物、および真菌、一部の藻類、プロトゾアのような下等真核微生物が含まれる。微生物は環境試料から得た培養微生物または非培養微生物で、そのような微生物は好熱菌、超好熱菌、好冷菌、低温細菌等のようなエクストレモフィルでよい。
【０２４７】
上述のように、ライブラリーは環境試料から作製することができるが、その場合、ＤＮＡは生物体の培養なしで回収しても良いし、培養生物体から回収しても良い。
【０２４８】
標的ＤＮＡを得るための開始材料ライブラリーとしての微生物ＤＮＡ供給源は、特に、北極および南極の氷、水、または永久凍土から得られた微生物試料、火山由来の材料、熱帯の土壌または植物由来の材料等のような環境試料を含むと考えられる。したがって、例えば、ゲノムＤＮＡは培養可能または培養不能な生物体から回収し、適切な組み換え発現ライブラリーの作製に用いて、その後、酵素活性を決定することができる。
【０２４９】
細菌および多くの真核生物は、その産物が関連したプロセスに関与する遺伝子を調節するための協調した機構を持っている。遺伝子は単一の染色体上で「遺伝子クラスター」と呼ばれる構造となって密集し、クラスター全体の転写を開始する単一のプロモーターを含む単一の調節配列の制御下で、一緒に転写される。合わせて調節に関与する遺伝子クラスター、プロモーター、および別の配列は、「オペロン」と呼ばれ、通常は２から６の遺伝子、最高２０またはそれ以上の遺伝子を含む。このように、遺伝子クラスターは、通常は機能に関して、関連するまたは同一の隣接する遺伝子群である。
【０２５０】
いくつかの遺伝子ファミリーは、同一のメンバーからなる。集団になっている遺伝子は、必ずしも同一ではないが、集団化は遺伝子間の同一性を維持するための必要条件である。遺伝子クラスターは隣接する関連遺伝子が重複した極端なものから、何百もの同一の遺伝子が縦列しているものまである。特定の遺伝子の繰り返しに、意義が見いだされない場合もある。その代表例は、哺乳類の他の種では単一のインスリン遺伝子が適切であるのに、ある種ではインスリン遺伝子が重複して発現するものである。
【０２５１】
遺伝子クラスターおよびそれからタンパク質が発現するためにクラスターの全長がどの程度必要かをさらに研究することは、重要である。さらに、遺伝子クラスターは継続的に再編成を受けているため、例えば細菌または他の原核生物由来の遺伝子クラスターの不均質なライブラリーを作製する能力は、特に、様々な有用な活性を持つポリケチドの合成をになうポリケチド合成酵素のような酵素を含む新規のタンパク質源を決定するうえで、価値がある。例えば、抗生物質、抗ウイルス薬、抗腫瘍薬、およびインスリンのような調節タンパク質を含め、他の種類の遺伝子クラスターの産物のタンパク質も予測される。
【０２５２】
ポリケチドは、抗生物質（テトラサイクリンやエリスロマイシンなど）、抗がん剤（ダウノマイシン）、免疫抑制剤（ＦＫ５０６およびラパマイシン）、および動物薬（モネンシン）を含む生理活性の非常に豊かな供給源となる分子である。多くのポリケチド（ポリケチド合成酵素に作製される）は、治療薬として価値が高い。ポリケチド合成酵素は、長さおよび機能や環化のパターンが異なる多様な炭素鎖の生合成を触媒する、多機能酵素である。ポリケチド合成酵素遺伝子は、遺伝子クラスターとなっており、少なくとも１つのタイプ（タイプＩと呼ばれる）のポリケチド合成酵素は、大きなサイズの遺伝子および酵素を持っており、遺伝子操作やこれらの遺伝子／タンパク質のインビトロ研究を複雑なものにしている。
【０２５３】
ポリケチドおよびポストポリケチド生合成遺伝子のライブラリーから、研究のために新規のポリケチドを求めて所望の成分を選択し組み合せる能力は魅力的である。本発明の方法では、大きな挿入物（特にＦ因子ベースのベクターを使用する場合）を含むクローンで遺伝子バンクを作製できるので、遺伝子クラスターのクローニングが容易になるため、本発明の方法は新規のポリケチド合成酵素のクローニングを可能にし、容易にする。
【０２５４】
好ましくは、遺伝子クラスターのＤＮＡをベクターに連結する。特に、ここでベクターはさらに、連結された遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレイの活性の作製を制御および調節する、発現調節配列も含む。外来核酸の導入収容力が特に大きいベクターは、そのような遺伝子クラスターに使用するのに特に適しており、本明細書では大腸菌（Ｅ．ｃｏｌｉ）のＦ因子（または稔性因子）を含む例によって記述されている。大腸菌（Ｅ．ｃｏｌｉ）のこのＦ因子は接合時に高頻度で起こるそれ自身の移動に影響を与えるプラスミドで、微生物の混合試料由来の遺伝子クラスターのような、大きな核酸断片を安定的に増やすために理想的である。
【０２５５】
標準化したライブラリーが作製されたら、本明細書に説明されるハイスループットロボットフォーマットを含む、種々のフォーマットの固相または液相スクリーニングアッセイを用いて、独自の酵素活性を発見できる。ライブラリーの作製に使われるＤＮＡの標準化は、このプロセスの鍵となる。標準化によって、試料中に少量しかないものを含め、重要な生物体由来のＤＮＡをより広く表すことができる。
【０２５６】
以下の実施例は本発明を説明するものであり、限定するものではない。実施例に説明される手順は、本発明の特定の局面を実施するために典型的に使用できるものではあるが、当業者に周知の他の手順も使用できる。
【０２５７】
実施例１
１６ＳｒＤＮＡ遺伝子の末端制限酵素断片長多型（Ｔ−ＲＦＬＰ）
以下の方法は、多様度指数（環境試料指標化）を得るための方法を示す。
【０２５８】
材料および方法：
ＰＣＲ増幅：

【０２５９】
％アガロースゲルにＰＣＲ産物（１００ μｌ）をかける。ＤＮＡはＱＩＡＥＮＱＩＡｑｕｉｃｋゲル抽出キットを用いて抽出する。
【０２６０】
清潔で鋭利なメスでアガロースゲルからＤＮＡ断片を切り出す。
【０２６１】
無色のチューブに入れたゲル断片の重量を測定する。ゲルの体積１（１００ｍｇ〜１００ μｌ）に対して緩衝液ＱＧを３加える。
【０２６２】
５０℃で１０分間（またはゲル断片が完全に溶解するまで）インキュベートする。ゲルの溶解を促進するため、インキュベーション中２〜３分ごとにチューブをボルテックスで撹拌する。
【０２６３】
ゲル断片が完全に溶解した後、反応液の色が黄色（アガロースを入れないときの緩衝液ＱＧと類似）であることを確認する。
【０２６４】
提供されている２ｍｌコレクションチューブに、ＱＩＡｑｕｉｃｋスピンカラムを入れる。ＤＮＡの結合のために、試料をＱＩＡｑｕｉｃｋカラムに入れ、１分間遠心する。フロースルーを廃棄し、同じコレクションチューブにＱＩＡｑｕｉｃｋカラムを戻す。洗浄のために、０．７５ｍｌの緩衝液ＰＥをＱＩＡｑｕｉｃｋカラムに加え、１分間遠心する。フロースルーを廃棄し、ＱＩＡｑｕｉｃｋカラムをさらに１分間、＞１０，０００×ｇで遠心する。ＱＩＡｑｕｉｃｋカラムを清潔な１．５ｍｌ微量遠心チューブに入れる。ＤＮＡの溶出のため、３０ μｌの緩衝液ＥＢ（１０ｍＭＴｒｉｓ−Ｃｌ、ｐＨ８．５）またはＨ_２ＯをＱＩＡｑｕｉｃｋメンブレンの中央に添加し、カラムを１分間静置してから、１分間遠心する。
【０２６５】
ＤＮＡ濃度のピコグリーン定量
ピコグリーンｄｓＤＮＡ定量キット（ＥＵＧＥＮＥ、カタログ番号Ｐ−７５８９）を用いたＤＮＡ濃度のアッセイ：

必要ならば全ての試料濃度を３０ｎｇ／μｌに調節する（元の体積＝３０ μｌならば、３０ｎｇ／μｌのための最終体積（μｌ）＝元の濃度（ｎｇ／μｌ））
【０２６６】
消化：
ＤＮＡ試料をＨｉｎｐ１Ｉ、ＭｓｅＩ、およびＭｓｐＩで一晩消化し、ＧｅｎｅＦｉｎｄｅｒで比較する。
【０２６７】
反応：０．５ μｌ酵素＋０．５ μｌ緩衝液（ＮＥ緩衝液２）＋４ μｌＤＮＡ
５ μｌの小さな体積を保つため、消化はＰＣＲ装置中で３７℃で行われる。
【０２６８】
ゲル調整：ＦＭＣロングレンジャーゲルプロトコールマニュアル
ＡＢＩ自動シーケンサーマニュアルの説明にしたがって、ガラスプレート（ＡＢＩ３７７用３６ｃｍプレート）およびスペーサー（０．２ｍｍ）をカセットで組み立てる。プレートは特別の非陰イオン洗浄剤ＡＬＣＯＮＯＸで十分に洗う。スペーサーはくぼみを内側にして蒸留水でプレートに付ける。ロングレンジャーシングルパックを室温にする。シーケンサーとプレートの長さに合う、ロングレンジャーシングルパックを使用する。黒のクリップを外し、コンパートメントの内容物を手で穏やかかつ十分に１分間混合する。パックを回転式攪拌機におき、中スピードで５分間撹拌する。手で穏やかかつ十分に１分間混合する。パックを回転式攪拌機上に置き、中スピードで５分間撹拌する。注：混合しすぎないこと。ゲルの重合に干渉しうる。
【０２６９】
ゲルのキャスティング（ロングレンジャーゲルプロトコール）
注：以下の段階は速やかに完了されねばならない。
赤いクリップのみを外し、コンパートメントの内容物を手で十分に１分間混合する。白のクリップを外し、フィルターをゲル溶液に露出する。内容物がフィルター端から排出するように、パックを保持する。記された線でパックを半分に折る。切り取りマークがパックの上端に来るようにパックを持ち、ＣＵＴと記されたスペース内で角を切り取る。気泡を避けるため、溶液がフィルターを通って定常的に流れるために十分に大きな穴を袋に開ける。混合後に溶液に気泡が入らないようにする。標準的なやり方で、ゲルを作製し、櫛を挿入する。ゲルが重合したら（３０分）、電気泳動緩衝液に浸したペーパータオルをプレートの端の上に置き、プラスチックラップで覆う。これにより、重合プロセスが継続する間に水分が失われるのを予防する。完全にゲルが重合するまで２時間ほどかかる。
注：空のロングレンジャーシングルパックは、通常のごみ入れに廃棄できる。
【０２７０】
電気泳動の調製（ロングレンジャーゲルプロトコールＦＭＣ）
櫛を取り外し、ＡＢＩ自動シーケンサーマニュアルの説明にしたがって、プレートを洗う。１０×ＴＢＥストックを脱イオン水で１×に希釈して、陽極および陰極チェンバーの両方を満たすために十分な量の電気泳動緩衝液を調製する。

最終体積が１０００ｍＬになるようにＨ_２Ｏを加え、完全に混合して、＜０．４５ μｍメンブレンで濾過する。
【０２７１】
室温で保存する。沈殿物が形成されたら使用しない。
注：最善の結果を得、またＴＢＥストック溶液の沈殿を予防するため、容器に埃の粒子が入らないようにし、ピペット等を挿入せずに、ボトルから注ぐようにする。≦１Ｌの量を調製する。大型ガラス瓶には保存しないこと。
【０２７２】
製造元の指示にしたがって、ゲルカセットをシーケンシング装置に取り付ける。
【０２７３】
プレートとゲルが清潔なことを確認するため、色素セットに特異的なプレートチェックモジュールを実行する。
【０２７４】
３６ｃｍプレートでＡＢＩＰｒｉｓｍ３７７遺伝子スキャンを行なう。
注：ＡＢＩＰｒｉｓｍ３７７自動シーケンサーマニュアルの説明にしたがって、ロングレンジャーゲル溶液用の分析マトリックス標準ファイルを作製する。
【０２７５】
１．「４％Ａｃ」設定を用いて、通常通りに試料シートを用意する。
【０２７６】
２．温度が５１℃になるまで約１０〜２０分間、希望するモードを用いてゲルの予備ラン（ｒｕｎ）を行なう。５１℃になるために必要な以上に、予備ランを行なわないこと。
【０２７７】
３．遺伝子スキャンラン用にＤＮＡ試料を調製し、各レーンに適切な量を加える。
【０２７８】
４．１．４ＫＢよりも小さい断片には、ランｈｒｓをラン時間に用いる。
【０２７９】
５．ＡＢＩ遺伝子スキャン分析マニュアルの説明にしたがって遺伝子スキャンランを分析する。
【０２８０】
ＤＩ数の計算：

【０２８１】
本発明はその特定の好ましい態様に関して詳細に説明されているが、修正および変更は、説明および請求の精神および範囲内であることが理解されると考えられる。

Claims

試料の核酸プロフィールを得る方法であり、以下の段階を含む方法：
試料が生物体の混合集団を含む、複数の核酸配列を試料から得る段階；
複数の核酸配列から作製されたライブラリー中の少なくとも１つのクローンの配列を決定する段階；
データベースが複数の生物体由来の複数の核酸配列を含む、少なくとも１つのクローンの配列をデータベース中のデータと比較するために、アルゴリズムを用いてデータベース検索を実行する段階；及び
少なくとも１つのクローン配列と相同性を持つ、データベース中の配列を同定し、それによって試料の核酸プロフィールを得る段階。
生物体の混合集団が、非培養生物体または培養生物体に由来する、請求項１記載の方法。
非培養生物体または培養生物体が環境試料から単離される、請求項２記載の方法。
環境試料から単離される生物体がエクストレモフィル（ｅｘｔｒｅｍｏｐｈｉｌｅ）である、請求項３記載の方法。
エクストレモフィルが好熱菌、超好熱菌、好冷菌、好塩菌、抗酸菌、好圧菌、および低温細菌（ｐｓｙｃｈｒｏｔｒｏｐｈｓ）からなる群より選択される、請求項４記載の方法。
複数の核酸配列が、ゲノムＤＮＡ、もしくはその断片または複数の核酸配列から作製されたｃＤＮＡである、請求項１記載の方法。
ゲノムＤＮＡまたはその断片が、１つもしくは複数のオペロン、またはその一部を含む、請求項６記載の方法。
オペロンまたはその一部が、完全または部分的な代謝経路をコードする、請求項７記載の方法。
複数のクローンを含むライブラリーが、ファージ、プラスミド、ファージミド、コスミド、フォスミド、ウイルスベクターおよび人工染色体からなる群より選択される、請求項１記載の方法。
ライブラリーが、細菌、真菌、植物細胞、昆虫細胞および動物細胞からなる群より選択される宿主細胞に含まれる、請求項１記載の方法。
宿主細胞が細菌細胞である、請求項１記載の方法。
細菌細胞が、大腸菌（Ｅ．ｃｏｌｉ）、バチルス（Ｂａｃｉｌｌｕｓ）、連鎖球菌（Ｓｔｒｅｐｔｏｍｙｃｅｓ）、またはネズミチフス菌（Ｓａｌｍｏｎｅｌｌａｔｙｐｈｉｍｕｒｉｕｍ）細胞である、請求項１１記載の方法。
宿主細胞が真菌細胞である、請求項１記載の方法。
真菌細胞が酵母細胞である、請求項１３記載の方法。
宿主細胞がショウジョウバエ（Ｄｒｏｓｏｐｈｉｌａ）Ｓ２細胞またはスポドプテラ（Ｓｐｏｄｏｐｔｅｒａ）Ｓ９細胞である、請求項１記載の方法。
宿主細胞が動物細胞である、請求項１記載の方法。
動物細胞がＣＨＯ細胞、ＣＯＳ細胞またはＢｏｗｅｓメラノーマ細胞である、請求項１６記載の方法。
配列決定がハイスループットシーケンシングにより行われる、請求項１記載の方法。
少なくとも１つのクローンが２つまたはそれ以上のクローンである、請求項１記載の方法。
データベースが、ＧｅｎＢａｎｋ、ＰＦＡＭ、またはＰｒｏＤｏｍからなる群より選択される、請求項１記載の方法。
アルゴリズムが、Ｓｍｉｔｈ−Ｗａｔｅｒｍａｎ、Ｎｅｅｄｌｅｍａｎ−Ｗｕｎｓｃｈ、ＢＬＡＳＴ、ＦＡＳＴＡ、ＢＬＩＴＺ、およびＰＳＩ−ＢＬＡＳＴからなる群より選択される、請求項１記載の方法。
相同性が事前に設定された閾値として定義される、請求項１記載の方法。
相同性が少なくとも約６０％である、請求項１記載の方法。
相同性が少なくとも約７０％である、請求項１記載の方法。
相同性が少なくとも約８０％である、請求項１記載の方法。
相同性が少なくとも約９０％である、請求項１記載の方法。
ライブラリーが少なくとも約１０^４のクローンを含む、請求項１記載の方法。
ライブラリーが少なくとも約１０^５のクローンを含む、請求項１記載の方法。
ライブラリーが少なくとも約１０^６のクローンを含む、請求項１記載の方法。
ライブラリーが少なくとも約１０^７のクローンを含む、請求項１記載の方法。
ライブラリーが少なくとも約１０^８のクローンを含む、請求項１記載の方法。
ライブラリーが少なくとも約１０^９のクローンを含む、請求項１記載の方法。
ライブラリーが少なくとも約１０^１０のクローンを含む、請求項１記載の方法。
ライブラリーの形成の前に核酸が標準化される、請求項１記載の方法。
ライブラリーが約０．０１から１０^１０の多様度指数を持つ、請求項１記載の方法。
ライブラリーが約０．１から１０^９の多様度指数を持つ、請求項１記載の方法。
ライブラリーが約０．１を上回る多様度指数を持つ、請求項１記載の方法。
ライブラリーが約１．０を上回る多様度指数を持つ、請求項１記載の方法。
ライブラリーのクローンが、約０．５ｋｂから１０ｋｂの核酸挿入物を含む、請求項１記載の方法。
ライブラリーのクローンが、約１ｋｂから８ｋｂの核酸挿入物を含む、請求項１記載の方法。
ライブラリーのクローンが、約１ｋｂから７ｋｂの核酸挿入物を含む、請求項１記載の方法。
配列決定が、挿入物の１つの末端からの配列決定を含む、請求項１記載の方法。
配列決定が、挿入物の両端からの配列決定を含む、請求項１記載の方法。
生物体が微生物である、請求項１記載の方法。
試料の核酸プロフィールを得る方法であり、以下の段階を含む方法：
試料が植物の混合集団を含む、試料から複数の核酸配列を得る段階；
複数の核酸配列から作製された核酸ライブラリー中の少なくとも１つのクローンの配列を決定する段階；
データベースが複数の生物体由来の複数の核酸配列を含む、少なくとも１つのクローンの配列をデータベース中のデータと比較するために、アルゴリズムを用いてデータベース検索を実行する段階；及び
少なくとも１つのクローン配列と相同性を持つ、データベース中の配列を同定し、それによって試料の核酸プロフィールを得る段階。