JP2004523211A

JP2004523211A - 高温ポリメラーゼ活性を有する酵素およびその使用方法

Info

Publication number: JP2004523211A
Application number: JP2002525742A
Authority: JP
Inventors: ウォルターカレン; エリックジェイマサー; ジェイエムショート
Original assignee: ディヴァーサコーポレイション
Priority date: 2000-09-06
Filing date: 2001-09-06
Publication date: 2004-08-05
Also published as: US8148126B2; AU2001288859A1; WO2002020735A3; EP1315803A2; US20110195479A1; US20020115108A1; US20020132997A1; US7781198B2; US20020164618A1; CA2419975A1; US7049101B1; WO2002020735A2

Abstract

本発明は、９０℃から１１３℃の範囲の温度でポリメラーゼ活性を有する耐熱性ポリメラーゼ（例えばＰｙｒｏｌｏｂｕｓｆｕｍａｒｉａに由来するもの）および前記ポリメラーゼをコードするポリヌクレオチドに関する。さらに本発明は、新規な耐熱性ＤＮＡポリメラーゼをデザインする方法、およびその使用方法もまた提供する。前記ポリメラーゼは、高いｐＨおよび温度で高い活性および安定性を有する。

Description

【０００１】
本発明は一般に、酵素、前記酵素をコードするポリヌクレオチド、前記のポリヌクレオチドおよびポリペプチドの使用に関し、より具体的には高温でポリメラーゼ活性を有する酵素に関する。
【０００２】
【従来技術】
好熱細菌は、高活性の耐熱酵素の供給源として大きな注目を浴びてきた。好熱細菌由来のＤＮＡポリメラーゼに対する関心は核酸増幅方法の発明とともに高まった。現に存在する核酸を最初に存在した量と比較して大量に増幅させるために耐熱酵素（例えば米国特許４，１６５，１８８号に記載されたようなもの）を使用することについては米国特許第４，６８３，１９５号および４，６８３，２０２号（これらはＰＣＲの方法について記載している）で開示された（前記特許は引用により本明細書に含まれる）。
【０００３】
前記ＰＣＲの方法は、標的核酸の変性、プライマーのハイブリダイゼーションおよびＤＮＡポリメラーゼによって触媒される相補鎖の合成を伴う。各プライマーの増幅生成物は、所望の核酸配列の生成のための鋳型になる。使用されるポリメラーゼが耐熱性酵素であれば、熱によってポリメラーゼ活性が破壊されないので、ポリメラーゼを変性工程後に毎回添加する必要がない。熱耐性ＤＮＡポリメラーゼは、ＰＣＲによるＤＮＡの増幅を実施しているときに例えば９３℃から９５℃に短時間加熱されたときでも不可逆的に活性を失うことはない。対照的に、前記のような温度上昇で大腸菌（Ｅ．ｃｏｌｉ）のＰｏｌＩは不活化される。
【０００４】
超好熱古細菌、例えばピロジクチウム（Ｐｙｒｏｄｉｃｔｉｕｍ）およびメタノピルス（Ｍｅｔｈａｎｏｐｙｒｕｓ）は約１１０℃の温度で増殖し、８０℃以下では増殖できない（例えば以下の文献を参照されたい：Ｓｔｅｔｔｅｒｅｔａｌ．，１９９０，ＦＥＭＳＭｉｃｒｏｂｉｏｌｏｇｙＲｅｖｉｅｗｓ７５：１１７−１２４（前記文献は引用により本明細書に含まれる））。前記の硫黄還元性、偏性嫌気性細菌は海底環境から単離される。例えば、Ｐ．アビッシー（ａｂｙｓｓｉ）は、グエイマスメキシコ（ＧｕａｙｍａｓＭｅｘｉｃｏ）のはずれの深海（深さ２０００メートル）にある活動性“スモーカー”の噴気口の噴出水（３２０℃）から単離された（Ｐｌｅｙｅｔａｌ．，１９９１，ＳｙｓｔｅｍａｔｉｃａｎｄＡｐｐｌｉｅｄＭｉｃｒｏｂｉｏｌｏｇｙ１４：２４５）。知られるかぎり最高の温度に生息する超好熱細菌、ピロロブス・フマリア（Ｐｙｒｏｌｏｂｕｓｆｕｍａｒｉａ）は、熱水噴出口（時にスモーカーと称され、ここを通って超高熱の鉱物に富む液体が噴出する）の壁内で増殖する。ピロロブス・フマリアは、約１０５℃の環境でもっともよく繁殖し、１１３℃までの温度で分裂することができるが、９０℃以下の温度で増殖を停止する。
【０００５】
より一般的な好熱細菌は、約９０℃の最適増殖温度および１００℃または１００℃近くの最高増殖温度を有する。前記より穏やかな超好熱細菌は培養で増殖させることができる。例えば、ＤＮＡポリメラーゼをコードする遺伝子が、テルモコッカス・リトラリス（Ｔｈｅｒｍｏｃｏｃｃｕｓｌｉｔｏｒａｌｉｓ）からクローニングされ、配列を決定された（ＥＰ４５５４３０号）。
しかしながら、超好熱細菌の培養は、固形寒天培地で増殖できないために困難である。例えば、ピロジクチウムの個々の細胞は極めて壊れやすく、さらにこの細菌は線維状ネットワークとして増殖し、通常の発酵装置のスチール部分に目詰まりをもたらす。したがってピロジクチウムの培養は標準的な細菌発酵技術では極めて難しい。（例えば以下を参照されたい：Ｊ．Ｔ．Ｓｔａｌｅｙｅｔａｌ．ｅｄｓ．，Ｂｅｒｇｅｙ’ｓＭａｎｕａｌｏｆＳｙｓｔｅｍａｔｉｃＢａｃｔｅｒｉｏｌｏｇｙ，１９８９，ＷｉｌｌｉａｍｓａｎｄＷｉｌｋｉｎｓ，Ｂａｌｔｉｍｏｒｅ（この文献は引用により本明細書に含まれる））。前記の問題およびその他の問題は、性状決定およびアミノ酸配列分析のために大量の精製された核酸ポリメラーゼ酵素を調製する実験室培養を困難にするであろう。
当技術分野では、ＰＣＲの工程を改善するために、さらにＰＣＲ以外の他の遺伝子組換え技術（例えばＤＮＡ配列決定、ニック−トランスレーションおよび逆転写）で耐熱性ＤＮＡポリメラーゼを用いたときに得られる結果を改善するために用いることができる、熱安定性が強化された耐熱性ＤＮＡを製造することが所望される。
【０００６】
発明の概要
本発明は、配列番号：１、３、５、７、９、１１、１３、１５に示される配列、および配列番号：１、３、５、７、９、１１、１３、１５と少なくとも５０％の配列同一性をもつその変種の配列を有し、４時間からそれ以上の時間の超高温（例えば９５℃から１１３℃）でポリメラーゼ活性を有するポリペプチドをコードする単離核酸を提供することによって、前記および他の要求に応える。
本発明の特徴の１つは、配列番号：１、３、５、７、９、１１、１３、１５に示される配列、前記配列と実質的に同一の配列および前記に相補的な配列を有する単離核酸である。
【０００７】
本発明の別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示される配列、前記配列と実質的に同一の配列、および前記配列と相補的な配列の少なくとも１０個の連続した塩基配列を含む単離核酸である。
さらに別の特徴では、本発明は、配列番号：２、４、６、８、１０、１２、１４、１６に示される配列を有するポリペプチド、および前記配列と少なくとも５０％の配列同一性を有するその変種をコードし、さらに９５℃から１１３℃の範囲の温度で耐熱性ポリメラーゼ活性を有するポリペプチドをコードする単離核酸を提供する。
本発明の別の特徴は、配列番号：２、４、６、８、１０、１２、１４または１６に示される配列および前記配列と実質的に同一である配列を有するポリペプチドまたはその機能的フラグメントをコードする単離核酸である。
【０００８】
本発明のまた別の特徴は、配列番号：２、４、６、８、１０、１２、１４または１６に示される配列および前記配列と実質的に同一の配列の少なくとも１０個の連続したアミノ酸を含むポリペプチドをコードする単離核酸である。
さらに別の特徴では、本発明は、配列番号：２、４、６、８、１０、１２、１４または１６に示される配列および前記配列と実質的に同一の配列を有する精製ポリペプチドを提供する。
本発明のまた別の特徴は、配列番号：２、４、６、８、１０、１２、１４または１６に示される配列および前記配列と実質的に同一の配列を有するポリペプチドと特異的に結合する単離または精製抗体である。
【０００９】
本発明のまた別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６のポリペプチドおよび前記と実質的に同一の配列の１つの少なくとも１０個の連続したアミノ酸を有するポリペプチドと特異的に結合する、単離もしくは精製抗体またはその結合フラグメントである。
本発明の別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６に示される配列および前記配列と実質的に同一の配列を有するポリペプチドを製造する方法である。前記方法は、前記ポリペプチドをコードする核酸を宿主細胞に導入し、前記宿主細胞を前記核酸の発現が許容される条件下で培養することを含み、ここで前記核酸はプロモーターに作働できるように連結されている。
【００１０】
本発明の別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６に示される配列および前記配列と実質的に同一の配列の少なくとも１０個のアミノ酸を有するポリペプチドを製造する方法である。前記方法は、前記ポリペプチドをコードする核酸を宿主細胞に導入し、前記宿主細胞を前記核酸の発現が許容される条件下で培養し、それによって前記ポリペプチドを製造することを含み、ここで前記核酸はプロモーターに作働的に連結されてある。
本発明のまた別の特徴は変種を作製する方法であって、前記方法は、配列番号：１、３、５、７、９、１１、１３、１５に示される配列、前記配列と実質的に同一の配列、配列番号：１、３、５、７、９、１１、１３、１５の配列と相補的な配列、前出の配列の少なくとも３０個の連続したヌクレオチドを含むフラグメントを入手し、さらに前記配列の１つまたは２つ以上のヌクレオチドを別のヌクレオチドに変更し、前記配列の１つまたは２つ以上のヌクレオチドを欠失させ、または前記配列に１つまたは２つ以上のヌクレオチドを付加することを含む。
【００１１】
本発明の別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示される配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列が保存されてあるコンピューター読取り可能媒体である。
本発明のまた別の特徴はプロセッサおよびデータ保存装置を含むコンピュータシステムであり、ここで前記データ保存装置には、配列番号：１、３、５、７、９、１１、１３、１５に示される配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６および前記配列と実質的に同一の配列が保存されてある。
【００１２】
本発明の別の特徴は第一の配列とリファレンス配列を比較する方法で、ここで前記第一の配列は、配列番号：１、３、５、７、９、１１、１３、１５に示される配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６および前記配列と実質的に同一のポリペプチドコードを有する核酸である。前記方法は、配列を比較するコンピュータプログラムを使用して前記第一の配列およびリファレンス配列を読み出し、さらに前記第一の配列と前記リファレンス配列との間の相違を決定する工程を含む。
本発明のまた別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示される配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示される配列および前記配列と実質的に同一の配列を有するポリペプチドの特性を同定する方法であって、前記方法は、配列の特性を同定するコンピュータープログラムを使用して前記配列を読み出し、さらに前記コンピュータープログラムにより配列の特性を同定する工程を含む。
【００１３】
本発明のまた別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６および前記配列と実質的に同一の配列のフラグメントまたは変種であって、配列番号：２、４、６、８、１０、１２、１４、１６のポリメラーゼの超高温ポリメラーゼ活性（すなわち４時間またはそれ以上の時間で９５℃から１１３℃の温度）を保持するものを同定するためのアッセイである。前記アッセイは、配列番号１、３、５、７、９、１１、１３、１５および前記配列と実質的に同一の配列と少なくとも５０％の相同性を有する核酸によってコードされるポリペプチド、または配列番号１、３、５、７、９、１１、１３、１５によってコードされるポリペプチドフラグメントまたは変種を利用して、超高温で４時間またはそれ以上の時間、前記ポリペプチドまたはフラグメントまたは変種が機能できる条件下でＰＣＲ増幅でＤＮＡポリメラーゼ活性を発揮させ、さらに増幅生成物の生成を検出することを含み、ここで増幅生成物の生成は、機能的なＤＮＡポリメラーゼポリペプチドまたはフラグメントまたは変種の表示となる。
【００１４】
ある実施態様では、本発明は、本発明のポリメラーゼを用いてＤＮＡ分子の配列を決定する方法を提供する。前記方法は、（ａ）プライマーを第一のＤＮＡ分子とハイブリダイズさせ；（ｂ）前記第一のＤＮＡ分子とデオキシリボヌクレオシド三リン酸、本発明のＤＮＡポリメラーゼ（例えば配列番号：１６）およびターミネーター分子と接触させて混合物を形成し；（ｃ）前記第一のＤＮＡ分子と相補的なＤＮＡ分子のランダム集団を合成するために十分な条件下で前記混合物をインキュベートし、さらにここで合成されたＤＮＡ分子はその５’末端にターミネーターヌクレオチドを含み；さらに（ｄ）前記第一のＤＮＡ分子のヌクレオチド配列の少なくとも一部分を決定することができるように、前記合成されたＤＮＡ分子を分離する工程を含む。前記デオキシリボヌクレオシド三リン酸には、イノシンｄＡＴＰ、ｄＣＴＰ、ｄＧＴＰ、ｄＴＴＰ、ｄＩＴＰ、７−デアザ−ｄＧＴＰ、ｄＵＴＰ、［α−Ｓ］ｄＡＴＰ、［α−Ｓ］ｄＴＴＰ、［α−Ｓ］ｄＧＴＰ、または［α−Ｓ］ｄＣＴＰが含まれるが、ただしこれらに限定されない。ターミネーターヌクレオチドは、例えばｄｄＴＴＰ、ｄｄＡＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰ、またはｄｄＣＴＰを含むことができる。
【００１５】
また別の実施態様では、本発明は、本発明のポリメラーゼを利用し、さらに前記ポリメラーゼの逆転写酵素（ＲＴ）活性によってｍＲＮＡからｃＤＮＡを調製する方法を提供する。前記方法は、（ａ）ｍＲＮＡをオリゴ（ｄＴ）プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成し；（ｂ）ｃＤＮＡが得られる条件下で、工程（ａ）で生成されたハイブリッドを請求項１のＤＮＡポリメラーゼおよび４種の異なるｄＮＴＰと接触させる工程を含む。
【００１６】
本発明はまた、例えばＰＣＲ反応によって二本鎖ＤＮＡ分子を増幅する方法を提供する。前記方法は、第一および第二のプライマーを提供し（ここで前記第一のプライマーは、前記ＤＮＡ分子の第一の鎖の３’末端または３’末端近くの配列と相補的であり、さらに前記第二のプライマーは、前記ＤＮＡ分子の第二の鎖の３’末端または３’末端近くの配列と相補的である）；本発明のＤＮＡポリメラーゼ（例えば配列番号：１６）の存在下で、第一の鎖と相補的な第三のＤＮＡ分子および第二の鎖と相補的な第四のＤＮＡ分子が合成される条件下で、前記プライマーを第一の鎖と、さらに第二のプライマーを第二の鎖とハイブリダイズさせ；第一の鎖と第三の鎖、および第二の鎖と第四の鎖を変性させ；さらに１番目から３番目までの工程を１回または２回以上繰り返して、増幅ＤＮＡ分子を生成することを含む。いったん増幅されたＤＮＡが得られたならば、前記ＤＮＡ分子をベクター、例えばプラスミドでクローニングすることができる（すなわち平滑端クローニング）。
本発明はまた、非天然のヌクレオチドまたはヌクレオチド類似体をＤＮＡ分子に取り込ませる方法を提供する。前記方法は、本発明のポリメラーゼをコードするポリヌクレオチドによってコードされるポリペプチドをＤＮＡ鋳型とＰＣＲ増幅反応で接触させることを含む。前記ヌクレオチドには、例えばイノシン、２−アミノプリンまたは５−メチルシトシンが含まれる。
【００１７】
（発明の詳細な記載）
本発明はＤＮＡポリメラーゼおよび前記をコードするポリヌクレオチドに関する。ポリヌクレオチド配列番号：１５は、もともとピロロブス・フマリア（Ｐｙｒｏｌｏｂｕｓｆｕｍａｒｉａ）のゲノム遺伝子ライブラリーから回収された。この２４１２塩基対のポリヌクレオチドは、推定される８０３個のアミノ酸配列（配列番号：１６）を有するタンパク質をコードする。配列番号：１、３、５、７、９、１１、１３は、ポリメラーゼをコードするさらに別の新規な核酸配列をコードし、さらに配列番号：２、４、６、８、１０、１２および１４は対応するタンパク質である。
【００１８】
本発明は精製された熱耐性ＤＮＡポリメラーゼを提供する。前記ポリメラーゼは、相補的なポリヌクレオチドを鋳型として用いながら、ポリヌクレオチド鎖の３’末端にデオキシヌクレオチドを付加することによってＤＮＡ合成を触媒する。生成される収量は、以前に同定されているポリメラーゼを用いた場合よりも多い。天然に存在するヌクレオチド、アデニン、グアニン、シトシン、チミン、ウラシルを付加する能力の他に、本発明のポリメラーゼは、改変ヌクレオチドまたは非天然ヌクレオチド（例えばグアニン、シトシン、チミン、ウラシルの類似体（デオキシを含む））の取込みにも有用である。例えば、本発明のポリメラーゼは、２−アミノプリン、イノシン、５−メチルシトシンまたは他の非天然もしくは改変ヌクレオチドの付加に有用である。
【００１９】
精製酵素の具体例は、本明細書でピロロブス・フマリア（Ｐｙｒｏｌｏｂｕｓｆｕｍａｒｉａ）と呼ぶ微生物に由来するポリメラーゼである。前記微生物は、高熱のミネラルに富む液体が噴出する熱水噴出口の壁の中で増殖する超好熱細菌である。ピロロブス・フマリアは、約１０５℃の環境でもっともよく繁殖し、さらに１１３℃までの温度で増殖することができるが、９０℃より低い温度で増殖を停止する。前記の例示的な酵素（図１Ｂに示す配列）を用いて所望のＤＮＡを生成できる。本発明のポリメラーゼ酵素は非常に高い耐熱性および反応処理能力を有する。ピロロブス・フマリアのポリメラーゼは、９５℃から１１３℃の高温で４時間またはそれ以上の時間の後でさえ高い活性を維持する。したがって、前記ポリメラーゼは、長さが２０ｋｂより大きくおよび／またはＧＣ含有量が約９０％より高い鋳型分子のＰＣＲ増幅のために特に有用で信頼性が高い（前記ＧＣ含有量の高い鋳型は典型的にはより長い増幅時間およびより高温を必要とする）。
【００２０】
ピロロブス・フマリアのＤＮＡポリメラーゼ酵素で見出された特性であって、天然のＴａｑＤＮＡポリメラーゼおよび天然のＴｔｈＤＮＡポリメラーゼには存在しない特性の１つは３’→５’エキソヌクレアーゼ活性である。前記の３’→５’エキソヌクレアーゼ活性（一般的には“読みとり保証”（プルーフリーディング）活性として知られている）は、合成される核酸配列の塩基の取り込みミスまたは不適合が前記活性によって排除されるので概ね望ましいと考えられている。したがって、３’→５’エキソヌクレアーゼ活性を有するポリメラーゼ（例えば本発明のピロロブス・フマリアＤＮＡポリメラーゼ酵素）を利用するＰＣＲは信頼性が高くなる。しかしながら、ＤＮＡポリメラーゼ酵素で見出される３’→５’エキソヌクレアーゼ活性は、プライマーの３’末端を改変することによってＰＣＲでの非特異的バックグラウンド増幅を増加させることもある。３’→５’エキソヌクレアーゼ活性は、一本鎖ＤＮＡ（例えばプライマーまたは一本鎖の鋳型）を排除することができる。本質的に、一本鎖プライマーまたは鋳型の３’ヌクレオチドはいずれも不適合として前記酵素によって処理され、したがって分解される。ＰＣＲでのプライマーの分解を回避するために、プライマーの３’末端にホスホロチオエートを付加することができる。ホスホロチオエート修飾ヌクレオチドは、３’→５’エキソヌクレアーゼによる除去に対してより抵抗性を有する。
【００２１】
所望されるものが天然のピリロブス・フマリアＤＮＡポリメラーゼであれ、または前記酵素の誘導体もしくは同族体であれ、前記ポリメラーゼのリコンビナント型の生成は、典型的には、発現ベクターの構築、宿主細胞の前記ベクターによる形質転換、および発現が生じるような条件下での前記形質転換宿主細胞の培養を伴う。前記発現ベクターを構築するためにＤＮＡを入手する。前記ＤＮＡは、成熟酵素（本明細書では全てのムテインを包含するために用いられる）または活性を破壊しない付加配列と前記ポリメラーゼの融合物、または制御条件下（例えばペプチダーゼによる処理）で切断して活性なタンパク質を生じることができる付加配列との融合物をコードするＤＮＡである。続いて前記コード配列を発現ベクター内の適切な制御配列と動作可能なように連結させる。前記ベクターは、宿主細胞内で自立的に複製するか、または宿主細胞の染色体ＤＮＡに組み込まれるようにデザインすることができる。前記ベクターを用いて適切な宿主を形質転換し、リコンビナントポリメラーゼの発現に適した条件下で前記形質転換宿主を培養する。リコンビナントポリメラーゼを培養液または細胞から単離する。前記タンパク質の回収および精製は、ある程度の不純物は許容できるいくつかの事例では必要ではないかもしれない。
【００２２】
定義
本明細書で用いられるように、“ＤＮＡポリメラーゼ”という用語は、加水分解酵素活性を有する酵素、例えばＰＣＲ増幅工程で鋳型配列を増幅するために用いることができる酵素を包含する。
本明細書で用いられる“核酸”または“核酸配列”という用語は、オリゴヌクレオチド、ヌクレオチド、ポリヌクレオチド、または前記のいずれかのフラグメントを指し、またゲノム起源もしくは合成起源のＤＮＡまたはＲＮＡ（一本鎖でも二本鎖でもよく、さらにセンス鎖でもアンチセンス鎖でもよい）を指し、またペプチド核酸（ＰＮＡ）、任意のＤＮＡ様もしくはＲＮＡ様物質（天然または合成起源）を指す。
【００２３】
本明細書で用いられる“ヌクレオチド”とは塩基−糖−リン酸結合体を指す。ヌクレオチドは核酸配列（ＤＮＡおよびＲＮＡ）のモノマーユニットである。ヌクレオチドという用語には、デオキシリボヌクレオシド三リン酸、例えばｄＡＴＰ、ｄＣＴＰ、ｄＩＴＰ、ｄＵＴＰ、ｄＧＴＰ、ｄＴＴＰまたはその誘導体が含まれる。前記誘導体には、例えば［α］ｄＡＴＰ、７−デアザ−ｄＧＴＰおよび７−デアザ−ｄＡＴＰが含まれる。本明細書で用いられるヌクレオチドという用語はまた、ジデオキシリボヌクレオシド三リン酸（ｄｄＮＴＰ）およびその誘導体を指す。ジデオキシリボヌクレオシド三リン酸の例にはｄｄＡＴＰ、ｄｄＣＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰおよびｄｄＴＴＰが含まれるが、ただしこれらに限定されない。本発明にしたがえば、“ヌクレオチド”は標識されてなくても、また検出できるように周知の技術によって標識されてあってもよい。検出可能な標識には、例えば放射能活性アイソトープ、蛍光標識、化学発光標識、生物発光標識および酵素標識が含まれる。
【００２４】
“コード配列”または特にポリペプチドまたはタンパク質を“コードするヌクレオチド配列”とは、適切な調節配列の制御下に配置されたとき、転写され、ポリペプチドまたはタンパク質に翻訳される核酸配列である。
“遺伝子”という用語は、ポリペプチド鎖の生成に関与するＤＮＡセグメントを指す。前記用語は、コード領域の前後領域（リーダー部分およびトレーラー部分）の他に、適切な場合には個々のコードセグメント（エクソン）間の介在配列（イントロン）を含む。
本明細書で用いられる、“アミノ酸”または“アミノ酸配列”とは、オリゴペプチド、ペプチド、ポリペプチドまたはタンパク質配列、または前記のいずれかのフラグメント、部分もしくはサブユニット、および天然に存在する分子もしくは合成分子を指す。
【００２５】
本明細書で用いられる、“ポリペプチド”という用語は、ペプチド結合または修飾ペプチド結合（すなわちペプチド同配体（ｐｅｐｔｉｄｅｉｓｏｓｔｅｒｅｓ））によって互いに結合したアミノ酸を指し、遺伝子によってコードされる２０のアミノ酸以外の改変アミノ酸を含むことができる。前記ポリペプチドは、自然のプロセッシング（例えば翻訳後プロセッシング）によって、または当技術分野で周知の化学的改変技術によって改変されてもよい。改変はポリペプチドのいずれの場所（ペプチド骨格、アミノ酸側鎖およびアミノまたはカルボキシ末端を含む）にあってもよい。同じタイプの改変が、与えられたポリペプチドのいくつかの場所に同じ程度でまたは種々の程度で存在し得ることは理解されよう。さらに、与えられたポリペプチドは多くのタイプの改変を含むこともできる。改変にはアセチル化、アシル化、ＡＤＰ−リボシル化、アミド化、フラビンの共有結合付加、ヘム部分の共有結合付加、ヌクレオチドまたはヌクレオチドの共有結合付加、脂質または脂質誘導体の共有結合付加、ホスホチジルイノシトールの共有結合付加、架橋環状化、ジスルフィド結合生成、脱メチル化、共有架橋結合の生成、システインの生成、ピログルタメートの生成、ホルミル化、ガンマカルボキシル化、グリコシル化、ＧＰＩアンカー生成、ヒドロキシル化、ヨウ素化、メチル化、ミリストイル化（ｍｙｒｉｓｔｏｌｙａｔｉｏｎ）、酸化、パージレーション（ｐｅｒｇｙｌａｔｉｏｎ）、タンパク分解処理、リン酸化、プレニル化、ラセミ化、セレノイル化、硫酸化、およびタンパク質へのｔ−ＲＮＡ介在アミノ酸付加（例えばアルギニル化）が含まれる。（例えば以下の文献を参照されたい：Ｐｒｏｔｅｉｎｓ−ＳｔｒｕｃｔｕｒｅａｎｄＭｏｌｅｃｕｌａｒＰｒｏｐｅｒｔｉｅｓ２^ｎｄＥｄ．，Ｔ．Ｅ．Ｃｒｅｉｇｈｔｏｎ，Ｗ．Ｈ．ＦｒｅｅｍａｎａｎｄＣｏｍｐａｎｙ，ＮｅｗＹｏｒｋ（１９９３）；ＰｏｓｔｔｒａｎｓｌａｔｉｏｎａｌＣｏｖａｌｅｎｔＭｏｄｉｆｉｃａｔｉｏｎｏｆＰｒｏｔｅｉｎｓ，Ｂ．Ｃ．Ｊｏｈｎｓｏｎ，Ｅｄ．，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮｅｗＹｏｒｋ，ｐｐ．１−１２（１９８３））。
【００２６】
本明細書で用いられる、“単離された”という用語は、物質がその本来の環境（例えば前記物質が天然に存在する場合は前記天然の環境）から取り出されることを意味する。例えば、生きた動物中に存在している天然のポリヌクレオチドまたはポリペプチドは単離されてはいないが、同じポリヌクレオチドまたはポリペプチドであって、前記天然の系に一緒に存在するいくつかの物質または全ての物質から分離されたものは単離されたものである。前記ポリヌクレオチドはベクターの一部であってもよく、および／または前記ポリヌクレオチドまたはポリペプチドは組成物の一部であってもよく、前記ベクターまたは組成物はその天然の環境の一部分ではないということでなお前記ポリヌクレオチドまたはポリペプチドは単離されている。
【００２７】
本明細書で用いられる、“精製された”という用語は完全に純粋であることを必要とせず、むしろ前記用語は相対的な限定を意図する。ライブラリーから得られる個々の核酸は電気泳動的に均一に常法によって精製されている。これらクローンから得られる配列は、前記ライブラリーからもヒトの全ＤＮＡからも直接には入手することはできない。本発明の精製核酸は、当該生物のゲノムＤＮＡの残りの部分から少なくとも１０^４−１０^６倍精製されている。しかしながら、“精製された”という用語はまた、ゲノムＤＮＡの残りの部分から、またはライブラリーの他の配列から、または他の環境から少なくとも１オーダーの規模で、典型的には２または３オーダー、より典型的に４または５オーダーの規模で精製された核酸も含む。
【００２８】
本明細書で用いられる、“増幅”とは、ＤＮＡポリメラーゼを用いてヌクレオチド配列のコピー数を増加させる任意のｉｎｖｉｔｒｏまたはｉｎｖｉｖｏの方法を指す。核酸の増幅は、ＤＮＡ分子またはプライマーへのヌクレオチドを取り込み、それによってＤＮＡ鋳型と相補的な新しいＤＮＡ分子の生成をもたらす。前記生成されたＤＮＡ分子およびその鋳型は、さらに別のＤＮＡ分子を合成するための鋳型として用いることができる。本明細書で用いられるように、１つの増幅反応は、何ラウンドものＤＮＡ複製から成るものであってもよい。ＤＮＡ増幅反応には例えばポリメラーゼ連鎖反応（ＰＣＲ）が含まれる。１つのＰＣＲ反応は、例えば数“サイクル”から３０サイクル、１００サイクルのＤＮＡ分子の変性と合成から成るものであってもよい。
【００２９】
本明細書で用いられる、“プライマー”という用語は、天然であれ合成であれ、プライマーの伸長が開始される条件下に置かれたとき、合成の開始点として機能することができるオリゴヌクレオチドをいう。ある核酸の鎖と相補的なプライマー伸長生成物の合成は、適切な温度の適切な緩衝液中でヌクレオシド三リン酸およびＤＮＡポリメラーゼまたは逆転写酵素の存在下で開始される。“緩衝液”は補助因子（例えば二価金属イオン）および塩（適切なイオン強度を提供するため）を含み、所望のｐＨに調節される。本発明のポリメラーゼの場合、前記緩衝液は、好ましくは約６０ｍＭのトリス塩酸（ｐＨ１０．０）、２５ｍＭのＮａＯＡｃ、２ｍＭのＭｇ（ＯＡｃ）_２（二価のマグネシウムイオンを提供するため）、および０．００２％ＮＰ−４０／トゥイーン−２０を含む。
【００３０】
プライマーは好ましくは一本鎖のオリゴデオキシリボヌクレオチドである。プライマーの適切な長さはプライマーの使用目的に左右されるが、典型的には１５から３５ヌクレオチドの範囲である。短いプライマー分子は、鋳型との十分に安定なハイブリッド複合体の形成のために一般により低い温度を要求する。プライマーは鋳型の正確な配列を再現する必要はないが、鋳型とハイブリダイズするために十分に相補的でなければならない。
【００３１】
“プライマー”という用語は、特に増幅されるべき標的領域の一端または両端に関する情報にある程度の不明確さがある場合には２つ以上のプライマーを指すことがある。例えば、核酸配列がタンパク質配列から推論される場合は、“プライマー”は実際には、遺伝暗号の縮退に基づいて全ての可能なコドンの変種を表す配列を含むプライマーオリゴヌクレオチドの集合物である。前記集合物中のプライマーの１つは標的配列の末端と相同であろう。同様に、“保存”領域が集団内で顕著なレベルの多形性を示す場合、隣接する配列を増幅するプライマー混合物を調製することができる。
【００３２】
プライマーは、鋳型の特定の配列の鎖と“実質的に”相補的であってもよい。プライマーは、プライマーの伸長が生じる鋳型の鎖とハイブリダイズするために十分相補的でなければならない。プライマー配列は鋳型の正確な配列を再現する必要はない。例えば、非相補的なヌクレオチドフラグメントをプライマーの５’末端に結合させ、プライマー配列の残りの部分は実質的に前記鎖と相補的であることができる。プライマー配列がハイブリダイズさせる鋳型の配列と十分な相補性を有し、それによってプライマーの伸長生成物の合成のための鋳型プライマー複合体を生成することを条件に、非相補的な塩基または長い配列をプライマー中に散在させることができる。
【００３３】
プライマーは、所望の場合は、分光光度法的、光化学的、生化学的、免疫化学的、または化学的手段によって検出できる標識を取り込ませることによって標識することができる。例えば、有用な標識には^３２Ｐ、蛍光染料、高電子試薬、酵素（ＥＬＩＳＡで一般的に用いられるもの）、ビオチンまたはハプテン、および抗血清もしくはモノクローナル抗体が利用できるタンパク質が含まれる。標識はまた、プライマーを“捕捉”するために用いられ、プライマーまたはプライマー伸長生成物（例えば増幅されたＤＮＡ）のいずれかを固相支持体に固定し易くすることができる。
本明細書で用いられる、“耐熱性ポリメラーゼ”および“耐熱性酵素”は、熱に対して安定で、４時間またはそれ以上の超高温の熱に対して耐性を示し、さらに適切な態様のヌクレオチドの組み合わせを触媒して、鋳型の核酸鎖と相補的なプライマー伸長生成物を形成する酵素を指す。一般に、プライマー伸長生成物の合成は、プライマーの３’末端で開始し、合成が終了するまで鋳型鎖に沿って５’方向に進行する。
【００３４】
本発明の耐熱性酵素は、米国特許第４，９６５，１８８号（この文献は引用により本明細書に含まれる）に記載されたように、ポリメラーゼ連鎖反応またはＰＣＲとして知られている増幅反応で効率的に使用するための要件を満たしている。本発明の酵素は、二本鎖核酸を変性させる（ＰＣＲ反応の重要な工程）ために必要な時間高温に付したときに不可逆的に変性しない（不活化されない）。本明細書でいう不可逆的変性は永久的および完全な酵素活性の消失を指す。核酸の変性に必要な加熱条件は、例えば緩衝液の塩濃度並びに変性させる核酸の組成および長さに左右されるが、典型的には約９０℃から約１０５℃で、時間は主に温度と核酸の長さに依存し、典型的には数秒から４分までである。
【００３５】
より高い温度が、緩衝液の塩濃度および／または核酸のＧＣ組成が増加するにつれ要求されるであろう。本発明の酵素は、４時間またはそれ以上の間約９５℃から１１３℃の温度に暴露することで不可逆的に変性することはない。本発明のＤＮＡポリメラーゼ酵素の超耐熱性は、以前に性状を調べた耐熱性酵素よりもさらに新たな利点を提供する。本発明の前には、１１３℃の変性温度での有効なＰＣＲは示されなかった。前記を目的とする耐熱性ＤＮＡポリメラーゼは報告されたことがない。しかしながら、標的核酸のＧ／Ｃ含有量が増すにつれ、二重鎖を変性させるために必要な温度もまた増加する。９５℃を越える変性工程を必要とする標的配列の場合、これまでのプロトコルでは二重鎖を部分的に不安定にさせる溶媒がＰＣＲに取り入れれ、有効な変性温度を低下させる。
【００３６】
例えばグリセロール、ＤＭＳＯまたはホルムアミドのような薬剤がＰＣＲにおいて前記の態様で用いられてきた［Ｋｏｒｇｅｅｔａｌ．，１９９２，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，８９：９１０−９１４；Ｗｏｎｇｅｔａｌ．，１９９１，Ｎｕｃ．ＡｃｉｄｓＲｅｓ．１９：２２５１−２２５９（前記文献は引用により本明細書に含まれる）］。しかしながら、これらの薬剤は、二重鎖ＤＮＡの脱安定化の他にも、プライマーの安定性に影響を与え、酵素活性を抑制し、さらに種々の濃度のＤＭＳＯまたはホルムアミドは好熱性ＤＮＡポリメラーゼの熱抵抗性（すなわち半減期）を低下させる。したがって、前記の補助溶媒を利用するときは、極めて多くの最適化実験および反応条件を検討する必要がある。対照的に、本発明のＤＮＡポリメラーゼを用いる場合は、単純に１００℃から１１３℃に変性温度を上昇させ、それ以外は標準的なＰＣＲによってＰＣＲ生成物の完全な鎖の分離が促進され、ＤＮＡらせんの脱安定化薬剤の必要性が排除できる。
本明細書で開示する超好熱ポリメラーゼは１００℃を超える温度で、さらに１１３℃でさえも他の既知のポリメラーゼで予想される標的ＤＮＡの完全性を犠牲にすることなく安定である［ＥｋｅｒｔａｎｄＫｕｎｋｅｌ，１９９２， ”ＰＣＲ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ，” ｅｄｓ．ＭｃＰｈｅｒｓｏｎ，ＱｕｉｒｋｅａｎｄＴａｙｌｏｒ，ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ｐａｇｅｓ２２５−２４４（前記文献は引用により本明細書に含まれる）］。
【００３７】
本明細書で用いられる、“リコンビナント”という用語は、該当核酸が天然の環境では隣接していない“骨格”核酸と隣接していることを意味する。さらにまた、該当核酸が“濃縮された”というためには、核酸骨格分子集団中の核酸挿入物の数が５％またはそれ以上であろう。本発明の骨格分子には、核酸、例えば発現ベクター、自己複製核酸、ウイルス、組み込み用核酸、および他のベクターまたは問題の核酸挿入物の維持もしくは操作に用いられる核酸が含まれる。典型的には、前記濃縮された核酸とは、リコンビナント骨格分子の集団中における核酸挿入物の数が１５％またはそれ以上を表す。より典型的には、前記濃縮された核酸は、リコンビナント骨格分子の集団中における核酸挿入物の数が５０％またはそれ以上である。ある実施態様では、前記濃縮された核酸は、リコンビナント骨格分子の集団中における核酸挿入物の数が９０％またはそれ以上である。
【００３８】
本明細書において、“リコンビナント”ポリペプチドまたはタンパク質とは、リコンビナントＤＮＡ技術によって生成された、すなわち所望のポリペプチドまたはタンパク質をコードする外因性ＤＮＡ構築物によって形質転換された細胞から産生されたポリペプチドまたはタンパク質を指す。“合成”ポリペプチドまたはタンパク質は化学合成によって製造されたものである。固相ペプチド化学合成もまた本発明のポリペプチドまたはフラグメントの合成に用いることができる。前記の方法は、１９６０年代の初めから当技術分野では公知で（Ｒ．Ｂ．Ｍｅｒｒｉｆｉｅｌｄ，１９６３，Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．，８５：２１４９−２１５４；Ｊ．Ｍ．ＳｔｅｗａｒｔａｎｄＪ．Ｄ．Ｙｏｕｎｇ，ＳｏｌｉｄＰｈａｓｅＰｅｐｔｉｄｅＳｙｎｔｈｅｓｉｓ，２^ｎｄｅｄ．，ＰｉｅｒｃｅＣｈｅｍｉｃａｌＣｏ．，Ｒｏｃｋｆｏｒｄ，Ｉｌｌ．，ｐｐ．１１−１２）、さらに最近は市販の実験室用ペプチドデザインおよび合成キットで利用されている（ＣａｍｂｒｉｄｇｅＲｅｓｅａｒｃｈＢｉｏｃｈｅｍｉｃａｌｓ）。前記の市販の実験室用キットは一般的に文献（Ｈ．Ｍ．Ｇｅｙｓｅｎｅｔａｌ．，１９８４，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．，ＵＳＡ，８１：３９９８）に報告された考えを利用し、その全てが一枚のプレーとに連結された多数の“ロッド”または“ピン”の先端でタンパク質を合成する。前記の系を利用するときは、ロッドまたはピンを含むプレートを逆さまにし、対応するウェルまたは液溜めをもつ第二のプレートに挿入する（前記ウェルまたは液溜めは適切なアミノ酸をピンまたはロッドの先端に付着または定着させるための溶液を含む）。前記の反応工程を繰り返すことによって（すなわち裏返し、さらに適切な溶液にロッドおよびピンの先端を挿入することによって）、アミノ酸が所望のペプチドを構築する。さらに、多数のＦＭＯＣペプチド合成系も利用できる。例えば、ポリペプチドまたはフラグメントの組み立ては、アプライドバイオシステム社（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ，Ｉｎｃ．）のモデル４３１Ａ自動ペプチド合成装置を用いて固相支持体上で実施できる。前記の装置は、直接合成によって、または他の既知の技術によって結合させることができる一連のフラグメントの合成によって容易に本発明のペプチドを提供する。
【００３９】
プロモーターで転写を開始させるＲＮＡポリメラーゼによってコード配列がｍＲＮＡに転写されるときは、前記プロモーター配列は前記コード配列に“動作可能に連結”されているという。
“プラスミド”は小文字のｐによって示され、大文字および／または数字がそれに先行するかおよび／またはその後に続く。本明細書の出発プラスミドは、市販されているか、非制限的な基準で公的に入手可能であるか、または入手可能なプラスミドを基にして文献に報告された方法にしたがって構築できる。さらに、本明細書に記載したプラスミドと同等なプラスミドは当技術分野で公知であり、当業者には明白であろう。
【００４０】
ＤＮＡの“消化”とは、ＤＮＡの一定の配列でのみ作用する制限酵素によるＤＮＡの触媒的切断を指す。本明細書で用いられる種々の制限酵素は市販されており、それらの反応条件、補助因子および他の要件は当業者に公知のものを用いた。分析を目的とする場合は、典型的には１μｇのプラスミドまたはＤＮＡフラグメントを約２単位の酵素とともに約２０μＬの緩衝液中で用いる。プラスミド構築のためにＤＮＡを単離する場合は、典型的には５から５０μｇのＤＮＡを２０から５０単位の酵素でより大容積中で消化する。具体的な制限酵素に対する適切な緩衝液および基質の量は製造元によって特定される。３７℃で約１時間のインキュベーションが常套的に用いられているが、供給元の指示にしたがって変動させることができる。消化後に、ゲル電気泳動を実施して所望のフラグメントを単離することができる。
【００４１】
“オリゴヌクレオチド”は、一本鎖ポリデオキシヌクレオチドまたは２本の相補的なポリデオキシヌクレオチド鎖のいずれをも意味し、前記ポリデオキシヌクレオチドは化学的に合成できる。そのような合成オリゴヌクレオチドは５’リン酸をもたず、したがってキナーゼ存在下でＡＴＰを用いてホスフェートを付加しなければまた別のオリゴヌクレオチドに連結できない。合成オリゴヌクレオチドは脱リン酸されていないフラグメントに連結される。
２つの核酸またはポリペプチドについていう場合、“実質的に同一”という語句は、最大の一致を得るように比較およびアラインメントを施して、公知の配列比較アルゴリズムを用いるか、または目で精査して測定したとき、少なくとも５０％、６０％、７０％、８０％、さらにいくつかの特徴では９０−９５％のヌクレオチドまたはアミノ酸残基の同一性を有する２つまたは３つ以上の配列を指す。典型的には、実質的な同一性は、少なくとも約１００残基の領域にわたって存在し、もっとも一般的には配列は少なくとも約１５０−２００残基にわたって実質的に同一である。いくつかの実施態様では、コード領域の全長にわたって実質的に同一である。
【００４２】
さらに、“実質的に同一な”アミノ酸配列とは、１つまたは２つ以上の保存的または非保存的アミノ酸置換、欠失または挿入によりリファレンス配列と異なる配列であり、特にそのような置換が前記分子の活性部位ではない部位に生じ、前記ポリペプチドが本質的にその機能を保持していることを条件とする。保存的アミノ酸置換は、例えば、１つのアミノ酸と同じ種類の別のアミノ酸との置換である［例えば１つの疎水性アミノ酸（例えばイソロイシン、バリン、ロイシンまたはメチオニン）で別の疎水性アミノ酸を置換するか、または１つの極性アミノ酸を別の極性アミノ酸で置換する（例えばアルギニンでリジンを、グルタミン酸でアスパラギン酸を、またはグルタミンでアスパラギンを置換）］。１つまたは２つ以上のアミノ酸を、例えばポリメラーゼポリペプチドから欠失させ、その生物学的活性を顕著に変化させることなく前記ポリペプチドの構造を改変することができる。例えば、ポリメラーゼの生物学的活性に要求されないアミノ末端またはカルボキシル末端のアミノ酸を除去することができる。
【００４３】
本発明のポリメラーゼポリペプチド配列（上記のように改変したものを含む）は、多くの任意の方法（ＤＮＡの重合化（例えば重合速度および読み取りの正確さ）を含む）によってポリメラーゼの生物学的活性についてアッセイすることができる。例えば、本発明のポリメラーゼの読み取りの正確さについてのアッセイには、本発明のポリメラーゼによって重合させたＤＮＡの配列を既知の配列と正確さについて比較することなどが含まれる。
本発明に含まれるポリメラーゼポリペプチドは、図１Ｂに示したポリメラーゼ（配列番号：２）のアミノ酸配列を有するか、または配列番号：２、４、６、８、１０、１２、１４、１６と５０％の相同性を有するアミノ酸配列を有し、前記ポリメラーゼは超高温、例えば約９０℃から１１３℃、約９５℃から１１３℃、約１００℃から１０７℃、または１００℃から１０５℃でポリメラーゼ活性を保持することができる。好ましくは、前記ポリメラーゼは、前記のような温度で１時間またはそれ以上、２時間またはそれ以上、好ましくは４時間またはそれ以上活性を有する。図１１は、配列番号：１６の８５℃、９０℃および９５℃で４時間の間の耐熱性を示すグラフである。
【００４４】
本明細書で用いられる “フラグメント”とは、少なくとも２つの異なるコンフォーメーションで存在することができる天然に存在するタンパク質の部分である。フラグメントは、天然に存在するタンパク質と同じまたは実質的に同じアミノ酸配列を有することができる。“実質的に同じ”とは、アミノ酸配列の大部分（全部ではなく）が同じであり、前記配列が関連を有する配列の少なくとも１つの機能的活性を保持することを意味する。一般には、２つのアミノ酸配列が少なくとも約８５％同一である場合は、それらは“実質的に同じ”または“実質的に相同”である。異なる三次元構造を有する天然に存在するフラグメントもまた含まれる。前記の例は“プロ−フォーム”分子、例えば切断によって改変され極めて高い活性をもつ成熟ポリメラーゼを生成する低活性プロタンパク質である。
【００４５】
“ハイブリダイゼーション”とは、核酸の鎖が塩基対形成により相補鎖と結合する過程を指す。ハイブリダイゼーション反応は鋭敏でさらに選択性を有し、したがって対象の個々の配列を、前記配列が低濃度で存在するサンプル中においてさえも同定することができる。適切にストリンジェントな条件は、例えば、予備ハイブリダイゼーション溶液およびハイブリダイゼーション溶液中の塩またはホルムアルデヒドの濃度によって、またはハイブリダイゼーションの温度によって規定することができ、前記は当技術分野で周知である。特に、ストリンジェンシーは塩濃度を減少させるか、ホルムアルデヒドの濃度を高めるか、またはハイブリダイゼーションの温度を上昇させることによって高めることができる。
【００４６】
例えば、高ストリンジェンシー条件下でのハイブリダイゼーションは、約５０％のホルムアルデヒドで約３７℃から４２℃で生じるであろう。ハイブリダイゼーションは、低ストリンジェンシー条件下、約３５％から２５％のホルムアミドで約３０℃から３５℃で生じ得るであろう。特に高ストリンジェンシー条件下でのハイブリダイゼーションは４２℃で、５０％のホルムアミド、５×ＳＳＰＥ、０．３％のＳＤＳ、および２００ｎｇ／ｍＬのせん断変性サケ精子ＤＮＡ中で起こり得る。低ストリンジェンシー条件下でのハイブリダイゼーションは上記のような条件で、ただし３５％ホルムアミド中で３５℃の低い温度で起こり得る。特定のレベルのストリンジェンシーに対応する温度範囲は、問題の核酸のプリン対ピリミジン比を計算し、さらにそれにしたがって温度を調整することによってさらに狭めることができる。上記範囲および条件に関する変動はこの技術分野で良く知られたものである。
【００４７】
“変種”という用語は、１つまたは２つ以上の（それぞれ）塩基対、コドン、イントロン、エクソンまたはアミノ酸残基において改変され、なお本発明のポリメラーゼ活性を保持する本発明のポリヌクレオチドまたはポリペプチドを指す。変種は例えば以下を含む多数の任意の手段によって製造できる：変異性ＰＣＲ（ｅｒｒｏｒ−ｐｒｏｎｅＰＣＲ）、シャフリング（入れ換え、ｓｈｕｆｆｌｉｎｇ）、オリゴヌクレオチド特異的突然変異導入、アッセンブリーＰＣＲ、有性ＰＣＲ突然変異導入、ｉｎｖｉｖｏ突然変異導入、カセット突然変異導入、循環アンサンブル（ｒｅｃｕｒｓｉｖｅｅｎｓｅｍｂｌｅ）突然変異導入、指数的アンサンブル突然変異導入、部位特異的突然変異導入、連結再アッセンブリー、ＧＳＳＭおよび前記の任意の組み合わせ。
【００４８】
本明細書で用いられる“鋳型”という用語は、増幅、合成または配列決定されるべき二本鎖または一本鎖のＤＮＡ分子を指す。二本鎖ＤＮＡ分子の場合は、これら分子の増幅、合成または配列決定の前に、その鎖を変性させて第一および第二の鎖を生成させる。プライマー（ＤＮＡ鋳型の一部分と相補的である）を適切な条件下でハイブリダイズさせ、続いて本発明のＤＮＡポリメラーゼが前記鋳型またはその一部分と相補的なＤＮＡ分子を合成することができる。本発明にしたがって新しく合成されたＤＮＡ分子は、最初のＤＮＡ鋳型と長さが等しいかまたは短い。新しく合成されるＤＮＡ分子の合成または伸長中のミスマッチの取り込みは、１つまたは多数の塩基対のミスマッチをもたらす。したがって、合成されたＤＮＡ分子はＤＮＡ鋳型と正確に相補的であるとは限らない。
【００４９】
特に本発明のポリメラーゼは、よく知られたＤＮＡ配列決定、ＤＮＡ標識、ＤＮＡ増幅およびクローニング反応並びにｃＤＮＡ合成反応で極めて有用である。特に本発明のポリメラーゼは、ｄＮＴＰおよびｄｄＮＴＰを区別せず、したがってＤＮＡ配列決定、ＤＮＡ標識、並びにＤＮＡ増幅反応およびｃＤＮＡ合成に極めて有用である。周知のように、配列決定反応（等温ＤＮＡシークェンシング法およびＤＮＡサイクルシークェンシング法）はＤＮＡポリメラーゼの使用を必要とする。ジデオキシ仲介配列決定は、ＤＮＡポリメラーゼによる伸長のための特別なポリマー、塩基特異的連鎖ターミネーターを使用する鎖停止技術、およびポリアクリルアミドゲルの使用を含む。ポリアクリルアミドゲルの使用によって、新しく合成された鎖停止ＤＮＡ分子をサイズによって分離し、その結果、最初のＤＮＡ分子のヌクレオチド配列の少なくとも一部分を決定することができる。特に、ＤＮＡ分子は、各々が異なる塩基特異的ターミネーターを含む４種の別個のＤＮＡ配列反応を用いて配列決定される。例えば、第一の反応はＧ−特異的ターミネーターを含み、第二の反応はＴ−特異的ターミネーターを含み、第三の反応はＡ−特異的ターミネーターを含み、第四の反応はＣ−特異的ターミネーターを含むことができる。好ましいターミネーターヌクレオチドにはジデオキシリボヌクレオシド三燐酸（ｄｄＮＴＰ）、例えばｄｄＡＴＰ、ｄｄＴＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰおよびｄｄＣＴＰが含まれる。ジデオキシリボヌクレオシド三燐酸の類似体もまた使用することができ、当技術分野では周知である。
【００５０】
ＤＮＡ分子の配列を決定するとき、ｄｄＮＴＰはデオキシリボース塩基の３’位にヒドロキシル残基を欠き、したがって、伸長ＤＮＡ鎖にＤＮＡポリメラーゼによって取り込まれるが、その３’−ヒドロキシ残基が欠如しているために次のホスホジエステル結合の生成が妨げられてＤＮＡ分子の伸長が停止する。したがって、配列決定反応混合物に１つのｄｄＮＴＰが少量含まれるとき、配列を決定されるべきＤＮＡ鋳型よりも短い合成されたＤＮＡ分子集団が生じる。４種の異なるｄｄＮＴＰを４つの別個の酵素反応で用いることによって、合成ＤＮＡ集団をサイズにより分離して、最初のＤＮＡ分子のヌクレオチド配列の少なくとも一部分を決定できる。ジデオキシヌクレオチドによるＤＮＡの配列決定は周知であり、文献に記載されている（Ｓａｍｂｒｏｏｋｅｔａｌ．， ”ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ，ａＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．（１９８９））。容易に理解されるとおり、本発明のポリメラーゼは前記の配列決定反応で用いることができる。
【００５１】
周知のように、典型的には検出できるように標識したヌクレオチドが配列決定反応に含まれる。多数の標識ヌクレオチドを配列決定（または標識）反応で用いることができる。前記標識ヌクレオチドには、放射性同位元素、蛍光標識、化学発光標識、生物発光標識および酵素標識が含まれるが、ただしこれらに限定されない。本発明の野生型および変異型ＤＮＡポリメラーゼは、配列決定（または標識）反応時にαＳヌクレオチドの取り込みのために有用であることが判明した。例えば、［α^３５Ｓ］ｄＡＴＰ（配列決定反応で一般的に用いられる検出可能標識ヌクレオチド）は、ＴａｑＤＮＡポリメラーゼよりも効率的に本発明のＤＮＡポリメラーゼにより取り込まれる。したがって、本発明の酵素は、［α^３５Ｓ］ｄＮＴＰを用いるＤＮＡ分子の配列決定または標識に特に適している。
【００５２】
周知のＤＮＡ増幅技術であるポリメラーゼ連鎖反応（ＰＣＲ）は、ＤＮＡポリメラーゼとデオキシリボヌクレオシド三燐酸を用いて標的ＤＮＡ鋳型を増幅させる工程である。前記のＰＣＲ反応では、２つのプライマー（１つは増幅されるべきＤＮＡ分子の第一の鎖の３’末端（または３’末端近傍）と相補的であり、第二のプライマーは増幅されるべきＤＮＡ分子の第二の鎖の３’末端（または３’末端近傍）と相補的である）を、その対応するＤＮＡ鎖とハイブリダイズさせる。ハイブリダイゼーションの後、デオキシリボヌクレオシド三燐酸の存在下で、ＤＮＡポリメラーゼは、増幅されるべきＤＮＡ分子の第一の鎖と相補的な第三のＤＮＡ分子および第二の鎖と相補的な第四のＤＮＡ分子を合成させる。前記の合成によって、２つの二本鎖ＤＮＡ分子がもたらされる。続いて、ＤＮＡポリメラーゼ、プライマーおよびデオキシリボヌクレオシド三燐酸を提供することによって、前記の二本鎖ＤＮＡ分子をさらに新たなＤＮＡ分子の合成のための鋳型として用いることができる。周知のように、前記のさらに新たな合成は、（過剰なプライマーおよびデオキシリボヌクレオシド三燐酸を用いて）最初の反応を“サイクル”させて、何回もの変性と合成工程を可能にすることによって実施される。典型的には、二本鎖ＤＮＡ分子の変性による一本鎖ＤＮＡ鋳型の生成は高温によって達成される。本発明の野生型および変種ＤＮＡポリメラーゼは熱に安定なＤＮＡポリメラーゼで、したがってＤＮＡ増幅反応時の前記温度サイクルに耐えるであろう。したがって、本発明の野生型および変種ＤＮＡポリメラーゼは、ＰＣＲ反応、特に増幅時に高温を用いてＤＮＡ分子を変性させるＰＣＲ反応に理想的である。
【００５３】
本発明のＤＮＡポリメラーゼおよび変異体はまた、ｍＲＮＡ鋳型からｃＤＮＡを調製するためにも用いることができる。例えば米国特許第５，４０５，７７６号および第５，２４４，７９７号を参照されたい（前記文献は引用により本明細書に含まれる）。したがって、本発明はまたｍＲＮＡからｃＤＮＡを調製する方法に関し、前記方法は以下の（ａ）および（ｂ）の工程を含む：（ａ）ｍＲＮＡをオリゴ（ｄＴ）プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成し；さらに（ｂ）工程（ａ）で生成されたハイブリッドを本発明のＤＮＡポリメラーゼまたはその変種および４種のｄＮＴＰと接触させ、それによってｃＤＮＡ−ＲＮＡハイブリッドを得る。
【００５４】
前記反応混合物が、工程（ｂ）で生成されるｃＤＮＡと相補的である適切なオリゴヌクレオチドをさらに含む場合は、第一の鎖の合成の後でｄｓＤＮＡを得ることもまた可能である。したがって本発明はまた、本発明のＤＮＡポリメラーゼまたはその変種を用いてｄｓＤＮＡを調製する方法を目的とする。
酵素は高度に選択的な触媒である。それらの特徴は、優れた立体的選択性、部位選択性（ｒｅｇｉｏ）および化学的選択性を有する反応の触媒能力で、それらは通常の化学的合成とは比較にならない。さらにまた、酵素は極めて高い融通性を有する。それらは種々に手を加えることによって、有機溶媒中で機能し、さらに極端なｐＨ（例えば高ｐＨおよび低ｐＨ）、極端な温度（例えば高温および低温）、極端な塩分レベル（例えば高い塩分および低い塩分）で働き、それらの天然の生理学的な基質とは構造的に無関係の化合物との反応を触媒する。
【００５５】
酵素は広範囲の天然および非天然基質に対して反応性を有し、したがって実質的に任意の有機主要化合物の改変を可能にする。さらにまた、通常の化学触媒と異なり、酵素は高い鏡像選択性および部位選択性を有する。酵素によって示される官能基の高度の特異性は、新規な活性化合物へと続く一連の合成反応で各反応の進路を追うことを可能にする。酵素はまた、それらの天然の生理学的機能とは無関係の多くの多様な反応を触媒することができる。例えば、ペルオキシダーゼは、過酸化水素によってフェノール酸化を触媒する。ペルオキシダーゼはまた、前記酵素の天然の機能とは無関係のヒドロキシル化反応を触媒することができる。他の例は、ポリペプチドの分解を触媒するタンパク質である。有機溶液中では、いくつかのプロテアーゼは糖をアシル化することができるが、前記はこれらの酵素の天然の機能とは無関係の機能である。
【００５６】
本発明は酵素の固有の触媒特性を利用する。化学物質の形質転換における生物触媒（すなわち精製または粗酵素、非生細胞または生細胞）の使用は、通常は、特定の出発化合物と反応する個々の生物触媒の同定を必要とするが、本発明では、多くの出発化合物に存在する官能基に特異的である選別した生物触媒および反応条件が使用される。
各生物触媒は１つの官能基（またはいくつかの関連する官能基）に特異的で、前記官能基を含む多くの出発化合物と反応することができる。
生物触媒による反応は１つの出発化合物から誘導体の集団を生成する。前記誘導体をさらにもう１回の生物触媒反応に付し、第二の誘導体化合物集団を生成することができる。生物触媒による誘導反応を繰り返すたびに最初の化合物に由来する何千もの変種を生成することができる。
【００５７】
酵素は出発化合物の特異的な部位で反応し、分子の残りの部分には影響を与えない。これは慣習的な化学的方法では達成することが非常に難しい反応である。生物触媒のこの高度な特異性は、ライブラリー中のただ１個の活性化合物を同定する手段を提供する。ライブラリーは、それを生成するために用いられた生物触媒による一連の反応、いわゆる“生合成歴”によって特徴が表される。生物学的活性についてライブラリーをスクリーニングし、その生合成歴を追跡することによって、前記活性化合物を生成する特定の反応を見つけ出すことができる。前記一連の反応を繰り返し、合成された化合物の構造を決定する。このような同定方法は、他の合成およびアプローチ方法と異なり固定技術を必要とせず、実質的に任意のタイプのスクリーニングアッセイを用いて、化合物を溶液中で遊離の状態で合成および検査することができる。官能基に対する酵素反応の高度な特異性が、生物触媒により生成されるライブラリーを完成させた特異的な酵素反応の追跡を可能にすることを特記することは重要である。
【００５８】
１日当たり何千もの生物触媒反応およびスクリーニングアッセイを高レベルの正確さと再現性を担保しつつ実施することを可能にするロボットによる自動化を用いて、多数の工程が実施される。結果として、従来の化学的な方法を用いれば何年も要する誘導化合物ライブラリーが数週間程度で生成できる。［分子（小分子を含む）の改変についての更なる説明のためにはＰＣＴ／ＵＳ９４／０９１７４を参照されたい（前記文献は引用により本明細書に含まれる）］。
ある特徴では、本発明は、合成遺伝子再アッセンブリーと称される非確率的方法を提供する。前記方法は、いくぶん確率的シャッフリングと関連するが、ただし核酸構築ブロックはランダムにシャッフリング、連結またはキメラ化されることはなく、むしろ非確率的に組み立てられる。
【００５９】
合成遺伝子再アッセンブリー法は、シャッフリングすべきポリヌクレオチド間に高レベルの相同性が存在することを必要としない。本発明を用いて、１０^１００を越える種々のキメラで構成された子孫分子ライブラリー（またはセット）を非確率的に生成することができる。おそらく、合成遺伝子再アッセンブリーは、１０^１０００をも越える種々の子孫キメラで構成されるライブラリーの生成に用いることができる。
したがってある特徴では、本発明は、意図的に選択された全体の組み立て順序を有する完成キメラ核酸分子のセットを生成する、以下の工程を含む非確率的方法を提供する：利用可能な相互に適合する連結可能末端を有する、複数の特定の核酸構築ブロックを計画的に生成し、さらに意図した全体の組み立て順序を達成できるように前記核酸構築ブロックを組み立てる。
【００６０】
組み立てられるべき核酸構築ブロックの相互に適合する連結可能な末端は、それらが構築ブロックを予め定めた順序で結合させることを可能にする場合は、このタイプの順序付けられた組み立てに“利用可能”であると考えられる。したがって、ある特徴では、核酸構築ブロックが結合される全体の組み立て順序は連結可能な末端のデザインによって指定することができ、さらに、２つ以上の組み立て工程が用いられる場合は、核酸構築ブロックが結合される全体の組み立て順序もまた前記組み立て工程の連続する順序によって指定される。本発明のある実施態様では、アニールされる構築片は酵素、例えばリガーゼ（例えばＴ４ＤＮＡリガーゼ）で処理され、前記構築片の共有結合が達成される。
【００６１】
別の実施態様では、核酸構築ブロックのデザインは、完成されたキメラ核酸分子の子孫セットを生成するための基礎として機能する原型（ｐｒｏｇｅｎｉｔｏｒ）核酸鋳型セットの配列分析を基にして得られる。これらの原型核酸鋳型は、したがって、突然変異を誘発されるべき、すなわちキメラ化または入れ換え（シャフリング）を実施されるべき核酸構築ブロックのデザインに役立つ配列情報の供給源として機能する。
ある実施態様では、本発明は、関連遺伝子類のキメラ化およびそれらによってコードされる関連ポリメラーゼ類を提供する。本発明のポリメラーゼは本明細書に記載した方法にしたがって突然変異を導入することができる。
【００６２】
したがって、本発明の特徴の１つにしたがえば、１つまたは２つ以上の境界設定ポイント（ｄｅｍａｒｃａｔｉｏｎｐｏｉｎｔ）を選択するために、複数の原型核酸鋳型の配列（例えば配列番号：１、３、５、７、９、１１、１３、１５）にアラインメントが施される（前記境界設定ポイントは相同性領域に位置することができる）。前記境界設定ポイントを用いて、生成されるべき核酸構築ブロックの境界を正確に示すことができる。したがって、前記原型分子で同定し選択した境界設定ポイントは、子孫分子の組み立てで潜在的なキメラ化ポイントとして機能する。
典型的には、有用な境界設定ポイントは、少なくとも２つの原型鋳型によって共有される相同性領域（少なくとも１つの相同なヌクレオチド塩基で構成される）であるが、前記境界設定ポイントは、少なくとも半分の原型鋳型、少なくとも２／３の原型鋳型、少なくとも３／４の原型鋳型、好ましくはほとんど全ての原型鋳型によって共有される相同性領域であってもよい。さらに好ましい有用な境界設定ポイントは、全原型鋳型によって共有される相同領域である。
【００６３】
ある実施態様では、前記連結再アッセンブリー方法は、包括的ライブラリーを生成するために余すところなく実施される。換言すれば、全ての可能な順序をもつ核酸構築ブロックの組合わせが、完成されたキメラ核酸分子セット中に出現する。同時に、各々の組合わせにおける組み立ての順序（すなわち完成された各キメラ核酸の５’から３’方向の配列中の各構築ブロックの組み立ての順序）は、計画的（または非確率的）である。前記方法の非確率的な特性のために、望ましくない副生成物の可能性が大幅に減少する。
【００６４】
別の実施態様では、本方法で提供されるのものは、例えば体系的に区画化したライブラリーを生成するために、（例えば１つずつ）体系的にスクリーニングすることができる区画による連結再アッセンブリー方法の体系的な実施である。換言すれば、本発明が提供するものは、特定の核酸構築ブロックの慎重な選択により、（アッセンブリー反応の連続工程の慎重な選択と組み合わせて）、いくつかの反応容器の各々に特定の子孫生成物セットが製造される実験デザインを達成できるということである。これによって、体系的な実験およびスクリーニング方法の実施が可能になる。したがって、本方法は、潜在的に非常に大量の子孫分子をより小さなグループで体系的に調べることを可能にする。
【００６５】
高度に順応性を有し、しかも同時に包括的で体系的な態様で、（特に原型分子に低レベルの相同性しか存在しないときに）キメラ化を実施できるその能力のために、本発明は、多数の子孫分子で構成されたライブラリー（またはセット）の生成を提供する。本発明の連結再アッセンブリーの非確率的特性のために、生成される子孫分子は、好ましくは、意図的に選択された全体の組み立て順序を有する完成キメラ核酸分子のライブラリーを構成する。特別な実施態様では、前記生成ライブラリーは１０^３から１０^１０００を超える種々の子孫分子種で構成される。
【００６６】
ある特徴では、上記のようにして生成される完成キメラ核酸分子セットは、ポリペプチドをコードするポリヌクレオチドを含む。ある実施態様に従えば、前記ポリヌクレオチドは遺伝子であり、前記は人工遺伝子でもよい。
別の実施態様に従えば、前記ポリヌクレオチドは遺伝子経路であり、前記は人工の遺伝子経路でもよい。本発明にしたがえば、本発明によって生成された１つまたは２つ以上の人工遺伝子を人工の遺伝子経路（例えば真核生物（植物を含む）中で作働可能な経路）に取り込ませることができる。
【００６７】
別の実施態様では、構築ブロックが生成される工程が合成的であるという性質によって、ヌクレオチド（例えば１つまたは２つ以上のヌクレオチド、前記は例えばコドンでもイントロンでもまたは調節配列でもよい）のデザインおよび導入が可能になる。前記ヌクレオチドは、後で場合によってｉｎｖｉｔｒｏプロセス（例えば突然変異誘発によって）またはｉｎｖｉｖｏプロセス（例えば宿主生物の遺伝子スプライシング能力によって）で除去することができる。多くの事例で、前記ヌクレオチドの導入はまた、有用な境界設定ポイントの創出という潜在的な利益以外に他の多くの理由から所望されることは理解されよう。
【００６８】
したがって、別の実施態様では、本発明はイントロンに導入するために用いることができる核酸構築ブロックを提供する。本発明はしたがって、本発明の人工遺伝子への機能的イントロンの導入を提供する。本発明はまた、本発明の人工遺伝子経路への機能的イントロンの導入を提供する。したがって、本発明は、１つ（または２つ以上）の人工的に導入されたイントロンを含む人工遺伝子であるキメラポリヌクレオチドの生成を提供する。
したがって本発明はまた、１つ（または２つ以上）の人工的に導入されたイントロンを含む人工遺伝子経路であるキメラポリヌクレオチドの生成を提供する。好ましくは、前記人工的に導入されたイントロンは、天然に存在するイントロンが遺伝子スプライシングで機能的に作用する態様とほぼ同様に、１つまたは２つ以上の宿主細胞で遺伝子スプライシングのための機能を有する。本発明は、遺伝子組換えおよび／またはスプライシングのために宿主生物に導入される人工イントロンを含むポリヌクレオチドの製造方法を提供する。
【００６９】
本発明を用いて製造された人工遺伝子はまた別の核酸との組換えのための基質として機能することができる。同様に、本発明を用いて製造された人工遺伝子経路はまた別の核酸との組換えのための基質として機能することができる。好ましい事例では、組換えは、人工イントロン含有遺伝子と組換えパートナーとして機能する核酸との間の相同領域によって促進され、また同領域で発生するであろう。特に好ましい事例では、前記組換えパートナーはまた本発明によって生成される核酸（人工遺伝子または人工遺伝子経路を含む）であってもよい。組換えは、１つ（または２つ以上）の人工的に導入された人工遺伝子内イントロンに存在する相同領域によって促進され、または同領域で発生するであろう。
【００７０】
本発明の合成的連結再アッセンブリーの方法は複数の核酸構築ブロックを用い、前記ブロックの各々は好ましくは２つの連結可能末端を有する。各核酸構築ブロックの前記２つの連結可能末端は２つが平滑端（すなわち各々はオーバーハングヌクレオチドをもたない）であってもよいが、好ましくは１つが平滑端で１つがオーバーハングを有するか、またはより好ましくは２つの末端がオーバーハングを有する。
前記の目的のために利用可能なオーバーハングは３’オーバーハングまたは５’オーバーハングであろう。したがって、核酸構築ブロックは、３’オーバーハング、また別には５’オーバーハング、また別には２つの３’オーバーハング、また別には２つの５’オーバーハングを有することができる。前記核酸構築ブロックが組み立てられて完成したキメラ核酸分子を生成する全体的な順序は、意図的な実験デザインによって決定され、ランダムではない。
【００７１】
好ましい実施態様の１つに従えば、核酸構築ブロックは、２つの一本鎖核酸（一本鎖オリゴとも称する）を化学合成し、さらにそれらをアニールさせるために接触させて二本鎖核酸構築ブロックを生成することによって作製される。
二本鎖核酸構築ブロックは種々のサイズを有することができる。これらの構築ブロックのサイズは小さくても大きくてもよい。構築ブロックの好ましいサイズは１塩基対（いずれのオーバーハングも含まない）から１０００００塩基対（いずれのオーバーハングも含まない）の範囲である。他の好ましいサイズ範囲も提供される。それらは、下限が１塩基対から１００００ｂｐ（その間の整数値を全て含む）で、上限が２ｂｐから１０００００ｂｐ（その間の整数値を全て含む）である。
二本鎖核酸構築ブロックを生成する本発明で有用な多くの方法が存在する。前記は当技術分野で公知であり、当業者は容易に実施することができる。
【００７２】
ある実施態様に従えば、二本鎖核酸構築ブロックは、先ず２つの一本鎖核酸を生成し、それらをアニールさせて二本鎖核酸構築ブロックを形成することによって作製される。二本鎖核酸構築ブロックの２本の鎖は、オーバーハングを形成するヌクレオチド以外は全てのヌクレオチドが相補的で、したがってオーバーハングは別としてミスマッチを含まない。別の実施態様に従えば、二本鎖核酸構築ブロックの２本の鎖は、オーバーハングを形成するヌクレオチドはさておき、全ヌクレオチド未満のヌクレオチドにおいて相補的である。したがって、本実施態様に従えば、二本鎖核酸構築ブロックを用いてコドンの縮退を導入することができる。好ましくはコドンの縮退は、本明細書で述べる部位特異的突然変異導入により、１つまたは２つ以上のＮ、Ｎ、Ｇ／ＴまたはＮ、Ｎ、Ｃ／Ｔカセットを用いて、また別には１つまたは２つ以上のＮ、Ｎ、Ｎカセットを用いて導入される。
【００７３】
本発明のｉｎｖｉｖｏ遺伝子組換え方法は、未知のハイブリッドまたは特定のポリヌクレオチドもしくは配列の対立遺伝子プールについて非計画的に実施することができる。しかしながら、特定のポリヌクレオチドの実際のＤＮＡまたはＲＮＡ配列を知る必要はない。
遺伝子の混合集団内の組換えを利用するアプローチは、任意の有用なタンパク質、例えばインターロイキン１、抗体、ｔＰＡおよび成長因子の生成に有用であろう。前記アプローチは、特異性または活性が変化したタンパク質の生成に用いることができる。前記アプローチはまた、ハイブリッド核酸配列、例えば遺伝子のプロモーター領域、イントロン、エクソン、エンハンサー配列、３１非翻訳領域、または５１非翻訳領域の生成にも有用であろう。したがって、前記アプローチを用いて、発現速度の速い遺伝子を生成することができる。前記アプローチはまた、反復ＤＮＡ配列の研究でも有用であろう。最後に、本アプローチは、リボザイムまたはアプタマー（ａｐｔａｍｅｒ）を変異させるために有用であろう。
【００７４】
ある特徴では、本発明は、高度に複雑な直鎖状配列（例えばＤＮＡ、ＲＮＡまたはタンパク質）の誘導分子進化を可能にする、減数再組合せ（ｒｅｄｕｃｔｉｖｅｒｅａｓｓｏｒｔｍｅｎｔ）、組換えおよび選別で構成されるサイクルを繰り返して用いることに関する。
分子のｉｎｖｉｖｏシャッフリングは変種の提供に有用で、マルチマーを組換える細胞の天然の特性を利用して実施することができる。Ｉｎｖｉｖｏ組換えは分子の多様性への主要な天然の経路を提供してきたが、一方、遺伝子組換えは依然として比較的複雑なプロセスであり以下の工程を含む：１）相同性の認識；２）鎖の切断、鎖への侵入および組換え交差をもたらす代謝工程；および３）別個の組換え分子への交差の分解。交差の形成は相同性配列の認識を必要とする。
【００７５】
別の実施態様では、本発明は、少なくとも第一のポリヌクレオチドおよび第二のポリヌクレオチドからハイブリッドポリヌクレオチドを生成する方法を含む。本発明を用い、部分的な配列相同性を有する少なくとも１つの領域を共有する少なくとも第一のポリヌクレオチドおよび第二のポリヌクレオチドを適切な宿主細胞に導入することによって、ハイブリッドポリヌクレオチドを生成することができる。部分的配列相同性を有する領域は、ハイブリッドポリヌクレオチドを生成する配列再構成を生じるプロセスを促進する。本明細書において、“ハイブリッドポリヌクレオチド”という用語は、本発明の方法で得られ、少なくとも２つの最初のポリヌクレオチド配列に由来する配列を含む任意のヌクレオチド配列である。ハイブリッドポリヌクレオチドは、ＤＮＡ分子間の配列の組込みを促進する分子間組換え事象によりもたらされる。さらに、そのようなハイブリッドポリヌクレオチドは、ＤＮＡ分子内のヌクレオチド配列を変化させるために繰返し配列を利用する分子内減数再組合せプロセスから得ることができる。
【００７６】
本発明は、生物学的に活性なハイブリッドポリペプチド（例えばハイブリッドポリメラーゼ）をコードすることができるハイブリッドポリヌクレオチドを生成する手段を提供する。ある特徴では、もともとのポリヌクレオチドは生物学的に活性なポリペプチドをコードする。本発明の方法は、生成されたハイブリッドポリヌクレオチドが元の生物学的に活性なポリペプチドに由来する活性を示すポリペプチドをコードすることができるように、元のポリヌクレオチドの配列を組み込む細胞性プロセスを利用することによって、新規なハイブリッドポリペプチドを生成する。
【００７７】
例えば、元のポリヌクレオチドは異なる微生物に由来する特定のポリメラーゼをコードしてもよい。１つの生物または変種に由来する第一のポリヌクレオチドによってコードされるポリメラーゼは、例えば特定の環境条件（例えば高い塩分）の下で効率的に機能するものであってもよい。異なる生物または変種に由来する第二のポリヌクレオチドによってコードされるポリメラーゼは、異なる環境（例えば超高温）で効率的に機能するものであってもよい。第一および第二の最初のポリヌクレオチドに由来する配列を含むハイブリッドポリヌクレオチドは、元のポリヌクレオチドによってコードされる両酵素の特徴を示す酵素をコードすることができる。したがって、ハイブリッドポリヌクレオチドによってコードされる酵素は、第一および第二のポリヌクレオチドによってコードされる酵素の各々によって共有される環境条件（例えば高塩分および超高温）で効率的に機能することができ、特に超高温、例えば約９５℃から１１３℃の温度でポリメラーゼ活性を示すであろう。いくつかの改変ポリヌクレオチドは、１５０℃までの温度でポリメラーゼ活性を示すことができ、前記温度は現在のところ、生命形態が、ＤＮＡおよび他の必須の分子の完全性を維持する化学結合の分解を防ぐことができる理論的限界であろうと考えられる。
【００７８】
本発明のポリヌクレオチドによってコードされる酵素にはヒドラーゼ、例えばポリメラーゼが含まれるが、ただしこれらに限定されない。本発明の方法によって得られるハイブリッドポリペプチドは、元の酵素が示さない特殊な酵素活性を示すことができる。例えば、ポリメラーゼ活性をコードするポリヌクレオチドの組換えおよび／または減数再組合せに続いて、ハイブリッドポリヌクレオチドによってコードされる生成ハイブリッドポリペプチドは、元の酵素の各々から得られた特殊化されたポリメラーゼ活性について、すなわち前記ポリメラーゼが３’−５’エクソヌクレアーゼ活性を有するか否か、前記ポリメラーゼのＤＮＡ伸長速度、野生型ポリメラーゼと比較して異なるｐＨでの％残留活性、およびポリメラーゼ活性の最適温度および上限温度についてスクリーニングすることができる。したがって例えば、ハイブリッドポリメラーゼを元のポリメラーゼから区別する化学的機能性、例えば、温度安定性の上限、上限温度での温度安定性の持続時間、またはハイブリッドポリペプチドが機能するｐＨまたは塩濃度を確認するために、前記ポリメラーゼをスクリーニングすることができる。スクリーニングすることができるさらに別の所望されるポリメラーゼの特徴には、長さが２０ｋｂより大きいか、または９０％を越えるグアニジン−シトシン（ＧＣ）含有量を含む鋳型分子のＰＣＲでのハイブリッドポリメラーゼの有用性が含まれる。
【００７９】
元のポリヌクレオチドの供給源は、個々の生物（“単離株”）、限定培地（“富裕培地”）で増殖させた生物集合物、または未培養生物（“環境サンプル”）から単離できる。環境サンプルから新規な生物活性をコードするポリヌクレオチドを誘導する培養非依存性アプローチを使用することがもっとも好ましい。なぜならば、前記のアプローチは、未開発の多様な生物資源にアクセスすることができるからである。
【００８０】
“環境ライブラリー”は環境サンプルから生成され、適切な原核細胞宿主で増殖させることができるクローニングベクター内に保存された天然に存在する生物のゲノム集合である。クローン化ＤＮＡは先ず初めに環境サンプルから直接抽出されるので、前記ライブラリーは純粋な培養で増殖できる原核細胞の小部分に限定されない。さらに、原核細胞宿主で産生することができるポリメラーゼは、工業的製造のために容易にスケールアップすることができる。前記サンプルに存在する環境性ＤＮＡの標準化によって、最初のサンプルに存在する全種に由来するＤＮＡのより均等な表現を可能にすることができるであろう。これによって、優勢な種と比較して数オーダー低く現れる可能性があるサンプルのマイナーな構成成分に由来する重要な遺伝子の発見効率が劇的に高められるであろう。
【００８１】
例えば、１つまたは２つ以上の未培養微生物から生成された遺伝子ライブラリーが問題の活性についてスクリーニングされる。問題の生物活性分子をコードする潜在的経路は、遺伝子発現ライブラリーの形態で先ず初めに原核細胞で捕捉される。問題の活性をコードするポリヌクレオチドを前記ライブラリーから単離し、宿主細胞に導入する。新規な活性または活性の強化を示す潜在的に活性を有する生物分子を創出する組換えおよび／または減数再組合わせを促進する条件下で前記宿主細胞を増殖させる。
【００８２】
配列番号：１、３、５、７、９、１１、１３、１５を有する本発明のポリヌクレオチドが由来する微生物はピロロブス・フマリアである。さらに新たなポリヌクレオチドを原核微生物（例えば真正細菌および古細菌）および下等真核微生物（例えば真菌、いくつかの藻類および原虫）から調製することができる。ポリヌクレオチドは環境サンプルから単離できる。その場合、前記核酸は、生物を培養することなく回収することができ、または１つまたは２つ以上の培養生物から回収することができる。約９０℃から約１５０℃までの範囲（例えば１１３℃まで）でポリメラーゼ活性を有するために、前記微生物は好ましくは、陸上の温泉または深海の熱噴出口で１００℃を越える温度で機能する超好熱細菌である。超好熱細菌によって産生されるポリメラーゼは低い温度では酵素活性が失われるかもしれない。例えば、ピロロブス・フマリアは９０℃以下の温度で増殖を停止する。
【００８３】
上記で述べたように選別され単離されたポリヌクレオチドは適切な宿主に導入される。適切な宿主細胞は、組換えおよび／または減数再組合せを促進することができる任意の細胞である。選択したポリヌクレオチドは、適切な制御配列を含むベクターに好ましくは既に収納されてある。宿主細胞は高等真核細胞（例えば哺乳類細胞）、または下等真核細胞（例えば酵母細胞）であろう。または宿主細胞は、好ましくは原核細胞（例えば細菌細胞）であろう。構築物の前記宿主細胞への導入は、リン酸カルシウムトランスフェクション、ＤＥＡＥ−デキストラン仲介トランスフェクション、または電気穿孔（Ｄａｖｉｓｅｔａｌ．１９８６）によって実施できる。
適切な宿主の代表的な例として以下を挙げることができる：細菌細胞、例えば大腸菌、ストレプトミセス（Ｓｔｒｅｐｔｏｍｙｃｅｓ）、ネズミチフス菌（Ｓａｌｍｏｎｅｌｌａｔｙｐｈｉｍｕｒｉｕｍ）；真菌細胞、例えば酵母；昆虫細胞、例えばショウジョウバエ（Ｄｒｏｓｏｐｈｉｌａ）Ｓ２およびスポディプテラ（Ｓｐｏｄｉｐｔｅｒａ）Ｓｆ９；動物細胞、例えばＣＨＯ、ＣＯＳまたはボウズ（Ｂｏｗｅｓ）メラノーマ；アデノウイルス；および植物細胞。適切な宿主の選択は、本明細書の記載にしたがって当業者が選択できると考えられる。
【００８４】
組換えタンパク質の発現に用いることができる種々の哺乳類細胞培養系を特に示せば、哺乳類発現系の例には、サル腎臓線維芽細胞のＣＯＳ−７株（以下の文献に記載されている：Ｇｌｕｚｍａｎ，１９８１，”ＳＶ４０−ｔｒａｎｓｆｏｒｍｅｄｓｉｍｉａｎｃｅｌｌｓｕｐｐｏｒｔｔｈｅｒｅｐｌｉｃａｔｉｏｎｏｆｅａｒｌｙＳＶ４０ｍｕｔａｎｔｓ”）、および適合するベクターを発現させることができる他の細胞株、例えばＣ１２７、３Ｔ３、ＣＨＯ、ＨｅＬａおよびＢＨＫ細胞株が含まれる。哺乳類発現ベクターは、複製起点、適切なプロモーターおよびエンハンサー、さらにまた必要ないずれかのリボソーム結合部位、ポリアデニル化部位、スプライスドナーおよびアクセプター部位、転写終了配列、並びに５’フランキング非転写配列を含むであろう。ＳＶ４０スプライスに由来するＤＮＡ配列およびポリアデニル化部位を用いて、必要な非転写遺伝子エレメントを提供することができる。
【００８５】
問題のポリヌクレオチドを含む宿主細胞を、プロモーターを活性化させるために適切に改変した通常の栄養培養液で培養し、形質転換体を選別し、さらに遺伝子を増幅させることができる。前記培養条件、例えば温度およびｐＨなどは、発現のために選択した宿主細胞に関して以前に用いられたものであり、当業者には明白であろう。７０℃から約１１３℃までの範囲の温度で固有のポリメラーゼ活性を有することが認定されたクローンの配列を決定し、前記ポリメラーゼをコードするポリヌクレオチド配列を同定することができる。
【００８６】
遺伝子クラスターＤＮＡは種々の生物から単離し、さらにベクター、特に発現調節配列を含むベクターに連結することができる（前記発現調節配列は、前記連結遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレーの活性が生成されるのを制御および調節することができる）。外因性ＤＮＡの導入のために極めて大きな能力をもつベクターの使用は、特に前記遺伝子クラスターとともに用いる場合に特に適切で、本明細書では大腸菌のｆ−因子（稔性因子）を含む実施例として記載されている。前記大腸菌のｆ−因子は、接合中にそれ自体の高頻度移入に影響を与えるプラスミドで、大型のＤＮＡフラグメント（例えば混合微生物サンプルの遺伝子クラスター）の安定な増殖のために理想的である。特に好ましい実施態様は、クローニングベクター（“フォスミド”または細菌性人工染色体（ＢＡＣ）ベクターと称される）を使用することである。前記ベクターは、ゲノムＤＮＡの大きなセグメントを安定に組み込むことができる大腸菌ｆ−因子に由来する。混合非培養環境サンプルに由来するＤＮＡとともに組み込まれたとき、前記は大きなゲノムフラグメントを“環境性ＤＮＡライブラリー”の形態で入手することを可能にする。
【００８７】
本発明で使用されるまた別のタイプのベクターは、コスミドベクターである。コスミドベクターは、本来大きなゲノムＤＮＡセグメントをクローニングし増殖させるためにデザインされたものである。コスミドベクターでのクローニングは下記文献に詳細に記載されている：”ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡｌａｂｏｒａｔｏｒｙＭａｎｕａｌ”（Ｓａｍｂｒｏｏｋｅｔａｌ．，１９８９）。いったん適切なベクターに連結したら、種々のポリペプチド合成遺伝子クラスターを含む２つまたは３つ以上のベクターを適切な宿主細胞に導入することができる。遺伝子クラスターによって共有される部分的配列相同性領域は、ハイブリッド遺伝子クラスターを生じる配列再構成をもたらすプロセスを促進するであろう。続いて、前記の新規なハイブリッド遺伝子クラスターを、本来の遺伝子クラスターで見出されないポリメラーゼ活性について、または本来の遺伝子クラスターで見出されるものから変化したポリメラーゼ活性についてスクリーニングすることができる。
【００８８】
したがってある実施態様では、本発明は、以下の工程によって生物学的に活性なハイブリッドポリペプチドを生成し、前記ポリペプチドを活性の強化についてスクリーニングする方法に関する：
１）動作可能なように連結された少なくとも第一のポリヌクレオチドおよび動作可能なように連結された第二のポリヌクレオチドを適切な宿主細胞に導入することであって、前記第一のポリヌクレオチドおよび前記第二のポリヌクレオチドは部分的な配列相同性を有する少なくとも１つの領域を共有しており；
２）配列認識を促進する条件下で前記宿主細胞を増殖させ、動作可能なように連結されたハイブリッドポリヌクレオチドを生成し；
３）前記ハイブリッドポリヌクレオチドによってコードされるハイブリッドポリペプチドを発現させ；
４）生物学的活性の強化の同定を容易にする条件下で前記ハイブリッドポリペプチドをスクリーニングし；
５）前記ハイブリッドポリペプチドをコードするポリヌクレオチドを単離する。
ポリメラーゼ活性についてスクリーニングする方法は当業者には公知で、本明細書を通して考察されている。そのような方法は、本発明のポリペプチドおよびポリヌクレオチドを単離した時に用いることができる。
【００８９】
使用することができる発現ベクターの代表的な例として以下を挙げることができる：ウイルス粒子、バキュロウイルス、ファージ、プラスミド、ファージミド、コスミド、フォスミド、細菌人工染色体、ウイルスＤＮＡ（例えばワクシニア、アデノウイルス、鶏痘ウイルス、仮性狂犬病およびＳＶ４０誘導体）、Ｐ１系人工染色体、酵母人工染色体、および問題の固有の宿主（例えばバチルス、アスペルギルス、および酵母）に特異的な任意の他のベクター。したがって、例えば前記ＤＮＡはポリペプチドを発現させるために多様な発現ベクターのいずれかに含有させることができる。前記ベクターには、染色体配列、非染色体配列および合成ＤＮＡ配列が含まれる。多数の適切なベクターが当業者には公知で、さらに市販されている。以下のベクターは例として提供される：細菌性：ｐＱＥベクター（Ｑｉａｇｅｎ）、ｐＢｌｕｅｓｃｒｉｐｔプラスミド、ｐＮＨベクター（λ−ＺＡＰベクター（Ｓｔｒａｔａｇｅｎｅ））；ｐｔｃ９９ａ、ｐＫＫ２２３−３、ｐＤＲ５４０、ｐＲＩＴ２Ｔ（Ｐｈａｒｍａｃｉａ）；真核細胞性：ｐＸＴ１、ｐＳＧ５（Ｓｔｒａｔａｇｅｎｅ）、ｐＳＶＫ３、ｐＢＰＶ、ｐＭＳＧ、ｐＳＶＬＳＶ４０（Ｐｈａｒｍａｃｉａ）。しかしながら、他のいずれのプラスミドまたは他のいずれのベクターもそれらが宿主細胞で複製可能で生存可能である限り用いることができる。低コピー数ベクターまたは高コピー数ベクターも本発明で用いることができる。
【００９０】
発現ベクター内のＤＮＡ配列は、ＲＮＡ合成を指令する適切な発現制御配列（プロモーター）に機能的に連結される。特に列挙すれば、細菌プロモーターには、ｌａｃＩ、ｌａｃＺ、Ｔ３、Ｔ７、ｇｐｔ、ｌａｍｂｄａＰ_Ｒ、Ｐ_Ｌおよびｔｒｐが含まれる。真核細胞プロモーターには、ＣＭＶ極初期、ＨＳＶチミジンキナーゼ、初期および後期ＳＶ４０、レトロウイルス由来ＬＴＲ、およびマウスのメタロチオネン−Ｉが含まれる。適切なベクターおよびプロモーターの選択は当業者に周知である。前記発現ベクターはまた、翻訳開始のためのリボソーム結合部位および転写ターミネーターを含む。前記ベクターはまた発現増幅のための適切な配列を含むことができる。プロモーター領域は、ＣＡＴ（クロラムフェニコールトランスフェラーゼ）ベクターまたは選別可能マーカーを含む他のベクターを用いて任意の所望の遺伝子から選択できる。さらに、発現ベクターは好ましくは１つまたは２つ以上の選別可能マーカー遺伝子を含み、形質転換細胞の選別のための表現型特性、例えば真核細胞の場合はジヒドロフォレートレダクターゼまたはネオマイシン耐性、大腸菌のテトラサイクリンまたはアンピシリン耐性を提供する。
【００９１】
ｉｎｖｉｖｏ再組合せは、包括的には“組換え”と称される“分子間”プロセスに依存し、細菌では一般に“ＲｅｃＡ依存”現象とみなされる。本発明は、配列を組換えて再度組み合わせるために宿主細胞の組換えプロセスに依存するか、または細胞内の擬似反復配列のコンプレキシティーを欠失によって減少させる減数プロセスを仲介する細胞の能力に依存する。この“減数再組合せ”のプロセスは“分子間”ＲｅｃＡ非依存プロセスによって生じる。
【００９２】
したがって、本発明の別の実施態様では、新規なポリヌクレオチドは減数再組合せのプロセスによって生成できる。前記方法は、連続配列（最初のコード配列）を含む構築物の生成、それらの適切なベクターへの挿入、続いて適切な宿主細胞へのそれらの導入を必要とする。個々の分子の認定本体（ｉｄｅｎｔｉｔｉｅｓ）の再組合せは、相同性領域を有する構築物中の連続配列間または擬似反復ユニット間の結合プロセスによって生じる。前記再組合せプロセスは、反復配列のコンプレキシティーおよび程度の再組換えおよび／または減少をもたらし、さらに新規な分子種の生成をもたらす。種々の処置を適用して、再組合せ速度を高めることができる。前記処置には、紫外線またはＤＮＡ損傷化学物質による処置および／または“遺伝的不安定性”のレベルが強化された宿主細胞株の使用が含まれる。したがって、再組合せプロセスは相同性組換え、またはそれ自身の進化を誘導する擬似反復配列の天然の特性を必要とする。
【００９３】
反復配列または“擬似反復”配列は遺伝的不安定性において役割を果たす。本発明では、“擬似リピート”はそれらの本来のユニット構造に限定されない反復物である。擬似反復ユニットは、構築物中の配列アレー、同様な配列の連続ユニットとして提示することができる。いったん連結されたら、連続配列間の結合部は本質的に見分けることができなくなり、生じた構築物の擬似反復特性は分子レベルではもはや連続的である。生成される構築物のコンプレキシティーを減少させるために細胞が行う前記欠失プロセスは擬似反復配列間で生じる。前記擬似反復ユニットは、すべり現象をもたらす鋳型の実用的な無限のレパートリーを提供する。したがって、擬似リピートを含む構築物は、実質的に擬似反復ユニット内の任意の場所に欠失（および潜在的には挿入）事象を生じる十分な分子の順応性を効果的に提供する。
【００９４】
前記擬似反復配列が全て同じ向きに（例えばヘッド−テール結合またはその逆）連結されたとき、細胞は個々のユニットを識別することができない。結果として、減数プロセスが配列全体に発生し得る。対照的に、前記ユニットがヘッド−テール結合ではなくヘッド−ヘッド結合で存在するとき、前記倒置によって隣接ユニットの終末点が明確に示され、欠失形成は離散的ユニットの損失を促進するであろう。したがって、本発明の方法に関しては配列が同じ向きにあることが好ましい。擬似反復配列のランダムな方向性は再組合せ効率の低下をもたらすが、一定の方向性の配列はもっとも高い効率を提供するであろう。しかしながら、同じ向きの連続配列の数が少なければ前記効率は低下するが、一方、前記はなお新規な分子の効果的な回収について十分な順応性を提供することができる。構築物は同じ向きの擬似反復配列を用いて作製し、より高い効率を可能にすることができる。
【００９５】
配列は、以下を含む任意の多様な方法を用いてヘッド−テール結合の向きで組み立てることができる：
ａ）ポリＡヘッドおよびポリＴ尾部（一本鎖を作製するときは、前記によって方向性が提供される）を含むプライマーを利用することができる。これは、プライマーの最初の数塩基をＲＮＡで生成することによって（したがってＲＮａｓｅＨによって容易に分解できる）達成できる。
ｂ）固有の制限部位を含むプライマーを用いることができる。多数の部位、一連の固有配列および合成と連結の工程の繰返しが要求されよう。
ｃ）プライマーの内部の数塩基をチオール化し、さらにエキソヌクレアーゼを用いて適切なテールを有する分子を生成することができよう。
【００９６】
再組合せされた配列の回収は、ＲＩが低いクローニングベクターの同定に依存する。前記の再組合せされたコード配列を続いて増幅によって回収する。生成物を再クローンニングし発現させる。ＲＩが低いクローニングベクターの回収は以下によって実施できる：
１）構築物のコンプレキシティーが減少したときにのみ安定に維持されるベクターを使用する。
２）短縮ベクターの物理的方法による回収。この場合、クローニングベクターは標準的なプラスミド単離方法を用いて回収され、さらにアガロースゲルまたはカラムのいずれかで標準的な方法を利用して低分子量カットオフによりサイズで分画されるであろう。
３）挿入物サイズが減少したときに選別できる介在遺伝子を含むベクターを回収する。
４）発現ベクターおよび適切な選別を用いる直接選別技術を使用する。
【００９７】
関連する生物由来のコード配列（例えば遺伝子）は高度な相同性を示し、多様なタンパク生成物をコードするであろう。前記のようなタイプの配列は、擬似反復配列として本発明で特に有用である。しかしながら、下記に例示した実施例ではほとんど同一のオリジナルコード配列（擬似反復配列）の再組合せを示したが、本プロセスはそのようなほぼ同一の反復配列に限定されない。
以下の実施例によって本発明の方法が立証される。３つの固有種に由来するコード核酸配列（擬似反復配列）について述べる。各配列は、別個の一組の特性を有するタンパク質をコードする。配列の各々は、その中の固有の位置に１つまたは数塩基対の相違を有する。前記擬似反復配列を別々に、または一緒に増幅し、さらに、全ての可能な並べ換えおよび組合せが連結分子集団で得られるようにランダムに連結して集合物にする。擬似反復配列ユニットの数はアッセンブリー条件によって制御することができる。構築物中の擬似反復ユニットの平均数は反復指標（ＲＩ）と定義される。
【００９８】
いったん形成したら、前記構築物は文献に記載されたプロトコルに従ってサイズにより分画し（またはしなくてもよい）、適切な宿主細胞にトランスフェクトすることができる。続いて細胞を増殖させ、“減数再組み合わせ”を実施する。減数再組合せプロセスの速度は、所望の場合はＤＮＡ損傷の誘発によって促進することができる。ＲＩの減少が、“分子内”メカニズムによる反復配列間の欠失形成によって仲介されるか、または“分子間”メカニズムによる組換え様事象によって仲介されるかは重要ではない。最終的に得られるものは、前記分子の再組合せによる可能な全ての組合せである。
【００９９】
場合によって前記方法はさらに別の工程を含む。前記工程は、シャッフリング実施プールのライブラリー構成物をスクリーニングし、シャッフリングを実施したライブラリーで、予め定めた巨大分子（例えばタンパク質性レセプター、オリゴ糖、ヴァイロン（ｖｉｒｏｎ））または他の予め定めた化合物または構造と結合もしくは相互作用する能力、または前記との特定の増幅反応を触媒する能力を有する個々の構成物質を同定する。
前記ライブラリーから同定されたポリペプチドは、治療、診断、研究および関連する目的（例えば触媒、水溶液の浸透圧を増加させるための溶質など）のために用いることができ、および／または、もう１回または２回以上のさらに別のシャッフリングおよび／または選別サイクルに付すことができる。
【０１００】
別の特徴では、組換えまたは再組合せの前またはその最中に、変異をオリジナルのポリヌクレオチドに導入しやすくする薬剤またはプロセスに本発明の方法によって生成されたポリヌクレオチドを付すことが考慮される。前記変異の導入は、生成されるハイブリッドポリヌクレオチドおよびそれらからコードされるポリペプチドの多様性を高めるであろう。突然変異導入を促進する薬剤またはプロセスには以下が含まれるが、ただしこれらに限定されない：（＋）−ＣＣ−１０６５または合成類似体、例えば（＋）−ＣＣ−１０６５−（Ｎ３−アデニン）（ＳｕｎａｎｄＨｕｒｌｅｙ，１９９２）；ＤＮＡ合成を抑制することができるＮ−アセチル化または脱アセチル化４’−フルオロ−４−アミノビフェニルアダクツ（例えば、ｖａｎｄｅＰｏｌｌｅｔａｌ．，１９９２）；またはＤＮＡ合成を抑制することができるＮ−アセチル化または脱アセチル化４−アミノビフェニルアダクツ（例えばまた以下を参照されたい：ｖａｎｄｅＰｏｌｌｅｔａｌ．，１９９２，ｐｐ．７５１−７５８）；３価クロム、３価クロム塩、ＤＮＡ複製を抑制することができる多環式芳香族炭化水素（”ＰＡＨ”）ＤＮＡアダクツ、例えば７−ブロモメチル−ベンゾ［ａ］アントラセン（“ＢＭＡ”）、トリス（２，３−ジブロモプロピル）ホスフェート（“トリス−ＢＰ”）、１，２−ジブロモ−３−クロロプロパン（“ＤＢＣＰ”）、２−ブロモアクロレイン（２ＢＡ）、ベンゾ［ａ］ピレン−７，８−ジヒドロジオール−９−１０−エポキシド（“ＢＰＤＥ”）、ハロゲン白金塩（ＩＩ）、Ｎ−ヒドロキシ−２−アミノ−３−メチルイミダゾール［４，５−ｆ］−キノリン（“Ｎ−ヒドロキシ−ＩＱ”）、およびＮ−ヒドロキシ−２−アミノ−１−メチル−６−フェニルイミダゾール［４，５−ｆ］ピリジン（“Ｎ−ヒドロキシ−ＰｈＩＰ”）。ＰＣＲ増幅を遅くするかまたは停止させる特に好ましい手段は、ＵＶ光（＋）−ＣＣ１０６５および（＋）−ＣＣ−１０６５−（Ｎ３−アデニン）から成る。特に包含される手段は、ＤＮＡアダクツまたはポリヌクレオチドもしくはポリヌクレオチドプール由来のＤＮＡアダクツを含むポリヌクレオチドであり、前記は、更なる処理の前にポリヌクレオチドを含む溶液の加熱を含むプロセスによって遊離または除去される。
【０１０１】
別の特徴では、本発明は、野生型タンパク質をコードする二本鎖鋳型ポリヌクレオチドを含むサンプルを、ハイブリッドまたは再組合せポリヌクレオチドを提供する本発明の条件の下で処理することによって、生物学的活性を有するリコンビナントタンパク質を生成する方法を目的とする。
本発明はまた、点変異をポリヌクレオチドに導入して、全範囲の単一アミノ酸置換が各アミノ酸部位において出現する子孫ポリペプチドセットを生成するための専用コドンプライマー（縮退Ｎ，Ｎ，Ｎ配列を含む）の使用を提供する（遺伝子部位飽和突然変異導入（ｇｅｎｅｓｉｔｅｓａｔｕｒａｔｅｄｍｕｔａｇｅｎｅｓｉｓ，ＧＳＳＭ））。使用されるオリゴは、連続的に第一の相同配列、縮退Ｎ，Ｎ，Ｎ配列および必ずというわけではないが好ましくは第二の相同配列を含む。Ｎ，Ｎ，Ｎ配列の縮退は２０個のアミノ酸全てに対するコドンを含むので、下流の子孫ポリペプチドの翻訳生成物は、前記ポリペプチドに沿って各アミノ酸サイトで全ての可能なアミノ酸変更を含む。
【０１０２】
ある特徴では、前記のような縮退オリゴ（縮退Ｎ，Ｎ，Ｎカセットで構成される）の１つを用いて、親のポリヌクレオチド鋳型の各オリジナルコドンが完全なコドン置換に付される。別の特徴では、少なくとも２つの縮退Ｎ，Ｎ，Ｎカセット（同じオリゴまたは異なるオリゴ）を用いて、親のポリヌクレオチド鋳型の少なくとも２つのオリジナルコドンが完全なコドン置換に付される。したがって、２つ以上のＮ，Ｎ，Ｎ配列を１つのオリゴに含ませて、２つ以上の部位にアミノ酸変異を導入することができる。この複数のＮ，Ｎ，Ｎ配列は直接接していてもよいが、また１つまたは２つ以上の別のヌクレオチド配列によって分離されてあってもよい。別の特徴では、付加および欠失を導入するために有用なオリゴを、単独またはＮ，Ｎ，Ｎ配列を含むコドンと組み合わせて用いて、アミノ酸の付加、欠失および／または置換の任意の組合せまたは並べ換えを導入することができる。
【０１０３】
特別な実施態様では、連続的なＮ，Ｎ，Ｎトリプレット（すなわち縮退（Ｎ，Ｎ，Ｎ）_ｎ配列）を含むオリゴを用いて、２つまたは３つ以上のアミノ酸の位置を同時に変異させることができる。
また別の特徴では、本発明は、Ｎ，Ｎ，Ｎ配列よりも少ない縮退を有する縮退カセットの使用を提供する。例えば、いくつかの事例では、（例えばオリゴとして）ただ１種のＮ（この場合Ｎはトリプレットの一番目、二番目または三番目の位置にあるものであってよい）で構成された縮退トリプレット配列を用いることが望ましいであろう。他のいずれの塩基（その任意の組合せおよび並べ換えを含む）も前記トリプレットの残りの２つの位置で用いることができる。また別には、いくつかの事例では、縮退Ｎ，Ｎ，Ｎトリプレット配列、Ｎ，Ｎ，Ｇ／Ｔ、またはＮ，Ｎ，Ｇ／Ｃトリプレット配列を（オリゴとして）用いることが所望されるであろう。
【０１０４】
しかしながら、本発明で開示した縮退トリプレット（例えばＮ，Ｎ，Ｇ／ＴまたはＮ，Ｎ，Ｇ／Ｃトリプレット配列）の使用が、いくつかの理由から有利であることは理解されるところである。ある特徴では、本発明は、可能なアミノ酸（合計２０個のアミノ酸について）をポリペプチド内の各々および全てのアミノ酸の位置で完全に、系統的にさらにかなり容易に置換させる手段を提供する。したがって、１００個のアミノ酸のポリペプチドの場合、本発明は、系統的にさらにかなり容易に２０００個の異なる種（すなわち各位置につき２０個の可能なアミノ酸×１００アミノ酸の位置）を生成する方法を提供する。縮退Ｎ，Ｎ，Ｇ／ＴまたはＮ，Ｎ，Ｇ／Ｃトリプレット配列を収納するオリゴの使用により、２０個の可能なアミノ酸をコードする３２個の別個の配列が提供されることは理解されよう。したがって、前記のような１つのオリゴを用いて親のポリヌクレオチド配列が飽和変異導入に付されている反応容器内には、２０個の異なるポリペプチドをコードする３２個の異なる子孫ポリヌクレオチドが存在する。対照的に、部位特異的突然変異導入で非縮退オリゴを使用することによって各反応容器につきただ１つの子孫ポリペプチド生成物が生じる。
【０１０５】
本発明はまた非縮退オリゴの使用を提供し、前記非縮退オリゴは、場合によって開示の縮退プライマーと組み合わせて用いられる。いくつかの状況では、非縮退オリゴを用いて、問題のポリヌクレオチドで特定の点変異を生成するのが有利であることは理解されよう。前記は、特定の非発現点変異、対応するアミノ酸の変化をもたらす点変異、並びに終止コドンの生成および対応するポリペプチドフラグメントの発現をもたらす点変異を創出する手段を提供する。
【０１０６】
したがって、本発明の好ましい実施態様では、各飽和突然変異導入反応容器は、親のポリヌクレオチドで突然変異を誘発したコドンの位置に対応する１つの固有のアミノ酸の位置に２０個のアミノ酸全てが出現するように少なくとも２０個の子孫ポリペプチド分子をコードするポリヌクレオチドを含む。各飽和突然変異導入反応容器から生成される３２倍の縮退子孫ポリペプチドをクローン増幅（例えば発現ベクターを用いて大腸菌宿主でクローニングする）に付し、さらに発現スクリーニングに付すことができる。スクリーニングして好ましい特性変化を表示させることによって個々の子孫ポリペプチドを認定したとき、前記ポリペプチドの配列を決定し、その中に含まれている対応する個々の好ましいアミノ酸置換を同定することができる。
【０１０７】
本明細書に開示した飽和突然変異導入を用いて親のポリペプチドの各々および全てのアミノ酸の位置を変異させるときに、２つ以上のアミノ酸の位置で好ましいアミノ酸の変化を同定できることは理解されよう。これら好ましいアミノ酸置換の全てまたは一部分を含む１つまたは２つ以上の新規な子孫分子を生成することができる。例えば、２つの固有の好ましいアミノ酸の変化がポリペプチド内の３つのアミノ酸各位置に同定される場合、順列は各位置で３つの可能性（本来のアミノ酸から変化がないもの、および２つの好ましい変化のうちのそれぞれ１つ）を３つの位置で含む。したがって、可能性の合計は３×３×３または２７で、これは以前に調べた７つ、すなわち６つの単一点変異（すなわち３つの位置の各々について２個）およびいずれの位置にも変化がないものを含む。
【０１０８】
さらに別の特徴では、部位飽和突然変異導入は、シャッフリング、キメラ化、組換えおよび他の突然変異導入プロセスとと共にスクリーニングと合わせて用いることができる。本発明は、任意の突然変異導入プロセス（飽和突然変異導入を含む）の反復態様における使用を提供する。ある実施態様では、任意の突然変異導入プロセスの反復使用がスクリーニングと組み合わせて用いられる。
したがって非制限的に例示すれば、本発明は、さらに別の突然変異導入プロセスと組み合わせた飽和突然変異導入の使用を提供する。前記別の突然変異導入プロセスは、例えば、２つまたは３つ以上の関連ポリヌクレオチドを適切な宿主細胞に導入し、ハイブリッドポリヌクレオチドを組換えおよび減数再組合せによって生成するものである。
【０１０９】
遺伝子の完全な配列に対して突然変異導入を実施する他に、本発明はポリヌクレオチド内の任意の数の塩基をそれぞれ置換することができる突然変異の使用を提供する。突然変異を誘発される前記塩基数は、好ましくは１５から１０００００までの全ての整数である。したがって、分子の任意の位置に突然変異を誘発する代わりに、任意の数の塩基または一定の数の塩基（好ましくは総数１５から１０００００のサブセット）を突然変異導入に付すことができる。好ましくは、ばらばらのヌクレオチドが、ポリヌクレオチド配列の各位置または数ヶ所の位置を含むグループの突然変異導入のために用いられる。突然変異導入を実施される３ヶ所の位置を含むグループはコドンであってもよい。変異は、好ましくは突然変異導入性プライマー（突然変異導入性カセットとも称される異種カセットを含む）を用いて導入される。好ましいカセットは１から５００塩基を有することができる。前記異種カセットの各ヌクレオチドの配置は、Ｎ、Ａ、Ｃ、Ｇ、Ｔ、Ａ／Ｃ、Ａ／Ｇ、Ａ／Ｔ、Ｃ／Ｇ、Ｃ／Ｔ、Ｇ／Ｔ、Ｃ／Ｇ／Ｔ、Ａ／Ｇ／Ｔ、Ａ／Ｃ／Ｔ、Ａ／Ｃ／ＧまたはＥで、ここでＥは、Ａ、Ｃ、ＧまたはＴではない任意の塩基である（Ｅはデザイナーオリゴと称することもできる）。
【０１１０】
一般的な意味で、飽和突然変異導入は、突然変異導入を実施されるべき一定の範囲のポリヌクレオチド（突然変異導入されるべき前記配列は好ましくは長さが約１５から１０００００塩基である）内の完全な一組の突然変異導入性カセット（各カセットは好ましくは１−５００塩基の長さである）を突然変異導入することを含む。したがって、数変異（１から１００個の範囲の変異）を含む１つのグループが、突然変異を誘発されるべき各カセットに導入される。１ラウンドの飽和突然変異導入適用中に、１つのカセットに導入されるべき変異の集合は、第二のカセットに導入されるべき第二の変異の集合と同じでも異なっていてもよい。前記集合は例示すれば欠失、付加、特定コドンの集合、および特定ヌクレオチドカセットの集合である。
【０１１１】
突然変異を誘発されるべき一定の範囲の配列は、完全な遺伝子、経路、ｃＤＮＡ、完全なオペロン読み枠（ＯＲＦ）および完全なプロモーター、エンハンサー、リプレッサー／トランスアクチベーター、複製起点、イントロン、オペレーターまたは任意のポリヌクレオチド機能群を含む。一般的には、本目的のための“一定の範囲の配列”とは、１５塩基のポリヌクレオチド配列、さらに長さが１５塩基から１５０００塩基の間のポリヌクレオチド配列の任意のポリヌクレオチドであろう（本発明では特に前記の間の全ての整数が指定される）。コドンの集合の選択で考慮されるべきこと事柄には、縮退突然変異導入性カセットによってコードされるアミノ酸タイプが含まれる。
突然変異導入性カセットに導入できる変異の集合の特に好ましい実施例で、本発明は特に、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９および２０個のアミノ酸を各位置でコードする縮退コドン置換（縮退オリゴを用いる）およびそれらによってコードされるポリペプチドライブラリーを提供する。
【０１１２】
本発明の特徴の１つは、１、３、５、７、９、１１、１３、１５の配列、および前記配列と実質的に同一の配列、前記配列と相補的な配列の１つ、またはグループＡの核酸配列の配列（または前記配列と相補的な配列）の１つの少なくとも１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００、３００、４００または５００の連続した塩基を含むフラグメントを含む単離核酸である。前記単離された核酸は、ＤＮＡ（ｃＤＮＡ、ゲノムＤＮＡおよび合成ＤＮＡを含む）を含む。前記ＤＮＡは二本鎖でも一本鎖でもよく、一本鎖の場合はコード鎖でも非コード鎖でもよい。また別には、前記単離核酸はＲＮＡでもよい。
下記でさらに詳細に説明するように、配列番号：１、３、５、７、９、１１、１３、１５および前記配列と実質的に同一の配列の１つの単離核酸を用いて、グループＢのアミノ酸配列および前記配列と実質的に同一の配列を有するポリペプチドの１つ、または配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列の１つの少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントを製造できる。
【０１１３】
したがって本発明の別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列のポリペプチド、または配列番号：２、４、６、８、１０、１２、１４、１６のポリペプチドの１つの少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントをコードする単離核酸である。前記核酸のコード配列は、配列番号：１、３、５、７、９、１１、１３、１５の核酸の１つのコード配列またはそのフラグメントの１つと同一であるか、または、遺伝暗号の重複もしくは縮退の結果として、縮退配列番号：２、４、６、８、１０、１２、１４、１６のポリペプチド、前記と実質的に同一の配列、および配列番号：２、４、６、８、１０、１２、１４、１６のポリペプチドの１つの少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントの１つをコードする異なるコード配列であろう。前記遺伝暗号は当業者には周知で、例えば以下の文献（Ｂ．Ｌｅｗｉｎ，ＧｅｎｅｓＶＩ，ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，１９９７）の２１４ページに記載されている（前記文献は引用により本明細書に含まれる）。
【０１１４】
配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチドの１つをコードする単離核酸は、以下のもの（ただしこれらに限定されない）を含むことができる：配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列の１つのコード配列のみ、およびさらに別のコード配列（例えばリーダー配列またはプロタンパク質配列）、および非コード配列（例えばイントロンまたはコード配列の５’および／または３’非コード配列）。したがって本明細書で用いられるように、“ポリペプチドをコードするポリヌクレオチド”という用語は、ポリペプチドのコード配列のみを含むポリヌクレオチドとともに、さらに別のコードおよび／または非コード配列も含むポリヌクレオチドを包含する。
【０１１５】
また別には、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列の核酸配列に、通常の技術、例えば部位特異的突然変異、または当業者に周知の他の技術を用いて突然変異を誘発し、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列のポリヌクレオチドにサイレント変化を導入することができる。本明細書において、“サイレント変化”には、例えばポリヌクレオチドによってコードされるアミノ酸配列を変更しない変化が含まれる。前記変化は、前記ポリペプチドをコードするベクターを含む宿主細胞によって産生されるポリペプチドレベルを、宿主生物で頻繁に生じるコドンまたはコドン対を導入することによって高めるために所望されるであろう。
【０１１６】
本発明はまた、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列のポリペプチドにおいてアミノ酸置換、付加、欠失、融合および末端切断をもたらすヌクレオチド変化を有するポリヌクレオチドに関する。前記のヌクレオチド変化は、例えば部位特異的突然変異導入、化学物質によるランダムな突然変異導入、エキソヌクレアーゼＩＩＩによる欠失、および他のＤＮＡ組換え技術を用いて導入することができる。あるいは、このようなヌクレオチド変化は天然に生じる対立遺伝子座変種であってもよく、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列（または前記と相補的な配列）の１つの少なくとも１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００、３００、４００または５００の連続した塩基を含むプローブと、本明細書で提供される高い、中等度または低いストリンジェンシー条件下で特異的にハイブリダイズする核酸を同定することによって単離される。
【０１１７】
配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列、前記と相補的な配列、または配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列または前記と相補的な配列の１つの少なくとも１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００、３００、４００または５００の連続した塩基を含むフラグメントの単離核酸をまた用いて、生物学的サンプル（例えば土壌サンプル）が本発明の核酸配列を有する生物を含むか否か、または前記核酸が得られた生物を含むか否かを決定することができる。そのような方法では、前記核酸が単離された生物を含む可能性がある生物学的サンプルを入手し、そのサンプルから核酸を入手する。プローブがサンプル中に存在する一切の相補的な配列と特異的にハイブリダイズすることができる条件下で、そのプローブと核酸を接触させる。
【０１１８】
必要な場合には、相補的な配列とプローブが特異的にハイブリダイズすることができる条件は、相補的な配列を含むことが判明しているサンプルに由来する相補的な配列とともに前記相補的な配列を含まないコントロール配列を前記プローブと接触させることによって決定してもよい。ハイブリダイゼーションの条件、例えばハイブリダイゼーション緩衝液の塩濃度、ハイブリダイゼーション緩衝液のホルムアミドの濃度、またはハイブリダイゼーションの温度を変動させて、プローブを相補的核酸と特異的にハイブリダイズさせる条件を同定することができる。
【０１１９】
前記核酸が単離された生物を前記サンプルが含んでいる場合は、プローブの固有のハイブリダイゼーションが検出される。ハイブリダイゼーションは、プローブを検出可能な薬剤（例えば放射性同位元素、蛍光染料、または検出可能な生成物の生成を触媒することができる酵素）で標識することによって検出することができる。
サンプル中の相補的な核酸の存在を検出する標識プローブを使用する多くの方法は当業者には周知である。前記方法には、サザンブロット、ノザンブロット、コロニーハイブリダイゼーションおよびドットブロットが含まれる。これらの方法の各々に関するプロトコルは以下の文献に提供されている：Ａｕｓｕｂｅｌｅｔａｌ． ”ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，” ＪｏｈｎＷｉｌｅｙ５０３Ｓｏｎｓ，Ｉｎｃ．１９９７；およびＳａｍｂｒｏｏｋｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ２^ｎｄＥｄ．，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，１９８９（前記文献は引用により本明細書に含まれる）。
【０１２０】
あるいは、２つ以上のプローブ（そのうちの少なくとも１つは核酸サンプル中に存在する一切の相補的配列と特異的にハイブリダイズすることができる）を増幅反応で用いて、前記サンプルが本発明の核酸を含む生物（例えば前記核酸が単離された生物）を含むか否かを決定してもよい。典型的には前記プローブはオリゴヌクレオチドを含む。ある実施態様では、前記増幅反応はＰＣＲ反応を含むことができる。ＰＣＲ反応は上掲書（ＡｕｓｕｂｅｌおよびＳａｍｂｒｏｏｋ）に記載されている。また別には、前記増幅はリガーゼ連鎖反応、３ＳＲまたは鎖置換反応を含むことができる（例えば以下の文献を参照されたい：Ｆ．Ｂａｒａｎｙ， ” ＴｈｅＬｉｇａｓｅＣｈａｉｎＲｅａｃｔｉｏｎｉｎａＰＣＲＷｏｒｌｄ”，ＰＣＲＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ１：５−１６，１９９１；Ｅ．Ｆａｈｙｅｔａｌ．， ”Ｓｅｌｆ−ｓｕｓｔａｉｎｅｄＳｅｑｕｅｎｃｅＲｅｐｌｉｃａｔｉｏｎ（３ＳＲ）：ＡｎＩｓｏｔｈｅｒｍａｌＴｒａｎｓｃｒｉｐｔｉｏｎ−ｂａｓｅｄＡｍｐｌｉｆｉｃａｔｉｏｎＳｙｓｔｅｍＡｌｔｅｒｎａｔｉｖｅｔｏＰＣＲ”，ＰＣＲＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ１：２５−３３，１９９１；Ｇ．Ｔ．Ｗａｌｋｅｒｅｔａｌ．， ” ＳｔｒａｎｄＤｉｓｐｌａｃｅｍｅｎｔＡｍｐｌｉｆｉｃａｔｉｏｎ−ａｎＩｓｏｔｈｅｒｍａｌｉｎｖｉｔｒｏＤＮＡＡｍｐｌｉｆｉｃａｔｉｏｎＴｅｃｈｎｉｑｕｅ”，ＮｕｃｌｅｉｃＡｃｉｄＲｅｓｅａｒｃｈ２０：１６９１−１６９６，１９９２（前記文献は引用により本明細書に含まれる））。これらの方法では、サンプル中の核酸をプローブと接触し、増幅反応を実施し、さらに得られた増幅反応生成物を全て検出する。前記増幅生成物は、反応生成物を用いてゲル電気泳動を実施し、前記ゲルをインターカレーター（例えば臭化エチジウム）で染色して検出できる。また別には、１つまたは２つ以上のプローブを放射性同位元素で標識し、ゲル電気泳動後にオートラジオグラフィーによって放射性の増幅生成物の存在を検出してもよい。
【０１２１】
また配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列の末端近くの配列に由来するプローブを染色体ウォーキング法で用いて、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列の近傍に位置するゲノム配列を含むクローンを特定してもよい。前記の方法は、宿主生物からさらに別のタンパク質をコードする遺伝子の単離を可能にする。
配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列、前記と相補的な配列、または配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列または前記と相補的な配列の１つの少なくとも１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００、３００、４００または５００の連続した塩基を含むフラグメントの単離核酸をプローブとして用いて、関連する核酸を同定または単離することができる。いくつかの実施態様では、関連する核酸は、前記核酸が単離された生物以外の生物のｃＤＮＡまたはゲノムＤＮＡであろう。例えば、前記他の生物は関連を有する生物であろう。前記の方法では、プローブが関連する核酸と特異的にハイブリダイズできる条件下で核酸サンプルをプローブと接触させる。続いて、プローブと関連する生物由来の核酸とのハイブリダイゼーションを上記に述べた方法のいずれかを用いて検出する。
【０１２２】
核酸ハイブリダイゼーション反応では、特定のレベルのストリンジェンシーを達成するために用いられる条件は、ハイブリダイズされる核酸の性質によって変動するであろう。例えば、ハイブリダイズさせる核酸領域の長さ、相補性の程度、ヌクレオチド配列の組成（例えばＧＣ対ＡＴ含有量）、および核酸のタイプ（例えばＲＮＡかＤＮＡか）は、ハイブリダイゼーション条件の選択で考慮されるであろう。さらに、核酸の１つが例えばフィルターに固定されているか否かが考慮されるであろう。
【０１２３】
ハイブリダイゼーションは、低ストリンジェンシー、中等度ストリンジェンシーまたは高ストリンジェンシー条件下で実施できる。核酸ハイブリダイゼーションの例を挙げれば、固定化した変性核酸を含むポリマーメンブレンを先ず３０分、４５℃で、０．９ＭのＮａＣｌ、５０ｍＭのＮａＨ_２ＰＯ_４（ｐＨ７．０）、５．０ｍＭのＮａ_２ＥＤＴＡ、０．５％ＳＤＳ、１０×デンハルト溶液および０．５ｍｇ／ｍＬのポリリボアデニル酸から成る溶液中で予備ハイブリダイズする。続いて前記溶液に、約２×１０^７ｃｐｍ（比活性４−９×１０^８ｃｐｍ／μｇ）の^３２Ｐ末端標識オリゴヌクレオチドを添加する。１２−１６時間のインキュベーションの後で、前記メンブレンを室温で０．５％のＳＤＳを含む１×ＳＥＴ（１５０ｍＬのＮａＣｌ、２０ｍＭのトリス塩酸（ｐＨ７．８）、１ｍＭのＮａ_２ＥＤＴＡ）で洗浄し、続いて新しい１×ＳＥＴで３０分、前記オリゴヌクレオチドプローブのＴ_ｍ−１０℃で洗浄する。続いて前記のメンブレンをオートラジオグラフィーフィルムに曝露しハイブリダイゼーションシグナルを検出する。
【０１２４】
検出可能プローブとハイブリダイズする核酸（例えばｃＤＮＡまたはゲノムＤＮＡ）を検出するために用いるハイブリダイゼーション条件のストリンジェンシーを変動させることによって、前記プローブと種々のレベルの相同性を有する核酸を同定し、単離することができる。ストリンジェンシーは、プローブの溶融温度より低い種々の温度でハイブリダイゼーションを実施することによって変動させることができる。溶融温度Ｔ_ｍは、（特定のイオン強度およびｐＨで）標的配列の５０％が完全に相補的なプローブとハイブリダイズする温度である。非常にストリンジェントな条件は、個々のプローブのＴ_ｍと等しいかまたは約５℃低くなるように選択される。プローブの溶融温度は以下の式を用いて計算される：
長さが１４から７０ヌクレオチドのプローブについては、溶融温度（Ｔ_ｍ）は次の式を用いて計算される：Ｔ_ｍ＝８１．５＋１６．６（ｌｏｇ［Ｎａ＋］）＋０．４１（Ｇ＋Ｃの割合）−（６００／Ｎ）、式中Ｎはプローブの長さである。
ハイブリダイゼーションがホルムアミドを含む溶液で実施される場合は、溶融温度は次の式を用いて計算できる：Ｔ_ｍ＝８１．５＋１６．６（ｌｏｇ［Ｎａ＋］）＋０．４１（Ｇ＋Ｃの割合）−（０．６３％ホルムアミド）−（６００／Ｎ）、式中Ｎはプローブの長さである。
ハイブリダイゼーションは、６×ＳＳＣ、５×デンハルト試薬、０．５％ＳＤＳ、１００μｇの変性フラグメント化サケ精子ＤＮＡ、または６×ＳＳＣ、５×デンハルト試薬、０．５％ＳＤＳ、１００μｇの変性フラグメント化サケ精子ＤＮＡ、５０％のホルムアミド中で実施できる。ＳＳＣおよびデンハルト試薬の処方は上掲書（Ｓａｍｂｒｏｏｋｅｔａｌ．）に記載されている。
【０１２５】
ハイブリダイゼーションは、上記に挙げた予備ハイブリダイゼーション溶液に検出可能なプローブを添加することによって実施できる。プローブが二本鎖ＤＮＡを含む場合は、ハイブリダイゼーション溶液に添加する前に前記プローブを変性させる。プローブと相補的な配列または相同な配列を含むｃＤＮＡまたはゲノムＤＮＡとプローブをハイブリダイズさせるために十分な時間、前記フィルターをハイブリダイゼーション溶液と接触させる。長さが２００ヌクレオチドを越えるプローブの場合は、ハイブリダイゼーションはＴ_ｍより１５−２５℃低い温度で実施することができる。より短いプローブの場合（例えばオリゴヌクレオチドプローブ）、ハイブリダイゼーションはＴ_ｍより５−１０℃低い温度で実施できる。典型的には６×ＳＳＣでのハイブリダイゼーションの場合は、ハイブリダイゼーションは約６８℃で実施される。通常、５０％のホルムアミドを含む溶液中でのハイブリダイゼーションの場合は、ハイブリダイゼーションは約４２℃で実施される。
前述のハイブリダイゼーションのいずれも高ストリンジェンシー条件下であると考えられる。
【０１２６】
ハイブリダイゼーションに続いて、フィルターを洗浄して非特異的に結合した検出用プローブの一切を除去する。フィルターを洗浄するために用いるストリンジェンシーもまた、ハイブリダイズさせる核酸の性質、ハイブリダイズさせる核酸の長さ、相補性の程度、ヌクレオチド配列の組成（例えばＧＣ対ＡＴ含有量）、および核酸のタイプ（例えばＲＮＡかＤＮＡか）に応じて変動させることができる。徐々に高くなるストリンジェンシー条件の洗浄の例は以下のとおりである：２×ＳＳＣ、０．１％ＳＤＳ、室温で１５分（低ストリンジェンシー）；０．１×ＳＳＣ、０．５％ＳＤＳ、室温で３０分から１時間（中等度のストリンジェンシー）；０．１×ＳＳＣ、０．５％ＳＤＳ、ハイブリダイゼーション温度から６８℃で１５分から３０分（高ストリンジェンシー）；および０．１５ＭのＮａＣｌ、７２℃で１５分（超ストリンジェンシー）。最後の低ストリンジェンシー洗浄は、０．１×ＳＳＣで室温で実施できる。上記の例は、フィルターの洗浄に用いることができる単なる条件一式の例示である。当業者は、種々のストリンジェンシーの洗浄用レシピーが多数存在することを認識しているであろう。他のいくつかの例は下記で示す。
プローブにハイブリダイズした核酸はオートラジオグラフィーまたは他の通常の技術によって同定される。
【０１２７】
上記の方法を改変して、プローブ配列と相同性レベルが低い核酸を同定できる。例えば、検出用プローブとの相同性が低い核酸を得るために、ストリンジェンシーがより低い条件を用いることができる。例えばハイブリダイゼーション温度は、約１ＭのＮａ^＋濃度を有するハイブリダイゼーション緩衝液中で、６８℃から４２℃まで５℃ずつ低下させることができる。ハイブリダイゼーションに続いて、フィルターを２×ＳＳＣ、０．５％のＳＤＳでハイブリダイゼーション温度で洗浄することができる。前記の条件は、５０℃以上で“中等度”の条件、５０℃未満で“低い”条件であると考えられる。“中等度”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが５５℃で実施されるときである。“低ストリンジェンシー”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが４５℃で実施されるときである。
【０１２８】
あるいは、ハイブリダイゼーションは緩衝液、例えばホルムアミドを含む６×ＳＳＣ中で４２℃の温度で実施できる。前記の場合、ハイブリダイゼーション緩衝液中のホルムアミドの濃度は、５０％から０％まで５％ずつ減少させ、プローブと相同性のレベルが低いクローンを同定できる。ハイブリダイゼーションの後で、フィルターを６×ＳＳＣ、０．５％のＳＤＳで５０℃で洗浄できる。前記の条件は、２５％を超えるホルムアミドで“中等度”の条件、２５％より低いホルムアミドで“低い”条件と考えられる。“中等度”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが３０％のホルムアミドで実施されるときである。“低ストリンジェンシー”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが１０％のホルムアミドで実施されるときである。
【０１２９】
例えば前述の方法は、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列、または前記の１つの少なくとも１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１５０、２００、３００、４００または５００の連続した塩基を含むフラグメント、および前記と相補的な配列の１つから成る群から選択される核酸配列と少なくとも約９７％、少なくとも９５％、少なくとも９０％、少なくとも８５％、少なくとも８０％、少なくとも７５％、少なくとも７０％、少なくとも６５％、少なくとも５５％、または少なくとも約５０％の相同性を有する配列をもつ核酸の単離に用いることができる。相同性はアラインメントアルゴリズムを用いて測定できる。例えば、相同なポリヌクレオチドは、本明細書に記載したコード配列の１つの天然に存在する対立遺伝子座変種であるコード配列を有するであろう。前記対立遺伝子座変種は、配列番号：１、３、５、７、９、１１、１３、１５または前記と相補的な配列と比較したとき、１つまたは２つ以上のヌクレオチドの置換、欠失、または付加を有するであろう。
【０１３０】
さらに、上記の方法は、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列、または前記の１つの少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントの１つの配列を有するポリペプチドと、配列アラインメントアルゴリズム（例えばデフォルトパラメーターを有するＦＡＳＴＡバージョン３．０ｔ７８アルゴリズム）を用いて決定したとき、少なくとも約９９％、少なくとも９５％、少なくとも９０％、少なくとも８５％、少なくとも８０％、少なくとも７５％、少なくとも７０％、少なくとも６５％、少なくとも６０％、少なくとも５５％、または少なくとも約５０％の相同性を有するポリペプチドをコードする核酸の単離に用いることができる。
【０１３１】
本発明のまた別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列、または前記の１つの少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００、または１５０の連続したアミノ酸を含むフラグメントの１つの配列を含む単離または精製ポリペプチドである。上記で述べたように、前記ポリペプチドは、前記ポリペプチドをコードする核酸をベクターに挿入することによって得ることができる。前記コード配列は、適切な宿主細胞で前記コードされたポリペプチドの発現を駆動することができる配列と動作可能なように連結される。例えば、発現ベクターは、プロモーター、翻訳開始のためのリボソーム結合部位および転写ターミネーターを含むことができる。前記ベクターはまた発現を増幅する適切な配列を含むことができる。
【０１３２】
ポリペプチドまたはそのフラグメントを細菌で発現させるために適したプロモーターには、大腸菌のｌａｃまたはｔｒｐプロモーター、ｌａｃＩプロモーター、ｌａｃＺプロモーター、Ｔ３プロモーター、Ｔ７プロモーター、ｇｐｔプロモーター、λＰ_Ｒプロモーター、λＰ_Ｌプロモーター、糖分解酵素（例えばホスホグリセレートキナーゼ（ＰＧＫ））をコードするオペロン由来のプロモーター、および酸性ホスファターゼプロモーターが含まれる。真菌のプロモーターには、∀因子プロモーターが含まれる。真核細胞プロモーターには、ＣＭＶ極初期プロモーター、ＨＳＶチミジンキナーゼプロモーター、熱ショックプロモーター、初期および後期ＳＶ４０プロモーター、レトロウイルス由来プロモーター、およびマウスのメタロチオネイン−Ｉプロモーターが含まれる。原核細胞または真核細胞またはそれらのウイルスで遺伝子が発現をすることが判明している他のプロモーターもまた用いることができる。
【０１３３】
哺乳類発現ベクターはまた、複製起点、必要な任意のリボソーム結合部位、ポリアデニル化部位、スプライシングドナーおよびアクセプター部位、転写終了配列、および５’フランキング非転写配列を含むことができる。いくつかの実施態様では、ＳＶ４０スプライスおよびポリアデニル化部位に由来するＤＮＡ配列を用いて、必要な非転写遺伝子エレメントを提供することができる。
ポリペプチドまたはそのフラグメントを真核細胞で発現するためのベクターはまた、発現レベルを高めるエンハンサーを含むことができる。エンハンサーはｃｉｓ−作動性ＤＮＡエレメントで、通常長さが約１０から約３００ｂｐでプロモーター上で作用してその転写を高める。例を挙げれば、複製起点の後期側１００から２７０ｂｐ上のＳＶ４０エンハンサー、サイトメガロウイルスの初期プロモーターエンハンサー、複製起点の後期側にあるポリオーマエンハンサーおよびアデノウイルスエンハンサーが含まれる。
【０１３４】
さらに、前記発現ベクターは典型的には１つまたは２つ以上の選別可能なマーカー遺伝子を含み、前記ベクターを含む宿主細胞の選別を可能にする。前記選別可能マーカーには、真核細胞培養のためのジヒドロフォレートレダクターゼをコードする遺伝子またはネオマイシン耐性を付与する遺伝子、大腸菌でテトラサイクリンまたはアンピシリン耐性を付与する遺伝子、およびビール酵母菌（Ｓ．ｃｅｒｅｖｉｓｉａｅ）ＴＲＰ１遺伝子が含まれる。
いくつかの実施態様では、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続アミノ酸を含むフラグメントの１つをコードする核酸が、翻訳された前記ポリペプチドまたはそのフラグメントの分泌を指令することができるリーダー配列を用いて適切な相で組み立てられる。場合によって、前記核酸は融合ポリペプチドをコードすることができる。前記融合ポリペプチドでは、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列のポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続アミノ酸を含むフラグメントの１つが、異種ペプチドまたはポリペプチド、例えば所望の特徴（例えば安定性の強化または精製の簡素化）を付与するＮ−末端認定ペプチドと融合される。
【０１３５】
適切なＤＮＡ配列を多様な方法によってベクターに挿入することができる。一般に、ＤＮＡ配列は、挿入物およびベクターを適切な制限エンドヌクレアーゼで消化した後、ベクターの所望の位置に連結される。また別には、挿入物およびベクターの両方の平滑末端を連結してもよい。種々のクローニング技術が以下の文献に記載されている：Ａｕｓｕｂｅｌｅｔａｌ． ”ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，” ＪｏｈｎＷｉｌｅｙ５０３Ｓｏｎｓ，Ｉｎｃ．１９９７；およびＳａｍｂｒｏｏｋｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ２^ｎｄＥｄ．，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，１９８９（前記文献は引用により本明細書に含まれる）。前記の方法および他の方法は当業者に公知である。
【０１３６】
前記ベクターは、例えばプラスミド、ウイルス粒子、またはファージの形態であってもよい。他のベクターには、染色体、非染色体および合成ＤＮＡ配列、ＳＶ４０の誘導体；細菌プラスミド、ファージＤＮＡ、バキュロウイルス、酵母プラスミド、プラスミドおよびファージＤＮＡの組合せに由来するベクター、ウイルスＤＮＡ、例えばワクシニア、アデノウイルス、鶏痘ウイルス、および仮性狂犬病ウイルスが含まれる。原核細胞および真核細胞宿主とともに用いることができる種々のクローニングおよび発現ベクターが、文献（Ｓａｍｂｒｏｏｋｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ２^ｎｄＥｄ．，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．１９８９（前記文献は引用により本明細書に含まれる））に記載されている。
【０１３７】
使用することができる具体的な細菌ベクターには、以下の周知のクローニングベクターの遺伝的エレメントを含む市販のプラスミドが含まれる：ｐＢＲ３２２（ＡＴＣＣ３７０１７）、ｐＫＫ２２３−３（ＰｈａｒｍａｃｉａＦｉｎｅＣｈｅｍｉｃａｌｓ，Ｕｐｐｓａｌａ，Ｓｗｅｄｅｎ）、ＧＥＭ１（ＰｒｏｍｅｇａＢｉｏｔｅｃ，Ｍａｄｉｓｏｎ，ＷＩ，ＵＳＡ）、ｐＱＥ７０、ｐＱＥ６０、ｐＱＥ−９（Ｑｉａｇｅｎ）、ｐＤ１０、ｐｓｉＸ１７４、ｐＢｌｕｅｓｃｒｉｐｔＩＩＫＳ、ｐＮＨ８Ａ、ｐＮＨ１６ａ、ｐＮＨ１８Ａ、ｐＮＨ４６Ａ（Ｓｔｒａｔａｇｅｎｅ）、ｐｔｒｃ９９ａ、ｐＫＫ２２３−３、ｐＫＫ２３３−３、ｐＤＲ５４０、ｐＲＩＴ５（Ｐｈａｒｍａｃｉａ）、ｐＫＫ２３２−８およびｐＣＭ７。具体的な真核細胞用ベクターには、ｐＳＶ２ＣＡＴ、ｐＯＧ４４、ｐＸＴ１、ｐＳＧ（Ｓｔｒａｔａｇｅｎｅ）、ｐＳＶＫ３、ｐＢＰＶ、ｐＭＳＧおよびｐＳＬＶ（Ｐｈａｒｍａｃｉａ）が含まれる。しかしながら、他のいずれのベクターも、宿主細胞で複製し生存するかぎり用いることができる。
【０１３８】
宿主細胞は当業者に公知のいずれの宿主細胞でもよい。前記細胞には、原核細胞、真核細胞、哺乳類細胞、昆虫細胞、または植物細胞が含まれる。適切な宿主の代表的な例として以下を挙げることができる：細菌細胞、例えば大腸菌、ストレプトミセス、枯草菌（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）、ネズミチフス菌（Ｓａｌｍｏｎｅｌｌａｔｙｐｈｉｍｕｒｉｕｍ）並びにシュードモナス属、ストレプトミセス属およびスタフィロコッカス属の様々な種；真菌細胞、例えば酵母；昆虫細胞、例えばキイロショウジョウバエＳ２およびスポドプテラ（Ｓｐｏｄｏｐｔｅｒａ）Ｓｆ９；動物細胞、例えばＣＨＯ、ＣＯＳまたはボウズ（Ｂｏｗｅｓ）メラノーマ；およびアデノウイルス。適切な宿主の選択は当業者には公知である。
【０１３９】
ベクターは、多様な技術のいずれか（形質転換、トランスフェクション、形質導入、ウイルス感染、遺伝子銃、またはＴｉ仲介遺伝子移転を含む）を用いて宿主細胞に導入できる。具体的な方法には、リン酸カルシウムトランスフェクション、ＤＥＡＥ−デキストラン仲介トランスフェクション、リポフェクチンまたは電気穿孔（Ｌ．Ｄａｖｉｓ，Ｍ．Ｄｉｂｎｅｒ，Ｉ．Ｂａｔｔｅｙ，ＢａｓｉｃＭｅｔｈｏｄｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，１９８６）が含まれる。
適切な場合には、前記のベクター導入宿主細胞を、プロモーターの活性化、形質転換体の選別または本発明の遺伝子の増幅に適切なように改変した通常の栄養培養液で培養することができる。適切な宿主株を選択し、さらに前記宿主株を適切な細胞密度まで増殖させた後で、前記の選択したプロモーターを適切な手段（例えば温度シフトまたは化学的誘発）で誘発することができる。さらに前記細胞をさらに新たな期間培養して所望のポリペプチドまたはそのフラグメントを産生させることができる。
【０１４０】
細胞は、典型的には遠心分離によって集め、物理的または化学的手段で破壊し、得られた粗抽出物を更なる精製のために維持する。タンパク質の発現に用いた微生物細胞は通常の任意の手段によって破壊することができる。前記手段には、反復凍結融解、超音波処理、機械的破壊、または細胞溶解剤の使用が含まれる。前記の方法は当業者には周知である。発現されたポリペプチドまたはそのフラグメントを回収し、リコンビナント細胞培養から以下を含む方法によって精製することができる：硫安もしくはエタノール沈澱、酸抽出、陰イオンもしくは陽イオン交換クロマトグラフィー、ホスホセルロースクロマトグラフィー、疎水性相互作用クロマトグラフィー、アフィニティークロマトグラフィー、ヒドロキシルアパタイトクロマトグラフィー、およびレクチンクロマトグラフィー。必要な場合には、ポリペプチドの立体配置を完成させるため、タンパク質再折り畳み工程を用いることができる。所望する場合には、高速液体クロマトグラフィー（ＨＰＬＣ）を最終精製工程で用いることができる。
【０１４１】
さらにまた種々の哺乳類細胞培養系を用いて、組換えタンパク質を発現させることができる。哺乳類発現系の例には、サル腎線維芽細胞のＣＯＳ−７株（Ｇｌｕｚｍａｎ，Ｃｅｌｌ，２３：１７５，１９８１に記載されている）、および適合ベクターからタンパク質を発現させることができる他の細胞株、例えばＣ１２７、３Ｔ３、ＣＨＯ、ＨｅＬａおよびＢＨＫ細胞株が含まれる。
宿主細胞中の構築物を通常の態様で用いて、組換え配列によってコードされた遺伝子生成物を産生させることができる。組換え体生成方法で用いる宿主にしたがって、前記ベクターを含む宿主細胞によって産生されるポリペプチドは糖化されたりされなかったりするであろう。本発明のポリペプチドはまた先頭のメチオニン残基を含んだり含まなかったりするであろう。
【０１４２】
また別には、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続アミノ酸を含むフラグメントは、通常のペプチド合成装置によって合成してもよい。他の実施態様では、ポリペプチドのフラグメントまたは部分をペプチド合成によって対応する完全長のポリペプチドを製造するために用いることができる。したがって、前記フラグメントは、完全長のポリペプチドの製造用中間体として用いることができる。
【０１４３】
配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続アミノ酸を含むフラグメントの１つを、前記ポリペプチドまたはそのフラグメントをコードする核酸に作働的に連結されたプロモーターを含むＤＮＡ構築物から転写されたｍＲＮＡを用いて製造するために無細胞翻訳系もまた利用することができる。いくつかの実施態様では、前記ＤＮＡ構築物はｉｎｖｉｔｒｏ転写反応を実施する前に直線化することができる。続いて転写ｍＲＮＡを適切な無細胞翻訳抽出物（例えばウサギの網状赤血球抽出物）とともにインキュベートし、所望のポリペプチドまたはそのフラグメントを生成することができる。
【０１４４】
本発明はまた、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続アミノ酸を含むフラグメントの変種に関する。“変種”という用語は前記ポリペプチドの誘導体または類似体を含む。特に、前記変種は、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列のポリペプチドと、１つまたは２つ以上の置換、付加、欠失、融合および末端短縮（これらはいずれの組合せにも存在することができる）によってアミノ酸配列が相違する。
【０１４５】
前記変種は天然に存在するものでもｉｎｖｉｔｒｏで創出されたものでもよい。特に前記変種は、遺伝子操作技術（例えば部位特異的突然変異導入、化学的ランダム突然変異導入、エキソヌクレアーゼＩＩＩ欠失方法、および標準的クローニング技術）を用いて創出することができる。また別には、前記変種、フラグメント、類似体または誘導体は、化学的合成または改変方法を用いて創出してもよい。
変種を作製する他の方法もまた当業者には知られている。前記方法には、天然の単離物から得られた核酸配列を改変して、それらの工業的または研究的利用価値を高める特性を有するポリペプチドをコードする核酸を生成する方法が含まれる。前記の方法では、天然の単離物から得られた配列に対して１つまたは２つ以上のヌクレオチドの相違を有する多数の変種配列が生成され性状を調べられる。典型的には、これらのヌクレオチドの相違は、天然の単離物の核酸によってコードされるポリペプチドに対してアミノ酸変化をもたらす。
【０１４６】
例えば、変種は変異性ＰＣＲ（ｅｒｒｏｒｐｒｏｎｅＰＣＲ）を用いて創出することができる。変異性ＰＣＲでは、ＰＣＲは、高率の点変異がＰＣＲ生成物の全長にわたって得られるように、ＤＮＡポリメラーゼの複製信頼度が低い状態で実施される。変異性ＰＣＲは以下の文献に記載されている：Ｄ．Ｗ．Ｌｅｕｎｇｅｔａｌ．，Ｔｅｃｈｎｉｑｕｅ，１：１１−１５，１９８９；Ｒ．Ｃ．Ｃａｌｄｗｅｌｌ＆Ｇ．Ｆ．Ｊｏｙｃｅ，ＰＣＲＭｅｔｈｏｄｓＡｐｐｌｉｃ．，２：２８−３３，１９９２（前記文献は引用により本明細書に含まれる）。簡単に記せば、そのような方法では、ＰＣＲ生成物の全長にわたって高率の点変異を達成するために、突然変異を誘発されるべき核酸を、ＰＣＲプライマー、反応緩衝液、ＭｇＣｌ_２、ＭｎＣｌ_２、Ｔａｑポリメラーゼおよび適切な濃度のｄＮＴＰと混合する。例えば、突然変異を誘発されるべき核酸を２０ｆｍｏｌ、各ＰＣＲプライマーを３０ｐｍｏｌ、５０ｍＭのＫＣｌ、１０ｍＭのトリス塩酸（ｐＨ８．３）および０．０１％のゼラチン、７ｍＭのＭｇＣｌ_２，０．５ｍＭのＭｎＣｌ_２、５単位のＴａｑポリメラーゼ、０．２ｍＭのｄＧＴＰ、０．２ｍＭのｄＡＴＰ、１ｍＭのｄＣＴＰおよび１ｍＭのｄＴＴＰを含む反応緩衝液を用いて反応を実施できる。ＰＣＲは、９４℃１分、４５℃１分および７２℃１分の３０サイクルで実施できる。しかしながら、前記のパラメーターは適宜変動可能であることは理解されよう。突然変異が誘発された核酸を適切なベクターでクローニングし、前記変異核酸によってコードされたポリペプチドの活性を調べる。
【０１４７】
変種はまた、注目する任意のクローン化ＤＮＡで位置特異的変異を生成するためにオリゴヌクレオチド誘導突然変異導入を用いて創出してもよい。オリゴヌクレオチド突然変異導入は以下の文献に記載されている：Ｊ．Ｆ．Ｒｅｉｄｈａａｒ−Ｏｌｓｏｎ＆Ｒ．Ｔ．Ｓａｕｅｒｅｔａｌ．，Ｓｃｉｅｎｃｅ，２４１：５３−５７，１９８８（前記文献は引用により本明細書に含まれる）。簡単に記せば、そのような方法では、クローン化ＤＮＡに導入されるべき１つまたは２つ以上の変異を含む複数の二本鎖オリゴヌクレオチドが合成され、前記突然変異を誘発されるべきクローン化ＤＮＡに導入される。突然変異を誘発されたＤＮＡを含むクローンを回収し、それらがコードするポリペプチドの活性を評価する。
【０１４８】
変種を創出するまた別の方法は、アッセンブリーＰＣＲである。アッセンブリーＰＣＲは、小さなＤＮＡフラグメントの混合物からＰＣＲ生成物を組み立てることを必要とする。同一のバイアル中で多数の異なるＰＣＲ反応が実施され、１つの反応の生成物が別の反応の生成物のプライマーの役割を果たす。アッセンブリーＰＣＲは米国特許第５，９６５，４０８号（１９９６年６月９日出願、発明の名称“ＭｅｔｈｏｄｏｆＤＮＡＲｅａｓｓｅｍｂｌｙｂｙＩｎｔｅｒｒｕｐｔｉｎｇＳｙｎｔｈｅｓｉｓ”）（前記文献は引用により本明細書に含まれる）に記載されている。
【０１４９】
変種を創出するまた別の方法は有性ＰＣＲ突然変異導入（ｓｅｘｕａｌＰＣＲｍｕｔａｇｅｎｅｓｉｓ）である。有性ＰＣＲ突然変異導入では、強制的相同性組換えが、相違を有するが高度に関連性を有するＤＮＡ配列をもつＤＮＡ分子間でｉｎｖｉｔｒｏで生じる。前記組換えは、配列相同性を基準にしたＤＮＡ分子のランダムフラグメント化と、それに続く、ＰＣＲ反応におけるプライマー伸長による交差の固定の結果として得られる。有性ＰＣＲ突然変異導入は以下の文献に記載されている：Ｗ．Ｐ．Ｓｔｅｍｍｅｒ，ＰＮＡＳ，ＵＳＡ，９１：１０７４７−１０７５１，１９９４（前記文献は引用により本明細書に含まれる）。簡単に記せば、このような方法では、組換えられるべき複数の核酸をデオキシリボヌクレアーゼで消化して、平均サイズが５０−２００ヌクレオチドのフラグメントを生成する。所望の平均サイズのフラグメントを精製し、ＰＣＲ混合物に再懸濁させる。前記核酸フラグメント間の組換えを促進する条件下でＰＣＲを実施する。例えば、ＰＣＲは、前記精製フラグメントを１０−３０ｎｇ／μＬの濃度で以下の組成の溶液に再懸濁させて実施できる：０．２ｍＭの各ｄＮＴＰ、２．２ｍＭのＭｇＣｌ_２、５０ｍＭのＫＣｌ、１０ｍＭのトリス塩酸（ｐＨ９．０）および０．１％トリトンＸ−１００。反応混合物１００μＬにつき２．５単位のＴａｑポリメラーゼを添加し、ＰＣＲを以下のように実施する：９４℃６０秒、９４℃３０秒、５０−５５℃３０秒、７２℃３０秒（３０−４５回）および７２℃５分。しかしながら、前記のパラメーターは適宜変動可能であることは理解されよう。いくつかの実施態様では、オリゴヌクレオチドをＰＣＲ反応に含ませることができる。他の実施態様では、ＤＮＡポリメラーゼＩのクレノーフラグメントを第一回目のＰＣＲ反応に用い、Ｔａｑポリメラーゼをその後のＰＣＲ反応サイクルで用いることができる。リコンビナント配列を単離し、それらがコードするポリペプチドの活性を評価する。
【０１５０】
変種はまたｉｎｖｉｖｏ突然変異導入によって創出できる。いくつかの実施態様では、問題の配列を細菌株、例えば大腸菌株（前記の細菌株はＤＮＡ修復経路の１つまたは２つ以上に変異を有する）で増殖させることによって前記配列にランダム変異を創出する。前記の“変異導入体”株は野生型の親株よりも高いランダム変異率を有する。前記ＤＮＡをこれらの株の１つで増殖させることによって、最終的に前記ＤＮＡ内にランダム変異が生成されるであろう。Ｉｎｖｉｖｏ突然変異導入で使用するために適した変異導入体株は、ＰＣＴ公開番号ＷＯ９１／１６４２７号（１９９１年１０月３１日公開、発明の名称：”ＭｅｔｈｏｄｓｆｏｒＰｈｅｎｏｔｙｐｅＣｒｅａｔｉｏｎｆｒｏｍＭｕｌｔｉｐｌｅＧｅｎｅＰｏｐｕｌａｔｉｏｎｓ”）に記載されている（前記文献は引用により本明細書に含まれる）。
【０１５１】
変種はまたカセット突然変異導入を用いて創出できる。カセット突然変異導入では、二本鎖ＤＮＡ分子の小さな領域が、天然の配列とは異なる合成オリゴヌクレオチド“カセット”で置換される。前記オリゴヌクレオチドはしばしば、完全および／または部分的に任意抽出された天然の配列を含む。
循環アンサンブル突然変異導入もまた変種の創出に用いることができる。循環アンサンブル突然変異導入は、表現型が関連する多様な集団でその構成メンバーのアミノ酸配列が異なっているものを作製するために開発されたタンパク質工学（タンパク質突然変異導入）用アルゴリズムである。前記方法は、フィードバックメカニズムを用いて組合せカセットの連続する突然変異導入ラウンドを制御する。循環アンサンブル突然変異導入は以下の文献に記載されている：Ａ．Ｐ．Ａｒｋｉｎ＆Ｄ．Ｃ．Ｙｏｕｖａｎ，ＰＮＡＳ，ＵＳＡ，８９：７８１１−７８１５，１９９２（前記文献は引用により本明細書に含まれる）。
【０１５２】
いくつかの実施態様では、変種は指数的アンサンブル突然変異導入を用いて創出される。指数的アンサンブル突然変異導入は、固有で機能的な変異体を高いパーセントで含む組合せライブラリーを作製するプロセスである。前記プロセスでは、短い残基群が並列的に任意抽出され、機能的タンパク質を生じるアミノ酸を各々異なる位置で同定する。指数的アンサンブル突然変異導入は以下の文献に記載されている：Ｓ．Ｄｅｌｅｇｒａｖｅ＆Ｄ．Ｃ．Ｙｏｕｖａｎ，ＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｓｅａｒｃｈ，１１：１５４８−１５５２，１９９３（前記文献は引用により本明細書に含まれる）。ランダム突然変異導入および部位特異的突然変異導入は以下の文献に記載されている：Ｆ．Ｈ．Ａｒｎｏｌｄ，ＣｕｒｒｅｎｔＯｐｉｎｉｏｎｉｎＢｉｏｔｅｃｈｎｏｌｏｇｙ，４：４５０−４５５，１９９３（前記文献は引用により本明細書に含まれる）。
【０１５３】
いくつかの実施態様では、変種はシャッフリングを用いて創出される。シャッフリングでは、別個のポリペプチドをコードする複数の核酸の部分が一緒に融合され、キメラポリペプチドをコードするキメラ核酸配列が創出される。前記は以下の文献に記載されている：米国特許第５，９６５，４０８号（１９９６年７月９日出願、発明の名称：”ＭｅｔｈｏｄｏｆＤＮＡＲｅａｓｓｅｍｂｌｙｂｙＩｎｔｅｒｒｕｐｔｉｎｇＳｙｎｔｈｅｓｉｓ”；および米国特許第５，９３９，２５０号（１９９６年５月２２日出願、発明の名称”ＰｒｏｄｕｃｔｉｏｎｏｆＥｎｚｙｍｅｓＨａｖｉｎｇＤｅｓｉｒｅｄＡｃｔｉｖｉｔｉｅｓｂｙＭｕｔａｇｅｎｅｓｉｓ”）（前記文献は引用により本明細書に含まれる）。
【０１５４】
配列番号：２、４、６、８、１０、１２、１４、１６のポリペプチドの変種は、配列番号：２、４、６、８、１０、１２、１４、１６のポリペプチドのアミノ酸残基の１つまたは２つ以上が、保存的または非保存的アミノ酸残基（好ましくは保存的アミノ酸残基）で置換された変種であろう。さらに前記置換されたアミノ酸残基は遺伝暗号によってコードされたものでもよいが、そうでないものでもよい。
保存的置換は、ポリペプチド内のあるアミノ酸を同様な特性をもつ別のアミノ酸で置換するものである。保存的置換として典型的に認められるものは以下の置換である：脂肪族アミノ酸（例えばＡｌａ、Ｖａｌ、ＬｅｕおよびＩｌｅ）の別の脂肪族アミノ酸による置換：ＳｅｒのＴｈｒによる置換；酸性残基（例えばＡｓｐおよびＧｌｕ）の別の酸性残基による置換；アミド基をもつ残基（たとえばＡｓｎおよびＧｌｎ）のアミド基をもつ別の残基による置換；塩基性残基（たとえばＬｙｓおよびＡｒｇ）の別の塩基性残基による交換および芳香族残基（例えばＰｈｅ、Ｔｙｒ）の別の芳香族残基による置換。
【０１５５】
他の変種は、配列番号：２、４、６、８、１０、１２、１４、１６に記載のポリペプチドのアミノ酸残基の１つまたは２つ以上が置換基を含むものである。
さらに他の変種は、ポリペプチドが別の化合物、例えば前記ポリペプチドの半減期を延長する化合物（例えばポリエチレングリコール）と結合されているものである。
さらに別の変種は、さらに別のアミノ酸がポリペプチドに融合されているものである。前記別のアミノ酸は、例えばリーダー配列、分泌配列、プロタンパク質配列、または前記ポリペプチドの精製、濃縮もしくは安定化を促進する配列である。
いくつかの実施態様では、前記フラグメント、誘導体および類似体は、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチドと同じ生物学的機能または活性を保持する。他の実施態様では、前記フラグメント、誘導体または類似体は、プロタンパク質の切断によって活性化され、活性ポリペプチドを生じるプロタンパク質を含む。
【０１５６】
本発明の別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列、または前記の少なくとも５、１０、１５、２０、２５、３０、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントの１つと少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、または約９５％を越える相同性を有するポリペプチドまたはそのフラグメントである。相同性は、比較されるポリペプチドまたはフラグメントでアラインメントを実施し、それらの間のアミノ酸同一性または類似性の程度を決定する、上記で説明した任意のプログラムを用いて決定することができる。アミノ酸の“相同性”は、上記で述べたような保存的アミノ酸置換も含むことは理解されよう。
【０１５７】
配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続アミノ酸を含むフラグメントの１つと相同性を有するポリペプチドまたはフラグメントは、上記の技術を用いて前記をコードする核酸を単離することによって得ることができる。
あるいは、相同なポリペプチドまたはフラグメントは生化学的な濃縮または精製方法により得ることができる。潜在的に相同なポリペプチドまたはフラグメントの配列は、タンパク質分解消化、ゲル電気泳動および／またはミクロ配列決定によって決定できる。相同性が予想されるポリペプチドまたはフラグメントの配列は、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくともあるいはの連続アミノ酸を含むフラグメントの１つと、上記に記載したプログラムのいずれかを用いて比較することができる。
【０１５８】
本発明のまた別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列のフラグメントまたは変種であって、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチドの酵素機能を保持するものを同定するためのアッセイである。例えば、前記ポリペプチドのフラグメントまたは変種は生化学的反応を触媒するために用いることができる（前記生化学的反応は、前記フラグメントまたは変種が配列番号：２、４、６、８、１０、１２、１４、１６のポリペプチドの酵素活性を保持することを提示する）。
【０１５９】
フラグメントまたは変種が、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチドの酵素活性を保持するか否かを決定するためのアッセイは以下の工程を含む：ポリペプチドフラグメントまたは変種を基質分子と、ポリペプチドフラグメントまたは変種が機能することができる条件下で接触させ、さらに基質レベルの低下、または前記ポリペプチドと基質との間の反応の特異的反応生成物レベルの増加を検出する。
【０１６０】
配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントを多様な用途に用いることができる。例えば、前記ポリペプチドまたはそのフラグメントを用いて、生化学的配列を触媒することができる。本発明の特徴の１つにしたがえば、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記ポリペプチドをコードするポリヌクレオチドをグリコシド結合の加水分解に用いる方法が提供される。前記方法では、グリコシド結合を含む物質（例えば澱粉）を、配列番号：２、４、６、８、１０、１２、１４、１６または前記と実質的に同一の配列を有するポリペプチドと、前記グリコシド結合の加水分解を促進する条件下で接触させる。
【０１６１】
配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントをまた用いて、前記ポリペプチドまたはフラグメントと特異的に結合する抗体を生成することができる。得られた抗体は、前記ポリペプチドの単離もしくは精製に、または生物学的サンプルにおける前記ポリペプチドの有無の決定にイムノアフィニティークロマトグラフィー手法で用いることができる。前記の手法では、タンパク質調製物（例えば抽出物）または生物学的サンプルを、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントの１つと特異的に結合することができる抗体と接触させる。
【０１６２】
イムノアフィニティー法では、抗体を固相支持体（例えばビーズまたは他のカラムマトリックス）に結合させる。前記抗体が配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、またはそのフラグメントと特異的に結合する条件下で、前記タンパク調製物を前記抗体と接触させる。非特異的に結合したタンパク質を除去するために洗浄した後、特異的に結合した前記ポリペプチドを溶出させる。
生物学的サンプル中のタンパク質の前記抗体と結合する能力は、当業者に知られている種々の方法のいずれかを用いて決定できる。例えば結合は、抗体を検出可能な標識（例えば蛍光薬剤、酵素標識または放射性同位元素）で標識することによって決定できる。また別には、抗体のサンプルへの結合は、前記のような検出可能な標識をその上に有する二次抗体を用いて検出することができる。具体的なアッセイには、ＥＬＩＳＡアッセイ、サンドイッチアッセイ、放射性イムノアッセイおよびウェスタンブロットが含まれる。
【０１６３】
配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントに対して作製されたポリクローナル抗体は、前記ポリペプチドを動物に直接注射するか、または動物（例えばヒト以外の動物）に前記ポリペプチドを投与することによって得ることができる。前記のようにして得られた抗体はポリペプチドそのものに結合するであろう。前記の態様では、前記ポリペプチドのフラグメントのみをコードする配列でさえ、完全な天然のポリペプチドと結合することができる抗体の生成に用いることができる。そのような抗体は、前記のポリペプチドを発現している細胞からポリペプチドを単離するために用いることができる。
【０１６４】
モノクローナル抗体を調製する場合は、継続的な細胞株培養によって産生される抗体を提供するいずれの技術も用いることができる。その例には、ハイブリドーマ技術（ＫｏｈｌｅｒａｎｄＭｉｌｓｔｅｉｎ，Ｎａｔｕｒｅ，２５６：４９５−４９７，１９７５：前記文献は引用により本明細書に含まれる）、トリオーマ技術、ヒトＢ細胞ハイブリドーマ技術（Ｋｏｚｂｏｒｅｔａｌ．ＩｍｍｕｎｏｌｏｇｙＴｏｄａｙ，４：７２，１９８３：前記文献は引用により本明細書に含まれる）、およびＥＢＶ−ハイブリドーマ技術（Ｃｏｌｅｅｔａｌ．， ”ＭｏｎｏｃｌｏｎａｌＡｎｔｉｂｏｄｉｅｓａｎｄＣａｎｃｅｒＴｈｅｒａｐｙ”，ＡｌａｎＲ．Ｌｉｓｓ，Ｉｎｃ．，ｐｐ．７７−９６（１９８５）：前記文献は引用により本明細書に含まれる）が含まれる。
【０１６５】
単鎖抗体製造のために報告された技術（米国特許第４，９４６，７７８号：前記文献は引用により本明細書に含まれる）を応用して、配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントに対する単鎖抗体を製造することができる。また別には、遺伝子導入マウスを用いて、前記ポリペプチドまたはそのフラグメントに対するヒト化抗体を発現させることができる。
【０１６６】
配列番号：２、４、６、８、１０、１２、１４、１６および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも５、１０、１５、２０、２５、３０、４０、５０、７５、１００または１５０の連続したアミノ酸を含むフラグメントに対して作製した抗体を、他の生物およびサンプルに由来する同様なポリペプチドのスクリーニングで用いることができる。前記の技術では、前記生物に由来するポリペプチドを前記抗体と接触させ、さらに前記抗体と特異的に結合するポリペプチドを検出する。上記で述べた方法のいずれも、抗体の結合検出に用いることができる。前記スクリーニングアッセイの１つが以下の文献に記載されている：”ＭｅｔｈｏｄｓｆｏｒＭｅａｓｕｒｉｎｇＣｅｌｌｕｌａｓｅＡｃｔｉｖｉｔｉｅｓ”，ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ，Ｖｏｌ．１６０，ｐｐ．８７−１１６（前記文献は引用により本明細書に含まれる）。
【０１６７】
本明細書において、“配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列”という用語は、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列を有するヌクレオチド配列とともに、配列番号：１、３、５、７、９、１１、１３、１５と相同な配列およびそのフラグメント、並びに前記配列の全てと相補的である配列を包含する。前記フラグメントには、配列番号：１、３、５、７、９、１１、１３、１５の部分が含まれ、前記部分は、配列番号：１、３、５、７、９、１１、１３、１５の少なくとも１０、１５、２０、２５、３０、３５、４０、５０、７５、１００、１５０、２００、３００、４００または５００の連続したヌクレオチド、および実質的に前記と同一の配列を含む。配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一な配列と相同な配列およびフラグメントとは、前記配列に対して少なくとも約９９％、９８％、９７％、９６％、９５％、９０％、８５％、８０％、７５％、７０％、６５％、６０％、５５％、または５０％の相同性を有する配列を指す。相同性は、本明細書に記載した任意のコンピュータプログラムおよびパラメーター（デフォルトパラメーターを用いるＦＡＳＴＡバージョン３．０ｔ７８を含む）を用いて決定することができる。相同な配列はまたＲＮＡ配列を含み、この場合、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列でチミジンはウリジンに置き換えられる。相同な配列は、本明細書に記載した方法のいずれかを用いて得られるか、または配列決定エラーの修正から得ることができる。配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列は、伝統的な一文字形式（”Ｂｉｏｃｈｅｍｉｓｔｒｙ”（Ｓｔｒｙｅｒ，Ｌｕｂｅｒｔ，３^ｒｄｅｄ．，Ｗ，Ｈ．Ｆｒｅｅｍａｎ＆Ｃｏ．，Ｎｅｗｙｏｒｋ）の裏表紙の内側を参照されたい）または一続きのヌクレオチドそのものを表示する他の任意の様式で表すことができる。
【０１６８】
本明細書において、“配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列”という用語は、配列番号：２、４、６、８、１０、１２、１４、１６およびこれらと実質的に同一の配列を有するポリペプチド配列（前記は配列番号：１、３、５、７、９、１１、１３、１５に示す配列によってコードされる）、配列番号：２、４、６、８、１０、１２、１４、１６およびこれらと実質的に同一の配列を有するポリペプチドと相同なポリペプチド配列、または前記配列のいずれかのフラグメントを包含する。相同なポリペプチド配列とは、配列番号：２、４、６、８、１０、１２、１４、１６ポリペプチド配列の１つと少なくとも約９９％、９８％、９７％、９６％、９５％、９０％、８５％、８０％、７５％、７０％、６５％、６０％、５５％、または５０％の相同性を有するポリペプチド配列を指す。相同性は、本明細書に記載した任意のコンピュータプログラムおよびパラメーター（デフォルトパラメーターまたは任意の改変パラメーターを用いるＦＡＳＴＡバージョン３．０ｔ７８を含む）を用いて決定することができる。相同な配列は、本明細書に記載した方法のいずれかを用いるか、または配列決定エラーの修正から得ることができる。前記ポリペプチドフラグメントは、配列番号：２、４、６、８、１０、１２、１４、１６および前記配列と実質的に同一の配列を有するポリペプチドの少なくとも５、１０、１５、２０、２５、３０、３５、４０、５０、７５、１００または１５０の連続したアミノ酸を含む。配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチドコードおよび前記配列と実質的に同一の配列は、伝統的な一文字表記または３文字表記（”Ｂｉｏｃｈｅｍｉｓｔｒｙ”（Ｓｔｒｙｅｒ，Ｌｕｂｅｒｔ，３^ｒｄｅｄ．，Ｗ，Ｈ．Ｆｒｅｅｍａｎ＆Ｃｏ．，Ｎｅｗｙｏｒｋ）の裏表紙の内側を参照されたい）または一続きのポリペプチドそのものを表示する他の任意の様式で表すことができる。
【０１６９】
配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列は、コンピュータによって読取り可能であって、さらにアクセスできる任意の媒体に保存、記録および処理することができることは当業者には理解されよう。本明細書で用いられるように、“記録”および“保存”という語は、コンピュータ媒体に情報を保存するプロセスを指す。当業者には、コンピュータ読取り可能な媒体に情報を記録するためにこれまでに知られている任意の方法を容易に利用して、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列の１つまたは２つ以上、並びに配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列の１つまたは２つ以上を含む製品を作製することができる。本発明の別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列の少なくとも２、５、１０、１５または２０個の核酸配列を保存した、コンピュータ読取り可能媒体である。
【０１７０】
本発明の別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列の１つまたは２つ以上を保存したコンピュータ読取り可能媒体である。本発明のまた別の特徴は、配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列の１つまたは２つ以上を保存したコンピュータ読取り可能媒体である。本発明のまた別の特徴は、上記に示す配列の少なくとも２、５、１０、１５または２０個を保存したコンピュータ読取り可能媒体である。
コンピュータ読取り可能媒体には、磁気により読み出すことができる媒体、光学的に読み出すことができる媒体、電子的に読み出すことができる媒体および磁気／光媒体が含まれる。例えば、前記コンピュータ読取り可能媒体はハードディスク、フレキシブルディスク、磁気テープ、ＣＤ−ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）、ランダムアクセスメモリー（ＲＡＭ）、または読み出し専用メモリー（ＲＯＭ）とともに当業者に公知の他の媒体の他のタイプであろう。
【０１７１】
本発明の実施態様には、システム（例えばインターネットをベースにするシステム）、特に本明細書で述べた配列情報を保存し処理するコンピュータシステムが含まれる。コンピュータシステム１００の一例は、図２の組立て分解図で示されている。本明細書で用いられるように、“コンピュータシステム”とは、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列を分析するために用いられるハードウェア成分、ソフトウェア成分およびデータ保存成分を指す。コンピュータシステム１００は典型的には配列データの加工、アクセスおよび処理のためのプロセッサを含む。前記プロセッサ１０５は任意の中央演算ユニットで、例えばインテル社のペンティアム（登録商標）ＩＩＩまたはサン、モトローラ、コンパック、ＡＭＤもしくはＩＢＭ（ｉｎｔｅｒｎａｔｉｏｎａｌＢｕｓｉｎｅｓｓＭａｃｈｉｎｅｓ）の同様なプロセッサであろう。
【０１７２】
典型的には前記コンピュータシステム１００は、プロセッサ１０５およびデータ保存用の１つまたは２つ以上の内部データ保存構成部１１０、およびデータ保存構成部に保存されたデータを検索する１つまたは２つ以上のデータ検索装置を含む汎用システムである。当業者には、現在利用可能なコンピュータシステムのいずれも適切であることは理解されよう。
ある特定の実施態様では、前記コンピュータシステム１００は、メインメモリー１１５（好ましくはＲＡＭとして提供される）に連結されたバスに連結されたプロセッサ１０５および１つまたは２つ以上の内部データ保存装置１１０、例えばハードドライブおよび／またはそれにデータを記録させる他のコンピュータ読出し可能媒体を含む。いくつかの実施態様では、前記コンピュータシステム１００はさらに、内部データ保存装置１１０に保存されたデータを読み出すための１つまたは２つ以上のデータ検索装置１１８を含む。
【０１７３】
前記データ検索装置１１８は、フレキシブルディスクドライブ、コンパクトディスクドライブ、磁気テープドライブ、または遠隔地のデータ保存システムと接続できる（例えばインターネットにより）モデムなどであろう。いくつかの実施態様では、前記内部データ保存装置１１０は、取り外し可能なコンピュータ読取り能媒体、例えばフレキシブルディスク、コンパクトディスク、磁気テープなどで、コントロールロジックおよび／またはそれに記録されたデータを含む。前記コンピュータシステム１００は有利には、データ検索装置にいったん挿入されたデータ保存装置のコントロールロジックおよび／またはデータを読み出すための適切なソフトを含むか、またはそれによってプログラムされるであろう。
【０１７４】
前記コンピュータシステム１００は、コンピュータ使用者に出力を表示するために用いられるディスプレー１２０を含む。前記コンピュータシステム１００は、ネットワークまたは広域ネットワークで他のコンピュータシステム１２５ａ−ｃと連結され、コンピュータシステム１００への中央管理アクセスを提供する。
配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列にアクセスするため、またはこれを加工するためにソフト（例えば検索ツール、比較ツール、および模型製作ツールなど）が、実行中にメーンメモリー１１５に存在する。
【０１７５】
いくつかの実施態様では、前記コンピュータシステム１００は、コンピュータの読出し可能媒体に保存された、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列の核酸配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列を、コンピュータ読出し可能媒体に保存されたリファレンスヌクレオチドまたはポリペプチド配列と比較するために配列比較アルゴリズムをさらに含む。“配列比較アルゴリズム”とは、あるヌクレオチドをデータ保存手段内に保存された他のヌクレオチドおよび／または化合物と比較するために前記コンピュータシステム１００に（局所的にまたは遠隔的に）実装される１つまたは２つ以上のプログラムを指す。例えば、前記配列比較アルゴリズムは、コンピュータ読出し可能媒体に保存された、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列を、コンピュータ読出し可能媒体に保存されたリファレンス配列と比較し、相同性または構造モチーフを同定することができる。
【０１７６】
本特許出願明細書のいずれかの場所で明らかにした種々の配列比較プログラムが、特に本発明の前記特徴で使用するために意図される。タンパク質および／または核酸配列相同性は、種々の配列比較アルゴリズムおよび当業者に公知のプログラムのいずれかを用いて評価できる。前記のアルゴリズムおよびプログラムには以下が含まれるが、ただしこれらに限定されない：ＴＢＬＡＳＴＮ、ＢＬＡＳＴＰ、ＦＡＳＴＡ、ＴＦＡＳＴＡおよびＣＬＵＳＴＡＬＷ（Ｐｅａｒｓｏｎ＆Ｌｉｐｍａｎ，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８５（８）：２４４４−２４４８，１９８８；Ａｌｔｓｃｈｕｌｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５（３）：４０３−４１０，１９９０；Ｔｈｏｍｐｏｎｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２２（２）：４６７３−４６８０，１９９４；Ｈｉｇｇｉｎｓｅｔａｌ．，ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ．２６６：３８３−４０２，１９９６；Ａｌｔｓｃｈｕｌｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５（３）：４０３−４１０，１９９０；Ａｌｔｓｃｈｕｌｅｔａｌ．，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ３：２６６−２７２，１９９３）。
【０１７７】
相同性および同一性は、しばしば配列分析ソフト（例えばウィスコンシン大学生物工学センター（１７１０ＵｎｉｖｅｒｓｉｔｙＡｖｅｎｕｅ，Ｍａｄｉｓｏｎ，ＷＩ５３７０５）、遺伝学コンピュータ群の配列分析ソフトウェアパッケージ）を用いて測定される。前記ソフトは、種々の欠失、置換および他の改変に対して相同性の程度を定めることによって類似する配列をマッチさせる。２つまたは３つ以上の核酸もしくはポリペプチド配列について“相同性”および“同一性”という用語は、任意の数の配列比較アルゴリズムを用いるかまたは手動アラインメントと目視観察によって測定したとき、比較ウィンドーまたは指定領域について最大の一致を目指して比較しアラインメントを実施したときに同じであるか、または特定の百分率のアミノ酸残基もしくはヌクレオチドが同じである２つまたは３つ以上の配列もしくはサブ配列を指す。
【０１７８】
配列比較の場合、典型的には１つの配列はリファレンス配列として機能し、前記に対してテスト配列を比較する。配列比較アルゴリズムを用いるときは、テスト配列およびリファレンス配列をコンピュータに入力し、サブ配列座標（ｃｏｏｒｄｉｎａｔｅ）を必要な場合には指定し、さらに配列アルゴリズムプログラムのパラメーターを指定する。デフォルトプログラムパラメーターを用いてもよいし、また別のパラメーターを指定してもよい。続いて配列比較アルゴリズムは、前記プログラムパラメーターを基準にしてリファレンス配列に対するテスト配列のパーセント配列同一性を計算する。
【０１７９】
本明細書において、“比較ウィンドー”は、２０から６００、通常は約５０から約２００、より通常は約１００から約１５０から成る群から選択される任意の数の連続した位置数を有するセグメントに対するリファレンスを含む。ある配列は、比較配列と最適なアラインメントを行った後、前記比較ウィンドー内で同じ数の連続した配置のリファレンス配列と比較される。比較のために配列アラインメントを実施する方法は当技術分野で周知である。比較のために最適な配列アラインメントは、例えば以下によって実施できる：Ｓｍｉｔｈ＆Ｗａｔｅｒｍａｎ（Ａｄｖ．Ａｐｐｌ．Ｍａｔｈ．２：４８２，１９８１）の局所相同性アルゴリズム、Ｎｅｅｄｌｅｍａｎ＆Ｗｕｎｓｃｈ（Ｊ．Ｍｏｌ．Ｂｉｏｌ．４８：４４３，１９７０）の相同性アラインメントアルゴリズム、Ｐｅｒｓｏｎ＆Ｌｉｐｍａｎ（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８５：２４４４，１９９８）の類似性検索法、前記アルゴリズムのコンピュータによる提供（ウィスコンシン大学生物工学センター（１７１０ＵｎｉｖｅｒｓｉｔｙＡｖｅｎｕｅ，Ｍａｄｉｓｏｎ，ＷＩ５３７０５）、遺伝学コンピュータ群の配列分析ソフトウェアパッケージのＧＡＰ、ＢＥＳＴＦＩＴ、ＦＡＳＴＡおよびＴＦＡＳＴＡ）、および手動アラインメントと目視。
【０１８０】
相同性または同一性を決定するための他のアルゴリズムには、例えばＢＬＡＳＴプログラム（ＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ）の他に以下が含まれる：ＡＬＩＧＮ、ＡＭＡＳ（ＡｎａｌｙｓｉｓｏｆＭｕｌｔｉｐｌｙＡｌｉｇｎｅｄＳｅｑｕｅｎｃｅｓ）、ＡＭＰＳ（ＰｒｏｔｅｉｎＭｕｌｔｉｐｌｅＳｅｑｕｅｎｃｅＡｌｉｇｎｍｅｎｔ）、ＡＳＳＥＴ（ＡｌｉｇｎｅｄＳｅｇｍｅｎｔＳａｔｉｓｔｉｃａｌＥｖａｌｕａｔｉｏｎＴｏｏｌ）、ＢＡＮＤＳ、ＢＥＳＴＳＣＯＲ、ＢＩＯＳＣＡＮ（ＢｉｏｌｏｇｉｃａｌＳｅｑｕｅｎｃｅＣｏｍｐａｒａｔｉｖｅＡｎａｌｙｓｉｓＮｏｄｅ）、ＢＬＩＭＰＳ（ＢｌｏｃｋｓＩＭＰｒｏｖｅｄＳｅａｒｃｈｅｒ）、ＦＡＳＴＡ、インターバルズ・アンド・ポインツ（Ｉｎｔｅｒｖａｌｓ＆Ｐｏｉｎｔｓ）、ＢＭＢ、ＣＬＵＳＴＡＬＷ、ＣＯＮＳＥＮＳＵＳ、ＬＣＯＮＳＥＮＳＵＳ、ＷＣＯＮＳＥＮＳＵＳ、スミス・ウォーターマンアルゴリズム、ＤＡＲＷＩＮ、ラスベガスアルゴリズム、ＦＮＡＴ（ＦｏｒｃｅｄＮｕｃｌｅｏｔｉｄｅＡｌｉｇｎｍｅｎｔＴｏｏｌ）、フレームアライン、フレームサーチ、ＤＹＮＡＭＩＣ、ＦＩＬＴＥＲ、ＦＳＡＰ（ＦｒｉｓｔｅｎｓｋｙＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＰａｃｋａｇｅ）、ＧＡＰ（ＧｌｏｂａｌＡｌｉｇｎｍｅｎｔＰｒｏｇｒａｍ）、ＧＥＮＡＬ、ＧＩＢＢＳ、ＧｅｎＱｕｅｓｔ、ＩＳＳＣ（ＳｅｎｓｉｔｉｖｅＳｅｑｕｅｎｃｅＣｏｍｐａｒｉｓｏｎ）、ＬＡＬＩＧＮ（ＬｏｃａｌＳｅｑｕｅｎｃｅＡｌｉｇｎｍｅｎｔ）、ＬＣＰ（ＬｏｃａｌＣｏｎｔｅｎｔＰｒｏｇｒａｍ）、ＭＡＣＡＷ（ＭｕｌｔｉｐｌｅＡｌｉｇｎｍｅｎｔＣｏｎｓｔｒｕｃｔｉｏｎ＆ＡｎａｌｙｓｉｓＷｏｒｋｂｅｎｃｈ）、ＭＡＰ（ＭｕｌｔｉｐｌｅＡｌｉｇｎｍｅｎｔＰｒｏｇｒａｍ）、ＭＢＬＫＰ、ＭＢＬＫＮ、ＰＩＭＡ（Ｐａｔｔｅｒｎ−ＩｎｄｕｃｅｄＭｕｌｔｉ−ｓｅｑｕｅｎｃｅＡｌｉｇｎｍｅｎｔ）、ＳＡＧＡ（ＳｅｑｕｅｎｃｅＡｌｉｇｎｍｅｎｔｂｙＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍ）およびＷＨＡＴ−ＩＦが含まれる。
【０１８１】
前記アラインメントプログラムはまた、ゲノムデータベースのスクリーニングに用いて、実質的に同一の配列を有するポリヌクレオチド配列を同定することができる。多数のゲノムデータベースが利用可能である。例えば、ヒトゲノムの実質的な部分を、ヒトゲノム配列決定プロジェクト（Ｊ．Ｒｏａｃｈ，ｈｔｔｐ：／／ｗｅｂｅｒ．ｕ．Ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ／〜ｒｏａｃｈ／ｈｕｍａｎ＿ｇｅｎｏｍｅ＿ｐｒｏｇｒｅｓｓ２．ｈｔｍｌ）（Ｇｉｂｂｓ，１９９５）の部分として利用することができる。少なくとも２１個の他のゲノムが既に配列を決定されている。これらには、例えばＭ．ジェニタリウム（Ｍ．ｇｅｎｉｔａｌｉｕｍ；Ｆｒａｓｅｒｅｔａｌ．，１９９５）、Ｍ．ヤナシー（Ｍ．Ｊａｎｎａｓｃｈｉｉ；Ｂｕｌｔｅｔａｌ．，１９９６）、インフルエンザ菌（Ｈ．ｉｎｆｌｕｅｎｚａｅ；Ｆｌｅｉｓｃｈｍａｎｎｅｔａｌ．，１９９５）、大腸菌（Ｂｌａｔｔｎｅｒｅｔａｌ．，１９９７）、酵母（Ｓ．ｃｅｒｅｖｉｓｉａｅ；Ｍｅｗｅｓｅｔａｌ．，１９７７）およびショウジョウバエ（Ｄ．ｍｅｌａｎｏｇａｓｔｅｒ；Ａｄａｍｓｅｔａｌ．，２０００）が含まれる。顕著な進展が、モデル生物、例えばマウス、Ｃ．エレガンス（Ｃ．ｅｌｅｇａｎｓ）およびシロイヌナズナ（Ａｒａｂｉｄｏｐｓｉｓｓｐ．）のゲノム配列決定でも達成されている。いくつかの実用的な情報が付されたゲノム情報を含むいくつかのデータベースが種々の機構によって維持されており、例えば以下のようにインターネットを介してアクセスできる：ｈｔｔｐ：／／ｗｗｗｔｉｇｒ．ｏｒｇ／ｔｄｂ；ｈｔｔｐ：／／ｗｗｗ．ｇｅｎｅｔｉｃｓ．ｗｉｓｃ．ｅｄｕ；ｈｔｔｐ：／／ｇｅｎｏｍｅ−ｗｗｗ．ｓｔａｎｆｏｒｄ．ｅｄｕ／〜ｂａｌｌ；ｈｔｔｐ：／／ｈｉｖ−ｗｅｂ．ｌａｎｌ．ｇｏｖ；ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ；ｈｔｔｐ：／／ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ；ｈｔｔｐ：／／ｐａｓｔｅｕｒ．ｆｒ／ｏｔｈｅｒ／ｂｉｏｌｏｇｙ；ｈｔｔｐ：／／ｗｗｗ．ｇｅｎｏｍｅ．ｗｉ．ｍｉｔ．ｅｄｕ．。
【０１８２】
有用なアルゴリズムの一例はＢＬＡＳＴおよびＢＬＡＳＴ２．０アルゴリズムで、前記は、それぞれ以下の文献に記載されている：Ａｌｔｓｃｈｕｌｅｔａｌ．，Ｎｕｃ．ＡｃｉｄｓＲｅｓ．２５：３３８９−３４０２，１９７７およびＡｌｔｓｃｈｕｌｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３−４１０，１９９０。ＢＬＡＳＴ分析を実施するためのソフトは、公的機関（ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ）を介して一般に（ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／）開放されている。このアルゴリズムは、照会配列中で、データベース中の同じ長さを有するワードとアラインメントを実施したとき、いくつかの正の値をもつ閾値スコアＴと適合するか、またはこれを満足させる長さＷの短いワードを同定することによって、先ず初めに高いスコアを有する配列対（ｈｉｇｈｓｃｏｒｉｎｇｓｅｑｕｅｎｃｅ；ＨＳＰ）を同定することを含む。Ｔは隣接ワードスコア閾値（Ａｌｔｓｃｈｕｌｅｔａｌ．，上掲書）と称される。これら最初の隣接ワードの的中は、それらを含むより長いＨＳＰを発見するための検索開始用の種として機能する。
【０１８３】
前記ワードの的中を両方向に向けて各配列に沿って、累積アラインメントスコアが増加するかぎり伸長する。累積スコアは、ヌクレオチド配列の場合はパラメーターＭ（マッチする残基対については褒賞スコア；常に＞０）を用いて計算する。アミノ酸配列の場合は、スコアリングマトリックスが累積スコアの計算に用いられる。各方向のワード的中の伸長は以下の場合に停止される：累積アラインメントスコアがその最大達成値から量Ｘだけ低下したとき；１つまたは２つ以上の陰性スコア値を有する残基アラインメントのために累積スコアが０またはそれより小さくなったとき；またはいずれかに配列の末端に達したとき。ＢＬＡＳＴアルゴリズムパラメーターＷ、ＴおよびＸはアラインメントの感度および速度を決定する。ＢＬＡＳＴプログラム（ヌクレオチド配列用）はデフォルトとして、１１のワード長（Ｗ）、１０の期待値（Ｅ）、Ｍ＝５、Ｎ＝−４および両鎖の比較を用いる。アミノ酸配列の場合は、ＢＬＡＳＴプログラムはデフォルトとして、３のワード長、および１０の期待値（Ｅ）、およびＢＬＯＳＵＭ６２スコアリングマトリックス（以下の文献を参照されたい：Ｈｅｎｉｋｏｆｆ＆Ｈｅｎｉｋｏｆｆ，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８９：１０９１５，１９８９）、５０のアラインメント（Ｂ）、１０の期待値（Ｅ）、Ｍ＝５、Ｎ＝−４、および両鎖の比較を用いる。
【０１８４】
ＢＬＡＳＴアルゴリズムはまた２つの配列間の類似性の統計分析を実施する（例えば以下の文献を参照されたい：Ｋａｒｌｉｎ＆Ａｌｔｓｃｈｕｌ，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９０：５８７３，１９９３）。ＢＬＡＳＴアルゴリズムによって提供される類似性の基準の１つは最小総和確率［ｓｍａｌｌｅｓｔｓｕｍｐｒｏｂａｂｉｌｉｔｙ（Ｐ（Ｎ））］で、前記は２つのヌクレオチドまたはアミノ酸の間でマッチが偶然生じる確率の指標を提供する。例えば、テスト核酸とリファレンス核酸の比較で最小和確率が約０．２未満、より好ましくは約０．０１未満、もっとも好ましくは約０．００１未満であるならば、核酸はリファレンス配列と類似であると考えられる。
【０１８５】
ある実施態様では、タンパク質および核酸配列の相同性は、ベーシック・ローカル・アラインメント検索ツール“ＢＬＡＳＴ”（ＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ）を用いて評価される。特に、５つの固有のＢＬＡＳＴプログラムが、以下のタスクの実施に用いられる：
（１）ＢＬＡＳＴＰおよびＢＬＡＳＴ３は、タンパク質配列データベースに対してアミノ酸照会配列を比較する；
（２）ＢＬＡＳＴＮは、ヌクレオチド配列データベースに対してヌクレオチド照会配列を比較する；
（３）ＢＬＡＳＴＸは、タンパク質配列データベースに対して照会ヌクレオチド配列（両鎖）の６フレームの仮想翻訳生成物を比較する；
（４）ＴＢＬＡＳＴＮは、６つの全ての読み枠（両鎖）で翻訳されるヌクレオチド配列データベースに対して照会タンパク質配列を比較する；および
（５）ＴＢＬＡＳＴＸは、ヌクレオチド配列データベースの６フレームの翻訳に対してヌクレオチド照会配列の６フレームの翻訳を比較する。
【０１８６】
ＢＬＡＳＴプログラムは、照会アミノ酸または核酸配列とテスト配列（前記は好ましくはタンパク質または核酸配列データベースから入手される）間で、類似セグメント（前記は本明細書では“高いスコアをもつセグメント対”と称される）を同定することによって相同な配列を同定する。高いスコアをもつセグメント対は、好ましくはスコアリングマトリックス（それらの多くは当技術分野で周知である）の手段によって同定される（すなわちアラインメントを実施される）。好ましくは、使用されるスコアリングマトリックスはＢＬＯＳＵＭ６２マトリックスである（Ｇｏｎｎｅｔｅｔａｌ．，Ｓｃｉｅｎｃｅ２５６：１４４３−１４４５，１９９２；ＨｅｎｉｋｏｆｆａｎｄＨｅｎｉｋｏｆｆ，Ｐｒｏｔｅｉｎｓ１７：４９−６１，１９９３）。前記よりも劣るが、ＰＡＭまたはＰＡＭ２５０マトリックスもまた使用することができる（例えば以下の文献を参照されたい：ＳｃｈｗａｒｔｚａｎｄＤａｙｈｏｆｆ，ｅｄｓ．，１９７８，ＭａｔｒｉｃｅｓｆｏｒＤｅｔｅｃｔｉｎｇＤｉｓｔａｎｃｅＲｅｌａｔｉｏｎｓｈｉｐｓ：ＡｔｌａｓｏｆＰｒｏｔｅｉｎＳｅｑｕｅｎｃｅａｎｄＳｔｒｕｃｔｕｒｅ，Ｗａｓｈｉｎｇｔｏｎ：ＮａｔｉｏｎａｌＢｉｏｍｅｄｉｃａｌＲｅｓｅａｒｃｈＦｏｕｎｄａｔｉｏｎ）。ＢＬＡＳＴプログラムは米国立医学図書館を介して、例えばｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ．でアクセスできる。
【０１８７】
上記のアルゴリズムとともに用いることができるパラメーターは、配列の長さおよび調査される相同性の程度に応じて改変させることができる。いくつかの実施態様では、前記パラメーターは、ユーザーの指示がない状態でアルゴリズムによって使用されるデフォルトパラメーターであってもよい。
図３は、新規なヌクレオチドまたはタンパク質配列と配列データベースとの間の相同性レベルを決定するために、前記新しい配列をデータベースの配列と比較するプロセス２００の実施態様の１つを示す作業工程図である。前記配列データベースは、コンピュータシステム１００内に保存された個人のデータベースでも、または公的なデータベース（例えばＧＥＮＢＡＮＫ、インターネットを介して利用できる）であってもよい。
プロセス２００は、開始状態２０１で始まり、続いて状態２０２に進む。状態２０２では、比較されるべき新規な配列はコンピュータシステム内のメモリーに保存される。上記で考察したように、前記メモリーはいずれのタイプのメモリーでもよく、これにはＲＡＭまたは内部保存装置が含まれる。
【０１８８】
続いてプロセス２００は状態２０４に進み、ここで配列データベースが分析と比較のために開かれる。さらにプロセス２００は状態２０６に進み、ここで前記データベースに保存された第一の配列はコンピュータのメモリー内に読み出される。続いて比較が状態２１０で実施され、第一の配列が第二の配列と同じか否かが決定される。前記工程は前記新規な配列とデータベース中の第一の配列との間の正確な比較を実施することに限定されないことを特記することは重要である。２つのヌクレオチドまたはタンパク質配列を、たとえそれらが同一でなくとも比較できる周知の方法が当業者には知られている。例えば、ギャップを１つの配列に導入し、２つのテストされる配列間の相同性レベルを高めることができる。比較時にギャップまたは他の特徴を配列に導入するか否かを制御するパラメーターは、通常は前記コンピュータシステムの使用者によってエンターされる。
【０１８９】
いったん状態２１０で比較を実施したら、前記２つの配列が同じか否かの決定が状態２１０で行われる。もちろん、“同じ”という用語は完全に同一の配列に限定されない。使用者がエンターした相同性パラメーターの範囲内にある配列はプロセス２００では“同じ”と表示されるであろう。
２つの配列が同じであると表示されたならば、プロセス２００は状態２１４に進み、ここでは前記データベースの配列の名称が使用者に表示される。前記状態は、表示の名称をもつ配列が、エンターされた相同性の制約を満たすことを使用者に報告する。保存されている配列名が使用者に表示されたら、プロセス２００は決定状態２１８に進み、ここでさらに多くの配列がデータベースに存在するか否かの決定が行われる。それ以上の配列がデータベースに存在しない場合、プロセス２００は終了状態２２０で停止する。しかしながら、データベースにそれ以上の配列が存在する場合は、プロセス２００は状態２２４に進み、ここでポインターはデータベースの次の配列に移動し、前記の新規な配列と比較することができる。このようにして、データベース内の全ての配列と前記新規な配列はアラインメントを実施され比較される。
配列が相同でないという決定が決定状態２１２で行われる場合、他のいずれかの配列がデータベースで比較に利用できるか否かを決定するために、プロセス２００は直ちに決定状態２１８に進むことは特記されねばならない。
【０１９０】
したがって、本発明の特徴の１つは、プロセッサ、データ保存装置および比較を実施するための配列比較装置を含むコンピュータシステムである。前記データ保存装置は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列がそれに保存されてあり、さらに前記データ保存装置には、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列と比較されるべきリファレンスヌクレオチド配列またはポリペプチド配列がそれに保存されてある。前記配列比較装置は、配列間の相同性レベルを表示するか、または、配列番号：１、３、５、７、９、１１、１３、１５および前記配列と実質的に同一の配列の上記核酸コード、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列における構造モチーフを同定するか、または、前記配列比較装置は、前記核酸コードまたはポリペプチドコードと比較される配列の構造モチーフを同定する。いくつかの実施態様では、データ保存装置は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列の少なくとも２、５、１０、１５、２０、２５、３０もしくは４０またはそれ以上の配列を保存する。
【０１９１】
本発明のまた別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列とリファレンスヌクレオチド配列との間の相同性レベルを決定する方法である。前記方法は、核酸コードまたはポリペプチドコードおよびリファレンスヌクレオチドまたはポリペプチド配列を、相同性レベルを決定するコンピュータプログラムを用いて読み出し、さらに核酸コードまたはポリペプチドコードおよびリファレンスヌクレオチドまたはポリペプチド配列との間の相同性を前記コンピュータプログラムを用いて決定することを含む。前記コンピュータプログラムは相同性レベルを決定する多数のコンピュータプログラムのいずれでもよいが、特に本明細書に挙げたもの（例えばデフォルトパラメーターまたは任意の改変パラメーターを有するＢＬＡＳＴ２Ｎ）が含まれる。前記方法は、上記で述べたコンピュータシステムを用いて実施することができる。前記方法はまた、配列番号：１、３、５、７、９、１１、１３、１５に示す上記核酸配列の少なくとも２、５、１０、１５、２０、２５、３０もしくは４０またはそれ以上の配列またはグループＢに示すポリペプチド配列を前記コンピュータプログラムにより読み出し、さらに前記核酸コードまたはポリペプチドコードとリファレンスヌクレオチド配列またはポリペプチド配列との間の相同性を決定することによって実施してもよい。
【０１９２】
図４は、２つの配列が相同であるか否かを決定するコンピュータプロセス２５０の実施態様の１つを示す作業工程図である。プロセス２５０は、開始状態２５２で開始し状態２５４に進み、ここで比較されるべき第一の配列がメモリーに保存される。続いて状態２５６で比較されるべき第二の配列がメモリーに保存される。続いてプロセス２５０は状態２６０に進み、ここで第一の配列の第一の文字が読み出され、続いて状態２６２に進み、ここで第二の配列の第一の文字が読み出される。前記配列がヌクレオチド配列の場合、前記文字は通常はＡ、Ｔ、Ｃ、ＧまたはＵであろうということは理解されよう。前記配列がタンパク質配列の場合は、前記文字は、前記第一および第二の配列を容易に比較できるように、好ましくは一文字アミノ酸コードである。
【０１９３】
続いて決定状態２６４で、前記２つの文字が同じものであるか否か決定が行われる。それらが同じである場合、前記プロセス２５０は状態２６８に進み、ここで第一および第二の配列の次の文字が読み出される。続いて、前記次の文字が同じものであるか否かの決定が行われる。それらが同じである場合は、さらに、プロセス２５０は、２つの文字が同じでなくなるまで前記ループを繰返す。次の２つの文字が同じでないという決定が行われた場合、プロセス２５０は決定状態２７４に進み、ここでさらにそれ以上の読み出すべき文字がいずれかの配列に存在するか否かが決定される。
読み出すべき文字がもはや存在しない場合は、プロセス２５０は状態２７６に進み、第一の配列と第二の配列との間の相同性レベルが使用者に表示される。前記相同性レベルは、第一の配列の文字総数のうち同じであった配列間の文字の割合を計算することによって決定される。したがって、第一の１００個のヌクレオチドの配列の全ての文字が第二の配列の全ての文字と並ぶならば、相同性レベルは１００％であろう。
【０１９４】
また別には、前記コンピュータプログラムは、本発明に示す核酸配列のヌクレオチド配列を１つまたは２つ以上のリファレンスヌクレオチドと比較し、配列番号：１、３、５、７、９、１１、１３、１５および前記と実質的に同一の配列の核酸コードがリファレンス核酸配列と１つまたは２つ以上の位置で異なるか否かを決定するコンピュータプログラムであってもよい。場合によって、前記のプログラムは、リファレンスポリヌクレオチドまたは配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列のいずれかについて挿入、欠失または置換させたヌクレオチドの長さまたその同一性を記録する。ある実施態様では、前記コンピュータプログラムは、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列がリファレンスヌクレオチド配列に対して単一ヌクレオチド多型（ＳＮＰ）を含むか否かを決定するプログラムであろう。
【０１９５】
したがって、本発明の別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列がリファレンスヌクレオチド配列と１つまたは２つ以上のヌクレオチドで相違するか否かを決定する方法である。前記方法は、核酸配列間の相違を同定するコンピュータプログラムを使用して前記核酸コードおよびリファレンスヌクレオチド配列を読み出し、さらに前記コンピュータプログラムにより前記核酸コードとリファレンスヌクレオチド配列間の相違を同定する工程を含む。いくつかの実施態様では、前記コンピュータプログラムは、シングルヌクレオチド多形性を同定するプログラムである。前記方法は、上記のコンピュータシステムおよび図４に示す方法によって実施することができる。前記方法はまた、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列の少なくとも２、５、１０、１５、２０、２５、３０もしくは４０またはそれ以上の配列およびリファレンス配列を前記コンピュータプログラムを使用して読み出し、さらに前記コンピュータプログラムにより前記核酸コードとリファレンスヌクレオチド配列間の相違を同定することによって実施することができる。
【０１９６】
他の実施態様では、前記コンピュータ支援システムは、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列内の特徴を同定するための認識機構（アイデンティファイアー）をさらに含むことができる。
“認識機構”とは、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列内の一定の特徴を同定する１つまたは２つ以上のプログラムを指す。ある実施態様では、前記アイデンティファイアーは、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列内の開放読み枠を同定するプログラムを含むことができる。
【０１９７】
図５は、配列内の特徴の存在を検出する認識機構によるプロセス３００の実施態様の１つを示す作業工程図である。前記プロセス３００は開始状態３０２で始まり、状態３０４に進み、ここで特徴についてチェックされるべき第一の配列がコンピュータシステムのメモリー１１５に保存される。続いてプロセス３００は状態３０６に進み、ここで配列特徴のデータベースが開かれる。前記データベースは、特徴の名称とともに各特徴の属性のリストが含まれるであろう。例えば、特徴の名称は“開始コドン”であり、その属性は“ＡＴＧ”であろう。また別の例は、特徴の名称は“ＴＡＡＴＡＡボックス”で特徴の属性は“ＴＡＡＴＡＡ”であろう。前記データベース例は、ウィスコンシン大学遺伝学コンピュータグループ（ｗｗｗ．ｇｃｇ．ｃｏｍ）によって作製されている。また別には、前記特徴は構造的ポリペプチドモチーフ、例えばアルフヘリックス、ベータシート、または機能的ポリペプチドモチーフ、例えば酵素の活性部位、ヘリックス−ターン−ヘリックスモチーフ、または当業者に公知のモチーフでもよい。
【０１９８】
いったん特徴のデータベースが状態３０６で開かれたら、前記プロセス３００は状態３０８に進み、ここで第一の特徴がデータベースから読み出される。第一の特徴の属性と第一の配列との比較が状態３１０で行われる。続いて、前記特徴の属性が第一の配列で見出されるか否かが決定状態３１６で決定される。前記属性が見出されたら、プロセス３００は状態３１８に進み、ここで見出された特徴の名称が使用者に表示される。
続いてプロセス３００は決定状態３２０に進み、ここでさらにそれ以上の特徴がデータベースに存在するか否かが決定される。それ以上の特徴が存在しない場合は、プロセス３００は終了状態３２４で終了する。しかしながら、それ以上の特徴がデータベースに存在する場合は、プロセス３００は状態３２６で次の配列特徴を読み出し、状態３１０に戻り、ここで次の特徴の属性が第一の配列に対して比較される。
特徴の属性が決定状態３１６で第一の配列で見出されない場合は、プロセス３００は決定状態３２０に直接進み、さらにそれ以上の特徴がデータベースに存在するか否かが決定されることは特記されるべきであろう。
【０１９９】
したがって、本発明の別の特徴は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列内の特徴を同定する方法である。前記方法は、核酸コードまたはポリペプチドコードを、その中に存在する特徴を同定するコンピュータプログラムを用いて読み出し、さらに前記コンピュータプログラムにより核酸コード内の特徴を同定することを含む。ある実施態様では、コンピュータプログラムは、開放読み枠を同定するコンピュータプログラムを含む。前記方法は、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列のただ１つの配列、または少なくとも２、５、１０、１５、２０、２５、３０もしくは４０個を前記コンピュータプログラムを使用して読み出し、さらに前記核酸コードまたはポリペプチドコード内の特徴を前記コンピュータプログラムにより同定することによって実施することができる。
【０２００】
配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列は、多様なデータプロセッサプログラムで多様なフォーマットで保存し処理することができる。例えば、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列は、ワードプロセッシングファイル、例えばマイクロソフトワードもしくはワードパーフェクトでテキストとして、または当業者に周知の多様なデータベースプログラム、例えばＤＢ２、ＳＹＢＡＳＥまたはＯＲＡＣＬＥでアスキーファイルとして保存することができる。さらに、多くのコンピュータプログラムおよびデータベースを、配列比較アルゴリズム、アイデンティファイアー、または配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列と比較されるべきリファレンスヌクレオチド配列またはポリペプチド配列の供給源として使用することができる。以下のリストは、本発明を制限しようとするものではないが、配列番号：１、３、５、７、９、１１、１３、１５に示す核酸配列および前記配列と実質的に同一の配列、または配列番号：２、４、６、８、１０、１２、１４、１６に示すポリペプチド配列および前記配列と実質的に同一の配列に関して有用なプログラムおよびデータベースの手引きを提供する。
【０２０１】
使用することができるプログラムおよびデータベースには以下が含まれる（ただしこれらに限定されない）：マックパターン（ＭａｃＰａｔｔｅｒｎ；ＥＭＢＬ）、ディスカバリーベース（ＤｉｓｃｏｖｅｒｙＢａｓｅ；ＭｏｌｅｃｕｌａｒＡｐｐｌｉｃａｔｉｏｎｓＧｒｏｕｐ）、ジーンマイン（ＧｅｎｅＭｉｎｅ；ＭｏｌｅｃｕｌａｒＡｐｐｌｉｃａｔｉｏｎｓＧｒｏｕｐ）、ルック（Ｌｏｏｋ；ＭｏｌｅｃｕｌａｒＡｐｐｌｉｃａｔｉｏｎｓＧｒｏｕｐ）、マックルック（ＭａｃＬｏｏｋ；ＭｏｌｅｃｕｌａｒＡｐｐｌｉｃａｔｉｏｎｓＧｒｏｕｐ）、ＢＬＡＳＴおよびＢＬＡＳＴ２（ＮＣＢＩ）、ＢＬＡＳＴＮおよびＢＬＡＳＴＸ（Ａｌｔｓｃｈｕｌｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３，１９９０）、ＦＡＳＴＡ（ＰｅａｒｓｏｎａｎｄＬｉｐｍａｎ，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，８５：２４４４，１９８８）、ＦＡＳＴＤＢ（Ｂｒｕｔｌａｇｅｔａｌ．，Ｃｏｍｐ．Ａｐｐ．Ｂｉｏｓｃｉ．６：２３７−２４５，１９９０）、カタリスト（Ｃａｔａｌｙｓｔ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、カタリスト／ＳＨＡＰＥ（ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、セリウス^２．ＤＢアクセス（Ｃｅｒｉｕｓ^２．ＤＢＡｃｃｅｓｓ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ハイポジェン（ＨｙｐｏＧｅｎ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、インサイトＩＩ（ＩｎｓｉｇｈｔＩＩ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ディスカバー（Ｄｉｓｃｏｖｅｒ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ＣＨＡＲＭｍ（ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、フェリックス（Ｆｅｌｉｘ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ＤｅｌＰｈｉ（ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、クォンテＭＭ（ＱｕａｎｔｅＭＭ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ホモロジー（Ｈｏｍｏｌｏｇｙ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、モデラー（Ｍｏｄｅｌｅｒ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ＩＳＩＳ（ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、クォンタ／プロテインデザイン（Ｑｕａｎｔａ／ＰｒｏｔｅｉｎＤｅｓｉｇｎ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ウェブラブ（ＷｅｂＬａｂ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ウェブラブダイバーシティエクスプローラー（ＷｅｂＬａｂＤｉｖｅｒｓｉｔｙＥｘｐｌｏｒｅｒ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ジーンエクスプローラー（ＧｅｎｅＥｘｐｌｏｒｅｒ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、セクフォールド（ＳｅｑＦｏｌｄ；ＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎｓＩｎｃ．）、ＭＤＬアベイラブルケミカルズディレクトリーデータベース（ｔｈｅＭＤＬＡｖａｉｌａｂｌｅＣｈｅｍｉｃａｌｓＤｉｒｅｃｔｏｒｙｄａｔａｂａｓｅ）、ＭＤＬドラッグデータレポートデータベース（ｔｈｅＭＤＬＤｒｕｇＤａｔａＲｅｐｏｒｔｄａｔａｂａｓｅ）、コンプリヘンシブメディシナルケミストリーデータベース（ｔｈｅＣｏｍｐｒｅｈｅｎｓｉｖｅＭｅｄｉｃｉｎａｌＣｈｅｍｉｓｔｒｙｄａｔａｂａｓｅ）、ダーウェントのワールドドラッグインデックスデータベース（Ｄｅｒｗｅｎｔ´ｓＷｏｒｌｄＤｒｕｇＩｎｄｅｘｄａｔａｂａｓｅ）、バイオバイトマスターファイルデータベース（ｔｈｅＢｉｏＢｙｔｅＭａｓｔｅｒＦｉｌｅｄａｔａｂａｓｅ）、ジェンバンクデータベース（ｔｈｅＧｅｎｂａｎｋｄａｔａｂａｓｅ）、およびジェンシークンデータベース（ｔｈｅＧｅｎｓｅｑｎｄａｔａｂａｓｅ）。本開示によって多くの他のプログラムおよびデータベースが当業者には明白であろう。
【０２０２】
上記のプログラムを用いて検出できるモチーフには以下が含まれる（ただしこれらに限定されない）：ロイシンジッパー、ヘリックス−ターン−ヘリックスモチーフ、糖化部位、ユビキチン付加部位、アルファヘリックスおよびベータシートをコードする配列、シグナルペプチド（コードされたタンパク質の分泌を指令する）をコードするシグナル配列、転写調節に関連する配列（例えばホメオボックス）、酸性ストレッチ、酵素活性部位、基質結合部位、および酵素切断部位。
【０２０３】
本発明は酵素の固有の触媒特性を利用する。化学物質の変換における生物触媒（すなわち精製または粗酵素、非生細胞または生細胞）の使用は、特定の出発化合物と反応する個々の生物触媒の同定を通常必要とするが、本発明は、多くの出発化合物、例えば小分子に存在する官能基に特異的な、選択した生物触媒および反応条件を用いる。各生物触媒は、１つの官能基または関連するいくつかの官能基に特異的で、この官能基を含む多くの出発化合物と反応することができる。
前記生物触媒反応は、単一の出発化合物から誘導体の集団を生成する。これら誘導体はさらにもう一回生物触媒反応に付され、第二の誘導化合物集団を生成することができる。最初の小分子または化合物の数千の変種が、生物触媒の誘導体生成反応を繰り返すたびに生成される。
【０２０４】
酵素は出発化合物の特異的部位で反応し、前記分子の残りの部分に影響を与えず、このプロセスは伝統的な化学的方法を用いて達成することは非常に困難である。前記高度な生物触媒反応の特異性は、ライブラリー内のただ１つの活性化合物を同定する手段を提供する。前記ライブラリーは、それを生成するために用いられた生物触媒反応シリーズ、いわゆる“生合成歴”によって特徴付けられる。前記ライブラリーを生物学的活性についてスクリーニングし、生合成歴を追跡することによって、活性化合物を生成する特異的な一連の反応が同定される。前記一連の反応が繰り返され、合成された化合物の構造が決定される。この同定態様は、他の合成およびスクリーニングアプローチと異なり、固定化技術を必要とせず、化合物は溶液中で自由に合成することが可能で、さらに、実質的に任意のタイプのスクリーニングアッセイを用いて溶液中で自由にテストすることができる。官能基上の酵素反応の高度な特異性は、生物触媒により生成されたライブラリーを作製する特異的な酵素反応の追跡を可能にする。
【０２０５】
前記手順の工程の多くはロボットによる自動化を用いて実施され、前記自動化は、１日につき何千もの生物触媒反応およびスクリーニングの実施を可能にするとともに高レベルの正確さおよび再現性を担保する。結果として、誘導化合物ライブラリーは数週間で作製することが可能で、従来の化学的な方法によれば作製に数年を要するであろう。
【０２０６】
特定の実施態様では本発明は小分子を改変する方法を提供する。前記方法は、本明細書に記載したポリヌクレオチドによってコードされるポリペプチドまたは酵素的に活性なそのフラグメントを小分子と接触させ、改変小分子を生成することを含む。改変小分子ライブラリーを調べて、所望の活性を示す改変小分子がライブラリー内に存在するか否かを決定する。所望の活性をもつ前記改変小分子を生成する特異的な生物触媒反応は、ライブラリーの一部分を作製するために用いられる生物触媒反応の各々を系統的に消去し、さらに所望の活性をもつ改変小分子の有無についてライブラリーの一部分で生成された小分子をテストすることによって同定される。所望の活性をもつ改変小分子を生成する特異的な生物触媒反応は場合によって繰り返される。この生物触媒反応は、小分子の構造内に見出される別々の構造部分と反応する一群の生物触媒を用いて実施され、各生物触媒は一つの構造部分又は一つの関連する構造部分群に特異的であり、さらに各生物触媒は、前記個々の構造部分を含む多くの異なる小分子と反応する。
【０２０７】
本発明の構成要素はキットの構成に適切である。特に、配列番号：２、４、６、８、１０、１２、１４、１６のアミノ酸配列またはその相同な配列を有する生成タンパク質であって、約９０℃から１１３℃の範囲の温度でポリメラーゼ活性を有するものを収納する少なくとも１つの容器を含むキットを提供する。好ましい実施態様では、前記タンパク質は、約９０℃から１１３℃の範囲の温度でポリメラーゼ活性を有する配列番号：１６またはその相同な配列である。ある特徴では、前記キットはさらに少なくとももう１つの容器を含み、前記容器にはｄＮＴＰ、ＰＣＲ用調製済み水、標準の長いＧＣリッチ陽性対照鋳型、対照プライマーセットまたはその任意の組合せを収納する。
本発明は以下の実施例を参考にしながらさらに説明されるが、本発明はそのような実施例に限定されないことは理解されるべきである。
【０２０８】
（実施例）
実施例１：配列番号：１６のポリメラーゼのための最適化試験
最適化試験を実施し、８５℃から９５℃の範囲の温度のＰＣＲで配列番号１４，１６のＤＮＡポリメラーゼをポリメラーゼ活性のために利用する場合にもっとも有利な条件を決定した。調べたパラメーターは、緩衝液、ｐＨ、塩および塩濃度、Ｍｇイオン供給源、界面活性剤および界面活性剤濃度であった。
調べた緩衝液はトリス−ＨＣｌ、トリス−ＨＯＡｃ、リン酸緩衝液、バイシン（Ｂｉｃｉｎｅ）、ＨＥＰＥＳ、ＭＯＰＳおよびＴＡＰＳであった。もっとも理想的な緩衝液はＨＣｌであった。
調べたｐＨ範囲は７．５から１０．０であった。もっとも理想的なｐＨは１０．０であった。
調べた塩は、濃度が５ｍＭから２００ｍＭのＮａＣｌ、ＮａＯＡｃ、ＫＣｌ、（ＮＨ_４）_２ＳＯ_４、ＮＨ_４ＯＡｃおよびＬｉＣｌであった。もっとも有利な塩は２５ｍＭのＮａＯＡｃであった。
調べたマグネシウムイオン供給源は、濃度が０．５ｍＭから５ｍＭのＭｇＣｌ_２、Ｍｇ（ＯＡｃ）_２、ＭｇＳＯ_４であった。前記のうちでもっとも有利なものは２から２．５ｍＭのＭｇ（ＫＯＡｃ）_２であった。
調べた界面活性剤は、濃度が０．００１から０．５体積％のＮＰ−４０、トゥイーン−２０（登録商標）およびトリトンＸ−１００（登録商標）界面活性剤であった。最良の条件は、濃度が０．００２％のＮＰ−４０とトゥイーン−２０界面活性剤の混合物であった。
これらの結果から、配列番号：１６のＤＮＡポリメラーゼを用いるＰＣＲの実施にもっとも有利な緩衝液は、６０ｍＭのトリス−ＨＣｌ（ｐＨ１０．０）、２５ｍＭのＮａＯＡｃ、２ｍＭのＭｇ（ＯＡｃ）_２および０．００２％ＮＰ−４０／トゥイーン−２０を用いる。
【０２０９】
実施例２：配列番号：１６のＤＮＡポリメラーゼの高い正確性
３．３ｋｂのｌａｃＺ遺伝子を増幅しクローニングした。文献に記載されたように（Ｗ．Ｍ．Ｂａｒｎｅｓ，（１９９４）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．，９１／：２２１６−２２２０）、β−ガラクトシダーゼアッセイを実施した。
配列番号：１６のポリメラーゼとＴａｑとの比較の結果は図６に示されている。相対的変異頻度は、配列番号：１６のＤＮＡポリメラーゼの場合よりもＴａｑで高いことが図から分かる。鋳型が倍になる毎に塩基対当たりの変異頻度は配列番号：１６のＤＮＡポリメラーゼで６．０×１０^−５で、一方Ｔａｑでは１．８×１０^−４であった。
【０２１０】
実施例３：配列番号：１６のＤＮＡポリメラーゼの収量および融通性
３種のｃＤＮＡ鋳型、長い鋳型およびＧＣリッチ鋳型を配列番号：１６のＤＮＡポリメラーゼを用いて増幅した。結果は図７、８および９に示されている。
以下の３種のｃＤＮＡ鋳型を調製した：３．０ｋｂの甲状腺ホルモンレセプター共働活性化因子、３．３ｋｂのオンコスタチン−Ｍ特異的レセプターベータ遺伝子およびタンパク質チロシンホスファターゼレセプターベータ遺伝子の２．１ｋｂ部分。前記３つの全ての鋳型を、ＨｅＬａ第一鎖ｃＤＮＡ１０ナノグラムを用い３０サイクルのＰＣＲで増幅した。ＰＣＲは各鋳型について２回、最初に配列番号：１６のＤＮＡポリメラーゼを、２回目はＴａｑをポリメラーゼとして用いて実施した。ＳＤＳ−ＰＡＧＥゲルを泳動して配列番号：１６のＤＮＡポリメラーゼによる結果とＴａｑによる結果を比較した。得られたゲルによれば、配列番号：１６のポリメラーゼは、Ｔａｑで達成された収量と同様な収量で３つの鋳型全てを増幅させることができた。
【０２１１】
さらに、種々の長さを有するラムダファージのゲノムＤＮＡを、配列番号：１６のＤＮＡポリメラーゼを用い最適化を実施させずにＰＣＲによって増幅させた。ＳＤＳ−ＰＡＧＥゲルを泳動して各鋳型の増幅量を決定した。得られたゲルによれば、配列番号：１６のポリメラーゼは、最適化を実施することなく１０、１５、２０および２５ｋｂの鋳型を増幅することができた。
インスリン様成長因子レセプターＩＩ（ＩＧＦＲＩＩ）（前記は９０％を越えるＧＣ含有量を有する）を、３つの別個のポリメラーゼ、配列番号：１６のＤＮＡポリメラーゼ、Ｔａｑポリメラーゼ、およびアドバーンテージ−ＧＣ（登録商標）を用いてＰＣＲによって増幅した。各増幅は最適化を実施しないでＰＣＲ２５サイクルを用いた。ＳＤＳ−ＰＡＧＥゲルを泳動して、各酵素による結果を比較した。結果は、配列番号：１６のＤＮＡポリメラーゼは前記鋳型を増幅できること示した。
【０２１２】
図７は、配列番号：１６は多数の鋳型を増幅することができ、Ｔａｑポリメラーゼと比較して大きな収量を生成できることを明瞭に示している。レーンの上に示したように、サンプルは配列番号：１６またはＴａｑのいずれによっても増幅された。増幅ではＰＣＲ３０サイクルについて１０ナノグラムのＨｅＬａ第一鎖ｃＤＮＡを用いた。レーン１，４：３．０ｋｂの甲状腺ホルモンレセプター共働活性化因子；レーン２，５：３．３ｋｂのオンコスタチン−Ｍ特異的レセプターベータ遺伝子；レーン３，６：タンパク質チロシンホスファターゼレセプターベータ遺伝子の２．１ｋｂ部分。
図８は、配列番号：１６は、さらに最適化を実施することなく、２５ｋｂまでのラムダファージゲノムＤＮＡ鋳型を増幅できることを明瞭に示している。
図９は、３種のＤＮＡポリメラーゼを用いた、インスリン様成長因子レセプターＩＩ（ＩＧＦＲＩＩ）の５００ｂｐ領域（９０％を越えるＧＣ含有量を有する）の増幅を示す。各増幅は、最適化を実施しないでＰＣＲ２５サイクルにより実施された。レーン１：配列番号：１６；レーン２：Ｔａｑポリメラーゼ；レーン３：アドバーンテージ−ＧＣ（登録商標）（Ｉｎｖｉｔｒｏｇｅｎ）。図９のレーン１は、配列番号：１６は、他の市販のＤＮＡポリメラーゼよりもＩＧＦＲＩＩｃＤＮＡの一部分（ＧＣが９０％を越える）を良好に増幅することを示している。
【０２１３】
実施例４：配列番号：１６の較正（プルーフリーディング）活性
配列番号：１６のプルーフリーディング活性は平滑端を有するＰＣＲ生成物を生じる。したがって、前記ＰＣＲ生成物は、例えばＴＯＰＯ（登録商標）ブラントクローニング法（ＴＯＰＯＢＬＵＮＴＣｌｏｎｉｎｇｍｅｔｈｏｄｓ；Ｉｎｖｉｔｒｏｇｅｎ，ＳａｎＤｉｅｇｏ，ＣＡ）または類似のシステムを用いてクローニングできる。ＴＯＰＯ（登録商標）クローニングは、迅速５分連結法によりＰＣＲ生成物をより迅速にさらに効率的にクローニングする。ＴＯＰＯ（登録商標）クローニングにとって重要なものは酵素トポイソメラーゼＩである。前記酵素の通常の役割は切れ目を入れスーパーコイルＤＮＡをリラックスさせ、続いて複製中に末端を再結合させることである。トポイソメラーゼの再結合活性の利点を有する種々のクローニングおよび発現ベクターがデザインされ、わずか５分でＰＣＲ生成物を結合することを可能にした。下記のリストは、配列番号：１６のＤＮＡポリメラーゼで増幅したＰＣＲ生成物の増幅のために現在利用可能なＴＯＰＯ（登録商標）ベクターのいくつかの概略である：ｐＣＲ（登録商標）−ＢｌｕｎｔＩＩ−ＴＯＰＯ（登録商標）；ｐＣＲ（登録商標）４Ｂｌｕｎｔ−ＴＯＰＯ（登録商標）；ｐＵｎｉＢｌｕｎｔ／Ｖ５−Ｈｉｓ−ＴＯＰＯ（登録商標）；ｐＵｎｉＤ／Ｖ５−Ｈｉｓ−ＴＰＰＯ（登録商標）。
【０２１４】
実施例５：配列番号：１６の逆転写酵素活性
ポリｄＴＤＮＡプライマーを用いてポリＡテールをもつメッセンジャーＲＮＡとハイブリダイズさせた。これに以下を添加した：ＰＣＲ緩衝液（種々の濃度のＭｎ^＋＋とともにＭｇ^＋＋含有または非含有）、ｄＡＴＰ、ｄＣＴＰ、ｄＧＴＰ、配列番号：１６のポリメラーゼ、およびアルファ−３Ｈ−ｄＴＴＰ。前記混合物を７２℃でインキュベートし、その後ＴＣＡ沈澱を行った。この沈殿により酵素により取り込まれたものから遊離ヌクレオチドは分離除去される。サンプルに取り込まれた放射能活性（ＣＰＭ（カウント／分））は前記反応の逆転写活性を示している。図１０は、Ｍｇ^＋＋の存在下および非存在下での配列番号：１６のＲＴ活性の比較を示す。
【０２１５】
実施例６：耐熱性アッセイ
活性化ウシ胸腺ＤＮＡ伸長反応におけるアルファ−３Ｈ−ｄＴＴＰのポリメラーゼによる取り込みによって酵素活性を測定した。以下を用いて反応混合物を準備した：ＰＣＲ緩衝液、ｄＡＴＰ、ｄＧＴＰ、ｄＣＴＰ、活性化ウシ胸腺ＤＮＡ、およびアルファ−３Ｈ−ｄＴＴＰ。ポリメラーゼ酵素（緩衝液中）を８５℃、９０℃または９５℃で種々の時間（０から２４０分）予備インキュベートした。前記熱処理の後、前記酵素を反応混合物に添加し、同じ温度で一定時間インキュベートした。続いてＴＣＡ沈澱を実施し、酵素によって取り込まれたヌクレオチドから遊離ヌクレオチドを分離した。ヌクレオチド取り込みサンプルの放射能活性（ＣＰＭ）は反応時のポリメラーゼ活性量を示す。各温度について予備インキュベーションに対するＣＰＭの表（酵素の耐熱性を示す）を作製することができる（図１１参照）。
本発明を上記の実施例を参考に述べてきたが、改変および変更は本発明の範囲内に包含されることは理解されよう。したがって、本発明は特許請求の範囲によってのみ限定される。
添付の図面は本発明の実施態様の説明であって、請求の範囲によって包含される本発明の範囲を限定しようとするものではない。
【図面の簡単な説明】
【図１】図１Ａから１Ｅは、ピロロブス・フマリア（Ｐｙｒｏｌｏｂｕｓｆｕｍａｒｉａ）由来のＤＮＡポリメラーゼ（１ＰＹ２）のヌクレオチド配列および推定されるアミノ酸配列を示す（それぞれ配列番号：１３および１４）。再配列決定したところ、ヌクレオチド配列および推定されるアミノ酸配列は、配列番号：１３および１４に対して９９％を越える相同性を示した（それぞれ配列番号：１５および１６を参照されたい）（図１Ｆ−１Ｈ（ＤＮＡ）および図１Ｉ（アミノ酸））。
【図２】図２はコンピュータシステムのブロック図である。
【図３】図３は、新規なヌクレオチド配列またはタンパク質配列を配列データベースで比較し、新規な配列とデータベースの配列との間の相同性レベルを決定するプロセスの実施態様の１つを示したフローチャートである。
【図４】図４は、２つの配列が相同であるか否かを決定するコンピュータプロセスの実施態様の１つを示したフローチャートである。
【図５】図５は、配列内の特徴の有無を検出するアイデンティファイアープロセス３００の実施態様の１つを示したフローチャートである。
【図６】図６は、実施例２で説明したように、配列番号：１５によってコードされるポリメラーゼ（ポリペプチド＝配列番号：１６）およびＴａｑポリメラーゼを用いた変異の相対頻度を示す表である。
【図７】図７はゲルを示しており、配列番号：１６が多数の鋳型を増幅し、Ｔａｑポリメラーゼと比較して大きな収量を生成できることを示している。
【図８】図８は、配列番号：１６が２５ｋｂまでのラムダファージゲノムＤＮＡ鋳型をまた別に最適化を実施することなく増幅できることを示すゲルを提示している。
【図９】図９はゲルを示しており、レーン１は、ＧＣ含有量が９０％を越えるＩＧＦＲＩＩのｃＤＮＡの一部を配列番号：１６が良好に増幅できることを示している。
【図１０】図１０は、Ｍｇ^＋＋の存在下および非存在下での配列番号：１６のＲＴ活性の比較を示す。
【図１１】図１１は、８５℃、９０℃および９５℃で４時間までの間の配列番号：１６の安定性およびポリメラーゼ活性を示すグラフである。

Claims

配列番号：１、３、５、７、９、１１、１３、１５に記載の配列、および、その変種であって配列番号：１、３、５、７、９、１１、１３、１５に記載の配列と少なくとも約５０％の同一性を有しかつ約９０℃から１１３℃の範囲の温度でポリメラーゼ活性を有するポリペプチドをコードする前記変種、から成る群から選択される配列を含む単離核酸。
配列番号：１、３、５、７、９、１１、１３、１５に記載の配列、前記配列と実質的に同一の配列、および前記配列と相補的な配列、から成る群から選択される配列を含む請求項１に記載の単離核酸。
前記単離核酸がＤＮＡである請求項１記載の単離核酸。
前記ＤＮＡがｃＤＮＡ、ゲノムＤＮＡまたは合成ＤＮＡである請求項３記載の単離核酸。
請求項１記載の核酸と高ストリンジェンシー条件下でハイブリダイズする単離核酸。
請求項１記載の核酸と中等度のストリンジェンシー条件下でハイブリダイズする単離核酸。
請求項１記載の核酸と低ストリンジェンシー条件下でハイブリダイズする単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも約５５％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも約６０％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも約６５％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも７０％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも約７５％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも８０％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも約８５％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも９０％の相同性を有する単離核酸。
配列比較アルゴリズムによる分析で決定したとき、請求項１記載の核酸と少なくとも約９５％の相同性を有する単離核酸。
前記配列比較アルゴリズムが、デフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８である請求項１、２、８、９、１０、１１、１２、１３、１４、１５または１６記載の単離核酸。
配列番号：１、３、５、７、９、１１、１３、１５に記載の配列、前記配列と実質的に同一の配列、および前記配列と相補的な配列から成る群から選択される配列の少なくとも１０個の連続した塩基を含む単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも約５０％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも約５５％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも約６０％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも６５％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも７０％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも７５％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも８０％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも８５％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも９０％の相同性を有する単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項１記載の核酸と少なくとも９５％の相同性を有する単離核酸。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列から成る群から選択される配列を有するポリペプチドをコードする単離核酸。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列から成る群から選択される配列を有するポリペプチドの少なくとも１０個の連続するアミノ酸を含むポリペプチドをコードする単離核酸。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと実質的に同一の精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約５０％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約５５％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約６０％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約６５％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも７０％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約７５％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも８０％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約８５％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約９０％の相同性を有する精製ポリペプチド。
配列比較アルゴリズムまたはデフォルトパラメーターを用いたＦＡＳＴＡバージョン３．０ｔ７８による分析で決定したとき、請求項２９または３０記載のポリペプチドと少なくとも約９５％の相同性を有する精製ポリペプチド。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列を有する精製ポリペプチドであって、約７０℃から１１３℃の範囲の温度でポリメラーゼ活性を有する前記精製ポリペプチド。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列を有する精製ポリペプチドであって、３’→５’エキソヌクレアーゼ活性を有する前記精製ポリペプチド。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列から成る群から選択される配列を含むポリペプチドと特異的に結合する精製抗体。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列から成る群から選択されるポリペプチドの少なくとも１０個の連続したアミノ酸を有するポリペプチドと特異的に結合する精製抗体。
ポリクローナルである請求項４４または４５記載の抗体。
モノクローナルである請求項４４または４５記載の抗体。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列を有するポリペプチドを製造する方法であって、前記方法が、前記ポリペプチドをコードする核酸を、前記ポリペプチドの発現を許容する条件下で宿主細胞に導入し、さらに前記ポリペプチドを回収することを含む前記ポリペプチドを製造する方法。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列の少なくとも１０個の連続したアミノ酸を含むポリペプチドを製造する方法であって、プロ−モーターに連結された前記ポリペプチドをコードする核酸を、前記ポリペプチドの発現を許容する条件下で宿主細胞に導入し、さらに前記ポリペプチドを回収することを含む前記ポリペプチドを製造する方法。
配列番号：１、３、５、７、９、１１、１３、１５に記載の配列、前記配列と実質的に同一の配列、前記配列と相補的な配列、少なくとも３０個の連続した前記ヌクレオチドを含むフラグメント、および配列番号：１、３、５、７、９、１１または１３、１５に記載の配列と相補的な配列の少なくとも約３０個の連続したヌクレオチドを含むフラグメントから成る群から選択される配列を含む核酸を入手し；さらに
前記配列中の１つまたは２つ以上のヌクレオチドを別のヌクレオチドに改変するか、前記配列中の１つまたは２つ以上のヌクレオチドを欠失させるか、または前記配列に１つまたは２つ以上のヌクレオチドを付加することを含む、変種の作製方法。
改変が、変異性ＰＣＲ、シャッフリング、オリゴヌクレオチド特異的突然変異導入、アッセンブリーＰＣＲ、有性ＰＣＲ突然変異導入、ｉｎｖｉｖｏ突然変異導入、カセット突然変異導入、循環アンサンブル突然変異導入、指数的アンサンブル突然変異導入、部位特異的突然変異導入、遺伝子再アッセンブリー、遺伝子部位飽和突然変異導入および前記の任意の組み合わせから成る群から選択される方法によって導入される請求項５０記載の方法。
改変が変異性ＰＣＲによって導入される請求項５０記載の方法。
改変がシャッフリングによって導入される請求項５０記載の方法。
改変がオリゴヌクレオチド特異的突然変異導入によって導入される請求項５０記載の方法。
改変がアッセンブリーＰＣＲによって導入される請求項５０記載の方法。
改変が有性ＰＣＲ突然変異導入によって導入される請求項５０記載の方法。
改変がｉｎｖｉｖｏ突然変異導入によって導入される請求項５０記載の方法。
改変がカセット突然変異導入によって導入される請求項５０記載の方法。
改変が循環アンサンブル突然変異導入によって導入される請求項５０記載の方法。
改変が指数的アンサンブル突然変異導入によって導入される請求項５０記載の方法。
前変が部位特異的突然変異導入によって導入される請求項５０記載の方法。
改変が遺伝子再アッセンブリーによって導入される請求項５０記載の方法。
改変が遺伝子部位飽和突然変異導入によって導入される請求項５０記載の方法。
配列番号：１、３、５、７、９、１１、１３、１５に記載の配列および前記配列と実質的に同一の配列から成る群から選択される核酸配列、または、配列配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列、から成る群から選択されるポリペプチド配列を保存したコンピュータ読取り可能媒体。
プロセッサおよびデータ保存装置を含むコンピュータシステムであって、前記データ保存装置が、配列番号：１、３、５、７、９、１１および１３、１５に記載の配列、並びに前記配列と実質的に同一の配列から成る群から選択される核酸配列、または配列配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列、および前記配列と実質的に同一の配列から成る群から選択されるポリペプチド配列を保存してある前記コンピュータシステム。
さらに配列比較アルゴリズムおよび少なくとも１つのリファレンス配列が保存してあるデータ保存装置を含む請求項６５記載のコンピュータシステム。
配列比較アルゴリズムが、多形性を表示するコンピュータプログラムを含む請求項６６記載のコンピュータシステム。
さらに配列の特徴を同定する認識機構を含む請求項６５記載のコンピュータシステム。
第一の配列とリファレンス配列を比較する方法であって、第一の配列が、配列番号：１、３、５、７、９、１１、１３、１５に記載の配列および前記配列と実質的に同一の配列から成る群から選択される核酸配列、または、配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列から成る群から選択されるポリペプチド配列であって、
前記第一の配列およびリファレンス配列を、配列を比較するコンピュータプログラムを使用して読取り、さらに
前記第一の配列と前記リファレンス配列との間の相違を前記コンピュータプログラムにより決定することを含む、前記方法。
第一の配列とリファレンス配列との間の相違の決定が多型性を同定することを含む請求項６９に記載の方法。
配列番号：１、３、５、７、９、１１、１３、１５に記載の配列、前記配列と実質的に同一の配列から成る群から選択される配列、または配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列から成る群から選択されるポリペプチド配列における特徴を同定する方法であって、
配列の特性を認識するコンピュータプログラムを使用して前記配列を読取り、さらに
前記コンピュータプログラムにより前記配列の特徴を認識することを含む、前記配列の特徴を同定する方法。
熱に対して安定であり、耐熱性であり、さらに核酸配列の生成または修復を触媒する酵素であり、さらに、約６０℃から１１３℃の温度に曝露した後で復元可能であって活性を取り戻すことができる酵素である、請求項１記載の精製ポリペプチド。
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列、および少なくとも５０％の相同性を有する配列から成る群から選択されるポリペプチドであって、さらにポリメラーゼ酵素活性を有するポリペプチドと核酸とを含むサンプルを、核酸配列の生成または修復を促進する条件下で接触させることを含む、核酸配列の生成または修復を触媒する方法。
配列番号１、３、５、７、９、１１、１３、１５に記載の配列のフラグメントおよび前記配列と実質的に同一の配列のフラグメントによってコードされる機能的ポリペプチドフラグメントまたは変種であって、配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列を有するポリペプチドの酵素機能を保持するものを同定するアッセイであって、
配列番号：２、４、６、８、１０、１２、１４、１６に記載の配列および前記配列と実質的に同一の配列のポリペプチド、または配列番号１、３、５、７、９、１１、１３もしくは１５によってコードされるポリペプチドフラグメントまたは変種を、前記ポリペプチドまたはフラグメントまたは変種が機能できる条件下で基質と接触させること；および、
基質レベルの低下または前記ポリペプチドと基質間の反応における反応生成物のレベルの増加を検出することを含み、
基質レベルの低下または反応生成物のレベル増加が機能的ポリペプチドまたはフラグメントまたは変種の指標となる前記アッセイ。
請求項１記載のポリヌクレオチドによってコードされるポリペプチドをＰＣＲ増幅反応においてＤＮＡ鋳型と接触させることを含むポリヌクレオチドの製造方法であって、前記鋳型分子の長さが約２０ｋｂより大きい前記ポリヌクレオチドの製造方法。
請求項１記載のポリヌクレオチドによってコードされるポリペプチドをＰＣＲ増幅反応においてＤＮＡ鋳型と接触させることを含むポリヌクレオチドの製造方法であって、前記鋳型分子が約９０％を越えるグアニジン−シトシン（ＧＣ）含有量を含む前記製造方法。
約１０から５０ヌクレオチド長のオリゴヌクレオチドを含み、さらに配列番号：１、３、５、７、９、１１、１３、および１５に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも５０％相補的である少なくとも１０個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的：ローブ二重鎖を生成する核酸プローブ。
オリゴヌクレオチドがＤＮＡである請求項７７記載のプローブ。
核酸標的領域と少なくとも５５％の相補性を有する請求項７７記載のプローブ。
核酸標的領域と少なくとも６０％の相補性を有する請求項７７記載のプローブ。
核酸標的領域と少なくとも６５％の相補性を有する請求項７７記載のプローブ。
核酸標的領域と少なくとも７０％の相補性を有する請求項７７記載のプローブ。
核酸標的領域と少なくとも７５％の相補性を有する請求項７７記載のプローブ。
オリゴヌクレオチドが、核酸標的領域と８０％の相補性を有する請求項７７記載のプローブ。
核酸標的領域と少なくとも８５％の相補性を有する請求項７７記載のプローブ。
オリゴヌクレオチドが、核酸標的領域と９０％の相補性を有する配列を含む請求項７７記載のプローブ。
核酸標的領域と少なくとも９５％の相補性を有する請求項７７記載のプローブ。
核酸標的領域と完全に相補的である請求項７７記載のプローブ。
オリゴヌクレオチドの長さが１５−５０ヌクレオチドである請求項７７記載のプローブ。
プローブがさらに検出可能なアイソトープ標識を含む請求項７７記載のプローブ。
プローブがさらに、蛍光分子、化学発光分子、酵素、補助因子、酵素基質およびハプテンから成る群から選択される非アイソトープ標識を含む請求項７７記載のプローブ。
長さが約１５から５０ヌクレオチドのオリゴヌクレオチドを含み、さらに配列番号：１、３、５、７、９、１１、１３、および１５に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも９０％相補性である少なくとも１５個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的：プローブ二重鎖を生成する核酸プローブ。
長さが約１５から５０ヌクレオチドのオリゴヌクレオチドを含み、さらに配列番号：１、３、５、７、９、１１、１３、および１５に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも９５％相補性である少なくとも１５個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的：プローブ二重鎖を生成する核酸プローブ。
長さが約１５から５０ヌクレオチドのオリゴヌクレオチドを含み、さらに配列番号：１、３、５、７、９、１１、１３および１５に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも９７％相補的である少なくとも１５個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的：プローブ二重鎖を生成する核酸プローブ。
配列番号：１、３、５、７、９、１１、１３または１５に記載の配列の少なくとも一部分と同じであるかまたは相補的である配列を有する、ポリメラーゼ遺伝子を単離または同定するためのポリヌクレオチドプローブ。
請求項１９または３２のいずれかに記載のポリペプチドを含む液体酵素調製物。
請求項１９または３２のいずれかに記載のポリペプチドを含む乾燥酵素調製物。
請求項１のポリヌクレオチドによってコードされるポリペプチドまたはそのフラグメントを小分子と混合して、改変小分子を生成することを含む小分子の改変方法。
改変小分子ライブラリーを試験して、所望の活性を示す改変小分子が前記ライブラリーに存在するか否かを決定する請求項９８記載の方法。
ライブラリーの一部分を生成するために用いられた生物触媒反応の各々を系統的に除去し、続いて前記ライブラリーの一部分で生成された小分子を所望の活性を有する改変小分子の有無について分析することによって、所望の活性をもつ改変小分子を生成する特異的な生物触媒反応を同定する請求項９９記載の方法。
所望の活性をもつ前記改変小分子を生成する特異的な生物触媒反応が場合により繰り返される請求項１００記載の方法。
（ａ）生物触媒反応が、小分子の構造内に見出される別々の構造部分と反応する一群の生物触媒によって行われ；
（ｂ）各生物触媒は１つの構造部分または一群の関連する構造部分について特異的であり；さらに
（ｃ）各生物触媒は別個の構造部分を含む多くの異なる小分子と反応する、
請求項１００または１０１記載の方法。
配列番号：２、４、６、８、１０、１２もしくは１４、１６に記載の配列または前記配列と相同な配列であるアミノ酸配列を有し、約９０℃から１１３℃の範囲の温度でポリメラーゼ活性を有する精製タンパク質を収納する少なくとも１つの容器を含むキット。
タンパク質が配列番号：１６に記載の配列または前記配列と相同な配列で、約９０℃から１１３℃の範囲の温度でポリメラーゼ活性を有する請求項１０３記載のキット。
ｄＮＴＰ、ＰＣＲ用調製水、標準長のＧＣ富裕陽性コントロール鋳型、コントロールプライマーセット、または前記の任意の組み合わせを収納した少なくとも１つの容器をさらに含む請求項１０３記載のキット。
以下を含むＤＮＡ分子の配列を決定する方法：
（ａ）プライマーを第一のＤＮＡ分子とハイブリダイズさせること；
（ｂ）前記第一のＤＮＡ分子をデオキシリボヌクレオシド三リン酸、請求項１記載のＤＮＡポリメラーゼおよびターミネーター分子と接触させて混合物を作製すること；
（ｃ）前記第一のＤＮＡ分子と相補的なＤＮＡ分子のランダムな集団を合成するために十分な条件下で前記混合物をインキュベートすることであって、前記合成されたＤＮＡ分子はその５’末端にターミネーターヌクレオチドを含んでおり；さらに
（ｄ）前記第一のＤＮＡ分子のヌクレオチド配列の少なくとも一部分を決定することができるように前記合成されたＤＮＡ分子をサイズによって分離すること。
デオキシリボヌクレオシド三リン酸が、イノシンｄＡＴＰ、ｄＣＴＰ、ｄＧＴＰ、ｄＴＴＰ、ｄＩＴＰ、７−デアザ−ｄＧＴＰ、ｄＵＴＰ、［α−Ｓ］ｄＡＴＰ、［α−Ｓ］ｄＴＴＰ、［α−Ｓ］ｄＧＴＰ、または［α−Ｓ］ｄＣＴＰである請求項１０６の方法。
ターミネーターヌクレオチドがｄｄＴＴＰ、ｄｄＡＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰ、またはｄｄＣＴＰである請求項１０６の方法。
以下を含む、ｍＲＮＡからｃＤＮＡを調製する方法：
（ａ）ｍＲＮＡをオリゴ（ｄＴ）プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成すること；および、
（ｂ）ｃＤＮＡが得られる条件下で、工程（ａ）で生成される前記ハイブリッドを請求項１のＤＮＡポリメラーゼおよび４種の異なるｄＮＴＰと接触させること。
以下を含む二本鎖ＤＮＡの増幅方法：
（ａ）第一および第二のプライマーを提供することであって、ここで前記第一のプライマーは前記ＤＮＡ分子の第一の鎖の３’末端または３’末端近くの配列と相補的で、さらに、前記第二のプライマーは前記ＤＮＡ分子の第二の鎖の３’末端または３’末端近くの配列と相補的であり；
（ｂ）請求項１のＤＮＡポリメラーゼの存在下で、前記第一の鎖と相補的な第三のＤＮＡ分子および前記第二の鎖と相補的な第四の鎖が合成されるような条件下で、前記第一の鎖と前記プライマーをハイブリダイズさせ、および、前記第二の鎖と前記第二のプライマーをハイブリダイズさせること；
（ｃ）前記第一と第三の鎖、および前記第二と第四の鎖を変性させること；および、
（ｄ）（ａ）から（ｃ）までの工程を１回または２回以上繰り返して増幅ＤＮＡ分子を生成すること。
さらに増幅ＤＮＡ分子をベクターに挿入することを含む請求項１１０記載の方法。
ベクターがプラスミドである請求項１１１記載の方法。
請求項１記載のポリヌクレオチドによってコードされるポリペプチドをＰＣＲ増幅反応でＤＮＡ鋳型と接触させることを含む、非天然ヌクレオチドまたはヌクレオチド類似体をＤＮＡ分子に取り込ませる方法。
ヌクレオチドがイノシン、２−アミノプリンまたは５−メチルシトシンから選択される請求項１１３記載の方法。