JP2004504014A - 配列に基づくスクリーニング - Google Patents
配列に基づくスクリーニング Download PDFInfo
- Publication number
- JP2004504014A JP2004504014A JP2001584578A JP2001584578A JP2004504014A JP 2004504014 A JP2004504014 A JP 2004504014A JP 2001584578 A JP2001584578 A JP 2001584578A JP 2001584578 A JP2001584578 A JP 2001584578A JP 2004504014 A JP2004504014 A JP 2004504014A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- sequence
- library
- polynucleotide
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6811—Selection methods for production or design of target specific oligonucleotides or binding molecules
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Eye Examination Apparatus (AREA)
- Combined Means For Separation Of Solids (AREA)
Abstract
試料の核酸プロフィールを得るための方法が提供される。方法は、生物体の混合集団の複数の核酸配列からDNAライブラリーを作製する段階、及びDNAライブラリー中の少なくとも1つのクローンの配列決定をする段階を含む。配列をデータベースと比較して、ライブラリー中のクローンと相同性を持つ、データベース中の配列を同定し、それにより生物体の混合集団の核酸プロフィールを得る。
Description
【0001】
発明の分野
本発明は一般的に、生物体の混合集団のスクリーニング、より具体的には環境試料の配列に基づくプロファイリングに関する。
【0002】
背景
現代生物学の中心となる核とは、遺伝情報は核酸ゲノムに存在し、そのようなゲノムに具体化される情報(すなわち遺伝型)が細胞の機能を指揮するというものである。これは、生物体のゲノム中の様々な遺伝子の発現と、そのような遺伝子発現の調節によって起きる。細胞または生物体中の遺伝子発現は、細胞または生物体の物理的特徴(すなわち表現型)を規定する。これは遺伝子のタンパク質への翻訳を介して行われる。
【0003】
種々の生物体のための潜在的な治療薬、抗生物質、および生物製剤をさらに理解し、決定するために、いくつかの生物体のゲノムの配列を決定する努力がなされてきた。例えば、ヒトゲノムプロジェクトは、ヒトのゲノムの完全な配列を決定し、各遺伝子の生化学的機能を決定するという具体的目標をもって開始された。現在までに、このプロジェクトはヒトゲノムの多くの部分の配列を決定している(J.Roach、http://weber.u.Washington.edu/ ̄roach/human_genome_progress2.html)(Gibbs、1995)。例えば、M.ゲニタリウム(genitalium) (Fraserら、1995)、M.ジャナスチー(jannaschii) (Bultら、1996)、インフルエンザ菌(H.influenzae) (Fleischmannら、1995)、大腸菌(E.coli) (Blattnerら、1997)および酵母(S.cerevisiae)(Mewesら、1997)を含む、少なくとも21の他のゲノムがすでに配列決定されている。マウス、線虫(C.elegans)、アラビドプシス(Arabidopsis)種およびキイロショウジョウバエ(D.melanogaster)のようなモデル生物のゲノムの配列決定においては、有意な進歩が見られている。たとえば以下のような、いくつかの機能情報で注釈されたゲノム情報を含むいくつかのデータベースが、種々の団体によって維持され、インターネット経由でアクセスされうる:http://wwwtigr.org/tdb;http.//www.genetics.wisc.edu; http://genome−www.stanford.edu/ ̄ball;http://hiv−web.lanl.gov; http://www.ncbi.nlm.nih.gov; http://www.ebi.ac.uk;http;//Pasteur.fr/other/biology;およびhttp;//www.genome.wi.mit.edu。ゲノム中の生(raw)核酸配列は、いくつかの利用可能なアルゴリズムの1つを経て、タンパク質のアミノ酸配列に転換され、このタンパク質が細胞中の様々な過程を実行する。残念ながら、これらのタンパク質配列の生データは、そのまま細胞中のタンパク質の機能や、生体試料中での関係や役割を表すわけではない。種々の細胞過程の詳細(例えば、代謝経路、分子間のシグナル伝達、細胞分裂など)およびこれらの過程をどのタンパク質が担うかを理解することは、現代の細胞生物学の中心的なゴールである。
【0004】
したがって、環境試料中に存在する生物体、タンパク質、核酸配列のプロフィールを決定することは、環境中のこれらの生物体やタンパク質の役割について、価値のある情報を提供し得る。さらにそのような情報は、生物製剤、診断薬、治療薬、および産業的応用性のある組成物の開発に役立ち得る。
【0005】
発明の概要
本発明は、複数の核酸配列を得ることによって、生物体の混合集団を含む試料から試料の核酸プロフィールを得る方法を提供することによって、当技術分野における多くの問題を解決する。本方法には、複数の核酸配列から核酸ライブラリーを作製し、そのライブラリーの少なくとも1つのクローンの配列を決定することが含まれる。配列情報は、少なくとも1つのクローンの配列と、複数の生物体由来の複数の核酸配列を含むデータベースとを比較するアルゴリズムを用いて、少なくとも1つのクローンに相同性を持つデータベース中の配列を同定する、データベース検索に使用される。これを必要ならば繰り返し実行し、試料の核酸プロフィールを得ることができる。1つの態様では、生物体の混合集団は、環境試料のような、非培養または培養微生物に由来する。別の態様では、核酸はRNA、DNA(例えば、ゲノムDNAまたはその断片)であり得る。
【0006】
本発明は、植物の混合集団を含む試料から複数の核酸配列を得ることによって、試料の核酸プロフィールを得る方法も提供する。本方法には、複数の核酸配列からDNAライブラリーを作製し、そのDNAライブラリーの少なくとも1つのクローンの配列を決定することが含まれる。配列情報は、少なくとも1つのクローンの配列と、複数の生物体由来の複数の核酸配列を含むデータベースとを比較するアルゴリズムを用いて、少なくとも1つのクローンに相同性を持つデータベース中の配列を同定する、データベース検索に使用される。これを必要ならば繰り返し実行し、試料の核酸プロフィールを得ることができる。1つの態様では、植物の混合集団は、環境試料のような、非培養または培養植物に由来する。別の態様では、核酸はRNA、DNA(例えば、ゲノムDNAまたはその断片)であり得る。
【0007】
発明の詳細な説明
本発明は、試料中に存在するポリヌクレオチド配列に基づいて、環境試料のフィンガープリンティングまたはプロファイリングを行なうための方法および組成物を提供する。それにより本発明は、生物体が特定の環境に対応するための進化および生物多様性を理解するために有用で、方向づけられた進化、分子生物学、バイオテクノロジー、および産業的応用に役立つ方法および組成物を提供する。
【0008】
本発明は生物体の混合集団または生物体の混合集団由来の核酸配列を含む試料中で、配列を素早くスクリーニングして同定する方法を提供する。試料中に存在する核酸配列のスクリーニングおよび同定を行なうことにより、本発明は診断薬、治療薬、または産業的応用のための分子の開発に使用可能な配列のレパートリーを増大させる。したがって、本発明の方法により機能の既知および未知のタンパク質またはポリペプチドをコードする新規の核酸配列を同定できる。
【0009】
また、本発明は既知の活性を持つ配列に対応する核酸配列、または既知の活性を持つタンパク質またはペプチドをコードする配列が、試料中に存在するか否かを素早く同定する方法を提供する。
【0010】
本明細書および添付の特許請求の範囲で使用される単数形「1つの」および「その」は、そうでないことが内容から明らかである場合を除き、複数形の物も含む。したがって、「1つのクローン」は複数のクローンを含み、「その核酸配列は」一般的に1つまたは複数の核酸配列および当技術分野で周知の同等物を含む。
【0011】
特に明確に定義されないかぎり、本明細書に使用されるすべての技術的および科学的用語は、本発明の関連する当業者によって通常理解されているのと同じ意味を持つ。本発明の実施または試験においては、本明細書記載の方法および材料と類似した、または同等の任意の方法、装置および材料を使用できるが、好ましい方法、装置および材料は、本明細書に記載されている。
【0012】
本明細書に記載される全ての出版物は、本明細書に記載される発明に関連して使用される可能性のある出版物中に記載されるデータベース、タンパク質および方法を記述し開示するために、その全体が参照として本明細書に組み入れられる。上述およびテキスト全体に記述される出版物は、本出願の出願日以前の開示のためのみに提供される。先行発明のおかげで、発明者にはそのような開示に先行する資格がないことを認めると解釈されてはならない。
【0013】
「アミノ酸」とは、中心の炭素原子(α炭素原子)が水素原子、カルボン酸基(本明細書ではその炭素原子を「カルボキシル炭素原子」と呼ぶ)、アミノ基(本明細書ではその窒素原子を「アミノ窒素原子」と呼ぶ)、および側鎖のR基に結合している構造を持つ分子である。ペプチド、ポリペプチド、またはタンパク質に組み込まれると、1つのアミノ酸を別のアミノ酸に結合する脱水反応において、アミノ酸は、アミノ酸カルボキシル基の1つまたは複数の原子を失う。その結果、タンパク質に組み込まれたときには、アミノ酸は「アミノ酸残基」と呼ばれる。
【0014】
「タンパク質」とは、2つまたはそれ以上の個々の(天然又は非天然の)アミノ酸がペプチド結合で結合した任意のポリマーを意味し、1つのアミノ酸(またはアミノ酸残基)のα炭素に結合したカルボン酸基のカルボキシル炭素原子が、隣接するアミノ酸のα炭素に結合するアミノ基のアミノ窒素原子に共有結合されると発生する。「タンパク質」という用語は、その意味の中に「ポリペプチド」および「ペプチド」(これらは本明細書では時折互換的に使用される可能性がある)という用語を含むと理解される。さらに、複数のポリペプチドサブユニット(例えば、DNAポリメラーゼIII、RNAポリメラーゼII)または他の成分(例えば、テロメラーゼにおけるRNA分子)を含むタンパク質も、本明細書で使用される「タンパク質」の意味に含まれると理解される。同様に、タンパク質やポリペプチドの断片も、本発明の範囲内であり、本明細書では「タンパク質」と呼ばれうる。
【0015】
あるタンパク質の特定のアミノ酸配列(すなわちアミノ末端からカルボキシ末端まで書かれた時のポリペプチドの「一次構造」)は、mRNAのコード部分のヌクレオチド配列によって決定され、mRNAは、通常はゲノムDNA(例えばミトコンドリアまたはクロロプラストDNAのようなオルガネラDNAを含む)である遺伝情報によって規定されている。このように、遺伝子の配列の決定は、対応するポリペプチドの一次配列、およびより具体的にはその遺伝子またはポリヌクレオチド配列によってコードされているポリペプチドまたはタンパク質の役割または活性を予測するのに役立つ。
【0016】
「単離された」という用語は、天然状態から「人間の手によって」変化を受けたことを意味する;すなわち、それが天然に発生する場合には、元々の環境から変えられたもしくは取り出された、またはその両方である。本明細書で用いられる用語では、例えば、天然状態の生きている動物、生物試料または環境試料に天然に存在するポリヌクレオチドまたはポリペプチドは、「単離されて」はいないが、天然状態で共存する物質から分離された同じポリヌクレオチドまたはポリペプチドは、「単離されて」いる。本明細書で用いられる用語では、そのようなポリヌクレオチドは、培養宿主細胞または生物体全体に導入された場合、天然に発生する形または環境ではないので、まだ単離されていることになる。同様に、ポリヌクレオチドおよびポリペプチドは、培地製剤(例えば、細胞にポリヌクレオチドまたはポリペプチドを導入するための溶液、または化学反応または酵素反応のための溶液)のような組成物中にも存在しうる。
【0017】
「ポリヌクレオチド」または「核酸配列」とは、ヌクレオチドのポリマー型を意味する。場合によっては、ポリヌクレオチドは、それが由来する生物体で天然に存在するゲノムでは直接に隣接する(5’末端で1つおよび3’末端で1つ)コード配列のいずれとも直接には隣接しない配列を指す。したがってこの用語は例えば、ベクター;自律的に複製するプラスミドまたはウイルス;または原核生物または真核生物のゲノムDNAに組み込まれた組み換えDNA、または他の配列とは独立した、分離した分子(例えば、cDNA)として存在する組み換えDNAも含む。本発明のヌクレオチドは、リボヌクレオチド、デオキシリボヌクレオチド、またはそのいずれかのヌクレオチドの修飾された形であり得る。本明細書におけるポリヌクレオチドは、特に、一本鎖および二本鎖DNA、一本鎖と二本鎖の領域が混在するDNA、一本鎖および二本鎖RNA、および一本鎖と二本鎖の部分が混在するRNA、一本鎖またはより通常には二本鎖であるか、一本鎖と二本鎖の部分が混在する、DNAおよびRNAのハイブリッド分子を指す。
【0018】
また、本明細書におけるポリヌクレオチドは、RNAもしくはDNAまたはRNAおよびDNAの両方を含む三本鎖領域を指す。そのような領域の鎖は、同一の分子または異なる分子に由来しうる。そのような領域には、1つまたは複数の分子の全体が含まれる可能性があるが、より一般的には分子のうちのある領域のみを含む。三重鎖領域の分子の1つはしばしばオリゴヌクレオチドである。ポリヌクレオチドまたは核酸という用語は、ゲノムDNAまたはRNA(生物体による、例えば、ウイルスのRNAゲノム)、およびゲノムDNAにコードされるmRNA、およびcDNAが含まれる。このように、本発明のライブラリーは、本明細書に記載されるような任意の核酸分子を用いて作製できる。
【0019】
上述のように、バイオテクノロジーおよび化学業界では現在、生物過程または化学過程を最適に実行できる分子(例えば、酵素)が求められている。環境試料中で新規の酵素を同定することは、この問題の1つの解決法である。環境試料中に存在する生物体、タンパク質および核酸配列のプロフィールを決定することによって、環境中におけるこれらの生物体またはタンパク質の役割に関する価値のある情報が提供できる。さらに、そのような情報は、産業的応用のための生物製剤、診断薬、治療薬および組成物の開発にも役立つ。確立されたおよび新興の化学、製薬、繊維、食品、飼料、洗剤市場で利用される全てのクラスの分子および化合物は、厳格な経済的および環境の基準に適合しなくてはならない。ポリマー、医薬品、天然製品、および農薬の合成は、有害な副産物を生成し、悪いまたは非効率的な触媒に影響される高価な過程によってしばしば妨げられている。例えば、酵素には触媒反応においてこれらの問題を克服できるいくつかの目覚ましい利点がある:単一の官能基にしか反応しない、単一の分子上の類似した官能基を区別する、および鏡像異性体の区別をする。さらに、生分解性であり、反応液中で、非常に低いモル比で機能する。その化学的特異性、部位特異性、および立体特異性のために、所望の選択的変換を最適に行なう独特な機会を与える。これらはしばしば、特に単一段階で、化学的に再現するのは非常に困難である。保護基が不要であること、選択性、単一の反応容器中で複数段階の変換を行なえること、同時に環境負荷が低減できることのために、化学および製薬業界において酵素の需要が増加してきた。酵素に基づく過程は、多くの従来の化学に基づく方法をしだいに置き換えてきた。さらに広範囲に産業用に使用されるための現在の弱みは、主に比較的少数の酵素が商業的に利用できることである。現在までに記述された>3000の非DNA修飾酵素のうち、約300の酵素(DNA修飾酵素を除く)が商業的に利用できるのみである。
【0020】
技術的な用途への酵素の利用も、要求の厳しい産業条件における性能が必要となる。これには、現在既知の酵素の集積が進化的に選択されなかった環境におけるまたは基質に対する活性が含まれる。しかし、天然の環境は、例えば極端な温度およびpHを含む極端な条件を提供する。いくつもの生物体が、部分的にはこれらの極端な条件に堪えられるポリペプチドを選択することによって、これらの条件に適合してきた。
【0021】
酵素は、生物体の環境内、温度、pH、塩濃度の条件下で、非常に特定の生物機能を発揮するという選択的圧力によって、進化してきた。多くの場合、これまでに記述された非DNA修飾酵素の活性は、利用できる系統発生の多様性の非常に小さな部分である、中温性の生物体から単離されてきた。生物触媒の動的な分野は、極端な環境で成育する微生物から単離された酵素の助けをもって、新しい次元を獲得する。そのような酵素は、地上の温泉および深海の熱水噴出口では100℃以上の温度、北極海では0℃以下の温度、死海では飽和塩濃度の環境、石炭鉱床および地熱の硫黄泉では0に近いpH、または下水汚泥では11以上のpHで機能する必要がある。例えば、生物体、ポリヌクレオチドおよびポリペプチド(例えば、酵素)を含む、極端な条件から得られた環境試料は、生物触媒に新しい分野を開拓する。また、試料中に存在するポリヌクレオチド配列に基づく環境試料のフィンガープリンティングまたはプロファイリングを行なうことによって、本発明は方向づけられた進化に役立つ進化の理解、生物多様性、分子生物学、バイオテクノロジーおよび産業的応用を提供する。
【0022】
産業用の新しい酵素に対するニーズに加え、新規の活性を持つ生理活性化合物に対するニーズも劇的に高まってきた。この需要は、主に全世界の人口統計的変化および現在使用できる抗生物質に耐性の病原体の数が増加する傾向に起因する。例えば、若年人口の高い新興国では抗菌薬の需要が上昇しているのに対し、米国のような高齢化の進行する国では、癌、糖尿病、関節炎、および他の衰弱性の疾病に対する薬のレパートリーを広げる必要がある。感染症による死亡率は、1980年から1992年までに58%増加しており、抗生物質に耐性の微生物の出現は、米国だけでも年間300億ドル以上も医療費を押し上げている。(Adamsら、Chemical and Engineering News、1995;Amannら、Microbiological Reviews、59、1995)。このような傾向に対応して、製薬会社は独特の活性または特異性を持つ化合物を求めて微生物の多様性のスクリーニングをかなり強化している。したがって本発明は、たとえば種々の微生物の消化管に存在する感染性微生物から、配列特異的な情報を得るために使用できる。
【0023】
したがって、本発明は感染因子および関連する生理活性化合物の供給源をプロファイリングおよび同定する方法を提供する。この情報は、特定の環境試料によって拡散または媒介される特定の疾病の治療における、化合物、治療薬および診断薬を開発するための重要な情報を提供する。例えば、冷却塔に存在する微生物および関連生理活性化合物の同定は、レジオネラおよび関連病原体の同定に役立ち得る。
【0024】
別の態様では、本発明の方法および組成物は、環境試料中に存在する薬剤のリード化合物の同定に役立つ。本発明の方法は、新規の薬剤を求めて環境を調べ、種々の微生物に含まれる関連薬物を同定する能力を提供する。例えば、海綿に見られる微生物のような海洋共生生物は、薬物化合物の貴重な供給源であり、本発明の方法の核酸供給源だと想像される。環境の調査の結果として同定または開発されたヌクレオチド、ペプチド、または他のポリマー分子のようなリード化合物(薬物候補)には、天然産物の集合、合成化学物質の集合、合成コンビナトリアルライブラリーを含め、いくつかの共通の供給源がある。各供給源にはそれぞれ長所と短所がある。これらの候補のスクリーニングプログラムの成功は、プログラムに入れる化合物の数に大きく依存しており、製薬会社は今日までにリード化合物を求めて何十万もの合成および天然の化合物のスクリーニングをしてきた。残念ながら、以前に発見された化合物に対する新規化合物の比は、時間とともに低下してきた。新規化合物の発見率は、製薬会社の最善の努力にもかかわらず、需要に追いついてはいない。潜在的薬物候補の新しい供給源を評価するニーズは非常に大きい。したがって、本発明は新規の薬物化合物を含む可能性のある環境試料の同定および解析のための素早く効率の良い方法を提供する。
【0025】
現在使用されている生理活性化合物の大部分は、土壌の微生物に由来する。土壌および他の複雑な生態的コミュニティに生息する多くの微生物は、その生存および繁栄能力を高めるような種々の化合物を作製する。これらの化合物は、一般に生物体の成長には必須ではないと考えられ、中間的代謝に関与する遺伝子の助けによって合成され、そのために「二次産物」という名を持つ。他の生物体の成長または生存に影響を与える二次代謝産物は、「生理活性」化合物として知られており、微生物およびマクロ生物のいずれにとっても、化学的防御の鍵となる化合物となる。ヒトは、広範囲の原核および真核病原体に対する活性を持つ抗生物質、抗感染薬、および他の生理活性化合物として、これらの化合物を活用してきた。微生物由来の約6,000の生理活性化合物が解析されており、その60%以上はStreptomyces属のグラム陰性土壌細菌によって作製される(Barnesら、Proc.Natl.Acad.Sci.USA 91、1994)。これらの中で、少なくとも70は生物医学および農業の用途に現在使用されている。生理活性化合物の最大のクラスであるポリケチドには、合わせると年商50億ドルを越す広範囲の抗生物質、免疫抑制剤および抗がん剤が含まれる。
【0026】
見掛け上は数多くの生理活性化合物が利用できるにもかかわらず、現代の生物医学の直面する最大の課題の1つが抗生物質耐性病原体の増殖であることは明らかである。世代時間が短く、遺伝情報を容易に交換する能力があるため、病原微生物は迅速に進化し、ほぼ全ての抗生物質のクラスに対する抵抗性の機構を広めた。例えば、現在ではただ1つの抗生物質、バンコマイシンでのみ治療できるヒト病原菌ブドウ球菌(Staphylococcus)および連鎖球菌(Streptococcus)の毒性株があり、この化合物に対する耐性は、耐性の腸球菌(Enterococcus)種からただ1つの遺伝子vanAが伝達されると発生する(Batesonら、System.Appl.Microbiol.12、1989)。新規の抗菌化合物に対する重要なニーズと、酵素阻害剤、免疫抑制剤、および抗がん剤に対する需要の増加を合わせると、どうして製薬会社が新規の性質を持つ生理活性化合物を求めて、多様な微生物のスクリーニングを強化してきたかが容易に理解できる。
【0027】
本発明は既知または未知の機能を持つ新規のポリペプチドをコードする新規の核酸配列を同定する方法を提供する。例えば、微生物ゲノムの多様性の多くは、微生物ゲノムにおける遺伝子クラスターの再配列の結果である。これらの遺伝子クラスターは、種を越えて存在したり、系統発生的に他の生物体と関連し得る。
【0028】
例えば、細菌および多くの真核生物は、その産物が関連する過程に関与する関連する遺伝子に、協調した機構を持っている。遺伝子は単一の染色体上で「遺伝子クラスター」と呼ばれる構造となって密集し、クラスター全体の転写を開始する単一のプロモーターを含む単一の調節配列の制御下で一緒に転写される。遺伝子クラスター、プロモーターおよび調節に機能する他の配列は、合わせて「オペロン」と呼ばれ、通常は2から6、最高20またはそれ以上の遺伝子を含む。このように、遺伝子クラスターは、通常は機能に関して、関連するまたは同一の隣接する遺伝子群である。
【0029】
いくつかの遺伝子ファミリーが、同一のメンバーからなる。集団になっている遺伝子は、必ずしも同一ではないが、集団化は遺伝子間の同一性を維持するための必要条件である。遺伝子クラスターは隣接する関連遺伝子が重複した極端なものから、何百もの同一の遺伝子が縦列しているものまである。特定の遺伝子の繰り返しに、意義が見いだされない場合もある。その代表例は、哺乳類の他の種では単一のインスリン遺伝子が適切であるのに、ある種ではインスリン遺伝子が重複して発現するものである。
【0030】
さらに、遺伝子クラスターは継続的に再構成されている。そのため、例えば細菌または他の原核生物から遺伝子クラスターの非均質ライブラリーを作製する能力は、新規のタンパク質、特に例えば数多くの有用な活性を持つポリケチドの合成を担うポリケチド合成酵素のような酵素の供給源を決定するために価値がある。例えば、抗生物質、抗ウイルス薬、抗腫瘍薬およびインスリンのような調節タンパク質を含む、他の種類の遺伝子クラスターの産物のタンパク質も予測される。
【0031】
一例として、ポリケチド合成酵素は、1つの遺伝子クラスターにある。ポリケチドは、抗生物質(テトラサイクリンやエリスロマイシンなど)、抗がん剤(ダウノマイシン)、免疫抑制剤(FK506およびラパマイシン)、および動物薬(モネンシン)を含む生理活性の非常に豊かな供給源となる分子である。多くのポリケチド(ポリケチド合成酵素に作製される)は、治療薬として価値が高い。ポリケチド合成酵素は、長さおよび機能や環化のパターンが異なる多様な炭素鎖の生合成を触媒する、多機能酵素である。ポリケチド合成酵素遺伝子は、遺伝子クラスターとなっており、少なくとも1つのタイプ(タイプIと呼ばれる)のポリケチド合成酵素は、大きなサイズの遺伝子および酵素を持っており、遺伝子操作やこれらの遺伝子/タンパク質のインビトロ研究を複雑なものにしている。
【0032】
研究する新規のポリケチドを作製するために、ポリケチドおよびポストポリケチド生合成遺伝子のライブラリーから所望の成分を選択し組み合せる能力は、魅力的である。本発明の方法では、大きな挿入物(特にF因子ベースのベクターを使用する場合)を含むクローンで遺伝子バンクを作製できるので、遺伝子クラスターのクローニングが容易になるため、本発明の方法は新規のポリケチド合成酵素のクローニングを可能にし、容易にする。
【0033】
例えば、遺伝子クラスターの核酸をベクターに連結する。ベクターはさらに、連結された遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレイの活性の作製を制御および調節する発現調節配列も含み得る。外来核酸の導入収容力が特に大きいベクターは、そのような遺伝子クラスターに使用するのに特に適しており、本明細書では大腸菌(E.coli)のF因子(または稔性因子)を含む例によって記述されている。大腸菌(E.coli)のこの因子は接合時に高頻度で起こるそれ自身の移動に影響を与えるプラスミドで、微生物の混合試料由来の遺伝子クラスターのような、大きな核酸断片を安定的に増やすために理想的である。
【0034】
これらの試料(例えば、微生物の混合集団)由来またはこれから単離された核酸は、好ましくはポリヌクレオチドのスクリーニングまたはハイスループットシーケンシングの前にベクターまたはプラスミドに挿入される。そのようなベクターまたはプラスミドは、通常はプロモーター、エンハンサーなどを含む発現調節配列を含んでいる。
【0035】
したがって、本発明はインビトロで関心対象の酵素活性および生理活性を求めて環境試料をクローニングしスクリーニングする新規のシステムを提供する。本発明の方法では、インビトロで新規の生理活性分子、特に非培養および培養試料由来の新規の生理活性分子のクローンニングおよび発見が可能になる。本発明の方法を用いると、大きなサイズの遺伝子クラスター、遺伝子および遺伝子断片がクローニング、配列決定、およびスクリーニング可能である。以前の戦略とは異なり、本発明の方法によると、広範囲の環境試料から、インビトロでポリヌクレオチドおよびこれらのポリヌクレオチドにコードされるポリペプチドをクローニング、同定、プロファイリング、および利用できる。
【0036】
本発明は、関心対象の酵素活性および生理活性をコードする遺伝子の、複雑な環境試料からのスクリーニングおよび同定を可能にする。これらの試料から作製されたDNAライブラリーは、試料中に存在する核酸の集団を表す。ライブラリーは、核酸配列を含むかぎり、無細胞試料から作製可能であり、細胞性の生物体またはウイルス粒子を含む試料からも作製可能である。ライブラリーを調製できる元になる生物体には、真正細菌(Eubacteria)および古細菌(Archaebacteria)のような原核微生物、真菌、ある種の藻類およびプロトゾアのような下等真核微生物、ならびに植物、植物胞子および花粉の混合物が含まれる。生物体は環境試料から得られた培養生物体または非培養生物体でよく、そのような生物体は好熱菌、超好熱菌、好冷菌、低温細菌のようなエクストレモフィルでよい。
【0037】
以前に示されたように、ライブラリーは環境試料から作製でき、この場合は核酸は生物体の培養なしに回収するか、培養生物体から回収できる。
【0038】
DNAライブラリーを構築するために使用する核酸供給源は、北極および南極の氷、水、永久凍土層から得られた微生物試料、火山由来の材料、熱帯の土壌または植物由来の材料、哺乳類、無脊椎動物を含む種々の生物体の糞、ならびに死体および腐敗物などのような環境試料が含まれるがこれらに限定されることはないと予想される。したがって、例えば培養または非培養生物体から核酸を回収し、適切なDNAライブラリー(例えば、組み換え発現ライブラリー)を作製し、その後、特定のポリヌクレオチド配列を同定したり、酵素活性をスクリーニングしたりできる。
【0039】
以下は、培養および非培養生物体ならびに生物体の混合集団からライブラリーを作製する一般的な手順の概要を示す。ライブラリーは同定されたまたは予測される生物活性(例えば、酵素活性)を持つ核酸配列を選択するために、プロービング、配列決定、およびスクリーニングできる。
【0040】
環境試料、核酸供給源、および単離
本明細書では、環境試料は生物体またはポリヌクレオチドまたはその組み合せを含む任意の試料である。したがって、環境試料は、例えば昆虫の糞を含む任意の数の供給源(上記)から得られる。精製または非精製の核酸の任意の供給源が開始材料として使用できる。したがって、核酸は生物体が汚染している任意の供給源、または細胞を含む任意の試料から得られる。環境試料は、任意の哺乳類の血液、尿、脊髄液、組織、膣スワブ、糞、羊水、または口内うがい液のような体液試料から抽出できる。非哺乳類(例えば、無脊椎動物)では、試料は、組織試料、唾液試料、糞または生物体の消化管中の材料でよい。環境試料には、例えば、硫黄泉、火山口、凍土帯の様な極端な環境から得られた試料も含まれる。また、試料は多様な供給源由来であり得る。例えば、園芸および農業試験では、試料は植物、肥料、土壌、液体、または他の園芸もしくは農業産物でよい;食品試験では、試料は生の食品または加工食品(例えば、乳児用ミルク、海産物、生鮮食料品、および包装された食品)でよい;環境試験では、試料は液体、土壌、下水処理、汚泥、および生物体またはポリヌクレオチドを含むと考えられるまたは疑われる任意の他の環境中の試料で良い。
【0041】
試料が、例えば血液、土壌および汚泥のような物質の混合物(例えば、生物体の混合集団)である場合には、細胞を開き、核酸の鎖を露出または分離するために有効な適切な試薬で処理できる。この溶菌および核酸変性段階は必ずしも必要ではないが、これによりクローニング、増幅、または配列決定がより容易に行なえる。さらに、特定の集団を精製するために、混合群を分析前に培養して純粋な試料が得られるようにしても良い。しかし、これは必ずしも必要ではない。
【0042】
したがって、試料は、例えば生物体の多様な混合集団(例えば、昆虫の消化管に存在する微生物)に由来する核酸を含む。核酸は、任意の数のDNAおよびRNA単離方法を用いて、試料から単離される。そのような核酸単離方法は、当技術分野で実施されている。核酸がRNAの場合には、当技術分野で周知のプライマーを用いてRNAをDNAに逆転写できる。DNAがゲノムDNAの場合には、25ゲージの針を用いて、DNAを剪断する。
【0043】
クローニングおよび形質転換
その後、適切なベクターを用いて核酸をクローニングする。使用されるベクターは、DNAが発現されるか、増幅されるか、配列決定されるか等に依存する(例えば、ハイスループットシーケンシングベクターを開示する米国特許第6,022,716号参照)。クローニング技術は当技術分野で周知であるか、過度の実験なしに当業者によって開発され得る。ベクターの選択も、ポリヌクレオチド配列のサイズおよび本発明の方法に使用される宿主細胞に依存する。したがって、本発明で使用されるベクターは、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど)、またはその一部(例えば、コートタンパク質、スパイク糖タンパク質、コスミドタンパク質)である可能性がある。例えば、コスミドおよびファージミドは、大きなポリヌクレオチドを安定的に増殖できるので、分析または修飾する特定の核酸配列がより大きな場合に好ましい。
【0044】
核酸配列の混合物がベクターにクローニングされると、各ベクターを宿主細胞に導入し、宿主細胞にベクターを増幅させることによって、クローンの増幅ができる。これは、核酸配列の絶対数は増加するものの、ハイブリッドの数は増えないので、クローン増幅と呼ばれる。
【0045】
クローニングされたDNA配列を含むベクターは、その後適切な宿主細胞にベクターをトランスフェクトすることにより増幅できる(例えば、大腸菌(E.coli)宿主にファージ)。または(または増幅の後に)、クローニングされたDNA配列を用いて、適切な生物体を形質転換することによってスクリーニングまたは配列決定するためのライブラリーを調製する。標的核酸を含むベクターを、形質転換を助ける条件下で接種することにより人工的に導入して、当技術分野で周知の宿主を形質転換する。二本鎖の環状または直線状の核酸により形質転換したり、場合によっては一本鎖の環状または直線状核酸配列により形質転換することができる。形質転換という用語は、新しいDNA(すなわち、細胞にとって外来のDNA)の組み込み後に、細胞中で永久または一過性の遺伝的変化が導入されることを意味する。細胞が哺乳類細胞の場合には、永久の遺伝的変化は、通常、DNAが細胞のゲノムに導入されることで起きる。形質転換された細胞または宿主細胞というのは、一般的に、宿主生物体に通常は存在しないDNA分子が組み換えDNA技術によってそれに(またはその祖先に)導入された細胞(例えば、原核または真核)を指す。
【0046】
本発明で使用される特定のタイプのベクターには、F因子の複製開始点が含まれている。大腸菌(E.coli)のF因子(または稔性因子)はプラスミドで、これのおかげで接合中にF因子自身は高頻度で移動し、細菌の染色体自身はより低い頻度で移動する。ある特定の態様では、「フォスミド」またはBAC(バクテリア人工染色体)ベクターと呼ばれるクローニングベクターが使用される。これらは大腸菌(E.coli)のF因子由来で、大きなDNA部分を安定的に組み込むことができる。非培養環境混合試料のDNAを組み込むと、安定な「環境DNAライブラリー」の形で大きなゲノム断片が得られる。
【0047】
混合集団または試料由来の核酸は、種々の手法によってベクター中に挿入できる。一般に、核酸配列は当技術分野で周知の手順により適切な制限エンドヌクレアーゼ部位に挿入される。そのような手順および他の手順は、当業者の範囲だと考えられる。典型的なクローニングシナリオは、適切なヌクレアーゼ(例えば、ヤエナリヌクレアーゼ)を用いてDNAを「ブラント」にし、例えばEcoRIメチラーゼなどでメチル化し、EcoRIリンカー
に連結する。リンカーはその後EcoRI制限エンドヌクレアーゼで消化し、DNAサイズを分画する(例えば、蔗糖勾配を用いる)。得られたサイズ分画したDNAを、それから配列決定、スクリーニング、または発現のために適切なベクターに連結する(例えば、λベクター、インビトロλパッケージングエキストラクトを用いてパッケージングする)。
【0048】
組み換えDNAを用いた宿主細胞の形質転換は、当業者に周知の通常の方法で実行できる。宿主が大腸菌(E.coli)のような原核生物の場合には、DNAの取り込み能力のあるコンピテント細胞は、指数増殖期の後で採集し、その後当技術分野で周知の手順でCaCl2処理を行なって調製できる。または、MgCl2またはRbClが使用できる。形質転換は、宿主細胞のプロトプラスト形成後、または電気穿孔法によっても行なえる。
【0049】
宿主が真核生物の場合には、DNAのトランスフェクションまたは形質転換法には、リン酸カルシウム共沈、マイクロインジェクションのような通常の機械的方法、電気穿孔法、リポソームにつつまれたプラスミドの導入、ウイルスベクター、ならびに他の当技術分野で周知の方法が含まれる。真核細胞は、単純ヘルペスウイルスチミジンキナーゼ遺伝子のような選択マーカーをコードする第2の外来DNA分子と共にトランスフェクトしても良い。また別の方法は、シミアンウイルス40(SV40)またはウシパピローマウイルスのような真核ウイルスベクターを用いて、真核細胞を一時的に感染または形質転換させ、タンパク質を発現するものである。(「真核ウイルスベクター(Eukaryotic Viral Vectors)」Cold Spring Harbor Laboratory、Gluzman編、1982)。通常は、真核宿主が宿主細胞として利用される。真核細胞は酵母細胞(例えば、Saccharomyces cerevisiae)、昆虫細胞(例えば、ショウジョウバエ(Drosophila)種)、またはヒト細胞を含む哺乳類細胞で良い。
【0050】
真核生物系、および哺乳類発現系では、発現された哺乳類タンパク質の翻訳後修飾が可能である。一次転写物のプロセッシング、グリコシル化、リン酸化、および好ましくは遺伝子産物の分泌のための細胞機構を持った真核細胞が使われると良い。そのような宿主細胞株には、CHO、VERO、BHK、HeLa、COS、MDCK、Jurkat、HEK−293およびWI38が含まれる可能性があるが、これらに限定されるわけではない。
【0051】
本明細書に記載されるライブラリーは、細菌、真菌、植物細胞、昆虫細胞および動物細胞中に含まれ得る。例えば、宿主細胞には、大腸菌(E.coli)、バチルス(Bacillus)、連鎖球菌(Streptomyces)、またはネズミチフス菌(Salmonella typhimurium)細胞;Sccharomyces sp.のような酵母細胞;ショウジョウバエ(Drosophila)S2細胞またはスポドプテラ(Spodoptera)S9細胞;またはCHO細胞、COS細胞またはBowesメラノーマ細胞が含まれるがこれらに限定されることはない。
【0052】
本発明の方法で利用されるライブラリーには、少なくとも約104クローン、および好ましくは約104から1010クローンが含まれる。ライブラリーは、少なくとも約105、106、107、108、109または1010クローンまたはその間の任意の数のクローンが含まれ得る。
【0053】
本発明の方法で利用されるライブラリーは、約0.01から1010の、好ましくは約0.1から109の;約0.1を上回る;および約1.0を上回る多様度指数を持つ。
【0054】
ライブラリーのクローンには、約0.5kbから10kb;約1kbから8kb;約1kbから7kb等の核酸挿入物が含まれる。当業者はクローン挿入物の片端または挿入物の両端から配列決定を開始できることを理解する必要がある。
【0055】
配列決定
ライブラリーの適切な数のクローン(例えば、1〜1000またはそれ以上のクローン、通常は約100)を入手し、ハイスループットシーケンシング法を用いてその配列を決定する。配列決定の方法は、本発明の限定因子ではない。特定のクローニングされたDNA配列の配列を同定するために役立つ任意の方法が使用できる。一般に、配列決定は、DNA複製の自然な過程を応用したものである。したがって、鋳型(例えば、ベクター)およびプライマー配列が使用される。1つの一般的な鋳型調製および配列決定プロトコールは、細菌のコロニーの自動ピッキングから始まるが、この各コロニーには配列決定反応の鋳型の働きをする別個のDNAクローンが含まれている。選択されたコロニーを培地に入れて、一晩増殖させる。その後、細胞からDNA鋳型を精製し、水に懸濁する。DNAの定量後、Applied Biosystems、Inc.、Prism 377 DNAシーケンサーのようなシーケンサーを用いてハイスループットシーケンシングが行われる。その後、得られた配列データは、データベースの検索に使用される。
【0056】
データベース検索およびアライメントアルゴリズム
特定のポリヌクレオチド配列によってコードされる活性を同定または決定するために、本発明では、核酸配列および/または推定アミノ酸配列を含むいくつかのデータベースが利用できる。調べる配列の全てまたは代表的な部分(例えば、約100の個別クローン)を用いて、同時または別個に配列データベース(例えば、GenBank、PFAMまたはProDom)の検索を行なう。そのような配列検索の実施方法は、当技術分野でいくつか知られている。データベースは特定の生物体または生物体の集合に特異的なものであり得る。例えば、線虫(C.elegans)、アラビドプシス(Arabidopsis)種、M.ゲニタリウム(genitalium)、M.ジャナスチー(jannaschii)、大腸菌(E.coli)、インフルエンザ菌(H.influenzae)、酵母(S.cerevisiae)およびその他用のデータベースが存在する。それから、2つまたはそれ以上の配列の間の相同性を測定するように設計されたアルゴリズムを用いて、クローンの配列データをデータベースの配列と比較する。
【0057】
そのような配列アラインメント法には、例えばBLAST (Altschulら、1990)、BLITZ (MPsrch)(SturrockおよびCollins、1993)、およびFASTA (PersonおよびLipman、1988)が含まれる。プローブ配列(例えば、クローンの配列データ)は任意の長さで良く、相同性の閾値に基づいて、相同と認識される。閾値は事前に決定することができるが、そうでなくても良い。閾値は特定のポリヌクレオチドの長さに基づき得る。配列のアライメントには、いくつかの異なる手順が使用できる。通常は、Smith−WatermanまたはNeedleman−Wunschアルゴリズムが使用される。しかし、上記のようにBLAST、FASTA、PSI−BLASTも使用できる。
【0058】
例えば、比較ウィンドウを並べるための最適の配列アライメントは、Smithの局所的相同性アルゴリズム(SmithおよびWaterman、Adv Appl Math、1981; SmithおよびWaterman、J Teor Biol、1981; SmithおよびWaterman、J Mol Biol、1981; Smithら、J Mol Evol、1981)、Needlemanの相同性アライメント法(NeedlemanおよびWunsch、1970)、Pearsonの類似性の検索法(PearsonおよびLipman、1988)、これらのアルゴリズムのコンピュータによる実行(Wisconsin Genetics SoftwarePackage Release 7.0、Genetics Computer Group、575 Science Dr.、Madison、WIまたはGenetics Computer Group、University of Wisconsin、Madison、WIのSequence Analysis Software PackageのGAP、BESTFIT、FASTA、およびTFASTA)、または観察によって行い、種々の方法によって作製された最適のアライメント(すなわち、比較ウィンドウに渡って最高の割合の相同性が得られる)を選択する。そして2つの配列(すなわちプローブ配列およびデータベース配列)の類似性が予測できる。
【0059】
そのようなソフトウェアは、相同性の度合いを種々の欠失、置換、および他の修飾に割り当てて、類似の配列を合わせる。2つまたはそれ以上の核酸またはポリペプチド配列における「相同性」および「同一性」は、任意の数の配列比較アルゴリズムを用いるか、手で並べて目視して測定した場合に、比較ウィンドウまたは指定の領域に渡って、対応が最大になるように比較及び整列させたときに、同一であるか特定の割合で同一のアミノ酸残基またはヌクレオチドを持つ、2つまたはそれ以上の配列またはサブ配列を指す。
【0060】
配列の比較には、通常は1つの配列が参照配列となり、試験配列がこれと比較される。配列比較アルゴリズムを使用するときは、試験および参照配列をコンピュータに入力し、必要ならばサブ配列座標を指定し、配列アルゴリズムプログラムのパラメータを指定する。デフォルトのプログラムパラメータを使用するか、別のパラメータを指定することができる。そして配列比較アルゴリズムはプログラムパラメータに基づいて、参照配列と比較した試験配列の配列の同一性の割合を計算する。
【0061】
本明細書における「比較ウィンドウ」は、20から600、通常は約50から200、さらに通常は約100から約150からなる群から選択される任意の数の連続する位置の区画を指し、ここで1つの配列が同数の連結する位置を持つ参照配列と最適に並べられた後、2つの配列が比較される。
【0062】
有用なアルゴリズムの一例は、BLASTおよびBLAST 2.0アルゴリズムであり、これらはAltschulら、Nuc.Acids Res.25:3389−3402 (1997)およびAltschulら、J.Mol.Biol.215:403−410 (1990)にそれぞれ記述されている。BLAST分析を行なうためのソフトウェアは、National Center for Biotechnology Information(http://ncbi.nlm.nih.gov/)から一般に公開されている。このアルゴリズムでは、まずデータベース配列中の同じ長さのワードと並べたときに一致するか、ある正の値の閾値Tを満足する長さWの短いワードをクエリー配列において同定することにより、高スコア配列ペア(HSP)を同定する。Tは近傍ワードスコア閾値と呼ばれる(Altschulら、上記)。これらの初期の近傍ワードヒットは、これらを含むさらに長いHSPを見つけるための検索を開始するシードとなる。ワードのヒットは累積アライメントスコアが増加するかぎり、各配列に沿って両方向に延長される。累積スコアは、ヌクレオチド配列の場合には、パラメータM(一致する残基のペアの報酬スコア;常に>0)を用いて計算される。BLASTアリゴリズムのパラメータW、TおよびXは感度およびアライメントのスピードを決定する。BLASTNプログラム(ヌクレオチド配列用)は、デフォルトとしてワード長は11、期待(E)は10、M=5、N=4、および両鎖の比較を用いる。
【0063】
BLASTアルゴリズムは、2つの配列の類似性の統計解析も行なう(KarlinおよびAltschul、Proc.Natl.Acad.Sci.USA 90:5873 (1993)参照)。BLASTアルゴリズムが提供する類似性の1つの尺度は、最小合計率(smallest sum probability)(P (N))で、これは2つのヌクレオチド配列の一致が偶然に発生する確率の指標となる。例えば、試験核酸と参照核酸の比較において最小合計率が約0.2未満、より好ましくは約0.01未満、最も好ましくは約0.001未満であれば、その核酸は参照核酸と類似していると認められる。
【0064】
配列の相同性は、2つのポリヌクレオチド配列が比較ウィンドウに渡って相同(ヌクレオチドごとに)であることを意味する。配列の同一性または相同性の割合は、比較ウィンドウに渡って最適に並べられた2つの配列を比較し、両方の配列で同一の核酸塩基(例えば、A、T、C、G、UまたはI)がある位置の数を決定して一致する位置の数を求め、一致した位置の数を比較ウィンドウ内の位置の合計数(ウィンドウサイズ)で割り、その結果を100倍して配列の相同性の百分率を求めて計算される。この実質的な相同性は、ポリヌクレオチド配列の特性を意味し、このポリヌクレオチドは少なくとも25〜50ヌクレオチドの比較ウィンドウの参照配列と比較して、少なくとも60%の配列相同性、通常は少なくとも70%、しばしば80から90%、最も一般的には少なくとも99%の配列相同性を持つが、配列の相同性は、比較ウィンドウに渡って参照配列の合計20%またはそれ以下の欠失または付加を含む可能性のあるポリヌクレオチド配列を、参照配列と比較して計算される。
【0065】
十分な相同性を持つ配列は、例えば種および活性の情報を含む、データベース中の注釈によってさらに同定できる。したがって、通常の環境試料では、複数の核酸配列が獲得、クローニング、配列決定され、データベースから対応する相同配列が同定される。この情報は、データベース情報に基づくとその配列またはその配列にコードされる任意のポリペプチドに関連する生物体および活性を含め、ポリヌクレオチドに関連する1つまたは複数の特徴を含む、試料中に存在するポリヌクレオチドのプロフィールを提供する。本明細書で使用される「フィンガープリント」または「プロフィール」は、各試料は、試料およびそれが由来する環境に特徴的なポリヌクレオチドのセットを持つという事実を意味する。そのようなプロフィールは、試料中に存在する配列の量と種類、ならびにポリヌクレオチドが由来する生物体およびそのポリヌクレオチドによってコードされる潜在的活性に関する情報を含み得る。この独特のパターンが各試料のプロフィールまたはフィンガープリントである。
【0066】
場合によっては、特定のクローニングされたポリヌクレオチド配列の正体および活性が決定されるか示唆される正体または活性がポリヌクレオチドと関連づけられると、その配列を発現するのが望ましいことがある。そのような場合、所望のクローンがまだ発現ベクターにクローニングされていなければ、これを調節制御要素(例えば、プロモーターまたはエンハンサー)の下流に連結し、適切な宿主細胞にクローニングする。発現ベクターは、本発明で使用される対応する宿主細胞とともに、市販されている。
【0067】
使用できる発現ベクターの代表例としては、ウイルス粒子、バキュロウイルス、ファージ、プラスミド、ファージミド、コスミド、フォスミド、バクテリア人工染色体、ウイルス核酸(例えば、ワクシニア、アデノウイルス、鶏痘ウイルス、偽狂犬病、およびSV40の誘導体)、P1ベースの人工染色体、酵母プラスミド、酵母人工染色体、および関心対象の特定の宿主(バチルス、アスペルギルス、酵母等)に特異的な任意の他のベクターがある。したがって、例えばポリペプチドの発現のために種々の発現ベクターの任意の1つにDNAを導入できる。そのようなベクターには、染色体性、非染色体性、および合成のDNA配列が含まれる。当業者には数多くの適切なベクターが知られており、市販されている。以下のベクターは、例として挙げられる;細菌用:pQE70、pQE60、pQE−9 (Qiagen)、psiX174、pBluescript SK、pBluescript KS、pNH8A、pNH16a、pNH18A、pNH46A (Stratagene); pTRC99a、pKK223−3、pKK233−3、pDR540、pRIT5 (Pharmacia);真核細胞用:pWLNEO、pSV2CAT、pOG44、pXT1、pSG (Stratagene)、pSVK3、pBPV、pMSG、pSVL (Pharmacia)。しかし、宿主中で複製可能で生存できるかぎり、任意の他のプラスミドまたはベクターも使用できる。
【0068】
発現ベクター中の核酸配列は、mRNA合成を指揮するために、適切な発現制御配列(プロモーター)に機能的に連結される。特に名前が付けられた細菌のプロモーターには、lacI、lacZ、T3、T7、gpt、λPR、PLおよびtrpが含まれる。真核細胞のプロモーターには、CMV IEプロモーター、HSVチミジンキナーゼ、SV40初期および後期プロモーター、レトロウイルスのLTR、およびマウスメタロチオネイン−Iが含まれる。適切なベクターおよびプロモーターの選択は、当業者のレベルの範囲内である。発現ベクターは、翻訳開始のためのリボソーム結合部位および転写終結因子も含む。ベクターには、発現の増幅のために適切な配列も含まれることがある。プロモーター領域は、CAT(クロラムフェニコールトランスフェラーゼ)ベクターまたは選択可能マーカーを持つ他のベクターを用いて、任意の遺伝子から選択することができる。
【0069】
また、発現ベクターは、真核細胞培養ではジヒドロ葉酸レダクターゼまたはネオマイシン耐性、または大腸菌(E.coli)ではテトラサイクリンまたはアンピシリン耐性のような、形質転換した宿主細胞の選択のための表現型の形質を提供する1つまたは複数の選択可能マーカー遺伝子を好ましくは含む。
【0070】
上述のようにして選択、クローニング、および配列決定した核酸配列は、さらに所望の酵素活性のスクリーニングを行なうライブラリーの調製のために、適切な宿主に導入できる。選択された核酸は、好ましくはすでに適当な制御配列を含むベクター中にあり、そのため、酵素をコードする選択された核酸は、所望の活性を検出するために発現できることになる。宿主細胞は、哺乳類細胞のような高等真核細胞、または酵母細胞のような下等真核細胞、または宿主は細菌細胞のような原核細胞であり得る。適切な宿主の選択は、本明細書の教えから、当業者の範囲であると考えられる。
【0071】
ライブラリーは、当技術分野で周知の手順によって特定の酵素活性に関してスクリーニングできる。例えば、6つのIUVクラス;酸化還元酵素、転移酵素、加水分解酵素、脱離酵素、異性化酵素、および合成酵素のうちの1つまたは複数についてスクリーニングできる。1つまたは複数のIUBクラスに陽性であること判断された組み換え酵素は、その後さらに具体的な酵素活性についてスクリーニングされる。または、さらに特化した酵素活性についてライブラリーのスクリーニングができる。例えば、加水分解酵素活性の一般的なスクリーニングの代わりに、より具体化した活性、すなわち加水分解酵素が作用する結合の種類についてスクリーニングができる。このようにして、例えば、(a) アミド(ペプチド結合)、すなわちプロテアーゼ;(b) エステル結合、すなわちエステラーゼおよびリパーゼ;(c) アセタール、すなわちグリコシダーゼのような1つまたは複数のさらに特定の化学的機能に作用する加水分解酵素を確実にするためにスクリーニングできる。
【0072】
場合によっては、試料中に存在する核酸配列または単離された特定のクローンの増幅を行なうことが望ましい場合がある。この態様では、核酸配列はPCR反応または当業者に周知の他の類似反応によって増幅される。そのような増幅反応を行なうために、増幅キットが市販されている。
【0073】
さらに、アライメントアルゴリズムおよび検索可能なデータベースが、コンピュータのハードウェア、ソフトウェア、またはその組み合せで実行できることを認識することが重要である。結果的に、核酸配列およびその配列にコードされる対応するポリペプチドの単離、処理、および同定は、自動化システムで実行できる。
【0074】
または、本発明の方法にしたがって獲得、同定、およびクローニングしたポリヌクレオチド配列を変化させることが望ましい場合がある。そのような変化によって、コードされるポリペプチドの活性、特異性、親和性、機能等を修飾(例えば、増加または減少)させるために、ポリヌクレオチド配列を修飾できる。特定の試料中の多様性を増加させるために、DNAシャッフリングが使用できる。DNAシャッフリングは、実質的に相同であるが同一ではない配列の間の組み換えを示すが、一部の態様では、cer/loxおよび/またはflp/frtシステムなどのようなDNAシャッフリングは非相同組み換えによるクロスオーバーを伴う可能性がある(例えば、1999年8月17日にDr.Jay Shortに付与され、Diversa Corporationに譲渡された米国特許第5,939,250号参照、この開示は参照として本明細書に組み入れられる)。シャッフリング、変異導入またはポリヌクレオチド配列を変化させる種々の方法は、以下に論じられている。
【0075】
核酸シャッフリングは、ポリヌクレオチドを作製するための、より短いまたは小さいポリヌクレオチドのプールのインビトロまたはインビボ相同組み換えの方法である。関連する核酸配列またはポリヌクレオチドの混合物にセクシャルPCRを施し、ランダムなポリヌクレオチドを提供し、リアセンブリーさせてライブラリーまたは組み換えハイブリッド核酸分子またはポリヌクレオチドの混合集合を作り出す。
【0076】
カセット変異法とは対照的に、シャッフリングおよびエラープローンPCRのみが、配列のプールに盲目的に(プライマー以外の配列情報なしに)変異を誘導できる。
【0077】
繰り返し選択に関して、本発明のシャッフリング変異法がエラープローンPCR単独よりも優れている点は、以下のように説明できる。エラープローンPCR(セクシャルPCRではない)とDNAシャッフリングを比較する。選択されたプール配列の最初のライブラリーは、多様な起源の関連する配列からなり、単一の遺伝子の任意のタイプの変異誘導(シャッフリングを含む)によって導かれうる。選択された配列の集合は、第1回の活性選択後に得られる。シャッフリングによると、例えば関連する配列全ての自由なコンビナトリアルな会合が可能になる。
【0078】
この方法は、逆連鎖反応であるという点で、エラープローンPCRとは異なる。エラープローンPCRでは、ポリメラーゼ開始部位の数および分子数は対数的に増加する。しかし、ポリメラーゼ開始部位の配列および分子の配列は、基本的に同じである。これとは対照的に、ランダムなポリヌクレオチドの核酸リアセンブリーまたはシャッフリング では、開始部位の数およびランダムなポリヌクレオチドの数(サイズではない)は、時間が経つと低下する。プラスミド全体に由来するポリヌクレオチドでは、理論的な終点は単一の大きなコンカテマー分子である。
【0079】
クロスオーバーは相同部位で起きるため、組み換えは主に同一の配列ファミリーのメンバー間で発生する。これにより著しく不適合(例えば、異なる活性または特異性を持つ)の配列間の組み合せが起こりにくくなる。複数の配列ファミリーを同一の反応でシャッフリングできると考えられる。さらに、一般にシャッフリングは相対的な順序を保存する。
【0080】
珍しいシャフラントは最良の分子(例えば、活性または特異性が最大)を数多く含んでおり、これらの珍しいシャフラントはその優れた活性または特異性に基づいて選択できる。
【0081】
100の異なるポリペプチド配列のプールには、最高103の異なる並べ替え方があり得る。この大きな順列数は、単一のDNA配列ライブラリーでは表せない。したがって、配列の長さと、望む配列多様性に応じて、複数回のDNAシャッフリングおよび選択が必要だと考えられる。
【0082】
これとは対照にエラープローンPCRは全ての選択された配列を、同じ相対的方向に保存するので、はるかに小さな変異群を生成することになる。
【0083】
本発明の方法で使用できる鋳型ポリヌクレオチドは、DNAまたはRNAでよい。遺伝子のサイズまたは組み合せもしくはリアセンブリーするより短いポリヌクレオチドに応じて、種々の長さであり得る。好ましくは、鋳型ポリヌクレオチドは50bpから50kbである。関心対象のタンパク質をコードする核酸を含むベクター全体を本発明の方法で使用できると予測され、実際に使用して成功を収めている。
【0084】
鋳型ポリヌクレオチドはPCR反応(米国特許第4,683,202号および米国特許第4,683,195号)または他の増幅またはクローニング方法によって得られる。しかし、PCR産物のプーリングおよびセクシャルPCRの前にPCR産物から遊離プライマーを除去するほうが、より効率の良い結果となる可能性がある。セクシャルPCRの前に元のプールからプライマーを適切に除去しないと、クロスオーバークローンの発生頻度が低下する。
【0085】
鋳型ポリヌクレオチドはしばしば二本鎖である。得られる一本鎖ポリヌクレオチドの領域が互いに相補的であり、ハイブリダイズして二本鎖分子を形成するように、二本鎖核酸分子が推奨される。
【0086】
鋳型ポリヌクレオチドと同一の領域および鋳型ポリヌクレオチドと異種の領域を持つ一本鎖または二本鎖核酸ポリヌクレオチドを、この段階で鋳型ポリヌクレオチドに添加できる。異なるが関連する2つのポリヌクレオチド鋳型も、この段階で混合できると考えられる。
【0087】
二本鎖ポリヌクレオチド鋳型および任意の添加された二本鎖または一本鎖ポリヌクレオチドは、約5bpから5kbまたはそれ以上の混合物を提供するために、減速または停止を含めたセクシャルPCRにかけられる。好ましくはランダムポリヌクレオチドのサイズは約10bpから1000bp、さらに好ましくはポリヌクレオチドのサイズは約20bpから500bpである。
【0088】
または、複数のニックを持つ二本鎖核酸も本発明の方法に使用できる。ニックとは、二本鎖核酸のうちの一本鎖に裂け目が入ったものである。そのようなニックの間の距離は、好ましくは5bpから5kb、より好ましくは10bpと1000bpの間である。これによって、セルフプライミングの領域が提供され、より短いポリヌクレオチドが生成して、例えばランダムプライマーから得られるポリヌクレオチドとともに含まれることになる。
【0089】
任意の特定のポリヌクレオチドの濃度は、ポリヌクレオチド全体の重量の1%以下、より好ましくは任意の特定の核酸配列は、全核酸重量の0.1%以下である。
【0090】
混合物中の異なるポリヌクレオチドの数は、少なくとも約100、好ましくは少なくとも約500、およびさらに好ましくは少なくとも約1000である。
【0091】
この段階で、ポリヌクレオチドの混合物の異質性を高めるために、ランダムの二本鎖のより短いポリヌクレオチドに、合成または天然の一本鎖または二本鎖ポリヌクレオチドを添加しても良い。
【0092】
またこの段階で、セクシャルPCRプロセスで得られたポリヌクレオチドに、無作為に破壊した二本鎖ポリヌクレオチド群を混合し、選択的にさらに1回またはそれ以上のセクシャルPCRサイクルを行なっても良い。
【0093】
鋳型ポリヌクレオチドに変異を導入することが望ましい場合には、鋳型ポリヌクレオチドと同一の領域、および鋳型ポリヌクレオチドと異種の領域を持つ一本鎖または二本鎖ポリヌクレオチドを、総核酸量と比較して最高20倍の重量で、より好ましくは一本鎖ポリヌクレオチドを総核酸量と比較して10倍の重量で、添加することができる。
【0094】
異なるが関連する鋳型ポリヌクレオチドが望ましい場合には、各鋳型のポリヌクレオチド群を約1:100以下、より好ましくは約1:40以下の比で組み合せることができる。例えば、自然変異(例えば、選択している表現型の性質に実質的ではない変化を生じる変異)を除去するために、変異ポリヌクレオチド群を野生型ポリヌクレオチドに戻し交雑することが望ましい場合がある。そのような例では、ランダムに提供されるセクシャルPCRサイクルハイブリッドポリヌクレオチドに添加できるランダムに提供される野生型ポリヌクレオチドの比率は、約1:1から約100:1、より好ましくは1:1から40:1である。
【0095】
ランダムポリヌクレオチドの混合群を変性して一本鎖ポリヌクレオチドを形成させ、再アニーリングさせる。他の一本鎖ポリヌクレオチドと相同領域を持つ一本鎖ポリヌクレオチドのみが、再アニーリングする。
【0096】
ランダムポリヌクレオチドは、加熱によって変性できる。当業者は二本鎖核酸を完全に変性するために必要な条件を決定できる。好ましくは温度は80℃から100℃、より好ましくは温度は90℃から96℃である。ポリヌクレオチドの変性に使用できる他の方法には、圧力とpHが含まれる。
【0097】
ポリヌクレオチドは冷却によって再アニーリングされうる。好ましくは温度は20℃から75℃、より好ましくは温度は40℃から65℃である。平均わずか4つの相同塩基の連続に基づいて高頻度のクロスオーバーが必要ならば、プロセスはより困難にはなるが、低いアニーリング温度を用いて組み換えを起こさせることができる。再生の度合いは、一本鎖ポリヌクレオチド群の間の相同性の度合いに依存する。
【0098】
ポリエチレングリコール(PEG)または塩を添加することによって、再生を加速できる。塩濃度は好ましくは0 mMから200 mM、より好ましくは塩濃度は10 mMから100 mMである。塩はKClまたはNaClでよい。PEGの濃度は好ましくは0%から20%、より好ましくは5%から10%である。
【0099】
アニーリングしたポリヌクレオチドを、次に核酸ポリメラーゼおよびdNTP(すなわちdATP、dCTP、dGTPおよびdTTP)の存在下でインキュベーションする。核酸ポリメラーゼはクレノウフラグメント、Taqポリメラーゼまたは当技術分野で周知の他の任意のDNAポリメラーゼで良い。
【0100】
アセンブリーに用いる方法は、クロスオーバーを生じる最低の相同性の度合いに依存する。同一部分が大きい場合には、アニーリング温度45〜65℃でTaqポリメラーゼが使用できる。同一部分が小さい場合には、アニーリング温度20〜30℃でクレノウフラグメントが使用できる。当業者は、クロスオーバーの数を増やすためにアニーリング温度を変えることができる。
【0101】
ポリメラーゼを、アニーリング前、アニーリングと同時、またはアニーリング後にランダムなポリヌクレオチドプライマーに添加できる。
【0102】
変性、再生、およびポリメラーゼ存在下のインキュベーションのサイクルは、本明細書において核酸のシャッフリングまたはリアセンブリーと呼ばれる。このサイクルは、所望の回数、繰り返される。好ましくはサイクルは2〜50回、より好ましくは10から40回繰り返される。
【0103】
得られる核酸は、約50bpから約100kb、好ましくは500bpから50kbのより大きな二本鎖ポリヌクレオチドである。
【0104】
このより大きなポリヌクレオチドには、鋳型ポリヌクレオチドと同じサイズのポリヌクレオチドが数コピー縦につながったものが含まれている可能性がある。このコンカテマーポリヌクレオチドを変性させて、鋳型ポリヌクレオチドの単一コピーにする。その結果、鋳型ポリヌクレオチドとほぼ同じサイズのポリヌクレオチド群になる。このポリヌクレオチド群は、シャッフリングの前に同一および異種の部分を持った一本鎖または二本鎖ポリヌクレオチドが鋳型ポリヌクレオチドに添加された、混合群になる。これらのポリヌクレオチドは、その後適当なベクターにクローニングされ、その連結反応液は細菌の形質転換に使用される。
【0105】
コンカテマーを消化するかわりに、PCR(米国特許第4,683,195号および米国特許第4,683,202号)を含む種々の方法によって、クローニングの前に単一のポリヌクレオチドの増幅を行なうことにより、より大きなコンカテマーポリヌクレオチドから単一のポリヌクレオチドが得られると考えられる。
【0106】
クローニングに使用されるベクターは、所望のサイズのポリヌクレオチドを受け入れるかぎり、特に重要ではない。特定のポリヌクレオチドの発現が望まれる場合には、クローニング媒体は、宿主細胞中でポリヌクレオチドの発現を行なうために、ポリヌクレオチドの挿入部位の隣の転写および翻訳シグナルも含む必要がある。
【0107】
得られる細菌集合には、ランダムな変異を持ついくつかの組み換えポリヌクレオチドが含まれている。この混合集合を用いて、所望の組み換えポリヌクレオチドを同定できる。選択の方法は、所望のポリヌクレオチドに依存する。
【0108】
例えば、本発明に記述される方法によって同定されたポリヌクレオチドが、第1の結合親和性を持つタンパク質をコードしている場合は、リガンドに対する結合親和性の増加したその後の変異(例えば、シャッフリングされた)配列が望まれる場合がある。そのような場合、その集合またはライブラリー中のポリヌクレオチドの部分の各々によって発現されるタンパク質について、当技術分野で周知の方法によって、リガンドに対する結合能力を試験することができる(パンニング、アフィニティクロマトグラフィー)。薬剤耐性の増加したタンパク質をコードするポリヌクレオチドが望まれる場合には、その集合またはライブラリーのポリヌクレオチドの各々によって発現されるタンパク質の持つ、宿主生物体に薬剤耐性を与える能力について、試験できる。当業者は、所望のタンパク質に関する知識があれば、タンパク質に望ましい性質を与えるポリヌクレオチドを同定するためにその集合を試験することができる。
【0109】
当業者は、タンパク質の断片がファージ表面上に融合タンパク質として発現される、ファージディスプレイシステム(Pharmacia、Milwaukee WI)を使用できると考えられる。組み換えDNA分子は、組み換えDNA分子によってその一部がコードされている融合タンパク質の転写を誘導するような部位で、ファージDNAにクローニングされる。組み換え核酸分子を含むファージは、細胞中で複製および転写される。融合タンパク質のリーダー配列は、融合タンパク質をファージ粒子の先端に輸送するように指示する。こうして、組み換えDNA分子が一部をコードする融合タンパク質は、ファージ粒子上にディスプレイされ、上述の方法で検出と選択が可能になる。
【0110】
さらに、最初の集合のうち、所望の組み換えタンパク質をコードするDNAをふくむサブ集合のポリヌクレオチドを用いて、核酸シャッフリングのサイクルを何回か実行できると考えられる。このようにして、より高い結合親和性または酵素活性を持つタンパク質も得られる。
【0111】
サブ集合からサイレント変異を除去するために、最初またはその後の回の核酸シャッフリングからの核酸サブ集合および野生型ポリヌクレオチドの混合物を用いて、核酸シャッフリングのサイクルを何回か実行できると考えられる。
【0112】
開始核酸として、精製された形の任意の核酸供給源が利用できる。したがって、この過程は一本鎖または二本鎖の、メッセンジャーRNAを含むRNAまたはDNAを使用しうる。また、DNAとRNAを各々一本ずつ含むDNA−RNAハイブリッドも利用できる。核酸配列の長さは、変異させる核酸配列のサイズに応じて異なる。好ましくは、特定の核酸配列は50から50000塩基対である。関心対象のタンパク質をコードする核酸を含むベクター全体が、本発明の方法で使用できると考えられる。
【0113】
任意の特定の核酸配列を用いて本過程によってハイブリッド群を作製できる。本方法のために、特定の核酸配列のハイブリッド配列の小さな集合が存在するまたは利用できることのみが、必要である。
【0114】
変異を持つ特定の核酸配列群を、いくつかの異なる方法で作製できる。エラープローンPCRで変異が作製できる。エラープローンPCRは、長い配列に渡って、ランダムに低いレベルで点変異を導入するために、忠実度の低い重合条件を使用する。または、オリゴヌクレオチド指定変異導入によって、鋳型ポリヌクレオチドに変異を導入することもできる。オリゴヌクレオチド指定変異導入では、制限酵素による消化を用いて、短い配列のポリヌクレオチドがポリヌクレオチドから除去され、元の配列から種々の塩基が変化している合成ポリヌクレオチドで置換される。化学的変異導入によってもポリヌクレオチドの配列を変化できる。化学的変異原には、例えば、亜硫酸水素ナトリウム、亜硝酸、ヒドロキシルアミン、ヒドラジンまたは蟻酸が含まれる。ヌクレオチド前駆体のアナログである他の物質には、ニトロソグアニジン、5−ブロモウラシル、2−アミノプリン、またはアクリジンが含まれる。一般に、これらの物質はヌクレオチド前駆体の代わりにPCR反応に添加され、配列に変異を誘導することになる。プロフラビン、アクリフラビン、キナクリン等のようなインターカレーションする薬剤も使用できる。ポリヌクレオチド配列のランダムな変異導入は、X線または紫外線の照射によっても誘導できる。 一般に、このように変異が誘導されたプラスミドポリヌクレオチドを大腸菌(E.coli)に導入し、ハイブリッドプラスミドのプールまたはライブラリーとして増殖させる。
【0115】
または、特定の核酸の小さな混合集合は天然に見られ、同じ遺伝子の異なる対立遺伝子または異なる関連する種由来の同じ遺伝子(すなわち同族遺伝子)を含む可能性もある。または、例えば免疫グロブリン遺伝子のように、1つの種の中に見られる関連DNA配列である可能性もある。
【0116】
特定の核酸配列の混合集合が作製されたら、当技術分野で周知のテクニックを用いてポリヌクレオチドは直接使用されるか、適当なクローニングベクターに挿入される。
【0117】
ベクターの選択は、本発明の方法で使用されるポリヌクレオチド配列のサイズおよび宿主細胞に依存する。本発明の鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルス等)、またはその選択された部分(例えば、コートタンパク、スパイク糖タンパク質、キャプシドタンパク質)である可能性がある。例えば、コスミドおよびファージミドは、大きなポリヌクレオチドを安定的に増殖できるので、変異させる特定の核酸配列が、より大きい場合に好ましい。
【0118】
特定の核酸配列の混合集合がベクターにクローニングされたら、クローン増幅できる。発現されたポリペプチドをスクリーニングすることによって、有用性は容易に決定できる。
【0119】
本発明のDNAシャッフリング法は、未知の配列のプールに対して盲目的に実行できる。リアセンブリー混合物にオリゴヌクレオチド(リアセンブリーしている配列と相同な末端を持つ)を添加することによって、任意の配列混合物を、任意の特定の位置で、別の配列混合物に組み込むことができる。したがって、合成オリゴヌクレオチド、PCRポリヌクレオチドまたは遺伝子全体の混合物でも、定められた位置で別の配列ライブラリー中に混合できる。1つの配列(混合物)の挿入は、鋳型の別の部分における配列の挿入とは独立している。したがって、組み換えの度合い、必要な相同性、およびライブラリーの多様性は、リアセンブリーされるDNAの長さとともに、独立して同時に変化させられる。
【0120】
シャッフリングには、多様性領域を分離する相同領域の存在が必要である。シャッフリングには、骨組みのようなタンパク質構造が特に適している可能性がある。保存された骨組みは、自己集合によって全体の折畳みを決定し、特定の結合を仲介する比較的制限の少ないループを提示する。そのような骨組みの例には、当技術分野で周知の免疫グロブリンβバレル、および4ヘリックスバンドルがある。このシャッフリングは、結合のための種々の変異配列の組み合せを用いて、骨組み様タンパク質を作製するために使用できる。
【0121】
インビトロシャッフリング
インビトロシャッフリングによって、標準的な遺伝的交配と同等なものも行なうことができる。例えば、ハイブリッドの核酸を野生型核酸と繰返し混合し、関心対象の変異を選択することによって、「分子戻し交雑」が行なえる。従来の育種と同様に、このアプローチを用いて、選択したバックグラウンドに種々の供給源からの表現型を組み合せることができる。これは例えば、選択されない特徴(例えば、免疫原性)に影響を与える中立変異を除去するために、有用である。したがって、これはタンパク質中のどの変異が向上した生物活性に関与していて、どれが関与していないかを決定するために有用であるが、これはエラープローン変異導入またはカセット変異法にはない利点である。
【0122】
小さなランダムポリヌクレオチドの混合物から、大きな機能的遺伝子を正しく組み立てることが可能である。この反応は、化石の高度に断片化されたDNAの遺伝子のリアセンブリーに有用である。また、化石のランダムな核酸断片は、関連する種の類似した遺伝子のポリヌクレオチドと組み合せることができる。
【0123】
本発明の方法は、種々の研究および診断用途に必要とされる、単一の細胞のゲノム全体のインビトロ増幅にも使用できる。PCRによるDNA増幅は、通常約40kbの配列を含む。PCRによって大腸菌(E.coli) (5,000kb) のようなゲノム全体を増幅するためには約250のプライマーが必要であり、125の40kbポリヌクレオチドが産生される。一方で、セクシャルPCRサイクルを用いたゲノムのポリヌクレオチドのランダム作製後に小さなポリヌクレオチドをゲル精製すると、多数の潜在的プライマーが提供される。この小さなランダムポリヌクレオチド混合物を、単独または鋳型としてのゲノム全体と共にPCR反応で使用すると、逆連鎖反応が起こり、その理論的終点はゲノムの多数のコピーを含む単一のコンカテマーとなる。
【0124】
ランダムポリヌクレオチドのみを使用すると、コピー数は100倍増幅、平均ポリヌクレオチドサイズは50kb以上が得られる。多くの小さなポリヌクレオチドの重複によって、より大きなコンカテマーが得られると考えられる。合成プライマーを用いて得られた特定のPCR産物の質は、増幅されないDNAから得られた産物と区別がつかないようになる。このアプローチは、ゲノムのマッピングに有用になると期待される。
【0125】
シャッフリングするポリヌクレオチドは、実施者の裁量によって、ランダムまたは非ランダムポリヌクレオチドとして作製できる。さらに、本発明は広範囲のポリヌクレオチドサイズおよびタイプに応用できるシャッフリング法を提供し、これにはより大きなポリヌクレオチドのリアセンブリーにおける構成単位として用いるポリヌクレオチドモノマーの作製段階が含まれる。例えば、構成単位は遺伝子断片であったり、遺伝子全体、遺伝子経路、またはその任意の組み合せを含む可能性がある。
【0126】
インビボシャッフリング
インビボシャッフリングの1つの態様では、特定の核酸配列の混合群が、少なくとも2つの異なる核酸配列が各宿主細胞に存在するような条件で、細菌または真核細胞中に導入される。ポリヌクレオチドは、種々の方法で宿主細胞に導入できる。宿主細胞は、例えば塩化カルシウム処理のような当技術分野で周知の方法を用いて、より小さなポリヌクレオチドで形質転換できる。ポリヌクレオチドがファージゲノムに挿入される場合は、特定の核酸配列を持つ組み換えファージゲノムを宿主細胞にトランスフェクトできる。または、電気穿孔、トランスフェクション、リポフェクション、バイオリスティック、接合等を用いて核酸配列を宿主細胞に導入できる。
【0127】
一般に、この態様では、宿主細胞中で安定に配列を複製できるベクター中に、特定の核酸配列が存在する。また、ベクターを持つ宿主細胞が選択できるように、ベクターにはマーカー遺伝子がコードされていると考えられる。これにより、変異を受けた特定の核酸配列が、宿主細胞への導入後に回収できるようになる。しかし、特定の核酸配列の混合群全体が、ベクター配列に存在する必要はないと考えられる。むしろ、ポリヌクレオチドの宿主細胞への導入後に、各宿主細胞がその中に少なくとも1つの特定の核酸配列を持つために十分な数の配列のみがベクターにクローニングされればよい。また、特定の核酸配列の集合のサブセットをベクターにクローニングするよりも、このサブセットは既に宿主細胞中に安定に組み入れられている可能性もある。
【0128】
宿主細胞中に同一領域を持つ2つのポリヌクレオチドが挿入されると、2つのポリヌクレオチドの間で相同組み換えが起きることが分かっている。2つの変異した核酸配列の間のそのような組み換えは、場合によっては二重または三重ハイブリッドを生じることがある。
【0129】
変異した核酸配列のいくつかが、直線状の核酸分子上に存在すると、組換え頻度が高まることも分かっている。したがって、1つの態様では、特定の核酸配列のいくつかは、直線状ポリヌクレオチド上に存在する。
【0130】
形質転換後、宿主細胞形質転換体は、所望の性質を持つ変異した核酸配列を含む宿主細胞形質転換体を同定するために、選択を受ける。例えば、特定の薬剤に対する耐性の増加が望まれる場合には、形質転換した宿主細胞を、濃度を上げたその特定の薬剤にさらし、薬剤耐性の上昇を与える変異タンパクを作製する形質転換体が選択される。特定のタンパク質が受容体に結合する能力を強化したい場合には、形質転換体のタンパク質の発現を誘導し、得られたタンパク質を当技術分野で周知の方法によりリガンド結合アッセイで検定し、リガンドに対する結合が強化した変異群のサブセットを同定する。または、正しいプロセッシングを保証するためにタンパク質を別のシステムで発現しても良い。
【0131】
所望の特徴を持つ第1の組み換え核酸配列(娘配列)のサブセットが同定されたら、2回の組み換えを行なう。第2ラウンドの組み換えでは、組み換えられた核酸配列を、元の変異導入された核酸配列(親配列)と混合し、上述のサイクルを繰り返すことができる。このようにして、増強した特徴を持つまたは増強した特性を持つタンパク質をコードする第2の組み換え核酸配列のセットが同定できる。このサイクルは、所望の回数繰り返すことができる。
【0132】
第2またはその後の組み換えサイクルにおいては、戻し交雑が行われると考えられる。分子の戻し交雑は、所望の核酸配列を、多数の野生型配列と混合し、少なくとも1つの野生型核酸配列および変異核酸配列が、形質転換後の同一の宿主細胞に存在するようにすることで実行できる。野生型の核酸配列との組み換えによって、免疫原性のような選択されない特徴に影響を与える中立変異は除去されるが、選択される特徴は除去されない。
【0133】
本発明の別の態様では、第1ラウンドの間に、宿主細胞への導入前にPCR増幅を減速または停止することにより、より小さなポリヌクレオチドとして特定の核酸配列のサブセットが作製できると考えられる。ポリヌクレオチドのサイズは、他の配列と相同組み換えを起こすように、他の配列と同一の領域をいくつか含むほど大きい必要がある。ポリヌクレオチドのサイズは0.03kbから100kb、より好ましくは0.2kbから10kbである。その後のラウンドでは、宿主細胞への導入前にPCRポリヌクレオチドを作製するために、前ラウンドより選択された配列以外の、全ての特定の核酸配列が使用できると考えられる。
【0134】
より短いポリヌクレオチド配列は、一本鎖または二本鎖である。核酸の鎖を分離するために適当な反応条件は、当技術分野で周知である。
【0135】
このプロセスの段階は、無限に繰り返すことができ、作製可能な潜在的ハイブリッドの数でのみ限定される。
【0136】
したがって、変異した鋳型核酸の最初のプールまたは集合は、大腸菌(E.coli)のような細菌中で複製可能なベクター中にクローニングされる。この特定のベクターは、大腸菌(E.coli)中で自己複製が可能でありさえすれば、特に重要ではない。1つの態様では、ベクターはベクターに結合された変異核酸によってコードされる任意のタンパク質の発現および作製ができるように設計されている。またベクターが選択可能マーカーをコードする遺伝子を含むことも好ましい。
【0137】
変異核酸配列のプールを含むベクターの集合は、大腸菌(E.coli)宿主細胞に導入される。ベクターの核酸配列は、ファージの場合は形質転換、トランスフェクション、または感染によって導入できる。細菌の形質転換に使用するベクターの濃度は、各細胞にいくつかのベクターが導入されるようにする。細胞中に入ると、相同組み換えの効率は、種々のベクターの間で相同組み換えが起きるようになっている。その結果、元の親変異配列とは異なる変異の組み合せを持つハイブリッド(娘)が生成する。その後、宿主細胞をクローン複製し、ベクター上に存在するマーカー遺伝子の選択をする。プラスミドを持つ細胞のみが、選択条件下で増殖する。ベクターを含む宿主細胞は、好ましい変異が存在するか検定する。
【0138】
所望の特徴を与える特定の娘変異核酸配列が同定されたら、すでにベクターに結合しているまたはベクターから分離している核酸が単離される。その後この核酸は、核酸の第1または親集合と混合され、サイクルが繰り返される。
【0139】
ポリヌクレオチドとしてまたは同一のベクターにクローニングされた、親変異核酸集合は、既に娘核酸を含んでいる宿主細胞に導入される。細胞中で組み換えを起こすようにし、次の世代の組み換え体、孫が上述の方法で選択される。このサイクルは、所望の特徴を持つ核酸またはタンパク質が得られるまで、何度も繰り返される。その後のサイクルでは、ハイブリッドに添加される変異配列の集合は、親ハイブリッドまたはその後の世代に由来すると考えられる。
【0140】
別の態様では、本発明は、中立変異を除去するために、得られた組み換え核酸の「分子」戻し交雑を行なう方法を提供する。中立変異とは、核酸またはペプチドに所望の性質を与えない変異である。しかし、そのような変異は望ましくない特徴を核酸またはペプチドに与えうる。したがって、そのような中立変異を除去することが望ましい。本発明の方法は、その方法を提供する。
【0141】
この態様では、本発明の方法で所望の特徴を持つハイブリッド核酸が得られたら、核酸、核酸を持つベクター、またはベクターおよび核酸を含む宿主細胞が単離される。
【0142】
その後、核酸またはベクターは、過剰量の野生型核酸とともに宿主細胞に導入される。ハイブリッドの核酸および野生型配列の核酸の組み換えが起きる。得られた組み換え体に、ハイブリッド核酸と同じ選択が行われる。所望の特徴を保持する組み換え体のみが、選択される。所望の特徴を提供しない任意のサイレント変異は、野生型DNAとの組み換えで失われる。このサイクルは、全てのサイレント変異が除去されるまで繰り返すことができる。
【0143】
エキソヌクレアーゼ媒介性リアセンブリー
別の態様では、本発明は、子孫ポリヌクレオチド(例えば、ポリペプチドまたは遺伝子経路を作製するように発現できるキメラ子孫ポリヌクレオチド)を形成するために、少なくとも2つのポリヌクレオチドを、シャッフリング、アセンブリー、リアセンブリー、組み換え、および/または連結する方法を提供する。ある1つの態様では、二本鎖ポリヌクレオチド(例えば、ハイブリダイゼーションパートナーとして、2つの一本鎖配列が互いにハイブリダイズしたもの)をエキソヌクレアーゼで処理して、2本の鎖のうちの1本からヌクレオチドを遊離させ、別のパートナーとのハイブリダイゼーションに残りの鎖が使用できるように、残りの鎖からパートナーを除去する。
【0144】
ある特定の局面では、二本鎖ポリヌクレオチドの末端(ポリヌクレオチド配列または非ポリヌクレオチド配列の一部またはこれに結合している可能性がある)をエキソヌクレアーゼ活性の供給源にさらす。エキソヌクレアーゼ活性の有用な供給源は、3’エキソヌクレアーゼ活性を持つ酵素、5’エキソヌクレアーゼ活性を持つ酵素、3’エキソヌクレアーゼ活性および5’エキソヌクレアーゼ活性の両方をもつ酵素、およびその任意の組み合せである。エキソヌクレアーゼは、直線状の二重鎖ポリヌクレオチドの片方または両方の末端、および2つ以上の末端を持つ分岐ポリヌクレオチドの1つ又は全ての末端から、ヌクレオチドを遊離させるために使用できる。
【0145】
反対に、ポリヌクレオチド構成単位のシャッフリング、アセンブリー、リアセンブリー、組み換えおよび/または連結のために非酵素段階も使用でき、これは作業試料を変性(または「溶解」)条件(例えば、温度、pH、および/または塩条件の変化による)にさらし、二本鎖ポリヌクレオチドの作業セットを一本鎖に溶解することを含む。シャッフリングのためには、単一のポリヌクレオチド鎖が異なるハイブリダイゼーションパートナーとのアニールにある程度参加することが望ましい(変性ステップ前の元のパートナーとの排他的アニールに戻るだけではなく)。しかし、反応容器中に元のハイブリダイゼーションパートナーが存在することは、一本鎖ポリヌクレオチドが元のパートナーとアニールし、元の二本鎖ポリヌクレオチドを再生することを排除するものではなく、時にはこれを有利にする。
【0146】
二本鎖ポリヌクレオチド構成単位を変性させアニーリングさせるこの非酵素シャッフリングステップとは反対に、本発明は変性を必要としない、エキソヌクレアーゼに基づく手法を提供する。むしろ、変性条件を避け、二本鎖ポリヌクレオチド基質をアニールした(すなわち非変性)状態で維持することは、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIIIおよびレッドα遺伝子産物)の作用のための必要条件である。また、反対に、他の一本鎖ポリヌクレオチド配列にハイブリダイズできる一本鎖ポリヌクレオチドの生成は、ハイブリダイゼーションパートナーの1つにおける共有結合の開裂および配列の破壊の結果である。例えば、エキソヌクレアーゼIII酵素を用いて1つのハイブリダイゼーション鎖における3’末端ヌクレオチドを遊離させることができ(そのポリヌクレオチド鎖における共有加水分解を行なう);これにより残りの一本鎖が新しいパートナーとハイブリダイゼーションするのが容易になる(元のパートナーが共有開裂を受けたため)。
【0147】
特に本開示の手法のために、より好適な速度および/またはより強い特異性および/または望まない活性のより少ない酵素が、発見、最適化(例えば、方向づけられた進化による操作)、または発見および最適化の両方をなされることができるのは、特に認識される。実際、本発明はそのようなデザイナー酵素の発見および/または開発を促進する可能性があると期待される。
【0148】
さらに、必要に応じて、二重鎖ポリヌクレオチドの末端を保護したり、使えるエキソヌクレアーゼの所望の酵素活性に感受性にしたりできることは認識され得る。例えば、3’がオーバーハングしている二重鎖ポリヌクレオチド末端は、エキソヌクレアーゼIIIのエキソヌクレアーゼ活性に感受性はない。しかし、種々の方法でこれをエキソヌクレアーゼIIIのエキソヌクレアーゼ活性に感受性にできる;例えば、ポリメラーゼ処理をしてブラントにする、ブラントエンドまたは5’のオーバーハングを提供するように開裂する、他の二重鎖ポリヌクレオチドと結合(連結またはハイブリダイズ)させてブラントエンドまたは5’オーバーハングを提供する、一本鎖ポリヌクレオチドとハイブリダイズさせてブラントエンドまたは5’オーバーハングを提供するようにする、または任意の種々の手法によって修飾できる。
【0149】
1つの局面では、直線状二重鎖ポリヌクレオチドの片端または両端にエキソヌクレアーゼを作用させ、完成、完成近く、または部分的完成まで進ませる。エキソヌクレアーゼ活性が完成まで進むと、その結果は各5’オーバーハング部分の長さは「ランデブーポイント」(ポリヌクレオチドの中点の近く)と考えられるものの方向に、ポリヌクレオチドの中央領域に向かって伸長する。最終的には、各々が元の二重鎖ポリヌクレオチドの長さの約半分である、一本鎖ポリヌクレオチド(分離できる)が形成される。
【0150】
したがってこのエキソヌクレアーゼを介する手法は、ポリヌクレオチド構成単位のシャッフリング、アセンブリーおよび/またはリアセンブリー、組み換えおよび、連結に有用で、そのポリヌクレオチド構成単位は、最高10塩基、または数10塩基、または数100塩基、または数1000塩基、または数万塩基、または数十万塩基、または数百万塩基、またはそれ以上の長さであり得る。
【0151】
エキソヌクレアーゼの基質は、二重鎖ポリヌクレオチドを断片化して作製できる。断片化は、機械的手法(例えば、剪断、超音波処理等)、酵素的手法(例えば、制限酵素を使用)、およびその組み合せによって、実行できる。より大きなポリヌクレオチドの断片は、ポリメラーゼを介する合成によっても作製できる。
【0152】
エキソヌクレアーゼ活性を持つ酵素の別の例には、レッドαおよびヘビ毒ホスホジエステラーゼが含まれる。レッドα遺伝子産物(λエキソヌクレアーゼとも呼ばれる)は、バクテリオファージλに由来する。レッドα遺伝子産物は、5’リン酸化末端から漸進的に作用し、二重鎖DNAからモノヌクレオチドを遊離させる(TakahashiおよびKobayashi、1990)。ヘビ毒ホスホジエステラーゼ(Laskowski、1980)はスーパーコイルDNAを素早く開くことができる。
【0153】
非確率的連結リアセンブリー
1つの局面では、本発明は合成連結リアセンブリー(SLR)と呼ばれる非確率的方法を提供する。これは核酸構成単位がランダムにシャッフリング、連結、またはキメラ化されるのではなく、非確率的に組み立てられるという点以外は、確率的シャッフリングにある程度関連している。
【0154】
SLR法はシャッフリングされるポリヌクレオチド間の高レベルの相同性の存在に依存しない。本発明は10100以上のキメラからなる子孫分子のライブラリー(セット)を非確率的に作製するために使用できる。おそらく、SLRは101000以上の異なる子孫キメラからなるライブラリーの作製にも使用できる。
【0155】
したがって、本発明は1つの局面では、設計によって選択された全体の組立順序を持つ完成したキメラ核酸分子のセットを作製する非確率的方法を提供する。この方法は、相互に適合する連結可能な末端を持った複数の特定の核酸構成単位を設計によって作製し、設計した全体の組立順序が実現するようにこれらの核酸構成単位を組み立てる段階を含む。
【0156】
組み立てられる核酸構成単位の相互に適合する連結可能な末端は、事前に定められた順序で構成単位を結合させることができるならば、この順序立った組立で「使用できる」と考えられる。したがって1つの局面では、核酸構成単位が結合される全体の組立順序は、連結可能末端の設計によって指定され、複数の組立段階が使用される場合には、核酸構成単位が結合される全体の組立順序は、やはり組立段階の逐次的順序によって指定される。本発明の1つの態様では、アニールされた構成単位は、リガーゼ(例えば、T4 DNAリガーゼ)等の酵素で処理され、構成単位の共有結合が作製される。
【0157】
別の態様では、核酸構成単位の設計は、完成したキメラ核酸分子の子孫セットを作製する基礎となる、祖先核酸鋳型のセットの配列分析により得られる。したがってこれらの祖先核酸鋳型は、変異導入、すなわちキメラ化またはシャッフリングする、核酸構成単位の設計に役立つ配列情報源となる。
【0158】
1つの具体例では、本発明は関連する遺伝子ファミリーおよびそれにコードされる関連する産物ファミリーのキメラ化を提供する。1つの特定の具体例では、コードされる産物は酵素である。本発明の局面にしたがって変異導入できる酵素ファミリーの代表例には、以下の酵素およびその機能がある:リパーゼ/エステラーゼ、プロテアーゼ、グリコシダーゼ/グリコシルトランスフェラーゼ、ホスファターゼ/キナーゼ、モノ/ジオキシゲナーゼ、ハロペルオキシダーゼ、リグニン、ペルオキシダーゼ/ジアリールプロパンペルオキシダーゼ、エポキシドヒドロラーゼ、ニトリルヒドラターゼ/ニトリラーゼ、トランスアミナーゼ、アミダーゼ/アシラーゼ。これらの具体例は、本発明の特定の局面を説明するものであるが、限定したり、開示される発明の範囲を制限するものではない。
【0159】
したがって本発明の1つの局面によると、1つまたは複数の境界点を選択するために、本発明の方法を用いて同定された複数の先祖核酸鋳型の配列を並べ、境界点を相同領域に見つけることができる。境界点は、作製する核酸構成単位の境界を明らかにするために使用できる。したがって、先祖分子中に同定され選択された境界点は、子孫分子の組立の潜在的キメラ化ポイントになる。
【0160】
通常利用できる境界点は、少なくとも2つの祖先鋳型が共有する相同領域(少なくとも1つのヌクレオチド塩基からなる)であるが、祖先鋳型の少なくとも半数、祖先鋳型の少なくとも3分の2、祖先鋳型の少なくとも4分の3、および好ましくはほぼ全ての祖先鋳型に共通の相同領域であり得る。さらに好ましくは、役立つ境界点は、全ての祖先鋳型に共通の相同領域である。
【0161】
好ましい態様では、網羅的なライブラリーを作製するために、連結組立プロセスは網羅的に行われる。つまり、核酸構成単位の全ての可能な順序の組み合せが、完成したキメラ核酸分子セット中に表される。同時に、各組み合せにおける組立順序(すなわち、各完成したキメラ核酸の5’から3’配列に向けての、各構成単位の組立順序)は設計(または非確率的)による。本発明の非確率的性質のために、望ましくない副産物の可能性は非常に低くなっている。
【0162】
別の好ましい態様では、本発明は、例えば、体系的に、例えば、1つずつ、スクリーニングできる区画を持つ、体系的に区画化したライブラリーを作製するために、連結リアセンブリープロセスが、体系的に行われることを規定する。つまり、特定の核酸構成単位の選択的および賢明な使用と、逐次的な段階的組立反応の選択的および賢明な使用により、いくつかの反応容器の各々において子孫産物の特定のセットが作製される実験設計が実現することを、本発明は規定する。これにより、体系的な試験およびスクリーニング手順が実行される。したがって、小さなグループにおいて、非常に多数の子孫分子を体系的に試験することが可能になる。
【0163】
特に祖先分子間の相同性が非常に低い場合に、非常に柔軟でかつ網羅的で体系的なキメラ化を実行する能力があるため、本発明は多数の子孫分子を含むライブラリー(またはセット)の作製を提供する。本連結リアセンブリー発明の非確率的性質のために、作製される子孫分子は好ましくは、設計によって選択された全体の組立順序を持つ完成したキメラ核酸分子のライブラリーを含む。1つの特定の態様では、そのような作製されたライブラリーには103から101000以上の異なる子孫分子種が含まれる。
【0164】
1つの局面では、上述のようにして作製された完成したキメラ核酸分子のセットは、ポリペプチドをコードするポリヌクレオチドを含む。1つの態様では、このポリヌクレオチドは遺伝子であり、人工の遺伝子である可能性もある。別の態様では、このポリヌクレオチドは遺伝子経路であり、人工の遺伝子経路である可能性もある。本発明は、本発明によって作製された1つまたは複数の人工遺伝子が、真核生物(植物を含む)中で作用できる経路のような、人工遺伝子経路に組み入れられることを規定する。
【0165】
別の具体例では、構成単位が作製されるステップの合成的な性質のために、後に選択的にインビトロプロセス(例えば、変異導入による)またはインビボプロセス(例えば、宿主生物体の遺伝子スプライシング能力を利用)によって除去できるヌクレオチド(例えば、例えばコドンまたはイントロンまたは調節配列のような、1つまたは複数のヌクレオチド)の導入と設計が可能である。多くの場合、役立つ境界点を作製する潜在的利点に加えて、他の多くの理由のためにこれらのヌクレオチドの導入が望ましい場合があることが認識される。
【0166】
したがって、別の態様では、本発明はイントロンを導入するために核酸構成単位が使用できることを規定する。したがって、本発明は本発明の人工遺伝子に機能的イントロンを導入できることを規定する。本発明は機能的イントロンは本発明の遺伝子経路にも導入できることを規定する。したがって、本発明は1つ(またはそれ以上)の人工的に導入されたイントロンを含む人工遺伝子である、キメラポリヌクレオチドの作製を提供する。
【0167】
したがって、本発明は1つ(またはそれ以上)の人工的に導入されたイントロンを含む人工遺伝子経路である、キメラポリヌクレオチドの作製も提供する。好ましくは、自然に発生するイントロンが遺伝子スプライシングにおいて機能するのと同様に、人工的に導入されたイントロンは、1つまたは複数の宿主細胞中で遺伝子スプライシングにおいて機能する。本発明は組み換えおよび/またはスプライシングのために、宿主生物体に導入される人工イントロン含有ポリヌクレオチドを作製する過程を提供する。
【0168】
本発明を用いて作製される人工遺伝子は、別の核酸との組み換えの基質にもなる。同様に、本発明を用いて作製される人工遺伝子経路は、別の核酸との組み換えの基質にもなる。好ましい例では、組み換えは、人工イントロン含有遺伝子と組み換えパートナーとなる核酸との間の相同領域によって促進されるか、ここで起きる。特に好ましい例では、組み換えパートナーも、人工遺伝子または人工遺伝子経路を含め、本発明によって作製された核酸である。組み換えは、人工遺伝子中に人工的に導入された1つ(またはそれ以上)のイントロンに存在する相同領域によって促進されるか、ここで起きる。
【0169】
本発明の合成連結リアセンブリー法は、複数の核酸構成単位を使用するが、その各々は好ましくは2つの連結可能末端を持つ。各核酸構成単位の2つの連結可能末端は、2つのブラントエンド(オーバーハングしたヌクレオチドがない)、または好ましくは1つのブラントエンドおよび1つのオーバーハング、より好ましくは2つのオーバーハングである。
【0170】
この目的に利用できるオーバーハングは、3’オーバーハングまたは5’オーバーハングである。したがって、核酸構成単位は、1つの3’オーバーハングまたは1つの5’オーバーハングまたは2つの3’オーバーハングまたは2つの5’オーバーハングを持つ可能性がある。核酸構成単位が組み立てられて、完成したキメラ核酸分子になる全体の順序は、目的を持った実験設計によって決定されるのであり、ランダムではない。
【0171】
1つの好ましい態様では、核酸構成単位は、2つの一本鎖核酸(一本鎖オリゴとも呼ばれる)を化学合成し、この2つがアニーリングして二本鎖核酸構成単位を形成するようにこれらを接触させることによって、作製される。
【0172】
二本鎖核酸構成単位は、種々のサイズであり得る。これらの構成単位のサイズは、小さいか、大きい可能性がある。構成単位の好ましいサイズは、1塩基対(オーバーハングを含まないで)から100,000塩基対(オーバーハングを含まないで)に渡る。他の好ましいサイズも提供され、下限は1bpから10,000bp(その間の全ての整数値を含む)、および上限は2bpから100,000bp(その間の全ての整数値を含む)である。
【0173】
本発明に役立つ二本鎖核酸構成単位を作製するために、多くの方法が存在する;これらは当技術分野で周知であり、当業者によって容易に実行できる。
【0174】
1つの態様では、二本鎖核酸構成単位は、まず2本の一本鎖核酸を作製し、これらをアニールさせて二本鎖核酸構成単位を形成させる。二本鎖核酸構成単位の2つの鎖は、オーバーハングを形成する部分以外は全てのヌクレオチドが相補的であり、オーバーハング以外はミスマッチが含まれない可能性がある。別の態様では、二本鎖核酸構成単位の2本の鎖は、オーバーハングを形成する部分以外の全てのヌクレオチドよりも少ない部分で相補的である。したがって、この態様では二本鎖核酸構成単位はコドンの縮重を導入するために使用できる。好ましくはコドンの縮重は、1つまたはそれ以上のN,N,G/Tカセットまたは1つまたはそれ以上のN,N,Nカセットを用いて、本明細書に記述される部位飽和変異導入を用いて導入される。
【0175】
本発明のインビボ組み換え法は、特定のポリヌクレオチドまたは配列の、未知のハイブリッドまたは対立遺伝子のプールに盲目的に実行できる。しかし、特定のポリヌクレオチドの実際のDNAまたはRNA配列を知ることは必要ではない。
【0176】
遺伝子の混合集団内で組み換えを使用する手法は、例えば、インターロイキンI、抗体、tPA、および成長ホルモンのような任意の有用なタンパク質の作製に役立ち得る。この手法は、特異性または活性が変化したタンパク質を作製するために使用できる。この手法は、例えば、遺伝子のプロモーター領域、イントロン、エクソン、エンハンサー配列、31非翻訳領域または51非翻訳領域のような、ハイブリッド核酸配列の作製にも有用な可能性がある。したがって、この手法は発現率が上昇した遺伝子を作製するために使用できる。この手法は、DNAの繰り返し配列の研究にも有用である可能性がある。最後に、この手法はリボザイムまたはアプタマーを変異させるために役立つ可能性がある。
【0177】
末端選択
本発明はポリヌクレオチドの開始セットからポリヌクレオチドのサブセットを選択する方法を提供するが、その方法は、作業ポリヌクレオチドのどこかに存在する1つまたは複数の選択可能な特徴(または選択マーカー)を区別する能力に基づき、各選択可能ポリヌクレオチドを(正の選択)および/または選択可能ポリヌクレオチドではないものを(負の選択)の選択ができるものである。好ましい局面では、選択可能ポリヌクレオチドの末端領域に一部または全体が存在する選択マーカーを利用する末端選択と呼ばれる方法が提供され、そのような選択マーカーは「末端選択マーカー」と呼ばれる。
【0178】
末端選択は、同じポリヌクレオチドの中でさえも、自然に発生する配列の検出、実験的に導入された配列(本明細書に記述されるおよび記述されない任意の変異導入手法によるものを含む)の検出、またはその両方に基づくものであり得る。末端選択マーカーは、構造的選択マーカーまたは機能的選択マーカー、または構造と機能の両方の選択マーカーであり得る。末端選択マーカーは、放射能、酵素活性、蛍光、光学的特徴、磁気的性質(例えば、磁気ビーズの使用)、免疫反応性、およびハイブリダイゼーションの検出に基づく方法を用いて選択されるマーカーを含む、ポリヌクレオチド配列、またはポリペプチド配列、または任意の化学構造、または生物学的もしくは生化学的タグを含み得る。
【0179】
末端選択は、変異を導入する任意の方法と組み合せて行なうことができる。そのような変異導入法には、本明細書(上記および下記)に記述される方法が含まれるが、これらに限定されるわけではない。そのような方法の、限定することのない具体例として、本明細書または当技術分野において以下の任意の用語で呼ばれる任意の方法が含まれる:「飽和変異導入」、「シャッフリング」、「組み換え」、「リアセンブリー(reassembly)」、「エラープローンPCR」、「アセンブリーPCR」、「セクシャルPCR」、「クロスオーバーPCR」、「オリゴヌクレオチドプライマー指定変異導入」、「再帰的(および/または指数的)集合(ensemble)変異導入(ArkinおよびYouvan、1992参照)」、「カセット変異導入」、「インビボ変異導入」、および「インビトロ変異導入」。また、末端選択は、任意の変異導入および/または増幅法(例えば、Arnold、1993; CaldwellおよびJoyce、1992; Stemmer、1994参照)によって生成する分子に対して行なうことができるが、そのような方法の後に望ましい子孫分子を選択(存在のスクリーニングを含む)することが望ましい。
【0180】
また、末端選択は、変異導入方法とは別にポリヌクレオチドに施すこともできる。1つの態様では、本明細書で提供される末端選択は、別のポリヌクレオチドへの連結(ベクターへの連結を含む)の段階のような、クローニング段階を促進するために使用できる。したがって、本発明は、ライブラリーの作製、望ましいポリヌクレオチドの選択および/または濃縮、およびクローニング全般を容易にするために役立つ手段として、末端選択を提供する。
【0181】
別の態様では、末端選択はポリヌクレオチドの(正の)選択に基づき得る;または、末端選択はポリヌクレオチドの(負の)選択に基づき得る;または、末端選択はポリヌクレオチドの(正の)選択および(負の)選択の両方に基づき得る。他の選択および/またはスクリーニング方法とともに、類似または非類似の選択および/またはスクリーニング法および役立つ変異導入法との任意の組み合せで、末端選択は反復して実行でき、これらの全ては反復して、任意の順序、組み合せ、および順列で実行できる。また、末端選択は、環状(例えば、プラスミドまたは任意の他の環状ベクターまたは他の任意の部分的に環状のポリヌクレオチド)、および/または分岐、および/または任意の化学基もしくは部分で修飾または置換されたポリヌクレオチドの選択にも使用できることが認識される。
【0182】
1つの限定的でない局面では、直線状ポリヌクレオチドの末端選択は、ポリヌクレオチドの末端(5’または3’末端のいずれでも)またはその付近に存在する少なくとも1つの末端選択マーカーの存在に基づく一般的手法を用いて行われる。1つの特定の限定的でない具体例では、末端選択は、ポリヌクレオチド配列を認識する酵素によって認識される配列のような、末端またはその付近の特定の配列の選択に基づく。ポリヌクレオチドの化学的修飾を認識および触媒する酵素は、本明細書ではポリヌクレオチド作用酵素と呼ばれる。好ましい態様では、役立つポリヌクレオチド作用酵素の非排他的具体例には、ポリヌクレオチド開裂活性を持つ酵素、ポリヌクレオチドメチル化活性を持つ酵素、ポリヌクレオチド連結活性を持つ酵素、複数の区別可能な酵素活性(例えばポリヌクレオチド切断活性およびポリヌクレオチド連結活性が含まれるが、これらに限定されるわけではない)を持つ酵素が含まれる。
【0183】
適切なポリヌクレオチド作用酵素には、当業者によって同定可能な任意の酵素(例えば、市販の酵素)、または現在は使用できないが将来開発される可能性のあるもの、ポリヌクレオチドの連結に適合する末端、好ましくは粘着末端を作製するために役立つものが含まれることが認識される。末端選択を行なうポリヌクレオチドの内部に含まれない、または含まれないと期待される、または含まれる可能性の少ない(例えば、作業ポリヌクレオチドに関する配列情報が不完全な場合)制限部位を使用することが好ましい可能性がある。内部の望ましくない制限部位を除去するために種々の方法(例えば、変異導入法)が使用できると認識される。また、末端領域における認識部位で消化を行なうために部分的消化反応(すなわち部分的な完成にまで進行する消化反応)を用い、ポリヌクレオチドの内部に存在し、同じ酵素で認識される感受性の制限部位を残すこともできる。1つの局面では、一部の酵素は、認識配列の存在する位置および環境に応じて、同じ認識配列の選択的開裂を行なうことが認識されるので、部分的消化は有用である。
【0184】
また保護方法を用いて、その部位が存在するために作業ポリペプチドが切断されるような、望ましくない酵素消化から、特定の制限部位(例えば、内部の部位)を選択的に保護することもできると認識される;そのような保護方法には、望ましくない酵素活性を阻害する、メチル化および塩基の置換(例えば、Tの代わりにU)が含まれる。
【0185】
本発明の別の態様では、役立つ末端選択マーカーは、特定のポリヌクレオチド配列を認識するポリヌクレオチド作用酵素によって認識される末端配列である。本発明の1つの局面では、役立つポリヌクレオチド作用酵素には、古典的なタイプII制限酵素に加えて、他の酵素も含まれる。本発明のこの好ましい局面では、役立つポリヌクレオチド作用酵素には、ジャイレース(例えば、トポイソメラーゼ)、ヘリカーゼ、レコンビナーゼ、リラクセース、およびこれらに関連する任意の酵素も含まれる。
【0186】
子孫分子(例えば、変異導入によって作製された)から親鋳型分子(例えば、変異導入を行なう)を区別および分離するために、末端選択が使用できると認識される。例えば、トポイソメラーゼI認識部位を持たないプライマーの第1のセットを用いて、親分氏の末端領域を修飾できる(例えば、ポリメラーゼベースの増幅)。その後、プライマーの第2の異なるセット(例えば、トポイソメラーゼI認識部位を持つ)を用いて、増幅された鋳型分子から、変異した子孫分子(例えば、中断した合成、鋳型を切り替えるポリメラーゼベースの増幅、または中断した合成;または飽和変異導入を使用;または変異導入した子孫分子にトポイソメラーゼI認識部位を導入するための他の任意の方法のような、任意のポリヌクレオチドキメラ化法を使用)が作製できる。トポイソメラーゼIに基づく末端選択を使用すると、所望の子孫分子の識別のみならず、その選択的なトポイソメラーゼIに基づく連結が容易になる。
【0187】
トポイソメラーゼに基づくニッキングおよび連結を用いた末端選択手法は、以前に利用された選択方法と比較して、いくつかの利点があることが認識される。要するに、この手法によると、方向を定めたクローニング(発現クローニングを含む)が可能になる。
【0188】
ペプチドディスプレイ法
本方法を用いて、ペプチドディスプレイ法によって選択されたポリヌクレオチド配列を、開示された任意の方法および任意の組み合せによるインビトロおよび/またはインビボ組み換えによって、シャッフリングすることができる。ここで、関連するポリヌクレオチドは、表現型(例えば、事前に定められた受容体(リガンド)に対する親和性)のスクリーニングをする、ディスプレイされるペプチドをコードしている。
【0189】
バイオ医薬品の開発と分子生物学で重要度を増しつつある局面は、生体高分子と相互作用するペプチドまたはペプチド様物質のアミノ酸の一次配列を含む、ペプチド構造の同定である。事前に定められた生体高分子(例えば、受容体)に対する結合のような、所望の構造または機能的性質を持つペプチドを同定する1つの方法は、ペプチドのアミノ酸配列によって与えられる所望の構造または機能的性質を持つ個々のライブラリーメンバーを求めて、ペプチドの大きなライブラリーをスクリーニングすることである。
【0190】
ペプチドライブラリーの作製のために、直接の化学合成法に加えて、いくつかの組み換えDNA法も報告されている。1つのタイプでは、バクテリオファージ粒子または細胞の表面に、ペプチド配列、抗体、または他のタンパク質をディスプレイするものである。一般に、これらの方法では、各バクテリオファージまたは細胞は、天然のバクテリオファージまたは細胞タンパク質配列に加えて、単一の種のペプチドをディスプレイする個々のライブラリーメンバーの役割を果たす。各バクテリオファージまたは細胞には、特定のディスプレイされたペプチド配列をコードするヌクレオチド配列情報が含まれている;したがって、ディスプレイされた配列は、単離されたライブラリーメンバーのヌクレオチド配列を決定することで確認できる。
【0191】
周知のペプチドディスプレイ法では、通常はバクテリオファージのコートタンパクとの融合タンパク質として、糸状バクテリオファージの表面上にペプチド配列を提示する。バクテリオファージのライブラリーを、固定化した事前に決められた高分子または小分子(例えば、受容体)とインキュベートして、固定化した高分子に結合したペプチド配列を提示するバクテリオファージ粒子が、事前に決められた高分子に結合するペプチド配列を提示しない粒子から、差別的に分けられるようにする。その後、固定化した高分子に結合したバクテリオファージ粒子(すなわちライブラリーメンバー)を回収および複製して、次のアフィニティ濃縮およびファージ複製のラウンドのために、選択されたバクテリオファージサブ集合を増幅しておく。アフィニティ濃縮およびファージ複製を数ラウンドした後、このように選択されたバクテリオファージライブラリーメンバーを単離し、ディスプレイされたペプチド配列をコードするヌクレオチド配列を決定し、それにより事前に決められた高分子(例えば、受容体)に結合するペプチド配列を同定する。このような方法は、国際公開公報第91/17271号、91/18980号、91/19818号、および93/08278号にさらに記述されている。
【0192】
本発明は、受容体分子、関心対象のエピトープ、望ましいやり方でペプチドまたはRNAを修飾する遺伝子産物に結合する有用な化合物(例えば、一本鎖抗体を含むペプチド)を同定するために、ランダム、疑似ランダム、および定義された配列のフレームワークペプチドライブラリー、ならびにそのようなライブラリーの作製およびスクリーニング法も提供する。ランダム、疑似ランダム、および定義された配列フレームワークのペプチドは、ディスプレイされたペプチドがそれから合成されたポリヌクレオチド鋳型に結合した、ディスプレイされた一本鎖抗体、またはディスプレイされたペプチドを含む、ペプチドライブラリーメンバーのライブラリーから作製される。結合の方法は、選択された本発明の態様に応じて異なり、ファージ粒子の被包または細胞への取り込みを含み得る。
【0193】
本発明の有意な利点は、関心対象のペプチドリガンドまたは抗体を単離するために、期待されるリガンドの構造に関して、何も事前の情報が必要ではないということである。同定されるペプチドは、生物活性を持つ可能性があり、これは少なくとも選択された受容体分子に対する特異的な結合親和性を含み、さらに場合によっては、他の化合物の結合を阻止する能力、代謝経路を刺激または阻害する能力、シグナルまたはメッセンジャーとして作用する能力、細胞活性を刺激または阻害する能力等も含む。
【0194】
本発明は、事前に決められた受容体(例えば、ペプチドホルモン受容体、細胞表面受容体、他のタンパク質と結合してヘテロダイマー等のような細胞内タンパク質複合体を形成する細胞内タンパク質のような哺乳類のタンパク質受容体)またはエピトープ(例えば、固定化されたタンパク質、糖タンパク質、オリゴ糖等)に結合するライブラリーメンバーを探すために、本発明の方法により同定され、新生ペプチド(一本鎖抗体を含む)をディスプレイするポリソームのライブラリーの親和性スクリーニングによって選択された、ポリヌクレオチド配列のプールをシャッフリングする方法も提供する。
【0195】
これらの任意の方法により1回目の選択ラウンド(通常は受容体(例えば、リガンド)への結合の親和性の選択)で選択されたポリヌクレオチド配列は、プールされ、このプールはインビトロおよび/またはインビボ組み換えによってシャッフリングされて、組み換えられた選択済ポリヌクレオチド配列の集合を含むシャッフリング済プールが作製される。組み換えられた選択済ポリヌクレオチド配列は、少なくとも1回の引き続く選択ラウンドにかけられる。以後の選択ラウンドで選択されるポリヌクレオチド配列は、直接使用する、配列決定する、および/またはさらにもう1度またはそれ以上のシャッフリングラウンドと引き続く選択にかけることができる。選択された配列は、中立配列(すなわち、結合には非実質的な機能効果を持つ)をコードするポリヌクレオチド配列と戻し交雑できる。例えば、選択された配列と実質的に同一の自然発生配列または野生型と戻し交雑して、免疫原性の少ない天然様機能的ペプチドを生成する。一般に、戻し交雑の間、引き続く選択は、事前に決められて受容体(リガンド)への結合する性質を保持するために行われる。
【0196】
選択された配列のシャッフリング前またはそれと同時に、配列に変異を導入できる。1つの態様では、選択されたライブラリーメンバーを原核ベクター(例えば、プラスミド、ファージミド、またはバクテリオファージ)にクローニングし、別々のライブラリーメンバーを表す個々のコロニー(またはプラーク)の集合が作製される。その後、個々の選択されたライブラリーメンバーを操作して(例えば、部位指定突然変異導入、カセット変異導入、化学的変異導入、PCR変異導入等)、選択されたライブラリーメンバーの配列に基づく配列多様性の中核(kernal)を表すライブラリーメンバーの集合が作製できる。個々の選択されたライブラリーメンバーまたはプールを操作して、部分的または個々の選択されたライブラリーメンバー配列の全長に渡って、ランダム変異、疑似ランダム変異、規定のカーナル変異(すなわち、変異および不変の残基位置を含む、および/または規定のアミノ酸残基サブセットから選択された残基を含む変異残基位置を含む)、コドンベースの変異等を組み込むようにできる。その後、変異導入した選択されたライブラリーメンバーは、本明細書に開示されるようにインビトロおよび/またはインビボ組み換えシャッフリングによってシャッフリングできる。
【0197】
本発明はまた、本発明の複数の個々のライブラリーメンバーを含むペプチドライブラリーを提供するが、(1) 各複数の個々のライブラリーメンバーは、選択された配列プールのシャッフリングによって作製された配列を含み、(2) 各個々のライブラリーメンバーは可変のペプチド部分配列または一本鎖抗体部分配列を含み、(一部のライブラリーメンバーは、不均一な増幅、確率等のために、1ライブラリー当たり複数のコピーで存在するにもかかわらず、)これは該複数における他の個々のライブラリーメンバーの一本鎖抗体配列または可変ペプチド部分配列とは異なる。
【0198】
本発明はプロダクトバイプロセス(product−by−process)も提供する。ここで、事前に決められた結合特異性を持つ(または、持つペプチドをコードする)選択されたポリヌクレオチド配列は、以下のプロセスによって形成される:(1) 事前に決められた受容体(例えば、リガンド)またはエピトープ(例えば、抗原高分子)に対するディスプレイされた一本鎖抗体またはディスプレイされたペプチドのライブラリーをスクリーニングし、事前に決められた受容体またはエピトープに結合するライブラリーメンバーを同定および/または濃縮して、選択されたライブラリーメンバーのプールを作製する、(2) 事前に決められたエピトープに結合し、そのためにライブラリーから単離および/または濃縮された、選択されたライブラリーメンバー(またはその増幅またはクローニングされたコピー)を組み換えによりシャッフリングして、シャッフリング済ライブラリーを作製する、および (3) 事前に決められた受容体(例えば、リガンド)またはエピトープ(例えば、抗原高分子)に対してシャッフリング済ライブラリーをスクリーニングして、事前に決められた受容体またはエピトープに結合するシャッフリング済ライブラリーメンバーを同定および/または濃縮して、選択されたシャッフリング済ライブラリーメンバーのプールを作製する。
【0199】
抗体ディスプレイおよびスクリーニング法
本発明は、抗体ディスプレイ法によって選択されたポリヌクレオチド配列を、開示された任意の方法およびその任意の組み合せによって、インビトロおよび/またはインビボ組み換えによりシャッフリングするために使用できる。ここで、関連するポリヌクレオチドは、表現型(例えば、事前に決められた抗原(リガンド)に結合する親和性)のスクリーニングをするディスプレイされた抗体をコードしている。
【0200】
免疫グロブリン鎖中に存在し得る、非常に多くの異なる可変領域によって表される広範囲の免疫レパートリーを獲得するために、種々の分子遺伝学的手法が考案されてきた。自然に存在する生殖細胞系免疫グロブリンH鎖の遺伝子座は、縦に並ぶ多様性部分遺伝子の上流に位置する、縦に並ぶ可変部分の遺伝子からなり、前者は連結(i)領域遺伝子の上流に位置しており、これはC領域遺伝子の上流に位置している。Bリンパ球の発生において、V−D−Jの再配列が起こり、ここでH鎖可変領域遺伝子(VH)は、融合したD部分を形成し、その後に可変部分との再配列が生じ、V−D−J連結産物遺伝子を形成する再配列によって形成されるが、これは作製的に再配列された場合には、H鎖の機能的な可変領域(VH)をコードしている。同様に、L鎖の遺伝子座では、いくつかの可変部分のうちの1つと、いくつかのJ部分のうちの1つが再配列して、L鎖の可変領域(VL)をコードする遺伝子が形成される。
【0201】
免疫グロブリンで可能な可変領域の広範囲のレパートリーは、部分的には、B細胞の発生時におけるVおよびi部分(およびH鎖の遺伝子座の場合はD部分)の数多くの組み合せの可能性に起因する。H鎖の可変領域の更なる配列多様性は、V−D−J連結におけるD部分の不均一な再配列と、N領域の付加から産生される。さらに、特定のB細胞の抗原選択は、H鎖およびL鎖の可変領域の1つまたは両方における非生殖細胞系突然変異を持つ高親和性の変異体を選択する;これは「親和性成熟」または「親和性尖鋭化」と呼ばれる現象である。通常は、これらの「親和性尖鋭化」変異は、可変領域の特定の部分、多くの場合相補性決定領域(CDR)に集まっている。
【0202】
抗原刺激されたB細胞の発生(すなわち、免疫化)を通して高親和性の免疫グロブリンを作製および同定する際の多くの制限を克服するために、特定の抗原に対する高親和性抗体のスクリーニングができるコンビナトリアル抗体ライブラリーを作製するために操作できる、種々の原核発現システムが開発されてきた。大腸菌(E.coli)およびバクテリオファージ系における抗体の発現の最近の進歩(「別のペプチドディスプレイ法」、下記参照)によって、解析されたハイブリドーマから抗体遺伝子をクローニングするか、抗体遺伝子ライブラリー(例えば、Ig cDNAから)を用いた新規の選択によって、ほぼどんな特異性でも得られる可能性が生じてきた。
【0203】
バクテリオファージプラークとして、または溶原菌のコロニーとしてスクリーニングできる抗体のコンビナトリアルライブラリーは、バクテリオファージλ発現システムにおいて作製されてきた(Huseら、1989;CatonおよびKoprowski、1990; Mullinaxら、1990; Perssonら、1991)。バクテリオファージ抗体ディスプレイライブラリーおよびλファージ発現ライブラリーの様々な態様は、記述されてきた(Kangら、1991;Clacksonら、1991; McCaffertyら、1990; Burtonら、1991; Hoogenboomら、1991;Changら、1991; Breitlingら、1991; Marksら、1991、p581; Barbasら、1992;HawkinsおよびWinter、1992; Marksら、1992、p779; Marksら、1992、p16007; およびLowmanら、1991; Lernerら、1992; 全てが参照として本明細書に組み入れられている)。通常は、バクテリオファージ抗体ディスプレイライブラリーは、固定され(例えば、アフィニティクロマトグラフィーによって反応性ファージを濃縮するためのクロマトグラフィー樹脂に共有結合)、および/または標識された(例えば、プラークのスクリーニングまたはコロニーのリフトのため)受容体(例えば、ポリペプチド、炭化水素、糖タンパク質、核酸)によってスクリーニングする。
【0204】
1つの特に有利な手法は、いわゆる一本鎖可変領域抗体(scfv)ライブラリーを用いることである(Marksら、1992、p779; WinterおよびMilstein、1991; Clacksonら、1991; Marksら、1991、p581; Chaudharyら、1990; Chiswellら、1992; McCaffertyら、1990; およびHustonら、1988)。バクテリオファージコートタンパク上にディスプレイされたscfvライブラリーの種々の態様は、記述されている。
【0205】
1988年からは、抗体工学の方法によりFv断片の一本鎖アナログおよびその融合タンパク質は信頼性高く作製されてきている。一般に、その第1段階は所望の結合特性を持つVHおよびVLドメインをコードする遺伝子を入手することである;これらのV遺伝子は、特定のハイブリドーマ細胞株から単離したり、コンビナトリアルV遺伝子ライブラリーから選択したり、V遺伝子合成によって作製したりできる。一本鎖Fvは、V遺伝子成分を、(Gly−Gly−Gly−Gly−Ser)または同等なリンカーペプチドのように、適切に設計されたリンカーペプチドをコードするオリゴヌクレオチドと結合させて形成できる。リンカーは第1のV領域のC末端と、第2の領域のN末端を、VH−リンカー−VLまたはVL−リンカー−VHの順につなぐ。原則的に、scfv結合部位は、その親抗体結合部位の親和性と特異性の両方を忠実に再現できる。
【0206】
したがって、scfv断片は、VHとVLドメインが、柔軟なリンカーペプチドによって連結されて1本のポリペプチド鎖になったものである。scfv遺伝子を組み立てた後、ファージミドにクローニングし、バクテリオファージPIII(遺伝子3)コートタンパクとの融合タンパク質として、M13ファージ(または類似の糸状バクテリオファージ)の先端に発現させる。関心対象の抗体を発現するファージの濃縮は、事前に決められたエピトープ(例えば、標的抗原、受容体)への結合を探して集合scfvをディスプレイする組み換えファージをパンニングして行われる。
【0207】
ライブラリーメンバーの結合ポリヌクレオチドは、スクリーニングまたは選択の後にライブラリーメンバーを複製する基礎を提供し、またヌクレオチド配列決定によって、ディスプレイされたペプチド配列、またはVHおよびVLアミノ酸配列を同定する基礎を提供する。ディスプレイされたペプチドまたは一本鎖抗体(例えば、scfv)および/またはそのVHおよびVLドメインまたはそのCDRは、適当な発現系にクローニングして発現できる。しばしば単離されたVHおよびVLドメインをコードするポリヌクレオチドは、C領域(CHおよびCL)をコードするポリヌクレオチドと連結されて、完全な抗体(例えば、キメラまたは完全にヒト)、抗体断片等をコードするポリヌクレオチドが作製される。しばしば単離されたCDRをコードするポリヌクレオチドは、適切な可変領域フレームワーク(および選択的にC領域)をコードするポリヌクレオチドに移植され、完全な抗体(例えば、ヒト化または完全にヒト)、抗体断片等をコードするポリヌクレオチドが作製される。抗体は、免疫親和性クロマトグラフィーによって調製用の量の抗原を単離するために使用できる。そのような抗体の他の種々の用途には、疾病の診断および/または病期の判断(例えば、新形成)、および例えば新形成、自己免疫疾患、AIDS、心臓血管疾患、感染等のような疾病の治療がある。
【0208】
結合種(イディオタイプスペクトラム)のレパートリーを広げるために、scfvライブラリーのコンビナトリアルな多様性を増加させるために、種々の方法が報告されている。PCRを使用することで、特定のハイブリドーマ源から、または非免疫細胞からの遺伝子ライブラリーとして可変領域が速やかにクローニングできるようになり、組み合せることのできるVHおよびVLカセットの種類にコンビナトリアルな多様性が生じた。さらに、VHおよびVLカセットは、ランダム、疑似ランダム、または指定変異導入などによって、それ自身を多様化できる。通常は、VHおよびVLカセットは、相補性決定領域(CDRS)、しばしば3番目のCDRであるCDR3においてまたはその付近で多様化される。酵素による逆PCR変異導入は、scfv部位指定ハイブリッドの比較的大きなライブラリーを作製するために簡単で信頼できる方法であることが示されており(Stemmerら、1993)、エラープローンPCRおよび化学的変異導入(Dengら、1994)も同様である。Riechmann(Riechmannら、1993)は、縮重オリゴヌクレオチドPCRおよびそれに引き続くscfvハイブリッドのファージディスプレイによる部位指定ランダム化を用いて、抗体scfv断片の準合理的設計を示した。Barbas(Barbasら、1992)は、偏りのある可変領域配列を用いるために生じるレパートリーサイズの制限の問題を、ヒト破傷風毒素結合Fabの合成CDR領域の配列をランダム化することによって回避しようとした。
【0209】
CDRランダム化は、H鎖のCDR3のみでも約1×1020のCDR、ならびにH鎖CDR1およびCDR2、およびL鎖CDR1−3でも、ほぼ同じ数の変異体を作製する可能性を持つ。別々または合わせて、H鎖および/またはL鎖のCDRランダム化の組み合せの可能性には、全ての可能性の組み合せを表すクローンライブラリーを作製するために、法外な数のバクテリオファージクローンを作製する必要があるが、その内の大部分は結合しないものである。そのような多数の一次形質転換体を作製することは、現在の形質転換技術およびバクテリオファージディスプレイシステムでは実現性に乏しい。例えば、Barbas(Barbasら、1992)は5×107の形質転換体を作製したのみであり、これは完全にランダム化したCDRSのライブラリーの潜在的多様性のごく一部を表すのみである。
【0210】
このような実質的な制約にもかかわらず、scfvのバクテリオファージディスプレイは、すでに様々な有用な抗体および抗体融合タンパク質を生み出している。二重特異性一本鎖抗体は、効率の良い腫瘍細胞溶解を仲介することが示されている(Gruberら、1994)。抗Rev scfvの細胞内発現は、インビトロでHIV−1ウイルス複製を阻害することが示されており(Duanら、1994)、抗p21rar、scfvの細胞内発現は、アフリカツメガエルの卵母細胞の成熟分裂を阻害することが示されている(Bioccaら、1993)。HIV感染を診断できる組み換えscfvも報告されており、scfvが診断に利用できることが示された(Lilleyら、1994)。scFvが毒素または線維素溶解活性化タンパク質のような第2のポリペプチドに連結される融合タンパク質も報告されている(Holvostら、1992; Nichollsら、1993)。
【0211】
抗体の多様性がより高く、潜在的な組み合せのごく一部しかカバーできないという通常のCDR変異導入およびランダム化法の多くの限界を克服するscfvライブラリーの作成が可能ならば、治療と診断に使用できるscfv抗体の数と質は大きく改善されるだろう。これに対処するために、本発明のインビトロおよびインビボシャッフリング法を用いて、選択されたディスプレイされた抗体から得られた核酸から得られたCDR(通常はPCR増幅またはクローニングによる)の組み換えが行われる。そのようなディスプレイされた抗体は、細胞、バクテリオファージ粒子、ポリソーム、または抗体がそのコードする核酸に関連付けされる任意の抗体ディスプレイシステム上でディスプレイされることができる。1つのバリエーションでは、CDRは最初は、抗体産生細胞(それに由来するハイブリドーマを含む)(例えば、国際公開公報第92/03918号、国際公開公報第93/12227号、国際公開公報第94/22585号のような免疫された野生型マウス、ヒト、またはヒト抗体を作製する能力のあるトランスジェニックマウス由来の形質細胞/脾細胞)のmRNA(またはcDNA)から得られる。
【0212】
組み換え選択済ポリヌクレオチド配列群を含むシャッフリングされたプールを作製するために、これらの任意の方法によって1回目の選択で選択されたポリヌクレオチド(通常は、抗原(例えば、リガンド)に結合する、ディスプレイされる抗体の親和性選択による)はプールされ、このプールはインビトロおよび/またはインビボ組み換えによってシャッフリング、特に、CDR(通常はH鎖CDRを他のH鎖CDRと、L鎖CDRを他のL鎖CDRとシャッフリング)のシャッフリングがなされる。組み換えられた選択済ポリヌクレオチド配列は、ディスプレイされた抗原として選択フォーマットで発現され、その後、少なくとも1回の選択が行われる。その後の選択ラウンドで選択されたポリヌクレオチド配列は、直接に使用したり、配列決定したり、および/または所望の結合親和性を持つ抗体が得られるまでさらに1回またはそれ以上のシャッフリングと選択を行なえる。選択された配列は、例えば、ヒト可変領域フレームワークと戻し交雑してヒト様配列抗体を作製するなど、中立の抗体フレームワーク配列(すなわち、抗原結合に機能的影響を実質的に持たない)をコードするポリヌクレオチド配列と戻し交雑してもよい。一般に、事前に決められた抗原に結合する性質を保持するために、戻し交雑後に選択を行なう。
【0213】
代わりに、または記述されたバリエーションとの組み合せで、選択されたscfvライブラリーメンバーの平均結合親和性をコントロールするために、標的エピトープの結合価を変化させることもできる。標的エピトープは、例えば競合エピトープを含めたり、希釈したり、当業者に周知の他の方法によって、様々な密度で表面または基質に結合させることができる。高い密度(結合価)の事前に決められたエピトープは、比較的低い親和性を持つscfvライブラリーメンバーの濃縮に使用できるが、低い密度(結合価)は、高い親和性のscfvライブラリーメンバーを選択的に濃縮できる。
【0214】
多様な可変部分を作製するために、ペプチド配列のランダム、疑似ランダム、または規定された配列カーナルセットをコードする合成オリゴヌクレオチドの集合が、連結によって、事前に決められた部位(例えば、CDR)に挿入できる。同様に、一本鎖抗体カセットの1つまたはそれ以上のCDRの配列多様性は、部位指定変異導入、CDR置換等によってCDRを変異させることによって、拡張できる。得られたDNA分子は、シャッフリングの前にクローニングと増幅のために宿主中で増殖させるか、直接使用して(すなわち、宿主細胞で増殖させた際の多様性の損失を避けるため)、選択されたライブラリーメンバーをその後シャッフリングできる。
【0215】
関心対象の可変部分ペプチド配列または関心対象の一本鎖抗体をコードする、ディスプレイされたペプチド/ポリヌクレオチド複合体(ライブラリーメンバー)は、親和性濃縮テクニックによってライブラリーから選択される。これは、受容体、他の高分子、または他のエピトープ種のような、関心対象のペプチド配列に特異的な固定化した高分子またはエピトープを用いて行なう。親和性選択手順を繰り返すと、所望の配列をコードするライブラリーメンバーが濃縮でき、その後これはプールとシャッフリング用、配列決定用、および/または更なる増殖と親和性濃縮用に、単離できる。
【0216】
所望の特異性を持たないライブラリーメンバーは、洗浄して除去する。必要な洗浄の度合いと厳密度は、関心対象の各ペプチド配列または一本鎖抗体、および固定化された事前に決められた高分子またはエピトープごとに決定される。結合インキュベーションおよびその後の洗浄の条件を調整することによって、回収される新生ペプチド/DNA複合体の結合特性に関して、ある程度のコントロールが可能である。温度、pH、イオン強度、二価陽イオン濃度、および洗浄の体積と時間によって、固定された高分子に対する特定の範囲の親和性を持つ新生ペプチド/DNA複合体が選択される。通常は高い親和性を予期させるゆっくりした解離速度に基づく選択は、しばしば最も実際的なルートである。これは、遊離の事前に決められた高分子の飽和量の存在下で連続的にインキュベートするか、洗浄の体積、数、および時間を増加させるかによって、行なえる。いずれの場合も、解離した新生ペプチド/DNAまたはペプチド/RNA複合体の再結合が予防され、時間を増やしていくと、より高い親和性を持つ新生ペプチド/DNAまたはペプチド/RNA複合体が回収される。
【0217】
結合および洗浄手順をさらに変更すると、特別な特性を持つペプチドが得られる場合がある。一部のペプチドの親和性は、イオン強度または陽イオン濃度に依存する。これは、ペプチドからタンパク質を除去するために穏やかな条件が必要な場合に、種々のタンパク質の親和性による精製に使用できる、ペプチドの有用な特徴である。
【0218】
1つのバリエーションでは、複数の結合標的(複数のエピトープ種、複数の受容体種)を用いて、scfvライブラリーを、異なる結合特性を持つ複数のscfvについて同時にスクリーニングする。scfvライブラリーのサイズがしばしば潜在的なscfv配列の多様性の限界となることを考えると、普通はできる限り大きなサイズのscfvライブラリーを使用することが望ましい。いくつもの非常に大きなポリソームscFvディスプレイライブラリーを作製するための時間と費用は、膨大なものになり得る。この大きな問題を避けるため、単一のライブラリーで、複数の事前に決められたエピトープ種(受容体種)を同時にスクリーニングしたり、いくつかのエピトープ種に関して順次スクリーニングしたりできる。1つのバリエーションでは、各々別のビーズ(またはビーズのサブセット)上にコードされた複数の標的エピトープ種を、適当な結合条件下でポリソームディスプレイscfvライブラリーと混合し、インキュベートできる。そして、複数のエピトープ種を含むビーズの集合を用いて、scfvライブラリーメンバーを親和性選択によって単離できる。一般に、引き続く親和性スクリーニングのラウンドには、同じビーズ混合物、そのサブセット、または1つまたは2つの個々のエピトープ種のみを含むビーズが使用できる。この方法によると効率良いスクリーニングが可能になり、これは実験室の自動化、バッチプロセッシング、およびハイスループットスクリーニングに適合する。
【0219】
本発明では種々のテクニックを使って、ペプチドライブラリーもしくは一本鎖抗体ライブラリーを多様化したり、またはシャッフリングの前または同時に、初期のパンニングのラウンドで事前に決められた高分子またはエピトープに対して十分な結合活性を持つことが分かった可変部分セグメントのペプチドを多様化することができる。1つの手法では、陽性の選択されたペプチド/ポリヌクレオチド複合体(親和性濃縮の初期のラウンドで同定されたもの)の配列決定をして、活性ペプチドの同定をする。その後これらの活性ペプチド配列に基づいてオリゴヌクレオチドを合成するが、各段階で低レベルの全ての塩基を組み込んで、オリゴヌクレオチドの一次配列にわずかな変化をつける。そして、この(わずかに)縮重したオリゴヌクレオチドの混合物を、可変部分配列に適切な位置でクローニングする。この方法では、開始ペプチド配列に体系的にコントロールした変化をつけられ、これはその後にシャッフリングできる。しかし、変異導入の前に、個々の陽性新生ペプチド/ポリヌクレオチド複合体の配列決定が必要であり、そのために少数の回収された複合体の多様性を拡張したり、より高い結合親和性および/またはより高い結合特異性を持つ変異体の選択に有用である。1つのバリエーションである、選択された陽性ペプチド/ポリヌクレオチド複合体(特に可変領域配列)の変異導入PCRの増幅では、インビトロおよび/またはインビボでシャッフリングされ、配列決定の前に1つまたはそれ以上の更なるスクリーニングラウンドが行われる。同じ一般的な手法は、多様性を拡張し、結合親和性/特異性を増強するために、一本鎖抗体でも使用でき、通常はシャッフリングの前または同時にCDRまたは隣接フレームワーク領域が多様化される。望むならば、シャッフリング反応では、選択されたライブラリーメンバーとインビトロで組み換え可能な変異導入オリゴヌクレオチドをスパイクすることができる。したがって、合成オリゴヌクレオチドおよびPCRで作製されたポリヌクレオチド(エラープローンまたは高忠実度の方法で合成)の混合物をインビトロのシャッフリング混合物に添加し、得られるシャッフリング済ライブラリーメンバー(シャフラント)に組み入れることができる。
【0220】
シャッフリングの発明は、CDR異型一本鎖抗体の巨大なライブラリーの作製を可能にする。そのような抗体を作製する1つの方法は、合成CDRを一本鎖抗体に挿入する、および/またはシャッフリング前または同時のCDRランダム化である。合成CDRカセットの配列は、ヒトCDRの既知の配列を参照にして選択され、以下のガイドラインにしたがって実施者の裁量で選択される:合成CDRは既知のCDR配列と少なくとも40%の位置上の配列同一性を持ち、好ましくは既知のCDR配列と少なくとも50から70%の位置上の配列同一性を持つ。例えば、合成CDR配列の集合は、Kabat(Kabatら、1991)にリストされている自然に存在するヒトCDR配列に基づいて、オリゴヌクレオチド配列の集合を合成することによって作製できる;合成CDR配列のプールは、少なくとも1つの既知の自然に存在するヒトCDR配列と、少なくとも40%の配列同一性を持つCDRペプチド配列をコードすると計算される。または、自然に存在するCDRの集合を比較して、コンセンサス配列を作製し、1つの残基位置で頻繁に(すなわち、既知のCDRの少なくとも5%)使用されるアミノ酸が対応する位置で合成CDRに組み込まれるようにする。通常は、いくつかの(例えば、3から約50)の既知のCDR配列が比較され、既知のCDRの間に観察される自然配列の変異を表にして、観察される自然の配列変異の順列の全てまたは大部分を包含するCDRペプチド配列をコードするオリゴヌクレオチドの集合が合成される。例えば、ヒトVH CDR配列の集合のカルボキシ末端のアミノ酸がTyr、Val、PheまたはAspのいずれかであれば、カルボキシ末端CDR残基がこれらのアミノ酸のいずれかであるように、合成CDRオリゴヌクレオチド配列が設計される。いくつかの態様では、CDR配列の集合において、1つの残基位置に自然に存在する残基以外の残基が組み込まれる:保存的なアミノ酸置換はしばしば組み込まれ、既知の自然に存在するCDR配列と比較して、最高5つの残基位置まで、非保存的アミノ酸置換を組み込むために変化できる。そのようなCDR配列は、一次ライブラリーメンバー(第1回のスクリーニング前)で使用したり、および/または選択されたライブラリーメンバー配列のインビトロシャッフリング反応にスパイクするために使用できる。そのような規定されたおよび/または縮重の配列のプールの作製は、当業者によって容易に実施される。
【0221】
合成CDR配列の集合には、自然に存在するCDR配列ではないことが知られているメンバーが少なくとも1つ含まれる。H鎖CDR中でN領域付加に対応するランダムまたは疑似ランダム配列を含めるか否かは、実施者の裁量である。N領域配列は、1ヌクレオチドから約4ヌクレオチドで、V−DおよびD−J接合部で発生する。合成H鎖CDR配列は、少なくとも約100のユニークなCDR配列、通常は少なくとも約1,000のユニークなCDR配列、好ましくは少なくとも約10,000のユニークなCDR配列、しばしば50,000以上のユニークなCDR配列を含む;しかし、通常1×10 6以下のユニークなCDR配列がこの集合には含まれるが、特に、自然に存在するヒトCDRでは保存的アミノ酸置換体が存在しないまたはまれな(すなわち0.1%未満)位置で、保存的アミノ酸置換が許可される場合には、時には1×107から1×108のユニークなCDR配列が存在する。一般に、ライブラリーに含まれるユニークなCDR配列の数は、ライブラリー中の期待される一次形質転換体の数の10倍を超えないほうが良い。そのような一本鎖抗体は、一般に少なくとも1×10 m−、好ましくは少なくとも5×107 M−1の親和性、より好ましくは少なくとも1×108 M−1から1×109 M−1またはそれ以上、時折最高1×1010 M−1またはそれ以上の親和性で結合する。しばしば、事前に決められた抗原はヒトタンパク質であり、例えばヒト細胞表面抗原(例えば、CD4、CD8、IL−2受容体、EGF受容体、PDGF受容体)、他のヒト生体高分子(例えば、トロンボモジュリン、プロテインC、炭化水素抗原、シアリルルイス抗原、Lセレクチン)、または非ヒト疾病関連高分子(例えば、細菌LPS、ビリオンキャプシドタンパク質、またはエンベロープ糖タンパク質)などがある。
【0222】
所望の特異性を持つ高親和性一本鎖抗体は種々の系で操作および発現できる。例えば、scfvは植物で作製され(Firekら、1993)、原核システムでも容易に作製できる(OwensおよびYoung、1994;JohnsonおよびBird、1991)。また、一本鎖抗体は、抗体全体またはその断片を作製する基礎として使用できる(Kettleboroughら、1994)。可変領域をコードする配列を単離して(例えば、PCR増幅またはサブクローニングによる)、所望のヒトC領域をコードする配列にスプライスし、好ましくは免疫原性が低下し、ヒトの治療により適したヒトの配列の抗体をコードするようにできる。得られた完全にヒトの配列をコードするポリヌクレオチドは、宿主細胞(例えば、哺乳類細胞中で発現ベクターから)で発現し、薬学的組成物を精製することができる。
【0223】
本発明の抗体、個々の変異免疫グロブリン鎖、変異抗体断片、および他の免疫グロブリンポリペプチドが発現されたら、硫酸アンモニウム沈殿、分画カラムクロマトグラフィー、ゲル電気泳動などの当技術分野の標準的な方法にしたがって、精製できる(一般にScopes、1982参照)。望むように部分的または均一にまで精製されたら、ポリペプチドを治療に使用したり、アッセイ手順、免疫蛍光染色等の開発および実行に使用したりできる(一般にLefkovitsおよびPernis、1979および1981;Lefkovits、1997参照)。
【0224】
本発明の方法で作製された抗体は、診断および治療に使用できる。限定ではなく実例として、これらは癌、自己免疫疾患、またはウイルス感染の治療に使用できる。癌の治療には、抗体は通常、erbB−2、CEA、CD33および当業者に周知の他の多くの抗原および結合メンバーのような、癌細胞に選択的に発現される抗原に結合する。
【0225】
シャッフリングを用いて、事前に決められたポリペプチド配列に結合するライブラリーメンバーを同定するために、ツーハイブリッドスクリーニングシステムによるスクリーニングで得られた選択されたライブラリーメンバーのプールを多様化できる。選択されたライブラリーメンバーは、プールされ、インビトロおよび/またはインビボ組み換えによってシャッフリングされる。そして、シャッフリングされたプールを酵母のツーハイブリッドシステムでスクリーニングして、該事前に決められたポリペプチド配列(例えば、SH2ドメイン)に結合するか、別の事前に決められたポリペプチド配列(例えば、別のタンパク質種のSH2ドメイン)に結合するライブラリーメンバーを選択する。
【0226】
事前に決められたポリペプチド配列に結合するポリペプチド配列の同定するための1つの方法は、いわゆる「ツーハイブリッド」システムを使用するもので、そこでは、事前に決められたポリペプチド配列が融合タンパク質として存在する(Chienら、1991)。この手法では、転写活性化因子(FieldsおよびSong、1989)、酵母Gal4転写タンパク質の再生を通して、インビボでタンパク質−タンパク質相互作用を同定する。通常は、この方法は酵母Gal4タンパク質の性質に基づいており、このタンパク質はDNA結合ドメインと転写活性化ドメインという分離可能なドメインからなる。1つは既知のタンパク質のポリペプチド配列に融合した酵母のGal4 DNA結合ドメインからなり、もう1つは第2のタンパク質のポリペプチド配列に融合したGal4活性化ドメインからなる2つのハイブリッドタンパク質をコードするポリヌクレオチドが作製され、酵母宿主細胞に導入される。2つの融合タンパク質の間の分子間結合が産生されると、Gal4 DNA結合ドメインがGal4活性化ドメインと再構成され、Gal4結合部位に機能的に連結されているレポーター遺伝子(例えば、lacz、HIS3)の転写が活性化する。通常は、ツーハイブリッド法は既知のタンパク質と相互作用する新規のポリペプチドを同定するために使用される(SilverおよびHunt、1993; Durfeeら、1993; Yangら、1992; Lubanら、1993; Hardyら、1992 ; Bartelら、1993; およびVojtekら、1993)。しかし、第2の既知のタンパク質への結合に影響を与える既知タンパク質中の変異を同定するために、ツーハイブリッド法のバリエーションが使用されてきた(LiおよびFields、1993; Laloら、1993; Jacksonら、1993; およびMaduraら、1993)。ツーハイブリッドシステムは、2つの既知のタンパク質の相互作用する構造のドメインや(Bardwellら、1993; Chakrabartyら、1992; Staudingerら、1993; およびMilneおよびWeaver 1993)、または単一のタンパク質のオリゴマー化をになうドメインの同定(Iwabuchiら、1993; Bogerdら、1993)にも使用されている。ツーハイブリッドシステムのバリエーションは、タンパク質分解酵素のインビボ活性の研究に使用された(Dasmahapatraら、1992)。または、大腸菌(E.coli)/BCCP相互作用スクリーニングシステム(Germinoら、1993; Guarente、1993)を用いて、相互作用するタンパク質配列(すなわち、ヘテロダイマーまたは、より高次のヘテロ多量体を形成するタンパク質配列)を同定することができる。ツーハイブリッドシステムによって選択された配列は、事前に決められた結合配列を含むハイブリッドに結合するポリペプチド配列を同定するためのスクリーニングを、さらに1回またはそれ以上行なうために、プールし、シャッフリングし、ツーハイブリッドシステムに導入することができる。このようにして同定された配列は、コンセンサス配列およびコンセンサス配列カーナルを同定するために比較される。
【0227】
鋳型DNAの1μgの試料を入手して、UV光で処理して、TT二量体を含む二量体、特にプリン二量体の形成を誘導する。UV照射は鋳型DNA試料上で1つの遺伝子当たり数コの光化学反応生成物のみが生成するように、制限される。複数の試料に異なる時間UV照射を行い、UV照射によって、種々の数の二量体を持つ鋳型DNAが得られるようにする。
【0228】
プルーフリーディング活性を持たないポリメラーゼを利用するランダムプライミングキット(例えば、Stratagene Cloning SystemsによるPrime−It II Random PrimerLabelingキット)を用いて、UV光によって調製された鋳型(上述)上のランダムな部位でプライミングし、鋳型に沿って伸長することによって、種々のサイズのポリヌクレオチドが生成する。Prime−It II Random Primer Labelingキットに記述されているようなプライミングプロトコールは、プライマーの伸長に利用できる。UV照射によって形成された二量体は、プルーフリーディング活性を持たないポリメラーゼによる伸長の妨害物の役割を果たす。こうして、ランダムプライマーによる伸長が終了した後で、ランダムなサイズのポリヌクレオチドのプールが存在することになる。
【0229】
本発明は、通常は増幅および/またはクローニングされたポリヌクレオチドの形で、選択された変異ポリヌクレオチド配列(または選択されたポリヌクレオチド配列の集合)を作製する方法にも使用できる。ここで、選択されたポリヌクレオチド配列は、選択可能な、少なくとも1つの所望の表現型の特徴(例えば、ポリペプチドをコードする、連結されたポリヌクレオチドの転写を促進する、タンパク質に結合する等)を持っている。事前に決められた生体高分子に結合する(例えば、受容体)といった所望の構造または機能の特性を持つハイブリッドポリペプチドを同定する1つの方法は、ポリペプチドのアミノ酸配列によって与えられる所望の構造または機能の特性を持つ個々のライブラリーメンバーを探すために、大きなポリペプチドライブラリーをスクリーニングすることである。
【0230】
1つの態様では、本発明は、親和性相互作用スクリーニングまたは表現型スクリーニングに適した、ディスプレイされたポリペプチドまたは抗体のライブラリーを作製する方法を提供する。本方法では、(1) ディスプレイされたポリペプチドまたは抗体、および該ディスプレイされたポリペプチドまたは抗体をコードする関連するポリヌクレオチドを含む複数の選択されたライブラリーメンバーを手に入れ、該関連ポリヌクレオチドが実質的に同一の配列を含むような、該関連ポリヌクレオチドまたはそのコピーを手に入れ、該ポリヌクレオチドまたはコピーに最適に変異を導入し、(2) ポリヌクレオチドまたはコピーをプールし、(3) ランダムまたは特殊化したプライミングおよび合成プロセスまたは増幅プロセスによる中断によって、より小さいまたは短いポリヌクレオチドを作製し、および (4) 増幅、好ましくはPCR増幅を行ない、選択的に変異導入を行なって、新しく合成されたポリヌクレオチドを相同組み換えする。
【0231】
以下を含む一連の段階によって、有用なハイブリッドポリペプチドを発現するハイブリッドポリヌクレオチドを作製するプロセスを提供することは、本発明の目的である:
(a) 増幅または合成プロセスを阻止または中断する手段を用いて、ポリヌクレオチドの増幅または合成プロセスを中断することによってポリヌクレオチドを作製し、種々の完成段階にあるポリヌクレオチドの複製のために、複数のより小さなまたは短いポリヌクレオチドを提供する;
(b) 得られた一本鎖または二本鎖ポリヌクレオチド集合に、1つまたは複数の一本鎖または二本鎖オリゴヌクレオチドを添加する。ここで、該添加されたオリゴヌクレオチドは、集合の1つまたは複数の一本鎖または二本鎖ポリヌクレオチドに対する非相同性領域中に同一の領域を含む;
(c) 得られた一本鎖または二本鎖オリゴヌクレオチドを変性させて、一本鎖ポリヌクレオチドの混合物を作製し、選択的により短いまたは小さいポリヌクレオチドを種々の長さを持つポリヌクレオチドのプールに分離し、さらに選択的に、該ポリヌクレオチドをPCR手順を施して、少なくとも1つの該ポリヌクレオチドプールに含まれる1つまたはそれ以上のオリゴヌクレオチドを増幅する;
(d) 複数の該ポリヌクレオチドまたは少なくとも1つの該ポリヌクレオチドのプールを、一本鎖ポリヌクレオチドの間で同一の領域において該一本鎖ポリヌクレオチドがアニーリングするような条件下で、ポリメラーゼとインキュベートして、それによって変異導入された二本鎖ポリヌクレオチド鎖を形成させる;
(e) 選択的に段階(c)および(d)を繰り返す;
(f) 該ポリヌクレオチド鎖から、少なくとも1つのハイブリッドポリペプチドを発現させる;
(g) 該少なくとも1つのハイブリッドポリペプチドから有用な活性をスクリーニングする。
【0232】
本発明の1つの好ましい局面では、増幅または合成プロセスの阻止または中断方法は、UV光、DNA付加物、DNA結合タンパク質の利用である。
【0233】
本発明の1つの態様では、DNA付加物、またはDNA付加物を含むポリヌクレオチドは、DNA断片を含む溶液の加熱を含むプロセスなどによって、さらに処理する前にポリヌクレオチドまたはポリヌクレオチドプールから除去される。
【0234】
1つの局面では、核酸はスクリーニングまたは配列決定の前に標準化できる。
【0235】
DNA単離
環境試料から標準化されたDNAライブラリーを作製する時の重要なステップは、試料からの核酸の調製である。DNAは、当技術分野で周知の様々なテクニックを用いて試料から調製できる(「環境中の核酸、方法および応用(Nucleic Acids in the Environment Methods & Applications)」、J.T.Trevors、D.D.van Elsas、Springer Laboratory、1995)。好ましくは、得られたDNAのサイズは大きく、酵素阻害剤および他の汚染物質を含まない。DNAは環境試料から直接単離することもできるが(直接の溶解)、DNA回収の前に細胞を収集することもできる(細胞の分離)。細胞の分離に基づくプロトロールに比較して、直接溶解手順には、いくつかの利点がある。直接溶解テクニックでは、細胞分離テクニックで回収されるDNAと比較して、一般に微生物のコミュニティをより広く代表するDNAがより多く得られるが、サイズはより小さいことがあり、酵素阻害剤を含む可能性がより高い。高分子量および高純度のDNAを提供する、非常に有用な直接溶解テクニックが最近記述された(Barns、1994; Holben、1994)。阻害剤存在する場合には、採用できる細胞単離を利用するプロトコールがいくつかある(Holben、1994)。また、以下に記述するビスベンジミド分離(塩化セシウム単離)のような分画テクニックを用いてDNAの純度を改善することもできる。
【0236】
標準化の前にDNA試料を分画すると、サンプリングした生物体プールに少数しか存在しない種のDNAをクローニングする確率が高くなる。本発明では、好ましくはDNAは密度遠心テクニックを用いて分画される。そのようなテクニックの一例は、塩化セシウム勾配である。好ましくは、このテクニックはDNAの領域に結合して核酸の浮遊密度を変化させる、核酸インターカレート剤の存在下で行なう。より好ましくは、核酸インターカレート剤は、DNAの領域(ビスベンジミドの場合にはAT)(Muller、1975; Manuelidis、1977)に選択的に結合するビスベンジミドのような色素である。ビスベンジミドのようなインターカレート剤と複合体を作った核酸は、適当な塩化セシウム勾配で分離されるので、核酸は分画される。インターカレート剤がGCまたはAT領域のようなDNA領域に選択的に結合すると、核酸はDNAの相対的な塩基含量によって分離される。複数の生物体の核酸は、このようにして分離できる。
【0237】
密度勾配は、現在、核酸を分画するために利用されている。例えば、土壌のタイピングおよび生物環境浄化に使用する微生物核酸の分離には、ビスベンジミド密度勾配の利用が記述されている。これらの実験では、生物環境浄化処理の前後で、固定されたベンジミド勾配におけるA.sub.260ピークの相対量を評価して、細菌群がどのように影響されたかを検討する。このテクニックは、平均して種のGC含量は相対的に一定であるという前提に基づいている。本発明ではこのテクニックはゲノムの複雑な混合物の分画に利用される。試料由来の核酸を超遠心して分画し、発表された手順にしたがってA.sub.260を測定する。
【0238】
本発明の1つの局面では、各ピークから等量のA.sub.260ユニットが取り出され、以下に説明するものを含め当技術分野で周知の種々の増幅プロトコールを用いて核酸が増幅され、遺伝子ライブラリーが調製される。または、各ピークから等量のA.sub.260が取り出され、この核酸から直接に遺伝子ライブラリーが調製される。このようにして遺伝子ライブラリーは、各ピークからの同じ量のDNAの組み合せから調製される。この戦略によって、分画しないDNA試料全体からライブラリーが作製されていたなら、生物体が非常に少量しか存在しないために表されないか失われる場合もあるような、環境試料および濃縮物内に少量存在する生物体からも、遺伝子を得ることができる。または、以下に説明するテクニックを用いて分画後にDNAを標準化できる。その後、この分画済/標準化DNAからDNAライブラリーを作製できる。
【0239】
分画された核酸の複数の画分の組成は、当技術分野で周知のPCR関連増幅分類法を用いて決定できる。
【0240】
以前の標準化プロトコールは、標準化cDNAライブラリーの作製のために設計された(国際公開公報第95/08647号、国際公開公報第95/11986号)。これらのプロトコールは、もともとMRNA由来のまれなcDNAのクローニングと単離のために開発された。本発明は非培養または環境試料からの、標準化したゲノムDNA遺伝子ライブラリーの作製に関する。
【0241】
環境試料または初代濃縮培養から直接単離された核酸試料は、通常多数の微生物由来のゲノムを含む。このような複雑な生物コミュニティは、1つの集合内に存在する種の絶対数、および試料内の各生物体の相対量によって記述することができる。試料内の各生物体の全体の標準化は、非常に困難である。光ピンセットのような分離テクニックは、試料中で形態学的に異なるメンバーを選ぶために使用できる。各メンバーの細胞を同じ数ずつ合わせるか、試料中の各メンバーの純粋培養を調製して、各純粋培養の細胞を同じ数ずつ合わせることで、標準化を行なう。実際には、これは特にハイスループットでは非常に困難な作業である。
【0242】
本発明は、環境試料中に存在するゲノムの標準化、標準化した核酸からのDNAの作製、および関心対象の活性に関するライブラリーのスクリーニングのためのテクニックの使用に関する。
【0243】
本発明の1つの局面では、試料からDNAが単離され、分画される。そして核酸の鎖を溶解して、一定条件で選択的にアニーリングさせる(C.sub.o t駆動のハイブリダイゼーション)。または、この溶解プロセスの前にDNAを分画しない。核酸断片の混合物が溶解され、厳密条件下でアニールされると、頻度の高い配列は、低い配列よりも速く相補鎖を見つける。選択的に一本鎖核酸単離を行なった後、まれな配列の濃縮物を表す一本鎖核酸を増幅して、遺伝子リブラリーを作製する。この手順によって、まれまたは量の少ない核酸分子が増幅されることになる。これらの分子を用いて、ライブラリーが作製される。全てのDNAが回収されると、もともとDNAを含んでいた生物体の識別が失われうる。この方法では、「クローニングできない供給源」からDNAを回収することができる。
【0244】
以前に記述されたテクニックを用いて得られた核酸試料を増幅して、標準化プロセスを完了する。例えば、試料はKoら(Ko、1990b; Ko、1990a、Takahashi、1994)によって記述されたようなPCR増幅プロトコール、またはより好ましくはBarnes (1994)またはCheng (1994)に記述された長いPCRプロトコールを用いて、増幅される。
【0245】
標準化は直接行なうか、標準化プロセスの前に核酸プールの複雑度を減らすための手順を踏んでから行なう。複雑度を低下させることは、あまり表されていない生物体から核酸を回収するために有益である。
【0246】
ライブラリーを調製する元になる微生物には、真正細菌(Eubacteria)および古細菌(Archaebacteria)のような原核微生物、および真菌、一部の藻類、プロトゾアのような下等真核微生物が含まれる。微生物は環境試料から得た培養微生物または非培養微生物で、そのような微生物は好熱菌、超好熱菌、好冷菌、低温細菌等のようなエクストレモフィルでよい。
【0247】
上述のように、ライブラリーは環境試料から作製することができるが、その場合、DNAは生物体の培養なしで回収しても良いし、培養生物体から回収しても良い。
【0248】
標的DNAを得るための開始材料ライブラリーとしての微生物DNA供給源は、特に、北極および南極の氷、水、または永久凍土から得られた微生物試料、火山由来の材料、熱帯の土壌または植物由来の材料等のような環境試料を含むと考えられる。したがって、例えば、ゲノムDNAは培養可能または培養不能な生物体から回収し、適切な組み換え発現ライブラリーの作製に用いて、その後、酵素活性を決定することができる。
【0249】
細菌および多くの真核生物は、その産物が関連したプロセスに関与する遺伝子を調節するための協調した機構を持っている。遺伝子は単一の染色体上で「遺伝子クラスター」と呼ばれる構造となって密集し、クラスター全体の転写を開始する単一のプロモーターを含む単一の調節配列の制御下で、一緒に転写される。合わせて調節に関与する遺伝子クラスター、プロモーター、および別の配列は、「オペロン」と呼ばれ、通常は2から6の遺伝子、最高20またはそれ以上の遺伝子を含む。このように、遺伝子クラスターは、通常は機能に関して、関連するまたは同一の隣接する遺伝子群である。
【0250】
いくつかの遺伝子ファミリーは、同一のメンバーからなる。集団になっている遺伝子は、必ずしも同一ではないが、集団化は遺伝子間の同一性を維持するための必要条件である。遺伝子クラスターは隣接する関連遺伝子が重複した極端なものから、何百もの同一の遺伝子が縦列しているものまである。特定の遺伝子の繰り返しに、意義が見いだされない場合もある。その代表例は、哺乳類の他の種では単一のインスリン遺伝子が適切であるのに、ある種ではインスリン遺伝子が重複して発現するものである。
【0251】
遺伝子クラスターおよびそれからタンパク質が発現するためにクラスターの全長がどの程度必要かをさらに研究することは、重要である。さらに、遺伝子クラスターは継続的に再編成を受けているため、例えば細菌または他の原核生物由来の遺伝子クラスターの不均質なライブラリーを作製する能力は、特に、様々な有用な活性を持つポリケチドの合成をになうポリケチド合成酵素のような酵素を含む新規のタンパク質源を決定するうえで、価値がある。例えば、抗生物質、抗ウイルス薬、抗腫瘍薬、およびインスリンのような調節タンパク質を含め、他の種類の遺伝子クラスターの産物のタンパク質も予測される。
【0252】
ポリケチドは、抗生物質(テトラサイクリンやエリスロマイシンなど)、抗がん剤(ダウノマイシン)、免疫抑制剤(FK506およびラパマイシン)、および動物薬(モネンシン)を含む生理活性の非常に豊かな供給源となる分子である。多くのポリケチド(ポリケチド合成酵素に作製される)は、治療薬として価値が高い。ポリケチド合成酵素は、長さおよび機能や環化のパターンが異なる多様な炭素鎖の生合成を触媒する、多機能酵素である。ポリケチド合成酵素遺伝子は、遺伝子クラスターとなっており、少なくとも1つのタイプ(タイプIと呼ばれる)のポリケチド合成酵素は、大きなサイズの遺伝子および酵素を持っており、遺伝子操作やこれらの遺伝子/タンパク質のインビトロ研究を複雑なものにしている。
【0253】
ポリケチドおよびポストポリケチド生合成遺伝子のライブラリーから、研究のために新規のポリケチドを求めて所望の成分を選択し組み合せる能力は魅力的である。本発明の方法では、大きな挿入物(特にF因子ベースのベクターを使用する場合)を含むクローンで遺伝子バンクを作製できるので、遺伝子クラスターのクローニングが容易になるため、本発明の方法は新規のポリケチド合成酵素のクローニングを可能にし、容易にする。
【0254】
好ましくは、遺伝子クラスターのDNAをベクターに連結する。特に、ここでベクターはさらに、連結された遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレイの活性の作製を制御および調節する、発現調節配列も含む。外来核酸の導入収容力が特に大きいベクターは、そのような遺伝子クラスターに使用するのに特に適しており、本明細書では大腸菌(E.coli)のF因子(または稔性因子)を含む例によって記述されている。大腸菌(E.coli)のこのF因子は接合時に高頻度で起こるそれ自身の移動に影響を与えるプラスミドで、微生物の混合試料由来の遺伝子クラスターのような、大きな核酸断片を安定的に増やすために理想的である。
【0255】
標準化したライブラリーが作製されたら、本明細書に説明されるハイスループットロボットフォーマットを含む、種々のフォーマットの固相または液相スクリーニングアッセイを用いて、独自の酵素活性を発見できる。ライブラリーの作製に使われるDNAの標準化は、このプロセスの鍵となる。標準化によって、試料中に少量しかないものを含め、重要な生物体由来のDNAをより広く表すことができる。
【0256】
以下の実施例は本発明を説明するものであり、限定するものではない。実施例に説明される手順は、本発明の特定の局面を実施するために典型的に使用できるものではあるが、当業者に周知の他の手順も使用できる。
【0257】
実施例1
16S rDNA 遺伝子の末端制限酵素断片長多型( T−RFLP )
以下の方法は、多様度指数(環境試料指標化)を得るための方法を示す。
【0258】
材料および方法:
PCR増幅:
【0259】
%アガロースゲルにPCR産物(100 μl)をかける。DNAはQIAEN QIAquickゲル抽出キットを用いて抽出する。
【0260】
清潔で鋭利なメスでアガロースゲルからDNA断片を切り出す。
【0261】
無色のチューブに入れたゲル断片の重量を測定する。ゲルの体積1(100 mg〜100 μl)に対して緩衝液QGを3加える。
【0262】
50℃で10分間(またはゲル断片が完全に溶解するまで)インキュベートする。ゲルの溶解を促進するため、インキュベーション中2〜3分ごとにチューブをボルテックスで撹拌する。
【0263】
ゲル断片が完全に溶解した後、反応液の色が黄色(アガロースを入れないときの緩衝液QGと類似)であることを確認する。
【0264】
提供されている2 mlコレクションチューブに、QIAquickスピンカラムを入れる。DNAの結合のために、試料をQIAquickカラムに入れ、1分間遠心する。フロースルーを廃棄し、同じコレクションチューブにQIAquickカラムを戻す。洗浄のために、0.75mlの緩衝液PEをQIAquickカラムに加え、1分間遠心する。フロースルーを廃棄し、QIAquickカラムをさらに1分間、>10,000×gで遠心する。QIAquickカラムを清潔な1.5ml微量遠心チューブに入れる。DNAの溶出のため、30 μlの緩衝液EB (10 mM Tris−Cl、pH 8.5)またはH2OをQIAquickメンブレンの中央に添加し、カラムを1分間静置してから、1分間遠心する。
【0265】
DNA濃度のピコグリーン定量
ピコグリーンdsDNA定量キット(EUGENE、カタログ番号P−7589)を用いたDNA濃度のアッセイ:
必要ならば全ての試料濃度を30 ng/μlに調節する(元の体積=30 μlならば、30ng/μlのための最終体積(μl)=元の濃度(ng/μl))
【0266】
消化:
DNA試料をHinp1 I、Mse I、およびMsp Iで一晩消化し、GeneFinderで比較する。
【0267】
反応:0.5 μl酵素+0.5 μl緩衝液(NE緩衝液2)+4 μl DNA
5 μlの小さな体積を保つため、消化はPCR装置中で37℃で行われる。
【0268】
ゲル調整:FMCロングレンジャーゲルプロトコールマニュアル
ABI自動シーケンサーマニュアルの説明にしたがって、ガラスプレート(ABI 377用36cmプレート)およびスペーサー(0.2 mm)をカセットで組み立てる。プレートは特別の非陰イオン洗浄剤ALCONOXで十分に洗う。スペーサーはくぼみを内側にして蒸留水でプレートに付ける。ロングレンジャーシングルパックを室温にする。シーケンサーとプレートの長さに合う、ロングレンジャーシングルパックを使用する。黒のクリップを外し、コンパートメントの内容物を手で穏やかかつ十分に1分間混合する。パックを回転式攪拌機におき、中スピードで5分間撹拌する。手で穏やかかつ十分に1分間混合する。パックを回転式攪拌機上に置き、中スピードで5分間撹拌する。注:混合しすぎないこと。ゲルの重合に干渉しうる。
【0269】
ゲルのキャスティング(ロングレンジャーゲルプロトコール)
注:以下の段階は速やかに完了されねばならない。
赤いクリップのみを外し、コンパートメントの内容物を手で十分に1分間混合する。白のクリップを外し、フィルターをゲル溶液に露出する。内容物がフィルター端から排出するように、パックを保持する。記された線でパックを半分に折る。切り取りマークがパックの上端に来るようにパックを持ち、CUTと記されたスペース内で角を切り取る。気泡を避けるため、溶液がフィルターを通って定常的に流れるために十分に大きな穴を袋に開ける。混合後に溶液に気泡が入らないようにする。標準的なやり方で、ゲルを作製し、櫛を挿入する。ゲルが重合したら(30分)、電気泳動緩衝液に浸したペーパータオルをプレートの端の上に置き、プラスチックラップで覆う。これにより、重合プロセスが継続する間に水分が失われるのを予防する。完全にゲルが重合するまで2時間ほどかかる。
注:空のロングレンジャーシングルパックは、通常のごみ入れに廃棄できる。
【0270】
電気泳動の調製(ロングレンジャーゲルプロトコールFMC)
櫛を取り外し、ABI自動シーケンサーマニュアルの説明にしたがって、プレートを洗う。10×TBEストックを脱イオン水で1×に希釈して、陽極および陰極チェンバーの両方を満たすために十分な量の電気泳動緩衝液を調製する。
最終体積が1000 mLになるようにH2Oを加え、完全に混合して、<0.45 μmメンブレンで濾過する。
【0271】
室温で保存する。沈殿物が形成されたら使用しない。
注:最善の結果を得、またTBEストック溶液の沈殿を予防するため、容器に埃の粒子が入らないようにし、ピペット等を挿入せずに、ボトルから注ぐようにする。≦1 Lの量を調製する。大型ガラス瓶には保存しないこと。
【0272】
製造元の指示にしたがって、ゲルカセットをシーケンシング装置に取り付ける。
【0273】
プレートとゲルが清潔なことを確認するため、色素セットに特異的なプレートチェックモジュールを実行する。
【0274】
36 cmプレートでABI Prism 377遺伝子スキャンを行なう。
注:ABI Prism 377自動シーケンサーマニュアルの説明にしたがって、ロングレンジャーゲル溶液用の分析マトリックス標準ファイルを作製する。
【0275】
1. 「4% Ac」設定を用いて、通常通りに試料シートを用意する。
【0276】
2. 温度が51℃になるまで約10〜20分間、希望するモードを用いてゲルの予備ラン(run)を行なう。51℃になるために必要な以上に、予備ランを行なわないこと。
【0277】
3. 遺伝子スキャンラン用にDNA試料を調製し、各レーンに適切な量を加える。
【0278】
4. 1.4 KBよりも小さい断片には、ランhrsをラン時間に用いる。
【0279】
5. ABI遺伝子スキャン分析マニュアルの説明にしたがって遺伝子スキャンランを分析する。
【0280】
DI数の計算:
【0281】
本発明はその特定の好ましい態様に関して詳細に説明されているが、修正および変更は、説明および請求の精神および範囲内であることが理解されると考えられる。
発明の分野
本発明は一般的に、生物体の混合集団のスクリーニング、より具体的には環境試料の配列に基づくプロファイリングに関する。
【0002】
背景
現代生物学の中心となる核とは、遺伝情報は核酸ゲノムに存在し、そのようなゲノムに具体化される情報(すなわち遺伝型)が細胞の機能を指揮するというものである。これは、生物体のゲノム中の様々な遺伝子の発現と、そのような遺伝子発現の調節によって起きる。細胞または生物体中の遺伝子発現は、細胞または生物体の物理的特徴(すなわち表現型)を規定する。これは遺伝子のタンパク質への翻訳を介して行われる。
【0003】
種々の生物体のための潜在的な治療薬、抗生物質、および生物製剤をさらに理解し、決定するために、いくつかの生物体のゲノムの配列を決定する努力がなされてきた。例えば、ヒトゲノムプロジェクトは、ヒトのゲノムの完全な配列を決定し、各遺伝子の生化学的機能を決定するという具体的目標をもって開始された。現在までに、このプロジェクトはヒトゲノムの多くの部分の配列を決定している(J.Roach、http://weber.u.Washington.edu/ ̄roach/human_genome_progress2.html)(Gibbs、1995)。例えば、M.ゲニタリウム(genitalium) (Fraserら、1995)、M.ジャナスチー(jannaschii) (Bultら、1996)、インフルエンザ菌(H.influenzae) (Fleischmannら、1995)、大腸菌(E.coli) (Blattnerら、1997)および酵母(S.cerevisiae)(Mewesら、1997)を含む、少なくとも21の他のゲノムがすでに配列決定されている。マウス、線虫(C.elegans)、アラビドプシス(Arabidopsis)種およびキイロショウジョウバエ(D.melanogaster)のようなモデル生物のゲノムの配列決定においては、有意な進歩が見られている。たとえば以下のような、いくつかの機能情報で注釈されたゲノム情報を含むいくつかのデータベースが、種々の団体によって維持され、インターネット経由でアクセスされうる:http://wwwtigr.org/tdb;http.//www.genetics.wisc.edu; http://genome−www.stanford.edu/ ̄ball;http://hiv−web.lanl.gov; http://www.ncbi.nlm.nih.gov; http://www.ebi.ac.uk;http;//Pasteur.fr/other/biology;およびhttp;//www.genome.wi.mit.edu。ゲノム中の生(raw)核酸配列は、いくつかの利用可能なアルゴリズムの1つを経て、タンパク質のアミノ酸配列に転換され、このタンパク質が細胞中の様々な過程を実行する。残念ながら、これらのタンパク質配列の生データは、そのまま細胞中のタンパク質の機能や、生体試料中での関係や役割を表すわけではない。種々の細胞過程の詳細(例えば、代謝経路、分子間のシグナル伝達、細胞分裂など)およびこれらの過程をどのタンパク質が担うかを理解することは、現代の細胞生物学の中心的なゴールである。
【0004】
したがって、環境試料中に存在する生物体、タンパク質、核酸配列のプロフィールを決定することは、環境中のこれらの生物体やタンパク質の役割について、価値のある情報を提供し得る。さらにそのような情報は、生物製剤、診断薬、治療薬、および産業的応用性のある組成物の開発に役立ち得る。
【0005】
発明の概要
本発明は、複数の核酸配列を得ることによって、生物体の混合集団を含む試料から試料の核酸プロフィールを得る方法を提供することによって、当技術分野における多くの問題を解決する。本方法には、複数の核酸配列から核酸ライブラリーを作製し、そのライブラリーの少なくとも1つのクローンの配列を決定することが含まれる。配列情報は、少なくとも1つのクローンの配列と、複数の生物体由来の複数の核酸配列を含むデータベースとを比較するアルゴリズムを用いて、少なくとも1つのクローンに相同性を持つデータベース中の配列を同定する、データベース検索に使用される。これを必要ならば繰り返し実行し、試料の核酸プロフィールを得ることができる。1つの態様では、生物体の混合集団は、環境試料のような、非培養または培養微生物に由来する。別の態様では、核酸はRNA、DNA(例えば、ゲノムDNAまたはその断片)であり得る。
【0006】
本発明は、植物の混合集団を含む試料から複数の核酸配列を得ることによって、試料の核酸プロフィールを得る方法も提供する。本方法には、複数の核酸配列からDNAライブラリーを作製し、そのDNAライブラリーの少なくとも1つのクローンの配列を決定することが含まれる。配列情報は、少なくとも1つのクローンの配列と、複数の生物体由来の複数の核酸配列を含むデータベースとを比較するアルゴリズムを用いて、少なくとも1つのクローンに相同性を持つデータベース中の配列を同定する、データベース検索に使用される。これを必要ならば繰り返し実行し、試料の核酸プロフィールを得ることができる。1つの態様では、植物の混合集団は、環境試料のような、非培養または培養植物に由来する。別の態様では、核酸はRNA、DNA(例えば、ゲノムDNAまたはその断片)であり得る。
【0007】
発明の詳細な説明
本発明は、試料中に存在するポリヌクレオチド配列に基づいて、環境試料のフィンガープリンティングまたはプロファイリングを行なうための方法および組成物を提供する。それにより本発明は、生物体が特定の環境に対応するための進化および生物多様性を理解するために有用で、方向づけられた進化、分子生物学、バイオテクノロジー、および産業的応用に役立つ方法および組成物を提供する。
【0008】
本発明は生物体の混合集団または生物体の混合集団由来の核酸配列を含む試料中で、配列を素早くスクリーニングして同定する方法を提供する。試料中に存在する核酸配列のスクリーニングおよび同定を行なうことにより、本発明は診断薬、治療薬、または産業的応用のための分子の開発に使用可能な配列のレパートリーを増大させる。したがって、本発明の方法により機能の既知および未知のタンパク質またはポリペプチドをコードする新規の核酸配列を同定できる。
【0009】
また、本発明は既知の活性を持つ配列に対応する核酸配列、または既知の活性を持つタンパク質またはペプチドをコードする配列が、試料中に存在するか否かを素早く同定する方法を提供する。
【0010】
本明細書および添付の特許請求の範囲で使用される単数形「1つの」および「その」は、そうでないことが内容から明らかである場合を除き、複数形の物も含む。したがって、「1つのクローン」は複数のクローンを含み、「その核酸配列は」一般的に1つまたは複数の核酸配列および当技術分野で周知の同等物を含む。
【0011】
特に明確に定義されないかぎり、本明細書に使用されるすべての技術的および科学的用語は、本発明の関連する当業者によって通常理解されているのと同じ意味を持つ。本発明の実施または試験においては、本明細書記載の方法および材料と類似した、または同等の任意の方法、装置および材料を使用できるが、好ましい方法、装置および材料は、本明細書に記載されている。
【0012】
本明細書に記載される全ての出版物は、本明細書に記載される発明に関連して使用される可能性のある出版物中に記載されるデータベース、タンパク質および方法を記述し開示するために、その全体が参照として本明細書に組み入れられる。上述およびテキスト全体に記述される出版物は、本出願の出願日以前の開示のためのみに提供される。先行発明のおかげで、発明者にはそのような開示に先行する資格がないことを認めると解釈されてはならない。
【0013】
「アミノ酸」とは、中心の炭素原子(α炭素原子)が水素原子、カルボン酸基(本明細書ではその炭素原子を「カルボキシル炭素原子」と呼ぶ)、アミノ基(本明細書ではその窒素原子を「アミノ窒素原子」と呼ぶ)、および側鎖のR基に結合している構造を持つ分子である。ペプチド、ポリペプチド、またはタンパク質に組み込まれると、1つのアミノ酸を別のアミノ酸に結合する脱水反応において、アミノ酸は、アミノ酸カルボキシル基の1つまたは複数の原子を失う。その結果、タンパク質に組み込まれたときには、アミノ酸は「アミノ酸残基」と呼ばれる。
【0014】
「タンパク質」とは、2つまたはそれ以上の個々の(天然又は非天然の)アミノ酸がペプチド結合で結合した任意のポリマーを意味し、1つのアミノ酸(またはアミノ酸残基)のα炭素に結合したカルボン酸基のカルボキシル炭素原子が、隣接するアミノ酸のα炭素に結合するアミノ基のアミノ窒素原子に共有結合されると発生する。「タンパク質」という用語は、その意味の中に「ポリペプチド」および「ペプチド」(これらは本明細書では時折互換的に使用される可能性がある)という用語を含むと理解される。さらに、複数のポリペプチドサブユニット(例えば、DNAポリメラーゼIII、RNAポリメラーゼII)または他の成分(例えば、テロメラーゼにおけるRNA分子)を含むタンパク質も、本明細書で使用される「タンパク質」の意味に含まれると理解される。同様に、タンパク質やポリペプチドの断片も、本発明の範囲内であり、本明細書では「タンパク質」と呼ばれうる。
【0015】
あるタンパク質の特定のアミノ酸配列(すなわちアミノ末端からカルボキシ末端まで書かれた時のポリペプチドの「一次構造」)は、mRNAのコード部分のヌクレオチド配列によって決定され、mRNAは、通常はゲノムDNA(例えばミトコンドリアまたはクロロプラストDNAのようなオルガネラDNAを含む)である遺伝情報によって規定されている。このように、遺伝子の配列の決定は、対応するポリペプチドの一次配列、およびより具体的にはその遺伝子またはポリヌクレオチド配列によってコードされているポリペプチドまたはタンパク質の役割または活性を予測するのに役立つ。
【0016】
「単離された」という用語は、天然状態から「人間の手によって」変化を受けたことを意味する;すなわち、それが天然に発生する場合には、元々の環境から変えられたもしくは取り出された、またはその両方である。本明細書で用いられる用語では、例えば、天然状態の生きている動物、生物試料または環境試料に天然に存在するポリヌクレオチドまたはポリペプチドは、「単離されて」はいないが、天然状態で共存する物質から分離された同じポリヌクレオチドまたはポリペプチドは、「単離されて」いる。本明細書で用いられる用語では、そのようなポリヌクレオチドは、培養宿主細胞または生物体全体に導入された場合、天然に発生する形または環境ではないので、まだ単離されていることになる。同様に、ポリヌクレオチドおよびポリペプチドは、培地製剤(例えば、細胞にポリヌクレオチドまたはポリペプチドを導入するための溶液、または化学反応または酵素反応のための溶液)のような組成物中にも存在しうる。
【0017】
「ポリヌクレオチド」または「核酸配列」とは、ヌクレオチドのポリマー型を意味する。場合によっては、ポリヌクレオチドは、それが由来する生物体で天然に存在するゲノムでは直接に隣接する(5’末端で1つおよび3’末端で1つ)コード配列のいずれとも直接には隣接しない配列を指す。したがってこの用語は例えば、ベクター;自律的に複製するプラスミドまたはウイルス;または原核生物または真核生物のゲノムDNAに組み込まれた組み換えDNA、または他の配列とは独立した、分離した分子(例えば、cDNA)として存在する組み換えDNAも含む。本発明のヌクレオチドは、リボヌクレオチド、デオキシリボヌクレオチド、またはそのいずれかのヌクレオチドの修飾された形であり得る。本明細書におけるポリヌクレオチドは、特に、一本鎖および二本鎖DNA、一本鎖と二本鎖の領域が混在するDNA、一本鎖および二本鎖RNA、および一本鎖と二本鎖の部分が混在するRNA、一本鎖またはより通常には二本鎖であるか、一本鎖と二本鎖の部分が混在する、DNAおよびRNAのハイブリッド分子を指す。
【0018】
また、本明細書におけるポリヌクレオチドは、RNAもしくはDNAまたはRNAおよびDNAの両方を含む三本鎖領域を指す。そのような領域の鎖は、同一の分子または異なる分子に由来しうる。そのような領域には、1つまたは複数の分子の全体が含まれる可能性があるが、より一般的には分子のうちのある領域のみを含む。三重鎖領域の分子の1つはしばしばオリゴヌクレオチドである。ポリヌクレオチドまたは核酸という用語は、ゲノムDNAまたはRNA(生物体による、例えば、ウイルスのRNAゲノム)、およびゲノムDNAにコードされるmRNA、およびcDNAが含まれる。このように、本発明のライブラリーは、本明細書に記載されるような任意の核酸分子を用いて作製できる。
【0019】
上述のように、バイオテクノロジーおよび化学業界では現在、生物過程または化学過程を最適に実行できる分子(例えば、酵素)が求められている。環境試料中で新規の酵素を同定することは、この問題の1つの解決法である。環境試料中に存在する生物体、タンパク質および核酸配列のプロフィールを決定することによって、環境中におけるこれらの生物体またはタンパク質の役割に関する価値のある情報が提供できる。さらに、そのような情報は、産業的応用のための生物製剤、診断薬、治療薬および組成物の開発にも役立つ。確立されたおよび新興の化学、製薬、繊維、食品、飼料、洗剤市場で利用される全てのクラスの分子および化合物は、厳格な経済的および環境の基準に適合しなくてはならない。ポリマー、医薬品、天然製品、および農薬の合成は、有害な副産物を生成し、悪いまたは非効率的な触媒に影響される高価な過程によってしばしば妨げられている。例えば、酵素には触媒反応においてこれらの問題を克服できるいくつかの目覚ましい利点がある:単一の官能基にしか反応しない、単一の分子上の類似した官能基を区別する、および鏡像異性体の区別をする。さらに、生分解性であり、反応液中で、非常に低いモル比で機能する。その化学的特異性、部位特異性、および立体特異性のために、所望の選択的変換を最適に行なう独特な機会を与える。これらはしばしば、特に単一段階で、化学的に再現するのは非常に困難である。保護基が不要であること、選択性、単一の反応容器中で複数段階の変換を行なえること、同時に環境負荷が低減できることのために、化学および製薬業界において酵素の需要が増加してきた。酵素に基づく過程は、多くの従来の化学に基づく方法をしだいに置き換えてきた。さらに広範囲に産業用に使用されるための現在の弱みは、主に比較的少数の酵素が商業的に利用できることである。現在までに記述された>3000の非DNA修飾酵素のうち、約300の酵素(DNA修飾酵素を除く)が商業的に利用できるのみである。
【0020】
技術的な用途への酵素の利用も、要求の厳しい産業条件における性能が必要となる。これには、現在既知の酵素の集積が進化的に選択されなかった環境におけるまたは基質に対する活性が含まれる。しかし、天然の環境は、例えば極端な温度およびpHを含む極端な条件を提供する。いくつもの生物体が、部分的にはこれらの極端な条件に堪えられるポリペプチドを選択することによって、これらの条件に適合してきた。
【0021】
酵素は、生物体の環境内、温度、pH、塩濃度の条件下で、非常に特定の生物機能を発揮するという選択的圧力によって、進化してきた。多くの場合、これまでに記述された非DNA修飾酵素の活性は、利用できる系統発生の多様性の非常に小さな部分である、中温性の生物体から単離されてきた。生物触媒の動的な分野は、極端な環境で成育する微生物から単離された酵素の助けをもって、新しい次元を獲得する。そのような酵素は、地上の温泉および深海の熱水噴出口では100℃以上の温度、北極海では0℃以下の温度、死海では飽和塩濃度の環境、石炭鉱床および地熱の硫黄泉では0に近いpH、または下水汚泥では11以上のpHで機能する必要がある。例えば、生物体、ポリヌクレオチドおよびポリペプチド(例えば、酵素)を含む、極端な条件から得られた環境試料は、生物触媒に新しい分野を開拓する。また、試料中に存在するポリヌクレオチド配列に基づく環境試料のフィンガープリンティングまたはプロファイリングを行なうことによって、本発明は方向づけられた進化に役立つ進化の理解、生物多様性、分子生物学、バイオテクノロジーおよび産業的応用を提供する。
【0022】
産業用の新しい酵素に対するニーズに加え、新規の活性を持つ生理活性化合物に対するニーズも劇的に高まってきた。この需要は、主に全世界の人口統計的変化および現在使用できる抗生物質に耐性の病原体の数が増加する傾向に起因する。例えば、若年人口の高い新興国では抗菌薬の需要が上昇しているのに対し、米国のような高齢化の進行する国では、癌、糖尿病、関節炎、および他の衰弱性の疾病に対する薬のレパートリーを広げる必要がある。感染症による死亡率は、1980年から1992年までに58%増加しており、抗生物質に耐性の微生物の出現は、米国だけでも年間300億ドル以上も医療費を押し上げている。(Adamsら、Chemical and Engineering News、1995;Amannら、Microbiological Reviews、59、1995)。このような傾向に対応して、製薬会社は独特の活性または特異性を持つ化合物を求めて微生物の多様性のスクリーニングをかなり強化している。したがって本発明は、たとえば種々の微生物の消化管に存在する感染性微生物から、配列特異的な情報を得るために使用できる。
【0023】
したがって、本発明は感染因子および関連する生理活性化合物の供給源をプロファイリングおよび同定する方法を提供する。この情報は、特定の環境試料によって拡散または媒介される特定の疾病の治療における、化合物、治療薬および診断薬を開発するための重要な情報を提供する。例えば、冷却塔に存在する微生物および関連生理活性化合物の同定は、レジオネラおよび関連病原体の同定に役立ち得る。
【0024】
別の態様では、本発明の方法および組成物は、環境試料中に存在する薬剤のリード化合物の同定に役立つ。本発明の方法は、新規の薬剤を求めて環境を調べ、種々の微生物に含まれる関連薬物を同定する能力を提供する。例えば、海綿に見られる微生物のような海洋共生生物は、薬物化合物の貴重な供給源であり、本発明の方法の核酸供給源だと想像される。環境の調査の結果として同定または開発されたヌクレオチド、ペプチド、または他のポリマー分子のようなリード化合物(薬物候補)には、天然産物の集合、合成化学物質の集合、合成コンビナトリアルライブラリーを含め、いくつかの共通の供給源がある。各供給源にはそれぞれ長所と短所がある。これらの候補のスクリーニングプログラムの成功は、プログラムに入れる化合物の数に大きく依存しており、製薬会社は今日までにリード化合物を求めて何十万もの合成および天然の化合物のスクリーニングをしてきた。残念ながら、以前に発見された化合物に対する新規化合物の比は、時間とともに低下してきた。新規化合物の発見率は、製薬会社の最善の努力にもかかわらず、需要に追いついてはいない。潜在的薬物候補の新しい供給源を評価するニーズは非常に大きい。したがって、本発明は新規の薬物化合物を含む可能性のある環境試料の同定および解析のための素早く効率の良い方法を提供する。
【0025】
現在使用されている生理活性化合物の大部分は、土壌の微生物に由来する。土壌および他の複雑な生態的コミュニティに生息する多くの微生物は、その生存および繁栄能力を高めるような種々の化合物を作製する。これらの化合物は、一般に生物体の成長には必須ではないと考えられ、中間的代謝に関与する遺伝子の助けによって合成され、そのために「二次産物」という名を持つ。他の生物体の成長または生存に影響を与える二次代謝産物は、「生理活性」化合物として知られており、微生物およびマクロ生物のいずれにとっても、化学的防御の鍵となる化合物となる。ヒトは、広範囲の原核および真核病原体に対する活性を持つ抗生物質、抗感染薬、および他の生理活性化合物として、これらの化合物を活用してきた。微生物由来の約6,000の生理活性化合物が解析されており、その60%以上はStreptomyces属のグラム陰性土壌細菌によって作製される(Barnesら、Proc.Natl.Acad.Sci.USA 91、1994)。これらの中で、少なくとも70は生物医学および農業の用途に現在使用されている。生理活性化合物の最大のクラスであるポリケチドには、合わせると年商50億ドルを越す広範囲の抗生物質、免疫抑制剤および抗がん剤が含まれる。
【0026】
見掛け上は数多くの生理活性化合物が利用できるにもかかわらず、現代の生物医学の直面する最大の課題の1つが抗生物質耐性病原体の増殖であることは明らかである。世代時間が短く、遺伝情報を容易に交換する能力があるため、病原微生物は迅速に進化し、ほぼ全ての抗生物質のクラスに対する抵抗性の機構を広めた。例えば、現在ではただ1つの抗生物質、バンコマイシンでのみ治療できるヒト病原菌ブドウ球菌(Staphylococcus)および連鎖球菌(Streptococcus)の毒性株があり、この化合物に対する耐性は、耐性の腸球菌(Enterococcus)種からただ1つの遺伝子vanAが伝達されると発生する(Batesonら、System.Appl.Microbiol.12、1989)。新規の抗菌化合物に対する重要なニーズと、酵素阻害剤、免疫抑制剤、および抗がん剤に対する需要の増加を合わせると、どうして製薬会社が新規の性質を持つ生理活性化合物を求めて、多様な微生物のスクリーニングを強化してきたかが容易に理解できる。
【0027】
本発明は既知または未知の機能を持つ新規のポリペプチドをコードする新規の核酸配列を同定する方法を提供する。例えば、微生物ゲノムの多様性の多くは、微生物ゲノムにおける遺伝子クラスターの再配列の結果である。これらの遺伝子クラスターは、種を越えて存在したり、系統発生的に他の生物体と関連し得る。
【0028】
例えば、細菌および多くの真核生物は、その産物が関連する過程に関与する関連する遺伝子に、協調した機構を持っている。遺伝子は単一の染色体上で「遺伝子クラスター」と呼ばれる構造となって密集し、クラスター全体の転写を開始する単一のプロモーターを含む単一の調節配列の制御下で一緒に転写される。遺伝子クラスター、プロモーターおよび調節に機能する他の配列は、合わせて「オペロン」と呼ばれ、通常は2から6、最高20またはそれ以上の遺伝子を含む。このように、遺伝子クラスターは、通常は機能に関して、関連するまたは同一の隣接する遺伝子群である。
【0029】
いくつかの遺伝子ファミリーが、同一のメンバーからなる。集団になっている遺伝子は、必ずしも同一ではないが、集団化は遺伝子間の同一性を維持するための必要条件である。遺伝子クラスターは隣接する関連遺伝子が重複した極端なものから、何百もの同一の遺伝子が縦列しているものまである。特定の遺伝子の繰り返しに、意義が見いだされない場合もある。その代表例は、哺乳類の他の種では単一のインスリン遺伝子が適切であるのに、ある種ではインスリン遺伝子が重複して発現するものである。
【0030】
さらに、遺伝子クラスターは継続的に再構成されている。そのため、例えば細菌または他の原核生物から遺伝子クラスターの非均質ライブラリーを作製する能力は、新規のタンパク質、特に例えば数多くの有用な活性を持つポリケチドの合成を担うポリケチド合成酵素のような酵素の供給源を決定するために価値がある。例えば、抗生物質、抗ウイルス薬、抗腫瘍薬およびインスリンのような調節タンパク質を含む、他の種類の遺伝子クラスターの産物のタンパク質も予測される。
【0031】
一例として、ポリケチド合成酵素は、1つの遺伝子クラスターにある。ポリケチドは、抗生物質(テトラサイクリンやエリスロマイシンなど)、抗がん剤(ダウノマイシン)、免疫抑制剤(FK506およびラパマイシン)、および動物薬(モネンシン)を含む生理活性の非常に豊かな供給源となる分子である。多くのポリケチド(ポリケチド合成酵素に作製される)は、治療薬として価値が高い。ポリケチド合成酵素は、長さおよび機能や環化のパターンが異なる多様な炭素鎖の生合成を触媒する、多機能酵素である。ポリケチド合成酵素遺伝子は、遺伝子クラスターとなっており、少なくとも1つのタイプ(タイプIと呼ばれる)のポリケチド合成酵素は、大きなサイズの遺伝子および酵素を持っており、遺伝子操作やこれらの遺伝子/タンパク質のインビトロ研究を複雑なものにしている。
【0032】
研究する新規のポリケチドを作製するために、ポリケチドおよびポストポリケチド生合成遺伝子のライブラリーから所望の成分を選択し組み合せる能力は、魅力的である。本発明の方法では、大きな挿入物(特にF因子ベースのベクターを使用する場合)を含むクローンで遺伝子バンクを作製できるので、遺伝子クラスターのクローニングが容易になるため、本発明の方法は新規のポリケチド合成酵素のクローニングを可能にし、容易にする。
【0033】
例えば、遺伝子クラスターの核酸をベクターに連結する。ベクターはさらに、連結された遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレイの活性の作製を制御および調節する発現調節配列も含み得る。外来核酸の導入収容力が特に大きいベクターは、そのような遺伝子クラスターに使用するのに特に適しており、本明細書では大腸菌(E.coli)のF因子(または稔性因子)を含む例によって記述されている。大腸菌(E.coli)のこの因子は接合時に高頻度で起こるそれ自身の移動に影響を与えるプラスミドで、微生物の混合試料由来の遺伝子クラスターのような、大きな核酸断片を安定的に増やすために理想的である。
【0034】
これらの試料(例えば、微生物の混合集団)由来またはこれから単離された核酸は、好ましくはポリヌクレオチドのスクリーニングまたはハイスループットシーケンシングの前にベクターまたはプラスミドに挿入される。そのようなベクターまたはプラスミドは、通常はプロモーター、エンハンサーなどを含む発現調節配列を含んでいる。
【0035】
したがって、本発明はインビトロで関心対象の酵素活性および生理活性を求めて環境試料をクローニングしスクリーニングする新規のシステムを提供する。本発明の方法では、インビトロで新規の生理活性分子、特に非培養および培養試料由来の新規の生理活性分子のクローンニングおよび発見が可能になる。本発明の方法を用いると、大きなサイズの遺伝子クラスター、遺伝子および遺伝子断片がクローニング、配列決定、およびスクリーニング可能である。以前の戦略とは異なり、本発明の方法によると、広範囲の環境試料から、インビトロでポリヌクレオチドおよびこれらのポリヌクレオチドにコードされるポリペプチドをクローニング、同定、プロファイリング、および利用できる。
【0036】
本発明は、関心対象の酵素活性および生理活性をコードする遺伝子の、複雑な環境試料からのスクリーニングおよび同定を可能にする。これらの試料から作製されたDNAライブラリーは、試料中に存在する核酸の集団を表す。ライブラリーは、核酸配列を含むかぎり、無細胞試料から作製可能であり、細胞性の生物体またはウイルス粒子を含む試料からも作製可能である。ライブラリーを調製できる元になる生物体には、真正細菌(Eubacteria)および古細菌(Archaebacteria)のような原核微生物、真菌、ある種の藻類およびプロトゾアのような下等真核微生物、ならびに植物、植物胞子および花粉の混合物が含まれる。生物体は環境試料から得られた培養生物体または非培養生物体でよく、そのような生物体は好熱菌、超好熱菌、好冷菌、低温細菌のようなエクストレモフィルでよい。
【0037】
以前に示されたように、ライブラリーは環境試料から作製でき、この場合は核酸は生物体の培養なしに回収するか、培養生物体から回収できる。
【0038】
DNAライブラリーを構築するために使用する核酸供給源は、北極および南極の氷、水、永久凍土層から得られた微生物試料、火山由来の材料、熱帯の土壌または植物由来の材料、哺乳類、無脊椎動物を含む種々の生物体の糞、ならびに死体および腐敗物などのような環境試料が含まれるがこれらに限定されることはないと予想される。したがって、例えば培養または非培養生物体から核酸を回収し、適切なDNAライブラリー(例えば、組み換え発現ライブラリー)を作製し、その後、特定のポリヌクレオチド配列を同定したり、酵素活性をスクリーニングしたりできる。
【0039】
以下は、培養および非培養生物体ならびに生物体の混合集団からライブラリーを作製する一般的な手順の概要を示す。ライブラリーは同定されたまたは予測される生物活性(例えば、酵素活性)を持つ核酸配列を選択するために、プロービング、配列決定、およびスクリーニングできる。
【0040】
環境試料、核酸供給源、および単離
本明細書では、環境試料は生物体またはポリヌクレオチドまたはその組み合せを含む任意の試料である。したがって、環境試料は、例えば昆虫の糞を含む任意の数の供給源(上記)から得られる。精製または非精製の核酸の任意の供給源が開始材料として使用できる。したがって、核酸は生物体が汚染している任意の供給源、または細胞を含む任意の試料から得られる。環境試料は、任意の哺乳類の血液、尿、脊髄液、組織、膣スワブ、糞、羊水、または口内うがい液のような体液試料から抽出できる。非哺乳類(例えば、無脊椎動物)では、試料は、組織試料、唾液試料、糞または生物体の消化管中の材料でよい。環境試料には、例えば、硫黄泉、火山口、凍土帯の様な極端な環境から得られた試料も含まれる。また、試料は多様な供給源由来であり得る。例えば、園芸および農業試験では、試料は植物、肥料、土壌、液体、または他の園芸もしくは農業産物でよい;食品試験では、試料は生の食品または加工食品(例えば、乳児用ミルク、海産物、生鮮食料品、および包装された食品)でよい;環境試験では、試料は液体、土壌、下水処理、汚泥、および生物体またはポリヌクレオチドを含むと考えられるまたは疑われる任意の他の環境中の試料で良い。
【0041】
試料が、例えば血液、土壌および汚泥のような物質の混合物(例えば、生物体の混合集団)である場合には、細胞を開き、核酸の鎖を露出または分離するために有効な適切な試薬で処理できる。この溶菌および核酸変性段階は必ずしも必要ではないが、これによりクローニング、増幅、または配列決定がより容易に行なえる。さらに、特定の集団を精製するために、混合群を分析前に培養して純粋な試料が得られるようにしても良い。しかし、これは必ずしも必要ではない。
【0042】
したがって、試料は、例えば生物体の多様な混合集団(例えば、昆虫の消化管に存在する微生物)に由来する核酸を含む。核酸は、任意の数のDNAおよびRNA単離方法を用いて、試料から単離される。そのような核酸単離方法は、当技術分野で実施されている。核酸がRNAの場合には、当技術分野で周知のプライマーを用いてRNAをDNAに逆転写できる。DNAがゲノムDNAの場合には、25ゲージの針を用いて、DNAを剪断する。
【0043】
クローニングおよび形質転換
その後、適切なベクターを用いて核酸をクローニングする。使用されるベクターは、DNAが発現されるか、増幅されるか、配列決定されるか等に依存する(例えば、ハイスループットシーケンシングベクターを開示する米国特許第6,022,716号参照)。クローニング技術は当技術分野で周知であるか、過度の実験なしに当業者によって開発され得る。ベクターの選択も、ポリヌクレオチド配列のサイズおよび本発明の方法に使用される宿主細胞に依存する。したがって、本発明で使用されるベクターは、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど)、またはその一部(例えば、コートタンパク質、スパイク糖タンパク質、コスミドタンパク質)である可能性がある。例えば、コスミドおよびファージミドは、大きなポリヌクレオチドを安定的に増殖できるので、分析または修飾する特定の核酸配列がより大きな場合に好ましい。
【0044】
核酸配列の混合物がベクターにクローニングされると、各ベクターを宿主細胞に導入し、宿主細胞にベクターを増幅させることによって、クローンの増幅ができる。これは、核酸配列の絶対数は増加するものの、ハイブリッドの数は増えないので、クローン増幅と呼ばれる。
【0045】
クローニングされたDNA配列を含むベクターは、その後適切な宿主細胞にベクターをトランスフェクトすることにより増幅できる(例えば、大腸菌(E.coli)宿主にファージ)。または(または増幅の後に)、クローニングされたDNA配列を用いて、適切な生物体を形質転換することによってスクリーニングまたは配列決定するためのライブラリーを調製する。標的核酸を含むベクターを、形質転換を助ける条件下で接種することにより人工的に導入して、当技術分野で周知の宿主を形質転換する。二本鎖の環状または直線状の核酸により形質転換したり、場合によっては一本鎖の環状または直線状核酸配列により形質転換することができる。形質転換という用語は、新しいDNA(すなわち、細胞にとって外来のDNA)の組み込み後に、細胞中で永久または一過性の遺伝的変化が導入されることを意味する。細胞が哺乳類細胞の場合には、永久の遺伝的変化は、通常、DNAが細胞のゲノムに導入されることで起きる。形質転換された細胞または宿主細胞というのは、一般的に、宿主生物体に通常は存在しないDNA分子が組み換えDNA技術によってそれに(またはその祖先に)導入された細胞(例えば、原核または真核)を指す。
【0046】
本発明で使用される特定のタイプのベクターには、F因子の複製開始点が含まれている。大腸菌(E.coli)のF因子(または稔性因子)はプラスミドで、これのおかげで接合中にF因子自身は高頻度で移動し、細菌の染色体自身はより低い頻度で移動する。ある特定の態様では、「フォスミド」またはBAC(バクテリア人工染色体)ベクターと呼ばれるクローニングベクターが使用される。これらは大腸菌(E.coli)のF因子由来で、大きなDNA部分を安定的に組み込むことができる。非培養環境混合試料のDNAを組み込むと、安定な「環境DNAライブラリー」の形で大きなゲノム断片が得られる。
【0047】
混合集団または試料由来の核酸は、種々の手法によってベクター中に挿入できる。一般に、核酸配列は当技術分野で周知の手順により適切な制限エンドヌクレアーゼ部位に挿入される。そのような手順および他の手順は、当業者の範囲だと考えられる。典型的なクローニングシナリオは、適切なヌクレアーゼ(例えば、ヤエナリヌクレアーゼ)を用いてDNAを「ブラント」にし、例えばEcoRIメチラーゼなどでメチル化し、EcoRIリンカー
に連結する。リンカーはその後EcoRI制限エンドヌクレアーゼで消化し、DNAサイズを分画する(例えば、蔗糖勾配を用いる)。得られたサイズ分画したDNAを、それから配列決定、スクリーニング、または発現のために適切なベクターに連結する(例えば、λベクター、インビトロλパッケージングエキストラクトを用いてパッケージングする)。
【0048】
組み換えDNAを用いた宿主細胞の形質転換は、当業者に周知の通常の方法で実行できる。宿主が大腸菌(E.coli)のような原核生物の場合には、DNAの取り込み能力のあるコンピテント細胞は、指数増殖期の後で採集し、その後当技術分野で周知の手順でCaCl2処理を行なって調製できる。または、MgCl2またはRbClが使用できる。形質転換は、宿主細胞のプロトプラスト形成後、または電気穿孔法によっても行なえる。
【0049】
宿主が真核生物の場合には、DNAのトランスフェクションまたは形質転換法には、リン酸カルシウム共沈、マイクロインジェクションのような通常の機械的方法、電気穿孔法、リポソームにつつまれたプラスミドの導入、ウイルスベクター、ならびに他の当技術分野で周知の方法が含まれる。真核細胞は、単純ヘルペスウイルスチミジンキナーゼ遺伝子のような選択マーカーをコードする第2の外来DNA分子と共にトランスフェクトしても良い。また別の方法は、シミアンウイルス40(SV40)またはウシパピローマウイルスのような真核ウイルスベクターを用いて、真核細胞を一時的に感染または形質転換させ、タンパク質を発現するものである。(「真核ウイルスベクター(Eukaryotic Viral Vectors)」Cold Spring Harbor Laboratory、Gluzman編、1982)。通常は、真核宿主が宿主細胞として利用される。真核細胞は酵母細胞(例えば、Saccharomyces cerevisiae)、昆虫細胞(例えば、ショウジョウバエ(Drosophila)種)、またはヒト細胞を含む哺乳類細胞で良い。
【0050】
真核生物系、および哺乳類発現系では、発現された哺乳類タンパク質の翻訳後修飾が可能である。一次転写物のプロセッシング、グリコシル化、リン酸化、および好ましくは遺伝子産物の分泌のための細胞機構を持った真核細胞が使われると良い。そのような宿主細胞株には、CHO、VERO、BHK、HeLa、COS、MDCK、Jurkat、HEK−293およびWI38が含まれる可能性があるが、これらに限定されるわけではない。
【0051】
本明細書に記載されるライブラリーは、細菌、真菌、植物細胞、昆虫細胞および動物細胞中に含まれ得る。例えば、宿主細胞には、大腸菌(E.coli)、バチルス(Bacillus)、連鎖球菌(Streptomyces)、またはネズミチフス菌(Salmonella typhimurium)細胞;Sccharomyces sp.のような酵母細胞;ショウジョウバエ(Drosophila)S2細胞またはスポドプテラ(Spodoptera)S9細胞;またはCHO細胞、COS細胞またはBowesメラノーマ細胞が含まれるがこれらに限定されることはない。
【0052】
本発明の方法で利用されるライブラリーには、少なくとも約104クローン、および好ましくは約104から1010クローンが含まれる。ライブラリーは、少なくとも約105、106、107、108、109または1010クローンまたはその間の任意の数のクローンが含まれ得る。
【0053】
本発明の方法で利用されるライブラリーは、約0.01から1010の、好ましくは約0.1から109の;約0.1を上回る;および約1.0を上回る多様度指数を持つ。
【0054】
ライブラリーのクローンには、約0.5kbから10kb;約1kbから8kb;約1kbから7kb等の核酸挿入物が含まれる。当業者はクローン挿入物の片端または挿入物の両端から配列決定を開始できることを理解する必要がある。
【0055】
配列決定
ライブラリーの適切な数のクローン(例えば、1〜1000またはそれ以上のクローン、通常は約100)を入手し、ハイスループットシーケンシング法を用いてその配列を決定する。配列決定の方法は、本発明の限定因子ではない。特定のクローニングされたDNA配列の配列を同定するために役立つ任意の方法が使用できる。一般に、配列決定は、DNA複製の自然な過程を応用したものである。したがって、鋳型(例えば、ベクター)およびプライマー配列が使用される。1つの一般的な鋳型調製および配列決定プロトコールは、細菌のコロニーの自動ピッキングから始まるが、この各コロニーには配列決定反応の鋳型の働きをする別個のDNAクローンが含まれている。選択されたコロニーを培地に入れて、一晩増殖させる。その後、細胞からDNA鋳型を精製し、水に懸濁する。DNAの定量後、Applied Biosystems、Inc.、Prism 377 DNAシーケンサーのようなシーケンサーを用いてハイスループットシーケンシングが行われる。その後、得られた配列データは、データベースの検索に使用される。
【0056】
データベース検索およびアライメントアルゴリズム
特定のポリヌクレオチド配列によってコードされる活性を同定または決定するために、本発明では、核酸配列および/または推定アミノ酸配列を含むいくつかのデータベースが利用できる。調べる配列の全てまたは代表的な部分(例えば、約100の個別クローン)を用いて、同時または別個に配列データベース(例えば、GenBank、PFAMまたはProDom)の検索を行なう。そのような配列検索の実施方法は、当技術分野でいくつか知られている。データベースは特定の生物体または生物体の集合に特異的なものであり得る。例えば、線虫(C.elegans)、アラビドプシス(Arabidopsis)種、M.ゲニタリウム(genitalium)、M.ジャナスチー(jannaschii)、大腸菌(E.coli)、インフルエンザ菌(H.influenzae)、酵母(S.cerevisiae)およびその他用のデータベースが存在する。それから、2つまたはそれ以上の配列の間の相同性を測定するように設計されたアルゴリズムを用いて、クローンの配列データをデータベースの配列と比較する。
【0057】
そのような配列アラインメント法には、例えばBLAST (Altschulら、1990)、BLITZ (MPsrch)(SturrockおよびCollins、1993)、およびFASTA (PersonおよびLipman、1988)が含まれる。プローブ配列(例えば、クローンの配列データ)は任意の長さで良く、相同性の閾値に基づいて、相同と認識される。閾値は事前に決定することができるが、そうでなくても良い。閾値は特定のポリヌクレオチドの長さに基づき得る。配列のアライメントには、いくつかの異なる手順が使用できる。通常は、Smith−WatermanまたはNeedleman−Wunschアルゴリズムが使用される。しかし、上記のようにBLAST、FASTA、PSI−BLASTも使用できる。
【0058】
例えば、比較ウィンドウを並べるための最適の配列アライメントは、Smithの局所的相同性アルゴリズム(SmithおよびWaterman、Adv Appl Math、1981; SmithおよびWaterman、J Teor Biol、1981; SmithおよびWaterman、J Mol Biol、1981; Smithら、J Mol Evol、1981)、Needlemanの相同性アライメント法(NeedlemanおよびWunsch、1970)、Pearsonの類似性の検索法(PearsonおよびLipman、1988)、これらのアルゴリズムのコンピュータによる実行(Wisconsin Genetics SoftwarePackage Release 7.0、Genetics Computer Group、575 Science Dr.、Madison、WIまたはGenetics Computer Group、University of Wisconsin、Madison、WIのSequence Analysis Software PackageのGAP、BESTFIT、FASTA、およびTFASTA)、または観察によって行い、種々の方法によって作製された最適のアライメント(すなわち、比較ウィンドウに渡って最高の割合の相同性が得られる)を選択する。そして2つの配列(すなわちプローブ配列およびデータベース配列)の類似性が予測できる。
【0059】
そのようなソフトウェアは、相同性の度合いを種々の欠失、置換、および他の修飾に割り当てて、類似の配列を合わせる。2つまたはそれ以上の核酸またはポリペプチド配列における「相同性」および「同一性」は、任意の数の配列比較アルゴリズムを用いるか、手で並べて目視して測定した場合に、比較ウィンドウまたは指定の領域に渡って、対応が最大になるように比較及び整列させたときに、同一であるか特定の割合で同一のアミノ酸残基またはヌクレオチドを持つ、2つまたはそれ以上の配列またはサブ配列を指す。
【0060】
配列の比較には、通常は1つの配列が参照配列となり、試験配列がこれと比較される。配列比較アルゴリズムを使用するときは、試験および参照配列をコンピュータに入力し、必要ならばサブ配列座標を指定し、配列アルゴリズムプログラムのパラメータを指定する。デフォルトのプログラムパラメータを使用するか、別のパラメータを指定することができる。そして配列比較アルゴリズムはプログラムパラメータに基づいて、参照配列と比較した試験配列の配列の同一性の割合を計算する。
【0061】
本明細書における「比較ウィンドウ」は、20から600、通常は約50から200、さらに通常は約100から約150からなる群から選択される任意の数の連続する位置の区画を指し、ここで1つの配列が同数の連結する位置を持つ参照配列と最適に並べられた後、2つの配列が比較される。
【0062】
有用なアルゴリズムの一例は、BLASTおよびBLAST 2.0アルゴリズムであり、これらはAltschulら、Nuc.Acids Res.25:3389−3402 (1997)およびAltschulら、J.Mol.Biol.215:403−410 (1990)にそれぞれ記述されている。BLAST分析を行なうためのソフトウェアは、National Center for Biotechnology Information(http://ncbi.nlm.nih.gov/)から一般に公開されている。このアルゴリズムでは、まずデータベース配列中の同じ長さのワードと並べたときに一致するか、ある正の値の閾値Tを満足する長さWの短いワードをクエリー配列において同定することにより、高スコア配列ペア(HSP)を同定する。Tは近傍ワードスコア閾値と呼ばれる(Altschulら、上記)。これらの初期の近傍ワードヒットは、これらを含むさらに長いHSPを見つけるための検索を開始するシードとなる。ワードのヒットは累積アライメントスコアが増加するかぎり、各配列に沿って両方向に延長される。累積スコアは、ヌクレオチド配列の場合には、パラメータM(一致する残基のペアの報酬スコア;常に>0)を用いて計算される。BLASTアリゴリズムのパラメータW、TおよびXは感度およびアライメントのスピードを決定する。BLASTNプログラム(ヌクレオチド配列用)は、デフォルトとしてワード長は11、期待(E)は10、M=5、N=4、および両鎖の比較を用いる。
【0063】
BLASTアルゴリズムは、2つの配列の類似性の統計解析も行なう(KarlinおよびAltschul、Proc.Natl.Acad.Sci.USA 90:5873 (1993)参照)。BLASTアルゴリズムが提供する類似性の1つの尺度は、最小合計率(smallest sum probability)(P (N))で、これは2つのヌクレオチド配列の一致が偶然に発生する確率の指標となる。例えば、試験核酸と参照核酸の比較において最小合計率が約0.2未満、より好ましくは約0.01未満、最も好ましくは約0.001未満であれば、その核酸は参照核酸と類似していると認められる。
【0064】
配列の相同性は、2つのポリヌクレオチド配列が比較ウィンドウに渡って相同(ヌクレオチドごとに)であることを意味する。配列の同一性または相同性の割合は、比較ウィンドウに渡って最適に並べられた2つの配列を比較し、両方の配列で同一の核酸塩基(例えば、A、T、C、G、UまたはI)がある位置の数を決定して一致する位置の数を求め、一致した位置の数を比較ウィンドウ内の位置の合計数(ウィンドウサイズ)で割り、その結果を100倍して配列の相同性の百分率を求めて計算される。この実質的な相同性は、ポリヌクレオチド配列の特性を意味し、このポリヌクレオチドは少なくとも25〜50ヌクレオチドの比較ウィンドウの参照配列と比較して、少なくとも60%の配列相同性、通常は少なくとも70%、しばしば80から90%、最も一般的には少なくとも99%の配列相同性を持つが、配列の相同性は、比較ウィンドウに渡って参照配列の合計20%またはそれ以下の欠失または付加を含む可能性のあるポリヌクレオチド配列を、参照配列と比較して計算される。
【0065】
十分な相同性を持つ配列は、例えば種および活性の情報を含む、データベース中の注釈によってさらに同定できる。したがって、通常の環境試料では、複数の核酸配列が獲得、クローニング、配列決定され、データベースから対応する相同配列が同定される。この情報は、データベース情報に基づくとその配列またはその配列にコードされる任意のポリペプチドに関連する生物体および活性を含め、ポリヌクレオチドに関連する1つまたは複数の特徴を含む、試料中に存在するポリヌクレオチドのプロフィールを提供する。本明細書で使用される「フィンガープリント」または「プロフィール」は、各試料は、試料およびそれが由来する環境に特徴的なポリヌクレオチドのセットを持つという事実を意味する。そのようなプロフィールは、試料中に存在する配列の量と種類、ならびにポリヌクレオチドが由来する生物体およびそのポリヌクレオチドによってコードされる潜在的活性に関する情報を含み得る。この独特のパターンが各試料のプロフィールまたはフィンガープリントである。
【0066】
場合によっては、特定のクローニングされたポリヌクレオチド配列の正体および活性が決定されるか示唆される正体または活性がポリヌクレオチドと関連づけられると、その配列を発現するのが望ましいことがある。そのような場合、所望のクローンがまだ発現ベクターにクローニングされていなければ、これを調節制御要素(例えば、プロモーターまたはエンハンサー)の下流に連結し、適切な宿主細胞にクローニングする。発現ベクターは、本発明で使用される対応する宿主細胞とともに、市販されている。
【0067】
使用できる発現ベクターの代表例としては、ウイルス粒子、バキュロウイルス、ファージ、プラスミド、ファージミド、コスミド、フォスミド、バクテリア人工染色体、ウイルス核酸(例えば、ワクシニア、アデノウイルス、鶏痘ウイルス、偽狂犬病、およびSV40の誘導体)、P1ベースの人工染色体、酵母プラスミド、酵母人工染色体、および関心対象の特定の宿主(バチルス、アスペルギルス、酵母等)に特異的な任意の他のベクターがある。したがって、例えばポリペプチドの発現のために種々の発現ベクターの任意の1つにDNAを導入できる。そのようなベクターには、染色体性、非染色体性、および合成のDNA配列が含まれる。当業者には数多くの適切なベクターが知られており、市販されている。以下のベクターは、例として挙げられる;細菌用:pQE70、pQE60、pQE−9 (Qiagen)、psiX174、pBluescript SK、pBluescript KS、pNH8A、pNH16a、pNH18A、pNH46A (Stratagene); pTRC99a、pKK223−3、pKK233−3、pDR540、pRIT5 (Pharmacia);真核細胞用:pWLNEO、pSV2CAT、pOG44、pXT1、pSG (Stratagene)、pSVK3、pBPV、pMSG、pSVL (Pharmacia)。しかし、宿主中で複製可能で生存できるかぎり、任意の他のプラスミドまたはベクターも使用できる。
【0068】
発現ベクター中の核酸配列は、mRNA合成を指揮するために、適切な発現制御配列(プロモーター)に機能的に連結される。特に名前が付けられた細菌のプロモーターには、lacI、lacZ、T3、T7、gpt、λPR、PLおよびtrpが含まれる。真核細胞のプロモーターには、CMV IEプロモーター、HSVチミジンキナーゼ、SV40初期および後期プロモーター、レトロウイルスのLTR、およびマウスメタロチオネイン−Iが含まれる。適切なベクターおよびプロモーターの選択は、当業者のレベルの範囲内である。発現ベクターは、翻訳開始のためのリボソーム結合部位および転写終結因子も含む。ベクターには、発現の増幅のために適切な配列も含まれることがある。プロモーター領域は、CAT(クロラムフェニコールトランスフェラーゼ)ベクターまたは選択可能マーカーを持つ他のベクターを用いて、任意の遺伝子から選択することができる。
【0069】
また、発現ベクターは、真核細胞培養ではジヒドロ葉酸レダクターゼまたはネオマイシン耐性、または大腸菌(E.coli)ではテトラサイクリンまたはアンピシリン耐性のような、形質転換した宿主細胞の選択のための表現型の形質を提供する1つまたは複数の選択可能マーカー遺伝子を好ましくは含む。
【0070】
上述のようにして選択、クローニング、および配列決定した核酸配列は、さらに所望の酵素活性のスクリーニングを行なうライブラリーの調製のために、適切な宿主に導入できる。選択された核酸は、好ましくはすでに適当な制御配列を含むベクター中にあり、そのため、酵素をコードする選択された核酸は、所望の活性を検出するために発現できることになる。宿主細胞は、哺乳類細胞のような高等真核細胞、または酵母細胞のような下等真核細胞、または宿主は細菌細胞のような原核細胞であり得る。適切な宿主の選択は、本明細書の教えから、当業者の範囲であると考えられる。
【0071】
ライブラリーは、当技術分野で周知の手順によって特定の酵素活性に関してスクリーニングできる。例えば、6つのIUVクラス;酸化還元酵素、転移酵素、加水分解酵素、脱離酵素、異性化酵素、および合成酵素のうちの1つまたは複数についてスクリーニングできる。1つまたは複数のIUBクラスに陽性であること判断された組み換え酵素は、その後さらに具体的な酵素活性についてスクリーニングされる。または、さらに特化した酵素活性についてライブラリーのスクリーニングができる。例えば、加水分解酵素活性の一般的なスクリーニングの代わりに、より具体化した活性、すなわち加水分解酵素が作用する結合の種類についてスクリーニングができる。このようにして、例えば、(a) アミド(ペプチド結合)、すなわちプロテアーゼ;(b) エステル結合、すなわちエステラーゼおよびリパーゼ;(c) アセタール、すなわちグリコシダーゼのような1つまたは複数のさらに特定の化学的機能に作用する加水分解酵素を確実にするためにスクリーニングできる。
【0072】
場合によっては、試料中に存在する核酸配列または単離された特定のクローンの増幅を行なうことが望ましい場合がある。この態様では、核酸配列はPCR反応または当業者に周知の他の類似反応によって増幅される。そのような増幅反応を行なうために、増幅キットが市販されている。
【0073】
さらに、アライメントアルゴリズムおよび検索可能なデータベースが、コンピュータのハードウェア、ソフトウェア、またはその組み合せで実行できることを認識することが重要である。結果的に、核酸配列およびその配列にコードされる対応するポリペプチドの単離、処理、および同定は、自動化システムで実行できる。
【0074】
または、本発明の方法にしたがって獲得、同定、およびクローニングしたポリヌクレオチド配列を変化させることが望ましい場合がある。そのような変化によって、コードされるポリペプチドの活性、特異性、親和性、機能等を修飾(例えば、増加または減少)させるために、ポリヌクレオチド配列を修飾できる。特定の試料中の多様性を増加させるために、DNAシャッフリングが使用できる。DNAシャッフリングは、実質的に相同であるが同一ではない配列の間の組み換えを示すが、一部の態様では、cer/loxおよび/またはflp/frtシステムなどのようなDNAシャッフリングは非相同組み換えによるクロスオーバーを伴う可能性がある(例えば、1999年8月17日にDr.Jay Shortに付与され、Diversa Corporationに譲渡された米国特許第5,939,250号参照、この開示は参照として本明細書に組み入れられる)。シャッフリング、変異導入またはポリヌクレオチド配列を変化させる種々の方法は、以下に論じられている。
【0075】
核酸シャッフリングは、ポリヌクレオチドを作製するための、より短いまたは小さいポリヌクレオチドのプールのインビトロまたはインビボ相同組み換えの方法である。関連する核酸配列またはポリヌクレオチドの混合物にセクシャルPCRを施し、ランダムなポリヌクレオチドを提供し、リアセンブリーさせてライブラリーまたは組み換えハイブリッド核酸分子またはポリヌクレオチドの混合集合を作り出す。
【0076】
カセット変異法とは対照的に、シャッフリングおよびエラープローンPCRのみが、配列のプールに盲目的に(プライマー以外の配列情報なしに)変異を誘導できる。
【0077】
繰り返し選択に関して、本発明のシャッフリング変異法がエラープローンPCR単独よりも優れている点は、以下のように説明できる。エラープローンPCR(セクシャルPCRではない)とDNAシャッフリングを比較する。選択されたプール配列の最初のライブラリーは、多様な起源の関連する配列からなり、単一の遺伝子の任意のタイプの変異誘導(シャッフリングを含む)によって導かれうる。選択された配列の集合は、第1回の活性選択後に得られる。シャッフリングによると、例えば関連する配列全ての自由なコンビナトリアルな会合が可能になる。
【0078】
この方法は、逆連鎖反応であるという点で、エラープローンPCRとは異なる。エラープローンPCRでは、ポリメラーゼ開始部位の数および分子数は対数的に増加する。しかし、ポリメラーゼ開始部位の配列および分子の配列は、基本的に同じである。これとは対照的に、ランダムなポリヌクレオチドの核酸リアセンブリーまたはシャッフリング では、開始部位の数およびランダムなポリヌクレオチドの数(サイズではない)は、時間が経つと低下する。プラスミド全体に由来するポリヌクレオチドでは、理論的な終点は単一の大きなコンカテマー分子である。
【0079】
クロスオーバーは相同部位で起きるため、組み換えは主に同一の配列ファミリーのメンバー間で発生する。これにより著しく不適合(例えば、異なる活性または特異性を持つ)の配列間の組み合せが起こりにくくなる。複数の配列ファミリーを同一の反応でシャッフリングできると考えられる。さらに、一般にシャッフリングは相対的な順序を保存する。
【0080】
珍しいシャフラントは最良の分子(例えば、活性または特異性が最大)を数多く含んでおり、これらの珍しいシャフラントはその優れた活性または特異性に基づいて選択できる。
【0081】
100の異なるポリペプチド配列のプールには、最高103の異なる並べ替え方があり得る。この大きな順列数は、単一のDNA配列ライブラリーでは表せない。したがって、配列の長さと、望む配列多様性に応じて、複数回のDNAシャッフリングおよび選択が必要だと考えられる。
【0082】
これとは対照にエラープローンPCRは全ての選択された配列を、同じ相対的方向に保存するので、はるかに小さな変異群を生成することになる。
【0083】
本発明の方法で使用できる鋳型ポリヌクレオチドは、DNAまたはRNAでよい。遺伝子のサイズまたは組み合せもしくはリアセンブリーするより短いポリヌクレオチドに応じて、種々の長さであり得る。好ましくは、鋳型ポリヌクレオチドは50bpから50kbである。関心対象のタンパク質をコードする核酸を含むベクター全体を本発明の方法で使用できると予測され、実際に使用して成功を収めている。
【0084】
鋳型ポリヌクレオチドはPCR反応(米国特許第4,683,202号および米国特許第4,683,195号)または他の増幅またはクローニング方法によって得られる。しかし、PCR産物のプーリングおよびセクシャルPCRの前にPCR産物から遊離プライマーを除去するほうが、より効率の良い結果となる可能性がある。セクシャルPCRの前に元のプールからプライマーを適切に除去しないと、クロスオーバークローンの発生頻度が低下する。
【0085】
鋳型ポリヌクレオチドはしばしば二本鎖である。得られる一本鎖ポリヌクレオチドの領域が互いに相補的であり、ハイブリダイズして二本鎖分子を形成するように、二本鎖核酸分子が推奨される。
【0086】
鋳型ポリヌクレオチドと同一の領域および鋳型ポリヌクレオチドと異種の領域を持つ一本鎖または二本鎖核酸ポリヌクレオチドを、この段階で鋳型ポリヌクレオチドに添加できる。異なるが関連する2つのポリヌクレオチド鋳型も、この段階で混合できると考えられる。
【0087】
二本鎖ポリヌクレオチド鋳型および任意の添加された二本鎖または一本鎖ポリヌクレオチドは、約5bpから5kbまたはそれ以上の混合物を提供するために、減速または停止を含めたセクシャルPCRにかけられる。好ましくはランダムポリヌクレオチドのサイズは約10bpから1000bp、さらに好ましくはポリヌクレオチドのサイズは約20bpから500bpである。
【0088】
または、複数のニックを持つ二本鎖核酸も本発明の方法に使用できる。ニックとは、二本鎖核酸のうちの一本鎖に裂け目が入ったものである。そのようなニックの間の距離は、好ましくは5bpから5kb、より好ましくは10bpと1000bpの間である。これによって、セルフプライミングの領域が提供され、より短いポリヌクレオチドが生成して、例えばランダムプライマーから得られるポリヌクレオチドとともに含まれることになる。
【0089】
任意の特定のポリヌクレオチドの濃度は、ポリヌクレオチド全体の重量の1%以下、より好ましくは任意の特定の核酸配列は、全核酸重量の0.1%以下である。
【0090】
混合物中の異なるポリヌクレオチドの数は、少なくとも約100、好ましくは少なくとも約500、およびさらに好ましくは少なくとも約1000である。
【0091】
この段階で、ポリヌクレオチドの混合物の異質性を高めるために、ランダムの二本鎖のより短いポリヌクレオチドに、合成または天然の一本鎖または二本鎖ポリヌクレオチドを添加しても良い。
【0092】
またこの段階で、セクシャルPCRプロセスで得られたポリヌクレオチドに、無作為に破壊した二本鎖ポリヌクレオチド群を混合し、選択的にさらに1回またはそれ以上のセクシャルPCRサイクルを行なっても良い。
【0093】
鋳型ポリヌクレオチドに変異を導入することが望ましい場合には、鋳型ポリヌクレオチドと同一の領域、および鋳型ポリヌクレオチドと異種の領域を持つ一本鎖または二本鎖ポリヌクレオチドを、総核酸量と比較して最高20倍の重量で、より好ましくは一本鎖ポリヌクレオチドを総核酸量と比較して10倍の重量で、添加することができる。
【0094】
異なるが関連する鋳型ポリヌクレオチドが望ましい場合には、各鋳型のポリヌクレオチド群を約1:100以下、より好ましくは約1:40以下の比で組み合せることができる。例えば、自然変異(例えば、選択している表現型の性質に実質的ではない変化を生じる変異)を除去するために、変異ポリヌクレオチド群を野生型ポリヌクレオチドに戻し交雑することが望ましい場合がある。そのような例では、ランダムに提供されるセクシャルPCRサイクルハイブリッドポリヌクレオチドに添加できるランダムに提供される野生型ポリヌクレオチドの比率は、約1:1から約100:1、より好ましくは1:1から40:1である。
【0095】
ランダムポリヌクレオチドの混合群を変性して一本鎖ポリヌクレオチドを形成させ、再アニーリングさせる。他の一本鎖ポリヌクレオチドと相同領域を持つ一本鎖ポリヌクレオチドのみが、再アニーリングする。
【0096】
ランダムポリヌクレオチドは、加熱によって変性できる。当業者は二本鎖核酸を完全に変性するために必要な条件を決定できる。好ましくは温度は80℃から100℃、より好ましくは温度は90℃から96℃である。ポリヌクレオチドの変性に使用できる他の方法には、圧力とpHが含まれる。
【0097】
ポリヌクレオチドは冷却によって再アニーリングされうる。好ましくは温度は20℃から75℃、より好ましくは温度は40℃から65℃である。平均わずか4つの相同塩基の連続に基づいて高頻度のクロスオーバーが必要ならば、プロセスはより困難にはなるが、低いアニーリング温度を用いて組み換えを起こさせることができる。再生の度合いは、一本鎖ポリヌクレオチド群の間の相同性の度合いに依存する。
【0098】
ポリエチレングリコール(PEG)または塩を添加することによって、再生を加速できる。塩濃度は好ましくは0 mMから200 mM、より好ましくは塩濃度は10 mMから100 mMである。塩はKClまたはNaClでよい。PEGの濃度は好ましくは0%から20%、より好ましくは5%から10%である。
【0099】
アニーリングしたポリヌクレオチドを、次に核酸ポリメラーゼおよびdNTP(すなわちdATP、dCTP、dGTPおよびdTTP)の存在下でインキュベーションする。核酸ポリメラーゼはクレノウフラグメント、Taqポリメラーゼまたは当技術分野で周知の他の任意のDNAポリメラーゼで良い。
【0100】
アセンブリーに用いる方法は、クロスオーバーを生じる最低の相同性の度合いに依存する。同一部分が大きい場合には、アニーリング温度45〜65℃でTaqポリメラーゼが使用できる。同一部分が小さい場合には、アニーリング温度20〜30℃でクレノウフラグメントが使用できる。当業者は、クロスオーバーの数を増やすためにアニーリング温度を変えることができる。
【0101】
ポリメラーゼを、アニーリング前、アニーリングと同時、またはアニーリング後にランダムなポリヌクレオチドプライマーに添加できる。
【0102】
変性、再生、およびポリメラーゼ存在下のインキュベーションのサイクルは、本明細書において核酸のシャッフリングまたはリアセンブリーと呼ばれる。このサイクルは、所望の回数、繰り返される。好ましくはサイクルは2〜50回、より好ましくは10から40回繰り返される。
【0103】
得られる核酸は、約50bpから約100kb、好ましくは500bpから50kbのより大きな二本鎖ポリヌクレオチドである。
【0104】
このより大きなポリヌクレオチドには、鋳型ポリヌクレオチドと同じサイズのポリヌクレオチドが数コピー縦につながったものが含まれている可能性がある。このコンカテマーポリヌクレオチドを変性させて、鋳型ポリヌクレオチドの単一コピーにする。その結果、鋳型ポリヌクレオチドとほぼ同じサイズのポリヌクレオチド群になる。このポリヌクレオチド群は、シャッフリングの前に同一および異種の部分を持った一本鎖または二本鎖ポリヌクレオチドが鋳型ポリヌクレオチドに添加された、混合群になる。これらのポリヌクレオチドは、その後適当なベクターにクローニングされ、その連結反応液は細菌の形質転換に使用される。
【0105】
コンカテマーを消化するかわりに、PCR(米国特許第4,683,195号および米国特許第4,683,202号)を含む種々の方法によって、クローニングの前に単一のポリヌクレオチドの増幅を行なうことにより、より大きなコンカテマーポリヌクレオチドから単一のポリヌクレオチドが得られると考えられる。
【0106】
クローニングに使用されるベクターは、所望のサイズのポリヌクレオチドを受け入れるかぎり、特に重要ではない。特定のポリヌクレオチドの発現が望まれる場合には、クローニング媒体は、宿主細胞中でポリヌクレオチドの発現を行なうために、ポリヌクレオチドの挿入部位の隣の転写および翻訳シグナルも含む必要がある。
【0107】
得られる細菌集合には、ランダムな変異を持ついくつかの組み換えポリヌクレオチドが含まれている。この混合集合を用いて、所望の組み換えポリヌクレオチドを同定できる。選択の方法は、所望のポリヌクレオチドに依存する。
【0108】
例えば、本発明に記述される方法によって同定されたポリヌクレオチドが、第1の結合親和性を持つタンパク質をコードしている場合は、リガンドに対する結合親和性の増加したその後の変異(例えば、シャッフリングされた)配列が望まれる場合がある。そのような場合、その集合またはライブラリー中のポリヌクレオチドの部分の各々によって発現されるタンパク質について、当技術分野で周知の方法によって、リガンドに対する結合能力を試験することができる(パンニング、アフィニティクロマトグラフィー)。薬剤耐性の増加したタンパク質をコードするポリヌクレオチドが望まれる場合には、その集合またはライブラリーのポリヌクレオチドの各々によって発現されるタンパク質の持つ、宿主生物体に薬剤耐性を与える能力について、試験できる。当業者は、所望のタンパク質に関する知識があれば、タンパク質に望ましい性質を与えるポリヌクレオチドを同定するためにその集合を試験することができる。
【0109】
当業者は、タンパク質の断片がファージ表面上に融合タンパク質として発現される、ファージディスプレイシステム(Pharmacia、Milwaukee WI)を使用できると考えられる。組み換えDNA分子は、組み換えDNA分子によってその一部がコードされている融合タンパク質の転写を誘導するような部位で、ファージDNAにクローニングされる。組み換え核酸分子を含むファージは、細胞中で複製および転写される。融合タンパク質のリーダー配列は、融合タンパク質をファージ粒子の先端に輸送するように指示する。こうして、組み換えDNA分子が一部をコードする融合タンパク質は、ファージ粒子上にディスプレイされ、上述の方法で検出と選択が可能になる。
【0110】
さらに、最初の集合のうち、所望の組み換えタンパク質をコードするDNAをふくむサブ集合のポリヌクレオチドを用いて、核酸シャッフリングのサイクルを何回か実行できると考えられる。このようにして、より高い結合親和性または酵素活性を持つタンパク質も得られる。
【0111】
サブ集合からサイレント変異を除去するために、最初またはその後の回の核酸シャッフリングからの核酸サブ集合および野生型ポリヌクレオチドの混合物を用いて、核酸シャッフリングのサイクルを何回か実行できると考えられる。
【0112】
開始核酸として、精製された形の任意の核酸供給源が利用できる。したがって、この過程は一本鎖または二本鎖の、メッセンジャーRNAを含むRNAまたはDNAを使用しうる。また、DNAとRNAを各々一本ずつ含むDNA−RNAハイブリッドも利用できる。核酸配列の長さは、変異させる核酸配列のサイズに応じて異なる。好ましくは、特定の核酸配列は50から50000塩基対である。関心対象のタンパク質をコードする核酸を含むベクター全体が、本発明の方法で使用できると考えられる。
【0113】
任意の特定の核酸配列を用いて本過程によってハイブリッド群を作製できる。本方法のために、特定の核酸配列のハイブリッド配列の小さな集合が存在するまたは利用できることのみが、必要である。
【0114】
変異を持つ特定の核酸配列群を、いくつかの異なる方法で作製できる。エラープローンPCRで変異が作製できる。エラープローンPCRは、長い配列に渡って、ランダムに低いレベルで点変異を導入するために、忠実度の低い重合条件を使用する。または、オリゴヌクレオチド指定変異導入によって、鋳型ポリヌクレオチドに変異を導入することもできる。オリゴヌクレオチド指定変異導入では、制限酵素による消化を用いて、短い配列のポリヌクレオチドがポリヌクレオチドから除去され、元の配列から種々の塩基が変化している合成ポリヌクレオチドで置換される。化学的変異導入によってもポリヌクレオチドの配列を変化できる。化学的変異原には、例えば、亜硫酸水素ナトリウム、亜硝酸、ヒドロキシルアミン、ヒドラジンまたは蟻酸が含まれる。ヌクレオチド前駆体のアナログである他の物質には、ニトロソグアニジン、5−ブロモウラシル、2−アミノプリン、またはアクリジンが含まれる。一般に、これらの物質はヌクレオチド前駆体の代わりにPCR反応に添加され、配列に変異を誘導することになる。プロフラビン、アクリフラビン、キナクリン等のようなインターカレーションする薬剤も使用できる。ポリヌクレオチド配列のランダムな変異導入は、X線または紫外線の照射によっても誘導できる。 一般に、このように変異が誘導されたプラスミドポリヌクレオチドを大腸菌(E.coli)に導入し、ハイブリッドプラスミドのプールまたはライブラリーとして増殖させる。
【0115】
または、特定の核酸の小さな混合集合は天然に見られ、同じ遺伝子の異なる対立遺伝子または異なる関連する種由来の同じ遺伝子(すなわち同族遺伝子)を含む可能性もある。または、例えば免疫グロブリン遺伝子のように、1つの種の中に見られる関連DNA配列である可能性もある。
【0116】
特定の核酸配列の混合集合が作製されたら、当技術分野で周知のテクニックを用いてポリヌクレオチドは直接使用されるか、適当なクローニングベクターに挿入される。
【0117】
ベクターの選択は、本発明の方法で使用されるポリヌクレオチド配列のサイズおよび宿主細胞に依存する。本発明の鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルス等)、またはその選択された部分(例えば、コートタンパク、スパイク糖タンパク質、キャプシドタンパク質)である可能性がある。例えば、コスミドおよびファージミドは、大きなポリヌクレオチドを安定的に増殖できるので、変異させる特定の核酸配列が、より大きい場合に好ましい。
【0118】
特定の核酸配列の混合集合がベクターにクローニングされたら、クローン増幅できる。発現されたポリペプチドをスクリーニングすることによって、有用性は容易に決定できる。
【0119】
本発明のDNAシャッフリング法は、未知の配列のプールに対して盲目的に実行できる。リアセンブリー混合物にオリゴヌクレオチド(リアセンブリーしている配列と相同な末端を持つ)を添加することによって、任意の配列混合物を、任意の特定の位置で、別の配列混合物に組み込むことができる。したがって、合成オリゴヌクレオチド、PCRポリヌクレオチドまたは遺伝子全体の混合物でも、定められた位置で別の配列ライブラリー中に混合できる。1つの配列(混合物)の挿入は、鋳型の別の部分における配列の挿入とは独立している。したがって、組み換えの度合い、必要な相同性、およびライブラリーの多様性は、リアセンブリーされるDNAの長さとともに、独立して同時に変化させられる。
【0120】
シャッフリングには、多様性領域を分離する相同領域の存在が必要である。シャッフリングには、骨組みのようなタンパク質構造が特に適している可能性がある。保存された骨組みは、自己集合によって全体の折畳みを決定し、特定の結合を仲介する比較的制限の少ないループを提示する。そのような骨組みの例には、当技術分野で周知の免疫グロブリンβバレル、および4ヘリックスバンドルがある。このシャッフリングは、結合のための種々の変異配列の組み合せを用いて、骨組み様タンパク質を作製するために使用できる。
【0121】
インビトロシャッフリング
インビトロシャッフリングによって、標準的な遺伝的交配と同等なものも行なうことができる。例えば、ハイブリッドの核酸を野生型核酸と繰返し混合し、関心対象の変異を選択することによって、「分子戻し交雑」が行なえる。従来の育種と同様に、このアプローチを用いて、選択したバックグラウンドに種々の供給源からの表現型を組み合せることができる。これは例えば、選択されない特徴(例えば、免疫原性)に影響を与える中立変異を除去するために、有用である。したがって、これはタンパク質中のどの変異が向上した生物活性に関与していて、どれが関与していないかを決定するために有用であるが、これはエラープローン変異導入またはカセット変異法にはない利点である。
【0122】
小さなランダムポリヌクレオチドの混合物から、大きな機能的遺伝子を正しく組み立てることが可能である。この反応は、化石の高度に断片化されたDNAの遺伝子のリアセンブリーに有用である。また、化石のランダムな核酸断片は、関連する種の類似した遺伝子のポリヌクレオチドと組み合せることができる。
【0123】
本発明の方法は、種々の研究および診断用途に必要とされる、単一の細胞のゲノム全体のインビトロ増幅にも使用できる。PCRによるDNA増幅は、通常約40kbの配列を含む。PCRによって大腸菌(E.coli) (5,000kb) のようなゲノム全体を増幅するためには約250のプライマーが必要であり、125の40kbポリヌクレオチドが産生される。一方で、セクシャルPCRサイクルを用いたゲノムのポリヌクレオチドのランダム作製後に小さなポリヌクレオチドをゲル精製すると、多数の潜在的プライマーが提供される。この小さなランダムポリヌクレオチド混合物を、単独または鋳型としてのゲノム全体と共にPCR反応で使用すると、逆連鎖反応が起こり、その理論的終点はゲノムの多数のコピーを含む単一のコンカテマーとなる。
【0124】
ランダムポリヌクレオチドのみを使用すると、コピー数は100倍増幅、平均ポリヌクレオチドサイズは50kb以上が得られる。多くの小さなポリヌクレオチドの重複によって、より大きなコンカテマーが得られると考えられる。合成プライマーを用いて得られた特定のPCR産物の質は、増幅されないDNAから得られた産物と区別がつかないようになる。このアプローチは、ゲノムのマッピングに有用になると期待される。
【0125】
シャッフリングするポリヌクレオチドは、実施者の裁量によって、ランダムまたは非ランダムポリヌクレオチドとして作製できる。さらに、本発明は広範囲のポリヌクレオチドサイズおよびタイプに応用できるシャッフリング法を提供し、これにはより大きなポリヌクレオチドのリアセンブリーにおける構成単位として用いるポリヌクレオチドモノマーの作製段階が含まれる。例えば、構成単位は遺伝子断片であったり、遺伝子全体、遺伝子経路、またはその任意の組み合せを含む可能性がある。
【0126】
インビボシャッフリング
インビボシャッフリングの1つの態様では、特定の核酸配列の混合群が、少なくとも2つの異なる核酸配列が各宿主細胞に存在するような条件で、細菌または真核細胞中に導入される。ポリヌクレオチドは、種々の方法で宿主細胞に導入できる。宿主細胞は、例えば塩化カルシウム処理のような当技術分野で周知の方法を用いて、より小さなポリヌクレオチドで形質転換できる。ポリヌクレオチドがファージゲノムに挿入される場合は、特定の核酸配列を持つ組み換えファージゲノムを宿主細胞にトランスフェクトできる。または、電気穿孔、トランスフェクション、リポフェクション、バイオリスティック、接合等を用いて核酸配列を宿主細胞に導入できる。
【0127】
一般に、この態様では、宿主細胞中で安定に配列を複製できるベクター中に、特定の核酸配列が存在する。また、ベクターを持つ宿主細胞が選択できるように、ベクターにはマーカー遺伝子がコードされていると考えられる。これにより、変異を受けた特定の核酸配列が、宿主細胞への導入後に回収できるようになる。しかし、特定の核酸配列の混合群全体が、ベクター配列に存在する必要はないと考えられる。むしろ、ポリヌクレオチドの宿主細胞への導入後に、各宿主細胞がその中に少なくとも1つの特定の核酸配列を持つために十分な数の配列のみがベクターにクローニングされればよい。また、特定の核酸配列の集合のサブセットをベクターにクローニングするよりも、このサブセットは既に宿主細胞中に安定に組み入れられている可能性もある。
【0128】
宿主細胞中に同一領域を持つ2つのポリヌクレオチドが挿入されると、2つのポリヌクレオチドの間で相同組み換えが起きることが分かっている。2つの変異した核酸配列の間のそのような組み換えは、場合によっては二重または三重ハイブリッドを生じることがある。
【0129】
変異した核酸配列のいくつかが、直線状の核酸分子上に存在すると、組換え頻度が高まることも分かっている。したがって、1つの態様では、特定の核酸配列のいくつかは、直線状ポリヌクレオチド上に存在する。
【0130】
形質転換後、宿主細胞形質転換体は、所望の性質を持つ変異した核酸配列を含む宿主細胞形質転換体を同定するために、選択を受ける。例えば、特定の薬剤に対する耐性の増加が望まれる場合には、形質転換した宿主細胞を、濃度を上げたその特定の薬剤にさらし、薬剤耐性の上昇を与える変異タンパクを作製する形質転換体が選択される。特定のタンパク質が受容体に結合する能力を強化したい場合には、形質転換体のタンパク質の発現を誘導し、得られたタンパク質を当技術分野で周知の方法によりリガンド結合アッセイで検定し、リガンドに対する結合が強化した変異群のサブセットを同定する。または、正しいプロセッシングを保証するためにタンパク質を別のシステムで発現しても良い。
【0131】
所望の特徴を持つ第1の組み換え核酸配列(娘配列)のサブセットが同定されたら、2回の組み換えを行なう。第2ラウンドの組み換えでは、組み換えられた核酸配列を、元の変異導入された核酸配列(親配列)と混合し、上述のサイクルを繰り返すことができる。このようにして、増強した特徴を持つまたは増強した特性を持つタンパク質をコードする第2の組み換え核酸配列のセットが同定できる。このサイクルは、所望の回数繰り返すことができる。
【0132】
第2またはその後の組み換えサイクルにおいては、戻し交雑が行われると考えられる。分子の戻し交雑は、所望の核酸配列を、多数の野生型配列と混合し、少なくとも1つの野生型核酸配列および変異核酸配列が、形質転換後の同一の宿主細胞に存在するようにすることで実行できる。野生型の核酸配列との組み換えによって、免疫原性のような選択されない特徴に影響を与える中立変異は除去されるが、選択される特徴は除去されない。
【0133】
本発明の別の態様では、第1ラウンドの間に、宿主細胞への導入前にPCR増幅を減速または停止することにより、より小さなポリヌクレオチドとして特定の核酸配列のサブセットが作製できると考えられる。ポリヌクレオチドのサイズは、他の配列と相同組み換えを起こすように、他の配列と同一の領域をいくつか含むほど大きい必要がある。ポリヌクレオチドのサイズは0.03kbから100kb、より好ましくは0.2kbから10kbである。その後のラウンドでは、宿主細胞への導入前にPCRポリヌクレオチドを作製するために、前ラウンドより選択された配列以外の、全ての特定の核酸配列が使用できると考えられる。
【0134】
より短いポリヌクレオチド配列は、一本鎖または二本鎖である。核酸の鎖を分離するために適当な反応条件は、当技術分野で周知である。
【0135】
このプロセスの段階は、無限に繰り返すことができ、作製可能な潜在的ハイブリッドの数でのみ限定される。
【0136】
したがって、変異した鋳型核酸の最初のプールまたは集合は、大腸菌(E.coli)のような細菌中で複製可能なベクター中にクローニングされる。この特定のベクターは、大腸菌(E.coli)中で自己複製が可能でありさえすれば、特に重要ではない。1つの態様では、ベクターはベクターに結合された変異核酸によってコードされる任意のタンパク質の発現および作製ができるように設計されている。またベクターが選択可能マーカーをコードする遺伝子を含むことも好ましい。
【0137】
変異核酸配列のプールを含むベクターの集合は、大腸菌(E.coli)宿主細胞に導入される。ベクターの核酸配列は、ファージの場合は形質転換、トランスフェクション、または感染によって導入できる。細菌の形質転換に使用するベクターの濃度は、各細胞にいくつかのベクターが導入されるようにする。細胞中に入ると、相同組み換えの効率は、種々のベクターの間で相同組み換えが起きるようになっている。その結果、元の親変異配列とは異なる変異の組み合せを持つハイブリッド(娘)が生成する。その後、宿主細胞をクローン複製し、ベクター上に存在するマーカー遺伝子の選択をする。プラスミドを持つ細胞のみが、選択条件下で増殖する。ベクターを含む宿主細胞は、好ましい変異が存在するか検定する。
【0138】
所望の特徴を与える特定の娘変異核酸配列が同定されたら、すでにベクターに結合しているまたはベクターから分離している核酸が単離される。その後この核酸は、核酸の第1または親集合と混合され、サイクルが繰り返される。
【0139】
ポリヌクレオチドとしてまたは同一のベクターにクローニングされた、親変異核酸集合は、既に娘核酸を含んでいる宿主細胞に導入される。細胞中で組み換えを起こすようにし、次の世代の組み換え体、孫が上述の方法で選択される。このサイクルは、所望の特徴を持つ核酸またはタンパク質が得られるまで、何度も繰り返される。その後のサイクルでは、ハイブリッドに添加される変異配列の集合は、親ハイブリッドまたはその後の世代に由来すると考えられる。
【0140】
別の態様では、本発明は、中立変異を除去するために、得られた組み換え核酸の「分子」戻し交雑を行なう方法を提供する。中立変異とは、核酸またはペプチドに所望の性質を与えない変異である。しかし、そのような変異は望ましくない特徴を核酸またはペプチドに与えうる。したがって、そのような中立変異を除去することが望ましい。本発明の方法は、その方法を提供する。
【0141】
この態様では、本発明の方法で所望の特徴を持つハイブリッド核酸が得られたら、核酸、核酸を持つベクター、またはベクターおよび核酸を含む宿主細胞が単離される。
【0142】
その後、核酸またはベクターは、過剰量の野生型核酸とともに宿主細胞に導入される。ハイブリッドの核酸および野生型配列の核酸の組み換えが起きる。得られた組み換え体に、ハイブリッド核酸と同じ選択が行われる。所望の特徴を保持する組み換え体のみが、選択される。所望の特徴を提供しない任意のサイレント変異は、野生型DNAとの組み換えで失われる。このサイクルは、全てのサイレント変異が除去されるまで繰り返すことができる。
【0143】
エキソヌクレアーゼ媒介性リアセンブリー
別の態様では、本発明は、子孫ポリヌクレオチド(例えば、ポリペプチドまたは遺伝子経路を作製するように発現できるキメラ子孫ポリヌクレオチド)を形成するために、少なくとも2つのポリヌクレオチドを、シャッフリング、アセンブリー、リアセンブリー、組み換え、および/または連結する方法を提供する。ある1つの態様では、二本鎖ポリヌクレオチド(例えば、ハイブリダイゼーションパートナーとして、2つの一本鎖配列が互いにハイブリダイズしたもの)をエキソヌクレアーゼで処理して、2本の鎖のうちの1本からヌクレオチドを遊離させ、別のパートナーとのハイブリダイゼーションに残りの鎖が使用できるように、残りの鎖からパートナーを除去する。
【0144】
ある特定の局面では、二本鎖ポリヌクレオチドの末端(ポリヌクレオチド配列または非ポリヌクレオチド配列の一部またはこれに結合している可能性がある)をエキソヌクレアーゼ活性の供給源にさらす。エキソヌクレアーゼ活性の有用な供給源は、3’エキソヌクレアーゼ活性を持つ酵素、5’エキソヌクレアーゼ活性を持つ酵素、3’エキソヌクレアーゼ活性および5’エキソヌクレアーゼ活性の両方をもつ酵素、およびその任意の組み合せである。エキソヌクレアーゼは、直線状の二重鎖ポリヌクレオチドの片方または両方の末端、および2つ以上の末端を持つ分岐ポリヌクレオチドの1つ又は全ての末端から、ヌクレオチドを遊離させるために使用できる。
【0145】
反対に、ポリヌクレオチド構成単位のシャッフリング、アセンブリー、リアセンブリー、組み換えおよび/または連結のために非酵素段階も使用でき、これは作業試料を変性(または「溶解」)条件(例えば、温度、pH、および/または塩条件の変化による)にさらし、二本鎖ポリヌクレオチドの作業セットを一本鎖に溶解することを含む。シャッフリングのためには、単一のポリヌクレオチド鎖が異なるハイブリダイゼーションパートナーとのアニールにある程度参加することが望ましい(変性ステップ前の元のパートナーとの排他的アニールに戻るだけではなく)。しかし、反応容器中に元のハイブリダイゼーションパートナーが存在することは、一本鎖ポリヌクレオチドが元のパートナーとアニールし、元の二本鎖ポリヌクレオチドを再生することを排除するものではなく、時にはこれを有利にする。
【0146】
二本鎖ポリヌクレオチド構成単位を変性させアニーリングさせるこの非酵素シャッフリングステップとは反対に、本発明は変性を必要としない、エキソヌクレアーゼに基づく手法を提供する。むしろ、変性条件を避け、二本鎖ポリヌクレオチド基質をアニールした(すなわち非変性)状態で維持することは、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIIIおよびレッドα遺伝子産物)の作用のための必要条件である。また、反対に、他の一本鎖ポリヌクレオチド配列にハイブリダイズできる一本鎖ポリヌクレオチドの生成は、ハイブリダイゼーションパートナーの1つにおける共有結合の開裂および配列の破壊の結果である。例えば、エキソヌクレアーゼIII酵素を用いて1つのハイブリダイゼーション鎖における3’末端ヌクレオチドを遊離させることができ(そのポリヌクレオチド鎖における共有加水分解を行なう);これにより残りの一本鎖が新しいパートナーとハイブリダイゼーションするのが容易になる(元のパートナーが共有開裂を受けたため)。
【0147】
特に本開示の手法のために、より好適な速度および/またはより強い特異性および/または望まない活性のより少ない酵素が、発見、最適化(例えば、方向づけられた進化による操作)、または発見および最適化の両方をなされることができるのは、特に認識される。実際、本発明はそのようなデザイナー酵素の発見および/または開発を促進する可能性があると期待される。
【0148】
さらに、必要に応じて、二重鎖ポリヌクレオチドの末端を保護したり、使えるエキソヌクレアーゼの所望の酵素活性に感受性にしたりできることは認識され得る。例えば、3’がオーバーハングしている二重鎖ポリヌクレオチド末端は、エキソヌクレアーゼIIIのエキソヌクレアーゼ活性に感受性はない。しかし、種々の方法でこれをエキソヌクレアーゼIIIのエキソヌクレアーゼ活性に感受性にできる;例えば、ポリメラーゼ処理をしてブラントにする、ブラントエンドまたは5’のオーバーハングを提供するように開裂する、他の二重鎖ポリヌクレオチドと結合(連結またはハイブリダイズ)させてブラントエンドまたは5’オーバーハングを提供する、一本鎖ポリヌクレオチドとハイブリダイズさせてブラントエンドまたは5’オーバーハングを提供するようにする、または任意の種々の手法によって修飾できる。
【0149】
1つの局面では、直線状二重鎖ポリヌクレオチドの片端または両端にエキソヌクレアーゼを作用させ、完成、完成近く、または部分的完成まで進ませる。エキソヌクレアーゼ活性が完成まで進むと、その結果は各5’オーバーハング部分の長さは「ランデブーポイント」(ポリヌクレオチドの中点の近く)と考えられるものの方向に、ポリヌクレオチドの中央領域に向かって伸長する。最終的には、各々が元の二重鎖ポリヌクレオチドの長さの約半分である、一本鎖ポリヌクレオチド(分離できる)が形成される。
【0150】
したがってこのエキソヌクレアーゼを介する手法は、ポリヌクレオチド構成単位のシャッフリング、アセンブリーおよび/またはリアセンブリー、組み換えおよび、連結に有用で、そのポリヌクレオチド構成単位は、最高10塩基、または数10塩基、または数100塩基、または数1000塩基、または数万塩基、または数十万塩基、または数百万塩基、またはそれ以上の長さであり得る。
【0151】
エキソヌクレアーゼの基質は、二重鎖ポリヌクレオチドを断片化して作製できる。断片化は、機械的手法(例えば、剪断、超音波処理等)、酵素的手法(例えば、制限酵素を使用)、およびその組み合せによって、実行できる。より大きなポリヌクレオチドの断片は、ポリメラーゼを介する合成によっても作製できる。
【0152】
エキソヌクレアーゼ活性を持つ酵素の別の例には、レッドαおよびヘビ毒ホスホジエステラーゼが含まれる。レッドα遺伝子産物(λエキソヌクレアーゼとも呼ばれる)は、バクテリオファージλに由来する。レッドα遺伝子産物は、5’リン酸化末端から漸進的に作用し、二重鎖DNAからモノヌクレオチドを遊離させる(TakahashiおよびKobayashi、1990)。ヘビ毒ホスホジエステラーゼ(Laskowski、1980)はスーパーコイルDNAを素早く開くことができる。
【0153】
非確率的連結リアセンブリー
1つの局面では、本発明は合成連結リアセンブリー(SLR)と呼ばれる非確率的方法を提供する。これは核酸構成単位がランダムにシャッフリング、連結、またはキメラ化されるのではなく、非確率的に組み立てられるという点以外は、確率的シャッフリングにある程度関連している。
【0154】
SLR法はシャッフリングされるポリヌクレオチド間の高レベルの相同性の存在に依存しない。本発明は10100以上のキメラからなる子孫分子のライブラリー(セット)を非確率的に作製するために使用できる。おそらく、SLRは101000以上の異なる子孫キメラからなるライブラリーの作製にも使用できる。
【0155】
したがって、本発明は1つの局面では、設計によって選択された全体の組立順序を持つ完成したキメラ核酸分子のセットを作製する非確率的方法を提供する。この方法は、相互に適合する連結可能な末端を持った複数の特定の核酸構成単位を設計によって作製し、設計した全体の組立順序が実現するようにこれらの核酸構成単位を組み立てる段階を含む。
【0156】
組み立てられる核酸構成単位の相互に適合する連結可能な末端は、事前に定められた順序で構成単位を結合させることができるならば、この順序立った組立で「使用できる」と考えられる。したがって1つの局面では、核酸構成単位が結合される全体の組立順序は、連結可能末端の設計によって指定され、複数の組立段階が使用される場合には、核酸構成単位が結合される全体の組立順序は、やはり組立段階の逐次的順序によって指定される。本発明の1つの態様では、アニールされた構成単位は、リガーゼ(例えば、T4 DNAリガーゼ)等の酵素で処理され、構成単位の共有結合が作製される。
【0157】
別の態様では、核酸構成単位の設計は、完成したキメラ核酸分子の子孫セットを作製する基礎となる、祖先核酸鋳型のセットの配列分析により得られる。したがってこれらの祖先核酸鋳型は、変異導入、すなわちキメラ化またはシャッフリングする、核酸構成単位の設計に役立つ配列情報源となる。
【0158】
1つの具体例では、本発明は関連する遺伝子ファミリーおよびそれにコードされる関連する産物ファミリーのキメラ化を提供する。1つの特定の具体例では、コードされる産物は酵素である。本発明の局面にしたがって変異導入できる酵素ファミリーの代表例には、以下の酵素およびその機能がある:リパーゼ/エステラーゼ、プロテアーゼ、グリコシダーゼ/グリコシルトランスフェラーゼ、ホスファターゼ/キナーゼ、モノ/ジオキシゲナーゼ、ハロペルオキシダーゼ、リグニン、ペルオキシダーゼ/ジアリールプロパンペルオキシダーゼ、エポキシドヒドロラーゼ、ニトリルヒドラターゼ/ニトリラーゼ、トランスアミナーゼ、アミダーゼ/アシラーゼ。これらの具体例は、本発明の特定の局面を説明するものであるが、限定したり、開示される発明の範囲を制限するものではない。
【0159】
したがって本発明の1つの局面によると、1つまたは複数の境界点を選択するために、本発明の方法を用いて同定された複数の先祖核酸鋳型の配列を並べ、境界点を相同領域に見つけることができる。境界点は、作製する核酸構成単位の境界を明らかにするために使用できる。したがって、先祖分子中に同定され選択された境界点は、子孫分子の組立の潜在的キメラ化ポイントになる。
【0160】
通常利用できる境界点は、少なくとも2つの祖先鋳型が共有する相同領域(少なくとも1つのヌクレオチド塩基からなる)であるが、祖先鋳型の少なくとも半数、祖先鋳型の少なくとも3分の2、祖先鋳型の少なくとも4分の3、および好ましくはほぼ全ての祖先鋳型に共通の相同領域であり得る。さらに好ましくは、役立つ境界点は、全ての祖先鋳型に共通の相同領域である。
【0161】
好ましい態様では、網羅的なライブラリーを作製するために、連結組立プロセスは網羅的に行われる。つまり、核酸構成単位の全ての可能な順序の組み合せが、完成したキメラ核酸分子セット中に表される。同時に、各組み合せにおける組立順序(すなわち、各完成したキメラ核酸の5’から3’配列に向けての、各構成単位の組立順序)は設計(または非確率的)による。本発明の非確率的性質のために、望ましくない副産物の可能性は非常に低くなっている。
【0162】
別の好ましい態様では、本発明は、例えば、体系的に、例えば、1つずつ、スクリーニングできる区画を持つ、体系的に区画化したライブラリーを作製するために、連結リアセンブリープロセスが、体系的に行われることを規定する。つまり、特定の核酸構成単位の選択的および賢明な使用と、逐次的な段階的組立反応の選択的および賢明な使用により、いくつかの反応容器の各々において子孫産物の特定のセットが作製される実験設計が実現することを、本発明は規定する。これにより、体系的な試験およびスクリーニング手順が実行される。したがって、小さなグループにおいて、非常に多数の子孫分子を体系的に試験することが可能になる。
【0163】
特に祖先分子間の相同性が非常に低い場合に、非常に柔軟でかつ網羅的で体系的なキメラ化を実行する能力があるため、本発明は多数の子孫分子を含むライブラリー(またはセット)の作製を提供する。本連結リアセンブリー発明の非確率的性質のために、作製される子孫分子は好ましくは、設計によって選択された全体の組立順序を持つ完成したキメラ核酸分子のライブラリーを含む。1つの特定の態様では、そのような作製されたライブラリーには103から101000以上の異なる子孫分子種が含まれる。
【0164】
1つの局面では、上述のようにして作製された完成したキメラ核酸分子のセットは、ポリペプチドをコードするポリヌクレオチドを含む。1つの態様では、このポリヌクレオチドは遺伝子であり、人工の遺伝子である可能性もある。別の態様では、このポリヌクレオチドは遺伝子経路であり、人工の遺伝子経路である可能性もある。本発明は、本発明によって作製された1つまたは複数の人工遺伝子が、真核生物(植物を含む)中で作用できる経路のような、人工遺伝子経路に組み入れられることを規定する。
【0165】
別の具体例では、構成単位が作製されるステップの合成的な性質のために、後に選択的にインビトロプロセス(例えば、変異導入による)またはインビボプロセス(例えば、宿主生物体の遺伝子スプライシング能力を利用)によって除去できるヌクレオチド(例えば、例えばコドンまたはイントロンまたは調節配列のような、1つまたは複数のヌクレオチド)の導入と設計が可能である。多くの場合、役立つ境界点を作製する潜在的利点に加えて、他の多くの理由のためにこれらのヌクレオチドの導入が望ましい場合があることが認識される。
【0166】
したがって、別の態様では、本発明はイントロンを導入するために核酸構成単位が使用できることを規定する。したがって、本発明は本発明の人工遺伝子に機能的イントロンを導入できることを規定する。本発明は機能的イントロンは本発明の遺伝子経路にも導入できることを規定する。したがって、本発明は1つ(またはそれ以上)の人工的に導入されたイントロンを含む人工遺伝子である、キメラポリヌクレオチドの作製を提供する。
【0167】
したがって、本発明は1つ(またはそれ以上)の人工的に導入されたイントロンを含む人工遺伝子経路である、キメラポリヌクレオチドの作製も提供する。好ましくは、自然に発生するイントロンが遺伝子スプライシングにおいて機能するのと同様に、人工的に導入されたイントロンは、1つまたは複数の宿主細胞中で遺伝子スプライシングにおいて機能する。本発明は組み換えおよび/またはスプライシングのために、宿主生物体に導入される人工イントロン含有ポリヌクレオチドを作製する過程を提供する。
【0168】
本発明を用いて作製される人工遺伝子は、別の核酸との組み換えの基質にもなる。同様に、本発明を用いて作製される人工遺伝子経路は、別の核酸との組み換えの基質にもなる。好ましい例では、組み換えは、人工イントロン含有遺伝子と組み換えパートナーとなる核酸との間の相同領域によって促進されるか、ここで起きる。特に好ましい例では、組み換えパートナーも、人工遺伝子または人工遺伝子経路を含め、本発明によって作製された核酸である。組み換えは、人工遺伝子中に人工的に導入された1つ(またはそれ以上)のイントロンに存在する相同領域によって促進されるか、ここで起きる。
【0169】
本発明の合成連結リアセンブリー法は、複数の核酸構成単位を使用するが、その各々は好ましくは2つの連結可能末端を持つ。各核酸構成単位の2つの連結可能末端は、2つのブラントエンド(オーバーハングしたヌクレオチドがない)、または好ましくは1つのブラントエンドおよび1つのオーバーハング、より好ましくは2つのオーバーハングである。
【0170】
この目的に利用できるオーバーハングは、3’オーバーハングまたは5’オーバーハングである。したがって、核酸構成単位は、1つの3’オーバーハングまたは1つの5’オーバーハングまたは2つの3’オーバーハングまたは2つの5’オーバーハングを持つ可能性がある。核酸構成単位が組み立てられて、完成したキメラ核酸分子になる全体の順序は、目的を持った実験設計によって決定されるのであり、ランダムではない。
【0171】
1つの好ましい態様では、核酸構成単位は、2つの一本鎖核酸(一本鎖オリゴとも呼ばれる)を化学合成し、この2つがアニーリングして二本鎖核酸構成単位を形成するようにこれらを接触させることによって、作製される。
【0172】
二本鎖核酸構成単位は、種々のサイズであり得る。これらの構成単位のサイズは、小さいか、大きい可能性がある。構成単位の好ましいサイズは、1塩基対(オーバーハングを含まないで)から100,000塩基対(オーバーハングを含まないで)に渡る。他の好ましいサイズも提供され、下限は1bpから10,000bp(その間の全ての整数値を含む)、および上限は2bpから100,000bp(その間の全ての整数値を含む)である。
【0173】
本発明に役立つ二本鎖核酸構成単位を作製するために、多くの方法が存在する;これらは当技術分野で周知であり、当業者によって容易に実行できる。
【0174】
1つの態様では、二本鎖核酸構成単位は、まず2本の一本鎖核酸を作製し、これらをアニールさせて二本鎖核酸構成単位を形成させる。二本鎖核酸構成単位の2つの鎖は、オーバーハングを形成する部分以外は全てのヌクレオチドが相補的であり、オーバーハング以外はミスマッチが含まれない可能性がある。別の態様では、二本鎖核酸構成単位の2本の鎖は、オーバーハングを形成する部分以外の全てのヌクレオチドよりも少ない部分で相補的である。したがって、この態様では二本鎖核酸構成単位はコドンの縮重を導入するために使用できる。好ましくはコドンの縮重は、1つまたはそれ以上のN,N,G/Tカセットまたは1つまたはそれ以上のN,N,Nカセットを用いて、本明細書に記述される部位飽和変異導入を用いて導入される。
【0175】
本発明のインビボ組み換え法は、特定のポリヌクレオチドまたは配列の、未知のハイブリッドまたは対立遺伝子のプールに盲目的に実行できる。しかし、特定のポリヌクレオチドの実際のDNAまたはRNA配列を知ることは必要ではない。
【0176】
遺伝子の混合集団内で組み換えを使用する手法は、例えば、インターロイキンI、抗体、tPA、および成長ホルモンのような任意の有用なタンパク質の作製に役立ち得る。この手法は、特異性または活性が変化したタンパク質を作製するために使用できる。この手法は、例えば、遺伝子のプロモーター領域、イントロン、エクソン、エンハンサー配列、31非翻訳領域または51非翻訳領域のような、ハイブリッド核酸配列の作製にも有用な可能性がある。したがって、この手法は発現率が上昇した遺伝子を作製するために使用できる。この手法は、DNAの繰り返し配列の研究にも有用である可能性がある。最後に、この手法はリボザイムまたはアプタマーを変異させるために役立つ可能性がある。
【0177】
末端選択
本発明はポリヌクレオチドの開始セットからポリヌクレオチドのサブセットを選択する方法を提供するが、その方法は、作業ポリヌクレオチドのどこかに存在する1つまたは複数の選択可能な特徴(または選択マーカー)を区別する能力に基づき、各選択可能ポリヌクレオチドを(正の選択)および/または選択可能ポリヌクレオチドではないものを(負の選択)の選択ができるものである。好ましい局面では、選択可能ポリヌクレオチドの末端領域に一部または全体が存在する選択マーカーを利用する末端選択と呼ばれる方法が提供され、そのような選択マーカーは「末端選択マーカー」と呼ばれる。
【0178】
末端選択は、同じポリヌクレオチドの中でさえも、自然に発生する配列の検出、実験的に導入された配列(本明細書に記述されるおよび記述されない任意の変異導入手法によるものを含む)の検出、またはその両方に基づくものであり得る。末端選択マーカーは、構造的選択マーカーまたは機能的選択マーカー、または構造と機能の両方の選択マーカーであり得る。末端選択マーカーは、放射能、酵素活性、蛍光、光学的特徴、磁気的性質(例えば、磁気ビーズの使用)、免疫反応性、およびハイブリダイゼーションの検出に基づく方法を用いて選択されるマーカーを含む、ポリヌクレオチド配列、またはポリペプチド配列、または任意の化学構造、または生物学的もしくは生化学的タグを含み得る。
【0179】
末端選択は、変異を導入する任意の方法と組み合せて行なうことができる。そのような変異導入法には、本明細書(上記および下記)に記述される方法が含まれるが、これらに限定されるわけではない。そのような方法の、限定することのない具体例として、本明細書または当技術分野において以下の任意の用語で呼ばれる任意の方法が含まれる:「飽和変異導入」、「シャッフリング」、「組み換え」、「リアセンブリー(reassembly)」、「エラープローンPCR」、「アセンブリーPCR」、「セクシャルPCR」、「クロスオーバーPCR」、「オリゴヌクレオチドプライマー指定変異導入」、「再帰的(および/または指数的)集合(ensemble)変異導入(ArkinおよびYouvan、1992参照)」、「カセット変異導入」、「インビボ変異導入」、および「インビトロ変異導入」。また、末端選択は、任意の変異導入および/または増幅法(例えば、Arnold、1993; CaldwellおよびJoyce、1992; Stemmer、1994参照)によって生成する分子に対して行なうことができるが、そのような方法の後に望ましい子孫分子を選択(存在のスクリーニングを含む)することが望ましい。
【0180】
また、末端選択は、変異導入方法とは別にポリヌクレオチドに施すこともできる。1つの態様では、本明細書で提供される末端選択は、別のポリヌクレオチドへの連結(ベクターへの連結を含む)の段階のような、クローニング段階を促進するために使用できる。したがって、本発明は、ライブラリーの作製、望ましいポリヌクレオチドの選択および/または濃縮、およびクローニング全般を容易にするために役立つ手段として、末端選択を提供する。
【0181】
別の態様では、末端選択はポリヌクレオチドの(正の)選択に基づき得る;または、末端選択はポリヌクレオチドの(負の)選択に基づき得る;または、末端選択はポリヌクレオチドの(正の)選択および(負の)選択の両方に基づき得る。他の選択および/またはスクリーニング方法とともに、類似または非類似の選択および/またはスクリーニング法および役立つ変異導入法との任意の組み合せで、末端選択は反復して実行でき、これらの全ては反復して、任意の順序、組み合せ、および順列で実行できる。また、末端選択は、環状(例えば、プラスミドまたは任意の他の環状ベクターまたは他の任意の部分的に環状のポリヌクレオチド)、および/または分岐、および/または任意の化学基もしくは部分で修飾または置換されたポリヌクレオチドの選択にも使用できることが認識される。
【0182】
1つの限定的でない局面では、直線状ポリヌクレオチドの末端選択は、ポリヌクレオチドの末端(5’または3’末端のいずれでも)またはその付近に存在する少なくとも1つの末端選択マーカーの存在に基づく一般的手法を用いて行われる。1つの特定の限定的でない具体例では、末端選択は、ポリヌクレオチド配列を認識する酵素によって認識される配列のような、末端またはその付近の特定の配列の選択に基づく。ポリヌクレオチドの化学的修飾を認識および触媒する酵素は、本明細書ではポリヌクレオチド作用酵素と呼ばれる。好ましい態様では、役立つポリヌクレオチド作用酵素の非排他的具体例には、ポリヌクレオチド開裂活性を持つ酵素、ポリヌクレオチドメチル化活性を持つ酵素、ポリヌクレオチド連結活性を持つ酵素、複数の区別可能な酵素活性(例えばポリヌクレオチド切断活性およびポリヌクレオチド連結活性が含まれるが、これらに限定されるわけではない)を持つ酵素が含まれる。
【0183】
適切なポリヌクレオチド作用酵素には、当業者によって同定可能な任意の酵素(例えば、市販の酵素)、または現在は使用できないが将来開発される可能性のあるもの、ポリヌクレオチドの連結に適合する末端、好ましくは粘着末端を作製するために役立つものが含まれることが認識される。末端選択を行なうポリヌクレオチドの内部に含まれない、または含まれないと期待される、または含まれる可能性の少ない(例えば、作業ポリヌクレオチドに関する配列情報が不完全な場合)制限部位を使用することが好ましい可能性がある。内部の望ましくない制限部位を除去するために種々の方法(例えば、変異導入法)が使用できると認識される。また、末端領域における認識部位で消化を行なうために部分的消化反応(すなわち部分的な完成にまで進行する消化反応)を用い、ポリヌクレオチドの内部に存在し、同じ酵素で認識される感受性の制限部位を残すこともできる。1つの局面では、一部の酵素は、認識配列の存在する位置および環境に応じて、同じ認識配列の選択的開裂を行なうことが認識されるので、部分的消化は有用である。
【0184】
また保護方法を用いて、その部位が存在するために作業ポリペプチドが切断されるような、望ましくない酵素消化から、特定の制限部位(例えば、内部の部位)を選択的に保護することもできると認識される;そのような保護方法には、望ましくない酵素活性を阻害する、メチル化および塩基の置換(例えば、Tの代わりにU)が含まれる。
【0185】
本発明の別の態様では、役立つ末端選択マーカーは、特定のポリヌクレオチド配列を認識するポリヌクレオチド作用酵素によって認識される末端配列である。本発明の1つの局面では、役立つポリヌクレオチド作用酵素には、古典的なタイプII制限酵素に加えて、他の酵素も含まれる。本発明のこの好ましい局面では、役立つポリヌクレオチド作用酵素には、ジャイレース(例えば、トポイソメラーゼ)、ヘリカーゼ、レコンビナーゼ、リラクセース、およびこれらに関連する任意の酵素も含まれる。
【0186】
子孫分子(例えば、変異導入によって作製された)から親鋳型分子(例えば、変異導入を行なう)を区別および分離するために、末端選択が使用できると認識される。例えば、トポイソメラーゼI認識部位を持たないプライマーの第1のセットを用いて、親分氏の末端領域を修飾できる(例えば、ポリメラーゼベースの増幅)。その後、プライマーの第2の異なるセット(例えば、トポイソメラーゼI認識部位を持つ)を用いて、増幅された鋳型分子から、変異した子孫分子(例えば、中断した合成、鋳型を切り替えるポリメラーゼベースの増幅、または中断した合成;または飽和変異導入を使用;または変異導入した子孫分子にトポイソメラーゼI認識部位を導入するための他の任意の方法のような、任意のポリヌクレオチドキメラ化法を使用)が作製できる。トポイソメラーゼIに基づく末端選択を使用すると、所望の子孫分子の識別のみならず、その選択的なトポイソメラーゼIに基づく連結が容易になる。
【0187】
トポイソメラーゼに基づくニッキングおよび連結を用いた末端選択手法は、以前に利用された選択方法と比較して、いくつかの利点があることが認識される。要するに、この手法によると、方向を定めたクローニング(発現クローニングを含む)が可能になる。
【0188】
ペプチドディスプレイ法
本方法を用いて、ペプチドディスプレイ法によって選択されたポリヌクレオチド配列を、開示された任意の方法および任意の組み合せによるインビトロおよび/またはインビボ組み換えによって、シャッフリングすることができる。ここで、関連するポリヌクレオチドは、表現型(例えば、事前に定められた受容体(リガンド)に対する親和性)のスクリーニングをする、ディスプレイされるペプチドをコードしている。
【0189】
バイオ医薬品の開発と分子生物学で重要度を増しつつある局面は、生体高分子と相互作用するペプチドまたはペプチド様物質のアミノ酸の一次配列を含む、ペプチド構造の同定である。事前に定められた生体高分子(例えば、受容体)に対する結合のような、所望の構造または機能的性質を持つペプチドを同定する1つの方法は、ペプチドのアミノ酸配列によって与えられる所望の構造または機能的性質を持つ個々のライブラリーメンバーを求めて、ペプチドの大きなライブラリーをスクリーニングすることである。
【0190】
ペプチドライブラリーの作製のために、直接の化学合成法に加えて、いくつかの組み換えDNA法も報告されている。1つのタイプでは、バクテリオファージ粒子または細胞の表面に、ペプチド配列、抗体、または他のタンパク質をディスプレイするものである。一般に、これらの方法では、各バクテリオファージまたは細胞は、天然のバクテリオファージまたは細胞タンパク質配列に加えて、単一の種のペプチドをディスプレイする個々のライブラリーメンバーの役割を果たす。各バクテリオファージまたは細胞には、特定のディスプレイされたペプチド配列をコードするヌクレオチド配列情報が含まれている;したがって、ディスプレイされた配列は、単離されたライブラリーメンバーのヌクレオチド配列を決定することで確認できる。
【0191】
周知のペプチドディスプレイ法では、通常はバクテリオファージのコートタンパクとの融合タンパク質として、糸状バクテリオファージの表面上にペプチド配列を提示する。バクテリオファージのライブラリーを、固定化した事前に決められた高分子または小分子(例えば、受容体)とインキュベートして、固定化した高分子に結合したペプチド配列を提示するバクテリオファージ粒子が、事前に決められた高分子に結合するペプチド配列を提示しない粒子から、差別的に分けられるようにする。その後、固定化した高分子に結合したバクテリオファージ粒子(すなわちライブラリーメンバー)を回収および複製して、次のアフィニティ濃縮およびファージ複製のラウンドのために、選択されたバクテリオファージサブ集合を増幅しておく。アフィニティ濃縮およびファージ複製を数ラウンドした後、このように選択されたバクテリオファージライブラリーメンバーを単離し、ディスプレイされたペプチド配列をコードするヌクレオチド配列を決定し、それにより事前に決められた高分子(例えば、受容体)に結合するペプチド配列を同定する。このような方法は、国際公開公報第91/17271号、91/18980号、91/19818号、および93/08278号にさらに記述されている。
【0192】
本発明は、受容体分子、関心対象のエピトープ、望ましいやり方でペプチドまたはRNAを修飾する遺伝子産物に結合する有用な化合物(例えば、一本鎖抗体を含むペプチド)を同定するために、ランダム、疑似ランダム、および定義された配列のフレームワークペプチドライブラリー、ならびにそのようなライブラリーの作製およびスクリーニング法も提供する。ランダム、疑似ランダム、および定義された配列フレームワークのペプチドは、ディスプレイされたペプチドがそれから合成されたポリヌクレオチド鋳型に結合した、ディスプレイされた一本鎖抗体、またはディスプレイされたペプチドを含む、ペプチドライブラリーメンバーのライブラリーから作製される。結合の方法は、選択された本発明の態様に応じて異なり、ファージ粒子の被包または細胞への取り込みを含み得る。
【0193】
本発明の有意な利点は、関心対象のペプチドリガンドまたは抗体を単離するために、期待されるリガンドの構造に関して、何も事前の情報が必要ではないということである。同定されるペプチドは、生物活性を持つ可能性があり、これは少なくとも選択された受容体分子に対する特異的な結合親和性を含み、さらに場合によっては、他の化合物の結合を阻止する能力、代謝経路を刺激または阻害する能力、シグナルまたはメッセンジャーとして作用する能力、細胞活性を刺激または阻害する能力等も含む。
【0194】
本発明は、事前に決められた受容体(例えば、ペプチドホルモン受容体、細胞表面受容体、他のタンパク質と結合してヘテロダイマー等のような細胞内タンパク質複合体を形成する細胞内タンパク質のような哺乳類のタンパク質受容体)またはエピトープ(例えば、固定化されたタンパク質、糖タンパク質、オリゴ糖等)に結合するライブラリーメンバーを探すために、本発明の方法により同定され、新生ペプチド(一本鎖抗体を含む)をディスプレイするポリソームのライブラリーの親和性スクリーニングによって選択された、ポリヌクレオチド配列のプールをシャッフリングする方法も提供する。
【0195】
これらの任意の方法により1回目の選択ラウンド(通常は受容体(例えば、リガンド)への結合の親和性の選択)で選択されたポリヌクレオチド配列は、プールされ、このプールはインビトロおよび/またはインビボ組み換えによってシャッフリングされて、組み換えられた選択済ポリヌクレオチド配列の集合を含むシャッフリング済プールが作製される。組み換えられた選択済ポリヌクレオチド配列は、少なくとも1回の引き続く選択ラウンドにかけられる。以後の選択ラウンドで選択されるポリヌクレオチド配列は、直接使用する、配列決定する、および/またはさらにもう1度またはそれ以上のシャッフリングラウンドと引き続く選択にかけることができる。選択された配列は、中立配列(すなわち、結合には非実質的な機能効果を持つ)をコードするポリヌクレオチド配列と戻し交雑できる。例えば、選択された配列と実質的に同一の自然発生配列または野生型と戻し交雑して、免疫原性の少ない天然様機能的ペプチドを生成する。一般に、戻し交雑の間、引き続く選択は、事前に決められて受容体(リガンド)への結合する性質を保持するために行われる。
【0196】
選択された配列のシャッフリング前またはそれと同時に、配列に変異を導入できる。1つの態様では、選択されたライブラリーメンバーを原核ベクター(例えば、プラスミド、ファージミド、またはバクテリオファージ)にクローニングし、別々のライブラリーメンバーを表す個々のコロニー(またはプラーク)の集合が作製される。その後、個々の選択されたライブラリーメンバーを操作して(例えば、部位指定突然変異導入、カセット変異導入、化学的変異導入、PCR変異導入等)、選択されたライブラリーメンバーの配列に基づく配列多様性の中核(kernal)を表すライブラリーメンバーの集合が作製できる。個々の選択されたライブラリーメンバーまたはプールを操作して、部分的または個々の選択されたライブラリーメンバー配列の全長に渡って、ランダム変異、疑似ランダム変異、規定のカーナル変異(すなわち、変異および不変の残基位置を含む、および/または規定のアミノ酸残基サブセットから選択された残基を含む変異残基位置を含む)、コドンベースの変異等を組み込むようにできる。その後、変異導入した選択されたライブラリーメンバーは、本明細書に開示されるようにインビトロおよび/またはインビボ組み換えシャッフリングによってシャッフリングできる。
【0197】
本発明はまた、本発明の複数の個々のライブラリーメンバーを含むペプチドライブラリーを提供するが、(1) 各複数の個々のライブラリーメンバーは、選択された配列プールのシャッフリングによって作製された配列を含み、(2) 各個々のライブラリーメンバーは可変のペプチド部分配列または一本鎖抗体部分配列を含み、(一部のライブラリーメンバーは、不均一な増幅、確率等のために、1ライブラリー当たり複数のコピーで存在するにもかかわらず、)これは該複数における他の個々のライブラリーメンバーの一本鎖抗体配列または可変ペプチド部分配列とは異なる。
【0198】
本発明はプロダクトバイプロセス(product−by−process)も提供する。ここで、事前に決められた結合特異性を持つ(または、持つペプチドをコードする)選択されたポリヌクレオチド配列は、以下のプロセスによって形成される:(1) 事前に決められた受容体(例えば、リガンド)またはエピトープ(例えば、抗原高分子)に対するディスプレイされた一本鎖抗体またはディスプレイされたペプチドのライブラリーをスクリーニングし、事前に決められた受容体またはエピトープに結合するライブラリーメンバーを同定および/または濃縮して、選択されたライブラリーメンバーのプールを作製する、(2) 事前に決められたエピトープに結合し、そのためにライブラリーから単離および/または濃縮された、選択されたライブラリーメンバー(またはその増幅またはクローニングされたコピー)を組み換えによりシャッフリングして、シャッフリング済ライブラリーを作製する、および (3) 事前に決められた受容体(例えば、リガンド)またはエピトープ(例えば、抗原高分子)に対してシャッフリング済ライブラリーをスクリーニングして、事前に決められた受容体またはエピトープに結合するシャッフリング済ライブラリーメンバーを同定および/または濃縮して、選択されたシャッフリング済ライブラリーメンバーのプールを作製する。
【0199】
抗体ディスプレイおよびスクリーニング法
本発明は、抗体ディスプレイ法によって選択されたポリヌクレオチド配列を、開示された任意の方法およびその任意の組み合せによって、インビトロおよび/またはインビボ組み換えによりシャッフリングするために使用できる。ここで、関連するポリヌクレオチドは、表現型(例えば、事前に決められた抗原(リガンド)に結合する親和性)のスクリーニングをするディスプレイされた抗体をコードしている。
【0200】
免疫グロブリン鎖中に存在し得る、非常に多くの異なる可変領域によって表される広範囲の免疫レパートリーを獲得するために、種々の分子遺伝学的手法が考案されてきた。自然に存在する生殖細胞系免疫グロブリンH鎖の遺伝子座は、縦に並ぶ多様性部分遺伝子の上流に位置する、縦に並ぶ可変部分の遺伝子からなり、前者は連結(i)領域遺伝子の上流に位置しており、これはC領域遺伝子の上流に位置している。Bリンパ球の発生において、V−D−Jの再配列が起こり、ここでH鎖可変領域遺伝子(VH)は、融合したD部分を形成し、その後に可変部分との再配列が生じ、V−D−J連結産物遺伝子を形成する再配列によって形成されるが、これは作製的に再配列された場合には、H鎖の機能的な可変領域(VH)をコードしている。同様に、L鎖の遺伝子座では、いくつかの可変部分のうちの1つと、いくつかのJ部分のうちの1つが再配列して、L鎖の可変領域(VL)をコードする遺伝子が形成される。
【0201】
免疫グロブリンで可能な可変領域の広範囲のレパートリーは、部分的には、B細胞の発生時におけるVおよびi部分(およびH鎖の遺伝子座の場合はD部分)の数多くの組み合せの可能性に起因する。H鎖の可変領域の更なる配列多様性は、V−D−J連結におけるD部分の不均一な再配列と、N領域の付加から産生される。さらに、特定のB細胞の抗原選択は、H鎖およびL鎖の可変領域の1つまたは両方における非生殖細胞系突然変異を持つ高親和性の変異体を選択する;これは「親和性成熟」または「親和性尖鋭化」と呼ばれる現象である。通常は、これらの「親和性尖鋭化」変異は、可変領域の特定の部分、多くの場合相補性決定領域(CDR)に集まっている。
【0202】
抗原刺激されたB細胞の発生(すなわち、免疫化)を通して高親和性の免疫グロブリンを作製および同定する際の多くの制限を克服するために、特定の抗原に対する高親和性抗体のスクリーニングができるコンビナトリアル抗体ライブラリーを作製するために操作できる、種々の原核発現システムが開発されてきた。大腸菌(E.coli)およびバクテリオファージ系における抗体の発現の最近の進歩(「別のペプチドディスプレイ法」、下記参照)によって、解析されたハイブリドーマから抗体遺伝子をクローニングするか、抗体遺伝子ライブラリー(例えば、Ig cDNAから)を用いた新規の選択によって、ほぼどんな特異性でも得られる可能性が生じてきた。
【0203】
バクテリオファージプラークとして、または溶原菌のコロニーとしてスクリーニングできる抗体のコンビナトリアルライブラリーは、バクテリオファージλ発現システムにおいて作製されてきた(Huseら、1989;CatonおよびKoprowski、1990; Mullinaxら、1990; Perssonら、1991)。バクテリオファージ抗体ディスプレイライブラリーおよびλファージ発現ライブラリーの様々な態様は、記述されてきた(Kangら、1991;Clacksonら、1991; McCaffertyら、1990; Burtonら、1991; Hoogenboomら、1991;Changら、1991; Breitlingら、1991; Marksら、1991、p581; Barbasら、1992;HawkinsおよびWinter、1992; Marksら、1992、p779; Marksら、1992、p16007; およびLowmanら、1991; Lernerら、1992; 全てが参照として本明細書に組み入れられている)。通常は、バクテリオファージ抗体ディスプレイライブラリーは、固定され(例えば、アフィニティクロマトグラフィーによって反応性ファージを濃縮するためのクロマトグラフィー樹脂に共有結合)、および/または標識された(例えば、プラークのスクリーニングまたはコロニーのリフトのため)受容体(例えば、ポリペプチド、炭化水素、糖タンパク質、核酸)によってスクリーニングする。
【0204】
1つの特に有利な手法は、いわゆる一本鎖可変領域抗体(scfv)ライブラリーを用いることである(Marksら、1992、p779; WinterおよびMilstein、1991; Clacksonら、1991; Marksら、1991、p581; Chaudharyら、1990; Chiswellら、1992; McCaffertyら、1990; およびHustonら、1988)。バクテリオファージコートタンパク上にディスプレイされたscfvライブラリーの種々の態様は、記述されている。
【0205】
1988年からは、抗体工学の方法によりFv断片の一本鎖アナログおよびその融合タンパク質は信頼性高く作製されてきている。一般に、その第1段階は所望の結合特性を持つVHおよびVLドメインをコードする遺伝子を入手することである;これらのV遺伝子は、特定のハイブリドーマ細胞株から単離したり、コンビナトリアルV遺伝子ライブラリーから選択したり、V遺伝子合成によって作製したりできる。一本鎖Fvは、V遺伝子成分を、(Gly−Gly−Gly−Gly−Ser)または同等なリンカーペプチドのように、適切に設計されたリンカーペプチドをコードするオリゴヌクレオチドと結合させて形成できる。リンカーは第1のV領域のC末端と、第2の領域のN末端を、VH−リンカー−VLまたはVL−リンカー−VHの順につなぐ。原則的に、scfv結合部位は、その親抗体結合部位の親和性と特異性の両方を忠実に再現できる。
【0206】
したがって、scfv断片は、VHとVLドメインが、柔軟なリンカーペプチドによって連結されて1本のポリペプチド鎖になったものである。scfv遺伝子を組み立てた後、ファージミドにクローニングし、バクテリオファージPIII(遺伝子3)コートタンパクとの融合タンパク質として、M13ファージ(または類似の糸状バクテリオファージ)の先端に発現させる。関心対象の抗体を発現するファージの濃縮は、事前に決められたエピトープ(例えば、標的抗原、受容体)への結合を探して集合scfvをディスプレイする組み換えファージをパンニングして行われる。
【0207】
ライブラリーメンバーの結合ポリヌクレオチドは、スクリーニングまたは選択の後にライブラリーメンバーを複製する基礎を提供し、またヌクレオチド配列決定によって、ディスプレイされたペプチド配列、またはVHおよびVLアミノ酸配列を同定する基礎を提供する。ディスプレイされたペプチドまたは一本鎖抗体(例えば、scfv)および/またはそのVHおよびVLドメインまたはそのCDRは、適当な発現系にクローニングして発現できる。しばしば単離されたVHおよびVLドメインをコードするポリヌクレオチドは、C領域(CHおよびCL)をコードするポリヌクレオチドと連結されて、完全な抗体(例えば、キメラまたは完全にヒト)、抗体断片等をコードするポリヌクレオチドが作製される。しばしば単離されたCDRをコードするポリヌクレオチドは、適切な可変領域フレームワーク(および選択的にC領域)をコードするポリヌクレオチドに移植され、完全な抗体(例えば、ヒト化または完全にヒト)、抗体断片等をコードするポリヌクレオチドが作製される。抗体は、免疫親和性クロマトグラフィーによって調製用の量の抗原を単離するために使用できる。そのような抗体の他の種々の用途には、疾病の診断および/または病期の判断(例えば、新形成)、および例えば新形成、自己免疫疾患、AIDS、心臓血管疾患、感染等のような疾病の治療がある。
【0208】
結合種(イディオタイプスペクトラム)のレパートリーを広げるために、scfvライブラリーのコンビナトリアルな多様性を増加させるために、種々の方法が報告されている。PCRを使用することで、特定のハイブリドーマ源から、または非免疫細胞からの遺伝子ライブラリーとして可変領域が速やかにクローニングできるようになり、組み合せることのできるVHおよびVLカセットの種類にコンビナトリアルな多様性が生じた。さらに、VHおよびVLカセットは、ランダム、疑似ランダム、または指定変異導入などによって、それ自身を多様化できる。通常は、VHおよびVLカセットは、相補性決定領域(CDRS)、しばしば3番目のCDRであるCDR3においてまたはその付近で多様化される。酵素による逆PCR変異導入は、scfv部位指定ハイブリッドの比較的大きなライブラリーを作製するために簡単で信頼できる方法であることが示されており(Stemmerら、1993)、エラープローンPCRおよび化学的変異導入(Dengら、1994)も同様である。Riechmann(Riechmannら、1993)は、縮重オリゴヌクレオチドPCRおよびそれに引き続くscfvハイブリッドのファージディスプレイによる部位指定ランダム化を用いて、抗体scfv断片の準合理的設計を示した。Barbas(Barbasら、1992)は、偏りのある可変領域配列を用いるために生じるレパートリーサイズの制限の問題を、ヒト破傷風毒素結合Fabの合成CDR領域の配列をランダム化することによって回避しようとした。
【0209】
CDRランダム化は、H鎖のCDR3のみでも約1×1020のCDR、ならびにH鎖CDR1およびCDR2、およびL鎖CDR1−3でも、ほぼ同じ数の変異体を作製する可能性を持つ。別々または合わせて、H鎖および/またはL鎖のCDRランダム化の組み合せの可能性には、全ての可能性の組み合せを表すクローンライブラリーを作製するために、法外な数のバクテリオファージクローンを作製する必要があるが、その内の大部分は結合しないものである。そのような多数の一次形質転換体を作製することは、現在の形質転換技術およびバクテリオファージディスプレイシステムでは実現性に乏しい。例えば、Barbas(Barbasら、1992)は5×107の形質転換体を作製したのみであり、これは完全にランダム化したCDRSのライブラリーの潜在的多様性のごく一部を表すのみである。
【0210】
このような実質的な制約にもかかわらず、scfvのバクテリオファージディスプレイは、すでに様々な有用な抗体および抗体融合タンパク質を生み出している。二重特異性一本鎖抗体は、効率の良い腫瘍細胞溶解を仲介することが示されている(Gruberら、1994)。抗Rev scfvの細胞内発現は、インビトロでHIV−1ウイルス複製を阻害することが示されており(Duanら、1994)、抗p21rar、scfvの細胞内発現は、アフリカツメガエルの卵母細胞の成熟分裂を阻害することが示されている(Bioccaら、1993)。HIV感染を診断できる組み換えscfvも報告されており、scfvが診断に利用できることが示された(Lilleyら、1994)。scFvが毒素または線維素溶解活性化タンパク質のような第2のポリペプチドに連結される融合タンパク質も報告されている(Holvostら、1992; Nichollsら、1993)。
【0211】
抗体の多様性がより高く、潜在的な組み合せのごく一部しかカバーできないという通常のCDR変異導入およびランダム化法の多くの限界を克服するscfvライブラリーの作成が可能ならば、治療と診断に使用できるscfv抗体の数と質は大きく改善されるだろう。これに対処するために、本発明のインビトロおよびインビボシャッフリング法を用いて、選択されたディスプレイされた抗体から得られた核酸から得られたCDR(通常はPCR増幅またはクローニングによる)の組み換えが行われる。そのようなディスプレイされた抗体は、細胞、バクテリオファージ粒子、ポリソーム、または抗体がそのコードする核酸に関連付けされる任意の抗体ディスプレイシステム上でディスプレイされることができる。1つのバリエーションでは、CDRは最初は、抗体産生細胞(それに由来するハイブリドーマを含む)(例えば、国際公開公報第92/03918号、国際公開公報第93/12227号、国際公開公報第94/22585号のような免疫された野生型マウス、ヒト、またはヒト抗体を作製する能力のあるトランスジェニックマウス由来の形質細胞/脾細胞)のmRNA(またはcDNA)から得られる。
【0212】
組み換え選択済ポリヌクレオチド配列群を含むシャッフリングされたプールを作製するために、これらの任意の方法によって1回目の選択で選択されたポリヌクレオチド(通常は、抗原(例えば、リガンド)に結合する、ディスプレイされる抗体の親和性選択による)はプールされ、このプールはインビトロおよび/またはインビボ組み換えによってシャッフリング、特に、CDR(通常はH鎖CDRを他のH鎖CDRと、L鎖CDRを他のL鎖CDRとシャッフリング)のシャッフリングがなされる。組み換えられた選択済ポリヌクレオチド配列は、ディスプレイされた抗原として選択フォーマットで発現され、その後、少なくとも1回の選択が行われる。その後の選択ラウンドで選択されたポリヌクレオチド配列は、直接に使用したり、配列決定したり、および/または所望の結合親和性を持つ抗体が得られるまでさらに1回またはそれ以上のシャッフリングと選択を行なえる。選択された配列は、例えば、ヒト可変領域フレームワークと戻し交雑してヒト様配列抗体を作製するなど、中立の抗体フレームワーク配列(すなわち、抗原結合に機能的影響を実質的に持たない)をコードするポリヌクレオチド配列と戻し交雑してもよい。一般に、事前に決められた抗原に結合する性質を保持するために、戻し交雑後に選択を行なう。
【0213】
代わりに、または記述されたバリエーションとの組み合せで、選択されたscfvライブラリーメンバーの平均結合親和性をコントロールするために、標的エピトープの結合価を変化させることもできる。標的エピトープは、例えば競合エピトープを含めたり、希釈したり、当業者に周知の他の方法によって、様々な密度で表面または基質に結合させることができる。高い密度(結合価)の事前に決められたエピトープは、比較的低い親和性を持つscfvライブラリーメンバーの濃縮に使用できるが、低い密度(結合価)は、高い親和性のscfvライブラリーメンバーを選択的に濃縮できる。
【0214】
多様な可変部分を作製するために、ペプチド配列のランダム、疑似ランダム、または規定された配列カーナルセットをコードする合成オリゴヌクレオチドの集合が、連結によって、事前に決められた部位(例えば、CDR)に挿入できる。同様に、一本鎖抗体カセットの1つまたはそれ以上のCDRの配列多様性は、部位指定変異導入、CDR置換等によってCDRを変異させることによって、拡張できる。得られたDNA分子は、シャッフリングの前にクローニングと増幅のために宿主中で増殖させるか、直接使用して(すなわち、宿主細胞で増殖させた際の多様性の損失を避けるため)、選択されたライブラリーメンバーをその後シャッフリングできる。
【0215】
関心対象の可変部分ペプチド配列または関心対象の一本鎖抗体をコードする、ディスプレイされたペプチド/ポリヌクレオチド複合体(ライブラリーメンバー)は、親和性濃縮テクニックによってライブラリーから選択される。これは、受容体、他の高分子、または他のエピトープ種のような、関心対象のペプチド配列に特異的な固定化した高分子またはエピトープを用いて行なう。親和性選択手順を繰り返すと、所望の配列をコードするライブラリーメンバーが濃縮でき、その後これはプールとシャッフリング用、配列決定用、および/または更なる増殖と親和性濃縮用に、単離できる。
【0216】
所望の特異性を持たないライブラリーメンバーは、洗浄して除去する。必要な洗浄の度合いと厳密度は、関心対象の各ペプチド配列または一本鎖抗体、および固定化された事前に決められた高分子またはエピトープごとに決定される。結合インキュベーションおよびその後の洗浄の条件を調整することによって、回収される新生ペプチド/DNA複合体の結合特性に関して、ある程度のコントロールが可能である。温度、pH、イオン強度、二価陽イオン濃度、および洗浄の体積と時間によって、固定された高分子に対する特定の範囲の親和性を持つ新生ペプチド/DNA複合体が選択される。通常は高い親和性を予期させるゆっくりした解離速度に基づく選択は、しばしば最も実際的なルートである。これは、遊離の事前に決められた高分子の飽和量の存在下で連続的にインキュベートするか、洗浄の体積、数、および時間を増加させるかによって、行なえる。いずれの場合も、解離した新生ペプチド/DNAまたはペプチド/RNA複合体の再結合が予防され、時間を増やしていくと、より高い親和性を持つ新生ペプチド/DNAまたはペプチド/RNA複合体が回収される。
【0217】
結合および洗浄手順をさらに変更すると、特別な特性を持つペプチドが得られる場合がある。一部のペプチドの親和性は、イオン強度または陽イオン濃度に依存する。これは、ペプチドからタンパク質を除去するために穏やかな条件が必要な場合に、種々のタンパク質の親和性による精製に使用できる、ペプチドの有用な特徴である。
【0218】
1つのバリエーションでは、複数の結合標的(複数のエピトープ種、複数の受容体種)を用いて、scfvライブラリーを、異なる結合特性を持つ複数のscfvについて同時にスクリーニングする。scfvライブラリーのサイズがしばしば潜在的なscfv配列の多様性の限界となることを考えると、普通はできる限り大きなサイズのscfvライブラリーを使用することが望ましい。いくつもの非常に大きなポリソームscFvディスプレイライブラリーを作製するための時間と費用は、膨大なものになり得る。この大きな問題を避けるため、単一のライブラリーで、複数の事前に決められたエピトープ種(受容体種)を同時にスクリーニングしたり、いくつかのエピトープ種に関して順次スクリーニングしたりできる。1つのバリエーションでは、各々別のビーズ(またはビーズのサブセット)上にコードされた複数の標的エピトープ種を、適当な結合条件下でポリソームディスプレイscfvライブラリーと混合し、インキュベートできる。そして、複数のエピトープ種を含むビーズの集合を用いて、scfvライブラリーメンバーを親和性選択によって単離できる。一般に、引き続く親和性スクリーニングのラウンドには、同じビーズ混合物、そのサブセット、または1つまたは2つの個々のエピトープ種のみを含むビーズが使用できる。この方法によると効率良いスクリーニングが可能になり、これは実験室の自動化、バッチプロセッシング、およびハイスループットスクリーニングに適合する。
【0219】
本発明では種々のテクニックを使って、ペプチドライブラリーもしくは一本鎖抗体ライブラリーを多様化したり、またはシャッフリングの前または同時に、初期のパンニングのラウンドで事前に決められた高分子またはエピトープに対して十分な結合活性を持つことが分かった可変部分セグメントのペプチドを多様化することができる。1つの手法では、陽性の選択されたペプチド/ポリヌクレオチド複合体(親和性濃縮の初期のラウンドで同定されたもの)の配列決定をして、活性ペプチドの同定をする。その後これらの活性ペプチド配列に基づいてオリゴヌクレオチドを合成するが、各段階で低レベルの全ての塩基を組み込んで、オリゴヌクレオチドの一次配列にわずかな変化をつける。そして、この(わずかに)縮重したオリゴヌクレオチドの混合物を、可変部分配列に適切な位置でクローニングする。この方法では、開始ペプチド配列に体系的にコントロールした変化をつけられ、これはその後にシャッフリングできる。しかし、変異導入の前に、個々の陽性新生ペプチド/ポリヌクレオチド複合体の配列決定が必要であり、そのために少数の回収された複合体の多様性を拡張したり、より高い結合親和性および/またはより高い結合特異性を持つ変異体の選択に有用である。1つのバリエーションである、選択された陽性ペプチド/ポリヌクレオチド複合体(特に可変領域配列)の変異導入PCRの増幅では、インビトロおよび/またはインビボでシャッフリングされ、配列決定の前に1つまたはそれ以上の更なるスクリーニングラウンドが行われる。同じ一般的な手法は、多様性を拡張し、結合親和性/特異性を増強するために、一本鎖抗体でも使用でき、通常はシャッフリングの前または同時にCDRまたは隣接フレームワーク領域が多様化される。望むならば、シャッフリング反応では、選択されたライブラリーメンバーとインビトロで組み換え可能な変異導入オリゴヌクレオチドをスパイクすることができる。したがって、合成オリゴヌクレオチドおよびPCRで作製されたポリヌクレオチド(エラープローンまたは高忠実度の方法で合成)の混合物をインビトロのシャッフリング混合物に添加し、得られるシャッフリング済ライブラリーメンバー(シャフラント)に組み入れることができる。
【0220】
シャッフリングの発明は、CDR異型一本鎖抗体の巨大なライブラリーの作製を可能にする。そのような抗体を作製する1つの方法は、合成CDRを一本鎖抗体に挿入する、および/またはシャッフリング前または同時のCDRランダム化である。合成CDRカセットの配列は、ヒトCDRの既知の配列を参照にして選択され、以下のガイドラインにしたがって実施者の裁量で選択される:合成CDRは既知のCDR配列と少なくとも40%の位置上の配列同一性を持ち、好ましくは既知のCDR配列と少なくとも50から70%の位置上の配列同一性を持つ。例えば、合成CDR配列の集合は、Kabat(Kabatら、1991)にリストされている自然に存在するヒトCDR配列に基づいて、オリゴヌクレオチド配列の集合を合成することによって作製できる;合成CDR配列のプールは、少なくとも1つの既知の自然に存在するヒトCDR配列と、少なくとも40%の配列同一性を持つCDRペプチド配列をコードすると計算される。または、自然に存在するCDRの集合を比較して、コンセンサス配列を作製し、1つの残基位置で頻繁に(すなわち、既知のCDRの少なくとも5%)使用されるアミノ酸が対応する位置で合成CDRに組み込まれるようにする。通常は、いくつかの(例えば、3から約50)の既知のCDR配列が比較され、既知のCDRの間に観察される自然配列の変異を表にして、観察される自然の配列変異の順列の全てまたは大部分を包含するCDRペプチド配列をコードするオリゴヌクレオチドの集合が合成される。例えば、ヒトVH CDR配列の集合のカルボキシ末端のアミノ酸がTyr、Val、PheまたはAspのいずれかであれば、カルボキシ末端CDR残基がこれらのアミノ酸のいずれかであるように、合成CDRオリゴヌクレオチド配列が設計される。いくつかの態様では、CDR配列の集合において、1つの残基位置に自然に存在する残基以外の残基が組み込まれる:保存的なアミノ酸置換はしばしば組み込まれ、既知の自然に存在するCDR配列と比較して、最高5つの残基位置まで、非保存的アミノ酸置換を組み込むために変化できる。そのようなCDR配列は、一次ライブラリーメンバー(第1回のスクリーニング前)で使用したり、および/または選択されたライブラリーメンバー配列のインビトロシャッフリング反応にスパイクするために使用できる。そのような規定されたおよび/または縮重の配列のプールの作製は、当業者によって容易に実施される。
【0221】
合成CDR配列の集合には、自然に存在するCDR配列ではないことが知られているメンバーが少なくとも1つ含まれる。H鎖CDR中でN領域付加に対応するランダムまたは疑似ランダム配列を含めるか否かは、実施者の裁量である。N領域配列は、1ヌクレオチドから約4ヌクレオチドで、V−DおよびD−J接合部で発生する。合成H鎖CDR配列は、少なくとも約100のユニークなCDR配列、通常は少なくとも約1,000のユニークなCDR配列、好ましくは少なくとも約10,000のユニークなCDR配列、しばしば50,000以上のユニークなCDR配列を含む;しかし、通常1×10 6以下のユニークなCDR配列がこの集合には含まれるが、特に、自然に存在するヒトCDRでは保存的アミノ酸置換体が存在しないまたはまれな(すなわち0.1%未満)位置で、保存的アミノ酸置換が許可される場合には、時には1×107から1×108のユニークなCDR配列が存在する。一般に、ライブラリーに含まれるユニークなCDR配列の数は、ライブラリー中の期待される一次形質転換体の数の10倍を超えないほうが良い。そのような一本鎖抗体は、一般に少なくとも1×10 m−、好ましくは少なくとも5×107 M−1の親和性、より好ましくは少なくとも1×108 M−1から1×109 M−1またはそれ以上、時折最高1×1010 M−1またはそれ以上の親和性で結合する。しばしば、事前に決められた抗原はヒトタンパク質であり、例えばヒト細胞表面抗原(例えば、CD4、CD8、IL−2受容体、EGF受容体、PDGF受容体)、他のヒト生体高分子(例えば、トロンボモジュリン、プロテインC、炭化水素抗原、シアリルルイス抗原、Lセレクチン)、または非ヒト疾病関連高分子(例えば、細菌LPS、ビリオンキャプシドタンパク質、またはエンベロープ糖タンパク質)などがある。
【0222】
所望の特異性を持つ高親和性一本鎖抗体は種々の系で操作および発現できる。例えば、scfvは植物で作製され(Firekら、1993)、原核システムでも容易に作製できる(OwensおよびYoung、1994;JohnsonおよびBird、1991)。また、一本鎖抗体は、抗体全体またはその断片を作製する基礎として使用できる(Kettleboroughら、1994)。可変領域をコードする配列を単離して(例えば、PCR増幅またはサブクローニングによる)、所望のヒトC領域をコードする配列にスプライスし、好ましくは免疫原性が低下し、ヒトの治療により適したヒトの配列の抗体をコードするようにできる。得られた完全にヒトの配列をコードするポリヌクレオチドは、宿主細胞(例えば、哺乳類細胞中で発現ベクターから)で発現し、薬学的組成物を精製することができる。
【0223】
本発明の抗体、個々の変異免疫グロブリン鎖、変異抗体断片、および他の免疫グロブリンポリペプチドが発現されたら、硫酸アンモニウム沈殿、分画カラムクロマトグラフィー、ゲル電気泳動などの当技術分野の標準的な方法にしたがって、精製できる(一般にScopes、1982参照)。望むように部分的または均一にまで精製されたら、ポリペプチドを治療に使用したり、アッセイ手順、免疫蛍光染色等の開発および実行に使用したりできる(一般にLefkovitsおよびPernis、1979および1981;Lefkovits、1997参照)。
【0224】
本発明の方法で作製された抗体は、診断および治療に使用できる。限定ではなく実例として、これらは癌、自己免疫疾患、またはウイルス感染の治療に使用できる。癌の治療には、抗体は通常、erbB−2、CEA、CD33および当業者に周知の他の多くの抗原および結合メンバーのような、癌細胞に選択的に発現される抗原に結合する。
【0225】
シャッフリングを用いて、事前に決められたポリペプチド配列に結合するライブラリーメンバーを同定するために、ツーハイブリッドスクリーニングシステムによるスクリーニングで得られた選択されたライブラリーメンバーのプールを多様化できる。選択されたライブラリーメンバーは、プールされ、インビトロおよび/またはインビボ組み換えによってシャッフリングされる。そして、シャッフリングされたプールを酵母のツーハイブリッドシステムでスクリーニングして、該事前に決められたポリペプチド配列(例えば、SH2ドメイン)に結合するか、別の事前に決められたポリペプチド配列(例えば、別のタンパク質種のSH2ドメイン)に結合するライブラリーメンバーを選択する。
【0226】
事前に決められたポリペプチド配列に結合するポリペプチド配列の同定するための1つの方法は、いわゆる「ツーハイブリッド」システムを使用するもので、そこでは、事前に決められたポリペプチド配列が融合タンパク質として存在する(Chienら、1991)。この手法では、転写活性化因子(FieldsおよびSong、1989)、酵母Gal4転写タンパク質の再生を通して、インビボでタンパク質−タンパク質相互作用を同定する。通常は、この方法は酵母Gal4タンパク質の性質に基づいており、このタンパク質はDNA結合ドメインと転写活性化ドメインという分離可能なドメインからなる。1つは既知のタンパク質のポリペプチド配列に融合した酵母のGal4 DNA結合ドメインからなり、もう1つは第2のタンパク質のポリペプチド配列に融合したGal4活性化ドメインからなる2つのハイブリッドタンパク質をコードするポリヌクレオチドが作製され、酵母宿主細胞に導入される。2つの融合タンパク質の間の分子間結合が産生されると、Gal4 DNA結合ドメインがGal4活性化ドメインと再構成され、Gal4結合部位に機能的に連結されているレポーター遺伝子(例えば、lacz、HIS3)の転写が活性化する。通常は、ツーハイブリッド法は既知のタンパク質と相互作用する新規のポリペプチドを同定するために使用される(SilverおよびHunt、1993; Durfeeら、1993; Yangら、1992; Lubanら、1993; Hardyら、1992 ; Bartelら、1993; およびVojtekら、1993)。しかし、第2の既知のタンパク質への結合に影響を与える既知タンパク質中の変異を同定するために、ツーハイブリッド法のバリエーションが使用されてきた(LiおよびFields、1993; Laloら、1993; Jacksonら、1993; およびMaduraら、1993)。ツーハイブリッドシステムは、2つの既知のタンパク質の相互作用する構造のドメインや(Bardwellら、1993; Chakrabartyら、1992; Staudingerら、1993; およびMilneおよびWeaver 1993)、または単一のタンパク質のオリゴマー化をになうドメインの同定(Iwabuchiら、1993; Bogerdら、1993)にも使用されている。ツーハイブリッドシステムのバリエーションは、タンパク質分解酵素のインビボ活性の研究に使用された(Dasmahapatraら、1992)。または、大腸菌(E.coli)/BCCP相互作用スクリーニングシステム(Germinoら、1993; Guarente、1993)を用いて、相互作用するタンパク質配列(すなわち、ヘテロダイマーまたは、より高次のヘテロ多量体を形成するタンパク質配列)を同定することができる。ツーハイブリッドシステムによって選択された配列は、事前に決められた結合配列を含むハイブリッドに結合するポリペプチド配列を同定するためのスクリーニングを、さらに1回またはそれ以上行なうために、プールし、シャッフリングし、ツーハイブリッドシステムに導入することができる。このようにして同定された配列は、コンセンサス配列およびコンセンサス配列カーナルを同定するために比較される。
【0227】
鋳型DNAの1μgの試料を入手して、UV光で処理して、TT二量体を含む二量体、特にプリン二量体の形成を誘導する。UV照射は鋳型DNA試料上で1つの遺伝子当たり数コの光化学反応生成物のみが生成するように、制限される。複数の試料に異なる時間UV照射を行い、UV照射によって、種々の数の二量体を持つ鋳型DNAが得られるようにする。
【0228】
プルーフリーディング活性を持たないポリメラーゼを利用するランダムプライミングキット(例えば、Stratagene Cloning SystemsによるPrime−It II Random PrimerLabelingキット)を用いて、UV光によって調製された鋳型(上述)上のランダムな部位でプライミングし、鋳型に沿って伸長することによって、種々のサイズのポリヌクレオチドが生成する。Prime−It II Random Primer Labelingキットに記述されているようなプライミングプロトコールは、プライマーの伸長に利用できる。UV照射によって形成された二量体は、プルーフリーディング活性を持たないポリメラーゼによる伸長の妨害物の役割を果たす。こうして、ランダムプライマーによる伸長が終了した後で、ランダムなサイズのポリヌクレオチドのプールが存在することになる。
【0229】
本発明は、通常は増幅および/またはクローニングされたポリヌクレオチドの形で、選択された変異ポリヌクレオチド配列(または選択されたポリヌクレオチド配列の集合)を作製する方法にも使用できる。ここで、選択されたポリヌクレオチド配列は、選択可能な、少なくとも1つの所望の表現型の特徴(例えば、ポリペプチドをコードする、連結されたポリヌクレオチドの転写を促進する、タンパク質に結合する等)を持っている。事前に決められた生体高分子に結合する(例えば、受容体)といった所望の構造または機能の特性を持つハイブリッドポリペプチドを同定する1つの方法は、ポリペプチドのアミノ酸配列によって与えられる所望の構造または機能の特性を持つ個々のライブラリーメンバーを探すために、大きなポリペプチドライブラリーをスクリーニングすることである。
【0230】
1つの態様では、本発明は、親和性相互作用スクリーニングまたは表現型スクリーニングに適した、ディスプレイされたポリペプチドまたは抗体のライブラリーを作製する方法を提供する。本方法では、(1) ディスプレイされたポリペプチドまたは抗体、および該ディスプレイされたポリペプチドまたは抗体をコードする関連するポリヌクレオチドを含む複数の選択されたライブラリーメンバーを手に入れ、該関連ポリヌクレオチドが実質的に同一の配列を含むような、該関連ポリヌクレオチドまたはそのコピーを手に入れ、該ポリヌクレオチドまたはコピーに最適に変異を導入し、(2) ポリヌクレオチドまたはコピーをプールし、(3) ランダムまたは特殊化したプライミングおよび合成プロセスまたは増幅プロセスによる中断によって、より小さいまたは短いポリヌクレオチドを作製し、および (4) 増幅、好ましくはPCR増幅を行ない、選択的に変異導入を行なって、新しく合成されたポリヌクレオチドを相同組み換えする。
【0231】
以下を含む一連の段階によって、有用なハイブリッドポリペプチドを発現するハイブリッドポリヌクレオチドを作製するプロセスを提供することは、本発明の目的である:
(a) 増幅または合成プロセスを阻止または中断する手段を用いて、ポリヌクレオチドの増幅または合成プロセスを中断することによってポリヌクレオチドを作製し、種々の完成段階にあるポリヌクレオチドの複製のために、複数のより小さなまたは短いポリヌクレオチドを提供する;
(b) 得られた一本鎖または二本鎖ポリヌクレオチド集合に、1つまたは複数の一本鎖または二本鎖オリゴヌクレオチドを添加する。ここで、該添加されたオリゴヌクレオチドは、集合の1つまたは複数の一本鎖または二本鎖ポリヌクレオチドに対する非相同性領域中に同一の領域を含む;
(c) 得られた一本鎖または二本鎖オリゴヌクレオチドを変性させて、一本鎖ポリヌクレオチドの混合物を作製し、選択的により短いまたは小さいポリヌクレオチドを種々の長さを持つポリヌクレオチドのプールに分離し、さらに選択的に、該ポリヌクレオチドをPCR手順を施して、少なくとも1つの該ポリヌクレオチドプールに含まれる1つまたはそれ以上のオリゴヌクレオチドを増幅する;
(d) 複数の該ポリヌクレオチドまたは少なくとも1つの該ポリヌクレオチドのプールを、一本鎖ポリヌクレオチドの間で同一の領域において該一本鎖ポリヌクレオチドがアニーリングするような条件下で、ポリメラーゼとインキュベートして、それによって変異導入された二本鎖ポリヌクレオチド鎖を形成させる;
(e) 選択的に段階(c)および(d)を繰り返す;
(f) 該ポリヌクレオチド鎖から、少なくとも1つのハイブリッドポリペプチドを発現させる;
(g) 該少なくとも1つのハイブリッドポリペプチドから有用な活性をスクリーニングする。
【0232】
本発明の1つの好ましい局面では、増幅または合成プロセスの阻止または中断方法は、UV光、DNA付加物、DNA結合タンパク質の利用である。
【0233】
本発明の1つの態様では、DNA付加物、またはDNA付加物を含むポリヌクレオチドは、DNA断片を含む溶液の加熱を含むプロセスなどによって、さらに処理する前にポリヌクレオチドまたはポリヌクレオチドプールから除去される。
【0234】
1つの局面では、核酸はスクリーニングまたは配列決定の前に標準化できる。
【0235】
DNA単離
環境試料から標準化されたDNAライブラリーを作製する時の重要なステップは、試料からの核酸の調製である。DNAは、当技術分野で周知の様々なテクニックを用いて試料から調製できる(「環境中の核酸、方法および応用(Nucleic Acids in the Environment Methods & Applications)」、J.T.Trevors、D.D.van Elsas、Springer Laboratory、1995)。好ましくは、得られたDNAのサイズは大きく、酵素阻害剤および他の汚染物質を含まない。DNAは環境試料から直接単離することもできるが(直接の溶解)、DNA回収の前に細胞を収集することもできる(細胞の分離)。細胞の分離に基づくプロトロールに比較して、直接溶解手順には、いくつかの利点がある。直接溶解テクニックでは、細胞分離テクニックで回収されるDNAと比較して、一般に微生物のコミュニティをより広く代表するDNAがより多く得られるが、サイズはより小さいことがあり、酵素阻害剤を含む可能性がより高い。高分子量および高純度のDNAを提供する、非常に有用な直接溶解テクニックが最近記述された(Barns、1994; Holben、1994)。阻害剤存在する場合には、採用できる細胞単離を利用するプロトコールがいくつかある(Holben、1994)。また、以下に記述するビスベンジミド分離(塩化セシウム単離)のような分画テクニックを用いてDNAの純度を改善することもできる。
【0236】
標準化の前にDNA試料を分画すると、サンプリングした生物体プールに少数しか存在しない種のDNAをクローニングする確率が高くなる。本発明では、好ましくはDNAは密度遠心テクニックを用いて分画される。そのようなテクニックの一例は、塩化セシウム勾配である。好ましくは、このテクニックはDNAの領域に結合して核酸の浮遊密度を変化させる、核酸インターカレート剤の存在下で行なう。より好ましくは、核酸インターカレート剤は、DNAの領域(ビスベンジミドの場合にはAT)(Muller、1975; Manuelidis、1977)に選択的に結合するビスベンジミドのような色素である。ビスベンジミドのようなインターカレート剤と複合体を作った核酸は、適当な塩化セシウム勾配で分離されるので、核酸は分画される。インターカレート剤がGCまたはAT領域のようなDNA領域に選択的に結合すると、核酸はDNAの相対的な塩基含量によって分離される。複数の生物体の核酸は、このようにして分離できる。
【0237】
密度勾配は、現在、核酸を分画するために利用されている。例えば、土壌のタイピングおよび生物環境浄化に使用する微生物核酸の分離には、ビスベンジミド密度勾配の利用が記述されている。これらの実験では、生物環境浄化処理の前後で、固定されたベンジミド勾配におけるA.sub.260ピークの相対量を評価して、細菌群がどのように影響されたかを検討する。このテクニックは、平均して種のGC含量は相対的に一定であるという前提に基づいている。本発明ではこのテクニックはゲノムの複雑な混合物の分画に利用される。試料由来の核酸を超遠心して分画し、発表された手順にしたがってA.sub.260を測定する。
【0238】
本発明の1つの局面では、各ピークから等量のA.sub.260ユニットが取り出され、以下に説明するものを含め当技術分野で周知の種々の増幅プロトコールを用いて核酸が増幅され、遺伝子ライブラリーが調製される。または、各ピークから等量のA.sub.260が取り出され、この核酸から直接に遺伝子ライブラリーが調製される。このようにして遺伝子ライブラリーは、各ピークからの同じ量のDNAの組み合せから調製される。この戦略によって、分画しないDNA試料全体からライブラリーが作製されていたなら、生物体が非常に少量しか存在しないために表されないか失われる場合もあるような、環境試料および濃縮物内に少量存在する生物体からも、遺伝子を得ることができる。または、以下に説明するテクニックを用いて分画後にDNAを標準化できる。その後、この分画済/標準化DNAからDNAライブラリーを作製できる。
【0239】
分画された核酸の複数の画分の組成は、当技術分野で周知のPCR関連増幅分類法を用いて決定できる。
【0240】
以前の標準化プロトコールは、標準化cDNAライブラリーの作製のために設計された(国際公開公報第95/08647号、国際公開公報第95/11986号)。これらのプロトコールは、もともとMRNA由来のまれなcDNAのクローニングと単離のために開発された。本発明は非培養または環境試料からの、標準化したゲノムDNA遺伝子ライブラリーの作製に関する。
【0241】
環境試料または初代濃縮培養から直接単離された核酸試料は、通常多数の微生物由来のゲノムを含む。このような複雑な生物コミュニティは、1つの集合内に存在する種の絶対数、および試料内の各生物体の相対量によって記述することができる。試料内の各生物体の全体の標準化は、非常に困難である。光ピンセットのような分離テクニックは、試料中で形態学的に異なるメンバーを選ぶために使用できる。各メンバーの細胞を同じ数ずつ合わせるか、試料中の各メンバーの純粋培養を調製して、各純粋培養の細胞を同じ数ずつ合わせることで、標準化を行なう。実際には、これは特にハイスループットでは非常に困難な作業である。
【0242】
本発明は、環境試料中に存在するゲノムの標準化、標準化した核酸からのDNAの作製、および関心対象の活性に関するライブラリーのスクリーニングのためのテクニックの使用に関する。
【0243】
本発明の1つの局面では、試料からDNAが単離され、分画される。そして核酸の鎖を溶解して、一定条件で選択的にアニーリングさせる(C.sub.o t駆動のハイブリダイゼーション)。または、この溶解プロセスの前にDNAを分画しない。核酸断片の混合物が溶解され、厳密条件下でアニールされると、頻度の高い配列は、低い配列よりも速く相補鎖を見つける。選択的に一本鎖核酸単離を行なった後、まれな配列の濃縮物を表す一本鎖核酸を増幅して、遺伝子リブラリーを作製する。この手順によって、まれまたは量の少ない核酸分子が増幅されることになる。これらの分子を用いて、ライブラリーが作製される。全てのDNAが回収されると、もともとDNAを含んでいた生物体の識別が失われうる。この方法では、「クローニングできない供給源」からDNAを回収することができる。
【0244】
以前に記述されたテクニックを用いて得られた核酸試料を増幅して、標準化プロセスを完了する。例えば、試料はKoら(Ko、1990b; Ko、1990a、Takahashi、1994)によって記述されたようなPCR増幅プロトコール、またはより好ましくはBarnes (1994)またはCheng (1994)に記述された長いPCRプロトコールを用いて、増幅される。
【0245】
標準化は直接行なうか、標準化プロセスの前に核酸プールの複雑度を減らすための手順を踏んでから行なう。複雑度を低下させることは、あまり表されていない生物体から核酸を回収するために有益である。
【0246】
ライブラリーを調製する元になる微生物には、真正細菌(Eubacteria)および古細菌(Archaebacteria)のような原核微生物、および真菌、一部の藻類、プロトゾアのような下等真核微生物が含まれる。微生物は環境試料から得た培養微生物または非培養微生物で、そのような微生物は好熱菌、超好熱菌、好冷菌、低温細菌等のようなエクストレモフィルでよい。
【0247】
上述のように、ライブラリーは環境試料から作製することができるが、その場合、DNAは生物体の培養なしで回収しても良いし、培養生物体から回収しても良い。
【0248】
標的DNAを得るための開始材料ライブラリーとしての微生物DNA供給源は、特に、北極および南極の氷、水、または永久凍土から得られた微生物試料、火山由来の材料、熱帯の土壌または植物由来の材料等のような環境試料を含むと考えられる。したがって、例えば、ゲノムDNAは培養可能または培養不能な生物体から回収し、適切な組み換え発現ライブラリーの作製に用いて、その後、酵素活性を決定することができる。
【0249】
細菌および多くの真核生物は、その産物が関連したプロセスに関与する遺伝子を調節するための協調した機構を持っている。遺伝子は単一の染色体上で「遺伝子クラスター」と呼ばれる構造となって密集し、クラスター全体の転写を開始する単一のプロモーターを含む単一の調節配列の制御下で、一緒に転写される。合わせて調節に関与する遺伝子クラスター、プロモーター、および別の配列は、「オペロン」と呼ばれ、通常は2から6の遺伝子、最高20またはそれ以上の遺伝子を含む。このように、遺伝子クラスターは、通常は機能に関して、関連するまたは同一の隣接する遺伝子群である。
【0250】
いくつかの遺伝子ファミリーは、同一のメンバーからなる。集団になっている遺伝子は、必ずしも同一ではないが、集団化は遺伝子間の同一性を維持するための必要条件である。遺伝子クラスターは隣接する関連遺伝子が重複した極端なものから、何百もの同一の遺伝子が縦列しているものまである。特定の遺伝子の繰り返しに、意義が見いだされない場合もある。その代表例は、哺乳類の他の種では単一のインスリン遺伝子が適切であるのに、ある種ではインスリン遺伝子が重複して発現するものである。
【0251】
遺伝子クラスターおよびそれからタンパク質が発現するためにクラスターの全長がどの程度必要かをさらに研究することは、重要である。さらに、遺伝子クラスターは継続的に再編成を受けているため、例えば細菌または他の原核生物由来の遺伝子クラスターの不均質なライブラリーを作製する能力は、特に、様々な有用な活性を持つポリケチドの合成をになうポリケチド合成酵素のような酵素を含む新規のタンパク質源を決定するうえで、価値がある。例えば、抗生物質、抗ウイルス薬、抗腫瘍薬、およびインスリンのような調節タンパク質を含め、他の種類の遺伝子クラスターの産物のタンパク質も予測される。
【0252】
ポリケチドは、抗生物質(テトラサイクリンやエリスロマイシンなど)、抗がん剤(ダウノマイシン)、免疫抑制剤(FK506およびラパマイシン)、および動物薬(モネンシン)を含む生理活性の非常に豊かな供給源となる分子である。多くのポリケチド(ポリケチド合成酵素に作製される)は、治療薬として価値が高い。ポリケチド合成酵素は、長さおよび機能や環化のパターンが異なる多様な炭素鎖の生合成を触媒する、多機能酵素である。ポリケチド合成酵素遺伝子は、遺伝子クラスターとなっており、少なくとも1つのタイプ(タイプIと呼ばれる)のポリケチド合成酵素は、大きなサイズの遺伝子および酵素を持っており、遺伝子操作やこれらの遺伝子/タンパク質のインビトロ研究を複雑なものにしている。
【0253】
ポリケチドおよびポストポリケチド生合成遺伝子のライブラリーから、研究のために新規のポリケチドを求めて所望の成分を選択し組み合せる能力は魅力的である。本発明の方法では、大きな挿入物(特にF因子ベースのベクターを使用する場合)を含むクローンで遺伝子バンクを作製できるので、遺伝子クラスターのクローニングが容易になるため、本発明の方法は新規のポリケチド合成酵素のクローニングを可能にし、容易にする。
【0254】
好ましくは、遺伝子クラスターのDNAをベクターに連結する。特に、ここでベクターはさらに、連結された遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレイの活性の作製を制御および調節する、発現調節配列も含む。外来核酸の導入収容力が特に大きいベクターは、そのような遺伝子クラスターに使用するのに特に適しており、本明細書では大腸菌(E.coli)のF因子(または稔性因子)を含む例によって記述されている。大腸菌(E.coli)のこのF因子は接合時に高頻度で起こるそれ自身の移動に影響を与えるプラスミドで、微生物の混合試料由来の遺伝子クラスターのような、大きな核酸断片を安定的に増やすために理想的である。
【0255】
標準化したライブラリーが作製されたら、本明細書に説明されるハイスループットロボットフォーマットを含む、種々のフォーマットの固相または液相スクリーニングアッセイを用いて、独自の酵素活性を発見できる。ライブラリーの作製に使われるDNAの標準化は、このプロセスの鍵となる。標準化によって、試料中に少量しかないものを含め、重要な生物体由来のDNAをより広く表すことができる。
【0256】
以下の実施例は本発明を説明するものであり、限定するものではない。実施例に説明される手順は、本発明の特定の局面を実施するために典型的に使用できるものではあるが、当業者に周知の他の手順も使用できる。
【0257】
実施例1
16S rDNA 遺伝子の末端制限酵素断片長多型( T−RFLP )
以下の方法は、多様度指数(環境試料指標化)を得るための方法を示す。
【0258】
材料および方法:
PCR増幅:
【0259】
%アガロースゲルにPCR産物(100 μl)をかける。DNAはQIAEN QIAquickゲル抽出キットを用いて抽出する。
【0260】
清潔で鋭利なメスでアガロースゲルからDNA断片を切り出す。
【0261】
無色のチューブに入れたゲル断片の重量を測定する。ゲルの体積1(100 mg〜100 μl)に対して緩衝液QGを3加える。
【0262】
50℃で10分間(またはゲル断片が完全に溶解するまで)インキュベートする。ゲルの溶解を促進するため、インキュベーション中2〜3分ごとにチューブをボルテックスで撹拌する。
【0263】
ゲル断片が完全に溶解した後、反応液の色が黄色(アガロースを入れないときの緩衝液QGと類似)であることを確認する。
【0264】
提供されている2 mlコレクションチューブに、QIAquickスピンカラムを入れる。DNAの結合のために、試料をQIAquickカラムに入れ、1分間遠心する。フロースルーを廃棄し、同じコレクションチューブにQIAquickカラムを戻す。洗浄のために、0.75mlの緩衝液PEをQIAquickカラムに加え、1分間遠心する。フロースルーを廃棄し、QIAquickカラムをさらに1分間、>10,000×gで遠心する。QIAquickカラムを清潔な1.5ml微量遠心チューブに入れる。DNAの溶出のため、30 μlの緩衝液EB (10 mM Tris−Cl、pH 8.5)またはH2OをQIAquickメンブレンの中央に添加し、カラムを1分間静置してから、1分間遠心する。
【0265】
DNA濃度のピコグリーン定量
ピコグリーンdsDNA定量キット(EUGENE、カタログ番号P−7589)を用いたDNA濃度のアッセイ:
必要ならば全ての試料濃度を30 ng/μlに調節する(元の体積=30 μlならば、30ng/μlのための最終体積(μl)=元の濃度(ng/μl))
【0266】
消化:
DNA試料をHinp1 I、Mse I、およびMsp Iで一晩消化し、GeneFinderで比較する。
【0267】
反応:0.5 μl酵素+0.5 μl緩衝液(NE緩衝液2)+4 μl DNA
5 μlの小さな体積を保つため、消化はPCR装置中で37℃で行われる。
【0268】
ゲル調整:FMCロングレンジャーゲルプロトコールマニュアル
ABI自動シーケンサーマニュアルの説明にしたがって、ガラスプレート(ABI 377用36cmプレート)およびスペーサー(0.2 mm)をカセットで組み立てる。プレートは特別の非陰イオン洗浄剤ALCONOXで十分に洗う。スペーサーはくぼみを内側にして蒸留水でプレートに付ける。ロングレンジャーシングルパックを室温にする。シーケンサーとプレートの長さに合う、ロングレンジャーシングルパックを使用する。黒のクリップを外し、コンパートメントの内容物を手で穏やかかつ十分に1分間混合する。パックを回転式攪拌機におき、中スピードで5分間撹拌する。手で穏やかかつ十分に1分間混合する。パックを回転式攪拌機上に置き、中スピードで5分間撹拌する。注:混合しすぎないこと。ゲルの重合に干渉しうる。
【0269】
ゲルのキャスティング(ロングレンジャーゲルプロトコール)
注:以下の段階は速やかに完了されねばならない。
赤いクリップのみを外し、コンパートメントの内容物を手で十分に1分間混合する。白のクリップを外し、フィルターをゲル溶液に露出する。内容物がフィルター端から排出するように、パックを保持する。記された線でパックを半分に折る。切り取りマークがパックの上端に来るようにパックを持ち、CUTと記されたスペース内で角を切り取る。気泡を避けるため、溶液がフィルターを通って定常的に流れるために十分に大きな穴を袋に開ける。混合後に溶液に気泡が入らないようにする。標準的なやり方で、ゲルを作製し、櫛を挿入する。ゲルが重合したら(30分)、電気泳動緩衝液に浸したペーパータオルをプレートの端の上に置き、プラスチックラップで覆う。これにより、重合プロセスが継続する間に水分が失われるのを予防する。完全にゲルが重合するまで2時間ほどかかる。
注:空のロングレンジャーシングルパックは、通常のごみ入れに廃棄できる。
【0270】
電気泳動の調製(ロングレンジャーゲルプロトコールFMC)
櫛を取り外し、ABI自動シーケンサーマニュアルの説明にしたがって、プレートを洗う。10×TBEストックを脱イオン水で1×に希釈して、陽極および陰極チェンバーの両方を満たすために十分な量の電気泳動緩衝液を調製する。
最終体積が1000 mLになるようにH2Oを加え、完全に混合して、<0.45 μmメンブレンで濾過する。
【0271】
室温で保存する。沈殿物が形成されたら使用しない。
注:最善の結果を得、またTBEストック溶液の沈殿を予防するため、容器に埃の粒子が入らないようにし、ピペット等を挿入せずに、ボトルから注ぐようにする。≦1 Lの量を調製する。大型ガラス瓶には保存しないこと。
【0272】
製造元の指示にしたがって、ゲルカセットをシーケンシング装置に取り付ける。
【0273】
プレートとゲルが清潔なことを確認するため、色素セットに特異的なプレートチェックモジュールを実行する。
【0274】
36 cmプレートでABI Prism 377遺伝子スキャンを行なう。
注:ABI Prism 377自動シーケンサーマニュアルの説明にしたがって、ロングレンジャーゲル溶液用の分析マトリックス標準ファイルを作製する。
【0275】
1. 「4% Ac」設定を用いて、通常通りに試料シートを用意する。
【0276】
2. 温度が51℃になるまで約10〜20分間、希望するモードを用いてゲルの予備ラン(run)を行なう。51℃になるために必要な以上に、予備ランを行なわないこと。
【0277】
3. 遺伝子スキャンラン用にDNA試料を調製し、各レーンに適切な量を加える。
【0278】
4. 1.4 KBよりも小さい断片には、ランhrsをラン時間に用いる。
【0279】
5. ABI遺伝子スキャン分析マニュアルの説明にしたがって遺伝子スキャンランを分析する。
【0280】
DI数の計算:
【0281】
本発明はその特定の好ましい態様に関して詳細に説明されているが、修正および変更は、説明および請求の精神および範囲内であることが理解されると考えられる。
Claims (45)
- 試料の核酸プロフィールを得る方法であり、以下の段階を含む方法:
試料が生物体の混合集団を含む、複数の核酸配列を試料から得る段階;
複数の核酸配列から作製されたライブラリー中の少なくとも1つのクローンの配列を決定する段階;
データベースが複数の生物体由来の複数の核酸配列を含む、少なくとも1つのクローンの配列をデータベース中のデータと比較するために、アルゴリズムを用いてデータベース検索を実行する段階;及び
少なくとも1つのクローン配列と相同性を持つ、データベース中の配列を同定し、それによって試料の核酸プロフィールを得る段階。 - 生物体の混合集団が、非培養生物体または培養生物体に由来する、請求項1記載の方法。
- 非培養生物体または培養生物体が環境試料から単離される、請求項2記載の方法。
- 環境試料から単離される生物体がエクストレモフィル(extremophile)である、請求項3記載の方法。
- エクストレモフィルが好熱菌、超好熱菌、好冷菌、好塩菌、抗酸菌、好圧菌、および低温細菌(psychrotrophs)からなる群より選択される、請求項4記載の方法。
- 複数の核酸配列が、ゲノムDNA、もしくはその断片または複数の核酸配列から作製されたcDNAである、請求項1記載の方法。
- ゲノムDNAまたはその断片が、1つもしくは複数のオペロン、またはその一部を含む、請求項6記載の方法。
- オペロンまたはその一部が、完全または部分的な代謝経路をコードする、請求項7記載の方法。
- 複数のクローンを含むライブラリーが、ファージ、プラスミド、ファージミド、コスミド、フォスミド、ウイルスベクターおよび人工染色体からなる群より選択される、請求項1記載の方法。
- ライブラリーが、細菌、真菌、植物細胞、昆虫細胞および動物細胞からなる群より選択される宿主細胞に含まれる、請求項1記載の方法。
- 宿主細胞が細菌細胞である、請求項1記載の方法。
- 細菌細胞が、大腸菌(E.coli)、バチルス(Bacillus)、連鎖球菌(Streptomyces)、またはネズミチフス菌(Salmonella typhimurium)細胞である、請求項11記載の方法。
- 宿主細胞が真菌細胞である、請求項1記載の方法。
- 真菌細胞が酵母細胞である、請求項13記載の方法。
- 宿主細胞がショウジョウバエ(Drosophila)S2細胞またはスポドプテラ(Spodoptera)S9細胞である、請求項1記載の方法。
- 宿主細胞が動物細胞である、請求項1記載の方法。
- 動物細胞がCHO細胞、COS細胞またはBowesメラノーマ細胞である、請求項16記載の方法。
- 配列決定がハイスループットシーケンシングにより行われる、請求項1記載の方法。
- 少なくとも1つのクローンが2つまたはそれ以上のクローンである、請求項1記載の方法。
- データベースが、GenBank、PFAM、またはProDomからなる群より選択される、請求項1記載の方法。
- アルゴリズムが、Smith−Waterman、Needleman−Wunsch、BLAST、FASTA、BLITZ、およびPSI−BLASTからなる群より選択される、請求項1記載の方法。
- 相同性が事前に設定された閾値として定義される、請求項1記載の方法。
- 相同性が少なくとも約60%である、請求項1記載の方法。
- 相同性が少なくとも約70%である、請求項1記載の方法。
- 相同性が少なくとも約80%である、請求項1記載の方法。
- 相同性が少なくとも約90%である、請求項1記載の方法。
- ライブラリーが少なくとも約104のクローンを含む、請求項1記載の方法。
- ライブラリーが少なくとも約105のクローンを含む、請求項1記載の方法。
- ライブラリーが少なくとも約106のクローンを含む、請求項1記載の方法。
- ライブラリーが少なくとも約107のクローンを含む、請求項1記載の方法。
- ライブラリーが少なくとも約108のクローンを含む、請求項1記載の方法。
- ライブラリーが少なくとも約109のクローンを含む、請求項1記載の方法。
- ライブラリーが少なくとも約1010のクローンを含む、請求項1記載の方法。
- ライブラリーの形成の前に核酸が標準化される、請求項1記載の方法。
- ライブラリーが約0.01から1010の多様度指数を持つ、請求項1記載の方法。
- ライブラリーが約0.1から109の多様度指数を持つ、請求項1記載の方法。
- ライブラリーが約0.1を上回る多様度指数を持つ、請求項1記載の方法。
- ライブラリーが約1.0を上回る多様度指数を持つ、請求項1記載の方法。
- ライブラリーのクローンが、約0.5kbから10kbの核酸挿入物を含む、請求項1記載の方法。
- ライブラリーのクローンが、約1kbから8kbの核酸挿入物を含む、請求項1記載の方法。
- ライブラリーのクローンが、約1kbから7kbの核酸挿入物を含む、請求項1記載の方法。
- 配列決定が、挿入物の1つの末端からの配列決定を含む、請求項1記載の方法。
- 配列決定が、挿入物の両端からの配列決定を含む、請求項1記載の方法。
- 生物体が微生物である、請求項1記載の方法。
- 試料の核酸プロフィールを得る方法であり、以下の段階を含む方法:
試料が植物の混合集団を含む、試料から複数の核酸配列を得る段階;
複数の核酸配列から作製された核酸ライブラリー中の少なくとも1つのクローンの配列を決定する段階;
データベースが複数の生物体由来の複数の核酸配列を含む、少なくとも1つのクローンの配列をデータベース中のデータと比較するために、アルゴリズムを用いてデータベース検索を実行する段階;及び
少なくとも1つのクローン配列と相同性を持つ、データベース中の配列を同定し、それによって試料の核酸プロフィールを得る段階。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/571,499 US6455254B1 (en) | 1995-07-18 | 2000-05-15 | Sequence based screening |
PCT/US2001/015692 WO2001088196A2 (en) | 2000-05-15 | 2001-05-15 | Sequence based screening |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004504014A true JP2004504014A (ja) | 2004-02-12 |
JP2004504014A5 JP2004504014A5 (ja) | 2005-01-06 |
Family
ID=24283949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001584578A Pending JP2004504014A (ja) | 2000-05-15 | 2001-05-15 | 配列に基づくスクリーニング |
Country Status (7)
Country | Link |
---|---|
US (2) | US6455254B1 (ja) |
EP (1) | EP1356090A2 (ja) |
JP (1) | JP2004504014A (ja) |
AU (1) | AU782529C (ja) |
CA (1) | CA2375082A1 (ja) |
IL (1) | IL147637A0 (ja) |
WO (1) | WO2001088196A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016198095A (ja) * | 2009-11-06 | 2016-12-01 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | 臓器移植患者における移植片拒絶反応の非侵襲的診断方法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1025217B1 (en) * | 1997-10-24 | 2006-10-04 | Invitrogen Corporation | Recombinational cloning using nucleic acids having recombination sites |
US6917882B2 (en) * | 1999-01-19 | 2005-07-12 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US7024312B1 (en) * | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US6961664B2 (en) | 1999-01-19 | 2005-11-01 | Maxygen | Methods of populating data structures for use in evolutionary simulations |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
US7198924B2 (en) | 2000-12-11 | 2007-04-03 | Invitrogen Corporation | Methods and compositions for synthesis of nucleic acid molecules using multiple recognition sites |
AU2003218114B2 (en) * | 2002-03-11 | 2008-09-18 | Athenix Corporation | Integrated system for high throughput capture of genetic diversity |
JP2007512838A (ja) | 2003-12-01 | 2007-05-24 | インヴィトロジェン コーポレーション | 組換え部位を含む核酸分子およびその使用方法 |
US20050282155A1 (en) * | 2004-06-17 | 2005-12-22 | Lucigen Corporation | Viral libraries from uncultivated viruses and polypeptides produced therefrom |
ES2679282T3 (es) | 2004-10-22 | 2018-08-23 | Revivicor Inc. | Porcinos transgénicos que carecen de cadena ligera de inmunoglobulina endógena |
PT2163562E (pt) | 2005-06-21 | 2013-12-19 | Xoma Us Llc | Anticorpos de ligação a il 1 beta e respectivos fragmentos |
ES2548377T3 (es) | 2008-10-27 | 2015-10-16 | Revivicor, Inc. | Ungulados inmunodeprimidos |
JP6055152B1 (ja) * | 2015-08-27 | 2016-12-27 | 花王株式会社 | トナー用結着樹脂組成物 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0528881A4 (en) | 1990-04-24 | 1993-05-26 | Stratagene | Methods for phenotype creation from multiple gene populations |
US5352778A (en) | 1990-04-26 | 1994-10-04 | New England Biolabs, Inc. | Recombinant thermostable DNA polymerase from archaebacteria |
US5500363A (en) | 1990-04-26 | 1996-03-19 | New England Biolabs, Inc. | Recombinant thermostable DNA polymerase from archaebacteria |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
KR19990008000A (ko) | 1995-04-24 | 1999-01-25 | 로버트 에스. 화이트 헤드 | 새로운 대사 경로를 만들고 이를 스크리닝하는 방법 |
US5783431A (en) * | 1996-04-24 | 1998-07-21 | Chromaxome Corporation | Methods for generating and screening novel metabolic pathways |
US5763239A (en) * | 1996-06-18 | 1998-06-09 | Diversa Corporation | Production and use of normalized DNA libraries |
-
2000
- 2000-05-15 US US09/571,499 patent/US6455254B1/en not_active Expired - Lifetime
-
2001
- 2001-05-15 JP JP2001584578A patent/JP2004504014A/ja active Pending
- 2001-05-15 WO PCT/US2001/015692 patent/WO2001088196A2/en active IP Right Grant
- 2001-05-15 EP EP01937406A patent/EP1356090A2/en not_active Ceased
- 2001-05-15 IL IL14763701A patent/IL147637A0/xx unknown
- 2001-05-15 AU AU63148/01A patent/AU782529C/en not_active Ceased
- 2001-05-15 CA CA002375082A patent/CA2375082A1/en not_active Abandoned
-
2002
- 2002-08-27 US US10/229,554 patent/US20030008319A1/en not_active Abandoned
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016198095A (ja) * | 2009-11-06 | 2016-12-01 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | 臓器移植患者における移植片拒絶反応の非侵襲的診断方法 |
US10968479B2 (en) | 2009-11-06 | 2021-04-06 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
US10982275B2 (en) | 2009-11-06 | 2021-04-20 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
US10988804B2 (en) | 2009-11-06 | 2021-04-27 | The Board Of Trustees Of The Leland Stanford Junior University | Nucleic acid sequencing apparatus for monitoring status of a transplant recipient |
US11098350B2 (en) | 2009-11-06 | 2021-08-24 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
US11384389B2 (en) | 2009-11-06 | 2022-07-12 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
US11390918B2 (en) | 2009-11-06 | 2022-07-19 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
US11597966B2 (en) | 2009-11-06 | 2023-03-07 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
Also Published As
Publication number | Publication date |
---|---|
US20030008319A1 (en) | 2003-01-09 |
AU782529C (en) | 2006-02-23 |
AU6314801A (en) | 2001-11-26 |
AU782529B2 (en) | 2005-08-04 |
WO2001088196A3 (en) | 2003-08-14 |
US6455254B1 (en) | 2002-09-24 |
EP1356090A2 (en) | 2003-10-29 |
CA2375082A1 (en) | 2001-11-22 |
WO2001088196A2 (en) | 2001-11-22 |
US20020037505A1 (en) | 2002-03-28 |
IL147637A0 (en) | 2002-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6794127B1 (en) | Capillary array-based sample screening | |
US6632600B1 (en) | Altered thermostability of enzymes | |
TW201321518A (zh) | 微量核酸樣本的庫製備方法及其應用 | |
JP2000514651A (ja) | 合成または増幅過程をブロックまたは中断することにより製造されたポリヌクレオチドによるdnaのシャッフリング方法 | |
JP2003245073A (ja) | Dnaシャッフリング方法 | |
JP2004504014A (ja) | 配列に基づくスクリーニング | |
US20010041333A1 (en) | High throughput screening for a bioactivity or biomolecule | |
KR20160138168A (ko) | 카피수 보존 rna 분석 방법 | |
EP1144679A2 (en) | Capillary array-based sample screening | |
US10214759B2 (en) | Probability-directed isolation of nucleotide sequences (PINS) | |
CN110818757A (zh) | 核苷酸类似物以及筛选dna聚合酶的方法 | |
US20020031771A1 (en) | Sequence based screening | |
US20030077620A1 (en) | High throughput screening for sequences of interest | |
AU2007201249A1 (en) | Sequence based screening | |
CA2391626A1 (en) | Combinatorial screening of mixed populations of organisms | |
US20050234654A1 (en) | Detection of evolutionary bottlenecking by dna sequencing as a method to discover genes of value | |
WO2024033411A1 (en) | Methods for determining the location of a target sequence and uses | |
US20020164580A1 (en) | Combinatorial screening of mixed populations of organisms | |
AU2015234399A1 (en) | Combinatorial screening of mixed populations of organisms | |
AU2012216477A1 (en) | Combinatorial screening of mixed populations of organisms | |
AU2007231834A1 (en) | Combinatorial screening of mixed populations of organisms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050830 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060207 |