JPWO2002026964A1 - Method for constructing mutant DNA library and use thereof - Google Patents

Method for constructing mutant DNA library and use thereof Download PDF

Info

Publication number
JPWO2002026964A1
JPWO2002026964A1 JP2002530727A JP2002530727A JPWO2002026964A1 JP WO2002026964 A1 JPWO2002026964 A1 JP WO2002026964A1 JP 2002530727 A JP2002530727 A JP 2002530727A JP 2002530727 A JP2002530727 A JP 2002530727A JP WO2002026964 A1 JPWO2002026964 A1 JP WO2002026964A1
Authority
JP
Japan
Prior art keywords
dna
unit region
protein
library
dnas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002530727A
Other languages
Japanese (ja)
Inventor
辻 融
柳川 弘志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Chemical Corp
Original Assignee
Mitsubishi Chemical Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Chemical Corp filed Critical Mitsubishi Chemical Corp
Publication of JPWO2002026964A1 publication Critical patent/JPWO2002026964A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Ecology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明によれば、(a)単位領域DNAを任意の組み合わせで連結し、(b)得られた連結単位領域DNAを、用いられるすべての連結単位領域DNAの末端の配列が少なくとも他の1種類の連結単位領域DNAの末端の配列と重複するように選択して混合し、(c)該連結単位領域DNAの混合物を鋳型としてPolymerase Chain Reactionを行って2以上のクローンを含むDNAライブラリーを取得することを含む、DNAライブラリーの構築方法が提供される。本発明の方法によれば、任意のアミノ酸配列をコードする複数のDNA断片を様々な順序と長さで連結した遺伝子の集団を構築する方法が提供される。According to the present invention, (a) the unit region DNAs are ligated in any combination, and (b) the obtained connected unit region DNAs are combined with at least one other type of terminal sequence of all the connected unit region DNAs used. (C) Polymerase \ Chain \ Reaction is performed using the mixture of the connection unit region DNA as a template to obtain a DNA library containing two or more clones. A method for constructing a DNA library is provided. According to the method of the present invention, there is provided a method for constructing a population of genes in which a plurality of DNA fragments encoding an arbitrary amino acid sequence are linked in various orders and lengths.

Description

技術分野
本発明は、連結単位領域DNAの混合物を鋳型としてPolymerase Chain Reaction(以下「PCR」と称することがある。)を行うことを特徴とするDNAライブラリーの構築方法に関する。より詳細には、本発明は、タンパク質のモジュール、二次構造、超二次構造、モチーフなど特定のアミノ酸配列をコードするDNA配列、原始配列、エキソン、発現制御領域を構成するDNA、あるいは人工アミノ酸配列をコードするDNA等を連結した連結単位領域DNAの混合物を鋳型としたPCRを行うことを特徴とする変異DNAライブラリーの構築方法、並びに該DNAライブラリーを転写、翻訳することにより取得されるプロテインライブラリーに関する。また、本発明は、該プロテインライブラリーを用いて所望の性質を有するタンパク質を選択することを特徴とする所望の性質を有する変異タンパク質を取得する方法、及び進化分子工学の手法を適用することにより得られる、所望の性質をさらに増大させたタンパク質にも関する。
背景技術
現在、多くの酵素が産業用のバイオプロセスに利用されている。環境問題との関連から、エネルギー効率の高いバイオプロセスは、今後さらに普及すると予想される。また、遺伝子工学の発展に伴い、医薬品やバイオセンサーとしてのタンパク質の需要も高まると考えられる。しかし、多くのタンパク質の場合、その構造安定性は低く、熱や有機溶媒などに対して変性しやすい。また製造過程における凝集は、合成物の回収率低下の原因となっている。このような変性、凝集は不可逆的であることが多く、一度変性したタンパク質を機能を持つ天然状態に再生することは困難である。
そのため、タンパク質工学あるいは進化分子工学的手法による、耐熱性や有機溶媒耐性等の向上を目指す試みがなされている。例えばタンパク質工学では、構造が既知のタンパク質について、その構造の安定化に寄与しそうな部位を推測してアミノ酸置換を行う(応用化学講座、蛋白質工学、朝倉書店、池谷克英、中村春木著、1991年)方法が用いられている。また、進化分子工学の技術を用いれば、部位特異的に、あるいはランダムにアミノ酸置換を行い、目的とする性質が上昇したことを指標として選択することにより機能が向上したタンパク質を取得することができる。
進化分子工学は、特定の機能を有するタンパク質を創出する優れた手法である。タンパク質の進化分子工学では、はじめに多くのタンパク質を含んだ変異体集団(以下、「変異プロテインライブラリー」と称することがある。)を構築する。次に、該ライブラリー中より目的の機能をもつ変異タンパク質を選択する。さらに選択した変異タンパク質をコードするDNAに変異を導入してこれを発現させ、再び変異プロテインライブラリーを構築し、所望の機能がさらに増大した変異タンパク質を選択する。この操作を数回繰り返すことにより、優れた機能をもつタンパク質を得ることができる。
このような進化分子工学による変異タンパク質の取得には、変異プロテインライブラリー及びそれらをコードする変異DNAライブラリーのうち、より広大な配列空間を検索できるライブラリーが必須である。従ってその構築手法は、進化分子工学にとって極めて重要な要素技術である。
変異DNAライブラリーの構築手法は、その初期においては、DNAに対する変異剤(Myers,R.M.et al.(1985)Science 229,242−247;Chu,C.−T.et al.(1979)Virology 98,168−181)や放射線(Billi,D.(2000)Appl.Environ.Microbiol.66,1489−1492)を用いたものに限られていたが、DNAの化学合成法(Sinha,N.D.et al.(1984)Nucleic Acids Res.12,4539−4557)やPolymerase Chain Reaction(Saiki,R.K.et al.(1985)Science 230,1350−1354)等新しい技術の進展にともない、変異の導入法も、組換え技術を利用した方法(Botstein,D.& Shortle,D.(1985)Science 229,1193−1201)、Error−prone PCR(Leung,D.W.et al.(1989)Technique 1,11−15)、DNA shuffling(Stemmer,W.P.C.(1994)Proc.Natl.Acad.Sci.USA.91,10747−10751)など質、量ともに、よりダイナミックなものになってきた。
Error−prone PCRでは、過剰量のマンガンイオンや4種類のデオキシリボヌクレオチド三リン酸を種々の混合比で加え、Taq DNAポリメラーゼを用いてPCRを行うことにより、DNAの複製の際に点突然変異が導入される。
DNA shufflingでは、進化させたいタンパク質をコードしているDNAにError−prone PCRにより点突然変異を導入した後、DNase Iにより切断する。その後、プライマーの非存在下でPCRを行うことにより、相同配列を介した組換えが起こり、すでに導入されている種々の点突然変異が組み合わされ、多様な変異が導入されたDNAライブラリーが構築される。つまりError−prone PCRよりも点突然変異を効率よく導入することができる。またDNA shufflingでは、配列上比較的相同性の高いファミリータンパク質内の配列を親配列として用いることもできる。
上記した方法によればDNAに点突然変異を導入した変異DNAライブラリーの作製は可能である。しかし、タンパク質のアミノ酸の配列空間は非常に広大である。例えば、100残基のアミノ酸からなるタンパク質の配列は20100≒10130通り可能である。これは、宇宙に存在する原子の数(1075)よりも多い。このような莫大な配列が40億年に満たない生物進化の過程で網羅的に試行されたとは到底考えられない。すなわち、広大なタンパク質のアミノ酸配列空間の中には、地球上に存在する生物が、まだ試行していない有用な機能をもつ配列が存在している可能性が高い。
この点において、Error−prone PCRでは非常に少数の点突然変異しか導入できない。また、DNA shufflingでは配列上相同性の高い配列同士の点突然変異の導入しか可能でないため、このような方法により構築したライブラリーでは、変異体としての広大な配列空間を探査することは不可能である。
また、DNAへ点突然変異を導入するのではなく、相同配列を持たない任意のアミノ酸配列をコードする塩基配列をランダムに組み合わせることによる変異DNAライブラリーを効率よく構築する手法はこれまで知られていない。
このようなDNAのある領域を組換える方法としては、例えば単純に任意のDNA断片をDNAリガーゼを用いて連結する方法が考えられるが、このような連結によれば逆方向に連結されるDNA断片が2分の1の確率で出現するため、本来のDNA断片がコードしているアミノ酸配列が得られなくなる上、終始コドンが頻繁に出現するので、最小の球状タンパク質(約100残基のアミノ酸からなる)に相当する構造遺伝子を構築することが困難となる等ライブラリーを構築する方法としては不適である。
また、DNAの方向性を保って連結する方法としては、連結しようとする各単位領域DNAの5’末端と3’末端を異なる制限酵素で消化し、その断片をDNAリガーゼを用いて連結する方法が考えられる。しかし、この場合は各単位領域の方向性は保持されるが、各単位領域に制限酵素の認識部位(リンカー)を人工的に付加しなくてはならず、その結果、本来のアミノ酸配列に特定のアミノ酸が挿入される問題点が生じる。
一方、本発明者らは、単位領域レベルでの部位特異的変異の導入法の1つとして、タンパク質をコードする遺伝子DNAを単位領域毎に分断して単離し、単離された単位領域DNAを任意の組み合わせで連結し、連結された単位領域DNAを、入れ換えようとする順序に各単位領域DNAの末端が重複するように選んで混合し、連結された単位領域DNAの混合物を鋳型とし、両末端単位領域DNAのプライマーを用いて増幅することよりなる入れ換え変異DNAの構築方法を開示している(特開平10−014578公報)。しかしこの方法は予め決められた数の単位領域DNAの並び替えにより得られる入れ換え変異DNAを得ることを目的としており、さらに一回のPCRにつき1種類の変異DNAしか得られないため多様なタンパク質の配列空間を有するライブラリーを一度のPCRで構築するものではない。
発明の開示
本発明の目的は、従来の変異体集団構築手法であるError−prone PCRやDNA shufflingでは実行不可能であったタンパク質の広大な配列空間を探査するためのライブラリーを構築する方法として、タンパク質のモジュール、二次構造、超二次構造、モチーフ、原始配列、DNAのエキソンなど天然のタンパク質の一部を構成する領域、あるいは発現制御領域、人工アミノ酸配列により構成される領域を単位領域(以下「単位領域」と称することがある。)とし、それらを構成するDNAを適当な組み合わせで連結した変異DNAライブラリーを効率的に構築することにある。
本発明のさらに別の目的は、進化分子工学の技術を用いた所望の性質を有するタンパク質の取得方法として、上記DNAライブラリーを転写、翻訳することによりプロテインライブラリーを作製し、該プロテインライブラリーを用いて所望の性質を有するタンパク質を選択、取得することである。
また本発明は、該プロテインライブラリーを用いて所望の性質を有するタンパク質を選択することにより所望の性質を有する変異タンパク質を取得し、さらに進化分子工学の手法を適用し、所望の性質がさらに改良されたタンパク質を取得すること等を目的とする。
さらに、本発明は、選択されたタンパク質をコードするDNAを解析することにより、所望の性質を有するタンパク質をコードするDNAを取得し、該DNAによって所望の性質を有するタンパク質の組み換え体を作製すること等を目的とする。
本発明者らは上記課題を達成すべく鋭意研究の結果、任意の2種類のアミノ酸配列をコードするDNAを連結させた連結単位領域DNAを複数種類調製して混合し、これを鋳型としてPCRを行えば、任意のアミノ酸配列をコードするDNAが、ランダムに組み合わされた、種々の配列を有するDNAが一度のPCRで合成される(以下、これを「ランダムライブラリー」と称することがある。)ことを見出した。さらに、本発明者らは、真核生物のタンパク質合成系においては、選択的(択一的)スプライシングにより、限られたエクソンを組み合わせて複数種類のタンパク質を合成していることに着目し、タンパク質をコードする構造遺伝子DNAを任意の断片に分断して得られる単位領域DNAについて、構造遺伝子において上流から下流にむけての順序を保ったまま連結した連結単位領域DNAを作製し、それらを特定の比率で混合して鋳型DNAとし、PCRを行えば、選択的スプライシングにより生じるDNA配列群(以下、これを「選択的スプライシングライブラリー」と称することがある。)が構築できることを見いだした。本発明はこれらの知見に基づいて完成されたものである。
即ち、本発明によれば、以下の発明が提供される。
(1) (a)単位領域DNAを任意の組み合わせで連結し、(b)得られた連結単位領域DNAを、用いられるすべての連結単位領域DNAの末端の配列が少なくとも他の1種類の連結単位領域DNAの末端の配列と重複するように選択して混合し、(c)該連結単位領域DNAの混合物を鋳型としてPolymerase Chain Reactionを行って2以上のクローンを含むDNAライブラリーを取得することを含む、DNAライブラリーの構築方法。
(2) 工程(b)において、連結単位領域DNAを、用いられる全ての連結単位領域の末端の配列が少なくとも他の1種類の連結単位領域DNAの末端の配列と重複し、かつ少なくとも1種類の連結単位領域DNAの5’末端あるいは3’末端のいずれかの配列が少なくとも他の2種類の連結単位領域DNAの末端と重複するように選択して混合する、(1)に記載の方法。
(3) 連結単位領域DNAの混合物が、用いられる単位領域DNAの全ての組み合わせで2つの単位領域DNAが連結された連結単位領域の混合物である、(1)または(2)に記載の方法。
(4) 単位領域DNAがタンパク質をコードする構造遺伝子DNAをL個に分断したものであり(ここで、Lは3以上の整数である)、その連結方法が、任意の単位領域DNAの3’末端と、該単位領域より上記タンパク質においてC末端側に存在する単位領域DNAの5’末端とが各単位領域のアミノ酸配列が保たれるように連結するものであり、かつ連結単位領域DNAの混合物が、連結した各単位領域DNAがもとの構造遺伝子において隔てている単位領域の数であるX(但しXは0以上L−2以下の整数である)を指標として分類した各連結単位領域DNAが、下記式(1)を満たす割合を指標にして混合されたものである、(1)に記載の方法。
L−X−1M−X    (1)
(式中、LおよびXは上記と同様の意味を示し、Mは単位領域の総数と作製する変異DNAの有する単位領域数との差を示す)
(5) 単位領域DNAが、同様の3次構造を有するがそのアミノ酸配列が異なるタンパク質群をコードするDNAをそれぞれL個の単位領域に分断したものであり(ここで、Lは3以上の整数である)、その連結方法が、任意の単位領域DNAの3’末端と、該単位領域より上記タンパク質群においてC末端側に存在する単位領域DNAの5’末端とが各単位領域のアミノ酸配列が保たれるように連結するものであり、かつ連結単位領域DNAの混合物が、連結した各単位領域DNAがもとのタンパク質群において隔てている単位領域の数であるX(但しXは0以上L−2以下の整数である)を指標として分類した各連結単位領域DNAが下記式(1)を満たす割合を指標にして混合されたものである、(1)に記載の方法。
L−X−1M−X    (1)
(式中、LおよびXは上記と同様の意味を示し、Mは単位領域の総数と作製する変異DNAの有する単位領域数との差を示す)
(6) Polymerase Chain Reactionが、構築されるべきDNAの両末端となるべき単位領域DNAと相補的な配列を有するプライマーの存在下で行われる(1)〜(5)のいずれかに記載の方法。
(7) Polymerase Chain Reactionが、共通DNA配列を含む連結単位領域DNAと該共通DNA配列に相補的な配列を有するプライマーの存在下で行われる(1)〜(6)のいずれかに記載の方法。
(8) (1)〜(7)のいずれかの方法により得られる変異DNAライブラリー。
(9) (8)に記載のDNAライブラリーを発現ベクターに組み込み、該発現ベクターで宿主細胞を形質転換し、該形質転換体を培養し、培養物からタンパク質を採取することにより得られるタンパク質ライブラリー。
(10) (8)に記載のDNAライブラリーを転写することにより得られるRNAライブラリー。
(11) (8)に記載のDNAライブラリー、または(10)に記載のRNAライブラリーを無細胞転写および/または翻訳系で発現させることを特徴とするタンパク質ライブラリーの作製方法。
(12) (11)の方法により得られるタンパク質ライブラリー。
(13) (7)に記載のDNAライブラリーに含まれるDNA、または(9)に記載のRNAライブラリーに含まれるRNAに該DNA、またはRNAがコードするタンパク質が結合した核酸−タンパク質連結分子ライブラリー。
(14) (9)、(12)または(13)に記載のライブラリーを用いて所望の性質を有するタンパク質を選択することを特徴とするタンパク質の取得方法。
(15) (14)に記載の方法により得られるタンパク質。
(16) (a)(15)に記載のタンパク質をコードするDNAを調製し、(b)該DNAに変異を導入し、(c)変異を導入したDNAを増幅し、(d)増幅されたDNAを転写/翻訳させることによりタンパク質ライブラリーを作製し、(e)該ライブラリーを用いて所望の性質を有するタンパク質を取得することを特徴とするタンパク質の取得方法。
(17) (16)に記載の方法により得られるタンパク質。
(18) (15)または(17)に記載のタンパク質をコードするDNAの取得方法。
(19) (18)に記載の方法により得られるDNA。
発明を実施するための最良の形態
以下、本発明についてさらに詳細に説明する。なお、本明細書中において特に指定がない限りは、ランダムライブラリー、選択的スプライシングライブラリーに共通の説明である。
(1)単位領域DNA
本発明で用いられる「単位領域」とは、タンパク質、遺伝子あるいはゲノムDNAで何らかの構造的、機能的、進化的な意味を有する特定の領域単位、あるいはそのような意味を示さない任意の領域、または発現調節領域等を指す。タンパク質において特定の意味を有する領域としては、具体的には、例えばタンパク質のモジュール、二次構造、超二次構造、構造モチーフ、モチーフ、原始配列、人工アミノ酸配列等があり、また遺伝子においてはエキソン等を指す。発現調節領域としては、具体的には、コアプロモーター要素、上流制御要素、エンハンサープロモーター、エンハンサー等を指す。
ランダムライブラリーを作製する場合には単位領域は、上記のいずれも用いることができるが、選択的スプライシングライブラリーの場合にはタンパク質をコードする構造遺伝子を分断したものが用いられる。
タンパク質のモジュールとは、球状タンパク質やドメイン中で、一次構造上連続でかつ立体的にコンパクトな10〜40残基のアミノ酸からなる領域である。真核生物のエキソン部分がコードするポリペプチドは、モジュール構造を示す単位領域によく対応しており、モジュールは、タンパク質を構成する基本的なポリペプチドであり、生物進化の初期段階において重要な素材であったと考えられる(Go,M.et al.(1987)Cold Spring Harb.Symp.Quant.Biol.,52,915−924)。具体的には、例えばリゾチーム、ヘモグロビン、トリオースリン酸イソメラーゼ、及びバルナーゼを構成するモジュール等が挙げられる。
また、タンパク質の二次構造とは、タンパク質の立体構造において、ペプチド主鎖中のC=O基とNH基との間の水素結合によって形成される比較的狭い範囲(10残基程度まで)にみられる特殊な立体構造で、α−ヘリックス、β−シート、βターン、あるいはループ構造のような繰り返しのある規則構造(Salemme,F.R.et al.(1983)In biochemistry,ed.Zubay,G.,69−129,Addison−Wesley Publishing co.,Massachusetts)や、カメレオン配列(Minor,D.L.et al.,Nature,380(6576),730−734(1996))、およびG−ペプチド(Honda,S.et al.,J.Mol.Biol.,295(2),269−278(2000))をいう。
タンパク質の超二次構造とは、α−ヘリックスやβ−シート構造のような二次構造単位がいくつか集まってコンパクトな立体構造を局所的につくっている単位をいう(Salemme,F.R.et al.(1983)In biochemistry,ed.Zubay,G.,69−129,Addison−Wesley Publishing co.,Massachusetts)。具体的にはヘリックス−ループ−ヘリックス構造等が挙げられる。
タンパク質のモチーフとは、アミノ酸配列がよく似ている、あるいは機能がよく似ているタンパク質のアミノ酸配列を、同じまたは性質の似たアミノ酸配列が同じ位置に来るように並べる操作(配列アライメント)を行い、配列を比べてみて、短いが有意に保存されているアミノ酸配列をいう。言い換えれば、モチーフはタンパク質の特定の部位にあり、進化の過程で保存されてきたアミノ酸配列や塩基配列を指す。具体的には、ギリシャキーモチーフ等が挙げられ、またタンパク質のモチーフのデータベースPROSITE(http://expasy.hcuge.ch/sprot/prosite.html)等に登録されているモチーフ等が挙げられる。
原始配列とは転移RNAの特異性の並びに対応するアミノ酸配列をいう。進化の初期段階では、原始配列がタンパク質の機能の多様化に重要な役割をしたと、現存タンパク質の配列のホモロジーの比較から推測されている(Ohnishi,K.(1993)In Endocytobiology V,eds.;S.Sato et al.,Tubingen University Press,Tubingen,407−414)。
エキソンとは、真核生物の遺伝子DNAの中のタンパク質にまで翻訳される塩基配列をいう。エキソンはタンパク質にまで翻訳されない塩基配列のイントロンによって分断されている。ゲノムDNAがRNAに転写された後、スプライシングによりイントロンが切り取られ、エキソンだけがつなぎ合わされて、タンパク質合成の情報となる成熟したmRNAになる(Gilbert,W.(1978)Nature,271,501)。
本発明で用いられる「単位領域DNA」とは、単位領域を構成するDNAを意味するが、単位領域が構造遺伝子を分断したものであるときは、元となる構造遺伝子が有する塩基配列は単一のものであり、これを分断して得られる単位領域DNAはそれぞれ単一の塩基配列を有するものが用いられる。また、単位領域が構造遺伝子を分断したものでないときは、各単位領域DNAに含まれるDNAは複数の相同性を有する塩基配列を含むDNA群を意味する。ここで、複数の相同性を有する塩基配列とは、相同性が後述のPCRが可能である程度であり、かつそのDNAの読み枠が保持されているものをいう。
このような単位領域DNAとは二本の相補鎖から成り、任意のDNA鎖から分断して単離し得るDNA又は化学合成したDNAでもよい。また、上記したような構造を有する単位であればDNA鎖の長さ等は特に制限はないが、10〜40アミノ酸をコードする30〜120bpの長さの断片、あるいは、5’または3’末端が±3〜15bp異なるDNA断片の混合物を用いてもよい。このような5’または3’末端が±3〜15bp異なるDNA断片の作製法の例としては、PCRで作製する場合にそれぞれ±3〜15bp隣接する塩基配列上でずらした配列を含むように設計した複数のプライマーを用いる方法が挙げられる。
本発明の変異DNAライブラリーの構築方法において、まずこの単位領域DNAを作製する。作製の方法は、上記した単位領域DNAが得られる方法であれば如何なるものであってもよいが、例えば目的のDNA配列を含むDNAを鋳型としてPCRにより得る方法が好ましい。
また、化学合成によって作製したDNAの相補鎖をアニールさせることにより得ることもできる。
(2)連結単位領域DNA
得られた単位領域DNAは、これをDNAリガーゼ等を用いて連結し、単位領域DNA連結体(以下、これを「連結単位領域DNA」と称することがある)を作製し、このようにDNAリガーゼ等によって連結された連結単位領域DNAについて、これを鋳型としたPCRを行うことにより該連結単位領域DNAを増幅することもできる。この時、それぞれの単位領域DNAがアミノ酸の読み枠を保った方向に連結した連結単位領域DNAを増幅する必要がある。そのためには、例えば、「単位領域1」と「単位領域2」を連結した「1−2」という連結単位領域DNAを増幅する場合は、「単位領域1」の5’末端の塩基配列と相補性を有するフォワードプライマーと「単位領域2」の3’末端の負塩基配列と相補性を有するリバースプライマーを用いてPCRを行う。このようにしてプライマーを選択することにより、DNAリガーゼ等による連結により反転して連結された連結単位領域DNAを自動的に削除することができる。
連結単位領域DNAは、DNAリガーゼ等による反応、あるいは上記のPCRを行った後、この反応液をアガロースゲル電気泳動等により分離し、目的のDNAが含まれている部分のゲルを切り出し、該ゲルからそれ自体既知の方法を用いて回収精製することにより取得することができる。また、上記連結単位領域DNAの全長のDNAを化学合成によって作製し取得することも可能である。
連結単位領域DNAを作製するための単位領域DNAの選択方法及び連結順序については、ランダムライブラリーを作製する場合には、連結する単位領域DNAは任意の単位領域DNAを用いることができ、連結する単位領域の数も特に制限はない。しかし構築されるライブラリーの構成要素の多様化の効率等の点から2つの単位領域DNAを連結した連結単位領域DNAを作製するのが好ましい。連結する単位領域DNA、及びその連結の順番は特に制限はないが、用いられる単位領域DNAの全ての組み合わせの連結単位領域DNAを作製すると、それを用いて後述する方法で作製するDNAライブラリーにおいて、用いるすべての単位領域の組み合わせが行われたDNAを得ることができる。具体的にはn種類の単位領域DNAを用いて、2個の単位領域を連結した連結単位領域DNAを作製する場合、最大の組み合わせの連結反応を行うことができる。
また、連結する場合に、単位領域DNA間にランダムな1〜10個程度、好ましくは1〜5個程度のアミノ酸残基をコードするDNAを挟むように連結を行ってもよい。このような連結単位領域DNAは、適当なプライマーを用いたPCRにより作製することができる。
また、選択的スプライシングライブラリーを作製する場合には、連結単位領域DNAは上記(1)で単一の構造遺伝子DNAを分断した単位領域DNAのうち2つを選択して特定の順番に連結して得ることができる。選択される第1の単位領域DNAは上記(1)で単一の構造遺伝子DNAを分断した単位領域DNA中、コードするタンパク質において最もC末端側に存在するものを除いて選択することができる。また該連結単位領域と結合させる第2の単位領域DNAは、これらがコードするタンパク質において上記第1の単位領域よりC末側に存在する単位領域をコードする単位領域DNAであればいずれのものでもよい。またその連結の順番は、第1の単位領域DNAの3’末端と、これらがコードするタンパク質においてC末側に存在する単位領域をコードする第2の単位領域DNAの5’末端とが単位領域中のアミノ酸配列が保たれるように行う。
上記のようにコードするタンパク質において上流から下流へむけての順序を保持するように結合させた連結単位領域は構造遺伝子をL個の単位領域DNAに分断したものを用いて連結単位領域DNAを作製する場合、第1の単位領域DNAとして選択されるL−1個の全てと、第2の連結単位領域DNAとして選択可能な全ての単位領域との組み合わせについて作製する。すなわちL個の単位領域DNAに構造遺伝子DNAを分断した場合、連結単位領域DNAは種類作製する。
(3)連結単位領域DNAの分類
作製された連結単位領域は、これを鋳型にしたPCRを行うことにより、本発明の変異DNAライブラリーを作製することができるが、選択的スプライシングライブラリーを作製する場合には、上記のようにして得られた連結単位領域DNAを、上記第1の単位領域DNAと第2の単位領域DNAが、それらが存在する構造遺伝子DNAにおいて何個の単位領域を隔てたものが連結されているかを指標として分類する必要がある。ここで第1の単位領域DNAと第2の単位領域DNAがそれらが存在する構造遺伝子DNAにおいて隔てている単位領域の数であるXは、分断された単位領域がL個のとき、0以上L−2以下の整数である。
具体的には、あるタンパク質をコードするDNAを、5個の単位領域DNAに分断した後、連結単位領域DNAを作製した場合、単位領域DNAを構造遺伝子のN末側から順に1、2、3、4、及び5とすると、連結単位領域DNAは1−2、1−3、1−4、1−5、2−3、2−4、2−5、3−4、3−5、4−5の10種類が作製される。これらのうち第1の単位領域DNAと第2の単位領域DNAが、それらが存在する構造遺伝子DNAにおいて0個の単位領域を隔てたもの(X=0)は、1−2、2−3、3−4、4−5である。同様に1個の単位領域を隔てたもの(X=1)は、1−3、2−4、3−5、2個隔てたもの(X=2)は1−4、2−5、3個隔てたもの(X=3)は1−5というようにそれぞれ分類することができる。このように分類された連結単位領域DNAの各グループに属する単位領域DNAを総称して「連結単位領域DNA群」と称することがある。
(4)連結単位領域DNAを鋳型としたPCR
本発明の方法によれば、このようにして得られた連結単位領域DNAを混合し、これを鋳型としてPCR反応を行うことにより、単位領域DNAが適当な組み合わせで連結され、種々の配列の構造遺伝子からなる変異DNAライブラリーを一度のPCRで構築することができる。
このPCRにおいて鋳型とする連結単位領域DNAは、用いられる全ての連結単位領域DNAの末端の配列が少なくとも他の1種類の連結単位領域DNAの末端の配列と重複するように選択して混合する。ここで、ランダムライブラリーを作製する場合には、このPCRにおいて鋳型とする連結単位領域DNAは、用いられる全ての連結単位領域DNAの末端の配列が少なくとも他の1種類の連結単位領域DNAの末端の配列と重複し、かつ少なくとも1種類の連結単位領域DNAの5’末端、あるいは3’末端のいずれかの配列が少なくとも他の2種類の連結単位領域DNAの末端の配列と重複するように選択する。本方法におけるPCRに用いる連結単位領域DNAは、上記の条件を満たしていれば、その種類、及び個数は特に制限されない。
ランダムライブラリーにおいて、用いるすべての単位領域の組み合わせが行われたDNAを得る目的の場合には、用いられる単位領域DNAの全ての組み合わせで連結された連結単位領域DNAを選択して混合し、これを鋳型としてPCRを行えばよい。この場合、2つの単位領域DNAが連結された連結単位領域DNAを用いるのが好ましい。具体的にはn種類の単位領域DNAを用いて、2個の単位領域を連結した連結単位領域DNAにより、n個の単位領域DNAの連結体を作製する場合、n種類の組み合わせの異なる連結単位領域DNAが存在するので、それら全ての連結単位領域DNAを鋳型としてPCRを行えば、用いられる単位領域DNAの全ての組み合わせで連結された変異DNAライブラリーを得ることができる。
ランダムライブラリーにおいて、特定の単位領域DNAの出現頻度については、その単位領域DNAを含む連結単位領域DNAの濃度によって調節することができる。具体的には、特定の単位領域DNAが他の2倍出現することを期待する場合には、その単位領域DNAを含む連結単位領域を含まないものの2倍量添加すればよい。
また、選択的スプライシングライブラリーを作製する場合、上記(3)で分類した連結単位領域DNA群を、PCRの鋳型として用いることができる。このPCRに供する連結単位領域DNA群のDNA量は、各連結単位領域DNA群の合計として300〜1500fmol、好ましくは500〜1300fmolが適当である。この鋳型DNAのうちの各連結単位領域DNA群の占めるDNA量は、それぞれの第1の単位領域DNAと第2の単位領域DNAがそれらが存在する構造遺伝子DNAにおいて隔てている単位領域の数であるX、分断された単位領域の総数であるL、単位領域の総数と作製する変異体DNAの有する単位領域DNAの数との差であるMについて下記式(1)
L−X−1M−X     (1)
(式中、LおよびXは上記同じ意味を示し、Mは単位領域の総数と作製する変異DNAの有する単位領域DNA数との差を示す)
により算出することができる。このように算出された値は、各連結単位領域DNA群のDNAの総量が上記鋳型DNAの総量に占める割合を示す。また、算出された各連結単位領域DNA群のDNAの総量に占める各連結単位領域DNAのDNA量は分子数として等量であることが好ましい。
具体的には、分断された単位領域の総数が5個(L=5)であり、作製しようとする変異体DNAが有する単位領域が3個(M=3)である場合、上記で分類したX=0の連結単位領域DNA群では=6、X=1の連結単位領域DNA群では=3、X=2の連結単位領域DNA群では=1、X=4の連結単位領域DNA群では−1=0の割合、つまりX=0に分類された1−2、2−3、3−4、4−5を等量混合したDNA量の合計と、X=1に分類された1−3、2−4、3−5を等量混合したDNA量の合計、及びX=2に分類された1−4、2−5を等量混合したDNA量の合計が6:3:1となるように混合し、これを鋳型としてPCRを行う。
さらに詳述すれば、例えば鋳型となるDNAの総量を500fmolとするとき、X=0に分類された1−2、2−3、3−4、4−5を等量混合したDNA量の合計は300fmolとなり、上記各連結単位領域DNAを75fmolずつ鋳型DNAとしてPCRに供する。同様にX=1に分類された1−3、2−4、3−5を等量混合したDNA量の合計は150fmolであり、各連結単位領域DNAを50fmolずつ鋳型DNAとしてPCRに供する。また、X=2に分類された1−4、2−5を等量混合したDNA量の合計は50fmolとなり、各連結単位領域DNを25fmolずつ鋳型DNAとしてPCRに供する。
かくして上記式(1)を満たす値に基づき適当量混合された連結単位領域DNAを鋳型としたPCRを行うことにより、これらの単位領域DNAを構造遺伝子において上流から下流にむけての順序を保ったまま、特定の単位領域DNAを選択的に削除して連結した変異DNAライブラリーを一度のPCRで構築することができる。
PCRの反応緩衝液、及び酵素等はそれ自体既知の適当なものを用いることができるが、好ましくは、ランダムライブラリーを作製する場合にはVent DNA Polymerase(NEB社製)、また選択的スプライシングライブラリーを作製する場合にはKOD Dash Polymerase(東洋紡社製)が用いられる。
PCRに供する連結単位領域DNA量はDNAの増幅反応が起こる量であれば特に制限はない。具体的には、PCRを50μlの反応スケールで行う場合には、合計量で300〜1500fmol、好ましくは500〜1300fmolが適当である。
また、PCRの条件としては、該連結単位領域DNAを鋳型としてDNA増幅反応が起こるものであればいかなるものであってもよい。各連結単位領域DNAの重複する配列の長さや、単位領域DNAの長さ、あるいは最終的に構築したい連結単位領域が連結されたDNAの長さ等によって好ましいものを、バイオ実験イラストレイテッド3、細胞工学別冊、中山広樹著、秀潤社(1993)第一章、p.13−43に記載されているようにして適宜選択、調整して用いることができる。具体的には、DNA変性(denature)反応を94〜96℃、好ましくは95℃で15〜60秒、好ましくは20〜40秒行い、プライマー結合(annealing)を50〜70℃、好ましくは55〜65℃で15〜60秒、好ましくは20〜40秒行い、続いてポリメラーゼ伸張(elongation)反応を70〜74℃、好ましくは72〜73℃で1〜5分、好ましくは2〜3分行うことを1サイクルとして、15〜40サイクル、好ましくは20〜30サイクル行うのが適当である。
上記PCRにおいてプライマーは特に必須ではないが、適当なプライマーを用いて行うこともできる。プライマーを使用してPCRを行うことの利点は、プライマーと相補的な配列を両末端に有するDNAが選択的に増幅されるため、構築されたDNAの両末端に任意の単位領域DNAまたは共通DNA含む単位領域を有するものを選択的に取得できることや、構築されたDNAの量が増えるためPCRの反応物を分離する際等に見やすいこと等が挙げられる。プライマーの量としては、フォワード、リバースプライマーがそれぞれ10〜60pmol、好ましくは20〜40pmolが適当である。
構築されるべきDNAの両末端となるべき単位領域DNAを固定した変異DNAライブラリーを構築する場合には、構築されるべきDNAの両末端となるべき単位領域DNAと相補的な配列を有するプライマーの存在下で行うことが好ましい。
上記したようにPCRを行うことにより、2以上のクローンを含むDNAライブラリーを取得することができる。「2以上のクローンを含むDNAライブラリー」とは、取得されたライブラリーに含まれるDNAが異なる配列を有する2以上のクローンから成るライブラリーを意味する。
このPCR反応緩衝液に適当なマンガンイオンを存在させることにより、本発明のDNAライブラリーを作製する際、同時に各DNA配列にある頻度で塩基置換を誘起することができる。このマンガンイオン源として具体的には、塩化マンガン等が挙げられる。PCR緩衝液中のマンガンイオン濃度は、誘起しようとする塩基置換の頻度に応じて選択される。塩基置換の頻度とマンガンイオン濃度の連関は、マンガンイオンの濃度を変えたPCRを行って、得られたDNAライブラリーに含まれるDNA断片の塩基配列を解析し、該DNAに誘起された塩基置換率を調べることにより特定することができる。この関数として例えば、実施例3の表2に記載された値等を用いることができる。その他の方法としては、dNTPの組成を変化させることによって、作製される変異DNAライブラリーに含まれる各DNA配列に塩基置換を誘起することもできる。
(5)共通DNA配列を有する連結単位領域DNAを鋳型としたPCR
上記した連結単位領域DNAを鋳型としたPCRの好ましい態様として、構築されるべきDNAの両末端にそれぞれ異なる共通の配列が付加されるような連結単位領域DNAを選択して鋳型とし、かつ該共通DNA配列に相補的な配列を有するプライマーを用いてPCRを行う方法が挙げられる。この方法により両末端に共通DNA配列を有する変異DNAライブラリーを選択的に構築・取得することができる。
共通DNA配列とは、15〜100塩基対程度の長さの適当な配列でよいが、構築されるDNAを後述する変異プロテインライブラリーの作製に用いる場合には、5’末端の共通配列を適当なプロモーター配列とすることが好ましい。
共通DNA配列として用いられるプロモーター配列としては、該DNAを発現させる宿主中で該DNAがコードするタンパク質が発現するものであれば特に制限は無い。具体的には、宿主微生物が大腸菌の場合にはT3、T7、SP6、tac、あるいはlacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等が挙げられる。また動物培養細胞の場合にはSV40プロモーター、CMVプロモーター等が挙げられる。
共通DNA配列の連結単位領域DNAへの付加方法としては、単位領域DNAの1つとして共通配列を有する2本鎖DNAを上記(1)に記載した単位領域DNAの作製方法と同様の方法で作製し、これを上記(2)に記載した連結単位領域DNAの作製方法と同様の方法で連結することができる。具体的には、所望の5’末端側共通DNA配列と単位領域DNA、及び3’末端側共通DNA配列と単位領域DNAを、上記連結単位領域DNAを作製したときと同様の操作で連結する。次に、得られた5’末端側共通DNA配列と単位領域DNAの連結体、及び3’末端側共通DNA配列と単位領域DNAの連結体については、5’側共通DNA配列をフォーワードプライマー、それに連結された単位領域DNAの3’末端の遺伝子配列をリバースプライマーとして、3’末端側は3’側共通DNA配列をリバースプライマー、それに連結された単位領域DNAの5’末端のDNA配列をフォーワードプライマーとしてPCRを行うことにより作製される。
また、前述した連結単位領域DNAを作製するためのPCRにプライマーとして5’、または3’末端に共通配列を付加した単位領域DNAの末端配列と相補性を有するプライマーを用いることによっても付加することができる。
このようにして作製した共通DNA配列を含む連結単位領域DNAは、これを他の連結単位領域DNAと混合してPCRを行う。他の連結単位領域DNAの選択方法及び混合率等は、上記(4)に記載のものと同様にして行うことができるが、詳細には以下に述べる通りである。
本発明の方法により作製する変異DNAライブラリーのうちランダムライブラリーにおいて、5’末端あるいは3’末端に共通配列を有し、かつ組換えに用いる単位領域DNAの全ての組み合わせが行われた変異DNAを得る目的の場合には、用いられる単位領域DNAの全ての組み合わせで連結された連結単位領域DNAと、用いられる全ての単位領域DNAの5’末端あるいは3’末端に共通配列を付加した連結単位領域を選択して混合し、これを鋳型としてPCRを行えばよい。この場合、2つの単位領域DNAが連結された連結単位領域DNAを用いるのが好ましい。具体的にはn種類の単位領域DNAを用いて、2個の単位領域を連結した連結単位領域DNAにより、5’末端あるいは3’末端に共通配列を有するn個の単位領域DNAの連結体DNAをPCRにより作製する場合、nの連結単位領域DNA、及び2n個の5’末端あるいは3’末端に共通配列を有する連結単位領域DNAを混合し、これを鋳型として用いたPCRを行えば、用いられる単位領域DNAの全ての組み合わせで連結され、かつ5’末端あるいは3’末端に共通配列を有するランダムDNAライブラリーを得ることができる。
また、選択的スプライシングライブラリーにおいては、共通DNA配列を含む連結単位領域DNAは、これを特定の比率で混合しこれを鋳型としてPCRを行うことにより、一度のPCRで構築することができる。
得られた共通DNA配列と各単位領域DNAの連結単位領域DNAは共通DNA配列と連結させる単位領域の間にそれらが存する構造遺伝子DNAにおいて隔てている単位領域の数(X:但しXは、分断された単位領域がL個のとき、0以上L−1以下の整数である)にもとづいて上記(3)に記載したようにして混合割合を算出し、その他の連結単位領域DNA群とともに混合してPCRを行うことにより行う。
具体的にはあるタンパク質をコードするDNAを5個の単位領域DNAに分断したのち連結単位領域DNAを作製した場合、単位領域DNAを構造遺伝子のN末側から順に1、2、3、4、及び5とし、5’共通DNA配列をT、3’側共通DNA配列をCとすると、共通DNA配列TあるいはCと単位領域DNAが連結した連結単位領域DNAはT−1、T−2、T−3、T−4、T−5、1−C、2−C、3−C、4−C、5−Cの10種類が作製される。これらのうち共通DNA配列と単位領域DNAとが、それらが存在する構造遺伝子DNAにおいて0個の単位領域を隔てたもの(X=0)は、T−1、5−Cである。同様に1個の単位領域を隔てたもの(X=1)は、T−2、C−4、2個隔てたもの(X=2)はT−3、3−C、3個隔てたもの(X=3)はT−4、2−C、4個隔てたもの(X=4)はT−5、1−Cであるので各Xの値からPCRに供する該連結単位領域DNAの混合割合を算出することができる。
このように選択して混合した共通配列を有する単位領域DNAを含む単位領域DNA群を鋳型としたPCRには5’末端あるいは3’末端に付加される共通DNA配列と相補的な配列を有するプライマーを用いることが必要である。
PCRの反応緩衝液、酵素、及び反応条件等は上記(4)に記載の方法に準じて行うことができる。ただし、共通配列を含む連結単位領域DNAについては、より好ましくは、PCRを50μlの反応スケールで行う場合には合計量で、5〜30fmol、好ましくは10〜20fmolを用いる。
(6)選択的スプライシングライブラリー構築方法の原理
本発明の変異DNAライブラリーのうち、選択的スプライシングライブラリーの構築方法の原理について、図3の5個の単位領域から構成されるタンパク質を例に説明する。この場合、これらを構造遺伝子において上流から下流にむけての順序を保つように2つずつ連結した連結単位領域DNAは=10種類考えられる。これらの連結単位領域DNAは、それがコードしている単位領域によって4通りに分類される(図3b)。構築しようとする選択的に適当な単位領域が削除されて連結された変異タンパク質が、5個の単位領域から選択された3個の単位領域が含まれるタンパク質である場合、その変異タンパク質の構造は=10通りが考えられる(図3c)。
次に上記に示された10種類の配列中に見出される連結単位領域を数え上げ、それらを図3bに基づいて分類する。その結果、単位領域をコードするタンパク質のN末側から順にN、N+1、N+2、N+3、N+4とした場合、N−N+1(隔てている単位領域の数(X)=0)が12個、N−N+2が6個、N−N+3が2個、N−N+4が0個となる。
この値を参照し、5個の単位領域から構成されるタンパク質から適当な2個の単位領域を削除して連結したタンパク質の集団(本例の場合10種類)をコードするDNAライブラリーを効率よく得られるためには、連結単位領域DNA、N−N+1(隔てている単位領域の数(X)=0):N−N+2:N−N+3:N−N+4=6:3:1:0の比率で混合し、これらを鋳型としてPCRを行えばよいことがわかる。
上記を一般式にあてはめると、タンパク質をコードする構造遺伝子DNAをL個の単位領域DNA(但しLは任意の整数である)に分割して、そのうちのM個を選択的に削除して連結した変異DNAライブラリーをPCRで作製する場合、鋳型となる2個の上記単位領域DNAを構造遺伝子において上流から下流にむけての順序を保つように連結した連結単位領域DNAが構造遺伝子上で隔てている単位領域の数(X)としたとき、下記式(1)によりそのDNAの割合を算出することができる。
L−X−1M−X   (1)
(7)変異DNAライブラリーの精製
上記(4)または(5)に記載したPCRにより増幅され構築されたDNAライブラリーに含まれるDNA断片は、アガロースゲル等を用いた電気泳動等により確認することができる。
また、上記アガロースゲル等を用いた電気泳動により、単位領域が種々の個数で連結したDNAの混合物から、任意の長さのDNAのみで構成される変異DNAライブラリーを取得したり、単位領域DNAが目的の個数連結したDNAが最も多く含まれる変異DNAライブラリーを取得することができる。この場合、低融点アガロースゲルを用いるのが好ましく、該ゲル中でDNAを電気泳動し、任意の長さのDNAが含まれる部分を切り出し、切り出したゲル中からそれ自体既知の方法を用いてDNAを抽出して精製することができる。
かくして得られる変異DNAライブラリーは、タンパク質−核酸相互作用を解析するためのDNAライブラリー、あるいはRNAライブラリーとして用いることもできる。また、これを適当なベクターに導入し、該組換えベクターを適当な宿主に形質転換するか、あるいは転写後無細胞翻訳系において発現させる等の方法により、該DNAライブラリーに含まれるDNAがコードするタンパク質のライブラリー(以下、これを「変異プロテインライブラリー」と称することがある)を作製するのに用いられる。
(8)変異DNAライブラリーのベクターへの導入、及び変異プロテインライブラリーの作製
組換えベクターの作製に用いられるベクターとしては、宿主微生物または培養細胞中で本発明の変異DNAライブラリー中に含まれるDNAを発現し得るものであれば特に制限はないが、通常宿主微生物または培養細胞に適したプロモーターが挿入されている市販のタンパク質発現用ベクターを用いることができる。一方、上述したように、変異DNAライブラリーを構築する際のPCRの鋳型として用いる連結単位領域DNAの5’末端に、共通DNA配列として適当なプロモーター配列を付加したものを用いた場合には、通常のクローニング用のベクターを用いることができる。また、上記のようなプロモーター配列DNAが5’末端に付加されていない変異DNAライブラリーであっても、これを適当なプロモーター配列DNAが5’末端に連結するように挿入すれば、通常のクローニングベクターを用いることができる。
タンパク質発現用ベクターとしては、宿主微生物が大腸菌の場合では、例えばpET3、pET11(スタラタジーン社)、pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、また宿主が酵母の場合にはpESP−I expression vector(ストラタジーン社製)等が挙げられる。動物培養細胞を宿主として用いる場合には、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等、また昆虫細胞を用いる場合にはBacPAK6(クロンテック社製)等を用いることができる。
本発明の変異DNAライブラリーに含まれるDNAを発現させるためのプロモーターとしては、宿主微生物または培養細胞が保有するプロモーターを一般的に用いることができるが、これに限られるものではない。具体的には、宿主微生物が大腸菌の場合にはT3、T7、SP6、tac、lacプロモーターを用いることができる。また酵母を宿主とする場合には、nmt1プロモーター、Gal1プロモーター等が挙げられる。また動物培養細胞の場合にはSV40、CMVプロモーター等が挙げられる。
これらのベクターへの本発明の変異DNAライブラリーに含まれるDNAの挿入は、該DNA断片がベクター中において上記プロモーターの下流に存在するようにDNAリガーゼ等を用いて連結することにより行うことができる。
かくして得られる組換えベクターは、これをそれ自体既知の適当な方法によって適当な宿主に導入することにより、形質転換体を作製することができる。具体的な宿主への導入方法としては、ヒートショック法(J.Mol.Biol.,53,154−(1970))、リン酸カルシウム法(Science,221,551−(1983))、DEAEデキストラン法(Science,215,166−(1982))、電気パルス法(Proc.Natl.Acad.Sci.USA,81,7161(1984))、インビトロパッケージング法(Proc.Natl.Acad.Sci.USA,72,581(1975))、あるいはウィルスベクター法(Cell,37,1053(1984))等が挙げられる。
この時、該DNAを導入する宿主としては、該DNAを含むタンパク質発現組換えベクターにより宿主体内で該DNAがコードするタンパク質が発現可能なものであればいかなるものであってもよいが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウィルス)−昆虫細胞、動物細胞、動物培養細胞等が挙げられる。
具体的には、大腸菌ではBL21、XL−1−Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)、バキュロウィルスではAcNPV(J.Biol.Chem.,263,7406(1988))とその宿主であるSf−9(J.Biol.Chem.,263,7406(1988))等が挙げられる。また動物培養細胞としてはマウス繊維芽細胞C127(J.Viol.,26,291(1978))やチャイニーズハムスター卵巣細胞CHO(Proc.Natl.Acad.Sci.USA.,77,4216(1980))やアフリカミドリザル腎臓細胞COS(ATCC:CRL1651)等が挙げられる。
かくして得られた形質転換体は、これをそれぞれに適した方法により、適当な培地で培養することにより変異DNAライブラリーのDNAがコードするタンパク質の発現を誘導することができる。培養に用いる培地中には、該形質転換体の生育に必要な炭素源、窒素源、無機物、ビタミン、血清及び耐性スクリーニングに用いられる薬剤等が含有される。具体的には、形質転換体の宿主が大腸菌の場合には例えば、LB培地(ナカライテスク社製)等、酵母の場合にはYPD培地(Genetic Engineering,1,117,Plenum Press(1979))等、昆虫細胞、動物細胞、及び動物培養細胞の場合には、20%以下のウシ胎児血清を含有するMEM培地、DMEM培地、RPMI1640培地(シグマ社製)等を用いることができる。
形質転換体の培養は、通常、温度が20〜45℃、pHが5〜8の範囲で行われ、必要に応じて通気や攪拌が行われる。これら以外の培地組成あるいは培養条件下でも形質転換体が生育し、導入されたDNAがコードするタンパク質が生成されれば特に制限されない。
得られた培養物から細胞あるいは菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム及び/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製タンパク質を得ることができる。かくして、変異プロテインライブラリーが作製される。
(9)変異DNAライブラリーの無細胞翻訳系による発現、及び変異プロテインライブラリーの作製
上記したタンパク質発現組換えベクターを用いる発現方法の他に、変異DNAライブラリーを転写することにより得られるRNAライブラリーを無細胞翻訳系に供することによりタンパク質発現を誘導し、変異プロテインライブラリーを作製することができる。該DNAライブラリーの転写は、それ自体既知の通常用いられる方法によることができるが、無細胞転写翻訳系を用いて翻訳と同時に行うことができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写及びmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。
無細胞転写翻訳系の具体例としては、真核細胞及びバクテリア細胞又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられ、特に好ましい具体例としては、ウサギ網状赤血球、小麦胚芽、大腸菌からの抽出液(大腸菌S30抽出液)に基づいて調製された転写翻訳系が挙げられる。
得られた無細胞転写翻訳系の転写翻訳産物からの、変異DNAライブラリーがコードするタンパク質の分離及び精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
(10)変異プロテインライブラリーのスクリーニング
上記(8)または(9)で得られた変異プロテインライブラリーは所望の性質を有することを指標としたスクリーニングに供することができる。所望の性質を有するタンパク質とは、所望の標的分子に結合するタンパク質、所望の化学反応を触媒するタンパク質、上記したタンパク質の結合能、触媒能、基質特異性、熱安定性及び環境条件が改変されたタンパク質等をいう。
目的とする生物活性により所望の性質を有するタンパク質を選択する方法としては、標的分子との結合能を指標にして選択する方法と、触媒活性を指標にして選択する方法が挙げられる。これら結合能または触媒活性を指標として、例えば、親和性樹脂吸着法、免疫沈降法、電気泳動法、クロマトグラフィー法、フローサイトメトリー法等を利用して所望の性質を有するタンパク質を選択することができる。より具体的には、タンパク質、核酸(DNAまたはRNA)、糖質、脂質等の標的分子を、予めマイクロプレートやビーズ等の固相に結合させておき、これに上記で構築された変異プロテインライブラリーを加え、適当な温度条件で、一定時間反応させた後に洗浄し、標的分子に結合した変異タンパク質を選択する方法が挙げられる。この方法は、既に確立しているEnzyme Linked Immunosorbent Assay(ELISA)(Crowther,J.R.,1995,Method in Molecular Biology,Vol.42,Humana Press Inc.)に準じて行うことができる。
触媒活性を指標として所望の性質を有するタンパク質、例えば酵素タンパク質を選択する際、例えば、次の2つの方法を用いることができる。その1つは触媒抗体の場合のように、所望の触媒反応の遷移状態アナログを固定化した樹脂に結合するタンパク質を選択する方法である(Tramontano,A.et al.(1986)Science,234,1566−1570)。もう1つはRNA酵素(リボザイム)の場合のように、触媒活性による分子の結合・切断によって、変異プロテインライブラリーに含まれるタンパク質が樹脂に結合・解離されるように工夫する方法である(Gold,L.et al.(1995)Annu.Rev.Biochem.,64,763−797)。前者の選択法は酵素活性のターンオーバーを増やすことが難しいのに対して、後者の選択法は、リボザイムの多くの成功例が示しているように、結合ではなく最初から触媒活性で選択する方法であり、後者の方法が有効である。
また、触媒抗体が抗体構造によって制限されることも、天然酵素ほどの活性をもつものが得られていない理由の1つである。本発明では、リボザイム型の選択法が利用可能であり、タンパク質の構造の選択範囲も抗体に限らず自由なので、従来の触媒抗体を越えた新規触媒タンパク質の創出に大きく寄与することが期待できる。
(11)所望の性質が改良されたタンパク質の取得
上記(10)に記載のスクリーニング方法により選択されたタンパク質は、これをコードするDNAを調製し、該DNAに変異を導入し、変異を導入したDNAを増幅し、増幅したDNAを発現させ新たな変異プロテインライブラリーを作製し、該ライブラリーを用いて所望の性質を指標としてタンパク質を選択することにより所望の性質が改良されたタンパク質を取得することができる。また、このように取得されたタンパク質も、上記の操作を繰り返すことによれば所望の性質がさらに改良されたタンパク質を取得することもできる。
所望の性質を有することを指標として選択されたタンパク質がコードするDNAを調製する方法としては、そのタンパク質を産出する形質転換体中からそれ自体既知の方法により回収し、PCR等を用いて増幅する方法を用いることができる。PCRによる所望のタンパク質をコードするDNAの増幅には、変異DNAを挿入したベクターの配列に相補的な配列を有するプライマー、あるいは共通DNA配列を有する連結単位領域を用いた場合には該共通DNA配列に相補的な配列を有するプライマーを用いればよい。
また、増幅されたDNAへ変異を誘発させる方法としては、既に確立しているError−prone PCR(Leung,D.W.et al.(1989)J.Methods Cell.Mol.Biol.,1,11−15)やSexual PCR(Stemmer,W.P.C.(1994)Proc.Natl.Acad.Sci.USA,91,10747−10751)を用いることができる。
このようにして得られた所望の性質がさらに改良されたタンパク質はそれ自体既知の方法により分離精製し、取得することができる。
(12)核酸−タンパク質連結分子を利用した所望の性質が改良されたタンパク質の取得
上記(11)に記載した所望の性質が改良されたタンパク質の取得方法は、タンパク質とそれをコードする核酸が対応づけられて連結している核酸−タンパク質連結分子を用いると更に効率よく実施することができる。核酸−タンパク質連結分子は、ファージ・ディスプレイ法(Smith,G.P.(1985)Science 228,1315−1317)、リボソーム・ディスプレイ法(Hanes,J.and Pluckthun,A.(1997)Proc.Natl.Acad.Sci.USA 94,4937−4942)、試験管内ウィルス法(Nemoto,N.et al.(1997)FEBS Lett.414,405−408;Roberts,R.W.and Szostak,J.W.(1997)Proc.Natl.Acad.Sci.USA 94,12297−12302;国際公開WO98/16636号公報)、STABLE法(Doi,N.et al.(1999)FEBS Lett.457,227−230)等の方法により調製することができる。
ファージ・ディスプレイ法は、大腸菌に感染して増殖するファージを利用する方法である。ファージ粒子はファージを構成する外被蛋白質がそれ自身をコードするDNAを包み込む形態をしている。DNAをファージの外被蛋白質遺伝子に挿入しこれを発現させることにより、ファージ粒子の表面に該DNAがコードするペプチドが提示されたファージライブラリーが作製できる。つまり間接的ではあるが、ファージ粒子の表面に提示されているタンパク質とファージ体内に存在するDNAとが対応つけられて存在している。提示しているペプチドのうち所望の性質を有することを指標として選択したファージ内からDNAを回収することにより、提示されたペプチドをコードするDNAを取得することができる。
リボゾーム・ディスプレイ法では、終止コドンを除いたmRNAを無細胞翻訳系等を用いて翻訳させる際、合成されたタンパク質をリボゾーム上にトラップさせる。この結果、タンパク質−リボゾーム−mRNA複合体が作製され、タンパク質−核酸連結分子として利用することができる。リボソーム上にトラップされたタンパク質のうち所望の性質を有することを指標として選択されたタンパク質を結合したリボソームから該タンパク質をコードするDNAを取得することができる。
試験管内ウイルス法では、mRNAを無細胞タンパク質合成系等において発現させる際、リボソーム上でmRNAとタンパク質が化学的に結合したmRNA−タンパク質連結分子を構築することができる。さらに、そのmRNA−タンパク質連結分子(in vitro virus)を試験管内淘汰法により淘汰し、選択されたin vitroウイルスのmRNA部分を逆転写PCRにより増幅して取得することができる。
STABLE法は、DNAに予め結合させたビオチン等のリガンド物質と特異的に結合するタンパク質、例えばストレプトアビジン等のアダプタータンパク質を、該DNAがコードするタンパク質と融合タンパク質として発現させ、このリガンドとアダプタータンパク質の結合を介してタンパク質と核酸を結合させる方法である。具体的には、例えば、予めDNAの末端にビオチンを化学的に結合させておき、該DNAを無細胞転写翻訳系等で発現させる。この時、1分子のDNAをマイクロカプセル等の中に隔離した状態で発現させる。生成されたタンパク質は該マイクロカプセル内に存在するDNAに結合しているリガンド、例えばビオチンと融合タンパク質として発現しているアダプタータンパク質、例えばストレプトアビジンとの結合を介して結合し、タンパク質−DNA連結分子が作製される。この連結分子のタンパク質部分が所望の性質を有することを指標として選択された連結分子のDNA部分をPCR等により増幅することにより、選択されたタンパク質をコードするDNAを取得することができる。
このような核酸−タンパク質連結分子を用いて取得した所望の性質を有するタンパク質をコードするDNAも、上記(11)と同様にこれに変異を導入し、変異を導入したDNAを増幅し、増幅したDNAを発現させ新たな変異プロテインライブラリーを作製し、該ライブラリーを用いて所望の性質を有することを指標としてタンパク質を選択することにより所望の性質が改良されたタンパク質を取得することができる。また、このように取得されたタンパク質も、上記の操作を繰り返すことにより所望の性質がさらに改良されたタンパク質を取得することもできる。かくして得られた所望の性質がさらに改良されたタンパク質はそれ自体既知の上記した方法により分離精製し、取得することができる。
所望の性質を有するタンパク質のスクリーニングは、上記(10)に記載の方法と同様に行えばよい。
(13)所望の性質を有するタンパク質をコードするDNAの取得
上記(10)、(11)あるいは(12)に記載された所望の性質を有するタンパク質を解析し、これをコードするDNAを取得することにより、該タンパク質の組み換え体を作製することができる。
タンパク質をコードするDNAは、上記(10)または(11)に記載のスクリーニング方法により取得されたタンパク質の場合、それ自体既知の通常用いられる方法を適宜組み合わせて解析、取得することができる。具体的には、選択的スプライシングライブラリーから得られたタンパク質の場合、例えば、(1)タンパク質の分子量を質量分析計等を用いて測定し、(2)この分子量から該タンパク質に含まれる単位領域の種類及び数を計算することによって同定することができる。同定されたDNA配列を有するDNA断片は上記(2)に記載の連結単位領域DNAの作製方法と同様にして作製することができる。
また、ランダムライブラリーから得られたタンパク質の場合には、例えば、該タンパク質のアミノ酸配列を公知の方法で解析し、得られたアミノ酸配列から含まれる単位領域の種類及び結合順序を同定することができる。同定されたDNA配列を有するDNA断片は上記(2)に記載の連結単位領域DNAの作製方法と同様にして作製することができる。
また、上記(12)に記載のスクリーニング方法により取得されたタンパク質の場合、得られた核酸−タンパク質連結分子の核酸部を逆転写PCR、またはPCR法により増幅して取得することができる。
また、本明細書において、DNAの単離、調製、連結、及び合成、あるいは形質転換の方法、プラスミドの構築、形質転換体の培養等の操作は、特に明記しない限り、Sonmbrook,J.et al.(1989)Molecular Cloning,2nd Edition,Cold Spring Harbor Laboratory Pressに記載の方法又はそれに準じた方法により行うことができる。
本出願が主張する優先権の基礎となる日本特許出願である特願2000−293692号及び特願2001−29138号の明細書に記載の内容は全て本明細書の開示の一部として本明細書中に引用するものとする。
以下、本発明を実施例により具体的に説明するが、下記の実施例は本発明についての具体的認識を得る一助とみなすべきものであり、本発明の範囲は下記の実施例により何ら限定されるものではない。
実施例
(実施例1)
(1)単位領域DNAの作製
グルタミニル−tRNA合成酵素のジヌクレオチド結合部位の全領域とアクセプタドメインの一部(Rould,M.A.et al.(1989)Science 246,1135−1142)は、150残基のアミノ酸から構成される(Hoben,P.et al.(1982)J.Biol.Chem.,257,11644−11650)。このジヌクレオチド結合部位の全領域とアクセプタドメインの一部に相当する領域を6等分した25アミノ酸残基をコードするDNA、75塩基対を単位領域DNAとした(1〜6;配列番号:1〜6)。単位領域DNA断片は化学合成(エスペックオリゴサービス)により作製した。また、5’共通配列としてT7プロモーター配列を含むDNA断片(T7;配列番号:19)を化学合成(エスペックオリゴサービス)により作製した。同様に3’共通配列(Ex;配列番号:20)も化学合成(エスペックオリゴサービス)により作製した。
各単位領域合成DNA断片、及び共通配列合成DNA断片はアニールを行い2本鎖にして、各単位領域DNAの5’側の塩基配列と相同性を有するフォワードプライマー(F1〜F6;配列番号7〜12)と3’側の塩基配列と相同性を有するリバースプライマー(R1〜R6;配列番号8〜18)、及び各共通配列の5’側の塩基配列と相同性を有するフォワードプライマー(FT7;配列番号21、FEx;配列番号:23)と3’側の塩基配列と相同性を有するリバースプライマー(RT7;配列番号:22、REx;配列番号:24)(ダテコンセプト)を用いて増幅した。
各プライマーはPCRに先立ちリン酸化した。リン酸化反応溶液(30μl)は、20μlのDNA溶液、10mMのATP、1ユニットのポリヌクレオチドリン酸キナーゼ(New England Biolab社製)、および添付の10×反応緩衝液3μlを含む。PCRの反応液(50μl)は、各プライマー20pmol、dNTPs 200μM、1ユニットvent DNAポリメラーゼ(New England Biolab社製)、および添付の10×vent DNAポリメラーゼ緩衝液5μlを含む。反応条件は、第1段階(1サイクル)95℃を5分;第2段階(30サイクル)95℃を30秒、60℃を30秒;第3段階(1サイクル)4℃を10分で行った。PCRで増幅した6個の単位領域DNA断片、5’共通配列DNA断片、及び3’共通配列DNA断片の合計8種類のDNA断片をフェノールとクロロホルムを用いて抽出した後、エタノール沈殿し、50μlのTE緩衝液に溶解した。
(2)連結単位領域DNAの作製
上記(1)で増幅し得られた8種類のDNA断片を以下の組み合わせで連結した。
T7−1、T7−2、T7−3、T7−4、T7−5、T7−6、1−2、1−3、1−4、1−5、1−6、1−Ex、2−3、2−4、2−5、2−6、2−Ex、3−4、3−5、3−6、3−Ex、4−5、4−6、4−Ex、5−6、5−Ex、6−Ex。
反応液は10μlのDNA溶液と10μlのligation high(東洋紡社製)を含む。反応は16℃で1時間行った。この反応を行った連結単位領域DNAの含有液を「連結反応液」と称する。
上記の連結反応生成物を鋳型DNAとして、それぞれ上記(1)で用いた適当なプライマーを用いて2つの単位領域DNAが連結した連結単位領域DNAを増幅した。増幅した連結単領域DNAは、T7−1、T7−2、T7−3、T7−4、T7−5、T7−6、1−1、1−2、1−3、1−4、1−5、1−6、1−Ex、2−1、2−2、2−3、2−4、2−5、2−6、2−Ex、3−1、3−2、3−3、3−4、3−5、3−6、3−Ex、4−1、4−2、4−3、4−4、4−5、4−6、4−Ex、5−1、5−2、5−3、5−4、5−5、5−6、5−Ex、6−1、6−2、6−3、6−4、6−5、6−6、6−Exの48種類である。
PCRの反応液(50μl)は、各プライマー20pmol、dNTPs 200μM、連結反応液1μl、1.5mM MgCl、1ユニットTaq DNAポリメラーゼ(東洋紡社製)、及び添付の10×Taq DNAポリメラーゼ緩衝液を含む。反応条件は、第1段階(1サイクル)95℃を5分;第2段階(30サイクル)95℃を30秒、60℃を30秒;第3段階(1サイクル)4℃を10分で行った。これらのPCR反応液をエタノール沈殿し、20μlの滅菌水に溶解後、低融点アガロースゲルを用いて電気泳動した。電気泳動後、目的のDNAバンドを切り出し、フェノール、クロロホルムを用いて抽出した後、エタノール沈殿し、60μlの滅菌水に溶解した。得られた連結単位領域DNAの濃度を260nmの吸光度を測定することにより求めた。全ての連結単位領域DNAの濃度は60〜100ng/μl程度であった。
得られた48種類の連結単位領域DNAをTOPO TA Cloning KIT(Invitrogen社製)を用いてクローニングした。クローニング手順はKITに添付されているプロトコール(TOPO TA Cloning Ver.K:Five Minutes Cloning of Taq Polymerase−Amplified PCR Products,Invitrogen)に従った。まず、連結単位領域DNAのPCR産物4μlとKITに添付されている塩溶液1μlとPCR−TOPO vector 1μlを混合し、25℃で5分間インキュベートした。次に2μlの反応溶液とKITに添付されているコンピテントセル50μlを混合し、氷上で30分間インキュベートした。その後、42℃で30秒間インキュベートした後、KITに添付されている250μlのSOC培地に全てのコンピテントセルを加え、37℃で30分間培養した。その後、50μg/mlのアンピシリンが添加されているLBプレートに50μlのSOCを塗布した。なお、LBプレートには、予め40μg/mlのイソプロピル−1−チオ−β−D−ガラクトシドガラクトース(IPTG)を24μl、40μg/mlのX−gal溶液を40μl塗布したものを用いた。
上記のLBプレートを12時間、37℃でインキュベートしたのち、プレート上に200個程度のコロニーを確認した。青色のコロニーを各連結単位領域DNAにつき3個ずつ選び、コロニーPCRにより目的の連結単位領域DNAがプラスミド上に含まれているか否かを調べた。ここで、白ではなく青コロニーを選んだ理由は、全ての単位領域DNA、及び共通配列DNAは3の倍数個の塩基対からなり、lacZ遺伝子にフレームシフトを起こさせず、活性に影響を及ぼさないと予想したからである。コロニーPCRの反応液(50μl)は、各プライマー20pmol、dNTP200μM、1.5mM MgCl、1ユニットTaq DNAポリメラーゼ(東洋紡社製)、および添付の10×Taq DNAポリメラーゼ緩衝液5μlを含む。なお、鋳型DNAとして、コロニーを滅菌水に懸濁したものを用いた。反応条件は、第1段階(1サイクル)95℃を5分;第2段階(30サイクル)95℃を30秒、60℃を30秒、72℃を30秒;第3段階(1サイクル)4℃を10分である。コロニーPCR産物をアガロース電気泳動で解析し、目的の連結単位領域DNAが増幅されていることを確認した後、生成物をWizard PCR Preps DNA Purification System(Promega社製)を用いて精製し、DNAシーケンサー(CEQ2000 DNA Analysis System;ベックマンコールター社製)により塩基配列の解析を行った。この塩基配列の解析により、作製された連結単位領域DNAに置換、挿入、欠失などの変異がないことを確認し、続くPCRの鋳型DNAとして用いた。
(3)変異DNAライブラリーの作製
上記(2)で作製された連結単位領域DNAのすべてを混合してPCRを行った。PCRの反応溶液(50μl)は、プライマーとしてT7のフォワードプライマー(配列番号:21)とExのリバースプライマー(配列番号:24)を各20pmol、単位領域1から6を含む連結単位領域DNA36種を合計で750fmol、T7およびExを含む連結単位領域DNA12種を合計で15fmol、dNTPsを200μM、Vent DNA polymerase(New England Biolab社製)を1ユニット、添付の10×vent DNA polymerase bufferを5μl含む。反応条件は、第1段階(1サイクル)95℃を5分;第2段階(20サイクル)95℃を30秒、60℃を30秒、72℃を3分;第3段階(1サイクル)4℃を10分である。得られたPCR産物をエタノール沈殿により濃縮後、低融点アガロースゲルを用いて電気泳動することにより、15本以上のラダー状のバンドを確認することができた(図2)。ラダーの間隔は75塩基対相当であることから、これらのラダーは、分子量が小さい方から順に、T7−(X)−Ex、T7−(X)−Ex、T7−(X)−Ex、・・・・・、T7−(X)15−Ex、・・の配列と予想される(「X」は単位領域1〜6のいずれか)。つまり、5’共通配列であるT7と3’共通配列であるExの内部で、6個の単位領域が種々の順序と個数で連結されている可能性が示された。
(4)変異DNAライブラリーの確認
上記(2)で得られたPCR産物が上記の推測通りの配列をもつか否かを調べる目的で、T7−(X)−Exに相当するDNAバンドを切り出し、クローニング後、塩基配列を解析した。まず、Wizard PCR Preps DNA Purification System(Promega社製)を用いてT7−(X)−Exに相当するDNAバンドを精製した。続いて、Taq DNA polymeraseを用いてdAを3’末端に付加させた後、TOPO TA Cloning KIT(Invitrogen)を用いてクローニングした。クローニングの手順は、IPTGとX−galが塗布されていないLBプレートを用いた点以外は上記(2)に記載したものと同様である。
LBプレートを12時間、37℃でインキュベートしたのち、プレート上に約100個のコロニーが確認できた。すべてのコロニーについてコロニーPCRを行い、インサートDNAが含まれているか否かを調べた。コロニーPCRの反応液(50μl)は、Kitに添付されているM13のフォワードおよびリバースプライマーを各20pmol、dNTP 200μM、1.5mM MgCl、1ユニットTaq DNAポリメラーゼ(東洋紡社製)、および添付の10×Taq DNAポリメラーゼ緩衝液5μlを含む。なお、鋳型DNAとして、コロニーを滅菌水に懸濁したものを用いた。反応条件は、第1段階(1サイクル)95℃を5分;第2段階(30サイクル)95℃を30秒、55℃を30秒、72℃を30秒;第3段階(1サイクル)4℃を10分である。コロニーPCR産物をアガロース電気泳動で解析した結果、66個のコロニーがインサートDNAを含んでいることが確認された。これらのコロニーPCR産物をWizard PCR Preps DNA Purification System(Promega社製)を用いて精製し、DNAシーケンサー(CEQ2000 DNA Analysis System、ベックマンコールター社製)により塩基配列を解析した。
インサートDNAが確認された66個の配列を解析した結果を表1に示す。表中の数字は、1〜6のDNA断片の連結順序を示す。66個の配列のうち64個の配列は、5’末端にT7、3’末端にExもち、内部の単位領域が様々な順序で連結された構造を有していた。つまり、上記の推測の通りの反応が起きていることが確認された。66個の配列の内訳はT7−(X)−Exが1個、T7−(X)−Exが1個、T7−(X)−Exが50個、T7−(X)−Exが5個、T7−(X)−Exが4個、T7−(X)−Exが3個、そして3’側にExを持たないT7−(X)の配列を持つものが2個であった。これらの中で、同じ配列を有するものは二組のみであり、64種の異なる配列が確認された。つまり、一度のPCRにおいて、6種の単位領域DNAが様々な異なる順序で連結された多くの構造遺伝子が同時に合成されたことが確認された。大腸菌を用いたクローニング後に解析された配列は、該PCRで作製されたDNAのごく一部であるため、このPCRにより作製された変異DNAライブラリーにはより多くの種類の構造遺伝子が構築されていると推測される。
解析した塩基配列に、T7−(X)−Ex以外の、より長いDNAや短いDNAが含まれていた理由としては、低融点アガロース電気泳動に於いて切り出した、T7−(X)−Exに相当するDNAバンドに、少数の長さの異なるDNAが存在していたためと考えられる。これらDNAも、5’側にT7、3’側にExをもち、その内部で単位領域DNAが様々な順序で連結された配列を有していた。
また、3’末端にExをもたなかった2種の配列に於いては、内部に連結されるべき連結単位領域DNA自身がプライマーとして働いたため生じた配列と推測される。また、T7−3−4−6−5−1−2−5−Exなる配列では、65の間で大きな欠失が見られた。これは、単位領域DNA6の5’側の15番目からの配列「gTACgACT」と、単位領域DNA5の5’側の3番目からの「gTACgACT」が同一配列であったため、それらの配列の間で組換えが起きたためと考えられる。
置換は、解析された40299塩基対中9ヶ所に見られた。すなわち、置換の頻度は5000分の1程度であり、Vent DNA ポリメラーゼを用いた通常のPCRでの置換の頻度(Mattila et al.(1991)Nucl.Acids.Res.,19,4967−4973)と比較して、2.5〜5倍高い頻度であった。しかし、この数値は進化分子工学のライブラリー構築という目的からは、充分許容できる範囲である。
本実施例におけるPCR産物のアガロース電気泳動において、15本以上のラダー状のDNAバンドが確認されたこと、解析したDNA配列において、大部分のものが異なった配列をもち、欠失などのフレームシフトを起こす変異が生じていなかったことなどから、6種類の単位領域を用いた場合、一度のPCRで次式で表されるように、615≒5×1011種類以上のストップコドンを含まない構造遺伝子の構築が可能である。

Figure 2002026964
Figure 2002026964
(実施例2)
(1)単位領域DNAの作製
ヒトエストロゲン受容体αのリガンド結合ドメイン(以下、「hERαLBD」と称することがある:Greene et al.(1986)Science,231(4742),1150−1154;Brzozowski et al.(1997)Nature,389(6652),753−758)は、258残基のアミノ酸から構成される。このhERαLBDの全領域を遺伝子のエクソン(Ponglikitmongkol et al.(1988)EMBO J.,11,3385−3388)とタンパク質の立体構造上の二次構造(Tanenbaum et al.(1998)Proc.Natl.Acad.Sci.USA.,95(11),5998−6003)の境界で10個の単位領域領域とした。各単位領域はN末端側からそれぞれ、34、35、29、17、26、37、24、17、20残基のアミノ酸をコードする(図4)ように、hERαLBDを含むプラスミドを鋳型として各単位領域DNA断片の5’側の塩基配列と相同性を有するフォワードプライマーと3’側の塩基配列と相同性を有するリバースプライマー(ダテコンセプトに依頼して作製した)を用いたPCRにより増幅して作製した(本プラスミドはシカゴ大学のG.L.Greene教授から分与されたものである)。
作製した単位領域はN末端側から1、2、3、4、5、6、7、8、9、10とした。プライマーは単位領域DNA1については、配列番号25及び26、単位領域DNA2については配列番号27及び28、単位領域DNA3については配列番号29及び30、単位領域DNA4については、配列番号31及び32、単位領域DNA5については、配列番号33及び34、単位領域DNA6については、配列番号35及び36、単位領域DNA7については、配列番号37及び38、単位領域DNA8については、配列番号39及び40、単位領域DNA9については、配列番号41及び42、また単位領域DNA10については、配列番号43及び44を用いた。またこれらの単位領域DNA以外に、5’末端共通配列DNA断片としてT7プロモーター配列を有するDNA断片(T7OM:配列番号45)、及び3’末端共通配列DNA断片(CBSHis:配列番号46)を化学合成により作製した(ダテコンセプト社に依頼)。この共通配列合成DNA断片を鋳型として、各DNA断片の5’側の塩基配列と相同性を有するフォワードプライマー(T7OM:配列番号47;CBSHis:配列番号49)と3’側の塩基配列と相同性を有するリバースプライマー(ダテコンセプトに依頼して作製した)(T7OM:配列番号48;CBSHis:配列番号50)を用いたPCRにより増幅して共通配列DNA断片を作製した。作製した共通配列を有するDNA断片は5’側をT7OM、3’側をCBSHisとした。
単位領域DNA、及び共通配列DNA断片の作製に用いるプライマーはPCRに先立ちリン酸化した。リン酸化反応液(30μl)は、DNA溶液(20pmol/μl)20μl、10mM ATP、ポリヌクレオチドリン酸キナーゼ(New England Biolab社製)、及び添付の10×反応緩衝液3μlを含む。リン酸化反応は37℃/12時間によって行った。
リン酸化したプライマーを用いて行ったPCRは、反応液(50μl)としてDNA溶液(20ng/μl)1μl、各プライマー20pmol、dNTPs200μM、2.5ユニットPfuDNAポリメラーゼ(STRATAGENE社製)、及び添付の10×PfuDNAポリメラーゼ反応緩衝液5μlを用い、反応条件が、第1段階(1サイクル)95℃/5分、第2段階(30サイクル)95℃/30秒、56℃/30秒、第3段階(1サイクル)4℃/10分で行った。PCRで増幅した上記した10個の単位領域DNA断片、及び2個の共通配列DNA断片はWizard PCR Preps(Promega社製)を用いて調製し、60μlの滅菌水に溶解した。
(2)連結単位領域DNAの作製
上記(1)で作製した12種類のDNA断片は以下の組み合わせでDNAリガーゼにより連結させた後に、この連結単位領域DNA断片を鋳型として第1の連結単位領域DNAの5’末端の配列と相同性を有するフォワードプライマー、及び第2の単位領域DNAの3’末端の配列と相同性を有するリバースプライマーを用いたPCRにより作製した。
T7OM−1、T7OM−2、T7OM−3、T7OM−4、T7OM−5、T7OM−6、T7OM−7、T7OM−8、T7OM−9、T7OM−10、1−2、1−3、1−4、1−5、1−6、1−7、1−8、1−9、1−10、1−CBSHis、2−3、2−4、2−5、2−6、2−7、2−8、2−9、2−10、2−CBSHis、3−4、3−5、3−6、3−7、3−8、3−9、3−10、3−CBSHis、4−5、4−6、4−7、4−8、4−9、4−10、4−CBSHis、5−6、5−7、5−8、5−9、5−10、5−CBSHis、6−7、6−8、6−9、6−10、6−CBSHis、7−8、7−9、7−10、7−CBSHis、8−9、8−10、8−CBSHis、9−10、9−CBSHis
DNAライゲースによる単位領域DNA断片の連結のための反応液はDNA溶液(10ng/μl)1μl、T4DNAリガーゼ400ユニット(New England Biolab社製)、添付の10×T4DNAリガーゼ反応緩衝液1μl、滅菌水6μlを含み、反応は16℃で1時間行った。この連結単位領域DNA断片を鋳型としたPCRの反応液(50μl)は、各プライマー20pmol、dNTPs 200μM、連結単位領域DNAを含む上記DNAリガーゼによる反応液1μl、1.5mM MgCl、Taq DNAポリメラーゼ(東洋紡社製)1ユニット、及び添付の10×Taq DNAポリメラーゼ反応緩衝液5μlを含む。反応条件は、第1段階(1サイクル)95℃/5分、第2段階(30サイクル)95℃/30秒、60℃/30秒、第3段階(1サイクル)4℃/10分により行った。
得られた上記連結単位領域DNA断片はTOPO TA Cloning KIT(InVitrogen社製)を用いてクローニングした。クローニング手順はKITに添付されているプロトコール(TOPO TA Clonig,Ver.K:Five minutes cloning of Taq polymerase−amplified PCR products,Invitrogen)に従い、ベクターは添付のものを使用した。具体的には、まず、上記で作製した全連結単位領域DNA断片のPCR反応液4μl、添付の塩溶液1μl、及びPCR TOPO vector 1μlを混合し、25℃で5分間インキュベートした。
次に2μlの上記反応液と添付のコンピテントセル50μlを混合し、氷上で30分間インキュベートした。その後42℃で30秒間インキュベートした後、添付のSOC培地250μlを加え、37℃で30分間インキュベートした。このうちの50μlを50μl/mlのアンピシリンが予め添加されているLBプレートに40μg/mlのイソプロピル−1−チオ−β−ガラクシドガラクトース(IPTG)を24μlと、40μg/mlのX−gal溶液40μlを塗布した後、塗布した。
上記LBプレートを12時間、37℃でインキュベートした後、プレート上に200個程度のコロニーを確認した。青色のコロニーを各連結単位領域DNAにつき3個ずつ選択し、コロニーPCRにより目的の連結単位領域がプラスミド上に含まれているかを確認した。ここで、青色のコロニーを選択した理由は、全ての単位領域DNAは3の倍数の塩基配列を有しているためlacZ遺伝子にフレームシフトを起こさせず活性に影響を及ぼさないと予想したからである。上記コロニーPCRの反応液は、TOPO TA Cloning KITに添付されているM13プライマー、及びM13Rev.プライマー(InVitrogen社製)社製)各20pmol、dNTPs 200μM、1.5mM MgCl、TaqDNAポリメラーゼ(東洋紡社製)1ユニット、添付の10×Taq DNAポリメラーゼ反応緩衝液5μl、及びコロニーを滅菌水に懸濁した溶液を含み、反応条件は第1段階(1サイクル)95℃/5分、第2段階(30サイクル)95℃/30秒、60℃/30秒、72℃/30秒、第3段階(1サイクル)4℃/10分によりPCRを行った。
このコロニーPCR反応液をアガロースゲル電気泳動により解析し、目的の連結単位領域DNA断片が増幅されていることを確認した後、生成物をWizard PCR Preps DNA Purification System(Promega社製)を用いて精製し、DNAシーケンサー(CEQ2000 DNA Analysis System:ベックマンコールター社製)による塩基配列解析を行った。塩基配列を解析後、置換、挿入、欠失などの変異がないことを確認した。
ここで正しい塩基配列を有していることが確認された連結単位領域DNAを含むプラスミドを鋳型として、(1)に示した各連結単位領域DNAの第1の単位領域DNAの5’末端の配列と相同性を有するフォワードプライマー、及び第2の単位領域DNAの3’末端の配列と相同性を有するリバースプライマーを用いたコロニーPCRにより再度連結単位領域DNAを作製した。PCRの反応液(50μl)は、各プライマー20pmol、dNTPs 200μM、3.75ユニットPfuDNAポリメラーゼ(STRATAGENE社製)、及び添付の10×PfuDNAポリメラーゼ反応緩衝液5μlを含み、反応条件は第1段階(1サイクル)95℃/5分、第2段階(30サイクル)95℃/30秒、56℃/30秒、第3段階(1サイクル)4℃/10分で行った。
上記連結単位領域DNAを作製したPCR反応液から連結単位領域DNA断片をエタノール沈殿により濃縮し、20μlmの滅菌水に溶解後、低融点アガロースゲル電気泳動により分離し、目的のDNAのバンドを切り出した。このアガロースゲル断片からフェノール/クロロフォルムを用いてDNAを抽出し、これをエタノール沈殿し、60μlの滅菌水に融解した。得られた各連結単位領域DNA水溶液の濃度は260nmの吸光度を測定することにより求めた。ここで得られた連結単位領域DNAを続く変異DNAライブラリーを構築するためのPCRの鋳型DNAとした。
(3)連結単位領域DNAの分類
上記(2)で得られた全ての連結単位領域DNAはそれらがコードしている単位領域DNAによって分類した。分類は上記で作製した連結単位領域DNAの第1の単位領域DNAと第2の単位領域DNAが、それらが存在する構造遺伝子DNAにおいて何個の単位領域を隔てたものが連結されているかを指標として行った。ここで第1の単位領域DNAと第2の単位領域DNAとがそれらが存在する構造遺伝子DNAにおいて隔てている単位領域の数をXとすると、作製した連結単位領域DNAはX=0からX=8の9種類に分類することができた(図5(a))。
(4)8個の単位領域DNAが連結された変異DNAライブラリーの構築
上記(3)で分類した連結単位領域DNA群を鋳型として、8個の単位領域DNAが連結された変異DNAライブラリーを作製した。各連結単位領域DNA群について、構造遺伝子を分けた連結単位領域の総数(L)を10、単位領域の総数と作製するDNAに含まれる単位領域DNA数との差(M)を2とし、第1の単位領域DNAと第2の単位領域DNAとがそれらが存在する構造遺伝子DNAにおいて隔てている単位領域の数(X)について、下記式(1)
L−X−1M−X   (1)
にあてはめて各連結単位領域DNA群のPCRに供するDNAの総量に占める割合を決めた。
上記(3)の分類でX=0の分類に入った連結単位領域DNA群は36、T7OM−1は36、10−CBSHisXは36、X=1の連結単位領域DNA群は8、T7OM−2は8、9−CBSHisXは8、X=2の連結単位領域DNA群は1、T7OM−2は1、8−CBSHisXは1となった。
具体的なDNA量としては、変異DNAライブラリーを作製するためのPCRにはDNAの総量として675fmolを用いたので、X=0の連結単位領域DNA群のDNAの総量は180fmolとなり、該分類に入る連結単位領域DNA(1−2、2−3、3−4、5−6、7−8、8−9、9−10)を26fmolずつ、T7OM−1を180fmol、10−CBSHisXを180fmol、X=1の連結単位領域DNA群のDNAの総量は40fmolとなるので該分類に入る連結単位領域DNA(1−3、2−4、3−5、4−6、5−7、6−8、7−9、8−10)を5fmolずつ、T7OM−2を40fmol、9−CBSHisXを40fmol、X=2の連結単位領域DNA群のDNAの総量は5fmolとなるので該分類に入る連結単位領域DNA(1−4、2−5、3−6、4−7、5−8、6−9、7−10)を0.7fmolずつ、T7OM−3を5fmol、8−CBSHisXを5fmolずつ混合してPCRの鋳型DNAとした。
PCR反応液(50μl)は、プライマーとしてT7OMのフォワードプライマーとCBPHisのリバースプライマーを各20pmol、上記混合鋳型DNAを675fmol、dNTPsを200μl、KOD Dash DNAポリメラーゼ(東洋紡社製)を1.25ユニット、添付の10×KOD Dash DNAポリメラーゼ反応緩衝液5μlを含み、反応条件が第1段階(1サイクル)95℃/5分、第2段階(20サイクル)95℃/30秒、60℃/30秒、72℃/3分、第3段階(1サイクル)4℃/10分によりPCRを行った。
上記PCR産物はエタノール沈殿により濃縮後、低融点アガロースゲル電気泳動により解析した結果、意図したとおりの分子量に相当する領域に強いDNAバンドを確認することができた(図6(a))。
(5)5個の単位領域DNAが連結された変異DNAライブラリーの構築
上記(3)で分類した連結単位領域DNA群を鋳型として、5個の単位領域DNAが連結された変異DNAライブラリーを作製した。各連結単位領域DNA群について、構造遺伝子を分けた連結単位領域の総数(L)を10、単位領域の総数と作製するDNAに含まれる単位領域DNA数との差(M)を5とし、第1の単位領域DNAと第2の単位領域DNAとがそれらが存在する構造遺伝子DNAにおいて隔てている単位領域の数(X)について、上記式(1)にあてはめて各連結単位領域DNA群のPCRに供するDNAの総量に占める割合を決めた。
上記(3)の分類でX=0の分類に入った連結単位領域DNA群は126、T7OM−1は126、10−CBSHisXは126、X=1の連結単位領域DNA群は70、T7OM−2は70、9−CBSHisXは70、X=2の連結単位領域DNA群は35、T7OM−3は35、8−CBSHisXは35、X=3の連結単位領域DNA群は15、T7OM−4は15、7−CBSHisXは15、X=4の連結単位領域DNA群は5、T7OM−5は5、6−CBSHisXは5、X=5の連結単位領域DNA群は1、T7OM−6は1、5−CBSHisXは1となった。
具体的なDNA量としては、変異DNAライブラリーを作製するためのPCRにはDNAの総量として1260fmolを用いたので、X=0の連結単位領域DNA群のDNAの総量は210fmolとなり、該分類に入る連結単位領域DNA(1−2、2−3、3−4、5−6、7−8、8−9、9−10)を30fmolずつ、T7OM−1を210fmol、10−CBSHisXを210fmol、X=1の連結単位領域DNA群のDNAの総量は117fmolとなるので該分類に入る連結単位領域DNA(1−3、2−4、3−5、4−6、5−7、6−8、7−9、8−10)を14.6fmolずつ、T7OM−2を117fmol、9−CBSHisXを117fmol、X=2の連結単位領域DNA群のDNAの総量は58fmolとなるので該分類に入る連結単位領域DNA(1−4、2−5、3−6、4−7、5−8、6−9、7−10)を8fmolずつ、T7OM−3を58fmol、8−CBSHisXを58fmol、X=3の連結単位領域DNA群のDNAの総量は25fmolとなるので該分類に入る連結単位領域DNA(1−5、2−6、3−7、4−8、5−9、6−10)を4fmolずつ、T7OM−4を25fmol、7−CBSHisXを25fmol、X=4の連結単位領域DNA群のDNAの総量は8.3fmolとなるので該分類に入る連結単位領域DNA(1−6、2−7、3−8、4−9、5−10)を1.6fmolずつ、T7OM−5を8.3fmol、6−CBSHisXを8.3fmol、X=5の連結単位領域DNA群のDNAの総量は1.7fmolとなるので該分類に入る連結単位領域DNA(1−7、2−8、3−9、4−10)を0.4fmolずつ、T7OM−6を1.7fmol、5−CBSHisXを1.7fmolずつ混合してPCRの鋳型DNAとした。
PCR反応液(50μl)は、プライマーとしてT7OMのフォワードプライマーとCBPHisのリバースプライマーを各20pmol、上記混合鋳型DNAを1260fmol、dNTPsを200μl、KOD Dash DNAポリメラーゼ(東洋紡社製)を1.25ユニット、添付の10×KOD Dash DNAポリメラーゼ反応緩衝液5μlを含み、反応条件が第1段階(1サイクル)95℃/5分、第2段階(20サイクル)95℃/30秒、60℃/30秒、72℃/3分、第3段階(1サイクル)4℃/10分によりPCRを行った。 上記PCR産物はエタノール沈殿により濃縮後、低融点アガロースゲル電気泳動により解析した結果、意図したとおりの分子量に相当する領域に強いDNAバンドを確認することができた。(図6(b))
(6)変異DNAライブラリーの確認
上記(4)及び(5)で得られたPCR産物が意図したとおりの配列を有するか否かを調べる目的で上記低融点アガロースゲル電気泳動により得られた強いDNAバンドを示す領域を切り出し、Wizard PCR Preps DNA Purification System(Promega社製)を用いてDNAを抽出精製した。続いてTaq DNAポリメラーゼを用いてdAを3’末端に付加させた後、TOPO TA Cloning KIT(InVitrogen社製)を用いて上記(2)と同様にクローニングした。この際、LBプレートはIPTGとX−Galを塗布していないものを用いた。
このLBプレートを12時間、37℃でインキュベートした後、プレート上に100個以上のコロニーを確認できた。40個以上のコロニーについて、上記(2)と同様の方法で、プラスミド内に含まれる(4)及び(5)で作製したPCR産物DNAの塩基配列を解析した。
上記(4)のPCR産物(8個の単位領域DNAが結合したもの)については、38クローンについて塩基配列を解析した。この結果を図7に示した。また(5)のPCR産物(5個の単位領域が結合したもの)については、33クローンについて塩基配列を解析した。この結果は図8に示した。いずれのPCRでも得られたDNA断片は全て5’末端にT7OM配列を3’末端にはCBSHis配列を有しており、内部の単位領域DNAが構造遺伝子において上流から下流にむけての順序を保ったまま様々に連結された構造を有していた。このことは、解析した71個のDNA断片の塩基配列中に出現した各単位領域の数が1/39個、2/30個、3/52個、4/34個、5/40個、6/43個、7/56個、8/32個、9/43個、10/40個であり、用いた単位領域の出現頻度に著しい偏りがみられなかたことにより確認できた。
また、上記で解析したDNA断片のうち同じ配列を有するものは図7で示した配列中1組あるのみであった。置換については、71クローン、47533塩基のうち、置換された塩基は60個であった。この変異率(1.3×10−3)は充分低く、ライブラリー構築の際の障害にはならないと判断した。実際に50箇所の置換のうち、ストップコドンがあったものは2箇所のみであった。さらに、意図せぬ領域で連結された配列が2種類存在した。1つは上記単位領域DNA1と単位領域DNA2の両方に共通に存在する「atgatc」での相同組換えが誘導されたことにより生じたものであった。もう1つは上記単位領域DNA5と単位領域DNA4両方に共通に存在する「ccaggga」と「ccagtga」間の相同組換えが誘導されたことにより生じたものであった。その他の配列にはフレームシフトを起こすような変異、つまり欠失や挿入は見られなかった。つまり本発明のPCRによる変異DNAライブラリー中に含まれるDNAの大部分は正しい読み取り枠を保っていることが示された。
図7に示した配列中には単位領域が5個連結したDNA断片が3クローン、6個連結したDNA断片が10クローン、7個連結したDNA断片が9クローン、8個連結したDNA断片が10クローン、9個連結したDNA断片が2クローン、10個連結したDNA断片が1クローンであった。また、図8に示した配列中には単位領域が2個連結したDNA断片が1クローン、3個連結したDNA断片が2クローン、4個連結したDNA断片が9クローン、5個連結したDNA断片が17クローン、6個連結したDNA断片が4クローンであった。
以上の結果は、意図した単位領域の数より多いまたは少ない数の単位領域DNAからなるDNA断片も含まれているが、目的とする数の単位領域DNAからなるDNA断片が最も多いことから、該ライブラリーを進化分子工学に適用することにより、有用なタンパク質を創出するという本発明の目的を達するに充分な変異DNAライブラリーが構築できたことを示している。
(実施例3)
Error−pronePCRによって変異DNAライブラリーを作製した。
実施例2の(1)〜(3)及び(5)の操作と同様にして連結単位領域を混合してPCRを行う際に、該PCR反応液に塩化マンガンを0〜1mMの濃度で添加した。増幅されたDNAが有する塩基配列を実施例2の(6)と同様にして解析した。この結果を表2に示す。マンガンイオン濃度の増加に対して、ほぼ直線的に塩基置換の頻度が増加することが分かった。従って、任意の置換率でライブラリーを構築したい場合には、表2のデータに従ってマンガンイオンを添加すればよいことが判明した。
Figure 2002026964
産業上の利用の可能性
本発明の方法によれば、任意のアミノ酸配列をコードする複数のDNA断片を様々な順序と長さで連結した遺伝子の集団を構築する方法が提供され、該変異DNAライブラリーから作製される変異プロテインライブラリーにより所望のタンパク質を選択し、さらに進化分子工学を用いることにより、天然タンパク質の部品(単位領域)である二次構造、モジュール、モチーフなどを組み合わせた新しい機能をもつタンパク質を創出するのに極めて有用である。
また、本発明の選択的スプライシングライブラリーから作製される変異プロテインライブラリーからは、分子量が小型化したタンパク質を取得することができる。分子量が2万以下の比較的小さな球状タンパク質の変性は可逆的であることが知られており、一度変性しても適切な条件に戻すことによりその機能を回復することができる。また、このような性質を持つタンパク質は、リボヌクレアーゼに代表されるように、熱や有機溶媒に対する耐性が強い。またこのような酵素を用いたバイオプロセスにおける精製物の回収率も高い。本発明の選択的スプライシングライブラリーから得られる変異タンパク質は、任意のタンパク質をその機能を保持したまま小型化できるため、タンパク質としての応用性を広げるものである。
【配列表】
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964

【図面の簡単な説明】
図1は、本発明の概念を示す図である。3種類の単位領域DNAをシャッフルする場合を例として示した。2つの単位領域DNAが連結した連結単位領域DNAを混合し、T7のフォワードプライマーとExのリバースプライマーを用いてPCRを行うことにより、3種の単位領域DNAが、種々の順序で連結された多数のDNA断片が一度のPCRで合成される。
図2は、PCR産物をアガロースゲル(2%)を用いて分離した電気泳動写真である。各レーンは50μlのPCR産物を含む。ラダー状のDNAバンドに対応する配列を右に示した。MはDNAマーカーである。
図3は、本発明の変異DNAライブラリーの構築方法の原理を示す図である。
図4は、ヒューマンエストロゲンレセプターαのリガンド結合ドメインをエクソンと二次構造境界で分断し、10個の単位領域に分割したことを示す構成図である。
図5は、10個の単位領域からなる構造遺伝子から本発明の変異遺伝子ライブラリーを構築する際に用いるすべての連結単位領域DNAを示す図である。各連結単位領域DNAは、対角線に示されたように、X=0からX=8の9通りの連結単位領域DNA群に分類できる(a)。ある特定の数の単位領域から構成される構造遺伝子の集団中に現れる各連結単位領域DNA群ごとの出現頻度を示した(b)。
図6は、本発明の変異DNAライブラリーを構築した際のPCR産物を分離したアガロースゲル電気泳動写真である。(a)、(b)はそれぞれ8個、及び5個の単位領域DNAから構成される構造遺伝子の集団を構築した場合のPCR産物である。図中、Mはマーカーを示す。
図7は、8個の単位領域DNAから構造遺伝子を得るような条件下でPCRを行い得られた本発明の変異遺伝子ライブラリーが有するDNAの構造を示した図である。
図8は、5個の単位領域DNAから構造遺伝子を得るような条件下でPCRを行い得られた本発明の変異遺伝子ライブラリーが有するDNAの構造を示した図である。Technical field
The present invention relates to a method for constructing a DNA library, which comprises performing Polymerase Chain Reaction (hereinafter, sometimes referred to as “PCR”) using a mixture of DNAs of a linking unit region as a template. More specifically, the present invention relates to a DNA sequence encoding a specific amino acid sequence such as a protein module, a secondary structure, a super secondary structure, a motif, a primitive sequence, an exon, a DNA constituting an expression control region, or an artificial amino acid. A method for constructing a mutant DNA library, wherein PCR is performed using a mixture of linked unit region DNAs to which DNAs encoding the sequence are linked as a template, and obtained by transcribing and translating the DNA library. Regarding protein library. In addition, the present invention provides a method for obtaining a mutant protein having a desired property, which comprises selecting a protein having a desired property using the protein library, and applying a technique of evolutionary molecular engineering. It also relates to the resulting protein with further enhanced desired properties.
Background art
Currently, many enzymes are used in industrial bioprocesses. In relation to environmental issues, energy-efficient bioprocesses are expected to become more widespread in the future. In addition, with the development of genetic engineering, the demand for proteins as pharmaceuticals and biosensors is expected to increase. However, many proteins have low structural stability and are easily denatured by heat or organic solvents. Agglomeration in the manufacturing process causes a decrease in the recovery rate of the synthesized product. Such denaturation and aggregation are often irreversible, and it is difficult to regenerate a once denatured protein to a natural state having a function.
Therefore, attempts have been made to improve heat resistance, organic solvent resistance and the like by protein engineering or evolutionary molecular engineering techniques. For example, in protein engineering, a protein having a known structure is subjected to amino acid substitution by estimating a site likely to contribute to the stabilization of the structure (Applied Chemistry, Protein Engineering, Asakura Shoten, Katsuhide Ikeya, Haruki Nakamura, 1991) ) Method is used. In addition, if the technique of evolutionary molecular engineering is used, a protein with improved function can be obtained by performing site-specific or random amino acid substitution and selecting as an index that the target property has been increased. .
Evolutionary molecular engineering is an excellent technique for creating proteins having specific functions. In the evolutionary molecular engineering of proteins, first, a mutant population containing many proteins (hereinafter, sometimes referred to as “mutant protein library”) is constructed. Next, a mutant protein having a desired function is selected from the library. Furthermore, a mutation is introduced into the DNA encoding the selected mutant protein and expressed, and a mutant protein library is constructed again to select a mutant protein having a further increased desired function. By repeating this operation several times, a protein having excellent functions can be obtained.
In order to obtain a mutant protein by such evolutionary molecular engineering, a library capable of searching a larger sequence space among mutant protein libraries and mutant DNA libraries encoding them is essential. Therefore, the construction method is a very important elemental technology for evolutionary molecular engineering.
In the early stage of constructing a mutant DNA library, a mutagenizing agent for DNA (Myers, RM et al. (1985) Science 229, 242-247; Chu, C.-T. et al. (1979)) ) Virology 98, 168-181) or radiation (Billi, D. (2000) Appl. Environ. Microbiol. 66, 1489-1492), but a method for chemically synthesizing DNA (Sinha, N. D. et al. (1984) Nucleic Acids Res. 12, 4539-4557) and Polymerase Chain Reaction (Saiki, RK et al. (1985) Science 230, 1350-1354). Mutation introduction methods are also methods using recombination technology (Botstein, D. & Shortle, D. (1985) Science 229, 1193-1201), Error-prone PCR (Leung, DW et al. (1989) ) Technique 1,11-15), DNA shuffling (Stemmer, WPC (1994) Proc. Natl. Acad. Sci. USA. 91, 10747-10751), etc. It has become.
In the error-prone PCR, an excess amount of manganese ions and four types of deoxyribonucleotide triphosphates are added at various mixing ratios, and PCR is performed using Taq DNA polymerase. be introduced.
In DNA shuffling, a DNA encoding a protein to be evolved is introduced with a point mutation by error-prone PCR, and then digested with DNase I. Thereafter, by performing PCR in the absence of primers, recombination via homologous sequences occurs, and various point mutations already introduced are combined to construct a DNA library into which various mutations have been introduced. Is done. That is, point mutation can be introduced more efficiently than Error-prone PCR. In DNA shuffling, a sequence in a family protein having relatively high homology in sequence can also be used as a parent sequence.
According to the method described above, it is possible to prepare a mutant DNA library in which a point mutation has been introduced into DNA. However, the amino acid sequence space of a protein is very large. For example, the sequence of a protein consisting of 100 amino acids is 20 100 $ 10 130 It is possible. This is the number of atoms in the universe (10 75 More than). It is unlikely that such an enormous sequence has been exhaustively tested in the course of less than 4 billion years of biological evolution. That is, it is highly possible that organisms existing on the earth have sequences with useful functions that have not yet been tried in the vast amino acid sequence space of proteins.
In this regard, Error-prone PCR can only introduce very few point mutations. In addition, since DNA shuffling can only introduce point mutations between sequences having high sequence homology, it is impossible to search a vast sequence space as a mutant with a library constructed by such a method. It is.
In addition, a technique for efficiently constructing a mutant DNA library by randomly combining base sequences encoding any amino acid sequence having no homologous sequence, instead of introducing a point mutation into DNA, has been known. Absent.
As a method of recombining a certain region of such DNA, for example, a method of simply ligating an arbitrary DNA fragment using DNA ligase can be considered. Appears with a half of the probability, the amino acid sequence encoded by the original DNA fragment cannot be obtained, and the termination codon frequently appears, so that the smallest globular protein (from about 100 amino acids It is not suitable as a method for constructing a library, for example, because it is difficult to construct a structural gene corresponding to
As a method of ligating while maintaining the orientation of the DNA, a method of digesting the 5 'end and 3' end of each unit region DNA to be ligated with different restriction enzymes and ligating the fragment using DNA ligase is used. Can be considered. However, in this case, the orientation of each unit region is maintained, but a recognition site (linker) for a restriction enzyme must be artificially added to each unit region. As a result, the specific amino acid sequence can be identified. The problem of insertion of an amino acid occurs.
On the other hand, the present inventors, as one of the methods for introducing site-specific mutations at the unit region level, isolate and isolate a gene DNA encoding a protein for each unit region, and isolate the isolated unit region DNA. Ligated in any combination, the connected unit region DNAs are selected and mixed so that the ends of each unit region DNA overlap in the order in which they are to be replaced, and the mixture of the connected unit region DNAs is used as a template, It discloses a method for constructing a replacement mutant DNA comprising amplifying the DNA using a primer of a terminal unit region DNA (Japanese Patent Application Laid-Open No. 10-014578). However, this method aims at obtaining a replacement mutant DNA obtained by rearranging a predetermined number of unit region DNAs, and further, since only one type of mutant DNA can be obtained per PCR, various proteins can be obtained. A library having a sequence space is not constructed by one PCR.
Disclosure of the invention
An object of the present invention is to provide a method for constructing a library for exploring a vast sequence space of a protein, which cannot be performed by a conventional mutant population construction method, such as Error-prone PCR or DNA shuffling. A region that constitutes a part of a natural protein such as a module, a secondary structure, a super-secondary structure, a motif, a primitive sequence, an exon of DNA, or an expression control region or a region composed of an artificial amino acid sequence is referred to as a unit region (hereinafter referred to as “ This is sometimes referred to as a “unit region”), and is intended to efficiently construct a mutant DNA library in which the DNAs constituting them are linked in an appropriate combination.
Still another object of the present invention is to prepare a protein library by transcribing and translating the above-mentioned DNA library as a method for obtaining a protein having desired properties using the technology of evolutionary molecular engineering. Is to select and obtain a protein having desired properties.
In addition, the present invention provides a mutant protein having a desired property by selecting a protein having a desired property using the protein library, and further applying an evolutionary molecular engineering technique to further improve the desired property. The purpose is to obtain a purified protein.
Further, the present invention provides a method for obtaining a DNA encoding a protein having a desired property by analyzing a DNA encoding a selected protein, and producing a recombinant of the protein having a desired property using the DNA. And so on.
The present inventors have conducted intensive studies to achieve the above object, and as a result, prepared and mixed a plurality of linked unit region DNAs in which DNAs encoding any two types of amino acid sequences were linked, and used this as a template to perform PCR. If performed, DNAs having various sequences in which DNAs encoding arbitrary amino acid sequences are randomly combined are synthesized by a single PCR (hereinafter, this may be referred to as a “random library”). I found that. Furthermore, the present inventors have focused on the fact that, in a eukaryotic protein synthesis system, a plurality of proteins are synthesized by combining limited exons by alternative (alternative) splicing. For the unit region DNA obtained by dividing the structural gene DNA encoding into an arbitrary fragment, a linked unit region DNA is prepared by connecting the structural gene while maintaining the order from upstream to downstream in the structural gene, and these are specified. It has been found that, by mixing the DNA at a ratio to form a template DNA and performing PCR, a DNA sequence group generated by alternative splicing (hereinafter, this may be referred to as “alternative splicing library”) can be constructed. The present invention has been completed based on these findings.
That is, according to the present invention, the following inventions are provided.
(1) (a) ligating the unit region DNAs in an arbitrary combination, and (b) connecting the obtained ligated unit region DNAs to at least one other type of ligated unit in which the terminal sequences of all the ligated unit region DNAs to be used are different. (C) Performing a Polymerase Chain Reaction using the mixture of the linked unit region DNAs as a template to obtain a DNA library containing two or more clones. And a method for constructing a DNA library.
(2) In the step (b), the connecting unit region DNA is used in such a manner that the terminal sequences of all the connecting unit regions used overlap at least the terminal sequences of at least one other type of connecting unit region DNA, and (1) The method according to (1), wherein the sequences of either the 5 ′ end or the 3 ′ end of the connecting unit region DNA are selected and mixed so as to overlap at least the other two types of connecting unit region DNA ends.
(3) The method according to (1) or (2), wherein the mixture of connected unit region DNAs is a mixture of connected unit regions in which two unit region DNAs are connected in all combinations of unit region DNAs used.
(4) The unit region DNA is obtained by dividing a structural gene DNA encoding a protein into L pieces (here, L is an integer of 3 or more), and the ligation method is 3 ′ of an arbitrary unit region DNA. A mixture of the terminal unit and the 5 'end of the unit region DNA present on the C-terminal side of the protein from the unit region so that the amino acid sequence of each unit region is maintained, and a mixture of the linked unit region DNAs Is the number of unit regions separated from each other in the original structural gene by X (where X is an integer from 0 to L-2) as an index. Are mixed using the ratio satisfying the following formula (1) as an index.
L-X-1 C MX (1)
(In the formula, L and X have the same meanings as described above, and M represents the difference between the total number of unit regions and the number of unit regions of the mutant DNA to be prepared.)
(5) A unit region DNA in which DNAs encoding a group of proteins having the same tertiary structure but different amino acid sequences are each divided into L unit regions (where L is an integer of 3 or more). The ligation method is such that the 3 ′ end of the arbitrary unit region DNA and the 5 ′ end of the unit region DNA present on the C-terminal side of the above protein group from the unit region have an amino acid sequence of each unit region. And a mixture of linked unit region DNAs is the number of unit regions separated from each other in the original protein group by X (where X is 0 or more and L (2). The method according to (1), wherein the respective linking unit region DNAs classified using the index as an index are mixed using the ratio satisfying the following formula (1) as an index.
L-X-1 C MX (1)
(In the formula, L and X have the same meanings as described above, and M represents the difference between the total number of unit regions and the number of unit regions of the mutant DNA to be prepared.)
(6) The method according to any one of (1) to (5), wherein the Polymerase Chain Reaction is performed in the presence of a primer having a sequence complementary to a unit region DNA to be both ends of the DNA to be constructed. .
(7) The method according to any one of (1) to (6), wherein the Polymerase Chain Reaction is performed in the presence of a connecting unit region DNA containing a common DNA sequence and a primer having a sequence complementary to the common DNA sequence. .
(8) A mutant DNA library obtained by any one of the methods (1) to (7).
(9) A protein library obtained by incorporating the DNA library according to (8) into an expression vector, transforming a host cell with the expression vector, culturing the transformant, and collecting protein from the culture. Rally.
(10) An RNA library obtained by transcribing the DNA library according to (8).
(11) A method for producing a protein library, comprising expressing the DNA library according to (8) or the RNA library according to (10) in a cell-free transcription and / or translation system.
(12) A protein library obtained by the method of (11).
(13) A nucleic acid-protein linked molecule library in which a DNA contained in the DNA library according to (7) or an RNA contained in the RNA library according to (9) is bound to a protein encoded by the DNA or RNA. Rally.
(14) A method for obtaining a protein, comprising selecting a protein having desired properties using the library according to (9), (12) or (13).
(15) A protein obtained by the method according to (14).
(16) (a) DNA encoding the protein described in (15) was prepared, (b) a mutation was introduced into the DNA, (c) the DNA having the mutation introduced was amplified, and (d) the DNA was amplified. A method for obtaining a protein, comprising: preparing a protein library by transcribing / translating DNA; and (e) obtaining a protein having desired properties using the library.
(17) A protein obtained by the method according to (16).
(18) A method for obtaining a DNA encoding the protein according to (15) or (17).
(19) DNA obtained by the method according to (18).
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be described in more detail. In addition, unless otherwise specified in the present specification, the description is common to the random library and the alternative splicing library.
(1) Unit region DNA
The "unit region" used in the present invention refers to a specific region unit having any structural, functional, or evolutionary meaning in a protein, gene, or genomic DNA, or any region not showing such a meaning, or Refers to an expression control region and the like. Examples of the region having a specific meaning in a protein include, for example, protein module, secondary structure, supersecondary structure, structural motif, motif, primitive sequence, artificial amino acid sequence, and the like. And so on. The expression control region specifically refers to a core promoter element, an upstream control element, an enhancer promoter, an enhancer, and the like.
When a random library is prepared, any of the above unit regions can be used. In the case of an alternative splicing library, a fragment obtained by dividing a structural gene encoding a protein is used.
A protein module is a region consisting of 10 to 40 residues of amino acids that is continuous and sterically compact in primary structure in a globular protein or domain. The polypeptides encoded by the exon parts of eukaryotes correspond well to the unit region showing the modular structure.Modules are the basic polypeptides that make up proteins, and are important materials in the early stages of biological evolution. (Go, M. et al. (1987) Cold Spring Harb. Symp. Quant. Biol., 52, 915-924). Specifically, for example, modules constituting lysozyme, hemoglobin, triosephosphate isomerase, and barnase can be mentioned.
The secondary structure of a protein refers to a relatively narrow range (up to about 10 residues) formed by a hydrogen bond between a C 間 の O group and an NH group in the peptide main chain in the three-dimensional structure of the protein. A special three-dimensional structure that is observed and has a regular structure having repetitions such as α-helix, β-sheet, β-turn, or loop structure (Salemme, FR et al. (1983) In biochemistry, ed. Zubay, G., 69-129, Addison-Wesley Publishing Co., Massachusetts), a chameleon sequence (Minor, DL et al., Nature, 380 (6576), 730-734 (1996)), and G-peptide. (Honda, S. et al., J. Mol. Biol., 95 (2), refers to a 269-278 (2000)).
The super-secondary structure of a protein refers to a unit in which a number of secondary structural units such as α-helix and β-sheet structure gather to locally form a compact three-dimensional structure (Salemme, FR. (1983) In biochemistry, ed. Zubay, G., 69-129, Addison-Wesley Publishing Co., Massachusetts). Specific examples include a helix-loop-helix structure.
A motif of a protein is an operation (sequence alignment) in which amino acid sequences of proteins with similar or similar functions are arranged so that amino acid sequences with the same or similar properties are located at the same position. A short but significantly conserved amino acid sequence when compared in sequence. In other words, a motif is a specific site in a protein, which refers to an amino acid sequence or base sequence that has been conserved during evolution. Specific examples include Greek key motifs, and motifs registered in the protein motif database PROSITE (http://expasy.hcuge.ch/sprot/prosite.html).
Primitive sequence refers to the specificity of the transfer RNA as well as the corresponding amino acid sequence. It has been speculated from the comparison of sequence homology of existing proteins that primitive sequences played an important role in diversification of protein functions in the early stages of evolution (Ohnishi, K. (1993) In Endocytobiology V, eds. S. Sato et al., Tubingen University Press, Tubingen, 407-414).
An exon refers to a base sequence translated into a protein in eukaryotic gene DNA. Exons are interrupted by introns whose base sequence is not translated into protein. After the genomic DNA is transcribed into RNA, introns are cut off by splicing, and only exons are joined to form a mature mRNA that is used as information for protein synthesis (Gilbert, W. (1978) Nature, 271, 501).
The term “unit region DNA” used in the present invention means DNA constituting a unit region. When the unit region is a fragment of a structural gene, the base sequence of the original structural gene has a single base sequence. The unit region DNA obtained by dividing the DNA has a single base sequence. When the unit region is not a fragment of the structural gene, the DNA contained in each unit region DNA means a DNA group containing a plurality of homologous base sequences. Here, the term "base sequence having a plurality of homologies" refers to a base sequence having a homology of a certain degree at which PCR described below can be performed and the reading frame of the DNA is retained.
Such a unit region DNA is composed of two complementary strands, and may be DNA that can be separated and isolated from an arbitrary DNA strand or chemically synthesized DNA. The length of the DNA chain is not particularly limited as long as it is a unit having the above structure, but a fragment of 30 to 120 bp encoding 10 to 40 amino acids, or a 5 ′ or 3 ′ terminal A mixture of DNA fragments differing by ± 3 to 15 bp may be used. As an example of such a method for preparing a DNA fragment having a 5 ′ or 3 ′ end differing by ± 3 to 15 bp, a DNA fragment designed to include a sequence shifted by ± 3 to 15 bp adjacent to the base sequence when producing by PCR is used. Using a plurality of primers.
In the method for constructing a mutant DNA library of the present invention, first, this unit region DNA is prepared. The method of preparation may be any method as long as the above-mentioned unit region DNA can be obtained, but for example, a method in which a DNA containing a target DNA sequence is used as a template and obtained by PCR is preferable.
Alternatively, it can be obtained by annealing a complementary strand of DNA produced by chemical synthesis.
(2) Linking unit region DNA
The obtained unit region DNA is ligated with a DNA ligase or the like to prepare a unit region DNA ligated product (hereinafter, this may be referred to as “ligated unit region DNA”). The DNA of the connected unit region can also be amplified by performing PCR using the DNA as a template. At this time, it is necessary to amplify a linked unit region DNA in which each unit region DNA is linked in a direction maintaining the reading frame of amino acids. For this purpose, for example, when amplifying a linked unit region DNA “1-2” obtained by linking “unit region 1” and “unit region 2”, it is complementary to the base sequence at the 5 ′ end of “unit region 1”. PCR is carried out using a forward primer having a property and a reverse primer having complementarity with the negative base sequence at the 3 ′ end of “unit region 2”. By selecting the primers in this manner, the linked unit region DNA that has been inverted and ligated by ligation with DNA ligase or the like can be automatically deleted.
The DNA of the linking unit region is subjected to a reaction with DNA ligase or the like or the above-mentioned PCR, and then the reaction solution is separated by agarose gel electrophoresis or the like, and a gel containing a target DNA is cut out, and the gel is cut out. Can be obtained by recovery and purification using a method known per se. Further, it is also possible to prepare and obtain a full-length DNA of the above-mentioned connecting unit region DNA by chemical synthesis.
Regarding the method of selecting unit region DNA and the order of ligation for preparing the linked unit region DNA, when a random library is prepared, any unit region DNA can be used as the unit region DNA to be linked. There is no particular limitation on the number of unit areas. However, it is preferable to prepare a linked unit region DNA in which two unit region DNAs are linked from the viewpoint of the efficiency of diversification of the components of the library to be constructed. The unit region DNAs to be connected and the order of the connection are not particularly limited. However, when the connected unit region DNAs of all combinations of the unit region DNAs to be used are prepared, a DNA library prepared by a method described below using the same is used. Thus, it is possible to obtain a DNA in which all the unit regions used are combined. Specifically, in the case of producing a connected unit region DNA in which two unit regions are connected using n types of unit region DNA, the maximum is n C 2 Ligation reaction can be performed.
In addition, in the case of ligation, ligation may be carried out such that DNAs encoding about 1 to 10, preferably about 1 to 5 random amino acid residues are interposed between unit region DNAs. Such a linking unit region DNA can be prepared by PCR using appropriate primers.
When preparing an alternative splicing library, the connected unit region DNA is selected from two unit region DNAs obtained by dividing a single structural gene DNA in the above (1) and connected in a specific order. Can be obtained. The first unit region DNA to be selected can be selected from the unit region DNA obtained by dividing the single structural gene DNA in the above (1), except for the one located at the most C-terminal side of the encoded protein. The second unit region DNA to be bound to the linking unit region may be any unit region DNA that encodes a unit region located on the C-terminal side of the first unit region in the protein encoded by these units. Good. The order of the ligation is as follows: the 3 ′ end of the first unit region DNA and the 5 ′ end of the second unit region DNA encoding the unit region present on the C-terminal side in the protein encoded by these units. The procedure is performed so that the amino acid sequence in the sample is maintained.
As described above, the linking unit region, which is linked so as to maintain the order from upstream to downstream in the encoded protein, is prepared by dividing the structural gene into L unit region DNAs. In this case, a combination of all L-1 units selected as the first unit region DNA and all the unit regions selectable as the second connected unit region DNA is prepared. That is, when the structural gene DNA is divided into L unit region DNAs, the connected unit region DNAs L C 2 Make a kind.
(3) Classification of linking unit region DNA
The resulting linked unit region can be used as a template to perform a PCR to produce the mutant DNA library of the present invention. However, when an alternative splicing library is to be prepared, The connected unit region DNA obtained as described above is used as an index to indicate how many unit regions in the structural gene DNA where the first unit region DNA and the second unit region DNA exist are connected. Need to be classified as Here, X, which is the number of unit regions separating the first unit region DNA and the second unit region DNA in the structural gene DNA in which they exist, is 0 or more when L divided unit regions are L. -2 or less.
Specifically, when a DNA encoding a certain protein is divided into five unit region DNAs, and then a linked unit region DNA is prepared, the unit region DNAs are divided into 1, 2, 3 in order from the N-terminal side of the structural gene. , 4, and 5, the connection unit region DNAs are 1-2, 1-3, 1-4, 1-5, 2-3, 2-4, 2-5, 3-4, 3-5, 4 Ten types of -5 are produced. Among these, those in which the first unit region DNA and the second unit region DNA are separated by 0 unit regions in the structural gene DNA where they exist (X = 0) are 1-2, 2-3, 3-4 and 4-5. Similarly, one unit area (X = 1) is 1-3, 2-4, 3-5, and two unit areas (X = 2) are 1-4, 2-5, 3 Those separated from each other (X = 3) can be classified as 1-5. The unit region DNAs belonging to each group of the connected unit region DNAs classified in this way may be collectively referred to as a “connected unit region DNA group”.
(4) PCR using ligation unit region DNA as template
According to the method of the present invention, the linked unit region DNAs thus obtained are mixed, and a PCR reaction is carried out using the mixed unit region DNAs as a template. A mutant DNA library consisting of genes can be constructed by a single PCR.
The ligation unit region DNAs used as templates in this PCR are selected and mixed so that the terminal sequences of all the ligation unit region DNAs used overlap at least the end sequences of at least one other type of ligation unit region DNA. Here, when a random library is prepared, the connecting unit region DNA used as a template in this PCR is such that the terminal sequence of all the connecting unit region DNAs used is at least the terminal sequence of at least one other type of connecting unit region DNA. And at least one of the 5′-terminal and 3′-terminal sequences of at least one type of the linking unit region DNA is selected so as to overlap with at least the terminal sequence of the other two types of the linking unit region DNA. I do. The type and number of the connecting unit region DNA used for PCR in the present method are not particularly limited as long as the above conditions are satisfied.
For the purpose of obtaining a DNA in which all the unit regions used in the random library are combined, the connected unit region DNAs connected by all the combinations of the unit region DNAs to be used are selected and mixed. PCR may be performed using as a template. In this case, it is preferable to use a connected unit region DNA in which two unit region DNAs are connected. Specifically, when a linked body of n unit region DNAs is produced by using a linked unit region DNA obtained by connecting two unit regions using n types of unit region DNAs, n 2 Since there are different types of linked unit region DNAs in different combinations, if PCR is performed using all these linked unit region DNAs as templates, it is possible to obtain a mutant DNA library linked by all combinations of unit region DNAs used. it can.
In the random library, the appearance frequency of a specific unit region DNA can be adjusted by the concentration of the linked unit region DNA containing the unit region DNA. Specifically, when it is expected that a specific unit region DNA appears twice more than that of the specific unit region DNA, double the amount of the unit unit DNA which does not include the linked unit region containing the unit region DNA may be added.
In the case of preparing an alternative splicing library, the DNA of the linking unit region classified in the above (3) can be used as a template for PCR. The amount of DNA of the DNA of the linking unit region to be subjected to the PCR is appropriately 300 to 1500 fmol, preferably 500 to 1300 fmol, as a total of each DNA of the linking unit region. The amount of DNA occupied by each connected unit region DNA group in the template DNA is the number of unit regions in which the first unit region DNA and the second unit region DNA are separated in the structural gene DNA in which they are present. Regarding a certain X, L which is the total number of divided unit regions, and M which is the difference between the total number of unit regions and the number of unit region DNAs of the mutant DNA to be prepared, the following formula (1)
L-X-1 C MX (1)
(In the formula, L and X have the same meaning as described above, and M indicates the difference between the total number of unit regions and the number of unit region DNAs of the mutant DNA to be prepared.)
Can be calculated by The value calculated in this manner indicates the ratio of the total amount of DNA in each of the connected unit region DNA groups to the total amount of the template DNA. Further, it is preferable that the calculated amount of DNA of each connected unit region DNA in the total amount of DNA of each connected unit region DNA group is equal to the number of molecules.
Specifically, when the total number of the divided unit regions is 5 (L = 5) and the mutant DNA to be prepared has 3 (M = 3), the above-described classification is performed. In the DNA group of the connection unit region where X = 0, 4 C 2 = 6, X = 1 3 C 1 = 3, X = 2 in the connected unit region DNA group 2 C 0 = 1, X = 4 0 C -1 = 0, that is, the sum of the amounts of DNA obtained by mixing equal amounts of 1-2, 2-3, 3-4, and 4-5 classified as X = 0, and 1-3 as the DNA classified as X = 1. The total amount of DNA obtained by mixing equal amounts of 2-4 and 3-5 and the total amount of DNA obtained by mixing equal amounts of 1-4 and 2-5 classified as X = 2 are 6: 3: 1. And PCR is performed using this as a template.
More specifically, for example, when the total amount of DNA as a template is 500 fmol, the total amount of DNA obtained by mixing equal amounts of 1-2, 2-3, 3-4, and 4-5 classified as X = 0 Is 300 fmol, and each of the above-mentioned ligation unit region DNAs is subjected to PCR as a template DNA by 75 fmol. Similarly, the total amount of DNA obtained by mixing equal amounts of 1-3, 2-4, and 3-5 classified as X = 1 is 150 fmol, and each ligation unit region DNA is subjected to PCR as a template DNA by 50 fmol. The total amount of DNA obtained by mixing equal amounts of 1-4 and 2-5 classified as X = 2 is 50 fmol, and 25 fmol of each connected unit region DN is used as a template DNA for PCR.
Thus, by performing PCR using the connected unit region DNA mixed in an appropriate amount as a template based on the value satisfying the above formula (1), the order of these unit region DNAs from upstream to downstream in the structural gene was maintained. As it is, a mutant DNA library in which specific unit region DNA is selectively deleted and ligated can be constructed by a single PCR.
Appropriate known PCR reaction buffers and enzymes can be used. Preferably, when a random library is prepared, Vent DNA Polymerase (manufactured by NEB) or an alternative splicing livestock is used. When preparing a rally, KOD Dash Polymerase (manufactured by Toyobo Co., Ltd.) is used.
There is no particular limitation on the amount of DNA in the linking unit region to be subjected to PCR, as long as the DNA amplification reaction occurs. Specifically, when PCR is performed on a reaction scale of 50 μl, the total amount is 300 to 1500 fmol, preferably 500 to 1300 fmol.
The PCR may be performed under any conditions as long as a DNA amplification reaction occurs using the DNA of the connected unit region as a template. Depending on the length of the overlapping sequence of each linking unit region DNA, the length of the unit region DNA, or the length of the DNA to which the connecting unit region to be finally constructed is linked, Bio Experiment Illustrated 3, Cell Engineering Separate Volume, written by Hiroki Nakayama, Shujunsha (1993) Chapter 1, p. It can be appropriately selected and adjusted as described in 13-43 and used. Specifically, a DNA denaturation reaction is performed at 94 to 96 ° C, preferably 95 ° C for 15 to 60 seconds, preferably 20 to 40 seconds, and primer binding (annealing) is performed at 50 to 70 ° C, preferably 55 to 70 ° C. Performing at 65 ° C. for 15 to 60 seconds, preferably 20 to 40 seconds, followed by a polymerase elongation reaction at 70 to 74 ° C., preferably 72 to 73 ° C. for 1 to 5 minutes, preferably 2 to 3 minutes. Is a cycle, and it is appropriate to carry out 15 to 40 cycles, preferably 20 to 30 cycles.
Primers are not particularly required in the above-mentioned PCR, but can be carried out using appropriate primers. The advantage of performing PCR using primers is that DNA having a sequence complementary to the primers at both ends is selectively amplified, so that any unit region DNA or common DNA can be added to both ends of the constructed DNA. That is, it is possible to selectively obtain a substance having a unit region containing the DNA, and to increase the amount of the constructed DNA so that it is easy to see when separating a PCR reaction product. The amount of the primer is appropriately 10 to 60 pmol, preferably 20 to 40 pmol for the forward and reverse primers, respectively.
When constructing a mutant DNA library in which unit region DNA to be both ends of DNA to be constructed is fixed, a primer having a sequence complementary to unit region DNA to be both ends of DNA to be constructed Is preferably performed in the presence of
By performing PCR as described above, a DNA library containing two or more clones can be obtained. The “DNA library containing two or more clones” means a library consisting of two or more clones in which the DNA contained in the obtained library has a different sequence.
The presence of an appropriate manganese ion in the PCR reaction buffer can simultaneously induce base substitution at a certain frequency in each DNA sequence when preparing the DNA library of the present invention. Specific examples of the manganese ion source include manganese chloride. The manganese ion concentration in the PCR buffer is selected according to the frequency of base substitution to be induced. The relationship between the frequency of base substitution and the manganese ion concentration was determined by performing PCR with the manganese ion concentration varied, analyzing the base sequence of the DNA fragment contained in the obtained DNA library, and detecting the base substitution induced in the DNA. It can be specified by examining the rate. As this function, for example, the values described in Table 2 of the third embodiment can be used. As another method, a base substitution can be induced in each DNA sequence contained in the mutant DNA library to be prepared by changing the composition of dNTP.
(5) PCR using as a template a DNA of a connecting unit region having a common DNA sequence
As a preferred embodiment of the PCR using the above-mentioned ligation unit region DNA as a template, a ligation unit region DNA in which different common sequences are added to both ends of the DNA to be constructed is selected and used as a template, and A method of performing PCR using a primer having a sequence complementary to a DNA sequence is exemplified. By this method, a mutant DNA library having a common DNA sequence at both ends can be selectively constructed and obtained.
The common DNA sequence may be an appropriate sequence having a length of about 15 to 100 base pairs. However, when the DNA to be constructed is used for preparing a mutant protein library to be described later, the 5′-terminal common sequence is appropriately used. It is preferable to use a simple promoter sequence.
The promoter sequence used as the common DNA sequence is not particularly limited as long as the protein encoded by the DNA is expressed in a host that expresses the DNA. Specifically, when the host microorganism is Escherichia coli, T3, T7, SP6, tac, or lac promoter can be used, and when yeast is used, the nmt1 promoter, Gal1 promoter, and the like can be used. In the case of cultured animal cells, SV40 promoter, CMV promoter and the like can be mentioned.
As a method for adding the common DNA sequence to the linked unit region DNA, a double-stranded DNA having a common sequence as one of the unit region DNAs is prepared in the same manner as the method for preparing the unit region DNAs described in (1) above. This can be ligated in the same manner as in the method for preparing a ligation unit region DNA described in (2) above. Specifically, the desired 5 'terminal common DNA sequence and the unit region DNA, and the 3' terminal common DNA sequence and the unit region DNA are ligated by the same operation as when the above linked unit region DNA was prepared. Next, with respect to the obtained ligated product of the 5 ′ terminal common DNA sequence and the unit region DNA, and the ligated product of the 3 ′ terminal common DNA sequence and the unit region DNA, the 5 ′ common DNA sequence was forwarded with a forward primer, The gene sequence at the 3 'end of the unit region DNA linked thereto is used as a reverse primer, and the 3' common DNA sequence is used as the reverse primer at the 3 'end, and the 5' end DNA sequence of the unit region DNA linked thereto is used as the reverse primer. It is prepared by performing PCR as a word primer.
In addition, the primer may be added by using a primer having complementarity with the terminal sequence of the unit region DNA to which a common sequence is added at the 5 ′ or 3 ′ end as a primer in the PCR for preparing the above-described linked unit region DNA. Can be.
The ligation unit region DNA containing the common DNA sequence thus prepared is mixed with other ligation unit region DNAs and subjected to PCR. The method of selecting other linking unit region DNAs, the mixing ratio, and the like can be performed in the same manner as described in (4) above, and are described in detail below.
Mutant DNA which has a common sequence at the 5 'end or 3' end in a random library among mutant DNA libraries prepared by the method of the present invention, and in which all combinations of unit region DNAs used for recombination have been performed For the purpose of obtaining the above, a connecting unit region DNA connected by all combinations of unit region DNAs to be used and a connecting unit obtained by adding a common sequence to the 5 ′ end or 3 ′ end of all the unit region DNAs to be used Regions may be selected and mixed, and PCR may be performed using this as a template. In this case, it is preferable to use a connected unit region DNA in which two unit region DNAs are connected. Specifically, a linked DNA of n unit region DNAs having a common sequence at the 5 ′ end or 3 ′ end is formed by connecting unit region DNAs connecting two unit regions using n types of unit region DNAs. Is prepared by PCR, n 2 Is mixed with 2n linked unit region DNAs having a common sequence at the 5 'end or 3' end, and PCR is performed using the mixed unit region DNA as a template, all combinations of unit region DNAs used are obtained. And a random DNA library having a common sequence at the 5 ′ end or 3 ′ end can be obtained.
In the alternative splicing library, the DNA of the linked unit region containing the common DNA sequence can be constructed in a single PCR by mixing the DNA at a specific ratio and performing PCR using the mixed DNA as a template.
The unit DNA obtained by connecting the obtained common DNA sequence and each unit region DNA is separated by the number of unit regions (X: where X is a fragment) which is separated in the structural gene DNA between the unit regions to be connected to the common DNA sequence. (Where L is an integer of 0 or more and L-1 or less when the number of unit regions obtained is L), the mixing ratio is calculated as described in (3) above, and mixed with the other connected unit region DNA groups. To perform PCR.
Specifically, when a DNA encoding a certain protein is divided into five unit region DNAs and then a linked unit region DNA is prepared, the unit region DNAs are sequentially arranged from the N-terminal side of the structural gene to 1, 2, 3, 4,. Assuming that the 5 ′ common DNA sequence is T and the 3 ′ common DNA sequence is C, the linked unit region DNA in which the common DNA sequence T or C is linked to the unit region DNA is T-1, T-2, T -3, T-4, T-5, 1-C, 2-C, 3-C, 4-C, and 5-C are produced. Among these, those in which the common DNA sequence and the unit region DNA are separated by 0 unit regions in the structural gene DNA where they exist (X = 0) are T-1, 5-C. Similarly, one unit region (X = 1) is T-2, C-4, two units (X = 2) are T-3, 3-C, three units (X = 3) is T-4, 2-C, and those separated by four (X = 4) are T-5, 1-C. Therefore, mixing of the linked unit region DNA to be subjected to PCR from each value of X The ratio can be calculated.
In the PCR using the unit region DNA group containing the unit region DNA having the common sequence selected and mixed as described above as a template, a primer having a sequence complementary to the common DNA sequence added to the 5 ′ end or 3 ′ end It is necessary to use
The PCR reaction buffer, enzymes, reaction conditions and the like can be determined according to the method described in the above (4). However, as for the DNA of the linking unit region containing the common sequence, the total amount is preferably 5 to 30 fmol, and more preferably 10 to 20 fmol when the PCR is performed on a 50 μl reaction scale.
(6) Principle of alternative splicing library construction method
Among the mutant DNA libraries of the present invention, the principle of the method for constructing an alternative splicing library will be described using a protein composed of five unit regions in FIG. 3 as an example. In this case, the linking unit region DNA obtained by linking these two by two so as to maintain the order from upstream to downstream in the structural gene is 5 C 2 = 10 possible. These linked unit region DNAs are classified into four types according to the unit region that they encode (FIG. 3b). If the selectively mutated protein to be constructed by deleting a suitable unit region is a protein containing three unit regions selected from five unit regions, the structure of the mutated protein is 5 C 3 = 10 cases (FIG. 3c).
Next, the connection unit regions found in the ten types of sequences shown above are counted, and they are classified based on FIG. 3b. As a result, when N, N + 1, N + 2, N + 3, and N + 4 are sequentially set from the N-terminal side of the protein encoding the unit region, N-N + 1 (the number of separated unit regions (X) = 0) is 12, and N There are six −N + 2, two N−N + 3, and zero N−N + 4.
By referring to this value, a DNA library encoding a group of proteins (in this case, 10 types) linked by deleting appropriate two unit regions from a protein composed of five unit regions can be efficiently prepared. In order to obtain it, the connection unit region DNA, N-N + 1 (the number of separated unit regions (X) = 0): ratio of N-N + 2: N-N + 3: N-N + 4 = 6: 3: 1: 0 It can be seen that mixing may be performed and PCR may be performed using these as templates.
Applying the above to the general formula, the structural gene DNA encoding the protein was divided into L unit region DNAs (where L is an arbitrary integer), and M were selectively deleted and linked. When a mutant DNA library is prepared by PCR, a connected unit region DNA in which two unit region DNAs serving as templates are connected so as to maintain an order from upstream to downstream in a structural gene is separated from each other on the structural gene. When the number of unit regions (X) is present, the ratio of the DNA can be calculated by the following equation (1).
L-X-1 C MX (1)
(7) Purification of mutant DNA library
The DNA fragment contained in the DNA library amplified and constructed by the PCR described in the above (4) or (5) can be confirmed by electrophoresis using an agarose gel or the like.
Further, by electrophoresis using the above agarose gel or the like, a mutant DNA library consisting only of DNA of an arbitrary length is obtained from a mixture of DNAs in which the unit region is linked in various numbers, Can obtain a mutant DNA library containing the largest number of target ligated DNAs. In this case, it is preferable to use a low melting point agarose gel, the DNA is electrophoresed in the gel, a portion containing DNA of an arbitrary length is cut out, and the DNA is cut out from the cut out gel by a method known per se. Can be extracted and purified.
The mutant DNA library thus obtained can be used as a DNA library for analyzing protein-nucleic acid interaction or an RNA library. The DNA contained in the DNA library may be coded by a method such as introducing this into an appropriate vector and transforming the recombinant vector into an appropriate host, or expressing it in a cell-free translation system after transcription. (Hereinafter, this may be referred to as a “mutated protein library”).
(8) Introduction of a mutant DNA library into a vector and preparation of a mutant protein library
The vector used for the production of the recombinant vector is not particularly limited as long as it can express the DNA contained in the mutant DNA library of the present invention in the host microorganism or cultured cells. A commercially available protein expression vector into which a promoter suitable for a cell is inserted can be used. On the other hand, as described above, when a 5′-end of a linking unit region DNA used as a template for PCR when constructing a mutant DNA library is added with an appropriate promoter sequence as a common DNA sequence, Normal cloning vectors can be used. Even in the case of a mutant DNA library in which the promoter sequence DNA is not added to the 5 ′ end as described above, if a suitable promoter sequence DNA is inserted so as to be linked to the 5 ′ end, ordinary cloning can be performed. Vectors can be used.
When the host microorganism is Escherichia coli, examples of the protein expression vector include pET3, pET11 (Staratagene), pGEX (Amersham Pharmacia Biotech) and the like, and when the host is yeast, pESP-I expression vector. (Manufactured by Stratagene) and the like. When animal cultured cells are used as a host, ZAP Express (manufactured by Stratagene), pSVK3 (manufactured by Amersham Pharmacia Biotech) and the like, and when insect cells are used, BacPAK6 (manufactured by Clontech) can be used. .
As a promoter for expressing DNA contained in the mutant DNA library of the present invention, a promoter possessed by a host microorganism or a cultured cell can be generally used, but is not limited thereto. Specifically, when the host microorganism is Escherichia coli, T3, T7, SP6, tac, and lac promoters can be used. When yeast is used as a host, examples include the nmt1 promoter and Gal1 promoter. In the case of animal cultured cells, SV40, CMV promoter and the like can be mentioned.
Insertion of the DNA contained in the mutant DNA library of the present invention into these vectors can be performed by ligation using DNA ligase or the like such that the DNA fragment is present downstream of the above promoter in the vector. .
A transformant can be produced by introducing the thus obtained recombinant vector into an appropriate host by an appropriate method known per se. Specific methods for introduction into a host include the heat shock method (J. Mol. Biol., 53, 154- (1970)), the calcium phosphate method (Science, 221, 551- (1983)), and the DEAE dextran method (Science). 215, 166- (1982)), electric pulse method (Proc. Natl. Acad. Sci. USA, 81, 7161 (1984)), in vitro packaging method (Proc. Natl. Acad. Sci. USA, 72, 581). (1975)) or the virus vector method (Cell, 37, 1053 (1984)).
At this time, the host into which the DNA is introduced may be any host as long as the protein encoded by the DNA can be expressed in the host by a protein expression recombinant vector containing the DNA. , Yeast, baculovirus (arthropod polyhedrosis virus)-insect cells, animal cells, animal cultured cells, and the like.
Specifically, BL21 and XL-1-Blue (manufactured by Stratagene) are used for Escherichia coli, SP-Q01 (manufactured by Stratagene) is used for yeast, and AcNPV is used for baculovirus (J. Biol. Chem., 263, 7406). 1988)) and its host Sf-9 (J. Biol. Chem., 263, 7406 (1988)). Examples of animal cultured cells include mouse fibroblast C127 (J. Viol., 26, 291 (1978)), Chinese hamster ovary cell CHO (Proc. Natl. Acad. Sci. USA., 77, 4216 (1980)) and the like. African green monkey kidney cells COS (ATCC: CRL1651) and the like.
By culturing the thus obtained transformant in a suitable medium by a method suitable for each, the expression of the protein encoded by the DNA of the mutant DNA library can be induced. The medium used for the culture contains a carbon source, a nitrogen source, an inorganic substance, a vitamin, serum, a drug used for resistance screening, and the like necessary for the growth of the transformant. Specifically, when the host of the transformant is Escherichia coli, for example, LB medium (manufactured by Nacalai Tesque) or the like, for yeast, YPD medium (Genetic Engineering, 1, 117, Plenum Press (1979)). In the case of insect cells, animal cells, and animal cultured cells, MEM medium, DMEM medium, RPMI1640 medium (manufactured by Sigma) containing 20% or less of fetal bovine serum can be used.
The cultivation of the transformant is usually performed at a temperature of 20 to 45 ° C. and a pH of 5 to 8, and aeration and stirring are performed as necessary. There is no particular limitation as long as the transformant grows under a medium composition or culture conditions other than these, and a protein encoded by the introduced DNA is produced.
Cells or cells are collected from the resulting culture by a method such as centrifugation, suspended in a suitable buffer, and disrupted by a suitable method known per se such as ultrasonication, lysozyme and / or freeze-thawing. After that, a crudely purified protein solution is obtained by centrifugation, filtration, or the like, and a purified protein can be obtained by further combining an appropriate purification method. Thus, a mutant protein library is created.
(9) Expression of mutant DNA library by cell-free translation system and preparation of mutant protein library
In addition to the above-described expression method using a protein expression recombinant vector, protein expression is induced by subjecting an RNA library obtained by transcribing a mutant DNA library to a cell-free translation system to prepare a mutant protein library. can do. The transcription of the DNA library can be carried out by a commonly used method known per se, but can be carried out simultaneously with the translation using a cell-free transcription / translation system. The cell-free transcription / translation system used in the present invention is a system containing all elements necessary for transcription from DNA to mRNA and translation from mRNA to protein, and the DNA is coded by adding DNA thereto. Refers to any system by which the protein in question is synthesized.
Specific examples of the cell-free transcription / translation system include a transcription / translation system prepared based on extracts from eukaryotic cells and bacterial cells or a part thereof, and particularly preferred specific examples include rabbit reticulocytes, A transcription translation system prepared based on an extract from wheat germ and Escherichia coli (Escherichia coli S30 extract) may be mentioned.
Separation and purification of the protein encoded by the mutant DNA library from the obtained transcription-translation product of the cell-free transcription / translation system can be carried out by a method known per se and generally used. Specifically, for example, a DNA region encoding an epitope peptide, a polyhistidine peptide, glutathione-S-transferase (GST), a maltose binding protein, or the like is introduced into the DNA to be transcribed and translated, and expressed as described above. The protein can be purified by utilizing the affinity of the protein with a substance having affinity.
(10) Screening of mutant protein library
The mutant protein library obtained in the above (8) or (9) can be subjected to screening using desired properties as an index. A protein having desired properties is a protein that binds to a desired target molecule, a protein that catalyzes a desired chemical reaction, or a protein whose binding ability, catalytic ability, substrate specificity, thermal stability, and environmental conditions are altered as described above. Protein, etc.
Methods for selecting a protein having desired properties depending on the desired biological activity include a method for selecting using a binding ability to a target molecule as an index and a method for selecting using a catalytic activity as an index. Using these binding capacities or catalytic activities as indices, for example, it is possible to select a protein having desired properties using an affinity resin adsorption method, an immunoprecipitation method, an electrophoresis method, a chromatography method, a flow cytometry method, or the like. it can. More specifically, target molecules such as proteins, nucleic acids (DNA or RNA), carbohydrates, and lipids are previously bound to a solid phase such as a microplate or a bead, and the mutant protein library constructed above is added thereto. After adding rally and reacting under a suitable temperature condition for a certain period of time, washing is performed, and a mutant protein bound to the target molecule is selected. This method can be carried out in accordance with the already established Enzyme Linked Immunosorbent Assay (ELISA) (Crowther, JR, 1995, Method in Molecular Biology, Vol. 42, Humana Press Inc.).
When selecting a protein having desired properties, for example, an enzyme protein, using the catalytic activity as an index, for example, the following two methods can be used. One is a method of selecting a protein that binds to a resin on which a transition state analog of a desired catalytic reaction is immobilized as in the case of a catalytic antibody (Tramontano, A. et al. (1986) Science, 234, 1566-1570). The other is a method in which proteins contained in a mutant protein library are bound to and dissociated from a resin by binding and cleavage of molecules by catalytic activity, as in the case of an RNA enzyme (ribozyme) (Gold). , L. et al. (1995) Annu. Rev. Biochem., 64, 763-797). The former selection method is difficult to increase the enzymatic activity turnover, while the latter selection method is based on catalytic activity rather than binding, as shown in many successful examples of ribozymes. The latter method is effective.
In addition, the fact that the catalytic antibody is restricted by the antibody structure is also one of the reasons why one having the activity as high as that of the natural enzyme has not been obtained. In the present invention, a ribozyme type selection method can be used, and the selection range of the protein structure is not limited to an antibody, and therefore, it can be expected to greatly contribute to the creation of a novel catalytic protein that exceeds conventional catalytic antibodies.
(11) Obtaining a protein having desired properties improved
The protein selected by the screening method described in (10) above is prepared by preparing DNA encoding the same, introducing a mutation into the DNA, amplifying the DNA having the mutation introduced therein, expressing the amplified DNA, By preparing a mutant protein library and using the library to select a protein using the desired property as an index, a protein having the desired property improved can be obtained. In addition, by repeating the above operation, a protein having desired properties can be obtained from the thus obtained protein.
As a method for preparing a DNA encoded by a protein selected as an indicator having desired properties, the DNA is recovered from a transformant producing the protein by a method known per se and amplified using PCR or the like. A method can be used. For amplification of the DNA encoding the desired protein by PCR, a primer having a sequence complementary to the sequence of the vector into which the mutant DNA has been inserted, or a common DNA sequence when a linking unit region having a common DNA sequence is used. A primer having a sequence complementary to the above may be used.
In addition, as a method for inducing a mutation in the amplified DNA, an established error-prone PCR (Leung, DW et al. (1989) J. Methods Cell. Mol. Biol., 1, 11). -15) and Sexual PCR (Stemmer, WPC (1994) Proc. Natl. Acad. Sci. USA, 91, 10747-10751) can be used.
The thus-obtained protein having further improved desired properties can be separated and purified by a method known per se and obtained.
(12) Obtaining a Protein with Improved Desired Properties Using a Nucleic Acid-Protein Linking Molecule
The method for obtaining a protein having an improved desired property described in the above (11) is more efficiently performed by using a nucleic acid-protein linking molecule in which a protein and a nucleic acid encoding the protein are linked and linked. Can be. Nucleic acid-protein linking molecules can be obtained by the phage display method (Smith, GP (1985) Science 228, 1315-1317), the ribosome display method (Hanes, J. and Pluckthun, A. (1997) Proc. Natl. Acad.Sci.USA 94, 4937-4942), in vitro virus method (Nemoto, N. et al. (1997) FEBS Lett. 414, 405-408; Roberts, RW and Szostak, JW. Natl. Acad. Sci. USA 94, 12297-12302; WO 98/16636), STABLE method (Doi, N. et al. (1999) FEBS Lett. 457, 227-230). It can be prepared by methods.
The phage display method is a method that utilizes phages that infect Escherichia coli and proliferate. A phage particle is in a form in which a coat protein constituting the phage wraps a DNA encoding itself. By inserting DNA into the phage coat protein gene and expressing it, a phage library in which the peptide encoded by the DNA is displayed on the surface of phage particles can be prepared. In other words, although indirectly, the protein displayed on the surface of the phage particle is associated with the DNA present in the phage. The DNA encoding the displayed peptide can be obtained by recovering the DNA from the phage selected from the displayed peptides having the desired property as an index.
In the ribosome display method, when the mRNA excluding the stop codon is translated using a cell-free translation system or the like, the synthesized protein is trapped on the ribosome. As a result, a protein-ribosome-mRNA complex is produced and can be used as a protein-nucleic acid linking molecule. DNA encoding the protein can be obtained from the ribosome to which a protein selected from the proteins trapped on the ribosome and having the desired property as an index is bound.
In the in vitro virus method, when expressing mRNA in a cell-free protein synthesis system or the like, it is possible to construct an mRNA-protein linked molecule in which mRNA and protein are chemically bonded on ribosomes. Further, the mRNA-protein linked molecule (in vitro virus) can be selected by an in vitro selection method, and the mRNA portion of the selected in vitro virus can be amplified and obtained by reverse transcription PCR.
In the STABLE method, a protein specifically binding to a ligand substance such as biotin previously bound to DNA, for example, an adapter protein such as streptavidin is expressed as a fusion protein with a protein encoded by the DNA, and the ligand and the adapter protein are expressed. This is a method for binding a protein and a nucleic acid via the binding of Specifically, for example, biotin is chemically bound to the end of DNA in advance, and the DNA is expressed in a cell-free transcription / translation system or the like. At this time, one molecule of DNA is expressed in a state isolated in a microcapsule or the like. The produced protein binds to the DNA present in the microcapsule via a ligand, for example, biotin, and an adapter protein, for example, expressed as a fusion protein, for example, streptavidin. Is produced. The DNA encoding the selected protein can be obtained by amplifying, by PCR or the like, the DNA portion of the connected molecule selected by using the protein portion of the connected molecule having desired properties as an index.
A DNA encoding a protein having desired properties obtained by using such a nucleic acid-protein linking molecule was also introduced with a mutation in the same manner as in (11) above, and the amplified DNA was amplified and amplified. By expressing a DNA to prepare a new mutant protein library and selecting a protein using the library based on the fact that the library has desired properties, a protein having desired properties improved can be obtained. In addition, by repeating the above operation, a protein having desired properties can be obtained from the thus obtained protein. The thus-obtained protein having further improved desired properties can be separated and purified by the above-mentioned method known per se and obtained.
Screening for a protein having desired properties may be performed in the same manner as in the method described in (10) above.
(13) Obtaining DNA encoding a protein having desired properties
By analyzing a protein having the desired properties described in the above (10), (11) or (12) and obtaining a DNA encoding the same, a recombinant of the protein can be produced.
In the case of a protein obtained by the screening method described in the above (10) or (11), the DNA encoding the protein can be analyzed and obtained by appropriately combining commonly used methods known per se. Specifically, in the case of a protein obtained from an alternative splicing library, for example, (1) the molecular weight of the protein is measured using a mass spectrometer or the like, and (2) the unit region contained in the protein is determined from the molecular weight. Can be identified by calculating the type and number of The DNA fragment having the identified DNA sequence can be prepared in the same manner as in the method for preparing the DNA of the linking unit region described in (2) above.
In the case of a protein obtained from a random library, for example, it is possible to analyze the amino acid sequence of the protein by a known method, and to identify the type and the binding order of the unit region contained from the obtained amino acid sequence. it can. The DNA fragment having the identified DNA sequence can be prepared in the same manner as in the method for preparing the DNA of the linking unit region described in (2) above.
In the case of the protein obtained by the screening method described in (12) above, the protein can be obtained by amplifying the nucleic acid portion of the obtained nucleic acid-protein linked molecule by reverse transcription PCR or PCR.
In this specification, unless otherwise specified, procedures for isolating, preparing, ligating, and synthesizing DNA, or for transforming, constructing a plasmid, and culturing a transformant are described in Sonnbrook, J. Am. et al. (1989) Molecular Cloning, 2 nd The method can be carried out by the method described in Edition, Cold Spring Harbor Laboratory Press or a method analogous thereto.
The contents described in the specifications of Japanese Patent Application Nos. 2000-293692 and 2001-29138, which are the basis of the priority claimed by the present application, are all incorporated herein as a part of the disclosure of the present specification. Shall be quoted inside.
Hereinafter, the present invention will be described in more detail with reference to examples.However, the following examples should be regarded as helping to obtain specific recognition of the present invention, and the scope of the present invention is not limited by the following examples. Not something.
Example
(Example 1)
(1) Preparation of unit region DNA
The entire region of the dinucleotide binding site of glutaminyl-tRNA synthetase and part of the acceptor domain (Rould, MA et al. (1989) Science 246, 1135-1142) are composed of 150 amino acids. (Hoben, P. et al. (1982) J. Biol. Chem., 257, 11644-11650). A DNA encoding 25 amino acid residues obtained by dividing the entire region of the dinucleotide binding site and a region corresponding to a part of the acceptor domain into six, and 75 base pairs as a unit region DNA (1 to 6; SEQ ID NO: 1) ~ 6). The unit region DNA fragment was prepared by chemical synthesis (Espec Oligo Service). In addition, a DNA fragment (T7; SEQ ID NO: 19) containing a T7 promoter sequence as a 5 ′ consensus sequence was prepared by chemical synthesis (Espec Oligo Service). Similarly, the 3 'consensus sequence (Ex; SEQ ID NO: 20) was also prepared by chemical synthesis (Espec Oligo Service).
Each unit region synthetic DNA fragment and common sequence synthetic DNA fragment are annealed to form a double strand, and have a forward primer (F1 to F6; SEQ ID NO: 7 to SEQ ID NO: 7) having homology to the 5 ′ base sequence of each unit region DNA. 12) and a reverse primer (R1 to R6; SEQ ID NOS: 8 to 18) having homology with the 3 ′ nucleotide sequence, and a forward primer (FT7; sequence) having homology with the 5 ′ nucleotide sequence of each common sequence No. 21, FEx; SEQ ID NO: 23) and a reverse primer (RT7; SEQ ID NO: 22, REx; SEQ ID NO: 24) having homology to the 3′-side nucleotide sequence (date concept).
Each primer was phosphorylated prior to PCR. The phosphorylation reaction solution (30 μl) contains 20 μl of the DNA solution, 10 mM ATP, 1 unit of polynucleotide phosphate kinase (New England Biolab), and 3 μl of the attached 10 × reaction buffer. The PCR reaction solution (50 μl) contains 20 pmol of each primer, 200 μM of dNTPs, 1 unit vent DNA polymerase (manufactured by New England Biolab), and 5 μl of the attached 10 × vent DNA polymerase buffer. The reaction conditions are as follows: the first stage (1 cycle) at 95 ° C for 5 minutes; the second stage (30 cycles) at 95 ° C for 30 seconds, 60 ° C for 30 seconds; and the third stage (1 cycle) at 4 ° C for 10 minutes. Was. A total of eight types of DNA fragments, that is, 6 unit region DNA fragments amplified by PCR, 5 ′ common sequence DNA fragment, and 3 ′ common sequence DNA fragment, were extracted using phenol and chloroform, and then ethanol-precipitated. Dissolved in TE buffer.
(2) Preparation of DNA for linked unit region
The eight types of DNA fragments obtained in the above (1) were ligated in the following combinations.
T7-1, T7-2, T7-3, T7-4, T7-5, T7-6, 1-2, 1-3, 1-4, 1-5, 1-6, 1-Ex, 2- 3, 2-4, 2-5, 2-6, 2-Ex, 3-4, 3-5, 3-6, 3-Ex, 4-5, 4-6, 4-Ex, 5-6, 5-Ex, 6-Ex.
The reaction solution contains 10 μl of the DNA solution and 10 μl of ligation high (manufactured by Toyobo). The reaction was performed at 16 ° C. for 1 hour. The solution containing the ligation unit region DNA that has undergone this reaction is referred to as “ligation reaction solution”.
Using the above ligation reaction product as a template DNA, the ligation unit region DNA in which the two unit region DNAs were linked was amplified using the appropriate primers used in (1) above. The amplified ligated single-region DNAs were T7-1, T7-2, T7-3, T7-4, T7-5, T7-6, 1-1, 1-2, 1-3, 1-4, 1- 5, 1-6, 1-Ex, 2-1 2-2, 2-3, 2-4, 2-5, 2-6, 2-Ex, 3-1 -3-2, 3-3, 3-4, 3-5, 3-6, 3-Ex, 4-1 4-2, 4-3, 4-4, 4-5, 4-6, 4-Ex, 5-1 and 5- 2,5-3,5-4,5-5,5-6,5-Ex, 6-1,6-2,6-3,6-4,6-5,6-6,6-Ex There are 48 types.
The PCR reaction solution (50 μl) was composed of 20 pmol of each primer, 200 μM of dNTPs, 1 μl of a ligation reaction solution, 1.5 mM MgCl 2 2 1 unit of Taq DNA polymerase (manufactured by Toyobo Co., Ltd.) and an attached 10 × Taq DNA polymerase buffer. The reaction conditions are as follows: the first stage (1 cycle) at 95 ° C for 5 minutes; the second stage (30 cycles) at 95 ° C for 30 seconds, 60 ° C for 30 seconds; and the third stage (1 cycle) at 4 ° C for 10 minutes. Was. These PCR reaction solutions were precipitated with ethanol, dissolved in 20 μl of sterilized water, and electrophoresed using a low-melting point agarose gel. After electrophoresis, Objective The DNA band was cut out, extracted with phenol and chloroform, precipitated with ethanol, and dissolved in 60 μl of sterilized water. The concentration of the obtained linked unit region DNA was determined by measuring the absorbance at 260 nm. The concentration of all the linking unit region DNAs was about 60 to 100 ng / μl.
The obtained 48 kinds of DNAs of the connection unit region were cloned using TOPO TA Cloning KIT (manufactured by Invitrogen). The cloning procedure followed the protocol attached to KIT (TOPO TA Cloning Ver. K: Five Minutes Cloning of Taq Polymerase-Amplified PCR Products, Invitrogen). First, 4 μl of the PCR product of the ligation unit region DNA, 1 μl of the salt solution attached to KIT, and 1 μl of PCR-TOPO vector were mixed and incubated at 25 ° C. for 5 minutes. Next, 2 μl of the reaction solution and 50 μl of the competent cells attached to KIT were mixed and incubated on ice for 30 minutes. Then, after incubating at 42 ° C. for 30 seconds, all the competent cells were added to 250 μl of SOC medium attached to KIT, and cultured at 37 ° C. for 30 minutes. Thereafter, 50 μl of SOC was applied to an LB plate to which 50 μg / ml of ampicillin was added. The LB plate used was coated with 24 μl of 40 μg / ml isopropyl-1-thio-β-D-galactoside galactose (IPTG) and 40 μl of a 40 μg / ml X-gal solution in advance.
After incubating the above LB plate for 12 hours at 37 ° C., about 200 colonies were confirmed on the plate. Three blue colonies were selected for each ligation unit region DNA, and it was examined by colony PCR whether or not the desired ligation unit region DNA was contained on the plasmid. Here, the reason why blue colonies were selected instead of white was that all unit region DNAs and common sequence DNAs consisted of multiples of 3 base pairs, did not cause a frame shift in the lacZ gene, and affected the activity. I expected that there would be none. The reaction solution (50 μl) for colony PCR was composed of 20 pmol of each primer, 200 μM of dNTP, 1.5 mM MgCl 2 1 unit of Taq DNA polymerase (manufactured by Toyobo Co., Ltd.), and 5 μl of the attached 10 × Taq DNA polymerase buffer. As a template DNA, a colony suspended in sterile water was used. The reaction conditions are as follows: 1st stage (1 cycle) 95 ° C for 5 minutes; 2nd stage (30 cycles) 95 ° C for 30 seconds, 60 ° C for 30 seconds, 72 ° C for 30 seconds; 3rd stage (1 cycle) 4 ° C for 10 minutes. The colony PCR product was analyzed by agarose electrophoresis, and after confirming that the target ligation unit region DNA was amplified, the product was purified using Wizard PCR Preps DNA Purification System (Promega), and the DNA sequencer was used. (CEQ2000 DNA Analysis System; Beckman Coulter, Inc.) was used to analyze the nucleotide sequence. By analyzing the base sequence, it was confirmed that there was no mutation such as substitution, insertion, or deletion in the prepared DNA of the connection unit region, and the DNA was used as a template DNA for the subsequent PCR.
(3) Preparation of mutant DNA library
PCR was performed by mixing all of the DNAs of the connection unit region prepared in the above (2). A PCR reaction solution (50 μl) was prepared by combining a forward primer of T7 (SEQ ID NO: 21) and a reverse primer of Ex (SEQ ID NO: 24) as primers in 20 pmol each, and a total of 36 kinds of linked unit region DNAs including unit regions 1 to 6 in total. 750 fmol, 15 fmol in total of 12 kinds of DNAs of the connecting unit region containing T7 and Ex, 200 μM of dNTPs, 1 unit of Vent DNA polymerase (manufactured by New England Biolab), and 5 μl of the attached 10 × vent DNA polymerase buffer. The reaction conditions are as follows: 1st stage (1 cycle) 95 ° C for 5 minutes; 2nd stage (20 cycles) 95 ° C for 30 seconds, 60 ° C for 30 seconds, 72 ° C for 3 minutes; 3rd stage (1 cycle) 4 ° C for 10 minutes. The resulting PCR product was concentrated by ethanol precipitation, and then electrophoresed on a low-melting point agarose gel, whereby 15 or more ladder-like bands could be confirmed (FIG. 2). Since the interval between the ladders is equivalent to 75 base pairs, these ladders are T7- (X) -Ex and T7- (X) in order of decreasing molecular weight. 2 -Ex, T7- (X) 3 -Ex, ..., T7- (X) Fifteen -Ex, ... ("X" is any of the unit areas 1 to 6). That is, the possibility that six unit regions are connected in various orders and numbers inside T7 which is a 5 ′ common sequence and Ex which is a 3 ′ common sequence was shown.
(4) Confirmation of mutant DNA library
In order to check whether the PCR product obtained in the above (2) has the sequence as predicted above, T7- (X) 6 The DNA band corresponding to -Ex was cut out, and after cloning, the nucleotide sequence was analyzed. First, T7- (X) was prepared using Wizard PCR Preps DNA Purification System (manufactured by Promega). 6 The DNA band corresponding to -Ex was purified. Subsequently, dA was added to the 3 ′ end using Taq DNA polymerase, followed by cloning using TOPO TA Cloning KIT (Invitrogen). The cloning procedure is the same as that described in the above (2) except that an LB plate to which IPTG and X-gal were not applied was used.
After incubating the LB plate for 12 hours at 37 ° C., about 100 colonies were confirmed on the plate. Colony PCR was performed on all colonies to check whether insert DNA was contained. The reaction solution (50 μl) of the colony PCR was prepared by adding 20 pmol of each of the M13 forward and reverse primers attached to Kit, 200 μM of dNTP, 1.5 mM MgCl 2. 2 1 unit of Taq DNA polymerase (manufactured by Toyobo Co., Ltd.), and 5 μl of the attached 10 × Taq DNA polymerase buffer. As a template DNA, a colony suspended in sterile water was used. The reaction conditions are as follows: first stage (1 cycle) 95 ° C. for 5 minutes; second stage (30 cycles) 95 ° C. for 30 seconds, 55 ° C. for 30 seconds, 72 ° C. for 30 seconds; third stage (1 cycle) 4 ° C for 10 minutes. As a result of analyzing the colony PCR product by agarose electrophoresis, it was confirmed that 66 colonies contained the insert DNA. These colony PCR products were purified using Wizard PCR Preps DNA Purification System (Promega), and the nucleotide sequence was analyzed by a DNA sequencer (CEQ2000 DNA Analysis System, Beckman Coulter).
Table 1 shows the results of analyzing 66 sequences in which the insert DNA was confirmed. The numbers in the table indicate the order of ligation of the DNA fragments 1 to 6. Of the 66 sequences, 64 sequences had T7 at the 5 'end and Ex at the 3' end, and had a structure in which the internal unit regions were linked in various orders. That is, it was confirmed that the reaction as estimated above occurred. The breakdown of the 66 sequences is T7- (X) 9 -One Ex, T7- (X) 7 -One Ex, T7- (X) 6 -Ex is 50 pieces, T7- (X) 5 -Ex is 5 pieces, T7- (X) 4 -Ex 4 pieces, T7- (X) 3 T7- (X) having three Ex and no Ex on the 3 ′ side 7 2 had the above sequence. Of these, only two sets had the same sequence, and 64 different sequences were confirmed. That is, it was confirmed that in one PCR, many structural genes in which six kinds of unit region DNAs were linked in various different orders were synthesized at the same time. Since the sequence analyzed after cloning using Escherichia coli is only a small part of the DNA produced by the PCR, more types of structural genes are constructed in the mutant DNA library produced by the PCR. It is assumed that there is.
The analyzed base sequence contains T7- (X) 6 The reason that longer DNA or shorter DNA other than -Ex was contained was that T7- (X) cut out by low melting point agarose electrophoresis. 6 This is probably because a small number of DNAs having different lengths were present in the DNA band corresponding to -Ex. These DNAs also had T7 on the 5 ′ side and Ex on the 3 ′ side, and had sequences in which unit region DNAs were linked in various orders.
In addition, in the case of two types of sequences having no Ex at the 3 'end, it is presumed that the sequence is generated due to the connection unit region DNA itself to be internally connected serving as a primer. In the sequence of T7-3-4-6-5-1-2-5-Ex, a large deletion was observed between 65. This is because the sequence “gTACgACT” from the 15th position on the 5 ′ side of the unit region DNA 6 is identical to the sequence “gTACgACT” from the 3rd position on the 5 ′ side of the unit region DNA5. It is considered that the replacement occurred.
Substitutions were found at nine of the 40299 base pairs analyzed. That is, the frequency of substitution is about 1/5000, and the frequency of substitution in normal PCR using Vent DNA polymerase (Mattila et al. (1991) Nucl. Acids. Res., 19, 4967-4973). In comparison, the frequency was 2.5 to 5 times higher. However, this value is sufficiently acceptable for the purpose of constructing a library for evolutionary molecular engineering.
In the agarose electrophoresis of the PCR product in this example, 15 or more ladder-like DNA bands were confirmed, and most of the analyzed DNA sequences had different sequences, and frame shifts such as deletions were observed. When six types of unit regions were used, a single PCR resulted in Fifteen ≒ 5 × 10 11 It is possible to construct a structural gene that does not contain more than one type of stop codon.
Figure 2002026964
Figure 2002026964
(Example 2)
(1) Preparation of unit region DNA
The ligand binding domain of the human estrogen receptor α (hereinafter, may be referred to as “hERαLBD”: Greene et al. (1986) Science, 231 (4742), 1150-1154; Brzozooski et al. (1997) Nature, 389 ( 6652), 753-758) are composed of 258 amino acids. The entire region of this hERαLBD is expressed by the exon of the gene (Ponglikitmongol et al. (1988) EMBO J., 11, 3385-3388) and the secondary structure in the three-dimensional structure of the protein (Tanenbaum et al. (1998) Proc. Natl. Acad. Sci.USA., 95 (11), 5998-6003), and 10 unit area regions were defined. Each unit region encodes 34, 35, 29, 17, 26, 37, 24, 17, and 20 amino acids from the N-terminal side (FIG. 4), and the plasmid containing hERαLBD is used as a template. Amplified and prepared by PCR using a forward primer having homology to the base sequence on the 5 'side and a reverse primer having homology to the base sequence on the 3' side of the region DNA fragment (prepared by the date concept) (This plasmid was kindly provided by Professor GL Greene of the University of Chicago).
The prepared unit regions were 1, 2, 3, 4, 5, 6, 7, 8, 9, and 10 from the N-terminal side. Primers are SEQ ID NOS: 25 and 26 for unit region DNA1, SEQ ID NOs: 27 and 28 for unit region DNA2, SEQ ID NOs: 29 and 30 for unit region DNA3, SEQ ID NOs: 31 and 32 for unit region DNA4, unit region For DNA5, SEQ ID NOS: 33 and 34, for unit region DNA6, SEQ ID NOS: 35 and 36, for unit region DNA7, SEQ ID NOs: 37 and 38, for unit region DNA8, SEQ ID NOs: 39 and 40, and for unit region DNA9 Used SEQ ID NOS: 41 and 42, and for the unit region DNA 10, SEQ ID NOs: 43 and 44. In addition to these unit region DNAs, a DNA fragment having a T7 promoter sequence (T7OM: SEQ ID NO: 45) and a 3 ′ terminal common sequence DNA fragment (CBSHis: SEQ ID NO: 46) are chemically synthesized as 5 ′ terminal common sequence DNA fragments. (Requested to Date Concept) Using this common sequence synthesized DNA fragment as a template, homology to the 3 ′ nucleotide sequence with a forward primer (T7OM: SEQ ID NO: 47; CBSHis: SEQ ID NO: 49) having homology to the 5 ′ nucleotide sequence of each DNA fragment (T7OM: SEQ ID NO: 48; CBSHis: SEQ ID NO: 50) was amplified by PCR using a reverse primer having the following sequence: The prepared DNA fragment having the common sequence was T7OM on the 5 ′ side and CBSHis on the 3 ′ side.
The primers used for preparing the unit region DNA and the common sequence DNA fragment were phosphorylated prior to PCR. The phosphorylation reaction solution (30 μl) contains 20 μl of a DNA solution (20 pmol / μl), 10 mM ATP, polynucleotide phosphate kinase (manufactured by New England Biolab), and 3 μl of an attached 10 × reaction buffer. The phosphorylation reaction was performed at 37 ° C. for 12 hours.
The PCR performed using the phosphorylated primers was performed as follows: 1 μl of a DNA solution (20 ng / μl) as a reaction solution (50 μl), 20 pmol of each primer, 200 μM of dNTPs, 2.5 units of Pfu DNA polymerase (manufactured by STRATAGENE), and the attached 10 × Using 5 μl of Pfu DNA polymerase reaction buffer, the reaction conditions were as follows: the first step (1 cycle): 95 ° C./5 minutes, the second step (30 cycles): 95 ° C./30 seconds, 56 ° C./30 seconds, the third step (1 cycle) (Cycle) 4 ° C./10 minutes. The above-mentioned ten unit region DNA fragments and two common sequence DNA fragments amplified by PCR were prepared using Wizard PCR Preps (manufactured by Promega) and dissolved in 60 μl of sterilized water.
(2) Preparation of DNA for linked unit region
The twelve kinds of DNA fragments prepared in the above (1) were ligated by DNA ligase in the following combinations, and then, using this ligation unit region DNA fragment as a template, the sequence was homologous to the sequence at the 5 ′ end of the first ligation unit region DNA. And a reverse primer having homology to the sequence at the 3 'end of the second unit region DNA.
T7OM-1, T7OM-2, T7OM-3, T7OM-4, T7OM-5, T7OM-6, T7OM-7, T7OM-8, T7OM-9, T7OM-10, 1-2, 1-3, 1- 4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-CBSHis, 2-3, 2-4, 2-5, 2-6, 2-7, 2-8, 2-9, 2-10, 2-CBSHis, 3-4, 3-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-CBSHis, 4- 5, 4-6, 4-7, 4-8, 4-9, 4-10, 4-CBSHis, 5-6, 5-7, 5-8, 5-9, 5-10, 5-CBSHis, 6-7, 6-8, 6-9, 6-10, 6-CBSHis, 7-8, 7-9, 7-10, 7-CBSHis, 8-9, 8-10, 8-CBSHis, 9- 10, 9 CBSHis
A reaction solution for ligation of unit region DNA fragments by DNA ligase was 1 μl of a DNA solution (10 ng / μl), 400 units of T4 DNA ligase (manufactured by New England Biolab), 1 μl of an attached 10 × T4 DNA ligase reaction buffer, and 6 μl of sterilized water. And the reaction was carried out at 16 ° C. for 1 hour. A PCR reaction solution (50 μl) using the DNA fragment of the ligation unit region as a template was 1 μl of a reaction solution of the above DNA ligase containing 20 pmol of each primer, 200 μM of dNTPs, and ligation unit region DNA, and 1.5 mM MgCl 2. 2 , 1 unit of Taq DNA polymerase (manufactured by Toyobo Co., Ltd.), and 5 μl of the attached 10 × Taq DNA polymerase reaction buffer. The reaction conditions are as follows: the first stage (one cycle) at 95 ° C./5 minutes, the second stage (30 cycles) at 95 ° C./30 seconds, 60 ° C./30 seconds, and the third stage (one cycle) at 4 ° C./10 minutes. Was.
The obtained DNA fragment of the linking unit region was cloned using a TOPO TA Cloning KIT (manufactured by InVitrogen). The cloning procedure was in accordance with the protocol attached to the KIT (TOPO TA Cloning, Ver. K: Five minutes cloning of Taq polymerase-amplified PCR products, Invitrogen), and the vector used was the one attached thereto. Specifically, 4 μl of the PCR reaction solution, 1 μl of the attached salt solution, and 1 μl of the PCR TOPO vector of the DNA fragment of the entire ligation unit region prepared above were mixed and incubated at 25 ° C. for 5 minutes.
Next, 2 μl of the above reaction solution and 50 μl of the attached competent cells were mixed and incubated on ice for 30 minutes. After incubating at 42 ° C. for 30 seconds, the attached SOC medium (250 μl) was added and incubated at 37 ° C. for 30 minutes. 50 μl of this was added to an LB plate to which 50 μl / ml ampicillin had been added in advance, 24 μl of 40 μg / ml isopropyl-1-thio-β-galactoside galactose (IPTG) and 40 μl of a 40 μg / ml X-gal solution. Was applied and then applied.
After incubating the LB plate for 12 hours at 37 ° C., about 200 colonies were confirmed on the plate. Three blue colonies were selected for each ligation unit region DNA, and it was confirmed by colony PCR whether the desired ligation unit region was contained on the plasmid. Here, the reason why the blue colonies were selected was that all the unit region DNAs had a base sequence that was a multiple of 3 and were expected not to cause a frame shift in the lacZ gene and not to affect the activity. is there. The reaction solution of the colony PCR was prepared using the M13 primer attached to the TOPO TA Cloning KIT and the M13 Rev. Primers (manufactured by InVitrogen) 20 pmol each, dNTPs 200 μM, 1.5 mM MgCl 2 , 1 unit of Taq DNA polymerase (manufactured by Toyobo Co., Ltd.), 5 μl of an attached 10 × Taq DNA polymerase reaction buffer, and a solution in which colonies were suspended in sterile water. The reaction conditions were the first stage (one cycle) at 95 ° C./5 PCR was carried out in the second step (30 cycles) at 95 ° C./30 seconds, 60 ° C./30 seconds, 72 ° C./30 seconds, and the third step (1 cycle) at 4 ° C./10 minutes.
The colony PCR reaction solution was analyzed by agarose gel electrophoresis, and after confirming that the target ligation unit region DNA fragment was amplified, the product was purified using Wizard PCR Preps DNA Purification System (Promega). Then, the nucleotide sequence was analyzed using a DNA sequencer (CEQ2000 DNA Analysis System: manufactured by Beckman Coulter, Inc.). After analyzing the nucleotide sequence, it was confirmed that there was no mutation such as substitution, insertion, or deletion.
Using the plasmid containing the linking unit region DNA confirmed to have the correct nucleotide sequence as a template, the sequence at the 5 'end of the first unit region DNA of each linking unit region DNA shown in (1) Ligation unit region DNA was prepared again by colony PCR using a forward primer having homology with the reverse primer and a reverse primer having homology with the sequence at the 3 ′ end of the second unit region DNA. The PCR reaction solution (50 μl) contained 20 pmol of each primer, 200 μM of dNTPs, 3.75 units of Pfu DNA polymerase (manufactured by STRATAGENE), and 5 μl of the attached 10 × Pfu DNA polymerase reaction buffer. The cycle was performed at 95 ° C./5 minutes, the second stage (30 cycles) at 95 ° C./30 seconds, 56 ° C./30 seconds, and the third stage (one cycle) at 4 ° C./10 minutes.
From the PCR reaction solution in which the above-mentioned ligation unit region DNA was prepared, the ligation unit region DNA fragment was concentrated by ethanol precipitation, dissolved in 20 μl of sterilized water, separated by low melting point agarose gel electrophoresis, and the band of the target DNA was cut out. . DNA was extracted from the agarose gel fragment using phenol / chloroform, ethanol-precipitated, and dissolved in 60 μl of sterile water. The concentration of the obtained aqueous DNA solution of each linking unit region was determined by measuring the absorbance at 260 nm. The DNA of the connected unit region obtained here was used as a template DNA for PCR for constructing a subsequent mutant DNA library.
(3) Classification of linking unit region DNA
All the linked unit region DNAs obtained in the above (2) were classified according to the unit region DNAs they encoded. The classification is based on how many unit regions in the structural gene DNA in which the first unit region DNA and the second unit region DNA of the above-mentioned connected unit region DNA exist are connected. Went as. Here, assuming that the number of unit regions separating the first unit region DNA and the second unit region DNA in the structural gene DNA in which they exist is X, the created connected unit region DNA is from X = 0 to X = 8 (9) (FIG. 5 (a)).
(4) Construction of a mutant DNA library in which eight unit region DNAs are linked
A mutant DNA library in which eight unit region DNAs were linked was prepared using the linked unit region DNA group classified in the above (3) as a template. For each of the connected unit region DNA groups, the total number (L) of connected unit regions obtained by dividing the structural gene is set to 10, and the difference (M) between the total number of unit regions and the number of unit region DNAs contained in the DNA to be prepared is set to 2, Regarding the number (X) of unit regions in which the first unit region DNA and the second unit region DNA are separated in the structural gene DNA in which they exist, the following formula (1)
L-X-1 C MX (1)
And the proportion of each ligation unit region DNA group to the total amount of DNA to be subjected to PCR was determined.
In the classification of the above (3), 36 are the connecting unit region DNA groups that fall into the classification of X = 0, T7OM-1 is 36, 10-CBSHisX is 36, X is 1 the connecting unit region DNA group is 8, and T7OM-2 Was 8, 9-CBSHisX was 8, the DNA group of the linked unit region where X = 2 was 1, T7OM-2 was 1, and 8-CBSHisX was 1.
As the specific amount of DNA, 675 fmol was used as the total amount of DNA in PCR for preparing a mutant DNA library, so that the total amount of DNA in the linked unit region DNA group of X = 0 was 180 fmol, 26 fmol each of the connecting unit region DNAs (1-2, 2-3, 3-4, 5-6, 7-8, 8-9, 9-10), 180 fmol of T7OM-1 and 180 fmol of 10-CBSHisX, Since the total amount of the DNAs in the DNA group of the connecting unit region where X = 1 is 40 fmol, the connecting unit region DNAs (1-3, 2-4, 3-5, 4-6, 5-7, 6-8) which fall into this category are included. , 7-9, 8-10) in 5 fmol increments, T7OM-2 in 40 fmol, 9-CBSHisX in 40 fmol, and the total amount of DNA in the linked unit region DNA group of X = 2 was 5 fmol. Therefore, the linking unit region DNAs (1-4, 2-5, 3-6, 4-7, 5-8, 6-9, 7-10) which fall into the classification are each 0.7 fmol, and T7OM-3 is 5 fmol, 8-CBSHisX was mixed at 5 fmol each to obtain a template DNA for PCR.
The PCR reaction solution (50 μl) includes T7OM forward primer and CBPHis reverse primer, each 20 pmol, 675 fmol of the above-mentioned mixed template DNA, 200 μl of dNTPs, and 1.25 units of KOD Dash DNA polymerase (manufactured by Toyobo Co., Ltd.). 5 × 1 × 10 × KOD Dash DNA polymerase reaction buffer, the reaction conditions were the first stage (1 cycle) 95 ° C./5 min, the second stage (20 cycles) 95 ° C./30 sec, 60 ° C./30 sec, 72 PCR was carried out at a third stage (1 cycle) of 4 ° C./10 minutes at 3 ° C./3 minutes.
The PCR product was concentrated by ethanol precipitation and analyzed by low-melting point agarose gel electrophoresis. As a result, a strong DNA band was confirmed in a region corresponding to the intended molecular weight (FIG. 6 (a)).
(5) Construction of a mutant DNA library in which five unit region DNAs are linked
A mutant DNA library in which five unit region DNAs were linked was prepared using the linked unit region DNA group classified in the above (3) as a template. For each connected unit region DNA group, the total number (L) of connected unit regions obtained by dividing the structural gene is set to 10, and the difference (M) between the total number of unit regions and the number of unit region DNAs contained in the DNA to be prepared is set to 5, Regarding the number (X) of unit regions in which the first unit region DNA and the second unit region DNA are separated in the structural gene DNA in which they exist, the above expression (1) was applied to the PCR of each connected unit region DNA group. The ratio of the DNA to the total amount of DNA to be subjected to was determined.
In the classification of (3) above, 126 were the connecting unit region DNA groups that entered the classification of X = 0, 126 were T7OM-1 and 126 were 10-CBSHisX, 70 were the connecting unit region DNA group of X = 1, and T7OM-2. Is 70, 9-CBSHisX is 70, the linking unit region DNA group of X = 2 is 35, T7OM-3 is 35, 8-CBSHisX is 35, the connecting unit region DNA group of X = 3 is 15, and T7OM-4 is 15 , 7-CBSHisX is 15, the linking unit region DNA group of X = 4 is 5, T7OM-5 is 5, the 6-CBSHisX is 5, the connecting unit region DNA group of X = 5 is 1, and the T7OM-6 is 1,5. -CBSHisX was 1.
As the specific amount of DNA, since 1260 fmol was used as the total amount of DNA in PCR for preparing a mutant DNA library, the total amount of DNA in the DNA unit of the linked unit region region where X = 0 was 210 fmol, and 30 fmol of the connecting unit region DNA (1-2, 2-3, 3-4, 5-6, 7-8, 8-9, 9-10), 210 fmol of T7OM-1 and 210 fmol of 10-CBSHisX, Since the total amount of DNA in the DNA group of the connection unit region where X = 1 is 117 fmol, the DNA of the connection unit region (1-3, 2-4, 3-5, 4-6, 5-7, 6-8) included in the classification is included. , 7-9, 8-10) in 14.6 fmol increments, T7OM-2 in 117 fmol, 9-CBSHisX in 117 fmol, and the total amount of DNA in the linked unit region DNA group of X = 2 is: Since 8 fmol is obtained, 8 fmol each of the connected unit region DNAs (1-4, 2-5, 3-6, 4-7, 5-8, 6-9, 7-10) and 58 fmol of T7OM-3 are included. , 8-CBSHisX is 58 fmol, and the total amount of DNA of the connected unit region DNA group of X = 3 is 25 fmol, so that the connected unit region DNAs (1-5, 2-6, 3-7, 4-8, 5-9, 6-10) in 4 fmol increments, T7OM-4 in 25 fmol, 7-CBSHisX in 25 fmol, and the total amount of DNA in the DNA group of the connection unit region where X = 4 is 8.3 fmol. Linkage of 1.6 fmol of the region DNA (1-6, 2-7, 3-8, 4-9, 5-10), 8.3 fmol of T7OM-5, 8.3 fmol of 6-CBSHisX, and X = 5 unit Since the total amount of the DNAs in the range DNA group is 1.7 fmol, the connecting unit region DNAs (1-7, 2-8, 3-9, 4-10) included in the classification are 0.4 fmol each, and T7OM-6 is 1 fmol. 1.7 fmol and 1.7 fmol of 5-CBSHisX were mixed at a time to obtain a template DNA for PCR.
The PCR reaction solution (50 μl) includes T7OM forward primer and CBPHis reverse primer of 20 pmol each, 1260 fmol of the above-mentioned mixed template DNA, 200 μl of dNTPs, 1.25 units of KOD Dash DNA polymerase (Toyobo), attached 5 × 1 × 10 × KOD Dash DNA polymerase reaction buffer, the reaction conditions were the first stage (1 cycle) 95 ° C./5 min, the second stage (20 cycles) 95 ° C./30 sec, 60 ° C./30 sec, 72 PCR was carried out at a third stage (1 cycle) of 4 ° C./10 minutes at 3 ° C./3 minutes. The PCR product was concentrated by ethanol precipitation and analyzed by low-melting point agarose gel electrophoresis. As a result, a strong DNA band was confirmed in a region corresponding to the intended molecular weight. (FIG. 6 (b))
(6) Confirmation of mutant DNA library
In order to check whether or not the PCR products obtained in the above (4) and (5) have the intended sequence, a region showing a strong DNA band obtained by the low melting point agarose gel electrophoresis was cut out, and Wizard was used. The DNA was extracted and purified using PCR Preps DNA Purification System (Promega). Subsequently, dA was added to the 3 'end using Taq DNA polymerase, and then cloned using the TOPO TA Cloning KIT (manufactured by InVitrogen) in the same manner as in (2) above. At this time, the LB plate used was not coated with IPTG and X-Gal.
After incubating the LB plate for 12 hours at 37 ° C., 100 or more colonies were confirmed on the plate. For 40 or more colonies, the nucleotide sequence of the PCR product DNAs prepared in (4) and (5) contained in the plasmid was analyzed in the same manner as in (2) above.
With regard to the PCR product of (4) above (to which eight unit region DNAs were bound), the nucleotide sequence of 38 clones was analyzed. The result is shown in FIG. Regarding the PCR product of (5) (in which five unit regions were bound), the nucleotide sequence of 33 clones was analyzed. The result is shown in FIG. All of the DNA fragments obtained by any of the PCRs have a T7OM sequence at the 5 'end and a CBSHis sequence at the 3' end, and the internal unit region DNA maintains the order from upstream to downstream in the structural gene. It had a structure that was variously connected as it was. This means that the number of each unit region that appeared in the base sequence of the analyzed 71 DNA fragments was 1/39, 2/30, 3/52, 4/34, 5/40, 6 / 43, 7/56, 8/32, 9/43, and 10/40, which were confirmed by the fact that there was no significant bias in the frequency of appearance of the unit regions used.
Further, among the DNA fragments analyzed above, there was only one set having the same sequence in the sequences shown in FIG. Regarding the substitution, out of 71 clones and 47533 bases, 60 bases were replaced. This mutation rate (1.3 × 10 -3 ) Was determined to be sufficiently low that it would not hinder the construction of the library. Of the 50 substitutions, only two had a stop codon. Furthermore, there were two types of sequences linked in unintended regions. One was caused by induction of homologous recombination at "atgatc" which is present in both the unit region DNA1 and the unit region DNA2. The other was caused by the induction of homologous recombination between “ccagggga” and “ccagtga” which are commonly present in both the unit region DNA5 and the unit region DNA4. The other sequences did not show any frameshift mutations, ie, no deletions or insertions. That is, it was shown that most of the DNA contained in the mutant DNA library obtained by PCR of the present invention maintained the correct reading frame.
In the sequence shown in FIG. 7, 3 clones of DNA fragments each having 5 linked unit regions, 10 clones of 6 linked DNA fragments, 9 clones of 7 linked DNA fragments, and 10 clones of 8 linked DNA fragments Two clones and nine cloned DNA fragments were one clone, and ten cloned DNA fragments were one clone. Further, in the sequence shown in FIG. 8, one DNA fragment in which two unit regions are linked, two clones in which three DNA fragments are linked, nine clones in which four DNA fragments are linked, and five DNA fragments in which five linked. Were 17 clones, and 4 cloned DNA fragments were 4 clones.
The above results include DNA fragments composed of a larger or smaller number of unit region DNAs than the intended number of unit regions. This shows that by applying the library to evolutionary molecular engineering, a mutant DNA library sufficient to achieve the object of the present invention to create a useful protein could be constructed.
(Example 3)
A mutant DNA library was prepared by Error-prone PCR.
When performing PCR by mixing the connection unit regions in the same manner as in the operations (1) to (3) and (5) of Example 2, manganese chloride was added to the PCR reaction solution at a concentration of 0 to 1 mM. . The nucleotide sequence of the amplified DNA was analyzed in the same manner as in Example 2, (6). Table 2 shows the results. It was found that the frequency of base substitution increased almost linearly with an increase in manganese ion concentration. Therefore, when it was desired to construct a library at an arbitrary substitution rate, it was found that manganese ions should be added according to the data in Table 2.
Figure 2002026964
Industrial potential
According to the method of the present invention, there is provided a method for constructing a population of genes in which a plurality of DNA fragments encoding an arbitrary amino acid sequence are linked in various orders and lengths, and a mutant prepared from the mutant DNA library is provided. By selecting a desired protein using a protein library and using evolutionary molecular engineering, we can create proteins with new functions that combine secondary structures, modules, motifs, etc., which are parts (unit regions) of natural proteins. Is extremely useful.
Further, a protein having a reduced molecular weight can be obtained from a mutant protein library prepared from the alternative splicing library of the present invention. Denaturation of relatively small globular proteins having a molecular weight of 20,000 or less is known to be reversible, and once denatured, its function can be restored by returning to appropriate conditions. In addition, proteins having such properties have strong resistance to heat and organic solvents, as represented by ribonuclease. In addition, the recovery rate of a purified product in a bioprocess using such an enzyme is high. The mutant protein obtained from the alternative splicing library of the present invention can reduce the size of any protein while maintaining its function, and thus expands its application as a protein.
[Sequence list]
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964
Figure 2002026964

[Brief description of the drawings]
FIG. 1 is a diagram showing the concept of the present invention. The case where three types of unit region DNAs are shuffled is shown as an example. By mixing the linked unit region DNAs in which the two unit region DNAs are linked and performing PCR using the forward primer of T7 and the reverse primer of Ex, a large number of the three unit region DNAs linked in various orders Is synthesized by one PCR.
FIG. 2 is an electrophoretic photograph obtained by separating PCR products using an agarose gel (2%). Each lane contains 50 μl of PCR product. The sequence corresponding to the ladder-like DNA band is shown on the right. M is a DNA marker.
FIG. 3 is a diagram showing the principle of the method for constructing a mutant DNA library of the present invention.
FIG. 4 is a block diagram showing that the ligand binding domain of human estrogen receptor α is divided at exon and secondary structure boundaries and divided into ten unit regions.
FIG. 5 is a diagram showing all connected unit region DNAs used when constructing the mutant gene library of the present invention from a structural gene consisting of 10 unit regions. Each connecting unit region DNA can be classified into nine types of connecting unit region DNA groups from X = 0 to X = 8 as indicated by diagonal lines (a). The appearance frequency of each connected unit region DNA group appearing in a population of structural genes composed of a specific number of unit regions is shown (b).
FIG. 6 is an agarose gel electrophoresis photograph obtained by separating a PCR product when the mutant DNA library of the present invention was constructed. (A) and (b) are PCR products when constructing a group of structural genes composed of 8 and 5 unit region DNAs, respectively. In the figure, M indicates a marker.
FIG. 7 is a diagram showing the structure of the DNA of the mutant gene library of the present invention obtained by performing PCR under such conditions that a structural gene is obtained from eight unit region DNAs.
FIG. 8 is a diagram showing the structure of the DNA of the mutant gene library of the present invention, which was obtained by performing PCR under conditions that obtain a structural gene from five unit region DNAs.

Claims (19)

(a)単位領域DNAを任意の組み合わせで連結し、(b)得られた連結単位領域DNAを、用いられるすべての連結単位領域DNAの末端の配列が少なくとも他の1種類の連結単位領域DNAの末端の配列と重複するように選択して混合し、(c)該連結単位領域DNAの混合物を鋳型としてPolymerase Chain Reactionを行って2以上のクローンを含むDNAライブラリーを取得することを含む、DNAライブラリーの構築方法。(A) the unit region DNAs are ligated in any combination, and (b) the obtained connected unit region DNAs are combined with at least one other type of the connected unit region DNAs at all the terminal sequences of all the connected unit region DNAs used. (C) performing a Polymerase \ Chain \ Reaction using the mixture of ligation unit region DNAs as a template to obtain a DNA library containing two or more clones. How to build a library. 工程(b)において、連結単位領域DNAを、用いられる全ての連結単位領域の末端の配列が少なくとも他の1種類の連結単位領域DNAの末端の配列と重複し、かつ少なくとも1種類の連結単位領域DNAの5’末端あるいは3’末端のいずれかの配列が少なくとも他の2種類の連結単位領域DNAの末端と重複するように選択して混合する、請求項1に記載の方法。In the step (b), the connecting unit region DNA is prepared by combining at least one type of connecting unit region with the terminal sequence of at least one other type of connecting unit region DNA being used. The method according to claim 1, wherein the DNA is selected and mixed so that the sequence at either the 5 'end or the 3' end of the DNA overlaps at least the ends of the other two types of connecting unit region DNA. 連結単位領域DNAの混合物が、用いられる単位領域DNAの全ての組み合わせで2つの単位領域DNAが連結された連結単位領域の混合物である、請求項1または2に記載の方法。The method according to claim 1 or 2, wherein the mixture of linked unit region DNAs is a mixture of linked unit regions in which two unit region DNAs are linked in all combinations of unit region DNAs used. 単位領域DNAがタンパク質をコードする構造遺伝子DNAをL個に分断したものであり(ここで、Lは3以上の整数である)、その連結方法が、任意の単位領域DNAの3’末端と、該単位領域より上記タンパク質においてC末端側に存在する単位領域DNAの5’末端とが各単位領域のアミノ酸配列が保たれるように連結するものであり、かつ連結単位領域DNAの混合物が、連結した各単位領域DNAがもとの構造遺伝子において隔てている単位領域の数であるX(但しXは0以上L−2以下の整数である)を指標として分類した各連結単位領域DNAが、下記式(1)を満たす割合を指標にして混合されたものである、請求項1に記載の方法。
L−X−1M−X    (1)
(式中、LおよびXは上記と同様の意味を示し、Mは単位領域の総数と作製する変異DNAの有する単位領域数との差を示す)
The unit region DNA is obtained by dividing a structural gene DNA encoding a protein into L pieces (here, L is an integer of 3 or more). The 5 ′ end of the unit region DNA present on the C-terminal side of the protein from the unit region is linked so that the amino acid sequence of each unit region is maintained, and the mixture of linked unit region DNAs is linked. Each of the linked unit region DNAs classified using X as an index (where X is an integer of 0 or more and L-2 or less), which is the number of unit regions separated from each other in the original structural gene, is as follows: The method according to claim 1, wherein the mixture is performed using a ratio satisfying the expression (1) as an index.
L-X-1 C MX (1)
(In the formula, L and X have the same meanings as described above, and M represents the difference between the total number of unit regions and the number of unit regions of the mutant DNA to be prepared.)
単位領域DNAが、同様の3次構造を有するがそのアミノ酸配列が異なるタンパク質群をコードするDNAをそれぞれL個の単位領域に分断したものであり(ここで、Lは3以上の整数である)、その連結方法が、任意の単位領域DNAの3’末端と、該単位領域より上記タンパク質群においてC末端側に存在する単位領域DNAの5’末端とが各単位領域のアミノ酸配列が保たれるように連結するものであり、かつ連結単位領域DNAの混合物が、連結した各単位領域DNAがもとのタンパク質群において隔てている単位領域の数であるX(但しXは0以上L−2以下の整数である)を指標として分類した各連結単位領域DNAが下記式(1)を満たす割合を指標にして混合されたものである、請求項1に記載の方法。
L−X−1M−X    (1)
(式中、LおよびXは上記と同様の意味を示し、Mは単位領域の総数と作製する変異DNAの有する単位領域数との差を示す)
Unit region DNA is a DNA obtained by dividing DNAs encoding proteins having similar tertiary structures but different amino acid sequences into L unit regions (where L is an integer of 3 or more). The ligation method is such that the amino acid sequence of each unit region is maintained at the 3 'end of the arbitrary unit region DNA and the 5' end of the unit region DNA located on the C-terminal side in the protein group from the unit region. X (where X is 0 or more and L-2 or less) is a mixture of linked unit region DNAs, and the mixture of the linked unit region DNAs is the number of unit regions separated in the original protein group. The method according to claim 1, wherein each of the connected unit region DNAs classified using an index as an index is a mixture obtained by using an index that satisfies the following formula (1) as an index.
L-X-1 C MX (1)
(In the formula, L and X have the same meanings as described above, and M represents the difference between the total number of unit regions and the number of unit regions of the mutant DNA to be prepared.)
Polymerase Chain Reactionが、構築されるべきDNAの両末端となるべき単位領域DNAと相補的な配列を有するプライマーの存在下で行われる請求項1〜5のいずれかに記載の方法。The method according to any one of claims 1 to 5, wherein the Polymerase Chain Reaction is performed in the presence of a primer having a sequence complementary to a unit region DNA to be both ends of the DNA to be constructed. Polymerase Chain Reactionが、共通DNA配列を含む連結単位領域DNAと該共通DNA配列に相補的な配列を有するプライマーの存在下で行われる請求項1〜6のいずれかに記載の方法。The method according to any one of claims 1 to 6, wherein the Polymerase Chain Reaction is performed in the presence of a connecting unit region DNA containing a common DNA sequence and a primer having a sequence complementary to the common DNA sequence. 請求項1〜7のいずれかの方法により得られる変異DNAライブラリー。A mutant DNA library obtained by the method according to claim 1. 請求項8に記載のDNAライブラリーを発現ベクターに組み込み、該発現ベクターで宿主細胞を形質転換し、該形質転換体を培養し、培養物からタンパク質を採取することにより得られるタンパク質ライブラリー。A protein library obtained by incorporating the DNA library according to claim 8 into an expression vector, transforming a host cell with the expression vector, culturing the transformant, and collecting a protein from the culture. 請求項8に記載のDNAライブラリーを転写することにより得られるRNAライブラリー。An RNA library obtained by transcribing the DNA library according to claim 8. 請求項8に記載のDNAライブラリー、または請求項10に記載のRNAライブラリーを無細胞転写および/または翻訳系で発現させることを特徴とするタンパク質ライブラリーの作製方法。A method for producing a protein library, comprising expressing the DNA library according to claim 8 or the RNA library according to claim 10 in a cell-free transcription and / or translation system. 請求項11の方法により得られるタンパク質ライブラリー。A protein library obtained by the method of claim 11. 請求項7に記載のDNAライブラリーに含まれるDNA、または請求項9に記載のRNAライブラリーに含まれるRNAに該DNA、またはRNAがコードするタンパク質が結合した核酸−タンパク質連結分子ライブラリー。A nucleic acid-protein linked molecule library in which a DNA contained in the DNA library according to claim 7 or an RNA contained in the RNA library according to claim 9 is bound to a protein encoded by the DNA or RNA. 請求項9、12または13に記載のライブラリーを用いて所望の性質を有するタンパク質を選択することを特徴とするタンパク質の取得方法。A method for obtaining a protein, comprising selecting a protein having desired properties using the library according to claim 9, 12 or 13. 請求項14に記載の方法により得られるタンパク質。A protein obtained by the method according to claim 14. (a)請求項15に記載のタンパク質をコードするDNAを調製し、(b)該DNAに変異を導入し、(c)変異を導入したDNAを増幅し、(d)増幅されたDNAを転写/翻訳させることによりタンパク質ライブラリーを作製し、(e)該ライブラリーを用いて所望の性質を有するタンパク質を取得することを特徴とするタンパク質の取得方法。(A) preparing a DNA encoding the protein of claim 15, (b) introducing a mutation into the DNA, (c) amplifying the DNA having the mutation introduced therein, and (d) transcribing the amplified DNA. / A method of preparing a protein library by performing translation, and (e) obtaining a protein having desired properties using the library. 請求項16に記載の方法により得られるタンパク質。A protein obtained by the method according to claim 16. 請求項15または17に記載のタンパク質をコードするDNAの取得方法。A method for obtaining a DNA encoding the protein according to claim 15. 請求項18に記載の方法により得られるDNA。A DNA obtained by the method according to claim 18.
JP2002530727A 2000-09-27 2001-09-26 Method for constructing mutant DNA library and use thereof Pending JPWO2002026964A1 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2000293692 2000-09-27
JP2000293692 2000-09-27
JP2001029138 2001-02-06
JP2001029138 2001-02-06
PCT/JP2001/008387 WO2002026964A1 (en) 2000-09-27 2001-09-26 Method of constructing mutant dna library and utilization thereof

Publications (1)

Publication Number Publication Date
JPWO2002026964A1 true JPWO2002026964A1 (en) 2004-02-05

Family

ID=26600800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002530727A Pending JPWO2002026964A1 (en) 2000-09-27 2001-09-26 Method for constructing mutant DNA library and use thereof

Country Status (3)

Country Link
JP (1) JPWO2002026964A1 (en)
AU (1) AU2001292254A1 (en)
WO (1) WO2002026964A1 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5605793A (en) * 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
JPH1014578A (en) * 1996-07-01 1998-01-20 Mitsubishi Chem Corp Construction of substituted variant gene dna

Also Published As

Publication number Publication date
WO2002026964A1 (en) 2002-04-04
AU2001292254A1 (en) 2002-04-08

Similar Documents

Publication Publication Date Title
EP1833965B1 (en) Ribosome display or mrna display method with selection for increased stability of the protein
Paschke Phage display systems and their applications
KR0185192B1 (en) Cell-free synthesis and isolation of novel genes and polypeptides
US5843701A (en) Systematic polypeptide evolution by reverse translation
US8592144B2 (en) Beta-sheet proteins with specific binding properties
JP4369662B2 (en) Combinatorial library of monomer domains
EP0988378B1 (en) A method for in vitro molecular evolution of protein function
Plückthun et al. In vitro selection and evolution of proteins
He et al. Ribosome display: cell-free protein display technology
CN109970858B (en) CD22 single domain antibody, nucleotide sequence and kit
WO1993003172A1 (en) Systematic polypeptide evolution by reverse translation
WO1993008278A1 (en) Peptide library and screening method
WO1992002536A1 (en) Systematic polypeptide evolution by reverse translation
US11136574B2 (en) Methods for in vitro ribosome synthesis and evolution
WO2007136840A2 (en) Nucleic acid library design and assembly
KR20100091997A (en) Directed evolution using proteins comprising unnatural amino acids
WO2002066653A2 (en) Procaryotic libraries and uses
Zoller New molecular biology methods for protein engineering
Mattheakis et al. [11] Cell-free synthesis of peptide libraries displayed on polysomes
JP2007507210A (en) Methods for in vitro evolution of polypeptides
Schaffitzel et al. 27 In Vitro Selection and Evolution of Protein-. Ligand Interactions by Ribosome Display
CN110386986B (en) Artificial modified protein and construction method and application thereof
JPWO2002026964A1 (en) Method for constructing mutant DNA library and use thereof
Amstutz et al. Ribosome display: in vitro selection of protein-protein interactions
US20040091920A1 (en) Method of constructing a mutant DNA library and use thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111018