JP2004524811A - Combinatorial screening of mixed populations of organisms - Google Patents

Combinatorial screening of mixed populations of organisms Download PDF

Info

Publication number
JP2004524811A
JP2004524811A JP2002527252A JP2002527252A JP2004524811A JP 2004524811 A JP2004524811 A JP 2004524811A JP 2002527252 A JP2002527252 A JP 2002527252A JP 2002527252 A JP2002527252 A JP 2002527252A JP 2004524811 A JP2004524811 A JP 2004524811A
Authority
JP
Japan
Prior art keywords
biomolecule
nucleic acid
biological activity
sequence
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002527252A
Other languages
Japanese (ja)
Inventor
ショート,ジョイ,エム.
Original Assignee
ディバーサ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/663,620 external-priority patent/US7018793B1/en
Application filed by ディバーサ コーポレーション filed Critical ディバーサ コーポレーション
Publication of JP2004524811A publication Critical patent/JP2004524811A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Ecology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

有機体の混合集団に由来する遺伝子ライブラリを、所定の生体分子の生物活性に関して、スクリーニングする方法を提示する。有機体の混合試料は、例えば環境からの培養集団又は未培養集団にすることが可能である。更に、有機体の分離物又は濃縮集団をスクリーニングする方法が提示され、分離物は、例えば、有機体の特定の種、属、科、又は綱の、空間的、時間的、又は階層的な集団を含む。新しい生体分子又は生物活性を形成するために、所定の生体分子又は生物活性を含む同定されたクローンには、更に変化を与えることが可能であり、或いは、クローンに含まれるDNAに、変化を与えることが可能である。A method is provided for screening a gene library from a mixed population of organisms for the biological activity of a given biomolecule. The mixed sample of organisms can be, for example, a cultured or uncultured population from the environment. Further, a method for screening a segregant or enriched population of an organism is provided, wherein the segregate comprises, for example, a spatial, temporal, or hierarchical population of a particular species, genus, family, or class of the organism. including. Identified clones containing a given biomolecule or biological activity can be further altered, or alter the DNA contained in the clone, to form a new biomolecule or biological activity. It is possible.

Description

【0001】
【発明の分野】
本発明は、生物活性分子のスクリーニング及び同定に関し、特に、生物活性分子又は生物活性について、二つ以上の有機体から分離した核酸から生成される遺伝子ライブラリの作成及びスクリーニングに関する。
【0002】
【背景】
現在使用されている生物活性化合物の大部分は、土壌微生物に由来する。土壌その他の複雑な生態学的コミュニティに住む多くの微生物は、存続及び繁殖する能力を高める様々な化合物を生成する。こうした化合物は、一般に、有機体の成長にとって不可欠ではないと考えられており、中間代謝に関与する遺伝子の助けを借りて合成される。他の有機体の成長又は生存に影響を与えるこうした二次代謝産物は、「生物活性」化合物として知られており、微生物及び非顕微的微生物の両方にとって、化学的な防衛備蓄の主要構成要素としての役割を果たす。人間は、こうした化合物を活用し、抗生物質、抗感染薬、及び広範な原核細胞及び真核細胞の病原体に対抗する活性を伴うその他の生物活性化合物として使用してきた(バーンズら、Proc. Nat. Acad. Sci. U.S.A., 91, 1994)。
【0003】
多数の利用可能な生物活性化合物が存在するように見えるが、現代の生物医学は、最大の課題の一つとして、抗生物質耐性病原体の増殖に直面している。世代時間の短さと、遺伝情報を容易に交換できる能力とにより、病原微生物は、急速に進化し、事実上、あらゆるクラスの複合抗生物質に対抗する抵抗メカニズムを広めている。例えば、ヒト病原体Staphylococcus及びStreptococcusの毒性の強い菌株は、現在、単一の抗生物質バンコマイシンでのみ治療可能であり、この化合物に対する耐性を発生させる上で必要となるのは、耐性のあるEnterococcus種から単一の遺伝子vanAを転写することのみである(ベイトソンら、System. Appl. Microbiol., 12, 1989)。新しい抗菌性化合物に関する重大な必要性を、酵素阻害剤、免疫抑制剤、及び抗癌剤の需要の増加と重ね合わせると、製薬会社が、生物活性化合物に関する微生物試料のスクリーニングを強化してきた理由は、容易に明らかとなる。
【0004】
新しい生物活性化合物に関して微生物をスクリーニングするために現在使用されているアプローチは、この分野が開始されて以来、概ね変化していない。バクテリアの新しい分離物、特に土壌環境からのグラム陽性菌株を収集し、その代謝産物を薬理活性についてテストする。
【0005】
先導化合物のソースとして未だ利用されていない生物学的多様性が、なお膨大に存在する。しかしながら、先導化合物をスクリーニング及び生成するために現在利用可能な方法は、こうした探究が不十分なリソースに効率的に適用することができない。例えば、海洋細菌種の少なくとも99%は実験室の培地上で生き残れないと推定されており、市販の発酵設備はこうした種が成長する条件で使用するのに適していないため、こうした有機体は、スクリーニング又は再供給のために培養するのが困難又は不可能である。薬物生成有機体の再収集、成長、株の改良、培地の改良、及び拡大生産は、先導化合物の合成及び開発において問題を発生させる場合が多い。更に、一部の化合物を合成するために特定の有機体を相互作用させる必要性により、発見の過程でこれらを使用することが極めて困難になる。未だ使用されていない化合物のソースの遺伝資源及び化学的多様性を利用する新しい方法を、薬物の発見において使用することは、非常に有益である。
【0006】
現代の生物学の中核となるのは、核酸ゲノムに遺伝情報が存在すること、及びこうしたゲノムにおいて具体化される情報(つまり遺伝子型)が細胞機能を方向付けることである。これは、有機体のゲノム内の様々な遺伝子の発現と、こうした遺伝子の発現の調節とを通じて発生する。細胞又は有機体内の遺伝子の発現は、その細胞又は有機体の物理的特性(つまり表現型)を定める。これは、遺伝子のタンパク質への翻訳を通じて達成される。環境試料から取得したタンパク質の生物活性を決定することで、環境におけるタンパク質の役割に関する有益な情報を提供できる。加えて、こうした情報は、生物学、診断学、治療学、及び産業用途の組成の発展に役立つ。
【0007】
したがって、本発明は、この未使用の生物学的多様性にアクセスし、組み換えDNA技術を利用して、所定の配列及び活性を迅速にスクリーニングする方法を提供する。本発明は、自然化合物を迅速にスクリーニングする能力に関連する利点と、有機体の遺伝物質を扱う作業に提供される柔軟性及び再現性とを組み合わせるものである。
【0008】
【発明の概要】
本発明は、所定の生物活性又は生体分子に関する試料の迅速なスクリーニングを提供する。試料は、広範なソースから導くことが可能であり、例えば、環境ライブラリと、二つ以上の有機体を含む試料(有機体の混合集団等)と、培養不可能な有機体からの試料と、深海の噴出孔と、その他とを含む。本明細書で説明するように、こうした試料は、生物学と、治療学と、産業用途とにおいて有用な未使用の分子の豊富なソースを提供し、これらは、本発明以前には、特徴付け及び特定のために困難で時間のかかる方法を要したものであり、或いは、同定又は特徴付けが不可能だったものである。
【0009】
本発明の一実施形態において、本発明は、特定の生物活性又は生体分子に関して、細胞の混合集団からの核酸により生成されたクローンのライブラリをスクリーニングするステップと、特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が配列変化の影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとにより、所定の生物活性又は生体分子を取得する方法を提供する。
【0010】
別の実施形態において、本発明は、特定の生物活性又は生体分子に関して、複数の分離物から取得したプール核酸により生成されたクローンのライブラリをスクリーニングするステップと、特定の生物活性又は生体分子を含むクローンを同定するステップとにより、所定の生物活性又は生体分子を同定する方法を提供する。
【0011】
更に別の実施形態において、本発明は、所定の生物活性又は生体分子を同定する方法を提供する。この方法は、特定の生物活性又は生体分子に関して、複数の分離物から取得したプール核酸により生成されたクローンのライブラリをスクリーニングするステップと、特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとを含む。
【0012】
別の実施形態において、本発明は、所定の生物活性又は生体分子を同定する方法を提供し、この方法は、特定の生物活性又は生体分子に関して、複数の分離物のそれぞれから取得された核酸により生成された個別の遺伝子ライブラリをプールすることで生成されたクローンのライブラリをスクリーニングするステップと、特定の生物活性又は生体分子を含むクローンを同定するステップとを含む。
【0013】
別の実施形態において、本発明は、特定の生物活性又は生体分子に関して、ライブラリをスクリーニングし、このライブラリが複数の分離物のそれぞれから取得された核酸により生成された個別の遺伝子ライブラリをプールすることで生成されるステップと、特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとにより、所定の生物活性又は生体分子を同定する方法を提供する。
【0014】
更に別の実施形態において、本発明は、所定の生物活性又は生体分子を同定する方法を提供し、これは、特定の生物活性及び生体分子に関して、有機体の濃縮集団からの核酸により生成されたクローンのライブラリをスクリーニングするステップと、特定の生物活性又は生体分子を含むクローンを同定するステップとを含む。
【0015】
更に別の実施形態において、本発明は、特定の生物活性又は生体分子に関して、有機体の濃縮集団からの核酸により生成されたクローンのライブラリをスクリーニングするステップと、特定の生物活性又は生体分子を有するクローンを含む核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとにより、所定の生物活性又は生体分子を同定する方法を提供する。
【0016】
別の実施形態において、本発明は、所定の生物活性又は生体分子を同定する方法を提供する。所定の生物活性又は生体分子は、有機体の混合集団からの核酸を、検出可能な分子を有する少なくとも一つのオリゴヌクレオチドプローブ及び所定の分子を符号化する核酸配列の少なくとも一部と共に、相補配列の相互作用が可能な条件下で培養するステップと、検出可能な分子を検出するアナライザを使用して、オリゴヌクレオチドプローブに対する補体を有する核酸配列を同定するステップとによって同定される。その後、同定された核酸配列からライブラリが生成され、このライブラリは、特定の生物活性又は生体分子に関してスクリーニングされる。特定の生物活性又は生体分子を有するクローンに含まれる核酸配列には変化を与え、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供される。
【0017】
別の実施形態において、本発明は、微環境において、有機体の混合集団から取得された核酸を、検出可能な分子を有する少なくとも一つのオリゴヌクレオチドプローブ及び所定の分子を符号化する核酸配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で、このような時間に渡って、共同カプセル化するステップと、検出可能な分子を検出するアナライザによりカプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、分離されたカプセル化核酸からライブラリを生成するステップと、このライブラリを特定の生物活性又は生体分子に関してスクリーニングするステップと、特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとにより、所定の生物活性又は生体分子を同定する方法を提供する。
【0018】
更に別の実施形態において、本発明は、微環境において、有機体の混合集団の分離物から取得された核酸を、検出可能なマーカを有する少なくとも一つのオリゴヌクレオチドプローブ及び所定の生物活性を有する分子を符号化するポリヌクレオチド配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で、このような時間に渡って、共同カプセル化するステップと、検出可能なマーカを検出するアナライザによりカプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、分離されたカプセル化核酸からライブラリを生成するステップと、このライブラリを特定の生物活性又は生体分子に関してスクリーニングするステップと、特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとを含む方法を提供する。
【0019】
別の実施形態において、本発明は、微環境において、有機体の混合集団の一つ以上の分離物から取得された核酸を、検出可能なマーカを有する少なくとも一つのオリゴヌクレオチドプローブ及び所定の生物活性を有する分子を符号化するポリヌクレオチド配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で、このような時間に渡って、共同カプセル化するステップと、検出可能なマーカを検出するアナライザによりカプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、分離されたカプセル化核酸からライブラリを生成するステップと、このライブラリを特定の生物活性又は生体分子に関してスクリーニングするステップと、特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとにより、所定の生物活性又は生体分子を取得する方法を提供する。
【0020】
更に別の実施形態において、本発明は、所定の生物活性又は生体分子を同定する方法を提供する。この方法は、微環境において、有機体の混合集団の分離物の混合物から取得された核酸を、検出可能なマーカを有する少なくとも一つのオリゴヌクレオチドプローブ及び所定の生物活性を有する分子を符号化するポリヌクレオチド配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で、このような時間に渡って、共同カプセル化するステップと、検出可能なマーカを検出するアナライザによりカプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、分離されたカプセル化核酸からライブラリを生成するステップと、このライブラリを特定の生物活性又は生体分子に関してスクリーニングするステップと、特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、変化を与えた生物活性又は生体分子を特定の生物活性又は生体分子と比較し、この比較において、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子が提供されるステップとを含む。
【0021】
本発明の前記その他の態様は、本明細書の教示から、当業者には明らかであろう。
【0022】
本発明は、例えば、環境試料或いは有機体の非培養集団又は有機体の培養集団からの有機体の混合集団等、二つ以上の有機体に由来するライブラリの迅速なスクリーニングを提供する。
【0023】
一実施形態において、遺伝子ライブラリは、有機体の混合集団から核酸を取得するステップと、複数のクローンを形質転換して遺伝子ライブラリを生成するために、この核酸を適切なベクタにクローニングするステップとにより生成される。したがって、遺伝子ライブラリは、混合集団の有機体内に存在する遺伝子又は遺伝子断片を含む。遺伝子ライブラリは、発現ライブラリにすることが可能であり、この場合、このライブラリは、望ましい活性を有する発現ポリペプチドに関してスクリーニングすることができる。代わりに、遺伝子ライブラリは、例えば、PCR又はハイブリッド形成スクリーニングにより、所定の配列に関してスクリーニングすることが可能である。
【0024】
一実施形態においては、有機体の混合集団を含む試料の分離物からの核酸がプールされ、プールされた核酸は、遺伝子ライブラリの生成に使用される。
【0025】
「分離物」とは、二つ以上の有機体を有する試料から或いは有機体の混合集団から、有機体の特定の種、属、科、目、又は綱が、取得されたこと或いは引き出されたことを意味する。こうした分離集団からの核酸は、その後、遺伝子ライブラリの生成に使用できる。分離物は、二つ以上の有機体又は有機体の混合集団を含む試料から、選択的にフィルタリング又は培養することで取得できる。例えば、バクテリアの分離物は、サイズに基づいて有機体を排除するフィルタで試料をフィルタリングすること、或いは有機体の特定の集団の選択的成長又は選択的阻害が可能な培地上で試料を培養することにより取得できる。
【0026】
「濃縮集団」とは、集団全体に対して、有機体の特定の種、属、科、目、又は綱に属する有機体のパーセンテージが増加している有機体集団である。例えば、選択的成長又は阻害培地により、有機体の全体的な数を増やすことができる。集団内の有機体の合計数に対して、原核生物を濃縮することができる。同様に、混合集団内の小集団の成長を阻害又は促進する選択的培地上で混合集団を成長させることにより、有機体の特定の種、属、科、目、又は綱を濃縮することができる。
【0027】
別の実施形態において、有機体の混合集団からの複数(例えば、二つ以上)の分離物からの核酸は、複数のクローンを含む複数の遺伝子ライブラリを生成するのに使用され、この少なくとも二つの分離物からの遺伝子ライブラリは、その後、「プール済み分離物ライブラリ」を取得するためにプールされる。
【0028】
遺伝子ライブラリが生成された後、クローンは、所定の生物活性(例えば、酵素活性、二次メッセンジャ活性、結合活性、転写活性、その他)又は生体分子(例えば、核酸配列、ペプチド、ポリペプチド、脂質又はその他の小分子、その他)を検出するためにスクリーニングされる。こうしたスクリーニング手法は、例えば、クローン、クローン集団、又は核酸配列の集団を、所定の生物活性又は生体分子との相互作用時に検出可能な信号を提供する検出可能な分子を有する基質又は複数の基質に接触させることを含む。この基質は、酵素基質、生物活性分子、オリゴヌクレオチド、及びその他にすることができる。
【0029】
一実施形態においては、遺伝子ライブラリが生成され、クローンは、所定の発色又は蛍光基質又は複数の基質に晒されるか、或いは、所定の配列に対応する配列を有する標識プローブ(検出可能分子を有するオリゴヌクレオチド等)とハイブリッド形成され、検出可能な信号(蛍光発光等)により、陽性のクローンが同定される。
【0030】
一実施形態においては、有機体の混合集団から生成された発現ライブラリが、所定の活性に関してスクリーニングされる。具体的には、発現ライブラリが生成され、クローンは、所定の基質又は複数の基質に晒され、陽性のクローンが同定及び分離される。本発明では、細胞が生き残る必要はない。細胞は、検出される分子を生成するのに十分な長さだけ生存する必要があり、その後は、発現生体分子(酵素等)が活性状態を維持する限り、生存細胞又は非生存細胞のどちらであってもよい。
【0031】
特定の実施形態において、本発明は、環境試料からの新しい又は望ましい生物活性を符号化する遺伝子のダイレクトクローニングを、新しい分子、例えば、酵素を迅速に発見するために設計された高スループットスクリーニングシステムに組み合わせるアプローチを提供する。このアプローチは、E.coliその他の適切な宿主細胞内で増殖させることが可能なクローニングベクタ内に保管された多数の自然発生微生物の集団ゲノムを表すことが可能な環境「発現ライブラリ」の構築に基づく。クローンDNAは、環境試料から、或いは環境試料の分離物から、直接、最初に抽出することができるため、このライブラリは、純培養で成長させることが可能な原核生物の小部分に限定されない。加えて、こうした試料に存在する環境DNAを平均化することで、試料内に存在するすべての種からのDNAを更に均等に表現させることが可能になる。平均化手法(下で説明する)は、試料内の支配的な種と比較して表現が数桁少ない場合がある試料の微量成分から、興味深い遺伝子を発見する効率を劇的に増加させる。平均化は、前記のあらゆる実施形態において、試料又は(複数の)基質からの核酸の取得に続いて行うことができる。
【0032】
別の実施形態において、本発明は、膨大な数のクローンを評価し、有用な酵素、及びその他の生体分子(リガンド等)を符号化する細胞を同定及び回収することが可能なスクリーニング用の高スループットキャピラリアレイシステムを提供する。特に、本明細書で説明するキャピラリアレイに基づく手法は、望ましい生物活性を有するタンパク質、或いは望ましい結合親和性を有するその他のリガンドのスクリーニング、同定、及び回収に使用することができる。例えば、望ましい結合事象の発生時に検出可能な信号を発する適切な基質又はその他のマーカを使用することで、結合検定を実施できる。
【0033】
加えて、蛍光活性細胞選別法を使用して、所定の活性又は配列を有するクローンをスクリーニング及び分離することができる。これまでは、真核及び原核細胞株及び細胞培養プロセスの分析を中心とした研究において、FACS装置が利用されてきた。FACSは、更に、研究する真核生物及び原核生物の両方における異質なタンパク質の生成、例えば、識別的遺伝子発現その他をモニタするためにも利用されてきた。FACSシステムの検出及び計数機能は、こうした例において応用されてきた。しかしながら、FACSは、これまで、原核生物における生物活性をスクリーニング及び回収する発見プロセスには利用されてこなかった。更に、本発明では、望ましい核酸(組み換えクローン)を生きた細胞又は死んだ細胞から取得できるため、以前に説明した技術のように、細胞が生き残る必要はない。細胞が生存する必要があるのは、検出する化合物を生成するのに十分な長さだけであり、その後は、発現生体分子が活性状態を維持する限り、生存細胞又は非生存細胞のどちらであってもよい。本発明は、更に、E.coli発現組み換え酵素の検出及び選別と、符号化する核酸の回収に関連することになる問題を解決する。加えて、本発明は、その実施形態に、生体物質に関連する蛍光波長を検出できる任意の装置を含み、こうした装置は、本明細書において、蛍光アナライザ(一例としてFACS装置)として定義される。
【0034】
また、有機体の混合集団、分離物、又は濃縮集団から核酸配列を同定することが望ましい。この実施形態では、遺伝子産物を発現させる必要がない。所定の核酸配列は、クローン、デバイス(遺伝子チップ等)、フィルタ、又は核酸試料を、検出可能な分子によって標識されたプローブに接触させることで同定又は「バイオパニング」することができる。プローブは、通常、所定の核酸配列と実質的に同一の配列を有する。或いは、プローブは、所定のポリペプチドを符号化する断片長又は全長核酸配列となる。プローブ及び核酸は、プローブと実質的な相補配列とのハイブリッド形成が可能になる条件下で、このような時間に渡って、培養される。ハイブリッド形成の緊縮性は、例えば、プローブの長さ及びGC含量に応じて変化する。こうした要因は、経験的に定めることができる(例えば、サンブルックら、Molecular Cloning−−A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, 1989、及びCurrent Protocols in Molecular Biology, M・オースベル他編(Current Protocols, Greene Publishing Associates, IncとJohn Wiley & Sons, Incとの合弁事業、最新の補足)を参照)。ハイブリッド形成後、相補配列は、PCR増幅すること、ハイブリッド形成手法(例えば、プローブ及び核酸混合物をフィルムに晒すこと)により同定すること、或いはチップを使用して核酸を検出することが可能である。
【0035】
本発明以前、複雑な遺伝子ライブラリ又は環境発現ライブラリの評価は、速度が制限されていた。本発明により、例えば、数千種類の有機体又はそのサブセット及び分離物からのゲノム配列を含む、複雑な環境ライブラリの迅速なスクリーニングが可能になる。本発明の利点は、例えば、複雑な環境試料をスクリーニングする点に見て取ることができる。複雑な試料のスクリーニングでは、これまで、労働集約的方法を使用して、数百万のクローンをスクリーニングし、ゲノムの多様性をカバーする必要があった。本発明は、こうした膨大な数のクローンを評価することが可能となる極めて高スループットなスクリーニング方法を意味する。開示する方法により、所定の望ましい核酸配列、生物学的活性、又は生体分子に関して、毎時約三千万乃至約二億のクローンを任意にスクリーニングすることが可能となる。これにより、クローン発現の新しい生物活性又は生体分子に関して、環境ライブラリを完全にスクリーニングすることが可能となる。
【0036】
所定の配列又は生物活性(例えば、所定の酵素)を同定した後、所定の生物活性を符号化する配列又はポリヌクレオチドを発展させること、変異させること、或いは誘導することでアミノ酸配列を修飾し、例えば、耐熱性、特異性、又は活性の増加といった修飾活性を提供することができる。
【0037】
「アミノ酸」は、中心炭素原子(α−炭素原子)が水素原子と、カルボン酸基(この中の炭素原子を本明細書では「カルボキシル炭素原子」と呼ぶ)と、アミノ基(この中の窒素原子を本明細書では「アミノ窒素原子」と呼ぶ)と、側鎖基Rとに連結した構造を有する分子である。ペプチド、ポリペプチド、又はタンパク質に組み込まれる時、アミノ酸は、一つのアミノ酸を他のものに連結させる脱水反応において、そのアミノ酸のカルボキシル基で一つ以上の原子を失う。その結果、タンパク質に組み込まれる時、アミノ酸は、「アミノ酸残基」と呼ばれることになる。
【0038】
「タンパク質」又は「ポリペプチド」は、ペプチド結合を介して連結した二つ以上の個別のアミノ酸(自然発生であるかどうかを問わない)による任意のポリマを指し、一つのアミノ酸(又はアミノ酸残基)のα−炭素原子と結合するカルボン酸基のカルボキシル炭素原子が、隣接するアミノ酸のα−炭素原子と結合するアミノ基のアミノ窒素原子と共有結合する時に発生する。「タンパク質」という用語は、「ポリペプチド」及び「ペプチド」という用語(本明細書では交換可能なものとして使用される場合がある)を、その意味の中に含むと理解される。加えて、多数のポリペプチドサブユニット(例えば、DNAポリメラーゼIII、RNAポリメラーゼII)又はその他の構成要素(例えば、テロメラーゼにおいて発生するようなRNA分子)を含むタンパク質も、本明細書で使用する「タンパク質」の意味に含まれると理解される。同様に、タンパク質及びポリペプチドの断片も、本発明の範囲に入り、本明細書では「タンパク質」と呼ばれる場合がある。
【0039】
一定のタンパク質の特定のアミノ酸配列(つまり、アミノ末端乃至カルボキシ末端を書く時のポリペプチドの「一次構造」)は、mRNAの符号化部分のヌクレオチド配列によって決定され、これは次に、遺伝情報、通常はゲノムDNA(ミトコンドリア又は葉緑体DNA等の細胞小器官DNAを含む)によって指定される。したがって、遺伝子の配列を決定することは、対応するポリペプチドの一次構造、更に詳しくは、その遺伝子又はポリヌクレオチド配列によって符号化されるポリペプチド又はタンパク質の役割又は活性を予測するのに役立つ。
【0040】
「分離された」又は「精製された」という用語は、核酸配列又はポリペプチド配列を指す時、それぞれ、「人間の手によって」自然状態から変更されたことを意味し、つまり、それが自然に発生する場合、オリジナルの環境から変化させたこと、又は移転させたこと、或いはその両方を行ったことになる。例えば、自然状態にある現存動物、生物学的試料、又は環境試料の中に自然に存在する自然発生ポリヌクレオチド又はポリペプチドは、「分離」又は「精製」されていないが、自然状態の共存物質から切り離した同じポリヌクレオチド又はポリペプチドは、本明細書で使用する用語として「分離」又は「精製」されている。こうしたポリヌクレオチドは、培養株又は完全な有機体の宿主細胞に導入した時も、自然発生の形態又は環境とは異なるため、本明細書で使用される用語では、依然として分離されていることになる。同様に、ポリヌクレオチド及びポリペプチドは、培地組成(例えば、細胞又は組成物にポリヌクレオチド又はポリペプチドを導入するための溶液、或いは化学又は酵素反応のための溶液)等の組成物において発生する場合がある。
【0041】
「ポリヌクレオチド」又は「核酸配列」は、ヌクレオチドの重合形態を指す。また、ポリヌクレオチドは、由来する有機体の自然発生ゲノムにおいて直に連続する符号化配列(5’末端に一つ及び3’末端に一つ)のいずれとも直に連続しない配列を指す。そのため、この用語は、例えば、ベクタ内、自己複製プラスミド又はウイルス内、或いは原核生物又は真核生物のゲノムDNA内に組み込まれた組み換えDNA、若しくは他の配列から独立した別個の分子(cDNA等)として存在する組み換えDNAを含む。本発明のヌクレオチドは、リボヌクレオチド、デオキシリボヌクレオチド、又はいずれかのヌクレオチドの修飾形態にすることができる。ポリヌクレオチドは、本明細書での使用において、特に、一本鎖及び二本鎖DNAと、一本鎖及び二本鎖領域の混合物であるDNAと、一本鎖及び二本鎖RNAと、一本鎖及び二本鎖領域の混合物であるRNAと、一本鎖、又は更に一般的には、二本鎖、或いは一本鎖及び二本鎖領域の混合物である場合があるDNA及びRNAを含むハイブリッド分子とを指す。
【0042】
加えて、ポリヌクレオチドは、本明細書での使用において、RNA又はDNA或いはRNA及びDNAの両方を含む三本鎖領域を指す。こうした領域の鎖は、同じ分子からのもの、又は異なる分子からのものである場合がある。この領域は、一つ以上の分子のすべてを含むことができるが、更に一般的には、いくつかの分子の一領域のみを含む。三重螺旋領域の分子の一つは、オリゴヌクレオチドである場合が多い。ポリヌクレオチドという用語は、ゲノムDNA又はRNA(有機体に応じて変化、つまりウイルスのRNAゲノム)の他、ゲノムDNAにより符号化されるmRNA、及びcDNAを包含する。
【0043】
上で述べたように、現在、生物学及び化学産業において、生物学的又は化学的プロセスを最適に実施することが可能な分子(酵素等)の必要性が存在する。例えば、従来及び新興の化学、製薬、繊維、食品及び試料、及び潜在市場において利用される分子及び化合物は、厳しい経済及び環境基準を満たす必要がある。ポリマ、製薬、天然産物、及び農薬の合成は、有害な副産物を生み出し、低品質又は非効率的な触媒作用が問題となる高価なプロセスにより妨げられる場合が多い。例えば、酵素は、こうした触媒作用における問題を克服可能な注目すべき多数の利点を有し、単一の官能基に作用し、単一の分子上の類似する官能基を識別し、光学異性体を識別する。更に、酵素は、生物分解可能であり、反応混合物において非常に小さなモル分率で機能する。その化学特異性、領域特異性、及び立体特異性から、酵素は、望ましい選択的形質転換を適切に達成する独自の機会を提供する。酵素は、特に単一段階の反応において、化学的に複製することが極めて困難である場合が多い。保護基の必要性の排除、選択性、単一の反応槽で多段階形質転換を実施する能力は、付随する環境的負担の減少と共に、化学及び製薬産業における酵素の需要増加をもたらしてきた。酵素系プロセスは、徐々に、従来型の多くの化学的方法に取って代わっている。現在、更に広範な産業での使用が制限されている主な原因は、商業的に利用可能な酵素が比較的少数なためである。これまでに説明されている3000を超える非DNA増幅酵素活性のうち、今のところ商業的に利用可能なものは、300までの酵素(DNA増幅酵素を除く)のみである。
【0044】
技術的用途での酵素の使用では、更に、要求の厳しい産業条件下での性能が求められる。これには、現在知られている酵素の備蓄が進化的に選択されない環境内又は基質上での活性が含まれる。しかしながら、自然環境は、例えば、極端な温度及びpHを含め、極限条件を提供する。多数の有機体は、こうした極限状態に耐えることが可能となるようにポリペプチドを選択すること等により、こうした条件に適応している。
【0045】
酵素は、温度、pH、及び塩濃度の条件の下、生物の環境内で非常に特異的な機能を果たす選択的な圧力により進化してきた。これまで同定された非DNA修飾酵素活性の大部分は、中温性の有機体から分離されており、これは、利用可能な系統発生的多様性の非常に小さな部分を表すものである。生体触媒の動的な分野は、極限環境で繁栄する微生物から分離された酵素の助けを借りて、新たな次元に入っている。例えば、こうした酵素は、陸上の温泉及び深海の熱水噴出孔での100℃を超える温度、極海での0℃を下回る温度、死海の飽和塩環境、石炭埋蔵地及び地熱による硫黄分の多い湧水でのゼロに近いpH値、或いは下水スラッジでの11より大きなpH値で機能する必要がある。例えば、有機体、ポリヌクレオチド、又はポリペプチド(酵素等)を含む極限条件から取得された環境試料は、生体触媒の新しい分野を開く。所定のポリペプチドを符号化するポリヌクレオチドを迅速にスクリーニングすることで、本発明は、生物学、治療学、及び産業用途の酵素を発展させる物質のソースだけでなく、特定の活性、特異性、又は条件のために修飾する分子又はポリペプチドを開発する目的で、例えば、定方向進化及び突然変異生成によって更に処理する新しい物質を提供する。
【0046】
産業で使用する新しい酵素の必要性に加え、新たな活性を有する生物活性化合物の必要性は、劇的に増加している。この需要は、主に、現在利用可能な抗生物質に対する抵抗力がある多数の病原生物における明確かつ増大する傾向と結びついた世界的な人口統計の変化から生じたものである。例えば、年少人口の高い新興国家において、抗菌薬の需要が急増した一方で、米国等、人口の高齢化が進む国では、癌、糖尿病、関節炎、及びその他の衰弱状態に対する薬品のレパートリを増やす必要がある。感染病による死亡率は、1980年から1992年の間に58%増加しており、抗生物質耐性菌の出現により、米国だけで年間300憶ドルを超える医療コストが追加されたと推定されている(アダムスら、Chemical and Engineering News, 1995、アマンら、Microbiological Reviews, 59, 1995)。この傾向への反応として、製薬会社は、独自の活性又は特異性を有する化合物に関して、細菌の多様性のスクリーニングを大幅に増加させた。したがって、本発明は、ポリヌクレオチド及び関連配列に固有の情報を、例えば、様々な微生物の消化管等の環境に存在する感染性微生物等から、取得及び同定するために使用することができる。
【0047】
環境試料において新しい酵素を同定することは、こうした問題に対する解決策の一つである。所定の活性を有するポリペプチドと、所定のポリペプチドを符号化するポリヌクレオチドとを迅速に同定することで、本発明は、生物学、診断学、治療学、及び産業用途の組成の発展に役立つ方法、組成、及びソースを提供する。
【0048】
本発明の方法及び組成は、環境試料内に存在する薬品の先導化合物の同定を提供する。本発明の方法は、新薬のための環境を掘り下げる能力、或いは異なる微生物中に含まれる関連する薬物を同定する能力を提供する。先導化合物(薬品候補)には、いくつかの共通するソースが存在し、これには、環境を掘り下げた結果として同定又は開発されたヌクレオチド、ペプチド、又はその他の重合分子のような、天然産物の集合と、合成化学物質の集合と、合成組み合わせ化学物質ライブラリとが含まれる。こうしたソースのそれぞれは、利点と欠点とを有する。こうした候補をスクリーニングするプログラムが成功するかどうかは、主に、プログラムに入れる化合物の数によって左右され、製薬会社は、先導化合物の探究において、スクリーニングした膨大な数の合成物質及び自然化合物を時代遅れにする必要がある。残念なことに、過去に発見された化合物に対する新化合物の割合は、時間と共に減少している。新しい先導化合物の発見率は、製薬会社の最善の努力にもかかわらず、需要に追随していない。潜在的な薬品候補の新しいソースにアクセスする強い必要性が存在している。したがって、本発明は、新しい薬品化合物を含む環境試料を同定し、特徴づけるための迅速で効率的な方法を提供する。
【0049】
現在使用されている生物活性化合物の大部分は、土壌微生物に由来する。こうした化合物は、一般に、微生物の成長にとって不可欠なものではないと考えられており、中間代謝に関与する遺伝子の助けを借りて合成されるため、「二次代謝産物」と呼ばれている。他の有機体の成長又は生存に影響する二次代謝物は、「生物活性」化合物として知られており、微生物及び非顕微的微生物の両方にとって、化学的な防衛備蓄の主要構成要素としての役割を果たす。微生物起源の約6,000の生物活性化合物が特徴づけられており、その60%より多くは、Streptomyces属のグラム陽性土壌バクテリアによって生成される(バーンズら、Proc. Nat. Acad. Sci. U.S.A., 91, 1994)。このうち、少なくとも70種類は、現在、生物医学及び農業の用途で使用されている。生物活性化合物の最大のクラスであるポリケチドは、広範な抗生物質、免疫抑制剤、及び抗癌剤を含み、合計すると、売上高は年間50億ドルとなる。
【0050】
本発明は、既知又は未知の機能を有するポリペプチドを符号化する核酸配列を同定する方法を提供する。例えば、微生物ゲノムにおける多様性の多くは、微生物のゲノムにある遺伝子群の再配列によって生じる。こうした遺伝子群は、種を越えて存在する場合があり、或いは他の有機体に系統的に関連する場合がある。
【0051】
例えば、バクテリア及び多くの真核生物は、生産物が関連プロセスに関与する調節遺伝子のための協調メカニズムを有する。こうした遺伝子は、単一の染色体上で集合し、「遺伝子群」と呼ばれる構造をなし、クラスタ全体の転写を開始する単一のプロモータを含む単一の調節配列の制御下で、共に転写される。遺伝子群と、プロモータと、調節において機能する補助配列とは、全体として「オペロン」と呼ばれ、20個以上の遺伝子を含むことが可能であり、通常は二乃至六個の遺伝子を含む。したがって、遺伝子群は、通常はその機能に関して、同一であるか、或いは関連性のある、隣接する遺伝子のグループである。
【0052】
一部の遺伝子ファミリは、同一の構成要素で構成される。群化する遺伝子は必ずしも同一である必要はないが、群化は、遺伝子間の同一性を維持するための必要条件である。遺伝子群は、隣接する関連遺伝子に対する複製が生成される極端なものから、数百の同一遺伝子がタンデム配列で存在するケースまでの幅がある。特定の遺伝子の反復に意味を見出せない場合もある。この主要な例は、一部の種における発現複製インスリン遺伝子であり、他の哺乳類種においては単一のインスリン遺伝子で十分である。
【0053】
更に、遺伝子群は、継続的な再編成を経験するため、例えば、バクテリアその他の原核生物ソースから、遺伝子群の異種ライブラリを形成する能力は、例えば、膨大な数の有効活性を有するポリケチドの合成を引き起こすポリケチド合成酵素等の酵素を特に含む、新しいタンパク質のソースを決定する上で価値がある。例えば、ポリケチドは、生物活性の極めて豊富なソースとなる分子であり、抗生物質(テトラサイクリン及びエリスロマイシン等)と、抗癌剤(ダウノマイシン)と、免疫抑制剤(FK506及びラパマイシン)と、獣医用製品(モネンシン)とを含む。多くのポリケチド(ポリケチド合成酵素によって生成される)は、治療剤として価値がある。ポリケチド合成酵素は、長さと機能及び還化のパターンとが異なる多様な炭素鎖の生合成を触媒する多機能酵素である。ポリケチド合成酵素遺伝子は、遺伝子群に分類され、ポリケチド合成酵素の少なくとも一つのタイプ(タイプIと指定される)は、大きなサイズの遺伝子及び酵素を有し、遺伝子操作と、こうした遺伝子/タンパク質のin vitro研究とは複雑なものになる。遺伝子群の(複数の)生産物である他のタイプのタンパク質も考えられ、これには、例えば、抗生物質、抗ウイルス薬、抗腫瘍剤、及びインスリン等の調節タンパク質が含まれる。
【0054】
研究用の新しいポリケチドを生成するために、ポリケチド及びポストポリケチド生合成遺伝子のライブラリから望ましい成分を選択し組み合わせる能力は、魅力あるものといえる。本発明の(複数の)方法は、これを可能にするものであり、(特にF因子系ベクタを使用する時に)大きな挿入を含むクローンを備える遺伝子バンクの生成が可能となり、これが遺伝子群のクローニングを容易にするため、新しいポリケチド合成酵素その他の遺伝子群のクローニングを容易にする。
【0055】
例えば、遺伝子群は、連結した遺伝子群からの検出可能なタンパク質又はタンパク質関連配列活性の生成を制御及び調節可能な発現調節配列を含むベクタに連結することができる。外部性の核酸の導入に関して非常に大きな容量を有するベクタの使用は、こうした遺伝子群での使用に特に適しており、本明細書では、一例として、E.coliのF因子(又は稔性因子)を含めて説明される。このE.coliのF因子は、接合中の自分自身の高頻度伝達に影響するプラスミドであり、混合微生物試料からの遺伝子群等、大きな核酸断片を完成させ、安定した繁殖を行う上で理想的である。
【0056】
こうした試料(微生物の混合集団等)又はその分離物から分離又は引き出された核酸は、ポリヌクレオチドのスクリーニングの前に、ベクタ又はプラスミドに挿入することができる。こうしたベクタ又はプラスミドは、通常、プロモータ、エンハンサ、及びその他を含め、発現調節配列を含むものである。
【0057】
したがって、本発明は、in vitroで、所定の活性、つまり所定の酵素活性及び生物活性を有する分子を符号化するポリヌクレオチドに関して、微生物濃縮試料の混合集団又はその分離物をクローニング及びスクリーニングする新しいシステムを提供する。本発明の(複数の)方法によって、in vitroで、新しい生物活性分子、特に、未培養又は培養試料に由来する新しい生物活性分子をクローニング及び発見することが可能となる。本発明の(複数の)方法を使用して、大きなサイズの遺伝子群、遺伝子、及び遺伝子断片を、クローニング、配列、及びスクリーニングすることができる。以前の方策とは異なり、本発明の(複数の)方法では、in vitroで、幅広い環境試料から、ポリヌクレオチドと、こうしたポリヌクレオチドによって符号化されたポリペプチドとを、クローニング、スクリーニング、及び同定することができる。
【0058】
本発明では、複雑な環境試料、その濃縮試料、又はその分離物から、ポリヌクレオチド配列をスクリーニング及び同定することができる。遺伝子ライブラリは、試料が核酸配列を含む限り、無細胞試料から生成することが可能であり、或いは、細胞、細胞物資、又はウイルス粒子を含む試料から生成できる。ライブラリを作成可能な有機体は、Eubacteria及びArchaebacteria等の原核微生物と、菌類、藻類、及び原生動物等の下等真核微生物とを含む他、植物、植物の胞子、及び花粉の混合集団を含む。こうした有機体は、培養有機体又は環境試料から取得した未培養有機体にすることが可能であり、好熱性有機体、超好熱性有機体、冷温性有機体、及び低温菌等の極限環境微生物を含む。
【0059】
DNAライブラリを生成するのに使用する核酸のソースは、環境試料から取得することが可能であり、これには、その一部として、北極及び南極の氷、海域、及び永久凍土層のソースと、火山起源の物質と、熱帯の土壌又は植物のソースからの物質と、哺乳類及び無脊椎動物を含む様々な有機体の糞とから取得した微生物試料の他、無機物及び腐敗物その他から取得した微生物試料が含まれる。遺伝子ライブラリを生成するのに使用する核酸は、例えば、試料の濃縮小集団又は分離物から取得することができる。別の実施形態では、複数の分離物からのDNAをプールし、ライブラリを生成するための核酸のソースを形成することができる。代わりに、この核酸は、複数の分離物と、複数の遺伝子ライブラリを収録するために複数の分離物から生成された複数の遺伝子ライブラリとから取得することが可能である。二つ以上の遺伝子ライブラリをプールすること又は組み合わせることで、プール分離ライブラリを取得することができる。したがって、例えば、核酸は、培養有機体又は未培養有機体から回収することが可能であり、適切な遺伝子ライブラリ(組み換え発現ライブラリ等)を生成し、所定の特定の生体分子の同一性(ポリヌクレオチド配列等)をその後決定するのに使用すること、或いは所定の生物活性(酵素又は生物学的活性等)に関してスクリーニングすることができる。
【0060】
以下では、培養及び未培養有機体の両方と、濃縮集団と、有機体の混合集団及びその分離物とからライブラリを生成するための一般的な手順の概要を説明しており、このライブラリは、調査、配列、又はスクリーニングを行って、確認、要望、又は予測される生物学的活性(酵素活性等)を有する核酸配列を、ここから選択することが可能であり、選択された核酸配列は、更に進化、突然変異生成、又は誘導することが可能である。
【0061】
環境試料とは、本明細書での使用において、有機体又はポリヌクレオチド或いはその組み合わせを含む任意の試料である。したがって、環境試料は、(上で説明したような)任意の数のソースから取得することが可能であり、これには、例えば、昆虫の糞、温泉、土壌、及びその他が含まれる。精製又は未精製形態である核酸の任意のソースは、出発物質として利用することができる。したがって、核酸は、有機体によって汚染された任意のソースから、或いは細胞を含む任意の試料から、取得することができる。環境試料は、任意の哺乳類生物の血液、尿、脊髄液、組織、膣スワブ、便、羊水、又は頬部口腔洗浄液といった任意の生体試料からの抽出物にすることができる。非哺乳類(例えば無脊椎)生物に関して、試料は、その生物の組織試料、唾液試料、糞便試料、又は消化管内の物質にすることができる。環境試料は、更に、極限環境から取得された試料を含み、こうした環境には、例えば、高温の硫黄だまり、火道、及び凍結したツンドラが含まれる。試料は、様々なソースから得ることができる。例えば、園芸及び農業試験において、試料は、植物、肥料、土壌、液体、又はその他の園芸及び農業生産物にすることが可能であり、食品試験において、試料は、生鮮食品又は加工食品(例えば、特殊調製粉乳、海産物、生鮮農産物、及び包装食品)にすることが可能であり、環境試験において、試料は、液体、土壌、汚水処理、汚泥、及び有機体又はポリヌクレオチドを含むと判断又は推測される環境内の他の任意の試料にすることが可能である。
【0062】
試料は、有機体の混合集団を含む物質の混合物、例えば、血液、土壌、又は汚泥である場合、細胞を開き、核酸の鎖を露出又は分離するのに有効である適切な試薬によって処理することができる。必須ではないものの、この溶解及び核酸変性ステップにより、クローニング、増幅、又は配列は、更に迅速に発生することになる。更に、望ましい場合は、特定の集団又は望ましい分離物(例えば、有機体の特定の種、属、又は科の分離物)を精製又は濃縮し、これにより不純物の少ない試料を取得するために、混合集団を分析の前に培養することができる。しかしながら、これは必須ではない。例えば、試料内の有機体を培養することは、微小液滴内の有機体を培養するステップと、培養した微小液滴を、セルソータにより、マルチウェル組織培養プレートの個々のウェルに分離するステップとを含む場合がある。代わりに、試料は、有機体の特定の小集団の成長を阻害又は促進するように設計された任意の数の選択的培地組成で培養することができる。
【0063】
分離物が有機体の混合集団を含む試料に由来する場合、核酸は、下で説明するような分離物から取得することができる。この分離物から取得される核酸は、遺伝子ライブラリの生成に使用することが可能であり、或いは、代わりに、試料の他の分離断片と共にプールすることが可能で、この場合は、プールされた核酸が遺伝子ライブラリの生成に使用される。この分離物は、核酸の抽出前に培養することが可能であり、或いは、未培養にすることができる。有機体の特定の集団を分離する方法は、混合集団において行われる。
【0064】
したがって、試料は、例えば、有機体(昆虫の消化管に存在する微生物等)の多様な混合集団からの核酸を含む。核酸は、DNA及びRNAを分離する任意の数の方法を使用して試料から分離される。こうした核酸分離方法は、この技術において一般的に実施されている。核酸がRNAである場合、このRNAは、この技術で知られているプライマを使用して、DNAに逆転写することができる。このDNAがゲノムDNAである場合、このDNAは、例えば25ゲージ針を使用して、剪断することができる。
【0065】
核酸は、適切なベクタでクローニングすることができる。使用されるベクタは、この技術で知られている任意の数の方法においてDNAの発現、増幅、又は操作のいずれを行うかによって決定することになる(例えば、高スループット配列ベクタを開示する米国特許第6,022,716号を参照)。クローニング手法は、この技術で知られており、不要な説明を行わなくとも、当業者が構築可能である。ベクタの選択は、更に、本発明の方法において利用されるポリヌクレオチド配列及び宿主細胞のサイズによって変化することになる。したがって、本発明で使用されるベクタは、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルス、及びその他)、又はこの選択部分(例えば、コートタンパク質、スパイク糖タンパク質、カプシドタンパク質)にすることができる。例えば、コスミド及びファージミドは、通常、分析又は修飾される特定の核酸配列が大きい場合に使用され、これは、こうしたベクタが大きなポリヌクレオチドを安定して増殖させることができるためである。
【0066】
クローン核酸配列を含むベクタは、次に、ベクタ(例えば、E.coli宿主上のファージ)により適切な宿主細胞をプレーティング(つまり、クローン増幅)又はトランスフェクションすることで、増幅できる。クローン核酸配列は、適切な有機体を形質転換することで、スクリーニング(例えば、発現スクリーニング、PCRスクリーニング、ハイブリッド形成スクリーニング、又はその他)のためのライブラリを作成するのに使用できる。この技術で知られている宿主は、こうした形質転換に役立つ条件下での接種により、核酸配列を含むベクタを人為的に導入することで形質転換される。二本鎖環状又は線状核酸による形質転換が可能であり、一本鎖環状又は線状核酸配列により形質転換されることもある。形質転換又はトランスフォーメーションとは、新しいDNA(細胞にとって外部性のDNA等)の組み込みに続いて、細胞内で誘発される永続的又は一時的な遺伝子の変化を意味する。細胞が哺乳類細胞である場合、永続的な遺伝子の変化は、通常、細胞のゲノムにDNAを導入することで達成される。形質転換細胞又は宿主細胞とは、一般に、宿主有機体に通常存在しないDNA分子を、組み換えDNA手法を用いて導入された(或いは、その祖先に導入された)細胞(例えば、原核又は真核)を指す。
【0067】
本発明において使用される特定のタイプのベクタは、F因子起点の複製を含む。E.coliのF因子(又は稔性因子)は、接合中の自分自身の高頻度伝達と、バクテリア染色体自体の低頻度伝達とに影響するプラスミドである。特定の実施形態では、「フォスミド」又はバクテリア人工染色体(BAC)ベクタと呼ばれるクローニングベクタが使用される。これらは、DNAの大きなセグメントを安定して統合することが可能なE.coliのF因子に由来するものである。混合未培養環境試料からのDNAと統合する時、これにより、安定した環境遺伝子ライブラリの形態で、大きなゲノム断片を達成することが可能となる。
【0068】
混合集団又は試料に由来する核酸は、様々な手順によってベクタに挿入することができる。一般に、核酸配列は、この技術で知られている手順により、適切な(複数の)制限エンドヌクレアーゼ部位に挿入される。こうした手順その他は、当業者の範囲に入ると思われる。代表的なクローニングのシナリオにおいては、適切なヌクレアーゼ(マングビーンヌクレアーゼ等)で「平滑化」したDNAを、例えば、EcoR Iメチラーゼによりメチル化し、EcoR IリンカGGAATTCC(SEQ ID番号1)に連結させることが含まれる場合がある。このリンカは、その後、EcoR I制限エンドヌクレアーゼにより消化され、DNAのサイズは(例えば、ショ糖勾配を使用して)断片化される。結果として生じるサイズ断片化DNAは、次に、配列、スクリーニング、又は発現のため、適切なベクタに連結される(例えば、λベクタ、及びin vitro λパッケージング抽出を使用したパッケージ化)。
【0069】
組み換えDNAによる宿主細胞の形質転換は、当業者に広く知られている従来の手法により実行できる。宿主がE.coli等の原核である場合、DNAを取り込むことが可能なコンピテント細胞は、指数増殖期の後で回収し、その後、この技術で広く知られる手順により、CaCl方法で処理した細胞から作成できる。代わりに、MgCl又はRbClを使用することができる。形質転換は、宿主細胞のプロトプラストを形成した後で、或いはエレクトロポレーションにより、実行することもできる。
【0070】
宿主が真核である時、DNAによるトランスフェクション又は形質転換の方法には、リン酸カルシウム共沈法、マイクロインジェクション等の従来の機械的手順、エレクトロポレーション、リポソームに包まれたプラスミドの挿入、又はウイルスベクタが含まれ、この技術で知られている他の方法を使用することもできる。真核細胞は、更に、単純ヘルペスチミジンキナーゼ遺伝子等、選択可能なマーカを符号化した第二の異種DNA分子によりコトランスフェクションすることが可能である。別の方法では、シミアンウイルス40(SV40)又はウシ乳頭腫ウイルス等の真核ウイルスベクタを使用し、真核細胞を一時的に感染又は形質転換させ、タンパク質を発現させる(Eukaryotic Viral Vector, Cold Spring Laboratory, グルツマン編、1982)。この真核細胞は、イースト菌(Saccharomyces cerevisiae等)、昆虫の細胞(Drosophila種等)、或いは人間の細胞を含む哺乳類細胞にすることができる。
【0071】
真核系、及び哺乳類発現系により、発現哺乳類タンパク質の翻訳後修飾が可能になる。一次転写、グリコシル化、リン酸化、又は遺伝子産物の分泌を処理する細胞機械を有する真核細胞を使用するべきである。こうした細胞株は、その一部として、CHO、VERO、BHK、HeLa、COS、MDCK、Jurkat、HEK−293、及びWI38を含むことができる。
【0072】
一実施形態において、上で説明したものを含め、任意の数の方法を使用して、クローンのライブラリが作成された後、クローンは、例えば、栄養豊富なブロス又はこの技術で知られる他の成長培地等の液体培地で再懸濁される。通常、培地は、素早くピペットで取ることが可能な液体培地である。その後、ライブラリの少なくとも一つのクローンを含む一つ以上の培地タイプを、個別に、或いは混合物として共に、キャピラリアレイのキャピラリに(すべて、又はその一部を)導入する。
【0073】
別の実施形態において、ライブラリは、最初に、キャピラリデバイス又は他のスクリーニング手法に導入又は送出する前に、バイオパニングされる。こうしたバイオパニング方法は、所定の配列又は活性に関して、ライブラリを濃縮する。バイオパニングする方法の例については、下で説明する。
【0074】
一実施形態において、ライブラリは、ライブラリ又はクローン内に存在するポリヌクレオチド配列に基づいて、所定の配列又は活性を含むクローンに関してスクリーニング又は選別することができる。したがって、本発明は、望ましい生物学的活性又は生物学的配列に関して、有機体をスクリーニングするのに有効で、更に、定方向進化、分子生物学、バイオテクノロジ、及び産業用途において使用可能な所定の配列の取得を支援する方法及び組成を提供する。
【0075】
したがって、本発明は、試料中に存在する核酸配列をスクリーニング及び同定することで、試料中の配列を迅速にスクリーニング、濃縮、及び又は同定する方法を提供する。そのため、本発明は、診断学、治療学、又は産業用途の分子を発展させるのに使用できる利用可能な配列のレパートリを増やす。したがって、本発明の方法は、望ましい生物学的活性を有するタンパク質又はポリペプチドを符号化する新しい核酸配列を同定することができる。
【0076】
遺伝子ライブラリ(発現ライブラリ等)が生成された後、発現スクリーニングの前に、こうしたライブラリを「バイオパニング」する追加ステップを含めることができる。この「バイオパニング」手順は、クローンのライブラリにおいて配列相同性に関するスクリーニングを行うことで、指定された生物学的活性を有するクローンを同定するプロセスを指す。
【0077】
ライブラリ内の所定のターゲット配列と選択的に相互作用させるために使用するプローブ配列は、既知の生物活性に関する全長コーディング領域配列又は部分コーディング領域配列にすることができる。ライブラリは、既知の生物活性を符号化する配列又は望ましい生物活性を有する配列の少なくとも一部を含むプローブの混合物を使用して、プローブすることができる。こうした複数のプローブ又はプローブライブラリは、好ましくは、一本鎖である。一実施形態において、ライブラリは、好ましくは、一本鎖の形態に転換される。特に適切なプローブは、スクリーニングされる指定の生物活性に類似する活性、或いは同一の活性を有する生物活性を符号化するDNAに由来するものである。プローブは、PCR増幅に使用することが可能であり、したがって、ターゲット配列を選択することができる。代わりに、プローブ配列は、実質的な相同性又は望ましい相同性を備える配列を同定するのに使用できるハイブリッド形成プローブとして使用することができる。
【0078】
別の実施形態において、FACS系装置を利用して、in vivoバイオパニングを実行することができる。遺伝子ライブラリ又は発現ライブラリは、転写RNAを安定化する要素を含むベクタにより構築される。例えば、RNAの転写領域を側面に置くように設計されたヘアピンのような二次構造を発生させる配列を含めることは、安定性を強化するのに役立ち、そのため、細胞内での半減期を増加させる。バイオパニングプロセスにおいて使用されるプローブ分子は、ターゲット配列との相互作用時に検出可能な信号を提供する(例えば、プローブがターゲット分子と結合した時のみ蛍光を発する)検出可能な分子によって標識されたオリゴヌクレオチドによって構成される。例えば、ハワード・M・シャピロM.D.の”Practical Flow Cytometry”, 1995, Wiley−Liss, Inc.において説明されているもの等、この技術で知られている様々な染料又は染色剤を使用して、オリゴヌクレオチドを「標識」するために、核酸にインタカレート又は関連付けすることができる。こうしたプローブは、いくつかの形質転換方法の一つを使用して、ライブラリの組み換え細胞に導入される。プローブ分子は、転写されたターゲットmRNA又はDNAと相互作用又はハイブリッド形成し、DNA/RNAヘテロ二本鎖分子又はDNA/RNA二本鎖分子を発生させる。プローブのターゲットとの結合により、スクリーニングプロセス中に、FACS装置又はその他によって検出及び選別される検出可能な信号(蛍光信号等)が生じることになる。
【0079】
プローブDNAは、少なくとも約10塩基、好ましくは、少なくとも15塩基にするべきである。一実施形態においては、経路の一部分のコーディング領域全体を、プローブとして利用することができる。プローブがin vitro系においてターゲットDNAとハイブリッド形成する場合、少なくとも一つのDNAプローブを使用することでターゲットDNAが分離されるハイブリッド形成の条件は、配列同一性が少なくとも約50%となるハイブリッド形成の緊縮性を提供するように設計され、更に詳しくは、配列同一性が少なくとも約70%となる緊縮性を提供する。
【0080】
対象となる可能性のあるターゲットDNAを分離するために微生物DNAライブラリをプローブするハイブリッド形成手法は、この技術において広く知られており、本明細書での使用には、文献において説明されている任意のものが適切であり、これには例えば、チップ単位の検定法、膜単位の検定法、及びその他が含まれる。
【0081】
結果として生じる形質転換クローンのライブラリは、その後、所定の活性を示すクローンに関して、更にスクリーニングすることができる。クローンは、活性化合物の発現のために、代替宿主へ輸送することが可能であり、或いは、本明細書で説明する方法を使用してスクリーニングすることができる。
【0082】
上で説明したin vitroバイオパニングの代替方法は、例えば、ゲル微小液滴等のカプセル化手法であり、これは多数のクローンを一つの場所に局所化し、FACS装置でスクリーニングするために利用することができる。クローンは、その後、再度FACS装置でスクリーニングし、陽性である個々のクローンを同定するために、個別のクローンに分割することができる。このようなFACS装置を使用するスクリーニングは、1997年6月16日に出願された特許出願番号第08/876,276号において十分に説明されている。したがって、例えば、クローン混合物が望ましい活性を有する場合は、個々のクローンを回収し、FACS装置を利用して再スクリーニングし、こうしたクローンの中から、指定された望ましい活性を有するものを決定することができる。
【0083】
本発明では、様々なタイプのカプセル化方法及び化合物又はポリマを使用することができる。例えば、高温のアガロースを利用して、高温で安定した微小液滴を作成することが可能であり、これにより、熱安定生物活性に関してスクリーニングする時、すべての背景活性を除去するために利用される熱殺菌ステップの後、安定した細胞のカプセル化を得ることができる。カプセル化は、ビード、高温アガロース、ゲル微小液滴、ゴースト赤血球細胞又はマクロファージ等の細胞、リポソーム、又は分子をカプセル化及び局所化する他の任意の手段で行うことができる。
【0084】
例えば、リポソームを作成する方法が説明されており(例えば、米国特許第5,653,996号、第5,393,530号、及び第5,651,981号)、様々な分子をカプセル化するためのリポソームの使用方法も説明されている(例えば、米国特許第5,595,756号、第5,605,703号、第5,627,159号、第5,652,225号、第5,567,433号、第4,235,871号、及び第5,227,170号)。エンドサイトーシス中のタンパク質、ウイルス、バクテリア、及びDNAの包括についても、同様に説明されている(例えば、Journal of Applied Biochemistry 4, 418−435 (1982)を参照)。膜の低浸透圧溶解又は絶縁破壊中に包括される物質のin vitro又はin vivoでのキャリアとして利用される赤血球についても説明されている(Their, G. M. (1983) J. Pharm. Therにおいて検討されている)。これらの手法は、本発明において、スクリーニングのために微環境で試料をカプセル化するのに役立つ。
【0085】
「微環境」とは、本発明での使用において、本発明の方法に必要な相互作用を促進するのに適した環境を提供する任意の分子環境を指す。分子の相互作用を促進するのに適した環境は、例えば、リポソームを含む。リポソームは、リン脂質と、糖脂質と、ステロイドと、アルキルリン酸塩等の長鎖アルキルエステルと、レシチン等の脂肪酸エステルと、脂肪族アミンと、その他とを含む様々な脂質から作成することができる。脂肪質の混合物は、中性ステロイド、荷電両親媒性物質、及びリン脂質といった組み合わせで利用することができる。リン脂質の説明例には、レシチンと、スフィンゴミエリンと、ジパルミトイルホスファチジルコリンとが含まれる。代表的なステロイドには、コレステロールと、コレスタノールと、ラノステロールとが含まれる。代表的な荷電両親媒性物質化合物は、一般に、12乃至30の炭素原子を含む。これは、モノアルキル又はジアルキルリン酸エステル、又はアルキルアミンであり、例えば、ジセチルリン酸塩、ステアリルアミン、ヘキサデシルアミン、ジラウリルリン酸塩、及びその他である。
【0086】
更に、上で説明した実施形態の一部又は全部を組み合わせ、発現ライブラリの生成前に平均化ステップを実行し、その後、発現ライブラリを生成し、次に、このように生成された発現ライブラリをバイオパニングし、その後、バイオパニングされた発現ライブラリを高スループット細胞選別及びスクリーニング機器を使用してスクリーニングすることが可能である。したがって、様々な選択肢が存在し、これには、(i)ライブラリを生成し、その後、スクリーニングすること、(ii)ターゲットDNAを平均化し、ライブラリを生成し、その後、スクリーニングすること、(ii)平均化し、ライブラリを生成し、バイオパニングし、スクリーニングすること、或いは(iv)ライブラリを生成し、バイオパニングし、スクリーニングすることが含まれる。ライブラリを生成するために使用する核酸は、例えば、環境試料と、有機体の混合集団(培養又は未培養等)と、その濃縮集団と、その分離物とから取得することができる。加えて、スクリーニング手法は、例えば、ハイブリッド形成スクリーニングと、PCRスクリーニングと、発現スクリーニングと、その他とを含む。
【0087】
ゲル微小液滴技術は、フローサイトメトリ分析で利用可能な信号を増幅することと、バイオテクノロジに関する菌株改良プログラムで微生物菌株のスクリーニングを可能にすることとにおいて、意義を有してきた。ウィットルプら(Biotechnolo. Bioeng. (1993) 42:351−356)は、Aspergillus awamoriグルコアミラーゼの分泌増進に関して、10を超えるイースト菌の迅速な量的スクリーニングを可能にする微小カプセル化選択方法を開発した。この方法は、高分泌突然変異体に関して400倍のシングルパス濃縮を提供する。
【0088】
ゲル微小液滴又は他の関連技術は、本発明において、組み換えライブラリの高スループットスクリーニングにおいて、局所化、選別、及び信号の増幅を行うのに使用することができる。核酸を微小液滴から回収できるため、スクリーニング中の細胞の生存可能性は、問題ではなく、或いは重要ではない。
【0089】
所定の配列を含むクローンに関してライブラリを濃縮できる任意の数のバイオパニング手法に続いて、濃縮クローンは、ブイヨンその他の成長培地等の液体培地に懸濁される。したがって、濃縮クローンは、試料(例えば、有機体の混合集団、その分離物、及びその他)に由来する核酸配列が組み込まれたベクタを含む構造物により形質転換された複数の宿主細胞を含む。クローンのサブセットと、検出可能な分子を有する一つ以上の基質(酵素基質等)とを含む液体培地は、その後、個別に、或いは混合物として共に、濃縮クローンに導入又は接触させる(キャピラリアレイのキャピラリ内等)。基質と、望ましい酵素活性を有する酵素を発現するクローンとの相互作用(反応を含む)により、生産物又は検出可能な信号が生成され、これは、少なくとも一つの信号生成クローンを含む一つ以上のクローン又はキャピラリを同定するために、空間的に検出することができる。この信号生成クローン又は信号生成クローンに含まれる核酸は、その後、任意の数の手法を使用して回収することができる。
【0090】
「基質」とは、本明細書での使用において、例えば、生物活性又は生体分子(例えば、酵素、及びその特定の酵素活性)を検出するための基質を含む。こうした基質は、この技術において広く知られている。例えば、様々な酵素、及びこうした酵素に固有の適切な基質は、Molecular Probes, Handbook Of Fluorescent Probes and Research Chemical(オレゴン州ユージーン所在のMolecular Probes,Inc)において提示されており、その開示内容は出典を明記することにより本願明細書の一部とする。基質は、関連する検出可能な分子を有することが可能であり、これには、例えば、発色又は蛍光分子が含まれる。本発明で使用するのに適した基質は、望ましい活性を有する一定の酵素、或いはこうした酵素を符号化する一定のクローンとの相互作用(例えば、反応)時に、光学的に検出可能な信号を生成する任意の基質である。
【0091】
当業者は、例えば、望ましい酵素活性に基づいて、適切な基質を選択できる。望ましい酵素/酵素活性の例には、本明細書で列挙するものが含まれる。望ましい酵素活性には、更に、光学信号基質が存在する酵素経路内の酵素のグループを含むことができる。この一例は、一連のカロチノイド合成酵素である。
【0092】
基質は、特に、グルコシダーゼ、プロテアーゼ、ホスファターゼ、及びモノオキシゲナーゼについて知られており及び又は市販されている。検出可能な(光学等の)信号基質を備えるプロテアーゼには、セリンプロテアーゼ――トリプシン及びキモトリプシンが含まれる。グルコシダーゼには、マンノシダーゼ、アミログルコシダーゼ、セルラーゼ、ノイラミニダーゼ、β−ガラクトシダーゼ、及びアルファアミラーゼが含まれる。
【0093】
望ましい活性が、多数の基質を有する他の生体分子又は酵素のものと同じクラスである時、その活性は、既知の基質の反応混液を使用して、検査することができる。例えば、基質は、約20種類の市販のエステラーゼについて知られており、こうした既知の基質の組み合わせは、光学的ではないとしても、検出可能な信号生成を提供する。
【0094】
光学信号基質は、発色基質、蛍光基質、生物発光又は化学発光基質、或いは、蛍光共鳴エネルギ移動(FRET)基質にすることができる。検出可能な種は、基質の分割、或いは、検出可能な変化を被るように、分割又は他の基質/生体分子の相互作用によって影響される二次的分子から生じるものにすることができる。検出可能な検定形式の無数の例は、イムノアッセイ、クロモジェニックアッセイ、及び標識プローブ法を使用する診断技術から知られている。
【0095】
一実施形態において、光学信号基質は、生物発光又は化学発光基質にすることができる。いくつかの酵素に関する化学発光基質は、Tropix(マサチューセッツ州ベッドフォード)から入手できる。既知の化学発光基質を有する酵素には、アルカリホスファターゼ、β−ガラクトシダーゼ、β−グルコロニダーゼ、及びβ−グルコシダーゼが含まれる。
【0096】
別の実施形態においては、発色基質を、特に、加水分解酵素といった特定の酵素に関して使用することができる。例えば、この光学信号基質は、酵素的に切断され、発色産物を発生させるインドリル誘導体にすることができる。発色基質が使用される場合、光学的に検出可能な信号は、光吸収度(吸収度の変化を含む)である。この実施形態においては、分光光度計又はその他を使用した吸収度測定によって、信号を検出することができる。
【0097】
別の実施形態においては、蛍光基質が使用され、光学的に検出可能な信号は、蛍光となる。蛍光基質は、検出性を高める高感度と、代わりの検出モードとを提供する。水酸基及びアミノ置換クマリンは、蛍光基質の作成に利用される蛍光物質として最も広く使用されている。通常のクマリン系蛍光基質は、7−ヒドロキシクマリンで、一般にウンベリフェロン(Umb)として知られている。ウンベリフェロンの誘導体及び類似体も使用される。フルオレセイン(FDG又はC12−FDG等)及びローダミンの誘導体及び類似体系基質も使用される。レゾルフィン(例えば、レゾルフィンβ−D−ガラクトピラノシド又はレゾルフィンβ−D−グルクロニド)は、本発明において特に有用である。レゾルフィン系基質は、例えば、グリコシダーゼ、ヒドロラーゼ、及びデアルキラーゼに関するスクリーニングにおいて有用である。前記の基質(アルキル化誘導体等)の脂肪親和性誘導体は、一般に、細胞に容易に取り込まれ、細胞の脂質領域と結びつく傾向を有することがあるため、特定の実施形態において有用な場合がある。フルオレセイン及びレゾルフィンは、相対的に水に溶解しにくい(つまり、脂肪親和性の)製品を形成するアルキル化誘導体として市販されている。例えば、蛍光画像化は、Molecular Probes(オレゴン州ユージーン)が基質として製造するC12−レゾルフィンガラクトシドを使用して実行することができる。
【0098】
使用する特定の蛍光基質は、スクリーニングする酵素活性に基づいて選択することができる。以下に例を挙げる。
【0099】
リパーゼ/エステラーゼ。リパーゼ又はエステラーゼ活性を有する酵素に関してスクリーニングする時は、フルオレセインのアシル化誘導体が使用される。蛍光物質は、この誘導体から加水分解され、信号を生成する。
【0100】
プロテアーゼ。プロテアーゼ活性を有する酵素は、エステラーゼと同じ方法でスクリーニングされ、エステルの代わりにアミド結合が切断される。現在、100種類を大きく上回るプロテアーゼ基質を、アシル化蛍光物質の切断部位において利用することができる。
【0101】
モノオキシゲナーゼ(デアルキラーゼ)。モノオキシゲナーゼ基質として適するいくつかのクマリン誘導体が市販されている。通常、こうした基質では、この化合物のエチル基のヒドロキシ化により、レゾルフィン蛍光物質の放出が生じる。
【0102】
通常、基質は、細胞に入り、分析を行うのに十分な期間に渡って、細胞内での存在を維持することができる(例えば、基質は、細胞に入ると、検出可能な反応を生成するのに十分な期間に渡って、スクリーニングされる酵素と反応する前に再び「漏出」することはない)。細胞内での基質の保持は、様々な手法によって強化することができる。一方法において、この基質化合物は、疎水性(例えばアルキル)の尾部を追加することで、構造的に修飾される。別の実施形態では、DMSO又はグリセロール等の溶媒を使用し、細胞の外部を覆うことができる。更に、この基質は、細胞からの基質の漏出を遅らせることが観察された換算温度で、細胞に与えることができる。しかしながら、基質の細胞への侵入は、例えば、酵素又はポリペプチドが分泌され、溶解細胞試料その他の中に存在する場合、或いは、基質が細胞に対して外的に作用できる場合(細胞外受容体リガンド複合体等)、必須ではない。
【0103】
光学信号基質は、一部の実施形態において、FRET基質にすることができる。FRETは、蛍光物質の近接性と相対的な角度方向とをモニタすることが可能な分光学的方法である。FRETを使用して基質又は生産物の濃度を測定する蛍光インジケータシステムは、発光及び励起スペクトルを有する二つの蛍光部分を含み、一方を「ドナー」蛍光部分とし、他方を「アクセプタ」蛍光部分とする。二つの蛍光部分は、アクセプタ蛍光部分の励起スペクトルが励起された部分(ドナー蛍光部分)の発光スペクトルと重複するように選択される。ドナー部分は、ドナー部分の励起スペクトル内の適切な強度の光によって励起され、吸収エネルギを蛍光として放出する。アクセプタ蛍光タンパク質部分が励起状態のドナー部分を抑制するように配置される時、蛍光エネルギは、アクセプタ部分に転送され、アクセプタ部分は第二のフォトンを放出することができる。ドナー及びアクセプタ部分の放出スペクトルは、最低限の重複を有するため、二つの放出を識別することが可能である。したがって、アクセプタがドナーよりも長い波長で蛍光を発する時には、最終的な定常状態の結果として、ドナーの放出は抑制され、ドナーの吸収極大で励起された時に、アクセプタが放出を行うようになる。
【0104】
検出可能又は光学的信号は、例えば、蛍光偏向、時間分解蛍光、又はFRETを含む蛍光を検出する蛍光光度計(又は同様のもの)を使用して測定可能である。一般に、第一の波長を有する励起源からの励起放射は、試料を励起する励起放射を発生させる。これに応じて、試料中の蛍光化合物は、励起波長とは異なる波長を有する放射を発する。蛍光物質に関する検定を行う方法は、この技術で広く知られており、例えば、ラコビッツ(Principles of Fluorescence Spectroscopy, New York, Plenum Press, 1983)及びハーマン(”Resonance energy transfer microscopy,” in: Fluorescence Microscopy of Living Cells in Culture, Part B, Methods in Cell Biology, vol. 30, ed. Taylor & Wang, San Diego, Academic Press, 1989, pp. 219−243)により説明されている。蛍光検出手法の例については、下で更に詳細に説明する。
【0105】
加えて、レポータ遺伝子を使用して遺伝子発現を測定することについて、いくつかの方法が、文献で説明されている。ノランらは、哺乳類細胞でのβ−ガラクトシダーゼ発現を分析する手法について説明している。この手法では、フルオレセイン−ジ−β−D−ガラクトピラノシド(FDG)をβ−ガラクトシダーゼに関する基質として利用し、これは、加水分解時に、蛍光発光により検出可能な生産物であるフルオレセインを放出する(ノランら,1991年)。他の蛍光基質も開発されており、例えば、5−ドデカノイルアミノフルオレセインジ−β−D−ガラクトピラノシド(C12−FDG)(Molecular Probes)は、生理的培養条件下で、殆どの細胞膜を容易に横断可能な脂肪親和性フルオレセイン誘導体である点において、FDGと異なっている。
【0106】
上で述べたβ−ガラクトシダーゼ検定は、例えば、Sulfolobus solfataricusといった超好熱性古細菌から分離される組み換えβ−D−ガラクトシダーゼを発現する、単一のE.coli細胞をスクリーニングするのに利用することができる。他のレポータ遺伝子も、基質として有用である場合があり、β−グルコロニダーゼ、アルカリホスフォターゼ、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、及びルシフェラーゼに関して知られている。
【0107】
ライブラリは、例えば、特定の酵素活性に関してスクリーニングすることができる。例えば、スクリーニングする酵素活性は、オキシドレダクターゼと、トランスフェラーゼと、ヒドロラーゼと、リアーゼと、イソメラーゼと、リガーゼとである6種類のIUBクラスの一つ以上にすることができる。IUBクラスの一つ以上に関して陽性であると判断された組み換え酵素は、その後、更に具体的な酵素活性に関して再スクリーニングすることができる。
【0108】
代わりに、ライブラリは、更に特化した酵素活性に関してスクリーニングすることができる。例えば、ライブラリは、ヒドロラーゼ活性に関して全般的にスクリーニングする代わりに、更に特化した活性、つまり、ヒドロラーゼが作用する結合のタイプに関してスクリーニングすることができる。したがって、例えば、ライブラリは、(a)アミド(ペプチド結合)、つまりプロテアーゼと、(b)エステル結合、つまりエステラーゼ及びリパーゼと、(c)アセタール、つまりグリコシダーゼ及びその他とのような一つ以上の特定の化学的官能性に作用するようなヒドロラーゼを確認するためにスクリーニングすることができる。
【0109】
上の態様の一つに関して説明したように、本発明は、微生物に由来する選択されたDNAを含むクローンの活性スクリーニングに関するプロセスを提供し、この方法は:
所定の生体分子又は所定の生物活性に関しライブラリをスクリーニングし、このライブラリが複数のクローンを含み、このクローンが有機体の混合集団、その濃縮集団、又はその分離物から核酸(ゲノムDNA等)を回収することで作成されるステップと、所定の生体分子又は生物活性に関してスクリーニングするクローンを生成するために宿主を核酸により形質転換するステップとである。
【0110】
別の実施形態においては、活性に基づくスクリーニングの前に、濃縮ステップを使用することができる。この濃縮ステップは、例えば、バイオパニング法にすることができる。こうした「バイオパニング」の手順は、2000年4月25日に発行された米国特許第6,054,002号において説明及び例証されており、その開示内容は出典を明記することにより本願明細書の一部とする。
【0111】
別の実施形態においては、ポリヌクレオチドがクローンに含まれ、このクローンは、有機体の混合集団の核酸配列から作成され、この核酸配列は、有機体の混合集団の遺伝子ライブラリを作成するために使用される。この遺伝子ライブラリは、望ましい活性を有する生物活性を符号化したDNA配列の全部又は一部である検出可能な分子を有する少なくとも一つの核酸配列によりライブラリを含む宿主細胞をトランスフェクションし、例えば、蛍光系の分析により、望ましい配列を含むライブラリクローンを分離することで、所定の配列に関してスクリーニングされる。
【0112】
本発明は、多くのタイプの生物活性に関してスクリーニングを行う能力を提供する。例えば、研究用の新しいポリケチドを生成するために、ポリケチド及びポストポリケチド生合成遺伝子のライブラリから、望ましい成分を選択し組み合わせる能力は、魅力あるものといえる。本発明の複数の方法は、これを可能にするものであり、(特に、F因子系ベクタ等、大きな挿入を受け入れることが可能なベクタを使用する時に)大きな挿入を含むクローンを備える遺伝子ライブラリの生成が可能となり、これが遺伝子群のクローニングを容易にするため、新しいポリケチド合成酵素と、商業的に関連する二次代謝産物を符号化するその他の関連経路又は遺伝子とのクローニングを容易にする。
【0113】
上で説明したバイオパニングのアプローチは、一定のプローブ配列と相同的な配列を運ぶクローンで濃縮されたライブラリを作成するために使用できる。このアプローチを使用することで、40kbpまでの挿入と共にクローンを含むライブラリは、パニングの各ラウンド後、約1,000倍に濃縮することができる。これにより、一ラウンドのバイオパニング濃縮後にスクリーニングされるクローンの数を減らすことができる。このアプローチは、例えば、ポリケチド配列等、所定の生物活性に関連する所定の配列を運ぶクローンに関して濃縮されたライブラリを作成するために適用できる。
【0114】
高密度フィルタ又はバイオパニングを使用するハイブリッド形成スクリーニングは、保全された遺伝子を含む経路の相同物を検出する上で効率的なアプローチであることが証明されている。しかしながら、既知の対応物が存在しない可能性のある新しい生物活性分子を発見するためには、別のアプローチが必要になる。本発明の別のアプローチでは、小分子のリング構造又は「バックボーン」の発現に関して、E.coli内でスクリーニングを行う。こうした多環構造を符号化する遺伝子はE.coli内で発現する場合が多いため、小分子バックボーンは、不活性形態であるとしても、生成することが可能である。生物活性は、構造を修飾又は「デコレート」して活性形態にすることができる必要なグリコシル化及びメチル化遺伝子を発現する適切な宿主に分子又は経路を転送した時点で与えられる。したがって、組み換えによりE.coli内で発現した不活性リング化合物は、クローンを同定し、次に、ストレプトミセスのように代謝的に豊かな宿主へ輸送し、その後、生物活性分子を生成するために検出される。高スループットロボットシステムの使用により、マイクロタイターディッシュの多重アレイにおいて膨大な数のクローンをスクリーニングすることが可能となる。
【0115】
こうした構造を運ぶクローンを検出及び濃縮するアプローチの一つでは、キャピラリスクリーニング法又はFACSスクリーニングを使用し、1997年6月16日に出願された米国出願番号第08/876,276号において、手順が説明及び例証されている。多環リング化合物は、通常、紫外線光によって励起される時、特徴的な蛍光スペクトルを有する。したがって、こうした構造を発現するクローンは、十分な感度の検出方法を使用して背景から識別することができる。例えば、高スループットFACSスクリーニングは、E.coliライブラリの小分子バックボーンに関するスクリーニングに利用することができる。市販のFACS装置は、UV活性分子に関して、毎秒100,000クローンまでをスクリーニングする能力を有する。こうしたクローンは、更にFACSスクリーニングで選別することが可能であり、或いは、定在のプラスミドを抽出し、活性スクリーニングのためにストレプトミセスへ輸送することができる。
【0116】
代替のスクリーニングアプローチにおいては、ストレプトミセス宿主への輸送後、候補クローンからの有機抽出物を、Staphylococcus aureus又はSaccharomyces cervisiae等のテスト有機体に対する感受性スクリーニングにより、生物活性に関してテストすることができる。
【0117】
本発明によって提供される上で述べたスクリーニング法の代替方法は、「混合抽出」スクリーニングと呼ばれるアプローチである。「混合抽出」スクリーニングのアプローチは、ストレプトミセス等の代謝的に豊かな宿主において多環バックボーンが発現される時、活性を与えるために補助遺伝子が必要であるという事実と、in vitroで生物活性化合物を生成するために、酵素を抽出し、E.coliクローンから抽出されたバックボーンと組み合わせることが可能であるという事実を利用する。様々な成長段階で、ストレプトミセス菌株等の代謝的に豊かな宿主からの酵素抽出標本は、E.coliライブラリからの有機抽出物のプールと結合され、その後、生物活性に関して評価される。
【0118】
E.coliクローンにおける活性を検出する別のアプローチでは、生物活性化合物を異なる形態へ変換できる遺伝子に関してスクリーニングが行われる。例えば、最近では、低価値のダウノマイシンを価値の高いドキソルビシンに変換することが可能な組み換え酵素が発見されている。同様の酵素経路は、ペニシリンをセファロスポリンに変換するために探求されている。
【0119】
キャピラリスクリーニングは、例えば、ストレプトミセス等の代謝的に豊かな宿主におけるUV蛍光分子の発現を検出するために使用することができる。組み換えオキシテトラサイクリンは、S.lividans TK24において非相同的に生成される時、診断的な赤色蛍光を維持する。本発明の方法及びシステムによって同定可能な経路のクローンは、したがって、高スループット方式で、多環の分子に関してスクリーニングできる。
【0120】
組み換え生物活性化合物は、「ツーハイブリッド」システムを使用して、in vivoでスクリーニングすることが可能であり、これは、転写因子とその活性物質との間、或いはレセプタとその同族ターゲットとの間にあるような、タンパク質−タンパク質又はその他の相互作用のエンハンサ及びインヒビタを検出することができる。この実施形態では、小分子経路とGFPレポータ構成物との両方が、共発現する。GFP発現において変化したクローンは、その後、同定することが可能であり、このクローンは特徴付けのために分離される
指摘したように、薬品を発見する一般的なアプローチには、疾病ターゲット(疾病の発生に関与する高分子)を治療活性に関してテストされる潜在的薬品候補に晒すスクリーニング検定が伴う。他のアプローチでは、バクテリア又は腫瘍細胞株等、代表的な疾病の原因物質である完全な細胞又は有機体を、スクリーニングの目的で潜在的候補に晒す。こうした任意のアプローチは、本発明で利用することができる。
【0121】
本発明では、更に、異種発現と、上で簡単に説明した様々なスクリーニングアプローチを使用した所定の生物活性化合物に関する下流でのスクリーニングとのために、未培養試料に由来するクローン経路を、代謝的に豊かな宿主に転送することが可能となる。
【0122】
遺伝子ライブラリからの異なる発現クローンをそれぞれ含む生存又は非生存細胞をスクリーニングし、陽性のクローンを回収した後、この技術で広く知られる手法を利用して、陽性クローンからDNAを分離することができる。このDNAは、その後、この技術で知られている任意の様々な増幅手法を利用して、in vivo又はin vitroのいずれかで増幅することができる。in vivo増幅は、(複数の)クローン又は(複数の)サブクローンを生存に適した宿主へと転換し、続いて宿主を成長させることを含む。in vivo増幅は、ポリメラーゼ連鎖反応等の手法を使用して実行できる。増幅後、同定された配列は、「進化」させること、或いは配列決定することが可能である。
【0123】
本発明が提供する利点の一つは、変更した配列、活性、又は特異性を有する符号化された変異体を生成及び選択するために、同定された生体分子又は生物活性を操作する能力である。
【0124】
スクリーニングが実行された生体分子又は生物活性を有すると判断されたクローンには、定方向突然変異生成を施し、望ましい特性を有する新しい生体分子又は生物活性を開発すること、或いは、熱又は有機溶媒に対する安定性等、自然状態(野生型の活性等)では欠如しているか又は顕著ではない特に望ましい特性を有する修飾生体分子又は生物活性を開発することができる。定方向突然変異生成に関する任意の既知の手法を、本発明に適用することができる。例えば、本発明による使用において特に好適な突然変異生成手法は、下で説明するものを含む。
【0125】
代わりに、本明細書で説明するように取得、同定、又はクローニングされた生体分子(例えば、ペプチド、タンパク質、又はポリヌクレオチド配列)又は生物活性(例えば、酵素活性)に変化を与えることが望ましい場合がある。こうした変化は、例えば、ポリペプチドの活性と、特異性と、親和性と、機能と、その他とを増加又は減少させるために、生体分子又は生物活性を修飾することができる。DNAシャッフリングは、実質的に相同だが同一ではない配列の間での組み換えを示すものであり、一部の実施形態において、DNAシャッフリングは、cer/lox及び又はflp/frt系を介するような、非相同組み換えを介した乗り換えを伴う場合がある(例えば、出典を明記することによりその開示内容を本願明細書の一部とする1997年8月17日にジェイ・ショート博士に対して発行され、Diversa Corporationに譲渡された米国特許第5,939,250号を参照)。ポリヌクレオチド又はポリペプチド配列をシャッフリングすること、突然変異させること、或いはこれらに変化を与えることに関する様々な方法については、下で説明する。
【0126】
核酸シャッフリングは、ポリヌクレオチド又は(複数の)ポリヌクレオチドを生成するために、短い又は小さいポリヌクレオチドのプールをin vitro又はin vivoで相同組み換えする方法である。関連する核酸配列又はポリヌクレオチドの混合物に、ランダムなポリヌクレオチドを提供するセクシャルPCRを施し、組み換えハイブリッド核酸分子又はポリヌクレオチドのライブラリ又は混合集団を生成するために、これを再構成する。カセット式突然変異生成とは対照的に、シャッフリング及びエラープローンPCRのみで、配列のプールを盲目的に(プライマ以外の配列情報なしに)突然変異させることができる。
【0127】
反復選択に関してエラープローンPCRのみと比較した本発明の突然変異生成シャッフリングの利点は、次のように説明することで最も理解できる。DNAシャッフリングについて、(セクシャルPCRではなく)エラープローンPCRと比較して考える。選択又はプールされた配列の最初のライブラリは、様々な起源の関連配列で構成される可能性があり、或いは、単一の遺伝子の任意のタイプの突然変異生成(シャッフリングを含む)に由来する可能性がある。選択された配列の集合は、活性選択の第一のラウンド後に取得される。シャッフリングにより、例えば、すべての関連配列の自由な組み合わせでの関連付けが可能になる。
【0128】
この方法は、逆連鎖反応である点において、エラープローンPCRとは異なる。エラープローンPCRにおいては、ポリメラーゼ開始部位の数と、分子の数とは、指数関数的に増加する。しかしながら、ポリメラーゼ開始部位の配列と、分子の配列とは、本質的に同じ状態を維持する。対照的に、核酸の再構成、或いはランダムなポリヌクレオチドのシャッフリングでは、開始部位の数と、ランダムなポリヌクレオチドの数(サイズではない)とは、経時的に減少する。プラスミド全体に由来するポリヌクレオチドに関して、理論的な終点は、単一の大きなコンカテマ分子である。
【0129】
乗り換えは相同の領域で発生するため、組み換えは、主に、同じ配列ファミリの構成要素間で発生する。これにより、著しく不適合な配列(例えば、異なる活性又は特異性を有する)の組み合わせは阻止される。配列の多数のファミリを、同じ反応内でシャッフリングできると考えられる。更に、シャッフリングでは、一般に、相対順序が保護される。
【0130】
シャッフルされるものは、まれに、多数の最善の分子(例えば、最高の活性又は特異性)を含むことになり、こうしたまれなものは、その優れた活性又は特異性に基づいて選択することができる。
【0131】
100種類のポリペプチド配列のプールは、10種類の方法で並べ替えることができる。こうした多数の並べ替えは、DNA配列の単一のライブラリでは表現できない。したがって、望ましい配列の長さ及び配列多様性に応じて、多数のサイクルのDNAシャッフリング及び選択が必要になる場合があると考えられる。エラープローンPCRは、対照的に、選択された配列をすべて同じ相対的な方向性で維持し、遙かに小さな突然変異体の群れを生成する。
【0132】
本発明の方法で使用することが可能な鋳型ポリヌクレオチドは、DNA又はRNAにすることができる。これは、遺伝子、或いは、組み換え又は再構成する短い又は小さいポリヌクレオチドのサイズに応じて、様々な長さにすることができる。好ましくは、鋳型ポリヌクレオチドは、50bp乃至50kbである。所定のタンパク質を符号化する核酸を含むベクタ全体を、本発明の方法において使用することができると考えられ、実際に、使用に成功している。
【0133】
鋳型ポリヌクレオチドは、PCR反応(米国特許第4,683,202号及び第4,683,195号)或いはその他の増幅又はクローニング方法を使用した増幅により取得することができる。しかしながら、PCR産物のプールを行う前に、PCR産物から遊離プライマを除去することで、セクシャルPCRは、更に効率的な結果を提供できる。セクシャルPCRの前に、オリジナルのプールからプライマを十分に除去しなかった場合は、乗り換えクローンの頻度が低くなる可能性がある。
【0134】
鋳型ポリヌクレオチドは、二本鎖である場合が多い。結果として生じる一本鎖ポリヌクレオチドが互いに相補的であり、したがって、ハイブリッド形成により二本鎖分子を形成できる状態を確保するために、二本鎖核酸分子が推奨される。
【0135】
鋳型ポリヌクレオチドとの同一性領域と、鋳型テンプレートとの異種領域とを有する一本鎖又は二本鎖核酸ポリヌクレオチドを、このステップで鋳型ポリヌクレオチドに追加できると考えられる。更に、二種類の関連するポリヌクレオチド鋳型を、このステップで混合できると考えられる。
【0136】
二本鎖ポリヌクレオチド鋳型と、追加した任意の二本鎖又は一本鎖ポリヌクレオチドとは、約5bp乃至5kb以上の混合物を提供するための緩慢化又は停止を含むセクシャルPCRを受ける。好ましくは、ランダムなポリヌクレオチドのサイズは、約10bp乃至1000bpであり、更に好ましくは、ポリヌクレオチドのサイズは、約20bp乃至500bpである。
【0137】
代わりに、多数のニックを有する二本鎖核酸を、本発明の方法において使用できると考えられる。ニックとは、二本鎖核酸の一本の鎖における切れ目である。こうしたニック間の距離は、好ましくは、5bp乃至5kbであり、更に好ましくは、10bp乃至1000bpである。これにより、例えば、ランダムプライマから生じたポリヌクレオチドと共に含まれる短い又は小さいポリヌクレオチドを生成する自給エリアを提供できる。
【0138】
任意の特定の一ポリヌクレオチドの濃度は、重量で、ポリヌクレオチド合計の1%を上回ることはなく、更に好ましくは、任意の特定の一核酸配列の濃度は、重量で、核酸合計の0.1%を上回ることはない。
【0139】
混合物における種類の異なる特定のポリヌクレオチドの数は、少なくとも約100であり、好ましくは、少なくとも約500であり、更に好ましくは、少なくとも約1000である。
【0140】
このステップでは、合成又は自然発生である一本鎖又は二本鎖ポリヌクレオチドを、ポリヌクレオチドの混合物の異種性を高めるために、ランダムな二本鎖の短い又は小さいポリヌクレオチドに追加することができる。
【0141】
更に、二本鎖のランダムに切れたポリヌクレオチドの集団は、このステップにおいて、セクシャルPCRプロセスからのポリヌクレオチドと混合すること又は組み合わせることが可能であり、随意的に一回以上のセクシャルPCRサイクルを施すことができると考えられる。
【0142】
鋳型ポリヌクレオチドへの突然変異体の挿入が望ましい場合、鋳型ポリヌクレオチドとの同一性領域と、鋳型ポリヌクレオチドとの異種領域とを有する一本鎖又は二本鎖ポリヌクレオチドを、核酸合計と比較して20倍超過する重量で追加することが可能であり、更に好ましくは、一本鎖ポリヌクレオチドを、核酸合計と比較して10倍超過する重量で追加することができる。
【0143】
種類は異なるが関連する鋳型ポリヌクレオチドの混合物が望ましい場合は、鋳型のそれぞれからのポリヌクレオチドの集団を、約1:100を下回る比率で、更に好ましくは、約1:40を下回る比率で、組み合わせることができる。例えば、中立突然変異(選択されている表現型特性において、実体のない変更が生じる突然変異)を排除するために、突然変異したポリヌクレオチドの集団による野生型ポリヌクレオチドの戻し交配が必要になる場合がある。こうした例において、ランダムに提供されるセクシャルPCRサイクルのハイブリッドポリヌクレオチドに追加することが可能なランダムに提供される野生型ポリヌクレオチドの比率は、約1:1乃至約100:1であり、更に好ましくは、1:1乃至40:1である。
【0144】
ランダムなポリヌクレオチドの混合集団は、変性させて一本鎖ポリヌクレオチドを形成し、その後、再アニーリングする。他の一本鎖ポリヌクレオチドとの相同性領域を有する一本鎖ポリヌクレオチドのみを、再アニーリングすることになる。
【0145】
ランダムなポリヌクレオチドは、加熱により変性させることができる。二本鎖核酸を完全に変性させるために必要な条件は、当業者が判断できる。好ましくは、この温度は、80℃乃至100℃であり、更に好ましくは、この温度は、90℃乃至96℃である。ポリヌクレオチドを変性させるために使用できる他の方法は、圧力及びpHを含む。
【0146】
このポリヌクレオチドは、冷却により再アニーリングすることができる。好ましくは、この温度は、20℃乃至75℃であり、更に好ましくは、この温度は、40℃乃至65℃である。相同性の四連続塩基のみの平均に基づいて、高頻度の乗り換えが必要な場合は、低いアニーリング温度を使用して、組み換えを強制できるが、このプロセスは更に難しくなる。発生する再生の度合いは、一本鎖ポリヌクレオチドの集団における相同性の度合いに応じて変化する。
【0147】
再生は、ポリエチレングリコール(「PEG」)又は塩を追加することで、加速できる。塩濃度は、好ましくは、0mM乃至200mMであり、更に好ましくは、塩濃度は、10mM乃至100mMである。この塩は、KCl又はNaClにすることができる。PEGの濃度は、好ましくは0%乃至20%であり、更に好ましくは、5%乃至10%である。
【0148】
アニーリングしたポリヌクレオチドは、次に、核酸ポリメラーゼ及びdNTP(つまり、dATP、dCTP、dGTP、及びdTTP)が存在する状態で培養される。核酸ポリメラーゼは、クレノウフラグメント、Taqポリメラーゼ、或いは、この技術で知られている他の任意のDNAポリメラーゼにすることができる。
【0149】
この組み立てに使用されるアプローチは、更に乗り換えを発生させる最低限の相同性の度合いに応じて変化する。同一のエリアが大きい場合は、Taqポリメラーゼを、45乃至65℃のアニーリング温度で使用することができる。同一のエリアが小さい場合は、クレノウポリメラーゼを、20乃至30℃のアニーリング温度で使用することができる。当業者は、アニーリングの温度を変化させて、達成する乗り換えの数を増やすことができる。
【0150】
ポリメラーゼは、アニーリングの前に、アニーリングと同時に、或いはアニーリング後に、ランダムなポリヌクレオチドに追加することができる。
【0151】
変性と、再生と、ポリメラーゼが存在する状態での培養とのサイクルは、本明細書において、核酸のシャッフリング又は再構成と呼ばれる。このサイクルは、望ましい回数に渡って繰り返される。好ましくは、このサイクルは、2乃至50回繰り返され、更に好ましくは、このシーケンスは、10乃至40回繰り返される。
【0152】
結果として生じた核酸は、約50bp乃至約100kbの大きな二本鎖ポリヌクレオチドであり、好ましくは、この大きなポリヌクレオチドは、500bp乃至50kbである。
【0153】
この大きなポリヌクレオチドは、鋳型ポリヌクレオチドと同じサイズを有するポリヌクレオチドの多数のコピーを、タンデム状態で含むことができる。このコンカテマポリヌクレオチドは、その後、鋳型ポリヌクレオチドの単一のコピーへと変性させる。結果として、鋳型ポリヌクレオチドとほぼ同じサイズのポリヌクレオチドの集団が生じる。この集団は、同一のエリアと異種のエリアとを有する一本鎖又は二本鎖ポリヌクレオチドをシャッフリング前の鋳型ポリヌクレオチドに追加した混合集団となる。こうしたポリヌクレオチドは、その後、バクテリアの形質転換に使用される適切なベクタ及びライゲーション混合物でクローニングされる。
【0154】
単一のポリヌクレオチドは、コンカテマの消化によってではなく、PCRを含む様々な方法によってクローニング前に単一のポリヌクレオチドを増幅することによって、大きなコンカテマポリヌクレオチドから取得できると考えられる(米国特許第4,683,195号及び第4,683,202号)。
【0155】
クローニングに使用されるベクタは、望ましいサイズのポリヌクレオチドを受け入れるのであれば、決定的な要素にはならない。特定のポリヌクレオチドの発現が望ましい場合、このクローニング用運搬体は、ポリヌクレオチドの挿入部位の隣に転写及び翻訳信号を更に含み、宿主細胞におけるポリヌクレオチドの発現を可能にする。
【0156】
結果として生じたバクテリア集団は、ランダムな突然変異を有する多数の組み換えポリヌクレオチドを含む。この混合集団は、望ましい組み換えポリヌクレオチドを同定するためにテストできる。選択の方法は、望ましいポリヌクレオチドに応じて変化する。
【0157】
例えば、本明細書で説明した方法により同定したポリヌクレオチドが第一の結合親和性を有するタンパク質を符号化する場合、後に突然変異させた(例えば、シャッフリングした)配列は、リガンドに対する結合効率が増加していることが望ましい。こうしたケースにおいて、集団又はライブラリ内のポリヌクレオチドのそれぞれの部分によって発現したタンパク質は、この技術で知られている方法(パニング、アフィニティクロマトグラフィ等)により、リガンドと結合する能力についてテストすることができる。薬物耐性が増加したタンパク質を符号化するポリヌクレオチドが望ましい場合、集団又はライブラリ内のポリヌクレオチドのそれぞれの部分によって発現したタンパク質は、宿主有機体に薬物耐性を与える能力についてテストすることができる。当業者は、望ましいタンパク質の知識を与えられた場合、タンパク質に望ましい特性を与えるポリヌクレオチドを同定するために集団を容易にテストすることができる。
【0158】
当業者は、タンパク質の断片をファージ表面の融合タンパク質として発現させるファージディスプレイシステムを使用することができると考えられる(ウィスコンシン州ミルウォーキのPharmacia)。組み換えDNA分子は、ファージDNAにおいて、融合タンパク質の転写が生じる部位でクローニングされ、融合タンパク質の一部は、組み換えDNA分子によって符号化される。組み換え核酸分子を含むファージは、細胞内で複製及び転写される。融合タンパク質のリーダ配列は、ファージ粒子の先端への融合タンパク質の運搬を命令する。したがって、組み換えDNA分子によって部分的に符号化された融合タンパク質は、上で説明した方法による検出及び選択のために、ファージ粒子上でディスプレイされる。
【0159】
更に、第一の集団の小集団からのポリペプチドにより、多数のサイクルの核酸シャッフリングを実行できると考えられ、この小集団は、望ましい組み換えタンパク質を符号化するDNAを含む。これにより、更に高い結合親和性又は酵素活性を有するタンパク質を達成することができる。
【0160】
更に、小集団からの任意のサイレント突然変異を除去するために、野生型ポリヌクレオチドと、核酸シャッフリングの第一又はその後のラウンドからの核酸の小集団との混合物により、多数のサイクルの核酸シャッフリングを実行できると考えられる。
【0161】
精製形態である核酸の任意のソースを、開始する核酸として利用できる。したがって、このプロセスは、メッセンジャRNAを含むDNA又はRNAを利用することが可能であり、このDNA又はDNAは一本鎖又は二本鎖にすることができる。加えて、それぞれの一本鎖を含むDNA−RNAハイブリッドを利用することができる。核酸配列は、突然変異させる核酸配列のサイズに応じて、様々な長さにすることができる。好ましくは、特定の核酸配列は、50乃至50,000塩基対である。所定のタンパク質を符号化する核酸を含むベクタ全体を、本発明の方法で使用できると考えられる。
【0162】
任意の特定の核酸配列を使用して、本プロセスによってハイブリッドの集団を生成することができる。必要となるのは、存在している或いは本プロセスで利用可能な、特定の核酸配列のハイブリッド配列の小さな集団のみである。
【0163】
突然変異を有する特定の核酸配列の集団は、多数の種類の方法によって形成することができる。突然変異は、エラープローンPCRによって形成することができる。エラープローンPCRは、低忠実度の重合条件を使用して、長い配列全体で低レベルの点突然変異をランダムに導入する。代わりに、突然変異は、オリゴヌクレオチド指定突然変異生成によって、鋳型ポリヌクレオチドに導入することができる。オリゴヌクレオチド指定突然変異生成では、ポリヌクレオチドの短い配列を、制限酵素消化を使用してポリヌクレオチドから除去し、様々な塩基をオリジナルの配列から変化させた合成ポリヌクレオチドに置き換える。このポリヌクレオチド配列は、化学的突然変異生成によって変更することもできる。化学的突然変異原は、例えば、亜硫酸水素ナトリウム、亜硝酸、ヒドロキシルアミン、ヒドラジン、又は蟻酸を含む。ヌクレオチド前駆体の類似体であるその他の作用因子は、ニトロソグアニジン、5−ブロモウラシル、2−アミノプリン、又はアクリジンを含む。一般に、こうした作用因子は、ヌクレオチド前駆体の位置でPCR反応に追加し、これにより、配列を突然変異させる。プロフラビン、アクリフラビン、キナクリン、及びその他といった挿入剤を使用することもできる。ポリヌクレオチド配列のランダムな突然変異生成は、X線又は紫外線の照射によって達成することもできる。一般に、このように突然変異生成したプラスミドのポリヌクレオチドは、E.coliに導入し、ハイブリッドプラスミドのプール又はライブラリとして増殖させる。
【0164】
代わりに、特定の核酸の小さな混合集団は、同じ遺伝子の様々な対立遺伝子、或いは様々な関連する種からの同じ遺伝子(つまり同族遺伝子)で構成される点において、自然状態で発見することができる。代わりに、これらは、例えば、免疫グロブリン遺伝子といった一つの種の中で発見される関連DNA配列にすることができる。
【0165】
特定の核酸配列の混合集団が生成された後、ポリヌクレオチドは、この技術で広く知られる手法を利用して、直接使用すること、或いは、適切なクローニングベクタに挿入することが可能である。
【0166】
ベクタの選択は、本発明の方法において利用するポリヌクレオチド配列及び宿主細胞のサイズに応じて変化する。本発明の鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルス、及びその他)、又はその選択部分(例えば、コートタンパク質、スパイク糖タンパク質、カプシドタンパク質)にすることができる。例えば、コスミド及びファージミドは、突然変異させる特定の核酸配列が大きい場合に好適であり、これは、こうしたベクタが大きなポリヌクレオチドを安定して増殖させることができるためである。
【0167】
特定の核酸配列の混合集団は、ベクタでクローニングする場合には、クローン的に増幅することができる。有用性は、発現ポリペプチドをスクリーニングすることで容易に判断できる。
【0168】
本発明のDNAシャッフリング法は、未知の配列のプールで盲目的に実行することができる。(再構成する配列と相同の末端を有する)再構成混合物のオリゴヌクレオチドに追加することで、任意の配列混合物を、任意の特定の位置で、別の配列混合物に組み込むことができる。したがって、合成オリゴヌクレオチド、PCRポリヌクレオチド、或いは更に、完全な遺伝子の混合物を、別の配列ライブラリに、定義した位置で混合することができる。一つの配列(混合物)の挿入は、鋳型の別の部分における配列の挿入から独立している。したがって、組み換えの度合いと、必要な相同性と、ライブラリの多様性とは、再構成されるDNAの長さと共に、独立して同時に変化させることができる。
【0169】
シャッフリングでは、多様性の領域を分離する相同性領域の存在が必要となる。足場状タンパク質構造は、シャッフリングに特に適している場合がある。保全された足場は、自己会合により全体的な折り畳みを決定し、同時に、特定の結合を仲介する比較的制限のないループを示す。こうした足場の例は、この技術で広く知られている免疫グロブリンβ−バレル及び四本ヘリックスバンドルである。このシャッフリングは、突然変異させた配列の様々な組み合わせでの結合により、足場状タンパク質を作成するために使用できる。
【0170】
一部の標準的な遺伝交配と同等のものを、in vitroでのシャッフリングにより実行することもできる。例えば、「分子的戻し交配」は、所定の突然変異を選択する間に、ハイブリッドの核酸を野生型の核酸に繰り返し混合することで実行できる。従来の品種改良と同様に、このアプローチは、様々なソースからの表現型を選択した背景に組み合わせるために使用することができる。これは、例えば、選択していない特徴(免疫原性等)に影響する中立突然変異の除去にとって有用である。したがって、これは、強化された生物学的活性に、タンパク質内のどの突然変異が関与しており、どれが関与していないかを判断するのに有用である場合があり、この利点はエラープローン突然変異生成又はカセット式突然変異生成法では達成できないものである。
【0171】
大きな機能遺伝子は、小さくランダムなポリヌクレオチドの混合物から、正確に組み立てることができる。この反応は、極めて断片化した化石のDNAからの遺伝子の再構成に使用することができる。加えて、化石からのランダムな核酸配列は、関連する種の類似遺伝子からのポリヌクレオチドに組み合わせることができる。
【0172】
更に、本発明の方法は、様々な研究及び診断用途で必要とされるような、単一の細胞からの完全なゲノムのin vitro増幅に使用することができると考えられる。PCRによるDNA増幅は、通常、約40kbの配列を含む。PCRによるE.coli(5,000kb)等の完全なゲノムの増幅では、125の40kbポリヌクレオチドを発生させる約250のプライマが必要となる。一方、セクシャルPCRサイクルによるゲノムのポリヌクレオチドのランダム生産と、これに続く小さなポリヌクレオチドのゲル精製とでは、可能性のある多数のプライマが提供される。このランダムな小さいポリヌクレオチドの混合物を、PCR反応におけるプライマとして、単独で、或いは、鋳型として完全なゲノムと共に、使用した場合には、ゲノムの多くのコピーを含む単一のコンカテマを理論上の終点とする逆連鎖反応が生じる。
【0173】
ランダムなヌクレオチドのみを使用した時には、コピー数の100倍の増幅と、50kbを上回る平均ポリヌクレオチドのサイズとが得られる。大きなコンカテマは、多くの小さなポリヌクレオチドの重複によって生成されると考えられる。合成プライマを使用して得られる特定のPCR産物の品質は、未増幅DNAから得られる産物と区別できない。このアプローチは、ゲノムのマッピングに有用であると予想される。
【0174】
シャッフリングされるポリヌクレオチドは、実施者の判断により、ランダム又は非ランダムなポリヌクレオチドとして生成することができる。更に、本発明は、広範なポリヌクレオチドのサイズ及びタイプに適用可能なシャッフリングの方法を提供し、これには、大きなポリヌクレオチドの再構成において基礎単位として使用されるポリヌクレオチドモノマを生成するステップが含まれる。例えば、この基礎単位は、遺伝子の断片にすることが可能であり、或いは、遺伝子全体又は遺伝子経路、又はその任意の組み合わせを含むことができる。
【0175】
in vivoシャッフリングの実施形態において、特定の核酸配列の混合集団は、少なくとも二種類の核酸配列が各宿主細胞に存在するような条件下で、バクテリア細胞又は真核細胞に導入される。このポリヌクレオチドは、様々な方法で宿主細胞に導入することができる。宿主細胞は、例えば、塩化カルシウムによる処理等、この技術で知られている方法を使用して、小さなポリヌクレオチドにより形質転換することができる。ポリヌクレオチドがファージゲノムに挿入される場合、宿主細胞は、特定の核酸配列を有する組み換えファージゲノムによりトランスフェクションすることができる。代わりに、この核酸配列は、エレクトロポレーション、トランスフェクション、リポフェクション、バイオリスティクス、接合、及びその他を使用して、宿主細胞に導入することができる。
【0176】
一般に、この実施形態において、特定の核酸配列は、この配列を宿主細胞内で安定して複製できるベクタ内に存在することになる。加えて、ベクタは、ベクタを有する宿主細胞を選択できるように、マーカ遺伝子を符号化することになると考えられる。これにより、突然変異させた特定の核酸配列を、宿主細胞への導入後に回収できる状態が確保される。しかしながら、特定の核酸配列の混合集団全体が、ベクタ配列上に存在する必要はないと考えられる。むしろ、宿主細胞へのポリヌクレオチドの導入後、各宿主細胞が、内部に少なくとも一つの特定の核酸配列が存在する一つのベクタを含む状態を確保するために、ベクタでクローニングする必要があるのは、十分な数の配列のみである。更に、特定の核酸配列の集団のサブセットをベクタでクローニングするのではなく、このサブセットが、既に宿主細胞に安定して統合されている可能性があると考えられる。
【0177】
同一性領域を有する二つのポリヌクレオチドが宿主細胞に挿入される時、二つのポリヌクレオチド間で相同的組み換えが発生することが分かっている。突然変異させた二つの特定の核酸配列間でのこうした組み換えにより、一部の状況では、二重又は三重ハイブリッドの生成が生じることになる。
【0178】
更に、突然変異させた特定の核酸配列の一部が線状核酸分子上に存在する場合、組み換えの頻度が増加することが分かっている。そのため、一実施形態において、特定の核酸配列の一部は、線状ポリヌクレオチド上に存在する。
【0179】
形質変換後、宿主細胞の形質転換体は、望ましい品質を有する突然変異させた特定の核酸配列を含む宿主細胞の形質転換体を同定するために、選択の対象とされる。例えば、特定の薬物に対する耐性の増加が望ましい場合、形質転換された宿主細胞には、濃度を高めた特定の薬物の影響を与えることが可能であり、増加した薬物耐性を与えることができる突然変異タンパク質を生成した形質変換体が選択されることになる。特定のタンパク質がレセプタと結合する能力を高めることが望ましい場合、形質転換体からタンパク質の発現を誘導することが可能であり、結果として生じたタンパク質を、この技術で知られている方法によって、リガンド結合検定において評価し、リガンドに対する結合の強化を示す突然変異集団のサブセットを同定する。代わりに、タンパク質を別のシステムで発現させ、適切な処理を確保することができる。
【0180】
望ましい特徴を有する第一の組み換え済みの特定の核酸配列のサブセット(娘配列)は、同定された後、第二のラウンドの組み換えを受ける。組み換えの第二のサイクルでは、組み換え済みの特定の核酸配列は、オリジナルである突然変異させた特定の核酸配列(親配列)と混合することが可能であり、このサイクルは、上で説明したように繰り返される。この方法では、強化された特徴を有する、或いは強化された特徴を有するプロテインを符号化する、第二の組み換え済みの特定の核酸配列のセットを同定することができる。このサイクルは、望ましい回数に渡って繰り返すことができる。
【0181】
更に、第二の又はその後の組み換えサイクルにおいて、戻し交配を実行させることができると考えられる。分子的戻し交配は、少なくとも一つの野生型核酸配列と突然変異させた核酸配列とが形質変換後の同じ宿主細胞に存在するように、望ましい特定の核酸配列を多数の野生型配列と混合することで実行できる。野生型の特定の核酸配列との組み換えにより、免疫原性等の選択していない特徴に影響するが、選択した特徴に影響しない可能性がある中立突然変異が除去されることになる。
【0182】
本発明の別の実施形態においては、宿主細胞への導入前にPCR増幅を緩慢化又は停止することで、第一のラウンド中に、特定の核酸配列のサブセットを、小さなポリヌクレオチドとして生成することができると考えられる。ポリヌクレオチドのサイズは、他の配列と相同的に組み換えできるように、他の配列とのいくつかの同一性領域を含むのに十分な大きさでなければならない。ポリヌクレオチドのサイズは、0.03kb乃至100kbの範囲となり、更に好ましくは、0.2kb乃至10kbとなる。更に、後に続くラウンドにおいて、以前のラウンドから選択された配列以外の特定の核酸配列のすべては、宿主細胞に導入する前にPCRポリヌクレオチドを生成するために利用することができる。
【0183】
短いポリヌクレオチド配列は、一本鎖又は二本鎖にすることができる。核酸の鎖を分離するのに適した反応条件は、この技術で広く知られている。
【0184】
このプロセスのステップは、無制限に繰り返すことが可能であり、達成できる可能性があるハイブリッドの数によってのみ制限される。
【0185】
そのため、突然変異させた鋳型核酸の最初のプール又は集団は、E.coli等、バクテリア内での複製が可能なベクタでクローニングされる。E.coliでの自律複製が可能である限り、特定のベクタが不可欠になることはない。一実施形態において、このベクタは、ベクタと結びつく突然変異させた特定の核酸によって符号化される任意のタンパク質の発現及び生成を可能にするように設計される。更に、好ましくは、このベクタは、選択可能なマーカを符号化する遺伝子を含む。
【0186】
突然変異させた核酸配列のプールを含むベクタの集団は、E.coli宿主細胞に導入される。ベクタの核酸配列は、形質転換、トランスフェクション、或いはファージの場合の感染によって導入することができる。バクテリアを形質転換するのに使用されるベクタの濃度は、多数のベクタが各細胞に導入されるようなものにする。細胞内に入った後、相同的組み換えの効率は、相同的組み換えが様々なベクタ間で発生するようなものにする。この結果、オリジナルの親突然変異配列とは異なる突然変異の組み合わせを有するハイブリッド(娘)が生成される。宿主細胞は、その後、ベクタに存在するマーカ遺伝子に関して、クローン的に複製され、選択される。プラスミドを有する細胞のみが、選択の対象として成長することになる。ベクタを含む宿主細胞は、その後、好ましい突然変異の存在に関してテストされる。
【0187】
望ましい特徴を与える特定の娘突然変異核酸が同定された後、この核酸は、既にベクタと結びついた状態或いはベクタから離れた状態のいずれかで、分離される。この核酸は、その後、第一の又は親である核酸の集団と混合され、このサイクルが繰り返される。
【0188】
親である突然変異させた特定の核酸の集団は、ポリヌクレオチドとして、或いは同じベクタでクローニングされ、既に娘核酸を含む宿主細胞に導入される。細胞内では組み換えの発生が可能となり、次世代の組み換え体、又は孫娘が、上で説明した方法によって選択される。このサイクルは、望ましい特徴を有する核酸又はペプチドが得られるまで、何度も繰り返すことができる。その後のサイクルにおいて、ハイブリッドに追加する突然変異させた配列の集団は、親ハイブリッド又は任意の配列世代に由来するものでよい。
【0189】
代替の実施形態において、本発明は、任意の中立突然変異を排除するために、取得された組み換え済みの特定の核酸の「分子的」戻し交配を実施する方法を提供する。中立突然変異は、核酸又はペプチドに望ましい特性を与えない突然変異である。しかしながら、こうした突然変異は、核酸又はペプチドに望ましくない特徴を与える。したがって、こうした中立突然変異を排除することが望ましい。本発明の方法は、これを行う手段を提供する。
【0190】
この実施形態においては、実施形態の方法によって、望ましい特徴を有するハイブリッド核酸が取得された後で、核酸、核酸を有するベクタ、或いは、ベクタ及び核酸を含む宿主細胞が、分離される。
【0191】
この核酸又はベクタは、その後、野生型核酸が大幅に超過した宿主細胞に導入される。ハイブリッドの核酸と、野生型配列の核酸とは、組み換えが可能となる。結果として生じた組み換え体は、ハイブリッド核酸と同様に選択の対象となる。望ましい特徴を保持している組み換え体のみが、選択されることになる。望ましい特徴を提供しない任意のサイレント突然変異は、野生型DNAとの組み換えを通じて失われることになる。このサイクルは、すべてのサイレント突然変異が排除されるまで、何度も繰り返すことができる。
【0192】
別の実施形態において、本発明は、子孫ポリヌクレオチド(例えば、発現させてポリペプチド又は遺伝子経路を生成できるキメラ子孫ヌクレオチド)を形成するために、少なくとも二つのポリヌクレオチドを、シャッフリング、組み立て、再構成、組み換え、及び又は鎖状化する方法を提供する。特定の実施形態において、二本鎖ポリヌクレオチド(例えば、ハイブリッド形成のパートナとして、互いにハイブリッド形成した二本の一本鎖配列)を、エクソヌクレアーゼにより処理し、二本の鎖の一方からヌクレオチドを遊離させ、残りの鎖をオリジナルのパートナから離れた状態にし、望ましい場合には、残りの鎖を使用して、別のパートナとのハイブリッド形成を達成できるようにする。
【0193】
特定の態様において、(ポリヌクレオチド又は非ポリヌクレオチド配列の一部にすること、或いは、これに結合させることが可能な)二本鎖ポリヌクレオチド末端は、エクソヌクレアーゼ活性のソースにより影響を受ける。3’エクソヌクレアーゼ活性を有する酵素と、5’エクソヌクレアーゼ活性を有する酵素と、3’エクソヌクレアーゼ活性及び5’エクソヌクレアーゼ活性の両方を有する酵素と、その任意の組み合わせとを、本発明において使用することができる。エクソヌクレアーゼは、線状二本鎖ポリヌクレオチドの一方又は両方の末端から、或いは三つ以上の末端を有する分岐ポリヌクレオチドの一つ乃至全部の末端から、ヌクレオチドを遊離させるのに使用することができる。
【0194】
対照的に、非酵素的ステップを使用して、ポリヌクレオチド基礎単位のシャッフリング、組み立て、再構成、組み換え、及び又は鎖状化を行うことが可能であり、これは、作業中の二本鎖ポリヌクレオチドのセットを溶解して単一のポリヌクレオチド鎖にできるように、(例えば、温度、pH、及び又は塩度条件を変化させることで)作業中の試料に変性(又は「溶解」)条件を与えることを含む。シャッフリングに関しては、単一のポリヌクレオチド鎖を、異なるハイブリッド形成パートナとのアニーリングに、ある程度まで関与させることが望ましい(つまり、単に、変性ステップ前の元のパートナとの間の排他的な再アニーリングに戻すのではない)。しかしながら、反応槽に元のハイブリッド形成パートナが存在するため、一本鎖ポリヌクレオチドと元のパートナとの再アニーリングによるオリジナルの二本鎖ヌクレオチドの再形成は不可能にならず、場合によっては、これに有利に働くこともある。
【0195】
二本鎖ポリペプチド基礎単位に変性を施し、その後アニーリングすることを含む非酵素的シャッフリングステップとは対照的に、本発明は、更に、エクソヌクレアーゼに基づくアプローチを提供し、これは変性を必要とせず、逆に、変性条件を回避し、二本鎖ポリヌクレオチド基質をアニーリング(つまり、非変性)条件で維持することが、エクソヌクレアーゼ(例えば、エクソヌクレアーゼIII及びレッドアルファ遺伝子産物)の活動にとっての必要条件となる。更に対照的に、他の一本鎖ポリヌクレオチド配列とのハイブリッド形成が可能な一本鎖ポリヌクレオチド配列の生成は、ハイブリッド形成パートナの一つにおける、共有開裂、及びこれによる配列の破壊の結果である。例えば、エクソヌクレアーゼIII酵素は、一つのハイブリッド形成鎖の3’末端ヌクレオチドを酵素的に遊離させる(そのポリヌクレオチド鎖において共有加水分解を達成する)ために使用可能であり、これは、残りの一本鎖が新しいパートナとハイブリッド形成するのを助ける(元のパートナが共有開裂を施されたため)。
【0196】
特に理解される点として、より最適な速度、及び又はより高い特異活性、及び又はより少ない不必要な活性を有する酵素を、直前に開示したアプローチのために特別に発見すること、最適化すること(例えば、定方向進化により作成)、又は発見と最適化との両方を行うことができる。実際に、本発明は、こうしたデザイナ酵素の発見及び又は開発を促進する場合があると予想される。
【0197】
更に、理解される点として、必要に応じて、二本鎖ポリヌクレオチドの末端を保護すること、或いは、エクソヌクレアーゼの望ましい酵素活動の影響を受けやすくすることが可能である。例えば、3’オーバハングを有する二本鎖ポリヌクレオチド末端は、エクソヌクレアーゼIIIのエクソヌクレアーゼ活動の影響を受けない。しかしながら、様々な手段により、エクソヌクレアーゼIIIのエクソヌクレアーゼ活動の影響を受けやすくすることが可能であり、例えば、ポリメラーゼによる処理で平滑化すること、開裂させ平滑末端又は5’オーバハングを提供すること、別の二本鎖ポリヌクレオチドに結び付け(連結又はハイブリッド形成させ)平滑末端又は5’オーバハングを提供すること、一本鎖ポリヌクレオチドとハイブリッド形成させ平滑末端又は5’オーバハングを提供すること、或いは、様々な手段のいずれかによって修飾することが可能である。
【0198】
一態様によれば、エクソヌクレアーゼは、線状二本鎖ポリヌクレオチドの一方又は両方の末端に作用することが可能で、完了、完了近く、又は部分的な完了へと進むことができる。エクソヌクレアーゼ活動が完了へと進むことができる時、その結果として、各5’オーバハングの長さは、ポリヌクレオチドの中央領域に向かって、「ランデブーポイント」(ポリヌクレオチドの中央点近くのどこかになる場合がある)と考えられるものの方向へ、長く延びることになる。最終的には、これにより、それぞれオリジナルの二本鎖ポリヌクレオチドの約半分の長さの(分離することが可能な)一本鎖ポリヌクレオチドが生成される。
【0199】
したがって、エクソヌクレアーゼが仲介するアプローチは、ポリヌクレオチド基礎単位のシャッフリングと、組み立て及び又は再構成と、組み換えと、鎖状化とを行うのに有用である。このポリヌクレオチド基礎単位は、長さ十塩基まで、又は長さ数十塩基、又は長さ数百塩基、又は長さ数千塩基、又は長さ数万塩基、又は長さ数十万塩基、又は長さ数百万塩基、又は更に長いものにすることができる。
【0200】
エクソヌクレアーゼの基質は、二本鎖ポリヌクレアーゼに断片化を施すことで生成できる。断片化は、機械的手段(例えば、剪断、音波処理、及びその他)と、酵素的手段(例えば、制限酵素の使用)と、その任意の組み合わせとによって達成できる。大きなポリヌクレオチドの断片は、ポリメラーゼ仲介合成によって生成することもできる。
【0201】
エクソヌクレアーゼ活性を有する酵素の追加的な例は、レッドアルファ及びヘビ毒ホスホジエステラーゼを含む。レッドアルファ(redα)遺伝子産物(λ−エクソヌクレアーゼとも呼ばれる)は、バクテリオファージλ起源である。レッドアルファ遺伝子産物は、5’−リン酸末端から前進的に作用し、二重螺旋DNAからモノヌクレオチドを遊離させる(タカハシ及びコバヤシ,1990)。ヘビ毒ホスホジエステラーゼ(ラスコースキ,1980)は、スーパーコイルDNAを急速に開くことができる。
【0202】
一態様において、本発明は、合成ライゲーション再構成(SLR)と呼ばれる非確率的方法を提供し、これは、確率的なシャッフリングに幾分関連するが、ただし、核酸基礎単位をランダムにシャッフリング、又は鎖状化、又はキメラ化するのではなく、非確率的に組み立てる
SLR法は、シャッフリングするポリヌクレオチド間における高レベルの相同性の存在に依存しない。本発明は、10100種類を超えるキメラを含む子孫分子のライブラリ(又はセット)を非確率的に生成するために使用することができる。おそらく、SLRは、101000種類を超える子孫キメラを含むライブラリを生成するために使用することさえ可能である。
【0203】
したがって、一態様において、本発明は、計画的に選択した全体的な組み立て順序を有する完成済みキメラ核酸分子のセットを生成する非確率的方法を提供し、この方法は、実用的で相互互換性があり連結可能な末端を有する複数の特定の核酸基礎単位を、計画的に生成することと、計画した全体的な組み立て順序が達成されるように、こうした核酸基礎単位を組み立てることとを含む。
【0204】
組み立てる核酸基礎単位の相互互換性がある連結可能な末端は、基礎単位を事前に定められた順序で結合させることができる場合に、このタイプの順序のある組み立てにとって「実用的」であるとされる。したがって、一態様において、核酸基礎単位を結合させることができる全体的な組み立て順序は、連結可能な末端の設計によって指定され、二つ以上の組み立てステップが使用される場合には、核酸基礎単位を結合させることができる全体的な組み立て順序は、更に、(複数の)組み立てステップの連続した順序によって指定される。本発明の一実施形態において、アニーリングされた基礎単位は、基礎単位の共有結合を達成するために、リガーゼ(例えば、T4 DNAリガーゼ)等の酵素によって処理される。
【0205】
別の実施形態において、核酸基礎単位の設計は、完成したキメラ核酸分子の子孫セットを生成する基盤の役割を果たす前駆核酸鋳型のセットの配列を分析することで取得される。したがって、こうした前駆核酸鋳型は、突然変異生成、つまりキメラ化又はシャッフリングされる核酸基礎単位の設計を支援する配列情報のソースとしての役割を果たす。
【0206】
一例証形態において、本発明は、関連する遺伝子のファミリと、関連する遺伝子の符号化ファミリとのキメラ化を提供する。特定の例証形態において、符号化された産物は、酵素である。本発明の態様による突然変異生成が可能な酵素のファミリの代表的なリストとして、挙げることが可能な酵素及びその機能は、リパーゼ/エステラーゼと、プロテアーゼと、グリコシダーゼ/グリコシルと、トランスフェラーゼと、ホスファターゼ/キナーゼと、モノ/ジオキシゲナーゼと、ハロペルオキシダーゼと、リグニンと、ペロキシダーゼ/ジアリルプロパンペロキシダーゼと、エポキシドヒドロラーゼと、ニトリルヒドラターゼ/ニトリラーゼと、トランスアミナーゼ、アミダーゼ/アシラーゼとである。こうした例証形態は、本発明の一部の特定の態様を例示するが、制限を表現すること、或いは開示する発明の範囲を制限することはない。
【0207】
したがって、本発明の一態様によれば、本発明の方法を使用して同定される複数の前駆核酸鋳型の配列は、一つ以上の境界点を選択するために整列させ、この境界点は、相同エリアに配置することが可能である。境界点は、生成する核酸基礎単位の境界を描くために使用することができる。したがって、前駆分子において同定及び選択される境界点は、子孫分子の組み立てにおいて、潜在的なキメラ化点としての役割を果たす。
【0208】
通常、境界点は、少なくとも二つの前駆鋳型が共有する相同エリア(少なくとも一つの相同ヌクレオチド塩基を含む)であるが、この境界点は、少なくとも半分の前駆鋳型と、少なくとも三分の二の前駆鋳型と、少なくとも四分の三の前駆鋳型と、好ましくは、ほとんどすべての前駆鋳型とが共有する相同エリアにすることができる。更に好ましくは、境界点は、すべての前駆鋳型が共有する相同エリアである。
【0209】
別の実施形態においては、網羅的なライブラリを生成するために、ライゲーション再構成プロセスが網羅的に実行される。言い換えると、核酸基礎単位の可能なすべての順序の組み合わせが、完成済みキメラ核酸分子のセット内で表現される。同時に、各組み合わせにおける組み立て順序(つまり、各完成済みキメラ核酸の5’乃至3配列における各基礎単位の組立の順序)は、計画的(又は非確率的)なものである。本発明の非確率的な性質から、不必要な副産物の可能性は、大幅に減少する。
【0210】
更に別の実施形態において、本発明では、ライゲーション再構成プロセスが、例えば、体系的にコンパートメント化されたライブラリを生成するために、体系的に実行され、このコンパートメントは、例えば、一つずつ等、体系的にスクリーニングできる。言い換えると、本発明では、特定の核酸基礎単位の選択的かつ賢明な使用を、連続した段階的な組み立て反応の選択的かつ賢明な使用と組み合わせ、子孫産物の特定のセットがいくつかの反応槽のそれぞれで作成される実験計画を達成できる。これにより、体系的な調査及びスクリーニング手順を実行することが可能となる。したがって、小さなグループ内で潜在的に非常に多数の子孫分子を体系的に調査することが可能となる。
【0211】
特に前駆分子間の相同性が低レベルである時、非常に柔軟でありながら網羅的で体系的でもある方法でキメラ化を実行する能力により、本発明は、多数の子孫分子を含むライブラリ(又はセット)の生成を提供する。このライゲーション再構成の発明の非確率的な性質から、生成される子孫分子は、好ましくは、計画的に選択された全体的な組み立て順序を有する完成済みキメラ核酸分子のライブラリの一部となる。特定の実施形態において、こうした生成済みライブラリは、10種類超乃至101000種類超の子孫分子種を含む。
【0212】
一態様において、説明にしたがって生成された完成済みキメラ核酸分子のセットは、ポリペプチドを符号化するポリヌクレオチドを含む。一実施形態によれば、このポリヌクレオチドは、遺伝子であり、これは人工遺伝子にすることができる。別の実施形態によれば、このポリヌクレオチドは、遺伝子経路であり、これは人工遺伝子経路にすることができる。本発明では、本発明によって生成された一つ以上の人工遺伝子を、例えば、真核有機体(植物を含む)において機能する経路等の人工遺伝子経路に組み込むことが可能である。
【0213】
別の例証形態において、基礎単位が生成されることの合成的な性質から、in vitroプロセスにおいて(例えば、突然変異生成によって)、或いはin vivoプロセスにおいて(例えば、宿主有機体の遺伝子スプライシング能力を利用して)、後で随意的に除去できるヌクレオチド(例えば、一つ以上のヌクレオチドで、コドン又はイントロン或いは調節配列等にすることができる)の設計及び導入が可能となる。多くの場合、こうしたヌクレオチドの導入は、境界点を形成する潜在的な利点に加え、他の多くの理由から望ましい場合もあると理解される。
【0214】
したがって、別の実施形態によれば、本発明では、核酸基礎単位を使用して、イントロンを導入することができる。したがって、本発明では、機能イントロンを、本発明の人工遺伝子に導入することができる。本発明では、更に、機能イントロンを、本発明の人工遺伝子経路に導入することができる。したがって、本発明は、一つの(又は複数の)人為的に導入した(複数の)イントロンを含む人工遺伝子であるキメラポリヌクレオチドの生成を提供する。
【0215】
したがって、本発明は、更に、一つの(又はそれ以上の)人為的に導入した(複数の)イントロンを含む人工遺伝子経路であるキメラポリヌクレオチドの生成を提供する。好ましくは、人為的に導入した(複数の)イントロンは、自然発生イントロンが遺伝子スプライシングにおいて機能を果たすのと同様の形で、一つ以上の宿主細胞において、遺伝子スプライシングに関して機能することができる。本発明は、組み換え及び又はスプライシングのために宿主有機体に導入する人工イントロン含有ポリヌクレオチドを生成するプロセスを提供する。
【0216】
本発明を使用して生成した人工遺伝子は、別の核酸による組み換えの基質としての役割を果たすこともできる。同様に、本発明を使用して生成した人工遺伝子経路は、更に、別の核酸による組み換えの基質としての役割を果たすこともできる。好適な事例において、この組み換えは、遺伝子を含む人工イントロンと組み換えパートナの役割を果たす核酸との間の相同エリアによって促進され、このエリアで発生する。特定の好適な事例において、この組み換えパートナは、本発明によって生成された核酸にすることが可能であり、これは人工遺伝子又は人工遺伝子経路を含む。組み換えは、人工遺伝子内の一つの(又はそれ以上の)人為的に導入された(複数の)イントロンに存在する相同エリアによって促進される場合があり、このエリアで発生する場合がある。
【0217】
本発明の合成ライゲーション再構成法は、複数の核酸基礎単位を利用し、そのそれぞれは、好ましくは、二つの連結可能末端を有する。各核酸基礎単位の二つの連結可能末端は、二つの平滑末端(つまり、それぞれがヌクレオチドのオーバハングを有しない)、又は、好ましくは、一つの平滑末端及び一つのオーバハング、又は、更に好ましくは、二つのオーバハングにすることができる。
【0218】
この目的でのオーバハングは、3’オーバハング又は5’オーバハングにすることができる。したがって、核酸基礎単位は、3’オーバハング、又は代わりに5’オーバハング、又は代わりに二つの3’オーバハング、又は代わりに二つの5’オーバハングを有することができる。完成済みキメラ核酸分子を形成するために核酸基礎単位が組み立てられる全体的順序は、ランダムではなく、目的のある実験計画によって決定される。
【0219】
好適な一実施形態によれば、核酸基礎単位は、二つの一本鎖核酸(一本鎖オリゴとも呼ばれる)の化学合成と、これらをアニーリングして二本鎖核酸基礎単位を形成できるように接触させるステップとによって生成される。
【0220】
二本鎖核酸基礎単位は、様々なサイズにすることができる。こうした基礎単位のサイズは、小さく又は大きくすることができる。基礎単位に好適なサイズは、1塩基対(任意のオーバハングを含まない)乃至100,000塩基対(任意のオーバハングを含まない)の範囲である。その他の好適なサイズ範囲も提供され、これは1bp乃至10,000bp(間の整数値をすべて含む)の下限値と、2bp乃至100,000bp(間の整数値をすべて含む)の上限値とを有する。
【0221】
図6は、酵素エクソヌクレアーゼIIIの活性を示している。これは、ポリヌクレオチド基礎単位のシャッフリング、組み立て、再構成、組み換え、及び又は鎖状化に使用できる例示的な酵素である。アスタリスクは、酵素がポリヌクレオチド基質の3’方向から5’方向に向かって作用することを示している。図7は、エクソヌクレアーゼ仲介ポリヌクレオチド再構成における酵素エクソヌクレアーゼIIIの例示的な応用を示している。更に、適切な宿主(エシェリキア、シュードモナス、ストレプトミセス、又はバシラス)を形質転換することと、発現スクリーニングで分析可能なクローン突然変異生成子孫核酸(及び好ましくは、こうした核酸によって発現されるポリペプチド)のライブラリを生成して更なる多様性を提供するために宿主の修復メカニズムを利用することとによるin vivo「修復」の併用を示している。
【0222】
図8は、多結合核酸鎖の生成を示している。このケースにおいて、生成された鎖は、親の鋳型と同じ長さだが、メチル化されていない。したがって、Dpn I処理を使用して、生成された鎖を選択することができる。表示されていないが、鋳型と生成産物とは、ベクタ(線状又は環状)の一部にすることができる。図9は、ヘテロメリック核酸複合体において、アニーリングした核酸鎖の未ハイブリッド形成一本鎖末端から、3’及び5’末端ヌクレオチドを遊離させ、短縮されているがハイブリッド形成された末端を残し、処理済み末端のポリメラーゼ系伸長及び又はリガーゼ仲介ライゲーションを促進する手段としてのエクソヌクレアーゼ処理の使用を示している。更に、適切な宿主(エシェリキア、シュードモナス、ストレプトミセス、又はバシラス)を形質転換することと、発現スクリーニングで分析可能なクローン突然変異生成子孫核酸(及び好ましくは、こうした核酸によって発現されるポリペプチド)のライブラリを生成して更なる多様性を提供するために宿主の修復メカニズムを利用することとによるin vivo「修復」の併用を示している。
【0223】
図10は、一本のメチル化多結合核酸鎖をアニーリングし、いくつかの非メチル化単結合核酸鎖にする例における、エクソヌクレアーゼ仲介核酸再構成の使用を示す図である。アニーリングした核酸鎖は、ヘテロメリック核酸複合体を形成し、ヘテロメリック核酸複合体において複数のアニーリングした核酸鎖の未ハイブリッド形成一本鎖末端から、3’及び5’末端ヌクレオチドを遊離させ、短縮されているがハイブリッド形成された末端を残し、処理済み末端のポリメラーゼ系伸長及び又はリガーゼ仲介ライゲーションを促進する手段として、エクソヌクレアーゼ処理を受ける。その後、自然状態において非メチル化及びキメラである生成されたアニーリング済み単結合核酸鎖に対する選択に関して、Dpn Iによる処理が実用的となる。
【0224】
図11は、複数のメチル化多結合核酸鎖をアニーリングし、いくつかの非メチル化単結合核酸鎖にする例における、エクソヌクレアーゼ仲介核酸再構成の使用を示している。アニーリングした核酸鎖は、ヘテロメリック核酸複合体を形成し、ヘテロメリック核酸複合体において複数のアニーリングした核酸鎖の未ハイブリッド形成一本鎖末端から、3’及び5’末端ヌクレオチドを遊離させ、短縮されているがハイブリッド形成された末端を残し、処理済み末端のポリメラーゼ系伸長及び又はリガーゼ仲介ライゲーションを促進する手段として、エクソヌクレアーゼ処理を受ける。その後、自然状態において非メチル化及びキメラである生成されたアニーリング済み単結合核酸鎖に対する選択に関して、Dpn Iによる処理が実用的となる。
【0225】
本発明において実用的である二本鎖核酸基礎単位を生成可能な多数の方法が存在し、これらは、この技術において知られており、当業者が容易に実行することができる。
【0226】
一実施形態によれば、二本鎖核酸基礎単位は、最初に二つの一本鎖核酸を生成することと、これらをアニーリングして二本鎖核酸基礎単位を生成できるようにすることとによって生成される。二本鎖核酸基礎単位の二つの鎖は、オーバハングを形成する任意のものを除き、すべてのヌクレオチドにおいて相補的にすることが可能であり、したがって、任意の(複数の)オーバハングを除き、ミスマッチを含まない。別の実施形態によれば、二本鎖核酸基礎単位の二つの鎖は、オーバハングを形成する任意のものを除き、すべてより少ない数のヌクレオチドにおいて相補的である。したがって、この実施形態によれば、二本鎖核酸基礎単位は、コドンの縮重を導入するのに使用することができる。好ましくは、コドンの縮重は、本明細書で説明する部位飽和突然変異生成を使用して導入され、これは一つ以上のN,N,G/Tカセットを使用し、或いは代わりに、一つ以上のN,N,Nカセットを使用する。
【0227】
図1は、本明細書で説明する部位飽和突然変異生成の好適な実施形態を示している。非確率的な部位飽和突然変異生成によって突然変異生成することが可能な核酸配列は、長さ15乃至100,000塩基の任意のポリヌクレオチド(例えば、任意のコーディング領域及び任意の非コーディング領域)を含む。例えば、こうした核酸配列は、例として、プロモータ、エンハンサ、イントロン、遺伝子全体、cDNA、遺伝子セグメント、オペレータ、ポリヌクレオチド官能基、発現調節配列、発現配列タグ(EST)、オープンリーディングフレーム(ORF)、リプレッサ/トランス作用因子、複製の起源、又は遺伝子経路を含む。
【0228】
非確率的な不意飽和突然変異生成によって突然変異生成できる変異原性カセットは、長さ1乃至500塩基の任意のポリヌクレオチドカセットを含む。部位飽和突然変異生成は、突然変異生成させるポリヌクレオチド配列内部に含まれるカセットの完全なセットを突然変異生成させることに関して実用的である。図1に示すように、カセットは、各ポリヌクレオチドに沿って様々な間隔(つまり、直に隣接、均等な間隔、又は不均等な間隔)にすることが可能であり、任意のサイズにすることができる。好適で非制限的な例証形態において、変異原性カセットのセットは、定められた長さの配列内の連続するコドンのセットである。代わりに、別の好適で非制限的な例において、変異原性カセットのセットは、整列した関連ポリヌクレオチドによって共有されないヌクレオチドカセットのセットである。
【0229】
変異原性カセットのセットに導入される突然変異のタイプは、ポリヌクレオチド部位飽和突然変異生成の各ラウンドで、同じタイプ又は異なるタイプにすることができる。(突然変異生成させる核酸配列内の)各変異原性カセットは、好ましくは、通常、対応するオリゴを使用することによって突然変異生成される(縮重オリゴによるものを含む)。本発明が提供する縮重突然変異の例は、以下を含む。
【0230】
全20種類のアミノ酸に関するコドン(例えば、N,N,N、又はN,N,G/T、又はN,N,G/C)
親の鋳型のアミノ酸配列を変更しないすべての縮重コドン(つまり、親の鋳型に存在する同じアミノ酸に関するコドン)
選択されたアミノ酸グループ化体系にしたがった同じグループ内のアミノ酸に関する(すべての又は選択された)コドン
各アミノ酸グループ内の少なくとも一つのアミノ酸に関するコドン
1.芳香族(Phe、Trp、Tyr)
2.脂肪族(Gly、Ala、Val、Leu、Ile)
3.OH含有(Ser、Tyr、Thr)
4.酸性(Asp、Glu、Asn、Gin)
5.塩基性(Lys、Arg、His)
6.硫黄含有(Met、Cys)
7.極性(Ser、Thr、Cys、Asn、Gin、Tyr)
8.無極性(Gly、Ala、Vai、Leu、Ile、Met、Phe、Trp、Pro)
【0231】
図2は、この例において設計された核酸基礎単位の可能なすべての組み合わせを網羅的及び体系的に生成する能力における本発明の力を示している。特に、子孫キメラ細胞の大きなセット(又はライブラリ)を生成することができる。この方法は網羅的及び体系的に実行できるため、新しい境界点を選択することで繰り返し方法を適用することが可能であり、これに対応する新たに設計された核酸基礎単位により、以前に調査及び拒否された分子種を再生成及び再スクリーニングする負担が回避される。境界点の頻度を増やす上で有利となるように、コドンの揺らぎを使用できると理解される。言い換えると、特定の塩基は、コドン縮重のため、前駆コドン(変更されたコドン)によって符号化されるアミノ酸を変更することなく、核酸基礎単位において置換できる場合が多い。例示のように、境界点は、八つの前駆鋳型が整列した状態で選択される。その後、(順序のある結合の生成に関して実用的な)オーバハングを含む核酸基礎単位が設計及び合成される。この事例においては、18の核酸基礎単位が、八つの前駆鋳型のそれぞれの配列に基づいて生成され、合計144の核酸基礎単位(又は二本鎖オリゴ)となる。その後、ライゲーション再構成手順を実行することで、818(又は1.8×1016超)のキメラ生成量を含む子孫分子のライブラリが生成されることになる。
【0232】
本発明のin vitro組み換え法は、特定のポリヌクレオチド又は配列の未知のハイブリッド又は対立遺伝子のプールに、盲目的に実行することができる。しかしながら、特定のポリヌクレオチドの実際のDNA又はRNA配列が分かっている必要がある。
【0233】
遺伝子の混合集団内での組み換えを使用するアプローチは、例えば、インターロイキンI、抗体、tPA、及び成長ホルモンといった、任意の有用なタンパク質の生成に役立てることができる。このアプローチは、変更された特異性又は活性を有するタンパク質を生成するために使用することができる。このアプローチは、例えば、遺伝子のプロモータ領域、イントロン、エクソン、エンハンサ配列、31非翻訳領域、又は51非翻訳領域といった、ハイブリッド核酸配列の生成に役立てることもできる。したがって、このアプローチは、発現の速度が増加した遺伝子を生成するのに使用することができる。このアプローチは、反復性DNA配列の研究において役立てることもできる。最後に、このアプローチは、リボザイム又はアプタマを突然変異させるのに役立てることができる。
【0234】
本発明は、ポリヌクレオチドの開始セットからポリヌクレオチドのサブセットを選択する方法を提供し、この方法は、各選択可能ポリヌクレオチドに関する選択(正の選択)、及び又は、これに対する選択(負の選択)を実行するために、作業中のポリヌクレオチドのどこかに存在する一つ以上の選択可能な特徴(又は選択マーカ)を識別する能力に基づいている。一態様において、提供される方法は末端選択と呼ばれ、この方法は、選択可能ポリヌクレオチドの末端領域に一部又は全部が位置する選択マーカの使用に基づいており、こうした選択マーカは、「末端選択マーカ」と呼ばれる場合がある。
【0235】
末端選択は、自然発生する配列の検出に基づくもの、又は実験的に導入した配列の検出に基づくもの(本明細書記載及び未記載の任意の突然変異生成によるものを含む)にすることが可能であり、或いは、同じポリヌクレオチド内であっても、これらの両方に基づくものにすることが可能である。末端選択マーカは、構造的な選択マーカ又は機能的な選択マーカ、或いは、構造的かつ機能的な選択マーカにすることができる。末端選択マーカは、ポリヌクレオチド配列、又はポリペプチド配列、又は任意の化学構造、或いは任意の生物学的又は生化学的タグを含むことが可能であり、放射能と、酵素活性と、蛍光と、任意の光学的特徴と、磁気特性(磁気ビーズの使用等)と、免疫反応性と、ハイブリッド形成との検出に基づく方法を使用して選択可能なマーカを含む。
【0236】
末端選択は、突然変異生成を実行する任意の方法と組み合わせて適用することができる。こうした突然変異生成法は、その一部として、本明細書で説明する方法を含む(前記及び後記)。こうした方法は、非制限的な例証として、本明細書において、又は当業者に、以下の用語のいずれかで呼ばれる場合がある任意の方法を含む:「飽和突然変異」、「シャッフリング」、「組み換え」、「再構成」、「エラープローンPCR」、「アセンブリPCR」、「セクシャルPCR」、「クロスオーバPCR」、「オリゴヌクレオチドプライマ指定突然変異生成」、「再帰的(及び又は指数)アンサンブル突然変異生成(アーキン及びユーバン,1992を参照)」、「カセット式突然変異生成」、「in vivo突然変異生成」、及び「in vitro突然変異生成」。更に、末端選択は、任意の突然変異生成及び又は増幅方法によって生成された分子に実行することが可能であり(アーノルド,1993、コールドウェル及びジョイス,1992、ステマ,1994等を参照)、この方法に続いて、望ましい子孫分子を(存在に関してスクリーニングを行うことを含め)選択することが望ましい。
【0237】
加えて、末端選択は、任意の突然変異生成法と関係のないポリヌクレオチドに適用することができる。一実施形態において、末端選択は、本明細書で定めるように、別のポリヌクレオチドとのライゲーションのステップ(ベクタとのライゲーションを含む)といったクローニングステップを促進するために使用できる。したがって、本発明は、望ましいポリヌクレオチドのライブラリ構築、選択、及び又は濃縮と、全般的なクローニングとを促進する手段としての末端選択を提供する。
【0238】
別の実施形態において、末端選択は、ポリヌクレオチドに関する(正の)選択に基づくものにすることが可能であり、代わりに、末端選択は、ポリヌクレオチドに対する(負の)選択に基づくものにすることが可能であり、更に代わりに、末端選択は、ポリヌクレオチドに関する(正の)選択と、これに対する(負の)選択との両方に基づくものにすることが可能である。末端選択は、他の選択及び又はスクリーニングの方法と共に、反復する形で実行することが可能であり、これにおいて、類似する又は類似しない選択及び又はスクリーニング方法及び突然変異生成又は定方向進化方法を任意の組み合わせにすることが可能であり、これらすべてを反復する形で、任意の順序、組み合わせ、及び順列において、実行することができる。更に、末端選択は、環状(例えば、プラスミド又は他の任意の環状ベクタ、或いは部分的に環状である他の任意のポリヌクレオチド)、及び又は分岐、及び又は任意の化学基又は部分による修飾又は置換状態のポリヌクレオチドを選択するために使用することもできる。
【0239】
非制限的な一態様において、線状ポリヌクレオチドの末端選択は、ポリヌクレオチドの端部又は末端(5’末端又は3’末端にすることが可能)或いはその近くに位置する少なくとも一つの末端選択マーカの存在に基づく一般的なアプローチを使用して実行される。特定の非制限的な一例証形態において、末端選択は、ポリヌクレオチド配列を認識する酵素によって認識される配列等を含む、末端又はその近くにある特定の配列の選択に基づく。ポリヌクレオチドの化学的修飾を認識及び触媒する酵素は、本明細書において、ポリヌクレオチド作用酵素と呼ばれる。好適な実施形態において、ポリヌクレオチド作用酵素は、ポリヌクレオチド切断活性を備える酵素と、ポリヌクレオチドメチル化活性を備える酵素と、ポリヌクレオチド連結活性を備える酵素と、複数の区別可能な酵素活性(例えば、ポリヌクレオチド切断活性及びポリヌクレオチド連結活性を排他的に含む)を備える酵素とによって、非排他的に例証される。
【0240】
関連するポリヌクレオチド作用酵素は、当業者が確認可能な(例えば、市販の)任意の酵素を含み、或いは、ポリヌクレオチドにおいてライゲーション適合末端、好ましくは付着末端を生成するのに役立つ、現在は利用できないが将来開発される可能性のあるものを含むと理解される。末端選択を施すポリヌクレオチドの内部に含まれない、或いは含まれることが予想されない、或いは含まれる可能性が低い(例えば、作業中のポリヌクレオチドに関する配列情報が不完全な場合)制限部位を使用することが好ましい場合がある。方法(例えば、突然変異生成法)は、不必要な内部制限部位を除去するのに使用することができると認識されている。更に、部分消化反応(つまり、部分的な完了へと進む消化反応)を使用して、末端領域の認識部位での消化を達成して、ポリヌクレオチド内部で発生し、同じ酵素によって認識される感受性のある制限部位を残しておくことが可能であると理解される。一態様において、部分消化が有用であるのは、認識配列が発生する位置及び環境に応じて、特定の酵素が同じ認識配列の優先的な切断を示すと理解されるためである。
【0241】
更に、保護方法を使用して、特定の制限部位(内部部位等)を、こうした部位の存在に反応して作業中のポリペプチドを切断する酵素による不必要な消化から、選択的に保護することが可能であり、こうした保護方法は、不必要な酵素活性を抑制するメチル化及び塩基置換(例えば、TをUに置き換える)といった修飾を含む。
【0242】
本発明の別の実施形態において、有用な末端選択マーカは、特定のポリヌクレオチド配列を認識するポリヌクレオチド作用酵素によって認識される末端配列である。本発明の一態様において、有用なポリヌクレオチド作用酵素は、更に、標準的なII型制限酵素に加え、他の酵素を含む。この本発明の好適な態様によれば、有用なポリヌクレオチド作用酵素は、更に、ジャイレース(トポイソメラーゼ等)と、ヘリカーゼと、組み換え酵素と、リラクセーズと、これらに関連する任意の酵素とを含む。
【0243】
末端選択は、親の鋳型分子(突然変異生成を施されるもの等)を子孫分子(突然変異生成によって生成されたもの等)から識別及び分離するために使用することができると理解される。例えば、トポイソメラーゼI認識部位を欠いたプライマの第一のセットを使用して、(例えば、ポリメラーゼベースの増幅において)親分子の末端領域を修飾することができる。その後、異なるプライマの第二のセット(トポイソメラーゼI認識部位を有するもの等)を使用して、増幅した親分子から突然変異させた子孫分子を生成することができる(例えば、断続合成、鋳型切り替えポリメラーゼベース増幅、又は断続合成といった任意のポリヌクレオチドキメラ化方法を使用すること、或いは飽和突然変異を使用すること、或いは、突然変異生成された子孫分子にトポイソメラーゼI認識部位を導入する他の任意の方法を使用することによる)。トポイソメラーゼIベースの末端選択の使用により、その後、望ましい子孫分子の識別だけでなく、選択的なトポイソメラーゼIベースのライゲーションも促進される。
【0244】
トポイソメラーゼベースのニッキング及びライゲーションを使用する末端選択アプローチは、以前に利用可能だった選択方法に比べ、いくつかの利点を有すると理解される。要するに、このアプローチでは、方向クローニング(発現クローニングを含む)を達成することができる。
【0245】
図3は、(例えば、合成ライゲーション再構成による)ポリヌクレオチド再構成によって生成された望ましいポリヌクレオチドを選択する(例えば、全長分子の選択を行う)トポイソメラーゼ誘導選択ステップを使用した末端選択の応用を示す図である。図4は、末端選択技術の様々な態様を例示している。これには、in vitro再構成遺伝子における末端選択の方法が含まれ、この方法は以下のステップを含む:a)遺伝子特異プライマ鋳型を備える所定の遺伝子を増幅すること:染色体DNA/λクローン/ゲノムクローン/任意のサブクローンDNA、b)組み換えPCRを実行すること:相同遺伝子からの混合PCR産物に一般的なトポクローニングプライマを追加、PCRは、例えば、5分94℃、80×(30秒94℃、10秒37℃、10秒72℃)、c)定方向発現クローニングを実行すること:再構成PCR産物をゲル精製し、ワクシニアウイルスにトポイソメラーゼを結合させ(最適なモル比は、DNA:酵素、1:5)、ベクタを追加し(挿入の二倍の量)、E.coliを形質転換し、形質転換体をスクリーニングする。図5は、オリジナルの平滑末端DNAの定方向発現クローニングを達成する目的で、当初の平滑末端DNAに「付着末端」を導入するために、酵素N.BstNBlを使用して、「c)定方向発現クローニングを実行すること」のステップが達成される、末端選択技術の特定の態様を例示している。
【0246】
本方法は、任意の開示方法と、その任意の組み合わせとによるin vitro及び又はin vivo組み換えによって、ペプチドディスプレイ法で選択されたポリヌクレオチド配列をシャッフリングするのに使用することが可能であり、これにおいて、関連するポリヌクレオチドは、表現型(既定のレセプタ(リガンド)に関する親和性等)に関してスクリーニングされたディスプレイペプチドを符号化する。
【0247】
生物薬剤学的薬品開発及び分子生物学において重要性が増す態様は、生物学的高分子と相互作用するペプチド又はペプチドミメティクスのプライマリアミノ酸配列を含むペプチド構造の同定である。既定の生物学的高分子(レセプタ等)との結合といった、望ましい構造又は機能特性を保有するペプチドを同定する一方法には、ペプチドのアミノ酸配列によって与えられる望ましい構造又は機能特性を保有する個別のライブラリ構成要素に関して、大きなライブラリ又はペプチドをスクリーニングすることが関与する。
【0248】
ペプチドライブラリを生成するためのダイレクト化学合成方法に加え、いくつかの組み換えDNA方法も報告されている。一タイプには、バクテリオファージ粒子又は細胞の表面でのペプチド配列、抗体、又は他のタンパク質のディスプレイが関与する。一般に、こうした方法では、各バクテリオファージ粒子又は細胞は、自然バクテリオファージ又は細胞タンパク質配列に加え、ディスプレイペプチドの単一の種をディスプレイする個別のライブラリ構成要素としての役割を果たす。各バクテリオファージ又は細胞は、特定のディスプレイペプチド配列を符号化するヌクレオチド配列情報を含み、したがって、ディスプレイペプチド配列は、分離したライブラリ構成要素の核酸配列を決定することで確認できる。
【0249】
広く知られているペプチドディスプレイ法には、通常はバクテリオファージコートタンパク質との融合として、糸状バクテリオファージの表面上でのペプチド配列の提示が関与する。このバクテリオファージライブラリは、固定化した既定の高分子または小分子(レセプタ等)により培養することが可能であり、固定化高分子と結合するペプチド配列を提示するバクテリオファージ粒子は、既定の高分子と結合するペプチド配列を提示しないものとは異なる形で区分できるようになる。固定化高分子と結合するバクテリオファージ粒子(つまり、ライブラリ構成要素)は、次に、回収及び複製し、その後のラウンドでの親和性濃縮及びファージ複製のために、選択したバクテリオファージ小集団を増幅することができる。数ラウンドの親和性濃縮及びファージ複製後、このように選択されたバクテリオファージライブラリ構成要素は、分離され、ディスプレイペプチド配列を符号化するヌクレオチド配列が決定され、これにより、既定の高分子(レセプタ等)と結合するペプチドの(複数の)配列が同定される。こうした方法については、PCT特許公報WO91/17271、WO91/18980、WO91/19818、及びWO93/08278において更に説明されている。
【0250】
本発明は、更に、ランダム、疑似ランダム、及び定義済みの配列枠組みペプチドライブラリと、所定のレセプタ分子又はエピトープ或いは望ましい形でペプチド又はRNAを修飾する遺伝子産物に結合する有用な化合物(一本鎖抗体を含むペプチド等)を同定するために、こうしたライブラリを生成及びスクリーニングする方法とを提供する。ランダム、疑似ランダム、及び定義済みの配列枠組みペプチドは、ディスプレイペプチドが合成されたポリヌクレオチド鋳型に付着するディスプレイペプチド又はディスプレイ一本鎖抗体を含むペプチドライブラリ構成要素のライブラリから生成される。付着の形態は、選択した本発明の特定の実施形態に応じて変化させることが可能であり、ファージ粒子内でのカプセル化又は細胞内での取り込みを含むことができる。
【0251】
本発明の大きな利点は、所定のペプチドリガンド又は抗体を分離するために、予想されるリガンド構造に関する事前情報を必要としないことである。同定するペプチドは、生物学的活性を有することが可能であり、これは、選択されたレセプタ分子に関して少なくとも特定の結合親和性を含むことを意味し、また、他の化合物の結合をブロックする能力と、代謝経路を刺激又は抑制する能力と、信号又はメッセンジャとして作用する能力と、細胞活性を刺激又は抑制する能力と、その他とを更に含むことになる。
【0252】
本発明は、更に、本発明の方法によって同定され、既定のレセプタ(哺乳類タンパク質性レセプタ等、例えば、ペプチド性ホルモンレセプタ、細胞表面レセプタ、他の(複数の)タンパク質に結合してヘテロ二量体等の細胞内タンパク質複合体を形成する細胞内タンパク質、及びその他)又はエピトープ(固定化タンパク質、糖タンパク質、オリゴ糖、及びその他等)と結合するライブラリ構成要素に関して、発生期ペプチド(一本鎖抗体を含む)をディスプレイするポリソームのライブラリを親和性スクリーニングすることによって選択されたポリヌクレオチド配列のプールをシャッフリングする方法を提供する。
【0253】
こうした方法のいずれかによる第一の選択ラウンド(通常は、レセプタ(リガンド)との結合に関する親和性選択による)において選択されたポリヌクレオチド配列はプールされ、この(複数の)プールは、in vitro及び又はin vivo組み換えによってシャッフリングされ、組み換え済み選択ポリヌクレオチド配列の集団を含むシャッフル済みプールが生成される。組み換え済み選択ポリヌクレオチド配列には、少なくとも一回の事後選択ラウンドが施される。(複数の)事後選択ラウンドにおいて選択されたポリヌクレオチド配列は、直接、配列に使用することが可能であり、及び又は、一回以上の追加ラウンドでシャッフリング及び事後選択を施すことができる。選択した配列は、自然配列(つまり、結合に対する機能的影響に実体のないもの)を符号化するポリヌクレオチド配列によって戻し交配することも可能であり、例えば、免疫原性の少ない可能性があるネイティブに似た機能ペプチドを生成するために、選択した配列と実質的に同一な野生型又は自然発生配列によって戻し交配することが可能である。一般に、戻し交配中には、既定のレセプタ(リガンド)との結合特性を維持するために、事後選択が適用される。
【0254】
選択した配列のシャッフリングの前に、或いはこれと同時に、この配列は、突然変異生成させることができる。一実施形態において、選択済みライブラリ構成要素は、原核ベクタ(例えば、プラスミド、ファージミド、又はバクテリオファージ)においてクローニングされ、これにおいて、個別のライブラリ構成要素を表す個々のコロニ(又はプラーク)の集合が生成される。個別の選択済みライブラリ構成要素は、その後、選択済みライブラリ構成要素の配列に基づく配列多様性の中核を表すライブラリ構成要素の集合を生成するために、操作することができる(例えば、部位指定突然変異生成、カセット式突然変異生成、化学的突然変異生成、PCR突然変異生成、及びその他)。個別の選択済みライブラリ構成要素又はプールの配列は、ランダム突然変異と、疑似ランダム突然変異と、定義中核突然変異(つまり、変異及び不変残基位置を含むこと、及び又はアミノ酸残基の定義されたサブセットから選択された残基を含む変異残基位置を含むこと)と、コドンベース突然変異と、その他とを組み込むために、セグメント的に、或いは個別の選択済みライブラリ構成要素配列の全長に渡って、操作することができる。突然変異生成した選択済みライブラリ構成要素は、その後、本明細書で開示するin vitro及び又はin vivo組み換えシャッフリングによってシャッフリングされる。
【0255】
本発明は、更に、本発明の複数の個別ライブラリ構成要素を含むペプチドライブラリを提供し、これにおいて、(1)前記複数内の各個別ライブラリ構成要素は、選択された配列のプールをシャッフリングすることで生成された配列を含み、(2)各個別ライブラリ構成要素は、前記複数内の他の個別ライブラリ構成要素の可変ペプチドセグメント配列又は一本鎖抗体セグメント配列から識別可能な、可変ペプチドセグメント配列又は一本鎖抗体セグメント配列を含む(ただし、一部のライブラリ構成要素は、不均等な増幅、確率的な可能性、又はその他のため、一ライブラリ当たり二つ以上のコピーに存在する場合がある)。
【0256】
本発明は、更に、プロダクトバイプロセスを提供し、これにおいて、既定の結合特異性を有する(或いは、これを有するペプチドを符号化する)選択されたポリヌクレオチド配列は、以下のプロセスによって形成される:(1)既定のレセプタ(リガンド等)又はエピトープ(抗原高分子等)に対してディスプレイペプチド又はディスプレイ一本鎖抗体ライブラリをスクリーニングすること、及び選択ライブラリ構成要素のプールを生成するために、既定のレセプタ又はエピトープに結合するライブラリ構成要素を同定及び又は濃縮すること、(2)既定のエピトープと結合し、これによりライブラリから分離及び又は濃縮された選択ライブラリ構成要素(或いは、その増幅済み又はクローニング済みコピー)を、シャッフル済みライブラリを生成するために組み換えによりシャッフリングすること、及び(3)既定のレセプタ(リガンド等)又はエピトープ(抗原高分子等)に対してシャッフル済みライブラリをシャッフリングすること、及び選択シャッフル済みライブラリ構成要素のプールを生成するために、既定のレセプタ又はエピトープに結合するシャッフル済みライブラリ構成要素を同定及び又は濃縮すること。
【0257】
本方法は、任意の開示方法と、その任意の組み合わせとによるin vitro及び又はin vivo組み換えによって、抗体ディスプレイ法で選択されたポリヌクレオチド配列をシャッフリングするのに使用することが可能であり、これにおいて、関連するポリヌクレオチドは、表現型(既定の抗原(リガンド)と結合する親和性等)に関してスクリーニングされたディスプレイ抗体を符号化する。
【0258】
免疫グロブリン鎖に存在する可能性がある極めて多数の区別可能な可変領域によって表現される膨大な免疫学的レパートリを捕捉するために、様々な分子遺伝子アプローチが考案されてきた。自然発生の生殖細胞系免疫グロブリン重鎖座は、可変セグメント遺伝子の分離タンデム配列を含み、これは多様性セグメント遺伝子のタンデム配列の上流に位置し、これ自体は接合(i)領域遺伝子のタンデム配列の上流に位置し、これは定常領域遺伝子の上流に位置する。Bリンパ球発生中、V−D−J再配列が発生し、これにおいて、融合Dセグメントを形成する再配列によって重鎖可変領域遺伝子(VH)が形成され、これに続いてVセグメントの再配列によりV−D−J接合産物遺伝子が形成され、これは生産的に再配列された場合、重鎖の機能可変領域(VH)を符号化する。同様に、軽鎖座は、いくつかのJセグメントの一つにより、いくつかのVセグメントの一つを再配列し、軽鎖の可変領域(LV)を符号化する遺伝子を形成する。
【0259】
免疫グロブリンにおいて可能な可変領域の膨大なレパートリは、部分的には、B細胞の発生における再配列中にV及びiセグメント(及び、重鎖座の場合、Dセグメント)を接合する無数の組み合わせ可能性に由来する。重鎖可変領域における追加的な配列多様性は、V−D−J接合中のDセグメントの不均一な再配列、及びN領域の追加から発生する。更に、同定B細胞クローンの抗原選択では、重鎖及び軽鎖変異領域の一方又は両方において、非生殖細胞系突然変異を有する高い親和性変異体が選択され、この現象は「親和性突然変異」又は「親和性シャープニング」と呼ばれる。通常、こうした「親和性シャープニング」突然変異は、可変領域の特定のエリアに集まり、最も一般的には、相補性決定領域(CDR)に集まる。
【0260】
抗原刺激β細胞の発生(つまり、免疫化)を通じて高親和性免疫グロブリンを生成及び同定することにおける多数の制約を克服するために、様々な原核発現系が開発されており、これは、特定の抗原に対する高親和性抗体をスクリーニング可能な組み合わせ抗体ライブラリを生成する目的で操作可能である。Escherichia coli及びバクテリオファージ系での抗体の発現における近年の進歩により(下記「代替ペプチドディスプレイ法」参照)、特徴付けたハイブリドーマからの抗体遺伝子をクローニングすること、或いは抗体遺伝子ライブラリ(例えば、Ig cDNAから)を使用したde novo選択により、事実上任意の特異性を得られる可能性が高まった。
【0261】
抗体の組み合わせライブラリは、バクテリオファージプラークとして、或いはリソゲンのコロニとしてスクリーニング可能なバクテリオファージλ発現系において生成されている(ヒューズら,1989、ケイトン及びコプロウスキ,1990、マリナックスら,1990、ペルソンら,1991)。バクテリオファージ抗体ディスプレイライブラリ及びλファージ発現ライブラリの様々な実施形態が説明されている(カンら,1991、クラックソンら,1991、マッカファーティら,1990、バートンら,1991、フーゲンブームら,1991、チャンら,1991、ブライトリングら,1991、マークスら,1991,p581、バーバスら,1992、ホーキンス及びウィンタ,1992、マークスら,1992,p779、マークスら,1992,p16007、及びローマンら,1991、ラーナら,1992、これらは全て出典を明記することによりその開示内容全体を本願明細書の一部とする)。通常、バクテリオファージ抗体ディスプレイライブラリは、固定化(例えば、親和性クロマトグラフィで反応性ファージを濃縮するためのクロマトグラフィ樹脂との共有結合による)及び又は標識付け(プラーク又はコロニリフトをスクリーニングすること)されたレセプタ(ポリペプチド、炭水化物、糖タンパク質、核酸等)によりスクリーニングされる。
【0262】
特定の有利な一アプローチは、いわゆる一本鎖可変断片(scfv)ライブラリの使用であった(マークスら,1992,p779、ウィンタ及びミルスタイン,1991、クラックソンら,1991、マークスら,1991,p581、チョードリら,1990、チスウェルら,1992、マッカファーティら,1990、及びヒューストンら,1998)。バクテリオファージコートタンパク質でディスプレイされるscfvライブラリの様々な実施形態が説明されている。
【0263】
1988年以来、一本鎖類似体及びその融合タンパク質は、抗体エンジニアリング法により、高い信頼性で生成されてきた。第一のステップは、通常、望ましい結合特性を備えたVH及びVLドメインを符号化する遺伝子を取得することを含み、こうしたV遺伝子は、組み合わせV遺伝子ライブラリから選択された或いはV遺伝子合成により作成された特定のハイブリドーマ細胞株から分離することが可能である。一本鎖Fvは、コンポーネントV遺伝子を、(Gly−Gly−Gly−Gly−Ser(SEQ ID NO:3))又は同等の(複数の)リンカペプチドのような適切に設計されたリンカペプチドを符号化するオリゴヌクレオチドに接続することで形成される。このリンカは、第一のV領域のC末端と第二のもののN末端とを架橋し、VH−リンカ−VL又はVL−リンカ−VH’の順序にする。原則として、scfv結合部位は、親抗体結合部位の親和性及び特異性の両方を忠実に複製することができる。
【0264】
したがって、scfv断片は、フレキシブルなリンカペプチドによって単一のポリペプチド鎖にリンクするVH及びVLドメインを含む。scfv遺伝子が組み立てられた後、これらは、ファージミドでクローニングし、M13ファージ(又は類似する糸状バクテリオファージ)の先端で、バクテリオファージPIII(遺伝子3)コートタンパク質を伴う融合タンパク質として発現させる。所定の抗体を発現するファージの濃縮は、集団のscfvをディスプレイする組み換えファージを、既定のエピトープ(例えば、ターゲット抗原、レセプタ)との結合に関してパニングすることで達成される。
【0265】
ライブラリ構成要素のリンクしたポリヌクレオチドは、スクリーニング又は選択手順後にライブラリ構成要素を複製するための基盤を提供し、更に、ディスプレイペプチド配列或いはVH又はVLアミノ酸配列の同一性をヌクレオチド配列によって決定するための基盤を提供する。(複数の)ディスプレイペプチド又は一本鎖抗体(scfv等)、及び又はそのVH及びVLドメイン又はそのCDRは、適切な発現系においてクローニング及び発現が可能である。分離されたVH及びVLドメインを符号化するポリヌクレオチドは、定常領域(CH及びCL)を符号化するポリヌクレオチドに連結され、完全な抗体(例えば、キメラ又は完全ヒト)、抗体断片、及びその他を符号化するポリヌクレオチドを形成する場合が多い。分離されたCDRを符号化するポリヌクレオチドは、適切な可変領域枠組み(及び、随意的に、定常領域)を符号化するポリヌクレオチドに移植され、完全な抗体(例えば、ヒト化又は完全ヒト)、抗体断片、及びその他を符号化するポリヌクレオチドを形成する場合が多い。抗体は、イミュノアフィニティクロマトグラフィによって、抗原の準備量を分離するのに使用できる。こうした抗体の他の様々な使用法には、疾病(腫瘍形成等)の診断及び又は段階付けと、例えば、腫瘍形成、自己免疫性疾患、AIDS、心疾患、感染症、及びその他といった疾病を治療するための治療的用途がある。
【0266】
scfvライブラリの組み合わせ多様性を増加させ、結合種(イディオタイプスペクトル)のレパートリを広げるために、様々な報告が報告されてきた。PCRの使用は、特定のハイブリドーマソースから、或いは非免疫化細胞からの遺伝子ライブラリとして、可変領域の迅速なクローニングを可能にし、組み合わせ可能なVH及びVLカセットの取り合わせに組み合わせ多様性を提供する。更に、VH及びVLカセットは、ランダム、疑似ランダム、又は定義済み突然変異生成によって、それ自体を多様化することが可能である。通常、VH及びVLカセットは、相補性決定領域(CDRS)において、或いはその近くで、多様化され、これは第三のCDR、CDR3である場合が多い。酵素的逆PCR突然変異生成は、エラープローンPCR及び化学的突然変異生成と同様に(デンら,1994)、scfv部位指定ハイブリッドの比較的大きなライブラリを構築するシンプルで信頼性の高い方法であることが示されている(ステマら,1993)。リーチマン(リーチマンら,1993)は、縮退オリゴヌクレオチドPCRと、その後の結果として生じたscfvハイブリッドのファージディスプレイとによる、部位指定ランダム化を使用した抗体scfv断片の半合理的設計を示した。バルバス(バルバスら,1992)は、ヒト破傷風トキソイド結合Fabの合成CDR領域において配列をランダム化することで、バイアスをかけた可変領域配列を使用することから生じる制限されたレパートリサイズの問題の回避を試みた。
【0267】
CDRランダム化は、重鎖CDR3のみに関して約1×1020CDRと、重鎖CDR1及びCDR2のほぼ同様の数の変異体と、軽鎖CDR1乃至3変異体とを形成する可能性を有する。個別又は一緒に考えると、重鎖及び又は軽鎖のCDRランダム化の組み合わせ可能性には、可能なすべての組み合わせを表現するクローンライブラリを生成するために、法外な数のバクテリオファージクローンを生成することが必要であり、組み合わせの大部分は非結合性である。こうした多数のプライマリ形質転換体の生成は、現在の形質転換技術及びバクテリオファージディスプレイシステムでは実現不可能である。例えば、バルバス(バルバスら,1992)は、5×10の形質転換体を生成したに過ぎず、これは完全にランダム化したCDRのライブラリの潜在的な多様性のほんの僅かしか表現していない。
【0268】
こうした大きな制限にもかかわらず、scfvのバクテリオファージディスプレイは、既に、様々な役に立つ抗体及び抗体融合タンパク質を生み出している。二重特異性一本鎖抗体は、効率的な腫瘍細胞の溶解を仲介することが示されている(グルーバら,1994)。抗Rev scfvの細胞内発現は、in vitroでのHIV−1ウイルスの複製を抑制することが示されており(デュアンら,1994)、抗p2lrar scfvの細胞内発現は、Xenopus卵母細胞の減数分裂成熟を抑制することが示されている(ビオッカら,1993)。HIV感染を診断するのに使用できる組み換えscfvについても報告されており、scfvの診断における重要性が実証されている(リリーら,1994)。毒素又は線維素溶解アクチベータタンパク質といった、scfvが第二のポリペプチドにリンクされる融合タンパク質についても報告されている(ホルボストら,1992、ニコラスら,1993)。
【0269】
幅広い抗体多様性を有し、潜在的な配列組み合わせの非常に僅かな部分のみをカバー可能な従来のCDR突然変異及びランダム化の多くの制限を克服するscfvライブラリを生成することが可能であれば、治療及び診断用途に適したscfv抗体の数及び品質は、大いに向上する。これに取り組むためには、本発明のin vitro及びin vivoシャッフリング法を使用して、選択されたディスプレイ抗体より得られた核酸から(通常はPCR増幅又はクローニングを介して)取得されたCDRを組み換える。こうしたディスプレイ抗体は、細胞上、バクテリオファージ粒子上、ポリソーム上、或いは抗体が(複数の)符号化核酸に関連する任意の適切な抗体ディスプレイ系で、ディスプレイすることができる。変異として、CDRは、抗体生成細胞(例えば、WO92/03918、WO93/12227、及びWO94/25585にあるような、免疫化した野生型マウス、ヒト、又はヒト抗体を形成できる遺伝子導入マウスからのプラズマ細胞/脾細胞)からのmRNA(又はcDNA)より最初に取得され、これは、これに由来するハイブリドーマを含む。
【0270】
こうした方法のいずれかによる第一の選択ラウンド(通常は、抗原(リガンド等)と結合するディスプレイ抗体に関する親和性選択による)において選択されたポリヌクレオチド配列は、プールされ、この(複数の)プールは、in vitro及び又はin vivo組み換え、特にCDRのシャッフリング(通常は、他の重鎖CDRにより重鎖CDRをシャッフリングし、他の軽鎖CDRにより軽鎖CDRをシャッフリングする)により、シャッフリングされ、組み換え済み選択ポリヌクレオチド配列の集団を含むシャッフル済みプールが生成される。この組み換え済み選択ポリヌクレオチド配列は、ディスプレイ抗体として選択フォーマットにおいて発現させ、少なくとも一回の事後選択ランドを施す。(複数の)事後選択ラウンドにおいて選択されたポリヌクレオチドは、直接、配列決定することが可能であり、及び又は望ましい結合親和性が得られるまで、一回以上の追加ラウンドでシャッフリング及び事後選択を施すことができる。選択した配列は、中立抗体枠組み配列(つまり、抗原結合に対する機能的影響に実体のないもの)を符号化するポリヌクレオチド配列によって戻し交配することも可能であり、例えば、ヒトに似た配列抗体を生成するために、ヒト可変領域によって戻し交配することが可能である。一般に、戻し交配中には、既定の抗原との結合特性を維持するために、事後選択が適用される。
【0271】
代わりに、或いは記載の変異と組み合わせて、ターゲットエピトープの原子価を変化させて、選択されたscfvライブラリ構成要素の平均結合親和性を制御することができる。ターゲットエピトープは、競争的エピトープを含めること、希釈すること、或いは当業者に知られる他の方法等によって、様々な濃度で表面又は基質に結合させることができる。既定のエピトープの高濃度(原子価)は、比較的低い親和性を有するscfvライブラリ構成要素を濃縮するために使用可能であるのに対し、低濃度(原子価)は、高い親和性のscfvライブラリ構成要素を優先的に濃縮することができる。
【0272】
多様な可変セグメントを生成するために、ペプチド配列のランダム、疑似ランダム、又は定義済みの配列中核セットを符号化する合成オリゴヌクレオチドの集合を、ライゲーションにより、既定の部位(CDR等)に挿入することができる。同様に、(複数の)一本鎖抗体カセットの一つ以上のCDRの配列多様性を、部位指定突然変異生成、CDR置換、及びその他により(複数の)CDRを突然変異させることで伸長することができる。結果として生じたDNA分子は、シャッフリング前のクローニング及び増幅のための宿主において増殖させることが可能で、或いは、直接使用することが可能であり(つまり、宿主細胞での増殖時に発生する可能性のある多様性の損失を回避することができる)、選択されたライブラリ構成要素は、その後、シャッフリングされる。
【0273】
所定の様々なセグメントペプチド配列又は所定の一本鎖抗体を符号化するディスプレイペプチド/ポリヌクレオチド複合体(ライブラリ構成要素)は、親和性濃縮手法によりライブラリから選択される。これは、レセプタ等、所定のペプチド配列に特異的な高分子又はエピトープ、その他の高分子、或いはエピトープ種を固定化する手段によって達成される。親和性選択手順を繰り返すことで、望ましい配列を符号化するライブラリ構成要素の濃縮が提供され、これはその後、プーリング及びシャッフリング、配列、及び又は更なる増殖及び親和性濃縮のために分離することができる。
【0274】
望ましい特異性のないライブラリ構成要素は、洗浄により除去される。必要な洗浄の度合い及び強さは、各ペプチド配列又は所定の一本鎖抗体及び固定化した既定の高分子又はエピトープに関して決定される。結合培養及びその後の洗浄の条件を調整することで、回収される発生期ペプチド/DNA複合体の結合特性に、ある程度の制御を及ぼすことができる。温度と、pHと、イオン強度と、二価カチオン濃度と、洗浄の量及び持続時間とは、特定の範囲内の固定化高分子に関する親和性を示す発生期ペプチド/DNA複合体に関して、選択することができる。通常、高親和性が予想される低い解離速度に基づく選択は、最も実際的なルートである場合が多い。これは、飽和量の自由な既定の高分子が存在する状態での継続的な培養、或いは、洗浄の量、回数、長さを増やすことによって実行できる。各ケースにおいて、解離した発生期ペプチド/DNA又はペプチド/RNA複合体の再結合は、防止され、時間が経過するにつれ、更に高い親和性の発生期ペプチド/DNA又はペプチド/RNA複合体が回収される。
【0275】
特別な特徴を有するペプチドを発見するために、結合及び洗浄手順の追加的な修正を適用することができる。一部のペプチドの親和性は、イオン強度又はカチオン濃度に応じて変化する。これは、ペプチドからタンパク質を除去するために穏やかな条件が必要とされる時、様々なタンパク質の親和性精製において使用されるペプチドにとって有用な特徴である。
【0276】
変異の一つには、多数の結合ターゲット(多数のエピトープ種、多数のレセプタ種)を使用し、様々な結合特異性を有する多数のscfvに関して、scfvライブラリを同時にスクリーニングできるようにすることが含まれる。scfvライブラリのサイズは可能性のあるscfv配列の多様性を制限することが多いことから、通常は、可能な限り大きなサイズのscfvライブラリを使用することが望ましい。多数の非常に大きなポリソームscFvディスプレイライブラリを生成することに関する時間及び経済的な考慮事項は、極めて大きなものになる可能性がある。こうした大きな問題を回避するため、多数の既定のエピトープ種(レセプタ種)を、単一のライブラリにおいて共にスクリーニングすることが可能であり、或いは、多数のエピトープ種に対する連続的スクリーニングを使用することができる。変異の一つにおいて、別個のビード(又はビードのサブセット)上でそれぞれが符号化される多数のターゲットエピトープ種は、適切な結合条件下で、ポリソームディスプレイscfvライブラリにより混合及び培養することができる。このビードの集合は、多数のエピトープ種を含み、その後、親和性選択により、scfvライブラリ構成要素を分離するのに使用することができる。一般に、その後の親和性スクリーニングラウンドは、ビードの同じ混合物、そのサブセット、或いは一つ又は二つの個別エピトープ種のみを含むビードを含むことができる。このアプローチは、効率的なスクリーニングを提供し、ラボラトリオートメーション、バッチ処理、及び高スループットスクリーニング方法に適合する。
【0277】
本発明においては、様々な手法を使用して、ペプチドライブラリ又は一本鎖抗体ライブラリを多様化すること、或いは、シャッフリングの前又はこれに付随して、パニングの初期のラウンドにおいて発見された可変領域修理のペプチドを多様化し、既定の高分子又はエピトープに対する十分な結合活性を得ることができる。アプローチの一つにおいては、陽性の選択ペプチド/ポリヌクレオチド複合体(親和性濃縮の初期のラウンドにおいて同定されたもの)を配列し、活性ペプチドの同一性を決定する。その後、一次オリゴヌクレオチド配列の僅かな変化を生成するために、各ステップに組み込まれた低レベルの全塩基を利用し、こうした活性ペプチド配列に基づいて、オリゴヌクレオチドが合成される。この(僅かに)縮退したオリゴヌクレオチドの混合物は、その後、様々なセグメント配列において、適切な位置でクローニングされる。この方法により、開始ペプチド配列の体系的で制御された変異が生じ、これはその後、シャッフリングすることができる。しかしながら、個々の陽性発生期ペプチド/ポリヌクレオチド複合体は、突然変異生成前に配列決定する必要があり、したがって、少数の回収複合体の多様性を伸長し、より高い親和性及び又はより高い結合特異性を有する変異体を選択するのに有用である。変異として、陽性の選択ペプチド/ポリヌクレオチド複合体(特に、可変領域配列のもの)の変異原性PCR増幅において、その増幅産物は、in vitro及び又はin vivoでシャッフリングされ、配列決定する前に、一回以上の追加ラウンドでのスクリーニングが実行される。同じ一般的なアプローチは、通常、シャッフリングの前又はこれに付随して、CDR又は隣接した枠組み領域を多様化することで、多様性を伸長し、結合親和性/特異性を強化するために、一本鎖抗体において利用することが可能である。望ましい場合、シャッフリング反応には、含めることが可能な選択されたライブラリ構成要素によるin vitro組み換えが可能な変異原性オリゴヌクレオチドを加えることができる。したがって、合成オリゴヌクレオチド及びPCR生成ポリヌクレオチド(エラープローン又は忠実性の高い方法により合成されたもの)の混合物は、in vitroシャッフリング混合物に追加することが可能であり、結果として生じたシャッフル済みライブラリ構成要素(シャッフラント)に組み込むことができる。
【0278】
本発明のシャッフリングにより、CDR変異一本鎖抗体の膨大なライブラリを生成できる。こうした抗体を生成する一方法は、シャッフリングの前又はこれに付随して、一本鎖抗体及び又はCDRランダム化に合成CDRを挿入することである。合成CDRカセットの配列は、ヒトCDRの既知の配列データを参照することで選択され、以下のガイドラインにしたがって、実施者の判断において選択される:合成CDRは、既知のCDR配列に対して、少なくとも40パーセントの位置的配列同一性を有し、好ましくは、既知のCDR配列に対して、少なくとも50乃至70パーセントの位置的配列同一性を有することになる。例えば、合成CDR配列の集合は、カバット(カバットら,1991)において列挙される自然発生ヒトCDR配列に基づいてオリゴヌクレオチド配列の集合を合成することで生成可能であり、合成CDR配列の(複数の)プールは、少なくとも一つの既知である自然発生ヒトCDR配列に対して、少なくとも40パーセントの配列同一性を有するCDRペプチド配列を符号化するために計算される。代わりに、自然発生CDR配列の集合は、残基位置において頻繁に(つまり、既知のCDR配列の少なくとも5%において)使用されるアミノ酸が合成CDRで対応する(複数の)位置に組み込まれるようなコンセンサス配列を生成するために比較することができる。通常は、いくつか(例えば、3乃至約50)の既知のCDR配列を比較し、既知のCDR間で観察される自然配列の変異を表にまとめ、観察された自然配列変異のすべて又は殆どの順列を包含するCDRペプチド配列を符号化するオリゴヌクレオチドの集合を合成する。制限ではない例として、ヒトVH CDR配列の集合がTyr、Val、Phe、又はAspのいずれかであるカルボキシ末端アミノ酸を有する場合、合成CDRオリゴヌクレオチド配列の(複数の)プールは、カルボキシ末端CDR残基をこうしたアミノ酸のいずれかにすることが可能となるように設計される。一部の実施形態においては、CDR配列の集合において残基位置で自然発生するもの以外の残基が組み込まれ、この場合は、同類アミノ酸置換が高い頻度で組み込まれ、既知の自然発生CDR配列と比較して、五つまでの残基位置を変化させ、非同類アミノ酸置換を組み込むことができる。こうしたCDR配列は、一次ライブラリ構成要素(第一のラウンドのスクリーニング前)において使用することが可能であり、及び又は、選択されたライブラリ構成要素配列のin vitroシャッフリング反応に加えるために使用することができる。こうした定義済み及び又は縮退配列のプールの構築は、当業者が容易に達成できるものである。
【0279】
合成CDR配列の集合は、自然発生CDR配列であることが知られていない少なくとも一つの構成要素を含む。重鎖CDRにおけるN領域添加に対応するランダム又は疑似ランダム配列の一部を含むかどうかは実施者の判断に含まれ、N領域配列は、V−D及びD−J接合において発生する1ヌクレオチド乃至約4ヌクレオチドの範囲である。合成重鎖CDR配列の集合は、少なくとも約100の一意的なCDR配列を含み、通常は少なくとも約1,000の一意的なCDR配列を含み、好ましくは少なくとも約10,000の一意的なCDR配列を含み、高い頻度で50,000を超える一意的なCDR配列を含むが、しかしながら、通常は、約1×10以下の一意的なCDR配列が集合に含まれ、ただし、場合によっては、特に自然発生ヒトCDRの同じ位置において同類アミノ酸置換が存在しない或いは希である(つまり0.1パーセント未満である)位置で、同類アミノ酸置換が可能である場合、1×10乃至1×10の一意的なCDR配列が存在する。一般に、ライブラリに含まれる一意的なCDR配列の数は、ライブラリにおける一次形質変換体の予想数の10倍を上回るべきではない。こうした一本鎖抗体は、一般に、少なくとも1×10m−を結合し、好ましくは少なくとも約5×10M−1の親和性であり、更に好ましくは少なくとも約1×10M−1乃至1×10M−1以上の親和性であり、場合によっては1×1010M−1以上である。既定の抗原は、高い頻度で、ヒトタンパク質、例えば、ヒト細胞表面抗原(例えば、CD4、CD8、IL−2レセプタ、EGFレセプタ、PDGFレセプタ)であり、その他のヒト生物学的高分子(例えば、トロンボモジュリン、プロテインC、糖鎖抗原、シアリルルイス抗原、Lセレクチン)、或いは、人間以外の疾病関連高分子(例えば、バクテリアLPS、ビリオンカプシドタンパク質、又はエンベロープ糖タンパク質)、及びその他である。
【0280】
望ましい特異性の高親和性一本鎖抗体は、様々な系においてエンジニアリング及び発現が可能である。例えば、scfvは、植物において生成されており(フィレクら,1993)、原核生物系において容易に作成できる(オーウェン及びヤング,1994、ジョンソン及びバード,1991)。更に、一本鎖抗体は、完全な抗体又はその様々な断片を構築する基盤として使用できる(ケトルバーロウら,1994)。配列を符号化する可変領域は、免疫原性を最小化するのが好ましいヒト治療用途に適したヒト配列抗体を符号化するために、(例えば、PCR増幅又はサブクローニングにより)分離し、望ましいヒト定常領域を符号化する配列にスプライシングすることができる。結果として生じる(複数の)完全なヒト符号化配列を有する(複数の)ポリヌクレオチドは、(例えば、哺乳類細胞の発現ベクタからの)宿主細胞において発現させ、薬品製剤のために精製することができる。
【0281】
発現後、抗体と、個別の突然変異免疫グロブリン鎖と、突然変異抗体断片と、本発明のその他の免疫グロブリンポリペプチドとは、この技術の標準的な手順にしたがって精製することが可能であり、これには硫安沈殿、フラクションカラムクロマトグラフィ、ゲル電気永動、及びその他が含まれる(一般に、スコープス,1982を参照)。部分的に又は望ましい均質性まで、精製された後、このポリペプチドは、治療的に使用可能であり、或いは、検定手順の開発及び実行、免疫蛍光染色、及びその他で使用することができる(一般に、レフコビッツ及びパーニス,1979及び1981、レフコビッツ,1997を参照)。
【0282】
本発明の方法によって生成された抗体は、診断及び治療に使用することができる。制限ではなく例示として、これらは、癌、自己免疫疾患、又はウイルス感染の治療に使用することができる。癌の治療に関して、この抗体は、通常、ガン細胞上で優先的に発現する抗原と結合することになり、これには、erB−2、CEA、CD33、及び、当業者に広く知られる他の多くの抗原及び結合要素が含まれる。
【0283】
シャッフリングは、ツーハイブリッドスクリーニング系によって得られるライブラリ構成要素のプールを組み換えにより多様化し、既定のポリペプチド配列と結合するライブラリ構成要素を同定するために使用することもできる。選択されたライブラリ構成要素は、in vitro及び又はin vivo組み換えによりプール及びシャッフリングされる。シャッフリングされたプールは、その後、イーストツーハイブリッド系においてスクリーニングし、前記既定のポリペプチド配列(例えば、SH2ドメイン)と結合するライブラリ構成要素、或いは代替の既定のポリペプチド配列(例えば、別のタンパク質種からのSH2ドメイン)と結合するライブラリ構成要素を選択することができる。
【0284】
既定のポリペプチド配列と結合するポリペプチド配列を同定するアプローチでは、既定のポリペプチド配列が融合タンパク質に存在するいわゆる「ツーハイブリッド」系が使用されてきた(シャンら,1991)。このアプローチは、転写活性因子、イーストGal4転写タンパク質の再構成(フィールズ及びソング,1989)を通じて、in vivoでタンパク質−タンパク質相互作用を同定する。通常、この方法は、DNA結合及び転写活性化を引き起こす分離可能なドメイン構成されるイーストGal4タンパク質の特性に基づく。ツーハイブリッドタンパク質を符号化するポリヌクレオチドで、一方が既知のタンパク質のポリペプチド配列と融合するイーストGal4 DNA結合ドメインで構成され、他方が第二のタンパク質のポリペプチド配列と融合するGal4活性化ドメインで構成されるものは、イースト宿主細胞で構築及び導入される。二つの融合タンパク質間の分子間結合は、Gal4活性化ドメインを伴うGal4 DNA結合ドメインを再構成し、これは、Gal4結合部位と動作的にリンクするレセプタ遺伝子(例えば、lacZ、HIS3)の転写活性化につながる。通常、ツーハイブリッド法は、既知のタンパク質と相互作用する新しいポリペプチド配列を同定するために使用される(シルバ及びハント,1993、ダーフィら,1993、ヤンら,1992、ルバンら,1993、ハーディら,1992、バーテルら,1993、及びボイテクら,1993)。しかしながら、ツーハイブリッド法の変異は、第二の既知のタンパク質との結合に影響する既知のタンパク質の突然変異を同定するために使用されている(リー及びフィールズ,1993、ラロら,1993、ジャクソンら,1993、及びマドゥら,1993)。ツーハイブリッド系は、二つの既知のタンパク質の相互作用構造ドメイン(バードウェルら,1993、チャクラバーティら,1992、シュタウディンガら,1993、及びミルン及びウィーバ,1993)、或いは単一のタンパク質のオリゴメリゼーションを引き起こす領域(イワブチら,1993、ボガードら,1993)を同定するためにも使用されている。ツーハイブリッド系の変異は、タンパク質分解酵素のin vivo活性を研究するために使用されている(ダスマシャパトラら,1992)。代わりに、E.coli/BCCP双方向スクリーニング系(ジェルミノら,1993、グアレンテ,1993)は、相互作用タンパク質配列(つまり、上位のヘテロマルチマをヘテロ二量体化又は形成するタンパク質配列)を同定するために使用できる。ツーハイブリッド系によって選択された配列は、プール及びシャッフリングし、一回以上のその後のラウンドでのスクリーニングのためにツーハイブリッドシステムに導入し、既定の結合配列を含むハイブリッドと結合するポリペプチド配列を同定することができる。このように同定された配列は、比較を行い、(複数の)コンセンサス配列及びコンセンサス配列の中核を同定することができる。
【0285】
鋳型DNAの1マイクログラム試料は、TT二量体、特にプリン二量体を含む二量体を形成させるために、取得し、紫外線により処理する。紫外線による露光は、鋳型DNA試料で遺伝子ごとにほんの僅かな光産物が生成されるように制限される。多数の試料を、紫外線により、時間の長さを変化させて処理し、紫外線露光による二量体の数が異なる鋳型DNA試料を取得する。
【0286】
非プルーフリーディングポリメラーゼを利用するランダム初回免疫キット(例えば、Stratagene Cloning SystemsのPrime−It II Random Primer Labelingキット)を利用し、紫外線によって(上記の通り)作成された鋳型のランダムな部位で初回免疫を行い、鋳型に沿って伸長することで、様々なサイズのポリヌクレオチドが生成される。Prime−It II Random Primer Labelingキットにおいて説明されるような初回免疫プロトコルは、プライマを伸長するのに利用することができる。紫外線露光によって形成される二量体は、非プルーフリーディングポリメラーゼによる伸長の障害物としての役割を果たす。したがって、ランダムなプライマによる伸長が終了した後には、ランダムなサイズのポリヌクレオチドのプールが存在する。
【0287】
本発明は、更に、通常は増幅及び又はクローニングされたポリヌクレオチドの形態である選択突然変異体ポリヌクレオチド配列(又は、選択ポリヌクレオチド配列の集団)を生成する方法に向けられており、これにより、(複数の)選択ポリヌクレオチド配列は、選択可能な少なくとも一つの望ましい表現型の特徴(例えば、ポリペプチドを符号化すること、リンクしたポリヌクレオチドの転写を促進すること、タンパク質を結合すること、及びその他)を保有する。既定の生物学的高分子(レセプタ等)との結合等、望ましい構造又は機能特性を保有するハイブリッドポリペプチドを同定する一方法は、ポリペプチドのアミノ酸配列によって与えられた望ましい構造又は機能特性を保有する個別のライブラリ構成要素に関して、ポリペプチドの大きなライブラリをスクリーニングすることを含む。
【0288】
一実施形態において、本発明は、親和性相互作用スクリーニング又は表現型スクリーニングに適したディスプレイポリペプチド又はディスプレイ抗体のライブラリを生成する方法を提供する。この方法は、(1)ディスプレイポリペプチド又はディスプレイ抗体及び前記ディスプレイポリペプチド又はディスプレイ抗体を符号化する関連ポリヌクレオチドを含む第一の複数の選択ライブラリ構成要素を取得すること、及び前記関連ポリヌクレオチド又はそのコピーを取得し、前記関連ポリヌクレオチドが実質的に同一である配列の領域を含み、突然変異を前記ポリヌクレオチド又はコピーに適切に導入することと、(2)このポリヌクレオチド又はコピーをプールすることと、(3)ランダムな又は特殊化した初回免疫及び合成プロセス或いは増幅プロセスを中断することで、小さい又は短いポリヌクレオチドを生成することと、(4)新たに合成されたポリヌクレオチドを相同的に組み換えるために、増幅、好ましくはPCR増幅、及び随意的な突然変異生成を実行することとを含む。
【0289】
本発明の目的は、以下を含む一連のステップにより、有用なハイブリッドポリペプチドを発現するハイブリッドポリヌクレオチドを生成するプロセスを提供することである。
【0290】
(a)増幅又は合成プロセスを阻害又は中断する手段により、ポリヌクレオチド増幅又は合成プロセスを中断し、様々な完了段階にあるポリヌクレオチドの複製による複数の小さい又は短いポリヌクレオチドを提供することで、ポリヌクレオチドを生成すること、
(b)結果として生じた一本鎖又は二本鎖ポリヌクレオチドに一つ以上の一本鎖又は二本鎖オリゴヌクレオチドを追加し、前記追加オリゴヌクレオチドが、集団の一つ以上の一本鎖又は二本鎖ポリヌクレオチドとの異種構造エリアに同一性エリアを含むこと、
(c)結果として生じた一本鎖又は二本鎖オリゴヌクレオチドを変性させ、随意的に、短い又は小さいポリヌクレオチドを様々な長さを有するポリヌクレオチドのプールに分離し、更に随意的に、少なくとも一つの前記ポリヌクレオチドプールに含まれる一つ以上のオリゴヌクレオチドを増幅するために前記ポリヌクレオチドにPCR手順を施すこと、
(d)前記一本鎖ポリヌクレオチドのアニーリングが一本鎖ポリヌクレオチド間の同一性領域において生じ、突然変異による二本鎖ポリヌクレオチド鎖が形成される条件下で、複数の前記ポリヌクレオチド又は前記ポリヌクレオチドの少なくとも一つのプールを、ポリメラーゼにより培養すること、
(e)ステップ(c)及び(d)を随意的に繰り返すこと、
(f)前記ポリヌクレオチド鎖、又は複数の鎖から、少なくとも一つのハイブリッドポリペプチドを発現させること、
(g)有用な活性に関して、前記少なくとも一つのハイブリッドポリペプチドをスクリーニングすること。
【0291】
本発明の一態様において、増幅又は合成プロセスを阻害又は中断する手段は、紫外線、DNA付加物、及びDNA結合タンパク質の利用によるものである。
【0292】
本発明の一実施形態において、DNA付加物、或いはDNA付加物を含むポリヌクレオチドは、更なる処理の前にDNA断片を含む溶液を加熱することを含むプロセス等により、ポリヌクレオチド又はポリヌクレオチドプールから除去される。
【0293】
別の実施形態においては、所定の生体分子又は生物活性を有するとして同定されたクローンも、例えば、ポリペプチド(酵素等)を符号化するDNA配列、或いは特定の活性を有するポリペプチド配列自体を同定するために配列決定することができる。したがって、本発明によれば、(i)所定の生物活性を符号化するDNA(例えば、特定の酵素活性を有する酵素)と、(ii)生体分子(例えば、こうした活性を有するポリペプチド又は酵素(そのアミノ酸配列を含む))と、(iii)生成された組み換え生体分子又は生物活性とを分離及び同定することが可能である。
【0294】
ライブラリからの適切なクローン(例えば、1乃至1000以上のクローン)は、本発明の方法によって同定され、例えば、高スループット配列手法を使用して配列決定される。配列決定の正確な方法は、本発明の限定要因にはならない。特定のクローンDNA配列の配列を同定するのに有用な任意の方法を使用することができる。一般に、配列決定は、DNA複製の自然過程の適応である。そのため、鋳型(ベクタ等)及びプライマ配列が使用される。一般的な鋳型作成及び配列決定プロトコルの一つは、バクテリアコロニの自動採集により開始され、バクテリアコロニのそれぞれは、配列決定反応の鋳型として機能する別個のDNAクローンを含む。選択したクローンは、培地に置き、一晩成長させる。DNA鋳型は、その後、細胞から精製され、水に懸濁される。DNAの定量化後、Applied Biosystems,Inc.のPrism 377 DNA Sequencer等のシークエンサを使用して、高スループット配列決定が実行される。結果として生じた配列データは、その後、データベース又は複数のデータベースの検索を含む、追加的な方法において使用することができる。
【0295】
特定のポリヌクレオチド配列によって符号化された活性の同定及び決定において本発明で使用する核酸配列及び又は推論アミノ酸配列を含む多数のソースデータベースを利用することができる。テストされる配列の全部又は代表的な部分(例えば、100の個別のクローン)は、同時に又は個別に配列データベース(例えば、GenBank、PFAM、又はProDom)を検索するために使用される。こうした配列検索を実行する多数の様々な方法が、この技術において知られている。このデータベースは、特定の有機体又は有機体の集合に限定されている場合がある。例えば、C.elegans、Arabadopsis.sp、M.genitalium、M.jannaschii、E.coli、H.influenzae、S.cerevisiae、及びその他に関するデータベースが存在する。クローンの配列データは、その後、二つ以上の配列の相同性を測定するために設計されたアルゴリズムを使用して、データベース又は複数のデータベースの配列に合わせて並べられる。
【0296】
こうした配列アライメント方法は、例えば、BLAST(アルトシュルら,1990)、BLITZ(MPsrch)(スターロック及びコリンズ,1993)、及びFASTA(パーソン及びリップマン,1988)を含む。プローブ配列(例えば、クローンからの配列データ)は、任意の長さにすることが可能であり、相同性閾値に基づいて、相同であると認識される。この閾値は、既定のものにすることができるが、これは必須ではない。この閾値は、特定のポリヌクレオチドの長さに基づいたものにすることができる。配列のアライメントには、多数の様々な手順を使用することができる。通常は、スミス−ウォーターマン又はニードルマン−ブンシュのアルゴリズムが使用される。しかしながら、説明したように、BLAST、FASTA、PSI−BLASTといったスピードの速い手順を使用することもできる。
【0297】
例えば、比較ウィンドウを並べる配列の適切なアライメントは、スミスの局所相同アルゴリズム(スミス及びウォーターマン,Adv Appl Math, 1981、スミス及びウォーターマン,J Teor Biol, 1981、スミス及びウォーターマン,J Mol Biol, 1981、スミスら,J Mol Evol, 1981)、ニードルマンの相同性アライメントアルゴリズム(ニードルマン及びブンシュ,1970)、ピアソンの類似性検索方法(ピアソン及びリップマン,1988)、こうしたアルゴリズムのコンピュータ実施(ウィスコンシン州マディソン、575 Science Dr.、Genetics Computer GroupのWisconsin Genetics Software Package Release7.0、或いはウィスコンシン州マディソン、ウィスコンシン大学、Genetics Computer GroupのSequence Analysis Software PackageにおけるGAP、BESTFIT、FASTA、及びTFASTA)、或いは検査によって、実施することが可能であり、様々な方法によって生成された最善のアライメント(つまり、比較ウィンドウ全体で最大の相同性パーセンテージが生じるもの)が選択される。二つの配列(つまり、プローブ配列及びデータベース配列)の類似性は、その後、予測することができる。
【0298】
こうしたソフトウェアは、様々な欠失、置換、及びその他の修飾に相同性の度合いを割り当てることで、類似する配列を一致させる。二つ以上の核酸又はポリペプチド配列のコンテクストにおける「相同」及び「同一」という用語は、任意の数の配列比較アルゴリズムを使用して或いは手動アライメント及び目視検査により測定されたものとして、比較ウィンドウ又は指定領域全体において最大の対応性で比較し並べた時に同じである、或いは同じである特定のパーセンテージのアミノ酸残基又はヌクレオチドを有する、二つ以上の配列又は部分配列を指す。
【0299】
配列比較では、通常、一配列が基準配列の役割を果たし、テスト配列は、これと比較される。配列比較アルゴリズムを使用する時は、テスト及び基準配列をコンピュータに入れ、必要な場合は小配列座標を指定し、配列アルゴリズムプログラムパラメータを指定する。デフォルトのプログラムパラメータを使用することが可能であり、或いは、代替のパラメータを指定することができる。その後、配列比較アルゴリズムは、プログラムパラメータに基づいて、基準配列と比較したテスト配列の配列同一性のパーセントを計算する。
【0300】
「比較ウィンドウ」は、本明細書での使用において、20乃至600、通常は約50乃至約200、更に通常は約100乃至約150で構成されるグループから選択された連続位置の任意の一つの数のセグメントに対する基準を含み、この中で、二つの配列を適切に並べた後、配列を連続位置の同じ数の基準配列と比較することが可能である。
【0301】
有用なアルゴリズムの一例は、BLAST及びBLAST2.0アルゴリズムであり、これは、それぞれ、アルトシュルら,Nuc. Acids Res. 25:3389−3402(1977)及びアルトシュルら,J. Mol. Biol. 215:403−410(1990)において説明されている。BLAST分析を実行するソフトウェアは、米国国立バイオテクノロジ情報センタ(http://www.ncbi.nlm.gov/)を通じて公的に入手することができる。このアルゴリズムは、問い合わせ配列において、長さWの短い単語を同定することで、高スコア配列ペア(HSP)を最初に同定することを含み、これは、データベース配列内の同じ長さの単語に合わせて並べた時、何らかの正の値の閾値スコアTと一致するか、或いはこれを満たすものである。Tは、隣接単語スコア閾値(アルトシュルら、前掲)と呼ばれる。こうした最初の隣接単語のヒットは、これらを含む長いHSPを見つけるために検索を開始する上で種の役割を果たす。単語のヒットは、累積アライメントスコアを増加させることができる限り、各配列に沿って、両方向で延長される。累積スコアは、ヌクレオチド配列に関して、パラメータM(一致する残基のペアに関する報酬スコアで、常に0より大きい)を使用して計算される。BLASTアルゴリズムのパラメータW、T、及びXは、アライメントの感度及び速度を決定する。BLASTプログラム(ヌクレオチド配列に関する)は、デフォルトとして、単語の長さ(W)11、期待値(E)10、M=5、N=4、及び両方の鎖の比較を使用する。
【0302】
BLASTアルゴリズムは、二配列間の類似性の統計分析も実行する(カーリン&アルトシュル,Proc. Natl. Acad. Sci. USA 90:5873(1993)等を参照)。BLASTアルゴリズムが提供する類似性の尺度の一つは、最小合計確率(P(N))であり、これは二つのヌクレオチド配列間での一致が偶然に発生する確率の表示を提供する。例えば、核酸は、基準核酸に対するテスト核酸の比較における最小合計確率が約0.2未満、更に好ましくは約0.01未満、最も好ましくは約0.001未満である場合、基準配列に類似するとみなされる。
【0303】
配列相同性とは、二つのポリヌクレオチド配列が比較のウィンドウ全体で(ヌクレオチドごとに比較して)相同であることを意味する。配列同一性又は相同性のパーセンテージは、比較のウィンドウ全体で適切にアライメントされた二配列を比較し、一致した位置の数を得るために両方の配列において同一の核酸塩基(例えば、A、T、C、G、U、又はI)が発生する位置の数を決定し、一致した位置の数を比較ウィンドウ内の位置の合計数(つまりウィンドウサイズ)で割り、配列相同性のパーセンテージを得るために結果に100を掛けることで計算される。こうした実質的な相同性は、ポリヌクレオチド配列の特徴を示し、これにおいて、ポリヌクレオチドは、少なくとも25乃至50ヌクレオチドの比較ウィンドウの基準配列と比較して、少なくとも60%の配列相同性、通常は少なくとも70%の相同性、多くの場合は80乃至90パーセントの配列相同性、最も一般的には少なくとも99パーセントの配列相同性を含み、これにおいて、配列相同性のパーセンテージは、基準配列を、比較ウィンドウ全体で、合計して基準配列の20パーセント以下の欠失又は追加を含む可能性があるポリヌクレオチド配列と比較することで計算される。
【0304】
十分な相同性を有する配列は、その後、例えば、種及び活性情報を含め、データベースに含まれる任意の注釈によって更に同定することが可能である。したがって、通常の環境試料では、複数の核酸配列が、取得され、クローニングされ、配列決定され、同定されたデータベースからの相同配列に対応することになる。この情報は、試料中に存在するポリヌクレオチドのプロフィールを提供し、これは、配列或いはその配列によってデータベース情報に基づいて符号化される任意のポリペプチドに関連する有機体及び活性を含むポリヌクレオチドに関連する一つ以上の機能を含む。本明細書において、「指紋」又は「プロフィール」とは、各試料が、試料のポリヌクレオチド特性のセットと、由来する環境とに関連することになる事実を指す。こうしたプロフィールは、試料中に存在する配列の量及びタイプと、ポリヌクレオチドによって符号化される潜在的な活性及びポリヌクレオチドが由来する有機体に関する情報とを含む場合がある。こうした固有のパターンは、各資料のプロフィール又は指紋となる。
【0305】
また、同一性又は活性が決定された時、或いは示唆される同一性又は活性がポリヌクレオチドに関連する時、特定のクローンポリヌクレオチド配列を発現させることが望ましい場合がある。こうした場合、望ましいクローンは、既に発現ベクタでクローニングされていない場合、調節制御要素(例えば、プロモータ又はエンハンサ)の下流で連結され、適切な宿主細胞でクローニングされる。発現ベクタは、本発明で使用される対応する宿主細胞と共に市販されている。
【0306】
使用可能な発現ベクタの代表的な例としては、ウイルス粒子と、バキュロウイルスと、ファージと、プラスミドと、ファージミドと、コスミドと、フォスミドと、バクテリア人工染色体と、ウイルス核酸(例えば、ワクシニア、アデノウイルス、foul poxウイルス、仮性狂犬病、及びSV40の派生物)と、P1ベース人工染色体と、イーストプラスミドと、イースト人工染色体と、所定の特定の宿主に特異的な他の任意のベクタ(バシラス、アスペルギルス、イースト、及びその他等)とを挙げることができる。したがって、例えば、DNAは、ポリペプチドを発現させる様々な発現ベクタの任意の一つに含まれる可能性がある。こうしたベクタは、染色体性、非染色体性、及び合成DNA配列を含む。多数の適切なベクタが、当業者に知られており、市販されている。以下のベクタは、例として提示される。細菌性:pQE70、pQE60、pQE−9(Quiagen)、psiX174、pBluescript SK、pBluescript KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、pTRC99a、pKK223−3、pKK233−3、pDR540、pRIT5(Pharmacia)、真核:pWLNEO、pSV2CAT、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSG、pSVL(Pharmacia)。しかしながら、宿主内で複製及び生存可能である限り、他の任意のプラスミド又はベクタを使用することができる。
【0307】
発現ベクタ内の核酸配列は、mRNA合成を方向付けるために、適切な(複数の)発現制御配列に動作的にリンクされる。特定の指定バクテリアプロモータは、lacIと、lacZと、T3と、T7と、gptと、ラムダPRと、PLと、trpとを含む。原核プロモータは、CMV前初期と、HSVチミジンキナーゼと、初期及び後記SV40と、レトロウイルスからのLTRと、マウスメタロチオネイン−Iとを含む。適切なベクタ及びプロモータの選択は、十分に、この技術における通常の技能レベル内に含まれる。発現ベクタは、更に、翻訳開始のためのリボソーム結合部位と、転写ターミネータとを含む。ベクタは、更に、発現を増幅するための適切な配列を含む。プロモータ領域は、CAT(クロラムフェニコールトランスフェラーゼ)ベクタ又は選択可能なマーカを有するその他のベクタを使用して、任意の望ましい遺伝子から選択することができる。
【0308】
加えて、発現ベクタは、真核細胞培養に関するジヒドロ葉酸還元酵素又はネオマイシン抵抗性、或いは、E.coliにおけるテトラサイクリン又はアンピシリン抵抗性といった、形質転換させた宿主細胞の選択に関する表現型形質を提供するために、通常、一つ以上の選択可能なマーカ遺伝子を含む。
【0309】
上で説明したように選択、クローニング、及び配列決定される(複数の)核酸配列は、加えて、適切な宿主に導入し、望ましい生体分子又は生物活性に関してスクリーニングされるライブラリを準備することができる。選択核酸は、好ましくは、既に、適切な制御配列を含むベクタ内にあり、これにより、望ましい活性を検出するために、生体分子又は生物活性を符号化する選択核酸を発現させることが可能である。宿主細胞は、哺乳類細胞等の高等真核細胞、又はイースト菌等の下等真核細胞にすることが可能であり、或いは、宿主細胞は、バクテリア細胞等の原核細胞にすることができる。適切な宿主の選択は、本明細書の内容から当業者の範囲に入ると考えられる。
【0310】
また、試料中に存在する核酸配列又は分離された特定のクローンの増幅を実行することが望ましい場合がある。この実施形態において、核酸配列は、PCR反応又は当業者に知られている同様の反応によって増幅される。こうした増幅反応を実行するために、市販の増幅キットを利用することができる。
【0311】
加えて、アライメントアルゴリズム及び検索可能なデータベースは、コンピュータハードウェア、ソフトウェア、又はその組み合わせにより実施することができる点を認識することが重要である。したがって、核酸又はポリペプチド配列の分離、処理、及び同定は、自動システムにおいて実施することができる。
【0312】
上で説明した配列ベースの手法に加え、マルチウェルプレートを使用して酵素活性を測定するための多数の伝統的な検定システムが存在している。例えば、既存のスクリーニング技術は、通常、二次元ウェル(例えば、96、384、1536ウェル)に依存する。本発明は、更に、ウェルベースのスクリーニング手法に比べ多数の利点を有するキャピラリアレイベースのアプローチを提供し、こうした利点には、個別のウェルリザーバに流体(反応体等)を分配する流体ディスペンサの必要性の排除と、アレイ当たりのコスト減少(例えば、ガラスキャピラリは再使用可能)とが含まれる(例えば、出典を明記することによりその開示内容を本願明細書の一部とする1999年11月22日に出願された米国特許出願番号第09/444,122号を参照)。
【0313】
したがって、本発明のキャピラリ、キャピラリアレイ、及びシステムは、ポリヌクレオチドを含む所定の活性又は生体分子に関してライブラリをスクリーニングするのに特に最適である。活性のスクリーニングは、個別の発現クローンに関して実行することが可能であり、或いは、発現クローンの混合物に関して、その混合物が一つ以上の指定された活性を有するかどうかを確認するために、最初に実行することができる。混合物が指定された活性を有する場合は、キャピラリアレイからの収集後、こうした活性に関して、或いは更に多くの指定された活性に関して、個別のクローンを再びスクリーニングすることができる。
【0314】
本明細書で使用されたあらゆる見出し及び小見出しは、読者の便宜を図るために提示されており、本発明の制限と解釈するべきではない。
【0315】
本明細書及び付記した請求項での使用において、単数形である原文の「a」、「an」、及び「the」は、コンテクストによる明確な指定がない限り、複数の指示物を含む。したがって、例えば、「クローン(a clone)」についての論及は、複数のクローンを含み、「核酸配列(the nucleic acid sequence)」についての論及は、一般に、一つ以上の核酸配列及び当業者に知られるその同等物についての論及を含み、その他も同様である。
【0316】
定義されていない限り、本明細書で使用されるあらゆる技術用語及び科学用語は、本発明が属する当業者が一般的に理解するものと同じ意味を有する。本発明の実施又はテストにおいては、本明細書で説明されているものと類似又は同等の任意の方法、デバイス、及び材料を使用することができるが、好適な方法、デバイス、及び材料が説明されている。
【0317】
本明細書で述べたすべての印刷物は、説明する発明と関連して使用される可能性がある出版物において説明されているデータベースと、タンパク質と、方法とを説明及び開示する目的で、出典を明記することによりその開示内容を本願明細書の一部とする。前記及び全文を通じて説明した出版物は、本願の出願日に先行する開示に関してのみ提示されている。本明細書のいかなる部分も、先行発明により発明者がこうした開示の日時を早める権利を有しないことを承認するものとして解釈されない。
【0318】
次に、本発明について、以下の非制限的な例を参照して更に詳細に説明する。
【0319】
実施例1
DNA分離。DNAは、IsoQuick Procedureを製造者の指示(ワシントン州ボセルのOrca Research Inc.)に従って使用することで分離される。分離DNAは、実施例2(下記)に従って、随意的に平均化することができる。分離時、DNAは、25ゲージダブルハブ針及び1cc注射器により約500回、DNAを押し引きすることで剪断される。少量を、0.8%アガロースゲルに流し、DNAの大部分が望ましいサイズ範囲(約3乃至6kb)にある状態を確保する。
【0320】
DNAの平滑末端化。DNAは、45μlの10×マングビーンバッファと、2.0μlのマングビーンヌクレアーゼ(1050u/μl)と、水とを混合し、最終体積を405μlにすることで平滑末端化する。この混合物を、37℃で15分培養する。この混合物をフェノール/クロロホルム抽出し、その後、更にクロロホルム抽出する。氷温のエタノール1mlを、最終抽出物に追加し、DNAを沈殿させる。DNAは、氷上で10分間沈殿させる。DNAは、30分間のマイクロ遠心分離機での遠心分離により取り出す。ペレットは、1mlの70%エタノールで洗浄し、マイクロ遠心分離機において再びペレットにする。遠心分離に続いて、DNAを乾燥させ、26μlのTEバッファで穏やかに再懸濁させる。
【0321】
DNAのメチル化。DNAは、4μlの10×EcoRIメチラーゼバッファと、0.5μlのSAM(32mM)と、5.0μlのEcoRIメチラーゼ(40u/μl)とを混合し、37℃で1時間培養することでメチル化する。平滑末端を保証するために、メチル化反応に以下を追加することができる:5.0μlの100mM MgCl、8.0μlのdNTP混合物(dGTP、dATP、dTTP、dCTP、それぞれ2.5mM)、4.0μlのクレノウ(5u/μl)。この混合物は、その後、12℃で30分間培養される。
【0322】
30分間の培養後、450μlの1×STEを追加する。この混合物を一度フェノール/クロロホルム抽出し、続いて、更にクロロホルム抽出する。氷温のエタノール1mlを、最終抽出物に追加し、DNAを沈殿させる。DNAは、氷上で10分間沈殿させる。DNAは、30分間のマイクロ遠心分離機での遠心分離により取り出す。ペレットは、1mlの70%エタノールで洗浄し、マイクロ遠心分離機において再びペレットにし、10分間乾燥させる。
【0323】
ライゲーション。DNAは、DNAを8μlのEcoRIアダプタ(StrageneのcDNA Synthesis Kitより)と、1.0μlの10×ライゲーションバッファと、1.0μlの10mM rATPと、1.0μlのT4 DNAリガーゼ(4Wu/μl)とに穏やかに再懸濁し、4℃で二日間培養することでライゲーションさせる。このライゲーション反応は、30分間70℃で加熱することにより終了させる。
【0324】
アダプタのリン酸化。アダプタ末端は、ライゲーション反応に、1.0μlの10×ライゲーションバッファと、2.0μlの10mM rATPと、6.0μlのHOと、1.0μlのポリヌクレオチドキナーゼ(PNK)とを混合し、37℃で30分間培養することでメチル化される。30分間の培養後、この反応に30μlのHOと、5mlの10×STEとを追加し、Sephacryl S−500スピンカラムにより試料をサイズ断片化する。プールした断片(1乃至3)を一度フェノール/クロロホルム抽出し、続いて、更にクロロホルム抽出する。DNAは、氷温のエタノールを追加することで、氷上で10分間沈殿させる。沈殿物は、30分間のマイクロ遠心分離機での遠心分離によりペレットにする。結果として生じたペレットは、1mlの70%エタノールで洗浄し、遠心分離機により再びペレットにし、10分間乾燥させる。この試料は、10.5μlのTEバッファで再懸濁させる。この試料は平板培養されないが、2.5μlのDNAが使用され、水が使用されない点を除き、上で説明したようにラムダ腕部に直接連結される。
【0325】
スクロース勾配(2.2ml)サイズ断片化。ライゲーションは、試料を65℃で10分間加熱することで停止させる。試料を2.2mlのショ糖勾配に入れ、45000rpmの小型超遠心分離機において20℃で4時間遠心分離する(ブレーキを使用しない)。断片は、勾配管の底部に20ゲージ針で穴を開け、ショ糖が針を通じて流れるようにすることで収集される。最初の20液滴は、Falcon 2059チューブで収集し、その後、10種類の1液滴断片(1乃至10で標識付け)を収集する。各液滴は、約60μlの体積である。各断片の5μlを0.8%アガロースゲルに流し、サイズをチェックする。断片1乃至4(約10乃至1.5kb)をプールし、別個のチューブにおいて、断片5乃至7(約5乃至0.5kb)をプールする。DNAを沈殿させるために氷温のエタノール1mlを追加し、その後、氷上に10分間置く。沈殿物は、30分間のマイクロ遠心分離機での遠心分離によりペレットにする。ペレットを、70%エタノールに再懸濁することで洗浄し、マイクロ遠心分離機において高速で10分間遠心分離することで再びペレットにし、その後、乾燥させる。各ペレットは、次に、10μlのTEバッファに再懸濁させる。
【0326】
ラムダ腕部とのテストライゲーション。分析物は、0.5μlの試料を基準(既知の濃度のDNA試料)と共にエチジウムブロマイドを含むアガロース上に置き、近似濃度を得ることで平板培養される。その後、紫外線を使用して、試料を観察し、推定濃度を基準と比較する。
【0327】
下の表1に示すように、以下のライゲーション反応(5μl反応)を準備し、4℃で一晩培養する。
【0328】
表1

Figure 2004524811
テストパッケージ及びプレート。ライゲーション反応は、製造業者のプロトコルに従ってパッケージする。パッケージング反応は、500μlのSMバッファにより停止させ、同じライゲーションに由来するパッケージングによりプールされる。各プール済み反応の1μlを適切な宿主上で滴定する(OD600=1.0)(XL1−Blue MRF)。200μlの宿主(MgSO内)を、Falcon 2059チューブに追加し、1μlのパッケージしたファージを接種し、37℃で15分間培養する。約3mlの48℃トップアガー(150μl IPTG(0.5M)及び300μl X−GAL(350mg/ml)を含む50mlストック)を追加し、100mmプレート上で平板培養する。プレートは、37℃で一晩培養する。
【0329】
ライブラリの増幅(各ライブラリから5.0×10の組み換え)。約3.0mlの宿主細胞(OD600=1.0)を、二本の50ml円錐管に追加し、円錐管当たり2.5×10pfuのファージを接種し、その後、37℃で20分間培養する。トップアガーを各管に追加し、最終体積を45mlにする。各管は、五枚の150mmプレートで平板培養する。プレートは、37℃で6乃至8時間、或いはプラークがピンヘッドのサイズになるまで培養する。プレートにm8乃至10mlのSMバッファを被せ、4℃で一晩置く(可能な場合は穏やかに揺らす)。
【0330】
ファージの回収。ファージの懸濁は、SMバッファを各プレートから50ml円錐管に注ぐことで回収される。約3mlのクロロホルムを追加し、強く振り、室温で15分間培養する。この管を2000rpmで10分間遠心分離し、細胞残屑を取り除く、上澄みを無菌フラスコに注ぎ、500μlクロロホルムを追加し、4℃で保存する。
【0331】
滴定量増幅ライブラリ。回収したファージの連続希釈を行い(例えば、10−5=1mlのSMバッファ内に1μlの増幅ファージ、10−6=1mlのSMバッファ1μlの10−3稀釈物、及びその他)、200μlの宿主(10mM MgSO内)を二本の管に追加する。一方の管には、10μlの10−6稀釈物(10−5)を接種する。他方の管には、1μlの10−6稀釈物(10−6)を接種し、37℃で15分間培養する。
【0332】
約3mlの48℃トップアガー(150μl IPTG(0.5M)及び37μl X−GAL(350mg/ml)を含む50mlストック)を各管に追加し、100mmプレートで平板培養する。プレートは、37℃で一晩培養する。
【0333】
ZAP IIライブラリは、製造業者のプロトコル(Stratagene)に従って、pBLUESCRIPTライブラリを形成するために切除される。
【0334】
DNAライブラリは、宿主細胞(E.coli等)で形質転換させ、クローンの発現ライブラリを生成することができる。
【0335】
実施例2
平均化
ライブラリ生成の前に、精製DNAは、平均化することができる。DNAは、以下のプロトコルに従って断片化される。ゲノムDNAを含む試料は、塩化セシウム勾配で精製される。塩化セシウム(Rf=1.3980)溶液は、0.2μlフィルタで濾過し、15mlを35ml OptiSeal管(Beckman)に入れる。DNAを追加し、完全に混合する。10マイクログラムのビスベンズイミド(Sigma、Hoechst 33258)を追加し、完全に混合する。この管は、次に、濾過した塩化セシウム溶液で満たし、Beckman L8−70 UltracentrifugeのBti50ロータにおいて、33000rpmで72時間回転させる。遠心分離に続いて、シリンジポンプ及び精留塔(Brandel Model 186)を使用して、280nmに設定したISCO UA−5UV吸光度検出器に勾配を通す。環境試料に存在する有機体からのDNAを表すピークが取得される。真正細菌の配列は、増幅のための以下のプライマを使用して、E.coliのピークの10倍稀釈からのrRNAを符号化するDNAをPCR増幅することで検出できる。
【0336】
フォワードプライマ:5’−AGAGTTTGATCCTGGCTCAG−3’(SEQ ID NO:4)
リバースプライマ:5’−GGTTACCTTGTTACGACTT−3’(SEQ ID NO:5)
回収されたDNAは、3乃至6kbの断片に剪断又は酵素的に消化される。ローンリンカプライマが連結され、DNAは、サイズ選択される。サイズ選択DNAは、必要な場合は、PCRによって増幅される。
【0337】
平均化は、その後、二本鎖DNA試料をハイブリッド形成バッファ(0.12M NaHPO、pH6.8/0.82M NaCl/1mM EDTA/0.1%SDS)において再懸濁することで達成される。この試料は、鉱油を被せ、10分間沸騰させることで変性させる。この試料は、68℃で12乃至36時間培養する。二本鎖DNAは、60℃のヒドロキシアパタイトにおいて、標準のプロトコル(サンブルック,1989)に従って、一本鎖DNAから分離される。一本鎖DNA断片は、脱塩し、PCRにより増幅する。このプロセスは、更に数ラウンド(五回まで又はそれ以上)繰り返される。
【0338】
実施例3
酵素活性検定
以下は、ヒドロラーゼ活性に関して、例1に従って準備された発現ライブラリをスクリーニングする代表的な手順である。
【0339】
例1において説明したように準備したライブラリのプレートは、各ウェルに200μlのLB Amp/Methのグリセロールを含む単一プレートを多重接種するのに使用される。このステップは、Beckman BIOMEK RTMのHigh Density Replicating Tool(HDRT)を使用して、1%漂白剤、水、イソプロパノール、各接種間の空気乾燥殺菌と共に実行される。この単一プレートは、二時間37℃で成長させ、その後、各ウェルに250μlのLB Amp/Methのグリセロールを含む二枚の白色96ウェルDynatechマイクロタイタドータープレートを接種するのに使用される。オリジナルの単一プレートは、37℃で18時間培養し、その後、−80℃で保管する。二枚の凝縮ドータープレートは、37℃で同じく18時間培養する。凝縮ドータープレートは、その後、70℃で45分間加熱して細胞を殺し、宿主E.coli酵素を不活性化する。DMSO内の5mg/mLモルフォウレアフェニルアラニル−7−アミノ−4−トリフルオロメチルクマリン(MuPheAFC、「基質」)のストック溶液は、0.6mg/mLの界面活性ドデシルマルトシドを含む50mM pH7.5 Hepesバッファにより、600μMまで稀釈する。600μMのMuPheAFC溶液50μlを、白色凝縮プレートのウェルのそれぞれに、BIOMEKを使用して、100μl混合サイクルで追加し、基質の最終濃度を約100μMにする。蛍光値は、基質の追加直後
【0340】
【化】
Figure 2004524811
(t=0)にプレート読み出し蛍光光度計により記録する。このプレートは、70℃で100分間培養し、その後、周囲温度で更に15分間冷却させる。蛍光値を、再度記録する(t=100)。t=0の値をt=100の値から減算し、活性クローンが存在するかどうかを判断する。
【0341】
MuPheAFC
このデータは、特定のウェル内のクローンの一つが基質を加水分解したかどうかを示すことになる。活性を備える個別のクローンを判定するために、ソースライブラリを解凍し、個別のクローンを使用して、LB Amp/Methのグリセロールを含む新しいプレートに単独で接種する。前記のように、このプレートは、37℃で培養して細胞を成長させ、70℃で加熱して宿主酵素を不活性化し、Biomekを使用して600μMのMuPheAFC50μlを追加する。
【0342】
基質の追加後、前記のように、t=0の蛍光値を記録し、プレートを70℃で培養し、t=100の値を記録する。これらのデータは、どのプレートに活性クローンがあるかを示す。
【0343】
基質に関する鏡像選択性の値、Eは、次の式に従って決定される。
【0344】
【数】
Figure 2004524811
この式で、ee=加水分解産物の鏡像体過剰率であり、c=反応の変換パーセントである。ウォン及びホワイトサイズ,Enzymes in Synthetic Organic Chemistry, 1994, Elsevier, Tarrytown, N.Y., pp. 9−12を参照せよ。
【0345】
鏡像体過剰率は、キラル高性能液体クロマトグラフィ(HPLC)又はキラルキャピラリ電気永動(CE)により決定される。検定は、以下のように実行される:200μlの適切なバッファを、96ウェル白色マイクロタイタプレートの各ウェルに追加し、続いて50μlの部分又は完全精製酵素を追加し、50μl基質を追加して、モニタされた蛍光の増加と時間とを、基質の50%の消費又は反応の停止のいずれか早いほうが発生するまで比較する。
【0346】
実施例4
陽性酵素活性クローンの定方向突然変異生成
定方向突然変異生成は、野生型酵素より高い度合いの活性を示す新しい酵素を生成するために、二種類の酵素(アルカリホスファターゼ及びβ−グリコシダーゼ)で実行した。
【0347】
アルカリホスファターゼ
XL1−Red株(Stratagene)を、製造業者のプロトコルに従ってクジラの骨表面から分離した有機体である有機体OC9aからのアルカリホスファターゼ遺伝子を符号化するゲノムクローン27a3a(プラスミドpBluescript内)により形質転換させた。LB+0.1mg/mlアンピシリンの5ml培地を、200μlの形質転換体により接種し、この培地を37℃で30時間に渡って成長させた。その後、この培地でミニプレップを実行し、製造業者のプロトコルに従い、下で概要を説明する検定手順に従って、結果として生じたDNA2μlをXL−1 Blue細胞(Stratagene)で形質転換することで分離DNAをスクリーニングした。スクリーニング検定において、突然変異したOC9aホスファターゼは、発色までに10分を要し、野生型酵素は、発色までに30分を要した。
【0348】
標準のアルカリホスファターゼスクリーニング検定
形質転換したXL1 Blue細胞は、LB/ampプレートで平板培養した。結果として生じたコロニは、Duralon UV(Stratagene)又はHATF(Millipore)薄膜によりリフトし、クロロホルム蒸気内で30秒間溶解させた。30分間85℃で培養し、細胞を熱で殺した。フィルタを、BCIPバッファにおいて室温で構築し、最も早く発展したコロニ(「陽性物」)を選択し、この「陽性物」をBCIPプレート(BCIPバッファ。20mm CAPS pH9.0、1mm MgCl、0.01mm ZnCl、0.1mg/ml BCIP)上で再び線条接種した。
【0349】
β−グリコシダーゼ
このプロトコルは、Thermococcus 9N2 β−グリコシダーゼを突然変異生成させるために使用した。
【0350】
2マイクロリットルのdNTP(10mMストック)と、10マイクロリットルの10×PCRバッファと、0.5マイクロリットルのベクタDNA−31G1A−100ナノグラムと、20マイクロリットルの3’プライマ(100pmol)と20マイクロリットルの5’プライマ(100pmol)と、16マイクロリットルのMnCl 4HO(1.25mMストック)と、24.5マイクロリットルのHOと、1マイクロリットルのTaqポリメラーゼ(5.0ユニット)とを、合計100マイクロリットルとして培養することにより、PCRを実行した。PCRサイクルは、95℃15秒、58℃30秒、72℃90秒、25サイクルである(72℃乃至4℃の培養で10分延長)。
【0351】
5マイクロリットルのPCR産物を、1%アガロースゲルに流し、反応をチェックした。QIAQUICKカラム(Qiagen)で精製した。50マイクロリットルのHOで再懸濁させた。
【0352】
25マイクロリットルの精製PCR産物と、10マイクロリットルのNEBバッファ#2と、3マイクロリットルのKpn I(1OU/マイクロリットル)と、3マイクロリットルのEcoR1(20U/マイクロリットル)と、59マイクロリットルのHOとを、2時間37℃で培養し、PCR産物を消化させ、QIAQUICKカラム(Qiagen)で精製した。35マイクロリットルのHOで溶出させた。
【0353】
10マイクロリットルの消化済みPCR産物と、5マイクロリットルのベクタ(EcoRI/KpnIによる切断、及びエビアルカリホスファターゼによるホスファターゼ処理済み)と、4マイクロリットルの5×ライゲーションバッファと、1マイクロリットルのT4 DNAリガーゼ(BRL)とを一晩培養し、PCR産物をベクタ内に連結させた。
【0354】
結果として生じたベクタは、エレクトロポレーションを使用して、M15pREP4細胞で形質転換させた。100又は200マイクロリットルの細胞を、LB amp meth kanプレート上で平板培養し、37℃で一晩成長させた。
【0355】
β−ガラクトシダーゼの検定は、(1)Millipore HAFT薄膜フィルタを使用してコロニリフトを実行し、(2)150mmガラスペトリ皿において、クロロホルム蒸気でコロニを溶解させ、(3)1mg/ml XGLUを含むZバッファを染み込ませたWhatman 3MM濾過紙1枚を含む100mmガラスペトリ皿にフィルタを移動させ(溶解コロニを有するフィルタをガラスペトリ皿に移動させた後、皿は室温に保つ)、(4)フィルタ薄膜上の青いスポットとして「陽性物」を観察すること(「陽性物」は早期に現れるスポット)により実行した。パスツールピペット(又はガラスキャピラリ管)を使用して、フィルタ薄膜上の青いスポットの中心を取った。小さなフィルタディスクを、20μlの水を含むエッペンドルフ管内に配置した。エッペンドルフ管を、75℃で5分間培養し、続いて、渦動させて、プラスミドDNAをフィルタから溶出させた。このDNAを電気反応性E.coli細胞で形質転換させ、形質転換プレートでフィルタリフト検定を繰り返し、「陽性物」を同定した。形質転換プレートは、フィルタリフト後、37℃の培養器に戻し、コロニを再生させた。3mlのLBamp液に再精製した陽性物を接種し、37℃で一晩培養した。こうした培地からプラスミドDNAを分離し、プラスミド挿入の配列を決定した。このフィルタ検定では、1mgの基質5−ブロモ−4−クロロ−3−インドリル−β−o−グルコピラノシド(XGLU)(Diagnostic Chemicals Limited又はSigma)を含むバッファZ(下の配合表参照)を使用する。
【0356】
Zバッファ(J・H・ミラー(1992)、A Short Course in Bacterial Genetics, p.445を引用)1リットル当たり
NaHPO−7HO 16.1g
NaHPO−4HO 5.5g
KCl 0.75g
NaHPO−7HO 0.246g
6−メルカプトエタノール 2.7ml
pHを7.0に調整
【0357】
実施例5
ピコプランクトンゲノムDNAの安定した大きな挿入DNAライブラリの構築 細胞収集及びDNAの準備。濃縮ピコプランクトン細胞を含むアガロースプラグは、オレゴン州ニューポート乃至ハワイ州ホノルルの海洋クルーズで採集した試料より準備した。海水(30リットル)をニスキンボトルに収集し、10μm Nitexによりスクリーニングし、30,000MWカットオフポリフルフォンフィルタを通じた中空糸濾過(Amicon DC10)により濃縮した。濃縮したバクテリアプランクトン細胞は、0.22μm、47mm Duraporeフィルタで収集し、1mlの2×STEバッファ(1M NaCl、0.1M EDTA、10mMトリス、pH8.0)に再懸濁し、最終濃度を1ml当たり約1×1010細胞とした。細胞懸濁液は、40℃に冷却した一体積の1%溶融Seaplaque LMPアガロース(FMC)と混合し、直後に1ml注射器に引き込んだ。この注射器は、パラフィルムで密封し、氷上に10分間置いた。細胞含有アガロースプラグを、10mlの溶解バッファ(10mMトリス、pH8.0、50mM NaCl、0.1M EDTA、1%サルコシル、0.2%デオキシコール酸ナトリウム、1mg/mlリゾチーム)に押し出し、37℃で1時間培養した。このアガロースプラグは、その後、40mlのESPバッファ(1%サルコシル、1mg/mlプロテイナーゼK、0.5M EDTA中)に移動させ、55℃で16時間培養した。この溶液をデカントし、新鮮なESPバッファに取り替え、55℃で更に一時間培養した。このアガロースプラグを、次に、50mM EDTA中に入れ、海洋クルーズの期間中、船上において4℃で保存した。
【0358】
オレゴン州沿岸で採集した試料から準備したアガロースプラグ一切片(72μl)を、2mLマイクロ遠心分離管において、1mLのバッファA(100mM NaCl、10mMビストリスプロパン−HCl、100μg/mlアセチル化BSA、25℃でpH7.0)に対して、4℃で一晩透析した。この溶液を、10mM MgCl及び1mM DTTを含む250μlの新鮮なバッファAと取り替え、ロッキングプラットフォーム上において、室温で1時間培養した。次に、この溶液を、4UのSau3A1(NEB)を含む250μlの同じバッファに変え、水槽内において37℃で平衡化し、その後、37℃の培養器内のロッキングプラットフォーム上で45分間培養した。プラグは、1.5mlマイクロ遠心分離管に移動させ、68℃で30分間培養し、酵素を不活性化し、アガロースを溶かした。Gelase及びHK−ホスファターゼ(Epicenture)をそれぞれ使用し、製造業者の推奨に従って、アガロースを消化し、DNAを脱ホスホリル化した。タンパク質は、穏やかなフェノール/クロロホルム抽出により取り除き、DNAは、エタノール沈殿させ、ペレット化し、その後、70%エタノールで洗浄した。この部分消化DNAを、無菌HOに再懸濁させ、pFOS1ベクタとのライゲーションのために濃度を2.5ng/μlにした。
【0359】
いくつかのアガロースプラグからのPCR増幅の成果は、多量の古細菌DNAの存在を示した。オレゴンコースト沖、深さ200mで採集した一試料から抽出したrRNAを使用する定量的ハイブリッド形成実験は、この集合のプランクトン古細菌が全ピコプランクトンのバイオマスの約4.7%を占めることを示した(この試料は、デロングら,Nature, 371:695−698, 1994のTable 1の”PACI”−200mに対応する)。アガロースプラグ溶解物で実行された古細胞バイアス済みrDNA PCR増幅の結果により、この試料における比較的多量の古細菌DNAの存在が確認された。このピコプランクトン試料から準備されたアガロースプラグを、その後のフォスミドライブラリ作成のために選択した。このサイトからの各1mlアガロースプラグは、約7.5×10の細胞を含んでいたため、部分消化DNAの作成に使用された72μlスライスには、約5.4×10の細胞が存在した。
【0360】
ベクタ腕部は、説明の通り、pFOS1から作成した(キムら、Stable propagation of conmid sized human DNA inserts in an F factor based vector, Nucl. Acids Res., 20:10832−10835, 1992)。簡単に言うと、プラスミドを、AstIIにより完全に消化し、HKホスファターゼにより脱ホスホリル化し、その後、BamHIにより消化して二つの腕部を生成し、そのそれぞれが、35乃至45kbpの連結DNAをクローニング及びパッケージングするのに適切な方向性であるcos部位を含む。部分消化ピコプランクトンDNAは、それぞれ25ngのベクタ及び挿入物と1UのT4 DNAリガーゼ(Boehringer−Mannheim)とを含む15μlのライゲーション反応物において、PFOS1腕部に一晩で連結させた。この反応物4マイクロリットルに含まれる連結DNAは、Gigapack XLパッケージングシステム(Stratagene)を使用してin vitroでパッケージし、フォスミド粒子をE.coli株DH10B(BRL)にトランスフェクションし、この細胞をLBcm15プレート状に塗り広げた。結果として生じたフォスミドクローンを、7%グリセロールを補ったLBcm15を含む96ウェルマイクロリットル皿に採取して入れた。約40kbのピコプランクトンDNA挿入物を含む組み換えフォスミドにより、3.552フォスミドクローンのライブラリが生じ、これは約1.4×10塩基対のクローンDNAを含む。検査したすべてのクローンは、38乃至42kbの範囲の挿入物を含んでいた。このライブラリは、その後の検定のために−80℃で冷凍保存した。
【0361】
実施例6
紫外線誘導光産物を使用したランダムサイズポリヌクレオチドの生成
鋳型DNAの1マイクログラム試料は、TT二量体、特にプリン二量体を含む二量体を形成させるために、取得し、紫外線により処理する。紫外線による露光は、鋳型DNA試料で遺伝子ごとにほんの僅かな光産物が生成されるように制限される。多数の試料を、紫外線により、時間の長さを変化させて処理し、紫外線露光による二量体の数が異なる鋳型DNA試料を取得する。
【0362】
非プルーフリーディングポリメラーゼを利用するランダム初回免疫キット(例えば、Stratagene Cloning SystemsのPrime−It II Random Primer Labelingキット)を利用し、紫外線によって(上記の通り)作成された鋳型のランダムな部位で初回免疫を行い、鋳型に沿って伸長することで、様々なサイズのポリヌクレオチドが生成される。Prime−It II Random Primer Labelingキットにおいて説明されるような初回免疫プロトコルは、プライマを伸長するのに利用することができる。紫外線露光によって形成される二量体は、非プルーフリーディングポリメラーゼによる伸長の障害物としての役割を果たす。したがって、ランダムなプライマによる伸長が終了した後には、ランダムなサイズのポリヌクレオチドのプールが存在する。
【0363】
実施例7
ランダムサイズのポリヌクレオチドの分離
例1に従って生成された所定のポリヌクレオチドは、1.5%アガロースゲル状でゲル分離される。100乃至300bpの範囲のポリヌクレオチドを、ゲルから切り取り、三体積の6M Nalをゲル切片に追加する。この混合物を、50℃で10分間培養し、10μlのグラスミルク(Bio 101)を追加する。この混合物を、一分間回転させ、上澄みをデカントする。ペレットを500μlのColumn Washで洗浄し(Column Washは、50%エタノール、10mlトリス−HCl、pH7.5、100mM NaCl、及び2.5mM EDTA)、1分間回転させ、その後、上澄みをデカントする。その後、洗浄、回転、及びデカントのステップを繰り返す。グラスミルクペレットを、20μlのHOに再懸濁し、一分間回転させる。DNAは、水相を維持する。
【0364】
実施例8
分離したランダムサイズの100乃至300bpのポリヌクレオチドのシャッフリング
実施例2において取得された100乃至300bpのポリヌクレオチドは、プライマを追加することなく、アニーリング混合物(0.2mMの各dNTP、2.2mM MgCl、50mM KCl、10mMトリスHCl、pH8.8,0.1% Triton X−100、0.3μ、Taq DNAポリメラーゼ、合計体積50μl)内で組み換える。以下のプログラムによるアニーリングステップに、StratageneのRobocyclerを使用した:95℃30秒、[95℃30秒、50乃至50℃(好ましくは58℃)30秒、及び72℃30秒]を25乃至50サイクル、及び72℃5分間。これにより、100乃至300bpのポリヌクレオチドは、結合し、長い配列を有する二本鎖ポリヌクレオチドを発生させる。再構成した二本鎖ポリヌクレオチドを分離し、変性させて、一本鎖ポリヌクレオチドを形成した後、随意的にサイクリングを再び繰り返し、一部の試料では鋳型としての一本鎖とプライマDNAとを利用し、その他の試料では一本鎖に加えてランダムなプライマを利用する。
【0365】
実施例9
シャッフル済みポリヌクレオチドからのポリヌクレオチドのスクリーニング
実施例3のポリヌクレオチドを分離し、ここからポリヌクレオチドを発現させる。実施例3のシャッフル済みポリヌクレオチドから取得したポリヌクレオチドは、オリジナルの鋳型から得られたポリペプチドの活性に関してスクリーニングし、活性レベルの制御を比較する。スクリーニング中に発見された関心のあるポリヌクレオチドをコーディングするシャッフル済みポリヌクレオチドは、更に、二次的な望ましい形質に関して比較される。関心の少ないスクリーン済みポリヌクレオチドに対応する一部のシャッフル済みポリヌクレオチドには、再びシャッフリングを施す。
【0366】
実施例10
飽和突然変異生成による定方向進化
部位飽和突然変異生成:部位飽和突然変異生成を達成するために、デハロゲナーゼ酵素のすべての残基を、下のように、32重縮退オリゴヌクレオチドプライマを使用した部位指定突然変異生成により、全20種類のアミノ酸に変換した。
【0367】
1. デハロゲナーゼ発現構造の培地を成長させ、プラスミドの作成を行った。
【0368】
プライマは、各コドンをランダム化させ、これらは共通の構造X20NN(G/T)X20を有し、このX20は鋳型と結合する十分な相同性を備えた20塩基配列を表し、NN(G/T)は全20種類のアミノ酸を符号化する32重縮退3塩基配列である。代替の態様において、本発明は、N,N,G/T又は同様なNN(G/T)カセットに加え、全19種類のアミノ酸置換を導入するのに実用的なコドンの任意のセットの使用を提供し、これは(その一部として)32重縮退NN(G/C)カセット、64重縮退NNNカセット、48重NN(A/C/G)カセット、48重NN(A/G/T)カセット、全19アミノ酸置換を導入するのに実用的な19コドンの任意の非縮退セット、及び全19アミノ酸置換を導入するのに実用的な20コドンの任意の非縮退セットを含む。更に別の代替の態様において、本発明は、20種類のアミノ酸のサブセットがコドン位置のセットのそれぞれに導入されることを提供し、こうしたサブセットの例は、グループ化体系に基づくサブセットから選択された(複数の)アミノ酸を含むことが可能であり、このグループ化体系は、非制限的な例証として、以下の8種類のサブセットを有するグループ化体系にすることができる。
【0369】
・芳香族(Phe、Trp、Tyr)
・脂肪族(Gly、Ala、Val、Leu、Ile)
・OH含有(Ser、Tyr、Thr)
・酸性(Asp、Glu、Asn、Gin)
・塩基性(Lys、Arg、His)
・硫黄含有(Met、Cys)
・極性(Ser、Thr、Cys、Asn、Gin、Tyr)
・無極性(Gly、Ala、Vai、Leu、Ile、Met、Phe、Trp、Pro)
【0370】
2. 50ngまでのプラスミド鋳型と、125ngの各プライマと、1×ネイティブPfuバッファと、20umの各dNTPと、2.5UネイティブPfu DNAポリメラーゼとを含む25μlの反応混合物を作成した。
【0371】
3. Robo96 Gradient Cyclerにおいて、次のように反応をサイクルさせた。
【0372】
95℃1時間の初期変性
95℃45秒間、53℃1分、72℃11分を20サイクル
72℃10分の最終延長ステップ
4. この反応混合物を、10UのDpnIにより37℃で1時間消化し、メチル化鋳型DNAを消化した。
【0373】
5. 2ulの反応混合物を使用して、50ulのXL1−Blue MRF細胞を形質転換し、形質転換混合物全体を大きなLB−Amp−Metプレート上で平板培養し、200乃至1000のコロニを作成した。
【0374】
6. 個別のコロニを、LB−Amp−IPTGを含む96ウェルマイクロタイタプレートのウェルに楊枝で入れ、一晩成長させた。
【0375】
7. 翌日、これらのプレートのクローンを検定した。
【0376】
スクリーニング:各位置の突然変異体の約200クローンを、液体培地(384ウェルマイクロタイタプレート)で成長させ、次のようにスクリーニングした。
【0377】
1. 384ウェルプレートにおいて一晩培養したものを、遠心分離し、培地を除去した。各ウェルに0.06mL 1mMトリス/SO 2−、pH7.8を追加した。
【0378】
2. 各親成長プレートからの二枚の検定プレートが、0.02mL細胞懸濁で構成されるようにした。
【0379】
3. 一方の検定プレートを室温で配置し、他方を一定期間(最初は30分間)に渡って高温にした(初期スクリーニングでは55℃を使用)。
【0380】
4. 規定の時間後、0.08mLの室温の基質(1.5mM NaN及び0.1mMブロモチモールブルーを含むTCP飽和1mMトリス/SO 2−、pH7.8)を各ウェルに追加した。
【0381】
5. 620nmでの測定値を様々な時点で取り、各ウェルのプログレス曲線を生成した。
【0382】
6. データを分析し、加熱した細胞と加熱していない細胞のキネティクスを比較した。各プレートは、1乃至2カラム(24ウェル)の非突然変異20F12制御を含んでいた。
【0383】
7. 安定性が向上したと思われるウェルは、再び成長させ、同じ条件でテストした。
【0384】
この手順の後、九種類の単一部位突然変異が酵素に熱安定性の増加を与えたと思われた。この改善を本質的に引き起こした各位置での正確なアミノ酸の変化を判断するために、配列分析を実行した。簡単に言うと、この改善は、七つの部位では一種類のアミノ酸の変化、第八の部位では二種類のアミノ酸の変化それぞれ、第九の部位では三種類のアミノ酸の変化それぞれによって与えられた。その後、いくつかの突然変異を作成し、この突然変異はそれぞれ、これら九種類の有益な部位突然変異のうち複数を組み合わせて有し、そのうち二種類の突然変異は、単一ポイント突然変異のものを含め、他のすべての突然変異よりも優れていることが分かった。
【0385】
実施例11
末端選択を使用したダイレクト発現クローニング
エステラーゼ遺伝子を、標準のPCR反応において、5’リン酸化プライマを使用して増幅した(10ngの鋳型、PCR条件:3分94℃、[1分94℃、1分50℃、1分30秒68℃]×30、10分68℃)。
【0386】
フォワードプライマ=9511TopF(CTAGAAGGGAGGAGAATTACATGAAGCGGCTTTTAGCCC)
リバースプライマ=9511TopR(AGCTAAGGGTCAAGGCCGCACCCGAGG)
結果として生じたPCR産物(約1000bp)は、ゲル精製及び定量化した。
【0387】
発現クローニングのベクタ、pASK3(ドイツ、ゲッチンゲンのInstitut fuer Bioanalytik)は、Xba I及びBgl IIにより切断し、CIPにより脱ホスホリル化した。
【0388】
0.5pmoleのVaccina Topoisomerase(カリフォルニア州カールズバッドのInvitrogen)を、バッファNEB I(マサチューセッツ州ベバリのNew England Biolabs)内の60ng(約0.1pmole)の精製PCR産物に追加し、合計体積5μlとし、5分間37℃にした。このトポゲートしたPCR産物を、ベクタpASK3(5μl、NEBI内で約200ng)でクローニングし、5分間室温にした。この混合物を、HOに対して30分間透析した。DH10B細胞(メリーランド州ゲーサーズバーグのGibco BRL)のエレクトロポレーションに、2μlを使用した。
【0389】
効率性:実際のクローン数に基づき、この方法は、1μgのベクタ当たり2×10クローンを生成可能である。
【0390】
実施例12
デハロゲナーゼの熱安定性
本発明では、定方向進化によって生成される望ましい特性は、厳しい環境と考えられるものを含め、変化した環境に指定の時間に渡って晒された分子の改善された残基活性(例えば、酵素活性、免疫反応性、抗生物質活性、その他)により、限定的な形で例証される。こうした厳しい環境は、以下の任意の組み合わせ(反復性の有無を問わず、及び任意の順序又は順列)を含む場合がある:高温(動作する酵素の変性を引き起こす温度を含む)、低温、高塩度、低塩度、高pH、低pH、高圧、低圧、及び放射源への露出の変化(紫外線放射、可視光線、及び電磁スペクトル全体を含む)。
【0391】
本発明によれば、改善された前記活性等の望ましい特性は、厳しい環境(例えば、高温、低温、高pH、低pH、高塩度、低塩度、有機溶媒の存在の増加、有機溶媒の存在の減少、その他)で特定の期間維持した後の改善された活性(高い活性等)にすることが可能で、定方向進化ステップの適用に続くスクリーニング又は選択ステップに関する選択基準を含むことが可能であり、その一部として、末端選択ベースのステップ、エクソヌクレアーゼ処理ベースのステップ、部位飽和突然変異生成ベースのステップ、又は合成ライゲーション再構成ベースのステップ等がある。
【0392】
本発明の別の態様によれば、改善された前記活性等の望ましい特性は、厳しい環境(例えば、高温、低温、高pH、低pH、高塩度、低塩度、有機溶媒の存在の増加、有機溶媒の存在の減少、その他)に晒し、ここから移動させた後の改善された活性(高い活性等)にすることが可能で、定方向進化ステップの適用に続くスクリーニング又は選択ステップに関する選択基準を含むことが可能であり、その一部として、末端選択ベースのステップ、エクソヌクレアーゼ処理ベースのステップ、部位飽和突然変異生成ベースのステップ、又は合成ライゲーション再構成ベースのステップ等がある。
【0393】
好適な実施形態において、残基活性は、変性条件に晒された後、活性のある三次元形態(オリジナルの三次元形態、オリジナルの三次元形態に類似する三次元形態、或いはオリジナルの三次元形態とは異なる三次元形態を含む)を回復する分子の能力増加から生じる。こうした再び折り重なるための能力は、「変性の可逆性」又は「再生能力」又は「変性−再生の可逆性」と呼ばれる場合があり、本発明による選択パラメータである。
【0394】
次の例は、高温に晒された時に酵素が活性を再生及び又は維持する能力を進化させる定方向進化の適用を示している。デハロゲナーゼ酵素のすべての残基(316)は、32重縮退オリゴヌクレオチドプライマを使用した部位指定突然変異生成により、全20種類のアミノ酸に変換した。この突然変異は、既に比率を改善した変異体Dhla 20F12に導入した。各位置の約200クローンを、スクリーニングするために液体培地(384ウェルマイクロタイタプレート)で成長させた。スクリーニング手順は、次の通りである。
【0395】
1. 384ウェルプレートにおいて一晩培養したものを、遠心分離し、培地を除去した。各ウェルに0.06mL 1mMトリス/SO 2−、pH7.8を追加した。
【0396】
2. ロボットにより、各親成長プレートからの二枚の検定プレートが、0.02mL細胞懸濁で構成されるようにした。
【0397】
3. 一方の検定プレートを室温で配置し、他方を一定期間(最初は30分間)に渡って高温にした(初期スクリーニングでは55℃を使用)。
【0398】
4. 規定の時間後、0.08mLの室温の基質(1.5mM NaN及び0.1mMブロモチモールブルーを含むTCP飽和1mMトリス/SO 2−、pH7.8)を各ウェルに追加した。TCP=トリクロロプロパン。
【0399】
5. 620nmでの測定値を様々な時点で取り、各ウェルのプログレス曲線を生成した。
【0400】
6. データを分析し、加熱した細胞と加熱していない細胞のキネティクスを比較した。各プレートは、1乃至2カラム(24ウェル)の非突然変異20F12制御を含んでいた。
【0401】
7. 安定性が向上したと思われるウェルは、再び成長させ、同じ条件でテストした。
【0402】
この手順の後、九種類の単一部位突然変異がDhla−20F12に熱安定性の増加を与えたと思われた。配列分析では、以下の変化が有益であることが明らかになった。
【0403】
D89G
F91S
T159L
G189Q、G189V
I220L
N238T
W251Y
P302A、P302L、P302S、P302K
P302R/S306R
二つの部位(189及び302)のみが、二つ以上の置換を有した。リストの最初の五つは、(G189Qを使用して)単一の遺伝子へと結合された(この突然変異は「Dhla5」と呼ばれる)。S306Rを除くすべての変化は、Dhla8と呼ばれる別の変異体に組み込まれた。
【0404】
熱安定性は、酵素を一定期間高温(55℃及び80℃)で培養し、30℃で活性検定することで評価した。初速度は、高温での時間と対比させてプロットした。酵素は、培養及び検定の両方で、50mMトリスSO、pH7.8に入れた。産物(Cl)は、Fe(NO及びHgSCNを使用した標準的な方法で検出した。Dhla 20F12を、事実上の野生型として使用した。見かけの半減期(T1/2)は、データを指数減衰関数に適合させることで計算した。
【0405】
55℃でのDhla5デハロゲナーゼの熱安定性。50mMトリスSO 2−、pH7.8内の精製タンパク質を、55℃で、様々な期間にわたって培養し、アリコートを取り出し、トリクロロプロパン(TCP)加水分解に関して検定した。この検定は、50mMトリスSO 2−、pH7.8において、30℃で、10mM TCPにより実行した。産物(Cl)の放出は、標準のCl検定により分析した。初速度(A450/分)は、酵素プログレス曲線から導き、培養時間と対比させてプロットした。このデータは、指数減衰(Cexp−kt)に適合し、ここでt1/2=ln2/kである(図13参照)。
【0406】
Dhla及び20F12の30℃及び55℃での酵素プログレス曲線(図14参照)。この反応は、精製タンパク質を使用して、50mMトリスSO 2−、pH7.8において、10mM TCPにより実行した。各検定において、等量のタンパク質を使用した。産物(Cl)の濃度は、標準のCl検定を使用して、様々な時点で判定した。Dhla 5は、30℃及び55℃の両方で、20F12と同じ特異活性を有すると思われるが、この酵素は、20F12が熱的に不活性となった後も、生成を継続する。
【0407】
80℃でのDhla5デハロゲナーゼの熱安定性。50mMトリスSO 2−、pH7.8内の精製タンパク質を、80℃で、様々な期間にわたって培養し、アリコートを取り出し、トリクロロプロパン(TCP)加水分解に関して検定した。この検定は、50mMトリスSO 2−、pH7.8において、30℃で、10mM TCPにより実行した。産物(Cl)の放出は、標準のCl検定により分析した。初速度(A450/分)は、酵素プログレス曲線から導き、培養時間と対比させてプロットした。このデータは、指数減衰(Cexp−kt)に適合し、ここでt1/2=ln2/kである(図15参照)。
【0408】
80℃でのDhla5及びDhla8の熱安定性。50mMトリスSO 2−、pH7.8内の精製タンパク質を、80℃で、様々な期間にわたって培養し、アリコートを取り出し、トリクロロプロパン(TCP)加水分解に関して検定した。この検定は、50mMトリスSO 2−、pH7.8において、30℃で、10mM TCPにより実行した。産物(Cl)の放出は、標準のCl検定により分析した。初速度(A450/分)は、酵素プログレス曲線から導き、相対速度を培養時間と対比させてプロットした。このデータは、指数減衰(Cexp−kt)に適合し、ここでt1/2=ln2/kであり、Dhla5及びDhla8に関して、それぞれ13及び138分の値を与えた(図16参照)。
【0409】
こうしたデハロゲナーゼ変異体の示唆走査熱量測定は、図17A、B、及びCに表示されている。このデータは、Perkin ElmerのPyris Iを使用し、走査速度10℃/分で記録した。タンパク質濃度は、40μlにおいて10mg/mlである(合計0.4mgのタンパク質)。バッファは、10mM NaP、pH7.5である。データから導かれた溶解温度は、68℃(20F12)、73℃(Dhla5)、及び73℃(Dhla8)。このデータは、更に、20F12が不可逆変性を受けており、Dhla5が部分的に可逆であり、Dhla8が完全に可逆であることを示している(図17参照)。
【0410】
55℃での野生型(20F12)及び突然変異体(Dhla5)デハロゲナーゼの熱安定性。50mMトリスSO 2−、pH7.8内の精製タンパク質を、55℃で、様々な期間にわたって培養し、アリコートを取り出し、トリクロロプロパン(TCP)加水分解に関して検定した。この検定は、50mMトリスSO 2−、pH7.8において、30℃で、10mM TCPにより実行した。産物(Cl)の放出は、標準のCl検定により分析した。初速度(A450/分)は、酵素プログレス曲線から導き、培養時間と対比させてプロットした。このデータは、指数減衰(Cexp−kt)に適合し、ここでt1/2=ln2/kである(図12参照)。
【0411】
上述した教示を踏まえて、本発明の多数の修正及び変形が可能であり、そのため、特許請求の範囲内で、本発明は、詳述したもの以外の態様で実施することができる。以上、本発明をその特定の好適な実施形態に基づき詳細に説明してきたが、修正及び変形は、説明され且つ請求されている発明の趣旨及び範囲内に入るものと理解されよう。
【図面の簡単な説明】
【図1】部位飽和突然変異生成の好適な実施形態を示す図である。
【図2】合成ライゲーション再構成によるキメラ結合の網羅的なセットの生成を示す図である。
【図3A及び図3B】(例えば、合成ライゲーション再構成による)ポリヌクレオチド再構成によって生成された望ましいポリヌクレオチドを選択する(例えば、全長分子の選択を行う)トポイソメラーゼ誘導選択ステップを使用した末端選択の応用を示す図である。
【図4】末端選択技術の様々な態様を示す図である。
【図5】オリジナルの平滑末端DNAの定方向発現クローニングを達成する目的で、当初の平滑末端DNAに「付着末端」を導入するために、酵素N.BstNBlを使用して、「c)定方向発現クローニングを実行すること」のステップが達成される、末端選択技術の特定の態様を示す図である。
【図6】酵素エクソヌクレアーゼIIIの活性を示す図である。アスタリスクは、この酵素がポリヌクレオチド基質の3’方向から5’方向に向けて働くことを示す。
【図7】エクソヌクレアーゼ仲介ポリヌクレオチド再構成における酵素エクソヌクレアーゼIIIの例示的な応用を示す図である。
【図8】多結合核酸鎖の生成を示す図である。
【図9】ヘテロメリック核酸複合体において、アニーリングした核酸鎖の未ハイブリッド形成一本鎖末端から、3’及び5’末端ヌクレオチドを遊離させ、短縮されているがハイブリッド形成された末端を残し、処理済み末端のポリメラーゼベース伸長及び又はリガーゼ仲介ライゲーションを促進する手段としてのエクソヌクレアーゼ処理の使用を示す図である。
【図10】一本のメチル化多結合核酸鎖をアニーリングし、いくつかの非メチル化単結合核酸鎖にする例における、エクソヌクレアーゼ仲介核酸再構成の使用を示す図である。
【図11】複数のメチル化多結合核酸鎖をアニーリングし、いくつかの非メチル化単結合核酸鎖にする例における、エクソヌクレアーゼ仲介核酸再構成の使用を示す図である。
【図12】55℃での野生型(20F12)及び突然変異型(Dhla 5)デハロゲナーゼの熱安定性のグラフを示す図である。
【図13】55℃でのDhla 5デハロゲナーゼの熱安定性のグラフを示す図である。
【図14】30℃及び55℃でのDhla 5及び20F12の酵素プログレス曲線を示す図である。
【図15】80℃でのDhla 5デハロゲナーゼの熱安定性を示す図である。このデータは、t1/2=ln2/kである指数減衰(Cexp−kt)に適合する。
【図16】80℃でのDhla 5及びDhla 8デハロゲナーゼの熱安定性を示す図である。このデータは、Dhla 5及びDhla 8それぞれに関して、13及び138分の値を与えたt1/2=ln2/kである指数減衰(Cexp−kt)に適合する。
【図17】(図17A、図17B、及び図17C)三種類のデハロゲナーゼ変種の示差走査熱量測定を示す図である。このデータは、Perkin Elmer Pyris 1を使用して10℃/分の走査速度で記録された。
【配列表】
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
[0001]
FIELD OF THE INVENTION
The present invention relates to the screening and identification of biologically active molecules, and in particular, to the generation and screening of gene libraries generated from nucleic acids isolated from two or more organisms for biologically active molecules or biological activities.
[0002]
【background】
Most of the currently used bioactive compounds are derived from soil microorganisms. Many microorganisms that live in soil and other complex ecological communities produce various compounds that enhance their ability to survive and reproduce. These compounds are generally considered not essential for the growth of organisms and are synthesized with the help of genes involved in intermediate metabolism. These secondary metabolites, which affect the growth or survival of other organisms, are known as "bioactive" compounds and are a major component of the chemical defense reserve for both microbial and non-microbial organisms. Plays a role. Humans have exploited these compounds and used them as antibiotics, anti-infectives, and other bioactive compounds with activity against a wide range of prokaryotic and eukaryotic pathogens (Burns et al., Proc. Nat. Acad. Sci. USA, 91, 1994).
[0003]
Although there appears to be a large number of available bioactive compounds, modern biomedicine is facing the growth of antibiotic resistant pathogens as one of the biggest challenges. Due to short generation times and the ability to easily exchange genetic information, pathogenic microorganisms are evolving rapidly, spreading resistance mechanisms against virtually any class of complex antibiotics. For example, the virulent strains of the human pathogens Staphylococcus and Streptococcus are currently only treatable with a single antibiotic, vancomycin, and developing resistance to this compound requires only that the resistant Enterococcus species It only transcribes a single gene, vanA (Bateson et al., System. Appl. Microbiol., 12, 1989). Combining the critical need for new antimicrobial compounds with the increasing demand for enzyme inhibitors, immunosuppressants, and anticancer agents, it is easy to see why pharmaceutical companies have stepped up screening microbial samples for bioactive compounds. It becomes clear.
[0004]
The approach currently used to screen microorganisms for new bioactive compounds has largely changed since the field began. Fresh isolates of bacteria, especially Gram-positive strains from the soil environment, are collected and their metabolites are tested for pharmacological activity.
[0005]
There is still a huge amount of biological diversity that has not yet been used as a source of lead compounds. However, currently available methods for screening and generating lead compounds cannot be efficiently applied to such sparse resources. For example, it has been estimated that at least 99% of marine bacterial species cannot survive on laboratory media, and commercial fermentation equipment is not suitable for use in conditions in which such species grow, so such organisms are: It is difficult or impossible to culture for screening or resupply. Reharvesting, growing, improving strains, improving media, and expanding production of drug producing organisms often creates problems in the synthesis and development of lead compounds. Furthermore, the need to interact with certain organisms to synthesize some compounds makes their use extremely difficult in the discovery process. The use of new methods in drug discovery to take advantage of the genetic resources and chemical diversity of the source of compounds that have not yet been used would be highly beneficial.
[0006]
At the heart of modern biology is the presence of genetic information in nucleic acid genomes, and the information embodied in these genomes (ie, genotypes) directs cellular function. This occurs through the expression of various genes in the genome of the organism and the regulation of the expression of these genes. The expression of a gene in a cell or organism determines the physical properties (ie, phenotype) of the cell or organism. This is achieved through the translation of genes into proteins. Determining the biological activity of a protein obtained from an environmental sample can provide useful information about the role of the protein in the environment. In addition, such information will aid in the development of biology, diagnostics, therapeutics, and industrial applications.
[0007]
Thus, the present invention provides a method for accessing this unused biological diversity and rapidly screening for predetermined sequences and activities utilizing recombinant DNA technology. The present invention combines the advantages associated with the ability to rapidly screen for natural compounds with the flexibility and reproducibility provided in working with genetic material of an organism.
[0008]
Summary of the Invention
The present invention provides for rapid screening of samples for a given biological activity or biomolecule. Samples can be derived from a wide range of sources, including, for example, environmental libraries, samples containing more than one organism (such as a mixed population of organisms), and samples from non-cultureable organisms. Includes deep sea vents and others. As described herein, such samples provide a rich source of virgin molecules useful in biology, therapeutics, and industrial applications, which have been characterized prior to the present invention. And difficult and time consuming methods to identify, or have been impossible to identify or characterize.
[0009]
In one embodiment of the invention, the invention comprises screening a library of clones generated by nucleic acids from a mixed population of cells for a particular bioactivity or biomolecule, and having the particular bioactivity or biomolecule. Altering the nucleic acid sequence contained in the clone and comparing the altered biological activity or biomolecule with a specific biological activity or biomolecule, wherein the difference in the biological activity or biomolecule is the effect of the sequence change. And thereby providing a predetermined biological activity or biomolecule, thereby providing a method for obtaining the predetermined biological activity or biomolecule.
[0010]
In another embodiment, the invention comprises screening a library of clones produced by pooled nucleic acids obtained from multiple isolates for a particular biological activity or biomolecule, and comprising the particular biological activity or biomolecule. Identifying the clone provides a method for identifying a given biological activity or biomolecule.
[0011]
In yet another embodiment, the invention provides a method for identifying a given biological activity or biomolecule. The method comprises the steps of screening a library of clones generated by pooled nucleic acids obtained from the plurality of isolates for a particular biological activity or biomolecule, and the nucleic acid sequence contained in the clone having the particular biological activity or biomolecule. And comparing the altered biological activity or biomolecule to a particular biological activity or biomolecule, wherein in the comparison the difference in the biological activity or biomolecules has introduced at least one sequence change. Indicating an effect, thereby providing a predetermined biological activity or biomolecule.
[0012]
In another embodiment, the invention provides a method of identifying a given biological activity or biomolecule, the method comprising, for a particular biological activity or biomolecule, a nucleic acid obtained from each of the plurality of isolates. Screening a library of clones generated by pooling the generated individual gene libraries, and identifying clones containing a particular biological activity or biomolecule.
[0013]
In another embodiment, the invention provides for screening a library for a particular biological activity or biomolecule, wherein the library pools individual gene libraries produced by nucleic acids obtained from each of a plurality of isolates. And the step of causing a change in the nucleic acid sequence contained in the clone having the specific biological activity or biomolecule, comparing the altered biological activity or biomolecule with the specific biological activity or biomolecule, In this comparison, the difference in bioactivity or biomolecule indicates the effect of introducing at least one sequence change, thereby providing a given bioactivity or biomolecule, thereby providing a given bioactivity or biomolecule. The present invention provides a method for identifying
[0014]
In yet another embodiment, the present invention provides a method of identifying a given biological activity or biomolecule, wherein the method is provided by a nucleic acid from an enriched population of organisms for a particular biological activity and biomolecule. Screening a library of clones and identifying clones containing a particular biological activity or biomolecule.
[0015]
In yet another embodiment, the invention includes screening a library of clones generated by nucleic acids from an enriched population of organisms for a particular biological activity or biomolecule; Altering the nucleic acid sequence comprising the clone and comparing the altered biological activity or biomolecule to a particular biological activity or biomolecule, wherein the difference in the biological activity or biomolecule is at least one sequence change. Providing a predetermined biological activity or biomolecule, thereby providing a method of identifying the predetermined biological activity or biomolecule.
[0016]
In another embodiment, the invention provides a method for identifying a given biological activity or molecule. The predetermined biological activity or biomolecule comprises a complementary sequence of a nucleic acid from a mixed population of organisms, together with at least one oligonucleotide probe having a detectable molecule and at least a portion of the nucleic acid sequence encoding the predetermined molecule. Culturing under conditions that permit interaction and identifying a nucleic acid sequence that has a complement to the oligonucleotide probe using an analyzer that detects the detectable molecule. Thereafter, a library is generated from the identified nucleic acid sequences, and the library is screened for a particular biological activity or biomolecule. A nucleic acid sequence contained in a clone having a specific biological activity or biomolecule is altered, and the altered biological activity or biomolecule is compared with the specific biological activity or biomolecule. A molecular difference indicates the effect of introducing at least one sequence change, which provides a given biological activity or biomolecule.
[0017]
In another embodiment, the present invention relates to the use of a nucleic acid obtained from a mixed population of organisms in a microenvironment with at least one oligonucleotide probe having a detectable molecule and at least one nucleic acid sequence encoding a given molecule. Co-encapsulating over such a time period and separating the encapsulated nucleic acid with an analyzer that detects detectable molecules, under conditions that allow interaction of the complementary sequences, in part. In identifying an encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule, generating a library from the separated encapsulated nucleic acid, and converting the library to a specific biological activity or biomolecule. Screening for clones having a particular biological activity or biomolecule. Altering the nucleic acid sequence and comparing the altered biological activity or biomolecule with a particular biological activity or biomolecule, wherein the difference in the biological activity or biomolecule results in at least one sequence change. Indicating the effect of the introduction and thereby providing a predetermined biological activity or biomolecule, thereby providing a method of identifying the predetermined biological activity or biomolecule.
[0018]
In yet another embodiment, the present invention relates to a method for detecting, in a microenvironment, a nucleic acid obtained from a segregate of a mixed population of organisms with at least one oligonucleotide probe having a detectable marker and a molecule having a predetermined biological activity. Co-encapsulating over such a time period and detecting a detectable marker under conditions that allow interaction of the complementary sequence with at least a portion of the polynucleotide sequence encoding Separating the encapsulated nucleic acid by an analyzer to identify an encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule, and generating a library from the separated encapsulated nucleic acid, Screening the library for a particular biological activity or biomolecule; Altering a nucleic acid sequence contained in a clone having a defined biological activity or biomolecule; comparing the altered biological activity or biomolecule with a specific biological activity or biomolecule; Indicating that the difference in the biomolecules has introduced at least one sequence change, whereby a given biological activity or biomolecule is provided.
[0019]
In another embodiment, the present invention provides a method for detecting, in a microenvironment, nucleic acids obtained from one or more isolates of a mixed population of organisms with at least one oligonucleotide probe having a detectable marker and a predetermined biological activity. Co-encapsulating with a polynucleotide sequence encoding a molecule having at least a portion thereof over such a time under conditions that allow interaction of the complementary sequence, and a detectable marker Isolating the encapsulated nucleic acid by an analyzer that detects the nucleic acid, thereby identifying an encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule, and generating a library from the separated encapsulated nucleic acid. And screening the library for specific biological activities or biomolecules. And altering the nucleic acid sequence contained in the clone having the specific biological activity or biomolecule; and comparing the altered biological activity or biomolecule with the specific biological activity or biomolecule; A step of obtaining a given biological activity or biomolecule by the step of providing a given biological activity or biomolecule, wherein the difference in activity or biomolecule indicates the effect of introducing at least one sequence change. provide.
[0020]
In yet another embodiment, the invention provides a method for identifying a given biological activity or biomolecule. The method comprises, in a microenvironment, converting a nucleic acid obtained from a mixture of isolates of a mixed population of organisms into at least one oligonucleotide probe having a detectable marker and a polynucleotide encoding a molecule having a predetermined biological activity. Co-encapsulating over such a time period under such conditions that the interaction of the complementary sequence with at least a portion of the nucleotide sequence is possible, and the nucleic acid encapsulated by the analyzer to detect a detectable marker Identifying an encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule, generating a library from the separated encapsulated nucleic acid, and converting the library to a specific organism. Screening for activity or biomolecules; and Altering a nucleic acid sequence contained in a clone having a biomolecule, and comparing the altered bioactivity or biomolecule with a particular bioactivity or biomolecule; Indicating the effect of introducing at least one sequence change, thereby providing a predetermined biological activity or biomolecule.
[0021]
These and other aspects of the invention will be apparent to those skilled in the art from the teachings herein.
[0022]
The present invention provides for rapid screening of libraries derived from two or more organisms, such as, for example, an environmental sample or a non-cultured population of organisms or a mixed population of organisms from a cultured population of organisms.
[0023]
In one embodiment, the gene library is obtained by obtaining the nucleic acid from a mixed population of organisms and cloning the nucleic acid into a suitable vector to transform a plurality of clones to generate the gene library. Generated. Thus, a gene library contains genes or gene fragments present in a mixed population of organisms. The gene library can be an expression library, in which case the library can be screened for expressed polypeptides having the desired activity. Alternatively, the gene library can be screened for a given sequence, for example, by PCR or hybridization screening.
[0024]
In one embodiment, nucleic acids from a sample isolate comprising a mixed population of organisms are pooled, and the pooled nucleic acids are used to generate a gene library.
[0025]
"Isolate" means that a specific species, genus, family, order, or class of an organism has been obtained or withdrawn from a sample having more than one organism or from a mixed population of organisms Means that. Nucleic acids from such segregated populations can then be used to generate gene libraries. Isolates can be obtained from samples containing two or more organisms or a mixed population of organisms by selective filtering or culturing. For example, bacterial isolates can be used to filter a sample with a filter that excludes organisms based on size, or to cultivate the sample on a medium that allows for selective growth or selective inhibition of a particular population of organisms. Can be obtained.
[0026]
An “enriched population” is an organism population in which the percentage of organisms belonging to a particular species, genus, family, order, or class of organisms relative to the entire population is increasing. For example, selective growth or inhibition media can increase the overall number of organisms. Prokaryotes can be enriched for the total number of organisms in the population. Similarly, growing a mixed population on a selective medium that inhibits or promotes the growth of a small population within the mixed population can enrich a particular species, genus, family, order, or class of organisms. .
[0027]
In another embodiment, nucleic acids from multiple (eg, two or more) isolates from a mixed population of organisms are used to generate a plurality of gene libraries, including a plurality of clones, wherein the at least two The gene libraries from the isolates are then pooled to obtain a “pooled isolate library”.
[0028]
After the gene library has been generated, the clones can be of a defined biological activity (eg, enzymatic activity, second messenger activity, binding activity, transcriptional activity, etc.) or biomolecule (eg, nucleic acid sequence, peptide, polypeptide, lipid or Other small molecules, etc.). Such screening techniques can be used, for example, to convert a clone, population of clones, or population of nucleic acid sequences to a substrate or substrates having a detectable molecule that provides a detectable signal upon interaction with a predetermined biological activity or biomolecule. Including contacting. The substrate can be an enzyme substrate, a bioactive molecule, an oligonucleotide, and others.
[0029]
In one embodiment, a gene library is generated and the clone is exposed to a predetermined chromogenic or fluorescent substrate or substrates, or a labeled probe having a sequence corresponding to the predetermined sequence (oligo with detectable molecule). A positive clone is identified by a detectable signal (such as fluorescence).
[0030]
In one embodiment, an expression library generated from a mixed population of organisms is screened for a predetermined activity. Specifically, an expression library is generated, the clones are exposed to a predetermined substrate or substrates, and positive clones are identified and separated. In the present invention, cells need not survive. The cells must survive long enough to produce the molecule to be detected, and then either live or non-viable cells, as long as the expressed biomolecules (such as enzymes) remain active. There may be.
[0031]
In certain embodiments, the present invention relates to the direct cloning of genes encoding new or desired biological activities from environmental samples into high-throughput screening systems designed to rapidly discover new molecules, such as enzymes. Provide a combined approach. This approach is described in E. based on the construction of an environmental "expression library" capable of representing the population genome of a large number of naturally occurring microorganisms stored in cloning vectors that can be propagated in E. coli or other suitable host cells. This library is not limited to the small fraction of prokaryotes that can be grown in pure culture, since cloned DNA can be initially extracted directly from environmental samples or from isolates of environmental samples. In addition, by averaging the environmental DNA present in such a sample, it is possible to more evenly represent DNA from all species present in the sample. The averaging technique (described below) dramatically increases the efficiency of finding interesting genes from trace components of a sample, which may have orders of magnitude less than the dominant species in the sample. Averaging can be performed subsequent to obtaining the nucleic acid from the sample or substrate (s) in any of the above embodiments.
[0032]
In another embodiment, the present invention evaluates a large number of clones and identifies and recovers cells encoding useful enzymes and other biomolecules (such as ligands). Provide a throughput capillary array system. In particular, the capillary array-based approach described herein can be used to screen, identify, and recover proteins with the desired biological activity or other ligands with the desired binding affinity. For example, a binding assay can be performed using a suitable substrate or other marker that generates a detectable signal upon the occurrence of a desired binding event.
[0033]
In addition, fluorescently active cell sorting can be used to screen and isolate clones having a given activity or sequence. Heretofore, FACS devices have been used in research centered on the analysis of eukaryotic and prokaryotic cell lines and cell culture processes. FACS has also been used to monitor the production of foreign proteins in both eukaryotes and prokaryotes to be studied, eg, differential gene expression and the like. The detection and counting functions of the FACS system have been applied in such instances. However, FACS has not been used in discovery processes to screen and recover biological activity in prokaryotes. Furthermore, in the present invention, the desired nucleic acid (recombinant clone) can be obtained from live or dead cells, so that the cells do not need to survive as in the previously described techniques. The cells need only survive long enough to produce the compound to be detected, and thereafter, either live or non-viable cells, as long as the expressed biomolecule remains active. May be. The present invention further relates to E.C. It solves the problems that would be associated with the detection and selection of E. coli expressed recombinant enzymes and the recovery of the encoding nucleic acid. In addition, the present invention includes in its embodiment any device capable of detecting a fluorescent wavelength associated with a biological material, such a device being defined herein as a fluorescence analyzer (FACS device as an example).
[0034]
It is also desirable to identify nucleic acid sequences from a mixed population, segregant, or enriched population of organisms. In this embodiment, there is no need to express the gene product. A given nucleic acid sequence can be identified or "biopanned" by contacting a clone, device (such as a gene chip), filter, or nucleic acid sample with a probe labeled with a detectable molecule. Probes usually have a sequence that is substantially identical to the given nucleic acid sequence. Alternatively, the probe will be a fragment-length or full-length nucleic acid sequence encoding a given polypeptide. The probe and the nucleic acid are cultured for such a time under conditions that allow hybridization of the probe to a substantially complementary sequence. The stringency of hybridization varies, for example, with probe length and GC content. These factors can be determined empirically (e.g., Sambrook et al., Molecular Cloning--A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, 1989, and Current Protocols, Inc., Columbia, Canada). (See Current Protocols, Green Publishing Associates, Inc., Joint Venture with John Wiley & Sons, Inc, Latest Supplement). After hybridization, the complementary sequence can be PCR amplified, identified by hybridization techniques (eg, exposing the probe and nucleic acid mixture to a film), or the nucleic acid can be detected using a chip.
[0035]
Prior to the present invention, the evaluation of complex gene or environmental expression libraries was rate-limited. The present invention allows for the rapid screening of complex environmental libraries, including, for example, genomic sequences from thousands of organisms or subsets and isolates. The advantages of the present invention can be seen, for example, in screening complex environmental samples. Screening complex samples has previously required the use of labor intensive methods to screen millions of clones to cover genomic diversity. The present invention means an extremely high-throughput screening method capable of evaluating such a huge number of clones. The disclosed method allows for the optional screening of about 30 million to about 200 million clones per hour for a given desired nucleic acid sequence, biological activity, or biomolecule. This allows full screening of environmental libraries for new biological activities or biomolecules of clonal expression.
[0036]
After identifying a given sequence or biological activity (eg, a given enzyme), modifying the amino acid sequence by developing, mutating, or inducing a sequence or polynucleotide encoding the given biological activity; For example, a modifying activity such as increased thermostability, specificity, or activity can be provided.
[0037]
“Amino acid” includes a hydrogen atom at the central carbon atom (α-carbon atom), a carboxylic acid group (the carbon atom therein is referred to as a “carboxyl carbon atom”), and an amino group (nitrogen atom therein). Atoms are referred to as “amino nitrogen atom” in the present specification) and a side chain group R. When incorporated into a peptide, polypeptide, or protein, an amino acid loses one or more atoms at the carboxyl group of the amino acid in a dehydration reaction linking one amino acid to another. As a result, when incorporated into a protein, the amino acids will be referred to as "amino acid residues."
[0038]
“Protein” or “polypeptide” refers to any polymer of two or more individual amino acids, whether or not naturally occurring, linked via peptide bonds, and one amino acid (or amino acid residue) This occurs when the carboxyl carbon atom of the carboxylic acid group bonded to the α-carbon atom of the above) is covalently bonded to the amino nitrogen atom of the amino group bonded to the α-carbon atom of the adjacent amino acid. The term "protein" is understood to include within its meaning the terms "polypeptide" and "peptide", which may be used interchangeably herein. In addition, proteins containing multiple polypeptide subunits (eg, DNA polymerase III, RNA polymerase II) or other components (eg, RNA molecules as occurs in telomerase) are also used herein as “proteins”. It is understood to be included in the meaning of "." Similarly, fragments of proteins and polypeptides fall within the scope of the invention and may be referred to herein as "proteins."
[0039]
The specific amino acid sequence of a given protein (ie, the "primary structure" of a polypeptide when writing the amino to carboxy termini) is determined by the nucleotide sequence of the encoded portion of the mRNA, which in turn comprises the genetic information, Usually specified by genomic DNA (including organelle DNA such as mitochondrial or chloroplast DNA). Thus, determining the sequence of a gene helps predict the primary structure of the corresponding polypeptide, and more particularly, the role or activity of the polypeptide or protein encoded by the gene or polynucleotide sequence.
[0040]
The terms "isolated" or "purified" when referring to a nucleic acid sequence or a polypeptide sequence, respectively, mean that they have been altered from their natural states "by the hand of man"; If it does, it has changed or moved from the original environment, or both. For example, naturally occurring polynucleotides or polypeptides that are naturally present in existing extant animals, biological samples, or environmental samples in their natural state are not "isolated" or "purified," The same polynucleotide or polypeptide that has been cleaved from is "separated" or "purified" as the term is used herein. Such polynucleotides, when introduced into a culture or whole intact host cell, are different from the naturally occurring form or environment and, as a term used herein, will still be isolated. . Similarly, when polynucleotides and polypeptides are generated in a composition, such as a medium composition (eg, a solution for introducing a polynucleotide or polypeptide into a cell or composition, or a solution for a chemical or enzymatic reaction). There is.
[0041]
"Polynucleotide" or "nucleic acid sequence" refers to a polymerized form of a nucleotide. Polynucleotide also refers to a sequence that is not directly contiguous with any of the immediately contiguous coding sequences (one at the 5 'end and one at the 3' end) in the naturally occurring genome of the organism from which it is derived. Thus, the term is used to describe, for example, a recombinant DNA incorporated into a vector, a self-replicating plasmid or virus, or a procaryotic or eukaryotic genomic DNA, or a separate molecule independent of other sequences (such as a cDNA). As well as recombinant DNA that exists as The nucleotides of the present invention can be ribonucleotides, deoxyribonucleotides, or modified forms of either nucleotide. Polynucleotides, as used herein, include, in particular, single- and double-stranded DNA, DNA that is a mixture of single- and double-stranded regions, single- and double-stranded RNA, Includes RNA, which is a mixture of single-stranded and double-stranded regions, and DNA and RNA, which may be single-stranded, or more generally, double-stranded, or a mixture of single- and double-stranded regions Hybrid molecule.
[0042]
In addition, polynucleotide, as used herein, refers to triple-stranded regions comprising RNA or DNA or both RNA and DNA. The chains in these regions can be from the same molecule or from different molecules. This region can include all of one or more of the molecules, but more generally includes only one region of some of the molecules. One of the molecules of the triple helix region is often an oligonucleotide. The term polynucleotide encompasses genomic DNA or RNA (varies depending on the organism, ie the viral RNA genome), as well as mRNA and cDNA encoded by the genomic DNA.
[0043]
As noted above, there is currently a need in the biology and chemical industry for molecules (such as enzymes) that can optimally perform biological or chemical processes. For example, molecules and compounds utilized in conventional and emerging chemical, pharmaceutical, fiber, food and sample, and potential markets must meet stringent economic and environmental standards. The synthesis of polymers, pharmaceuticals, natural products, and pesticides creates harmful by-products and is often hampered by expensive processes where poor quality or inefficient catalysis is problematic. For example, enzymes have a number of remarkable advantages that can overcome these catalysis problems, acting on a single functional group, identifying similar functional groups on a single molecule, and enantiomers. Identify. In addition, enzymes are biodegradable and function in very small mole fractions in the reaction mixture. Due to their chemical, region and stereospecificity, enzymes offer a unique opportunity to properly achieve the desired selective transformation. Enzymes are often very difficult to replicate chemically, especially in single-step reactions. The elimination of the need for protecting groups, selectivity, and the ability to perform multi-step transformations in a single reaction vessel have led to an increased demand for enzymes in the chemical and pharmaceutical industries, with the attendant reduced environmental burden. Enzymatic processes are gradually replacing many conventional chemical methods. A major cause of the current limited use in a wider industry is the relatively small number of commercially available enzymes. Of the over 3000 non-DNA amplifying enzyme activities described so far, only up to 300 enzymes (excluding DNA amplifying enzymes) are currently commercially available.
[0044]
The use of enzymes in technical applications also requires performance under demanding industrial conditions. This includes activities in environments or on substrates where the stock of currently known enzymes is not evolutionarily selected. However, the natural environment offers extreme conditions, including, for example, extreme temperatures and pH. Many organisms have adapted to such conditions, such as by selecting polypeptides to be able to withstand such extreme conditions.
[0045]
Enzymes have evolved under the conditions of temperature, pH, and salt concentration due to selective pressures that perform very specific functions in the environment of living organisms. Most of the non-DNA modifying enzyme activities identified to date have been isolated from mesophilic organisms, representing a very small part of the available phylogenetic diversity. The dynamic field of biocatalysis is entering a new dimension with the help of enzymes isolated from microorganisms that thrive in extreme environments. For example, such enzymes may be in excess of 100 ° C. in hot springs and hot water vents on land and below 0 ° C. in polar waters, in the Dead Sea's saturated salt environment, in coal reserves and in geothermal sulfur. It must function at pH values near zero in spring water or greater than 11 in sewage sludge. For example, environmental samples obtained from extreme conditions including organisms, polynucleotides, or polypeptides (such as enzymes) open up a new field of biocatalysis. By rapidly screening for polynucleotides encoding a given polypeptide, the present invention provides a source of materials that will develop enzymes for biology, therapeutics, and industrial use, as well as specific activities, specificities, Or to provide new substances for further processing, for example by directed evolution and mutagenesis, in order to develop molecules or polypeptides that modify for the conditions.
[0046]
In addition to the need for new enzymes for use in the industry, the need for bioactive compounds with new activities has increased dramatically. This demand stems primarily from changes in global demographics coupled with a clear and growing trend in a number of pathogens that are resistant to currently available antibiotics. For example, in emerging nations with a young population, demand for antimicrobial drugs has surged, while in aging countries, such as the United States, the need to increase the repertoire of drugs for cancer, diabetes, arthritis, and other debilitating conditions There is. Infectious disease mortality has increased 58% between 1980 and 1992, and the emergence of antibiotic-resistant bacteria is estimated to add more than $ 30 billion annually to health care costs in the United States alone ( Adams et al., Chemical and Engineering News, 1995; Amman et al., Microbiological Reviews, 59, 1995). In response to this trend, pharmaceutical companies have greatly increased the screening of bacterial diversity for compounds with unique activities or specificities. Accordingly, the present invention can be used to obtain and identify information unique to polynucleotides and related sequences, for example, from infectious microorganisms present in the environment such as the digestive tract of various microorganisms.
[0047]
Identifying new enzymes in environmental samples is one solution to these problems. By rapidly identifying polypeptides having a given activity and polynucleotides encoding a given polypeptide, the present invention helps develop compositions for biology, diagnostics, therapeutics, and industrial applications. Methods, compositions, and sauces are provided.
[0048]
The methods and compositions of the present invention provide for the identification of a lead compound of a drug present in an environmental sample. The methods of the invention provide the ability to delve into the environment for new drugs or to identify related drugs contained in different microorganisms. There are several common sources of lead compounds (drug candidates), including natural products, such as nucleotides, peptides, or other polymeric molecules that have been identified or developed as a result of delving into the environment. A set, a set of synthetic chemicals, and a synthetic combined chemicals library are included. Each of these sources has advantages and disadvantages. The success of these candidate screening programs is largely determined by the number of compounds in the program, and pharmaceutical companies are looking to pioneer the search for a vast number of synthetic and natural compounds that have been screened out of date. There is a need to. Unfortunately, the ratio of new compounds to compounds discovered in the past has decreased over time. The discovery rate of new lead compounds has not kept up with demand, despite the best efforts of pharmaceutical companies. There is a strong need to access new sources of potential drug candidates. Thus, the present invention provides a rapid and efficient method for identifying and characterizing environmental samples containing new drug compounds.
[0049]
Most of the currently used bioactive compounds are derived from soil microorganisms. These compounds are generally considered not essential for microbial growth and are called "secondary metabolites" because they are synthesized with the help of genes involved in intermediate metabolism. Secondary metabolites that affect the growth or survival of other organisms are known as "bioactive" compounds and play a role as a major component of chemical defense reserves for both microbial and non-microscopic organisms. Fulfill. About 6,000 bioactive compounds of microbial origin have been characterized, of which more than 60% are produced by Gram-positive soil bacteria of the genus Streptomyces (Barnes et al., Proc. Nat. Acad. Sci. U.S.A.). SA, 91, 1994). Of these, at least 70 are currently used in biomedical and agricultural applications. Polyketides, the largest class of bioactive compounds, include a wide range of antibiotics, immunosuppressants, and anticancer agents, for a combined turnover of $ 5 billion annually.
[0050]
The present invention provides a method for identifying a nucleic acid sequence encoding a polypeptide having a known or unknown function. For example, much of the diversity in microbial genomes results from rearrangements of genes in the microbial genome. These genes may exist across species or may be systematically related to other organisms.
[0051]
For example, bacteria and many eukaryotes have a coordinated mechanism for regulatory genes whose products are involved in related processes. These genes assemble on a single chromosome, form a structure called "genes," and are transcribed together under the control of a single regulatory sequence that contains a single promoter that initiates transcription of the entire cluster. . Genes, promoters, and auxiliary sequences that function in regulation are collectively referred to as "operons" and can include 20 or more genes, and typically include 2 to 6 genes. Thus, a group of genes is a group of adjacent genes that are usually identical or related in terms of their function.
[0052]
Some gene families are composed of identical components. Although the genes to be grouped need not necessarily be identical, grouping is a prerequisite for maintaining identity between the genes. Genes range from extremes, where duplications to adjacent related genes are generated, to cases where hundreds of identical genes are present in tandem sequence. In some cases, no meaning can be found for a particular gene repeat. A prime example of this is the expressed replicative insulin gene in some species, while a single insulin gene is sufficient in other mammalian species.
[0053]
In addition, the ability of genes to form heterogeneous libraries of genes, for example, from bacteria and other prokaryotic sources, e.g., from bacterial and other prokaryotic sources, can result in the synthesis of polyketides with a vast number of active activities, for example. Is of value in determining the source of new proteins, particularly including enzymes such as polyketide synthases that cause For example, polyketides are molecules that are extremely abundant sources of biological activity, including antibiotics (such as tetracycline and erythromycin), anticancer drugs (daunomycin), immunosuppressants (FK506 and rapamycin), and veterinary products (monensin). And Many polyketides (produced by polyketide synthases) are valuable as therapeutic agents. Polyketide synthases are multifunctional enzymes that catalyze the biosynthesis of various carbon chains that differ in length, function, and pattern of reduction. Polyketide synthase genes are categorized into genes, and at least one type of polyketide synthase (designated as Type I) has large size genes and enzymes, genetic manipulation and the incorporation of such genes / proteins. In vitro research is complicated. Other types of proteins that are the product (s) of a group of genes are also contemplated, including, for example, regulatory proteins such as antibiotics, antivirals, antitumor agents, and insulin.
[0054]
The ability to select and combine desired components from a library of polyketide and post-polyketide biosynthetic genes to generate new polyketides for research is attractive. The method (s) of the present invention make this possible, allowing the generation of gene banks with clones containing large insertions (especially when using factor F-based vectors), which is the cloning of genes. To facilitate the cloning of new polyketide synthases and other genes.
[0055]
For example, the genes can be linked to a vector containing an expression control sequence capable of controlling and regulating the production of a detectable protein or protein-related sequence activity from the linked genes. The use of vectors having a very high capacity for the introduction of exogenous nucleic acids is particularly suitable for use with such a group of genes; E. coli F factor (or fertility factor) is explained. This E. The E. coli F factor is a plasmid that affects its own high frequency transmission during conjugation and is ideal for completing large nucleic acid fragments, such as genes from mixed microbial samples, and performing stable propagation.
[0056]
Nucleic acids isolated or extracted from such a sample (such as a mixed population of microorganisms) or isolates thereof can be inserted into a vector or plasmid prior to polynucleotide screening. Such vectors or plasmids usually contain expression control sequences, including promoters, enhancers, and others.
[0057]
Accordingly, the present invention provides a new system for cloning and screening a mixed population of microbial enriched samples or isolates thereof in vitro for a polynucleotide encoding a molecule having a predetermined activity, ie, a predetermined enzymatic and biological activity. I will provide a. The method (s) of the present invention allow for the cloning and discovery of new bioactive molecules in vitro, especially new bioactive molecules derived from uncultured or cultured samples. The method (s) of the invention can be used to clone, sequence, and screen large groups of genes, genes, and gene fragments. Unlike previous approaches, the method (s) of the present invention clone, screen, and identify polynucleotides and polypeptides encoded by such polynucleotides in vitro from a wide range of environmental samples. be able to.
[0058]
In the present invention, a polynucleotide sequence can be screened and identified from a complex environmental sample, its concentrated sample, or its isolate. A gene library can be generated from a cell-free sample, as long as the sample contains a nucleic acid sequence, or can be generated from a sample that contains cells, cellular materials, or viral particles. Organisms from which libraries can be created include prokaryotic microorganisms such as Eubacteria and Archaebacteria, and lower eukaryotic microorganisms such as fungi, algae, and protozoa, as well as mixed populations of plants, plant spores, and pollen. . Such organisms can be cultured organisms or uncultured organisms obtained from environmental samples, and can be used in extreme environmental microorganisms such as thermophilic, hyperthermophilic, cold and psychrotrophic organisms. including.
[0059]
Sources of nucleic acids used to generate DNA libraries can be obtained from environmental samples, including, in part, Arctic and Antarctic ice, sea and permafrost sources, Microbial samples obtained from materials of volcanic origin, materials from tropical soil or plant sources, and feces of various organisms, including mammals and invertebrates, as well as microbial samples obtained from minerals, spoils, etc. Is included. The nucleic acids used to generate the gene library can be obtained, for example, from a concentrated subpopulation or isolate of a sample. In another embodiment, DNA from multiple isolates can be pooled to form a source of nucleic acids for generating a library. Alternatively, the nucleic acid can be obtained from multiple isolates and multiple gene libraries generated from multiple isolates to include multiple gene libraries. A pool separation library can be obtained by pooling or combining two or more gene libraries. Thus, for example, nucleic acids can be recovered from cultured or uncultured organisms, generate appropriate gene libraries (such as recombinant expression libraries), and determine the identity of certain biomolecules (polynucleotides). Sequence, etc.) can then be used to determine or be screened for a given biological activity (such as an enzyme or biological activity).
[0060]
The following outlines a general procedure for generating a library from both cultured and uncultured organisms, enriched populations, and mixed populations of organisms and their isolates, By performing a survey, sequence, or screening, a nucleic acid sequence having a confirmed, desired, or predicted biological activity (such as an enzymatic activity) can be selected therefrom. Further evolution, mutagenesis, or induction is possible.
[0061]
An environmental sample, as used herein, is any sample that contains an organism or polynucleotide or a combination thereof. Thus, environmental samples can be obtained from any number of sources (as described above), including, for example, insect dung, hot springs, soil, and others. Any source of nucleic acid, in purified or unpurified form, can be utilized as starting material. Thus, nucleic acids can be obtained from any source contaminated by the organism or from any sample, including cells. The environmental sample can be an extract from any biological sample, such as blood, urine, spinal fluid, tissue, vaginal swabs, stool, amniotic fluid, or buccal mouthwash of any mammalian organism. For a non-mammalian (eg, invertebrate) organism, the sample can be a tissue sample, a saliva sample, a stool sample, or a substance in the gastrointestinal tract of the organism. Environmental samples further include samples obtained from extreme environments, including, for example, hot sulfur pools, conduits, and frozen tundra. Samples can be obtained from various sources. For example, in horticultural and agricultural tests, the sample can be a plant, fertilizer, soil, liquid, or other horticultural and agricultural products, and in a food test, the sample can be a fresh or processed food (eg, Specialty milk powder, marine products, fresh agricultural products, and packaged foods), and in environmental tests, the samples are judged or assumed to include liquids, soil, sewage treatment, sludge, and organisms or polynucleotides. It can be any other sample in the environment.
[0062]
If the sample is a mixture of substances comprising a mixed population of organisms, e.g., blood, soil, or sludge, treating with a suitable reagent that is effective to open cells and expose or separate nucleic acid strands Can be. Although not required, this lysis and nucleic acid denaturation step results in cloning, amplification, or sequence occurring more rapidly. In addition, if desired, a particular population or desired isolate (eg, a isolate of a particular species, genus, or family of organisms) may be purified or concentrated, and thus mixed to obtain a low-impurity sample. The population can be cultured prior to analysis. However, this is not required. For example, culturing the organism in the sample includes culturing the organism in the microdroplet, and separating the cultured microdroplet into individual wells of a multi-well tissue culture plate by using a cell sorter. May be included. Alternatively, the sample can be cultured in any number of selective media compositions designed to inhibit or promote the growth of a particular small population of organisms.
[0063]
If the isolate is from a sample that contains a mixed population of organisms, the nucleic acid can be obtained from the isolate as described below. The nucleic acids obtained from this isolate can be used to generate a gene library or, alternatively, can be pooled with other separated fragments of the sample, in which case the pooled nucleic acids Is used to generate a gene library. The isolate can be cultured prior to nucleic acid extraction or can be uncultivated. The method of separating a particular population of organisms is performed in a mixed population.
[0064]
Thus, the sample includes, for example, nucleic acids from a diverse mixed population of organisms (such as microorganisms present in the digestive tract of insects). Nucleic acids are separated from a sample using any number of methods that separate DNA and RNA. Such nucleic acid separation methods are commonly practiced in the art. If the nucleic acid is RNA, the RNA can be reverse transcribed into DNA using primers known in the art. If the DNA is genomic DNA, the DNA can be sheared using, for example, a 25 gauge needle.
[0065]
The nucleic acid can be cloned in a suitable vector. The vector used will be determined by whether to express, amplify, or manipulate the DNA in any number of ways known in the art (eg, US Pat. No. 6,022,716). Cloning techniques are known in the art and can be constructed by one of ordinary skill in the art without undue explanation. The choice of vector will also depend on the size of the host cell and the polynucleotide sequence utilized in the methods of the invention. Thus, the vectors used in the present invention can be plasmids, phages, cosmids, phagemids, viruses (eg, retroviruses, parainfluenza viruses, herpes viruses, reoviruses, paramyxoviruses, and others), or selected portions thereof (eg, , Coat protein, spike glycoprotein, capsid protein). For example, cosmids and phagemids are commonly used when the particular nucleic acid sequence to be analyzed or modified is large, since such vectors can stably propagate large polynucleotides.
[0066]
Vectors containing the cloned nucleic acid sequences can then be amplified by plating (ie, cloning) or transfecting appropriate host cells with the vector (eg, a phage on an E. coli host). The cloned nucleic acid sequence can be used to transform a suitable organism to create a library for screening (eg, expression screening, PCR screening, hybridization screening, or the like). Hosts known in the art are transformed by artificially introducing a vector containing the nucleic acid sequence by inoculation under conditions conducive to such transformations. Transformation with double-stranded circular or linear nucleic acids is possible, and in some cases, with single-stranded circular or linear nucleic acid sequences. Transformation or transformation refers to permanent or transient changes in a gene induced within a cell following the incorporation of new DNA (such as DNA external to the cell). When the cell is a mammalian cell, permanent genetic changes are usually achieved by introducing DNA into the genome of the cell. A transformed cell or host cell is generally a cell (eg, prokaryotic or eukaryotic) into which DNA molecules not normally present in the host organism have been introduced (or introduced into their ancestors) using recombinant DNA techniques. Point to.
[0067]
Certain types of vectors used in the present invention contain a copy of the F factor origin. E. FIG. E. coli F factor (or fertility factor) is a plasmid that affects its own high frequency transmission during conjugation and the low frequency transmission of the bacterial chromosome itself. In certain embodiments, a cloning vector called a "fosmid" or bacterial artificial chromosome (BAC) vector is used. These are E. coli capable of stably integrating large segments of DNA. E. coli F factor. When integrated with DNA from mixed uncultured environmental samples, this allows large genomic fragments to be achieved in the form of a stable environmental gene library.
[0068]
Nucleic acids from a mixed population or sample can be inserted into a vector by various procedures. Generally, the nucleic acid sequence is inserted into the appropriate restriction endonuclease site (s) by procedures known in the art. Such procedures and others will be within the purview of those skilled in the art. In a typical cloning scenario, DNA that has been "blunted" with an appropriate nuclease (such as mung bean nuclease) is methylated, for example, with EcoR I methylase, and ligated to the EcoR I linker GGAATTCC (SEQ ID NO: 1). May be included. The linker is then digested with EcoRI restriction endonuclease and the size of the DNA is fragmented (eg, using a sucrose gradient). The resulting size-fragmented DNA is then ligated into a suitable vector for sequencing, screening, or expression (eg, packaging using a λ vector and in vitro λ packaging extraction).
[0069]
Transformation of a host cell with the recombinant DNA can be performed by conventional techniques widely known to those skilled in the art. If the host is E. coli. In the case of prokaryotes such as E. coli, competent cells capable of taking up DNA are harvested after the exponential growth phase, and then purified by procedures well known in the art.2It can be made from cells treated by the method. Instead, MgCl2Alternatively, RbCl can be used. Transformation can also be performed after forming a protoplast of the host cell or by electroporation.
[0070]
When the host is eukaryotic, methods for transfection or transformation with DNA include conventional mechanical procedures such as calcium phosphate co-precipitation, microinjection, electroporation, insertion of liposome-encapsulated plasmids, or viral Vectors may be included and other methods known in the art may be used. Eukaryotic cells can be further co-transfected with a second heterologous DNA molecule encoding a selectable marker, such as the herpes simplex thymidine kinase gene. Another method uses eukaryotic viral vectors, such as Simian Virus 40 (SV40) or bovine papilloma virus, to transiently infect or transform eukaryotic cells and express proteins (Eukaryotic Viral Vector, Cold Spring). Laboratory, Glutzmann ed., 1982). The eukaryotic cells can be yeast cells (such as Saccharomyces cerevisiae), insect cells (such as Drosophila species), or mammalian cells, including human cells.
[0071]
Eukaryotic and mammalian expression systems allow for post-translational modifications of expressed mammalian proteins. Eukaryotic cells should be used that have a cellular machine that handles primary transcription, glycosylation, phosphorylation, or secretion of the gene product. Such cell lines can include CHO, VERO, BHK, HeLa, COS, MDCK, Jurkat, HEK-293, and WI38 as part thereof.
[0072]
In one embodiment, after a library of clones has been created using any number of methods, including those described above, the clones are transformed into, for example, nutrient-rich broth or other growth media known in the art. It is resuspended in a liquid medium such as a medium. Typically, the medium is a liquid medium that can be quickly pipetted. Then, one or more media types, including at least one clone of the library, are introduced individually or together as a mixture (all or part thereof) into the capillaries of the capillary array.
[0073]
In another embodiment, the library is first biopanned prior to introduction or delivery to a capillary device or other screening technique. Such biopanning methods enrich the library for a given sequence or activity. Examples of biopanning methods are described below.
[0074]
In one embodiment, a library can be screened or sorted for clones containing a given sequence or activity based on the polynucleotide sequences present in the library or clone. Thus, the present invention is useful for screening organisms for desirable biological activities or sequences, and furthermore, can be used for directed evolution, molecular biology, biotechnology, and industrial applications. Methods and compositions are provided that assist in obtaining a sequence.
[0075]
Accordingly, the present invention provides a method for rapidly screening, enriching, and / or identifying sequences in a sample by screening and identifying nucleic acid sequences present in the sample. As such, the present invention increases the repertoire of available sequences that can be used to develop molecules for diagnostics, therapeutics, or industrial applications. Thus, the methods of the present invention can identify new nucleic acid sequences that encode proteins or polypeptides having a desired biological activity.
[0076]
After a gene library (such as an expression library) has been generated and prior to expression screening, an additional step of "biopanning" such a library may be included. This “biopanning” procedure refers to the process of screening clones for sequence homology in a library of clones to identify clones with designated biological activities.
[0077]
The probe sequence used to selectively interact with a given target sequence in the library can be a full-length or partial coding region sequence for a known biological activity. Libraries can be probed using a mixture of probes that include at least a portion of a sequence that encodes a known biological activity or that has a desired biological activity. Such a plurality of probes or probe libraries are preferably single-stranded. In one embodiment, the library is preferably converted to single-stranded form. Particularly suitable probes are those derived from DNA encoding an activity similar to, or having the same activity as, the specified biological activity being screened. Probes can be used for PCR amplification and, therefore, target sequences can be selected. Alternatively, the probe sequence can be used as a hybridization probe that can be used to identify sequences with substantial or desired homology.
[0078]
In another embodiment, FACS-based devices can be utilized to perform in vivo biopanning. Gene or expression libraries are constructed with vectors containing elements that stabilize the transcribed RNA. For example, including sequences that generate secondary structures, such as hairpins, designed to flanking the transcribed region of RNA can help enhance stability and therefore increase half-life in cells Let it. The probe molecules used in the biopanning process provide an detectable signal upon interaction with the target sequence (eg, an oligonucleotide labeled with a detectable molecule that fluoresces only when the probe binds to the target molecule). It is composed of nucleotides. For example, Howard M. Shapiro M. D. "Practical Flow Cytometry", 1995, Wiley-Liss, Inc. Various dyes or stains known in the art, such as those described in, can be used to intercalate or associate with nucleic acids to "label" oligonucleotides. Such probes are introduced into recombinant cells of the library using one of several transformation methods. The probe molecule interacts or hybridizes with the transcribed target mRNA or DNA, generating a DNA / RNA heteroduplex or DNA / RNA double-stranded molecule. Binding of the probe to the target will produce a detectable signal (such as a fluorescent signal) that is detected and sorted by the FACS device or otherwise during the screening process.
[0079]
The probe DNA should be at least about 10 bases, preferably at least 15 bases. In one embodiment, the entire coding region of a portion of the pathway can be utilized as a probe. When the probe hybridizes to the target DNA in an in vitro system, the conditions for hybridization in which the target DNA is separated by using at least one DNA probe are stringent hybridization conditions that result in at least about 50% sequence identity. Designed to provide stringency, and more particularly, to provide stringency with at least about 70% sequence identity.
[0080]
Hybridization techniques for probing microbial DNA libraries to isolate potential target DNA are well known in the art and include any of the techniques described in the literature for use herein. Are suitable, including, for example, chip-based assays, membrane-based assays, and others.
[0081]
The resulting library of transformed clones can then be further screened for clones exhibiting the desired activity. Clones can be transferred to an alternative host for expression of the active compound, or can be screened using the methods described herein.
[0082]
An alternative to the in vitro biopanning described above is the encapsulation technique, for example, gel microdroplets, which localizes a large number of clones to one location and uses it for screening on a FACS device. Can be. Clones can then be rescreened on a FACS machine and split into individual clones to identify individual clones that are positive. Screening using such a FACS device is fully described in patent application Ser. No. 08 / 876,276, filed Jun. 16, 1997. Thus, for example, if the clone mixture has the desired activity, it may be necessary to collect individual clones and rescreen using a FACS machine to determine among these clones those having the specified desired activity. it can.
[0083]
Various types of encapsulation methods and compounds or polymers can be used in the present invention. For example, high temperature agarose can be used to create high temperature stable microdroplets, which can be used to remove all background activity when screening for thermostable biological activity. After the heat sterilization step, stable cell encapsulation can be obtained. Encapsulation can be by beads, hot agarose, gel microdroplets, cells such as ghost red blood cells or macrophages, liposomes, or any other means of encapsulating and localizing molecules.
[0084]
For example, methods for making liposomes have been described (eg, US Pat. Nos. 5,653,996, 5,393,530, and 5,651,981) to encapsulate various molecules. Also described are methods of using liposomes (eg, US Pat. Nos. 5,595,756, 5,605,703, 5,627,159, 5,652,225, 5). No., 567,433, 4,235,871, and 5,227,170). The inclusion of proteins, viruses, bacteria, and DNA during endocytosis has been similarly described (see, for example, Journal of Applied Biochemistry 4, 418-435 (1982)). Erythrocytes used as carriers in vitro or in vivo for substances involved during hypotonic lysis or breakdown of membranes have also been described (Their, GM (1983) J. Pharm. Ther. Has been considered in). These techniques are useful in the present invention to encapsulate a sample in a microenvironment for screening.
[0085]
"Microenvironment" refers to any molecular environment that, in use with the present invention, provides an environment suitable for promoting the interactions required for the methods of the present invention. Suitable environments for promoting the interaction of molecules include, for example, liposomes. Liposomes can be made from various lipids including phospholipids, glycolipids, steroids, long chain alkyl esters such as alkyl phosphates, fatty acid esters such as lecithin, aliphatic amines, and others. it can. Fat mixtures may be utilized in combinations such as neutral steroids, charged amphiphiles, and phospholipids. Illustrative examples of phospholipids include lecithin, sphingomyelin, and dipalmitoyl phosphatidylcholine. Representative steroids include cholesterol, cholestanol, and lanosterol. Representative charged amphiphile compounds generally contain 12 to 30 carbon atoms. This is a monoalkyl or dialkyl phosphate, or an alkylamine, such as dicetyl phosphate, stearylamine, hexadecylamine, dilauryl phosphate, and others.
[0086]
Further, some or all of the above-described embodiments may be combined, performing an averaging step prior to generating the expression library, and then generating the expression library, and then bioexpressing the thus generated expression library. Panned and then biopanned expression libraries can be screened using high-throughput cell sorting and screening equipment. Thus, there are various options, including (i) generating a library and then screening, (ii) averaging the target DNA, generating a library and then screening, (ii) Averaging, generating a library, biopanning and screening, or (iv) generating, biopanning and screening a library. The nucleic acid used to generate the library can be obtained, for example, from an environmental sample, a mixed population of organisms (cultured or uncultured, etc.), an enriched population, and a isolate thereof. In addition, screening techniques include, for example, hybridization screening, PCR screening, expression screening, and others.
[0087]
Gel microdroplet technology has had significance in amplifying the signals available for flow cytometric analysis and in enabling microbial strain screening with strain improvement programs related to biotechnology. (Biotechnolo. Bioeng. (1993) 42: 351-356) reported that Aspergillus awamori glucoamylase has a 10-fold increase in secretion.6We have developed a microencapsulation selection method that enables rapid quantitative screening of yeasts exceeding 100%. This method provides a 400-fold single pass enrichment for high secretion mutants.
[0088]
Gel microdroplets or other related techniques can be used in the present invention to perform localization, sorting, and signal amplification in high-throughput screening of recombinant libraries. Because nucleic acids can be recovered from the microdroplets, the viability of the cells during screening is not an issue or is not critical.
[0089]
Following any number of biopanning procedures that can enrich the library for clones containing a given sequence, enriched clones are suspended in a liquid medium such as broth or other growth medium. Thus, an enriched clone includes a plurality of host cells that have been transformed with a construct that includes a vector that has incorporated nucleic acid sequences from a sample (eg, a mixed population of organisms, isolates thereof, and the like). A liquid medium containing a subset of the clones and one or more substrates having detectable molecules (such as enzyme substrates) is then introduced or contacted individually or as a mixture with the enriched clones (capillary array capillary). Etc.). The interaction (including the reaction) of the substrate with a clone that expresses an enzyme having the desired enzymatic activity produces a product or detectable signal, which can include one or more signal-generating clones, including at least one signal-generating clone. Spatial detection can be used to identify clones or capillaries. This signal producing clone or the nucleic acid contained in the signal producing clone can then be recovered using any number of techniques.
[0090]
"Substrate" as used herein includes, for example, a substrate for detecting a biological activity or a biomolecule (eg, an enzyme and its specific enzymatic activity). Such substrates are widely known in the art. For example, various enzymes, and suitable substrates specific to such enzymes, are disclosed in Molecular Probes, Handbook of Fluorescent Probes and Research Chemical (Molecular Probes, Inc., Eugene, Oreg.), The disclosure of which is incorporated herein by reference. Part of the specification of the present application is explicitly stated. Substrates can have an associated detectable molecule, including, for example, a chromogenic or fluorescent molecule. Substrates suitable for use in the invention are those that produce an optically detectable signal upon interaction (eg, a reaction) with certain enzymes having the desired activity, or with certain clones encoding such enzymes. Any substrate that does.
[0091]
One skilled in the art can, for example, select an appropriate substrate based on the desired enzyme activity. Examples of desirable enzymes / enzyme activities include those listed herein. Desirable enzymatic activity can further include a group of enzymes in the enzymatic pathway where the optical signal substrate is present. An example of this is the series of carotenoid synthases.
[0092]
Substrates are known and / or commercially available, especially for glucosidases, proteases, phosphatases, and monooxygenases. Proteases with a detectable (such as optical) signal substrate include serine proteases—trypsin and chymotrypsin. Glucosidases include mannosidase, amyloglucosidase, cellulase, neuraminidase, β-galactosidase, and alpha amylase.
[0093]
When the desired activity is of the same class as that of other biomolecules or enzymes with multiple substrates, the activity can be tested using a cocktail of known substrates. For example, substrates are known for about 20 commercially available esterases, and combinations of such known substrates provide detectable, if not optical, signal generation.
[0094]
The optical signal substrate can be a chromogenic substrate, a fluorescent substrate, a bioluminescent or chemiluminescent substrate, or a fluorescence resonance energy transfer (FRET) substrate. The detectable species can be derived from a secondary molecule that is affected by cleavage or other substrate / biomolecule interactions, such that the cleavage of the substrate or undergoes a detectable change. Numerous examples of detectable assay formats are known from diagnostic techniques using immunoassays, chromogenic assays, and labeled probe methods.
[0095]
In one embodiment, the optical signal substrate can be a bioluminescent or chemiluminescent substrate. Chemiluminescent substrates for some enzymes are available from Tropix (Bedford, Mass.). Enzymes with known chemiluminescent substrates include alkaline phosphatase, β-galactosidase, β-glucoronidase, and β-glucosidase.
[0096]
In another embodiment, a chromogenic substrate can be used, particularly for certain enzymes such as hydrolases. For example, the optical signal substrate can be an indolyl derivative that is enzymatically cleaved to generate a chromogenic product. If a chromogenic substrate is used, the optically detectable signal is light absorbance (including changes in absorbance). In this embodiment, the signal can be detected by absorbance measurement using a spectrophotometer or other.
[0097]
In another embodiment, a fluorescent substrate is used and the optically detectable signal is fluorescent. Fluorescent substrates provide high sensitivity to enhance detectability and alternative modes of detection. Hydroxyl- and amino-substituted coumarins are most widely used as fluorescent materials used to make fluorescent substrates. A common coumarin-based fluorescent substrate is 7-hydroxycoumarin, commonly known as umbelliferone (Umb). Derivatives and analogs of umbelliferone are also used. Derivatives of fluorescein (such as FDG or C12-FDG) and rhodamine and analogous substrates are also used. Resorufin (eg, resorufin β-D-galactopyranoside or resorufin β-D-glucuronide) is particularly useful in the present invention. Resorufin-based substrates are useful, for example, in screening for glycosidases, hydrolases, and dealkylases. Lipophilic derivatives of the above substrates (such as alkylated derivatives) may generally be useful in certain embodiments because they may be readily taken up by cells and have a tendency to associate with lipid regions of the cell. Fluorescein and resorufin are commercially available as alkylated derivatives that form relatively water-insoluble (ie, lipophilic) products. For example, fluorescence imaging can be performed using C12-resorphin galactoside manufactured by Molecular Probes (Eugene, Oreg.) As a substrate.
[0098]
The particular fluorescent substrate used can be selected based on the enzyme activity to be screened. The following is an example.
[0099]
Lipase / esterase. When screening for enzymes having lipase or esterase activity, acylated derivatives of fluorescein are used. The fluorescent substance is hydrolyzed from this derivative to generate a signal.
[0100]
Protease. Enzymes with protease activity are screened in the same way as esterases, where the amide bond is cleaved instead of the ester. Currently, significantly more than 100 protease substrates are available at the cleavage site of an acylated fluorophore.
[0101]
Monooxygenase (dealkylase). Several coumarin derivatives suitable as monooxygenase substrates are commercially available. Typically, in such substrates, hydroxylation of the ethyl group of the compound results in release of the resorufin phosphor.
[0102]
Usually, the substrate can enter the cell and maintain its presence in the cell for a period of time sufficient to perform the analysis (e.g., the substrate produces a detectable reaction upon entry into the cell). Do not "leak" again before reacting with the enzyme being screened for a sufficient period of time). Substrate retention in cells can be enhanced by a variety of techniques. In one method, the substrate compound is structurally modified by adding a hydrophobic (eg, alkyl) tail. In another embodiment, a solvent such as DMSO or glycerol can be used to cover the outside of the cells. Further, the substrate can be provided to the cells at reduced temperatures that have been observed to slow the escape of the substrate from the cells. However, entry of the substrate into the cell may occur, for example, if the enzyme or polypeptide is secreted and present in a lysed cell sample or the like, or if the substrate is capable of acting externally on the cell (extracellular receptor). Ligand complex, etc.) is not essential.
[0103]
The optical signal substrate can, in some embodiments, be a FRET substrate. FRET is a spectroscopic method that can monitor the proximity and relative angular orientation of fluorescent materials. Fluorescent indicator systems that measure the concentration of a substrate or product using FRET include two fluorescent moieties with emission and excitation spectra, one as a "donor" fluorescent moiety and the other as an "acceptor" fluorescent moiety. . The two fluorescent moieties are selected such that the excitation spectrum of the acceptor fluorescent moiety overlaps the emission spectrum of the excited moiety (donor fluorescent moiety). The donor moiety is excited by light of the appropriate intensity in the excitation spectrum of the donor moiety and emits absorbed energy as fluorescence. When the acceptor fluorescent protein moiety is positioned to suppress the excited donor moiety, the fluorescent energy is transferred to the acceptor moiety, which can emit a second photon. Since the emission spectra of the donor and acceptor moieties have minimal overlap, it is possible to distinguish between the two emissions. Thus, when the acceptor fluoresces at a longer wavelength than the donor, as a result of the final steady state, the emission of the donor is suppressed and the acceptor emits when excited at the absorption maximum of the donor.
[0104]
The detectable or optical signal can be measured, for example, using a fluorimeter (or the like) that detects fluorescence, including fluorescence deflection, time-resolved fluorescence, or FRET. Generally, excitation radiation from an excitation source having a first wavelength generates excitation radiation that excites the sample. In response, the fluorescent compound in the sample emits radiation having a wavelength different from the excitation wavelength. Methods for performing assays on fluorescent materials are widely known in the art, and include, for example, Racowitz (Principles of Fluorescence Spectroscopy, New York, Plenum Press, 1983) and Herman ("Resonance energy profession system, France"). Living Cells in Culture, Part B, Methods in Cell Biology, vol. 30, ed. Taylor & Wang, San Diego, Academic Press, 1989, pp. 219-2. Examples of fluorescence detection techniques are described in further detail below.
[0105]
In addition, several methods for measuring gene expression using reporter genes have been described in the literature. Nolan et al. Describe a technique for analyzing β-galactosidase expression in mammalian cells. This approach utilizes fluorescein-di-β-D-galactopyranoside (FDG) as a substrate for β-galactosidase, which upon hydrolysis releases fluorescein, a product detectable by fluorescence. (Nolan et al., 1991). Other fluorescent substrates have also been developed, for example, 5-dodecanoylaminofluorescein di-β-D-galactopyranoside (C12-FDG) (Molecular Probes), which under physiological culture conditions, It differs from FDG in that it is an easily traversable lipophilic fluorescein derivative.
[0106]
The β-galactosidase assay described above can be used, for example, to express a single E. coli expressing recombinant β-D-galactosidase isolated from hyperthermophilic archae such as Sulfolobus solfataricus. It can be used to screen E. coli cells. Other reporter genes may also be useful as substrates and are known for β-glucoronidase, alkaline phosphatase, chloramphenicol acetyltransferase (CAT), and luciferase.
[0107]
Libraries can be screened, for example, for specific enzyme activities. For example, the enzymatic activity screened can be one or more of the six IUB classes of oxidoreductase, transferase, hydrolase, lyase, isomerase, and ligase. Recombinant enzymes that test positive for one or more of the IUB classes can then be rescreened for more specific enzyme activity.
[0108]
Alternatively, the library can be screened for more specialized enzyme activity. For example, instead of screening the library in general for hydrolase activity, the library can be screened for more specialized activity, ie, the type of binding on which the hydrolase acts. Thus, for example, the library may include one or more specific compounds such as (a) amides (peptide bonds), ie, proteases, (b) ester bonds, ie, esterases and lipases, and (c) acetals, ie, glycosidases and others. Can be screened to identify those hydrolases that affect the chemical functionality of the enzyme.
[0109]
As described with respect to one of the above embodiments, the present invention provides a process for screening the activity of clones containing selected DNA from a microorganism, the method comprising:
Screening a library for a given biomolecule or a given biological activity, wherein the library comprises a plurality of clones, which clones recover nucleic acids (such as genomic DNA) from a mixed population of organisms, enriched populations, or isolates thereof And transforming the host with the nucleic acid to generate a clone to be screened for a given biomolecule or biological activity.
[0110]
In another embodiment, an enrichment step can be used prior to activity-based screening. This concentration step can be, for example, a biopanning method. Such a "biopanning" procedure is described and exemplified in U.S. Patent No. 6,054,002, issued April 25, 2000, the disclosure of which is hereby incorporated by reference. Partly.
[0111]
In another embodiment, the polynucleotide is included in a clone, the clone being created from a nucleic acid sequence of a mixed population of organisms, which nucleic acid sequence is used to create a gene library of the mixed population of organisms. Is done. The gene library can be used to transfect a host cell containing the library with at least one nucleic acid sequence having a detectable molecule that is all or part of a DNA sequence encoding a biological activity having the desired activity, e.g., using a fluorescent system. By screening, library clones containing the desired sequence are isolated and screened for a predetermined sequence.
[0112]
The present invention provides the ability to screen for many types of biological activity. For example, the ability to select and combine desirable components from a library of polyketide and post-polyketide biosynthetic genes to produce new polyketides for research can be attractive. The methods of the present invention make this possible, particularly in gene libraries with clones containing large inserts (especially when using vectors that can accept large inserts, such as factor F-based vectors). A new polyketide synthase can be cloned with other relevant pathways or genes encoding secondary metabolites that are commercially relevant, since production is possible, which facilitates the cloning of genes.
[0113]
The biopanning approach described above can be used to generate libraries enriched in clones carrying sequences homologous to certain probe sequences. Using this approach, libraries containing clones with up to 40 kbp of insert can be enriched approximately 1,000-fold after each round of panning. This can reduce the number of clones screened after one round of biopanning enrichment. This approach can be applied, for example, to generate enriched libraries for clones that carry a given sequence associated with a given biological activity, such as a polyketide sequence.
[0114]
Hybridization screening using high density filters or biopanning has proven to be an efficient approach for detecting homologues of pathways involving conserved genes. However, another approach is needed to discover new bioactive molecules for which there may be no known counterparts. In another approach of the invention, the expression of a small molecule ring structure or "backbone" is described in E. coli. Perform screening in E. coli. The gene encoding such a polycyclic structure is E. coli. Because they are often expressed in E. coli, small molecule backbones can be produced, even in an inactive form. Biological activity is conferred upon transfer of the molecule or pathway to an appropriate host that expresses the necessary glycosylation and methylation genes that can modify or "decorate" the structure into its active form. Therefore, the E. coli was recombined. Inactive ring compounds expressed in E. coli are identified to identify the clone and then transport it to a metabolically enriched host, such as Streptomyces, after which it is detected to produce a bioactive molecule. The use of high-throughput robotic systems makes it possible to screen vast numbers of clones in multiple arrays of microtiter dishes.
[0115]
One approach to detecting and enriching clones carrying such a structure, using capillary screening or FACS screening, is described in US application Ser. No. 08 / 876,276, filed Jun. 16, 1997. Explained and illustrated. Polycyclic ring compounds typically have a characteristic fluorescence spectrum when excited by ultraviolet light. Thus, clones expressing these structures can be distinguished from the background using detection methods with sufficient sensitivity. For example, high-throughput FACS screening is described in E.I. It can be used for screening of the E. coli library for the small molecule backbone. Commercially available FACS machines have the ability to screen up to 100,000 clones per second for UV active molecules. Such clones can be further screened by FACS screening, or the stationary plasmid can be extracted and transported to Streptomyces for activity screening.
[0116]
In an alternative screening approach, after transfer to a Streptomyces host, organic extracts from candidate clones can be tested for biological activity by susceptibility screening against a test organism such as Staphylococcus aureus or Saccharomyces cerevisiae.
[0117]
An alternative to the above-described screening method provided by the present invention is an approach called "mixed extraction" screening. The “mixed extraction” screening approach relies on the fact that accessory genes are required to confer activity when the polycyclic backbone is expressed in metabolically rich hosts such as Streptomyces, and the in vitro bioactive compound The enzyme is extracted to produce E. It takes advantage of the fact that it can be combined with a backbone extracted from E. coli clones. At various stages of growth, enzyme-extracted specimens from metabolically-rich hosts such as Streptomyces strains were obtained from E. coli. A pool of organic extracts from the E. coli library is combined and then evaluated for biological activity.
[0118]
E. FIG. Another approach to detecting activity in E. coli clones involves screening for genes that can convert bioactive compounds to different forms. For example, recently, a recombinant enzyme capable of converting low-value daunomycin to high-value doxorubicin has been discovered. A similar enzymatic pathway has been explored to convert penicillin to cephalosporins.
[0119]
Capillary screening can be used, for example, to detect the expression of UV fluorescent molecules in metabolically rich hosts such as Streptomyces. Recombinant oxytetracycline is available from S.A. When produced heterologously in C. lividans TK24, it retains diagnostic red fluorescence. Pathway clones identifiable by the methods and systems of the present invention can therefore be screened for polycyclic molecules in a high-throughput manner.
[0120]
Recombinant bioactive compounds can be screened in vivo using a "two-hybrid" system, which involves the interaction between a transcription factor and its active substance or between a receptor and its cognate target. Certain protein-protein or other interaction enhancers and inhibitors can be detected. In this embodiment, both the small molecule pathway and the GFP reporter construct are co-expressed. Clones that have altered in GFP expression can then be identified, and the clones are isolated for characterization
As noted, a common approach to drug discovery involves screening assays that expose disease targets (macromolecules involved in disease development) to potential drug candidates to be tested for therapeutic activity. In another approach, whole cells or organisms, such as bacteria or tumor cell lines, that are the causative agents of the disease are exposed to potential candidates for screening purposes. Any of these approaches can be utilized in the present invention.
[0121]
The present invention further provides for the clonal pathway from uncultured samples to be metabolically metabolized for heterologous expression and downstream screening for a given bioactive compound using the various screening approaches described briefly above. Can be transferred to a rich host.
[0122]
After screening live or non-viable cells, each containing a different expression clone from the gene library, and collecting the positive clones, DNA can be isolated from the positive clones using techniques well known in the art. The DNA can then be amplified either in vivo or in vitro, using any of the various amplification techniques known in the art. In vivo amplification involves the conversion of the clone (s) or subclone (s) into a host suitable for survival and subsequent growth of the host. In vivo amplification can be performed using techniques such as the polymerase chain reaction. After amplification, the identified sequences can be "evolved" or sequenced.
[0123]
One of the advantages provided by the present invention is the ability to manipulate the identified biomolecule or biological activity to generate and select encoded variants with altered sequence, activity, or specificity. .
[0124]
The screened biomolecules or clones determined to have bioactivity can be subjected to directed mutagenesis to develop new biomolecules or bioactivity with desired properties, or Modified biomolecules or biological activities can be developed that have particularly desirable properties that are absent or not significant in their natural state (such as wild-type activity), such as stability. Any known technique for directed mutagenesis can be applied to the present invention. For example, particularly suitable mutagenesis techniques for use in accordance with the present invention include those described below.
[0125]
Alternatively, when it is desirable to alter the biological molecule (eg, peptide, protein, or polynucleotide sequence) or biological activity (eg, enzymatic activity) obtained, identified, or cloned as described herein. There is. Such changes can modify a biomolecule or biological activity, for example, to increase or decrease the activity, specificity, affinity, function, etc., of the polypeptide. DNA shuffling refers to recombination between sequences that are substantially homologous but not identical, and in some embodiments, DNA shuffling involves non-sequencing, such as through the cer / lox and / or flp / frt systems. It may be accompanied by transfer via homologous recombination (for example, issued to Dr. Jay Short on August 17, 1997, the disclosure of which is incorporated herein by reference, and See U.S. Patent No. 5,939,250 assigned to Corporation). Various methods relating to shuffling, mutating, or altering polynucleotide or polypeptide sequences are described below.
[0126]
Nucleic acid shuffling is a method of homologous recombination of a pool of short or small polynucleotides in vitro or in vivo to produce a polynucleotide or polynucleotides. A mixture of related nucleic acid sequences or polynucleotides is subjected to sexual PCR to provide a random polynucleotide, which is reconstituted to generate a library or mixed population of recombinant hybrid nucleic acid molecules or polynucleotides. In contrast to cassette mutagenesis, shuffling and error prone PCR alone can blindly mutate a sequence pool (without sequence information other than the primers).
[0127]
The advantages of the mutagenized shuffling of the present invention over error-prone PCR alone for repeated selection can best be understood by describing as follows. Consider DNA shuffling compared to error-prone PCR (as opposed to sexual PCR). The initial library of selected or pooled sequences may consist of related sequences of various origins, or may be derived from any type of mutagenesis (including shuffling) of a single gene There is. The set of selected sequences is obtained after the first round of activity selection. Shuffling, for example, allows association of all related sequences in any combination.
[0128]
This method differs from error-prone PCR in that it is a reverse chain reaction. In error-prone PCR, the number of polymerase start sites and the number of molecules increase exponentially. However, the sequence of the polymerase start site and the sequence of the molecule remain essentially the same. In contrast, in rearrangement of nucleic acids or shuffling of random polynucleotides, the number of start sites and the number (but not size) of random polynucleotides decrease over time. For polynucleotides derived from whole plasmids, the theoretical endpoint is a single large concatemer molecule.
[0129]
Recombination mainly occurs between members of the same sequence family because crossovers occur in regions of homology. This prevents combinations of significantly mismatched sequences (eg, having different activities or specificities). It is believed that multiple families of sequences can be shuffled in the same reaction. Furthermore, shuffling generally preserves the relative order.
[0130]
Those that are shuffled will rarely contain a large number of the best molecules (eg, the highest activity or specificity), and those that are rare may be selected based on their superior activity or specificity. it can.
[0131]
The pool of 100 polypeptide sequences is 103You can sort in different ways. These multiple permutations cannot be represented in a single library of DNA sequences. Therefore, it is contemplated that multiple cycles of DNA shuffling and selection may be required, depending on the desired sequence length and sequence diversity. Error-prone PCR, in contrast, maintains all selected sequences in the same relative orientation, producing a much smaller cluster of mutants.
[0132]
The template polynucleotide that can be used in the method of the present invention can be DNA or RNA. This can be of various lengths depending on the size of the gene or the short or small polynucleotide to be recombined or reconstituted. Preferably, the template polynucleotide is between 50 bp and 50 kb. It is believed that the entire vector containing the nucleic acid encoding a given protein can be used in the methods of the invention and has been successfully used.
[0133]
The template polynucleotide can be obtained by PCR reaction (US Pat. Nos. 4,683,202 and 4,683,195) or amplification using other amplification or cloning methods. However, by removing free primers from the PCR products before pooling the PCR products, sexual PCR can provide more efficient results. If primers are not sufficiently removed from the original pool prior to sexual PCR, the frequency of transfer clones may be low.
[0134]
The template polynucleotide is often double-stranded. Double-stranded nucleic acid molecules are recommended to ensure that the resulting single-stranded polynucleotides are complementary to each other and thus can form double-stranded molecules upon hybridization.
[0135]
It is contemplated that a single or double stranded nucleic acid polynucleotide having a region of identity with the template polynucleotide and a region of heterogeneity with the template template can be added to the template polynucleotide at this step. It is further contemplated that the two related polynucleotide templates can be mixed at this step.
[0136]
The double-stranded polynucleotide template and any additional double- or single-stranded polynucleotides undergo sexual PCR, including slowing or stopping to provide a mixture of about 5 bp to 5 kb or more. Preferably, the size of the random polynucleotide is between about 10 bp and 1000 bp, and more preferably, the size of the polynucleotide is between about 20 bp and 500 bp.
[0137]
Alternatively, it is contemplated that double-stranded nucleic acids having multiple nicks can be used in the methods of the invention. A nick is a break in one strand of a double-stranded nucleic acid. The distance between such nicks is preferably between 5 bp and 5 kb, more preferably between 10 bp and 1000 bp. This can provide, for example, a self-sufficient area that produces short or small polynucleotides included with the polynucleotides generated from random primers.
[0138]
The concentration of any one particular polynucleotide does not exceed 1% by weight of the total polynucleotide, more preferably the concentration of any one particular nucleic acid sequence is 0.1% by weight of the total nucleic acid. % Will not be exceeded.
[0139]
The number of different types of specific polynucleotides in the mixture is at least about 100, preferably at least about 500, and more preferably at least about 1000.
[0140]
In this step, single or double stranded polynucleotides, synthetic or naturally occurring, can be added to random double stranded short or small polynucleotides to increase the heterogeneity of the mixture of polynucleotides. .
[0141]
Furthermore, the population of double-stranded, randomly cut polynucleotides can be mixed or combined with the polynucleotides from the sexual PCR process in this step, optionally involving one or more sexual PCR cycles. It is believed that it can be applied.
[0142]
If insertion of a mutant into the template polynucleotide is desired, a single- or double-stranded polynucleotide having a region of identity with the template polynucleotide and a region of heterogeneity with the template polynucleotide is compared to the total nucleic acid. It is possible to add more than 20 times the weight of the single-stranded polynucleotide, more preferably more than 10 times the weight of the total nucleic acid.
[0143]
If a mixture of different but related template polynucleotides is desired, the populations of polynucleotides from each of the templates are combined in a ratio of less than about 1: 100, and more preferably in a ratio of less than about 1:40. be able to. For example, when it is necessary to backcross a wild-type polynucleotide with a population of mutated polynucleotides to eliminate neutral mutations (mutations that result in intangible alterations in the selected phenotypic trait). There is. In such instances, the ratio of randomly provided wild-type polynucleotide that can be added to the randomly provided sexual PCR cycle hybrid polynucleotide is from about 1: 1 to about 100: 1, and more preferably. Is 1: 1 to 40: 1.
[0144]
The mixed population of random polynucleotides is denatured to form single-stranded polynucleotides and then re-annealed. Only single-stranded polynucleotides having regions of homology to other single-stranded polynucleotides will be reannealed.
[0145]
Random polynucleotides can be denatured by heating. Conditions necessary for completely denaturing the double-stranded nucleic acid can be determined by those skilled in the art. Preferably, this temperature is between 80 ° C and 100 ° C, more preferably, this temperature is between 90 ° C and 96 ° C. Other methods that can be used to denature a polynucleotide include pressure and pH.
[0146]
The polynucleotide can be re-annealed by cooling. Preferably, this temperature is between 20 ° C and 75 ° C, more preferably, this temperature is between 40 ° C and 65 ° C. If frequent transfers are required, based on an average of only four consecutive bases of homology, a lower annealing temperature can be used to force recombination, but this process is more difficult. The degree of regeneration that occurs varies depending on the degree of homology in the population of single-stranded polynucleotides.
[0147]
Regeneration can be accelerated by adding polyethylene glycol ("PEG") or a salt. The salt concentration is preferably 0 mM to 200 mM, and more preferably the salt concentration is 10 mM to 100 mM. This salt can be KCl or NaCl. The concentration of PEG is preferably 0% to 20%, more preferably 5% to 10%.
[0148]
The annealed polynucleotide is then cultured in the presence of a nucleic acid polymerase and dNTPs (ie, dATP, dCTP, dGTP, and dTTP). The nucleic acid polymerase can be Klenow fragment, Taq polymerase, or any other DNA polymerase known in the art.
[0149]
The approach used for this assembly will vary depending on the minimum degree of homology that will cause further transfers. If the same area is large, Taq polymerase can be used at an annealing temperature of 45-65 ° C. If the same area is small, Klenow polymerase can be used at an annealing temperature of 20-30 ° C. One skilled in the art can vary the temperature of the annealing to increase the number of transfers achieved.
[0150]
The polymerase can be added to the random polynucleotide prior to, simultaneously with, or after annealing.
[0151]
The cycle of denaturation, regeneration, and culture in the presence of polymerase is referred to herein as nucleic acid shuffling or reconstitution. This cycle is repeated a desired number of times. Preferably, this cycle is repeated 2 to 50 times, and more preferably, the sequence is repeated 10 to 40 times.
[0152]
The resulting nucleic acid is a large double-stranded polynucleotide of about 50 bp to about 100 kb, preferably, the large polynucleotide is 500 bp to 50 kb.
[0153]
The large polynucleotide can include multiple copies of the polynucleotide having the same size as the template polynucleotide in tandem. The concatemer polynucleotide is then denatured into a single copy of the template polynucleotide. The result is a population of polynucleotides about the same size as the template polynucleotide. This population is a mixed population in which single- or double-stranded polynucleotides having the same area and different areas are added to the template polynucleotide before shuffling. Such polynucleotides are then cloned into the appropriate vector and ligation mixture used to transform bacteria.
[0154]
It is believed that single polynucleotides can be obtained from large concatemer polynucleotides by amplifying the single polynucleotide prior to cloning by various methods, including PCR, rather than by digestion of the concatemer (US Patent No. 4,683,195 and 4,683,202).
[0155]
The vector used for cloning is not critical if it accepts the desired size polynucleotide. If expression of a particular polynucleotide is desired, the cloning vehicle will further include transcription and translation signals adjacent to the site of insertion of the polynucleotide to allow expression of the polynucleotide in a host cell.
[0156]
The resulting bacterial population contains a large number of recombinant polynucleotides with random mutations. This mixed population can be tested to identify the desired recombinant polynucleotide. The method of selection will vary depending on the desired polynucleotide.
[0157]
For example, if a polynucleotide identified by the methods described herein encodes a protein with a first binding affinity, then a subsequently mutated (eg, shuffled) sequence will have increased binding efficiency for the ligand. It is desirable to have. In such cases, the protein expressed by each portion of the polynucleotides in the population or library can be tested for its ability to bind the ligand by methods known in the art (panning, affinity chromatography, etc.). If a polynucleotide encoding a protein with increased drug resistance is desired, the protein expressed by each portion of the polynucleotide in the population or library can be tested for its ability to confer drug resistance to the host organism. Given the knowledge of a desired protein, one of skill in the art can easily test the population to identify polynucleotides that confer the desired properties on the protein.
[0158]
One of skill in the art could use a phage display system that expresses a fragment of the protein as a fusion protein on the phage surface (Pharmacia, Milwaukee, Wis.). The recombinant DNA molecule is cloned in the phage DNA at the site where transcription of the fusion protein occurs, and a portion of the fusion protein is encoded by the recombinant DNA molecule. Phage containing the recombinant nucleic acid molecule are replicated and transcribed within the cell. The fusion protein leader sequence directs delivery of the fusion protein to the tip of the phage particle. Thus, the fusion protein partially encoded by the recombinant DNA molecule is displayed on phage particles for detection and selection by the methods described above.
[0159]
Further, it is contemplated that polypeptides from a sub-population of the first population can perform multiple cycles of nucleic acid shuffling, the sub-population comprising DNA encoding the desired recombinant protein. Thereby, a protein having higher binding affinity or enzymatic activity can be achieved.
[0160]
Additionally, multiple cycles of nucleic acid shuffling may be performed with a mixture of wild-type polynucleotide and a small population of nucleic acids from the first or subsequent rounds of nucleic acid shuffling to remove any silent mutations from the small population. It can be done.
[0161]
Any source of nucleic acid in purified form can be used as starting nucleic acid. Thus, the process can utilize DNA or RNA, including messenger RNA, which can be single-stranded or double-stranded. In addition, DNA-RNA hybrids containing each single strand can be utilized. Nucleic acid sequences can be of various lengths, depending on the size of the nucleic acid sequence to be mutated. Preferably, a particular nucleic acid sequence is between 50 and 50,000 base pairs. It is contemplated that the entire vector containing the nucleic acid encoding the given protein can be used in the methods of the invention.
[0162]
Any particular nucleic acid sequence can be used to generate a population of hybrids by this process. All that is needed is a small population of hybrid sequences of a particular nucleic acid sequence, either present or available in the process.
[0163]
A particular population of nucleic acid sequences having a mutation can be formed by a number of different methods. Mutations can be made by error-prone PCR. Error-prone PCR uses low-fidelity polymerization conditions to randomly introduce low levels of point mutations throughout long sequences. Alternatively, mutations can be introduced into the template polynucleotide by oligonucleotide directed mutagenesis. In oligonucleotide directed mutagenesis, a short sequence of a polynucleotide is removed from the polynucleotide using restriction enzyme digestion, replacing various bases with a synthetic polynucleotide that has been altered from the original sequence. The polynucleotide sequence can be altered by chemical mutagenesis. Chemical mutagens include, for example, sodium bisulfite, nitrite, hydroxylamine, hydrazine, or formic acid. Other agents that are analogs of nucleotide precursors include nitrosoguanidine, 5-bromouracil, 2-aminopurine, or acridine. Generally, such agents are added to the PCR reaction at the nucleotide precursor, thereby mutating the sequence. Inserting agents such as proflavine, acriflavine, quinacrine, and others can also be used. Random mutagenesis of the polynucleotide sequence can also be achieved by X-ray or UV irradiation. Generally, the polynucleotide of the plasmid so mutated is E. coli. coli and grown as a pool or library of hybrid plasmids.
[0164]
Alternatively, a small mixed population of a particular nucleic acid can be found in nature, in that it is made up of different alleles of the same gene, or the same gene from different related species (ie, cognate genes). . Alternatively, they can be related DNA sequences found in one species, for example, immunoglobulin genes.
[0165]
After a mixed population of specific nucleic acid sequences has been generated, the polynucleotides can be used directly or inserted into an appropriate cloning vector using techniques well known in the art.
[0166]
The choice of vector will vary depending on the polynucleotide sequence utilized in the method of the invention and the size of the host cell. The template of the present invention may be a plasmid, phage, cosmid, phagemid, virus (eg, retrovirus, parainfluenza virus, herpes virus, reovirus, paramyxovirus, and others), or a selected portion thereof (eg, coat protein, spike Glycoprotein, capsid protein). For example, cosmids and phagemids are preferred when the particular nucleic acid sequence to be mutated is large, since such vectors can stably propagate large polynucleotides.
[0167]
A mixed population of specific nucleic acid sequences can be clonally amplified when cloned in a vector. Utility can be readily determined by screening the expressed polypeptide.
[0168]
The DNA shuffling method of the present invention can be performed blindly on pools of unknown sequences. By adding to the oligonucleotides of the reconstituted mixture (having ends homologous to the sequence to be reconstituted), any sequence mixture can be incorporated into another sequence mixture at any particular position. Thus, a mixture of synthetic oligonucleotides, PCR polynucleotides or even complete genes can be mixed into another sequence library at defined locations. Insertion of one sequence (mixture) is independent of insertion of the sequence in another part of the template. Thus, the degree of recombination, the required homology, and the diversity of the library can be varied independently and simultaneously, along with the length of the DNA to be reconstituted.
[0169]
Shuffling requires the presence of regions of homology that separate regions of diversity. Scaffold-like protein structures may be particularly suitable for shuffling. Conserved scaffolds determine the overall fold by self-association, while exhibiting relatively unrestricted loops that mediate specific binding. Examples of such scaffolds are immunoglobulin β-barrels and four-helix bundles well known in the art. This shuffling can be used to create scaffold-like proteins by combining various combinations of mutated sequences.
[0170]
Equivalents of some standard genetic crosses can also be performed by shuffling in vitro. For example, "molecular backcrossing" can be performed by repeatedly mixing hybrid nucleic acid with wild-type nucleic acid while selecting a given mutation. As with conventional breeding, this approach can be used to combine phenotypes from various sources into a selected background. This is useful, for example, for the removal of neutral mutations affecting unselected characteristics (such as immunogenicity). Thus, this may be useful in determining which mutations in a protein are involved and which are not involved in the enhanced biological activity, and this advantage may be attributed to the error prone It cannot be achieved by mutagenesis or cassette mutagenesis.
[0171]
Large functional genes can be assembled accurately from a mixture of small, random polynucleotides. This reaction can be used to reconstruct genes from highly fragmented fossil DNA. In addition, random nucleic acid sequences from fossils can be combined with polynucleotides from similar genes of related species.
[0172]
Further, it is contemplated that the methods of the present invention can be used for in vitro amplification of the complete genome from a single cell, as required for various research and diagnostic applications. DNA amplification by PCR usually involves a sequence of about 40 kb. E. PCR by PCR. Amplification of a complete genome, such as E. coli (5,000 kb), requires approximately 250 primers that generate 125 40 kb polynucleotides. On the other hand, random production of genomic polynucleotides by sexual PCR cycles, followed by gel purification of small polynucleotides, provides a large number of potential primers. If this random mixture of small polynucleotides is used alone or with the entire genome as a template in a PCR reaction, a single concatemer containing many copies of the genome will be the theoretical endpoint. A reverse chain reaction occurs.
[0173]
When only random nucleotides are used, an amplification of 100 times the copy number and an average polynucleotide size of greater than 50 kb is obtained. Large concatemers are thought to be generated by the duplication of many small polynucleotides. The quality of certain PCR products obtained using synthetic primers is indistinguishable from products obtained from unamplified DNA. This approach is expected to be useful for genome mapping.
[0174]
The shuffled polynucleotides can be generated as random or non-random polynucleotides, at the discretion of the practitioner. In addition, the present invention provides methods of shuffling applicable to a wide range of polynucleotide sizes and types, including the steps of producing polynucleotide monomers used as building blocks in large polynucleotide reconstitution. included. For example, the basic unit can be a fragment of a gene, or can include an entire gene or a gene pathway, or any combination thereof.
[0175]
In an in vivo shuffling embodiment, a mixed population of specific nucleic acid sequences is introduced into a bacterial or eukaryotic cell under conditions such that at least two nucleic acid sequences are present in each host cell. The polynucleotide can be introduced into the host cell in various ways. Host cells can be transformed with small polynucleotides using methods known in the art, for example, treatment with calcium chloride. If the polynucleotide is inserted into the phage genome, the host cell can be transfected with the recombinant phage genome having the particular nucleic acid sequence. Alternatively, the nucleic acid sequence can be introduced into a host cell using electroporation, transfection, lipofection, biolistics, conjugation, and the like.
[0176]
Generally, in this embodiment, the particular nucleic acid sequence will be present in a vector that is capable of stable replication of this sequence in the host cell. In addition, the vector will encode a marker gene so that a host cell having the vector can be selected. This ensures that the particular mutated nucleic acid sequence can be recovered after introduction into the host cell. However, it is not believed that the entire mixed population of a particular nucleic acid sequence need be present on the vector sequence. Rather, after introduction of the polynucleotide into the host cells, it is necessary that each host cell be cloned into a vector in order to ensure that it contains a single vector within which at least one particular nucleic acid sequence is present. , Only a sufficient number of sequences. Furthermore, rather than cloning a subset of a particular population of nucleic acid sequences into a vector, it is likely that this subset may already be stably integrated into the host cell.
[0177]
It has been found that when two polynucleotides having regions of identity are inserted into a host cell, homologous recombination occurs between the two polynucleotides. Such recombination between two particular mutated nucleic acid sequences will, in some circumstances, result in the formation of a double or triple hybrid.
[0178]
Furthermore, it has been found that the recombination frequency increases when a portion of a particular mutated nucleic acid sequence is present on a linear nucleic acid molecule. Thus, in one embodiment, a portion of a particular nucleic acid sequence is on a linear polynucleotide.
[0179]
After transformation, transformants of the host cell are selected for identification of transformants of the host cell that contain the particular mutated nucleic acid sequence having the desired quality. For example, if increased resistance to a particular drug is desired, transformed host cells can be affected by increased concentrations of the particular drug, and mutations that can confer increased drug resistance. The transformant that produced the protein will be selected. If it is desired to increase the ability of a particular protein to bind to the receptor, it is possible to induce expression of the protein from the transformant, and the resulting protein can be converted to a ligand by methods known in the art. Evaluate in a binding assay to identify a subset of the mutant population that shows enhanced binding to the ligand. Alternatively, the protein can be expressed in another system to ensure proper processing.
[0180]
Once identified, a subset of the first recombined specific nucleic acid sequence (daughter sequence) having the desired characteristics is subjected to a second round of recombination. In the second cycle of recombination, the particular recombined nucleic acid sequence can be mixed with the original mutated particular nucleic acid sequence (the parent sequence), and this cycle is performed as described above. Is repeated. In this way, a second set of recombined specific nucleic acid sequences can be identified that have enhanced characteristics or encode proteins with enhanced characteristics. This cycle can be repeated as many times as desired.
[0181]
It is further contemplated that backcrossing can be performed in a second or subsequent recombination cycle. Molecular backcrossing involves mixing a particular nucleic acid sequence with a number of wild-type sequences so that at least one wild-type nucleic acid sequence and the mutated nucleic acid sequence are present in the same host cell after transformation. Can be run with Recombination with a particular nucleic acid sequence of the wild type will eliminate neutral mutations that affect unselected features, such as immunogenicity, but may not affect the selected features.
[0182]
In another embodiment of the present invention, slowing or stopping PCR amplification prior to introduction into a host cell produces a subset of a particular nucleic acid sequence as a small polynucleotide during a first round. It is thought that it is possible. The size of the polynucleotide must be large enough to include some region of identity with the other sequence so that it can recombine homologously with the other sequence. The size of the polynucleotide will range from 0.03 kb to 100 kb, more preferably from 0.2 kb to 10 kb. Further, in subsequent rounds, all of the specific nucleic acid sequences other than those selected from the previous round can be utilized to generate a PCR polynucleotide before introduction into a host cell.
[0183]
Short polynucleotide sequences can be single-stranded or double-stranded. Suitable reaction conditions for separating nucleic acid strands are widely known in the art.
[0184]
The steps of this process can be repeated indefinitely and are limited only by the number of hybrids that can be achieved.
[0185]
Therefore, the first pool or population of mutated template nucleic acids is E. coli. E. coli or the like, and cloned into a vector capable of replicating in bacteria. E. FIG. No particular vector is essential as long as autonomous replication in E. coli is possible. In one embodiment, the vector is designed to allow expression and production of any protein encoded by the particular mutated nucleic acid associated with the vector. Further, preferably, the vector contains a gene encoding a selectable marker.
[0186]
A population of vectors containing a pool of mutated nucleic acid sequences is E. coli. E. coli host cells. The nucleic acid sequence of the vector can be introduced by transformation, transfection, or infection in the case of phage. The concentration of the vector used to transform the bacteria is such that multiple vectors are introduced into each cell. After entering the cell, the efficiency of homologous recombination is such that homologous recombination occurs between the various vectors. This results in a hybrid (daughter) having a different combination of mutations than the original parent mutant sequence. Host cells are then clonally replicated and selected for the marker gene present in the vector. Only cells that have the plasmid will grow for selection. The host cell containing the vector is then tested for the presence of the preferred mutation.
[0187]
After the identification of a particular daughter mutant nucleic acid that confers the desired characteristics, the nucleic acid is isolated either already in association with the vector or away from the vector. The nucleic acid is then mixed with the first or parent population of nucleic acids and the cycle is repeated.
[0188]
The parental mutated population of specific nucleic acids is cloned as a polynucleotide or in the same vector and introduced into a host cell that already contains the daughter nucleic acid. In vivo, recombination is allowed to occur, and next generation recombinants, or granddaughters, are selected by the methods described above. This cycle can be repeated many times until a nucleic acid or peptide with the desired characteristics is obtained. In subsequent cycles, the population of mutated sequences that add to the hybrid may be from the parent hybrid or any sequence generation.
[0189]
In an alternative embodiment, the present invention provides a method of performing a "molecular" backcross of the specific, recombined nucleic acid obtained to eliminate any neutral mutations. Neutral mutations are mutations that do not confer the desired properties on the nucleic acid or peptide. However, such mutations impart undesired characteristics to the nucleic acid or peptide. Therefore, it is desirable to eliminate such neutral mutations. The method of the present invention provides a means to do this.
[0190]
In this embodiment, the nucleic acid, the vector containing the nucleic acid, or the host cell containing the vector and the nucleic acid is isolated after obtaining the hybrid nucleic acid having the desired characteristics by the method of the embodiment.
[0191]
The nucleic acid or vector is then introduced into a host cell that has significantly exceeded wild-type nucleic acid. The hybrid nucleic acid and the wild-type sequence nucleic acid can be recombined. The resulting recombinant is subject to selection, as is a hybrid nucleic acid. Only those recombinants that retain the desired characteristics will be selected. Any silent mutations that do not provide the desired characteristics will be lost through recombination with wild-type DNA. This cycle can be repeated many times until all silent mutations have been eliminated.
[0192]
In another embodiment, the invention provides for shuffling, assembling, and reassembling at least two polynucleotides to form a progeny polynucleotide (eg, a chimeric progeny nucleotide that can be expressed to produce a polypeptide or gene pathway). , Recombination, and / or linearization methods. In certain embodiments, a double-stranded polynucleotide (eg, two single-stranded sequences hybridized to each other as a partner for hybridization) is treated with an exonuclease to release nucleotides from one of the two strands. And leave the remaining strand away from the original partner so that, if desired, the remaining strand can be used to achieve hybridization with another partner.
[0193]
In certain embodiments, the double-stranded polynucleotide terminus (which can be part of or attached to a polynucleotide or non-polynucleotide sequence) is affected by the source of exonuclease activity. An enzyme having 3 'exonuclease activity, an enzyme having 5' exonuclease activity, an enzyme having both 3 'exonuclease activity and 5' exonuclease activity, and any combination thereof are used in the present invention. be able to. Exonucleases can be used to release nucleotides from one or both ends of a linear double-stranded polynucleotide, or from one to all ends of a branched polynucleotide having three or more ends. .
[0194]
In contrast, non-enzymatic steps can be used to shuffle, assemble, reassemble, recombine, and / or linearize the polynucleotide building blocks, which is a process in which a working double-stranded poly Denaturing (or "lysing") conditions are applied to the working sample (e.g., by changing temperature, pH, and / or salinity conditions) so that the set of nucleotides can be dissolved into a single polynucleotide chain. Including giving. With respect to shuffling, it is desirable to involve a single polynucleotide strand in annealing with different hybridization partners to some extent (i.e., simply to have exclusive re-annealing with the original partner before the denaturation step). Not back). However, due to the presence of the original hybridization partner in the reaction vessel, re-annealing of the single-stranded polynucleotide to the original partner does not preclude, and in some cases, re-formation of the original double-stranded nucleotide. It may work in some cases.
[0195]
In contrast to the non-enzymatic shuffling step, which involves denaturing the double-chain polypeptide building blocks and then annealing, the present invention further provides an exonuclease-based approach, which requires denaturation. Conversely, avoiding denaturing conditions and maintaining the double-stranded polynucleotide substrate in annealing (ie, non-denaturing) conditions is critical to the activity of exonucleases (eg, exonuclease III and red alpha gene products). It is a necessary condition. In further contrast, the generation of single-stranded polynucleotide sequences capable of hybridizing with other single-stranded polynucleotide sequences is a consequence of covalent cleavage and consequent disruption of one of the hybridization partners. is there. For example, the exonuclease III enzyme can be used to enzymatically release the 3 ′ terminal nucleotide of one hybridizing strand (to achieve covalent hydrolysis in that polynucleotide strand), Helps the strand hybridize with the new partner (since the original partner has undergone a covalent cleavage).
[0196]
It is particularly understood that enzymes having more optimal rates and / or higher specific activities and / or less unnecessary activities are specifically discovered and optimized for the approach disclosed immediately above. (Eg, created by directed evolution), or both discovery and optimization. Indeed, it is expected that the present invention may facilitate the discovery and / or development of such designer enzymes.
[0197]
It is further understood that the ends of the double-stranded polynucleotide can be protected, if desired, or made susceptible to the desired enzymatic activity of exonucleases. For example, ends of a double-stranded polynucleotide having a 3 'overhang are not affected by exonuclease activity of exonuclease III. However, by various means, it can be made susceptible to exonuclease activity of exonuclease III, for example, blunting by treatment with a polymerase, cleavage to provide blunt ends or 5 'overhangs, Ligating (ligating or hybridizing) to another double stranded polynucleotide to provide a blunt end or 5 'overhang, hybridizing to a single stranded polynucleotide to provide a blunt end or 5' overhang, or various It can be modified by any of the various means.
[0198]
According to one aspect, the exonuclease can act on one or both termini of the linear double-stranded polynucleotide and can proceed to completion, near completion, or partial completion. When exonuclease activity can proceed to completion, the result is that the length of each 5 'overhang increases toward the central region of the polynucleotide by a "rendezvous point" (somewhere near the central point of the polynucleotide). (May be). Ultimately, this produces single-stranded polynucleotides, each of which is about half as long (separable) as the original double-stranded polynucleotide.
[0199]
Thus, exonuclease-mediated approaches are useful for shuffling, assembling and / or rearranging, recombination, and linearizing polynucleotide building blocks. This polynucleotide basic unit is up to ten bases in length, or tens of bases in length, or hundreds of bases in length, or thousands of bases in length, or tens of thousands of bases in length, or hundreds of thousands of bases in length, or It can be millions of bases in length, or longer.
[0200]
Exonuclease substrates can be generated by fragmenting double-stranded polynucleases. Fragmentation can be achieved by mechanical means (eg, shearing, sonication, and others), enzymatic means (eg, using restriction enzymes), and any combination thereof. Large polynucleotide fragments can also be produced by polymerase-mediated synthesis.
[0201]
Additional examples of enzymes having exonuclease activity include red alpha and snake venom phosphodiesterase. The red alpha (redα) gene product (also called λ-exonuclease) is of bacteriophage λ origin. The red alpha gene product acts progressively from the 5'-phosphate end, releasing mononucleotides from double-stranded DNA (Takahashi and Kobayashi, 1990). Snake venom phosphodiesterase (Lascousky, 1980) can rapidly open supercoiled DNA.
[0202]
In one aspect, the invention provides a non-stochastic method called synthetic ligation rearrangement (SLR), which is somewhat related to stochastic shuffling, except that nucleic acid building blocks are randomly shuffled, or Assemble non-stochastically instead of chaining or chimerizing
The SLR method does not rely on the presence of high levels of homology between shuffling polynucleotides. The present invention relates to 10100It can be used to non-stochastically generate libraries (or sets) of progeny molecules containing more than one type of chimera. Perhaps the SLR is 101000It can even be used to generate libraries containing more than one progeny chimera.
[0203]
Thus, in one aspect, the present invention provides a non-stochastic method for generating a set of completed chimeric nucleic acid molecules having a deliberately selected overall assembly order, which method is practical and compatible. Deliberately generating a plurality of specific nucleic acid building blocks with ligable ends and assembling such nucleic acid building blocks such that a planned overall assembly sequence is achieved.
[0204]
The interchangeable linkable ends of the nucleic acid building blocks to be assembled are said to be "practical" for this type of ordered assembly if the building blocks can be joined in a predetermined order. You. Thus, in one aspect, the overall assembly order in which the nucleic acid building blocks can be joined is dictated by the design of the ligatable ends, and if more than one assembly step is used, the nucleic acid building blocks are joined together. The overall assembly sequence that can be combined is further specified by the sequential order of the assembly step (s). In one embodiment of the present invention, the annealed building blocks are treated with an enzyme such as a ligase (eg, T4 DNA ligase) to achieve the covalent attachment of the building blocks.
[0205]
In another embodiment, the design of a nucleic acid building block is obtained by analyzing the sequence of a set of precursor nucleic acid templates that serve as a basis for generating a set of progeny of the completed chimeric nucleic acid molecule. Thus, such precursor nucleic acid templates serve as a source of sequence information to assist in mutagenesis, ie, the design of chimeric or shuffled nucleic acid building blocks.
[0206]
In one illustrative form, the invention provides for chimerization of a family of related genes and a coding family of related genes. In certain illustrative forms, the encoded product is an enzyme. As a representative list of a family of enzymes capable of mutagenesis according to aspects of the present invention, the enzymes and their functions that may be mentioned are lipase / esterase, protease, glycosidase / glycosyl, transferase, phosphatase / Kinases, mono / dioxygenases, haloperoxidases, lignins, peroxidases / diallylpropaneperoxidases, epoxide hydrolases, nitrile hydratases / nitrilases, transaminases, amidases / acylases. These illustrative forms exemplify some specific aspects of the invention, but do not represent limitations or limit the scope of the disclosed invention.
[0207]
Thus, according to one aspect of the present invention, the sequences of the plurality of precursor nucleic acid templates identified using the methods of the present invention are aligned to select one or more demarcation points, wherein the demarcation points are: It can be located in the homology area. Boundary points can be used to delineate the resulting nucleic acid building blocks. Thus, the demarcation points identified and selected in the precursor molecule serve as potential chimerization points in the assembly of progeny molecules.
[0208]
Usually, the demarcation point is an area of homology (comprising at least one homologous nucleotide base) shared by at least two pre-templates, but this demarcation point comprises at least half of the pre-template and at least two-thirds of the pre-template And a homology area shared by at least three-quarters of the pre-template and, preferably, almost all of the pre-template. More preferably, the demarcation points are homology areas shared by all precursor templates.
[0209]
In another embodiment, the ligation reconstruction process is performed exhaustively to generate a comprehensive library. In other words, all possible order combinations of the nucleic acid building blocks are represented in the set of completed chimeric nucleic acid molecules. At the same time, the order of assembly in each combination (i.e., the order of assembly of each building block in the 5 'to 3 sequences of each completed chimeric nucleic acid) is deliberate (or non-stochastic). Due to the non-stochastic nature of the present invention, the potential for unwanted by-products is greatly reduced.
[0210]
In yet another embodiment, in the present invention, the ligation reconstruction process is performed systematically, for example, to generate a systematically compartmentalized library, wherein the compartments are, for example, one by one, etc. Can be screened systematically. In other words, the present invention combines the selective and judicious use of a particular nucleic acid building block with the selective and judicious use of successive step-by-step assembly reactions so that a particular set of progeny products can Can achieve the experimental design created by each of the. This makes it possible to carry out a systematic survey and screening procedure. Thus, it is possible to systematically examine a potentially very large number of progeny molecules within a small group.
[0211]
Due to the ability to perform chimerization in a very flexible yet comprehensive and systematic way, especially when the homology between the precursor molecules is at a low level, the present invention provides a library (or Set) generation. Due to the non-stochastic nature of the invention of this ligation rearrangement, the resulting progeny molecules will preferably be part of a library of completed chimeric nucleic acid molecules having a deliberately selected overall assembly order. In certain embodiments, such a generated library comprises 103More than kind to 101000Includes more than one progeny molecular species.
[0212]
In one aspect, the set of completed chimeric nucleic acid molecules generated according to the description comprises a polynucleotide encoding a polypeptide. According to one embodiment, the polynucleotide is a gene, which can be an artificial gene. According to another embodiment, the polynucleotide is a genetic pathway, which can be an artificial gene pathway. In the present invention, one or more artificial genes generated according to the present invention can be incorporated into artificial gene pathways such as those that function in eukaryotic organisms (including plants).
[0213]
In another illustrative form, the synthetic nature of the generation of the building blocks makes use of the gene splicing capacity of the host organism (eg, by mutagenesis) or in vivo (eg, by mutagenesis). Then, the design and introduction of nucleotides that can optionally be removed at a later time (eg, one or more nucleotides can be codons or introns or regulatory sequences, etc.) becomes possible. It will be appreciated that in many cases, the introduction of such nucleotides may be desirable for many other reasons, in addition to the potential benefits of forming a demarcation point.
[0214]
Thus, according to another embodiment, the invention allows the use of nucleic acid building blocks to introduce introns. Therefore, in the present invention, a functional intron can be introduced into the artificial gene of the present invention. In the present invention, a functional intron can be further introduced into the artificial gene pathway of the present invention. Accordingly, the invention provides for the generation of a chimeric polynucleotide that is an artificial gene containing one (or more) artificially introduced intron (s).
[0215]
Accordingly, the present invention further provides for the generation of chimeric polynucleotides that are artificial gene pathways containing one (or more) artificially introduced intron (s). Preferably, the artificially introduced intron (s) is capable of functioning in one or more host cells for gene splicing in a manner similar to that of naturally occurring introns in gene splicing. The present invention provides a process for producing an artificial intron-containing polynucleotide that is introduced into a host organism for recombination and / or splicing.
[0216]
An artificial gene generated using the present invention can also serve as a substrate for recombination with another nucleic acid. Similarly, an artificial gene pathway generated using the present invention can also serve as a substrate for recombination with another nucleic acid. In a preferred case, the recombination is facilitated by, and occurs in, an area of homology between the artificial intron containing the gene and the nucleic acid that acts as a recombination partner. In certain preferred cases, the recombinant partner can be a nucleic acid produced according to the present invention, including an artificial gene or an artificial gene pathway. Recombination may be facilitated by and may occur in homologous areas present in one (or more) artificially introduced intron (s) in the artificial gene.
[0217]
The synthetic ligation rearrangement method of the present invention utilizes a plurality of nucleic acid building blocks, each of which preferably has two ligatable ends. The two linkable ends of each nucleic acid building block may be two blunt ends (ie, each having no nucleotide overhang), or, preferably, one blunt end and one overhang, or more preferably, two blunt ends. There can be overhangs.
[0218]
The overhang for this purpose can be a 3 'overhang or a 5' overhang. Thus, a nucleic acid building block can have a 3 'overhang, or alternatively a 5' overhang, or alternatively two 3 'overhangs, or alternatively two 5' overhangs. The overall order in which the nucleic acid building blocks are assembled to form the completed chimeric nucleic acid molecule is not random, but is determined by the desired experimental design.
[0219]
According to one preferred embodiment, the nucleic acid building blocks are contacted such that two single-stranded nucleic acids (also called single-stranded oligos) are chemically synthesized and annealed to form double-stranded nucleic acid building blocks. And causing
[0220]
Double-stranded nucleic acid building blocks can be of various sizes. The size of such basic units can be small or large. Suitable sizes for the basic units range from 1 base pair (not including any overhangs) to 100,000 base pairs (not including any overhangs). Other suitable size ranges are also provided, with a lower limit of 1 bp to 10,000 bp (including all integer values between) and an upper limit of 2 bp to 100,000 bp (including all integer values between). Have.
[0221]
FIG. 6 shows the activity of the enzyme exonuclease III. This is an exemplary enzyme that can be used for shuffling, assembling, reassembling, recombining, and / or linearizing polynucleotide building blocks. The asterisk indicates that the enzyme acts from the 3 'direction to the 5' direction of the polynucleotide substrate. FIG. 7 shows an exemplary application of the enzyme exonuclease III in exonuclease-mediated polynucleotide reconstitution. In addition, transforming a suitable host (Escherichia, Pseudomonas, Streptomyces, or Bacillus) and transforming the clonal mutagenic progeny nucleic acids (and preferably the polypeptides expressed by such nucleic acids) that can be analyzed by expression screening. Figure 4 illustrates the combined use of in vivo "repair" by utilizing host repair mechanisms to generate libraries and provide additional diversity.
[0222]
FIG. 8 shows the generation of a multilinked nucleic acid strand. In this case, the resulting strand is the same length as the parent template, but unmethylated. Thus, the resulting strand can be selected using the Dpn I treatment. Although not shown, the template and the product can be part of a vector (linear or circular). FIG. 9 shows that in the heteromeric nucleic acid complex, the 3 ′ and 5 ′ terminal nucleotides were released from the unhybridized single-stranded ends of the annealed nucleic acid strands, leaving a shortened but hybridized end. 9 illustrates the use of exonuclease treatment as a means of promoting polymerase end extension and / or ligase-mediated ligation of the terminated ends. In addition, transforming a suitable host (Escherichia, Pseudomonas, Streptomyces, or Bacillus) and transforming the clonal mutagenized progeny nucleic acids (and preferably the polypeptides expressed by such nucleic acids) that can be analyzed by expression screening. Figure 4 illustrates the combined use of in vivo "repair" by utilizing host repair mechanisms to generate libraries and provide additional diversity.
[0223]
FIG. 10 shows the use of exonuclease-mediated nucleic acid rearrangement in an example of annealing one methylated multi-linked nucleic acid strand into several unmethylated single-linked nucleic acid strands. The annealed nucleic acid strands form a heteromeric nucleic acid complex, which releases the 3 ′ and 5 ′ terminal nucleotides from the unhybridized single-stranded ends of the multiple annealed nucleic acid strands in the heteromeric nucleic acid complex. However, the treated ends are subjected to exonuclease treatment as a means of promoting polymerase extension and / or ligase-mediated ligation, leaving the hybridized ends. The treatment with Dpn I then becomes practical for the selection of the generated annealed single-bonded nucleic acid strands that are unmethylated and chimeric in nature.
[0224]
FIG. 11 illustrates the use of exonuclease-mediated nucleic acid rearrangement in an example of annealing multiple methylated multi-linked nucleic acid strands into several unmethylated single-linked nucleic acid strands. The annealed nucleic acid strands form a heteromeric nucleic acid complex, which releases the 3 ′ and 5 ′ terminal nucleotides from the unhybridized single-stranded ends of the multiple annealed nucleic acid strands in the heteromeric nucleic acid complex. However, the treated ends are subjected to exonuclease treatment as a means of promoting polymerase extension and / or ligase-mediated ligation, leaving the hybridized ends. The treatment with Dpn I then becomes practical for the selection of the generated annealed single-bonded nucleic acid strands that are unmethylated and chimeric in nature.
[0225]
There are a number of methods by which double-stranded nucleic acid building blocks can be produced that are useful in the present invention and are known in the art and can be readily implemented by those skilled in the art.
[0226]
According to one embodiment, the double-stranded nucleic acid building blocks are generated by first generating two single-stranded nucleic acids and annealing them so that double-stranded nucleic acid building blocks can be generated. Is done. The two strands of the double-stranded nucleic acid building block can be complementary at all nucleotides except for any that form an overhang, thus eliminating mismatches except for any overhang (s). Not included. According to another embodiment, the two strands of the double-stranded nucleic acid building block are complementary in all fewer nucleotides, except for any that form an overhang. Thus, according to this embodiment, double-stranded nucleic acid building blocks can be used to introduce codon degeneracy. Preferably, codon degeneracy is introduced using site saturation mutagenesis as described herein, which uses one or more N, N, G / T cassettes, or alternatively, One or more N, N, N cassettes are used.
[0227]
FIG. 1 illustrates a preferred embodiment of the site saturation mutagenesis described herein. Nucleic acid sequences that can be mutated by non-stochastic site saturation mutagenesis include any polynucleotide between 15 and 100,000 bases in length (eg, any coding region and any non-coding region). Including. For example, such nucleic acid sequences may include, for example, promoters, enhancers, introns, whole genes, cDNAs, gene segments, operators, polynucleotide functional groups, expression control sequences, expression sequence tags (ESTs), open reading frames (ORFs), repressors / Trans-acting factor, origin of replication, or genetic pathway.
[0228]
Mutagenic cassettes that can be mutagenized by non-stochastic abrupt mutagenesis include any polynucleotide cassette from 1 to 500 bases in length. Site saturation mutagenesis is practical for mutagenizing the complete set of cassettes contained within the polynucleotide sequence to be mutagenized. As shown in FIG. 1, the cassettes can be variously spaced (ie, immediately adjacent, evenly or unevenly spaced) along each polynucleotide and can be of any size Can be. In a preferred, non-limiting illustrative form, the set of mutagenic cassettes is a set of contiguous codons within a sequence of defined length. Alternatively, in another preferred, non-limiting example, the set of mutagenic cassettes is a set of nucleotide cassettes that are not shared by the related polynucleotides in alignment.
[0229]
The type of mutation introduced into the set of mutagenic cassettes can be of the same or different types in each round of polynucleotide site saturation mutagenesis. Each mutagenic cassette (within the nucleic acid sequence to be mutagenized) is preferably usually mutagenized (including with degenerate oligos) by using the corresponding oligo. Examples of degenerate mutations provided by the present invention include:
[0230]
Codons for all 20 amino acids (eg, N, N, N or N, N, G / T or N, N, G / C)
All degenerate codons that do not change the amino acid sequence of the parent template (ie, codons for the same amino acid present in the parent template)
Selected amino acid grouping system*(All or selected) codons for amino acids in the same group according to
Each amino acid group*Codon for at least one amino acid in
1. Aromatic (Phe, Trp, Tyr)
2. Aliphatic (Gly, Ala, Val, Leu, Ile)
3. OH content (Ser, Tyr, Thr)
4. Acidic (Asp, Glu, Asn, Gin)
5. Basic (Lys, Arg, His)
6. Sulfur-containing (Met, Cys)
7. Polarity (Ser, Thr, Cys, Asn, Gin, Tyr)
8. Non-polar (Gly, Ala, Vai, Leu, Ile, Met, Phe, Trp, Pro)
[0231]
FIG. 2 illustrates the power of the present invention in its ability to generate all possible combinations of nucleic acid building blocks designed in this example in an exhaustive and systematic manner. In particular, large sets (or libraries) of progeny chimeric cells can be generated. This method can be performed comprehensively and systematically, so that iterative methods can be applied by selecting new boundary points, and correspondingly newly designed nucleic acid building blocks have previously been investigated and The burden of regenerating and rescreening rejected molecular species is avoided. It is understood that codon fluctuations can be used to advantage in increasing the frequency of boundary points. In other words, a particular base can often be replaced in a nucleic acid building block without changing the amino acid encoded by the precursor codon (altered codon) due to codon degeneracy. As illustrated, the boundary points are selected with the eight precursor templates aligned. Thereafter, nucleic acid building blocks containing overhangs (practical for the generation of ordered bonds) are designed and synthesized. In this case, 18 nucleic acid building blocks are generated based on the sequence of each of the eight precursor templates, for a total of 144 nucleic acid building blocks (or double-stranded oligos). Then, by performing the ligation reconstitution procedure, a library of progeny molecules containing 818 (or more than 1.8 x 1016) chimera production will be generated.
[0232]
The in vitro recombination method of the invention can be performed blindly on a pool of unknown hybrids or alleles of a particular polynucleotide or sequence. However, it is necessary that the actual DNA or RNA sequence of a particular polynucleotide be known.
[0233]
An approach that uses recombination within a mixed population of genes can help generate any useful protein, for example, interleukin I, antibodies, tPA, and growth hormone. This approach can be used to generate proteins with altered specificity or activity. This approach can also be useful in generating hybrid nucleic acid sequences, for example, promoter regions, introns, exons, enhancer sequences, 31 untranslated regions, or 51 untranslated regions of a gene. Thus, this approach can be used to generate genes with increased rates of expression. This approach can also be useful in the study of repetitive DNA sequences. Finally, this approach can help mutate ribozymes or aptamers.
[0234]
The present invention provides a method for selecting a subset of polynucleotides from a starting set of polynucleotides, the method comprising selecting for each selectable polynucleotide (positive selection) and / or selecting against it (negative selection). Is performed based on the ability to identify one or more selectable features (or selectable markers) present somewhere in the working polynucleotide. In one aspect, the provided method is referred to as end selection, which is based on the use of selectable markers located in part or all in the terminal region of the selectable polynucleotide, such selectable markers comprising "terminal Sometimes referred to as a "selection marker."
[0235]
End selection can be based on the detection of naturally occurring sequences, or based on the detection of experimentally introduced sequences (including by any mutagenesis described herein and not described). Or even within the same polynucleotide, based on both of these. The end selection marker can be a structural or functional selection marker, or a structural and functional selection marker. The terminal selectable marker can include a polynucleotide sequence, or polypeptide sequence, or any chemical structure, or any biological or biochemical tag, including radioactivity, enzymatic activity, fluorescence, Includes optional optical features, magnetic properties (such as the use of magnetic beads), immunoreactivity, and markers selectable using methods based on detection of hybridization.
[0236]
End selection can be applied in combination with any method that performs mutagenesis. Such mutagenesis methods include, in part, the methods described herein (above and below). Such methods include, by way of non-limiting illustration, any method that may be referred to herein or by one of skill in the art by any of the following terms: “saturation mutation”, “shuffling”, “recombination” "Reconstruction", "error-prone PCR", "assembly PCR", "sexual PCR", "crossover PCR", "oligonucleotide primer-directed mutagenesis", "recursive (and / or exponential) ensemble mutation" Production (see Arkin and Uban, 1992) "," Cassette Mutagenesis "," In Vivo Mutagenesis ", and" In Vitro Mutagenesis ". In addition, end selection can be performed on molecules generated by any mutagenesis and / or amplification method (see Arnold, 1993, Caldwell and Joyce, 1992, Stema, 1994, etc.) Following, it is desirable to select the desired progeny molecule (including screening for its presence).
[0237]
In addition, end selection can be applied to polynucleotides unrelated to any mutagenesis method. In one embodiment, end selection can be used to facilitate a cloning step, such as a step of ligation with another polynucleotide (including ligation with a vector), as defined herein. Thus, the present invention provides end selection as a means to facilitate library construction, selection, and / or enrichment, and general cloning, of desired polynucleotides.
[0238]
In another embodiment, the end selection can be based on a (positive) selection for the polynucleotide; alternatively, the end selection can be based on a (negative) selection for the polynucleotide. Alternatively, the terminal selection can be based on both (positive) and (negative) selection for the polynucleotide. End selection can be performed in an iterative manner, along with other selection and / or screening methods, in which similar or dissimilar selection and / or screening methods and mutagenesis or directed evolution methods are optional. , All of which can be performed in an iterative manner, in any order, combination, and permutation. In addition, end selection can be circular (eg, a plasmid or any other circular vector, or any other polynucleotide that is partially circular), and / or branched, and / or modified or replaced by any chemical group or moiety. It can also be used to select polynucleotides in a state.
[0239]
In one non-limiting embodiment, the end-selection of the linear polynucleotide is performed by using at least one end-selection marker located at or near the end of the polynucleotide (which can be 5 'or 3'). Is performed using a general approach based on the presence of In one specific, non-limiting, illustrative form, end selection is based on the selection of a particular sequence at or near the end, including those recognized by enzymes that recognize polynucleotide sequences. Enzymes that recognize and catalyze chemical modifications of polynucleotides are referred to herein as polynucleotide acting enzymes. In a preferred embodiment, the polynucleotide acting enzyme is an enzyme having a polynucleotide cleavage activity, an enzyme having a polynucleotide methylation activity, an enzyme having a polynucleotide ligation activity, and a plurality of distinguishable enzyme activities (for example, (Exclusively including polynucleotide cleavage activity and polynucleotide ligation activity).
[0240]
Related polynucleotide acting enzymes include any enzymes known to those of skill in the art (e.g., commercially available), or are currently not available to help generate ligation compatible ends, preferably cohesive ends, in the polynucleotide. Is understood to include those that may be developed in the future. Use a restriction site that is not, is not expected to be, or is unlikely to be contained within the polynucleotide to be end-selected (eg, when the sequence information for the working polynucleotide is incomplete). May be preferred. It is recognized that methods (eg, mutagenesis methods) can be used to remove unnecessary internal restriction sites. In addition, partial digestion reactions (i.e., digestion reactions that go to partial completion) are used to achieve digestion at the recognition site in the terminal region to produce susceptibility generated within the polynucleotide and recognized by the same enzyme. It is understood that it is possible to leave certain restriction sites. In one aspect, partial digestion is useful because, depending on the location and environment in which the recognition sequence occurs, it is understood that certain enzymes will exhibit preferential cleavage of the same recognition sequence.
[0241]
In addition, the use of protection methods to selectively protect certain restriction sites (such as internal sites) from unnecessary digestion by enzymes that cut the working polypeptide in response to the presence of such sites. Such protection methods include modifications such as methylation and base substitution (eg, replacing T with U) to suppress unwanted enzyme activity.
[0242]
In another embodiment of the invention, a useful end selectable marker is an end sequence recognized by a polynucleotide acting enzyme that recognizes a particular polynucleotide sequence. In one aspect of the invention, useful polynucleotide acting enzymes further include other enzymes in addition to the standard type II restriction enzymes. According to this preferred aspect of the invention, useful polynucleotide acting enzymes further include gyrase (such as topoisomerase), helicase, recombinant enzymes, relaxase, and any enzymes related thereto.
[0243]
It is understood that end selection can be used to distinguish and separate parent template molecules (such as those that have undergone mutagenesis) from progeny molecules (such as those generated by mutagenesis). For example, a first set of primers lacking a topoisomerase I recognition site can be used to modify the terminal region of the parent molecule (eg, in a polymerase-based amplification). A second set of different primers (such as those having a topoisomerase I recognition site) can then be used to generate mutated progeny molecules from the amplified parent molecule (eg, intermittent synthesis, template switching polymerase). Using any polynucleotide chimerization method, such as base amplification, or intermittent synthesis, or using a saturation mutation, or any other method that introduces a topoisomerase I recognition site into the mutated progeny molecule. By using.) The use of topoisomerase I-based end selection then facilitates selective topoisomerase I-based ligation as well as identification of the desired progeny molecule.
[0244]
It is understood that the end selection approach using topoisomerase-based nicking and ligation has several advantages over previously available selection methods. In short, with this approach, directional cloning (including expression cloning) can be achieved.
[0245]
FIG. 3 illustrates the application of end-selection using a topoisomerase-induced selection step to select a desired polynucleotide (eg, to select a full-length molecule) generated by polynucleotide rearrangement (eg, by synthetic ligation rearrangement). FIG. FIG. 4 illustrates various aspects of the end selection technique. This includes a method of end selection in in vitro rearranged genes, which includes the following steps: a) amplifying a given gene with a gene-specific primer template: chromosomal DNA / λ clone / genome Clone / optional subclone DNA, b) Performing recombinant PCR: add general topo cloning primer to mixed PCR product from homologous gene, PCR can be performed, for example, at 5 min 94 ° C, 80 x (30 sec 94 C) performing directed expression cloning: gel-purifying the reconstituted PCR product and binding topoisomerase to vaccinia virus (optimal molar ratio is DNA: enzyme). , 1: 5), add vector (double the amount of insertion), and transformants are screened. FIG. 5 illustrates the use of the enzyme N.I. to introduce "sticky ends" into the original blunt-ended DNA in order to achieve directed expression cloning of the original blunt-ended DNA. 9 illustrates a particular embodiment of the end-selection technique in which the step of "c) performing directed expression cloning" is accomplished using BstNBl.
[0246]
The method can be used to shuffle a polynucleotide sequence selected by a peptide display method by in vitro and / or in vivo recombination with any disclosed method and any combination thereof, wherein The relevant polynucleotide encodes a display peptide that has been screened for a phenotype (such as affinity for a given receptor (ligand)).
[0247]
An aspect of increasing importance in biopharmaceutical drug development and molecular biology is the identification of peptide structures that include the primary amino acid sequence of peptides or peptidomimetics that interact with biological macromolecules. One method of identifying a peptide that possesses a desired structural or functional property, such as binding to a defined biological macromolecule (such as a receptor), involves individualized possession of the desired structural or functional property provided by the amino acid sequence of the peptide. Screening large libraries or peptides for library components is involved.
[0248]
In addition to direct chemical synthesis methods for generating peptide libraries, several recombinant DNA methods have also been reported. One type involves the display of peptide sequences, antibodies, or other proteins on the surface of bacteriophage particles or cells. In general, in such methods, each bacteriophage particle or cell serves as a separate library member that displays a single species of display peptide in addition to the native bacteriophage or cellular protein sequence. Each bacteriophage or cell contains nucleotide sequence information that encodes a particular display peptide sequence, and thus the display peptide sequence can be ascertained by determining the nucleic acid sequence of the separated library components.
[0249]
Widely known peptide display methods involve the display of peptide sequences on the surface of filamentous bacteriophage, usually as a fusion with a bacteriophage coat protein. This bacteriophage library can be cultured with a fixed macromolecule or a small molecule (such as a receptor) immobilized, and bacteriophage particles displaying a peptide sequence that binds to the immobilized macromolecule can be cultured with the predetermined macromolecule. Can be distinguished from those that do not display peptide sequences that bind to The bacteriophage particles (ie, library components) that bind to the immobilized macromolecule are then recovered and replicated, amplifying the selected bacteriophage subpopulation for subsequent rounds of affinity enrichment and phage replication. can do. After several rounds of affinity enrichment and phage replication, the bacteriophage library components selected in this way are separated and the nucleotide sequence encoding the display peptide sequence is determined, whereby the defined macromolecules (such as receptors) )) Are identified. Such methods are further described in PCT Patent Publications WO 91/17271, WO 91/18980, WO 91/19818, and WO 93/08278.
[0250]
The present invention further provides peptide libraries of random, pseudorandom, and defined sequence frameworks and useful compounds (single-chain antibodies) that bind to a given receptor molecule or epitope or a gene product that modifies a peptide or RNA in a desired manner. And methods for generating and screening such libraries to identify peptides comprising Random, pseudorandom, and predefined sequence framework peptides are generated from a library of peptide library components, including display peptides or display single-chain antibodies, that attach the display peptide to the synthesized polynucleotide template. The form of attachment can vary depending on the particular embodiment of the invention chosen, and can include encapsulation within phage particles or uptake within cells.
[0251]
A great advantage of the present invention is that no prior information about the expected ligand structure is required to separate a given peptide ligand or antibody. The peptide identified can have biological activity, which means that it contains at least a specific binding affinity for the selected receptor molecule, and the ability to block the binding of other compounds And the ability to stimulate or inhibit metabolic pathways, the ability to act as a signal or messenger, the ability to stimulate or inhibit cell activity, and others.
[0252]
The invention further relates to heterodimers identified by the methods of the invention and binding to defined receptors (such as mammalian proteinaceous receptors, such as peptide hormone receptors, cell surface receptors, other protein (s)). Nascent peptides (single-chain antibodies) for library components that bind to intracellular proteins that form intracellular protein complexes, such as, etc., or epitopes (immobilized proteins, glycoproteins, oligosaccharides, etc.) Methods of Shuffling a Pool of Selected Polynucleotide Sequences by Affinity Screening a Library of Polysomes That Display
[0253]
The polynucleotide sequences selected in the first round of selection (usually by affinity selection for binding to the receptor (ligand)) by any of these methods are pooled, and the pool (s) are pooled in vitro and Alternatively, shuffled by in vivo recombination to produce a shuffled pool containing a population of recombinantly selected polynucleotide sequences. The recombined selection polynucleotide sequence is subjected to at least one post selection round. Polynucleotide sequences selected in the round (s) of post-selection can be used directly for the sequence, and / or can be subjected to shuffling and post-selection in one or more additional rounds. The selected sequence can also be backcrossed with a polynucleotide sequence that encodes a native sequence (ie, one that has no substantial functional effect on binding), for example, a native sequence that may be less immunogenic. Can be backcrossed with a wild-type or naturally occurring sequence that is substantially identical to the selected sequence. Generally, during backcrossing, post-selection is applied to maintain the binding properties with a given receptor (ligand).
[0254]
The sequence can be mutagenized before or simultaneously with shuffling of the selected sequence. In one embodiment, the selected library components are cloned in a prokaryotic vector (eg, a plasmid, phagemid, or bacteriophage), which produces a collection of individual colonies (or plaques) that represent the individual library components. Is done. The individual selected library components can then be manipulated to generate a set of library components that represent a core of sequence diversity based on the sequence of the selected library components (eg, site-directed mutations). Generation, cassette mutagenesis, chemical mutagenesis, PCR mutagenesis, and others). The sequences of the individual selected library members or pools can be random mutations, pseudo-random mutations, and defined core mutations (ie, including mutation and invariant residue positions, and / or defined amino acid residues). Segmented or over the entire length of the individual selected library component sequence to incorporate the variant residue positions including residues selected from the subset), codon-based mutations, and others. , Can be operated. The mutagenized selected library components are then shuffled by the in vitro and / or in vivo recombinant shuffling disclosed herein.
[0255]
The invention further provides a peptide library comprising a plurality of individual library components of the invention, wherein (1) each individual library component in said plurality shuffles a pool of selected sequences. (2) each individual library component is a variable peptide segment sequence or a variable peptide segment sequence or a single chain antibody segment sequence that is distinguishable from the variable peptide segment sequence or single chain antibody segment sequence of the other individual library components in the plurality. Contains single-chain antibody segment sequences (although some library components may be present in more than one copy per library due to unequal amplification, stochastic potential, or otherwise) .
[0256]
The present invention further provides a product-by-process, wherein a selected polynucleotide sequence having a defined binding specificity (or encoding a peptide having the same) is formed by the following process. : (1) To screen a display peptide or display single-chain antibody library for a given receptor (eg, ligand) or epitope (eg, antigenic macromolecule), and to generate a pool of selected library components, Identifying and / or enriching a library component that binds to a receptor or epitope of (2) a selected library component that binds to a predetermined epitope, thereby being separated and / or enriched from the library (or amplified or cloned thereof) Copy), shuffled library Shuffling recombinantly to produce; (3) shuffling the shuffled library against a given receptor (eg, ligand) or epitope (eg, antigenic macromolecule); and selecting a pool of shuffled library components. Identifying and / or enriching shuffled library components that bind to a given receptor or epitope to generate.
[0257]
The method can be used to shuffle a polynucleotide sequence selected by an antibody display method by in vitro and / or in vivo recombination with any disclosed method and any combination thereof, wherein Related polynucleotides encode display antibodies that have been screened for phenotype, such as affinity for binding to a given antigen (ligand).
[0258]
Various molecular genetic approaches have been devised to capture the vast immunological repertoire represented by the large number of distinct variable regions that may be present in the immunoglobulin chains. The naturally occurring germline immunoglobulin heavy chain locus contains an isolated tandem sequence of the variable segment gene, which is located upstream of the tandem sequence of the diversity segment gene, and is itself a tandem sequence of the junctional (i) region gene. Which is located upstream of the constant region gene. During B lymphocyte development, a VDJ rearrangement occurs in which rearrangements forming the fusion D segment form the heavy chain variable region gene (VH), followed by rearrangement of the V segment. Form a VDJ conjugation product gene, which, when productively rearranged, encodes a heavy chain functional variable region (VH). Similarly, the light chain locus rearranges one of several V segments with one of several J segments to form a gene encoding the variable region (LV) of the light chain.
[0259]
The vast repertoire of variable regions possible in immunoglobulins is due, in part, to the myriad possible combinations of joining V and i segments (and, in the case of heavy chain loci, D segments) during rearrangement in B cell development. Derived from sex. Additional sequence diversity in the heavy chain variable region results from heterogeneous rearrangement of the D segments during the VDJ junction and the addition of N regions. In addition, antigen selection of identified B cell clones selects for high affinity variants with non-germline mutations in one or both of the heavy and light chain variant regions, a phenomenon which is referred to as "affinity mutations". Or, it is called “affinity sharpening”. Usually, such "affinity sharpening" mutations are concentrated in specific areas of the variable region, most commonly in the complementarity determining regions (CDRs).
[0260]
To overcome a number of limitations in producing and identifying high affinity immunoglobulins through the generation of antigen-stimulated β cells (ie, immunization), various prokaryotic expression systems have been developed, It can be manipulated to generate a combinatorial antibody library that can screen for high affinity antibodies to the antigen. With recent advances in the expression of antibodies in Escherichia coli and bacteriophage systems (see "Alternate Peptide Display Methods" below), cloning antibody genes from characterized hybridomas, or using antibody gene libraries (eg, from Ig cDNAs) ) Increased the possibility of obtaining virtually any specificity.
[0261]
Combinatorial libraries of antibodies have been generated in bacteriophage lambda expression systems that can be screened as bacteriophage plaques or as lysogen colonies (Hughes et al., 1989, Caton and Koplowski, 1990, Marinax et al., 1990, Person et al. 1991). Various embodiments of bacteriophage antibody display libraries and phage lambda expression libraries have been described (Kang et al., 1991; Crackson et al., 1991; McCaferty et al., 1990; Burton et al., 1991; Hugenboom et al., 1991; 1991, Breitling et al., 1991, Marks et al., 1991, p581, Barbus et al., 1992, Hawkins and Winter, 1992, Marks et al., 1992, p779, Marks et al., 1992, p16007, and Roman et al., 1991, Lana et al. 1992, all of which are hereby incorporated by reference. Typically, bacteriophage antibody display libraries contain immobilized (eg, by covalent attachment to a chromatography resin for enriching reactive phage by affinity chromatography) and / or labeled (screening for plaque or colony lift). (Polypeptides, carbohydrates, glycoproteins, nucleic acids, etc.).
[0262]
One particular advantageous approach has been the use of so-called single-chain variable fragment (scfv) libraries (Marks et al., 1992, p779, Winter and Milstein, 1991, Cracson et al., 1991, Marks et al., 1991, p581. Chodoli et al., 1990; Chiswell et al., 1992; McCaferty et al., 1990; and Houston et al., 1998). Various embodiments of a scfv library displayed with bacteriophage coat proteins have been described.
[0263]
Since 1988, single-chain analogs and their fusion proteins have been reliably produced by antibody engineering methods. The first step usually involves obtaining genes encoding VH and VL domains with the desired binding properties, such V genes being selected from a combinatorial V gene library or generated by V gene synthesis. Can be isolated from certain hybridoma cell lines. The single-chain Fv encodes the component V gene with a properly designed linker peptide such as (Gly-Gly-Gly-Gly-Ser (SEQ ID NO: 3)) or equivalent linker peptide (s). It is formed by connecting to an oligonucleotide to be converted. The linker bridges the C-terminus of the first V region and the N-terminus of the second, in the order of VH-linker-VL or VL-linker-VH '. In principle, the scfv binding site can faithfully replicate both the affinity and specificity of the parent antibody binding site.
[0264]
Thus, scfv fragments contain VH and VL domains linked by a flexible linker peptide to a single polypeptide chain. After the scfv genes have been assembled, they are cloned on a phagemid and expressed at the tip of M13 phage (or similar filamentous bacteriophage) as a fusion protein with a bacteriophage PIII (gene 3) coat protein. Enrichment of phage expressing a given antibody is achieved by panning recombinant phage displaying the scfv of a population for binding to a defined epitope (eg, target antigen, receptor).
[0265]
The linked polynucleotides of the library components provide a basis for replicating the library components after the screening or selection procedure, and also for determining the identity of the display peptide sequence or VH or VL amino acid sequence by nucleotide sequence. Provide the foundation. The display peptide (s) or single chain antibodies (such as scfv), and / or their VH and VL domains or their CDRs can be cloned and expressed in a suitable expression system. Polynucleotides encoding the separated VH and VL domains are linked to polynucleotides encoding the constant regions (CH and CL), and are used to encode whole antibodies (eg, chimeric or fully human), antibody fragments, and the like. Often, a polynucleotide to be encoded is formed. The polynucleotide encoding the separated CDRs can be grafted onto a polynucleotide encoding the appropriate variable region framework (and, optionally, the constant region), and a fully antibody (eg, humanized or fully human), Often, polynucleotides encoding antibody fragments, and others, are formed. Antibodies can be used to separate antigen reserves by immunoaffinity chromatography. Various uses for such antibodies include diagnosis and / or staging of diseases (such as tumorigenesis) and treatment of diseases such as, for example, tumorigenesis, autoimmune diseases, AIDS, heart disease, infections, and others. There are therapeutic uses for
[0266]
Various reports have been reported to increase the combinatorial diversity of scfv libraries and broaden the repertoire of binding species (idiotypic spectra). The use of PCR allows for the rapid cloning of variable regions from specific hybridoma sources or as a gene library from non-immunized cells, providing a combinatorial diversity for assortment of combinatorial VH and VL cassettes. Furthermore, VH and VL cassettes can diversify themselves by random, pseudo-random, or defined mutagenesis. Usually, the VH and VL cassettes are diversified at or near the complementarity determining region (CDRs), which is often the third CDR, CDR3. Enzymatic inverse PCR mutagenesis, like error-prone PCR and chemical mutagenesis (Den et al., 1994), should be a simple and reliable method of constructing a relatively large library of scfv site-directed hybrids Is shown (Stema et al., 1993). Leachman (Leachman et al., 1993) showed a semi-rational design of antibody scfv fragments using site-directed randomization by degenerate oligonucleotide PCR followed by phage display of the resulting scfv hybrid. Barbas (Barbas et al., 1992) randomized the sequence in the synthetic CDR regions of the human tetanus toxoid-binding Fab to avoid the problem of limited repertoire resizing resulting from the use of biased variable region sequences. Tried.
[0267]
CDR randomization is approximately 1 × 10 for heavy chain CDR3 only.20It has the potential to form CDRs, approximately the same number of variants of heavy chain CDR1 and CDR2, and light chain CDR1 to 3 variants. When considered individually or together, the combinatorial possibility of CDR randomization of heavy and / or light chains generates an inordinate number of bacteriophage clones to generate a clone library that represents all possible combinations And most of the combinations are non-binding. The generation of such a large number of primary transformants is not feasible with current transformation techniques and bacteriophage display systems. For example, Barbas (Barbas et al., 1992) is 5 × 107, Which represents only a small fraction of the potential diversity of a library of fully randomized CDRs.
[0268]
Despite these major limitations, bacteriophage display of scfv has already produced a variety of useful antibodies and antibody fusion proteins. Bispecific single-chain antibodies have been shown to mediate efficient tumor cell lysis (Gruba et al., 1994). Intracellular expression of anti-Rev scfv has been shown to suppress HIV-1 virus replication in vitro (Duan et al., 1994), and intracellular expression of anti-p2llar scfv was reduced in Xenopus oocytes. It has been shown to inhibit mitotic maturation (Biokka et al., 1993). Recombinant scfv that can be used to diagnose HIV infection has also been reported, demonstrating its importance in the diagnosis of scfv (Lilly et al., 1994). Fusion proteins where the scfv is linked to a second polypeptide, such as a toxin or fibrinolytic activator protein, have also been reported (Horbost et al., 1992; Nicholas et al., 1993).
[0269]
Given that it is possible to generate scfv libraries that have a wide range of antibody diversity and overcome many of the limitations of conventional CDR mutations and randomization that can cover only a very small fraction of potential sequence combinations The number and quality of scfv antibodies suitable for therapeutic and diagnostic applications is greatly improved. To address this, the CDRs obtained (usually via PCR amplification or cloning) from nucleic acids obtained from a selected display antibody using the in vitro and in vivo shuffling methods of the present invention are recombined. You. Such display antibodies can be displayed on cells, on bacteriophage particles, on polysomes, or in any suitable antibody display system in which the antibody relates to the encoding nucleic acid (s). As a mutation, the CDRs may be derived from plasma from immunized wild-type mice, humans, or transgenic mice capable of forming human antibodies, such as those found in antibody producing cells (eg, WO 92/03918, WO 93/12227, and WO 94/25585). Cells / splenocytes) from the mRNA (or cDNA), including the hybridomas derived therefrom.
[0270]
Polynucleotide sequences selected in a first round of selection (usually by affinity selection for display antibodies that bind to an antigen (such as a ligand)) by any of these methods are pooled, and the pool (s) are pooled. , In vitro and / or in vivo recombination, especially shuffling CDRs (usually shuffling heavy chain CDRs with other heavy chain CDRs and shuffling light chain CDRs with other light chain CDRs) and recombining A shuffled pool containing a population of the selected polynucleotide sequences is generated. The recombinant selection polynucleotide sequence is expressed in a selection format as a display antibody and subjected to at least one post-selection land. Polynucleotides selected in the post-selection round (s) can be sequenced directly and / or undergo one or more additional rounds of shuffling and post-selection until the desired binding affinity is obtained. be able to. The selected sequence can also be backcrossed with a polynucleotide sequence encoding a neutral antibody framework sequence (ie, one that has no substantial effect on antigen binding), for example, a human-like sequence antibody. It can be backcrossed with human variable regions to produce. Generally, during backcrossing, post-selection is applied to maintain the binding properties to the defined antigen.
[0271]
Alternatively or in combination with the described mutations, the valency of the target epitope can be altered to control the average binding affinity of the selected scfv library component. The target epitope can be bound to the surface or substrate at various concentrations, such as by including, diluting, or other methods known to those of skill in the art. High concentrations (valency) of a given epitope can be used to enrich scfv library components with relatively low affinity, whereas low concentrations (valency) can be used for high affinity scfv library The components can be preferentially concentrated.
[0272]
Insertion of a set of synthetic oligonucleotides encoding random, pseudo-random, or defined sequence core sets of peptide sequences into defined sites (such as CDRs) by ligation to generate diverse variable segments Can be. Similarly, extending the sequence diversity of one or more CDR (s) of the single chain antibody cassette (s) by site-directed mutagenesis, CDR substitution, and mutating the CDR (s) by other means. Can be. The resulting DNA molecule can be propagated in a host for cloning and amplification prior to shuffling, or can be used directly (i.e., the potential for occurring upon growth in a host cell). The selected library components are then shuffled (a certain loss of diversity can be avoided).
[0273]
Display peptide / polynucleotide complexes (library components) encoding predetermined various segmented peptide sequences or predetermined single chain antibodies are selected from the library by affinity enrichment techniques. This is achieved by means of immobilizing macromolecules or epitopes specific to a given peptide sequence, other macromolecules, or epitope species, such as receptors. Repeating the affinity selection procedure provides enrichment of library components that encode the desired sequence, which can then be pooled and shuffled, sequenced, and / or separated for further growth and affinity enrichment. it can.
[0274]
Library components without the desired specificity are removed by washing. The degree and intensity of washing required is determined for each peptide sequence or given single-chain antibody and the immobilized predefined macromolecule or epitope. By adjusting the conditions of the binding culture and subsequent washing, some control can be exerted on the binding properties of the recovered nascent peptide / DNA complex. Temperature, pH, ionic strength, divalent cation concentration, and amount and duration of washing are selected for nascent peptide / DNA complexes that exhibit an affinity for immobilized macromolecules within a specified range. be able to. Usually, selection based on low off-rates, where high affinity is expected, is often the most practical route. This can be accomplished by continuous culturing in the presence of a predetermined amount of macromolecule, free of saturation, or by increasing the amount, number and length of washes. In each case, reassociation of dissociated nascent peptide / DNA or peptide / RNA complexes is prevented and over time, higher affinity nascent peptide / DNA or peptide / RNA complexes are recovered. You.
[0275]
Additional modifications of the coupling and washing procedures can be applied to find peptides with particular characteristics. The affinity of some peptides changes depending on ionic strength or cation concentration. This is a useful feature for peptides used in affinity purification of various proteins when mild conditions are required to remove the protein from the peptide.
[0276]
One variation involves using multiple binding targets (multiple epitope species, multiple receptor species) and allowing the scfv library to be screened simultaneously for multiple scfv with different binding specificities. It is. Since the size of the scfv library often limits the diversity of possible scfv sequences, it is usually desirable to use the largest possible size of the scfv library. The time and economic considerations for generating a number of very large polysomal scFv display libraries can be quite large. To avoid these major problems, multiple defined epitope species (receptor species) can be screened together in a single library, or sequential screening for multiple epitope species can be used. . In one variation, multiple target epitope species, each encoded on a separate bead (or a subset of beads), can be mixed and cultured with a polysome-displayed scfv library under appropriate binding conditions. This set of beads contains multiple epitope species, which can then be used to separate scfv library components by affinity selection. In general, subsequent affinity screening rounds can include the same mixture of beads, a subset thereof, or beads containing only one or two individual epitope species. This approach provides efficient screening and is compatible with laboratory automation, batch processing, and high-throughput screening methods.
[0277]
In the present invention, various techniques are used to diversify a peptide library or a single-chain antibody library, or the variable regions discovered in an earlier round of panning before or in conjunction with shuffling. Repair peptides can be diversified to obtain sufficient binding activity for a given macromolecule or epitope. In one approach, a positive selection peptide / polynucleotide complex (identified in an early round of affinity enrichment) is sequenced to determine the identity of the active peptide. Oligonucleotides are then synthesized based on these active peptide sequences, utilizing low levels of all bases incorporated at each step to generate subtle changes in the primary oligonucleotide sequence. This mixture of (slightly) degenerate oligonucleotides is then cloned at appropriate positions in the various segment sequences. This method results in a systematic and controlled mutation of the starting peptide sequence, which can then be shuffled. However, individual positive nascent peptide / polynucleotide complexes need to be sequenced before mutagenesis, thus extending the diversity of the small number of recovered complexes, increasing affinity and / or higher binding. It is useful for selecting mutants having specificity. As a mutation, in mutagenic PCR amplification of a positive selection peptide / polynucleotide complex (especially of the variable region sequence), the amplification product is shuffled in vitro and or in vivo, and prior to sequencing, One or more additional rounds of screening are performed. The same general approach is to extend diversity and enhance binding affinity / specificity by diversifying CDRs or adjacent framework regions, usually before or in conjunction with shuffling. It can be used in single chain antibodies. If desired, the shuffling reaction can include mutagenic oligonucleotides that can be recombined in vitro with selected library components that can be included. Thus, a mixture of synthetic oligonucleotides and PCR-generated polynucleotides (synthesized by error prone or high fidelity methods) can be added to an in vitro shuffling mixture, resulting in a shuffled library construct Can be incorporated into elements (shuffled).
[0278]
The shuffling of the present invention can generate a vast library of CDR-mutated single-chain antibodies. One way to generate such antibodies is to insert the synthetic CDRs into a single-chain antibody and / or CDR randomization before or in conjunction with shuffling. The sequence of the synthetic CDR cassette is selected by reference to the known sequence data of the human CDRs and selected at the practitioner's discretion according to the following guidelines: It will have 40% positional sequence identity, and will preferably have at least 50-70% positional sequence identity to a known CDR sequence. For example, a set of synthetic CDR sequences can be generated by synthesizing a set of oligonucleotide sequences based on the naturally occurring human CDR sequences listed in Kabat (Kabat et al., 1991), and (multiple) of the synthetic CDR sequences. 2.) The pool is calculated to encode CDR peptide sequences having at least 40 percent sequence identity to at least one known naturally occurring human CDR sequence. Instead, the set of naturally occurring CDR sequences is such that frequently used amino acids at residue positions (ie, in at least 5% of the known CDR sequences) are incorporated at corresponding position (s) in the synthetic CDR. The comparisons can be made to generate a consensus sequence. Typically, several (eg, 3 to about 50) known CDR sequences are compared, and the natural sequence variation observed between known CDRs is tabulated, and all or most of the observed natural sequence variation is tabulated. A set of oligonucleotides encoding the CDR peptide sequence encompassing the permutation is synthesized. As a non-limiting example, if the collection of human VH CDR sequences has a carboxy-terminal amino acid that is either Tyr, Val, Phe, or Asp, the pool (s) of synthetic CDR oligonucleotide sequences will have a carboxy-terminal CDR residue. The group is designed to be able to be any of these amino acids. In some embodiments, residues other than those that occur naturally at residue positions in the set of CDR sequences are incorporated, in which conservative amino acid substitutions are incorporated at a high frequency, and the known naturally occurring CDR sequences have By comparison, up to five residue positions can be changed to incorporate non-conservative amino acid substitutions. Such CDR sequences can be used in the primary library component (prior to the first round of screening) and / or can be used to add to the in vitro shuffling reaction of the selected library component sequence. it can. Construction of such a pool of defined and / or degenerate sequences is readily achievable by those skilled in the art.
[0279]
The set of synthetic CDR sequences includes at least one component that is not known to be a naturally occurring CDR sequence. Whether or not to include a portion of the random or pseudo-random sequence corresponding to the N-region addition in the heavy chain CDRs is included in the judgment of the practitioner, and the N-region sequence may be one nucleotide to It is in the range of about 4 nucleotides. The set of synthetic heavy chain CDR sequences comprises at least about 100 unique CDR sequences, usually comprises at least about 1,000 unique CDR sequences, and preferably comprises at least about 10,000 unique CDR sequences. And frequently contains more than 50,000 unique CDR sequences; however, typically about 1 × 106The following unique CDR sequences are included in the set, but in some cases, especially at positions where conservative amino acid substitutions are absent or rare (ie, less than 0.1 percent) at the same position in naturally occurring human CDRs. 1 × 10 if conservative amino acid substitutions are possible7~ 1 × 108There are unique CDR sequences. In general, the number of unique CDR sequences contained in a library should not exceed 10 times the expected number of primary transformants in the library. Such single chain antibodies generally bind at least 1 × 10 m −, preferably at least about 5 × 107M-1 affinity, more preferably at least about 1 × 108M-1 to 1 × 109M-1 or higher affinity, sometimes 1 × 1010M-1 or more. Predetermined antigens are frequently human proteins, eg, human cell surface antigens (eg, CD4, CD8, IL-2 receptor, EGF receptor, PDGF receptor), and other human biological macromolecules (eg, Thrombomodulin, protein C, sugar chain antigen, sialyl Lewis antigen, L-selectin) or non-human disease-related macromolecules (eg, bacterial LPS, virion capsid protein, or envelope glycoprotein), and others.
[0280]
High affinity single chain antibodies of the desired specificity can be engineered and expressed in a variety of systems. For example, scfv has been produced in plants (Philek et al., 1993) and can easily be made in prokaryotic systems (Owen and Young, 1994; Johnson and Bird, 1991). In addition, single-chain antibodies can be used as a basis for constructing whole antibodies or various fragments thereof (Kettlebarlow et al., 1994). The variable regions encoding the sequences may be separated (eg, by PCR amplification or subcloning) and encoded using the desired human constant to encode a human sequence antibody suitable for human therapeutic use, preferably minimizing immunogenicity. The region can be spliced into a coding sequence. The resulting polynucleotide (s) having the fully human coding sequence (s) can be expressed in a host cell (eg, from a mammalian cell expression vector) and purified for drug formulation. .
[0281]
After expression, the antibodies, individual mutant immunoglobulin chains, mutant antibody fragments, and other immunoglobulin polypeptides of the invention can be purified according to standard procedures in the art, This includes ammonium sulfate precipitation, fraction column chromatography, gel electrophoresis, and others (see generally, Scopes, 1982). After purification, partially or to the desired homogeneity, the polypeptide can be used therapeutically, or used in the development and performance of assay procedures, immunofluorescent staining, and the like (generally , Lefkovitz and Parnis, 1979 and 1981; Lefkovitz, 1997).
[0282]
Antibodies generated by the methods of the present invention can be used for diagnosis and therapy. By way of example and not limitation, they can be used to treat cancer, autoimmune diseases, or viral infections. For the treatment of cancer, the antibody will normally bind to an antigen that is preferentially expressed on cancer cells, including erB-2, CEA, CD33, and other antigens widely known to those of skill in the art. Many antigens and binding elements are included.
[0283]
Shuffling can also be used to recombine and diversify the pool of library components obtained by the two-hybrid screening system and identify library components that bind to a given polypeptide sequence. The selected library components are pooled and shuffled by in vitro and / or in vivo recombination. The shuffled pool is then screened in an yeast-to-hybrid system, and library components that bind to the predetermined polypeptide sequence (eg, SH2 domain), or alternative predetermined polypeptide sequences (eg, another protein species). Library component that binds to the SH2 domain from SH2).
[0284]
Approaches to identify polypeptide sequences that bind to a given polypeptide sequence have used a so-called "two-hybrid" system in which the given polypeptide sequence is present in the fusion protein (Shang et al., 1991). This approach identifies protein-protein interactions in vivo through rearrangement of the transcriptional activator, yeast Gal4 transcribed protein (Fields and Song, 1989). Usually, this method is based on the properties of the yeast Gal4 protein, which is composed of separable domains that cause DNA binding and transcriptional activation. A polynucleotide encoding a two-hybrid protein, one composed of a yeast Gal4 DNA binding domain fused to a polypeptide sequence of a known protein and the other a Gal4 activation domain fused to a polypeptide sequence of a second protein The construct is constructed and introduced in a yeast host cell. The intermolecular binding between the two fusion proteins reconstitutes the Gal4 DNA binding domain with the Gal4 activation domain, which is the transcriptional activity of a receptor gene (eg, lacZ, HIS3) that is operatively linked to the Gal4 binding site. Will lead to Usually, the two-hybrid method is used to identify new polypeptide sequences that interact with known proteins (Silva & Hunt, 1993, Darphy et al., 1993, Yang et al., 1992, Luban et al., 1993, Hardy et al. , 1992, Bartel et al., 1993, and Boyek et al., 1993). However, two-hybrid mutations have been used to identify mutations in known proteins that affect binding to a second known protein (Lee and Fields, 1993; Lalo et al., 1993; Jackson et al. 1993, and Madou et al., 1993). The two-hybrid system can be used to interact the structural domains of two known proteins (Birdwell et al., 1993, Chakraberti et al., 1992, Staudinger et al., 1993, and Milne and Weaver, 1993), or the oligos of a single protein It has also been used to identify regions that cause lysis (Iwabuchi et al., 1993, Bogard et al., 1993). Mutations in the two-hybrid system have been used to study the in vivo activity of proteolytic enzymes (Dasmasha Patra et al., 1992). Instead, E. The E. coli / BCCP two-way screening system (Germino et al., 1993, Guarente, 1993) can be used to identify interacting protein sequences (ie, protein sequences that heterodimerize or form the upper heteromultimers). Sequences selected by the two-hybrid system are pooled and shuffled and introduced into the two-hybrid system for one or more subsequent rounds of screening to identify polypeptide sequences that bind to the hybrid, including the defined binding sequence can do. The sequences thus identified can be compared to identify the consensus sequence (s) and the core of the consensus sequence.
[0285]
One microgram sample of the template DNA is obtained and treated with ultraviolet light to form a dimer containing a TT dimer, especially a purine dimer. Ultraviolet light exposure is limited so that only a small amount of photoproduct is generated for each gene in the template DNA sample. A large number of samples are treated with ultraviolet light for varying lengths of time to obtain template DNA samples with different numbers of dimers due to ultraviolet light exposure.
[0286]
Using a random priming kit utilizing a non-proofreading polymerase (e.g., the Stratagene Cloning Systems Prime-It II Random Primer Labeling kit), the primary immunization is performed at random sites on the template created by ultraviolet light (as described above). Performing and extending along the template produces polynucleotides of various sizes. A prime immunization protocol as described in the Prime-It II Random Primer Labeling kit can be used to extend primers. Dimers formed by UV exposure serve as obstacles to extension by non-proofreading polymerases. Thus, after completion of the random primer extension, there is a pool of polynucleotides of random size.
[0287]
The present invention is further directed to a method of producing a selection mutant polynucleotide sequence (or a population of selection polynucleotide sequences), usually in the form of an amplified and / or cloned polynucleotide, The selected polynucleotide sequence (s) can be selected from at least one desired phenotypic characteristic (e.g., encoding a polypeptide, promoting transcription of a linked polynucleotide, binding a protein, and Other). One method of identifying hybrid polypeptides that possess desirable structural or functional properties, such as binding to a defined biological macromolecule (such as a receptor), possesses the desirable structural or functional properties conferred by the amino acid sequence of the polypeptide. Screening large libraries of polypeptides for individual library components.
[0288]
In one embodiment, the invention provides a method of generating a library of display polypeptides or display antibodies suitable for affinity interaction screening or phenotypic screening. The method comprises: (1) obtaining a first plurality of selected library components comprising a display polypeptide or display antibody and a related polynucleotide encoding the display polypeptide or display antibody; and Obtaining a copy thereof, wherein said related polynucleotide comprises a region of sequence that is substantially identical, appropriately introducing a mutation into said polynucleotide or copy, and (2) pooling said polynucleotide or copy. (3) generating small or short polynucleotides by interrupting the random or specialized priming and synthesis or amplification processes; and (4) homologating newly synthesized polynucleotides. Amplification, preferably PCR amplification, for recombination And and performing an optional mutagenesis.
[0289]
It is an object of the present invention to provide a process for producing a hybrid polynucleotide that expresses a useful hybrid polypeptide by a series of steps including:
[0290]
(A) interrupting the polynucleotide amplification or synthesis process by means of inhibiting or interrupting the amplification or synthesis process to provide a plurality of small or short polynucleotides by replication of the polynucleotide at various completion stages; Producing nucleotides,
(B) adding one or more single-stranded or double-stranded oligonucleotides to the resulting single-stranded or double-stranded polynucleotide, wherein said additional oligonucleotides are one or more single-stranded or Including an area of identity in the heterogeneous structural area with the double-stranded polynucleotide,
(C) denaturing the resulting single- or double-stranded oligonucleotides, optionally separating short or small polynucleotides into pools of polynucleotides of various lengths, and optionally, at least Subjecting said polynucleotide to a PCR procedure to amplify one or more oligonucleotides contained in one said polynucleotide pool;
(D) annealing of the single-stranded polynucleotide occurs in a region of identity between the single-stranded polynucleotides, and under the condition that a double-stranded polynucleotide chain due to mutation is formed, a plurality of the polynucleotides or the polynucleotides Culturing at least one pool of nucleotides with a polymerase;
(E) optionally repeating steps (c) and (d);
(F) expressing at least one hybrid polypeptide from the polynucleotide chain or a plurality of chains;
(G) screening said at least one hybrid polypeptide for useful activity.
[0291]
In one aspect of the invention, the means of inhibiting or interrupting the amplification or synthesis process is through the use of ultraviolet light, DNA adducts, and DNA binding proteins.
[0292]
In one embodiment of the present invention, the DNA adduct or polynucleotide containing the DNA adduct is separated from the polynucleotide or polynucleotide pool, such as by a process comprising heating the solution containing the DNA fragment prior to further processing. Removed.
[0293]
In another embodiment, a clone identified as having a given biomolecule or biological activity also includes, for example, a DNA sequence encoding a polypeptide (such as an enzyme), or the polypeptide sequence itself having a particular activity. Can be sequenced to Therefore, according to the present invention, (i) a DNA encoding a predetermined biological activity (for example, an enzyme having a specific enzymatic activity) and (ii) a biomolecule (for example, a polypeptide or an enzyme having such an activity ( (Including its amino acid sequence)) and (iii) the resulting recombinant biomolecule or biological activity.
[0294]
Suitable clones from the library (eg, 1 to 1000 or more clones) are identified by the methods of the invention and sequenced, for example, using high-throughput sequencing techniques. The exact method of sequencing is not a limiting factor of the present invention. Any method useful for identifying the sequence of a particular cloned DNA sequence can be used. Generally, sequencing is an adaptation of the natural process of DNA replication. For this purpose, a template (such as a vector) and a primer sequence are used. One of the common template generation and sequencing protocols begins with automated collection of bacterial colonies, each of which contains a separate DNA clone that serves as a template for a sequencing reaction. Selected clones are placed in culture medium and grown overnight. The DNA template is then purified from the cells and suspended in water. After quantification of the DNA, Applied Biosystems, Inc. High-throughput sequencing is performed using a sequencer such as the Prism 377 DNA Sequencer. The resulting sequence data can then be used in additional ways, including searching a database or multiple databases.
[0295]
A number of source databases containing nucleic acid sequences and / or deduced amino acid sequences for use in the present invention in identifying and determining the activity encoded by a particular polynucleotide sequence are available. All or a representative portion of the sequences to be tested (eg, 100 individual clones) are used simultaneously or individually to search a sequence database (eg, GenBank, PFAM, or ProDom). Many different ways to perform such a sequence search are known in the art. This database may be limited to a particular organism or set of organisms. For example, C.I. elegans, Arabadopsis. sp, M.P. genitalium, M.P. Jannaschii, E .; coli, H.E. influenzae, S.P. There is a database for cerevisiae and others. The sequence data of the clones is then aligned to the sequence of the database or databases using an algorithm designed to determine the homology of two or more sequences.
[0296]
Such sequence alignment methods include, for example, BLAST (Altschul et al., 1990), BLITZ (MPsrch) (Starlock and Collins, 1993), and FASTA (Person and Lippman, 1988). Probe sequences (eg, sequence data from clones) can be of any length and are recognized as homologous based on a homology threshold. This threshold can be a predefined one, but this is not required. This threshold can be based on the length of a particular polynucleotide. A number of different procedures can be used for sequence alignment. Usually, the Smith-Waterman or Needleman-Bunsch algorithm is used. However, as described, fast procedures such as BLAST, FASTA, and PSI-BLAST may be used.
[0297]
For example, the proper alignment of the sequences that line up the comparison window can be found in Smith's local homology algorithm (Smith and Waterman, Adv Appl. Math., 1981, Smith and Waterman, J. Teor Biol, 1981, Smith and Waterman, J Mol Biol, 1981, Smith Et al., J Mol Evol, 1981), Needleman's homology alignment algorithm (Needleman and Bunsch, 1970), Pearson's similarity search method (Pearson and Lippman, 1988), and computer implementation of such an algorithm (Madison, Wisconsin, 575). Science Dr., Wisconsin Genetics Software Package of Genetics Computer Group Release 7.0, or GAP, BESTFIT, FASTA, and TFASTA in the Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin, Madison, Wisconsin), or by any method that can be performed by inspection. The best alignment (ie, the one that produces the highest percentage homology over the comparison window) is selected. The similarity of the two sequences (ie, the probe sequence and the database sequence) can then be predicted.
[0298]
Such software matches similar sequences by assigning degrees of homology to various deletions, substitutions, and other modifications. The terms "homologous" and "identical" in the context of two or more nucleic acid or polypeptide sequences may refer to a comparison window or a sequence as determined using any number of sequence comparison algorithms or by manual alignment and visual inspection. Refers to two or more sequences or subsequences that have the same or specific percentage of amino acid residues or nucleotides that are the same or the same when compared and aligned with maximum correspondence across the designated regions.
[0299]
In sequence comparison, typically one sequence acts as a reference sequence, to which test sequences are compared. When using the sequence comparison algorithm, the test and reference sequences are loaded into a computer, where necessary specify small sequence coordinates, and specify sequence algorithm program parameters. Default program parameters can be used, or alternative parameters can be specified. Thereafter, the sequence comparison algorithm calculates the percent sequence identity of the test sequence relative to the reference sequence, based on the program parameters.
[0300]
A “comparison window”, as used herein, is any one of a series of positions selected from the group consisting of 20 to 600, usually about 50 to about 200, and more usually about 100 to about 150. It includes a reference to a number of segments in which, after properly aligning the two sequences, it is possible to compare the sequence to the same number of reference sequences at consecutive positions.
[0301]
One example of a useful algorithm is the BLAST and BLAST 2.0 algorithms, which are described in Altschul et al., Nuc. Acids Res. 25: 3389-3402 (1977) and Altshull et al. Mol. Biol. 215: 403-410 (1990). Software for performing BLAST analyzes is publicly available through the National Center for Biotechnology Information (http://www.ncbi.nlm.gov/). The algorithm involves first identifying high-scoring sequence pairs (HSPs) in the query sequence by identifying short words of length W, which are matched to words of the same length in the database sequence. When they are arranged side by side, they match or satisfy a threshold score T of some positive value. T is called the adjacent word score threshold (Altschul et al., Supra). These first adjacent word hits play a role in initiating a search to find long HSPs containing them. Word hits are extended in both directions, along each sequence, as long as the cumulative alignment score can be increased. Cumulative scores are calculated for nucleotide sequences using the parameter M (reward score for a pair of matching residues, always greater than 0). The BLAST algorithm parameters W, T, and X determine the sensitivity and speed of the alignment. The BLAST program (for nucleotide sequences) uses as defaults a word length (W) of 11, an expectation (E) of 10, M = 5, N = 4, and a comparison of both strands.
[0302]
The BLAST algorithm also performs a statistical analysis of the similarity between the two sequences (see, eg, Carlin & Altshull, Proc. Natl. Acad. Sci. USA 90: 5873 (1993)). One measure of similarity provided by the BLAST algorithm is the minimum sum probability (P (N)), which provides an indication of the probability that a match between two nucleotide sequences will occur by chance. For example, a nucleic acid is considered similar to a reference sequence if the minimum sum probability in comparison of the test nucleic acid to the reference nucleic acid is less than about 0.2, more preferably, less than about 0.01, and most preferably, less than about 0.001. It is.
[0303]
Sequence homology means that the two polynucleotide sequences are homologous (compare nucleotide by nucleotide) over the window of comparison. The percentage of sequence identity or homology is determined by comparing two properly aligned sequences over the entire window of comparison, and by comparing nucleobases identical in both sequences (eg, A, T, Determine the number of positions where C, G, U, or I) occur, divide the number of matched positions by the total number of positions in the comparison window (ie, window size) to obtain the percentage of sequence homology. It is calculated by multiplying the result by 100. Such substantial homology is characteristic of a polynucleotide sequence in which the polynucleotide has at least 60% sequence homology, usually at least 60%, compared to a reference sequence in a comparison window of at least 25 to 50 nucleotides. It includes 70% homology, often 80-90% sequence homology, most commonly at least 99% sequence homology, wherein the percentage of sequence homology is determined by comparing the reference sequence to the comparison window. In total, it is calculated by comparison to polynucleotide sequences that may contain up to 20 percent of the deletion or addition of the reference sequence.
[0304]
Sequences with sufficient homology can then be further identified by any annotation included in the database, including, for example, species and activity information. Thus, in a typical environmental sample, multiple nucleic acid sequences will be obtained, cloned, sequenced, and correspond to homologous sequences from the identified database. This information provides a profile of the polynucleotides present in the sample, which may include the sequence or any polynucleotide associated with any polypeptide encoded by the sequence based on the database information and the activity of the polynucleotide. Contains one or more related functions. As used herein, "fingerprint" or "profile" refers to the fact that each sample will be associated with the set of polynucleotide properties of the sample and the environment from which it is derived. Such a profile may include the amount and type of sequence present in the sample, and the potential activity encoded by the polynucleotide and information about the organism from which the polynucleotide is derived. These unique patterns are the profile or fingerprint of each document.
[0305]
It may also be desirable to express a particular cloned polynucleotide sequence when the identity or activity has been determined, or when the suggested identity or activity is associated with the polynucleotide. In such cases, the desired clone, if not already cloned in the expression vector, is ligated downstream of regulatory control elements (eg, a promoter or enhancer) and cloned in a suitable host cell. Expression vectors are commercially available with corresponding host cells used in the present invention.
[0306]
Representative examples of expression vectors that can be used include viral particles, baculoviruses, phages, plasmids, phagemids, cosmids, fosmids, bacterial artificial chromosomes, viral nucleic acids (eg, vaccinia, adenovirus). , Fowl pox virus, pseudorabies, and derivatives of SV40), P1-based artificial chromosomes, yeast plasmids, yeast artificial chromosomes, and any other vector specific to a given particular host (Bacillus, Aspergillus, Yeast, and others). Thus, for example, DNA may be included in any one of a variety of expression vectors for expressing a polypeptide. Such vectors include chromosomal, non-chromosomal, and synthetic DNA sequences. Many suitable vectors are known to those of skill in the art and are commercially available. The following vectors are provided as examples. Bacterial: pQE70, pQE60, pQE-9 (Quiagen), psiX174, pBluescript SK, pBluescript KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), pTRC2apR, pTRC2APKp, KTR2Kp Eukaryotic: pWLNEO, pSV2CAT, pOG44, pXT1, pSG (Stratagene), pSVK3, pBPV, pMSG, pSVL (Pharmacia). However, any other plasmid or vector can be used, so long as it can replicate and survive in the host.
[0307]
The nucleic acid sequence in the expression vector is operatively linked to the appropriate expression control sequence (s) to direct mRNA synthesis. Particular designated bacterial promoters include lacI, lacZ, T3, T7, gpt, lambda PR, PL, and trp. Prokaryotic promoters include CMV immediate early, HSV thymidine kinase, early and late SV40, LTRs from retrovirus, and mouse metallothionein-I. Selection of the appropriate vector and promoter is well within the level of ordinary skill in the art. The expression vector further includes a ribosome binding site for translation initiation and a transcription terminator. The vector may further include appropriate sequences for amplifying expression. The promoter region can be selected from any desired gene using a CAT (chloramphenicol transferase) vector or other vector with a selectable marker.
[0308]
In addition, expression vectors may be resistant to dihydrofolate reductase or neomycin for eukaryotic cell culture, or E. coli. One or more selectable marker genes are usually included to provide a phenotypic trait for selection of transformed host cells, such as tetracycline or ampicillin resistance in E. coli.
[0309]
The nucleic acid sequence (s) that are selected, cloned, and sequenced as described above, in addition, can be introduced into an appropriate host to prepare a library that is screened for the desired biomolecule or biological activity. . The selection nucleic acid is preferably already in a vector containing the appropriate control sequences, which allows the expression of the biomolecule or the selection nucleic acid encoding the biological activity to detect the desired activity. . The host cell can be a higher eukaryotic cell, such as a mammalian cell, or a lower eukaryotic cell, such as a yeast, or the host cell can be a prokaryotic cell, such as a bacterial cell. The selection of an appropriate host will be within the skill of the art in light of the present description.
[0310]
It may also be desirable to perform amplification of a nucleic acid sequence present in a sample or of a particular isolated clone. In this embodiment, the nucleic acid sequence is amplified by a PCR reaction or a similar reaction known to those skilled in the art. To perform such an amplification reaction, a commercially available amplification kit can be used.
[0311]
In addition, it is important to recognize that alignment algorithms and searchable databases can be implemented by computer hardware, software, or a combination thereof. Thus, separation, processing, and identification of nucleic acid or polypeptide sequences can be performed in an automated system.
[0312]
In addition to the sequence-based approaches described above, there are a number of traditional assay systems for measuring enzyme activity using multi-well plates. For example, existing screening techniques typically rely on two-dimensional wells (eg, 96, 384, 1536 wells). The present invention further provides a capillary array-based approach that has a number of advantages over well-based screening techniques, including the need for a fluid dispenser to dispense fluids (such as reactants) to individual well reservoirs. And reduced cost per array (e.g., glass capillaries are reusable) (e.g., November 22, 1999, the disclosure of which is hereby incorporated by reference). (See U.S. patent application Ser.
[0313]
Accordingly, the capillaries, capillary arrays, and systems of the present invention are particularly suitable for screening libraries for a given activity or biomolecule, including polynucleotides. Screening for activity can be performed on individual expression clones, or, on a mixture of expression clones, first to determine whether the mixture has one or more specified activities. can do. If the mixture has the specified activity, after collection from the capillary array, individual clones can be screened again for such activity, or for more specified activity.
[0314]
Any headings and subheadings used herein are presented for the convenience of the reader and should not be construed as limiting the invention.
[0315]
As used in this specification and the appended claims, the singular forms "a," "an," and "the" include plural referents unless the content clearly dictates otherwise. Thus, for example, reference to "a clone" includes a plurality of clones, and reference to "the nucleic acid sequence" generally refers to one or more nucleic acid sequences and those skilled in the art. And the like, including references to its equivalents, as well as others.
[0316]
Unless defined, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Although any methods, devices, and materials similar or equivalent to those described herein can be used in the practice or testing of the present invention, the preferred methods, devices, and materials are described. ing.
[0317]
All printed materials mentioned herein are sourced for the purpose of explaining and disclosing the databases, proteins, and methods described in publications that may be used in connection with the described invention. The disclosure is incorporated herein by reference. The publications discussed above and throughout the text are provided solely for their disclosure prior to the filing date of the present application. Nothing in this specification should be construed as an admission that the inventors have not been entitled to antedate such disclosure by virtue of prior invention.
[0318]
The invention will now be described in more detail with reference to the following non-limiting examples.
[0319]
Example 1
DNA separation. DNA is isolated using the IsoQuick Procedure according to the manufacturer's instructions (Orca Research Inc., Bothell, WA). The separated DNA can optionally be averaged according to Example 2 (below). Upon separation, the DNA is sheared by pushing and pulling the DNA about 500 times with a 25 gauge double hub needle and a 1 cc syringe. Run a small amount on a 0.8% agarose gel to ensure that the majority of the DNA is in the desired size range (about 3-6 kb).
[0320]
DNA blunting. The DNA is blunt-ended by mixing 45 μl of 10 × mung bean buffer, 2.0 μl of mung bean nuclease (1050 u / μl) and water to a final volume of 405 μl. This mixture is incubated at 37 ° C. for 15 minutes. The mixture is extracted with phenol / chloroform and then further with chloroform. Add 1 ml of ice-cold ethanol to the final extract and precipitate the DNA. DNA is precipitated on ice for 10 minutes. DNA is removed by centrifugation in a microcentrifuge for 30 minutes. The pellet is washed with 1 ml of 70% ethanol and pelleted again in a microcentrifuge. Following centrifugation, the DNA is dried and gently resuspended in 26 μl of TE buffer.
[0321]
DNA methylation. The DNA is methylated by mixing 4 μl of 10 × EcoRI methylase buffer, 0.5 μl of SAM (32 mM) and 5.0 μl of EcoRI methylase (40 u / μl), and culturing at 37 ° C. for 1 hour. . To ensure blunt ends, the following can be added to the methylation reaction: 5.0 μl of 100 mM MgCl2, 8.0 μl dNTP mixture (dGTP, dATP, dTTP, dCTP, 2.5 mM each), 4.0 μl Klenow (5 u / μl). This mixture is then incubated at 12 ° C. for 30 minutes.
[0322]
After incubation for 30 minutes, add 450 μl of 1 × STE. The mixture is extracted once with phenol / chloroform, followed by another chloroform extraction. Add 1 ml of ice-cold ethanol to the final extract and precipitate the DNA. DNA is precipitated on ice for 10 minutes. DNA is removed by centrifugation in a microcentrifuge for 30 minutes. The pellet is washed with 1 ml of 70% ethanol, pelleted again in a microcentrifuge and dried for 10 minutes.
[0323]
Ligation. The DNA was prepared by adding the DNA to 8 μl of EcoRI adapter (from Stragene's cDNA Synthesis Kit), 1.0 μl of 10 × ligation buffer, 1.0 μl of 10 mM rATP, and 1.0 μl of T4 DNA ligase (4 Wu / μl). And ligated by culturing at 4 ° C. for 2 days. The ligation reaction is terminated by heating at 70 ° C. for 30 minutes.
[0324]
Phosphorylation of the adapter. Adapter ends were used for ligation reaction with 1.0 μl of 10 × ligation buffer, 2.0 μl of 10 mM rATP, and 6.0 μl of H2O is mixed with 1.0 μl of polynucleotide kinase (PNK) and cultured at 37 ° C. for 30 minutes to be methylated. After 30 minutes of culture, 30 μl of H2Add O and 5 ml of 10 × STE and size fragment the sample with a Sephacryl S-500 spin column. The pooled fragments (1-3) are extracted once with phenol / chloroform, followed by a further chloroform extraction. DNA is precipitated on ice for 10 minutes by adding ice-cold ethanol. The precipitate is pelleted by centrifugation in a microcentrifuge for 30 minutes. The resulting pellet is washed with 1 ml of 70% ethanol, pelleted again by centrifugation and dried for 10 minutes. This sample is resuspended in 10.5 μl of TE buffer. This sample is not plated, but is ligated directly to the lambda arm as described above, except that 2.5 μl of DNA is used and no water is used.
[0325]
Sucrose gradient (2.2 ml) size fragmentation. Ligation is stopped by heating the sample at 65 ° C. for 10 minutes. The sample is placed in a 2.2 ml sucrose gradient and centrifuged for 4 hours at 20 ° C. in a 45000 rpm mini ultracentrifuge (without brake). The fragments are collected by piercing the bottom of the gradient tube with a 20 gauge needle and allowing sucrose to flow through the needle. The first 20 droplets are collected in a Falcon 2059 tube, after which ten 1-drop fragments (labeled 1-10) are collected. Each droplet has a volume of about 60 μl. Run 5 μl of each fragment on a 0.8% agarose gel and check the size. Fragments 1-4 (about 10-1.5 kb) are pooled, and fragments 5-7 (about 5-0.5 kb) are pooled in separate tubes. Add 1 ml of ice-cold ethanol to precipitate the DNA, then place on ice for 10 minutes. The precipitate is pelleted by centrifugation in a microcentrifuge for 30 minutes. The pellet is washed by resuspension in 70% ethanol, re-pelleted by centrifugation at high speed for 10 minutes in a microcentrifuge, and then dried. Each pellet is then resuspended in 10 μl of TE buffer.
[0326]
Test ligation with lambda arms. Analytes are plated by placing 0.5 μl of sample on agarose containing ethidium bromide with standards (DNA samples of known concentration) and obtaining approximate concentrations. The sample is then observed using ultraviolet light and the estimated concentration is compared to a reference.
[0327]
As shown in Table 1 below, prepare the following ligation reaction (5 μl reaction) and incubate at 4 ° C. overnight.
[0328]
Table 1
Figure 2004524811
Test package and plate. The ligation reaction is packaged according to the manufacturer's protocol. The packaging reaction is stopped with 500 μl SM buffer and pooled with packaging from the same ligation. Titrate 1 μl of each pooled reaction on the appropriate host (OD600= 1.0) (XLl-Blue MRF). 200 μl of host (MgSO 44) Is added to a Falcon 2059 tube, inoculated with 1 μl of packaged phage, and cultured at 37 ° C. for 15 minutes. Add about 3 ml of 48 ° C. top agar (50 ml stock containing 150 μl IPTG (0.5 M) and 300 μl X-GAL (350 mg / ml)) and plate on a 100 mm plate. Plates are incubated overnight at 37 ° C.
[0329]
Library amplification (5.0 × 10 from each library)5Recombination). About 3.0 ml of host cells (OD600= 1.0) was added to two 50 ml conical tubes and 2.5 × 105The pfu phage is inoculated, and then cultured at 37 ° C. for 20 minutes. Add top agar to each tube to bring the final volume to 45 ml. Each tube is plated on five 150 mm plates. Plates are incubated at 37 ° C. for 6-8 hours or until the plaque has reached the size of the pinhead. Plates are covered with 8-10 ml of SM buffer and placed at 4 ° C. overnight (gently rock if possible).
[0330]
Phage recovery. Phage suspension is recovered by pouring SM buffer from each plate into a 50 ml conical tube. Add about 3 ml of chloroform, shake vigorously, and incubate at room temperature for 15 minutes. The tube is centrifuged at 2000 rpm for 10 minutes to remove cell debris, the supernatant is poured into a sterile flask, added with 500 μl chloroform and stored at 4 ° C.
[0331]
Titration amplification library. The collected phages were serially diluted (for example, 10-5= 1 μl amplified phage, 10 ml in 1 ml SM buffer-6= 1 ml of 1 ml SM buffer 10-3200 μl of host (10 mM MgSO)4) Is added to the two tubes. In one tube, 10 μl of 10-6Diluted (10-5). In the other tube, 1 μl of 10-6Diluted (10-6) And incubate at 37 ° C. for 15 minutes.
[0332]
Add about 3 ml of 48 ° C top agar (50 ml stock containing 150 μl IPTG (0.5 M) and 37 μl X-GAL (350 mg / ml)) to each tube and plate on a 100 mm plate. Plates are incubated overnight at 37 ° C.
[0333]
The ZAP II library is excised to form a pBLUESCRIPT library according to the manufacturer's protocol (Stratagene).
[0334]
The DNA library can be transformed with a host cell (such as E. coli) to generate a clone expression library.
[0335]
Example 2
Averaging
Prior to library generation, the purified DNA can be averaged. DNA is fragmented according to the following protocol. Samples containing genomic DNA are purified on a cesium chloride gradient. The cesium chloride (Rf = 1.3980) solution is filtered through a 0.2 μl filter and 15 ml is placed in a 35 ml OptiSeal tube (Beckman). Add DNA and mix thoroughly. Add 10 micrograms of bisbenzimide (Sigma, Hoechst 33258) and mix thoroughly. The tube is then filled with the filtered cesium chloride solution and spun at 33000 rpm for 72 hours in a Beckman L8-70 Ultracentrifuge Bti50 rotor. Following centrifugation, the gradient is passed through an ISCO UA-5 UV absorbance detector set at 280 nm using a syringe pump and a rectification column (Brandel Model 186). Peaks representing DNA from organisms present in the environmental sample are obtained. Eubacteria sequences were obtained using the following primers for amplification. DNA encoding rRNA from a 10-fold dilution of the E. coli peak can be detected by PCR amplification.
[0336]
Forward primer: 5'-AGAGTTTGATCCTGGCTCAG-3 '(SEQ ID NO: 4)
Reverse primer: 5'-GGTTACCTTGTTTACGACTT-3 '(SEQ ID NO: 5)
The recovered DNA is sheared or enzymatically digested into 3-6 kb fragments. The lone linker primer is ligated and the DNA is size selected. The size selection DNA is amplified, if necessary, by PCR.
[0337]
Averaging was then performed by combining the double-stranded DNA sample with hybridization buffer (0.12 M NaH2PO46.8 / 0.82 M NaCl / 1 mM EDTA / 0.1% SDS). The sample is denatured by overlaying with mineral oil and boiling for 10 minutes. This sample is incubated at 68 ° C. for 12 to 36 hours. Double-stranded DNA is separated from single-stranded DNA in hydroxyapatite at 60 ° C. according to standard protocols (Sambrook, 1989). The single-stranded DNA fragment is desalted and amplified by PCR. This process is repeated several more rounds (up to five or more).
[0338]
Example 3
Enzyme activity assay
The following is a representative procedure for screening an expression library prepared according to Example 1 for hydrolase activity.
[0339]
The library plates prepared as described in Example 1 are used to multi-inoculate a single plate containing 200 μl LB Amp / Meth glycerol in each well. This step is performed using Beckman BIOMEK RTM's High Density Replicating Tool (HDRT) with 1% bleach, water, isopropanol, and air-dry sterilization between each inoculation. This single plate is grown for 2 hours at 37 ° C. and then used to inoculate two white 96-well Dynatech microtiter daughter plates containing 250 μl LB Amp / Meth glycerol in each well. The original single plate is incubated at 37 ° C. for 18 hours and then stored at −80 ° C. The two condensed daughter plates are also incubated at 37 ° C. for 18 hours. The condensing daughter plate was then heated at 70 ° C. for 45 minutes to kill the cells and the host E. coli. inactivate the E. coli enzyme. A stock solution of 5 mg / mL morphourea phenylalanyl-7-amino-4-trifluoromethyl coumarin (MuPheAFC, “substrate”) in DMSO is 50 mM pH 7.0 containing 0.6 mg / mL surfactant dodecyl maltoside. Dilute to 600 μM with 5 Hepes buffer. Add 50 μl of a 600 μM MuPheAFC solution to each of the wells of the white condensing plate using BIOMEK in a 100 μl mixing cycle to bring the final substrate concentration to about 100 μM. Fluorescence value immediately after addition of substrate
[0340]
[Formula]
Figure 2004524811
At (t = 0), record by plate reading fluorometer. The plate is incubated at 70 ° C. for 100 minutes and then allowed to cool at ambient temperature for another 15 minutes. The fluorescence value is recorded again (t = 100). The value of t = 0 is subtracted from the value of t = 100 to determine whether an active clone exists.
[0341]
MuPheAFC
This data will indicate whether one of the clones in a particular well has hydrolyzed the substrate. To determine individual clones with activity, the source library is thawed and individual clones are used to inoculate a new plate containing glycerol of LB Amp / Meth alone. As described above, the plate is cultured at 37 ° C. to grow the cells, heated at 70 ° C. to inactivate the host enzymes, and added 50 μl of 600 μM MuPheAFC using Biomek.
[0342]
After addition of the substrate, the fluorescence value at t = 0 is recorded as above, the plate is incubated at 70 ° C., and the value at t = 100 is recorded. These data indicate which plates have active clones.
[0343]
The value of the enantioselectivity for the substrate, E, is determined according to the following equation:
[0344]
【number】
Figure 2004524811
In this equation, eep= Enantiomeric excess of hydrolyzate, c = percent conversion of reaction. Won and White Size, Enzymes in Synthetic Organic Chemistry, 1994, Elsevier, Tarrytown, N.W. Y. Pp. See 9-12.
[0345]
Enantiomeric excess is determined by chiral high performance liquid chromatography (HPLC) or chiral capillary electrophoresis (CE). The assay is performed as follows: 200 μl of the appropriate buffer is added to each well of a 96-well white microtiter plate, followed by the addition of 50 μl partially or fully purified enzyme and the addition of 50 μl substrate. The increase in monitored fluorescence is compared to the time until 50% consumption of substrate or termination of the reaction, whichever occurs first.
[0346]
Example 4
Directed mutagenesis of positive enzyme-active clones
Directed mutagenesis was performed with two enzymes (alkaline phosphatase and β-glycosidase) to produce a new enzyme that showed a higher degree of activity than the wild-type enzyme.
[0347]
Alkaline phosphatase
The XL1-Red strain (Stratagene) was transformed with a genomic clone 27a3a (in plasmid pBluescript) encoding the alkaline phosphatase gene from organism OC9a, an organism isolated from the surface of whale bone according to the manufacturer's protocol. . 5 ml medium of LB + 0.1 mg / ml ampicillin was inoculated with 200 μl of the transformants and the medium was grown at 37 ° C. for 30 hours. The isolated DNA was then performed by performing a miniprep on this medium and transforming 2 μl of the resulting DNA into XL-1 Blue cells (Stratagene) according to the manufacturer's protocol and according to the assay procedure outlined below. Screened. In the screening assay, the mutated OC9a phosphatase required 10 minutes to develop color and the wild-type enzyme required 30 minutes to develop color.
[0348]
Standard alkaline phosphatase screening assay
The transformed XL1 Blue cells were plated on LB / amp plates. The resulting colonies were lifted by Duralon UV (Stratagene) or HATF (Millipore) thin films and dissolved in chloroform vapor for 30 seconds. The cells were cultured for 30 minutes at 85 ° C., and the cells were killed by heat. Filters were constructed at room temperature in BCIP buffer and the fastest growing colonies ("positives") were selected and the "positives" were transferred to a BCIP plate (BCIP buffer; 20 mm CAPS pH 9.0, 1 mm MgCl2).2, 0.01mm ZnCl2, 0.1 mg / ml BCIP).
[0349]
β-glycosidase
This protocol was used to mutate Thermococcus 9N2 β-glycosidase.
[0350]
2 microliters of dNTP (10 mM stock), 10 microliters of 10 × PCR buffer, 0.5 microliters of vector DNA-31G1A-100 nanograms, 20 microliters of 3 ′ primer (100 pmol) and 20 microliters 5 'primer (100 pmol) and 16 microliters of MnCl 4H2O (1.25 mM stock) and 24.5 microliters of H2PCR was performed by culturing O and 1 microliter of Taq polymerase (5.0 units) for a total of 100 microliters. The PCR cycle is 95 ° C. for 15 seconds, 58 ° C. for 30 seconds, 72 ° C. for 90 seconds, and 25 cycles (culture at 72 ° C. to 4 ° C. for 10 minutes).
[0351]
Five microliters of the PCR product was run on a 1% agarose gel and the reaction was checked. Purified on a QIAQUICK column (Qiagen). 50 microliters of H2Resuspended with O.
[0352]
25 microliters of purified PCR product, 10 microliters of NEB buffer # 2, 3 microliters of Kpn I (1OU / microliter), 3 microliters of EcoR1 (20U / microliter), and 59 microliters of H2O was incubated for 2 hours at 37 ° C. to digest the PCR product and purified on a QIAQUICK column (Qiagen). 35 microliters of H2Eluted with O.
[0353]
10 microliters of digested PCR product, 5 microliters of vector (cut with EcoRI / KpnI and phosphatase with shrimp alkaline phosphatase), 4 microliters of 5 × ligation buffer and 1 microliter of T4 DNA ligase (BRL) was cultured overnight, and the PCR product was ligated into the vector.
[0354]
The resulting vector was transformed in M15pREP4 cells using electroporation. 100 or 200 microliters of cells were plated on LB amp meth kan plates and grown overnight at 37 ° C.
[0355]
Assays for β-galactosidase consisted of (1) performing a colony lift using a Millipore HAFT membrane filter, (2) dissolving the colonies with chloroform vapor in a 150 mm glass Petri dish, and (3) Z containing 1 mg / ml XGLU. Move the filter to a 100 mm glass Petri dish containing one Whatman 3MM filter paper soaked with buffer (after moving the filter with dissolving colonies to the glass Petri dish, keep the dish at room temperature); (4) Filter membrane This was done by observing "positives" as blue spots above ("positives" are spots that appear early). The center of the blue spot on the filter membrane was centered using a Pasteur pipette (or glass capillary tube). A small filter disc was placed in an Eppendorf tube containing 20 μl of water. The Eppendorf tube was incubated at 75 ° C. for 5 minutes, followed by vortexing to elute the plasmid DNA from the filter. This DNA was converted to electroreactive E. coli. E. coli cells were transformed and the filter lift assay was repeated on the transformation plates to identify "positives". After the filter lift, the transformed plate was returned to the incubator at 37 ° C. to regenerate the colonies. Repurified positives were inoculated into 3 ml of LBamp solution, and cultured at 37 ° C. overnight. Plasmid DNA was isolated from these media and the sequence of the plasmid insert was determined. This filter assay uses Buffer Z (see recipe below) containing 1 mg of the substrate 5-bromo-4-chloro-3-indolyl-β-o-glucopyranoside (XGLU) (Diagnostic Chemicals Limited or Sigma).
[0356]
Per liter of Z buffer (cited from JH Miller (1992), A Short Course in Bacterial Genetics, p. 445)
Na2HPO4-7H2O 16.1 g
Na2HPO4-4H2O 5.5g
0.75 g of KCl
Na2HPO4-7H2O 0.246g
2.7 ml of 6-mercaptoethanol
Adjust pH to 7.0
[0357]
Example 5
Construction of a stable large insert DNA library of picoplankton genomic DNA. Cell collection and DNA preparation. Agarose plugs containing concentrated picoplankton cells were prepared from samples collected on a marine cruise from Newport, OR to Honolulu, Hawaii. Seawater (30 liters) was collected in a Niskin bottle, screened with a 10 μm Nitex, and concentrated by hollow fiber filtration (Amicon DC10) through a 30,000 MW cutoff polyfluphon filter. The concentrated bacterial plankton cells were collected with a 0.22 μm, 47 mm Durapore filter, resuspended in 1 ml of 2 × STE buffer (1 M NaCl, 0.1 M EDTA, 10 mM Tris, pH 8.0) to a final concentration of 1 ml / ml. About 1 × 1010Cells. The cell suspension was mixed with one volume of 1% molten Seaplaque LMP agarose (FMC) cooled to 40 ° C. and immediately drawn into a 1 ml syringe. The syringe was sealed with parafilm and placed on ice for 10 minutes. The cell-containing agarose plug was extruded into 10 ml of lysis buffer (10 mM Tris, pH 8.0, 50 mM NaCl, 0.1 M EDTA, 1% sarkosyl, 0.2% sodium deoxycholate, 1 mg / ml lysozyme) at 37 ° C. Cultured for 1 hour. The agarose plug was then transferred to 40 ml of ESP buffer (1% sarkosyl, 1 mg / ml proteinase K, in 0.5 M EDTA) and cultured at 55 ° C. for 16 hours. The solution was decanted, replaced with fresh ESP buffer and incubated at 55 ° C. for another hour. The agarose plug was then placed in 50 mM EDTA and stored at 4 ° C. on board during the ocean cruise.
[0358]
An agarose plug piece (72 μl) prepared from a sample collected along the Oregon coast was placed in a 2 mL microcentrifuge tube with 1 mL of buffer A (100 mM NaCl, 10 mM bistrispropane-HCl, 100 μg / ml acetylated BSA, 25 ° C. (PH 7.0) at 4 ° C. overnight. This solution was added to 10 mM MgCl2And 250 μl of fresh buffer A containing 1 mM DTT and incubated on a rocking platform for 1 hour at room temperature. This solution was then changed to 250 μl of the same buffer containing 4 U of Sau3A1 (NEB), equilibrated in a water bath at 37 ° C., and then cultured for 45 minutes on a rocking platform in a 37 ° C. incubator. The plug was transferred to a 1.5 ml microcentrifuge tube and incubated at 68 ° C. for 30 minutes to inactivate the enzyme and dissolve the agarose. Agarose was digested and DNA was dephosphorylated using Gelase and HK-phosphatase (Epicenture), respectively, according to the manufacturer's recommendations. Protein was removed by gentle phenol / chloroform extraction and DNA was ethanol precipitated, pelleted, and then washed with 70% ethanol. This partially digested DNA is converted into sterile H2Resuspended in O and brought to a concentration of 2.5 ng / μl for ligation with the pFOS1 vector.
[0359]
Results of PCR amplification from several agarose plugs indicated the presence of large amounts of archaeal DNA. Quantitative hybridization experiments using rRNA extracted from a single sample offshore the Oregon Coast at a depth of 200 m showed that the plankton archaea in this assembly accounted for approximately 4.7% of the total picoprankton biomass. (This sample corresponds to Table 1, "PACI" -200 m of Delong et al., Nature, 371: 695-698, 1994). Results of archaeal biased rDNA PCR amplification performed on agarose plug lysates confirmed the presence of relatively large amounts of archaeal DNA in this sample. Agarose plugs prepared from this picoplankton sample were selected for subsequent fosmid library construction. Each 1ml agarose plug from this site is about 7.5x105Of the cells used for the preparation of the partially digested DNA, about 5.4 × 105Cells were present.
[0360]
The vector arm was prepared from pFOS1 as described (Kim et al., Stable propagation of common sized human DNA inserts in an Factor based vector, Nucl. Res. Briefly, plasmids were completely digested with AstII, dephosphorylated with HK phosphatase, and then digested with BamHI to generate two arms, each of which cloned and ligated 35-45 kbp of ligated DNA. Includes a cos site that is in the proper orientation for packaging. The partially digested picoplankton DNA was ligated overnight to the PFOS1 arm in a 15 μl ligation reaction containing 25 ng each of the vector and insert and 1 U of T4 DNA ligase (Boehringer-Mannheim). The ligated DNA contained in 4 microliters of this reaction was packaged in vitro using a Gigapack XL packaging system (Stratagene) and the fosmid particles were transformed into E. coli. E. coli strain DH10B (BRL), and the cells werecm15It was spread on a plate. The resulting fosmid clone was replaced with LB supplemented with 7% glycerol.cm15And placed in a 96-well microliter dish containing Recombinant fosmid containing the approximately 40 kb picoplankton DNA insert yielded a library of 3.552 fosmid clones, which was approximately 1.4 × 10 58Includes base pair cloned DNA. All clones tested contained inserts ranging from 38 to 42 kb. This library was stored frozen at -80 ° C for subsequent assays.
[0361]
Example 6
Generation of random-sized polynucleotides using UV-induced photoproducts
One microgram sample of the template DNA is obtained and treated with ultraviolet light to form a dimer containing a TT dimer, especially a purine dimer. Ultraviolet light exposure is limited so that only a small amount of photoproduct is generated for each gene in the template DNA sample. A large number of samples are treated with ultraviolet light for varying lengths of time to obtain template DNA samples with different numbers of dimers due to ultraviolet light exposure.
[0362]
Using a random priming kit utilizing a non-proofreading polymerase (e.g., the Stratagene Cloning Systems Prime-It II Random Primer Labeling kit), the primary immunization is performed at random sites on the template created by ultraviolet light (as described above). Performing and extending along the template produces polynucleotides of various sizes. A prime immunization protocol as described in the Prime-It II Random Primer Labeling kit can be used to extend primers. Dimers formed by UV exposure serve as obstacles to extension by non-proofreading polymerases. Thus, after completion of the random primer extension, there is a pool of polynucleotides of random size.
[0363]
Example 7
Separation of randomly sized polynucleotides
Certain polynucleotides produced according to Example 1 are gel separated on a 1.5% agarose gel. Polynucleotides ranging from 100 to 300 bp are excised from the gel and three volumes of 6M NaI are added to the gel slice. The mixture is incubated at 50 ° C. for 10 minutes and 10 μl of glass milk (Bio 101) is added. The mixture is spun for 1 minute and the supernatant decanted. Wash the pellet with 500 μl Column Wash (Column Wash is 50% ethanol, 10 ml Tris-HCl, pH 7.5, 100 mM NaCl, and 2.5 mM EDTA), spin for 1 minute, and then decant the supernatant. Thereafter, the steps of washing, spinning, and decanting are repeated. Glass milk pellet is added to 20 μl of H2Resuspend in O and spin for 1 minute. DNA maintains an aqueous phase.
[0364]
Example 8
Shuffling of isolated random-sized 100 to 300 bp polynucleotides
The 100-300 bp polynucleotide obtained in Example 2 was added to the annealing mixture (0.2 mM of each dNTP, 2.2 mM MgCl 2) without adding a primer.2, 50 mM KCl, 10 mM Tris HCl, pH 8.8, 0.1% Triton X-100, 0.3 μ, Taq DNA polymerase, total volume 50 μl). Stratagene Robocycler was used for the annealing step according to the following program: 95 ° C. for 30 seconds, [95 ° C. for 30 seconds, 50 to 50 ° C. (preferably 58 ° C.) for 30 seconds, and 72 ° C. for 30 seconds] for 25 to 50 cycles. And 72 ° C for 5 minutes. Thus, the 100 to 300 bp polynucleotides combine to generate a double-stranded polynucleotide having a long sequence. After the reconstituted double-stranded polynucleotide is separated and denatured to form a single-stranded polynucleotide, cycling is optionally repeated again, and in some samples, the single-stranded as a template and the primer DNA are used. Other samples use random primers in addition to single strands.
[0365]
Example 9
Screening polynucleotides from shuffled polynucleotides
The polynucleotide of Example 3 is separated, and the polynucleotide is expressed therefrom. Polynucleotides obtained from the shuffled polynucleotides of Example 3 are screened for the activity of the polypeptide obtained from the original template, and control of the level of activity is compared. Shuffled polynucleotides encoding polynucleotides of interest discovered during the screening are further compared for secondary desirable traits. Some shuffled polynucleotides corresponding to the screened polynucleotides of less interest are shuffled again.
[0366]
Example 10
Directed evolution by saturation mutagenesis
Site Saturation Mutagenesis: To achieve site saturation mutagenesis, all residues of the dehalogenase enzyme were subjected to site directed mutagenesis using 32-fold degenerate oligonucleotide primers, as shown below, for a total of 20 variants. Amino acid.
[0367]
1. A medium having a dehalogenase expression structure was grown to prepare a plasmid.
[0368]
Primers randomize each codon so that they have a common structure X20NN (G / T) X20And this X20Represents a 20-base sequence with sufficient homology to bind to the template, and NN (G / T) is a 32-fold degenerate 3-base sequence encoding all 20 amino acids. In an alternative embodiment, the invention provides for the use of any set of codons that are practical to introduce all 19 amino acid substitutions in addition to the N, N, G / T or similar NN (G / T) cassette. Which include (as part of) a 32-fold degenerate NN (G / C) cassette, a 64-fold degenerate NNN cassette, a 48-fold NN (A / C / G) cassette, a 48-fold NN (A / G / T) ) Cassette, including any non-degenerate set of 19 codons that are practical to introduce all 19 amino acid substitutions, and any non-degenerate set of 20 codons that are practical to introduce all 19 amino acid substitutions. In yet another alternative embodiment, the invention provides that a subset of 20 amino acids is introduced into each of the set of codon positions, examples of such subsets being selected from subsets based on a grouping scheme. It can include amino acid (s), and this grouping system can be, by way of non-limiting example, a grouping system having the following eight subsets.
[0369]
・ Aromatic (Phe, Trp, Tyr)
・ Aliphatic (Gly, Ala, Val, Leu, Ile)
-Contains OH (Ser, Tyr, Thr)
・ Acid (Asp, Glu, Asn, Gin)
・ Basic (Lys, Arg, His)
・ Sulfur content (Met, Cys)
-Polarity (Ser, Thr, Cys, Asn, Gin, Tyr)
-Non-polar (Gly, Ala, Vai, Leu, Ile, Met, Phe, Trp, Pro)
[0370]
2. A 25 μl reaction mixture was made containing up to 50 ng of plasmid template, 125 ng of each primer, 1 × native Pfu buffer, 20 μm of each dNTP, and 2.5 U native Pfu DNA polymerase.
[0371]
3. The reaction was cycled on a Robo96 Gradient Cycler as follows.
[0372]
Initial denaturation at 95 ° C for 1 hour
20 cycles of 95 ° C for 45 seconds, 53 ° C for 1 minute, and 72 ° C for 11 minutes
Final extension step at 10 minutes at 72 ° C
4. This reaction mixture was digested with 10 U of DpnI at 37 ° C. for 1 hour to digest methylated template DNA.
[0373]
5. Two ul of the reaction mixture was used to transform 50 ul of XL1-Blue MRF cells, and the entire transformation mixture was plated on large LB-Amp-Met plates to make 200-1000 colonies.
[0374]
6. Individual colonies were picked into wells of a 96-well microtiter plate containing LB-Amp-IPTG and grown overnight.
[0375]
7. The next day, clones from these plates were assayed.
[0376]
Screening: Approximately 200 clones of the mutant at each position were grown in liquid medium (384-well microtiter plates) and screened as follows.
[0377]
1. The overnight culture in a 384-well plate was centrifuged to remove the medium. 0.06 mL 1 mM Tris / SO in each well4 2-, PH 7.8 was added.
[0378]
2. Two assay plates from each parent growth plate were made up with 0.02 mL cell suspension.
[0379]
3. One assay plate was placed at room temperature and the other was heated for a period of time (30 minutes initially) (55 ° C. used for initial screening).
[0380]
4. After the specified time, 0.08 mL of room temperature substrate (1.5 mM NaN3Saturated with 1 mM Tris / SO containing 0.1 mM and 0.1 mM bromothymol blue4 2-, PH 7.8) was added to each well.
[0381]
5. Measurements at 620 nm were taken at various time points to generate a progress curve for each well.
[0382]
6. The data was analyzed to compare the kinetics of heated and unheated cells. Each plate contained 1-2 columns (24 wells) of non-mutated 20F12 controls.
[0383]
7. Wells that appeared to have improved stability were grown again and tested under the same conditions.
[0384]
After this procedure, nine single-site mutations appeared to have given the enzyme increased thermostability. Sequence analysis was performed to determine the exact amino acid change at each position that essentially caused this improvement. Briefly, the improvement was provided by one amino acid change at the seven sites, two amino acid changes at the eighth site, and three amino acid changes at the ninth site, respectively. We then made several mutations, each of which had some combination of these nine beneficial site mutations, two of which were single-point mutations. Was found to be superior to all other mutations, including
[0385]
Example 11
Direct expression cloning using end selection
The esterase gene was amplified using a 5 ′ phosphorylated primer in a standard PCR reaction (10 ng template, PCR conditions: 3 min 94 ° C., [1 min 94 ° C., 1 min 50 ° C., 1 min 30 sec 68 ° C] x 30, 10 minutes 68 ° C).
[0386]
Forward primer = 9511TopF (CTAGAAGGGAGGAGAATTACATGAAGCGGCTTTTTAGCCC)
Reverse primer = 9511TopR (AGCTAAGGGTCAAGGCCGCACCCGGAGG)
The resulting PCR product (about 1000 bp) was gel purified and quantified.
[0387]
The vector for expression cloning, pASK3 (Institut fuel Bioanalytik, Göttingen, Germany) was cut with Xba I and Bgl II and dephosphorylated with CIP.
[0388]
0.5 pmole Vaccina Topoisomerase (Invitrogen, Carlsbad, CA) was added to 60 ng (approximately 0.1 pmole) of the purified PCR product in buffer NEB I (New England Biolabs, Beverly, MA), for a total volume of 5 μl. 37 ° C. for minutes. The topogated PCR product was cloned with the vector pASK3 (5 μl, about 200 ng in NEBI) and brought to room temperature for 5 minutes. This mixture is2Dialyzed against O for 30 minutes. 2 μl was used for electroporation of DH10B cells (Gibco BRL, Gaithersburg, MD).
[0389]
Efficiency: Based on the actual number of clones, the method was 2x10 / μg vector6Clones can be generated.
[0390]
Example 12
Thermostability of dehalogenase
In the present invention, desirable properties produced by directed evolution include improved residue activity (eg, enzymatic activity) of molecules exposed to a changed environment for a specified period of time, including those that are considered harsh environments. , Immunoreactivity, antibiotic activity, etc.). Such harsh environments may include any combination of the following (with or without repetition and in any order or permutation): high temperature (including the temperature that causes denaturation of the working enzyme), low temperature, high salt Degree, low salinity, high pH, low pH, high pressure, low pressure, and changes in exposure to radiation sources (including ultraviolet radiation, visible light, and the entire electromagnetic spectrum).
[0391]
According to the present invention, the desired properties such as improved activity can be achieved in harsh environments (eg, high temperature, low temperature, high pH, low pH, high salinity, low salinity, increased organic solvent presence, increased organic solvent content). (E.g., reduced presence, etc.) and can have improved activity (e.g., higher activity) after maintaining for a specified period of time, and can include selection criteria for screening or selection steps following the application of directed evolution steps Some of which include end selection-based steps, exonuclease treatment-based steps, site saturation mutagenesis-based steps, or synthetic ligation reconstruction-based steps.
[0392]
According to another aspect of the present invention, the desired properties such as improved activity may be in harsh environments (eg, high temperature, low temperature, high pH, low pH, high salinity, low salinity, increased presence of organic solvents). , Reduction of the presence of organic solvents, etc.) and improved mobility (such as high activity) after removal therefrom, and the choice of a screening or selection step following the application of a directed evolution step. Criteria can be included, some of which include end selection based steps, exonuclease treatment based steps, site saturation mutagenesis based steps, or synthetic ligation reconstruction based steps.
[0393]
In a preferred embodiment, the residue activity is such that after exposure to denaturing conditions, the active three-dimensional form (the original three-dimensional form, a three-dimensional form similar to the original three-dimensional form, or the original three-dimensional form) (Including a different three-dimensional form). Such ability to fold again, sometimes referred to as "denaturation reversibility" or "regeneration ability" or "denaturation-regeneration reversibility", is a selection parameter according to the present invention.
[0394]
The following example illustrates the application of directed evolution to evolve the ability of enzymes to regenerate and / or maintain activity when exposed to high temperatures. All residues (316) of the dehalogenase enzyme were converted to a total of 20 amino acids by site-directed mutagenesis using a 32-fold degenerate oligonucleotide primer. This mutation was introduced into mutant Dhla 20F12, which already had an improved ratio. About 200 clones at each location were grown in liquid medium (384-well microtiter plates) for screening. The screening procedure is as follows.
[0395]
1. The overnight culture in a 384-well plate was centrifuged to remove the medium. 0.06 mL 1 mM Tris / SO in each well4 2-, PH 7.8 was added.
[0396]
2. The robot made sure that two assay plates from each parent growth plate consisted of 0.02 mL cell suspension.
[0397]
3. One assay plate was placed at room temperature and the other was heated for a period of time (30 minutes initially) (55 ° C. used for initial screening).
[0398]
4. After the specified time, 0.08 mL of room temperature substrate (1.5 mM NaN3Saturated with 1 mM Tris / SO containing 0.1 mM and 0.1 mM bromothymol blue4 2-, PH 7.8) was added to each well. TCP = trichloropropane.
[0399]
5. Measurements at 620 nm were taken at various time points to generate a progress curve for each well.
[0400]
6. The data was analyzed to compare the kinetics of heated and unheated cells. Each plate contained 1-2 columns (24 wells) of non-mutated 20F12 controls.
[0401]
7. Wells that appeared to have improved stability were grown again and tested under the same conditions.
[0402]
Following this procedure, nine single-site mutations appeared to have conferred increased thermal stability on Dhla-20F12. Sequence analysis revealed that the following changes were beneficial.
[0403]
D89G
F91S
T159L
G189Q, G189V
I220L
N238T
W251Y
P302A, P302L, P302S, P302K
P302R / S306R
Only two sites (189 and 302) had more than one substitution. The first five in the list were linked to a single gene (using G189Q) (this mutation is called "Dhla5"). All changes except S306R have been incorporated into another mutant called Dhla8.
[0404]
The thermostability was evaluated by culturing the enzyme at a high temperature (55 ° C. and 80 ° C.) for a certain period and assaying the activity at 30 ° C. Initial velocity was plotted against time at elevated temperature. The enzyme was used at 50 mM Tris SO in both culture and assay.4, PH 7.8. Product (Cl) Is Fe (NO)3)3And HgSCN using standard methods. Dhla 20F12 was used as the de facto wild type. Apparent half-life (T1/2) Was calculated by fitting the data to an exponential decay function.
[0405]
Thermostability of Dhla5 dehalogenase at 55 ° C. 50 mM Tris SO4 2-The purified protein in pH 7.8 was incubated at 55 ° C. for various periods of time, aliquots were removed and assayed for trichloropropane (TCP) hydrolysis. This assay was performed using 50 mM Tris SO4 2-, PH 7.8 at 30 ° C with 10 mM TCP. Product (Cl) Is released from standard ClAnalyzed by a test. The initial rate (A450 / min) was derived from an enzyme progress curve and plotted against incubation time. This data has an exponential decay (C*exp-Kt) Where t1/2= Ln2 / k (see FIG. 13).
[0406]
Enzyme progress curves of Dhla and 20F12 at 30 ° C. and 55 ° C. (see FIG. 14). This reaction is performed using purified protein at 50 mM Tris SO4 2-, PH 7.8, performed with 10 mM TCP. Equal amounts of protein were used in each assay. Product (Cl) Is the standard ClThe test was used to determine at various time points. Dhla 5 appears to have the same specific activity as 20F12 at both 30 ° C. and 55 ° C., but the enzyme continues to form after 20F12 becomes thermally inactive.
[0407]
Thermostability of Dhla5 dehalogenase at 80 ° C. 50 mM Tris SO4 2-, PH 7.8, were incubated at 80 ° C. for various periods of time, aliquots were removed and assayed for trichloropropane (TCP) hydrolysis. This assay was performed using 50 mM Tris SO4 2-, PH 7.8 at 30 ° C with 10 mM TCP. Product (Cl) Is released from standard ClAnalyzed by a test. The initial rate (A450 / min) was derived from an enzyme progress curve and plotted against incubation time. This data has an exponential decay (C*exp-Kt) Where t1/2= Ln2 / k (see FIG. 15).
[0408]
Thermal stability of Dhla5 and Dhla8 at 80 ° C. 50 mM Tris SO4 2-The purified protein in pH 7.8 was incubated at 80 ° C. for various periods of time, aliquots were removed and assayed for trichloropropane (TCP) hydrolysis. This assay was performed using 50 mM Tris SO4 2-, PH 7.8 at 30 ° C with 10 mM TCP. Product (Cl) Is released from standard ClAnalyzed by a test. The initial rate (A450 / min) was derived from the enzyme progress curve and the relative rate was plotted against the incubation time. This data has an exponential decay (C*exp-Kt) Where t1/2= In2 / k, giving values of 13 and 138 minutes for Dhla5 and Dhla8, respectively (see FIG. 16).
[0409]
Indicative scanning calorimetry of such dehalogenase variants is displayed in FIGS. 17A, B, and C. The data were recorded using a Perkin Elmer Pyris I at a scan rate of 10 ° C./min. The protein concentration is 10 mg / ml in 40 μl (0.4 mg total protein). Buffer is 10 mM NaPi, PH 7.5. Dissolution temperatures derived from the data were 68 ° C (20F12), 73 ° C (Dhla5), and 73 ° C (Dhla8). The data further shows that 20F12 has undergone irreversible denaturation, Dhla5 is partially reversible, and Dhla8 is completely reversible (see FIG. 17).
[0410]
Thermostability of wild-type (20F12) and mutant (Dhla5) dehalogenase at 55 ° C. 50 mM Tris SO4 2-The purified protein in pH 7.8 was incubated at 55 ° C. for various periods of time, aliquots were removed and assayed for trichloropropane (TCP) hydrolysis. This assay was performed using 50 mM Tris SO4 2-, PH 7.8 at 30 ° C with 10 mM TCP. Product (Cl) Is released from standard ClAnalyzed by a test. The initial rate (A450 / min) was derived from an enzyme progress curve and plotted against incubation time. This data has an exponential decay (C*exp-Kt) Where t1/2= Ln2 / k (see FIG. 12).
[0411]
Many modifications and variations of the present invention are possible in light of the above teachings, so that, within the scope of the appended claims, the invention may be practiced other than as specifically described. While the present invention has been described in detail with reference to certain preferred embodiments thereof, it will be understood that modifications and variations fall within the spirit and scope of the described and claimed invention.
[Brief description of the drawings]
FIG. 1 shows a preferred embodiment of site saturation mutagenesis.
FIG. 2 shows the generation of an exhaustive set of chimeric linkages by synthetic ligation rearrangement.
3A and 3B. Select end-points using a topoisomerase-derived selection step to select the desired polynucleotide (eg, perform full-length molecule selection) produced by polynucleotide rearrangement (eg, by synthetic ligation rearrangement). It is a figure showing an application.
FIG. 4 illustrates various aspects of the end selection technique.
FIG. 5. In order to achieve directed expression cloning of the original blunt-ended DNA, the enzyme N.A. FIG. 3 illustrates a particular embodiment of the end-selection technique in which the step of “c) performing directed expression cloning” is accomplished using BstNB1.
FIG. 6 shows the activity of the enzyme exonuclease III. The asterisk indicates that the enzyme works from the 3 'direction to the 5' direction of the polynucleotide substrate.
FIG. 7 illustrates an exemplary application of the enzyme exonuclease III in exonuclease-mediated polynucleotide reconstitution.
FIG. 8 is a diagram showing generation of a multi-bond nucleic acid chain.
FIG. 9: In the heteromeric nucleic acid complex, the 3 ′ and 5 ′ terminal nucleotides are released from the unhybridized single-stranded end of the annealed nucleic acid strand, leaving the shortened but hybridized end. FIG. 3 illustrates the use of exonuclease treatment as a means to promote polymerase-based extension of the terminated ends and / or ligase-mediated ligation.
FIG. 10 illustrates the use of exonuclease-mediated nucleic acid rearrangement in an example of annealing a single methylated multi-linked nucleic acid strand into several unmethylated single-linked nucleic acid strands.
FIG. 11 illustrates the use of exonuclease-mediated nucleic acid rearrangement in an example of annealing a plurality of methylated multi-binding nucleic acid strands into several unmethylated single-binding nucleic acid strands.
FIG. 12 is a graph showing the thermostability of wild-type (20F12) and mutant (Dhla 5) dehalogenase at 55 ° C.
FIG. 13 shows a graph of the thermostability of Dhla 5 dehalogenase at 55 ° C.
FIG. 14 shows enzyme progress curves of Dhla 5 and 20F12 at 30 ° C. and 55 ° C.
FIG. 15 shows the thermostability of Dhla 5 dehalogenase at 80 ° C. This data is t1/2= Ln2 / k exponential decay (C*exp-Kt).
FIG. 16 shows the thermostability of Dhla 5 and Dhla 8 dehalogenase at 80 ° C. This data gives values of 13 and 138 minutes for Dhla 5 and Dhla 8, respectively.1/2= Ln2 / k exponential decay (C*exp-Kt).
FIG. 17 (FIGS. 17A, 17B, and 17C) shows differential scanning calorimetry of three dehalogenase variants. This data was recorded using a Perkin Elmer Pyris 1 at a scan rate of 10 ° C./min.
[Sequence list]
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811
Figure 2004524811

Claims (62)

所定の生物活性又は生体分子を取得する方法であって、
a)特定の生物活性又は生体分子に関して、細胞の混合集団からの核酸により生成されたクローンのライブラリをスクリーニングするステップと、
b)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
c)ステップb)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が配列変化の影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for obtaining a predetermined biological activity or biomolecule,
a) screening a library of clones produced by nucleic acids from a mixed population of cells for a particular biological activity or biomolecule;
b) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
c) comparing the biological activity or biomolecule from step b) to a specific biological activity or biomolecule, wherein the difference in the biological activity or biomolecule indicates the effect of the sequence change, whereby Providing a molecule;
A method comprising:
生体分子が、核酸配列である、請求項1記載の方法。The method according to claim 1, wherein the biomolecule is a nucleic acid sequence. 核酸配列が、DNA又はRNA配列である、請求項2記載の方法。3. The method according to claim 2, wherein the nucleic acid sequence is a DNA or RNA sequence. 核酸配列が、
クローンに含まれる核酸を、検出可能な分子を含む少なくとも一つのオリゴヌクレオチドプローブ及び所定の核酸配列の少なくとも一部に接触させるステップと、
少なくとも一つのオリゴヌクレオチドプローブに対する補体を含む核酸配列を、検出可能な分子からの検出可能な信号を検出するアナライザにより同定するステップと、
によってスクリーニングされる、請求項2記載の方法。
The nucleic acid sequence is
Contacting the nucleic acid contained in the clone with at least one oligonucleotide probe containing a detectable molecule and at least a part of a predetermined nucleic acid sequence,
Identifying a nucleic acid sequence comprising complement to at least one oligonucleotide probe by an analyzer that detects a detectable signal from the detectable molecule;
3. The method of claim 2, which is screened by:
検出可能な分子が、発色又は蛍光基質である、請求項4記載の方法。5. The method according to claim 4, wherein the detectable molecule is a chromogenic or fluorescent substrate. 検出可能な信号が、蛍光である、請求項4記載の方法。The method of claim 4, wherein the detectable signal is fluorescence. 蛍光基質が、ウンベリフェロン又はその誘導体又は類似体、レゾルフィン又はその誘導体又は類似体、フルオレセイン又はその誘導体又は類似体、或いはローダミン又はその誘導体又は類似体である、請求項5記載の方法。The method according to claim 5, wherein the fluorescent substrate is umbelliferone or a derivative or analog thereof, resorufin or a derivative or analog thereof, fluorescein or a derivative or analog thereof, or rhodamine or a derivative or analog thereof. 検出可能な分子が、所定のポリヌクレオチド又はその断片を符号化する配列を有する、検出可能に標識されたオリゴヌクレオチドである、請求項4記載の方法。5. The method of claim 4, wherein the detectable molecule is a detectably labeled oligonucleotide having a sequence encoding a given polynucleotide or fragment thereof. 検出可能に標識されたオリゴヌクレオチドが、蛍光分子によって標識される、請求項8記載の方法。9. The method of claim 8, wherein the detectably labeled oligonucleotide is labeled with a fluorescent molecule. スクリーニングが、所定の配列又は所定の核酸配列を側面に置く配列を実質的に補完し、検出可能な分子を有するプライマを使用した、所定の核酸配列のPCR増幅によるものである、請求項2記載の方法。3. The method of claim 2, wherein the screening is by PCR amplification of the predetermined nucleic acid sequence using a primer having a detectable molecule that substantially complements the predetermined sequence or the sequence flanking the predetermined nucleic acid sequence. the method of. スクリーニングが、所定の核酸配列を実質的に補完するオリゴヌクレオチドのハイブリッド形成によるものである、請求項2記載の方法。3. The method of claim 2, wherein the screening is by hybridization of an oligonucleotide that substantially complements the predetermined nucleic acid sequence. 変化を与えた所定の核酸配列を、変化を与えていないステップ(c)の核酸配列と比較し、これによりヌクレオチド配列の変化を特定するステップを更に含む、請求項2記載の方法。3. The method of claim 2, further comprising comparing the altered nucleic acid sequence with the unaltered nucleic acid sequence of step (c), thereby identifying an altered nucleotide sequence. 比較が、配列比較アルゴリズムを使用して実行される、請求項12記載の方法。13. The method of claim 12, wherein the comparison is performed using a sequence comparison algorithm. 生物活性が、ポリペプチドによって提供される、請求項1記載の方法。2. The method of claim 1, wherein the biological activity is provided by a polypeptide. 生物活性が、酵素活性である、請求項1記載の方法。2. The method according to claim 1, wherein the biological activity is an enzymatic activity. 酵素活性が、リパーゼと、エステラーゼと、プロテアーゼと、グリコシダーゼと、グリコシルトランスフェラーゼと、ホスファターゼと、キナーゼと、モノ及びジオキシゲナーゼと、ハロペルオキシダーゼと、リグニンペロキシダーゼと、ジアリルプロパンペロキシダーゼと、エポキシドヒドロラーゼと、ニトリルヒドラターゼと、ニトリラーゼと、トランスアミナーゼと、アミダーゼと、アシラーゼとによって構成されるグループから選択された酵素によって提供される、請求項15記載の方法。Enzyme activity, lipase, esterase, protease, glycosidase, glycosyltransferase, phosphatase, kinase, mono- and dioxygenase, haloperoxidase, lignin peroxidase, diallyl propane peroxidase, epoxide hydrolase 16. The method of claim 15, wherein the method is provided by an enzyme selected from the group consisting of: nitrile hydratase, nitrilase, transaminase, amidase, and acylase. ライブラリが、発現ライブラリである、請求項1記載の方法。2. The method according to claim 1, wherein the library is an expression library. ライブラリが、環境試料から取得されたDNAを含む、請求項1記載の方法。2. The method of claim 1, wherein the library comprises DNA obtained from an environmental sample. ライブラリが、極限環境微生物から取得されたDNAを含む、請求項1記載の方法。2. The method of claim 1, wherein the library comprises DNA obtained from an extreme environment microorganism. 極限環境微生物が、好熱性有機体である、請求項19記載の方法。20. The method of claim 19, wherein the extreme environmental microorganism is a thermophilic organism. 極限環境微生物が、超好熱性有機体と、冷温性有機体と、好塩性有機体と、低温菌と、好アルカリ性有機体と、好酸性有機体とによって構成されるグループから選択される、請求項20記載の方法。Extreme environmental microorganisms are selected from the group consisting of hyperthermophilic organisms, cold and warm organisms, halophilic organisms, psychrotrophs, alkalophilic organisms, and acidophilic organisms, The method of claim 20. スクリーニングするステップが、クローンを、検出可能な分子により標識された基質に接触させるステップを含み、基質とクローンに含まれる生物活性又は生体分子との相互作用が検出可能な信号を生成する、請求項17記載の方法。The screening step comprises contacting the clone with a substrate labeled with a detectable molecule, wherein the interaction of the substrate with a biological activity or biomolecule contained in the clone produces a detectable signal. The method of claim 17. 基質が、生物活性基質である、請求項22記載の方法。23. The method of claim 22, wherein the substrate is a biologically active substrate. 生物活性基質が、C12FDCGを含む、請求項22記載の方法。23. The method of claim 22, wherein the bioactive substrate comprises C12FDCG. 基質が、DNA結合部分にリンクする第一のテストタンパク質と、転写活性部分にリンクする第二のテストタンパク質とを含み、DNA結合部分にリンクする第一のテストタンパク質と転写活性部分にリンクする第二のテストタンパク質との相互作用の調節により、検出可能なタンパク質の発現に変化が生じる、請求項22記載の方法。The substrate includes a first test protein linked to a DNA binding moiety and a second test protein linked to a transcriptionally active moiety, wherein the first test protein linked to the DNA binding moiety and the second test protein linked to the transcriptionally active moiety. 23. The method of claim 22, wherein modulating interaction with the second test protein results in a change in expression of the detectable protein. スクリーニングが、核酸の発現によるものである、請求項22記載の方法。23. The method of claim 22, wherein the screening is by expression of a nucleic acid. ステップ(d)の前に、特定の生物活性又は生体分子を含むクローンから核酸を取得するステップを更に含む、請求項1記載の方法。2. The method of claim 1, further comprising, prior to step (d), obtaining nucleic acids from a clone containing the particular biological activity or biomolecule. クローンに含まれる核酸を取得するステップが、クローンを、相補的核酸又はその断片に接触させるステップを含み、これにより、相補的核酸によるクローン核酸のハイブリッド形成と、その分離とを可能にする、請求項27記載の方法。Obtaining the nucleic acid contained in the clone comprises contacting the clone with a complementary nucleic acid or a fragment thereof, thereby allowing hybridization of the cloned nucleic acid with the complementary nucleic acid and its separation. Item 28. The method according to Item 27. 相補的核酸又はその断片が、固相結合ハイブリッド形成プローブを含む、請求項28記載の方法。29. The method of claim 28, wherein the complementary nucleic acid or fragment thereof comprises a solid phase binding hybridization probe. 核酸配列に、エラープローンPCRと、シャッフリングと、オリゴヌクレオチド指定突然変異生成と、アセンブリPCRと、セクシャルPCR突然変異生成と、in vivo突然変異生成と、カセット式突然変異生成と、再帰的アンサンブル突然変異生成と、指数アンサンブル突然変異生成と、部位特異的突然変異生成と、ライゲーション再構成と、GSSMと、その任意の組み合わせとによって構成されるグループから選択された方法で変化を与える、請求項1記載の方法。Error-prone PCR, shuffling, oligonucleotide-directed mutagenesis, assembly PCR, sexual PCR mutagenesis, in vivo mutagenesis, cassette mutagenesis, and recursive ensemble mutation of nucleic acid sequences The method of claim 1, wherein the altering is provided in a manner selected from a group consisting of generation, exponential ensemble mutagenesis, site-directed mutagenesis, ligation rearrangement, GSSM, and any combination thereof. the method of. 核酸配列に、エラープローンPCRで変化を与える、請求項1記載の方法。The method according to claim 1, wherein the nucleic acid sequence is changed by error-prone PCR. 核酸配列に、シャッフリングで変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by shuffling. 核酸配列に、オリゴヌクレオチド指定突然変異生成で変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by oligonucleotide directed mutagenesis. 核酸配列に、アセンブリPCRで変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by assembly PCR. 核酸配列に、セクシャルPCR突然変異生成で変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by sexual PCR mutagenesis. 核酸配列に、in vivo突然変異生成で変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by in vivo mutagenesis. 核酸配列に、カセット式突然変異生成で変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by cassette mutagenesis. 核酸配列に、再帰的アンサンブル突然変異生成で変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by recursive ensemble mutagenesis. 核酸配列に、指数アンサンブル突然変異生成で変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by exponential ensemble mutagenesis. 核酸配列に、部位特異的突然変異生成で変化を与える、請求項1記載の方法。2. The method of claim 1, wherein the nucleic acid sequence is altered by site-directed mutagenesis. 核酸に変化を与えるステップの前に、更なる特定のタンパク質又は酵素活性に対して、ステップ(c)のクローンをスクリーニングするステップを含む、請求項1記載の方法。2. The method of claim 1, comprising screening the clone of step (c) for further specific protein or enzyme activity prior to the step of altering the nucleic acid. ライブラリが、原核細胞において生成される、請求項1記載の方法。2. The method of claim 1, wherein the library is produced in a prokaryotic cell. ライブラリが、ストレプトミセス種において生成される、請求項1記載の方法。2. The method of claim 1, wherein the library is generated in a Streptomyces species. ストレプトミセスが、Streptomyces venezuelaeである、請求項43記載の方法。44. The method of claim 43, wherein the Streptomyces is Streptomyces venezuelae. 原核細胞が、グラム陰性である、請求項42記載の方法。43. The method of claim 42, wherein the prokaryotic cells are Gram negative. 原核細胞が、バシラス種である、請求項42記載の方法。43. The method of claim 42, wherein the prokaryotic cell is a Bacillus species. 原核細胞が、シュードモナス種である、請求項42記載の方法。43. The method of claim 42, wherein the prokaryotic cell is a Pseudomonas species. ライブラリが、ライブラリのクローンを、生物活性基質に接触させること、或いはこれによりカプセル化することによりスクリーニングされ、クローンによって生成される生物活性又は生体分子が、クローンに接触させる前の基質における接触後と比較した相違によって検出される、請求項1記載の方法。Libraries are screened by contacting, or encapsulating, a clone of the library with a biologically active substrate so that the biological activity or biomolecules produced by the clones can be compared after contact with the substrate before contacting the clones. The method of claim 1, wherein the difference is detected by a compared difference. ライブラリが、ライブラリをスクリーニングするステップの前に平均化される、請求項1記載の方法。2. The method of claim 1, wherein the libraries are averaged prior to the step of screening the libraries. 生物活性又は生体分子が、遺伝子群又はその断片である、請求項1記載の方法。The method according to claim 1, wherein the biological activity or biomolecule is a gene group or a fragment thereof. 生物活性又は生体分子が、代謝経路にあるポリペプチドである、請求項1記載の方法。2. The method of claim 1, wherein the biological activity or biomolecule is a polypeptide that is in a metabolic pathway. 所定の生物活性又は生体分子を同定する方法であって、
a)特定の生物活性又は生体分子に関して、複数の分離物から取得されたプール済み核酸により生成されたクローンのライブラリをスクリーニングするステップと、
b)特定の生物活性又は生体分子を含むクローンを同定するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
a) screening a library of clones generated by pooled nucleic acids obtained from the plurality of isolates for a particular biological activity or biomolecule;
b) identifying a clone containing a particular biological activity or biomolecule;
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
a)特定の生物活性又は生体分子に関して、複数の分離物から取得されたプール済み核酸により生成されたクローンのライブラリをスクリーニングするステップと、
b)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
c)b)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較し、これにおいて、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
a) screening a library of clones generated by pooled nucleic acids obtained from the plurality of isolates for a particular biological activity or biomolecule;
b) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
c) comparing the biological activity or biomolecule from b) to a specific biological activity or biomolecule, wherein the difference in the biological activity or biomolecule indicates the effect of introducing at least one sequence change, Providing a predetermined biological activity or biomolecule;
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
a)特定の生物活性又は生体分子に関して、複数の分離物のそれぞれから取得した核酸により生成された個別の遺伝子ライブラリをプールすることから生成されたクローンのライブラリをスクリーニングするステップと、
b)特定の生物活性又は生体分子を含むクローンを同定するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
a) screening a library of clones generated from pooling individual gene libraries generated by nucleic acids obtained from each of the plurality of isolates for a particular biological activity or biomolecule;
b) identifying a clone containing a particular biological activity or biomolecule;
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
a)特定の生物活性又は生体分子に関してライブラリをスクリーニングするステップにして、前記ライブラリが、複数の分離物のそれぞれから取得した核酸により生成された個別の遺伝子ライブラリをプールすることから生成されるステップと、
b)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
c)ステップc)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
a) screening the library for a particular biological activity or biomolecule, wherein the library is generated from pooling individual gene libraries generated by nucleic acids obtained from each of a plurality of isolates; ,
b) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
c) comparing the bioactivity or biomolecule from step c) to a particular bioactivity or biomolecule, indicating the effect of the difference in bioactivity or biomolecule introducing at least one sequence change, Providing a predetermined biological activity or biomolecule,
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
(a)特定の生物活性又は生体分子に関して、有機体の濃縮集団からの核酸により生成されたクローンのライブラリをスクリーニングするステップと、
(b)特定の生物活性又は生体分子を含むクローンを同定するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
(A) screening a library of clones generated by nucleic acids from an enriched population of organisms for a particular biological activity or biomolecule;
(B) identifying a clone containing a particular biological activity or biomolecule;
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
(a)特定の生物活性又は生体分子に関して、有機体の濃縮集団からの核酸により生成されたクローンのライブラリをスクリーニングするステップと、
(b)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
(c)ステップb)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
(A) screening a library of clones generated by nucleic acids from an enriched population of organisms for a particular biological activity or biomolecule;
(B) altering a nucleic acid sequence contained in a clone having a specific biological activity or biomolecule;
(C) comparing the bioactivity or biomolecule from step b) to a particular bioactivity or biomolecule, indicating the effect of the difference in bioactivity or biomolecule introducing at least one sequence change; Thereby providing a predetermined biological activity or biomolecule;
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
(a)有機体の混合集団からの核酸を、検出可能な分子を含む少なくとも一つのオリゴヌクレオチドプローブ及び所定の分子を符号化する核酸配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で且つ相補配列の相互作用が可能となるような時間に渡って、培養するステップと、
(b)検出可能な分子を検出するアナライザを使用して、オリゴヌクレオチドプローブに対する補体を有する核酸配列を同定するステップと、
(c)同定した核酸配列からライブラリを生成するステップと、
(d)特定の生物活性又は生体分子に関してライブラリをスクリーニングするステップと、
(e)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
(f)ステップ(e)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
(A) enabling the interaction of a complementary sequence of a nucleic acid from a mixed population of organisms with at least one oligonucleotide probe containing a detectable molecule and at least a portion of the nucleic acid sequence encoding a given molecule. Culturing under such conditions and for a time that allows the interaction of the complementary sequences,
(B) using an analyzer to detect the detectable molecule, identifying a nucleic acid sequence having a complement to the oligonucleotide probe;
(C) generating a library from the identified nucleic acid sequence;
(D) screening the library for a particular biological activity or biomolecule;
(E) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
(F) comparing the bioactivity or biomolecule from step (e) to a particular bioactivity or biomolecule, indicating the effect of the difference in bioactivity or biomolecule introducing at least one sequence change. Providing a predetermined biological activity or biomolecule,
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
(a)有機体の混合集団から取得した核酸を、検出可能な分子を含む少なくとも一つのオリゴヌクレオチドプローブ及び所定の分子を符号化する核酸配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で且つ相補配列の相互作用が可能となるような時間に渡って、微環境において共同カプセル化するステップと、
(b)検出可能な分子を検出するアナライザにより、カプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、
(c)分離されたカプセル化核酸からライブラリを生成するステップと、
(d)特定の生物活性又は生体分子に関してライブラリをスクリーニングするステップと、
(e)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
(f)ステップ(e)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
(A) enabling the interaction of a complementary sequence with a nucleic acid obtained from a mixed population of organisms, together with at least one oligonucleotide probe containing a detectable molecule and at least a portion of a nucleic acid sequence encoding a given molecule. Co-encapsulating in a microenvironment under such conditions and for a time such that complementary sequence interactions are possible;
(B) identifying an encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule by separating the encapsulated nucleic acid with an analyzer that detects a detectable molecule;
(C) generating a library from the separated encapsulated nucleic acids;
(D) screening the library for a particular biological activity or biomolecule;
(E) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
(F) comparing the bioactivity or biomolecule from step (e) to a particular bioactivity or biomolecule, indicating the effect of the difference in bioactivity or biomolecule introducing at least one sequence change. Providing a predetermined biological activity or biomolecule,
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
(a)有機体の混合集団の分離物から取得された核酸を、検出可能なマーカを含む少なくとも一つのオリゴヌクレオチドプローブ及び所定の生物活性を有する分子を符号化するポリヌクレオチド配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で且つ相補配列の相互作用が可能となるような時間に渡って、微環境において共同カプセル化するステップと、
(b)検出可能なマーカを検出するアナライザにより、カプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、
(c)分離されたカプセル化核酸からライブラリを生成するステップと、
(d)特定の生物活性又は生体分子に関してライブラリをスクリーニングするステップと、
(e)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
(f)ステップ(e)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
(A) combining a nucleic acid obtained from a segregate of a mixed population of organisms with at least one oligonucleotide probe comprising a detectable marker and at least a portion of a polynucleotide sequence encoding a molecule having a predetermined biological activity. Co-encapsulating in a microenvironment under conditions that allow interaction of the complementary sequences and for a time that allows interaction of the complementary sequences;
(B) identifying an encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule by separating the encapsulated nucleic acid by an analyzer that detects a detectable marker;
(C) generating a library from the separated encapsulated nucleic acids;
(D) screening the library for a particular biological activity or biomolecule;
(E) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
(F) comparing the bioactivity or biomolecule from step (e) to a particular bioactivity or biomolecule, indicating the effect of the difference in bioactivity or biomolecule introducing at least one sequence change. Providing a predetermined biological activity or biomolecule,
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
(a)有機体の混合集団の一つ以上の分離物から取得された核酸を、検出可能なマーカを含む少なくとも一つのオリゴヌクレオチドプローブ及び所定の生物活性を有する分子を符号化するポリヌクレオチド配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で且つ相補配列の相互作用が可能となるような時間に渡って、微環境において共同カプセル化するステップと、
(b)検出可能なマーカを検出するアナライザによりカプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、
(c)分離されたカプセル化核酸からライブラリを生成するステップと、
(d)特定の生物活性又は生体分子に関してライブラリをスクリーニングするステップと、
(e)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
(f)ステップ(e)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
(A) combining nucleic acid obtained from one or more isolates of a mixed population of organisms with at least one oligonucleotide probe containing a detectable marker and a polynucleotide sequence encoding a molecule having a predetermined biological activity. Co-encapsulating in a microenvironment, at least in part, under conditions such that complementary sequence interaction is possible and for a time such that complementary sequence interaction is possible;
(B) identifying the encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule by separating the encapsulated nucleic acid with an analyzer that detects a detectable marker;
(C) generating a library from the separated encapsulated nucleic acids;
(D) screening the library for a particular biological activity or biomolecule;
(E) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
(F) comparing the bioactivity or biomolecule from step (e) to a particular bioactivity or biomolecule, indicating the effect of the difference in bioactivity or biomolecule introducing at least one sequence change. Providing a predetermined biological activity or biomolecule,
A method comprising:
所定の生物活性又は生体分子を同定する方法であって、
(a)有機体の混合集団の分離物の混合物から取得された核酸を、検出可能なマーカを含む少なくとも一つのオリゴヌクレオチドプローブ及び所定の生物活性を有する分子を符号化するポリヌクレオチド配列の少なくとも一部と共に、相補配列の相互作用が可能となるような条件下で且つ相補配列の相互作用が可能となるような時間に渡って、微環境において共同カプセル化するステップと、
(b)検出可能なマーカを検出するアナライザによりカプセル化核酸を分離することで、所定の分子を符号化するオリゴヌクレオチドプローブに対する補体を含むカプセル化核酸を同定するステップと、
(c)分離されたカプセル化核酸からライブラリを生成するステップと、
(d)特定の生物活性又は生体分子に関してライブラリをスクリーニングするステップと、
(e)特定の生物活性又は生体分子を有するクローンに含まれる核酸配列に変化を与えるステップと、
(f)ステップ(e)からの生物活性又は生体分子を特定の生物活性又は生体分子と比較するステップにして、生物活性又は生体分子の相違が少なくとも一つの配列変化を導入したことの影響を示し、これにより所定の生物活性又は生体分子を提供するステップと、
を備える方法。
A method for identifying a given biological activity or biomolecule,
(A) combining a nucleic acid obtained from a mixture of isolates of a mixed population of organisms with at least one oligonucleotide probe containing a detectable marker and at least one polynucleotide sequence encoding a molecule having a predetermined biological activity. Co-encapsulating in a microenvironment under conditions that allow interaction of the complementary sequences and for a time that allows interaction of the complementary sequences,
(B) identifying the encapsulated nucleic acid containing a complement to an oligonucleotide probe encoding a predetermined molecule by separating the encapsulated nucleic acid with an analyzer that detects a detectable marker;
(C) generating a library from the separated encapsulated nucleic acids;
(D) screening the library for a particular biological activity or biomolecule;
(E) altering a nucleic acid sequence contained in a clone having a particular biological activity or biomolecule;
(F) comparing the bioactivity or biomolecule from step (e) to a particular bioactivity or biomolecule, indicating the effect of the difference in bioactivity or biomolecule introducing at least one sequence change. Providing a predetermined biological activity or biomolecule,
A method comprising:
JP2002527252A 2000-09-15 2001-09-17 Combinatorial screening of mixed populations of organisms Pending JP2004524811A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/663,620 US7018793B1 (en) 1995-12-07 2000-09-15 Combinatorial screening of mixed populations of organisms
PCT/US2001/029712 WO2002022810A2 (en) 2000-09-15 2001-09-17 Combinatorial screening of mixed populations of organisms

Publications (1)

Publication Number Publication Date
JP2004524811A true JP2004524811A (en) 2004-08-19

Family

ID=24662600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002527252A Pending JP2004524811A (en) 2000-09-15 2001-09-17 Combinatorial screening of mixed populations of organisms

Country Status (5)

Country Link
EP (1) EP1319068A2 (en)
JP (1) JP2004524811A (en)
AU (1) AU9120801A (en)
CA (1) CA2391626A1 (en)
WO (1) WO2002022810A2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006235875B8 (en) * 2000-12-01 2011-04-14 Basf Enzymes Llc Enzymes having dehalogenase activity and methods of use thereof
CA2430192C (en) * 2000-12-01 2014-06-03 Diversa Corporation Enzymes having dehalogenase activity and methods of use thereof
CN102590528A (en) * 2012-01-18 2012-07-18 厦门大学 Method for detecting interaction of proteins
CN106124471B (en) * 2016-07-19 2019-04-16 天津大学 Time-domain fluorescent service life imaging arrangement and life test acquisition methods

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6117679A (en) * 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
GB9701425D0 (en) * 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function

Also Published As

Publication number Publication date
AU9120801A (en) 2002-03-26
WO2002022810A2 (en) 2002-03-21
CA2391626A1 (en) 2002-03-21
EP1319068A2 (en) 2003-06-18
WO2002022810A3 (en) 2003-02-27

Similar Documents

Publication Publication Date Title
US6632600B1 (en) Altered thermostability of enzymes
US6794127B1 (en) Capillary array-based sample screening
US20010041333A1 (en) High throughput screening for a bioactivity or biomolecule
US20120010104A1 (en) Growth selection method
US20060094033A1 (en) Screening methods and libraries of trace amounts of DNA from uncultivated microorganisms
WO2001038583A2 (en) Capillary array-based sample screening
JP2001078786A (en) Screening of enzymatic activity
KR20220147616A (en) RNA detection and transcription-dependent editing using reprogrammed tracrRNA
US6455254B1 (en) Sequence based screening
JP2004524811A (en) Combinatorial screening of mixed populations of organisms
US20050064498A1 (en) High throughput screening for sequences of interest
US20020164580A1 (en) Combinatorial screening of mixed populations of organisms
AU2015234399A1 (en) Combinatorial screening of mixed populations of organisms
AU2007231834A1 (en) Combinatorial screening of mixed populations of organisms
AU2012216477A1 (en) Combinatorial screening of mixed populations of organisms
US20020031771A1 (en) Sequence based screening
MXPA01007369A (en) Capillary array-based sample screening
CA2375873A1 (en) Methods and compositions for isolating high molecular weight dna from natural samples
AU2007201249A1 (en) Sequence based screening
AU2002316326A1 (en) Methods for the manufacture of pure single enantiomer compounds and for selecting enantioselective enzymes