JP2003527072A - Protein design automation for protein libraries - Google Patents

Protein design automation for protein libraries

Info

Publication number
JP2003527072A
JP2003527072A JP2000577277A JP2000577277A JP2003527072A JP 2003527072 A JP2003527072 A JP 2003527072A JP 2000577277 A JP2000577277 A JP 2000577277A JP 2000577277 A JP2000577277 A JP 2000577277A JP 2003527072 A JP2003527072 A JP 2003527072A
Authority
JP
Japan
Prior art keywords
library
protein
sequences
sequence
primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000577277A
Other languages
Japanese (ja)
Other versions
JP2003527072A5 (en
Inventor
クラウス・エム・フィービッヒ
ロバート・ジェイ・ヘイズ
バシル・アイ・ダヒヤット
イェルク・ベントツィーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xencor Inc
Original Assignee
Xencor Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xencor Inc filed Critical Xencor Inc
Publication of JP2003527072A publication Critical patent/JP2003527072A/en
Publication of JP2003527072A5 publication Critical patent/JP2003527072A5/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1044Preparation or screening of libraries displayed on scaffold proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/86Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in cyclic amides, e.g. penicillinase (3.5.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/02Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amides (3.5.2)
    • C12Y305/02006Beta-lactamase (3.5.2.6)

Abstract

(57)【要約】 本発明は、蛋白質設計オートメーション(PDA)を使用して、コンピューター処理プレスクリーニングした蛋白質の二次ライブラリーを生成させること、およびそれらのライブラリーを利用する方法および組成物に関する。 The present invention relates to the use of protein design automation (PDA) to generate secondary libraries of computerized prescreened proteins, and methods and compositions utilizing those libraries. .

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】 (発明の分野) 本発明は、コンピューター処理によりプレスクリーニングされた蛋白質の二次
ライブラリーを作成するための蛋白質設計オートメーション(PDA)の使用、
並びに該ライブラリーを用いた方法および組成物に関するものである。
FIELD OF THE INVENTION The present invention relates to the use of protein design automation (PDA) to create a secondary library of computationally prescreened proteins,
And methods and compositions using the library.

【0002】 (発明の背景) 定方向分子進化を用いることにより、新規機能および特性を有する蛋白質およ
び酵素が生成され得る。既知天然蛋白質から出発し、数ラウンドの変異誘発、機
能的スクリーニングおよび好結果の配列の増殖が遂行される。この方法の利点は
、それを用いることにより構造が判明していない蛋白質でも急速に進化させ得る
ことである。幾つかの異なる変異誘発方法が存在し、例えば誤りがちなPCRに
よる点変異誘発、カセット変異誘発およびDNAシャッフリングが含まれる。こ
れらの技術は多くの成果をあげてきた。しかしながら、それらは全て、潜在的変
化を有する小さなフラクションしか生成できないという不利な条件を抱えている
。例えば、約500アミノ酸長を有する平均的蛋白質の場合20500の可能な
アミノ酸変化が存在する。明らかに、非常に多くの変異体の変異誘発および機能
スクリーニングは不可能である。定方向進化により提供される可能な配列のサン
プリングは非常に散在したものであるため、改良された可能性のある蛋白質のご
く一部、典型的には点変異または既存配列の組換えしか調べられない。莫大な数
の可能な配列から無作為にサンプリングすることにより、定方向進化は不偏であ
って、広く適用可能であるが、蛋白質の構造および生物物理学的情報をすべて無
視しているため本質的には非効率的である。
BACKGROUND OF THE INVENTION By using directed molecular evolution, proteins and enzymes with novel functions and properties can be produced. Starting from a known native protein, several rounds of mutagenesis, functional screening and successful sequence amplification are performed. The advantage of this method is that it allows rapid evolution of proteins of unknown structure. There are several different mutagenesis methods, including error-prone PCR point mutagenesis, cassette mutagenesis and DNA shuffling. These technologies have achieved many results. However, they all suffer from the disadvantage that they can only produce a small fraction with potential changes. For example, there are 20 500 possible amino acid changes for an average protein with a length of about 500 amino acids. Clearly, mutagenesis and functional screening of a large number of variants is not possible. The sampling of possible sequences provided by directed evolution is so interspersed that only a small portion of the potentially improved proteins could be investigated, typically point mutations or recombination of existing sequences. Absent. Random sampling from an enormous number of possible sequences allows directed evolution to be unbiased and widely applicable, but essential because it ignores all protein structural and biophysical information. Is inefficient.

【0003】 対照的に、コンピューター操作による方法を用いることにより、莫大な配列ラ
イブラリー(一計算で1080以下)がスクリーニングされるため、実験的ライ
ブラリースクリーニング方法、例えば定方向分子進化の鍵となる限界が克服され
得る。配列の生成および評価に関する広く多様な方法が知られている。これらに
は、配列プロファイリング(Bowieおよび Eisenberg、Science253(5016
):164−70(1991))、回転異性体ライブラリー選択法(Dahiyatお
よびMayo、Protein Sci5(5):895−903(1996)、Dahiyatおよび
Mayo、Science278(5335):82−7(1997);DesjarlaisおよびH
andel、Protein Science4:2006−2018(1995)、Harburyら、PNA
S USA 92(18);8408−8412(1995);Konoら、Proteins:Str
ucture, Function and Genetics 19:244−255(1994)、Hellinga
およびRichards、PNAS USA 91:5803−5807(1994))、および
残基対ポテンシャル(Jones, Protein Science 3:567−574(1994
))があるが、限定されるわけではない。
[0003] In contrast, by using a computer based method operation, since vast array library (one calculated at 10 80 or less) are screened, experimental library screening methods, for example, a key directed molecular evolution Can be overcome. A wide variety of methods for generating and evaluating sequences are known. These include sequence profiling (Bowie and Eisenberg, Science 253 (5016
): 164-70 (1991)), rotamer library selection method (Dahiyat and Mayo, Protein Sci5 (5): 895-903 (1996), Dahiyat and
Mayo, Science 278 (5335): 82-7 (1997); Desjarlais and H.
andel, Protein Science 4: 2006-2018 (1995), Harbury et al., PNA.
S USA 92 (18); 8408-8421 (1995); Kono et al., Proteins: Str.
ucture, Function and Genetics 19: 244-255 (1994), Hellinga
And Richards, PNAS USA 91: 5803-5807 (1994)), and residue pair potential (Jones, Protein Science 3: 567-574 (1994).
)), But is not limited.

【0004】 特に、U.S.S.N60/061097、60/043464、60/054
678、09/127926およびPCT US98/07254は、若干のス
コアリング機能を用いて配列安定性を評価する、「蛋白質設計オートメーション
」またはPDAと呼ばれる方法について記載している。
In particular, USS N 60/061097, 60/043464, 60/054
678, 09/127926 and PCT US98 / 07254 describe a method called "protein design automation" or PDA, which uses some scoring function to assess sequence stability.

【0005】 配列ライブラリーをプレスクリーニングして二次ライブラリーを生成および選
択するためのコンピューター操作による方法の提供が本発明の目的であり、次い
で上記ライブラリーは実験的に作成および評価され得る。
It is an object of the present invention to provide a computerized method for prescreening a sequence library to generate and select a secondary library, which library can then be experimentally generated and evaluated.

【0006】 (発明の概要) 上で概説した本発明の目的に従い、本発明は、骨格蛋白質変異体の二次ライブ
ラリーの作成方法であって、骨格蛋白質一次変異体配列のランク順リストを含む
一次ライブラリーの提供を含む方法を提供する。次いで、一次ライブラリーにお
ける一次変異位置のリストを作成し、次いで複数の一次変異位置を合わせること
により二次配列の二次ライブラリーを作成する。
SUMMARY OF THE INVENTION In accordance with the objects of the present invention outlined above, the present invention is a method of making a secondary library of scaffold protein variants, comprising a rank ordered list of scaffold protein primary variant sequences. Methods are provided that include providing a primary library. Then, a list of primary mutation positions in the primary library is created, and then a plurality of primary mutation positions are combined to create a secondary library of secondary sequences.

【0007】 別の態様において、本発明は、骨格蛋白質変異体の二次ライブラリーの作成方
法であって、骨格蛋白質一次変異配列のランク順リストを含む一次ライブラリー
を提供することを含む方法、および複数の変異位置におけるアミノ酸残基の確率
分布を作成する方法を提供する。複数のアミノ酸残基を合わせることにより、二
次配列の二次ライブラリーを作成する。次いで、これらの配列は、プールしたオ
リゴヌクレオチドによる多重PCR、誤りがちなPCR、遺伝子シャッフリング
などを含む様々な方法で所望により合成および試験され得る。
In another aspect, the invention provides a method of making a secondary library of scaffold protein variants, comprising providing a primary library comprising a rank ordered list of scaffold protein primary variant sequences, And a method for creating a probability distribution of amino acid residues at multiple mutation positions. A secondary library of secondary sequences is created by combining multiple amino acid residues. These sequences can then be optionally synthesized and tested in a variety of ways, including multiplex PCR with pooled oligonucleotides, error prone PCR, gene shuffling, and the like.

【0008】 別の態様において、本発明は、複数の二次変異蛋白質または蛋白質をコード化
する核酸を含む組成物を提供するが、この複数には、二次ライブラリーの全てま
たはサブセットが含まれる。さらに本発明は、ライブラリーを含む細胞、特に哺
乳動物細胞を提供する。
In another aspect, the invention provides a composition comprising a plurality of secondary mutant proteins or nucleic acids encoding proteins, the plurality comprising all or a subset of a secondary library. . The invention further provides cells comprising the library, particularly mammalian cells.

【0009】 別の態様において、本発明は、骨格蛋白質変異体の二次ライブラリーの作成方
法であって、骨格蛋白質一次変異体の第一ライブラリーランク順リストの提供を
含む方法、複数の変異位置におけるアミノ酸残基の確率分布作成方法、および複
数のアミノ酸残基を含む複数の骨格蛋白質二次変異体を合成することにより二次
ライブラリーを形成させる方法を提供する。二次変異体の少なくとも一つは一次
変異体とは異なる。
[0009] In another aspect, the invention provides a method of making a secondary library of scaffold protein variants, the method comprising providing a first library rank ordered list of scaffold protein primary variants, a plurality of mutations. A method for creating a probability distribution of amino acid residues at a position and a method for forming a secondary library by synthesizing a plurality of backbone protein secondary mutants containing a plurality of amino acid residues are provided. At least one of the secondary variants differs from the primary variant.

【0010】 別の態様において、本発明は、プログラムの制御下コンピューターにより実行
される方法を提供し、上記コンピューターはプログラム記憶用メモリーを含んで
いる。この方法は、可変残基位置をもつ蛋白質骨格構造を受容し、可変残基位置
の各々に関する一群の潜在的回転異性体を確立し、そして回転異性体の各々と蛋
白質骨格構造の残りの全部または一部との相互作用を分析することにより一連の
最適化蛋白質配列を生成させる段階を含む。さらにこれらの方法は、コア、表面
または境界残基として各可変残基位置を分類することを含む。分析段階は、デッ
ド‐エンド・エリミネーション(DEE)コンピューター操作を含み得る。一般
的に、分析段階は、ファンデルワールスポテンシャルスコアリング機能、水素結
合ポテンシャル機能、原子溶媒和スコアリング機能、二次構造性質スコアリング
機能および静電気スコアリング機能から成る群から選択される少なくとも1つの
スコアリング機能の使用を含む。さらにこれらの方法は、分析前に蛋白質骨格を
改変することを含み、少なくとも1つの超二次構造パラメーター値の改変を含む
。さらにこれらの方法は、広域最適蛋白質配列からの追加的最適配列のランク順
リストを作成することを含む。順番リストからの蛋白質配列の幾つかまたは全部
を試験することにより、ポテンシャルエネルギー試験結果を作成し得る。さらに
これらの方法は、ここで概説された技術を用いて二次ライブラリーを生成および
/または二次ライブラリーをランク分けすることを含み得る。すなわちプログラ
ム実行用コンピューターコードを含む装置も提供される。
In another aspect, the invention provides a method executed by a computer under the control of a program, the computer including a memory for storing the program. This method accepts a protein scaffold with variable residue positions, establishes a group of potential rotamers for each of the variable residue positions, and each of the rotamers and all or the rest of the protein scaffold. Generating a set of optimized protein sequences by analyzing interactions with a portion. Furthermore, these methods include classifying each variable residue position as a core, surface or boundary residue. The analysis step may include dead-end elimination (DEE) computer operation. Generally, the analysis step comprises at least one selected from the group consisting of van der Waals potential scoring function, hydrogen bond potential function, atomic solvation scoring function, secondary structure property scoring function and electrostatic scoring function. Includes the use of scoring features. In addition, these methods involve modifying the protein backbone prior to analysis and include modifying at least one super-secondary structure parameter value. In addition, these methods include creating a rank ordered list of additional optimal sequences from the global optimal protein sequence. Potential energy test results may be generated by testing some or all of the protein sequences from the ordered list. Further, these methods can include generating and / or ranking secondary libraries using the techniques outlined herein. That is, an apparatus including computer code for executing a program is also provided.

【0011】 (図面の簡単な説明) 図1は、完全長遺伝子の合成およびPCRによる可能な全変異導入を描く。完
全長遺伝子(黒い棒線、段階1)に対応する重複オリゴヌクレオチドを合成し、
加熱し、アニーリングする。アニーリングしたオリゴヌクレオチドにPfu D
NAポリメラーゼを付加することにより、DNAの5'−3'合成が行なわれ(段
階2)、さらに長いDNAフラグメントを製造する(段階3)。加熱、アニーリ
ング(段階4)の反復周期により、幾つかの完全長分子を含む、さらに長いDN
Aを製造する。これらは、完全長遺伝子の末端に対応するプライマー(矢印)を
用いて(段階5)第2ラウンドのPCRにより選択し得る。
BRIEF DESCRIPTION OF THE FIGURES FIG. 1 depicts the synthesis of a full-length gene and the introduction of all possible mutations by PCR. Synthesized overlapping oligonucleotides corresponding to the full length gene (black bar, step 1),
Heat and anneal. Pfu D on the annealed oligonucleotide
By adding NA polymerase, 5′-3 ′ synthesis of DNA is performed (step 2) to produce a longer DNA fragment (step 3). Longer DN, including some full length molecules, due to repeated cycles of heating and annealing (step 4)
A is manufactured. These can be selected by a second round of PCR with primers (arrows) corresponding to the ends of the full length gene (step 5).

【0012】 図2は、PDAスクリーニングによる配列空間の大きさの減少を示す。左から
右へ、1:PDA無し、2:PDA無し、システイン、プロリン、グリシン計数
せず、3:PDA実施、1%基準使用、遊離酵素をモデリング、4:PDA実施
、1%基準使用、酵素基質複合体をモデリング、5:PDA実施、5%基準使用
、遊離酵素をモデリング、6:PDA実施、5%基準使用、酵素基質複合体をモ
デリング。
FIG. 2 shows the reduction in the size of the sequence space by PDA screening. From left to right, 1: no PDA, 2: no PDA, cysteine, proline, glycine not counted, 3: PDA performed, 1% reference used, free enzyme modeled, 4: PDA performed, 1% reference used, enzyme Model substrate complex, 5: PDA performed, 5% reference used, free enzyme modeled, 6: PDA performed, 5% reference used, enzyme substrate complex modeled.

【0013】 図3は、ビー・シルクランス(B.circulans)キシラナーゼの活性部位を示す
。PDAデザインに含まれるそれらの位置は、それらの側鎖呈示により示されて
いる。赤色内は野生型残基である(それらの立体配置は変更され得るがそれらの
アミノ酸同一性は変更されなかった)。緑色内は立体配置および同一性を(プロ
リン、システインおよびグリシンを除くアミノ酸に対し)変更させ得た位置であ
る。
FIG. 3 shows the active site of B. circulans xylanase. Their positions included in the PDA design are indicated by their side chain presentation. In red are wild type residues (their configurations could be changed but their amino acid identities were not changed). In green are positions where the configuration and identity could be changed (relative to amino acids except proline, cysteine and glycine).

【0014】 図4は、大腸菌(E.coli)発現性野生型(WT)およびPDAスクリーンβ−
ラクタマーゼのセフォタキシム耐性を示し、結果はセフォタキシムの濃度増加に
関して示されている。
FIG. 4 shows E. coli expressing wild type (WT) and PDA screen β-
The resistance of lactamase to cefotaxime is shown, and the results are shown with increasing concentrations of cefotaxime.

【0015】 (発明の詳細な記載) 本発明は、蛋白質配列ライブラリー(1080以下またはそれ以上の構成員を
含み得る)のコンピューター処理スクリーニングを用いることにより蛋白質配列
の小型二次ライブラリー(1013以下の構成員を含み得る)を選択する方法に
関するものであり、次いでそれらは実際に合成され、機能および特性の改良につ
いて所望の検定法で実験的に試験され得る。
[0015] DETAILED DESCRIPTION OF THE INVENTION The present invention is a small secondary library (10 of protein sequence by using computational screening protein sequence libraries (10 80 can include the following or more members) ( Which may include up to 13 members), which may then be actually synthesized and experimentally tested with the desired assay for improved function and properties.

【0016】 本発明は2つの広範な用途を有する。第一に、本発明は、既知骨格蛋白質に基
いたライブラリーのプレスクリーニングに使用され得る。すなわち、安定性(ま
たは他の特性)に関するコンピューター処理スクリーニングは、所望に応じて下
記の通り、蛋白質全体または残基の幾つかのサブセットにおいて行われ得る。コ
ンピューター処理方法の使用により閾値またはカットオフを生成させて不利な配
列を削除することにより、一連の所定変異体サイズにおいて有用な変異体のパー
センテージは増加し得、そして必要とされる実験的支出は減少する。
The present invention has two broad applications. First, the present invention can be used for prescreening libraries based on known scaffold proteins. That is, computational screens for stability (or other properties) can be performed on the entire protein or on some subset of residues, as described below, as desired. By using computerized methods to generate thresholds or cutoffs and deleting unfavorable sequences, the percentage of useful mutants in a given set of mutant sizes can be increased, and the experimental expenditure required is Decrease.

【0017】 さらに、本発明は、ランダムペプチドライブラリーのスクリーニングに有用で
ある。知られている通り、細胞におけるシグナル伝達経路は、細胞生理機能にお
ける表現型描写可能な変化をまねくエフェクター刺激因子から始まることが多い
。細胞内シグナル伝達経路が疾患発病で演じる重要な役割にもかかわらず、多く
の場合、初期刺激因子および最終細胞応答以外、シグナル伝達経路についてはほ
とんど理解されていない。
Furthermore, the present invention is useful for screening random peptide libraries. As is known, signal transduction pathways in cells often begin with effector stimulators that lead to phenotypic changes in cell physiology. Despite the important role that intracellular signaling pathways play in disease pathogenesis, little is known about signaling pathways other than early stimulators and final cellular responses.

【0018】 歴史的に、シグナル変換は、生化学または遺伝学により分析されてきた。生化
学的方法は、「到達手段」方法で経路を解剖する。すなわち、経路の一端で作用
するかまたはそこに含まれる分子を発見し、検定可能な量を分離し、次いで分離
されたものの上流または下流にある、経路における次の分子の測定を試みる。遺
伝学的方法は、古典的に「憶測」に基いている。すなわち、シグナル伝達経路に
おいて変異体を誘発または誘導し、遺伝的交雑により遺伝子座の地図を作成する
かまたはcDNAライブラリーにより変異を補完する。生化学的方法の限界には
、試験下の構成成分に関するかなりの量の先在情報に頼る点および上記試験を事
後にインビトロで実施することを必要とする点が含まれる。純粋な遺伝学的方法
の限界には、遺伝子の同定およびクローニングを続行する前に、まず経路を誘導
し、次いで特性確認することを必要とする点が含まれる。
Historically, signal transduction has been analyzed by biochemistry or genetics. Biochemical methods dissect pathways in a “reach-by” fashion. That is, one finds molecules that act at or are contained in one end of the pathway, separates the assayable amount, and then attempts to measure the next molecule in the pathway, either upstream or downstream of the separation. Genetic methods are classically based on "speculation." That is, mutations are induced or induced in the signal transduction pathway and genetic loci map the loci or complement the mutations with a cDNA library. Limitations of biochemical methods include the reliance on a significant amount of pre-existing information about the components under test and the need to perform the test in vitro afterwards. Limitations of pure genetic methods include the need to first induce and then characterize the pathway before continuing gene identification and cloning.

【0019】 化学的化合物の分子ライブラリーをシグナル系を調節する薬物についてスクリ
ーニングすることにより、大きな臨床的意味をもつ重要な発見が導かれた。例え
ば、シクロスポリンA(CsA)およびFK506は、T細胞活性化の阻害に関
する標準医薬用スクリーンで選択された。これら2種の薬物が完全に異なる細胞
蛋白質‐‐それぞれシクロフィリンおよびFK506結合蛋白質(FKBP)と
結合し、いずれの薬物の効果も、転写因子、例えばNF−ATおよびNF−κB
に依存的なmRNA生産の阻害の場合と事実上同じ‐‐T細胞において表現型に
より観察され得る、T細胞活性化の強く特異的な抑制であることは注目に値する
。小ペプチドのライブラリーはまた、生物活性に関する検定においてインビトロ
でスクリーニングされ、好結果をあげている。文献は、広く多様なシグナル伝達
経路を変調し得る小ペプチドの実例を豊富に挙げている。例えば、HIV−1エ
ンベロープ蛋白質に由来するペプチドは、細胞カルモジュリンの作用を遮断する
ことが示された。
Screening a molecular library of chemical compounds for drugs that modulate the signal system has led to important discoveries of great clinical significance. For example, cyclosporin A (CsA) and FK506 were selected in a standard pharmaceutical screen for inhibition of T cell activation. These two drugs bind completely different cellular proteins--cyclophilin and FK506 binding protein (FKBP), respectively, and the effect of either drug is on transcription factors such as NF-AT and NF-κB.
It is worth noting that it is the strong and specific repression of T cell activation that can be observed phenotypically in T cells in virtually the same way as the inhibition of mRNA production in a dependent manner. Libraries of small peptides have also been screened in vitro in assays for biological activity and have been successful. The literature is replete with examples of small peptides that can modulate a wide variety of signaling pathways. For example, peptides derived from the HIV-1 envelope protein have been shown to block the action of cellular calmodulin.

【0020】 従って、蛋白質およびペプチドのランダムまたは半ランダム配列ライブラリー
の生成により、有用な特性をもつ蛋白質(ペプチド、オリゴペプチドおよびポリ
ペプチドを含む)が選択され得る。これらの実験的ライブラリーにおける配列は
、特異部位のみまたは配列全体を通してランダム化され得る。これらのライブラ
リーで検索され得る配列の数は、ランダム化されている位置の数との指数関数的
に増大する。一般的に、研究室は物理的制約(器具の大きさ、多数の生体高分子
の製造費用など)があるため、1012−1015以下の配列のみがライブラリ
ーに含まれ得るに過ぎない。他の実際的な問題を考慮した結果、ライブラリーの
大きさが10またはそれより少なく制限され得ることも多い。これらの限界に
到達しているのは、10アミノ酸位置の場合のみである。従って、実験的配列ラ
イブラリーにおける改良された蛋白質またはペプチドに関する検索で可能なのは
配列のサンプリングが散在している場合のみであることから、成功の機会が減り
、望ましい候補がほぼ確実に見落とされる。これらの配列における変化はランダ
ムであるため、ライブラリーにおける候補の大部分は適しておらず、ライブラリ
ー作成における努力の大部分は無駄になっている。
Thus, by generating random or semi-random sequence libraries of proteins and peptides, proteins with useful properties, including peptides, oligopeptides and polypeptides, can be selected. The sequences in these experimental libraries can be randomized only at specific sites or throughout the sequences. The number of sequences that can be searched in these libraries grows exponentially with the number of positions that are randomized. In general, due to physical constraints in the laboratory (device size, cost of manufacturing many biopolymers, etc.), only 10 12 -10 15 or less sequences can be included in the library. Often, due to other practical considerations, the size of libraries can be limited to 10 6 or less. It is only at the 10 amino acid position that these limits are reached. Thus, a search for improved proteins or peptides in an experimental sequence library is only possible if the sampling of sequences is interspersed, reducing the chances of success and almost certainly overlooking the desired candidate. Because the changes in these sequences are random, most of the candidates in the library are unsuitable and most of the efforts in library construction are wasted.

【0021】 しかしながら、下記で概説されている自動蛋白質設計技術を用いると、実験的
ライブラリーよりかなり大きい蛋白質配列のバーチャルライブラリーが生成され
得る。1080以下の候補配列がコンピューター的にスクリーニングされ得、安
定した機能的蛋白質に有利な設計基準を満たすものが容易に選択され得る。次い
で、バーチャルライブラリースクリーニングから見出される好適な候補から成る
実験的ライブラリーが作成され得ることにより、実験的ライブラリーがさらに有
効利用され、ランダム蛋白質ライブラリーの限界が克服され得る。
However, using the automated protein design techniques outlined below, virtual libraries of protein sequences that are significantly larger than experimental libraries can be generated. 10 80 The following candidate sequences are computationally screened obtained, those satisfying the advantageous design criteria for stable functional protein may be readily selected. The experimental library can then be made more efficient and the limitations of the random protein library can be overcome by creating an experimental library consisting of suitable candidates found from the virtual library screen.

【0022】 バーチャルライブラリースクリーニングから2つの主要な利益が得られる。(
1)自動蛋白質設計により、設計基準を満たすのに有利な配列候補リストが作成
される。それはまた、配列におけるどの位置が容易に変更されるか、およびどの
位置が変更される際に蛋白質安定性および機能性の破壊を伴うと思われるかを示
している。容易に改変され得る非破壊的配列位置がランダム化されているに過ぎ
ない実験的ランダムライブラリーが作成され得る。(2)これらの位置における
アミノ酸の多様性は、これらの位置と適合し得ることを自動設計が示すものに制
限され得る。すなわち、ランダム化された位置の数およびこれらの位置における
可能性の数を制限することにより、実験的ライブラリーで生産される無駄な配列
の数が減らされ、有用な特性をもつ配列の発見に関する成功の確率が高くなる。
There are two main benefits from virtual library screening. (
1) Automatic protein design creates a sequence candidate list that is advantageous for satisfying the design criteria. It also shows which positions in the sequence are easily changed and which positions are likely to be associated with disruption of protein stability and functionality. Experimental random libraries can be created in which only non-disruptive sequence positions that can be easily modified are randomized. (2) The amino acid diversity at these positions can be limited to what automatic design indicates is compatible with these positions. That is, limiting the number of randomized positions and the number of possibilities at these positions reduces the number of wasted sequences produced in an experimental library and relates to the discovery of sequences with useful properties. The chance of success increases.

【0023】 さらに、変異体の非常に大きなライブラリーをコンピューター処理でスクリー
ニングすることにより、スクリーニングされ得る蛋白質配列の多様性が広がり、
蛋白質機能に大きな改良がもたらされる。さらに、所定のライブラリーサイズを
スクリーニングするため実験的に試験する必要がある変異体は少なくてすむため
、蛋白質の遺伝子操作に伴う出費および難しさは低減化される。コンピューター
的方法を用いて蛋白質ライブラリーをプレスクリーニングすることにより、速度
および効率というコンピューター的特徴を実験的ライブラリースクリーニングの
能力と合わせると、適当なコンピューターモデルおよび構造‐機能関係が不明瞭
である蛋白質において新規活性が生み出される。
Furthermore, by screening a very large library of variants by computer processing, the diversity of protein sequences that can be screened is increased,
Significant improvements in protein function are provided. Furthermore, the expense and difficulty associated with genetic engineering of proteins is reduced because fewer variants need to be tested experimentally to screen for a given library size. By prescreening protein libraries using computational methods, combining the computational features of speed and efficiency with the capabilities of experimental library screening, suitable computer models and proteins with unclear structure-function relationships A new activity is created in.

【0024】 同様に、コンピューター使用による非常に大きな変異体ライブラリーから誘導
された二次ライブラリーを作成する新規方法により、多数のコンピューター設計
された配列の迅速な試験が行われ得る。
Similarly, the novel method of making secondary libraries derived from computationally very large mutant libraries allows rapid testing of large numbers of computer designed sequences.

【0025】 さらに、下記で十分に概説されている通り、ライブラリーはかなり多数の方向
で偏在し得るため、焦点が異なる二次ライブラリーが作成され得る。例えば、ド
メイン、残基のサブセット、活性または結合部位、表面残基などは全て、所望に
応じて改変されるかまたは一定に保たれ得る。
Moreover, as is fully outlined below, the libraries can be ubiquitous in any number of orientations so that secondary libraries with different focus can be created. For example, domains, subsets of residues, active or binding sites, surface residues, etc. may all be modified or held constant as desired.

【0026】 従って、本発明は、骨格蛋白質変異体の二次ライブラリー生成方法を提供する
。ここで「蛋白質」とは、ペプチド結合により一緒に結合された少なくとも2個
のアミノ酸を包含する。ここで使用されている通り、蛋白質は、蛋白質、オリゴ
ペプチドおよびペプチドを包含する。ペプチジル基は、天然アミノ酸およびペプ
チド結合、または合成擬ペプチド(peptidomimetic)構造、すなわち、「類似体
」、例えばペプトイド(Simonら、PNAS USA 89(20):9367(1992
)参照)を含み得る。アミノ酸は、天然に存するものまたは非天然的なもののい
ずれかであり得る。当業界で認識されている通り、一連の回転異性体が既知であ
るかまたは生成され得る構造であれば、アミノ酸として使用し得る。側鎖は(R
)または(S)立体配置であり得る。好ましい態様において、アミノ酸は(S)
またはL−立体配置である。
Accordingly, the present invention provides a method for generating a secondary library of skeletal protein variants. The term "protein" as used herein includes at least two amino acids linked together by peptide bonds. As used herein, protein includes proteins, oligopeptides and peptides. Peptidyl groups are natural amino acid and peptide bonds, or synthetic peptidomimetic structures, ie, “analogs” such as peptoids (Simon et al., PNAS USA 89 (20): 9367 (1992).
) Reference). Amino acids can be either naturally occurring or non-naturally occurring. As is recognized in the art, any structure of which a series of rotamers is known or can be produced can be used as the amino acid. The side chain is (R
) Or (S) configuration. In a preferred embodiment, the amino acid is (S)
Or L-configuration.

【0027】 骨格蛋白質は、三次元構造が既知であるかまたは生成され得る、すなわち蛋白
質の各原子について三次元座標が存在する蛋白質であれば全て包含し得る。一般
的に、これは、X線結晶技術、NMR技術、新規モデリング、相同性モデリング
などを用いて測定され得る。一般に、X線構造を使用する場合、2オングストロ
ーム解像能またはそれより高解像能での構造が好ましいが、必ずしも必要なわけ
ではない。
The scaffold protein can include any protein whose three-dimensional structure is known or can be generated, ie for which there are three-dimensional coordinates for each atom of the protein. Generally, this can be measured using X-ray crystallographic techniques, NMR techniques, novel modeling, homology modeling and the like. Generally, when using an X-ray structure, a structure with a resolution of 2 Å or higher is preferable, but not always required.

【0028】 骨格蛋白質は、細菌、真菌、好極限性細菌、例えば細菌、昆虫、魚類、動物(
特に哺乳類および特にヒト)および鳥類由来の酵素が全て可能であると共に、原
核生物および真核生物を含むあらゆる生物体に由来し得る。
The skeletal proteins include bacteria, fungi, extremophiles such as bacteria, insects, fish, animals (
Enzymes, especially from mammals and especially humans) and birds are all possible and can be derived from any organism, including prokaryotes and eukaryotes.

【0029】 すなわち、本明細書では「骨格蛋白質」は、それについての変異体の二次ライ
ブラリーが望まれる蛋白質を意味する。当業界では理解されるであろうが、全て
の骨格蛋白質が本発明では有用である。具体的には、既知蛋白質のフラグメント
およびドメイン、例えば機能的ドメイン、例えば酵素的ドメイン、結合性ドメイ
ンなど、および小型フラグメント、例えばターン、ループなども「蛋白質」の定
義内に含まれる。すなわち、蛋白質の一部も同様に使用され得る。さらに、本明
細書で使用するとき「蛋白質」は、蛋白質、オリゴペプチドおよびペプチドを包
含する。さらに、蛋白質変異体、すなわち非天然蛋白質類似体構造も使用され得
る。
Thus, as used herein, “skeletal protein” means a protein for which a secondary library of variants is desired. As will be appreciated in the art, all scaffold proteins are useful in the present invention. Specifically included within the definition of "protein" are fragments and domains of known proteins, such as functional domains, such as enzymatic domains, binding domains, and small fragments, such as turns and loops. That is, a portion of the protein may be used as well. Furthermore, "protein" as used herein includes proteins, oligopeptides and peptides. In addition, protein variants, ie non-natural protein analog structures, may also be used.

【0030】 適した蛋白質には、産業用および医薬用蛋白質、例えばリガンド、細胞表面受
容体、抗原、抗体、サイトカイン、ホルモン、転写因子、シグナルモジュール、
細胞骨格蛋白質および酵素が含まれるが、これらに限定はされない。適した種類
の酵素には、加水分解酵素、例えばプロテアーゼ、カルボヒドラーゼ、リパーゼ
、イソメラーゼ、例えばラセマーゼ、エピメラーゼ、タウトメラーゼ、またはム
ターゼ、トランスフェラーゼ、キナーゼ、オキシドレダクターゼおよびホスファ
ターゼがあるが、これらに限定はされない。適した酵素はスイス‐プロット酵素
データベースに列挙されている。適した蛋白質骨格には、リサーチ・コラボレイ
トリー・フォー・ストラクチャル・バイオインフォマティックス(RCSB、前
のブルックヘヴン・ナショナル・ラブ)により編集および提供された蛋白質デー
タベースに見出されるもの全てが含まれるが、これらに限定はされない。
Suitable proteins include industrial and pharmaceutical proteins such as ligands, cell surface receptors, antigens, antibodies, cytokines, hormones, transcription factors, signal modules,
Includes, but is not limited to, cytoskeletal proteins and enzymes. Suitable classes of enzymes include, but are not limited to, hydrolases such as proteases, carbohydrases, lipases, isomerases such as racemases, epimerases, tautomers, or mutases, transferases, kinases, oxidoreductases and phosphatases. Suitable enzymes are listed in the Swiss-Prot Enzyme Database. Suitable protein scaffolds include all those found in protein databases compiled and provided by Research Collaboration for Structural Bioinformatics (RCSB, formerly Brookhaven National Love). However, it is not limited thereto.

【0031】 具体的には、好ましい骨格蛋白質には、既知構造を有するもの(変異体を含む
)、例えばサイトカイン類(IL−1ra(+受容体複合体)、IL−1(受容
体単独)、IL−1a、IL−1b(変異体および/または受容体複合体を含む
)、IL−2、IL−3、IL−4、IL−5、IL−6、IL−8、IL−1
0、IFN−β、INF−γ、IFN−α−2a、IFN−α−2B、TNF−
α;CD40リガンド(chk)、ヒト肥満蛋白質レプチン、顆粒球コロニー刺
激因子、骨形態発生タンパク−7、毛様体神経栄養因子、顆粒球マクロファージ
コロニー刺激因子、単球化学誘導タンパク1、マクロファージ遊走阻止因子、ヒ
トグリコシル化阻害因子、ヒトランテス、ヒトマクロファージ炎症タンパク1ベ
ータ、ヒト成長ホルモン、白血病阻止因子、ヒト黒色腫増殖刺激活性、好中球活
性化ペプチド−2、Cc−ケモカインMcp−3、血小板因子M2、好中球活性
化ペプチド2、エオタキシン(Eotaxin)、間質細胞由来因子−1、インシュリ
ン、インシュリン様増殖因子I、インシュリン様成長因子II、トランスフォーミ
ング増殖因子B1、トランスフォーミング増殖因子B2、トランスフォーミング
増殖因子B3、トランスフォーミング増殖因子A、血管内皮細胞増殖因子(VE
GF)、酸性線維芽細胞成長因子、塩基性線維芽細胞成長因子、内皮細胞成長因
子、神経発育因子、脳由来神経栄養因子、毛様体神経栄養因子、血小板由来増殖
因子、ヒト肝細胞増殖因子、神経膠細胞由来神経栄養因子(およびPDB1/1
2/99における55のサイトカイン類))、エリトロポイエチン、他の細胞外
シグナル伝達部分、例えば限定的ではないが、ヘッジホッグ(hedgehog)・ソニ
ック、ヘッジホッグ・デザート、ヘッジホッグ・インディアン、hCG;凝固因
子、例えば限定的ではないが、TPAおよび因子VIIa;転写因子、例えば限定
的ではないが、p53、p53四量体化ドメイン、Znフィンガー(そのうち1
2を越えるものが構造を有する)、ホメオドメイン(そのうち8つが構造を有す
る)、ロイシンジッパー(そのうち4つが構造を有する);抗体、例えば限定的
ではないが、cFv;ウイルス蛋白質、例えば限定的ではないが、血球凝集素四
量体化ドメインおよびhiv Gp41エクトドメイン(融合ドメイン)、細胞
内シグナルモジュール、例えば限定的ではないが、SH2ドメイン(そのうち8
構造は既知である)、SH3ドメイン(そのうち11は構造を有する)、および
プレクスチン相同性ドメイン;受容体、例えば限定的ではないが、Gp130の
ヒト組織因子サイトカイン結合性領域の細胞外領域、G−CSF受容体、エリト
ロポイエチン受容体、線維芽細胞増殖因子受容体、TNF受容体、IL−1受容
体、IL−1受容体/ILra複合体、IL−4受容体、INF−γ受容体アル
ファ鎖、MHC I類、MHC II類、T細胞受容体、インシュリン受容体、イン
シュリン受容体チロシンキナーゼおよびヒト成長ホルモン受容体があるがこれら
に限定はされない。
Specifically, preferred scaffold proteins include those having a known structure (including mutants), for example, cytokines (IL-1ra (+ receptor complex), IL-1 (receptor alone), IL-1a, IL-1b (including mutant and / or receptor complex), IL-2, IL-3, IL-4, IL-5, IL-6, IL-8, IL-1
0, IFN-β, INF-γ, IFN-α-2a, IFN-α-2B, TNF-
α; CD40 ligand (chk), human obesity protein leptin, granulocyte colony stimulating factor, bone morphogenetic protein-7, ciliary neurotrophic factor, granulocyte macrophage colony stimulating factor, monocyte chemoinduction protein 1, macrophage migration inhibition Factor, human glycosylation inhibitor, human rantes, human macrophage inflammatory protein 1 beta, human growth hormone, leukemia inhibitory factor, human melanoma growth stimulating activity, neutrophil activating peptide-2, Cc-chemokine Mcp-3, platelet factor M2, neutrophil activating peptide 2, eotaxin, stromal cell-derived factor-1, insulin, insulin-like growth factor I, insulin-like growth factor II, transforming growth factor B1, transforming growth factor B2, trans Forming growth factor B3, trans Omingu growth factor A, vascular endothelial cell growth factor (VE
GF), acidic fibroblast growth factor, basic fibroblast growth factor, endothelial cell growth factor, nerve growth factor, brain-derived neurotrophic factor, ciliary neurotrophic factor, platelet-derived growth factor, human hepatocyte growth factor , Glial-derived neurotrophic factor (and PDB1 / 1
55 cytokines in 2/99)), erythropoietin, other extracellular signaling moieties such as, but not limited to, hedgehog sonic, hedgehog desert, hedgehog indian, hCG. Coagulation factors such as, but not limited to, TPA and Factor VIIa; transcription factors such as, but not limited to, p53, p53 tetramerization domain, Zn fingers (1 of which
More than two have structure), homeodomains (of which eight have structure), leucine zippers (of which four have structure); antibodies, such as but not limited to cFv; viral proteins such as, but not limited to But not to hemagglutinin tetramerization domain and hiv Gp41 ectodomain (fusion domain), intracellular signal modules such as, but not limited to, SH2 domain (8 of which are
Structures are known), SH3 domains (11 of which have structure), and plexin homology domains; receptors such as, but not limited to, the extracellular region of the human tissue factor cytokine binding region of Gp130, G-. CSF receptor, erythropoietin receptor, fibroblast growth factor receptor, TNF receptor, IL-1 receptor, IL-1 receptor / ILra complex, IL-4 receptor, INF-γ receptor Alpha chains, MHC I, MHC II, T cell receptors, insulin receptors, insulin receptor tyrosine kinases and human growth hormone receptors include, but are not limited to.

【0032】 一旦骨格蛋白質が選択されると、一次ライブラリーはコンピューター処理を用
いて作成する。概して、コンピューター処理の目標は、一連の最適化蛋白質配列
を測定することである。ここで「最適化蛋白質配列」とは、コンピューター処理
の数学等式に最も適合する配列を意味する。当業界で認識されているところによ
ると、大域最適化配列は、等式に最も適合する一配列(例えば、PDAを使用時
、大域最適化配列は下記等式1に最も適合する配列である)、すなわちどの可能
な配列にせよ、その最低エネルギーを有する配列である。しかしながら、大域最
低値ではないが低いエネルギーを有する配列がかなり多数存在する。
Once the scaffold protein is selected, the primary library is created using computer processing. In general, the goal of computer processing is to measure a set of optimized protein sequences. By "optimized protein sequence" herein is meant the sequence that best fits the computational mathematical equation. It is recognized in the art that the globally optimized sequence is the one that best fits the equation (eg, when using PDA, the globally optimized sequence is the one that best fits Equation 1 below). , That is, the array with the lowest energy of any possible array. However, there are quite a few sequences that have low, but not global, minimum energies.

【0033】 すなわち、本明細書で使用するとき、「一次ライブラリー」は、一般的にはラ
ンク順リスト形態における、最適化配列の集合体である。理論上、蛋白質の可能
な配列は全て評価され得る。しかしながら、現時点では1013配列が実際的限
界である。すなわち、一般に、可能な配列全ての何らかのサブセットが一次ライ
ブラリーとして使用されている。一般的に、上位10〜1013配列が一次ラ
イブラリーとして選択される。一次ライブラリーのランク順リストに包括される
ためのカットオフは、多様な方法で行われ得る。例えば、カットオフは任意の排
除点というだけであり得る。上位10配列は一次ライブラリーを含み得る。別
法として、大域最適値のある種の限界内に評点される配列は全て使用され得る。
例えば、10kcal/モルの大域最適値を有する配列は全て一次ライブラリーとし
て使用され得る。この方法は、三次元構造に対する忠実度の直接尺度を用いて包
含関係を測定するという利点を有する。この方法を用いることにより、ライブラ
リー変異が異なる変異間における最低エネルギーギャップを有する位置に限定さ
れないことが確実にされ得る。別法として、一つの位置につき予め定められた変
異数に達すると、カットオフが強化され得る。ランク順に列挙された配列リスト
が延長され、ライブラリーが拡大されると、一つの位置につきさらに多くの変異
が特定される。別法として、全変異の組換えにより特定される配列総数が、一次
配列ライブラリーに関するカットオフ基準として使用され得る。配列総数につい
て好ましい値は100〜1020の範囲、特に好ましい値は1000〜1013 の範囲、特に好ましい値は1000〜10の範囲である。別法として、予め特
定された望ましくない残基のリストにおいて最初に現れたものが、カットオフ基
準として使用され得る。例えば、コア位置に存する最初の親水性残基がリストを
制限する。また、これらの方法が一次ライブラリーの大きさの制限と連係的に記
載されており、これら同技術を用いることにより同様に二次ライブラリーに包括
されるためのカットオフが公式化され得ることに注目すべきである。
That is, as used herein, a “primary library” is a collection of optimized sequences, generally in rank ordered list form. In theory, all possible sequences of proteins can be evaluated. However, at this time 10 13 sequences is a practical limit. That is, generally some subset of all possible sequences is used as the primary library. In general, the top 10 3 to 10 13 sequences are selected as the primary library. The cutoff for inclusion in the ranked list of the primary library can be done in a variety of ways. For example, the cutoff may simply be any exclusion point. The top 10 5 sequences may comprise the primary library. Alternatively, all sequences scoring within certain bounds of the global optimum can be used.
For example, all sequences with a global optimum of 10 kcal / mol can be used as a primary library. This method has the advantage of measuring inclusion relationships using a direct measure of fidelity to the three-dimensional structure. Using this method, it can be ensured that library mutations are not limited to the positions with the lowest energy gaps between different mutations. Alternatively, the cutoff may be enhanced when a predetermined number of mutations per position is reached. When the list of sequences listed in rank order is extended and the library is expanded, more mutations are identified per position. Alternatively, the total number of sequences identified by recombination of all mutations can be used as a cutoff criterion for the primary sequence library. A preferred value for the total number of sequences is in the range of 100 to 10 20 , a particularly preferred value is in the range of 1000 to 10 13 , and a particularly preferred value is in the range of 1000 to 10 7 . Alternatively, the first occurrence in the list of pre-specified unwanted residues can be used as a cutoff criterion. For example, the first hydrophilic residue at the core position limits the list. Also, these methods have been described in conjunction with the size limitations of primary libraries, and using these same techniques, a cutoff for inclusion in secondary libraries can be formulated as well. It should be noted.

【0034】 すなわち、本発明は、下記で詳述されている通り、一般には理論的定量安定性
に関して、配列のランク順リストを含む一次ライブラリーの作成方法を提供する
。立体配置の安定性を最適化するために一次ライブラリーを作成する方法を用い
ると、酵素の活性部位立体配置が安定化され得、その活性も改良される。同様に
、リガンド‐受容体複合体または酵素‐基質複合体を安定化すると、結合親和力
も改善される。
Thus, the present invention provides a method for making a primary library containing a rank ordered list of sequences, generally in terms of theoretical quantitative stability, as detailed below. Using the methods of creating primary libraries to optimize conformational stability can stabilize the active site conformation of the enzyme and also improve its activity. Similarly, stabilizing the ligand-receptor complex or the enzyme-substrate complex also improves binding affinity.

【0035】 一次ライブラリーは様々な方法で作成され得る。本質的に、測定可能な安定性
パラメーターに基いた蛋白質の可能な配列の相対的ランキングが得られるもので
あればいずれの方法でも使用され得る。当業界で認識されているところによると
、ここに記載されているか当業界で公知の方法のいずれでも単独または他の方法
と組み合わせて使用され得る。
The primary library can be created in various ways. Essentially any method can be used that results in a relative ranking of the possible sequences of the protein based on measurable stability parameters. It will be recognized in the art that any of the methods described herein or known in the art may be used alone or in combination with other methods.

【0036】 好ましい態様において、骨格蛋白質は酵素であり、非常に正確な静電気モデル
を酵素活性部位残基評価に使用することにより、酵素活性部位ライブラリーが改
善され得る(Warshel、computer Modeling of Chemical Reactions in Enzymes
and Solutions、ウィリー・アンド・サンズ、ニューヨーク(1991)参照、
出典明示により本明細書の一部とする)。これらの精巧なモデルは、高い精度で
配列の相対エネルギーを評価し得るが、コンピューター操作に集中している。
In a preferred embodiment, the scaffold protein is an enzyme and a highly accurate electrostatic model can be used to evaluate enzyme active site residues to improve enzyme active site libraries (Warshel, computer Modeling of Chemical Reactions. in Enzymes
and Solutions, Willie and Sons, New York (1991),
It is made a part of this specification by clearly showing the source). These elaborate models can evaluate relative energies of sequences with high accuracy, but focus on computer manipulation.

【0037】 同様に、分子力学計算を用いて、変異体配列評点を個々に計算し、ランク順リ
ストを編集することにより配列がコンピューター操作でスクリーニングされ得る
Similarly, sequences can be computationally screened by individually calculating variant sequence scores using molecular mechanics calculations and compiling a ranked list.

【0038】 好ましい態様では、残基対ポテンシャルを用いることにより、コンピューター
操作でのスクリーニング中に配列が評価され得る(Miyazawaら、Macromolecules
18(3):534−552(1985)、出典明示により本明細書の一部と
する)。
In a preferred embodiment, the use of residue pair potentials allows the sequence to be evaluated during computational screening (Miyazawa et al. Macromolecules.
18 (3): 534-552 (1985), which is incorporated herein by reference.

【0039】 好ましい態様において、配列プロフィール評価(Bowieら、Science 253(
5016):164−70(1991)出典明示により本明細書の一部とする)
および/または平均力のポテンシャル(Hendlichら、J.Mol.Biol. 216(1)
:167−180(1990)これも出典明示により本明細書の一部とする)を
計算することにより、配列が評価し得る。これらの方法は、配列および3D蛋白
質構造間の対合を評価するため、蛋白質構造に対する忠実度についてスクリーニ
ングすべく機能し得る。異なるスコアリング機能を用いて配列を評価することに
より、配列空間の異なる領域がコンピュータースクリーンでサンプリングし得る
In a preferred embodiment, sequence profile evaluation (Bowie et al., Science 253 (
5016): 164-70 (1991) incorporated herein by reference.
And / or the potential of mean force (Hendlich et al., J. Mol. Biol. 216 (1)
167-180 (1990), also incorporated herein by reference), to evaluate the sequence. These methods can function to screen for fidelity to protein structure in order to assess pairing between sequences and 3D protein structures. By evaluating sequences using different scoring functions, different regions of sequence space can be sampled on a computer screen.

【0040】 さらに、スコアリング機能を用いることにより、蛋白質における金属または補
因子結合部位を作成する配列についてスクリーニングが行い得る(Hellingaら、
Fold Des.3(1):R1−8(1998)、出典明示により本明細書の一部と
する)。同様に、スコアリング機能を用いることにより、蛋白質においてジスル
フィド結合を生成する配列についてスクリーニングが行い得る。これらの潜在性
を試すことにより、新規構造モチーフを導入すべく蛋白質構造が特異的に修飾さ
れる。
In addition, the scoring function can be used to screen for sequences that create metal or cofactor binding sites in proteins (Hellinga et al.,
Fold Des. 3 (1): R1-8 (1998), incorporated herein by reference. Similarly, the scoring function can be used to screen for sequences that produce disulfide bonds in proteins. By testing these potentials, the protein structure is specifically modified to introduce new structural motifs.

【0041】 さらに、配列および/または構造アラインメント(整列)プログラムを用いる
ことにより、一次ライブラリーが作成され得る。例えば、構造的関連蛋白質の構
造アラインメントを行うことにより、配列アラインメントが作成され得る(Oren
goら、Structure 5(8):1093−108(1997)、Holmら、Nucleic
Acid Res.26(1):316−9(1998)、両方とも出典明示により本明
細書の一部とする)。次いで、これらの配列アラインメントを調べることにより
、観察した配列変異を測定し得る。
Further, by using sequence and / or structure alignment programs, primary libraries can be created. For example, a sequence alignment can be created by performing a structural alignment of structurally related proteins (Oren
go et al., Structure 5 (8): 1093-108 (1997), Holm et al., Nucleic.
Acid Res. 26 (1): 316-9 (1998), both incorporated herein by reference. The observed sequence mutations can then be measured by examining these sequence alignments.

【0042】 同様に、配列相同性に基くアラインメント方法を用いることにより、標的構造
に関連した蛋白質の配列アラインメントを作成し得る(Altschulら、J.Mol.Biol
.215(3):403(1990)、出典明示により本明細書の一部とする)
。次いで、これらの配列アラインメントを調べることにより、観察した配列変異
を測定する。これらの配列変異を製表することにより、一次ライブラリーを特定
する。
Similarly, sequence homology-based alignment methods can be used to generate sequence alignments of proteins related to the target structure (Altschul et al., J. Mol. Biol.
.215 (3): 403 (1990), which is made a part of this specification by citation.)
. The observed sequence mutations are then measured by examining these sequence alignments. The primary library is identified by representing these sequence variations.

【0043】 これらの配列変異は製表し、下記の通りそれらから二次ライブラリーを特定し
得る。別法として、許容された配列変異を用いることにより、コンピューター処
理スクリーニング中に各位置で考えられるアミノ酸を特定し得る。別の変異は、
配列アラインメントに存するアミノ酸に関するスコアを偏向させることであり、
それによってそれらがコンピュータースクリーニング中に見出される可能性は高
まるが、依然として他のアミノ酸も考慮され得る。この偏向の結果、焦点に集め
られた一次ライブラリーが得られるが、アラインメントにおいて見出されないア
ミノ酸が度外視されることはない。
These sequence variations are represented and secondary libraries can be identified from them as follows. Alternatively, allowed sequence mutations may be used to identify possible amino acids at each position during computational screening. Another mutation is
Biasing the scores for amino acids present in a sequence alignment,
Although it increases the likelihood that they will be found during computer screening, other amino acids may still be considered. This bias results in a focused primary library, but does not overlook amino acids that are not found in the alignment.

【0044】 同様に、上で概説した通り、他のコンピューター処理方法も知られており、例
えば配列プロファイリング(BowieおよびEisenberg、Science253(5016
):164−70(1991))、回転異性体ライブラリー選択法(Dahiyatお
よび Mayo、Protein Sci5(5):895−903(1996)、Dahiyatおよ
びMayo、Science278(5335):82−7(1997);Desjarlaisおよ
びHandel、Protein Science 4:2006−2018(1995)、Harburyら
、PNAS USA92(18):8408−8412(1995);Konoら、Proteins
:Structure,Function and Genetics 19:244−255(1994);Hell
ingaおよびRichards、PNAS USA 91:5803−5807(1994))およ
び残基対ポテンシャル(Jones、Protein Science 3:567−574(199
4))があるが、これらに限定されるわけではないものとし、これらは全て出典
明示により本明細書の一部とする。
Similarly, as outlined above, other computational methods are known, eg sequence profiling (Bowie and Eisenberg, Science 253 (5016).
): 164-70 (1991)), rotamer library selection method (Dahiyat and Mayo, Protein Sci5 (5): 895-903 (1996), Dahiyat and Mayo, Science 278 (5335): 82-7 (1997). Desjarlais and Handel, Protein Science 4: 2006-2018 (1995), Harbury et al., PNAS USA92 (18): 8408-841 (1995); Kono et al., Proteins.
: Structure, Function and Genetics 19: 244-255 (1994); Hell
inga and Richards, PNAS USA 91: 5803-5807 (1994)) and residue pair potential (Jones, Protein Science 3: 567-574 (199).
4)), but not limited thereto, all of which are incorporated herein by reference.

【0045】 好ましい態様において、一次ライブラリー作成に使用するコンピューター処理
方法は、U.S.S.N.60/061097、60/043464、60/054
678、09/127926およびPCT US98/07254(これらは全
て出典明示により本明細書の一部とする)に記載されている、蛋白質設計オート
メーション(PDA)である。簡単に述べると、PDAは次の要領で説明し得る
。既知蛋白質構造を出発点として使用する。次いで、最適化される残基を同定す
るが、それらは全配列またはそのサブセット(複数も可)であり得る。次いで、
可変位置の側鎖を除去する。生成した蛋白質骨格および残りの側鎖から成る構造
は鋳型と呼ばれる。次いで、各可変残基位置を、好ましくはコア残基、表面残基
または境界残基として分類する。各分類により、位置に関して可能性のあるアミ
ノ酸残基のサブセットが特定される(例えば、コア残基は一般に一連の疎水性残
基から選択され、表面残基は一般に親水性残基から選択され、そして境界残基は
どちらでもあり得る)。各アミノ酸は、回転異性体と呼ばれる、各側鎖の許容さ
れた全配座異性体の独立した一群により代表され得る。すなわち、骨格に最適な
配列に到達するため、回転異性体の可能性のある配列を全てスクリーニングしな
ければならず、その場合各骨格位置は、全てその可能な回転異性体状態である各
アミノ酸、またはアミノ酸のサブセット、すなわち回転異性体のサブセットによ
り占められ得る。
In a preferred embodiment, the computer processing method used to create the primary library is USSN 60/061097, 60/043464, 60/054.
678, 09/127926 and PCT US98 / 07254, all of which are incorporated herein by reference, for protein design automation (PDA). Briefly, a PDA can be described as follows. The known protein structure is used as a starting point. The residues to be optimized are then identified, which may be the entire sequence or a subset (s) thereof. Then
The side chains at variable positions are removed. The structure consisting of the generated protein backbone and the remaining side chains is called the template. Each variable residue position is then preferably classified as a core residue, surface residue or boundary residue. Each classification identifies a subset of possible amino acid residues with respect to position (eg, core residues are generally selected from a series of hydrophobic residues, surface residues are generally selected from hydrophilic residues, And the boundary residue can be either). Each amino acid can be represented by an independent group of all allowed conformers of each side chain, called rotamers. That is, in order to reach the optimal sequence for the skeleton, all possible rotamer sequences must be screened, in which case each skeletal position has each amino acid in its possible rotamer state, Or it may be occupied by a subset of amino acids, ie a subset of rotamers.

【0046】 次いで、2セットの相互作用を全ての位置における各回転異性体について計算
する。すなわち、回転異性体側鎖と骨格の全部または一部との相互作用(「シン
グルス」エネルギー、回転異性体/鋳型または回転異性体/骨格エネルギーとも
呼ばれる)、および回転異性体側鎖とその他全ての位置または他の位置のサブセ
ットにおけるその他全ての可能な回転異性体との相互作用(「ダブルス」エネル
ギー、回転異性体/回転異性体エネルギーとも呼ばれる)。これらの相互作用の
各々のエネルギーは、様々なスコアリング機能の使用を通して計算され、例えば
ファンデルワールス力のエネルギー、水素結合のエネルギー、二次構造傾向のエ
ネルギー、表面領域溶媒和のエネルギーおよび静電気が含まれる。すなわち、骨
格および他の回転異性体の両方と各回転異性体の相互作用の総エネルギーを計算
し、マトリックス形態で記憶させる。
Two sets of interactions are then calculated for each rotamer at all positions. Interaction of rotamer side chains with all or part of the skeleton (also referred to as "singles" energy, rotamer / template or rotamer / skeletal energy), and rotamer side chains with all other positions or Interactions with all other possible rotamers in other subsets of positions (also called "doubles" energies, rotamers / rotomer energies). The energies of each of these interactions are calculated through the use of various scoring functions such as van der Waals force energies, hydrogen bond energies, secondary structure tendency energies, surface area solvation energies, and electrostatics. included. That is, the total energy of interaction of each rotamer with both the backbone and other rotamers is calculated and stored in matrix form.

【0047】 回転異性体のセットは独立した性質を有するため、試験する回転異性体配列数
は単純に計算し得る。一つの位置につきmの可能な回転異性体をもつ長さnの骨
格の場合、mの可能な回転異性体配列があり、数は配列長によって指数関数的
に増大するため、即時計算するのは非実際的または不可能である。従って、この
組み合わせ検索問題を解決するため、「デッド・エンド・エリミネーション」(
DEE)計算を遂行する。DEE計算は、第1回転異性体の最低の全体的相互作
用が第2回転異性体の最上の全体的相互作用よりもなお良好な場合、第2回転異
性体は大域の最適な解答の一部にはなり得ないという事実に基づいている。全回
転異性体のエネルギーは既に計算されているため、DEE方法では、回転異性体
を試験し削除するためには配列長全体に及ぶ合計を出しさえすればよく、計算は
かなり加速される。DEEは、回転異性体の対または回転異性体の組み合わせを
比較しながら再実行され得ることにより、結局、大域最適エネルギーを表す単一
配列が決定される。
Because the set of rotamers has independent properties, the number of rotamer sequences tested can be calculated simply. For a skeleton of length n with m possible rotamers per position, there are m n possible rotamer sequences and the number increases exponentially with the sequence length, so immediate calculation Is impractical or impossible. Therefore, in order to solve this combinatorial search problem, "dead end elimination" (
DEE) Perform calculations. DEE calculations show that if the lowest overall interaction of the first rotamer is still better than the highest overall interaction of the second rotamer, then the second rotamer is part of the global optimal solution. It is based on the fact that it cannot be. Since the energies of all rotamers have already been calculated, the DEE method only requires a total over the length of the sequence to test and eliminate rotamers, which considerably accelerates the calculation. DEE can be re-run while comparing pairs of rotamers or combinations of rotamers, ultimately determining a single sequence that represents the global optimum energy.

【0048】 一旦大域解答が見出されると、モンテカルロ検索を行うことにより、DEE解
答の近隣における配列のランク順リストを作成し得る。DEE解答から出発し、
ランダム位置を他の回転異性体に変更し、新規配列エネルギーを計算する。新規
配列が許容性に関する基準を満たす場合、それは別のジャンプ用出発点として使
用する。予め定められた数のジャンプ後、配列のランク順リストを作成する。
Once the global solution is found, a Monte Carlo search can be performed to create a rank ordered list of sequences in the neighborhood of the DEE solution. Starting from the DEE answer,
Change random positions to other rotamers and calculate new sequence energies. If the new sequence meets the criteria for acceptability, it is used as a starting point for another jump. After a predetermined number of jumps, create a rank ordered list of arrays.

【0049】 U.S.S.N.09/127926で概説されているところによると、蛋白質骨
格(α−炭素からβ−炭素へのベクトルの方向に沿って、窒素、カルボニル炭素
、α−炭素およびカルボニル酸素を含む(天然蛋白質の場合))を、超二次構造
パラメーターと呼ばれる一連のパラメーターを変えることにより、コンピュータ
ー分析前に改変し得る。
According to USS 09/127926, the protein backbone (along the direction of the vector from α-carbon to β-carbon, nitrogen, carbonyl carbon, α-carbon And carbonyl oxygen (in the case of native proteins) can be modified prior to computer analysis by altering a series of parameters called super-secondary structural parameters.

【0050】 一旦蛋白質構造骨格を作成(上記概説の通り、改変を伴う)し、コンピュータ
ーに入力すると、明示的水素が、構造内に含まれていない場合には付加される(
例えば、構造がX線結晶学により生成された場合、水素を付加しなければならな
い)。水素付加後、構造のエネルギーを最小限にすると、水素並びに他の原子、
結合角および結合長が緩和される。好ましい態様では、これは、若干の段階から
成る原子座標位置のコンジュゲート勾配最小限化(Mayoら、J.Phys.Chem.94:
8897(1990))を実行することにより行なわれ、静電気を全く伴わずに
ドレイディング(Dreiding)力の場が最小限にされる。一般的に、約10〜約2
50段階が好ましく、約50が最も好ましい。
Once the protein structural scaffold has been created (with modifications as outlined above) and entered into the computer, an explicit hydrogen is added if not contained within the structure (
For example, hydrogen must be added if the structure was generated by X-ray crystallography). After hydrogenation, if the energy of the structure is minimized, hydrogen and other atoms,
The bond angle and bond length are relaxed. In a preferred embodiment, this is a conjugate gradient minimization of atomic coordinate positions consisting of several steps (Mayo et al., J. Phys. Chem. 94:
8897 (1990)) to minimize the field of Dreiding forces without any static electricity. Generally, about 10 to about 2
50 steps are preferred, with about 50 being most preferred.

【0051】 蛋白質骨格構造は、少なくとも一つの可変残基位置を含む。当業界で知られて
いるところによると、蛋白質の残基またはアミノ酸は、一般に蛋白質のN−末端
から出発して連続的に番号付けされている。すなわち、そのN末端にメチオニン
を有する蛋白質は、残基またはアミノ酸の1位にメチオニンを有していなくては
ならず、次の残基は2、3、4位などに位置するとされている。各位置において
、野生型(すなわち天然)蛋白質は、かなり多数の回転異性体において、少なく
とも20アミノ酸のうちの一つを有し得る。ここで「可変残基位置」とは、設計
される蛋白質のアミノ酸位置が残基または回転異性体、一般的に野生型残基また
は回転異性体としては設計方法で固定されない場合を意味する。
The protein backbone structure comprises at least one variable residue position. As known in the art, protein residues or amino acids are generally numbered consecutively starting from the N-terminus of the protein. That is, a protein having methionine at its N-terminus must have a methionine at position 1 of a residue or an amino acid, and the next residue is said to be located at positions 2, 3, 4 and so on. At each position, the wild-type (ie native) protein can have at least one of at least 20 amino acids in any number of rotamers. The term "variable residue position" as used herein means that the amino acid position of the designed protein is not fixed as a residue or rotamer, generally as a wild-type residue or rotamer, by the design method.

【0052】 好ましい態様において、蛋白質の残基位置全てが可変である。すなわち、どの
アミノ酸側鎖も本発明方法では改変させ得る。これは、小型蛋白質の場合特に望
ましいが、本発明では大型蛋白質の設計も同様に行い得る。この方法で設計され
得る蛋白質の長さに理論的制限は無く、実際的なコンピューターによる制限が存
在する。
In a preferred embodiment, all residue positions of the protein are variable. That is, any amino acid side chain can be modified by the method of the present invention. This is particularly desirable in the case of small proteins, but large proteins can be designed in the present invention as well. There is no theoretical limit to the length of a protein that can be designed in this way, and there are practical computer limits.

【0053】 別の好ましい態様では、蛋白質の残基位置の一部のみが可変であり、残りは「
固定」されている、すなわち、それらはセットコンホメーション(立体配座)で
あるものとして三次元構造で同定される。態様の中には、固定位置がそのもとの
立体配座に残されている場合もある(使用されている回転異性体ライブラリーの
特異的回転異性体と相関関係を示す場合または示さない場合があり得る)。別法
として、残基は非野生型残基として固定され得る。例えば、公知部位指定変異導
入技術が、特定残基が望ましいと示しているとき(例えば、蛋白質加水分解部位
を削除または酵素の基質特異性を改変するために)、残基は特定アミノ酸として
固定され得る。別法として、本発明方法を用いることにより、下記で検討されて
いる通り、新たに変異を評価し得る。別の好ましい態様において、固定位置は「
浮動」させ得る。その位置のアミノ酸は固定されるが、そのアミノ酸の異なる回
転異性体が試験される。この態様において、可変残基は、残基総数の少なくとも
1、または概して0.1%〜99.9%であり得る。すなわち、例えば、そこにあ
らゆる可能性があれば、少数のみ(または1個)の残基または残基の大部分を変
えることも可能である。
In another preferred embodiment, only some of the protein residue positions are variable and the rest are “
"Fixed", that is, they are identified in the three-dimensional structure as being in a set conformation. In some embodiments, a fixed position may remain in its original conformation (whether or not it correlates with the specific rotamer of the rotamer library being used). Can be). Alternatively, the residue may be fixed as a non-wild type residue. For example, when known site-directed mutagenesis techniques indicate that a particular residue is desirable (eg, to delete a proteolytic site or modify the substrate specificity of an enzyme), the residue is fixed as a particular amino acid. obtain. Alternatively, the method of the invention may be used to newly assess mutations, as discussed below. In another preferred embodiment, the fixed position is
Can be floated. The amino acid at that position is fixed, but different rotamers of that amino acid are tested. In this embodiment, the variable residues may be at least 1, or generally 0.1% to 99.9% of the total number of residues. Thus, for example, it is possible to change only a few residues (or only one) or most of the residues, if there are any possibilities there.

【0054】 好ましい態様において、固定され得る残基には、構造的または生物学的機能性
残基があるが、限定されるわけではない。例えば、生物活性にとって重要である
ことが知られている残基、例えば酵素の活性部位、酵素の基質結合部位、結合相
手(リガンド/受容体、抗原/抗体など)にとっての結合部位、生物学的機能に
とっては決定的なリン酸化またはグリコシル化部位を形成する残基、または構造
的に重要な残基、例えばジスルフィド架橋、金属結合部位、重大な水素結合性残
基、骨格立体配座にとって重大な残基、例えばプロリンまたはグリシン、相互作
用パッキングにとって重大な残基などは全て、一立体配座にまたは単一回転異性
体として固定または「浮動」させ得る。
In preferred embodiments, the residues that can be fixed include, but are not limited to, structural or biologically functional residues. For example, residues known to be important for biological activity, such as the active site of an enzyme, the substrate binding site of an enzyme, the binding site for a binding partner (ligand / receptor, antigen / antibody, etc.), biological Residues that form phosphorylation or glycosylation sites that are critical for function, or structurally important residues, such as disulfide bridges, metal binding sites, critical hydrogen bonding residues, critical for backbone conformation Residues such as proline or glycine, residues critical for interaction packing, etc. may all be fixed or "float" in one conformation or as a single rotamer.

【0055】 同様に、可変残基として選択し得る残基は、望ましくない生物学的特性、例え
ば蛋白質加水分解、二量体化または凝集部位、免疫応答を誘導し得るグリコシル
化部位に対する感受性、望ましくない結合活性、望ましくないアロステリー、結
合は保存されているが望ましくない酵素活性などを付与するものであり得る。
Similarly, residues that may be selected as variable residues may have undesirable biological properties, such as sensitivity to proteolytic, dimerization or aggregation sites, glycosylation sites that may induce an immune response, preferably. No binding activity, undesired allostery, binding may confer conserved but undesired enzymatic activity, and the like.

【0056】 好ましい態様において、各可変位置は、コア、表面または境界残基位置として
分類されるが、場合によっては、下で説明されている通り、可変位置をグリシン
に設定することにより、骨格鎖を最小化し得る。コア、表面および境界位置のい
ずれの組み合わせも使用し得る。すなわち、コア、表面および境界残基;コアお
よび表面残基;コアおよび境界残基、および表面および境界残基、並びにコア残
基単独、表面残基単独または境界残基単独。
In a preferred embodiment, each variable position is classified as a core, surface or border residue position, but optionally by setting the variable position to glycine, as described below, the backbone chain Can be minimized. Any combination of core, surface and boundary locations may be used. Core, surface and boundary residues; core and surface residues; core and boundary residues, and surface and boundary residues, and core residues alone, surface residues alone or boundary residues alone.

【0057】 コア、表面または境界としての残基位置の分類は、当業界で認識されている通
り、幾つかの方法で行い得る。好ましい態様において、分類は、側鎖を含む、も
との蛋白質骨格構造の走査画像により行い、蛋白質モデリング技術分野の一熟練
者の主観的評価に基づいて種類を指定する。別法として、好ましい態様は、U.
S.S.N.60/061097、60/043464、60/054678、0
9/127926およびPCT US98/07254で概説されている通り、
鋳型Cα原子のみを用いてコンピューター処理した、溶媒に影響され易い表面に
対するCα−Cβベクトルの配向の評価を利用する。
Classification of residue positions as cores, surfaces or boundaries can be done in several ways, as is recognized in the art. In a preferred embodiment, the classification is performed by scanning an image of the original protein backbone structure including side chains, and the type is designated based on the subjective evaluation of one skilled in the field of protein modeling. Alternatively, the preferred embodiment is U.
S.S.N. 60/061097, 60/043464, 60/054678, 0
As outlined in 9/127926 and PCT US98 / 07254,
Utilizes an assessment of the orientation of the Cα-Cβ vector relative to a solvent-sensitive surface that was computerized with only template Cα atoms.

【0058】 一旦各可変位置をコア、表面または境界として分類すると、一連のアミノ酸側
鎖、すなわち一連の回転異性体が各位置に割り当てられる。すなわち、プログラ
ムにより特定位置での考慮の対象として認められた一連の可能なアミノ酸側鎖が
選択される。それに続いて、一旦可能なアミノ酸側鎖を選択すると、特定位置で
評価される一連の回転異性体を決定し得る。すなわち、コア残基は、一般にアラ
ニン、バリン、イソロイシン、ロイシン、フェニルアラニン、チロシン、トリプ
トファンおよびメチオニンから成る疎水性残基の群から選択され(態様によって
は、下記ファンデルワールスのスコアリンク機能のαスケーリング因子が低いと
き、メチオニンが設定から除去されることもある)、各コア位置に関して示され
た回転異性体は、潜在的にこれらの8アミノ酸側鎖に関する回転異性体を包含す
る(骨格独立ライブラリーを使用する場合は全回転異性体、および回転異性体依
存的骨格を使用する場合はサブセット)。同様に、表面位置は、一般にアラニン
、セリン、トレオニン、アスパラギン酸、アスパラギン、グルタミン、グルタミ
ン酸、アルギニン、リシンおよびヒスチジンから成る親水性残基の群から選択さ
れる。すなわち各表面位置に関して示された回転異性体は、これらの10残基に
関する回転異性体を包含する。最後に、境界位置は、一般にアラニン、セリン、
トレオニン、アスパラギン酸、アスパラギン、グルタミン、グルタミン酸、アル
ギニン、リシン、ヒスチジン、バリン、イソロイシン、ロイシン、フェニルアラ
ニン、チロシン、トリプトファンおよびメチオニンから選択する。すなわち、各
境界位置に関して示された回転異性体は、これらの17残基に関する回転異性体
を全て包含する(システイン、グリシンおよびプロリンが使用されないことを仮
定するが、それらは使用され得る)。さらに、幾つかの好ましい態様では、一連
の18天然アミノ酸(システインおよびプロリンを除く全て、これらは特に破壊
的であることが知られている)を使用する。
Once each variable position is classified as a core, surface or boundary, a series of amino acid side chains, or series of rotamers, is assigned to each position. That is, the program selects a set of possible amino acid side chains that are considered for consideration at a particular position. Following that, once the possible amino acid side chains have been selected, a series of rotamers evaluated at a particular position can be determined. That is, the core residue is generally selected from the group of hydrophobic residues consisting of alanine, valine, isoleucine, leucine, phenylalanine, tyrosine, tryptophan and methionine (in some embodiments, α scaling of van der Waals scorelink function below. When the factor is low, methionine may be removed from the setup), and the rotamers shown for each core position potentially encompass rotamers for these 8 amino acid side chains (backbone independent library). All rotamers when using, and subsets when using rotamer-dependent scaffolds). Similarly, the surface position is generally selected from the group of hydrophilic residues consisting of alanine, serine, threonine, aspartic acid, asparagine, glutamine, glutamic acid, arginine, lysine and histidine. That is, the rotamers shown for each surface position include rotamers for these 10 residues. Finally, the boundary positions are generally alanine, serine,
It is selected from threonine, aspartic acid, asparagine, glutamine, glutamic acid, arginine, lysine, histidine, valine, isoleucine, leucine, phenylalanine, tyrosine, tryptophan and methionine. That is, the rotamers shown for each boundary position encompass all rotamers for these 17 residues (assuming cysteine, glycine and proline are not used, but they can be used). Further, in some preferred embodiments, a series of 18 natural amino acids (all except cysteine and proline, which are known to be particularly destructive) are used.

【0059】 すなわち、当業者には理解されるであろうが、計算回数が減らせるため、残基
位置を分類することにはコンピューター化の利点がある。また、一連のコア、境
界および表面残基が上記のものから改変される状況があり得ることに注目すべき
である。例えば、環境によっては、一つまたはそれ以上のアミノ酸が付加される
かまたは一連の認められたアミノ酸群から控除されることもある。例えば、二量
体化または多量体化するか、またはリガンド結合部位を有する蛋白質の中には、
疎水性表面残基などを含み得るものもある。さらに、らせん「キャッピング」ま
たはαらせん双極子との有利な相互作用を行わせない残基は、一連の認められた
残基から控除し得る。このアミノ酸基修飾は、残基ごとに行い得る。
That is, as will be appreciated by those skilled in the art, classifying residue positions has the advantage of computerization as it reduces the number of calculations. It should also be noted that there may be situations where the core, border and surface residues are modified from those described above. For example, in some circumstances one or more amino acids may be added or subtracted from the set of allowed amino acids. For example, some proteins that dimerize or multimerize or have a ligand binding site include
Some may include hydrophobic surface residues and the like. In addition, residues that do not permit helical "capping" or favorable interaction with the alpha helix dipole can be subtracted from the set of recognized residues. This amino acid group modification can be performed on a residue-by-residue basis.

【0060】 好ましい態様において、プロリン、システインおよびグリシンは可能なアミノ
酸側鎖のリストには含まれないため、これらの側鎖に関する回転異性体は使用さ
れない。しかしながら、好ましい態様において、可変残基位置が0°より大きい
角度φ(すなわち、1)上記アミノ酸のカルボニル炭素、2)現残基の窒素原子
、3)現残基のα炭素、および4)現残基のカルボニル炭素により特定される二
面角)を有するとき、該位置をグリシンに設定して骨格のひずみを最小化する。
In a preferred embodiment, proline, cysteine and glycine are not included in the list of possible amino acid side chains, so rotamers for these side chains are not used. However, in a preferred embodiment, the variable residue position is at an angle φ greater than 0 ° (ie, 1) the carbonyl carbon of the above amino acid, 2) the nitrogen atom of the current residue, 3) the α carbon of the current residue, and 4) the current carbon atom. When having a dihedral angle specified by the carbonyl carbon of the residue, the position is set to glycine to minimize backbone strain.

【0061】 一旦潜在的回転異性体の群を各可変残基位置に割り当てると、U.S.S.N.0
9/127926およびPCT US98/07254で概説されている要領で
プロセッシングが進められる。このプロセッシング段階は、回転異性体間の相互
作用および回転異性体と蛋白質骨格との相互作用の分析を必要とし、それによっ
て最適化蛋白質配列が作成される。極度に単純化すると、プロセッシングは、ま
ず若干のスコアリング機能を用いることにより、骨格自体または他の回転異性体
に対し、回転異性体の相互作用エネルギーを計算することを含む。好ましいPD
Aスコアリング機能には、ファンデルワールスポテンシャルスコアリング機能、
水素結合ポテンシャルスコアリング機能、原子溶媒和スコアリング機能、二次構
造傾向スコアリング機能および静電気スコアリング機能があるが、これらに限定
はされない。さらに下記で報告されているように、少なくとも一つのスコアリン
グ機能を用いることにより、各位置を評価するが、スコアリング機能は位置分類
または他の考慮すべき点、例えばαらせん双極子との有利な相互作用により異な
り得る。下記で概説されている通り、計算で使用される総エネルギーは、一般に
等式1で示されるように、特定位置で使用される各スコアリング機能のエネルギ
ー合計である: 等式1 Etotal=nEvdw+nEas+nEh−結合+nEas+nEelec
Once a group of potential rotamers has been assigned to each variable residue position, USS N0
Processing proceeds as outlined in 9/127926 and PCT US98 / 07254. This processing step requires analysis of rotamer interactions and rotamer-protein backbone interactions, thereby producing optimized protein sequences. In extreme simplification, processing involves first calculating the interaction energy of the rotamer with respect to the backbone itself or other rotamers by using some scoring function. Preferred PD
A scoring function includes van der Waals potential scoring function,
There are, but not limited to, hydrogen bond potential scoring functions, atomic solvation scoring functions, secondary structure tendency scoring functions and electrostatic scoring functions. As reported further below, each position is evaluated by using at least one scoring function, which is useful for position classification or other considerations, such as alpha helical dipoles. Can vary with different interactions. As outlined below, the total energy used in the calculation is generally the sum of the energy of each scoring function used at a particular position, as shown in Equation 1: Equation 1 E total = nE vdw + nE as + nE h-bond + nE as + nE elec

【0062】 等式1において、総エネルギーは、ファンデルワールスポテンシャルエネルギ
ー(Evdw)、原子溶媒和エネルギー(Eas)、水素結合エネルギー(Eh−結
)、二次構造エネルギー(Ess)および静電気相互作用エネルギー(Eelec
の合計である。nの語は、この語を特定残基位置に関して考慮すべきか否かによ
って、0または1である。
In Equation 1, the total energy is van der Waals potential energy (E vdw ), atomic solvation energy (E as ), hydrogen bond energy (E h- bond).
If), the secondary structure energy (E ss) and electrostatic interaction energy (E elec)
Is the sum of The word n is 0 or 1 depending on whether this word should be considered for a particular residue position.

【0063】 U.S.S.N.60/061097、60/043464、60/054678
、09/127926およびPCT US98/07254で概説されていると
ころによると、単独または組み合わせとして、これらのスコアリング機能の組み
合わせはどれでも使用し得る。一旦使用するスコアリング機能を各可変位置に関
して定めると、コンピューター分析における好ましい第一段階では、可能な各回
転異性体と蛋白質の残り全部または一部との相互作用が測定される。すなわち、
スコアリング機能の一つまたはそれ以上により測定される、各可変残基位置にお
ける可能な各回転異性体と骨格または他の回転異性体との相互作用のエネルギー
が計算される。好ましい態様では、各回転異性体と蛋白質の残り全部、すなわち
鋳型全体および他の全回転異性体の両方との相互作用が行なわれる。しかしなが
ら、上記で概説されている通り、蛋白質の一部、例えば大型蛋白質のドメインを
モデルにすることのみが可能であるため、場合によっては、蛋白質の必ずしも全
部を考慮する必要はないこともある。
U.S.S.N. 60/061097, 60/043464, 60/054678
, 09/127926 and PCT US98 / 07254, either alone or in combination, any combination of these scoring functions may be used. Once the scoring function to be used has been defined for each variable position, the preferred first step in computer analysis measures the interaction of each possible rotamer with all or part of the rest of the protein. That is,
The energy of each possible rotamer interaction with the backbone or other rotamer at each variable residue position, as measured by one or more of the scoring functions, is calculated. In a preferred embodiment, the interaction of each rotamer with all of the rest of the protein, both the entire template and all other rotamers, is carried out. However, as outlined above, it is not necessary to consider all of the protein in some cases, as it is only possible to model a portion of the protein, eg the domain of a large protein.

【0064】 好ましい態様において、コンピューター処理の第一段階は、全ての位置におけ
る各回転異性体に関して2セットの相互作用を計算することにより行なう。すな
わち、その位置を変更しようと浮動させようと、回転異性体側鎖と鋳型または骨
格との相互作用(「シングルス」エネルギー)、および回転異性体側鎖と全ての
他の位置における全ての他の可能な回転異性体との相互作用(「ダブルス」エネ
ルギー)である。この場合の骨格は蛋白質構造骨格の原子および固定残基があれ
ばその原子の両方を含み、この場合固定残基はアミノ酸の特定立体配座として定
義されることを理解すべきである。
In a preferred embodiment, the first step of computer processing is performed by calculating two sets of interactions for each rotamer at all positions. That is, the rotamer side chains interact with the template or backbone (the "singles" energy), whether or not its position is altered or floated, and the rotamer side chains and all other possible positions at all other positions. Interaction with rotamers (“doubles” energy). It should be understood that the scaffold in this case includes both the atoms of the protein structural scaffold and the fixed residues, if any, in which case the fixed residues are defined as a particular conformation of the amino acid.

【0065】 すなわち、「シングルス」(回転異性体/鋳型)エネルギーは、スコアリング
機能の一部または全部を用いて、全ての可変残基位置における全ての可能な回転
異性体と骨格との相互作用に関して計算される。すなわち、水素結合スコアリン
グ機能の場合、回転異性体の全水素結合原子および骨格の全水素結合原子が評価
され、EHBが全可変位置における可能な各回転異性体について計算される。同様
に、ファンデルワールススコアリング機能の場合、回転異性体の全原子を鋳型の
全原子と比較し(一般的にそれ自体の残基の骨格原子を除外する)、そして全可
変残基位置における可能な各回転異性体についてEvdWを計算する。さらに、原
子が3つまたはそれ未満の結合により結合されている場合、一般的に、ファンデ
ルワールスエネルギーは計算されない。原子溶媒和スコアリング機能の場合、回
転異性体の表面は鋳型表面に対して測定され、全ての可変残基位置における可能
な各回転異性体についてEasが計算される。また二次構造傾向スコアリング機能
はまた、シングルスエネルギーとして考えられるため、総シングルスエネルギー
はEss限界点を含み得る。当業界で認識されているところによると、回転異性体
および鋳型位置間の物理的距離によって、これらのエネルギー限界点の多くはゼ
ロに近づく。すなわち、2つの部分がさらに離れると、エネルギーは低くなる。
That is, the “single” (rotamer / template) energy is the interaction of all possible rotamers with the backbone at all variable residue positions using some or all of the scoring function. Is calculated with respect to. That is, for the hydrogen bond scoring function, all rotamer hydrogen atoms and backbone all hydrogen bond atoms are evaluated and E HB is calculated for each possible rotamer at all variable positions. Similarly, for the van der Waals scoring function, all atoms of the rotamer are compared to all atoms of the template (generally excluding the backbone atoms of its own residue) and at all variable residue positions. Calculate E vdW for each possible rotamer. In addition, van der Waals energies are generally not calculated when atoms are bound by three or fewer bonds. In the case of the atomic solvation scoring function, the rotamer surface is measured relative to the template surface and E as is calculated for each possible rotamer at every variable residue position. Also, the secondary structure tendency scoring function is also considered as a singles energy, so the total singles energy may include the E ss limit point. It is recognized in the art that many of these energy limits approach zero due to the physical distance between rotamers and template positions. That is, the further the two parts are separated, the lower the energy.

【0066】 「ダブルス」エネルギー(回転異性体/回転異性体)の計算の場合、可能な各
回転異性体の相互作用エネルギーを全ての他の可変残基位置における全ての可能
な回転異性体と比較する。すなわち、「ダブルス」エネルギーは、スコアリング
機能の一部または全部を用いて、全ての可変残基位置における全ての可能な回転
異性体と全ての他の可変残基位置における全ての可能な回転異性体との相互作用
に関して計算される。すなわち、水素結合スコアリング機能の場合、第一回転異
性体の全水素結合原子および全ての可能な第二回転異性体の全水素結合原子が評
価され、EHBが2つの可変位置における可能な各回転異性体対について計算され
る。同様に、ファンデルワールススコアリング機能の場合、第一回転異性体の全
原子を全ての可能な第二回転異性体の全原子と比較し、そして全ての2可変残基
位置における可能な各回転異性体対についてEvdWを計算する。原子溶媒和スコ
アリング機能の場合、第一回転異性体の表面は全ての可能な第二回転異性体の表
面に対して測定され、そして全ての2可変残基位置における可能な各回転異性体
対についてEasが計算される。二次構造傾向スコアリング機能については、「シ
ングルス」エネルギーの構成要素として見なされることから、「ダブルス」エネ
ルギーとして実施される必要は無い。当業界で認識されているところによると、
第一回転異性体および第二回転異性体間の物理的距離によって、これらのダブル
スエネルギー限界点の多くはゼロに近づく。すなわち、2つの部分がさらに離れ
ると、エネルギーは低くなる。
For calculation of “doubles” energy (rotomer / rotomer), compare the interaction energy of each possible rotamer with all possible rotamers at all other variable residue positions. To do. That is, the “doubles” energy uses all or all of the possible rotamers at all variable residue positions and all of the possible rotamers at all variable residue positions using some or all of the scoring function. Calculated in terms of interactions with the body. That is, for the hydrogen bond scoring function, all hydrogen-bonding atoms of the first rotamer and all possible hydrogen-bonding atoms of the second rotamer are evaluated, and E HB is determined by each possible hydrogen bond at two variable positions. Calculated for rotamer pairs. Similarly, for the van der Waals scoring function, all atoms of the first rotamer are compared to all atoms of all possible second rotamers, and each possible rotation at all two variable residue positions. Calculate E vdW for the isomer pair. In the case of the atomic solvation scoring function, the surface of the first rotamer was measured against the surface of all possible second rotamers, and each possible rotamer pair at all two variable residue positions. E as is calculated for. The secondary structure tendency scoring function need not be implemented as "doubles" energy as it is considered a component of "singles" energy. According to what is recognized in the industry,
Many of these doubles energy limit points approach zero due to the physical distance between the first and second rotamers. That is, the further the two parts are separated, the lower the energy.

【0067】 一旦シングルスおよびダブルスエネルギーが計算され記憶されると、コンピュ
ーター処理の第二段階が行われ得る。U.S.S.N.09/127926およびP
CT US98/07254で概説されているところによると、好ましい態様は
、デッド・エンド・エリミネーション(DEE)段階、および好ましくはモンテ
カルロ段階を利用する。
Once the singles and doubles energies have been calculated and stored, the second stage of computer processing may take place. U.S.S.N. 09/127926 and P
As outlined in CT US98 / 07254, the preferred embodiment utilizes a dead end elimination (DEE) stage, and preferably a Monte Carlo stage.

【0068】 コンピューター処理の結果、一連の最適化蛋白質配列が作成される。これらの
最適化蛋白質配列は、一般的に、必ずというわけではないが、骨格を取り出した
野生型配列とは顕著に異なる。すなわち、各最適化蛋白質配列は、好ましくは少
なくとも約5−10%の割合で出発または野生型配列由来のアミノ酸変異型を含
み、少なくとも約15−20%変異が好ましく、少なくとも約30%変異が特に
好ましい。
As a result of computer processing, a series of optimized protein sequences is created. These optimized protein sequences are generally, but not always, significantly different from the scaffold-extracted wild-type sequences. That is, each optimized protein sequence preferably comprises at least about 5-10% amino acid variants from the starting or wild type sequences, with at least about 15-20% mutations preferred, and at least about 30% mutations particularly preferred. preferable.

【0069】 次いで、一次ライブラリーに関するカットオフを強化することにより、一次ラ
イブラリーを形成する一連の一次配列が生成される。上記で概説されている通り
、これは様々な方法で、例えば任意のカットオフ、エネルギー制限により、また
はある数の残基位置が改変されたとき行われ得る。一般に、一次ライブラリーの
サイズは、蛋白質のサイズ、 変っている残基の数、使用されているコンピュー
ター処理方法、適用されたカットオフおよびユーザーの判断に応じて変化する。
一般に、確固たる二次ライブラリーの準備をするために、一次ライブラリーは、
妥当な配列空間を無作為にサンプリングできる程度の十分に大きいものにするの
が好ましい。すなわち、一次ライブラリーの範囲は、約50〜約1013が好ま
しく、約1000〜約10が特に好ましく、約1000〜約100000がさ
らに好ましい。
The cutoffs for the primary library are then enhanced to produce a series of primary sequences that form the primary library. As outlined above, this can be done in a variety of ways, eg by any cutoff, energy restriction, or when a certain number of residue positions have been modified. In general, the size of the primary library will vary depending on the size of the protein, the number of altered residues, the computational method used, the cutoff applied and the discretion of the user.
Generally, to prepare a solid secondary library, the primary library is
It is preferable that the reasonable array space be large enough to allow random sampling. That is, the range of the primary library is preferably about 50 to about 10 13, more preferably about 1000 to about 10 7 , and even more preferably about 1000 to about 100,000.

【0070】 好ましい態様では、これは要件ではないが、一次ライブラリーは、その最適立
体配置において大域的最適配列、すなわち各可変位置における最適回転異性体を
含む。すなわち、シミュレーションプログラムが大域的最適結果である単一配列
に収束するまでコンピューター処理を行う。好ましい態様において、一次ライブ
ラリーは少なくとも2つの最適化蛋白質配列を含む。すなわち例えば、コンピュ
ーター処理段階は、若干の不利な組み合わせを削除するが、収束前には停止され
得、大域的最適結果であるものの配列のライブラリーが提供される。それに加え
て、例えば異なる方法を用いて、さらなるコンピューター分析がライブラリーに
対して実行されることにより、さらに配列を削除またはそれらを種々にランク付
けし得る。別法として、U.S.S.N.60/061097、60/043464
、60/054678、09/127926およびPCT US98/0725
4でさらに十分に説明されているところによると、大域的最適結果に到達し得、
次いでさらにコンピューター処理が行われ得ることにより、大域的最適結果の近
隣で追加的最適化配列が作成される。
In a preferred embodiment, although this is not a requirement, the primary library comprises the global optimal sequence in its optimal configuration, ie the optimal rotamer at each variable position. That is, computer processing is performed until the simulation program converges to a single array that is the global optimum result. In a preferred embodiment, the primary library contains at least two optimized protein sequences. Thus, for example, the computational step removes some unfavorable combinations but can be stopped prior to convergence, providing a library of sequences of global optimal results. In addition, further computer analysis can be performed on the library, eg using different methods, to further delete sequences or rank them differently. Alternatively, USS N. 60/061097, 60/043464
, 60/054678, 09/127926 and PCT US98 / 0725.
According to what is more fully explained in 4, global optimal results can be reached,
Further computational processing can then be performed to create additional optimized sequences in the neighborhood of the global optimal result.

【0071】 さらに、態様によっては、カットオフを設けなかった一次ライブラリー配列が
一次ライブラリーに含まれる場合もある。これは、一次ライブラリー生成方法を
評価するか、対照または比較基準として用いるか、または追加的配列空間をサン
プリングするのに状況によっては望ましいものであり得る。例えば、好ましい態
様では、野生型配列が含まれる。
Further, in some embodiments, a primary library sequence without a cutoff is included in the primary library. This may be desirable in some situations to evaluate primary library generation methods, to be used as controls or comparison criteria, or to sample additional sequence space. For example, in a preferred embodiment, the wild type sequence is included.

【0072】 また、異なる一次ライブラリーの組み合わせが行われ得ることにも注目すべき
である。例えば、コンピュータースクリーニングにおいて多量の変異多様性を示
す蛋白質での位置は、下記で概説されている通り固定され、異なる一次ライブラ
リーが再生され得る。第1のと同じ長さのランク順リストは、先にほとんど位置
を変えない状態で多様性を示している。第1の一次ライブラリーからの変異体を
第2の一次ライブラリーからの変異体と組み合わせることにより、非常に長いラ
ンク順リストを作成するよりも低いコンピューター支出で組み合わせライブラリ
ーが提供され得る。この方法は、容易に表面位置を変える低エネルギーギャップ
、およびコア位置をほとんど変えない高エネルギーギャップの両方において配列
多様性をサンプリングするのに特に有用であり得る。
It should also be noted that combinations of different primary libraries can be made. For example, positions in proteins that display large amounts of mutational diversity in computer screens can be fixed and reconstituted with different primary libraries, as outlined below. The rank-ordered list of the same length as the first shows diversity with little change in position first. Combining the variants from the first primary library with the variants from the second primary library may provide a combinatorial library with lower computer outlay than making a very long ranked list. This method can be particularly useful for sampling sequence diversity in both low energy gaps that easily change surface position and high energy gaps that rarely change core position.

【0073】 すなわち、本発明は、配列のランク順リストを含む一次ライブラリーを提供す
る。一態様において、一次ライブラリーの全部または一部は二次ライブラリーと
しての役割を果たす。すなわち、カットオフを一次配列に適用し、それ以上操作
または組換えを行わずにこれらの配列を二次ライブラリーとして用いる。ライブ
ラリー構成要素は下記で概説されている要領で、例えば直接合成またはライブラ
リー構成要素をコード化する核酸を構築し、それらを適当な宿主で発現させ、次
いで所望によりスクリーニングすることにより作成し得る。
Thus, the invention provides a primary library containing a ranked list of sequences. In one aspect, all or part of the primary library serves as a secondary library. That is, the cutoffs are applied to the primary sequences and these sequences are used as a secondary library without further manipulation or recombination. Library members may be made as outlined below, for example by direct synthesis or by constructing nucleic acids encoding the library members, expressing them in a suitable host, and then optionally screening. ..

【0074】 好ましい態様では、骨格蛋白質の一次ライブラリーを用いることにより、二次
ライブラリーを作成する。当業界で認識されているところによると、二次ライブ
ラリーは、一次ライブラリーのサブセットであるか、または新規ライブラリー構
成要素、すなわち一次ライブラリーからは見出されない配列を含み得る。すなわ
ち、一般に、変異位置および/または変異位置におけるアミノ酸残基を若干の方
法で再び組み合わせることにより、一次ライブラリーから見出される配列変異を
利用した新規ライブラリーが形成され得る。すなわち、「ホットスポット(変異
多発域)」または重要な変異位置および/または残基が確認されると、これらの
位置を新規方法で再び組み合わせることにより、新規配列が生成され、二次ライ
ブラリーを形成し得る。すなわち、好ましい態様において、二次ライブラリーは
、一次ライブラリーからは見出されない少なくとも一構成要素の配列、および好
ましくは複数の上記配列を含む。
In a preferred embodiment, a secondary library is created by using a primary library of scaffold proteins. It is recognized in the art that the secondary library may be a subset of the primary library or may contain novel library members, ie sequences not found in the primary library. That is, generally, a mutation position and / or the amino acid residues at the mutation position can be recombined in some manner to form a new library that utilizes the sequence mutations found in the primary library. That is, once "hot spots" or important mutation positions and / or residues have been identified, these positions are recombined in a novel manner to generate new sequences and to generate secondary libraries. Can be formed. That is, in a preferred embodiment, the secondary library comprises a sequence of at least one component not found in the primary library, and preferably a plurality of the above sequences.

【0075】 好ましい態様において、二次ライブラリーは、レファレンス配列から変異する
アミノ酸位置を製表することにより作成される。レファレンス配列は任意に選択
され得るか、または好ましくは野生型配列または大域最適配列として選択され、
後者の方が好ましい。すなわち、一次ライブラリーで変異する各アミノ酸位置を
製表する。勿論、最初のコンピューター分析により幾つかの位置が固定されてい
る場合、二次ライブラリーの可変位置は、これら最初の可変位置そのものまたは
これら最初の可変位置のサブセットを含む。すなわち、100アミノ酸から成る
蛋白質を仮定すると、最初のコンピュータースクリーンは100の位置を全て変
異させ得る。しかしながら、一次ライブラリーにおけるカットオフ故に、25の
位置のみが変異し得る。別法として、同じ100アミノ酸蛋白質を仮定すると、
最初のコンピュータースクリーンは25の位置のみ変異させ、他の75を固定さ
せ得た。この結果、25のうち12のみがカットオフ一次ライブラリーにおいて
変更され得る。次いで、これらの一次ライブラリー位置を再び組み合わせること
により、二次ライブラリーを形成させ得、これらの可変位置の可能な組み合わせ
全てが二次ライブラリーを形成する。非可変位置がレファレンス配列位置に設定
されていることに注目すべきである。
In a preferred embodiment, a secondary library is created by representing the mutated amino acid positions from the reference sequence. The reference sequence may be arbitrarily selected, or is preferably selected as a wild type sequence or a global optimal sequence,
The latter is preferred. That is, each amino acid position that mutates in the primary library is tabulated. Of course, if some positions are fixed by the initial computer analysis, the variable positions of the secondary library include these first variable positions themselves or a subset of these first variable positions. Thus, assuming a protein of 100 amino acids, the first computer screen can mutate all 100 positions. However, only 25 positions can be mutated due to the cutoff in the primary library. Alternatively, assuming the same 100 amino acid protein,
The first computer screen was able to mutate only 25 positions and fix the other 75. As a result, only 12 of 25 can be altered in the cutoff primary library. A secondary library can then be formed by recombining these primary library positions, and all possible combinations of these variable positions form the secondary library. It should be noted that the non-variable position is set to the reference sequence position.

【0076】 この方法を用いた二次ライブラリーの形成は2つの一般的方法;可変位置の全
てで任意のアミノ酸が存在し得るか、またはアミノ酸のサブセットが各位置で存
在し得るか、のいずれかで行い得る。
The formation of a secondary library using this method is two general methods; either any amino acid may be present at all of the variable positions, or a subset of amino acids may be present at each position. You can do it in

【0077】 好ましい実施態様では、この一次ライブラリー中に同定された各可変位置は何
のアミノ酸残基であってもよい。即ち、一度可変位置を同定すれば、各可変位置
におけるあらゆるアミノ酸のあらゆる組合わせを含む二次ライブラリーが作成さ
れる。 好ましい実施態様では、アミノ酸群のサブセット群を選択する。任意の位置に
おけるサブセットは、使用者が選択するものであるか、または一次スクリーンで
生成したアミノ酸残基群のコレクションであり得る。即ち、コア残基25が可変
であると仮定し、そしてこの一次スクリーンがこの位置について5種の可能性あ
る別異のアミノ酸を与えるとするなら、使用者は上で概説した良好なコア残基群
(例えば、疎水性残基)のセットを選択してもよく、または使用者は一次スクリ
ーンで生成したこれら5種の別異アミノ酸を選択することによってこのセットを
構築してもよい。あるいは、これらの技法の組合わせを採用でき、その場合、同
定された残基群のセットは手作業で拡張する。例えば、一部の実施態様では、ア
ミノ酸残基数よりも少ない数を選択する;例えば、5種中3種のみを選択するこ
とができる。あるいは、このセットを手作業で拡張する;例えば、計算で2種の
異なる疎水性残基を選択したなら、追加の選択を加えてもよい。
In a preferred embodiment, each variable position identified in this primary library can be any amino acid residue. That is, once the variable positions are identified, a secondary library containing any combination of any amino acids at each variable position is created. In a preferred embodiment, a subset of amino acid groups is selected. The subset at any position may be user-selected or a collection of amino acid residue groups generated in the primary screen. That is, assuming that core residue 25 is variable, and if this primary screen gives 5 possible distinct amino acids for this position, the user is A set of groups (eg hydrophobic residues) may be selected or the user may construct this set by selecting these 5 different amino acids generated in the primary screen. Alternatively, a combination of these techniques can be employed, in which case the set of identified residues will be expanded manually. For example, in some embodiments, a number less than the number of amino acid residues is selected; for example, only 3 out of 5 can be selected. Alternatively, this set is expanded manually; for example, if two different hydrophobic residues are selected in the calculation, additional selections may be added.

【0078】 加えて、これは、一次ライブラリーを分析して、骨格蛋白質中でどれどれのア
ミノ酸位置が高い変異頻度を有し、どれどれの位置が低い変異頻度を有するか決
めることにより実施できる。この二次ライブラリーは、一定頻度以上の変異数は
もたない位置をそのままに保ち、他方、高い変異数を有する位置でアミノ酸群を
ランダム化することにより生成させることができる。例えば、該位置が20%以
下の、好ましくは10%以下の変異しかもたない位置である場合、それは参照配
列位置としてそのまま保持され得る。
In addition, this can be done by analyzing the primary library to determine which amino acid positions in the scaffold protein have a high mutation frequency and which positions have a low mutation frequency. . This secondary library can be generated by keeping the positions that do not have the number of mutations at a certain frequency or higher as they are, while randomizing the amino acid groups at the positions that have a high number of mutations. For example, if the position is a position that has 20% or less, preferably 10% or less mutations, it may be retained as a reference sequence position.

【0079】 好ましい実施態様では、確率分布表を作成する。この実施態様では、各可変位
置における各アミノ酸残基の頻度を同定する。各頻度は、カットオフより低い変
異頻度を全てゼロとセットした場合の閾値であり得る。このカットオフは、好ま
しくは、1%、2%、5%、10%または20%であり、特に好ましいのは10
%である。これらの頻度は、次いで二次ライブラリー中にビルトインする。即ち
、上記のように、これらの可変位置を集め、そしてあらゆる可能性のある組合わ
せを生成させるが、二次ライブラリーを「満たす」アミノ酸残基群は頻度ベース
で利用する。従って、ある頻度ベースでない二次ライブラリー中では、5つの可
能性のある残基を有する1つの可変位置が、可能性ある第一残基を有する該可変
位置を含む蛋白質を20%、第二のそれが20%、以下同、を有するであろう。
しかしながら、頻度ベースの二次ライブラリーでは、それぞれ10%、15%、
25%、30%および20%の各頻度を有する、5つの可能性のある残基を有す
る1つの可変位置は、可能性ある第一残基を有する該可変位置を含む蛋白質を1
0%、第二残基を有する蛋白質を15%、第三のそれが25%、以下同、を有す
るであろう。当業者には明らかであろうが、実際の頻度は実際に蛋白質生成に使
用した方法によって変り得る;例えば、正確な頻度はそれらの蛋白質を合成した
時に可能である。しかしながら、以下に概説する頻度ベースのプライマー系を使
用する場合は、各位置における実際の頻度は後述のごとく可変である。
In the preferred embodiment, a probability distribution table is created. In this embodiment, the frequency of each amino acid residue at each variable position is identified. Each frequency can be a threshold when all mutation frequencies below the cutoff are set to zero. This cut-off is preferably 1%, 2%, 5%, 10% or 20%, particularly preferably 10%.
%. These frequencies are then built into the secondary library. That is, as described above, these variable positions are assembled and all possible combinations are generated, but the amino acid residues that "fill" the secondary library are utilized on a frequency basis. Thus, in a non-frequency-based secondary library, one variable position with 5 possible residues would be 20% of the protein containing that variable position with the first possible residue, the second It will have 20%, and below.
However, with frequency-based secondary libraries, 10%, 15%,
One variable position with 5 possible residues, each having a frequency of 25%, 30% and 20%, is a protein containing the variable position with the first possible residue.
0%, 15% of proteins with the second residue, 25% of the third, and so on. As will be apparent to those of skill in the art, the actual frequency may vary depending on the method actually used to produce the protein; for example, the exact frequency is possible when the proteins are synthesized. However, when using the frequency-based primer system outlined below, the actual frequency at each position is variable as described below.

【0080】 明らかとなるであろうが、各可変位置および/または該可変位置における各残
基を再構成して創り出された二次ライブラリーは、ランク―順に配列したリスト
中には入らない。一部の実施態様では、全リストを適正に作成し、試験し得た。
あるいは、好ましい実施態様では、、この二次ライブラリーはランク順のリスト
の形態でもある。これは、二次ライブラリーの大きさが実験的に生成させるには
まだ大きすぎること、または予想できる目的を含む、いくつかの理由に対して実
施できる。これは数種の方法で実施できる。ある実施態様では、ライブラリーメ
ンバーを順位付けするPDAの採点機能を使用して、二次ライブラリーを順位付
けする。あるいは、統計的手法を使用することもできる。例えば、この二次ライ
ブラリーは、頻度スコアによって順位付けし得る;即ち、高頻度残基の大部分を
含有する蛋白質を高ランクに順位付けすること、等が可能であろう。これは、各
可変位置において数値的スコアを発生する頻度を加算するかまたは乗ずることに
よっても実施できる。同様にして、二次ライブラリーの異なる各位置を秤量し、
次いで各蛋白質を採点することができる;例えば、任意に、ある各種残基を含有
するもので順位付けし得る。
As will be apparent, secondary libraries created by rearranging each variable position and / or each residue at that variable position are not included in the rank-ordered list. In some embodiments, the entire list could be properly prepared and tested.
Alternatively, in a preferred embodiment, this secondary library is also in the form of a rank ordered list. This can be done for several reasons, including that the size of the secondary library is still too large to generate experimentally, or a predictable purpose. This can be done in several ways. In some embodiments, the PDA scoring function of ranking library members is used to rank secondary libraries. Alternatively, statistical methods can be used. For example, the secondary library may be ranked by frequency score; that is, proteins that contain the majority of high frequency residues may be ranked high. This can also be done by adding or multiplying the frequency of generating the numerical score at each variable position. Similarly, weigh each different position of the secondary library,
Each protein may then be scored; for example, it may optionally be ranked by those containing certain various residues.

【0081】 本明細書中で概説しているように、二次ライブラリーは、一般的に2通りの方
法で生成させ得る。第1は、上述のごときコンピューター処理方式である。該方
法中で一次ライブラリーはさらにコンピューター処理方式で、例えば、可能性あ
る変異位置および/またはアミノ酸残基を各変異位置で再構成することにより取
扱う。それは、上述のようにして順位付けし得る。このコンピューター処理方式
で導き出した二次ライブラリーは、以下に詳述するように、それから、ライブラ
リーメンバーまたはそれらをコードしている核酸を合成することにより、実験的
に生成させることがができる。あるいは、この二次ライブラリーを実験的に生成
する;即ち、核酸再構成技法を使用して該組合わせを実験的に生成させる。これ
は、下記のように各種の方法で実施できる。
Secondary libraries, as outlined herein, can generally be generated in two ways. The first is the computer processing method as described above. In the method the primary library is further handled in a computational manner, eg by reconstituting potential mutation positions and / or amino acid residues at each mutation position. It may be ranked as described above. This computationally derived secondary library can be generated experimentally by synthesizing library members or the nucleic acids encoding them, as described in detail below. Alternatively, this secondary library is generated empirically; that is, the combination is empirically generated using nucleic acid reconstitution techniques. This can be done in various ways as described below.

【0082】 好ましい実施態様では、二次ライブラリーの異なる蛋白質メンバーを化学的に
合成できる。これは、設計した蛋白質が短いものである場合、好ましくは150
アミノ酸長以下のものである場合、より好ましくは100アミノ酸長以下である
場合、特に好ましくは50アミノ酸長以下である場合に特に有用である(蛋白質
だし、当業界で知られているように、化学的にまたは酵素的により長い蛋白質も
調製し得る)。例えば、参照して本明細書の一部とすることを明記する Wilken
et al, Curr. Opin. Biotevhnol. 9: 412-26 (1998) 参照。
In a preferred embodiment, different protein members of the secondary library can be chemically synthesized. This is preferably 150 when the designed protein is short.
It is particularly useful when the amino acid length is less than or equal to the amino acid length, more preferably 100 amino acid length or less, and particularly preferably 50 amino acid length or less (a protein, as known in the art, chemically. Longer proteins may be prepared either enzymatically or enzymatically). Wilken, for example, which is explicitly incorporated by reference
See et al, Curr. Opin. Biotevhnol. 9: 412-26 (1998).

【0083】 好ましい実施態様では、特により長い蛋白質について、または大型サンプルが
望まれる蛋白質について、二次ライブラリー配列を、メンバー配列をコードして
おり、そして宿主細胞中にクローン化し、所望なら発現させ分析し得るDNAの
ような核酸類を創り出すために使用する。このようにして、核酸類および特にD
NAは、メンバー蛋白質配列をコードしているように調製し得る。これは周知の
操作を用いて実施できる。コドン、適切な発現ベクター、および適した宿主の選
択は、各種要因によって変り、また必要に応じて容易に最適化し得る。
In a preferred embodiment, a secondary library sequence encodes a member sequence and is cloned into a host cell and expressed if desired, particularly for longer proteins, or for proteins for which large samples are desired. It is used to create nucleic acids such as DNA that can be analyzed. Thus, nucleic acids and especially D
NA can be prepared to encode a member protein sequence. This can be done using known procedures. The choice of codon, appropriate expression vector, and appropriate host will depend on a variety of factors and can be readily optimized as needed.

【0084】 好ましい実施態様では、図1に一般的に示しているように、プールしたオリゴ
ヌクレオチド群を用いる複数のPCR反応を実施する。この実施態様では、完全
長遺伝子に対応する重なり合ったオリゴヌクレオチド群を合成する。これらのオ
リゴヌクレオチド群は、さらに、各変異位置またはサブセットにおいて異なるア
ミノ酸の全てを現し得る。 好ましい実施態様では、これらのオリゴヌクレオチド群を等しい割合でプール
し、複数のPCR反応を実施して、二次ライブラリーで定義された変異の組合わ
せを含有する完全長配列群を創り出す。
In a preferred embodiment, multiple PCR reactions with pooled oligonucleotides are performed, as is generally shown in FIG. In this embodiment, overlapping oligonucleotides corresponding to the full length gene are synthesized. These oligonucleotides may also represent all of the different amino acids at each mutation position or subset. In a preferred embodiment, these oligonucleotides are pooled in equal proportions and multiple PCR reactions are performed to create full-length sequences containing the combination of mutations defined in the secondary library.

【0085】 好ましい実施態様では、確率分布表に対応する各相対量の異種オリゴヌクレオ
チド群を加える。これら複数のPCR反応は、このようにして、所望の各変異の
組合わせを所望の各割合で有する完全長配列群を生成する。 必要となるオリゴヌクレオチド群の総数は、変異させる位置の数とそれらの位
置で考えられる変異数との関数である。 (各定位置に対するオリゴ数)+M1+M2+M3+・・・・Mn=(必要オリ
ゴの総数)、但し、Mnはその配列のn位において考えられる変異数である。
In a preferred embodiment, each relative amount of the heterologous oligonucleotide group corresponding to the probability distribution table is added. These multiple PCR reactions thus produce a set of full-length sequences having each desired combination of mutations in each desired proportion. The total number of oligonucleotides required is a function of the number of positions to mutate and the number of possible mutations at those positions. (Number of oligos for each fixed position) + M1 + M2 + M3 + ... Mn = (total number of oligos required), where Mn is the number of possible mutations at the n-position of the sequence.

【0086】 好ましい実施態様では、各重なり合っているオリゴヌクレオチドは、変異させ
ようとする位置を1つだけ含むが;別の実施態様では、変異位置群が互いに非常
に近接してこれを可能としており、各オリゴヌクレオチド当たり複数の変異を使
用して可能性のある全ての完全な組換えを可能とする。即ち、各オリゴは、変異
させようとする単一位置に対するか、または変異させようとする1以上の位置に
対するコドンを含有し得る。変異させようとするこれらの複数位置は、オリゴの
長さが機能し得なくなるのを防ぐために、配列内で近接していなければならない
。あるオリゴヌクレオチド上の複数の変異位置に対して、特定の変異組み合わせ
をコードしているオリゴヌクレオチドを導入または排除することにより、該組み
合わせをそのライブラリー中で導入または排除できる。必要となるオリゴヌクレ
オチドの総数は、複数の変異可能位置が単一のオリゴヌクレオチドによりコード
されているとき、増加する。各アニール化した領域は不変であった部位、即ち、
参考配列の配列を有する部位である。
In a preferred embodiment, each overlapping oligonucleotide contains only one position to be mutated; in another embodiment, the mutation sites are in close proximity to each other to allow this. Using multiple mutations for each oligonucleotide, allows for all possible complete recombination. That is, each oligo may contain codons for a single position to be mutated or for one or more positions to be mutated. These multiple positions to be mutated must be contiguous within the sequence to prevent the length of the oligo from failing. By introducing or eliminating oligonucleotides encoding a particular mutation combination at multiple mutation positions on an oligonucleotide, the combination can be introduced or excluded in the library. The total number of oligonucleotides required increases when multiple mutable positions are encoded by a single oligonucleotide. Each annealed region is the unchanged part, i.e.
It is a site having the sequence of the reference sequence.

【0087】 コドンを挿入または除去したオリゴヌクレオチド群を使用して、長さが異なる
蛋白質を発現するライブラリーを創り出すことができる。特に、挿入または除去
のためのコンピューター処理配列スクリーニングにより、長さが異なる蛋白質を
定義する二次ライブラリーを生成させることができ、それらの蛋白質は、長さが
異なるプールしたオリゴヌクレオチドのライブラリーにより発現させ得る。
Oligonucleotides with or without codon insertions can be used to create libraries expressing proteins of different lengths. In particular, computerized sequence screening for insertions or deletions can generate secondary libraries that define proteins of different lengths, which proteins are expressed by a library of pooled oligonucleotides of different lengths. Can be expressed.

【0088】 好ましい実施態様では、エラーを起しやすい(error-prone)PCRを実施して
二次ライブラリーを生成させる。米国特許Nos.5605793、58112
38、および5830721参照(それらの全部を参照して本明細書の一部とす
る)。これは、ライブラリーの最適配列またはトップメンバー群上で実施できる
。この実施態様では、一次ライブラリーのコンピューター処理スクリーニングで
見出した最適配列に対する遺伝子を合成できる。それから、エラーを起しやすい
PCRを、二次ライブラリーの変異位置で変異をコードしているオリゴヌクレオ
チド群(偏向している(bias)オリゴヌクレオチド群)の存在下に、最適配列遺伝
子上で実施できる。オリゴヌクレオチド群を加えることにより、二次ライブラリ
ー中への変異の導入に有利となる偏向が創り出される。あるいは、ある種の変異
に対するオリゴヌクレオチド群のみがライブラリーを偏向させるのに使用できる
In a preferred embodiment, error-prone PCR is performed to generate a secondary library. US Patent No. 5605793, 58112
38, and 5830721, all of which are incorporated herein by reference. This can be done on the optimal sequence or top member group of the library. In this embodiment, the gene for the optimal sequence found in the computational screening of the primary library can be synthesized. Then, error-prone PCR is performed on the optimal sequence gene in the presence of oligonucleotides encoding mutations (biased oligonucleotides) at mutation positions in the secondary library. it can. The addition of oligonucleotides creates a bias that favors the introduction of mutations into the secondary library. Alternatively, only oligonucleotides for certain mutations can be used to bias the library.

【0089】 好ましい実施態様では、偏向しているオリゴヌクレオチド群の存在下に、エラ
ーを起しやすいPCRによる遺伝子の切り混ぜを遺伝子上で最適配列に対して実
施し、二次ライブラリー中に見出される各変異の割合を反映しているDNA配列
ライブラリーを創り出すことができる。偏向しているオリゴヌクレオチド群の選
択は、各種の方法で実施できる;それらは、それらの頻度に基づいて選択できる
、即ち、高い変異頻度の位置群をコードしているオリゴヌクレオチド群を使用で
き;あるいは、最も変異しやすい位置群を含有するオリゴヌクレオチド群を使用
でき、そのようにして多様性を増加でき;もし二次ライブラリーがランクされた
なら、トップスコアの位置群の一部を、偏向しているオリゴヌクレオチド群の生
成に使用でき;ランダムな位置群を選択することもでき;僅かのトップスコア群
および僅かの低スコア群も選択し得る;等である。重要なことは、好ましい変異
位置および配列に基づいて新規な配列を生成させることである。
In a preferred embodiment, error-prone PCR gene truncation is performed on the gene for optimal sequence in the presence of biased oligonucleotides and is found in a secondary library. A DNA sequence library can be created that reflects the proportion of each mutation that is made. The selection of biased oligonucleotides can be performed in a variety of ways; they can be selected based on their frequency, ie, oligonucleotides encoding high mutation frequency loci can be used; Alternatively, oligonucleotides containing the most mutated loci can be used, thus increasing diversity; if the secondary library is ranked, then some of the top-scoring loci are biased. Can be used to generate a group of oligonucleotides that are active; random position groups can also be selected; only a few top scoring groups and a few low scoring groups can be selected; and so on. What is important is to generate a new sequence based on the preferred mutation position and sequence.

【0090】 好ましい実施態様では、二次ライブラリーをコンピューター処理により巧みに
再操作して別の二次ライブラリーを形成させることができる。例えば、任意の二
次ライブラリー配列を、第1二次ライブラリー中の変化位置の一部または全てを
凍結または固定することにより、PDAの第2ラウンド用に選択できる。あるい
は、最後の確率分布表中にみられる変化のみを可能とする。あるいは、確率表の
ストリンジェンシイを、加入に対するカットオフを増加させるかまたは減少させ
るかの何れかにより変更することができる。同様にして、二次ライブラリーを第
1ラウンド後に実験的に組換えることもできる;例えば、最良遺伝子/第1スク
リーン由来の遺伝子群、を採取し、遺伝子組み立てを再実施する(以下に概説す
る技術、複数PCR、エラーを起しやすいPCR、切り混ぜ、等を使用して)。
あるいは、一部の位置における確率を変更するための、1種またはそれ以上の良
好遺伝子(群)由来のフラグメント。これは、第1ラウンドのコンピューター処
理のおよび実験的スクリーニングにおいて見出された配列スペースの領域につい
ての探索を偏らせる。
In a preferred embodiment, the secondary library can be skillfully reengineered to form another secondary library by computer processing. For example, any secondary library sequence can be selected for the second round of PDA by freezing or fixing some or all of the changed positions in the first secondary library. Alternatively, only the changes found in the last probability distribution table are allowed. Alternatively, the stringency of the probability table can be modified by either increasing or decreasing the cutoff for recruitment. Similarly, a secondary library can be experimentally recombined after the first round; eg, the best genes / genes from the first screen are picked and reassembled (as outlined below). Using techniques, multiple PCR, error-prone PCR, shuffling, etc.).
Alternatively, a fragment from one or more good gene (s) to alter the probability at some positions. This biases the search for regions of sequence space found in the first round of computational and experimental screening.

【0091】 本明細書中で概説しているように、これらの方法において、酵素活性、安定性
、溶解性、凝集性、結合親和性、結合特異性、基質特異性、構造的完全性、免疫
原性、毒性、ペプチドおよび擬ペプチドライブラリーの生成、新規抗体CDR'
sの創出、新規DNAの生成、RNA結合、等を含む、がそれらに限定されない
、任意の数の蛋白質属性を改変できる。
In these methods, as outlined herein, enzymatic activity, stability, solubility, aggregability, binding affinity, binding specificity, substrate specificity, structural integrity, immunity Originating, toxicity, generation of peptide and pseudopeptide libraries, novel antibody CDR '
Any number of protein attributes can be modified, including but not limited to the creation of s, the generation of new DNA, RNA binding, and the like.

【0092】 これらの方法で利用した治療的蛋白質は、免疫原性応答を誘発するかもしれな
い該蛋白質の分子表面における変化を防ぐために、疎水性コア群中にスクリーン
した残基を選択的に有するだろうことに留意さるべきである。これらの治療的蛋
白質は、それらの結合部位を取り巻く領域をレセプターに対応するように設計す
ることもできる。それらの領域は、例えば、全ての残基をある距離内、例えば、
結合部位残基の4.5Å内とすることを設計に含めることにより定義できる。こ
の範囲は、4から6Åまで変えることができる。この設計は、酵素の活性および
特異性を改良することに役立ち得る。
Therapeutic proteins utilized in these methods selectively have screened residues in the hydrophobic core group to prevent alterations at the molecular surface of the protein that may elicit an immunogenic response. It should be kept in mind. These therapeutic proteins can also be designed so that the regions surrounding their binding sites correspond to receptors. These regions are, for example, all residues within a certain distance, for example,
It can be defined by including it within 4.5 Å of the binding site residue in the design. This range can vary from 4 to 6Å. This design can help improve the activity and specificity of the enzyme.

【0093】 好ましい実施態様では、本発明の方法は、既知の骨格蛋白質についてではなく
、ランダムなペプチド群について、安定な立体構造を与えると思われるこれらの
配列に対するバーチャルライブラリーを探索するために使用する。上述したよう
に、現時点での関心と興味は、ランダムペプチドライブラリーをスクリーニング
して新しい結合/モジュレーターを見出すことに注がれている。しかしながら、
これらの実験的ライブラリーにおける配列は、特定の部位においてのみか、また
は該配列の全域においてランダム化され得る。これらのライブラリー中で探索し
得る配列数は、ランダム化される位置の数に応じて指数的に増加する。概して言
えば、実験室の物理的制約(機器サイズ、多数のバイオポリマー製造コスト、等
)のために、ライブラリー中に1012―1015配列しか含めることができな
い。他の実際的配慮により、ライブラリーのサイズはしばしば10またはそれ
以下に限定される。これらの限界は10アミノ酸位置のみに到達する。それ故、
実験的配列ライブラリー中で、配列のまばらなサンプリングによる改良蛋白質ま
たはペプチドの探索だけが可能であり、そのため成功するチャンスを低くし、か
つほぼ確実に有望候補を見逃している。これらの配列中での変化はランダム性で
あり、そのために、このライブラリー中の候補の大部分は不適となり、ライブラ
リーを生成させた努力の多くが無駄に費やされる結果となる。
In a preferred embodiment, the method of the invention is used to search a virtual library for those sequences that are believed to give a stable conformation for a random group of peptides, but not for known scaffold proteins. To do. As noted above, current interest and interest is focused on screening random peptide libraries to find new binding / modulators. However,
The sequences in these experimental libraries can be randomized only at specific sites or across the sequences. The number of sequences that can be searched in these libraries increases exponentially with the number of randomized positions. Generally speaking, due to physical limitations of the laboratory (equipment size, large number of biopolymer manufacturing costs, etc.), only 10 12 -10 15 sequences can be included in the library. Other practical considerations often limit the size of libraries to 10 6 or less. These limits reach only 10 amino acid positions. Therefore,
Only sparse sampling of sequences can be sought in experimental sequence libraries for improved proteins or peptides, thus reducing the chance of success and almost certainly missing promising candidates. The changes in these sequences are random, which makes most of the candidates in this library unsuitable, resulting in wasted much of the effort that generated the library.

【0094】 しかしながら、本明細書中に概説するオートメーション化した蛋白質設計技術
を使用することにより、実験的ライブラリーよりはるかに多くの、蛋白質配列の
バーチャルライブラリーを生成させることができる。1075にも及ぶ候補配列
がコンピューター処理でスクリーニングでき、しかもそれらは安定かつ機能的蛋
白質を容易に選択できる利点のある設計基準を満たすものである。バーチャルラ
イブラリースクリーニングにより見出した、有望候補群から成る実験的ライブラ
リーを、次いで生成させ、さらに効率的な実験的ライブラリーの使用をもたらし
、ランダム蛋白質ライブラリーの限界を克服することができる。このように、本
発明の方法は、ペプチドについて特定構造を取りつけるようにランダム蛋白質の
セットをバーチャルスクリーニングすることを可能とし、かくして、それらのペ
プチドを調製しテストすることなく、好ましくないかまたは許容されない立体配
置の大部分を排除することを可能とする。
However, using the automated protein design techniques outlined herein, it is possible to generate much more virtual libraries of protein sequences than experimental libraries. As many as 10 75 candidate sequences can be computationally screened, yet they meet the design criteria of advantage in that stable and functional proteins can be easily selected. An experimental library of promising candidate groups, found by virtual library screening, can then be generated, resulting in a more efficient use of experimental libraries and overcoming the limitations of random protein libraries. Thus, the method of the present invention allows virtual screening of a set of random proteins to attach specific structures for peptides, thus making them unfavorable or unacceptable without preparing and testing those peptides. It is possible to eliminate most of the configuration.

【0095】 上述のように、下記2点の本質的利点がバーチャルライブラリースクリーニン
グにより得られる:(1)オートメーション化した蛋白質設計が、設計基準を満
たす有望な配列候補のリストを作成すること:それはまた、該配列中のどの位置
が容易に変化し得るものであり、どの位置が変化させ難いものであるかを蛋白質
の安定性および機能を破壊することなく示すこと。容易に変化し得る、非破壊的
配列位置においてのみランダム化された、実験的ランダムライブラリーを生成し
得ること。(2)これらの位置におけるアミノ酸の多様性を、それらの位置にオ
ートメーション化した蛋白質設計が適合性を示し得る程度まで限定し得ること。
このように、ランダム化位置の数およびそれらの位置における可能性の数を制限
することにより、実験的ライブラリーで産生される無駄となる配列の数を減少さ
せ、そのようにして、有用な性質を有する配列を見出すことに成功する確率を増
加させること。
As mentioned above, the following two essential advantages are obtained by virtual library screening: (1) Automated protein design produces a list of promising sequence candidates that meet the design criteria: In addition, indicate which position in the sequence can be easily changed and which position is difficult to change without destroying the stability and function of the protein. The ability to generate an experimental random library, randomized only at non-disruptive sequence positions that can be easily varied. (2) To be able to limit the diversity of amino acids at these positions to the extent that automated protein design at those positions may be compatible.
Thus, by limiting the number of randomized positions and the number of possibilities at those positions, the number of wasted sequences produced in the experimental library is reduced and, in this way, useful properties. Increasing the probability of successfully finding an array with.

【0096】 例えば、下表は、ある蛋白質の12の位置におけるバーチャルスクリーニング
による10の有望配列候補をリスト化している。それは、9位、10位および1
2位が、蛋白質の機能を破壊せずに最も変化させ易いようであること、9位、1
0位および12位をランダム化するランダム実験ライブラリーではより多数の所
望配列画分を有するだろうことを示している。。さらに、バーチャルライブラリ
ーにより、10位が最もIleまたはPhe残基と適合性であること、ライブラ
リーサイズをさらに限定し、より完全な良好配列のスクリーニングを可能とする
ことを示唆している。
For example, the table below lists 10 potential sequence candidates by virtual screening at 12 positions for a protein. It's 9th, 10th and 1st
2nd position is most likely to change without destroying protein function, 9th position, 1
It has been shown that random experimental libraries that randomize positions 0 and 12 will have a higher number of desired sequence fractions. . In addition, a virtual library suggests that position 10 is most compatible with Ile or Phe residues, further limiting the library size and allowing a more complete screening of good sequences.

【0097】[0097]

【表1】 [Table 1]

【0098】 このオートメーション化設計法は、配列のスクリーニングに物理化学的基準を
使用し、安定で、組み立ててあるような、かつ必要なら機能を保存している配列
を生じる。別の設計基準を使用して、荷電、溶解性、活性部位性質(極性、サイ
ズ)のような性質を偏向させた、またはある位置である種のアミノ酸を有するよ
うに偏向させた、候補セットを生成させることもできる。即ち、バイオ活性な候
補物質および候補核酸を、完全にランダム化するか、またはそれらのランダム化
を、例えば、ヌクレオチド/残基頻度(全体的または位置毎の)において偏向さ
せるかのいずれかで、ランダム化する。本明細書中では、「ランダム化」または
その文法的同義語により、各核酸およびペプチドが、本質的にランダムなヌクレ
オチドおよびアミノ酸からそれぞれ構成されていることを意味する。従って、任
意のアミノ酸残基を任意の位置に導入し得る。ランダム化したペプチド類および
/または核酸類を生成させる合成プロセスを設計し、全てのまたは大部分の可能
性ある組み合わせを、核酸の長さに形成させることを可能とし、かくして、ラン
ダム化した核酸候補のライブラリーを形成させることができる。
This automated design method uses physicochemical criteria for screening the sequences and results in sequences that are stable, assembled and, if necessary, preserve function. Using another design criterion, a set of candidates is biased for properties such as charge, solubility, active site properties (polarity, size) or biased to have certain amino acids at certain positions. It can also be generated. That is, either the bioactive candidate substances and candidate nucleic acids are completely randomized or their randomization is biased, for example, in nucleotide / residue frequency (global or position-wise), Randomize. By "randomized" or its grammatical synonyms, it is meant herein that each nucleic acid and peptide is composed of essentially random nucleotides and amino acids, respectively. Therefore, any amino acid residue can be introduced at any position. Designing synthetic processes to generate randomized peptides and / or nucleic acids, allowing all or most possible combinations to be formed into nucleic acid lengths, thus randomized nucleic acid candidates Can be formed into a library of.

【0099】 ある実施態様では、ライブラリィを、配列優勢なしに、または任意の位置での
不変なしに、十分ランダム化する。好ましい態様において、ライブラリィは偏向
している。すなわち、配列内のある位置が一定に保たれるか、または限られた数
の可能性から選択される。例えば、好ましい態様において、例えば、疎水性アミ
ノ酸、親水性残基、立体的偏向(小または大)残基のヌクレオチドまたはアミノ
酸残基は定義されたクラス内で、架橋のためのシステイン、SH−3ドメインの
ためのプロリン、ホスホリル化部位のためのセリン、スレオニン、チロシンまた
はヒスチジン等の創造に向けて、またはプリンのために等、ランダム化される。
In some embodiments, the library is fully randomized without sequence dominance or invariance at any position. In a preferred embodiment, the library is biased. That is, some position in the sequence is kept constant or is selected from a limited number of possibilities. For example, in a preferred embodiment, for example, hydrophobic amino acids, hydrophilic residues, nucleotides or amino acid residues of sterically biasing (small or large) residues are within defined classes, cysteine for crosslinking, SH-3. Randomized towards the creation of proline for domains, serine for phosphorylation sites, threonine, tyrosine or histidine etc. or for purines etc.

【0100】 好ましい態様において、この偏向は既知のクラスの分子と相互作用するペプチ
ドまたは配位子に向かう。例えば、多くの細胞内シグナル伝達が、小ペプチドド
メインを通って、他のポリペプチドと相互作用するポリペプチドの短領域を介し
て行われることは既知である。例えば、HIV−1エンベロープ細胞質ドメイン
由来の短領域は、前に細胞内カルモジュリンの作用を遮断することが示されてい
る。Waspsからのマストパラン毒素に相同性を示すFas細胞質ドメインを
、死誘導アポトーシスまたはGタンパク質誘導機能を有する短ペプチド領域に限
定できる。Xenopus由来の天然ペプチドであるマゲイニンは、強い抗腫瘍
および抗微生物活性を有する。プロテインキナーゼCイソザイム(βPKC)の
短ペプチド断片は、刺激に続くXenopus卵母細胞におけるβPKCの核翻
訳を遮断することが示されている。そして、短SH−3標的ペプチドは、SH−
3タンパク質への特異的結合の偽基質として使用されている。これは、もちろん
、生物活性を有する利用可能なペプチドについての簡単な記述である。この分野
には多数の文献がある。このように、小ペプチドが細胞内シグナル伝達カスケー
ドを有する可能性に関して、多くの先行物がある。加えて、多くの分子のアゴニ
ストおよびアンタゴニストを同様にペプチドの偏向ランダム化の基本として使用
し得る。
In a preferred embodiment, this bias is towards peptides or ligands that interact with known classes of molecules. For example, it is known that many intracellular signalings occur through small peptide domains and through short regions of the polypeptide that interact with other polypeptides. For example, a short region from the HIV-1 envelope cytoplasmic domain has previously been shown to block the action of intracellular calmodulin. The Fas cytoplasmic domain homologous to mastoparan toxin from Wasps can be restricted to short peptide regions with death-induced apoptosis or G-protein inducing function. Magainin, a natural peptide from Xenopus, has strong antitumor and antimicrobial activity. A short peptide fragment of protein kinase C isozyme (βPKC) has been shown to block nuclear translation of βPKC in Xenopus oocytes following stimulation. And, the short SH-3 target peptide is SH-
It has been used as a pseudosubstrate for specific binding to 3 proteins. This is, of course, a brief description of available peptides with biological activity. There are numerous publications in this area. Thus, there are many precursors regarding the potential of small peptides to have intracellular signaling cascades. In addition, agonists and antagonists of many molecules can be used as the basis for bias randomization of peptides as well.

【0101】 プレスクリーンしたランダム化ペプチドライブラリーの生成は、一般的に、下
記のように記述できる。既知構造であるかどうかを問わず、例えば、既知蛋白質
の部分、既知ペプチド、または合成的構造等、全ての構造をPDAの骨格として
使用できる。例えば、X線クリスタログラフィック技法、NMR技法、デノボモ
デリング、相同性モデリング、等で得た構造を全て、所望の配列に対する骨格を
得るのに使用できる。同様に、多数の分子または蛋白質ドメインも、偏向させラ
ンダム化した候補生物活性物質のための出発点として適している。共通の機能、
構造または親和性を与える、多数の小分子ドメインが知られている。加えて、当
業界では明らかなように、アミノ酸相同性の弱い領域は、強い構造的相同性を有
し得る。これらの分子、ドメイン、および/または対応するコンセンサス配列は
多数知られており、それらには、SH−2ドメイン、SH−3ドメイン、プレッ
クストリン、死のドメイン、プロテアーゼ開裂/認識部位、酵素阻害剤、酵素基
質、トラフ等が含まれるが、それらに限定されない。同様に、本発明での使用に
適したドメインを含有している多数の既知核酸結合蛋白質がある。例えば、ロイ
シンジッパーコンセンサス配列が知られている。
Generation of a prescreened randomized peptide library can generally be described as follows. Regardless of whether or not it has a known structure, for example, all structures such as a known protein portion, a known peptide, or a synthetic structure can be used as the backbone of PDA. For example, structures obtained by X-ray crystallographic techniques, NMR techniques, de novo modeling, homology modeling, etc. can all be used to obtain the scaffold for the desired sequence. Similarly, a large number of molecular or protein domains are also suitable as starting points for biased and randomized candidate bioactive agents. Common features,
A large number of small molecule domains are known that provide structure or affinity. In addition, as will be appreciated in the art, regions of weak amino acid homology may have strong structural homology. Many of these molecules, domains, and / or corresponding consensus sequences are known, including SH-2 domains, SH-3 domains, pleckstrins, death domains, protease cleavage / recognition sites, enzyme inhibitors. , Enzyme substrates, troughs, etc., but are not limited thereto. Similarly, there are numerous known nucleic acid binding proteins that contain domains suitable for use in the present invention. For example, the leucine zipper consensus sequence is known.

【0102】 従って、一般に、既知ペプチドリガンド類を、一次ランダム化を生成させるた
めの出発骨格として使用できる。 加えて、ある種の立体配置に載ることが既知である構造も、骨格を創り出し、
そして配列をそのような立体配置に載るように思われるものについてスクリーニ
ングするのに使用することができる。例えば、多様な既知「ミニ構造」、時には
「表現構造」とも呼ばれる、があるが、それらは立体配置的安定性を与えるか、
またはランダム配列立体配置限定形態を与え得るものである。蛋白質は互いに主
として立体構造的に窮屈なドメインを介して他と相互作用する。自由回転アミノ
酸とカルボキシル末端とを有する小型ペプチド類は、当業界で知られているよう
に、強力な官能性を有し得るが、それらのペプチド構造を薬理学的作用成分へ変
換するのは、擬ペプチド性合成のための側鎖位置を予測することができないため
に困難である。それ故、立体構造的に窮屈な構造のペプチド類の提示は、後日の
医薬生成に役立つであろうし、また該ペプチドの標的蛋白質とのより高度な親和
性相互作用を導くであろう。この事実は、バクテリオファージ系で生物学的に生
成させた短いペプチドを使用する集積ライブラリー生成系で認められている。多
数の研究者が、内部にランダム化したペプチド構造を提示したかもしれない小型
ドメイン分子を構築している。
Thus, in general, known peptide ligands can be used as a starting scaffold to generate a first order randomization. In addition, structures that are known to be in certain configurations create skeletons,
The sequence can then be used to screen for those that appear to fall in such a configuration. For example, there are various known "ministructures," sometimes referred to as "expressive structures," which either confer configurational stability or
Alternatively, it is possible to provide a configuration in which the random arrangement is restricted. Proteins interact with each other primarily through conformationally tight domains. Small peptides having free-rotating amino acids and a carboxyl terminus can have powerful functionalities, as is known in the art, but converting their peptide structure into a pharmacologically active ingredient is Difficult due to the unpredictability of side chain positions for pseudo-peptidic synthesis. Therefore, the presentation of conformationally constrained peptides will aid in later drug production and will lead to higher affinity interactions of the peptides with their target proteins. This fact is observed in an integrated library generation system that uses short peptides biologically generated in the bacteriophage system. Numerous researchers have constructed small domain molecules that may have internally displayed randomized peptide structures.

【0103】 このように、合成提示構造、すなわち人工ポリペプチド、は、立体配置的に制
限された領域としてランダム化されたペプチドを提示することができる。好まし
い提示構造は、外部ループの上でそれを提示することによってペプチドへの接触
性を最大にするものである。従って、適切な提示構造として、限定するものでは
ないが、ミニボデー(minibody)構造、ベータシートターン上のループおよびコイ
ル状にまかれたコイルシステム構造(構造上重要でない残基がランダム化された
もの)、亜鉛フィンガー領域、システインが結合した(ジスルフィド)構造、トラ
ンスグルタミナーゼ結合構造、環状ペプチド、B-ループ構造、らせん状バレル
またはバンドル、ロイシンジッパーモチーフ等が含まれる。
Thus, synthetic presentation structures, ie, artificial polypeptides, can present randomized peptides as conformationally restricted regions. Preferred presentation structures are those that maximize accessibility to the peptide by presenting it on the outer loop. Thus, suitable presentation structures include, but are not limited to, minibody structures, loops on beta sheet turns and coiled coil system structures (randomized residues that are not structurally significant). ), Zinc finger region, cysteine-bonded (disulfide) structure, transglutaminase binding structure, cyclic peptide, B-loop structure, helical barrel or bundle, leucine zipper motif, and the like.

【0104】 好ましい態様として、この提示構造はコイル状にまかれたコイル構造であり、
外部ループ上でランダム化されたペプチドを提示する。例えば"Myszka et al.,
Biochem. 33:2362-2373 (1994)参照、出典明示および図3により本明細書に組込
まれている)。このシステムを使用して、研究者らは、単離ペプチドを適切な標
的と高度に親和性の相互作用をなし得るようにした。一般に、コイル状にまかれ
たコイル構造は、6位から20位の間でランダム化される;(Martin et al., EM
BO J. 13(22):5303-5309 (1994)参照、出典明示により組み込まれている)。
In a preferred embodiment, the presenting structure is a coiled coil structure,
Presents randomized peptides on the outer loop. For example, "Myszka et al.,
Biochem. 33: 2362-2373 (1994), incorporated herein by reference and FIG. 3). Using this system, researchers have enabled isolated peptides to make high affinity interactions with appropriate targets. In general, coiled coil structures are randomized between positions 6 and 20; (Martin et al., EM
See BO J. 13 (22): 5303-5309 (1994), incorporated by reference).

【0105】 好ましい態様として、この提示構造はミニボデー構造である。"ミニボデー"と
は、基本的に、最小の抗体相補的な領域からなる。このミニボデー提示構造は、
一般に、折り畳まれたタンパク質が三次構造の単一の表面に沿って提示される、
2種のランダム化領域を提供する。例えばBianchi et al., J. Mol. Biol. 236(
2):649-59 (1994)およびその中の出典明示参照、これらすべては出典明示により
本明細書に組込まれている)。研究者らは、この最小ドメインが溶液中で安定で
あることを示し、そして組合せライブラリー中でファージ選択システムを使用し
て炎症誘発性サイトカインIL6に対して高度な親和性(Kd=10-7)を示すペプチ
ド領域を有するミニボデーを選択した。
In a preferred embodiment, the presentation structure is a minibody structure. A "minibody" basically consists of the smallest antibody complementary region. This mini body presentation structure is
In general, folded proteins are displayed along a single surface of tertiary structure,
Two types of randomized areas are provided. For example, Bianchi et al., J. Mol. Biol. 236 (
2): 649-59 (1994) and references therein, all of which are incorporated herein by reference). Researchers have shown that this minimal domain is stable in solution, and have a high affinity (Kd = 10 −7) for the proinflammatory cytokine IL6 using the phage selection system in combinatorial libraries. A minibody having a peptide region showing) was selected.

【0106】 一旦、骨格鎖を選択し、ランダム・ペプチドの一次ライブラリーを上記のよう
に生成させると、既知骨格タンパク質に関して二次ライブラリーの生成および創
製が進行する:これは変異位置および/またはアミノ酸残基の組換えを含み、コ
ンピューター処理でまたは実験的に行なう。さらに、自動化タンパク質設計方法
で定義された、タンパク質配列を発現するDNAライブラリーを調製してもよい
。コドンを、自動化設計方法で特定された残基位置を明示するヌクレオチド配列
トリプレットでのみランダム化することもできる。また、特定のアミノ酸をコー
ドする基底トリプレットの混合物をDNA合成反応中へ導入し、1の反応工程中
で完全トリプレットを明示するアミノ酸に付着させることができる。また、一定
のアミノ酸に関して所望の位置に偏った、または一定のアミノ酸にその位置を限
定する、ランダムDNAオリゴマーのライブラリーを設計する。偏向したアミノ
酸は、バーチャルスクリーニング、またはそれらのサブセットで特定されるであ
ろう。
Once the backbone chains have been selected and the primary library of random peptides generated as described above, the generation and creation of secondary libraries for known backbone proteins proceeds: this is at the mutation site and / or It involves the recombination of amino acid residues and is done by computer processing or experimentally. Furthermore, a DNA library expressing a protein sequence defined by the automated protein design method may be prepared. Codons can also be randomized only with nucleotide sequence triplets that specify residue positions identified by automated design methods. Also, a mixture of basal triplets encoding specific amino acids can be introduced into the DNA synthesis reaction to attach the complete triplet to the amino acids that exhibit it in one reaction step. We also design a library of random DNA oligomers that are biased toward a desired position with respect to a given amino acid or that limit the position to a given amino acid. Biased amino acids will be identified in a virtual screen, or a subset thereof.

【0107】 ある位置においてアミノ酸の異なるサブセットをコードしている多数のDNA
ライブラリーを合成し、コドンを完全にはランダム化せずに所望の多様なアミノ
酸の生成を可能とし、その結果、ライブラリー中の配列を終止コドン、フレーム
シフト、不要アミノ酸などについて、無駄にした。これは、ランダム化しようと
する各位置で、トリプレットのうちの1つまたは2つの位置のみでランダム化さ
れるライブラリーを創作することによって行なうことができ、ここで、変わらず
残った位置(群)は、この位置において考慮されるアミノ酸が共有しているもので
ある。多数のDNAライブラリーを、各位置において所望の全アミノ酸が、集積
したライブラリー中に存在することが保証されるように調製する。
Multiple DNA encoding different subsets of amino acids at certain positions
By synthesizing the library, it was possible to generate a variety of desired amino acids without completely randomizing codons, resulting in wasted sequences in the library for stop codons, frameshifts, unwanted amino acids, etc. . This can be done by creating a library that is randomized at only one or two of the triplets at each position to be randomized, where the remaining positions (group ) Is shared by the amino acids considered at this position. A large number of DNA libraries are prepared such that at each position all desired amino acids are guaranteed to be present in the integrated library.

【0108】 あるいは、頻度作表、および多発性PCR、シャフリング等を含む実験的生成
方法を使用して、ランダム・ペプチドライブラリーを行なってもよい。
Alternatively, random peptide libraries may be performed using frequency tabulation and experimental generation methods including multiplex PCR, shuffling and the like.

【0109】 本発明は、発明を実行するためのコンピューターで読めるメモリー、中央処理
ユニット、関連回路、および他の関連組成物を提供する。本発明の装置は、メモ
リーおよび、入力/出力装置のセット(例えば、キーボード、マウス、モニター、
プリンターなど)26と、バスを介して通じている、中央処理ユニットを含み得
る。中央処理ユニット、メモリー、入力/出力装置および、バス間の一般的な相
互作用は、当分野に知られている。本発明は、自動化タンパク質設計プログラム
およびメモリー中に記憶されている二次ライブラリージェネレーターに向けられ
ている。
The present invention provides computer readable memory, central processing unit, associated circuitry, and other associated compositions for carrying out the invention. The device of the present invention comprises a memory and a set of input / output devices (e.g., keyboard, mouse, monitor,
Printer 26) and a central processing unit communicating via a bus. General interactions between the central processing unit, memory, input / output devices, and buses are known in the art. The present invention is directed to an automated protein design program and a secondary library generator stored in memory.

【0110】 自動化タンパク質設計プログラムおよび/または二次ライブラリージェネレー
ターを、側鎖モジュールに対して行なってもよい。関連出願に詳記されているよ
うに、側鎖モジュールは、選択したタンパク質骨格構造についての、可能性のあ
る回転異性体のグループを確立する。このタンパク質設計プログラムは、ランキ
ングモジュールを用いて実行してもよい。以下に詳記するように、ランキングモ
ジュールはタンパク質骨格構造について回転異性体の相互作用を分析し、最適化
されたタンパク質配列を生成する。このタンパク質設計プログラムは、例えば下
記に示す、タンパク質配列の最適化に関連するモンテカルロ検索などの検索を実
行する、検索モジュールを含んでいてもよい。最終的に、以下に記載するように
、評価モジュールを使用して、得られたタンパク質に関連する物理的パラメータ
を評価してもよい。
Automated protein design programs and / or secondary library generators may be run on the side chain modules. As detailed in the related application, the side chain module establishes a group of potential rotamers for selected protein backbone structures. This protein design program may be executed using a ranking module. As detailed below, the ranking module analyzes rotamer interactions for protein backbone structures and produces optimized protein sequences. The protein design program may include a search module for performing a search such as the Monte Carlo search related to protein sequence optimization shown below. Finally, an evaluation module may be used to evaluate the physical parameters associated with the resulting protein, as described below.

【0111】 このメモリーはタンパク質骨格構造も記憶し、そしてそれは入力/出力装置を
通して使用者がダウンロードできる。このメモリーは、側鎖モジュールによって
得られる、可能性のある回転異性体の情報も記憶する。加えて、このメモリーは
、ランキングモジュールによって生成したタンパク質配列を記憶する。このタン
パク質配列を、入力/出力装置に出力として移してもよい。
This memory also stores the protein backbone structure, which can be downloaded by the user through the input / output device. This memory also stores information on potential rotamers obtained by the side chain module. In addition, this memory stores the protein sequences generated by the ranking module. This protein sequence may be transferred as output to an input / output device.

【0112】 ライブラリーメンバーをコードする本発明の核酸を使用して、様々な発現ベク
ターを調製する。発現ベクターは、自己複製する染色体外ベクター、またはホス
ト遺伝子に組み込まれるベクターのどちらでもよい。一般に、これらの発現ベク
ターは、ライブラリータンパク質をコードする核酸に実施可能に結合した、転写
性および翻訳調節核酸を含む。"調節配列"の用語は、特定のホスト生物体中で実
施可能に結合したコード配列の発現に必要なDNA配列をいう。原核生物に適し
た調節配列として、例えば、プロモーター、所望によりオペレータ配列、そして
リボソーム結合部位が含まれる。真核生物の細胞がプロモーター、ポリアデニル
化シグナル、およびエンハンサーを利用することが知られている。
A variety of expression vectors are prepared using the nucleic acids of the invention that encode library members. The expression vector may be either a self-replicating extrachromosomal vector or a vector integrated into a host gene. Generally, these expression vectors contain transcriptional and translational regulatory nucleic acid operably linked to the nucleic acid encoding the library protein. The term "regulatory sequence" refers to a DNA sequence necessary for the expression of operably linked coding sequences in a particular host organism. The control sequences that are suitable for prokaryotes, for example, include a promoter, optionally an operator sequence, and a ribosome binding site. It is known that eukaryotic cells utilize promoters, polyadenylation signals, and enhancers.

【0113】 核酸が別の核酸配列と機能的関係にある状況に置かれたとき、核酸は「操作可
能的に結合」されている。例えば、前駆配列または分泌リーダーに関するDNA
は、ポリペプチドの分泌に関与する前蛋白質として発現される場合に、ポリペプ
チドに対するDNAに機能しやすいように;プロモーターまたはエンハンサーは
配列の転写に影響する場合にコード配列に操作可能的に結合されている;または
リボソーム結合部位は、翻訳を容易にするような位置にある場合に、コード配列
に操作可能的に結合されている。一般的に、「操作可能的に結合する」とは、該
DNA配列が、隣接していること、および、分泌リーダーの場合、隣接および読
み取り段階であることを意味する。しかし、エンハンサーは、隣接する必要はな
い。結合は、好都合な制限部位でのライゲーションにより達成される。上記部位
が存在しない場合、合成オリゴヌクレオチドアダプターまたはリンカーは、常法
に従い使用される。転写および翻訳調節核酸は、一般に、当業者には公知である
ように、ライブラリー蛋白質の発現に使用される宿主細胞に適合する;例えば、
バチルス(Bacillus)由来の転写および翻訳調節核酸配列は、好ましくはバチル
ス(Bacillus)でのライブラリー蛋白質の発現に使用される。多様な型の適当な
発現ベクター、および適当な調節配列が、様々な宿主細胞に関して当技術分野で
知られている。
Nucleic acid is "operably linked" when it is placed into a functional relationship with another nucleic acid sequence. For example, DNA for precursor sequences or secretory leaders
Is operably linked to the DNA for the polypeptide when expressed as a preprotein involved in the secretion of the polypeptide; a promoter or enhancer is operably linked to the coding sequence when it affects the transcription of the sequence. Or the ribosome binding site is operably linked to the coding sequence when in a position that facilitates translation. Generally, "operably linked" means that the DNA sequences are contiguous, and, in the case of a secretory leader, contiguous and reading steps. However, enhancers do not have to be contiguous. Binding is accomplished by ligation at convenient restriction sites. If the above sites do not exist, synthetic oligonucleotide adapters or linkers are used in accord with conventional practice. Transcriptional and translational regulatory nucleic acids are generally compatible with the host cell used to express the library protein, as is known to those of skill in the art;
Transcriptional and translational regulatory nucleic acid sequences from Bacillus are preferably used for expression of library proteins in Bacillus. Various types of suitable expression vectors, and suitable regulatory sequences are known in the art for different host cells.

【0114】 一般に、転写および翻訳調節配列は、プロモーター配列、リボソーム結合部位
、転写開始および停止配列、翻訳開始および停止配列、およびエンハンサーまた
はアクチベーター配列を含み得るが、これらに限定はされない。好ましい態様に
おいて、調節配列は、プロモーターおよび転写開始および停止配列を含む。
In general, transcriptional and translational regulatory sequences may include, but are not limited to, promoter sequences, ribosome binding sites, transcriptional start and stop sequences, translational start and stop sequences, and enhancer or activator sequences. In a preferred embodiment, the regulatory sequences include a promoter and transcriptional start and stop sequences.

【0115】 プロモーター配列は、構成的または誘導性プロモーター配列を含む。プロモー
ターは、天然プロモーターまたはハイブリッドまたは合成プロモーターであって
よい。1以上のプロモーターの要素をあわせもつハイブリッドプロモーターは、
当業界でも知られており、本発明において有用である。
Promoter sequences include constitutive or inducible promoter sequences. The promoter may be a natural promoter or a hybrid or synthetic promoter. Hybrid promoters that have elements of more than one promoter together
It is also known in the art and is useful in the present invention.

【0116】 さらに、発現ベクターは追加要素を含み得る。例えば、発現ベクターは2つの
複製系を有し得るため、2生物体、例えば発現用の哺乳類または昆虫細胞および
クローニングおよび増幅用の原核生物宿主において維持され得る。さらに、組込
み発現ベクターの場合、発現ベクターは、宿主細胞ゲノムに相同的に少なくとも
1つの配列、および好ましくは発現構築体の両端に接する2つの相同性配列を含
む。組込みベクターは、ベクターでの封入に適した相同性配列を選択することに
より宿主細胞における特定座に指向され得る。組込みベクター用構築体および適
切な選択およびスクリーニングプロトコールは当業界ではよく知られ、例えば、
Mansouret all, Cell, 51:503 (1988) and Murray, Gene Transfer and Express
ion Protocols, Methods in Molecular Biology, Vol. 7 (Clifton: Humana Pre
ss, 1991)に記載されている。
In addition, the expression vector may contain additional elements. For example, expression vectors can have two replication systems and thus can be maintained in two organisms, eg, mammalian or insect cells for expression and prokaryotic hosts for cloning and amplification. Furthermore, in the case of an integrative expression vector, the expression vector comprises at least one sequence homologous to the host cell genome, and preferably two homologous sequences flanking the expression construct. Integrating vectors can be directed to specific loci in the host cell by selecting the appropriate homologous sequences for inclusion in the vector. Constructs for integrative vectors and appropriate selection and screening protocols are well known in the art, for example:
Mansouret all, Cell, 51: 503 (1988) and Murray, Gene Transfer and Express
ion Protocols, Methods in Molecular Biology, Vol. 7 (Clifton: Humana Pre
ss, 1991).

【0117】 さらに、好ましい態様において、発現ベクターは、特に哺乳動物細胞の際に、
ベクターを含まない細胞が一般的に死滅するため、ベクターの安定性を確保し、
形質転換した宿主細胞の選択を可能にする選択遺伝子を含有する。選択遺伝子は
当業界ではよく知られており、使用する宿主細胞により異なる。本明細書中で用
いる「選択遺伝子」は、選択剤に対して耐性を示す遺伝産物をコードする全ての
遺伝子を意味する。適当な選択剤には、それらに限定するものではないが、ネオ
マイシン(もしくは該アナログG418)、ブラスチシジンS、ヒスチニドール
D、ベレオマイシン、ピューロマイシン、ヒグロマイシンBおよび他の薬物が含
まれる。
Furthermore, in a preferred embodiment, the expression vector is, in particular in mammalian cells,
Cells that do not contain the vector will generally die, ensuring the stability of the vector,
It contains a selection gene that allows for selection of transformed host cells. Selection genes are well known in the art and will vary with the host cell used. As used herein, "selection gene" means any gene that encodes a gene product that is resistant to a selection agent. Suitable selection agents include, but are not limited to, neomycin (or the analog G418), blasticidin S, histinidol D, berellomycin, puromycin, hygromycin B and other drugs.

【0118】 好ましい態様では、発現ベクターは、遺伝子発現レベルを増加させるために発
現されるべき遺伝子のRNAスプライシング配列の上流もしくは下流を含む(参
照:Barret et al., Nucleic Acids Res. 1991; Groos et al., Mol. Cell. Bio
l. 1987; and Budiman et al., Mol. Cell. Biol. 1988)。
In a preferred embodiment, the expression vector comprises upstream or downstream of the RNA splicing sequence of the gene to be expressed to increase the level of gene expression (see: Barret et al., Nucleic Acids Res. 1991; Groos et. al., Mol. Cell. Bio
l. 1987; and Budiman et al., Mol. Cell. Biol. 1988).

【0119】 好ましい発現ベクター系は、 Mann et al., Cell, 33:153-9 (1993); Pear et
al., Proc. Natl. Acad. Sci. U.S.A., 90(18):8392-6 (1993); Kitamura et a
l., Proc. Natl. Acad. Sci. U.S.A., 92:9146-50 (1995);Kinsella et al., Hu
man Gene Therapy, 7:1405-13; Hofmann et al.,Proc. Natl. Acad. Sci. U.S.A
., 93:5185-90; Choate et al., Human Gene Therapy, 7:2247 (1996); PCT
/US97/01019 およびPCT/US97/01048に記載されるよ
うなレトロウイルスベクター系であって、明細書中で引用したものは出典明示に
より本明細書の一部とする。
A preferred expression vector system is Mann et al., Cell, 33: 153-9 (1993); Pear et
al., Proc. Natl. Acad. Sci. USA, 90 (18): 8392-6 (1993); Kitamura et a
L., Proc. Natl. Acad. Sci. USA, 92: 9146-50 (1995); Kinsella et al., Hu
man Gene Therapy, 7: 1405-13; Hofmann et al., Proc. Natl. Acad. Sci. USA
., 93: 5185-90; Choate et al., Human Gene Therapy, 7: 2247 (1996); PCT
/ US97 / 01019 and PCT / US97 / 01048, retroviral vector systems as cited in the specification, which are hereby incorporated by reference.

【0120】 本発明のライブラリー蛋白質は、ライブラリー蛋白質を誘導もしくは発現させ
るための適切な条件下で、核酸、好ましくはライブラリー蛋白質をコードする核
酸を含む発現ベクターを用いて形質転換した宿主細胞を培養して産生させる。ラ
イブラリー蛋白質の発現に適切な条件は、発現ベクターおよび宿主細胞の選択に
より変動し、日常的な実験を通じて当業者により容易に確認される。例えば、発
現ベクターにおける構成的プロモーターを使用するには、宿主細胞の成長および
増殖の最適化が必要とされ、誘導プロモーターを使用する場合、誘導に適した成
長条件が必要とされる。さらに、具体例においては、採取のタイミングが重要で
ある。例えば、昆虫細胞発現で使用されるバキュロウイルス系は溶菌ウイルスで
あり、そのため採取時間の選択が生成物の収率にとって重大である。
The library protein of the present invention is a host cell transformed with an expression vector containing a nucleic acid, preferably a nucleic acid encoding the library protein, under suitable conditions for inducing or expressing the library protein. Are cultured and produced. Appropriate conditions for expression of library proteins will vary with the choice of expression vector and host cell and are readily ascertained by one of skill in the art through routine experimentation. For example, the use of constitutive promoters in expression vectors requires optimization of host cell growth and proliferation, and the use of inducible promoters requires growth conditions suitable for induction. Furthermore, in a specific example, the timing of collection is important. For example, the baculovirus system used in insect cell expression is a lytic virus, so the choice of harvest time is critical to product yield.

【0121】 当業者に明らかとなるように、本発明において使用する細胞型は広範囲に変動
する。基本的には、酵母、細菌、古細菌、真菌および昆虫および哺乳類細胞を含
む動物細胞を含む、各種の適当な宿主細胞を用いることができる。特に有利なの
は、ドロソフィラ・メランガスター(Drosophila melangaster)細胞、サッカロ
マイシス・セレヴィシアエ(Saccharomyses cerevisiae)および他の酵母、大腸
菌、枯草菌(Bacillus subtilis)、SF9細胞、C129細胞、293細胞、
ニューロスポラ(Neurospora)、BHK、CHO、COSおよびヒーラ(HeLa)
細胞、線維芽細胞、Schwanoma 細胞系、不死化哺乳類骨髄様およびリンパ様細胞
系、ジャカット(Jurkat)細胞、マスト細胞および他の内分泌性細胞および外分
泌性細胞さらにニューロン細胞である。出典明示により本明細書の一部とするA
TCC細胞系カタログを参照。さらに、当業界で周知のようなファージディスプ
レイ系における二次ライブラリーの発現は、二次ライブラリーがランダムペプチ
ドを含む特別な場合に、特に好ましい。一態様では、該細胞は、外来核酸、例え
ば標的分子を含有するように遺伝子操作し得る。
As will be apparent to those of skill in the art, the cell types used in the present invention will vary widely. In principle, any suitable host cell can be used, including yeast, bacteria, archaea, fungi and animal cells including insect and mammalian cells. Particularly advantageous are Drosophila melangaster cells, Saccharomyses cerevisiae and other yeasts, E. coli, Bacillus subtilis, SF9 cells, C129 cells, 293 cells,
Neurospora, BHK, CHO, COS and HeLa
Cells, fibroblasts, Schwanoma cell lines, immortalized mammalian myeloid and lymphoid cell lines, Jurkat cells, mast cells and other endocrine and exocrine cells as well as neuronal cells. A, which is included in this specification due to clarification of the source
See TCC cell line catalog. Moreover, expression of the secondary library in a phage display system as is well known in the art is particularly preferred in the special case where the secondary library comprises random peptides. In one aspect, the cells can be genetically engineered to contain a foreign nucleic acid, eg, a target molecule.

【0122】 好ましい態様では、ライブラリー蛋白質を、哺乳類細胞中で発現させる。いず
れの哺乳類細胞、マウス、ラット、霊長類を使用してもよく、特にヒトの細胞は
好ましく、当業者には理解されるであろうが、偽型による該系の修飾は、全て真
核細胞、好ましくは高等真核生物に使用され得る。以下により詳しく記載するが
、スクリーンによって、ランダムライブラリーメンバーの存在下で選択し得る表
現系を提示する該細胞を提示されるであろう。さらに以下に記載するが、適当な
スクリーンが、細胞内のライブラリーメンバーの存在によって別の表現型を示す
細胞の選択を可能とするように構築され得る限り、疾病症状の広範囲の変動に影
響を与える細胞型は、特に有用である。
[0122] In a preferred embodiment, the library proteins are expressed in mammalian cells. Any mammalian cell, mouse, rat, primate may be used, especially human cells being preferred and as will be appreciated by those skilled in the art, modifications of the system by pseudotypes are all eukaryotic cells. , Preferably for use in higher eukaryotes. As described in more detail below, a screen will display the cells displaying a selectable phenotype in the presence of random library members. As described further below, as long as a suitable screen can be constructed that allows the selection of cells that display a different phenotype by the presence of intracellular library members, it will affect a wide range of variations in disease symptoms. The cell types given are particularly useful.

【0123】 従って、適切な哺乳動物細胞型は、限定されるものではないが、全ての種類の
腫瘍細胞(特に、黒色腫様、骨髄性白血病、肺癌腫、胸癌腫、卵巣癌腫、大腸癌
腫、腎臓癌腫、前立腺癌腫、膵臓癌腫および精巣癌腫)、心筋細胞、内皮細胞、
上皮細胞、リンパ細胞(T細胞およびB細胞)、マスト細胞、好酸球、血脈管内
膜細胞、神経系、皮膚、肺、腎臓、肝臓および筋軸細胞(分化および脱分化ファ
クターのためのスクリーニングで使用する)、破骨細胞、軟骨細胞および別の連
結組織細胞、ケラチノサイト、メラノサイト、肝臓細胞、腎臓細胞および含脂肪
細胞を包含する。また、適当な細胞は、既知の探査細胞、ジャカット(Jurkat)
T細胞、NIH3T3細胞、CHO、Cosなども包含する。ATCCセルライ
ンカタログを参照(出典明示により本明細書の一部とするが、これらに限定する
ものではない)。
Accordingly, suitable mammalian cell types include, but are not limited to, all types of tumor cells (especially melanoma-like, myeloid leukemia, lung carcinoma, breast carcinoma, ovarian carcinoma, colon carcinoma, Renal carcinoma, prostate carcinoma, pancreatic carcinoma and testicular carcinoma), cardiomyocytes, endothelial cells,
Epithelial cells, lymphocytes (T cells and B cells), mast cells, eosinophils, intimal cells, nervous system, skin, lungs, kidneys, liver and muscle axis cells (screening for differentiation and dedifferentiation factors ), Osteoclasts, chondrocytes and other connective tissue cells, keratinocytes, melanocytes, liver cells, kidney cells and adipocytes. Suitable cells are also known exploratory cells, Jurkat
It also includes T cells, NIH3T3 cells, CHO, Cos and the like. See ATCC Cell Line Catalog (including but not limited to by reference).

【0124】 哺乳類発現系もまた当分野では既知であり、レトロウイルス系を含む。哺乳類
プロモーターは、哺乳類RNAポリメラーゼに結合し、mRNAへのライブラリ
ー蛋白質に関するコード配列の下流(3')転写を開始させ得る全てのDNA配
列である。プロモーターは、通常コード配列の5'末端近位に位置する転写開始
領域、および転写開始部位上流に位置する25−30塩基対を用いたTATAボ
ックスを有する。TATAボックスは、RNAポリメラーゼIIに指令し、正確な
部位でのRNA合成を開始させると考えられている。哺乳類プロモーターはまた
、典型的にはTATAボックスの上流100ないし200塩基対内に位置する、
上流プロモーター要素(エンハンサー要素)を含む。上流プロモーター要素は、
転写開始速度を決定し、いずれかの配向で作用し得る。ウイルス遺伝子は高度発
現されることが多く広い宿主範囲を有するため、哺乳類プロモーターとして特に
有用なのは哺乳類ウイルス遺伝子由来のプロモーターである。例としては、SV
40初期プロモーター、マウス乳癌ウイルスLTRプロモーター、アデノウイル
ス主要後期プロモーター、単純ヘルペスウイルスプロモーター、CMVプロモー
ターを含む。
Mammalian expression systems are also known in the art and include retroviral systems. A mammalian promoter is any DNA sequence capable of binding mammalian RNA polymerase and initiating the downstream (3 ') transcription of a coding sequence for a library protein into mRNA. The promoter has a transcription initiation region usually located proximal to the 5'end of the coding sequence, and a TATA box with 25-30 base pairs located upstream of the transcription initiation site. The TATA box is thought to direct RNA polymerase II to initiate RNA synthesis at the correct site. Mammalian promoters are also typically located within 100 to 200 base pairs upstream of the TATA box,
Contains upstream promoter elements (enhancer elements). The upstream promoter element is
It determines the rate of transcription initiation and can act in either orientation. Since viral genes are often highly expressed and have a wide host range, promoters derived from mammalian viral genes are particularly useful as mammalian promoters. As an example, SV
40 early promoter, mouse mammary tumor virus LTR promoter, adenovirus major late promoter, herpes simplex virus promoter, CMV promoter.

【0125】 典型的には、哺乳類細胞により認識される転写終結およびポリアデニル化配列
は、転写停止コドンに対し3'に配置された調節領域であり、そのためプロモー
ター要素と共存してコード配列の両端に隣接する。成熟mRNAの3'末端は、
部位特異的翻訳後開裂およびポリアデニル化により形成される。転写ターミネー
ターおよびポリアデニル化シグナルの例としては、SV40から誘導されたもの
がある。
[0125] Typically, transcription termination and polyadenylation sequences recognized by mammalian cells are regulatory regions located 3'to the transcription stop codon, and thus co-exist with promoter elements at the ends of the coding sequence. Adjacent. The 3'end of the mature mRNA is
It is formed by site-specific post-translational cleavage and polyadenylation. Examples of transcription terminators and polyadenylation signals include those derived from SV40.

【0126】 外来核酸を哺乳類宿主ならびに他の宿主に導入する方法は、当業界ではよく知
られており、使用される宿主により変化する。技術として、デキストラン介在ト
ランスフェクション、燐酸カルシウム沈殿、ポリブレン介在トランスフェクショ
ン、プロトプラスト融合、エレクトロポーレーション、ウイルス感染、リポソー
ムにおけるポリヌクレオチド(複数でもよい)封入、および核へのDNAの直接
顕微注入がある。
Methods for introducing foreign nucleic acid into mammalian hosts as well as other hosts are well known in the art and will vary with the host used. Techniques include dextran-mediated transfection, calcium phosphate precipitation, polybrene-mediated transfection, protoplast fusion, electroporation, viral infection, polynucleotide (s) encapsulation in liposomes, and direct microinjection of DNA into the nucleus.

【0127】 好ましい態様では、ライブラリー蛋白質は、細菌系で発現する。細菌発現系は
、当業者には公知である。
[0127] In a preferred embodiment, the library proteins are expressed in bacterial systems. Bacterial expression systems are known to those of skill in the art.

【0128】 適当な細菌性プロモーターとは、細菌性RNAポリメラーゼに結合し、mRN
Aへのライブラリー蛋白質コード配列の下流(3')転写を開始させ得る全ての
核酸配列である。細菌性プロモーターは、通常コード配列の5'末端近位に配置
された転写開始領域を有する。この転写開始領域は典型的にはRNAポリメラー
ゼ結合部位および転写開始部位を含む。代謝経路酵素をコードする配列からは、
特に有用なプロモーター配列を提供する。例としては、糖代謝性酵素、例えばガ
ラクトース、ラクトースおよびマルトースから誘導されたプロモーター配列、お
よび生合成酵素、例えばトリプトファンから誘導された配列がある。バクテリオ
ファージからのプロモーターもまた使用され得ることは、当業者には公知である
。さらに、合成プロモーターおよびハイブリッドプロモーターもまた有用である
。例えば、tacプロモーターは、trpおよびlacプロモーター配列のハイブリッド
である。さらに、細菌性プロモーターは、細菌性RNAポリメラーゼと結合し、
転写を開始させる能力を有する非細菌起源の天然プロモーターを含み得る。
A suitable bacterial promoter is one that binds to bacterial RNA polymerase and
All nucleic acid sequences capable of initiating the downstream (3 ') transcription of the library protein coding sequence into A. Bacterial promoters usually have a transcription initiation region located proximal to the 5'end of the coding sequence. This transcription start region typically includes an RNA polymerase binding site and a transcription start site. From the sequence encoding the metabolic pathway enzyme,
Particularly useful promoter sequences are provided. Examples are promoter sequences derived from sugar-metabolizing enzymes such as galactose, lactose and maltose, and sequences derived from biosynthetic enzymes such as tryptophan. It is known to those skilled in the art that promoters from bacteriophage can also be used. In addition, synthetic and hybrid promoters are also useful. For example, the tac promoter is a hybrid of the trp and lac promoter sequences. In addition, the bacterial promoter binds bacterial RNA polymerase,
It may include native promoters of non-bacterial origin that have the ability to initiate transcription.

【0129】 機能性プロモーター配列に加えて、有効なリボソーム結合部位が望ましい。大
腸菌の場合、リボソーム結合部位は、シャイン‐デルガルノ(SD)配列と呼ば
れ、開始コドンおよび開始コドン上流3−11ヌクレオチドに位置する配列3−
9ヌクレオチド長を有する。
In addition to a functional promoter sequence, an effective ribosome binding site is desirable. In Escherichia coli, the ribosome binding site is called the Shine-Delgarno (SD) sequence, and the start codon and the sequence located 3-11 nucleotides upstream of the start codon
It has a length of 9 nucleotides.

【0130】 発現ベクターもまた、細菌中でライブラリー蛋白質の分泌を提供するシグナル
ペプチドも包含し得る。シグナル配列は、通常、当業者によく知られているよう
に、該細胞からの蛋白質分泌を指令する疎水性アミノ酸からなるシグナルペプチ
ドをコードする。蛋白質は、成長培地(グラム陽性菌)または細胞(グラム陰性
菌)の内膜および外膜間にある周辺腔に分泌される。
The expression vector may also include a signal peptide that provides for secretion of the library protein in bacteria. The signal sequence typically encodes a signal peptide consisting of hydrophobic amino acids that direct protein secretion from the cell, as is well known to those of skill in the art. The protein is secreted into the periplasmic space between the inner and outer membranes of growth medium (Gram-positive bacteria) or cells (Gram-negative bacteria).

【0131】 細菌性発現ベクターはまた、形質転換された細菌株の選択を可能にする選択可
能マーカー遺伝子を含み得る。適当な選択遺伝子には、薬剤、例えばアンピシリ
ン、クロラムフェニコール、エリスロマイシン、カナマイシン、ネオマイシンお
よびテトラサイクリンに対する耐性を細菌に付与する遺伝子がある。選択可能マ
ーカーはまた、生合成遺伝子、例えばヒスチジン、トリプトファンおよびロイシ
ン生合成経路にあるものを含む。
The bacterial expression vector may also contain a selectable marker gene to allow the selection of transformed bacterial strains. Suitable selection genes include genes that confer to bacteria resistance to drugs such as ampicillin, chloramphenicol, erythromycin, kanamycin, neomycin and tetracycline. Selectable markers also include biosynthetic genes such as those in the histidine, tryptophan and leucine biosynthetic pathways.

【0132】 これらの成分は発現ベクターへと構築される。細菌に関する発現ベクターは当
業界ではよく知られており、そのなかのものには、枯草菌、大腸菌、ストレプト
コッカス・クレモリス(Streptococcus cremoris)およびストレプトコッカス・
リビダンス(Streptococcus lividans)に関するベクターを含む。
These components are constructed into an expression vector. Expression vectors for bacteria are well known in the art and include B. subtilis, E. coli, Streptococcus cremoris and Streptococcus.
Contains vectors for Libidoans (Streptococcus lividans).

【0133】 細菌性発現ベクターは、当業界でよく知られた技術、例えば塩化カルシウム処
理、エレクトロポーレーションなどを用いて細菌宿主細胞に形質転換される。
Bacterial expression vectors are transformed into bacterial host cells using techniques well known in the art, such as calcium chloride treatment, electroporation and the like.

【0134】 一態様では、ライブラリー蛋白質は昆虫細胞で産生される。昆虫細胞の形質転
換のための発現ベクターおよび特にバキュロウイルス由来の発現ベクターは、当
業界でも公知であり、例えばO'Reilly et al., Baculovirus Expression Vector
s: A Laboratory Manual(New York: Oxford University Press, 1994に記載され
ている。
In one aspect, the library proteins are produced in insect cells. Expression vectors for transformation of insect cells and especially baculovirus-derived expression vectors are also known in the art, eg O'Reilly et al., Baculovirus Expression Vector.
s: A Laboratory Manual (New York: Oxford University Press, 1994).

【0135】 好ましい態様において、ライブラリー蛋白質は酵母細胞で産生される。酵母発
現系は当業界では公知であり、サッカロマイシイス・セレヴィシアエ、カンジダ
・アルビカンス(Candida albicans)およびカンジダ・マルトーサ(C. maltosa
)、ハンセヌラ・ポリモルファ(Hansenula polymorpha)、クルイヴェロマイシス
・フラギリス(Kluyveromyces fragilis)およびクルイヴェロマイシス・ラクテ
ィス(K. lactis)、ピキア・ギレリモンディ(Pichia guillerimondii)および
ピキア・パストリス(P. Pastoris)、シゾサッカロマイシス・ポンベ(Schizos
accharomyces pombe)およびヤロウィア・リポリティカ(Yarrowia lipolytica
)に関する発現ベクターがある。酵母における発現に好ましいプロモーター配列
には、誘導性GAL1,10プロモーター、アルコールデヒドロゲナーゼ、エノ
ラーゼ、グルコキナーゼ、グルコース−6−燐酸イソメラーゼ、グリセルアルデ
ヒド−3−燐酸デヒドロゲナーゼ、ヘキソキナーゼ、ホスホフルクトキナーゼ、
3−ホスホグリセリン酸ムターゼ、ピルビン酸キナーゼおよび酸性ホスファター
ゼ遺伝子由来のプロモーターがある。酵母選択可能マーカーには、ADE2、H
IS4、LEU2、TRP1およびALG7(これはツニカマイシンに対する耐
性を与える)、G418に対する耐性を付与するネオマイシンホスホトランスフ
ェラーゼ遺伝子、および銅イオンの存在下で酵母を成長させ得るCUP1遺伝子
がある。
In a preferred embodiment, library proteins are produced in yeast cells. Yeast expression systems are known in the art and include Saccharomyces cerevisiae, Candida albicans and C. maltosa.
), Hansenula polymorpha, Kluyveromyces fragilis and K. lactis, Pichia guillerimondii and P. Pastoris. Saccharomyces pombe (Schizos
accharomyces pombe) and Yarrowia lipolytica
A) expression vector. Preferred promoter sequences for expression in yeast include the inducible GAL1,10 promoter, alcohol dehydrogenase, enolase, glucokinase, glucose-6-phosphate isomerase, glyceraldehyde-3-phosphate dehydrogenase, hexokinase, phosphofructokinase,
There are promoters from the 3-phosphoglycerate mutase, pyruvate kinase and acid phosphatase genes. Yeast selectable markers include ADE2, H
There are IS4, LEU2, TRP1 and ALG7 (which confers resistance to tunicamycin), the neomycin phosphotransferase gene which confers resistance to G418, and the CUP1 gene which allows yeast to grow in the presence of copper ions.

【0136】 本発明のライブラリー蛋白質は、当分野では公知技術を用いて、融合蛋白質と
して製造することも可能である。そのために、例えば、モノクローナル抗体の構
築に関して、所望のエピトープが小さい場合には、ライブラリー蛋白質を、キャ
リアー蛋白質と融合させて免疫原を形成することもできる。あるいは、ライブラ
リー蛋白質は、発現を増加させるため、もしくは別の理由のために融合蛋白質と
して製造することもできる。例えば、ライブラリー蛋白質がライブラリーペプチ
ドである場合には、ペプチドをコードする核酸は発現目的のために別の核酸と結
合させてもよい。同様に、別の融合パートナー、例えば、細胞の細胞内もしくは
細胞外腔へのライブラリーメンバーの局在化を可能にする標的配列、ライブラリ
ー蛋白質もしくはそれらをコードする核酸のいずれかを精製もしくは単離を可能
にするレスキュー配列もしくは精製タグ;ライブラリー蛋白質もしくはライブラ
リー蛋白質をコードする核酸に対する分解からの安定化もしくは保護(例えば蛋
白質分解に対する耐性)を与える安定配列もしくはこれらの組合物、さらに必要
であればリンカー配列も使用できる。
The library protein of the present invention can also be produced as a fusion protein using a technique known in the art. To that end, for example, with respect to the construction of monoclonal antibodies, the library protein can be fused with a carrier protein to form an immunogen when the desired epitope is small. Alternatively, the library protein can be produced as a fusion protein for increased expression or for other reasons. For example, if the library protein is a library peptide, the nucleic acid encoding the peptide may be linked to another nucleic acid for expression purposes. Similarly, another fusion partner, such as a target sequence that enables localization of the library member to the intracellular or extracellular space of the cell, either the library protein or the nucleic acid encoding them, is purified or purified. A rescue sequence or purification tag that allows separation; a stable sequence that provides stabilization or protection (eg, resistance to proteolysis) from degradation to the library protein or nucleic acid encoding the library protein, or a combination thereof, Linker sequences can also be used if present.

【0137】 このように、好適な標的配列としては、限定されるものではないが、発現産物
の生物活性を維持しながら、発現産物を予じめ決定した分子または分子クラスと
結合させることができる結合配列(例えば、酵素阻害剤または基質配列を用いて
関連する酵素クラスを標的化する);それ自体またはともに結合している蛋白質
の選択的分解のシグナルを与える配列;ならびに、候補発現産物を、a)ゴルジ
体、小胞体、核、仁、核膜、ミトコンドリア、葉緑体、分泌小胞、リソソーム、
および細胞膜などの細胞内位置、および、b)分泌シグナルを介する細胞外の位
置を含む、予め決定された細胞の位置へ構成的に局在化させ得るシグナル配列が
挙げられる。細胞下への局在化または分泌を介する細胞外への局在化のいずれか
が特に好ましい。
Thus, suitable target sequences include, but are not limited to, capable of binding an expression product to a predetermined molecule or class of molecules while maintaining the biological activity of the expression product. A binding sequence (eg, targeting the relevant enzyme class with an enzyme inhibitor or substrate sequence); a sequence that provides a signal for selective degradation of the protein bound by itself or together; and a candidate expression product, a) Golgi apparatus, endoplasmic reticulum, nucleus, nucleolus, nuclear membrane, mitochondria, chloroplast, secretory vesicle, lysosome,
And signal sequences capable of constitutively localizing to a predetermined cellular location, including intracellular locations such as the cell membrane, and b) extracellular locations via secretory signals. Either subcellular localization or extracellular localization via secretion is particularly preferred.

【0138】 好ましい態様では、該ライブラリーメンバーはレスキュー配列である。レスキ
ュー配列は、候補物質またはそれをコードする核酸のいずれかを精製または単離
するために使用できる配列である。このようにペプチドのレスキュー配列として
は、例えば、Ni親和性カラムと共に用いるHisタグ、および検出、免疫沈
降またはFACS(蛍光活性化細胞分別)のためのエピトープタグなどの精製配
列が挙げられる。好適なエピトープタグとしては、myc(市販の9E10抗体
と共に用いる)、細菌酵素BirAのBSPビオチン化標的配列、fluタグ、
lacZおよびGSTが挙げられる。
In a preferred embodiment, the library member is a rescue sequence. A rescue sequence is a sequence that can be used to purify or isolate either the candidate substance or the nucleic acid that encodes it. Thus, peptide rescue sequences include, for example, His 6 tags for use with Ni affinity columns and purified sequences such as epitope tags for detection, immunoprecipitation or FACS (fluorescence activated cell sorting). Suitable epitope tags include myc (used with commercially available 9E10 antibody), BSP biotinylated target sequence of bacterial enzyme BirA, flu tag,
lacZ and GST.

【0139】 あるいは、レスキュー配列は、PCR、関連技術もしくはハイブリダイゼーシ
ョンによるレトロウイルス構築体を迅速かつ容易に単離し得るプローブ標的部位
として機能する独特のオリゴヌクレオチド配列であってもよい。
Alternatively, the rescue sequence may be a unique oligonucleotide sequence that functions as a probe target site from which a retroviral construct by PCR, related techniques or hybridization can be isolated quickly and easily.

【0140】 好ましい態様では、該融合パートナーは、ライブラリーメンバーもしくはそれ
をコードする核酸に安定性を付与する安定性配列である。このように、例えば、
VarahavskyのN−末端則に従い、ユビキチン化されるペプチドを保護するため、
開始メチオニン(MGまたはMGGO)の後にグリシンを組み込むことによりペ
プチドを安定化し、このようにして細胞質中での長い半減期を付与し得る。同様
に、C末端の2個のプロリンは、ペプチドにカルボキシペプチダ−ゼの作用に対
する強い耐性を付与する。プロリンの前の2個のグリシンが存在することにより
、可変性と防護構造の両方を付与し、ジ−プロリン中で候補ペプチド構造中に伝
わるべき一連の事象を開始する。このような好ましい安定性配列を以下に示す:
MG(X)GGPP、但し、Xはいずれかのアミノ酸であり、nは少なくとも4
の整数である。 。
In a preferred embodiment, the fusion partner is a stable sequence that confers stability to the library member or the nucleic acid encoding it. Thus, for example,
To protect the ubiquitinated peptide according to Varahavsky's N-terminal rule,
Incorporation of glycine after the initiating methionine (MG or MGGO) may stabilize the peptide and thus confer a long half-life in the cytoplasm. Similarly, the two C-terminal prolines confer to the peptide strong resistance to the action of carboxypeptidase. The presence of the two glycines in front of proline confers both variability and protective structure and initiates a series of events in di-proline to propagate into the candidate peptide structure. Such preferred stability sequences are shown below:
MG (X) n GGPP, where X is any amino acid and n is at least 4
Is an integer. .

【0141】 一態様では、本発明のライブラリー核酸、蛋白質および抗体を標識化する。こ
こで「標識化した」とは、本発明のライブラリー核酸、蛋白質および抗体が、同
位元素または化学的化合物がそれに結合して本発明のライブラリー核酸、蛋白質
および抗体の検出を可能にする少なくとも1つの成分を有することを意味する。
一般に、標識は3種類、すなわちa)放射性または重同位元素であり得る同位元
素標識、b)抗体または抗原であり得る免疫標識、およびc)着色または蛍光染
料、に分類される。標識はいずれかの位置で化合物に組込まれ得る。
In one aspect, the library nucleic acids, proteins and antibodies of the invention are labeled. As used herein, the term “labeled” means that the library nucleic acid, protein and antibody of the present invention are bound to an isotope or a chemical compound to enable detection of the library nucleic acid, protein and antibody of the present invention. It is meant to have one component.
In general, labels fall into three categories: a) isotope labels, which can be radioactive or heavy isotopes, b) immunolabels, which can be antibodies or antigens, and c) colored or fluorescent dyes. The label can be incorporated into the compound at any position.

【0142】 好ましい態様では、ライブラリー蛋白質を、発現後に精製もしくは単離する。
ライブラリー蛋白質は、当業者には公知の様々な方法で単離もしくは精製し得る
。標準的な精製方法には、電気泳動、分子、免疫学的およびイオン交換、疎水性
、アフィニティーそして逆相HPLCクロマトグラフィーを含むクロマログラフ
ィー技術およびクロマトフォーカシング(chromatofocusing)が含まれる。例え
ば、ライブラリー蛋白質は、標準的な抗ライブラリー抗体カラムを用いて精製す
ることができる。蛋白質濃度との関連で限外濾過およびダイアフィルトレーショ
ン技術も有用である。適当な精製技術における一般的ガイダンスについては、Sc
opes,R.、Protein Purification、Springer-Verlag、NY(1982)を参照。必要な
精製度合いは、ライブラリー蛋白質の用途により異なる。精製が必要ではない場
合もある。
In a preferred embodiment, the library proteins are purified or isolated after expression.
Library proteins can be isolated or purified by various methods known to those of skill in the art. Standard purification methods include electrophoretic, molecular, immunological and ion exchange, hydrophobic, affinity and chromatofocusing techniques including reverse phase HPLC chromatography and chromatofocusing. For example, library proteins can be purified using standard anti-library antibody columns. Ultrafiltration and diafiltration techniques are also useful in connection with protein concentration. For general guidance on suitable purification techniques, see Sc
See opes, R., Protein Purification, Springer-Verlag, NY (1982). The required degree of purification depends on the use of the library protein. In some cases, no purification is necessary.

【0143】 一旦発現させ、必要であれば、および精製したライブラリー蛋白質および核酸
は、様々な用途に有用である。
Once expressed, and if necessary, and purified library proteins and nucleic acids are useful in a variety of applications.

【0144】 一般に、二次ライブラリーを、生物活性ついてスクリーンする。これらのスク
リーンは、当分野で知られているように、選択した骨格蛋白質を基準とする。こ
のようにして、その既知の結合メンバー(例えば、酵素であれば、その基質)と
の結合、活性プロファイル、安定性プロファイル(pH、温度、緩衝液の条件)
、基質特異性、免疫原性、毒性などを含む、多数の蛋白質の活性または特性の全
てを試験し得る。
Secondary libraries are generally screened for biological activity. These screens are based on the scaffold protein of choice, as is known in the art. In this way, binding with its known binding member (eg its substrate in the case of an enzyme), activity profile, stability profile (pH, temperature, buffer conditions).
, All of the activities or properties of a large number of proteins can be tested, including substrate specificity, immunogenicity, toxicity and the like.

【0145】 ランダムペプチドが生成する場合、これらを、活性に関するスクリーニングの
ために様々な方法で使用し得る。好ましい態様では、第一の細胞集団がスクリー
ニングされる。即ち、ライブラリーメンバーの核酸を導入した細胞を、変化表現
型に関してスクリーンする。従って、この態様では、ライブラリーメンバーの効
果を、その作製された同じ細胞中で見られる;即ちオートクリン効果である。
If random peptides are produced, these can be used in various ways for screening for activity. In a preferred embodiment, the first cell population is screened. That is, cells into which library member nucleic acids have been introduced are screened for altered phenotype. Thus, in this aspect, the effect of the library member is seen in the same cell in which it was made; ie the autocrine effect.

【0146】 本明細書では「細胞集団」により、おおよそ約10から10または10 までの細胞を意味し、10ないし10が好ましい。この細胞集団は、細胞性
ライブラリーを含み、その場合、通常ライブラリー内の各細胞には二次ライブラ
リーのメンバー、すなわち、別のライブラリーメンバーを含むが、当業者には明
かなように、ライブラリー内の一部の細胞はライブラリーメンバーを含まないこ
ともあり、一部は1以上のライブラリーメンバーを含んでいてもよい。レトロウ
イルス感染以外の方法を用い、ライブラリーメンバーを細胞集団に導入する場合
には、細胞性ライブラリーの個々細胞メンバー内のライブラリーメンバーの分布
は広範囲に変化し得る。それは、エレクトロポレーションなどの間に細胞に入れ
る多数の核酸を制御することが困難だからである。
By “cell population” herein is meant approximately about 10 3 to 10 8 or 10 9 cells, with 10 6 to 10 8 being preferred. This cell population comprises a cellular library, in which usually each cell in the library will contain a member of the secondary library, i.e. another library member, as will be apparent to those skilled in the art. , Some cells in the library may not contain library members, and some may contain one or more library members. When methods other than retroviral infection are used to introduce library members into a cell population, the distribution of library members within individual cell members of a cellular library can vary widely. This is because it is difficult to control the large number of nucleic acids that enter the cell during electroporation and the like.

【0147】 好ましい態様では、ライブラリー核酸を第一の細胞集団に導入し、ライブラリ
ーメンバーの効果は、第一細胞集団とは異なる、すなわち通常異なる細胞型の第
二もしくは第三の細胞集団でスクリーニングする。すなわち、ライブラリーメン
バーの効果は、第二の細胞への細胞外効果、すなわち内分泌または傍分泌効果に
起因する。これは標準的な技術により行う。第一の細胞集団は、1以上の培地で
増殖し得、当該培地により第二の細胞集団と接触させ、その効果を測定する。あ
るいは、細胞間で直接接触させてもよい。このように、「接触する」とは、機能
的な接触であり、直接的および間接的の両方を含む。この態様では、第一の細胞
集団をスクリーニングしてもよいし、しなくてもよい。
In a preferred embodiment, the library nucleic acid is introduced into a first cell population and the effect of the library members is on a second or third cell population of a different cell type than the first cell population, ie usually a different cell type. To screen. That is, the effect of the library member is due to an extracellular effect on the second cell, an endocrine or paracrine effect. This is done by standard techniques. The first cell population can be grown in one or more media, which is contacted with the second cell population and the effect measured. Alternatively, the cells may be directly contacted with each other. Thus, "contacting" is functional contacting, including both direct and indirect. In this aspect, the first cell population may or may not be screened.

【0148】 必要であれば、この細胞を、ライブラリーメンバーの発現に適した条件(例え
ば、誘導性プロモーターを用いる)に処し、ライブラリー蛋白質を産生させる。
即ち、ある態様では、本発明の方法は、細胞集団、細胞ライブラリーにライブラ
リーメンバーの分子ライブラリーを導入することを含む。次いで、以下でさらに
詳しく説明するように、細胞集団は、変化表現型を示す細胞としてスクリーニン
グされる。変化表現型はライブラリーメンバーの存在に起因する。
If necessary, the cells are subjected to conditions suitable for expression of library members (eg, using an inducible promoter) to produce library proteins.
That is, in one aspect, the method of the invention comprises introducing a molecular library of library members into a cell population, a cell library. The cell population is then screened for cells exhibiting an altered phenotype, as described in further detail below. The altered phenotype is due to the presence of library members.

【0149】 本明細書の「変化表現型」もしくは「生理学的に変化した」または他の文法上
の同義語は、当該細胞の当該表現型が、幾つかの方法で、好ましくは検出可能お
よび/または測定可能な方法で変化することを意味する。当業者が認識するよう
に、本発明の長所は、本方法を用い試験され得る多様な細胞型および可能性ある
表現型変化である。従って、観察され、検出されるか、または測定され得る全て
の表現型変化は本明細書のスクリーニング方法に基づき得る。適当な表現型変化
には、以下に限らないが、細胞の形態学的変化、細胞増殖、細胞生存能力、基質
または他の細胞への接着、および細胞性密度のような全体的な物理的変化;1以
上のRNA、蛋白質、脂質、ホルモン、サイトカインまたは他の分子の発現の変
化;1以上のRNA、蛋白質、脂質、ホルモン、サイトカインまたは他の分子の
平衡状態(すなわち、半減期(half-life))の変化;1以上のRNA、蛋白質、脂
質、ホルモン、サイトカインまたは他の分子の局在化の変化;1以上のRNA、
蛋白質、脂質、ホルモン、サイトカイン、レセプターまたは他の分子の生物活性
または特異活性(比活性)の変化;イオン、サイトカイン、ホルモン、増殖因子
または他の分子の分泌の変化;細胞膜の電位、極性、完全性または輸送性の変化
;感染性、伝染力、潜在性、接着性ならびにウイルスおよび細菌性病原体の吸収
の変化などが含まれる。本明細書において「表現型を変化させ得る」とは、ラブ
ラリィメンバーが、幾つかの検出可能および/または測定可能な方法で細胞の表
現型を変化させ得ることを意味する。
As used herein, "altered phenotype" or "physiologically altered" or other grammatical synonyms mean that the phenotype of the cell is in some way preferably detectable and / or Or it means changing in a measurable way. As will be appreciated by one of skill in the art, an advantage of the present invention is the variety of cell types and potential phenotypic changes that can be tested using this method. Therefore, any phenotypic change that can be observed, detected or measured can be based on the screening methods herein. Suitable phenotypic changes include, but are not limited to, morphological changes in cells, cell proliferation, cell viability, adhesion to substrates or other cells, and overall physical changes such as cellular density. A change in the expression of one or more RNAs, proteins, lipids, hormones, cytokines or other molecules; an equilibrium state of one or more RNAs, proteins, lipids, hormones, cytokines or other molecules (ie half-life )) Changes; one or more RNAs, proteins, lipids, hormones, cytokines or other localization changes; one or more RNAs,
Altered biological or specific activity (specific activity) of proteins, lipids, hormones, cytokines, receptors or other molecules; altered secretion of ions, cytokines, hormones, growth factors or other molecules; cell membrane potential, polarity, integrity Changes in sex or transport; including infectivity, infectivity, latency, adhesiveness and changes in absorption of viral and bacterial pathogens. By "capable of altering phenotype" herein is meant that the library member is capable of altering the phenotype of a cell in a number of detectable and / or measurable ways.

【0150】 変化表現型は、種々の方法で検出され得るが、一般的に、変化されつつある表
現型に依存しかつ相当する。一般に、変化表現型は、例えば、細胞形態の顕微鏡
分析;標準的な細胞生存能力検定法、この場合、増殖細胞死および増殖細胞生存
能力の両方が含まれ、例えばウイルス、細菌または細菌もしくは合成毒性を介す
る細胞死に耐性のある細胞;特定細胞または分子の存在またはレベルに関する蛍
光インディケーター検定法のような標準的な標識検定法、この場合、FACSま
たは他の色素染色技術が含まれる;細胞の死滅後の標的化合物の発現の生化学的
検出などを用い検出される。ある場合には、本明細書で十分に記載したように、
変化表現型は、ランダム化した核酸を導入した細胞で検出され、他の態様では、
その変化表現型は、第一の細胞由来の幾つかの分子シグナルに応答する第二の細
胞において検出される。
The altered phenotype can be detected in a variety of ways, but generally depends and corresponds to the phenotype being altered. In general, altered phenotypes include, for example, microscopic analysis of cell morphology; standard cell viability assays, in which case both proliferative cell death and proliferative cell viability are involved, eg viral, bacterial or bacterial or synthetic toxicity. Cells that are resistant to cell death mediated by P. a .; standard labeling assays, such as fluorescent indicator assays for the presence or level of particular cells or molecules, in which case FACS or other dye staining techniques are included; cell death It is subsequently detected using biochemical detection of the expression of the target compound. In some cases, as fully described herein,
The altered phenotype is detected in cells into which the randomized nucleic acid has been introduced, and in other aspects,
The altered phenotype is detected in the second cell in response to some molecular signal from the first cell.

【0151】 好ましい態様では、ライブラリーメンバーは、陽性細胞から単離される。これ
は、種々の方法で行い得る。好ましい態様では、上記で定義された構築体もしく
はレスキュー配列のようなラブラリィの特定要素に共通するDNA領域に相補的
なプライマーを用い、特定のランダム配列を「レスキュー」する。他に、該メン
バーは、レスキュー配列を用いて単離される。そのため、例えば、エピトープタ
グまたは精製配列を含むレスキュー配列を用い、免疫沈降または親和性カラムを
使用してライブラリーメンバーを回収する。ある例では、ライブラリーメンバー
と標的分子の間に強力な結合相互作用が有意に存在するならば、ライブラリーメ
ンバーが結合するもの(例えば第一標的分子)をも回収される。あるいは、該ペ
プチドはマススペクトロメトリーを用いて検出され得る。
In a preferred embodiment, library members are isolated from positive cells. This can be done in various ways. In a preferred embodiment, a primer complementary to a DNA region common to a particular element of a library such as the construct or rescue sequence defined above is used to "rescue" a particular random sequence. Alternatively, the member is isolated using a rescue sequence. Thus, for example, a rescue sequence containing an epitope tag or a purified sequence is used to recover library members using immunoprecipitation or affinity columns. In certain instances, if there is a significant strong binding interaction between the library member and the target molecule, the one to which the library member binds (eg, the first target molecule) is also recovered. Alternatively, the peptide can be detected using mass spectrometry.

【0152】 一旦レスキューされると、ライブラリーメンバーの配列が決定される。次いで
、この情報は多くの方法で使用され得る。
Once rescued, the library members are sequenced. This information can then be used in many ways.

【0153】 好ましい実施態様では、該メンバーは再合成され、標的細胞に再導入され、そ
の効果が証明される。これは、レトロウイルス、または他にHIV−1Tat蛋
白質および類似および関連蛋白質に対する融合物を用いて行い、それによって、
標的細胞中への非常に高い取込みが可能となる。例えば、Fawell et al., PNAS
USA 91:664(1994);Frankel et al., Cell 55:1189(1988); Savion et al., J. B
iol. Chem. 256: 1149 (1981); Derossi et al., J. Biol. Chem. 269: 10444 (
1994);およびBaldin et al., EMBO J. 9: 1511(1990)参照(出典表示により本明
細書の一部とする)。
In a preferred embodiment, the member is resynthesized and reintroduced into the target cell, demonstrating its effect. This is done with a retrovirus, or alternatively a fusion to the HIV-1 Tat protein and similar and related proteins, whereby
Very high uptake into target cells is possible. For example, Fawell et al., PNAS
USA 91: 664 (1994); Frankel et al., Cell 55: 1189 (1988); Savion et al., J. B.
iol. Chem. 256: 1149 (1981); Derossi et al., J. Biol. Chem. 269: 10444 (
1994); and Baldin et al., EMBO J. 9: 1511 (1990) (incorporated herein by reference).

【0154】 好ましい態様では、本明細書に記載したように、該メンバーの配列を用いて、
ライブラリーが生成される。
In a preferred embodiment, the sequence of the member is used as described herein,
The library is created.

【0155】 好ましい実施態様では、該ライブラリーメンバーを用い、標的分子、すなわち
、当該メンバーが相互作用する分子を同定する。当業者が認識するように、ライ
ブラリーメンバーが結合するか直接作用する第一標的分子が存在し得、ライブラ
リーメンバーが影響するシグナル伝達経路の一部である第二標的分子が存在し得
、これらを「有効な標的」と呼ぶ。
In a preferred embodiment, the library members are used to identify target molecules, ie molecules with which the members interact. As one of skill in the art will recognize, there may be a first target molecule to which the library member binds or acts directly, and there may be a second target molecule that is part of the signal transduction pathway affected by the library member, These are called "effective targets".

【0156】 本発明のスクリーニング方法は、多様な条件下、多くの細胞型をスクリーンす
るのに有用となり得る。通常、宿主細胞は、疾患状態を含む細胞であり、それら
は、細胞に対して通常望ましくない結果を生ずる条件下で試験またはスクリーニ
ングされる。適当なライブラリーメンバーが見出される場合、望ましくない効果
は減少するかまたは除かれ得る。あるいは、通常望ましい結果は、減少もしくは
除くことができ、疾患状態または信号伝達経路に関連する細胞性機構を解明する
手段を伴う。
The screening methods of the invention can be useful for screening many cell types under a variety of conditions. Usually, host cells are cells that contain a disease state, and they are tested or screened under conditions that usually produce undesirable results on the cells. Undesirable effects may be reduced or eliminated when suitable library members are found. Alternatively, usually the desired result is one that can be reduced or eliminated and involves a means of elucidating the cellular mechanisms involved in the disease state or signaling pathway.

【0157】 以下、実施例を挙げて、上記した本発明の手法を用いてより詳細に記載し、さ
らに本発明の様々な態様の実施について予想される最善の方法を示す。これらの
実施例は、いかなる意味においても本発明の真の範囲を制限するのではなく、む
しろ単に説明を目的として提示したものである。本明細書中で列挙されている全
参考文献を出典明示により本明細書の一部とする。
The following is a more detailed description, using the techniques of the invention set forth above, of examples, and further illustrates the best method envisioned for practicing the various aspects of the invention. These examples do not limit the true scope of the invention in any way, but rather are presented for illustrative purposes only. All references cited in this specification are incorporated herein by reference.

【0158】 実施例 実施例1 β-ラクタマーゼTEM-1についての、コンピューター処理プレスクリーニング β-ラクタマーゼ遺伝子TEM-1について予備試験を行なった。ブルックヘブ
ン蛋白質データバンクエントリー 1BTLを出発構造として使用した。水分子
とSO4 2-基を全て取り除き、そして該構造上に陽水素を生成させた。この構造
を、コンジュゲート勾配法とドライデイングII力場を使用して、静電気を用いず
に50工程で最小化した。これらの工程を、BIOGRAFプログラム(Molecul
ar Simulations, Inc., San Diego, CA)を使用して行なった。この最小化した構
造を、すべての蛋白質設計計算用のテンプレート(鋳型)として役立てた。
Examples Example 1 Computational Prescreening of β-Lactamase TEM-1 Preliminary testing was performed on β-lactamase gene TEM-1. Brookhaven Protein Data Bank Entry 1BTL was used as the starting structure. All water molecules and SO 4 2− groups were removed and cations were generated on the structure. The structure was minimized in 50 steps without static electricity using the conjugate gradient method and the Drying II force field. The BIOGRAF program (Molecul
ar Simulations, Inc., San Diego, CA). This minimized structure served as a template for all protein design calculations.

【0159】 コンピューター処理プレスクリーニング 配列のコンピューター処理プレスクリーニングを、PDAを使用して行なった
。4Å球体を4つの触媒残基の重側鎖原子(S70, K73, S130, およびE166)の周り
に設けて、そしてカットオフ距離内の重側鎖原子を有する全てのアミノ酸を選択
した。このようにして下記の7つの位置:F72, Y105, N132, N136, L169, N170,
およびK234、が得られた。これらの残基の2つ、N132とK234、は、数種の異な
るβ-ラクタマーゼ中に高度に維持されており、従って、5つの可変位置(F72, Y
105, N136, L169, N170)を残して、設計に含めなかった。これらの設計した位置
を、20種の天然型アミノ酸のうちプロリン、システイン、およびグリシンを除
いたもの(計17アミノ酸)の何れかと同一性を変化可能とした。プロリンは、プ
ロリンの適切な回転異性体を定義することが難しいため、通常は使用しない。シ
ステインは、ジスルフィド結合の形成を防ぐために除外し、そしてグリシンは高
次構造上の可動性のため、除外した。
Computerized Prescreening Computerized prescreening of sequences was performed using PDA. A 4Å sphere was placed around the heavy side chain atoms (S70, K73, S130, and E166) of the four catalytic residues, and all amino acids with heavy side chain atoms within the cutoff distance were selected. In this way the following seven positions: F72, Y105, N132, N136, L169, N170,
And K234 were obtained. Two of these residues, N132 and K234, are highly conserved in several different β-lactamases, and therefore five variable positions (F72, Y).
105, N136, L169, N170) were not included in the design. These designed positions were able to change the identity with any of 20 natural amino acids except proline, cysteine, and glycine (17 amino acids in total). Proline is not normally used because it is difficult to define the appropriate rotamer of proline. Cysteine was excluded to prevent disulfide bond formation, and glycine was excluded due to conformational flexibility.

【0160】 さらに、PDA設計用に選択した残基の、5Åの範囲内の第2残基セットを浮
遊させた(それらのアミノ酸同一性は野生型として維持されたが、配置は変更が
可能であった)。重側鎖原子を再度使用して、何れの残基がカットオフ内にあっ
たかを決定した。次の28の位置が得られた: M68, M69, S70, T71, K73, V74,
L76, V103, E104, S106, P107, I127, M129, S130, A135, L139, L148, L162, R
164, W165, E166, P167, D179, M211, D214, V216, S235, I247。A248は、I247
の代わりの浮遊位置として包含された。位置がM69, R164,およびW165である場合
、第2セットからの23の浮遊した残基を残して、結晶構造が高度に緊縮した回
転異性体を示すので、2つのプロリン、P107およびP167、を浮遊残基から除外し
た。第1の範囲(4Å)からの、維持された残基、N132およびK234も同様に浮遊し
、合計25の浮遊残基が得られた。
In addition, a second set of residues within the range of 5Å of the residues selected for PDA design was floated (their amino acid identities were maintained as wild type but the configuration could be changed). there were). The heavy side chain atoms were used again to determine which residue was within the cutoff. The following 28 positions were obtained: M68, M69, S70, T71, K73, V74,
L76, V103, E104, S106, P107, I127, M129, S130, A135, L139, L148, L162, R
164, W165, E166, P167, D179, M211, D214, V216, S235, I247. A248 is I247
Was included as an alternative floating position. When the positions are M69, R164, and W165, two prolines, P107 and P167, were selected because the crystal structure shows a highly stringent rotamer, leaving 23 floating residues from the second set. Excluded from floating residues. The retained residues, N132 and K234, from the first range (4Å) also floated, giving a total of 25 floating residues.

【0161】 PDA計算に使用したポテンシャル関数とパラメータは下記の通りであった。
ファンデルワールススケールファクターを0.9にセットし、そして静電ポテンシ
ャルを、距離のアテニュエーションと誘電定数40を使用して計算した。水素結
合ポテンシャル用のウェルの深さを、局所および遠隔性バックボーンスケールフ
ァクター(それぞれ0.25および1.0)で8kcal/molにセットした。溶媒和ポテ
ンシャル を、コアとして分類された設計位置(F72, L169, M68, T71, V74, L76,
I127, A135, L139, L148, L162, M211 およびA248)のみで計算した。タイプ2
溶媒和を使用した(Street and Mayo, 1998)。非極性曝露増殖ファクターを1.6
にセットし、非極性埋葬エネルギーを0.048kcal/mol/A2にセットし、そして
極性水素埋葬エネルギーを2.0kcal/molにセットした。
The potential functions and parameters used for PDA calculation were as follows:
The Van der Waals scale factor was set to 0.9 and the electrostatic potential was calculated using distance attenuation and a dielectric constant of 40. The well depth for hydrogen bonding potential was set to 8 kcal / mol with local and remote backbone scale factors (0.25 and 1.0 respectively). Design positions (F72, L169, M68, T71, V74, L76,
I127, A135, L139, L148, L162, M211 and A248) only. Type 2
Solvation was used (Street and Mayo, 1998). Non-polar exposure growth factor 1.6
, The non-polar burial energy was set to 0.048 kcal / mol / A 2 , and the polar hydrogen burial energy was set to 2.0 kcal / mol.

【0162】 Dead End Elimination(DEE)最適化方法(文献参照)を使用して、最も低いエ
ネルギーである基底状態配列を見出した。50および100kcal/molのDEEカ
ットオフを、それぞれ、1重および2重エネルギー計算に使用した。
The Dead End Elimination (DEE) optimization method (see literature) was used to find the lowest energy ground state sequence. DEE cutoffs of 50 and 100 kcal / mol were used for single and dual energy calculations, respectively.

【0163】 DEE基底状態配列を出発としてモンテカルロ(MC)計算を行ない、1000
の最も低いエネルギーの配列のリストを作成した。MCパラメーターはサイクル
毎に1,000,000の工程を有する、100のアニーリングサイクルであった
。非生産的サイクル範囲を50にセットした。アニーリングスケジュールで、高
温度と低温度をそれぞれ500Kと100Kにセットした。
A Monte Carlo (MC) calculation is performed starting from the DEE ground state array, and 1000
Created a list of the lowest energy arrays of. The MC parameters were 100 annealing cycles with 1,000,000 steps per cycle. The non-productive cycle range was set to 50. The annealing schedule set the high and low temperatures to 500K and 100K, respectively.

【0164】 次いで、下記の確率分布をMCリスト中のトップ1000配列から計算した(
下記の表3参照)。それは各位置(5つの可変性位置と25の浮遊位置)について
選択した各アミノ酸の発生数を示す。 表3:モンテカルロ分析(アミノ酸とその発生数(トップ1000配列について)
Next, the following probability distribution was calculated from the top 1000 sequences in the MC list (
(See Table 3 below). It shows the number of occurrences of each amino acid selected for each position (5 variable positions and 25 floating positions). Table 3: Monte Carlo analysis (amino acids and their occurrences (for top 1000 sequences)
)

【表2】 [Table 2]

【0165】 この確率分布を、端数を切り捨てた確率分布に変換した(表4参照)。10%の
カットオフ値を使用して設計された位置で四捨五入して、野生型アミノ酸は少な
くとも10%の可能性で常に生成した。Eは総時間の15.6%で169位において
みられた。しかしながら、この位置は他の設計位置、170位の直前であるので、
この近接のためにさらに複雑なオリゴヌクレオチドライブラリー設計が必要とな
るであろう;そのため、配列ライブラリーを作成するときに、Eをこの位置に含
めなかった(Lのみを使用した)。
This probability distribution was converted into a probability distribution with rounding down (see Table 4). Wild-type amino acids were always produced with a probability of at least 10%, rounded off at the designed position using a cutoff value of 10%. E was found in 169th place, 15.6% of the total time. However, since this position is just before the other design position, 170th place,
This proximity would require a more complex oligonucleotide library design; therefore, E was not included in this position when creating the sequence library (only L was used).

【0166】 表4:β-ラクタマーゼの設計位置に対するPDA確率分布(最も近い10%単位
に四捨五入した)
Table 4: PDA probability distributions for β-lactamase design positions (rounded to the nearest 10%).

【表3】 [Table 3]

【0167】 表4に示すように、コンピューター処理プレスクリーニングによって問題の大
きさを桁はずれに縮小化することができた。本来、17の異なるアミノ酸にそれ
ぞれ5種の設計位置があり、175=1,419,857の可能配列があった。これが、ほん
の2*7*3*1*5=210の可能性のある配列まで削減された(ほぼ4桁の大きさの縮小で
ある)。
As shown in Table 4, computerized prescreening was able to reduce the size of the problem by orders of magnitude. Originally, there are respectively five design located at different amino acids of 17, there is a possibility sequences 17 5 = 1,419,857. This was reduced to only 2 * 7 * 3 * 1 * 5 = 210 possible arrays (a reduction of almost 4 orders of magnitude).

【0168】 配列ライブラリーの産生 β-ラクタマーゼの完全長TEM-1遺伝子および全ての所望変異に対応する重
複オリゴヌクレオチドを合成し、前述と同様にPCR反応で使用し(図1)、上記
の210配列を含む配列ライブラリーが得られた。
Generation of Sequence Library Overlapping oligonucleotides corresponding to the full-length TEM-1 gene of β-lactamase and all desired mutations were synthesized and used in a PCR reaction as described above (FIG. 1), 210 as described above. A sequence library containing the sequences was obtained.

【0169】 TEM-1遺伝子変異体の合成 TEM-1遺伝子の変異体の調製のため、pCR2.1(Invitrogen)をXbalとEcoRIで
設計し、T4 DNA ポリメラーゼで平滑断端化し、再連結した。ポリリンカー
内からHind IIIとXhol部位を取り除いた。それから、Quickchange Site-Directe
d Mutagenesis Kitを使用して、製造業者(Stratagene)による記述のとおり、新
たなXhol部位を、TEM-1遺伝子の2269位(原型のpCR2.1としてナンバリング)
中へ導入した。同様に、新たなHindIII部位を2674位に導入し、pCR-Xen1を得た
Synthesis of TEM-1 Gene Variants For the preparation of TEM-1 gene variants, pCR2.1 (Invitrogen) was designed with Xbal and EcoRI, blunt-ended with T4 DNA polymerase and religated. The Hind III and Xhol sites were removed from within the polylinker. Then, Quickchange Site-Directe
Using the d Mutagenesis Kit, the new Xhol site was located at position 2269 of the TEM-1 gene (numbered as the original pCR2.1) as described by the manufacturer (Stratagene).
Introduced inside. Similarly, a new HindIII site was introduced at position 2674, resulting in pCR-Xen1.

【0170】 変異したTEM-1遺伝子を作成するために、新たに導入したXho1とHindIII部
位間の配列に対応して、重複する40merオリゴヌクレオチドを合成し、近接す
るオリゴヌクレオチドと20のヌクレオチドが重複するように設計した。各設計
位置(72,105,136および170)において、多数のオリゴヌクレオチドを合成したが
、それぞれ異なる変異体を含み、そのため表4に示すように全ての可能な組合せ
の変異体配列(210)を所望の割合で調製できた。例えば、72位では、2セットの
オリゴヌクレオチドを合成した(1つは72位にFを含み、もう一方はYを含んで
いる)。それぞれのオリゴヌクレオチドを1μg/μlの濃度で再懸濁し、そして等
モル濃度のオリゴヌクレオチドをプールした。
To create a mutated TEM-1 gene, overlapping 40 mer oligonucleotides were synthesized corresponding to the sequence between the newly introduced Xho1 and HindIII sites, and adjacent nucleotides overlapped with 20 nucleotides. Designed to do. A large number of oligonucleotides were synthesized at each design position (72, 105, 136 and 170), each containing different variants, so that as shown in Table 4, all possible combinations of variant sequences (210) were obtained in the desired proportions. It was prepared. For example, at position 72, two sets of oligonucleotides were synthesized (one containing an F at position 72 and the other containing a Y). Each oligonucleotide was resuspended at a concentration of 1 μg / μl and equimolar concentrations of oligonucleotide were pooled.

【0171】 重複する位置において、各オリゴヌクレオチドを、表4の確率を反映した濃度
で加えた。例えば、72位では等量の2種のオリゴヌクレオチドをプールに加え、
また136位では、Mを含むオリゴヌクレオチドを、Nを含むオリゴヌクレオチド
と比べて2倍量加え、さらにDを含むオリゴヌクレオチドを、Nを含むオリゴヌ
クレオチドと比べて7倍量加えた。
At overlapping positions, each oligonucleotide was added at a concentration that reflected the probability of Table 4. For example, at position 72 add equal amounts of two oligonucleotides to the pool,
At position 136, the oligonucleotide containing M was added in an amount twice that of the oligonucleotide containing N, and the oligonucleotide containing D was added in an amount of 7 times that of the oligonucleotide containing N.

【0172】 DNAライブラリーの組み立て 1回目のPCR用として、所望の確率(表4)でプールしたオリゴヌクレオチド
2μlを、10mM dNTPs 2μl、10x Taq緩衝剤(Qiagen) 10μl、TaqDNAポ
リメラーゼ(5ユニット/μl:Qiagen) 1μl、およびPfu DNAポリメラーゼ(2
.5ユニット/μl:Promega) 2μlを含む100μl反応系に加えた。この反応混
合物を氷上で集め、94℃5分間、それから94℃30秒間、52℃30秒間そ
して72℃30秒間を15サイクル、さらに72℃10分間の最終伸長工程にか
けた。
Assembly of DNA Library For the first round of PCR, 2 μl of oligonucleotides pooled at the desired probability (Table 4) were added to 2 μl of 10 mM dNTPs, 10 μl of 10x Taq buffer (Qiagen), Taq DNA polymerase (5 units / μl). : Qiagen) 1 μl and Pfu DNA polymerase (2
0.5 unit / μl: Promega) was added to a 100 μl reaction system containing 2 μl. The reaction mixture was collected on ice and subjected to a final extension step of 94 ° C for 5 minutes, then 15 cycles of 94 ° C for 30 seconds, 52 ° C for 30 seconds and 72 ° C for 30 seconds, followed by 72 ° C for 10 minutes.

【0173】 完全長オリゴヌクレオチドの単離 2回目のPCR用として、1回目の反応の2.5μlを、10mM dNTPs 2μl、
10x Pfu DNAポリメラーゼ緩衝液(Promega) 10μl、Pfu DNAポリメラー
ゼ(2.5ユニット/μl:Promega) 2μl、および合成遺伝子の5'末端と3'末端
に対応するオリゴヌクレオチド 1μlを含む100μl反応系に加えた。この反
応混合物を氷上で集め、94℃5分間、それから94℃30秒間、52℃30秒
間そして72℃30秒間を20サイクル、さらに72℃10分間の最終伸長工程
にかけ、完全長オリゴヌクレオチドを単離した。
Isolation of full-length oligonucleotide For the second round of PCR, 2.5 μl of the first round of reaction was added to 2 μl of 10 mM dNTPs,
10x Pfu DNA polymerase buffer (Promega) 10 μl, Pfu DNA polymerase (2.5 units / μl: Promega) 2 μl, and a 100 μl reaction system containing 1 μl of oligonucleotides corresponding to the 5 ′ and 3 ′ ends of the synthetic gene were added. It was The reaction mixture was collected on ice and subjected to a final extension step of 94 ° C for 5 minutes, then 94 ° C for 30 seconds, 52 ° C for 30 seconds, 72 ° C for 30 seconds, and 72 ° C for 10 minutes to isolate the full length oligonucleotide. did.

【0174】 DNAライブラリーの精製 PCR生成物を、QlAquick PCR Purification Kit(Qiagen)を使用して精製し
、Xho1とHindlllで消化し、1.2%アガロースゲルで電気泳動をし、そしてQlAq
uick Gel Extraction Kit(Qiagen)を使用して再精製した。
Purification of DNA library PCR products were purified using the QlAquick PCR Purification Kit (Qiagen), digested with Xho1 and Hindlll, electrophoresed on a 1.2% agarose gel and QlAq.
Repurified using uick Gel Extraction Kit (Qiagen).

【0175】 配列ライブラリーの同一性の確認 変異体TEM-1 β-ラクタマーゼ遺伝子のライブラリーを含むPCR生成物
を、カナマイシン抵抗性プラスミド中のプロモータとターミネーターの間にクロ
ーン化し、E. coli中で形質転換させた。等量の細菌をカナマイシンまたはアン
ピシリンの何れかを含む培地上に広げた。形質転換されたコロニーは、全て、カ
ナマイシン抵抗性でありうるが、しかし、活性変異したβ-ラクタマーゼ遺伝子
を有するもののみがアンピシリン上で増殖し得る。一晩インキュベーションした
後に、両方のプレート上で数個のコロニーが得られ、上記配列の少なくとも1つ
が活性なβ-ラクタマーゼをコードしていることが分かった。カナマイシンプレ
ート上のコロニーの数はアンピシリンプレート上のものよりかなり多く(おおよ
そ5:1の割合)、ある種の配列が活動を消失させたのか、あるいはPCR導入
が失敗して不活性物または切断酵素が得られたということが示唆される。
Confirmation of Sequence Library Identity A PCR product containing a library of mutant TEM-1 β-lactamase genes was cloned between the promoter and terminator in a kanamycin resistance plasmid and cloned in E. coli. Transformed. Equal amounts of bacteria were spread on medium containing either kanamycin or ampicillin. Transformed colonies can all be kanamycin resistant, but only those with an active mutated β-lactamase gene can grow on ampicillin. After overnight incubation, several colonies were obtained on both plates and at least one of the above sequences was found to encode an active β-lactamase. The number of colonies on the kanamycin plate was significantly higher than that on the ampicillin plate (roughly 5: 1), either because some sequence had lost its activity, or because the PCR transfer failed and the inactive or cleaving enzyme was present. It is suggested that was obtained.

【0176】 これらの可能性を区別するために、60のコロニーをカナマイシンプレートか
ら選び、プラスミドDNAを配列決定した。表5に示す分布が得られた。 表5:PDA予測パーセンテージ 対 設計位置についての実験で観察されたパー
センテージ
To distinguish these possibilities, 60 colonies were picked from kanamycin plates and the plasmid DNA sequenced. The distribution shown in Table 5 was obtained. Table 5: PDA Predicted Percentages vs Percentages Observed in Experiments for Design Positions

【表4】 [Table 4]

【0177】 4位置の全てにおける各アミノ酸の観察パーセンテージが予測パーセンテージ
と近接して適合していることに注目すべきである。配列決定においても、60個
のコロニーのうち1個のみがPCRエラー(GからCへのトランジション)を含ん
でいたことが明らかになった。
It should be noted that the observed percentage of each amino acid in all four positions fits closely with the predicted percentage. Sequencing also revealed that only 1 out of 60 colonies contained a PCR error (G to C transition).

【0178】 この小テストは、プールしたオリゴヌクレオチドとの複数PCRを使用して、
望ましい比率のアミノ酸変化を反映させた配列ライブラリーを作成することがで
きることを示している。
This quiz uses multiple PCR with pooled oligonucleotides to
It shows that a sequence library can be created that reflects the desired ratio of amino acid changes.

【0179】 配列ライブラリーの実験的スクリーニング 変異配列のライブラリーを含む精製したPCR生成物を、予めXho1とHindlll
で消化させて精製したpCR-Xen1中でライゲートした。ライゲーション反応は、被
感染能力を持つTOP 10 E. coli 細胞(Invitrogen)中へ形質転換した。細胞を3
7℃で1時間回復させたあと、細胞を、抗生物質セフォタキシムを0.1μg/ml
から50μg/mlの濃度範囲で含むLBプレート上に広げて、抵抗の増強について
選択した。
Experimental Screening of Sequence Libraries Purified PCR products containing a library of mutant sequences were previously digested with Xho1 and Hindlll.
Ligated in pCR-Xen1 which had been digested with and purified. The ligation reaction was transformed into competent TOP 10 E. coli cells (Invitrogen). 3 cells
After recovering at 7 ° C for 1 hour, the cells were treated with the antibiotic cefotaxime at 0.1 µg / ml.
Were spread on LB plates containing a concentration range from 1 to 50 μg / ml and selected for enhanced resistance.

【0180】 ただ単回のスクリーニングで、酵素機能が35倍改善された三重変異体がみら
れた(図4参照)。この変異体(Y105Q, N136D, N170L)は50μg/mlセフォタキシ
ムにおいても残存していた。
Only in a single screen were triple mutants with 35-fold improved enzyme function (see FIG. 4). This mutant (Y105Q, N136D, N170L) remained even at 50 μg / ml cefotaxime.

【0181】 実施例2 キシラナーゼの二次ライブラリー生成 PDAプレスクリーニングは可能性のある配列数の桁はずれな縮小化につながる コンピューター処理プレスクリーニングが可能であり、そして実験的にスクリ
ーニングしなければならない配列数を顕著に縮小できることを明示するために、
基質存在下または非存在下でのB. circulansキシラナーゼについての初期計算を
行なった。B. circulansキシラナーゼのPDB構造1XNと酵素基質複合体用の1BC
Xを使用した。結合部位の内部の27残基が、活性部位に属することを視覚的に
同定した。これらの残基の8個を、酵素活性に絶対的に必須であると考えた。こ
れらの位置を野生型残基として取扱った。これは、これらの構造が変化可能であ
るが、アミノ酸の同一性はそうではないことを意味する(図2参照)。
Example 2 Secondary Library Generation of Xylanase PDA Prescreening Leads to Out-of-Order Reduction of Possible Sequence Numbers Computational Prescreening Is Possible and Sequences That Must Be Screened Experimentally To make it clear that the number can be reduced significantly,
Initial calculations were performed for B. circulans xylanase in the presence or absence of substrate. PDB structure of B. circulans xylanase 1XN and 1BC for enzyme substrate complex
I used X. The 27 residues within the binding site were visually identified as belonging to the active site. Eight of these residues were considered absolutely essential for enzyme activity. These positions were treated as wild type residues. This means that their structures are variable, but amino acid identity is not (see Figure 2).

【0182】 20種の天然型アミノ酸のうち3種(システイン、プロリン、およびグリシン)
は考慮しなかった。その結果、残りの19の位置で未だ17種の異なるアミノ酸
の可能性があった;問題は、1719=2.4×1023の異なるアミノ酸配列が生
ずることである。この数は、革新方法を指向している最新技術で扱えるものより
、10桁大きい。これらのアプローチを使用して問題を完全に三次元的にスクリ
ーンし、多様な置換えを有する全配列を考慮することは不可能であることは明ら
かである。従って、PDA計算を行なって検索区域を減少させた。最も低いエネ
ルギー配列10,000のリストを作り、そして各位置における各アミノ酸の確
率を決定した(表1参照)。
Three of the twenty natural amino acids (cysteine, proline, and glycine)
Did not consider. As a result, there was still a possibility of 17 different amino acids at the remaining 19 positions; the problem is that 17 19 = 2.4 × 10 23 different amino acid sequences occur. This number is ten orders of magnitude higher than that available in the state-of-the-art oriented innovation methods. Obviously, it is not possible to screen the problem completely three-dimensionally using these approaches and to consider the entire sequence with various permutations. Therefore, PDA calculations were performed to reduce the search area. A list of 10,000 lowest energy sequences was made and the probability of each amino acid at each position was determined (see Table 1).

【0183】 表1:野生型(WT)酵素構造のPDA計算の結果として得られる設計位置における
、各アミノ酸の確率。確率が1%より大きいアミノ酸のみを示す。
Table 1: Probability of each amino acid at the design position resulting from PDA calculation of wild type (WT) enzyme structure. Only amino acids with a probability greater than 1% are shown.

【表5】 もし、PDA計算で得られたアミノ酸全てを考慮する場合、確率1%以下のも
のを含めて、4.1×1015種の異なるアミノ酸配列があることになる。これは
7桁の大きさの縮小である。表1に示された、少なくとも1%またはそれ以上の
可能性を有するアミノ酸(1%基準)のみを考慮する場合、問題は3.3×109
列まで減少する。可能性が5%以下のアミノ酸(5%基準)の全てを無視すると、
4.0×106の配列のみが残る。これはスクリーニング技術および遺伝子シャフ
リング技術で容易に扱うことができる数である。低エネルギー配列のリストを1
00,000に増やすことは、これらの数を顕著に変えることではなく、各位置
で得られるアミノ酸の作用は取るに足らない。変更は、可能性が1%以下のアミ
ノ酸の間のみでおこる。
[Table 5] If all the amino acids obtained by PDA calculation are considered, there are 4.1 × 10 15 different amino acid sequences, including those with a probability of 1% or less. This is a 7-digit size reduction. If only the amino acids shown in Table 1 with a probability of at least 1% or more (1% basis) are considered, the problem is reduced to 3.3 × 10 9 sequences. Ignoring all amino acids (5% basis) that are less than 5% likely,
Only 4.0 × 10 6 sequences remain. This is a number that can be easily handled by screening and gene shuffling techniques. List of low energy arrays 1
Increasing to 00,000 does not change these numbers significantly, and the effect of the amino acid obtained at each position is insignificant. Changes occur only between amino acids that are less than 1% likely.

【0184】 PDA計算に基質を含めると、各位置で見出されるアミノ酸の数がさらに減少
した。5%より高い可能性を有するアミノ酸を考慮する場合、2.4×106の配
列である(表2参照)。 表2:酵素基質複合体のPDA計算から得られる設計位置での、アミノ酸の可能
性。可能性が1%以上のアミノ酸のみを示す。
Inclusion of substrate in the PDA calculation further reduced the number of amino acids found at each position. Considering the amino acids with a probability higher than 5%, it has a sequence of 2.4 × 10 6 (see Table 2). Table 2: Possibility of amino acids at the design position resulting from PDA calculation of enzyme substrate complex. Only amino acids with a probability of 1% or higher are shown.

【表6】 [Table 6]

【0185】 これらの予備的計算は、PDAが問題の大きさを顕著に減少させることができ
、遺伝子シャフリング技術およびスクリーニング技術の範囲内とすることができ
ることを示している(図3参照)。
These preliminary calculations show that PDA can significantly reduce the size of the problem and fall within the scope of gene shuffling and screening techniques (see Figure 3).

【図面の簡単な説明】[Brief description of drawings]

【図1】 図1は、完全長遺伝子の合成およびPCRによる可能な全変異導
入を描く。
FIG. 1 depicts the synthesis of a full length gene and all possible mutagenesis by PCR.

【図2】 図2は、PDAスクリーニングによる配列空間の大きさの減少を
示す。
FIG. 2 shows the reduction in size of sequence space by PDA screening.

【図3】 図3は、ビー・シルクランス(B.circulans)キシラナーゼの活
性部位を示す。
FIG. 3 shows the active site of B. circulans xylanase.

【図4】 図4は、大腸菌(E.coli)発現性野生型(WT)およびPDAス
クリーンβ−ラクタマーゼのセフォタキシム耐性を示す。
FIG. 4 shows cefotaxime resistance of E. coli expressing wild type (WT) and PDA screen β-lactamase.

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C U,CZ,DE,DK,EE,ES,FI,GB,GD ,GE,GH,GM,HR,HU,ID,IL,IN, IS,JP,KE,KG,KP,KR,KZ,LC,L K,LR,LS,LT,LU,LV,MD,MG,MK ,MN,MW,MX,NO,NZ,PL,PT,RO, RU,SD,SE,SG,SI,SK,SL,TJ,T M,TR,TT,TZ,UA,UG,UZ,VN,YU ,ZA,ZW (72)発明者 バシル・アイ・ダヒヤット アメリカ合衆国90065カリフォルニア州ロ サンジェルス、サン・アンドレアス・アベ ニュー4413番 (72)発明者 イェルク・ベントツィーン アメリカ合衆国91101カリフォルニア州パ サディナ、プレザント・ストリート・ナン バー307、277番 Fターム(参考) 4B024 AA20 BA11 BA12 CA04 HA01 5B046 AA00 KA06 ─────────────────────────────────────────────────── ─── Continued front page    (81) Designated countries EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, I T, LU, MC, NL, PT, SE), OA (BF, BJ , CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, GM, K E, LS, MW, SD, SL, SZ, TZ, UG, ZW ), EA (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), AE, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, C U, CZ, DE, DK, EE, ES, FI, GB, GD , GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, L K, LR, LS, LT, LU, LV, MD, MG, MK , MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, T M, TR, TT, TZ, UA, UG, UZ, VN, YU , ZA, ZW (72) Inventor Basil I Dahyat             United States 90065 California California             San Angels, San Andreas Abe             New 4413 (72) Inventor Jörg Benttwyn             United States 91101 Pa, California             Sadina, Pleasant Street Nan             Bars 307 and 277 F-term (reference) 4B024 AA20 BA11 BA12 CA04 HA01                 5B046 AA00 KA06

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 a)骨格蛋白質の一次変異体配列のランク順リストを含む、一
次ライブラリーを用意すること; b)該一次ライブラリーにおける一次変異位置のリストを作成すること; c)複数の該一次変異位置を組合せて、二次配列の二次ライブラリーを作成するこ
と; を含む、骨格蛋白質変異体の二次ライブラリーの生成方法。
1. A) preparing a primary library containing a ranked ordered list of primary variant sequences of scaffold proteins; b) creating a list of primary mutation positions in the primary library; c) a plurality of Combining the primary mutation positions to create a secondary library of secondary sequences; and, producing a secondary library of scaffold protein variants.
【請求項2】 a)骨格蛋白質の一次変異体配列のランク順リストを含む、一
次ライブラリーを用意すること; b)複数の変異位置におけるアミノ酸残基の確率分布を作成すること; c)複数の該一次変異位置を組合せて、二次配列の二次ライブラリーを作成するこ
と; を含む、骨格蛋白質変異体の二次ライブラリーの生成方法。
2. A) preparing a primary library containing a rank-ordered list of primary mutant sequences of a scaffold protein; b) creating a probability distribution of amino acid residues at a plurality of mutation positions; c) plural. Combining the primary mutation positions of to create a secondary library of secondary sequences;
【請求項3】 さらに、複数の該二次配列を合成することを含む、請求項1
に記載の方法。
3. The method of claim 1, further comprising synthesizing a plurality of said secondary sequences.
The method described in.
【請求項4】 該合成をプールしたオリゴヌクレオチドを用いる複数PCR
によって実施する、請求項2に記載の方法。
4. Multiple PCR using the pooled oligonucleotides of the synthesis.
The method of claim 2, wherein the method is performed by.
【請求項5】 該プールしたオリゴヌクレオチドを等モル量加える、請求項
4に記載の方法。
5. The method of claim 4, wherein the pooled oligonucleotides are added in equimolar amounts.
【請求項6】 該プールしたオリゴヌクレオチドを、変異の回数に対応した
量で加える、請求項4に記載の方法。
6. The method according to claim 4, wherein the pooled oligonucleotide is added in an amount corresponding to the number of mutations.
【請求項7】 二次ライブラリーのサブセットを含む、複数の二次変異体蛋
白質を含む、組成物。
7. A composition comprising a plurality of secondary variant proteins comprising a subset of a secondary library.
【請求項8】 二次ライブラリーのサブセットを含む複数の二次変異体蛋白
質をコード化する、複数の核酸を含む、組成物。
8. A composition comprising a plurality of nucleic acids encoding a plurality of secondary variant proteins comprising a subset of a secondary library.
【請求項9】 a)骨格蛋白質の一次変異体の第1ライブラリーのランク順リ
ストを用意すること; b)複数の変異位置におけるアミノ酸残基の確率分布を作成すること; c)複数の該アミノ酸残基を含む骨格蛋白質の二次変異体を複数合成して、二次ラ
イブラリーを形成させること; 但し、該二次変異体の少なくとも1つは該一次変異体と異なる、 を含む、骨格蛋白質変異体の二次ライブラリーの生成方法。
9. A) preparing a rank-ordered list of the first library of primary variants of skeletal proteins; b) creating a probability distribution of amino acid residues at a plurality of mutation positions; c) a plurality of such sequences. Synthesizing a plurality of secondary mutants of a scaffold protein containing amino acid residues to form a secondary library; provided that at least one of the secondary mutants is different from the primary mutant. A method for generating a secondary library of protein variants.
JP2000577277A 1998-10-16 1999-10-15 Protein design automation for protein libraries Pending JP2003527072A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10461298P 1998-10-16 1998-10-16
US60/104,612 1998-10-16
US15870099P 1999-10-08 1999-10-08
US60/158,700 1999-10-08
PCT/US1999/024229 WO2000023564A2 (en) 1998-10-16 1999-10-15 Protein design automation for protein libraries

Publications (2)

Publication Number Publication Date
JP2003527072A true JP2003527072A (en) 2003-09-16
JP2003527072A5 JP2003527072A5 (en) 2006-06-29

Family

ID=26801737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000577277A Pending JP2003527072A (en) 1998-10-16 1999-10-15 Protein design automation for protein libraries

Country Status (5)

Country Link
EP (1) EP1157093A1 (en)
JP (1) JP2003527072A (en)
AU (2) AU774334B2 (en)
CA (1) CA2347214A1 (en)
WO (1) WO2000023564A2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521933A (en) * 2000-02-10 2003-07-22 ゼンコー Protein design automation for protein libraries
JP2008526186A (en) * 2005-01-03 2008-07-24 エフ.ホフマン−ラ ロシュ アーゲー Hemopexin-like structure as a polypeptide scaffold

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2286262A1 (en) 1997-04-11 1998-10-22 California Institute Of Technology Apparatus and method for automated protein design
US20020048772A1 (en) 2000-02-10 2002-04-25 Dahiyat Bassil I. Protein design automation for protein libraries
US7315786B2 (en) 1998-10-16 2008-01-01 Xencor Protein design automation for protein libraries
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US8457903B1 (en) 1999-01-19 2013-06-04 Codexis Mayflower Holdings, Llc Method and/or apparatus for determining codons
US7873477B1 (en) 2001-08-21 2011-01-18 Codexis Mayflower Holdings, Llc Method and system using systematically varied data libraries
US7702464B1 (en) 2001-08-21 2010-04-20 Maxygen, Inc. Method and apparatus for codon determining
US20070065838A1 (en) 1999-01-19 2007-03-22 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6946265B1 (en) 1999-05-12 2005-09-20 Xencor, Inc. Nucleic acids and proteins with growth hormone activity
US6746853B1 (en) 1999-05-19 2004-06-08 Xencor, Inc. Proteins with insulin-like activity useful in the treatment of diabetes
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
EP1621617A1 (en) * 2000-02-10 2006-02-01 Xencor, Inc. Protein design automation for protein libraries
US7244823B2 (en) 2000-03-02 2007-07-17 Xencor TNF-alpha variants proteins for the treatment of TNF-alpha related disorders
US7687461B2 (en) 2000-03-02 2010-03-30 Xencor, Inc. Treatment of TNF-α related disorders with TNF-α variant proteins
US7662367B2 (en) 2000-03-02 2010-02-16 Xencor, Inc. Pharmaceutical compositions for the treatment of TNF-α related disorders
US7446174B2 (en) 2001-03-02 2008-11-04 Xencor, Inc. Protein based TNF-α variants for the treatment of TNF-α related disorders
US7101974B2 (en) 2000-03-02 2006-09-05 Xencor TNF-αvariants
US7056695B2 (en) 2000-03-02 2006-06-06 Xencor TNF-α variants
AU2001278872A1 (en) * 2000-07-06 2002-01-21 Genvec, Inc. Method of identifying a binding partner of a gene product
ATE396539T1 (en) 2000-07-13 2008-06-15 Ct Concept Technologie Ag METHOD AND DEVICE FOR STATE-DEPENDENT CONTROL OF THE TRANSIENT BEHAVIOR OF POWER SEMICONDUCTOR SWITCHES
WO2002031745A1 (en) * 2000-10-10 2002-04-18 Genencor International, Inc. Information rich libraries
US7351690B2 (en) 2000-12-19 2008-04-01 Palatin Technologies, Inc. Knockout identification of target-specific sites in peptides
AU2002251999A1 (en) * 2001-02-22 2002-09-12 Xencor Methods and compositions for the construction and use of fusion libraries using computational protein design methods
CA2447407A1 (en) 2001-05-04 2002-11-14 Xencor Nucleic acids and proteins with thioredoxin reductase activity
US7381792B2 (en) 2002-01-04 2008-06-03 Xencor, Inc. Variants of RANKL protein
US7662925B2 (en) 2002-03-01 2010-02-16 Xencor, Inc. Optimized Fc variants and methods for their generation
US7317091B2 (en) 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
US20040132101A1 (en) 2002-09-27 2004-07-08 Xencor Optimized Fc variants and methods for their generation
US8188231B2 (en) 2002-09-27 2012-05-29 Xencor, Inc. Optimized FC variants
DE10233047A1 (en) * 2002-07-19 2004-02-26 Amaxa Gmbh Preparing synthetic polypeptides, particularly fluorescent proteins, useful in pharmaceutical compositions, by aligning sequences of known proteins to define an average sequence
US8084582B2 (en) 2003-03-03 2011-12-27 Xencor, Inc. Optimized anti-CD20 monoclonal antibodies having Fc variants
US8388955B2 (en) 2003-03-03 2013-03-05 Xencor, Inc. Fc variants
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
US9051373B2 (en) 2003-05-02 2015-06-09 Xencor, Inc. Optimized Fc variants
US8101720B2 (en) 2004-10-21 2012-01-24 Xencor, Inc. Immunoglobulin insertions, deletions and substitutions
US9714282B2 (en) 2003-09-26 2017-07-25 Xencor, Inc. Optimized Fc variants and methods for their generation
EP1697741A4 (en) 2003-12-04 2008-02-13 Xencor Inc Methods of generating variant proteins with increased host string content and compositions thereof
US20150010550A1 (en) 2004-07-15 2015-01-08 Xencor, Inc. OPTIMIZED Fc VARIANTS
EP2314618A3 (en) 2004-11-12 2011-10-19 Xencor Inc. Fc variants with altered binding to FcRn
US8546543B2 (en) 2004-11-12 2013-10-01 Xencor, Inc. Fc variants that extend antibody half-life
US8367805B2 (en) 2004-11-12 2013-02-05 Xencor, Inc. Fc variants with altered binding to FcRn
US8802820B2 (en) 2004-11-12 2014-08-12 Xencor, Inc. Fc variants with altered binding to FcRn
CA2624189A1 (en) 2005-10-03 2007-04-12 Xencor, Inc. Fc variants with optimized fc receptor binding properties
CA2625998C (en) 2005-10-06 2015-12-01 Xencor, Inc. Optimized anti-cd30 antibodies
DK2383297T5 (en) 2006-08-14 2022-07-04 Xencor Inc Optimized antibodies directed against CD19
CA2660795C (en) 2006-09-18 2014-11-18 Xencor, Inc. Optimized antibodies that target hm1.24
ES2742268T3 (en) 2007-12-26 2020-02-13 Xencor Inc Fc variants with altered FcRn binding
CA2738282C (en) 2008-09-26 2016-05-24 Nippon Suisan Kaisha, Ltd. Method for concentrating lipids
US9493578B2 (en) 2009-09-02 2016-11-15 Xencor, Inc. Compositions and methods for simultaneous bivalent and monovalent co-engagement of antigens
US8362210B2 (en) 2010-01-19 2013-01-29 Xencor, Inc. Antibody variants with enhanced complement activity

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5605793A (en) * 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
GB9701425D0 (en) * 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function
CA2286262A1 (en) * 1997-04-11 1998-10-22 California Institute Of Technology Apparatus and method for automated protein design
EP1179075A2 (en) * 1999-05-12 2002-02-13 Xencor, Inc. Bacillus circulans xylanase mutants

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521933A (en) * 2000-02-10 2003-07-22 ゼンコー Protein design automation for protein libraries
JP2008526186A (en) * 2005-01-03 2008-07-24 エフ.ホフマン−ラ ロシュ アーゲー Hemopexin-like structure as a polypeptide scaffold

Also Published As

Publication number Publication date
AU2004203224B2 (en) 2007-07-05
WO2000023564A2 (en) 2000-04-27
WO2000023564A3 (en) 2001-12-13
AU1119000A (en) 2000-05-08
AU2004203224A1 (en) 2004-08-12
AU774334B2 (en) 2004-06-24
CA2347214A1 (en) 2000-04-27
EP1157093A1 (en) 2001-11-28

Similar Documents

Publication Publication Date Title
JP2003527072A (en) Protein design automation for protein libraries
US6403312B1 (en) Protein design automatic for protein libraries
US20030049654A1 (en) Protein design automation for protein libraries
JP2003521933A (en) Protein design automation for protein libraries
US7315786B2 (en) Protein design automation for protein libraries
US7379822B2 (en) Protein design automation for protein libraries
Tang et al. Suprafacial orientation of the SCFCdc4 dimer accommodates multiple geometries for substrate ubiquitination
US20060160138A1 (en) Compositions and methods for protein design
US20070184487A1 (en) Compositions and methods for design of non-immunogenic proteins
US20030130827A1 (en) Protein design automation for protein libraries
Dower Targeting growth factor and cytokine receptors with recombinant peptide libraries
GB2356401A (en) Method for manipulating protein or DNA sequence data
EP1482434A2 (en) Protein design automation for protein libraries
JP2005535281A (en) Method for increasing the expression level of a protein
AU754276B2 (en) Methods for producing libraries of expressible gene sequences
US20220112470A1 (en) Systems and methods for metabolic engineering
EP1621617A1 (en) Protein design automation for protein libraries
Gao Regulation of meiotic recombination by a multifunctional ATF/CREB protein
Richards et al. Biopolymers: Protein and Nucleic Acids
Martens et al. Cloning of an IgE Immunoregulatory Factor by Expression in Mammalian Cells
AU2002327442A1 (en) Protein design automation for protein libraries

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060511

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080527

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080602

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090413

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090928