JP2002537758A - Shuffling of codon-modified genes - Google Patents

Shuffling of codon-modified genes

Info

Publication number
JP2002537758A
JP2002537758A JP2000572353A JP2000572353A JP2002537758A JP 2002537758 A JP2002537758 A JP 2002537758A JP 2000572353 A JP2000572353 A JP 2000572353A JP 2000572353 A JP2000572353 A JP 2000572353A JP 2002537758 A JP2002537758 A JP 2002537758A
Authority
JP
Japan
Prior art keywords
codon
nucleic acid
altered
nucleic acids
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000572353A
Other languages
Japanese (ja)
Inventor
フィリップ エイ. パッテン,
ルー リュー,
ウィレム ピー. シー. ステマー,
Original Assignee
マキシジェン, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マキシジェン, インコーポレイテッド filed Critical マキシジェン, インコーポレイテッド
Publication of JP2002537758A publication Critical patent/JP2002537758A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • C07K14/505Erythropoietin [EPO]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/53Colony-stimulating factor [CSF]
    • C07K14/535Granulocyte CSF; Granulocyte-macrophage CSF
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00686Automatic
    • B01J2219/00689Automatic using computers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16111Human Immunodeficiency Virus, HIV concerning HIV env
    • C12N2740/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Toxicology (AREA)
  • Virology (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

(57)【要約】 コドン変更された核酸のライブラリーを組換える方法が、提供される。核酸は、野生型の配列と比較して、コドン変更に加えて、コード配列の保存的な改変または保存的ではない改変を含み得る。新規のタンパク質を作製する方法に加えて、野生型および弱毒化されたウイルスへの復帰の減少した速度を有するベクターを生成する方法もまた、提供される。   (57) [Summary] Methods for recombination of a library of codon-altered nucleic acids are provided. The nucleic acid may contain conservative or non-conservative alterations in the coding sequence in addition to the codon changes as compared to the wild-type sequence. In addition to methods for making novel proteins, methods for generating vectors with reduced rates of reversion to wild-type and attenuated viruses are also provided.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】 (関連出願の相互参照) 本出願は、1998年9月29日に提出された、PattenおよびStem
merによる、代理人登録番号第02−028500号の、USSN60/10
2,362「SHUFFLING OF CODON ALTERED GEN
ES」、および1999年1月29日に提出された、PattenおよびSte
mmerによる、代理人登録番号第02−028510号の、USSN60/1
17,729「SHUFFLING OF CODON ALTERED GE
NES」の仮ではない出願である。本出願はまた、1999年2月5日に提出さ
れた、Crameriら、代理人登録番号第02−296号による、USSN6
0/118,813「OLIGONUCLEOTIDE MEDIATED N
UCLEIC ACID RECOMBINATION」;および1999年1
月24日に提出された、Crameriら、代理人登録番号第02−296−1
号による、USSN60/141,049「OLIGONUCLEOTIDE
MEDIATED NUCLEIC ACID RECOMBINATION」
に関連する。
CROSS REFERENCE TO RELATED APPLICATIONS [0001] This application was filed on September 29, 1998 by Patten and Stem.
USSN 60/10, attorney registration no.
2,362 "SHUFFLING OF CODON ALTERED GEN
ES "and Patten and Ste, filed January 29, 1999.
USSN 60/1, attorney registration no.
17,729 "SHUFFLING OF CODON ALTERED GE
NES is not a provisional application. This application is also related to USSN6, filed February 5, 1999, by Crameri et al., Agent Registration No. 02-296.
0 / 118,813 "OLIGONUCLEOTIDE MEDIATED N
UCLEIC ACID RECOMBINATION "; and January 1999
Et al., Agent Registration No. 02-296-1, filed on March 24.
, USSN 60 / 141,049 "OLIGONUCLEOTIDE
MEDIATED NUCLEC ACID RECOMBINATION "
is connected with.

【0002】 (背景) 遺伝子コードは、高度に縮重している。アミノ酸をコードする全てのDNA/
RNAトリプレット(コドン)は、代表的には、ATG/AUG(メチオニンを
コードする)およびTGG/UGG(トリプトファンをコードする)を除いて、
対応する核酸配列によってコードされるタンパク質の配列を変更することなく、
変更され得る。おおまかに、平均(タンパク質間のアミノ酸の分布の変化)して
、各コードトリプレットは、およそ3個の異なる方法で置換され得る。なぜなら
、20個のアミノ酸をコードする61個のコドンが存在するからである(20個
のアミノ酸をコードする64個のコドンの全てについて、終止コドンをコードす
る3個のさらなるトリプレットが存在する)。このことは、所定のタンパク質を
コードする、およそ3n個の可能性のある配列の可能性のある配列多様性を示す
(ここで、nは、アミノ酸中のタンパク質の長さである)。容易に見出され得る
ように、適度な長さのタンパク質についてでさえ、可能性のある核酸の数(これ
は、タンパク質をコードし得る)は、宇宙における物理的粒子の数を上回る(約
1080粒子と推定される)。
BACKGROUND [0002] The genetic code is highly degenerate. All DNAs encoding amino acids /
RNA triplets (codons) are typically, except for ATG / AUG (encoding methionine) and TGG / UGG (encoding tryptophan),
Without altering the sequence of the protein encoded by the corresponding nucleic acid sequence,
Can be changed. Approximately, on average (change in distribution of amino acids between proteins), each code triplet can be replaced in approximately three different ways. Because there are 61 codons encoding 20 amino acids (for all 64 codons encoding 20 amino acids, there are 3 additional triplets encoding stop codons). This indicates a possible sequence diversity of approximately 3 n possible sequences encoding a given protein, where n is the length of the protein in amino acids. As can be easily found, even for moderately long proteins, the number of potential nucleic acids, which can encode proteins, exceeds the number of physical particles in the universe (about 10 Estimated to be 80 particles).

【0003】 個々のタンパク質についてのこのとてつもなく大きな可能性のある配列空間は
、興味深い進化的な関係を有する。例えば、超変異性のウイルス(例えば、HI
Vおよび他のレトロウイルス)は、代表的には、認識分子(例えば、ウイルスの
エンベロープタンパク質中)をコードするように使用される特定のコドンに一部
基づく、ランダムではない変異を蓄積することによって、宿主の免疫システムの
一歩先を行く。変異は、ランダムではない。なぜなら、ウイルスは、宿主の免疫
システムによって迅速には認識されない形態に変異する能力について選択される
からである。この結果、ウイルスは、例えば、エンベロープタンパク質をコード
するコドンのランダムではないセットを有するように選択され、これによって、
例えば、タンパク質構造中に特異的な変更を作製するような特異的な点変異を作
製することによって、ウイルスに迅速に形態をシフトさせる。
[0003] This tremendously large potential sequence space for individual proteins has interesting evolutionary relationships. For example, hypermutable viruses (eg, HI
V and other retroviruses) typically accumulate non-random mutations based in part on the particular codons used to encode recognition molecules (eg, in the viral envelope proteins). Go one step further in the host immune system. Mutations are not random. This is because viruses are selected for their ability to mutate into a form that is not quickly recognized by the host immune system. As a result, the virus is selected, for example, to have a non-random set of codons encoding the envelope protein, whereby
For example, by making specific point mutations that create specific alterations in the protein structure, the virus will rapidly shift form.

【0004】 コドン使用もまた、種内でランダムではない。全ての可能性のあるt−RNA
のサブセットを優先的に作製することによって、細胞は、エネルギーを節約し得
、そして細胞性の翻訳システムの効率を最適化し得るかまたは調節すらし得る。
この事実は、長く経験的に認識されており、しばしば、異なる可能性のあるリー
ディングフレームによって生じる単純にコドンを考慮することによって所定の核
酸配列のリーディングフレームを、研究者が最初に簡単に決定することを可能に
する。この「種のコドンの偏り」の1つの結果は、種中のタンパク質が、例えば
、点変異の結果として生じ得る、可能性のある変異の制限されたセットを有する
ことである。このことは、タンパク質の可能性のある進化の速度を制限する。
[0004] Codon usage is also not random within a species. All possible t-RNA
By preferentially producing a subset of the cells, cells can conserve energy and optimize or even regulate the efficiency of a cellular translation system.
This fact has long been empirically recognized and often allows researchers to first easily determine the reading frame of a given nucleic acid sequence by simply considering the codons caused by the potentially different reading frames. Make it possible. One consequence of this "species codon bias" is that the proteins in the species have a restricted set of possible mutations that can occur, for example, as a result of point mutations. This limits the possible rate of evolution of the protein.

【0005】 任意の所定のタンパク質をコードする核酸のコード配列の多様性に加えて、タ
ンパク質配列が、それ自体、極めて縮重していることが、現在、明らかである。
しばしば、タンパク質を構成するアミノ酸残基の多くが、タンパク質の三次構造
を有意に変更することなく、構造的に類似のアミノ酸ユニットに置換され得る。
従って、どの残基がタンパク質の所望される特性を改変または改良するのか決定
することは、困難であり得る。
[0005] In addition to the diversity of the coding sequences of nucleic acids encoding any given protein, it is now evident that protein sequences themselves are extremely degenerate.
Often, many of the amino acid residues that make up a protein can be replaced with structurally similar amino acid units without significantly altering the tertiary structure of the protein.
Thus, determining which residues alter or improve the desired properties of the protein can be difficult.

【0006】 商業的に価値のあるタンパク質については、天然のタンパク質のものとは異な
る、変異したスペクトルを利用し得ることが、所望される。本発明は、この特徴
および多くの他の特徴を提供し、これは、以下の完全な記載にもとづいて明らか
である。
For commercially valuable proteins, it is desirable to be able to utilize a mutated spectrum that is different from that of the native protein. The present invention provides this and many other features, which will be apparent based on the following complete description.

【0007】 (発明の要旨) 本発明は、タンパク質をコードする天然に存在する核酸において利用可能なも
のよりも、選択されたタンパク質についての完全に異なる変異したスペクトルに
接近する方法を提供する。これは、選択されたタンパク質についての強制的な進
化の型および速度を増大させ、これによって、タンパク質の任意の検出可能な特
徴の迅速な改善を可能にする。この方法においては、核酸は、変更されたコドン
使用を用いて合成され、そして/または核酸は、選択されたタンパク質と比較し
た場合に、1つまたはいくつかのアミノ酸残基の変更をコードする(ここで、ア
ミノ酸変化およびコドン使用の変化は、保存的であっても非保存的であってもよ
い)。得られるコドン/アミノ酸を改変された核酸(単数または複数)は、天然
の核酸と、またはお互いにのいずれか(あるいは両方)で、DNAシャッフリン
グ技術を使用して(代表的には、反復シャッフリング法を使用して)組換えられ
る。核酸またはコードされるタンパク質は、次いで、所望される特性についてス
クリーニングされる。
SUMMARY OF THE INVENTION [0007] The present invention provides a method of accessing a completely different mutated spectrum for a selected protein than is available in naturally occurring nucleic acids encoding the protein. This increases the type and rate of forced evolution for the selected protein, thereby allowing for rapid improvement of any detectable characteristics of the protein. In this method, the nucleic acid is synthesized using altered codon usage and / or the nucleic acid encodes one or several amino acid residue changes when compared to the selected protein ( Here, amino acid changes and codon usage changes may be conservative or non-conservative). The resulting codon / amino acid modified nucleic acid (s) may be used with DNA shuffling techniques (typically by an iterative shuffling method) either with natural nucleic acids or with each other (or both). Recombinant). The nucleic acid or encoded protein is then screened for the desired properties.

【0008】 従って、本発明は、コドン変更された核酸を作製する方法を提供する。この方
法においては、第1のポリペプチド配列をコードする第1の核酸が選択される。
複数のコドン変更された核酸配列(それらの各々が、第1のポリペプチドまたは
その改変された形態をコードする)が次いで選択され(例えば、コドン変更され
た核酸のライブラリーは、ライブラリーの成分または活性を認識する生物学的ア
ッセイにおいて選択され得る)、そして複数のコドン変更された核酸配列は、第
2のタンパク質をコードする標的のコドン変更された核酸を生じるように組換え
られる。標的のコドン変更された核酸は、次いで、必要に応じて、第1のポリペ
プチドの特性との比較を含む、検出可能な機能的または構造的特性についてスク
リーニングされる。このようなスクリーニングの目的は、第1のポリペプチドと
等価であるかまたはそれよりも優れた、構造的または機能的特性を有するポリペ
プチドを同定することである。このようなポリペプチドをコードする核酸は、細
胞、ベクター、ウイルス、弱毒化ウイルス(例えば、ワクチンまたは免疫原性組
成物の成分として)、トランスジェニック生物などへの標的のコドン変更された
核酸を導入することを含む、所望される本質的に任意の手順において使用され得
る。
Accordingly, the present invention provides a method for producing a codon-altered nucleic acid. In this method, a first nucleic acid encoding a first polypeptide sequence is selected.
A plurality of codon-altered nucleic acid sequences, each of which encodes a first polypeptide or an altered form thereof, are then selected (eg, a library of codon-altered nucleic acids is a component of the library). Or in a biological assay recognizing activity), and the plurality of codon-altered nucleic acid sequences are recombined to yield a target codon-altered nucleic acid encoding a second protein. The target codon-altered nucleic acid is then optionally screened for a detectable functional or structural property, including comparison to a property of the first polypeptide. The purpose of such a screen is to identify polypeptides that have structural or functional properties that are equivalent to or better than the first polypeptide. Nucleic acids encoding such polypeptides can be introduced into a cell, vector, virus, attenuated virus (eg, as a component of a vaccine or immunogenic composition), transgenic organism, etc., into a target codon-modified nucleic acid. It can be used in essentially any desired procedure, including:

【0009】 この方法を実行するためのキットおよび組成物もまた、提供される。これらは
、細胞の組換え混合物および基質(例えば、変更されたコドン使用を有する核酸
)、容器、方法を実行するための説明書などの1つ以上を含む。
[0009] Kits and compositions for performing the method are also provided. These include one or more of a recombinant mixture of cells and a substrate (eg, a nucleic acid with altered codon usage), a container, instructions for performing the method, and the like.

【0010】 (定義) 反対であることが明らかに示されない限り、以下の定義は、当該分野で公知の
用語の定義を補充する。
Definitions Unless clearly indicated to the contrary, the following definitions supplement the definitions of terms known in the art.

【0011】 本明細書中で使用される場合、「組換え」核酸は、2つ以上の核酸間、または
インビトロもしくは人工的なプロセスによって作製される任意の核酸の間で組換
えによって産生される、核酸である。用語「組換え」は、細胞に関して使用され
る場合は、細胞が異種核酸を含むか(そして必要に応じて複製する)、または異
種核酸によってコードされるペプチドまたはタンパク質を発現することを示す。
組換え細胞は、細胞の天然の(組換えではない)野生型の形態においては見出さ
れない遺伝子を含み得る。組換え細胞はまた、遺伝子が改変されそして人工的な
手段によって細胞中に再導入される場合、細胞の天然の形態において見出される
遺伝子を含み得る。この用語はまた、細胞から核酸を取り出すことなく、人工的
に改変されている細胞に対して内因性の核酸を含む細胞を含む;このような改変
として、遺伝子の置換、部位特異的変異、キメラ形成、および関連する技術によ
って得られるものが挙げられる。
[0011] As used herein, a "recombinant" nucleic acid is produced recombinantly between two or more nucleic acids, or any nucleic acid made by an in vitro or artificial process. , Nucleic acids. The term "recombinant," when used in reference to a cell, indicates that the cell contains (and optionally replicates) a heterologous nucleic acid or expresses a peptide or protein encoded by the heterologous nucleic acid.
Recombinant cells can contain genes that are not found in the cell's native (non-recombinant) wild-type form. Recombinant cells can also contain genes that are found in the cell's natural form when the genes are modified and reintroduced into the cell by artificial means. The term also includes cells containing nucleic acid endogenous to the cell that has been artificially modified without removing the nucleic acid from the cell; such modifications include gene substitutions, site-specific mutations, chimeras And those obtained by related techniques.

【0012】 「コドン変更された」核酸は、天然に存在する核酸によってコードされる天然
に存在するポリペプチドと類似であるかまたはそれと同一である、第1のポリペ
プチドをコードする第1の核酸である。ここで、第1の核酸は、第1のポリペプ
チドをコードする複数のコドンを利用し、これは、天然に存在するポリペプチド
をコードする天然に存在する核酸のコドンとは異なる。
A “codon-altered” nucleic acid is a first nucleic acid that encodes a first polypeptide that is similar to or identical to a naturally-occurring polypeptide encoded by a naturally-occurring nucleic acid. It is. Here, the first nucleic acid utilizes a plurality of codons encoding the first polypeptide, which is different from the codon of a naturally occurring nucleic acid encoding a naturally occurring polypeptide.

【0013】 「核酸配列」は、核酸(例えば、RNA、DNA、またはその改変された形態
、単離された形態、組換え形態、もしくは天然の形態)、あるいは核酸の一次構
造(配列)を示す文字の配列のような核酸の表示のいずれかをいう。
“Nucleic acid sequence” refers to a nucleic acid (eg, RNA, DNA, or a modified, isolated, recombinant, or natural form thereof) or the primary structure (sequence) of a nucleic acid. Refers to any representation of a nucleic acid, such as a sequence of letters.

【0014】 「ポリペプチド配列」は、ポリペプチド(その改変された形態、単離された形
態、組換え形態、もしくは天然の形態)、あるいはポリペプチドの一次構造(ア
ミノ酸配列)を示す文字の配列または他のキャラクターストリング情報のような
ポリペプチドの表示のいずれかをいう。
“Polypeptide sequence” is a character sequence that indicates a polypeptide (altered, isolated, recombinant, or natural form thereof) or the primary structure (amino acid sequence) of a polypeptide. Or other representations of the polypeptide, such as character string information.

【0015】 参照ポリペプチドの「改変された形態」は、参照ポリペプチドに対して類似で
あるが同一ではない配列を有する標的ポリペプチドである。標的ポリペプチドの
配列は、参照ポリペプチド配列の保存的または非保存的置換によって、参照ポリ
ペプチドとは異なり得る。上記により詳細に記載されるように、参照ポリペプチ
ドと比較して異なる非保存的置換を有する異なる標的ポリペプチドをコードする
異なる核酸は、参照ポリペプチドに対してより類似の標的ポリペプチドをコード
する組換え核酸を産生するように組換えられ得る。
A “modified form” of a reference polypeptide is a target polypeptide having a sequence that is similar, but not identical, to the reference polypeptide. The sequence of the target polypeptide can differ from the reference polypeptide by conservative or non-conservative substitutions of the reference polypeptide sequence. As described in more detail above, different nucleic acids encoding different target polypeptides having different non-conservative substitutions as compared to the reference polypeptide encode a more similar target polypeptide to the reference polypeptide It can be recombined to produce a recombinant nucleic acid.

【0016】 選択された核酸の「複数の形態」は、核酸の複数のホモログをいう。ホモログ
は、天然に存在するホモログ(例えば、2つ以上の相同遺伝子またはその誘導体
)に由来し得るか、または、関連する配列を有する1つ以上の核酸の人工的な合
成によるものであり得るか、または関連する核酸を生じるような1つ以上の核酸
の改変によるものであり得る。核酸は、それらが、共通の先祖配列から天然また
は人工的に由来した場合に、相同である。天然の進化の間では、これは、2つ以
上の子孫配列が、経時的に、すなわち、変異および天然の選択に起因して、親配
列から生じる場合に、生じる。人工的な条件下では、分岐は、例えば、2つの方
法の1つにおいて生じる。第1に、所定の配列は、別の配列と人工的に(例えば
、代表的なクローニングの間に、生じるように)組換えられ得、子孫核酸を生成
し得る。あるいは、核酸は、所定の親の核酸配列とは配列が異なる核酸を合成す
ることによって、新たに合成され得る。
The “plural forms” of a selected nucleic acid refer to multiple homologs of the nucleic acid. The homolog may be derived from a naturally occurring homolog (eg, two or more homologous genes or derivatives thereof) or may be due to the artificial synthesis of one or more nucleic acids having related sequences. , Or by altering one or more nucleic acids to give rise to related nucleic acids. Nucleic acids are homologous when they are derived, naturally or artificially, from a common ancestral sequence. During natural evolution, this occurs when more than one progeny sequence results from the parent sequence over time, ie, due to mutation and natural selection. Under artificial conditions, branching occurs, for example, in one of two ways. First, a given sequence can be artificially recombined with another sequence (eg, as occurs during a representative cloning) to produce progeny nucleic acids. Alternatively, the nucleic acid can be newly synthesized by synthesizing a nucleic acid having a sequence different from that of a predetermined parent nucleic acid sequence.

【0017】 2つの核酸の先祖についての明らかな知見が存在しない場合は、相同性は、代
表的には、2つの配列間の配列比較によって推測される。2つの核酸配列が配列
類似性を示す場合は、2つの核酸は共通の先祖を共有すると推測される。相同性
を確立するために必要とされる配列類似性の正確なレベルは、種々の因子に依存
して当該分野で変化する。この開示の目的のために、2つの配列は、それらが2
つの核酸分子間で組換えを生じることを可能にするに十分な配列同一性を共有す
る場合、または組換えを行うための能力を有する2つ以上の核酸を生じるコドン
の変化がなされ得る場合に、相同であると考えられる。代表的には、核酸は、組
換えが起こることを可能にするためにおおよそ同じ距離を空けて配置された、密
接に類似である領域を必要とする。
In the absence of apparent knowledge of the ancestry of two nucleic acids, homology is typically inferred by sequence comparison between the two sequences. If two nucleic acid sequences show sequence similarity, the two nucleic acids are presumed to share a common ancestor. The exact level of sequence similarity required to establish homology will vary in the art depending on various factors. For the purposes of this disclosure, two sequences are
If they share sufficient sequence identity to allow recombination to occur between two nucleic acid molecules, or if codon changes that result in two or more nucleic acids capable of performing recombination can be made , Are considered homologous. Typically, nucleic acids require closely similar regions, located approximately the same distance apart, to allow recombination to occur.

【0018】 用語「同一」またはパーセント「同一性」は、2つ以上の核酸配列またはポリ
ペプチド配列の状況においては、以下に記載される配列比較アルゴリズム(また
は当業者に利用可能な他のアルゴリズム)の1つを使用して、または視覚的な検
査によって測定されて、最大の対応について比較されて、そしてアラインメント
された場合に、同一であるかまたは同一であるアミノ酸残基もしくはヌクレオチ
ドの特定の割合を有する2つ以上の配列もしくはサブ配列をいう。
The terms “identical” or percent “identity” in the context of two or more nucleic acid or polypeptide sequences refer to the sequence comparison algorithms described below (or other algorithms available to those of skill in the art). A specific percentage of amino acid residues or nucleotides that are identical or identical when measured using one or by visual inspection, compared for greatest correspondence, and aligned Refers to two or more sequences or subsequences having

【0019】 句「実質的に同一」は、2つの核酸またはポリペプチドの状況においては、以
下の配列比較アルゴリズムの1つを使用するかまたは視覚的な検査によって測定
した場合に、最大の対応について比較されそしてアラインメントされた場合に、
少なくとも約40%、50%、60%、または好ましくは、約70%、または8
0%またはそれ以上、または最も好ましくは、90−95%のヌクレオチドまた
はアミノ酸残基の同一性を有する、2つ以上の配列またはサブ配列をいう。この
ような「実質的に同一である」配列は、代表的には、相同であるとみなされる。
好ましくは、「実質的な同一性」は、少なくとも約50残基の長さである配列の
領域にわたって存在し、より好ましくは、少なくとも約100残基の領域にわた
って存在し、そして最も好ましくは、配列は、少なくとも約150残基または比
較される2つの配列の全長にわたって、実質的に同一である。
The phrase “substantially identical” in the context of two nucleic acids or polypeptides refers to the greatest correspondence when using one of the following sequence comparison algorithms or as determined by visual inspection: When compared and aligned,
At least about 40%, 50%, 60%, or preferably about 70%, or 8
Refers to two or more sequences or subsequences that have 0% or more, or most preferably, 90-95% nucleotide or amino acid residue identity. Such "substantially identical" sequences are typically considered to be homologous.
Preferably, "substantial identity" exists over a region of the sequence that is at least about 50 residues in length, more preferably over a region of at least about 100 residues, and most preferably over a region of at least about 100 residues. Are substantially identical over at least about 150 residues or the entire length of the two sequences being compared.

【0020】 配列比較および相同性の決定については、代表的には、1つの配列は、試験配
列が比較される参考配列として作用する。配列比較アルゴリズムを使用する場合
は、試験および参考配列は、コンピューターに入力され、配列コーディネートが
設計され(必要な場合)、そして配列アルゴリズムプログラムパラメーターが設
計される。次いで、配列比較アルゴリズムが、参考配列と比較した試験配列(単
数または複数)についてのパーセント配列同一性を、設計されたプログラムパラ
メーターに基づいて計算する。
For sequence comparison and homology determination, typically one sequence acts as a reference sequence, to which test sequences are compared. When using a sequence comparison algorithm, test and reference sequences are entered into a computer, sequence coordination is designed (if necessary), and sequence algorithm program parameters are designed. The sequence comparison algorithm then calculates the percent sequence identity for the test sequence (s) compared to the reference sequence, based on the designed program parameters.

【0021】 比較のため配列の最適なアラインメントは、例えば、SmithおよびWat
erman、Adv.Appl.Math.2:482(1981)の局所的な
相同性アルゴリズムによって、NeedlmenおよびWunsch、J.Mo
l.Biol.48:443(1970)の相同アラインメントアルゴリズムに
よって、PearsonおよびLipman、Proc.Natl.Acad.
Sci.USA 85:2444(1988)の類似性検索方法によって、これ
らのアルゴリズムのコンピューター化された実行によって(Wisconsin
Genetics Software Package、Genetics
Computer Group、575、Science Dr.、Madis
on,WIのGAP、BESTFIT、FASTA、およびTFASTA)、ま
たは視覚的な検査(一般的には、Ausubelら、前出を参照のこと)によっ
て行われ得る。
The optimal alignment of sequences for comparison is, for example, Smith and Wat
erman, Adv. Appl. Math. 2: 482 (1981), by the homology alignment algorithm of Needlmen and Wunsch, J. Am. Mo
l. Biol. 48: 443 (1970), by the search for similarity method of Pearson and Lipman, Proc. Natl. Acad.
Sci. USA 85: 2444 (1988), by the computerized implementation of these algorithms (Wisconsin).
Genetics Software Package, Genetics
Computer Group, 575, Science Dr. , Madis
on, WI, GAP, BESTFIT, FASTA, and TFASTA), or by visual inspection (see generally Ausubel et al., supra).

【0022】 パーセント配列同一性および配列類似性を決定するために適切なアルゴリズム
の1つの例は、BLASTアルゴリズムである。これは、Altschulら、
J.Mol.Biol.215:403−410(1990)に記載されている
。BLAST分析を実行するためのソフトウェアは、National Cen
ter for Biotechnology Information(ht
tp://www.ncbi.nlm.nih.gov/)を通じて公に入手可
能である。このアルゴリズムは、尋問配列中の長さWの短いワードを同定するこ
とによって、最初に高スコアの配列対(HSP)を同定することを含む。これは
、データベース配列中の同じ長さのワードとアラインメントされた場合に、いく
つかの正の値の限界値スコアTと適合するかまたはそれを満たすかのいずれかで
ある。Tは、近隣ワードスコア限界と呼ばれる(Altschulら、前出)。
これらの最初の近隣ワードヒットは、それらを含有するより長いHSPを見つけ
るための検索を開始するためのシードとして作用する。このワードヒットは次い
で、累積アラインメントスコアが増大され得る限りは、各配列に沿って両方向で
拡大される。累積スコアは、ヌクレオチド配列については、パラメーターM(適
合する残基の対についての褒賞スコア;常に>0)およびN(適合しない残基に
ついてのペナルティースコア;常に<0)を使用して計算される。アミノ酸配列
については、スコアマトリックスは、累積スコアを計算するために使用される。
各方向においてのワードヒットの拡大は、以下の場合に停止する:累積アライン
メントスコアが、その達成された最大値から数量X下がる場合;累積スコアは、
1つ以上の負のスコア残基アラインメントの蓄積に起因して、0またはそれ未満
になる場合;またはいずれかの配列の末端に到達する場合。BLASTアルゴリ
ズムのパラメーターである、W、T、およびXは、アラインメントの感度および
速度を決定する。BLASTNプログラム(ヌクレオチド配列について)は、1
1のワード長(W)、10の期待値(E)、100のカットオフ、M=5、N=
−4、および両方の鎖の比較をデフォルトとして使用する。アミノ酸配列につい
ては、BLASTPプログラムは、3のワード長(W)、10の期待値(E)、
およびBLOSUM62スコアマトリックスをデフォルトとして使用する(He
nikoffおよびHenikoff(1989)Proc.Natl.Aca
d.Sci.USA 89:10915を参照のこと)。
One example of an algorithm that is suitable for determining percent sequence identity and sequence similarity is the BLAST algorithm. This is Altschul et al.
J. Mol. Biol. 215: 403-410 (1990). Software for performing BLAST analysis is available from National Cen.
ter for Biotechnology Information (ht
tp: // www. ncbi. nlm. nih. Gov /) is publicly available. The algorithm involves first identifying a high-scoring sequence pair (HSP) by identifying short words of length W in the interrogation sequence. It either matches or satisfies some positive value threshold score T when aligned with words of the same length in the database sequence. T is called the neighborhood word score limit (Altschul et al., Supra).
These first neighbor word hits act as seeds for initiating searches to find longer HSPs containing them. This word hit is then expanded in both directions along each sequence, as long as the cumulative alignment score can be increased. Cumulative scores are calculated for nucleotide sequences using the parameters M (reward score for matching residue pairs; always> 0) and N (penalty score for mismatching residues; always <0). . For amino acid sequences, a score matrix is used to calculate the cumulative score.
The expansion of word hits in each direction stops when: the cumulative alignment score drops by a quantity X from its maximum achieved; the cumulative score is:
Zero or less due to accumulation of one or more negative score residue alignments; or when reaching the end of either sequence. The parameters of the BLAST algorithm, W, T, and X, determine the sensitivity and speed of the alignment. The BLASTN program (for nucleotide sequences)
1 word length (W), 10 expected value (E), 100 cutoff, M = 5, N =
-4, and a comparison of both strands is used as default. For amino acid sequences, the BLASTP program gives a wordlength (W) of 3, an expected value (E) of 10,
And the BLOSUM62 score matrix as default (He
nikoff and Henikoff (1989) Proc. Natl. Aca
d. Sci. ScL USA 89: 10915).

【0023】 パーセント配列同一性を計算することに加えて、BLASTアルゴリズムはま
た、2つの配列間の類似性の統計学的な分析をも行う(例えば、Karlinお
よびAltschul(1993)Proc.Natl.Acad.Sci.U
SA 90:5873−5787を参照のこと)。BLASTアルゴリズムによ
って提供される類似性の1つの測定は、最少合計確率(P(N))である。これ
は、2つのヌクレオチド配列またはアミノ酸配列間の適合が偶然によって生じる
確率の指標を提供する。例えば、参照核酸に対する試験核酸の比較における最少
合計確率が、約0.1未満、より好ましくは、約0.01未満、そして最も好ま
しくは、約0.001未満である場合には、核酸は、参照配列に対して類似であ
ると考えられる。
[0023] In addition to calculating percent sequence identity, the BLAST algorithm also performs statistical analysis of the similarity between two sequences (eg, Karlin and Altschul (1993) Proc. Natl. Acad. .Sci.U
SA 90: 5873-5787). One measure of similarity provided by the BLAST algorithm is the minimum sum probability (P (N)). This provides an indication of the probability that a match between two nucleotide or amino acid sequences will occur by chance. For example, if the minimum total probability of comparison of a test nucleic acid to a reference nucleic acid is less than about 0.1, more preferably less than about 0.01, and most preferably less than about 0.001, the nucleic acid is: It is considered similar to the reference sequence.

【0024】 2つの核酸配列が実質的に同一/相同であることの別の指標は、2つの分子が
ストリンジェントな条件下で互いにハイブリダイズすることである。句「特異的
にハイブリダイズする」は、配列が複雑な混合(例えば、全細胞)DNAまたは
RNA中に存在する場合を含み、ストリンジェントな条件下で特定のヌクレオチ
ド配列に対してのみの分子の結合、二本鎖の形成、またはハイブリダイズをいう
。「実質的に結合する」は、プローブ核酸と標的核酸との間での相補的なハイブ
リダイゼーションをいい、そして標的ポリヌクレオチド配列の所望される検出を
達成するためのハイブリダイゼーション媒体のストリンジェンシーを低下させる
ことによって達成され得る主要ではない不適合を含む。
Another indication that two nucleic acid sequences are substantially identical / homologous is that the two molecules hybridize to each other under stringent conditions. The phrase “specifically hybridizes” includes where the sequences are present in complex mixed (eg, whole cell) DNA or RNA, and includes the ability of a molecule to bind to only a particular nucleotide sequence under stringent conditions. Refers to binding, duplex formation, or hybridization. "Substantially bind" refers to complementary hybridization between a probe nucleic acid and a target nucleic acid, and reduces the stringency of the hybridization medium to achieve the desired detection of the target polynucleotide sequence. Including minor incompatibilities that can be achieved by

【0025】 核酸のハイブリダイゼーション実験(例えば、サザンおよびノーザンハイブリ
ダイゼーション)の状況における、「ストリンジェントなハイブリダイゼーショ
ン条件および「ストリンジェントなハイブリダイゼーション洗浄条件」は、配列
依存的であり、そして異なる環境パラメーター下で異なる。より高いG:C含量
を有するより長い配列(単数または複数)は、より高い温度(またはより低い塩
濃度)で依然としてハイブリダイズする。核酸のハイブリダイゼーションに対す
る広範囲の指針は、Tijssen(1993)Laboratory Tec
hniques in Biochemistry and Molecula
r Biology−−Hybridization with Nuclei
c Acid Probes part I chapter 2「Overv
iew of principles of hybridization a
nd the strategy of nucleic acid prob
e assays」Elsvier,New Yorkに見出される。
In the context of nucleic acid hybridization experiments (eg, Southern and Northern hybridizations), “stringent hybridization conditions and“ stringent hybridization wash conditions ”are sequence-dependent and have different environmental parameters. Different below. The longer sequence (s) with a higher G: C content will still hybridize at higher temperatures (or lower salt concentrations). Extensive guidance on nucleic acid hybridization can be found in Tijssen (1993) Laboratory Tec.
hniques in Biochemistry and Molecula
r Biology--Hybridization with Nuclei
c Acid Probes part I chapter 2 "Overv
view of principals of hybridization a
nd the strategy of nucleic acid prob
eassays "found in Elsvier, New York.

【0026】 一般的には、高くストリンジェントなハイブリダイゼーション条件および洗浄
条件が、規定されたイオン強度およびpHで特定の配列についての融点温度(T m )よりも約5℃低くなるように選択される。代表的には、「ストリンジェント
な条件」下では、プローブは、その標的サブ配列にハイブリダイズするが、無関
係な(相同ではない)配列に対してはハイブリダイズしない。
In general, high stringency hybridization conditions and washing
Conditions are defined as the melting temperature (T.sub.T) for a particular sequence at a defined ionic strength and pH. m ) Is selected to be about 5 ° C. lower. Typically, "stringent
Under `` normal conditions, '' the probe will hybridize to its target subsequence, but
It does not hybridize to relevant (non-homologous) sequences.

【0027】 Tmは、完全に適合するプローブに対して標的配列の50%がハイブリダイズ
する温度(規定されたイオン強度およびpH下で)である。極めてストリンジェ
ントな条件は、特定のプローブについてTmと等しくなるように選択される。サ
ザンまたはノーザンブロットにおいてフィルター上の100を超える相補的な残
基を有する相補核酸のハイブリダイゼーションについてのストリンジェントなハ
イブリダイゼーション条件の例は、42℃で、1mgのヘパリンを含有する50
%のホルムアミドであり、ハイブリダイゼーションは一晩行われる。高くストリ
ンジェントな洗浄条件の例は、0.15MのNaClで72℃にて約15分間で
ある。ストリンジェントな洗浄条件の例は、0.2×SSCでの、65℃にて1
5分間の洗浄である(Sambrook、前出、SSC緩衝液の記載について)
。しばしば、高いストリンジェンシーの洗浄には、バックグラウンドのプローブ
のシグナルを除去するための低いストリンジェンシーでの洗浄が先行する。例え
ば、100を超えるヌクレオチドの二本鎖についての例示的な中程度のストリン
ジェンシーの洗浄は、1×SSCでの、45℃にて15分間である。例えば、1
00を超えるヌクレオチドの二本鎖についての例示的な低程度のストリンジェン
シーの洗浄は、4−6×SSCでの、40℃にて15分間である。短いプローブ
(例えば、約10−50ヌクレオチド)については、ストリンジェントな条件は
、代表的には、1.0MのNaイオンより低い(代表的には、約0.01から1
.0MのNaイオン濃度(または他の塩)、pH7.0から8.3)の塩濃度を
含み、そして温度は、代表的には、少なくとも約40℃である。ストリンジェン
トな条件はまた、ホルムアミドのような脱安定化剤の添加を用いて達成され得る
。一般的には、特定のハイブリダイゼーションアッセイにおいて無関係なプロー
ブについて観察されるものの2×(またはそれより大きい)のシグナル対ノイズ
比が、特異的なハイブリダイゼーションの検出を示す。シグナル対ノイズ比が無
関係なプローブ(例えば、相同ではないタンパク質をコードする核酸)の2×未
満である場合は、問題になっている核酸は、ストリンジェントな条件下ではハイ
ブリダイズしない。同様に、シグナル対ノイズ比が、ストリンジェントな条件下
で完全に適合するプローブについて観察されるものの25%未満である場合は、
核酸は、その用語が本明細書中で使用されるように、「ストリンジェントな条件
下でハイブリダイズ」しない。これは、高くストリンジェントな条件に対しては
適用されない。なぜなら、ストリンジェンシーは、完全に適合したプローブのみ
がハイブリダイズするまで、理論的に増大させられ得るからである。
T m is the temperature (under defined ionic strength and pH) at which 50% of the target sequence hybridizes to a perfectly matched probe. Extremely stringent conditions are chosen to be equal to Tm for a particular probe. An example of stringent hybridization conditions for hybridization of complementary nucleic acids with more than 100 complementary residues on a filter in a Southern or Northern blot is at 42 ° C containing 50 mg of heparin containing 1 mg of heparin.
% Formamide and hybridization is performed overnight. An example of high stringency washing conditions is 0.15 M NaCl at 72 ° C. for about 15 minutes. An example of stringent wash conditions is 0.2 × SSC at 65 ° C. for 1 hour.
5 minute wash (Sambrook, supra, for SSC buffer description)
. Often, high stringency washes are preceded by low stringency washes to remove background probe signals. For example, an exemplary moderate stringency wash for duplexes of more than 100 nucleotides is 1 × SSC at 45 ° C. for 15 minutes. For example, 1
An exemplary low stringency wash for duplexes of greater than 00 nucleotides is 4-6 × SSC at 40 ° C. for 15 minutes. For short probes (eg, about 10-50 nucleotides), stringent conditions are typically less than 1.0 M Na ion (typically about 0.01 to 1
. It contains a salt concentration of 0 M Na ion concentration (or other salt), pH 7.0 to 8.3) and the temperature is typically at least about 40 ° C. Stringent conditions may also be achieved with the addition of destabilizing agents such as formamide. Generally, a signal to noise ratio of 2x (or greater), as observed for an irrelevant probe in a particular hybridization assay, indicates the detection of specific hybridization. If the signal to noise ratio is less than 2 × that of an unrelated probe (eg, a nucleic acid encoding a non-homologous protein), the nucleic acid in question will not hybridize under stringent conditions. Similarly, if the signal to noise ratio is less than 25% of that observed for a perfectly matched probe under stringent conditions,
Nucleic acids do not "hybridize under stringent conditions," as the term is used herein. This does not apply for highly stringent conditions. This is because stringency can be increased theoretically until only perfectly matched probes hybridize.

【0028】 1つの例示的なハイブリダイゼーション手順においては、プローブされるべき
標的核酸は、任意の従来の方法によってフィルター上にブロットされる。無関係
な核酸(例えば、プラスミドベクター)(標的核酸は標的核酸と相同性を有さな
いと仮定する)もまた、フィルター上にほぼ等量でブロットされる。フィルター
は、標的核酸に対して相補的な標識されたプローブを用いてプローブされる。実
験は、相補的な標的に対する標識されたプローブのハイブリダイゼーションによ
るシグナルが、無関係なプラスミドベクター核酸に対するよりも10−100倍
高くなるまで、ハイブリダイゼーションおよび洗浄条件のストリンジェンシーを
漸増させて繰り返される。上記に記載されるようにして、一旦、これらの条件が
決定されると、試験核酸は、標的と同じ条件下でプローブされる。標識されたプ
ローブからのシグナルが、標的に対するプローブの結合によるシグナルの25%
程度またはそれより高い場合は、試験核酸は、プローブに対して「ストリンジェ
ントな条件下でハイブリダイズする」。シグナルが、25%未満である場合は、
試験核酸は、プローブに対してストリンジェントな条件下でハイブリダイズしな
い。
In one exemplary hybridization procedure, the target nucleic acid to be probed is blotted on a filter by any conventional method. Irrelevant nucleic acids (eg, plasmid vectors) (assuming the target nucleic acid has no homology to the target nucleic acid) are also blotted on the filter in approximately equal amounts. The filter is probed with a labeled probe complementary to the target nucleic acid. The experiment is repeated with increasing stringency of hybridization and washing conditions until the signal from hybridization of the labeled probe to a complementary target is 10-100 fold higher than to an irrelevant plasmid vector nucleic acid. Once these conditions are determined, as described above, the test nucleic acid is probed under the same conditions as the target. The signal from the labeled probe is 25% of the signal due to the binding of the probe to the target
To the extent or higher, the test nucleic acid "hybridizes under stringent conditions" to the probe. If the signal is less than 25%,
The test nucleic acid does not hybridize under stringent conditions to the probe.

【0029】 ストリンジェントな条件下で互いにハイブリダイズしない核酸は、それらがコ
ードするポリペプチドが実質的に同一である場合に、核酸の変異体形態としてな
お認識可能である。このことは、例えば、核酸のコピーが、遺伝子コードによっ
て許容される最大のコドン縮重を使用して作成されるように、生じる。このよう
な核酸は、本明細書中で詳細に記載されるように、mRNAの折り畳みにおける
差異、調節配列の変更などに起因して、機能的に等価ではない。
Nucleic acids that do not hybridize to each other under stringent conditions are still recognizable as variant forms of the nucleic acid when the polypeptides they encode are substantially identical. This occurs, for example, such that a copy of the nucleic acid is made using the maximum codon degeneracy permitted by the genetic code. Such nucleic acids are not functionally equivalent due to differences in mRNA folding, changes in regulatory sequences, and the like, as described in detail herein.

【0030】 2つの核酸配列またはポリペプチドが変異体形態である別の指標は、第1のポ
リペプチドに対して作成されたポリクローナル抗血清によって試験した場合に、
第1の核酸によってコードされるポリペプチドが、第2の核酸によってコードさ
れるポリペプチドと免疫学的に交差反応することである。従って、ポリペプチド
は、例えば、2つのペプチドが保存的置換によってのみ異なる場合には、代表的
には、第2のポリペプチドと実質的に同一である。
Another indication that two nucleic acid sequences or polypeptides are in a variant form is that when tested with a polyclonal antiserum raised against the first polypeptide,
That is, a polypeptide encoded by a first nucleic acid immunologically cross-reacts with a polypeptide encoded by a second nucleic acid. Thus, a polypeptide is typically substantially identical to a second polypeptide, for example, where the two peptides differ only by conservative substitutions.

【0031】 特定のポリヌクレオチド配列の「保存的に改変されたバリエーション」は、同
一または本質的に同一のアミノ酸配列をコードするポリヌクレオチドバリエーシ
ョンであるか、あるいはポリヌクレオチドがアミノ酸配列をコードしない場合に
は、本質的に同一の配列をコードするポリヌクレオチドバリエーションである。
遺伝子コードの縮重に起因して、多数の機能的に同一である核酸が、任意の所定
のポリペプチドをコードする。例えば、コドンCGU、CGC、CGA、CGG
、AGA、およびAGGは全て、アミノ酸アルギニンをコードする。従って、ア
ルギニンがコドンによって特定される全ての位置で、コドンは、コードされるポ
リペプチドを変更することなく、記載される対応するコドンのいずれかに対して
変更され得る。このような核酸のバリエーションは「サイレントなバリエーショ
ン」である。これらは、「保存的に改変されたバリエーション」の一種である。
ポリペプチドをコードする本明細書中に記載されているあらゆるポリヌクレオチ
ド配列はまた、必要に応じて、あらゆる可能性のあるサイレントなバリエーショ
ンを記載する。これは、他に記載されている場合を、除く。当業者は、核酸にお
ける各コドン(通常メチオニンのコドンであるAUG、および通常トリプトファ
ンのコドンであるTGGを除く)が、構造的に同一であるペプチドを生じるよう
に改変され得ることを認識する。
A “conservatively modified variation” of a particular polynucleotide sequence is a polynucleotide variation that encodes the same or essentially the same amino acid sequence, or when the polynucleotide does not encode an amino acid sequence. Are polynucleotide variations that encode essentially the same sequence.
Due to the degeneracy of the genetic code, a number of functionally identical nucleic acids encode any given polypeptide. For example, codons CGU, CGC, CGA, CGG
, AGA, and AGG all encode the amino acid arginine. Thus, at every position where an arginine is specified by a codon, the codon may be changed for any of the corresponding codons described without changing the encoded polypeptide. Such nucleic acid variations are "silent variations." These are a kind of “conservatively modified variations”.
Every polynucleotide sequence described herein which encodes a polypeptide also describes, as appropriate, all possible silent variations. This excludes cases where otherwise stated. One skilled in the art will recognize that each codon in the nucleic acid (except AUG, which is usually the codon for methionine, and TGG, which is usually the codon for tryptophan), can be modified to yield peptides that are structurally identical.

【0032】 さらに、当業者は、コードされる配列中の単一のアミノ酸またはアミノ酸の少
ない割合(代表的には5%未満、より代表的には1%未満)を変更、付加、また
は欠失させる個々の置換、欠失、または付加が、変更が化学的に類似のアミノ酸
でのアミノ酸の置換を生じる場合に、「保存的に改変されたバリエーション」で
あることを認識する。機能的に類似のアミノ酸を提供する保存的な置換の表は、
当該分野で周知である。以下の5つの群のそれぞれは、互いに保存的な置換であ
るアミノ酸を含む: 脂肪族性:グリシン(G)、アラニン(A)、バリン(V)、ロイシン(L)
、イソロイシン(I);芳香族:フェニルアラニン(F)、チロシン(Y)、ト
リプトファン(W);イオウを含有する:メチオニン(M)、システイン(C)
;塩基性:アルギニン(R)、リジン(K)、ヒスチジン(H);酸性:アスパ
ラギン酸(D)、グルタミン酸(E)、アスパラギン(N)、グルタミン(Q)
。Creighton(1984)Proteins,W.H.Freeman
and Companyをもまた参照のこと。さらに、コードされる配列中の
単一のアミノ酸またはアミノ酸の少ない割合を、変更、付加、または欠失させる
個々の置換、欠失、または付加もまた、「保存的に改変されたバリエーション」
である。保存的バリエーションによって異なる配列は、一般的には相同である。
In addition, one skilled in the art will recognize that a single amino acid or a small percentage of amino acids (typically less than 5%, more typically less than 1%) in the encoded sequence may be altered, added, or deleted. Recognizing a "conservatively modified variation" is where the individual substitutions, deletions, or additions made, when the alteration results in the replacement of the amino acid with a chemically similar amino acid. A table of conservative substitutions that provide functionally similar amino acids is
It is well known in the art. Each of the following five groups contains amino acids that are conservative substitutions for each other: Aliphatic: glycine (G), alanine (A), valine (V), leucine (L)
, Isoleucine (I); aromatic: phenylalanine (F), tyrosine (Y), tryptophan (W); containing sulfur: methionine (M), cysteine (C)
Basic: arginine (R), lysine (K), histidine (H); acidic: aspartic acid (D), glutamic acid (E), asparagine (N), glutamine (Q)
. Creighton (1984) Proteins, W.C. H. Freeman
See also and Company. In addition, individual substitutions, deletions, or additions that alter, add, or delete a single amino acid or a small percentage of amino acids in the encoded sequence are also "conservatively modified variations."
It is. Sequences that differ by conservative variations are generally homologous.

【0033】 用語「単離された」は、核酸またはタンパク質に対して適用される場合は、核
酸またはタンパク質が、それが天然の状態において結合している他の細胞性の成
分または他の成分(例えば、ライブラリーの成分)を本質的に含まないことを意
味する。
When the term “isolated” is applied to a nucleic acid or protein, the nucleic acid or protein is bound to other cellular or other components with which it is naturally associated ( (E.g., components of a library).

【0034】 用語「核酸」は、一本鎖または二本鎖の形態のいずれかでの、そのデオキシリ
ボヌクレオチドまたはリボヌクレオチド、およびそれらのポリマーをいう。特に
限定されない限りは、この用語は、参照核酸と類似の結合特性を有し、そして天
然に存在するヌクレオチドと類似の様式で代謝される天然のヌクレオチドの既知
のアナログを含む核酸を含む。他に記載されない限りは、特定の核酸配列はまた
、その保存的に改変された変異体(例えば、縮重コドンの置換)および相補的な
配列、ならびに明確に示された配列を明確に含む。詳細には、縮重コドンの置換
は、1つ以上の選択された(または全ての)コドンの3番目の位置が混合された
塩基および/またはデオキシイノシン残基で置換されている配列を作成すること
によって、達成され得る(Batzerら、(1991)Nucleic Ac
id Res.19:5081;Ohtsukaら、(1985)J.Biol
.Chem.260:2605−2608;Cassolら(1992);Ro
ssoliniら(1994)Mol.Cell.Probes 8:91−9
8)。用語核酸は、用語「遺伝子」、「DNA」、「cDNA」、「オリゴヌク
レオチド」、「RNA」、「mRNA」などに対して一般的である。
The term “nucleic acid” refers to its deoxyribonucleotides or ribonucleotides and their polymers, in either single-stranded or double-stranded form. Unless specifically limited, the term includes nucleic acids that have similar binding properties as a reference nucleic acid, and that include known analogs of naturally occurring nucleotides that are metabolized in a manner similar to the naturally occurring nucleotides. Unless otherwise stated, a particular nucleic acid sequence also specifically includes conservatively modified variants thereof (eg, degenerate codon substitutions) and complementary sequences, as well as explicitly indicated sequences. In particular, substitution of degenerate codons creates a sequence in which the third position of one or more selected (or all) codons has been replaced with a mixed base and / or deoxyinosine residue. (Batzer et al., (1991) Nucleic Ac
id Res. 19: 5081; Ohtsuka et al., (1985) J. Am. Biol
. Chem. 260: 2605-2608; Cassol et al. (1992); Ro
(1994) Mol. Cell. Probes 8: 91-9
8). The term nucleic acid is generic to the terms "gene", "DNA", "cDNA", "oligonucleotide", "RNA", "mRNA" and the like.

【0035】 「遺伝子に由来する核酸」は、遺伝子またはそのサブ配列の合成について最終
的に鋳型として作用した核酸をいう。従って、mRNA、mRNAから逆転写さ
れたcDNA、cDNAから転写されたRNA、cDNAから増幅されたDNA
、増幅されたDNAから転写されたRNAなどは全て、遺伝子に由来し、そして
このような由来された産物の検出はサンプル中のもともとの遺伝子および/また
は遺伝子転写物の存在および/または量の指標である。
“Nucleic acid derived from a gene” refers to a nucleic acid that has ultimately acted as a template for the synthesis of a gene or a subsequence thereof. Accordingly, mRNA, cDNA reverse transcribed from mRNA, RNA transcribed from cDNA, DNA amplified from cDNA
The RNA, etc., transcribed from the amplified DNA are all derived from genes, and the detection of such derived products is an indication of the presence and / or amount of the original gene and / or gene transcript in the sample. It is.

【0036】 核酸は、それが別の核酸配列と機能的な関係で配置される場合に、「作動可能
に連結される」。例えば、プロモーターまたはエンハンサーは、それがコード配
列の転写を増大させる場合には、コード配列に作動可能に連結される。
A nucleic acid is “operably linked” when it is placed into a functional relationship with another nucleic acid sequence. For example, a promoter or enhancer is operably linked to a coding sequence if it increases the transcription of the coding sequence.

【0037】 「組換え発現カセット」または単純に「発現カセット」は、このような配列と
適合性である宿主において構造遺伝子の発現に影響を与え得る核酸エレメントを
用いて、組換え的にまたは合成によって生成された核酸構築物である。発現カセ
ットは、少なくともプロモーターを、そして必要に応じて、転写終結シグナルを
含む。代表的には、組換え発現カセットは、転写される核酸(例えば、所望のポ
リペプチドをコードする核酸)、およびプロモーターを含む。発現に影響を与え
ることにおいて不可欠であるかまたはそれを助けるさらなる因子もまた、本明細
書中で記載されているように使用され得る。例えば、発現カセットはまた、宿主
細胞からの発現タンパク質の分泌を指向するシグナル配列をコードするヌクレオ
チド配列を含む。転写終結シグナル、エンハンサー、および遺伝子発現に影響を
与える他の核酸配列もまた、発現カセット中に含まれ得る。
A “recombinant expression cassette” or simply “expression cassette” is a recombinant or synthetic, nucleic acid element that can affect the expression of a structural gene in a host that is compatible with such a sequence. The nucleic acid construct produced by The expression cassette contains at least a promoter and, optionally, a transcription termination signal. Typically, a recombinant expression cassette includes a nucleic acid to be transcribed (eg, a nucleic acid encoding a desired polypeptide), and a promoter. Additional factors that are essential or aid in affecting expression can also be used as described herein. For example, the expression cassette also includes a nucleotide sequence that encodes a signal sequence that directs secretion of the expressed protein from the host cell. Transcription termination signals, enhancers, and other nucleic acid sequences that affect gene expression, can also be included in the expression cassette.

【0038】 (発明の詳細な説明) 本発明においては、DNAのシャッフリング手順についての基質の配列多様性
は、鋳型としてコドン変更された核酸を使用することによって、および/または
選択された野生型タンパク質と比較して保存的もしくは非保存的アミノ酸改変を
有するタンパク質をコードする鋳型を使用することによって、増大させられる。
DETAILED DESCRIPTION OF THE INVENTION In the present invention, the sequence diversity of the substrate for the DNA shuffling procedure is determined by using a codon-modified nucleic acid as a template and / or by selecting a selected wild-type protein. By using a template that encodes a protein having conservative or non-conservative amino acid modifications compared to

【0039】 これらのコドン変更された核酸は、化学的に合成され得る(例えば、標準的な
人工的な合成プロトコール(例えば、核酸が注文され得る市販の供給源によって
代表的に使用されるもの)を使用して)か、または当業者に入手可能な本明細書
中の種々の方法のいずれかを使用して作製され得る。例えば、標準的な合成方法
、続いて、ポリメラーゼおよび/またはリガーゼによって媒介されるオリゴヌク
レオチドの連結/組換えプロトコールを使用して、所望されるコドン変更された
核酸に対応するオリゴヌクレオチドフラグメントが、全長の核酸を生成するため
に作製され得る。
These codon-altered nucleic acids can be chemically synthesized (eg, standard artificial synthesis protocols (eg, those typically used by commercial sources from which nucleic acids can be ordered). Or using any of the various methods herein available to those skilled in the art. For example, using standard synthetic methods followed by polymerase and / or ligase mediated oligonucleotide ligation / recombination protocols, the oligonucleotide fragment corresponding to the desired codon-altered nucleic acid is converted to a full-length oligonucleotide fragment. Can be made to produce a nucleic acid.

【0040】 コドン使用の改変およびコードの改変の組み合わせは、選択されたタンパク質
を天然にコードする核酸に対するコドン変更された核酸のハイブリダイゼーショ
ンを低下させるかまたはストリンジェントな条件下では排除すらするに十分に広
範であり得る。このことは、可能性のある単一のヌクレオチド変異によって生じ
る変異を劇的に変更し、これによってDNAシャッフリングプロトコールについ
ての大きな多様性への接近を提供する。
The combination of codon usage alterations and coding alterations is sufficient to reduce hybridization or even eliminate under stringent conditions the codon-altered nucleic acid to the nucleic acid that naturally encodes the selected protein. Can be extensive. This dramatically alters the mutations caused by possible single nucleotide mutations, thereby providing access to great diversity for DNA shuffling protocols.

【0041】 さらに、DNAシャッフリング手順の間のこのような核酸の組換えおよび選択
は、可能性のある変異の異なるセットへの接近を生じるのみではなく、これはま
た、転写または翻訳の調節の改変された形態、核酸の局在化、mRNAの安定性
などの変更をも生じ得る。さらに、コドン変更された核酸の改変されたハイブリ
ダイゼーション特性は、可能性のある組換えのパートナーとハイブリダイズする
核酸の能力における変更を導き、これは、シャッフリングの間の利用可能な組換
えの多様性を変更しそして最終的に増大させる。
In addition, recombination and selection of such nucleic acids during a DNA shuffling procedure not only results in access to a different set of potential mutations, but also results in altered regulation of transcription or translation. Altered morphology, nucleic acid localization, mRNA stability, etc. can also occur. In addition, the altered hybridization properties of the codon-altered nucleic acids lead to an alteration in the ability of the nucleic acid to hybridize with potential recombination partners, which results in a diversity of available recombination during shuffling. Gender changes and eventually increases.

【0042】 さらに、コドン変更された基質を使用する「ファミリーシャッフリング」は、
組換えのための出発物質の可能性のある配列多様性をなおさらに増大させる。現
在行われているように、ファミリーシャッフリング方法は、所定のタンパク質の
配列変異体(例えば、種または対立遺伝子ホモログ)をコードする核酸をシャッ
フリングすることを含む。本方法においては、この手順は、組換えの間にさらな
る分子多様性に接近するように、配列変異体のコドン変更されたバージョンを作
成することによって改変される。さらなる多様性は、天然には存在しない配列変
異体をコードするように、出発核酸を保存的および非保存的に改変することによ
って達成される。ファミリーシャッフリングは、比較的低い同一性のホモログを
使用してもなお行われ得る。このような場合においては、コドンは、メンバー間
の同一性のレベルを増大させるように、ファミリーのメンバーの1つ以上におい
て変更され得、それによって、本発明の方法を使用して組換えするそれらの能力
を増大させる。
Further, “family shuffling” using codon-altered substrates,
It further increases the potential sequence diversity of the starting material for recombination. As currently practiced, family shuffling methods involve shuffling nucleic acids encoding sequence variants (eg, species or allelic homologs) of a given protein. In this method, the procedure is modified by creating a codon-altered version of the sequence variant to access additional molecular diversity during recombination. Additional diversity is achieved by conservatively and non-conservatively modifying the starting nucleic acid to encode non-naturally occurring sequence variants. Family shuffling can still be performed using homologs of relatively low identity. In such cases, the codons can be altered in one or more of the members of the family to increase the level of identity between the members, thereby recombining them using the methods of the invention. Increase the ability of

【0043】 遺伝子シャッフリングおよびファミリーシャッフリングは、タンパク質の機能
を改良するおよび「移動させる」(反応の型、酵素のような選択されたタンパク
質の基質もしくは活性、または発現される成分の調節もしくは構造を段階的に変
更する)ために利用可能な強力な方法の2つを提供する。ファミリーシャッフリ
ングにおいては、相同配列(例えば、異なる種、染色体位置に由来するか、また
は合成による変更に起因する)は、組換えられる。遺伝子シャッフリングにおい
ては、シグナル配列は、変異させられるか、またはそうでなければ変更され、そ
して次いで組換えられる。
Gene shuffling and family shuffling improve and function the function of a protein (steps the type of reaction, the substrate or activity of a selected protein such as an enzyme, or the regulation or structure of the expressed component). Provide two powerful methods that can be used. In family shuffling, homologous sequences (eg, derived from different species, chromosomal locations, or due to synthetic alterations) are recombined. In gene shuffling, the signal sequence is mutated or otherwise altered and then recombined.

【0044】 高い質のシャッフリングされたライブラリーの生成およびスクリーニングは、
DNAシャッフリング(または「指向された進化」)を提供する。ライブラリー
をスクリーニングするための適切な高スループット分析化学の利用可能性は、所
望される活性を達成するために、統合された高スループットシャッフリングおよ
びライブラリーのスクリーニングを可能にする。
Generation and screening of high quality shuffled libraries
Provides DNA shuffling (or "directed evolution"). The availability of suitable high-throughput analytical chemistry to screen libraries allows for integrated high-throughput shuffling and screening of libraries to achieve the desired activity.

【0045】 1つの有意な実施態様においては、コドンを改変された核酸を構築するための
オリゴヌクレオチドが、コンピューターにおいて(「インシリコで」)設計され
る。推定されるコドンを改変された組換え核酸もまた、インシリコで、すなわち
、本質的に、1999年2月5日に、USSN60/118854で提出された
、SelifonovおよびStemmer「METHODS FOR MAK
ING CHARACTER STRINGS,POLYNUCLEOTIDE
S & POLYPEPTIDES HAVING DESIRED CHAR
ACTERISTICS」において教示されるように、決定され得る。
In one significant embodiment, oligonucleotides for constructing codon-modified nucleic acids are designed computationally (“in silico”). Recombinant nucleic acids with altered putative codons have also been described in silico, ie, essentially on February 5, 1999, in USSN 60/118854, Serifonov and Stemmer "METHODS FOR MAK."
ING CHARACTER STRINGS, POLYNUCLEOTIDE
S & POLYPEPTIDES HAVING DESIRED CHAR
ACTERISTICS ".

【0046】 さらに、組換えのための基質としてコドンを改変された核酸を生成するよりも
むしろ、核酸のファミリーは、単に関連するオリゴヌクレオチドの適切な選択に
よって組換えられ得る。これは、1999年2月5日、USSN 60/118
,813に提出された、Crameriら、「OLIGONUCLEOTIDE
MEDIATED NUCLEIC ACID RECOMBINATION
」、および1999年6月24日、USSN60/141,049に提出された
、Crameriら、「OLIGONUCLEOTIDE MEDIATED
NUCLEIC ACID RECOMBINATION」において教示され得
るように、ファミリーのオリゴヌクレオチドによって媒介されるシャッフリング
方法と組み合わせて、組換え核酸を作成するための遺伝子再構築方法において、
すなわち、本明細書中で議論されるコドンを改変された核酸オリゴヌクレオチド
を使用することによって、使用される。この技術は、相同な核酸配列または非相
同の核酸配列すらをも組換えるように、使用され得る。本発明の状況においては
、コドンを改変された核酸のファミリーに対応するオリゴヌクレオチドがシャッ
フリングされる。
Furthermore, rather than producing codon-modified nucleic acids as substrates for recombination, families of nucleic acids can be recombined simply by appropriate selection of the relevant oligonucleotides. This is USSN 60/118, February 5, 1999.
, 813, submitted by Crameri et al., "OLIGONUCLEOTIDE."
MEDIATED NUCLEIC ACID RECOMBINATION
And Crameri et al., "OLIGONUCLEOTIDE MEDIATED, filed June 24, 1999 with USSN 60 / 141,049.
As taught in NUCLEC ACID RECOMBINATION, in combination with shuffling methods mediated by a family of oligonucleotides, in a gene reconstitution method for making recombinant nucleic acids,
That is, it is used by using codon-modified nucleic acid oligonucleotides as discussed herein. This technique can be used to recombine homologous or even heterologous nucleic acid sequences. In the context of the present invention, oligonucleotides corresponding to a family of codon-modified nucleic acids are shuffled.

【0047】 本発明は、遺伝子の最適化のための、以前から使用されている方法を超える有
意な利点を提供する。例えば、コドンを改変された核酸のDNAシャッフリング
は、それによって特定の特性が媒介される機構の詳細な理解がなお存在しない、
所望される特性の最適化を生じ得る。さらに、完全に新しい特性が、コドンを改
変されたDNAのシャッフリングの際に得られ得る。すなわち、シャッフリング
されたDNAは、シャッフリングされる親のDNAが完全に欠失している特性を
有するポリペプチドまたはRNAをコードする。従って、コドン使用および/ま
たは関連する遺伝子もしくは他の核酸のコードされるアミノ酸を改変することに
よって、分子多様性が接近され、そして配列は、完全に新規の特性を含む、所望
される特性を獲得するようにシャッフリングされ得る。
The present invention offers significant advantages over previously used methods for gene optimization. For example, DNA shuffling of codon-modified nucleic acids is not yet fully understood by the precise mechanism by which specific properties are mediated.
This may result in optimization of the desired properties. In addition, completely new properties can be obtained upon shuffling codon-modified DNA. That is, the shuffled DNA encodes a polypeptide or RNA that has the property of completely deleting the shuffled parental DNA. Thus, by altering the codon usage and / or the encoded amino acids of the related gene or other nucleic acid, molecular diversity is approached and the sequence gains the desired properties, including entirely novel properties. Can be shuffled.

【0048】 一般的には、配列組換えは、以下にさらに詳細に記載されるように、多くの種
々の形式および形式の順列において達成され得る。
In general, sequence recombination can be accomplished in many different formats and permutations of formats, as described in further detail below.

【0049】 改変についての標的は、獲得または改良しようとされる特性と同様に、種々の
適用において変化する。特性の獲得または特性の改善のための候補の標的の例と
して、酵素的もしくは治療的または他の商業的に有用な活性を有するタンパク質
をコードする遺伝子が挙げられる。より広範囲のリストは、前出に見出される。
しかし、このリストですら、本質的にいずれもの核酸が、本明細書中のプロセス
の1つ以上を使用してコドンを改変され得、そしてシャッフリングされ得るよう
に、限定的であるとは意図されない。
The targets for modification vary in various applications, as well as the properties sought to be obtained or improved. Examples of candidate targets for gaining or improving properties include genes encoding proteins having enzymatic or therapeutic or other commercially useful activities. A more extensive list is found above.
However, even this list is not intended to be limiting, as essentially any nucleic acid can be codon modified and shuffled using one or more of the processes herein. .

【0050】 シャッフリング方法は、出発標的の少なくとも2つの変異体形態を使用する(
変異体形態は、例えば、コンピュータープログラムにおける文字列としての、核
酸またはその表示であり得る)。候補のコドン変更された基質の変異体形態は、
互いに実質的な配列類似性または二次的な構造類似性を示し得るが、これらはま
た、少なくとも1つのそして好ましくは少なくとも2つの位置で異なるはずであ
る。形態間での最初の多様性は、天然のバリエーションの結果であり得る。例え
ば、異なる変異体形態(ホモログ)は、生物体の異なる個体もしくは株から得ら
れるか、または同じ生物体に由来する関連する配列(例えば、対立遺伝子変異体
)を構成するか、または異なる生物体に由来するホモログ(種間変異体)を構成
するか、または人工のホモログ(例えば、同じもしくは類似のタンパク質をコー
ドするコドン変更された核酸)を構成する。これらの配列の任意のものまたは全
ては、コドン変更された核酸を示し得るか、またはそれを含み得る。
The shuffling method uses at least two mutant forms of the starting target (
A variant form can be, for example, a nucleic acid or a representation thereof, as a string in a computer program). The mutant form of the candidate codon-altered substrate is
Although they may exhibit substantial sequence or secondary structural similarity to each other, they should also differ in at least one and preferably at least two positions. Initial diversity between forms may be the result of natural variation. For example, different variant forms (homologs) can be obtained from different individuals or strains of an organism, or constitute related sequences (eg, allelic variants) from the same organism, or can be different organisms. Or an artificial homologue (eg, a codon-altered nucleic acid encoding the same or a similar protein). Any or all of these sequences may indicate or include a codon-altered nucleic acid.

【0051】 最初の多様性もまた、含まれ得る。例えば、変異体形態は、第1の変異体形態
の誤りがちな転写(例えば、誤りがちなPCRもしくはプルーフリーディング活
性を欠損しているポリメラーゼの使用)によって(Liao(1990)Gen
e 88:107−111を参照のこと)、または、ミューテーター株中の第1
の形態の複製によって生成され得る(ミューテーター宿主細胞は、以下にさらに
詳細に議論され、そして一般的に周知である)。基質間の最初の多様性は、ライ
ブラリーの生成のための組換えの続く工程において大きく増大させられる。
[0051] Initial diversity may also be included. For example, the mutant form may be derived from the error-prone transcription of the first mutant form (eg, using error-prone PCR or a polymerase lacking proof-reading activity) (Liao (1990) Gen.
e 88: 107-111) or the first in the mutator strain.
(Mutator host cells are discussed in further detail below and are generally well-known). The initial diversity between the substrates is greatly increased in subsequent steps of the recombination for the generation of the library.

【0052】 ミューテーター株は、不適正塩基対修復の機能を損った任意の生物体中の任意
の変異を含み得る。これらとして、mutS、mutT、mutH、mutL、
ovrD、dcm、vsr、umuC、umuD、sbcB、recJなどの変
異遺伝子産物が挙げられる。欠陥は、遺伝的な変異、対立遺伝子の置換、添加さ
れた試薬(例えば、小さい化合物または発現されたアンチセンスRNA)による
選択的な阻害、または他の技術によって達成される。欠陥は、記載されている遺
伝子のものであり得るか、または任意の生物体中の相同遺伝子のものであり得る
。獲得され得るかまたは改善され得る特性または特徴は、広範に変化し、そして
もちろん、基質の選択に依存する。
The mutator strain can contain any mutation in any organism that has impaired the function of mismatch repair. These include mutS, mutT, mutH, mutL,
Mutant gene products such as ovrD, dcm, vsr, umuC, umuD, sbcB, recJ and the like can be mentioned. Defects are achieved by genetic mutation, allelic replacement, selective inhibition by added reagents (eg, small compounds or expressed antisense RNA), or other techniques. The defect may be of the described gene or of a homologous gene in any organism. The properties or characteristics that can be obtained or improved can vary widely and, of course, depend on the choice of substrate.

【0053】 核酸の少なくとも2つの変異形態(例えば、これらは、所望の活性を付与し得
るか、またはこれらは、所望の活性を生じるように組換えられ得る)は、組換え
核酸のライブラリーを産生するように組換えられる。次いで、このライブラリー
は、目的の特定の特性(単数または複数)について最適化される少なくとも1つ
の組換え核酸を同定するためにスクリーニングされる。
At least two mutated forms of the nucleic acid (eg, they can confer the desired activity or they can be recombined to produce the desired activity) can be used to create a library of recombinant nucleic acids. Recombined to produce. The library is then screened to identify at least one recombinant nucleic acid that is optimized for the particular property or properties of interest.

【0054】 しばしば、改善は、1回の組換えおよび選択の後に達成される。しかし、再帰
的配列組換えが、所望の特性におけるなおさらなる改善を達成するため、または
新規の(もしくは「異なる」)特性を生じるために使用され得る。再帰的配列組
換えは、分子の多様性を生成するための組換えの連続的なサイクルを要する。す
なわち、当業者は、互いにいくらかの配列同一性を示すが、しかし変異の存在に
起因して異なる、核酸分子のファミリーを作成する。任意の所定のサイクルにお
いては、組換えは、インビボまたはインビトロにおいて、細胞内または細胞外で
生じ得る。さらに、組換えによって生じる多様性は、組換えのための基質または
生成物のいずれかに対して公知の変異誘発方法(例えば、誤りがちなPCRまた
はカセット変異誘発)を適用することによって、任意のサイクルにおいて増大さ
れる。しかし、一般的には、コドン変更された核酸の1回のDNAシャッフリン
グサイクルが、驚くほどに有効な核酸の生成を提供する。従って、シャッフリン
グのための再帰的アプローチが使用され得る一方で、1回の組換えサイクルもま
た好ましい。代表的には、2回、3回、4回、5回、またはなお10回以上の組
換えサイクルが行われ、各サイクルは必要に応じて、1回以上の選択工程を含む
Often, improvements are achieved after a single round of recombination and selection. However, recursive sequence recombination can be used to achieve still further improvements in the desired properties or to produce new (or "different") properties. Recursive sequence recombination requires successive cycles of recombination to generate molecular diversity. That is, one skilled in the art creates a family of nucleic acid molecules that exhibit some sequence identity to one another, but differ due to the presence of mutations. In any given cycle, recombination can occur in vivo or in vitro, intracellularly or extracellularly. In addition, the diversity arising from recombination may be determined by applying known mutagenesis methods (eg, error-prone PCR or cassette mutagenesis) to either the substrate or the product for recombination. Increased in cycles. However, in general, a single DNA shuffling cycle of a codon-modified nucleic acid provides surprisingly efficient nucleic acid production. Thus, while a recursive approach for shuffling may be used, a single recombination cycle is also preferred. Typically, two, three, four, five, or even ten or more recombination cycles are performed, each cycle optionally including one or more selection steps.

【0055】 組換えサイクルは、通常は、所望の特性または特徴を有する分子についての少
なくとも1回のスクリーニングまたは選択のサイクルを伴う。組換えサイクルが
インビトロで行われる場合は、組換え産物(すなわち、組換えセグメント)は、
しばしば、スクリーニング工程の前に細胞中に導入される。組換えセグメントは
また、スクリーニングの前に、適切なベクターまたは他の調節配列に連結させら
れ得る。あるいは、インビトロで生成された組換え産物は、しばしば、スクリー
ニングの前にウイルス(例えば、バクテリオファージ)中にパッケージされる。
組換えがインビボで行われる場合は、組換え産物は、しばしば、組換えが生じる
細胞中でスクリーニングされ得る。他の適用においては、組換えセグメントが細
胞から抽出され、そして必要に応じて、スクリーニングの前にウイルスとしてパ
ッケージングされる。
A recombination cycle usually involves at least one cycle of screening or selection for molecules having the desired properties or characteristics. If the recombination cycle is performed in vitro, the recombination product (ie, the recombination segment)
Often, they are introduced into cells prior to the screening step. The recombinant segment can also be ligated to a suitable vector or other regulatory sequence before screening. Alternatively, recombinant products produced in vitro are often packaged in a virus (eg, bacteriophage) prior to screening.
If the recombination is performed in vivo, the recombination product can often be screened in the cell where the recombination occurs. In other applications, the recombinant segments are extracted from the cells and optionally packaged as viruses prior to screening.

【0056】 スクリーニングまたは選択の性質は、どの特性もしくは特徴が獲得されるか、
またはそれについて改善が考えられる特性もしくは特徴に依存して変化し、そし
て多くの例が以下に議論される。組換えの特定の産物(組換えセグメント)が出
発基質と比較して新規のまたは改善された特性または特徴を獲得する分子基準を
理解することは、必要ではない。例えば、遺伝子は、多くの成分配列を有し得、
それぞれが、異なった意図される役割(例えば、コード配列、調節配列、標的化
配列、安定性を付与する配列、サブユニット配列、および凝集に影響を与える配
列)を有する。これらの成分配列のそれぞれは、同時に変更され、そして組換え
られ得る。次いで、スクリーニング/選択が、例えば、ベクターの任意の個々の
成分配列に対するこのような改善に寄与する必要を伴わずに、細胞に対して活性
を付与する増大した能力を有する組換えセグメントについて、行われ得る。
The nature of the screening or selection depends on which property or feature is obtained,
Or that the improvement will vary depending on the property or characteristic that is considered, and many examples are discussed below. It is not necessary to understand the molecular criteria by which a particular product of recombination (recombinant segment) acquires new or improved properties or characteristics compared to the starting substrate. For example, a gene may have many component sequences,
Each has a different intended role (eg, coding sequence, regulatory sequence, targeting sequence, stabilizing sequence, subunit sequence, and sequence affecting aggregation). Each of these component sequences can be altered and recombined simultaneously. Screening / selection is then performed, for example, on recombinant segments with increased ability to confer activity on cells without having to contribute to such an improvement on any individual component sequence of the vector. Can be.

【0057】 所望の特性について使用される特定のスクリーニングプロトコールに依存して
、スクリーニングの最初の回(単数または複数)は、しばしば、高いトランスフ
ェクション効率および培養の容易さに起因して、細菌細胞を使用して行われ得る
。しかし、細菌性の発現はしばしば、実行不可能であるかまたは所望されず、そ
して、酵母、真菌、または他の真核生物システムもまた、ライブラリーの発現お
よびスクリーニングのために使用される。同様に、他の型のスクリーニング(こ
れらは、細菌または単純な真核生物のライブラリー細胞中でのスクリーニングに
敏感には反応しない)が、それらの意図される使用の環境と近い環境における使
用について選択された細胞中で行われる。スクリーニングの最後の回が、意図さ
れる使用の正確な細胞型において行われ得る。
Depending on the particular screening protocol used for the desired properties, the first round or rounds of screening often involve bacterial cells due to high transfection efficiency and ease of culture. Can be done using However, bacterial expression is often infeasible or undesirable, and yeast, fungal, or other eukaryotic systems are also used for library expression and screening. Similarly, other types of screens, which are not sensitive to screening in bacterial or simple eukaryotic library cells, have been described for use in environments that are close to those of their intended use. Performed in selected cells. The last round of screening may be performed on the correct cell type for the intended use.

【0058】 特性におけるさらなる改善が所望される場合は、少なくとも1つおよび通常、
最初の回のスクリーニング/選択を生き残っている組換えセグメントのコレクシ
ョンが、さらなる回の組換えに供される。これらの組換えセグメントは、互いに
、またはもともとの基質もしくはそのさらなる変異体を提示する外因性のセグメ
ントと、組換えられ得る。再度、組換えが、インビトロまたはインビボで行われ
得る。以前のスクリーニング工程が、細胞の成分として所望の組換えセグメント
を同定する場合は、その成分は、インビボでのさらなる組換えに供され得るか、
またはインビボでのさらなる組換えに供され得るか、またはインビトロでの組換
えの回を実行する前に単離され得る。逆に、以前のスクリーニング工程が、所望
の組換えセグメントを裸の形態で同定するかまたはウイルスの成分として所望の
組換え成分を同定する場合は、これらのセグメントは、インビボでの組換えの回
を実行するために細胞中に導入され得る。2回目の組換え(どのように実行され
るかとは無関係に)は、以前の回によって生じた(または複数の以前の回によっ
て生じた(例えば、プロセスが複数回繰り返されている場合))組換えセグメン
ト中に存在するさらなる多様性を含むさらなる組換えセグメントを生成する。
If further improvements in properties are desired, at least one and usually
The collection of recombinant segments surviving the first round of screening / selection is subjected to a further round of recombination. These recombinant segments can be recombined with each other or with an exogenous segment presenting the original substrate or a further variant thereof. Again, recombination can take place in vitro or in vivo. If the previous screening step identified the desired recombinant segment as a component of the cell, the component can be subjected to further recombination in vivo,
Alternatively, it may be subjected to further recombination in vivo or isolated before performing a round of recombination in vitro. Conversely, if the previous screening step identified the desired recombinant segments in a naked form or identified the desired recombinant components as components of the virus, these segments would have been used in rounds of recombination in vivo. Can be introduced into cells to perform The second recombination (independent of how it is performed) is the set resulting from the previous round (or from multiple previous rounds (eg, if the process is repeated multiple times)) An additional recombinant segment is generated that contains the additional diversity present in the recombinant segment.

【0059】 第2回目の組換えには、第1回目について上記で議論した原理に従う、さらな
る回のスクリーニング/選択が続く。スクリーニング/選択のストリンジェンシ
ーは、回の間で増大させられ得る。また、スクリーニングの性質およびスクリー
ニングされる特性は、1つ以上の特性における改善が所望される場合、または1
つ以上の新規の特性を獲得することが所望される場合は、各回の間で変化し得る
。組換えおよびスクリーニングのさらなる回は、次いで、組換えセグメントが所
望される新規のまたは改善された特性または機能を獲得するように十分に進化す
るまで、行われ得る。
The second round of recombination is followed by a further round of screening / selection according to the principles discussed above for the first round. The stringency of the screening / selection can be increased between rounds. Also, the nature of the screening and the properties being screened may be such that improvement in one or more properties is desired, or
If it is desired to acquire one or more new properties, it may change between each round. Further rounds of recombination and screening may then take place until the recombinant segment has evolved sufficiently to acquire the desired new or improved property or function.

【0060】 本発明の実施は、組換え核酸の構築およびトランスフェクトされた宿主細胞中
での遺伝子の発現を含む。これらの目的を達成するための分子クローニング技術
は、当該分野で公知である。発現ベクターのような組換え核酸の構築に適切な広
範な種々のクローニングおよびインビトロ増幅の方法は、当業者に周知である。
本明細書において有用である分子生物学的技術を記載する一般的なテキストとし
て、以下が挙げられる:BergerおよびKimmel、Guide to
Molecular Cloning Techniques,Methods
in Enzymology、第152巻、Academic Press,
Inc.,San Diego,CA(Berger);Sambrookら、
Molecular Cloning − A Laboratory Man
ual(第2版)、第1巻−第3巻、Cold Spring Harbor
Laboratory,Cold Spring Harbor,New Yo
rk,1989(「Sambrook」)、ならびにCurrent Prot
ocols in Molecular Biology,F.M.Ausub
elら編、Current Protocols、Greene Publis
hing Associates,Inc.とJohn Wiley & So
ns,Inc.,との間での合弁企業(1998に補充された)(「Ausub
el」)。核酸を用いて、植物および動物細胞を含む細胞を形質導入する方法は
、一般的には、このような核酸によってコードされるタンパク質を発現する方法
として利用可能である。Berger、Ausubel、およびSambroo
kに加えて、動物細胞の培養について有用な一般的な参考文献として、以下が挙
げられる:Freshney(Culture of Animal Cell
s,a Manual of Basic Technique、第3版、Wi
ley−Liss,New York(1994))、およびその中で引用され
ている参考文献、Humason(Animal Tissue Techni
ques、第4版、W.H.FreemanおよびCompany(1979)
)、ならびにRicciardelliら、In Vitro Cell De
v.Biol.25:1016−1024(1989)。植物細胞のクローニン
グ、培養、および再生についての参考文献として、以下が挙げられる:Payn
eら(1992)Plant Cell and Tissue Cultur
e in Liquid Systems、John Wiley & Son
s,Inc.New York,NY(Payne);ならびにGamborg
およびPhillips(編)(1995)Plant Cell,Tissu
e and Organ Culture;Fundamental Meth
ods,Springer Lab Mannual,Springer−Ve
rlag(Berlin Heidelberg New Yoek)(Gam
borg)。種々の細胞培養培地は、AtlasおよびParks(編)、Th
e Handbook of Microbiological Media(
1993)CRC Press,Boca Raton,FL(Atlas)に
記載されている。植物細胞の培養についてのさらなる情報は、例えば、以下のよ
うな入手可能な市販されている文献において見出される:Life Scien
ce Research Cell Culture Catalogue(1
998)、Sigma − Aldrich,Inc(St Louis,MO
)(Sigma−LSRCCC)、ならびに、また、例えば、Sigma −
Aldrich,Inc(St Louis,MO)(Sigma−PCCS)
による、Plant Culture Catalogueおよび補遺(199
7)。
The practice of the present invention involves the construction of recombinant nucleic acids and the expression of the gene in transfected host cells. Molecular cloning techniques to achieve these ends are known in the art. A wide variety of cloning and in vitro amplification methods suitable for the construction of recombinant nucleic acids, such as expression vectors, are well known to those of skill in the art.
General text describing molecular biology techniques useful herein include: Berger and Kimmel, Guide to
Molecular Cloning Technologies, Methods
in Enzymology, Volume 152, Academic Press,
Inc. , San Diego, CA (Berger); Sambrook et al.
Molecular Cloning-A Laboratory Man
ual (2nd edition), Volumes 1-3, Cold Spring Harbor
Laboratory, Cold Spring Harbor, New Yo
rk, 1989 ("Sambrook"), and Current Prot
ocols in Molecular Biology, F.C. M. Ausub
el et al., Current Protocols, Greene Publis
hing Associates, Inc. And John Wiley & So
ns, Inc. , A joint venture (replenished in 1998) ("Aussub
el "). Methods for transducing cells, including plant and animal cells, using nucleic acids are generally available as methods for expressing proteins encoded by such nucleic acids. Berger, Ausubel, and Sambrook
In addition to k, general references useful for culturing animal cells include the following: Freshney (Culture of Animal Cell)
s, a Manual of Basic Technology, 3rd edition, Wi
ley-Liss, New York (1994)), and the references cited therein, Humason (Animal Tissue Techni).
ques, 4th edition, W.W. H. Freeman and Company (1979)
), And Ricciardelli et al., In Vitro Cell De.
v. Biol. 25: 1016-1024 (1989). References for cloning, culturing, and regeneration of plant cells include: Payn
e et al. (1992) Plant Cell and Tissue Culture.
e in Liquid Systems, John Wiley & Son
s, Inc. New York, NY (Payne); and Gamborg
And Phillips (eds.) (1995) Plant Cell, Tissue
e and Organ Culture; Fundamental Meth
ods, Springer Lab Manual, Springer-Ve
rlag (Berlin Heidelberg New York) (Gam
borg). Various cell culture media are available from Atlas and Parks (Ed.), Th.
e Handbook of Microbiological Media (
1993) CRC Press, Boca Raton, FL (Atlas). Further information about culturing plant cells can be found, for example, in available commercial literature such as: Life Science
ce Research Cell Culture Catalog (1
998), Sigma-Aldrich, Inc. (St Louis, MO
) (Sigma-LSRCCC), and also, for example, Sigma −
Aldrich, Inc (St Louis, MO) (Sigma-PCCS)
Plant Culture Catalog and Supplement (199)
7).

【0061】 ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、Qβ−レプ
リカ−ゼ増幅、および他のRNAポリメラーゼによって媒介される技術(例えば
、NASBA)を含むインビトロでの増幅方法に通じる当業者に十分である技術
の例は、以下に見出される:Berger、Sambrook、およびAusu
bel、同書、ならびにMullisら、(1987)米国特許第4,683,
202号;PCR Protocols A Guide to Method
s and Applications(Innisら編)Academic
Press Inc.San Diego,CA(1990)(Innis);
ArnheimおよびLevinson(1990年10月1日)C&EN 3
6−47;The Journal Of NIH Research(199
1)3、81−94;Kwohら(1989)Proc.Natl.Acad.
Sci.USA 86,1173;Guatelliら(1990)Proc.
Natl.Acad.Sci.USA 87,1874;Lomellら(19
89)J.Clin.Chem 35,1826;Landegrenら(19
88)Science 241、1077−1080;Van Brunt(1
990)Biotechnology 8,291−294;WuおよびWal
lace,(1989)Gene 4,560;Barringerら(199
0)Gene 89、117、ならびにSooknananおよびMalek(
1995)Biotechnology 13:563−564。インビトロで
増幅された核酸をクローニングする改善された方法は、Wallaceら、米国
特許第5,426,039号に記載されている。PCRによって大きな核酸を増
幅する改善された方法は、Chengら(1994)Nature 369:6
84−685、およびその中の参考文献においてまとめられている。ここでは、
40kbまでのPCR単位複製配列が生成される。当業者は、本質的に任意のR
NAが、制限消化、PCR伸張、および配列決定に適切な二本鎖DNAに、逆転
写酵素およびポリメラーゼを使用して転換され得ることを理解している。Aus
bel、Sambrook、およびBerger(全て、前出)を参照のこと。
Those skilled in the art are familiar with in vitro amplification methods, including the polymerase chain reaction (PCR), ligase chain reaction (LCR), Qβ-replicase amplification, and other RNA polymerase-mediated techniques (eg, NASBA). Examples of techniques that are sufficient for are found below: Berger, Sambrook, and Ausu
bel, ibid, and Mullis et al., (1987) U.S. Pat.
No. 202; PCR Protocols A Guide to Method
s and Applications (Edited by Innis et al.) Academic
Press Inc. San Diego, CA (1990) (Innis);
Arnheim and Levinson (October 1, 1990) C & EN 3
6-47; The Journal of NIH Research (199)
1) 3, 81-94; Kwoh et al. (1989) Proc. Natl. Acad.
Sci. USA 86, 1173; Guatelli et al. (1990) Proc.
Natl. Acad. Sci. USA 87, 1874; Lomell et al.
89) J. Amer. Clin. Chem 35, 1826; Landegren et al. (19
88) Science 241, 1077-1080; Van Brunt (1
990) Biotechnology 8, 291-294; Wu and Wal.
race, (1989) Gene 4,560; Barringer et al. (199
0) Gene 89, 117, and Sooknanan and Malek (
1995) Biotechnology 13: 563-564. Improved methods for cloning in vitro amplified nucleic acids are described in Wallace et al., US Pat. No. 5,426,039. An improved method of amplifying large nucleic acids by PCR is described in Cheng et al. (1994) Nature 369: 6.
84-685, and references therein. here,
PCR amplicons of up to 40 kb are generated. One skilled in the art will recognize that essentially any R
It is understood that NA can be converted to double stranded DNA suitable for restriction digestion, PCR extension, and sequencing using reverse transcriptase and polymerase. Aus
See bell, Sambrook, and Berger (all supra).

【0062】 例えば、インビトロでの増幅/遺伝子の再構築方法における使用のため、遺伝
子プローブの使用のため、またはシャッフリングの標的(例えば、合成の遺伝子
または遺伝子セグメント)としてのオリゴヌクレオチドは、代表的には、例えば
、BeaucageおよびCaruthers(1981)、Tetrahed
ron Letts.,22(20):1859−1862によって記載されて
いるように、例えば、自動合成装置(例えば、Needham−VanDeva
nterら(1984)Nucleic Acids Res.,12:615
9−6168に記載されているか、または当該分野で日常的に実行されているよ
うなもの)を使用して、固相ホスホルアミダイトトリエステル方法に従って、化
学的に合成される。オリゴヌクレオチドはまた、特注で作成され得、そして当業
者に公知の種々の市販の供給源から注文され得る。合成オリゴヌクレオチドの質
を改善するためのオリゴヌクレオチドの精製(例えば、ゲル精製法を使用する)
は、核酸合成のプロトコールの質を改善するために本明細書中のプロセスにおい
て特に所望され得る。
Oligonucleotides, for example, for use in in vitro amplification / gene reconstitution methods, for the use of gene probes, or as targets for shuffling (eg, synthetic genes or gene segments) are typically Are described, for example, in Beaucage and Caruthers (1981), Tetrahed.
ron Letts. , 22 (20): 1859-1862, for example, an automated synthesizer (eg, Needham-VanDeva).
(1984) Nucleic Acids Res. , 12: 615
9-6168 or as routinely practiced in the art) according to the solid phase phosphoramidite triester method. Oligonucleotides can also be made to order and ordered from a variety of commercial sources known to those of skill in the art. Purification of oligonucleotides to improve the quality of synthetic oligonucleotides (eg, using gel purification methods)
May be particularly desirable in the processes herein to improve the quality of the protocol for nucleic acid synthesis.

【0063】 記載されるように、本質的に任意の核酸が、The Midland Cer
tified Reagent Company(mcrc@oligos.c
om)、The Great American Gene Company(
http://www.genco.com)、ExpressGen Inc
.(www.expressgen.com)、Operon Technol
ogies Inc.(Alameda,CA)、および多くの他の供給源のよ
うな、任意の種々の市販の供給源から特注で注文され得る。同様に、ペプチドお
よび抗体が、PeptidoGenic(pkim@ccnet.com)、H
TI Bio−products,inc.(http://www.htib
io.com)、BMA Biomedicals Ltd(U.K.)、Bi
oSynthesis,Inc.,および多くの他の供給源のような、任意の種
々の供給源から特注で注文され得る。
As described, essentially any nucleic acid can be obtained from The Midland Cer.
tied Reagent Company (mcrc@oligos.c)
om), The Great American Gene Company (
http: // www. genco. com), ExpressGen Inc
. (Www.expressgen.com), Operon Technology
offices Inc. (Alameda, CA), and can be custom ordered from any of a variety of commercially available sources, such as many other sources. Similarly, peptides and antibodies are available from PeptidoGenic (pkim@ccnet.com), H
TI Bio-products, inc. (Http: //www.htib
io. com), BMA Biomedicals Ltd (UK), Bi
oSynthesis, Inc. , And many other sources can be custom ordered from any of a variety of sources.

【0064】 (コドンおよびアミノ酸を変更されたライブラリー) 本発明の方法においては、コドン変更された核酸のライブラリーが作成され得
、そして組換えられ得る。コドン変更された核酸はまた、コードされるアミノ酸
配列における差異を含み得、これは、性質において保存的または非保存的のいず
れかであり得る。コドン変更された核酸は、単一の親のアミノ酸配列から誘導さ
れ得るか、またはもともとの配列のファミリー(例えば、所定の配列の天然のま
たは合成の相同変異体)から誘導され得る。ライブラリーは、例えば、細胞のプ
ールまたはアリコート、ウイルスプラーク、酵素的に合成された核酸のプールま
たはアリコート、あるいは化学的に合成された核酸のプール中に存在し得る。核
酸のライブラリーを作成する方法は、例えば、Berger、Sambrook
、およびAusubel、前出において入手可能であり、そして教示されている
。1つの実施態様においては、ライブラリーは、本発明において使用される場合
、少なくとも2個の核酸の配列を含む。さらなる実施態様においては、本発明の
ライブラリーは、少なくとも2個、5個、10個、100個、1000個、また
はそれ以上の核酸の配列を含む。
Libraries with Altered Codons and Amino Acids In the method of the present invention, a library of codon-altered nucleic acids can be created and recombined. Codon-altered nucleic acids can also include differences in the encoded amino acid sequences, which can be either conservative or non-conservative in nature. Codon-altered nucleic acids can be derived from a single parent amino acid sequence, or can be derived from a family of original sequences (eg, natural or synthetic homologous variants of a given sequence). The library can be present, for example, in a pool or aliquot of cells, a viral plaque, a pool or aliquot of enzymatically synthesized nucleic acid, or a pool of chemically synthesized nucleic acid. Methods for preparing nucleic acid libraries are described, for example, in Berger, Sambrook.
And Ausubel, supra, are available and taught. In one embodiment, the library, as used in the present invention, comprises a sequence of at least two nucleic acids. In a further embodiment, the library of the invention comprises at least 2, 5, 10, 100, 1000 or more nucleic acid sequences.

【0065】 本発明に対して適用される場合は、ライブラリーは、代表的には、最初の(例
えば、野生型)核酸と比較して変更されたコドンの高い割合を有して構築される
。コドン変更された核酸のそれぞれについてのコドン使用の差異は、最初の核酸
と比較して50%、75%、またはなお90%もしくはそれ以上であり得る。こ
れによって、親の核酸に対するハイブリダイゼーションが排除される(そしてそ
れによって、親の核酸との組換えを阻害する、以下に議論される特定の実施態様
において所望される特徴)。
As applied to the present invention, libraries are typically constructed with a high percentage of altered codons compared to the original (eg, wild-type) nucleic acid. . The difference in codon usage for each of the codon-altered nucleic acids can be 50%, 75%, or even 90% or more compared to the original nucleic acid. This eliminates hybridization to the parent nucleic acid (and thereby inhibits recombination with the parent nucleic acid, a desired feature in certain embodiments discussed below).

【0066】 本発明のいくつかの実施態様においては、コドンは、メンバー間の同一性の程
度を増大させるように、遺伝子ファミリーのメンバー中で改変される。1つのこ
のような実施態様においては、遺伝子は、異なる種に由来する相同遺伝子である
。このような場合においては、核酸の同一性の程度は、アミノ酸の同一性の程度
よりも低くなり得、これは少なくともある程度、種間でのコドンの使用における
差異に起因する。さらなる実施態様においては、相同遺伝子は、単一種における
遺伝子ファミリーの異なるメンバーを意味する。このような遺伝子は、遺伝子フ
ァミリーの機能的に異なるメンバーをコードし得る。それにもかかわらず、これ
は、有意な構造的または機能的類似性を共有する。好ましい実施態様においては
、相同遺伝子は、核酸配列中で逆転写され、そして核酸配列は、それらの間での
同一性のレベルを増大させるように改変される。次いで、改変された配列を有す
る核酸が、インビトロで合成され得る。特定の好ましい実施態様においては、改
変された核酸配列は、もとのアミノ酸配列と互いに少なくとも同一である。
In some embodiments of the present invention, codons are modified in members of a gene family to increase the degree of identity between members. In one such embodiment, the genes are homologous genes from different species. In such cases, the degree of nucleic acid identity may be lower than the degree of amino acid identity, at least in part due to differences in codon usage between species. In a further embodiment, a homologous gene refers to different members of a gene family in a single species. Such genes may encode functionally distinct members of the gene family. Nevertheless, it shares significant structural or functional similarity. In a preferred embodiment, homologous genes are reverse transcribed in nucleic acid sequences, and the nucleic acid sequences are modified to increase the level of identity between them. The nucleic acid having the altered sequence can then be synthesized in vitro. In certain preferred embodiments, the modified nucleic acid sequence is at least identical to each other as the original amino acid sequence.

【0067】 さらなる配列多様性は、第1の核酸と比較した場合に、コドン変更された核酸
のそれぞれにおける、重複しない非保存的置換を有する核酸を生成することによ
って提供される。これにより、組換えの際に、野生型への復帰変異が提供され、
一方、必要に応じて、保存的ではない変更がスクリーニングの間の検出可能な改
善を生じる事象において、配列への保存的ではない変更の取り込みを可能にする
Further sequence diversity is provided by generating nucleic acids with non-overlapping non-conservative substitutions in each of the codon-altered nucleic acids when compared to the first nucleic acid. This provides a reversion to the wild type upon recombination,
On the other hand, if necessary, it allows for the incorporation of non-conservative changes into the sequence in the event that the non-conservative changes result in a detectable improvement during screening.

【0068】 最初のポリペプチドと比較して、コードされるポリペプチドについて1つ以上
の異なる疎水性コア残基を提供するような、1つ以上のコドン変更された核酸の
コドンの改変もまた、提供される。このコアアミノ酸の改変は、コードされるタ
ンパク質の主要ではない差異を提供するが、一方、得られる核酸の変異スペクト
ルを変更し、それによって配列の多様性を増大させる。
A codon modification of one or more codon-altered nucleic acids that provides one or more different hydrophobic core residues for the encoded polypeptide, as compared to the original polypeptide, is also Provided. This core amino acid modification provides minor differences in the encoded protein, while altering the mutation spectrum of the resulting nucleic acid, thereby increasing sequence diversity.

【0069】 さらに、所定の細胞についての翻訳機構の制約に起因して、コドン使用は、発
現された配列が異なる生物体(例えば、動物細胞、植物細胞、細菌細胞など)間
でシャッフルされる場合は、最適な発現のために変更される必要性を有し得る。
これによって、同じタンパク質をコードするが、典型的な形態の点変異の後にそ
のタンパク質のもともとの形態とは異なる変異多様性を入手する核酸を生じる。
In addition, due to the limitations of the translation machinery for a given cell, codon usage can result in the expressed sequence being shuffled between different organisms (eg, animal cells, plant cells, bacterial cells, etc.). May need to be changed for optimal expression.
This results in a nucleic acid that encodes the same protein, but that, after a typical form of point mutation, obtains a variant diversity that differs from the original form of the protein.

【0070】 1つの実施態様においては、ファージライブラリーが作成され、そしてmut
S、mutT、mutH、mutL、ovrD、dcm、vsr、umuC、u
muD、sbcB、recJなどの変異遺伝子産物または欠陥遺伝子産物を有す
る細胞のような、ミューテーター株中で組換えられる。欠陥は、遺伝的変異、対
立遺伝子置換、添加された試薬(例えば、小さい化合物または発現されたアンチ
センスRNA)による選択的な阻害、または他の技術によって達成される。感染
多重度(MOI)の高いライブラリーが細胞を感染させるために使用されて、組
換え頻度を増大させる。ファージライブラリーを作成するため、ならびに/また
はドナー細胞およびレシピエント細胞からDNAを組換えるためのさらなる戦略
は、米国特許第5,521,077号に示されている。酵母中でプラスミドを組
換えるためのさらなる組換え戦略は、WO97 07205に示されている。
[0070] In one embodiment, a phage library is created and mut
S, mutT, mutH, mutL, ovrD, dcm, vsr, umuC, u
It is recombined in a mutator strain, such as a cell having a mutant or defective gene product, such as muD, sbcB, recJ. The defect is achieved by genetic mutation, allelic replacement, selective inhibition by added reagents (eg, small compounds or expressed antisense RNA), or other techniques. Libraries with a high multiplicity of infection (MOI) are used to infect cells, increasing the frequency of recombination. Additional strategies for making phage libraries and / or for recombination of DNA from donor and recipient cells are set forth in US Pat. No. 5,521,077. Further recombination strategies for recombination of plasmids in yeast are given in WO 97/07205.

【0071】 作成されるライブラリーは、インビトロでの分子セットであり得るか、または
細胞もしくはファージに存在し得る。インシリコで生成された仮想的な核酸ライ
ブラリーもまた、本発明の特徴である(SelifonovおよびStemme
r、前出をもまた参照のこと)。一般的には、ライブラリーは、親の核酸または
組換えられる核酸と比較して、異なるかまたは改善された活性を示す、少なくと
も1つの組換え核酸を同定するためにスクリーニングされる。適切なライブラリ
ーを作成することについてのさらなる詳細は、例えば、「配列の組換えのための
形式」と題した節において以下に見出される。
The library created can be a set of molecules in vitro, or can be in a cell or phage. A hypothetical nucleic acid library generated in silico is also a feature of the invention (Serifonov and Stemme).
r, see also supra). Generally, the library is screened to identify at least one recombinant nucleic acid that exhibits different or improved activity as compared to the parent nucleic acid or the nucleic acid to be recombined. Further details on creating suitable libraries are found below, for example, in the section entitled "Formats for Sequence Recombination".

【0072】 (コドンの改変およびシャッフリングのための標的) 本質的には、任意の核酸が、コドン変更され得そしてシャッフリングされ得る
。本明細書中では、多数の公知の核酸を同定するための試みは行っていない。公
知のタンパク質についての一般的な配列保存機関としては、GenBank、E
MBL、DDBJ、およびNCBIが挙げられる。他の保存機関は、インターネ
ット検索することによって容易に確認され得る。
Codon Alterations and Targets for Shuffling Essentially any nucleic acid can be codon altered and shuffled. No attempt has been made herein to identify a number of known nucleic acids. General sequence preservation agencies for known proteins include GenBank, E.
MBL, DDBJ, and NCBI. Other repositories can be easily identified by searching the Internet.

【0073】 活性化のための好ましい標的の1つのクラスとして、以下のような治療用タン
パク質をコードする核酸が挙げられる:エリトロポイエチン(EPO)、インス
リン、ペプチドホルモン(例えば、ヒト成長ホルモン);増殖因子およびサイト
カイン(例えば、上皮性好中球活性化ペプチド−78、GROα/MGSA、G
ROβ、Groγ、MIP−1α、MIP−1β、MCP−1、上皮増殖因子、
繊維芽細胞増殖因子、肝細胞増殖因子、インスリン様成長因子、インターフェロ
ン、インターロイキン、ケラチノサイト増殖因子、白血病阻害因子、オンコスタ
チンM、PD−ECSF、PDGF、プレイオトロピン、SCF、c−kitリ
ガンド、VEGEF、G−CSFなど)。これらのタンパク質の多くが、市販に
よって入手可能(例えば、Sigma BioSciences 1997、カ
タログおよび価格表を参照のこと)であり、そして対応する遺伝子が周知である
One class of preferred targets for activation includes nucleic acids encoding therapeutic proteins such as: erythropoietin (EPO), insulin, peptide hormones (eg, human growth hormone) Growth factors and cytokines (eg, epithelial neutrophil activating peptide-78, GROα / MGSA, G;
ROβ, Groγ, MIP-1α, MIP-1β, MCP-1, epidermal growth factor,
Fibroblast growth factor, hepatocyte growth factor, insulin-like growth factor, interferon, interleukin, keratinocyte growth factor, leukemia inhibitory factor, oncostatin M, PD-ECSF, PDGF, pleiotropin, SCF, c-kit ligand, VEGEF, G-CSF, etc.). Many of these proteins are commercially available (see, for example, Sigma BioSciences 1997, catalogs and price lists), and the corresponding genes are well known.

【0074】 好ましい標的の別のクラスは、転写および発現のアクチベーターである。例示
的な転写および発現のアクチベーターとして、細胞の増殖、分化、調節などを調
節する遺伝子およびタンパク質が挙げられる。発現および転写のアクチベーター
は、原核生物、ウイルス、および真核生物(真菌、植物、および動物(哺乳動物
を含む)を含む)中に見出され、広範囲の治療標的を提供する。発現および転写
のアクチベーターが、例えば、レセプターへの結合、シグナル伝達カスケードの
刺激、転写因子の発現の調節、プロモーターおよびエンハンサーへの結合、プロ
モーターおよびエンハンサーに結合するタンパク質への結合、DNAの巻き戻し
、プレmRNAのスプライシング、RNAのポリアデニル化、ならびにRNAの
分解によるような、多くの機構によって転写を調節することは明らかである。発
現アクチベーターとして、以下が挙げられる:サイトカイン、炎症性分子、増殖
因子、それらのレセプター、およびオンコジーン産物(例えば、インターロイキ
ン(例えば、IL−1、IL−2、IL−8など))、インターフェロン、FG
F、IGF−I、OGF−II、FGF、PDGF、TNF、TGF−α、TG
F−β、EGF、KGF、SCF/c−Kit、CD40L/CD40、VLA
−4/VCAM−1、ICAM−1/LFA−1、およびヒアルリン(hyal
urin)/CD44;シグナル伝達分子、および対応するオンコジーン産物(
例えば、Mos、Ras、Raf、およびMet);ならびに転写アクチベータ
ーおよびサプレッサー(例えば、p53、Tat、Fos、Myc、Jun,M
yb、Rel、およびステロイドホルモンレセプター(例えば、エストロゲン、
プロゲステロン、テストステロン、アルドステロン、LDLレセプターリガンド
、およびコルチコステロン))。
Another class of preferred targets are activators of transcription and expression. Exemplary transcription and expression activators include genes and proteins that regulate cell growth, differentiation, regulation, and the like. Activators of expression and transcription are found in prokaryotes, viruses, and eukaryotes, including fungi, plants, and animals, including mammals, and provide a wide range of therapeutic targets. Activators of expression and transcription include, for example, binding to receptors, stimulating signaling cascades, regulating expression of transcription factors, binding to promoters and enhancers, binding to proteins that bind promoters and enhancers, unwinding DNA It is clear that transcription is regulated by a number of mechanisms, such as by pre-mRNA splicing, RNA polyadenylation, and RNA degradation. Expression activators include: cytokines, inflammatory molecules, growth factors, their receptors, and oncogene products (eg, interleukins (eg, IL-1, IL-2, IL-8, etc.)), interferons , FG
F, IGF-I, OGF-II, FGF, PDGF, TNF, TGF-α, TG
F-β, EGF, KGF, SCF / c-Kit, CD40L / CD40, VLA
-4 / VCAM-1, ICAM-1 / LFA-1, and hyalulin (hyalin)
urin) / CD44; signaling molecules and the corresponding oncogene products (
For example, Mos, Ras, Raf, and Met); and transcriptional activators and suppressors (eg, p53, Tat, Fos, Myc, Jun, M.).
yb, Rel, and steroid hormone receptors (eg, estrogen,
Progesterone, testosterone, aldosterone, LDL receptor ligand, and corticosterone)).

【0075】 同様に、感染性生物体に由来する、可能なワクチン適用のためのタンパク質が
、以下により詳細に記載され、これらには以下が含まれる:感染性の真菌(例え
ば、Aspergillus、Candida種);細菌(特に、病原性細菌の
モデルとして役立つE.coli)、ならびに医学的に重要な細菌(例えば、S
taphylococci(例えば、aureus)、Streptococc
i(例えば、pneumoniae)、Clostridia(例えば、per
fringens)、Neisseria(例えば、gonorrhoea)、
Enterobacteriaceae(例えば、coli)、Helicob
acter(例えば、pylori)、Vibrio(例えば、cholera
e)、Capylobacter(例えば、jejuni)、Pseudomo
nas(例えば、aeruginosa)、Haemophilus(例えば、
influenzae)、Bordetella(例えば、pertussis
)、Mycoplasma(例えば、pneumoniae)、Ureapla
sma(例えば、urealyticum)、Legionella(例えば、
pneumophila)、Spirochetes(例えば、Trepone
ma、Leptospira、およびBorrelia)、Mycobacte
ria(例えば、tuberculosis、smegmatis)、Acti
nomyces(例えば、israelii)、Nocardia(例えば、a
steroides)、Chlamydia(例えば、trachomatis
)、Rickettsia、Coxiella、Ehrilichia、Roc
halimaea、Brucella、Yersinia、Fracisell
a、およびPasteurella;原生動物(例えば、sporozoa(例
えば、Plasmodia)、rhizopods(例えば、Entamoeb
a)、および鞭毛類(Trypanosoma、Leishmania、Tri
chomonas、Giardiaなど);ウイルス(例えば、(+)RNAウ
イルス(例として、ポックスウイルス(例えば、vaccinia)、ピコルナ
ウイルス(例えば、polio);トガウイルス(例えば、rubella);
フラビウイルス(例えば、HCV);およびコロナウイルスが挙げられる)、(
−)RNAウイルス(例として、ラブドウイルス(例えば、VSV);パラミク
ソウイルス(例えば、RSV);オルトミクソウイルス(例えば、インフルエン
ザ);ブンヤウイルス;およびアレナウイルスが挙げられる)、dsDNAウイ
ルス(例えば、レオウイルス)、RNA to DNAウイルス(すなわち、レ
トロウイルス(例えば、特に、HIVおよびHTLV))、ならびに特定のDN
A to RNAウイルス(例えば、B型肝炎ウイルス)。
Similarly, proteins for possible vaccine applications, derived from infectious organisms, are described in more detail below and include: infectious fungi (eg, Aspergillus, Candida species) Bacteria (especially E. coli, which serves as a model for pathogenic bacteria), as well as bacteria of medical interest (eg, S.
tapylococci (eg, aureus), Streptococci
i (for example, pneumoniae), Clostridia (for example, per
fringens), Neisseria (e.g., gonorrhoea),
Enterobacteriaceae (eg, coli), Helicob
actor (eg, pylori), Vibrio (eg, cholera)
e), Capylobacter (eg, jejuni), Pseudomo
nas (eg, aeruginosa), Haemophilus (eg,
influenzae), Bordetella (eg, pertussis)
), Mycoplasma (eg, pneumoniae), Ureapla
sma (eg, urealyticum), Legionella (eg,
pneumophila), Spirochetes (eg, Trepone)
ma, Leptospira, and Borrelia), Mycobacterte
ria (eg, tuberculosis, smegmatis), Acti
nomyces (eg, israelii), Nocardia (eg, a
steroides), Chlamydia (eg, trachomatis)
), Rickettsia, Coxiella, Ehrichichia, Roc
halimaea, Brucella, Yersinia, Fracisell
a, and Pasteurella; protozoa (eg, sporozoa (eg, Plasmodia), rhizopods (eg, Entamoeb)
a), and flagella (Trypanosoma, Leishmania, Tri)
chomonas, Giardia, etc.); viruses (eg, (+) RNA viruses (eg, poxviruses (eg, vaccinia), picornaviruses (eg, polio); togaviruses (eg, rubella);
Flaviviruses (eg, HCV); and coronaviruses), (
-) RNA viruses (eg, rhabdoviruses (eg, VSV); paramyxoviruses (eg, RSV); orthomyxoviruses (eg, influenza); bunyaviruses; and arenaviruses), dsDNA viruses (eg, Reoviruses), RNA to DNA viruses (ie, retroviruses (eg, HIV and HTLV, in particular)), and certain DNs
A to RNA virus (eg, hepatitis B virus).

【0076】 医学的ではない用途に関連する他のタンパク質(例えば、転写インヒビター、
または農作物の害虫(例えば、昆虫、真菌、タバコ植物など)の毒素)もまた、
シャッフリングの好ましい標的である。産業的に重要な酵素(例えば、モノオキ
シゲナーゼ、プロテアーゼ、ヌクレアーゼ、およびリパーゼ)もまた、好ましい
標的である。例として、サブチリシンが、コドン変更されたサブチリシン遺伝子
の形態をシャッフリングすることによって進化させられ得る(von der
Ostenら、J.Biotechnol.28:55−68(1993)は、
サブチリシンをコードする核酸を提供する)。シャペロンのような折り畳みを補
助するタンパク質もまた好ましい。
Other proteins relevant to non-medical uses (eg, transcription inhibitors,
Or toxins of crop pests (eg, insects, fungi, tobacco plants, etc.)
It is a preferred target for shuffling. Industrially important enzymes such as monooxygenases, proteases, nucleases and lipases are also preferred targets. As an example, subtilisin can be evolved by shuffling the form of the codon-altered subtilisin gene (von der
Osten et al. Biotechnol. 28: 55-68 (1993)
Providing nucleic acids encoding subtilisins). Folding assisting proteins such as chaperones are also preferred.

【0077】 コドン変更およびシャッフリングに適切な好ましい公知の遺伝子はまた、以下
を含む:α−1抗トリプシン、アンジオスタチン、抗溶血因子、アポリポタンパ
ク質、アポタンパク質、心房性ナトリウム利尿因子、心房性ナトリウム利尿ポリ
ペプチド、心房性ペプチド、C−X−Cケモカイン(例えば、T39765、N
AP−2、ENA−78、Gro−a、Gro−b、Gro−c、IP−10、
GCP−2、NAP−4、SDF−1、PF4、MIG)、カルシトニン、CC
ケモカイン(例えば、単球化学誘導蛋白−1、単球化学誘導蛋白−2、単球化学
誘導蛋白−3、単球炎症性タンパク質−1α、単球炎症性タンパク質−1β、R
ANTES,I309、R83915、R91733、HCC1、T58847
、D31065、T64262)、CD40リガンド、コラーゲン、コロニー刺
激因子(CSF)、補体因子5a、補体インヒビター、補体レセプター1、第I
X因子、第VII因子、第VIII因子、第X因子、フィブリノーゲン、フィブ
ロネクチン、グルコセレブロシダーゼ、性腺刺激ホルモン、ヘッジホッグタンパ
ク質(例えば、Sonic、Indian、Desert)、ヘモグロビン(代
用血液のため、放射性線増感のため)、ヒルジン、ヒト血清アルブミン、ラクト
フェリン、ルシフェラーゼ、ニュートリン(Neurturin)、好中球阻害
因子(NIF)、骨形成タンパク質、副甲状腺ホルモン、プロテインA、プロテ
インG、リラキシン、レニン、サケカルシトニン、サケ成長ホルモン、可溶性補
体レセプターI、可溶性I−CAM1、可溶性インターロイキンレセプター(I
L−1、2、3、4、5、6、7、9、10、11、12、13、14、15)
、可溶性TNFレセプター、ソマトメジン、ソマトスタチン、ソマトトロピン、
ストレプトキナーゼ、スーパー抗原(すなわち、Staphylococcal
腸毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE))
、トキシックショック症候群毒素(TSST−1)、落屑(Exfoliati
ng)毒素AおよびB、発熱性外毒素A、B、およびC、ならびにM.arth
ritisesマイトジェン、スーパーオキシドジスムターゼ、サイモシンα1
、組織プラスミノーゲンアクチベーター、腫瘍壊死因子β(TNFβ)、腫瘍壊
死因子レセプター(TNFR)、腫瘍壊死因子α(TNFα)、およびウロキナ
ーゼ。多くの他の公知のコード核酸(例えば、GenebankTM中のもの)が
、コドン変更され得、そしてシャッフリングされ得る。
Preferred known genes suitable for codon alterations and shuffling also include: α-1 antitrypsin, angiostatin, antihemolytic factors, apolipoprotein, apoprotein, atrial natriuretic factor, atrial natriuresis Polypeptides, atrial peptides, CXC chemokines (e.g., T39765, N
AP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10,
GCP-2, NAP-4, SDF-1, PF4, MIG), calcitonin, CC
Chemokines (e.g., monocyte chemistry-induced protein-1, monocyte chemistry-induced protein-2, monocyte chemistry-induced protein-3, monocyte inflammatory protein-1α, monocyte inflammatory protein-1β, R
ANTES, I309, R83915, R91733, HCC1, T58847
, D31065, T64262), CD40 ligand, collagen, colony stimulating factor (CSF), complement factor 5a, complement inhibitor, complement receptor 1, I
Factor X, Factor VII, Factor VIII, Factor X, fibrinogen, fibronectin, glucocerebrosidase, gonadotropin, hedgehog proteins (eg, Sonic, Indian, Desert), hemoglobin (for blood substitutes, radioactive Hirudin, human serum albumin, lactoferrin, luciferase, neutrin, neutrophil inhibitor (NIF), bone morphogenetic protein, parathyroid hormone, protein A, protein G, relaxin, renin, salmon calcitonin , Salmon growth hormone, soluble complement receptor I, soluble I-CAM1, soluble interleukin receptor (I
L-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15)
, Soluble TNF receptor, somatomedin, somatostatin, somatotropin,
Streptokinase, superantigen (ie, Staphylococcal)
Enterotoxin (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE)
, Toxic shock syndrome toxin (TSST-1), desquamation (Exfoliati)
ng) Toxins A and B, pyrogenic exotoxins A, B, and C; art
ritises mitogen, superoxide dismutase, thymosin α1
, Tissue plasminogen activator, tumor necrosis factor β (TNFβ), tumor necrosis factor receptor (TNFR), tumor necrosis factor α (TNFα), and urokinase. Many other known encoding nucleic acids, such as those in Genebank , can be codon-altered and shuffled.

【0078】 (遺伝子ファミリーのシャッフリングのための出発物質として再設計されそし
て化学的に合成されたコドン用法を有する遺伝子−−DNAのシャッフリングの
多様性の拡大) 生物間で好まれる遺伝子コードが、極めて類似であるものから非常に異なるも
のまで存在するので、異なる生物体に由来する相同遺伝子は、アミノ酸レベルよ
りも核酸レベルで有意により低い相同性を有し得る。例えば、いくつかの細菌種
についての遺伝情報は、GC含量において高い(70%まで)が、一方、他のも
のは、ATに富む(>60%)コドン用法を有する。従って、異なる生物体に由
来する遺伝子は、例えば、40〜60%のアミノ酸同一性を有し得るが、わずか
に25〜35%の核酸の同一性しか有さない。相同配列を組換える能力を増大さ
せ、それによって本発明の方法を使用してファミリーシャッフリングの効率を増
大させるために、このような核酸同一性レベルを増大させることが、しばしば所
望される。他の局面においては、例えば、ベクターと宿主DNAとの間での組換
え速度を減少させることがしばしば所望され、それによってベクターの安全性を
増大させることが所望されるベクターを使用する場合には、システムにおける組
換え速度を低下させることが実際に好ましい。以下の実施例は、コドン変更され
た核酸をシャッフリングすることに関して特定の問題点について記載する。
Genes with Redesigned and Chemically Synthesized Codon Usage as Starting Materials for Shuffling of Gene Families—Expanding the Diversity of DNA Shuffling The preferred genetic code among organisms is Homologous genes from different organisms can have significantly lower homology at the nucleic acid level than at the amino acid level, as there are from similar to very different. For example, genetic information for some bacterial species is high in GC content (up to 70%), while others have AT-rich (> 60%) codon usage. Thus, genes from different organisms can have, for example, 40-60% amino acid identity, but have only 25-35% nucleic acid identity. It is often desirable to increase such levels of nucleic acid identity in order to increase the ability to recombine homologous sequences and thereby increase the efficiency of family shuffling using the methods of the present invention. In other aspects, for example, when using vectors where it is desired to reduce the rate of recombination between the vector and the host DNA, thereby increasing the safety of the vector, It is actually preferred to reduce the recombination rate in the system. The following examples describe certain issues with shuffling codon-altered nucleic acids.

【0079】 (相同性を増大させるためのコドン使用の変更) 1つの局面においては、遺伝子ファミリーのメンバーのタンパク質配列は、例
えば、任意の従来のDNA操作プログラムにおける好ましいコドン使用チャート
の1つ(例えば、Wisconsin Package(登録商標)、SeqW
eb,OMIGA,SeqApp、SeqPup,MacVector、DNA
stryder、GeneWorksなど)を使用して、DNA配列へと逆に
翻訳される。コドンの使用の選択は、しばしば、遺伝子が発現される宿主によっ
て決定される。DNA配列の同一性の割合を最大化した後、遺伝子は、例えば、
高スループットオリゴヌクレオチド合成装置を使用して、例えば、96−ウェル
形式で、必要に応じて、ポリメラーゼおよび/またはリガーゼ遺伝子合成方法と
組み合わせて、化学的に合成される。
Alteration of Codon Usage to Increase Homology In one aspect, the protein sequence of a member of a gene family can be, for example, one of the preferred codon usage charts in any conventional DNA manipulation program (eg, , Wisconsin Package (R), SeqW
eb, OMIGA, SeqApp, SeqPup, MacVector, DNA
(Strider, GeneWorks, etc.). The choice of codon usage is often determined by the host in which the gene is expressed. After maximizing the percentage of DNA sequence identity, the gene is
It is chemically synthesized using a high-throughput oligonucleotide synthesizer, for example, in a 96-well format, optionally in combination with polymerase and / or ligase gene synthesis methods.

【0080】 一般的には、このような処理後のDNA配列の類似性は、少なくともアミノ酸
の類似性と同程度に高いが、任意の所定のコドンについての配列同一性のランダ
ムな頻度に基づいて(天然に存在する遺伝子(これは、通常はコードされるポリ
ペプチドよりも十分には保存されていない)についての状況と比較して)、アミ
ノ酸同一性よりも、少なくとも約10%から15%高くなり得る。ほとんどの場
合においては、アミノ酸同一性について最少の要件は、約35%程度の低さであ
り得るが、なお、標準的な組換え方法についての十分な核酸の相同性を保持して
いる(前出において議論されているように、オリゴヌクレオチドによって媒介さ
れる組換え方法は、組換えを達成するためには高いレベルの類似性を必要とはし
ない)。しかし、いくつかの場合(例えば、保存された領域が遺伝子内でクラス
ターを形成する場合)においては、最少のアミノ酸の同一性はなおより低くあり
得る。
In general, the similarity of DNA sequences after such treatment is at least as high as amino acid similarity, but based on the random frequency of sequence identity for any given codon. (Compared to the situation for a naturally occurring gene, which is usually less conserved than the encoded polypeptide), at least about 10% to 15% more than amino acid identity Can be. In most cases, the minimum requirement for amino acid identity can be as low as about 35%, yet retain sufficient nucleic acid homology for standard recombination methods (see The oligonucleotide-mediated recombination methods do not require a high level of similarity to achieve recombination, as discussed in supra.) However, in some cases (eg, where conserved regions form clusters within a gene), the minimum amino acid identity may still be lower.

【0081】 (実施例:コドンを改変されたEPOのシャッフリング) タンパク質エリトロポイエチンα(EPOとしてもまた公知である)、Epo
gen、およびProcritは、造血性のホルモンであり、これは、貧血(例
えば、AIDSの共通の症状)を罹患している患者に対して種々の利点を提供す
る。EPOは、世界中で約10億ドルの売上がある医薬品として生産されている
。従って、EPO様の活性(および好ましくは、優れた活性)を有するタンパク
質が、実質的な商業的な目的である。
Example: Shuffling of EPO with Modified Codons Protein erythropoietin α (also known as EPO), Epo
Gen and Procrit are hematopoietic hormones that provide various benefits to patients suffering from anemia (eg, a common symptom of AIDS). EPO is produced as a pharmaceutical with worldwide sales of approximately $ 1 billion. Thus, proteins with EPO-like activity (and preferably excellent activity) are of substantial commercial interest.

【0082】 図1は、サルのEPO遺伝子の一部の配列を示す。これは、ヒトのEPO遺伝
子と類似である。図2は、コドン変更されたEPO核酸(または、「ゆらぎ」の
EPO遺伝子)の例を示す。一般的には、転位変異よりもむしろ塩基転換が、可
能な場合、行われる。この戦略の目的は、天然に存在するEPOを有する得られ
る遺伝子のハイブリダイゼーションを最大限に破壊することである。図3は、天
然に存在するEPOのアラインメントを示す。
FIG. 1 shows the sequence of a portion of the monkey EPO gene. It is similar to the human EPO gene. FIG. 2 shows an example of a codon-modified EPO nucleic acid (or "wobble" EPO gene). Generally, transversion rather than transposition mutation is performed, where possible. The purpose of this strategy is to maximally disrupt hybridization of the resulting gene with naturally occurring EPO. FIG. 3 shows an alignment of naturally occurring EPO.

【0083】 この戦略は、配列の破壊を最大にするために塩基の対合の標準的な規則(例え
ば、G−C対合およびGCの積み重ねの排除)を適用することによって、さらに
良好に調節される;さらに、保存的または非保存的なアミノ酸の改変もまた、行
われ得る(複数のコドン変更された核酸がシャッフリングされるいくつかの場合
においては、シャッフリングの間に野生型のアミノ酸に戻ることを可能にする、
重複しない非保存的な置換を有するコドン変更された核酸を作製することが所望
される)。EPOをコードする核酸についての配列空間の大きさは、大きく、約
2.8×1088の異なる配列である(領域中に約1080個の粒子が存在する;従
って、EPOをコードする可能性のある配列の全てを作製することは物理的に不
可能である)。図4に模式的に示すように、当業者が最大に異なるゆらぎの遺伝
子(ロイシン、アルギニン、およびセリンについてのコドンの別の型を使用する
もの)のみを考慮する場合は、EPOをコードする1038個の配列の配列空間が
なお存在する。全体的な戦略は、ゆらぎの遺伝子のライブラリーを合成し、所望
される場合は、発現および活性についてスクリーニングし、そして所望される遺
伝子を(例えば、反復プロセスによって)DNAシャッフリングすることである
This strategy is better regulated by applying standard rules of base pairing (eg, elimination of GC pairing and GC stacking) to maximize sequence disruption. In addition, conservative or non-conservative amino acid modifications may also be made (in some cases where multiple codon-altered nucleic acids are shuffled, revert to wild-type amino acids during shuffling). Enable you to
It is desirable to generate codon-altered nucleic acids with non-overlapping non-conservative substitutions). The size of the sequence space for nucleic acids encoding EPO is large, about 2.8 × 10 88 different sequences (about 10 80 particles in the region; It is physically impossible to create all of the sequences with As shown schematically in FIG. 4, if one of skill in the art considers only the most different fluctuating genes (ones that use another type of codon for leucine, arginine, and serine), then the 10 There is still a sequence space of 38 sequences. The overall strategy is to synthesize a library of wobble genes, screen for expression and activity if desired, and DNA shuffle the desired genes (eg, by an iterative process).

【0084】 コドン変更された核酸をさらに進化させることが、目的である。天然に由来す
る他の相同遺伝子、設計された遺伝子(設計された配列のバリエーションのライ
ブラリーを取り込む)、および目的の変異を含む遺伝子を用いるシャッフリング
が、目的の任意の遺伝子を進化させるための戦略である。しかし、コドン変更さ
れた核酸は、配列の差異のために、これらの遺伝子を用いては容易にはシャッフ
リングされないかもしれず;またはこれらは、他の理由のために所望されないか
もしれない(例えば、天然に存在する配列が、特許であり得るか、もしくは特許
の要素を含み得る)。これらの困難は、所望されるアミノ酸のバリエーション(
例えば、相同遺伝子中に見出されるもの)をコードするコドン変更された相同核
酸を合成することによって回避され得るが、これは、組換えられる核酸(単数ま
たは複数)に対して接近したコドンのセットを有する(それによって、例えば、
組換えの間のハイブリダイゼーションを可能にする)。
It is an object to further evolve codon-altered nucleic acids. A strategy for evolving any gene of interest by shuffling with other homologous genes from nature, the designed gene (which incorporates a library of designed sequence variations), and the gene containing the mutation of interest It is. However, codon-altered nucleic acids may not be easily shuffled using these genes due to sequence differences; or they may not be desirable for other reasons (eg, natural May be patented or may comprise elements of patented). These difficulties depend on the desired amino acid variation (
For example, it can be avoided by synthesizing a codon-altered homologous nucleic acid that encodes the one found in the homologous gene), which reduces the set of codons in close proximity to the nucleic acid (s) to be recombined. Have (by which, for example,
Allowing hybridization during recombination).

【0085】 例えば、目的のホモログ(例えば、EPOについて図3に示されるもの)を同
定した後、同じタンパク質をコードするコドン変更された核酸が、類似のコドン
選択を用いて合成される。次いで、標準的なファミリーシャッフリングが、コド
ン変更された核酸を用いて実行される。これは、図5中にEPOについて模式的
に示される。
For example, after identifying a homologue of interest (eg, that shown in FIG. 3 for EPO), codon-altered nucleic acids encoding the same protein are synthesized using similar codon choices. Standard family shuffling is then performed using the codon-modified nucleic acid. This is shown schematically for EPO in FIG.

【0086】 EPOのゆらぎの変異体は、発現についてスクリーニングされ、次いで、レセ
プター結合アッセイが、ヒトのEPOr−Fc融合体を使用してELISA形式
で行われる。結合変異体の選択の後、活性が、UT7−EPO(ヒトの骨髄細胞
株)細胞増殖アッセイにおいてチミジンの取りこみとして測定される。細胞は、
EPO変異体の種々の濃度を用いて、2−3日間処理され、その後、これらは、
3−Hチミジンの存在下で4時間インキュベートされ、そしてチミジンの取り込
みが測定される。Erickson−millerら(1997)Blood
90:2421(レセプター結合アッセイについて)、およびWenら(199
4)J.Biol.Chem.269:22839−22846(チミジンの取
り込みのアッセイについて)をもまた参照のこと。
[0086] Fluctuation variants of EPO are screened for expression, and receptor binding assays are then performed in an ELISA format using the human EPOr-Fc fusion. After selection of binding mutants, activity is measured as thymidine incorporation in the UT7-EPO (human bone marrow cell line) cell proliferation assay. The cells are
Treated with various concentrations of EPO variants for 2-3 days, after which they are
Incubate for 4 hours in the presence of 3-H thymidine and measure thymidine incorporation. Erickson-miller et al. (1997) Blood.
90: 2421 (for receptor binding assays), and Wen et al.
4) J.I. Biol. Chem. 269: 22839-22846 (for assays for thymidine incorporation).

【0087】 EPOを選択するためのアッセイはまた、例えば、血液細胞の増殖を刺激する
EPOタンパク質の能力(例えば、インビトロまたはインビボ)に基づき得る。
Assays for selecting EPO may also be based, for example, on the ability of the EPO protein to stimulate blood cell proliferation (eg, in vitro or in vivo).

【0088】 (実施例:G−CSFのコドンシャッフリング) ファミリーシャッフリングを、スクリーニングされるライブラリー中に遺伝子
から多様性を改良するために使用し得る。さらに、設計の発見的手法(例えば、
疎水性コア残基のランダム化)を、タンパク質の一次構造と三次構造との間での
縮重(すなわち、多くの異なる一次構造が、非常に類似する三次元構造を有する
タンパク質をコードする)を利用するように使用し得る。
Example: Codon Shuffling of G-CSF Family shuffling can be used to improve diversity from genes in the library being screened. In addition, heuristic approaches to design (eg,
The degeneracy between the primary and tertiary structures of the protein (ie, many different primary structures encode proteins with very similar three-dimensional structures) Can be used to take advantage.

【0089】 設計の発見的手法は、もともとの活性を保存しているタンパク質をコードする
ように高度に偏っている(ランダムな変異誘発と比較して)と推定される変異体
の配列空間を作製するために使用する。高スループット(HTP)スクリーニン
グおよびファージパニングのような方法を、所望の活性を有する設計されたライ
ブラリーのメンバーを同定するために使用する。DNAシャッフリングを、変異
体を良好に調節するように、この活性なクローンの集団を改良するために使用し
、これにより、当業者が、天然に存在するタンパク質と比較して、等価なまたは
それよりも優れた機能を有する変異体を進化させることを可能にする。
A heuristic approach to design creates a sequence space of putative mutants that are highly biased (compared to random mutagenesis) to encode proteins that preserve the original activity. Use to Methods such as high-throughput (HTP) screening and phage panning are used to identify members of the designed library with the desired activity. DNA shuffling is used to improve this population of active clones so as to better regulate the mutant, so that one of skill in the art can compare the naturally occurring protein with an equivalent or better protein. Also makes it possible to evolve variants with superior functions.

【0090】 図6および7は、いくつかのG−CSFの哺乳動物のホモログを示す。図8は
、ヒトのG−CSFの疎水性コア残基を示す(黒くした)。図9は、配列中で高
度に異なる、ヒトのG−CSFの変異体を進化させるための戦略を示す。最初に
、G−CSFの哺乳動物のホモログの多様性の全てを含むこれらの遺伝子を合成
する(遺伝子1、2、および3、図8)。これらの遺伝子を、シャッフリングし
、G−CSFレセプターに対してファージパニングし、そして生物学的機能(レ
セプター活性)についてHTPスクリーニングする。活性なクローンを、繰り返
してシャッフリングし、そして必要である場合には、(ヒト細胞において)活性
においてヒトの遺伝子に匹敵するかまたは超える、進化した変異体を生じるよう
に、スクリーニングする。
FIGS. 6 and 7 show some mammalian homologs of G-CSF. FIG. 8 shows the hydrophobic core residues of human G-CSF (darkened). FIG. 9 illustrates a strategy for evolving human G-CSF variants that differ highly in sequence. First, these genes, including all of the diversity of mammalian homologs of G-CSF, are synthesized (genes 1, 2, and 3, FIG. 8). These genes are shuffled, phage panned against the G-CSF receptor, and HTP screened for biological function (receptor activity). Active clones are repeatedly shuffled and, if necessary, screened to generate evolved variants that are comparable (or greater) in activity (in human cells) to the human gene.

【0091】 次に、当業者は、高度に変異した疎水性コアを有する変異体を進化させる。こ
れは、図8に模式的に説明され、そして生物学的なスクリーニングを実行するた
めの特異的な戦略が、図9に模式的に示される。疎水性コアがランダム化された
ライブラリーのスクリーニングの後で得られる最良の変異体が、野生型のヒトの
G−CSFよりも低い活性であり得ることが、予期される。なぜなら、このよう
な手順において活性を最初に最適化することは困難であるからである。ファミリ
ーシャッフリングを、最適化された変異体を得るために使用する。このことは、
疎水性コアの位置以外の全てで哺乳動物ホモログの多様性を含む遺伝子を合成す
ることによって行う;しかし、これらは、進化した野生型ではない疎水性のコア
の状況において合成される。ファミリーシャッフリングを、新規の疎水性コアに
ついて最適化するために使用する。
Next, those skilled in the art will evolve variants with highly mutated hydrophobic cores. This is schematically illustrated in FIG. 8, and a specific strategy for performing a biological screen is schematically illustrated in FIG. It is expected that the best variants obtained after screening a library in which the hydrophobic core has been randomized may be less active than wild-type human G-CSF. This is because it is difficult to optimize activity first in such a procedure. Family shuffling is used to obtain optimized variants. This means
By synthesizing genes containing mammalian homolog diversity at all but the location of the hydrophobic core; however, they are synthesized in the context of an evolved non-wild-type hydrophobic core. Family shuffling is used to optimize for the new hydrophobic core.

【0092】 この戦略は、その野生型タンパク質とは大きく異なるアミノ酸からなる、野生
型タンパク質についての機能的に類似の疎水性コアが存在するので、作用する。
この理解は、モデルシステムにおける最近の実験によって支持される。例えば、
λリプレッサーの疎水性コア中の3つの残基についての53%のランダム化され
た配列が折り畳まれ、そして生物学的に活性である(LimおよびSauer(
1991)J.Mol.Biol.219:359−376)。極性アミノ酸と
非極性のアミノ酸のパターン化によるタンパク質の設計(ここでは、4−へリッ
クスの束状構造のタンパク質の疎水性コア中の24個の残基)が、Kamtek
arら(1993)Science 262:1321によってランダム化され
た。折り畳まれたαへリックスタンパク質は、約1%のクローンから回収された
。DesjarlaisおよびHandel(1995)Current Op
inion in Biiotechnology 6:460−466は、R
op(別の4−へリックス束状構造タンパク質)の変異体を示した。ここでは、
4個の疎水性コア残基がランダム化され、そして活性な変異体が得られている。
Axeら、(1996)PNAS 95:5590−5594は、酵素のバルナ
−ゼ(barnase)中の13個の疎水性コア残基をランダム化することによ
ってライブラリー中に生物学的活性を保持している23%のクローンを生じたこ
とを示した。Gassenerら(1996)PNAS 93:12155−1
2158は、疎水性コア中の10残基がMetで置換されている、T4リゾチー
ムの変異体を記載している。これによって、このタンパク質の疎水性コアが置換
に非常に寛容であることが明らかである。まとめると、モデルシステムにおける
この実験証拠は、多くのタンパク質の疎水性コアが活性なタンパク質を生じる類
似の様式においてパックする、他の疎水性残基で置き換えられ得ることを示す。
この縮重は、天然の遺伝子およびコドン変更された遺伝子の新規の形態を進化さ
せるために使用される。
This strategy works because there is a functionally similar hydrophobic core for the wild-type protein, consisting of amino acids that differ significantly from the wild-type protein.
This understanding is supported by recent experiments on model systems. For example,
53% of the randomized sequences for three residues in the hydrophobic core of the λ repressor are folded and biologically active (Lim and Sauer (
1991). Mol. Biol. 219: 359-376). The design of proteins by patterning polar and non-polar amino acids (here, the 24 residues in the hydrophobic core of a 4-helix bundle protein) was performed by Kamtek
Randomized by ar et al. (1993) Science 262: 1321. The folded α-helix protein was recovered from approximately 1% of the clones. Desjarrais and Handel (1995) Current Op
inion in Biotechnology 6: 460-466 is R
A mutant of op (another 4-helix bundle protein) was shown. here,
Four hydrophobic core residues have been randomized and active variants have been obtained.
Axe et al. (1996) PNAS 95: 5590-5594 retain biological activity in a library by randomizing 13 hydrophobic core residues in the enzyme barnase. 23% clones. (1996) PNAS 93: 12155-1.
2158 describes a variant of T4 lysozyme in which 10 residues in the hydrophobic core have been replaced by Met. This reveals that the hydrophobic core of this protein is very tolerant of displacement. Taken together, this experimental evidence in a model system indicates that the hydrophobic core of many proteins can be replaced with other hydrophobic residues that pack in a similar fashion resulting in an active protein.
This degeneracy is used to evolve new forms of native and codon-altered genes.

【0093】 関連するアプローチは、進化させることが所望されるタンパク質と類似の活性
を有するタンパク質についてのタンパク質のデータベースを検索することである
。Denesyukら(1996)J.Theor.Biolは、G−CSFの
こについてのような検索の結果を示す。LIFは非常に類似して折り畳まれるタ
ンパク質である。当業者は、活性のために必要とされるG−CSFの残基をその
上に配置する「足場」としてLIFを使用し得る。G−CSF「かつら(tou
pee)」を有するLIFの場合は、当業者は、かつらが完全に生物学的に活性
な形態で提示される変異体を得るように、LIF足場をファミリーシャッフリン
グする。
A related approach is to search a protein database for proteins having similar activity to the protein desired to be evolved. (1996) J. Denesyuk et al. Theor. Biol shows the result of a search such as this for G-CSF. LIF is a protein that folds very similarly. One skilled in the art can use LIF as a "scaffold" on which the residues of G-CSF required for activity are located. G-CSF "wig (tou
In the case of a LIF with “pee” ”, one skilled in the art family shuffles the LIF scaffold such that the wig obtains a variant that is presented in a completely biologically active form.

【0094】 別のアプローチは、機能的であると推定される変異体のファミリーを作製する
ためのコンピューター化された方法を使用することである。Dahiyatおよ
びMayo、Scienceは、最近、タンパク質を設計するために使用される
コンピューター方法を記載している。タンパク質は、しばしば遺伝的なアルゴリ
ズムの補助を用いて、コンピューター上で模倣され、そして「適合する」と考え
られるサブセットが、実際に合成され、そして「分析される」。これらのコンピ
ューターによる方法は、しだいに強力になりつつある。これらは、例えば、機能
を破壊しないタンパク質の表面上の変異のファミリーを推定するために有用であ
る。DNAシャッフリングは、設計によって得られる活性なクローンを最適化す
るために使用され得る。G−CSFの例を挙げると、当業者は、推定の機能的な
変異体のファミリーを設計するために、全ての構造機能データ(例えば、Rei
dhaar−Olsen(Biochemistry)によって最近報告された
G−CSFについてのアラニンスキャンのデータ)と組み合わせて、コンピュー
ターによる方法を使用し得る。当業者は、例えば、設計の束縛を考慮して野生型
の遺伝子に対して最少のDNA同一性を有するようにファミリーを設計し得る。
このライブラリーを、合成し、生物学的なスクリーニングおよび/または選択に
通し(すなわち、G−CSFレセプターに対するパニング)、そして活性な変異
体を得る。次いで、DNAシャッフリングを、機能の所望されるレベルを有する
これらの活性な変異体を進化させるために使用する。
Another approach is to use a computerized method to generate a family of putatively functional variants. Dahiyat and Mayo, Science, recently described computer methods used to design proteins. Proteins are mimicked on a computer, often with the aid of genetic algorithms, and the subsets that are considered “fit” are actually synthesized and “analyzed”. These computer methods are becoming increasingly powerful. These are useful, for example, for estimating families of mutations on the surface of proteins that do not disrupt function. DNA shuffling can be used to optimize active clones obtained by design. To give an example of G-CSF, one of skill in the art will be able to design all putative functional variant families to obtain all the structure-function data (eg, Rei
Combined with Dhaar-Olsen (Biochemistry) recently reported alanine scan data for G-CSF), a computerized method can be used. One skilled in the art can, for example, design a family to have minimal DNA identity to a wild-type gene, taking into account design constraints.
This library is synthesized, passed through biological screening and / or selection (ie, panning for the G-CSF receptor), and active variants are obtained. DNA shuffling is then used to evolve these active variants with the desired level of function.

【0095】 G−CSFタンパク質を、ファージ上に提示し、そしてELISA形式におい
てヒトのG−CSFレセプターに対する結合についてスクリーニングする。レセ
プターに結合する変異体を、レセプターの活性化についての高スループットスク
リーニングにおいて選択する。この細胞に基づくアッセイは、STAT結合エレ
メントを含有しているG−CSF応答性の構築物によって活性化されるレポータ
ー遺伝子(例えば、ルシフェラーゼ)を介してレセプターの活性化を測定する。
細胞(例えば、HepG2)を、G−CSF応答性のレポータープラスミドで形
質転換し、そしてコドンをシャッフリングされたG−CSF変異体を用いて2.
5時間処理する。次いで、細胞を、溶解し、そしてルシフェラーゼ活性を測定す
る。Tianら、(1998)Science 281:257−259もまた
参照のこと。
The G-CSF protein is displayed on phage and screened for binding to the human G-CSF receptor in an ELISA format. Mutants that bind to the receptor are selected in a high-throughput screen for receptor activation. This cell-based assay measures receptor activation via a reporter gene (eg, luciferase) that is activated by a G-CSF responsive construct containing a STAT binding element.
1. Transform cells (e.g., HepG2) with a G-CSF responsive reporter plasmid and use the G-CSF mutant with the codon shuffled.
Treat for 5 hours. The cells are then lysed and luciferase activity is measured. See also Tian et al., (1998) Science 281: 257-259.

【0096】 (実施例:アルカリホスファターゼのコドンシャッフリング) アルカリホスファターゼは、ELISAアッセイ、タンパク質融合アッセイの
ために広範に使用されるレポーター酵素であり、そして哺乳動物細胞についての
レポーター遺伝子としての分泌された形態である。この酵素のより活性な形態が
所望される。
Examples: Codon Shuffling of Alkaline Phosphatase Alkaline phosphatase is a reporter enzyme widely used for ELISA assays, protein fusion assays, and secreted forms as reporter genes for mammalian cells It is. A more active form of this enzyme is desired.

【0097】 アルカリホスファターゼのコドン変更された形態を、図10中に示されるオリ
ゴを使用してPCRアセンブリによって生成した。オリゴのマップを図11に示
す。使用した手順は、本質的には、Stemmerら(1994)Gene 1
64:49−57において教示されるものと同一であった。簡潔には、オリゴを
、種々の希釈で、1:1混合し、そして、例えば、94℃(60秒)、94℃(
30秒)、50℃(30秒)、72℃(30秒)でのPCRの、例えば25−6
0サイクルを行って、PCRアセンブリした。BIAP遺伝子のアセンブリを、
循環形式で行い、そして遺伝子のフラグメントを精製した。約100,000個
のコロニーをLB/amプレート上でスクリーニングした(約1/10がwtプ
ラスミドである)。およそ1/10が、バックグラウンドよりも青い色を示した
。プラスミドDNAは正しい挿入を示した。
A codon-altered form of alkaline phosphatase was generated by PCR assembly using the oligos shown in FIG. The oligo map is shown in FIG. The procedure used was essentially that of Stemmer et al. (1994) Gene 1
64: 49-57. Briefly, the oligos are mixed 1: 1 at various dilutions and, for example, 94 ° C. (60 seconds), 94 ° C. (
30 sec), 50 ° C. (30 sec), PCR at 72 ° C. (30 sec), for example, 25-6
Zero cycles were performed to perform PCR assembly. Assembling the BIAP gene
Performed in a circular format and the gene fragment was purified. About 100,000 colonies were screened on LB / am plates (about 1/10 is wt plasmid). Approximately 1/10 showed a blue color above background. Plasmid DNA showed the correct insertion.

【0098】 一般的には、ホスファターゼ活性についての代表的な比色アッセイを使用する
ペトリ皿のスクリーニングが、スクリーニングに使用され得る。これは、利点を
有しており、すなわち、単純であり、高スループットであり、そして半定量的で
ある。マイクロタイタープレートのスクリーニングもまた、好ましい。これは、
比色的であり、そして定量的であるが、さらなる機器が実行のために必要とされ
得る。
In general, screening petri dishes using a representative colorimetric assay for phosphatase activity can be used for screening. This has advantages: it is simple, high-throughput, and semi-quantitative. Screening of microtiter plates is also preferred. this is,
Colorimetric and quantitative, but additional equipment may be required for implementation.

【0099】 (実施例:ベクターからのコンピテントウイルスの産生を低下させるため、お
よび免疫原性の組成物およびワクチンとしての弱毒化されたウイルスを生成する
ための、コドンシャッフリング) 細胞を、レトロウイルス、ポックスウイルス、アデノウイルス(Ads)、ヘ
ルペスウイルス、およびパルボウイルスに由来するものを含む多数のウイルスベ
クターを用いて安定に形質導入し得る。一般的なウイルスベクターとして、マウ
ス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、ヒト
免疫不全ウイルス(HIV)、アデノウイルス、アデノ随伴ウイルス(AAV)
、エプスタインバーウイルス、カナリヤポックスウイルス、ウシポックスウイル
ス、およびワクシニアウイルスに由来するものが挙げられる。レトロウイルス、
アデノ随伴ウイルス、ヘルペスウイルス、およびアデノウイルスに基づくウイル
スベクターは全て、エキソビボおよびインビボの方法による生物体の細胞中への
治療用核酸の導入のための遺伝子治療ベクターとして使用される。
Examples: Codon shuffling to reduce production of competent virus from vectors and to produce attenuated virus as immunogenic compositions and vaccines. , Poxviruses, adenoviruses (Ads), herpes viruses, and parvoviruses. Common viral vectors include mouse leukemia virus (MuLV), gibbon ape leukemia virus (GaLV), human immunodeficiency virus (HIV), adenovirus, adeno-associated virus (AAV)
, Epstein-Barr virus, canarypox virus, bovine pox virus, and vaccinia virus. Retrovirus,
Adeno-associated virus, herpes virus, and adenovirus-based viral vectors are all used as gene therapy vectors for the introduction of therapeutic nucleic acids into cells of an organism by ex vivo and in vivo methods.

【0100】 ウイルスベクターを使用する場合は、パッケージング細胞を、標的細胞を形質
導入するために使用されるビリオンを調製するために一般的に使用する。これら
のベクターにおいては、トランス活性遺伝子は、不活化され、そしてパッケージ
されたベクターを提供するためにトランス相補物によって「レスキュー」される
。トランス相補物のこの形態を、トランスで特定の遺伝子治療ベクターから欠失
している機能を供給するウイルスもしくはベクターとのパッケージング細胞の同
時感染によって、またはパッケージング細胞のゲノム中に組み込まれたウイルス
成分を有する細胞株(例えば、293細胞)を使用することによって、提供する
。例えば、HIVまたはマウスのレトロウイルスプロウイルス配列(これは、核
酸のパッケージング部位を欠失している)で形質導入された細胞は、レトロウイ
ルスのトランス活性成分を産生するが、産生されたキャプシド中にレトロウイル
スの核酸を特異的に取りこむことはせず、従って、わずかな生存しているウイル
スを生じるかまたは全く生じない。
If a viral vector is used, packaging cells are generally used to prepare virions used to transduce target cells. In these vectors, the transactive gene is inactivated and "rescued" by the transcomplement to provide a packaged vector. This form of the trans-complement may be transferred by co-infection of the packaging cell with a virus or vector that supplies a function missing from a particular gene therapy vector in trans, or a virus integrated into the genome of the packaging cell Provided by using a cell line having the components (eg, 293 cells). For example, cells transduced with an HIV or mouse retroviral proviral sequence, which lacks a nucleic acid packaging site, produce the transactive component of the retrovirus, but the capsid produced It does not specifically incorporate retroviral nucleic acids therein, and thus produces little or no surviving virus.

【0101】 これらの形質導入された「パッケージング」細胞を、続いて、レトロウイルス
トランス活性機能についてのコード領域を欠失しているが、パッケージングシグ
ナルを含むベクター核酸で形質導入する場合は、ベクター核酸は、感染性のビリ
オン中にパッケージングされる。MoMLVに基づくベクターについて有用であ
る多数のパッケージング細胞株(例えば、PA317(ATCC CRL 90
78)、これは、MoMLVコアおよびエンベロープタンパク質を発現する(M
illerら、J.Virol.65:2220−2224(1991)を参照
のこと))が当該分野で公知である。Carrolら(1994)Journa
l of Virology 68(9):6047−6051は、HIVウイ
ルスについてのパッケージング細胞株の構築を記載する。不完全なHIV分子ク
ローンの相互相補物は、例えば、Loriら、(1992)Journal o
f Virology 66(9)5553−5560に記載されている。
If these transduced “packaging” cells are subsequently transduced with a vector nucleic acid lacking the coding region for retroviral transactivation function but containing a packaging signal, Vector nucleic acids are packaged in infectious virions. Numerous packaging cell lines that are useful for MoMLV-based vectors, such as PA317 (ATCC CRL 90
78), which expresses MoMLV core and envelope proteins (M
Iller et al. Virol. 65: 2220-2224 (1991))) are known in the art. Carroll et al. (1994) Journa.
l of Virology 68 (9): 6047-6051 describes the construction of a packaging cell line for the HIV virus. Mutual complements of incomplete HIV molecular clones are described, for example, in Lori et al., (1992) Journal.
f Virology 66 (9) 5553-5560.

【0102】 ベクターの複製に必要であるトランス相補物によっては提供されないウイルス
の複製の機能が、ベクター中に存在する。HIVにおいては、これは代表的には
、以下を含む:例えば、TAR配列(HIVのパッケージングに必要な配列)、
RRE配列(gagのp17遺伝子の不安定性エレメントが含まれる場合)、お
よびポリプリントラクトをコードする配列。これらの機能を含むHIV配列は、
効率的なパッケージングの原因である5’長末端反復(LTR)および5’LT
Rの下流の配列の一部(すなわち、主要なスプライシングドナー部位(「MSD
」)まで)、ならびに3’LTR上流のおよびポリプリントラクトから、3’L
TRのU3R節までを含む。パッケージング部位(psi部位またはΨ部位)は
、リーダー配列中のMSD部位およびgag開始コドン(AUG)の間に主に、
5’LTRに隣接して部分的に配置される。Garzino−Demoら(19
95)Hum.Gene Ther.6(2):177−184を参照のこと。
HIVゲノムの構造的エレメントの一般的な記載については、Holmesら、
PCT/EP92/02787を参照のこと。
There is a viral replication function present in the vector that is not provided by the trans-complement required for the replication of the vector. In HIV, this typically includes: TAR sequences (sequences required for HIV packaging),
RRE sequence (if the instability element of gag p17 gene is included), and sequence encoding polyprint lacto. HIV sequences containing these functions are:
5 'long terminal repeat (LTR) and 5' LT responsible for efficient packaging
A portion of the sequence downstream of R (ie, the major splicing donor site (“MSD
))) And from the 3 ′ LTR upstream and from the polyprint lacto 3 ′ L
Includes up to U3R section of TR. The packaging site (psi or Ψ site) is mainly located between the MSD site and the gag start codon (AUG) in the leader sequence.
Partially located adjacent to the 5 'LTR. Garzino-Demo et al. (19
95) Hum. Gene Ther. 6 (2): 177-184.
For a general description of the structural elements of the HIV genome, see Holmes et al.,
See PCT / EP92 / 02787.

【0103】 別の一般的なベクターは、アデノウイルスに基づく。代表的には、アデノウイ
ルスのITRを含むベクター(Gingerasら(1982)J.Biol.
Chem.257:13475−13491)は、例えば、293細胞(これは
、ベクターのパッケージングのために必要な多くの成分を提供する)中にパッケ
ージされる。
[0103] Another common vector is based on adenovirus. Typically, a vector containing the adenovirus ITR (Gingeras et al. (1982) J. Biol.
Chem. 257: 13475-13491) are packaged, for example, in 293 cells, which provide many of the components needed for vector packaging.

【0104】 アデノ随伴ウイルス(AAV)は、増殖性の感染を達成するためにアデノウイ
ルスまたはヘルペスウイルスのようなヘルパーウイルスを利用する。ヘルパーウ
イルスの機能に非存在下では、AAVは、宿主細胞のゲノム中に(部位特異的に
)組込むが、組み込まれたAAVゲノムは、病原性の効果を有さない。組込み工
程は、AAVゲノムが宿主が適切な環境の条件(例えば、溶解性のヘルパーウイ
ルス)(その上では、宿主は溶解生活環に再度入る)に曝されるまで、遺伝的に
完全なままであることを可能にする。Samulski(1993)Curre
nt Opinion in Genetic and Developmen
t 3:74−80およびその中で引用されている参考文献は、AAVの生活環
の概要を提供する。AAVおよびアデノウイルス、またはヘルペスのヘルパー機
能についての一般的な概要については、BernsおよびBohensky(1
987)Advanced in Virus Research,Acade
mic Press.,32:243−306を参照のこと。AAVのゲノムは
、Laughlinら(1983)Gene,23:65−73に記載されてい
る。AAVの発現は、Beatonら(1989)J.Virol.,63:4
450−4454に記載されている。一般的には、全てのパルボウイルス(B1
9およおびAAVを含む)についてのパッケージング部位は、ウイルスのITR
中に位置する。組換えAAVベクター(rAAVベクター)は、広範な哺乳動物
細胞に外来核酸を送達し(HermonatおよびMuzycka(1984)
Proc.Natl.Acad.Sci.USA 81:6466−6470;
Tratschinら(1985)Mol Cell Biol 5:3251
−3260)、宿主の染色体中に組込み(McLaughlinら(1988)
J.Virol.62:1963−1973)、そして細胞および動物モデル中
でトランスジーンの安定な発現を示す(Flotteら(1993)Proc.
Natl.Acad.Sci.USA 90:10613−10617)。rA
AVベクターは、分裂していない細胞を感染させることができる(Podsak
offら(1994)J.Virol.68:5656−66;Flotteら
(1994)Am.J.Respir.Cell Mol.Biol.11:5
17−521)。rAAVベクターのさらなる利点として、内因性の強力なプロ
モーターの欠失が挙げられ、これにより、下流の細胞性の配列、ベクターの裸の
正二十面体キャプシド構造(これは、ベクターを安定にし、そして一般的な研究
室技術によって濃縮することを容易にする)の可能性のある活性化を回避する。
Adeno-associated virus (AAV) utilizes a helper virus, such as an adenovirus or a herpes virus, to achieve a productive infection. In the absence of helper virus function, AAV integrates (site-specifically) into the genome of the host cell, but the integrated AAV genome has no pathogenic effect. The integration step is such that the AAV genome remains genetically intact until the host is exposed to appropriate environmental conditions (eg, a lytic helper virus), where the host reenters the lytic life cycle. Make it possible. Samulski (1993) Curre
nt Opinion in Genetic and Developmentmen
t3: 74-80 and references cited therein provide an overview of the life cycle of AAV. For a general overview of AAV and adenovirus, or herpes helper functions, see Berns and Bohensky (1
987) Advanced in Virus Research, Acade
mic Press. , 32: 243-306. The genome of AAV is described in Laughlin et al. (1983) Gene, 23: 65-73. AAV expression is described in Beaton et al. Virol. , 63: 4
450-4454. Generally, all parvoviruses (B1
9 and AAV), including the ITRs of the virus.
Located inside. Recombinant AAV vectors (rAAV vectors) deliver foreign nucleic acids to a wide range of mammalian cells (Hermonat and Muzykka (1984)).
Proc. Natl. Acad. Sci. USA 81: 6466-6470;
Tratschin et al. (1985) Mol Cell Biol 5: 3251.
-3260), integrated into the chromosome of the host (McLaughlin et al. (1988)
J. Virol. 62: 1963-1973) and shows stable expression of the transgene in cell and animal models (Flotte et al. (1993) Proc.
Natl. Acad. Sci. ScL USA 90: 10613-10617). rA
AV vectors can infect non-dividing cells (Podsak)
(1994) J. Off. Virol. 68: 5656-66; Flotte et al. (1994) Am. J. Respir. Cell Mol. Biol. 11: 5
17-521). Additional advantages of rAAV vectors include the deletion of an endogenous strong promoter, which allows downstream cellular sequences, the naked icosahedral capsid structure of the vector (which stabilizes the vector, and Avoids possible activation (which facilitates enrichment by common laboratory techniques).

【0105】 以前から存在するベクターパッケージング戦略に伴う1つの問題は、パッケー
ジングされるベクターがトランスでパッケージング機能を提供する核酸と組換え
られ得、これによって複製コンピテントウイルスを生じることである。これは、
ベクターが治療的な適用(例えば、遺伝子治療)のために産生される場合、およ
びインビトロでのコードされる成分の産生の間の両方の問題であり得る。本発明
は、トランス活性成分をコードする核酸とパッケージング部位をコードするベク
ター核酸との間での組換えを減少させるかまたは排除する方法を提供する。
One problem with pre-existing vector packaging strategies is that the vector to be packaged can recombine in trans with a nucleic acid that provides the packaging function, thereby producing a replication competent virus. . this is,
It can be a problem both when the vector is produced for therapeutic applications (eg, gene therapy) and during the production of the encoded component in vitro. The present invention provides a method for reducing or eliminating recombination between a nucleic acid encoding a transactive component and a vector nucleic acid encoding a packaging site.

【0106】 詳細には、ベクターの核酸のサブ配列(これは、トランスで提供される改変さ
れたかまたは欠失させられたエレメントに隣接する)を、野生型の配列に対する
ハイブリダイゼーションを排除するようにコドンを改変する。これらの配列がハ
イブリダイズしないので、これらは、トランス活性成分を産生する核酸と組換え
られ得ない。このアプローチの1つのさらなる利点は、ベクターもまた、生存し
ているウイルスと組換えし得ない(例えば、ベクターエレメントをパッケージす
るウイルスで感染させられたヒトの体において)ことである。上記のように、2
つの型の遺伝子治療ベクターは、レトロウイルス(これらは、例えばHIV−1
によってパッケージされ得る)およびアデノウイルス(これらは、アデノウイル
スによってパッケージされ得る)に基づくベクターである。
In particular, the nucleic acid subsequences of the vector, which flank the modified or deleted elements provided in trans, are designed to eliminate hybridization to wild-type sequences. Modify codons. Since these sequences do not hybridize, they cannot recombine with the nucleic acid producing the transactive component. One further advantage of this approach is that the vector also cannot recombine with the live virus (eg, in a human body infected with the virus that packages the vector elements). As mentioned above, 2
Two types of gene therapy vectors are retroviruses (these are, for example, HIV-1
And vectors based on adenoviruses, which can be packaged by adenoviruses.

【0107】 あるいは、トランス活性成分をコードする核酸を、それらが野生型の配列にハ
イブリダイズしないように、コドンを改変し得る。これはまた、野生型の配列を
有するベクターとの組換えを妨げ、それによって複製コンピテントウイルスの組
換えおよび形成を妨げる。
Alternatively, the codons of the nucleic acids encoding the transactive components can be modified such that they do not hybridize to the wild-type sequence. This also prevents recombination with the vector having the wild-type sequence, thereby preventing the replication and formation of replication competent virus.

【0108】 コドンの改変後、ベクターまたはトランス活性核酸を、前出に記載されている
ようにシャッフルし得、そして核酸をパッケージングするかまたは適切な場合に
はパッケージングされる能力についてスクリーニングされ得る。
After modification of the codons, the vector or transactive nucleic acid can be shuffled as described above, and the nucleic acid can be packaged or screened, if appropriate, for its ability to be packaged. .

【0109】 ウイルス配列のコドンの改変が、さらなる使用を有することも同様に理解され
る。ウイルス配列のコドン変更は、例えば、調節配列の改変、mRNAの二次構
造における変更、稀なコドン使用に起因する不十分な翻訳などに起因して、ウイ
ルスの弱毒化を生じ得る。このような「コドン弱毒化された」ウイルスは、既存
の弱毒化されたウイルス(これは、代表的には、ウイルスについての正常な宿主
型以外の細胞中の連続的継代によって生成される)を上回る有意な利点を有する
。詳細には、コドン弱毒化されたウイルスは、タンパク質の野生型のセットをコ
ードし得、それによってそれらを抗体を生成するため、またはワクチンとしての
使用のための免疫原性の組成物として理想的なものとする。ウイルスタンパク質
はまた、種々の診断アッセイにおいても使用され得る。例えば、現在のHIV感
染の標準的な診断試験は、ウイルスタンパク質を用いて探索することによる、血
液中の抗HIV抗体の存在についての試験を使用する。
It is likewise understood that codon modifications of the viral sequence have additional uses. Codon changes in viral sequences can result in viral attenuation, for example, due to alterations in regulatory sequences, changes in mRNA secondary structure, inadequate translation due to rare codon usage, and the like. Such "codon attenuated" viruses are pre-existing attenuated viruses, which are typically produced by successive passages in cells other than the normal host type for the virus. Have significant advantages over In particular, codon-attenuated viruses can encode a wild-type set of proteins, making them ideal as immunogenic compositions for producing antibodies or for use as vaccines It is assumed that Viral proteins can also be used in various diagnostic assays. For example, current standard diagnostic tests for HIV infection use tests for the presence of anti-HIV antibodies in the blood by probing with viral proteins.

【0110】 (実施例:天然の遺伝子配列との減少した組換えを用いて機能的な変異体を進
化させるための、コドン使用ライブラリー−−アデノウイルス) アデノウイルスは、例えば、遺伝子治療に使用される一般的なベクターである
。このウイルスは、代表的には、それを複製欠損にするように改変される。これ
は、例えば、E1およびE4遺伝子を欠失させることによって達成され得る。E
1およびE4の機能は、E1およびE4を欠失させられたベクターが、遍在する
ヒトの胚性の腎臓細胞株293(これは、それらのゲノム中に取りこまれた特徴
付けられていない、トランスで欠失している機能を供給するアデノウイルスフラ
グメントを有する)において増殖する場合には、トランス相補物によって供給さ
れ得る。複製欠損アデノウイルスベクターは、低いが、しかし臨床的には有意な
頻度で、組換え、それによってベクター調製物の複製コンピテントアデノウイル
スの混入を生じる。アデノウイルスが健康上に有害な効果を有するので、このこ
とは、アデノウイルスに基づく遺伝子治療ベクターの適用について有意な問題で
ある。
Examples: Codon usage libraries for evolving functional variants using reduced recombination with native gene sequences--adenoviruses Adenoviruses are used, for example, in gene therapy. This is a common vector. The virus is typically modified to render it replication deficient. This can be achieved, for example, by deleting the E1 and E4 genes. E
The function of E1 and E4 is that the vector deleted for E1 and E4 is a ubiquitous human embryonic kidney cell line 293 (which has been uncharacterized incorporated into their genome, (With the adenovirus fragment providing the function missing in trans) can be supplied by the trans complement. Replication-deficient adenovirus vectors, although at a low, but clinically significant frequency, recombine, thereby resulting in replication competent adenovirus contamination of the vector preparation. This is a significant problem for the application of adenovirus-based gene therapy vectors because adenovirus has deleterious effects on health.

【0111】 本発明においては、アデノウイルスE1およびE4遺伝子に隣接する数百塩基
から数キロ塩基の配列を含むコドン使用ライブラリーを作製する。このライブラ
リーは、天然のアデノウイルスのコンセンサス配列とは高い程度の多様性だが、
同時に、大きな程度のコドンの縮重を組み込み、それによって検索される配列の
多様性の大きな空間を可能にするように設計する。設計の原理は、同じまたは類
似のタンパク質配列をコードする変異体を得ることであるが、野生型のE1およ
びE4配列に対する多くの不適合が、293ゲノム中に見出される。これらの不
適合は、トランス相補遺伝子との所望されない組換えの頻度を強力に低下させる
。結果として、操作されたアデノウイルスベクターまたはアデノウイルスヘルパ
ーベクター(これは、トランスでパッケージング配列(アデノウイルスまたはア
デノ随伴ウイルスのITR)を含むアデノウイルス配列をパッケージする)は、
組換えの低下したレベルを有する。このことは、コンピテントアデノウイルスの
産生の低い速度を提供し、これによってこのようなベクターの培養および産生を
より安全にする。
In the present invention, a codon usage library containing a sequence of several hundred bases to several kilobases adjacent to the adenovirus E1 and E4 genes is prepared. This library has a high degree of diversity from the native adenovirus consensus sequence,
At the same time, they are designed to incorporate a large degree of codon degeneracy, thereby allowing a large space of sequence diversity to be searched. The principle of the design is to obtain variants encoding the same or similar protein sequence, but many mismatches to the wild-type E1 and E4 sequences are found in the 293 genome. These mismatches strongly reduce the frequency of unwanted recombination with the transcomplementing gene. As a result, the engineered adenovirus vector or adenovirus helper vector, which packages the adenovirus sequence in trans, including the packaging sequence (the adenovirus or adeno-associated virus ITR),
Has a reduced level of recombination. This provides a lower rate of production of competent adenovirus, thereby making culture and production of such vectors more secure.

【0112】 (ワクチンに対する一般的なアプローチとしての大量のコドン使用の変更によ
って作製した、進化損傷したウイルス−−HIV) HIV−1およびHIV2は、遺伝的に関連し、抗原的に交差反応性であり、
そして共通の細胞性レセプター(CD4)を共有する。HIV感染の概要につい
ては、RosenburgおよびFauci(1993)Fundamenta
l Immunology、第3版、Paul(編)Raven Press,
Ltd.,New York(RosenburgおよびFauci 1)およ
びその中で引用されている参考文献を参照のこと。HIV−1感染は、世界的に
流行性であり、それによって、後天性免疫不全症候群(AIDS)と一般的に呼
ばれる種々の免疫系の不全に関連する現象を生じる。HIV2型(HIV−2)
は、健常な固体およびAIDS様の病気を有する患者の両方から単離されている
(Andreassonら、(1993)Aids 7.989−93;Cla
velら(1986)Nature,324、691−695;Gaoら(19
92)Nature 358、495−9;Harrisonら(1991)J
ournal of Acquired Immune Deficiency
Syndromes 4、1155−60;Kankiら(1992)Ame
rican Journal of Epidemiology 136,89
5−907;Kankiら(1991)Aids Clinical Revi
ew 1991、17−38;Romieuら(1990)Journal o
f Acquired Immune Deficiency Syndrom
es 3,220−30;Nauclerら(1993)Internatio
nal Journal of STD and Aids 4、217−21
;Nauclerら、(1991)Aids 5、301−4)。HIV−2
AIDSの症例は西アフリカから主に同定されているが、散発性のHIV−2に
関連するAIDSの症例は、米国(O’Brienら(1991)Aids 5
,85−8)および他の場所においてもまた報告されている。HIV−2はおそ
らく、HIV−1と類似の伝達の経路を追って時間とともに他の地域においても
風土病となる(Harrisonら(1991)Journal of Acq
uired Immune Deficiency Syndromes 4,
1155−60;Kankiら(1992)American Journal
of Epidemiology 136、895−907;Romieuら
(1990)Journal of Acquired Immune Def
iciency Syndromes 3,220−30)。疫学的な研究は、
HIV−2がHIV−1よりも低い浸透度を有するヒトの疾患を生じ、そしてH
IV−1については10年間未満であるのに対して、相当により長い臨床的な潜
伏期間(少なくとも、25年間、およびおそらくそれより長く)を示すことを示
唆する;Kankiら(1991)Aids Clinical Review
1991、17−38;Romieuら(1990)Journal of
Acquired Immune Deficiency Syndromes
3,220−30、およびTraversら(1995)Science 2
68:1612−1615を参照のこと。
(Evolutionally Impaired Viruses Created by Altering Large Codon Usage as a General Approach to Vaccines--HIV) HIV-1 and HIV2 are genetically related and antigenically cross-reactive. Yes,
They share a common cellular receptor (CD4). For an overview of HIV infection, see Rosenberg and Fauci (1993) Fundamenta.
l Immunology, 3rd edition, Paul (eds.) Raven Press,
Ltd. See, New York (Rosenburg and Fauci 1) and the references cited therein. HIV-1 infection is epidemic worldwide, thereby causing a variety of immune system deficiencies related to what is commonly referred to as acquired immunodeficiency syndrome (AIDS). HIV type 2 (HIV-2)
Has been isolated from both healthy individuals and patients with AIDS-like illness (Andreasson et al., (1993) Aids 7.989-93; Cla).
vel et al. (1986) Nature, 324, 691-695; Gao et al.
92) Nature 358, 495-9; Harrison et al. (1991) J.
own of Acquired Immunity Deficiency
Syndromes 4, 1155-60; Kanki et al. (1992) Ame.
rican Journal of Epidemiology 136,89
5-907; Kanki et al. (1991) Aids Clinical Revi.
ew 1991, 17-38; Romeieu et al. (1990) Journal o.
f Acquired Immunity Definition Syndrom
es 3,220-30; Naucler et al. (1993) International.
nal Journal of STD and Aids 4, 217-21
Naucler et al., (1991) Aids 5, 301-4). HIV-2
Although AIDS cases have been identified primarily from West Africa, sporadic HIV-2 related cases of AIDS have been identified in the United States (O'Brien et al. (1991) Aids 5).
85-8) and elsewhere. HIV-2 probably becomes endemic in other areas over time, following a pathway of transmission similar to HIV-1 (Harrison et al. (1991) Journal of Acq.
uired Immunity Syndromes 4,
1155-60; Kanki et al. (1992) American Journal.
of Epidemiology 136, 895-907; Romieu et al. (1990) Journal of Acquired Immun Def.
ciency syndromes 3,220-30). Epidemiological studies
HIV-2 causes human disease with lower penetrance than HIV-1, and
IV-1 suggests a significantly longer clinical incubation period (at least 25 years, and possibly longer) compared to less than 10 years; Kanki et al. (1991) Aids Clinical Review.
1991, 17-38; Romieu et al. (1990) Journal of
Acquired Immunity Syndromes
3,220-30, and Travers et al. (1995) Science 2
68: 1612-1615.

【0113】 HIVウイルスの集団が迅速に点変異して免疫応答を回避する能力は、ワクチ
ンの設計についての特定のチャレンジを提起する。免疫系は段階的かつ同時進化
的な様式でウイルスに対して応答してきたが、本発明は、より有効な免疫応答を
刺激するような新規のワクチンを産生するように大規模なより早い進化を提供す
る一般的なアプローチを提供する。
The ability of the HIV virus population to rapidly point mutate and evade the immune response poses a particular challenge for vaccine design. Although the immune system has responded to the virus in a step-wise and co-evolutionary manner, the present invention provides large, faster evolutions to produce new vaccines that stimulate more effective immune responses. Provide a general approach to offer.

【0114】 例えば、HIV感染のインキュベーション期間(これは、数年間続く)の間に
、低い力価のHIVは、免疫系による効率的なウイルスのクリアランスと組み合
わせての高いHIV複製速度から生じ得る。これらの選択的な力に応答して、免
疫系のB細胞応答およびT細胞応答による認識および中和を減少させるウイルス
の変異が、選択される。Lukashovら(1995)J.Virol.69
:6911−6916を参照のこと。長期間のインキュベーション時間の間には
、これらの変異が蓄積し、そして最終的には、免疫系防除を圧倒する。Hoら(
1995)Natureを参照のこと。
For example, during the HIV infection incubation period (which lasts for several years), low titers of HIV may result from high HIV replication rates in combination with efficient virus clearance by the immune system. In response to these selective forces, viral mutations that reduce the recognition and neutralization of the immune system by B and T cell responses are selected. Lukashov et al. (1995) J. Am. Virol. 69
: 6911-6916. During prolonged incubation times, these mutations accumulate and ultimately overwhelm immune system control. Ho et al. (
1995) Nature.

【0115】 生の弱毒化ワクチン(代表的には、動物細胞中のヒトのウイルスの増殖の延長
によって産生される)は、いくつかの疾患(おたふく風邪、風疹、および麻疹を
含む)についてのワクチンとして有用であることが証明されている。弱毒化は、
動物細胞中での増殖への適応の経過の間の、ウイルスのゲノム全体を通じた多く
の変異のゆっくりとした蓄積を含む。ヒトに対してワクチン接種するために使用
される場合、弱毒化されたウイルスは、弱くしか増殖せず、そしてウイルスが回
避し得ない複雑な免疫応答を誘発する。弱毒化されたウイルス中での変異は、原
理的には、それが培養物中で増殖するために受けるのと同じ段階的な様式で復帰
し得る。
Live attenuated vaccines (typically produced by prolonging the growth of human viruses in animal cells) are vaccines for several diseases, including mumps, rubella, and measles Has proven to be useful. Attenuation is
It involves the slow accumulation of many mutations throughout the genome of the virus during the course of adaptation to growth in animal cells. When used to vaccinate humans, the attenuated virus grows only weakly and elicits a complex immune response that the virus cannot avoid. Mutations in the attenuated virus can in principle revert in the same stepwise manner as it undergoes to grow in culture.

【0116】 復帰の危険性は、HIV−1のような高い変異速度を有するウイルスにおいて
最も高く、これは、ワクチンの開発のための現在の技術のもとでこの戦略を危険
にさせている。しかし、HIV−1に対する防御性の効果が、関連するHIV−
2ウイルス(これは、HIV−1よりもはるかに病原性が少ない)での感染後に
観察されることが、注目に値する。従って、HIVに対する防御的効果は、生の
ワクチンを用いて達成され得る。
The risk of reversion is highest in viruses with a high mutation rate, such as HIV-1, which makes this strategy dangerous under current technology for vaccine development. However, the protective effect against HIV-1 was not
It is noteworthy that it is observed after infection with two viruses, which is much less pathogenic than HIV-1. Thus, a protective effect against HIV can be achieved with live vaccines.

【0117】 復帰の危険性を減少させるためには、多数の変異が、ウイルス中に蓄積される
ことを必要とする。しかし、あまりに多くの変異が存在する場合は、事実上、免
疫系は、それに対する防御的効果が考えられるウイルスではなく、弱毒化された
ウイルスを認識する。
[0117] To reduce the risk of reversion, a number of mutations need to be accumulated in the virus. However, if too many mutations are present, the immune system will in effect recognize an attenuated virus, rather than a virus with a protective effect against it.

【0118】 本明細書中で提供される場合は、多数のサイレントな置換を含む免疫原性組成
物(例えば、ワクチン)が、作製される。既存の弱毒化されたワクチンとは対照
的に、このようなウイルスは、天然のタンパク質配列を有し、そして本質的には
、対応する野生型のウイルスと同じ免疫応答を誘発する(代表的には、1つまた
はいくつかのさらなる不能な変異もまた、取りこまれ得る)。コドン変更は、2
つの効果を生じ、この両方ともがワクチンの能力を増大させる。
As provided herein, immunogenic compositions (eg, vaccines) containing a number of silent substitutions are made. In contrast to existing attenuated vaccines, such viruses have a native protein sequence and elicit essentially the same immune response as the corresponding wild-type virus (typically Can also incorporate one or several additional impossible mutations). Codon change is 2
Have two effects, both of which increase the capacity of the vaccine.

【0119】 第1に、標準的な弱毒化されたウイルスと同様に、コドン変更されたウイルス
の増殖は、翻訳、調節配列、mRNAの折り畳み、パッケージングなどに対する
コドン変更の影響に起因して、弱毒化される。例えば、HIV−1エンベロープ
の発現の調節が、コドンの使用頻度の結果として観察されている。Haasら(
1989)Current Biology 6(3):315−324を参照
のこと。
First, as with standard attenuated viruses, the growth of codon-altered viruses is due to the effects of codon changes on translation, regulatory sequences, mRNA folding, packaging, etc. Be attenuated. For example, regulation of HIV-1 envelope expression has been observed as a result of codon usage. Haas et al. (
1989) Current Biology 6 (3): 315-324.

【0120】 第2に、コドン変更は、ウイルスの進化の欠陥を生じる。上記で議論されたよ
うに、コドンの改変は、ウイルスの変異回避スペクトルを変更し、それによって
特定のコドンについての進化的な選択を混乱させる。
Second, codon changes create defects in the evolution of the virus. As discussed above, codon modifications alter the mutation avoidance spectrum of the virus, thereby disrupting the evolutionary choice for a particular codon.

【0121】 6個のコドンのアミノ酸は、コドン変更についての最適な標的である。セリン
、アルギニン、およびロイシンは、それぞれ、4個のコドン、および無関係な群
における2個のコドンの1群を有する。図12を参照のこと。AGYからTCX
へとすべてのセリンのコドンに切り換えること、およびその逆は、変更されてい
ないアミノ酸配列を有するタンパク質を生じる。図13もまた参照のこと。しか
し、これらのコドンの群は、それらが点変異の際に生じるアミノ酸のスペクトル
において有意に異なる。セリンの1つのコドン(TCA)のすべての可能性のあ
る点変異の78%が、セリンについてのAGTコドンについて得られる点変異と
比較して、異なるアミノ酸を生じる。図13を参照のこと。数百のコドン変更を
有するウイルスは、統計的には、野生型ウイルスと比較して、全体的に異なる変
異スペクトル(すなわち、「大群(cloud)」)に接近し得、そして非常に
多様な変異空間である。進化欠損ウイルスを産生するための全体的な戦略は、図
14、15、および17にさらに示される。図16、パネルA〜Cは、ser、
arg、およびleuの異なるコドンの単一の変異の結果を示す。
[0121] Six codon amino acids are optimal targets for codon changes. Serine, arginine, and leucine each have four codons and one group of two codons in an unrelated group. See FIG. AGY to TCX
Switching to all serine codons and vice versa results in a protein with an unaltered amino acid sequence. See also FIG. However, these groups of codons differ significantly in the spectrum of amino acids that occur upon point mutation. 78% of all possible point mutations at one codon for serine (TCA) give rise to different amino acids as compared to the point mutation obtained for the AGT codon for serine. See FIG. Viruses with hundreds of codon changes can statistically access a totally different mutation spectrum (ie, "cloud") compared to the wild-type virus, and Space. The overall strategy for producing an evolutionarily defective virus is further illustrated in FIGS. 14, 15, and 17. FIG. 16, panels AC show ser,
The results of a single mutation at different codons for arg and leu are shown.

【0122】 点変異は、宿主の免疫系に有利な立場でとどまるために、HIV−1のような
ウイルスについて重要である。ウイルスの回避に必要とされるアミノ酸の変異は
、おそらく、ランダムではない。野生型のコドン使用頻度は、最適な免疫系の回
避を可能にするように進化してきた。野生型のコドン使用頻度は、おそらく、コ
ードされるタンパク質(単数または複数)に有害な影響を与えることなく、宿主
の免疫系を回避する変更を提示する変異に好ましい。複雑ではあるが、宿主シス
テムに応答する天然のウイルスのアミノ酸配列変更のこの天然のパターンは、ラ
ンダムではなく、そしてあまり予想可能ではない。Seiller−Moise
iwitschら(1994)Annu.Rev.Genet.28:559−
596をもまた参照のこと。
[0122] Point mutations are important for viruses such as HIV-1 to stay in favor of the host immune system. The amino acid mutations required for virus evasion are probably not random. Wild-type codon usage has evolved to allow for optimal immune system evasion. Wild-type codon usage is probably preferred for mutations that present changes that evade the host immune system without adversely affecting the encoded protein (s). Although complex, this natural pattern of amino acid sequence changes in the natural virus in response to the host system is not random and is less predictable. Seeiler-Moise
iwitsch et al. (1994) Annu. Rev .. Genet. 28: 559-
See also 596.

【0123】 HIV−1の875aaのエンベロープポリタンパク質(例えば、MN株)中
のser、arg、およびleuについての全てのコドン変更することは、18
7個のコドン(22%)に影響を与えて、561個の変異を生じる。例えば、図
18、パネルA〜Dを参照のこと。全てのHIVタンパク質を変更した場合は、
変異の数は、3倍以上多い。このようなコドンを改変されたウイルスの構築は、
およそ75%の効率で、一工程で40マーのオリゴから平均サイズのプラスミド
の組立てを可能とする、長いDNA配列の合成における最近の進歩によって単純
化される。Stemmer(1994)Nature 370 389−391
を参照のこと。HIV Envの合成についての1つの適用におけるオリゴのリ
ストについては、図19もまた参照のこと。エンベロープ遺伝子の合成は十分で
あるが、一方、オリゴからの全HIVゲノムの合成が、この方法によって行われ
得る。
All codon alterations for ser, arg, and leu in the 875 aa envelope polyprotein of HIV-1 (eg, strain MN) are 18
Affects 7 codons (22%), resulting in 561 mutations. See, for example, FIG. 18, panels AD. If you change all HIV proteins,
The number of mutations is more than three times greater. Construction of such a codon-modified virus,
This is simplified by recent advances in the synthesis of long DNA sequences, which allow the assembly of average-sized plasmids from 40-mer oligos in one step, with approximately 75% efficiency. Stemmer (1994) Nature 370 389-391.
checking ... See also FIG. 19 for a list of oligos in one application for the synthesis of HIV Env. While the synthesis of the envelope gene is sufficient, the synthesis of the whole HIV genome from the oligo can be performed by this method.

【0124】 実際には、弱毒化および進化欠損の好ましい平衡は、例えば、野生型およびコ
ドン変更された配列のDNAのシャッフリング(例えば、Stemmerら(1
995)Gene 164:49−53)、続く、多くのコドン変更にもかかわ
らず適度な増殖を維持している、得られたウイルスのライブラリーの選択によっ
て得られる。
In practice, a favorable equilibrium between attenuation and evolutionary deficiencies can be achieved, for example, by shuffling wild-type and codon-altered sequence DNA (eg, Stemmer et al. (1)
995) Gene 164: 49-53), followed by selection of the resulting library of viruses that maintain moderate growth despite many codon changes.

【0125】 このアプローチによって得られ得る弱毒化は、ほとんどのウイルスについての
ワクチンを得るために十分であり得るが、HIV−1については、ウイルスの高
い変異速度に起因して進化欠損はより重要である。生のワクチンは、それらが野
生型ウイルスの感染を予防するために十分に複雑かつ強力な免疫応答を誘発する
場合にのみ、使用される。生のウイルスワクチンは、代表的には、多数のエピト
ープに対するT細胞およびB細胞応答を外変異(out−mutate)するこ
とが困難であるので、単一のタンパク質ワクチンよりも防御的である。生のウイ
ルスワクチンの弱い増殖は、より大きな抗原性の用量を生じ,そして点変異は、
免疫応答の複雑さを増大させる。ワクチンの能力を評価するためには、ワクチン
の能力は、マカーク(M.nemestrina)またはチンパンジー中で、A
IDSを生じることが公知であるSIV変異体を使用して評価される。例示的な
SIVの配列である、SIVsmmは、Gene Bank登録番号第x143
07において見出される。このウイルスは、HIV−2に密接に関連する。Hi
rsch(1989)Nature 339:389−392を参照のこと。一
般的には、HIV、SIV、および多くの他のウイルスの多くの完全な配列が、
周知の配列保存機関(GenBank、EMBL、DDBJ、およびNCBIを
含む)において見出される。十分に特徴付けられたHIVクローンとして、HI
V−1NL43、HIV−1SF2、HIV−1BRU、およびHIV−1MN
が挙げられる。HIVの遺伝的な多様性についての概論については、Silli
er−Moiseiwitschら(1994)Annu.Rev.Genet
.28:559−96およびその中で引用されている参考文献を参照のこと。
The attenuation that can be obtained by this approach may be sufficient to obtain vaccines for most viruses, but for HIV-1, evolutionary defects are more important due to the high mutation rate of the virus. is there. Live vaccines are used only if they elicit a complex and strong immune response sufficiently to prevent infection with the wild-type virus. Live virus vaccines are typically more protective than single protein vaccines because of the difficulty in out-mutating T and B cell responses to multiple epitopes. Weak growth of live virus vaccines results in larger antigenic doses, and point mutations
Increases the complexity of the immune response. To assess vaccine performance, vaccine performance was assessed in M. nemestrina or chimpanzees using A.
Evaluated using SIV variants known to produce IDS. An exemplary SIV sequence, SIVsmm, has Gene Bank accession number x143.
07. This virus is closely related to HIV-2. Hi
rsch (1989) Nature 339: 389-392. In general, the many complete sequences of HIV, SIV, and many other viruses are
It is found in well-known sequence repositories, including GenBank, EMBL, DDBJ, and NCBI. As a well characterized HIV clone, HI
V-1NL43, HIV-1SF2, HIV-1BRU, and HIV-1MN
Is mentioned. For an overview on the genetic diversity of HIV, see
er-Moiseiwitsch et al. (1994) Annu. Rev .. Genet
. 28: 559-96 and the references cited therein.

【0126】 いくつかのHIV−2単離物(HIV−2の3つの分子クローン(HIV−2 ROD 、HIV−2SBL-ISY、およびHIV−2UC1)を含む)もまた、マカーク(
M.mulattaおよびM.nemestrina)またはヒヒに感染するこ
とが報告されている(Franchiniら(1989)Proc.Natl.
Acad.Sci.U.S.A.86,2433−2437;Barnettら
(1993)Journal of Virology 67,1006−14
;Boeriら(1992)Journal of Virology 66、
4546−50;Castroら(1991)Virology 184,21
9−26;Franchiniら(1990)Journal of Viro
logy 64,4462−7;Putkonenら(1990)Aids 4
、783−9;Putkonenら(1991)Nature 352、436
−8)。小さい霊長類に感染し得るヒトの病原体として、HIV−2分子クロー
ンは、AIDSの病原体の研究のため、ならびにHIV−1およびHIV−2に
対する薬物およびワクチンの開発のための魅力的なモデルを提供する。
Several HIV-2 isolates (three molecular clones of HIV-2 (HIV-2 ROD , HIV-2SBL-ISYAnd HIV-2UC1)), But also Makaki (
M. mulatta and M.M. nemstrina) or baboons
(Franchini et al. (1989) Proc. Natl.
Acad. Sci. U. S. A. 86, 2433-2437; Barnett et al.
(1993) Journal of Virology 67, 1006-14.
Boeri et al. (1992) Journal of Virology 66;
4546-50; Castro et al. (1991) Virology 184,21.
9-26; Francini et al. (1990) Journal of Viro.
logic 64, 4462-7; Putkonen et al. (1990) Aids 4.
Putkonen et al. (1991) Nature 352, 436.
-8). HIV-2 molecular claw is a human pathogen that can infect small primates.
Has been developed for AIDS pathogen studies and for HIV-1 and HIV-2.
Provides an attractive model for drug and vaccine development.

【0127】 最近、HIV−2は、その長い無症状性の潜伏期間およびHIV−1による感
染に対して防御するその能力に起因して、より毒性のHIV−1に対する可能性
のあるワクチン候補として示唆された(Traversら(1995)Scie
nce 268:1612−1615、およびCohenら(1995)Sci
ence 268:1566による関連する注釈を参照のこと)。HIV−2に
感染した西アフリカの売春婦についてのTraversら(同上)による9年間
の研究においては、HIV−2による感染が、HIV−1による感染において7
0%の減少を引き起こすことが、決定された。従って、コドン変更されたHIV
−2ウイルスはまた、HIV−2およびHIV−1の両方に対して、生のワクチ
ンとして使用され得る。さらに、HIV−2の天然の病原性はHIV−1よりも
少ないので、これは、HIV−1に加えて、改変に好ましいウイルスである。
Recently, HIV-2 is a potential vaccine candidate against HIV-1, which is more toxic, due to its long asymptomatic latency and its ability to protect against infection by HIV-1. (Travers et al. (1995) Scie
268: 1621-2615, and Cohen et al. (1995) Sci.
ence 268: 1566). In a nine-year study by Travers et al. (Ibid.) Of HIV-2 infected prostitutes in West Africa, HIV-2 infection was 7% lower in HIV-1 infection.
It was determined to cause a 0% reduction. Thus, codon-modified HIV
-2 virus can also be used as a live vaccine against both HIV-2 and HIV-1. In addition, because HIV-2 is less pathogenic in nature than HIV-1, it is a preferred virus for modification in addition to HIV-1.

【0128】 (配列組換えのための形式) 本発明の方法は、組換え(「シャッフリング」)を行うこと、および個々の遺
伝子、全プラスミド、もしくはウイルス、多遺伝子クラスター、または全ゲノム
でさえ「進化させる」ためにスクリーニングあるいは選択を行うことを必然的に
伴う(Stemmer(1995)Bio/Technology 13:54
9−553)。組換えおよびスクリーニング/選択の反復サイクルは、目的の核
酸をさらに進化させるために行われ得る。このような技術は、ポリペプチドの操
作のための従来の方法によって必要とされる広範囲な分析および計算を必要とは
しない。シャッフリングによって、天然の対合様式(pair−wise)の組
換え事象(例えば、有性複製の間に生じるような)と対照的に、最少の選択サイ
クルの回数において多数の変異の組換えが可能となる。従って、本明細書中で記
載される配列組換え技術は、それらがこれらの任意または全てにおける変異の間
で組換えを提供する点で、特に利点を提供し、それによって、変異の種々の組み
合わせが所望の結果を及ぼし得る様式を探索する非常に早い方法を提供する。し
かし、いくつかの例においては、構造および/または機能の情報が入手可能であ
り、これは、配列の組換えには必要ではないが、技術の改変のための機会を提供
する。
Formats for Sequence Recombination The methods of the present invention provide for performing recombination (“shuffling”) and for individual genes, whole plasmids, or viruses, multigene clusters, or even whole genomes. It entails performing screening or selection to "evolve" (Stemmer (1995) Bio / Technology 13:54).
9-553). Repeat cycles of recombination and screening / selection can be performed to further evolve the nucleic acid of interest. Such techniques do not require the extensive analysis and calculations required by conventional methods for manipulating polypeptides. Shuffling allows for the recombination of a large number of mutations in a minimal number of selection cycles, as opposed to the natural pair-wise recombination event, such as occurs during sexual replication. Becomes Accordingly, the sequence recombination techniques described herein offer particular advantages in that they provide recombination between mutations in any or all of these, thereby permitting various combinations of mutations. Provides a very fast way to search for modalities that can produce the desired result. However, in some instances, structural and / or functional information is available, which is not required for sequence recombination, but provides an opportunity for technology modification.

【0129】 配列の組換えについての例示的な形式および例(例えば、「DNAシャッフリ
ング」「早い強制進化」、または「分子育種」と言われる)は、、本発明者らお
よび共同研究者らによって、以下の特許および特許出願に記載されている:米国
特許5,605,793号;1995年2月17日に出願された、PCT出願W
O95/22625号(出願番号第PCT/US95/02126号);199
5年4月18日に出願された、米国特許出願番号第08/425,684号;1
996年3月25日に出願された、米国特許出願番号第08/621,430号
;1996年4月18日に出願された、PCT出願WO97/20078号(出
願番号第PCT/US96/05480号);1997年3月20日に出願され
た、PCT出願WO97/35966号;1996年7月3日に出願された、米
国特許出願番号第08/675,502号;1996年9月27日に出願された
、米国特許出願番号第08/721,824号;1997年9月26日に出願さ
れた、PCT出願WO98/13487号;del Cardayreらによっ
て1998年7月15日に出願された、「Evolution of Whol
e Cells and Organisms by Recursive S
equence Recombination」代理人整理番号第018097
−020720US(PCT/US99/15972、1999年7月15日に
出願された);Stemmer、Science 270:1510(1995
);Stemmerら、Gene 164:49−53(1995);Stem
mer、Bio/Technology 13:549−553(1995);
Stemmer、Proc.Natl.Acad.Sci.U.S.A.91:
10747−10751(1994);Stemmer、Nature 370
:389−391(1994);Crameriら、Nature Medic
ine 2(1)1−3(1996);ならびにCrameriら、Natur
e Biotechnology 14:315−319(1996)。これら
のそれぞれが、全ての目的のためにその全体において参照として援用されている
Illustrative formats and examples of sequence recombination (eg, referred to as “DNA shuffling,” “early forced evolution,” or “molecular breeding”) are described by the present inventors and coworkers. Are described in the following patents and patent applications: US Pat. No. 5,605,793; PCT Application W filed on Feb. 17, 1995.
O95 / 22625 (Application No. PCT / US95 / 02126); 199
U.S. Patent Application Serial No. 08 / 425,684, filed April 18, 5; 1
US patent application Ser. No. 08 / 621,430, filed Mar. 25, 996; PCT application WO 97/20078, filed Apr. 18, 1996 (application no. PCT / US96 / 05480). PCT Application WO 97/35966, filed March 20, 1997; U.S. Patent Application Serial No. 08 / 675,502, filed July 3, 1996; September 27, 1996. No. 08 / 721,824, filed on Sep. 26, 1997, PCT Application WO 98/13487; filed on Jul. 15, 1998 by del Cardayre et al. Evolution of Whol
e Cells and Organisms by Recursive S
equipment Recombination ”Attorney Reference Number 018097
020720US (PCT / US99 / 15972, filed July 15, 1999); Stemmer, Science 270: 1510 (1995).
); Stemmer et al., Gene 164: 49-53 (1995);
mer, Bio / Technology 13: 549-553 (1995);
Stemmer, Proc. Natl. Acad. Sci. U. S. A. 91:
10747-10751 (1994); Stemmer, Nature 370.
: 389-391 (1994); Crameri et al., Nature Medic.
ine 2 (1) 1-3 (1996); and Crameri et al., Natur.
e Biotechnology 14: 315-319 (1996). Each of these is incorporated by reference in its entirety for all purposes.

【0130】 組換え手順は、互いに実質的な配列同一性を一般的に示す(例えば、少なくと
も約30%、50%、70%、80%、または90%もしくはそれ以上の配列同
一性)が、特定の位置で互いに異なる少なくとも2つの基質を用いて開始する。
例えば、少なくとも1つのコドン変更された核酸が、本明細書中の1つ以上のさ
らなる核酸(このさらなる核酸もまた、コドン変更された核酸であり得る)と組
換えられる。組換えられる核酸間の差異は、任意の型の変異(例えば、置換、挿
入、および欠失)であり得る。しばしば、種々のセグメントは、約5〜20の位
置で互いに異なる。出発物質と比較して増大した多様性を生成するための組換え
については、出発物質は、少なくとも2個のヌクレオチド位置で互いに異ならな
ければならない。すなわち、2個の基質のみが存在する場合は、それらは少なく
とも2つの異なる位置でなければならない。3個の基質が存在する場合は、例え
ば、1つの基質は、単一の位置で第2の基質とは異なり得、そして第2の基質は
、異なる単一の位置で第3の基質とは異なり得る。出発DNAセグメントは、互
いに天然の変異体(例えば、対立遺伝子変異体または種変異体)であり得る。よ
り代表的には、これらは、1つ以上のホモログ核酸配列に由来するコドン変更さ
れた核酸である。セグメントはまた、いくらかの程度の構造的および通常は機能
的相関性を示す非対立遺伝子に由来し得る(例えば、スーパーファミリー内の異
なるが相同である遺伝子に由来する、コドン変更された核酸)。出発DNAセグ
メントはまた、互いの誘導された変異体であり得る。例えば、1つのDNAセグ
メントは、他のDNAセグメントの誤りがちなPCR複製によって、または変異
促進性カセットの置換によって産生され得る。誘導された変異体はまた、変異原
性の株中のセグメントの1つ(または両方)を増殖することによって調製され得
る。これらの状況においては、厳密に言うと、第2のDNAセグメントは、単一
のセグメントではないが、関連するセグメントの大きなファミリーである。出発
物質を形成する異なるセグメントは、しばしば、同じ長さであるかまたは実質的
に同じ長さである。しかし、このことは、例えば、1つのセグメントが別のセグ
メントの部分配列であり得る場合には、必要ではない。セグメントは、より長い
分子(例えば、ベクター)の一部として存在し得るか、または単離された形態で
あり得る。
Recombination procedures generally exhibit substantial sequence identity to one another (eg, at least about 30%, 50%, 70%, 80%, or 90% or more sequence identity), Begin with at least two substrates that differ from each other at a particular location.
For example, at least one codon-altered nucleic acid is recombined with one or more additional nucleic acids herein, which may also be a codon-altered nucleic acid. The differences between the nucleic acids to be recombined can be any type of mutation, such as substitutions, insertions, and deletions. Often, the various segments differ from each other at about 5-20 positions. For recombination to generate increased diversity compared to the starting material, the starting materials must differ from each other by at least two nucleotide positions. That is, if only two substrates are present, they must be at least two different positions. If three substrates are present, for example, one substrate may be different from the second substrate at a single location, and the second substrate may be different from the third substrate at a different single location. Can be different. The starting DNA segments can be natural variants of each other (eg, allelic variants or species variants). More typically, these are codon-altered nucleic acids from one or more homologous nucleic acid sequences. Segments can also be derived from non-alleles that show some degree of structural and usually functional correlation (eg, codon-altered nucleic acids from different but homologous genes within the superfamily). The starting DNA segments can also be derived variants of each other. For example, one DNA segment can be produced by error-prone PCR replication of another DNA segment, or by replacement of a mutagenic cassette. Derived mutants can also be prepared by growing one (or both) of the segments in a mutagenic strain. In these situations, strictly speaking, the second DNA segment is not a single segment, but is a large family of related segments. The different segments forming the starting material are often the same length or substantially the same length. However, this is not necessary, for example, if one segment can be a subsequence of another segment. A segment can be present as part of a longer molecule (eg, a vector) or can be in an isolated form.

【0131】 出発DNAセグメントは、組換えDNAセグメントの多様なライブラリーを作
製するために、本明細書中で提供される任意の配列組換え形式によって組換えら
れる。このようなライブラリーは、10個より少ないメンバーを有するものから
、105個、109個、1012個、1015個、1020個を超えるかまたはそれ以上
もののメンバーを有するものまで、大きさにおいて広範に変化し得る。いくつか
の実施態様においては、生成された出発セグメントおよび組換えライブラリーは
、本質的に全長のコード配列および発現のために必要とされる任意の必須の調節
配列(例えば、プロモーターおよびポリアデニル化配列)を含む。他の実施態様
においては、ライブラリー中の組換えDNAセグメントは、スクリーニング/選
択を実行する前に、発現のために必要な配列を提供する一般的なベクター中に挿
入され得る。
The starting DNA segments are recombined by any of the sequence recombination formats provided herein to create a diverse library of recombinant DNA segments. Such libraries, from those having fewer than 10 members, 10 5, 10 9, 10 12, 10 15, up to those having a member of 10 20 more than or greater than one, the size Can vary widely. In some embodiments, the generated starting segments and recombinant libraries are essentially full-length coding sequences and any necessary regulatory sequences required for expression (eg, promoter and polyadenylation sequences). )including. In another embodiment, the recombinant DNA segments in the library can be inserted into a general vector that provides the necessary sequences for expression before performing the screening / selection.

【0132】 (変異体を組換えるための制限酵素部位の使用) いくつかの状況においては、目的の核酸配列中の変異の組換えを指向するため
に、核酸中の制限酵素部位を使用することが有利である。これらの技術は、関連
するDNAまたは問題となっている他の一次配列モチーフの存在に起因して、他
の既存の方法によっては容易にはシャッフリングされ得ないフラグメントの進化
において特に好ましい。これらの状況はまた、変異していない特定の配列を保持
することが好ましい組換え形式を含む。制限酵素部位の使用もまた、大きなフラ
グメント(代表的には、10kbよりも長い)(例えば、遺伝子のクラスター(
これは、それらの大きさが理由で、容易にはシャッフリングおよび「PCR増幅
」され得ない))をシャッフリングするために好ましい。50kbまでのフラグ
メントが、PCRによって増幅されることが報告されている(Barnes、P
roc.Natl.Acad.Sci.U.S.A.91:2216−2220
(1994))が、これは、10kbを超えるフラグメントについては問題であ
り得、従って、10〜50kbの範囲およびそれ以上のシャッフリングについて
は別の方法が好ましい。好ましくは、使用される制限エンドヌクレアーゼは、ク
ラスII型のもの(Sambrook、AusubelおよびBerger、前
出)および好ましくは、AlwnI、SfiI、またはBstX1のような、非
パリンドローム粘着末端突出を生じるものである。これらの酵素は、DNAリガ
ーゼを用いた効率的な順序付けられた再アセンブリを可能にする、非パリンドロ
ーム末端を生成する。代表的には、制限酵素(すなわち、エンドヌクレアーゼ)
部位は、従来の制限酵素マッピング技術(Sambrook、Ausubel、
およびBerger、前出)によって、その遺伝子についての配列情報の分析に
よって、または合成による核酸配列中への所望される制限部位の導入によって(
すなわち、サイレントな変異の取りこみによって)、同定される。例えば、1つ
以上のコドン変更された核酸が、制限酵素部位で、例えば、1つ以上の目的の核
酸(例えば、コドン変更された核酸との組換えによって改変される遺伝子または
遺伝子クラスターを含む)と組換えられ得る。
Use of Restriction Enzyme Sites to Recombine Mutants In some situations, the use of restriction enzyme sites in nucleic acids to direct the recombination of mutations in a nucleic acid sequence of interest. Is advantageous. These techniques are particularly preferred in the evolution of fragments that cannot be easily shuffled by other existing methods due to the presence of related DNA or other primary sequence motifs of interest. These situations also include recombination formats in which it is preferable to retain the particular sequence that is not mutated. The use of restriction sites is also important for large fragments (typically longer than 10 kb) (eg, clusters of genes (eg,
This is preferred for shuffling which cannot be easily shuffled and "PCR amplified" because of their size)). Fragments of up to 50 kb have been reported to be amplified by PCR (Barnes, P.
rc. Natl. Acad. Sci. U. S. A. 91: 2216-2220
(1994)), but this can be a problem for fragments larger than 10 kb, so alternative methods are preferred for shuffling in the range of 10-50 kb and beyond. Preferably, the restriction endonucleases used are of the class II type (Sambrook, Ausubel and Berger, supra) and preferably those that produce non-palindromic cohesive end overhangs, such as AlwnI, SfiI or BstX1. is there. These enzymes generate non-palindromic ends that allow for efficient ordered reassembly with DNA ligase. Typically, a restriction enzyme (ie, an endonuclease)
The site was prepared using conventional restriction enzyme mapping techniques (Sambrook, Ausubel,
And Berger, supra), by analyzing sequence information about the gene, or by introducing the desired restriction site into the nucleic acid sequence by synthesis (
Ie, by silent mutation incorporation). For example, one or more codon-altered nucleic acids may be placed at a restriction enzyme site, for example, one or more nucleic acids of interest (eg, including a gene or gene cluster modified by recombination with a codon-altered nucleic acid). And can be recombined.

【0133】 消化されるDNA基質分子は、インビボで複製されるDNA(例えば、プラス
ミド調製物)に由来し得るか、または合成(すなわち、例えば、目的の制限酵素
認識部位(好ましくは、フラグメントの末端近く)を保有しているPCR増幅さ
れた核酸のフラグメント)に由来し得るかのいずれかであり得る。代表的には、
目的の遺伝子の少なくとも2つの変異体(それぞれが、1つ以上の変異を有する
)、およびコドンの改変を取りこんでいる変異体の少なくとも1つが、目的の核
酸配列中で切断することが決定された少なくとも1つの制限酵素で消化される。
制限フラグメントは、次いで、シャッフリングされた領域を有する全長の遺伝子
を生成するように、DNAリガーゼを用いて連結される。シャッフリングされる
領域の数は、目的の核酸配列中での切断の数に依存する。シャッフリングされた
分子は、上記のように細胞中に導入され得、そして本明細書中に記載されるよう
な所望される特性についてスクリーニングまたは選択され得る。次いで、核酸は
、所望の特性を有するプール(ライブラリー)またはクローンから単離され得、
そして、所望の程度の改善が得られるまで同じ手順に供され得る。
The DNA substrate molecule to be digested can be derived from DNA that is replicated in vivo (eg, a plasmid preparation), or synthetic (ie, eg, containing a restriction enzyme recognition site of interest (preferably, the terminal (A fragment of a PCR-amplified nucleic acid carrying the DNA). Typically,
At least two variants of the gene of interest (each having one or more mutations) and at least one of the variants incorporating the codon modification have been determined to cleave in the nucleic acid sequence of interest. Digested with at least one restriction enzyme.
The restriction fragments are then ligated using DNA ligase to generate a full-length gene with the shuffled region. The number of regions shuffled depends on the number of cleavages in the nucleic acid sequence of interest. Shuffled molecules can be introduced into cells as described above, and screened or selected for desired properties as described herein. The nucleic acid can then be isolated from a pool (library) or clone having the desired properties,
It can then be subjected to the same procedure until the desired degree of improvement is obtained.

【0134】 いくつかの実施態様においては、少なくとも1つのDNA基質分子またはその
フラグメントが、単離され、そして変異誘発に供される。いくつかの実施態様に
おいては、再連結された制限フラグメントのプールまたはライブラリーは、消化
−連結プロセスが繰り返される前に、変異誘発またはさらなる組換えプロトコー
ルに供される。本明細書中で使用されるような「変異誘発」は、PCR変異誘発
、オリゴヌクレオチドによって指向される変異誘発、部位特異的変異誘発などの
ような当該分野で公知のこのような技術、および本明細書中で記載される任意の
技術による反復的な配列組換えを含む。
[0134] In some embodiments, at least one DNA substrate molecule or fragment thereof is isolated and subjected to mutagenesis. In some embodiments, the pool or library of religated restriction fragments is subjected to mutagenesis or further recombination protocols before the digestion-ligation process is repeated. “Mutage” as used herein refers to such techniques known in the art as PCR mutagenesis, oligonucleotide-directed mutagenesis, site-directed mutagenesis, and the like. Includes repetitive sequence recombination by any of the techniques described herein.

【0135】 (再アセンブリPCR) 核酸配列中の変異を組換えるためのさらなる技術は、「再アセンブリPCR」
を利用する。この方法は、遺伝子のような全長の核酸テンプレート中で別々に進
化された複数のセグメントをアセンブルするために使用され得る。この技術は、
有利な変異体のプールが、以前の作業によって既知であるが、または当該分野で
公知の任意の変異誘発技術(例えば、PCR変異誘発、カセット変異誘発、ドー
プ処理(doped)オリゴ変異誘発、化学的変異誘発、またはミューテーター
株中でのインビボでのDNAテンプレートの増殖)によって作製され得る変異体
をスクリーニングすることによって同定されている場合に、行われる。目的の核
酸配列のセグメントを定義する境界は、好ましくは、遺伝子間領域、イントロン
、または目的の変異をおそらく有さない遺伝子の領域中に存在する。好ましくは
、オリゴヌクレオチドプライマー(オリゴ)は、目的の核酸配列のセグメントの
PCR増幅のために合成される。その結果、オリゴヌクレオチドの配列は、2つ
のセグメントの連結部を重複する。重複領域は、代表的には、約10から100
ヌクレオチドの長さである。
Reassembly PCR A further technique for recombining mutations in nucleic acid sequences is “reassembly PCR”.
Use This method can be used to assemble multiple segments that have been separately evolved in a full-length nucleic acid template, such as a gene. This technology is
The pool of advantageous variants is known by previous work, or any mutagenesis technique known in the art (eg, PCR mutagenesis, cassette mutagenesis, doped oligo mutagenesis, chemical This is done if it has been identified by screening for mutants that can be created by mutagenesis, or by growing a DNA template in vivo in a mutator strain. The boundaries defining the segments of the nucleic acid sequence of interest are preferably located in intergenic regions, introns, or regions of the gene that probably do not have the mutation of interest. Preferably, oligonucleotide primers (oligos) are synthesized for PCR amplification of a segment of the nucleic acid sequence of interest. As a result, the sequence of the oligonucleotide overlaps the junction of the two segments. The overlap region is typically about 10 to 100
The length of the nucleotide.

【0136】 セグメントのそれぞれは、このようなプライマーのセットを用いて増幅される
。PCR産物は、次いで、本明細書中で議論されるようなアセンブリプロトコー
ルに従って「再アセンブルされ」、ランダムに断片化された遺伝子をアセンブル
する。簡潔には、アセンブリプロトコールにおいては、PCR産物は、最初にプ
ライマーから、例えば、ゲル電気泳動またはサイズ排除クロマトグラフィーによ
って精製される。精製された産物は互いに混合され,そしてさらなるプライマー
(「自己プライミング」)が存在しない、ポリメラーゼおよびデオキシヌクレオ
シド三リン酸(dNTP)および適切な緩衝塩の存在下で、約1〜10サイクル
の変性、再アニーリング、および伸長に供される。遺伝子に隣接するプライマー
を用いる続くPCRが、完全に再アセンブルされそしてシャッフリングされた遺
伝子の収量を増幅するために使用される。いくつかの実施態様においては、得ら
れる再アセンブルされた遺伝子は、プロセスが繰り返される前に、変異誘発に供
される。
[0136] Each of the segments is amplified using such a set of primers. The PCR product is then "reassembled" according to the assembly protocol as discussed herein to assemble the randomly fragmented gene. Briefly, in an assembly protocol, PCR products are first purified from primers, for example, by gel electrophoresis or size exclusion chromatography. The purified products are mixed with each other and denatured for about 1-10 cycles in the presence of polymerase and deoxynucleoside triphosphate (dNTP) and an appropriate buffer salt without the presence of additional primers ("self-priming"). Subject to reannealing and extension. Subsequent PCR using primers flanking the gene is used to amplify the yield of the fully reassembled and shuffled gene. In some embodiments, the resulting reassembled gene is subjected to mutagenesis before the process is repeated.

【0137】 本発明においては、PCRプライマーのようなオリゴは、出発配列と比較した
場合にコドンの改変を含み得る。さらに、オリゴヌクレオチドは、重複している
ハイブリダイズしたオリゴヌクレオチドが1回以上のPCR増幅サイクルにおい
て延長される、PCRコンカテマー化反応の基礎を形成し得る。この実施態様に
おいては、テンプレートの核酸は必要ではない(しかし、テンプレートまたはそ
のフラグメントが、増幅混合物に添加され得るが、これは、全長の遺伝子の最終
的な再アセンブリにおいて補助し得る)。オリゴヌクレオチド遺伝子の再アセン
ブリ方法に関するさらなる詳細は、例えば、Crameriら、1999年2月
5日に出願された、USSN60/118,813号の「OLIGONUCLE
OTIDE MEDIATED NUCLEIC ACID RECOMBIN
ATION」、およびCrameriら、1999年6月24日に出願された、
USSN60/141,049号の「OLIGONUCLEOTIDE MED
IATED NUCLEIC ACID RECOMBINATION」におい
て見出される。
In the present invention, oligos such as PCR primers may contain codon modifications when compared to the starting sequence. In addition, oligonucleotides can form the basis of a PCR concatamerization reaction where overlapping hybridized oligonucleotides are extended in one or more PCR amplification cycles. In this embodiment, the template nucleic acid is not required (although the template or a fragment thereof may be added to the amplification mixture, but this may aid in the final reassembly of the full-length gene). Further details regarding oligonucleotide gene reassembly methods are described, for example, in US Patent No. 60 / 118,813, OLIGONUCLE, filed February 5, 1999, by Crameri et al.
OTIDE MEDIATED NUCLEIC ACID RECOMBIN
ATION ", and Crameri et al., Filed June 24, 1999,
USN60 / 141,049 "OLIGONUCLEOTIDE MED
Found in "IATED NUCLEIC ACID RECOMBINATION".

【0138】 さらなる実施態様においては、目的の核酸配列のセグメントの増幅のためのP
CRプライマーは、以下のような目的の遺伝子中に変異を導入するために使用さ
れる。核酸配列中の目的の部位での変異は、スクリーニングまたは選択によって
、核酸配列のホモログを配列決定することによって、などにより同定される。目
的の部位での野生型および変異体の情報をコードするオリゴヌクレオチドPCR
プライマーが、合成される。次いで、これらのプライマーは、設計された位置で
の野生型および変異体の情報の入れ替え(permutation)をコードす
る全長の遺伝子のライブラリーを作製するためのPCR変異誘発において使用さ
れる。この技術は、代表的には、スクリーニングまたは選択のプロセスが、目的
の変異体の遺伝子を配列決定し、そして変異原性のオリゴヌクレオチドを合成す
るコストと比較して、高価であるか、厄介であるか、または非実用的である場合
に、有利である。
In a further embodiment, a P for amplification of a segment of the nucleic acid sequence of interest is used.
The CR primer is used to introduce a mutation into a target gene as described below. Mutations at sites of interest in a nucleic acid sequence are identified by screening or selection, by sequencing homologs of the nucleic acid sequence, and the like. Oligonucleotide PCR encoding wild-type and mutant information at the site of interest
Primers are synthesized. These primers are then used in PCR mutagenesis to create a library of full-length genes encoding permutation of wild-type and mutant information at the designed positions. This technique typically requires that the screening or selection process be expensive or cumbersome compared to the cost of sequencing the mutant gene of interest and synthesizing mutagenic oligonucleotides. It is advantageous if present or impractical.

【0139】 (シャッフリング前の相同変異体をコードするオリゴヌクレオチドでの部位特
異的変異誘発(SDM)) 本発明のいくつかの実施態様においては、1つ以上の基質配列からの配列情報
が、目的の所定の「親」配列に加えられ、スクリーニングまたは選択の回の間に
組換えが続く。代表的には、これは、鋳型としての1つの基質および他の基質配
列(例えば、相同遺伝子)に由来する単一のまたは複数の変異をコードするオリ
ゴヌクレオチドを用いて、当該分野で周知の技術(例えば、Berger,Au
subel、およびSambrook、前出)によって行われる。目的の改善さ
れた表現型についてのスクリーニングまたは選択後、選択された組換え体(単数
または複数)は、反復的な技術を使用してさらに進化され得る。スクリーニング
または選択後、部位特異的変異誘発が、相同変異体をコードするオリゴヌクレオ
チドの別のコレクションを用いて再度行われ得、そして上記のプロセスが、所望
の特性が得られるまで繰り返される。
Site-directed mutagenesis (SDM) with oligonucleotides encoding homologous variants before shuffling In some embodiments of the invention, sequence information from one or more substrate sequences is Of a given "parent" sequence, followed by recombination during rounds of screening or selection. Typically, this is accomplished using techniques well known in the art using oligonucleotides encoding one or more mutations from one substrate and another substrate sequence (eg, a homologous gene) as a template. (Eg, Berger, Au
subbel, and Sambrook, supra). After screening or selection for the improved phenotype of interest, the selected recombinant (s) can be further evolved using iterative techniques. After screening or selection, site-directed mutagenesis can be performed again with another collection of oligonucleotides encoding homologous variants, and the above process is repeated until the desired properties are obtained.

【0140】 2つのホモログ間の差異がコドン中の1つ以上の単一の点変異である場合は、
両方のホモログ中の配列をコードする縮重オリゴヌクレオチドが使用され得る。
1つのオリゴヌクレオチドは、多くのこのような縮重コドンを含み得、そしてな
お、当業者が配列のこのブロックにわたる全ての入れ替え(permutaio
n)を徹底的に検索することを可能にする。
If the difference between the two homologs is one or more single point mutations in the codon,
Degenerate oligonucleotides encoding sequences in both homologs can be used.
One oligonucleotide may contain many such degenerate codons, and one of ordinary skill in the art will appreciate that all permutations across this block of sequence (permutaio)
n) can be searched exhaustively.

【0141】 相同配列空間が非常に大きい場合は、特定の変異体に対する検索を制限するこ
とが有利であり得る。従って、例えば、コンピューターモデル化ツール(Lat
hropら(1996)J.Mol.Biol.,255:641−665)は
、標的タンパク質上の各相同変異をモデル化し、そして構造および機能を著しく
破壊すると予想される任意の変異を廃棄するために、使用され得る。変異事象を
生成および予測するためのインシリコでの遺伝的アルゴリズムの操作は、199
9年2月5日に出願された、USSN60/118854の、Selifono
vおよびStemmer「METHODS FOR MAKING CHARA
CTER STRINGS,POLYNUCLEOTIDES&POLYPEP
TIDES HAVINGDESIRED CHARACTERISTICS」
において見出される。
If the homologous sequence space is very large, it may be advantageous to limit the search for a particular variant. Thus, for example, computer modeling tools (Lat
hrop et al. (1996) J. Am. Mol. Biol. , 255: 641-665) can be used to model each homologous mutation on the target protein and discard any mutations that are expected to significantly disrupt structure and function. The operation of a genetic algorithm in silico to generate and predict mutation events is described in 199
USSN 60/118854, Serifono, filed February 5, 9
v and Stemmer "METHODS FOR MAKING CHARA
CTER STRINGS, POLYNUCLEOTIDES & POLYPEP
TIDES HAVING DESIRED CHARACTERISTICS "
Found in

【0142】 (オリゴヌクレオチドおよびインシリコでのシャッフリング形式) 上記のように、少なくとも2つのさらなる関連する形式が、本発明の実施にお
いて有用である。最初のものは、「インシリコ」でのシャッフリングと呼ばれ、
コンピューター内の遺伝子操作装置を使用して、「仮想的な」シャッフリングを
行うコンピューターアルゴリズムを利用する。本発明に対して適用されるように
、コドン変更された遺伝子配列のストリングは、コンピューターシステムにおい
て組換えられ、そして所望の生成物が、例えば、再組立てPCRまたは合成オリ
ゴヌクレオチドの連結によって作成される。インシリコでのシャッフリングは、
1999年2月5日に提出された、USSN60/118854の、Selif
onovおよびStemmer「METHODS FOR MAKING CH
ARACTER STRINGS,POLYNUCLEOTIDES&POLY
PEPTIDES HAVING DESIRED CHARACTER ST
RINGS,POLYNUCLEOTIDES & POLYPEPTIDES
HAVING DESIRED CHARACTERISTICS」において
詳細に記載されている。簡潔には、遺伝子操作装置(点変異のような所定の遺伝
的事象を示すアルゴリズム、相同核酸の2つの鎖の組換えなど)が、例えば、核
酸配列のストリングをアラインメントし(標準的なアラインメントソフトウェア
を使用するか、または手動による検査およびアラインメントによる)、そして組
換えの結果を予想することによって、1つ以上の核酸において生じ得る組換えま
たは変異事象をモデル化するために使用される。予想される組換えの結果は、例
えば、オリゴヌクレオチドの合成および再組立てPCRによって、対応する分子
を産生するために使用される。
Oligonucleotide and In Silico Shuffling Formats As noted above, at least two additional related formats are useful in the practice of the present invention. The first one is called shuffling in "silico"
Utilizes computer algorithms that perform "virtual" shuffling using genetic manipulation devices in the computer. As applied to the invention, a string of codon-altered gene sequences is recombined in a computer system and the desired product is created, for example, by reassembly PCR or ligation of synthetic oligonucleotides. . Shuffling in silico,
USSN 60/118854, Serif, filed February 5, 1999.
onov and Stemmer "METHODS FOR MAKING CH
ARACTER STRINGS, POLYNUCLEOTIDES & POLY
PEPTIDES HAVING DESIRED CHARACTER ST
RINGS, POLYNUCLEOTIDES & POLYPEPTIDES
HAVING DESIRED CHARACTERISTICS ". Briefly, genetic engineering devices (algorithms that indicate a given genetic event, such as a point mutation, recombination of two strands of homologous nucleic acid, etc.), for example, align strings of nucleic acid sequences (standard alignment software) Or by manual inspection and alignment) and predicting the consequences of recombination, to model recombination or mutation events that may occur in one or more nucleic acids. The expected result of the recombination is used to produce the corresponding molecule, for example, by oligonucleotide synthesis and reassembly PCR.

【0143】 第2の有用な形式は、「オリゴヌクレオチドによって媒介されるシャッフリン
グ」と呼ばれ、ここでは、関連する相同核酸(例えば、本発明に対して適用され
る場合は、コドンを改変された合成の核酸相同変異体)のファミリーに対応する
オリゴヌクレオチドであり、これは、選択可能な核酸を生じるように組換えられ
る。この形式は、1999年2月5日に提出された、USSN 60/118,
813の、Crameriら、「OLIGONUCLEOTIDE MEDIA
TED NUCLEIC ACID RECOMBINATION」、および1
999年6月24日に提出された、USSN 60/141,049の、Cra
meriら、「OLIGONUCLEOTIDE MEDIATED NUCL
EIC ACID RECOMBINATION」において詳細に記載されてい
る。簡潔には、選択されたオリゴヌクレオチドは、合成され、連結され、そして
代表的には、ポリメラーゼまたはリガーゼのいずれかによって媒介される伸張反
応において、伸張される。この技術は、相同な核酸配列、またはなお、相同では
ないコドン変更された核酸配列を組換えるために使用され得る。
A second useful format is referred to as “oligonucleotide-mediated shuffling”, in which related homologous nucleic acids (eg, as applied to the invention, have been modified with codons) Oligonucleotides that correspond to a family of synthetic nucleic acid homologous variants), which are recombined to yield a selectable nucleic acid. This format is described in USSN 60/118, filed February 5, 1999.
813, Crameri et al., "OLIGONUCLEOTIDE MEDIA.
TED NUCLEIC ACID RECOMBINATION ", and 1
Cra of USSN 60 / 141,049, filed June 24, 999,
Meri et al., “OLIGONUCLEOTIDE MEDIATED NUCL
EIC ACID RECOMBINATION ". Briefly, selected oligonucleotides are synthesized, ligated, and extended, typically in an extension reaction mediated by either a polymerase or a ligase. This technique can be used to recombine a homologous nucleic acid sequence, or even a codon altered nucleic acid sequence that is not homologous.

【0144】 オリゴヌクレオチドによって媒介される組換えの1つの利点は、低い配列類似
性を有する相同核酸、または相同ではない核酸でさえも組換える能力である。こ
れらの低い相同性のオリゴヌクレオチドのシャッフリング方法においては、1つ
以上の断片化された核酸のセット(例えば、切断されたコドンを改変されたオリ
ゴヌクレオチド、または合成されたコドン変更されたオリゴヌクレオチド)が、
例えば、交差ファミリー多様性オリゴヌクレオチドのセットを用いて、組換えら
れる。これらの交差オリゴヌクレオチドのそれぞれは、低い配列類似性を有する
相同または非相同核酸に由来する複数の配列多様性ドメインに対応する複数の配
列多様性ドメインを有する。断片化されたオリゴヌクレオチド(これは、1つ以
上の相同または非相同核酸との比較によって誘導される)は、交差オリゴの1つ
以上の領域に対してハイブリダイズし得、それによって組換えを容易にする。
One advantage of oligonucleotide-mediated recombination is the ability to recombine homologous nucleic acids with low sequence similarity, or even non-homologous nucleic acids. In these low homology oligonucleotide shuffling methods, a set of one or more fragmented nucleic acids (eg, truncated codon-modified oligonucleotides or synthesized codon-modified oligonucleotides) But,
For example, they are recombined using a set of cross-family diversity oligonucleotides. Each of these cross-over oligonucleotides has a plurality of sequence diversity domains corresponding to a plurality of sequence diversity domains from homologous or heterologous nucleic acids having low sequence similarity. Fragmented oligonucleotides, which are derived by comparison to one or more homologous or heterologous nucleic acids, can hybridize to one or more regions of the crossing oligo, thereby reducing recombination. make it easier.

【0145】 相同な核酸を組換える場合は、重複しているファミリーの遺伝子シャッフリン
グオリゴヌクレオチドのセット(これは、1つ以上のコドンを改変された核酸を
含む相同核酸の比較、続いて対応するオリゴヌクレオチドの合成によって誘導さ
れる)が、ハイブリダイズさせられ、そして伸張させられる(例えば、再組立て
PCRまたは連結によって)。それによって、組換えられた核酸の集団が提供さ
れ、これは、所望される形質または特性について選択され得る。重複しているフ
ァミリーのシャッフリング遺伝子オリゴヌクレオチドのセットは、複数の相同な
標的核酸から誘導されたコンセンサス領域のサブ配列を有する複数のオリゴヌク
レオチドのメンバーの型を含む。
[0145] When recombining homologous nucleic acids, a set of gene-shuffling oligonucleotides of overlapping families is used, which is a comparison of homologous nucleic acids containing nucleic acids with one or more codons modified, followed by the corresponding oligonucleotides. (Derived by nucleotide synthesis) are hybridized and extended (eg, by reassembly PCR or ligation). Thereby, a population of recombinant nucleic acids is provided, which can be selected for a desired trait or property. The set of overlapping family shuffling gene oligonucleotides comprises a plurality of oligonucleotide member types having consensus region subsequences derived from a plurality of homologous target nucleic acids.

【0146】 代表的には、本発明に対して適用される場合は、ファミリーの遺伝子シャッフ
リングオリゴヌクレオチド(これは、1つ以上のコドン変更された核酸(単数ま
たは複数)を含む)が、配列同一性の保存された領域および配列多様性の領域を
選択するために、相同核酸配列をアラインメントすることによって提供される。
配列多様性の少なくとも1つの領域に対応する複数のファミリーの遺伝子シャッ
フリングオリゴヌクレオチドが、(連続的、または同時に)合成される。
Typically, as applied to the present invention, the gene shuffling oligonucleotides of the family, which comprise one or more codon-altered nucleic acid (s), have sequence identity. It is provided by aligning homologous nucleic acid sequences to select for conserved regions of sex and regions of sequence diversity.
Multiple families of gene shuffling oligonucleotides corresponding to at least one region of sequence diversity are synthesized (either sequentially or simultaneously).

【0147】 フラグメントのセット、またはオリゴヌクレオチドシャッフリングアプローチ
において使用されるフラグメントのサブセットは、1つ以上の相同核酸を切断す
ることによって(例えば、DNaseを用いて)、またはより一般的には、少な
くとも1つの核酸の複数の領域に対応するオリゴヌクレオチドのセットを合成す
ることによって提供され得る(代表的には、全長の核酸に対応するオリゴヌクレ
オチドは、核酸のフラグメントのセットのメンバーとして提供される)。本明細
書中のシャッフリング手順においては、これらの切断フラグメントは、ファミリ
ーの遺伝子シャッフリングオリゴヌクレオチドと組み合わせて、例えば、組換え
のコドン変更された核酸(単数または複数)を産生するための1つ以上の組換え
反応において、使用され得る。
A set of fragments, or a subset of fragments used in an oligonucleotide shuffling approach, may be obtained by cleaving one or more homologous nucleic acids (eg, using DNase), or more usually, at least one fragment. It can be provided by synthesizing a set of oligonucleotides corresponding to multiple regions of one nucleic acid (typically, oligonucleotides corresponding to a full-length nucleic acid are provided as members of a set of fragments of a nucleic acid). In the shuffling procedure herein, these truncated fragments are combined with a family of gene shuffling oligonucleotides, for example, to produce one or more of the recombinant codon-modified nucleic acid (s). It can be used in recombination reactions.

【0148】 さらなるオリゴヌクレオチドシャッフリング形式が、Crameriら、「O
LIGONUCLEOTIDE MEDIATED NUCLEIC ACID
RECOMBINATION」、(代理人登録番号第02−296−2US)
による同時出願、およびWelchら、「USE OF CODON VARI
ED OLIGONUCLEOTIDE SYNTHESIS FOR SYN
THETIC SHUFFLING」、(代理人登録番号第02−1007)に
よる同時出願において見出される。詳細には、これらの出願は、縮重オリゴヌク
レオチドの3−ヌクレオチドに基づく合成を提供し、それによってオリゴヌクレ
オチドのシャッフリングの間のコドンの置換を提供する。簡潔には、この手順は
、標準的な1−ヌクレオチド合成よりもむしろ、オリゴを合成するために、3−
ヌクレオチドホスホルアミダイト化学を利用する。コドンがユニットとして変更
されるので、縮重オリゴヌクレオチドの合成スキームは単純である。
A further oligonucleotide shuffling format is described in Crameri et al., “O
LIGNUCLEOTIDE MEDIATED NUCLEC ACID
RECOMBINATION ", (agent registration number 02-296-2US)
And Welch et al., "USE OF CODON VARI."
ED OLIGONUCLEOTIDE SYNTHESIS FOR SYN
"THETIC SHUFFLING", (Attorney Registration No. 02-1007). In particular, these applications provide 3-nucleotide based synthesis of degenerate oligonucleotides, thereby providing codon substitution during shuffling of oligonucleotides. Briefly, this procedure uses 3-, rather than standard 1-nucleotide synthesis, to synthesize oligos.
Utilizes nucleotide phosphoramidite chemistry. Since the codons are changed as units, the synthesis scheme for degenerate oligonucleotides is simple.

【0149】 (さらなるインビトロでのDNAシャッフリング形式) インビトロでDNA配列をシャッフリングするための1つの実施態様において
は、組換えのための最初の基質は、異なる個体、株、または生物体の種に由来す
るホモログのような関連する配列(例えば、異なる変異体形態)のプール、ある
いは対立遺伝子変異体のような同じ生物体に由来する関連する配列である。配列
は、DNAまたはRNAであり得、そして組換えられるかまたは再組立てされる
遺伝子またはDNAフラグメントの大きさに依存して種々の長さであり得る。好
ましくは、配列は、50塩基対(bp)から50キロ塩基(kb)までである。
Additional In Vitro DNA Shuffling Formats In one embodiment for shuffling DNA sequences in vitro, the first substrate for recombination is from a different individual, strain, or species of organism. Pools of related sequences (eg, different variant forms), such as homologs, or related sequences from the same organism, such as allelic variants. The sequence can be DNA or RNA, and can be of various lengths depending on the size of the gene or DNA fragment to be recombined or reassembled. Preferably, the sequence is from 50 base pairs (bp) to 50 kilobases (kb).

【0150】 関連する基質のプールは、例えば、約5bpから5kbまたはそれ以上の重複
しているフラグメントに変換される。しばしば、例えば、フラグメントの大きさ
は、約10bpから1000bpまでであり、そしてしばしば、DNAフラグメ
ントの大きさは、約100bpから500bpまでである。転換は、多数の異な
る方法(例えば、DNaseI、またはRNase消化、ランダムな剪断、また
は部分的な制限酵素消化)によって、あるいはcrameriら、前出において
議論されるファミリーのオリゴヌクレオチドによって媒介されるシャッフリング
方法におけるようなオリゴヌクレオチドの合成によって、達成され得る。核酸の
単離、操作、酵素消化などのためのプロトコールの議論については、例えば、S
ambrookら、およびAusubel(両方とも前出)を参照のこと。特定
の長さおよび配列の核酸のフラグメントの濃度は、しばしば、全核酸の重量の0
.1%未満、または1%未満である。混合物中の異なる特異的な核酸のフラグメ
ントの数は、通常は、少なくとも約2、10、100、500、または1,00
0もしくはそれ以上である。
The pool of related substrates is converted, for example, into overlapping fragments of about 5 bp to 5 kb or more. Often, for example, the size of the fragment is from about 10 bp to 1000 bp, and often the size of the DNA fragment is from about 100 bp to 500 bp. The conversion can be mediated by a number of different methods (eg, DNase I or RNase digestion, random shear, or partial restriction enzyme digestion) or by shrambling methods mediated by the oligonucleotides of the family discussed in crameli et al. Can be achieved by the synthesis of oligonucleotides as in For a discussion of protocols for nucleic acid isolation, manipulation, enzymatic digestion, etc.
See ambrook et al. and Ausubel (both supra). The concentration of fragments of a nucleic acid of a particular length and sequence is often 0% of the total nucleic acid weight.
. Less than 1%, or less than 1%. The number of different specific nucleic acid fragments in a mixture will usually be at least about 2, 10, 100, 500, or 1,000.
0 or more.

【0151】 核酸のフラグメントの混合された集団は、任意の種々の技術(例えば、加熱、
化学的な変性、DNA結合タンパク質の使用などを含む)を使用して、少なくと
も、部分的に、一本鎖の形態に転換される(オリゴヌクレオチドによって媒介さ
れる方法においては、この工程は省略される)。一本鎖の核酸フラグメントを形
成し、次いで再アニーリングするための転換は、約80℃から100℃まで、よ
り好ましくは、90℃から96℃までに加熱することによって、達成され得る。
転換はまた、一本鎖のDNA結合タンパク質(Wold(1997)Annu.
Rev.Biochem.66:61−92を参照のこと)またはrecAタン
パク質(例えば、Kiianitsa(1997)Proc.Natl.Aca
d.Sci.U.S.A.94:7837−7840を参照のこと)での処理に
よっても達成され得る。他の一本鎖の核酸フラグメントとの配列同一性の領域を
有する一本鎖の核酸のフラグメントは、次いで、20℃から75℃に、そして好
ましくは、40℃から65℃に冷却することによって再アニーリングされ得る。
再生は、ポリエチレングリコール(PEG)、他の体積排除剤または塩の添加に
よって加速させられ得る。塩濃度は、好ましくは、0mMから200mMであり
、より好ましくは、塩濃度は、10mMから100mMである。塩は、KClま
たはNaClであり得る。PEGの濃度は、好ましくは、0%から20%であり
、より好ましくは、5%から10%である。再アニーリングするフラグメントは
、異なる基質に由来し得る。アニーリングした核酸のフラグメントは、核酸ポリ
メラーゼ(例えばTaqまたはKlenow)およびdNTP(すなわち、dA
TP、dCTP、dGTP、およびdTTP)の存在下でインキュベートされる
。配列同一性の領域が大きい場合は、Taqポリメラーゼは、45−65℃の間
の再アニーリング温度を用いて使用され得る。同一性の領域が小さい場合は、K
lenowポリメラーゼが、20−30℃の間の再アニーリング温度を用いて使
用され得る。ポリメラーゼは、アニーリングの前に、アニーリングと同時に、ま
たはアニーリング後に、ランダムな核酸のフラグメントに対して添加され得る。
The mixed population of nucleic acid fragments can be prepared by any of a variety of techniques, including heating,
This step is at least partially converted to single-stranded form using chemical denaturation, including the use of DNA binding proteins, etc. (in oligonucleotide-mediated methods, this step is omitted). ). Conversion to form a single-stranded nucleic acid fragment and then reannealing can be accomplished by heating from about 80 ° C to 100 ° C, more preferably from 90 ° C to 96 ° C.
Transformation can also be performed by single-stranded DNA binding proteins (Wold (1997) Annu.
Rev .. Biochem. 66: 61-92) or the recA protein (e.g., Kiianitsa (1997) Proc. Natl. Aca).
d. Sci. U. S. A. 94: 7837-7840). The single stranded nucleic acid fragment having a region of sequence identity with another single stranded nucleic acid fragment is then regenerated by cooling from 20 ° C to 75 ° C, and preferably from 40 ° C to 65 ° C. Can be annealed.
Regeneration can be accelerated by the addition of polyethylene glycol (PEG), other volume exclusion agents or salts. The salt concentration is preferably from 0 mM to 200 mM, more preferably the salt concentration is from 10 mM to 100 mM. The salt can be KCl or NaCl. The concentration of PEG is preferably between 0% and 20%, more preferably between 5% and 10%. Reannealing fragments can be from different substrates. The annealed nucleic acid fragment is a nucleic acid polymerase (eg, Taq or Klenow) and dNTP (ie, dA
(TP, dCTP, dGTP, and dTTP). If the region of sequence identity is large, Taq polymerase can be used with a reannealing temperature between 45-65 ° C. If the area of identity is small, K
Lenow polymerase can be used with a reannealing temperature between 20-30 <0> C. The polymerase can be added to random nucleic acid fragments before annealing, simultaneously with annealing, or after annealing.

【0152】 フラグメントの異なる順列を含むポリヌクレオチドのコレクションを作成する
ための、重複しているフラグメントのポリメラーゼまたはリガーゼの存在下での
、変性、再生、およびインキュベーションのプロセスは、しばしば、インビトロ
での核酸のシャッフリングと呼ばれる。このサイクルは、所望される回数繰り返
される。好ましくは、サイクルは、2回から100回まで繰り返され、より好ま
しくは、配列は、10回から40回繰り返される。得られる核酸は、約50bp
から約100kb、好ましくは、500bpから50kbまでの二本鎖のポリヌ
クレオチドのファミリーである。集団は、それに対して実質的な配列同一性を示
すが、またいくつかの位置で異なっている出発基質の変異体を示す。集団は、出
発基質よりも多いさらなるメンバーを有する。シャッフリングによって得られる
フラグメントの集団は、必要に応じて、ベクター中へのクローニングの後で、宿
主細胞を形質転換するために使用される。
The process of denaturation, regeneration, and incubation of overlapping fragments in the presence of a polymerase or ligase to create a collection of polynucleotides containing different permutations of the fragments often involves in vitro nucleic acid in vitro. Called shuffling. This cycle is repeated as many times as desired. Preferably, the cycle is repeated from 2 to 100 times, more preferably, the sequence is repeated from 10 to 40 times. The resulting nucleic acid is about 50 bp
From about 100 kb, preferably from 500 bp to 50 kb. The population shows variants of the starting substrate which show substantial sequence identity thereto, but also differ at some positions. The population has more members than the starting substrate. The population of fragments obtained by shuffling is used to transform host cells, optionally after cloning into a vector.

【0153】 インビトロでのシャッフリングを利用する1つの実施態様においては、組換え
基質のサブ配列は、実質的な画分(代表的には、少なくとも20パーセントまた
はそれ以上の不完全に延長された増幅産物)を生じる条件下で、全長の配列を増
幅することによって生成され得る。別の実施態様は、全長の増幅産物よりも短い
ものを生成するように、完全な鋳型DNAをプライムするためのランダムプライ
マーを使用する。増幅産物(不完全に伸張された増幅産物を含む)は、変性させ
られ、そして再アニーリングおよび増幅の少なくとも1回のさらなるサイクルに
供される。再アニーリングおよび増幅の少なくとも1回のサイクルが、不完全に
伸張された産物の実質的な画分を提供するこのバリエーションは、「どもり(s
tuttering)」と呼ばれる。続く増幅の回においては、部分的に伸張さ
れた(全長よりも短い)産物は、異なる配列に関連する鋳型の種に対して再アニ
ーリングし、そしてその伸張をプライムする。別の実施態様においては、フラグ
メントへの基質の転換は、基質の部分的なPCR増幅によって達成され得る。
In one embodiment utilizing in vitro shuffling, the subsequences of the recombination substrate have a substantial fraction (typically at least 20 percent or more incompletely extended amplification). Product) under the conditions that result in the amplification of the full-length sequence. Another embodiment uses random primers to prime the complete template DNA to generate shorter than full-length amplification products. Amplification products (including incompletely extended amplification products) are denatured and subjected to at least one additional cycle of reannealing and amplification. This variation, in which at least one cycle of reannealing and amplification provides a substantial fraction of incompletely extended product, is called "stuttering (s
tutting). In subsequent rounds of amplification, the partially extended (less than full length) product reanneals to the template species associated with a different sequence and primes the extension. In another embodiment, conversion of the substrate into fragments can be achieved by partial PCR amplification of the substrate.

【0154】 別の実施態様においては、フラグメントの混合物は、1つ以上のオリゴヌクレ
オチドでスパイクされる。オリゴヌクレオチドは、野生型の配列の予め特徴付け
られた変異(例えば、コドンの改変)、あるいは固体または種間の天然の変異の
部位を含むように設計され得る。オリゴヌクレオチドはまた、代表的には、野生
型フラグメントとのアニーリングを可能にするために、このような変異体または
バリエーションに隣接する十分な配列相同性または構造的相同性を含む。アニー
リング温度は、相同性の長さに依存して調節され得る。
[0154] In another embodiment, the mixture of fragments is spiked with one or more oligonucleotides. Oligonucleotides can be designed to include pre-characterized mutations (eg, codon modifications) of the wild-type sequence, or sites of natural mutation between solids or species. Oligonucleotides also typically include sufficient sequence or structural homology flanking such variants or variations to allow for annealing with the wild-type fragment. The annealing temperature can be adjusted depending on the length of homology.

【0155】 さらなる実施態様においては、例えば、1つの鋳型に由来するDNAフラグメ
ントが関連するが異なる鋳型の相同な位置上でプライムする場合には、組換えは
、温度を変更することによって、少なくとも1回のサイクルで生じる。温度の変
更は、recA(Kiianitsa(1997)、前出を参照のこと)、ra
d51(Namsaraev(1997)Mol.Cell.Biol.17:
5359−5368を参照のこと)、rad55(Clever(1997)E
MBO J.16:2535−2544を参照のこと)、rad57(Sung
(1997)Genes Dev.11:1111−1121を参照のこと);
または他のポリメラーゼ(例えば、ウイルスのポリメラーゼ、逆転写酵素)の増
幅混合物への添加によって誘導され得る。温度の変更はまた、DNA鋳型の濃度
を増大させることによってもまた、増大させられ得る。
In a further embodiment, recombination is effected by altering the temperature by altering the temperature, eg, when DNA fragments from one template prime on homologous positions of related but different templates. Occurs in one cycle. The change in temperature is indicated by recA (see Kiianitsa (1997), supra), ra
d51 (Namsaraev (1997) Mol. Cell. Biol. 17:
5359-5368), rad55 (Clever (1997) E
MBOJ. 16: 2535-2544), rad57 (Sung).
(1997) Genes Dev. 11: 1111-1121);
Alternatively, it can be induced by the addition of other polymerases (eg, viral polymerase, reverse transcriptase) to the amplification mixture. Altering the temperature can also be increased by increasing the concentration of the DNA template.

【0156】 別の実施態様は、少なくとも1回の増幅のサイクルを利用する。これは、関連
する配列の重複している一本鎖のDNAフラグメントのコレクション、および異
なる長さを使用して行われ得る。フラグメントは、一本鎖のDNAファージ(例
えば、M13(Wang(1997)Biochemistry 36:948
6−9492を参照のこと)を使用して調製され得る。各フラグメントは、コレ
クションに由来する第2のフラグメントのポリヌクレオチド鎖にハイブリダイズ
し、そしてその伸張をプライムし、従って、配列を組換えられたポリヌクレオチ
ドを形成する。さらなるバリエーションにおいては、第1のDNA鋳型に対して
、可変の長さのssDNAフラグメントが、単一のプライマーから、Pfu、T
aq、Vent、Deep Vent、U1Tma DNAポリメラーゼ、また
は他のDNAポリメラーゼによって生成され得る(Cline(1996)Nu
cleic Acids Res.24:3546−3551を参照のこと)。
一本鎖のDNAフラグメントは、第2のKunkel型鋳型についてのプライマ
ーとして使用される。これは、ウラシルを含有する環状のssDNAから形成さ
れる。これは、第2の鋳型への第1の鋳型の複数の置換を生じる。Levich
kin(1995)Mol.Biology 29:572−577;Jung
(1992)Gene 121:17−24を参照のこと。
Another embodiment utilizes at least one cycle of amplification. This can be done using a collection of overlapping single-stranded DNA fragments of related sequences, and different lengths. The fragment may be a single-stranded DNA phage (eg, M13 (Wang (1997) Biochemistry 36: 948).
6-9492). Each fragment hybridizes to the polynucleotide strand of the second fragment from the collection and primes its extension, thus forming a polynucleotide whose sequence has been recombined. In a further variation, a ssDNA fragment of variable length relative to a first DNA template can be used to generate Pfu, T
aq, Vent, Deep Vent, U1Tma DNA polymerase, or other DNA polymerases (Cline (1996) Nu
cleic Acids Res. 24: 3546-3551).
The single-stranded DNA fragment is used as a primer for a second Kunkel-type template. It is formed from circular ssDNA containing uracil. This results in multiple substitutions of the first template for the second template. Levich
Kin (1995) Mol. Biology 29: 572-577; Jung
(1992) Gene 121: 17-24.

【0157】 本発明のいくつかの実施態様においては、本発明の反復的な組換え方法の使用
によって得られたシャッフリングされた核酸は、スクリーニングのための細胞お
よび/または生物体に導入される。シャッフリングされた遺伝子は、最初のスク
リーニングのために、例えば、細菌細胞、酵母細胞、真菌細胞、脊椎動物細胞、
無脊椎動物細胞、または植物細胞中に導入され得る。Bacillus種(例え
ば、B.subtilisおよびE.coliは、その中にシャッフリングされ
た遺伝子(これは、他の細胞型に対する便利なシャトリングを提供する(これら
の細菌細胞と真核生物細胞との間でのシャトル材料のための種々のベクターが利
用可能である;Sambrook、Ausubel、およびBerger(全て
前出)を参照のこと))を挿入し得、そしてそれを発現し得る、適切な細菌細胞
の2つの例である。シャッフリングされた遺伝子は、細菌、真菌、または酵母細
胞中に、染色体DNA中への組込みによるか、またはプラスミドとしてのいずれ
かによって導入され得る。
In some embodiments of the present invention, the shuffled nucleic acids obtained by using the iterative recombination methods of the present invention are introduced into cells and / or organisms for screening. Shuffled genes are used for initial screening, e.g., bacterial cells, yeast cells, fungal cells, vertebrate cells,
It can be introduced into an invertebrate cell or a plant cell. Bacillus species, such as B. subtilis and E. coli, have genes shuffled therein, which provide convenient shuttling against other cell types (between these bacterial and eukaryotic cells). A variety of vectors are available for shuttle material at the site; appropriate bacterial cells capable of inserting and expressing it can be inserted into Sambrook, Ausubel, and Berger (see all supra))). There are two examples: Shuffled genes can be introduced into bacterial, fungal, or yeast cells, either by integration into chromosomal DNA or as plasmids.

【0158】 細菌、植物、動物、および酵母のシステムは、本発明において好ましい。例え
ば、1つの実施態様においては、シャッフリングされた遺伝子は、産生の目的の
ために植物または動物細胞中に導入され得る(トランスジェニック植物が、産業
的な酵素のますます重要な供給源であることが理解される)か、あるいは治療目
的のために植物または動物細胞中に導入され得る。従って、目的のトランスジー
ンは、本発明の反復的な配列組換え法を使用してインビトロで改変され得、そし
て細菌、真核生物細胞、または全真核生物の生物体中での新規のまたは改善され
た特性についてのインビトロ/インサイチュでの選択のための細胞中に再挿入さ
れ得る。
Bacterial, plant, animal, and yeast systems are preferred in the present invention. For example, in one embodiment, shuffled genes can be introduced into plant or animal cells for production purposes (transgenic plants being an increasingly important source of industrial enzymes). Is understood) or can be introduced into plant or animal cells for therapeutic purposes. Thus, the transgene of interest can be modified in vitro using the repetitive sequence recombination method of the present invention, and be novel or novel in bacterial, eukaryotic cells, or whole eukaryotic organisms. It can be reinserted into cells for in vitro / in situ selection for improved properties.

【0159】 (インビボでのDNAシャッフリング形式) 本発明のいくつかの実施態様においては、DNA基質分子(例えば、野生型の
配列と比較してコドンの改変を含むもの)が、細胞中に導入され、ここで、細胞
性の機構はそれらの組換えを指向する。例えば、変異体のライブラリーが構築さ
れ、そして、本明細書中に記載されている任意の技術によって改善された表現形
を有する変異体についてスクリーニングまたは選択される。
In Vivo DNA Shuffling Format In some embodiments of the present invention, a DNA substrate molecule (eg, containing a codon modification relative to a wild-type sequence) is introduced into a cell. Here, cellular mechanisms direct their recombination. For example, a library of variants is constructed and screened or selected for variants with an improved phenotype by any of the techniques described herein.

【0160】 最良の候補をコードするDNA基質分子は、本明細書中に記載されている任意
の技術によって回収され、次いで、断片化され、そして植物宿主をトランスフェ
クトするために使用され、そして改善された機能についてスクリーニングまたは
選択される。さらなる改良が所望される場合は、DNA基質分子は、例えば、P
CRによって宿主細胞から回収され、そしてこのプロセスが、所望のレベルの改
善が得られるまで繰り返される。いくつかの実施態様においては、フラグメント
は、トランスフェクションの前に変性されそして再アニーリングされ、recA
のような組換えの刺激タンパク質でコーティングされるか、またはNoeRのよ
うな選択可能なマーカーとともに同時トランスフェクトされ得て、目的の遺伝子
の組換えられたバージョンを受容している細胞のポジティブな選択を可能にする
。インビボでのシャッフリングのための方法は、例えば、PCT出願番号第WO
98/13487号、および同第WO97/20078号において記載されてい
る。インビボでのシャッフリングの効率は、宿主細胞中の目的の遺伝子のコピー
数を増大させることによって増強され得る。
The DNA substrate molecule encoding the best candidate can be recovered by any of the techniques described herein, then fragmented and used to transfect a plant host and improved. Screened or selected for the function performed. If further improvement is desired, the DNA substrate molecule may be, for example, P
Recovered from the host cells by CR and the process is repeated until the desired level of improvement is obtained. In some embodiments, the fragment is denatured and re-annealed prior to transfection,
Recombination either coated with stimulated protein such as, or Noe in conjunction with a selectable marker such as R could be co-transfected, positive of cells receiving recombined versions of the gene of interest Enable selection. Methods for shuffling in vivo are described, for example, in PCT Application No. WO
98/13487, and WO 97/20078. The efficiency of shuffling in vivo can be enhanced by increasing the copy number of the gene of interest in the host cell.

【0161】 (全ゲノムのシャッフリング) 1つの実施態様においては、本明細書中の選択方法は、「全ゲノムのシャッフ
リング」形式において利用される。全ゲノムのシャッフリングの多くの形式に対
する広範囲の指針は、del Cardayreらによる、PCT/US99/
15972の、「Evolution of Whole Cells and
Organisms by Recursive Sequence Rec
ombination」と題された、本発明者らおよび彼らの共同研究者らの先
駆的出願において見出される。任意のコドン変更された核酸のセットは、細胞を
形質転換するために使用され得、これは次いで、全ゲノムの形式においてシャッ
フリングされ得る。
Whole Genome Shuffling In one embodiment, the selection methods herein are utilized in a “whole genome shuffling” format. Extensive guidance on many forms of whole genome shuffling can be found in PCT / US99 / by del Cardayre et al.
15972, "Evolution of Whole Cells and
Organisms by Recursive Sequence Rec
Ombination "is found in the pioneering application of the present inventors and their co-workers. Any set of codon-altered nucleic acids can be used to transform cells, which can then be shuffled in a whole genome format.

【0162】 簡潔には、全ゲノムのシャッフリングは、その核酸が所望される特性を付与し
得るかどうかに関して全ての仮定を行わない。その代わりに、完全なゲノム(例
えば、ゲノムのライブラリーに由来するか、または生物体から単離された)が、
細胞中でシャッフリングされ、そして細胞に対して選択プロトコールが適用され
る。これらのゲノムは、コドンを改変された核酸を含む、任意の所望される核酸
のセットでスパイクされ得る。
In brief, shuffling of the whole genome does not make any assumptions about whether the nucleic acid can confer the desired properties. Instead, a complete genome (eg, derived from a library of genomes or isolated from an organism)
The cells are shuffled and a selection protocol is applied to the cells. These genomes can be spiked with any desired set of nucleic acids, including codon-modified nucleic acids.

【0163】 (アッセイ) コドンを改変された核酸の所望される特性の選択についての関連するアッセイ
は、適用に依存する。タンパク質、レセプター、リガンド、細胞などの活性を検
出するための多くのアッセイが公知である。形式は、固定化された成分に対する
結合、細胞または生物体の生存性、レポーター組成物の産生などを含む。
Assays Relevant assays for the selection of the desired properties of the codon-modified nucleic acid will depend on the application. Many assays are known for detecting the activity of proteins, receptors, ligands, cells and the like. Formats include binding to immobilized components, cell or organism viability, production of a reporter composition, and the like.

【0164】 本発明の高スループットアッセイにおいては、1日に数千までの異なるシャッ
フリングされた変異体をスクリーニングすることが可能である。詳細には、マル
チタイタープレートの各ウェルは、別々のアッセイを行うために使用され得るか
、または濃度もしくはインキュベーション時間の影響が観察される場合は、5−
10ウェル毎に、単一の変異体を試験し得る。従って、単一の標準的なマイクロ
タイタープレートは、約100(例えば、96)個の反応をアッセイし得る。1
536ウェルのプレートが使用される場合は、単一のプレートは、約100から
約1500までの異なる反応を容易にアッセイし得る。一日でいくつかの異なる
プレートをアッセイすることが可能である;約6,000から20,000まで
の異なるアッセイ(すなわち、異なる核酸、コードされるタンパク質、濃度など
を含む)のアッセイスクリーニングは、本発明の集約されたシステムを使用する
ことが可能である。より最近には、試薬の操作に対する微量流体(microf
luidic)アプローチが、例えば、Caliper Technologi
es(Mountain View,CA)によって開発されている。
In the high throughput assays of the present invention, it is possible to screen up to thousands of different shuffled variants per day. In particular, each well of the multititer plate can be used to perform a separate assay, or if the effect of concentration or incubation time is observed,
A single mutant can be tested every 10 wells. Thus, a single standard microtiter plate can assay about 100 (eg, 96) reactions. 1
If 536 well plates are used, a single plate can easily assay from about 100 to about 1500 different reactions. It is possible to assay several different plates in a single day; assay screening of about 6,000 to 20,000 different assays (ie including different nucleic acids, encoded proteins, concentrations, etc.) It is possible to use the centralized system of the present invention. More recently, microfluidics (microf) for the manipulation of reagents
luidic) approach is described in, for example, Caliper Technology
es (Mountain View, CA).

【0165】 1つの局面においては、ライブラリーのメンバー(例えば、細胞、ウイルスの
プラーク、胞子など)は、個々のコロニー(またはプラーク)を生じるように、
固形の培地上で分離される。自動化されたコロニー採取装置(例えば、Q−bo
t、Genetix,U.K.)を使用して、コロニーまたはプラークが同定さ
れ、採取され、そして10,000個までの異なる変異体が、2個の3mmガラ
スボール/ウェルを含有する96ウェルのマイクロタイターディッシュ中に接種
される。Q−botは、コロニー全体を採取するのではなく、むしろコロニーの
中心を通してピンを挿入し、そして細胞(または菌糸体)および胞子(またはプ
ラーク適用においてはウイルス)を少量サンプリングして出る。ピンがコロニー
中にある時間、培養培地に接種するディップの数、およびピンがその培地中にあ
る時間は、それぞれ接種物の大きさに影響を与え、そして各々が制御されそして
最適化され得る。Q−botの均一なプロセスは、ヒトの手作業によるエラーを
減少させ、そして培養物を確立させる速度を増大させる(ほぼ、10,000/
4時間)。これらの培養物は、次いで、一定の温度および湿度が制御されたイン
キュベーター中で振盪させられる。マイクロタイタープレート中のガラスボール
は、細胞の均質な通気の形成を促進し、そして発酵装置のはねに類似する菌糸体
のフラグメントの分散を促進するように作用する。目的の培養物に由来するクロ
ーンは、限界希釈によってクローン化され得る。上記にもまた記載されるように
、ライブラリーを構成するプラークまたは細胞はまた、タンパク質の産生のため
に、ハイブリダイゼーション、タンパク質活性、抗体に対するタンパク質の結合
などを検出することのいずれかによって、直接スクリーニングされ得る。
In one aspect, the members of the library (eg, cells, viral plaques, spores, etc.) are transformed into individual colonies (or plaques).
Separated on solid medium. Automated colony harvester (eg, Q-bo
t, Genetix, U.S.A. K. ), Colonies or plaques are identified and picked, and up to 10,000 different mutants are inoculated into a 96-well microtiter dish containing two 3 mm glass balls / well . Q-bot does not pick the entire colony, but rather inserts pins through the center of the colony and samples a small sample of cells (or mycelium) and spores (or virus in plaque applications). The amount of time the pins are in the colony, the number of dips inoculating the culture medium, and the time the pins are in the medium each affect the size of the inoculum, and each can be controlled and optimized. The uniform process of Q-bot reduces human manual errors and increases the rate at which cultures are established (approximately 10,000 /
4 hours). These cultures are then shaken in a constant temperature and humidity controlled incubator. The glass balls in the microtiter plate serve to promote the formation of a homogeneous aeration of the cells and to promote the dispersal of fragments of the mycelium resembling the fermentor splash. Clones from the culture of interest can be cloned by limiting dilution. As also described above, the plaques or cells that make up the library can also be directly used for protein production, either by detecting hybridization, protein activity, binding of the protein to the antibody, etc. Can be screened.

【0166】 シャッフリングされたライブラリーのメンバーの能力における親株を超える微
妙な増大を検出する能力は、アッセイの感度による。改善を有している生物体を
見出す機会は、そのアッセイによってスクリーニングされ得る個々の変異体の数
によって増大させられる。十分な大きさのプールを同定する機会を増大するため
に、処理される変異体の数を増大させる(例えば、10倍まで)予備スクリーニ
ングが使用され得る。最初のスクリーニングの目的は、親の株(単数または複数
)と等しいかまたはそれよりも良好である生成物の力価を有する変異体を迅速に
同定すること、および続く分析のための液体の細胞培養物に対してこれらの変異
体のみを移動させることである。
The ability to detect subtle increases in the capacity of shuffled library members over the parental strain depends on the sensitivity of the assay. The chance of finding an organism that has improvement is increased by the number of individual variants that can be screened by the assay. Preliminary screening can be used to increase the number of mutants treated (eg, up to 10-fold) to increase the chance of identifying a pool of sufficient size. The purpose of the initial screen was to quickly identify variants with a product titer equal to or better than the parent strain (s), and to identify liquid cells for subsequent analysis. The transfer of only these mutants to the culture.

【0167】 多くの周知のロボットによるシステムもまた、アッセイシステムにおいて有用
である溶液相化学について開発されている。これらのシステムは、Takeda
Chemical Industries,LTD.(大阪、日本)によって
開発された自動合成装置、およびロボットアームを利用する多くのロボットシス
テム(Zymate II、Zymark Corporation,Hopk
inton,Mass.;Orca,Hewlett−Packard,Pal
o Alto,Calif.)(これは、科学者によって行われる手作業による
合成操作を模倣する)のような、自動化されたワークステーションを含む。任意
の上記のデバイスが、本発明を用いる使用(例えば、コドンを改変された核酸に
よってコードされる分子の高スループットスクリーニング)に適切である。組み
込まれたシステムを参照して本明細書中で議論されるようにこれらが操作され得
るような、これらのデバイスに対する改変の性質および改良(もしあれば)は、
関連する分野の当業者に明らかである。
[0167] Many well-known robotic systems have also been developed for solution phase chemistry that are useful in assay systems. These systems are based on Takeda
Chemical Industries, LTD. (Symate II, Zymark Corporation, Hopk)
inton, Mass. Orca, Hewlett-Packard, Pal;
o Alto, Calif. ) (Which mimics manual synthesis operations performed by scientists), including automated workstations. Any of the above devices are suitable for use with the invention (eg, high-throughput screening for molecules encoded by codon-modified nucleic acids). The nature and improvement (if any) of these modifications to these devices such that they can be manipulated as discussed herein with reference to the incorporated system,
It will be apparent to those skilled in the relevant arts.

【0168】 高スループットスクリーニングシステムは、市販によって入手可能である(例
えば、Zymark Corp.,Hopkinton,MA;Air Tec
hnical Industries,Mentor,OH;Beckman
Instruments,Inc.Fullerton,CA;Precisi
on Systems,Inc.,Natick,MAなどを参照のこと)。こ
れらのシステムは、代表的には、全てのサンプルおよび試薬のピペッティング、
液体の調剤、時間を計測するインキュベーション、およびアッセイに適切な検出
装置(単数または複数)中でのマイクロプレートの最終的な読み取りを含む、全
体的な手順を自動化する。これらの設定可能なシステムは、可撓性およびカスタ
マイズの高い程度と同様の、高スループットおよび迅速な開始を提供する。
High throughput screening systems are commercially available (eg, Zymark Corp., Hopkinton, Mass .; Air Tec).
hnical Industries, Mentor, OH; Beckman
Instruments, Inc. Fullerton, CA; Precisi
on Systems, Inc. , Natick, MA, etc.). These systems typically include pipetting of all samples and reagents,
Automate the entire procedure, including dispensing the liquid, timing the incubation, and final reading of the microplate in the detection device (s) appropriate for the assay. These configurable systems provide high throughput and quick start-up, as well as a high degree of flexibility and customization.

【0169】 このようなシステムの製造業者は、種々の高スループットの詳細なプロトコー
ルを提供する。従って、例えば、Zymark Corp.は、遺伝子の転写、
リガンドの結合などの変調を検出する為のスクリーニングシステムを記載する技
術的な雑誌を提供する。試薬の操作についての微量流体アプローチもまた、例え
ば、Caliper Technologies(Mountain View
,CA)によって開発されている。
Manufacturers of such systems provide a variety of high-throughput, detailed protocols. Therefore, for example, Zymark Corp. Is the transcription of the gene,
Technical journals are provided that describe screening systems for detecting modulation such as ligand binding. Microfluidic approaches to the manipulation of reagents are also described, for example, in Caliper Technologies (Mountain View).
, CA).

【0170】 カメラまたは他の読み取りデバイス(例えば、フォトダイオード、およびデー
タ保存デバイス)によって可視化される(そして、必要に応じて記録される)光
学的な画像は、必要に応じて、さらに本明細書中の任意の実施態様において、例
えば、画像をデジタル化すること、および/または保存すること、およびコンピ
ューター上で画像を分析することによって、処理される。種々の商業的に入手可
能な周辺機器およびソフトウェアが、デジタル化されたビデオまたはデジタル化
された光学的な画像を、デジタル化、保存、および分析するために利用可能であ
る(例えば、PC(Intel x86またはpentium chip−互換
性DOS(登録商標)、OS2(登録商標)、WINDOWS(登録商標)、W
INDOWS NT(登録商標)、またはWINDOWS 95(登録商標)に
基づく機器)、MACINTOSH(登録商標)もしくはUNIX(登録商標) に基づく(例えば、SUN(登録商標)ワークステーション)コンピューターを 使用する)。
The optical images visualized (and optionally recorded) by cameras or other reading devices (eg, photodiodes and data storage devices) are further described herein as appropriate. In any of the embodiments described herein, the image is processed, for example, by digitizing and / or storing the image, and analyzing the image on a computer. A variety of commercially available peripherals and software are available for digitizing, storing, and analyzing digitized video or digitized optical images (e.g., PC (Intel) x86 or pentium chip-compatible DOS (R), OS2 (R), WINDOWS (R), W
Devices based on INDOW NT® or WINDOWS 95®), MACINTOSH® or UNIX® (eg using a SUN® workstation) computer).

【0171】 1つの従来のシステムは、当該分野での一般的な使用において、冷却された充
電結合デバイス(CCD)カメラに対するアッセイデバイスによる光を有する。
CCDカメラは、写真エレメント(画素)の並びを含む。検体からの光は、CC
D上で画像化される。検体の領域(例えば、生物学的なポリマーの並び上の個々
のハイブリダイゼーション部位)に対応する特定の画素が、各位置についての光
の強度の読み取りを得るためにサンプリングされる。複数の画素が、速度を増大
させるために並行して処理される。本発明の装置および方法は、任意のサンプル
を、例えば、蛍光または暗視顕微鏡技術によって、可視化するために容易に使用
される。
One conventional system, in typical use in the art, has light from an assay device to a cooled charge-coupled device (CCD) camera.
A CCD camera includes an array of photographic elements (pixels). The light from the specimen is CC
It is imaged on D. Particular pixels corresponding to regions of the analyte (eg, individual hybridization sites on a row of biological polymers) are sampled to obtain a light intensity reading for each location. Multiple pixels are processed in parallel to increase speed. The devices and methods of the present invention are readily used to visualize any sample, for example, by fluorescence or night vision microscopy techniques.

【0172】 コドンを改変された核酸に対応する文字のストリングを操作するためのソフト
ウェアエレメントは、コドンを改変された核酸のシャッフリングに関連するオリ
ゴヌクレオチドの合成を指向するために使用され得る。これらおよび他の有用な
特徴を含むし集められたシステム(例えば、高スループットの液体コントロール
ソフトウェア、画像分析ソフトウェア、データ解読ソフトウェア、デジタルコン
ピュータに作動可能に連結された目的地に対して供給源から溶液を輸送するため
のロボット流体制御電機子、ロボット流体制御電機子による高スループットの流
体の移動を制御するためのデジタルコンピューターにデータを入力するための入
力デバイス(例えば、コンピューターのキーボード)、標識されたアッセイの構
成要素からの標識シグナルをデジタル化するための画像のスキャナーなどは、本
発明の特徴である。
Software elements for manipulating strings of characters corresponding to codon-modified nucleic acids can be used to direct the synthesis of oligonucleotides involved in shuffling of codon-modified nucleic acids. Aggregated systems containing these and other useful features (eg, high-throughput liquid control software, image analysis software, data decoding software, solutions from a source to a destination operably linked to a digital computer) Robotic fluid control armature for transporting, labeled input device (eg, computer keyboard) for inputting data to a digital computer for controlling high-throughput fluid movement by the robotic fluid control armature Image scanners and the like for digitizing the labeled signal from the components of the assay are features of the present invention.

【0173】 1つの局面においては、本発明は、少なくとも2つの人工的なホモログである
コドン変更された核酸配列のストリングを有するデータベースを含むコンピュー
ターまたはコンピューターで読み取り可能な媒体およびユーザーがデータベース
中の少なくとも1つの配列のストリングを選択的に見ることを可能にするユーザ
ーインターフェースを含む、集約されたシステムを提供する。全体を通して議論
されるように、配列をアラインメントし、そして操作するための種々の配列デー
タベースプログラムが存在する。さらに、標準的な教科書的な操作ソフトウェア
(例えば、言語処理ソフトウェア(例えば、Microsoft Word(登
録商標)またはCorel Wordperfect(登録商標)))およびデ
ータベースソフトウェア(例えば、Microsoft Excel(登録商標
)、Corel Quattro Pro(登録商標)のような表計算プログラ
ムソフトウェア)、またはデータベースソフトウェア(例えば、Microso
ft Access(登録商標)またはParadox(登録商標))が、文字
のストリングを操作するために、ユーザーインターフェース(例えば、Wind
ows、Mcintosh、またはLINUXシステムのような、標準的な操作
システムにおけるGUI)と組み合わせて使用され得る。BLASTのような特
殊化されたアラインメントプログラムもまた、コドン変更された核酸(または対
応する特徴鎖)のアラインメントのために、本発明のシステムにおいて取りこま
れ得る。
In one aspect, the present invention relates to a computer or computer readable medium comprising a database having a string of codon-altered nucleic acid sequences that is at least two artificial homologs, and wherein the user has at least An integrated system is provided that includes a user interface that allows selective viewing of a single array of strings. As discussed throughout, various sequence database programs exist for aligning and manipulating sequences. Additionally, standard textbook operating software (eg, language processing software (eg, Microsoft Word® or Corel Wordperfect®)) and database software (eg, Microsoft Excel®, Corel Quattro Pro) (A spreadsheet program software such as a registered trademark) or database software (for example, Microsoft)
ft Access (registered trademark) or Paradox (registered trademark) operates a user interface (for example, Wind) in order to operate a string of characters.
It can be used in combination with a GUI in a standard operating system, such as an ows, Macintosh, or LINUX system. Specialized alignment programs, such as BLAST, can also be incorporated in the system of the invention for alignment of codon-altered nucleic acids (or corresponding feature strands).

【0174】 上記の集約されたシステムに加えて、集約されたシステムはまた、コンピュー
ターまたはコンピューターによって読み取りが可能な媒体に作動可能に連結され
た自動化されたオリゴヌクレオチド合成装置を含み得る。代表的には、合成装置
は、少なくとも2個の人工的な相同のコドンを改変された核酸の1つ以上の1つ
以上のサブ配列を含む1つ以上のオリゴヌクレオチドを合成するようにプログラ
ムされる。
In addition to the integrated system described above, the integrated system can also include an automated oligonucleotide synthesizer operably linked to a computer or a computer-readable medium. Typically, the synthesizer is programmed to synthesize one or more oligonucleotides comprising one or more subsequences of at least two artificially homologous codon modified nucleic acids. You.

【0175】 改変は、請求されるような本発明の精神または範囲を逸脱することなく本明細
書中に上記に記載されるような方法および材料に対して行われ得、そして本発明
は、以下を含む多数の種々の用途に対して利用され得る。
Modifications may be made to the methods and materials as described herein above without departing from the spirit or scope of the invention as claimed, and the invention comprises Can be utilized for a number of different applications, including:

【0176】 反復的なプロセス中に含まれるシャッフリングされたコドンを改変されたDN
ADNAを試験するための集約されたシステムの使用。
[0176] Shuffled codons involved in an iterative process have been modified by DN
Use of the integrated system for testing ADNA.

【0177】 選択戦略、材料、構成要素、方法、または基質の任意の1つの使用を利用する
アッセイ、キット、またはシステムが、本明細書中で上記に記載されている。キ
ットは必要に応じて、さらに、方法またはアッセイを行うため、材料をパッケー
ジングするため、アッセイ、デバイス、またはシステムの構成要素などを含む1
つ以上の容器を含む。
Assays, kits, or systems that utilize the use of any one of the selection strategies, materials, components, methods, or substrates have been described herein above. The kit optionally further comprises components of an assay, device, or system, such as for performing a method or assay, packaging materials, and the like.
Includes one or more containers.

【0178】 さらなる局面においては、本発明は、本明細書中の方法および装置を使用する
キットを提供する。本発明のキットは、必要に応じて、1つ以上の以下のものを
含む:(1)本明細書中に記載されているような、シャッフリングされたコドン
を改変された構成要素;(2)本明細書中に記載されている方法を実施するため
および/または本明細書中に記載されている選択手順を操作するための説明書;
(3)1つ以上のアッセイ成分;(4)核酸または酵素、他の核酸、トランスジ
ェニック植物、動物、細胞などを保持するための容器、(5)パッケージング材
料、ならびに(6)1つ以上のコドンを改変された核酸の文字ストリングに対応
する配列を含む、コンピューターで読み取り可能な媒体中に固定されたソフトウ
ェア。
In a further aspect, the present invention provides kits using the methods and devices herein. The kits of the invention optionally include one or more of the following: (1) shuffled codon-modified components as described herein; (2) Instructions for performing the methods described herein and / or for operating the selection procedures described herein;
(3) one or more assay components; (4) containers for holding nucleic acids or enzymes, other nucleic acids, transgenic plants, animals, cells, etc., (5) packaging materials, and (6) one or more The software immobilized in a computer-readable medium comprising a sequence corresponding to a character string of a nucleic acid in which the codons have been modified.

【0179】 さらなる局面においては、本発明は、本明細書中の任意の方法もしくはアッセ
イの実施のため、および/または本明細書中の任意のアッセイもしくは方法を実
行するための任意の装置もしくはキットの使用のために、本明細書中の任意の構
成要素またはキットの使用を提供する。
In a further aspect, the invention relates to any device or kit for performing any of the methods or assays herein and / or for performing any of the assays or methods herein. Provided is the use of any of the components or kits herein for use.

【0180】 上記の発明は、明確性および理解の目的のために、いくらか詳細に記載されて
いるが、形態および詳細における種々の変更が、本発明の真の範囲を逸脱するこ
となく行われ得ることが、この開示を参照して当業者に明らかである。例えば、
上記に記載されている全ての技術および材料は、種々の組み合わせて使用され得
る。本出願において援用されている全ての刊行物および特許文献は、まるで個々
の刊行物または特許文献が個々に示されているかのように、同じ程度に、すべて
の目的についてそれらの全体において参考として援用されている。
Although the above invention has been described in some detail for purposes of clarity and understanding, various changes in form and detail may be made without departing from the true scope of the invention. Will be apparent to those of skill in the art in light of this disclosure. For example,
All the techniques and materials described above can be used in various combinations. All publications and patent documents cited in this application are incorporated by reference in their entirety for all purposes and to the same extent as if each individual publication or patent document was individually listed. Have been.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 図1は、ヒトのEPO遺伝子に類似である、サルのEPO遺伝子の一部の核酸
/アミノ酸配列である。
FIG. 1 is the nucleic acid / amino acid sequence of a portion of the monkey EPO gene, similar to the human EPO gene.

【図2】 図2は、コドン変更されたEPO核酸配列の例を示す。FIG. 2 shows an example of a codon altered EPO nucleic acid sequence.

【図3】 図3は、天然に存在するEPOのアラインメントを示す。FIG. 3 shows an alignment of naturally occurring EPO.

【図4】 図4は、ヒトのEPOのゆらぎ配列空間の模式図である。FIG. 4 is a schematic diagram of a fluctuation sequence space of human EPO.

【図5】 図5は、哺乳動物のEPOファミリーのゆらぎ配列空間の模式図である。FIG. 5 is a schematic diagram of a fluctuation sequence space of a mammalian EPO family.

【図6】 図6は、種の情報との、G−CSFホモログの配列アラインメントである。FIG. 6 is a sequence alignment of G-CSF homologs with species information.

【図7】 図7は、G−CSFホモログの配列アラインメントであり、差異を抜き出した
FIG. 7 is a sequence alignment of the G-CSF homolog, and differences were extracted.

【図8】 図8は、ヒトのG−CSF(黒くした)の疎水性コア残基を示す配列アライン
メントである。
FIG. 8 is a sequence alignment showing the hydrophobic core residues of human G-CSF (darkened).

【図9】 図9は、G−CSFのシャッフリング戦略を示す模式図である。FIG. 9 is a schematic diagram showing a shuffling strategy of G-CSF.

【図10】 図10は、コドン変更されたアルカリホスファターゼを作製するために使用し
たオリゴのリストである。
FIG. 10 is a list of oligos used to generate codon-altered alkaline phosphatase.

【図11】 図11は、コドン変更されたアルカリホスファターゼを作製するために使用し
たオリゴのマップである。
FIG. 11 is a map of the oligos used to generate codon-altered alkaline phosphatase.

【図12】 図12は、進化的に欠損したウイルスでのワクチン接種の模式図である。FIG. 12 is a schematic of vaccination with an evolutionarily defective virus.

【図13】 図13は、ser、arg、およびleuについての種々のコドン型から生じ
る、種々の変異の模式図である。
FIG. 13 is a schematic representation of various mutations resulting from various codon types for ser, arg, and leu.

【図14】 図14は、進化的に欠損したウイルスでのワクチン接種の模式図である。FIG. 14 is a schematic of vaccination with an evolutionarily defective virus.

【図15】 図15は、複雑化された「変異クラウド」に対する非複雑化「変異クラウド」
を示す、進化的に欠損したウイルスでのワクチン接種の模式図である。
FIG. 15 shows an uncomplexed “mutant cloud” versus a complex “mutant cloud”.
FIG. 1 is a schematic diagram of vaccination with an evolutionarily defective virus.

【図16】 図16、パネルA−Cは、ser、arg、およびleuについての種々のコ
ドンの単一の変異の結果を示す。
FIG. 16, Panels AC show the results of a single mutation of various codons for ser, arg, and leu.

【図17】 図17は、拡大された変異スペクトルを有する、タンパク質の進化の模式図で
ある。
FIG. 17 is a schematic representation of the evolution of a protein with an expanded mutation spectrum.

【図18A1】 図18、パネルAは、Envのコドン変更された形態を示す。FIG. 18, Panel A shows a codon modified form of Env.

【図18A2】 図18、パネルAは、Envのコドン変更された形態を示す。FIG. 18, Panel A shows a codon modified form of Env.

【図18B】 図18、パネルBは、Envのコドン変更された形態を示す。FIG. 18, Panel B shows a codon modified form of Env.

【図18C1】 図18、パネルCは、Envのコドン変更された形態を示す。FIG. 18, panel C shows a codon modified form of Env.

【図18C2】 図18、パネルCは、Envのコドン変更された形態を示す。FIG. 18, panel C shows a codon modified form of Env.

【図18C3】 図18、パネルCは、Envのコドン変更された形態を示す。FIG. 18, Panel C shows a codon modified form of Env.

【図18D1】 図18、パネルDは、Envのコドン変更された形態を示す。FIG. 18, Panel D shows a codon-modified form of Env.

【図18D2】 図18、パネルDは、Envのコドン変更された形態を示す。FIG. 18, Panel D shows a codon modified form of Env.

【図19A】 図19Aは、HIV Envの合成についての1つの適用におけるオリゴのリ
ストである。
FIG. 19A is a list of oligos in one application for the synthesis of HIV Env.

【図19B】 図19Bは、HIV Envの合成についての1つの適用におけるオリゴのリ
ストである。
FIG. 19B is a listing of oligos in one application for the synthesis of HIV Env.

───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 60/118,813 (32)優先日 平成11年2月5日(1999.2.5) (33)優先権主張国 米国(US) (31)優先権主張番号 60/141,049 (32)優先日 平成11年6月24日(1999.6.24) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C U,CZ,DE,DK,EE,ES,FI,GB,GD ,GE,GH,GM,HR,HU,ID,IL,IN, IS,JP,KE,KG,KP,KR,KZ,LC,L K,LR,LS,LT,LU,LV,MD,MG,MK ,MN,MW,MX,NO,NZ,PL,PT,RO, RU,SD,SE,SG,SI,SK,SL,TJ,T M,TR,TT,UA,UG,US,UZ,VN,YU ,ZA,ZW (72)発明者 ステマー, ウィレム ピー. シー. アメリカ合衆国 カリフォルニア 95030, ロス ガトス, キャシー コート 108 Fターム(参考) 4B024 AA20 BA11 BA21 BA30 BA32 BA35 CA06 DA02 DA06 EA02 GA11 HA01 HA11 4B065 AA26X AA95X AA95Y AA96X AA96Y AB01 BA02 CA24 CA27 CA44 CA45 CA46 ──────────────────────────────────────────────────続 き Continued on the front page (31) Priority claim number 60 / 118,813 (32) Priority date February 5, 1999 (1999.2.5) (33) Priority claim country United States (US) ( 31) Priority claim number 60 / 141,049 (32) Priority date June 24, 1999 (June 24, 1999) (33) Priority claim country United States (US) (81) Designated country EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE), OA (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, GM, KE, LS, MW, SD, SL, SZ, TZ, UG, ZW), EA (AM, AZ) , BY, KG, KZ, MD, RU , TJ, TM), AE, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CU, CZ, DE, DK, EE, ES, FI, GB , GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MD, MD, MG, MK, MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, UA, UG, US, UZ , VN, YU, ZA, ZW (72) Inventor Stemmer, Willem P .; C. United States California 95030, Los Gatos, Cathy Court 108 F Term (Reference) 4B024 AA20 BA11 BA21 BA30 BA32 BA35 CA06 DA02 DA06 EA02 GA11 HA01 HA11 4B065 AA26X AA95X AA95Y AA96X AA96Y AB01 BA02 CA24 CA27 CA44 CA45 CA46

Claims (51)

【特許請求の範囲】[Claims] 【請求項1】 以下の工程を包含する、コドン変更された核酸を作製する方
法: (i)第1の核酸配列を提供する工程であって、該核酸配列が、第1のポリペ
プチド配列をコードする、工程; (ii)複数のコドン変更された核酸配列を提供する工程であって、これらの
各々が該第1のポリペプチドまたはその改変された形態をコードする、工程;お
よび (iii)標的のコドン変更された核酸を産生するために、該複数のコドン変
更された核酸配列を組換える工程であって、該標的のコドン変更された核酸は第
2のタンパク質をコードする、工程。
1. A method for producing a codon-modified nucleic acid comprising the steps of: (i) providing a first nucleic acid sequence, wherein the nucleic acid sequence comprises a first polypeptide sequence; (Ii) providing a plurality of codon-altered nucleic acid sequences, each of which encodes the first polypeptide or an altered form thereof; and (iii) Recombining the plurality of codon-altered nucleic acid sequences to produce a target codon-altered nucleic acid, wherein the target codon-altered nucleic acid encodes a second protein.
【請求項2】 前記複数のコドン変更された核酸配列の少なくとも1つが、
ストリンジェントなハイブリダイゼーション条件下では前記第1の核酸にはハイ
ブリダイズしない、請求項1に記載の方法。
2. The method of claim 2, wherein at least one of said plurality of codon-altered nucleic acid sequences comprises:
The method of claim 1, wherein the method does not hybridize to the first nucleic acid under stringent hybridization conditions.
【請求項3】 前記第1の核酸、またはその実質的に同一の変異体からなる
サブ配列を含む核酸を、前記複数のコドン変更された核酸の1つ以上、または標
的のコドン変更された核酸とシャッフリングする工程をさらに包含する、請求項
1に記載の方法。
3. The method of claim 1, wherein the first nucleic acid, or a nucleic acid comprising a subsequence comprising a substantially identical variant thereof, comprises one or more of the plurality of codon-modified nucleic acids or a target codon-modified nucleic acid. The method of claim 1, further comprising the step of shuffling with:
【請求項4】 以下の工程をさらに包含する、請求項1に記載の方法: (iv)構造的または機能的特性について前記第2のタンパク質をスクリーニ
ングする工程。
4. The method of claim 1, further comprising: (iv) screening said second protein for structural or functional properties.
【請求項5】 以下の工程をさらに包含する、請求項1に記載の方法: (iv)構造的または機能的特性について前記第2のタンパク質をスクリーニ
ングする工程、および (v)前記第1のタンパク質の構造的または機能的特性に対して前記第2のタ
ンパク質の構造的または機能的特性を比較する工程。
5. The method of claim 1, further comprising: (iv) screening said second protein for structural or functional properties; and (v) said first protein. Comparing the structural or functional properties of the second protein to the structural or functional properties of the second protein.
【請求項6】 前記第2のポリペプチドが、前記第1のポリペプチドと等価
であるかまたはそれよりも優れた構造的または機能的特性を有する、請求項1に
記載の方法。
6. The method of claim 1, wherein said second polypeptide has structural or functional properties that are equivalent to or better than said first polypeptide.
【請求項7】 前記第1および第2のポリペプチドが相同である、請求項1
に記載の方法。
7. The method of claim 1, wherein said first and second polypeptides are homologous.
The method described in.
【請求項8】 前記複数のコドン変更された核酸が、コドン変更された核酸
のライブラリーを含む、請求項1に記載の方法。
8. The method of claim 1, wherein said plurality of codon-altered nucleic acids comprises a library of codon-altered nucleic acids.
【請求項9】 前記複数のコドン変更された核酸が、コドン変更された保存
的に改変された核酸のライブラリーを含む、請求項1に記載の方法。
9. The method of claim 1, wherein said plurality of codon-altered nucleic acids comprises a library of codon-altered conservatively modified nucleic acids.
【請求項10】 請求項9に記載の方法によって産生された、コドン変更さ
れた保存的に改変された核酸のライブラリー。
10. A library of codon-altered conservatively modified nucleic acids produced by the method of claim 9.
【請求項11】 前記複数のコドン変更された核酸が、コドン変更された非
保存的に改変された核酸のライブラリーを含む、請求項1に記載の方法。
11. The method of claim 1, wherein the plurality of codon-altered nucleic acids comprises a library of codon-altered non-conservatively modified nucleic acids.
【請求項12】 請求項11に記載の方法によって産生された、コドン変更
された保存的に改変された核酸のライブラリー。
12. A library of codon-altered conservatively modified nucleic acids produced by the method of claim 11.
【請求項13】 前記複数のコドン変更された核酸が、第1の核酸の複数の
形態から誘導される、請求項1に記載の方法。
13. The method of claim 1, wherein said plurality of codon-altered nucleic acids is derived from a plurality of forms of a first nucleic acid.
【請求項14】 前記複数のコドン変更された核酸配列が、少なくとも3個
のコドン変更された核酸を含む、請求項1に記載の方法。
14. The method of claim 1, wherein said plurality of codon-altered nucleic acid sequences comprises at least three codon-altered nucleic acids.
【請求項15】 前記複数のコドン変更された核酸配列が、以下の構造的な
特徴の1つ以上を含む、請求項1に記載の方法: (a)前記第1の核酸と比較した場合に、該コドン変更された核酸の各々につ
いて、50%以上コドン使用の相違; (b)前記第1の核酸と比較した場合に、該コドン変更された核酸の各々につ
いて、75%以上コドン使用の相違; (c)前記第1の核酸と比較した場合に、該コドン変更された核酸の各々につ
いて、90%以上コドン使用の相違; (d)前記第1の核酸と比較した場合に、該コドン変更された核酸の各々につ
いて最大のコドン使用の相違; (e)前記第1の核酸と比較した場合に、該コドン変更された核酸の各々にお
いての重複しない非保存的置換; (f)1つ以上の該コドン変更された核酸と前記第1の核酸との間での高スト
リンジェンシーのハイブリダイゼーションの欠如;および (g)前記第1のポリペプチドと比較した場合に、コードされるポリペプチド
についての1つ以上の異なる疎水性コア残基を提供するための、該コドン変更さ
れた核酸の1つ以上のコドンの改変。
15. The method of claim 1, wherein the plurality of codon-altered nucleic acid sequences comprises one or more of the following structural features: (a) when compared to the first nucleic acid. 50% or more difference in codon usage for each of the codon-modified nucleic acids; (b) 75% or more difference in codon usage for each of the codon-modified nucleic acids when compared to the first nucleic acid. (C) a difference in codon usage of at least 90% for each of the codon-changed nucleic acids when compared to the first nucleic acid; (d) a codon change when compared to the first nucleic acid A difference in maximum codon usage for each of the modified nucleic acids; (e) non-overlapping non-conservative substitutions in each of the codon-modified nucleic acids when compared to the first nucleic acid; (f) one or more The codon-modified nucleic acid and A lack of high stringency hybridization with said first nucleic acid; and (g) one or more different hydrophobic cores for the encoded polypeptide when compared to said first polypeptide. Altering one or more codons of the codon altered nucleic acid to provide residues.
【請求項16】 前記第2のタンパク質と前記第1のタンパク質との間での
パーセント同一性が、前記複数のコドン変更された核酸の2つの間でのパーセン
ト同一性よりも低い、請求項1に記載の方法。
16. The method according to claim 1, wherein the percent identity between the second protein and the first protein is less than the percent identity between two of the plurality of codon-modified nucleic acids. The method described in.
【請求項17】 前記第1の核酸が、以下から選択されるタンパク質をコー
ドする、請求項1に記載の方法:EPO、G−CSF、ウイルスエンベロープタ
ンパク質、サイトカイン、およびホスファターゼ。
17. The method of claim 1, wherein said first nucleic acid encodes a protein selected from: EPO, G-CSF, viral envelope protein, cytokine, and phosphatase.
【請求項18】 前記第1の核酸配列またはコドン変更された核酸配列が、
単離された核酸である、請求項1に記載の方法。
18. The method according to claim 18, wherein the first nucleic acid sequence or the codon-modified nucleic acid sequence is
2. The method of claim 1, wherein the method is an isolated nucleic acid.
【請求項19】 請求項1に記載の方法によって産生された、標的のコドン
変更された核酸。
19. A target codon-altered nucleic acid produced by the method of claim 1.
【請求項20】 前記第1の核酸配列または前記コドン変更された核酸配列
が、細胞中に存在する核酸である、請求項1に記載の方法。
20. The method of claim 1, wherein said first nucleic acid sequence or said codon altered nucleic acid sequence is a nucleic acid present in a cell.
【請求項21】 請求項20に記載の方法によって産生された、細胞。21. A cell produced by the method of claim 20. 【請求項22】 前記コドン変更された核酸配列の各々が、前記第1の核酸
と比較した場合に、少なくとも2つのヌクレオチドの差異を含む、請求項1に記
載の方法。
22. The method of claim 1, wherein each of said codon-altered nucleic acid sequences comprises a difference of at least two nucleotides when compared to said first nucleic acid.
【請求項23】 細胞中、あるいはベクターまたはウイルス中に標的のコド
ン変更された核酸を導入する工程をさらに包含する、請求項1に記載の方法。
23. The method of claim 1, further comprising introducing the target codon-altered nucleic acid into a cell or into a vector or virus.
【請求項24】 請求項23に記載の方法によって産生された、細胞、ベク
ター、またはウイルス。
24. A cell, vector, or virus produced by the method of claim 23.
【請求項25】 前記標的のコドン変更された核酸が、弱毒化されたウイル
スを産生するためにウイルスゲノムの一部と組換えられる、請求項1に記載の方
法。
25. The method of claim 1, wherein the target codon-altered nucleic acid is recombined with a portion of a viral genome to produce an attenuated virus.
【請求項26】 請求項25に記載の方法によって産生された、弱毒化され
たウイルス。
26. An attenuated virus produced by the method of claim 25.
【請求項27】 前記標的のコドン変更された核酸が、弱毒化されたウイル
スを産生するためにウイルスゲノムの一部と組換えられる、請求項1に記載の方
法であって、ここで、該弱毒化されたウイルスが、哺乳動物におけるウイルスに
よる感染の際に免疫応答を生じる、方法。
27. The method of claim 1, wherein said target codon-altered nucleic acid is recombined with a portion of a viral genome to produce an attenuated virus. The method wherein the attenuated virus produces an immune response upon infection by the virus in a mammal.
【請求項28】 請求項27に記載の方法によって産生された、弱毒化され
たウイルス。
28. An attenuated virus produced by the method of claim 27.
【請求項29】 前記標的のコドン変更された核酸が、弱毒化されたレトロ
ウイルスを産生するためにレトロウイルスゲノムの一部と組換えられる、請求項
1に記載の方法であって、ここで、該弱毒化されたレトロウイルスが、哺乳動物
におけるレトロウイルスによる感染の際に免疫応答を生じる、方法。
29. The method of claim 1, wherein the target codon-altered nucleic acid is recombined with a portion of a retroviral genome to produce an attenuated retrovirus. The method wherein the attenuated retrovirus produces an immune response upon infection by the retrovirus in a mammal.
【請求項30】 請求項29に記載の方法によって産生された、弱毒化され
たレトロウイルス。
30. An attenuated retrovirus produced by the method of claim 29.
【請求項31】 前記標的のコドン変更された核酸が、ウイルスベクターを
産生するためにウイルスゲノムの一部と組換えられる、請求項1に記載の方法。
31. The method of claim 1, wherein the target codon-altered nucleic acid is recombined with a portion of a viral genome to produce a viral vector.
【請求項32】 請求項31に記載の方法によって産生された、ウイルスベ
クター。
32. A viral vector produced by the method of claim 31.
【請求項33】 前記標的のコドン変更された核酸が、ウイルスベクターを
産生するためにウイルスゲノムの一部と組換えられ、ここで、該ベクターは、複
製のためにトランス相補を必要とし、そしてここで該ベクターは、該標的のコド
ン変更された核酸に対応するサブ配列を欠失している対応するウイルスベクター
と比較した場合に、複製型への減少した復帰速度を有する、請求項1に記載の方
法。
33. The target codon-altered nucleic acid is recombined with a portion of a viral genome to produce a viral vector, wherein the vector requires transcomplementation for replication, and Wherein the vector has a reduced rate of reversion to its replicated form when compared to the corresponding viral vector lacking a subsequence corresponding to the target codon altered nucleic acid. The described method.
【請求項34】 請求項33に記載の方法によって産生された、ウイルスベ
クター。
34. A viral vector produced by the method of claim 33.
【請求項35】 前記ベクターが、以下の1つ以上に由来するウイルスエレ
メントを含む、請求項33に記載の方法:レンチウイルス、アデノウイルス、ヘ
ルペスウイルス、およびアデノ随伴ウイルス。
35. The method of claim 33, wherein said vector comprises viral elements from one or more of the following: lentivirus, adenovirus, herpes virus, and adeno-associated virus.
【請求項36】 以下の工程を包含する、コドン変更された核酸のライブラ
リーを作製する方法: (i)第1の核酸配列を選択する工程であって、ここで該核酸配列は、第1の
ポリペプチド配列をコードする、工程;および (ii)複数のコドン変更された核酸配列を作製する工程であって、これらの
各々は、該第1のポリペプチドまたはその改変された形態をコードし、ここで、
該複数のコドン変更された核酸は、ライブラリーを包含する、工程。
36. A method for producing a library of codon-altered nucleic acids, comprising the steps of: (i) selecting a first nucleic acid sequence, wherein said nucleic acid sequence comprises a first nucleic acid sequence; And (ii) producing a plurality of codon-altered nucleic acid sequences, each of which encodes the first polypeptide or an altered form thereof. ,here,
The plurality of codon-altered nucleic acids comprises a library.
【請求項37】 請求項36に記載の方法によって作製された、コドン変更
されたライブラリー。
37. A codon-altered library produced by the method of claim 36.
【請求項38】 前記ライブラリーが、少なくとも2個のコドン変更された
核酸を含む、請求項37に記載のライブラリー。
38. The library of claim 37, wherein said library comprises at least two codon-altered nucleic acids.
【請求項39】 前記ライブラリーが、少なくとも5個のコドン変更された
核酸を含む、請求項37に記載のライブラリー。
39. The library of claim 37, wherein said library comprises at least 5 codon-altered nucleic acids.
【請求項40】 前記ライブラリーが、少なくとも10個のコドン変更され
た核酸を含む、請求項37に記載のライブラリー。
40. The library of claim 37, wherein said library comprises at least 10 codon-altered nucleic acids.
【請求項41】 前記ライブラリーが、少なくとも100個のコドン変更さ
れた核酸を含む、請求項37に記載のライブラリー。
41. The library of claim 37, wherein said library comprises at least 100 codon-modified nucleic acids.
【請求項42】 請求項25に記載のライブラリー、ならびに容器、および
該ライブラリーの2個以上のメンバーの組換えのための方法工程の説明書を提供
する説明材料の1つ以上を含む、キット。
42. The library of claim 25, comprising one or more of the containers, and explanatory material providing instructions for the method steps for recombination of two or more members of the library. kit.
【請求項43】 シャッフリングされたコドン変更されたライブラリーを産
生するために、前記複数のコドン変更された核酸を組換える工程をさらに包含す
る、請求項41に記載の方法。
43. The method of claim 41, further comprising recombining said plurality of codon-altered nucleic acids to produce a shuffled codon-altered library.
【請求項44】 請求項43に記載の方法によって作製された、コドン変更
されたライブラリー。
44. A codon-altered library produced by the method of claim 43.
【請求項45】 前記核酸が、EPO、サイトカイン、ホスファターゼ、お
よびウイルスエンベロープタンパク質から選択されるタンパク質をコードする、
請求項36に記載の方法。
45. The nucleic acid encodes a protein selected from EPO, cytokines, phosphatases, and viral envelope proteins.
37. The method of claim 36.
【請求項46】 各々が、第1のポリペプチドまたはその改変された形態を
コードする、複数のコドン変更された核酸を含む組成物。
46. A composition comprising a plurality of codon-altered nucleic acids each encoding a first polypeptide or an altered form thereof.
【請求項47】 複数の相同核酸に由来する複数のコドン変更された核酸を
含む、コドン変更された核酸のライブラリー。
47. A library of codon-altered nucleic acids comprising a plurality of codon-altered nucleic acids from a plurality of homologous nucleic acids.
【請求項48】 前記複数のコドン変更された核酸が、前記複数の相同核酸
と比較して増大した速度でインビトロで組換えられる、請求項47に記載のライ
ブラリー。
48. The library of claim 47, wherein said plurality of codon-altered nucleic acids are recombined in vitro at an increased rate as compared to said plurality of homologous nucleic acids.
【請求項49】 前記複数のコドン変更された核酸中での同一性のレベルが
、前記複数の相同核酸によってコードされる複数のポリペプチド中での同一性の
レベルと少なくとも同じ高さである、請求項47に記載のライブラリー。
49. The level of identity in the plurality of codon-altered nucleic acids is at least as high as the level of identity in the plurality of polypeptides encoded by the plurality of homologous nucleic acids. A library according to claim 47.
【請求項50】 少なくとも2個の人工的な相同なコドン変更された核酸配
列ストリングを有するデータベースを含む、コンピューター、またはコンピュー
タによって読み取りが可能な媒体、ならびにデータベース中の1つ以上の配列ス
トリングを利用者が選択的に見ることを可能にするユーザーインターフェースを
含む、一体型システム。
50. Utilizing a computer, or a computer-readable medium, including a database having at least two artificially homologous codon-altered nucleic acid sequence strings, and utilizing one or more sequence strings in the database. An integrated system that includes a user interface that allows a person to selectively view.
【請求項51】 コンピューターまたはコンピューターによって読み取りが
可能な媒体に作動可能に連結された自動化されたオリゴヌクレオチド合成装置を
さらに含む、請求項50に記載の一体型のシステムであって、該合成装置が、1
つ以上のオリゴヌクレオチドを合成するようにプログラムされ、ここで該オリゴ
ヌクレオチドが、少なくとも2個の人工的な相同なコドン変更された核酸の1つ
以上の、1つ以上のサブ配列を含む、システム。
51. The integrated system of claim 50, further comprising an automated oligonucleotide synthesizer operably linked to the computer or a computer-readable medium. , 1
A system programmed to synthesize one or more oligonucleotides, wherein the oligonucleotides comprise one or more subsequences of one or more of at least two artificially homologous codon-modified nucleic acids. .
JP2000572353A 1998-09-29 1999-09-28 Shuffling of codon-modified genes Withdrawn JP2002537758A (en)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US10236298P 1998-09-29 1998-09-29
US11772999P 1999-01-29 1999-01-29
US11881399P 1999-02-05 1999-02-05
US14104999P 1999-06-24 1999-06-24
US60/117,729 1999-06-24
US60/102,362 1999-06-24
PCT/US1999/022588 WO2000018906A2 (en) 1998-09-29 1999-09-28 Shuffling of codon altered genes
US60/118,813 1999-10-12
US60/141,049 1999-10-12

Publications (1)

Publication Number Publication Date
JP2002537758A true JP2002537758A (en) 2002-11-12

Family

ID=27493256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000572353A Withdrawn JP2002537758A (en) 1998-09-29 1999-09-28 Shuffling of codon-modified genes

Country Status (7)

Country Link
EP (1) EP1117777A2 (en)
JP (1) JP2002537758A (en)
KR (1) KR20010085850A (en)
AU (1) AU1199000A (en)
CA (1) CA2331335A1 (en)
IL (1) IL140441A0 (en)
WO (1) WO2000018906A2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140076513A (en) * 2012-12-11 2014-06-20 연세대학교 산학협력단 Method of synthesis of gene library using codon randomization and mutagenesis
JP2014528952A (en) * 2011-09-27 2014-10-30 フジョン キム Erythropoietin-derived peptides and uses thereof

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6759226B1 (en) 2000-05-24 2004-07-06 Third Wave Technologies, Inc. Enzymes for the detection of specific nucleic acid sequences
US7150982B2 (en) 1991-09-09 2006-12-19 Third Wave Technologies, Inc. RNA detection assays
US7045289B2 (en) 1991-09-09 2006-05-16 Third Wave Technologies, Inc. Detection of RNA Sequences
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
ATE329928T1 (en) * 1997-10-23 2006-07-15 Nippon Inst For Biolog Science CAT GRANULOCYTE COLONY-STIMULATING FACTOR
WO1999021979A1 (en) 1997-10-28 1999-05-06 Maxygen, Inc. Human papillomavirus vectors
EP1690868A1 (en) 1997-10-31 2006-08-16 Maxygen, Inc. Modification of virus tropism and host range by viral genome shuffling
US6902918B1 (en) 1998-05-21 2005-06-07 California Institute Of Technology Oxygenase enzymes and screening method
WO1999065927A2 (en) 1998-06-17 1999-12-23 Maxygen, Inc. Method for producing polynucleotides with desired properties
US7033781B1 (en) 1999-09-29 2006-04-25 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
US20010039014A1 (en) * 2000-01-11 2001-11-08 Maxygen, Inc. Integrated systems and methods for diversity generation and screening
AU2001241522A1 (en) * 2000-02-16 2001-08-27 Sequel Genetics, Inc. Methods and products for peptide based dna sequence identification and analysis
AU2001249170A1 (en) * 2000-03-13 2001-09-24 Aptagen Method for modifying a nucleic acid
US7115403B1 (en) 2000-05-16 2006-10-03 The California Institute Of Technology Directed evolution of galactose oxidase enzymes
US20020045175A1 (en) * 2000-05-23 2002-04-18 Zhen-Gang Wang Gene recombination and hybrid protein development
AUPQ776100A0 (en) 2000-05-26 2000-06-15 Australian National University, The Synthetic molecules and uses therefor
WO2001096551A2 (en) * 2000-06-14 2001-12-20 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
US20050209447A1 (en) * 2000-07-25 2005-09-22 Takashi Ito Process for producing recombinant protein
AU2001280968A1 (en) 2000-07-31 2002-02-13 Menzel, Rolf Compositions and methods for directed gene assembly
AU2002251710A1 (en) * 2000-11-10 2002-07-30 The Penn State Research Foundation A modeling framework for predicting the number, type, and distribution of crossovers in directed evolution experiments
JP4776146B2 (en) 2001-01-10 2011-09-21 ザ・ペン・ステート・リサーチ・ファンデーション Method and system for modeling cellular metabolism
WO2002083868A2 (en) 2001-04-16 2002-10-24 California Institute Of Technology Peroxide-driven cytochrome p450 oxygenase variants
WO2002092780A2 (en) * 2001-05-17 2002-11-21 Diversa Corporation Novel antigen binding molecules for therapeutic, diagnostic, prophylactic, enzymatic, industrial, and agricultural applications, and methods for generating and screening thereof
WO2003008563A2 (en) 2001-07-20 2003-01-30 California Institute Of Technology Improved cytochrome p450 oxygenases
ES2564570T3 (en) 2002-03-01 2016-03-23 Codexis Mayflower Holdings, Llc Methods, systems and software for the identification of functional biomolecules
JP4851687B2 (en) 2002-03-09 2012-01-11 マキシジェン, インコーポレイテッド Crossover optimization for directed evolution
US9321832B2 (en) 2002-06-28 2016-04-26 Domantis Limited Ligand
WO2004018621A2 (en) 2002-07-10 2004-03-04 The Penn State Research Foundation Method for determining gene knockout strategies
US7826975B2 (en) 2002-07-10 2010-11-02 The Penn State Research Foundation Method for redesign of microbial production systems
AU2003304275A1 (en) 2002-08-06 2005-01-21 Pioneer Hi-Bred International, Inc. Ap1 amine oxidase variants
CN1863914B (en) 2003-04-29 2011-03-09 先锋高级育种国际公司 Novel glyphosate-n-acetyltransferase (GAT) genes
US7524664B2 (en) 2003-06-17 2009-04-28 California Institute Of Technology Regio- and enantioselective alkane hydroxylation with modified cytochrome P450
DK1660646T3 (en) 2003-08-11 2015-03-09 California Inst Of Techn Thermostable peroxide-driven cytochrome P450 oxygenase variants and methods of use
US8715988B2 (en) 2005-03-28 2014-05-06 California Institute Of Technology Alkane oxidation by modified hydroxylases
US11214817B2 (en) 2005-03-28 2022-01-04 California Institute Of Technology Alkane oxidation by modified hydroxylases
WO2008016709A2 (en) 2006-08-04 2008-02-07 California Institute Of Technology Methods and systems for selective fluorination of organic molecules
US8252559B2 (en) 2006-08-04 2012-08-28 The California Institute Of Technology Methods and systems for selective fluorination of organic molecules
GB0617387D0 (en) * 2006-09-04 2006-10-11 Glaxo Group Ltd Synthetic gene
BRPI0809600B1 (en) 2007-03-30 2023-01-24 The Research Foundation Of State University Of New York ATENUE VIRUS USEFUL FOR VACCINES
BRPI0909611B8 (en) 2008-05-23 2022-12-06 Pioneer Hi Bred Int METHOD OF INCREASE THE TOTAL FATTY ACID CONTENT OF AN OILSEED CELL, RECOMBINANT NUCLEIC ACID, CONSTRUCTION OF RECOMBINANT DNA AND METHOD OF PRODUCTION OF AN OILSEED
US8383346B2 (en) 2008-06-13 2013-02-26 Codexis, Inc. Combined automated parallel synthesis of polynucleotide variants
WO2010045002A2 (en) 2008-09-26 2010-04-22 Tocagen Inc. Gene therapy vectors and cytosine deaminases
BR112013003135A2 (en) 2010-08-13 2017-11-07 Pioneer Hi Bred Int isolated or recombinant polynucleotide and polypeptide, nucleic acid construct, cell, plant, plant explant, transgenic seed, plant cell production method for weed control and detection of an hppd polypeptide and a polynucleotide.
WO2013016207A2 (en) 2011-07-22 2013-01-31 California Institute Of Technology Stable fungal cel6 enzyme variants
WO2013166113A1 (en) 2012-05-04 2013-11-07 E. I. Du Pont De Nemours And Company Compositions and methods comprising sequences having meganuclease activity
US9663532B2 (en) 2012-10-29 2017-05-30 University Of Rochester Artemisinin derivatives, methods for their preparation and their use as antimalarial agents
BR112015023286A2 (en) 2013-03-14 2018-03-06 Arzeda Corp recombinant polypeptide with dicamba decarboxylase activity, polynucleotide construct, cell, method of producing a host cell comprising a heterologous polynucleotide encoding a dicamba decarboxylase activity, method for decarboxylating dicamba, a dicamba derivative or a dicamba metabolite, method for detecting a polypeptide and method for detecting the presence of a polynucleotide encoding a polypeptide having dicamba decarboxylase activity
US20160053277A1 (en) 2013-03-14 2016-02-25 Pioneer Hi-Bred International, Inc. Compositions Having Dicamba Decarboxylase Activity and Methods of Use
US10023877B2 (en) 2013-03-15 2018-07-17 Pioneer Hi-Bred International, Inc. PHI-4 polypeptides and methods for their use
EP3032942B1 (en) 2013-08-16 2020-03-11 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EP3043635B1 (en) 2013-09-13 2020-02-12 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EP3087088B1 (en) 2013-12-23 2022-05-25 University Of Rochester Methods and compositions for ribosomal synthesis of macrocyclic peptides
EP3102684B1 (en) 2014-02-07 2020-05-06 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2015120276A1 (en) 2014-02-07 2015-08-13 Pioneer Hi Bred International Inc Insecticidal proteins and methods for their use
US10435706B2 (en) 2014-10-16 2019-10-08 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EA038923B1 (en) 2015-03-11 2021-11-10 Пайонир Хай-Бред Интернэшнл, Инк. Insecticidal dna construct and methods of use thereof
RU2017144238A (en) 2015-05-19 2019-06-19 Пайонир Хай-Бред Интернэшнл, Инк. INSECTICIDAL PROTEINS AND METHODS OF THEIR APPLICATION
MX2018001523A (en) 2015-08-06 2018-03-15 Pioneer Hi Bred Int Plant derived insecticidal proteins and methods for their use.
US20180325119A1 (en) 2015-12-18 2018-11-15 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EP3960863A1 (en) 2016-05-04 2022-03-02 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EP3954202A1 (en) 2016-07-01 2022-02-16 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
US11149255B2 (en) * 2016-09-06 2021-10-19 Bioventures, Llc Compositions and methods for generating reversion free attenuated and/or replication incompetent vaccine vectors
EP4050021A1 (en) 2016-11-01 2022-08-31 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN110088123B (en) 2016-12-14 2023-10-20 先锋国际良种公司 Insecticidal proteins and methods of use thereof
CA3046226A1 (en) 2016-12-22 2018-06-28 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2018148001A1 (en) 2017-02-08 2018-08-16 Pioneer Hi-Bred International Inc Insecticidal combinations of plant derived insecticidal proteins and methods for their use
EP3363900A1 (en) * 2017-02-21 2018-08-22 ETH Zurich Evolution-guided multiplexed dna assembly of dna parts, pathways and genomes
EP3622076A1 (en) 2017-05-11 2020-03-18 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2019040335A1 (en) 2017-08-19 2019-02-28 University Of Rochester Micheliolide derivatives, methods for their preparation and their use as anticancer and antiinflammatory agents
US20230235352A1 (en) 2020-07-14 2023-07-27 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2023173084A1 (en) 2022-03-11 2023-09-14 University Of Rochester Cyclopeptibodies and uses thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL99553A0 (en) * 1990-09-28 1992-08-18 Ixsys Inc Compositions containing oligonucleotides linked to expression elements,a kit for the preparation of vectors useful for the expression of a diverse population of random peptides and methods utilizing the same
US5837458A (en) * 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
CA2268265A1 (en) * 1996-09-27 1998-04-02 Maxygen, Inc. Methods for optimization of gene therapy by recursive sequence shuffling and selection

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014528952A (en) * 2011-09-27 2014-10-30 フジョン キム Erythropoietin-derived peptides and uses thereof
KR20140076513A (en) * 2012-12-11 2014-06-20 연세대학교 산학협력단 Method of synthesis of gene library using codon randomization and mutagenesis
KR101600902B1 (en) * 2012-12-11 2016-03-10 주식회사 셀레믹스 Method of synthesis of gene library using codon randomization and mutagenesis
US10036007B2 (en) 2012-12-11 2018-07-31 Celemics, Inc. Method of synthesis of gene library using codon randomization and mutagenesis

Also Published As

Publication number Publication date
KR20010085850A (en) 2001-09-07
CA2331335A1 (en) 2000-04-06
WO2000018906A2 (en) 2000-04-06
IL140441A0 (en) 2002-02-10
AU1199000A (en) 2000-04-17
EP1117777A2 (en) 2001-07-25
WO2000018906A3 (en) 2000-10-26
WO2000018906A9 (en) 2000-08-31

Similar Documents

Publication Publication Date Title
JP2002537758A (en) Shuffling of codon-modified genes
US6423542B1 (en) Oligonucleotide mediated nucleic acid recombination
JP6050295B2 (en) Continuous directed evolution of proteins and nucleic acids
Patten et al. Applications of DNA shuffling to pharmaceuticals and vaccines
US6387702B1 (en) Enhancing cell competence by recursive sequence recombination
US6596539B1 (en) Modification of virus tropism and host range by viral genome shuffling
EA020657B1 (en) Tailored multi-site combinatorial assembly
US20070054313A1 (en) Oligonucleotide mediated nucleic acid recombination
JP2002534966A (en) Oligonucleotide-mediated nucleic acid recombination
WO2008045380A2 (en) Nucleic acid libraries and their design and assembly
WO1998013485A1 (en) Methods for optimization of gene therapy by recursive sequence shuffling and selection
US20230357733A1 (en) Reverse Transcriptase and Methods of Use
US6607899B2 (en) Amplification-based cloning method
US20030036641A1 (en) Methods for homology-driven reassembly of nucleic acid sequences
MXPA01003212A (en) Shuffling of codon altered genes
US7485415B2 (en) Sequence analysis of the tetravalent rotavirus vaccine
JP2004531258A (en) Method of template-adjusted ligation direction localization for non-random shuffling of polynucleotides
KR20010042040A (en) Oligonucleotide mediated nucleic acid recombination
Pollmann Preparation, validation and application of combinatorial phagemid libraries displaying large peptides
MXPA00009027A (en) Oligonucleotide mediated nucleic acid recombination

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061205