JP2007520423A - Protein design automation to design modified immunogenic protein libraries - Google Patents

Protein design automation to design modified immunogenic protein libraries Download PDF

Info

Publication number
JP2007520423A
JP2007520423A JP2006515515A JP2006515515A JP2007520423A JP 2007520423 A JP2007520423 A JP 2007520423A JP 2006515515 A JP2006515515 A JP 2006515515A JP 2006515515 A JP2006515515 A JP 2006515515A JP 2007520423 A JP2007520423 A JP 2007520423A
Authority
JP
Japan
Prior art keywords
protein
sequence
sequences
immunogenic
computerized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006515515A
Other languages
Japanese (ja)
Inventor
アーサー・チリノ
バシル・アイ・ダヒヤット
ジョン・デスジャーレイス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xencor Inc
Original Assignee
Xencor Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/903,378 external-priority patent/US20020119492A1/en
Application filed by Xencor Inc filed Critical Xencor Inc
Publication of JP2007520423A publication Critical patent/JP2007520423A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/473Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used alpha-Glycoproteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/04General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length on carriers
    • C07K1/047Simultaneous synthesis of different peptide species; Peptide libraries
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/76Albumins
    • C07K14/765Serum albumin, e.g. HSA

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Zoology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Analytical Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Engineering & Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本発明は、宿主生物中で免疫反応を誘起する可能性が高いアミノ酸配列を同定および改変することによる、タンパク質の免疫原性を調節するための様々なコンピューター処理方法の使用に関するものである。特に、タンパク質を、MHC結合配列、T細胞エピトープおよびB細胞エピトープについてスクリーニングする。  The present invention relates to the use of various computer processing methods to modulate the immunogenicity of a protein by identifying and modifying amino acid sequences that are likely to elicit an immune response in a host organism. In particular, proteins are screened for MHC binding sequences, T cell epitopes and B cell epitopes.

Description

本願は2001年7月10日に出願されたU.S.S.N. 09/903,378の優先日の利益を主張する。   This application claims the priority date benefit of USS 09 / 903,378, filed July 10, 2001.

発明の分野 本発明は、宿主生物中で免疫反応を誘起する可能性が高いアミノ酸配列を同定および改変することによる、タンパク質の免疫原性を調節するための様々なコンピューター処理方法の使用に関するものである。特に、タンパク質を、MHC結合モチーフ、T細胞受容体およびB細胞受容体結合配列についてスクリーニングする。 Field of Invention   The present invention relates to the use of various computer processing methods to modulate the immunogenicity of a protein by identifying and modifying amino acid sequences that are likely to elicit an immune response in a host organism. In particular, proteins are screened for MHC binding motifs, T cell receptors and B cell receptor binding sequences.

発明の背景 外来のものと「自己」のものとの間の区別は、免疫監視の中で主要な重要点である。ウイルスや細菌などの外来性病原体由来タンパク質の同定は、獲得免疫において重大な段階である。同様の認識過程は、移植臓器拒絶および自己免疫疾患において生じ、そしてヒトにおいて外因性タンパク質または他の高分子を繰返しまたは継続して全身的に使用するときにも起こり得る。 Background of the Invention   The distinction between foreign and “self” is a major point in immune surveillance. The identification of foreign pathogen-derived proteins such as viruses and bacteria is a critical step in acquired immunity. A similar recognition process occurs in transplant organ rejection and autoimmune diseases, and can also occur in humans when exogenous proteins or other macromolecules are used repeatedly or continuously systemically.

獲得免疫には2つの主要な武器がある:体液性免疫と細胞性免疫である。免疫グロブリンは、体液性免疫反応の最重要物である。Bリンパ球上の細胞表面受容体として、免疫グロブリンは、活性化、分化およびプログラムされた細胞死など多岐にわたる細胞反応の誘発を担う。抗体として分泌されると、免疫グロブリンは、外来抗原に結合し、それを直接中和するか、または補体もしくは単球性食細胞による抗体依存性細胞溶解などのエフェクター系を武装させ、徴集するのに必要な段階を開始させられる(Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 3, pp 37-74)。   There are two main weapons of acquired immunity: humoral immunity and cellular immunity. Immunoglobulins are the most important humoral immune response. As a cell surface receptor on B lymphocytes, immunoglobulins are responsible for eliciting a wide variety of cellular responses such as activation, differentiation and programmed cell death. When secreted as antibodies, immunoglobulins bind to foreign antigens and neutralize them directly or arm and collect effector systems such as antibody-dependent cell lysis by complement or monocytic phagocytes The necessary steps are started (Fundamental Immunology, 4th edition, WE Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 3, pp 37-74).

T細胞は細胞性免疫を担う。T細胞は、標的細胞を直接的に殺すこと、そのようなキラーに補助を与えること、他の免疫系の細胞(即ち、マクロファージ)を活性化すること、B細胞が抗体反応を起こすのを補助すること、各種免疫系細胞の活性を下方調節すること、そしてサイトカイン、ケモカイン、および他の調整因子を分泌することが知られている。これらの活性は、性質の異なるタイプのTサイトカイン、ケモカイン、および他の調整因子によってしばしば媒介される。これらの活性は、α:βT細胞、1型および2型ヘルパー細胞などの性質の異なるタイプのT細胞によって、しばしば媒介される。T細胞の活性化は、その表面に並ぶ受容体(即ち、T細胞受容体またはTCR)を介して、T細胞が特定の抗原を認識するときに起こる。α:βT細胞(即ち、CD8+かつCD4+T細胞)は、主要組織適合性複合体(MHC)内にコードされる分子の1つと共同してのみ、そしてそれが適切な対立遺伝子変異体である場合にのみ、抗原を認識する。この現象はMHC拘束と呼ばれる(Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 11, pp 367-409)。   T cells are responsible for cellular immunity. T cells directly kill target cells, provide assistance to such killer, activate cells of other immune systems (ie macrophages), help B cells elicit an antibody response It is known to down-regulate the activity of various immune system cells and to secrete cytokines, chemokines, and other regulatory factors. These activities are often mediated by different types of T cytokines, chemokines, and other modulators. These activities are often mediated by different types of T cells such as α: β T cells, type 1 and type 2 helper cells. T cell activation occurs when a T cell recognizes a particular antigen via a receptor on its surface (ie, a T cell receptor or TCR). α: β T cells (ie CD8 + and CD4 + T cells) are only in association with one of the molecules encoded within the major histocompatibility complex (MHC) and when it is a suitable allelic variant Only recognize the antigen. This phenomenon is called MHC restriction (Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 11, pp 367-409).

主要組織適合性複合体(MHC)分子は、外来タンパク質由来のポリペプチド断片(抗原)に結合し、これらのペプチドをT細胞表面の受容体に提示して免疫反応に至ることによって、認識過程において中心的な役割を演じる。MHC分子は、2種の別個の分子機能を満たすことにより、免疫反応におけるその主要な役割を達成する:ペプチドの結合、および通常α:βT細胞受容体(TCR)を介するT細胞との相互作用である。MHC IまたはMHC II分子によるペプチドの結合は、MHC分子を発現している細胞(抗原提示細胞、APC)が、それ自身のタンパク質(MCH I)または付近の細胞外環境から摂取したタンパク質(MCH II)のいずれかのサンプルになることを可能にする選択的事象である(Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 8, pp 263-285)。   Major histocompatibility complex (MHC) molecules bind to foreign protein-derived polypeptide fragments (antigens) and present these peptides to receptors on the surface of T cells leading to an immune response, leading to an immune response. Play a central role. MHC molecules achieve their primary role in the immune response by fulfilling two distinct molecular functions: peptide binding and interaction with T cells, usually via the α: β T cell receptor (TCR). It is. Peptide binding by MHC I or MHC II molecules is determined by the cell expressing the MHC molecule (antigen-presenting cell, APC), its protein (MCH I) or the protein (MCH II) taken from the nearby extracellular environment. ) Is a selective event that makes it possible to become any sample (Fundamental Immunology, 4th edition, WE Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 8, pp 263-285).

ある細胞上のTCRと別の細胞上の相補的ペプチド−MHC複合体との間の相互作用は、T細胞および抗原提示細胞の個性によって決まる細胞内シグナルのカスケードを引き起こす。最終的に、TCR−ペプチド−MHC認識は、移植片および腫瘍拒絶、抗ウイルス細胞溶解、および抗体産生B細胞などの他の免疫細胞の徴集と制御を含む、免疫反応を調節する(Madden, D.R., (1995) Annu. Rev. Immunol., 13:587-622)。   The interaction between the TCR on one cell and the complementary peptide-MHC complex on another cell causes a cascade of intracellular signals that depend on the identity of the T cell and the antigen presenting cell. Finally, TCR-peptide-MHC recognition regulates immune responses, including graft and tumor rejection, antiviral cytolysis, and collection and control of other immune cells such as antibody-producing B cells (Madden, DR , (1995) Annu. Rev. Immunol., 13: 587-622).

MHC分子は高度に多形であり、種々のヒトの集団中で対立遺伝子変異を示す(Buus、前出)。何百ものMHCクラスIおよびII対立遺伝子が既知であり、各々が特定の抗原ペプチド配列に対して異なる結合親和性を示す。この対立遺伝子依存性ペプチド選択性のための構造的偏重は、MHCペプチド結合ポケット内のアミノ酸残基における差異に集中している(Buus、前出)。特定の抗原ペプチドに結合したMHCクラスIおよびII分子のX線結晶構造は、NおよびC末端(即ち、アンカー位置)のペプチド残基がMHCクラスI結合ポケットと間近な物理的接触にあり、一方クラスIIに結合するペプチドは、MHCクラスIIポケットとの接触を形成している付加的ペプチド残基によりさらに延長されていること、を明らかにしている(Buus、前出)。   MHC molecules are highly polymorphic and show allelic variation in various human populations (Buus, supra). Hundreds of MHC class I and II alleles are known, each displaying a different binding affinity for a particular antigenic peptide sequence. This structural bias for allele-dependent peptide selectivity is centered on differences in amino acid residues within the MHC peptide binding pocket (Buus, supra). X-ray crystal structures of MHC class I and II molecules bound to specific antigenic peptides show that the N and C-terminal (ie anchor position) peptide residues are in close physical contact with the MHC class I binding pocket, while It has been revealed that peptides that bind to class II are further extended by additional peptide residues that make contact with the MHC class II pocket (Buus, supra).

MHC分子から抽出されるペプチドの詳細な配列分析により、いくつかの対立遺伝子特異的アミノ酸選択性が解明された(Buus、前出)。MHC分子に結合すると知られている何千ものペプチド配列からなるデータベースが編集され(Rammensee, H., et al. (1999) Immunogenetics, 50:213-219)、そして全長タンパク質配列を分析し、可能性のある抗原配列の存在を予測するためのいくつかの技法が開発された(Hiemstra, H.S. et al. (2000) Curr. Op. Immunol., 12:80-84; Malios, R.R., (1999) Bioinformatics, 15:432-439; Sturniolo, T., et al. (1999) Nature Biotechnology, 17:555-561; Brusic, V., et al., (1998) Bioinformatics, 14:121-130; Mallios, R.R., (1998) J. Comp. Biol., 5:703-711; Savoie, C.J. et al. (1999) Pac Symp Biocomput, 182-9; Altuvia, Y., et al. (1997) Human Immunology, 58:1-11; Shastri, N. (1996) Curr. Op. Immunol., 8:271-277; Hammer, J. (1995) Curr. Op. Immunol., 7:263-269; Meister, G.E., et al. (1995) Vaccine, 13:581-591; Udaka, K., et al. (1995) J. Exp. Med., 181:20972108; Hammer, J. et al. (1994) Behring. Inst. Mitt. 94:124-132; Hammer, J., et al. (1994) J. Exp. Med., 180: 2353-2358; および Rudenshky, A. Y., et al. (1991) Nature, 353:622-627)。包括的なペプチド結合親和性は配列およびMHC対立遺伝子特異的であるが、各ペプチド残基の寄与は隣接残基の個性から独立しており、そして個々に総計され得る(Altuvia, et al., 前出)。アンカー残基の存在およびMHCクラスI結合ペプチドの長さは、MHCクラスII分子よりもMHCクラスI分子に対して良好な予測モデルを導く(Abrams and Schlom, (2000) Curr. Op. Immunol., 12:85-91)。   Detailed sequence analysis of peptides extracted from MHC molecules revealed several allele-specific amino acid selectivities (Buus, supra). A database of thousands of peptide sequences known to bind to MHC molecules has been compiled (Rammensee, H., et al. (1999) Immunogenetics, 50: 213-219) and possible to analyze full-length protein sequences Several techniques have been developed to predict the presence of sex antigenic sequences (Hiemstra, HS et al. (2000) Curr. Op. Immunol., 12: 80-84; Malios, RR, (1999) Bioinformatics, 15: 432-439; Sturniolo, T., et al. (1999) Nature Biotechnology, 17: 555-561; Brusic, V., et al., (1998) Bioinformatics, 14: 121-130; Mallios, RR, (1998) J. Comp. Biol., 5: 703-711; Savoie, CJ et al. (1999) Pac Symp Biocomput, 182-9; Altuvia, Y., et al. (1997) Human Immunology, 58 : 1-11; Shastri, N. (1996) Curr. Op. Immunol., 8: 271-277; Hammer, J. (1995) Curr. Op. Immunol., 7: 263-269; Meister, GE, et al. (1995) Vaccine, 13: 581-591; Udaka, K., et al. (1995) J. Exp. Med., 181: 20972108; Hammer, J. et al. (1994) Behring. Inst. Mitt 94: 124-132; Hammer, J., et al. (1994) J. Exp. Med., 180: 2353-2358; and Rudenshky, A. Y., et al. (1991) Nature, 353: 622-627). The overall peptide binding affinity is sequence and MHC allele specific, but the contribution of each peptide residue is independent of the identity of the neighboring residues and can be summed individually (Altuvia, et al., The above). The presence of anchor residues and the length of MHC class I binding peptides lead to a better predictive model for MHC class I molecules than MHC class II molecules (Abrams and Schlom, (2000) Curr. Op. Immunol., 12: 85-91).

抗原ペプチドのいずれの残基がTCRにより結合されるのかは、あまり明確ではないが、側鎖置換実験により、数々のペプチド−MHC複合体上のTCR結合部位の概略がマッピングされてきた。典型的に、異なるTCRは異なるが重複するMHCおよびペプチド側鎖のサブセットと接触することが見出された。TCR「足跡」は、結合したペプチドの中心に置かれ、ペプチド結合溝を形成する両αヘリックスの最上部にあるMHC側鎖を含む。ペプチド表面の大部分が埋没しているにも関わらず、結合したペプチドは、明らかに、顕著にTCR認識に寄与する。より最近の結果は、ペプチド配列中の各アミノ酸が独立してMHC−ペプチド−TCR複合体の親和性に寄与することを示唆している (Hemmer, B., et al., (1998), J. Immunol., 160:3631-3636)。   It is not clear which residues of the antigenic peptide are bound by TCR, but side chain substitution experiments have mapped the outline of TCR binding sites on a number of peptide-MHC complexes. Typically, different TCRs have been found to contact different but overlapping subsets of MHC and peptide side chains. The TCR “footprint” is located in the center of the bound peptide and includes the MHC side chain at the top of both α helices that form the peptide binding groove. Despite the majority of the peptide surface being buried, the bound peptides clearly contribute significantly to TCR recognition. More recent results suggest that each amino acid in the peptide sequence independently contributes to the affinity of the MHC-peptide-TCR complex (Hemmer, B., et al., (1998), J Immunol., 160: 3631-3636).

体液性免疫の重要な構成要素は、Bリンパ球が産生する広範なレパートリーの抗体(即ち、免疫グロブリン)である。特異的B細胞との抗原接触は、B細胞抗原受容体(BCR)の膜貫通シグナル伝達機能を引き起こす。これが、今度は、MHCクラスII分子発現の増加および抗体分泌細胞の形成を含む、B細胞活性化における初期事象を誘導する。   An important component of humoral immunity is the broad repertoire of antibodies (ie, immunoglobulins) produced by B lymphocytes. Antigen contact with specific B cells causes the transmembrane signaling function of the B cell antigen receptor (BCR). This in turn induces early events in B cell activation, including increased MHC class II molecule expression and formation of antibody secreting cells.

ポリペプチドの免疫原性の減少は、合理的(rational)部位特異的突然変異導入(Meyer, et al., (2001) Protein Science 10:491-503)、網羅的(exhaustive)部位特異的突然変異導入(Laroche, et al., (2000) Blood, 96:1425-1432; WO00/34317;WO98/52976)およびポリエチレングリコール誘導体の直接的化学カップリング(Tsutsumi, et al., (2000) Proc. Natl. Acad. Sci. USA, 97:8548-8553)により達成されてきた。しかしながら、これらの方法は、特に多数の変異を同時に考慮すると、極度に時間を消費する。表面残基の合理的選択により免疫原性の減少を導けるが、いくつかの残基の置換は、不安定化し、折畳みを不十分にし得る。加えて、溶媒に露出する荷電残基の除去は、エネルギー的に不都合であり得る。   Reduced polypeptide immunogenicity is due to rational site-directed mutagenesis (Meyer, et al., (2001) Protein Science 10: 491-503), exhaustive site-directed mutagenesis. Introduction (Laroche, et al., (2000) Blood, 96: 1425-1432; WO00 / 34317; WO98 / 52976) and direct chemical coupling of polyethylene glycol derivatives (Tsutsumi, et al., (2000) Proc. Natl Acad. Sci. USA, 97: 8548-8553). However, these methods are extremely time consuming, especially when multiple mutations are considered simultaneously. Although rational selection of surface residues can lead to reduced immunogenicity, substitution of some residues can destabilize and cause poor folding. In addition, removal of charged residues exposed to the solvent can be energetically inconvenient.

これらの問題を克服する方法の1つは、コンピューター処理方法を使用して、標的タンパク質と比べて免疫原性が高いか、または低いが、適切な折畳みと活性を確保するための構造的特性を保持している配列を設計することである。   One way to overcome these problems is to use computerized methods that are either more or less immunogenic compared to the target protein, but have the structural properties to ensure proper folding and activity. It is to design the array that holds.

従って、可能性のあるMHC、TCR、またはBCR結合ペプチドをスクリーニングするためのコンピューター処理方法の使用が、本発明の目的である。配列の生成および評価のための、幅広い各種の方法が既知である。これらには、配列プロファイリング (Bowie and Eisenberg, Science 253(5016): 164-70, (1991))、回転異性体ライブラリー選択法(Dahiyat and Mayo, Protein Sci 5(5): 895-903 (1996); Dahiyat and Mayo, Science 278(5335): 82-7 (1997); Desjarlais and Handel, Protein Science 4: 2006-2018 (1995); Harbury et al, PNAS USA 92(18): 8408-8412 (1995); Kono et al., Proteins: Structure, Function and Genetics 19: 244-255 (1994); Hellinga and Richards, PNAS USA 91: 5803-5807 (1994));および残基対ポテンシャル (Jones, Protein Science 3: 567-574, (1994))が含まれるが、これらに限定されるものではない。   Accordingly, it is an object of the present invention to use a computerized method to screen for potential MHC, TCR, or BCR binding peptides. A wide variety of methods are known for the generation and evaluation of sequences. These include sequence profiling (Bowie and Eisenberg, Science 253 (5016): 164-70, (1991)), rotamer library selection (Dahiyat and Mayo, Protein Sci 5 (5): 895-903 (1996) ); Dahiyat and Mayo, Science 278 (5335): 82-7 (1997); Desjarlais and Handel, Protein Science 4: 2006-2018 (1995); Harbury et al, PNAS USA 92 (18): 8408-8412 (1995) ); Kono et al., Proteins: Structure, Function and Genetics 19: 244-255 (1994); Hellinga and Richards, PNAS USA 91: 5803-5807 (1994)); and residue pair potential (Jones, Protein Science 3 : 567-574, (1994)), but is not limited thereto.

特に、U.S.S.N.60/061,097、60/043,464、60/054,678、09/127,926およびPCT US98/07254は、配列安定性を評価するための数々のスコア付け関数を利用する「タンパク質設計オートメーション」またはPDA(登録商標)と称する方法を記載している。   In particular, U.S.S.N. 60 / 061,097, 60 / 043,464, 60 / 054,678, 09 / 127,926, and PCT US98 / 07254 include a number of methods for assessing sequence stability. A method called “Protein Design Automation” or PDA® that utilizes a scoring function is described.

さらに、免疫原性の改変のために作成および評価できるタンパク質配列の小型ライブラリーを選択するために、配列ライブラリーのスクリーニング用のコンピューター処理方法を提供することが、本発明の目的である。   Furthermore, it is an object of the present invention to provide a computerized method for screening a sequence library in order to select a small library of protein sequences that can be created and evaluated for immunogenic modification.

発明の概要 上記概説した目的に従って、本発明は、増強された免疫原性を示すポリペプチドの生成方法を提供する。その方法は、可変残基位置と共に標的タンパク質の主鎖構造をコンピューターに入力する段階、少なくとも1つのタンパク質設計アルゴリズムを適用することにより、一次変異アミノ酸配列のセットをコンピューター処理により生成させる段階、そしてコンピューター処理の免疫原性フィルターを適用することにより、該一次変異アミノ酸配列のセットをコンピューター処理により分析する段階を含む。次いで候補タンパク質を作成し、標的タンパク質と比較して候補タンパク質の免疫原性が増強されたか否かを判定するために試験する。これと同じ方法を、低減された免疫原性を示すポリペプチドの生成に使用し得る。 Summary of the Invention   In accordance with the objects outlined above, the present invention provides methods for producing polypeptides that exhibit enhanced immunogenicity. The method includes inputting a backbone structure of a target protein along with variable residue positions into a computer, applying a set of primary mutated amino acid sequences by applying at least one protein design algorithm, and computing the computer Analyzing the set of primary variant amino acid sequences by computer processing by applying an immunogenic filter of treatment. A candidate protein is then created and tested to determine whether the candidate protein has been enhanced in immunogenicity compared to the target protein. This same method can be used to produce polypeptides that exhibit reduced immunogenicity.

さらなる態様では、本発明は、増強された免疫原性を示すポリペプチドの生成方法を提供する。その方法は、可変残基位置と共に標的タンパク質の主鎖構造をコンピューターに入力する段階、少なくとも1つのコンピューター処理の免疫原性フィルターを適用して一次変異アミノ酸配列のセットを生成させる段階、少なくとも1つのタンパク質設計アルゴリズムを使用して該一次変異アミノ酸配列のセットをコンピューター処理により分析する段階、そして増強された免疫原性を有する少なくとも1つの変異体タンパク質を同定する段階を含む。これと同じ方法を、低減された免疫原性を示すポリペプチドの生成に使用し得る。   In a further aspect, the present invention provides a method for producing a polypeptide that exhibits enhanced immunogenicity. The method includes inputting a backbone structure of a target protein with variable residue positions into a computer, applying at least one computational immunogenic filter to generate a set of primary mutated amino acid sequences, at least one Computational analysis of the set of primary mutant amino acid sequences using a protein design algorithm, and identifying at least one mutant protein with enhanced immunogenicity. This same method can be used to produce polypeptides that exhibit reduced immunogenicity.

さらなる態様では、本発明は、増強された免疫原性を示すポリペプチドの生成方法を提供する。その方法は、可変残基位置と共に標的タンパク質の主鎖構造をコンピューターに入力する段階、少なくとも1つのコンピューター処理の免疫原性フィルターを含む少なくとも1つのスコア付け関数を含む少なくとも1つのタンパク質設計アルゴリズムを適用することにより一次変異アミノ酸配列のセットをコンピューター処理により生成させる段階、そして増強された免疫原性を有する少なくとも1つの変異体タンパク質を同定する段階を含む。これと同じ方法を、低減された免疫原性を示すポリペプチドの生成に使用し得る。   In a further aspect, the present invention provides a method for producing a polypeptide that exhibits enhanced immunogenicity. The method applies at least one protein design algorithm comprising inputting a backbone structure of a target protein with variable residue positions into a computer, at least one scoring function including at least one computational immunogenic filter. Thereby generating a set of primary mutated amino acid sequences by computer processing and identifying at least one variant protein having enhanced immunogenicity. This same method can be used to produce polypeptides that exhibit reduced immunogenicity.

さらなる態様では、本発明は、増強された免疫原性を示すポリペプチドの生成方法を提供する。その方法は、可変残基位置と共に標的タンパク質の主鎖構造をコンピューターに入力する段階、少なくとも1つのコンピューター処理のタンパク質設計アルゴリズムおよび少なくとも1つのコンピューター処理の免疫原性フィルターを順を問わず適用する段階、そして増強された免疫原性を有する少なくとも1つの変異体タンパク質を同定する段階を含む。これと同じ方法を、低減された免疫原性を示すポリペプチドの生成に使用し得る。   In a further aspect, the present invention provides a method for producing a polypeptide that exhibits enhanced immunogenicity. The method includes inputting a backbone structure of a target protein with variable residue positions into a computer, applying at least one computerized protein design algorithm and at least one computerized immunogenic filter in any order. And identifying at least one mutant protein having enhanced immunogenicity. This same method can be used to produce polypeptides that exhibit reduced immunogenicity.

さらなる態様では、本発明は、患者において増強された免疫反応を誘起する方法を提供する。その方法は、可変残基位置と共に標的タンパク質の主鎖構造をコンピューターに入力する段階、少なくとも1つのコンピューター処理のタンパク質設計アルゴリズムおよび少なくとも1つのコンピューター処理の免疫原性フィルターを順を問わず適用する段階、増強された免疫原性を有する少なくとも1つの変異体タンパク質を同定する段階、そして該変異体タンパク質を患者に投与する段階を含む。   In a further aspect, the present invention provides a method of eliciting an enhanced immune response in a patient. The method includes inputting a backbone structure of a target protein with variable residue positions into a computer, applying at least one computerized protein design algorithm and at least one computerized immunogenic filter in any order. Identifying at least one mutant protein having enhanced immunogenicity, and administering the mutant protein to a patient.

コンピューター処理の設計アルゴリズムは、コンピューター処理の免疫原性フィルターの適用に先立って、またはその後に適用し得る。あるいは、コンピューター処理のタンパク質設計アルゴリズムは、スコア付け関数としてコンピューター処理のフィルターを含む。   The computerized design algorithm may be applied prior to or after the application of the computerized immunogenic filter. Alternatively, the computerized protein design algorithm includes a computerized filter as a scoring function.

コンピューター処理により生成させる段階は、MHCクラスIモチーフ、MHCクラスIIモチーフ、B細胞エピトープまたはT細胞エピトープに関するスコア付け関数を含むコンピューター処理の免疫原性フィルターを適用することを含み得る。他のコンピューター処理の段階には、行き止まり排除法(Dead-End-Elimination:DEE)コンピューター計算、モンテカルロ検索、または遺伝的アルゴリズムの使用が含まれる。さらなるスコア付け関数には、ファンデルワールスポテンシャルスコア付け関数、水素結合ポテンシャルスコア付け関数、原子溶媒和スコア付け関数、二次構造傾向スコア付け関数および静電気スコア付け関数が含まれる。   The step of generating by computer processing may comprise applying a computerized immunogenic filter comprising a scoring function for the MHC class I motif, MHC class II motif, B cell epitope or T cell epitope. Other computational steps include the use of Dead-End-Elimination (DEE) computer calculations, Monte Carlo searches, or genetic algorithms. Additional scoring functions include van der Waals potential scoring functions, hydrogen bond potential scoring functions, atomic solvation scoring functions, secondary structure trend scoring functions, and electrostatic scoring functions.

さらなる態様では、ポリペプチドは1つまたはそれ以上の免疫原性配列を含み得る。免疫原性配列は、同一であるか、または異なり得る。免疫原性配列は、MHCクラスIモチーフ、MHCクラスIIモチーフ、B細胞エピトープおよびT細胞エピトープからなる群から選択され得る。   In a further aspect, the polypeptide may comprise one or more immunogenic sequences. The immunogenic sequences can be identical or different. The immunogenic sequence can be selected from the group consisting of an MHC class I motif, an MHC class II motif, a B cell epitope and a T cell epitope.

さらなる態様では、標的タンパク質は、Zn−アルファ2−糖タンパク質、ヒト血清アルブミン、免疫グロブリンGおよび他の非免疫原性タンパク質を含む群から選択される。   In a further aspect, the target protein is selected from the group comprising Zn-alpha 2-glycoprotein, human serum albumin, immunoglobulin G and other non-immunogenic proteins.

図面の簡単な説明 図1は、全長遺伝子の合成およびPCRによる可能な全変異導入を描く。全長遺伝子(黒い棒線、段階1)に対応する重複オリゴヌクレオチドを合成し、加熱し、アニーリングする。アニーリングしたオリゴヌクレオチドにPfu DNAポリメラーゼを添加することにより、DNAの5'→3'合成に至り(段階2)、さらに長いDNA断片を産生する(段階3)。加熱、アニーリングの反復周期(段階4)により、いくつかの全長分子を含む、さらに長いDNAが産生される結果となる。これらは、全長遺伝子の末端に対応するプライマー(矢印)を用いて第2ラウンドのPCRにより選択できる(段階5)。 Brief Description of Drawings   FIG. 1 depicts full-length gene synthesis and possible total mutation introduction by PCR. Overlapping oligonucleotides corresponding to the full-length gene (black bar, step 1) are synthesized, heated and annealed. Addition of Pfu DNA polymerase to the annealed oligonucleotide leads to 5 ′ → 3 ′ synthesis of DNA (step 2), producing longer DNA fragments (step 3). Repeated heating and annealing cycles (step 4) result in the production of longer DNA containing several full length molecules. These can be selected by a second round of PCR using primers (arrows) corresponding to the ends of the full-length gene (step 5).

図2は、本発明のライブラリーを合成するための、好ましいスキームを示す。野生型遺伝子、または大域的極小(global minimum)遺伝子のための遺伝子などの、いかなる出発遺伝子も使用できる。様々な変異部位で様々なアミノ酸を含むオリゴヌクレオチドを、標準的なプライマーを使用するPCRにおいて使用できる。これは、一般的に、要するオリゴヌクレオチドはより少なく、そして結果としてエラーがより少なくなる。   FIG. 2 shows a preferred scheme for synthesizing the libraries of the present invention. Any starting gene can be used, such as a wild type gene, or a gene for a global minimum gene. Oligonucleotides containing different amino acids at different mutation sites can be used in PCR using standard primers. This generally requires less oligonucleotide and results in fewer errors.

図3は、重複伸張法を示す。図3の最上段は、変異させる領域(黒色のボックス)の場所と、関連するプライマー(矢印)の結合部位を示した鋳型DNAである。プライマーR1とR2は、プライマーのプールを表し、各々が異なる変異を含む;ここで記載したように、これは、所望により様々な比率のプライマーを使用して行い得る。変異部位は、ハイブリダイゼーションを行うのに十分な相同性がある領域に隣接する。この例では、3つの別個のPCR反応が段階1で行われる。第1の反応は、鋳型に加えてオリゴF1とR1を含む。第2の反応は、鋳型に加えてF2とR2を含み、第3の反応は、鋳型に加えてF3とR3を含む。反応生成物を示す。段階2では、段階1のチューブ1と、段階1のチューブ2の生成物を用いる。精製してプライマーを除いた後、これらをF1とR4と共に、新しいPCR反応に添加する。PCRの変性段階の間に、重複領域がアニーリングし、第2鎖が合成される。次いで、生成物を外側のプライマーにより増幅する。段階3では、精製した段階2の生成物を、段階1のチューブ3の生成物およびプライマーF1とR3と共に、第3のPCR反応に用いる。最終生成物は、全長遺伝子に相当し、求める変異を含む。   FIG. 3 shows the overlap extension method. The top row of FIG. 3 is a template DNA showing the location of the region to be mutated (black box) and the binding site of the associated primer (arrow). Primers R1 and R2 represent a pool of primers, each containing a different mutation; as described herein, this can be done using various ratios of primers as desired. The mutation site is adjacent to a region with sufficient homology to perform hybridization. In this example, three separate PCR reactions are performed in stage 1. The first reaction includes oligos F1 and R1 in addition to the template. The second reaction includes F2 and R2 in addition to the template, and the third reaction includes F3 and R3 in addition to the template. The reaction product is shown. Stage 2 uses the product of stage 1 tube 1 and stage 1 tube 2. After purification to remove the primers, they are added to a new PCR reaction along with F1 and R4. During the denaturation step of PCR, the overlapping region anneals and the second strand is synthesized. The product is then amplified with the outer primer. In stage 3, the purified stage 2 product is used in the third PCR reaction with the product of stage 1 tube 3 and primers F1 and R3. The final product corresponds to the full-length gene and contains the desired mutation.

図4は、本発明のライブラリーを合成するための、PCR反応生成物のライゲーションを示す。この技法では、プライマーは、平滑末端、5'オーバーハング末端、または3'オーバーハング末端のいずれかのエンドヌクレアーゼ制限部位(RE)も含む。我々は、段階1に、3つの別個のPCR反応をセットアップした。第1の反応は、鋳型に加えてオリゴF1とR1を含む。第2の反応は、鋳型に加えてF2とR2を含み、第3の反応は、鋳型に加えてF3とR3を含む。反応生成物を示す。段階2では、段階1の生成物を精製し、次に適切な制限エンドヌクレアーゼで切断する。段階2のチューブ1および段階2のチューブ2由来の切断生成物を共にDNAリガーゼでライゲーションする(段階3)。次いで、段階4では、プライマーF1とR4を用いて生成物を増幅する。増幅された生成物を切断し、それらを段階2のチューブ3の切断生成物にライゲーションし、そして最終生成物をプライマーF1とR3で増幅することにより、全プロセスを繰り返す。2つの制限酵素部位(RETとRE2)が異なれば、段階1の3つの全PCR産物を、1反応でライゲーションすることも可能である。   FIG. 4 shows the ligation of PCR reaction products to synthesize the library of the present invention. In this technique, the primer also contains an endonuclease restriction site (RE), either blunt ended, 5 ′ overhanged, or 3 ′ overhanged. We set up three separate PCR reactions in stage 1. The first reaction includes oligos F1 and R1 in addition to the template. The second reaction includes F2 and R2 in addition to the template, and the third reaction includes F3 and R3 in addition to the template. The reaction product is shown. In step 2, the product of step 1 is purified and then cleaved with an appropriate restriction endonuclease. The cleavage products from step 2 tube 1 and step 2 tube 2 are both ligated with DNA ligase (step 3). Step 4 then amplifies the product using primers F1 and R4. The entire process is repeated by cleaving the amplified products, ligating them to the cleavage products of stage 2 tube 3, and amplifying the final product with primers F1 and R3. If the two restriction enzyme sites (RET and RE2) are different, it is possible to ligate all three PCR products from step 1 in one reaction.

図5は、PCR産物の平滑末端ライゲーションを描く。この技法では、F1とR1のようなプライマーは重複しないが隣接する。再び3つの別個のPCR反応を実施する。チューブ1とチューブ2の生成物をライゲーションし、外側のプライマーF1とR4で増幅する。次いで、この生成物を、段階1のチューブ3の生成物とライゲーションする。次いで、最終生成物をプライマーF1とR3で増幅する。   FIG. 5 depicts blunt end ligation of PCR products. In this technique, primers such as F1 and R1 do not overlap but are adjacent. Again three separate PCR reactions are performed. The products of tube 1 and tube 2 are ligated and amplified with outer primers F1 and R4. This product is then ligated with the product of tube 1 of stage 1. The final product is then amplified with primers F1 and R3.

発明の詳細な説明 本発明は、改変された免疫原性を有するタンパク質配列の小型ライブラリー(1013以下の構成員を含み得る)を選択するための、タンパク質配列ライブラリー(1080以下またはそれ以上の構成員を含み得る)のコンピューター処理スクリーニングの使用方法を対象としている。例えば、免疫原性が減少したタンパク質を所望するならば、免疫反応を誘起すると知られている残基を同定し、タンパク質の天然の折畳みと安定性を維持する補償の残基と置換するために、コンピューター処理のフィルターを使用でき、その結果、非免疫原性であるか、または開始タンパク質よりも低免疫原性であるタンパク質が生じる。 DETAILED DESCRIPTION OF THE INVENTION The present invention, for selecting a small library of protein sequences with altered immunogenicity (10 13 can include the following members), the protein sequence library (10 80 or less or The method of using computerized screening (which may include the above members) is targeted. For example, if a protein with reduced immunogenicity is desired, to identify residues known to elicit an immune response and replace them with compensating residues that maintain the protein's natural folding and stability Computerized filters can be used, resulting in proteins that are non-immunogenic or less immunogenic than the starting protein.

あるいは、免疫原性が増加したタンパク質を設計することが所望であり得る。この場合、残基を変更して抗原モチーフを導入し、生じるタンパク質の適正な折畳みと安定性を確保するために、コンピューター処理のフィルターを適用できる。   Alternatively, it may be desirable to design a protein with increased immunogenicity. In this case, computational filters can be applied to change residues and introduce antigen motifs to ensure proper folding and stability of the resulting protein.

一般に、このことは2つの一般的方法のうちの1つで成し得る。第1の実施態様では、コンピューター処理による加工を、安定性などの特性が改変された変異タンパク質のリストを生成させるために使用する。次いで、コンピューター処理のフィルターを、免疫原性が改変された傾向が強い変異体を選択するために適用する。   In general, this can be done in one of two general ways. In a first embodiment, computational processing is used to generate a list of mutant proteins with altered properties such as stability. A computerized filter is then applied to select variants that are more likely to have altered immunogenicity.

あるいは、免疫原性を改変された傾向のある変異体のリストを生成させるためにコンピューター処理のフィルターを最初に適用し、次いで折畳まれているか、または安定であると考えられる変異体を選択するために、コンピューター処理による加工を行う。   Alternatively, a computational filter is first applied to generate a list of variants that are prone to altered immunogenicity, and then variants that are considered to be folded or stable are selected. Therefore, processing by computer processing is performed.

特に、MHCクラスIおよびクラスII分子、T細胞およびB細胞に結合する可能性のあるペプチド断片またはアミノ酸残基をスクリーニングするために、コンピューター処理のフィルターを使用する。例えば、MHCリガンドとペプチドモチーフのデータベースを検索し、可能性のあるMHCクラスIまたはクラスII結合配列を同定するために、使用できる(Rammensee, H., et al. (1999) Immunogenetics, 50:213-219)。次いで、MHC分子への結合に関連するアミノ酸残基を、構造的、化学的に補償するために、コンピューター処理方法を使用する。例えば、標的タンパク質よりも免疫原性が低い変異タンパク質が望ましいならば、免疫反応を誘起すると予測されるペプチド配列またはアミノ酸残基を同定し、これらの残基を非免疫原性と予測される残基で置換し、次いで生じた配列から、適正に折畳まれ、かつ安定である配列をスクリーニングするために、コンピューター処理方法を使用できる。   In particular, computational filters are used to screen for peptide fragments or amino acid residues that may bind to MHC class I and class II molecules, T cells and B cells. For example, it can be used to search a database of MHC ligands and peptide motifs and identify potential MHC class I or class II binding sequences (Rammensee, H., et al. (1999) Immunogenetics, 50: 213 -219). Computer processing methods are then used to structurally and chemically compensate for amino acid residues associated with binding to MHC molecules. For example, if a mutant protein that is less immunogenic than the target protein is desired, peptide sequences or amino acid residues that are predicted to elicit an immune response are identified and the residues that are predicted to be non-immunogenic are identified. Computer processing methods can be used to screen for sequences that are properly folded and stable from the resulting sequence and then substituted with a group.

抗体結合表面残基の適切な置換を判定するための法則が明らかになっている (Meyer, D.L., et al. (2001) Protein Science, 10:491-503; Laroche, Y., (2000) Blood, 96:1425-1432; and Schwartz, H.L., (1999) J. Mol. Biol., 287:983-999 参照)。例えば、芳香族の表面残基は、抗原抗体結合に関与する。チロシンなどの芳香族の表面残基を、セリン、アラニンまたはグリシンなどの小型残基で置換することができる。同様に、荷電側鎖の大型パッチを、セリンまたはアラニンなどの小型親水性残基で置換できる。次いで、天然の折畳みおよび安定性の維持を補償する配列変化を決定するために、コンピューター処理方法を適用できる。   Rules have been clarified to determine appropriate substitution of antibody-binding surface residues (Meyer, DL, et al. (2001) Protein Science, 10: 491-503; Laroche, Y., (2000) Blood 96: 1425-1432; and Schwartz, HL, (1999) J. Mol. Biol., 287: 983-999). For example, aromatic surface residues are involved in antigen-antibody binding. Aromatic surface residues such as tyrosine can be replaced with small residues such as serine, alanine or glycine. Similarly, large patches of charged side chains can be replaced with small hydrophilic residues such as serine or alanine. Computer processing methods can then be applied to determine sequence changes that compensate for natural folding and maintenance of stability.

標的タンパク質の免疫原性を増加させることが望ましい状況もある。例えば、特定のエピトープに対するT細胞集団の活性化は、ウイルス性病原体または腫瘍形成を制御または排除するのに密接な関係を有する。この場合、標的タンパク質内のどこかにT細胞エピトープを導入するために、コンピューター処理方法を使用できる。さらに、本明細書に記載のコンピューター処理方法を使用して、ループ領域などの、固定度が低く、構造的な制限が少ない標的タンパク質の領域にT細胞エピトープを導入することもできる。その際、エピトープ挿入に隣接する残基を変更するために、コンピューター処理方法を使用し、天然のタンパク質と移植したエピトープとの間のエネルギー的適合性を確保する。   There are situations where it is desirable to increase the immunogenicity of the target protein. For example, activation of T cell populations against specific epitopes is closely related to controlling or eliminating viral pathogens or tumorigenesis. In this case, computational methods can be used to introduce T cell epitopes anywhere within the target protein. In addition, T cell epitopes can be introduced into regions of the target protein that are less fixed and less structurally restricted, such as loop regions, using the computer processing methods described herein. In doing so, computer processing methods are used to change the residues adjacent to the epitope insertion to ensure energetic compatibility between the native protein and the grafted epitope.

従って、本発明は、標的タンパク質の免疫原性の調節方法を提供する。本明細書における「調節」は、標的タンパク質に対する免疫反応が改変されることを意味する。つまり、標的タンパク質が所定の種で免疫反応を誘引するならば、免疫反応が減少するか、または増強されるように、標的タンパク質のアミノ酸配列を変化させる。本明細書における「減少」は、野生型タンパク質と比較して少なくとも1つの免疫学的反応が低減することを意味する。本明細書における「増強」は、野生型タンパク質と比較して少なくとも1つの免疫学的反応が増加することを意味する。当業者に認識されるように、反応を誘引する能力がある全同定配列を改変する必要があるわけではない。例えば、一般に免疫反応は、免疫グロブリンおよび他の血清タンパク質などの、自己由来循環タンパク質に対しては起こらない。従って、反応を誘起する能力のある配列の少なくとも5%を改変する。好ましくは少なくとも10%の配列を改変し、少なくとも15%の配列を改変するのがより好ましく、少なくとも20%の配列を改変するのがさらにより好ましく、少なくとも30%の配列を改変するのがさらにより好ましく、少なくとも40%の配列を改変するのがさらにより好ましく、少なくとも50%の配列を改変するのがより好ましく、100%の配列を改変するのが最も好ましい。   Accordingly, the present invention provides a method for modulating the immunogenicity of a target protein. “Modulation” as used herein means that the immune response to the target protein is altered. That is, if the target protein elicits an immune response in a given species, the amino acid sequence of the target protein is changed so that the immune response is reduced or enhanced. As used herein, “decrease” means that at least one immunological response is reduced compared to a wild-type protein. As used herein, “enhanced” means that at least one immunological response is increased compared to a wild-type protein. As will be appreciated by those skilled in the art, not all identified sequences that are capable of eliciting a response need be modified. For example, immune responses generally do not occur against autologous circulating proteins such as immunoglobulins and other serum proteins. Thus, at least 5% of the sequences capable of eliciting a response are modified. Preferably, at least 10% of the sequence is modified, more preferably at least 15% of the sequence is modified, more preferably at least 20% of the sequence is modified, even more preferably at least 30% of the sequence is modified. Preferably, at least 40% of the sequence is even more preferred, at least 50% of the sequence is more preferred, and 100% of the sequence is most preferred.

改変された免疫原性は、特定の宿主生物内で定義されることに留意すべきである。つまり、好ましい実施態様では、標的タンパク質(下記定義の通り)は、改変された免疫原性をヒト内で示すために改変される。これに代る宿主生物には、げっ歯類(ラット、マウス、ハムスター、モルモットなど)、霊長類、家畜動物(ヒツジ、ヤギ、ブタ、ウシ、ウマなど)、および家内動物(ネコ、イヌ、ウサギなど)が含まれるがこれらに限定されるわけではない。   It should be noted that altered immunogenicity is defined within a particular host organism. That is, in a preferred embodiment, the target protein (as defined below) is modified to show altered immunogenicity in humans. Alternative host organisms include rodents (rats, mice, hamsters, guinea pigs, etc.), primates, livestock animals (sheep, goats, pigs, cows, horses, etc.), and domestic animals (cats, dogs, rabbits). Such as, but not limited to.

本明細書における「免疫原性」は、免疫反応を誘起するタンパク質の能力を表す。免疫反応を誘起するタンパク質の能力は、タンパク質内のアミノ酸配列または配列類に依存する。下記概説するように、免疫原性には、免疫反応の体液性および細胞性の両成分が含まれる。免疫反応を誘起する能力があるアミノ酸配列は、本明細書で「免疫原性配列」と表す。好ましくは、免疫原性配列は、下記概説のように「MHC結合部位(即ち、MHC結合モチーフ)」、「T細胞エピトープ」および「B細胞エピトープ」を含む。   As used herein, “immunogenic” refers to the ability of a protein to elicit an immune response. The ability of a protein to elicit an immune response depends on the amino acid sequence or sequences within the protein. As outlined below, immunogenicity includes both humoral and cellular components of the immune response. Amino acid sequences capable of eliciting an immune response are referred to herein as “immunogenic sequences”. Preferably, the immunogenic sequence comprises an “MHC binding site (ie, MHC binding motif)”, “T cell epitope” and “B cell epitope” as outlined below.

本明細書で定義するように、免疫原性の定義は、用語「抗原性」を包含するに十分なほど広範である。「抗原性」は、非自己分子と認識されるとタンパク質が単独で抗体反応を誘起する能力を表す。   As defined herein, the definition of immunogenicity is broad enough to encompass the term “antigenic”. “Antigen” refers to the ability of a protein to elicit an antibody response by itself when recognized as a non-self molecule.

免疫原性配列を有するタンパク質によって誘起される反応には、免疫系の両構成要素が含まれる:体液性免疫と細胞性免疫である。従って、本発明の文脈における「免疫反応」は、体液性または細胞性免疫反応のいかなる構成要素をも含む。概説すると、免疫原性配列を有するタンパク質をヒトに投与すると、そのタンパク質は免疫系の体液性と細胞性の両武器の監視下におかれる。タンパク質が外来性と認識され、かつ免疫系がまだそのタンパク質内の免疫原性配列に対して寛容でない場合、免疫系はそのタンパク質に対して反応する。体液性免疫反応では、表面に免疫グロブリン(Ig)を表示している未成熟B細胞は、個々の免疫グロブリンに適合する親和性があり、かつIgがB細胞エピトープに接近できるようにB細胞エピトープが露出している場合、タンパク質内の1つまたはそれ以上の配列(B細胞エピトープ)に結合できる。タンパク質へのIg結合の過程は、好適なサイトカインの存在下で、B細胞が分化分裂するように刺激して、タンパク質と複合体を形成できる可溶性形態の原型Igを提供し、個体からのタンパク質の除去を促進できる。   The reaction elicited by a protein having an immunogenic sequence includes both components of the immune system: humoral immunity and cellular immunity. Thus, an “immune response” in the context of the present invention includes any component of a humoral or cellular immune response. In general, when a protein having an immunogenic sequence is administered to a human, the protein is under surveillance of both humoral and cellular weapons of the immune system. If a protein is recognized as foreign and the immune system is not yet tolerant to the immunogenic sequences within the protein, the immune system will react to the protein. In a humoral immune response, immature B cells displaying immunoglobulin (Ig) on the surface have an affinity that matches the individual immunoglobulin and allow the B cell epitope to be accessible to the Ig. Can be bound to one or more sequences (B cell epitopes) within the protein. The process of Ig binding to the protein provides a soluble form of native Ig that can stimulate B cells to divide and form a complex with the protein in the presence of a suitable cytokine. Removal can be promoted.

効果的なB細胞反応は、可溶性抗体を生じるのに必要なサイトカインおよび他のシグナルを与えるために、平行してT細胞反応も含む。効果的なT細胞反応には、抗原提示細胞(APC)によるタンパク質断片の取込みが必要である;APCには、B細胞、またはマクロファージ、樹状細胞および他の単球などの他の細胞が含まれる。次いでAPCはMHCクラスII分子と複合体を形成したタンパク質を細胞表面に提示する。そのようなペプチド−MHC II複合体は、T細胞受容体(TCR)を介してヘルパーT細胞によって認識されることができ、そしてこのことは、抗体産生細胞への分化においてB細胞に補助を与える、T細胞刺激およびサイトカインの分泌に至る。上記議論から分かるように、免疫原性タンパク質に対する効果的な一次免疫反応には、一般に、BおよびT細胞特異的配列またはエピトープに対するBおよびT細胞反応の組合せが必要である。   An effective B cell response also includes a T cell response in parallel to provide the cytokines and other signals necessary to generate soluble antibodies. An effective T cell response requires the uptake of protein fragments by antigen presenting cells (APCs); APCs include B cells or other cells such as macrophages, dendritic cells and other monocytes It is. The APC then presents the protein complexed with MHC class II molecules on the cell surface. Such peptide-MHC II complexes can be recognized by helper T cells via the T cell receptor (TCR) and this assists B cells in differentiation into antibody producing cells. Leading to T cell stimulation and cytokine secretion. As can be seen from the above discussion, an effective primary immune response to an immunogenic protein generally requires a combination of B and T cell responses to B and T cell specific sequences or epitopes.

あるいは、免疫原性配列がMHCクラスI分子に特異的である場合、MHC I抗原加工/提示経路が関わる。MHCクラスI分子は、感染病原体由来タンパク質または「自己」分子の断片を集め、次いでAPCの表面にこれらの断片を表示する。結合したペプチドは細胞傷害性Tリンパ球のTCRに認識され、細胞性免疫反応の一次抗原決定基である。従って、免疫原性の調節には、T細胞反応を刺激するペプチド、即ちT細胞エピトープを同定すること、そのタンパク質への細胞性反応が減少または増強されるようにそれらのペプチドの配列を変化させること、が含まれる。加えて、免疫原性の調節には、B細胞反応を刺激するペプチド、即ち「B細胞エピトープ」または「BCR」を同定すること、そのタンパク質への体液性の反応が改変されるようにこれらのペプチドの配列を変化させること、も含まれる。当業者に理解されるように、単一のタンパク質はTおよびB細胞エピトープの両方を含有し得るので、両方の調節により、免疫系の体液性と細胞性の両武器を改変し得る。   Alternatively, if the immunogenic sequence is specific for MHC class I molecules, the MHC I antigen processing / presentation pathway is involved. MHC class I molecules collect fragments of infectious agent-derived proteins or “self” molecules and then display these fragments on the surface of the APC. The bound peptide is recognized by the TCR of cytotoxic T lymphocytes and is the primary antigenic determinant of the cellular immune response. Thus, the regulation of immunogenicity involves identifying peptides that stimulate T cell responses, ie T cell epitopes, and changing the sequence of those peptides so that the cellular response to the protein is reduced or enhanced. That is included. In addition, the modulation of immunogenicity includes the identification of peptides that stimulate B cell responses, ie “B cell epitopes” or “BCRs”, such that the humoral response to the protein is altered. Changing the sequence of the peptide is also included. As will be appreciated by those skilled in the art, since a single protein can contain both T and B cell epitopes, both modulations can modify both humoral and cellular weapons of the immune system.

好ましい実施態様では、MHC I反応を改変するように標的タンパク質を改変する。MHCクラスI分子は、感染しているウイルス、細胞内寄生生物、または正常に発現しているか、腫瘍形成により制御を逸脱した自己タンパク質に由来するタンパク質断片を集め、これらの分子の断片を細胞表面に表示する。細胞表面では、APC上に露出している、細胞に結合したMHC I−ペプチド複合体がT細胞に対して表示される。MHC I分子の第2の特徴は、特定のMHC−ペプチド複合体を有するAPCが適切なTCRと噛合うようにする、TCRとの相互作用能力である。このことは、標的としてのAPCの細胞溶解を導く細胞性のプログラム、および/またはT細胞によるリンホカインの分泌の活性化における第1段階である。TCRとの相互作用はペプチドとMHC分子の両方に依存する。MHCクラスI分子は、CD8+細胞に対する選択的制限を示す。MHCクラスI分子のさらなる機能は、ナチュラルキラー細胞へのシグナル伝達の要素として作用することである(Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 8, pp 263-285)。   In a preferred embodiment, the target protein is modified to modify the MHC I response. MHC class I molecules collect protein fragments derived from infected viruses, intracellular parasites, or self-proteins that are normally expressed or deviated from control by tumorigenesis; To display. On the cell surface, the MHC I-peptide complex bound to the cells exposed on the APC is displayed to the T cells. The second feature of the MHC I molecule is the ability to interact with the TCR that allows APCs with specific MHC-peptide complexes to engage the appropriate TCR. This is the first step in the activation of the cellular program leading to the lysis of APC as a target and / or the secretion of lymphokines by T cells. Interaction with TCR depends on both peptides and MHC molecules. MHC class I molecules exhibit selective restriction on CD8 + cells. A further function of MHC class I molecules is to act as an element of signal transduction to natural killer cells (Fundamental Immunology, 4th edition, WE Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 8, pp 263- 285).

好ましい実施態様では、MHC II反応を改変するように標的タンパク質を改変する。MHCクラスI分子と同様の分子メカニズムを活用して、MHCクラスII分子は、MHC IIを発現しているAPCにより摂取されたタンパク質の分解に由来するペプチドに結合し、特異的T細胞に認識されるようにそれらを細胞表面に表示する。MHC II抗原提示経路は、MHC IIαβヘテロダイマーの、二重機能分子、即ち、不変鎖(Ii)との最初の会合をベースとする。Iiは、αβヘテロダイマーが抗原ペプチドと出会うエンドソームの酸性のタンパク質加工場所へ、αβヘテロダイマーを導くシャペロンとして作用する。抗原ペプチドをMHC II分子にロードする(load)過程により、MHC IIペプチド複合体の細胞表面提示が導かれる。MHC IIを認識しているT細胞は、次いでリンホカインを分泌し、増殖するように誘導され得る。MHCクラスII分子は、CD4+細胞に選択的制限を示す(Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 8, pp 263-285)。   In a preferred embodiment, the target protein is modified to modify the MHC II response. Utilizing the same molecular mechanism as MHC class I molecules, MHC class II molecules bind to peptides derived from the degradation of proteins ingested by APCs expressing MHC II and are recognized by specific T cells. Display them on the cell surface. The MHC II antigen presentation pathway is based on the initial association of the MHC II αβ heterodimer with a dual function molecule, ie, the invariant chain (Ii). Ii acts as a chaperone that directs the αβ heterodimer to the acidic protein processing site of the endosome where the αβ heterodimer meets the antigenic peptide. The process of loading the antigenic peptide onto the MHC II molecule leads to cell surface presentation of the MHC II peptide complex. T cells that recognize MHC II can then be induced to secrete lymphokines and proliferate. MHC class II molecules exhibit selective restriction on CD4 + cells (Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 8, pp 263-285).

好ましい実施態様では、TCR反応を改変するように標的タンパク質を改変する。TCRは、2つの別個のヘテロダイマー、αβまたはγδとして生じ、これらの両者は非多型CD3ポリペプチドγ、δ、ε、ζと共に発現する。CD3ポリペプチド、特にζおよびその変異体は、細胞内シグナル伝達に非常に重要である。αβTCRヘテロダイマー発現細胞は、殆どのリンパ球区画で支配的であり、古典的なヘルパーまたは細胞傷害性T細胞反応を担う。殆どの場合、αβTCRリガンドは、クラスIまたはクラスII MHC分子に結合したペプチド抗原である(Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 10, pp 341-367)。   In a preferred embodiment, the target protein is modified to modify the TCR response. TCR occurs as two separate heterodimers, αβ or γδ, both of which are expressed with non-polymorphic CD3 polypeptides γ, δ, ε, ζ. CD3 polypeptides, particularly ζ and its variants, are very important for intracellular signaling. αβTCR heterodimer expressing cells are dominant in most lymphocyte compartments and are responsible for classical helper or cytotoxic T cell responses. In most cases, the αβTCR ligand is a peptide antigen bound to a class I or class II MHC molecule (Fundamental Immunology, 4th edition, WE Paul, ed., Lippincott-Raven Publishers, 1999, Chapter 10, pp 341-367). .

好ましい実施態様では、BCR反応を改変するように標的タンパク質を改変する。特異的B細胞との抗原の接触は、B細胞抗原受容体(BCR)の膜貫通シグナル伝達機能を引き起こす。BCR分子は、抗原結合後迅速に内在化し、抗原取込みおよびエンドソームまたはリソソームにおける分解を導く。タンパク質抗原の場合、抗原由来ペプチドは、クラスII MHC分子の溝の中で結合する。結合すると、この複合体は細胞表面に送達され、そこで特異的ヘルパーT細胞の刺激物質として作用する。ヘルパーT細胞による抗原認識は、ヘルパーT細胞が緊密かつ長期継続であるB細胞との相互作用を形成し、B細胞増殖および分化因子を合成するように誘導する。このようにして活性化されたB細胞は、増殖し、ついには抗体分泌細胞(プラズマ細胞とも呼ばれる)に分化する(Fundamental Immunology, 4th edition, W. E. Paul, ed., Lippincott-Raven Publishers, 1999, Chapters 6-7, pp 183-261)。   In a preferred embodiment, the target protein is modified to modify the BCR response. Contact of the antigen with specific B cells causes the transmembrane signaling function of the B cell antigen receptor (BCR). BCR molecules are internalized rapidly after antigen binding, leading to antigen uptake and degradation in endosomes or lysosomes. In the case of protein antigens, antigen-derived peptides bind in the groove of class II MHC molecules. Upon binding, this complex is delivered to the cell surface where it acts as a stimulator for specific helper T cells. Antigen recognition by helper T cells induces helper T cells to form tight and long-lasting interactions with B cells and synthesize B cell proliferation and differentiation factors. B cells activated in this way proliferate and finally differentiate into antibody-secreting cells (also called plasma cells) (Fundamental Immunology, 4th edition, WE Paul, ed., Lippincott-Raven Publishers, 1999, Chapters). 6-7, pp 183-261).

従って、本発明は標的タンパク質の免疫原性の調節方法を対象としている。本明細書において「標的タンパク質」とは、共有結合した少なくとも2つのアミノ酸を意味し、タンパク質、ポリペプチド、オリゴペプチドおよびペプチドが含まれる。該タンパク質は、天然産生のアミノ酸およびペプチド結合または合成ペプチド模倣構造、即ち、ペプトイド(peptoid)などの「類似体」(Simon et al., Proc. Natl. Acad. Sci. U.S.A. 89 (20):9367-71 (1992)参照)からなってもよく、一般に合成法に依存する。従って本明細書において「アミノ酸」または「ペプチド残基」とは、天然産生のアミノ酸と合成アミノ酸の両方を意味する。例えば、ホモフェニルアラニン、シトルリンおよびノルロイシンは、本発明のためのアミノ酸と考えられる。また「アミノ酸」には、プロリンおよびヒドロキシプロリンなどのイミノ酸残基が含まれる。加えて、本発明の変異タンパク質の構成要素を表すいかなるアミノ酸も、同じアミノ酸であるが反対のキラリティーのもので置換できる。従って、L配置で天然に産生するいかなるアミノ酸(これらは化学物質の構造によって、RまたはSとも呼ばれる)も、同じ化学構造であるが反対のキラリティーのアミノ酸で置換できる。これは一般にDアミノ酸と呼ばれるが、その組成および化学配置によってさらにRまたはSと呼ばれる。一般的に、そのような誘導体は、安定性が大幅に増加する特性を有し、従って経口、静脈内、筋肉内、腹膜内、局所、直腸、眼内または他の経路で投与するときに、インビボでのハーフライフがより長い化合物の形成に有利である。   Accordingly, the present invention is directed to a method for modulating the immunogenicity of a target protein. As used herein, “target protein” means at least two amino acids covalently bound, and includes proteins, polypeptides, oligopeptides and peptides. The protein comprises naturally occurring amino acids and peptide bonds or synthetic peptidomimetic structures, ie “analogs” such as peptoids (Simon et al., Proc. Natl. Acad. Sci. USA 89 (20): 9367. -71 (1992)) and generally depends on the synthesis method. Therefore, in the present specification, “amino acid” or “peptide residue” means both naturally-occurring amino acids and synthetic amino acids. For example, homophenylalanine, citrulline and norleucine are considered amino acids for the present invention. “Amino acid” also includes imino acid residues such as proline and hydroxyproline. In addition, any amino acid representing a component of the mutant protein of the invention can be replaced with the same amino acid but with the opposite chirality. Thus, any amino acids that are naturally produced in the L configuration (these are also referred to as R or S, depending on the structure of the chemical), can be substituted with amino acids of the same chemical structure but of the opposite chirality. This is commonly referred to as a D amino acid, but is further called R or S depending on its composition and chemical configuration. In general, such derivatives have the property of greatly increasing stability, and therefore when administered by oral, intravenous, intramuscular, intraperitoneal, topical, rectal, intraocular or other routes. It is advantageous for the formation of compounds with a longer half-life in vivo.

好ましい実施態様では、該アミノ酸は(S)またはL配置である。非天然産生側鎖を用いる場合は、例えばインビボ分解の防止または遅延のために非アミノ酸置換基を用いてもよい。非天然産生アミノ酸を含むタンパク質は、合成してもよく、組換え的に作成する場合もある;van Hest et al., FEBS Lett 428:(1-2) 68-70 May 22 1998 and Tang et al., Abstr. Pap Am. Chem. S218:U138-U138 Part 2 August 22, 1999 を参照のこと。両者を出典明示により本明細書の一部とする。   In a preferred embodiment, the amino acid is in the (S) or L configuration. If non-naturally occurring side chains are used, non-amino acid substituents may be used, for example to prevent or retard in vivo degradation. Proteins containing non-naturally occurring amino acids may be synthesized or may be made recombinantly; van Hest et al., FEBS Lett 428: (1-2) 68-70 May 22 1998 and Tang et al ., Abstr. Pap Am. Chem. S218: U138-U138 Part 2 August 22, 1999. Both are hereby incorporated by reference.

芳香族アミノ酸は、D−またはL−ナフィル(naphyl)アラニン、D−またはL−フェニルグリシン、D−またはL−2−チエニルアラニン、D−またはL−1−,2−,3−または4−ピレニルアラニン、D−またはL−3−チエニルアラニン、D−またはL−(2−ピリジニル)−アラニン、D−またはL−(3−ピリジニル)−アラニン、D−またはL−(2−ピラジニル)−アラニン、D−またはL−(4−イソプロピル)−フェニルグリシン、D−(トリフルオロメチル)−フェニルグリシン、D−(トリフルオロメチル)−フェニルアラニン、D−p−フルオロフェニルアラニン、D−またはL−p−ビフェニルフェニルアラニン、D−またはL−p−メトキシビフェニルフェニルアラニン、D−またはL−2−インドール(アルキル)アラニン、およびD−またはL−アルキルアイニン(ainine)(ただしアルキルは置換または非置換メチル、エチル、プロピル、ヘキシル、ブチル、ペンチル、イソプロピル、イソ−ブチル、sec−イソチル(isotyl)、イソ−ペンチルおよびC1−C20の非酸性アミノ酸である)で置換してもよい。   Aromatic amino acids are D- or L-naphyl alanine, D- or L-phenylglycine, D- or L-2-thienylalanine, D- or L-1-, 2-, 3- or 4- Pyrenylalanine, D- or L-3-thienylalanine, D- or L- (2-pyridinyl) -alanine, D- or L- (3-pyridinyl) -alanine, D- or L- (2-pyrazinyl) -alanine , D- or L- (4-isopropyl) -phenylglycine, D- (trifluoromethyl) -phenylglycine, D- (trifluoromethyl) -phenylalanine, Dp-fluorophenylalanine, D- or Lp- Biphenylphenylalanine, D- or Lp-methoxybiphenylphenylalanine, D- or L-2-indole (Al ) Alanine, and D- or L-alkyl ainine, where alkyl is substituted or unsubstituted methyl, ethyl, propyl, hexyl, butyl, pentyl, isopropyl, iso-butyl, sec-isotyl, iso -Pentyl and C1-C20 non-acidic amino acids).

酸性アミノ酸は、非限定的な例として(ホスホノ)アラニン、グリシン、ロイシン、イソロイシン、スレオニン、または セリン;または硫酸化 (例えば、−SOH) スレオニン、セリン、またはチロシンなどの、負電荷を維持している非カルボン酸アミノ酸およびそれらの誘導体または類似体で置換できる。 Acidic amino acids maintain a negative charge, such as (phosphono) alanine, glycine, leucine, isoleucine, threonine, or serine; or sulfated (eg, —SO 3 H) threonine, serine, or tyrosine as non-limiting examples Non-carboxylic acid amino acids and derivatives or analogs thereof.

他の置換には、任意の天然アミノ酸と「アルキル」を組合せて作成し得る非天然水酸化アミノ酸が含まれ得る。本明細書で使用する用語「アルキル」は、メチル、エチル、n−プロピル、イソプロピル、n−ブチル、イソブチル、t−ブチル、オクチル、デシル、テトラデシル、ヘキサデシル、エイコシル、テトラシシルなどの、1ないし24個の炭素原子の分枝または非分枝飽和炭化水素基を意味する。アルキルには、窒素、酸素および硫黄原子を有するヘテロアルキルが含まれる。本発明で好ましいアルキル基は、1ないし12個の炭素原子を含有する。塩基性アミノ酸は、天然産生アミノ酸のリシン、アルギニン、オルニチン、シトルリン、または(グアニジノ)−酢酸、または他の(グアニジノ)アルキル−酢酸(但し、「アルキル」は上記定義の通りである)の任意の位置でアルキル基で置換し得る。ニトリル誘導体(例えば、COOHの代りにCN部分を含有する)も、アスパラギンまたはグルタミンを置換し得、そしてメチオニンスルフォキシドはメチオニンを置換し得る。そのようなペプチド誘導体の調製方法は、当業者に周知である。   Other substitutions may include unnatural hydroxylated amino acids that may be made by combining “alkyl” with any natural amino acid. As used herein, the term “alkyl” refers to 1 to 24 such as methyl, ethyl, n-propyl, isopropyl, n-butyl, isobutyl, t-butyl, octyl, decyl, tetradecyl, hexadecyl, eicosyl, tetracycyl and the like. Means a branched or unbranched saturated hydrocarbon group of carbon atoms. Alkyl includes heteroalkyl having nitrogen, oxygen and sulfur atoms. Preferred alkyl groups in the present invention contain 1 to 12 carbon atoms. The basic amino acid is any of the naturally occurring amino acids lysine, arginine, ornithine, citrulline, or (guanidino) -acetic acid, or other (guanidino) alkyl-acetic acid (where “alkyl” is as defined above). It can be substituted with an alkyl group at the position. Nitrile derivatives (eg containing a CN moiety instead of COOH) can also replace asparagine or glutamine, and methionine sulfoxide can replace methionine. Methods for preparing such peptide derivatives are well known to those skilled in the art.

加えて、任意の変異ポリペプチド中の任意のアミド結合を、ケトメチレン部分で置換することができる。そのような誘導体は、酵素による分解に対する安定性が増加している特性を有し、従って経口、静脈内、筋肉内、腹膜内、局所、直腸、眼内または他の経路で投与するときに、インビボでのハーフライフがより長い化合物の形成に有利であると期待される。   In addition, any amide bond in any mutant polypeptide can be replaced with a ketomethylene moiety. Such derivatives have the property of increasing stability against enzymatic degradation, and thus when administered by oral, intravenous, intramuscular, intraperitoneal, topical, rectal, intraocular or other routes. It is expected to be advantageous for the formation of compounds with longer half lives in vivo.

本発明の変異ポリペプチドのアミノ酸のさらなるアミノ酸修飾には、以下のものが含まれ得る:システイニル残基を2−クロロ酢酸またはクロロアセトアミドなどのアルファ−ハロ酢酸塩(および相応するアミン)と反応させて、カルボキシメチルまたはカルボキシアミドメチル誘導体を得る。システイニル残基は、ブロモトリフルオロアセトン、アルファ−ブロモ−ベータ−(5−イミドゾイル)プロピオン酸、クロロアセチルリン酸塩、N−アルキルマレイミド、3−ニトロ−2−ピリジルジスルフィド、メチル2−ピリジルジスルフィド、p−クロロ水銀安息香酸塩、2−クロロ水銀−4−ニトロフェノール、またはクロロ−7−ニトロベンゾ−2−オキサ−1,3−ジアゾールなどの化合物との反応によっても誘導体化し得る。   Further amino acid modifications of the amino acids of the mutant polypeptides of the invention may include the following: reacting a cysteinyl residue with an alpha-haloacetate salt (and corresponding amine) such as 2-chloroacetic acid or chloroacetamide. To obtain a carboxymethyl or carboxyamidomethyl derivative. Cysteinyl residues include bromotrifluoroacetone, alpha-bromo-beta- (5-imidozoyl) propionic acid, chloroacetyl phosphate, N-alkylmaleimide, 3-nitro-2-pyridyl disulfide, methyl 2-pyridyl disulfide, It can also be derivatized by reaction with compounds such as p-chloromercury benzoate, 2-chloromercury-4-nitrophenol, or chloro-7-nitrobenzo-2-oxa-1,3-diazole.

ヒスチジル残基は、ジエチルプロ炭酸塩(例えばpH5.5−7.0で、なぜならこの物質はヒスチジル側鎖に比較的特異的であるので)などの化合物との反応により誘導体化し得、パラ−ブロモフェナシル(bromophenacyl)臭化物も使用し得る;例えば、その場合、好ましくはpH6.0の0.1Mカコジル酸ナトリウム中で反応を実施する。   A histidyl residue can be derivatized by reaction with a compound such as diethyl procarbonate (eg, at pH 5.5-7.0, since this material is relatively specific for the histidyl side chain), and para-bromophenacyl (Bromophenacyl) bromide may also be used; for example, in that case, the reaction is preferably carried out in 0.1 M sodium cacodylate at pH 6.0.

リシニルおよびアミノ末端残基は、スクシン酸または他のカルボン酸無水物と反応させ得る。これらの試薬による誘導は、リシニル残基の電荷を逆転させる効果を有すると期待される。   Ricinyl and amino terminal residues can be reacted with succinic acid or other carboxylic anhydrides. Induction with these reagents is expected to have the effect of reversing the charge of the ricinyl residue.

アルファ−アミノ含有残基を誘導するのに適する他の試薬には、メチルピコリンイミダートなどのイミドエステル;ピリドキサルリン酸塩;ピリドキサール;クロロボロヒドリド;トリニトロベンゼンスルホン酸;O−メチルイソ尿素;2,4ペンタンジオンなどの化合物;およびグリオキシル酸塩とのトランスアミナーゼ触媒反応が含まれる。アルギニル残基は、1または複数の従来の試薬、とりわけフェニルグリオキサール、2,3−ブタンジオン、1,2−シクロヘキサンジオンおよびニンヒドリンとの反応により、既知方法の段階に従って修飾し得る。アルギニン残基の誘導には、グアニジン官能基のpKaが高いために、反応をアルカリ性条件で実施することが必要である。さらに、これらの試薬は、アルギニンのイプシロン−アミノ基と同様に、リシンの基と反応させ得る。芳香族ジアゾニウム化合物またはテトラニトロメタンとの反応によりスペクトル標識をチロシル残基に導入するためなどの、チロシル残基自体の特異的修飾は周知である。   Other reagents suitable for deriving alpha-amino containing residues include imide esters such as methylpicolinimidate; pyridoxal phosphate; pyridoxal; chloroborohydride; trinitrobenzene sulfonic acid; O-methylisourea; Transaminase-catalyzed reaction with compounds such as pentanedione; and glyoxylate. Arginyl residues may be modified according to known method steps by reaction with one or more conventional reagents, notably phenylglyoxal, 2,3-butanedione, 1,2-cyclohexanedione and ninhydrin. Inducing arginine residues, the pKa of the guanidine functional group is high, so it is necessary to carry out the reaction under alkaline conditions. Furthermore, these reagents can be reacted with lysine groups as well as the epsilon-amino group of arginine. Specific modifications of tyrosyl residues themselves, such as to introduce spectral labels into tyrosyl residues by reaction with aromatic diazonium compounds or tetranitromethane are well known.

N−アセチルイミジゾールおよびテトラニトロメタンは、各々O−アセチルチロシル種および3−ニトロ誘導体を形成するために使用し得る。カルボキシル側鎖基(アスパルチルまたはグルタミル)は、1−シクロヘキシル−3−(2−モルホリニル−(4−エチル)カルボジイミドまたは1−エチル−3−(4−アゾニア−4,4−ジメチルペンチル)カルボジイミドなどのカルボジイミド(R'−N−C−N−R')との反応により、選択的に修飾し得る。さらに、アスパルチルおよびグルタミル残基は、アンモニウムイオンとの反応によりアスパラギニルおよびグルタミニル残基に変換し得る。   N-acetylimidizole and tetranitromethane can be used to form O-acetyl tyrosyl species and 3-nitro derivatives, respectively. Carboxyl side chain groups (aspartyl or glutamyl) include 1-cyclohexyl-3- (2-morpholinyl- (4-ethyl) carbodiimide or 1-ethyl-3- (4-azonia-4,4-dimethylpentyl) carbodiimide Can be selectively modified by reaction with carbodiimide (R′—N—C—N—R ′) In addition, aspartyl and glutamyl residues can be converted to asparaginyl and glutaminyl residues by reaction with ammonium ions. .

グルタミニルおよびアスパラギニル残基は、頻繁に相応するグルタミルおよびアスパルチル残基に脱アミド化される。あるいは、これらの残基は穏かな酸性条件下で脱アミド化し得る。これらの残基のいずれの形態も、本発明の範囲内にある。   Glutaminyl and asparaginyl residues are frequently deamidated to the corresponding glutamyl and aspartyl residues. Alternatively, these residues can be deamidated under mildly acidic conditions. Either form of these residues is within the scope of the present invention.

標的タンパク質は、3次元構造が既知であるかまたは生成できる、即ちタンパク質の各原子について3次元座標が存在する任意のタンパク質であり得る。一般的に、これは、X線結晶技法、NMR技法、新規モデリング、相同性モデリングなどを用いて測定できる。一般に、X線構造を使用する場合、2Å解像能またはそれより高解像能での構造が好ましいが、必ずしも必要なわけではない。   The target protein can be any protein whose three-dimensional structure is known or can be generated, ie there are three-dimensional coordinates for each atom of the protein. In general, this can be measured using X-ray crystal techniques, NMR techniques, novel modeling, homology modeling, and the like. In general, when an X-ray structure is used, a structure with 2 構造 resolution or higher resolution is preferable, but it is not always necessary.

本発明の標的タンパク質は、細菌(古細菌のような好極限性細菌を含む)、真菌、昆虫、魚類および哺乳動物などの原核生物および真核生物に由来し得る。適する哺乳動物には、げっ歯類(ラット、マウス、ハムスター、モルモットなど)、霊長類、家畜動物(ヒツジ、ヤギ、ブタ、ウシ、ウマなどを含む)が含まれるがこれらに限定されるわけではなく、最も好ましい実施態様では、ヒト由来である。   The target proteins of the invention can be derived from prokaryotes and eukaryotes such as bacteria (including extreme bacteria such as archaea), fungi, insects, fish and mammals. Suitable mammals include, but are not limited to, rodents (rats, mice, hamsters, guinea pigs, etc.), primates, livestock animals (including sheep, goats, pigs, cows, horses, etc.). In the most preferred embodiment, it is human.

即ち、本明細書では「標的タンパク質」は、好ましくは免疫原性が改変された変異体のライブラリーが望まれるタンパク質を意味する。当業者に理解されるように、いかなる数の標的タンパク質も本発明では有用である。具体的には、酵素ドメイン、結合ドメインなどの機能的ドメイン、およびターン、ループなどの小型フラグメントを含む、既知タンパク質のフラグメントおよびドメインは、「タンパク質」の定義内に含まれる。即ち、タンパク質の一部も同様に使用され得る。さらに、本明細書で使用する「タンパク質」は、タンパク質、オリゴペプチドおよびペプチドを包含する。さらに、タンパク質変異体、即ち非天然産生タンパク質類似体構造も使用され得る。   That is, as used herein, “target protein” preferably refers to a protein for which a library of variants with altered immunogenicity is desired. As will be appreciated by those skilled in the art, any number of target proteins are useful in the present invention. Specifically, fragments and domains of known proteins, including functional domains such as enzyme domains, binding domains, and small fragments such as turns, loops, are included within the definition of “protein”. That is, a portion of the protein can be used as well. Furthermore, “protein” as used herein encompasses proteins, oligopeptides and peptides. In addition, protein variants, i.e. non-naturally occurring protein analog structures, can also be used.

適するタンパク質には、リガンド、細胞表面受容体、抗原、抗体、サイトカイン、ホルモン、転写因子、シグナルモジュール、細胞骨格タンパク質および酵素を含む、産業用、医薬用および農業用タンパク質が含まれるが、これらに限定されるわけではない。適する種類の酵素には、プロテアーゼ、カルボヒドラーゼ、リパーゼなどの加水分解酵素、ラセマーゼ、エピメラーゼ、タウトメラーゼ、またはムターゼなどのイソメラーゼ、トランスフェラーゼ、キナーゼ、オキシドリダクターゼおよびホスファターゼがあるが、これらに限定されるわけではない。適する酵素はスイス−プロット酵素データベースに列挙されている。適するタンパク質主鎖には、Research Collaboratory for Structural Bioinformatics(RCSB, 前身は the Brookhaven National Lab)により編集および提供されたタンパク質データベースに見出されるもの全てが含まれるが、これらに限定されるわけではない。   Suitable proteins include industrial, pharmaceutical and agricultural proteins, including ligands, cell surface receptors, antigens, antibodies, cytokines, hormones, transcription factors, signal modules, cytoskeletal proteins and enzymes. It is not limited. Suitable types of enzymes include, but are not limited to, hydrolases such as proteases, carbohydrases, lipases, isomerases such as racemases, epimerases, tautomers, or mutases, transferases, kinases, oxidoreductases and phosphatases. . Suitable enzymes are listed in the Swiss-plot enzyme database. Suitable protein backbones include, but are not limited to, those found in protein databases compiled and provided by Research Collaboratory for Structural Bioinformatics (RCSB, formerly the Brookhaven National Lab).

特に、好ましい医薬用標的タンパク質には、サイトカイン類(IL−1ra(+受容体複合体)、IL−1(受容体単独)、IL−1a、IL−1b(変異体および/または受容体複合体を含む)、IL−2、IL−3、IL−4、IL−5、IL−6、IL−8、IL−10、IFN−β、INF−γ、IFN−α−2a;IFN−α−2B、TNF−α;CD40リガンド(chk)、ヒト肥満タンパク質レプチン、顆粒球コロニー刺激因子、骨形態形成タンパク質−7、毛様体神経栄養因子、顆粒球マクロファージコロニー刺激因子、単球化学誘導タンパク質1、マクロファージ遊走阻止因子、ヒトグリコシル化阻害因子、ヒトランテス、ヒトマクロファージ炎症タンパク質1ベータ、ヒト成長ホルモン、白血病阻害因子、ヒト黒色腫増殖刺激活性、好中球活性化ペプチド−2、Cc−ケモカインMcp−3、血小板因子M2、好中球活性化ペプチド2、エオタキシン(Eotaxin)、間質細胞由来因子−1、インシュリン、インシュリン様増殖因子I、インシュリン様成長因子II、トランスフォーミング増殖因子B1、トランスフォーミング増殖因子B2、トランスフォーミング増殖因子B3、トランスフォーミング増殖因子A、血管内皮細胞増殖因子(VEGF)、酸性線維芽細胞成長因子、塩基性線維芽細胞成長因子、内皮細胞成長因子、神経発育因子、脳由来神経栄養因子、毛様体神経栄養因子、血小板由来増殖因子、ヒト肝細胞増殖因子、神経膠細胞由来神経栄養因子(およびPDB1/12/99における55のサイトカイン類));ウロキナーゼ;エリトロポイエチン;ヘッジホッグ(hedgehog)・ソニック、ヘッジホッグ・デザート、ヘッジホッグ・インディアン、hCGを含むがこれらに限定されるわけではない、他の細胞外シグナル伝達部分;TPAおよび因子VIIaを含むがこれらに限定されるわけではない、凝固因子;p53、p53四量体化ドメイン、Znフィンガー(そのうち12個以上が構造を有する)、ホメオドメイン(そのうち8個が構造を有する)、ロイシンジッパー(そのうち4個が構造を有する)を含むがこれらに限定されるわけではない、転写因子;cFvを含むがこれらに限定されるわけではない、抗体;血球凝集素四量体化ドメインおよびhiv Gp41エクトドメイン(融合ドメイン)を含むがこれらに限定されるわけではない、ウイルスタンパク質;SH2ドメイン(そのうち8構造は既知である)、SH3ドメイン(そのうち11個は構造を有する)、およびプレクスチン相同性ドメインを含むがこれらに限定されるわけではない、細胞内シグナルモジュール;Gp130のヒト組織因子サイトカイン結合性領域の細胞外領域、G−CSF受容体、エリトロポイエチン受容体、線維芽細胞増殖因子受容体、TNF受容体、IL−1受容体、IL−1受容体/IL1ra複合体、IL−4受容体、INF−γ受容体アルファ鎖、MHCクラスI、MHCクラスII、T細胞受容体、インシュリン受容体、インシュリン受容体、インシュリン受容体チロシンキナーゼおよびヒト成長ホルモン受容体を含むがこれらに限定されるわけではない、受容体を含む、既知構造を有するもの(変異体を含む)が含まれるが、これらに限定されるわけではない。   Particularly preferred pharmaceutical target proteins include cytokines (IL-1ra (+ receptor complex), IL-1 (receptor alone), IL-1a, IL-1b (mutant and / or receptor complex) IL-2, IL-3, IL-4, IL-5, IL-6, IL-8, IL-10, IFN-β, INF-γ, IFN-α-2a; IFN-α- 2B, TNF-α; CD40 ligand (chk), human obesity protein leptin, granulocyte colony stimulating factor, bone morphogenic protein-7, ciliary neurotrophic factor, granulocyte macrophage colony stimulating factor, monocyte chemistry-inducing protein 1 , Macrophage migration inhibitory factor, human glycosylation inhibitor, human lantes, human macrophage inflammatory protein 1 beta, human growth hormone, leukemia inhibitory factor, human melanoma growth Stimulating activity, neutrophil activating peptide-2, Cc-chemokine Mcp-3, platelet factor M2, neutrophil activating peptide 2, eotaxin, stromal cell-derived factor-1, insulin, insulin-like growth factor I, insulin-like growth factor II, transforming growth factor B1, transforming growth factor B2, transforming growth factor B3, transforming growth factor A, vascular endothelial growth factor (VEGF), acidic fibroblast growth factor, basic Fibroblast growth factor, endothelial cell growth factor, nerve growth factor, brain-derived neurotrophic factor, ciliary neurotrophic factor, platelet-derived growth factor, human hepatocyte growth factor, glial cell-derived neurotrophic factor (and PDB1 / 55 cytokines in 12/99)); urokinase; erythropoietin Other extracellular signaling moieties including but not limited to hedgehog sonic, hedgehog desert, hedgehog indian, hCG; including but not limited to TPA and factor VIIa Coagulation factors; p53, p53 tetramerization domain, Zn finger (of which more than 12 have structure), homeodomain (of which 8 have structure), leucine zipper (of which 4 are A transcription factor; including but not limited to cFv; an antibody; a hemagglutinin tetramerization domain and a hiv Gp41 ectodomain (fusion domain) ) Viral proteins; SH2 domains (including but not limited to) 8 of which are known), an SH3 domain (of which 11 have structure), and an intracellular signal module including, but not limited to, a plexin homology domain; a human tissue factor cytokine of Gp130 Extracellular region of binding region, G-CSF receptor, erythropoietin receptor, fibroblast growth factor receptor, TNF receptor, IL-1 receptor, IL-1 receptor / IL1ra complex, IL -4 receptor, INF-γ receptor alpha chain, MHC class I, MHC class II, T cell receptor, insulin receptor, insulin receptor, insulin receptor tyrosine kinase and human growth hormone receptor. Including but not limited to receptors with known structures (including variants), including receptors, However, it is not limited to these.

医薬用タンパク質の定義には、免疫原性配列送達用の輸送手段(vehicle)として作用できる可溶性タンパク質も含まれる。可溶性タンパク質の例には、アルブミン、グロブリン、血液および他の体液中に存在する他のタンパク質、および実質的に非免疫原性のいかなる他のタンパク質も含まれるが、これらに限定されるわけではない。本明細書において、「実質的に非免疫原性のタンパク質」は、対象中で免疫反応を誘起しない、いかなるタンパク質をも意味する。実質的に非免疫原性のタンパク質は、天然産生、合成、または当業者に公知の組換え技法を使用して改変されたものであり得る。好ましくは、送達輸送手段として使用される可溶性タンパク質には、Zn−アルファ2−糖タンパク質(Sanchez, L.M., (1997) Proc. Natl. Acad. Sci., 94:4626-4630; Sanchez, L.M., et al., (1999) Science, 283:1914-1919;両方を出典明示により本明細書の一部とする)、ヒト血清アルブミン(HSA)、IgGおよび他の実質的に非免疫原性のタンパク質が含まれるが、これらに限定されるわけではない。   The definition of pharmaceutical protein also includes soluble proteins that can act as vehicles for immunogenic sequence delivery. Examples of soluble proteins include, but are not limited to, albumin, globulins, other proteins present in blood and other body fluids, and any other protein that is substantially non-immunogenic. . As used herein, “substantially non-immunogenic protein” means any protein that does not elicit an immune response in a subject. Substantially non-immunogenic proteins can be naturally occurring, synthetic, or modified using recombinant techniques known to those skilled in the art. Preferably, soluble proteins used as delivery vehicles include Zn-alpha 2-glycoprotein (Sanchez, LM, (1997) Proc. Natl. Acad. Sci., 94: 4626-4630; Sanchez, LM, et al., (1999) Science, 283: 1914-1919; both of which are hereby incorporated by reference), human serum albumin (HSA), IgG and other substantially non-immunogenic proteins. Including, but not limited to.

特に、好ましい産業用標的タンパク質には、プロテアーゼ(パパイン、サブチリシンを含むが、これらに限定されるわけではない)セルラーゼ(エンドグルカナーゼI、IIおよびIII、エキソグルカナーゼ、キシラナーゼ、リグニナーゼ、セロビオヒドロラーゼI、IIおよびIIIを含むが、これらに限定されるわけではない)、カルボヒドラーゼ(グルコアミラーゼ、α−アミラーゼ、グルコースイソメラーゼを含むが、これらに限定されるわけではない)およびリパーゼを含む、既知構造を有するもの(変異体を含む)が含まれるが、これらに限定されるわけではない。   In particular, preferred industrial target proteins include protease (including but not limited to papain, subtilisin) cellulases (endoglucanases I, II and III, exoglucanases, xylanases, ligninases, cellobiohydrolase I, Having a known structure, including but not limited to II and III, carbohydrase (including but not limited to glucoamylase, α-amylase, glucose isomerase) and lipase (Including mutants), but are not limited to these.

特に、好ましい農業用標的タンパク質には、キシロースイソメラーゼ、ペクチナーゼ、セルラーゼ、ペルオキシダーゼ、ルビスコ、ADPグルコースフロホスホルリアーゼ、並びに油生合成、ステロール生合成、炭水化物生合成および二次代謝物の合成に関わる酵素を含む、既知構造を有するもの(変異体を含む)が含まれるが、これらに限定されるわけではない。   In particular, preferred agricultural target proteins include xylose isomerase, pectinase, cellulase, peroxidase, rubisco, ADP glucose furophosphorylase, and enzymes involved in oil biosynthesis, sterol biosynthesis, carbohydrate biosynthesis and secondary metabolite synthesis Including, but not limited to, those having a known structure (including mutants).

好ましい実施態様では、本発明の方法は、標的タンパク質で開始すること、および一次配列のセットを生成させるためにコンピューター処理分析を使用することを包含する。関連するタンパク質の配列アラインメント、構造アラインメント、構造予測モデル、データベース、または(好ましくは)タンパク質設計オートメーションのコンピューター処理分析を含む、使用できる多様なコンピューター処理方法がある。まとめて、これらのコンピューター処理方法を、本明細書では「コンピューター処理のタンパク質設計アルゴリズム」と呼ぶ。同様に、(分子力学計算、モンテカルロ分析などの任意の数の技法を使用して)出発構造を乱してタンパク質を変化させること(主鎖および側鎖のねじれ角の変化を含む)によって創出した骨格構造のセットを使用する配列スクリーニングを介して、一次変異配列ライブラリーを生成できる。各出発構造(または、上位配列のいくつかのセット)について最適配列を選択し、一次変異配列ライブラリーを作成する。   In a preferred embodiment, the methods of the invention include starting with a target protein and using computerized analysis to generate a set of primary sequences. There are a variety of computerized methods that can be used, including sequence alignments, structural alignments, structural prediction models, databases, or (preferably) protein design automation computerized analysis of related proteins. Collectively, these computer processing methods are referred to herein as “computerized protein design algorithms”. Similarly, created by perturbing the starting structure (using any number of techniques such as molecular mechanics calculations, Monte Carlo analysis, etc.) and altering the protein (including changes in torsion angles of the main and side chains) A primary mutant sequence library can be generated through sequence screening using a set of scaffold structures. The optimal sequence is selected for each starting structure (or several sets of superordinate sequences) to create a primary mutant sequence library.

これらの技術のいくつかにより、一次ライブラリー中の配列リストがある特定の基準をベースとして「スコア付け」、「ランク付け」または「フィルターがけ」される結果となる。いくつかの実施態様では、ランク付け無しで生成される配列リストに、その後下記に概説する技術を使用してランク付けまたはフィルターがけすることができる。   Some of these techniques result in a “scoring”, “ranking”, or “filtering” based on a certain criterion of a list of sequences in the primary library. In some embodiments, the sequence listing generated without ranking can then be ranked or filtered using the techniques outlined below.

一般的に、一次変異配列ライブラリーの生成に使用できる様々なコンピューター処理方法がある。再度、これらの全てをコンピューター処理のタンパク質設計アルゴリズムと考えることができる。好ましい実施態様では、配列をベースとする方法が使用される。あるいは、下記に詳述するPDA(登録商標)のような、構造をベースとする方法を使用する。高精度で配列の相対エネルギーを評価するための他のモデルには、出典明示により本明細書の一部とする Warshel, Computer Modeling of Chemical Reactions in Enzymes and Solutions, Wiley & Sons, New York, (1991) が含まれる。   In general, there are various computer processing methods that can be used to generate a primary mutant sequence library. Again, all of these can be considered as computerized protein design algorithms. In a preferred embodiment, sequence-based methods are used. Alternatively, a structure-based method is used, such as the PDA® detailed below. Other models for assessing the relative energy of sequences with high accuracy include Warshel, Computer Modeling of Chemical Reactions in Enzymes and Solutions, Wiley & Sons, New York, (1991, which is incorporated herein by reference. ) Is included.

同様に、変異配列スコアを個々に計算し、ランク順リストを編集することにより配列をコンピューター処理でスクリーニングするために、分子力学計算を使用できる。   Similarly, molecular mechanics calculations can be used to compute sequences by computing mutant sequence scores individually and editing the ranked list.

好ましい実施態様では、コンピューター処理のスクリーニング中に配列をスコア付けするために、残基対ポテンシャルを使用できる(Miyazawa et al. Macromolecules 18(3):5 34-552 (1985) 、出典明示により本明細書の一部とする)。   In a preferred embodiment, residue pair potentials can be used to score sequences during computational screening (Miyazawa et al. Macromolecules 18 (3): 5 34-552 (1985), hereby incorporated by reference).

好ましい実施態様では、配列をスコア付けするために、配列プロフィール評価(Bowie et al. Science 253 (5016): 164-70 (1991) 出典明示により本明細書の一部とする)および/または平均力のポテンシャル(Hendlich et al. J.Mol.Biol. 216(1): 167-180 (1990) これも出典明示により本明細書の一部とする)も計算できる。これらの方法は、配列と3Dタンパク質構造との間の調和を評価するため、タンパク質構造に対する忠実度についてスクリーニングすべく機能できる。配列を評価するために様々なスコア付け関数を使用することにより、配列空間の様々な領域がコンピューター処理スクリーニングでサンプリングできる。   In a preferred embodiment, a sequence profile evaluation (Bowie et al. Science 253 (5016): 164-70 (1991) is incorporated herein by reference) and / or average power to score sequences. (Hendlich et al. J. Mol. Biol. 216 (1): 167-180 (1990), which is also incorporated herein by reference). These methods can function to screen for fidelity to protein structure to assess the harmony between sequence and 3D protein structure. By using various scoring functions to evaluate the sequence, various regions of the sequence space can be sampled by computerized screening.

さらに、タンパク質に金属または補因子結合部位を創出する配列についてスクリーニングするために、スコア付け関数を使用できる(Hellinga et al. Fold Des.3(1):R1-8(1998) 、出典明示により本明細書の一部とする)。同様に、タンパク質にジスルフィド結合を創出する配列についてスクリーニングするために、スコア付け関数を使用できる。新規構造モチーフを導入すべくタンパク質構造を特異的に変更するために、これらの可能性を試す。   In addition, scoring functions can be used to screen for sequences that create metal or cofactor binding sites in proteins (Hellinga et al. Fold Des. 3 (1): R1-8 (1998), published by reference). Part of the description). Similarly, scoring functions can be used to screen for sequences that create disulfide bonds in proteins. Try these possibilities to specifically alter the protein structure to introduce new structural motifs.

好ましい実施態様では、一次ライブラリーを生成させるために、配列および/または構造アラインメント・プログラムを使用できる。当業界で既知のように、数々の配列をベースとしたアラインメント・プログラムがある;例えば、Smith−Waterman サーチ、Needleman−Wunsch、Double Affine Smith−Waterman、フレームサーチ、Griskov/GCG プロフィールサーチ、Griskov/GCG プロフィールスキャン、プロフィールフレームサーチ、Bucher 一般化プロフィール、Hidden Markov モデル、Hframe、Double Frame、Blast、Psi-blast、Clustal、および GeneWise を含む。   In a preferred embodiment, sequence and / or structural alignment programs can be used to generate a primary library. As known in the art, there are numerous sequence-based alignment programs; for example, Smith-Waterman search, Needleman-Wunsch, Double Affine Smith-Waterman, frame search, Griskov / GCG profile search, Griskov / GCG Includes profile scan, profile frame search, Bucher generalized profile, Hidden Markov model, Hframe, Double Frame, Blast, Psi-blast, Clustal, and GeneWise.

配列の供給源は幅広く変化でき、かつ、SCOP (Hubbard et al. Nucleic Acids Res 27(1):254-256. (1999));PFAM (Bateman et al. Nucleic Acids Res 27(1):260-262. (1999));VAST (Gibrat et al. Curr Opin Struct Biol 6(3):377-385. (1996));CATH (Orengo et al. Structure 5(8):1093-1108. (1997);これらの全てを出典明示により本明細書の一部とする);PhD Predictor (http://www.embl-heidelberg.de/predictprotein/predictprotein.html);Prosite (Hofmann et al. Nucleic Acids Res 27(1):215-219. (1999)出典明示により本明細書の一部とする);PIR (http://www.mips.biochem.mpg.de/proj/protseqdb/);GenBank (http://www.ncbi.nlm.nih.gov/);PDB (www.rcsb.org) および BIND (Bader et al. Nucleic Acids Res 29(1):242-245. (2001)出典明示により本明細書の一部とする)を含むがこれらに限定されない、1つまたはそれ以上の既知データベースから配列を得ることを含む。   The source of the sequence can vary widely, and SCOP (Hubbard et al. Nucleic Acids Res 27 (1): 254-256. (1999)); PFAM (Bateman et al. Nucleic Acids Res 27 (1): 260- 262. (1999)); VAST (Gibrat et al. Curr Opin Struct Biol 6 (3): 377-385. (1996)); CATH (Orengo et al. Structure 5 (8): 1093-1108. (1997) All of which are hereby incorporated by reference); PhD Predictor (http://www.embl-heidelberg.de/predictprotein/predictprotein.html); Prosite (Hofmann et al. Nucleic Acids Res 27 (1): 215-219. (1999) part of this specification by reference); PIR (http://www.mips.biochem.mpg.de/proj/protseqdb/); GenBank (http: //www.ncbi.nlm.nih.gov/); PDB (www.rcsb.org) and BIND (Bader et al. Nucleic Acids Res 29 (1): 242-245. (2001) Including, but not limited to, obtaining a sequence from one or more known databases.

さらに、これらのデータベース由来の配列は、連続分析または遺伝子予測にかけ得る;Wheeler et al. Nucleic Acids Res 28(1):10-14. (2000) と、Burge and Karlin, J Mol Biol 268(1):78-94. (1997) を参照のこと(両方を出典明示により本明細書の一部とする)。   In addition, sequences from these databases can be subjected to continuous analysis or gene prediction; Wheeler et al. Nucleic Acids Res 28 (1): 10-14. (2000) and Burge and Karlin, J Mol Biol 268 (1) : 78-94. (1997) (both are hereby incorporated by reference).

当業界で既知のように、使用できる数々の配列アラインメント体系がある。例えば、アラインメント法に基づく配列の相同性は、標的構造に関するタンパク質の配列アラインメントを創出するために使用できる(Altschul et al. J. Mol. Biol. 215(3):403 (1990)、出典明示により本明細書の一部とする)。これらの配列アラインメントを調べ、観測された配列の変動を決定する。これらの配列の変動は、一次ライブラリーを定義するために表にする。加えて、さらに以下に概説するように、二次ライブラリーを生成させるためにもこれらの方法を使用できる。   There are a number of sequence alignment schemes that can be used, as is known in the art. For example, sequence homology based on alignment methods can be used to create protein sequence alignments with respect to the target structure (Altschul et al. J. Mol. Biol. 215 (3): 403 (1990), by reference) Part of this specification). These sequence alignments are examined to determine the observed sequence variation. These sequence variations are tabulated to define the primary library. In addition, these methods can also be used to generate secondary libraries, as further outlined below.

配列をベースとしたアラインメントは、様々な方法で使用できる。例えば、関連するタンパク質のいくつかを、当業界で既知のようにアラインメントでき、そして「可変」および「保存された」残基を定義する;即ち、そのファミリーの構成員の間で、変化した残基または同一のままの残基を定義できる。これらの結果は、以下に概説した確率表を生成させるのに使用できる。同様に、これらの配列の変動を表にでき、そしてこれらから、以下で定義するように二次ライブラリーを定義する。あるいは、コンピューター処理スクリーニングにおいて各位置で考えられるアミノ酸を定義するために、許容される配列変動を使用できる。別の変動は、配列アラインメントで生じるアミノ酸のスコアに偏りをかけ、それによってそれらのアミノ酸がコンピューター処理スクリーニングにおいて見出される見込みが増加するが、なお他のアミノ酸を考慮することも許容される。この偏りは、結果として焦点をあてた一次ライブラリーが得られるが、アラインメントに見出されないアミノ酸を考慮から除外しない。加えて、数々の他のタイプの偏りを導入してもよい。例えば、多様化を強いてもよい;即ち「保存された」残基を選び、タンパク質に多様化を強いるように改変し、かくして配列空間のより大きな部分をサンプリングする。あるいは、ファミリーの構成員間で可変性が高い (即ち保存性が低い) 位置を、アミノ酸の全てまたはサブセットのいずれかを使用して、ランダム化することができる。同様に、異常残基は位置異常または側鎖異常のいずれも排除してもよい。   Sequence-based alignments can be used in a variety of ways. For example, some of the related proteins can be aligned as is known in the art and define “variable” and “conserved” residues; that is, altered residues among members of the family. Groups or residues that remain the same can be defined. These results can be used to generate the probability table outlined below. Similarly, these sequence variations can be tabulated, and from these, a secondary library is defined as defined below. Alternatively, permissible sequence variations can be used to define the possible amino acids at each position in computerized screening. Another variation biases the scores of amino acids that occur in sequence alignments, thereby increasing the likelihood that those amino acids will be found in computerized screening, but still allow for other amino acids to be considered. This bias results in a focused primary library, but does not exclude amino acids that are not found in the alignment from consideration. In addition, numerous other types of bias may be introduced. For example, diversification may be forced; ie, “conserved” residues are selected and modified to force the protein to diversify, thus sampling a larger portion of the sequence space. Alternatively, positions that are highly variable (i.e., less conserved) among family members can be randomized using either all or a subset of amino acids. Similarly, abnormal residues may eliminate either positional abnormalities or side chain abnormalities.

同様に、配列アラインメントを生成させるために、構造的に関連したタンパク質の構造アラインメントを行える。そのような既知の広く様々な構造アラインメント・プログラムがある。例えば、NCBI による VAST (http://www.ncbi.nlm.nih.gov:80/Structure/VAST/vast.shtml) ;SSAP (Orengo and Taylor, Methods Enzymol 266(617-635 (1996)) SARF2 (Alexandrov, Protein Eng 9(9):727-732. (1996)) CE (Shindyalov and Bourne, Protein Eng 11(9):739-747. (1998));(Orengo et al. Structure 5(8):1093-108 (1997);Dali (Holm et al. Nucleic Acid Res. 26(1):316-9 (1998)(これらは全て出典明示により本明細書の一部とする)を参照のこと。観測された配列の変動を決定するために、これらの構造的に生成させた配列アラインメントを調査できる。   Similarly, structural alignments of structurally related proteins can be made to generate a sequence alignment. There are such a wide variety of known structural alignment programs. For example, NCBI's VAST (http://www.ncbi.nlm.nih.gov:80/Structure/VAST/vast.shtml); SSAP (Orengo and Taylor, Methods Enzymol 266 (617-635 (1996)) SARF2 ( (Alexandrov, Protein Eng 9 (9): 727-732. (1996)) CE (Shindyalov and Bourne, Protein Eng 11 (9): 739-747. (1998)); (Orengo et al. Structure 5 (8): 1093-108 (1997); see Dali (Holm et al. Nucleic Acid Res. 26 (1): 316-9 (1998), all of which are incorporated herein by reference). These structurally generated sequence alignments can be examined to determine the variation of the generated sequence.

一次変異配列ライブラリーは、配列から二次構造を予測し、次いで予測された二次構造と矛盾しない配列を選択することによって生成できる。スレッディング(threading) (Bryant and Altschul, Curr Opin Struct Biol 5(2):236-244. (1995));Profile 3D (Bowie et al. Methods Enzymol 266(598-616 (1996);MONSSTER (Skolnick et al. J Mol Biol 265(2):217-241. (1997);Rosetta (Simons et al. Proteins 37(S3):171-176 (1999);PSI-BLAST (Altschul and Koonin, Trends Biochem Sci 23(11):444-447. (1998));Impala(Schaffer et al. Bioinformatics 15(12):1000-1011. (1999));HMMER (McClure et al. Proc Int Conf Intell Syst Mol Biol 4(155-164 (1996));Clustal W (http://www.ebi.ac.uk/clustalw/);BLAST (Altschul et al. J Mol Biol 215(3):403-410. (1990));ヘリックス−コイル転移理論 (Munoz and Serrano, Biopolymers 41:495, 1997)、ニューラルネットワーク、局所構造アラインメント、およびその他(例えば、Selbig et al. Bioinformatics 15:1039, 1999 参照)を含むが、これらに制限されるものではない、数々の二次構造予測法がある。   A primary mutant sequence library can be generated by predicting secondary structure from a sequence and then selecting sequences that are consistent with the predicted secondary structure. Threading (Bryant and Altschul, Curr Opin Struct Biol 5 (2): 236-244. (1995)); Profile 3D (Bowie et al. Methods Enzymol 266 (598-616 (1996)); MONSSTER (Skolnick et al J Mol Biol 265 (2): 217-241. (1997); Rosetta (Simons et al. Proteins 37 (S3): 171-176 (1999); PSI-BLAST (Altschul and Koonin, Trends Biochem Sci 23 (11) ): 444-447. (1998)); Impala (Schaffer et al. Bioinformatics 15 (12): 1000-1011. (1999)); HMMER (McClure et al. Proc Int Conf Intell Syst Mol Biol 4 (155-164) (1996)); Clustal W (http://www.ebi.ac.uk/clustalw/); BLAST (Altschul et al. J Mol Biol 215 (3): 403-410. (1990)); Helix-coil Including but not limited to transition theory (Munoz and Serrano, Biopolymers 41: 495, 1997), neural networks, local structure alignments, and others (see, eg, Selbig et al. Bioinformatics 15: 1039, 1999) There are not many secondary structure prediction methods.

同様に、上記概説した通り、他のコンピューター処理方法も知られており、例えば配列プロファイリング(Bowie and Eisenberg、Science253(5016):164-70(1991))、回転異性体ライブラリー選択法(Dahiyat and Mayo、Protein Sci5(5):895-903(1996)、Dahiyat and Mayo、Science278(5335):82-7(1997);Desjarlais and Handel、Protein Science 4:2006-2018(1995)、Harburyet al. PNAS USA92(18):8408-8412(1995);Konoet al. Proteins:Structure,Function and Genetics 19:244-255(1994);Hellinga and Richards、PNAS USA 91:5803-5807(1994)) および残基対ポテンシャル(Jones、Protein Science 3:567-574(1994))、PROSA (Heindlich et al. J. Mol. Biol. 216 : 167-180 (1990) ;THREADER (Jones et al. Nature 358 : 86-89 (1992)、および Simons et al. (Proteins, 34 : 535-543, 1999), Levitt and Gerstein (PNAS USA, 95 : 59135920, 1998), Godzik et al. PNAS, V89, PP 12098-102 ; Godzik and Skolnick (PNAS USA, 89 : 12098102, 1992), Godzik et al. (J. Mol. Biol. 227 : 227-38, 1992) に記載されているもののような他の逆折畳み方法、および2−プロファイル方法 (Gribskov et al. PNAS 84 : 4355-4358 (1987) および、Fischer and Eisenberg, Protein Sci. 5 : 947-955 (1996), Rice and Eisenberg J. Mol. Biol. 267 : 1026-1038 (1997)) が含まれるが、これらに限定されるわけではなく、これらは全て出典明示により本明細書の一部とする。さらに、Koehl and Levitt (J. Mol. Biol. 293 : 1161-1181 (1999) ; J. Mol. Biol. 293 : 1183-1193 (1999) ; 出典明示により本明細書の一部とする)に記載されているもののような他のコンピューター処理方法を使用してタンパク質配列ライブラリーを創出でき、場合により、それを改良された特性および機能についての実験的スクリーニングにおいて使用するための、より小さい二次ライブラリーを生成させるのに使用できる。   Similarly, as outlined above, other computer processing methods are known, such as sequence profiling (Bowie and Eisenberg, Science 253 (5016): 164-70 (1991)), rotamer library selection (Dahiyat and Mayo, Protein Sci5 (5): 895-903 (1996), Dahiyat and Mayo, Science278 (5335): 82-7 (1997); Desjarlais and Handel, Protein Science 4: 2006-2018 (1995), Harbury et al. PNAS USA92 (18): 8408-8412 (1995); Konoet al. Proteins: Structure, Function and Genetics 19: 244-255 (1994); Hellinga and Richards, PNAS USA 91: 5803-5807 (1994)) and residue pairs Potential (Jones, Protein Science 3: 567-574 (1994)), PROSA (Heindlich et al. J. Mol. Biol. 216: 167-180 (1990); THREADER (Jones et al. Nature 358: 86-89 ( 1992), and Simons et al. (Proteins, 34: 535-543, 1999), Levitt and Gerstein (PNAS USA, 95: 59135920, 1998), Godzik et al. PNAS, V89, PP 12098-102; Godzik and Skolnick (PNAS USA, 89: 12098102, 1992), Godzik et al. (J. Mol. B iol. 227: 227-38, 1992) and other two-fold methods (Gribskov et al. PNAS 84: 4355-4358 (1987) and Fischer and Eisenberg, Protein Sci. 5: 947-955 (1996), Rice and Eisenberg J. Mol. Biol. 267: 1026-1038 (1997)), but are not limited to these. Part of the description. Furthermore, described in Koehl and Levitt (J. Mol. Biol. 293: 1161-1181 (1999); J. Mol. Biol. 293: 1183-1193 (1999); incorporated herein by reference). Other computer processing methods, such as those described, can be used to create protein sequence libraries, and in some cases, smaller secondary live for use in experimental screening for improved properties and functions Can be used to generate a rally.

加えて、SCMF と同様に用い得る、SCMF などの力場の計算に基づくコンピューター処理方法がある。Delarue et al. Pac. Symp. Biocomput. 109-21 (1997), Koehl et al. J. Mol. Biol. 239:249 (1994);Koehl et al. Nat. Struc. Biol. 2:163 (1995);Koehl et al. Curr. Opin. Struct. Biol. 6:222 (1996);Koehl et al. J. Mol. Bio. 293:1183 (1999);Koehl et al. J. Mol. Biol. 293:1161 (1999);Lee, J. Mol. Biol. 236:918 (1994);Vasquez Biopolymers 36:53-70 (1995);(これらは全て出典明示により本明細書の一部とする)を参照のこと。コンピューター処理方法の範囲内で配列のコンホメーション(立体配座)を最適化するため、またはここで概説したような新規の最適化された配列を新しく生成させるために使用できる他の力場計算には、OPLS-AA (Jorgensen et al. J. Am. Chem. Soc. (1996), v 118, pp 11225-11236;Jorgensen, W.L.; BOSS, Version 4.1; Yale University: New Haven, CT (1999));OPLS (Jorgensen et al. J. Am. Chem. Soc. (1988), v 110, pp 1657ff;Jorgensen et al. J Am. Chem. Soc. (1990), v 112, pp 4768ff);UNRES (United Residue Forcefield;Liwo et al. Protein Science (1993), v 2, pp1697-1714;Liwo et al. Protein Science (1993), v 2, pp1715-1731;Liwo et al. J. Comp. Chem. (1997), v 18, pp849-873;Liwo et al. J. Comp. Chem. (1997),v 18, pp874-884;Liwo et al. J. Comp. Chem. (1998), v 19, pp259-276;Forcefield for Protein Structure Prediction (Liwo et al. Proc. Natl. Acad. Sci. USA (1999), v 96, pp5482-5485);ECEPP/3(Liwo et al. J Protein Chem 1994 May;13(4):375-80);AMBER 1.1 力場 (Weiner et al. J. Am. Chem. Soc. v 106, pp765-784);AMBER 3.0 力場 (U.C. Singh et al. Proc. Natl. Acad. Sci. USA. 82:755-759);CHARMM および CHARMM22 (Brooks et al. J. Comp. Chem. v 4, pp 187-217);cvff3.0 (Dauber-Osguthorpe et al. (1988) Proteins: Structure, Function and Genetics, v4, pp31-47);cff91 (Maple et al. J. Comp. Chem. v15, 162-182) を含み、これらに限定されない;また、DISCOVER (cvff および cff91) および AMBER 力場は、INSIGHT 分子モデリング・パッケージ (Biosym/MSI, San Diego California) で使用され、そして HARMM は、QUANTA 分子モデリング・パッケージ (Biosym/MSI, San Diego California)で使用される(これらは全て出典明示により本明細書の一部とする)。事実、下記で概説したように、直接二次ライブラリーを生成させるために、これらの力場の方法を使用できる;即ち、一次ライブラリーを生成させない;むしろ、これらの方法は、確率表を作成するために使用でき、それを元に、例えばSCMF計算の間にこれらの力場を使用することによって、二次ライブラリーを直接生成させる。   In addition, there are computer processing methods based on force field calculations such as SCMF that can be used in the same way as SCMF. Delarue et al. Pac. Symp. Biocomput. 109-21 (1997), Koehl et al. J. Mol. Biol. 239: 249 (1994); Koehl et al. Nat. Struc. Biol. 2: 163 (1995) Koehl et al. Curr. Opin. Struct. Biol. 6: 222 (1996); Koehl et al. J. Mol. Bio. 293: 1183 (1999); Koehl et al. J. Mol. Biol. 293: 1161 (1999); Lee, J. Mol. Biol. 236: 918 (1994); Vasquez Biopolymers 36: 53-70 (1995); all of which are hereby incorporated by reference. . Other force field calculations that can be used to optimize the conformation of sequences within computer processing methods or to generate new optimized sequences as outlined here , OPLS-AA (Jorgensen et al. J. Am. Chem. Soc. (1996), v 118, pp 11225-11236; Jorgensen, WL; BOSS, Version 4.1; Yale University: New Haven, CT (1999) OPLS (Jorgensen et al. J. Am. Chem. Soc. (1988), v 110, pp 1657ff; Jorgensen et al. J Am. Chem. Soc. (1990), v 112, pp 4768ff); UNRES ( United Residue Forcefield; Liwo et al. Protein Science (1993), v 2, pp1697-1714; Liwo et al. Protein Science (1993), v 2, pp1715-1731; Liwo et al. J. Comp. Chem. (1997 ), v 18, pp849-873; Liwo et al. J. Comp. Chem. (1997), v 18, pp874-884; Liwo et al. J. Comp. Chem. (1998), v 19, pp259-276 ; Forcefield for Protein Structure Prediction (Liwo et al. Proc. Natl. Acad. Sci. USA (1999), v 96, pp5482-5485); ECEPP / 3 (Liwo et al. JP rotein Chem 1994 May; 13 (4): 375-80); AMBER 1.1 force field (Weiner et al. J. Am. Chem. Soc. v 106, pp765-784); AMBER 3.0 force field (UC Singh et al. Proc. Natl. Acad. Sci. USA. 82: 755-759); CHARMM and CHARMM22 (Brooks et al. J. Comp. Chem. V 4, pp 187-217); cvff3.0 (Dauber-Osguthorpe et al. (1988) Proteins: Structure, Function and Genetics, v4, pp31-47); including, but not limited to, cff91 (Maple et al. J. Comp. Chem. V15, 162-182); and DISCOVER (cvff and cff91) and AMBER force fields are used in the INSIGHT molecular modeling package (Biosym / MSI, San Diego California) and HARMM is used in the QUANTA molecular modeling package (Biosym / MSI, San Diego California) (these Are all incorporated herein by reference). In fact, as outlined below, these force field methods can be used to generate a secondary library directly; that is, they do not generate a primary library; rather, these methods create a probability table. Based on that, secondary libraries can be generated directly, for example by using these force fields during SCMF calculations.

好ましい実施態様では、一次ライブラリー生成に使用するコンピューター処理方法は、U.S.S.N.60/061,097、60/043,464、60/054,678、09/127,926、09/782,004およびPCT US98/07254(これらは全て出典明示により本明細書の一部とする)に記載されている、タンパク質設計オートメーション(登録商標)(PDA(登録商標))技法である。再度、本明細書で概説するように、上記方法の各々を「タンパク質設計アルゴリズム」「コンピューター処理のタンパク質設計アルゴリズム」「コンピューター処理のタンパク質設計方法」と呼ぶことができる。   In a preferred embodiment, the computer processing method used to generate the primary library is U.S.S.N.60 / 061,097, 60 / 043,464, 60 / 054,678, 09 / 127,926, 09. / 782,004 and PCT US98 / 07254, all of which are hereby incorporated by reference, the Protein Design Automation® (PDA®) technique. Again, as outlined herein, each of the above methods can be referred to as a “protein design algorithm”, “computerized protein design algorithm”, or “computerized protein design method”.

簡単に述べると、PDA(登録商標)タンパク質設計技法は次のように説明できる。既知タンパク質構造を出発点として使用する。次いで、最適化される残基を同定するが、それは全配列またはそのサブセット(複数も可)であり得る。次いで、変化させる任意の位置の側鎖を除去する。得られたタンパク質主鎖および残りの側鎖から成る構造を鋳型と呼ぶ。次いで、好ましくは、各可変残基位置を、コア残基、表面残基または境界残基として分類する。各分類は、その位置に可能なアミノ酸残基のサブセットを定義する(例えば、コア残基は一般に疎水性残基のセットから選択され、表面残基は一般に親水性残基から選択され、そして境界残基はどちらでもあり得る)。各アミノ酸は、回転異性体と呼ばれる、独立したセットの許容される各側鎖の全コンフォマーにより代理され得る。即ち、主鎖に最適な配列に到達するため、回転異性体の可能性のある全配列をスクリーニングしなければならず、その場合各主鎖位置は、その可能な全回転異性体状態である各アミノ酸、またはアミノ酸のサブセット、従って回転異性体のサブセットにより占められ得る。   Briefly, the PDA® protein design technique can be described as follows. A known protein structure is used as a starting point. The residue to be optimized is then identified, which can be the entire sequence or a subset (s) thereof. Next, the side chain at any position to be changed is removed. The resulting structure consisting of the protein main chain and the remaining side chains is called a template. Each variable residue position is then preferably classified as a core residue, surface residue or boundary residue. Each classification defines a subset of possible amino acid residues at that position (eg, core residues are generally selected from a set of hydrophobic residues, surface residues are generally selected from hydrophilic residues, and boundaries The residue can be either). Each amino acid can be represented by an independent set of all conformers of each allowed side chain, called a rotamer. That is, to reach the optimal sequence for the main chain, all possible rotamer sequences must be screened, where each main chain position is in each possible rotamer state. It can be occupied by an amino acid, or a subset of amino acids, and thus a subset of rotamers.

次いで、2セットの相互作用を各回転異性体について全位置で計算する。即ち、回転異性体側鎖と主鎖の全部または一部との相互作用(「シングルス」エネルギー、回転異性体/鋳型または回転異性体/主鎖エネルギーとも呼ばれる)、および回転異性体側鎖と、他の全ての位置または他の位置のサブセットにおける他の可能な全回転異性体との相互作用(「ダブルス」エネルギー、回転異性体/回転異性体エネルギーとも呼ばれる)。これらの相互作用の各々のエネルギーは、様々なスコア付け関数の使用を通して計算され、それにはファンデルワールス力のエネルギー、水素結合のエネルギー、二次構造傾向のエネルギー、表面領域溶媒和のエネルギーおよび静電気が含まれる。ゆえに、主鎖および他の回転異性体の両方と各回転異性体の相互作用の総エネルギーが計算され、マトリックス形態で記憶される。   Two sets of interactions are then calculated at all positions for each rotamer. That is, the interaction of rotamer side chains with all or part of the main chain (also referred to as “singles” energy, rotamer / template or rotamer / main chain energy), and rotamer side chains and other Interaction with other possible all rotamers at all positions or a subset of other positions ("doubles" energy, also called rotamer / rotomer energy). The energy of each of these interactions is calculated through the use of various scoring functions, including van der Waals force energy, hydrogen bond energy, secondary structure tendency energy, surface region solvation energy and electrostatics. Is included. Therefore, the total energy of the interaction of each rotamer with both the backbone and other rotamers is calculated and stored in matrix form.

回転異性体のセットの明確な性質は、試験する回転異性体配列の数の単純計算を可能にする。各位置につきm個の可能な回転異性体をもつ長さnの主鎖の場合、m個の可能な回転異性体配列があり、その数は配列長と共に指数関数的に増大し、リアルタイムで計算するのは非実際的または不可能である。従って、この組合せ検索問題を解決するため、「行き止まり排除法」(DEE)計算を実施する。DEE計算は、第1回転異性体の最悪の総相互作用が第2回転異性体の最良の総相互作用よりもなお良好な場合、第2回転異性体は大域的最適解答(global optimum solution)の一部にはなり得ないという事実に基づいている。全回転異性体のエネルギーは既に計算されているので、DEE方法では、回転異性体を試験し排除するためには配列長全体に及ぶ合計があればよく、計算はかなり速くなる。DEEは、回転異性体の対または回転異性体の組合せを比較しながら再実行でき、結局、大域的最適エネルギーを表す単一の配列が決定される。 The unambiguous nature of the set of rotamers allows a simple calculation of the number of rotamer sequences to be tested. For a length-n backbone with m possible rotamers at each position, there are m n possible rotamer sequences, the number increasing exponentially with sequence length, in real time It is impractical or impossible to calculate. Therefore, in order to solve this combination search problem, a “dead end elimination” (DEE) calculation is performed. The DEE calculation shows that if the worst total interaction of the first rotamer is still better than the best total interaction of the second rotamer, the second rotamer is a global optimum solution. Based on the fact that it cannot be part. Since the energies of all rotamers have already been calculated, the DEE method requires a sum that spans the entire sequence length to test and eliminate rotamers, and the calculation is much faster. DEE can be rerun while comparing rotamer pairs or rotamer combinations, and ultimately a single sequence representing the global optimum energy is determined.

一旦大域的解答を見出したら、DEE解答の近隣における配列のランク順リストを生成させるためにモンテカルロ検索を行い得る。DEE解答から出発し、ランダム位置を他の回転異性体に変更し、新規配列エネルギーを計算する。新規配列が許容基準に合う場合、それを別のジャンプ用の出発点として使用する。予め定めた数のジャンプの後、配列のランク順リストを生成させる。   Once a global answer is found, a Monte Carlo search can be performed to generate a ranked list of sequences in the vicinity of the DEE answer. Starting from the DEE answer, change the random position to another rotamer and calculate the new sequence energy. If the new sequence meets the acceptance criteria, it is used as a starting point for another jump. After a predetermined number of jumps, a rank ordered list of sequences is generated.

モンテカルロ検索は、大域的極小値周辺の配列空間を調査するための、または配列空間中の新しい局所的極小距離を見出すためのサンプリング技法である。下記にさらに概説するように、ボルツマンサンプリング、遺伝的アルゴリズム技法および模擬アニーリング(simulated annealing)を含む、使用できる他のサンプリング技法がある。さらに、全ての標本技術に関して、許容されるジャンプの種類を変更できる(例えば、ランダムな残基へのランダムなジャンプ、偏りのあるジャンプ(例えば、野生型へ、または野生型から)、偏りのある残基へのジャンプ(例えば、類似の残基へ、または残基から)など)。同様に、全てのサンプリング技法に関して、サンプリングのジャンプが許容されるか否かの許容基準を変更できる。   Monte Carlo search is a sampling technique for exploring the array space around a global minimum or finding a new local minimum distance in the array space. There are other sampling techniques that can be used, including Boltzmann sampling, genetic algorithm techniques, and simulated annealing, as further outlined below. In addition, for all sampling techniques, the type of jump allowed is changeable (eg random jump to random residues, biased jump (eg to or from wild type), biased Jump to a residue (eg, to or from a similar residue). Similarly, for all sampling techniques, the acceptance criteria for whether sampling jumps are allowed can be changed.

U.S.S.N.09/127926で概説されているように、タンパク質主鎖(α−炭素からβ−炭素へのベクトルの方向に沿って、窒素、カルボニル炭素、α−炭素およびカルボニル酸素を含む(天然タンパク質の場合))を、超二次構造パラメーターと呼ばれるパラメーターのセットを変えることにより、コンピューター処理分析に先立ち改変し得る。   The protein backbone (nitrogen, carbonyl carbon, α-carbon and carbonyl oxygen along the α-carbon to β-carbon vector direction, as outlined in USS N.09 / 127926. (In the case of natural proteins) can be modified prior to computational analysis by changing a set of parameters called super-secondary structure parameters.

一旦タンパク質構造主鎖を生成させ(上記概説の通り、改変を伴う)、コンピューターに入力したら、明らかな水素が構造内に含まれていないならば、それを付加する(例えば、構造がX線結晶学により生成された場合、水素を付加しなければならない)。水素付加後、構造エネルギーの最小化を実行し、水素並びに他の原子、結合角および結合長を緩和する。好ましい実施態様では、これは、いくつかの段階から成る原子座標位置のコンジュゲート勾配最小化(Mayoet al. J. Phys.Chem.94: 8897 (1990))を実行することにより行なわれ、静電気を全く伴わずに Dreiding の力場が最小限にされる。一般的に、約10ないし約250の段階が好ましく、約50が最も好ましい。   Once the protein structure backbone is generated (as outlined above, with modifications) and entered into the computer, it is added if no apparent hydrogen is included in the structure (eg, the structure is X-ray crystal If generated by science, hydrogen must be added). After hydrogen addition, structural energy minimization is performed to relax hydrogen and other atoms, bond angles and bond lengths. In a preferred embodiment, this is done by performing a conjugate gradient minimization (Mayoet al. J. Phys. Chem. 94: 8897 (1990)) of atomic coordinate positions consisting of several steps, Dreiding's force field is minimized without any involvement. Generally, about 10 to about 250 steps are preferred, and about 50 is most preferred.

タンパク質主鎖構造は、少なくとも1つの可変残基位置を含む。当業界で既知のように、タンパク質の残基またはアミノ酸は、一般にタンパク質のN−末端から出発して連続的に番号付けされる。従って、そのN末端にメチオニンを有するタンパク質は、残基またはアミノ酸の1位にメチオニンを有し、次の残基は2、3、4位などとされている。各位置において、野生型(即ち天然産生)タンパク質は、少なくとも20個のアミノ酸のうちの1つを任意の数の回転異性体で有し得る。本明細書における「可変残基位置」とは、設計方法において特定の残基または回転異性体、一般的には野生型残基または回転異性体として固定されていない、設計されるタンパク質のアミノ酸位置を意味する。   The protein backbone structure includes at least one variable residue position. As is known in the art, protein residues or amino acids are generally sequentially numbered starting from the N-terminus of the protein. Therefore, a protein having a methionine at its N-terminus has a methionine at the 1st position of the residue or amino acid, and the next residues are at positions 2, 3, 4 and so on. At each position, the wild-type (ie, naturally produced) protein can have one of at least 20 amino acids in any number of rotamers. As used herein, “variable residue position” refers to the amino acid position of a protein that is not fixed as a specific residue or rotamer, generally a wild-type residue or rotamer in the design method. Means.

好ましい実施態様において、タンパク質の残基位置全てが可変である。即ち、どのアミノ酸側鎖も本発明方法では改変され得る。これは、小型タンパク質の場合特に望ましいが、本発明は大型タンパク質の設計も同様に可能にする。この方法で設計され得るタンパク質の長さに理論的制限は無く、実際的なコンピューター処理上の制限がある。   In a preferred embodiment, all residue positions of the protein are variable. That is, any amino acid side chain can be modified in the method of the present invention. This is particularly desirable for small proteins, but the present invention allows for the design of large proteins as well. There is no theoretical limit to the length of protein that can be designed in this way, and there are practical computational limitations.

別の好ましい実施態様では、タンパク質の残基位置のいくつかのみが可変であり、残りは「固定」されている、即ち、それらは設定されたコンホメーションであるものとして3次元構造中で同定される。いくつかの実施態様では、固定位置はその本来の立体配座のままである(使用されている回転異性体ライブラリーの特異的回転異性体と相関関係を示しても示さなくてもよい)。あるいは、残基は非野生型残基として固定され得る。例えば、既知の部位指定変異導入技法により、特定残基が望ましい(例えば、タンパク質加水分解部位の排除または酵素の基質特異性の改変のために)と示されたとき、残基は特定アミノ酸として固定され得る。   In another preferred embodiment, only some of the residue positions of the protein are variable and the rest are “fixed”, ie they are identified in the three-dimensional structure as being in a set conformation. Is done. In some embodiments, the fixed position remains in its original conformation (which may or may not be correlated with the specific rotamer of the rotamer library being used). Alternatively, the residue can be fixed as a non-wild type residue. For example, when a known site-directed mutagenesis technique indicates that a particular residue is desirable (eg, to eliminate a proteolytic site or to alter the substrate specificity of an enzyme), the residue is fixed as a particular amino acid. Can be done.

あるいは、下記で検討されている通り、新たに変異を評価するために本発明の方法を使用できる。別の好ましい実施態様では、固定位置は「浮動」させ得る;その位置のアミノ酸は固定されるが、そのアミノ酸の別の回転異性体が試験される。この実施態様において、可変残基は、少なくとも1個、または概して残基総数の0.1%ないし99.9%であり得る。従って、例えば、少数のみ(または1個)の残基または残基の大部分(両者の間にあらゆる可能性がある)を変えることが可能である。   Alternatively, as discussed below, the methods of the invention can be used to newly assess mutations. In another preferred embodiment, the fixed position may be “floating”; the amino acid at that position is fixed, but another rotamer of that amino acid is tested. In this embodiment, the variable residue can be at least one, or generally from 0.1% to 99.9% of the total number of residues. Thus, for example, it is possible to change only a small number (or one) of a residue or a majority of residues (any possibility between them).

好ましい実施態様において、固定できる残基には、構造的または生物学的機能性残基が含まれるが、これらに限定されるわけではない;あるいは、生物学的機能性残基は、特異的に固定されていなくてもよい。例えば、生物活性にとって重要であることが知られている残基、例えば酵素の活性部位、酵素の基質結合部位、結合パートナー(リガンド/受容体、抗原/抗体など)への結合部位、生物学的機能にとっては決定的なリン酸化またはグリコシル化部位を形成する残基、または構造的に重要な残基、例えばジスルフィド架橋、金属結合部位、重大な水素結合性残基、プロリンまたはグリシンなどの主鎖立体配座にとって重大な残基、相互作用パッキングにとって重大な残基などは全て、一立体配座に、または単一回転異性体として固定してもよく、または「浮動」してもよい。   In a preferred embodiment, the residues that can be fixed include, but are not limited to, structural or biological functional residues; alternatively, the biological functional residues are specifically It does not have to be fixed. For example, residues known to be important for biological activity, such as enzyme active sites, enzyme substrate binding sites, binding sites for binding partners (ligand / receptor, antigen / antibody, etc.), biological Residues that form a phosphorylation or glycosylation site critical for function, or a structurally important residue such as a disulfide bridge, a metal binding site, a critical hydrogen bonding residue, a backbone such as proline or glycine Residues critical for conformation, residues critical for interaction packing, etc. may all be fixed in one conformation, or as a single rotamer, or may be “floating”.

同様に、可変残基として選択し得る残基は、望ましくない生物学的特性、例えばタンパク質加水分解に対する感受性、二量体化または凝集部位、免疫応答を誘導し得るグリコシル化部位、望ましくない結合活性、望ましくないアロステリー、結合は保存されているが望ましくない酵素活性などを付与するものであり得る。   Similarly, residues that can be selected as variable residues include undesirable biological properties such as susceptibility to proteolysis, dimerization or aggregation sites, glycosylation sites that can induce an immune response, unwanted binding activity. Undesirable allostery, binding may be conserved but impart undesirable enzyme activity, and the like.

好ましい実施態様において、各可変位置は、コア、表面または境界残基位置として分類されるが、場合によっては、下記説明の通り、主鎖を最小化するために可変位置をグリシンに設定し得る。さらに、本明細書で概説するように、残基が分類されている必要はなく、可変なものとして選択でき、いかなるアミノ酸のセットも使用し得る。コア、表面および境界位置のいずれの組合せも利用できる。即ち、コア、表面および境界残基;コアおよび表面残基;コアおよび境界残基、および表面および境界残基、並びにコア残基単独、表面残基単独または境界残基単独。   In a preferred embodiment, each variable position is classified as a core, surface or boundary residue position, but in some cases, as described below, the variable position can be set to glycine to minimize the backbone. Further, as outlined herein, the residues need not be classified, can be selected as variable, and any set of amino acids can be used. Any combination of core, surface and boundary location can be used. That is, core, surface and boundary residues; core and surface residues; core and boundary residues, and surface and boundary residues, and core residues alone, surface residues alone or boundary residues alone.

コア、表面または境界としての残基位置の分類は、当業者に明らかな通り、いくつかの方法で行い得る。好ましい実施態様において、分類は、側鎖を含む本来のタンパク質主鎖構造の走査画像により行い、タンパク質モデリングの当業者の主観的評価に基づいて分類を指定する。あるいは、好ましい態様は、U.S.S.N.60/061,097、60/043,464、60/054,678、09/127,926およびPCT US98/07254で概説されている通り、鋳型Cα原子のみを用いて計算した、溶媒が近づき易い表面に関してCα−Cβベクトル配向評価を利用する。あるいは、表面積計算を行える。   Classification of residue positions as cores, surfaces or boundaries can be done in several ways, as will be apparent to those skilled in the art. In a preferred embodiment, the classification is done by scanning images of the original protein backbone structure including side chains and assigning the classification based on the subjective assessment of those skilled in protein modeling. Alternatively, a preferred embodiment is a template as outlined in U.S.S.N.60 / 061,097, 60 / 043,464, 60 / 054,678, 09 / 127,926 and PCT US98 / 07254. A Cα-Cβ vector orientation assessment is used for a solvent accessible surface calculated using only Cα atoms. Alternatively, the surface area can be calculated.

一旦各可変位置をコア、表面または境界として分類したら、アミノ酸側鎖のセット、即ち回転異性体のセットが各位置に割り当てられる。即ち、プログラムにより特定位置での考慮の対象として認められた可能なアミノ酸側鎖のセットが選択される。それに続いて、一旦可能なアミノ酸側鎖を選択すると、特定位置で評価される回転異性体のセットを決定し得る。従って、コア残基は、一般にアラニン、バリン、イソロイシン、ロイシン、フェニルアラニン、チロシン、トリプトファンおよびメチオニンから成る疎水性残基の群から選択され(いくつかの実施態様では、下記ファンデルワールススコア付け関数のαスケーリング因子が低いとき、メチオニンがセットから除去される)、各コア位置のための回転異性体のセット(主鎖非依存的ライブラリーを使用する場合は全回転異性体、そして回転異性体依存的主鎖を使用する場合はサブセット)は、潜在的にこれらの8アミノ酸側鎖の回転異性体を包含する。同様に、表面位置は、一般にアラニン、セリン、スレオニン、アスパラギン酸、アスパラギン、グルタミン、グルタミン酸、アルギニン、リシンおよびヒスチジンから成る親水性残基の群から選択される。従って、各表面位置のための回転異性体のセットは、これらの10残基の回転異性体を包含する。最後に、境界位置は、一般にアラニン、セリン、スレオニン、アスパラギン酸、アスパラギン、グルタミン、グルタミン酸、アルギニン、リシン、ヒスチジン、バリン、イソロイシン、ロイシン、フェニルアラニン、チロシン、トリプトファンおよびメチオニンから選択する。従って、各境界位置のための回転異性体のセットは、これらの17残基(システイン、グリシンおよびプロリンが使用されないことを仮定しているが、それらは使用できる)の全回転異性体を包含する。さらに、いくつかの好ましい実施態様では、18個の天然産生アミノ酸(特に破壊的であることが知られているシステインおよびプロリンを除く全て)を使用する。   Once each variable position is classified as a core, surface or boundary, a set of amino acid side chains, ie a set of rotamers, is assigned to each position. That is, the program selects a set of possible amino acid side chains that are recognized as considerations at a particular position. Subsequently, once the possible amino acid side chains are selected, the set of rotamers evaluated at a particular position can be determined. Accordingly, the core residue is generally selected from the group of hydrophobic residues consisting of alanine, valine, isoleucine, leucine, phenylalanine, tyrosine, tryptophan and methionine (in some embodiments, the Van der Waals scoring function When α-scaling factor is low, methionine is removed from the set), a set of rotamers for each core position (total rotamers when using a backbone independent library, and rotamer dependent) The subset), when using a functional backbone, potentially includes these 8-amino acid side-chain rotamers. Similarly, the surface location is generally selected from the group of hydrophilic residues consisting of alanine, serine, threonine, aspartic acid, asparagine, glutamine, glutamic acid, arginine, lysine and histidine. Thus, the set of rotamers for each surface position includes these 10 residue rotamers. Finally, the boundary position is generally selected from alanine, serine, threonine, aspartic acid, asparagine, glutamine, glutamic acid, arginine, lysine, histidine, valine, isoleucine, leucine, phenylalanine, tyrosine, tryptophan and methionine. Thus, the set of rotamers for each boundary position includes all rotamers of these 17 residues (assuming that cysteine, glycine and proline are not used, but they can be used). . In addition, in some preferred embodiments, 18 naturally occurring amino acids are used, particularly all except cysteine and proline, which are known to be destructive.

従って、当業者に理解されるように、計算回数が減らせるため、残基位置を分類することにはコンピューター処理上の利点がある。また、コア、境界および表面残基のセットが上記のものから改変される状況があり得ることに注目すべきである。例えば、ある状況では、1個またはそれ以上のアミノ酸が付加されるかまたは許容されるアミノ酸のセットから控除される。例えば、二量体化または多量体化するか、またはリガンド結合部位を有するいくつかのタンパク質は、疎水性表面残基などを含み得る。さらに、らせん「キャッピング」またはαらせん双極子との有利な相互作用を行わせない残基は、許容される残基のセットから控除し得る。このアミノ酸のグループの変更は、残基ごとに行い得る。   Therefore, as will be appreciated by those skilled in the art, there is a computational advantage in classifying residue positions since the number of calculations can be reduced. It should also be noted that there may be situations where the set of cores, boundaries and surface residues is altered from the above. For example, in some situations, one or more amino acids are added or subtracted from the set of allowed amino acids. For example, some proteins that dimerize or multimerize or have a ligand binding site may contain hydrophobic surface residues and the like. Furthermore, residues that do not allow favorable interaction with the helix “capping” or α-helix dipole can be subtracted from the set of allowed residues. This amino acid group change can be made on a residue by residue basis.

好ましい態様において、プロリン、システインおよびグリシンは可能なアミノ酸側鎖のリストには含まれず、従ってこれらの側鎖の回転異性体は使用されない。しかしながら、好ましい実施態様では、可変残基位置が0°より大きいφ角度(即ち、1)先行アミノ酸のカルボニル炭素、2)現残基の窒素原子、3)現残基のα炭素、および4)現残基のカルボニル炭素、により定義される二面角)を有するとき、該位置をグリシンに設定して主鎖のひずみを最小化する。   In a preferred embodiment, proline, cysteine and glycine are not included in the list of possible amino acid side chains and thus rotamers of these side chains are not used. However, in a preferred embodiment, the φ angle where the variable residue position is greater than 0 ° (ie, 1) the carbonyl carbon of the preceding amino acid, 2) the nitrogen atom of the current residue, 3) the α carbon of the current residue, and 4) The dihedral angle defined by the carbonyl carbon of the current residue), the position is set to glycine to minimize main chain distortion.

一旦可能な回転異性体の群を各可変残基位置に割り当てたら、U.S.S.N.09/127,926およびPCT US98/07254で概説されているように加工が進められる。この加工段階は、最適タンパク質配列を生成させるために、回転異性体間の相互作用および回転異性体とタンパク質主鎖との相互作用の分析を必要とする。極度に単純化すると、加工は、まずいくつかのスコア付け関数を用いることにより、主鎖自体または他の回転異性体に対する、回転異性体の相互作用エネルギーを計算することを含む。好ましいPDA(登録商標)技法スコア付け関数には、ファンデルワールスポテンシャルスコア付け関数、水素結合ポテンシャルスコア付け関数、原子溶媒和スコア付け関数、二次構造傾向スコア付け関数および静電気スコア付け関数があるが、これらに限定はされない。さらに下記で報告されているように、各位置をスコア付けするために少なくとも1つのスコア付け関数を使用するが、スコア付け関数は、位置分類、またはαらせん双極子との有利な相互作用などの他の考慮すべき点により異なり得る。下記で概説されている通り、計算で使用される総エネルギーは、一般に等式1で示されるように、特定位置で使用される各スコア付け関数のエネルギーの合計である: 等式1 Etotal=nEvdw+nEas+nEh−結合+nEas+nEelec Once a group of possible rotamers has been assigned to each variable residue position, processing proceeds as outlined in U.S.S.N.09 / 127,926 and PCT US98 / 07254. This processing step requires analysis of the interaction between rotamers and the interaction between rotamers and protein backbones in order to produce an optimal protein sequence. In extreme simplification, processing involves first calculating the interaction energy of a rotamer relative to the main chain itself or other rotamers by using some scoring function. Preferred PDA® technique scoring functions include van der Waals potential scoring functions, hydrogen bond potential scoring functions, atomic solvation scoring functions, secondary structure propensity scoring functions, and electrostatic scoring functions. However, it is not limited to these. In addition, as reported below, at least one scoring function is used to score each position, such as position classification or advantageous interaction with the α-helix dipole. It can vary depending on other considerations. As outlined below, the total energy used in the calculation is the sum of the energies of each scoring function used at a particular position, as generally shown in Equation 1: Equation 1 E total = nE vdw + nE as + nE h-bond + nE as + nE elec

等式1において、総エネルギーは、ファンデルワールスポテンシャルエネルギー(Evdw)、原子溶媒和エネルギー(Eas)、水素結合エネルギー(Eh−結合)、二次構造エネルギー(Ess)および静電気相互作用エネルギー(Eelec)の合計である。nの語は、この語を特定残基位置に関して考慮すべきか否かによって、0または1である。 In Equation 1, the total energy is van der Waals potential energy (E vdw ), atomic solvation energy (E as ), hydrogen bond energy (E h-bond ), secondary structure energy (E ss ), and electrostatic interaction. It is the sum of energy (E elec ). The word n is 0 or 1 depending on whether this word should be considered with respect to a particular residue position.

U.S.S.N.60/061,097、60/043,464、60/054,678、09/127,926およびPCT US98/07254で概説されているように、単独でか、または組合せて、これらのスコア付け関数の組合せはどれでも使用し得る。一旦使用するスコア付け関数を各可変位置について同定したら、コンピューター処理分析における好ましい第1段階には、可能な各回転異性体とタンパク質の残り全部または一部との相互作用の測定が含まれる。即ち、スコア付け関数の1つまたはそれ以上により測定される、各可変残基位置における可能な各回転異性体と主鎖または他の回転異性体との相互作用のエネルギーが計算される。好ましい実施態様では、各回転異性体とタンパク質の残り全部、即ち鋳型全体および他の全回転異性体の両方との相互作用が行なわれる。しかしながら、上記で概説されている通り、タンパク質の一部分、例えば大型タンパク質のドメインのみをモデルにすることが可能であり、従って、場合によってはタンパク質の必ずしも全部を考慮する必要はない。本明細書で使用される「部分」という用語は、あるタンパク質に関してそのタンパク質の断片を表す。この断片は、10アミノ酸残基から、全アミノ酸配列マイナス1アミノ酸までのサイズの範囲であり得る。従って、本明細書で使用される「部分」の用語は、ある核酸に関してその核酸の断片を表す。この断片は、10ヌクレオチドから、全核酸配列マイナス1ヌクレオチドまでのサイズの範囲であり得る。   U.S.S.N. 60 / 061,097, 60 / 043,464, 60 / 054,678, 09 / 127,926 and PCT US98 / 07254, alone or in combination Any combination of these scoring functions can be used. Once the scoring function to be used has been identified for each variable position, the preferred first step in the computational analysis involves measuring the interaction of each possible rotamer with all or part of the protein. That is, the energy of interaction of each possible rotamer with each backbone or other rotamer at each variable residue position, as measured by one or more of the scoring functions, is calculated. In a preferred embodiment, the interaction of each rotamer with the rest of the protein, both the entire template and all other rotamers, takes place. However, as outlined above, it is possible to model only a portion of a protein, for example a domain of a large protein, and thus in some cases it is not necessary to consider the entire protein. The term “portion” as used herein refers to a fragment of a protein with respect to a protein. This fragment can range in size from 10 amino acid residues to the entire amino acid sequence minus one amino acid. Thus, as used herein, the term “portion” refers to a fragment of a nucleic acid with respect to that nucleic acid. This fragment can range in size from 10 nucleotides to the entire nucleic acid sequence minus 1 nucleotide.

好ましい実施態様において、コンピューター処理加工の第1段階は、全ての位置における各回転異性体に関して2セットの相互作用を計算することにより行なう。即ち、その位置を変更しようと浮動させようと、回転異性体側鎖と鋳型または主鎖との相互作用(「シングルス」エネルギー)、および回転異性体側鎖と全ての他の位置における全ての他の可能な回転異性体との相互作用(「ダブルス」エネルギー)である。この場合の主鎖はタンパク質構造主鎖の原子および固定残基があればその原子の両方を含み、この場合固定残基はあるアミノ酸の特定立体配座として定義されることを理解すべきである。   In a preferred embodiment, the first stage of computer processing is performed by calculating two sets of interactions for each rotamer at all positions. That is, the interaction of the rotamer side chain with the template or main chain (“single-s” energy) and all other possibilities at all other positions with the rotamer side chain, whether to change or float its position Interaction ("doubles" energy) with various rotamers. It should be understood that the backbone in this case includes both the protein structure backbone atom and the fixed residue, if any, where the fixed residue is defined as a specific conformation of an amino acid. .

即ち、「シングルス」(回転異性体/鋳型)エネルギーは、スコア付け関数のいくつかまたは全部を使用して、全ての可変残基位置における全ての可能な回転異性体と主鎖との相互作用について計算される。従って、水素結合スコア付け関数の場合、回転異性体の全水素結合原子および主鎖の全水素結合原子が評価され、EHBが全可変位置における可能な各回転異性体について計算される。同様に、ファンデルワールススコア付け関数の場合、回転異性体の全原子を鋳型の全原子と比較し(一般的にそれ自体の残基の主鎖原子を除外する)、そして全可変残基位置における可能な各回転異性体についてEvdWを計算する。さらに、原子が3つまたはそれ未満の結合により結合されている場合、一般的に、ファンデルワールスエネルギーは計算されない。原子溶媒和スコア付け関数の場合、回転異性体の表面は鋳型表面に対して測定され、全ての可変残基位置における可能な各回転異性体についてEasが計算される。また二次構造傾向スコア付け関数も、シングルスエネルギーとして考えられるため、総シングルスエネルギーはEss項を含み得る。当業者に明らかなように、回転異性体および鋳型位置間の物理的距離に依存して、これらのエネルギー項の多くはゼロに近づく;即ち、2つの部分が離れれば離れるほど、エネルギーは低くなる。 That is, "single" (rotamer / template) energy is used for all possible rotamer and backbone interactions at all variable residue positions using some or all of the scoring functions. Calculated. Thus, for the hydrogen bond scoring function, all rotamer and main chain hydrogen bond atoms are evaluated and E HB is calculated for each possible rotamer at all variable positions. Similarly, for van der Waals scoring functions, all rotamer atoms are compared to template atoms (typically excluding the main chain atom of its own residue) and all variable residue positions. Calculate E vdW for each possible rotamer in. Furthermore, van der Waals energy is generally not calculated when atoms are joined by three or fewer bonds. For atomic solvation scoring functions, the surface of the rotamer is measured against the template surface and E as is calculated for each possible rotamer at all variable residue positions. Secondary structure trend scoring functions can also be considered as singles energy, so the total singles energy can include an Ess term. As will be apparent to those skilled in the art, depending on the physical distance between the rotamer and the template position, many of these energy terms approach zero; that is, the farther apart the two parts, the lower the energy .

「ダブルス」エネルギー(回転異性体/回転異性体)の計算の場合、可能な各回転異性体の相互作用エネルギーを全ての他の可変残基位置における全ての可能な回転異性体と比較する。従って、「ダブルス」エネルギーは、スコア付け関数のいくつかまたは全部を使用して、全ての可変残基位置における全ての可能な回転異性体と全ての他の可変残基位置における全ての可能な回転異性体との相互作用について計算される。従って、水素結合スコア付け関数の場合、第1回転異性体の全水素結合原子および全ての可能な第2回転異性体の全水素結合原子が評価され、EHBが任意の2可変位置における可能な各回転異性体対について計算される。同様に、ファンデルワールススコア付け関数の場合、第1回転異性体の全原子を全ての可能な第2回転異性体の全原子と比較し、そして全ての2可変残基位置における可能な各回転異性体対についてEvdWを計算する。原子溶媒和スコア付け関数の場合、第1回転異性体の表面は全ての可能な第2回転異性体の表面に対して測定され、そして全ての2可変残基位置における可能な各回転異性体対についてEasが計算される。二次構造傾向スコア付け関数は、「シングルス」エネルギーの構成要素として見なされることから、「ダブルス」エネルギーとして実施する必要は無い。当業者に認識されるように、第1回転異性体および第2回転異性体間の物理的距離に依存して、これらのダブルスエネルギー項の多くはゼロに近づく。即ち、即ち、2つの部分が離れれば離れるほど、エネルギーは低くなる。 For the calculation of “doubles” energies (rotamers / rotamers), the interaction energy of each possible rotamer is compared to all possible rotamers at all other variable residue positions. Thus, the “doubles” energy uses all or all of the scoring functions to calculate all possible rotamers at all variable residue positions and all possible rotations at all other variable residue positions. Calculated for interactions with isomers. Thus, for the hydrogen bond scoring function, all hydrogen bond atoms of the first rotamer and all possible second rotamer atoms are evaluated, and E HB is possible at any two variable positions. Calculated for each rotamer pair. Similarly, for the van der Waals scoring function, all atoms of the first rotamer are compared with all atoms of all possible second rotamers, and each possible rotation at every two variable residue position. E vdW is calculated for the isomer pair. For the atomic solvation scoring function, the surface of the first rotamer is measured against the surface of all possible second rotamers and each possible rotamer pair at all two variable residue positions. E as is calculated for. Secondary structure propensity scoring functions need not be implemented as “doubles” energy because they are considered components of “single” energy. As will be appreciated by those skilled in the art, many of these doubles energy terms approach zero, depending on the physical distance between the first and second rotamers. That is, the further away the two parts, the lower the energy.

加えて、当業者に認識されるように、PDA(登録商標)技法計算で種々の力場を使用でき、Dreifing I および Dreiding II (Mayo et al, J. Phys. Chem. 948897 (1997))、AMBER (Weiner et al., J. Amer. Chem. Soc. 106:765 (1984) および Weiner et al., J. Comp. Chem. 106:230 (1986))、MM2 (Allinger J. Chem. Soc. 99:8127 (1977), Liljefors et al., J. Com. Chem. 8:1051 (1987)); MMP2 (Sprague et al., J. Comp. Chem. 8:581 (1987)); CHARMM (Brooks et al., J. Comp. Chem. 106:187 (1983)); GROMOS; および MM3 (Allinger et al., J. Amer. Chem. Soc. 111:8551 (1989))、OPLS-AA (Jorgensen, et al., J. Am. Chem. Soc. (1996), v 118, pp 11225-11236; Jorgensen, W. L.; BOSS, Version 4.1; Yale University:New Haven, CT (1999)); OPLS (Jorgensen, et al., J. Am. Chem. Soc. (1988), v 110, pp 1657ff; Jorgensen, et al., J. Am. Chem. Soc. (1990), v112, pp 4768ff); UNRES (United Residue Forcefield; Liwo, et al., Protein Science (1993), v2, pp 1697-1714; Liwo et al.,Protein science (1993), v2, pp1715-1731; Liwo, et al., J. Comp. Chem. (1997), v 18, pp849-873; Liwo, et al., J. Comp. Chem. (197), v18, pp874-884; Liwo, et al., J. Comp. Chem. (1998), v 19, pp259-276; Forcefield for Protein Structure Prediction (Liwo, et al., Proc. Natl. Acad. Sci. USA (1999), v 96, pp5482-5485); ECEPP/3 (Liwo et al., J Protein Chem 1994 May; 13 (4):375-80); AMBER 1.1 力場 (Weiner, et al., J. Am. Chem. Soc. v106, pp765-784); AMBER 3.0 力場 (U.C. Singh et al., Proc. Natl. Acad. Sci. USA. 82:755-759); CHARMM および CHARMM22 (Brooks, et al., J. Comp. Chem. v4, pp 187-217); cvff3.0 (Dauber-Osguthorpe, et al., (1988) Proteins: Structure, Function and Genetics, v4, pp31-47); cff91 (Maple, et al., J. Comp. Chem. v15, 162-182) を含むがこれらに限定されるわけではない;また DISCOVER (cvff および cff91) および AMBER 力場は、INSIGHT 分子モデリングパッケージ (Biosym/MSI, San Diego California) に使用し、HARMM は QUANTA 分子モデリングパッケージ (Biosym/MSI, San Diego California) に使用し、これらの全ては出典明示により本明細書の一部とする。   In addition, as will be appreciated by those skilled in the art, various force fields can be used in PDA® technique calculations, such as Dreifing I and Dreiding II (Mayo et al, J. Phys. Chem. 948897 (1997)), AMBER (Weiner et al., J. Amer. Chem. Soc. 106: 765 (1984) and Weiner et al., J. Comp. Chem. 106: 230 (1986)), MM2 (Allinger J. Chem. Soc. 99: 8127 (1977), Liljefors et al., J. Com. Chem. 8: 1051 (1987)); MMP2 (Sprague et al., J. Comp. Chem. 8: 581 (1987)); CHARMM (Brooks et al., J. Comp. Chem. 106: 187 (1983)); GROMOS; and MM3 (Allinger et al., J. Amer. Chem. Soc. 111: 8551 (1989)), OPLS-AA (Jorgensen, et al., J. Am. Chem. Soc. (1996), v 118, pp 11225-11236; Jorgensen, WL; BOSS, Version 4.1; Yale University: New Haven, CT (1999)); OPLS (Jorgensen, et al., J. Am. Chem. Soc. (1988), v 110, pp 1657ff; Jorgensen, et al., J. Am. Chem. Soc. (1990), v112, pp 4768ff); UNRES (United Residue Forcefield ; Liwo, et al., Protein Science (1993), v2, pp 1697-1714; Liwo et al., Protein scienc e (1993), v2, pp1715-1731; Liwo, et al., J. Comp. Chem. (1997), v 18, pp849-873; Liwo, et al., J. Comp. Chem. (197), v18, pp874-884; Liwo, et al., J. Comp. Chem. (1998), v 19, pp259-276; Forcefield for Protein Structure Prediction (Liwo, et al., Proc. Natl. Acad. Sci. USA (1999), v 96, pp5482-5485); ECEPP / 3 (Liwo et al., J Protein Chem 1994 May; 13 (4): 375-80); AMBER 1.1 force field (Weiner, et al., J. Am. Chem. Soc. V106, pp765-784); AMBER 3.0 force field (UC Singh et al., Proc. Natl. Acad. Sci. USA. 82: 755-759); CHARMM and CHARMM22 (Brooks, et al. , J. Comp. Chem. V4, pp 187-217); cvff3.0 (Dauber-Osguthorpe, et al., (1988) Proteins: Structure, Function and Genetics, v4, pp31-47); cff91 (Maple, et al., J. Comp. Chem. v15, 162-182); and DISCOVER (cvff and cff91) and AMBER force fields are also included in the INSIGHT molecular modeling package (Biosym / MSI, San) Diego California), HARMM is a QUANTA molecular modeling Kkeji (Biosym / MSI, San Diego California) was used to, all of which are incorporated herein by reference.

一旦シングルスおよびダブルスエネルギーが計算され記憶されると、コンピューター処理加工の第2段階が行われ得る。U.S.S.N.09/127926およびPCT US98/07254で概説されているように、好ましい実施態様は、行き止まり排除法(DEE)段階、および好ましくはモンテカルロ段階を利用する。   Once the singles and doubles energies are calculated and stored, a second stage of computer processing can be performed. As outlined in U.S.S.N.09 / 127926 and PCT US98 / 07254, preferred embodiments utilize a dead end exclusion (DEE) stage, and preferably a Monte Carlo stage.

概観すると、PDA(登録商標)技法は、アウトプット(例えば、一次ライブラリー)を改変するために変化させ得る3つの要素を有する:加工に使用するスコア付け関数;フィルタリング技法、およびサンプリング技法。これらの関数は、連続して、または実質的に同時に使用し得る。例えば、フィルターがけ技法と平行して、スコア付け関数を使用し得る。   In overview, the PDA® technique has three elements that can be varied to modify the output (eg, primary library): a scoring function used for processing; a filtering technique, and a sampling technique. These functions can be used sequentially or substantially simultaneously. For example, a scoring function may be used in parallel with the filtering technique.

好ましい実施態様では、スコア付け関数を改変し得る。好ましい実施態様では、上記概説のスコア付け関数は、種々の方法において偏らされ、または加重され得る。例えば、参照配列または参照配列のファミリーに向かうかまたはそこから離れる偏りを行うことができる;例えば、野生型または相同残基に向かう偏りを使用し得る。同様に、全タンパク質またはそのフラグメントを偏らせ得る;例えば、活性部位を野生型残基に向けて偏らせ得、または特定の望ましい物理的特性に向けたドメイン残基を行える。更に、増加したエネルギーに向かうまたは対する偏りを創出し得る。更なるスコア付け関数偏重には、静電ポテンシャル勾配または疎水性勾配の適用、計算への基板または結合パートナーの添加、または所望の電荷または阻止性に向けた偏りが含まれるが、これらに限定されない。   In a preferred embodiment, the scoring function can be modified. In a preferred embodiment, the scoring function outlined above can be biased or weighted in various ways. For example, a bias towards or away from the reference sequence or family of reference sequences can be made; for example, a bias towards wild-type or homologous residues can be used. Similarly, the entire protein or fragment thereof can be biased; for example, the active site can be biased toward wild-type residues, or domain residues can be directed toward certain desirable physical properties. Furthermore, a bias towards or against increased energy can be created. Additional scoring function biases include, but are not limited to, applying electrostatic potential gradients or hydrophobic gradients, adding substrates or binding partners to the calculation, or biasing towards the desired charge or blocking properties. .

加えて、別の実施態様において、使用し得る更なる種々のスコア付け関数が存在する。更なるスコア付け関数には、ねじれポテンシャル、または残基対ポテンシャルまたは残基エントロピーポテンシャルが含まれるが、これらに限定されない。このような更なるスコア付け関数は、単独で、またはライブラリーを最初にスコア付けした後のライブラリー加工用の関数として使用できる。   In addition, in other embodiments, there are a variety of additional scoring functions that can be used. Additional scoring functions include, but are not limited to, torsional potential, or residue pair potential or residue entropy potential. Such additional scoring functions can be used alone or as a function for library processing after initial scoring of the library.

好ましい実施態様において、DEEおよびその関連カウンターパートを含むが、これらに限定されない、種々の加工フィルタリング技法を行える。更なるフィルタリング技法は、最適配列の発見のためのブランチ−アンド−バウンド技法 (Cordon and Mayo, Structure Fold. Des. 7:1089-98, 1999) および配列の徹底的な列挙を含むが、これらに限定されない。しかし、ある技法は、フィルタリング技法なしでも行ない得ることは注意すべきである;例えば、サンプリング技法は、フィルタリング無しで良好な配列の発見に使用できる。   In a preferred embodiment, various processing filtering techniques can be performed, including but not limited to DEE and its associated counterparts. Further filtering techniques include branch-and-bound techniques for finding optimal sequences (Cordon and Mayo, Structure Fold. Des. 7: 1089-98, 1999) and exhaustive enumeration of sequences. It is not limited. However, it should be noted that certain techniques can be performed without filtering techniques; for example, sampling techniques can be used to find good sequences without filtering.

当業者に認識されるように、一旦最適配列または配列のセットが生成されたら、(あるいはまた、これらは最適化または順序だてる必要はない)種々の配列空間サンプリング法を、好ましいモンテカルロ法に加えて、またはモンテカルロ検索の代わりに行なうことができる。即ち、一旦配列または配列のセットが生成されたら、好ましい方法は、試験のための更なる、関連配列の生成を可能にするサンプリング技法を利用する。   As will be appreciated by those skilled in the art, once an optimal sequence or set of sequences has been generated (or they need not be optimized or ordered), various sequence space sampling methods can be added to the preferred Monte Carlo method. Or instead of a Monte Carlo search. That is, once a sequence or set of sequences has been generated, preferred methods utilize sampling techniques that allow the generation of further related sequences for testing.

これらのサンプリング法には、アミノ酸の置換、挿入もしくは欠失、または1つもしくはそれ以上の配列の組換えの使用が含まれる。本明細書で略述するように、好ましい実施態様はモンテカルロ検索を利用するが、これは一連の偏らせたか、系統的か、またはランダムなジャンプである。しかしながら、この他にも使用可能なサンプリング技法があり、ボルツマンサンプリング、遺伝的アルゴリズム技法、および模擬アニーリングが含まれる。加えて、全てのサンプリング技法に関して、許容されるジャンプの種類を改変することができる (例えば、ランダムな残基へのランダムなジャンプ、偏らせたジャンプ (例えば、野生型に向かうか、または離れて) 、偏らせた残基へのジャンプ (類似の残基に向かうか、または離れて、等) 。複数の残基の位置を一緒にしたジャンプ (2個の残基が常に共に変化する、または決して共に変化しない) 、残基の全セットが他の配列に変化するジャンプ (例、組換え) 。同様に、全てのサンプリング技法について、サンプリングジャンプが許容されるか否かの許容基準を改変することもでき、また高温での広い検索および低温での局所的最適値近傍で狭い検索を可能にする。出展明示により本明細書の一部とする Metropolis et al., J. Chem. Phys v21, pp1087, 1953 参照。   These sampling methods include the use of amino acid substitutions, insertions or deletions, or recombination of one or more sequences. As outlined herein, the preferred embodiment utilizes a Monte Carlo search, which is a series of biased, systematic, or random jumps. However, there are other sampling techniques that can be used, including Boltzmann sampling, genetic algorithm techniques, and simulated annealing. In addition, for all sampling techniques, the types of jumps allowed can be modified (e.g. random jumps to random residues, biased jumps (e.g. towards wild type or away) ), Jump to a biased residue (toward or away from a similar residue, etc.), jump to the position of multiple residues together (two residues always change together, or Jumps in which the entire set of residues changes to other sequences (eg, recombination), as well as altering the acceptance criteria for whether sampling jumps are allowed for all sampling techniques It also allows for a wide search at high temperatures and a narrow search near local optimal values at low temperatures, which are incorporated herein by reference to Metropolis et al., J. Chem. Phys v21, pp1087, 1953 Teru.

加えて、本発明の好ましい方法は配列のランク順リストに帰着することに留意すべきである;即ち、配列は一定の客観的基準に基づいてランク付けまたはフィルターがけされる。しかしながら、本明細書で概説するように、例えば配列をランク付けせずに、リストする確率表を直接に生成させること (例えば、SCMF分析または配列アラインメント技法を使用して)により、ランク付けをしない配列のセットを創出することが可能である。本明細書に略述するサンプリング技法はどちらの状況でも使用できる。   In addition, it should be noted that the preferred method of the present invention results in a ranked list of sequences; that is, the sequences are ranked or filtered based on certain objective criteria. However, as outlined herein, no ranking is done, for example, by directly generating the probability table to list (eg, using SCMF analysis or sequence alignment techniques) without ranking the sequences. It is possible to create a set of sequences. The sampling techniques outlined herein can be used in either situation.

好ましい実施態様では、ボルツマンサンプリングを行う。当業者に認識されるように、ボルツマンサンプリングの温度基準を改変することにより、高温で広い検索を行うことも低温で局所的な最適値の近傍で狭い検索を行うこともできる (例えば、Metropolis et al., J. Chem. Phys. 21: 1087, 1953 参照) 。   In a preferred embodiment, Boltzmann sampling is performed. As will be appreciated by those skilled in the art, a Boltzmann sampling temperature reference can be modified to perform a broad search at high temperatures or a narrow search near local optimal values at low temperatures (eg, Metropolis et al. al., J. Chem. Phys. 21: 1087, 1953).

好ましい実施態様では、サンプリング技法は、例えば、Holland (Adaptation in Natural and Artificial Systems, 1975, Ann Arbor, U. Michigan Press) により記載されたような遺伝的アルゴリズムを利用する。一般的に、遺伝的アルゴリズムは、生成させた配列を取り、これらを核酸の組換え事象と同様にして「遺伝子混合」と同様なやりかたでコンピューター処理で組換える。かくして、遺伝的アルゴリズム分析の「ジャンプ」は一般的に複数位置のジャンプである。加えて、以下に略述するように、相関的多重ジャンプも行い得る。このようなジャンプは、様々なクロスオーバー位置で、一度に1回以上の組換えを行うことができ、そして2個またはそれ以上の配列の組換えを伴うことができる。さらに、欠失または挿入 (ランダムまたは偏らせた) を行うことができる。加えて、以下に略述するように、遺伝的アルゴリズム分析は二次ライブラリー生成後に使用してもよい。   In a preferred embodiment, the sampling technique utilizes a genetic algorithm as described, for example, by Holland (Adaptation in Natural and Artificial Systems, 1975, Ann Arbor, U. Michigan Press). In general, genetic algorithms take generated sequences and recombine them computationally in a manner similar to “gene mixing” in the same manner as nucleic acid recombination events. Thus, a “jump” in genetic algorithm analysis is generally a multi-position jump. In addition, correlated multiple jumps can also be performed, as outlined below. Such jumps can be performed one or more recombination at a time, at various crossover positions, and can involve recombination of two or more sequences. In addition, deletions or insertions (random or biased) can be made. In addition, as outlined below, genetic algorithm analysis may be used after secondary library generation.

好ましい実施態様では、サンプリング技法は、例えば、Kirkpatrick et al. (Science, 220: 671-680, 1983) に記載されているようなシミュレートしたアニーリングを使用する。シミュレートしたアニーリングは温度を改変することにより良いジャンプまたは悪いジャンプのカットオフを改変する。即ち、温度を変えることによってカットオフの厳しさの度合いを変化させる。これにより、新しい配列空間領域への高温での広範な検索を行って、低温での狭いサーチによる領域の詳細な探索に切り替えることが可能になる。   In a preferred embodiment, the sampling technique uses simulated annealing as described, for example, in Kirkpatrick et al. (Science, 220: 671-680, 1983). Simulated annealing modifies the good or bad jump cutoff by modifying the temperature. That is, the severity of the cutoff is changed by changing the temperature. This makes it possible to perform a wide search at a high temperature to a new sequence space region and switch to a detailed search of the region by a narrow search at a low temperature.

加えて、以下に略述するように、これらのサンプリング方法を、更なる二次ライブラリー (時々、本明細書では三次ライブラリーと呼ぶ) を生成させるための更なるプロセスに使用できる。   In addition, as outlined below, these sampling methods can be used in further processes to generate additional secondary libraries (sometimes referred to herein as tertiary libraries).

従って、一次ライブラリーは、PDA(登録商標)のような構造ベースの方法、または配列ベースの方法、または本明細書に概説のような組合せを含む、コンピューター処理の種々の方法において生成できる。   Thus, primary libraries can be generated in a variety of computational methods, including structure-based methods such as PDA®, or sequence-based methods, or combinations as outlined herein.

コンピューター処理加工により、最適化候補変異配列のセットが生じる。最適化候補変異タンパク質配列は、一般に、MHC、TCRまたはBCR結合に非常に重要な領域において標的タンパク質配列と異なっている。好ましくは、各最適化候補変異配列は、開始または標的配列から少なくとも約1個の変異アミノ酸を含み、3−5個が好ましい。好ましくは、変異残基は非連続の領域に位置する。   Computer processing produces a set of optimized candidate mutation sequences. The optimized candidate mutant protein sequence generally differs from the target protein sequence in a region critical for MHC, TCR or BCR binding. Preferably, each optimized candidate mutated sequence comprises at least about 1 mutated amino acid from the start or target sequence, with 3-5 being preferred. Preferably, the mutated residue is located in a non-contiguous region.

従って、好ましい実施態様では、本発明は、標的タンパク質またはその断片をコンピューター処理により加工し、候補変異タンパク質または候補変異タンパク質配列のセットを産生する方法を対象としている。   Accordingly, in a preferred embodiment, the present invention is directed to a method of processing a target protein or fragment thereof by computer processing to produce a candidate mutant protein or a set of candidate mutant protein sequences.

ゆえに、好ましい実施態様では、本発明の候補変異タンパク質は、少なくとも1つのM HC、TCRまたはBCR結合部位において、標的タンパク質と異なるアミノ酸配列を有する。好ましくは、免疫原性の低いタンパク質が望ましいならば、候補変異タンパク質は、少なくとも1つのMHC、TCRまたはBCR結合部位を排除することにより標的タンパク質と異なっている。あるいは、より免疫原性のあるタンパク質が望ましいならば、候補変異タンパク質は、少なくとも1つのMHC、TCRまたはBCR結合部位の付加を介して標的タンパク質と異なっている。   Thus, in a preferred embodiment, the candidate mutant protein of the invention comprises at least one M It has a different amino acid sequence from the target protein at the HC, TCR or BCR binding site. Preferably, if a less immunogenic protein is desired, the candidate mutant protein differs from the target protein by eliminating at least one MHC, TCR or BCR binding site. Alternatively, if a more immunogenic protein is desired, the candidate mutant protein differs from the target protein through the addition of at least one MHC, TCR or BCR binding site.

従って、コンピューター処理加工は一次変異配列のセットに帰着し、それは、ある種のランク付けまたはスコア付け関数を使用する場合、最適化タンパク質配列であり得る。これらの最適化タンパク質配列は、一般に(常にではないが)、主鎖を採用した標的配列と顕著に異なっている。つまり、各最適化タンパク質配列は、好ましくは開始標的または野生型配列から少なくとも約5−10%の変異アミノ酸を含み、少なくとも約15−20%の変化が好ましく、そして少なくとも約30%の変化が特に好ましい。   Thus, computer processing results in a set of primary mutant sequences, which can be optimized protein sequences when using certain ranking or scoring functions. These optimized protein sequences are generally (but not always) significantly different from the target sequence employing the backbone. That is, each optimized protein sequence preferably contains at least about 5-10% mutated amino acids from the starting target or wild-type sequence, preferably at least about 15-20% change, and particularly at least about 30% change. preferable.

好ましい実施態様では、コンピューター処理の免疫原性フィルターを、一次ライブラリー配列のセットに適用する。本明細書における「コンピューター処理の免疫原性フィルター」は、MHC分子、またはT細胞エピトープもしくはB細胞エピトープへのペプチドの結合についてのデータに由来する、数々のスコア付け関数のいずれかを意味する。コンピューター処理の免疫原性フィルターは、元のコンピューター計算の一部として(例えば、実質的に同時に;例えば、コンピューター処理段階の1つとして、または元のコンピューター計算中のスコア付け関数として)、コンピューター計算に先立って(例えば、前フィルターとして)または元のコンピューター計算の後に(例えば後フィルターとして)、適用できる。例えば、好ましい実施態様では、コンピューター処理の免疫原性フィルターを後フィルターとして使用する:即ち、一次ライブラリー配列のセットを再スコア付けして、免疫原性の可能性がある配列を排除するために、または非免疫原性の配列を導入するために、スコア付け関数を使用する。   In a preferred embodiment, a computerized immunogenic filter is applied to the set of primary library sequences. As used herein, “computerized immunogenic filter” refers to any of a number of scoring functions derived from data on MHC molecules, or binding of peptides to T or B cell epitopes. A computerized immunogenic filter is computed as part of the original computer calculation (eg, substantially simultaneously; eg, as one of the computer processing steps or as a scoring function during the original computer calculation). Can be applied prior to (eg, as a pre-filter) or after the original computer computation (eg, as a post-filter). For example, in a preferred embodiment, a computerized immunogenic filter is used as a post-filter: ie, to re-score a set of primary library sequences to eliminate potentially immunogenic sequences. Or a scoring function is used to introduce non-immunogenic sequences.

好ましい実施態様では、一次ライブラリー配列を生成するときに、コンピューター処理の免疫原性フィルターを同じ時に、即ち、実質的に同時に、適用する。   In a preferred embodiment, a computerized immunogenic filter is applied at the same time, ie substantially simultaneously, when generating the primary library sequence.

他の好ましい実施態様では、一次配列のセットをコンピューター処理により生成する前に、コンピューター処理の免疫原性フィルターを適用する。このアプローチを使用して、所望の結果に応じて、免疫原性配列を潜在的に欠くか、または含む、一次配列のセットが生成される。次いで、PDA(登録商標)技法をこれらの配列に実行し、天然の折畳みを保持し、少なくとも開始標的タンパク質と同程度に安定なものを同定する。   In another preferred embodiment, a computerized immunogenic filter is applied before the primary sequence set is computationally generated. Using this approach, depending on the desired result, a set of primary sequences is generated that potentially lack or contain immunogenic sequences. PDA® techniques are then performed on these sequences to identify those that retain the natural fold and are at least as stable as the starting target protein.

好ましい実施態様では、TCRに認識されるMHCクラスIおよびII分子により表示される線状エピトープをコードするアミノ酸残基の除去または付加のいずれかを、構造的および化学的に補償するために、PDA(登録商標)技法を使用する。   In a preferred embodiment, PDA is used to structurally and chemically compensate for either the removal or addition of amino acid residues encoding linear epitopes represented by MHC class I and II molecules recognized by the TCR. (Registered trademark) technique is used.

好ましい実施態様では、ナイーブB細胞上の膜結合抗体に感知される立体構造エピトープをコードするアミノ酸残基の除去または付加のいずれかを、構造的および化学的に補償するために、PDA(登録商標)技法を使用する。   In a preferred embodiment, PDA® is used to structurally and chemically compensate for either the removal or addition of amino acid residues encoding conformational epitopes that are sensed by membrane-bound antibodies on naive B cells. ) Technique.

MHC分子によるペプチド選択の法則についての現在の知見は、ペプチドおよびMHCタンパク質から抽出した天然のペプチドライブラリーの配列解読、MHC分子へのペプチド結合およびT細胞反応に対する、未知CTLエピトープ配列への変異導入の効果の分析、並びに決定されたMHCペプチド複合体の結晶構造分析および分子力場研究に由来するものである (Meister, G.E., et al. (1995) Vaccine, 13:581-591; Malios, R.R., (1999) Bioinformatics Savoie, C.J. et al. (1999) Pac Symp Biocomput., 182-9; Brusic, V., et al., (1998) Bioinformatics, Mallios, R.R., (1998) J. Comp. Biol., 5:703-711; Altuvia, Y., et al. (1997) Human Immunology, 58:1-11; Udaka, et al., (1995) J. Exp. Med., 181:2097-2108; Hammer, J. et al. (1994) Behring. Inst. Mitt. 94:124-132; Hemmer, B., et al., (2000) J. Immunol., 164:861-871)。さらに、MHC分子に結合すると知られている数千のペプチド配列からなるデータベースが編集され(Buus, 前出; Brusic, V., et al., (1998) Nucleic Acids Res., 26:368-371; Rammensee, H-G., et al., (1999) Immunogenetics, 50:213-219)、そしてタンパク質全長の配列を分析し、可能性のある免疫原性配列の存在を予測するためのいくつかの技法が開発されてきた (Hiemstra, H.S. et al. (2000) Curr. Op. Immunol., 12:80-84; Malios, R.R., (1999) Bioinformatics, 15:432-439; Sturniolo, T., et al. (1999) Nature Biotechnology, 17:555-561; Brusic, V., et al., (1998) Bioinformatics, 14:121-130; Mallios, R.R., (1998) J. Comp. Biol., 5:703-711; Shastri, N. (1996) Curr. Op. Immunol., 8:271-277; Hammer, J. (1995) Curr. Op. Immunol., 7:263-269; Meister, G.E., et al. (1995) Vaccine, 13:581-591; Udaka, K., et al. (1995) J. Exp. Med., 181:20972108; Hammer, J. et al. (1994) Behring. Inst. Mitt. 94:124-132; Hammer, J., et al. (1994) J. Exp. Med., 180: 2353-2358; and, Rudenshky, A. Y., et al. (1991) Nature, 353:622-627; Marshall, K.W., et al., (1995) J. Immunology, 154:5927-5933; Novak, E.J., (2001) J. Immunology, 166:6665-6670; Cochlovius, B., et al., (2000) J. Immunology, 165:4731-4741; Raddrizzani and Hammer, (2000) Brief Bioinform., 1(2):179-89; Hemmer, B., et al., (1998) J. Immunology, 160:3631-3636; Gulukota, K., et al., (1997) J. Mol. Biol., 1258-1267; Parker, et al., (1994) J. Immunology, 152:163175; Berzofsky, J.A., et al European Patent publication number 0279 994 A2); Fikes, J. et al., WO 01/41788、これらの全てを出典明示により本明細書の一部とする)。   Current knowledge about the rules of peptide selection by MHC molecules is the sequencing of natural peptide libraries extracted from peptides and MHC proteins, peptide binding to MHC molecules and mutagenesis into unknown CTL epitope sequences for T cell responses Derived from the analysis of the effects of MHC and the crystal structure analysis and molecular force field studies of the determined MHC peptide complex (Meister, GE, et al. (1995) Vaccine, 13: 581-591; Malios, RR , (1999) Bioinformatics Savoie, CJ et al. (1999) Pac Symp Biocomput., 182-9; Brusic, V., et al., (1998) Bioinformatics, Mallios, RR, (1998) J. Comp. Biol. , 5: 703-711; Altuvia, Y., et al. (1997) Human Immunology, 58: 1-11; Udaka, et al., (1995) J. Exp. Med., 181: 2097-2108; Hammer , J. et al. (1994) Behring. Inst. Mitt. 94: 124-132; Hemmer, B., et al., (2000) J. Immunol., 164: 861-871). In addition, a database of thousands of peptide sequences known to bind to MHC molecules was compiled (Buus, supra; Brusic, V., et al., (1998) Nucleic Acids Res., 26: 368-371 Rammensee, HG., Et al., (1999) Immunogenetics, 50: 213-219), and several techniques for analyzing the full-length protein sequence and predicting the presence of potential immunogenic sequences (Hiemstra, HS et al. (2000) Curr. Op. Immunol., 12: 80-84; Malios, RR, (1999) Bioinformatics, 15: 432-439; Sturniolo, T., et al. (1999) Nature Biotechnology, 17: 555-561; Brusic, V., et al., (1998) Bioinformatics, 14: 121-130; Mallios, RR, (1998) J. Comp. Biol., 5: 703 -711; Shastri, N. (1996) Curr. Op. Immunol., 8: 271-277; Hammer, J. (1995) Curr. Op. Immunol., 7: 263-269; Meister, GE, et al. (1995) Vaccine, 13: 581-591; Udaka, K., et al. (1995) J. Exp. Med., 181: 20972108; Hammer, J. et al. (1994) Behring. Inst. Mitt. 94 : 124-132; Hammer, J., et al. (19 94) J. Exp. Med., 180: 2353-2358; and, Rudenshky, AY, et al. (1991) Nature, 353: 622-627; Marshall, KW, et al., (1995) J. Immunology, 154: 5927-5933; Novak, EJ, (2001) J. Immunology, 166: 6665-6670; Cochlovius, B., et al., (2000) J. Immunology, 165: 4731-4741; Raddrizzani and Hammer, ( 2000) Brief Bioinform., 1 (2): 179-89; Hemmer, B., et al., (1998) J. Immunology, 160: 3631-3636; Gulukota, K., et al., (1997) J Mol. Biol., 1258-1267; Parker, et al., (1994) J. Immunology, 152: 163175; Berzofsky, JA, et al European Patent publication number 0279 994 A2); Fikes, J. et al., WO 01/41788, all of which are incorporated herein by reference).

好ましい実施態様では、潜在的にMHCクラスI分子に結合する能力のあるペプチド断片について、一次変異配列をスクリーニングする。MHC Iリガンドは、殆どオクタ−またはノナペプチドであり、天然の隔離集団を集団的に配列解読して決定された、MHC対立遺伝子特異的配列モチーフを示す。結晶構造分析により、2本のαヘリックスと1本のβプリーツ・シートで縁取られたペプチド結合開裂(cleft)、即ち溝、が同定された。開裂は、非共有結合で会合したβ2ミクログロブリンにより、下から安定化されている。結合溝中の特異的ポケットが、ペプチドのアンカー残基を収容する。ペプチドの向きは、NH−およびCOOH−末端の電荷を補償するMHC Iタンパク質の保存された側鎖により決定される。 In a preferred embodiment, primary mutant sequences are screened for peptide fragments that are potentially capable of binding to MHC class I molecules. MHC I ligands are mostly octa- or nonapeptides and represent MHC allele-specific sequence motifs determined by collectively sequencing natural segregants. Crystal structure analysis identified a peptide bond cleft, or groove, bordered by two α helices and one β pleated sheet. The cleavage is stabilized from below by non-covalently associated β2 microglobulin. A specific pocket in the binding groove accommodates the anchor residue of the peptide. Orientation of the peptides, NH 2 - is determined by conserved side chain of MHC I protein to compensate for and COOH- terminus of charge.

所定のMHCクラスIペプチド結合溝は、少数の側鎖位置でのみ同一または相同である、何百または何千もの異なるペプチドに結合できる。多数のクラスIペプチド−MHC複合体の構造比較により、この柔軟性は、各ペプチド残基の小さいサブセットが構造的に同等に結合することによって達成されると解明された。なかでも、ペプチド主鎖の荷電または極性原子の結合は、本質的な側鎖非依存的ペプチド−MHC相互作用をもたらす。この水素結合およびファンデルワールス接触の集合は、要求される主鎖コンホメーションをとる能力のある任意のペプチドの結合を安定化するのを補助する。少数のペプチド側鎖とのさらなる相互作用は、主鎖結合エネルギーを補い、特定のMHC分子に結合するペプチドにいくらかの配列選択性を持たせる(Madden, D.R. (1995) Annu. Rev. Immunol., 13:587-622). Rules for identifying MHC I binding sites have been described in Altuvia, Y., et al (1997) Human Immunology, 58:1-11; Meister, GE., et al (1995) Vaccine: 6:581-591; Parker, K.C., et al., (1994) J. Immunolgy, 152:163; Gulukota, K., et al., (1997) J. Mol. Biol., 267:1258-1267; Buus, S., (1999) Current Opinion Immunology, 11:209-213;出典明示により本明細書の一部とする)。加えて、潜在的MHC I結合部位を同定するために、SYPEITHIおよびMHCPEPなどのMHC結合ペプチドのデータベースも入手可能であり、使用し得る(Rammensee, H-G., et al., (1999) Immunogenetics, 50:213-219; Brusic, V., et al., (1998) Nucleic Acids Research, 26:368-371;出典明示により本明細書の一部とする)。MHC結合モチーフを同定するための他の方法には、Fikes, J., et al., WO 01/41788により記載された対立遺伝子特異的多項式アルゴリズムが含まれる。   A given MHC class I peptide binding groove can bind to hundreds or thousands of different peptides that are identical or homologous only in a few side chain positions. A structural comparison of a number of class I peptide-MHC complexes revealed that this flexibility was achieved by the structurally equivalent binding of a small subset of each peptide residue. Among other things, the charge of the peptide backbone or the binding of polar atoms results in intrinsic side chain independent peptide-MHC interactions. This assembly of hydrogen bonds and van der Waals contacts helps to stabilize the binding of any peptide capable of adopting the required backbone conformation. Further interaction with a small number of peptide side chains supplements the main chain binding energy, making the peptides that bind to specific MHC molecules have some sequence selectivity (Madden, DR (1995) Annu. Rev. Immunol., 13: 587-622). Rules for identifying MHC I binding sites have been described in Altuvia, Y., et al (1997) Human Immunology, 58: 1-11; Meister, GE., Et al (1995) Vaccine: 6 : 581-591; Parker, KC, et al., (1994) J. Immunolgy, 152: 163; Gulukota, K., et al., (1997) J. Mol. Biol., 267: 1258-1267; Buus , S., (1999) Current Opinion Immunology, 11: 209-213; incorporated herein by reference). In addition, databases of MHC binding peptides such as TYPEITHI and MHCPEP are also available and can be used to identify potential MHC I binding sites (Rammensee, HG., Et al., (1999) Immunogenetics, 50 : 213-219; Brusic, V., et al., (1998) Nucleic Acids Research, 26: 368-371; incorporated herein by reference). Other methods for identifying MHC binding motifs include the allele-specific polynomial algorithm described by Fikes, J., et al., WO 01/41788.

好ましい実施態様では、可能性のあるMHCクラスI結合部位は、MHCクラスI分子へのペプチド結合を減少または排除するために除去されたアンカー残基を構造的および化学的に補償するアミノ酸残基で置換される。可能性のあるMHC I結合モチーフは、SYFPEITHI (Rammensee, H., et al., (1999) Immunogenetics, 50:213-219; http://134.2.96.221/scripts/MHCServer.dll/home.html)); http://wehih.wehi.edu.au/mhcpep/, MHCEP (Brusic, B., et al., 前出) などの公開されたモチーフのデータベースに適合させることにより、または神経網(Gulukota, K, 前出)、多項式 (Gulukota, K., 前出) ランク順位付け (Parker, K.C., 前出) および対立遺伝子特異的多項式アルゴリズム (Fikes, J., et al., WO 01/41788)などの確立された方法により、同定する。 さらなる実施態様では、非アンカー残基を置き換える。   In a preferred embodiment, potential MHC class I binding sites are amino acid residues that structurally and chemically compensate for anchor residues removed to reduce or eliminate peptide binding to MHC class I molecules. Replaced. A possible MHC I binding motif is SYFPEITHI (Rammensee, H., et al., (1999) Immunogenetics, 50: 213-219; http://134.2.96.221/scripts/MHCServer.dll/home.html) ); http://wehih.wehi.edu.au/mhcpep/, by adapting to published motif databases such as MHCEP (Brusic, B., et al., supra) or by neural networks (Gulukota , K, supra), polynomial (Gulukota, K., supra) ranking (Parker, KC, supra) and allele-specific polynomial algorithms (Fikes, J., et al., WO 01/41788) Identify by established methods such as In a further embodiment, non-anchor residues are replaced.

好ましい実施態様では、抗原加工と提示のための特異的切断モチーフが除去される。本明細書において、「特異的切断モチーフ」は、あるタンパク質に存在する抗原決定因子の加工に関与するプロテアーゼにより、タンパク質分解切断部位として特異的に認識されるモチーフを意味する(Schneider, S.C., et al., (2000) J. Immunol., 165:20-23; 出典明示により全体的に本明細書の一部とする、を参照)。言い換えれば、特異的切断モチーフは、存在すると、抗原決定因子をMHC分子への結合とそれに続くAPC表面での提示に利用しやすくするモチーフである。好ましくは、プロテオソーム切断部位を除去し、MHCクラスI分子へ結合するための抗原決定因子の利用可能性を低減させる。可能性のあるプロテオソーム切断部位は、Kutter, C., et al., (2000) J. Mol. Biol., 298:417-429 および Nussbaum, A. K., et al., (2001) Immunogenetics, 53:87-94(両方を出典明示により全体的に本明細書の一部とする)により記載されたものなどの予測アルゴリズムを使用することにより同定する。   In a preferred embodiment, specific cleavage motifs for antigen processing and presentation are removed. As used herein, “specific cleavage motif” means a motif that is specifically recognized as a proteolytic cleavage site by proteases involved in processing of antigenic determinants present in a protein (Schneider, SC, et al., (2000) J. Immunol., 165: 20-23; entirely incorporated herein by reference.). In other words, a specific cleavage motif, if present, is a motif that makes an antigenic determinant accessible for binding to MHC molecules and subsequent presentation on the APC surface. Preferably, the proteosome cleavage site is removed, reducing the availability of antigenic determinants for binding to MHC class I molecules. Possible proteosome cleavage sites are Kutter, C., et al., (2000) J. Mol. Biol., 298: 417-429 and Nussbaum, AK, et al., (2001) Immunogenetics, 53:87. Identified by using a prediction algorithm such as that described by -94, both of which are hereby incorporated by reference in their entirety.

好ましい実施態様では、可能性のあるMHCクラスI結合部位を、細胞性免疫を誘導する手段として標的タンパク質に付加する。好ましくは、少なくとも1つのMHCクラスI結合部位を標的タンパク質ごとに付加する。より好ましくは、少なくとも2つのMHCクラスI結合部位を標的タンパク質ごとに付加する。より好ましくは、3ないし5個のMHCクラスI結合部位を標的タンパク質ごとに付加する。他の実施態様では、16個までのMHCクラスI結合部位を標的タンパク質ごとに付加し得る(Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98:13872-13877; 出典明示により全体的に本明細書の一部とする、を参照)。改変された標的タンパク質の正しい折畳みと安定性を確実にするために、PDA(登録商標)技法を使用する。適する標的タンパク質には、Zn−アルファ2−糖タンパク質(Sanchez, L.M., et al., (1999) Science 283:1914-9)などの可溶性タンパク質、または他の目的の標的タンパク質を使用して生成された一次配列ライブラリーが含まれるが、これらに限定されるわけではない。可能性のあるMHC I結合モチーフは、SYFPEITHI (Rammensee, H., et al., (1999) Immunogenetics, 50:213-219; http://134.2.96.221/scripts/MHCServer.dll/home.html)); http://wehih.wehi.edu.au/mhcpep/, MHCEP (Brusic, B., et al., 前出) などの公開されたモチーフのデータベースに適合させることにより、または神経網(Gulukota, K, 前出)、多項式 (Gulukota, K., 前出)、ランク順位付け (Parker, K.C., 前出) および対立遺伝子特異的多項式アルゴリズム (Fikes, J., et al., WO 01/41788)などの確立された方法により、同定する。   In a preferred embodiment, potential MHC class I binding sites are added to the target protein as a means of inducing cellular immunity. Preferably, at least one MHC class I binding site is added for each target protein. More preferably, at least two MHC class I binding sites are added for each target protein. More preferably, 3 to 5 MHC class I binding sites are added for each target protein. In other embodiments, up to 16 MHC class I binding sites may be added per target protein (Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98: 13872-13877; Are incorporated herein by reference in their entirety). PDA® technology is used to ensure correct folding and stability of the modified target protein. Suitable target proteins are produced using soluble proteins such as Zn-alpha 2-glycoprotein (Sanchez, LM, et al., (1999) Science 283: 1914-9), or other target proteins of interest. Primary sequence libraries, but are not limited to these. A possible MHC I binding motif is SYFPEITHI (Rammensee, H., et al., (1999) Immunogenetics, 50: 213-219; http://134.2.96.221/scripts/MHCServer.dll/home.html) ); http://wehih.wehi.edu.au/mhcpep/, by adapting to published motif databases such as MHCEP (Brusic, B., et al., supra) or by neural networks (Gulukota , K, supra), polynomials (Gulukota, K., supra), ranking (Parker, KC, supra) and allele-specific polynomial algorithms (Fikes, J., et al., WO 01/41788) ) By established methods such as

好ましい実施態様では、抗原加工と提示のための特異的切断モチーフ(上記で定義された)が付加される。好ましくは、プロテオソーム切断部位を付加し、MHCクラスI分子へ結合するための抗原決定因子の利用可能性を高める。可能性のあるプロテオソーム切断部位は、Kutter, C., et al., (2000) J. Mol. Biol., 298:417-429 および Nussbaum, A. K., et al., (2001) Immunogenetics, 53:87-94(両方を出典明示により全体的に本明細書の一部とする)により記載されたものなどの予測アルゴリズムを使用することにより同定する。   In a preferred embodiment, specific cleavage motifs (defined above) are added for antigen processing and presentation. Preferably, a proteosome cleavage site is added to increase the availability of antigenic determinants for binding to MHC class I molecules. Possible proteosome cleavage sites are Kutter, C., et al., (2000) J. Mol. Biol., 298: 417-429 and Nussbaum, AK, et al., (2001) Immunogenetics, 53:87. Identified by using a prediction algorithm such as that described by -94, both of which are hereby incorporated by reference in their entirety.

好ましい実施態様では、MHCクラスII分子に結合すると予測されるペプチド断片について、一次変異配列をスクリーニングする。クラスIIリガンドは、12ないし25アミノ酸からなり、そのうちの9個が結合溝を占める;2個ないし4個がポケットにアンカーされる。クラスIリガンドにおいてと同様に、非アンカーアミノ酸は、二次的な、しかし依然として重要な役割を果たす (Rammensee, H., et al., (1999) Immunogenetics, 50:213-219)。MHC II結合部位同定の法則は、Rammensee, H., et al., (1999) Immunogenetics, 50:213-219). Rules for identifying MHC II binding sites have been described in Hammer, J. et al., (1994) Behring. Inst. Mitt., 94: 124-132; Hammer, J. et al., (1994) J. Exp. Med., 180:2353-2358; Mallios, R.R. (1998) J. Com. Biol., 5:703-711; Brusic, V., et al., (1998) Bioinformatics, 14:121-130; Mallios, R.R. (1999) Bioinformatics, 15:432-439; Marshall, K.W., et al., (1995) J. Immunology, 154:5927-5933; Novak, E.J., et al., (2001) J. Immunology, 166:6665-6670; Cochlovius, B., et al., (2000) J. Immunology, 165:4731-4741; および by Fikes, J., et al., WO 01/41788(これらの全てを出典明示により本明細書の一部とする)に記載されている。   In a preferred embodiment, primary mutant sequences are screened for peptide fragments predicted to bind to MHC class II molecules. Class II ligands consist of 12 to 25 amino acids, 9 of which occupy the binding groove; 2 to 4 are anchored in the pocket. As in class I ligands, non-anchor amino acids play a secondary but still important role (Rammensee, H., et al., (1999) Immunogenetics, 50: 213-219). The rules for identifying MHC II binding sites are described in Rammensee, H., et al., (1999) Immunogenetics, 50: 213-219). Rules for identifying MHC II binding sites have been described in Hammer, J. et al., ( 1994) Behring. Inst. Mitt., 94: 124-132; Hammer, J. et al., (1994) J. Exp. Med., 180: 2353-2358; Mallios, RR (1998) J. Com. Biol ., 5: 703-711; Brusic, V., et al., (1998) Bioinformatics, 14: 121-130; Mallios, RR (1999) Bioinformatics, 15: 432-439; Marshall, KW, et al., (1995) J. Immunology, 154: 5927-5933; Novak, EJ, et al., (2001) J. Immunology, 166: 6665-6670; Cochlovius, B., et al., (2000) J. Immunology, 165: 4731-4741; and by Fikes, J., et al., WO 01/41788, all of which are hereby incorporated by reference.

好ましい実施態様では、可能性のあるMHCクラスII結合部位は、MHC II結合部位を排除するために除去されたアンカー残基を構造的および化学的に補償するアミノ酸残基で置換される。好ましくは、可能性のあるMHC II結合部位は、SYFPEITHI(Rammensee, H., et al., (1999) Immunogenetics, 50:213-219; http://134.2.96.221/scripts/MHCServer.dll/home.html)またはMHCEP(http://wehih.wehi.edu.au/mhcpep/)などの公開されたモチーフのデータベースに適合させて同定する。あるいは、クラスII分子への結合予測は、仮想マトリックスの方法(Sturniolo, T, et al. (1999) Nature Biotechnology, 17:555-561) および Raddrizzani, L. and Hammer, J., (2000) Brief Bioinform.、両方とも出典明示により本明細書の一部とする)またはFikes, J., et al., WO 01/41788 に記載された対立遺伝子特異的多項式アルゴリズムを使用する。 さらなる実施態様では、非アンカー残基を置換する。   In a preferred embodiment, potential MHC class II binding sites are replaced with amino acid residues that structurally and chemically compensate for the removed anchor residues to eliminate MHC II binding sites. Preferably, the potential MHC II binding site is SYFPEITHI (Rammensee, H., et al., (1999) Immunogenetics, 50: 213-219; http://134.2.96.221/scripts/MHCServer.dll/home .html) or MHCEP (http://wehih.wehi.edu.au/mhcpep/) to identify and match published motif databases. Alternatively, binding to class II molecules can be predicted by virtual matrix methods (Sturniolo, T, et al. (1999) Nature Biotechnology, 17: 555-561) and Raddrizzani, L. and Hammer, J., (2000) Brief. Bioinform., Both of which are hereby incorporated by reference) or the allele-specific polynomial algorithm described in Fikes, J., et al., WO 01/41788.   In a further embodiment, non-anchor residues are substituted.

好ましい実施態様では、抗原加工および提示のための上記で定義されるような特異的切断モチーフが除去される。あるタンパク質に存在するMHCクラスII分子のための抗原決定因子の加工に関与するプロテアーゼには、カテプシンB、D、E、Lおよびアスパラギニルエンドペプチダーゼが含まれる(Schneider, S.C., et al., (2000) J. Immunol., 165:20-23; 出典明示により全体的に本明細書の一部とする、を参照)。好ましくは、タンパク質分解切断部位を除去して、MHCクラスII分子へ結合するための抗原決定因子の利用可能性を低減させる。可能性のあるタンパク質分解切断部位は、Schneider, S.C., et al., (2000) J. Immunol., 165:20-23; および Medd and Chain, (2000) Cell & Developmental Biology, 11:203-210(両方とも出典明示により全体的に本明細書の一部とする)に記載されたようにして同定する。   In a preferred embodiment, specific cleavage motifs as defined above for antigen processing and presentation are removed. Proteases involved in the processing of antigenic determinants for MHC class II molecules present in certain proteins include cathepsins B, D, E, L and asparaginyl endopeptidases (Schneider, SC, et al., (2000) J. Immunol., 165: 20-23; entirely incorporated herein by reference). Preferably, proteolytic cleavage sites are removed to reduce the availability of antigenic determinants for binding to MHC class II molecules. Possible proteolytic cleavage sites are Schneider, SC, et al., (2000) J. Immunol., 165: 20-23; and Medd and Chain, (2000) Cell & Developmental Biology, 11: 203-210. (Both of which are hereby incorporated by reference in their entirety).

好ましい実施態様では、可能性のあるMHCクラスII結合部位を、細胞性免疫を誘導する手段として標的タンパク質に付加する。好ましくは、少なくとも1つのMHCクラスII結合部位を標的タンパク質ごとに付加する。より好ましくは、少なくとも2つのMHCクラスII結合部位を標的タンパク質ごとに付加する。より好ましくは、3ないし5個のMHCクラスII結合部位を標的タンパク質ごとに付加する。他の実施態様では、16個までのMHCクラスII結合部位を標的タンパク質ごとに付加し得る(Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98:13872-13877; 出典明示により本明細書の一部とする、を参照)。改変された標的タンパク質の正しい折畳みと安定性を確実にするために、PDA(登録商標)技法を使用する。適する標的タンパク質には、Zn−アルファ2−糖タンパク質(Sanchez, L.M., et al., (1999) Science 283:1914-9)などの可溶性タンパク質、または他の目的の標的タンパク質を使用して生成された一次配列ライブラリーが含まれるが、これらに限定されるわけではない。可能性のあるMHC II結合モチーフは、SYFPEITHI (Rammensee, H., et al., (1999) Immunogenetics, 50:213-219; http://134.2.96.221/scripts/MHCServer.dll/home.html)); http://wehih.wehi.edu.au/mhcpep/, MHCEP (Brusic, B., et al., 前出) などの公開されたモチーフのデータベースに適合させることにより、または、仮想マトリックス(Sturniolo, T, et al. (1999) Nature Biotechnology, 17:555-561; Raddrizzani, L. and Hammer, J., (2000) Brief Bioinform., 1:179-89)および対立遺伝子特異的多項式アルゴリズム (Fikes, J., et al., WO 01/41788)などの確立された方法により、同定する。   In a preferred embodiment, potential MHC class II binding sites are added to the target protein as a means of inducing cellular immunity. Preferably, at least one MHC class II binding site is added for each target protein. More preferably, at least two MHC class II binding sites are added per target protein. More preferably, 3 to 5 MHC class II binding sites are added per target protein. In other embodiments, up to 16 MHC class II binding sites may be added per target protein (Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98: 13872-13877; As a part of this specification). PDA® technology is used to ensure correct folding and stability of the modified target protein. Suitable target proteins are produced using soluble proteins such as Zn-alpha 2-glycoprotein (Sanchez, LM, et al., (1999) Science 283: 1914-9), or other target proteins of interest. Primary sequence libraries, but are not limited to these. A possible MHC II binding motif is SYFPEITHI (Rammensee, H., et al., (1999) Immunogenetics, 50: 213-219; http://134.2.96.221/scripts/MHCServer.dll/home.html) ); http://wehih.wehi.edu.au/mhcpep/, by adapting to published motif databases such as MHCEP (Brusic, B., et al., supra), or virtual matrices ( Sturniolo, T, et al. (1999) Nature Biotechnology, 17: 555-561; Raddrizzani, L. and Hammer, J., (2000) Brief Bioinform., 1: 179-89) and allele-specific polynomial algorithms ( Identification by established methods such as Fikes, J., et al., WO 01/41788).

好ましい実施態様では、抗原加工および提示のための上記で定義されるような特異的切断モチーフを付加する。好ましくは、カテプシンB、D、E、Lおよびアスパラギニルエンドペプチダーゼのタンパク質分解切断部位を付加して、MHCクラスII分子へ結合するための抗原決定因子の利用可能性を高める。可能性のあるタンパク質分解切断部位は、Schneider, S.C., et al., (2000) J. Immunol., 165:20-23; および Medd and Chain, (2000) Cell & Developmental Biology, 11:203-210(両方とも出典明示により全体的に本明細書の一部とする)に記載されたようにして同定する。   In a preferred embodiment, a specific cleavage motif as defined above for antigen processing and presentation is added. Preferably, cathepsin B, D, E, L and asparaginyl endopeptidase proteolytic cleavage sites are added to increase the availability of antigenic determinants for binding to MHC class II molecules. Possible proteolytic cleavage sites are Schneider, SC, et al., (2000) J. Immunol., 165: 20-23; and Medd and Chain, (2000) Cell & Developmental Biology, 11: 203-210. (Both of which are hereby incorporated by reference in their entirety).

好ましい実施態様では、可能性のあるMHCクラスIおよびクラスII結合部位を、標的タンパク質または目的の他の標的タンパク質を使用して生成した一次配列ライブラリーに、上記で定義したように細胞性免疫を誘導する手段として付加する。   In a preferred embodiment, potential MHC class I and class II binding sites are transferred to a primary sequence library generated using the target protein or other target protein of interest, with cellular immunity as defined above. Add as a means to guide.

好ましい実施態様では、本明細書に記載のコンピューター処理方法により改変された配列のみを考慮する。 他の実施態様では、自己由来タンパク質に存在するペプチド配列 (即ち、免疫グロブリン、アルブミンなどの循環するヒトタンパク質)は無視される。   In preferred embodiments, only sequences modified by the computer processing methods described herein are considered.   In other embodiments, peptide sequences present in autologous proteins (ie, circulating human proteins such as immunoglobulins, albumin, etc.) are ignored.

好ましい実施態様では、一次変異配列を、T細胞エピトープとして機能すると予測されるペプチド断片についてスクリーニングする。好ましい実施態様では、可能性のあるT細胞エピトープは、T細胞エピトープを排除するために除去された残基を構造的および化学的に補償するアミノ酸残基で置換される。好ましくは、可能性のあるT細胞エピトープは、公開されたモチーフのデータベースに適合させて同定する (Walden, P., (1996) Curr. Op. Immunol., 8:68-74)。本発明で有用な他のT細胞エピトープ同定方法には、Hemmer, B., et al. (1998) J. Immunol., 160:3631-3636; Walden, P., et al. (1995) Biochemical Society Transactions, 23; Anderton, S.M., et al., (1999) Eur. J. Immunol., 29:1850-1857; Correia-Neves, M., et al., (1999) J. Immunol., 163:5471-5477; Shastri, N., (1995) Curr. Op. Immunol., 7:258-262; Hiemstra, H.S., (2000) Curr. Op. Immunol., 12:80-84; および Meister, G.E., et al., (1995) Vaccine, 13:581-591(全て出典明示により全体を本明細書の一部とする)に記載されたものが含まれる。   In a preferred embodiment, the primary mutant sequence is screened for peptide fragments that are predicted to function as T cell epitopes. In a preferred embodiment, potential T cell epitopes are replaced with amino acid residues that structurally and chemically compensate for the removed residues to eliminate T cell epitopes. Preferably, potential T cell epitopes are identified by fitting to published motif databases (Walden, P., (1996) Curr. Op. Immunol., 8: 68-74). Other T cell epitope identification methods useful in the present invention include Hemmer, B., et al. (1998) J. Immunol., 160: 3631-3636; Walden, P., et al. (1995) Biochemical Society. Transactions, 23; Anderton, SM, et al., (1999) Eur. J. Immunol., 29: 1850-1857; Correia-Neves, M., et al., (1999) J. Immunol., 163: 5471 Shastri, N., (1995) Curr. Op. Immunol., 7: 258-262; Hiemstra, HS, (2000) Curr. Op. Immunol., 12: 80-84; and Meister, GE, et al., (1995) Vaccine, 13: 581-591, all of which are incorporated herein by reference in their entirety.

好ましい実施態様では、抗原加工および提示のための上記で定義されるような特異的切断モチーフを除去する。MHCクラスIおよび/またはクラスII分子のために存在する抗原決定因子の加工に関与する切断部位を、上記のように除去する。このように、タンパク質分解切断部位を除去して、MHCクラスII分子へ結合するための抗原決定因子の利用可能性を低減させ得る。加えて、プロテオソーム切断部位を除去して、MHCクラスII分子へ結合するための抗原決定因子の利用可能性を低減させ得る。   In a preferred embodiment, specific cleavage motifs as defined above for antigen processing and presentation are removed. Cleavage sites involved in processing of antigenic determinants present for MHC class I and / or class II molecules are removed as described above. In this way, proteolytic cleavage sites can be removed to reduce the availability of antigenic determinants for binding to MHC class II molecules. In addition, proteosome cleavage sites can be removed to reduce the availability of antigenic determinants for binding to MHC class II molecules.

好ましい実施態様では、非ペプチド主鎖要素をT細胞エピトープに導入し、アンタゴニスト的特性を有するMHCクラスIまたはクラスIIリガンドを生成させる。本明細書において、「非ペプチド主鎖要素」は、上記のように、非天然産生または合成アミノ酸を意味する。本明細書において、「アンタゴニスト的」は、T細胞により認識されるが、活性化するエピトープの存在下でさえ、その活性化を妨害するエピトープ、即ち同種のエピトープを意味する。一般的に、アンタゴニスト的なものは、ペプチド側鎖の荷電または大きいサイズの改変を導入するアミノ酸置換により、既知のエピトープから誘導される。好ましくは、N−ヒドロキシル化ペプチド誘導体またはβアミノ酸をT細胞エピトープに導入し、アンタゴニストを生成させる(例えば、Hin, S., et al., (1999) J. Immunology, 163:2363-2367; Reinelt, S., et al., (2001) J. Biol. Chemistry, 276:24525-24530、出典明示により全体的に本明細書の一部とする、を参照)。   In preferred embodiments, non-peptide backbone elements are introduced into T cell epitopes to generate MHC class I or class II ligands with antagonistic properties. As used herein, “non-peptide backbone element” means a non-naturally occurring or synthetic amino acid as described above. As used herein, “antagonistic” means an epitope that is recognized by a T cell but interferes with its activation even in the presence of an activating epitope, ie, a homologous epitope. In general, antagonistic ones are derived from known epitopes by amino acid substitutions that introduce peptide side chain charges or large size modifications. Preferably, N-hydroxylated peptide derivatives or β-amino acids are introduced into T cell epitopes to generate antagonists (eg, Hin, S., et al., (1999) J. Immunology, 163: 2363-2367; Reinelt S., et al., (2001) J. Biol. Chemistry, 276: 24525-24530, which is hereby incorporated by reference in its entirety.).

他の実施態様では、標的タンパク質の天然の折畳みと安定性に影響しない領域で、T細胞エピトープを一次配列ライブラリーに導入する。T細胞エピトープは、上記のような既知のMHC I結合ペプチド、MHC II結合ペプチドおよびT細胞エピトープのデータベースから選択される。好ましくは、少なくとも1つのT細胞エピトープを標的タンパク質ごとに付加する。より好ましくは、少なくとも2つのT細胞エピトープを標的タンパク質ごとに付加する。より好ましくは、3ないし5個のT細胞エピトープを標的タンパク質ごとに付加する。他の実施態様では、16個までのT細胞エピトープを標的タンパク質ごとに付加し得る(Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98:13872-13877; 出典明示により全体的に本明細書の一部とする、を参照)。改変された標的タンパク質の正しい折畳みと安定性を確実にするために、PDA(登録商標)技法を使用する。   In other embodiments, T cell epitopes are introduced into the primary sequence library in regions that do not affect the natural folding and stability of the target protein. The T cell epitope is selected from a database of known MHC I binding peptides, MHC II binding peptides and T cell epitopes as described above. Preferably, at least one T cell epitope is added for each target protein. More preferably, at least two T cell epitopes are added per target protein. More preferably, 3 to 5 T cell epitopes are added for each target protein. In other embodiments, up to 16 T cell epitopes can be added per target protein (Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98: 13872-13877; As a part of this specification). PDA® technology is used to ensure correct folding and stability of the modified target protein.

好ましい実施態様では、抗原加工と提示のための上記で定義された特異的切断モチーフが付加される。MHCクラスIおよび/またはクラスII分子のために存在する抗原決定因子の加工に関与する切断部位を、上記のように付加する。従って、タンパク質分解切断部位を付加し、MHCクラスII分子へ結合するための抗原決定因子の利用可能性を高め得る。加えて、プロテオソーム切断部位を付加し、MHCクラスI分子へ結合するための抗原決定因子の利用可能性を高め得る。   In a preferred embodiment, a specific cleavage motif as defined above for antigen processing and presentation is added. Cleavage sites involved in the processing of antigenic determinants present for MHC class I and / or class II molecules are added as described above. Thus, proteolytic cleavage sites can be added to increase the availability of antigenic determinants for binding to MHC class II molecules. In addition, proteosome cleavage sites can be added to increase the availability of antigenic determinants for binding to MHC class I molecules.

好ましい実施態様では、非ペプチド主鎖要素をT細胞エピトープに導入し、アゴニスト特性を有するMHCクラスIまたはクラスIIリガンドを生成させる。本明細書において、「アゴニスト」は、T細胞により認識され、それを活性化するエピトープを意味する。   In a preferred embodiment, non-peptide backbone elements are introduced into T cell epitopes to produce MHC class I or class II ligands with agonist properties. As used herein, “agonist” means an epitope that is recognized by and activates T cells.

好ましい実施態様では、抗体に結合すると予測されるペプチド断片について一次変異配列をスクリーニングする。好ましい実施態様では、Meyer らにより記載されたように(Meyer, D.L., et al. (2001), Protein Sci., 10:491-503; Schwartz, HL., et al. (1999) J. Mol Biol. 287:983-999; および Laroche, Y., et al., (2000) Blood, 96:1425-1432 も参照のこと)、可能性のあるB細胞エピトープをより小さい中性の残基で置換し、配列の免疫原性を低減させる。   In a preferred embodiment, the primary mutant sequence is screened for peptide fragments that are predicted to bind to the antibody. In a preferred embodiment, as described by Meyer et al. (Meyer, DL, et al. (2001), Protein Sci., 10: 491-503; Schwartz, HL., Et al. (1999) J. Mol Biol 287: 983-999; and Laroche, Y., et al., (2000) Blood, 96: 1425-1432), replacing potential B cell epitopes with smaller neutral residues. And reduce the immunogenicity of the sequence.

他の実施態様では、標的タンパク質の天然の折畳みと安定性に影響しない領域で、B細胞エピトープを一次配列ライブラリーまたは可溶性標的タンパク質に導入する。特に、荷電、芳香族または大型疎水性残基を標的タンパク質の表面上に付加する。好ましくは、少なくとも1つのB細胞エピトープを標的タンパク質ごとに付加する。より好ましくは、少なくとも2つのB細胞エピトープを標的タンパク質ごとに付加する。より好ましくは、3ないし5個のB細胞エピトープを標的タンパク質ごとに付加する。他の実施態様では、16個までのB細胞エピトープを標的タンパク質ごとに付加し得る(Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98:13872-13877; 出典明示により本明細書の一部とする、を参照)。改変された標的タンパク質の正しい折畳みと安定性を確実にするために、PDA(登録商標)技法を使用する。   In other embodiments, B cell epitopes are introduced into the primary sequence library or soluble target protein in a region that does not affect the natural folding and stability of the target protein. In particular, charged, aromatic or large hydrophobic residues are added on the surface of the target protein. Preferably, at least one B cell epitope is added for each target protein. More preferably, at least two B cell epitopes are added per target protein. More preferably, 3 to 5 B cell epitopes are added per target protein. In other embodiments, up to 16 B cell epitopes may be added per target protein (Stienekemeier, M., et al., (2001) Proc Natl Acad Sci USA, 98: 13872-13877; As part of the description). PDA® technology is used to ensure correct folding and stability of the modified target protein.

いくつかの実施態様では、T細胞エピトープ、B細胞エピトープ、MHCクラスIおよび/またはMHCクラスII結合モチーフの任意の組合せを、一次配列ライブラリーまたはZn−アルファ2−糖タンパク質などの可溶性標的タンパク質に上記のように導入する。   In some embodiments, any combination of T cell epitopes, B cell epitopes, MHC class I and / or MHC class II binding motifs is converted into a primary target library or soluble target protein such as a Zn-alpha 2-glycoprotein. Introduce as above.

好ましい実施態様では、MHCクラスIまたはクラスII分子、TCRまたはBCRと相互作用する能力のある少なくとも1つの配列が改変された、少なくとも1つの候補変異タンパク質を同定する。可能性があるか、または実際のMHC、TCRまたはBCR配列を同定するいかなる方法も、本発明で使用し得る。許容し得る方法には、コンピューター処理的または物理的方法が含まれる。許容し得るコンピューター処理方法には、OptiMer と EpiMer (Meister, GE., et al. (1995) Vaccine, 6:581-591); 相互作用段階的判別手段分析金属アルゴリズム(iterative stepwise discriminant analysis metal algorithm)(Mallios, RR., (1999) Bioinformatics, 15:432-439);および構造ベースのもの (Altuvia, Y., (1997) Human Immunology 58:1-11)および進化的アルゴリズムと人工神経ネットワークを組合せた予測方法(Brusic, V., et al. (1998) Bioinformatics, 14:121-130)、仮想的マトリックス (Sturniolo, T., et al. (1999) Nature Biotechnology, 17:555-561) および BONSAI 決定ツリー (Savoie, CJ., et al (1999) Pac Symp Biocomput., 182-9)などのアルゴリズムの使用が含まれる。この段落で引用した全参照文献を、出典明示により全体的に本明細書の一部とする。   In a preferred embodiment, at least one candidate mutant protein is identified in which at least one sequence capable of interacting with an MHC class I or class II molecule, TCR or BCR has been modified. Any method of identifying the actual or actual MHC, TCR or BCR sequence may be used in the present invention. Acceptable methods include computational or physical methods. Acceptable computer processing methods include OptiMer and EpiMer (Meister, GE., Et al. (1995) Vaccine, 6: 581-591); interactive stepwise discriminant analysis metal algorithm (Mallios, RR., (1999) Bioinformatics, 15: 432-439); and structure-based (Altuvia, Y., (1997) Human Immunology 58: 1-11) and combining evolutionary algorithms with artificial neural networks Prediction methods (Brusic, V., et al. (1998) Bioinformatics, 14: 121-130), virtual matrix (Sturniolo, T., et al. (1999) Nature Biotechnology, 17: 555-561) and BONSAI This includes the use of algorithms such as decision trees (Savoie, CJ., Et al (1999) Pac Symp Biocomput., 182-9). All references cited in this paragraph are hereby incorporated by reference in their entirety.

許容し得る物理的方法には、高親和性結合アッセイ(Hammer, J., et al. (1993) Proc. Natl. Acad. Sci. USA, 91:4456-4460; Sarobe, P. et al. (1998) J. Clin. Invest., 102:1239-1248)、T細胞増殖およびCTLアッセイ (Hemmer, B., et al., (1998) J. Immunol., 160:3631-3636)、安定化アッセイ、精製MHC分子またはMHCを有するMHCへの競合阻害アッセイ、または抽出に続く配列解読(Brusic, V., et al., (1998) Nucleic Acids Res., 26:368-371)が含まれる。この段落で引用した全参照文献を、出典明示により全体的に本明細書の一部とする。   Acceptable physical methods include high affinity binding assays (Hammer, J., et al. (1993) Proc. Natl. Acad. Sci. USA, 91: 4456-4460; Sarobe, P. et al. ( 1998) J. Clin. Invest., 102: 1239-1248), T cell proliferation and CTL assay (Hemmer, B., et al., (1998) J. Immunol., 160: 3631-3636), stabilization assay Competitive inhibition assays to purified MHC molecules or MHC with MHC, or sequencing followed by extraction (Brusic, V., et al., (1998) Nucleic Acids Res., 26: 368-371). All references cited in this paragraph are hereby incorporated by reference in their entirety.

可能性のあるMHC、TCRまたはBCR配列を同定したら、次いで下記のように1個またはそれ以上のアミノ酸の置換によりこれらの配列を変更する。一旦候補変異タンパク質を変更したら、その後該タンパク質を試験して、その活性が標的タンパク質と同様か否かを判定する。変異体は、十分な活性を保持しているか、十分な割合の活性を有用に保持し得る。   Once potential MHC, TCR or BCR sequences have been identified, these sequences are then altered by substitution of one or more amino acids as described below. Once the candidate mutant protein is changed, the protein is then tested to determine if its activity is similar to the target protein. A variant may retain sufficient activity or may usefully retain a sufficient percentage of activity.

本発明の変異タンパク質および核酸は、天然産生の標的タンパク質と区別できる。本明細書における「天然産生」または「野生型」または文法的均等物は、天然に見出されるアミノ酸配列またはヌクレオチド配列を意味し、対立遺伝子変化を含む;つまり、アミノ酸配列またはヌクレオチド配列は、通常は意図的に変更されていない。従って、本明細書における「非天然産生」または「合成」または「組換え」またはそれらの文法的均等物は、天然に見出されないアミノ酸配列またはヌクレオチド配列を意味する;つまり、アミノ酸配列またはヌクレオチド配列は、通常は意図的に変更されている。一旦組換え核酸が作成され、宿主細胞または生物に再導入されると、それは非組換え的に、即ち、インビトロの操作よりもむしろインビボで宿主細胞の細胞機構を使用して、複製されるが、一旦組換え的に産生された核酸は、以後は非組換え的に複製されても、本発明のためにはなお組換え体と考えられることが理解される。従って、本発明の変異タンパク質および核酸は、非天然産生である;つまり、これらは天然には存在しない。   The mutant proteins and nucleic acids of the present invention can be distinguished from naturally occurring target proteins. As used herein, “naturally produced” or “wild type” or grammatical equivalent means an amino acid sequence or nucleotide sequence found in nature and includes allelic changes; that is, an amino acid sequence or nucleotide sequence is usually It has not been intentionally changed. Thus, “non-naturally occurring” or “synthetic” or “recombinant” or grammatical equivalents herein means an amino acid sequence or nucleotide sequence that is not found in nature; Are usually deliberately changed. Once a recombinant nucleic acid has been created and reintroduced into a host cell or organism, it is replicated non-recombinantly, ie, using the cellular machinery of the host cell in vivo rather than in vitro manipulation. It will be appreciated that once recombinantly produced nucleic acid is subsequently replicated non-recombinantly, it is still considered recombinant for the purposes of the present invention. Thus, the mutant proteins and nucleic acids of the invention are non-naturally occurring; that is, they do not exist in nature.

従って、好ましい実施態様では、変異タンパク質は、少なくとも残基の1−5%まで標的配列と異なるアミノ酸配列を有する。つまり、本発明の変異タンパク質は標的アミノ酸配列と約97−99%以下同一である。従って、タンパク質は、標的配列に対するタンパク質配列の包括的相同性が好ましくは約99%以下、より好ましくは約98%以下、さらにより好ましくは約97%以下、そしてより好ましくは約95%以下であるならば、「候補変異タンパク質」である。いくつかの実施態様では、相同性は約75−80%程も低い。   Thus, in a preferred embodiment, the mutant protein has an amino acid sequence that differs from the target sequence by at least 1-5% of the residues. That is, the mutant protein of the present invention is about 97-99% or less identical to the target amino acid sequence. Accordingly, the protein preferably has a global homology of the protein sequence to the target sequence of about 99% or less, more preferably about 98% or less, even more preferably about 97% or less, and more preferably about 95% or less. Then, it is a “candidate mutant protein”. In some embodiments, the homology is as low as about 75-80%.

この文脈における相同性は、配列類似性または同一性を意味し、同一性が好ましい。当業界で既知のように、タンパク質(または以下に考察するように核酸)が既知配列と配列同一性または類似性を有しているか否かを同定するために多数の異なるプログラムを使用できる。配列同一性および/または類似性は技術上周知の標準的技法を使用して測定され、それには、Smith & Waterman, Adv. Appl. Math., 2: 482 (1981) の局所配列同一性アルゴリズム、Needleman & Wunsch, J. Mol. Biol., 48: 443 (1970) の配列同一性アラインメント、Pearson & Lipman, Proc. Natl. Acad. Sci. U.S.A., 85: 2444 (1988) の類似性検索法、これらのアルゴリズムのコンピュータによる実行(Wisconsin Genetics Software Package、Genetics Computer Group, 575 Science Drive, Madison, WI、中の GAP、BESTFIT、FASTA および TFASTA)、Devereux et al., Nucl. Acid Res., 12: 387-395 (1984) に記載の Best Fit 配列プログラムを含むがこれらに限定されるわけではなく、好ましくはデフォルト設定を使用し、または検定により使用する。好ましくは、FstDB により以下のパラメータに基づいてパーセント同一性を計算する:mismatch penalty 1; gap penalty 1; gap size penalty 0.33; joining penalty 30、"Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149 (1988), Alan R. Liss, Inc. である。全参照文献を、出典明示により本明細書の一部とする。   Homology in this context means sequence similarity or identity, with identity being preferred. As is known in the art, a number of different programs can be used to identify whether a protein (or a nucleic acid as discussed below) has sequence identity or similarity with a known sequence. Sequence identity and / or similarity is measured using standard techniques well known in the art, including the local sequence identity algorithm of Smith & Waterman, Adv. Appl. Math., 2: 482 (1981), Needleman & Wunsch, J. Mol. Biol., 48: 443 (1970) sequence identity alignment, Pearson & Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444 (1988) Computer implementation of the algorithm (Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Drive, Madison, WI, GAP, BESTFIT, FASTA and TFASTA), Devereux et al., Nucl. Acid Res., 12: 387- Including, but not limited to, the Best Fit sequence program described in 395 (1984), preferably using default settings or by assay. Preferably, FstDB calculates percent identity based on the following parameters: mismatch penalty 1; gap penalty 1; gap size penalty 0.33; joining penalty 30, "Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149 (1988), Alan R. Liss, Inc. All references are incorporated herein by reference.

有用なアルゴリズムの一例は PILEUP である。PILEUP は、漸進的対アラインメントを用いて関連配列群から多重配列アラインメントを創出する。それはまた、アラインメント創出に使用される、クラスタリングの関係を示すツリーを描くことができる。PILEUP は、Feng & Doolittle, J. Mol. Evol. 35: 351-360 (1987)の漸進的アラインメント法を簡略化したものを用いる;この方法は Higgins & Sharp, CABIOS 5: 151-153 (1989) 記載の方法と類似している。有用な PILEUP パラメータは、a default gap weight 3.00, a default gap length weight 0.10, weighted end gaps を含む。   An example of a useful algorithm is PILEUP. PILEUP creates multiple sequence alignments from related sequences using progressive pair alignment. It can also draw a tree showing the clustering relationships used to create the alignment. PILEUP uses a simplified version of the progressive alignment method of Feng & Doolittle, J. Mol. Evol. 35: 351-360 (1987); this method is Higgins & Sharp, CABIOS 5: 151-153 (1989). Similar to the method described. Useful PILEUP parameters include a default gap weight 3.00, a default gap length weight 0.10, and weighted end gaps.

有用なアルゴリズムのもう1つの例は、Altschul et al., J. Mol. Biol. 215, 403-410, (1990); Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997);および Karlin et al., Proc. Natl. Acad. Sci. U.S.A. 90: 5873-5787 (1993) に記載の BLAST アルゴリズムである。特に有用な BLAST プログラムは、Altschul et al., Methods in Enzymology, 266: 460-480 (1996); http://blast.wustl/edu/blast/ README.html] から得られる WU-BLAST-2 プログラムである。WU-BLAST-2 はいくつかの検索パラメータを使用するがその殆どはデフォルト値に設定されている。調節可能なパラメータは以下の値で設定する:overlap span =1, overlap fraction = 0.125, word threshold (T) = 11である。HSP S および HSP S2 パラメータは動的数値であり、特定の配列の組成および興味の対象である配列を検索する特定のデータベースの組成に依存してプログラム自身により確立されるが、値は感度を上げるように調節し得る。   Another example of a useful algorithm is Altschul et al., J. Mol. Biol. 215, 403-410, (1990); Altschul et al., Nucleic Acids Res. 25: 3389-3402 (1997); Karlin et al., Proc. Natl. Acad. Sci. USA 90: 5873-5787 (1993). A particularly useful BLAST program is the WU-BLAST-2 program obtained from Altschul et al., Methods in Enzymology, 266: 460-480 (1996); http: //blast.wustl/edu/blast/README.html] It is. WU-BLAST-2 uses several search parameters, most of which are set to default values. The adjustable parameters are set with the following values: overlap span = 1, overlap fraction = 0.125, word threshold (T) = 11. HSP S and HSP S2 parameters are dynamic numbers, established by the program itself depending on the composition of the particular sequence and the composition of the particular database searching for the sequence of interest, but the values increase sensitivity Can be adjusted as follows.

これに加えて有用なアルゴリズムは、Altschul et al., Nucl. Acids Res., 25: 3389-3402 に報告されている gapped BLAST である。gapped BLAST は BLOSUM-62 代替スコアを使用する;ここで閾値Tパラメータは9に設定し;2−ヒット法によりギャップのない伸長を引き起こし;ギャップ長kにコスト10+kを課し;Xを16に設定し;Xをデータベース検索段階では40に、そしてアルゴリズムのアウトプット段階では67に設定する。ギャップドアラインメントは約22ビットまでに相当するスコアで開始される。 An additional useful algorithm is gapped BLAST as reported in Altschul et al., Nucl. Acids Res., 25: 3389-3402. gapped BLAST uses BLOSUM-62 alternative score; wherein threshold T parameter set to 9; the X u 16; 2 hits method by causing a free extension of the gap; imposes costs 10 + k to the gap length k Set; Xg is set to 40 in the database search phase and 67 in the output phase of the algorithm. A gap door alignment starts with a score corresponding to about 22 bits.

パーセントアミノ酸配列同一性の値は、マッチする同一残基の数を、アラインメントを行った領域における「より長い」配列の総残基数で割って決定される。「より長い」配列は、アラインメントを行った領域中で実際の残基を最も多く有するものである(アラインメントスコアを最大化するために WU-Blast-2 により導入されたギャップを無視する)。   The percent amino acid sequence identity value is determined by dividing the number of matching identical residues by the total number of residues of the “longer” sequence in the aligned region. A “longer” sequence is one that has the most actual residues in the aligned region (ignoring gaps introduced by WU-Blast-2 to maximize the alignment score).

同様にして、本発明で同定されるポリペプチドのコード配列に関する「パーセント(%)核酸配列同一性」を、標的タンパク質のコード配列のヌクレオチド残基と同一な、候補配列中のヌクレオチド残基の割合として定義する。好ましい方法は、WU-BLAST-2 の BLASTN モジュールをデフォルトパラメータに設定し、重複スパンおよび重複フラクションをそれぞれ1および0.125に設定して利用する。   Similarly, “percent (%) nucleic acid sequence identity” with respect to the coding sequence of a polypeptide identified in the present invention is the percentage of nucleotide residues in the candidate sequence that are identical to the nucleotide residues of the coding sequence of the target protein. Define as A preferred method is to use WU-BLAST-2's BLASTN module with default parameters and overlap span and overlap fraction set to 1 and 0.125 respectively.

アラインメントは、アラインメントを行う配列中へのギャップ導入を含んでもよい。加えて、標的タンパク質より多いかまたは少ないアミノ酸を含有する配列については、ある実施態様では、配列同一性の割合は、アミノ酸総数に関する同一アミノ酸数に基づいて決定されると理解される。パーセント同一性の計算においては、相対的重みは、挿入、欠失、置換その他のような種々の配列変化の表出には割り当てられない。   Alignment may include introducing gaps into the alignment sequence. In addition, for sequences containing more or fewer amino acids than the target protein, it is understood that in certain embodiments, the percent sequence identity is determined based on the number of identical amino acids relative to the total number of amino acids. In calculating percent identity, relative weights are not assigned to the expression of various sequence changes such as insertions, deletions, substitutions, and the like.

ある実施態様では、同一性のみがプラスのスコアを与えられ(+1)、ギャップを含むあらゆる形態の配列変化に「0」の値が割り当てられる。これにより、配列類似性計算について後述するような、重みをつけた目盛りまたはパラメータの必要性がなくなる。例えば、パーセントアミノ酸配列同一性は、マッチする同一残基の数を、アラインメントを行った領域における「より短い」配列の総残基数で割り、100を掛けて算出される。「より長い」配列は、アラインメントを行った領域中で実際の残基を最も多く有するものである。   In one embodiment, only identity is given a positive score (+1) and a value of “0” is assigned to any form of sequence variation, including gaps. This eliminates the need for weighted scales or parameters as described below for sequence similarity calculations. For example, percent amino acid sequence identity is calculated by dividing the number of matching identical residues by the total number of residues of the “shorter” sequence in the aligned region and multiplying by 100. A “longer” sequence is one that has the most actual residues in the aligned region.

従って、本発明の変異タンパク質は、標的タンパク質よりも、短くても長くてもよい。標的配列の部分または断片が、変異タンパク質の定義に包含される。変異タンパク質の断片は、a)少なくとも1つの抗原エピトープを共有する;b)少なくとも指示された相同性を有する;c)そして好ましくは標的タンパク質の生物学的活性を示す場合、変異αタンパク質とみなされる。   Therefore, the mutant protein of the present invention may be shorter or longer than the target protein. A part or fragment of the target sequence is included in the definition of the mutant protein. A fragment of a mutant protein is considered a mutant alpha protein if it a) shares at least one antigenic epitope; b) has at least the indicated homology; c) and preferably exhibits the biological activity of the target protein. .

下記でより詳細に概説するように、好ましい実施態様では、候補変異タンパク質は、標的タンパク質と比較して、本明細書に概説するものよりもさらにアミノ酸変化を含む。加えて、本明細書に概説するように、さらなる新規変異タンパク質を形成するために、本明細書に描写する任意の変化をいかなる方法で組合せてもよい。   As outlined in more detail below, in a preferred embodiment, the candidate mutein contains further amino acid changes compared to the target protein than those outlined herein. In addition, as outlined herein, any of the changes depicted herein may be combined in any way to form additional novel mutant proteins.

加えて、例えば出典明示により本明細書の一部とするU.S.S.N. 09/798,789に記載のように、精製タグ、融合配列などの他の配列を付加することにより、標的タンパク質よりも長い候補変異タンパク質を作成できる。例えば、本発明の変異タンパク質を、他の治療的タンパク質または薬物動体学的な目的でFcもしくは血清アルブミンなどの他のタンパク質と融合させてもよい。例えば、両方とも出典明示により本明細書の一部とする米国特許番号第5,766,883号および第5,876,969号を参照されたい。   In addition, by adding other sequences such as purification tags, fusion sequences, as described, for example, in USS 09 / 798,789, which is hereby incorporated by reference. Can create candidate mutant proteins that are longer than the target protein. For example, the mutant proteins of the invention may be fused with other therapeutic proteins or other proteins such as Fc or serum albumin for pharmacokinetic purposes. See, eg, US Pat. Nos. 5,766,883 and 5,876,969, both of which are hereby incorporated by reference.

コア、表面、および境界残基に可変残基を含む変異タンパク質も、発明内に含まれる。 好ましい実施態様では、本発明の変異タンパク質は、ヒトのコンフォマー(conformer)である。本明細書における「コンフォマー」は、事実上同一の主鎖3D構造を有するが、アミノ酸側鎖に顕著な差異を有するタンパク質を意味する。つまり、本発明の変異タンパク質は、セットの全タンパク質が主鎖構造を共有し、なお少なくとも1−3−5%まで異なる配列を有する、コンフォマーのセットを定義する。変異タンパク質の3次元主鎖構造は、従ってヒト標的タンパク質の3次元主鎖構造と実質的に相応する。   Mutant proteins that contain variable residues at the core, surface, and boundary residues are also included within the invention.   In a preferred embodiment, the mutant protein of the invention is a human conformer. As used herein, “conformer” refers to a protein that has substantially the same main-chain 3D structure, but with significant differences in amino acid side chains. That is, the muteins of the present invention define a set of conformers where all the proteins of the set share the backbone structure and still have at least 1-3-5% different sequences. The three-dimensional backbone structure of the mutant protein therefore substantially corresponds to the three-dimensional backbone structure of the human target protein.

この文脈における「主鎖」は、非側鎖原子、即ち窒素、カルボニル基の炭素および酸素、およびα炭素、並びに窒素およびα炭素に結合した水素を意味する。コンフォマーを考慮すると、タンパク質はヒト標的タンパク質構造から2Åを超えない主鎖原子を持たねばならず、1.5Åを超えないのが好ましく、1Åを超えないのが特に好ましい。一般に、これらの距離は2つの方法で決定される。ある実施態様では、可能性のある各コンフォマーを結晶化し、その3次元構造を決定する。あるいは、前者は技術的に難しいので、各可能性のあるコンフォマーの配列をPDA(登録商標)プログラムで実行し、それがコンフォマーであるか否かを判定する。   “Main chain” in this context means non-side chain atoms, ie nitrogen, carbon and oxygen of the carbonyl group, and the α carbon, and hydrogen bonded to the nitrogen and α carbon. In view of the conformer, the protein must have a main chain atom of no more than 2 か ら from the human target protein structure, preferably no more than 1.5 好 ま し く, particularly preferably no more than 1 Å. In general, these distances are determined in two ways. In one embodiment, each potential conformer is crystallized and its three-dimensional structure is determined. Alternatively, since the former is technically difficult, each possible conformer sequence is executed in the PDA® program to determine whether it is a conformer.

候補変異核酸にコードされるものとして、候補変異タンパク質を同定してもよい。核酸の場合、核酸配列の包括的な相同性はアミノ酸相同性と同一基準であるが、遺伝コードの縮重と様々な生物のコドン偏重を考慮に入れる。従って、核酸配列相同性は、タンパク質配列のものよりも低くても高くてもよく、低い相同性が好ましい。   A candidate mutant protein may be identified as being encoded by a candidate mutant nucleic acid. In the case of nucleic acids, the overall homology of nucleic acid sequences is the same criteria as amino acid homology, but takes into account the degeneracy of the genetic code and the codon bias of various organisms. Thus, nucleic acid sequence homology may be lower or higher than that of protein sequences, with lower homology being preferred.

好ましい実施態様では、候補変異核酸は、候補変異タンパク質をコードする。当業者に 理解されるように、遺伝暗号の縮重のために、すべて本発明の変異タンパク質をコードす る、極めて多数の核酸を作成し得る。ゆえに、特定のアミノ酸配列を同定すれば、当業者 は、変異タンパク質のアミノ酸配列を変えない方法で、単純に1つまたはそれ以上のコド ンの配列を変更することにより、異なる核酸をいくつでも作成し得る。   In a preferred embodiment, the candidate mutant nucleic acid encodes a candidate mutant protein. To those skilled in the art As will be appreciated, all encode the mutant proteins of the present invention due to the degeneracy of the genetic code. A large number of nucleic acids can be generated. Therefore, if a specific amino acid sequence is identified, those skilled in the art Is a method that does not change the amino acid sequence of the mutated protein, simply one or more codes. Any number of different nucleic acids can be made by altering the sequence of the nucleic acids.

ある実施態様では、核酸相同性はハイブリダイゼーション研究により決定される。ストリンジェンシーの高い条件は、当分野で既知である;例えば、出典明示により本明細書の一部とする Maniatis et al., Molecular Cloning: A Laboratory Manual, 2d Edition, 1989 および Short Protocols in Molecular Biology, ed. Ausubel, et al. を参照のこと。ストリンジェンシー条件は配列依存的であり、環境が違えば異なる。より長い配列はより高い温度で特異的にハイブリダイズする。核酸のハイブリダイゼーションの詳細な手引きは、Tijssen, Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays" (1993) に見出される。一般的に、ストリンジェンシー条件は、規定されたイオン強度およびpHにおいて、特異的配列の熱融解点(T)より約5−10℃低いように選択される。Tは、標的に相補的なプローブの50%が、平衡状態で標的配列に(規定のイオン強度、pHおよび核酸濃度で)ハイブリダイズする温度である(標的配列が過剰に存在するので、Tでは、50%のプローブが平衡状態で占有される)。ストリンジェンシー条件は、そこでは塩濃度が約1.0Mナトリウムイオンより低く、典型的には約0.01ないし1.0Mのナトリウムイオン(または他の塩)濃度、pH7.0ないし8.3、温度が、短いプローブ(例えば、10ないし50のヌクレオチド)には低くても約30℃、長いプローブ(例えば、50ヌクレオチド以上)には低くても約60℃であるもの、である。ストリンジェンシー条件は、ホルムアミドのような不安定化させる物質の添加により達成されてもよい。 In certain embodiments, nucleic acid homology is determined by hybridization studies. Conditions with high stringency are known in the art; for example, Maniatis et al., Molecular Cloning: A Laboratory Manual, 2d Edition, 1989 and Short Protocols in Molecular Biology, which are incorporated herein by reference. See ed. Ausubel, et al. Stringency conditions are sequence-dependent and will vary for different environments. Longer sequences hybridize specifically at higher temperatures. Detailed guidance on nucleic acid hybridization can be found in Tijssen, Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays" (1993). Generally, stringency conditions are selected to be about 5-10 ° C. lower than the thermal melting point (T m ) for the specific sequence at a defined ionic strength and pH. T m is the temperature at which 50% of the probe complementary to the target will hybridize to the target sequence in equilibrium (at a defined ionic strength, pH and nucleic acid concentration) (because the target sequence is present in excess) In m , 50% of the probes are occupied in equilibrium). Stringency conditions are such that the salt concentration is below about 1.0 M sodium ion, typically about 0.01 to 1.0 M sodium ion (or other salt) concentration, pH 7.0 to 8.3, The temperature is as low as about 30 ° C. for short probes (eg, 10-50 nucleotides) and as low as about 60 ° C. for long probes (eg, 50 nucleotides or more). Stringency conditions may be achieved by the addition of destabilizing substances such as formamide.

他の実施態様では、より低いストリンジェンシーのハイブリダイゼーション条件を使用する;例えば、当分野で既知のように、穏やかなまたは低いストリンジェンシー条件を使用してもよい;Maniatis and Ausubel(前出)および Tijssen(前出)を参照のこと。   In other embodiments, lower stringency hybridization conditions are used; for example, mild or low stringency conditions may be used, as known in the art; Maniatis and Ausubel (supra) and See Tijssen (supra).

本発明の候補変異タンパク質と核酸は、組換え体である。本明細書で使用される「核酸」は、DNAもしくはRNA、またはデオキシ−およびリボヌクレオチドの両者を含有する分子を表わし得る。核酸は、ゲノムDNA、cDNAおよびオリゴヌクレオチドを含み、センスおよびアンチセンス核酸を含む。このような核酸はまた、生理的環境におけるそのような分子の安定性および半減期を増加させるために、リボース−リン酸バックボーンに変更を含んでいてもよい。   The candidate mutant protein and nucleic acid of the present invention are recombinant. As used herein, “nucleic acid” may refer to DNA or RNA, or a molecule containing both deoxy- and ribonucleotides. Nucleic acids include genomic DNA, cDNA and oligonucleotides, including sense and antisense nucleic acids. Such nucleic acids may also contain changes in the ribose-phosphate backbone to increase the stability and half-life of such molecules in a physiological environment.

核酸は2本鎖、1本鎖であってよく、または2本鎖もしくは1本鎖の配列の両方の部分を含有してもよい。当業者に認識されるように、1本鎖(「ワトソン」)を描けばもう1つの鎖(「クリック」)の配列が規定され、ゆえに図6に示す配列は、該配列の相補鎖もまた含む。本明細書における「組換え核酸」の用語は、一般的に、核酸をエンドヌクレアーゼによって操作して、天然には通常見出されない形状で、当初にインビトロで形成した核酸を意味する。ゆえに、線状形状で単離された候補変異核酸や、通常は結合していないDNA分子をライゲーションすることによりインビトロで形成した発現ベクターは、両者とも本発明のためには組換え体と考えられる。一旦組換え核酸が作成され宿主細胞または生物に再導入されたら、それは非組換え的に、即ち、インビトロの操作ではなく宿主細胞のインビボの細胞機構を使用して複製すると理解される;しかしながら、そのような核酸は一旦組換え的に産生されれば、以後は非組換え的に複製しても、本発明のためにはなお組換え体と考えられる。   Nucleic acids may be double stranded, single stranded, or contain portions of both double stranded or single stranded sequence. As will be appreciated by those skilled in the art, drawing one strand (“Watson”) defines the sequence of the other strand (“click”), so the sequence shown in FIG. Including. As used herein, the term “recombinant nucleic acid” generally refers to a nucleic acid originally formed in vitro in a form that is not normally found in nature by manipulating the nucleic acid with an endonuclease. Therefore, both candidate mutant nucleic acids isolated in linear form and expression vectors formed in vitro by ligation of DNA molecules that are not normally bound are both considered recombinant for the purposes of the present invention. . Once a recombinant nucleic acid has been created and reintroduced into a host cell or organism, it is understood to replicate non-recombinant, ie, using the in vivo cellular machinery of the host cell rather than in vitro manipulation; Once such nucleic acid is produced recombinantly, it can still be replicated non-recombinantly and still be considered recombinant for the purposes of the present invention.

同様に、「組換えタンパク質」は組換え技法を使用して、即ち上述のように組換え核酸の発現を通して作成されたタンパク質である。組換えタンパク質は、少なくとも1つまたはそれ以上の特性によって、天然産生のタンパク質と区別される。例えば、このタンパク質は、野生型宿主中で通常会合しているタンパク質または化合物の一部または全てから単離または精製され、従って実質的に純粋であり得る。例えば、単離されたタンパク質は、天然状態では通常会合している物質の少なくとも一部を伴わないで、所定の試料中の総タンパク質重量の好ましくは少なくとも約0.5%、より好ましくは少なくとも5%を構成している。実質的に純粋なタンパク質は、総タンパク質重量の少なくとも約75%、好ましくは少なくとも約80%、そして特に好ましくは少なくとも約90%を含む。この定義には、ある生物由来の候補変異タンパク質を異なる生物または宿主細胞中で生産することが含まれる。あるいは、タンパク質がより増加した濃度レベルで作成されるように、誘導可能プロモーターまたは高発現プロモーターを使用することにより、タンパク質を通常見られるよりも有意に高濃度で作成し得る。さらに、以下に考察するように、本明細書で概説する全ての変異タンパク質は、アミノ酸置換、挿入および欠失、好ましくは置換、を含むので、天然に通常は見出されない形態である。   Similarly, a “recombinant protein” is a protein made using recombinant techniques, ie through expression of a recombinant nucleic acid as described above. A recombinant protein is distinguished from naturally occurring protein by at least one or more properties. For example, the protein can be isolated or purified from some or all of the protein or compound normally associated in the wild-type host, and thus can be substantially pure. For example, an isolated protein is preferably at least about 0.5%, more preferably at least 5% of the total protein weight in a given sample without at least some of the substances normally associated in the natural state. % Make up. A substantially pure protein comprises at least about 75%, preferably at least about 80%, and particularly preferably at least about 90% of the total protein weight. This definition includes producing a candidate mutein from one organism in a different organism or host cell. Alternatively, the protein can be made at a significantly higher concentration than would normally be seen by using an inducible promoter or a high expression promoter so that the protein is made at an increased concentration level. Furthermore, as discussed below, all of the mutant proteins outlined herein are in a form not normally found in nature because they contain amino acid substitutions, insertions and deletions, preferably substitutions.

本明細書で概説する候補変異配列のアミノ酸配列変異体も、本発明の候補変異タンパク質の定義に包含される。つまり、候補変異タンパク質は、標的タンパク質と比較して、さらなる可変位置を含有し得る。これらの変異体は、置換、挿入または欠失変異体の3分類の1つまたはそれ以上に相当する。これらの変異体は通常、カセット式またはPCR式変異導入または当分野で周知の他の技法を使用して、候補変異タンパク質をコードするDNA中のヌクレオチドの部位特異的変異導入により、変異体をコードするDNAを産生し、その後上記概説したようにDNAを組換え培養細胞中で発現させることにより調製する。しかしながら、約100〜150残基までを有する候補変異タンパク質断片を、確立された技法を使用してインビトロ合成で調製し得る。アミノ酸配列変異体は変化が予め決定されているという性質によって特徴付けられ、この特徴によって、これらの変異体は、候補変異タンパク質のアミノ酸配列の天然産生の対立遺伝子変異体または種間変異体から区別される。変異体は典型的に、天然産生の類似体と同じ定性的な生物学的活性を発揮するが、以下にさらに詳しく略述するように、変更された特徴を有する変異体を選択することもできる。   Amino acid sequence variants of the candidate variant sequences outlined herein are also included in the definition of candidate variant proteins of the invention. That is, the candidate mutant protein can contain additional variable positions compared to the target protein. These variants correspond to one or more of three classes: substitutional, insertional or deletional variants. These mutants typically encode the mutant by site-directed mutagenesis of nucleotides in the DNA encoding the candidate mutant protein using cassette or PCR mutagenesis or other techniques well known in the art. And is then prepared by expressing the DNA in recombinant cultured cells as outlined above. However, candidate mutant protein fragments having up to about 100-150 residues can be prepared by in vitro synthesis using established techniques. Amino acid sequence variants are characterized by the property that changes are predetermined, which distinguishes these variants from naturally occurring allelic or interspecies variants of the amino acid sequence of the candidate mutant protein. Is done. Variants typically exhibit the same qualitative biological activity as naturally occurring analogs, but variants with altered characteristics can also be selected as outlined in more detail below. .

アミノ酸配列変異を導入する部位または領域は予め決定されるが、変異自体は予め決定しておく必要はない。例えば、所定の部位における変異の実施を最適化するために、標的コドンまたは領域でランダム変異誘発を起こし、発現した変異タンパク質をスクリーニングして所望の活性の最適な組合せについてスクリーニングしてもよい。既知配列を有するDNA中の予め定められた部位に置換変異を作成する技法は周知であり、例えば、M13プライマーによる変異導入およびPCRによる変異導入がある。   The site or region for introducing an amino acid sequence variation is determined in advance, but the mutation per se need not be determined in advance. For example, in order to optimize the performance of mutations at a given site, random mutagenesis may occur at the target codon or region, and the expressed mutant proteins may be screened for the optimal combination of desired activities. Techniques for creating substitution mutations at predetermined sites in DNA having a known sequence are well known, for example, mutagenesis by M13 primer and mutagenesis by PCR.

アミノ酸置換は典型的には単一の残基である;かなり大きな挿入も許容され得るが、挿入は通常、約1〜20アミノ酸の単位で行われる。欠失は、より大きな場合もあるが、約1から約20残基の範囲である。   Amino acid substitutions are typically single residues; insertions are usually made in units of about 1-20 amino acids, although fairly large insertions may be tolerated. Deletions can be larger, but range from about 1 to about 20 residues.

最終誘導体に到達するために、置換、欠失、挿入またはそれらのいかなる組合せを用いてもよい。一般的に、これらの変化は、分子の改変を最小限にするために少数のアミノ酸について行われる。しかしながら、より大きな変化も一定の状況では許容され得る。変異タンパク質の特徴について小さな改変が望まれる場合は、置換は一般的にチャート1に従って作成される。

Figure 2007520423
Substitutions, deletions, insertions or any combination thereof may be used to arrive at the final derivative. In general, these changes are made on a small number of amino acids to minimize molecular modifications. However, larger changes can be tolerated in certain situations. Substitutions are generally made according to Chart 1 if minor modifications are desired for the characteristics of the mutated protein.
Figure 2007520423

機能または免疫学的同一性における実質的な変化は、チャートIに示したものより保存性の低い置換を選択することによって作成される。例えば、より大きく影響する置換を作成できる:それらは、改変する区域のポリペプチド主鎖構造、例えばアルファ−ヘリックス構造またはベータ−シート構造;標的部位での分子の電荷または疎水性;または側鎖の大きさである。一般的にポリペプチドの特性に最も大きな変化を生じると期待される置換は(a)親水性残基、例えばセリルまたはスレオニルを、疎水性残基、例えばロイシル、イソロイシル、フェニルアラニル、バリル、またはアラニルに置換する(またはその逆)、(b)システインまたはプロリンを他のいずれかの残基に置換する(またはその逆)、(c)正電荷を持つ側鎖、例えばリシル、アルギニル、またはヒスチジルを、負電荷を持つ側鎖、例えばグルタミル、アスパルチルに置換する(またはその逆)、または(d)大きい側鎖を持つ残基、例えばフェニルアラニンを、側鎖を持たない残基、例えばグリシンに置換する(またはその逆)、ものである。   Substantial changes in function or immunological identity are made by selecting substitutions that are less conservative than those shown in Chart I. For example, more influential substitutions can be made: they can be polypeptide backbone structures of the region to be modified, such as alpha-helix or beta-sheet structures; molecular charge or hydrophobicity at the target site; or side chain It is a size. The substitutions that are generally expected to produce the greatest changes in the properties of the polypeptide are: (a) a hydrophilic residue such as seryl or threonyl, a hydrophobic residue such as leucyl, isoleucyl, phenylalanyl, valyl, or Substituting alanyl (or vice versa), (b) replacing cysteine or proline with any other residue (or vice versa), (c) a positively charged side chain such as lysyl, arginyl, or histidyl Is replaced with a negatively charged side chain such as glutamyl, aspartyl (or vice versa), or (d) a residue with a large side chain such as phenylalanine is replaced with a residue without a side chain such as glycine Yes (or vice versa).

典型的には、変異体は定性的に同じ生物学的活性を発揮するが、必要に応じて免疫応答は元来の候補変異タンパク質のものから改変されていてもよい。あるいは、変異体を候補変異タンパク質の生物学的活性が改変されるように設計することができる。例えば、グリコシル化部位を改変または除去し得る。同様に、生物学的機能も改変し得る。   Typically, mutants exhibit the same biological activity qualitatively, but the immune response may be altered from that of the original candidate mutant protein, if desired. Alternatively, the mutant can be designed such that the biological activity of the candidate mutant protein is altered. For example, glycosylation sites can be modified or removed. Similarly, biological functions can be altered.

加えて、いくつかの実施態様では、標的タンパク質よりも安定である、免疫原性が改変された候補変異タンパク質を得るのが望ましい。好ましくは、酸化安定性、アルカリ安定性、熱安定性を示すタンパク質を得るのが望ましい。   In addition, in some embodiments, it is desirable to obtain candidate mutant proteins with altered immunogenicity that are more stable than the target protein. Preferably, it is desirable to obtain a protein exhibiting oxidative stability, alkali stability, and thermal stability.

酸化安定性の変化は、様々な酸化条件にさらされたときに、変異タンパク質の活性が、野生型タンパク質のものと比較して少なくとも約20%、より好ましくは少なくとも約50%増加することにより明示される。酸化安定性は、既知方法により測定される。   The change in oxidative stability is manifested by an increase in the activity of the mutant protein by at least about 20%, more preferably at least about 50% compared to that of the wild-type protein when exposed to various oxidizing conditions. Is done. Oxidative stability is measured by known methods.

アルカリ安定性の変化は、上昇または低下するpH条件にさらされたときに、変異タンパク質活性の半減期が、野生型タンパク質のものと比較して、少なくとも約5%またはそれ以上増加または減少(好ましくは増加)することにより明示される。一般に、アルカリ安定性は、既知方法により測定される。   The change in alkali stability indicates that the half-life of the mutant protein activity is increased or decreased by at least about 5% or more (preferably compared to that of the wild type protein) when exposed to increasing or decreasing pH conditions. Is increased). In general, alkali stability is measured by known methods.

熱安定性の変化は、比較的高い温度と中性pHにさらされたときに、変異タンパク質活性の半減期が、野生型タンパク質のものと比較して少なくとも約5%またはそれ以上増加または減少(好ましくは増加)することにより明示される。一般に、熱安定性は、既知方法により測定される。   Changes in thermal stability indicate that the half-life of the mutant protein activity is increased or decreased by at least about 5% or more compared to that of the wild-type protein when exposed to relatively high temperatures and neutral pH ( (Preferably increase). In general, thermal stability is measured by known methods.

本発明の候補変異タンパク質および核酸は、数々の方法で作成できる。個々の核酸およびタンパク質は、当分野で既知のように、また以下に概説するように作成できる。あるいは、候補変異タンパク質のライブラリーを試験用に作成できる。   Candidate mutant proteins and nucleic acids of the invention can be made by a number of methods. Individual nucleic acids and proteins can be made as known in the art and as outlined below. Alternatively, a library of candidate mutant proteins can be created for testing.

好ましい実施態様では、候補変異タンパク質ライブラリーは確率分布表から生成される。本明細書に概説するように、PDA(登録商標)技法、配列アラインメント、自己無撞着性平均力場(self-consistent mean field; SCMF)計算などの力場計算などを含む、確率分布表を生成させる様々な方法がある。加えて、ライブラリーで観察される変異頻度の測定として各位置についてエントロピースコアの情報を生成させるために、確率分布を使用できる。   In a preferred embodiment, the candidate mutant protein library is generated from a probability distribution table. Produce probability distribution tables, including PDA® techniques, sequence alignment, force field calculations such as self-consistent mean field (SCMF) calculations, etc. as outlined herein There are various ways to make it happen. In addition, a probability distribution can be used to generate entropy core information for each position as a measure of the mutation frequency observed in the library.

この実施態様では、リスト中の各可変位置における各アミノ酸残基の頻度を同定する。各頻度は、カットオフより低い変異頻度を全てゼロとセットした場合の閾値であり得る。このカットオフは、好ましくは、約1%、2%、5%、10%または20%であり、特に好ましいのは約10%である。これらの頻度は、次いで候補変異タンパク質ライブラリー中に組込む。即ち、上記のように、これらの可変位置を集め、そしてあらゆる可能性のある組合せを生成させるが、候補変異タンパク質ライブラリーを「満たす」アミノ酸残基は頻度ベースで利用する。従って、ある頻度ベースでない候補変異タンパク質ライブラリー中では、5つの可能性のある残基を有する1つの可変位置が、可能性がある第1残基を有するその可変位置を含むタンパク質を約20%、第2のそれを20%、以下同、を有するであろう。しかしながら、頻度ベースの候補変異タンパク質ライブラリーでは、それぞれ約10%、15%、25%、30%および20%の頻度で、5つの可能性のある残基を有する1つの可変位置は、可能性がある第1残基を有するその可変位置を含むタンパク質を10%、第2残基を有するタンパク質を15%、第3のそれを25%、以下同、を有するであろう。当業者には明らかなように、実際の頻度は実際にタンパク質生成に使用した方法によって変り得る;例えば、正確な頻度はタンパク質を合成した時に可能であり得る。しかしながら、以下に概説する頻度ベースのプライマー系を使用する場合は、各位置における実際の頻度は後述のように変化する。   In this embodiment, the frequency of each amino acid residue at each variable position in the list is identified. Each frequency can be a threshold when all mutation frequencies below the cutoff are set to zero. This cut-off is preferably about 1%, 2%, 5%, 10% or 20%, with about 10% being particularly preferred. These frequencies are then incorporated into the candidate mutant protein library. That is, as described above, these variable positions are collected and any possible combinations are generated, but the amino acid residues that “fill” the candidate mutant protein library are utilized on a frequency basis. Thus, in a non-frequency-based candidate mutant protein library, one variable position with five possible residues is about 20% of proteins containing that variable position with a potential first residue. The second would have 20%, and so on. However, in a frequency-based candidate mutein library, one variable position with 5 possible residues, with a frequency of about 10%, 15%, 25%, 30% and 20%, respectively, is likely Will have 10% of the protein containing that variable position with the first residue, 15% of the protein with the second residue, 25% of the protein with the second residue, and so on. As will be apparent to those skilled in the art, the actual frequency may vary depending on the method actually used for protein production; for example, the exact frequency may be possible when the protein is synthesized. However, when using the frequency-based primer system outlined below, the actual frequency at each position varies as described below.

当業者に認識されるように、そして本明細書で概説するように、確率分布表は種々の方法で生成させることができる。本明細書で概説した方法に加えて、確率表の直接的生成において、自己無撞着性平均力場(SCMF)法を使用できる。SCMFは、回転異性体相互作用の平均力場の記載を使用してエネルギーを計算する決定論的コンピュータ処理方法である。この方法で形成された確率表は、本明細書に記載のような候補変異タンパク質ライブラリーを創出するのに使用できる。SCMFは3通りに使用できる:アミノ酸および各アミノ酸の回転異性体の頻度を各位置についてリストする;確率をSCMFから直接決定する(出典明示により本明細書の一部とする Delarue et la. Pac. Symp. Biocomput. 109-21 (1997) を参照のこと)。加えて、高度可変位置および非可変位置を同定できる。   As will be appreciated by those skilled in the art and as outlined herein, probability distribution tables can be generated in a variety of ways. In addition to the methods outlined herein, a self-consistent mean force field (SCMF) method can be used in the direct generation of probability tables. SCMF is a deterministic computerized method of calculating energy using a description of the mean force field of rotamer interactions. A probability table formed in this way can be used to create a candidate mutant protein library as described herein. SCMF can be used in three ways: list amino acid and rotamer frequency of each amino acid for each position; probability is determined directly from SCMF (Delarue et la. Pac., Which is incorporated herein by reference). Symp. Biocomput. 109-21 (1997)). In addition, highly variable positions and non-variable positions can be identified.

あるいは、配列空間探索中にどの配列にジャンプするかを決定するために、別の方法が使用される;SCMFはその配列について正確なエネルギーを得るために用いられる;このエネルギーは次いでそれをランク付けし、(モンテカルロ配列リストに類似の)配列のランク順リストを創出するのに使用される。次いで各位置におけるアミノ酸の頻度を示す確率表がこのリストから計算される(Koehl et al., J. Mol. Biol. 239: 249 (1994); Koehl et al., Nat. Struc. Biol. 2: 163 (1995); Koehl et al., Curr. Opin. Struct. Biol. 6: 222 (1996); Koehl et al., J. Mol. Bio. 293: 1183 (1999); Koehl et al., J. Mol. Biol. 293: 1161 (1999); Lee J. Mol. Biol. 236: 918 (1994); and Vasquez Biopolymers 36: 53-70 (1995);いずれも、特に出典明示により本明細書の一部とする) 。   Alternatively, another method is used to determine which sequence to jump to during the sequence space search; SCMF is used to obtain the correct energy for that sequence; this energy is then ranked And used to create a ranked list of sequences (similar to a Monte Carlo sequence list). A probability table showing the frequency of amino acids at each position is then calculated from this list (Koehl et al., J. Mol. Biol. 239: 249 (1994); Koehl et al., Nat. Struc. Biol. 2: 163 (1995); Koehl et al., Curr. Opin.Struct. Biol. 6: 222 (1996); Koehl et al., J. Mol. Bio. 293: 1183 (1999); Koehl et al., J. Mol. Biol. 293: 1161 (1999); Lee J. Mol. Biol. 236: 918 (1994); and Vasquez Biopolymers 36: 53-70 (1995); all of which are specifically incorporated herein by reference. And) .

類似の方法としては、OPLS-AA (Jorgensen, et al., J. Am. Chem. Soc. (1996), v 118, pp 11225-11236; Jorgensen, W.L.; BOSS, Version 4.1; Yale University: New Haven, CT (1999)); OPLS (Jorgensen, et al., J. Am. Chem. Soc. (1988), v 110, pp 1657ff; Jorgensen, et al., J Am. Chem. Soc. (1990), v 112, pp 4768ff);UNRES (United Residue Forcefield; Liwo, et al., Protein Science (1993), v 2, pp 1697-1714; Liwo, et al., Protein Science (1993), v 2, pp1715-1731; Liwo, et al., J. Comp. Chem. (1997), v 18, pp 849-873; Liwo, et al., J. Comp. Chem. (1997), v 18, pp 874-884; Liwo, et al., J. Comp. Chem. (1998), v 19, pp 259-276); Forcefield for Protein Structure Prediction(Liwo, et al., Proc. Natl. Acad. Sci. USA (1999), v 96, pp 5482-5485);ECEPP/3(Liwo et al., J Protein Chem 1994 May;13(4): 375-80); AMBER 1.1 力場 (Weiner, et al., J. Am. Chem. Soc. v 106, pp 765-784);AMBER 3.0 力場 (U.C. Singh et al., Proc. Natl. Acad. Sci. USA. 82: 755-759);CHARMM および CHARMM22 (Brooks, et al., J. Comp. Chem. v4, pp 187-217);cvff3.0(Dauber-Osguthorpe, et al.,(1988) Proteins: Structure, Function and Genetics, v 4,pp 31-47); CFF91(Maple, et al., J. Comp. Chem. v 15, 162-182)が含まれるが、これらに限定されるわけではない;また、DISCOVER(cvffおよびcff91)および AMBER 力場は INSIGHT 分子モデリングパッケージ(Biosym/MSI, San Diego California)で使用され、そして HARM は QUANTA 分子モデリングパッケージ(Biosym/MSI, San Diego California)(全参照文献を、出典明示により本明細書の一部とする)で使用される。   Similar methods include OPLS-AA (Jorgensen, et al., J. Am. Chem. Soc. (1996), v 118, pp 11225-11236; Jorgensen, WL; BOSS, Version 4.1; Yale University: New Haven. , CT (1999)); OPLS (Jorgensen, et al., J. Am. Chem. Soc. (1988), v 110, pp 1657ff; Jorgensen, et al., J Am. Chem. Soc. (1990), v 112, pp 4768ff); UNRES (United Residue Forcefield; Liwo, et al., Protein Science (1993), v 2, pp 1697-1714; Liwo, et al., Protein Science (1993), v 2, pp1715- 1731; Liwo, et al., J. Comp. Chem. (1997), v 18, pp 849-873; Liwo, et al., J. Comp. Chem. (1997), v 18, pp 874-884; Liwo, et al., J. Comp. Chem. (1998), v 19, pp 259-276); Forcefield for Protein Structure Prediction (Liwo, et al., Proc. Natl. Acad. Sci. USA (1999), v 96, pp 5482-5485); ECEPP / 3 (Liwo et al., J Protein Chem 1994 May; 13 (4): 375-80); AMBER 1.1 force field (Weiner, et al., J. Am. Chem) Soc. V 106, pp 765-784); AMBER 3.0 force field (UC Singh et al., Proc. Natl. Acad. Sci. USA. 82: 755-759); CHARMM and CHARMM22 (Brooks, et al., J. Comp. Chem. v4, pp 187-217); cvff3.0 (Dauber-Osguthorpe, et al., (1988) Proteins: Structure, Function and Genetics, v 4, pp 31-47); Including, but not limited to, CFF91 (Maple, et al., J. Comp. Chem. V 15, 162-182); and DISCOVER (cvff and cff91) and AMBER force fields are INSIGHT molecules Used in the modeling package (Biosym / MSI, San Diego California) and HARM is a QUANTA molecular modeling package (Biosym / MSI, San Diego California) (all references are hereby incorporated by reference) used.

加えて、本明細書で概説するように、確率分布表生成の好ましい方法は配列アラインメントプログラムの使用を介するものである。加えて、確率表は配列アラインメントおよびコンピューター処理によるアプローチの組合せで得られる。例えば、相同配列のアラインメントで見出されたアミノ酸をコンピューター処理の結果に付加できる。好ましくは、確率表に一致する野生型アミノ酸を、もしそれがコンピューター処理で見出されない場合に付加できる。   In addition, as outlined herein, a preferred method of generating a probability distribution table is through the use of a sequence alignment program. In addition, the probability table is obtained by a combination of sequence alignment and computational approach. For example, amino acids found in homologous sequence alignments can be added to the results of computer processing. Preferably, wild-type amino acids matching the probability table can be added if it is not found by computer processing.

明らかとなるであろうが、可変位置および/または可変位置における残基を組換えて創出した候補変異タンパク質ライブラリーは、ランク順になっていない。いくつかの実施態様では、全リストを作成し、試験するだけでよい。あるいは、好ましい実施態様では、この二次ライブラリーもランク順リスト形態にある。これは、二次ライブラリーの大きさが実験的に生成させるにはまだ大きすぎること、または予測上の目的を含む、いくつかの理由で行い得る。これは数種の方法で実施できる。ある実施態様では、ライブラリー構成員をランク付けするPDA(登録商標)のスコア付けまたはフィルターがけ機能を使用して、二次ライブラリーをランク付けまたはフィルターがけする。あるいは、統計的手法を使用できる。例えば、この二次ライブラリーは、頻度スコアによってランク付けまたはフィルターがけし得る;即ち、高頻度残基の大部分を含有するタンパク質を高くランク付けすること、等が可能であろう。これは、数値的スコアを生成させるために、各可変位置において頻度を加算するかまたは乗ずることによっても行い得る。同様にして、二次ライブラリーの様々な位置に重みを付け、次いでタンパク質をスコア付けできる;例えば、ある残基を含有するものを任意にランク付けまたはフィルターがけできる。   As will be apparent, candidate mutant protein libraries created by recombination of variable positions and / or residues at variable positions are not in rank order. In some implementations, the entire list need only be created and tested. Alternatively, in a preferred embodiment, this secondary library is also in a ranked list format. This can be done for several reasons, including that the size of the secondary library is still too large to generate experimentally, or for predictive purposes. This can be done in several ways. In one embodiment, the secondary library is ranked or filtered using the PDA® scoring or filtering function that ranks library members. Alternatively, statistical techniques can be used. For example, this secondary library may be ranked or filtered by frequency score; that is, it may be possible to rank proteins that contain the majority of high frequency residues, etc. This can also be done by adding or multiplying the frequency at each variable position to generate a numerical score. Similarly, various positions in the secondary library can be weighted and then the proteins can be scored; for example, those containing certain residues can be arbitrarily ranked or filtered.

好ましい実施態様では、候補変異体ライブラリーの異なるタンパク質構成員を化学的に合成できる。これは、設計したタンパク質が短い場合、好ましくは150アミノ酸長以下、より好ましくは100アミノ酸長以下、特に好ましくは50アミノ酸長以下である場合に特に有用であるが、当業界で既知のように、より長いタンパク質でも、化学的または酵素的に調製し得る。例えば、出典明示により本明細書の一部とする Wilken et al, Curr. Opin. Biotevhnol. 9: 412-26 (1998) 参照。   In a preferred embodiment, different protein members of the candidate mutant library can be chemically synthesized. This is particularly useful when the designed protein is short, preferably 150 amino acids or less, more preferably 100 amino acids or less, particularly preferably 50 amino acids or less, but as known in the art, Longer proteins can be prepared chemically or enzymatically. See, for example, Wilken et al, Curr. Opin. Biotevhnol. 9: 412-26 (1998), which is incorporated herein by reference.

好ましい実施態様では、特により長いタンパク質または大型サンプルが望まれるタンパク質について、候補変異配列を、構成員配列をコードしており、そして宿主細胞中にクローン化し、所望により発現および分析できるDNAのような核酸を生成させるために使用する。従って、各構成員タンパク質配列をコードする核酸、特にDNAを作成できる。これは周知の方法を使用して行う。コドン、適する発現ベクター、および適する宿主細胞の選択は、数々の要因によって変化し、また必要に応じて容易に最適化できる。   In a preferred embodiment, especially for longer proteins or proteins for which large samples are desired, candidate mutant sequences such as DNA that encode member sequences and can be cloned into host cells and optionally expressed and analyzed. Used to generate nucleic acid. Thus, nucleic acids, particularly DNA, encoding each member protein sequence can be created. This is done using known methods. The selection of codons, suitable expression vectors, and suitable host cells will vary depending on a number of factors and can be easily optimized as needed.

好ましい実施態様では、図1に一般的に示すように、プールしたオリゴヌクレオチドを用いる複数のPCR反応を実施する。この実施態様では、全長遺伝子に対応する重なり合ったオリゴヌクレオチドを合成する。また、これらのオリゴヌクレオチドは、各変異位置またはサブセットにおいて異なるアミノ酸の全てを表し得る。   In a preferred embodiment, multiple PCR reactions using pooled oligonucleotides are performed as generally shown in FIG. In this embodiment, overlapping oligonucleotides corresponding to the full-length gene are synthesized. These oligonucleotides may also represent all of the different amino acids at each mutation position or subset.

好ましい実施態様では、これらのオリゴヌクレオチドを等しい割合でプールし、複数のPCR反応を実施して、二次ライブラリーで定義された変異の組合せを含有する全長配列を創出する。加えて、このことは、誤りがちなPCR(error-prone PCR)の方法を使用して行い得る。   In a preferred embodiment, these oligonucleotides are pooled in equal proportions and multiple PCR reactions are performed to create a full-length sequence containing the combination of mutations defined in the secondary library. In addition, this can be done using error-prone PCR (error-prone PCR) methods.

好ましい実施態様では、様々なオリゴヌクレオチドを、確率分布表に対応する相対量で加える。従って、複数のPCR反応は、所望の変異の組合せを所望の割合で有する全長配列をもたらす。   In a preferred embodiment, the various oligonucleotides are added in relative amounts corresponding to the probability distribution table. Thus, multiple PCR reactions result in a full-length sequence having the desired mutation combination in the desired proportion.

必要なオリゴヌクレオチドの総数は、変異させる位置の数およびそれらの位置で考慮される変異の数の関数である。 (不変位置に対するオリゴ数)+M1+M2+M3+・・・Mn=(必要オリゴの総数)、但し、Mnはその配列の位置nにおいて考慮される変異の数である。   The total number of oligonucleotides required is a function of the number of positions to be mutated and the number of mutations considered at those positions. (Number of oligos for invariant positions) + M1 + M2 + M3 +... Mn = (total number of necessary oligos), where Mn is the number of mutations considered at position n of the sequence.

好ましい実施態様では、各重複オリゴヌクレオチドは、変異させようとする位置を1つだけ含む;別の実施態様では、変異位置が互いに近接しすぎてこのことを不可能にし、各オリゴヌクレオチド当たり複数の変異を使用して可能性のある全ての組換えを完成させる。即ち、各オリゴは、変異させようとする単一位置か、または変異させようとする1以上の位置のコドンを含有できる。変異させようとする複数位置は、オリゴの長さが非実用的になるのを防ぐために、配列内で近接していなければならない。あるオリゴヌクレオチド上の複数の変異位置に対して、特定の変異の組合せをコードしているオリゴヌクレオチドを包含または排除することにより、該組合せをそのライブラリー中で包含または排除できる。例えば、本明細書で考察するように、可変位置間に相関関係があり得る;即ち、位置Xがある特定の残基の場合には、位置Yはある特定の残基でなければならない(または、あってはならない)。可変位置のこれらのセットは、本明細書においては時々「クラスター」と呼称される。クラスターが互いに近接した残基を含み、従って1個のヌクレオチドプライマー上に存在できるときには、クラスターは「良好な」相関に設定し、ライブラリーの有効性を減少させ得る悪い組合せを除去できる。しかしながら、クラスターの残基が配列中で離れていて、従って合成のための別のオリゴヌクレオチド上に存在するであろう場合には、残基を「良好な」相関に設定するか、または可変残基として完全に排除するのが望ましいであろう。   In a preferred embodiment, each overlapping oligonucleotide contains only one position to be mutated; in another embodiment, the mutation positions are too close to each other to make this possible, and multiple oligonucleotides per oligonucleotide Mutations are used to complete all possible recombination. That is, each oligo can contain a single position to be mutated or one or more codons to be mutated. The multiple positions to be mutated must be close together in the sequence to prevent the oligo length from becoming impractical. By including or excluding an oligonucleotide encoding a particular combination of mutations for multiple mutation positions on an oligonucleotide, the combination can be included or excluded in the library. For example, as discussed herein, there may be a correlation between the variable positions; that is, if position X is a certain residue, position Y must be a certain residue (or Must not be). These sets of variable positions are sometimes referred to herein as “clusters”. When a cluster contains residues in close proximity to each other and can therefore be present on a single nucleotide primer, the cluster can be set to a “good” correlation to eliminate bad combinations that can reduce the effectiveness of the library. However, if the cluster residues are separated in the sequence and will therefore be present on another oligonucleotide for synthesis, the residues are set to “good” correlation or variable residues. It would be desirable to eliminate it entirely as a group.

別の実施態様では、クラスター変異がもっぱら一緒に現れるように、ライブラリーをいくつかの段階で創出する。この方法、即ち、変異クラスターを同定し、それを同じオリゴヌクレオチド上に置くか、またはライブラリーから除去するか、またはクラスターを保存しながらいくつかの段階でライブラリーを生成させることにより、実験的ライブラリーが、適正に折畳まれたタンパク質にかなり富むようにできる。クラスターの同定は、例えば、既知のパターン認識法の使用、変異発生頻度の比較、または実験的に生成させる配列のエネルギー解析(例えば、もし相互作用エネルギーが高ければ、位置は相関している)の使用などの多数の方法で実行することができる。これらの相関は、位置相関(例えば、位置1および2が常に一緒に変化するか、または決して一緒に変化しない)でも、配列相関(例えば、位置1に残基Aがあれば、常に位置2に残基Bがある)でもよい。   In another embodiment, the library is created in several stages so that cluster mutations appear exclusively. This method, i.e. identifying a mutant cluster and placing it on the same oligonucleotide or removing it from the library or generating the library in several steps while preserving the cluster The library can be made very rich in properly folded proteins. Cluster identification can be done, for example, using known pattern recognition methods, comparing mutation frequencies, or analyzing the energy of experimentally generated sequences (eg, if the interaction energy is high, the position is correlated) It can be implemented in a number of ways such as use. These correlations are both positional correlations (eg, positions 1 and 2 always change together or never change together), even if they are sequence correlations (eg, if there is a residue A at position 1, it will always be at position 2). Residue B).

Pattern discovery in Biomolecular Data: Tools, Techniques, and Applications; edited by Jason T.L. Wang, Bruce A. Shapiro, Dennis Shasha. New York: Oxford University, 1999; Andrews, Harry C. Introduction to mathematical techniques in pattern recognition; New York, Wiley-lnterscience [1972]; Applications of Pattern Recognition; Editor, K.S. Fu. Boca Raton, Fla. CRC Press, 1982; Genetic Algorithms for Pattern Recognition; edited by Sankar K. Pal, Paul P. Wang. Boca Raton: CRC Press, c1996; Pandya, Abhijit S., Pattern recognition with neural networks in C++ / Abhijit S. Pandya, Robert B. Macy. Boca Raton, Fla.: CRC Press, 1996; Handbook of pattern recognition & computer vision / edited by C.H. Chen, L.F. Pau, P.S.P. Wang. 2nd ed. Singapore; River Edge, N.J.: World Scientific, c1999; Friedman, Introduction to Pattern Recognition: Statistical, Structural, Neural, and Fuzy Logic Approaches; River Edge, N.J.: World Scientific, c1999, Series title: Series in machine perception and artificial intelligence; vol. 32、これらは全て出典明示により本明細書の一部とする、を参照のこと。加えて、共通モチーフの探索に使用するプログラムも同様に使用できる。   Pattern discovery in Biomolecular Data: Tools, Techniques, and Applications; edited by Jason TL Wang, Bruce A. Shapiro, Dennis Shasha.New York: Oxford University, 1999; Andrews, Harry C. Introduction to mathematical techniques in pattern recognition; New York , Wiley-lnterscience [1972]; Applications of Pattern Recognition; Editor, KS Fu. Boca Raton, Fla. CRC Press, 1982; Genetic Algorithms for Pattern Recognition; edited by Sankar K. Pal, Paul P. Wang. Boca Raton: CRC Press, c1996; Pandya, Abhijit S., Pattern recognition with neural networks in C ++ / Abhijit S. Pandya, Robert B. Macy. Boca Raton, Fla .: CRC Press, 1996; Handbook of pattern recognition & computer vision / edited by CH Chen, LF Pau, PSP Wang. 2nd ed. Singapore; River Edge, NJ: World Scientific, c1999; Friedman, Introduction to Pattern Recognition: Statistical, Structural, Neural, and Fuzy Logic Approaches; River Edge, NJ: World Scientific, c1999 , Series title: Series in machine perception and artificial intelligence; vol. 32, all of which are hereby incorporated by reference. In addition, the program used to search for common motifs can be used as well.

加えて、相関および混合は、オリゴヌクレオチドの設計を改変することにより、即ち、オリゴヌクレオチド(プライマー)をどこで開始および停止するか(例えばどこで配列を「切断」するか)を定めることにより、固定または最適化することができる。オリゴの開始および停止部位は、単一のオリゴヌクレオチド中に現れるクラスターの数を最大にするように設定でき、それにより、ライブラリーをより高いスコアの配列に富ませる。様々なオリゴヌクレオチドの開始および停止部位のオプションをコンピューター処理でモデル化し、単一のオリゴ上に表されるクラスターの数に従って、または予測された配列ライブラリーに合致する、生じた配列の割合に従ってランク付けまたはフィルターがけを行うことができる。   In addition, correlation and mixing can be fixed or modified by modifying the design of the oligonucleotide, that is, by defining where the oligonucleotide (primer) starts and stops (eg where to “cleave” the sequence). Can be optimized. Oligo start and stop sites can be set to maximize the number of clusters that appear in a single oligonucleotide, thereby enriching the library with higher-scoring sequences. Computerized modeling of various oligonucleotide start and stop site options, ranked according to the number of clusters represented on a single oligo or according to the percentage of sequences generated that match the predicted sequence library Can be attached or filtered.

必要となるオリゴヌクレオチドの総数は、複数の変異可能位置が単一のオリゴヌクレオチドによりコードされるとき、増加する。アニールリングした領域は一定のままのもの、即ち、参考配列の配列を有するものである。   The total number of oligonucleotides required increases when multiple mutable positions are encoded by a single oligonucleotide. The annealed region remains constant, i.e. has the sequence of the reference sequence.

長さが異なるタンパク質を発現するライブラリーを創出するために、コドンを挿入または欠失したオリゴヌクレオチドを使用できる。特に、挿入または欠失のためのコンピューター処理配列スクリーニングにより、長さが異なるタンパク質を定義する二次ライブラリーを得ることができ、それらのタンパク質は、プールした様々な長さのオリゴヌクレオチドのライブラリーにより発現させ得る。   Oligonucleotides with inserted or deleted codons can be used to create libraries that express proteins of different lengths. In particular, computerized sequence screening for insertions or deletions can yield secondary libraries that define proteins of different lengths, which are pooled libraries of oligonucleotides of various lengths Can be expressed.

好ましい実施態様では、二次ライブラリーは、ファミリー(例えば、変異体のセット)の混合により実施される;つまり、(ランク順リストを使用する場合、)誤りがちなPCRを用いるか、または用いずに、いくつかの上位配列のセットを混合できる。この文脈での「混合」は、一般にランダムに行われる、関連配列の組換えを意味する。それには、米国特許番号第5,830,721号;第5,811,238号;第5,605,793号;第5,837,458号およびPCT US/19256(すべて、これらの全部分を出典明示により本明細書の一部とする)に定義および例示されているような「混合」が包含される。この配列のセットは、人工のセットも可能である;例えば、確率表(例えばSCMFを使用して生成されるもの)やモンテカルロのセットに由来する。同様に、「ファミリー」は、上位の10配列と下位の10配列、上位100配列、などであり得る。また、このことは誤りがちなPCRによっても行い得る。   In a preferred embodiment, the secondary library is performed by mixing families (eg, a set of variants); that is, with or without error-prone PCR (when using a ranked list). In addition, several sets of superordinate sequences can be mixed. “Mixing” in this context means recombination of related sequences, which is generally performed randomly. US Pat. Nos. 5,830,721; 5,811,238; 5,605,793; 5,837,458 and PCT US / 19256 (all of which are incorporated by reference) “Mixed” as defined and exemplified in the specification of which is hereby incorporated by reference). This set of sequences can be an artificial set; for example, derived from a probability table (eg, generated using SCMF) or a Monte Carlo set. Similarly, a “family” can be the top 10 sequences and the bottom 10 sequences, the top 100 sequences, and the like. This can also be done by error-prone PCR.

従って、好ましい実施態様では、本明細書に記載のコンピューター処理方法を使用して、インシリコ(in silico)混合を行う。つまり、2つのライブラリーまたは2つの配列のどちらかで開始し、ランダムな配列の組換えを生成させ、評価することができる。   Accordingly, in a preferred embodiment, in silico mixing is performed using the computer processing methods described herein. That is, starting with either two libraries or two sequences, random sequence recombination can be generated and evaluated.

好ましい実施態様では、誤りがちなPCRを行って二次ライブラリーを生成させる。米国特許番号第5,605,793号、第5,811,238号、および第5,830,721号参照(これらの全部を出典明示により本明細書の一部とする)。これは、最適配列またはライブラリーの上位構成員、または他の人工セットもしくはファミリー上で行える。この実施態様では、一次ライブラリーのコンピューター処理スクリーニングで見出した最適配列に対する遺伝子を合成できる。次いで、誤りがちなPCRを、二次ライブラリーの変異位置で変異をコードしているオリゴヌクレオチド(偏りのある(bias)オリゴヌクレオチド)の存在下で、最適配列遺伝子上で実施する。オリゴヌクレオチドの添加により、二次ライブラリー中に変異の導入に有利となる偏りが創出される。あるいは、ライブラリーを偏らせるのに、ある一定の変異のためのオリゴヌクレオチド群のみを使用し得る。   In a preferred embodiment, error-prone PCR is performed to generate a secondary library. See US Pat. Nos. 5,605,793, 5,811,238, and 5,830,721, all of which are hereby incorporated by reference. This can be done on optimal sequences or members of the library, or on other artificial sets or families. In this embodiment, a gene for the optimal sequence found in the computerized screening of the primary library can be synthesized. Error-prone PCR is then performed on the optimal sequence gene in the presence of oligonucleotides (bias oligonucleotides) that encode mutations at the mutation positions in the secondary library. The addition of oligonucleotides creates a bias that favors the introduction of mutations in the secondary library. Alternatively, only a set of oligonucleotides for certain mutations can be used to bias the library.

好ましい実施態様では、偏りのあるオリゴヌクレオチドの存在下に、誤りがちなPCRによる遺伝子の混合を最適配列の遺伝子上で実施し、二次ライブラリー中に見出される各変異の割合を反映しているDNA配列ライブラリーを創出できる。偏りのあるオリゴヌクレオチドの選択は、各種の方法で行える;それらは、それらの頻度に基づいて選択できる、即ち、変異頻度の高い位置をコードしているオリゴヌクレオチドを使用でき;あるいは、多様性が増加するように、最も変異しやすい位置を含有するオリゴヌクレオチドを使用でき;もし二次ライブラリーがランク付けされるなら、上位スコアの位置のいくつかを、偏りのあるオリゴヌクレオチドの生成に使用でき;ランダムな位置を選択することもでき;上位スコアのものを少数と低スコアのものを少数選択し得る;等である。重要なことは、好ましい変異位置および配列に基づいて新規配列を生成させることである。   In a preferred embodiment, error-prone PCR gene mixing is performed on optimally sequenced genes in the presence of biased oligonucleotides, reflecting the percentage of each mutation found in the secondary library. A DNA sequence library can be created. The selection of biased oligonucleotides can be done in various ways; they can be selected based on their frequency, i.e., they can use oligonucleotides that encode positions with high mutation frequency; To increase, the oligonucleotide containing the most susceptible position can be used; if the secondary library is ranked, some of the top score positions can be used to generate a biased oligonucleotide. A random location can be selected; a small number of top scores and a small number of low scores can be selected; and so on. What is important is to generate a new sequence based on the preferred mutation position and sequence.

好ましい実施態様では、図1に概略を描写するように、野生型遺伝子または標的遺伝子を用いるPCRを使用できる。この実施態様では、開始遺伝子を使用する;要件ではないが、一般にその遺伝子は野生型遺伝子である。それは大域的最適配列またはリストにある任意の他の配列をコードする遺伝子である場合がある。この実施態様では、変異位置に対応し、二次ライブラリーの様々なアミノ酸を含有するオリゴヌクレオチドを使用する。当分野で周知のように、PCRは末端でPCRプライマーを用いて行う。これには2点の利点がある;第1にオリゴヌクレオチドが少なくて済み、誤りを少なくできる。加えて、野生型遺伝子を使用する場合、合成する必要がないという実験上の利点がある。   In a preferred embodiment, PCR with a wild type gene or target gene can be used, as outlined in FIG. In this embodiment, a starting gene is used; although it is not a requirement, generally the gene is a wild type gene. It can be a gene that encodes a global optimal sequence or any other sequence in the list. In this embodiment, oligonucleotides corresponding to the mutation positions and containing various amino acids of the secondary library are used. As is well known in the art, PCR is performed using PCR primers at the ends. This has two advantages; first, fewer oligonucleotides and fewer errors. In addition, when using a wild-type gene, there is an experimental advantage that there is no need to synthesize.

加えて、図2−5に例示するように、使用できる他のいくつかの技法がある。好ましい実施態様では、PCR産物のライゲーションを行う。   In addition, there are several other techniques that can be used, as illustrated in FIGS. 2-5. In a preferred embodiment, PCR product ligation is performed.

好ましい実施態様では、1つまたはそれ以上の候補変異二次ライブラリーに対して、様々な付加的な段階を行える;例えば、さらなるコンピューター処理を施すことができ、候補変異二次ライブラリーを再び組合せることができ、あるいは異なる候補変異二次ライブラリーからのカットオフを組合せることができる。好ましい実施態様では、候補変異二次ライブラリーをコンピューター処理により再操作してさらなる二次ライブラリー(本明細書で「三次ライブラリー」と呼ぶときがある)を形成し得る。例えば、任意の候補変異二次ライブラリー配列を、第1二次ライブラリー中の変化位置の一部または全てを凍結または固定することにより、PDA(登録商標)の第2ラウンド用に選択できる。あるいは、最後の確率分布表中にみられる変化のみを許容する。あるいは、確率表のストリンジェンシーを、含めるカットオフを増加させるかまたは減少させるかのいずれかにより変更し得る。同様にして、候補変異二次ライブラリーを第1ラウンド後に実験的に組換え得る;例えば、第1スクリーニング由来の最良遺伝子/遺伝子群を取り、遺伝子組み立てを再び行う(以下に概説する技術、複数PCR、誤りがちなPCR、混合、等を使用して)。あるいは、いくつかの位置における確率を変えるための、1つまたはそれ以上の良好遺伝子(群)由来の断片。これは、第1ラウンドのコンピューター処理的および実験的スクリーニングにおいて見出された配列空間の区域の探索を偏らせる。   In a preferred embodiment, various additional steps can be performed on one or more candidate mutation secondary libraries; for example, further computer processing can be performed and the candidate mutation secondary libraries are recombined. Cut-offs from different candidate mutation secondary libraries can be combined. In a preferred embodiment, the candidate mutant secondary library can be re-engineered by computer processing to form additional secondary libraries (sometimes referred to herein as “tertiary libraries”). For example, any candidate mutant secondary library sequence can be selected for the second round of PDA® by freezing or fixing some or all of the altered positions in the first secondary library. Alternatively, only the changes found in the last probability distribution table are allowed. Alternatively, the stringency of the probability table may be altered by either increasing or decreasing the included cutoff. Similarly, a candidate mutation secondary library can be experimentally recombined after the first round; for example, the best gene / gene group from the first screen is taken and gene assembly is performed again (techniques outlined below, multiple Using PCR, error-prone PCR, mixing, etc.). Alternatively, a fragment from one or more good gene (s) to change the probability at several positions. This biases the search for areas of sequence space found in the first round of computational and experimental screening.

好ましい実施態様では、候補変異二次ライブラリーを組合せることから三次ライブラリーを生成できる。例えば、本明細書で概説するようにコンピューター処理的または実験的に、候補変異二次ライブラリーから確率分布表を生成させて組換える。PDA(登録商標)技法の候補変異二次ライブラリーを配列アラインメントライブラリーと組合せてもよく、(再度、コンピューター処理的または実験的に)組換えるか、単に各々からのカットオフを合わせるかして、新しい三次ライブラリーを作成してもよい。数個のライブラリーからの上位配列を再び組合せることができる。一次および二次ライブラリーを、同様に組合せることができる。あるライブラリーの上位からの配列を、そのライブラリーの下位からの配列と組合せてより広い配列空間をサンプリングすることができ、あるいはライブラリーの上位から離れた配列のみを組合せることができる。タンパク質の様々な部分を分析した候補変異二次ライブラリーを組合せて、タンパク質の組合された部分を取扱う三次ライブラリーにすることができる。   In a preferred embodiment, a tertiary library can be generated from combining candidate mutant secondary libraries. For example, a probability distribution table is generated from a candidate mutation secondary library and recombined computationally or experimentally as outlined herein. PDA® technology candidate mutation secondary libraries may be combined with sequence alignment libraries, either recombined (again, computationally or experimentally) or simply combined with a cut-off from each A new tertiary library may be created. Upper sequences from several libraries can be recombined. Primary and secondary libraries can be combined in a similar manner. Sequences from the top of a library can be combined with sequences from the bottom of the library to sample a wider sequence space, or only sequences away from the top of the library can be combined. Candidate mutant secondary libraries that have analyzed various parts of the protein can be combined into a tertiary library that handles the combined parts of the protein.

好ましい実施態様では、候補変異二次ライブラリーにおける相関を使用して、三次ライブラリーを生成できる。つまり、第1可変位置の残基を第2可変位置の残基に相関させる(または同様にさらなる位置の残基に相関させる)ことができる。例えば、第1の残基がXなら第2の塩基はYでなければならないというように、2つの可変位置は立体配置的または静電気的に相互作用し得る。これは正または負の相関のどちらでもよい。   In a preferred embodiment, correlations in candidate mutant secondary libraries can be used to generate tertiary libraries. That is, residues at the first variable position can be correlated to residues at the second variable position (or similarly correlated to residues at further positions). For example, two variable positions can interact sterically or electrostatically, such that if the first residue is X, the second base must be Y. This can be either positive or negative correlation.

候補変異体ライブラリー構成員をコードする本発明の核酸を使用して、様々な発現ベクターを作成する。発現ベクターは、自己複製する染色体外ベクター、または宿主のゲノムに組込まれるベクターのどちらでもよい。一般に、これらの発現ベクターは、ライブラリータンパク質をコードする核酸に機能し得るように結合した、転写および翻訳調節核酸を含む。「制御配列」の用語は、特定の宿主生物中で機能し得るように結合したコード配列の発現に必要なDNA配列を表す。原核生物に適する調節配列には、例えば、プロモーター、場合によりオペレーター配列、そしてリボソーム結合部位が含まれる。真核生物の細胞は、プロモーター、ポリアデニル化シグナル、およびエンハンサーを利用することが知られている。   A variety of expression vectors are generated using the nucleic acids of the invention encoding candidate mutant library members. Expression vectors can be either self-replicating extrachromosomal vectors or vectors that integrate into the host genome. In general, these expression vectors contain transcriptional and translational regulatory nucleic acids operably linked to nucleic acids encoding library proteins. The term “control sequence” refers to a DNA sequence necessary for the expression of a coding sequence operably linked in a particular host organism. The control sequences that are suitable for prokaryotes, for example, include a promoter, optionally an operator sequence, and a ribosome binding site. Eukaryotic cells are known to utilize promoters, polyadenylation signals, and enhancers.

核酸が別の核酸配列と機能的関係にある状況に置かれたとき、核酸は「機能し得るように結合」されている。例えば、前駆配列または分泌リーダーに関するDNAは、ポリペプチドの分泌に関与する前駆タンパク質として発現される場合に、ポリペプチドのDNAに機能し得るように結合されている;プロモーターまたはエンハンサーは配列の転写に影響するならば、コード配列に機能し得るように結合されている;またはリボソーム結合部位は、翻訳を促進するような位置にあるならば、コード配列に機能し得るように結合されている。一般的に、「機能し得るように結合」するとは、結合されるDNA配列が隣接していることを、そして、分泌リーダーの場合、隣接し、かつリーディング・フェーズ(reading phase)にあることを意味する。しかし、エンハンサーは、隣接する必要はない。結合は、好都合な制限部位でのライゲーションにより達成される。そのような部位が存在しない場合、合成オリゴヌクレオチドアダプターまたはリンカーを、常法に従い使用する。転写および翻訳調節核酸は、一般に、当業者に認識されるように、ライブラリータンパク質の発現に使用される宿主細胞に適切である;例えば、Bacillus 由来の転写および翻訳調節核酸配列は、好ましくは Bacillus でのライブラリータンパク質の発現に使用される。多様な型の適当な発現ベクター、および適当な調節配列が、様々な宿主細胞に関して当技術分野で知られている。   A nucleic acid is “operably linked” when it is placed in a situation where it is in a functional relationship with another nucleic acid sequence. For example, DNA related to a precursor sequence or secretory leader is operably linked to the DNA of the polypeptide when expressed as a precursor protein involved in the secretion of the polypeptide; a promoter or enhancer is responsible for transcription of the sequence. If it affects, it is operably linked to the coding sequence; or the ribosome binding site is operably linked to the coding sequence if it is positioned to facilitate translation. In general, “operably linked” means that the DNA sequences to be bound are contiguous and, in the case of a secretory leader, contiguous and in the reading phase. means. However, enhancers do not have to be contiguous. Binding is achieved by ligation at convenient restriction sites. If such sites do not exist, synthetic oligonucleotide adapters or linkers are used according to conventional methods. Transcriptional and translational regulatory nucleic acids are generally appropriate for the host cell used for expression of the library protein, as will be appreciated by those skilled in the art; for example, transcriptional and translational regulatory nucleic acid sequences from Bacillus are preferably Bacillus. Used for the expression of library proteins. Various types of suitable expression vectors, and suitable regulatory sequences are known in the art for a variety of host cells.

一般に、転写および翻訳調節配列は、プロモーター配列、リボソーム結合部位、転写開始および停止配列、翻訳開始および停止配列、およびエンハンサーまたはアクチベーター配列を含み得るが、これらに限定はされない。好ましい実施態様では、調節配列は、プロモーターおよび転写開始および停止配列を含む。   In general, transcriptional and translational regulatory sequences can include, but are not limited to, promoter sequences, ribosome binding sites, transcriptional start and stop sequences, translational start and stop sequences, and enhancer or activator sequences. In a preferred embodiment, the regulatory sequences include a promoter and transcription start and stop sequences.

プロモーター配列は、構成的または誘導可能プロモーター配列を含む。プロモーターは、天然産生プロモーター、ハイブリッドまたは合成プロモーターであり得る。1つ以上のプロモーターのエレメントをあわせもつハイブリッドプロモーターも、当業界で知られており、本発明で有用である。   Promoter sequences include constitutive or inducible promoter sequences. The promoter can be a naturally produced promoter, a hybrid or a synthetic promoter. Hybrid promoters that combine one or more promoter elements are also known in the art and are useful in the present invention.

さらに、発現ベクターはさらなるエレメントを含み得る。例えば、発現ベクターは2つの複製系を有してもよく、2生物、例えば発現用の哺乳動物または昆虫細胞およびクローニングおよび増幅用の原核生物宿主において維持され得る。さらに、組込み発現ベクターの場合、発現ベクターは、宿主細胞ゲノムに相同的な少なくとも1つの配列、そして好ましくは発現コンストラクトの両端に接する2つの相同配列を含む。組込みベクターは、ベクターに含める適切な相同配列を選択することにより、宿主細胞中の特定座に導かれ得る。組込みベクター用コンストラクトおよび適切な選択およびスクリーニングプロトコールは当業界ではよく知られ、例えば、Mansouret all, Cell, 51:503 (1988) and Murray, Gene Transfer and Expression Protocols, Methods in Molecular Biology, Vol. 7 (Clifton: Humana Press, 1991)に記載されている。   In addition, the expression vector may contain additional elements. For example, an expression vector may have two replication systems and can be maintained in two organisms, such as mammalian or insect cells for expression and a prokaryotic host for cloning and amplification. Furthermore, in the case of an integrative expression vector, the expression vector comprises at least one sequence homologous to the host cell genome, and preferably two homologous sequences that abut both ends of the expression construct. The integrating vector can be directed to a specific locus in the host cell by selecting appropriate homologous sequences for inclusion in the vector. Integration vector constructs and appropriate selection and screening protocols are well known in the art, e.g., Mansouret all, Cell, 51: 503 (1988) and Murray, Gene Transfer and Expression Protocols, Methods in Molecular Biology, Vol. 7 ( Clifton: Humana Press, 1991).

さらに、好ましい実施態様では、発現ベクターは、発現ベクターを含有する形質転換した宿主細胞の選択を可能にする選択遺伝子を含有し、そして、特に哺乳動物細胞の場合、ベクターを含有しない細胞が一般的に死滅するため、ベクターの安定性が確保される。選択遺伝子は当業界ではよく知られており、使用する宿主細胞により異なる。本明細書における「選択遺伝子」は、選択剤に対する耐性を付与する遺伝子産物をコードする任意の遺伝子を意味する。適当な選択剤には、ネオマイシン(またはその類似体G418)、ブラスチシジンS、ヒスチニドールD、ベレオマイシン、ピューロマイシン、ヒグロマイシンBおよび他の薬物が含まれるが、それらに限定されるものではない。   Further, in a preferred embodiment, the expression vector contains a selection gene that allows for selection of transformed host cells containing the expression vector, and cells that do not contain the vector are generally common, especially for mammalian cells. The stability of the vector is ensured. Selection genes are well known in the art and will vary with the host cell used. As used herein, “selection gene” means any gene that encodes a gene product that confers resistance to a selection agent. Suitable selective agents include, but are not limited to, neomycin (or its analog G418), blasticidin S, histinidol D, bereomycin, puromycin, hygromycin B and other drugs.

好ましい実施態様では、発現ベクターは、遺伝子発現レベルを上昇させるために、発現される遺伝子の上流または下流にRNAスプライシング配列を含有する(Barret et al., Nucleic Acids Res. 1991; Groos et al., Mol. Cell. Biol. 1987; and Budiman et al., Mol. Cell. Biol. 1988 を参照されたい)。   In a preferred embodiment, the expression vector contains RNA splicing sequences upstream or downstream of the expressed gene to increase gene expression levels (Barret et al., Nucleic Acids Res. 1991; Groos et al., Mol. Cell. Biol. 1987; and Budiman et al., Mol. Cell. Biol. 1988).

好ましい発現ベクター系は、 Mann et al., Cell, 33:153-9 (1993); Pear et al., Proc. Natl. Acad. Sci. U.S.A., 90(18):8392-6 (1993); Kitamura et al., Proc. Natl. Acad. Sci. U.S.A., 92:9146-50 (1995);Kinsella et al., Human Gene Therapy, 7:1405-13; Hofmann et al.,Proc. Natl. Acad. Sci. U.S.A., 93:5185-90; Choate et al., Human Gene Therapy, 7:2247 (1996); PCT/US97/01019 および PCT/US97/01048、並びにこれらで引用された参照文献に一般的に記載されるようなレトロウイルスベクター系であって、すべて出典明示により本明細書の一部とする。   A preferred expression vector system is Mann et al., Cell, 33: 153-9 (1993); Pear et al., Proc. Natl. Acad. Sci. USA, 90 (18): 8392-6 (1993); Kitamura et al., Proc. Natl. Acad. Sci. USA, 92: 9146-50 (1995); Kinsella et al., Human Gene Therapy, 7: 1405-13; Hofmann et al., Proc. Natl. Acad. Sci. USA, 93: 5185-90; Choate et al., Human Gene Therapy, 7: 2247 (1996); generally described in PCT / US97 / 01019 and PCT / US97 / 01048, and references cited therein. Retroviral vector systems, all of which are incorporated herein by reference.

本発明の候補変異体ライブラリータンパク質は、核酸、好ましくはライブラリータンパク質をコードする核酸を含有する発現ベクターで形質転換した宿主細胞を、ライブラリータンパク質の発現を誘導するか、または引き起こすための適切な条件下で、培養して産生する。候補変異体ライブラリータンパク質の発現に適切な条件は、発現ベクターおよび宿主細胞の選択により変動し、日常的な実験を通じて当業者により容易に確認される。例えば、発現ベクターにおける構成的プロモーターを使用するには、宿主細胞の成長および増殖の最適化が必要とされ、一方誘導可能プロモーターを使用するには、誘導に適した成長条件が必要とされる。さらに、いくつかの実施態様では、回収のタイミングが重要である。例えば、昆虫細胞発現で使用されるバキュロウイルス系は溶菌ウイルスであり、そのため回収時期の選択が生成物の収率にとって重大である。   The candidate mutant library protein of the invention is suitable for inducing or causing expression of a library protein in a host cell transformed with an expression vector containing a nucleic acid, preferably a nucleic acid encoding the library protein. Produced under culture conditions. Appropriate conditions for expression of the candidate mutant library protein will vary with the choice of the expression vector and the host cell, and will be readily ascertained by one skilled in the art through routine experimentation. For example, using constitutive promoters in expression vectors requires optimization of host cell growth and proliferation, while using inducible promoters requires growth conditions suitable for induction. Furthermore, in some embodiments, the timing of recovery is important. For example, the baculovirus system used in insect cell expression is a lytic virus, so the choice of recovery time is critical to product yield.

当業者に明らかなように、本発明において使用する細胞型は広範囲に変動する。基本的には、酵母、細菌、古細菌、真菌および昆虫および哺乳動物細胞を含む動物細胞を含む、広く様々な適切な宿主細胞を使用できる。特に有利なのは、Drosophila melangaster 細胞、Saccharomyses cerevisiae および他の酵母、E. coli、Bacillus subtilis、SF9細胞、C129細胞、293細胞、ニューロスポラ(Neurospora)、BHK、CHO、COSおよびHeLa細胞、線維芽細胞、神経鞘腫細胞系、不死化哺乳動物骨髄様およびリンパ様細胞系、ジャーカット(Jurkat)細胞、マスト細胞および他の内分泌性細胞および外分泌性細胞、並びにニューロン細胞である。出典明示により本明細書の一部とするATCC細胞株カタログを参照されたい。さらに、当業界で周知のようなファージディスプレイ系における二次ライブラリーの発現は、特に二次ライブラリーがランダムペプチドを含む場合に、特に好ましい。ある実施態様では、細胞は遺伝子操作し得る、つまり、外因核酸を含有するように、例えば標的分子を含有するようにし得る。   As will be apparent to those skilled in the art, the cell types used in the present invention vary widely. In principle, a wide variety of suitable host cells can be used, including yeast, bacteria, archaea, fungi and animal cells including insect and mammalian cells. Particularly advantageous are Drosophila melangaster cells, Saccharomyses cerevisiae and other yeasts, E. coli, Bacillus subtilis, SF9 cells, C129 cells, 293 cells, Neurospora, BHK, CHO, COS and HeLa cells, fibroblasts, Schwannoma cell lines, immortalized mammalian myeloid and lymphoid cell lines, Jurkat cells, mast cells and other endocrine and exocrine cells, and neuronal cells. See the ATCC cell line catalog, which is incorporated herein by reference. Furthermore, expression of secondary libraries in phage display systems as is well known in the art is particularly preferred, especially when the secondary library contains random peptides. In certain embodiments, the cells can be genetically engineered, that is, contain an exogenous nucleic acid, eg, contain a target molecule.

好ましい実施態様では、候補変異体ライブラリータンパク質を、哺乳動物細胞中で発現させる。いずれの哺乳動物細胞を使用してもよく、マウス、ラット、霊長類、ヒトの細胞は特に好ましい。当業者に理解されるように、偽型による系の変更により、全ての真核細胞、好ましくは高等真核生物の使用を可能にする。以下により詳しく記載するように、スクリーニングは、ランダムライブラリー構成員の存在下で選択可能な表現型を示すように設定する。さらに以下に詳述するように、細胞内にライブラリー構成員が存在する結果として、改変された表現型を示す細胞の選択を可能とするように、適当なスクリーニングが設計され得る限り、幅広く様々な疾病症状に関連する細胞型は、特に有用である。   In a preferred embodiment, the candidate mutant library protein is expressed in mammalian cells. Any mammalian cell may be used, with mouse, rat, primate and human cells being particularly preferred. As will be appreciated by those skilled in the art, modification of the system by pseudotype allows the use of all eukaryotic cells, preferably higher eukaryotes. As described in more detail below, the screening is set up to show a selectable phenotype in the presence of random library members. As detailed further below, as long as an appropriate screen can be designed to allow selection of cells exhibiting an altered phenotype as a result of the presence of library members in the cell, a wide variety of Cell types associated with various disease symptoms are particularly useful.

従って、適当な哺乳動物細胞型は、限定されるものではないが、全ての種類の腫瘍細胞(特に、黒色腫様、骨髄性白血病、肺癌腫、胸癌腫、卵巣癌腫、大腸癌腫、腎臓癌腫、前立腺癌腫、膵臓癌腫および精巣癌腫)、心筋細胞、内皮細胞、上皮細胞、リンパ球(T細胞およびB細胞)、マスト細胞、好酸球、血脈管内膜細胞、肝細胞、単核白血球を含む白血球、造血、神経、皮膚、肺、腎臓、肝臓および筋幹細胞などの幹細胞(分化および脱分化因子のスクリーニングで使用する)、破骨細胞、軟骨細胞および他の結合組織細胞、ケラチノサイト、メラノサイト、肝臓細胞、腎臓細胞および含脂肪細胞を包含する。また、適当な細胞は、ジャーカットT細胞、NIH3T3細胞、CHO、Cosなどを含むが、これらに限定されるものではない、既知の研究用細胞を含む。出典明示により本明細書の一部とするATCC細胞株カタログを参照のこと。   Thus, suitable mammalian cell types include, but are not limited to, all types of tumor cells (especially melanoma-like, myeloid leukemia, lung carcinoma, breast carcinoma, ovarian carcinoma, colon carcinoma, kidney carcinoma, Prostate cancer, pancreatic carcinoma and testicular carcinoma), cardiomyocytes, endothelial cells, epithelial cells, lymphocytes (T cells and B cells), mast cells, eosinophils, intima cells, hepatocytes, mononuclear leukocytes Stem cells (used in screening for differentiation and dedifferentiation factors), osteoclasts, chondrocytes and other connective tissue cells, keratinocytes, melanocytes, liver, such as leukocytes, hematopoiesis, nerves, skin, lungs, kidneys, liver and muscle stem cells Includes cells, kidney cells and adipocytes. Suitable cells also include known research cells, including but not limited to Jurkat T cells, NIH3T3 cells, CHO, Cos and the like. See the ATCC cell line catalog, which is incorporated herein by reference.

哺乳動物発現系もまた当分野では既知であり、レトロウイルス系を含む。哺乳動物プロモーターは、哺乳動物RNAポリメラーゼに結合し、ライブラリータンパク質をコードする配列のmRNAへの下流(3')転写を開始させる能力のある任意のDNA配列である。プロモーターは、通常コード配列の5'末端近傍に位置する転写開始領域、および転写開始部位上流に位置する25−30塩基対を使用するTATAボックスを有する。TATAボックスは、RNAポリメラーゼIIに指令し、正確な部位でのRNA合成を開始させると考えられている。哺乳動物プロモーターはまた、典型的にはTATAボックスの上流100ないし200塩基対内に位置する、上流プロモーターエレメント(エンハンサーエレメント)を含有する。上流プロモーターエレメントは、転写開始速度を決定し、いずれかの向きで作用できる。ウイルス遺伝子は高度に発現されることが多く広い宿主範囲を有するため、哺乳動物プロモーターとして特に有用なのは哺乳動物ウイルス遺伝子由来プロモーターである。例としては、SV40初期プロモーター、マウス乳癌ウイルスLTRプロモーター、アデノウイルス主要後期プロモーター、単純ヘルペスウイルスプロモーター、およびCMVプロモーターが含まれる。   Mammalian expression systems are also known in the art and include retroviral systems. A mammalian promoter is any DNA sequence capable of binding mammalian RNA polymerase and initiating downstream (3 ′) transcription of a sequence encoding a library protein into mRNA. A promoter has a transcription initiation region, usually located near the 5 'end of the coding sequence, and a TATA box using 25-30 base pairs located upstream of the transcription initiation site. The TATA box is thought to direct RNA polymerase II to initiate RNA synthesis at the correct site. Mammalian promoters also contain an upstream promoter element (enhancer element), typically located within 100 to 200 base pairs upstream of the TATA box. The upstream promoter element determines the rate of transcription initiation and can act in either orientation. Since viral genes are often highly expressed and have a wide host range, mammalian virus gene-derived promoters are particularly useful as mammalian promoters. Examples include the SV40 early promoter, mouse mammary tumor virus LTR promoter, adenovirus major late promoter, herpes simplex virus promoter, and CMV promoter.

典型的には、哺乳動物細胞により認識される転写終結およびポリアデニル化配列は、翻訳停止コドンの3'に位置する調節領域であり、そのためプロモーターエレメントと共に、コード配列に隣接する。成熟mRNAの3'末端は、部位特異的転写後切断およびポリアデニル化により形成される。転写ターミネーターおよびポリアデニル化シグナルの例としては、SV40由来のものがある。   Typically, transcription termination and polyadenylation sequences recognized by mammalian cells are regulatory regions located 3 'to the translation stop codon, and thus are flanked by coding sequences along with promoter elements. The 3 ′ end of the mature mRNA is formed by site-specific post-transcriptional cleavage and polyadenylation. Examples of transcription terminators and polyadenylation signals include those derived from SV40.

外因核酸を哺乳動物宿主ならびに他の宿主に導入する方法は、当業界ではよく知られており、使用される宿主細胞により変化する。技法には、デキストラン介在トランスフェクション、リン酸カルシウム沈殿、ポリブレン介在トランスフェクション、プロトプラスト融合、エレクトロポレーション、ウイルス感染、リポソームにおけるポリヌクレオチド(複数も可)封入、および核へのDNAの直接マイクロインジェクションがある。   Methods for introducing exogenous nucleic acid into mammalian hosts as well as other hosts are well known in the art and will vary with the host cell used. Techniques include dextran mediated transfection, calcium phosphate precipitation, polybrene mediated transfection, protoplast fusion, electroporation, viral infection, encapsulation of polynucleotide (s) in liposomes, and direct microinjection of DNA into the nucleus.

好ましい実施態様では、候補変異体ライブラリータンパク質は、細菌系で発現する。細菌発現系は、当業者には周知である。   In a preferred embodiment, the candidate mutant library protein is expressed in a bacterial system. Bacterial expression systems are well known to those skilled in the art.

適当な細菌プロモーターとは、細菌RNAポリメラーゼに結合し、ライブラリータンパク質をコードする配列のmRNAへの下流(3')転写を開始させる能力のある任意の核酸配列である。細菌プロモーターは、通常コード配列の5'末端近傍に位置する転写開始領域を有する。この転写開始領域は典型的にはRNAポリメラーゼ結合部位および転写開始部位を含む。代謝経路酵素をコードする配列は、特に有用なプロモーター配列を提供する。例としては、ガラクトース、ラクトースおよびマルトースなどの糖代謝性酵素由来のプロモーター配列、およびトリプトファンなどの生合成酵素由来の配列がある。バクテリオファージからのプロモーターもまた使用され得、当業者には公知である。さらに、合成プロモーターおよびハイブリッドプロモーターもまた有用である;例えば、tac プロモーターは、trp および lac プロモーター配列のハイブリッドである。さらに、細菌プロモーターは、細菌RNAポリメラーゼと結合し、転写を開始させる能力を有する非細菌起源の天然産生プロモーターを包含できる。   A suitable bacterial promoter is any nucleic acid sequence capable of binding bacterial RNA polymerase and initiating downstream (3 ′) transcription of a sequence encoding a library protein into mRNA. Bacterial promoters usually have a transcription initiation region located near the 5 ′ end of the coding sequence. This transcription initiation region typically includes an RNA polymerase binding site and a transcription initiation site. Sequences encoding metabolic pathway enzymes provide particularly useful promoter sequences. Examples include promoter sequences from sugar metabolizing enzymes such as galactose, lactose and maltose, and sequences from biosynthetic enzymes such as tryptophan. Promoters from bacteriophages can also be used and are known to those skilled in the art. In addition, synthetic and hybrid promoters are also useful; for example, the tac promoter is a hybrid of the trp and lac promoter sequences. In addition, bacterial promoters can include naturally produced promoters of non-bacterial origin that have the ability to bind bacterial RNA polymerase and initiate transcription.

機能性プロモーター配列に加えて、有効なリボソーム結合部位が望ましい。大腸菌の場合、リボソーム結合部位は、シャイン−ダルガルノ(SD)配列と呼ばれ、開始コドンおよび開始コドン上流3−11ヌクレオチドに位置する3−9ヌクレオチド長の配列を含む。   In addition to a functional promoter sequence, an effective ribosome binding site is desirable. In the case of E. coli, the ribosome binding site is called the Shine-Dalgarno (SD) sequence and includes a 3-9 nucleotide long sequence located 3-11 nucleotides upstream of the start codon and start codon.

発現ベクターはまた、細菌中でライブラリータンパク質の分泌をもたらすシグナルペプチド配列も含み得る。シグナル配列は、典型的に、当業者に周知のように、細胞からのタンパク質分泌を指令する、疎水性アミノ酸を含むシグナルペプチドをコードする。タンパク質は、成長培地(グラム陽性菌)または細胞の内膜と外膜との間にある周辺腔(グラム陰性菌)のいずれかに分泌される。   The expression vector can also include a signal peptide sequence that provides for secretion of the library protein in bacteria. The signal sequence typically encodes a signal peptide containing hydrophobic amino acids that directs protein secretion from the cell, as is well known to those skilled in the art. Proteins are secreted into either the growth medium (gram-positive bacteria) or the peripheral space (gram-negative bacteria) between the inner and outer membranes of the cell.

細菌発現ベクターはまた、形質転換された細菌株の選択を可能にする選択可能マーカー遺伝子も含み得る。適当な選択遺伝子には、アンピシリン、クロラムフェニコール、エリスロマイシン、カナマイシン、ネオマイシンおよびテトラサイクリンなどの薬物に対する耐性を細菌に付与する遺伝子が含まれる。選択可能マーカーはまた、ヒスチジン、トリプトファンおよびロイシン生合成経路にあるもののような生合成遺伝子を含む。   Bacterial expression vectors can also include a selectable marker gene that allows selection of transformed bacterial strains. Suitable selection genes include genes that confer resistance to drugs such as ampicillin, chloramphenicol, erythromycin, kanamycin, neomycin and tetracycline. Selectable markers also include biosynthetic genes such as those in the histidine, tryptophan and leucine biosynthetic pathways.

これらの成分は発現ベクターに組立てる。細菌用の発現ベクターは当分野ではよく知られており、Bacillus subtilis、E. coli、Streptococcus cremoris およびStreptococcus lividans などのためのベクターが含まれる。   These components are assembled into an expression vector. Expression vectors for bacteria are well known in the art and include vectors for Bacillus subtilis, E. coli, Streptococcus cremoris and Streptococcus lividans, and the like.

細菌発現ベクターは、当業界で周知の技術、例えば塩化カルシウム処理、エレクトロポレーションなどを使用して細菌宿主細胞に形質転換される。   Bacterial expression vectors are transformed into bacterial host cells using techniques well known in the art such as calcium chloride treatment, electroporation and the like.

ある実施態様では、候補変異体ライブラリータンパク質は昆虫細胞で産生される。昆虫細胞形質転換用の発現ベクターおよび特にバキュロウイルスベースの発現ベクターは、当業界でも周知であり、例えば O'Reilly et al., Baculovirus Expression Vectors: A Laboratory Manual(New York: Oxford University Press, 1994 に記載されている。   In certain embodiments, the candidate mutant library protein is produced in insect cells. Expression vectors for insect cell transformation and in particular baculovirus-based expression vectors are well known in the art and are described in, for example, O'Reilly et al., Baculovirus Expression Vectors: A Laboratory Manual (New York: Oxford University Press, 1994). Are listed.

好ましい態様において、候補変異体ライブラリータンパク質は酵母細胞で産生される。酵母発現系は当業界では周知であり、Saccharomyces cerevisiae、Candida albicans および C. maltosa、Hansenula polymorpha、Kluyveromyces fragilis および K. lactis、Pichia guillerimondii および P. pastoris、Schizosaccharomyces pombe および Yarrowia lipolytica 用の発現ベクターが含まれる。酵母における発現に好ましいプロモーター配列には、誘導可能GAL1、10プロモーター、アルコールデヒドロゲナーゼ、エノラーゼ、グルコキナーゼ、グルコース−6−リン酸イソメラーゼ、グリセルアルデヒド−3−リン酸デヒドロゲナーゼ、ヘキソキナーゼ、ホスホフルクトキナーゼ、3−ホスホグリセリン酸ムターゼ、ピルビン酸キナーゼおよび酸性ホスファターゼ遺伝子由来のプロモーターが含まれる。酵母の選択可能マーカーには、ADE2、HIS4、LEU2、TRP1およびツニカマイシンに対する耐性を与えるALG7、G418に対する耐性を付与するネオマイシンホスホトランスフェラーゼ遺伝子、および銅イオンの存在下で酵母を成長させるCUP1遺伝子が含まれる。   In a preferred embodiment, the candidate mutant library protein is produced in yeast cells. Yeast expression systems are well known in the art and include the expression vectors for Saccharomyces cerevisiae, Candida albicans and C. maltosa, Hansenula polymorpha, Kluyveromyces fragilis and K. lactis, Pichia guillerimondii and P. pastoris, Schizosaccharomyces pombe and Yarrowia lipoa . Preferred promoter sequences for expression in yeast include inducible GAL1, 10 promoter, alcohol dehydrogenase, enolase, glucokinase, glucose-6-phosphate isomerase, glyceraldehyde-3-phosphate dehydrogenase, hexokinase, phosphofructokinase, Included are promoters from 3-phosphoglycerate mutase, pyruvate kinase and acid phosphatase genes. Yeast selectable markers include ALG7 conferring resistance to ADE2, HIS4, LEU2, TRP1, and tunicamycin, the neomycin phosphotransferase gene conferring resistance to G418, and the CUP1 gene that grows yeast in the presence of copper ions. .

本発明の候補変異体ライブラリータンパク質は、当分野で周知の技法を使用して、融合タンパク質としても作成し得る。従って、例えば、モノクローナル抗体の創出のために、所望のエピトープが小さいならば、ライブラリータンパク質を担体タンパク質と融合させて免疫原を形成し得る。あるいは、ライブラリータンパク質は、発現を増加させるため、または他の理由のために融合タンパク質として作成し得る。例えば、ライブラリータンパク質がライブラリーペプチドである場合には、ペプチドをコードする核酸は発現目的のために他の核酸と結合させてもよい。同様に、細胞の細胞内または細胞外区画へのライブラリー構成員の局在化を可能にする標的配列、ライブラリータンパク質またはそれらをコードする核酸のいずれかの精製または単離を可能にするレスキュー配列または精製タグ;ライブラリータンパク質またはライブラリータンパク質をコードする核酸に安定性または分解からの保護(例えばタンパク質加水分解への耐性)を与える安定配列、またはこれらの組合せ、並びに必要であればリンカー配列などの他の融合パートナーも使用できる。   Candidate variant library proteins of the invention can also be made as fusion proteins using techniques well known in the art. Thus, for example, for the creation of monoclonal antibodies, if the desired epitope is small, the library protein can be fused to a carrier protein to form an immunogen. Alternatively, library proteins can be made as fusion proteins to increase expression or for other reasons. For example, if the library protein is a library peptide, the nucleic acid encoding the peptide may be combined with other nucleic acids for expression purposes. Similarly, a rescue that allows the purification or isolation of any of the target sequences, library proteins, or nucleic acids that encode them, that allow the localization of library members to the intracellular or extracellular compartments of the cell. Sequences or purification tags; stable sequences that confer stability or degradation protection (eg, resistance to proteolysis) to library proteins or nucleic acids encoding library proteins, or combinations thereof, and linker sequences if necessary Other fusion partners such as can also be used.

このように、適当な標的配列には、限定されるものではないが、発現産物の生物学的活性を保持しながら、発現産物を予じめ決定した分子または分子クラスと結合させる能力のある結合配列(例えば、酵素阻害剤または基質配列を使用して関連する酵素クラスを標的化する);それ自体またはともに結合しているタンパク質の選択的分解のシグナルを与える配列;および、候補発現産物を、a)ゴルジ体、小胞体、核、仁、核膜、ミトコンドリア、葉緑体、分泌小胞、リソソーム、および細胞膜などの細胞内位置、および、b)分泌シグナルを介する細胞外の位置を含む、予め決定された細胞の位置へ構成的に局在化させる能力のあるシグナル配列が挙げられる。細胞内への局在化または分泌を介する細胞外への局在化のいずれかが特に好ましい。   Thus, suitable target sequences include, but are not limited to, binding capable of binding the expression product to a predetermined molecule or class of molecules while retaining the biological activity of the expression product. A sequence (eg, targeting an associated enzyme class using an enzyme inhibitor or substrate sequence); a sequence that provides a signal for selective degradation of the protein bound to itself or together; and a candidate expression product, a) intracellular locations such as the Golgi apparatus, endoplasmic reticulum, nucleus, kidney, nuclear membrane, mitochondria, chloroplast, secretory vesicle, lysosome, and cell membrane, and b) the extracellular location via a secretion signal, A signal sequence capable of constitutive localization to a predetermined cell location. Either intracellular localization or extracellular localization via secretion is particularly preferred.

好ましい実施態様では、候補変異体ライブラリー構成員はレスキュー配列を含む。レスキュー配列は、候補物質またはそれをコードする核酸のいずれかを精製または単離するために使用し得る配列である。従って、例えば、ペプチドレスキュー配列には、例えば、Ni親和性カラムと共に使用するためのHisタグ、および検出、免疫沈降またはFACS(蛍光活性化細胞分別)のためのエピトープタグなどの精製配列が含まれる。適当なエピトープタグには、myc(市販の9E10抗体と共に使用する)、細菌酵素BirAのBSPビオチン化標的配列、flagタグ、lacZおよびGSTが含まれる。 In a preferred embodiment, the candidate mutant library member comprises a rescue sequence. The rescue sequence is a sequence that can be used to purify or isolate either the candidate substance or the nucleic acid that encodes it. Thus, for example, peptide rescue sequences include, for example, purified sequences such as His 6 tags for use with Ni affinity columns and epitope tags for detection, immunoprecipitation or FACS (fluorescence activated cell sorting). It is. Suitable epitope tags include myc (used with the commercially available 9E10 antibody), BSP biotinylated target sequence of the bacterial enzyme BirA, flag tag, lacZ and GST.

あるいは、レスキュー配列は、PCR、関連技法またはハイブリダイゼーションを介してレトロウイルスコンストラクトの迅速かつ容易な単離を可能にするプローブ標的部位として作用する独特のオリゴヌクレオチド配列であってもよい。   Alternatively, the rescue sequence may be a unique oligonucleotide sequence that acts as a probe target site that allows for rapid and easy isolation of retroviral constructs via PCR, related techniques or hybridization.

好ましい実施態様では、融合パートナーは、ライブラリー構成員またはそれをコードする核酸に安定性を付与する安定配列である。従って、例えば、Varahavsky のN−末端則に従い、ユビキチン化されるペプチドを保護するために、開始メチオニンの後にグリシンを組み込むこと(MGまたはMGG0)によりペプチドを安定化し、このようにして細胞質中での長い半減期を付与し得る。同様に、C末端の2個のプロリンは、カルボキシペプチダーゼの作用に対して十分に耐性のあるペプチドをもたらす。プロリンの前に2個のグリシンが存在することは、可変性と防護構造の両方を付与し、ジ−プロリン中の事象を候補ペプチド構造中に伝播させる。従って、好ましい安定配列は次の通りである:MG(X)GGPP、但し、Xは任意のアミノ酸であり、nは小さくとも4の整数である。 In a preferred embodiment, the fusion partner is a stable sequence that confers stability to the library member or the nucleic acid encoding it. Thus, for example, according to Varahavsky's N-terminal rule, to protect a peptide that is ubiquitinated, the peptide is stabilized by incorporating glycine after the initiation methionine (MG or MGG0), thus in the cytoplasm. Can provide a long half-life. Similarly, the C-terminal two prolines result in peptides that are well resistant to the action of carboxypeptidases. The presence of two glycines before proline confers both variability and protective structure and propagates events in di-proline into the candidate peptide structure. Thus, the preferred stable sequence is: MG (X) n GGPP, where X is any amino acid and n is an integer of at least 4.

ある実施態様では、本発明の候補変異体ライブラリー核酸、タンパク質および抗体を標識化する。本明細書において「標識化」とは、本発明の核酸、タンパク質および抗体が、本発明の核酸、タンパク質および抗体の検出を可能にするために取付けられた少なくとも1つの成分、同位元素または化学的化合物を有することを意味する。一般に、標識は3分類、即ちa)放射性または重同位元素であり得る同位元素標識;b)抗体または抗原であり得る免疫標識;およびc)着色または蛍光染料、に分類される。標識は任意の位置で化合物に組込まれ得る。   In certain embodiments, candidate variant library nucleic acids, proteins and antibodies of the invention are labeled. As used herein, “labeling” refers to at least one component, isotope or chemical attached to the nucleic acids, proteins and antibodies of the present invention to enable detection of the nucleic acids, proteins and antibodies of the present invention. Means having a compound. In general, labels are classified into three categories: a) isotope labels that can be radioactive or heavy isotopes; b) immunolabels that can be antibodies or antigens; and c) colored or fluorescent dyes. The label can be incorporated into the compound at any position.

好ましい実施態様では、候補変異体ライブラリータンパク質を、発現後に精製または単離する。ライブラリータンパク質は、サンプル中にどのような他の成分が存在するかによって、当業者には公知の様々な方法で単離または精製し得る。標準的な精製方法には、電気泳動、分子、免疫学的方法並びにイオン交換、疎水性、アフィニティー並びに逆相HPLCクロマトグラフィーを含むクロマログラフィー技法およびクロマトフォーカシング(chromatofocusing)が含まれる。例えば、ライブラリータンパク質は、標準的な抗ライブラリー抗体カラムを使用して精製し得る。タンパク質濃度との関連で限外濾過およびダイアフィルトレーション技法も有用である。適当な精製技法の一般的ガイダンスについては、Scopes,R., Protein Purification, Springer-Verlag, NY(1982)を参照のこと。必要な精製度は、ライブラリータンパク質の用途により異なる。精製が必要ではない場合もある。   In a preferred embodiment, the candidate mutant library protein is purified or isolated after expression. Library proteins can be isolated or purified in a variety of ways known to those skilled in the art depending on what other components are present in the sample. Standard purification methods include electrophoresis, molecules, immunological methods and chromatographic techniques and chromatofocusing including ion exchange, hydrophobicity, affinity and reverse phase HPLC chromatography. For example, library proteins can be purified using standard anti-library antibody columns. Ultrafiltration and diafiltration techniques are also useful in the context of protein concentration. For general guidance on appropriate purification techniques, see Scopes, R., Protein Purification, Springer-Verlag, NY (1982). The required degree of purification depends on the use of the library protein. Purification may not be necessary.

好ましい実施態様では、候補変異体ライブラリータンパク質を、発現後に精製または単離する。変異タンパク質は、サンプル中にどのような他の成分が存在するかによって、当業者には公知の様々な方法で単離または精製し得る。標準的な精製方法には、電気泳動、分子、免疫学的方法並びにイオン交換、疎水性、アフィニティー並びに逆相HPLCクロマトグラフィーを含むクロマログラフィー技法およびクロマトフォーカシングが含まれる。例えば、変異タンパク質は、標準的な抗ライブラリー抗体カラムを使用して精製し得る。タンパク質濃度との関連で限外濾過およびダイアフィルトレーション技法も有用である。適当な精製技法の一般的ガイダンスについては、Scopes,R., Protein Purification, Springer-Verlag, NY(1982)を参照のこと。必要な精製度は、変異タンパク質の用途により異なる。精製が必要ではない場合もある。   In a preferred embodiment, the candidate mutant library protein is purified or isolated after expression. The mutant protein can be isolated or purified in a variety of ways known to those skilled in the art depending on what other components are present in the sample. Standard purification methods include electrophoresis, molecules, immunological methods and chromatographic techniques and chromatofocusing including ion exchange, hydrophobicity, affinity and reverse phase HPLC chromatography. For example, the mutein can be purified using a standard anti-library antibody column. Ultrafiltration and diafiltration techniques are also useful in the context of protein concentration. For general guidance on appropriate purification techniques, see Scopes, R., Protein Purification, Springer-Verlag, NY (1982). The required degree of purification varies depending on the use of the mutant protein. Purification may not be necessary.

一旦発現させ、必要であれば精製した候補変異体ライブラリータンパク質および核酸は、免疫原性の改変について試験できる。適切な方法には、MHCペプチド複合体のTCRへの結合の測定、MHC/ペプチド相互作用の測定(Sidney, J., et al., In Current Protocols in Immunology (1998) 18.3.1-18.3.19)、ヒトMHC分子を発現するトランスジェニックマウスにおける、可能性のあるT細胞エピトープの試験、内在性細胞の代りにヒト抗原提示細胞およびT細胞で再構成されたマウスにおける、可能性のあるT細胞エピトープの試験(WO 98/52976; WO 00/34317)、T細胞増殖およびCTLアッセイ(Hemmer, B., (1998) J. Immunol., 160:3631-3636)、安定化アッセイ、精製MHC分子またはMHCを有するMHCへの競合阻害アッセイ(Brusic, V., et al., (1998) Nucleic Acids Res., 26:368-371)、および「i-mune アッセイ」(Genecor; The Scientist, 15:14, (2001))が含まれる(全参照文献を出典明示により本明細書の一部とする)。   Once expressed, and if necessary, purified candidate mutant library proteins and nucleic acids can be tested for immunogenic alteration. Suitable methods include measurement of MHC peptide complex binding to TCR, measurement of MHC / peptide interaction (Sidney, J., et al., In Current Protocols in Immunology (1998) 18.3.1-18.3.19 ), Testing for potential T cell epitopes in transgenic mice expressing human MHC molecules, potential T cells in mice reconstituted with human antigen presenting cells and T cells instead of endogenous cells Epitope testing (WO 98/52976; WO 00/34317), T cell proliferation and CTL assay (Hemmer, B., (1998) J. Immunol., 160: 3631-3636), stabilization assay, purified MHC molecule or Competitive inhibition assay for MHC with MHC (Brusic, V., et al., (1998) Nucleic Acids Res., 26: 368-371) and “i-mune assay” (Genecor; The Scientist, 15:14 , (2001)), including all references And is incorporated herein by reference).

一旦作成したら、本発明の候補変異タンパク質および核酸は、数々の応用に有用である。好ましい実施態様では、標的タンパク質よりも低免疫原性の候補変異タンパク質を、治療用タンパク質として使用する。例えば、臨床および前臨床治療研究により、外因性タンパク質は、放射性核種を捕獲するための人工受容体として、毒物として、またはプロドラッグ活性化のための触媒として、インビボで効果的であり得ることが示された(Meyer, DL., et al. (2001) Protein Science, 10:491-503)。免疫原性が減少した治療用タンパク質の他の用途には、急性心筋梗塞の血栓溶解治療が含まれる(Laroche, Y., et al., (2000) Blood, 96:1425-1432)。   Once made, the candidate mutant proteins and nucleic acids of the invention are useful for a number of applications. In a preferred embodiment, candidate mutant proteins that are less immunogenic than the target protein are used as therapeutic proteins. For example, clinical and preclinical treatment studies have shown that exogenous proteins can be effective in vivo as artificial receptors for capturing radionuclides, as toxicants, or as catalysts for prodrug activation. (Meyer, DL., Et al. (2001) Protein Science, 10: 491-503). Other uses of therapeutic proteins with reduced immunogenicity include thrombolytic treatment of acute myocardial infarction (Laroche, Y., et al., (2000) Blood, 96: 1425-1432).

好ましい実施態様では、標的タンパク質よりも高免疫原性である候補変異タンパク質を、ワクチン並びに自己免疫疾患および癌に対する免疫治療剤の開発において使用する。例えば、MHCクラスIまたはクラスII分子に対する親和性が増加した線状アミノ酸配列エピトープの挿入により、免疫反応の誘導においてより効果的であるワクチンを作成できる(例えば、Sarobe, P., et al. (1998) J. Clin. Invest., 102:1239-1248; Thimme, R., et al. (2001) J. Virology, 75:3984-3987; Roberts, C., et al., (1996) Aids Research and Human Retroviruses, 12:593-610 (例えば、Sarobe, P., et al. (1998) J. Clin. Invest., 102:1239-1248; Thimme, R., et al. (2001) J. Virology, 75:3984-3987; Roberts, C., et al., (1996) Aids Research and Human Retroviruses, 12:593-610; Kobayashi, H., et al., (2000) Cancer Res., 60:5228-5236; Keogh, E., et al., (2001) J. Immunology, 167:787-796; Want, R-F., (2001) Trends in Immunology, 22:269-276;(全参照文献を本明細書の一部とする)を参照のこと)。   In a preferred embodiment, candidate mutant proteins that are more immunogenic than the target protein are used in the development of vaccines and immunotherapeutic agents against autoimmune diseases and cancer. For example, insertion of linear amino acid sequence epitopes with increased affinity for MHC class I or class II molecules can create vaccines that are more effective in inducing immune responses (eg, Sarobe, P., et al. ( 1998) J. Clin. Invest., 102: 1239-1248; Thimme, R., et al. (2001) J. Virology, 75: 3984-3987; Roberts, C., et al., (1996) Aids Research and Human Retroviruses, 12: 593-610 (eg Sarobe, P., et al. (1998) J. Clin. Invest., 102: 1239-1248; Thimme, R., et al. (2001) J. Virology , 75: 3984-3987; Roberts, C., et al., (1996) Aids Research and Human Retroviruses, 12: 593-610; Kobayashi, H., et al., (2000) Cancer Res., 60: 5228 Keogh, E., et al., (2001) J. Immunology, 167: 787-796; Want, RF., (2001) Trends in Immunology, 22: 269-276; As a part of the book)).

好ましい実施態様では、少なくとも1つのT細胞エピトープの挿入により、免疫反応の誘導においてより効果的であるワクチンを作成する (de Lalla, C., et al., (1999) J. Immunology, 163:1725-1729; Kim and DeMars, (2001) Curr. Op Immunology, 13:429-436; Berzofsky, J.A., et al., European Patent Publication No. 0 273 716B1; 全参照文献を全体的に本明細書の一部とする)。   In a preferred embodiment, the insertion of at least one T cell epitope creates a vaccine that is more effective in inducing an immune response (de Lalla, C., et al., (1999) J. Immunology, 163: 1725 Kim and DeMars, (2001) Curr. Op Immunology, 13: 429-436; Berzofsky, JA, et al., European Patent Publication No. 0 273 716B1; all references are incorporated herein in their entirety. Part).

他の実施態様では、ナイーブB細胞上の膜結合抗体と相互作用する少なくとも1つの構造的3次元エピトープをコードする配列の挿入により、免疫反応の誘導においてより効果的であるワクチンを作成する(Criag, L., et al., (1998) J. Mol. Biol., 281:183-201; Buttinelli, G., et al., (2001) Virology, 281:265-271; Saphire, E.O., et al., (2001) Science, 293:1155; Mascola and Nabel, (2001) Curr. Op. Immunology, 13:489-495; 全参考文献を全体的に本明細書の一部とする、を参照されたい)。   In another embodiment, the insertion of a sequence encoding at least one structural three-dimensional epitope that interacts with a membrane-bound antibody on naive B cells creates a vaccine that is more effective in inducing an immune response (Criag , L., et al., (1998) J. Mol. Biol., 281: 183-201; Buttinelli, G., et al., (2001) Virology, 281: 265-271; Saphire, EO, et al ., (2001) Science, 293: 1155; Mascola and Nabel, (2001) Curr. Op. Immunology, 13: 489-495; all references are incorporated herein in their entirety. ).

なお他の実施態様では、B細胞エピトープ、MHCクラスI結合モチーフ、MHCクラスII結合モチーフおよびT細胞エピトープの任意の組合せの挿入により、免疫反応の誘導においてより効果的であるワクチンを作成する(例えば、WO 01/41788 および米国特許第6,037,135号を参照されたい)。   In still other embodiments, insertion of any combination of B cell epitopes, MHC class I binding motifs, MHC class II binding motifs and T cell epitopes creates vaccines that are more effective in inducing immune responses (eg, WO 01/41788 and US Pat. No. 6,037,135).

アレルゲン、細菌性病原体、ウイルス性病原体および腫瘍に対して効果的なワクチンを設計し得る。例えば、WO/41788; 米国特許第6,322,789号; 米国特許第6,329,505号; WO 01/41799; WO 01/42267; WO 01/42270; および WO 01/45728 を参照されたい。   An effective vaccine against allergens, bacterial pathogens, viral pathogens and tumors can be designed. See, for example, WO / 41788; US Pat. No. 6,322,789; US Pat. No. 6,329,505; WO 01/41799; WO 01/42267; WO 01/42270; and WO 01/45728.

例えば、化学的アレルゲン、食物アレルゲン、花粉アレルゲン、菌性アレルゲン、ペットの鱗屑、ダニなどを含むがそれらに限定されるわけではない、1つまたはそれ以上のアレルゲンに対してワクチンを設計し得る (Huby, R.D. et al., (2000) Toxicological Science, 55:235-246(出典明示により全体的に本明細書の一部とする)を参照されたい)。   For example, a vaccine may be designed against one or more allergens, including but not limited to chemical allergens, food allergens, pollen allergens, fungal allergens, pet scales, mites, etc. (See Huby, RD et al., (2000) Toxicological Science, 55: 235-246, which is hereby incorporated by reference in its entirety).

好ましくは、肝炎A、肝炎B、肝炎C、ポリオウイルス、HIV、単純ヘルペスIおよびII、天然痘、ヒト乳頭腫ウイルス、サイトメガロウイルス、ハンタウイルス、狂犬病、エボラウイルス、黄熱病ウイルス、ロタウイルス、風疹、はしかウイルス、おたふく風邪ウイルス、水痘(即ち、水疱瘡)、インフルエンザ、脳炎、ラッサ熱ウイルスなどを含むがそれらに限定されるわけではないウイルス性病原体に対して、ワクチンを作成する。   Preferably, hepatitis A, hepatitis B, hepatitis C, poliovirus, HIV, herpes simplex I and II, smallpox, human papilloma virus, cytomegalovirus, hantavirus, rabies, Ebola virus, yellow fever virus, rotavirus, Vaccines are made against viral pathogens including, but not limited to, rubella, measles virus, mumps virus, chickenpox (ie chicken pox), influenza, encephalitis, Lassa fever virus, and the like.

好ましくは、ライム病、ジフテリア、炭疽、ボツリヌス中毒、百日咳、百日咳、破傷風、コレラ、腸チフス、チフス、ペスト、ハンセン氏病、結核(多薬剤耐性形態を含む)、ブドウ球菌感染、連鎖球菌感染、リステリア、髄膜炎菌性髄膜炎、肺炎球菌感染、レジオネラ病、潰瘍、結膜炎などの原因物質を含むがそれらに限定されるわけではない細菌性病原体に対して、ワクチンを作成する。 Preferably, Lyme disease, diphtheria, anthrax, botulism, pertussis, pertussis * , tetanus, cholera, typhoid fever, typhoid, plague, leprosy, tuberculosis (including multi-drug resistant forms), staphylococcal infection, streptococcal infection, Vaccines are made against bacterial pathogens including, but not limited to, causative agents such as Listeria, meningococcal meningitis, pneumococcal infection, Legionella disease, ulcers, and conjunctivitis.

デング熱、マラリア、アフリカ睡眠病、赤痢、ロッキー山紅斑熱、住血吸虫症、下痢、西ナイル熱、レーシュマニア症、ジアルジア症などの原因物質を含むがそれらに限定されるわけではない他の感染物質に対しても、ワクチンを作成し得る。   Other infections, including but not limited to dengue fever, malaria, African sleeping sickness, dysentery, rocky mountain spotted fever, schistosomiasis, diarrhea, West Nile fever, leishmaniasis, giardiasis Vaccines can also be made for substances.

他の実施態様では、候補変異体タンパク質は、皮膚、乳房、脳、子宮頚癌腫、精巣癌腫などの固形腫瘍を含む様々な癌に対して、より免疫原性である。特に、本発明の組成物および方法により処置され得る癌には、心臓:肉腫(血管肉腫、線維肉腫、横紋筋肉腫、脂肪肉腫)、粘液腫、横紋筋腫、線維腫、脂肪腫および奇形腫;肺:気管支原性癌腫(扁平上皮細胞、未分化小細胞、未分化大細胞、腺癌)、肺胞(細気管支)癌腫、気管支腺腫、肉腫、リンパ腫、軟骨性過誤腫、中皮腫;消化器:食道(扁平上皮細胞癌腫、腺癌、平滑筋肉腫、リンパ腫)、胃(癌腫、リンパ腫、平滑筋肉腫)、膵臓(管性腺癌、インスリン産生腫瘍、グルカゴン産生腫瘍、ガストリン産生腫瘍、カルチノイド腫瘍、ビポーマ(vipoma))、小腸(腺癌、リンパ腫、カルチノイド腫瘍、カポジ肉腫、平滑筋腫、血管腫、脂肪腫、神経線維腫、線維腫)、大腸(腺癌、管状腺腫、絨毛腺腫、過誤腫、平滑筋腫);尿生殖路:腎臓(腺癌、ウィルムス腫瘍[腎芽腫]、リンパ腫、白血病)、膀胱および尿道(扁平上皮細胞癌腫、移行細胞癌腫、腺癌)、前立腺(腺癌、肉腫)、精巣(精上皮腫、奇形腫、胚性癌腫、奇形癌腫、絨毛癌腫、肉腫、間質細胞癌腫、線維腫、線維腺腫、腺腫様腫瘍、脂肪腫);肝臓:肝細胞腫(肝細胞性癌腫)、胆管癌腫、肝芽腫、血管肉腫、肝細胞性腺腫、血管腫;骨:骨原性肉腫(骨肉腫)、線維肉腫、悪性線維性組織球腫、軟骨肉腫、ユーイング肉腫、悪性リンパ腫(細網細胞肉腫)、多発性骨髄腫、悪性巨細胞腫瘍脊索腫、骨軟骨腫(osteochronfroma)(骨軟骨性外骨腫)、良性脊索腫、脊索芽腫、脊索粘液線維腫、類骨骨腫および巨細胞腫瘍;神経系:頭蓋(骨腫、血管腫、肉芽腫、黄色腫、変形性骨炎)、髄膜(髄膜腫、髄膜肉腫、神経膠腫症)、脳(星細胞腫、髄芽腫、神経膠腫、上衣細胞腫、胚細胞腫[松果体腫]、多形神経膠芽腫、乏突起細胞腫、シュワン細胞腫、網膜芽細胞腫、先天性腫瘍)、脊髄神経線維腫、髄膜腫、神経膠腫、肉腫);婦人科学:子宮(子宮内膜癌腫)、頚部、(子宮頚癌腫、前腫瘍子宮頚異形成)、卵巣(卵巣癌腫[漿液性嚢胞腺癌、粘液製嚢胞腺癌、分類不能癌腫]、顆粒膜−包膜細胞腫瘍、セルトリ−ライディッヒ細胞腫瘍、未分化胚細胞腫、悪性奇形腫)、外陰部(扁平上皮細胞癌腫、上皮内癌腫、腺癌、線維肉腫、黒色腫)、膣(明細胞癌腫、扁平上皮細胞癌腫、ブドウ状肉腫[胚性横紋筋肉腫]、ファロピウス管(癌腫);血液学:血液(骨髄白血病[急性および慢性]、急性リンパ芽球性白血病、慢性リンパ性白血病、骨髄増殖性疾患、多発性骨髄腫、骨髄異形性症候群)、ホジキン病、非ホジキン性リンパ腫[悪性リンパ腫];皮膚:悪性黒色腫、基底細胞癌腫、扁平上皮細胞癌腫、カポジ肉腫、ほくろ形成異常母斑、脂肪腫、血管腫、皮膚線維腫、ケロイド、乾癬;および副腎:神経芽細胞腫が含まれるがこれらに限定されるわけではない。   In other embodiments, the candidate variant protein is more immunogenic against a variety of cancers including solid tumors such as skin, breast, brain, cervical carcinoma, testicular carcinoma. In particular, cancers that can be treated by the compositions and methods of the present invention include: heart: sarcoma (angiosarcoma, fibrosarcoma, rhabdomyosarcoma, liposarcoma), myxoma, rhabdomyosarcoma, fibroma, lipoma and malformation. Lung: Bronchiogenic carcinoma (squamous cell, undifferentiated small cell, undifferentiated large cell, adenocarcinoma), alveolar (bronchiole) carcinoma, bronchial adenoma, sarcoma, lymphoma, cartilaginous hamartoma, mesothelioma Digestive organs: esophagus (squamous cell carcinoma, adenocarcinoma, leiomyosarcoma, lymphoma), stomach (carcinoma, lymphoma, leiomyosarcoma), pancreas (tubular adenocarcinoma, insulin-producing tumor, glucagon-producing tumor, gastrin-producing tumor, Carcinoid tumor, vipoma, small intestine (adenocarcinoma, lymphoma, carcinoid tumor, Kaposi's sarcoma, leiomyoma, hemangioma, lipoma, neurofibroma, fibroma), large intestine (adenocarcinoma, tubular adenoma, villous adenoma, Hamartoma, leiomyoma); urinary reproduction Pathology: Kidney (adenocarcinoma, Wilms tumor [nephroblastoma], lymphoma, leukemia), bladder and urethra (squamous cell carcinoma, transitional cell carcinoma, adenocarcinomas), prostate (adenocarcinoma, sarcoma), testis (seminal epithelioma) Teratoma, embryonal carcinoma, teratocarcinoma, choriocarcinoma, sarcoma, stromal cell carcinoma, fibroma, fibroadenoma, adenomatous tumor, lipoma); liver: hepatocellular carcinoma (hepatocellular carcinoma), cholangiocarcinoma, Hepatoblastoma, hemangiosarcoma, hepatocellular adenoma, hemangioma; bone: osteogenic sarcoma (osteosarcoma), fibrosarcoma, malignant fibrous histiocytoma, chondrosarcoma, Ewing sarcoma, malignant lymphoma (reticular cell sarcoma) , Multiple myeloma, malignant giant cell tumor chordoma, osteochronfroma (osteochondroma), benign chordoma, chordoblastoma, chordal mucinous fibroma, osteoid osteoma and giant cell tumor; nerve System: skull (osteomas, hemangiomas, granulomas, xanthomas, osteoarthritis), meninges (meningiomas, meninges) , Glioma), brain (astrocytoma, medulloblastoma, glioma, ependymoma, germinomas [pineomas], glioblastoma multiforme, oligodendroma, Schwann cell , Retinoblastoma, congenital tumor), spinal neurofibroma, meningioma, glioma, sarcoma); gynecology: uterus (endometrial carcinoma), cervix, (cervical carcinoma, pre-tumor cervix) Dysplasia), ovary (ovarian carcinoma [serous cystadenocarcinoma, mucinous cystadenocarcinoma, unclassifiable carcinoma], granulosa-capsular cell tumor, Sertoli-Leydig cell tumor, undifferentiated germ cell tumor, malignant teratoma) , Vulva (squamous cell carcinoma, carcinoma in situ, adenocarcinoma, fibrosarcoma, melanoma), vagina (clear cell carcinoma, squamous cell carcinoma, grape sarcoma [embryonic rhabdomyosarcoma), fallopian tube (carcinoma) ); Hematology: blood (myeloid leukemia [acute and chronic], acute lymphoblastic leukemia, chronic lymphocytic leukemia, Myeloproliferative disease, multiple myeloma, myelodysplastic syndrome), Hodgkin's disease, non-Hodgkin's lymphoma [malignant lymphoma]; skin: malignant melanoma, basal cell carcinoma, squamous cell carcinoma, Kaposi's sarcoma, mole-dysplastic mother Includes, but is not limited to, plaques, lipomas, hemangiomas, dermal fibromas, keloids, psoriasis; and adrenal gland: neuroblastoma.

好ましい実施態様では、ワクチンは、p53を有する腫瘍、黒色腫抗原遺伝子(MAGE; WO 01/42267を参照);癌胚抗原(CEA;WO 01/42270を参照)、前立腺特異的抗原(PSA)、前立腺特異的膜抗原(PSM)、前立腺酸性フォスファターゼ(PAP)およびヒトカリクレイン2(hK2またはHuK2)などの前立腺癌抗原(WO 01/45728 および米国特許第6,329,505号を参照)、および乳癌抗原(即ち、her2/neu; AU 2087401を参照)を対象とする。   In a preferred embodiment, the vaccine comprises a tumor with p53, a melanoma antigen gene (MAGE; see WO 01/42267); a cancer embryo antigen (CEA; see WO 01/42270), a prostate specific antigen (PSA), Prostate cancer antigens (see WO 01/45728 and US Pat. No. 6,329,505), such as prostate specific membrane antigen (PSM), prostate acid phosphatase (PAP) and human kallikrein 2 (hK2 or HuK2), and breast cancer antigens (ie her2 / neu; see AU 2087401).

好ましい実施態様では、候補変異タンパク質の治療的有効量を、処置を必要としている患者に投与する。本明細書における「治療的有効量」は、投与の目的である効果を生じる用量を意味する。正確な用量は処置目的により異なり、公知技法を使用して当業者は確認し得る。好ましい実施態様では、約5μg/kgの用量を使用し、静脈内、腹膜内または皮下に投与する。当分野で既知の通り、候補変異タンパク質分解、全身対局所送達、および新規プロテアーゼ合成速度、並びに年齢、体重、全般的な健康状態、性別、食事、投与時間、薬剤相互作用および病状の重篤度による調節が必要であり、当業者は常用の実験法で確認し得る。   In a preferred embodiment, a therapeutically effective amount of the candidate mutein is administered to a patient in need of treatment. As used herein, “therapeutically effective amount” means a dose that produces the effect for which it is administered. The exact dose will depend on the purpose of the treatment, and will be ascertainable by one skilled in the art using known techniques. In a preferred embodiment, a dose of about 5 μg / kg is used and is administered intravenously, intraperitoneally or subcutaneously. Candidate mutant proteolysis, systemic versus local delivery, and novel protease synthesis rates, as well as known in the art, and age, weight, general health, sex, diet, time of administration, drug interactions and severity of disease state Adjustment is necessary and can be confirmed by one skilled in the art by routine experimentation.

本発明のための「患者」は、ヒトおよび他の動物の両方、特に哺乳動物、および生物を包含する。従って、本発明の方法は、ヒトの治療および獣医学的応用の両方に適用可能である。好ましい実施態様では、患者は哺乳動物であり、最も好ましい実施態様では、患者はヒトである。   “Patient” for the purposes of the present invention includes both humans and other animals, particularly mammals, and organisms. Thus, the method of the present invention is applicable to both human therapy and veterinary applications. In a preferred embodiment, the patient is a mammal, and in the most preferred embodiment, the patient is a human.

本発明における用語「処置」は、治療処置並びに疾患または異常の予防または抑制手段を含む意味である。従って、例えば、疾患の発病に先立って候補変異タンパク質を成功裡に投与することは、疾患の「処置」に至る。他の例として、疾患の症状と闘うために、疾患の臨床的顕示の後に変異タンパク質を成功裡に投与することは、疾患の「処置」を含む。また、「処置」は、疾患を撲滅するために疾患の出現の後に変異タンパク質を投与することも包含する。あり得る臨床症状の減少とおそらく疾患の改善を伴って、発病後および臨床症状の進行の後に物質を成功裡に投与することは、疾患の「処置」を含む。   The term “treatment” in the present invention is meant to include therapeutic treatment as well as means for preventing or suppressing a disease or disorder. Thus, for example, successful administration of a candidate mutant protein prior to the onset of the disease leads to “treatment” of the disease. As another example, successful administration of a mutein after clinical manifestation of a disease to combat disease symptoms includes “treatment” of the disease. “Treatment” also includes administering the mutant protein after the appearance of the disease to eradicate the disease. Successful administration of a substance after onset and after progression of clinical symptoms, with a possible reduction in clinical symptoms and possibly amelioration of the disease, includes “treatment” of the disease.

「処置を必要としている」者には、既に疾患または異常を有する哺乳動物、並びに疾患または異常を有する傾向のある者が含まれ、その者において疾患または異常が防止されるべき者が含まれる。   Persons “in need of treatment” include mammals already having a disease or abnormality, as well as those prone to having the disease or abnormality, in whom the disease or abnormality should be prevented.

好ましくは滅菌水性溶液形態における、本発明の候補変異タンパク質の投与は、経口、皮下、静脈内、鼻腔内、経皮、腹腔内、筋肉内、肺内、膣内、直腸内または眼内投与を含むがこれらに限定されない、様々な方法で行える。場合によっては、例えば、損傷や炎症などの処置において、候補変異タンパク質を溶液またはスプレーとして直接適用し得る。導入方法に応じて、医薬組成物を様々な方法で製剤化し得る。製剤中の治療的に活性な候補変異タンパク質の濃度は、約0.1ないし100重量%で変化し得る。別の好ましい実施態様では、候補変異タンパク質の濃度は0.003ないし1.0モル濃度の範囲内であり、体重キログラム当り0.03、0.05、0.1、0.2、および0.3ミリモルの用量が好ましい。   Administration of the candidate mutant proteins of the invention, preferably in sterile aqueous solution form, includes oral, subcutaneous, intravenous, intranasal, transdermal, intraperitoneal, intramuscular, intrapulmonary, intravaginal, rectal or intraocular administration. Various methods can be used, including but not limited to these. In some cases, the candidate mutein may be applied directly as a solution or spray, for example in the treatment of injury or inflammation. Depending on the method of introduction, the pharmaceutical composition can be formulated in various ways. The concentration of the therapeutically active candidate mutein in the formulation can vary from about 0.1 to 100% by weight. In another preferred embodiment, the concentration of the candidate mutein is in the range of 0.003 to 1.0 molar and is 0.03, 0.05, 0.1, 0.2, and 0.0 per kilogram body weight. A dose of 3 mmol is preferred.

本発明の医薬組成物は、患者への投与に適する形態の候補変異タンパク質を含む。好ましい実施態様では、医薬組成物は、酸および塩基の両付加塩類を包含することを意図している、医薬的に許容し得る塩として存在するような、水溶性形態である。「医薬的に許容し得る酸付加塩」は、遊離塩基の生物学的有効性を保持し、かつ生物学上またはその他の点で不都合でないものであり、塩酸、臭化水素酸、硫酸、硝酸、リン酸などの無機酸、および、酢酸、プロピオン酸、グリコール酸、ピルビン酸、蓚酸、マレイン酸、マロン酸、コハク酸、フマル酸、酒石酸、クエン酸、安息香酸、桂皮酸、マンデル酸、メタンスルホン酸、エタンスルホン酸、p−トルエンスルホン酸、サリチル酸などの有機酸と形成する。「医薬的に許容し得る塩基付加塩」は、無機塩基、例えば、ナトリウム、カリウム、リチウム、アンモニウム、カルシウム、マグネシウム、鉄、亜鉛、銅、マンガン、アルミニウム塩類などから誘導されたものを含む。特に好ましいのは、アンモニウム、カリウム、ナトリウム、カルシウムおよびマグネシウム塩などである。医薬的に許容し得る有機非毒性塩基から誘導される塩には、第1級、第2級および第3級アミン類、置換アミン類、例えば、天然産生の置換アミン類、環状アミン類および塩基性イオン交換樹脂、例えば、イロプロピルアミン、トリメチルアミン、ジエチルアミン、トリエチルアミン、トリプロピルアミンおよびエタノールアミンの塩が含まれる。   The pharmaceutical composition of the invention comprises a candidate mutein in a form suitable for administration to a patient. In a preferred embodiment, the pharmaceutical composition is in a water-soluble form, such as present as a pharmaceutically acceptable salt, which is intended to include both acid and base addition salts. “Pharmaceutically acceptable acid addition salts” retain the biological effectiveness of the free base and are not biologically or otherwise inconvenient and include hydrochloric acid, hydrobromic acid, sulfuric acid, nitric acid. , Inorganic acids such as phosphoric acid, and acetic acid, propionic acid, glycolic acid, pyruvic acid, succinic acid, maleic acid, malonic acid, succinic acid, fumaric acid, tartaric acid, citric acid, benzoic acid, cinnamic acid, mandelic acid, methane It forms with organic acids, such as sulfonic acid, ethanesulfonic acid, p-toluenesulfonic acid, salicylic acid. "Pharmaceutically acceptable base addition salts" include those derived from inorganic bases such as sodium, potassium, lithium, ammonium, calcium, magnesium, iron, zinc, copper, manganese, aluminum salts and the like. Particularly preferred are ammonium, potassium, sodium, calcium and magnesium salts. Salts derived from pharmaceutically acceptable organic non-toxic bases include primary, secondary and tertiary amines, substituted amines such as naturally occurring substituted amines, cyclic amines and bases. Ionic ion exchange resins such as salts of isopropylamine, trimethylamine, diethylamine, triethylamine, tripropylamine and ethanolamine are included.

医薬組成物はまた、次の物質;即ち、血清アルブミンなどの担体タンパク質;NaOAcなどの緩衝液;微晶性セルロース、ラクトース、トウモロコシおよび他の澱粉類などの充填剤;結合剤;甘味料および他の着香剤;着色剤;およびポリエチレングリコールのうちの1種またはそれ以上を含み得る。添加物は当業界で周知であり、様々な製剤で使用される。例えば、出典明示により本明細書の一部とする Goodman and Gilman を参照されたい。   The pharmaceutical composition also includes the following materials: carrier proteins such as serum albumin; buffers such as NaOAc; fillers such as microcrystalline cellulose, lactose, corn and other starches; binders; sweeteners and others Flavoring agents; coloring agents; and one or more of polyethylene glycols. Additives are well known in the art and are used in various formulations. See, for example, Goodman and Gilman, which is incorporated herein by reference.

さらなる実施態様では、ミセル製剤に候補変異タンパク質を添加する;出典明示により全体を本明細書の一部とする米国特許番号第5,833,948号参照。   In a further embodiment, the candidate mutant protein is added to the micelle formulation; see US Pat. No. 5,833,948, hereby incorporated by reference in its entirety.

医薬組成物の組合せを投与し得る。例えば、亜鉛−アルファ2−糖タンパク質、ヒト血清アルブミン、免疫グロブリンG(IgG)および他の非免疫原性タンパク質などの可溶性タンパク質の変異体からなる群から選択される、増強された免疫原性を示す変異体タンパク質の混合物を含む医薬組成物を、患者に投与し得る。さらに、組成物を他の治療剤と組合せて投与してもよい。   Combinations of pharmaceutical compositions can be administered. For example, enhanced immunogenicity selected from the group consisting of variants of soluble proteins such as zinc-alpha 2-glycoprotein, human serum albumin, immunoglobulin G (IgG) and other non-immunogenic proteins. A pharmaceutical composition comprising a mixture of the variant proteins shown can be administered to a patient. In addition, the composition may be administered in combination with other therapeutic agents.

本発明で提供されるある実施態様では、当分野で既知の方法を使用して、モノクローナルおよびポリクローナル抗体を含むがこれらに限定されない、変異タンパク質に対する抗体を生成させる(出典明示により本明細書の一部とする、Soren, M., et al., EP 0 752 886 を参照されたい)。好ましい実施態様では、これらの抗変異体抗体を、免疫治療に使用する。従って、免疫治療の方法が提供される。「免疫治療」は、自己タンパク質の産生を伴う自己免疫疾患の処置を意味する。特に、自己ワクチンを作成するために、自己タンパク質をT細胞エピトープに結合する(例えば、WO 95/05849 および WO 00/20027 を参照されたい;両方を出典明示により本明細書の一部とする。)本発明での用途の自己タンパク質には、癌の処置用のTNFαおよびγ-インターフェロン、アレルギーの処置用のIgE、慢性炎症性疾患の処置用のTNFα、TNFβおよびインターロイキン1が含まれる。   In certain embodiments provided by the present invention, methods known in the art are used to generate antibodies to muteins, including but not limited to monoclonal and polyclonal antibodies. Part, see Soren, M., et al., EP 0 752 886). In preferred embodiments, these anti-variant antibodies are used for immunotherapy. Accordingly, a method of immunotherapy is provided. “Immunotherapy” refers to the treatment of autoimmune diseases that involve the production of self-proteins. In particular, to make a self-vaccine, the self-protein is linked to a T cell epitope (see, eg, WO 95/05849 and WO 00/20027; both are hereby incorporated by reference. ) Self-proteins for use in the present invention include TNFα and γ-interferon for the treatment of cancer, IgE for the treatment of allergies, TNFα, TNFβ and interleukin 1 for the treatment of chronic inflammatory diseases.

本発明で使用されるように、免疫治療は、受動的または能動的であり得る。本明細書で定義するように、受動的免疫治療は、抗体を受容者(患者)に受動的に輸送することである。能動的免疫化は、抗体および/またはT細胞反応を受容者(患者)の中で誘導することである。免疫反応の誘導は、T細胞エピトープおよび自己タンパク質を含む変異タンパク質抗原(これに対して抗体を生成させる)を受容者に与える結果であり得る。当業者に理解されるように、変異タンパク質抗原は、抗体を生成させることが望まれる変異ポリペプチドを受容者に注射するか、または変異TNFαタンパク質抗原を発現するための条件下で、変異タンパク質抗原を発現する能力のある、変異タンパク質をコードする核酸を、受容者に接触させるかして与えられる。   As used in the present invention, immunotherapy can be passive or active. As defined herein, passive immunotherapy is the passive delivery of antibodies to a recipient (patient). Active immunization is the induction of antibody and / or T cell responses in a recipient (patient). Induction of the immune response may be the result of giving the recipient a mutated protein antigen that includes a T cell epitope and a self protein, against which an antibody is generated. As will be appreciated by those skilled in the art, a mutant protein antigen is a mutant protein antigen that is injected into a recipient with a mutant polypeptide that is desired to produce antibodies, or under conditions to express a mutant TNFα protein antigen. A nucleic acid encoding a mutein capable of expressing is provided by contacting the recipient.

好ましい実施態様では、候補変異タンパク質を治療剤として投与し、上記概説のように製剤できる。同様に、候補変異遺伝子(全長配列、部分配列の両方、または変異体コード領域の調節配列を含む)を、当分野で既知のように遺伝子治療応用において投与できる。当業者に理解されるように、これらの変異体遺伝子は、遺伝子治療(即ち、ゲノムへの組込み用)としてか、またはアンチセンス組成物としての、アンチセンス応用を含む。   In a preferred embodiment, the candidate mutein is administered as a therapeutic agent and can be formulated as outlined above. Similarly, candidate mutant genes (including both full-length sequences, partial sequences, or mutant coding region regulatory sequences) can be administered in gene therapy applications as is known in the art. As will be appreciated by those skilled in the art, these mutant genes include antisense applications, either as gene therapy (ie, for integration into the genome) or as an antisense composition.

好ましい実施態様では、候補変異タンパク質をコードしている核酸も、遺伝子治療で使用し得る。遺伝治療への応用では、例えば欠陥遺伝子置換のために、治療的に有効な遺伝子産物のインビボ合成を達成させるために、遺伝子を細胞内に導入する。「遺伝子治療」には、単回の処置により持続的効果を達成させる従来の遺伝子治療と、治療的に有効なDNAまたはmRNAの単回または反復した投与を含む、遺伝子治療剤の投与との両方が含まれる。アンチセンスRNAおよびDNAを、インビボである種の遺伝子の発現を阻止する治療剤として使用できる。細胞膜による取り込みが制限されることにより細胞内濃度が低いにもかかわらず、短いアンチセンスオリゴヌクレオチドが細胞内に導入され、そこで阻害物質として作用することが既に示されている(Zamecnik et al., Proc. Natl. Acad. Sci. USA 83, 4143-4146 [1986])。例えば、取込みを増強するために、負荷電のホスホジエステル基を非荷電基で置換することにより、オリゴヌクレオチドを変更できる。   In a preferred embodiment, nucleic acids encoding candidate mutant proteins can also be used in gene therapy. In gene therapy applications, genes are introduced into cells to achieve in vivo synthesis of therapeutically effective gene products, eg, for defective gene replacement. “Gene therapy” includes both conventional gene therapy that achieves a sustained effect with a single treatment and administration of a gene therapy agent, including single or repeated administration of therapeutically effective DNA or mRNA. Is included. Antisense RNA and DNA can be used as therapeutic agents to block the expression of certain genes in vivo. Despite low intracellular concentrations due to limited uptake by the cell membrane, it has already been shown that short antisense oligonucleotides are introduced into cells where they act as inhibitors (Zamecnik et al., Proc. Natl. Acad. Sci. USA 83, 4143-4146 [1986]). For example, oligonucleotides can be altered by replacing negatively charged phosphodiester groups with uncharged groups to enhance uptake.

生存細胞内に核酸を導入するには様々なの技法が利用できる。技法は、核酸がインビトロで培養細胞内に移入されるのか、またはインビボで意図する宿主の細胞内に移入されるのかによって変わる。インビトロで哺乳動物細胞内に核酸を移入するのに適する技法には、リポソーム、エレクトロポレーション、マイクロインジェクション、細胞融合、DEAE−デキストラン、リン酸カルシウム沈殿法、等の使用が含まれる。現今好適とされているインビボ遺伝子移入技法には、ウイルス(典型的にはレトロウイルス)ベクターを用いるトランスフェクション、およびウイルス被覆タンパク質−リポソーム媒介トランスフェクションが含まれる(Dzau et al., Trends in Biotechnology 11, 205-210 [1993])。ある状況では、細胞表面膜タンパク質または標的細胞に特異的な抗体や標的細胞上のレセプターに対するリガンドなどの標的細胞を標的とする物質を有する核酸ソースを供給するのが望ましい。リポソームを採用した場合は、エンドサイトーシスに伴って細胞表面膜タンパク質に結合するタンパク質を標的化および/または取込み促進のために使用し得る。例えば特定の細胞型に親和性のカプシドタンパク質またはその断片、サイクリング中に内在化を経るタンパク質に対する抗体、細胞内局在を標的化し、細胞内半減期を強化するタンパク質である。レセプター媒介エンドサイトーシスの技法は、例えば、Wu et al., J. Biol. Chem. 262,4429-2232 (1987): および Wagnernet al., Proc. Natl. Acad. Sci. USA 87, 3410-3414(1990) に記載されている。遺伝子マーキングおよび遺伝子治療プロトコールを概観するには、Andersen et al., Science 256, 808-813 (1992)を参照されたい。   A variety of techniques are available for introducing nucleic acids into viable cells. The technique depends on whether the nucleic acid is transferred in vitro into cultured cells or in vivo into the intended host cell. Suitable techniques for transferring nucleic acids into mammalian cells in vitro include the use of liposomes, electroporation, microinjection, cell fusion, DEAE-dextran, calcium phosphate precipitation, and the like. In vivo gene transfer techniques currently preferred include transfection using viral (typically retroviral) vectors, and viral coat protein-liposome-mediated transfection (Dzau et al., Trends in Biotechnology 11 , 205-210 [1993]). In certain situations, it may be desirable to provide a nucleic acid source having a substance that targets the target cell, such as a cell surface membrane protein or an antibody specific for the target cell or a ligand for a receptor on the target cell. When liposomes are employed, proteins that bind to cell surface membrane proteins with endocytosis can be used to target and / or promote uptake. For example, capsid proteins or fragments thereof having affinity for specific cell types, antibodies to proteins that undergo internalization during cycling, proteins that target intracellular localization and enhance intracellular half-life. Techniques for receptor-mediated endocytosis are described, for example, in Wu et al., J. Biol. Chem. 262,4429-2232 (1987): and Wagnernet al., Proc. Natl. Acad. Sci. USA 87, 3410-3414. (1990). For an overview of gene marking and gene therapy protocols, see Andersen et al., Science 256, 808-813 (1992).

好ましい実施態様では、候補変異遺伝子を、DNAワクチンとして投与する。単一の遺伝子または候補変異遺伝子の組合せのどちらかである。むき出しのDNAワクチンは、当分野で一般的に知られている;Brower, Nature Biotechnology 16:1304-1305 (1998)。DNAワクチンとして遺伝子を使用する方法は、当業者に周知であり、候補変異遺伝子または変異遺伝子の部分を、処置を必要としている患者中での発現用のプロモーターの制御下に置くことを含む。DNAワクチンに使われる変異遺伝子は、変異タンパク質全長をコードできるが、より好ましくは、変異タンパク質から生じたペプチドを含む、変異タンパク質の部分をコードする。好ましい実施態様では、患者は、変異遺伝子から生じた多数のヌクレオチド配列を含むDNAワクチンで免疫される。同様に、本明細書で定義するように、多数の変異遺伝子またはその部分で、患者を免疫することが可能である。理論によって制限を受けないが、DNAワクチンにコードされるポリペプチドの発現に続いて、TNFαタンパク質を発現している細胞を認識し破壊または除去する細胞障害性T細胞、ヘルパーT細胞および抗体が誘導される。   In a preferred embodiment, the candidate mutant gene is administered as a DNA vaccine. Either a single gene or a combination of candidate mutant genes. Bare DNA vaccines are generally known in the art; Brower, Nature Biotechnology 16: 1304-1305 (1998). Methods of using genes as DNA vaccines are well known to those skilled in the art and involve placing a candidate mutant gene or portion of a mutant gene under the control of a promoter for expression in a patient in need of treatment. The mutant gene used in the DNA vaccine can encode the full length of the mutant protein, but more preferably encodes a portion of the mutant protein, including peptides derived from the mutant protein. In a preferred embodiment, the patient is immunized with a DNA vaccine comprising a number of nucleotide sequences derived from the mutated gene. Similarly, it is possible to immunize a patient with a number of mutated genes or portions thereof, as defined herein. Without being limited by theory, expression of the polypeptide encoded by the DNA vaccine is followed by induction of cytotoxic T cells, helper T cells and antibodies that recognize and destroy or eliminate cells expressing the TNFα protein. Is done.

好ましい実施態様では、DNAワクチンは、DNAワクチンと共にアジュバント分子をコードする遺伝子を含む。そのようなアジュバント分子には、DNAワクチンにコードされる変異ポリペプチドへの免疫反応を上昇させるサイトカインが含まれる。追加または代用のアジュバントは、当業者に周知であり、本発明で有用である。 本明細書で引用した全参照文献を、出典明示により本明細書の一部とする。   In a preferred embodiment, the DNA vaccine includes a gene encoding an adjuvant molecule with the DNA vaccine. Such adjuvant molecules include cytokines that increase the immune response to the mutant polypeptide encoded by the DNA vaccine. Additional or alternative adjuvants are well known to those of skill in the art and are useful in the present invention.   All references cited herein are hereby incorporated by reference.

図1は、全長遺伝子の合成およびPCRによる可能な全変異導入を描く。 FIG. 1 depicts full-length gene synthesis and possible total mutation introduction by PCR.    図2は、本発明のライブラリーを合成するための、好ましいスキームを示す FIG. 2 shows a preferred scheme for synthesizing the libraries of the present invention.    図3は、重複伸張法を示す。 FIG. 3 shows the overlap extension method.    図4は、本発明のライブラリーを合成するための、PCR反応生成物のライゲーションを示す。 FIG. 4 shows the ligation of PCR reaction products to synthesize the library of the present invention.    図5は、PCR産物の平滑末端ライゲーションを描く。 FIG. 5 depicts blunt end ligation of PCR products.   

Claims (22)

増強された免疫原性を示すポリペプチドの生成方法であって、 a)可変残基位置と共に、標的主鎖構造をコンピューターに入力すること、 b)順を問わず、 i)少なくとも1つのコンピューター処理のタンパク質設計アルゴリズム;および ii)少なくとも1つのコンピューター処理の免疫原性フィルター を適用すること、および c)増強された免疫原性を有する少なくとも1つの変異体タンパク質を同定すること、 を含む方法。   A method for producing a polypeptide exhibiting enhanced immunogenicity, comprising: a) entering the target backbone structure into the computer along with the variable residue positions; b) Any order   i) at least one computerized protein design algorithm; and   ii) At least one computerized immunogenic filter Applying, and c) identifying at least one variant protein with enhanced immunogenicity, Including methods. 低減された免疫原性を示すポリペプチドの生成方法であって、 a)可変残基位置と共に、標的主鎖構造をコンピューターに入力すること、 b)順を問わず、 i)少なくとも1つのコンピューター処理のタンパク質設計アルゴリズム;および ii)少なくとも1つのコンピューター処理の免疫原性フィルター を適用すること、および c)低減された免疫原性を有する少なくとも1つの変異体タンパク質を同定すること、 を含む方法。   A method for producing a polypeptide exhibiting reduced immunogenicity, comprising: a) entering the target backbone structure into the computer along with the variable residue positions; b) Any order   i) at least one computerized protein design algorithm; and   ii) At least one computerized immunogenic filter Applying, and c) identifying at least one mutant protein having reduced immunogenicity, Including methods. 患者において増強された免疫反応を誘起する方法であって、 a)可変残基位置と共に、標的主鎖構造をコンピューターに入力すること、 b)順を問わず、 i)少なくとも1つのコンピューター処理のタンパク質設計アルゴリズム;および ii)少なくとも1つのコンピューター処理の免疫原性フィルター を適用すること、 c)増強された免疫原性を有する少なくとも1つの変異体タンパク質を同定すること、および d)該変異体タンパク質を患者に投与すること、 を含む方法。   A method of inducing an enhanced immune response in a patient comprising a) entering the target backbone structure into the computer along with the variable residue positions; b) Any order   i) at least one computerized protein design algorithm; and   ii) At least one computerized immunogenic filter Applying, c) identifying at least one mutant protein having enhanced immunogenicity; and d) administering the mutant protein to a patient; Including methods. 該コンピューター処理のタンパク質設計アルゴリズムを該フィルターに先立って適用する、請求項1、請求項2または請求項3に記載の方法。   4. The method of claim 1, 2 or 3, wherein the computerized protein design algorithm is applied prior to the filter. 該コンピューター処理のタンパク質設計アルゴリズムを該フィルターの後に適用する、請求項1、請求項2または請求項3に記載の方法。   The method of claim 1, claim 2 or claim 3, wherein the computerized protein design algorithm is applied after the filter. 該コンピューター処理のタンパク質設計アルゴリズムが、該フィルターをスコア付け関数として含む、請求項1、請求項2または請求項3に記載の方法。   4. The method of claim 1, 2 or 3, wherein the computerized protein design algorithm includes the filter as a scoring function. 該標的タンパク質が、Zn−アルファ2−糖タンパク質、ヒト血清アルブミン、免疫グロブリンGおよび非免疫原性タンパク質からなる群から選択される、請求項1、請求項2、請求項3、請求項4、請求項5または請求項6に記載の方法。   The target protein is selected from the group consisting of Zn-alpha 2-glycoprotein, human serum albumin, immunoglobulin G, and non-immunogenic protein, claim 1, claim 3, claim 4, claim 4, 7. A method according to claim 5 or claim 6. 該コンピューター処理の免疫原性フィルターが、MHCクラスIモチーフに関するスコア付け関数を含む、請求項1、請求項2、請求項3、請求項4、請求項5、請求項6または請求項7に記載の方法。   8. The computerized immunogenic filter of claim 1, claim 2, claim 3, claim 4, claim 6 or claim 7, wherein the scoring function for MHC class I motifs. the method of. 該コンピューター処理の免疫原性フィルターが、MHCクラスIIモチーフに関するスコア付け関数を含む、請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7または請求項8に記載の方法。   Claim 1, Claim 2, Claim 3, Claim 4, Claim 5, Claim 7, or Claim 7, wherein the computerized immunogenic filter comprises a scoring function for the MHC class II motif. Item 9. The method according to Item 8. 該増強された免疫原性が、少なくとも1つの免疫原性配列の存在によるものである、請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8または請求項9に記載の方法。   The enhanced immunogenicity is due to the presence of at least one immunogenic sequence, claim 1, claim 3, claim 4, claim 5, claim 6, claim 7 10. A method according to claim 8 or claim 9. 該免疫原性配列が同一のものである、請求項10に記載の方法。   11. A method according to claim 10, wherein the immunogenic sequences are identical. 該免疫原性配列が異なるものである、請求項10に記載の方法。   11. The method of claim 10, wherein the immunogenic sequences are different. 該免疫原性配列が、B細胞エピトープ、T細胞エピトープ、MHCクラスIモチーフおよびMHCクラスIIモチーフからなる群から選択される、請求項10、請求項11または請求項12に記載の方法。   13. The method according to claim 10, 11 or 12, wherein the immunogenic sequence is selected from the group consisting of a B cell epitope, a T cell epitope, an MHC class I motif and an MHC class II motif. 該免疫原性配列が、特異的切断モチーフをさらに含む、請求項10、請求項11、請求項12または請求項13に記載の方法。   14. The method of claim 10, 11, 12, or 13, wherein the immunogenic sequence further comprises a specific cleavage motif. 該コンピューター処理で生成させる段階が、DEEコンピューター計算を含む、請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、請求項13または請求項14に記載の方法。   The step of generating by the computer processing includes DEE computer calculation, claim 1, claim 3, claim 4, claim 5, claim 7, claim 8, claim 9. 15. A method according to claim 10, claim 11, claim 12, claim 13 or claim 14. 該DEEコンピューター計算が、オリジナルDEEおよびゴールドステイン(Goldstein)DEEからなる群から選択される、請求項15に記載の方法。   16. The method of claim 15, wherein the DEE computer calculation is selected from the group consisting of an original DEE and a Goldstein DEE. 該一次変異アミノ酸配列のセットが、少なくとも1つのスコア付け関数に最適化されている、請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、請求項13、請求項14、請求項15または請求項16に記載の方法。   Claim 1, Claim 2, Claim 3, Claim 4, Claim 5, Claim 7, wherein the set of primary variant amino acid sequences is optimized for at least one scoring function. The method according to claim 8, claim 9, claim 10, claim 11, claim 12, claim 13, claim 14, claim 15 or claim 16. 少なくとも1つのスコア付け関数に最適化されている該一次変異アミノ酸配列のセットが、大域的最適タンパク質配列を含む、請求項17に記載の方法。   18. The method of claim 17, wherein the set of primary variant amino acid sequences that are optimized for at least one scoring function comprises a global optimal protein sequence. 該スコア付け関数が、ファンデルワールスポテンシャルスコア付け関数、水素結合ポテンシャルスコア付け関数、原子溶媒和スコア付け関数、静電気スコア付け関数および二次構造傾向スコア付け関数からなる群から選択される、請求項17に記載の方法。   The scoring function is selected from the group consisting of a van der Waals potential scoring function, a hydrogen bond potential scoring function, an atomic solvation scoring function, an electrostatic scoring function, and a secondary structure trend scoring function. 18. The method according to 17. 該コンピューター処理で生成させる段階がモンテカルロ検索の使用を含む、請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、請求項13、請求項14、請求項15、請求項16、請求項17、請求項18または請求項19に記載の方法。   Claims 1, 2, 3, 4, 5, 6, 7, 8, 8, wherein the step of generating by computer includes the use of a Monte Carlo search. A method according to claim 10, claim 11, claim 12, claim 13, claim 14, claim 15, claim 16, claim 17, claim 18 or claim 19. 請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、請求項13、請求項14、請求項15、請求項16、請求項17、請求項18、請求項19または請求項20に記載の方法により作成された、増強された免疫原性を示す改変ポリペプチド。   Claim 1, Claim 2, Claim 3, Claim 4, Claim 5, Claim 6, Claim 7, Claim 8, Claim 9, Claim 11, Claim 12, Claim A modified polypeptide exhibiting enhanced immunogenicity produced by the method of claim 13, claim 14, claim 15, claim 16, claim 17, claim 18, claim 19 or claim 20. 該変異体タンパク質がZn−アルファ2−糖タンパク質、ヒト血清アルブミン、免疫グロブリンG、非免疫原性タンパク質の変異体およびそれらの混合物からなる群から選択される、請求項3に記載の方法。   4. The method of claim 3, wherein the variant protein is selected from the group consisting of Zn-alpha 2-glycoprotein, human serum albumin, immunoglobulin G, non-immunogenic protein variants and mixtures thereof.
JP2006515515A 2001-07-10 2002-01-04 Protein design automation to design modified immunogenic protein libraries Pending JP2007520423A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/903,378 US20020119492A1 (en) 2000-07-10 2001-07-10 Protein design automation for designing protein libraries with altered immunogenicity
PCT/US2001/021823 WO2002005146A2 (en) 2000-07-10 2001-07-10 Method for disigning protein libraries with altered immunogenicity
PCT/US2002/000165 WO2003006154A2 (en) 2001-07-10 2002-01-04 Protein design automation for designing protein libraries with altered immunogenicity

Publications (1)

Publication Number Publication Date
JP2007520423A true JP2007520423A (en) 2007-07-26

Family

ID=26680528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006515515A Pending JP2007520423A (en) 2001-07-10 2002-01-04 Protein design automation to design modified immunogenic protein libraries

Country Status (3)

Country Link
JP (1) JP2007520423A (en)
CA (1) CA2452824A1 (en)
WO (1) WO2003006154A2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006267058A (en) * 2005-03-25 2006-10-05 Univ Of Tokushima Immobilization method of protein/peptide to diamond chip
JP2010083759A (en) * 2008-09-29 2010-04-15 National Institute Of Advanced Industrial Science & Technology Activated peptide of antibody-producing cell
JP2015526775A (en) * 2012-05-25 2015-09-10 バイエル・ヘルスケア・エルエルシーBayer HealthCareLLC Systems and methods for predicting the immunogenicity of peptides

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020048772A1 (en) 2000-02-10 2002-04-25 Dahiyat Bassil I. Protein design automation for protein libraries
US7315786B2 (en) 1998-10-16 2008-01-01 Xencor Protein design automation for protein libraries
US20030130827A1 (en) * 2001-08-10 2003-07-10 Joerg Bentzien Protein design automation for protein libraries
WO2003057856A2 (en) 2002-01-04 2003-07-17 Xencor Dominant negative proteins and methods thereof
US7381792B2 (en) 2002-01-04 2008-06-03 Xencor, Inc. Variants of RANKL protein
CA2727654C (en) 2002-02-06 2014-08-05 Jx Nippon Oil & Energy Corporation Method for preparing hydrogenation purification catalyst
US7553930B2 (en) 2003-01-06 2009-06-30 Xencor, Inc. BAFF variants and methods thereof
CA2512693A1 (en) * 2003-01-08 2004-07-29 Xencor, Inc. Novel proteins with altered immunogenicity
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
WO2005014641A2 (en) * 2003-07-09 2005-02-17 Xencor, Inc. Ciliary neurotrophic factor variants
US8399618B2 (en) 2004-10-21 2013-03-19 Xencor, Inc. Immunoglobulin insertions, deletions, and substitutions
US9714282B2 (en) 2003-09-26 2017-07-25 Xencor, Inc. Optimized Fc variants and methods for their generation
US8883147B2 (en) 2004-10-21 2014-11-11 Xencor, Inc. Immunoglobulins insertions, deletions, and substitutions
EP1695252A2 (en) * 2003-12-08 2006-08-30 Xencor, Inc. Protein engineering with analogous contact environments
WO2005113598A2 (en) * 2004-05-21 2005-12-01 Xencor, Inc. Tnf super family members with altered immunogenicity
CN101018807A (en) * 2004-05-21 2007-08-15 赞科股份有限公司 C1q family member proteins with altered immunogenicity
EP2845865A1 (en) 2004-11-12 2015-03-11 Xencor Inc. Fc variants with altered binding to FcRn
US8367805B2 (en) 2004-11-12 2013-02-05 Xencor, Inc. Fc variants with altered binding to FcRn
WO2007008951A1 (en) * 2005-07-12 2007-01-18 Codon Devices, Inc. Compositions and methods for design of non-immunogenic proteins
DK1931709T3 (en) 2005-10-03 2017-03-13 Xencor Inc FC VARIETIES WITH OPTIMIZED FC RECEPTOR BINDING PROPERTIES
EP3575317A1 (en) 2007-12-26 2019-12-04 Xencor, Inc. Fc variants with altered binding to fcrn
US9493578B2 (en) 2009-09-02 2016-11-15 Xencor, Inc. Compositions and methods for simultaneous bivalent and monovalent co-engagement of antigens
WO2017165856A1 (en) * 2016-03-24 2017-09-28 Baker Brian M Biomolecule design model and uses thereof
JP7347113B2 (en) * 2019-10-21 2023-09-20 富士通株式会社 Method for searching for modified sites in peptide molecules, searching device, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006267058A (en) * 2005-03-25 2006-10-05 Univ Of Tokushima Immobilization method of protein/peptide to diamond chip
JP4660756B2 (en) * 2005-03-25 2011-03-30 国立大学法人徳島大学 Immobilization of protein / peptide on diamond chip
JP2010083759A (en) * 2008-09-29 2010-04-15 National Institute Of Advanced Industrial Science & Technology Activated peptide of antibody-producing cell
JP2015526775A (en) * 2012-05-25 2015-09-10 バイエル・ヘルスケア・エルエルシーBayer HealthCareLLC Systems and methods for predicting the immunogenicity of peptides

Also Published As

Publication number Publication date
WO2003006154A3 (en) 2005-10-13
WO2003006154A2 (en) 2003-01-23
CA2452824A1 (en) 2003-01-23

Similar Documents

Publication Publication Date Title
JP2007520423A (en) Protein design automation to design modified immunogenic protein libraries
US20030022285A1 (en) Protein design automation for designing protein libraries with altered immunogenicity
JP2004502946A (en) Protein design automation for designing protein libraries with altered immunogenicity
US7101974B2 (en) TNF-αvariants
US7056695B2 (en) TNF-α variants
AU5270000A (en) Novel nucleic acids and proteins with interferon-beta activity
JP2003521933A (en) Protein design automation for protein libraries
JP2003525612A (en) Design and discovery of variant TNF-α proteins for treatment of TNF-α related disorders
US20070184487A1 (en) Compositions and methods for design of non-immunogenic proteins
US6746853B1 (en) Proteins with insulin-like activity useful in the treatment of diabetes
Liang et al. Exploring the molecular design of protein interaction sites with molecular dynamics simulations and free energy calculations
Jain et al. First observation of left-handed helical conformation in a dehydro peptide containing two L-Val residues. Crystal and solution structure of Boc-L-Val-ΔPhe-ΔPhe-ΔPhe-L-Val-OMe
WO2000069901A2 (en) Proteins with insulin-like activity useful in the treatment of diabetes
JP2004532618A (en) Modified leptin with reduced immunogenicity
US7208147B2 (en) Modified granulocyte macrophage colony stimulating factor (GM-CSF) with reduced immunogenicity
JP2004519230A (en) Modified interleukin-1 receptor antagonist with reduced immunogenicity (IL-1RA)
JP2004520836A (en) Modified protamine with reduced immunogenicity
Yu et al. Cyclic peptide linker design and optimization by molecular dynamics simulations
EP1572345A2 (en) Protein design automation for designing protein libraries with altered immunogenicity
AU2002306402A1 (en) Protein design automation for designing protein libraries with altered immunogenicity
AU4849200A (en) Novel nucleic acids and proteins with p53 activity and altered tetramerization domains
US20020183937A1 (en) Method for the generation of proteins with new enzymatic function
AU2001245411B2 (en) Design and discovery of protein based TNF-alpha variants for the treatment of TNF-alpha related disorders
AU2001245411A1 (en) Design and discovery of protein based TNF-alpha variants for the treatment of TNF-alpha related disorders
AU2005239700A1 (en) Design and discovery of protein based TNF-alpha variants for the treatment of TNF-alpha related disorders

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080708