WO2002057954A1 - Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation - Google Patents

Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation Download PDF

Info

Publication number
WO2002057954A1
WO2002057954A1 PCT/JP2002/000286 JP0200286W WO02057954A1 WO 2002057954 A1 WO2002057954 A1 WO 2002057954A1 JP 0200286 W JP0200286 W JP 0200286W WO 02057954 A1 WO02057954 A1 WO 02057954A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
dimensional structure
ligand
atomic coordinates
coordinates
Prior art date
Application number
PCT/JP2002/000286
Other languages
English (en)
French (fr)
Inventor
Hideaki Umeyama
Katsuichiro Komatsu
Original Assignee
Mitsubishi Chemical Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Chemical Corporation filed Critical Mitsubishi Chemical Corporation
Priority to JP2002558170A priority Critical patent/JP3843260B2/ja
Publication of WO2002057954A1 publication Critical patent/WO2002057954A1/ja

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Definitions

  • the present invention relates to a method for constructing a three-dimensional structure of a protein including induction fitting and its use. More specifically, the present invention relates to a three-dimensional structure of a reference protein and a plurality of three-dimensional structure sets obtained by displacing atomic coordinates thereof as a three-dimensional structure of the reference protein.
  • the present invention relates to a method for constructing a three-dimensional structure of a protein, which comprises creating a plurality of three-dimensional structure sets of a target protein, a method for constructing a three-dimensional structure of a protein-ligand complex using the three-dimensional structure set, and a method for identifying a ligand binding site of a protein. .
  • the three-dimensional structure of the target protein provided by the method of the present invention is an induction-compatible
  • an alignment with the target protein with an unknown three-dimensional structure can be obtained, and the three-dimensional structure of the target protein can be created using a computer based on this alignment information.
  • This method is usually called homology modeling.
  • the accuracy of three-dimensional structures constructed by homology modeling has improved remarkably in recent years, but there are still many problems to be solved.
  • the main chain or side chain of the three-dimensional structure constructed in the space where the ligand exists or in the binding site is packed, and the space is closed, and the ligand is bound to the receptor protein. There were problems such as contact and the inability to exist at the binding site.
  • the three-dimensional structure of a protein-ligand complex In the method for constructing the three-dimensional structure of a protein-ligand complex, if the three-dimensional structure of the target receptor protein has not been experimentally determined, the three-dimensional structure of the receptor protein itself simply constructed by homology modeling is used. To The three-dimensional structure of the receptor protein-ligand complex was obtained by docking the ligands and optimizing them by molecular force field calculations and molecular dynamics calculations. Also,
  • thermal fluctuations hereinafter sometimes simply referred to as “thermal fluctuations” or “molecular fluctuations" were ignored.
  • the present invention has been made in view of the above circumstances, and provides a method for accurately constructing a three-dimensional structure of an arbitrary protein, a method for accurately constructing a three-dimensional structure of a protein-ligand complex, and the like. .
  • the present inventors have conducted intensive studies to achieve the above object, and as a result, referencing the atomic coordinates of the reference protein displaced in the intrinsic vector direction obtained from the normal vibration analysis method, the three-dimensional shape of the receptor protein was determined.
  • the main chain or side chain of the three-dimensional structure will not be packed in the space where the ligand exists or the binding site, and the space will not be blocked, and the accuracy of the three-dimensional structure of the receptor protein will be significantly improved. I found that I could do that. In other words, it was found that multiple receptor protein models can be constructed in consideration of the thermal fluctuation of molecules based on the normal mode.
  • the present inventors have come to the conclusion that the hydrophobic interaction is less important than the electrostatic force when considering the phenomenon in an aqueous solution for the protein-ligand complex.
  • Solvents are placed around and inside the protein by the method. Analysis of the solvent behavior (solvent diffusion / accumulation) by molecular dynamics shows that the site where the solvent accumulates in the protein or where the solvent does not easily diffuse coincides with the ligand binding site. was found.
  • the present invention has been achieved based on these findings.
  • a method for deriving an alignment between a reference protein and a target protein and constructing a three-dimensional structure of the target protein based on the alignment and the three-dimensional structure information of the reference protein includes: Constructing a three-dimensional structure of a protein, including induction adaptation, characterized by creating three-dimensional structures and multiple three-dimensional structures whose atomic coordinates are displaced as the three-dimensional structure of a reference protein, and creating multiple three-dimensional structure sets of the target protein A method is provided.
  • (4) (i) docking operation of a ligand with a plurality of three-dimensional structures of the target protein obtained by the method described in any of (1) to (3) above.
  • the target protein side (Iv) The ligand moves the atomic coordinates of the ligand in the direction of averaging the calculated potential energy gradients, and (V) moves the atomic coordinates of the target protein in accordance with the potential energy gradient.
  • a method for constructing a three-dimensional structure of a protein-ligand complex which comprises determining a three-dimensional structure of a ligand based on a body structure.
  • the initial Co; atomic coordinate position of the target protein is added as an optional Harmonic function.
  • a force function or a potential function for restricting a twist angle of the main chain of the target protein is added.
  • (6) (i) arranging small molecules around the three-dimensional structure of a protein, and (ii) arranging water molecules further around them, By performing molecular energy calculations, the atomic coordinates of the protein and the low-molecular compound are obtained.
  • (Iii) Using the obtained atomic coordinates, behavioral analysis of the low-molecular compound around and inside the protein is performed, and ligand binding is performed.
  • the behavior analysis of the low-molecular compound is performed by cluster-one analysis for the low-molecular compound, and the obtained cluster-one size is determined by the rank of the ligand-binding possibility site.
  • (9) docking a ligand to a ligand binding site of a protein specified by the method according to any one of the above (6) to (8), and empirical molecular energy calculation
  • a method for constructing a three-dimensional structure of a protein-ligand complex which comprises obtaining a three-dimensional structure of the complex.
  • the three-dimensional structure of a protein obtained by the method according to any one of the above (1) to (5) and (9) and the three-dimensional structure of A computer-readable recording medium characterized in that prescribed atomic coordinates are recorded, or a database characterized by including the atomic coordinates is provided.
  • a drug is prepared by using atomic coordinates defining the three-dimensional structure of a protein obtained from the recording medium or the database according to the above (10).
  • a drug molecule designing method characterized by identifying, searching, evaluating or designing a target drug molecule based on an interaction with a three-dimensional structure of a product candidate molecule.
  • FIG. 1 is a flow chart showing an example of a method for constructing a protein three-dimensional structure including induction fitting according to the present invention.
  • FIG. 2 is a diagram showing a method of constructing Co; atomic coordinates in steps 1-41.
  • the matching part of the alignment is obtained from the reference protein, and the part without the alignment is obtained from the database with the minimum rmsd of the superposition of the two residues overlapping at both ends of N and C.
  • FIG. 3 is a diagram showing a local space homology (LSH).
  • LSH local space homology
  • FIG. 4 is a diagram showing the relationship between LSH and the ratio of structurally conserved sites (SCRs).
  • FIG. 5 is a flowchart showing an example of a method for constructing a three-dimensional structure of a protein-ligand complex of the present invention.
  • FIG. 6 is a flowchart showing an example of the method for specifying a ligand binding site of the present invention, and a method for constructing a three-dimensional structure of a protein-ligand complex using the binding site specified by the method.
  • FIG. 7 is a flowchart showing an example of an embodiment of the method for constructing a three-dimensional structure of a protein including induction fitting according to the present invention.
  • FIG. 8 is a diagram showing an alignment of QRHUB2 (32-adrenergic receptor) obtained using 1F88 (mouth dopsin) as a reference protein.
  • QRHUB2 32-adrenergic receptor
  • 1F88 mouth dopsin
  • the amino acid sequence of each protein is indicated by a single letter symbol.
  • Fig. 10 shows one example of the three-dimensional structure of an induced fit type target protein constructed from an induced fit type reference protein multiplied by ⁇ 2X ( ⁇ 2X26.4) with the target protein.
  • 4 is a photograph of a printout of a display showing a part.
  • the central structure is the no induced fit protein of interest.
  • FIG. 11 is a photograph of a printout of a display showing a three-dimensional structure of trypsin in a trypsin-BPTI complex system after MCSS calculation.
  • FIG. 12 is a photograph of a printout of the display showing the initial three-dimensional structure of the trypsin-BPTI complex before MCSS calculation.
  • His57, Aspl02 and oxyunhole are extracted from the trypsin side, which corresponds to the active site of the trypsin-BPTI complex, and only Lysl5 is extracted from the BPTI side.
  • the line shown in black is the three-dimensional structure of the trypsin-BPTI complex obtained by X-ray crystallography
  • the line shown in gray is the initial three-dimensional structure of the complex model with thread. .
  • FIG. 13 is a photograph of a printout of a display showing the three-dimensional structure of the trypsin-complex after the MCSS calculation.
  • His57, Aspl02, and the xyxion hole (Glyl93-Aspl94-Serl95), which correspond to the active site of the trypsin-BPTI complex, are extracted from the trypsin side, and only Lysl5 is extracted from the BPTI side.
  • the line shown in black is the three-dimensional structure of the trypsin-BPTI complex by X-ray crystallography
  • the line shown in gray is the refined three-dimensional structure of the assembled complex model. is there.
  • FIG. 14 is a photograph of a printout of a display showing the three-dimensional structure coordinates of the trypsin-BPTI complex by X-ray crystallography.
  • Figure 15 is a printout of the display showing the distribution of benzene molecules around trypsin.
  • the black line hexagon is the largest benzene cluster.
  • FIG. 16 is a photograph of a printout of a display showing the distribution of benzene molecules around BPTI.
  • the black line hexagon is the largest benzene cluster.
  • the “target protein” refers to any protein for which a three-dimensional structure has not been completely determined by X-ray crystallography or IR analysis or the like, and for which a three-dimensional structure is to be constructed in the present invention.
  • This protein includes those whose partial structure has been analyzed but whose complete three-dimensional structure has not been obtained.
  • the X-ray crystal analysis includes not only X-ray but also electron beam and neutron beam analysis.
  • Receptor protein refers to a protein that is present in a cell and recognizes a foreign substance or physical stimulus to induce a response in the cell. This receptor protein has the ability to specifically bind a ligand.
  • Ligand refers to a substance that has the ability to specifically bind to proteins. Ligands include not only low-molecular substances such as pharmaceutical and agricultural chemicals, but also antibodies and proteins that interact with proteins. High molecular substances such as non-peptide proteins are also included.
  • a “reference protein” is a protein whose details of its tertiary structure have already been determined by X-ray crystallography, NMR analysis, etc., and which are referred to for constructing atomic coordinates that define the tertiary structure of the target protein. means.
  • the term “alignment” means that amino acid sequences are associated with two or more proteins.
  • “Atomic coordinates” describe a three-dimensional structure in a three-dimensional space. It is the relative distance in three directions perpendicular to each other with a point in space as the origin, and is the number of betatles consisting of three numbers per atom excluding hydrogen atoms present in the protein.
  • “Induced fit” means that the conformation of the protein is flexible and, when bound to a ligand, eg, a medicinal and agrochemical molecule, changes the conformation of the protein to better bind to it. "Three-dimensional including induced fit The term ⁇ structure '' is based on the assumption that the conformational change of a protein caused by induction fitting can be represented by, for example, the unique vector obtained by the standard vibration analysis method, and is generated by adding this unique vector to the three-dimensional structure before induction fitting Three-dimensional structure.
  • target protein-ligand complex refers to a protein-ligand complex for which a three-dimensional structure is to be constructed in the present invention, since the complete three-dimensional structure of the complex has not been elucidated by X-ray crystallography, NMR analysis, or the like. means.
  • the protein includes a three-dimensional structure obtained by X-ray crystallography, NMR analysis, or the like.
  • This complex includes those whose partial structure has been analyzed but the complete three-dimensional structure has not been obtained. It means a complex of both ligands bound to the protein.
  • the “Multiple Copy Simultaneous Search (MCSS) method” is based on the empirical molecular energy / registry calculation method based on the tertiary structure of multiple ligands. This is a method to obtain the three-dimensional structure of the receptor protein by kinetic calculation. In the present invention, on the contrary, it means a method for obtaining the three-dimensional structure of a protein-ligand complex of interest based on the three-dimensional structure of a plurality of proteins based on the three-dimensional structure of one ligand.
  • Empirical molecular energy calculation means molecular mechanics calculation and molecular dynamics calculation. Both are molecular energy calculations using empirical potentials.
  • rMSAS Maximum Solvent Accessibility of Sidechain J is the maximum surface area of the solvent contacted hornworm.
  • the methods I to III described below can be carried out using an appropriate computer capable of performing homology modeling and using an appropriate program for executing the method described below.
  • FIG. 1 shows an example of a method for constructing a three-dimensional structure including induced fit according to the present invention.
  • step 1-10 input the rooster sequence of the target protein, select a reference protein to be used for constructing the three-dimensional structure of the target protein, obtain atomic coordinates from the three-dimensional structure of the reference protein, and minimize the objective function. Optimize the atomic coordinates to optimize.
  • step 1-20 the optimized normal vibration analysis method of atomic coordinates is performed.
  • step 1-30 the atomic coordinates of the reference protein are displaced in the unique vector direction, the structure is added to the reference protein, and a set of reference proteins is created.
  • Step 1_ 4 appropriate homology one ⁇ modeling program, for example, to build a set of three-dimensional structure of the target protein from the three-dimensional structure information of Araime cement information and reference protein set by FAMS.
  • a three-dimensional structure including induced fit of the target protein can be constructed with high accuracy.
  • each step will be described in more detail.
  • the amino acid sequence of the target protein is input, and a reference protein (reference protein) is selected. Selection of the reference protein is performed using commonly used alignment software known per se.
  • the atomic coordinates of this reference protein are obtained from an appropriate three-dimensional structure database. In these atomic coordinates, there is no hydrogen atom bonded to the nitrogen atom etc. that forms the amino acid skeleton, and if a hydrogen atom is necessary for the calculation of the normal vibration analysis method in steps 1-20, a hydrogen atom is generated.
  • the atomic coordinates are optimized using the objective function composed of the atomic coordinates of the reference protein.
  • the amino acid sequence of the target protein to be used may be a sequence registered in a database or a sequence derived from any sequence such as a sequence analyzed for the first time.
  • GCRDb The Internet review described in the complete neuroscientist scours he World ffide Web. "Bloom FE, Science 1996; 274 (5290): 1104-9"
  • G-protein-coupled Receptor Database http: // www. Gcrdb. Uthscsa. Ecm /, GPCRDB: http: // www. Gpcr. Org / 7tm / ExPASy: http: // www. Expasy.
  • Ch / cgi- bin / sm-gpcr. pl 0RDB http: // ycrai. med. yale. edu / senselab / ordb /, GeneBank: ftp: //ncbi.nlm.nih.gov/genbank/genomes/, PIR: http: // www-nbrf.georgetown.edu/pir/ (National Biomedical Research Foundation (NBRF)) Swiss Plot: http: // ww expasy.ch/sprot/sprot-top.html (Swiss Institute of Bioinforraatics (SIB), European Bioinformatics Institute (EBI)), TrEMBL (both URL and administrator are the same as Swiss Plot), TrEMBLNEff (URL and administrator Both are the same as Swiss Plot), DAD: ftp: ⁇ ftp.ddbj.nig.ac.jp (Japan DNA Data Bank) and other databases
  • Examples of the three-dimensional structure database used to obtain the atomic coordinates of the reference protein include, for example, PDB (Protein Data Bank): http: ⁇ ⁇ .rcsb.org / pdb8 CCDC (Cambridge Crystallographic Data Center: http: // www. ccdc. cam. au. uk /, SCOP (Structure Classification of Protein): http: // scop. rarc—lmb. cam. ac. uk / scop, CATH- http: // www. biochem. ucl. ac. uk / bsm / cath etc.
  • SCOP and CATH are domain units (the three-dimensional structure of It is a three-dimensional structure database divided into (units).
  • FASTA is a program that searches the three-dimensional structure database for a sequence with a high degree of coincidence with the target sequence, and calculates the final degree of coincidence between the target sequence and the reference protein as an e-value. Details of FASTA are described in "Effective protein sequence comparison.” Pearson WR, (1996) Methods Enzymol; 266: 227-58.
  • PSI-BLAST is programmed to perform profile alignment. For details on PSI-BLAST, see “Matching a protein sequence against a collection of PSI-BLAST-constructed position-specific score matrices.” Schaffer AA, Wolf YI, Ponting CP, Koonin EV, Aravind L and Altschul SF, Bioinformatics 1999, 12, 1000-11.
  • the method for optimizing the atomic coordinates of the reference protein, the coordinate system, the objective function, and the like are not particularly limited.
  • the maximum gradient method uses the first derivative of the numerically calculated objective function to optimize the atomic coordinate objective function.
  • the conjugate gradient method but there are a number of schemes, Fletcher-Reeves method (Fletcher, R., and Reeves, CM (1964) Function Minimization by Conjugate Gradients Comput J, 7:. 149 - 154) force s standard manner If the objective function is a strict quadratic function of n variables, the optimization can be reached by at most n iterations.
  • the Newton-Raphscm method uses the second derivative in addition to the first derivative, and is efficient when the initial structure is close to the optimized structure. Details of these methods are described in Shigehiro Eguchi, “Physics of Protein Engineering. Basics of Chemistry (Kyoritsu Shuppan 1991)” and references therein.
  • optimized structures and optimized coordinates respectively.
  • the atomic coordinates are displaced. It is preferable to perform the displacement of the atomic coordinates by performing the normal vibration analysis method and obtaining the eigenvector of each eigenvalue. At this time, a coordinate system in which a part of the optimized degrees of freedom may be used. In this case, optimization has been achieved for some degrees of freedom.
  • the ⁇ normal vibration analysis method '' means a method of approximating potential energy as a quadratic function of displacement, rigorously solving the equation of motion, and analyzing minute vibrations around the optimized structure .
  • Eigenvalue means a period of minute vibration.
  • Eigenvector means the direction of vibration.
  • the eigenvalue equation to be solved by the normal vibration analysis method is the following equation (1) or (2).
  • 3 ⁇ 4 is the coordinate corresponding to the degree of freedom of vibration, 3 ⁇ 4.
  • a jk is a coefficient linking the collective motion Q k and the individual atoms motion qj, is as the formula (5). q + ⁇ ⁇ (5)
  • step I-20 calculate the position fluctuation of the C atom at a certain temperature and a certain eigenvalue. Equivalent to the number of eigenvalues, the position fluctuation is obtained. Convert the temperature factor of the Ca atom of the reference protein into position fluctuations, calculate the ratio of each C atom to the position fluctuation of the normal vibration analysis method, and obtain the average ratio. The ratio of this average is equal to the number of eigenvalues used and belongs to this eigenvalue multiplied by this ratio.
  • the three-dimensional structure consisting of the displaced atomic coordinates that is, the three-dimensional structure including the induced fit, is added to the atomic coordinates of the reference protein before the structural optimization. And one of them.
  • this is referred to as an induced fit type reference protein, three-dimensional structure, and coordinates.
  • the eigenvector has forward and reverse directions, and the same vector is displaced in the opposite direction by multiplying by 11. That is, the induced fit type has only four times the number of eigenvalues used.
  • the three-dimensional structures of an induced fit type and a no induced fit type reference protein are defined as a reference protein three-dimensional structure set.
  • Bi is the temperature factor of the atoms obtained from the PDB file
  • is the pi, and is the position fluctuation. In the present invention, it is only with respect to the Co atom.
  • is the position fluctuation of the i-th atom with respect to the v-th eigenvalue obtained from the normal vibration analysis method. In the present invention, this is performed only for the C a atom.
  • the average of the ratio is as shown in the following equation ( 8 ).
  • N is the number of atoms and the sum is over atoms.
  • 3 ⁇ 4 ⁇ is the average ratio of the relative ⁇ [nu th eigenvalue. In the present invention, this is performed on the C a atom.
  • the atomic coordinates of the induced fit type reference protein three-dimensional structure are as shown in the following formulas (9) and (10).
  • k ° atomic coordinates
  • k v of the reference protein represents a component of the intrinsic base vector belonging to V th eigenvalue.
  • Step 1-40 Model the target protein
  • a three-dimensional structure set of the target protein is constructed using an appropriate homology modeling program, for example, FAMS.
  • FAMS homology modeling program
  • the same number of three-dimensional structures of the target protein as the number of three-dimensional structures of the reference protein are constructed.
  • an induced fit type and a non induced fit type target protein three-dimensional structure which is four times as many as the number of eigenvalues used, are constructed.
  • each step of FAMS will be described as a preferred example of the modeling (construction of a three-dimensional structure) method.
  • the numbers of calculations, constants, cutoff values, and the like described in the following steps 1-41 to 43 are examples of parameters that the present inventor considers most preferable. Is not limited at all. It is described in FAMS, Itoda f, Koji Ogata and Hideaki Umeyaraa, "An automatic homology modeling method consisting of database searches and simulated annealing" Journal of Molecular Graphics and Modeling 18, 258-272, 2000.
  • a region without gaps in which three or more amino acids correspond consecutively is selected, and in that region, the target
  • the Co atom of the protein is the same as the reference protein. If the Co; atom cannot be determined, the coordinates are applied from a previously created fragment database (see Fig. 2).
  • the Co; atom means a carbon atom at the center of the skeleton of each amino acid.
  • the C / 3 atom means a carbon atom bonded to the side chain of the Ca atom, and the Cy atom means a carbon atom bonded to the side chain of the atom.
  • the C atom means a carbon atom of the lipowell group.
  • Step I-41 Simulating the C atom using the simulated door-one ring method
  • the Ca atom created in steps 1-41 above is optimized using a function composed of the coordinates of the reference protein using a simulated annealing process. This objective function is as shown in the following equation (11).
  • U len relates to the distance between the Co: atom of the pair of the residue adjacent to the sequence and the Cys residue, and is set as in the following formula (12).
  • Hi / e " -5.4 (12) where i + 1 is the distance between residue i and C between residue i + 1. 55 is the distance between pairs of Cys residues that form a disulfide bond.
  • 3 ⁇ 4 are constants and are set to 2 and 5, respectively.
  • 1 1 ⁇ M means the norm
  • Mi is the average distance between C atoms at structurally equivalent positions on the structure-based alignment. If the value of Mi cannot be determined for residue i, the value of Mi is set to 10.
  • the average coordinates of the Ca atom are as shown in the following equation (15).
  • X ji is the atomic coordinates of Ca at the ith residue of the jth reference protein.
  • w ji is the weight of the ith residue of the jth reference protein. This weight is an important parameter for determining the approximate shape of the target protein, and is determined by the local value within 12 A of the region of interest, called local space homology (LSH), within 12 A of the site of interest. (See Figure 3).
  • the C a atom is optimized using a simulated annealing method according to equation (11).
  • the perturbation of the atom is set to be within 1. oA.
  • this annealing step is calculated 100 times for all atoms. Then, the parameter corresponding to temperature was reduced from 25 by 0.01 every 0.5 times, and the parameter was kept constant thereafter.
  • the atomic coordinates of the main chain are generated from the corresponding 4-residue protein fragment in the database.
  • the main chain atom of residue i is selected from the residues with the minimum rmsd value between the i-1st and i + 2th C ⁇ atoms.
  • the overlapping range of the atomic coordinates of C is from i-th to i + 3, and for the C-terminal residue and the immediately preceding residue, i_3 to i-th and From i_2 to i + 1.
  • u bond K bj (b j -b) (18) where is the standard bond length and depends on the type of chemical bond.
  • K b is a constant and is 225.
  • U ang is a function of the bond angle, as shown in the following equation (19).
  • 0i is the i-th bond angle, which differs depending on the type of chemical bond.
  • K a is set to 45 by a constant.
  • K non is a constant of 0.25, and the cutoff is 8 ⁇ .
  • U D0S is a function related to the position of an atom, as shown in the following equation (22).
  • ⁇ 1> c is given by the following equation (23) ⁇ W ;
  • Xi> in equation (22) is determined from the superposition of the structures between the target protein and the reference protein.
  • K p . s is a constant and is 0.3.
  • U tor is the torsion angle of the main chain, and is represented by the following equation (24).
  • the torsion angle is determined by N-Co; _Cj3-C, and K chi is 50.
  • U hydr relates to the backbone hydrogen bond conserved in homozygous proteins, and is defined by the following formula (26).
  • Hydrogen bonds are set when the distance between the N atom and the 0 atom is 2.9 soil 0.5 A. When determining whether or not there is a hydrogen bond in a plurality of reference proteins, it is determined that there is a hydrogen bond when it is recognized that 75% or more of the reference proteins are present.
  • K hydr is a constant and is 0.6.
  • optimization of main chain atoms including C / 3 is performed by simulated annealing.
  • the perturbation of the main chain and C] 3 atoms should be within 1.OA from the initial position.
  • This annealing step is performed 200 times for the main chain and Ci3 atoms.
  • the parameter corresponding to the temperature starts from 50 or 25, multiplies by 0.5 each time, continues until it reaches 0.01, and then becomes a constant value.
  • the above method is preferably performed six times, and the atomic coordinates of the main chain having the minimum objective function value are determined as the optimal solution. And the parameters corresponding to the temperature start from 50 for the first two times and start from 25 for the third time. -43: Construction and optimization of side chain atomic coordinates
  • step I-43 (1) construction of the side chain of the structure-conserved site
  • step I-43 (2) construction of the entire side chain J
  • the twist angle of the side chain is obtained from the homologous gas protein using the method in the previous study. Details of this method are described in ⁇ The role of played by environmental residues in side-cnam torsional angles witnin homologous families of proteins: A new method of side chain modeling, Ogata K and Umeyaraa H, Prot. Struct. Funct. Genet. 1998, 31, 255-369. In this method, the proportion of side chains conserved in homologous proteins is calculated, and the side chains are modeled based on this information. The atomic coordinates of the side chain at the conserved side chain position are relative to the fixed main chain atom.
  • the structure information 1 ⁇ and the hydrogen bond N-0 pair are used in the optimization process.
  • the above process is repeated three times to obtain the configuration of the main chain atoms, and the coordinates of the minimum main chain atom of the objective function are calculated.
  • the construction of the side chain is performed under a fixed main chain C atom. This is done with the results of the research disclosed in Ogata K and Umeyaraa H, Prot. Struct. Funct. Genet. 1998, 31, 255-369, above, which provides a fast and accurate model. Can be.
  • the main chain structure is reconstructed by the Monte force Optimized, the temperature is set to 0.001 and the objective function U n of equation (17). n - b .
  • nd it is calculated for all main and side chain atoms.
  • the coordinates of the side chain are rearranged so that the twist angle of the side chain is maintained in an optimized state.
  • Atomic perturbation shall be within 0.5A.
  • the side chains are then deleted and the above side chain construction is repeated. This process is repeated until the 2.4A atoms no longer collide with each other and the twist angle of N-Ca_C] 3-C falls within the range of -120 ⁇ 15 °.
  • FIG. 5 is a flowchart showing an example of a method for constructing a three-dimensional structure of a target protein-ligand complex, that is, a method for constructing a three-dimensional structure of a complex including induced fit.
  • step II-10 the modeled atomic coordinates of the target protein are obtained.
  • the normal mode can be obtained.
  • the atomic coordinates of the target protein obtained mainly in the experiment are displaced in the direction of the intrinsic vector to create a set of a plurality of reference proteins. Referring to these coordinates, the three-dimensional structure of the target protein is constructed by homology modeling.
  • step ⁇ -20 an operation of docking the ligand to the obtained three-dimensional structure of the target protein is performed.
  • step II-30 empirical molecular energy calculations are performed by the MCSS method based on the ligands docked to the set of target proteins to simulate the three-dimensional structure of the target protein-ligand complex.
  • the three-dimensional structure of the target protein-ligand complex thus obtained is a three-dimensional structure that includes the induce fit of the target protein, that is, periodic thermal motion (molecular fluctuations). Can be used for design.
  • Step II-10 Model the target protein
  • the modeling of the target protein can be divided into the following three steps: ⁇ -11: optimization of the initial coordinates of the reference protein, ⁇ -12: normal frequency analysis of the optimized coordinates, and 11-13: modeling of the target protein. This step is performed in the same manner as in I-10 to 1_44.
  • a three-dimensional structure based on the vibration mode of the normal vibration analysis method that is, a three-dimensional structure of the target protein including an induced fit can be constructed.
  • Step II-20 Docking ligand to target protein
  • the binding site of the ligand to be used is not particularly limited, and any of a binding site that has been already known and a binding site that is newly specified can be used.
  • the site can also be identified by the method described in III below.
  • Step 11-30 Optimization of 3D structure of target protein-ligand complex
  • This step II-30 is performed, for example, by the Multiple Copy Simultaneous Search (MCSS) method, and multiple complex structures are simultaneously optimized by empirical molecular energy calculation (molecular force field method) using ligands, and their atomic coordinates Is empirical molecular energy By calculation (molecular dynamics method), the structure is relaxed by, for example, 10 PS at a temperature of 300 ° K, and the atomic coordinates are optimized by the molecular force field method.
  • the temperature and time may vary depending on the target system being calculated.
  • the MCSS method has been proposed by A. Miranker and M. Karplus (Proteins, 1991, 11, 29-34) as a method for optimizing the tertiary structure of both receptor proteins and ligands using multiple ligands.
  • A. Miranker and M. Karplus Proteins, 1991, 11, 29-314 as a method for optimizing the tertiary structure of both receptor proteins and ligands using multiple ligands.
  • the empirical molecular energies of individual ligands and proteins are calculated at the same time, and the average of the gradient of the receptor protein is calculated, so that the receptor protein moves as one three-dimensional structure.
  • the structure of a ligand based on a plurality of protein structures is obtained by using a plurality of molecular structures on the protein side and one molecular structure on the ligand side.
  • the calculation of the protein 1 structure and the ligand 1 structure was performed for the number of protein structures, and the ligand side was calculated in the direction of averaging the calculated potential energy gradients. Power coordinates.
  • the atomic coordinates are moved according to the potential energy gradient of each of the multiple structures, and the ligand structure based on the multiple steric structures of the target protein is obtained.
  • the method of the above empirical molecular energy calculation is not particularly limited, and may be performed by a method known per se.
  • the apricot program developed by the inventors Yamamoto, S., and Umeyama, H., J Chem Phys. 1992; 97: 6730-6736.
  • the apricot-MCSS program is preferably used.
  • an AMBER-type potentior function SJ für, PA Kollman, DA Case, U. Chandra Singh, C. Ghio, G. Alagona, S. Prof eta, Jr., P. Weiner, J. Am Chem. Soc., 1984, 106, 765-784
  • parm89a Rev A as the parameter.
  • other empirical potentials can be used.
  • Equation (24) instead of the constraint potential on the X, Y, and ⁇ coordinates of the C o; atom, the constraint on the torsion angle of the main chain of the target protein shown in Equation (24) is used. By adding a potential function that restricts the torsion angle of the main chain, the initial three-dimensional structure may be prevented from becoming large.
  • ligand molecule is a protein
  • a ligand in which the induced fit on the ligand side is considered from a plurality of three-dimensional structures including the normal mode of the ligand and one three-dimensional structure of the protein in the same manner as described above is used. It is also possible to construct a three-dimensional structure of the dope protein complex.
  • FIG. 6 is a flowchart showing an example of a method for specifying a ligand binding site of a protein and a method for binding a ligand to the obtained binding site to construct a three-dimensional structure of a protein-ligand complex.
  • Step III-10 the binding site between the protein and the ligand is specified (predicted).
  • small molecules such as non-polar solvents
  • a number of water molecules are added around them to create an apparently aqueous solution.
  • the binding site between the protein and the ligand is searched from the behavior of a low molecular compound on the surface of the protein and / or the ligand, for example, a nonpolar solvent.
  • the initial site coordinates of the three-dimensional structure of the protein-ligand complex are determined with reference to the estimated binding sites between the protein and ligand obtained in step III-10.
  • step III-30 water molecules are generated around the initial three-dimensional structure of the protein-ligand complex obtained in step III-20, and the protein is apparently identified using molecular mechanics and molecular dynamics in an aqueous solvent. Refine the three-dimensional structure of the ligand complex.
  • Step 111-10 Identify ligand binding site of protein
  • Identification of the binding site between a protein and a ligand involves the following three steps: III-11: generation of small molecules around the protein and around Z or ligand; 111-12: protein and zo or ligand Of low molecular weight compounds (eg non-polar solvents) by empirical molecular energy calculations (molecular dynamics, molecular dynamics calculations) in aqueous solvents, III-13: Low molecular weight compounds (eg non-polar solvents etc.) ) Can be divided into the determination of the ligand binding site to the protein and the binding site of Z or ligand to the protein.
  • III-11 generation of small molecules around the protein and around Z or ligand
  • 111-12 protein and zo or ligand Of low molecular weight compounds (eg non-polar solvents) by empirical molecular energy calculations (molecular dynamics, molecular dynamics calculations) in aqueous solvents
  • III-13 Low molecular weight compounds (eg non-polar solvents etc.) )
  • Step 111-11 Generation of small molecule around protein and / or around ligand
  • a water molecule is generated around the protein and z or ligand, and then the water molecule around the protein, around the ligand, and around the inside where the low molecular compound can enter is replaced with the low molecular compound.
  • these substitutions may place the low molecular weight compound around the entire periphery thereof, or may place the low molecular weight compound only around the amino acid functional group having hydrophobicity or hydrogen bonding ability.
  • the ligand is a high molecular substance such as a peptide protein
  • a low molecular compound is generated around the ligand, and the behavior analysis of the low molecular compound by empirical molecular energy calculation is performed in the same way as for the protein. Do.
  • the ligand is a substance having a small molecular weight, such as a medicinal and agrochemical molecule, since it is possible to determine which portion is a hydrophobic region, there is usually no need to specify a binding site.
  • the ligand side It is necessary to analyze the binding site of the complex in the same way as the binding site on the protein side to identify the binding site of the complex.
  • the low molecular weight compound examples include, but are not particularly limited to, non-polar solvents such as ethane, cyclopentane, and benzene, hydrogen-bonding solvents such as N-methylacetamide and benzamide, and pharmaceutical and agricultural chemical compounds.
  • non-polar solvents such as ethane, cyclopentane, and benzene
  • hydrogen-bonding solvents such as N-methylacetamide and benzamide
  • pharmaceutical and agricultural chemical compounds examples include, but are not particularly limited to, non-polar solvents such as ethane, cyclopentane, and benzene, hydrogen-bonding solvents such as N-methylacetamide and benzamide, and pharmaceutical and agricultural chemical compounds.
  • nonpolar solvent such as ethane, cyclopentane, and benzene
  • hydrogen-bonding solvents such as N-methylacetamide and benzamide
  • pharmaceutical and agricultural chemical compounds examples include, but are not particularly limited to, non-polar solvents such as ethane
  • the MSAS value in the protein is 30 ° /.
  • Water molecules on the surface within 3.5 A formed by the above amino acid residues may be replaced with a non-polar solvent (benzene).
  • the non-polar solvent (benzene) is less than 1.5 A, the water molecule need not be replaced with the non-polar solvent. Water molecules not replaced by the non-polar solvent are eliminated once.
  • the above-described criterion for replacing a water molecule with a non-polar solvent is an example in the case of using benzene, and does not limit the scope of the present invention.
  • Step III-12 Empirical molecular energy calculations of proteins and / or ligands in aqueous solvent Search for behavior of low molecular weight compounds
  • a non-polar solvent benzene
  • molecular dynamics calculations at a temperature of 300 ° K and about 10 to 20 PS may be performed. This causes diffusion and accumulation of low molecular weight compounds around and inside the protein. By analyzing the state of this diffusion and accumulation, that is, the behavior of the low-molecular compound by the method of Step III-13 described later, The ligand binding site on the protein side and the protein binding site on the ligand side can be specified.
  • the method of the above-mentioned empirical molecular energy calculation is not particularly limited, but it is preferable to use the apricot program developed by the present inventors. It is preferable to use an AMBER type potential function as the empirical potential function. Of course, other experience potentioles can be used.
  • Step III-13 Judgment of ligand binding site from behavior of low molecular weight compound
  • step III-12 For the distribution of low-molecular compounds around the protein and Z or around the ligand determined in step III-12 above, for example, the distribution of non-polar solvents, a cluster analysis was performed on the distribution. Then, the site of the darkening is determined.
  • cluster analysis is a multivariate analysis method in which a given data set in a multidimensional space is clustered according to the similarity (or dissimilarity) between individuals.
  • Clustering from solvents Unlike ordinary cluster analysis, the set of clustered non-polar solvents is not the distance from the center of gravity of the cluster, but the non-polar solvent of the shortest distance within the cluster is checked whether it is within the threshold. By doing so, it is determined whether or not to cluster them.
  • benzene which is a non-polar solvent
  • 6 A was used as the threshold value, but the value is merely an example and does not limit the scope of the present invention.
  • a non-polar solvent benzene
  • they are classified into several clusters.
  • the shape of the clustered nonpolar solvent group can be represented by an ellipsoidal sphere, but by solving the eigenvalue problem of the coordinates, the long and short directions of the cluster can be determined. Docking of the clusters on both the protein side and the ligand side with reference to the longitudinal direction of the ellipsoidal sphere creates several models of the protein-ligand complex. Of course, the complex structure in which the protein and ligand overlap is automatically removed.
  • the docked model is the software described in steps 11-20. Fine-tune the arrangement of proteins and ligands with software.
  • This step can be performed using commercially available software that can input and output files in PDB format.
  • docking is performed by rotating and translating a ligand on a display capable of stereo display. Docking including a simple energy calculation method may be performed.
  • Step III-30 Construction of protein-ligand complex
  • the initial atomic coordinate data of the protein-ligand complex obtained in step III-20 above is obtained by generating water molecules around them under periodic boundary conditions, optimizing the initial three-dimensional structure by molecular mechanics calculations, and then The three-dimensional structure of the protein-ligand complex can be obtained by performing kinetic calculations and removing water molecules from the coordinate locus of the final step.
  • the method of molecular dynamics calculation is not particularly limited, and may be performed, for example, at a temperature of 300 ° K and about 10 to 20 ps.
  • the program to be used is not particularly limited, but it is preferable that the apricot developed by the inventors use an AMBER type empirical force field.
  • the program used and the force field are merely examples, and do not limit the scope of the present invention.
  • a recording medium that stores the atomic coordinates that define the three-dimensional structure of a protein.
  • a three-dimensional structure database of the target protein By storing the atomic coordinates that define the three-dimensional structure of the body in an appropriate recording medium in a predetermined format that can be used by a computer, a three-dimensional structure database of the target protein can be constructed.
  • the database of the present invention may preferably include alignment information of the reference protein and the target protein together with the atomic coordinates. Further, the database may include, if desired, a code number, information on a reference region of a reference protein, information on a target protein, a distance between Ca atoms, and the like.
  • the database also refers to a computer system that writes the above atomic coordinates on an appropriate recording medium and performs a search according to a predetermined program.
  • Suitable recording media include, for example, magnetic media such as floppy disks, hard disks, and magnetic tapes; optical disks such as CD-R0M, M0, CD-R, and CD-RW; and semiconductor memories. Can be.
  • a computer that runs an appropriate program that can design drug molecules such as medical and agricultural chemicals, and is a target protein of the drug molecule obtained by the above method (hereinafter, this may be referred to as “target protein”).
  • Drug molecules antagonists or agonists
  • Drug molecules that interact with the target protein using all or part of the structural coordinates of the target protein, or all or part of the structural coordinates of the database or storage medium on which they are recorded Drug) can be identified, searched, evaluated or designed.
  • Identification, search, evaluation or design of a drug molecule is performed based on the presence or absence of the interaction between the three-dimensional structure coordinates obtained by the method of the present invention and the three-dimensional structure coordinates of the drug molecule, and the degree thereof.
  • identification, search, evaluation, design, and the like of a drug molecule may be simply referred to as molecular design of a drug.
  • any computer that is adjusted so that an appropriate program operates can be used.
  • the storage medium of the computer there can be mentioned, for example, a computer “Program Insight II” manufactured by Accelrys.
  • Ludi created specifically for this purpose, By using programs such as DOCK alone or in combination, drug molecules can be more easily identified, searched, evaluated or designed.
  • the docking evaluation between the protein conformational coordinates and the drug molecule can be performed using, for example, software such as BI0CES manufactured by NEC described in Step I-20 above.
  • any known drug molecule or newly synthesized drug molecule having a new chemical structure can be used as long as the three-dimensional structure can be obtained. It can be used in the method of the invention.
  • the conformational coordinates of the drug molecule may be obtained by any method such as X-ray crystallography ⁇ modeling.
  • the ones for which the three-dimensional structural coordinates have been determined are stored in a suitable database such as CCDC (Cambridge Crystallographic Data Centre: http: //www.cede. Cam. Ac. Uk /) or PDB (Protein Data Bank: http: // It can be obtained from www.rcsb.org/pdb/).
  • the target protein for example, JP 2000- 1 78 by the method described in 20, No. 9 Gazette
  • molecular design of a drug molecule by computer becomes possible.
  • the molecular design method of the present invention is not limited to those using these programs and techniques.
  • the candidate drug for agrochemicals identified, searched, evaluated or designed by the above method can be obtained, for example, by a known chemical synthesis method depending on the properties of the molecule.
  • the drug molecule may be a natural compound or a synthetic compound, and may be a high molecular compound or a low molecular compound.
  • the obtained medicinal and pesticidal scavenger molecules can be further used for pharmacological or in vivo tests in a manner known per se. By examining the activity by a physiological test and selecting a candidate molecule of a medicinal and agrochemical having a desired activity, it is possible to obtain a molecule which can be actually applied as a medicinal and agrochemical.
  • Drug molecules such as pharmaceuticals and agrochemicals selected by the above screening method, for example, drug molecules, can be administered to patients with diseases to be treated by themselves, but one or more of these active ingredients may be administered. May be mixed and administered.
  • a pharmacologically acceptable additive for pharmaceutical preparations and the like for example, sugar-coated tablets, capsules, granules, fine granules, powders, pills, pills, microcapsules, ribosome preparations, troches, sublinguals, liquids, elixirs, emulsions, suspensions, etc.
  • suppositories can be used orally or parenterally as injections, suppositories, ointments, patches, etc., prepared as sterile aqueous or oily liquids.
  • sterile aqueous or oily liquids include, for example, the substance in a unit dosage form required for the practice of generally accepted formulations, together with physiologically acceptable carriers, flavors, excipients, vehicles, preservatives, stabilizers, binders and the like. It can be manufactured using methods well known in the art, such as mixing, filling or tableting.
  • the amount of the active ingredient in these pharmaceutical compositions is such that an appropriate dose in the specified range can be obtained.
  • a pesticide molecule When a pesticide molecule is actually used as a pesticide, it is mixed with a carrier or diluent, an additive, an auxiliary agent, and the like by a known method, and the formulation form (composition) usually used as a pesticide, such as a powder It is used after being prepared into granules, wettable powders, emulsions, aqueous solvents, flocculants and the like.
  • Example 12 Constructing the three-dimensional structure of adrenergic receptor
  • FIG. 7 shows the flowchart.
  • the three-dimensional structure model was constructed using an NEC workstation (model: Express5800 / 120Rc-2, CPU: Pentiumlll 933MHz x 2, OS: Red Hat Linux 6.2J, memory: 1024Mbytes).
  • the targeted amino acid sequence of the 32 adrenergic receptor was obtained from PIR; http: //www-nbrf.georgeto n.edu/pir/, ID: QRHUB2.
  • the amino acid sequence of the] 32 adrenergic receptor was used as the sequence of the target protein, and alignment was performed by PSI-BLAST (Position-Specific Iterated BLAST). At that time, the motif profile used was 892 total sequences of GCRDb; http: ⁇ www.gcrdb.uthscsa.edu /.
  • the amino acid sequence of the ⁇ 2 adrenergic receptor is shown in SEQ ID No. 1.
  • the coordinates of the A chain and the B chain are not complete due to the large defect in each, and the modeling of the 1F88 structure was performed using the modeling program FAMS described in detail in step 1-40 above, and the constructed tertiary structure was converted to 2 adrenaline.
  • the reference protein conformation of the receptor was used.
  • the obtained initial atomic coordinates are optimized by the Cartesian coordinate system, some of the SS bond potential parameters are set to zero, and the Cartesian coordinate system is re-optimized, the dihedral angle coordinate system
  • the eigenvalue 'eigenvector' was obtained by performing the normal vibration analysis method by.
  • parameter using P arm89a Rev A of AMBER Force of non-bonding interaction
  • the cut-off value is 9.0 A inside and 10.OA outside, and 1-4 interaction parameters are non-bonding
  • the interaction was multiplied by 1/2, and the permittivity was distance-dependent ( ⁇ / rA).
  • the Fletcher-Reeves conjugate gradient method was used. After optimizing the obtained initial atomic coordinates in the Cartesian coordinate system, reoptimizing in the Cartesian coordinate system using the same conditions except that the parameters of the bond angle of the SS bond and the dihedral angle are set to zero, A normal vibration analysis method using a dihedral angle coordinate system was performed, and eigenvalues' eigenvectors were obtained.
  • Step 1-30 above set the temperature to 300 ° K, calculate the Co fluctuation for each eigenvalue of 30cm- 1 or less, and calculate the average of the average of the A and B chains of PDB ID: 1F88 (rhodopsin).
  • the ratio of the average to each eigenvalue was obtained.
  • the average ratio was multiplied by the eigenvector belonging to this eigenvalue, and displacement was performed in addition to the atomic coordinates of the reference protein to obtain coordinates defining the three-dimensional structure of the induced fit type reference protein.
  • no induced fit type reference protein Three-dimensional structure and three-dimensional structure of the target protein, i32 adrenergic receptor, were modeled by FAMS from the three-dimensional structure set of the induced fit type reference protein. There is a one-to-one relationship between the three-dimensional structure of the target protein and the three-dimensional structure of the reference protein, and 472 induced fit-type target protein three-dimensional structures and one non-induced fit obtained from the conventional method (no Induced fit) was obtained.
  • Figure 10 shows the three-dimensional structure of the target protein of the no induced fit type constructed from the no induced fit type reference protein obtained above and the eigenvector of the lowest eigenvalue.
  • trypsin 3-trypsin
  • BPTI trypsin 'inhibitor
  • amino acid sequence of trypline used is shown in SEQ ID No. 3, and the amino acid sequence of trypsin inhibitor (BPTI) is shown in SEQ ID No. 4. Since the amino acid number of trypsin is described by the amino acid sequence number of chymotrypsinogen (precursor of chymotrypsin), it has 223 residues of amino acid numbers 16 to 245 as shown below. On the way, amino acid numbers 35, 36, 68, 128, 131, 188, 205, 206, 207, and 208 are missing, but 184, 188, and 221 are duplicated (indicated by 184A, 188A, and 221A).
  • a three-dimensional model of the BPTI complex was constructed, and the position of the active site of the complex was compared with its X-ray crystallography data.
  • Construction of the three-dimensional structure model of the receptor protein-ligand complex is performed by a personal computer made by DEL (model: Dimension XPS B866, CPU: Pentinura III 864MHz, OS: RedHat Linux 6.2J, memory: 512Mbytes).
  • DEL model: Dimension XPS B866, CPU: Pentinura III 864MHz, OS: RedHat Linux 6.2J, memory: 512Mbytes.
  • X-ray crystallographic coordinates of trypsin and BPTI alone, and that of the trypsin-BPTI complex are as shown in Protein Data Bank (PDB); http: //www.rcsb.org/pdb/ , 4PTI (BPTI) and 2PTC (trypsin-BPTI complex) were obtained and used.
  • PDB Protein Data Bank
  • the three-dimensional coordinate system of trypsin and BPTI was superposed by the least square foot from the coordinate system of 1TLD and 4PTI to the coordinate system of 2PTC so that the results of the trypsin-I complex could be easily considered.
  • a hydrogen atom was generated in the heteroatom, and then the initial coordinates were optimized independently.
  • trypsin was subjected to normal frequency analysis in a system not containing BPTI, and the vibration vector for each wavelength was obtained.
  • the BPTI three-dimensional structure was docked to the three-dimensional structure of five trypsins composed of a vibration vector with a long period in time, and MCSS calculation was performed by the apricot-MCSS program to obtain the trypsin-BPTI complex.
  • the three-dimensional structure has been refined.
  • the breakdown of the MCSS calculation is to first optimize the three-dimensional structure of the trypsin-BPTI complex with 1000 steps by molecular mechanics calculation, and then to calculate molecular dynamics at 300 ° K and 10ps with lfs as one step Reduced the three-dimensional structure of the trypsin-BPTI complex.
  • trypsin-one complex system after MCSS calculation The three-dimensional structure of trypsin in the trypsin-one complex system after MCSS calculation is shown in FIG. Looking at the atomic coordinates of trypsin, there were parts where both the main and side chains varied widely, and parts where they did not vary much. Among them, His57, Aspl02 and Glyl93-Aspl94-Serl95 (oxydion hole) on the trypsin side, which is the active site of trypsin, were in good agreement with the main chain and side chain. This can be used to find important sites on the receptor protein side for the ligand binding site. It is a great reference for designing new ligands.
  • Fig. 12 shows the initial three-dimensional structure of the trypsin-BPTI complex before the MCSS calculation
  • Fig. 13 shows the three-dimensional structure of the trypsin-BPTI complex after the MCSS calculation. Indicated with.
  • the active part of the trypsin-BPTI complex On the trypsin side, His57, Aspl02, and Xianion Honore (Glyl93-Aspl94-Serl95) were extracted, and on the BPTI side, only Lysl5 was extracted and displayed.
  • the line shown in black is the three-dimensional structure of the trypsin-BPTI complex by X-ray crystallography
  • the line shown in gray is the initial three-dimensional structure of the complex model assembled by the present invention (No. 12 (Fig. 13) and the result of the precision drawing (Fig. 13).
  • the active sites of trypsin, His57, Aspl02, and oxyanion hole are the main three-dimensional structure before the MCSS calculation (Fig. 12) and the refined three-dimensional structure after the MCSS calculation (Fig. 13). , Including the side chains are in good agreement.
  • the BPTI Lysl5 main chain also has good agreement before and after the MCSS calculation, because its carbonyl oxygen is linked to the Glyl93 and Serl95 peptide H groups of the oxyeon hole by two hydrogen bonds.
  • Lys 15 side chain of BPTI is not in the active pocket of trypsin before MCSS calculation, but enters the active pocket by refining the three-dimensional structure by MCSS calculation, and the trypsin-BPTI complex Good agreement with X-ray crystallography.
  • Example 3 Identification of Binding Sites of Trypsin and Trypsin Inhibitor
  • the binding sites of trypsin and BPTI were identified by the following procedure, and those sites were conjugated.
  • X-ray crystallographic analysis of ⁇ In this example, a system of j3-Trypsin (trypsin) and trypsin.
  • BPTI Inhibitor
  • trypsin is a receptor protein (target protein)
  • BPTI is a ligand. Since BPTI is also a protein, binding sites on the ligand side as well as on the protein side were identified.
  • the trypsin and trypsin-inhibitor (BPTI) amino acid sequences used are as shown in SEQ ID No. 3 and SEQ ID No. 4, respectively.
  • FIG. 14 shows the three-dimensional structure of the trypsin- ⁇ complex of 2PTC by X-ray crystallography.
  • a personal computer manufactured by DEL (model: Dimension XPS B866, CPU: Pentinurall 864MHz, OS: RedHat Linux 6.2J, memory: 512Mbytes) was used.
  • the three-dimensional coordinates of trypsin and BPTI were treated separately, and a hydrogen atom was generated as a hetero atom, and then an aqueous solvent was generated around the hetero atom.
  • trypsin and BPTI benzene molecules were substituted for water molecules within 3.5 A from the surface on which amino acid residues with MSAS of 30% or more were formed. At that time, when the amount of benzene was less than 1.5A, the water molecule was not replaced with benzene. When the substitution with benzene was completed, the water molecule was erased once.
  • both trypsin and BPTI eliminate the water molecules in the periodic box and perform molecular dynamics calculations 10 atomic PS coordinates of trypsin and benzene after PS.
  • BPTI and benzene atomic coordinates were obtained in PDB format.
  • cluster angle sharpening was performed on the distribution of benzene excluding trypsin and BPTI with a threshold of 6 A.
  • the largest clusters were 29 and 11, respectively.
  • the distribution of benzene molecules around trypsin and BPTI is shown in FIGS. 15 and 16 together with trypsin and BPTI, respectively.
  • the method of the present invention is a method capable of accurately constructing a protein structure that is closer to the true state, in particular, the vicinity of binding to a ligand, as compared with the conventional method. Therefore, the method of the present invention is extremely useful for designing medical and agricultural chemical molecules and the like.
  • the method for constructing a three-dimensional structure including induction fitting uses a plurality of coordinate data obtained from normal vibration analysis based on the model three-dimensional structure of the target protein. Structure can be constructed with high accuracy. Particularly, when predicting the three-dimensional structure of the target protein-ligand complex, an important induced fit can be included in the prediction, and a precise model three-dimensional structure of the complex can be constructed taking this into account. In addition, by simulating the three-dimensional structure of a protein-ligand complex using the Multiple Copy Simultaneous Search (MCSS) method, which optimizes the three-dimensional structure of multiple receptor proteins with that of a single ligand, the three-dimensional structure is averaged over time. The resulting three-dimensional structure of the complex is obtained.
  • MCSS Multiple Copy Simultaneous Search
  • the method for constructing a three-dimensional structure of a protein-ligand complex of the present invention is to examine the dispersion of atomic coordinates on the receptor side in a target protein-ligand complex model after MCSS calculation.
  • the relatively small variation in coordinates and the large variation in other sites can be used to design new ligands, which can be used effectively in the design of medicines and agricultural chemicals.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

明細書 誘導適合を含めた 質の立体構造構築方法およびその利用 技術分野
本発明は、 誘導適合を含めたタンパク質の立体構造構築方法およびその利用に 関し、 さらに詳しくは、 参照タンパク質の立体構造とその原子座標を変位させた 複数の立体構造セットを参照タンパク質の立体構造として目的タンパク質の複数 の立体構造セットを作成することよりなるタンパク質の立体構造構築方法、 該立 体構造セットを用いるタンパク質一リガンド複合体の立体構造構築方法、 および タンパク質のリガンド結合部位の特定方法等に関する。
本発明の方法により提供される目的タンパク質の立体構造は、 誘導適合
(induced fit) を含めた立体構造であり、 医農薬の分子設計に極めて有用である。 背景技術
立体構造が既知のタンパク質に関する情報を利用し、 立体構造が未知の目的 タンパク質とのァライメントを得て、 このァライメント情報に基づいて目的タ ンパク質の立体構造を、 コンピュータを用いて作成することが可能であり、 こ の手法は、 通常ホモロジーモデリング(homology modeling)と呼ばれている。 ホ モロジーモデリングにより構築される立体構造の精度は、 近年目覚ましく向上 しているが、 未だ解決すべき問題点も多い。
この方法を用いて受容体タンパク質の立体構造を構築する場合、 リガンドが結 合する空間の確保が不可欠である。 しかしながら、 従来の立体構造構築法ではリ ガンドが存在する空間や結合部位に構築された立体構造の主鎖または側鎖がパッ キングされ、その空間が塞がれてしまい、 リガンドが受容体タンパク質と接触し、 その結合部位に存在できない等の問題が生じていた。
また、 タンパク質一リガンド複合体の立体構造構築方法において、 目的受容体 タンパク質の立体構造が実験的に求まっていない場合、 単にホモロジーモデリン グ (homology modeling)法により構築された受容体タンパク質の立体構造自身に リガンドをドッキングさせ、 分子力場計算や分子動力学計算で、 それらを最適化 することにより受容体タンパク質一リガンド複合体の立体構造を得ていた。また、
Multiple Copy Simultaneous Search (MCSS) 法を用いた研究においても、 受容体 タンパク質側の立体構造には基準振動モードは考慮されておらず、 とくに分子の 時間的にピコオーダーの振動を主とする長周期の熱揺らぎ (以下これを単に「熱揺 らぎ」 または 「分子揺らぎ」 と称することがある)は無視されていた。
更に、 従来から、 遠距離まで影響を及ぼす静電ポテンシャルによるタンパク質 のリガンド結合部位を特定する方法や、 類似化合物に基づいたタンパク質一リガ ンド複合体の立体構造の構築が行われているが、 いずれも信頼性が低く、 類似化 合物の無い場合には信頼性のあるタンパク質一リガンド複合体の立体構造を導く ことは困難であった。 発明の開示
本発明は、 上記の状況を鑑みて、 任意のタンパク質の立体構造を精度良く構築 する方法、 またタンパク質一リガンド複合体の立体構造を精度良く構築する方法 等の提供を目的としてなされたものである。
本発明者等は、 上記課題を達成すべく鋭意検討した結果、 参照タンパク質の原 子座標を基準振動解析法から得られる固有べクトル方向に変位した原子座標を参 照して受容体タンパク質の立体構造を構築すれば、 リガンドが存在する空間や結 合部位に立体構造の主鎖または側鎖がパッキングされてその空間が塞がれること が無く、 受容体タンパク質の立体構造の精度を格段に向上させることができるこ とを見出した。 すなわち、 基準振動モードに基づいて分子の熱揺らぎを考慮した 複数の受容体タンパク質モデルが構築できることを見出した。
また、 かくして構築された受容体タンパク質モデルにドッキングしたリガンド の立体構造を用いて、 Multiple Copy Simultaneous Search (MCSS) 法の分子力学 計算と分子動力学計算を適用して、 分子の熱揺らぎを考慮した精度の高いタンパ ク質一リガンド複合体の立体構造構築が可能であることを見出した。
更に、 本発明者等は、 タンパク質一リガンド複合体には水溶液中での現象を考 えると静電力よりも疎水相互作用の方が重要でないかという結論に達した。 そこ でタンパク質周囲および内部に溶媒を配置し、 分子動力学による溶媒挙動 (溶媒 の拡散■集積) の解析からタンパク質に溶媒が集積する部位または溶媒が拡散し にくい部位が、 リガンド結合部位と一致することを見出した。
本発明はこれらの知見に基づいて成し遂げられたものである。
即ち、本発明の方法により、 ( 1 )参照タンパク質と目的タンパク質とのァライ メントを導き出し、 該ァライメントおよび参照タンパク質の立体構造情報に基づ いて目的タンパク質の立体構造を構築する方法において、 参照タンパク質の立体 構造とその原子座標を変位させた複数の立体構造を参照タンパク質の立体構造と して目的タンパク質の複数の立体構造セットを作成することを特徴とする誘導適 合を含めたタンパク質の立体構造構築方法が提供される。
この発明の好ましい態様により (2 ) 参照タンパク質の原子座標の変位が、 基 準振動解析法により行われることを特徴とする上記(1 ) に記載の方法、 (3 )立 体構造の構築が、 (i)アミノ酸中の C o;原子について参照タンパク質の立体構造か ら座標を取得し、 目的関数を最小化するように C a原子座標を最適化し、 (ii)最 適化された C αの原子座標に主鎖の他の原子を付カ卩して目的関数を最小化するよ うに主鎖の原子座標を最適化し、(iii)最適化された主鎖の原子座標に側鎖の他の 原子を付加し目的関数を最小化するように最適化することにより行われることを 特徴とする上記 (1 ) 又は (2 ) に記載の方法が提供される。
本努明の別の態様により、 (4 ) (i)上記 ( 1 ) 〜 (3 ) のいずれかに記載の方 法により得られる目的タンパク質の複数の立体構造とリガンドとのドッキング操 作を行い、 (ii)目的タンパク質の 1つの構造とリガンドとの構造の経験的分子ェ ネルギー計算を、 目的タンパク質の構造の数だけ行い、その際、 (iii)目的タンパ ク質側は、 複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標 を動かし、 (iv)リガンド側は、 複数個算出されたポテンシャルエネルギー勾配を 平均化した方向にリガンドの原子座標を動かして、(V)目的タンパク質の複数の立 体構造に基づくリガンドの立体構造を求めることを特徴とするタンパク質一リガ ンド複合体の立体構造構築方法が提供される。
この発明の好ましい態様により、 ( 5 )経験的分子エネルギー計算において、目 的タンパク質の初期 C o;原子座標の位置をオプション Harmonic関数として加える 力、 あるいは目的タンパク質の主鎖のねじれ角を拘束するポテンシャル関数を加 えることを特徴とする上記 (4 ) に記載の方法が提供される。
本発明の別の態様により、 (6 ) (i)タンパク質の立体構造の周囲に低分子化合 物を配置し、 (ii)それらの周囲にさらに水分子を配置し、 zk溶媒中での経験的分 子エネルギー計算を行って、タンパク質と低分子化合物との原子座標を得、(iii) 得られた原子座標について、 タンパク質の周囲および内部の、 低分子化合物の挙 動解析を行い、 リガンドの結合部位を判定することを特徴とするタンパク質のリ ガンド結合部位の特定方法、 および、 (7 ) (i)タンパク質およびリガンドの立体 構造の周囲に低分子化合物を配置し、(ii)それらの周囲にさらに水分子を配置し、 7溶媒中での経験的分子エネルギー計算を行って、 タンパク質と低分子化合物と の原子座標を得、 (iii)得られた原子座標について、タンパク質およびリガンドの 周囲および内部の、 低分子化合物の挙動解析を行い、 タンパク質一リガンド複合 体の結合部位を判定することを特 ί敷とするタンパク質一リガンド複合体の結合部 位の特定方法が提供される。
この発明の好ましい態様により、 (8 )低分子化合物の挙動解析が、低分子化合 物を対象としたクラスタ一解析により行われ、 得られたクラスタ一のサイズをリ ガンドの結合可能性部位の順位として結合部位を判定することを特徴とする上記 ( 6 ) または (7 ) に記載の方法が提供される。
本発明の別の態様により、 (9 ) 上記 ( 6 )〜(8 ) のいずれかに記載の方法に より特定したタンパク質のリガンド結合部位にリガンドをドッキングし、 経験的 分子エネルギー計算によりタンパク質一リガンド複合体の立体構造を得ることを 特徴とするタンパク質一リガンド複合体の立体構造構築方法が提供される。
本発明の別の態様により、 (1 0 ) 上記 ( 1 )〜(5 ) および(9 ) のいずれか に記載の方法により得られるタンパク質の立体構造および Ζまたはタンパク質一 リガンド複合体の立体構造を規定する原子座標が記録されていることを特徴とす るコンピュータ読みとり可能な記録媒体、 または、 該原子座標を含むことを特徴 とするデータベースが提供される。
本発明の別の態様により、 (1 1 ) 上記 (1 0 ) に記載の記録媒体またはデー タベースから得られるタンパク質の立体構造を規定する原子座標を用いて、 薬 物候補分子の立体構造との相互作用に基づいて、 目的とする薬物分子を同定、 検索、 評価または設計することを特徴とする薬物分子設計方法が提供される。 図面の簡単な説明
第 1図は、 本発明の誘導適合を含めたタンパク質立体構造構築法の一例を示す フローチヤ一トである。
第 2図は、 ステップ 1-41の C o;原子座標の構築方法を示す図である。 ァライメ ントの一致部分は参照タンパク質から取得し、 無い部分は N, C両端それぞれ重 なった 2残基の重ね合わせの rmsdが最小のものをデータベースから取得する。 第 3図は、 ローカルスペースホモロジ一 (LSH) を示す図である。 図中の T残基 に関する計算では、 網をかけた (灰色の) 残基が考慮される。 図中下のァライメ ントにおける四角で囲った部分が考慮される残基ペアであり、 *のマークがある ところの比率が LSHである。 この場合1^11は5 6 . 2 %である。
第 4図は、 LSH と構造保存部位 (SCRs) にある比率との関係を示す図である。
LSHは目的タンパク質と参照タンパク質との C 原子の重ね合わせから計算され、 SCRsにある比率は目的タンパク質の全残基数に対する SCRs中の残基数である。 第 5図は、 本発明のタンパク質一リガンド複合体の立体構造構築法の一例を示 すフローチヤ一トである。
第 6図は、 本発明のリガンド結合部位の特定方法、 該方法で特定された結合部 位を用いるタンパク質一リガンド複合体の立体構造構築法の一例を示すフローチ ヤートである。
第 7図は、 本発明の誘導適合を含めたタンパク質の立体構造構築方法の実施例 の一例を示すフローチヤ一トである。
第 8図は、 1F88 (口ドプシン)を参照タンパク質として得られた QRHUB2 ( 3 2ァ ドレナリンレセプター)のァライメントを示す図である。 図中、 QRHUB2及び 1F88 の右側の数字は、 各々のタンパク質のアミノ酸配列においてァラィメントの対象 となったァミノ酸数である。 また、 上段の配列は QRHUB2 ( 3 2アドレナリンレセ プター)を示し、 下段の配列は 1F88 (ロドプシン)を示す。 各タンパク質のァミノ 酸配列は 1文字記号で示す。 第 9図は、最低固有値 4. 47cm—1の (=26.4)倍したゆらぎと換算した温度因子を 示す図である。 実線は PDB ID: 1F88の A鎖と B鎖平均の温度因子を換算した Ca 原子のゆらぎであり、点線は基準振動解析法から得られた 4. 47cm— 1の Cot原子位置 ゆらぎを ¾f (=26.4)倍したものである。
第 1 0図は、 目的タンパク質と ± 2 X (±2 X 26. 4)倍した誘導適合 (induced fit) 型参照タンパク質から構築された誘導適合 (induced fit) 型目的タンパク 質の立体構造の一部を示すディスプレイのプリントァゥトの写真である。 中央の 構造が非誘導適合 (no induced fit) 型目的タンパク質である。
第 1 1図は、 MCSS計算後のトリプシン一 BPTI複合体系のトリプシンの立体構造 を示すディスプレイのプリントァゥトの写真である。
第 1 2図は、 MCSS計算前のトリプシン—BPTI複合体の初期立体構造を示すディ スプレイのプリントアウトの写真である。 この図では、 トリプシン一 BPTI複合体 の活性部位に当たる、 トリプシン側では His57、 Aspl02、 ォキシァユオンホール (Glyl93-Aspl94-Serl95)を、 BPTI側では Lysl5だけを抜き出して表示してある。 図中、黒色で表示されている線がトリプシン一 BPTI複合体の X線結晶解析の立体 構造、 灰色で表示されている,線が糸且み立てられた複合体モデルの初期の立体構造 である。
第 1 3図は、 MCSS計算後のトリプシン一 ΒΡΠ複合体の立体構造を示すディスプ レイのプリントアウトの写真である。 この図では、 トリプシン一 BPTI複合体の活 性部位に当たる、 トリプシン側では His57、 Aspl02、 才キシァニオンホール (Glyl93-Aspl94-Serl95)を、 BPTI側では Lysl5だけを抜き出して表示してある。 図中、黒色で表示されている線がトリプシン一 BPTI複合体の X線結晶解析の立体 構造であり、 灰色で表示されている線が組み立てられた複合体モデルの精密化さ れた立体構造である。
第 1 4図は、 トリプシン一 BPTI複合体の X線結晶解析の立体構造座標を示すデ イスプレイのプリントァゥトの写真である。
第 1 5図は、 トリプシン周囲のベンゼン分子の分布を示すディスプレイのプリ ントアウトの写真である。 図中、 黒線の六角形が一番大きなベンゼンクラスター である。 第 1 6図は、 BPTI周囲のベンゼン分子の分布を示すディスプレイのプリントァ ゥトの写真である。図中、黒線の六角形が一番大きなベンゼンクラスターである。 発明を実施するための最良の形態
以下、 本努明を更に詳細に説明する。 本明細書において、 幾つかの用語を使用 する力 特に明記しない限り、 次の意味を有する。
「目的タンパク質」とは、 X線結晶解析や丽 R解析等により完全な立体構造が決 定されておらず、 本発明において立体構造構築の対象となる任意のタンパク質を 意味する。 このタンパク質には、 部分構造は解析されているが完全な立体構造が 得られていないものも含まれる。 本発明においては、 立体構造が未知の受容体タ ンパク質、 酵素等を目的タンパク質とするのが好ましい。 ここで、 X線結晶解析 には、 X線のみならず電子線および中性子線解析等も含まれる。
「受容体タンパク質」 とは、 細胞に存在し、 外来性の物質あるいは物理的刺激 を認識して、 細胞に応答を誘起するタンパク質を意味する。 この受容体タンパク 質は、 リガンドを特異的に結合する能力を有する。 また、 「リガンド とは、 タン パク質と特異的に結合する能力を有する物質を意味する。 リガンドには、 医農薬 分子の様な低分子物質のみならず、 抗体やタンパク質と相互作用をする特定のぺ プチドゃタンパク質等の高分子物質も含まれる。
「参照タンパク質」とは、 その立体構造の詳細が X線結晶解析や NMR解析等によ り既に決定されており、 目的タンパク質の立体構造を規定する原子座標を構築す るために参照するタンパク質を意味する。 また 「ァライメント」 とは、 2種類以 上のタンパク質についてアミノ酸配列の対応関係をつけることを意味する。
「原子座標」 とは、 三次元空間上で立体構造を記述するものである。 それは空 間上のある点を原点とする互いに垂直な三方向の相対的な距離であり、 タンパク 質中に存在する水素原子を除く原子一つあたりに 3個の数字からなるベタトル量 である。
「誘導適合 (induced fit) 」とは、 タンパク質の立体構造は柔軟であり、 リガン ド、 例えば医農薬分子と結合すると、 それとより良く結合するようにタンパク質 の立体構造が変化することを意味する。 「誘導適合 (induced fit) を含めた立体 構造」 とは、 誘導適合により生じるタンパク質の立体構造変化を、 例えば基準振 動解析法で得られる固有べクトルで表せると仮定し、 誘導適合前の立体構造にこ の固有べクトルを加えて生成する立体構造を意味する。
「目的タンパク質一リガンド複合体」とは、 X線結晶解析や NMR解析等により複 合体の完全な立体構造が解明されておらず、 本発明において立体構造の構築対象 となるタンパク質一リガンド複合体を意味する。 もちろんタンパク質として X線 結晶解析や NMR解析等により得られた立体構造を含むことは当然である。 この複 合体には、 部分構造が解析されているが完全な立体構造が得られていないものも 含まれる。 タンパク質に結合したリガンド双方の複合体を意味する。
「Multiple Copy Simultaneous Search (MCSS) 法」とは、 複数リガンドの立体構 造を基にして目的タンパク質一リガンド複合体の立体構造を、 経験的分子エネ/レ ギ一計算法、 すなわち分子力学、 分子動力学計算で受容体タンパク質の立体構造 を求める方法である。 本発明では、 それとは逆に、 複数のタンパク質の立体構造 を 1つのリガンドの立体構造を基に目的とするタンパク質一リガンド複合体の立 体構造を求める方法を意味する。
「経験的分子エネルギー計算」 とは、 分子力学計算と分子動力学計算を意味す る。 両者とも経験ポテンシャルを使った分子エネルギー計算である。
rMSAS (Maximum Solvent Accessibility of Sidechain) J とは、 最大、溶媒接角虫 表面積のことであり、 タンパク質を構成している各ァミノ酸の側鎖の溶媒接触表 面積と、 そのアミノ酸がタンパク質を構成していない単独に存在する状態のとき の側鎖の溶媒接触表面積との比を意味する。 MSASの詳細は、 K. Akahane, Y. Nagano and H. Umeyama, Chera. Pharm. Bull. , 1989, 37 (1) 86 - 92に記載されている。 後記 I〜: IIIの方法は、 ホモロジーモデリングを行うことができる適当なコン ピュータを用いて、 後記方法を実行させる適当なプログラムを利用して実施す ることができる。
I . 誘導適合を含めた立体構造の構築方法
先ず、 本発明の誘導適合を含めた立体構造の構築方法について説明する。
第 1図は、 本発明の誘導適合 (induced fit) を含めた立体構造構築方法の一例 を示すフローチヤ一トである。
ステップ 1-10において、 目的タンパク質の酉己列を入力し、 目的タンパク質の立 体構造の構築に用 ヽる参照タンパク質を選定し、 参照タンパク質の立体構造から 原子座標を収得し、 目的関数を最小化するように原子座標を最適化する。 ステツ プ 1-20において、 最適化した原子座標の基準振動解析法を行う。 ステップ 1-30 において、 固有べクトル方向に参照タンパク質の原子座標を変位し、 その構造を 参照タンパク質に加え、参照タンパク質のセットを作成する。ステップ 1_40にお いて、適当なホモロジ一■モデリング ·プログラム、例えば FAMSによりァライメ ント情報や参照タンパク質セットの各立体構造情報から目的タンパク質の立体構 造のセットを構築する。 かくして、 目的タンパク質の誘導適合 (induced fit) を 含めた立体構造を精度良く構築することができる。 以下、 各ステップについて更 に詳細に説明する。
[- 10:参照タンパク質の初期座標の最適化
先ず、 目的タンパク質の立体構造の構築において、 目的タンパク質のアミノ酸 配列を入力し、 参照するタンパク質 (参照タンパク質) を選定する。 参照タンパ ク質の選定は、 それ自体既知の通常用いられるァライメントソフトウェアを用い て行われる。 この参照タンパク質の原子座標を、 適当な立体構造データベースか ら収得する。 この原子座標には、 アミノ酸の骨格を作る窒素原子等に結合してい る水素原子はなく、ステップ 1-20の基準振動解析法の計算に水素原子が必要な場 合は水素原子を発生させる。 参照タンパク質の原子座標から構成される目的関数 を用いて原子座標を最適化する。
ここで、用いられる目的タンパク質のアミノ酸配列としては、データベースに 登録されているもの、 配列が始めて解析されたもの等の如何なる由来の配列で あってもよい。 用いられるアミノ酸配列データベースとしては、 例えば、 "An Internet review" the complete neuroscientist scours て he World ffide Web. " Bloom FE, Science 1996; 274 (5290): 1104-9に詳細が記載されている GCRDb (The G - protein-coupled Receptor Database): http : //www. gcrdb. uthscsa. ecm/、 GPCRDB : http://www. gpcr. org/7tm/ ExPASy: http: //www. expasy. ch/cgi- bin/sm-gpcr. pl 0RDB: http://ycrai. med. yale. edu/senselab/ordb/、 GeneBank: ftp: //ncbi. nlm. nih. gov/genbank/genomes/ 、 PIR: http: //www - nbrf. georgetown. edu/pir/ (National Biomedical Research Foundation (NBRF) ) Swiss Plot : http://ww . expasy. ch/sprot/sprot-top. html (Swiss Institute of Bioinforraatics (SIB) , European Bioinf omatics Institute (EBI) )、 TrEMBL (URL 及び管理者ともに Swiss Plotと同じ)、 TrEMBLNEff (URL及ぴ管理者ともに Swiss Plot と同じ)、 DAD: ftp:〃 ftp. ddbj. nig. ac. jp (日本 DNAデータバンク)等のデ ータベースに登録されているヒ ト(g. sapiens)、 ショ ウジヨ ウバエ(2. melanogaster)、 線虫 ( . elagans)、 酵母 ( . cerevisiae)、 シロイヌナズナ ( thaliana)等を挙げることができる。 これらのデータベースは単なる例示であり、 タンパク質のァミノ酸配列が登録されているものであれば如何なるデータべ一 スを用いることもできる。
また、 参照タンパク質の原子座標の収得に用いられる立体構造データベース としては、 例えば PDB (Protein Data Bank): http:〃丽. rcsb. org/pdb八 CCDC (Cambridge Crystallographic Data Centre : http://www. ccdc. cam. au. uk/、 SCOP (Structure Classification of Protein): http://scop. rarc— lmb. cam. ac. uk/scop、 CATH- http://www. biochem. ucl. ac. uk/bsm/cath等 挙げ ることができる。 これらの立体構造データベースは、 単独または組み合わせて 用いることことができる。 上記データベース中、 SCOPおよび CATHは、 ドメイン 単位 (タンパク質の立体構造で、 3次構造の単位) に区切った立体構造データ ベースである。
ァライメント用ソフトウェアとしては、 例えば FASTA もしくは PSI-BLAST (Position-Specific Iterated BLAST)を使うのが好ましい。 FASTAは目的配列と 一致度の高い配列を立体構造データベースから探索し、 最終的な目的配列と参 照タンパク質との一致度を e値として算出するプログラムである。 FASTAの詳細 は" Effective protein sequence comparison. " Pearson WR, (1996) Methods Enzymol; 266: 227-58に記載されている。
PSI-BLASTはプロファイルァライメントを行うようにプログラムされている。 PSI -BLASTの 細は、 "Matching a protein sequence against a collection of PSI-BLAST-constructed position-specific score matrices. " Schaffer AA, Wolf YI, Ponting CP, Koonin EV, Aravind L and Altschul SF, Bioinformatics 1999, 12, 1000-11に記載されている。
参照タンパク質の原子座標の最適化を達成するための方法、 座標系、 目的関数 等は特に制限されないが、 例えば、 最大傾斜法、 共役勾配法、 Newton- Raphson法 等で行うのが好ましい。 最大傾斜法は、 数値的に計算された目的関数の 1次微分 を利用し、 原子座標の目的関数に対する最適化を行う。 共役勾配法には、 多くの 方式があるが、 Fletcher-Reeves法 (Fletcher, R., and Reeves, C. M. (1964) Function Minimization by Conjugate Gradients. Comput J, 7 : 149 - 154) 力 s標 準的に用いられており、 目的関数の 1次微:分を利用し、 目的関数が n個の変数の 厳密な二次関数である場合、 多くとも n回の繰り返しにより最適化に到達するこ とが保証されている。 Newton- Raphscm法は、 1次微分に加えて 2次微分を利用し、 初期構造が最適化構造に近い場合に効率が良い。 これらの方法の詳細は、 江口至 洋「タンパク質工学の物理.化学的基礎 (共立出版 1991) 」とその中の文献に記 載されている。
以下、 上記の通り最適化した構造および座標を、 それぞれ最適化構造および最 適化座標として引用する。
[-20:最適 座標の基準振動角析法
上記ステップ 1-10で作成された最適化座標を用いて、その原子座標の変位を行 う。 原子座標の変位は、 基準振動解析法を行い、 各固有値の固有べクトルを得る ことにより行うのが好ましい。 その際、 最適化した自由度の一部を自由度とする 座標系を用いても良い。 この場合、 一部の自由度に対しても最適化が達成されて いる。
ここで、 「基準振動解析法」とは、 ポテンシャルエネルギーを変位の 2次関数と して近似し、 運動方程式を厳密に解き、 最適化構造の周りの微小な振動を解析す る方法を意味する。「固有値」とは、微小な振動の周期を意味する。「固有べクトル」 とは、 振動の方向を意味する。
基準振動解析法の解くべき固有値方程式は、 下記式 (1)または (2)である。 VU ( 2 )
Figure imgf000014_0001
ただし AJ = q 0lj 5UTTU = (0ij) ここで は固有値、 uikは固有べクトルであり、 はクロネッカーのデルタで ある。 Tuと Vuはそれぞれ運動エネルギー Ekとポテンシャルエネルギー Vに関係し、 下記式 (3)および (4)の通りである。
( 3 )
i, j
( 4 )
2
ここで ¾は振動の自由度に対応した座標、 ¾。は最適化座標、 は の時間に よる微分である。 Ajkは集団運動 Qkと個々の原子運動 qjを結ぶ係数であり、 下記 式 (5)の通りである。 q +ΣΑ ( 5 )
ただし、 基準振動 Qk - ¾008^(¾ΐ + Sk である。 ここで、 ockと Skは初期条件で定められる。
上記した基準振動解析法の詳細は、 Wilson, E. B. , Decius, J. C., and Cross, P. C. 1955. Molecular Vibrations. McGraw-Hill.に記載されている。
[-30:新規参照タンパク置の生成
上記ステップ I - 20で得られた固有値、 固有べクトノレを用いて、 ある温度-ある 固有値での Cひ原子の位置ゆらぎを計算する。 固有値の数と等しレ、位置ゆらぎが 得られる。参照タンパク質の C a原子の温度因子を位置ゆらぎに換算し、各 C 原 子について基準振動解析法の位置ゆらぎとの比を計算し、 平均の比を求める。 こ の平均の比は、 使用した固有値の数だけあり、 この比を掛けたこの固有値に属す る固有べクトルを構造最適化前の参照タンパク質の原子座標に加え、 この変位さ せた原子座標からなる立体構造、 即ち、 誘導適合 (induced fit) を含めた立体構 造を参照タンパク質の立体構造の 1つとする。 以下これを、 誘導適合 (induced fit) 型参照タンパク質、 立体構造、 座標として引用する。
平均の比を 2倍して同様に参照タンパク質の誘導適合 (induced fit)型立体構 造を作成する。 固有べクトルには順■逆の方向があり、 固有べクトルに一 1を掛 けた逆方向にも同様に変位させる。 すなわち、 誘導適合 (induced fit) 型には使 用した固有値の数の 4倍だけある。 誘導適合 (induced fit) 型と非誘導適合 (no induced fit)型参照タンパク質の立体構造を参照タンパク質立体構造セットとす る。
ここで、 温度因子と位置ゆらぎの関係は下記式 (6)のとおりである。
D 一 3 x Bi
D' ^ ( 6 )
ここで、 Biは PDBファイルから得られる原子の温度因子であり、 πは円周率、 は位置ゆらぎに相当する。 本発明では C o;原子に関してのみである。
基準振動法から得られる位置ゆらぎと PDBファイルの温度因子を換算した位置 ゆらぎの比は下記式 (7)のとおりである。
Figure imgf000015_0001
ここで νは基準振動解析法から得られる v番目の固有値に対する i番目の原子 の位置ゆらぎである。 本 明では、 C a原子のみに対して行う。
比の平均は下記式 (8)のとおりである。
Figure imgf000015_0002
ここで Nは原子数であり、和は原子に対して行う。 ¾Π±ν番目の固有値に対する 平均の比である。 本発明では、 C a原子に対して行う。 誘導適合 (induced fit) 型参照タンパク質立体構造の原子座標は下記式 (9)お よび(10)のとおりである。
^ = ±Μν χ ν k二 x, y,z ( 9 )
Figure imgf000016_0001
ここで k°は参照タンパク質の原子座標、 k vは V番目の固有値に属する固有べ クトルの成分をあらわす。
ステップ 1-40: 目的タンパク質のモデリング
上記ステップ 1-30で得られた参照タンパク質の立体構造セットを参照して、適 当なホモロジ一■モデリング ·プログラム、例えば FAMSにより目的タンパク質の 立体構造セットを構築する。 参照タンパク質の立体構造の数と同じ数の目的タン パク質の立体構造が構築される。 即ち、 使用した固有値の数の 4倍だけある誘導 適合 (induced fit) 型と非誘導適合 (no induced fit) 型目的タンパク質立体構 造が構築され、 これらを、 目的タンパク質立体構造セット、 すなわち誘導適合
(induced fit) を含めた立体構造とする。
次に、モデリング(立体構造の構築)手法の好適な一例として FAMSの各ステツ プについて説明する。なお、下記のステップ 1-41〜43において記載されている計 算回数、 定数、 カットオフ値等は、 本発明者が最も好ましいと考えているパラメ ータの一例を示すものであり、本発明の範囲を何ら限定するものではない。なお、 FAMS の 糸田 f 、 Koji Ogata and Hideaki Umeyaraa, "An automatic homology modeling method consisting of database searches and simulated anneal ing" Journal of Molecular Graphics and Modeling 18, 258-272, 2000 に記載され ている。
-41: C a原子の初期座標の構築及び最適化
-30からの参照タンパク質セットおよぴァライメント情報を受けて、 参照タンパク質から挿入および欠損のあるアミノ酸残基についての情報をえる。 ァライメントにおいて連続して三残基以上のアミノ酸が対応しているギャップの 無い領域を選び出し、 その領域においては、 これらの残基ペアにおいて、 目的タ ンパク質の Co;原子は参照タンパク質と同一のものを当てはめておく。 Co;原子が 求められなかった場合には、 予め作成してある断片のデ タベースから座標を当 てはめる (第 2図参照)。
ここで、 本明細書において Co;原子とは、 各アミノ酸の骨格の中心となる炭素 原子を意味する。 C/3原子とは、 Ca原子の側鎖側に結合する炭素原子を意味し、 C y原子とは、 原子の側鎖側に結合する炭素原子を意味する。 また、 C原子とは、 力ルポエル基の炭素原子を意味する。
ステップ I - 41(1): Cひ原子のシミュレーテイツドア-一リング法による構築
上記ステツプ 1-41で作成された C a原子はシミュレ一ティッドアニーリングの プロセスを用いて参照タンパク質の座標から構成される関数を用いて最適化され る。 この目的関数は下記式(11)のとおりである。
TT -TJ + 7 + 7 - TI
り Ca—り len し ang 1 pos ^ ^ vdw (l D
ここで Ulenは、 配列上隣の残基および Cys残基のペアの Co:原子間の距離に関 するもので下記式(12)のように設定される。 ひ/ e"
Figure imgf000017_0001
-5.4 (12) ここで i+1は残基 i と残基 i+1の Cひ間距離である。 55はジスルフィド結合 を形成する Cys残基のペア同士の距離である。 と ¾ は定数でありそれぞれ 2 および 5と設定される。
Uangは C α原子の結合角の関数であり下記式(13)のとおりである。
Figure imgf000017_0002
i
ここで (rad)は i, i+1, i+2番目の残基 Cひ原子の角度である。 0。は PDB の X線構造から(100/180) ■ π (rad)と設定される。 Kaは定数であり 1とする。
UD。。は、 C 原子の位置に関する関数であり、 下記式(14)のとおりである。 ひ pos =κ pos
Figure imgf000018_0001
ここで 1 1 · Mが意味する所はノルムであり、 Miは構造を基にしたァライメント上 で構造的に等価な位置にある Cひ原子間の平均距離である。残基 iについて Miの 値が求められないとき、 Mi の値は 10 と設定される。 ここでは、 C a原子の平均 座標であり下記式 (15)のとおりである。
Figure imgf000018_0002
ここで Xjiは j番目の参照タンパク質の i番目の残基の C aの原子座標である。 wjiは、 j番目の参照タンパク質の i番目の残基の重みである。 この重みは目的タ ンパク質の大体の形を決定するため重要なパラメータであるが、 これはローカル スペースホモロジ一 (LSH) と呼ばれる着目部位の 12A以内の空間的近傍の局所 的な値によって決定している (第 3図参照) 。 LSH と構造がよく保存されている 部位 (SCRs: Structural Conserved Regions) に存在する残基のペアの比率との 相関は第 4図に示されているように非常に高い。 これは、 高い LSH値を持つとき は統計的に C o;原子の位置が参照タンパク質構造と比べて 1. OA以内にあること を意味する。
Uvdwは下記式 (16)のとおりである。
ひ vdw = K vdw ( 1 6 )
Figure imgf000018_0003
ここで は 0. 01 (D^. く 3. 2A) と O- OOUD > 3. 2A)と設定され 6 Aをカツ トオフ値とした。
C a原子は式(11)に従って、シミュレ一ティッドアニーリング法を用いて最適化 される。この最適化の段階で c«原子の摂動は 1. oA以内になるように設定する。 またこのアニーリングの段階は全ての 原子について、 100回づっ計算される。 そして、 温度に相当するパラメータは、 25から 0. 5回ごとに 0. 01減らし、 その パラメータは以後一定とした。
この大きな 2つの段階、構造情報の取得と Cひ原子の構築は 10回繰り返され、 最小の目的関数値をもつ Cひ原子の座標が最適解として算出される。
-42:主鎮愿子座標—の構築及び最適化
[-41 (1)の C αの原子座標に主鎖の他の原子を付カ卩し、シミュレーティ ッドア-一リング法によって目的関数を最小化するようにする。まず、 C o;原子の 立体的な重ねあわせを行い、 C aの原子間距離が 2. 5A以下の残基が取り上げられ る。 C o:を除く主鎖の原子座標は C a原子間距離が最小になるように参照タンパク 質の座標から取得しモデル構造とする。
参照タンパク質の中に相当する残基が無い場合、 主鎖の原子座標はデータべ一 ス中の相当する 4残基のタンパク質断片から作成される。 この過程の中で、 残基 iの主鎖原子は i- 1番目から i+2番目までの C α原子間の最小の rmsd値を持つ残 基から選ばれる。 その際 N末端の残基では、 Cひ原子座標の重ね合わせ範囲が i 番目から i+3番目までとなり、 C末端の残基およびそのひとつ前の残基では同様 に i_3番目から i番目までおよび i_2番目から i+1番目までとなる。
主鎖原子の目的関数を元にシミュレ一ティッドアニーリング法によって最適化 される。
目的関数は下記式(17)のとおりである。 ^ main ―し bond +し ang + ^ non-bond +リ +リ DOS + ^ tor + J chi + hydr
( 1 7 )
Ubondは下記式(18)のとおりである。
2
ubond = Kb j (bj - b ) ( 1 8 ) ここで は、標準の結合長でありそれぞれの化学結合の種類によって異なる。
Kbは定数であり 225とする。
Uangは結合角の関数で、 下記式 (19)のとおりである。
Figure imgf000020_0001
ここで 0iは i番目の結合角であり、化学結合の種類によって異なる。 Kaは定数 で 45と設定される。
Unon.bondは非結合の相互作用の関数で、 下記式 (20)のとおりである。
non-bond ―
(20)
Figure imgf000020_0002
ここで と / は定数で原子の種類によって異なる。
Knonは定数で 0.25とし、 カットオフは 8Αとする。
Ussは Cys残基が生成するジスルフィ ド結合の関数で、下記式 (21)のとおりであ る c
Figure imgf000020_0003
ここで KSS CAおよび KSS は定数であり 7.5である。
UD0Sは原子の位置に関する関数で、 下記式 (22)のとおりである。
2
ひ pos 05 X广 ( (22)
.で< 1>は下記式(23)のように与えられる c
Figure imgf000020_0004
式 (22)の <W;Xi>は、 目的タンパク質および参照タンパク質の間の構造の重ね あわせから求める。
Kpsは定数であり 0.3である。 Utorは主鎖のねじれ角のものであり、 下記式 (24)のとおりである。
Utor = ∑ - ?)2 - 2 + - 2 (24) ここで φ i0と i。は Ramachandranマップ上での最も近いねじれ角の Φ 4 および φ1 とする。 また は 0 として cis- Pro残基の場合のみ π (radian)とする。 Kt および Κωは定数であり、 それぞれ 10および 50とする。
Uchiは Cひのキラリティーに関するものであり、 下記式 (25)のとおりである。 2
π (25)
Figure imgf000021_0001
ここで は N- Co;_Cj3-Cで定められるねじれ角であり Kchi は 50とする。
Uhydrはホモ口ガスなタンパク質中で保存された主鎖の水素結合に関するもので、 下記式 (26)のとおり定められる。
N-O 一 2
U hydr = Khydr (Djj 一 2.9) (26)
i,j
水素結合は、 N原子と 0原子の距離が 2.9土 0.5 Aにあるときに設定される。 複数の参照タンパク質中で水素結合があるか否かを判定するときは、 75%以上の 参照タンパク質が存在すると認めた場合に水素結合ありと判定する。 Khydrは定数 であり 0.6である。
次に C/3を含む主鎖原子の最適化がシミュレ一ティッドアニーリングによって 行われる。 このアニーリングの過程で主鎖と C ]3の原子の摂動が初期の位置に対 して 1. OA以内になるようにする。このアニーリングの段階は主鎖と Ci3の原子に 対して 200回行われる。 温度に相当するパラメータは 50もしくは 25から始まり 一回毎に 0.5倍にしてゆき 0.01になるまで続け、 その後一定値とする。
主鎖の立体配置を幅広くサンプリングするために、 本発明の方法では、 好まし くは上記の方法を 6回行い、 最小の目的関数値を持つ主鎖の原子座標を最適解と する。 そして、 温度に相当するパラメータは、 はじめの 2回は 50からスタートし て 3回目から 25からスタートすることとする。 -43:側鎖原子座標の構築及び最適化
側鎖の構築は、 大きく 2段階に分かれており、 「構造保存部位の側鎖構築」 (ス ッテプ I - 43 (1) ) と 「全体の側鎖構築 J (スッテプ I - 43 (2) ) に分けられる。
-43 (1) :構造保存部位の側鏠構築
算出された主鎖原子に対して、 以前の研究における方法を用いてホモ口ガスな タンパク質から側鎖のねじれ角を得る。 この方法の詳細は、 〃The role of played by environmental residues in side-cnam torsional angles witnin homologous families of proteins : A new method of side chain modeling, Ogata K and Umeyaraa H, Prot. Struct. Funct. Genet. 1998, 31, 255 - 369に記載されている。 この方法の中でホモ口ガスなタンパク質中で保存されている側鎖の割合を算出 し、 この情報を元にして側鎖のモデリングを行う。 側鎖の保存された部位の側鎖 の原子座標は固定した主鎖原子に対して置かれる。 例えば、 ホモ口ガスなタンパ ク質中でアルギニン残基の X 1角が保存されていれば、 C y原子の座標を置くこと ができ、 Phe残基で 1と X 2角が保存されていれば、 全ての側鎖原子を置くこと ができる。 式 (17)を用いたシミュレ一ティッドア-一リングの最適化の過程は、 主鎖と C の原子のみ行われて、原子の摂動は 1. 0 A以内となるようにした。 この 主鎖と C ]3の原子のァエーリングの段階は 200回行われる。 そして、 温度に相当 するパラメータは 25からスタートして一回毎に 0. 5倍にしてゆき 0. 01になるま で小さくなるようにする。式 (17)の中の Unn_bndは主鎖原子と部分的に作成された 側鎖原子について行われる。 そのとき側鎖原子の座標は最適化の過程を通じて保 存されるようにする。
構造の情報である 1^と水素結合の N— 0のペアは最適化の過程で用いられる。 主鎖原子の配置を得るために、 上記プロセスを 3回繰り返し、 目的関数の最小の 主鎖原子の座標を算出構造とする。
-43 (2) :全体の側鎖の構鐘
側鎖の構築は固定した主鎖おょぴ C β原子のもとで行う。これは上記した Ogata K and Umeyaraa H, Prot. Struct. Funct. Genet. 1998, 31, 255 - 369に開示され ている研究成果をもって行われ、 それを用いることにより短時間で正確なモデル を与えることができる。 次に主鎖構造は低温におけるモンテ力ノレ口法によって最 適化され、 温度は 0. 001に設定され式 (17)の目的関数 Unn-bndを用い、 全ての主鎖 と側鎖の原子で計算される。 そして、 N、 C a C、 C /3原子の最適化の過程で側鎖 のねじれ角を最適化された状態を保つように側鎖の座標を再配置する。 原子の摂 動は 0. 5A以内とする。 次に側鎖は削除され、 上記の側鎖構築が繰り返される。 このプロセスは 2. 4Aの原子同士のぶっかり合いがなくなり、 且つ N- C a _C ]3 -C のねじれ角が- 120 ± 15° の範囲に収まるまで繰り返される。
-44:最終構造の構築
かくして、 任意の目的タンパク質の非誘導適合 (no induced fit) 型と誘導適 合 (induced fit) 型の立体構造を規定する原子座標を得ることができる。
II. タンパク質一リガンド複合体の立体構造構築方法
次に、 本発明の別の態様であるタンパク質一リガンド複合体の立体構造構築方 法について、 図面を参照して説明する。 第 5図は、 目的とするタンパク質一リガ ンド複合体の立体構造構築方法、即ち誘導適合 (induced fit)を含んだ複合体の立 体構造構築方法の一例を示すフローチヤ一トである。
まず、 ステップ II- 10において、 目的タンパク質のモデリングされた原子座標 を得る。 最適化された参照タンパク質の基準振動解析法を行なうことにより、 基 準振動モードが得られる。 そして固有べクトル方向に主に実験で得られた目的タ ンパク質の原子座標を変位し、 複数の参照タンパク質のセットを作成する。 それ らの座標を参照して目的タンパク質の立体構造をホモロジーモデリング (homology modeling)に り構築する。
ステップ Π- 20で、 得られた目的タンパク質の立体構造に対してリガンドをド ッキングさせる操作を行なう。 ステップ II - 30において、 目的タンパク質のセッ トにドッキングしたリガンドに基づき MCSS 法による経験的分子エネルギー計算 を行ない、 目的とするタンパク質一リガンド複合体の立体構造をシミュレートす る。 かくして得られる目的タンパク質一リガンド複合体の立体構造は、 目的タン パク質の誘導適合 (induce fit) すなわち周期的熱運動 (分子揺らぎ)を含めた立 体構造であり、 医農薬の精度の高い分子設計に用いることができる。
以下、 各ステップについて更に詳しく説明する。 ステップ II- 10 : 目的タンパク質のモデリング
目的タンパク質のモデリングは、 次の 3つのステップ Π- 11 :参照タンパク質 の初期座標の最適化、 Π- 12:最適化座標の基準振動解析、 11-13: 目的タンパク 質のモデリングに分けられる。 このステップは、前記 I - 10〜1_44と同様に行われ る。 かくして、 基準振動解析法の振動モードに基づく立体構造、 すなわち誘導適 合 (induced fit)を含んだ目的タンパク質の立体構造が構築できる。
ステップ II- 20: 目的タンパク質へのリガンドのドッキング
基準振動モードを考慮した目的タンパク質の複数の立体構造モデルに対してリ ガンドのドッキングを行なう。 目的タンパク質のリガンド結合サイトと考えられ る位置にドッキングさせる。 このステップは、 PDB形式のファイルが入出力でき る市販のソフトウエア、 例えば BI0CES (NEC 社製)、 Cerius2 (Accelrys 社製)、 SYBYL (TRIPOS社製)、 HyperChem (Hypercube社製)等を用いて行なう。 一般的には ドッキングはステレオ表示が可能なディスプレイ上でリガンドを回転、 並進して 行なう。 また簡易的エネルギー計算手法を含めたドッキングを行なってもよ 、。 用いるリガンドの結合部位は、 特に限定されず、 既に判明している結合部位、 新たに特定した結合部位のいずれも用いることができる。 リガンドの結合部位が 未知のタンパク質については、 後記 IIIで述べる方法により、 その部位を特定す ることもできる。
ステップ 11-30: 目的タンパク質一リガンド複合体の立体構造の最適化
ステップ 11-20で得られたタンパク質一リガンド複合体構造モデルについて、 目的タンパク質の 1つの構造とリガンドとの構造の経験的分子エネルギー計算を、 目的タンパク質の構造の数だけ行い、 その際、 目的タンパク質側は、 複数の構造 それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、 リガンド側 は、 複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンド の原子座標を動かして、 目的タンパク質の複数の立体構造に基づくリガンドの構 造を求める。
このステップ II- 30は、 例えば Multiple Copy Simultaneous Search (MCSS) 法 により行われ、リガンドにより複数の複合体構造が経験的分子エネルギー計算 (分 子力場法) により同時に最適化され、 それらの原子座標は経験的分子エネルギー 計算 (分子動力学法) により、 構造が、 例えば温度 300° Kで 10PS間緩和され、 さらにその原子座標は分子力場法により最適化されることにより行われる。 もち ろん温度、 時間は計算している対象系によって変わることはある。
MCSS法は、複数のリガンドを用いて受容体タンパク質とリガンド双方の立体構 造を最適化する手法として A. Miranker and M. Karplus (Proteins, 1991, 11, 29-34) により提案されている。 手法としては、個々のリガンドとタンパク質の経 験的分子エネルギー計算を同時に行ない、 受容体タンパク質のグラジェントにつ いては平均をとるため、 受容体タンパク質側は 1つの立体構造として動く。
これに対して、 本発明の方法では、 タンパク質側は複数の分子構造、 リガンド 側は 1つの分子構造を用いて、 複数のタンパク質構造に基づくリガンドの構造を 求めるものである。 この時の経験的分子エネルギー計算において、 タンパク質 1 構造とリガンド 1構造の計算を、 タンパク質構造の数だけ行い、 リガンド側は、 複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原 子座標を動力す。 一方、 目的タンパク質側は、 複数の構造それぞれのポテンシャ ルエネルギー勾配に応じて原子座標を動かし、 目的タンパク質の複数の立体構造 に基づくリガンドの構造が求められる。
上記の経験的分子エネルギー計算の方法は、 特に限定されずそれ自体既知の方 法で行えば良いが、 発明者らが開発した apricot プログラム(Yoneda, S., and Umeyama, H. , J Chem Phys 1992; 97: 6730- 6736)を改良した apricot -MCSSプロ グラムを用いるのが好ましい。 経験的ポテンシャル関数としては AMBERタイプの ポテンシャノレ関数 (S. J. einer, P. A. Kollman, D. A. Case, U. Chandra Singh, C. Ghio, G. Alagona, S. Prof eta, Jr. , P. Weiner, J. Am. Chem. Soc. , 1984, 106, 765-784) を、 パラメ ^"タとしては parm89a Rev Aを用いるのが好ましい。 もちろん他の経験ポテンシャルの使用も可能である。
分子動力学計算では、 通常のエネルギー項の他に C o:原子位置に対する拘束ポ テンシャルを、例えば下記式 (27)のように Harmonic関数として加えることにより、 目的タンパク質の初期立体構造が大きく壌れないようにするのが好ましい。 これ は計算の近似の粗さを補う意味で大切であるが、 拘束ポテンシャルの範囲を主鎖 全体に広げたりしてもよく、 これに限定されるものではない。 ひ
Figure imgf000026_0001
( 2 7 ) ここで Uxyzは目的タンパク質における C «原子位置に掛ける拘束のポテンシャ ルエネルギーで、 Cひのオリジナル座標値が X 0、 更新された座標値が X、 Kxyzが 原子をどの程度拘束させるかのパラメータである。 ここでは Kxyz として 10. 0kcal/raol/A2を用いたが、 一例であるので、 式の形を含めて本発明の範囲を 限定するものではない。
また、 C o;原子の X、 Y、 Ζ座標に対する拘束ポテンシャルの代りに、 式(24) に示す目的タンパク質の主鎖のねじれ角に対する拘束を用いて、 すなわち経験的 分子エネルギー計算において目的タンパク質の主鎖のねじれ角を拘束するポテン シャル関数を加えることにより、 初期立体構造が大きく壌れないようにしてもよ い。
かくして、 目的タンパク質として誘導適合(induced fit)型の立体構造モデルを 使えば、 分子揺らぎを考慮した目的タンパク質一リガンド複合体の原子座標を得 ることができる。
また、 リガンド分子がタンパク質の場合には、 上記と同様の方法で、 リガンド の基準振動モードを含む複数の立体構造とタンパク質の 一立体構造からリガン ド側の誘導適合(induced fit)を考慮したリガンドータンパク質複合体の立体構 造の構築も可能である。
III. タンパク質のリガンド結合部位の特定方法
次に、 本発明の別の態様である、 タンパク質のリガンド結合部位の特定方法に ついて説明する。 第 6図は、 タンパク質のリガンド結合部位の特定方法と、 得ら れた結合部位にリガンドを結合させて、 タンパク質一リガンド複合体の立体構造 を構築する方法の一例を示すフローチャートである。
ステップ III - 10で、 タンパク質とリガンドの結合部位の特定(予測) を行う。 このステップにおいて、 タンパク質およぴ Zまたはリガンドの周囲および内部、 例えば疎水性表面に、 低分子化合物、 例えば非極性溶媒を発生させ、 さらにそれ ら周囲に多数の水分子を追加して見かけ上水溶液中の分子動力学計算を行う。 そ れらの結果に基づき、 タンパク質および/またはリガンド表面の低分子化合物、 例えば非極性溶媒の挙動から、 タンパク質とリガンドの結合部位を検索する。 ス テップ 111-20ではステップ III - 10で得られたタンパク質とリガンドの結合推定 部位を参考にして、 それらをドッキングさせ、 タンパク質一リガンド複合体の立 体構造の初期原子座標を求める。 そしてステップ III- 30ではステップ III- 20で 得られたタンパク質一リガンド複合体の初期立体構造の周囲に水分子を発生させ、 見かけ上水溶媒中の分子力学と分子動力学法を用いてタンパク質一リガンド複合 体の立体構造の精密化を行う。
以下、 各ステップについて更に詳しく説明する。
ステップ 111-10:タンパク質のリガンド結合部位の特定
タンパク質とリガンドの結合部位の特定は、次の 3つのステップ、 III - 11:タ ンパク質周囲および Zまたはリガンド周囲への低分子化合物の発生、 111-12 :タ ンパク質およひゾまたはリガンドの水溶媒中での経験的分子エネルギー計算 (分 子力学、 分子動力学計算) による低分子化合物 (例えば非極性溶媒等) の挙動検 索、 III - 13:低分子化合物 (例えば非極性溶媒等) の挙動から、 タンパク質への リガンド結合部位および Zまたはリガンドのタンパク質への結合部位の判定に分 けられる。
ステップ 111-11:タンパク質周囲および/またはリガンド周囲への低分子化合物 の発生
先ず、 タンパク質および zまたはリガンドの周囲に水分子を発生させたのち、 タンパク質周囲、 リガンド周囲、 ならびに低分子化合物が入り込める内部周囲に ある水分子を低分子化合物で置換する。 その場合、 これらの置換はそれら周囲全 体にわたり低分子化合物を配置してもよいし、 疎水性や水素結合能を有するアミ ノ酸ゃ官能基の周りにだけ低分子化合物を配置してもよい。 ここで、 リガンドが ぺプチドゃタンパク質等の高分子物質である場合には、 リガンド周囲へも低分子 化合物を発生させ、 タンパク質の場合と同様に経験的分子エネルギー計算による 低分子化合物の挙動解析を行う。 リガンドが医農薬分子等の分子量が小さい物質 である場合は、 どの部分が疎水性領域か等の判別できるので、 通常、 結合部位の 特定の必要†生は無い。 しかし、 リガンドが高分子物質である場合は、 リガンド側 の結合部位もタンパク質側の結合部位と同様に解析し、 複合体の結合部位を特定 することが必要である。
低分子化合物としては、 例えば、 ェタン、 シクロペンタン、 ベンゼン等の非極 性溶媒、 N—メチルァセタミド、 ベンズアミド等の水素結合能性溶媒、 あるいは 医農薬化合物でもよく特に限定されない。 だがそれら配向の任意性を考えると、 対象性を有する化合物が好ましい。 非極性溶媒を用いると疎水性部分を有するタ ンパク質やリガンドの結合部位を特定することができる。 また水素結合能性溶媒 である酸アミド基を有する化合物を用いると、酸アミド基と水素結合しうる部分、 すなわち シート構造の露出部分ゃォキシァ-オンホールを含むリガンドの結合 部位を特定することができる。 更に医農薬分子を用いると、 医農薬分子が特異的 に結合しうる部分を特定することができる。
具体的には、 例えばべンゼン等の非極性溶媒をタンパク質の周囲に配置させる 場合は、 タンパク質の中で MSASの値が 30°/。以上のアミノ酸残基により形成され る 3. 5A以内の表面にある水分子を非極性溶媒(ベンゼン) で置換すれば良い。 また非極性溶媒(ベンゼン) 同士が 1. 5A以内になるような場合には水分子の非 極性溶媒への置換は行わなくて良い。 非極性溶媒に置換されなかった水分子は一 回すベて消去する。 上記した水分子の非極性溶媒への置換基準は、 ベンゼンを用 いた場合の一例であり、 本発明の範囲を限定するものではない。
ステップ III- 12:タンパク質および/またはリガンドの水溶媒中での経験的分子 エネルギー計算による低分子化合物の挙動検索
上記ステップ III - 11で作成されたタンパク質(および Zまたはリガンド) と低 分子化合物の原子座標を用いて、 それら周囲に周期境界条件で水分子を発生させ たのち、 経験的分子エネノレギー計算である分子力学計算で立体構造を最適化し、 続いて分子動力学計算を行う。 分子動力学計算が終了したのち、 水分子を除去し てタンパク質 (および Zまたはリガンド) と低分子化合物との原子座標を得る。 例えば、低分子化合物として非極性溶媒 (ベンゼン)を配置した場合は、温度 300° K、 10〜20PS程度の分子動力学計算を行えば良い。 これにより、 タンパク質の周 囲や内部への低分子化合物の拡散や集積が起こる。 この拡散や集積の状態、 即ち 低分子化合物の挙動を、後記ステップ III- 13の方法で解析することにより、タン パク質側のリガンド結合部位、 リガンド側のタンパク質結合部位を特定すること ができる。
上記の経験的分子エネノレギー計算の方法は、 特に限定されないが、 本発明者ら が開発した apricotプログラムを用いるのが好ましい。 経験的ポテンシャル関数 としては AMBERタイプのポテンシャル関数を用いるのが好ましい。 もちろん他の 経験ポテンシャノレの使用も可能である。
ステップ III- 13:低分子化合物の挙動からのリガンド結合部位の判定
上記ステップ III- 12 で求まったタンパク質周囲および Zまたはリガンド周囲 の低分子化合物、 例えば非極性溶媒の分布について、 これを対象としたクラスタ 一解析を行い、 得られたクラスターの大きさからリガンドがタンパク質にドツキ ングしゃすい部位を判定する。
ここで、 クラスター解析とは、 多次元空間において与えられたデータ集合を個 体間の類似度(あるいは相違度)によってクラスター (塊)化する多変量解析法であ る。ここでは 3次元空間における非極性溶媒の重心 (ベンゼンでは 6炭素原子の座 標平均)間同士のユークリッド距離を計算し、閾値以内の距離の非極性溶媒があれ ば、 距離が短い非極†生溶媒同士からクラスター化していく。 そのときクラスター 化された非極性溶媒の集合についても、 通常のクラスター解析と異なり、 クラス ターの重心からの距離ではなく、 その中で最短距離の非極性溶媒同士が閾値以内 であるかどうかを調べることにより、 それらをクラスタ一化するか否かを判定す る。 非極性溶媒のベンゼンの場合、 閾値については 6 Aを用いたが、 その値は単 なる例示であり本発明の範囲を限定するものではない。
例えば非極性溶媒 (ベンゼン) を用いた場合、 それらはいくつかのクラスター に分類されるが、 大きなクラスターほどリガンドゃタンパク質へのドッキング部 位である可能性が高 、と考えられる。 クラスター化された非極性溶媒群はその形 状を楕円球で表現できるが、 座標の固有値問題を解くことにより、 クラスターの 長短方向が求まる。 タンパク質側とリガンド側双方のクラスター同士を楕円球の 長短方向を参考にしてドッキングし、 タンパク質一リガンド複合体のモデルをい くつカ 乍成する。 もちろんタンパク質とリガンドが重なる配置になる複合体構造 は自動的に取り除く。 ドッキングされたモデルはステツプ 11-20で記述したソフ トウェアでタンパク質とリガンド配置の微調整を行う。
ステップ III- 20: タンパク質へのリガンドのドッキング
上記ステップ 111-13で得られた低分子化合物、 例えば非極性溶媒 (ベンゼン) のクラスタリングで大きなクラスターとなったサイト同士をドッキングし、 タン パク質一リガンド複合体構造の初期データとする。 この際、 低分子化合物、 例え ば非極性溶媒 (ベンゼン) データはドッキングに際して除かれる。
本ステップは PDB形式のファイルが入出力できる巿販のソフトウエアを用いて 行なうことができる。 一般的にはドッキングはステレオ表示が可能なディスプレ ィ上でリガンドの回転、 並進等により行なわれる。 また簡易的エネルギー計算手 法を含めたドッキングを行なってもよい。
ステップ III- 30:タンパク質一リガンド複合体の立体構造の構築
上記ステップ III- 20 で得られたタンパク質一リガンド複合体の初期原子座標 データは、 それら周囲に周期境界条件で水分子を発生させたのち、 分子力学計算 で初期立体構造を最適化し、 続いて分子動力学計算を行い、 そして最終ステップ の座標軌跡から水分子を取り除くことによりタンパク質一リガンド複合体の立体 構造が得られる。
分子動力学計算の方法は、特に限定されず、例えば、温度 300° K、 10から 20ps 程度で行えばよい。 用いるプログラムも特に限定されないが、 発明者らが開発し た apricotで、経験力場も AMBERタイプを用いるのが好ましい。 しかし使用プロ グラム、 力場とも単なる例示であり、 本発明の範囲を限定するものではない。 かくして、 タンパク質一リガンド複合体の生成過程が水溶液中であることを考 慮して、水溶媒中での低分子化合物、例えば非極性溶媒の集積、拡散を利用して、 タンパク質とリガンドの疎本性表面を見い出し、 それら同士をドッキングすると いう方法でこれまでより精密なタンパク質一リガンド複合体の原子座標を得るこ とができる。
IV. タンパク質の立体構造を規定する原子座標が記録されている記録媒体、 デ
' ~々ベ1 ~ス
上記方法で得られたタンパク質の立体構造またはタンパク質一リガンド複合 体の立体構造を規定する原子座標を、 コンピュータが利用可能な所定の形式で 適当な記録媒体に格納することにより、 目的タンパク質の立体構造データべ一 スが構築できる。 本発明のデータベースは、 好ましくは、 上記原子座標ととも に参照タンパク質と目的タンパク質のァライメント情報を含んでいても良い。 また、 データベースには、 所望によりコード番号、 参照タンパク質の参照領域 の情報、 目的タンパク質の情報、 C a原子間距離等が含まれる。
本発明においてデータベースとは、 上記原子座標を適当な記録媒体に書き込 み、 所定のプログラムに従つて検索を行うコンピュータシステムをも意味する。 ここで適当な記録媒体としては、 例えば、 フロッピーディスク、 ハードディス ク、 磁気テープ等の磁気媒体; CD-R0M、 M0、 CD- R、 CD-RW等の光ディスク、 半導 体メモリ等を挙げることができる。
V. 薬物の分子設計方法
医農薬等の薬物分子設計を行うことができる適当なプログラムが動作するコ ンピュータで、 上記方法で得られた薬物分子の標的となるタンパク質 (以下こ れを 「標的タンパク質」 と称することがある) の構造座標の全て若しくは一部、 又はそれらが記録されたデータベース若しくは記録媒体の構造座標の全て若し くは一部を使用して、 標的タンパク質と相互作用をする薬物分子 (拮抗薬また は作動薬) を同定、 検索、 評価又は設計等を行うことができる。
薬物分子の同定、 検索、 評価又は設計は、 本発明の方法で得られた立体構造 座標と薬物分子の立体構造座標との相互作用の有無やその程度に基づいて行わ れる。 本明細書において、 薬物分子の同定、 検索、 評価又は設計等を、 単に薬 物の分子設計ということがある。
タンパク質の立体構造座標と薬物候補分子の立体構造座標との相互作用に基 づいて分子設計を行う際に用いられるコンピュータとしては、 適当なプロダラ ムが動作するように調整されているコンピュータであれば特に制限はない。 ま た、 コンピュータの記憶媒体にも特に制限はない。 分子設計に用いるプログラ ムは、例えばアクセルリス(Accelrys)社製のコンピュータ 'プログラム Insight II等を挙げることができる。特に、 この目的のために特別に作成された Ludiや DOCK といったプログラムを単独又は組み合わせて用いることで、 より容易に薬 物分子を同定、 検索、 評価又は設計することができる。 また、 タンパク質の立 体構造座標と薬物分子とのドッキング評価は、 例えば前記ステップ Π- 20 に記 載した NEC社製の BI0CES等のソフトウェアを用いて行うことができる。
ここで、 薬物分子は、 既知のものであっても、 新たに合成された新規な化学 構造を有する薬物分子であっても、 その立体構造が得られるものであれば、 い ずれの薬物分子も本発明の方法で用いることができる。 薬物分子の立体構造座 標は、 X線結晶解析ゃモデリング等のいずれの方法で得られたものでも良い。 3次元構造座標が決定されているものは、 適当なデータベース、 例えば CCDC (Cambridge Crystallographic Data Centre: http: //www. cede. cam. ac. uk/) や PDB (Protein Data Bank: http: //www. rcsb. org/pdb/) 等から収得することが できる。
更には、 標的タンパク質の立体構造を用いて、 例えば特開 2000- 178209号公 報に記載されている方法によっても、 薬物分子を設計することができる。 この 様に、 本発明の方法で得られたタンパク質の立体構造座標を用いることで、 薬 物分子のコンピュータによる分子設計が可能となる。 ただし、 本発明の分子設 計方法は、 これらのプログラムゃ手法を用いるものに限定されるものではない。 薬物の分子設計には、 通常、 概念的に 2つの段階がある。 最初の段階は、 リ 一ド化合物を見つけだすものであり、 次の段階はリ一ド化合物の最適化である。 どちらの段階も、 標的タンパク質の立体構造座標を使用して、 それ自体既知の 方法により行うことができる。 これにより最適な医農薬候補分子を得ることが できる。
VI. 分子設計方法により得られる医農薬候補分子のスクリーニング方法
上記方法により同定、 検索、 評価又は設計された医農薬候補分子は、 その分 子の性質に応じて、 例えばそれ自体既知の化学合成法により得ることができる。 し力 しながら、 薬物分子は、 天然化合物、 合成化合物のいずれでも良く、 また、 高分子化合物、 低分子化合物のいずれでも良い。 得られた医農薬候捕分子は、 更に、 それ自体既知の方法により、 試験管内や生体内における薬理学的または 生理学的試験によりその活性を調べ、 所望の活性を有する医農薬候補分子を選 抜することにより実際に医農薬として応用可能なものを得ることができる。
VII. 医農薬組成物の製造方法
上記スクリーニング方法により選択された医農薬等の薬物分子、 例えば医薬 分子は、 それ自体単独で治療対象となる疾患等の患者に投与することができる が、 これらの有効成分の 1種又は 2種以上を混合して投与することもできる。 また、 薬理学的に許容される製剤用添加物等を用いて該物質を医薬品組成物と して製剤化し、 これを投与するのが好ましい。 例えば、 必要に応じて糖衣を施 した錠剤、 カプセル剤、 顆粒剤、 細粒剤、 散剤、 丸剤、 マイクロカプセル剤、 リボソーム製剤、 トローチ、 舌下剤、 液剤、 エリキシル剤、 乳剤、 懸濁剤等と して経口的に、 あるいは無菌の水性液もしくは油性液として製造した注射剤や、 座剤、 軟膏、 貼付剤等として非経口的に使用できる。 これらは、 例えば、 該物 質を生理学的に認められる担体、 香味剤、 賦形剤、 べヒクル、 防腐剤、 安定剤、 結合剤などとともに一般に認められた製剤実施に要求される単位用量形態で混 和し、 充填又は打錠等の当業界で周知の方法を用いて製造することができる。 これらの医薬組成物における有効成分量は指示された範囲の適当な容量が得ら れるようにするものである。
農薬分子について、 実際に農薬として使用する場合には、 担体若しくは希釈 剤、 添加剤および補助剤等と公知の方法で混合して、 通常農薬として用いられ ている製剤形態 (組成物) 、 例えば粉剤、 粒剤、 水和剤、 乳剤、 水溶剤、 フロ ァプル剤等に調製して使用される。 実施例
以下、 実施例を挙げて本 明を更に具体的に説明するが、 下記の実施例は、 本 発明の具体的な認識を得る一助と見なすべきであり、 本発明の範囲を何ら制限す るものではない。
実施例 1 2アドレナリンレセプターの立体構造の構築
上記 明の実施形態の I - 10〜; [- 40で詳述した方法に従って、次の通りヒ ト由来 β 2アドレナリンレセプターの誘導適合を含めた立体構造を構築した。 第 7図に フローチヤ一トを示す。
立体構造モデルの構築は、 NEC 社製ワーク ステーショ ン (機種: Express5800/120Rc-2, CPU: Pentiumlll 933MHz x 2、 OS : Red Hat Linux 6. 2J、 メモリ: 1024Mbytes) を用いて行った。 目的とした ]3 2アドレナリンレセプターの 了ミノ酸配列は、 PIR; http://www-nbrf. georgeto n. edu/pir/の ID:QRHUB2より 得た。
この ]3 2アドレナリンレセプターのアミノ酸酉己列を目的タンパク質の酉己列とし て PSI- BLAST (Position-Specific Iterated BLAST)によるァライメントを行つた。 その際、 モチーフプロファイルは、 GCRDb ; http:〃 www. gcrdb. uthscsa. edu/の全 配列 892個を用いた。 β 2アドレナリンレセプターのアミノ酸配列を、 SEQ ID No. 1 に示す。
参照するタンパク質の立体構造として、 PDB (http: //www. rcsb. org/pdb/)の ID: 1F88 (口ドプシン)の B鎖の構造を用い、この B鎖に対してのァライメントを得 た。 1F88 (口ドプシン)の B鎖の配列を SEQ ID No. 2に、 ァライメント結果を第 8 図に示す。 1F88 (口ドプシン)の結晶格子中には A鎖及び B鎖よりなるほぼ同一の 立体構造を持つ 2量体があり、 B鎖を参照構造として用いた。 また A鎖と B鎖の 座標にはそれぞれ大きな欠損があり完全ではなく、前記ステップ 1-40で詳述した モデリング■プログラム FAMSを用いて 1F88構造のモデリングを行い、 構築され た立体構造を 2アドレナリンレセプターの参照タンパク質立体構造とした。
PDBファイルおよび FAMSでは適当な残基に水素原子が付加されないため、この 参照タンパク質立体構造の適当な残基に水素原子を発生させ、 基準振動解析法の 入力座標となる初期原子座標を得た。
前記ステップ 1_10〜1- 20のとおり、得られた初期原子座標のデカルト座標系に よる最適化、 SS結合のポテンシャルパラメータの一部をゼロにしてデカルト座標 系で再最適化、 2面角座標系による基準振動解析法を行い、 固有値'固有べクト ルを得た。
この際、 パラメータは AMBERの Parm89a Rev Aを用いた。 非結合相互作用の力 ットオフ値は内側 9. 0 A、 外側 10. OAとし、 1-4相互作用のパラメータは非結合 相互作用のそれに 1/2を乗じたものを使用し、誘電率は距離依存型 (Ι/rA) とし た。 最適化は、 Fletcher- Reeves の共役勾配法を用いた。 得られた初期原子座標 のデカルト座標系による最適化をしたあと、 SS結合の結合角、 2面角のパラメ一 タをゼロにする以外は同じ条件を使用してデカルト座標系で再最適化し、 2面角 座標系による基準振動解析法を行い、 固有値'固有べクトルを得た。
使用した最適化の条件は、 Sumikawa, H. , Suzuki, E. - 1., Fukuhara, K. - 1., Nakajiraa, Y., Kamiya, K. , and Umeyama Η. 1998. Dynamics structure of granulocyte co丄 ony— stimulating factor proteins studied by normal mode analysis : Two domain-type motions in low frequency modes. Chera Pharm Bull 46: 1069-1077 に記載されている方法を用いた。 また、 2面角座標系による基準 振動解析法の詳細は、 No gut i, T. , and Go, Ν. 1983. Dynamics of native globular proteins in terms of dihedral angles. J Phys Soc Jpn 52: 3283-3288およぴ Noguti, T., and Go, N. 1983. A method of rapid calculation of a second derivative matrix of conformational energy for large molecules. J Phys Soc Jpn 52 : 3685- 3690に記載されている方法を用いた。
前記ステップ 1-30のとおり、 温度を 300° Kとし、 30cm— 1以下の各固有値に対 する C o;原子のゆらぎを求め、 PDB ID : 1F88 (ロドプシン) の A鎖と B鎖の平均の 温度因子から換算される C a原子のゆらぎとの比をとり、 各固有値に対する平均 の比を得た。 平均の比をこの固有値に属する固有べクトルに掛けて、 参照タンパ ク質の原子座標に加えて変位を行い、誘導適合 (induced fit) 型参照タンパク質 の立体構造を規定する座標を得た。 同様に固有ベクトルに一 1を掛けた変位、 2 倍した平均の比を固有べクトルに掛けた変位、さらに一 1を掛けた変位を行った。 ただし、 ここで加える固有べクトルは 2面角座標からデカルト座標に変換してあ る。 1つの固有値 ·固有べクトルから 4つの誘導適合 (induced fit) 型参照タン パク質の立体構造セットカ得られる。 用いた 30cm-1以下の固有値の数は 118個で あり、得られた誘導適合 (induced fit) 型の参照タンパク質の数は 472個である。 例として、第 9図に最低固有値 4. 47cm"1の ¾f (=26.4)倍したゆらぎと換算した温度 因子を示す。
前記ステップ 1-40のとおり、 非誘導適合 (no induced fit) 型参照タンパク質 立体構造と誘導適合 (induced fit) 型参照タンパク質立体構造セットから FAMS により目的タンパク質である i3 2 アドレナリンレセプターの立体構造をモデリン グした。 目的タンパク質の立体構造と参照タンパク質の立体構造は 1対 1の関係 にあり、 472個の誘導適合 (induced fit) 型目的タンパク質立体構造と従来の方 法から得られる 1個の非誘導適合 (no induced fit) 型目的タンパク質立体構造 を得た。 例として、 第 1 0図に、 上記で得られた非誘導適合 (no induced fit) 型参照タンパク質から構築された非誘導適合 (no induced fit) 型目的タンパク 質立体構造と最低固有値の固有べクトルを ± 2 XMV (±2 X 26. 4)倍した誘導適合 (induced fit)型参照タンパク質立体構造から構築された誘導適合(induced fit) 型目的タンパク質の立体構造の一部を示す。 図中、 中央の構造が非誘導適合型目 的タンパク質である。 実施例 2 トリプシン単体おょぴトリプシン ·ィンヒビター単体からの複合体の 立体構造の構築
本例では受容体、 リガンド、 受容体一リガンド複合体の X線結晶解析が既知で ある牛膝臓由来の |3 -Trypsin (トリプシン)とトリプシン 'インヒビター(BPTI)の 系を用いて、 本発明のタンパク質一リガンド複合体の立体構造構築方法の検証を 行った。 ここではトリプシンが受容体タンパク質 (目的タンパク質)、 BPTI がリ ガンドである。
用いたトリプリンのァミノ酸配列を SEQ ID No. 3に、 トリプシン ·ィンヒビタ 一 (BPTI)のァミノ酸配列を SEQ ID No. 4に示す。 なお、 トリプシンのァミノ酸番 号は、 キモトリプシノ一ゲン(キモトリプシンの前駆体)のァミノ酸配列番号で記 述するので、次に示す通り、 アミノ酸番号 16〜245までの 223残基になる。途中、 アミノ酸番号 35、 36、 68、 128、 131、 188、 205、 206、 207、 208に欠落が、 184、 188、 221に重複(184A、 188A、 221Aで表示)がある。
lie Val Gly Gly Tyr Thr Cys Gly Ala Asn Thr Val Pro Tyr Gin Val
16 20 25 30
Ser Leu Asn Ser Gly Tyr His Phe Cys Gly Gly Ser Leu lie Asn Ser
34 37 40 45 Gin Trp Val Val Ser Ala Ala His Cys Tyr Lys Ser Gly lie Gin Val
50 55 60 65
Arg Leu Gly Glu Asp Asn lie Asn Val Val Glu Gly Asn Glu Gin Phe
67 69 70 75 80
lie Ser Ala Ser Lys Ser lie Val His Pro Ser Tyr Asn Ser Asn Thr
85 90 95
Leu Asn Asn Asp lie Met Leu lie Lys Leu Lys Ser Ala Ala Ser Leu
100 105 110
Asn Ser Arg Val Ala Ser lie Ser Leu Pro Thr Ser Cys Ala Ser Ala
115 120 125 127 130 132
Gly Thr Gin Cys Leu lie Ser Gly Trp Gly Asn Thr Lys Ser Ser Gly
135 140 145
Thr Ser Tyr Pro Asp Val Leu Lys Cys Leu Lys Ala Pro lie Leu Ser
150 155 160
Asp Ser Ser Cys Lys Ser Ala Tyr Pro Gly Gin lie Thr Ser Asn Met
165 170 175 180
Phe Cys Ala Gly Tyr Leu Glu Gly Gly Lys Asp Ser Cys Gin Gly Asp
183 184A184 185 187 188A188 190
Ser Gly Gly Pro Val Val Cys Ser Gly Lys Leu Gin Gly lie Val Ser
195 200 204 209 210
Trp Gly Ser Gly Cys Ala Gin Lys Asn Lys Pro Gly Val Tyr Thr Lys
215 217 219 220 221A221 225 230
Val Cys Asn Tyr Val Ser Trp lie Lys Gin Thr lie Ala Sse Asn
235 240 245
前記ステップ II- 10〜Π- 30で詳述した方法に従って、次の手順でトリ
BPTI複合体の立体構造モデルを構築し、複合体活性部位の位置をその X線結晶解 析データと比較検討した。
受容体タンパク質一リガンド複合体の立体構造モデルの構築は、 DEL社製パー ソナノレコンピュータ (機種: Dimension XPS B866、 CPU: Pentinura III 864MHz、 OS: RedHat Linux 6. 2J、 メモリ: 512Mbytes)を用いて行った。 トリプシンと BPTI単 独の X線結晶解析の座標、 ならびにトリプシン一 BPTI複合体のそれは、 Protein Data Bank (PDB); http: //www. rcsb. org/pdb/より、 それぞれ 1TLD (トリプシン単 体)、 4PTI (BPTI)、 2PTC (トリプシン一BPTI複合体)を取得して用いた。
トリプシンと BPTIの立体座標系は、 トリプシン一 ΒΡΠ複合体の結果を考察し やすいように 1TLDと 4PTIの座標系を 2PTCの座標系に最小二乗フットによりスー パーィンポーズした。トリプシンと BPTIの立体座標はへテロ原子に水素原子を発 生させたのち、 それぞれ単体での初期座標の最適化を行った。 次にトリプシンは BPTIを含まない系で基準振動解析を行い、波長ごとに対する振動べクトルを求め た。
その中で、 時間的に長周期な振動べクトルからなる 5つのトリプシンの立体構 造に対して、 BPTIの立体構造をドッキングして apricot-MCSSプログラムによる MCSS計算を行い、 トリプシン一 BPTI複合体の立体構造を精密化した。 MCSS計算 の内訳は、 最初に 1000 ステップのトリプシン一 BPTI複合体の分子力学計算によ る立体構造の最適化を行い、 続いて lfsを 1ステップとする 300° K、 10psの分 子動力学計算により トリプシン一 BPTI複合体の立体構造の緩和を行った。分子動 力学計算では複合体の立体構造が大きく崩れないように式 (27)に示した C o:原子 に対する Kxyz = 10. Okcal/mol/A2の拘束条件を加えた。 そして 10ps後の立体 構造について、 トリプシン一 BPTI複合体の座標データを PDBフォーマットで得た。
MCSS計算後のトリプシン一ΒΡΠ複合体系のトリプシンの立体構造を第 1 1図 に示す。 トリプシンの原子座標を眺めて見ると、 主鎖、 側鎖ともに大きくばらつ いている部分と、 それらが余りばらついていない部分があった。 その中でもトリ プシン活性部位であるトリプシン側の His57、 Aspl02、 Glyl93-Aspl94-Serl95 (ォ キシァ二オンホール) 部分は主鎖、 側鎖ともよく一致していた。 このことを利用 するとリガンド結合部位に重要な受容体タンパク質側の部位を見つけられる。 そ れは新たなリガンドをデザィンする上でたいへん参考になる。
MCSS計算前のトリプシン一 BPTI複合体の初期立体構造を第 1 2図に、 MCSS計 算後のトリプシン一 BPTI複合体の立体構造を第 1 3図に、複合体の X線結晶解析 の立体構造とともに示した。 これらの図では、 トリプシン一 BPTI複合体の活性部 位に当たる、 トリプシン側では His57、 Aspl02、 才キシァニオンホーノレ(Glyl93 - Aspl94-Serl95)を、 BPTI側では Lysl5だけを抜き出して表示した。 黒色で表示さ れている線がトリプシン一 BPTI複合体の X線結晶解析の立体構造、灰色で表示さ れている線が本発明により組み立てられた複合体モデルの初期の立体構造 (第 1 2図)と精密ィ匕された結果 (第 1 3図)である。
トリプシンの活性部位である His57、 Aspl02、 ォキシァニオンホールは、 MCSS 計算前の初期立体構造 (第 1 2図)と MCSS計算後の精密化された立体構造 (第 1 3 図)は主鎖、 側鎖を含めてよく一致している。 BPTIの Lysl5主鎖も、 そのカルボ ニル酸素がォキシァェオンホールの Glyl93と Serl95ベプチド H基と 2本の水素 結合で結ばれているため、 MCSSの計算前後でよく一致している。一方 BPTIの Ly s 15 側鎖の方向は、 MCSS計算前はトリプシンの活性ポケットに入っていないが、 MCSS 計算で立体構造を精密化することによりその活性ボケットに入り込み、 トリプシ ン一 BPTI複合体の X線結晶解析によく一致するようになる。
このことは、 目的タンパク質の基準振動モードを含む複数のモデル立体構造を 用いること、 それらにドッキングして得られる目的タンパク質一リガンド複合体 の初期立体構造を MCSS計算によりシミユレーションする手法が、目的とするタン パク質一リガンド複合体の立体構造の構築に有用であることを示している。 実施例 3 トリプシン、 トリプシン ·ィンヒビターそれぞれの結合部位の特定 前記ステップ III- 10〜ΙΠ- 30で詳述した方法に従って、次の手順でトリプシン および BPTIの結合部位をそれぞれ特定し、それら部位を複合体の X線結晶解析デ →と比較検討した。 本例では、 タンパク質一リガンド複合体 X線結晶解析が既 知である牛膝臓由来の j3 -Trypsin (トリプシン)と トリプシン .インヒビター (BPTI)の系を用いた。 ここではトリプシンが受容体タンパク質(目的タンパク質)、 BPTIがリガンドである力 BPTIもタンパク質であるので、タンパク質側だけでな く、リガンド側の結合部位の特定も行った。用いたトリプシンおよびトリプシン - インヒビター (BPTI)アミノ酸配列は、 それぞれ SEQ ID No. 3および SEQ ID No. 4 に示した通りである。
トリプシン一 BPTI 複合体の立体構造座標は、 Protein Data Bank (PDB); http : //www. rcsb. org/pdb/より 2PTCを得た。 2PTCのトリプシン- ΒΡΠ複合体の X 線結晶解析の立体構造を第 1 4図に示す。
タンパク質ならぴにリガンドの結合部位の検索には、 DEL社製パーソナルコン ピュータ(機種: Dimension XPS B866, CPU : Pentinura lll 864MHz、 OS : RedHat Linux 6. 2J、 メモリ: 512Mbytes)を用いた。
トリプシンと BPTIの立体構造座標はそれぞれ別に扱い、ヘテロ原子に水素原子 を発生させたのち、周囲に水溶媒を発生した。次にトリプシンと BPTIの中で MSAS が 30%以上のァミノ酸残基が形成する表面より 3. 5 A以内の水分子をベンゼン分 子と置換した。 その際ベンゼン同士が 1. 5A以内になるときは水分子のベンゼン への置換は行わなかった。 そしてベンゼンへの置換が終了した時点で水分子は 1 回消去した。ベンゼン分子を含むトリプシンと ΒΡΠの立体構造座標はそれら周囲 に水分子を満たした周期ポックスを発生させたのち、 水分子の周期境界条件のも と apricotプログラムによる経験的分子エネルギー計算を実行した。 これらエネ ルギー計算の内訳は最初に 1, 000ステップの分子力学計算よる構造の最適化、 続 いて sを 1ステップとする 300° K、 10psの分子動力学計算によるベンゼン分 子の挙動探索である。 分子動力学計算ではタンパク質の立体構造が大きく崩れな いように全ァミノ酸残基の C a原子に式 (27)による Uxyz=10. Okcal/raol/A2の拘 束条件を加えた。
これら経験的分子エネルギー計算の終了した時点で、 トリプシン、 BPTIともに 周期ボックス内の水分子を消去し、分子動力学計算 10PS後のトリプシンとベンゼ ンの原子座標おょぴ BPTIとベンゼンの原子座標を PDBフォーマツトで得た。それ らからトリプシンならびに BPTI を除いたベンゼンの分布について閾値を 6 Aと したクラスター角罕析をそれぞれ行った。トリプシンと BPTI周囲にそれぞれ置力れ た 94個と 40個のべンゼン分子のうち、一番大きなクラスターはそれぞれ 29個、 11個であった。 トリプシンと BPTI周囲のベンゼン分子の分布を、 トリプシンと BPTIとともに第 1 5図と第 1 6図にそれぞれ示す。
これらの図は、 第 1 4図と同じ方向から見たものである。 図中、 黒線の六角形 が一番大きなベンゼンクラスターである。
第 1 4図〜第 1 6図より、トリプシンと BPTI周囲の一番大きなノ
3S ター同士は方向的によく一致していることが分かる。 すなわちタンパク質の疎水 性残基の周囲にベンゼン分子を配置し、 水溶媒中での分子動力学計算を行い、 ク ラスタ一解析による大きなベンゼンクラスタ一分布を探索することにより、 タン パク質のリガンドへの結合部位候補を特定できることが分かる。 またダラフイツ タス上でこれらのクラスター同士を重ねるようにタンパク質とリガンドをドツキ ングさせると、 タンパク質一リガンド複合体の初期立体配置をラフに予測できる と考えられる。 この初期立体配置は手動あるいは分子設計ソフトで調整すること により、 タンパク質一リガンド複合体の立体配置の有力な候補の 1つになる。 産業上の利用可能性
上記のとおり、 本宪明の方法は、 従来の方法と比べて、 より真に近いタンパク 質の構造、 特にリガンドと結合する近傍を精度良く構築しうる方法である。 した がって、 本発明の方法は医農薬分子の設計等に極めて有用である。
即ち、 本発明の誘導適合を含めた立体構造の構築方法は、 目的タンパク質のモ デル立体構造による基準振動解析から得られる複数の座標データを用いるもので あり、 分子振動を考慮した平均のモデル立体構造が精度よく構築できる。 とくに 目的タンパク質一リガンド複合体の立体構造を予測する場合には、 それに重要な 誘導適合 (induced fit)を含められるので、 それを考慮した精密な複合体のモデ ル立体構造を構築できる。 また複数の受容体タンパク質の立体構造を 1つのリガ ンドのそれで構造最適化させる Multiple Copy Simultaneous Search (MCSS) 法 でタンパク質一リガンド複合体の立体構造をシミュレートすることにより、 経時 的に平均化された複合体の立体構造が得られる。
また、 本発明のタンパク質一リガンド複合体の立体構造構築方法は、 MCSS計 算後に、 目的タンパク質一リガンド複合体モデルにおける受容体側の原子座標の ばらつきを調べるものであり、 活性に重要なサイトは原子座標のばらつきが比較 的小さく、 その他のサイトはそのばらつきが大きいことを利用して、 新たなリガ ンドをデザインすることができ、 医農薬分子設計において、 有効に利用すること ができる。 本発明を詳細にまた特定の実施態様を参照して説明したが、 本発明の精神と 範囲を逸脱することなく様々な変更や修正を加えることができることは当業者 にとつて明らかである。 本出願は、 2001年 1月 19日の日本特許出願 (特願 2001— 01 1 783号) に基づくものであり、 その内容はここに参照として取り込まれる。 また、 本明細書にて引用した文献の内容もここに参照として取り込まれる。

Claims

請求の範囲
1 . 参照タンパク質と目的タンパク質とのァライメントを導き出し、 該ァライメ ントおよび参照タンパク質の立体構造情報に基づいて目的タンパク質の立体構造 を構築する方法において、 参照タンパク質の立体構造とその原子座標を変位させ た複数の立体構造を参照タンパク質の立体構造として目的タンパク質の複数の立 体構造セットを作成することを特徴とする誘導適合を含めたタンパク質の立体構
2 . 参照タンパク質の原子座標の変位が、 基準振動解析法により行われることを 特徴とする請求項 1に記載の方法。
3 . 立体構造の構築が、 (i)アミノ酸中の Cひ原子について参照タンパク質の立体 構造から座標を取得し、 目的関数を最小化するように C a原子座標を最適化し、 (ii)最適化された Cひの原子座標に主鎖の他の原子を付加して目的関数を最小化 するように主鎖の原子座標を最適化し、(iii)最適化された主鎖の原子座標に側鎖 の他の原子を付加し目的関数を最小化するように最適化することにより行われる ことを特徴とする請求項 1又は 2に記載の方法。
4 . (i)請求項 1〜 3のいずれかに記載の方法により得られる目的タンパク質の複 数の立体構造とリガンドとのドッキング操作を行い、
(ii)目的タンパク質の 1つの構造とリガンドとの構造の経験的分子エネルギー計 算を、 目的タンパク質の構造の数だけ行い、 その際、
(iii)目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に 応じて原子座標を動かし、
(iv)リガンド側は、 複数個算出されたポテンシャルエネルギー勾配を平均化した 方向にリガンドの原子座標を動かして、
(V)目的タンパク質の複数の立体構造に基づくリガンドの立体構造を求める ことを特徴とするタンパク質ーリガンド複合体の立体構造構築方法。
5 . 経験的分子エネルギー計算において、 目的タンパク質の初期 C a原子座標の 位置をォプション Harmonic関数として加えるカ あるいは目的タンパク質の主鎖 のねじれ角を拘束するポテンシャル関数を加えることを特徴とする請求項 4に記 載の方法。
6 . (i)タンパク質の立体構造の周囲に低分子化合物を配置し、
(ii)それらの周囲にさらに水分子を配置し、 水溶媒中での経験的分子エネルギー 計算を行つて、 タンパク質と低分子化合物との原子座標を得、
(iii)得られた原子座標について、タンパク質の周囲および内部の、低分子化合物 の挙動解析を行い、 リガンドの結合部位を判定する
ことを特徴とするタンパク質のリガンド結合部位の特定方法。
7 . (i)タンパク質およびリガンドの立体構造の周囲に低分子化合物を配置し、
(ii)それらの周囲にさらに水分子を配置し、 7溶媒中での経験的分子エネルギー 計算を行って、 タンパク質と低分子化合物との原子座標を得、
(iii)得られた原子座標について、タンパク質およびリガンドの周囲および内部の、 低分子化合物の挙動解析を行い、 タンパク質一リガンド複合体の結合部位を判定 する
ことを特徴とするタンパク質一リガンド複合体の結合部位の特定方法。
8 . 低分子化合物の挙動解析が、 低分子化合物を対象としたクラスター解析によ り行われ、 得られたクラスタ一のサイズをリガンドの結合可能性部位の順位とし て結合部位を判定することを特徴とする請求項 6または 7に記載の方法。
9 . 請求項 6〜 8のいずれか 1項に記載の方法により特定したタンパク質のリガ ンド結合部位にリガンドをドッキングし、 経験的分子エネルギー計算によりタン パク質一リガンドの複合体の立体構造を得ることを特徴とするタンパク質一リガ ンド複合体の立体構造構築方法。
1 0 . 請求項 1〜 5および 9のいずれか 1項に記載の方法により得られるタンパ ク質の立体構造および/またはタンパク質一リガンド複合体の立体構造を規定す る原子座標が記録されていることを特徴とするコンピュータ一読みとり可能な記 録媒体。
1 1 . 請求項 1〜5および 9のいずれか 1項に記載の方法により得られるタンパ ク質の立体構造および/またはタンパク質一リガンド複合体の立体構造を規定す る原子座標を含むことを特徴とするデータベース。
1 2 . 請求項 1 0に記載の記録媒体または請求項 1 1に記載のデータベースか ら得られるタンパク質の立体構造を規定する原子座標を用いて、 薬物候補分子 の立体構造との相互作用に基づいて、 目的とする薬物分子を同定、 検索、 評価 または設計することを特徴とする薬物分子設計方法。
PCT/JP2002/000286 2001-01-19 2002-01-17 Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation WO2002057954A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002558170A JP3843260B2 (ja) 2001-01-19 2002-01-17 誘導適合を含めたタンパク質の立体構造構築方法およびその利用

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001-11783 2001-01-19
JP2001011783 2001-01-19

Publications (1)

Publication Number Publication Date
WO2002057954A1 true WO2002057954A1 (fr) 2002-07-25

Family

ID=18878877

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/000286 WO2002057954A1 (fr) 2001-01-19 2002-01-17 Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation

Country Status (2)

Country Link
JP (1) JP3843260B2 (ja)
WO (1) WO2002057954A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005083616A1 (ja) * 2004-02-24 2005-09-09 In-Silico Sciences, Inc. リガンド探索装置、リガンド探索方法、プログラム、および記録媒体
JP2007219760A (ja) * 2006-02-15 2007-08-30 Fujitsu Ltd ドッキングシミュレーションプログラム、該プログラムを記録した記録媒体、ドッキングシミュレーション装置、およびドッキングシミュレーション方法
JP2007536618A (ja) * 2004-05-06 2007-12-13 サーノフ コーポレーション 結合部位を同定するためのコンピュータによるタンパク質探索法
JP2013232126A (ja) * 2012-04-27 2013-11-14 Fujitsu Ltd 計算支援プログラム、計算支援装置、および計算支援方法
CN107480429A (zh) * 2017-07-21 2017-12-15 清华大学深圳研究生院 化合物的3d展示方法和系统
JP2018503171A (ja) * 2014-11-25 2018-02-01 インリア・インスティテュート・ナショナル・ドゥ・ルシェルチェ・アン・インフォマティック・エ・アン・アートマティックInria Institut National De Recherche En Informatique Et En Automatique 分子構造の入力セットのための相互作用パラメータ
WO2019235567A1 (ja) * 2018-06-06 2019-12-12 株式会社日立製作所 タンパク質相互作用解析装置及び解析方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996013785A1 (fr) * 1994-10-31 1996-05-09 Akiko Itai Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996013785A1 (fr) * 1994-10-31 1996-05-09 Akiko Itai Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NOBUHIRO GO: "Amino san chikan niyoru rittai kozo henka oyobi sodo tanpakushitsu no rittai kozo no yosoku gijutsu no kaihatsu", KINOSEI TANPAKUSITSU NO KAISEKI, SHUSHOKU, MOHI GIJUTSU NO KAIHATSU NI KANSURU KENKYU (DAI 2KI SHOWA 61 TO 63NENDO) SEIKA HOKOKUSHO, August 1989 (1989-08-01), pages 89 - 101, XP002953192 *
NOBUHIRO GO: "II. Computer de tanpakushitsu bunshi o miru", JAPANESE SCIENTIFIC MONTHLY, vol. 41, no. 9, 15 September 1988 (1988-09-15), pages 716 - 723, XP002953193 *
RAREY M. ET AL.: "The particle concept: placing discrete water molecules during protein-ligand docking predictions", PROTEIN: STRUCTURE, FUNCTION AND GENETICS, vol. 34, no. 1, 1 January 1999 (1999-01-01), pages 17 - 28, XP002950545 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005083616A1 (ja) * 2004-02-24 2005-09-09 In-Silico Sciences, Inc. リガンド探索装置、リガンド探索方法、プログラム、および記録媒体
US8036831B2 (en) 2004-02-24 2011-10-11 In-Silico Sciences, Inc. Ligand searching device, ligand searching method, program, and recording medium
JP2007536618A (ja) * 2004-05-06 2007-12-13 サーノフ コーポレーション 結合部位を同定するためのコンピュータによるタンパク質探索法
JP2007219760A (ja) * 2006-02-15 2007-08-30 Fujitsu Ltd ドッキングシミュレーションプログラム、該プログラムを記録した記録媒体、ドッキングシミュレーション装置、およびドッキングシミュレーション方法
JP2013232126A (ja) * 2012-04-27 2013-11-14 Fujitsu Ltd 計算支援プログラム、計算支援装置、および計算支援方法
JP2018503171A (ja) * 2014-11-25 2018-02-01 インリア・インスティテュート・ナショナル・ドゥ・ルシェルチェ・アン・インフォマティック・エ・アン・アートマティックInria Institut National De Recherche En Informatique Et En Automatique 分子構造の入力セットのための相互作用パラメータ
CN107480429A (zh) * 2017-07-21 2017-12-15 清华大学深圳研究生院 化合物的3d展示方法和系统
CN107480429B (zh) * 2017-07-21 2020-07-03 清华大学深圳研究生院 化合物的3d展示方法和系统
WO2019235567A1 (ja) * 2018-06-06 2019-12-12 株式会社日立製作所 タンパク質相互作用解析装置及び解析方法
JPWO2019235567A1 (ja) * 2018-06-06 2021-07-01 株式会社日立製作所 タンパク質相互作用解析装置及び解析方法
JP6995990B2 (ja) 2018-06-06 2022-02-04 株式会社日立製作所 タンパク質相互作用解析装置及び解析方法

Also Published As

Publication number Publication date
JP3843260B2 (ja) 2006-11-08
JPWO2002057954A1 (ja) 2004-09-16

Similar Documents

Publication Publication Date Title
Skolnick et al. MONSSTER: a method for folding globular proteins with a small number of distance restraints
JP3669704B2 (ja) 三次元構造データベースから新規リガンド化合物を検索する方法
US7092825B1 (en) Protein engineering
Mannhold et al. Molecular Modeling: Basic Principles and Applications
JP4315960B2 (ja) タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法
JP2002536301A (ja) タンパク質モデリングツール
US20070020642A1 (en) Structural interaction fingerprint
JP2002523057A (ja) タンパク質の機能を予測するための方法およびシステム
Kroemer Molecular modelling probes: docking and scoring
Preißner et al. Dictionary of interfaces in proteins (DIP). Data bank of complementary molecular surface patches
US20070134662A1 (en) Structural interaction fingerprint
US20030228624A1 (en) Molecular docking methods for assessing complementarity of combinatorial libraries to biotargets
WO2002057954A1 (fr) Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation
Moon et al. 3D database searching and de novo construction methods in molecular design
AU780941B2 (en) System and method for searching a combinatorial space
JP4314128B2 (ja) タンパク質立体構造と誘導適合を利用したリガンド探索方法
Brylinski et al. Is the protein folding an aim-oriented process? Human haemoglobin as example
Durojaye et al. Potential therapeutic target identification in the novel 2019 coronavirus: insight from homology modeling and blind docking study
So et al. Evaluation of designed ligands by a multiple screening method: Application to glycogen phosphorylase inhibitors constructed with a variety of approaches
Cai et al. SHEF: a vHTS geometrical filter using coefficients of spherical harmonic molecular surfaces
Gadhe et al. Binding site exploration of CCR5 using in silico methodologies: A 3D-QSAR approach
JP3747048B2 (ja) 三次元構造データベースから新規リガンド化合物を検索するためのデータベースの作成方法
Sun Reduced representation approach to protein tertiary structure prediction: statistical potential and simulated annealing
JP4118680B2 (ja) タンパク質の立体構造構築方法
Goodarzi et al. Modeling of 2-pyridin-3-yl-benzo [d][1, 3] oxazin-4-one derivatives by several conformational searching tools and molecular docking

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2002558170

Country of ref document: JP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase