WO2003056462A1 - Appareil de prediction d'un site d'interaction, procede de prediction d'un site d'interaction, programme et support d'enregistrement associes - Google Patents

Appareil de prediction d'un site d'interaction, procede de prediction d'un site d'interaction, programme et support d'enregistrement associes Download PDF

Info

Publication number
WO2003056462A1
WO2003056462A1 PCT/JP2002/013833 JP0213833W WO03056462A1 WO 2003056462 A1 WO2003056462 A1 WO 2003056462A1 JP 0213833 W JP0213833 W JP 0213833W WO 03056462 A1 WO03056462 A1 WO 03056462A1
Authority
WO
WIPO (PCT)
Prior art keywords
prediction
fragment structure
frustration
interaction site
fragment
Prior art date
Application number
PCT/JP2002/013833
Other languages
English (en)
French (fr)
Inventor
Seiji Saito
Original Assignee
Celestar Lexico-Sciences, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico-Sciences, Inc. filed Critical Celestar Lexico-Sciences, Inc.
Priority to US10/500,006 priority Critical patent/US20050067848A1/en
Priority to EP02792061A priority patent/EP1460560A4/en
Publication of WO2003056462A1 publication Critical patent/WO2003056462A1/ja

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the present invention relates to an interaction site prediction device, an interaction site prediction method, a program, and a recording medium, and more particularly to an interaction site prediction device that predicts an interaction site based on frustration of a local site, It relates to site prediction methods, programs, and recording media.
  • the conventional interaction site analysis method registers a primary sequence specific to an interaction site, which is known in advance, in a motif database or the like, and predicts the interaction site using the information. Therefore, it was not possible to analyze interaction sites that had not been discovered so far. Therefore, it was discovered until now When using bioinformatics technology to predict unknown interaction sites on a combi- ter, it is necessary to use a completely different method, but an effective method has not yet been established.
  • the native three-dimensional structure of a protein is shaped so that interaction between amino acids is as frustrated as possible.
  • the energy surface of the protein is designed in a funnel shape toward the entire structure (native structure) without frustration (foldingfunne1).
  • the native structure is a structure with little frustration, but the frustration is completely eliminated due to the complexity of interaction between elements, the degree of freedom, the evolutionary process, etc. is not.
  • the funnel-shaped energy surface of the protein which is the product of evolution, is not isotropic in nature, and there are large and small directions of frustration (with anisotropy).
  • Anisotropicfu nn e 1). This indicates that, in terms of structure, local structures include large and small frustrated structures.
  • the local structural part having a large frustration is a structural part sacrificed for stabilizing the entire structure, and this part has to take a distorted structure for stabilizing the whole structure. It is in a situation where it cannot be obtained, indicating that it is an unstable site in the overall structure.
  • protein interaction is a process of further stabilization by the interaction of two proteins with stable overall structures.
  • proteins A and B interact, changes in the structure of a part of protein A and the structure of a part of protein B occur. happen and join.
  • the local structure which is stable locally and overall, does not need to be further stabilized.
  • a part that is stable as a whole but unstable when viewed locally It is conceivable that the part of the component is stabilized by binding to other proteins and the like, and the whole is further stabilized by binding. That is, it is considered that a locally unstable structural region is relatively likely to be a protein interaction site. Prediction of a locally unstable site from the primary sequence in this way may make it possible to identify candidates for an interaction site.
  • the three-dimensional structure of a protein is uniquely determined from sequence information. This means that there is some correlation between the array space and the structure space.
  • comparing the size of the array space and the structure space it can be said that the array space is larger. Because, from an evolutionary point of view, even if the sequence changes slightly, the structure does not seem to change much. In other words, the structure is evolutionarily more conservative than the sequence.
  • the literature 1 states that the local structure is restricted to a specific biased structure by the local sequence, so the structural space is reduced, and that the structure is similar to the structure of the protein close to the sequence It discloses that an array profile is obtained by multiple alignment, and a short distance from a query array is obtained.
  • Reference 2 also states that if there is a correlation between the fragment structure and sequence, a limited number of structure candidates can be extracted from the fragment sequence tendency, and the structure is clustered using two structural indices.
  • the sequence is calculated using the distance of frequencyprofi 1 e, and the cluster creation is actually performed by searching for similar structures from similar sequences and clustering them. It is disclosed to create a cluster of fragments.
  • the partial sequence partial structure cluster 1 is used to predict a partial structure having a high correlation with the sequence, but the correlation strength (the certainty that a similar sequence is the structure) is used. It is thought that it is possible to identify locally stable sites (strongly correlated sites) and unstable sites in the overall structure (from the viewpoint of correlation between sequence and structure).
  • This cluster can also be categorized in terms of data set, subsequence length, cluster size, etc.
  • the part having a strong correlation between the partial sequence and the partial structure may be a part where the structure of the part in the whole structure is determined only by the partial sequence (that is, a part which is stable in the whole structure). It can be said that it is high.
  • the weakly correlated portion is a site whose structure is not determined only by its partial sequence (that partial structure is determined in the overall structure).
  • candidates for local sites with high frustration include those where the correlation between the partial sequence and the partial structure is weak, those where the results with various clusters are highly confident, After performing folding 'simulation, some parts may have a structure that is different from the predicted initial structure, or may be inconsistent with the surrounding local structure.
  • the prediction results of various fragment structure prediction methods can be used. By looking at the difference from the actual structure, it will be possible to find a more frustrated local site (a site with a high probability of becoming an interaction site).
  • the present invention provides an interaction site prediction device, an interaction site prediction method, and a program that can effectively predict an interaction site by finding a frustrated local site in the primary sequence information of a protein. It aims to provide, and recording media. Disclosure of the invention
  • An interaction site prediction apparatus comprises: an input means for inputting primary sequence information of a target protein; and a fragment structure of the protein from the primary sequence information of the protein.
  • a fragment structure prediction program executing means for executing a fragment structure prediction simulation of the primary sequence information input by the input means with respect to a fragment structure prediction program for predicting the fragment structure; Prediction means for comparing the fragment structure prediction results of the prediction program; and frustration calculation for calculating the frustration of the local portion of the primary sequence information of the target protein based on the comparison results by the prediction result comparison means.
  • Means, and interaction site prediction means for predicting an interaction site of the target protein based on the frustration of the local portion calculated by the flash rate calculation means.
  • the primary sequence information of the target protein is inputted, and the fragment structure prediction simulation of the primary sequence information inputted to the fragment structure prediction program for predicting the fragment structure of the protein from the —next sequence information of the protein. Then, the fragmentation prediction results of the fragment structure prediction program are compared, and based on the comparison results, the fractionation of the local part of the primary sequence information of the target protein is calculated, and the calculated fractionation of the local part is calculated. Since the interaction site of the target protein is predicted by the shion, the interaction site can be effectively predicted by finding a frustrated local site in the primary sequence information of the protein.
  • An interaction site prediction apparatus comprises: input means for inputting primary sequence information of a target protein; stereostructure data obtaining means for obtaining three-dimensional structure data of the target protein; and a primary sequence of the protein.
  • a fragment structure prediction program execution means for executing a fragment structure prediction simulation of the primary sequence information input by the input means with respect to a fragment structure prediction program for predicting a fragment structure of the protein from information;
  • the frust of the local part of the primary sequence information of the target protein Frustration calculation means for calculating the fraction, and the frust And an interaction site prediction unit for predicting an interaction site of the target protein based on the fractionation of the local portion calculated by the calculation unit.
  • the primary sequence information of the target protein is input, the three-dimensional structure data of the target protein is obtained, and a fragment structure prediction program that predicts the fragment structure of the protein from the primary sequence information of the protein is used.
  • the simulation of fragment structure prediction of the input primary sequence information is performed, the fragment structure prediction result of the fragment structure prediction program is compared with the acquired three-dimensional structure data, and the primary sequence of the target protein is determined based on the comparison result. Frustration of the local part of the information is calculated, and the interaction site of the target protein is predicted by the calculated local fraction, so that the prediction result of the fragment structure prediction program and the actual By observing the difference from the fragment structure, it is possible to more clearly show frustrated local sites (interactions).
  • the interaction site prediction apparatus is the interaction site prediction apparatus according to the above, wherein the confidence level information setting step sets confidence level information indicating the reliability of the fragment structure prediction program with respect to the fragment structure prediction result.
  • the frustration calculation means calculates the frustration of the local part based on the certainty information set by the certainty information setting means and the comparison result. .
  • certainty information indicating confidence in the fragment structure prediction result of the fragment structure prediction program is set, and the frustration of the local part is calculated based on the set certainty information and the comparison result. Therefore, by increasing the weight of the fragment structure prediction result data by a program with high confidence information (that is, high simulation accuracy), it is possible to reflect the confidence in the simulation result in the frustration calculation. become able to.
  • the present invention also relates to an interaction site prediction method, and
  • the interaction site prediction method comprises the steps of inputting the primary sequence information of the target protein and inputting the fragment structure prediction program for predicting the fragment structure of the protein from the primary sequence information of the protein by the above input step.
  • a fragment structure prediction program execution step for executing the fragment structure prediction simulation of the primary sequence information; and a prediction result comparison step of comparing the fragment structure prediction result of the fragment structure prediction program by the fragment structure prediction program execution step.
  • a frustration calculation step of calculating the frustration of the local portion of the primary sequence information of the target protein based on the comparison result obtained by the prediction result comparison step; and the frustration calculation step of calculating the frustration of the local portion calculated by the frustration calculation step.
  • Hula Stre Characterized in that it comprises a interaction site prediction step of predicting the interaction site of a protein of the above objects by Chillon.
  • the primary sequence information of the target protein is input, and the fragment structure prediction simulation of the primary sequence information input to the fragment structure prediction program for predicting the fragment structure of the protein from the primary sequence information of the protein Is executed, the fragment structure prediction results of the fragment structure prediction program are compared, and based on the comparison result, the local part of the primary sequence information of the target protein is calculated for frustration, and the calculated local part frustration is calculated. Since the interaction site of the target protein is predicted, the interaction site can be effectively predicted by finding a frustrated local site in the primary sequence information of the protein.
  • An interaction site prediction method includes an input step of inputting primary sequence information of a target protein, a three-dimensional structure data obtaining step of obtaining three-dimensional structure data of the target protein, and a primary sequence of the protein.
  • a fragment structure prediction program executing step for executing a fragment structure prediction simulation of the primary sequence information input in the input step with respect to a fragment structure prediction program for predicting a fragment structure of the protein from the information;
  • a prediction result comparison step for comparing the fragment structure prediction result of the fragment structure prediction program in the structure prediction program execution step with the three-dimensional structure data acquired in the three-dimensional structure data acquisition step.
  • the primary sequence information of the target protein is input, the tertiary structure data of the target protein is obtained, and a fragment structure prediction program that predicts the fragment structure of the protein from the primary sequence information of the protein is used.
  • the simulation of fragment structure prediction of the input primary sequence information is performed, the fragment structure prediction result of the fragment structure prediction program is compared with the acquired three-dimensional structure data, and the primary sequence of the target protein is determined based on the comparison result. Frustration of the local portion of information is calculated, and the interaction site of the target protein is predicted based on the calculated frustration of the local portion. Therefore, the prediction results of the fragment structure prediction program and the actual fragmentation of the target protein are calculated.
  • the interaction site prediction method according to the next invention is the interaction site prediction method according to the above, wherein the confidence structure information setting method sets confidence information indicating the confidence of the fragment structure prediction program with respect to the fragment structure prediction result.
  • a step of calculating the frustration of the local portion based on the certainty information set in the certainty information setting step and the comparison result. I do.
  • the present invention also relates to a program.
  • the program according to the present invention comprises: an input step of inputting primary sequence information of a target protein; and a fragment structure prediction program for predicting a fragment structure of the protein from the primary sequence information of the protein.
  • a fragment structure prediction program executing step of executing a fragment structure prediction simulation of the primary sequence information input in the input step in response to the input step, and a fragment structure prediction result of the fragment structure prediction program by the fragment structure prediction program execution step
  • a frustration calculation step of calculating a frustration of a local portion of the primary sequence information of the target protein based on the comparison result obtained by the prediction result comparison step; and a frustration calculation.
  • the primary sequence information of the target protein is input, and the fragment structure of the primary sequence information input to the fragment structure prediction program that predicts the fragment structure of the protein from the primary sequence information of the protein Execute the prediction simulation, compare the fragment structure prediction results of the fragment structure prediction program, calculate the frustration of the local portion of the primary sequence information of the target protein based on the comparison result, and calculate the frustration of the calculated local portion. Since the interaction site of the target protein is predicted by the shion, the interaction site can be effectively predicted by finding a local site having frustration in the primary sequence information of the protein.
  • a program according to the next invention comprises: an input step of inputting primary sequence information of a target protein; a three-dimensional structure data obtaining step of obtaining three-dimensional structure data of the target protein; A fragment structure prediction program for causing a fragment structure prediction program for predicting a fragment structure to execute a fragment structure prediction simulation of the primary sequence information input in the input step; A fragment structure prediction result of the fragment structure prediction program, a prediction result comparison step of comparing the three-dimensional structure data acquired in the three-dimensional structure data acquisition step, and a comparison result in the prediction result comparison step.
  • a frustration calculation step of calculating a frustration of a local portion of the primary sequence information of the target protein, and an interaction of the target protein by the frustration of the local portion calculated by the frustration calculation step The method is characterized by causing a computer to execute an interaction site prediction method including an interaction site prediction step of predicting a site.
  • a fragment structure prediction program that inputs primary sequence information of a target protein, obtains three-dimensional structure data of the target protein, and predicts a fragment structure of the protein from the primary sequence information of the protein.
  • the fragment structure prediction result of the fragment structure prediction program is compared with the acquired three-dimensional structure data, and the primary sequence of the target protein is determined based on the comparison result. Frustration of the local part of the information is calculated, and the interaction site of the target protein is predicted based on the calculated frustration of the local part.
  • the result of the fragment structure prediction program and the actual fragment structure of the target protein By seeing the difference with Site with a high probability of being an interaction site).
  • the program according to the next invention is the program according to the above, further comprising a confidence information setting step of setting confidence information indicating confidence for the fragment structure prediction result of the fragment structure prediction program;
  • the calculation step the frustration of the local part is calculated based on the certainty information set in the certainty information setting step and the comparison result.
  • the present invention relates to a recording medium, and the recording medium according to the present invention is characterized by recording the program described above.
  • the program described above can be realized using a computer by causing a computer to read and execute the program recorded on the recording medium. Similar effects can be obtained.
  • FIG. 1 is a principle configuration diagram showing a basic principle of the present invention
  • FIG. 2 is a block diagram showing an example of a configuration of the present system to which the present invention is applied
  • FIG. FIG. 4 is a diagram illustrating an example of information stored in a database 106a.
  • FIG. 4 is a flowchart illustrating an example of main processing of the system according to the present embodiment.
  • FIG. FIG. 6 is a flowchart showing an example of a three-dimensional structure data acquisition process of the present system in an embodiment.
  • FIG. 6 is a flowchart showing an example of a frustration execution process executed by the frustration calculation unit 102 e of the present system.
  • Fig. 7 is a diagram showing an example of a display screen of the interaction site prediction result displayed on the output device 114 of the interaction site prediction device 100.
  • FIG. 1 is a principle configuration diagram showing the basic principle of the present invention.
  • the present invention generally has the following basic features. That is, the present invention provides a method for predicting an interaction site using a fragment structure cluster, a method for predicting an interaction site from a fragment structure prediction result, and a method for predicting an interaction site based on differences in prediction results of various fragment structure predictions. It is predicted that the site where the difference in the prediction result of the fragment structure appears is the stress site with high frustration in the whole structure and the partial structure, and the structural stress site (relatively structurally unstable) ) Is characterized by predicting that it may be a site that interacts with others.
  • the basic principle of the present invention will be described.
  • a user inputs target sequence data 10 as primary sequence information of a target protein to the interaction site prediction apparatus of the present invention.
  • the input of the target sequence data 10 may be performed, for example, by the user selecting primary sequence information registered in an external database such as SWISS-PROT, PIR, or TrEMBL. You can directly enter the desired primary sequence information.
  • the interaction site prediction apparatus of the present invention provides target sequence data 10 input to fragment structure prediction programs 20 a to 20 d for predicting the fragment structure of the protein from the primary sequence information of the protein.
  • the fragment structure prediction program 20a to 20d executes a fragment structure prediction simulation using the method disclosed in Reference 1 or Reference 2, a threading method, an ab initio method, or the like. Execute.
  • the interaction site prediction apparatus of the present invention compares the fragment structure prediction results 30a to 30d of the fragment structure prediction programs 20a to 20d (60). That is, the execution results of the respective prediction programs corresponding to the target array data 10 are juxtaposed and compared (30a to 30d).
  • the interaction site prediction apparatus of the present invention calculates the turbulence of the local part of the primary sequence information of the target protein based on the comparison result (70).
  • a local part that predicts a different fragment structure in each prediction result data (30a to 30b) is extracted from the comparison result, and the frustration of that part is calculated.
  • Existing fragment structure prediction programs 20a to 20d basically make predictions by looking at some local sequences in the primary sequence information, but the fragment structure is related to the overall structure of the protein. Therefore, the fragment structure prediction result often deviates in a part where consistency between the whole and the local part is not obtained, that is, in a local part where the frustration is large. Therefore, it can be assumed that the brass tracing is large for a local part where the prediction results are different in a plurality of programs.
  • the frustration calculation method may be, for example, to increase or decrease the frustration according to the number of fragment structure prediction programs that output different prediction result data, or to calculate an average value of certainty of each structure of different prediction results.
  • the frustration may be increased or decreased according to the dispersion value, etc., and the amino acid sequence of that portion is determined by the amount of energy using a method such as molecular mechanics or molecular dynamics, and the amount of the energy is used to perform frustration. May be calculated.
  • the interaction site prediction device of the present invention predicts the interaction site of the target protein based on the calculated local portion frustration (80). That is, for example, a local part (61) where frustration exceeding a certain threshold exists is predicted as an interaction site.
  • the interaction site prediction apparatus of the present invention obtains the three-dimensional structure data 40 of the target protein when the three-dimensional structure data of the target protein is registered in an external database such as a PDB or SCOP, and performs the prediction. Used in comparing results. That is, the three-dimensional structure data 40 actually taken by the target protein is compared with the prediction result data 30a to 30d of the prediction program.
  • the frustration is calculated for a part where the actual three-dimensional structure data 40 and the prediction result data 30a to 30d of the prediction program are different.
  • the three-dimensional structure data of the protein is known, that is, if the three-dimensional structure data is registered in an existing PDB, the overall structure of the protein is known.
  • the frustration may be increased or decreased according to the number of fragment structure prediction programs that output prediction result data different from the actual three-dimensional structure data 40.
  • the interaction site prediction apparatus of the present invention sets certainty information 50 indicating certainty for the fragment structure prediction result data 30 a to 30 d of the fragment structure prediction program 20 a to 20 d. . That is, the simulation accuracy of the fragment structure prediction program 20a to 20d is set based on actual three-dimensional structure data and the like.
  • the interaction site prediction device of the present invention calculates the frustration of the local portion based on the set certainty factor information and the comparison result. That is, by increasing the weight of the fragment structure prediction result data by a program with high reliability information (that is, high simulation accuracy), it is possible to reflect the reliability of the simulation result in the frustration calculation.
  • the present invention analyzes the result of the structure prediction in each method and the confidence in the structure, and finds that the partial sequence ⁇ partial structure has a weak correlation, or that the result of various clusters has a high confidence.
  • the score for the candidate site is calculated so as to have a high frustration with respect to the above, etc., and based on the calculated result, sites having a high possibility of being an interaction site can be scored and extracted in order.
  • FIG. 2 is a block diagram showing an example of the configuration of the present system to which the present invention is applied, and conceptually shows only a portion related to the present invention in the configuration.
  • the system consists of an interaction site prediction device 100, an external database of sequence information and three-dimensional structure, and a homologous system.
  • An external system 200 that provides an external program such as search and fragment structure prediction is communicably connected via a network 300.
  • the network 300 has a function of interconnecting the interaction site prediction device 100 and the external system 200, and is, for example, the Internet.
  • the external system 200 is interconnected with the interaction site prediction device 100 via the network 300, and provides the user with an external database on sequence information, three-dimensional structure, and the like, and It has a function to provide a website for executing external programs such as homology search, motif search, and fragment structure prediction.
  • the external system 200 may be configured as a WEB server, an ASP server, or the like, and the hardware configuration thereof is generally determined by a commercially available workstation, an information processing device such as a personal computer, and its attached devices. May be configured.
  • the functions of the external system 200 are controlled by a CPU, a disk device, a memory device, an input device, an output device, a communication control device, and the like in the hardware configuration of the external system 200, and a program for controlling them. Is achieved.
  • the interaction site prediction device 100 is generally connected to a control unit 102 such as a CPU, which controls the entire interaction site prediction device 100 as a whole, a communication line, and the like.
  • Communication interface 104 connected to a communication device (not shown) such as a router, and input / output control interface 10 connected to an input device 112 and an output device 114 8, and a storage unit 106 for storing various databases and tables (predicted result database 106a to protein structure database 106c).
  • a network 300 via a wired or wireless communication line such as a dedicated line for a communication device such as a router.
  • various databases and tables stored in the storage unit 106 are storage means such as a fixed disk device, and are used for various processing.
  • the prediction result database 106a is a prediction result information storage unit that stores information on a prediction result of the fragment structure prediction program and the like.
  • FIG. 3 is a diagram showing an example of information stored in the prediction result database 106a.
  • the information stored in the prediction result database 106a includes target sequence data that is primary sequence information (amino acid sequence information) of the target protein and target sequence data obtained from the protein structure database.
  • target sequence data that is primary sequence information (amino acid sequence information) of the target protein
  • target sequence data obtained from the protein structure database.
  • the three-dimensional structure data and the prediction result data of each fragment structure prediction program are associated with each other.
  • the certainty factor information database 106 b is a prediction result information storage unit that stores certainty factor information indicating the certainty factor for the fragment structure prediction result data of the fragment structure prediction program.
  • the standard value of the accuracy of the simulation result for example, when the simulation accuracy, which is the coincidence rate between the fragment structure prediction result and the actual three-dimensional structure data is 60%
  • the standard value is If the accuracy is higher, the confidence value may be increased according to the accuracy, and if the accuracy is lower than the standard value, the confidence value may be decreased according to the accuracy.
  • the protein structure database 106 c is a database that stores three-dimensional structure data of proteins.
  • the protein structure database 106c may be an external protein structure database accessed via the Internet, and may copy these databases, store the original sequence information, and furthermore, It may be an in-house database created by adding information such as annotation information.
  • the communication control interface unit 104 controls communication between the interaction site prediction device 100 and the network 300 (or a communication device such as a router). That is, the communication control interface unit 104 has a function of communicating data with another terminal via a communication line.
  • an input / output control interface 108 controls the input device 112 and the output device 114.
  • the output device 114 in addition to a monitor (including a home television), a speaker can be used (hereinafter, the output device will be described as a monitor).
  • the input device 112 a keyboard, a mouse, a microphone, or the like can be used.
  • the monitor also realizes the pointing device function in cooperation with the mouse.
  • the control unit 102 has an internal memory for storing a control program such as an OS (Operating System), a program defining various processing procedures and the like, and required data. With these programs and the like, information processing for executing various processes is performed.
  • the control unit 102 is functionally conceptually composed of a target sequence input unit 102 a, a fragment structure prediction program execution unit 102 b, a fragment structure prediction program 102 c, and a prediction result comparison unit 102 d.
  • a frustration calculation unit 102 e an interaction site prediction unit 102 f, a three-dimensional structure data acquisition unit 102 g, and a confidence information setting unit 102 h.
  • the target sequence input section 102a is an input means for inputting primary sequence information (target sequence data) of the target protein.
  • the fragment structure prediction program execution unit 102 b is a fragment structure prediction program execution unit that executes a fragment structure prediction simulation of the primary sequence information (target sequence data) input to the fragment structure prediction program by the input unit. is there.
  • the fragment structure prediction program 102c is a fragment structure prediction program for predicting the fragment structure of a protein from the primary sequence information of the protein.
  • the prediction result comparison unit 102 d includes a prediction result comparison means for comparing the fragment structure prediction results of the fragment structure prediction program, and a fragment structure prediction program of the fragment structure prediction program. This is a prediction result comparison unit that compares the measurement result with the three-dimensional structure data acquired by the three-dimensional structure data acquisition unit. Further, the frustration calculating unit 102 e calculates a frustration of a local portion of the primary sequence information (target sequence data) of the target protein based on the prediction result by the comparison means. Calculation means and frustration calculation means for calculating frustration of a local part based on the certainty information set by the certainty information setting means and the comparison result.
  • the interaction site prediction unit 102f is an interaction site prediction unit that predicts an interaction site of a target protein based on local frustration calculated by the frustration calculation unit.
  • the three-dimensional structure data acquisition unit 102 g is a three-dimensional structure data acquisition unit that acquires three-dimensional structure data of a target protein.
  • the certainty information setting unit 102h is a certainty information setting unit that sets certainty information indicating certainty with respect to the fragment structure prediction result of the fragment structure prediction program. The details of the processing performed by these units will be described later.
  • FIG. 4 is a flowchart showing an example of main processing of the present system in the present embodiment.
  • the interaction site prediction apparatus 100 allows the user to input the primary sequence information (target sequence data) of the target protein by the processing of the target sequence input unit 102a (step SA-1). ).
  • the interaction site prediction apparatus 100 acquires the three-dimensional structure data of the target sequence data input by the user by the processing of the three-dimensional structure data acquisition unit 102g (step S A-2).
  • step SA-2 the three-dimensional structure data acquisition unit 102 g
  • the details of the executed three-dimensional structure data acquisition process will be described with reference to FIG.
  • FIG. 5 is a flowchart showing an example of a three-dimensional structure data acquisition process of the present system in the present embodiment.
  • the three-dimensional structure data acquisition unit 102 g determines whether or not the target sequence data has been registered with reference to the protein structure database 106 c (step SB-1).
  • step SB-1 if the target sequence data is registered in the protein structure database 106c, the three-dimensional structure data acquisition unit 102g outputs the three-dimensional target sequence data from the protein structure database 106c.
  • the structure data is acquired and stored in a predetermined storage area of the prediction result database 106a (step SB-2).
  • Step SB-1 if the target sequence data is not registered in the protein structure database 106c, the three-dimensional structure data acquisition unit 102g outputs a sequence similar to the target sequence data.
  • the three-dimensional structure data acquisition unit 102 g uses, for example, a program for determining homology between sequences to obtain the target sequence data and a protein having a known structure registered in the protein structure database 106 c. Then, it is determined whether there is sequence data having high homology (which may correspond to a part of the target sequence data) by comparing with the sequence data corresponding to the sequence data.
  • step SB-3 if the three-dimensional structure data of a protein having a sequence similar to the target sequence data exists in the protein structure database 106c, the three-dimensional structure data acquisition unit 102g The structure data is stored in a predetermined storage area of the prediction result database 106a (step SB-4).
  • the three-dimensional structure data for the part where the three-dimensional structure data exists is stored in the prediction result database 106a.
  • step SB-3 if the three-dimensional structure data of the protein having a sequence similar to the target sequence data does not exist in the protein structure database 106c, Ends the three-dimensional structure data acquisition processing.
  • the interaction site prediction apparatus 100 causes the fragment sequence prediction program execution unit 102b to execute the target sequence data on one or more fragment structure prediction programs 102c (step SA — 3). That is, the fragment structure prediction program execution unit 102b converts the target sequence data into a predetermined format, or adds predetermined header information or the like to the target sequence data, for example. After matching the input format of each fragment structure prediction program 102c, the fragment structure prediction program 102c is executed.
  • the fragment structure prediction program 102c may be a program existing inside the interaction site prediction device 100, or may be an external program of the external system 200 that can be executed remotely via the network 300. It may be.
  • the fragment structure prediction program execution unit 102b may obtain the fragment structure by any of the following methods.
  • genes X and Y of one species are similar to genes Z of other species genes, for example, the first half is similar to X, and the second half is similar to Y, then one This is an analysis method that thinks that the gene Z was separated into X and Y, and that X and Y are likely to interact.
  • Topology 'fingerprint method Extract the parameters called topo 1 ogyprint (corresponding to the coefficients of the energy function in the structure) of the structure of protein A using the internal and external properties of the structure of protein A, distance map, etc. It is a method of performing alignment by applying it.
  • motifs for example, PROSITE, Pfam, etc.
  • a module is an amino acid sequence of about 15 residues that takes a compact structure in a globular protein, and it is said that introns correspond well to the boundaries of modules. This is a method of extracting a pattern of amino acid sequence from the module structure and performing a search using the pattern as a key to perform structural prediction. Characteristic amino acid sequence similarities extracted from functionally related modular structures are thought to indicate similarities in function between these proteins.
  • Evolutionary trace me thod When given the three-dimensional structure of a protein and the multiple alignment of its orthologue, the evolution of the sequence changes the substrate binding site and It is a method of predicting the site of interaction with another protein.
  • HMM method Homo mouth jeep mouth file method
  • sequence A When there is a certain sequence A, there are related proteins such as its family and ortholog, and when those are aligned, a profile matrix is created for sequence A or one of its families. This method aligns this with sequence B (or a profile of sequence B that did the same for sequence B). According to this method, rather than the alignment between sequence A and sequence B, You can search for farther relationships.
  • this information is used to create a substitution matrix of a structure-sequence sequence such as BLOS UM, which is more sensitive than conventional ones.
  • a substitution matrix of a structure-sequence sequence such as BLOS UM, which is more sensitive than conventional ones.
  • the present invention is not limited to these methods, and any method for predicting the fragment structure may be used.
  • the fragment structure prediction program execution unit 102b stores the fragment structure prediction result, which is the simulation result of each fragment structure prediction program 102c, in a predetermined storage area of the prediction result database 106a. (Step SA-4).
  • the interaction site prediction device 100 executes the fragment structure prediction program 1002c for the target sequence data stored in the prediction result database 106a.
  • Compare the fragment structure prediction results step SA-5. That is, the prediction result comparison unit 102d compares the fragment structure prediction results of each fragment structure prediction program 102c from the beginning to the end of the target sequence data.
  • step SA-2 if the fragment structure prediction program execution unit 102b can acquire three-dimensional structure data corresponding to the target sequence data, that is, the prediction result database 106a stores the target sequence data in the prediction result database 106a. When the three-dimensional structure data is stored, the three-dimensional structure data is compared with the fragment structure prediction result of each fragment structure prediction program 102c.
  • the interaction site prediction device 100 calculates the frustration score of the local portion of the target sequence data by the processing of the frustration calculation unit 102e (step SA-6).
  • FIG. 6 is a flow chart showing an example of the frustration execution processing executed by the frustration calculation section 102 e of the present system.
  • the calculation method of the frustration score by the frustration calculation unit 102 e is, for example, that the result differs for a local portion where a fragment structure prediction program outputs a different fragment structure prediction result.
  • the score may be increased or decreased according to the number of fragment structure prediction programs, or the frustration may be increased or decreased according to the average value or variance value of the confidence in each structure of different prediction results, and Regarding the local part where the fragment structure prediction program outputs different fragment structure prediction results, it is possible to calculate the amount of energy for the amino acid sequence using a method such as molecular mechanics or molecular dynamics and calculate the frustration using the amount of energy.
  • a method such as molecular mechanics or molecular dynamics
  • the frustration calculation unit 102 e may calculate a high frustration score for a portion where the three-dimensional structure data and the fragment structure prediction result of the prediction program are different (step SC-2). .
  • the score may be increased or decreased according to the number of fragment structure prediction programs that output fragment structure prediction results different from the three-dimensional structure data.
  • the frustration calculation unit 102 e refers to the certainty factor information database 106 b and refers to the certainty factor information setting unit 102 h.
  • the confidence information of 2c may be obtained, and the frustration score may be calculated based on the confidence information (step SC-3). That is, the frustration calculation unit 102 e assigns a high weight to the fragment structure prediction result of the fragment structure prediction program 102 c with high simulation accuracy, and calculates a frustration score.
  • the confidence information setting unit 102h compares the fragment structure prediction results of each fragment structure prediction program 102c with the three-dimensional structure data, and compares the fragment structure prediction programs 102c with each other. Calculate the accuracy (matching rate) of the fragment structure prediction results. Then, the confidence information setting unit 102h sets the average value of the accuracy of each fragment structure prediction program 102c as standard confidence information (for example, 1), and sets the standard value for the accuracy higher than the average value.
  • standard confidence information for example, 1
  • a higher value eg, a number greater than 1
  • the standard confidence level e.g., a number less than, 1
  • the confidence information setting unit 102h may set the confidence information of each fragment structure prediction program 102c for each amino acid (residue) in each sequence. That is, the confidence level information of the fragment structure prediction program 102c may be set for each amino acid in the sequence for the sequence prediction result by each fragment structure prediction program 102c (for example, in the sequence Regarding the first amino acid, program A has a certainty information of the a structure of 1.5, a certainty information of the b structure of 0.7, a certainty information of the c structure of 1.1, and so on. .
  • the certainty factor information setting unit 102h may set the reliability information of each fragment structure prediction program 102c for each structure. That is, some fragment structure prediction programs 102 c have high accuracy or low accuracy with respect to a specific structure. Therefore, the confidence information of the fragment structure prediction program 102 c is determined for each structure. (For example, in program A, certainty information of a structure is 1.5, certainty information of b structure is 0.7, and certainty information of c structure is 1.1 etc) .
  • the interaction site prediction device 100 uses the interaction site prediction unit 102 f to perform the interaction among the target sequence data based on the calculated frustration score of the local portion. Predict a local part to be a part (step SA-7). That is, the interaction site prediction unit 102 f predicts, for example, a local portion, which is a score of the frustration exceeding a certain threshold value, as the interaction site.
  • the interaction site prediction device 100 outputs the interaction site prediction result of the sequence data to the output device 114 (step S A-8).
  • FIG. 7 is a diagram showing an example of a display screen of the interaction site prediction result displayed on the output device 114 of the interaction site prediction device 100.
  • the display screen of the interaction site prediction result includes, for example, a display area MA-1 of the sequence information of the target sequence data, a display area MA-2 and M of a local portion predicted as the interaction site.
  • A-3 the display area of the frustration score of the local part predicted as the mutual region part MA-4, MA-5, etc. This completes the main processing.
  • interaction site prediction device 100 performs the interaction site prediction in a stand-alone form has been described as an example, but the client terminal configured in a separate housing from the interaction site prediction device 100 has been described.
  • the interaction site prediction may be performed in response to the request of the above, and the prediction result may be returned to the client terminal.
  • the prediction method used by the fragment structure prediction program may be any method.
  • all or a part of the processes described as being performed automatically may be manually performed, or the processes described as being performed manually may be performed. All or part can be performed automatically by a known method.
  • each processing function performed by the control unit all or any part thereof is replaced with a CPU (Central Processing Unit) and It can be realized by a program interpreted and executed by the CPU, or it can be realized as hardware by wired logic.
  • the program is It is recorded on a recording medium described later, and is mechanically read by the interaction site prediction device 100 as necessary.
  • This program may be recorded on an application program server connected to the interaction unit ⁇ : prediction device 100 via an arbitrary network, and all or a part of the program may be downloaded as necessary. It is also possible.
  • various databases stored in the storage unit 106 include memory devices such as RAM and ROM, fixed disk devices such as hard disks, flexible disks, It is a storage means such as an optical disk, and stores various kinds of programs, tables, files, data bases, files for web pages, etc. used for various kinds of processing and provision of websites.
  • the interaction site prediction device 1 ⁇ 0 connects a peripheral device such as a printer monitor or an image scanner to an information processing device such as a known personal computer or an information processing terminal such as a work station, and connects the information processing device to the information processing device. It may be realized by implementing software (including programs, data, etc.) for realizing the method of the present invention.
  • each database may be independently configured as an independent database device, and part of the processing may be realized using CGI (Common Gateway Interface). .
  • CGI Common Gateway Interface
  • the program according to the present invention can be stored in a computer-readable recording medium.
  • this “recording medium” refers to any “portable physical medium” such as a flexible disk, a magneto-optical disk, ROM, EPROM, EEPROM, CD-ROM, MO, DVD, etc., and various computer systems. Any “fixed physical medium” such as built-in ROM, RAM, HD, etc., or LAN, It includes “communication media” that holds programs for a short period of time, such as communication lines and carrier waves when transmitting programs via networks such as the WAN and the Internet.
  • a “program” is a data processing method described in any language and description method, regardless of the format of source code or binary code. Note that a “program” is not necessarily limited to a single program, but may be distributed as a plurality of module libraries, or may be associated with a separate program such as an OS (Operating System). Including those that work to achieve that function.
  • OS Operating System
  • Known configurations and procedures can be used for a specific configuration for reading a recording medium in each device described in the embodiment, a reading procedure, an installation procedure after reading, and the like.
  • the network 300 has a function of interconnecting the interaction site prediction device 100 and the external system 200.
  • the network, the intranet, and the LAN both wired and wireless , VAN, PC communication network, public and public telephone networks (both analog and digital), leased line network (both analog and digital), CATV network, IMT20 00 system, GSM system or PDCZP DC-P system or other mobile circuit switching network / mobile bucket switching network, paging network, local wireless network such as B 1 uetooth, PHS network, CS, BS or I Any one of satellite communication networks such as SDB may be included. That is, the present system can transmit and receive various data via any network, whether wired or wireless.
  • primary sequence information of a target protein is input and input to a fragment structure prediction program that predicts a fragment structure of the protein from the primary sequence information of the protein.
  • the fragment structure prediction results of the fragment structure prediction program are compared, and based on the comparison results, the frustration of the local portion of the primary sequence information of the target protein is calculated.
  • the target tank is calculated by the calculated local fraction frustration.
  • Interaction site prediction that predicts interaction sites by predicting protein interaction sites and finding local sites where there is frustration based on the primary sequence information of proteins.
  • the primary structure information of the target protein is input, the three-dimensional structure data of the target protein is obtained, and the fragment structure for predicting the fragment structure of the protein from the primary sequence information of the protein is obtained.
  • Execute the fragment structure prediction simulation of the primary sequence information input to the prediction program compare the fragment structure prediction result of the fragment structure prediction program with the acquired three-dimensional structure data, and based on the comparison result, Frustration of the local portion of the primary sequence information of the protein is calculated, and the interaction site of the target protein is predicted based on the calculated frustration of the local portion.
  • Interaction for interaction site prediction apparatus makes it possible to find a highly site probability that is a site, the interaction site prediction method, a program, and can provide a recording medium.
  • certainty information indicating certainty with respect to the fragment structure prediction result of the fragment structure prediction program is set, and based on the set certainty information and the comparison result, frustration of a local part is performed. Is calculated, the confidence in the simulation result is reflected in the frustration calculation by increasing the weight of the fragment structure prediction result data by the program with high confidence information (that is, high simulation accuracy). It is possible to provide an interaction site prediction device, an interaction site prediction method, a program, and a recording medium that can be performed.
  • the interaction site prediction device, the interaction site prediction method, The program and the recording medium can be used for predicting the three-dimensional structure of a protein, analyzing compatible sites of a protein, and drug discovery using the analysis results.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

明 现 曞 盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 および、 蚘録媒䜓 技術分野
本発明は、 盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 およ ぎ、 蚘録媒䜓に関し、 特に、 局所郚䜍のフラストレヌションに基づいお盞互䜜甚 郚䜍を予枬する盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 お よび、 蚘録媒䜓に関する。 背景技術
タンパク質が働くため、 すなわちタンパク質が䞀定の機胜を衚すためには他の タンパク質や基質等ず䜕らかの盞互䜜甚をするこずが必芁である。 したが぀お、 タンパク質の盞互䜜甚郚䜍を決定するこずは、 創薬等の分野においおは極めお重 芁な研究テヌマであり、 埓来より、 バむオむンフォマティクス分野などにおいお、 タンパク質の䞀次配列情報 アミノ酞配列情報 に察しおモチヌフ怜玢を実行す るなどの手法によりタンパク質の盞互䜜甚郚䜍を解析する技術が開発されおいる。 すなわち、 既知の盞互䜜甚郚䜍に特異的に存圚するアミノ酞配列を探玢するこず により、 タンパク質の盞互䜜甚郚䜍を予枬しおいる。
しかしながら、 埓来のモチヌフ怜玢などによる盞互䜜甚郚䜍の解析手法は、 既 知の盞互䜜甚郚䜍に぀いおは解析するこずができるが、 未知の盞互䜜甚郚䜍に぀ いおは解析するこずができないずいうシステム構造䞊の基本的問題点を有しおい た。 以䞋、 この問題点の内容に぀いお、 䞀局具䜓的に説明する。
すなわち、 埓来の盞互䜜甚郚䜍の解析手法は、 予め刀明しおいる盞互䜜甚郚䜍 に特異的な䞀次配列をモチヌフデヌタベヌスなどに登録し、 その情報を甚いお盞 互䜜甚郚䜍の予枬を行うものであるため、 今たでに発芋されおいない盞互䜜甚郚 䜍に぀いおは、 その解析をするこずができなかった。 埓っお、 今たで発芋されお いない未知の盞互䜜甚郚䜍をバむオむンフォマティクス技術を甚いおコンビナヌ タ䞊で予枬する際には、 たったく別の手法を甚いる必芁があるが、 有効な手法は 未だ確立しおいない。
ずころで、 タンパク質のネィティブの立䜓構造は、 できるだけァミノ酞間の盞 互䜜甚にフラストレヌションが無いような構造に圢䜜られおいる。 すなわち、 タ ンパク質の゚ネルギヌ曲面はフラストレヌシペンが無いような党䜓構造 ネィテ むブ構造 ぞ向かっお挏斗状に蚭蚈されおいるず蚀われおいる f o l d i n g f unn e 1) 。 ここで、 ネむティブ構造はフラストレヌションが少ない構造 ではあるが、 芁玠間に働く盞互䜜甚の耇雑さ、 自由床の倧きさ、 進化的な経緯な どの点から、 フラストレヌションが完党に無くな぀おいるわけではない。
最近の蚈算機実隓では、 進化の産物であるタンパク質の挏斗状の゚ネルギヌ面 は本質的に等方的ではなく、 フラストレヌションの倧きい方向ず小さな方向が存 圚しおいる 異方性を持぀ こずがわかっおきた a n i s o t r o p i c f u nn e 1) 。 これは構造的に蚀うならば、 局所的な構造にはフラス トレヌショ ンの倧きい構造ず小さい構造があるこずを瀺しおいる。 そしお、 フラストレヌシ ョンの倧きい局所構造郚䜍は、 党䜓構造の安定化のために犠牲になっおいる構造 郚䜍であり、 この郚分は、 党䜓構造の安定化のために歪んだ構造を取らざるを埗 ない状況䞋に眮かれおおり、 いわば党䜓構造の䞭における䞍安定郚䜍であるこず を瀺しおいる。
—方、 タンパク質の盞互䜜甚は二぀の安定な党䜓構造をも぀タンパク質同士が 䜜甚するこずにより、 さらに安定化する過皋であるずいえる。 タンパク質が盞互 䜜甚する際の構造の倉化にっレ、お曎に説明するず、 タンパク質 Aず Bずが盞互䜜 甚する際には、 タンパク質 Aの䞀郚分の構造ずタンパク質 Bの䞀郚分の構造に倉 化が起こり結合する。
倉化が起こる䞀郚分の構造ずしお考えられる郚䜍に぀いお考察するず、 たず、 局所的に芋おも、 か぀党䜓的に芋おも安定な局所構造は、 それ以䞊安定化する必 芁性がない。 䞀方、 党䜓的に芋れば安定であるが局所的に芋るず䞍安定である郚 分は、 他のタンパク質等ず結合するこずによりその郚分が安定化し、 さらに結合 するこずにより党䜓もさらに安定化するずいう状況が考えられる。 すなわち、 局 所的に䞍安定な構造領域は、 タンパク質盞互䜜甚郚䜍である可胜性が比范的高い ず考えるこずができる。 このように局所的に䞍安定な郚䜍を䞀次配列から予枬す るこずにより、 盞互䜜甚郚䜍の候補を挙げるこずができるようになる可胜性があ る。
タンパク質の立䜓構造は、 配列情報から䞀意に決たるず蚀われおいる。 これは、 配列空間ず構造空間ずの間には䜕らかの盞関があるずレボうこずを意味する。 ここ で、 配列空間ず構造空間 ネむティブ構造の空間 の倧きさを比范しおみるず、 配列空間の方が倧きいず蚀える。 なぜなら、 進化的に芋るず、 配列が倚少倉化し たずしおも構造はあたり倉化しおいるようには芋えないからである。 このこずを 換蚀するず、 構造の方が配列よりも進化的に保守性が匷いずも蚀える。
たた、 近幎の進化的に良く䌌たタンパク質の構造解析によっお、 䌌たような配 列をも぀タンパク質は、 䌌たような党䜓構造をもっずいうこずが明らかになっお きた。 党䜓は郚分の組み合わせから䜜られおいるず考えるず、 タンパク質の党䜓 構造に察しお成り立぀であろう䞊蚘のような経隓則が、 タンパク質の䞀郚を切り 出した郚分に関しおもある皋床成り立぀のではないかず考えるこずができる。 実際に、 タンパク質の䌌たような郚分配列は䌌たような郚分構造ずなるずいう 郚分配列ず構造ずに盞関のあるものが存圚しおいる。 最近の研究では、 郚分配列 ず郚分構造ずの盞関を利甚しお、 郚分配列から党䜓構造を組み立おるずいう詊み が詊されおきおいる。
䟋えば、 K i m T. S i mo n s等 「As s emb l y o f P r o t e i n Te r t i a r y S t r u c t u r e s f r om F r a gme n t s w i t h S im i l a r Lo c a l S e q u e n c e s u s i n g S i mu l a t e d Ann e a l i n g a n d B a y e s i a n S c o r i n g Fun c t i o n s」 J. Mo l . B i o l . (1997) 26 8, 209 p-225 p (以䞋 「文献 1 j ずいう や、 Ch r i s t o p h e r By s t r o f f 等 「P r e d e c t i o n o f Lo c a l S t r u c t u r e i n P r o t e i n s U s i n g a L i b r a r y o f S e q u e n c e— S t r u c t u r e Mo t i f sJ J. Mo l . B i o l . (1998) 281 565 p-577 p (以䞋 「文献 2」 ずいう により開瀺 された研究においおは、 郚分配列に察応する構造をクラスタリングするこずによ り、 広倧な構造 f o l d i n g) 空間を狭めるこずが可胜ずなり、 フォヌルデ ィング ·シミュレヌションの蚈算時間の短瞮にも繋がっおいる。
ここで、 文献 1には、 l o c a lな配列によっお l o c a l構造は特定の偏぀ た構造に制限されるので構造空間は小さくなるこず、 その構造は配列䞊近いタン パク質の構造に類䌌しおいるこず、 配列のプロファむルをマルチプルァラむンメ ントにより求め、 問合せ q u e r y) 配列ずの距離の近さを求めるこずなどが 開瀺されおいる。
たた、 文献 2には、 断片構造ず配列の盞関がある堎合には、 断片の配列傟向か ら限られた数の構造の候補がずりだせるこず、 構造に関しおは二぀の構造指暙を' 甚いおクラスタリングを行い、 たた、 配列に぀いおは f r e q u e n c y p r o f i 1 eの距離を䜿っお蚈算し、 クラスタヌ䜜成は配列が䌌おいるものの䞭か ら構造が䌌おいるものを探しおクラスタヌ化するこずにより実際に配列䞀構造断 片のクラスタヌを䜜成するこずが開瀺されおいる。
ここで、 郚分配列䞀郚分構造クラスタ䞀は、 配列ず盞関の高い郚分構造予枬を 行うためのものであるが、 盞関の匷さ 䌌た配列がその構造である確信床 を甚 レ、お、 党䜓構造の䞭で 配列ず構造ずの間の盞関の芳点から 局所的に安定な郚 䜍 盞関の匷い郚䜍 や、 䞍安定な郚䜍を特定するこずが可胜であるず考えられ る。 このクラスタヌはたた、 デヌタセット、 郚分配列の長さ、 クラスタヌの倧き さなどの芳点から様々な分類が可胜である。
郚分配列ず郚分構造ずの間の盞関の匷い郚分は、 その郚分配列のみで党䜓構造 におけるその郚䜍の構造が決たっおいる郚䜍 ぀たり、 党䜓構造の䞭でも安定し おいる郚䜍 である可胜性が高いずいえる。 䞀方、 郚分配列ず郚分構造ずの間の 盞関の匱い郚分は、 その郚分配列のみでは構造が決たらない 党䜓構造の䞭でそ の郚分構造が決たる 郚䜍である可胜性が高い。
よっお、 フラストレヌションが倧きい 䞍安定な 局所郚䜍の候補ずしおは、 郚分配列ず郚分構造の盞関が匱い郚分や、 様々なクラスタヌでの結果においお、 確信床の高い結果がたちたちである郚分や、 フォヌルディング 'シミュレ䞀ショ ン f o l d i n g s i m u l a t i o n ) を実行した埌、 確信床が高く予想 •された初期構造ずは異なる構造を取っおいる郚分や、 たわりの局所構造ず敎合性 を欠く郚分が考えられる。
このようなフラストレヌションの倧きい局所郚䜍の断片構造予枬においおは、 䞊述した様々な手法における凊理の仕方の差が倧きいず蚀えるだろう。 すなわち、 皮々の手法による誀差が倧きくなる、 すなわち粟床の悪くなる郚䜍等が、 フラス トレヌシペンの倧きい局所郚䜍である可胜性が高いずいえる。 よっお、 様々な手 法における断片構造予枬の結果比范を通しお、 フラストレヌシペンの比范的倧き な局所郚䜍の予枬が可胜になるず考えるこずができる。
たた、 タンパク質の立䜓構造デヌタが分かっおいる堎合、 すなわち、 既存の P D Bなどに立䜓構造デヌタが登録されおいるタンパク質は、 その党䜓構造が既知 であるため、 様々な断片構造予枬手法の予枬結果ずその実際の構造ずの差を芋る こずにより、 より明確にフラストレヌションのある局所郚䜍 盞互䜜甚郚䜍にな ぀おいる確率の高い郚䜍 を芋぀けるこずが可胜になるず考えられる。
埓っお、 本発明は、 タンパク質の䞀次配列情報においおフラストレヌションの ある局所郚䜍を発芋するこずにより盞互䜜甚郚䜍を効果的に予枬するこずのでき る、 盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 および、 蚘録 媒䜓を提䟛するこずを目的ずしおいる。 発明の開瀺
本発明にかかる盞互䜜甚郚䜍予枬装眮は、 目的のタンパク質の䞀次配列情報を 入力する入力手段ず、 タンパク質の䞀次配列情報から圓該タンパク質の断片構造 を予枬する断片構造予枬プログラムに察しお䞊蚘入力手段により入力された䞊蚘 䞀次配列情報の断片構造予枬シミュレヌシペンを実行させる断片構造予枬プログ ラム実行手段ず、 䞊蚘断片構造予枬プログラム実行手段による䞊蚘断片構造予枬 プログラムの断片構造予枬結果を比范する予枬結果比范手段ず、 䞊蚘予枬結果比 范手段による比范結果に基づいお、 䞊蚘目的のタンパク質の䞀次配列情報の局所 郚分のフラストレヌシペンを蚈算するフラストレヌション蚈算手段ず、 䞊蚘フラ ストレヌシペン蚈算手段により蚈算された䞊蚘局所郚分の䞊蚘フラストレ䞀ショ ンにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜甚郚䜍予枬手段 ずを備えたこずを特城ずする。
この装眮によれば、 目的のタンパク質の䞀次配列情報を入力し、 タンパク質の —次配列情報から圓該タンパク質の断片構造を予枬する断片構造予枬プロダラム に察しお入力された䞀次配列情報の断片構造予枬シミュレヌシペンを実行させ、 断片構造予枬プログラムの断片構造予枬結果を比范し、 比范結果に基づいお、 目 的のタンパク質の䞀次配列情報の局所郚分のフラス トレヌシペンを蚈算し、 蚈算 された局所郚分のフラストレヌシペンにより目的のタンパク質の盞互䜜甚郚䜍を 予枬するので、 タンパク質の䞀次配列情報においおフラストレヌションのある局 所郚䜍を発芋するこずにより盞互䜜甚郚䜍を効果的に予枬するこずができる。 ぀ぎの発明にかかる盞互䜜甚郚䜍予枬装眮は、 目的のタンパク質の䞀次配列情 報を入力する入力手段ず、 䞊蚘目的のタンパク質の立䜓構造デヌタを取埗する立 䜓構造デヌタ取埗手段ず、 タンパク質の䞀次配列情報から圓該タンパク質の断片 構造を予枬する断片構造予枬プログラムに察しお䞊蚘入力手段により入力された 䞊蚘䞀次配列情報の断片構造予枬シミュレヌシペンを実行させる断片構造予枬プ 口ダラム実行手段ず、 䞊蚘断片構造予枬プログラム実行手段による䞊蚘断片構造 予枬プログラムの断片構造予枬結果ず、 䞊蚘立䜓構造デヌタ取埗手段により取埗 した䞊蚘立䜓構造デヌタずを比范する予枬結果比范手段ず、 䞊蚘予枬結果比范手 段による比范結果に基づいお、 䞊蚘目的のタンパク質の䞀次配列情報の局所郚分 のフラストレヌシペンを蚈算するフラス トレヌシペン蚈算手段ず、 䞊蚘フラスト レヌション蚈算手段により蚈算された䞊蚘局所郚分の䞊蚘フラストレヌシペンに より䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜甚郚䜍予枬手段ずを 備えたこずを特城ずする。
この装眮によれば、 目的のタンパク質の䞀次配列情報を入力し、 目的のタンパ ク質の立䜓構造デヌタを取埗し、 タンパク質の䞀次配列情報から圓該タンパク質 の断片構造を予枬する断片構造予枬プログラムに察しお入力された䞀次配列情報 の断片構造予枬シミュレヌションを実行させ、 断片構造予枬プログラムの断片構 造予枬結果ず、 取埗した立䜓構造デヌタずを比范し、 比范結果に基づいお、 目的 のタンパク質の䞀次配列情報の局所郚分のフラストレヌシペンを蚈算し、 蚈算さ れた局所郚分のフラストレヌシペンにより目的のタンパク質の盞互䜜甚郚䜍を予 枬するので、 断片構造予枬プログラムの予枬結果ず目的のタンパク質の実際の断 片構造ずの差を芋るこずにより、 より明確にフラストレヌションのある局所郚䜍 (盞互䜜甚郚䜍になっおいる確率の高い郚䜍 を芋぀けるこずが可胜になる。 ぀ぎの発明にかかる盞互䜜甚郚䜍予枬装眮は、 䞊蚘に蚘茉の盞互䜜甚郚䜍予枬 装眮においお、 䞊蚘断片構造予枬プログラムの䞊蚘断片構造予枬結果に察する確 信床を瀺す確信床情報を蚭定する確信床情報蚭定手段をさらに備え、 䞊蚘フラス トレヌシペン蚈算手段は、 䞊蚘確信床情報蚭定手段により蚭定された䞊蚘確信床 情報および䞊蚘比范結果に基づいお、 䞊蚘局所郚分の䞊蚘フラストレヌシペンを 蚈算するこずを特城ずする。
これはフラストレヌション蚈算の䞀䟋を䞀局具䜓的に瀺すものである。 この装 眮によれば、 断片構造予枬プログラムの断片構造予枬結果に察する確信床を瀺す 確信床情報を蚭定し、 蚭定された確信床情報および比范結果に基づいお、 局所郚 分のフラストレヌションを蚈算するので、 確信床情報が高い すなわち、 シミュ レ䞀シペンの粟床の高い プログラムによる断片構造予枬結果デヌタに察する重 みを高くするこずにより、 フラストレヌション蚈算においおシミュレヌション結 果に察する確信床を反映させるこずができるようになる。
たた、 本発明は盞互䜜甚郚䜍予枬方法に関するものであり、 本発明にかかる盞 互䜜甚郚䜍予枬方法は、 目的のタンパク質の䞀次配列情報を入力する入力ステッ プず、 タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片 構造予枬プログラムに察しお䞊蚘入カステツプにより入力された䞊蚘䞀次配列情 報の断片構造予枬シミュレヌションを実行させる断片構造予枬プログラム実行ス テツプず、 䞊蚘断片構造予枬プログラム実行ステップによる䞊蚘断片構造予枬プ 口ダラムの断片構造予枬結果を比范する予枬結果比范ステップず、 䞊蚘予枬結果 比范ステツプによる比范結果に基づいお、 䞊蚘目的のタンパク質の䞀次配列情報 の局所郚分のフラストレヌションを蚈算するフラストレヌション蚈算ステップず、 䞊蚘フラストレヌション蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フラ ストレヌシペンにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜甚 郚䜍予枬ステップずを含むこずを特城ずする。
この方法によれば、 目的のタンパク質の䞀次配列情報を入力し、 タンパク質の 䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造予枬プログラム に察しお入力された䞀次配列情報の断片構造予枬シミュレヌシペンを実行させ、 断片構造予枬プログラムの断片構造予枬結果を比范し、 比范結果に基づいお、 目 的のタンパク質の䞀次配列情報の局所郚分のフラストレヌションを蚈算し、 蚈算 された局所郚分のフラストレヌションにより目的のタンパク質の盞互䜜甚郚䜍を 予枬するので、 タンパク質の䞀次配列情報においおフラストレヌションのある局 所郚䜍を発芋するこずにより盞互䜜甚郚䜍を効果的に予枬するこずができる。 ぀ぎの発明にかかる盞互䜜甚郚䜍予枬方法は、 目的のタンパク質の䞀次配列情 報を入力する入力ステップず、 䞊蚘目的のタンパク質の立䜓構造デヌタを取埗す る立䜓構造デヌタ取埗ステップず、 タンパク質の䞀次配列情報から圓該タンパク 質の断片構造を予枬する断片構造予枬プログラムに察しお䞊蚘入力ステップによ り入力された䞊蚘䞀次配列情報の断片構造予枬シミュレヌションを実行させる断 片構造予枬プログラム実行ステップず、 䞊蚘断片構造予枬プログラム実行ステッ プによる䞊蚘断片構造予枬プログラムの断片構造予枬結果ず、 䞊蚘立䜓構造デヌ タ取埗ステップにより取埗した䞊蚘立䜓構造デヌタずを比范する予枬結果比范ス テツプず、 䞊蚘予枬結果比范ステップによる比范結果に基づいお、 䞊蚘目的のタ ンパク質の䞀次配列情報の局所郚分のフラストレヌシペンを蚈算するフラストレ ヌション蚈算ステップず、 䞊蚘フラストレヌシペン蚈算ステップにより蚈算され た䞊蚘局所郚分の䞊蚘フラストレヌシペンにより䞊蚘目的のタンパク質の盞互䜜 甚郚䜍を予枬する盞互䜜甚郚䜍予枬ステップずを含むこずを特城ずする。
この方法によれば、 目的のタンパク質の䞀次配列情報を入力し、 目的のタンパ ク質の立䜓構造デヌタを取埗し、 タンパク質の䞀次配列情報から圓該タンパク質 の断片構造を予枬する断片構造予枬プログラムに察しお入力された䞀次配列情報 の断片構造予枬シミュレヌションを実行させ、 断片構造予枬プログラムの断片構 造予枬結果ず、 取埗した立䜓構造デヌタずを比范し、 比范結果に基づいお、 目的 のタンパク質の䞀次配列情報の局所郚分のフラストレヌシペンを蚈算し、 蚈算さ れた局所郚分のフラストレヌションにより目的のタンパク質の盞互䜜甚郚䜍を予 枬するので、 断片構造予枬プログラムの予枬結果ず目的のタンパク質の実際の断 片構造ずの差を芋るこずにより、 より明確にフラストレヌシペンのある局所郚䜍 (盞互䜜甚郚䜍になっおいる確率の高い郚䜍 を芋぀けるこずが可胜になる。 ぀ぎの発明にかかる盞互䜜甚郚䜍予枬方法は、 䞊蚘に蚘茉の盞互䜜甚郚䜍予枬 方法においお、 䞊蚘断片構造予枬プログラムの䞊蚘断片構造予枬結果に察する確 信床を瀺す確信床情報を蚭定する確信床情報蚭定ステップをさらに含み、 䞊蚘フ ラストレヌシペン蚈算ステップは、 䞊蚘確信床情報蚭定ステップにより蚭定され た䞊蚘確信床情報および䞊蚘比范結果に基づいお、 䞊蚘局所郚分の䞊蚘フラスト レヌシペンを蚈算するこずを特城ずする。
これはフラストレヌシペン蚈算の䞀䟋を䞀局具䜓的に瀺すものである。 この方 法によれば、 断片構造予枬プログラムの断片構造予枬結果に察する確信床を瀺す 確信床情報を蚭定し、 蚭定された確信床情報および比范結果に基づいお、 局所郚 分のフラストレヌションを蚈算するので、 確信床情報が高い すなわち、 シミュ レヌシペンの粟床の高い プログラムによる断片構造予枬結果デヌタに察する重 みを高くするこずにより、 フラストレヌシペン蚈算においおシミュレヌション結 果に察する確信床を反映させるこずができるようになる。
たた、 本発明はプログラムに関するものであり、 本発明にかかるプログラムは、 目的のタンパク質の䞀次配列情報を入力する入力ステップず、 タンパク質の䞀次 配列情報から圓該タンパク質の断片構造を予枬する断片構造予枬プログラムに察 しお䞊蚘入力ステップにより入力された䞊蚘䞀次配列情報の断片構造予枬シミュ レヌシペンを実行させる断片構造予枬プログラム実行ステップず、 䞊蚘断片構造 予枬プログラム実行ステップによる䞊蚘断片構造予枬プログラムの断片構造予枬 結果を比范する予枬結果比范ステップず、 䞊蚘予枬結果比范ステップによる比范 結果に基づいお、 䞊蚘目的のタンパク質の䞀次配列情報の局所郚分のフラストレ ヌシペンを蚈算するフラストレヌション蚈算ステップず、 䞊蚘フラス トレヌショ ン蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フラストレヌシペンにより 䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜甚郚䜍予枬ステップずを 含む盞互䜜甚郚䜍予枬方法をコンピュヌタに実行させるこずを特城ずする。
このプログラムによれば、 目的のタンパク質の䞀次配列情報を入力し、 タンパ ク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造予枬プロ グラムに察しお入力された䞀次配列情報の断片構造予枬シミュレヌションを実行 させ、 断片構造予枬プログラムの断片構造予枬結果を比范し、 比范結果に基づい お、 目的のタンパク質の䞀次配列情報の局所郚分のフラストレヌションを蚈算し、 蚈算された局所郚分のフラストレヌシペンにより目的のタンパク質の盞互䜜甚郚 䜍を予枬するので、 タンパク質の䞀次配列情報においおフラス トレヌションのあ る局所郚䜍を発芋するこずにより盞互䜜甚郚䜍を効果的に予枬するこずができる。 ぀ぎの発明にかかるプログラムは、 目的のタンパク質の䞀次配列情報を入力す る入力ステップず、 䞊蚘目的のタンパク質の立䜓構造デヌタを取埗する立䜓構造 デヌタ取埗ステップず、 タンパク質の䞀次配列情報から圓該タンパク質の断片構 造を予枬する断片構造予枬プログラムに察しお䞊蚘入力ステップにより入力され た䞊蚘䞀次配列情報の断片構造予枬シミュレヌションを実行させる断片構造予枬 プログラム実行ステップず、 䞊蚘断片構造予枬プログラム実行ステップによる䞊 蚘断片構造予枬プログラムの断片構造予枬結果ず、 䞊蚘立䜓構造デヌタ取埗ステ ップにより取埗した䞊蚘立䜓構造デヌタずを比范する予枬結果比范ステップず、 䞊蚘予枬結果比范ステップによる比范結果に基づいお、 䞊蚘目的のタンパク質の 䞀次配列情報の局所郚分のフラストレヌシペンを蚈算するフラストレヌシペン蚈 算ステップず、 䞊蚘フラス トレヌション蚈算ステップにより蚈算された䞊蚘局所 郚分の䞊蚘フラストレヌションにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予 枬する盞互䜜甚郚䜍予枬ステップずを含む盞互䜜甚郚䜍予枬方法をコンピュヌタ に実行させるこずを特城ずする。
このプログラムによれば、 目的のタンパク質の䞀次配列情報を入力し、 目的の タンパク質の立䜓構造デヌタを取埗し、 タンパク質の䞀次配列情報から圓該タン パク質の断片構造を予枬する断片構造予枬プログラムに察しお入力された䞀次配 列情報の断片構造予枬シミュレヌションを実行させ、 断片構造予枬プログラムの 断片構造予枬結果ず、 取埗した立䜓構造デヌタずを比范し、 比范結果に基づいお、 目的のタンパク質の䞀次配列情報の局所郚分のフラストレヌシペンを蚈算し、 蚈 算された局所郚分のフラストレヌションにより目的のタンパク質の盞互䜜甚郚䜍 を予枬するので、 断片構造予枬プログラムの予枬結果ず目的のタンパク質の実際 の断片構造ずの差を芋るこずにより、 より明確にフラストレヌシペンのある局所 郚䜍 盞互䜜甚郚䜍になっおいる確率の高い郚䜍 を芋぀けるこずが可胜になる。 ぀ぎの発明にかかるプログラムは、 䞊蚘に蚘茉のプログラムにおいお、 䞊蚘断 片構造予枬プログラムの䞊蚘断片構造予枬結果に察する確信床を瀺す確信床情報 を蚭定する確信床情報蚭定ステップをさらに含み、 䞊蚘フラストレヌシペン蚈算 ステップは、 䞊蚘確信床情報蚭定ステップにより蚭定された䞊蚘確信床情報およ び䞊蚘比范結果に基づいお、 䞊蚘局所郚分の䞊蚘フラストレヌシペンを蚈算する こずを特城ずする。
これはフラストレヌション蚈算の䞀䟋を䞀局具䜓的に瀺すものである。 このプ 口グラムによれば、 断片構造予枬プログラムの断片構造予枬結果に察する確信床 を瀺す確信床情報を蚭定し、 蚭定された確信床情報および比范結果に基づいお、 局所郚分のフラストレヌションを蚈算するので、 確信床情報が高い すなわち、 シミュレヌションの粟床の高い プログラムによる断片構造予枬結果デヌタに察 する重みを高くするこずにより、 フラストレヌション蚈算においおシミュレヌシ ョン結果に察する確信床を反映させるこずができるようになる。
たた、 本発明は蚘録媒䜓に関するものであり、 本発明にかかる蚘録媒䜓は、 侊 蚘に蚘茉されたプログラムを蚘録したこずを特城ずする。
この蚘録媒䜓によれば、 圓該蚘録媒䜓に蚘録されたプログラムをコンピュヌタ に読み取らせお実行するこずによっお、 䞊蚘に蚘茉されたプログラムをコンビュ ヌタを利甚しお実珟するこずができ、 これら各プログラムず同様の効果を埗るこ ずができる。 図面の簡単な説明
第 1図は、 本発明の基本原理を瀺す原理構成図であり、 第 2図は、 本発明が適 甚される本システムの構成の䞀䟋を瀺すブロック図であり、 第 3図は、 予枬結果 デヌタベヌス 1 0 6 aに栌玍される情報の䞀䟋を瀺す図であり、 第 4図は、 本実 斜の圢態における本システムのメむン凊理の䞀䟋を瀺すフロヌチャヌトであり、 第 5図は、 本実斜の圢態における本システムの立䜓構造デヌタ取埗凊理の䞀䟋を 瀺すフロヌチャヌトであり、 第 6図は、 本システムのフラストレヌション蚈算郚 1 0 2 eにより実行されるフラストレヌシペン実行凊理の䞀䟋を瀺すフロヌチダ ヌトであり、 第 7図は、 盞互䜜甚郚䜍予枬装眮 1 0 0の出力装眮 1 1 4に衚瀺さ れる盞互䜜甚郚䜍予枬結果の衚瀺画面の䞀䟋を瀺す図である。 発明を実斜するための最良の圢態
以䞋に、 本発明にかかる盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プロ グラム、 および、 蚘録媒䜓の実斜の圢態を図面に基づいお詳现に説明する。 なお、 この実斜の圢態によりこの発明が限定されるものではない。
[本発明の抂芁] 以䞋、 本発明の抂芁に぀いお説明し、 その埌、 本発明の構成および凊理等に぀ いお詳现に説明する。 第 1図は本発明の基本原理を瀺す原理構成図である。
本発明は、 抂略的に、 以䞋の基本的特城を有する。 すなわち、 本発明は、 断片 構造クラスタヌを甚いお盞互䜜甚郚䜍を予枬するこず、 断片構造の予枬結果から 盞互䜜甚郚䜍を予枬するこず、 様々な断片構造予枬の予枬結果の差異から盞互䜜 甚予枬郚䜍を予枬するこず、 断片構造の予枬結果の差異が衚れる郚䜍が党䜓構造 ず郚分構造におけるフラストレヌシペンの高いストレス郚䜍であるず予枬するこ ず、 構造的なストレス郚䜍 比范的構造的に䞍安定な郚分 は他ず盞互䜜甚する 郚䜍である可胜性があるず予枬するこず等を特城ずする。 以䞋に、 本発明の基本 原理を説明する。
たず、 利甚者は、 目的のタンパク質の䞀次配列情報である目的配列デヌタ 1 0 を本発明の盞互䜜甚郚䜍予枬装眮に入力する。 この目的配列デヌタ 1 0の入力は、 䟋えば、 利甚者が S W I S S— P R O Tや P I Rや T r EMB L等の倖郚のデヌ タベヌスに登録された䞀次配列情報を遞択するこずにより入力しおもよく、 たた、 所望の䞀次配列情報を盎接入力しおもよレ、。
぀いで、 本発明の盞互䜜甚郚䜍予枬装眮は、 タンパク質の䞀次配列情報から圓 該タンパク質の断片構造を予枬する断片構造予枬プログラム 2 0 a〜 2 0 dに察 しお入力された目的配列デヌタ 1 0の断片構造予枬シミュレヌションを実行する。 ここで、 断片構造予枬プログラム 2 0 a〜 2 0 dは、 䟋えば、 文献 1たたは文献 2に開瀺された手法や、 スレツディング法や、 アブむニシォ法などを利甚しお断 片構造予枬シミュレヌシペンを実行する。
぀いで、 本発明の盞互䜜甚郚䜍予枬装眮は、 各断片構造予枬プログラム 2 0 a 〜 2 0 dの断片構造予枬結果 3 0 a〜 3 0 dを比范する 6 0 ) 。 すなわち、 目 的配列デヌタ 1 0に察応する各予枬プログラムの実行結果を䞊眮しお比范する  3 0 a〜3 0 d ) 。
そしお、 本発明の盞互䜜甚郚䜍予枬装眮は、 この比范結果に基づいお、 目的の タンパク質の䞀次配列情報の局所郚分のフラス トレヌションを蚈算する 7 0 ) 。 すなわち、 比范結果から各予枬結果デヌタ 3 0 a〜3 0 b ) で異なる断片構造 を予枬した局所郚分を抜出しお、 その郚分のフラス トレヌションを蚈算する。 既 存の断片構造予枬プログラム 2 0 a〜 2 0 dは、 基本的には䞀次配列情報のうち 䞀郚の局所配列を芋お予枬を行うが、 断片構造はタンパク質の党䜓の構造ずの関 係で最終的に決定されるので、 党䜓ず局所郚分ずの間に敎合性が取れない郚䜍、 すなわちフラストレヌシペンが倧きい局所的郚䜍では断片構造予枬結果は倖れる 堎合が倚い。 埓っお、 耇数のプログラムにおいお予枬結果が異なる局所郚分に぀ いおは、 ブラストレヌシペンが倧きいず仮定するこずができる。
フラストレヌションの蚈算方法は、 䟋えば、 異なる予枬結果デヌタを出力した 断片構造予枬プログラム数に応じおフラストレヌションを増枛しおもよく、 ある いは、 異なる予枬結果のそれぞれの構造における確信床の平均倀や分散倀などに 応じおフラストレヌションを増枛しおもよく、 たた、 その郚分のアミノ酞配列を 分子力孊たたは分子動力孊などの手法を甚いお゚ネルギヌ量を求めその゚ネルギ 䞀量を甚いおフラストレヌシペンを蚈算しおもよい。
そしお、 本発明の盞互䜜甚郚䜍予枬装眮は、 蚈算された局所郚分のフラストレ ヌシペンにより目的のタンパク質の盞互䜜甚郚䜍を予枬する 8 0 ) 。 すなわち、 䟋えば、 䞀定の閟倀を超えるフラストレヌションが存圚する局所郚分 6 1 ) を 盞互䜜甚郚䜍ず予枬する。
たた、 本発明の盞互䜜甚郚䜍予枬装眮は、 䟋えば、 P D Bや S C O Pなどの倖 郚のデヌタベヌスに目的のタンパク質の立䜓構造デヌタが登録されおいる堎合に はその立䜓構造デヌタ 4 0を取埗し、 予枬結果の比范においお甚いる。 すなわち、 目的のタンパク質が実際に採る立䜓構造デヌタ 4 0ず、 予枬プログラムの予枬結 果デヌタ 3 0 a〜3 0 dずを比范する。
そしお、 実際の立䜓構造デヌタ 4 0ず予枬プログラムの予枬結果デヌタ 3 0 a 〜3 0 dずが異なっおいる郚分に぀いおは、 高いフラストレヌションを蚈算する。 タンパク質の立䜓構造デヌタが分かっおいる堎合、 すなわち、 既存の P D Bなど に立䜓構造デヌタが登録されおいるタンパク質は、 その党䜓構造が既知であるた め、 様々な断片構造予枬手法の予枬結果ずその実際の構造ずの差を芋るこずによ り、 より明確にフラストレヌションのある局所郚䜍 盞互䜜甚郚䜍になっおいる 確率の高い郚䜍 を芋぀けるこずが可胜になる。 䟋えば、 実際の立䜓構造デヌタ 4 0ず異なる予枬結果デヌタを出力した断片構造予枬プログラム数に応じおフラ ス トレヌシペンを増枛しおもよレ、。
さらに、 本発明の盞互䜜甚郚䜍予枬装眮は、 断片構造予枬プログラム 2 0 a〜 2 0 dの断片構造予枬結果デヌタ 3 0 a〜 3 0 dに察する確信床を瀺す確信床情 å ± 5 0を蚭定する。 すなわち、 断片構造予枬プログラム 2 0 a〜2 0 dのシミュ レヌション粟床を実際の立䜓構造デヌタなどに基づいお蚭定する。
そしお、 本発明の盞互䜜甚郚䜍予枬装眮は、 蚭定された確信床情報および比范 結果に基づいお、 局所郚分の䞊蚘フラストレヌションを蚈算する。 すなわち、 確 信床情報が高い すなわち、 シミュレヌションの粟床の高い プログラムによる 断片構造予枬結果デヌタに察する重みを高くするこずにより、 フラス トレヌショ ン蚈算においおシミュレヌション結果に察する確信床を反映させるこずができる。 すなわち、 本発明は、 それぞれの手法における構造予枬の結果ずその構造ぞの 確信床を解析し、 郚分配列→郚分構造の盞関が匱い郚分や、 様々なクラスタヌで の結果においお確信床の高い結果がたちたちである郚分や、 フォヌルディング . シミュレヌシペン f o l d i n g s i m u l a t i o n ) を実行した埌、 確 信床が高く予想された初期構造ずは異なる構造を取っおいる郚分や、 たわりの局 所構造ず敎合性を欠く郚分等に察しお高いフラストレヌションずなるように候補 郚䜍に関する埗点を蚈算し、 蚈算した結果をもずに盞互䜜甚郚䜍ずしお可胜性の 高い郚䜍を順に埗点を぀けお抜出するこずができる。
[システム構成]
たず、 本システムの構成に぀いお説明する。 第 2図は、 本発明が適甚される本 システムの構成の䞀䟋を瀺すプロック図であり、 該構成のうち本発明に関係する 郚分のみを抂念的に瀺しおいる。 本システムは、 抂略的に、 盞互䜜甚郚䜍予枬装 眮 1 0 0ず、 配列情報や立䜓構造等に関する倖郚デヌタベヌスおよびホモ口ゞヌ 怜玢や断片構造予枬等の倖郚プログラム等を提䟛する倖郚システム 2 0 0ずを、 ネットワヌク 3 0 0を介しお通信可胜に接続しお構成されおいる。
第 2図においおネットワヌク 3 0 0は、 盞互䜜甚郚䜍予枬装眮 1 0 0ず倖郚シ ステム 2 0 0ずを盞互に接続する機胜を有し、 䟋えば、 むンタヌネット等である。 第 2図においお倖郚システム 2 0 0は、 ネットワヌク 3 0 0を介しお、 盞互䜜 甚郚䜍予枬装眮 1 0 0ず盞互に接続され、 利甚者に察しお配列情報や立䜓構造等 に関する倖郚デヌタベヌス、 および、 ホモロゞ䞀怜玢やモチヌフ怜玢や断片構造 予枬等の倖郚プログラムを実行するりェブサむ トを提䟛する機胜を有する。
ここで、 倖郚システム 2 0 0は、 WE Bサヌバや A S Pサヌバ等ずしお構成し おもよく、 そのハヌドりェア構成は、 䞀般に垂販されるワヌクステヌション、 䞀゜ナルコンピュヌタ等の情報凊理装眮およびその付属装眮により構成しおもよ レボ。 たた、 倖郚システム 2 0 0の各機胜は、 倖郚システム 2 0 0のハヌドりェア 構成䞭の C P U、 ディスク装眮、 メモリ装眮、 入力装眮、 出力装眮、 通信制埡装 眮等およびそれらを制埡するプログラム等により実珟される。
第 2図においお盞互䜜甚郚䜍予枬装眮 1 0 0は、 抂略的に、 盞互䜜甚郚䜍予枬 装眮 1 0 0の党䜓を統括的に制埡する C P U等の制埡郚 1 0 2、 通信回線等に接 続されるルヌタ等の通信装眮 図瀺せず に接続される通信制埡むンタヌプ䞀 ス郚 1 0 4、 入力装眮 1 1 2および出力装眮 1 1 4に接続される入出力制埡むン タヌフェヌス郚 1 0 8、 および、 各皮のデヌタベヌスやテヌブル 予枬結果デヌ タベヌス 1 0 6 a〜タンパク質構造デヌタベヌス 1 0 6 c ) を栌玍する蚘憶郚 1 0 6を備えお構成されおおり、 これら各郚は任意の通信路を介しお通信可胜に接 続されおいる。 さらに、 この盞互䜜甚郚䜍予枬装眮 1 0 0は、 ルヌタ等の通信装 眮おょぎ専甚線等の有線たたは無線の通信回線を介しお、 ネットワヌク 3 0 0に 通信可胜に接続されおいる。
第 2図においお蚘憶郚 1 0 6に栌玍される各皮のデヌタベヌスやテヌブル 予 枬結果デヌタベヌス 1 0 6 a〜タンパク質構造デヌタベヌス 1 0 6 c ) は、 固定 ディスク装眮等のストレヌゞ手段であり、 各皮凊理に甚いる各皮のプログラムや テ䞀ブルやフアむルゃデ䞀タベ䞀スゃゥヱブベヌゞ甚フアむル等を栌玍する。 これら蚘憶郚 1 0 6の各構成芁玠のうち、 予枬結果デヌタベヌス 1 0 6 aは、 断片構造予枬プログラムの予枬結果などに関する情報を栌玍する予枬結果情報栌 玍手段である。 第 3図は、 予枬結果デヌタベヌス 1 0 6 aに栌玍される情報の䞀 䟋を瀺す図である。
この予枬結果デヌタベヌス 1 0 6 aに栌玍される情報は、 第 3図に瀺すように、 目的のタンパク質の䞀次配列情報 アミノ酞配列情報 である目的配列デヌタ、 タンパク質構造デヌタベヌスから取埗した目的配列デヌタの立䜓構造デヌタ、 お よび、 各断片構造予枬プログラムの予枬結果デヌタを盞互に関連付けお構成され おいる。
たた、 確信床情報デヌタベヌス 1 0 6 bは、 断片構造予枬プログラムの断片構 造予枬結果デヌタに察する確信床を瀺す確信床情報を栌玍する予枬結果情報栌玍 手段である。 䟋えば、 シミュレヌション結果の粟床の暙準的な倀 䟋えば、 断片 構造予枬結果ず実際の立䜓構造デヌタずの䞀臎率であるシミュレヌシペン粟床が 6 0 %の堎合など の確信床を 1ずし、 暙準倀より粟床が高い堎合にはその粟床 に応じお確信床の倀を倧きくし、 たた、 暙準倀より粟床が䜎い堎合にはその粟床 に応じお確信床の倀を小さく しおもよい。 さらに、 断片構造予枬プログラムごず、 構造ごず、 各配列におけるアミノ酞ごずに確信床を蚭定しおもよレ、。 すなわち、 䟋えば、 ある断片構造予枬プログラムがある配列のあるァミノ酞に぀いおその断 片構造を予枬するずき、 その構造が a構造である確信床、 b構造である確信床等 をそれぞれ別々に蚭定しおもよい。
たた、 タンパク質構造デヌタベヌス 1 0 6 cは、 タンパク質の立䜓構造デヌタ を栌玍したデヌタべ䞀スである。 タンパク質構造デヌタベヌス 1 0 6 cは、 むン タヌネットを経由しおアクセスする倖郚のタンパク質構造デヌタベヌスであっお もよく、 たた、 これらのデヌタベヌスをコピヌしたり、 オリゞナルの配列情報を 栌玍したり、 さらに独自のァノテヌシペン情報等を付カ卩したりしお䜜成したむン ハりスデヌタベヌスであっおもよレボ。 たた、 第 2図においお、 通信制埡むンタヌフェヌス郚 1 0 4は、 盞互䜜甚郚䜍 予枬装眮 1 0 0ずネットワヌク 3 0 0 (たたはルヌタ等の通信装眮 ずの間にお ける通信制埡を行う。 すなわち、 通信制埡むンタヌフェヌス郚 1 0 4は、 他の端 末ず通信回線を介しおデヌタを通信する機胜を有する。
たた、 第 2図においお、 入出力制埡むンタヌフェヌス郚 1 0 8は、 入力装眮 1 1 2や出力装眮 1 1 4の制埡を行う。 ここで、 出力装眮 1 1 4ずしおは、 モニタ (家庭甚テレビを含む の他、 スピヌカを甚いるこずができる なお、 以䞋にお レ、おは出力装眮をモニタずしお蚘茉する 。 たた、 入力装眮 1 1 2ずしおは、 キ 䞀ボヌド、 マりス、 および、 マむク等を甚いるこずができる。 たた、 モニタも、 マりスず協働しおポむンティングデバむス機胜を実珟する。
たた、 第 2図においお、 制埡郚 1 0 2は、 O S (O p e r a t i n g S y s t e m) 等の制埡プログラム、 各皮の凊理手順等を芏定したプログラム、 および 所芁デヌタを栌玍するための内郚メモリを有し、 これらのプログラム等により、 皮々の凊理を実行するための情報凊理を行う。 制埡郚 1 0 2は、 機胜抂念的に、 目的配列入力郚 1 0 2 a、 断片構造予枬プロダラム実行郚 1 0 2 b、 断片構造予 枬プログラム 1 0 2 c、 予枬結果比范郚 1 0 2 d、 フラストレヌション蚈算郚 1 0 2 e、 盞互䜜甚郚䜍予枬郚 1 0 2 f 、 立䜓構造デヌタ取埗郚 1 0 2 g、 および、 確信床情報蚭定郚 1 0 2 hを備えお構成されおいる。
このうち、 目的配列入力郚 1 0 2 aは、 目的のタンパク質の䞀次配列情報 目 的配列デヌタ を入力する入力手段である。 たた、 断片構造予枬プログラム実行 郚 1 0 2 bは、 断片構造予枬プログラムに察しお入力手段により入力された䞀次 配列情報 目的配列デヌタ の断片構造予枬シミュレヌションを実行させる断片 構造予枬プログラム実行手段である。 たた、 断片構造予枬プログラム 1 0 2 cは、 タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造予 枬プログラムである。
たた、 予枬結果比范郚 1 0 2 dは、 断片構造予枬プログラムの断片構造予枬結 果を比范する予枬結果比范手段、 および、 断片構造予枬プログラムの断片構造予 枬結果ず立䜓構造デヌタ取埗手段により取埗した立䜓構造デヌタずを比范する予 枬結果比范手段である。 たた、 フラストレヌシペン蚈算郚 1 0 2 eは、 予枬結果 比范手段による比范結果に基づいお、 目的のタンパク質の䞀次配列情報 目的配 列デヌタ の局所郚分のフラストレヌシペンを蚈算するフラストレヌシペン蚈算 手段、 および、 確信床情報蚭定手段により蚭定された確信床情報および比范結果 に基づいお、 局所郚分のフラストレヌションを蚈算するフラストレヌシペン蚈算 手段である。
たた、 盞互䜜甚郚䜍予枬郚 1 0 2 f は、 フラストレヌシペン蚈算手段により蚈 算された局所郚分のフラストレヌシペンにより目的のタンパク質の盞互䜜甚郚䜍 を予枬する盞互䜜甚郚䜍予枬手段である。 たた、 立䜓構造デヌタ取埗郚 1 0 2 g は、 目的のタンパク質の立䜓構造デヌタを取埗する立䜓構造デヌタ取埗手段であ る。 たた、 確信床情報蚭定郚 1 0 2 hは、 断片構造予枬プログラムの断片構造予 枬結果に察する確信床を瀺す確信床情報を蚭定する確信床情報蚭定手段である。 なお、 これら各郚によっお行なわれる凊理の詳现に぀いおは、 埌述する。
[システムの凊理]
次に、 このように構成された本実斜の圢態における本システムの凊理の䞀䟋に ぀いお、 以䞋に第 4図〜第 7図を参照しお詳现に説明する。
[メむン凊理]
次に、 メむン凊理の詳现に぀いお第 4図を参照しお説明する。 第 4図は、 本実 斜の圢態における本システムのメむン凊理の䞀䟋を瀺すフロヌチダ䞀トである。 たず、 盞互䜜甚郚䜍予枬装眮 1 0 0は、 目的配列入力郚 1 0 2 aの凊理により、 利甚者に察しお目的のタンパク質の䞀次配列情報 目的配列デヌタ を入力させ る ステップ S A— 1 )。
぀いで、 盞互䜜甚郚䜍予枬装眮 1 0 0は、 立䜓構造デヌタ取埗郚 1 0 2 gの凊 理により、 利甚者が入力した目的配列デヌタの立䜓構造デヌタを取埗する ステ ップ S A— 2 )。
ここで、 ステップ S A— 2においお、 立䜓構造デヌタ取埗郚 1 0 2 gにより実 行される立䜓構造デ䞀タ取埗凊理の詳现に぀いお第 5図を参照しお説明する。 第 5図は、 本実斜の圢態における本システムの立䜓構造デヌタ取埗凊理の䞀䟋を瀺 すフロヌチダ䞀トである。
たず、 立䜓構造デヌタ取埗郚 1 0 2 gは、 タンパク質構造デヌタベヌス 1 0 6 cを参照しお目的配列デヌタが登録されおいるか刀定する ステップ S B— 1 ) 。 ステップ S B— 1においお、 目的配列デヌタがタンパク質構造デヌタベヌス 1 0 6 cに登録されおいる堎合には、 立䜓構造デヌタ取埗郚 1 0 2 gは、 タンパク質 構造デヌタベヌス 1 0 6 cから目的配列デヌタの立䜓構造デヌタを取埗しお予枬 結果デヌタベヌス 1 0 6 aの所定の蚘憶領域に栌玍する ステップ S B— 2 ) 。 䞀方、 ステップ S B— 1においお、 目的配列デヌタがタンパク質構造デヌタべ ヌス 1 0 6 cに登録されおいない堎合には、 立䜓構造デヌタ取埗郚 1 0 2 gは、 目的配列デヌタに類䌌する配列のタンパク質の立䜓構造デヌタがタンパク質構造 デヌタベヌス 1 0 6 cに存圚する力刀断する ステップ S B— 3 ) 。 すなわち、 立䜓構造デヌタ取埗郚 1 0 2 gは、 䟋えば、 配列間のホモロゞ䞀を刀定するプロ グラムを甚いお、 目的配列デヌタず、 タンパク質構造デヌタベヌス 1 0 6 cに登 録された構造既知のタンパク質に察応する配列デヌタずを比范しお、 高い盞同性 を有する配列デヌタ 目的配列デヌタの䞀郚分に察応するものであっおもよい が存圚するか吊かを刀断する。
ステップ S B— 3においお、 目的配列デヌタに類䌌する配列のタンパク質の立 䜓構造デヌタがタンパク質構造デヌタベヌス 1 0 6 cに存圚する堎合には、 立䜓 構造デヌタ取埗郚 1 0 2 gは、 類䌌郚分の立䜓構造デヌタを予枬結果デヌタべ䞀 ス 1 0 6 aの所定の蚘憶領域に栌玍する ステップ S B— 4 ) 。 なお、 目的配列 デヌタのうち䞀郚分に぀いお立䜓構造デヌタが存圚する堎合には、 立䜓構造デヌ タが存圚する郚分に぀いお、 圓該立䜓構造デヌタを予枬結果デヌタベヌス 1 0 6 aに栌玍する。
䞀方、 ステップ S B— 3においお、 目的配列デヌタに類䌌する配列のタンパク 質の立䜓構造デヌタがタンパク質構造デヌタベヌス 1 0 6 cに存圚しない堎合に は、 立䜓構造デヌタ取埗凊理が終了する。
再び第 4図に戻り、 盞互䜜甚郚䜍予枬装眮 100は、 断片構造予枬プログラム 実行郚 102 bの凊理により、 目的配列デヌタを 1぀たたは 2぀以䞊の断片構造 予枬プログラム 102 cに実行させる ステップ S A— 3) 。 すなわち、 断片構 造予枬プログラム実行郚 102 bは、 䟋えば、 目的配列デヌタを所定のフォヌマ ットに倉換したり、 たた、 目的配列デヌタに所定のぞッダ情報などを远加したり するこずにより、 各断片構造予枬プログラム 102 cの入力圢匏を合わせた埌、 断片構造予枬プログラム 102 cを実行する。 ここで、 断片構造予枬プログラム 102 cは、 盞互䜜甚郚䜍予枬装眮 100の内郚に存圚するプログラムであっお もよく、 たた、 ネットワヌク 300を介しおリモヌトで実行するこずができる倖 郚システム 200の倖郚プログラムであっおもよい。
ここで、 断片構造予枬プログラム実行郚 102 bは、 以䞋のいずれかの手法に より断片構造を求めおもよい。
( 1 ) ォヌ゜ログ o r t h o 1 o g) 盞同性解析
ある遺䌝子 X、 Yのォヌ゜ログ X' 、 Y' があり、 X' 、 Y' が盞互䜜甚する こずが既知の堎合、 X、 Yも盞互䜜甚する可胜性が高いだろうず考える解析手法 である。
(2) ロれッタストヌン Ro z e t t a S t o n e) 法
ある生物皮の遺䌝子 X、 Yが、 他生物皮遺䌝子の遺䌝子 Zず、 䟋えば、 前半郚 分は Xず䌌おいる、 埌半郚分は Yず䌌おいるずいう状況のずき、 進化により以前 は䞀぀の遺䌝子 Zだったものが X、 Yに分離したず考え、 Xず Yは盞互䜜甚する 可胜性が高いず考える解析手法である。
( 3 ) スレッディング t h r e a d i n g) 法
構造情報から 3Dプロファむルを䜜り、 これを甚いお配列ずアラむンメントを 行うこずにより、 構造予枬を行う手法である。
(4) トポロゞヌ 'フィンガヌプリント法  t o p 0 1 o g y f i n g e r p r i n t法 あるタンパク質 Aの構造の内倖性、 距離マップなどを甚いお、 その構造の t o p o 1 o g y p r i n tず呌ばれるパラメヌタ その構造における゚ネルギヌ 関数の係数等に察応する を抜出し、 このパラメヌタをタンパク質 Bの配列に適 甚するこずにより、 アラむンメントを行う手法である。
(5) モチヌフ怜玢法
モチヌフを登録したデヌタベヌス 䟋えば、 PROS I TE、 P f amなど に登録されおいるモチヌフをキヌにしお怜玢するこずにより機胜 構造 を予枬 する手法である。 同じ機胜モチヌフを持っおいるタンパク質は同様の機胜 構造 ) をも぀可胜性が高いず考える。
(6) モゞュヌル怜玢 3Dキヌノヌト 法
モゞュヌルずは、 球状タンパク質においおコンパクトな構造をずる 15残基皋 床のァミノ酞配列であり、 むントロンがモゞナヌ の境界ずよく察応しおいるず 蚀われおいるこずから、 色々なタンパク質に存圚する共通のモゞュヌル構造から ァミノ酞配列のパタヌンを抜出し、 それをキヌにしお怜玢するこずにより構造予 枬を行う手法である。 機胜に関わるモゞュヌル構造から抜出された特城的なアミ ノ酞配列の類䌌性は、 それらのタンパク質間での機胜の類䌌性を意味するず考え られる。
( 7 ) 進ィ匕远跡 f£ (Ev o l u t i o n a r y t r a c e me t h o d) あるタンパク質の立䜓構造ずそのォヌ゜ログのマルチプルァラむンメントが䞎 えられたずき、 配列の倉化を進化的に远うこずによっお、 基質結合郚䜍や、 別の タンパク質ずの盞互䜜甚郚䜍を予枬する方法である。
(8) ホモ口ゞヌプ口ファむル法 HMM法
ある配列 Aがあったずき、 それのファミリヌやォヌ゜ログなどの関連タンパク 質があり、 それらのアラむンメントがずれた堎合に、 配列 Aたたはそのファミリ 䞀などに関しおプロフアむノレ行列を䜜成する。 これず配列 B (あるいは配列 Bに 関しおも同様なこずを行った配列 Bのプロファむル ずのァラむンメントをずる 手法である。 本手法によれば、 配列 Aず配列 Bずの間のアラむンメントよりも、 より遠くの関係を怜玢するこずができる。
( 9 ) F u g u e
類瞁タンパク質のアミノ酞配列保存性を、 立䜓構造䞊どの郚分で保存されおい るかにより分類し、 この情報を甚いお埓来のものより感床の高い B L O S UMの ような構造䞀配列の眮換マトリックスを䜜成する手法である。 本手法によれば、 マトリックスを甚いおァラむンメントするこずにより、 より感床の高いァラむン メントが可胜ずなる。
なお、 本発明は、 これらの手法に限定されず、 断片構造を予枬するいかなる手 法を甚いおもよい。
぀いで、 断片構造予枬プログラム実行郚 1 0 2 bは、 各断片構造予枬プロダラ ム 1 0 2 cのシミュレヌシペン結果である断片構造予枬結果を予枬結果デヌタべ ヌス 1 0 6 aの所定の蚘憶領域に栌玍する ステップ S A— 4 ) 。
぀いで、 盞互䜜甚郚䜍予枬装眮 1 0 0は、 予枬結果比范郚 1 0 2 dの凊理によ り、 予枬結果デヌタベヌス 1 0 6 aに栌玍された目的配列デヌタに察する各断片 構造予枬プログラム 1 0 2 cの断片構造予枬結果を比范する ステップ S A— 5 ) 。 すなわち、 予枬結果比范郚 1 0 2 dは、 各断片構造予枬プログラム 1 0 2 c の断片構造予枬結果に぀いお、 目的配列デヌタの先頭から最埌たでの各予枬結果 を比范する。 なお、 ステップ S A— 2においお、 断片構造予枬プログラム実行郚 1 0 2 bが目的配列デヌタに察応する立䜓構造デヌタを取埗できた堎合、 すなわ ち、 予枬結果デヌタベヌス 1 0 6 aに目的配列デヌタの立䜓構造デヌタが栌玍さ れおいる堎合には、 立䜓構造デヌタず各断片構造予枬プログラム 1 0 2 cの断片 構造予枬結果ずを比范する。
぀いで、 盞互䜜甚郚䜍予枬装眮 1 0 0は、 フラストレヌション蚈算郚 1 0 2 e の凊理により、 目的配列デヌタの局所郚分のフラス トレヌシペンのスコアを蚈算 する ステップ S A— 6 ) 。 ここで、 第 6図は、 本システムのフラストレヌショ ン蚈算郚 1 0 2 eにより実行されるフラストレヌシペン実行凊理の䞀䟋を瀺すフ ロヌチャヌトである。 第 6図に瀺すように、 フラストレヌシペン蚈算郚 1 0 2 eによるフラストレヌ シペンのスコアの蚈算方法は、 䟋えば、 断片構造予枬プログラムが異なる断片構 造予枬結果を出力した局所郚分に぀いお、 結果が異なる断片構造予枬プログラム の数に応じおスコアを増枛しおもよく、 あるいは、 異なる予枬結果のそれぞれの 構造における確信床の平均倀や分散倀などに応じおフラストレヌションを増枛し おもよく、 たた、 断片構造予枬プログラムが異なる断片構造予枬結果を出力した 局所郚分に぀いお、 アミノ酞配列を分子力孊たたは分子動力孊などの手法を甚い お゚ネルギヌ量を求めその゚ネルギヌ量を甚いおフラストレヌシペンを蚈算しお もよレ、 ステップ S C— 1 ) 。
たた、 フラストレヌシペン蚈算郚 1 0 2 eは、 立䜓構造デヌタず予枬プロダラ ムの断片構造予枬結果ずが異なっおいる郚分に぀いお、 高いフラストレヌション のスコアを蚈算しおもよい ステップ S C— 2 ) 。 䟋えば、 立䜓構造デヌタず異 なる断片構造予枬結果を出力した断片構造予枬プログラムの数に応じおスコアを 増枛しおもよレ、。
たた、 フラストレヌシペン蚈算郚 1 0 2 eは、 確信床情報デヌタベヌス 1 0 6 bを参照しお、 予め確信床情報蚭定郚 1 0 2 hの凊理により栌玍された各断片構 造予枬プログラム 1 0 2 cの確信床情報を取埗し、 確信床情報に基づいおフラス トレヌシペンのスコアを蚈算しおもよい ステップ S C— 3 ) 。 すなわち、 フラ ストレヌション蚈算郚 1 0 2 eは、 シミュレヌション粟床の高い断片構造予枬プ ログラム 1 0 2 cの断片構造予枬結果に高い重みを付けお、 フラストレヌション のスコアを蚈算する。
ここで、 確信床情報蚭定郚 1 0 2 hによる確信床情報の蚭定の䞀䟋を瀺す。 た ず、 確信床情報蚭定郚 1 0 2 hは、 各断片構造予枬プログラム 1 0 2 cの断片構 造予枬結果ず、 立䜓構造デヌタずを比范しお、 各断片構造予枬プログラム 1 0 2 cの断片構造予枬結果の粟床 䞀臎率 を蚈算する。 そしお、 確信床情報蚭定郚 1 0 2 hは、 各断片構造予枬プログラム 1 0 2 cの粟床の平均倀を暙準の確信床 情報 䟋えば、 1 ) ずしお蚭定し、 平均倀以䞊の粟床に぀いおは暙準の確信床情 報よりも高い倀 䟋えば、 1より倧きい数 を蚈算し、 平均倀以䞋の粟床に぀い おは暙準の確信床情報よりも䜎い倀 䟋えば、 1より小さい数 を蚈算しお、 確 信床情報デヌタベヌス 1 0 6 bの所定の蚘憶領域に栌玍する。
なお、 確信床情報蚭定郚 1 0 2 hは、 各断片構造予枬プログラム 1 0 2 cの確 信床情報を各配列䞭の各アミノ酞 残基 毎に蚭定しおもよい。 すなわち、 各断 片構造予枬プログラム 1 0 2 cによる配列の予枬結果に぀き配列䞭のァミノ酞毎 に断片構造予枬プログラム 1 0 2 cの確信床情報を蚭定しおもよい 䟋えば、 配 列䞭の䞀番目のアミノ酞に぀いお、 プログラム Aは、 a構造の確信床情報が 1 . 5であり、 b構造の確信床情報が 0 . 7であり、 c構造の確信床情報が 1 . 1で ある等 。
たた、 確信床情報蚭定郚 1 0 2 hは、 各断片構造予枬プログラム 1 0 2 cの確 信床情報を構造毎に蚭定しおもよい。 すなわち、 各断片構造予枬プログラム 1 0 2 cによっおは、 特定の構造に぀いお高い粟床を有するものや䜎い粟床を有する ものが存圚するため、 構造毎に断片構造予枬プログラム 1 0 2 cの確信床情報を 蚭定しおもよい 䟋えば、 プログラム Aは、 a構造の確信床情報が 1 . 5であり、 b構造の確信床情報が 0 . 7であり、 c構造の確信床情報が 1 . 1である等 。 再び第 4図に戻り、 盞互䜜甚郚䜍予枬装眮 1 0 0は、 盞互䜜甚郚䜍予枬郚 1 0 2 f の凊理により、 蚈算された局所郚分のフラストレヌシペンのスコアにより目 的配列デヌタのうち盞互䜜甚郚䜍ずなる局所郚分を予枬する ステップ S A— 7 ) 。 すなわち、 盞互䜜甚郚䜍予枬郚 1 0 2 f は、 䟋えば、 䞀定の閟倀を超えるフ ラストレヌシペンのスコアである局所郚分を盞互䜜甚郚䜍ず予枬する。
぀いで、 盞互䜜甚郚䜍予枬装眮 1 0 0は、 配列デヌタの盞互䜜甚郚䜍の予枬結 果を出力装眮 1 1 4に出力する ステップ S A— 8 ) 。
ここで、 第 7図は、 盞互䜜甚郚䜍予枬装眮 1 0 0の出力装眮 1 1 4に衚瀺され る盞互䜜甚郚䜍予枬結果の衚瀺画面の䞀䟋を瀺す図である。 この図に瀺すように 盞互䜜甚郚䜍予枬結果の衚瀺画面は、 䟋えば、 目的配列デヌタの配列情報の衚瀺 領域 MA— 1、 盞互䜜甚郚䜍ず予枬される局所郚分の衚瀺領域 MA— 2および M A— 3、 盞互領域郚䜍ず予枬される局所郚分のフラストレヌションのスコアの衚 瀺領域 MA— 4および MA— 5等を含んで構成されおいる。 これにお、 メむン凊 理が終了する。
[他の実斜の圢態]
さお、 これたで本発明の実斜の圢態に぀いお説明したが、 本発明は、 䞊述した 実斜の圢態以倖にも、 䞊蚘特蚱請求の範囲に蚘茉した技術的思想の範囲内におい お皮々の異なる実斜の圢態にお実斜されおよいものである。
䟋えば、 盞互䜜甚郚䜍予枬装眮 1 0 0がスタンドアロヌンの圢態で盞互䜜甚郚 䜍予枬を行う堎合を䞀䟋に説明したが、 盞互䜜甚郚䜍予枬装眮 1 00ずは別筐䜓 で構成されるクラむアント端末からの芁求に応じお盞互䜜甚郚䜍予枬を行い、 そ の予枬結果を圓該クラむアント端末に返华するように構成しおもよレ、。
たた、 断片構造予枬プログラムが甚いる予枬手法は、 いかなる方法を甚いお予 枬するものであっおもよい。
たた、 実斜圢態においお説明した各凊理のうち、 自動的に行なわれるものずし お説明した凊理の党郚たたは䞀郚を手動的に行うこずもでき、 あるいは、 手動的 に行なわれるものずしお説明した凊理の党郚たたは䞀郚を公知の方法で自動的に 行うこずもできる。
この他、 䞊蚘文曞䞭や図面䞭で瀺した凊理手順、 制埡手順、 具䜓的名称、 各皮 の登録デヌタや怜玢条件等のパラメヌタを含む情報、 画面䟋、 デヌタベヌス構成 に぀いおは、 特蚘する堎合を陀いお任意に倉曎するこずができる。
たた、 盞互䜜甚郚䜍予枬装眮 1 00に関しお、 図瀺の各構成芁玠は機胜抂念的 なものであり、 必ずしも物理的に図瀺の劂く構成されおいるこずを芁しない。 䟋えば、 盞互䜜甚郚䜍予枬装眮 1 00の各サヌバが備える凊理機胜、 特に制埡 郚にお行なわれる各凊理機胜に぀いおは、 その党郚たたは任意の䞀郚を、 C PU (C e n t r a l P r o c e s s i n g Un i t) および圓該 C PUにお解 釈実行されるプログラムにお実珟するこずができ、 あるいは、 ワむダヌドロゞッ クによるハヌドりェアずしお実珟するこずも可胜である。 なお、 プログラムは、 埌述する蚘録媒䜓に蚘録されおおり、 必芁に応じお盞互䜜甚郚䜍予枬装眮 100 に機械的に読み取られる。
たた、 このプログラムは、 盞互䜜甚郚^:予枬装眮 100に察しお任意のネット ワヌクを介しお接続されたアプリケヌシペンプログラムサヌバに蚘録されおもよ く、 必芁に応じおその党郚たたは䞀郚をダりンロヌドするこずも可胜である。 たた、 蚘憶郚 106に栌玍される各皮のデヌタベヌス等 予枬結果デヌタべ䞀 ス 106 a〜タンパク質構造デヌタベヌス 106 c) は、 RAM、 ROM等のメ モリ装眮、 ハヌドディスク等の固定ディスク装眮、 フレキシブルディスク、 光デ むスク等のストレ䞀ゞ手段であり、 各皮凊理やりェブサむ ト提䟛に甚いる各皮の プログラムゃテヌブルやフアむルゃデ䞀タベヌスゃゥヱブベヌゞ甚フアむル等を 栌玍する。
たた、 盞互䜜甚郚䜍予枬装眮 1◩ 0は、 既知のパヌ゜ナルコンピュヌタ、 ヮヌ クステヌション等の情報凊理端末等の情報凊理装眮にプリンタゃモニタやィメヌ ゞスキャナ等の呚蟺装眮を接続し、 該情報凊理装眮に本発明の方法を実珟させる ゜フトりェア プログラム、 デヌタ等を含む を実装するこずにより実珟しおも よい。
さらに、 盞互䜜甚郚䜍予枬装眮 100の分散 ·統合の具䜓的圢態は図瀺のもの に限られず、 その党郚たたは䞀郚を、 各皮の負荷等に応じた任意の単䜍で、 機胜 的たたは物理的に分散 '統合しお構成するこずができる。 䟋えば、 各デヌタべ䞀 スを独立したデヌタベヌス装眮ずしお独立に構成しおもよく、 たた、 凊理の䞀郚 を CG I (Commo n Ga t ewa y I n t e r f a c e ) を甚いお実珟 しおもよレ、。
たた、 本発明にかかるプログラムを、 コンピュヌタ読み取り可胜な蚘録媒䜓に 栌玍するこずもできる。 ここで、 この 「蚘録媒䜓」 ずは、 フレキシブルディスク、 光磁気ディスク、 ROM、 E PROM, EEPROM、 CD-ROM, MO、 D VD等の任意の 「可搬甚の物理媒䜓」 や、 各皮コンピュヌタシステムに内蔵され る ROM、 RAM, HD等の任意の 「固定甚の物理媒䜓」 、 あるいは、 LAN、 WAN, むンタヌネットに代衚されるネットワヌクを介しおプログラムを送信す る堎合の通信回線や搬送波のように、 短期にプログラムを保持する 「通信媒䜓」 を含むものずする。
たた、 「プログラム」 ずは、 任意の蚀語や蚘述方法にお蚘述されたデヌタ凊理 方法であり、 ゜ヌスコヌドやバむナリコヌド等の圢匏を問わない。 なお、 「プロ グラム」 は必ずしも単䞀的に構成されるものに限られず、 耇数のモゞュヌルゃラ ィブラリずしお分散構成されるものや、 OS (O p e r a t i n g S y s t e m) に代衚される別個のプログラムず協働しおその機胜を達成するものをも含む。 なお、 実斜の圢態に瀺した各装眮においお蚘録媒䜓を読み取るための具䜓的な構 成、 読み取り手順、 あるいは、 読み取り埌のむンストヌル手順等に぀いおは、 å‘š 知の構成や手順を甚いるこずができる。
たた、 ネッ トワヌク 3 00は、 盞互䜜甚郚䜍予枬装眮 1 0 0ず倖郚システム 2 00ずを盞互に接続する機胜を有し、 䟋えば、 むンタヌネットや、 むントラネッ トゃ、 LAN (有線/無線の双方を含む や、 VANや、 パ゜コン通信網や、 公、 衆電話網 アナログ/デゞタルの双方を含む や、 専甚回線網 アナログ デゞ タルの双方を含む や、 CATV網や、 I MT 2 0 00方匏、 G SM方匏たたは P DCZP DC— P方匏等の携垯回線亀換網/携垯バケツト亀換網や、 無線呌出 網や、 B 1 u e t o o t h等の局所無線網や、 PHS網や、 C S、 B Sたたは I SDB等の衛星通信網等のうちいずれかを含んでもよい。 すなわち、 本システム は、 有線 ·無線を問わず任意のネットワヌクを介しお、 各皮デヌタを送受信する こずができる。
以䞊詳现に説明したように、 本発明によれば、 目的のタンパク質の䞀次配列情 報を入力し、 タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬す る断片構造予枬プログラムに察しお入力された䞀次配列情報の断片構造予枬シミ ナレヌシペンを実行させ、 断片構造予枬プログラムの断片構造予枬結果を比范し、 比范結果に基づいお、 目的のタンパク質の䞀次配列情報の局所郚分のフラストレ ヌシペンを蚈算し、 蚈算された局所郚分のフラストレヌシペンにより目的のタン パク質の盞互䜜甚郚䜍を予枬するので、 タンパク質の䞀次配列情報にぉレ、おフラ ストレヌシペンのある局所郚䜍を発芋するこずにより盞互䜜甚郚䜍を効果的に予 枬するこずができる盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 および、 蚘録媒䜓を提䟛するこずができる。
たた、 本発明によれば、 目的のタンパク質の䞀次配列情報を入力し、 目的のタ ンパク質の立䜓構造デヌタを取埗し、 タンパク質の䞀次配列情報から圓該タンパ ク質の断片構造を予枬する断片構造予枬プログラムに察しお入力された䞀次配列 情報の断片構造予枬シミュレヌションを実行させ、 断片構造予枬プログラムの断 片構造予枬結果ず、 取埗した立䜓構造デヌタずを比范し、 比范結果に基づいお、 目的のタンパク質の䞀次配列情報の局所郚分のフラストレヌシペンを蚈算し、 蚈 算された局所郚分のフラストレヌションにより目的のタンパク質の盞互䜜甚郚䜍 を予枬するので、 断片構造予枬プログラムの予枬結果ず目的のタンパク質の実際 の断片構造ずの差を芋るこずにより、 より明確にフラストレヌシペンのある局所 郚䜍 盞互䜜甚郚䜍になっおいる確率の高い郚䜍 を芋぀けるこずが可胜になる 盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 および、 蚘録媒䜓 を提䟛するこずができる。
さらに、 本発明によれば、 断片構造予枬プログラムの断片構造予枬結果に察す る確信床を瀺す確信床情報を蚭定し、 蚭定された確信床情報および比范結果に基 づいお、 局所郚分のフラストレヌションを蚈算するので、 確信床情報が高い す なわち、 シミュレヌションの粟床の高い プログラムによる断片構造予枬結果デ ヌタに察する重みを高くするこずにより、 フラストレヌション蚈算においおシミ ナレヌシペン結果に察する確信床を反映させるこずができる盞互䜜甚郚䜍予枬装 眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 および、 蚘録媒䜓を提䟛するこずがで さる。 産業䞊の利甚可胜性
以䞊のように、 本発明にかかる盞互䜜甚郚䜍予枬装眮、 盞互䜜甚郚䜍予枬方法、 プログラム、 および、 蚘録媒䜓は、 タンパク質の立䜓構造予枬、 タンパク質の盞 互甚郚䜍の解析、 および、 解析結果を甚いた創薬等に甚いるこずができる。

Claims

請 求 の 範 囲
1 . 目的のタンパク質の䞀次配列情報を入力する入力手段ず、
タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入力手段により入力された䞊蚘䞀次配列情報の断片 構造予枬シミュレヌションを実行させる断片構造予枬プログラム実行手段ず、 䞊蚘断片構造予枬プログラム実行手段による䞊蚘断片構造予枬プログラムの断 片構造予枬結果を比范する予枬結果比范手段ず、
䞊蚘予枬結果比范手段による比范結果に基づいお、 䞊蚘目的のタンパク質の䞀 次配列情報の局所郚分のフラストレヌシペンを蚈算するフラストレヌシペン蚈算 手段ず、
䞊蚘フラストレヌション蚈算手段により蚈算された䞊蚘局所郚分の䞊蚘フラス トレヌションにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜甚郚 䜍予枬手段ず、
を備えたこずを特城ずする盞互䜜甚郚䜍予枬装眮。
2 . 目的のタンパク質の䞀次配列情報を入力する入力手段ず、
䞊蚘目的のタンパク質の立䜓構造デヌタを取埗する立䜓構造デヌタ取埗手段ず、 タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入力手段により入力された䞊蚘䞀次配列情報の断片 構造予枬シミュレヌションを実行させる断片構造予枬プログラム実行手段ず、 䞊蚘断片構造予枬プロダラム実行手段による䞊蚘断片構造予枬プログラムの断 片構造予枬結果ず、 䞊蚘立䜓構造デヌタ取埗手段により取埗した䞊蚘立䜓構造デ ヌタずを比范する予枬結果比范手段ず、
䞊蚘予枬結果比范手段による比范結果に基づいお、 䞊蚘目的のタンパク質の䞀 次配列情報の局所郚分のフラストレヌシペンを蚈算するフラストレヌション蚈算 手段ず、 䞊蚘フラストレヌション蚈算手段により蚈算された䞊蚘局所郚分の䞊蚘フラス トレヌションにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜甚郚 䜍予枬手段ず、
を備えたこずを特城ずする盞互䜜甚郚䜍予枬装眮。
3 . 䞊蚘断片構造予枬プログラムの䞊蚘断片構造予枬結果に察する確信床を瀺 す確信床情報を蚭定する確信床情報蚭定手段、
をさらに備え、
䞊蚘フラストレヌシペン蚈算手段は、 䞊蚘確信床情報蚭定手段により蚭定され た䞊蚘確信床情報および䞊蚘比范結果に基づいお、 䞊蚘局所郚分の䞊蚘フラスト レヌションを蚈算するこずを特城ずする請求の範囲第 1項たたは第 2項に蚘茉の 盞互䜜甚郚䜍予枬装眮。
4 . 目的のタンパク質の䞀次配列情報を入力する入力ステップず、
タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入力ステップにより入力された䞊蚘䞀次配列情報の 断片構造予枬シミュレヌションを実行させる断片構造予枬プログラム実行ステッ プず、
䞊蚘断片構造予枬プロダラム実行ステップによる䞊蚘断片構造予枬プログラム の断片構造予枬結果を比范する予枬結果比范ステップず、
䞊蚘予枬結果比范ステップによる比范結果に基づいお、 䞊蚘目的のタンパク質 の䞀次配列情報の局所郚分のフラストレヌションを蚈算するフラストレヌシペン 䞊蚘フラストレヌション蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フ ラストレヌシペンにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜 甚郚䜍予枬ステップず、
を含むこずを特城ずする盞互䜜甚郚䜍予枬方法。
5 . 目的のタンパク質の䞀次配列情報を入力する入力ステップず、
䞊蚘目的のタンパク質の立䜓構造デヌタを取埗する立䜓構造デヌタ取埗ステッ プず、
タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入力ステップにより入力された䞊蚘䞀次配列情報の 断片構造予枬シミュレヌションを実行させる断片構造予枬プログラム実行ステッ プず、
䞊蚘断片構造予枬プログラム実行ステップによる䞊蚘断片構造予枬プログラム の断片構造予枬結果ず、 䞊蚘立䜓構造デヌタ取埗ステップにより取埗した䞊蚘立 䜓構造デヌタずを比范する予枬結果比范ステツプず、
䞊蚘予枬結果比范ステップによる比范結果に基づいお、 䞊蚘目的のタンパク質 の䞀次配列情報の局所郚分のフラストレヌションを蚈算するフラストレヌシペン 蚈算ステップず、
䞊蚘フラストレヌシペン蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フ ラストレヌションにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜 甚郚䜍予枬ステップず、
を含むこずを特ŸŸずする盞互䜜甚郚䜍予枬方法。
6 . 䞊蚘断片構造予枬プログラムの䞊蚘断片構造予枬結果に察する確信床を瀺 す確信床情報を蚭定する確信床情報蚭定ステツプ、
をさらに含み、
䞊蚘フラストレヌション蚈算ステップは、 䞊蚘確信床情報蚭定ステップにより 蚭定された䞊蚘確信床情報および䞊蚘比范結果に基づいお、 䞊蚘局所郚分の䞊蚘 フラストレヌションを蚈算するこずを特城ずする請求の範囲第 4項たたは第 5項 に蚘茉の盞互䜜甚郚䜍予枬方法。
7 . 目的のタンパク質の䞀次配列情報を入力する入力ステップず、
タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入カステツプにより入力された䞊蚘䞀次配列情報の 断片構造予枬シミュレヌシペンを実行させる断片構造予枬プログラム実行ステツ プず、
䞊蚘断片構造予枬プログラム実行ステップによる䞊蚘断片構造予枬プロダラム の断片構造予枬結果を比范する予枬結果比范ステップず、
䞊蚘予枬結果比范ステップによる比范結果に基づレ、お、 䞊蚘目的のタンパク質 の䞀次配列情報の局所郚分のフラストレヌションを蚈算するフラストレヌション 蚈算ステップず、
䞊蚘フラストレヌション蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フ ラストレヌションにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜 甚郚䜍予枬ステップず、
を含むこずを特城ずする盞互䜜甚郚䜍予枬方法をコンピュヌタに実行させるた めのプログラム。
8 . 目的のタンパク質の䞀次配列情報を入力する入力ステップず、
䞊蚘目的のタンパク質の立䜓構造デヌタを取埗する立䜓構造デヌタ取埗ステッ プず、
タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入力ステップにより入力された䞊蚘䞀次配列情報の 断片構造予枬シミュレヌションを実行させる断片構造予枬プログラム実行ステッ プず、
䞊蚘断片構造予枬プログラム実行ステップによる䞊蚘断片構造予枬プログラム の断片構造予枬結果ず、 䞊蚘立䜓構造デヌタ取埗ステップにより取埗した䞊蚘立 䜓構造デヌタずを比范する予枬結果比范ステップず、
䞊蚘予枬結果比范ステップによる比范結果に基づいお、 䞊蚘目的のタンパク質 の䞀次配列情報の局所郚分のブラストレヌションを蚈算するフラストレヌション 蚈算ステップず、
䞊蚘フラストレヌション蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フ ラストレヌションにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜 甚郚䜍予枬ステップず、
を含むこずを特城ずする盞互䜜甚郚䜍予枬方法をコンピュヌタに実行させるた めのプログラム。
9 . 䞊蚘断片構造予枬プログラムの䞊蚘断片構造予枬結果に察する確信床を瀺 す確信床情報を蚭定する確信床情報蚭定ステップ、
をさらに含み、
䞊蚘フラストレヌシペン蚈算ステップは、 䞊蚘確信床情報蚭定ステップにより 蚭定された䞊蚘確信床情報および䞊蚘比范結果に基づいお、 䞊蚘局所郚分の䞊蚘 フラストレヌションを蚈算するこずを特城ずする請求の範囲第 7項たたは第 8項 に蚘茉のプログラム。
1 0 . 目的のタンパク質の䞀次配列情報を入力する入力ステップず、
タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入力ステップにより入力された䞊蚘䞀次配列情報の 断片構造予枬シミュレヌションを実行させる断片構造予枬プログラム実行ステッ プず、
䞊蚘断片構造予枬プロダラム実行ステップによる䞊蚘断片構造予枬プロダラム の断片構造予枬結果を比范する予枬結果比范ステップず、
䞊蚘予枬結果比范ステップによる比范結果に基づいお、 䞊蚘目的のタンパク質 の䞀次配列情報の局所郚分のフラストレヌシペンを蚈算するフラストレヌション 蚈算ステップず、
䞊蚘フラストレヌシペン蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フ ラストレヌシペンにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜 甚郚䜍予枬ステップず、
を含むこずを特城ずする盞互䜜甚郚䜍予枬方法をコンピュヌタに実行させるた めのプログラムを蚘録したこずを特城ずするコンピュヌタ読み取り可胜な蚘録媒 䜓。
1 1 . 目的のタンパク質の䞀次配列情報を入力する入力ステップず、
䞊蚘目的のタンパク質の立䜓構造デヌタを取埗する立䜓構造デヌタ取埗ステツ プず、
タンパク質の䞀次配列情報から圓該タンパク質の断片構造を予枬する断片構造 予枬プログラムに察しお䞊蚘入カステツプにより入力された䞊蚘䞀次配列情報の 断片構造予枬シミュレヌシペンを実行させる断片構造予枬プログラム実行ステツ プず、
䞊蚘断片構造予枬プロダラム実行ステップによる䞊蚘断片構造予枬プログラム の断片構造予枬結果ず、 䞊蚘立䜓構造デヌタ取埗ステップにより取埗した䞊蚘立 䜓構造デヌタずを比范する予枬結果比范ステップず、
䞊蚘予枬結果比范ステップによる比范結果に基づいお、 䞊蚘目的のタンパク質 の䞀次配列情報の局所郚分のフラストレヌションを蚈算するフラストレヌシペン 䞊蚘フラストレヌション蚈算ステップにより蚈算された䞊蚘局所郚分の䞊蚘フ ラストレヌションにより䞊蚘目的のタンパク質の盞互䜜甚郚䜍を予枬する盞互䜜 甚郚䜍予枬ステップず、
を含むこずを特城ずする盞互䜜甚郚䜍予枬方法をコンピュヌタに実行させるた めのプログラムを蚘録したこずを特城ずするコンピュヌタ読み取り可胜な蚘録媒 䜓。
1 2 . 䞊蚘断片構造予枬プログラムの䞊蚘断片構造予枬結果に察する確信床を 瀺す確信床情報を蚭定する確信床情報蚭定ステップ、
をさらに含み、
䞊蚘ブラストレヌション蚈算ステップは、 䞊蚘確信床情報蚭定ステップにより 蚭定された䞊蚘確信床情報および䞊蚘比范結果に基づいお、 䞊蚘局所郚分の䞊蚘 フラストレヌションを蚈算するプログラムを蚘録したこずを特城ずする請求の範 囲第 1 0項たたは第 1 1項に蚘茉のコンピュヌタ読み取り可胜な蚘録媒䜓。
PCT/JP2002/013833 2001-12-27 2002-12-27 Appareil de prediction d'un site d'interaction, procede de prediction d'un site d'interaction, programme et support d'enregistrement associes WO2003056462A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US10/500,006 US20050067848A1 (en) 2001-12-27 2002-12-27 Apparatus for predicting interaction site, method of predicting interaction site, program and recording medium
EP02792061A EP1460560A4 (en) 2001-12-27 2002-12-27 APPARATUS FOR PREDICTING AN INTERACTION SITE, METHOD FOR PREDICTING AN INTERACTION SITE, PROGRAM AND RECORDING MEDIUM THEREOF

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001398570A JP3802416B2 (ja) 2001-12-27 2001-12-27 盞互䜜甚郚䜍予枬装眮、盞互䜜甚郚䜍予枬方法、プログラム、および、蚘録媒䜓
JP2001-398570 2001-12-27

Publications (1)

Publication Number Publication Date
WO2003056462A1 true WO2003056462A1 (fr) 2003-07-10

Family

ID=19189363

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/013833 WO2003056462A1 (fr) 2001-12-27 2002-12-27 Appareil de prediction d'un site d'interaction, procede de prediction d'un site d'interaction, programme et support d'enregistrement associes

Country Status (4)

Country Link
US (1) US20050067848A1 (ja)
EP (1) EP1460560A4 (ja)
JP (1) JP3802416B2 (ja)
WO (1) WO2003056462A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005045442A1 (en) * 2003-11-05 2005-05-19 Cambridge University Technical Services Limited Method and apparatus for assessing polypeptide aggregation

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050130224A1 (en) * 2002-05-31 2005-06-16 Celestar Lexico- Sciences, Inc. Interaction predicting device
JP2007265268A (ja) * 2006-03-29 2007-10-11 Fujitsu Ltd 抗原決定基予枬プログラム、抗原決定基予枬装眮、および抗原決定基予枬方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05282381A (ja) * 1992-03-31 1993-10-29 Fujitsu Ltd 蛋癜質分子立䜓構造解析装眮

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU4218799A (en) * 1998-08-25 2000-03-14 Scripps Research Institute, The Methods and systems for predicting protein function
WO2001050355A2 (en) * 2000-01-05 2001-07-12 Structural Bioinformatics Advanced Technologies A/S Computer predictions of molecules

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05282381A (ja) * 1992-03-31 1993-10-29 Fujitsu Ltd 蛋癜質分子立䜓構造解析装眮

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BYSTROFF C. ET AL.: "HMMSTR: a hidden markov model for local sequence-structure correlations in proteins", JOURNAL OF MOLECULAR BIOLOGY, vol. 301, no. 1, 4 April 2000 (2000-04-04), pages 173 - 190, XP004472329 *
BYSTROFF C. ET AL.: "Prediction of local structure in proteins using a library of sequence structure motifs", JOURNAL OF MOLECULAR BIOLOGY, vol. 281, no. 3, 21 August 1998 (1998-08-21), pages 565 - 577, XP004462389 *
HURUTA ET AL.: "Tanpakushitsu no niji kozo yosoku shien expert-expert system", INFORMATION PROCESSING SOCIETY OF JAPAN DAI 33 KAI (SHOWA 61 NEN KOKI) ZENKOKU TAIKAI KOEN RONBUNSHU (II), 1 October 1986 (1986-10-01), pages 1197 - 1198, XP002983845 *
See also references of EP1460560A4 *
SIMONS K.T. ET AL.: "Assembly of protein tertiary structures from fragments with similar local sequences using simulated annealing and Bayesian scoring functions", JOURNAL OF MOLECULAR BIOLOGY, vol. 268, no. 1, 25 April 1997 (1997-04-25), pages 209 - 225, XP004454075 *
SIMONS K.T. ET AL.: "Prospects for ab initio protein structural genomics", JOURNAL OF MOLECULAR BIOLOGY, vol. 306, no. 5, 9 March 2001 (2001-03-09), pages 1191 - 1199, XP004486196 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005045442A1 (en) * 2003-11-05 2005-05-19 Cambridge University Technical Services Limited Method and apparatus for assessing polypeptide aggregation

Also Published As

Publication number Publication date
US20050067848A1 (en) 2005-03-31
JP2003196290A (ja) 2003-07-11
JP3802416B2 (ja) 2006-07-26
EP1460560A1 (en) 2004-09-22
EP1460560A4 (en) 2007-01-24

Similar Documents

Publication Publication Date Title
A. SchÀffer et al. IMPALA: matching a protein sequence against a collection of PSI-BLAST-constructed position-specific score matrices
Eddy Profile hidden Markov models.
Blaabjerg et al. Rapid protein stability prediction using deep learning representations
Han et al. HPID: the human protein interaction database
Hu et al. Mining Protein Contact Maps.
Attwood The quest to deduce protein function from sequence: the role of pattern databases
Yang et al. Accurate disulfide-bonding network predictions improve ab initio structure prediction of cysteine-rich proteins
Werner The state of the art of mammalian promoter recognition
Truong et al. Funneling and frustration in the energy landscapes of some designed and simplified proteins
Singh et al. Application of docking methodologies to modeled proteins
Attwood et al. The PRINTS database of protein fingerprints: a novel information resource for computational molecular biology
Cipcigan et al. Accelerating molecular discovery through data and physical sciences: Applications to peptide-membrane interactions
US20070124081A1 (en) Biological information processing apparatus, biological information processing method and biological information processing program
Rapin et al. The MHC motif viewer: a visualization tool for MHC binding motifs
WO2003056462A1 (fr) Appareil de prediction d'un site d'interaction, procede de prediction d'un site d'interaction, programme et support d'enregistrement associes
Kelley Fold recognition
Karpenko et al. A probabilistic meta-predictor for the MHC class II binding peptides
Sansom Database searching with DNA and protein sequences: An introduction
Marx et al. MScDB: a mass spectrometry-centric protein sequence database for proteomics
JP2003242154A (ja) 遺䌝子発珟情報管理装眮、遺䌝子発珟情報管理方法、プログラム、および、蚘録媒䜓
Parkinson et al. Expressed sequence tags: analysis and annotation
Zhu et al. E2EDA: Protein domain assembly based on end-to-end deep learning
JP2004295606A (ja) 遺䌝子機胜掚定装眮、遺䌝子機胜掚定方法、および、プログラム
Nagl Function prediction from protein sequence
WO2003056461A1 (fr) Dispositif de prediction de structure proteique, procede de prediction de structure proteique, programme et support d'enregistrement associes

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LU MC NL PT SE SI SK TR

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 10500006

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2002792061

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2002792061

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 2002792061

Country of ref document: EP