WO2015199162A1 - 膜タンパク質の熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラム - Google Patents

膜タンパク質の熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラム Download PDF

Info

Publication number
WO2015199162A1
WO2015199162A1 PCT/JP2015/068277 JP2015068277W WO2015199162A1 WO 2015199162 A1 WO2015199162 A1 WO 2015199162A1 JP 2015068277 W JP2015068277 W JP 2015068277W WO 2015199162 A1 WO2015199162 A1 WO 2015199162A1
Authority
WO
WIPO (PCT)
Prior art keywords
amino acid
heat
membrane protein
change
stabilized
Prior art date
Application number
PCT/JP2015/068277
Other languages
English (en)
French (fr)
Inventor
村田 武士
正弘 木下
安田 賢司
勇樹 高椋
健二 水谷
七緒 鈴木
佑太 梶原
Original Assignee
国立研究開発法人科学技術振興機構
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立研究開発法人科学技術振興機構 filed Critical 国立研究開発法人科学技術振興機構
Priority to CN201580033500.8A priority Critical patent/CN106415562B/zh
Priority to US15/321,414 priority patent/US20170212982A1/en
Priority to EP15812344.8A priority patent/EP3163481B1/en
Priority to JP2016529643A priority patent/JP6359656B2/ja
Publication of WO2015199162A1 publication Critical patent/WO2015199162A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/107General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • C12M1/34Measuring or testing with condition measuring or sensing means, e.g. colony counters
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Definitions

  • the present invention relates to a heat-stabilized mutant prediction apparatus for a membrane protein, a heat-stabilized mutant prediction method, and a program.
  • G protein-coupled receptors which are receptors such as hormones and neurotransmitters, form about 800 families, and about 280 types are estimated to be drug discovery targets.
  • each amino acid of the GPCR is exhaustively substituted with alanine, experimentally examined for mutation sites that lead to improved thermal stability, and combinations of these mutation sites STAR (registered trademark) technology is disclosed that greatly improves the thermal stability by performing crystal structure analysis and improves the thermal stability of other types of GPCRs by utilizing the similar structure of GPCRs. ing.
  • the present invention has been made in view of the above problems, and can be used to predict amino acid mutations to be thermally stabilized in a membrane protein by a computer, a heat-stabilized mutant prediction apparatus, a heat-stabilized mutant prediction method, And it aims at providing a program.
  • the heat-stabilized mutant prediction apparatus of the present invention predicts a candidate amino acid mutant that heat-stabilizes a membrane protein, and includes a heat-stabilized mutation having a storage unit and a control unit.
  • the storage unit stores the amino acid sequence of the membrane protein
  • the control unit generates an amino acid sequence of the amino acid variant by introducing an amino acid mutation into the amino acid sequence of the membrane protein.
  • the heat-stabilized mutant predicting apparatus of the present invention is the above-described heat-stabilized mutant predicting apparatus, wherein the calculating means is further configured for the membrane protein and each amino acid mutant based on the amino acid sequence.
  • the calculating means is further configured for the membrane protein and each amino acid mutant based on the amino acid sequence.
  • the heat-stabilized mutant predicting apparatus is the heat-stabilized mutant predicting apparatus described above, wherein the calculation means includes an excluded volume, an exposed surface area, an integrated value of an average curvature of the exposed surface, and an exposed surface.
  • the solvation entropy change is calculated using an integrated methodology of morphometric expression and integral equation theory based on four geometric indicators of the integral value of the Gaussian curvature.
  • the heat-stabilized mutant prediction apparatus of the present invention is the above-mentioned heat-stabilized mutant prediction apparatus, wherein the storage unit further stores structure data of the membrane protein, and the calculation means includes the amino acid Structure optimization is performed based on the array and the structure data.
  • the calculation means first fixes and minimizes heavy atoms of the membrane protein, and then C ⁇ The structure optimization is performed while removing the constraints stepwise by fixing and minimizing carbon and C ⁇ carbon, and finally minimizing without fixing.
  • the heat-stabilized mutant predicting apparatus is the above-described heat-stabilized mutant predicting apparatus, wherein the calculation means has the tertiary structure obtained by extracting the transmembrane site after performing the structure optimization.
  • a change between the solvation entropy and the solvation entropy of the secondary structure obtained by separating the tertiary structure is calculated as the solvation entropy change.
  • the heat-stabilized mutant predicting apparatus is the above-described heat-stabilized mutant predicting apparatus, wherein the calculation means has the tertiary structure that has been subjected to the structure optimization after extracting the transmembrane site.
  • a change between the solvation entropy and the solvation entropy of the secondary structure which has been subjected to the structure optimization after separating the extracted transmembrane site is calculated as the solvation entropy change.
  • the heat-stabilized mutant predicting apparatus is the above-described heat-stabilized mutant predicting apparatus, wherein the calculation means has the tertiary structure obtained by extracting the transmembrane site after performing the structure optimization. Calculating the change in solvation entropy and the change in solvation entropy of the secondary structure obtained by extracting the transmembrane site and separating the transmembrane site and then optimizing the structure. To do.
  • the heat-stabilized mutant predicting apparatus is the above-described heat-stabilized mutant predicting apparatus, wherein the calculation means has the tertiary structure obtained by extracting the transmembrane site after performing the structure optimization.
  • a change between the solvation entropy and the solvation entropy of the primary structure obtained by extracting the transmembrane site and extending the transmembrane site and then optimizing the structure is calculated as the solvation entropy change. .
  • the heat-stabilized mutant predicting apparatus is the above-described heat-stabilized mutant predicting apparatus, wherein the calculation means has the tertiary structure that has been subjected to the structure optimization after extracting the transmembrane site.
  • a change between the solvation entropy and the solvation entropy of the primary structure obtained by extracting the transmembrane site and separating and extending the transmembrane site and then optimizing the structure is calculated as the solvation entropy change.
  • the present invention also relates to a method for predicting a heat-stabilized variant, and is an amino acid that heat-stabilizes the membrane protein, which is executed in a computer having a storage unit and a control unit that store the amino acid sequence of the membrane protein.
  • a heat-stabilized mutant prediction method for predicting a candidate for a mutant wherein a mutation introduction step of generating an amino acid sequence of the amino acid mutant by introducing an amino acid mutation into the amino acid sequence of the membrane protein; Calculate the solvation entropy change from the primary structure to the tertiary structure or from the secondary structure to the tertiary structure at the transmembrane site with structural optimization based on the amino acid sequence for the membrane protein and each amino acid variant The solvation entropy change in the membrane protein and the amino acid Based on the difference between the solvation entropy change in the acid mutant, characterized in that it comprises a and a candidate extraction step of extracting a candidate of amino acid variants for the heat stabilization.
  • the present invention also relates to a program, which is executed on a computer having a storage unit and a control unit for storing the amino acid sequence of the membrane protein in order to predict amino acid variant candidates that thermally stabilize the membrane protein.
  • Solvation entropy change and in the above amino acid variants Serial solvation based on the difference between the entropy change, characterized in that to execute a candidate extraction step of extracting a candidate of amino acid variants for the heat stabilization, the.
  • the present invention also relates to a recording medium, and is characterized by recording the above-described program.
  • the amino acid sequence of the membrane protein is stored, the amino acid sequence of the amino acid variant is generated by introducing an amino acid mutation into the amino acid sequence of the membrane protein, and the amino acid sequence of the membrane protein and each amino acid variant is determined.
  • the candidate for the amino acid variant to be thermally stabilized is extracted, so that the amino acid mutation to be thermally stabilized in the membrane protein can be predicted by a computer (in silico). There is an effect.
  • the present invention provides a morphometric expression and integral equation theory based on four geometrical indicators: the excluded volume, the exposed surface area, the integral value of the average curvature of the exposed surface, and the integral value of the Gaussian curvature of the exposed surface. Since the solvation entropy change is calculated using an integrated methodology, the solvation entropy can be calculated at high speed by simplifying and handling the solute form morphometrically.
  • the present invention further stores structure data of membrane proteins and optimizes the structure based on the amino acid sequence and the structure data. Therefore, the structure can be accurately optimized using the known structure data. There is an effect that can be done.
  • the heavy atoms of the membrane protein are fixed and minimized, then the C ⁇ carbon and C ⁇ carbon are fixed and minimized, and finally, minimization without fixation is performed, thereby restricting in stages. Since the structure is optimized while removing the above, it is possible to obtain a more accurate predicted structure.
  • the present invention calculates the change between the solvation entropy of the tertiary structure obtained by extracting the transmembrane site after the structure optimization and the solvation entropy of the secondary structure from which the tertiary structure is separated as a solvation entropy change Therefore, it is possible to obtain a result with a relatively high predictive predictive value (5/11 as an example).
  • the present invention provides a solvation entropy of a tertiary structure in which structure optimization is performed after taking out the transmembrane site, and a solvation entropy of secondary structure in which structure optimization is performed after separating the taken out transmembrane site. Is calculated as a change in solvation entropy, so that a result with a high predictive predictability (1/4 as an example) can be obtained.
  • the present invention provides the solvation entropy of the tertiary structure in which the transmembrane site is taken out after performing the structure optimization, and the secondary structure in which the structure is optimized after taking out the transmembrane site and separating the transmembrane site. Since the change from the solvation entropy is calculated as the change in solvation entropy, it is possible to obtain a result with a high predictive predictability (3/11 as an example).
  • the present invention provides a solvation entropy of the tertiary structure in which the transmembrane site is extracted after the structure optimization, and a primary structure solvent in which the structure optimization is performed after the transmembrane site is extracted and the transmembrane site is extended. Since the change from the sum entropy is calculated as the change in the solvation entropy, an effect is obtained that a result with a high predictive predictability (5/11 as an example) can be obtained.
  • the present invention relates to the solvation entropy of the tertiary structure in which the structure is optimized after taking out the transmembrane site, and the primary structure in which the structure is optimized after taking out the transmembrane site and extending the transmembrane site. Since the change from the solvation entropy is calculated as the solvation entropy change, it is possible to obtain a result with a high predictive predictability (2/4 as an example).
  • FIG. 3 is a diagram schematically showing rotation, diffusion, inversion, and bending motions of phospholipid molecules in the lipid bilayer membrane.
  • FIG. 4 is a diagram schematically showing the sum R of the radii of hydrocarbon groups and spherical solutes. With the insertion of a spherical solute having 15 different diameters, 15 different sets of (R, S) are obtained.
  • FIG. 3 is a diagram schematically showing rotation, diffusion, inversion
  • FIG. 5 is a diagram showing a two-stage model for forming a three-dimensional structure of a membrane protein.
  • FIG. 6 is a diagram showing a natural structure (NS) of Glycophorin A (GpA) composed of two structural units and a fake structure generated by replica exchange Monte Carlo simulation.
  • FIG. 7 is a diagram plotting the least square deviation of the correct structure on the horizontal axis and the non-dimensionalized free energy difference on the vertical axis for the natural structure (NS) of GpA and 15,000 fake structures.
  • FIG. 8 is a diagram plotting the least square deviation of the correct structure on the horizontal axis and the dimensionless energy component difference on the vertical axis for the natural structure (NS) of GpA and 15,000 fake structures.
  • FIG. 1 is a diagram showing a two-stage model for forming a three-dimensional structure of a membrane protein.
  • FIG. 6 is a diagram showing a natural structure (NS) of Glycophorin A (GpA) composed of two structural units
  • FIG. 9 is a diagram plotting the least square deviation from the correct structure on the horizontal axis and the entropy component (solvation entropy) difference on the vertical axis for the natural structure (NS) of GpA and 15,000 fake structures.
  • FIG. 10 is a block diagram showing an example of the present heat-stabilized mutant predicting apparatus 100 to which the present embodiment is applied, and conceptually shows only the part related to the present embodiment in the configuration.
  • FIG. 11 is a flowchart illustrating an example of processing executed by the heat-stabilized mutant prediction apparatus 100.
  • FIG. 12 schematically shows a calculation method of the solvation entropy change ⁇ S w in the membrane protein and the solvation entropy change ⁇ S m in the amino acid mutant in the heat-stabilized mutant prediction apparatus 100 of the present embodiment. It is a figure.
  • FIG. 13 is a diagram illustrating a state in which the structure is optimized after the helices in the systems 2 and 3 are separated.
  • FIG. 14 is a diagram showing an example of a structure in which the helix is extended to the primary structure in the systems 4 and 5.
  • FIG. 15 is a flowchart showing a procedure common to the methods 1 to 5 of the present embodiment.
  • FIG. 16 is a flowchart illustrating a processing example of method 1.
  • FIG. 13 is a diagram illustrating a state in which the structure is optimized after the helices in the systems 2 and 3 are separated.
  • FIG. 14 is a diagram showing an example of a structure in which the helix is extended to the primary structure in the systems 4 and 5.
  • FIG. 17 is a flowchart illustrating a processing example of method 2.
  • FIG. 18 is a flowchart illustrating a processing example of method 3.
  • FIG. 19 is a flowchart illustrating a processing example of method 4.
  • FIG. 20 is a flowchart illustrating a processing example of method 5.
  • FIG. 21 is a diagram showing the calculation results ( ⁇ S) according to methods 1 to 5 for mutants in which threonine at the 88th residue that is stabilized in the experiment is substituted with glutamic acid.
  • FIG. 22 is a diagram showing the calculation results - ⁇ S according to methods 1 to 5 for mutants in which serine at the 91st residue, which is stabilized (thermal denaturation temperature increased by 8 ° C.) in the experiment, is substituted with arginine.
  • FIG. 23 is a diagram showing the calculation result - ⁇ S according to methods 1 to 5 for a mutant in which cysteine at residue 245, which is destabilized in the experiment, is substituted with tryptophan.
  • FIG. 24 is a diagram showing the calculation result - ⁇ S according to methods 1 to 5 for a mutant in which alanine at the 51st residue, which is destabilized in the experiment, is substituted with tryptophan.
  • FIG. 25 is a diagram showing the calculation results ⁇ S according to methods 1 to 5 for a mutant in which arginine is substituted for valine at the 239th residue, which is destabilized in the experiment.
  • FIG. 26 is a table of prediction results of heat-stabilized mutants according to methods 1 to 5 for five amino acid mutations.
  • FIG. 27 is a graph showing the calculation result of ⁇ S in method 1.
  • FIG. 28 is a graph showing the calculation result of ⁇ S in method 2.
  • FIG. 29 is a graph showing the calculation result of ⁇ S in method 3.
  • FIG. 30 is a graph showing the calculation result of ⁇ S in method 4.
  • FIG. 31 is a graph showing the calculation result of ⁇ S in method 5.
  • FIG. 32 is a table of prediction results of heat-stabilized mutants according to methods 1 to 5 for each amino acid mutation.
  • FIG. 33 is a flowchart illustrating an example of processing executed by the heat-stabilized mutant prediction apparatus.
  • FIG. 34 is a diagram showing the value of energy decrease when one intramolecular hydrogen bond is formed.
  • FIG. 35 is a flowchart showing a processing example of ⁇ .
  • FIG. 36 is a diagram illustrating an example of a prediction result.
  • FIG. 37 is a diagram showing the value of ⁇ F of methods 1 to 5 for S91R.
  • FIG. 38 is a diagram showing the value of ⁇ F of methods 1 to 5 for S91K.
  • FIG. 39 is a diagram showing ⁇ F values of methods 1 to 5 for L85R.
  • FIG. 40 is a diagram showing the value of ⁇ F of methods 1 to 5 for N280R.
  • FIG. 41 is a diagram showing the value of ⁇ F of methods 1 to 5 for N181K.
  • FIG. 42 is a diagram illustrating an example of a prediction result.
  • FIG. 43 is a diagram illustrating the value of ⁇ S of the methods 1 to 5 with respect to S91R.
  • FIG. 44 is a diagram showing the value of ⁇ S of methods 1 to 5 with respect to S91K.
  • FIG. 45 is a diagram showing the value of ⁇ S of methods 1 to 5 for L85R.
  • FIG. 46 is a diagram showing the value of ⁇ S of methods 1 to 5 for N280R.
  • FIG. 47 is a diagram showing the value of ⁇ S of the methods 1 to 5 for N181K.
  • thermostable mutant prediction apparatus a thermostable mutant prediction method, and a program according to the present invention will be described in detail with reference to the drawings.
  • this invention is not limited by this embodiment.
  • the main focus is on the entropy effect resulting from the translational movement of CH, CH 2 , and CH 3 groups (assuming these aggregates are solvents) constituting the hydrophobic chain of the phospholipid molecule
  • the purpose is to theoretically predict changes in solvation entropy of membrane proteins due to amino acid substitution.
  • “Energy reduction associated with intramolecular hydrogen bond formation number of intramolecular hydrogen bonds * D” is calculated on the basis of a completely extended structure (having no intramolecular hydrogen bond).
  • D is a value of energy reduction when one intramolecular hydrogen bond is formed. Further, D may be an energy decrease value (for example, ⁇ 14 k B T 0 etc.) generated when formamide forms one hydrogen bond in a nonpolar solvent.
  • “energy reduction associated with intramolecular hydrogen bond formation number of intramolecular hydrogen bonds * ( ⁇ 14 k B T 0 ) ”may be calculated.
  • ⁇ 14 k B T 0 is an energy decrease value generated when formamide forms one hydrogen bond in a nonpolar solvent.
  • entropy loss occurs when protein is inserted into the membrane due to the intense thermal motion of phospholipids.
  • Entropy is represented by the translational configuration entropy of the hydrocarbon group population of phospholipid molecules.
  • the magnitude of the loss is expressed as a function of the three-dimensional structure, and the three-dimensional structure in which the loss is minimized is stabilized.
  • S is the translational arrangement entropy loss (negative) of the hydrocarbon group population accompanying insertion.
  • S is solvation entropy (entropy loss of solvent generated when a solute fixed in a certain three-dimensional structure is inserted into the solvent: negative amount).
  • a high-speed calculation may be realized by using an integrated methodology of morphometric expression and integral equation theory devised by the present inventors.
  • the exclusion space is “a space in which the center of the solvent molecule cannot enter”, the volume of the exclusion space is the exclusion volume V, and the surface area of the exclusion space is the exposed surface area A.
  • the coefficients C 1 , C 2 , C 3 , and C 4 of the four morphological indices do not depend on the geometric properties of the solute, so that they have a simplified form (for example, a sphere). Can be handled. Therefore, the entropy loss accompanying the insertion of spherical solutes having various diameters is calculated by considering the shape as a simplified sphere.
  • the hydrocarbon group population is modeled and calculated as a hard sphere solvent using integral equation theory. According to the morphometric expression for the spherical solute, the following equation is obtained.
  • FIG. 4 is a diagram schematically showing the sum R of the radii of hydrocarbon groups and spherical solutes. For example, with the insertion of a spherical solute having 15 different diameters, 15 different sets of (R, S) are obtained.
  • Integral equation theory starts with the partition function of the system and defines various distribution functions (correlation functions) while deriving the relational expressions established between them. As far as the equilibrium structure and physical properties are concerned, it is a technique that enables analysis at the same level as computer simulation. Targeting an infinitely large system and taking the average of physical quantities for an infinite number of microscopic states, it is unrelated to problems such as “system size may be too small; statistical error is inevitable” is there.
  • thermodynamic quantities that represent specific properties can be obtained (can be extended to multi-component solvents).
  • thermodynamic quantity of solvation is a change in the thermodynamic quantity that occurs when a solute (fixed solid structure) is inserted into the solvent.
  • a solute fixed solid structure
  • thermodynamic quantity of solvation is a change in the thermodynamic quantity that occurs when a solute (fixed solid structure) is inserted into the solvent.
  • a solute fixed solid structure
  • a solute having an arbitrary shape and polyatomic structure can be directly handled (three-dimensional integral equation theory).
  • integral equation theory is superior to the computer simulation, but mathematical and numerical analysis is considerably required when solving the basic equation. In the form, this is solved by integration with the morphometric indicators described above.
  • this embodiment creates an amino acid sequence of an amino acid variant in which each amino acid residue of a membrane protein is substituted with all amino acids other than Gly and Pro.
  • a mutant membrane protein can be obtained by introducing an amino acid mutation into a wild-type membrane protein.
  • the amino acid mutation may be an amino acid sequence in which one or several amino acids are deleted, substituted, or added in the original amino acid sequence.
  • an amino acid sequence of an amino acid variant in which each amino acid residue of a membrane protein is substituted with all amino acids including Gly and Pro may be created.
  • FIG. 5 is a diagram showing a two-stage model for formation of a three-dimensional structure of a membrane protein (reference: curr.opin.struct.biol.2011, 21: 460-466).
  • Stage 1 relates to the stage in which membrane proteins form secondary structures from primary structures. More specifically, ⁇ -helix structural units are individually stabilized in the membrane to form as many intramolecular hydrogen structures as possible (step 1). In the lipid bilayer, the ⁇ helix is more advantageous than the ⁇ sheet.
  • Stage 2 relates to the stage in which the membrane protein forms a secondary structure from a secondary structure within the membrane. More specifically, side chains are filled between structural units such as ⁇ helix (step 2).
  • the solvation entropy change from the primary structure through stages 1 and 2 to the tertiary structure formation may be obtained, or the solvation entropy change from the secondary structure through stage 2 to the tertiary structure formation may be obtained.
  • FIG. 6 is a diagram showing a natural structure (NS) of Glycophorin A (GpA) composed of two structural units and a fake structure generated by replica exchange Monte Carlo simulation.
  • the lower structure is a diagram when the upper structure is viewed from the illustrated viewpoint. As shown in FIG. 6, although the ⁇ helix structure as the secondary structure itself is the same, the positional relationship between the ⁇ helices in the tertiary structure is different.
  • FIG. 7 is a diagram in which the abscissa represents the least-square deviation from the correct structure and the ordinate represents the dimensionless free energy difference for the natural structure (NS) of GpA and 15,000 fake structures.
  • FIG. 8 is a diagram plotting the least square deviation of the correct structure on the horizontal axis and the dimensionless energy component difference on the vertical axis for the natural structure (NS) of GpA and 15,000 fake structures.
  • FIG. 9 is a diagram in which the abscissa represents the least square deviation from the correct structure and the ordinate represents the difference in entropy component (solvation entropy) for the natural structure (NS) of GpA and 15,000 impersonal structures. .
  • the correct structure can be correctly extracted without detecting false positives based on the difference in solvation entropy change, which is an index in the present embodiment. This is because in the natural structure, the side chains are filled between the structural units so that the entropy of the hydrocarbon group population is maximized.
  • FIG. 10 is a block diagram showing an example of the present heat-stabilized mutant predicting apparatus 100 to which the present embodiment is applied, and conceptually shows only the part related to the present embodiment in the configuration.
  • the heat-stabilized mutant prediction apparatus 100 in the present embodiment schematically includes at least a control unit 102 and a storage unit 106.
  • the input / output control interface unit 108 further includes A communication control interface unit 104 is provided.
  • the control unit 102 is a CPU or the like that comprehensively controls the entire heat-stabilized mutant prediction apparatus 100.
  • the communication control interface unit 104 is an interface connected to a communication device (not shown) such as a router connected to a communication line, and the input / output control interface unit 108 is connected to the input unit 114 and the output unit 116.
  • the storage unit 106 is a device that stores various databases and tables.
  • Each part of these heat-stabilized mutant prediction apparatuses 100 is communicably connected via an arbitrary communication path. Further, the heat-stabilized mutant prediction apparatus 100 is communicably connected to the network 300 via a communication device such as a router and a wired or wireless communication line such as a dedicated line.
  • a communication device such as a router and a wired or wireless communication line such as a dedicated line.
  • the various databases and tables (such as the structure file 106a and the array file 106b) stored in the storage unit 106 are storage means such as a fixed disk device.
  • the storage unit 106 stores various programs, tables, files, databases, web pages, and the like used for various processes.
  • the structure file 106a is a structure data storage unit that stores the structure data of the membrane protein.
  • the structure file 106a may store the structure data of the membrane protein that has been subjected to the crystal structure analysis, which is input via the input unit 114.
  • the structure data in the structure file 106a may include coordinates of each atom in a two-dimensional space or a three-dimensional space.
  • the sequence file 106b is sequence data storage means for storing sequence data of membrane proteins.
  • the sequence file 106b may store sequence data of membrane proteins and the like input via the input unit 114.
  • the input / output control interface unit 108 controls the input unit 114 and the output unit 116.
  • the output unit 116 a speaker can be used in addition to a monitor (including a home television) (hereinafter, the output unit 116 may be described as a monitor).
  • the input unit 114 a keyboard, a mouse, a microphone, and the like can be used.
  • control unit 102 has a control program such as an OS (Operating System), a program defining various processing procedures, and an internal memory for storing necessary data. And the control part 102 performs the information processing for performing various processes by these programs.
  • the control unit 102 includes a mutation introduction unit 102a, a calculation unit 102b, and a candidate extraction unit 102c in terms of functional concept.
  • the mutation introducing unit 102a generates an amino acid sequence of an amino acid variant (hereinafter simply referred to as “mutant”) by introducing an amino acid mutation into each amino acid sequence of the membrane protein. It is a means for introducing mutation.
  • the mutation introducing unit 102a may generate an amino acid sequence in which one or several amino acids are deleted, substituted, or added to the original amino acid sequence as a mutant.
  • the calculation unit 102b calculates from the primary structure to the tertiary structure or from the secondary structure to the tertiary structure in the transmembrane region with the structure optimization based on the amino acid sequence for the membrane protein wild type and each variant. This is a calculation means for calculating solvation entropy changes - ⁇ S w , - ⁇ S m .
  • the calculation unit 102b uses a morphometric expression based on four geometric indexes, that is, an excluded volume V, an exposed surface area A, an integrated value X of the average curvature of the exposed surface, and an integrated value Y of the Gaussian curvature of the exposed surface.
  • the solvation entropy may be calculated using an integrated methodology of and the integral equation theory.
  • the calculation unit 102b may perform the structure optimization based on not only the amino acid sequence stored in the sequence file 106b but also the structure data stored in the structure file 106a. In addition, the calculation unit 102b first fixes and minimizes the heavy atoms of the membrane protein, then fixes and minimizes the C ⁇ carbon and C ⁇ carbon, and finally minimizes without fixing. Structural optimization may be performed while removing the constraint. In addition, the calculation unit 102b may perform structure optimization by using another structure optimization method such as Modeller.
  • the calculation unit 102b may calculate the solvation entropy change by any one of the following methods 1 to 5.
  • Method 1 Change of solvation entropy of tertiary structure from which transmembrane site was taken out after structure optimization and solvation entropy of secondary structure from which tertiary structure was separated
  • Method 2 Structure after taking out transmembrane site Changes in the solvation entropy of the optimized tertiary structure and the solvation entropy of the secondary structure that has been optimized after separating the extracted transmembrane site
  • Method 3 After the structure optimization, the membrane Change between the solvation entropy of the tertiary structure from which the penetrating site has been extracted and the solvation entropy of the secondary structure to which the structure has been optimized after extracting the transmembrane site and separating the transmembrane site
  • Method 4 Structure optimization The solvation entropy of the tertiary structure from which the transmembrane
  • the above is an example of the configuration of the heat-stabilized mutant prediction apparatus 100 in the present embodiment.
  • the heat-stabilized mutant prediction device 100 may be connected to the external system 200 via the network 300.
  • the communication control interface unit 104 performs communication control between the heat-stabilized mutant prediction device 100 and the network 300 (or a communication device such as a router). That is, the communication control interface unit 104 has a function of communicating data with other terminals via a communication line.
  • the network 300 has a function of connecting the heat-stabilized mutant prediction apparatus 100 and the external system 200 to each other, and is, for example, the Internet.
  • the external system 200 is connected to the heat-stabilized mutant prediction apparatus 100 via the network 300, and is connected to an external database related to various data such as structure data, sequence data, parameters, and simulation result data.
  • the information processing apparatus has a function of providing a program or the like for causing the heat-stabilized mutant prediction method to be executed.
  • the external system 200 may be configured as a WEB server, an ASP server, or the like.
  • the hardware configuration of the external system 200 may be configured by an information processing apparatus such as a commercially available workstation or a personal computer and its attached devices.
  • Each function of the external system 200 is realized by a CPU, a disk device, a memory device, an input device, an output device, a communication control device, and the like in the hardware configuration of the external system 200 and a program for controlling them.
  • FIG. 11 is a flowchart illustrating an example of processing executed by the heat-stabilized mutant prediction apparatus 100.
  • the mutation introducing unit 102a generates an amino acid sequence of the mutant Mt by introducing an amino acid mutation into the amino acid sequence of the membrane protein stored in the sequence file 106b (step). SA-1).
  • the mutation introducing unit 102a may generate a mutant Mt into which an amino acid mutation such as one amino acid deletion, one amino acid substitution, or one amino acid addition is introduced.
  • the calculation unit 102b calculates from the primary structure to the tertiary structure or from the secondary structure to the tertiary structure in the transmembrane region with the structure optimization based on the amino acid sequence for the membrane protein wild-type Wt and each mutant Mt.
  • the solvation entropy changes up to - ⁇ S w and ⁇ S m are calculated (step SA-2). Note that the calculation unit 102b may calculate the change in solvation entropy by any one of methods 1 to 5 described later.
  • the calculation unit 102b uses a morphometric expression based on four geometric indexes, that is, an excluded volume V, an exposed surface area A, an integrated value X of the average curvature of the exposed surface, and an integrated value Y of the Gaussian curvature of the exposed surface.
  • the solvation entropy may be calculated using an integrated methodology of and the integral equation theory.
  • the calculation unit 102b may perform the structure optimization based on not only the amino acid sequence stored in the sequence file 106b but also the structure data stored in the structure file 106a.
  • the calculation unit 102b first fixes and minimizes the heavy atoms of the membrane protein, then fixes and minimizes the C ⁇ carbon and C ⁇ carbon, and finally minimizes without fixing. Structural optimization may be performed while removing the constraint.
  • the candidate extraction unit 102c extracts a candidate for the mutant Mt to be thermally stabilized based on the calculated difference ⁇ S (step SA-4). For example, the candidate extraction unit 102c may determine that the thermal stabilization is performed when ⁇ S is a negative value and that the thermal extraction is performed when ⁇ S is positive. As an example, the candidate extraction unit 102c may extract a mutant Mt whose ⁇ S is equal to or less than a predetermined threshold as a candidate for a mutant Mt to be thermally stabilized.
  • FIG. 12 schematically shows a calculation method of the solvation entropy change ⁇ S w in the membrane protein wild-type Wt and the solvation entropy change ⁇ S m in the mutant Mt in the heat-stabilized mutant prediction apparatus 100 of the present embodiment.
  • FIG. 12 schematically shows a calculation method of the solvation entropy change ⁇ S w in the membrane protein wild-type Wt and the solvation entropy change ⁇ S m in the mutant Mt in the heat-stabilized mutant prediction apparatus 100 of the present embodiment.
  • the solvation entropy difference ⁇ S between the state in which ⁇ helices are separated from each other and the state in which they are packed is expressed as solvation. Obtained as entropy change.
  • the calculation unit 102b may calculate the change in solvation entropy by any one of the following methods 1 to 5.
  • Method 1 is a method for obtaining a change - ⁇ S between the solvation entropy S of the tertiary structure obtained by extracting the transmembrane site after the structure optimization and the solvation entropy S of the secondary structure separated from the tertiary structure.
  • scheme 1 does not consider refilling of the side chains of the detached helix.
  • Method 2 includes a tertiary structure solvation entropy S in which the structure optimization is performed after the transmembrane site is extracted, and a secondary structure solvation entropy S in which the structure optimization is performed after separating the extracted transmembrane site.
  • This is a method for obtaining - ⁇ S.
  • FIG. 13 is a diagram illustrating a state in which the structure is optimized after the helices in the systems 2 and 3 are separated.
  • Method 3 is a tertiary structure solvation entropy S in which the transmembrane site is extracted after structure optimization, and a secondary structure solvent in which the transmembrane site is extracted and separated from the transmembrane site.
  • This is a method for obtaining a change - ⁇ S with respect to the sum entropy S. As shown in FIG. 13, schemes 2 and 3 optimize the structure of each separated helix and take into account refilling of the side chains.
  • Method 4 includes the solvation entropy S of the tertiary structure in which the transmembrane site is extracted after the structure optimization, and the solvation of the primary structure in which the structure optimization is performed after the transmembrane site is extracted and the transmembrane site is extended. This is a method for obtaining a change - ⁇ S from the entropy S.
  • FIG. 14 is a diagram showing an example of a structure in which the helix is extended to the primary structure in the systems 4 and 5.
  • Method 5 is a tertiary structure solvation entropy S that has been optimized after extracting the transmembrane site, and the primary structure that has been optimized after the transmembrane site has been extracted and stretched away from the transmembrane site.
  • This is a method for obtaining a change - ⁇ S from the solvation entropy S.
  • entropy change accompanying the formation of the helix of the stage 1 in the two-stage model is also taken into consideration.
  • the loop structure is also considered when the packed structure is minimized.
  • FIG. 15 is a flowchart showing a procedure common to the systems 1 to 5 of the present embodiment.
  • the crystal structure of human-derived adenosine A2a receptor (PDB code; 3vg9) was used as wild-type Wt.
  • the calculation unit 102b performs hydrogenation on the crystal structure of A2aR using the CHARMM program and the MMTSB program as an example (hereinafter, referred to as the process).
  • This structure is referred to as structure ⁇ 1>).
  • FIG. 16 is a flowchart illustrating a processing example of method 1.
  • Method 1 As shown in FIG. 16, first, for the structure ⁇ 1> of wild-type Wt, the calculation unit 102b uses the CHARMM program to fix and minimize the heavy atoms of the membrane protein to fix the C ⁇ carbon and C ⁇ carbon.
  • the structure is optimized in the order of minimizing and minimizing without fixing, stepwise removing the constraints (step S1-1). Hereinafter, this process is simply referred to as “structure optimization”.
  • the calculation unit 102b extracts only the transmembrane site and calculates the solvation entropy ( ⁇ S w ) (step S1-2).
  • the calculation unit 102b calculates the total solvation entropy ( ⁇ S ′ w ) of the structure in which the respective helices are separated (step S1-3).
  • the mutation introducing unit 102a replaces the amino acid residue of the structure ⁇ 1> based on the sequence data stored in the sequence file 106b (step S1-a).
  • the calculation unit 102b optimizes the structure (step S1-b).
  • the calculation unit 102b extracts only the transmembrane site and calculates the solvation entropy ( ⁇ S m ) (step S1-c).
  • the calculation unit 102b calculates the sum ( ⁇ S ′ m ) of the solvation entropy of the structure in which the respective helices are separated (step S1-d).
  • FIG. 17 is a flowchart illustrating a processing example of method 2. As shown in FIG. 17, first, for the structure ⁇ 1> of wild-type Wt, the calculation unit 102b extracts only the transmembrane site of structure ⁇ 1> (referred to as structure ⁇ 2>) (step S2-1).
  • the calculation unit 102b optimizes the structure, and calculates its solvation entropy ( ⁇ S w ) (step S2-2).
  • the calculation unit 102b separates the helix of the structure ⁇ 2> (Step S2-3).
  • the calculation unit 102b optimizes the structure of each helix and calculates the sum of solvation entropy ( ⁇ S ′ w ) (step S2-4).
  • the mutation introducing part 102a substitutes the amino acid residue of the structure ⁇ 2> (this structure is referred to as the structure ⁇ 3>) (step S2-a).
  • the calculation unit 102b optimizes the structure and calculates the solvation entropy ( ⁇ S m ) (step S2-b).
  • the calculation unit 102b separates the helix of the structure ⁇ 3> (Step S2-c).
  • the calculation unit 102b optimizes the structure of each helix, and calculates the sum ( ⁇ S ′ m ) of solvation entropy (step S2-d).
  • FIG. 18 is a flowchart illustrating a processing example of method 3. As shown in FIG. 18, for the structure ⁇ 1> of wild-type Wt, the calculation unit 102b first optimizes the structure of the structure ⁇ 1> (step S3-1).
  • the calculation unit 102b extracts only the transmembrane site and calculates its solvation entropy ( ⁇ S w ) (step S3-2).
  • the calculation unit 102b takes out the transmembrane site of the structure ⁇ 1> and separates the helix structure (step S3-3).
  • the calculation unit 102b optimizes the structure of each helix, and calculates the sum ( ⁇ S ′ w ) of solvation entropy (step S3-4).
  • the mutation introducing unit 102a replaces the amino acid residue of the structure ⁇ 1> (this structure is referred to as the structure ⁇ 4>) (step S3-a).
  • the calculation unit 102b optimizes the structure of the structure ⁇ 4> (Step S3-b).
  • the calculation unit 102b extracts only the transmembrane site and calculates its solvation entropy ( ⁇ S m ) (step S3-c).
  • the calculation unit 102b extracts only the transmembrane site of the structure ⁇ 4> and separates the helix structure (step S3-d).
  • the calculation unit 102b optimizes the structure of each helix, and calculates the total solvation entropy ( ⁇ S ′ m ) (step S3-e).
  • FIG. 19 is a flowchart illustrating a processing example of method 4. As shown in FIG. 19, first, for the structure ⁇ 1> of wild-type Wt, the calculation unit 102b optimizes the structure of the structure ⁇ 1> (step S4-1).
  • the calculation unit 102b extracts only the transmembrane site and calculates its solvation entropy ( ⁇ S w ) (step S4-2).
  • the calculation unit 102b takes out the transmembrane site of the structure ⁇ 1> and creates a completely extended structure (step S4-3).
  • the calculation unit 102b optimizes each stretched structure, and calculates the total solvation entropy ( ⁇ S ′ w ) (step S4-4).
  • the mutation introducing unit 102a replaces the amino acid residue of the structure ⁇ 1> (this structure is referred to as the structure ⁇ 4>) (step S4-a).
  • the calculation unit 102b optimizes the structure of the structure ⁇ 4> (Step S4-b).
  • the calculation unit 102b extracts only the transmembrane site and calculates its solvation entropy ( ⁇ S m ) (step S4-c).
  • the calculation unit 102b extracts only the transmembrane site of the structure ⁇ 4> and creates a completely extended structure (step S4-d).
  • the calculation unit 102b optimizes the stretched structure, and calculates the total solvation entropy ( ⁇ S ′ m ) (step S4-e).
  • FIG. 20 is a flowchart illustrating a processing example of method 5. As shown in FIG. 20, first, with respect to the structure ⁇ 1> of wild-type Wt, the calculation unit 102b extracts only the transmembrane site of structure ⁇ 1> (referred to as structure ⁇ 2>) (step S5-1).
  • the calculation unit 102b optimizes the structure and calculates the solvation entropy ( ⁇ S w ) (step S5-2).
  • the calculation unit 102b separates the helix of the structure ⁇ 2> and creates a completely extended structure (step S5-3).
  • the calculation unit 102b optimizes the stretched structure, and calculates the total solvation entropy ( ⁇ S ′ w ) (step S5-4).
  • the mutation introduction part 102a substitutes the amino acid residue of the structure ⁇ 2> (step S5-a).
  • the calculation unit 102b optimizes the structure of the structure ⁇ 3>, and calculates its solvation entropy ( ⁇ S m ) (step S5-b).
  • the calculation unit 102b separates the helix of the structure ⁇ 3> and creates a completely extended structure (step S5-c).
  • the calculation unit 102b optimizes the stretched structure, and calculates the total solvation entropy ( ⁇ S ′ m ) (step S5-d).
  • FIG. 21 is a diagram showing the calculation results ( ⁇ S) according to methods 1 to 5 for mutants in which threonine at the 88th residue that is stabilized in the experiment is substituted with glutamic acid.
  • FIG. 22 is a diagram showing the calculation results - ⁇ S according to methods 1 to 5 for mutants in which serine at the 91st residue, which is stabilized (thermal denaturation temperature increased by 8 ° C.) in the experiment, is substituted with arginine.
  • FIG. 23 is a diagram showing the calculation result - ⁇ S according to methods 1 to 5 for a mutant in which cysteine at residue 245, which is destabilized in the experiment, is substituted with tryptophan.
  • FIG. 24 is a diagram showing the calculation result - ⁇ S according to methods 1 to 5 for a mutant in which alanine at the 51st residue, which is destabilized in the experiment, is substituted with tryptophan.
  • FIG. 25 is a diagram showing the calculation results ⁇ S according to methods 1 to 5 for a mutant in which arginine is substituted for valine at the 239th residue, which is destabilized in the experiment.
  • FIG. 26 is a table of prediction results of heat-stabilized mutants according to methods 1 to 5 for five amino acid mutations.
  • a circle indicates a prediction success, and a cross indicates a prediction failure.
  • a minus sign indicates stabilization, and a plus sign indicates instability.
  • the prediction success rate of method 5 was high for five amino acid mutations.
  • methods 1 and 2 are combined and both result in stability (negative number)
  • prediction as a stabilizing mutant candidate may be performed.
  • FIG. 32 is a table of prediction results of heat-stabilized mutants according to methods 1 to 5 for each amino acid mutation. A circle indicates that the prediction has succeeded, a cross indicates that the prediction has failed, and a blank indicates that the calculation has been excluded.
  • a minus sign indicates stabilization, and a plus sign indicates instability.
  • glycine such as G114A, G118A, G123A, and G152A is substituted with alanine, the degree of freedom of the structure is greatly changed. And left blank.
  • the P149A and E151A residues are excluded from the calculation because they are loop portions where no crystal structure is obtained, and are left blank. Since H075A, T119A, K122A, A203L, A204L, A231L, and L235A are amino acid residues outside the membrane, replacement is not performed in methods 2 and 5 in which substitution is performed after taking out the transmembrane site. .
  • T088A is a substitution that greatly improves the stability, but could be predicted to be stabilized by any of the calculation methods 1 to 5. Therefore, if a substitution that is predicted to be stabilized by any of the calculation methods 1 to 5 is selected, it can be expected that a mutant with greatly improved stability can be predicted.
  • FIG. 33 is a flowchart illustrating an example of processing executed by the heat-stabilized mutant prediction apparatus 100.
  • the mutation introducing unit 102a first generates an amino acid sequence of the mutant Mt by introducing an amino acid mutation into the amino acid sequence of the membrane protein wild type Wt stored in the sequence file 106b. (Step SB-1).
  • the mutation introducing unit 102a may generate a mutant Mt into which an amino acid mutation such as one amino acid deletion, one amino acid substitution, or one amino acid addition is introduced.
  • the calculation unit 102b calculates from the primary structure to the tertiary structure or from the secondary structure to the tertiary structure in the transmembrane region with the structure optimization based on the amino acid sequence for the membrane protein wild-type Wt and each mutant Mt.
  • the solvation entropy changes up to - ⁇ Sw, - ⁇ Sm were calculated, and for the membrane protein wild-type Wt and each mutant Mt, from the primary structure to the tertiary structure formation at the transmembrane site with structural optimization based on the amino acid sequence
  • energy changes ⁇ w and ⁇ m from the secondary structure to the tertiary structure formation are calculated (step SB-2).
  • the calculation unit 102b may calculate a change in solvation entropy by any one of the above-described methods 1 to 5.
  • the calculation unit 102b uses a morphometric expression based on four geometric indexes, that is, an excluded volume V, an exposed surface area A, an integrated value X of the average curvature of the exposed surface, and an integrated value Y of the Gaussian curvature of the exposed surface.
  • the solvation entropy may be calculated using an integrated methodology of and the integral equation theory.
  • the calculation unit 102b may perform the structure optimization based on not only the amino acid sequence stored in the sequence file 106b but also the structure data stored in the structure file 106a. In addition, the calculation unit 102b first fixes and minimizes the heavy atoms of the membrane protein, then fixes and minimizes the C ⁇ carbon and C ⁇ carbon, and finally minimizes without fixing. Structural optimization may be performed while removing the constraint.
  • FIG. 34 is a diagram showing the value of energy decrease when one intramolecular hydrogen bond is formed.
  • the free energy function F for membrane protein is expressed by the following equation.
  • F -TS + ⁇ (T: absolute temperature, S: entropy component, ⁇ : energy component)
  • D is D 0 when the distance between the centers of the atoms of the donor and the acceptor is less than 1.5 mm (that is, energy reduction of D 0 is given), and the distance between the centers is 1
  • the value decreases linearly from 0 to D 0 (that is, the energy decreases linearly)
  • the center-to-center distance is 3.0 mm or more, 0 (That is, no energy reduction is given).
  • D 0 may be ⁇ 4 k B T.
  • FIG. 35 is a flowchart showing a processing example of ⁇ .
  • the calculation unit 102b optimizes the structure ⁇ 1> of the membrane protein wild type Wt (step S6-1).
  • the calculation unit 102b extracts only the transmembrane (interpenetration) site and calculates the energy ( ⁇ w ) (step S6-2).
  • the mutation introducing unit 102a substitutes the amino acid residue of the structure ⁇ 1> (this structure is referred to as the structure ⁇ 4>) (step S6-a).
  • the calculation unit 102b optimizes the structure of the structure ⁇ 4> (Step S6-b).
  • the calculation unit 102b extracts only the transmembrane site and calculates its energy ( ⁇ m ) (step S6-c).
  • the candidate extraction unit 102c extracts a candidate for the mutant Mt to be thermally stabilized based on ⁇ F that is the sum of the calculated ⁇ and ⁇ T ⁇ S (step SB-4). For example, the candidate extraction unit 102c determines that ⁇ F (amount of change due to amino acid substitution due to a decrease in free energy of the system due to folding) is a negative value, and that it is thermally unstable when ⁇ F is positive. Also good. As an example, the candidate extraction unit 102c may extract a mutant Mt having ⁇ F that is equal to or smaller than a predetermined threshold as a candidate for a mutant Mt to be thermally stabilized.
  • FIG. 36 is a diagram illustrating an example of a prediction result.
  • FIG. 37 is a diagram showing ⁇ F values of methods 1 to 5 for S91R.
  • FIG. 38 is a diagram showing the value of ⁇ F of methods 1 to 5 for S91K.
  • FIG. 39 is a diagram showing ⁇ F values of methods 1 to 5 for L85R.
  • FIG. 40 is a diagram showing the value of ⁇ F of methods 1 to 5 for N280R.
  • FIG. 41 is a diagram showing the value of ⁇ F of methods 1 to 5 for N181K.
  • FIG. 42 is a diagram illustrating an example of a prediction result.
  • FIG. 42 is a diagram illustrating an example of a prediction result.
  • FIG. 43 is a diagram illustrating the value of ⁇ S of the methods 1 to 5 with respect to S91R.
  • FIG. 44 is a diagram showing the value of ⁇ S of methods 1 to 5 with respect to S91K.
  • FIG. 45 is a diagram showing the value of ⁇ S of methods 1 to 5 for L85R.
  • FIG. 46 is a diagram showing the value of ⁇ S of methods 1 to 5 for N280R.
  • FIG. 47 is a diagram showing the value of ⁇ S of the methods 1 to 5 for N181K.
  • ⁇ F for these five amino acid substitutions is a negative value regardless of which of the methods 1 to 5 is used. It was predicted to be a mutant to be converted (shown in the column of method 1 to method 5 in FIG. 36 (-)).
  • ⁇ F for these five amino acid substitutions is a negative value and stable regardless of which of methods 1 to 5 is used. It was predicted to be a mutant to be converted (shown in the column of method 1 to method 5 in FIG. 42 (-)).
  • a high prediction success rate can be obtained both when the heat-stabilized mutant prediction using ⁇ S is performed and when the heat-stabilized mutant prediction using ⁇ F is performed. I understood that.
  • the heat-stabilized mutant prediction apparatus 100 performs processing in a stand-alone form
  • the heat-stabilized mutant prediction apparatus 100 performs processing in response to a request from a client terminal
  • the processing result may be returned to the client terminal.
  • all or a part of the processes described as being automatically performed can be manually performed, or all of the processes described as being manually performed can be performed.
  • a part can be automatically performed by a known method.
  • each illustrated component is functionally conceptual and does not necessarily need to be physically configured as illustrated.
  • the processing functions provided in each device of the heat-stabilized mutant prediction device 100 are all or any part of the CPU (Central Processing Unit) and the CPU. It may be realized by a program that is interpreted and executed by, or may be realized as hardware by wired logic. The program is recorded on a recording medium to be described later, and is mechanically read by the heat-stabilized mutant prediction apparatus 100 as necessary. That is, in the storage unit 106 such as a ROM or HD, a computer program for performing various processes by giving instructions to the CPU in cooperation as an OS (Operating System) is recorded. This computer program is executed by being loaded into the RAM, and constitutes a control unit in cooperation with the CPU.
  • OS Operating System
  • the computer program may be stored in an application program server connected to the heat-stabilized mutant prediction apparatus 100 via an arbitrary network 300, and the computer program may be downloaded in whole or in part as necessary. It is also possible to do.
  • the program according to the present invention may be stored in a computer-readable recording medium, or may be configured as a program product.
  • the “recording medium” includes a memory card, USB memory, SD card, flexible disk, magneto-optical disk, ROM, EPROM, EEPROM, CD-ROM, MO, DVD, and Blu-ray (registered trademark). It includes any “portable physical medium” such as Disc.
  • program is a data processing method described in an arbitrary language or description method, and may be in any form such as source code or binary code. Note that the “program” is not necessarily limited to a single configuration, but is distributed in the form of a plurality of modules and libraries, or in cooperation with a separate program typified by an OS (Operating System). Including those that achieve the function.
  • OS Operating System
  • a well-known structure and procedure can be used about the specific structure for reading a recording medium in each apparatus shown in embodiment, a reading procedure, or the installation procedure after reading.
  • Various databases and the like (structure file 106a, array file 106b, etc.) stored in the storage unit 106 are storage means such as a memory device such as RAM and ROM, a fixed disk device such as a hard disk, a flexible disk, and an optical disk.
  • Various programs, tables, databases, web page files, and the like used for various processes and website provision are stored.
  • the heat-stabilized mutant prediction apparatus 100 may be configured as an information processing apparatus such as a known personal computer or workstation, or may be configured by connecting any peripheral device to the information processing apparatus. Good.
  • the heat-stabilized mutant prediction apparatus 100 may be realized by installing software (including programs, data, and the like) that causes the information processing apparatus to realize the method of the present invention.
  • the specific form of distribution / integration of the devices is not limited to that shown in the figure, and all or a part of them may be functional or physical in arbitrary units according to various additions or according to functional loads. Can be distributed and integrated. That is, the above-described embodiments may be arbitrarily combined and may be selectively implemented.

Abstract

 本発明は、膜タンパク質の各アミノ酸残基をすべてのアミノ酸に置換した1残基変異体の立体構造を予測し、膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算し、膜タンパク質における溶媒和エントロピー変化とアミノ酸変異体における溶媒和エントロピー変化との差分に基づいて、熱安定化させるアミノ酸変異体の候補を抽出する。

Description

膜タンパク質の熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラム
 本発明は、膜タンパク質の熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラムに関する。
 膜タンパク質は、ゲノムにコードされる全タンパク質の30%を占め、シグナル伝達、物質輸送、生体エネルギー産生・変換などの細胞機能において重要な役割を果たしている。また同時に、市販の医薬品の60%程度が膜タンパク質に作用することから、創薬においても重要なターゲットである。特に、ホルモンや神経伝達物質など受容体であるGタンパク共役型受容体(GPCR)は、約800種のファミリーを形成し、280種程度が創薬標的であると見積もられている。
 近年、副作用が少なく効果の高い薬剤の設計・改良のために、医薬標的となるタンパク質の立体構造に基づいた医薬分子設計(SBDD)が有効であると示されている。しかしながら、GPCRは、(1)熱安定性が低く大量生産が難しい、(2)結晶化のための親水性表面が少なく結晶化が難しい、という問題点があり、2007年までヒトGPCRの詳細構造は得られていなかった。
 2007年、非特許文献1に記載のように、B.KobilkaとR.Stevensらは、ヒト・アドレナリン受容体の細胞内第3ループにT4リゾチーム(T4L)を融合することにより、受容体を熱安定化させるのと同時に親水性表面を拡張し、脂質メソフェーズ法と呼ばれる方法で結晶化し、X線結晶構造解析に成功した。このように、GPCRの(2)結晶化が難しいという問題はT4L融合や抗体を用いることにより克服できるものの、(1)熱安定性が低く大量生産が難しい問題に関しては十分ではなくGPCRの9割以上は未だ大量生産ができていない。
 ここで、特許文献1等では、熱安定性を高めるため、GPCRの各アミノ酸を網羅的にアラニンへ置換し、熱安定性の向上をもたらす変異箇所を実験的に調べ、それらの変異箇所の組み合わせによって熱安定性を大きく向上させて結晶構造解析をおこない、GPCRの構造が互いに似ていることを利用して他の種類のGPCRについても熱安定性を向上させるStaR(登録商標)技術が開示されている。
特表2011-505800号公報
Vadim Cherezov, Daniel M. Rosenbaum, Michael A. Hanson, Soren G. F. Rasmussen, Foon Sun Thian, Tong Sun Kobilka, Hee-Jung Choi, Peter Kuhn, William I. Weis, Brian K. Kobilka, Raymond C. Stevens, "High-Resolution Crystal Structure of an Engineered Human β2-Adrenergic G Protein-Coupled Receptor", Science 2007, Vol.318 no.5854 pp. 1258-1265
 しかしながら、StaR(登録商標)技術では、実験的な網羅的解析を要するためアラニン以外の他のアミノ酸置換の効果は不明であり、また、新たにGPCRなど他の膜タンパク質についての同様の解析を行うには、かなりの時間と労力を必要とするという問題点を有していた。
 本発明は、上記問題点に鑑みてなされたもので、膜タンパク質において熱安定化させるアミノ酸変異をコンピュータにて予測することができる、熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラムを提供することを目的とする。
 このような目的を達成するため、本発明の熱安定化変異体予測装置は、膜タンパク質を熱安定化させるアミノ酸変異体の候補を予測する、記憶部と制御部とを備えた熱安定化変異体予測装置において、上記記憶部は、上記膜タンパク質のアミノ酸配列を記憶し、上記制御部は、上記膜タンパク質の上記アミノ酸配列にアミノ酸変異を導入することにより、上記アミノ酸変異体のアミノ酸配列を生成する変異導入手段と、上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算する計算手段と、上記膜タンパク質における上記溶媒和エントロピー変化と上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出する候補抽出手段と、を備えたことを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、更に、上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて上記構造最適化を伴った上記膜貫通部位における、上記一次構造から上記三次構造形成まで或いは上記二次構造から上記三次構造形成までのエネルギー変化を計算し、上記候補抽出手段は、上記膜タンパク質における上記エネルギー変化と上記アミノ酸変異体における上記エネルギー変化との差分、ならびに、上記膜タンパク質における上記溶媒和エントロピー変化と上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に絶対温度を乗じた値、の和である変化量に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出することを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、排除容積、露出表面積、露出表面の平均曲率の積分値、および、露出表面のガウス曲率の積分値の4つの幾何学的指標に基づく形態計測学的表現と積分方程式論の統合型方法論を用いて、上記溶媒和エントロピー変化を計算することを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記記憶部は、更に、上記膜タンパク質の構造データを記憶し、上記計算手段は、上記アミノ酸配列および上記構造データに基づいて構造最適化を行うことを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、まず、上記膜タンパク質の重原子を固定してミニマイズし、つぎに、Cα炭素およびCβ炭素を固定してミニマイズし、最後に、固定なしでミニマイズすることにより、段階的に拘束を外しながら上記構造最適化を行うことを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、上記構造最適化を行ってから上記膜貫通部位を取り出した上記三次構造の溶媒和エントロピーと、当該三次構造を引き離した上記二次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、上記膜貫通部位を取り出してから上記構造最適化を行った上記三次構造の溶媒和エントロピーと、取り出した当該膜貫通部位を引き離したのち上記構造最適化を行った上記二次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、上記構造最適化を行ってから上記膜貫通部位を取り出した上記三次構造の溶媒和エントロピーと、上記膜貫通部位を取り出し当該膜貫通部位を引き離したのち上記構造最適化を行った上記二次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、上記構造最適化を行ってから上記膜貫通部位を取り出した上記三次構造の溶媒和エントロピーと、上記膜貫通部位を取り出し当該膜貫通部位を伸ばしたのち上記構造最適化を行った上記一次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする。
 また、本発明の熱安定化変異体予測装置は、上記記載の熱安定化変異体予測装置において、上記計算手段は、上記膜貫通部位を取り出してから上記構造最適化を行った上記三次構造の溶媒和エントロピーと、上記膜貫通部位を取り出し当該膜貫通部位を引き離して伸ばしたのち上記構造最適化を行った上記一次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする。
 また、本発明は、熱安定化変異体予測方法に関するものであり、膜タンパク質のアミノ酸配列を記憶する記憶部と制御部とを備えたコンピュータにおいて実行される、上記膜タンパク質を熱安定化させるアミノ酸変異体の候補を予測する熱安定化変異体予測方法であって、上記膜タンパク質の上記アミノ酸配列にアミノ酸変異を導入することにより、上記アミノ酸変異体のアミノ酸配列を生成する変異導入ステップと、上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算する計算ステップと、上記膜タンパク質における上記溶媒和エントロピー変化と上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出する候補抽出ステップと、を含むことを特徴とする。
 また、本発明は、プログラムに関するものであり、膜タンパク質を熱安定化させるアミノ酸変異体の候補を予測するため、上記膜タンパク質のアミノ酸配列を記憶する記憶部と制御部とを備えたコンピュータに実行させるためのプログラムであって、上記膜タンパク質の上記アミノ酸配列にアミノ酸変異を導入することにより、上記アミノ酸変異体のアミノ酸配列を生成する変異導入ステップと、上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算する計算ステップと、上記膜タンパク質における上記溶媒和エントロピー変化と、上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出する候補抽出ステップと、を実行させることを特徴とする。
 また、本発明は記録媒体に関するものであり、上記記載のプログラムを記録したことを特徴とする。
 この発明によれば、膜タンパク質のアミノ酸配列を記憶し、膜タンパク質のアミノ酸配列にアミノ酸変異を導入することにより、アミノ酸変異体のアミノ酸配列を生成し、膜タンパク質および各アミノ酸変異体について、アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算し、膜タンパク質における溶媒和エントロピー変化と、アミノ酸変異体における溶媒和エントロピー変化との差分に基づいて、熱安定化させるアミノ酸変異体の候補を抽出するので、膜タンパク質において熱安定化させるアミノ酸変異をコンピュータにて(in silico)予測することができるという効果を奏する。
 また、本発明は、排除容積、露出表面積、露出表面の平均曲率の積分値、および、露出表面のガウス曲率の積分値の4つの幾何学的指標に基づく形態計測学的表現と積分方程式論の統合型方法論を用いて、溶媒和エントロピー変化を計算するので、形態計測学的に溶質の形態を簡素化して取り扱うことにより高速に溶媒和エントロピーを計算することができるという効果を奏する。
 また、本発明は、更に、膜タンパク質の構造データを記憶し、アミノ酸配列および構造データに基づいて構造最適化を行うので、既知の構造データを利用して的確に構造の最適化を図ることができるという効果を奏する。
 また、本発明は、まず、膜タンパク質の重原子を固定してミニマイズし、つぎに、Cα炭素およびCβ炭素を固定してミニマイズし、最後に、固定なしでミニマイズすることにより、段階的に拘束を外しながら構造最適化を行うので、より精度のよい予測構造を得ることができるという効果を奏する。
 また、本発明は、構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーと、当該三次構造を引き離した二次構造の溶媒和エントロピーとの変化を溶媒和エントロピー変化として計算するので、比較的予測的中率の高い結果(一実施例として5/11)を得ることができるという効果を奏する。
 また、本発明は、膜貫通部位を取り出してから構造最適化を行った三次構造の溶媒和エントロピーと、取り出した当該膜貫通部位を引き離したのち構造最適化を行った二次構造の溶媒和エントロピーとの変化を溶媒和エントロピー変化として計算するので、予測的中率の高い結果(一実施例として1/4)を得ることができるという効果を奏する。
 また、本発明は、構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーと、膜貫通部位を取り出し当該膜貫通部位を引き離したのち構造最適化を行った二次構造の溶媒和エントロピーとの変化を溶媒和エントロピー変化として計算するので、予測的中率の高い結果(一実施例として3/11)を得ることができるという効果を奏する。
 また、本発明は、構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーと、膜貫通部位を取り出し当該膜貫通部位を伸ばしたのち構造最適化を行った一次構造の溶媒和エントロピーとの変化を溶媒和エントロピー変化として計算するので、予測的中率の高い結果(一実施例として5/11)を得ることができるという効果を奏する。
 また、本発明は、膜貫通部位を取り出してから構造最適化を行った三次構造の溶媒和エントロピーと、膜貫通部位を取り出し当該膜貫通部位を引き離して伸ばしたのち構造最適化を行った一次構造の溶媒和エントロピーとの変化を溶媒和エントロピー変化として計算するので、予測的中率の高い結果(一実施例として2/4)を得ることができるという効果を奏する。
図1は、熱力学サイクル(T=298K)におけるN原子がドナー、O原子がアクセプターの場合の図である。 図2は、熱力学サイクル(T=298K)におけるN原子がドナー、O原子がアクセプターの場合の図である。 図3は、脂質二重膜層におけるリン脂質分子の回転、拡散、反転、屈曲の運動を模式的に示した図である。 図4は、炭化水素基と球状溶質の半径の和Rを模式的に示す図である。15通りの直径を有する球状溶質の挿入に伴って、(R,S)のセットが15通り得られる。 図5は、膜タンパク質の立体構造形成に対する2ステージモデルを示す図である。 図6は、2個の構造ユニットからなるGlycophorinA(GpA)の天然構造(NS)と、レプリカ交換モンテカルロシミュレーションにて発生させた偽者構造を示した図である。 図7は、GpAの天然構造(NS)と15000個の偽者構造について、横軸に正解構造との最小二乗偏差、縦軸に無次元化した自由エネルギー差をプロットした図である。 図8は、GpAの天然構造(NS)と15000個の偽者構造について、横軸に正解構造との最小二乗偏差、縦軸に無次元化したエネルギー成分差をプロットした図である。 図9は、GpAの天然構造(NS)と15000個の偽者構造について、横軸に正解構造との最小二乗偏差、縦軸にエントロピー成分(溶媒和エントロピー)差をプロットした図である。 図10は、本実施形態が適用される本熱安定化変異体予測装置100の一例を示すブロック図であり、該構成のうち本実施形態に関係する部分のみを概念的に示している。 図11は、熱安定化変異体予測装置100により実行される処理の一例を示すフローチャートである。 図12は、本実施形態の熱安定化変異体予測装置100における、膜タンパク質における溶媒和エントロピー変化-ΔSと、アミノ酸変異体における溶媒和エントロピー変化-ΔSとの計算方法を模式的に示した図である。 図13は、方式2,3におけるヘリックスを引き離したのち構造最適化する様子を示す図である。 図14は、方式4,5における、ヘリックスを一次構造まで伸ばした構造の例を示す図である。 図15は、本実施形態の方式1~5に共通する手順を示すフロー図である。 図16は、方式1の処理例を示すフロー図である。 図17は、方式2の処理例を示すフロー図である。 図18は、方式3の処理例を示すフロー図である。 図19は、方式4の処理例を示すフロー図である。 図20は、方式5の処理例を示すフロー図である。 図21は、実験では安定化する88残基目のスレオニンをグルタミン酸に置換した変異体についての方式1~5による計算結果(-ΔΔS)を示す図である。 図22は、実験では安定化(熱変性温度が8℃上昇)する91残基目のセリンをアルギニンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。 図23は、実験では不安定化する245残基目のシステインをトリプトファンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。 図24は、実験では不安定化する51残基目のアラニンをトリプトファンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。 図25は、実験では不安定化する239残基目のバリンをアルギニンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。 図26は、アミノ酸変異5種について、方式1~5による熱安定化変異体の予測結果の表である。 図27は、方式1における-ΔΔSの計算結果を示すグラフ図である。 図28は、方式2における-ΔΔSの計算結果を示すグラフ図である。 図29は、方式3における-ΔΔSの計算結果を示すグラフ図である。 図30は、方式4における-ΔΔSの計算結果を示すグラフ図である。 図31は、方式5における-ΔΔSの計算結果を示すグラフ図である。 図32は、各アミノ酸変異について、方式1~5による熱安定化変異体の予測結果の表である。 図33は、熱安定化変異体予測装置により実行される処理の一例を示すフローチャートである。 図34は、分子内水素結合を一つ形成した時のエネルギー低下の値を表した図である。 図35は、Λの処理例を示すフロー図である。 図36は、予測結果の一例を示す図である。 図37は、S91Rに対する方式1~5のΔΔFの値を示す図である。 図38は、S91Kに対する方式1~5のΔΔFの値を示す図である。 図39は、L85Rに対する方式1~5のΔΔFの値を示す図である。 図40は、N280Rに対する方式1~5のΔΔFの値を示す図である。 図41は、N181Kに対する方式1~5のΔΔFの値を示す図である。 図42は、予測結果の一例を示す図である。 図43は、S91Rに対する方式1~5の-ΔΔSの値を示す図である。 図44は、S91Kに対する方式1~5の-ΔΔSの値を示す図である。 図45は、L85Rに対する方式1~5の-ΔΔSの値を示す図である。 図46は、N280Rに対する方式1~5の-ΔΔSの値を示す図である。 図47は、N181Kに対する方式1~5の-ΔΔSの値を示す図である。
 以下に、本発明にかかる、熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態によりこの発明が限定されるものではない。
[本実施形態の概要]
 以下、本発明の実施形態の概要を説明するために、まず本願発明者らにより開発された形態計測学的表現と積分方程式論の統合型方法論について説明し、その後、本実施形態の概要、構成および処理等について詳細に説明する。
[統合型方法論]
 本願発明者らは、水分子の並進移動に起因したエントロピー効果に主眼を置き、独自に開発した液体の統計力学理論と形態計測学的アプローチの統合型方法論により、水溶液中におけるタンパク質の熱変性の描像を与えることに成功した。
 本実施の形態では、これを応用し、リン脂質分子の疎水鎖を構成するCH,CH,CHグループ(これらの集まりを溶媒と見立てる)の並進移動に起因したエントロピー効果に主眼を置き、アミノ酸置換による膜タンパク質の溶媒和エントロピーの変化を理論的に予測することを目的とする。ここで、膜タンパク質用の自由エネルギー関数Fは、以下の式で表される。
F=-TS+Λ
(T:絶対温度、S:エントロピー成分、Λ:エネルギー成分)
 上記の式を、k(k:ボルツマン定数,T=298K)で割って無次元化し、T=Tと設定すると下記の式となる。
F/(k)=-S/k+Λ/(k
 ここで、図1および図2は、熱力学サイクル(T=298K)におけるN原子がドナー、O原子がアクセプターの場合の図である。図1に示すように、完全に伸びた構造(分子内水素結合を全く持たない)を基準にして、「分子内水素結合形成に伴うエネルギー低下=分子内水素結合数*D」を計算する。
 ここで、Dは、分子内水素結合を1つ形成したときのエネルギー低下の値である。また、Dは、ホルムアミドが無極性溶媒中で水素結合を1本形成した場合に生じるエネルギー低下値(例えば、-14k等)であってもよい。
 例えば、図2に示すように、完全に伸びた構造(分子内水素結合を全く持たない)を基準にして、「分子内水素結合形成に伴うエネルギー低下=分子内水素結合数*(-14k)」を計算してもよい。ここで、-14kは、ホルムアミドが無極性溶媒中で水素結合を1本形成した場合に生じるエネルギー低下値である。
 そして、主鎖-主鎖,主鎖-側鎖,側鎖-側鎖間のあらゆるドナーとアクセプターを調べ、分子内水素結合数をカウントし、「Λ=分子内水素結合形成に伴うエネルギー低下(負)」を計算する。なお、タンパク質分子内のファン・デル・ワールス引力相互作用の獲得は、タンパク質-リン脂質間のファン・デル・ワールス引力相互作用の喪失と相殺し合うと仮定している。ここで、図3は、脂質二重膜層におけるリン脂質分子の回転、拡散、反転、屈曲の運動を模式的に示した図である(参考:東京大学 生命科学構造化センター/生命科学ネットワーク LS-EDI生命科学教育用画像集「脂質二重層の性質」 URL:http://csls-db.c.u-tokyo.ac.jp/search/detail?image_repository_id=696)。
 図3に示すように、リン脂質の激しい熱運動から、膜内へのタンパク質の挿入が起きると、エントロピーの損失が発生する。なお、エントロピーは、リン脂質分子の炭化水素基集団の並進配置エントロピーで代表している。損失の大きさは立体構造の関数で表され、損失がなるべく小さくなる立体構造が安定化する。ここで、Sを、挿入に伴う炭化水素基集団の並進配置エントロピー損失(負)とする。
 リン脂質分子の炭化水素基集団を溶媒と見立てた場合、Sは溶媒和エントロピー(ある立体構造に固定された溶質を溶媒中に挿入した場合に生じる溶媒のエントロピー損失:負の量)となる。
 本実施の形態では、溶媒和エントロピーSを計算する場合に、本願発明者らが考案した形態計測学的表現と積分方程式論の統合型方法論を用いて、高速な演算を実現してもよい。
 形態計測学的表現では、溶質の立体構造を、4つの幾何学的指標(排除容積V、露出表面積A、露出表面の平均曲率の積分値X、および、露出表面のガウス曲率の積分値Y)に基づいて、溶媒和エントロピーを計算することができる。すなわち、溶媒和エントロピーSの表現式は以下の線形結合で表される。
S/k=CV+CA+CX+C
 ここで、排除空間は、「溶媒分子の中心が入れない空間」であり、排除空間の容積が排除容積V、排除空間の表面積が露出表面積Aである。排除空間も種々の半径を有する球の結合体となり、半径rの球からのX,Yへの寄与は次の通りである。
「Xへの寄与=平均曲率1/rにその球の露出表面積ξを乗じたもの;
Yへの寄与=ガウス曲率1/rにξを乗じたもの」である。
 なお、形態計測学によれば、4つの形態指標の係数C,C,C,Cは、溶質の幾何学的特性には依存しないので、単純化した形態(例えば球)にて扱うことができる。そのため、形態を単純化した球としてとらえ、種々の直径を有する球状溶質の挿入に伴うエントロピー損失を計算する。本実施の形態では、積分方程式論を用いて、炭化水素基集団は、剛体球溶媒としてモデル化して計算する。球状溶質に対する形態計測学的表現によれば、以下の式となる。
S/k=C(4πR/3)+C(4πR)+C(4πR)+C(4π),
R=(d+d)/2
 ここで、dは溶媒分子直径,dは球状(剛体球)溶質直径である。複数の異なる直径(0<d≦30dの範囲内で15通り程度)を有する孤立剛体球溶質のSを積分方程式論を用いて計算し、上記の式を適用して最小2乗法によってC~Cを決定する。一旦C~Cが決まると、それらを任意の立体構造を持つタンパク質に対しても使用する。すなわち、V,A,X,Yを計算するだけで直ちに式からSが得られる。ただし、C~Cは溶媒の種類や熱力学条件(温度,圧力など)には大きく依存する。
 ここで、図4は、炭化水素基と球状溶質の半径の和Rを模式的に示す図である。例えば、15通りの直径を有する球状溶質の挿入に伴って、(R,S)のセットが15通り得られる。
 溶質をタンパク質とし、あらゆる構成原子(H,C,N,O,S)の直径とx,y,z-座標について、上述の4つの幾何学的指標を用いた計算を行うとすると、上述した統計力学理論と形態計測学的アプローチの統合型方法論により、1つの立体構造当たり標準的なワークステーションでも高速に(1秒以内で)Sが計算可能となる。複雑な多原子構造を考慮した3次元積分方程式論で計算した場合と比べると、計算時間は約1万分の1、誤差は±5%未満であり、Λの計算も含めても自由エネルギー関数Fの計算自体が1秒以内で終了する。
 以上のように、水溶液中のタンパク質に対して開発された統合型方法論を、膜タンパク質に応用することにより、処理負荷の小さい高速な演算が可能となる。ここで、積分方程式論について概説する。
 積分方程式論では、システムの分配関数から出発し、種々の分布関数(相関関数)を定義しつつ、それらの間に成立する関係式を導く。平衡構造・物性に関する限り、計算機シミュレーションと同レベルの解析が可能な手法である。無限に大きなシステムを対象とし、無限個の微視的状態に対して物理量の平均を取るので、「システムサイズが小さ過ぎる可能性がある;統計誤差が避けられない」などの問題とは無縁である。
 単一成分から成るバルク溶媒の場合、温度,数密度,溶媒分子間の相互作用ポテンシャルを入力データとして、分布関数間に成立する関係式を数値的に解くと、溶媒の微視的構造、巨視的性質を表す種々の熱力学量を得ることができる(多成分から成る溶媒にも拡張可能)。
 溶質の溶媒和特性(溶質近傍における溶媒の微視的構造;溶媒和の熱力学量)をも解析できる。ここで、溶媒和の熱力学量とは、溶質(立体構造を固定)を溶媒中に挿入した場合に生じる熱力学量の変化のことである。剛体球系やレナード・ジョーンズ流体のような単純な溶媒の場合、任意の形状・多原子構造を有する溶質を直接扱うことができる(3次元積分方程式論)。溶媒和の熱力学量の計算では、計算機シミュレーションよりも積分方程式論の方が優位であるが、基本式を解く場合に数学的・数値解析学的な取り扱いが相当要求されるため、本実施の形態では、上述の形態計測学的指標との統合により、これを解決する。
[本実施の形態の概要]
 つづいて、本実施の形態の概要について説明する。
 まず、本実施の形態は、膜タンパク質の各アミノ酸残基をGlyとPro以外のすべてのアミノ酸に置換したアミノ酸変異体のアミノ酸配列を作成する。例えば、野生型の膜タンパク質にアミノ酸変異を導入することにより、変異体の膜タンパク質を得ることができる。なお、アミノ酸変異は、元のアミノ酸配列において、1もしくは数個のアミノ酸が、欠失、置換、もしくは付加されたアミノ酸配列であってもよい。
 また、本実施の形態は、膜タンパク質の各アミノ酸残基をGlyとProを含むすべてのアミノ酸に置換したアミノ酸変異体のアミノ酸配列を作成してもよい。
 つぎに、本実施の形態は、各アミノ酸変異体のそれぞれについて、アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化-ΔSを計算する。ここで、図5は、膜タンパク質の立体構造形成に対する2ステージモデルを示す図である(参考:curr. opin. struct. biol. 2011, 21:460-466)。
 ステージ1は、膜タンパク質が一次構造から二次構造を形成する段階に関する。より具体的には、αへリックスの構造ユニットが、膜内で個別に安定化され、分子内水素構造をできるだけ多く形成する(ステップ1)。なお、脂質二重膜層では、βシートよりもαヘリックスの方が有利である。
 ステージ2は、膜タンパク質が膜内で二次構造から三次構造を形成する段階に関する。より具体的には、αへリックスなどの構造ユニット間の側鎖の充填が行われる(ステップ2)。本実施の形態は、一次構造からステージ1,2を経て三次構造形成までの溶媒和エントロピー変化を求めてもよく、二次構造からステージ2を経て三次構造形成までの溶媒和エントロピー変化を求めてもよい。ここで、図6は、2個の構造ユニットからなるGlycophorinA(GpA)の天然構造(NS)と、レプリカ交換モンテカルロシミュレーションにて発生させた偽者構造を示した図である。下段の構造は、上段の構造を図示の視点から見た場合の図である。図6に示すように、二次構造であるαへリックス構造自体は同じであるものの、三次構造におけるαへリックス同士の位置関係は異なっている。
 そして、膜タンパク質野生型における溶媒和エントロピー変化-ΔSと、アミノ酸変異体における溶媒和エントロピー変化-ΔSとの差分-ΔΔSに基づいて、熱安定化させるアミノ酸変異体の候補を抽出する。ここで、図7は、GpAの天然構造(NS)と15000個の偽者構造について、横軸に正解構造との最小二乗偏差、縦軸に無次元化した自由エネルギー差をプロットした図である。
 図7に示すように、天然構造で自由エネルギーFは最小値をとる。図8は、GpAの天然構造(NS)と15000個の偽者構造について、横軸に正解構造との最小二乗偏差、縦軸に無次元化したエネルギー成分差をプロットした図である。
 図8に示すように、天然構造では、構造ユニット間で分子内水素結合が形成されていないので、天然構造よりも有利な偽者構造(破線長方形内の点)が偽陽性として多数存在してしまう。ここで、図9は、GpAの天然構造(NS)と15000個の偽者構造について、横軸に正解構造との最小二乗偏差、縦軸にエントロピー成分(溶媒和エントロピー)差をプロットした図である。
 図9に示すように、本実施の形態における指標である、溶媒和エントロピー変化の差分に基づけば、偽陽性を検出してしまうことなく、正しく正解構造を抽出することができることがわかる。これは、天然構造では、炭化水素基集団のエントロピーが最大になるように構造ユニット間の側鎖の充填が行われているからである。
 以上が本実施形態の概要である。つづいて、上述した本発明の実施形態をコンピュータにて実現するための装置構成や処理の詳細な例について、以下に詳しく説明する。
[熱安定化変異体予測装置の構成]
 次に、本実施形態における熱安定化変異体予測装置100の構成について図10を参照して説明する。図10は、本実施形態が適用される本熱安定化変異体予測装置100の一例を示すブロック図であり、該構成のうち本実施形態に関係する部分のみを概念的に示している。
 図10に示すように、本実施形態における熱安定化変異体予測装置100は、概略的に、制御部102と記憶部106を少なくとも備え、本実施形態において、更に、入出力制御インターフェース部108と通信制御インターフェース部104を備える。ここで、制御部102は、熱安定化変異体予測装置100の全体を統括的に制御するCPU等である。また、通信制御インターフェース部104は、通信回線等に接続されるルータ等の通信装置(図示せず)に接続されるインターフェースであり、入出力制御インターフェース部108は、入力部114や出力部116に接続されるインターフェースである。また、記憶部106は、各種のデータベースやテーブルなどを格納する装置である。これら熱安定化変異体予測装置100の各部は任意の通信路を介して通信可能に接続されている。更に、この熱安定化変異体予測装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
 記憶部106に格納される各種のデータベースやテーブル(構造ファイル106a、配列ファイル106b等)は、固定ディスク装置等のストレージ手段である。例えば、記憶部106は、各種処理に用いる各種のプログラム、テーブル、ファイル、データベース、および、ウェブページ等を格納する。
 これら記憶部106の各構成要素のうち、構造ファイル106aは、膜タンパク質の構造データを記憶する構造データ記憶手段である。構造ファイル106aは、入力部114を介して入力された、結晶構造解析がなされた膜タンパク質の構造データ等を記憶してもよい。なお、構造ファイル106aにおける構造データは、2次元空間や3次元空間における各原子の座標等を含んでもよい。
 また、配列ファイル106bは、膜タンパク質の配列データを記憶する配列データ記憶手段である。配列ファイル106bは、入力部114を介して入力された、膜タンパク質の配列データ等を記憶してもよい。
 図10において、入出力制御インターフェース部108は、入力部114や出力部116の制御を行う。ここで、出力部116としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力部116をモニタとして記載する場合がある)。また、入力部114としては、キーボード、マウス、およびマイク等を用いることができる。
 また、図10において、制御部102は、OS(Operating System)等の制御プログラムや、各種の処理手順等を規定したプログラム、および、所要データを格納するための内部メモリを有する。そして、制御部102は、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、変異導入部102a、計算部102b、および、候補抽出部102cを備える。
 このうち、図10に示すように、変異導入部102aは、膜タンパク質の各アミノ酸配列にアミノ酸変異を導入することにより、アミノ酸変異体(以下、単に「変異体」と称する)のアミノ酸配列を生成する変異導入手段である。ここで、変異導入部102aは、変異体として、元のアミノ酸配列に対して、1もしくは数個のアミノ酸が、欠失、置換、もしくは付加されたアミノ酸配列を生成してもよい。
 また、計算部102bは、膜タンパク質野生型および各変異体について、アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化-ΔS,-ΔSを計算する計算手段である。また、計算部102bは、排除容積V、露出表面積A、露出表面の平均曲率の積分値X、および、露出表面のガウス曲率の積分値Yの4つの幾何学的指標に基づく形態計測学的表現と積分方程式論の統合型方法論を用いて、溶媒和エントロピーを計算してもよい。
 ここで、構造最適化について、計算部102bは、配列ファイル106bに記憶されたアミノ酸配列のみならず、構造ファイル106aに記憶された構造データに基づいて構造最適化を行ってもよい。また、計算部102bは、まず、膜タンパク質の重原子を固定してミニマイズし、つぎに、Cα炭素およびCβ炭素を固定してミニマイズし、最後に、固定なしでミニマイズすることにより、段階的に拘束を外しながら構造最適化を行ってもよい。このほか、計算部102bは、Modeller等のように、他の構造最適化法を用いて、構造最適化を行ってもよい。
 ここで、計算部102bは、以下の方式1~方式5のうち、いずれかの方式にて溶媒和エントロピー変化を計算してもよい。
 方式1:構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーと、三次構造を引き離した二次構造の溶媒和エントロピーとの変化
 方式2:膜貫通部位を取り出してから構造最適化を行った三次構造の溶媒和エントロピーと、取り出した当該膜貫通部位を引き離したのち構造最適化を行った二次構造の溶媒和エントロピーとの変化
 方式3:構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーと、膜貫通部位を取り出し当該膜貫通部位を引き離したのち構造最適化を行った二次構造の溶媒和エントロピーとの変化
 方式4:構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーと、膜貫通部位を取り出し当該膜貫通部位を伸ばしたのち構造最適化を行った一次構造の溶媒和エントロピーとの変化
 方式5:膜貫通部位を取り出してから構造最適化を行った三次構造の溶媒和エントロピーと、膜貫通部位を取り出し当該膜貫通部位を引き離して伸ばしたのち構造最適化を行った一次構造の溶媒和エントロピーとの変化
 また、候補抽出部102cは、膜タンパク質野生型における溶媒和エントロピー変化-ΔSと、変異体における溶媒和エントロピー変化-ΔSとの差分-ΔΔS(=-ΔS-(-ΔS))に基づいて、熱安定化させる変異体の候補を抽出する候補抽出手段である。例えば、候補抽出部102cは、-ΔΔSが負の値のときに熱安定化し、-ΔΔSが正のときに熱不安定化すると判定してもよい。一例として、候補抽出部102cは、-ΔΔSが所定値以下である変異体を、熱安定化させる変異体の候補として抽出してもよい。なお、以下に、各記号とその意味の対応関係を列挙する。
S:(ある構造の)溶媒和エントロピー
-ΔS:(ある構造から他の構造への)溶媒和エントロピー変化
-ΔΔS:(変異前のタンパク質と変異体との間の)溶媒和エントロピー変化の差分
 以上が、本実施形態における熱安定化変異体予測装置100の構成の一例である。なお、熱安定化変異体予測装置100は、ネットワーク300を介して外部システム200に接続されてもよい。この場合、通信制御インターフェース部104は、熱安定化変異体予測装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。また、ネットワーク300は、熱安定化変異体予測装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
 また、外部システム200は、ネットワーク300を介して、熱安定化変異体予測装置100と相互に接続され、構造データや配列データ、パラメータや、シミュレーション結果データ等の各種データに関する外部データベースや、接続された情報処理装置に熱安定化変異体予測方法を実行させるためのプログラム等を提供する機能を有する。
 ここで、外部システム200は、WEBサーバやASPサーバ等として構成していてもよい。また、外部システム200のハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成していてもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
 以上で、本実施形態の構成の説明を終える。
[熱安定化変異体予測装置100の処理]
 次に、このように構成された本実施形態における熱安定化変異体予測装置100の処理の一例について、以下に図面を参照して詳細に説明する。
 まず、熱安定化変異体予測装置100により実行される処理の一例について、図11を参照して説明する。図11は、熱安定化変異体予測装置100により実行される処理の一例を示すフローチャートである。
 図11に示すように、まず、変異導入部102aは、配列ファイル106bに記憶された膜タンパク質のアミノ酸配列に対して、アミノ酸変異を導入することにより、変異体Mtのアミノ酸配列を生成する(ステップSA-1)。例えば、変異導入部102aは、1アミノ酸欠失、1アミノ酸置換、1アミノ酸付加等のアミノ酸変異を導入した変異体Mtを生成してもよい。
 そして、計算部102bは、膜タンパク質野生型Wtおよび各変異体Mtについて、アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化-ΔS,-ΔSを計算する(ステップSA-2)。なお、計算部102bは、後述する方式1~5のうち、いずれかの方式にて溶媒和エントロピーの変化を計算してもよい。また、計算部102bは、排除容積V、露出表面積A、露出表面の平均曲率の積分値X、および、露出表面のガウス曲率の積分値Yの4つの幾何学的指標に基づく形態計測学的表現と積分方程式論の統合型方法論を用いて、溶媒和エントロピーを計算してもよい。ここで、構造最適化について、計算部102bは、配列ファイル106bに記憶されたアミノ酸配列のみならず、構造ファイル106aに記憶された構造データに基づいて構造最適化を行ってもよい。また、計算部102bは、まず、膜タンパク質の重原子を固定してミニマイズし、つぎに、Cα炭素およびCβ炭素を固定してミニマイズし、最後に、固定なしでミニマイズすることにより、段階的に拘束を外しながら構造最適化を行ってもよい。
 そして、候補抽出部102cは、膜タンパク質野生型Wtにおける溶媒和エントロピー変化-ΔSと、変異体Mtにおける溶媒和エントロピー変化-ΔSとの差分-ΔΔS(=-ΔS-(-ΔS))を計算する(ステップSA-3)。
 そして、候補抽出部102cは、計算した差分-ΔΔSに基づいて、熱安定化させる変異体Mtの候補を抽出する(ステップSA-4)。例えば、候補抽出部102cは、-ΔΔSが負の値のときに熱安定化し、-ΔΔSが正のときに熱不安定化すると判定してもよい。一例として、候補抽出部102cは、-ΔΔSが所定の閾値以下である変異体Mtを、熱安定化させる変異体Mtの候補として抽出してもよい。
 以上が、本実施形態における熱安定化変異体予測装置100の処理の一例である。
[5種類の方式]
 つづいて、上述した処理を基礎として、具体的な5種類の方式1~5の処理の詳細について、以下に図12~図32を参照して説明する。図12は、本実施形態の熱安定化変異体予測装置100における、膜タンパク質野生型Wtにおける溶媒和エントロピー変化-ΔSと、変異体Mtにおける溶媒和エントロピー変化-ΔSとの計算方法を模式的に示した図である。
 代表例として、図12に示すように、膜タンパク質野生型Wtと変異体Mtそれぞれについて、αへリックス同士を引き離した状態とパッキングした状態との間の溶媒和エントロピーの差-ΔSを、溶媒和エントロピー変化として求める。これら膜タンパク質野生型Wtの溶媒和エントロピー変化-ΔSと、変異体Mtの溶媒和エントロピー変化-ΔSとの差分-ΔΔS(=-ΔS-(-ΔS))を求める。
 具体的には、計算部102bは、以下の方式1~5のうち、いずれかの方式にて溶媒和エントロピーの変化を計算してもよい。
 方式1は、構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーSと、三次構造を引き離した二次構造の溶媒和エントロピーSとの変化-ΔSを求める方法である。このように、方式1では、引き離したヘリックスの側鎖の再充填は考慮しない。
 方式2は、膜貫通部位を取り出してから構造最適化を行った三次構造の溶媒和エントロピーSと、取り出した当該膜貫通部位を引き離したのち構造最適化を行った二次構造の溶媒和エントロピーSとの変化-ΔSを求める方法である。図13は、方式2,3におけるヘリックスを引き離したのち構造最適化する様子を示す図である。
 方式3は、構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーSと、膜貫通部位を取り出し当該膜貫通部位を引き離したのち構造最適化を行った二次構造の溶媒和エントロピーSとの変化-ΔSを求める方法である。図13に示すように、方式2,3は、引き離したヘリックス各々の構造最適化を行い、側鎖の再充填を考慮している。
 方式4は、構造最適化を行ってから膜貫通部位を取り出した三次構造の溶媒和エントロピーSと、膜貫通部位を取り出し当該膜貫通部位を伸ばしたのち構造最適化を行った一次構造の溶媒和エントロピーSとの変化-ΔSを求める方法である。図14は、方式4,5における、ヘリックスを一次構造まで伸ばした構造の例を示す図である。
 方式5は、膜貫通部位を取り出してから構造最適化を行った三次構造の溶媒和エントロピーSと、膜貫通部位を取り出し当該膜貫通部位を引き離して伸ばしたのち構造最適化を行った一次構造の溶媒和エントロピーSとの変化-ΔSを求める方法である。図14に示すように、方式4,5では、2ステージモデルにおけるステージ1のヘリックス形成に伴うエントロピー変化も考慮する。また、方式1,3,4ではパッキングした構造をミニマイズするときに、ループ構造も考慮する。以下に、方式1~5のより具体的なフロー例について詳細に説明する。
 ここで、図15は、本実施形態の方式1~5に共通する手順を示すフロー図である。なお、本実施例では、ヒト由来アデノシンA2a受容体の結晶構造(PDB code; 3vg9)を野生型Wtとして用いた。のちに詳述する方式1~5に共通する処理として、図15に示すように、計算部102bは、一例としてCHARMMプログラム及びMMTSBプログラムを用いて、A2aRの結晶構造に水素付加を行う(以後、この構造を構造<1>と呼ぶ)。以下に方式1~5の個別フローについて説明する。図16は、方式1の処理例を示すフロー図である。
[方式1]
 図16に示すように、まず、野生型Wtの構造<1>について、計算部102bは、CHARMMプログラムを用いて、膜タンパク質の重原子を固定してミニマイズし、Cα炭素およびCβ炭素を固定してミニマイズし、固定なしでミニマイズする順で、段階的に拘束を外しながら構造最適化を行う(ステップS1-1)。なお、この処理を以下、単に「構造の最適化」と呼ぶ。
 つぎに、計算部102bは、膜貫通部位のみを取り出し、その溶媒和エントロピー(-S)を計算する(ステップS1-2)。
 そして、計算部102bは、それぞれのヘリックスを引き離した構造の溶媒和エントロピーの総和(-S’)を計算する(ステップS1-3)。
 そして、計算部102bは、ヘリックスのパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS1-4)。
 一方、変異体Mtについては、変異導入部102aは、配列ファイル106bに記憶された配列データに基づいて、構造<1>のアミノ酸残基を置換する(ステップS1-a)。
 そして、計算部102bは、構造の最適化を行う(ステップS1-b)。
 そして、計算部102bは、膜貫通部位のみを取り出し、溶媒和エントロピー(-S)を計算する(ステップS1-c)。
 そして、計算部102bは、それぞれのヘリックスを引き離した構造の溶媒和エントロピーの総和(-S’)を計算する(ステップS1-d)。
 そして、計算部102bは、ヘリックスのパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS1-e)。
 以上の結果から、計算部102bは、野生型Wtのエントロピー変化-ΔSと変異型のエントロピー変化-ΔSの差分である、アミノ酸置換に伴うエントロピー変化-ΔΔS=-ΔS-(-ΔS)を計算することができる。
[方式2]
 図17は、方式2の処理例を示すフロー図である。図17に示すように、まず、野生型Wtの構造<1>について、計算部102bは、構造<1>の膜貫通部位のみ(構造<2>と呼ぶ)を取り出す(ステップS2-1)。
 つぎに、計算部102bは、構造の最適化を行い、その溶媒和エントロピー(-S)を計算する(ステップS2-2)。
 そして、計算部102bは、構造<2>のヘリックスを引き離す(ステップS2-3)。
 そして、計算部102bは、それぞれのヘリックスの構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS2-4)。
 そして、計算部102bは、ヘリックスのパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS2-5)。
 一方、変異体Mtについては、変異導入部102aは、構造<2>のアミノ酸残基を置換する(この構造を構造<3>とする)(ステップS2-a)。
 そして、計算部102bは、構造の最適化を行い、その溶媒和エントロピー(-S)を計算する(ステップS2-b)。
 そして、計算部102bは、構造<3>のヘリックスを引き離す(ステップS2-c)。
 そして、計算部102bは、それぞれのヘリックスの構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS2-d)。
 そして、計算部102bは、ヘリックスのパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS2-e)。
 以上の結果から、計算部102bは、野生型Wtのエントロピー変化-ΔSと変異型のエントロピー変化-ΔSの差分である、アミノ酸置換に伴うエントロピー変化-ΔΔS=-ΔS-(-ΔS)を計算することができる。
[方式3]
 図18は、方式3の処理例を示すフロー図である。図18に示すように、まず、野生型Wtの構造<1>について、計算部102bは、構造<1>の構造の最適化を行う(ステップS3-1)。
 つぎに、計算部102bは、膜貫通部位のみを取り出し、その溶媒和エントロピー(-S)を計算する(ステップS3-2)。
 そして、計算部102bは、構造<1>の膜貫通部位を取り出し、ヘリックス構造を引き離す(ステップS3-3)。
 そして、計算部102bは、それぞれのヘリックスの構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS3-4)。
 そして、ヘリックスのパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS3-5)。
 一方、変異体Mtについては、変異導入部102aは、構造<1>のアミノ酸残基を置換する(この構造を構造<4>とする)(ステップS3-a)。
 そして、計算部102bは、構造<4>の構造の最適化を行う(ステップS3-b)。
 そして、計算部102bは、膜貫通部位のみを取り出し、その溶媒和エントロピー(-S)を計算する(ステップS3-c)。
 そして、計算部102bは、構造<4>の膜貫通部位のみを取り出し、ヘリックス構造を引き離す(ステップS3-d)。
 そして、計算部102bは、それぞれのヘリックスの構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS3-e)。
 そして、計算部102bは、ヘリックスのパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS3-f)。
 以上の結果から、計算部102bは、野生型Wtのエントロピー変化-ΔSと変異型のエントロピー変化-ΔSの差分である、アミノ酸置換に伴うエントロピー変化-ΔΔS=-ΔS-(-ΔS)を計算することができる。
[方式4]
 図19は、方式4の処理例を示すフロー図である。図19に示すように、まず、野生型Wtの構造<1>について、計算部102bは、構造<1>の構造の最適化を行う(ステップS4-1)。
 つぎに、計算部102bは、膜貫通部位のみを取り出し、その溶媒和エントロピー(-S)を計算する(ステップS4-2)。
 そして、計算部102bは、構造<1>の膜貫通部位を取り出し、完全に伸ばした構造を作成する(ステップS4-3)。
 そして、計算部102bは、それぞれの伸ばした構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS4-4)。
 そして、計算部102bは、伸びた構造からのヘリックス形成及びパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS4-5)。
 一方、変異体Mtについては、変異導入部102aは、構造<1>のアミノ酸残基を置換する(この構造を構造<4>とする)(ステップS4-a)。
 そして、計算部102bは、構造<4>の構造の最適化を行う(ステップS4-b)。
 そして、計算部102bは、膜貫通部位のみを取り出し、その溶媒和エントロピー(-S)を計算する(ステップS4-c)。
 そして、計算部102bは、構造<4>の膜貫通部位のみを取り出し、完全に伸ばした構造を作成する(ステップS4-d)。
 そして、計算部102bは、それぞれ伸ばした構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS4-e)。
 そして、計算部102bは、伸びた構造からヘリックス形成およびパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS4-f)。
 以上の結果から、計算部102bは、野生型Wtのエントロピー変化-ΔSと変異型のエントロピー変化-ΔSの差分である、アミノ酸置換に伴うエントロピー変化-ΔΔS=-ΔS-(-ΔS)を計算することができる。
[方式5]
 図20は、方式5の処理例を示すフロー図である。図20に示すように、まず、野生型Wtの構造<1>について、計算部102bは、構造<1>の膜貫通部位のみ(構造<2>と呼ぶ)を取り出す(ステップS5-1)。
 つぎに、計算部102bは、構造の最適化を行い、その溶媒和エントロピー(-S)を計算する(ステップS5-2)。
 そして、計算部102bは、構造<2>のヘリックスを引き離し、完全に伸ばした構造を作成する(ステップS5-3)。
 そして、計算部102bは、それぞれ伸ばした構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS5-4)。
 そして、計算部102bは、伸びた構造からヘリックス形成およびパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS5-5)。
 一方、変異体Mtについては、変異導入部102aは、構造<2>のアミノ酸残基を置換する(ステップS5-a)。
 そして、計算部102bは、構造<3>の構造の最適化を行い、その溶媒和エントロピー(-S)を計算する(ステップS5-b)。
 そして、計算部102bは、構造<3>のヘリックスを引き離し、完全に伸ばした構造を作成する(ステップS5-c)。
 そして、計算部102bは、それぞれ伸ばした構造の最適化を行い、溶媒和エントロピーの総和(-S’)を計算する(ステップS5-d)。
 そして、計算部102bは、伸びた構造からヘリックス形成およびパッキングに伴うエントロピー変化-ΔS=-S-(-S’)を計算する(ステップS5-e)。
 以上の結果から、計算部102bは、野生型Wtのエントロピー変化-ΔSと変異型のエントロピー変化-ΔSの差分である、アミノ酸置換に伴うエントロピー変化-ΔΔS=-ΔS-(-ΔS)を計算することができる。
[実験結果との比較]
 置換により安定化または不安定化することが既知のアミノ酸変異5種について、方式1~5による熱安定化変異体の予測結果を検討した。図21は、実験では安定化する88残基目のスレオニンをグルタミン酸に置換した変異体についての方式1~5による計算結果(-ΔΔS)を示す図である。
 図21に示すように、方式1,2,5では、負の数となり予測に成功している。図22は、実験では安定化(熱変性温度が8℃上昇)する91残基目のセリンをアルギニンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。
 図22に示すように、全て負の数となり、すべての方式で予測に成功した。他のアミノ酸への置換でも安定化することが期待される。図23は、実験では不安定化する245残基目のシステインをトリプトファンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。
 図23に示すように、方式1では、安定化と予測してしまう。他の方式では、不安定化されることが予測された。図24は、実験では不安定化する51残基目のアラニンをトリプトファンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。
 図24に示すように、方式1では安定化と予測してしまう。ただし、この置換により、受容体の折り畳み過程に問題が生じ、予測した折り畳み後の構造になることができないことが原因と考えられる。図25は、実験では不安定化する239残基目のバリンをアルギニンに置換した変異体についての方式1~5による計算結果-ΔΔSを示す図である。
 図25に示すように、すべての方式で予測に失敗している。図26は、アミノ酸変異5種について、方式1~5による熱安定化変異体の予測結果の表である。○印は、予測成功、×印は予測失敗を示す。また、マイナス記号は安定化を示し、プラス記号は不安定化を示す。
 図26に示すように、アミノ酸変異5種については、方式5の予測成功率が高かった。また、例えば、方式1と2を組み合わせ、両者で安定(負の数)との結果が出た場合に、安定化変異体候補として予測してもよい。
 つづいて、StaR(登録商標)技術のTateらの実験結果により熱安定効果が既知の変異体群について方式1~5の予測結果を検討した。Tateらは、アラニンスキャニングの実験結果から、17箇所の安定化するアミノ酸置換を報告している。この結果と、方式1~5で計算した-ΔΔSの値を比較した。図27~図31は、それぞれ方式1~5における-ΔΔSの計算結果を示すグラフ図である。図32は、各アミノ酸変異について、方式1~5による熱安定化変異体の予測結果の表である。○印は、予測成功、×印は予測失敗、空欄は計算から外したことを示すものである。また、マイナス記号は安定化を示し、プラス記号は不安定化を示す。なお、G114A,G118A,G123A,G152Aなどのグリシンをアラニンに置換したものは構造の自由度が大きく変わるため、膜のエントロピー効果以外の影響、すなわち、構造エントロピーの影響が大きいと考えられるため、計算から外し、空欄とした。また、P149A,E151A残基は結晶構造が得られていないループ部分であるため計算から外し、空欄とした。H075A,T119A,K122A,A203L,A204L,A231L,L235Aは、膜の外のアミノ酸残基であるため、膜貫通部位を取り出してから置換を行う方式2と5では計算外となるため、空欄とした。
 図27~図32に示すように、方式1または方式4を用いるのがよいと考えられる。また、T088Aは、実験結果から、安定性が大きく向上する置換であるが、方式1~5のどの計算方式でも安定化すると予測できた。したがって、方式1~5のどの計算方式でも安定化すると予測される置換を選べば、安定性が大きく向上する変異体を予測できると期待できる。
[実施例]
 また、本実施形態における熱安定化変異体予測装置100の実施例について図1、および、図33乃至図47を参照して説明する。図33は、熱安定化変異体予測装置100により実行される処理の一例を示すフローチャートである。
 図33に示すように、まず、変異導入部102aは、配列ファイル106bに記憶された膜タンパク質野生型Wtのアミノ酸配列に対して、アミノ酸変異を導入することにより、変異体Mtのアミノ酸配列を生成する(ステップSB-1)。例えば、変異導入部102aは、1アミノ酸欠失、1アミノ酸置換、1アミノ酸付加等のアミノ酸変異を導入した変異体Mtを生成してもよい。
 そして、計算部102bは、膜タンパク質野生型Wtおよび各変異体Mtについて、アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化-ΔSw,-ΔSmを計算し、膜タンパク質野生型Wtおよび各変異体Mtについて、アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までのエネルギー変化ΔΛ,ΔΛを計算する(ステップSB-2)。
 なお、計算部102bは、前述の方式1~5のうち、いずれかの方式にて溶媒和エントロピーの変化を計算してもよい。また、計算部102bは、排除容積V、露出表面積A、露出表面の平均曲率の積分値X、および、露出表面のガウス曲率の積分値Yの4つの幾何学的指標に基づく形態計測学的表現と積分方程式論の統合型方法論を用いて、溶媒和エントロピーを計算してもよい。
 ここで、構造最適化について、計算部102bは、配列ファイル106bに記憶されたアミノ酸配列のみならず、構造ファイル106aに記憶された構造データに基づいて構造最適化を行ってもよい。また、計算部102bは、まず、膜タンパク質の重原子を固定してミニマイズし、つぎに、Cα炭素およびCβ炭素を固定してミニマイズし、最後に、固定なしでミニマイズすることにより、段階的に拘束を外しながら構造最適化を行ってもよい。
 ここで、本実施例におけるエネルギー計算の一例について図1、図34、および、図35を参照して説明する。図34は、分子内水素結合を一つ形成した時のエネルギー低下の値を表した図である。
 本実施例では、膜タンパク質用の自由エネルギー関数Fは、以下の式で表される。
F=-TS+Λ
(T:絶対温度、S:エントロピー成分、Λ:エネルギー成分)
 上記の式を、k(k:ボルツマン定数,T=298K)で割って無次元化し、T=Tと設定すると下記の式となる。
F/(k)=-S/k+Λ/(k
 ここで、図1に示すように、本実施例においては、完全に伸びた構造(分子内水素結合を全く持たない)を基準にして、「分子内水素結合形成に伴うエネルギー低下=分子内水素結合数*D」を計算する。ここで、Dは、分子内水素結合を1つ形成したときのエネルギー低下の値である。
 また、図34に示すように、Dは、ドナーとアクセプターとの原子の中心間距離が1.5Å未満の場合、Dとし(すなわち、Dのエネルギー低下を与え)、中心間距離が1.5Å以上且つ3.0Å未満の場合、0からDまで直線的に減少する値とし(すなわち、直線的に減少させたエネルギー低下を与え)、中心間距離が3.0Å以上の場合、0とする(すなわち、エネルギー低下を与えない)。ここで、本実施例において、Dは、-4kTであってもよい。
 そして、主鎖-主鎖,主鎖-側鎖,側鎖-側鎖間のあらゆるドナーとアクセプターを調べ、それぞれに対しDを計算し、その総和をとることで、「Λ=分子内水素結合形成に伴うエネルギー低下(負)」を計算する。なお、タンパク質分子内のファン・デル・ワールス引力相互作用の獲得は、蛋白質-リン脂質間のファン・デル・ワールス引力相互作用の喪失と相殺し合うと仮定している。
 ここで、図35を参照して、本実施例におけるΛの計算手順の一例について説明する。図35は、Λの処理例を示すフロー図である。
 図35に示すように、まず、計算部102bは、膜タンパク質野生型Wtの構造<1>の構造の最適化を行う(ステップS6-1)。
 つぎに、計算部102bは、膜貫通(間入)部位のみを取り出し、そのエネルギー(Λ)を計算する(ステップS6-2)。
 そして、計算部102bは、構造<1>の膜貫通部位を取り出し、仮想的に考えた完全に伸びた構造(Λ’=0)を取得する(ステップS6-3)。
 そして、計算部102bは、仮想的に考えた完全に伸びた構造(Λ’=0)からのヘリックス形成およびパッキングに伴うエネルギー変化ΔΛ=Λ-Λ’を計算する(ステップS6-4)。
 一方、変異体Mtについては、変異導入部102aは、構造<1>のアミノ酸残基を置換する(この構造を構造<4>とする)(ステップS6-a)。
 そして、計算部102bは、構造<4>の構造の最適化を行う(ステップS6-b)。
 そして、計算部102bは、膜貫通部位のみを取り出し、そのエネルギー(Λ)を計算する(ステップS6-c)。
 そして、計算部102bは、構造<4>の膜貫通部位を取り出し、仮想的に考えた完全に伸びた構造(Λ’=0)を取得する(ステップS6-d)。
 そして、計算部102bは、仮想的に考えた完全に伸びた構造(Λ’=0)からのヘリックス形成およびパッキングに伴うエネルギー変化ΔΛ=Λ-Λ’を計算する(ステップS6-e)。
 以上の結果から、計算部102bは、膜タンパク質野生型Wtのエネルギー変化ΔΛと変異型のエネルギー変化ΔΛとの差分である、折り畳みによるエネルギー低下のアミノ酸置換に伴うエネルギー変化量ΔΔΛ=ΔΛ-ΔΛを計算することができる。
 図33に戻り、候補抽出部102cは、膜タンパク質野生型Wtにおける溶媒和エントロピー変化-ΔSと、変異体Mtにおける溶媒和エントロピー変化-ΔSとの差分-ΔΔS(=-ΔS-(-ΔS))を計算し、膜タンパク質野生型Wtにおけるエネルギー変化ΔΛと、変異体Mtにおけるエネルギー変化ΔΛとの差分ΔΔΛ(=ΔΛ-ΔΛ)を計算する(ステップSB-3)。
 そして、候補抽出部102cは、計算したΔΔΛと-TΔΔSとの和であるΔΔFに基づいて、熱安定化させる変異体Mtの候補を抽出する(ステップSB-4)。例えば、候補抽出部102cは、ΔΔF(折り畳みによる系の自由エネルギー低下のアミノ酸置換に伴う変化量)が負の値の場合に熱安定化し、ΔΔFが正の場合に熱不安定化すると判定してもよい。一例として、候補抽出部102cは、ΔΔFが所定の閾値以下である変異体Mtを、熱安定化させる変異体Mtの候補として抽出してもよい。
 ここで、図36乃至図47を参照して、本実施における予測結果の一例について説明する。図36は、予測結果の一例を示す図である。図37はS91Rに対する方式1~5のΔΔFの値を示す図である。図38は、S91Kに対する方式1~5のΔΔFの値を示す図である。図39は、L85Rに対する方式1~5のΔΔFの値を示す図である。図40は、N280Rに対する方式1~5のΔΔFの値を示す図である。図41は、N181Kに対する方式1~5のΔΔFの値を示す図である。図42は、予測結果の一例を示す図である。図43は、S91Rに対する方式1~5の-ΔΔSの値を示す図である。図44は、S91Kに対する方式1~5の-ΔΔSの値を示す図である。図45は、L85Rに対する方式1~5の-ΔΔSの値を示す図である。図46は、N280Rに対する方式1~5の-ΔΔSの値を示す図である。図47は、N181Kに対する方式1~5の-ΔΔSの値を示す図である。
 まず、Modellerを用いて行われた全アミノ酸置換の中で、方式1に基づいて計算されたΔΔFの値において、小さいものから順に5つのアミノ酸置換(S91R、S91K、L85R、N280R、N181K)を、安定化が予測されるアミノ酸置換として選び出した。
 そして、図36に示すように、本実施例においては、本熱安定化変異体予測方法を用いて、これら5つのアミノ酸置換に対してΔΔFの値(図37~図41)を計算し、方式1から方式5のいずれかの方式を用いた場合における予測結果(安定化(-)または不安定化(+))を取得した。
 すなわち、図36に示すように、本実施例においては、方式1から方式5のいずれの方式を用いた場合であっても、これら5つのアミノ酸置換に対するΔΔFの値は負の値であり、安定化させる変異体であると予測された(図36の方式1から方式5の列に示す(-))。
 そして、これら5つのアミノ酸置換に対して、検証実験を行い、実験的に安定化するか否かの確認を行ったところ、図36に示すように、これら5つのアミノ酸置換のうち3つのアミノ酸置換において実際に安定化が確認され(図36の左端の列に示す(-))、方式1から方式5のいずれの方式を用いても、予測成功率60%の結果が得られた。
 さらに、図42に示すように、本実施例においては、本熱安定化変異体予測方法を用いて、これら5つのアミノ酸置換に対して-ΔΔSの値(図43~図47)を計算した所、方式1から方式5のいずれかの方式を用いた場合における予測結果(安定化(-)または不安定化(+))を取得した。
 すなわち、図42に示すように、本実施例においては、方式1から方式5のいずれの方式を用いた場合であっても、これら5つのアミノ酸置換に対するΔΔFの値は負の値であり、安定化させる変異体であると予測された(図42の方式1から方式5の列に示す(-))。
 そして、これら5つのアミノ酸置換に対して、検証実験を行い、実験的に安定化するか否かの確認を行ったところ、図42に示すように、これら5つのアミノ酸置換のうち3つのアミノ酸置換において実際に安定化が確認され(図42の左端の列に示す(-))、エントロピーのみの観点で、方式1から方式5のいずれの方式を用いても、予測成功率60%の結果が得られた。
 このように、本実施例においては、-ΔΔSを用いた熱安定化変異体予測を行っても、ΔΔFを用いた熱安定化変異体予測を行っても、いずれも高い予測成功率が得られることが分かった。
[他の実施形態]
 さて、これまで本発明の実施形態について説明したが、本発明は、上述した実施形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
 例えば、熱安定化変異体予測装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、熱安定化変異体予測装置100は、クライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。
 また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
 このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
 また、熱安定化変異体予測装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
 例えば、熱安定化変異体予測装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、後述する記録媒体に記録されており、必要に応じて熱安定化変異体予測装置100に機械的に読み取られる。すなわち、ROMまたはHDなどの記憶部106などには、OS(Operating System)として協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
 また、このコンピュータプログラムは、熱安定化変異体予測装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
 また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD-ROM、MO、DVD、および、Blu-ray(登録商標)Disc等の任意の「可搬用の物理媒体」を含むものとする。
 また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
 記憶部106に格納される各種のデータベース等(構造ファイル106a、配列ファイル106b等)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。
 また、熱安定化変異体予測装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、熱安定化変異体予測装置100は、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
 更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。
 以上詳述に説明したように、本発明によれば、エロンゲーション法を2次元系や3次元系に適用する場合であっても、計算時間の増大化を抑制することができる、熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラムを提供することができるので、新規物質探索や医療や製薬や創薬や化学的研究や生物学研究や臨床検査など様々な分野において極めて有用である。
 100 熱安定化変異体予測装置
 102 制御部
 102a 変異導入部
 102b 計算部
 102c 候補抽出部
 104 通信制御インターフェース部
 106 記憶部
 106a 構造ファイル
 106b 配列ファイル
 108 入出力制御インターフェース部
 114 入力部
 116 出力部
 200 外部システム
 300 ネットワーク

Claims (12)

  1.  膜タンパク質を熱安定化させるアミノ酸変異体の候補を予測する、記憶部と制御部とを備えた熱安定化変異体予測装置において、
     上記記憶部は、
     上記膜タンパク質のアミノ酸配列を記憶し、
     上記制御部は、
     上記膜タンパク質の上記アミノ酸配列にアミノ酸変異を導入することにより、上記アミノ酸変異体のアミノ酸配列を生成する変異導入手段と、
     上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算する計算手段と、
     上記膜タンパク質における上記溶媒和エントロピー変化と上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出する候補抽出手段と、
     を備えたことを特徴とする熱安定化変異体予測装置。
  2.  請求項1に記載の熱安定化変異体予測装置において、
     上記計算手段は、
     更に、上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて上記構造最適化を伴った上記膜貫通部位における、上記一次構造から上記三次構造形成まで或いは上記二次構造から上記三次構造形成までのエネルギー変化を計算し、
     上記候補抽出手段は、
     上記膜タンパク質における上記エネルギー変化と上記アミノ酸変異体における上記エネルギー変化との差分、ならびに、上記膜タンパク質における上記溶媒和エントロピー変化と上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に絶対温度を乗じた値、の和である変化量に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出することを特徴とする熱安定化変異体予測装置。
  3.  請求項1または2に記載の熱安定化変異体予測装置において、
     上記計算手段は、
     排除容積、露出表面積、露出表面の平均曲率の積分値、および、露出表面のガウス曲率の積分値の4つの幾何学的指標に基づく形態計測学的表現と積分方程式論の統合型方法論を用いて、上記溶媒和エントロピー変化を計算することを特徴とする熱安定化変異体予測装置。
  4.  請求項1乃至3のいずれか一つに記載の熱安定化変異体予測装置において、
     上記記憶部は、更に、
     上記膜タンパク質の構造データを記憶し、
     上記計算手段は、
     上記アミノ酸配列および上記構造データに基づいて構造最適化を行うことを特徴とする熱安定化変異体予測装置。
  5.  請求項1乃至4のいずれか一つに記載の熱安定化変異体予測装置において、
     上記計算手段は、
     まず、上記膜タンパク質の重原子を固定してミニマイズし、つぎに、Cα炭素およびCβ炭素を固定してミニマイズし、最後に、固定なしでミニマイズすることにより、段階的に拘束を外しながら上記構造最適化を行うことを特徴とする熱安定化変異体予測装置。
  6.  請求項1乃至5のいずれか一つに記載の熱安定化変異体予測装置において、
     上記計算手段は、
     上記構造最適化を行ってから上記膜貫通部位を取り出した上記三次構造の溶媒和エントロピーと、当該三次構造を引き離した上記二次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする熱安定化変異体予測装置。
  7.  請求項1乃至5のいずれか一つに記載の熱安定化変異体予測装置において、
     上記計算手段は、
     上記膜貫通部位を取り出してから上記構造最適化を行った上記三次構造の溶媒和エントロピーと、取り出した当該膜貫通部位を引き離したのち上記構造最適化を行った上記二次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする熱安定化変異体予測装置。
  8.  請求項1乃至5のいずれか一つに記載の熱安定化変異体予測装置において、
     上記計算手段は、
     上記構造最適化を行ってから上記膜貫通部位を取り出した上記三次構造の溶媒和エントロピーと、上記膜貫通部位を取り出し当該膜貫通部位を引き離したのち上記構造最適化を行った上記二次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする熱安定化変異体予測装置。
  9.  請求項1乃至5のいずれか一つに記載の熱安定化変異体予測装置において、
     上記計算手段は、
     上記構造最適化を行ってから上記膜貫通部位を取り出した上記三次構造の溶媒和エントロピーと、上記膜貫通部位を取り出し当該膜貫通部位を伸ばしたのち上記構造最適化を行った上記一次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする熱安定化変異体予測装置。
  10.  請求項1乃至5のいずれか一つに記載の熱安定化変異体予測装置において、
     上記計算手段は、
     上記膜貫通部位を取り出してから上記構造最適化を行った上記三次構造の溶媒和エントロピーと、上記膜貫通部位を取り出し当該膜貫通部位を引き離して伸ばしたのち上記構造最適化を行った上記一次構造の溶媒和エントロピーとの変化を上記溶媒和エントロピー変化として計算することを特徴とする熱安定化変異体予測装置。
  11.  膜タンパク質のアミノ酸配列を記憶する記憶部と制御部とを備えたコンピュータにおいて実行される、上記膜タンパク質を熱安定化させるアミノ酸変異体の候補を予測する熱安定化変異体予測方法であって、
     上記膜タンパク質の上記アミノ酸配列にアミノ酸変異を導入することにより、上記アミノ酸変異体のアミノ酸配列を生成する変異導入ステップと、
     上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算する計算ステップと、
     上記膜タンパク質における上記溶媒和エントロピー変化と上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出する候補抽出ステップと、
     を含むことを特徴とする熱安定化変異体予測方法。
  12.  膜タンパク質を熱安定化させるアミノ酸変異体の候補を予測するため、上記膜タンパク質のアミノ酸配列を記憶する記憶部と制御部とを備えたコンピュータに実行させるためのプログラムであって、
     上記膜タンパク質の上記アミノ酸配列にアミノ酸変異を導入することにより、上記アミノ酸変異体のアミノ酸配列を生成する変異導入ステップと、
     上記膜タンパク質および上記各アミノ酸変異体について、上記アミノ酸配列に基づいて構造最適化を伴った膜貫通部位における、一次構造から三次構造形成まで或いは二次構造から三次構造形成までの溶媒和エントロピー変化を計算する計算ステップと、
     上記膜タンパク質における上記溶媒和エントロピー変化と上記アミノ酸変異体における上記溶媒和エントロピー変化との差分に基づいて、上記熱安定化させるアミノ酸変異体の候補を抽出する候補抽出ステップと、
     を実行させるためのプログラム。
PCT/JP2015/068277 2014-06-25 2015-06-24 膜タンパク質の熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラム WO2015199162A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201580033500.8A CN106415562B (zh) 2014-06-25 2015-06-24 膜蛋白质的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序
US15/321,414 US20170212982A1 (en) 2014-06-25 2015-06-24 Thermostabilized mutant-predicting apparatus for membrane protein, a thermostabilized mutant-predicting method, and computer program product
EP15812344.8A EP3163481B1 (en) 2014-06-25 2015-06-24 Device, method and program for predicting mutant capable of thermally stabilizing membrane protein
JP2016529643A JP6359656B2 (ja) 2014-06-25 2015-06-24 予測装置、予測方法、および、プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-130560 2014-06-25
JP2014130560 2014-06-25

Publications (1)

Publication Number Publication Date
WO2015199162A1 true WO2015199162A1 (ja) 2015-12-30

Family

ID=54938240

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/068277 WO2015199162A1 (ja) 2014-06-25 2015-06-24 膜タンパク質の熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラム

Country Status (5)

Country Link
US (1) US20170212982A1 (ja)
EP (1) EP3163481B1 (ja)
JP (2) JP6359656B2 (ja)
CN (1) CN106415562B (ja)
WO (1) WO2015199162A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2014115416A1 (ja) * 2013-01-23 2017-01-26 分子設計フロンティア株式会社 溶液中の生体高分子の構造揺らぎとダイナミクスを記述する方程式
JP2022512637A (ja) * 2018-10-11 2022-02-07 バークレー ライツ,インコーポレイテッド 最適化タンパク質生成の同定のためのシステム及び方法並びにそのためのキット

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709274A (zh) * 2017-02-27 2017-05-24 新疆大学 一种通过熵变分析生物功能基因在其生长发育中协同调控物理机制的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134514A (ja) * 2008-12-02 2010-06-17 Panasonic Corp タンパク質立体構造予測法
JP2012504801A (ja) * 2008-10-06 2012-02-23 ザ ユニヴァーシティ オブ ブリティッシュ コロンビア ミスフォールドタンパク質エピトープを予測するための方法およびシステム
US20130013279A1 (en) * 1999-11-03 2013-01-10 Lonza Biologics Plc Apparatus and method for structure-based prediction of amino acid sequences

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002354462A1 (en) * 2001-12-10 2003-07-09 Fujitsu Limited Apparatus for predicting stereostructure of protein and prediction method
PL375219A1 (en) * 2002-08-16 2005-11-28 Schering Aktiengesellschaft Enos mutants useful for gene therapy
CA2812721C (en) * 2010-09-30 2019-01-15 Zymeworks Inc. Simplifying residue relationships in protein design
JP5704386B2 (ja) * 2010-10-12 2015-04-22 日本電気株式会社 タンパク質分子のアミノ酸置換部位選択装置、置換アミノ酸選択装置、アミノ酸置換部位選択方法、置換アミノ酸選択方法、プログラムおよび記録媒体
CN103087145A (zh) * 2013-02-20 2013-05-08 福州大学 一种基于理性设计的蛋白质分子热稳定性改造方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130013279A1 (en) * 1999-11-03 2013-01-10 Lonza Biologics Plc Apparatus and method for structure-based prediction of amino acid sequences
JP2012504801A (ja) * 2008-10-06 2012-02-23 ザ ユニヴァーシティ オブ ブリティッシュ コロンビア ミスフォールドタンパク質エピトープを予測するための方法およびシステム
JP2010134514A (ja) * 2008-12-02 2010-06-17 Panasonic Corp タンパク質立体構造予測法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3163481A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2014115416A1 (ja) * 2013-01-23 2017-01-26 分子設計フロンティア株式会社 溶液中の生体高分子の構造揺らぎとダイナミクスを記述する方程式
JP2022512637A (ja) * 2018-10-11 2022-02-07 バークレー ライツ,インコーポレイテッド 最適化タンパク質生成の同定のためのシステム及び方法並びにそのためのキット

Also Published As

Publication number Publication date
JP6359656B2 (ja) 2018-07-18
JP6533324B2 (ja) 2019-06-19
CN106415562A (zh) 2017-02-15
EP3163481A1 (en) 2017-05-03
JP2018160255A (ja) 2018-10-11
EP3163481A4 (en) 2018-02-07
US20170212982A1 (en) 2017-07-27
CN106415562B (zh) 2019-12-10
JPWO2015199162A1 (ja) 2017-04-20
EP3163481B1 (en) 2019-05-01

Similar Documents

Publication Publication Date Title
JP6533324B2 (ja) 熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラム
Kubelka et al. Chemical, physical, and theoretical kinetics of an ultrafast folding protein
Wassenaar et al. High-throughput simulations of dimer and trimer assembly of membrane proteins. The DAFT approach
Paliwal et al. A benchmark test set for alchemical free energy transformations and its use to quantify error in common free energy methods
Zhukov et al. Biophysical mapping of the adenosine A2A receptor
Hills Jr et al. Insights from coarse-grained Gō models for protein folding and dynamics
Mirijanian et al. Development and use of an atomistic CHARMM‐based forcefield for peptoid simulation
Kirmizialtin et al. Revisiting and computing reaction coordinates with directional milestoning
Kurcinski et al. Flexible docking of peptides to proteins using CABS‐dock
Mijaković et al. A comparison of force fields for ethanol–water mixtures
Marino et al. Confinement-induced states in the folding landscape of the Trp-cage miniprotein
Norgaard et al. Experimental parameterization of an energy function for the simulation of unfolded proteins
Wang et al. Higher accuracy achieved in the simulations of protein structure refinement, protein folding, and intrinsically disordered proteins using polarizable force fields
Hall et al. Sidekick for membrane simulations: automated ensemble molecular dynamics simulations of transmembrane helices
Thorpe et al. Exploration of transferability in multiscale coarse-grained peptide models
Nagarajan et al. Design of symmetric TIM barrel proteins from first principles
Andrews et al. COFFDROP: a coarse-grained nonbonded force field for proteins derived from all-atom explicit-solvent molecular dynamics simulations of amino acids
Perthold et al. GroScore: accurate scoring of protein–protein binding poses using explicit-solvent free-energy calculations
Bereau et al. Enhanced sampling of coarse-grained transmembrane-peptide structure formation from hydrogen-bond replica exchange
Bilodeau et al. Conformational equilibria of multimodal chromatography ligands in water and bound to protein surfaces
Zaporozhets et al. Multibody terms in protein coarse-grained models: A top-down perspective
Mukherjee et al. Genome-wide protein structure prediction
Ostermeir et al. Hamiltonian replica exchange combined with elastic network analysis to enhance global domain motions in atomistic molecular dynamics simulations
Altan et al. Using schematic models to understand the microscopic basis for inverted solubility in γD-crystallin
Bertaccini et al. Effect of cobratoxin binding on the normal mode vibration within acetylcholine binding protein

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15812344

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016529643

Country of ref document: JP

Kind code of ref document: A

REEP Request for entry into the european phase

Ref document number: 2015812344

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2015812344

Country of ref document: EP

Ref document number: 15321414

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE