WO2020262327A1 - 酵素-電極間電子伝達増強作用の有無の予測方法 - Google Patents
酵素-電極間電子伝達増強作用の有無の予測方法 Download PDFInfo
- Publication number
- WO2020262327A1 WO2020262327A1 PCT/JP2020/024471 JP2020024471W WO2020262327A1 WO 2020262327 A1 WO2020262327 A1 WO 2020262327A1 JP 2020024471 W JP2020024471 W JP 2020024471W WO 2020262327 A1 WO2020262327 A1 WO 2020262327A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- compound
- action
- smr
- descriptor
- nanocarbon
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M1/00—Apparatus for enzymology or microbiology
- C12M1/40—Apparatus specially designed for the use of free, immobilised, or carrier-bound enzymes, e.g. apparatus containing a fluidised bed of immobilised enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N11/00—Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
- C12N11/14—Enzymes or microbial cells immobilised on or in an inorganic carrier
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/25—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving enzymes not classifiable in groups C12Q1/26 - C12Q1/66
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/26—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase
- C12Q1/32—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase involving dehydrogenase
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/28—Electrolytic cell components
- G01N27/30—Electrodes, e.g. test electrodes; Half-cells
- G01N27/327—Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
Definitions
- a technique for predicting the presence or absence of an enzyme-electrode electron transfer enhancing action is disclosed.
- nanocarbon Since nanocarbon has high electrical conductivity, its application as a conductive material for electron transfer with other substances is progressing. For example, it has been proposed to mix nanocarbon with an ink composed of carbon, resin and an organic solvent, print it on a substrate, and use it as an electrode for a biosensor (Patent Document 1).
- carbon nanotubes which are a type of nanocarbon, are used in sensors for measuring peroxides (Patent Document 2), and are molded into a film together with enzymes and used as electrodes for sensors and fuel cells (Patent Document 2).
- Patent Document 3 It has also been reported that the use of single-walled carbon nanotubes causes electron transfer from the enzyme directly to the electrode (Non-Patent Document 1). This makes it possible to use flavin adenine dinucleotide-coenzyme glucose dehydrogenase (FADGDH), which has traditionally required a mediator, in a glucose sensor without a mediator.
- FADGDH flavin adenine dinucleotide-co
- action A a means for predicting the presence or absence of an action (hereinafter referred to as "action A") of enhancing electron transfer between an enzyme and an electrode by nanocarbon.
- the present inventors generate a value of a specific descriptor from the structure of the target compound to determine whether or not the target compound has action A, and use that value as the descriptor. We found that it can be predicted by applying it to the prediction model expressed as a function of. Further research and improvement were carried out on such findings, and the present invention was completed.
- the present invention includes the following aspects: Item 1. It is a method of predicting whether or not the target compound has an action A that enhances the electron transfer between the enzyme and the electrode by nanocarbon.
- the step of generating the descriptor value related to action A from the structure of the target compound, and the value of the descriptor related to action A are applied to the prediction model expressed as a function of the descriptor related to action A.
- a method in which the descriptor associated with the action A comprises fr_Ar_OH or SMR_VSA9.
- Item 2. Item 2.
- Item 9 A method of enhancing electron transfer between enzymes and electrodes by nanocarbon. Including attaching or bringing compound X to or close to nanocarbon
- the values of the descriptors fr_Ar_OH, SMR_VSA6, PEOE_VSA11, and fr_aryl_methyl of compound X are as follows: -1.00 + 2.00 x fr_Ar_OH + 0.37 x SMR_VSA6-0.20 x PEOE_VSA11 + 1.43 x fr_aryl_methyl ⁇ 0 How to meet.
- Item 9 The method according to Item 9, wherein the compound X is a compound having an aromatic ring skeleton.
- the method of Item 9 or 10, wherein attaching or bringing compound X close to or adhering to nanocarbon comprises loading nanocarbon, compound X, and an enzyme onto a substrate of the electrode.
- Item 9. The method according to Item 9 or 10, wherein attaching or bringing the compound X close to the nanocarbon comprises immersing the electrode on which the nanocarbon and the enzyme are loaded on the substrate in a solvent containing the compound X.
- Item 13 Item 12.
- the method according to Item 12, wherein the concentration of compound X in the solvent is 0.000001 to 2% (w / v).
- Item 14 The use of compound X to enhance enzyme-electrode electron transfer by nanocarbons.
- a technique relating to a method for predicting the presence or absence of action A is provided.
- the structure of the electrode produced in the example is shown.
- “1” is a PET film
- "2” is an adhesive sheet
- "3” is a gold-deposited PET film
- "4" is a working electrode site.
- a method for predicting whether or not the target compound has action A is, in one embodiment, described in the following steps: (1) The step of generating the value of the descriptor related to the action A from the structure of the target compound, and (2) the value of the descriptor related to the action A are expressed as a function of the descriptor related to the action A. It is preferable to include a step of predicting whether or not the target compound has action A by applying it to a prediction model.
- the target compound is not particularly limited as long as the structure can be specified, and includes low molecular weight organic compounds having a molecular weight of 1000 or less, high molecular weight organic compounds having a molecular weight of more than 1000 (for example, synthetic resins, proteins, polysaccharides) and the like. Can be mentioned.
- the target compound is preferably a low molecular weight organic compound. Further, in one embodiment, it is preferable that the target compound alone is a compound that does not have a function as a mediator from the viewpoint of prediction accuracy.
- the target compound is preferably a compound having an aromatic ring skeleton.
- the number of ring-constituting atoms in the aromatic ring skeleton is, for example, 5 to 18, preferably 5 to 16, and even more preferably 5 to 14.
- the number of aromatic rings in the target compound is, for example, 4 or less, preferably 3 or less, and more preferably 1 or 2.
- the aromatic ring skeleton includes a skeleton consisting of one benzene ring, a skeleton consisting of two or more (for example, 2 to 4) benzene rings (naphthalene skeleton, anthracene skeleton, etc.), a benzene ring and another aromatic ring (nitrogen-containing aromatic ring).
- the target compound is preferably a compound having a skeleton consisting of one benzene ring. Moreover, in one embodiment, a compound having no phenothiazine skeleton is preferable.
- the compound having an aromatic ring skeleton preferably has an electron-donating substituent.
- the electron-donating substituent is a hydroxy group, an amino group, a methyl group, or the like.
- a preferred electron donating substituent is a hydroxy group.
- Action A is not particularly limited as long as it is an action of enhancing electron transfer between the enzyme and the electrode by nanocarbon.
- the nanocarbon may be any substance as long as it has an electron transfer function and is recognized as nanocarbon.
- Such a substance means a carbon material composed mainly of carbon, including, for example, carbon nanotubes, carbon nanohorns, carbon nanotwists, cocoons, carbon nanocoils, graphene, fullerenes and the like.
- the carbon nanotubes may be single-walled carbon nanotubes, double-walled carbon nanotubes, or multi-walled carbon nanotubes.
- the nanocarbon is preferably a carbon nanotube, preferably a single-walled carbon nanotube.
- the enzyme preferably releases an electron by a catalytic reaction.
- an enzyme include redox enzymes.
- the oxidoreductase include glucose dehydrogenase, glucose oxidase, lactic acid oxidase, cholesterol oxidase, alcohol oxidase, zarcosine oxidase, fructosylamine oxidase, pyruvate oxidase, lactate dehydrogenase, alcohol dehydrogenase, glycerol oxidase and glycerol-3-lin.
- Examples thereof include acid oxidase, uricase, choline oxidase, xanthine oxidase, and hydroxybutyric acid dehydrogenase.
- the enzyme is preferably glucose dehydrogenase, preferably flavin-bound glucose dehydrogenase, and preferably glucose dehydrogenase (FADGDH) with flavin adenine dinucleotide (FAD) as a coenzyme.
- FAD glucose dehydrogenase
- FADGDH glucose dehydrogenase
- FAD flavin adenine dinucleotide
- FADGDH is not limited, and any type can be used. Specific examples of FADGDH include those derived from one of the following organisms: Aspergillus terreus, Aspergillus oryzae, Alpergillus niger, Aspergillus foretidas, Alpergillus aureus, Aspergillus barge color, Aspergillus.
- the preferred FADGDHs are FADGDH from Aspergillus oryzae, FADGDH from Mucor hiemalis, FADGDH from Mucor subtilisimas, FADGDH from silcinera simplex, FADGDH from Metallydium spy or from Colletorcum SP. It preferably has 80% or more identity with the amino acid sequences of SEQ ID NOs: 1 to 6, more preferably 90% or more identity with the amino acid sequences of SEQ ID NOs: 1 to 6, and even more preferably sequences. Examples thereof include those having 95% or more identity with the amino acid sequences of Nos. 1 to 6 and having glucose dehydrogenating activity.
- Amino acid sequence identity can be calculated using commercially available or telecommunications line (Internet) analysis tools, such as the National Center for Biotechnology Information (NCBI) homology algorithm BLAST (Basic local alignmentment). search tool) http://www.ncbi.nlm.nih.gov/BLAST/ It can be calculated using the default (initial setting) parameters.
- the amino acid sequence of SEQ ID NO: 1 is that of FADGDH derived from Aspergillus oryzae
- the amino acid sequence of SEQ ID NO: 2 is that of FADGDH derived from Mucor Hiemaris
- the amino acid sequence of SEQ ID NO: 3 is that of Mucor.
- the amino acid sequence of SEQ ID NO: 4 is that of FADGDH derived from silcinella simplex
- amino acid sequence of SEQ ID NO: 5 is that of FADGDH derived from Metallydium SP
- SEQ ID NO: 6 The amino acid sequence of is that of FADGDH derived from collettricum SP.
- the electrode is not particularly limited, and for example, an electrode in which a metal film (for example, a metal thin film) or a carbon film (for example, a carbon thin film) is laminated on an insulating substrate can be used.
- a metal film for example, a metal thin film
- a carbon film for example, a carbon thin film
- an insulating substrate for example, a glass substrate or a plastic substrate (for example, a PET substrate) can be used.
- the type of metal forming the metal film is not particularly limited as long as it is used for an electrode, and examples thereof include gold, platinum, and titanium.
- the carbon film for example, a thin film made of carbon paste can be used.
- the type and number of descriptors related to action A are not particularly limited as long as they are descriptors capable of predicting the presence or absence of action A.
- the descriptor associated with action A is preferably the descriptor extracted by sparse modeling, more specifically the descriptor extracted in the additional step (i) described below. Is preferable.
- the descriptor associated with action A is preferably at least one selected from 0-4 dimensional descriptors.
- the 0-dimensional descriptor include the number of atoms such as C, H, O, N, and halogen, the number of bonds, and the molecular weight.
- the one-dimensional descriptor include the number of functional groups such as an alkyl group, an aryl group, an arylalkyl group, a hydroxy group, an ester group, and an amino group, the number of aromatic rings, and the like.
- Examples of the two-dimensional descriptor include those characterized by structural formulas such as SMR_VSA1 to 10, PEOE_VSA1 to 14, SlogP_VSA1 to 12, Estate_VSA1 to 11.
- Examples of the three-dimensional descriptor include geometrically characterized ones such as 3D-MoRSE, WHIM, and GETAWAY.
- Examples of the four-dimensional descriptor include those calculated by GRID, CoMFA, Volsurf, etc. and characterized by the interaction energy.
- the descriptor associated with action A is preferably at least one selected from 0 to 2D descriptors.
- the number of descriptors related to action A is not particularly limited, but 2 or more is preferable, 3 or more is more preferable, and 4 or more is further preferable from the viewpoint of improving prediction accuracy. Further, the number of descriptors related to the action A is preferably 10 or less, more preferably 8 or less, and further preferably 6 or less from the viewpoint of constructing a simple prediction model.
- the descriptor associated with action A preferably comprises fr_Ar_OH or van der Waals surface area or polarizability descriptors, more preferably fr_Ar_OH or SMR_VSA9, in addition to fr_Ar_OH or SMR_VSA9. Further, it is more preferable to include at least one descriptor selected from the group consisting of SMR_VSA6, PEOE_VSA11, fr_ester, and fr_aryl_methyl, and particularly preferably to include fr_Ar_OH or SMR_VSA9, SMR_VSA6, PEOE_VSA11, and fr_aryl_methyl. Further, when the descriptor related to the action A contains SMR_VSA9, it is also preferable to further include fr_ester, fr_aryl_methyl, SMR_VSA6, and PEOE_VSA11.
- fr_Ar_OH is the number of hydroxy groups attached to the aromatic ring.
- SMR_VSA9 is the total surface area (unit: ⁇ 2 ) of carbon having a triple bond and aromatic carbon bonded to an oxygen atom and an aromatic ring. More specifically, SMR_VSA9 is one of the VSA-type descriptors created by LABUTE to predict the physicochemical properties of molecules such as free dissolution energy and boiling point (LABUTE, Paul. A widely applicable set of). descriptors. Journal of Molecular Graphics and Modeling, 2000, 18.4-5: 464-477).
- VSA type descriptor the respective atoms in the molecule and having any nature (numeric) P i, is defined as the sum of the surface area having a property P within a range of the following formula (S1): It is represented by.
- V i is the van der Waals surface area of each atom; a (van der Waals surface area VSA) , which is approximately the value calculated from the Van der Waals radius and standard bond length atoms.
- ⁇ (A) is a function that returns 1 when the conditional expression A is true and 0 when it is false.
- VSA type descriptor "P_VSAk” is the sum of V i ⁇ (A) for all atoms except hydrogen atoms.
- P i of the condition A is MR (see below)
- SMR_VSAk the VSA type descriptor called SMR_VSAk.
- SMR_VSAk mainly describes polarizability.
- the range boundary ⁇ ak ⁇ for SMR_VSAk is given by the following equation (S2): It is represented by.
- MR is an atomic contribution method (the following formula (S3)): which is the molar refractivity of a molecule. It is the coefficient P i of each atom in predicting by, those determined from the experimental data of 3412 molecules by Crippen et al.
- MR values are set for each of the 68 atomic types. Of these, only the three atomic types shown in the table below are in the range [3.80, 4.00] corresponding to SMR_VSA9.
- the aromatic carbon bonded to the pyrazole ring corresponds to C20
- the aromatic carbon adjacent to the hydroxy group corresponds to C23.
- SMR_VSA9 can be said to be the sum of the van der Waals surface areas of atoms belonging to the atomic type in the corresponding range [3.80, 4.00].
- SMR_VSA6 is the total surface area (unit: ⁇ 2 ) of the primary and secondary non-aromatic carbons bonded to the non-aromatic hetero atom and the nitrogen atom bonded to the aromatic ring. More specifically, SMR_VSA6, like SMR_VSA9, is one of the VSA type descriptors and is the sum of the van der Waals surface areas of atoms belonging to the atomic type in the range [2.75, 3.05] corresponding to SMR_VSA6. The atomic types in the range [2.75, 3.05] corresponding to SMR_VSA6 are only the four types shown in the table below.
- PEOE_VSA11 is the total surface area (unit: ⁇ 2 ) of an atom having a charge of 0.15 to 0.20 (unit is expressed in elementary charge). More particularly, the PEOE_VSAk containing PEOE_VSA11, as with SMR_VSAk, is one of the VSA type descriptor, defined by formula (S1) when the P i of the condition A was PEOE (described later). PEOE_VSAk primarily describes electrostatic interactions. The range boundary ⁇ ak ⁇ for PEOE_VSAk is given by the following equation (S4): It is represented by. PEOE is an atomic charge calculated by the empirical atomic charge determination method proposed by Gasteiger et al. In this estimation method by Gasteiger et al., The atomic charge is determined based on the electronegativity of the atom.
- the descriptor "fr_ester” is the number of ester groups.
- the descriptor "fr_aryl_methyl” is the number of benzylic carbons that can be hydroxylated.
- the benzylic carbon capable of undergoing hydroxyation refers to a carbon atom directly bonded to an aromatic ring among carbon atoms constituting a methyl group or an ethyl group or an ethylene group bonded to an aromatic ring.
- the benzylic carbon of the ethylene group is the number of benzylic carbons that can be hydroxylated. Not included in.
- both of the two aromatic atoms adjacent to the aromatic atom to which the benzylic carbon is bonded are other than hydrogen atoms. If it has a non-aromatic bond, the benzylic carbon is not included in the number of benzylic carbons that can be hydroxyated.
- step (1) involves DRAGON, alvaDesc, CODESSAPRO, ADAPT, ADMETPredictor, CORINASymphony, Pentacle, VolSurf +, ISIDAFragmentor, JOELib, Molconn-Z, PowerMV, PreADMET, PaDEL-Descriptor, cinfony, Chemopy.
- the computer software is preferably RDKit.
- Step (2) The prediction model expressed as a function of the descriptor related to the action A is not particularly limited as long as it is a model capable of predicting whether or not the target compound has the action A.
- the prediction model is preferably a prediction model created by machine learning, and more specifically, a prediction model created in the additional step (ii) described later.
- f (x) is 0 or more, it is more preferable that the model predicts that the target compound has action A, and formulas (N3) to (N4) and (M3) to (M5). In any case, if f (x) is 0 or more, it is more preferable that the model predicts that the target compound has action A, and in any of the formulas (N4) and (M4) to (M5), If f (x) is 0 or more, it is even more preferable that the model predicts that the target compound has action A, and in the formula (N4) or (M5), if f (x) is 0 or more. , It is particularly preferable that the model predicts that the target compound has action A.
- Equations (N), (N1) to (N4), (M), and (M1) to (M5) are each multiplied by ⁇ on the right side in order to determine whether f (x) is 0 or more. It is equivalent to the equation ( ⁇ is an arbitrary number other than 0).
- the prediction accuracy of the prediction model (the ratio of the number of times that the prediction and the actual result match to the number of trials) is preferably 75% or more, more preferably 80% or more, further preferably 85% or more, and further more than 90%. Preferably, 95% or more is particularly preferable, and 100% is most preferable.
- the method of predicting whether or not the target compound has action A is, in addition to steps (1) and (2), a step of extracting a descriptor related to action A from the structure of the learning compound. It is preferable to include (i).
- the learning compound is not particularly limited as long as it is a compound whose presence or absence of action A has been confirmed, but it is preferable to use a plurality of compounds having different basic skeletons, functional groups and the like.
- the method for confirming the presence or absence of action A is either method 1 or method 2 below.
- Method 1 Using a sheet in which gold is vapor-deposited on a PET substrate, an electrode chip having a working electrode portion of 9 mm 2 is produced (FIG. 1).
- FIG. 1 is a PET film
- "2" is an adhesive sheet
- "3" is a gold-deposited PET film
- "4" is a working electrode site.
- FIG. 1 Using a sheet in which gold is vapor-deposited on a PET substrate, an electrode chip having a working electrode portion of 9 mm 2 is produced (FIG. 1). Water containing 2% (w / v) sodium cholic acid and 0.15% (w / v) single-walled carbon nanotubes (SuperPureTubes, NanoIntegras, outer diameter 1.1-1.7 nm) at this working electrode site. 5 ⁇ L of the dispersion is added dropwise and dried. After drying, 5 ⁇ L of FADGDH (having the amino acid sequence of SEQ ID NO: 2; 20 U / ⁇ L) dissolved in ultrapure water is added dropwise to the working electrode site and dried.
- FADGDH having the amino acid sequence of SEQ ID NO: 2; 20 U / ⁇ L
- the learning compound is preferably a plurality of compounds selected from the group consisting of the following.
- the lower limit of the number of learning compounds is not particularly limited, but from the viewpoint of improving prediction accuracy, 5 or more is preferable, 10 or more is more preferable, 15 or more is further preferable, and 20 or more is particularly preferable.
- the upper limit of the learning compound is not particularly limited, but from the viewpoint of data collectability, 50 or less is preferable, 40 or less is more preferable, and 30 or less is further preferable.
- the learning compound preferably contains both a compound having action A and a compound having no action A.
- the ratio of the number of compounds having action A to the number of compounds not having action A is preferably 1: 5 to 5: 1, more preferably 1: 4 to 4: 1.
- the adjustment method include oversampling for a small number, undersampling for a large number, and a combination thereof.
- Examples of the oversampling method include random oversampling, SMOTE, SMOTE-NC, and ADASYN.
- Examples of the undersampling method include random undersampling, ONESS, NearMiss, NCL and the like.
- step (i) may be a method of generating a group of descriptor values from the structure of the learning compound and extracting the descriptors associated with action A from that group using sparse modeling. preferable.
- the group of descriptors is preferably selected from 0 to 2D descriptors and preferably does not include descriptors having the same value for all learning compounds.
- Examples of the normalization method include standardization conversion, Yeo-Johnson conversion, and the like.
- Examples of sparse modeling include greedy algorithm, convex relaxation method, and stochastic reasoning.
- Examples of the greedy algorithm include orthogonal matching tracking (OMP), matching tracking (MP), weak matching tracking (Weak MP), threshold algorithm, and the like.
- Examples of the convex relaxation method include a basis tracking method, an iterative reweighting least squares method (IRLS), and a homotopy method.
- Probabilistic reasoning includes approximate message propagation method (AMP).
- the sparse modeling is preferably orthogonal matching tracking.
- step (ii) the method of predicting whether a target compound has action A creates a prediction model represented as a function of the descriptor associated with action A, in addition to steps (1) and (2). It is preferable to include step (ii).
- step (ii) preferably creates a prediction model by machine learning.
- Machine learning includes, for example, support vector machines, related vector machines, logistic regression, variant Bayesian logistic regression, Fisher's linear discriminant analysis, Bayesian networks, neural networks, AdaBoost, random forests, and the like. These may be used alone or in combination of two or more. When the number of data is small, it is preferable to adopt the method of adopting a linear model from the viewpoint of prevention of overfitting and high interpretability.
- machine learning is preferably a linear support vector machine or variational Bayesian logistic regression.
- machine learning includes LibSVM, TensorFlowTM, Chainer TM, Jubatus TM, Caffe, Theano, Torch, neonTM, MXNet, The Microsoft Cognitive Toolkit, R (C), MATLAB TM, Using computer software such as Mathematica (trademark), SAS (trademark), RapidMiner (trademark), KNIME (trademark), WeKa, shogun-toolbox / shogun, Orange, Apache MahoutTM, scikit-learn, mlpy, XGBoost, Deeplearning4j, etc. It is preferable to carry out.
- the method of predicting whether or not the target compound has action A preferably includes steps (1), (2), (i), and (ii).
- the means for performing the method preferably includes an input device, a main storage device, an auxiliary storage device, an arithmetic device, an output device, and a control device.
- the input device is not particularly limited as long as the structure of the learning compound and / or the target compound can be input, and examples thereof include a keyboard, a mouse, and a touch panel.
- the main storage device is not particularly limited as long as it can capture and store data input by the input device, data stored in the auxiliary storage device, a program, and the like, and examples thereof include a RAM and a ROM.
- the auxiliary storage device is not particularly limited as long as it can store data, programs, and the like, and examples thereof include a hard disk drive, an optical disk, and an SSD.
- the control device is not particularly limited as long as it can control the arithmetic unit and the like according to the program stored in the main storage device.
- the output device is not particularly limited as long as it can display the result calculated by the arithmetic unit, and examples thereof include a display.
- a system including the above means incorporates the structural data input by the input device and a program for creating a descriptor, a prediction model, a prediction result, etc. related to the action A from the structural data into the main memory.
- the data and the program can be stored, taken into the arithmetic device, calculated based on the arithmetic instruction sent from the control device, and the arithmetic result can be returned to the main storage device and output by the output device.
- the program for executing the method for predicting whether or not the target compound has action A and the recording medium The method for predicting whether or not the target compound has action A are as described in 1 above.
- the program is not particularly limited as long as the above method can be executed.
- the programs are CD (Compact Disc) -ROM, CD-R, CD-RW, DVD (Digital Versatile Disc), DVD-RAM, BD (Blu-ray TM Disc), MO (Magneto Optical disc). ), SSD, magnetic tape, various memory cards (USB flash memory, SD memory card, etc.), etc., stored in a computer-readable storage medium, or downloaded from a cloud computer or the like. It is also possible to store the program in the auxiliary storage device of a computer connected via the network, transfer the program to another computer via the network, and the like.
- the nanocarbon-based enzyme-to-electrode electron transfer enhancer preferably comprises compound X.
- the values of the descriptors fr_Ar_OH, SMR_VSA6, PEOE_VSA11, fr_ester, and fr_aryl_methyl of compound X are represented by any of the formulas (N), (N1) to (N4), (M), and (M1) to (M5).
- f (x) ⁇ 0, and the following equation: -1.00 + 2.00 x fr_Ar_OH + 0.37 x SMR_VSA6-0.20 x PEOE_VSA11 + 1.43 x fr_aryl_methyl ⁇ 0 It is particularly preferable that the condition is satisfied. Further, among the equations (N1) to (N4) and (M1) to (M5), in two or more equations (for example, equations (N1) and (N4)), f (x) ⁇ 0 is satisfied. It is also preferable to have.
- the compound X preferably has the same structure as the target compound described in 1 above, and is preferably a compound that does not have a function as a mediator by itself.
- the nanocarbon, enzyme, and electrode are as described in 1 above.
- the method of enhancing enzyme-electrode electron transfer by nanocarbon preferably comprises adhering or adhering Compound X to or in close proximity to nanocarbon.
- the values of the descriptors fr_Ar_OH, SMR_VSA6, PEOE_VSA11, fr_ester, and fr_aryl_methyl of compound X are represented by any of the formulas (N), (N1) to (N4), (M), and (M1) to (M5).
- f (x) ⁇ 0, and the following equation: -1.00 + 2.00 x fr_Ar_OH + 0.37 x SMR_VSA6-0.20 x PEOE_VSA11 + 1.43 x fr_aryl_methyl ⁇ 0 It is particularly preferable that the condition is satisfied. Further, among the equations (N1) to (N4) and (M1) to (M5), in two or more equations (for example, equations (N1) and (N4)), f (x) ⁇ 0 is satisfied. It is also preferable to have.
- the compound X preferably has the same structure as the target compound described in 1 above, and is preferably a compound that does not have a function as a mediator by itself.
- adhering or bringing Compound X onto or in close proximity to nanocarbon preferably comprises loading the nanocarbon, compound X, and enzyme onto the substrate of the electrode.
- the nanocarbon, compound X, and enzyme can be loaded onto the substrate by any means. For example, a solution in which each of these substances is dispersed or dissolved is prepared, and they are sequentially formed at a predetermined portion on a substrate (when the substrate is a metal thin film formed on an insulating substrate, a metal thin film is formed). It can be loaded by repeating the operation of applying (for example, dropping) to the place where it is dried and drying it.
- the dispersion medium or solvent is not particularly limited, and examples thereof include water, an alcohol solvent (for example, ethanol), a ketone solvent (for example, acetone), and a combination thereof.
- the loading order is arbitrary, but it is preferable to load in the order of nanocarbon ⁇ enzyme ⁇ compound X or nanocarbon ⁇ compound X ⁇ enzyme.
- the load capacity of compound X is not particularly limited.
- the load capacity of the compound X is, for example, 0.001 part by mass or more, preferably 0.01 part by mass or more, and more preferably 0.1 part by mass or more with respect to 100 parts by mass of the load capacity of nanocarbon.
- the load capacity of the compound X is, for example, 100,000 parts by mass or less, preferably 10,000 parts by mass or less, and more preferably 1000 parts by mass or less with respect to 100 parts by mass of the load capacity of nanocarbon.
- the lower limit and the upper limit can be arbitrarily combined.
- the load of compound X is, for example, 0.001 part by mass or more, preferably 0.01 part by mass or more, and more preferably 0.1 part by mass or more with respect to 100 parts by mass of the enzyme load.
- the loading capacity of compound X is, for example, 1,000,000 parts by mass or less, preferably 100,000 parts by mass or less, and more preferably 10,000 parts by mass or less with respect to 100 parts by mass of the enzyme loading capacity.
- the lower limit and the upper limit can be arbitrarily combined.
- the dispersant may be further loaded on the substrate.
- the dispersant is not particularly limited as long as it is a substance capable of suppressing the aggregation of nanocarbons on the substrate and dispersing them.
- examples of the dispersant include sodium cholic acid, sodium deoxycholate, sodium dodecyl sulfate, sodium dodecylbenzenesulfonate, cetyltrimethylammonium bromide, octylphenolethoxylate and the like.
- preferred dispersants are sodium cholic acid, sodium deoxycholate.
- the nanocarbon, compound X, and enzyme may be immobilized on the substrate. Immobilization can be carried out by appropriately selecting a known method. For example, a liquid in which a substance suitable for immobilization such as a tetrafluoroethylene / perfluoro [2- (fluorosulfonylethoxy) polyvinyl ether] copolymer (eg, Nafion TM) and carboxylmethyl cellulose is dissolved is placed on a substrate. Each of the above substances can be immobilized by dropping the substance on the loaded portion and drying the substance. In one embodiment, it is preferable that nanocarbon, compound X, and an enzyme are loaded on a substrate and then treated with a polymer substance such as carboxylmethyl cellulose so as to cover these substances.
- a substance suitable for immobilization such as a tetrafluoroethylene / perfluoro [2- (fluorosulfonylethoxy) polyvinyl ether] copolymer (eg, Nafion
- the dispersant is preferably blended with a dispersion liquid in which nanocarbon is dispersed.
- the mixing ratio of the dispersant is arbitrary, but for example, it is preferable to add 0.2 to 2% (w / v).
- the blending ratio of nanocarbon is also arbitrary, but for example, it is preferable to blend 0.05 to 0.5% (w / v).
- adhering or bringing compound X to or close to nanocarbon preferably involves immersing an electrode with nanocarbon and enzyme loaded on a substrate in a solvent containing compound X.
- the solvent include a buffer solution, and examples thereof include an acetate buffer solution, a citrate buffer solution, a phosphate buffer solution, and a borate buffer solution.
- the concentration of compound X in the solvent is not particularly limited. The lower limit of the concentration is, for example, 0.000001% (w / v), preferably 0.000005% (w / v), more preferably 0.00001% (w / v), and more preferably 0.00005%.
- the upper limit of the concentration is, for example, 2% (w / v), preferably 1.5% (w / v), and more preferably 1% (w / v).
- the lower and upper limits of the concentration can be arbitrarily combined.
- nanocarbon, enzyme, and electrode are as described in 1 above.
- FIG. 1 An electrode chip having a working electrode portion of 9 mm 2 was produced using a sheet in which gold was vapor-deposited on a PET substrate (FIG. 1).
- FIG. 1 is a PET film
- “2” is an adhesive sheet
- "3” is a gold-deposited PET film
- "4" is a working electrode site.
- the electrode tip prepared above was set as the working electrode of the electrochemical analyzer (ALS / CHI 660B, manufactured by ABS Co., Ltd.), the silver / silver chloride electrode was set as the reference electrode, and the platinum wire was set as the counter electrode.
- the three electrodes were immersed in 40 mM sodium phosphate buffer (pH 7.4). Measurement by cyclic voltammetry was carried out when glucose was not added to this buffer solution or when glucose was added so as to be 48 mM.
- an electrode chip having a working electrode portion of 9 mm 2 was prepared using a sheet in which gold was vapor-deposited on a PET substrate (FIG. 1).
- 5 ⁇ L of the dispersion was added dropwise and dried. After drying, 5 ⁇ L of FADGDH (having the amino acid sequence of SEQ ID NO: 2; 20 U / ⁇ L) dissolved in ultrapure water was added dropwise to the working electrode site and dried.
- 17 compounds including the compound of group 1 as the compound having no action A and 17 compounds consisting of the compound of group 2 as the compound having action A were used for the learning data.
- Creating a prediction model for the presence or absence of action A consists of three steps: (1) creating descriptors, (2) extracting descriptors related to action A, and (3) creating prediction formulas using training data. Was done by.
- descriptors Using Rdkit (Open-source cheminformatics; http://www.rdkit.org), 200 types of descriptor values are used for each compound of the training data based on the chemical structural formula. Was calculated and converted into a 200-dimensional vector.
- the 200 types of descriptors include descriptors representing the number of functional groups, topology, polarity, and the like.
- the 3D descriptor is excluded.
- descriptors with the same value for all compounds in the training data are excluded because they have no meaning.
- Equation (2) Standardization transformation of the descriptor matrix X for each column, that is, for each descriptor for the purpose of stabilizing the calculation.
- ⁇ j represents the average for each column
- ⁇ j represents the standard deviation.
- Yeo-Johnson transformations YEO, In-Kwon; JOHNSON, Richard A.
- JOHNSON Richard A.
- a new family of power transformations to improve normality or symmetry. Biometrika that can bring the data closer to the standard normal distribution more strongly.
- the descriptor fr_Ar_OH is selected, when S is 2, the descriptor SMR_VSA6 is selected, and when S is 3, the descriptor PEOE_VSA11 is selected.
- S was 4 another descriptor called fr_aryl_methyl was chosen.
- the descriptor SMR_VSA9 is selected, when S is 2, the descriptor fr_ester is selected, and when S is 3, the descriptor fr_aryl_methyl is further selected.
- the descriptor SMR_VSA6 is selected, and when S is 5, the descriptor PEOE_VSA11 is selected.
- x i and y i represent the descriptor of each compound and the presence or absence of action A as in the formula (1).
- Eq. (5) for determining the presence or absence of action A was obtained.
- C in Eq. (4) is a hyperparameter called a regularization coefficient.
- C 1 because the test accuracy did not change and was stable even when C was changed. Calculations of these linear SVCs were performed using Scikit-learn.
- the Yeo-Johnson conversion and the standardization conversion of the descriptor are not performed.
- the prediction accuracy of the presence or absence of action A of the learning compound is 91.2% in the case of the prediction formula (N1), 94.1% in the case of the prediction formula (N2), and 97.1% in the case of the prediction formula (N3).
- the formula (N4) is 100%, the prediction formula (M1) is 91.2%, the prediction formula (M2) is 94.1%, and the prediction formula (M3) is 97.1%. In the case of M4), it was 97.1%, and in the case of the prediction formula (M5), it was 100%.
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Electrochemistry (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Inorganic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Sustainable Development (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
ナノカーボンによる酵素-電極間電子伝達を増強する作用の有無を予測する手段の提供を課題とする。当該課題は、対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び前記作用Aに関連する記述子の値を、作用Aに関連する記述子の関数として表される予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップを含んでおり、前記作用Aに関連する記述子が、fr_Ar_OH又はSMR_VSA9を含む、方法により解決することができる。
Description
酵素-電極間電子伝達増強作用の有無の予測方法に関する技術が開示される。
ナノカーボンは電気の伝導率が高いことから他の物質との電子伝達を行う導電材料としての応用が進んでいる。例えばナノカーボンをカーボン、樹脂及び有機溶剤からなるインクに混合し基板上に印刷してバイオセンサ用の電極として用いることが提案されている(特許文献1)。また、ナノカーボンの一種であるカーボンナノチューブは過酸化物を測定するセンサに用いられたり(特許文献2)、酵素とともにフィルム状に成形し、センサや燃料電池の電極として用いられたりしている(特許文献3)。さらに単層カーボンナノチューブを用いることで酵素から直接電子移動で電極への電子伝達を行うことも報告されている(非特許文献1)。これは従来メディエーターが必須であった、フラビンアデニンジヌクレオチドを補酵素とするグルコースデヒドロゲナーゼ(FADGDH)をメディエーターなしでグルコースセンサーに用いることを可能にする。
ACS Catal. 2017, 7, 725_734
ナノカーボンによる酵素-電極間電子伝達を増強する作用(以下、「作用A」と称する)の有無を予測する手段の提供が1つの課題である。
本発明者らは課題を解決すべく鋭意研究を重ねた結果、対象化合物が作用Aを有するか否かは、対象化合物の構造から特定の記述子の値を生成し、その値を前記記述子の関数として表される予測モデルに適用することにより、予測できることを見出した。斯かる知見に更なる研究と改良を重ね本発明を完成するに至った。
本発明は、以下の態様を包含する:
項1.
対象化合物が、ナノカーボンによる酵素-電極間電子伝達を増強する作用Aを有するか否かを予測する方法であって、
対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
前記作用Aに関連する記述子の値を、作用Aに関連する記述子の関数として表される予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含んでおり、
前記作用Aに関連する記述子が、fr_Ar_OH又はSMR_VSA9を含む、方法。
項2.
前記作用Aに関連する記述子が、さらにSMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylからなる群から選択される少なくとも一種の記述子を含む、項1に記載の方法。
項3.
前記作用Aに関連する記述子が、さらにSMR_VSA6、PEOE_VSA11、及びfr_aryl_methylを含む、項1に記載の方法。
項4.
前記予測モデルが、
f(x)=-1.00+a×fr_Ar_OH+b×SMR_VSA6+c×PEOE_VSA11+d×fr_aryl_methyl、又はf(x)=-1.00+e×SMR_VSA9+f×fr_ester+g×fr_aryl_methyl+h×SMR_VSA6+i×PEOE_VSA11
(式中、a~iは、機械学習により決定される数である。)
において、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルである、項1~3のいずれかに記載の方法。
項5.
対象化合物が、ナノカーボンによる酵素-電極間電子伝達を増強する作用Aを有するか否かを予測する方法であって、
学習用化合物の構造から作用Aに関連する記述子を抽出するステップ、
前記作用Aに関連する記述子の関数として表される予測モデルを作成するステップ、
対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
前記作用Aに関連する記述子の値を前記予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含む、方法。
項6.
項1~5のいずれかに記載の方法を実行するための手段を備えるシステム。
項7.
項1~5のいずれかに記載の方法を実行するためのプログラム。
項8.
項7に記載のプログラムが記録された記録媒体。
項9.
ナノカーボンによる酵素-電極間電子伝達を増強する方法であって、
化合物Xをナノカーボンに付着又は近接させることを含み、
化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、及びfr_aryl_methylの値が、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たす、方法。
項10.
化合物Xが、芳香環骨格を有する化合物である、項9に記載の方法。
項11.
化合物Xをナノカーボンに付着又は近接させることが、電極の基板上にナノカーボン、化合物X、及び酵素を積載することを含む、項9又は10に記載の方法。
項12.
化合物Xをナノカーボンに付着又は近接させることが、基板上にナノカーボン及び酵素を積載した電極を、化合物Xを含む溶媒に浸漬することを含む、項9又は10に記載の方法。
項13.
溶媒中の化合物Xの濃度が、0.000001~2%(w/v)である、項12に記載の方法。
項14.
ナノカーボンによる酵素-電極間電子伝達を増強するための、化合物Xの使用であって、
化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、及びfr_aryl_methylの値が、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たす、使用。
項15.
化合物Xが、芳香環骨格を有する化合物である、項14に記載の使用。
項1.
対象化合物が、ナノカーボンによる酵素-電極間電子伝達を増強する作用Aを有するか否かを予測する方法であって、
対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
前記作用Aに関連する記述子の値を、作用Aに関連する記述子の関数として表される予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含んでおり、
前記作用Aに関連する記述子が、fr_Ar_OH又はSMR_VSA9を含む、方法。
項2.
前記作用Aに関連する記述子が、さらにSMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylからなる群から選択される少なくとも一種の記述子を含む、項1に記載の方法。
項3.
前記作用Aに関連する記述子が、さらにSMR_VSA6、PEOE_VSA11、及びfr_aryl_methylを含む、項1に記載の方法。
項4.
前記予測モデルが、
f(x)=-1.00+a×fr_Ar_OH+b×SMR_VSA6+c×PEOE_VSA11+d×fr_aryl_methyl、又はf(x)=-1.00+e×SMR_VSA9+f×fr_ester+g×fr_aryl_methyl+h×SMR_VSA6+i×PEOE_VSA11
(式中、a~iは、機械学習により決定される数である。)
において、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルである、項1~3のいずれかに記載の方法。
項5.
対象化合物が、ナノカーボンによる酵素-電極間電子伝達を増強する作用Aを有するか否かを予測する方法であって、
学習用化合物の構造から作用Aに関連する記述子を抽出するステップ、
前記作用Aに関連する記述子の関数として表される予測モデルを作成するステップ、
対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
前記作用Aに関連する記述子の値を前記予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含む、方法。
項6.
項1~5のいずれかに記載の方法を実行するための手段を備えるシステム。
項7.
項1~5のいずれかに記載の方法を実行するためのプログラム。
項8.
項7に記載のプログラムが記録された記録媒体。
項9.
ナノカーボンによる酵素-電極間電子伝達を増強する方法であって、
化合物Xをナノカーボンに付着又は近接させることを含み、
化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、及びfr_aryl_methylの値が、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たす、方法。
項10.
化合物Xが、芳香環骨格を有する化合物である、項9に記載の方法。
項11.
化合物Xをナノカーボンに付着又は近接させることが、電極の基板上にナノカーボン、化合物X、及び酵素を積載することを含む、項9又は10に記載の方法。
項12.
化合物Xをナノカーボンに付着又は近接させることが、基板上にナノカーボン及び酵素を積載した電極を、化合物Xを含む溶媒に浸漬することを含む、項9又は10に記載の方法。
項13.
溶媒中の化合物Xの濃度が、0.000001~2%(w/v)である、項12に記載の方法。
項14.
ナノカーボンによる酵素-電極間電子伝達を増強するための、化合物Xの使用であって、
化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、及びfr_aryl_methylの値が、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たす、使用。
項15.
化合物Xが、芳香環骨格を有する化合物である、項14に記載の使用。
本発明によれば、作用Aの有無の予測方法に関する技術が提供される。
1.対象化合物が作用Aを有するか否かを予測する方法
対象化合物が作用Aを有するか否かを予測する方法は、一実施形態において、下記ステップ:
(1)対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
(2)前記作用Aに関連する記述子の値を、作用Aに関連する記述子の関数として表される予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含むことが好ましい。
対象化合物が作用Aを有するか否かを予測する方法は、一実施形態において、下記ステップ:
(1)対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
(2)前記作用Aに関連する記述子の値を、作用Aに関連する記述子の関数として表される予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含むことが好ましい。
1-1.ステップ(1)
対象化合物としては、構造が特定可能なものである限り特に制限はなく、分子量が1000以下の低分子有機化合物、分子量が1000を超える高分子有機化合物(例えば、合成樹脂、タンパク質、多糖)などが挙げられる。対象化合物は、低分子有機化合物であることが好ましい。また、一実施形態において、対象化合物は単独でメディエーターとしての機能をもたない化合物であることが、予測精度の観点から好ましい。
対象化合物としては、構造が特定可能なものである限り特に制限はなく、分子量が1000以下の低分子有機化合物、分子量が1000を超える高分子有機化合物(例えば、合成樹脂、タンパク質、多糖)などが挙げられる。対象化合物は、低分子有機化合物であることが好ましい。また、一実施形態において、対象化合物は単独でメディエーターとしての機能をもたない化合物であることが、予測精度の観点から好ましい。
一実施形態において、対象化合物は、芳香環骨格を有する化合物であることが好ましい。芳香環骨格の環構成原子の数は、例えば5~18、好ましくは5~16、さらに好ましくは5~14である。対象化合物中の芳香環の数は、例えば4以下、好ましくは3以下、さらに好ましくは1又は2である。芳香環骨格には、1つのベンゼン環からなる骨格、2以上(例えば、2~4)のベンゼン環からなる骨格(ナフタレン骨格、アントラセン骨格など)、ベンゼン環と他の芳香環(含窒素芳香環、含酸素芳香環、含硫黄芳香環など)との縮合環からなる骨格(フェナントロリン骨格、ベンゾフラン骨格、ベンゾイミダゾール骨格、カルバゾール骨格など)、炭素と他の元素(窒素、酸素、硫黄など)により構成される芳香環からなる骨格(トリアジン骨格、トリアゾール骨格、ピリジン骨格など)を有するものが包含される。一実施形態において、対象化合物は、1つのベンゼン環からなる骨格を有する化合物が好ましい。また、一実施形態において、フェノチアジン骨格を有さない化合物が好ましい。
一実施形態において、芳香環骨格を有する化合物は、電子供与性の置換基を有することが好ましい。電子供与性の置換基とはヒドロキシ基、アミノ基、及びメチル基等のことである。好ましい電子供与性の置換基は、ヒドロキシ基である。
作用Aは、ナノカーボンによる酵素-電極間電子伝達を増強する作用である限り特に制限されない。ナノカーボンは、電子伝達機能を有する、ナノカーボンとして認識される物質であれば如何なる物質であってもよい。そのような物質は、例えば、カーボンナノチューブ、カーボンナノホーン、カーボンナノツイスト、コクーン、カーボンナノコイル、グラフェン、フラーレンなどを含む、主に炭素により構成されている炭素材料を意味する。カーボンナノチューブは、単層カーボンナノチューブであっても、二層カーボンナノチューブであっても、多層カーボンナノチューブであってもよい。一実施形態において、ナノカーボンは、カーボンナノチューブであることが好ましく、単層カーボンナノチューブであることが好ましい。
酵素は、触媒反応に伴って電子を遊離するものが好ましい。そのような酵素としては、例えば、酸化還元酵素を挙げることができる。酸化還元酵素としては、例えば、グルコースデヒドロゲナーゼ、グルコースオキシダーゼ、乳酸オキシダーゼ、コレステロールオキシダーゼ、アルコールオキシダーゼ、ザルコシンオキシダーゼ、フルクトシルアミンオキシダーゼ、ピルビン酸オキシダーゼ、乳酸デヒドロゲナーゼ、アルコールデヒドロゲナーゼ、グリセロールオキシダーゼ、グリセロール-3-リン酸オキシダーゼ、ウリカーゼ、コリンオキシダーゼ、キサンチンオキシダーゼ、及びヒドロキシ酪酸デヒドロゲナーゼ等を挙げることができる。
一実施形態において、酵素は、グルコースデヒドロゲナーゼであることが好ましく、フラビン結合型グルコースデヒドロゲナーゼであることが好ましく、フラビンアデニンジヌクレオチド(FAD)を補酵素とするグルコースデヒドロゲナーゼ(FADGDH)が好ましい。FADGDHは、ポリペプチドで形成される3次元構造のくぼみにFADを保持するため、そこで生成された電子を電極に伝達するためには、従来、メディエーターと呼ばれる物質を要した。これに対し、ナノカーボン(好ましくはカーボンナノチューブ、より好ましくは単層カーボンナノチューブ)を用いることにより、メディエーターを利用しなくても、電子を電極に伝達することが可能となる。
FADGDHの種類は制限されず、任意のものを使用することができる。FADGDHの具体例としては、次の生物のいずれかに由来するものを挙げることができる:アスペルギルス・テレウス、アスペルギルス・オリゼ、アルペルギルス・ニガー、アスペルギルス・フォエチダス、アルペルギルス・アウレウス、アスペルギルス・バージカラー、アスペルギルス・カワチ、アルペルギルス・アワモリ、アグロバクテリウム・ツメファシエンス、サイトファーガ・マリノフラバ、アガリカス・ビスポラス、マクロレピオタ・ラコデス、ブルクホルデリア・セパシア、ムコール・サブチリシマス、ムコール・ギリエルモンディ、ムコール・プライニ、ムコール・ジャバニカス、ムコール・シルシネロイデス、ムコール・シルシネロイデス・エフ・シルシネロイデス、ムコール・ヒエマリス、ムコール・ヒエマリス・エフ・シルバチカス、ムコール・ダイモルフォスポラス、アブシジア・シリンドロスポラ、アブシジア・ヒアロスポラ、アクチノムコール・エレガンス、シルシネラ・シンプレックス、シルシネラ・アンガレンシス、シルシネラ・シネンシス、シルシネラ・ラクリミスポラ、シルシネラ・マイナー、シルシネラ・ムコロイデス、シルシネラ・リジダ、シルシネラ・アンベラータ、シルシネラ・ムスカエ、メタリジウム・エスピー及びコレトトリカム・エスピー。
一実施形態において、好ましいFADGDHは、アスペルギルス・オリゼ由来のFADGDH、ムコール・ヒエマリス由来のFADGDH、ムコール・サブチリシマス由来のFADGDH、シルシネラ・シンプレックス由来のFADGDH、メタリジウム・エスピー由来のFADGDH又はコレトトリカム・エスピー由来のFADGDHであり、好ましくは配列番号1~6のアミノ酸配列と80%以上の同一性を有し、より好ましくは配列番号1~6のアミノ酸配列と90%以上の同一性を有し、さらに好ましくは配列番号1~6のアミノ酸配列と95%以上の同一性を有し、グルコース脱水素活性を有するものを挙げることができる。アミノ酸配列の同一性は、市販の又は電気通信回線(インターネット)を通じて利用可能な解析ツールを用いて算出することができ、例えば、全米バイオテクノロジー情報センター(NCBI)の相同性アルゴリズムBLAST(Basic local alignment search tool)http://www.ncbi.nlm.nih.gov/BLAST/ においてデフォルト(初期設定)のパラメータを用いて、算出することができる。なお、配列番号1のアミノ酸配列は、アスペルギルス・オリゼ由来のFADGDHのものであり、配列番号2のアミノ酸配列は、ムコール・ヒエマリス由来のFADGDHのものであり、配列番号3のアミノ酸配列は、ムコール・サブチリシマス由来のFADGDHのものであり、配列番号4のアミノ酸配列は、シルシネラ・シンプレックス由来のFADGDHのものであり、配列番号5のアミノ酸配列は、メタリジウム・エスピー由来のFADGDHのものであり、配列番号6のアミノ酸配列は、コレトトリカム・エスピー由来のFADGDHのものである。
電極としては、特に制限はなく、例えば、絶縁性基板上に金属膜(例えば、金属薄膜)又は炭素膜(例えば、炭素薄膜)が積層されたものを使用することができる。絶縁性基板は、例えば、ガラス基板又はプラスチック基板(例えば、PET基板)を使用することができる。金属膜を形成する金属の種類は、電極に使用されるものであれば特に制限されず、例えば、金、白金、及びチタン等を挙げることができる。また、炭素膜としては、例えば、カーボンペーストによる薄膜を使用することができる。
作用Aに関連する記述子は、作用Aの有無を予測することが可能な記述子である限り、その種類及び数は特に制限されない。一実施形態において、作用Aに関連する記述子は、スパースモデリングにより抽出された記述子であることが好ましく、より具体的には、後述の追加のステップ(i)で抽出された記述子であることが好ましい。
一実施形態において、作用Aに関連する記述子は、0~4次元記述子から選択された少なくとも一種であることが好ましい。0次元記述子としては、例えば、C, H, O, N, ハロゲン等の原子の数、結合数、分子量等が挙げられる。1次元記述子としては、例えば、アルキル基, アリール基, アリールアルキル基, ヒドロキシ基, エステル基, アミノ基等の官能基の数、芳香環の数等が挙げられる。2次元記述子としては、例えば、SMR_VSA1~10, PEOE_VSA1~14, SlogP_VSA1~12, Estate_VSA1~11等の構造式で特徴付けられるもの等が挙げられる。3次元記述子としては、例えば、3D-MoRSE, WHIM, GETAWAY等の幾何学的に特徴付けられるもの等が挙げられる。4次元記述子としては、例えば、GRID, CoMFA, Volsurf等によって算出され、相互作用エネルギーで特徴付けられるもの等が挙げられる。
一実施形態において、作用Aに関連する記述子は、0~2次元記述子から選択された少なくとも一種であることが好ましい。
作用Aに関連する記述子の数は、特に制限されないが、予測精度を高める点から、2以上が好ましく、3以上がより好ましく、4以上がさらに好ましい。また、作用Aに関連する記述子の数は、単純な予測モデルを構築する点から、10以下が好ましく、8以下がより好ましく、6以下がさらに好ましい。
一実施形態において、作用Aに関連する記述子は、fr_Ar_OH又はファンデルワールス表面積に関する記述子又は分極率に関する記述子を含むことが好ましく、fr_Ar_OH又はSMR_VSA9を含むことがより好ましく、fr_Ar_OH又はSMR_VSA9に加えて、さらにSMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylからなる群から選択される少なくとも一種の記述子を含むことがさらに好ましく、fr_Ar_OH又はSMR_VSA9、SMR_VSA6、PEOE_VSA11、及びfr_aryl_methylを含むことが特に好ましい。また、作用Aに関連する記述子がSMR_VSA9を含む場合、さらにfr_ester、fr_aryl_methyl、SMR_VSA6、及びPEOE_VSA11を含むことも好ましい。
記述子「fr_Ar_OH」は、芳香環に結合するヒドロキシ基の数である。
記述子「SMR_VSA9」は、三重結合をもつ炭素、並びに、酸素原子及び芳香環に結合する芳香族炭素の総表面積(単位:Å2)である。より詳細には、SMR_VSA9は、溶解自由エネルギー、沸点などの分子の物理化学的性質を予測するためにLABUTEによって作られたVSA型記述子の一つである(LABUTE, Paul. A widely applicable set of descriptors. Journal of Molecular Graphics and Modelling, 2000, 18.4-5: 464-477)。
VSA型記述子は、分子中の各原子が任意の性質(数値)Piをもつとすると、ある範囲内の性質Pをもつ表面積の合計として定義され、下記式(S1):
で表される。ここで、Viは各原子のファンデルワールス表面積(van der Waals surface area; VSA)であり、原子のファンデルワールス半径と標準的な結合距離から近似的に計算された値である。δ(A)は条件式Aが真のとき1、偽のとき0を返す関数である。
VSA型記述子「P_VSAk」は、水素原子を除く全ての原子についてのViδ(A)の総和である。条件式AのPiがMR(後述)のとき、このVSA型記述子はSMR_VSAkと呼ばれる。SMR_VSAkは、主に分極率を記述する。SMR_VSAkに対する範囲の境界{ak}は、下記式(S2):
で表される。MRとは、分子のモル屈折率(molar refractivity)を原子寄与法(下記式(S3)):
により予測する際の原子毎の係数Piであり、Crippenらによって3412分子の実験データから決定されたものである。MRの値は68個の原子タイプ毎に定められている。そのうち、SMR_VSA9に対応する範囲[3.80, 4.00]にある原子タイプは、下表に示す3タイプのみである。
例えば、アンピロンの場合、ピラゾール環に結合する芳香族炭素がC20に該当し、フェノールの場合、ヒドロキシ基に隣接する芳香族炭素がC23に該当する。
すなわち、SMR_VSA9は、それに対応する範囲[3.80, 4.00]にある原子タイプに属する原子のファンデルワールス表面積の総和ということができる。
記述子「SMR_VSA6」は、非芳香族へテロ原子と結合する第一及び二級非芳香族炭素、並びに、芳香環に結合する窒素原子の総表面積(単位:Å2)である。より詳細には、SMR_VSA6は、SMR_VSA9と同様、VSA型記述子の一つであり、SMR_VSA6に対応する範囲[2.75, 3.05]にある原子タイプに属する原子のファンデルワールス表面積の総和である。なお、SMR_VSA6に対応する範囲[2.75, 3.05]にある原子タイプは、下表に示す4タイプのみである。
記述子「PEOE_VSA11」は、0.15~0.20の電荷(単位は電荷素量で表す)を持つ原子の総表面積(単位:Å2)である。より詳細には、PEOE_VSA11を含むPEOE_VSAkは、SMR_VSAkと同様、VSA型記述子の一つであり、条件式AのPiをPEOE(後述)としたときの式(S1)により定義される。PEOE_VSAkは、主に静電相互作用を記述する。PEOE_VSAkに対する範囲の境界{ak}は、下記式(S4):
で表される。PEOEとは、Gasteigerらによって提案された経験的原子電荷決定法により算出された原子電荷である。このGasteigerらによる推算法では原子の電気陰性度を基に原子電荷が決定される。
記述子「fr_ester」は、エステル基の数である。
記述子「fr_aryl_methyl」は、ヒドロキシ化を受けうるベンジル位炭素の数である。ヒドロキシ化を受けうるベンジル位炭素とは、芳香環に結合するメチル基またはエチル基またはエチレン基を構成する炭素原子のうち芳香環に直接結合している炭素原子のことを指す。ただし、エチレン基の一端に芳香環が結合し他端に非芳香族性の酸素原子または窒素原子が結合している場合、エチレン基のベンジル位炭素は、ヒドロキシ化を受けうるベンジル位炭素の数には含めない。また、芳香環に結合する基がメチル基、エチル基、エチレン基の全ての場合において、ベンジル位炭素が結合する芳香族性原子に隣接する2つの芳香族性原子のどちらもが水素原子以外と非芳香族性結合をもつなら、当該ベンジル位炭素は、ヒドロキシ化を受けうるベンジル位炭素の数には含めない。
一実施形態において、ステップ(1)は、DRAGON、alvaDesc、CODESSA PRO、ADAPT、ADMET Predictor、CORINA Symphony、Pentacle、VolSurf+、ISIDA Fragmentor、JOELib、Molconn-Z、PowerMV、PreADMET、PaDEL-Descriptor、cinfony、Chemopy、The Chemistry Development Kit、RDKit、Open Babel、ToMoCoMD-CARDD、QuaSAR-Descriptor、Molecular Operating Environment、SYBYL(商標)-X Suite、BIOVIA(商標) Discovery Studio、BIOVIA(商標) Material Studio、QikProp、Jaguar、MacroModel、VCharge、MarvinSketch、Spartan、MOPAC(商標)、GAMESS、Gaussian(商標)、HyperChem、Q-Chem、BOSS、Firefly、Molpro、Molcas、ADF、TURBOMOLE、PQS、MPQC、Dalton、LSDalton、COLUMBUS、NWChem、PSI4、CFOUR、ACES、ORCA、SMASH、ABINIT-MP、NTChem、PAICS、Mold2等のコンピュータソフトウェアを利用して、対象化合物の構造から作用Aに関連する記述子の値を計算する方法であることが好ましい。一実施形態において、コンピュータソウトウェアは、RDKitであることが好ましい。
1-2.ステップ(2)
作用Aに関連する記述子の関数として表される予測モデルは、対象化合物が作用Aを有するか否かを予測することが可能なモデルである限り、特に制限はない。一実施形態において、予測モデルは、機械学習により作成された予測モデルであることが好ましく、より具体的には、後述の追加のステップ(ii)で作成された予測モデルであることが好ましい。
作用Aに関連する記述子の関数として表される予測モデルは、対象化合物が作用Aを有するか否かを予測することが可能なモデルである限り、特に制限はない。一実施形態において、予測モデルは、機械学習により作成された予測モデルであることが好ましく、より具体的には、後述の追加のステップ(ii)で作成された予測モデルであることが好ましい。
一実施形態において、予測モデルは、下記式(N)又は(M):
f(x)=-1.00+a×fr_Ar_OH+b×SMR_VSA6+c×PEOE_VSA11+d×fr_aryl_methyl (N) 又はf(x)=-1.00+e×SMR_VSA9+f×fr_ester+g×fr_aryl_methyl+h×SMR_VSA6+i×PEOE_VSA11 (M)
(式中、a~iは、機械学習により決定される数である。)
において、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることが好ましい。
f(x)=-1.00+a×fr_Ar_OH+b×SMR_VSA6+c×PEOE_VSA11+d×fr_aryl_methyl (N) 又はf(x)=-1.00+e×SMR_VSA9+f×fr_ester+g×fr_aryl_methyl+h×SMR_VSA6+i×PEOE_VSA11 (M)
(式中、a~iは、機械学習により決定される数である。)
において、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることが好ましい。
一実施形態において、予測モデルは、下記式(N1)~(N4)及び(M1)~(M5):
f(x)=-1.00+2.44×fr_Ar_OH (N1)
f(x)=-1.00+2.14×fr_Ar_OH+0.25×SMR_VSA6 (N2)
f(x)=-1.00+2.14×fr_Ar_OH+0.39×SMR_VSA6-0.21×PEOE_VSA11 (N3)
f(x)=-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl (N4)
f(x)=-1.00+0.37×SMR_VSA9 (M1)
f(x)=-1.00+0.39×SMR_VSA9-1.72×fr_ester (M2)
f(x)=-1.00+0.37×SMR_VSA9-1.56×fr_ester+1.48×fr_aryl_methyl (M3)
f(x)=-1.00+0.34×SMR_VSA9-1.38×fr_ester+1.39×fr_aryl_methyl+0.17×SMR_VSA6 (M4)
f(x)=-1.00+0.34×SMR_VSA9-1.38×fr_ester+1.39×fr_aryl_methyl+0.36×SMR_VSA6-0.18×PEOE_VSA11 (M5)
のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることが好ましく、式(N2)~(N4)及び(M2)~(M5)のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることがより好ましく、式(N3)~(N4)及び(M3)~(M5)のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることがさらに好ましく、式(N4)及び(M4)~(M5)のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることがさらにより好ましく、式(N4)又は(M5)において、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることが特に好ましい。
f(x)=-1.00+2.44×fr_Ar_OH (N1)
f(x)=-1.00+2.14×fr_Ar_OH+0.25×SMR_VSA6 (N2)
f(x)=-1.00+2.14×fr_Ar_OH+0.39×SMR_VSA6-0.21×PEOE_VSA11 (N3)
f(x)=-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl (N4)
f(x)=-1.00+0.37×SMR_VSA9 (M1)
f(x)=-1.00+0.39×SMR_VSA9-1.72×fr_ester (M2)
f(x)=-1.00+0.37×SMR_VSA9-1.56×fr_ester+1.48×fr_aryl_methyl (M3)
f(x)=-1.00+0.34×SMR_VSA9-1.38×fr_ester+1.39×fr_aryl_methyl+0.17×SMR_VSA6 (M4)
f(x)=-1.00+0.34×SMR_VSA9-1.38×fr_ester+1.39×fr_aryl_methyl+0.36×SMR_VSA6-0.18×PEOE_VSA11 (M5)
のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることが好ましく、式(N2)~(N4)及び(M2)~(M5)のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることがより好ましく、式(N3)~(N4)及び(M3)~(M5)のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることがさらに好ましく、式(N4)及び(M4)~(M5)のいずれかにおいて、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることがさらにより好ましく、式(N4)又は(M5)において、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルであることが特に好ましい。
式(N), (N1)~(N4), (M), 及び(M1)~(M5)は、f(x)が0以上であるか否かを判定するため、それぞれ、右辺をα倍(αは0以外の任意の数)した式と等価である。例えば、式(N1)は、下記式(N1’):
f(x)=-1.00×α+2.44×α×fr_Ar_OH (N1’)
と等価である。
f(x)=-1.00×α+2.44×α×fr_Ar_OH (N1’)
と等価である。
予測モデルの予測精度(試行回数に対する予測と実際の結果とが一致する回数の割合)は、75%以上が好ましく、80%以上がより好ましく、85%以上がさらに好ましく、90%以上がさらにより好ましく、95%以上が特に好ましく、100%が最も好ましい。
1-3.任意の追加のステップ(i)
一実施形態において、対象化合物が作用Aを有するか否かを予測する方法は、ステップ(1)及び(2)に加えて、学習用化合物の構造から作用Aに関連する記述子を抽出するステップ(i)を含むことが好ましい。
一実施形態において、対象化合物が作用Aを有するか否かを予測する方法は、ステップ(1)及び(2)に加えて、学習用化合物の構造から作用Aに関連する記述子を抽出するステップ(i)を含むことが好ましい。
学習用化合物としては、作用Aの有無が確認されている化合物である限り特に制限されないが、基本骨格、官能基等が異なる複数の化合物を用いることが好ましい。なお、作用Aの有無を確認する方法は、次の方法1及び方法2のいずれかである。
<方法1>
PET基板に金を蒸着したシートを用いて、9mm2の作用電極部位を持つ電極チップを作製する(図1)。図1において、「1」はPETフィルムであり、「2」は粘着シートであり、「3」は金蒸着PETフィルムであり、「4」は作用電極部位を示す。この作用電極部位に2%(w/v)のコール酸ナトリウム及び0.15%(w/v)の単層カーボンナノチューブ(SuperPureTubes、NanoIntegris社、外径1.1~1.7nm)を含む水分散液を5μL滴下し乾燥させる。乾燥後、作用電極部位に超純水に溶解したFADGDH(配列番号2のアミノ酸配列を有する;20U/μL)を5μL滴下し乾燥させる。乾燥後、作用電極部位に、学習用化合物をエタノール又はアセトン又はリン酸ナトリウム緩衝液に溶解した溶液(1%(w/v))を5μL滴下し乾燥させる。乾燥後、作用電極部位に3%(w/v)ナフィオン液を5μL滴下し乾燥させ、カーボンナノチューブ及びFADGDHを作用電極に固定化する。電気化学アナライザー(ALS/CHI 660B、エービーエス(株)社製)の作用極に上記で作製した電極チップ、参照電極に銀/塩化銀電極、対極に白金線をセットする。この3電極を40mMリン酸ナトリウム緩衝液(pH7.4)に浸漬する。この緩衝液にグルコースを添加しない場合、又はグルコースを48mMとなるように添加する場合において、サイクリックボルタンメトリーによる測定を実施し、得られたサイクリックボルタモグラムから作用Aの有無を判定する。
<方法2>
PET基板に金を蒸着したシートを用いて、9mm2の作用電極部位を持つ電極チップを作製する(図1)。この作用電極部位に2%(w/v)のコール酸ナトリウム及び0.15%(w/v)の単層カーボンナノチューブ(SuperPureTubes、NanoIntegris社、外径1.1~1.7nm)を含む水分散液を5μL滴下し乾燥させる。乾燥後、作用電極部位に超純水に溶解したFADGDH(配列番号2のアミノ酸配列を有する;20U/μL)を5μL滴下し乾燥させる。乾燥後、作用電極部位に3%(w/v)ナフィオン液を5μL滴下し乾燥させ、カーボンナノチューブ及びFADGDHを作用電極に固定化する。次に、40mMリン酸ナトリウム緩衝液(pH7.4)に学習用化合物を0.1%(w/v)添加して溶解する。電気化学アナライザー(ALS/CHI 660B)の作用極に上記で作製した電極チップ、参照電極に銀/塩化銀電極、対極に白金線をセットし、上記学習用化合物を溶解したリン酸ナトリウム緩衝液に浸漬する。この緩衝液にグルコースを添加しない(0mM)、又はグルコースを48mMとなるように添加する場合において、サイクリックボルタンメトリーによる測定を実施し、得られたサイクリックボルタモグラムから作用Aの有無を判定する。
<方法1>
PET基板に金を蒸着したシートを用いて、9mm2の作用電極部位を持つ電極チップを作製する(図1)。図1において、「1」はPETフィルムであり、「2」は粘着シートであり、「3」は金蒸着PETフィルムであり、「4」は作用電極部位を示す。この作用電極部位に2%(w/v)のコール酸ナトリウム及び0.15%(w/v)の単層カーボンナノチューブ(SuperPureTubes、NanoIntegris社、外径1.1~1.7nm)を含む水分散液を5μL滴下し乾燥させる。乾燥後、作用電極部位に超純水に溶解したFADGDH(配列番号2のアミノ酸配列を有する;20U/μL)を5μL滴下し乾燥させる。乾燥後、作用電極部位に、学習用化合物をエタノール又はアセトン又はリン酸ナトリウム緩衝液に溶解した溶液(1%(w/v))を5μL滴下し乾燥させる。乾燥後、作用電極部位に3%(w/v)ナフィオン液を5μL滴下し乾燥させ、カーボンナノチューブ及びFADGDHを作用電極に固定化する。電気化学アナライザー(ALS/CHI 660B、エービーエス(株)社製)の作用極に上記で作製した電極チップ、参照電極に銀/塩化銀電極、対極に白金線をセットする。この3電極を40mMリン酸ナトリウム緩衝液(pH7.4)に浸漬する。この緩衝液にグルコースを添加しない場合、又はグルコースを48mMとなるように添加する場合において、サイクリックボルタンメトリーによる測定を実施し、得られたサイクリックボルタモグラムから作用Aの有無を判定する。
<方法2>
PET基板に金を蒸着したシートを用いて、9mm2の作用電極部位を持つ電極チップを作製する(図1)。この作用電極部位に2%(w/v)のコール酸ナトリウム及び0.15%(w/v)の単層カーボンナノチューブ(SuperPureTubes、NanoIntegris社、外径1.1~1.7nm)を含む水分散液を5μL滴下し乾燥させる。乾燥後、作用電極部位に超純水に溶解したFADGDH(配列番号2のアミノ酸配列を有する;20U/μL)を5μL滴下し乾燥させる。乾燥後、作用電極部位に3%(w/v)ナフィオン液を5μL滴下し乾燥させ、カーボンナノチューブ及びFADGDHを作用電極に固定化する。次に、40mMリン酸ナトリウム緩衝液(pH7.4)に学習用化合物を0.1%(w/v)添加して溶解する。電気化学アナライザー(ALS/CHI 660B)の作用極に上記で作製した電極チップ、参照電極に銀/塩化銀電極、対極に白金線をセットし、上記学習用化合物を溶解したリン酸ナトリウム緩衝液に浸漬する。この緩衝液にグルコースを添加しない(0mM)、又はグルコースを48mMとなるように添加する場合において、サイクリックボルタンメトリーによる測定を実施し、得られたサイクリックボルタモグラムから作用Aの有無を判定する。
一実施形態において、学習用化合物には単独でメディエーターとしての機能をもつ化合物を含めないことが、予測モデルの簡潔化および予測精度の向上の観点から好ましい。
学習用化合物の数の下限は、特に制限されないが、予測精度を高める点から、5以上が好ましく、10以上がより好ましく、15以上がさらに好ましく、20以上が特に好ましい。また、学習用化合物の上限は、特に制限されないが、データの収集性の点から、50以下が好ましく、40以下がより好ましく、30以下がさらに好ましい。
学習用化合物には、作用Aを有する化合物及び作用Aを有さない化合物の両方が含まれることが好ましい。作用Aを有する化合物の数と作用Aを有さない化合物の数との比は、1:5~5:1が好ましく、1:4~4:1がより好ましい。
作用Aを有する化合物の数と作用Aを有さない化合物の数との比が1:1と異なる場合には、比が1:1となるように学習用化合物の数を調整することが好ましい。調整方法としては、例えば、数が少ない方に対するオーバーサンプリング、数が多い方に対するアンダーサプリング、それらの組合せ等が挙げられる。オーバーサンプリングの手法としては、例えば、ランダムオーバーサンプリンング、SMOTE、SMOTE-NC、ADASYN等が挙げられる。アンダーサンプリングの手法としては、例えば、ランダムアンダーサンプリンング、ONESS、NearMiss、NCL等が挙げられる。学習用化合物の数が多くない場合には、オーバーサンプリングを用いることが好ましい。
一実施形態において、ステップ(i)は、学習用化合物の構造から一群の記述子の値を生成し、その群からスパースモデリングを用いて作用Aに関連する記述子を抽出する方法であることが好ましい。
一実施形態において、一群の記述子は、0~2次元記述子から選択されることが好ましく、学習用化合物全てに対して同じ値をもつ記述子を含まないことが好ましい。
一実施形態において、作用Aに関連する記述子を抽出する前に、一群の記述子の値を正規化することが好ましい。正規化の方法としては、例えば、標準化変換、Yeo-Johnson変換等が挙げられる。一実施形態において、Yeo-Johnson変換を実行することが好ましく、機械学習用PythonライブラリであるScikit-learnを用いてYeo-Johnson変換を実行することがより好ましい。
スパースモデリングとしては、例えば、貪欲法、凸緩和法、確率推論などが挙げられる。貪欲法としては、例えば、直交マッチング追跡(OMP)、マッチング追跡(MP)、弱マッチング追跡(Weak MP)、閾値アルゴリズムなどが挙げられる。凸緩和法としては、例えば、基底追跡法、反復再重み付け最小二乗法(IRLS)、ホモトピー法などが挙げられる。確率推論としては、近似メッセージ伝搬法(AMP)などが挙げられる。一実施形態において、スパースモデリングは、直交マッチング追跡であることが好ましい。
1-4.任意の追加のステップ(ii)
一実施形態において、対象化合物が作用Aを有するか否かを予測する方法は、ステップ(1)及び(2)に加えて、作用Aに関連する記述子の関数として表される予測モデルを作成するステップ(ii)を含むことが好ましい。
一実施形態において、対象化合物が作用Aを有するか否かを予測する方法は、ステップ(1)及び(2)に加えて、作用Aに関連する記述子の関数として表される予測モデルを作成するステップ(ii)を含むことが好ましい。
一実施形態において、ステップ(ii)は、機械学習により予測モデルを作成することが好ましい。機械学習としては、例えば、サポートベクターマシン、関連ベクターマシン、ロジスティック回帰、変分ベイズロジスティック回帰、フィッシャーの線形判別分析、ベイジアンネットワーク、ニューラルネットワーク、アダブースト、ランダムフォレスト等が挙げられる。これらは単独で使用しても2つ以上を併用してもよい。データ数が少ない場合は、線形モデルを採用する方法を採用することが、過学習の防止および解釈可能性の高さの観点から好ましい。一実施形態において、機械学習は、線形サポートベクターマシン、又は変分ベイズロジスティック回帰が好ましい。また、一実施形態において、機械学習は、LibSVM、TensorFlowTM、Chainer(商標)、Jubatus(商標)、Caffe、Theano、Torch、neonTM、MXNet、The Microsoft Cognitive Toolkit、R(C)、MATLAB(商標)、Mathematica(商標)、SAS(商標)、RapidMiner(商標)、KNIME(商標)、WeKa、shogun-toolbox/shogun、Orange、Apache MahoutTM、scikit-learn、mlpy、XGBoost、Deeplearning4j等のコンピュータソフトウェアを利用して実行することが好ましい。
一実施形態において、対象化合物が作用Aを有するか否かを予測する方法は、ステップ(1)、(2)、(i)、及び(ii)を含むことが好ましい。
2.対象化合物が作用Aを有するか否かを予測する方法を実行するための手段を備えるシステム
対象化合物が作用Aを有するか否かを予測する方法は、上記1で記載した通りである。一実施形態において、当該方法を実行するための手段は、入力装置、主記憶装置、補助記憶装置、演算装置、出力装置、及び制御装置を含むことが好ましい。
対象化合物が作用Aを有するか否かを予測する方法は、上記1で記載した通りである。一実施形態において、当該方法を実行するための手段は、入力装置、主記憶装置、補助記憶装置、演算装置、出力装置、及び制御装置を含むことが好ましい。
入力装置は、学習用化合物及び/又は対象化合物の構造を入力可能な限り特に制限されず、例えば、キーボード、マウス、タッチパネル等が挙げられる。主記憶装置は、入力装置で入力されたデータ、補助記憶装置に格納されたデータ、プログラム等を取り込み格納できる限り特に制限されず、例えば、RAM、ROM等が挙げられる。補助記憶装置は、データ、プログラム等が格納できる限り特に制限されず、例えば、ハードディスクドライブ、光ディスク、SSD等が挙げられる。制御装置は、主記憶装置に格納されたプログラムに従って、演算装置等を制御できる限り特に制限されない。出力装置は、演算装置で演算された結果を表示できる限り特に制限されず、例えば、ディスプレイ等が挙げられる。
上記手段を含むシステムは、例えば、入力装置で入力された構造データ、及び当該構造データから作用Aに関連する記述子、予測モデル、予測結果等を作成するためのプログラムを主記憶装置に取り込んで格納し、前記データ及びプログラムを演算装置に取り込んで、制御装置から送られた演算命令に基づいて演算し、演算結果を主記憶装置に返して出力装置により出力することができる。
3.対象化合物が作用Aを有するか否かを予測する方法を実行するためのプログラム及び記録媒体
対象化合物が作用Aを有するか否かを予測する方法は、上記1で記載した通りである。プログラムは、上記方法を実行できる限り特に制限されない。一実施形態において、プログラムは、CD(Compact Disc)-ROM、CD-R、CD-RW、DVD(Digital Versatile Disc)、DVD-RAM、BD(Blu-ray(商標)Disc)、MO(MagnetoOptical disc)、SSD、磁気テープ、各種メモリーカード(USBフラッシュメモリー、SDメモリーカード等)等のコンピュータ読み取り可能な記憶媒体に格納した状態、或いはクラウドコンピュータ等からダウンロードする形態で提供される。また、ネットワークを介して接続されたコンピュータの補助記憶装置にプログラムを格納すること、ネットワークを通じて他のコンピュータにプログラムを転送することなども可能である。
対象化合物が作用Aを有するか否かを予測する方法は、上記1で記載した通りである。プログラムは、上記方法を実行できる限り特に制限されない。一実施形態において、プログラムは、CD(Compact Disc)-ROM、CD-R、CD-RW、DVD(Digital Versatile Disc)、DVD-RAM、BD(Blu-ray(商標)Disc)、MO(MagnetoOptical disc)、SSD、磁気テープ、各種メモリーカード(USBフラッシュメモリー、SDメモリーカード等)等のコンピュータ読み取り可能な記憶媒体に格納した状態、或いはクラウドコンピュータ等からダウンロードする形態で提供される。また、ネットワークを介して接続されたコンピュータの補助記憶装置にプログラムを格納すること、ネットワークを通じて他のコンピュータにプログラムを転送することなども可能である。
4.ナノカーボンによる酵素-電極間電子伝達の増強剤
一実施形態において、ナノカーボンによる酵素-電極間電子伝達の増強剤は、化合物Xからなることが好ましい。化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylの値が、式(N), (N1)~(N4), (M), 及び(M1)~(M5)のいずれかで表されるf(x)≧0を満たすものであることが好ましく、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たすものであることが特に好ましい。また、式(N1)~(N4)及び(M1)~(M5)のうち、2つ以上の式(例えば、式(N1)及び(N4))において、f(x)≧0を満たすものであることも好ましい。
一実施形態において、ナノカーボンによる酵素-電極間電子伝達の増強剤は、化合物Xからなることが好ましい。化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylの値が、式(N), (N1)~(N4), (M), 及び(M1)~(M5)のいずれかで表されるf(x)≧0を満たすものであることが好ましく、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たすものであることが特に好ましい。また、式(N1)~(N4)及び(M1)~(M5)のうち、2つ以上の式(例えば、式(N1)及び(N4))において、f(x)≧0を満たすものであることも好ましい。
一実施形態において、化合物Xは、上記1で記載した対象化合物と同様の構造を有することが好ましく、単独でメディエータとしての機能をもたない化合物であることが好ましい。なお、ナノカーボン、酵素、及び電極は、上記1で記載した通りである。
5.ナノカーボンによる酵素-電極間電子伝達を増強する方法
一実施形態において、ナノカーボンによる酵素-電極間電子伝達を増強する方法は、好ましくは、化合物Xをナノカーボンに付着又は近接させることを含む。化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylの値が、式(N), (N1)~(N4), (M), 及び(M1)~(M5)のいずれかで表されるf(x)≧0を満たすものであることが好ましく、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たすものであることが特に好ましい。また、式(N1)~(N4)及び(M1)~(M5)のうち、2つ以上の式(例えば、式(N1)及び(N4))において、f(x)≧0を満たすものであることも好ましい。一実施形態において、化合物Xは、上記1で記載した対象化合物と同様の構造を有することが好ましく、単独でメディエータとしての機能をもたない化合物であることが好ましい。
一実施形態において、ナノカーボンによる酵素-電極間電子伝達を増強する方法は、好ましくは、化合物Xをナノカーボンに付着又は近接させることを含む。化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylの値が、式(N), (N1)~(N4), (M), 及び(M1)~(M5)のいずれかで表されるf(x)≧0を満たすものであることが好ましく、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たすものであることが特に好ましい。また、式(N1)~(N4)及び(M1)~(M5)のうち、2つ以上の式(例えば、式(N1)及び(N4))において、f(x)≧0を満たすものであることも好ましい。一実施形態において、化合物Xは、上記1で記載した対象化合物と同様の構造を有することが好ましく、単独でメディエータとしての機能をもたない化合物であることが好ましい。
化合物Xをナノカーボンに付着又は近接させる方法は特に制限されない。一実施形態において、化合物Xをナノカーボンに付着又は近接させることは、好ましくは、電極の基板上にナノカーボン、化合物X、及び酵素を積載することを含む。当該実施形態において、ナノカーボン、化合物X、及び酵素は、任意の手段で基板に積載することができる。例えば、これらの物質の各々を分散又は溶解させた溶液を調製し、それらを順次基板上の所定部位(基板が、絶縁性基板上に金属薄膜が形成されたものである場合、金属薄膜が形成された場所)に適用(例えば、滴下)し、乾燥させるという操作を繰り返すことにより積載することができる。分散媒又は溶媒としては、特に制限されず、水、アルコール系溶媒(例えば、エタノール)、ケトン系溶媒(例えば、アセトン)、これらの組合せが挙げられる。積載する順序は任意であるが、ナノカーボン→酵素→化合物X、又はナノカーボン→化合物X→酵素の順で積載することが好ましい。
化合物Xの積載量は、特に制限されない。化合物Xの積載量は、ナノカーボンの積載量100質量部に対して、例えば、0.001質量部以上、好ましくは0.01質量部以上、さらに好ましくは0.1質量部以上である。また、化合物Xの積載量は、ナノカーボンの積載量100質量部に対して、例えば、100000質量部以下、好ましくは10000質量部以下、さらに好ましくは1000質量部以下である。前記下限及び上限は任意に組み合わせることができる。また、化合物Xの積載量は、酵素の積載量100質量部に対して、例えば、0.001質量部以上、好ましくは0.01質量部以上、さらに好ましくは0.1質量部以上である。また、化合物Xの積載量は、酵素の積載量100質量部に対して、例えば、1000000質量部以下、好ましくは100000質量部以下、さらに好ましくは10000質量部以下である。前記下限及び上限は任意に組み合わせることができる。
基板上に分散剤が更に積載されていてもよい。分散剤は、基板上でのナノカーボンの凝集を抑制し、分散させることが可能な物質であれば、特に制限されない。分散剤としては、例えば、コール酸ナトリウム、デオキシコール酸ナトリウム、ドデシル硫酸ナトリウム、ドデシルベンゼンスルホン酸ナトリウム、セチルトリメチルアンモニウムブロミド、オクチルフェノールエトキシレート等を挙げることができる。一実施形態において、好ましい分散剤は、コール酸ナトリウム、デオキシコール酸ナトリウムである。
一実施形態において、ナノカーボン、化合物X、及び酵素は、基板に固定化されてもよい。固定化は、公知の方法を適宜選択して実施することができる。例えば、テトラフルオロエチレン/パーフルオロ[2-(フルオロスルホニルエトキシ)ポリビニルエーテル]共重合体(例:ナフィオン(商標))及びカルボキシルメチルセルロース等の固定化に適した物質を溶解させた液体を、基板上の上記各物質を積載した部位に滴下し、乾燥させることによって、固定化することができる。一実施形態において、ナノカーボン、化合物X、及び酵素を基板に積載したのち、これらの物質を覆うようにカルボキシルメチルセルロース等のポリマー物質で処理することが好ましい。
一実施形態において、分散剤は、ナノカーボンを分散させた分散液に配合することが好ましい。分散剤の配合割合は任意であるが、例えば、0.2~2%(w/v)配合することが好ましい。なお、ナノカーボンの配合割合も任意であるが、例えば、0.05~0.5%(w/v)配合することが好ましい。
一実施形態において、化合物Xをナノカーボンに付着又は近接させることは、好ましくは、基板上にナノカーボン及び酵素を積載した電極を、化合物Xを含む溶媒に浸漬することを含む。溶媒としては、典型的には、緩衝液が挙げられ、その例としては、酢酸塩緩衝液、クエン酸塩緩衝液、リン酸塩緩衝液、硼酸塩緩衝液などが挙げられる。溶媒中の化合物Xの濃度は、特に限定されない。前記濃度の下限は、例えば、0.000001%(w/v)、好ましくは0.000005%(w/v)、より好ましくは0.00001%(w/v)、より好ましくは0.00005%(w/v)、より好ましくは0.0001%(w/v)、より好ましくは0.0005%(w/v)、より好ましくは0.001%(w/v)、より好ましくは0.005%(w/v)、より好ましくは0.01%(w/v)である。前記濃度の上限は、例えば、2%(w/v)、好ましくは1.5%(w/v)、より好ましくは1%(w/v)である。前記濃度の下限及び上限は任意に組み合わせることができる。
なお、ナノカーボン、酵素、並びに電極(及び基板)は、上記1で記載した通りである。
<学習用データ>
PET基板に金を蒸着したシートを用いて、9mm2の作用電極部位を持つ電極チップを作製した(図1)。図1において、「1」はPETフィルムであり、「2」は粘着シートであり、「3」は金蒸着PETフィルムであり、「4」は作用電極部位を示す。この作用電極部位に2%(w/v)のコール酸ナトリウム及び0.15%(w/v)の単層カーボンナノチューブ(SuperPureTubes、NanoIntegris社、外径1.1~1.7nm)を含む水分散液を5μL滴下し乾燥させた。乾燥後、作用電極部位に超純水に溶解したFADGDH(配列番号2のアミノ酸配列を有する;20U/μL)を5μL滴下し乾燥させた。乾燥後、作用電極部位に、下記の群1及び群2の化合物をエタノール又はアセトン又はリン酸ナトリウム緩衝液に溶解した溶液(1%(w/v))を5μL滴下し乾燥させた。乾燥後、作用電極部位に3%(w/v)ナフィオン液を5μL滴下し乾燥させ、カーボンナノチューブ及びFADGDHを作用電極に固定化した。
PET基板に金を蒸着したシートを用いて、9mm2の作用電極部位を持つ電極チップを作製した(図1)。図1において、「1」はPETフィルムであり、「2」は粘着シートであり、「3」は金蒸着PETフィルムであり、「4」は作用電極部位を示す。この作用電極部位に2%(w/v)のコール酸ナトリウム及び0.15%(w/v)の単層カーボンナノチューブ(SuperPureTubes、NanoIntegris社、外径1.1~1.7nm)を含む水分散液を5μL滴下し乾燥させた。乾燥後、作用電極部位に超純水に溶解したFADGDH(配列番号2のアミノ酸配列を有する;20U/μL)を5μL滴下し乾燥させた。乾燥後、作用電極部位に、下記の群1及び群2の化合物をエタノール又はアセトン又はリン酸ナトリウム緩衝液に溶解した溶液(1%(w/v))を5μL滴下し乾燥させた。乾燥後、作用電極部位に3%(w/v)ナフィオン液を5μL滴下し乾燥させ、カーボンナノチューブ及びFADGDHを作用電極に固定化した。
電気化学アナライザー(ALS/CHI 660B、エービーエス(株)社製)の作用極に上記で作製した電極チップ、参照電極に銀/塩化銀電極、対極に白金線をセットした。この3電極を40mMリン酸ナトリウム緩衝液(pH7.4)に浸漬した。この緩衝液にグルコースを添加しない場合、又はグルコースを48mMとなるように添加する場合において、サイクリックボルタンメトリーによる測定を実施した。
上記と同様に、PET基板に金を蒸着したシートを用いて、9mm2の作用電極部位を持つ電極チップを用意した(図1)。この作用電極部位に2%(w/v)のコール酸ナトリウム及び0.15%(w/v)の単層カーボンナノチューブ(SuperPureTubes、NanoIntegris社、外径1.1~1.7nm)を含む水分散液を5μL滴下し乾燥させた。乾燥後、作用電極部位に超純水に溶解したFADGDH(配列番号2のアミノ酸配列を有する;20U/μL)を5μL滴下し乾燥させた。乾燥後、作用電極部位に3%(w/v)ナフィオン液を5μL滴下し乾燥させ、カーボンナノチューブ及びFADGDHを作用電極に固定化した。次に、40mMリン酸ナトリウム緩衝液(pH7.4)に、下記の群1及び群2の化合物を0.1%(w/v)添加して溶解した。電気化学アナライザー(ALS/CHI 660B)の作用極に上記で作製した電極チップ、参照電極に銀/塩化銀電極、対極に白金線をセットし、上記学習用化合物を溶解したリン酸ナトリウム緩衝液に浸漬した。この緩衝液にグルコースを添加しない(0mM)、又はグルコースを48mMとなるように添加する場合において、サイクリックボルタンメトリーによる測定を実施した。
得られたサイクリックボルタモグラムから、群1の化合物は、カーボンナノチューブによる酵素-電極間電子伝達を増強する作用Aを有さず、群2の化合物は作用Aを有することが分かった。なお、群2の化合物(2-7)については、さらに、上記測定において、単層カーボンナノチューブを多層カーボンナノチューブに変更した場合、及び、FADGDHをグルコースオキシダーゼ又は乳酸オキシダーゼに変更した場合も、同様に作用Aを有することを確認した。
作用Aを有さない化合物として群1の化合物を含む17個の化合物を、作用Aを有する化合物として群2の化合物からなる17個の化合物を、学習用データに用いた。
<予測モデルの作成>
作用Aの有無の予測モデルの作成は、学習用データを用いて、(1)記述子の作成、(2)作用Aに関連する記述子の抽出、及び(3)予測式の作成の3段階により行った。
作用Aの有無の予測モデルの作成は、学習用データを用いて、(1)記述子の作成、(2)作用Aに関連する記述子の抽出、及び(3)予測式の作成の3段階により行った。
(1) 記述子の作成
Rdkit(Open-source cheminformatics; http://www.rdkit.org)を用いて、学習用データの各化合物を、化学構造式に基づいて、200種類の記述子の値を計算し、200次元ベクトルに変換した。200種類の記述子には、官能基数、トポロジー、分極性などを表す記述子が含まれる。なお、基本的で汎用性の高い記述子を優先的に用いるため、3次元記述子は除外した。また、学習用データの化合物全てに対し同じ値をもつ記述子は意味をもたないため除外した。
Rdkit(Open-source cheminformatics; http://www.rdkit.org)を用いて、学習用データの各化合物を、化学構造式に基づいて、200種類の記述子の値を計算し、200次元ベクトルに変換した。200種類の記述子には、官能基数、トポロジー、分極性などを表す記述子が含まれる。なお、基本的で汎用性の高い記述子を優先的に用いるため、3次元記述子は除外した。また、学習用データの化合物全てに対し同じ値をもつ記述子は意味をもたないため除外した。
(2) 作用Aに関連する記述子の抽出
学習用データの化合物の作用Aの有無を判定するために必要な記述子は、200種類のうちでも少数であるから、予測式を作成する前に、記述子の抽出を行った。記述子の抽出には、直交マッチング追跡(orthogonal matching pursuit; OMP)(MALLAT, Stephane; ZHANG, Zhifeng. Matching pursuit with time-frequency dictionaries. Courant Institute of Mathematical Sciences New York United States, 1993)を用いた。OMPはスパースモデリングの一種であり、式(1)のL0ノルム制限付き最適化問題(Rubinstein, R., Zibulevsky, M. and Elad, M., Efficient Implementation of the K-SVD Algorithm using Batch Orthogonal Matching Pursuit Technical Report - CS Technion, April 2008)を係数ベクトルCについて解いた。
ここで、y=(y1,…,yn)Tの成分yiは各化合物の作用Aの有(1)無(-1)を表し、X=(x1,…,xn)Tは各化合物の記述子xiを並べた行列である。このとき、式(1)を解いて得られる係数ベクトルCは、たかだかS個しか非ゼロ要素をもたないスパース(疎)なベクトルとなる。そこで、非ゼロ要素に対応する記述子を抽出し、次の予測式の作成に使用した。
学習用データの化合物の作用Aの有無を判定するために必要な記述子は、200種類のうちでも少数であるから、予測式を作成する前に、記述子の抽出を行った。記述子の抽出には、直交マッチング追跡(orthogonal matching pursuit; OMP)(MALLAT, Stephane; ZHANG, Zhifeng. Matching pursuit with time-frequency dictionaries. Courant Institute of Mathematical Sciences New York United States, 1993)を用いた。OMPはスパースモデリングの一種であり、式(1)のL0ノルム制限付き最適化問題(Rubinstein, R., Zibulevsky, M. and Elad, M., Efficient Implementation of the K-SVD Algorithm using Batch Orthogonal Matching Pursuit Technical Report - CS Technion, April 2008)を係数ベクトルCについて解いた。
なお、OMPを行う前に、計算の安定化を目的として記述子行列Xを列、すなわち記述子ごとに標準化変換(式(2))することが一般的である。
ここで、μjは列ごとの平均、σjは標準偏差を表す。しかし、データ数が少ない場合、外れ値が存在する場合には、標準化変換をしても変換後の分布は標準正規分布とはならない可能性がある。そこで、OMPを行う前に、より強力にデータを標準正規分布に近づけることのできるYeo-Johnson変換(YEO, In‐Kwon; JOHNSON, Richard A. A new family of power transformations to improve normality or symmetry. Biometrika, 2000, 87.4: 954-959)を列ごとに行った(式(3))。
ここでλjは0≦λj≦2の範囲の指数パラメータであり、最尤推定により決定した。これらの処理は、機械学習用PythonライブラリであるScikit-learn(Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825-2830, 2011)を用いて実行した。
抽出する記述子の数Sが1のとき、fr_Ar_OHという記述子が選ばれ、Sが2のとき、さらにSMR_VSA6という記述子が選ばれ、Sが3のとき、さらにPEOE_VSA11という記述子が選ばれ、Sが4のとき、さらにfr_aryl_methylという記述子が選ばれた。或いは、抽出する記述子の数Sが1のとき、SMR_VSA9という記述子が選ばれ、Sが2のとき、さらにfr_esterという記述子が選ばれ、Sが3のとき、さらにfr_aryl_methylという記述子が選ばれ、Sが4のとき、さらにSMR_VSA6という記述子が選ばれ、Sが5のとき、さらにPEOE_VSA11という記述子が選ばれた。
(3) 予測式の作成
既に重要な記述子がOMPにより抽出されており、単純な分類手法で十分であるため、予測式の作成には、線形カーネルによるサポートベクター分類(Support Vector Classification; SVC)(R.-E. Fan, K.-W. Chang, C.-J. Hsieh, X.-R. Wang, and C.-J. Lin. LIBLINEAR: A Library for Large Linear Classification, Journal of Machine Learning Research 9(2008), 1871-1874. Software available at http://www.csie.ntu.edu.tw/~cjlin/liblinear)を用いた。線形SVCでは、双対変数ベクトル
に関する拘束付き最小化(式(4))を行った。
ここでxiとyiは式(1)と同様に各化合物の記述子と作用Aの有無を表す。ただし、バイアス(切片)の効果を考慮するためにxiの第0次元に定数項を追加した:
このとき、最適化された双対変数ベクトルαを用い、作用Aの有無を判別する式(5)を得た。
ここで、
である。また、式(4)中のCは正則化係数と呼ばれるハイパーパラメータである。一つ抜き(Leave One Out)法を用いた交差検証によりCの決定を試みたが、Cを変化させてもテスト精度が変わらず安定していたため、C=1とした。これら線形SVCの計算は、Scikit-learnを用いて実行した。なお、予測式の作成に関しては、前述の抽出とは異なり、記述子に対するYeo-Johnson変換及び標準化変換は施していない。
既に重要な記述子がOMPにより抽出されており、単純な分類手法で十分であるため、予測式の作成には、線形カーネルによるサポートベクター分類(Support Vector Classification; SVC)(R.-E. Fan, K.-W. Chang, C.-J. Hsieh, X.-R. Wang, and C.-J. Lin. LIBLINEAR: A Library for Large Linear Classification, Journal of Machine Learning Research 9(2008), 1871-1874. Software available at http://www.csie.ntu.edu.tw/~cjlin/liblinear)を用いた。線形SVCでは、双対変数ベクトル
学習用化合物の作用Aの有無の予測精度は、予測式(N1)の場合91.2%であり、予測式(N2)の場合94.1%であり、予測式(N3)の場合97.1%であり、予測式(N4)の場合100%であり、予測式(M1)の場合91.2%であり、予測式(M2)の場合94.1%であり、予測式(M3)の場合97.1%であり、予測式(M4)の場合97.1%であり、予測式(M5)の場合100%であった。
群3の各化合物について、化学構造式から記述子の値を算出し、その値を予測式に適用したところ、予測式(N1)~(N4)及び(M1)~(M5)のいずれを用いても、群3のうち、化合物(3-1)~(3-9)は作用Aを有し、化合物(3-10)及び(3-11)は作用Aを有さないと予測された。実際、群3の化合物を学習用データで述べたのと同様の試験に供したところ、予測通りの結果となり、予測と実際の結果は完全に一致する(予測精度が100%である)ことが分かった。
Claims (15)
- 対象化合物が、ナノカーボンによる酵素-電極間電子伝達を増強する作用Aを有するか否かを予測する方法であって、
対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
前記作用Aに関連する記述子の値を、作用Aに関連する記述子の関数として表される予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含んでおり、
前記作用Aに関連する記述子が、fr_Ar_OH又はSMR_VSA9を含む、方法。 - 前記作用Aに関連する記述子が、さらにSMR_VSA6、PEOE_VSA11、fr_ester、及びfr_aryl_methylからなる群から選択される少なくとも一種の記述子を含む、請求項1に記載の方法。
- 前記作用Aに関連する記述子が、さらにSMR_VSA6、PEOE_VSA11、及びfr_aryl_methylを含む、請求項1に記載の方法。
- 前記予測モデルが、
f(x)=-1.00+a×fr_Ar_OH+b×SMR_VSA6+c×PEOE_VSA11+d×fr_aryl_methyl、又はf(x)=-1.00+e×SMR_VSA9+f×fr_ester+g×fr_aryl_methyl+h×SMR_VSA6+i×PEOE_VSA11
(式中、a~iは、機械学習により決定される数である。)
において、f(x)が0以上であれば、対象化合物が作用Aを有すると予測するモデルである、請求項1~3のいずれかに記載の方法。 - 対象化合物が、ナノカーボンによる酵素-電極間電子伝達を増強する作用Aを有するか否かを予測する方法であって、
学習用化合物の構造から作用Aに関連する記述子を抽出するステップ、
前記作用Aに関連する記述子の関数として表される予測モデルを作成するステップ、
対象化合物の構造から作用Aに関連する記述子の値を生成するステップ、及び
前記作用Aに関連する記述子の値を前記予測モデルに適用し、対象化合物が作用Aを有するか否かを予測するステップ
を含む、方法。 - 請求項1~5のいずれかに記載の方法を実行するための手段を備えるシステム。
- 請求項1~5のいずれかに記載の方法を実行するためのプログラム。
- 請求項7に記載のプログラムが記録された記録媒体。
- ナノカーボンによる酵素-電極間電子伝達を増強する方法であって、
化合物Xをナノカーボンに付着又は近接させることを含み、
化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、及びfr_aryl_methylの値が、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たす、方法。 - 化合物Xが、芳香環骨格を有する化合物である、請求項9に記載の方法。
- 化合物Xをナノカーボンに付着又は近接させることが、電極の基板上にナノカーボン、化合物X、及び酵素を積載することを含む、請求項9又は10に記載の方法。
- 化合物Xをナノカーボンに付着又は近接させることが、基板上にナノカーボン及び酵素を積載した電極を、化合物Xを含む溶媒に浸漬することを含む、請求項9又は10に記載の方法。
- 溶媒中の化合物Xの濃度が、0.000001~2%(w/v)である、請求項12に記載の方法。
- ナノカーボンによる酵素-電極間電子伝達を増強するための、化合物Xの使用であって、
化合物Xの記述子fr_Ar_OH、SMR_VSA6、PEOE_VSA11、及びfr_aryl_methylの値が、下記式:
-1.00+2.00×fr_Ar_OH+0.37×SMR_VSA6-0.20×PEOE_VSA11+1.43×fr_aryl_methyl≧0
を満たす、使用。 - 化合物Xが、芳香環骨格を有する化合物である、請求項14に記載の使用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019121978A JP6891372B2 (ja) | 2019-06-28 | 2019-06-28 | 酵素−電極間電子伝達増強作用の有無の予測方法 |
JP2019-121978 | 2019-06-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020262327A1 true WO2020262327A1 (ja) | 2020-12-30 |
Family
ID=74059769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2020/024471 WO2020262327A1 (ja) | 2019-06-28 | 2020-06-22 | 酵素-電極間電子伝達増強作用の有無の予測方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6891372B2 (ja) |
WO (1) | WO2020262327A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021040633A (ja) * | 2020-11-04 | 2021-03-18 | 東洋紡株式会社 | 酵素−電極間電子伝達増強作用の有無の予測方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007055100A1 (ja) * | 2005-11-08 | 2007-05-18 | Ultizyme International Ltd. | 酵素電極 |
JP2009014485A (ja) * | 2007-07-04 | 2009-01-22 | Funai Electric Advanced Applied Technology Research Institute Inc | 酵素電極及び酵素センサ |
WO2014002998A1 (ja) * | 2012-06-25 | 2014-01-03 | 合同会社バイオエンジニアリング研究所 | 酵素電極 |
WO2015020149A1 (ja) * | 2013-08-07 | 2015-02-12 | アークレイ株式会社 | 電気化学式バイオセンサを用いた物質の測定方法及び測定装置 |
CN105403605A (zh) * | 2015-10-23 | 2016-03-16 | 太原理工大学 | 一种纳米碳管载葡萄糖氧化酶膜电极的制备方法 |
WO2018043050A1 (ja) * | 2016-08-29 | 2018-03-08 | 国立研究開発法人産業技術総合研究所 | グルコースセンサ用試薬、グルコースセンサ、グルコースセンサの製造方法、および、グルコース測定装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908630B (zh) * | 2009-06-04 | 2012-08-08 | 中国科学院化学研究所 | 一种介体型生物燃料电池阳极及其制备方法 |
WO2012066806A1 (ja) * | 2010-11-18 | 2012-05-24 | 独立行政法人科学技術振興機構 | 微生物燃料電池用電極及びそれを用いた微生物燃料電池 |
JP6312441B2 (ja) * | 2014-01-09 | 2018-04-18 | 国立大学法人信州大学 | 単層カーボンナノチューブ、それを含む電極シート、それの製造方法、および、それの分散体の製造方法 |
US10697918B2 (en) * | 2016-05-04 | 2020-06-30 | Massachusetts Institute Of Technology | Polymer / single-walled carbon nanotube composite for gas detection |
-
2019
- 2019-06-28 JP JP2019121978A patent/JP6891372B2/ja active Active
-
2020
- 2020-06-22 WO PCT/JP2020/024471 patent/WO2020262327A1/ja active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007055100A1 (ja) * | 2005-11-08 | 2007-05-18 | Ultizyme International Ltd. | 酵素電極 |
JP2009014485A (ja) * | 2007-07-04 | 2009-01-22 | Funai Electric Advanced Applied Technology Research Institute Inc | 酵素電極及び酵素センサ |
WO2014002998A1 (ja) * | 2012-06-25 | 2014-01-03 | 合同会社バイオエンジニアリング研究所 | 酵素電極 |
WO2015020149A1 (ja) * | 2013-08-07 | 2015-02-12 | アークレイ株式会社 | 電気化学式バイオセンサを用いた物質の測定方法及び測定装置 |
CN105403605A (zh) * | 2015-10-23 | 2016-03-16 | 太原理工大学 | 一种纳米碳管载葡萄糖氧化酶膜电极的制备方法 |
WO2018043050A1 (ja) * | 2016-08-29 | 2018-03-08 | 国立研究開発法人産業技術総合研究所 | グルコースセンサ用試薬、グルコースセンサ、グルコースセンサの製造方法、および、グルコース測定装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6891372B2 (ja) | 2021-06-18 |
JP2021007323A (ja) | 2021-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dao et al. | Identify origin of replication in Saccharomyces cerevisiae using two-step feature selection technique | |
Wei et al. | Computational prediction and interpretation of cell-specific replication origin sites from multiple eukaryotes by exploiting stacking framework | |
Fang et al. | GSEApy: a comprehensive package for performing gene set enrichment analysis in Python | |
Lv et al. | RF-PseU: a random forest predictor for RNA pseudouridine sites | |
Le et al. | iEnhancer-5Step: identifying enhancers using hidden information of DNA sequences via Chou's 5-step rule and word embedding | |
Zhang et al. | NARROMI: a noise and redundancy reduction technique improves accuracy of gene regulatory network inference | |
Ashoor et al. | Graph embedding and unsupervised learning predict genomic sub-compartments from HiC chromatin interaction data | |
Yuan et al. | scBasset: sequence-based modeling of single-cell ATAC-seq using convolutional neural networks | |
Filipovska et al. | A universal code for RNA recognition by PUF proteins | |
Liao et al. | Logistic regression for disease classification using microarray data: model selection in a large p and small n case | |
He | Grand challenge commentary: RNA epigenetics? | |
Palsson | In silico biology through “omics” | |
Zhang et al. | DeepHE: Accurately predicting human essential genes based on deep learning | |
Machado et al. | Stoichiometric representation of gene–protein–reaction associations leverages constraint-based analysis from reaction to gene-level phenotype prediction | |
Chuang et al. | An improved PSO algorithm for generating protective SNP barcodes in breast cancer | |
Liu et al. | iRSpot-DACC: a computational predictor for recombination hot/cold spots identification based on dinucleotide-based auto-cross covariance | |
Mao et al. | Comparative analyses between retained introns and constitutively spliced introns in Arabidopsis thaliana using random forest and support vector machine | |
Manavalan et al. | Computational prediction of species-specific yeast DNA replication origin via iterative feature representation | |
Das et al. | Bayesian integration of genetics and epigenetics detects causal regulatory SNPs underlying expression variability | |
WO2020262327A1 (ja) | 酵素-電極間電子伝達増強作用の有無の予測方法 | |
He et al. | Sc-ncdnapred: a sequence-based predictor for identifying non-coding dna in saccharomyces cerevisiae | |
Choi et al. | Predicting protein-binding regions in RNA using nucleotide profiles and compositions | |
Cai et al. | A bioinformatics tool for the prediction of DNA N6-Methyladenine modifications based on feature fusion and optimization protocol | |
Huang et al. | Finding branched pathways in metabolic network via atom group tracking | |
Zhou et al. | Joint eQTL mapping and inference of gene regulatory network improves power of detecting both cis-and trans-eQTLs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20831472 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20831472 Country of ref document: EP Kind code of ref document: A1 |