WO2018158916A1 - 化合物の原料物質の探索方法、及び探索装置、並びにプログラム - Google Patents

化合物の原料物質の探索方法、及び探索装置、並びにプログラム Download PDF

Info

Publication number
WO2018158916A1
WO2018158916A1 PCT/JP2017/008348 JP2017008348W WO2018158916A1 WO 2018158916 A1 WO2018158916 A1 WO 2018158916A1 JP 2017008348 W JP2017008348 W JP 2017008348W WO 2018158916 A1 WO2018158916 A1 WO 2018158916A1
Authority
WO
WIPO (PCT)
Prior art keywords
search
compound
raw material
group
partial structures
Prior art date
Application number
PCT/JP2017/008348
Other languages
English (en)
French (fr)
Inventor
惇 朝永
明彦 上田
健太郎 高井
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to PCT/JP2017/008348 priority Critical patent/WO2018158916A1/ja
Publication of WO2018158916A1 publication Critical patent/WO2018158916A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services

Definitions

  • This case relates to a method for searching a raw material of a compound, a search device, and a program for executing the search method.
  • the search for drug candidate molecules means searching for a compound (ligand) that strongly interacts with a target molecule involved in a target disease (target disease) as a drug candidate. Therefore, screening of compounds based on the three-dimensional structure of the target molecule by computers is actively performed.
  • a structure-based drug design method (Structure-Based Drug Design, SBDD) can be mentioned.
  • SBDD Structure-Based Drug Design
  • This method is a molecular design method based on the three-dimensional structure information of the target molecule and receptor.
  • a drug candidate molecule selected as a drug candidate by computer simulation can actually be synthesized, and knowing the availability of its raw materials in advance, will affect the drug efficacy of the drug candidate molecule. It is as important as confirming. This is because if you try to synthesize a drug candidate molecule that has been determined to have a strong medicinal effect by simulation but cannot synthesize it, or if you spend a lot of time to synthesize the raw material, the utility of the drug candidate molecule Is very low.
  • the present case executes a method for searching for a compound raw material that facilitates determination of whether or not a compound can be synthesized, a device for searching for a raw material of a compound that facilitates determination of whether or not a compound can be synthesized, and the search method.
  • the purpose is to provide a program.
  • the search method for the raw material of the disclosed compound is as follows: Dividing the chemical structure of the compound input to the computer into a plurality of partial structures, and creating a search structure corresponding to each of the plurality of partial structures; Searching a raw material material satisfying the search structure from a raw material database; Displaying the search results; including.
  • the disclosed program is A program for causing a computer to search for a raw material of a compound, In the computer, Dividing the chemical structure of the compound input to the computer into a plurality of partial structures, and creating a search structure corresponding to each of the plurality of partial structures; Searching a raw material material satisfying the search structure from a raw material database; Displaying the search results; Is executed.
  • a device for searching for a raw material of the disclosed compound is: A search structure creation unit that divides the chemical structure of the compound input to the search device into a plurality of partial structures, and creates a search structure corresponding to each of the plurality of partial structures; A search unit for searching for a source material satisfying the search structure from a source material database; A display for displaying the search results; Have
  • the disclosed method for searching a raw material of a compound it is easy to determine whether or not a compound can be synthesized.
  • the disclosed program it is easy to determine whether or not a compound can be synthesized.
  • the disclosed raw material search device for a compound it is easy to determine whether or not a compound can be synthesized.
  • FIG. 1 is a flowchart of an example of a method for searching for a raw material of a disclosed compound.
  • FIG. 2 is a flowchart of another example of the disclosed method for searching a raw material of a compound.
  • FIG. 3 is a flowchart of another example of the disclosed method for searching a raw material of a compound.
  • FIG. 4 is a flowchart of another example of the disclosed method for searching a raw material of a compound.
  • FIG. 5 is a flowchart of another example of a method for searching for a raw material of a disclosed compound.
  • FIG. 6 is a flowchart of another example of a method for searching a raw material of a disclosed compound.
  • FIG. 7 is a configuration example of a search device for a raw material substance of the disclosed compound.
  • FIG. 8 shows another configuration example of the disclosed raw material search device for a compound.
  • FIG. 9 shows another configuration example of the disclosed raw material search apparatus for compounds.
  • Drug discovery refers to the process of drug design.
  • the drug discovery is performed in the following order, for example. (1) Search for target molecules (2) Search for lead compounds, etc. (3) Confirmation of physiological action (4) Confirmation of safety / toxicity test It is important to accurately evaluate the interaction between each drug candidate molecule and the target molecule.
  • the process of designing medicines using a computer can be used in general drug discovery. Among them, use for searching for lead compounds and the like is useful for shortening the period of new drug development and increasing the probability of success.
  • the disclosed technology can be used, for example, for searching for lead compounds that are expected to have high pharmacological activity.
  • the disclosed technology can be used as a reference for determining whether or not a compound can be synthesized regardless of drug discovery. It does not matter whether the compound here is a known compound or an unknown compound.
  • the disclosed raw material search method for a compound includes at least a search structure creation step, a raw material search step, and a search result display step, and further includes other steps as necessary.
  • the search structure creation step is not particularly limited as long as it is a step of dividing a chemical structure of a compound input to a computer into a plurality of partial structures and creating a search structure corresponding to each of the plurality of partial structures. Can be appropriately selected according to the purpose.
  • the chemical structure of the compound is input to the computer in a known data format, for example.
  • a known data format examples include an SD (Structure Data) file format and a MOLfile format.
  • the splitting is preferably performed on the acyclic molecular chain or the point of attachment between the acyclic molecular chain and the ring structure in the compound.
  • the number of the divisions is preferably one or less for one acyclic molecular chain.
  • the compound is not particularly limited and may be appropriately selected depending on the intended purpose. Examples thereof include compounds having a molecular weight of 100 to 1,000.
  • an organic compound is mentioned, for example. There is no restriction
  • the chemical structure of the compound is divided into the plurality of partial structures by decomposing a group or bond registered as a decomposable group or bond.
  • the decomposable group or bond include a group or bond generated by a known synthesis method.
  • the group include an ether group, an ester group, a carbonyl group, an amino group, an amide group, a urea group, a urethane group, a thioether group, and a thioester group.
  • the bond include a carbon-carbon single bond.
  • the carbon-carbon single bond is, for example, a carbon-carbon single bond in which one or both carbon atoms are carbon atoms constituting an aromatic ring.
  • the aromatic ring include a benzene ring, a naphthalene ring, and an anthracene ring.
  • the group or bond generated in a known synthesis method is registered by registering the decomposable group or bond, and the division is performed by decomposing the group or bond registered as a decomposable group or bond. This increases the accuracy of the synthesis of the compound using the raw material hit by the search.
  • an alkylene group containing the carbon-carbon single bond may be deleted in the partial structure during the decomposition.
  • the method for extending the hydrocarbon chain is known as an organic synthesis reaction, even when the alkylene group containing the carbon-carbon single bond is deleted from the partial structure during decomposition, the search for the raw material in the disclosed technique is performed. In this respect, it is preferable that the possibility of increasing the number of candidates for the raw material substance is increased.
  • the group or the bond may be weighted.
  • the weighting is performed based on easiness of generation of the group or the bond, for example. Then, based on the weighting, the group or the bond to be decomposed may be limited in the division.
  • the creation of the search structure preferably includes a process of defining a split end portion in the partial structure as an arbitrary group that may be limited.
  • segmentation edge part is an edge part produced when the said chemical structure of the said compound is divided
  • the arbitrary group that may be limited examples include a group having a hetero atom.
  • the search structure can be obtained by bonding a group having the heteroatom to the partial structure via the heteroatom. That is, the arbitrary group which may be limited is, for example, an arbitrary group which may have a hetero atom as a linker to the partial structure.
  • the heteroatom is an atom other than carbon and hydrogen. Examples of the hetero atom include an oxygen atom, a nitrogen atom, a sulfur atom, and a halogen atom.
  • the arbitrary group which may be limited is preferably limited in the number of atoms or molecular weight. By doing so, the number of raw material hits can be adjusted.
  • the functional group containing the carbon atom in the search structure may be limited. It is preferable to include a process of converting to a group of to obtain a functional group conversion search structure. At that time, the functional group conversion search structure is added to a group of the search structures.
  • a methylene group etc. are mentioned, for example.
  • Examples of the functional group containing a carbon atom include a carbonyl group.
  • the methylene group in the functional group conversion search structure can usually be easily converted to a functional group containing the carbon atom. Therefore, by including the treatment, the raw material substances useful for the synthesis of the compound can be widely searched.
  • search structure there is usually one search structure for one partial structure, but when a group of the search structures includes the functional group conversion search structure, the search structure is one partial structure. There are several.
  • search structure creation process will be described using a structural formula.
  • a search structure is created from the following compound (A).
  • the compound (A) is divided. Specifically, the compound (A) is divided into two partial structures by decomposing an amide group which is a decomposable group in the compound (A). In this case, more specifically, the compound (A) is divided into two partial structures by deleting the NH group. Subsequently, a split end portion in the two partial structures is defined as an arbitrary group X. By doing so, a search structure (A-1) and a search structure (A-2) corresponding to each of the two partial structures are obtained.
  • the search structure (A-2) since the functional group containing a carbon atom adjacent to an arbitrary group X is a carbonyl group, the carbonyl group is converted into a methylene group, and the search structure (A-2) ') Get the functional group conversion search structure.
  • the search structure (A-1), the search structure (A-2), and the search structure (A-2 ′) are obtained as the search structure of the compound (A).
  • search structure creation process Next, another example of the search structure creation process will be described using structural formulas.
  • a search structure is created from the following compound (B).
  • the compound (B) is divided. Specifically, the compound (B) is divided into two partial structures by decomposing an amino group that is a decomposable group in the compound (B). Subsequently, a split end portion in the two partial structures is defined as an arbitrary group X. By doing so, a search structure (B-1) and a search structure (B-2) corresponding to each of the two partial structures are obtained. Through the above search structure creation step, the search structure (B-1) and the search structure (B-2) are obtained as the search structure of the compound (B).
  • search structure creation process Next, another example of the search structure creation process will be described using structural formulas.
  • a search structure is created from the following compound (C).
  • the compound (C) is divided. Specifically, the compound (C) is divided into two partial structures by decomposing a carbon-carbon single bond (* 1) which is a decomposable bond in the compound (C). Subsequently, a split end portion in the two partial structures is defined as an arbitrary group X. By doing so, a search structure (C-1) and a search structure (C-2) corresponding to each of the two partial structures are obtained. Through the above search structure creation step, the search structure (C-1) and the search structure (C-2) are obtained as the search structure of the compound (C).
  • the compound (C) may be divided into two partial structures by decomposing a carbon-carbon single bond (* 2) which is a decomposable bond in the compound (C).
  • Compound (C) is divided into two partial structures by decomposing a carbon-carbon single bond (* 2) which is a decomposable bond in compound (C).
  • a split end portion in the two partial structures is defined as an arbitrary group X.
  • a search structure (C-3) and a search structure (C-4) corresponding to each of the two partial structures are obtained.
  • the search structure (C-3) and the search structure (C-4) are obtained as the search structure of the compound (C).
  • search structure creation process Next, another example of the search structure creation process will be described using structural formulas.
  • a search structure is created from the following compound (D).
  • the compound (D) is divided. Specifically, the compound (D) is divided into two partial structures by decomposing a carbon-carbon single bond (* 1) which is a decomposable bond in the compound (D). At this time, the ethylene group adjacent to the carbon-carbon single bond (* 1) in one partial structure is deleted. Subsequently, a split end portion in the two partial structures is defined as an arbitrary group X. By doing so, a search structure (D-1) and a search structure (D-2) corresponding to each of the two partial structures are obtained. Through the above search structure creation process, the search structure (D-1) and the search structure (D-2) are obtained as the search structure of the compound (D).
  • the compound (D) may be divided into two partial structures by decomposing a carbon-carbon single bond (* 2) which is a decomposable bond in the compound (D).
  • Compound (D) is divided into two partial structures by decomposing a carbon-carbon single bond (* 2) which is a decomposable bond in compound (D).
  • the ethylene group adjacent to the carbon-carbon single bond (* 2) in one partial structure is deleted.
  • a split end portion in the two partial structures is defined as an arbitrary group X.
  • a search structure (D-3) and a search structure (D-4) corresponding to each of the two partial structures are obtained.
  • the search structure (D-3) and the search structure (D-4) are obtained as the search structure of the compound (D).
  • search structure creation process Next, another example of the search structure creation process will be described using structural formulas.
  • a search structure is created from the following compound (E).
  • the compound (E) is divided. Specifically, the compound (E) is divided into two partial structures by decomposing a carbon-carbon single bond (* 1) which is a decomposable bond in the compound (E). Subsequently, a split end portion in the two partial structures is defined as an arbitrary group X. By doing so, a search structure (E-1) and a search structure (E-2) corresponding to each of the two partial structures are obtained. Through the above search structure creation step, the search structure (E-1) and the search structure (E-2) are obtained as the search structure of the compound (E).
  • the source material search step is not particularly limited as long as it is a step of searching for a source material satisfying the search structure from a source material database, and can be appropriately selected according to the purpose.
  • the raw material database is not particularly limited as long as it is a database containing existing compounds, and can be appropriately selected according to the purpose, and may be a commercially available database or a database created. Also good.
  • the source material database may be a single database that integrates a plurality of databases, or may be a database group that includes a plurality of databases.
  • the data format of the source material in the source material database is not particularly limited and may be appropriately selected according to the purpose. Examples thereof include an SD (Structure Data) file format and a MOLfile format.
  • the search request algorithm for the raw material database is not particularly limited and can be appropriately selected according to the purpose.
  • the search request algorithm in the chemical structure search system having an existing database containing compounds It may be.
  • the search result display step is not particularly limited as long as it is a step of displaying a search result, and can be appropriately selected according to the purpose.
  • the search result is displayed on a display, for example.
  • the search result may be displayed, for example, by displaying the source material hit by the search.
  • the search structure or the partial structure corresponding to the source material hit by the search may be displayed in association with the source material hit by the search.
  • the listability of search results is enhanced.
  • a list of the search structure or the partial structure and a list of the raw material hit by the search are displayed, and at that time, the search structure or the partial structure,
  • the source material corresponding to the search structure or the partial structure may be displayed in association with each other. By doing so, the listability of the search results is further improved.
  • the display of the search result is preferably an indication of the possibility of synthesis of the compound from the viewpoint of easier determination of the possibility of synthesis of the compound.
  • the display of the search result is preferably a display indicating that there is a possibility of synthesizing the compound when all of the raw materials corresponding to each of the plurality of partial structures are obtained as a search result. By doing so, it can be easily estimated that there is a high possibility that the compound can be synthesized using all the starting materials as starting materials.
  • FIG. 1 is a flowchart showing an example of a method for searching a raw material of a compound in a very simple manner.
  • information on the chemical structure of the compound to be investigated is input to a computer.
  • the chemical structure of the compound input to the computer is divided into a plurality of partial structures, and a search structure corresponding to each of the plurality of partial structures is created.
  • the source material satisfying the search structure is searched from the source material database.
  • the search result is displayed.
  • an example of a method for searching for a raw material of a compound is performed.
  • FIG. 2 is a flowchart of another example of a method for searching for a raw material of a compound.
  • information on the chemical structure of the compound to be investigated is input to a computer.
  • the chemical structure of the compound input to the computer is divided into a plurality of partial structures.
  • a search structure corresponding to each of the plurality of partial structures is created.
  • the source material satisfying the search structure is searched from the source material database.
  • the hit raw material is displayed on the display.
  • the search for the raw material satisfying the search structure is resumed. If there is no unsearched search structure, the search is terminated.
  • an example of a method for searching for a raw material of a compound is performed.
  • FIG. 3 is a flowchart of another example of a method for searching for a raw material of a compound.
  • This example is an example of displaying whether or not composition is possible.
  • information on the chemical structure of the compound to be investigated is input to a computer.
  • the chemical structure of the compound input to the computer is divided into a plurality of partial structures.
  • a search structure corresponding to each of the plurality of partial structures is created.
  • the source material satisfying the search structure is searched from the source material database.
  • the hit raw material is listed.
  • the search for the raw material satisfying the search structure is resumed.
  • the hit raw material list determines whether or not the raw material corresponding to each of the partial structures is in the raw material database.
  • the hit raw material list if the raw material corresponding to each of the partial structures is in the raw material database, the fact that synthesis is possible is displayed on the display.
  • the synthesis is impossible. As described above, an example of a method for searching for a raw material of a compound is performed.
  • FIG. 4 is a flowchart of another example of a method for searching for a raw material of a compound.
  • This example is an example of displaying a list of hit source materials.
  • information on the chemical structure of the compound to be investigated is input to a computer.
  • the chemical structure of the compound input to the computer is divided into a plurality of partial structures.
  • a search structure corresponding to each of the plurality of partial structures is created.
  • the source material satisfying the search structure is searched from the source material database.
  • the hit raw material is listed.
  • the search for the raw material satisfying the search structure is resumed. If there is no unsearched search structure, the hit raw material list is displayed with reference to the hit raw material list.
  • an example of a method for searching for a raw material of a compound is performed.
  • FIG. 5 is a flowchart of another example of a method for searching for a raw material of a compound.
  • This example is an example in which division into partial structures is performed in a plurality of patterns.
  • information on the chemical structure of the compound to be investigated is input to a computer.
  • the chemical structure of the compound input to the computer is divided into a plurality of partial structures.
  • a search structure corresponding to each of the plurality of partial structures is created.
  • the source material satisfying the search structure is searched from the source material database. At this time, if there is a raw material hit in the search, the hit raw material is listed.
  • the search for the raw material satisfying the search structure is resumed. If there is no unsearched search structure, it is determined by referring to the hit raw material list whether or not the raw material corresponding to each of the partial structures is in the raw material database. With reference to the hit raw material list, if the raw material corresponding to each of the partial structures is in the raw material database, the fact that synthesis is possible is displayed on the display, and the search is terminated.
  • FIG. 6 is a flowchart of another example of a method for searching for a raw material of a compound.
  • This example is an example in which division into partial structures is performed in a plurality of patterns, and a plurality of lists of source materials can be displayed.
  • First, information on the chemical structure of the compound to be investigated is input to a computer. Subsequently, the chemical structure of the compound input to the computer is divided into a plurality of partial structures. Subsequently, a search structure corresponding to each of the plurality of partial structures is created. Subsequently, the source material satisfying the search structure is searched from the source material database. At this time, if there is a raw material hit in the search, the hit raw material is listed.
  • the search for the raw material satisfying the search structure is resumed. If there is no unsearched search structure, it is determined by referring to the hit raw material list whether or not the raw material corresponding to each of the partial structures is in the raw material database. With reference to the hit raw material list, if the raw material corresponding to each of the partial structures is in the raw material database, a list of hit raw materials is displayed. Further, if there is another division pattern as a pattern for dividing the chemical structure of the compound into partial structures, the chemical structure of the compound is divided using the division pattern. If there is no other division pattern, the search is terminated.
  • the disclosed program is a program for executing the disclosed method for searching a raw material of the compound.
  • the program can be created using various known programming languages according to the configuration of the computer system to be used and the type / version of the operating system.
  • the program may be recorded on a storage medium such as an internal hard disk or an external hard disk, a CD-ROM (Compact Disc Only Memory), a DVD-ROM (Digital Versatile Disk Read Only Memory), or an MO disk (You may record on storage media, such as Magneto-Optical disk and USB memory [USB (Universal Serial Bus) flash drive].
  • a storage medium such as a CD-ROM, DVD-ROM, MO disk, or USB memory
  • the program is directly stored on a hard disk or through a storage medium reader included in the computer system as needed. Can be installed and used.
  • the program is recorded in an external storage area (another computer or the like) that is accessible from the computer system through the information communication network, and if necessary, the program is directly stored in the external storage area through the information communication network, or It can also be installed and used on a hard disk.
  • an external storage area another computer or the like
  • the disclosed computer-readable recording medium records the disclosed program.
  • the computer-readable recording medium is not particularly limited and can be appropriately selected according to the purpose. For example, an internal hard disk, an external hard disk, a CD-ROM, a DVD-ROM, an MO disk, a USB memory, etc. Is mentioned.
  • the disclosed raw material search device for a compound includes at least a search structure creation unit, a search unit, and a display unit, and further includes other units as necessary.
  • the search structure creation unit divides the chemical structure of the compound input to the search device into a plurality of partial structures, and creates a search structure corresponding to each of the plurality of partial structures.
  • the search structure creation unit for example, a process of defining a split end portion in the partial structure generated when the chemical structure of the compound is divided into the plurality of partial structures as an arbitrary group that may be limited. Do. For example, when the search structure has a functional group containing a carbon atom adjacent to the arbitrary group, the search structure creating unit may limit the functional group containing the carbon atom in the search structure. Conversion to a good arbitrary group is performed to obtain a functional group conversion search structure. At this time, the functional group conversion search structure is added to a group of the search structures.
  • the search unit searches a source material satisfying the search structure from a source material database.
  • the display unit displays search results.
  • the display unit displays, for example, whether or not the compound can be synthesized.
  • the display unit displays, for example, that there is a possibility of synthesizing the compound when all of the raw materials corresponding to each of the plurality of partial structures are obtained as search results.
  • the compound raw material search device executes the disclosed raw material search method for the compound.
  • FIG. 7 shows a configuration example of the disclosed raw material search device for a compound.
  • the compound raw material search device 10 for example, a CPU 11, a memory 12, a storage unit 13, a display unit 14, an input unit 15, an output unit 16, an I / O interface unit 17, and the like are connected via a system bus 18. Composed.
  • a CPU (Central Processing Unit) 11 performs operations (four arithmetic operations, comparison operations, etc.), hardware and software operation control, and the like.
  • the CPU corresponds to the search structure creation unit and the search unit.
  • the memory 12 is a memory such as a RAM (Random Access Memory) and a ROM (Read Only Memory).
  • the RAM stores an OS (Operating System) and application programs read from the ROM and the storage unit 13, and functions as a main memory and work area of the CPU 11.
  • the storage unit 13 is a device that stores various programs and data, and is, for example, a hard disk.
  • the raw material database is stored in the storage unit 13.
  • the storage unit 13 further stores a program executed by the CPU 11, data necessary for program execution, an OS, and the like.
  • the program is stored in the storage unit 13, loaded into the RAM (main memory) of the memory 12, and executed by the CPU 11.
  • the display unit 14 is a display device, for example, a display device such as a CRT monitor or a liquid crystal panel.
  • the input unit 15 is an input device for various data, such as a keyboard and a pointing device (for example, a mouse).
  • the output unit 16 is an output device for various data, and is, for example, a printer.
  • the I / O interface unit 17 is an interface for connecting various external devices. For example, data input / output from a CD-ROM, DVD-ROM, MO disk, USB memory, etc. is made possible.
  • FIG. 8 shows another configuration example of the disclosed raw material search device for a compound.
  • the configuration example in FIG. 8 is a cloud-type configuration example, and the CPU 11 is independent of the storage unit 13 and the like.
  • a computer 30 that stores the storage unit 13 and the like and a computer 40 that stores the CPU 11 are connected via the network interface units 19 and 20.
  • the network interface units 19 and 20 are hardware that performs communication using the Internet.
  • FIG. 9 shows another configuration example of the disclosed raw material search device for a compound.
  • the configuration example of FIG. 9 is a cloud-type configuration example, and the storage unit 13 is independent of the CPU 11 and the like. In this configuration example, the CPU 11 and the like are stored via the network interface units 19 and 20.
  • Example 1 As the synthesis target compound (I), a compound represented by the following structural formula was selected.
  • the target compound (I) was divided into three partial structures using the amide bond amino group (NH) as a dividing point. Then, the following three search structures (1) to (3) were created by substituting an arbitrary group X for NH, which is a division point when dividing into three partial structures.
  • the arbitrary group X was limited to O—R 1 , N—R 2 R 3 , S—R 4 , or a halogen atom (where R 1 to R 4 represent an arbitrary group).
  • search structure (2) two functional group conversion search structures were prepared by converting a carbonyl group adjacent to an arbitrary group X into a methylene group. As a result, the following three search structures (2-1) to (2-3) were obtained.
  • the source material database is a database that records about 4 million compounds.
  • the target compound (I) can be synthesized because all of the raw material substances corresponding to each of the three partial structures exist in the raw material substance database.
  • Example 2 As a synthesis target compound (II), a compound represented by the following structural formula was selected.
  • the target compound (II) was divided into three partial structures using the amide bond amino group (NH) as a dividing point. Then, the following three search structures (4) to (6) were created by substituting an arbitrary group X for NH, which is a division point when dividing into three partial structures.
  • the arbitrary group X was limited to O—R 1 , N—R 2 R 3 , S—R 4 , or a halogen atom (where R 1 to R 4 represent an arbitrary group).
  • search structure (5) two functional group conversion search structures were prepared by converting a carbonyl group adjacent to an arbitrary group X into a methylene group. As a result, the following three search structures (5-1) to (5-3) were obtained.
  • the source material database is a database that records about 4 million compounds.
  • the target compound (II) is determined to be unsynthesizable because the source material corresponding to one of the three partial structures does not exist in the source material database.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

化合物の原料物質の探索方法であって、 コンピュータに入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する工程と、 原料物質データベースから、前記検索構造を満たす原料物質を検索する工程と、 検索結果を表示する工程と、 を含む化合物の原料物質の探索方法である。

Description

化合物の原料物質の探索方法、及び探索装置、並びにプログラム
 本件は、化合物の原料物質の探索方法、及び探索装置、並びに前記探索方法を実行するプログラムに関する。
 近年、薬候補分子を実験的に探索するのに要する膨大な費用と労力を削減するため、各種のコンピュータによるシミュレーションが行われている。薬候補分子の探索とは、標的疾患(ターゲットとする疾患)に関与する標的分子に対して強く相互作用する化合物(リガンド)を薬候補として探索することである。そこで、コンピュータによる標的分子立体構造に基づく化合物のスクリーニングが活発に行われている。
 特に利用されている方法として、例えば、構造ベース薬剤設計方法(Structure-Based Drug Design,SBDD)が挙げられる。この方法は、標的分子や受容体の立体構造情報に基づいた分子設計法である。
 コンピュータによるシミュレーションによって薬の候補として選び出された薬候補分子が、実際に合成が可能かどうかを予め知ること、及びその原料の入手しやすさを予め知ることは、その薬候補分子の薬効を確認するのに匹敵するくらい、重要である。なぜなら、シミュレーションにより薬効が強いと判定された薬候補分子を合成しようとしても、合成ができない場合や、原料を合成するために多くの時間を費やしてしまう場合には、その薬候補分子の実用性は非常に低いためである。
 既知の化合物に関するデータベースは、多くが提案されており、例えば、SciFinderなどの情報検索ツールが提供されている。また、化合物の検索を支援するシステムについても種々提案されている(例えば、特許文献1及び2参照)。
 しかし、既知化合物であるか、未知化合物であるかを問わず、化合物の合成の可否の判断を容易にする方法については知られていない。
特開2007-277188号公報 特開2007-323182号公報
 本件は、従来における前記諸問題を解決し、以下の目的を達成することを課題とする。即ち、本件は、化合物の合成の可否の判断を容易にする化合物の原料物質の探索方法、及び化合物の合成の可否の判断を容易にする化合物の原料物質の探索装置、並びに前記探索方法を実行するプログラムを提供することを目的とする。
 前記課題を解決するための手段としては、以下の通りである。即ち、
 開示の化合物の原料物質の探索方法は、
 コンピュータに入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する工程と、
 原料物質データベースから、前記検索構造を満たす原料物質を検索する工程と、
 検索結果を表示する工程と、
を含む。
 開示のプログラムは、
 コンピュータに化合物の原料物質を探索させるプログラムであって、
 前記コンピュータに、
 前記コンピュータに入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する工程と、
 原料物質データベースから、前記検索構造を満たす原料物質を検索する工程と、
 検索結果を表示する工程と、
 を実行させる。
 開示の化合物の原料物質の探索装置は、
 前記探索装置に入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する検索構造作成部と、
 原料物質データベースから、前記検索構造を満たす原料物質を検索する検索部と、
 検索結果を表示する表示部と、
を有する。
 開示の化合物の原料物質の探索方法によれば、化合物の合成の可否の判断が容易になる。
 開示のプログラムによれば、化合物の合成の可否の判断が容易になる。
 開示の化合物の原料物質の探索装置によれば、化合物の合成の可否の判断が容易になる。
図1は、開示の化合物の原料物質の探索方法の一例のフローチャートである。 図2は、開示の化合物の原料物質の探索方法の他の一例のフローチャートである。 図3は、開示の化合物の原料物質の探索方法の他の一例のフローチャートである。 図4は、開示の化合物の原料物質の探索方法の他の一例のフローチャートである。 図5は、開示の化合物の原料物質の探索方法の他の一例のフローチャートである。 図6は、開示の化合物の原料物質の探索方法の他の一例のフローチャートである。 図7は、開示の化合物の原料物質の探索装置の構成例である。 図8は、開示の化合物の原料物質の探索装置の他の構成例である。 図9は、開示の化合物の原料物質の探索装置の他の構成例である。
 創薬とは、医薬品の設計するプロセスを指す。前記創薬は、例えば、以下のような順で行われる。
(1)標的分子の探索
(2)リード化合物等の探索
(3)生理作用の確認
(4)安全性・毒性試験の確認
 リード化合物等(リード化合物及びそれから派生する化合物)の探索においては、多数の薬候補分子の各々と、標的分子との相互作用を精度よく評価することが重要である。
 コンピュータを用いて医薬品を設計するプロセスは、創薬全般において利用可能である。その中でも、リード化合物等の探索に利用することは、新薬開発の期間短縮及び成功確率を高める上で有用である。
 開示の技術は、例えば、高い薬理活性が期待されるリード化合物等の探索に利用できる。
 また、開示の技術は、創薬に関わらず、化合物の合成の可否の判断の参考として利用できる。ここでの化合物は、既知化合物であるか、未知化合物であるかを問わない。
(化合物の原料物質の探索方法)
 開示の化合物の原料物質の探索方法は、検索構造作成工程と、原料物質検索工程と、検索結果表示工程とを少なくとも含み、更に必要に応じて、その他の工程を含む。
<検索構造作成工程>
 前記検索構造作成工程としては、コンピュータに入力された化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する工程であれば、特に制限はなく、目的に応じて適宜選択することができる。
 前記化合物の前記化学構造は、例えば、公知のデータ形式で前記コンピュータに入力される。
 前記公知のデータ形式としては、例えば、SD(Structure Data)ファイル形式、MOLfile形式などが挙げられる。
 前記分割は、前記化合物における、非環式の分子鎖、又は非環式の分子鎖と環構造との結合点に対して行われることが好ましい。
 前記分割は、一つの非環式の分子鎖に対して、一つ以下であることが好ましい。
 前記化合物としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、分子量が100~1,000の化合物などが挙げられる。
 また、前記化合物としては、例えば、有機化合物が挙げられる。
 前記有機化合物としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、芳香環含有化合物、ヘテロ原子含有化合物などが挙げられる。
 前記化合物の前記化学構造の前記複数の部分構造への分割は、分解可能な基又は結合として登録された基又は結合を分解することにより行われることが好ましい。
 前記分解可能な基又は結合としては、例えば、公知の合成法において生成される基又は結合が挙げられる。
 前記基としては、例えば、エーテル基、エステル基、カルボニル基、アミノ基、アミド基、ウレア基、ウレタン基、チオエーテル基、チオエステル基などが挙げられる。
 前記結合としては、例えば、炭素-炭素単結合などが挙げられる。前記炭素-炭素単結合は、例えば、片方又は両方の炭素原子が芳香環を構成する炭素原子である炭素-炭素単結合である。前記芳香環としては、例えば、ベンゼン環、ナフタレン環、アントラセン環などが挙げられる。
 公知の合成法において生成される基又は結合を、前記分解可能な基又は結合を登録しておき、前記分割が、分解可能な基又は結合として登録された基又は結合を分解することにより行われることにより、検索によりヒットした原料物質を用いた前記化合物の合成の確度が高くなる。
 前記分割が、前記分解可能な結合としての炭素-炭素単結合を分解することにより行われる場合には、分解に際して、前記部分構造において、前記炭素-炭素単結合を含むアルキレン基を削除してもよい。炭化水素鎖を延長させる方法は、有機合成反応として公知であるため、分解に際して、前記部分構造において、前記炭素-炭素単結合を含むアルキレン基を削除しても、開示の技術における原料物質の探索の点において問題となることはないどころか、原料物質の候補が増える可能性の方が高くなる点で、好適である。
 前記基又は前記結合は、重み付けされていてもよい。前記重み付けは、例えば、前記基又は前記結合の生成の容易性に基づいて行われる。そして、前記重み付けに基づいて、前記分割に際して、前記分解される前記基又は前記結合を限定してもよい。
 前記検索構造の作成は、前記部分構造における分割端部を、限定されていてもよい任意の基として定義する処理を含むことが好ましい。
 前記分割端部とは、前記化合物の前記化学構造を前記複数の部分構造に分割した際に生じる端部である。
 前記限定されていてもよい任意の基としては、例えば、ヘテロ原子を有する基が挙げられる。
 例えば、前記部分構造に、前記ヘテロ原子を有する基を、前記ヘテロ原子を介して結合させることにより、前記検索構造が得られる。
 即ち、前記限定されていてもよい任意の基は、例えば、前記部分構造へのリンカーとしてのヘテロ原子を有する限定されていてもよい任意の基である。
 前記ヘテロ原子とは、炭素、水素以外の原子である。前記ヘテロ原子としては、例えば、酸素原子、窒素原子、硫黄原子、ハロゲン原子などが挙げられる。
 前記限定されていてもよい任意の基は、原子数又は分子量が限定されていることが好ましい。そうすることにより、ヒットする原料物質の数を調整することができる。
 前記検索構造作成工程は、前記検索構造が、前記任意の基に隣接する炭素原子を含む官能基を有するときに、前記検索構造における前記炭素原子を含む官能基を、限定されていてもよい任意の基に変換し、官能基変換検索構造を得る処理を含むことが好ましい。その際には、前記検索構造の一群に、前記官能基変換検索構造が加えられる。
 前記限定されていてもよい任意の基としては、例えば、メチレン基などが挙げられる。
 前記炭素原子を含む官能基としては、例えば、カルボニル基などが挙げられる。前記官能基変換検索構造における前記メチレン基は、通常、容易に前記炭素原子を含む官能基に変換できる。そのため、前記処理を含むことで、前記化合物の合成に有用な前記原料物質を広く探索することができる。
 即ち、検索構造は、1つの部分構造に対して、通常、一つであるが、前記検索構造の一群が、前記官能基変換検索構造を含む場合には、検索構造は、1つの部分構造に対して複数存在する。
 ここで、検索構造作成工程の一例を構造式を用いて説明する。
 この一例では、下記化合物(A)から、検索構造を作成する。
Figure JPOXMLDOC01-appb-C000001
 まず、化合物(A)を分割する。具体的には、化合物(A)における分解可能な基であるアミド基を分解することにより化合物(A)を2つの部分構造に分割する。この際、更に具体的には、NH基を削除することにより、化合物(A)を2つの部分構造に分割する。
 続いて、2つの部分構造における分割端部を、任意の基Xとして定義する。そうすることにより、2つの部分構造の各々に対応した検索構造(A-1)及び検索構造(A-2)が得られる。
 更に、検索構造(A-2)は、任意の基Xに隣接する、炭素原子を含む官能基が、カルボニル基であるので、このカルボニル基を、メチレン基に変換し、検索構造(A-2’)(官能基変換検索構造)を得る。
 以上の検索構造作成工程により、化合物(A)の検索構造として、検索構造(A-1)、検索構造(A-2)、及び検索構造(A-2’)が得られる。
 続いて、検索構造作成工程の他の一例を構造式を用いて説明する。
 この一例では、下記化合物(B)から、検索構造を作成する。
Figure JPOXMLDOC01-appb-C000002
 まず、化合物(B)を分割する。具体的には、化合物(B)における分解可能な基であるアミノ基を分解することにより化合物(B)を2つの部分構造に分割する。
 続いて、2つの部分構造における分割端部を、任意の基Xとして定義する。そうすることにより、2つの部分構造の各々に対応した検索構造(B-1)及び検索構造(B-2)が得られる。
 以上の検索構造作成工程により、化合物(B)の検索構造として、検索構造(B-1)、及び検索構造(B-2)が得られる。
 続いて、検索構造作成工程の他の一例を構造式を用いて説明する。
 この一例では、下記化合物(C)から、検索構造を作成する。
Figure JPOXMLDOC01-appb-C000003
 まず、化合物(C)を分割する。具体的には、化合物(C)における分解可能な結合である炭素-炭素単結合(*1)を分解することにより化合物(C)を2つの部分構造に分割する。
 続いて、2つの部分構造における分割端部を、任意の基Xとして定義する。そうすることにより、2つの部分構造の各々に対応した検索構造(C-1)及び検索構造(C-2)が得られる。
 以上の検索構造作成工程により、化合物(C)の検索構造として、検索構造(C-1)、及び検索構造(C-2)が得られる。
 他方、化合物(C)における分解可能な結合である炭素-炭素単結合(*2)を分解することにより化合物(C)を2つの部分構造に分割してもよい。その場合について以下に示す。
 化合物(C)における分解可能な結合である炭素-炭素単結合(*2)を分解することにより化合物(C)を2つの部分構造に分割する。
 続いて、2つの部分構造における分割端部を、任意の基Xとして定義する。そうすることにより、2つの部分構造の各々に対応した検索構造(C-3)及び検索構造(C-4)が得られる。
 以上の検索構造作成工程により、化合物(C)の検索構造として、検索構造(C-3)、及び検索構造(C-4)が得られる。
 続いて、検索構造作成工程の他の一例を構造式を用いて説明する。
 この一例では、下記化合物(D)から、検索構造を作成する。
Figure JPOXMLDOC01-appb-C000004
 まず、化合物(D)を分割する。具体的には、化合物(D)における分解可能な結合である炭素-炭素単結合(*1)を分解することにより化合物(D)を2つの部分構造に分割する。この際、1つの部分構造において炭素-炭素単結合(*1)に隣接するエチレン基を削除する。
 続いて、2つの部分構造における分割端部を、任意の基Xとして定義する。そうすることにより、2つの部分構造の各々に対応した検索構造(D-1)及び検索構造(D-2)が得られる。
 以上の検索構造作成工程により、化合物(D)の検索構造として、検索構造(D-1)、及び検索構造(D-2)が得られる。
 他方、化合物(D)における分解可能な結合である炭素-炭素単結合(*2)を分解することにより化合物(D)を2つの部分構造に分割してもよい。その場合について以下に示す。
 化合物(D)における分解可能な結合である炭素-炭素単結合(*2)を分解することにより化合物(D)を2つの部分構造に分割する。この際、1つの部分構造において炭素-炭素単結合(*2)に隣接するエチレン基を削除する。
 続いて、2つの部分構造における分割端部を、任意の基Xとして定義する。そうすることにより、2つの部分構造の各々に対応した検索構造(D-3)及び検索構造(D-4)が得られる。
 以上の検索構造作成工程により、化合物(D)の検索構造として、検索構造(D-3)、及び検索構造(D-4)が得られる。
 続いて、検索構造作成工程の他の一例を構造式を用いて説明する。
 この一例では、下記化合物(E)から、検索構造を作成する。
Figure JPOXMLDOC01-appb-C000005
 まず、化合物(E)を分割する。具体的には、化合物(E)における分解可能な結合である炭素-炭素単結合(*1)を分解することにより化合物(E)を2つの部分構造に分割する。
 続いて、2つの部分構造における分割端部を、任意の基Xとして定義する。そうすることにより、2つの部分構造の各々に対応した検索構造(E-1)及び検索構造(E-2)が得られる。
 以上の検索構造作成工程により、化合物(E)の検索構造として、検索構造(E-1)、及び検索構造(E-2)が得られる。
<原料物質検索工程>
 前記原料物質検索工程としては、原料物質データベースから、前記検索構造を満たす原料物質を検索する工程であれば、特に制限はなく、目的に応じて適宜選択することができる。
 前記原料物質データベースとしては、既存の化合物を収録したデータベースであれば、特に制限はなく、目的に応じて適宜選択することができ、市販のデータベースであってもよいし、作成したデータベースであってもよい。
 また、前記原料物質データベースは、複数のデータベースを統合した1つのデータベースであってもよいし、複数のデータベースを備えたデータベース群であってもよい。
 前記原料物質データベースにおける前記原料物質のデータ形式としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、SD(Structure Data)ファイル形式、MOLfile形式などが挙げられる。
 前記原料物質データベースに対する検索要求のアルゴリズムとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、化合物を収録する既存のデータベースを備える化学構造検索システムにおける検索要求のアルゴリズムと同じであってもよい。
<検索結果表示工程>
 前記検索結果表示工程としては、検索結果を表示する工程であれば、特に制限はなく、目的に応じて適宜選択することができる。
 前記検索結果は、例えば、ディスプレイに表示される。
 前記検索結果の表示は、例えば、検索によりヒットした前記原料物質を表示することにより行われてもよい。その際、検索によりヒットした前記原料物質に対応する前記検索構造又は前記部分構造を、検索によりヒットした前記原料物質と対応付けて表示してもよい。そうすることにより、検索結果の一覧性が高くなる。
 また、前記検索結果の表示においては、例えば、前記検索構造又は前記部分構造の一覧と、検索によりヒットした前記原料物質の一覧とを表示し、その際に、前記検索構造又は前記部分構造と、前記検索構造又は前記部分構造に対応する前記原料物質とを対応付けて表示してもよい。そうすることにより、検索結果の一覧性がより高くなる。
 前記検索結果の表示は、前記化合物の合成の可能性の可否の表示であることが、化合物の合成の可否の判断がより容易になる点で、好ましい。
 前記検索結果の表示は、前記複数の部分構造の各々に対応する前記原料物質の全てが検索結果として得られた際に、前記化合物の合成の可能性があるとする表示であることが好ましい。そうすることにより、全ての前記原料物質を出発物質として、前記化合物が合成できる可能性が高いことが容易に推定できる。
 ここで、化合物の原料物質の探索方法の一例のフローチャートを用いて説明する。
 図1は、化合物の原料物質の探索方法の一例をごく簡単に表したフローチャートである。
 まず、調査対象の化合物の化学構造の情報をコンピュータに入力する。
 続いて、コンピュータに入力された化合物の化学構造を複数の部分構造に分割し、複数の部分構造の各々に対応した検索構造を作成する。
 続いて、原料物質データベースから、検索構造を満たす原料物質を検索する。
 続いて、検索結果を表示する。
 以上により、化合物の原料物質の探索方法の一例が行われる。
 図2は、化合物の原料物質の探索方法の他の一例のフローチャートである。
 まず、調査対象の化合物の化学構造の情報をコンピュータに入力する。
 続いて、コンピュータに入力された化合物の化学構造を複数の部分構造に分割する。
 続いて、複数の部分構造の各々に対応した検索構造を作成する。
 続いて、原料物質データベースから、検索構造を満たす原料物質を検索する。
 この際に、検索にヒットする原料物質がある場合には、ヒットした原料物質をディスプレイに表示する。
 続いて、未検索の検索構造がある場合には、その検索構造を満たす原料物質の検索を再開する。未検索の検索構造がない場合には、探索を終了する。
 以上により、化合物の原料物質の探索方法の一例が行われる。
 図3は、化合物の原料物質の探索方法の他の一例のフローチャートである。
 この一例は、合成の可否を表示する一例である。
 まず、調査対象の化合物の化学構造の情報をコンピュータに入力する。
 続いて、コンピュータに入力された化合物の化学構造を複数の部分構造に分割する。
 続いて、複数の部分構造の各々に対応した検索構造を作成する。
 続いて、原料物質データベースから、検索構造を満たす原料物質を検索する。
 この際に、検索にヒットする原料物質がある場合には、ヒットした原料物質をリスト化する。
 続いて、未検索の検索構造がある場合には、その検索構造を満たす原料物質の検索を再開する。
 未検索の検索構造がない場合には、全ての部分構造の各々に対応する原料物質が原料物質データベースにあるかどうかを、ヒット原料物質リストを参照して判断する。
 ヒット原料物質リストを参照し、全ての部分構造の各々に対応する原料物質が原料物質データベースにある場合には、合成が可能であることをディスプレイに表示する。
 他方、全ての部分構造の各々に対応する原料物質がない、即ち、少なくとも1つの部分構造に対応する原料物質が原料物質データベースにない場合には、合成が不能であることをディスプレイに表示する。
 以上により、化合物の原料物質の探索方法の一例が行われる。
 図4は、化合物の原料物質の探索方法の他の一例のフローチャートである。
 この一例は、ヒットした原料物質の一覧を表示する一例である。
 まず、調査対象の化合物の化学構造の情報をコンピュータに入力する。
 続いて、コンピュータに入力された化合物の化学構造を複数の部分構造に分割する。
 続いて、複数の部分構造の各々に対応した検索構造を作成する。
 続いて、原料物質データベースから、検索構造を満たす原料物質を検索する。
 この際に、検索にヒットする原料物質がある場合には、ヒットした原料物質をリスト化する。
 続いて、未検索の検索構造がある場合には、その検索構造を満たす原料物質の検索を再開する。
 未検索の検索構造がない場合には、ヒット原料物質リストを参照して、ヒット原料物質の一覧を表示する。
 以上により、化合物の原料物質の探索方法の一例が行われる。
 図5は、化合物の原料物質の探索方法の他の一例のフローチャートである。
 この一例は、部分構造への分割を複数のパターンで行う一例である。
 まず、調査対象の化合物の化学構造の情報をコンピュータに入力する。
 続いて、コンピュータに入力された化合物の化学構造を複数の部分構造に分割する。
 続いて、複数の部分構造の各々に対応した検索構造を作成する。
 続いて、原料物質データベースから、検索構造を満たす原料物質を検索する。
 この際に、検索にヒットする原料物質がある場合には、ヒットした原料物質をリスト化する。
 続いて、未検索の検索構造がある場合には、その検索構造を満たす原料物質の検索を再開する。
 未検索の検索構造がない場合には、全ての部分構造の各々に対応する原料物質が原料物質データベースにあるかどうかを、ヒット原料物質リストを参照して判断する。
 ヒット原料物質リストを参照し、全ての部分構造の各々に対応する原料物質が原料物質データベースにある場合には、合成が可能であることをディスプレイに表示し、探索を終了する。
 他方、全ての部分構造の各々に対応する原料物質がない、即ち、少なくとも1つの部分構造に対応する原料物質が原料物質データベースにない場合に、化合物の化学構造を部分構造に分割する際のパターンとして他の分割パターンがあれば、その分割パターンで化合物の化学構造の分割を行う。他方、他の分割パターンがなければ、合成が不能であることをディスプレイに表示し、探索を終了する。
 以上により、化合物の原料物質の探索方法の一例が行われる。
 図6は、化合物の原料物質の探索方法の他の一例のフローチャートである。
 この一例は、部分構造への分割を複数のパターンで行う一例であって、原料物質の複数の一覧を表示可能な一例である。
 まず、調査対象の化合物の化学構造の情報をコンピュータに入力する。
 続いて、コンピュータに入力された化合物の化学構造を複数の部分構造に分割する。
 続いて、複数の部分構造の各々に対応した検索構造を作成する。
 続いて、原料物質データベースから、検索構造を満たす原料物質を検索する。
 この際に、検索にヒットする原料物質がある場合には、ヒットした原料物質をリスト化する。
 続いて、未検索の検索構造がある場合には、その検索構造を満たす原料物質の検索を再開する。
 未検索の検索構造がない場合には、全ての部分構造の各々に対応する原料物質が原料物質データベースにあるかどうかを、ヒット原料物質リストを参照して判断する。
 ヒット原料物質リストを参照し、全ての部分構造の各々に対応する原料物質が原料物質データベースにある場合には、ヒット原料物質の一覧を表示する。更に、化合物の化学構造を部分構造に分割する際のパターンとして他の分割パターンがあれば、その分割パターンで化合物の化学構造の分割を行う。他の分割パターンがなければ、探索を終了する。
 他方、全ての部分構造の各々に対応する原料物質がない、即ち、少なくとも1つの部分構造に対応する原料物質が原料物質データベースにない場合に、化合物の化学構造を部分構造に分割する際のパターンとして他の分割パターンがあれば、その分割パターンで化合物の化学構造の分割を行う。他方、他の分割パターンがなければ、合成が不能であることをディスプレイに表示し、探索を終了する。
 以上により、化合物の原料物質の探索方法の一例が行われる。
(プログラム)
 開示のプログラムは、開示の前記化合物の原料物質の探索方法を実行するプログラムである。
 前記プログラムは、使用するコンピュータシステムの構成及びオペレーティングシステムの種類・バージョンなどに応じて、公知の各種のプログラム言語を用いて作成することができる。
 前記プログラムは、内蔵ハードディスク、外付けハードディスクなどの記憶媒体に記録しておいてもよいし、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、MOディスク(Magneto-Optical disk)、USBメモリ〔USB(Universal Serial Bus) flash drive〕などの記憶媒体に記録しておいてもよい。前記プログラムをCD-ROM、DVD-ROM、MOディスク、USBメモリなどの記憶媒体に記録する場合には、必要に応じて随時、コンピュータシステムが有する記憶媒体読取装置を通じて、これを直接、又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータ等)に前記プログラムを記録しておき、必要に応じて随時、前記外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することもできる。
(コンピュータが読み取り可能な記録媒体)
 開示のコンピュータが読み取り可能な記録媒体は、開示の前記プログラムを記録してなる。
 前記コンピュータが読み取り可能な記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD-ROM、DVD-ROM、MOディスク、USBメモリなどが挙げられる。
(化合物の原料物質の探索装置)
 開示の化合物の原料物質の探索装置は、検索構造作成部と、検索部と、表示部とを少なくとも有し、更に必要に応じて、その他の部を有する。
 前記検索構造作成部では、前記探索装置に入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する。
 前記検索構造作成部は、例えば、前記化合物の前記化学構造を前記複数の部分構造に分割した際に生じる前記部分構造における分割端部を、限定されていてもよい任意の基として定義する処理を行う。
 前記検索構造作成部は、例えば、前記検索構造が、前記任意の基に隣接する炭素原子を含む官能基を有するときに、前記検索構造における前記炭素原子を含む官能基を、限定されていてもよい任意の基に変換し、官能基変換検索構造を得る処理を行う。この際に、前記検索構造の一群に、前記官能基変換検索構造が加えられる。
 前記検索部は、原料物質データベースから、前記検索構造を満たす原料物質を検索する。
 前記表示部は、検索結果を表示する。
 前記表示部は、例えば、前記化合物の合成の可能性の可否を表示する。
 前記表示部は、例えば、前記複数の部分構造の各々に対応する前記原料物質の全てが検索結果として得られた際に、前記化合物の合成の可能性があることを表示する。
 前記化合物の原料物質の探索装置は、開示の前記化合物の原料物質の探索方法を実行する。
 図7に、開示の化合物の原料物質の探索装置の構成例を示す。
 化合物の原料物質の探索装置10は、例えば、CPU11、メモリ12、記憶部13、表示部14、入力部15、出力部16、I/Oインターフェース部17等がシステムバス18を介して接続されて構成される。
 CPU(Central Processing Unit)11は、演算(四則演算、比較演算等)、ハードウエア及びソフトウエアの動作制御などを行う。例えば、CPUが、前記検索構造作成部、及び前記検索部に対応する。
 メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)などのメモリである。前記RAMは、前記ROM及び記憶部13から読み出されたOS(Operating System)及びアプリケーションプログラムなどを記憶し、CPU11の主メモリ及びワークエリアとして機能する。
 記憶部13は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。例えば、前記原料物質データベースは、記憶部13に格納される。記憶部13には、更にCPU11が実行するプログラム、プログラム実行に必要なデータ、OSなどが格納される。
 前記プログラムは、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、CPU11により実行される。
 表示部14は、表示装置であり、例えば、CRTモニタ、液晶パネル等のディスプレイ装置である。
 入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
 出力部16は、各種データの出力装置であり、例えば、プリンタである。
 I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。例えば、CD-ROM、DVD-ROM、MOディスク、USBメモリなどのデータの入出力を可能にする。
 図8に、開示の化合物の原料物質の探索装置の他の構成例を示す。
 図8の構成例は、クラウド型の構成例であり、CPU11が、記憶部13等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、記憶部13等を格納するコンピュータ30と、CPU11を格納するコンピュータ40とが接続される。
 ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
 図9に、開示の化合物の原料物質の探索装置の他の構成例を示す。
 図9の構成例は、クラウド型の構成例であり、記憶部13が、CPU11等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、CPU11等を格納する。
 以下、開示の技術について説明するが、開示の技術は下記実施例に何ら限定されるものではない。
(実施例1)
 合成のターゲット化合物(I)として、下記構造式で表される化合物を選択した。
Figure JPOXMLDOC01-appb-C000006
 上記ターゲット化合物(I)について、アミド結合のアミノ基(NH)を分割点として、3つの部分構造に分割した。そして、3つの部分構造に分割した際の分割点であるNHを、任意の基Xに置き換えて、下記の3つの検索構造(1)~(3)を作成した。ここでは、任意の基Xは、O-R、N-R、S-R、又はハロゲン原子(ただし、R~Rは任意の基を表す。)に限定した。
Figure JPOXMLDOC01-appb-C000007
 さらに、検索構造(2)については、任意の基Xに隣接するカルボニル基をメチレン基に変換することで、2つの官能基変換検索構造を作製した。その結果、以下の3つの検索構造(2-1)~(2-3)を得た。
Figure JPOXMLDOC01-appb-C000008
 次に、原料物質データベース(市販化合物データベース)から、得られた検索構造(1)、(2-1)、(2-2)、(2-3)、及び(3)を満たす化合物を検索した。検索は、MOLfile形式を用いて行った。なお、原料物質データベースは、約400万件の化合物を収録するデータベースである。
 その結果、検索構造(1)に対して、回答として以下の5つの原料物質を得た。
Figure JPOXMLDOC01-appb-C000009
 また、検索構造(2-1)に対して、回答として以下の原料物質を得た。
Figure JPOXMLDOC01-appb-C000010
 また、検索構造(3)に対して、回答として以下の原料物質を得た。
Figure JPOXMLDOC01-appb-C000011
 なお、検索構造(2-2)、及び(2-3)に対しては、回答となる原料物質が得られなかった。
 以上より、ターゲット化合物(I)は、3つの部分構造の各々に対応する原料物質の全てが原料物質データベースに存在していることから、合成可能であると判定される。
(実施例2)
 合成のターゲット化合物(II)として、下記構造式で表される化合物を選択した。
Figure JPOXMLDOC01-appb-C000012
 上記ターゲット化合物(II)について、アミド結合のアミノ基(NH)を分割点として、3つの部分構造に分割した。そして、3つの部分構造に分割した際の分割点であるNHを、任意の基Xに置き換えて、下記の3つの検索構造(4)~(6)を作成した。ここでは、任意の基Xは、O-R、N-R、S-R、又はハロゲン原子(ただし、R~Rは任意の基を表す。)に限定した。
Figure JPOXMLDOC01-appb-C000013
 さらに、検索構造(5)については、任意の基Xに隣接するカルボニル基をメチレン基に変換することで、2つの官能基変換検索構造を作製した。その結果、以下の3つの検索構造(5-1)~(5-3)を得た。
Figure JPOXMLDOC01-appb-C000014
 次に、原料物質データベース(市販化合物データベース)から、得られた検索構造(4)、(5-1)、(5-2)、(5-3)、及び(6)を満たす化合物を検索した。検索は、MOLfile形式を用いて行った。なお、原料物質データベースは、約400万件の化合物を収録するデータベースである。
 その結果、検索構造(4)に対して、回答として以下の5つの原料物質を得た。
Figure JPOXMLDOC01-appb-C000015
 また、検索構造(5-1)に対して、回答として以下の原料物質を得た。
Figure JPOXMLDOC01-appb-C000016
 また、検索構造(6)に対しては、回答となる原料物質が得られなかった。
 なお、検索構造(5-2)、及び(5-3)に対しても、回答となる原料物質が得られなかった。
 以上より、ターゲット化合物(II)については、3つの部分構造のうち、1つの部分構造に対応する原料物質が原料物質データベースに存在していないことから、合成不可能であると判定される。
 10  化合物の原料物質の探索装置
 11  CPU
 12  メモリ
 13  記憶部
 14  表示部
 15  入力部
 16  出力部
 17  I/Oインターフェース部
 18  システムバス
 19  ネットワークインターフェース部
 20  ネットワークインターフェース部
 30  コンピュータ
 40  コンピュータ

 

Claims (18)

  1.  化合物の原料物質の探索方法であって、
     コンピュータに入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する工程と、
     原料物質データベースから、前記検索構造を満たす原料物質を検索する工程と、
     検索結果を表示する工程と、
    を含むことを特徴とする化合物の原料物質の探索方法。
  2.  前記化合物の前記化学構造の前記複数の部分構造への分割が、分解可能な基又は結合として登録された基又は結合を分解することにより行われる請求項1に記載の化合物の原料物質の探索方法。
  3.  前記検索構造の作成が、前記化合物の前記化学構造を前記複数の部分構造に分割した際に生じる前記部分構造における分割端部を、限定されていてもよい任意の基として定義する処理を含む請求項1から2のいずれかに記載の化合物の原料物質の探索方法。
  4.  前記検索構造が、前記任意の基に隣接する炭素原子を含む官能基を有するときに、前記検索構造における前記炭素原子を含む官能基を、限定されていてもよい任意の基に変換し、官能基変換検索構造を得る処理を含み、
     前記検索構造の一群に、前記官能基変換検索構造が加えられる、
     請求項3に記載の化合物の原料物質の探索方法。
  5.  前記検索結果の表示が、前記化合物の合成の可能性の可否の表示である請求項1から4のいずれかに記載の化合物の原料物質の探索方法。
  6.  前記検索結果の表示が、前記複数の部分構造の各々に対応する前記原料物質の全てが検索結果として得られた際に、前記化合物の合成の可能性があるとする表示である請求項1から5のいずれかに記載の化合物の原料物質の探索方法。
  7.  コンピュータに化合物の原料物質を探索させるプログラムであって、
     前記コンピュータに、
     前記コンピュータに入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する工程と、
     原料物質データベースから、前記検索構造を満たす原料物質を検索する工程と、
     検索結果を表示する工程と、
     を実行させることを特徴とするプログラム。
  8.  前記化合物の前記化学構造の前記複数の部分構造への分割が、分解可能な基又は結合として登録された基又は結合を分解することにより行われる請求項7に記載のプログラム。
  9.  前記検索構造の作成が、前記化合物の前記化学構造を前記複数の部分構造に分割した際に生じる前記部分構造における分割端部を、限定されていてもよい任意の基として定義する処理を含む請求項7から8のいずれかに記載のプログラム。
  10.  前記検索構造が、前記任意の基に隣接する炭素原子を含む官能基を有するときに、前記検索構造における前記炭素原子を含む官能基を、限定されていてもよい任意の基に変換し、官能基変換検索構造を得る処理を含み、
     前記検索構造の一群に、前記官能基変換検索構造が加えられる、
     請求項9に記載のプログラム。
  11.  前記検索結果の表示が、前記化合物の合成の可能性の可否の表示である請求項7から10のいずれかに記載のプログラム。
  12.  前記検索結果の表示が、前記複数の部分構造の各々に対応する前記原料物質の全てが検索結果として得られた際に、前記化合物の合成の可能性があるとする表示である請求項7から11のいずれかに記載のプログラム。
  13.  化合物の原料物質の探索装置であって、
     前記探索装置に入力された前記化合物の化学構造を複数の部分構造に分割し、前記複数の部分構造の各々に対応した検索構造を作成する検索構造作成部と、
     原料物質データベースから、前記検索構造を満たす原料物質を検索する検索部と、
     検索結果を表示する表示部と、
    を有することを特徴とする化合物の原料物質の探索装置。
  14.  前記化合物の前記化学構造の前記複数の部分構造への分割が、分解可能な基又は結合として登録された基又は結合を分解することにより行われる請求項13に記載の化合物の原料物質の探索装置。
  15.  前記検索構造作成部が、前記化合物の前記化学構造を前記複数の部分構造に分割した際に生じる前記部分構造における分割端部を、限定されていてもよい任意の基として定義する処理を、行う請求項13から14のいずれかに記載の化合物の原料物質の探索装置。
  16.  前記検索構造作成部が、前記検索構造が前記任意の基に隣接する炭素原子を含む官能基を有するときに、前記検索構造における前記炭素原子を含む官能基を、限定されていてもよい任意の基に変換し、官能基変換検索構造を得る処理を、行い、
     前記検索構造の一群に、前記官能基変換検索構造が加えられる、
     請求項15に記載の化合物の原料物質の探索装置。
  17.  前記表示部が、前記化合物の合成の可能性の可否を表示する請求項13から16のいずれかに記載の化合物の原料物質の探索装置。
  18.  前記表示部が、前記複数の部分構造の各々に対応する前記原料物質の全てが検索結果として得られた際に、前記化合物の合成の可能性があることを表示する請求項13から17のいずれかに記載の化合物の原料物質の探索装置。
PCT/JP2017/008348 2017-03-02 2017-03-02 化合物の原料物質の探索方法、及び探索装置、並びにプログラム WO2018158916A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/008348 WO2018158916A1 (ja) 2017-03-02 2017-03-02 化合物の原料物質の探索方法、及び探索装置、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/008348 WO2018158916A1 (ja) 2017-03-02 2017-03-02 化合物の原料物質の探索方法、及び探索装置、並びにプログラム

Publications (1)

Publication Number Publication Date
WO2018158916A1 true WO2018158916A1 (ja) 2018-09-07

Family

ID=63369844

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/008348 WO2018158916A1 (ja) 2017-03-02 2017-03-02 化合物の原料物質の探索方法、及び探索装置、並びにプログラム

Country Status (1)

Country Link
WO (1) WO2018158916A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067390A (ja) * 2001-08-29 2003-03-07 Tanabe R & D Service:Kk 法規制化学物質の判定方法及びデータ構造
JP2004152029A (ja) * 2002-10-30 2004-05-27 Fujitsu Ltd 機能予測支援方法、機能予測支援プログラムおよび機能予測支援装置
JP2007323182A (ja) * 2006-05-30 2007-12-13 Riron Soyaku Kenkyusho:Kk 大規模化学構造データベースから高速に化学構造を検索するシステム及び方法
JP2014091724A (ja) * 2012-11-06 2014-05-19 Fujitsu Ltd 情報提供方法、情報提供装置および情報提供プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067390A (ja) * 2001-08-29 2003-03-07 Tanabe R & D Service:Kk 法規制化学物質の判定方法及びデータ構造
JP2004152029A (ja) * 2002-10-30 2004-05-27 Fujitsu Ltd 機能予測支援方法、機能予測支援プログラムおよび機能予測支援装置
JP2007323182A (ja) * 2006-05-30 2007-12-13 Riron Soyaku Kenkyusho:Kk 大規模化学構造データベースから高速に化学構造を検索するシステム及び方法
JP2014091724A (ja) * 2012-11-06 2014-05-19 Fujitsu Ltd 情報提供方法、情報提供装置および情報提供プログラム

Similar Documents

Publication Publication Date Title
Nystrom et al. Memes: A motif analysis environment in R using tools from the MEME Suite
Clemons et al. Small molecules of different origins have distinct distributions of structural complexity that correlate with protein-binding profiles
Schwartz et al. SMIfp (SMILES fingerprint) chemical space for virtual screening and visualization of large databases of organic molecules
Schmidt et al. Cosolvent-enhanced sampling and unbiased identification of cryptic pockets suitable for structure-based drug design
Zok et al. MCQ4Structures to compute similarity of molecule structures
US7991730B2 (en) Methods for similarity searching of chemical reactions
Hu et al. LEAP into the Pfizer Global Virtual Library (PGVL) space: creation of readily synthesizable design ideas automatically
WO2008058923A2 (en) A system and method to identify the metabolites of a drug
Hou et al. SeRenDIP-CE: sequence-based interface prediction for conformational epitopes
Thalheim et al. Tautomer identification and tautomer structure generation based on the InChI code
Wahl et al. Fully automated creation of virtual chemical fragment spaces using the open-source library OpenChemLib
Karwath et al. SMIREP: predicting chemical activity from SMILES
Takeuchi et al. Systematic mapping of R-group space enables the generation of an R-group replacement system for medicinal chemistry
Lobanov et al. Stochastic similarity selections from large combinatorial libraries
Yirik et al. Chemical graph generators
WO2018158916A1 (ja) 化合物の原料物質の探索方法、及び探索装置、並びにプログラム
Patel et al. Synthetically accessible virtual inventory (SAVI)
Kuiper et al. The gene regulation knowledge commons: the action area of GREEKC
Vogt et al. 3D visualization of molecular structures in the MOGADOC database
US7330793B2 (en) Method for searching heterogeneous compound databases using topomeric shape descriptors and pharmacophoric features
Kelich et al. BinderSpace: A package for sequence space analyses for datasets of affinity‐selected oligonucleotides and peptide‐based molecules
Rabal et al. Using novel descriptor accounting for ligand–receptor interactions to define and visually explore biologically relevant chemical space
Kerber et al. Molecules in silico: a graph description of chemical reactions
Kovács et al. Automatic generation of Markush structures from specific compounds
JP6882704B2 (ja) 安定立体構造の算出方法、及び算出装置、並びにプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17898391

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17898391

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP