WO2022149395A1 - 情報処理装置、情報処理方法、及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法、及び情報処理プログラム Download PDF

Info

Publication number
WO2022149395A1
WO2022149395A1 PCT/JP2021/044993 JP2021044993W WO2022149395A1 WO 2022149395 A1 WO2022149395 A1 WO 2022149395A1 JP 2021044993 W JP2021044993 W JP 2021044993W WO 2022149395 A1 WO2022149395 A1 WO 2022149395A1
Authority
WO
WIPO (PCT)
Prior art keywords
input
chemical substance
new
information processing
derived
Prior art date
Application number
PCT/JP2021/044993
Other languages
English (en)
French (fr)
Inventor
大和 鑓水
泰士 疋田
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to CN202180089276.XA priority Critical patent/CN116745759A/zh
Priority to EP21917616.1A priority patent/EP4276840A1/en
Priority to JP2022573954A priority patent/JPWO2022149395A1/ja
Priority to CA3203480A priority patent/CA3203480A1/en
Publication of WO2022149395A1 publication Critical patent/WO2022149395A1/ja
Priority to US18/340,039 priority patent/US20230335230A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures

Definitions

  • the disclosed technology relates to information processing devices, information processing methods, and information processing programs.
  • Japanese Patent Application Laid-Open No. 2006-323833 prepares the geometry of the physiologically active compound to be designed by (1) extracting atomic coordinates from a compound having a specific physiological activity and a known structure.
  • the molecular structure of the candidate compound is determined by arranging possible combinations of atomic species so as to satisfy the bond order relationship between atoms with respect to the geometry prepared in the first step and (2) first step.
  • the second step to be acquired, (3) is characterized by having a third step of evaluating the molecular structure of the candidate compound obtained in the second step based on the activity score obtained from the model for predicting the physiological activity of the compound.
  • a method for designing a physiologically active compound is described.
  • Japanese Patent Application Laid-Open No. 2001-58962 comprehensively stores an input device for inputting desired required characteristics and library creation conditions and a molecular structure that can be theoretically generated based on the library creation conditions.
  • the molecular structure library creation unit that creates the library and the molecular structure that is expected to have the characteristics that match the required characteristics by evaluating the characteristics of the molecular structure stored in the molecular structure library using computational scientific methods.
  • a molecular structure development support system including a molecular structure extraction device provided with a characteristic evaluation unit for extraction and an output device for outputting the molecular structure extracted by the molecular structure extraction device is described.
  • the designer designs the structure of the chemical substance through an editor.
  • the editor inputs the structure of the chemical substance, it outputs the molecular weight and performance index value according to the input structure.
  • This information is very important for structural design of chemical substances for the purpose of producing chemical substances exhibiting desired performance. Therefore, the designer always keeps in mind the performance index value output from the editor when designing.
  • the existing editor can output the molecular weight and the performance index value according to the input structure, but does not have the function of presenting the structure of the chemical substance exhibiting the desired performance. Therefore, the structural design of the chemical substance exhibiting the desired performance is performed by trial and error of the designer, which imposes a heavy burden on the designer.
  • the disclosed technology was made in view of the above points, and aims to support the structural design of chemical substances that exhibit desired performance.
  • the information processing apparatus is an information processing apparatus including at least one processor, wherein the processor is a structural data indicating the structure of a chemical substance and an evaluation function for evaluating a specific performance of the chemical substance.
  • the processor is a structural data indicating the structure of a chemical substance and an evaluation function for evaluating a specific performance of the chemical substance. From a database that accepts input and records structural data indicating the structure of each of a plurality of known chemical substances, known chemical substances that have the same basic structure as the input structure indicated by the input structural data are extracted. Then, a new structure in which the input structure is modified based on the structure of the extracted known chemical substance or a new structure in which the structure of the extracted known chemical substance is modified is generated, and the index value regarding the specific performance of the generated new structure is obtained. Is derived, the evaluation value of the new structure is derived based on the derived index value and the evaluation function, and the process of displaying the new structure according to the evaluation value is performed.
  • the processor may generate a new structure by adding a partial structure associated with the basic structure of the extracted known chemical substance to the input structure.
  • the processor may generate a new structure by removing the substructure associated with the basic structure of the input structure from the input structure.
  • the processor may perform a process of displaying the difference between the new structure and the input structure in a recognizable manner.
  • the processor may perform a process of ranking a plurality of new structures based on evaluation values and displaying the plurality of new structures in a manner in which the ranking result can be recognized.
  • the processor may perform a process of deriving an index value relating to a specific performance for the input structure and displaying the derived index value for each of the input structure and the new structure.
  • the processor may perform a process of displaying only the new structure whose evaluation value is equal to or larger than the threshold value among the plurality of generated new structures.
  • the information processing method accepts the input of structural data indicating the structure of a chemical substance and an evaluation function for evaluating a specific performance of the chemical substance, and for each of a plurality of known chemical substances, the chemical substance of the chemical substance is received. From the database that records the structural data showing the structure, known chemical substances that have the same basic structure as the input structure shown by the input structural data are extracted, and the input structure is modified based on the structure of the extracted known chemical substances. A new structure is generated by modifying the structure of the extracted new structure or the extracted known chemical substance, and for the generated new structure, the index value related to a specific performance is derived, and the new structure is derived based on the derived index value and the evaluation function.
  • the processor included in the information processing apparatus executes the process of deriving the evaluation value of the above and displaying the new structure according to the evaluation value.
  • the information processing program accepts the input of structural data showing the structure of a chemical substance and an evaluation function for evaluating the specific performance of the chemical substance, and for each of a plurality of known chemical substances of the chemical substance. From the database that records the structural data showing the structure, known chemical substances that have the same basic structure as the input structure shown by the input structural data are extracted, and the input structure is modified based on the structure of the extracted known chemical substances. A new structure is generated by modifying the structure of the extracted new structure or the extracted known chemical substance, and for the generated new structure, the index value related to a specific performance is derived, and the new structure is derived based on the derived index value and the evaluation function.
  • This is a program for causing a processor included in an information processing apparatus to execute a process of deriving an evaluation value of a substance and displaying a new structure according to the evaluation value.
  • FIG. 1 is a diagram showing an example of a hardware configuration of the information processing apparatus 10 according to the embodiment of the disclosed technique.
  • the information processing device 10 includes a CPU (Central Processing Unit) 101, a memory 102 as a temporary storage area, and a storage unit 103. Further, the information processing apparatus 10 includes a display unit 104 such as a liquid crystal display, an input unit 105 including an input device such as a keyboard and a mouse, and a network I / F (InterFace) 106 connected to the network.
  • the CPU 101, the memory 102, the storage unit 103, the display unit 104, the input unit 105, and the network I / F 106 are each connected to the bus 108.
  • the storage unit 103 is realized by a non-volatile storage medium such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), or a flash memory.
  • the information processing program 110 and the chemical substance database 120 are stored in the storage unit 103.
  • the CPU 101 reads the information processing program 110 from the storage unit 103, expands the information processing program 110 into the memory 102, and executes the program.
  • An example of the information processing apparatus 10 is a server computer or the like.
  • the CPU 101 is an example of a processor in the disclosed technique.
  • the information processing apparatus 10 is used for structural design of chemical substances and has a function as a molecular design editor.
  • the structural data representing the structure of the chemical substance handled by the information processing apparatus 10 according to the present embodiment is expressed in a graph format.
  • FIG. 2 is a diagram showing an example of structural data 200 of a chemical substance expressed in a graph format.
  • the atoms constituting the chemical substance are represented by the nodes 201, and the bonds between the atoms are represented by the edges 202.
  • the format of the structural data handled by the information processing apparatus 10 is not limited to the graph format, and may be, for example, a character string format such as a DNA (DeoxyriboNucleic Acid) base sequence.
  • FIG. 3 is a diagram showing an example of the chemical substance database 120 stored in the storage unit 103.
  • the chemical substance database 120 records structural data representing the overall structure of the chemical substance for each of the plurality of known chemical substances. Structural data is represented in graph format. Each of the structural data is associated with at least one index value representing the performance of the chemical substance. Examples of index values include boiling point, melting point, glass transition temperature, partition coefficient, density, viscosity, coefficient of thermal expansion, and molecular weight. The index value may be, for example, an actually measured value or a nominal value obtained by a past experiment.
  • FIG. 4 is a functional block diagram showing an example of the functional configuration of the information processing apparatus 10.
  • the information processing apparatus 10 includes a reception unit 11, a search unit 12, a generation unit 13, a first derivation unit 14, a second derivation unit 15, and a display processing unit 16.
  • the information processing apparatus 10 functions as a reception unit 11, a search unit 12, a generation unit 13, a first derivation unit 14, a second derivation unit 15, and a display processing unit 16. do.
  • FIG. 5 is a diagram showing an example of the input structure 300.
  • the nodes constituting the basic structure 300A are hatched.
  • the basic structure will be described later.
  • the input of the input structure to the information processing apparatus 10 can be performed by operating the input unit 105.
  • the reception unit 11 receives structural data indicating an input structure input by the user, and supplies the structural data to the search unit 12 and the generation unit 13.
  • an evaluation function for evaluating the specific performance of the chemical substance into the information processing apparatus 10.
  • An evaluation value that evaluates the performance of the new structure generated by the generation unit 13 is derived using an evaluation function.
  • the evaluation function is formulated so that the closer the performance of the generated new structure is to the target, the higher the evaluation value.
  • the evaluation function is formulated so that the closer the boiling point and partition coefficient of the new structure are to the target, the higher the evaluation value. The details of the new structure will be described later.
  • the evaluation function can be input to the information processing apparatus 10 by operating the input unit 105.
  • the reception unit 11 receives the evaluation function input by the user and supplies it to the second derivation unit 15.
  • the search unit 12 searches for and extracts from the chemical substance database 120 known chemical substances that have the same basic structure as the input structure received by the reception unit 11.
  • the basic structure is a structure forming a skeleton of a chemical substance, and may be, for example, a structure corresponding to a main chain.
  • the basic structure may be a predefined one.
  • the search unit 12 extracts all the corresponding chemical substances.
  • the structure of the chemical substance extracted by the search unit 12 is hereinafter referred to as an extracted chemical structure.
  • FIG. 6 is a diagram showing an example of the extracted chemical structure 400. In FIG. 6, the nodes constituting the basic structure 400A of the extracted chemical structure 400 are hatched.
  • the basic structure 400A in the two extraction chemical structures 400 shown in FIG. 6 is the same as the basic structure 300A in the input structure 300 shown in FIG.
  • the search unit 12 supplies structural data indicating the extracted chemical structure to the generation unit 13.
  • the generation unit 13 generates a new structure in which the input structure is modified based on the extracted chemical structure. For example, the generation unit 13 generates a new structure by adding a partial structure accompanying the basic structure of the extracted chemical structure to the input structure. Further, the generation unit 13 generates a new structure by deleting the partial structure associated with the basic structure of the input structure from the input structure.
  • a partial structure is a part of a structure that constitutes a chemical substance, and is a structure that accompanies a basic structure.
  • FIG. 7 is a diagram showing an example of the new structure 500 generated by the generation unit 13.
  • the partial structure 400B attached to the lowermost part of the basic structure 400A of the extracted chemical structure 400 shown on the left of FIG. 6 is added to the corresponding portion of the input structure 300 shown in FIG. be.
  • the structure corresponding to the input structure is shown by hatching, and the partial structure added to the input structure is shown by a broken line.
  • the partial structure 400B attached to the lowermost part of the basic structure 400A of the extracted chemical structure 400 shown on the right of FIG. 6 is added to the corresponding portion of the input structure 300 shown in FIG. be.
  • the structure corresponding to the input structure is shown by hatching, and the partial structure added to the input structure is shown by a broken line.
  • the new structure 500 shown on the right side of FIG. 7 is obtained by deleting the partial structure 300B attached to the basic structure 300A of the input structure 300 shown in FIG. 5 from the input structure 300.
  • the structure corresponding to the input structure is shown by hatching, and the partial structure deleted from the input structure is shown by a broken line.
  • the generation unit 13 generates a new structure so that the new structure is different from the structure of a known chemical substance recorded in the chemical substance database 120.
  • the generation unit 13 supplies the generated new structure to the first derivation unit 14 and the display processing unit 16.
  • the first derivation unit 14 derives an index value related to the performance of the new structure generated by the generation unit 13.
  • the index value derived by the first derivation unit 14 includes a value related to the performance set as a variable in the evaluation function received by the reception unit 11. For example, when the boiling point and the partition coefficient are set as variables of the evaluation function, the first derivation unit 14 derives at least the boiling point and the partition coefficient for the new structure.
  • the first derivation unit 14 may derive an index value by using a known estimation method such as QSAR (Quantitative Structure-Activity Relationship).
  • QSAR is a method of estimating the physical properties of a chemical substance based on its chemical structure using a mathematical model.
  • the first derivation unit 14 derives an index value for each of the plurality of new structures.
  • the first out-licensing unit 14 supplies the derived index value to the second out-licensing unit 15 and the display processing unit 16.
  • the second derivation unit 15 derives the evaluation value for the new structure by substituting the index value derived by the first derivation unit 14 into the variable of the evaluation function.
  • This evaluation value is a numerical value that evaluates the specific performance of the new structure. The higher the evaluation value derived by the second out-licensing unit 15, the closer the performance of the new structure is to the target.
  • the second derivation unit 15 derives an evaluation value for each of the plurality of new structures.
  • the second derivation unit 15 supplies the derived evaluation value to the display processing unit 16.
  • the display processing unit 16 performs a process of displaying the new structure generated by the generation unit 13 on the display unit 104 according to the evaluation value derived by the second derivation unit 15.
  • FIG. 8 is a diagram showing an example of a display form of the new structure 500 displayed on the display screen 104A of the display unit 104.
  • the display processing unit 16 performs a process of displaying the difference between the new structure 500 and the input structure in a recognizable manner. For example, of the new structure 500, the partial structure added to the input structure may be displayed in a color different from that of the input structure. Further, the partial structure deleted from the input structure may be displayed in a blinking manner.
  • the display processing unit 16 When a plurality of new structures are generated, the display processing unit 16 ranks the plurality of new structures based on the evaluation value, and displays the plurality of new structures 500 in a manner in which the ranking result can be recognized. I do. For example, as illustrated in FIG. 8, a process of displaying a plurality of new structures 500 in order from the left to the right of the display screen 104A in descending order of evaluation value is performed. A plurality of new structures may be displayed side by side in order from the top to the bottom of the display screen 104A in descending order of evaluation value. Further, the display processing unit 16 performs a process of displaying the index value and the evaluation value derived for the new structure 500 together with the new structure 500. As for the index value, only those related to the performance set as variables in the evaluation function (that is, those contributing to the evaluation value) may be selectively displayed.
  • the display processing unit 16 may perform a process of explicitly displaying how the index value related to the specific performance of the new structure has changed with respect to the input structure. ..
  • FIG. 9 illustrates a display mode in which both the index value in the input structure and the index value in the new structure are displayed. In this case, the first derivation unit 14 derives the index value not only for the new structure but also for the input structure. Further, when a plurality of new structures are generated, the display processing unit 16 may perform a process of displaying only the new structures whose evaluation value is equal to or greater than the threshold value among the plurality of new structures.
  • FIG. 10 is a flowchart showing an example of the flow of display processing executed by the CPU 101 executing the information processing program 110.
  • the reception unit 11 receives structural data indicating an input structure input by the user by operating the input unit 105.
  • the reception unit 11 receives the evaluation function input by the user by operating the input unit 105.
  • step S3 the search unit 12 searches for and extracts from the chemical substance database 120 a known chemical structure that has the same basic structure as the input structure received in step S1.
  • step S4 the generation unit 13 generates a new structure obtained by modifying the input structure received in step S1 based on the structure of the known chemical substance extracted in step S3 (that is, the extracted chemical structure).
  • the generation unit 13 generates a new structure, for example, by adding a partial structure associated with the basic structure of the extracted known chemical substance to the input structure. Further, the generation unit 13 generates a new structure by, for example, deleting a partial structure associated with the basic structure of the input structure from the input structure.
  • step S5 the first derivation unit 14 derives an index value related to a specific performance for the new structure generated in step S4.
  • the index values derived in this step include those related to the performance set as variables in the evaluation function.
  • step S6 the second derivation unit 15 derives an evaluation value for the new structure based on the index value derived in step S5 and the evaluation function received in step S2.
  • step S7 the display processing unit 16 performs a process of displaying the new structure generated in step S4 on the display unit 104 according to the evaluation value derived in step S6. For example, when a plurality of new structures are generated, the display processing unit 16 ranks the plurality of new structures based on the evaluation value, and displays the plurality of new structures in a manner in which the ranking result can be recognized. Perform processing.
  • the information processing apparatus 10 As described above, the information processing apparatus 10 according to the embodiment of the disclosed technique generates a new structure in which the input structure is modified based on the structure of a known chemical substance having the same basic structure as the input structure, and creates a new structure. The process of displaying a new structure is performed according to the evaluation value derived for. According to the information processing apparatus 10, since the new structure is presented to the user in a display mode based on the evaluation value, it is possible to support the structural design of the chemical substance exhibiting the desired performance.
  • a new structure is generated based on a known chemical structure that has a common basic structure with the input structure, it is possible to generate a new structure with high feasibility compared to the case where a new structure is randomly generated. It will be possible. Further, by displaying the difference between the new structure and the input structure in a recognizable manner, it becomes easy to grasp the partial structure added or deleted from the input structure. Further, by displaying the plurality of new structures in a manner in which the ranking result according to the evaluation value can be recognized, it becomes easy to grasp the one having the most preferable performance from the plurality of new structures. Further, as shown in FIG.
  • the generation unit 13 may generate a new structure by modifying the extraction chemical structure.
  • a new structure may be generated by changing the connection position of the partial structure 400B accompanying the basic structure 400A of the extraction chemical structure 400.
  • a new structure may be generated by adding a partial structure 400B of another extraction chemical structure 400 to the basic structure 400A of the extraction chemical structure 400.
  • a new structure may be generated by substituting the partial structure 400B of the extraction chemical structure 400 with the partial structure 400B of another extraction chemical structure 400.
  • a new structure may be generated by deleting the partial structure 400B of the extracted chemical structure 400.
  • a new structure may be generated by a combination of addition, replacement, and deletion of the above-mentioned partial structures.
  • FIG. 11 is a functional block diagram showing an example of the functional configuration of the information processing apparatus 10 according to the second embodiment of the disclosed technique.
  • the information processing apparatus 10 according to the second embodiment includes a partial structure database 130.
  • the partial structure database 130 is stored in the storage unit 103.
  • FIG. 12 is a diagram showing an example of the partial structure database 130.
  • the substructure database 130 records the substructure data representing the substructure for each of the plurality of known substructures.
  • the structure of a functional group such as a carboxy group, an aldehyde group, or a hydroxyl group is recorded as a partial structure.
  • the structural data of the substructure is expressed in graph format.
  • Each of the structural data of the substructure is associated with at least one index value representing the performance of the substructure. Examples of index values include the presence or absence of carcinogenicity, the presence or absence of toxicity, and the degree of solubility in water.
  • the index value may be, for example, an actually measured value or a nominal value obtained by a past experiment.
  • the generation unit 13 generates a new structure in which the input structure is modified based on the extraction chemical structure exemplified in FIG. For example, the generation unit 13 generates a new structure by adding a partial structure accompanying the basic structure of the extracted chemical structure to the input structure. Further, the generation unit 13 generates a new structure by deleting the partial structure associated with the basic structure of the input structure from the input structure.
  • the generation unit 13 determines the partial structure to be added to the input structure and the partial structure to be deleted from the input structure by referring to the partial structure database 130.
  • the generation unit 13 finds the same partial structure as the partial structure recorded in the partial structure database 130 in the extracted chemical structure exemplified in FIG. 6, the performance of the partial structure satisfies a predetermined condition. Judge whether or not. This determination is made based on the index value recorded corresponding to the substructure in the substructure database 130.
  • the conditions are set in advance by the user. The conditions include, for example, that the toxicity level of the partial structure is below the threshold value.
  • the generation unit 13 determines that the performance of the substructure satisfies the conditions, the generation unit 13 targets the substructure to be added to the input structure. On the other hand, when the generation unit 13 determines that the performance of the partial structure does not satisfy the condition, the generation unit 13 excludes the partial structure from the target to be added to the input structure. As a result, it is possible to suppress the addition of a partial structure having unfavorable performance to the input structure.
  • the generation unit 13 finds the same substructure as the substructure recorded in the substructure database 130 in the input structure exemplified in FIG. 5, the performance of the substructure is set to a predetermined condition. Determine if it meets or not. This determination is made based on the index value recorded corresponding to the substructure in the substructure database 130.
  • the conditions are set in advance by the user. The conditions include, for example, that the specific performance of the substructure meets the requirements.
  • the generation unit 13 targets the substructure to be deleted from the input structure.
  • the generation unit 13 determines that the performance of the partial structure satisfies the condition, the generation unit 13 excludes the partial structure from the target to be deleted from the input structure. As a result, it is possible to prevent the partial structure having preferable performance from being deleted from the input structure.
  • a processing unit that executes various processes such as a reception unit 11, a search unit 12, a generation unit 13, a first derivation unit 14, a second derivation unit 15, and a display processing unit 16
  • various processors shown below can be used.
  • the various processors include CPUs, which are general-purpose processors that execute software (programs) and function as various processing units, as well as circuits after manufacturing FPGAs (Field Programmable Gate Arrays) and the like.
  • Dedicated electricity which is a processor with a circuit configuration specially designed to execute specific processing such as programmable logic device (PLD), ASIC (Application Specific Integrated Circuit), which is a processor whose configuration can be changed. Circuits etc. are included.
  • One processing unit may be composed of one of these various processors, or a combination of two or more processors of the same type or different types (for example, a combination of a plurality of FPGAs or a combination of a CPU and an FPGA). It may be composed of a combination). Further, a plurality of processing units may be configured by one processor.
  • one processor is configured by a combination of one or more CPUs and software, as represented by a computer such as a client and a server.
  • the processor functions as a plurality of processing units.
  • SoC System On Chip
  • the various processing units are configured by using one or more of the above-mentioned various processors as a hardware-like structure.
  • an electric circuit in which circuit elements such as semiconductor elements are combined can be used.
  • the information processing program 110 is stored (installed) in the storage unit 103 in advance, but the present invention is not limited to this.
  • the information processing program 110 is provided in a form recorded on a recording medium such as a CD-ROM (Compact Disc Read Only Memory), a DVD-ROM (Digital Versatile Disc Read Only Memory), and a USB (Universal Serial Bus) memory. May be good. Further, the information processing program 110 may be downloaded from an external device via a network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

情報処理装置は、少なくとも1つのプロセッサを備える。プロセッサは、化学物質の構造を示す構造データ及び化学物質の特定の性能を評価するための評価関数の入力を受け付け、複数の既知の化学物質の各々について当該化学物質の構造を示す構造データを記録したデータベースから、入力された構造データによって示される入力構造と基本構造が共通する既知の化学物質を抽出し、抽出した既知の化学物質の構造に基づいて入力構造を改変した新規構造又は抽出した既知の化学物質の構造を改変した新規構造を生成し、生成した新規構造について、特定の性能に関する指標値を導出し、導出した指標値及び評価関数に基づいて、新規構造の評価値を導出し、評価値に応じて新規構造を表示する処理を行う。

Description

情報処理装置、情報処理方法、及び情報処理プログラム
 開示の技術は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
 化学物質の設計支援に関する技術として以下の技術が知られている。例えば、特開2006-323833号公報には、(1)特定の生理活性を有し、且つ、既知の構造を有する化合物から原子座標を抽出することにより、設計対象の生理活性化合物のジオメトリを用意する第1工程、(2)第1工程で用意されたジオメトリに対して、原子間の結合次数の関係を満たすように、原子種の可能な組み合わせを配置することにより、候補化合物の分子構造を取得する第2工程、(3)第2工程で得られた候補化合物の分子構造を、化合物の上記生理活性を予測するモデルから求めた活性スコアにより評価する第3工程を有することを特徴とする、生理活性化合物の設計方法が記載されている。
 特開2001-58962号公報には、目的とする要求特性及びライブラリ作成条件を入力する入力装置と、該ライブラリ作成条件に基づいて理論的に生成可能な分子構造を網羅的に格納して分子構造ライブラリを作成する分子構造ライブラリ作成部と、該分子構造ライブラリに格納された分子構造の特性を計算科学的手法を用いて評価して該要求特性に合致する特性を有すると予想される分子構造を抽出する特性評価部とを備える分子構造抽出装置と、該分子構造抽出装置により抽出された分子構造を出力する出力装置とを備えた分子構造開発支援システムが記載されている。
 化学物質の構造設計において、設計者はエディタを通して化学物質の構造を設計している。エディタは化学物質の構造を入力すると、入力した構造に応じた分子量及び性能指標値を出力する。これらの情報は、所望の性能を発揮する化学物質の製造を目的とする化学物質の構造設計を行う上では非常に重要である。このため、設計者は、エディタから出力される性能指標値等を常に意識しながら設計を行っている。既存のエディタは、入力した構造に応じた分子量及び性能指標値を出力することはできるが、所望の性能を発揮する化学物質の構造を提示する機能までは備えていない。このため、所望の性能を発揮する化学物質の構造設計は、設計者の試行錯誤によって行われ、設計者の負担が大きい。
 開示の技術は、上記の点に鑑みてなされたものであり、所望の性能を発揮する化学物質の構造設計を支援することを目的とする。
 開示の技術に係る情報処理装置は、少なくとも1つのプロセッサを備えた情報処理装置であって、プロセッサは、化学物質の構造を示す構造データ及び化学物質の特定の性能を評価するための評価関数の入力を受け付け、複数の既知の化学物質の各々について当該化学物質の構造を示す構造データを記録したデータベースから、入力された構造データによって示される入力構造と基本構造が共通する既知の化学物質を抽出し、抽出した既知の化学物質の構造に基づいて入力構造を改変した新規構造又は抽出した既知の化学物質の構造を改変した新規構造を生成し、生成した新規構造について、特定の性能に関する指標値を導出し、導出した指標値及び評価関数に基づいて、新規構造の評価値を導出し、評価値に応じて新規構造を表示する処理を行う。
 プロセッサは、抽出した既知の化学物質の基本構造に付随する部分構造を入力構造に付加することにより新規構造を生成してもよい。プロセッサは、入力構造の基本構造に付随する部分構造を入力構造から削除することにより新規構造を生成してもよい。
 プロセッサは、新規構造の、入力構造との差分を認識可能な態様で表示する処理を行ってもよい。プロセッサは、複数の新規構造について評価値に基づいて順位付けを行い、順位付けの結果を認識可能な態様で複数の新規構造を表示する処理を行ってもよい。プロセッサは、入力構造について、特定の性能に関する指標値を導出し、入力構造及び新規構造のそれぞれについて導出した指標値を表示する処理を行ってもよい。プロセッサは、生成した複数の新規構造のうち評価値が閾値以上の新規構造のみを表示する処理を行ってもよい。
 開示の技術に係る情報処理方法は、化学物質の構造を示す構造データ及び化学物質の特定の性能を評価するための評価関数の入力を受け付け、複数の既知の化学物質の各々について当該化学物質の構造を示す構造データを記録したデータベースから、入力された構造データによって示される入力構造と基本構造が共通する既知の化学物質を抽出し、抽出した既知の化学物質の構造に基づいて入力構造を改変した新規構造又は抽出した既知の化学物質の構造を改変した新規構造を生成し、生成した新規構造について、特定の性能に関する指標値を導出し、導出した指標値及び評価関数に基づいて、新規構造の評価値を導出し、評価値に応じて新規構造を表示する処理を、情報処理装置が備えるプロセッサが実行する、というものである。
 開示の技術に係る情報処理プログラムは、化学物質の構造を示す構造データ及び化学物質の特定の性能を評価するための評価関数の入力を受け付け、複数の既知の化学物質の各々について当該化学物質の構造を示す構造データを記録したデータベースから、入力された構造データによって示される入力構造と基本構造が共通する既知の化学物質を抽出し、抽出した既知の化学物質の構造に基づいて入力構造を改変した新規構造又は抽出した既知の化学物質の構造を改変した新規構造を生成し、生成した新規構造について、特定の性能に関する指標値を導出し、導出した指標値及び評価関数に基づいて、新規構造の評価値を導出し、評価値に応じて新規構造を表示する処理を、情報処理装置が備えるプロセッサに実行させるためのプログラムである。
 開示の技術によれば、所望の性能を発揮する化学物質の構造設計を支援することが可能となる。
開示の技術の実施形態に係る情報処理装置のハードウェア構成の一例を示す図である。 グラフ形式で表現された化学物質の構造データの一例を示す図である。 開示の技術の実施形態に係る化学物質データベースの一例を示す図である。 開示の技術の実施形態に係る情報処理装置の機能的な構成の一例を示す機能ブロック図である。 開示の技術の実施形態に係る入力部分構造の一例を示す図である。 開示の技術の実施形態に係る抽出化学構造の一例を示す図である。 開示の技術の実施形態に係る新規構造の一例を示す図である。 開示の技術の実施形態に係る新規構造の表示形態の一例を示す図である。 開示の技術の実施形態に係る新規構造の表示形態の一例を示す図である。 開示の技術の実施形態に係る表示処理の流れの一例を示すフローチャートである。 開示の技術の他の実施形態に係る情報処理装置の機能的な構成の一例を示す機能ブロック図である。 開示の技術の実施形態に係る部分構造データベースの一例を示す図である。
 以下、開示の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一または等価な構成要素及び部分には同一の参照符号を付与し、重複する説明は適宜省略する。
 図1は、開示の技術の実施形態に係る情報処理装置10のハードウェア構成の一例を示す図である。
 情報処理装置10は、CPU(Central Processing Unit)101、一時記憶領域としてのメモリ102、及び記憶部103を含む。また、情報処理装置10は、液晶ディスプレイ等の表示部104、キーボード及びマウス等の入力デバイスを含んで構成される入力部105、ネットワークに接続されるネットワークI/F(InterFace)106を含む。CPU101、メモリ102、記憶部103、表示部104、入力部105及びネットワークI/F106は、それぞれバス108に接続される。
 記憶部103は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等の不揮発性の記憶媒体によって実現される。記憶部103には、情報処理プログラム110、化学物質データベース120が記憶される。CPU101は、記憶部103から情報処理プログラム110を読み出してからメモリ102に展開し、実行する。なお、情報処理装置10の例としては、サーバコンピュータ等が挙げられる。CPU101は、開示の技術におけるプロセッサの一例である。
 情報処理装置10は、化学物質の構造設計に用いられるものであり、分子設計エディタとしての機能を有している。本実施形態に係る情報処理装置10が取り扱う化学物質の構造を表す構造データは、グラフ形式で表現される。図2はグラフ形式で表現された化学物質の構造データ200の一例を示す図である。グラフ形式で表現された構造データ200は、当該化学物質を構成する原子をノード201によって表現し、原子間の結合をエッジ202によって表現したものである。なお、情報処理装置10が取り扱う構造データの形式は、グラフ形式に限定されるものではなく、例えば、DNA(DeoxyriboNucleic Acid)塩基配列のような文字列形式であってもよい。
 図3は、記憶部103に記憶された化学物質データベース120の一例を示す図である。化学物質データベース120は、複数の既知の化学物質の各々について、当該化学物質の全体構造を表す構造データを記録したものである。構造データは、グラフ形式で表現される。構造データの各々には、当該化学物質の性能を表す少なくとも1つの指標値が対応付けられている。指標値の例としては、沸点、融点、ガラス転移温度、分配係数、密度、粘度、熱膨張率、分子量などが挙げられる。指標値は、例えば、過去の実験によって得られた実測値又は公称値であってもよい。
 図4は、情報処理装置10の機能的な構成の一例を示す機能ブロック図である。情報処理装置10は、受付部11、探索部12、生成部13、第1の導出部14、第2の導出部15及び表示処理部16を含んで構成されている。CPU101が情報処理プログラム110を実行することで、情報処理装置10は、受付部11、探索部12、生成部13、第1の導出部14、第2の導出部15及び表示処理部16として機能する。
 情報処理装置10を用いて化学物質の構造設計を行うユーザは、設計対象の化学物質が含み得る化学構造を情報処理装置10に入力する。情報処理装置10に入力される化学構造を、以下において入力構造と称する。図5は、入力構造300の一例を示す図である。図5において、入力構造300のうち基本構造300Aを構成するノードにはハッチングが施されている。基本構造については後述する。入力構造の情報処理装置10への入力は、入力部105を操作することによって行うことが可能である。受付部11は、ユーザによって入力された入力構造を示す構造データを受け付け、これを探索部12及び生成部13に供給する。
 また、ユーザは、化学物質の特定の性能を評価するための評価関数を情報処理装置10に入力する。生成部13によって生成される新規構造の性能を評価した評価値が、評価関数を用いて導出される。生成された新規構造の性能が目標に近い程、評価値が高くなるように評価関数が策定される。例えば、沸点及び分配係数について目標値を定めて化学物質の構造設計を行う場合、新規構造の沸点及び分配係数が評価関数の変数とされる。新規構造の沸点及び分配係数が目標に近い程、評価値が高くなるように評価関数が策定される。なお、新規構造の詳細については後述する。評価関数の情報処理装置10への入力は、入力部105を操作することによって行うことが可能である。受付部11は、ユーザによって入力された評価関数を受け付け、これを第2の導出部15に供給する。
 探索部12は、化学物質データベース120から、受付部11によって受け付けられた入力構造と基本構造が共通する既知の化学物質を探索し、抽出する。基本構造とは、化学物質の骨格をなす構造であり、例えば主鎖に相当する構造であってもよい。基本構造は、予め定義されたものであってもよい。探索部12は、入力構造と基本構造が共通する既知の化学物質が、化学物質データベース120に複数存在する場合、該当する全ての化学物質を抽出する。探索部12によって抽出された化学物質の構造を以下において抽出化学構造と称する。図6は、抽出化学構造400の一例を示す図である。図6において、抽出化学構造400のうち基本構造400Aを構成するノードにはハッチングが施されている。図6に示す2つの抽出化学構造400における基本構造400Aは、図5に示す入力構造300における基本構造300Aと同じである。探索部12は、抽出化学構造を示す構造データを生成部13に供給する。
 生成部13は、抽出化学構造に基づいて、入力構造を改変した新規構造を生成する。例えば、生成部13は、抽出化学構造の基本構造に付随する部分構造を入力構造に付加することにより新規構造を生成する。また、生成部13は、入力構造の基本構造に付随する部分構造を入力構造から削除することにより新規構造を生成する。部分構造とは化学物質を構成する一部の構造であり、基本構造に付随する構造である。
 図7は、生成部13によって生成される新規構造500の一例を示す図である。図7左に示す新規構造500は、図6左に示す抽出化学構造400の基本構造400Aの最下部に付随する部分構造400Bを、図5に示す入力構造300の対応する箇所に付加したものである。図7左において、入力構造に相当する構造がハッチングで示され、入力構造に付加された部分構造が破線で示されている。図7中央に示す新規構造500は、図6右に示す抽出化学構造400の基本構造400Aの最下部に付随する部分構造400Bを、図5に示す入力構造300の対応する箇所に付加したものである。図7中央において、入力構造に相当する構造がハッチングで示され、入力構造に付加された部分構造が破線で示されている。図7右に示す新規構造500は、図5に示す入力構造300の基本構造300Aに付随する部分構造300Bを入力構造300から削除したものである。図7右において、入力構造に相当する構造がハッチングで示され、入力構造から削除された部分構造が破線で示されている。
 生成部13は、新規構造が、化学物質データベース120に記録されている既知の化学物質の構造とは異なるように新規構造を生成する。生成部13は、生成した新規構造を第1の導出部14及び表示処理部16に供給する。
 第1の導出部14は、生成部13によって生成された新規構造について、その性能に関する指標値を導出する。第1の導出部14が導出する指標値には、受付部11が受け付けた評価関数において変数として設定された性能に関するものが含まれる。例えば、沸点及び分配係数が評価関数の変数として設定されている場合、第1の導出部14は、新規構造について、少なくとも沸点及び分配係数を導出する。第1の導出部14は、例えばQSAR(Quantitative Structure-Activity Relationship)等の公知の推計手法を用いて指標値を導出してもよい。QSARは、数理モデルを用いて化学構造を基に化学物質の物性を推計する手法である。第1の導出部14は、生成部13によって複数の新規構造が生成された場合、複数の新規構造のそれぞれについて指標値を導出する。第1の導出部14は、導出した指標値を第2の導出部15及び表示処理部16に供給する。
 第2の導出部15は、第1の導出部14によって導出された指標値を評価関数の変数に代入することによって、新規構造についての評価値を導出する。この評価値は、当該新規構造の特定の性能を評価した数値である。第2の導出部15によって導出される評価値が高い程、その新規構造の性能が目標に近いことを意味する。第2の導出部15は、生成部13によって複数の新規構造が生成された場合、複数の新規構造のそれぞれについて評価値を導出する。第2の導出部15は、導出した評価値を表示処理部16に供給する。
 表示処理部16は、生成部13によって生成された新規構造を、第2の導出部15によって導出された評価値に応じて表示部104に表示する処理を行う。図8は、表示部104の表示画面104Aに表示される新規構造500の表示形態の一例を示す図である。表示処理部16は、新規構造500の、入力構造との差分を認識可能な態様で表示する処理を行う。例えば、新規構造500のうち、入力構造に対して付加された部分構造を、入力構造とは異なる色で表示してもよい。また、入力構造から削除した部分構造を点滅表示してもよい。
 表示処理部16は、複数の新規構造が生成された場合、複数の新規構造について評価値に基づいて順位付けを行い、順位付けの結果が認識可能な態様で複数の新規構造500を表示する処理を行う。例えば、図8に例示するように、複数の新規構造500を、評価値の高い順に表示画面104Aの左から右に向けて順番に並べて表示する処理を行う。複数の新規構造を、評価値が高い順に表示画面104Aの上から下に向けて順番に並べて表示してもよい。また、表示処理部16は、新規構造500について導出された指標値及び評価値を、新規構造500とともに表示する処理を行う。指標値については、評価関数において変数として設定された性能に関するもの(すなわち評価値に寄与するもの)のみを選択的に表示してもよい。
 また、表示処理部16は、図9に例示するように、新規構造の特定の性能に関する指標値が、入力構造に対してどのように変化したのかを明示的に表示する処理を行ってもよい。図9には、入力構造における指標値と、新規構造における指標値との双方を表示する表示形態が例示されている。この場合、第1の導出部14は、新規構造のみならず入力構造についても指標値を導出する。また、表示処理部16は、複数の新規構造が生成された場合、複数の新規構造のうち、評価値が閾値以上の新規構造のみを表示する処理を行ってもよい。
 図10は、CPU101が情報処理プログラム110を実行することによって実施される表示処理の流れの一例を示すフローチャートである。ステップS1において、受付部11は、ユーザが入力部105を操作することによって入力した入力構造を示す構造データを受け付ける。ステップS2において、受付部11は、ユーザが入力部105を操作することによって入力した評価関数を受け付ける。
 ステップS3において、探索部12は、化学物質データベース120から、ステップS1において受け付けた入力構造と基本構造が共通する既知の化学構造を探索し、抽出する。
 ステップS4において、生成部13は、ステップS3において抽出された既知の化学物質の構造(すなわち抽出化学構造)に基づいて、ステップS1において受け付けた入力構造を改変した新規構造を生成する。生成部13は、例えば、抽出された既知の化学物質の基本構造に付随する部分構造を入力構造に付加することにより新規構造を生成する。また、生成部13は、例えば、入力構造の基本構造に付随する部分構造を入力構造から削除することにより新規構造を生成する。
 ステップS5において、第1の導出部14は、ステップS4において生成された新規構造について、特定の性能に関する指標値を導出する。本ステップにおいて導出される指標値には、評価関数において変数として設定された性能に関するものが含まれる。
 ステップS6において、第2の導出部15は、ステップS5において導出された指標値及びステップS2において受け付けた評価関数に基づいて、新規構造について評価値を導出する。
 ステップS7において、表示処理部16は、ステップS6において導出された評価値に応じて、ステップS4において生成された新規構造を表示部104に表示する処理を行う。例えば、表示処理部16は、複数の新規構造が生成された場合、複数の新規構造について評価値に基づいて順位付けを行い、順位付けの結果が認識可能な態様で複数の新規構造を表示する処理を行う。
 以上のように、開示の技術の実施形態に係る情報処理装置10は、入力構造と基本構造が共通する既知の化学物質の構造に基づいて、入力構造を改変した新規構造を生成し、新規構造について導出した評価値に応じて新規構造を表示する処理を行う。情報処理装置10によれば、評価値に基づく表示態様で新規構造がユーザに提示されるので、所望の性能を発揮する化学物質の構造設計を支援することが可能となる。
 また、入力構造と基本構造が共通する既知の化学構造に基づいて新規構造が生成されるので、無作為に新規構造を生成する場合と比較して、実現性の高い新規構造を生成することが可能となる。また、新規構造の、入力構造との差分を認識可能な態様で表示することで、入力構造に対して付加又は削除された部分構造の把握が容易となる。また、評価値に応じた順位付けの結果が認識可能な態様で複数の新規構造を表示することで、複数の新規構造中から最も好ましい性能を有するものを把握することが容易となる。また、図10に示すように、入力構造及び新規構造のそれぞれについて導出した指標値を表示することで、新規構造における指標値が、入力構造に対してどのように変化したのかを把握することが可能となる。また、複数の新規構造のうち評価値が閾値以上の新規構造のみを表示することで、好ましい性能を有する新規構造のみをユーザに提示することが可能となる。
 なお、上記の実施形態では、生成部13が、入力構造と基本構造が共通する既知の化学構造(すなわち抽出化学構造)に基づいて入力構造を改変することで新規構造を生成する場合を例示したが、この態様に限定されない。生成部13は、抽出化学構造を改変することで新規構造を生成してもよい。例えば、抽出化学構造400の基本構造400Aに付随する部分構造400Bの接続位置を変更することによって新規構造を生成してもよい。また、抽出化学構造400の基本構造400Aに、他の抽出化学構造400の部分構造400Bを付加することによって新規構造を生成してもよい。また、抽出化学構造400の部分構造400Bを、他の抽出化学構造400の部分構造400Bに置換することによって新規構造を生成してもよい。また、抽出化学構造400の部分構造400Bを削除することによって新規構造を生成してもよい。また、上記した部分構造の付加、置換、削除の組み合わせによって新規構造を生成してもよい。
[第2の実施形態]
 図11は、開示の技術の第2の実施形態に係る情報処理装置10の機能的な構成の一例を示す機能ブロック図である。第2の実施形態に係る情報処理装置10は、部分構造データベース130を備えている。部分構造データベース130は、記憶部103に記憶されている。
 図12は、部分構造データベース130の一例を示す図である。部分構造データベース130は、複数の既知の部分構造の各々について、当該部分構造を表す部分構造データを記録したものである。部分構造データベースには、例えば、カルボキシ基、アルデヒド基、水酸基等の官能基の構造が部分構造として記録されている。部分構造の構造データは、グラフ形式で表現される。部分構造の構造データの各々には、当該部分構造の性能を表す少なくとも1つの指標値が対応付けられている。指標値の例としては、発癌性の有無、毒性の有無、及び水への溶けやすさを表す度合い等が挙げられる。指標値は、例えば、過去の実験によって得られた実測値又は公称値であってもよい。
 生成部13は、第1の実施形態と同様、図6に例示する抽出化学構造に基づいて、入力構造を改変した新規構造を生成する。例えば、生成部13は、抽出化学構造の基本構造に付随する部分構造を入力構造に付加することにより新規構造を生成する。また、生成部13は、入力構造の基本構造に付随する部分構造を入力構造から削除することにより新規構造を生成する。
 本実施形態において、生成部13は、入力構造に付加する部分構造及び入力構造から削除する部分構造を、部分構造データベース130を参照することによって決定する。生成部13は、図6に例示する抽出化学構造の中に、部分構造データベース130に記録された部分構造と同じ部分構造を発見した場合、その部分構造の性能が、予め定められた条件を満たすか否かを判定する。この判定は、部分構造データベース130において部分構造に対応して記録されている指標値に基づいて行われる。条件は、予めユーザによって設定される。条件としては、例えば、当該部分構造の毒性レベルが閾値以下であること等が挙げられる。生成部13は、当該部分構造の性能が条件を満たしていると判定した場合、当該部分構造を入力構造に付加する対象とする。一方、生成部13は、当該部分構造の性能が条件を満たしていないと判定した場合、当該部分構造を入力構造に付加する対象から除外する。これにより、好ましくない性能を有する部分構造が入力構造に付加されることを抑制できる。
 また、生成部13は、図5に例示する入力構造の中に、部分構造データベース130に記録された部分構造と同じ部分構造を発見した場合、その部分構造の性能が、予め定められた条件を満たすか否かを判定する。この判定は、部分構造データベース130において部分構造に対応して記録されている指標値に基づいて行われる。条件は、予めユーザによって設定される。条件としては、例えば、当該部分構造の特定の性能が要求を満たしていること等が挙げられる。生成部13は、当該部分構造の性能が条件を満たしていないと判定した場合、当該部分構造を入力構造から削除する対象とする。一方、生成部13は、当該部分構造の性能が条件を満たしていると判定した場合、当該部分構造を入力構造から削除する対象から除外する。これにより、好ましい性能を有する部分構造が入力構造から削除されることを抑制できる。
 このように、部分構造データベース130を参照することによって、入力構造に付加する部分構造及び入力構造から削除する部分構造を選択することで、性能要求に合致しない新規構造が生成されることを抑制できる。
 なお、上記実施形態において、例えば、受付部11、探索部12、生成部13、第1の導出部14、第2の導出部15、及び表示処理部16といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
 1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
 複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System On Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
 更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
 また、上記実施形態では、情報処理プログラム110が記憶部103に予め記憶(インストール)されている態様を説明したが、これに限定されない。情報処理プログラム110は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、情報処理プログラム110は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
 なお、2021年1月7日に出願された日本国特許出願2021-001611の開示は、その全体が参照により本明細書に取り込まれる。また、本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願、および技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

Claims (9)

  1.  少なくとも1つのプロセッサを備えた情報処理装置であって、
     前記プロセッサは、
     化学物質の構造を示す構造データ及び化学物質の特定の性能を評価するための評価関数の入力を受け付け、
     複数の既知の化学物質の各々について当該化学物質の構造を示す構造データを記録したデータベースから、入力された前記構造データによって示される入力構造と基本構造が共通する既知の化学物質を抽出し、
     抽出した既知の化学物質の構造に基づいて前記入力構造を改変した新規構造又は抽出した既知の化学物質の構造を改変した新規構造を生成し、
     生成した前記新規構造について、前記特定の性能に関する指標値を導出し、
     導出した前記指標値及び前記評価関数に基づいて、前記新規構造の評価値を導出し、
     前記評価値に応じて前記新規構造を表示する
     処理を行う情報処理装置。
  2.  前記プロセッサは、抽出した前記既知の化学物質の基本構造に付随する部分構造を前記入力構造に付加することにより前記新規構造を生成する
     処理を行う請求項1に記載の情報処理装置。
  3.  前記プロセッサは、前記入力構造の基本構造に付随する部分構造を前記入力構造から削除することにより前記新規構造を生成する
     処理を行う請求項2に記載の情報処理装置。
  4.  前記プロセッサは、前記新規構造の、前記入力構造との差分を認識可能な態様で表示する
     処理を行う請求項1から請求項3のいずれか1項に記載の情報処理装置。
  5.  前記プロセッサは、
     複数の前記新規構造について前記評価値に基づいて順位付けを行い、
     前記順位付けの結果を認識可能な態様で複数の前記新規構造を表示する
     処理を行う請求項1から請求項4のいずれか1項に記載の情報処理装置。
  6.  前記プロセッサは、
     前記入力構造について、前記特定の性能に関する指標値を導出し、
     前記入力構造及び前記新規構造のそれぞれについて導出した指標値を表示する
     処理を行う請求項1から請求項5のいずれか1項に記載の情報処理装置。
  7.  前記プロセッサは、生成した複数の前記新規構造のうち前記評価値が閾値以上の新規構造のみを表示する処理を行う
     請求項1から請求項6のいずれか1項に記載の情報処理装置。
  8.  化学物質の構造を示す構造データ及び化学物質の特定の性能を評価するための評価関数の入力を受け付け、
     複数の既知の化学物質の各々について当該化学物質の構造を示す構造データを記録したデータベースから、入力された前記構造データによって示される入力構造と基本構造が共通する既知の化学物質を抽出し、
     抽出した既知の化学物質の構造に基づいて前記入力構造を改変した新規構造又は抽出した既知の化学物質の構造を改変した新規構造を生成し、
     生成した前記新規構造について、前記特定の性能に関する指標値を導出し、
     導出した前記指標値及び前記評価関数に基づいて、前記新規構造の評価値を導出し、
     前記評価値に応じて前記新規構造を表示する
     処理を、情報処理装置が備えるプロセッサが実行する情報処理方法。
  9.  化学物質の構造を示す構造データ及び化学物質の特定の性能を評価するための評価関数の入力を受け付け、
     複数の既知の化学物質の各々について当該化学物質の構造を示す構造データを記録したデータベースから、入力された前記構造データによって示される入力構造と基本構造が共通する既知の化学物質を抽出し、
     抽出した既知の化学物質の構造に基づいて前記入力構造を改変した新規構造又は抽出した既知の化学物質の構造を改変した新規構造を生成し、
     生成した前記新規構造について、前記特定の性能に関する指標値を導出し、
     導出した前記指標値及び前記評価関数に基づいて、前記新規構造の評価値を導出し、
     前記評価値に応じて前記新規構造を表示する
     処理を、情報処理装置が備えるプロセッサに実行させるための情報処理プログラム。
PCT/JP2021/044993 2021-01-07 2021-12-07 情報処理装置、情報処理方法、及び情報処理プログラム WO2022149395A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202180089276.XA CN116745759A (zh) 2021-01-07 2021-12-07 信息处理装置、信息处理方法及信息处理程序
EP21917616.1A EP4276840A1 (en) 2021-01-07 2021-12-07 Information processing device, information processing method, and information processing program
JP2022573954A JPWO2022149395A1 (ja) 2021-01-07 2021-12-07
CA3203480A CA3203480A1 (en) 2021-01-07 2021-12-07 Information processing apparatus, information processing method, and information processing program
US18/340,039 US20230335230A1 (en) 2021-01-07 2023-06-23 Information processing apparatus, information processing method, and information processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021001611 2021-01-07
JP2021-001611 2021-01-07

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/340,039 Continuation US20230335230A1 (en) 2021-01-07 2023-06-23 Information processing apparatus, information processing method, and information processing program

Publications (1)

Publication Number Publication Date
WO2022149395A1 true WO2022149395A1 (ja) 2022-07-14

Family

ID=82357386

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/044993 WO2022149395A1 (ja) 2021-01-07 2021-12-07 情報処理装置、情報処理方法、及び情報処理プログラム

Country Status (6)

Country Link
US (1) US20230335230A1 (ja)
EP (1) EP4276840A1 (ja)
JP (1) JPWO2022149395A1 (ja)
CN (1) CN116745759A (ja)
CA (1) CA3203480A1 (ja)
WO (1) WO2022149395A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7388578B1 (ja) 2023-01-16 2023-11-29 住友ベークライト株式会社 化学構造提案方法、プログラム、および化学構造提案装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001058962A (ja) 1999-08-20 2001-03-06 Mitsubishi Chemicals Corp 分子構造開発支援システム及び分子構造開発支援方法、並びに、分子構造抽出装置,分子構造抽出方法及び分子構造抽出プログラムを格納したコンピュータ読取可能な記録媒体
JP2006323833A (ja) 2005-04-19 2006-11-30 Zoegene Corp 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム
JP2007277188A (ja) * 2006-04-10 2007-10-25 Hitachi Ltd 化合物検索支援システム
JP2013101510A (ja) * 2011-11-08 2013-05-23 Fujitsu Ltd 情報提供装置、情報提供プログラムおよび情報提供方法
US20190114390A1 (en) * 2017-10-13 2019-04-18 BioAge Labs, Inc. Drug repurposing based on deep embeddings of gene expression profiles
US20190286791A1 (en) * 2018-03-15 2019-09-19 International Business Machines Corporation Creation of new chemical compounds having desired properties using accumulated chemical data to construct a new chemical structure for synthesis
WO2020054841A1 (ja) * 2018-09-14 2020-03-19 富士フイルム株式会社 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置
WO2020166486A1 (ja) * 2019-02-12 2020-08-20 Jsr株式会社 データ処理方法、データ処理装置及びデータ処理システム
JP2021001611A (ja) 2019-06-19 2021-01-07 有限会社アールストーン 配管支持具

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001058962A (ja) 1999-08-20 2001-03-06 Mitsubishi Chemicals Corp 分子構造開発支援システム及び分子構造開発支援方法、並びに、分子構造抽出装置,分子構造抽出方法及び分子構造抽出プログラムを格納したコンピュータ読取可能な記録媒体
JP2006323833A (ja) 2005-04-19 2006-11-30 Zoegene Corp 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム
JP2007277188A (ja) * 2006-04-10 2007-10-25 Hitachi Ltd 化合物検索支援システム
JP2013101510A (ja) * 2011-11-08 2013-05-23 Fujitsu Ltd 情報提供装置、情報提供プログラムおよび情報提供方法
US20190114390A1 (en) * 2017-10-13 2019-04-18 BioAge Labs, Inc. Drug repurposing based on deep embeddings of gene expression profiles
US20190286791A1 (en) * 2018-03-15 2019-09-19 International Business Machines Corporation Creation of new chemical compounds having desired properties using accumulated chemical data to construct a new chemical structure for synthesis
WO2020054841A1 (ja) * 2018-09-14 2020-03-19 富士フイルム株式会社 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置
WO2020166486A1 (ja) * 2019-02-12 2020-08-20 Jsr株式会社 データ処理方法、データ処理装置及びデータ処理システム
JP2021001611A (ja) 2019-06-19 2021-01-07 有限会社アールストーン 配管支持具

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7388578B1 (ja) 2023-01-16 2023-11-29 住友ベークライト株式会社 化学構造提案方法、プログラム、および化学構造提案装置

Also Published As

Publication number Publication date
EP4276840A1 (en) 2023-11-15
CA3203480A1 (en) 2022-07-14
US20230335230A1 (en) 2023-10-19
JPWO2022149395A1 (ja) 2022-07-14
CN116745759A (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
US11119834B2 (en) Artificial creation of dominant sequences that are representative of logged events
KR102402673B1 (ko) Beol의 공정 변이를 고려하여 집적 회로를 설계하기 위한 컴퓨터 구현 방법 및 컴퓨팅 시스템
JP5011830B2 (ja) データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP4634269B2 (ja) クロストークを考慮したタイミング分析のためのシステム、方法及び論理装置
JP4890806B2 (ja) 予測プログラムおよび予測装置
JP4806376B2 (ja) クロックメッシュ分析方法、装置及びシステム
WO2022149395A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6036134B2 (ja) 設計支援装置、設計支援方法、および設計支援プログラム
JP6851460B2 (ja) 最適解判定方法、最適解判定プログラム、非一時的記録媒体及び最適解判定装置
JP5699768B2 (ja) 回路シミュレーション方法および回路シミュレーション装置
Spencer et al. Incorporating functional genomic information in genetic association studies using an empirical Bayes approach
US20170039315A1 (en) Information processing apparatus and simulation method
US20140136152A1 (en) Analyzing hardware designs based on component re-use
US7185298B2 (en) Method of parasitic extraction from a previously calculated capacitance solution
JPWO2008081544A1 (ja) シミュレーションシステム、シミュレーションプログラムおよび該プログラムを記録した記録媒体
JP5668425B2 (ja) 障害検知装置、情報処理方法、およびプログラム
JP6805632B2 (ja) 設計予測装置、設計予測プログラムおよび設計予測方法
WO2022149394A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2022137969A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Nie et al. Machine Learning Framework Using Complex Network Features to Predict Wire-length
US20090192770A1 (en) Analysis supporting apparatus, analysis supporting method, and analysis supporting program
US20230326560A1 (en) Information processing apparatus, information processing method, and information processing program
Sotiriou et al. Swarm-A VLSI Timing, Fanout-aware Clustering Algorithm
JP2008299486A (ja) データ削除装置並びにデータ削除のための方法およびプログラム
Kasap et al. A high performance fpga-based implementation of position specific iterated blast

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21917616

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 3203480

Country of ref document: CA

ENP Entry into the national phase

Ref document number: 2022573954

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 202180089276.X

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021917616

Country of ref document: EP

Effective date: 20230807