WO2022045334A1 - 推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラム - Google Patents

推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラム Download PDF

Info

Publication number
WO2022045334A1
WO2022045334A1 PCT/JP2021/031711 JP2021031711W WO2022045334A1 WO 2022045334 A1 WO2022045334 A1 WO 2022045334A1 JP 2021031711 W JP2021031711 W JP 2021031711W WO 2022045334 A1 WO2022045334 A1 WO 2022045334A1
Authority
WO
WIPO (PCT)
Prior art keywords
inference
input data
lipid molecule
lipid
chemical structure
Prior art date
Application number
PCT/JP2021/031711
Other languages
English (en)
French (fr)
Inventor
友大 前田
臨 小川
Original Assignee
武田薬品工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 武田薬品工業株式会社 filed Critical 武田薬品工業株式会社
Priority to US18/022,491 priority Critical patent/US20240038340A1/en
Priority to EP21861755.3A priority patent/EP4207205A1/en
Priority to CN202180052991.6A priority patent/CN115989511A/zh
Priority to JP2022545756A priority patent/JPWO2022045334A1/ja
Publication of WO2022045334A1 publication Critical patent/WO2022045334A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Definitions

  • the present disclosure relates to an inference device, an inference method, an inference program, a model generation method, an inference service providing system, an inference service providing method, and an inference service providing program.
  • a drug delivery system using particles containing lipid molecules is known for introducing active substances such as nucleic acids into cells with high efficiency.
  • particles of a complex are formed by including the active substance in particles containing a lipid molecule, and the active substance is introduced into the cell (transfection) through the particles of the complex. ) Is performed.
  • DDS drug Delivery System
  • Such DDS is used not only for transfection into in vivo cells by administration to a living body, but also for transfection into cells in vitro (in vitro, in situ or ex vivo).
  • the design and selection of the chemical structure of the lipid molecules constituting the particles containing the active substance are generally performed manually, the design and selection of appropriate lipid molecules according to the purpose is based on the experience of the expert and the selection. It depends largely on know-how.
  • lipid molecules with a designed or selected chemical structure are evaluated experimentally, and the work of redesigning and selecting according to the evaluation results is repeated, so it is necessary to search for a more suitable chemical structure of the lipid molecule. take time.
  • the present disclosure is intended to support the work of designing or selecting the chemical structure of lipid molecules that make up particles containing active substances.
  • the present inventors have generated a learning model based on data such as chemical structure information of lipid molecules, transfection efficiency and / or cell viability, and chemistry of lipid molecules using this. It has been found that structural information, transfection efficiency and / or cell viability can be inferred.
  • the present disclosure provides: [1] An acquisition unit that acquires input data including at least chemical structure information of lipid molecules, and For a learning model that correlates at least the input data containing the chemical structural information of the lipid molecule with the transfection efficiency and / or cell viability of the active substance contained in the particles containing the lipid molecule into cells. It has a trained model generated by the training process, and has The trained model is an inference device that infers the transfection efficiency and / or the cell viability associated with the input data newly acquired by the acquisition unit. [2] The transfection efficiency and / or cell viability used when the learning process is performed is a particle containing a lipid molecule having chemical structural information used when the learning process is performed.
  • the inference device which is calculated from the measurement results measured by introducing the contained active substance into cells.
  • the output when input data including at least the chemical structure information of the lipid molecule is input to the learning model is the transfection efficiency and / or the cell viability calculated from the measurement result.
  • the inference device which is generated by updating the model parameters of the learning model so as to approach. "4"
  • the acquisition unit performs a predetermined pretreatment on the newly acquired input data, and the trained model is a transfection efficiency and / or cell associated with the input data after the pretreatment.
  • the inference device which infers the survival rate.
  • It is an inference program for making a computer execute an execution process that executes a trained model generated by performing a training process.
  • the execution step is an inference program that infers the transfection efficiency and / or the cell viability associated with the input data newly acquired in the acquisition step by executing the trained model.
  • a learning model that correlates at least input data including chemical structural information of lipid molecules with transfection efficiency and / or cell viability of active substances contained in particles containing the lipid molecules.
  • a model generation method that generates a trained model by performing training processing.
  • the trained model is an inference device that infers the chemical structure information of the lipid molecule associated with the input data newly acquired by the acquisition unit.
  • the input data used when the learning process is performed is a measurement measured by introducing an active substance contained in particles containing a designed or selected lipid molecule into cells.
  • the inference apparatus according to [8] which comprises the transfection efficiency and / or cell viability of the active substance contained in the particles containing the lipid molecule, which is calculated from the result, into cells.
  • the output when the input data including the preconditions is input to the learning model is close to the chemical structure information of the lipid molecule used when the learning process is performed.
  • the inference device according to [8] which is generated by updating the model parameters of the learning model.
  • the acquisition unit performs a predetermined pretreatment on the newly acquired input data, and the trained model obtains the chemical structure information of the lipid molecule associated with the input data after the pretreatment.
  • the inference device according to [8] for inferring.
  • a reasoning method that has an execution process that executes a trained model that has been trained.
  • the execution step is an inference method that infers the chemical structure information of the lipid molecule associated with the input data newly acquired in the acquisition step by executing the trained model.
  • It is an inference program for making a computer execute an execution process that executes a trained model.
  • the execution step is an inference program that infers the chemical structure information of the lipid molecule associated with the input data newly acquired in the acquisition step by executing the trained model.
  • Trained model By inputting input data including preconditions newly acquired by the user by the acquisition unit, an inference having a providing unit that provides the user with the chemical structure information of the lipid molecule inferred by the learned model.
  • Service provision system By inputting input data including preconditions newly acquired by the user by the acquisition unit, the trained model charges the user when the chemical structure information of the lipid molecule is inferred.
  • the inference service providing system according to [15], further comprising a billing unit.
  • the lipid molecule is contained, which is calculated from the measurement result measured by introducing the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the trained model into the cell.
  • the charging unit changes the charging content to the user [16].
  • the inference service providing system described in. [18] The acquisition process of acquiring from the user the prerequisites for designing or selecting the lipid molecules that make up the particles containing the active substance, Generated by performing a learning process on a learning model that associates input data including prerequisites for designing or selecting lipid molecules that make up particles containing active substances with chemical structural information of the lipid molecules.
  • the execution process to execute the trained model, and By inputting input data including preconditions newly acquired by the user in the acquisition step, the user has a providing step of providing the chemical structure information of the lipid molecule inferred by the learned model to the user.
  • Inference service provision method [19] The acquisition process of acquiring from the user the prerequisites for designing or selecting the lipid molecules that make up the particles containing the active substance, Generated by performing a learning process on a learning model that associates input data including prerequisites for designing or selecting lipid molecules that make up particles containing active substances with chemical structural information of the lipid molecules. The execution process to execute the trained model, and A computer provides the user with the chemical structure information of the lipid molecule inferred by the trained model by inputting the input data including the preconditions newly acquired by the user in the acquisition process. A program that provides an inference service to be executed by a computer. [20] An acquisition unit that acquires input data including prerequisites for designing or selecting lipid molecules that make up particles containing active substances.
  • a reinforcement learning model that infers chemical structural information of lipid molecules by inputting input data including preconditions acquired by the acquisition unit, and The lipid molecule is contained, which is calculated from the measurement result measured by introducing the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the enhanced learning model into the cell. It has a calculation unit that calculates the reward based on the transfection efficiency and / or the cell viability of the active substance contained in the particles.
  • the reinforcement learning model is an inference device that performs learning processing based on a reward calculated by the calculation unit. [21] The inference device according to [20], wherein the calculation unit calculates the reward so as to be maximized by increasing the transfection efficiency and / or the cell survival rate.
  • the acquisition unit performs a predetermined pretreatment on the input data, and the reinforcement learning model infers the chemical structure information of the lipid molecule by inputting the input data after the pretreatment.
  • the inference device according to [20].
  • the lipid molecule is contained, which is calculated from the measurement result measured by introducing the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the enhanced learning model into the cell.
  • the reinforcement learning model is an inference method that performs learning processing based on the reward calculated in the calculation process.
  • the lipid molecule is contained, which is calculated from the measurement result measured by introducing the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the enhanced learning model into the cell.
  • the reinforcement learning model is an inference program that performs learning processing based on the reward calculated in the calculation process.
  • a reinforcement learning model that infers chemical structure information of lipid molecules by inputting input data including preconditions acquired by the user by the acquisition unit.
  • a providing unit that provides the user with the chemical structure information of the lipid molecule inferred by the reinforcement learning model.
  • the lipid molecule is contained, which is calculated from the measurement result measured by introducing the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the enhanced learning model into the cell. It has a calculation unit that calculates the reward based on the transfection efficiency and / or the cell viability of the active substance contained in the particles.
  • the reinforcement learning model is an inference service providing system that performs learning processing based on a reward calculated by the calculation unit. [26]
  • the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the enhanced learning model is calculated from the measurement result measured by being introduced into the cell.
  • the charging unit changes the charging content to the user.
  • the inference service providing system [28] An acquisition step of acquiring a prerequisite for designing or selecting a lipid molecule constituting a particle containing an active substance from a user, and An execution step of executing a reinforcement learning model for inferring chemical structure information of lipid molecules by inputting input data including preconditions acquired by the user in the acquisition step, and an execution step.
  • a step of providing the chemical structure information of the lipid molecule inferred by the reinforcement learning model to the user, and The lipid molecule calculated from the measurement result measured by introducing the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the enhanced learning model into the cell is used.
  • a method for providing an inference service comprising a calculation step of calculating a reward based on the efficiency of transfection of an active substance contained in the contained particles into cells and / or the cell viability.
  • the reinforcement learning model is an inference service providing method that performs learning processing based on the reward calculated in the calculation process.
  • a step of providing the chemical structure information of the lipid molecule inferred by the reinforcement learning model to the user, and The lipid molecule calculated from the measurement result measured by introducing the active substance contained in the particles containing the lipid molecule having the chemical structure information inferred by the enhanced learning model into the cell is used.
  • a inference service providing program for causing a computer to perform a calculation step of calculating a reward based on the efficiency of transfection of an active substance contained in the contained particles into cells and / or the cell viability.
  • the reinforcement learning model is an inference service providing program that performs learning processing based on the reward calculated in the calculation process.
  • a learning model that correlates at least input data containing chemical structural information of a lipid molecule with transfection efficiency and / or cell viability of an active substance contained in particles containing the lipid molecule.
  • the generation unit is Based on the inference result, one of the search spaces is selected from a plurality of search spaces according to the combination of the molecular fragment of the formable hydrocarbon and the chemical skeleton of the lipid molecule, and the characteristics of the selected search space are used.
  • the inference apparatus which generates chemical structure information of the next new lipid molecule.
  • the reasoning apparatus according to [31], wherein the plurality of search spaces differ from each other in the combination of the length, saturation, and number of branches of the molecular fragment and the type of the chemical skeleton of the lipid molecule.
  • the inference device wherein the generation unit generates chemical structure information of the next new lipid molecule under a predetermined constraint condition.
  • the inference device wherein the generation unit generates chemical structure information of the next new lipid molecule with the acquired precondition as the predetermined constraint.
  • a learning model that correlates at least input data containing chemical structural information of a lipid molecule with transfection efficiency and / or cell viability of an active substance contained in particles containing the lipid molecule.
  • the execution process that executes the trained model generated by the training process, and If the transfection efficiency and / or cell viability associated with the input data, including the chemical structural information of the newly generated lipid molecule, was inferred by the trained model, then based on the inference results, the next new A transfection method comprising a generation step of repeating a generation process for generating chemical structural information of a lipid molecule until a predetermined termination condition is satisfied.
  • a learning model that correlates at least input data containing chemical structural information of a lipid molecule with transfection efficiency and / or cell viability of an active substance contained in particles containing the lipid molecule.
  • the execution process that executes the trained model generated by the training process, and If the transfection efficiency and / or cell viability associated with the input data, including the chemical structural information of the newly generated lipid molecule, was inferred by the trained model, then based on the inference results, the next new An inference program for causing a computer to perform a generation process that repeats the generation process for generating chemical structural information of lipid molecules until certain termination conditions are met.
  • FIG. 1 is a diagram showing an example of accumulating various data in the drug delivery system review process.
  • FIG. 2 is a diagram showing an application example of the inference device according to the first embodiment.
  • FIG. 3 is a diagram showing an example of the hardware configuration of the inference device.
  • FIG. 4 is a diagram showing an example of the functional configuration of the learning device according to the first embodiment.
  • FIG. 5 is a diagram showing an example of the functional configuration of the inference device according to the first embodiment.
  • FIG. 6 is an example of a flowchart showing the flow of transfection efficiency and / or cell viability inference processing.
  • FIG. 7A is a diagram showing an embodiment of the learning device.
  • FIG. 7B is a diagram showing an embodiment of the inference device.
  • FIG. 7A is a diagram showing an embodiment of the learning device.
  • FIG. 7B is a diagram showing an embodiment of the inference device.
  • FIG. 8 is a diagram showing an application example of the inference device according to the second embodiment.
  • FIG. 9 is a diagram showing an example of the functional configuration of the learning device according to the second embodiment.
  • FIG. 10 is a diagram showing an example of the functional configuration of the inference device according to the second embodiment.
  • FIG. 11 is an example of a flowchart showing the flow of the chemical structure information inference processing of the lipid molecule.
  • FIG. 12 is a diagram showing an application example of the inference service providing system according to the third embodiment.
  • FIG. 13 is an example of a flowchart showing the flow of the inference service provision process.
  • FIG. 14 is a diagram showing an application example of the inference service providing system according to the fourth embodiment.
  • FIG. 14 is a diagram showing an application example of the inference service providing system according to the fourth embodiment.
  • FIG. 15 is a diagram showing an example of the functional configuration of the inference device according to the fourth embodiment.
  • FIG. 16 is another example of a flowchart showing the flow of the inference service provision process.
  • FIG. 17 is a diagram showing an example of the functional configuration of the inference device according to the fifth embodiment.
  • FIG. 18 is an example of a flowchart showing the flow of the generation process.
  • FIG. 19 is a diagram showing an example of the functional configuration of the inference device according to the sixth embodiment.
  • FIG. 1 is a diagram showing an example of accumulating various data in the drug delivery system review process.
  • the particles containing the active substance are at least, -A case where lipid molecules are mixed with an active substance (for example, nucleic acid 140) to form complex particles.
  • a lipid molecule forms an outer shell and a complex substance is formed by containing an active substance (for example, nucleic acid 140) in the outer shell.
  • Examples of the lipid molecule treated in one aspect of the present disclosure include a cationic lipid molecule.
  • Cationic lipid means a lipid having a net positive charge at a selected pH, such as physiological pH.
  • Examples of the method for producing particles containing a lipid molecule and an active substance include the methods described in International Publication No. 2016/021683, International Publication No. 2019/131389, and International Publication No. 2020/032184.
  • Examples of the lipid molecule treated in another aspect of the present disclosure include an anionic lipid molecule, a cholesterol derivative molecule, an amphiphilic lipid molecule and the like.
  • the nucleic acid treated in one aspect of the present disclosure may be any molecule as long as it is a polymer of a nucleotide and a molecule having a function equivalent to the nucleotide, for example, RNA which is a polymer of ribonucleotide, weight of deoxyribonucleotide.
  • RNA which is a polymer of ribonucleotide, weight of deoxyribonucleotide.
  • examples thereof include a polymer in which combined DNA, ribonucleotides and deoxyribonucleotides are mixed, and a nucleotide polymer containing a nucleotide analog, and may be a nucleotide polymer containing a nucleic acid derivative.
  • the nucleic acid may be a single-stranded nucleic acid or a double-stranded nucleic acid.
  • the double-stranded nucleic acid also includes a double-stranded nucleic acid in which one strand is hybridized with the other strand under stringent conditions.
  • the nucleic acid handled in the present embodiment is not particularly limited, and is, for example, improvement of a disease, symptom, disorder, or pathological condition, reduction of the disease, symptom, disorder, or pathological condition, or prevention of its onset (the present invention).
  • nucleic acid for the purpose of "treatment of a disease, etc.”), and it may be used to regulate the expression of a desired protein useful for research, although it does not contribute to the treatment of a disease, etc. It may be a nucleic acid of.
  • Specific examples of the nucleic acids handled in the present embodiment include siRNA, miRNA, miRNA mimic, antisense nucleic acid, ribozai ⁇ , mRNA, decoy nucleic acid, aptamer, DNA, and analogs or derivatives obtained by artificially modifying these. Can be mentioned.
  • the designer 110 designs or selects the chemical structure of the lipid molecule from the design prerequisite 101 based on the experience and know-how so far.
  • the lipid molecule 111 having the chemical structure designed or selected by the designer 110 is subjected to experimental processing and evaluation processing by the experimenter and the evaluator 120, and the evaluation data 121 is notified to the designer 110.
  • the designer 110 redesigns or selects the chemical structure of the lipid molecule based on the notified evaluation data 121.
  • the lipid molecule 111'(not shown) having the chemical structure redesigned or selected by the designer 110 is subjected to the experimental treatment and the evaluation treatment again by the experimenter and the evaluator 120, and the evaluation data 121'(not shown) is obtained.
  • the designer 110 is notified.
  • the design or selection by the designer 110 and the experimental processing and evaluation processing by the experimenter and the evaluator 120 are repeated a plurality of times. This allows the designer 110 to search for a more suitable chemical structure of the lipid molecule that constitutes the particle containing the nucleic acid 140.
  • the nucleic acid 140 is contained by the particles containing the generated lipid molecule 130, and the nucleic acid 140 is complexed. Particles of body 150 are formed.
  • the particles of the complex 150 may contain components other than the lipid molecule and the nucleic acid, if necessary, in addition to the nucleic acid 140. Examples of such components include appropriate amounts of stabilizers, antioxidants and the like. These ingredients can be pharmaceutically acceptable ingredients.
  • the formed complex 150 particles are applied to 160 target animals and the like, and in vitro (in vitro, in situ or ex vivo) cells and / or tissues 160 and the like. Changes (or in vitro (in vitro, in situ or ex vivo)) caused by the introduction of the particles of the complex 150 into specific cells in the body (in vivo) of 160 such as target animals (Changes caused by the introduction) are measured by various measuring methods and measuring instruments, and are output as effect data 161.
  • a method for applying the particles of the complex 150 to the target animal or the like 160 a method known to those skilled in the art may be used.
  • Specific examples of the method of application to the target animals 160 include intravenous, intramuscular, intraperitoneal, intracerebral intrathecal (intracerobrospinal), subcutaneous, intra-articular, and synovial fluid as a bolus or by continuous injection over a certain period of time.
  • Intramuscular, intrathecal, oral, topical or inhalation routes may be mentioned. Further, those skilled in the art can appropriately determine the number of administrations, the dose, and the administration interval.
  • particles of the complex 150 are placed in a container in which the cells of interest are cultured. Addition and culturing for a certain period may be mentioned. A person skilled in the art can appropriately determine the number of additions, the amount of addition, the interval of addition, the culture conditions, the culture period, and the like.
  • the effect data 161 includes the transfection efficiency and / or the cell viability of the nucleic acid 140 contained in the particles containing the lipid molecule 130, which is calculated from the measurement results.
  • the transfection efficiency can be appropriately evaluated using a known method based on the attributes of the nucleic acid as an active substance and the like.
  • siRNA when siRNA is used as a nucleic acid, it can be evaluated based on the knockdown rate of the expression of the gene targeted by the siRNA. More specifically, the expression level of the gene (for example, mRNA) in the group (administered group) to which the particles containing the siRNA were administered, and the control group (for example, the group to which nothing was administered, siRNA-free or particles).
  • the cell viability when transfected can also be appropriately evaluated using a known method. For example, it can be evaluated by comparing the number of cells before application and the number of cells after application and measuring the ratio of the number of cells after application to the number of cells before application. A person skilled in the art can appropriately select a method for measuring the number of cells and a measuring instrument.
  • the evaluation data and effect data exemplify the transfection efficiency and cell viability into cells, and further, the pharmacokinetics (absorption) of nucleic acid 140 in vivo when the particles of the complex 150 are applied to 160 such as a target animal. , Distribution, metabolism) and toxicity data may also be included, but not limited to these.
  • various data acquired in these series of flows in the drug delivery system review process 100 are stored in the data storage unit 170 regarding the drug delivery system.
  • various data stored in the data storage unit 170 regarding the drug delivery system include, for example, -Design prerequisites 101, ⁇ Evaluation data 121, -Chemical structure information of lipid molecule 130, -Type of nucleic acid 140, chemical structure information, ⁇ Chemical structure information of complex 150, Effect data 161 (including transfection efficiency and / or cell viability), Etc. are included.
  • the chemical structure information of the lipid molecule is not particularly limited, and examples thereof include a chemical formula, a three-dimensional structure, a molecular weight, a number of carbon atoms, a number of nitrogen atoms, a number of oxygen atoms, and an electric charge.
  • the chemical structure information of the nucleic acid is not particularly limited, and examples thereof include the number of bases constituting the nucleic acid, the chemical formula, the three-dimensional structure, the molecular weight, and the electric charge.
  • Examples of the chemical structure information of the complex include the particle size and membrane potential of the complex.
  • the various data stored in the data storage unit 170 regarding the drug delivery system may further include various public information (for example, patent gazettes, papers) and data that can be obtained from a database.
  • FIG. 2 is a diagram showing an application example of the inference device according to the first embodiment.
  • 260 or in vitro (in vitro, in situ or ex vivo) cells and / or tissue 260), ⁇ Types of 260 diseases such as target animals, Attributes of the included active substance (eg, nucleic acid 240) (eg, type of active substance (eg, nucleic acid 240), chemical structure information, etc.), A target into which particles of the complex 250 are introduced (specific cells in vivo (in vivo) such as a target animal or specific cells 260 in vitro (in vitro, in situ or ex vivo)). Etc. are input to the designer 110.
  • active substance eg, nucleic acid 240
  • a target into which particles of the complex 250 are introduced specific cells in vivo (in vivo) such as a target animal or specific cells 260 in vitro (in vitro, in situ or ex vivo)
  • Etc. are input to the designer 110.
  • the designer 110 designs or selects the chemical structure of the lipid molecule from the design prerequisite 201 based on the experience and know-how so far.
  • the chemical structure information of the lipid molecule 211 having the chemical structure designed or selected by the designer 110 is input to the inference device 220.
  • the inference device 220 has a trained model generated by the learning device 210.
  • the learning device 210 generates a trained model by performing a learning process on the learning model using a learning data set generated based on various data stored in the data storage unit 170 related to the drug delivery system. do.
  • the inference device 220 uses the trained model generated by the learning device 210 to generate evaluation data 221 for the chemical structure information of the lipid molecule 211.
  • the evaluation data 221 generated by the inference device 220 is notified to the designer 110.
  • the design or selection by the designer 110 and the generation of the evaluation data by the inference device 220 are repeated a plurality of times. This allows the designer 110 to search for a more suitable chemical structure of the lipid molecule that constitutes the particle containing the nucleic acid 240.
  • the nucleic acid 240 is contained by the particles containing the generated lipid molecule 230, and the nucleic acid 240 is complexed. Particles of body 250 are formed.
  • the particles of the complex 250 may contain components other than the lipid molecule and the nucleic acid, if necessary, in addition to the nucleic acid 240. Examples of such components include appropriate amounts of stabilizers, antioxidants and the like. These ingredients can be pharmaceutically acceptable ingredients.
  • the formed complex 250 particles are applied to 260 target animals and the like, and in vitro (in vitro, in situ or ex vivo) cells and / or tissues 260 and the like. Changes caused by the introduction of the particles of the complex 250 into specific cells in vivo (in vivo) such as the target animal (or in vitro, in situ or ex vivo) to specific cells 260 (Changes caused by the introduction) are measured by various measuring methods and measuring instruments, and are output as effect data 261.
  • a method for applying the particles of the complex 250 to the target animal or the like 260 a method known to those skilled in the art may be used.
  • Specific examples of the method of application to the target animals such as 260 include intravenous, intramuscular, intraperitoneal, intracerebral intrathecal (intracerobrospinal), subcutaneous, intra-articular, and synovial fluid as a bolus or by continuous injection over a certain period of time.
  • Intramuscular, intrathecal, oral, topical or inhalation routes may be mentioned.
  • a person skilled in the art can appropriately determine and design the number of administrations, the dose, and the administration interval.
  • particles of the complex 250 are placed in a container in which the cells of interest are cultured. Addition and culturing for a certain period may be mentioned. A person skilled in the art can appropriately determine the number of additions, the amount of addition, the interval of addition, the culture conditions, the culture period, and the like.
  • the change caused by the introduction of the particles of the complex 250 into a specific cell or the like in vivo of the target animal or the like 260 is the target animal or the like 260 into which the particles of the complex 250 are introduced, or It can be grasped by measuring a sample containing the specific cell collected from the target animal or the like 260.
  • the sample is not particularly limited as long as the specific cell is contained, and is not limited to whole blood, plasma, urine, serum, lymph, saliva, anal and vaginal secretions, sweat and semen, body fluids not limited thereto, and organs. , Tissue samples and cells obtained from tissue biopsy.
  • the collected sample may be labeled by any known method for use in measurement.
  • target animals include, but are not limited to, animals such as mice, rats, guinea pigs, dogs, cats, rabbits, cows, horses, sheep, goats, and pigs, in addition to humans.
  • the target animal or the like may be a healthy human or animal, or may be a human (patient) or animal suffering from some kind of disease.
  • any in vitro or in vivo method known to those skilled in the art may be used. Specific examples thereof include flow cytometry, immunological assay, mRNA transcript analysis, PCR method and hybridization method. Alternatively, sequencing methods, RFLP methods, Western blots, ELISAs, radioimmunoassays, immunoprecipitation, FACS, HPLC, surface plasmon resonance, optical spectroscopy, mass spectrometry and the like can be mentioned.
  • the transfection efficiency to cells and the cell viability are exemplified as measurement results, but the measurement items are not limited thereto.
  • the effect data 261 includes the transfection efficiency and / or the cell viability of the nucleic acid 240 contained in the particles containing the lipid molecule 230, which is calculated from the measurement results.
  • the effect data 261 may further include data on the pharmacokinetics (absorption, distribution, metabolism) and toxicity of the nucleic acid 240 in vivo when the particles of the complex 250 are applied to 260 of the target animal, etc., and are limited thereto. Not done.
  • the evaluation data 121 is generated by performing the experimental processing and the evaluation processing by the experimenter and the evaluator 120, but by applying the inference device 220, the experimental processing and the evaluation processing can be performed. Evaluation data 221 can be generated without doing this.
  • FIG. 3 is a diagram showing an example of the hardware configuration of the inference device.
  • the inference device 220 includes a processor 301, a memory 302, an auxiliary storage device 303, an I / F (Interface) device 304, a communication device 305, and a drive device 306.
  • the hardware of the inference device 220 is connected to each other via the bus 307.
  • the processor 301 has various arithmetic devices such as a CPU (Central Processing Unit) and a GPU (Graphics Processing Unit).
  • the processor 301 reads various programs installed in the auxiliary storage device 303 onto the memory 302 and executes them.
  • the memory 302 has a main storage device such as a ROM (ReadOnlyMemory) and a RAM (RandomAccessMemory).
  • the processor 301 and the memory 302 form a so-called computer, and the processor 301 executes various programs read on the memory 302, so that the computer realizes various functions.
  • the auxiliary storage device 303 stores various programs and various data used when various programs are executed by the processor 301.
  • the I / F device 304 is a connection device that connects the operation device 310, the display device 311 and the inference device 220.
  • the I / F device 304 receives various instructions to the inference device 220 via the operation device 310. Further, the I / F device 304 outputs the processing result of the inference device 220 via the display device 311.
  • the communication device 305 is a communication device for communicating with other devices via a network.
  • the drive device 306 is a device for setting the recording medium 312.
  • the recording medium 312 referred to here includes a medium such as a CD-ROM, a flexible disk, a magneto-optical disk, or the like that optically, electrically, or magnetically records information. Further, the recording medium 312 may include a semiconductor memory or the like for electrically recording information such as a ROM or a flash memory.
  • the various programs installed in the auxiliary storage device 303 are installed, for example, by setting the distributed recording medium 312 in the drive device 306 and reading the various programs recorded in the recording medium 312 by the drive device 306. Will be done.
  • various programs installed in the auxiliary storage device 303 may be installed by being downloaded from the network via the communication device 305.
  • FIG. 4 is a diagram showing an example of the functional configuration of the learning device according to the first embodiment.
  • the learning data set 400 is an example of a learning data set generated based on various data stored in the data storage unit 170 related to the drug delivery system.
  • the items of each information of the learning data are illustrated below, but the present invention is not limited to these, and a part or all of them can be appropriately used as the learning data. ..
  • the learning data set 400 has input data and correct answer data, and the input data contains, for example, “disease type”, “nucleic acid type”, and “introduction” as information items. Includes “target”, “chemical structure information of lipid molecules”, and “attribute information of target animals, etc.”
  • the "disease type” includes, for example, when the target animal or the like 160 is a patient (hereinafter, may be referred to as a "target patient” in the present specification), the type of the disease, "disease A1". Stored.
  • nucleic acid type for example, "nucleic acid X 1 ", “nucleic acid X 2 " and the like are stored as the type of nucleic acid corresponding to "disease A 1 ".
  • Examples of the information indicating the target cell referred to here include the origin or the organ or tissue in which the cell is present in the living body, the type of cell (for example, nerve cell, parenchymal cell, stromal cell, etc.) and the like. However, it is not limited to these.
  • “Chemical structure information of lipid molecules” is more appropriate than previously designed or selected by the designer 110 based on design prerequisites 101 such as “type of disease”, “type of nucleic acid”, “target of introduction”. Information indicating the chemical structure of various lipid molecules is stored.
  • the attribute information of the target animal or the like 160 (for example, the target patient) is stored.
  • the correct answer data includes "transfection efficiency and / or cell viability" as an information item.
  • the "transfection efficiency and / or cell viability” stores the transfection efficiency and / or cell viability of the nucleic acid contained in the particles containing the lipid molecule into the cells.
  • the particles of the corresponding complex are applied to the corresponding target animal such as 260 or in vitro (in vitro, in situ or ex vivo) cells and / or tissue 260, and the applied target animal is applied.
  • Etc. and / or cell viability calculated from the measurement results obtained by measuring the sample isolated from the transfection efficiency and / or the cell viability are stored.
  • These learning data sets may be data obtained from various public information (for example, patent gazettes, papers) or databases.
  • a learning program is installed in the learning device 210, and when the learning program is executed, the learning device 210 functions as a preprocessing unit 410, a learning model 420, and a comparison / change unit 430.
  • the pre-processing unit 410 acquires "input data" of the learning data set 400 and performs various pre-processing to generate pre-processing and post-processing data suitable for input to the learning model 420.
  • the various pre-processing performed by the pre-processing unit 410 includes a process of normalizing the input data, a process of vectorizing the input data, and the like.
  • the learning model 420 is a model that associates input data with correct answer data (transfection efficiency and / or cell viability). Specifically, the learning model 420 takes the post-treatment data notified by the pre-treatment unit 410 as an input, and outputs the transfection efficiency and / or the cell survival rate.
  • a learning process for updating the model parameters is performed by back-propagating the error calculated by the comparison / change unit 430.
  • This will generate a trained model. That is, the trained model is generated by updating the model parameters of the training model 420 so that the output of the training model 420 approaches the correct data (transfection efficiency and / or cell viability).
  • the comparison / change unit 430 compares the transfection efficiency and / or the cell survival rate output from the learning model 420 with the correct answer data (transfection efficiency and / or the cell survival rate) of the learning data set 400. Calculate the error. Further, the comparison / change unit 430 updates the model parameters of the learning model 420 by back-propagating the calculated error.
  • FIG. 5 is a diagram showing an example of the functional configuration of the inference device according to the first embodiment.
  • the input data 500_1, 500_2, 500_3, ... -Information included in the design prerequisite 201 type of disease, type of nucleic acid, target of introduction, attribute information of target animal, etc.
  • the input data may be various public information (for example, patent gazettes, papers) or data obtained from a database.
  • Input data 500_1, 500_2, 500_3, ... Containing chemical structure information of different lipid molecules are input to the inference device 220.
  • An inference program is installed in the inference device 220, and when the inference program is executed, the inference device 220 functions as a preprocessing unit 510, a trained model 520, and an evaluation data generation unit 530.
  • the pre-processing unit 510 is an example of the acquisition unit, and has the same function as the pre-processing unit 410 of the learning device 210. Specifically, the preprocessing unit 510 acquires the input data 500_1, 500_2, 500_3, ..., And performs various preprocessing on the acquired input data 500_1, 500_2, 500_3, .... , Generate post-processing data.
  • the trained model 520 is a trained model generated by performing a training process by the learning device 210, and inputs preprocessed data notified from the preprocessing unit 510 as input to transfection efficiency and / or cell survival. Infer the rate.
  • the evaluation data generation unit 530 generates evaluation data 540_1, 540_2, 540_3, ... Based on the transfection efficiency and / or the cell survival rate inferred by the trained model 520.
  • the transfection efficiency and / or cell viability is inferred for the lipid molecule having the chemical structure designed or selected by the designer 110 without performing experimental treatment and evaluation treatment. Evaluation data can be generated.
  • FIG. 6 is an example of a flowchart showing the flow of transfection efficiency and / or cell viability inference processing.
  • step S601 the learning device 210 acquires various data from the data storage unit 170 related to the drug delivery system.
  • step S602 the learning device 210 generates a learning data set 400 using various acquired data.
  • step S603 the learning device 210 performs learning processing on the learning model 420 using the learning data set 400, and generates a trained model 520.
  • step S604 the inference device 220 acquires input data (for example, input data 500_1) including chemical structure information of the lipid molecule newly designed or selected by the designer 110.
  • step S605 the inference device 220 executes the trained model 520 by inputting the acquired input data (for example, input data 500_1) into the trained model 520, and infers the transfection efficiency and / or the cell survival rate. do.
  • the inference device 220 also generates evaluation data (eg, evaluation data 540_1) based on the inferred transfection efficiency and / or cell viability.
  • step S606 the inference device 220 determines whether or not there is the next input data (for example, input data 500_2, 500_3, ).
  • step S606 If it is determined in step S606 that there is the next input data (YES in step S606), the process returns to step S604.
  • step S606 determines whether there is no next input data (NO in step S606). If it is determined in step S606 that there is no next input data (NO in step S606), the transfection efficiency and / or cell viability inference process is terminated.
  • the inference device 220 is -Obtain input data including at least chemical structure information of lipid molecules. -Generated by performing a learning process on a learning model that correlates input data with cell transfection efficiency and / or cell viability of nucleic acids contained in particles containing lipid molecules. Have a trained model. The trained model infers transfection efficiency and / or cell viability associated with newly acquired input data.
  • the inference device 220 according to the first embodiment it is possible to shorten the time required to search for a more suitable chemical structure of the lipid molecule constituting the particles containing the nucleic acid. That is, according to the inference device 220 according to the first embodiment, it is possible to support the work for designing or selecting the chemical structure of the lipid molecule constituting the particle containing the nucleic acid.
  • Example 1 ⁇ Example 1 >> Hereinafter, specific examples of the learning device 210 and the inference device 220 according to the first embodiment will be described. The following examples are merely examples, and the learning device 210 and the inference device 220 according to the first embodiment are not limited to the following examples.
  • the training data set is divided into a training data set and a verification data set, and the training model is trained using the training data set. Generate a model. Further, in this embodiment, the inference accuracy of the inference device 220 was evaluated using the data set for verification.
  • FIG. 7A is a diagram showing an embodiment of the learning device.
  • the preprocessing unit 410 has a conversion unit 710, and the conversion unit 710 reads input data from the data set for learning and converts it into a molecular descriptor.
  • the example of FIG. 7A shows a state in which the chemical structure information of 75 lipid molecules is read out from the chemical structure information 0001 of the lipid molecule to the chemical structure information 0200 of the lipid molecule and converted into 200 molecular descriptors.
  • reference numeral 701 indicates the chemical structure information of one of the 75 lipid molecules read out by the conversion unit 710.
  • the pretreatment unit 410 has an extraction unit 720, and deletes a molecular descriptor that is not suitable for use in the learning process from the 200 molecular descriptors.
  • the extraction unit 720 deletes the molecular descriptor having a small dispersion among the 200 molecular descriptors, and further deletes the molecular descriptor in which colinearity is recognized.
  • the extraction unit 720 extracts a molecular descriptor suitable for use in the learning process.
  • reference numeral 711 is an example of the molecular descriptor extracted by the extraction unit 720, and is input to the learning model 420 as preprocessed data.
  • the learning model 420 uses "Gradient Boosting Decision Tree” as a machine learning algorithm, and it is assumed that hyperparameters are optimized by K-validation cross-validation.
  • the learning model 420 performs the learning process with the transfection efficiency as the correct answer data.
  • the training model 420 is trained so as to associate the pre-processed data (molecular descriptor) with the transfection efficiency, and the trained model 520 (see FIG. 7B) is generated.
  • FIG. 7B is a diagram showing an embodiment of the inference device.
  • the preprocessing unit 510 has a conversion unit 710, and the conversion unit 710 reads input data from the data set for verification and converts it into a molecular descriptor.
  • the conversion unit 710 reads out the chemical structure information of 16 lipid molecules from 0201 to 0216 of the chemical structure information of the lipid molecule and converts it into 200 molecular descriptors. Is shown.
  • reference numeral 801 indicates the chemical structure information of one of the 16 lipid molecules read out by the conversion unit 710.
  • the molecular descriptor converted by the conversion unit 710 is input to the trained model 520 as preprocessed data, and the trained model 520 infers the transfection efficiency.
  • reference numeral 802 is the result of evaluating the inference accuracy of the trained model 520 with respect to the chemical structure information of 16 lipid molecules included in the data set for verification. Specifically, reference numeral 802 indicates a state in which the inference value of the transfection efficiency is compared with the actually measured value, and the inference accuracy is evaluated using the correlation coefficient and the mean absolute error as indexes. As shown by reference numeral 802, in this example, it was confirmed that the trained model 520 can infer the transfection efficiency of the chemical structural information of 16 lipid molecules with high inference accuracy.
  • the learning device 210 is based on various data stored in the data storage unit 170 regarding the drug delivery system.
  • ⁇ Input data including chemical structure information of lipid molecules and • Transfection efficiency and / or cell viability, Described the case of generating a trained model that associates with.
  • the learning device is based on various data stored in the data storage unit 170 regarding the drug delivery system.
  • the second embodiment will be described focusing on the differences from the first embodiment.
  • FIG. 8 is a diagram showing an application example of the inference device according to the second embodiment.
  • design prerequisite 201 (specifically, design) in inferring more appropriate chemical structural information of lipid molecules constituting particles containing nucleic acid 240.
  • Input data including the information included in the precondition 201) of the above is input to the inference device 820.
  • the inference device 820 has a trained model generated by the learning device 810.
  • the learning device 810 generates a trained model by performing a learning process on the learning model using a learning data set generated based on various data stored in the data storage unit 170 related to the drug delivery system. do.
  • the inference device 820 executes the trained model generated by the learning device 810, and infers the chemical structure information 280 of the lipid molecule from the information (including input data) included in the precondition 201 of the design.
  • the lipid molecule 230 is generated based on the chemical structure information 280 inferred by the inference device 820, and the nucleic acid 240 is contained by the particles containing the generated lipid molecule 230. By doing so, particles of the complex 250 are formed.
  • the formed complex 250 particles are applied to 260 target animals and the like, and in vitro (in vitro, in situ or ex vivo) cells and / or tissues 260 and the like. Changes caused by the introduction of the particles of the complex 250 into specific cells in vivo (in vivo) such as the target animal (or in vitro, in situ or ex vivo) to specific cells 260 (Changes caused by the introduction) are measured by various measuring methods and measuring instruments, and are output as effect data 261.
  • the method of applying the particles of the complex 250 to the target animal or the like 260 or to cells and / or tissues in vitro (in vitro, in situ or ex vivo) is the same as that of the above-mentioned [first embodiment]. Can be used.
  • the effect data 261 includes the transfection efficiency and / or the cell viability of the nucleic acid 240 contained in the particles containing the lipid molecule 230, which is calculated from the measurement results. Transfection efficiency and cell viability can be evaluated in the same manner as in [First Embodiment] described above.
  • the effect data 261 exemplifies the transfection efficiency to cells and the cell survival rate, and further, the pharmacokinetics (absorption, distribution) of nucleic acid 240 in vivo when the particles of the complex 250 are applied to 260 of a target animal or the like. , Metabolism) and toxicity data may also be included, but not limited to these.
  • the design or selection of the chemical structure of the lipid molecule depends on the experience and know-how of the designer 110, but according to the inference device 820, from the information contained in the precondition 201 of the design, The chemical structure information 280 of the lipid molecule can be directly inferred.
  • a more suitable chemical structure of the lipid molecule constituting the particle containing the nucleic acid 240 can be designed or selected without depending on the experience and know-how of the designer 110. That is, according to the inference device 820 according to the second embodiment, it is possible to support the work for designing or selecting the chemical structure of the lipid molecule constituting the particle containing the nucleic acid.
  • FIG. 9 is a diagram showing an example of the functional configuration of the learning device according to the second embodiment.
  • the learning data set 900 is an example of a learning data set generated based on various data stored in the data storage unit 170 related to the drug delivery system.
  • the items of each information of the learning data are illustrated below, but the present invention is not limited to these, and a part or all of them can be appropriately used as the learning data.
  • the learning data set 900 has input data and correct answer data, and the input data includes "disease type”, “nucleic acid type”, and “introduction target” as information items. , “Transfection efficiency and / or cell viability”, “attribute information such as target animals” are included.
  • disease A 1 which is the type of the disease
  • nucleic acid type for example, "nucleic acid X 1 ", “nucleic acid X 2 " and the like are stored as the type of nucleic acid corresponding to "disease A 1 ".
  • Examples of the information indicating the target cell referred to here include the origin or the organ or tissue in which the cell is present in the living body, the type of cell (for example, nerve cell, parenchymal cell, stromal cell, etc.) and the like. However, it is not limited to these.
  • the "transfection efficiency and / or cell viability” stores the transfection efficiency and / or cell viability of the nucleic acid contained in the particles containing the lipid molecule into the cells. Specifically, the particles of the corresponding complex are applied to the corresponding target animal, etc. 160 or the cell and / or tissue 160 in vitro (in vitro, in situ or ex vivo), and the applied target animal, etc. The transfection efficiency and / or cell viability calculated from the measurement results obtained by measuring the sample isolated from the sample is stored.
  • These learning data sets may be data obtained from various public information (for example, patent gazettes, papers) or databases.
  • the attribute information of the target animal or the like 160 (for example, the target patient) is stored.
  • the correct answer data includes "chemical structure information of lipid molecules” as an information item.
  • “Chemical structure information of lipid molecule” is designed by the designer 110 in the past based on the information contained in the design prerequisite 101 such as "type of disease”, “type of nucleic acid”, and “target of introduction”. Information indicating the chemical structure of the selected more suitable lipid molecule is stored.
  • a learning program is installed in the learning device 810, and when the learning program is executed, the learning device 810 functions as a preprocessing unit 910, a learning model 920, and a comparison / change unit 930.
  • the pre-processing unit 910 acquires "input data" of the learning data set 900 and performs various pre-processing to generate pre-processing and post-processing data suitable for input to the learning model 920.
  • the various pre-processing performed by the pre-processing unit 910 includes a process of normalizing the input data, a process of vectorizing the input data, and the like.
  • the learning model 920 is a model that associates input data with correct answer data (chemical structure information of lipid molecules). Specifically, the learning model 920 takes the pretreatment and post-treatment data notified from the pretreatment unit 910 as an input, and outputs the chemical structure information of the lipid molecule.
  • a learning process for updating the model parameters is performed by back-propagating the error calculated by the comparison / change unit 930. This will generate a trained model. That is, the trained model is generated by updating the model parameters of the training model 920 so that the output of the training model 920 approaches the correct answer data (chemical structure information of the lipid molecule).
  • the comparison / change unit 930 calculates an error by comparing the chemical structure information of the lipid molecule output from the learning model 920 with the correct answer data (chemical structure information of the lipid molecule) of the learning data set 900. Further, the comparison / change unit 930 updates the model parameters of the learning model 920 by back-propagating the calculated error.
  • FIG. 10 is a diagram showing an example of the functional configuration of the inference device according to the second embodiment.
  • the input data 1000 includes information included in the design prerequisite 201 (disease type, nucleic acid type, introduction target, attribute information of target animal, etc.) and target transfection efficiency. And / or cell viability.
  • the input data may be various public information (for example, patent gazettes, papers) or data obtained from a database.
  • the input data 1000 is input to the inference device 820.
  • An inference program is installed in the inference device 820, and when the inference program is executed, the inference device 820 functions as a preprocessing unit 1010 and a trained model 1020.
  • the pre-processing unit 1010 is another example of the acquisition unit, and has the same function as the pre-processing unit 910 of the learning device 810. Specifically, the pre-processing unit 1010 acquires the input data 1000 and performs various pre-processing on the acquired input data 1000 to generate pre-processing and post-processing data.
  • the trained model 1020 is a trained model generated by performing a learning process by the learning device 810, and receives the pre-processed data notified from the pre-processing unit 1010 as input, and obtains the chemical structure information 280 of the lipid molecule. Infer.
  • the chemical structure information of the lipid molecule can be inferred directly from the information included in the preconditions of the design.
  • a more suitable chemical structure of the lipid molecule constituting the particle containing the nucleic acid 240 can be designed or selected without depending on the experience and know-how of the designer 110. That is, according to the inference device 820 according to the second embodiment, it is possible to support the work for designing or selecting the chemical structure of the lipid molecule constituting the particle containing the nucleic acid.
  • FIG. 11 is an example of a flowchart showing the flow of the chemical structure information inference processing of the lipid molecule.
  • step S1101 the learning device 810 acquires various data from the data storage unit 170 related to the drug delivery system.
  • step S1102 the learning device 810 generates a learning data set 900 using various acquired data.
  • step S1103 the learning device 810 performs learning processing on the learning model 920 using the learning data set 900, and generates a trained model 1020.
  • step S1104 the inference device 820 acquires input data (eg, input data 1000) including the information contained in the design prerequisite 201 and the target transfection efficiency and / or cell viability.
  • input data eg, input data 1000
  • step S1105 the inference device 820 executes the trained model 1020 by inputting the acquired input data (for example, input data 1000) into the trained model 1020, and infers the chemical structure information of the lipid molecule.
  • the acquired input data for example, input data 1000
  • the inference device 820 is -Obtain input data including prerequisites for designing or selecting lipid molecules that make up particles containing nucleic acids. -Generated by performing a learning process on a learning model that associates input data, including prerequisites for designing or selecting lipid molecules that make up particles containing nucleic acids, with chemical structural information of the lipid molecules. Has a trained model. The trained model infers the chemical structural information of the lipid molecule associated with the newly acquired input data.
  • a more suitable chemical structure of the lipid molecule constituting the particles containing nucleic acid can be designed or selected without depending on the experience and know-how of the designer. be able to. That is, according to the inference device 820 according to the second embodiment, it is possible to support the work for designing or selecting the chemical structure of the lipid molecule constituting the particle containing the nucleic acid.
  • -A learning data set is generated based on various data stored in the data storage unit 170 related to the drug delivery system.
  • a trained model is generated by performing training processing using the generated training data set.
  • the chemical structure information of lipid molecules can be inferred.
  • -By encapsulating nucleic acid with particles containing lipid molecules generated based on the inferred chemical structure information particles of the complex are formed.
  • the chemical structure information of the lipid molecule is inferred.
  • the user generates a lipid molecule, and by including the nucleic acid with the particles containing the generated lipid molecule, the user forms the particles of the complex.
  • the third embodiment it becomes possible to search for more suitable lipid molecules constituting particles containing each of the various types of nucleic acids possessed by the user, and to form particles containing nucleic acids. It is possible to accumulate a large amount of know-how for searching for more suitable lipid molecules.
  • the third embodiment will be described focusing on the differences from the first and second embodiments.
  • FIG. 12 is a diagram showing an application example of the inference service providing system according to the third embodiment.
  • the inference service providing system 1210 has an inference device 820 and an information providing device 1211.
  • the inference device 820 is the same as the inference device 820 described with reference to FIGS. 8 and 10 in the second embodiment. Specifically, the inference device 820 executes the trained model generated by the learning device 810 and infers the chemical structure information of the lipid molecule from the input data including the preconditions of the design.
  • the information providing device 1211 generates input data including the acquired design precondition 1221 and the design precondition 1231, respectively, and notifies the inference device 820.
  • the inference device 820 executes the trained model and infers the chemical structure information of the lipid molecule as in the second embodiment.
  • the information providing device 1211 also functions as a charging unit, and charges each user when providing information on the chemical structure of the lipid molecule to each user.
  • the inference service providing system 1210 can receive compensation according to the inference service of the chemical structure information of the lipid molecule.
  • the billing refers to a process of recording the amount of money each user should pay to the inference service providing system 1210.
  • the user 1220 provides the attribute information of the target animal or the like 1225, the type of the disease of the target animal or the like 1225, the attribute of the nucleic acid 1223, the precondition 1221 of the design such as the target for introducing the particles of the complex 1224, and the terminal (not shown). Is transmitted to the inference service providing system 1210 via.
  • the user 1220 is provided with the chemical structure information 1212_1 of the lipid molecule corresponding to the precondition 1221 of the design from the inference service providing system 1210 via a terminal (not shown).
  • the effect data 1226 includes transfection efficiency and / or cell viability of nucleic acid 1223 contained in particles containing the lipid molecule 1222 into cells, which is calculated from the measurement results.
  • the user 1220 registers various data acquired in the series of flow of the drug delivery system review process 1200 in the data storage unit 170 regarding the drug delivery system.
  • ⁇ "Design prerequisite 1” ⁇ "Chemical structure information of lipid molecules 1”, ⁇ Chemical structure information of "nucleic acid 1", ⁇ Chemical structure information of "complex 1", ⁇ "Effect data 1", Etc. are included.
  • the data 1227 regarding the drug delivery system registered by the user 1220 may be data obtained by the user 1220 from various public information (for example, patent gazettes, papers) or databases.
  • the inference service providing system 1210 refunds a part of the consideration received by providing the chemical structure information 1212_1 of the lipid molecule to the user 1220. .. That is, the inference service providing system 1210 changes the billing content for the user 1220.
  • the user 1230 can use the attribute information of the target animal or the like 1235, the type of the disease when the target animal or the like is a patient, the attributes of the nucleic acid 1233 (for example, the type of the nucleic acid 1233, the chemical structure information), and the complex 1234.
  • Prerequisites 1231 for the design of the object to which the particles are introduced are transmitted to the inference service providing system 1210 via a terminal (not shown).
  • the user 1230 is provided with the chemical structure information 1212_2 of the lipid molecule corresponding to the precondition 1231 of the design from the inference service providing system 1210 via a terminal (not shown).
  • the user 1230 applies the formed particles of the complex 1234 to the target animal or the like 1235, or to cells and / or tissues 1235 in vitro (in vitro, in situ or ex vivo).
  • the effect data 1236 includes the transfection efficiency and / or the cell viability of the nucleic acid 1233 contained in the particles containing the lipid molecule 1232, which is calculated from the measurement results.
  • the user 1230 registers various data acquired in the series of flow of the drug delivery system review process 1200 in the data storage unit 170 regarding the drug delivery system.
  • ⁇ "Design prerequisite 2” ⁇ "Chemical structure information of lipid molecules 2”, ⁇ Chemical structure information of "nucleic acid 2”, ⁇ Chemical structure information of "complex 2”, ⁇ "Effect data 2", Etc. are included.
  • the inference service providing system 1210 refunds a part of the consideration received by providing the chemical structure information 1212_2 of the lipid molecule to the user 1230. be able to. That is, in the inference service providing system 1210, the billing content for the user 1230 can be changed.
  • the inference service providing system 1210 provides chemical structure information of the lipid molecule in response to the request from each user, so that more appropriate lipid molecules constituting particles containing each of various types of nucleic acids can be obtained. It will be possible to explore.
  • the data storage unit 170 regarding the drug delivery system can store data regarding the drug delivery system for various types of nucleic acids.
  • the data stored in the data storage unit 170 regarding the drug delivery system may include various public information (for example, patent gazettes, papers) and data available from a database.
  • the trained model can be updated by updating the learning data set using the newly accumulated data regarding the drug delivery system and performing the learning process again.
  • the inference service providing system 1210 according to the third embodiment it is possible to accumulate a large amount of know-how for searching for a more appropriate lipid molecule constituting particles containing nucleic acid. That is, according to the inference service providing system 1210 according to the third embodiment, it is possible to support the work for designing or selecting the chemical structure of the lipid molecule constituting the particles containing the nucleic acid.
  • FIG. 13 is an example of a flowchart showing the flow of the inference service provision process.
  • step S1301 the learning device 810 acquires various data from the data storage unit 170 related to the drug delivery system.
  • step S1302 the learning device 810 generates a learning data set 900 using various acquired data.
  • step S1303 the learning device 810 performs learning processing on the learning model 920 using the learning data set 900, and generates a trained model 1020.
  • step S1304 the inference device 820 of the inference service providing system 1210 acquires the input data generated by the information providing device 1211 based on the preconditions of the design transmitted from the user.
  • step S1305 the inference device 820 of the inference service providing system 1210 executes the trained model 1020 by inputting the acquired input data into the trained model 1020, and infers the chemical structure information of the lipid molecule.
  • step S1306 the information providing device 1211 of the inference service providing system 1210 provides the chemical structure information of the lipid molecule inferred by the inference device 820 to the user who has transmitted the preconditions of the design, and charges the user. conduct.
  • step S1307 when the inference service providing system 1210 collects data on the drug delivery system from the user in response to the information providing device 1211 providing the chemical structure information of the lipid molecule to the user, the user. Part of the consideration can be refunded.
  • step S1308 the inference service providing system 1210 determines whether or not a predetermined amount of data has been collected from the user regarding the data related to the drug delivery system.
  • step S1308 If it is determined in step S1308 that a predetermined amount of data has been collected (YES in step S1308), the process returns to step S1302. In this case, a training data set is generated based on the newly registered predetermined amount of data, and the learning process is performed again.
  • step S1308 determines whether a predetermined amount of data has been collected (NO in step S1308). If it is determined in step S1308 that a predetermined amount of data has not been collected (NO in step S1308), the process proceeds to step S1309.
  • step S1309 the information providing device 1211 of the inference service providing system 1210 determines whether or not to terminate the inference service providing process. If it is determined in step 1309 that the inference service provision process is to be continued (NO in step S1309), the process returns to step S1304.
  • step S1309 if it is determined in step S1309 that the inference service provision process is terminated (YES in step S1309), the inference service provision process is terminated.
  • the inference service providing system 1210 is -Obtain from the user the prerequisites for designing or selecting the lipid molecules that make up the particles containing nucleic acids. -Generated by performing a learning process on a learning model that associates input data, including prerequisites for designing or selecting lipid molecules that make up particles containing nucleic acids, with chemical structural information of the lipid molecules. Has a trained model. -By inputting input data including the preconditions acquired from the user, the chemical structure information of the lipid molecule inferred by the trained model is provided to the user who transmitted the preconditions.
  • the inference service providing system 1210 is -Collect data on drug delivery systems from users in response to providing information on the chemical structure of lipid molecules.
  • the inference service providing system 1210 according to the third embodiment it is possible to accumulate a large amount of know-how for searching for a more appropriate lipid molecule constituting particles containing nucleic acid. That is, according to the inference service providing system 1210 according to the third embodiment, it is possible to support the work for designing or selecting the chemical structure of the lipid molecule constituting the particles containing the nucleic acid.
  • the transfection efficiency and / or the cell viability is obtained from the user in response to the provision of the chemical structure information of the lipid molecule.
  • the reinforcement learning process is performed on the reinforcement learning model by using the reward calculated based on the acquired transfection efficiency and / or the cell survival rate.
  • FIG. 14 is a diagram showing an application example of the inference service providing system according to the fourth embodiment.
  • the inference service providing system 1410 provides each user with information on the chemical structure of the lipid molecule in response to a request from the user 1220, the user 1230, ... Shows the case.
  • the inference service providing system 1410 has an inference device 1420 and an information providing device 1211.
  • the information providing device 1211 has the same function as the information providing device 1211 described with reference to FIG. 12 in the third embodiment. Specifically, when the design preconditions are transmitted from each user, the information providing device 1211 generates input data and notifies the inference device 1420. Further, the information providing device 1211 acquires the chemical structure information of the lipid molecule inferred by the inference device 1420 in response to the notification of the input data, and provides it to the corresponding user.
  • the information providing device 1211 charges each user for providing the chemical structure information of the lipid molecule.
  • the inference service providing system 1410 can receive compensation according to the inference service of the chemical structure information of the lipid molecule.
  • the inference device 1420 acquires effect data from the user in response to the fact that the information providing device 1211 provides the chemical structure information of the lipid molecule to the user. In addition, the inference device 1420 calculates a reward based on the transfection efficiency and / or the cell survival rate included in the acquired effect data, and updates the model parameters of the reinforcement learning model based on the calculated reward.
  • the inference device 1420 executes the reinforcement learning model by inputting the input data newly notified from the information providing device 1211 into the reinforcement learning model with updated model parameters, and newly performs the chemical structure information of the lipid molecule. Infer.
  • the processing performed by the user 1220 and the user 1230 in FIG. 14 is the same as the processing described with reference to FIG. 12 in the third embodiment, and therefore the description thereof will be omitted here.
  • the user 1220 transmits the effect data 1226 to the inference service providing system 1410.
  • the effect data 1226 to be transmitted includes the transfection efficiency and / or the cell viability of the nucleic acid 1223 contained in the particles containing the lipid molecule 1222 into cells.
  • the user 1230 transmits the effect data 1236 to the inference service providing system 1410.
  • the effect data 1236 to be transmitted includes the transfection efficiency and / or the cell viability of the nucleic acid 1233 contained in the particles containing the lipid molecule 1232 into cells.
  • the data transmitted to the inference service providing system may be various public information (for example, patent gazettes, papers) or data that can be obtained from a database.
  • the inference service providing system 1410 can refund a part of the consideration for providing the chemical structure information 1212_1 of the lipid molecule to the user 1220. That is, in the inference service providing system 1410, the billing content for the user 1220 can be changed.
  • the inference service providing system 1410 can refund the user 1230 a part of the consideration for providing the chemical structure information 1212_2 of the lipid molecule. .. That is, in the inference service providing system 1410, the billing content for the user 1230 can be changed.
  • the inference service providing system 1410 performs reinforcement learning processing for the reinforcement learning model by acquiring effect data from each user each time it provides chemical structure information of the lipid molecule in response to a request from each user. conduct.
  • the inference service providing system 1410 According to the fourth embodiment, it becomes possible to perform reinforcement learning processing on a reinforcement learning model for a wide variety of nucleic acids, and with the provision of the inference service. Inference accuracy can be improved.
  • the inference service providing system 1410 according to the fourth embodiment it is possible to accumulate a large amount of know-how for searching for a more appropriate lipid molecule constituting particles containing nucleic acid. That is, according to the inference service providing system 1410 according to the fourth embodiment, it is possible to support the work for designing or selecting a more suitable chemical structure of a lipid molecule constituting particles containing nucleic acid.
  • FIG. 15 is a diagram showing an example of the functional configuration of the inference device.
  • An inference program is installed in the inference device 1420, and when the inference program is executed, the inference device 1420 functions as a preprocessing unit 1510, a reinforcement learning model 1520, and a reward calculation unit 1530.
  • the pre-processing unit 1510 has the same function as the pre-processing unit 910 of the learning device 810, and generates pre-processing and post-processing data by performing various pre-processing on the input data 1501, 1502 and the like.
  • the input data 1501 includes the design prerequisite 1221 transmitted by the user 1220. Further, the input data 1502 includes the precondition 1231 of the design transmitted from the user 1230.
  • the reinforcement learning model 1520 takes the post-treatment data notified from the pre-treatment unit 1510 as an input, and infers the chemical structure information 1212_1, 1212_2, etc. of the lipid molecule.
  • the reward calculation unit 1530 functions as a calculation unit, and calculates the reward based on the transfection efficiency and / or the cell survival rate included in the effect data 1226, 1236, etc. transmitted from the users 1220 and 1230.
  • the reward calculation unit 1530 calculates the reward so that the reward is maximized by increasing the transfection efficiency and / or the cell survival rate.
  • the reward calculation unit 1530 performs reinforcement learning processing for updating the model parameters of the reinforcement learning model 1520 based on the calculated reward.
  • FIG. 16 is another example of a flowchart showing the flow of the inference service provision process.
  • step S1601 the inference device 1420 of the inference service providing system 1410 acquires the input data generated by the information providing device 1211 based on the preconditions of the design transmitted by the user.
  • step S1602 the inference device 1420 of the inference service providing system 1410 executes the reinforcement learning model 1520 by inputting the acquired input data into the reinforcement learning model 1520, and infers the chemical structure information of the lipid molecule.
  • step S1603 the information providing device 1211 of the inference service providing system 1410 provides the chemical structure information of the lipid molecule inferred by the inference device 1420 to the user who has transmitted the preconditions of the design, and charges the user. conduct.
  • step S1604 the inference device 1420 of the inference service providing system 1410 acquires effect data from the user in response to the information providing device 1211 providing the chemical structure information of the lipid molecule to the user. Further, the inference device 1420 of the inference service providing system 1410 refunds a part of the consideration to the user who has transmitted the effect data.
  • step S1605 the inference device 1420 of the inference service providing system 1410 calculates the reward based on the transfection efficiency and / or the cell survival rate included in the acquired effect data.
  • step S1606 the inference device 1420 of the inference service providing system 1410 performs reinforcement learning processing for updating model parameters for the reinforcement learning model based on the calculated reward.
  • step S1607 the information providing device 1211 of the inference service providing system 1410 determines whether or not to terminate the inference service providing process. If it is determined in step 1607 that the inference service provision process is to be continued (NO in step S1607), the process returns to step S1601.
  • step S1607 determines whether the inference service provision process is terminated. If it is determined in step S1607 that the inference service provision process is terminated (YES in step S1607), the inference service provision process is terminated.
  • the inference service providing system 1410 is -Obtain from the user the prerequisites for designing or selecting the lipid molecules that make up the particles containing nucleic acids.
  • -It has a reinforcement learning model that infers the chemical structure information of lipid molecules by inputting input data including the acquired preconditions.
  • do. Perform reinforcement learning processing for the reinforcement learning model based on the calculated reward.
  • the inference accuracy can be improved with the provision of the inference service.
  • a large amount of know-how for searching for a more suitable lipid molecule constituting particles containing nucleic acid can be accumulated. That is, according to the inference service providing system 1410 according to the fourth embodiment, it is possible to support the work for designing or selecting a more suitable chemical structure of a lipid molecule constituting particles containing nucleic acid.
  • the method of applying the trained model 520 is not limited to this, and for example, the inference device is configured to search for the chemical structural information of the lipid molecule satisfying the target transfection efficiency and / or the cell viability. May be good.
  • the fifth embodiment will be described focusing on the differences from the first embodiment.
  • FIG. 17 is a diagram showing an example of the functional configuration of the inference device according to the fifth embodiment.
  • the inference device 1700 functions as a preprocessing unit 510, a trained model 520, and a generation unit 1710.
  • the preprocessing unit 510 and the trained model 520 have already been described with reference to FIG. 5 in the first embodiment, and therefore the description thereof will be omitted here.
  • the generation unit 1710 has, for example, a reinforcement learning function by Thompson Sample. Specifically, the generator 1710 satisfies the predetermined termination condition (eg, the transfection efficiency and / or the transfection efficiency and / or the cell targeted by the transfection efficiency and / or the cell viability inferred by the trained model 520). Whether or not the survival rate is satisfied) is determined.
  • the predetermined termination condition eg, the transfection efficiency and / or the transfection efficiency and / or the cell targeted by the transfection efficiency and / or the cell viability inferred by the trained model 520.
  • the generation unit 1710 determines that the predetermined termination condition is not satisfied, the generation unit 1710 generates the chemical structure information of the lipid molecule based on the transfection efficiency and / or the cell viability inferred by the trained model 520. In addition, the generation unit 1710 notifies the pretreatment unit 510 of the chemical structure information of the generated lipid molecule.
  • the generation unit 1710 determines that the predetermined termination condition is satisfied, the chemical structure information of the previously generated lipid molecule is used as the chemical structure information of the lipid molecule satisfying the target transfection efficiency and / or the cell viability. Output.
  • reference numeral 1730 is an example of chemical structure information of the lipid molecule output from the generation unit 1710.
  • the example of FIG. 17 shows how a specific lipid molecule was generated as chemical structural information of the lipid molecule satisfying the target transfection efficiency and / or cell viability.
  • FIG. 18 is an example of a flowchart showing the flow of the generation process.
  • the generation process shown in FIG. 18 is started by the inference device 1700, it is assumed that the target transfection efficiency and / or the cell survival rate is set in the inference device 1700 in advance.
  • step S1801 the generation unit 1710 generates a group of molecular fragments from chemically formable hydrocarbons in which the maximum values of length, saturation, and number of branches are set.
  • step S1802 the generation unit 1710 combines the generated molecular fragment with the chemical skeleton group of the lipid selected by the designer 110 to generate the chemical structure group of the lipid molecule.
  • the generation unit 1710 has a number of the generated chemical structure group of the lipid molecule specified by the designer 110 according to the combination of the length of the molecular fragment, the degree of saturation, the number of branches, the type of the chemical skeleton, and the like. Divide into multiple search spaces.
  • step S1803 the generation unit 1710 selects one of the search spaces from the plurality of search spaces divided in step S1802 by using Thumbson Sample.
  • selecting one of the search spaces is nothing but selecting the characteristics of the search space (combination of the length, saturation, number of branches, type of chemical skeleton, etc. of the molecular fragment of the lipid molecule). ..
  • step S1804 the generation unit 1710 generates a chemical structure group of the lipid molecule using a combination of the length, saturation, number of branches, type of chemical skeleton, etc. of the selected molecular fragment of the lipid molecule.
  • the generation unit 1710 randomly acquires a plurality of molecular fragments from a search space other than the selected search space with a certain probability, and generates a chemical structure group of lipid molecules together with the selected molecular fragments.
  • step S1805 the generation unit 1710 notifies the pretreatment unit 510 of each chemical structure information of the chemical structure group of the generated lipid molecule.
  • the pretreatment unit 510 performs various pretreatments on each chemical structure information of the lipid molecule notified from the generation unit 1710, so that the pretreatment data group suitable for input to the trained model 520 can be obtained.
  • the trained model 520 infers the transfection efficiency and / or the cell viability for the chemical structure group of the lipid molecule generated by the generator 1710 in step S1804.
  • step S1806 the generation unit 1710 The maximum of multiple transfection efficiencies and / or cell viability inferred by the trained model 520 (inference results).
  • step S1807 the generation unit 1710 determines whether or not a predetermined end condition is satisfied. If it is determined in step S1807 that the predetermined end condition is not satisfied (NO in step S1807), the process returns to step S1803.
  • step S1807 determines whether the predetermined end condition is satisfied (YES in step S1807). If it is determined in step S1807 that the predetermined end condition is satisfied (YES in step S1807), the process proceeds to step S1808.
  • step S1808 the generation unit 1710 uses the previously generated chemical structure information of the lipid molecule (chemical structure information of the lipid molecule whose maximum value is inferred) to satisfy the target transfection efficiency and / or cell viability. It is output as the chemical structure information of.
  • the inference device 1700 is -For a learning model that correlates at least input data containing chemical structural information of lipid molecules with transfection efficiency and / or cell viability of active substances contained in particles containing the lipid molecules. , Has a trained model in which the training process has been performed. • Based on the inference results, the following new transfection efficiencies and / or cell viability associated with input data, including chemical structural information of newly generated lipid molecules, are inferred by the trained model. It has a transfection unit that produces chemical structural information of lipid molecules. -The generation unit repeats the generation process of generating the chemical structure of the next new lipid molecule based on the inference result until the predetermined termination condition is satisfied.
  • the inference device 1700 according to the fifth embodiment for example, it is possible to generate chemical structural information of a lipid molecule that satisfies the target transfection efficiency and / or cell viability. That is, according to the reasoning apparatus 1700 according to the fifth embodiment, it is possible to support the work for designing or selecting the chemical structural information of the lipid molecule constituting the particle containing the nucleic acid.
  • the structure is such that the chemical structure information of the lipid molecule is generated according to the transfection efficiency and / or the cell viability.
  • the information included in the design precondition 201 (disease type, nucleic acid type). , Attribute information such as introduction target, target animal, etc.). Then, in the sixth embodiment, when generating the chemical structure information of the lipid molecule, the information included in the precondition 201 of the design (type of disease, type of nucleic acid, introduction target, attribute information of target animal, etc.) is used. Generates chemical structure information of the corresponding lipid molecule.
  • the sixth embodiment will be described focusing on the differences from the fifth embodiment.
  • FIG. 19 is a diagram showing an example of the functional configuration of the inference device according to the sixth embodiment.
  • the inference device 1900 functions as a preprocessing unit 510, a trained model 520, a generation unit 1910, and an acquisition unit 1930.
  • the preprocessing unit 510 and the trained model 520 have already been described with reference to FIG. 5 in the first embodiment, and therefore the description thereof will be omitted here.
  • the generation unit 1910 has a reinforcement learning function by Thompson Sample, similar to the generation unit 1710 in FIG. Specifically, the generator 1910 obtains the transfection efficiency and / or cell viability output from the trained model 520. In addition, the generation unit 1910 determines whether or not a predetermined termination condition is satisfied (for example, whether or not the acquired transfection efficiency and / or cell viability satisfies the target transfection efficiency and / or cell viability). Is determined. Further, when the generation unit 1910 determines that the predetermined termination condition is not satisfied, the generation unit 1910 generates chemical structure information of the lipid molecule based on the acquired transfection efficiency and / or cell viability, and the chemistry of the generated lipid molecule. Notify the preprocessing unit 510 of the structural information.
  • a predetermined termination condition for example, whether or not the acquired transfection efficiency and / or cell viability satisfies the target transfection efficiency and / or cell viability.
  • the generation unit 1910 the information included in the design precondition 201 (disease type, nucleic acid type, introduction target, target animal, etc.) notified by the acquisition unit 1930 when generating the chemical structure information of the lipid molecule. (Attribute information, etc.) is acquired as a predetermined constraint condition. Then, when the generation unit 1910 generates the chemical structure information of the lipid molecule, the chemical structure information is generated with these acquired information as a predetermined constraint condition.
  • the generation unit 1910 determines that the predetermined termination condition is satisfied, the previously generated chemical structure information of the lipid molecule is used as the chemical structure information of the lipid molecule satisfying the target transfection efficiency and / or the cell viability. Output.
  • the acquisition unit 1930 acquires the input data 1000. Further, the acquisition unit 1930 notifies the generation unit 1910 of the acquired input data 1000.
  • the inference device 1900 is -For a learning model that correlates at least input data containing chemical structural information of lipid molecules with transfection efficiency and / or cell viability of active substances contained in particles containing the lipid molecules. , Has a trained model in which the training process has been performed. • Infer transfection efficiency and / or cell viability associated with input data, including chemical structural information of newly generated lipid molecules, using a trained model. • Generate the following new lipid molecule chemical structural information based on the inferred transfection efficiency and / or cell viability.
  • the information included in the preconditions of the design is set as a predetermined constraint, and the following new chemical structure information of the lipid molecule is generated. Generates the next new lipid molecule chemical structure information based on the inferred transfection efficiency and / or cell viability and the information contained in the design prerequisites until certain termination conditions are met. Repeat the generation process.
  • the chemical structure information of the lipid molecule satisfying the target transfection efficiency and / or the cell viability under a predetermined constraint condition is generated. Can be done. That is, according to the inference device 1900 according to the sixth embodiment, it is possible to support the work for designing or selecting the chemical structure of the lipid molecule constituting the particle containing the nucleic acid.
  • the learning device and the inference device have been described as being configured as separate devices. However, the learning device and the inference device may be configured as an integrated device.
  • the inference service providing system 1210 has been described as having the inference device 820 and the information providing device 1211 configured as separate devices.
  • the inference device 820 and the information providing device 1211 may be configured as an integrated device.
  • the function of the inference device 820 and the function of the information providing device 1211 may be realized by, for example, executing the inference service providing program in the integrated device.
  • the inference service providing system 1410 has been described as having the inference device 1420 and the information providing device 1211 configured as separate devices.
  • the inference device 1420 and the information providing device 1211 may be configured as an integrated device.
  • the function of the inference device 1420 and the function of the information providing device 1211 may be realized by, for example, executing the inference service providing program in the integrated device.
  • the information providing device generates input data.
  • the generation of input data may be configured to be performed by, for example, an inference device.
  • the information providing device has been described as functioning as an acquisition unit, a provision unit, and a billing unit. However, some of the functions realized by the information providing device may be realized on the user's terminal (or on the cloud).
  • the details of the method of providing the chemical structure information of the lipid molecule to the user by the information providing device are not mentioned, but the method of providing the information by the information providing device is arbitrary.
  • the information providing device may be configured to directly transmit the chemical structure information of the lipid molecule to the user, or the storage location where the chemical structure information of the lipid molecule can be accessed by the user by inputting a password or the like. It may be configured to be stored in.
  • the generation unit uses the transfection efficiency and / or the cell viability inferred by the trained model 520 as the target transfection efficiency and / or the target transfection efficiency as a predetermined termination condition. Alternatively, it was determined whether or not the cell viability was satisfied.
  • the predetermined termination condition is not limited to this, and for example, it may be determined whether or not the chemical structure information of the lipid molecule to be produced has been updated. In this case, the generation unit determines that a predetermined termination condition is satisfied when it is determined that the chemical structure information of the lipid molecule to be produced has not been updated.
  • information items such as FIGS. 5, 10, and 15 are exemplified as input data information items, but the input data information items are not limited to these.
  • Drug delivery system review process 170 Data storage unit for drug delivery system 200: Drug delivery system review process 210: Learning device 220: Inference device 400: Learning data set 520: Trained model 800: Drug delivery system review process 810 : Learning device 820: Inference device 900: Learning data set 1000: Input data 1020: Trained model 1200: Drug delivery system review process 1211: Information provision device 1400: Drug delivery system review process 1410: Inference service provision system 1420: Inference Device 1520: Reinforcement learning model 1530: Reward calculation unit 1700: Inference device 1710: Generation unit 1900: Inference device 1910: Generation unit 1930: Acquisition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

活性物質を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援する。推論装置は、少なくとも脂質分子の化学構造情報を含む入力データを取得する取得部と、少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、を有し、前記学習済みモデルは、前記取得部により新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する。

Description

推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラム
 本開示は、推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラムに関する。
発明の背景
 核酸等の活性物質を高効率で細胞内に導入するための、脂質分子を含有してなる粒子を用いた薬物送達システム(DDS(Drug Delivery System))が知られている。当該システムでは、脂質分子を含有してなる粒子に、当該活性物質を包含させることで複合体の粒子を形成し、当該複合体の粒子を介して当該活性物質の細胞内への導入(トランスフェクション)が行われる。このようなDDSは、生体への投与による生体内細胞へのトランスフェクションのみならず、生体外(in vitro、in situまたはex vivo)の細胞へのトランスフェクションにも用いられる。
国際公開第2016/021683号 国際公開第2019/131839号 国際公開第2020/032184号
 一方で、活性物質を包含する粒子を構成する脂質分子の化学構造のデザインや選択は、一般に、人手によって行われるため、目的に合わせた適切な脂質分子のデザインや選択はその熟練者の経験やノウハウに依存するところが大きい。また、デザインまたは選択された化学構造を有する脂質分子を実験により評価し、評価結果に応じてデザインや選択をやり直す作業が繰り返し行われるため、より適切な脂質分子の化学構造を探索するのには時間がかかる。更に、限られた種類の活性物質や目的に適した脂質分子を探索するだけでは、様々な活性物質や目的に適した脂質分子の化学構造をデザインまたは選択するためのノウハウを蓄積することが難しい。
 本開示は、活性物質を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することを目的とする。
 本発明者らは上記課題に鑑み、鋭意検討した結果、脂質分子の化学構造情報、トランスフェクション効率及び/または細胞生存率等のデータに基づく学習モデルの生成やこれを用いて、脂質分子の化学構造情報、トランスフェクション効率及び/または細胞生存率等の推論が可能であることを見出した。
 すなわち、本開示は以下を提供する。
[1]少なくとも脂質分子の化学構造情報を含む入力データを取得する取得部と、
 少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、を有し、
 前記学習済みモデルは、前記取得部により新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、推論装置。
[2]前記学習処理が行われる際に用いられたトランスフェクション効率及び/または細胞生存率は、前記学習処理が行われる際に用いられた化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定された測定結果から算出される、[1]に記載の推論装置。
[3]前記学習済みモデルは、前記少なくとも脂質分子の化学構造情報を含む入力データを前記学習モデルに入力した場合の出力が、前記測定結果から算出される前記トランスフェクション効率及び/または細胞生存率に近づくように、前記学習モデルのモデルパラメータが更新されることで生成される、[2]に記載の推論装置。
「4」前記取得部は、前記新たに取得した入力データに対して予め定められた前処理を行い、前記学習済みモデルは、前処理後の入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、[1]に記載の推論装置。
[5]少なくとも脂質分子の化学構造情報を含む入力データを取得する取得工程と、
 少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、を有する推論方法であって、
 前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、推論方法。
[6]少なくとも脂質分子の化学構造情報を含む入力データを取得する取得工程と、
 少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、をコンピュータに実行させるための推論プログラムであって、
 前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、推論プログラム。
[7]少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理を行うことで学習済みモデルを生成するモデル生成方法。
[8]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得部と、
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、を有し、
 前記学習済みモデルは、前記取得部により新たに取得された入力データに関連付けられた脂質分子の化学構造情報を推論する、推論装置。
[9]前記学習処理が行われる際に用いられた入力データには、デザインまたは選択された脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定された測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる、[8]に記載の推論装置。
[10]前記学習済みモデルは、前記前提条件を含む入力データを前記学習モデルに入力した場合の出力が、前記学習処理が行われる際に用いられた脂質分子の化学構造情報に近づくように、前記学習モデルのモデルパラメータが更新されることで生成される、[8]に記載の推論装置。
[11]前記取得部は、前記新たに取得した入力データに対して予め定められた前処理を行い、前記学習済みモデルは、前処理後の入力データに関連付けられた脂質分子の化学構造情報を推論する、[8]に記載の推論装置。
[12]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、を有する推論方法であって、
 前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられた脂質分子の化学構造情報を推論する、推論方法。
[13]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、をコンピュータに実行させるための推論プログラムであって、
 前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられた脂質分子の化学構造情報を推論する、推論プログラム。
[14]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理を行うことで学習済みモデルを生成する、モデル生成方法。
[15]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得部と、
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、
 前記取得部によって新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルが推論した脂質分子の化学構造情報を、該ユーザに提供する提供部と
 を有する推論サービス提供システム。
[16]
 前記取得部によって新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルが、脂質分子の化学構造情報を推論した場合に、前記ユーザに対して課金を行う課金部を更に有する、[15]に記載の推論サービス提供システム。
[17]
 前記学習済みモデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率を、前記ユーザより取得した場合に、前記課金部は、前記ユーザに対する課金内容を変更する、[16]に記載の推論サービス提供システム。
[18]
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
 前記取得工程において新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルにより推論された脂質分子の化学構造情報を、該ユーザに提供する提供工程と
 を有する推論サービス提供方法。
[19]
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
 前記取得工程において新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルにより推論された脂質分子の化学構造情報を、該ユーザに提供する提供工程と
 をコンピュータに実行させるための推論サービス提供プログラム。
[20]
 活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得部と、
 前記取得部により取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルと、
 前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出部と、を有し、
 前記強化学習モデルは、前記算出部により算出された報酬に基づいて学習処理を行う、推論装置。
[21]前記算出部は、前記トランスフェクション効率及び/または細胞生存率が上がることで最大化するように、前記報酬を算出する[20]に記載の推論装置。
[22]前記取得部は、前記入力データに対して予め定められた前処理を行い、前記強化学習モデルは、前処理後の入力データが入力されることで、脂質分子の化学構造情報を推論する、[20]に記載の推論装置。
[23]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
 前記取得工程において取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
 前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、を有し、
 前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論方法。
[24]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
 前記取得工程において取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
 前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、をコンピュータに実行させるための推論プログラムであって、
 前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論プログラム。
[25]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得部と、
 前記取得部によってユーザより取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルと、
 前記強化学習モデルにより推論された脂質分子の化学構造情報を、前記ユーザに提供する提供部と、
 前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出部と、を有し、
 前記強化学習モデルは、前記算出部により算出された報酬に基づいて学習処理を行う、推論サービス提供システム。
[26]前記強化学習モデルが推論した脂質分子の化学構造情報を前記提供部が前記ユーザに提供した場合に、前記ユーザに対して課金を行う課金部と
 を更に有する[25]に記載の推論サービス提供システム。
[27]前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質が、細胞に導入されることで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率を、前記ユーザより取得した場合に、前記課金部は、前記ユーザに対する課金内容を変更する、[26]に記載の推論サービス提供システム。
[28]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
 前記取得工程においてユーザより取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
 前記強化学習モデルにより推論された脂質分子の化学構造情報を、前記ユーザに提供する提供工程と、
 前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質が、細胞に導入されることで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、を有する推論サービス提供方法であって、
 前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論サービス提供方法。
[29]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
 前記取得工程においてユーザより取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
 前記強化学習モデルにより推論された脂質分子の化学構造情報を、前記ユーザに提供する提供工程と、
 前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質が、細胞に導入されることで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、をコンピュータに実行させるための推論サービス提供プログラムであって、
 前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論サービス提供プログラム。
[30]少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、
 新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率が、前記学習済みモデルによって推論された場合に、推論結果に基づいて、次の新たな脂質分子の化学構造情報を生成する生成処理を、所定の終了条件が満たされるまで繰り返す生成部と
 を有する推論装置。
[31]前記生成部は、
 形成可能な炭化水素の分子フラグメントと脂質分子の化学骨格との組み合わせに応じた複数の探索空間から、前記推論結果に基づいて、いずれかの探索空間を選択し、選択した探索空間の特性を用いて前記次の新たな脂質分子の化学構造情報を生成する、[30]に記載の推論装置。
[32]前記複数の探索空間は、互いに、分子フラグメントの長さ、飽和度、枝数と、脂質分子の化学骨格の種類との組み合わせが異なる、[31]に記載の推論装置。
[33]前記生成部は、所定の制約条件のもとで前記次の新たな脂質分子の化学構造情報を生成する、[31]に記載の推論装置。
[34]活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を取得する取得部を更に有し、
 前記生成部は、取得された前記前提条件を前記所定の制約条件として、前記次の新たな脂質分子の化学構造情報を生成する、[30]に記載の推論装置。
[35]少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
 新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率が、前記学習済みモデルによって推論された場合に、推論結果に基づいて、次の新たな脂質分子の化学構造情報を生成する生成処理を、所定の終了条件が満たされるまで繰り返す生成工程と
 を有する推論方法。
[36]少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
 新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率が、前記学習済みモデルによって推論された場合に、推論結果に基づいて、次の新たな脂質分子の化学構造情報を生成する生成処理を、所定の終了条件が満たされるまで繰り返す生成工程と
 をコンピュータに実行させるための推論プログラム。
 本開示によれば、活性物質を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
図1は、薬物送達システム検討プロセスにおける各種データの蓄積例を示す図である。 図2は、第1の実施形態に係る推論装置の適用例を示す図である。 図3は、推論装置のハードウェア構成の一例を示す図である。 図4は、第1の実施形態に係る学習装置の機能構成の一例を示す図である。 図5は、第1の実施形態に係る推論装置の機能構成の一例を示す図である。 図6は、トランスフェクション効率及び/または細胞生存率推論処理の流れを示すフローチャートの一例である。 図7Aは、学習装置の一実施例を示す図である。 図7Bは、推論装置の一実施例を示す図である。 図8は、第2の実施形態に係る推論装置の適用例を示す図である。 図9は、第2の実施形態に係る学習装置の機能構成の一例を示す図である。 図10は、第2の実施形態に係る推論装置の機能構成の一例を示す図である。 図11は、脂質分子の化学構造情報推論処理の流れを示すフローチャートの一例である。 図12は、第3の実施形態に係る推論サービス提供システムの適用例を示す図である。 図13は、推論サービス提供処理の流れを示すフローチャートの一例である。 図14は、第4の実施形態に係る推論サービス提供システムの適用例を示す図である。 図15は、第4の実施形態に係る推論装置の機能構成の一例を示す図である。 図16は、推論サービス提供処理の流れを示すフローチャートの他の一例である。 図17は、第5の実施形態に係る推論装置の機能構成の一例を示す図である。 図18は、生成処理の流れを示すフローチャートの一例である。 図19は、第6の実施形態に係る推論装置の機能構成の一例を示す図である。
 以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
 [第1の実施形態]
 <薬物送達システム検討プロセスにおける各種データの蓄積例>
 はじめに、一般的な、薬物送達システム検討プロセスにおける各種データの蓄積例について説明する。図1は、薬物送達システム検討プロセスにおける各種データの蓄積例を示す図である。
 図1に示すように、薬物送達システム検討プロセス100では、活性物質を包含する粒子を構成する脂質分子の化学構造をデザイン(または選択)するにあたり、まず、デザインまたは選択の前提条件(以下、単に、“デザインの前提条件”と称す)として、
・被検体(対象とするヒトまたはヒト以外の動物(以下、本明細書において、「対象動物等」と称することがある。)160あるいは生体外(in vitro、in situまたはex vivo)の細胞及び/または組織160)の属性、
・対象動物等160の疾病の種類、
・包含される活性物質(例えば、核酸140)の属性(例えば、活性物質(例えば、核酸140)の種類、化学構造情報等)、
・複合体150の粒子を導入する対象(対象動物等160の生体中(in vivo)の特定の細胞あるいは生体外(in vitro、in situまたはex vivo)の特定の細胞160)、
等(デザインの前提条件101参照)を、設計者110にインプットする。なお、活性物質を包含する粒子とは、少なくとも、
・脂質分子が、活性物質(例えば、核酸140)と混然一体となって複合体の粒子を形成するケースと、
・脂質分子が、外郭を形成し、その中に活性物質(例えば、核酸140)が含まれることで複合体の粒子を形成するケースと、
を含む概念である。
 本開示の一態様において取り扱われる脂質分子としては、例えば、カチオン性脂質分子が挙げられる。カチオン性脂質は、生理学的pHなどの選択したpHにおいて、正味の正電荷を持つ脂質を意味する。脂質分子および活性物質を包含する粒子の製造方法としては、例えば、国際公開第2016/021683号、国際公開第2019/131839号、国際公開第2020/032184号等に記載の方法が挙げられる。本開示の別の一態様において取り扱われる脂質分子としては、例えば、アニオン性脂質分子、コレステロール誘導体分子、両親媒性脂質分子(amphiphilic lipid molecule)などが挙げられる。
 本開示の一態様において取り扱われる核酸としては、ヌクレオチドおよび該ヌクレオチドと同等の機能を有する分子が重合した分子であればいかなるものでもよく、例えば、リボヌクレオチドの重合体であるRNA、デオキシリボヌクレオチドの重合体であるDNA、リボヌクレオチドおよびデオキシリボヌクレオチドが混合した重合体、および、ヌクレオチド類似体を含むヌクレオチド重合体を挙げることができ、さらに、核酸誘導体を含むヌクレオチド重合体であってもよい。また、核酸は、一本鎖核酸または二本鎖核酸であってもよい。また二本鎖核酸には、一方の鎖に対し、他方の鎖がストリンジェントな条件でハイブリダイズする二本鎖核酸も含まれる。また、本実施形態において取り扱われる核酸は、特に限定されず、例えば、疾患、症状、障害、または病的状態の改善、および、疾患、症状、障害または病態の軽減またはその発症の予防など(本明細書において、「疾患の治療等」と称することがある)を目的とした核酸であってもよく、疾患の治療等には寄与しないものの研究用として有用な所望のタンパク質の発現を調節するための核酸であってもよい。本実施形態において取り扱われる核酸の具体例としては、siRNA、miRNA、miRNAmimic、アンチセンス核酸、リボザイ厶、mRNA、デコイ核酸、アプタマー、DNAおよびこれらに人工的な修飾が施された類似体もしくは誘導体等が挙げられる。
 設計者110は、デザインの前提条件101から、これまでの経験やノウハウに基づいて、脂質分子の化学構造をデザインまたは選択する。設計者110によりデザインまたは選択された化学構造を有する脂質分子111は、実験者及び評価者120によって実験処理及び評価処理が行われ、評価データ121が設計者110に通知される。
 設計者110は、通知された評価データ121に基づいて、脂質分子の化学構造のデザインまたは選択をやり直す。設計者110により再度デザインまたは選択された化学構造を有する脂質分子111’(不図示)は、実験者及び評価者120によって再度実験処理及び評価処理が行われ、評価データ121’(不図示)が設計者110に通知される。
 設計者110によるデザインまたは選択と、実験者及び評価者120による実験処理及び評価処理とは、複数回繰り返される。これにより、設計者110は、核酸140を包含する粒子を構成するより適切な脂質分子の化学構造を探索することができる。
 続いて、設計者110により探索された脂質分子の化学構造情報180に基づいて、脂質分子130が生成されると、生成された脂質分子130を含有してなる粒子によって核酸140が包含され、複合体150の粒子が形成される。なお、複合体150の粒子には、核酸140の他に、必要に応じて、脂質分子及び核酸以外の成分が含まれていてもよい。そのような成分としては、例えば、適量の安定化剤及び酸化防止剤等が挙げられる。これらの成分は、医薬上許容される成分とすることができる。
 形成された複合体150の粒子は、対象動物等160や、生体外(in vitro、in situまたはex vivo)の細胞及び/または組織160等に適用される。複合体150の粒子が対象動物等160の生体中(in vivo)の特定の細胞に導入されることで生じた変化(あるいは生体外(in vitro、in situまたはex vivo)の特定の細胞160に導入されることで生じた変化)は、各種測定方法や測定器により測定され、効果データ161として出力される。
 なお、対象動物等160への複合体150の粒子の適用方法は、当業者に公知の方法を用いてよい。対象動物等160への適用方法としては、具体的には、例えば、ボーラスとして又は一定期間にわたる持続注入による静脈内、筋肉内、腹腔内、脳髄腔内(intracerobrospinal)、皮下、関節内、滑液内、クモ膜下腔内、経口、局所又は吸入による経路での投与等が挙げられる。また、当業者であれば、投与回数、投与量、投与間隔を適宜決定することができる。生体外(in vitro、in situまたはex vivo)の細胞及び/または組織への適用方法としては、具体的には、例えば、対象とする細胞が培養されている容器中に複合体150の粒子を添加し、一定期間培養を行うこと等が挙げられる。当業者であれば、添加回数、添加量、添加間隔、培養条件、培養期間等を適宜決定することができる。
 効果データ161には、測定結果から算出される、脂質分子130を含有してなる粒子に包含された核酸140の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる。
 トランスフェクション効率は、活性物質である核酸の属性等に基づいて、公知の方法を用いて適宜評価することができる。例えば、核酸としてsiRNAを用いた場合には、当該siRNAが標的とする遺伝子の発現のノックダウン率に基づいて評価することができる。より具体的には、当該siRNAを包含する粒子を投与した群(投与群)の遺伝子(たとえばmRNA)の発現量と、対照群(例えば、何も投与されない群、siRNAを含まないか、粒子が投与される群、siRNAも脂質分子も含まない物質(例えば生理食塩水等)のみが投与される群等)における遺伝子の発現量とを比較し、投与群における遺伝子発現量の、対照群における遺伝子発現量に対する割合を求めることで評価することができる。siRNAを用いる場合には、その割合が低いほど、トランスフェクション効率が高いと判断できる。また、核酸としてmRNAを用いた場合には、当該mRNAがコードするタンパクの発現量に基づいて評価することができる。より具体的には、siRNAを用いた場合と同様にして、タンパクの発現量を比較することにより評価することができる。mRNAを用いる場合には、その割合が高いほど、トランスフェクション効率が高いと判断できる。遺伝子の発現量やタンパクの発現量等の測定方法や測定器は当業者が適宜選択することができる。
 トランスフェクションを行った場合の細胞生存率についても、公知の方法を用いて適宜評価することができる。例えば、適用前の細胞数と、適用後の細胞数を比較して、適用前の細胞数に対する適用後の細胞数の割合を測定することにより評価することができる。細胞数の測定方法や測定器は当業者が適宜選択することができる。
 評価データおよび効果データとしては、細胞へのトランスフェクション効率や細胞生存率を例示するが、さらに、複合体150の粒子を対象動物等160に適用した場合の生体内における核酸140の体内動態(吸収、分布、代謝)や毒性に関するデータも含まれ得、これらに限定されない。
 薬物送達システム検討プロセス100における、これら一連の流れの中で取得された各種データは、薬物送達システムに関するデータ格納部170に蓄積される。図1に示すように、薬物送達システムに関するデータ格納部170に蓄積される各種データには、例えば、
・デザインの前提条件101、
・評価データ121、
・脂質分子130の化学構造情報、
・核酸140の種類、化学構造情報、
・複合体150の化学構造情報、
・効果データ161(トランスフェクション効率及び/または細胞生存率を含む)、
等が含まれる。
 脂質分子の化学構造情報としては、特に限定されないが、例えば、化学式、立体構造、分子量、炭素原子数、窒素原子数、酸素原子数、電荷などが挙げられる。
 核酸の化学構造情報としては、特に限定されないが、例えば、当該核酸を構成する各塩基数、化学式、立体構造、分子量、電荷などが挙げられる。
 複合体の化学構造情報としては、例えば、当該複合体の粒子径、膜電位などが挙げられる。
 これらの化学構造情報は公知の方法を用いて適宜測定することができる。
 なお、薬物送達システムに関するデータ格納部170に蓄積される各種データには、更に、種々の公開情報(例えば、特許公報、論文)やデータベースから入手できるデータが含まれていてもよい。
 <推論装置の適用例>
 次に、図1に示した薬物送達システムに関するデータ格納部170に蓄積された各種データを用いて、推論装置を生成した場合の、該推論装置の薬物送達システム検討プロセスへの適用例について説明する。図2は、第1の実施形態に係る推論装置の適用例を示す図である。
 図1同様、第1の実施形態に係る推論装置220が適用される薬物送達システム検討プロセス200では、活性物質を包含する粒子を構成する脂質分子の化学構造をデザイン(または選択)するにあたり、デザインの前提条件201として、
・被検体(対象動物等260あるいは生体外(in vitro、in situまたはex vivo)の細胞及び/または組織260)の属性、
・対象動物等260の疾病の種類、
・包含される活性物質(例えば、核酸240)の属性(例えば、活性物質(例えば、核酸240)の種類、化学構造情報等)、
・複合体250の粒子を導入する対象(対象動物等260の生体中(in vivo)の特定の細胞あるいは生体外(in vitro、in situまたはex vivo)の特定の細胞260)、
等が、設計者110にインプットされる。
 設計者110は、デザインの前提条件201から、これまでの経験やノウハウに基づいて、脂質分子の化学構造をデザインまたは選択する。設計者110によりデザインまたは選択された化学構造を有する脂質分子211の化学構造情報は、推論装置220に入力される。
 ここで、推論装置220は、学習装置210により生成された学習済みモデルを有する。学習装置210は、薬物送達システムに関するデータ格納部170に蓄積された各種データに基づいて生成された学習用データセットを用いて、学習モデルに対して学習処理を行うことで、学習済みモデルを生成する。
 推論装置220は、学習装置210により生成された学習済みモデルを用いて、脂質分子211の化学構造情報についての評価データ221を生成する。推論装置220により生成された評価データ221は、設計者110に通知される。
 設計者110によるデザインまたは選択と、推論装置220による評価データの生成は、複数回繰り返される。これにより、設計者110は、核酸240を包含する粒子を構成するより適切な脂質分子の化学構造を探索することができる。
 続いて、設計者110により探索された脂質分子の化学構造情報280に基づいて、脂質分子230が生成されると、生成された脂質分子230を含有してなる粒子によって核酸240が包含され、複合体250の粒子が形成される。なお、複合体250の粒子には、核酸240の他に、必要に応じて、脂質分子及び核酸以外の成分が含まれていてもよい。そのような成分としては、例えば、適量の安定化剤及び酸化防止剤等が挙げられる。これらの成分は、医薬上許容される成分とすることができる。
 形成された複合体250の粒子は、対象動物等260や、生体外(in vitro、in situまたはex vivo)の細胞及び/または組織260等に適用される。複合体250の粒子が対象動物等260の生体中(in vivo)の特定の細胞に導入されることで生じた変化(あるいは生体外(in vitro、in situまたはex vivo)の特定の細胞260に導入されることで生じた変化)は、各種測定方法や測定器により測定され、効果データ261として出力される。
 なお、対象動物等260への複合体250の粒子の適用方法は、当業者に公知の方法を用いてよい。対象動物等260への適用方法としては、具体的には、例えば、ボーラスとして又は一定期間にわたる持続注入による静脈内、筋肉内、腹腔内、脳髄腔内(intracerobrospinal)、皮下、関節内、滑液内、クモ膜下腔内、経口、局所又は吸入による経路での投与等が挙げられる。また、当業者であれば、投与回数、投与量、投与間隔を適宜決定し、設計することができる。生体外(in vitro、in situまたはex vivo)の細胞及び/または組織への適用方法としては、具体的には、例えば、対象とする細胞が培養されている容器中に複合体250の粒子を添加し、一定期間培養を行うこと等が挙げられる。当業者であれば、添加回数、添加量、添加間隔、培養条件、培養期間等を適宜決定することができる。
 また、複合体250の粒子が対象動物等260の生体中(in vivo)の特定の細胞等に導入されることで生じた変化は、複合体250の粒子が導入された対象動物等260、あるいは対象動物等260から採取した当該特定の細胞を含む試料を測定することにより捉えることができる。試料としては、当該特定の細胞が含まれている限り特に限定されず、全血液、血漿、尿、血清、リンパ液、唾液、肛門及び膣分泌物、汗及び精液、これらに限定されない体液、及び臓器、組織の生検から得られる組織試料や細胞が挙げられる。また、採取した試料を測定に供するため公知のいかなる方法で標識されてよい。
 また、「対象動物等」としては、ヒトのほか、マウス、ラット、モルモット、イヌ、ネコ、ウサギ、ウシ、ウマ、ヒツジ、ヤギ、およびブタ等の動物が挙げられるが、これらに限定されない。対象動物等は、健常なヒトや動物であっても、何らかの疾病を患うヒト(患者)や動物であってもよい。
 更に、測定方法としては、当業者に公知のいかなる生体外、生体内の方法を用いてよい。具体的には、フローサイトメトリー、免疫学的アッセイ、mRNA転写物分析、PCR法及びハイブリダイゼーション法等が挙げられる。あるいは、配列決定法、RFLP法、ウェスタンブロット、ELISA、ラジオイムノアッセイ、免疫沈降、FACS、HPLC、表面プラズモン共鳴、光学分光、及び質量分析等が挙げられる。以下、細胞へのトランスフェクション効率や細胞生存率を測定結果として例示するが、測定事項はこれらに限定されない。
 効果データ261には、測定結果から算出される、脂質分子230を含有してなる粒子に包含された核酸240の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる。効果データ261としては、さらに、複合体250の粒子を対象動物等260に適用した場合の生体内における核酸240の体内動態(吸収、分布、代謝)や毒性に関するデータも含まれ得、これらに限定されない。
 このように、従来は、実験者及び評価者120によって実験処理及び評価処理が行われることで評価データ121が生成されていたところ、推論装置220が適用されることで、実験処理及び評価処理を行うことなく、評価データ221を生成することができる。
 これにより、核酸240を包含する粒子を構成するより適切な脂質分子の化学構造を探索するのに要する時間を短縮することができる。つまり、第1の実施形態に係る推論装置220によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 <学習装置及び推論装置のハードウェア構成>
 次に、学習装置210及び推論装置220のハードウェア構成について説明する。なお、学習装置210と推論装置220とは、同様のハードウェア構成を有することから、ここでは、推論装置220のハードウェア構成について説明する。
 図3は、推論装置のハードウェア構成の一例を示す図である。図3に示すように、推論装置220は、プロセッサ301、メモリ302、補助記憶装置303、I/F(Interface)装置304、通信装置305、ドライブ装置306を有する。なお、推論装置220の各ハードウェアは、バス307を介して相互に接続されている。
 プロセッサ301は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の各種演算デバイスを有する。プロセッサ301は、補助記憶装置303にインストールされた各種プログラムをメモリ302上に読み出して実行する。
 メモリ302は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ301とメモリ302とは、いわゆるコンピュータを形成し、プロセッサ301が、メモリ302上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する。
 補助記憶装置303は、各種プログラムや、各種プログラムがプロセッサ301によって実行される際に用いられる各種データを格納する。
 I/F装置304は、操作装置310及び表示装置311と、推論装置220とを接続する接続デバイスである。I/F装置304は、推論装置220に対する各種指示を、操作装置310を介して受け付ける。また、I/F装置304は、推論装置220による処理結果を、表示装置311を介して出力する。
 通信装置305は、ネットワークを介して他の装置と通信するための通信デバイスである。
 ドライブ装置306は記録媒体312をセットするためのデバイスである。ここでいう記録媒体312には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体312には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
 なお、補助記憶装置303にインストールされる各種プログラムは、例えば、配布された記録媒体312がドライブ装置306にセットされ、該記録媒体312に記録された各種プログラムがドライブ装置306により読み出されることでインストールされる。あるいは、補助記憶装置303にインストールされる各種プログラムは、通信装置305を介してネットワークからダウンロードされることで、インストールされてもよい。
 <学習装置の機能構成>
 次に、学習装置210の機能構成の詳細について説明する。図4は、第1の実施形態に係る学習装置の機能構成の一例を示す図である。図4において、学習用データセット400は、薬物送達システムに関するデータ格納部170に格納された各種データに基づいて生成された学習用データセットの一例である。なお、以下に学習用データ(入力データ及び正解データ)の各情報の項目を例示するが、これらに限定されず、また、これらのうちの一部または全部を学習用データとして適宜用いることができる。
 図4に示すように、学習用データセット400は、入力データと正解データとを有し、入力データには、情報の項目として、例えば、“疾病の種類”、“核酸の種類”、“導入対象”、“脂質分子の化学構造情報”、“対象動物等の属性情報”が含まれる。
 “疾病の種類”には、例えば、対象動物等160が患者(以下、本明細書において「対象患者」と称することがある)である場合、その疾病の種類である、「疾病A」が格納される。
 “核酸の種類”には、例えば、「疾病A」に対応する核酸の種類として、「核酸X」、「核酸X」等が格納される。
 “導入対象”には、“疾病の種類”、“核酸の種類”ごとに、複合体の粒子が導入されるべき対象の細胞を示す情報が格納される。図4の例は、疾病の種類=「疾病A」、核酸の種類=「核酸X」の場合、複合体の粒子は「細胞Y」に導入され、疾病の種類=「疾病A」、核酸の種類=「核酸X」の場合、複合体の粒子は「細胞Y」に導入されたことを示している。
 ここでいう対象の細胞を示す情報としては、例えば、由来元または当該細胞が生体内において存在する臓器または組織、細胞の種類(例えば、神経細胞、実質細胞、間質細胞等)などが挙げられるが、これらに限定されない。
 “脂質分子の化学構造情報”には、“疾病の種類”、“核酸の種類”、“導入対象”等のデザインの前提条件101に基づいて、設計者110により過去にデザインまたは選択されたより適切な脂質分子の化学構造を示す情報が格納される。
 “対象動物等の属性情報”には、対象動物等160(例えば、対象患者)の属性情報が格納される。図4の例は、脂質分子を含有してなる粒子に、核酸の種類=「核酸X」を包含させることで形成された複合体の粒子が、対象動物等の属性情報=「患者属性Z」を有する対象患者の「細胞Y」に導入されたことを示している。また、図4の例は、脂質分子を含有してなる粒子に、核酸の種類=「核酸X」を包含させることで形成された複合体の粒子が、対象動物等の属性情報=「患者属性Z」を有する対象患者の「細胞Y」に導入されたことを示している。
 一方、正解データには、情報の項目として、“トランスフェクション効率及び/または細胞生存率”が含まれる。
 “トランスフェクション効率及び/または細胞生存率”には、脂質分子を含有してなる粒子に包含された核酸の細胞へのトランスフェクション効率及び/または細胞生存率が格納される。具体的には、例えば、対応する複合体の粒子を対応する対象動物等260または生体外(in vitro、in situまたはex vivo)の細胞及び/または組織260に適用して、当該適用した対象動物等やそこから単離された試料を測定した測定結果から算出された、トランスフェクション効率及び/または細胞生存率が格納される。
 これらの学習用データセットは、種々の公開情報(例えば、特許公報、論文)やデータベースから入手したデータであってもよい。
 図4の例は、核酸の種類=「核酸X」の細胞へのトランスフェクション効率が「85%」であったことを示している。また、図4の例は、核酸の種類=「核酸X」の細胞へのトランスフェクション効率が「72%」であったことを示している。
 一方、学習装置210には、学習プログラムがインストールされており、当該学習プログラムが実行されることで、学習装置210は、前処理部410、学習モデル420、比較/変更部430として機能する。
 前処理部410は、学習用データセット400の“入力データ”を取得し、各種前処理を行うことで、学習モデル420に入力するのに適した前処理後データを生成する。前処理部410が行う各種前処理には、入力データを正規化する処理や、入力データをベクトル化する処理等が含まれる。
 学習モデル420は、入力データと正解データ(トランスフェクション効率及び/または細胞生存率)とを関連付けるモデルである。具体的には、学習モデル420は、前処理部410より通知された前処理後データを入力とし、トランスフェクション効率及び/または細胞生存率を出力する。
 なお、学習モデル420に対しては、比較/変更部430により算出された誤差を逆伝播させることでモデルパラメータを更新する学習処理が行われる。これにより、学習済みモデルが生成される。つまり、学習済みモデルは、学習モデル420の出力が、正解データ(トランスフェクション効率及び/または細胞生存率)に近づくように、学習モデル420のモデルパラメータを更新することで生成される。
 比較/変更部430は、学習モデル420より出力されたトランスフェクション効率及び/または細胞生存率と、学習用データセット400の正解データ(トランスフェクション効率及び/または細胞生存率)とを比較することで誤差を算出する。また、比較/変更部430は、算出した誤差を逆伝播させることで、学習モデル420のモデルパラメータを更新する。
 <推論装置の機能構成>
 次に、推論装置220の機能構成の詳細について説明する。図5は、第1の実施形態に係る推論装置の機能構成の一例を示す図である。図5に示すように、入力データ500_1、500_2、500_3、・・・には、
・デザインの前提条件201に含まれる情報(疾病の種類、核酸の種類、導入対象、対象動物等の属性情報等)と、
・デザインの前提条件201に基づいて設計者110がデザインまたは選択した脂質分子の化学構造情報と、
が含まれる。
 入力データは、種々の公開情報(例えば、特許公報、論文)やデータベースから入手したデータであってもよい。
 互いに異なる脂質分子の化学構造情報が含まれる入力データ500_1、500_2、500_3、・・・は、推論装置220に入力される。推論装置220には、推論プログラムがインストールされており、当該推論プログラムが実行されることで、推論装置220は、前処理部510、学習済みモデル520、評価データ生成部530として機能する。
 前処理部510は取得部の一例であり、学習装置210が有する前処理部410と同じ機能を有する。具体的には、前処理部510は、入力データ500_1、500_2、500_3、・・・を取得し、取得した入力データ500_1、500_2、500_3、・・・に対して、各種前処理を行うことで、前処理後データを生成する。
 学習済みモデル520は、学習装置210により学習処理が行われることで生成された学習済みモデルであり、前処理部510より通知された前処理後データを入力とし、トランスフェクション効率及び/または細胞生存率を推論する。
 評価データ生成部530は、学習済みモデル520により推論されたトランスフェクション効率及び/または細胞生存率に基づいて、評価データ540_1、540_2、540_3、・・・を生成する。
 このように、推論装置220によれば、設計者110がデザインまたは選択した化学構造を有する脂質分子について、実験処理及び評価処理を行うことなく、トランスフェクション効率及び/または細胞生存率を推論し、評価データを生成することができる。
 これにより、核酸240を包含する粒子を構成するより適切な脂質分子の化学構造を探索するのに要する時間を短縮することができる。つまり、第1の実施形態に係る推論装置220によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 <トランスフェクション効率及び/または細胞生存率推論処理の流れ>
 次に、薬物送達システム検討プロセス200におけるトランスフェクション効率及び/または細胞生存率推論処理の流れについて説明する。図6は、トランスフェクション効率及び/または細胞生存率推論処理の流れを示すフローチャートの一例である。
 ステップS601において、学習装置210は、薬物送達システムに関するデータ格納部170より、各種データを取得する。
 ステップS602において、学習装置210は、取得した各種データを用いて学習用データセット400を生成する。
 ステップS603において、学習装置210は、学習用データセット400を用いて、学習モデル420に対して学習処理を行い、学習済みモデル520を生成する。
 ステップS604において、推論装置220は、設計者110により新たにデザインまたは選択された脂質分子の化学構造情報を含む入力データ(例えば、入力データ500_1)を取得する。
 ステップS605において、推論装置220は、学習済みモデル520に、取得した入力データ(例えば、入力データ500_1)を入力することで学習済みモデル520を実行し、トランスフェクション効率及び/または細胞生存率を推論する。また、推論装置220は、推論したトランスフェクション効率及び/または細胞生存率に基づいて評価データ(例えば、評価データ540_1)を生成する。
 ステップS606において、推論装置220は、次の入力データ(例えば、入力データ500_2、500_3、・・・)があるか否かを判定する。
 ステップS606において、次の入力データがあると判定された場合には(ステップS606においてYESの場合には)、ステップS604に戻る。
 一方、ステップS606において、次の入力データがないと判定された場合には(ステップS606においてNOの場合には)、トランスフェクション効率及び/または細胞生存率推論処理を終了する。
 <まとめ>
 以上の説明から明らかなように、第1の実施形態に係る推論装置220は、
・少なくとも脂質分子の化学構造情報を含む入力データを取得する。
・入力データと、脂質分子を含有してなる粒子に包含された核酸の細胞へのトランスフェクション効率及び/または細胞生存率とを関連づける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを有する。
・学習済みモデルは、新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する。
 これにより、第1の実施形態に係る推論装置220によれば、核酸を包含する粒子を構成するより適切な脂質分子の化学構造を探索するのに要する時間を短縮することができる。つまり、第1の実施形態に係る推論装置220によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 <<実施例1>>
 以下に、上記第1の実施形態に係る学習装置210及び推論装置220の具体的な実施例を説明する。なお、以下の実施例はあくまで一例であり、第1の実施形態に係る学習装置210及び推論装置220は、以下の実施例に限定されるものではない。
 <学習装置の実施例>
 はじめに、学習装置210の一実施例について説明する。本実施例では、学習用データセットを学習のためのデータセットと、検証のためのデータセットとに分割し、学習のためのデータセットを用いて学習モデルに対して学習処理を行い、学習済みモデルを生成する。また、本実施例では、検証のためのデータセットを用いて推論装置220の推論精度について評価を行った。
 図7Aは、学習装置の一実施例を示す図である。図7Aに示すように、前処理部410は、変換部710を有し、変換部710は、学習のためのデータセットから、入力データを読み出し、分子記述子に変換する。図7Aの例は、脂質分子の化学構造情報0001から脂質分子の化学構造情報0200までのうち、75個の脂質分子の化学構造情報を読み出し、200個の分子記述子に変換した様子を示している。なお、図7Aの例において、符号701は、変換部710により読み出された75個の脂質分子の化学構造情報のうちの1つの脂質分子の化学構造情報を示している。
 また、図7Aに示すように、前処理部410は、抽出部720を有し、200個の分子記述子の中から、学習処理に用いるのに適切でない分子記述子を削除する。具体的には、抽出部720は、200個の分子記述子のうち、分散が小さい分子記述子を削除し、更に、共線性が認められる分子記述子を削除する。これにより、抽出部720は、学習処理に用いるのに適した分子記述子を抽出する。なお、図7Aにおいて、符号711は、抽出部720により抽出された分子記述子の一例であり、前処理後データとして、学習モデル420に入力される。
 また、図7Aに示すように、本実施例において学習モデル420は機械学習アルゴリズムとして、“Gradient Boosting Decision Tree”を用い、K-分割交差検証によりハイパーパラメータが最適化されているものとする。
 また、図7Aに示すように、本実施例において、学習モデル420はトランスフェクション効率を正解データとして学習処理が行われる。これにより、前処理後データ(分子記述子)と、トランスフェクション効率とを関連付けるように、学習モデル420に対して学習処理が行われ、学習済みモデル520(図7B参照)が生成される。
 <推論装置の実施例>
 次に、推論装置220の一実施例について説明する。図7Bは、推論装置の一実施例を示す図である。図7Bに示すように、前処理部510は、変換部710を有し、変換部710は、検証のためのデータセットから、入力データを読み出し、分子記述子に変換する。図7Bの例は、変換部710が、脂質分子の化学構造情報0201~脂質分子の化学構造情報0216までの16個の脂質分子の化学構造情報を読み出し、200個の分子記述子に変換した様子を示している。なお、図7Bの例において、符号801は、変換部710により読み出された16個の脂質分子の化学構造情報のうちの1つの脂質分子の化学構造情報を示している。
 また、図7Bに示すように、変換部710により変換された分子記述子は、前処理後データとして、学習済みモデル520に入力され、学習済みモデル520は、トランスフェクション効率を推論する。
 図7Bにおいて、符号802は、検証のためのデータセットに含まれる16個の脂質分子の化学構造情報について、学習済みモデル520の推論精度を評価した結果である。具体的には、符号802は、トランスフェクション効率の推論値と実測値とを比較し、相関係数及び平均絶対誤差を指標として推論精度を評価した様子を示している。符号802に示す通り、本実施例では、16個の脂質分子の化学構造情報のトランスフェクション効率について、学習済みモデル520が高い推論精度で推論することが可能であることを確認できた。
 [第2の実施形態]
 次に、第2の実施形態について説明する。上記第1の実施形態では、薬物送達システムに関するデータ格納部170に蓄積された各種データに基づいて、学習装置210が、
・脂質分子の化学構造情報を含む入力データと、
・トランスフェクション効率及び/または細胞生存率と、
を関連付ける学習済みモデルを生成するケースについて説明した。
 これに対して、第2の実施形態では、薬物送達システムに関するデータ格納部170に蓄積された各種データに基づいて、学習装置が、
・デザインの前提条件に含まれる情報と、
・脂質分子の化学構造情報と、
を関連付ける学習済みモデルを生成するケースについて説明する。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
 <推論装置の適用例>
 はじめに、第2の実施形態に係る推論装置の薬物送達システムへの適用例について説明する。図8は、第2の実施形態に係る推論装置の適用例を示す図である。
 図8に示すように、薬物送達システム検討プロセス800では、核酸240を包含する粒子を構成するより適切な脂質分子の化学構造情報を推論するにあたり、デザインの前提条件201(具体的には、デザインの前提条件201に含まれる情報を含む入力データ)を、推論装置820に入力する。
 ここで、推論装置820は、学習装置810により生成された学習済みモデルを有する。学習装置810は、薬物送達システムに関するデータ格納部170に蓄積された各種データに基づいて生成された学習用データセットを用いて、学習モデルに対して学習処理を行うことで、学習済みモデルを生成する。
 推論装置820は、学習装置810により生成された学習済みモデルを実行し、デザインの前提条件201に含まれる情報(を含む入力データ)から脂質分子の化学構造情報280を推論する。
 続いて、薬物送達システム検討プロセス800では、推論装置820により推論された化学構造情報280に基づいて、脂質分子230が生成され、生成された脂質分子230を含有してなる粒子によって核酸240が包含されることで、複合体250の粒子が形成される。
 形成された複合体250の粒子は、対象動物等260や、生体外(in vitro、in situまたはex vivo)の細胞及び/または組織260等に適用される。複合体250の粒子が対象動物等260の生体中(in vivo)の特定の細胞に導入されることで生じた変化(あるいは生体外(in vitro、in situまたはex vivo)の特定の細胞260に導入されることで生じた変化)は、各種測定方法や測定器により測定され、効果データ261として出力される。対象動物等260や、生体外(in vitro、in situまたはex vivo)の細胞及び/または組織への複合体250の粒子の適用方法は、上述の[第1の実施形態]と同様の方法を用いることができる。
 効果データ261には、測定結果から算出される、脂質分子230を含有してなる粒子に包含された核酸240の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる。トランスフェクション効率および細胞生存率は、上述の[第1の実施形態]と同様に評価することができる。
 効果データ261としては、細胞へのトランスフェクション効率や細胞生存率を例示するが、さらに、複合体250の粒子を対象動物等260に適用した場合の生体内における核酸240の体内動態(吸収、分布、代謝)や毒性に関するデータも含まれ得、これらに限定されない。
 このように、従来は、脂質分子の化学構造のデザインまたは選択が、設計者110の経験やノウハウに依存していたところ、推論装置820によれば、デザインの前提条件201に含まれる情報から、直接、脂質分子の化学構造情報280を推論することができる。
 これにより、核酸240を包含する粒子を構成するより適切な脂質分子の化学構造を、設計者110の経験やノウハウに依存することなくデザインまたは選択することができる。つまり、第2の実施形態に係る推論装置820によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 <学習装置の機能構成>
 次に、学習装置810の機能構成の詳細について説明する。図9は、第2の実施形態に係る学習装置の機能構成の一例を示す図である。図9において、学習用データセット900は、薬物送達システムに関するデータ格納部170に格納された各種データに基づいて生成された学習用データセットの一例である。以下に学習用データ(入力データおよび正解データ)の各情報の項目を例示するが、これらに限定されず、またこれらのうちの一部または全部を学習用データとして適宜用いることができる。
 図9に示すように、学習用データセット900は、入力データと正解データとを有し、入力データには、情報の項目として、“疾病の種類”、“核酸の種類”、“導入対象”、“トランスフェクション効率及び/または細胞生存率”、“対象動物等の属性情報”が含まれる。
 “疾病の種類”には、例えば、対象動物等160が患者である場合、その疾病の種類である、「疾病A」が格納される。
 “核酸の種類”には、例えば、「疾病A」に対応する核酸の種類として、「核酸X」、「核酸X」等が格納される。
 “導入対象”には、“疾病の種類”、“核酸の種類”ごとに、複合体の粒子が導入されるべき対象の細胞を示す情報が格納される。図9の例は、疾病の種類=「疾病A」、核酸の種類=「核酸X」の場合、複合体の粒子は「細胞Y」に導入され、疾病の種類=「疾病A」、核酸の種類=「核酸X」の場合、複合体の粒子は「細胞Y」に導入されたことを示している。
 ここでいう対象の細胞を示す情報としては、例えば、由来元または当該細胞が生体内において存在する臓器または組織、細胞の種類(例えば、神経細胞、実質細胞、間質細胞等)などが挙げられるが、これらに限定されない。
 “トランスフェクション効率及び/または細胞生存率”には、脂質分子を含有してなる粒子に包含された核酸の細胞へのトランスフェクション効率及び/または細胞生存率が格納される。具体的には、対応する複合体の粒子を対応する対象動物等160または生体外(in vitro、in situまたはex vivo)の細胞及び/または組織160に適用して、当該適用した対象動物等やそこから単離された試料を測定した測定結果から算出された、トランスフェクション効率及び/または細胞生存率が格納される。
 これらの学習用データセットは、種々の公開情報(例えば、特許公報、論文)やデータベースから入手したデータであってもよい。
 図9の例は、脂質分子を含有してなる粒子に包含された核酸の種類=「核酸X」の細胞へのトランスフェクション効率が「85%」であったことを示している。また、図8の例は、脂質分子を含有してなる粒子に包含された核酸の種類=「核酸X」の細胞へのトランスフェクション効率が「72%」であったことを示している。
 “対象動物等の属性情報”には、対象動物等160(例えば、対象患者)の属性情報が格納される。図9の例は、脂質分子を含有してなる粒子に核酸の種類=「核酸X」を包含させることで形成された複合体の粒子が、対象動物等の属性情報=「患者属性Z」を有する対象患者の「細胞Y」に導入されたことを示している。また、図9の例は、脂質分子を含有してなる粒子に核酸の種類=「核酸X」を包含させることで形成された複合体の粒子が、対象動物等の属性情報=「患者属性Z」を有する対象患者の「細胞Y」に導入されたことを示している。
 一方、正解データには、情報の項目として、“脂質分子の化学構造情報”が含まれる。“脂質分子の化学構造情報”には、“疾病の種類”、“核酸の種類”、“導入対象”等のデザインの前提条件101に含まれる情報に基づいて、設計者110により過去にデザインまたは選択されたより適切な脂質分子の化学構造を示す情報が格納される。
 一方、学習装置810には、学習プログラムがインストールされており、当該学習プログラムが実行されることで、学習装置810は、前処理部910、学習モデル920、比較/変更部930として機能する。
 前処理部910は、学習用データセット900の“入力データ”を取得し、各種前処理を行うことで、学習モデル920に入力するのに適した前処理後データを生成する。前処理部910が行う各種前処理には、入力データを正規化する処理や、入力データをベクトル化する処理等が含まれる。
 学習モデル920は、入力データと正解データ(脂質分子の化学構造情報)とを関連付けるモデルである。具体的には、学習モデル920は、前処理部910より通知された前処理後データを入力とし、脂質分子の化学構造情報を出力する。
 なお、学習モデル920に対しては、比較/変更部930により算出された誤差を逆伝播させることでモデルパラメータを更新する学習処理が行われる。これにより、学習済みモデルが生成される。つまり、学習済みモデルは、学習モデル920の出力が、正解データ(脂質分子の化学構造情報)に近づくように、学習モデル920のモデルパラメータを更新することで生成される。
 比較/変更部930は、学習モデル920より出力された脂質分子の化学構造情報と、学習用データセット900の正解データ(脂質分子の化学構造情報)とを比較することで誤差を算出する。また、比較/変更部930は、算出した誤差を逆伝播させることで、学習モデル920のモデルパラメータを更新する。
 <推論装置の機能構成>
 次に、推論装置820の機能構成の詳細について説明する。図10は、第2の実施形態に係る推論装置の機能構成の一例を示す図である。図10に示すように、入力データ1000には、デザインの前提条件201に含まれる情報(疾病の種類、核酸の種類、導入対象、対象動物等の属性情報等)と、目標とするトランスフェクション効率及び/または細胞生存率とが含まれる。入力データは、種々の公開情報(例えば、特許公報、論文)やデータベースから入手したデータであってもよい。
 入力データ1000は、推論装置820に入力される。推論装置820には、推論プログラムがインストールされており、当該推論プログラムが実行されることで、推論装置820は、前処理部1010、学習済みモデル1020として機能する。
 前処理部1010は取得部の他の一例であり、学習装置810が有する前処理部910と同じ機能を有する。具体的には、前処理部1010は、入力データ1000を取得し、取得した入力データ1000に対して、各種前処理を行うことで、前処理後データを生成する。
 学習済みモデル1020は、学習装置810により学習処理が行われることで生成された学習済みモデルであり、前処理部1010より通知された前処理後データを入力とし、脂質分子の化学構造情報280を推論する。
 このように、推論装置820によれば、デザインの前提条件に含まれる情報から、直接、脂質分子の化学構造情報を推論することができる。これにより、核酸240を包含する粒子を構成するより適切な脂質分子の化学構造を、設計者110の経験やノウハウに依存することなくデザインまたは選択することができる。つまり、第2の実施形態に係る推論装置820によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 <脂質分子の化学構造情報推論処理の流れ>
 次に、薬物送達システム検討プロセス800による脂質分子の化学構造情報推論処理の流れについて説明する。図11は、脂質分子の化学構造情報推論処理の流れを示すフローチャートの一例である。
 ステップS1101において、学習装置810は、薬物送達システムに関するデータ格納部170より、各種データを取得する。
 ステップS1102において、学習装置810は、取得した各種データを用いて学習用データセット900を生成する。
 ステップS1103において、学習装置810は、学習用データセット900を用いて、学習モデル920に対して学習処理を行い、学習済みモデル1020を生成する。
 ステップS1104において、推論装置820は、デザインの前提条件201に含まれる情報、及び、目標となるトランスフェクション効率及び/または細胞生存率、を含む入力データ(例えば、入力データ1000)を取得する。
 ステップS1105において、推論装置820は、学習済みモデル1020に、取得した入力データ(例えば、入力データ1000)を入力することで学習済みモデル1020を実行し、脂質分子の化学構造情報を推論する。
 <まとめ>
 以上の説明から明らかなように、第2の実施形態に係る推論装置820は、
・核酸を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する。
・核酸を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを有する。
・学習済みモデルは、新たに取得された入力データに関連付けられる脂質分子の化学構造情報を推論する。
 これにより、第2の実施形態に係る推論装置820によれば、核酸を包含する粒子を構成するより適切な脂質分子の化学構造を、設計者の経験やノウハウに依存することなくデザインまたは選択することができる。つまり、第2の実施形態に係る推論装置820によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 [第3の実施形態]
 上記第2の実施形態では、
・薬物送達システムに関するデータ格納部170に蓄積された各種データに基づいて学習用データセットを生成し、
・生成した学習用データセットを用いて学習処理を行うことで学習済みモデルを生成し、
・生成した学習済みモデルに、デザインの前提条件を含む入力データを入力することで、脂質分子の化学構造情報を推論し、
・推論した化学構造情報に基づいて生成した脂質分子を含有してなる粒子によって核酸を包含することで、複合体の粒子を形成し、
・形成した複合体の粒子を対象動物等または生体外(in vitro、in situまたはex vivo)の細胞及び/または組織等に適用する、
場合について説明した。
 これに対して、第3の実施形態では、
・デザインの前提条件をユーザから取得し、
・生成した学習済みモデルに、取得したデザインの前提条件を含む入力データを入力することで、脂質分子の化学構造情報を推論し、
・推論した化学構造情報を、ユーザに提供し、
・提供した化学構造情報に基づいて、ユーザが脂質分子を生成し、生成した脂質分子を含有してなる粒子によって核酸を包含することで、ユーザが複合体の粒子を形成し、
・形成した複合体の粒子を対象動物等または生体外(in vitro、in situまたはex vivo)の細胞及び/または組織等に適用することで得られる、薬物送達システムに関するデータをユーザから収集し、
・収集した薬物送達システムに関するデータを用いて学習用データセットを更新し、再度、学習処理を行うことで、学習済みモデルを更新する、
場合について説明する。
 これにより、第3の実施形態によれば、ユーザが有する多種類の核酸それぞれを包含する粒子を構成するより適切な脂質分子をそれぞれ探索することが可能になり、核酸を包含する粒子を構成するより適切な脂質分子を探索するためのノウハウを多数蓄積することができる。以下、第3の実施形態について、上記第1及び第2の実施形態との相違点を中心に説明する。
 <推論サービス提供システムの適用例>
 はじめに、脂質分子の化学構造情報をユーザに提供する、第3の実施形態に係る推論サービス提供システムの、薬物送達システム検討プロセスへの適用例について説明する。図12は、第3の実施形態に係る推論サービス提供システムの適用例を示す図である。
 具体的には、図12は、ユーザ1220(ユーザ名=“ユーザ1”)、ユーザ1230(ユーザ名=“ユーザ2”)、・・・等からの要求に応じて、推論サービス提供システム1210が、各ユーザに、脂質分子の化学構造情報を提供するケースを示している。
 図12に示すように、推論サービス提供システム1210は、推論装置820と情報提供装置1211とを有する。
 このうち、推論装置820は、上記第2の実施形態において図8及び図10を用いて説明した推論装置820と同じである。具体的には、推論装置820は、学習装置810により生成された学習済みモデルを実行し、デザインの前提条件を含む入力データから脂質分子の化学構造情報を推論する。
 一方、情報提供装置1211は取得部として機能する。具体的には、情報提供装置1211は、ユーザ1220及びユーザ1230から、デザインの前提条件1221(情報名=“デザインの前提条件1”)、デザインの前提条件1231(情報名=“デザインの前提条件2”)をそれぞれ取得する。
 また、情報提供装置1211は、取得したデザインの前提条件1221、デザインの前提条件1231を含む入力データをそれぞれ生成し、推論装置820に通知する。これにより、推論装置820では、上記第2の実施形態同様、学習済みモデルを実行し、脂質分子の化学構造情報を推論する。
 また、情報提供装置1211は提供部として機能する。具体的には、情報提供装置1211は、デザインの前提条件1221を含む入力データを通知したことに応じて、推論装置820により推論された脂質分子の化学構造情報1212_1(情報名=“脂質分子の化学構造情報1”)を、ユーザ1220に提供する。また、情報提供装置1211は、デザインの前提条件1231を含む入力データを通知したことに応じて、推論装置820により推論された脂質分子の化学構造情報1212_2(情報名=“脂質分子の化学構造情報2”)を、ユーザ1230に提供する。
 更に、情報提供装置1211は課金部としても機能し、各ユーザに脂質分子の化学構造情報を提供するにあたり、各ユーザに対して課金を行う。これにより、推論サービス提供システム1210では、脂質分子の化学構造情報の推論サービスに応じた対価を受け取ることができる。なお、課金とは、各ユーザが推論サービス提供システム1210に対して支払うべき金額を記録する処理を指す。
 一方、ユーザ1220は、対象動物等1225の属性情報、対象動物等1225の疾病の種類、核酸1223の属性、複合体1224の粒子を導入する対象等のデザインの前提条件1221を、不図示の端末を介して推論サービス提供システム1210に送信する。
 また、ユーザ1220は、対価の支払いと引き換えに、推論サービス提供システム1210より、不図示の端末を介して、デザインの前提条件1221に対応する脂質分子の化学構造情報1212_1が提供される。
 また、ユーザ1220は、提供された脂質分子の化学構造情報1212_1に基づいて脂質分子1222(脂質分子の種類=“脂質分子1”)を生成する。また、ユーザ1220は、生成した脂質分子1222を含有してなる粒子によって核酸1223(核酸の種類=“核酸1”)を包含することで、複合体1224(複合体の種類=“複合体1”)の粒子を形成する。
 また、ユーザ1220は、形成した複合体1224の粒子を対象動物等1225あるいは生体外(in vitro、in situまたはex vivo)の細胞及び/または組織1225等に適用する。複合体1224の粒子が対象動物等1225の特定の細胞に導入されることで生じた変化(あるいは生体外(in vitro、in situまたはex vivo)の特定の細胞1225に導入されることで生じた変化)は、各種測定方法や測定器により測定され、効果データ1226(データ名=“効果データ1”)として出力される。
 効果データ1226には、測定結果から算出される、脂質分子1222を含有してなる粒子に包含された核酸1223の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる。
 更に、ユーザ1220は、薬物送達システム検討プロセス1200の一連の流れの中で取得した各種データを、薬物送達システムに関するデータ格納部170に登録する。図12に示すように、薬物送達システムに関するデータ格納部170に登録される薬物送達システムに関するデータ1227(データ名=“薬物送達システムに関するデータ1”)には、
・“デザインの前提条件1”、
・“脂質分子の化学構造情報1”、
・“核酸1”の化学構造情報、
・“複合体1”の化学構造情報、
・“効果データ1”、
等が含まれる。
 ユーザ1220が登録する薬物送達システムに関するデータ1227は、ユーザ1220が種々の公開情報(例えば、特許公報、論文)やデータベースから入手したデータであってもよい。
 なお、ユーザ1220が薬物送達システムに関するデータ1227を登録したことに応じて、推論サービス提供システム1210では、脂質分子の化学構造情報1212_1を提供したことにより受け取る対価の一部を、ユーザ1220に返金する。つまり、推論サービス提供システム1210では、ユーザ1220に対する課金内容を変更する。
 同様に、ユーザ1230は、対象動物等1235の属性情報、対象動物等が患者である場合、その疾病の種類、核酸1233の属性(例えば、核酸1233の種類、化学構造情報)、複合体1234の粒子を導入する対象等のデザインの前提条件1231を、不図示の端末を介して推論サービス提供システム1210に送信する。
 また、ユーザ1230は、対価の支払いと引き換えに、推論サービス提供システム1210より、不図示の端末を介して、デザインの前提条件1231に対応する脂質分子の化学構造情報1212_2が提供される。
 また、ユーザ1230は、提供された脂質分子の化学構造情報1212_2に基づいて脂質分子1232(脂質分子の種類=“脂質分子2”)を生成する。また、ユーザ1230は、生成した脂質分子1232を含有してなる粒子によって核酸1233(核酸の種類=“核酸2”)を包含することで、複合体1234(複合体の種類=“複合体2”)の粒子を形成する。
 また、ユーザ1230は、形成した複合体1234の粒子を対象動物等1235や、生体外(in vitro、in situまたはex vivo)の細胞及び/または組織1235等に適用する。複合体1234の粒子が対象動物等1235の生体中(in vivo)の特定の細胞に導入されることで生じた変化(あるいは生体外(in vitro、in situまたはex vivo)の特定の細胞1235に導入されることで生じた変化)は、各種測定方法や測定器により測定され、効果データ1236(データ名=“効果データ2”)として出力される。
 効果データ1236には、測定結果から算出される、脂質分子1232を含有してなる粒子に包含された核酸1233の、細胞へのトランスフェクション効率及び/または細胞生存率が含まれる。
 更に、ユーザ1230は、薬物送達システム検討プロセス1200の一連の流れの中で取得した各種データを、薬物送達システムに関するデータ格納部170に登録する。図12に示すように、薬物送達システムに関するデータ格納部170に登録される薬物送達システムに関するデータ1237(データ名=“薬物送達システムに関するデータ2”)には、
・“デザインの前提条件2”、
・“脂質分子の化学構造情報2”、
・“核酸2”の化学構造情報、
・“複合体2”の化学構造情報、
・“効果データ2”、
等が含まれる。
 なお、ユーザ1230が薬物送達システムに関するデータ1237を登録したことに応じて、推論サービス提供システム1210では、脂質分子の化学構造情報1212_2を提供したことにより受け取る対価の一部を、ユーザ1230に返金することができる。つまり、推論サービス提供システム1210では、ユーザ1230に対する課金内容を変更することができる。
 このように、推論サービス提供システム1210が、各ユーザからの要求に応じて脂質分子の化学構造情報を提供することで、多種類の核酸それぞれを包含する粒子を構成するより適切な脂質分子をそれぞれ探索することが可能になる。
 また、薬物送達システムに関するデータ格納部170では、多種類の核酸についての、薬物送達システムに関するデータを蓄積することができる。また、薬物送達システムに関するデータ格納部170に蓄積されるデータには、種々の公開情報(例えば、特許公報、論文)やデータベースから入手できるデータが含まれていてもよい。更に、学習装置810では、新たに蓄積された薬物送達システムに関するデータを用いて学習用データセットを更新し、再度、学習処理を行うことで、学習済みモデルを更新することができる。
 この結果、第3の実施形態に係る推論サービス提供システム1210によれば、核酸を包含する粒子を構成するより適切な脂質分子を探索するためのノウハウを多数蓄積することができる。つまり、第3の実施形態に係る推論サービス提供システム1210によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 <推論サービス提供処理の流れ>
 次に、薬物送達システム検討プロセス1200による推論サービス提供処理の流れについて説明する。図13は、推論サービス提供処理の流れを示すフローチャートの一例である。
 ステップS1301において、学習装置810は、薬物送達システムに関するデータ格納部170より、各種データを取得する。
 ステップS1302において、学習装置810は、取得した各種データを用いて学習用データセット900を生成する。
 ステップS1303において、学習装置810は、学習用データセット900を用いて、学習モデル920に対して学習処理を行い、学習済みモデル1020を生成する。
 ステップS1304において、推論サービス提供システム1210の推論装置820は、ユーザより送信されたデザインの前提条件に基づいて情報提供装置1211が生成した入力データを取得する。
 ステップS1305において、推論サービス提供システム1210の推論装置820は、学習済みモデル1020に、取得した入力データを入力することで学習済みモデル1020を実行し、脂質分子の化学構造情報を推論する。
 ステップS1306において、推論サービス提供システム1210の情報提供装置1211は、推論装置820により推論された脂質分子の化学構造情報を、デザインの前提条件を送信したユーザに提供するとともに、ユーザに対して課金を行う。
 ステップS1307において、推論サービス提供システム1210は、情報提供装置1211がユーザに対して脂質分子の化学構造情報を提供したことに応じて、ユーザより、薬物送達システムに関するデータを収集した場合には、ユーザに対して対価の一部を返金することができる。
 ステップS1308において、推論サービス提供システム1210は、ユーザから、薬物送達システムに関するデータについて、所定量のデータを収集したか否かを判定する。
 ステップS1308において、所定量のデータを収集したと判定した場合には(ステップS1308においてYESの場合には)、ステップS1302に戻る。この場合、新たに登録された所定量のデータに基づいて、学習用データセットを生成し、再度、学習処理を行う。
 一方、ステップS1308において、所定量のデータを収集していないと判定した場合には(ステップS1308においてNOの場合には)、ステップS1309に進む。
 ステップS1309において、推論サービス提供システム1210の情報提供装置1211は、推論サービス提供処理を終了するか否かを判定する。ステップ1309において推論サービス提供処理を継続すると判定した場合には(ステップS1309においてNOの場合には)、ステップS1304に戻る。
 一方、ステップS1309において、推論サービス提供処理を終了すると判定した場合には(ステップS1309においてYESの場合には)、推論サービス提供処理を終了する。
 <まとめ>
 以上の説明から明らかなように、第3の実施形態に係る推論サービス提供システム1210は、
・核酸を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザから取得する。
・核酸を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを有する。
・ユーザから取得した前提条件を含む入力データが入力されることで、学習済みモデルが推論した脂質分子の化学構造情報を、前提条件を送信したユーザに提供する。
 これにより、第3の実施形態に係る推論サービス提供システム1110によれば、ユーザが提示する多種類の核酸それぞれを包含する粒子を構成するより適切な脂質分子をそれぞれ探索することが可能になる。
 また、第3の実施形態に係る推論サービス提供システム1210は、
・脂質分子の化学構造情報を提供したことに応じて、ユーザより、薬物送達システムに関するデータを収集する。
 これにより、第3の実施形態に係る推論サービス提供システム1210によれば、核酸を包含する粒子を構成するより適切な脂質分子を探索するためのノウハウを多数蓄積することができる。つまり、第3の実施形態に係る推論サービス提供システム1210によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 [第4の実施形態]
 上記第3の実施形態では、脂質分子の化学構造情報を提供したことに応じて、ユーザより、薬物送達システムに関するデータを収集し、所定量のデータが蓄積された場合に、再度、学習処理を行うものとして説明した。
 これに対して、第4の実施形態では、脂質分子の化学構造情報を提供したことに応じて、ユーザより、トランスフェクション効率及び/または細胞生存率を取得する。また、第4の実施形態では、取得したトランスフェクション効率及び/または細胞生存率に基づいて算出される報酬を用いて、強化学習モデルに対して強化学習処理を行う。これにより、第4の実施形態によれば、推論サービスの提供に伴って推論精度を向上させることが可能となり、核酸を包含する粒子を構成するより適切な脂質分子を探索するためのノウハウを多数蓄積することができる。
 以下、第4の実施形態について、上記第3の実施形態との相違点を中心に説明する。
 <推論サービス提供システムの適用例>
 はじめに、脂質分子の化学構造情報をユーザに提供する、第4の実施形態に係る推論サービス提供システムの、薬物送達システム検討プロセスへの適用例について説明する。図14は、第4の実施形態に係る推論サービス提供システムの適用例を示す図である。
 具体的には、図14は、図12同様、ユーザ1220、ユーザ1230、・・・等からの要求に応じて、推論サービス提供システム1410が、各ユーザに、脂質分子の化学構造情報を提供するケースを示している。ただし、図14に示すように、薬物送達システム検討プロセス1400の場合、推論サービス提供システム1410は、推論装置1420と情報提供装置1211とを有する。
 このうち、情報提供装置1211は、上記第3の実施形態において図12を用いて説明した情報提供装置1211と同じ機能を有する。具体的には、情報提供装置1211は、各ユーザよりデザインの前提条件が送信されると、入力データをそれぞれ生成し、推論装置1420に通知する。また、情報提供装置1211は、入力データを通知したことに応じて、推論装置1420により推論された脂質分子の化学構造情報を取得し、対応するユーザに提供する。
 更に、上記第3の実施形態同様、情報提供装置1211は、脂質分子の化学構造情報を提供するにあたり、各ユーザに対して課金を行う。これにより、推論サービス提供システム1410では、脂質分子の化学構造情報の推論サービスに応じた対価を受け取ることができる。
 一方、推論装置1420は、情報提供装置1211によって、脂質分子の化学構造情報がユーザに提供されたことに応じて、ユーザより、効果データを取得する。また、推論装置1420は、取得した効果データに含まれるトランスフェクション効率及び/または細胞生存率に基づいて報酬を算出し、算出した報酬に基づいて、強化学習モデルのモデルパラメータを更新する。
 また、推論装置1420は、モデルパラメータが更新された強化学習モデルに、情報提供装置1211より新たに通知された入力データを入力することで強化学習モデルを実行し、新たに脂質分子の化学構造情報を推論する。
 なお、図14においてユーザ1220及びユーザ1230が行う処理は、上記第3の実施形態において図12を用いて説明した処理と同様であるため、ここでは、説明を省略する。ただし、ユーザ1220は、効果データ1226を推論サービス提供システム1410に送信する。このとき、送信する効果データ1226には、脂質分子1222を含有してなる粒子に包含された核酸1223の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる。
 同様に、ユーザ1230は、効果データ1236を推論サービス提供システム1410に送信する。このとき、送信する効果データ1236には、脂質分子1232を含有してなる粒子に包含された核酸1233の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる。
 推論サービス提供システムに送信されるデータは、種々の公開情報(例えば、特許公報、論文)やデータベースから入手できるデータであってもよい。
 なお、ユーザ1220が効果データ1226を送信したことに応じて、推論サービス提供システム1410では、脂質分子の化学構造情報1212_1を提供したことに対する対価の一部を、ユーザ1220に返金することができる。つまり、推論サービス提供システム1410では、ユーザ1220に対する課金内容を変更することができる。
 同様に、ユーザ1230が効果データ1236を送信したことに応じて、推論サービス提供システム1410では、脂質分子の化学構造情報1212_2を提供したことに対する対価の一部を、ユーザ1230に返金することができる。つまり、推論サービス提供システム1410では、ユーザ1230に対する課金内容を変更することができる。
 このように、推論サービス提供システム1410は、各ユーザからの要求に応じて脂質分子の化学構造情報を提供するごとに、各ユーザから効果データを取得することで、強化学習モデルに対する強化学習処理を行う。
 これにより、第4の実施形態に係る推論サービス提供システム1410によれば、多種類の核酸を対象に、強化学習モデルに対して強化学習処理を行うことが可能となり、推論サービスの提供に伴って推論精度を向上させることができる。
 この結果、第4の実施形態に係る推論サービス提供システム1410によれば、核酸を包含する粒子を構成するより適切な脂質分子を探索するためのノウハウを多数蓄積することができる。つまり、第4の実施形態に係る推論サービス提供システム1410によれば、核酸を包含する粒子を構成するより適切な脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 <推論装置の機能構成>
 次に、推論装置1420の機能構成の詳細について説明する。図15は、推論装置の機能構成の一例を示す図である。推論装置1420には、推論プログラムがインストールされており、当該推論プログラムが実行されることで、推論装置1420は、前処理部1510、強化学習モデル1520、報酬算出部1530として機能する。
 前処理部1510は、学習装置810が有する前処理部910と同じ機能を有し、入力データ1501、1502等に対して、各種前処理を行うことで、前処理後データを生成する。なお、入力データ1501には、ユーザ1220より送信されたデザインの前提条件1221が含まれる。また、入力データ1502には、ユーザ1230より送信されたデザインの前提条件1231が含まれる。
 強化学習モデル1520は、前処理部1510より通知された前処理後データを入力とし、脂質分子の化学構造情報1212_1、1212_2等を推論する。
 報酬算出部1530は算出部として機能し、ユーザ1220、1230より送信される効果データ1226、1236等に含まれる、トランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する。なお、報酬算出部1530では、トランスフェクション効率及び/または細胞生存率が上がることで報酬が最大化するように、報酬を算出する。
 また、報酬算出部1530は、算出した報酬に基づいて、強化学習モデル1520のモデルパラメータを更新する強化学習処理を行う。
 <推論サービス提供処理の流れ>
 次に、薬物送達システム検討プロセス1400による推論サービス提供処理の流れについて説明する。図16は、推論サービス提供処理の流れを示すフローチャートの他の一例である。
 ステップS1601において、推論サービス提供システム1410の推論装置1420は、ユーザが送信するデザインの前提条件に基づいて情報提供装置1211が生成した入力データを取得する。
 ステップS1602において、推論サービス提供システム1410の推論装置1420は、強化学習モデル1520に、取得した入力データを入力することで強化学習モデル1520を実行し、脂質分子の化学構造情報を推論する。
 ステップS1603において、推論サービス提供システム1410の情報提供装置1211は、推論装置1420により推論された脂質分子の化学構造情報を、デザインの前提条件を送信したユーザに提供するとともに、ユーザに対して課金を行う。
 ステップS1604において、推論サービス提供システム1410の推論装置1420は、情報提供装置1211がユーザに対して脂質分子の化学構造情報を提供したことに応じて、ユーザより、効果データを取得する。また、推論サービス提供システム1410の推論装置1420は、効果データを送信したユーザに対して対価の一部を返金する。
 ステップS1605において、推論サービス提供システム1410の推論装置1420は、取得した効果データに含まれる、トランスフェクション効率及び/または細胞生存率に基づいて報酬を算出する。
 ステップS1606において、推論サービス提供システム1410の推論装置1420は、算出した報酬に基づいて、強化学習モデルに対してモデルパラメータを更新する強化学習処理を行う。
 ステップS1607において、推論サービス提供システム1410の情報提供装置1211は、推論サービス提供処理を終了するか否かを判定する。ステップ1607において推論サービス提供処理を継続すると判定した場合には(ステップS1607においてNOの場合には)、ステップS1601に戻る。
 一方、ステップS1607において、推論サービス提供処理を終了すると判定した場合には(ステップS1607においてYESの場合には)、推論サービス提供処理を終了する。
 <まとめ>
 以上の説明から明らかなように、第4の実施形態に係る推論サービス提供システム1410は、
・核酸を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザから取得する。
・取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを有する。
・強化学習モデルにより推論された化学構造情報に基づいて生成された脂質分子を含有してなる粒子に包含された核酸の細胞へのトランスフェクション効率及び/または細胞生存率を取得し、報酬を算出する。
・算出した報酬に基づいて、強化学習モデルに対して強化学習処理を行う。
 これにより、第4の実施形態に係る推論サービス提供システム1410によれば、推論サービスの提供に伴って推論精度を向上させることができる。この結果、第4の実施形態に係る推論サービス提供システム1410によれば、核酸を包含する粒子を構成するより適切な脂質分子を探索するためのノウハウの多数蓄積することができる。つまり、第4の実施形態に係る推論サービス提供システム1410によれば、核酸を包含する粒子を構成するより適切な脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 [第5の実施形態]
 上記第1の実施形態では、学習装置210により生成された学習済みモデル520を推論装置220に適用し、評価データ221を生成するように、推論装置220を構成する場合について説明した。
 しかしながら、学習済みモデル520の適用方法は、これに限定されず、例えば、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報を探索するように推論装置を構成してもよい。以下、第5の実施形態について、上記第1の実施形態との相違点を中心に説明する。
 <推論装置の機能構成>
 はじめに、第5の実施形態に係る推論装置の機能構成の詳細について説明する。図17は、第5の実施形態に係る推論装置の機能構成の一例を示す図である。図17に示すように、推論装置1700は、前処理部510、学習済みモデル520、生成部1710として機能する。
 このうち、前処理部510及び学習済みモデル520は、上記第1の実施形態において図5を用いて説明済みであるため、ここでは説明を省略する。
 生成部1710は、例えば、Thompson Samplingによる強化学習機能を有する。具体的には、生成部1710は、所定の終了条件を満たすか否か(例えば、学習済みモデル520により推論されたトランスフェクション効率及び/または細胞生存率が目標とするトランスフェクション効率及び/または細胞生存率を満たすか否か)を判定する。
 また、生成部1710は、所定の終了条件を満たさないと判定した場合、学習済みモデル520により推論されたトランスフェクション効率及び/または細胞生存率に基づいて、脂質分子の化学構造情報を生成する。また、生成部1710は、生成した脂質分子の化学構造情報を前処理部510に通知する。
 一方、生成部1710は、所定の終了条件を満たすと判定した場合、前回生成した脂質分子の化学構造情報を、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報として出力する。
 図17において、符号1730は、生成部1710より出力された脂質分子の化学構造情報の一例である。図17の例は、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報として、ある特定の脂質分子が生成された様子を示している。
 <推論装置による生成処理の流れ>
 次に、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報を生成するための、推論装置1700による生成処理の流れについて説明する。
 図18は、生成処理の流れを示すフローチャートの一例である。なお、推論装置1700により図18に示す生成処理が開始されるにあたり、推論装置1700には、予め目標とするトランスフェクション効率及び/または細胞生存率が設定されているものとする。
 ステップS1801において、生成部1710は、長さ、飽和度、枝数の最大値を設定した、化学的に形成可能な炭化水素から分子フラグメント群を生成する。
 ステップS1802において、生成部1710は、生成した分子フラグメントと、設計者110が選択した脂質の化学骨格群とを結合し、脂質分子の化学構造群を生成する。このとき、生成部1710は、生成した脂質分子の化学構造群を、分子フラグメントの長さ、飽和度、枝数と化学骨格の種類等との組み合わせに応じて、設計者110が規定した数の複数の探索空間に分割する。
 ステップS1803において、生成部1710は、ステップS1802において分割した複数の探索空間の中から、Thompson Samplingを用いて、いずれかの探索空間を選択する。なお、いずれかの探索空間を選択することは、探索空間の特性(脂質分子の分子フラグメントの長さ、飽和度、枝の数と化学骨格の種類等との組み合わせ)を選択することに他ならない。
 ステップS1804において、生成部1710は、選択した脂質分子の分子フラグメントの長さ、飽和度、枝数と化学骨格の種類等との組み合わせを用いて脂質分子の化学構造群を生成する。なお、生成部1710は、選択した探索空間以外の探索空間から、一定の確率で、ランダムに複数の分子フラグメントを取得し、選択した分子フラグメントとともに、脂質分子の化学構造群を生成する。
 ステップS1805において、生成部1710は、生成した脂質分子の化学構造群の各化学構造情報を、前処理部510に通知する。また、前処理部510は、生成部1710より通知された脂質分子の各化学構造情報に対して各種前処理を行うことで、学習済みモデル520に入力するのに適した前処理後データ群を生成し、学習済みモデル520に入力する。これにより、学習済みモデル520は、ステップS1804において、生成部1710により生成された脂質分子の化学構造群について、トランスフェクション効率及び/または細胞生存率を推論する。
 ステップS1806において、生成部1710は、
・学習済みモデル520により推論された複数のトランスフェクション効率及び/または細胞生存率のうちの最大値(推論結果)と、
・ステップS1803において選択した探索空間と、
を用いて、Thompson Samplingに用いる確率分布を更新する。
 ステップS1807において、生成部1710は、所定の終了条件を満たすか否かを判定する。ステップS1807において、所定の終了条件を満たさないと判定した場合には(ステップS1807においてNOの場合には)、ステップS1803に戻る。
 一方、ステップS1807において、所定の終了条件を満たすと判定した場合には(ステップS1807においてYESの場合には)、ステップS1808に進む。
 ステップS1808において、生成部1710は、前回生成した脂質分子の化学構造情報(最大値が推論された脂質分子の化学構造情報)を、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報として出力する。
 <まとめ>
 以上の説明から明らかなように、第5の実施形態に係る推論装置1700は、
・少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われた学習済みモデルを有する。
・新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率が、学習済みモデルによって推論された場合に、推論結果に基づいて、次の新たな脂質分子の化学構造情報を生成する生成部を有する。
・生成部は、所定の終了条件が満たされるまで、推論結果に基づいて、次の新たな脂質分子の化学構造を生成する生成処理を繰り返す。
 これにより、第5の実施形態に係る推論装置1700によれば、例えば、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報を生成することができる。つまり、第5の実施形態に係る推論装置1700によれば、核酸を包含する粒子を構成する脂質分子の化学構造情報をデザインまたは選択するための作業を支援することができる。
 [第6の実施形態]
 上記第5の実施形態では、トランスフェクション効率及び/または細胞生存率に応じた脂質分子の化学構造情報を生成する構成とした。
 これに対して、第6の実施形態では、上記第2の実施形態同様、トランスフェクション効率及び/または細胞生存率に加えて、デザインの前提条件201に含まれる情報(疾病の種類、核酸の種類、導入対象、対象動物等の属性情報等)を入力する。そして、第6の実施形態では、脂質分子の化学構造情報を生成する際、デザインの前提条件201に含まれる情報(疾病の種類、核酸の種類、導入対象、対象動物等の属性情報等)に応じた脂質分子の化学構造情報を生成する。以下、第6の実施形態について、上記第5の実施形態との相違点を中心に説明する。
 <推論装置の機能構成>
 図19は、第6の実施形態に係る推論装置の機能構成の一例を示す図である。図19に示すように、推論装置1900は、前処理部510、学習済みモデル520、生成部1910、取得部1930として機能する。
 このうち、前処理部510及び学習済みモデル520は、上記第1の実施形態において図5を用いて説明済みであるため、ここでは説明を省略する。
 生成部1910は、図17の生成部1710同様、Thompson Samplingによる強化学習機能を有する。具体的には、生成部1910は、学習済みモデル520から出力されたトランスフェクション効率及び/または細胞生存率を取得する。また、生成部1910は、所定の終了条件を満たすか否か(例えば、取得したトランスフェクション効率及び/または細胞生存率が、目標とするトランスフェクション効率及び/または細胞生存率を満たすか否か)を判定する。また、生成部1910は、所定の終了条件を満たさないと判定した場合、取得したトランスフェクション効率及び/または細胞生存率に基づいて、脂質分子の化学構造情報を生成し、生成した脂質分子の化学構造情報を前処理部510に通知する。
 なお、生成部1910では、脂質分子の化学構造情報を生成する際、取得部1930より通知された、デザインの前提条件201に含まれる情報(疾病の種類、核酸の種類、導入対象、対象動物等の属性情報等)を、所定の制約条件として取得する。そして、生成部1910では、脂質分子の化学構造情報を生成する際、取得したこれらの情報を所定の制約条件として化学構造情報を生成する。
 一方、生成部1910は、所定の終了条件を満たすと判定した場合、前回生成した脂質分子の化学構造情報を、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報として出力する。
 取得部1930は、入力データ1000を取得する。また、取得部1930は、取得した入力データ1000を、生成部1910に通知する。
 <まとめ>
 以上の説明から明らかなように、第6の実施形態に係る推論装置1900は、
・少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われた学習済みモデルを有する。
・新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を、学習済みモデルを用いて推論する。
・推論されたトランスフェクション効率及び/または細胞生存率に基づいて、次の新たな脂質分子の化学構造情報を生成する。その際、デザインの前提条件に含まれる情報を所定の制約条件として、次の新たな脂質分子の化学構造情報を生成する。
・所定の終了条件が満たされるまで、推論されたトランスフェクション効率及び/または細胞生存率と、デザインの前提条件に含まれる情報とに基づいて、次の新たな脂質分子の化学構造情報を生成する生成処理を繰り返す。
 これにより、第6の実施形態に係る推論装置1900によれば、所定の制約条件のもとで、目標とするトランスフェクション効率及び/または細胞生存率を満たす脂質分子の化学構造情報を生成することができる。つまり、第6の実施形態に係る推論装置1900によれば、核酸を包含する粒子を構成する脂質分子の化学構造をデザインまたは選択するための作業を支援することができる。
 [その他の実施形態]
 上記第1乃至第3の実施形態では、学習装置と推論装置とを別体の装置として構成するものとして説明した。しかしながら、学習装置と推論装置とは、一体の装置として構成してもよい。
 また、上記第3の実施形態では、推論サービス提供システム1210において、推論装置820と情報提供装置1211とを別体の装置として構成するものとして説明した。しかしながら、推論装置820と情報提供装置1211とは一体の装置として構成してもよい。この場合、推論サービス提供システム1210では、一体の装置において、例えば、推論サービス提供プログラムを実行することで、推論装置820の機能と情報提供装置1211の機能とを実現してもよい。
 同様に、上記第4の実施形態では、推論サービス提供システム1410において、推論装置1420と情報提供装置1211とを別体の装置として構成するものとして説明した。しかしながら、推論装置1420と情報提供装置1211とは一体の装置として構成してもよい。この場合、推論サービス提供システム1410では、一体の装置において、例えば、推論サービス提供プログラムを実行することで、推論装置1420の機能と情報提供装置1211の機能とを実現してもよい。
 また、上記第3及び第4の実施形態では、情報提供装置が、入力データを生成するものとして説明した。しかしながら、入力データの生成は、例えば、推論装置が行うように構成してもよい。
 また、上記第3及び第4の実施形態では、情報提供装置が、取得部、提供部、課金部として機能するものとして説明した。しかしながら、情報提供装置が実現する機能の一部は、ユーザの端末(あるいはクラウド上)において実現されてもよい。
 また、上記第3及び第4の実施形態では、情報提供装置による脂質分子の化学構造情報のユーザへの提供方法の詳細について言及しなかったが、情報提供装置による提供方法は任意である。例えば、情報提供装置は、脂質分子の化学構造情報を直接ユーザに送信するように構成してもよいし、脂質分子の化学構造情報を、ユーザがパスワード等を入力することでアクセス可能な格納場所に格納するように構成してもよい。
 また、上記第5及び第6の実施形態では、生成部が、所定の終了条件として、学習済みモデル520により推論されたトランスフェクション効率及び/または細胞生存率が、目標とするトランスフェクション効率及び/または細胞生存率を満たすか否かを判定した。しかしながら、所定の終了条件はこれに限定されず、例えば、生成する脂質分子の化学構造情報が更新されたか否かを判定するようにしてもよい。この場合、生成部では、生成する脂質分子の化学構造情報が更新されていないと判定した場合に、所定の終了条件を満たすと判定する。
 また、上記各実施形態では、入力データの情報の項目として、図5、図10、図15等の情報の項目を例示したが、入力データの情報の項目は、これらに限定されない。
 なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
 本出願は、2020年8月31日に出願された日本国特許出願第2020-146402号に基づきその優先権を主張するものであり、同日本国特許出願の全内容を参照することにより本願に援用する。
 100      :薬物送達システム検討プロセス
 170      :薬物送達システムに関するデータ格納部
 200      :薬物送達システム検討プロセス
 210      :学習装置
 220      :推論装置
 400      :学習用データセット
 520      :学習済みモデル
 800      :薬物送達システム検討プロセス
 810      :学習装置
 820      :推論装置
 900      :学習用データセット
 1000     :入力データ
 1020     :学習済みモデル
 1200     :薬物送達システム検討プロセス
 1211     :情報提供装置
 1400     :薬物送達システム検討プロセス
 1410     :推論サービス提供システム
 1420     :推論装置
 1520     :強化学習モデル
 1530     :報酬算出部
 1700     :推論装置
 1710     :生成部
 1900     :推論装置
 1910     :生成部
 1930     :取得部

Claims (36)

  1.  少なくとも脂質分子の化学構造情報を含む入力データを取得する取得部と、
     少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、を有し、
     前記学習済みモデルは、前記取得部により新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、推論装置。
  2.  前記学習処理が行われる際に用いられたトランスフェクション効率及び/または細胞生存率は、前記学習処理が行われる際に用いられた化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定された測定結果から算出される、請求項1に記載の推論装置。
  3.  前記学習済みモデルは、前記少なくとも脂質分子の化学構造情報を含む入力データを前記学習モデルに入力した場合の出力が、前記測定結果から算出される前記トランスフェクション効率及び/または細胞生存率に近づくように、前記学習モデルのモデルパラメータが更新されることで生成される、請求項2に記載の推論装置。
  4.  前記取得部は、前記新たに取得した入力データに対して予め定められた前処理を行い、前記学習済みモデルは、前処理後の入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、請求項1に記載の推論装置。
  5.  少なくとも脂質分子の化学構造情報を含む入力データを取得する取得工程と、
     少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、を有する推論方法であって、
     前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、推論方法。
  6.  少なくとも脂質分子の化学構造情報を含む入力データを取得する取得工程と、
     少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、をコンピュータに実行させるための推論プログラムであって、
     前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられたトランスフェクション効率及び/または細胞生存率を推論する、推論プログラム。
  7.  少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理を行うことで学習済みモデルを生成するモデル生成方法。
  8.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得部と、
     活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、を有し、
     前記学習済みモデルは、前記取得部により新たに取得された入力データに関連付けられた脂質分子の化学構造情報を推論する、推論装置。
  9.  前記学習処理が行われる際に用いられた入力データには、デザインまたは選択された脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定された測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率が含まれる、請求項8に記載の推論装置。
  10.  前記学習済みモデルは、前記前提条件を含む入力データを前記学習モデルに入力した場合の出力が、前記学習処理が行われる際に用いられた脂質分子の化学構造情報に近づくように、前記学習モデルのモデルパラメータが更新されることで生成される、請求項8に記載の推論装置。
  11.  前記取得部は、前記新たに取得した入力データに対して予め定められた前処理を行い、前記学習済みモデルは、前処理後の入力データに関連付けられた脂質分子の化学構造情報を推論する、請求項8に記載の推論装置。
  12.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
     活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、を有する推論方法であって、
     前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられた脂質分子の化学構造情報を推論する、推論方法。
  13.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
     活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、をコンピュータに実行させるための推論プログラムであって、
     前記実行工程は、前記学習済みモデルを実行することで、前記取得工程において新たに取得された入力データに関連付けられた脂質分子の化学構造情報を推論する、推論プログラム。
  14.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理を行うことで学習済みモデルを生成する、モデル生成方法。
  15.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得部と、
     活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、
     前記取得部によって新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルが推論した脂質分子の化学構造情報を、該ユーザに提供する提供部と
     を有する推論サービス提供システム。
  16.  前記取得部によって新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルが、脂質分子の化学構造情報を推論した場合に、前記ユーザに対して課金を行う課金部を更に有する、請求項15に記載の推論サービス提供システム。
  17.  前記学習済みモデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率を、前記ユーザより取得した場合に、前記課金部は、前記ユーザに対する課金内容を変更する、請求項16に記載の推論サービス提供システム。
  18.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
     活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
     前記取得工程において新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルにより推論された脂質分子の化学構造情報を、該ユーザに提供する提供工程と
     を有する推論サービス提供方法。
  19.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
     活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データと、該脂質分子の化学構造情報とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
     前記取得工程において新たにユーザより取得された前提条件を含む入力データが入力されることで、前記学習済みモデルにより推論された脂質分子の化学構造情報を、該ユーザに提供する提供工程と
     をコンピュータに実行させるための推論サービス提供プログラム。
  20.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得部と、
     前記取得部により取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルと、
     前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出部と、を有し、
     前記強化学習モデルは、前記算出部により算出された報酬に基づいて学習処理を行う、推論装置。
  21.  前記算出部は、前記トランスフェクション効率及び/または細胞生存率が上がることで最大化するように、前記報酬を算出する請求項20に記載の推論装置。
  22.  前記取得部は、前記入力データに対して予め定められた前処理を行い、前記強化学習モデルは、前処理後の入力データが入力されることで、脂質分子の化学構造情報を推論する、請求項20に記載の推論装置。
  23.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
     前記取得工程において取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
     前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、を有し、
     前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論方法。
  24.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を含む入力データを取得する取得工程と、
     前記取得工程において取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
     前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、をコンピュータに実行させるための推論プログラムであって、
     前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論プログラム。
  25.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得部と、
     前記取得部によってユーザより取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルと、
     前記強化学習モデルにより推論された脂質分子の化学構造情報を、前記ユーザに提供する提供部と、
     前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質を、細胞に導入することで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出部と、を有し、
     前記強化学習モデルは、前記算出部により算出された報酬に基づいて学習処理を行う、推論サービス提供システム。
  26.  前記強化学習モデルが推論した脂質分子の化学構造情報を前記提供部が前記ユーザに提供した場合に、前記ユーザに対して課金を行う課金部と
     を更に有する請求項25に記載の推論サービス提供システム。
  27.  前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質が、細胞に導入されることで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率を、前記ユーザより取得した場合に、前記課金部は、前記ユーザに対する課金内容を変更する、請求項26に記載の推論サービス提供システム。
  28.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
     前記取得工程においてユーザより取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
     前記強化学習モデルにより推論された脂質分子の化学構造情報を、前記ユーザに提供する提供工程と、
     前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質が、細胞に導入されることで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、を有する推論サービス提供方法であって、
     前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論サービス提供方法。
  29.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件をユーザより取得する取得工程と、
     前記取得工程においてユーザより取得された前提条件を含む入力データが入力されることで、脂質分子の化学構造情報を推論する強化学習モデルを実行する実行工程と、
     前記強化学習モデルにより推論された脂質分子の化学構造情報を、前記ユーザに提供する提供工程と、
     前記強化学習モデルにより推論された化学構造情報を有する脂質分子を含有してなる粒子に包含された活性物質が、細胞に導入されることで測定される測定結果から算出される、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率に基づいて、報酬を算出する算出工程と、をコンピュータに実行させるための推論サービス提供プログラムであって、
     前記強化学習モデルは、前記算出工程において算出された報酬に基づいて学習処理を行う、推論サービス提供プログラム。
  30.  少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルと、
     新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率が、前記学習済みモデルによって推論された場合に、推論結果に基づいて、次の新たな脂質分子の化学構造情報を生成する生成処理を、所定の終了条件が満たされるまで繰り返す生成部と
     を有する推論装置。
  31.  前記生成部は、
     形成可能な炭化水素の分子フラグメントと脂質分子の化学骨格との組み合わせに応じた複数の探索空間から、前記推論結果に基づいて、いずれかの探索空間を選択し、選択した探索空間の特性を用いて前記次の新たな脂質分子の化学構造情報を生成する、請求項30に記載の推論装置。
  32.  前記複数の探索空間は、互いに、分子フラグメントの長さ、飽和度、枝数と、脂質分子の化学骨格の種類との組み合わせが異なる、請求項31に記載の推論装置。
  33.  前記生成部は、所定の制約条件のもとで前記次の新たな脂質分子の化学構造情報を生成する、請求項31に記載の推論装置。
  34.  活性物質を包含する粒子を構成する脂質分子をデザインまたは選択するための前提条件を取得する取得部を更に有し、
     前記生成部は、取得された前記前提条件を前記所定の制約条件として、前記次の新たな脂質分子の化学構造情報を生成する、請求項30に記載の推論装置。
  35.  少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
     新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率が、前記学習済みモデルによって推論された場合に、推論結果に基づいて、次の新たな脂質分子の化学構造情報を生成する生成処理を、所定の終了条件が満たされるまで繰り返す生成工程と
     を有する推論方法。
  36.  少なくとも脂質分子の化学構造情報を含む入力データと、該脂質分子を含有してなる粒子に包含された活性物質の細胞へのトランスフェクション効率及び/または細胞生存率とを関連付ける学習モデルに対して、学習処理が行われることで生成された学習済みモデルを実行する実行工程と、
     新たに生成した脂質分子の化学構造情報を含む入力データに関連付けられたトランスフェクション効率及び/または細胞生存率が、前記学習済みモデルによって推論された場合に、推論結果に基づいて、次の新たな脂質分子の化学構造情報を生成する生成処理を、所定の終了条件が満たされるまで繰り返す生成工程と
     をコンピュータに実行させるための推論プログラム。
PCT/JP2021/031711 2020-08-31 2021-08-30 推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラム WO2022045334A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US18/022,491 US20240038340A1 (en) 2020-08-31 2021-08-30 Inference device, inference method, inference program, model generating method, inference service providing system, inference service providing method, and inference service providing program
EP21861755.3A EP4207205A1 (en) 2020-08-31 2021-08-30 Inference device, inference method, inference program, model generating method, inference service providing system, inference service providing method, and inference service providing program
CN202180052991.6A CN115989511A (zh) 2020-08-31 2021-08-30 推理装置、推理方法、推理程序、模型生成方法、推理服务提供系统、推理服务提供方法以及推理服务提供程序
JP2022545756A JPWO2022045334A1 (ja) 2020-08-31 2021-08-30

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020146402 2020-08-31
JP2020-146402 2020-08-31

Publications (1)

Publication Number Publication Date
WO2022045334A1 true WO2022045334A1 (ja) 2022-03-03

Family

ID=80353466

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/031711 WO2022045334A1 (ja) 2020-08-31 2021-08-30 推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラム

Country Status (5)

Country Link
US (1) US20240038340A1 (ja)
EP (1) EP4207205A1 (ja)
JP (1) JPWO2022045334A1 (ja)
CN (1) CN115989511A (ja)
WO (1) WO2022045334A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023190974A1 (ja) * 2022-03-31 2023-10-05 武田薬品工業株式会社 遺伝子導入率予測方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005530771A (ja) * 2002-05-08 2005-10-13 ユニバーシティ カレッジ ロンドン 生物学的活性物質の細胞への運搬に適した複合体
WO2016021683A1 (ja) 2014-08-07 2016-02-11 武田薬品工業株式会社 カチオン性脂質
JP2019515913A (ja) * 2016-04-22 2019-06-13 科済生物医薬(上海)有限公司Carsgen Therapeutics Limited 細胞免疫療法の組成物および方法
WO2019131839A1 (ja) 2017-12-28 2019-07-04 武田薬品工業株式会社 カチオン性脂質
WO2020031671A1 (ja) * 2018-08-08 2020-02-13 パナソニックIpマネジメント株式会社 材料記述子生成方法、材料記述子生成装置、材料記述子生成プログラム、予測モデル構築方法、予測モデル構築装置及び予測モデル構築プログラム
WO2020032184A1 (ja) 2018-08-10 2020-02-13 武田薬品工業株式会社 カチオン性脂質
JP2020146402A (ja) 2019-03-15 2020-09-17 トヨタホーム株式会社 宅配ボックスシステム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005530771A (ja) * 2002-05-08 2005-10-13 ユニバーシティ カレッジ ロンドン 生物学的活性物質の細胞への運搬に適した複合体
WO2016021683A1 (ja) 2014-08-07 2016-02-11 武田薬品工業株式会社 カチオン性脂質
JP2019515913A (ja) * 2016-04-22 2019-06-13 科済生物医薬(上海)有限公司Carsgen Therapeutics Limited 細胞免疫療法の組成物および方法
WO2019131839A1 (ja) 2017-12-28 2019-07-04 武田薬品工業株式会社 カチオン性脂質
WO2020031671A1 (ja) * 2018-08-08 2020-02-13 パナソニックIpマネジメント株式会社 材料記述子生成方法、材料記述子生成装置、材料記述子生成プログラム、予測モデル構築方法、予測モデル構築装置及び予測モデル構築プログラム
WO2020032184A1 (ja) 2018-08-10 2020-02-13 武田薬品工業株式会社 カチオン性脂質
JP2020146402A (ja) 2019-03-15 2020-09-17 トヨタホーム株式会社 宅配ボックスシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023190974A1 (ja) * 2022-03-31 2023-10-05 武田薬品工業株式会社 遺伝子導入率予測方法

Also Published As

Publication number Publication date
CN115989511A (zh) 2023-04-18
JPWO2022045334A1 (ja) 2022-03-03
US20240038340A1 (en) 2024-02-01
EP4207205A1 (en) 2023-07-05

Similar Documents

Publication Publication Date Title
Theodoris et al. Transfer learning enables predictions in network biology
Chen et al. Zfp312 is required for subcortical axonal projections and dendritic morphology of deep-layer pyramidal neurons of the cerebral cortex
Wacker et al. Trait extraversion and dopamine function
Encinas et al. Division-coupled astrocytic differentiation and age-related depletion of neural stem cells in the adult hippocampus
Groszer et al. Impaired synaptic plasticity and motor learning in mice with a point mutation implicated in human speech deficits
Katz et al. Synapse distribution suggests a two-stage model of dendritic integration in CA1 pyramidal neurons
Li et al. Fetal tissue containing the suprachiasmatic nucleus restores multiple circadian rhythms in old rats
Goodkey et al. Nusinersen in the treatment of spinal muscular atrophy
Ellegood et al. Neuroanatomical assessment of the integrin β3 mouse model related to autism and the serotonin system using high resolution MRI
Jungenitz et al. Structural homo-and heterosynaptic plasticity in mature and adult newborn rat hippocampal granule cells
CN113632174A (zh) 用于nmda、甘氨酸和ampa受体的调节剂的药物基因组学决策支持
CN108292299A (zh) 从基因组变体预测疾病负担
Almehmadi et al. Increased Expression of miR‐155p5 in Amygdala of Children With Autism Spectrum Disorder
Sharma et al. Temporal profile of clinical signs and histopathologic changes in an F-344 rat model of kainic acid–induced mesial temporal lobe epilepsy
Silverstein et al. Inferring the dysconnection syndrome in schizophrenia: Interpretational considerations on methods for the network analyses of fMRI data
WO2022045334A1 (ja) 推論装置、推論方法、推論プログラム、モデル生成方法、推論サービス提供システム、推論サービス提供方法及び推論サービス提供プログラム
Biliouris et al. A semi‐mechanistic population pharmacokinetic model of nusinersen: an antisense oligonucleotide for the treatment of spinal muscular atrophy
CN108271422A (zh) 基于器官间串扰系统的预测装置及预测程序
Ahmed et al. Endothelial eNAMPT drives EndMT and preclinical PH: rescue by an eNAMPT-neutralizing mAb
Salvati et al. Retrospective and randomized analysis of influence and correlation of clinical and molecular prognostic factors in a mono-operative series of 122 patients with glioblastoma treated with STR or GTR
CN104220873A (zh) 基于nmr的代谢物筛选平台
CN105555961B (zh) 具有动态变化刺激的实时反馈系统控制技术平台
Zambon et al. Phenotypic spectrum of dystrophinopathy due to Duchenne muscular dystrophy exon 2 duplications
Pan et al. Machine learning identifies girls with central precocious puberty based on multisource data
Feng et al. Dorsal raphe neurons signal integrated value during multi-attribute decision-making

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21861755

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022545756

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021861755

Country of ref document: EP

Effective date: 20230331