WO2019230073A1 - 医学情報処理装置、医学情報処理方法、及び記憶媒体 - Google Patents

医学情報処理装置、医学情報処理方法、及び記憶媒体 Download PDF

Info

Publication number
WO2019230073A1
WO2019230073A1 PCT/JP2019/006416 JP2019006416W WO2019230073A1 WO 2019230073 A1 WO2019230073 A1 WO 2019230073A1 JP 2019006416 W JP2019006416 W JP 2019006416W WO 2019230073 A1 WO2019230073 A1 WO 2019230073A1
Authority
WO
WIPO (PCT)
Prior art keywords
medical
drug
concept
information
information processing
Prior art date
Application number
PCT/JP2019/006416
Other languages
English (en)
French (fr)
Inventor
木戸 邦彦
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to CN201980024273.0A priority Critical patent/CN111971754B/zh
Priority to US17/054,795 priority patent/US11469000B2/en
Publication of WO2019230073A1 publication Critical patent/WO2019230073A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Definitions

  • the present invention relates to a medical information processing apparatus, a medical information processing method, and a storage medium.
  • Patent Document 1 JP 2008-210414 A (Patent Document 1).
  • Patent Document 1 states that “the computer device of the present invention is linked to a history database of longitudinal prescription data obtained from a retail pharmacy, and whether or not a patient to be concealed in relation to a specific prescription can be tracked in the database.
  • the dosage and prescription product for a particular prescription is compared with the dosages and prescription products of other prescriptions for that confidential patient in the database and the corresponding number
  • Patent Document 1 predicts a doctor's prescription practice by analyzing past prescription data. However, not only information included in medical information such as prescription data, but also information that does not appear in medical information such as QOL (Quality of Life) and ADL (Activities of Daily Living) affects the determination of prescription drugs. The technique described in Patent Document 1 does not evaluate the influence.
  • an object of one aspect of the present invention is to evaluate the influence of information that cannot be obtained from medical information such as a QoL index and an ADL index on the determination of a prescription drug.
  • the medical information processing apparatus includes a processor and a memory, and the memory is included in the medical dictionary indicating a list of medical concepts, drug information indicating a drug name, medical information including a medical history, and the medical information.
  • a medical concept list including medical concepts indicated by the medical dictionary included in each of the identified documents is generated for each of the combinations, and is not included in the medical information
  • Each medical concept is included in the medical information based on the probability of appearing in the context of the literature indicated by the medical concept list.
  • medical concepts have to determine the first medical concepts influence the formulation of the drug contained in the drug information.
  • FIG. 4 is an example of real world data in the first embodiment. It is explanatory drawing which shows an example of the medical treatment identified by the real world data in Example 1.
  • FIG. 2 is an example of related literature in Example 1. It is explanatory drawing which shows an example of the outline of the whole process by the prescription prediction apparatus in Example 1.
  • FIG. 6 is a flowchart illustrating an example of a phenotypic vector generation process according to the first embodiment. 6 is a flowchart illustrating an example of prescription prediction contraction matrix generation processing in the first embodiment. 3 is an example of an encounter vector in the first embodiment. 6 is an example of a sales impact analysis screen in the first embodiment. 6 is a flowchart illustrating an example of a product strategy development support process in the first embodiment. It is explanatory drawing which shows an example of the product strategy formulation assistance process in Example 1.
  • FIG. 4 is an example of real world data in the first embodiment. It is explanatory drawing which shows an example of the medical treatment identified by the real world data in Example 1.
  • FIG. 2 is an example of
  • FIG. 1 is a block diagram illustrating a configuration example of a prescription prediction apparatus.
  • the prescription prediction apparatus 100 is configured by a computer having a CPU (Central Processing Unit) 101, a memory 102, an auxiliary storage device 103, and a communication device 104.
  • CPU Central Processing Unit
  • the CPU 101 includes a processor and executes a program stored in memory 102.
  • the memory 102 includes a ROM (Read Only Memory) that is a nonvolatile storage element and a RAM (Random Access Memory) that is a volatile storage element.
  • the ROM stores an immutable program (for example, BIOS (Basic Input / Output System)).
  • BIOS Basic Input / Output System
  • the RAM is a high-speed and volatile storage element such as a DRAM (Dynamic Random Access Memory), and temporarily stores a program executed by the CPU 101 and data used when the program is executed.
  • the auxiliary storage device 103 is a large-capacity non-volatile storage device such as a magnetic storage device (HDD (Hard Disk Drive)), flash memory (SSD (Solid State Drive)), and the like. Stores data used when executing. That is, the program is read from the auxiliary storage device 103, loaded into the memory 102, and executed by the CPU 101.
  • HDD Hard Disk Drive
  • SSD Solid State Drive
  • the prescription prediction apparatus 100 may include an input interface 105 and an output interface 108.
  • the input interface 105 is an interface that is connected to a keyboard 106, a mouse 107, and the like and receives input from an operator.
  • the output interface 108 is an interface to which a display device 109, a printer, or the like is connected, and the execution result of the program is output in a form that can be visually recognized by the operator.
  • the communication device 104 is a network interface device that controls communication with other devices in accordance with a predetermined protocol.
  • the communication device 104 includes a serial interface such as USB.
  • the program executed by the CPU 101 is provided to the prescription prediction device 100 via a removable medium (CD-ROM, flash memory, etc.) or a network, and is stored in the nonvolatile auxiliary storage device 103 which is a non-temporary storage medium. For this reason, the prescription prediction apparatus 100 is good to have an interface which reads data from a removable medium.
  • the prescription prediction apparatus 100 is a computer system that is configured on one computer or a plurality of computers that are logically or physically configured, and operates in separate threads on the same computer. It may be possible to operate on a virtual machine constructed on a plurality of physical computer resources.
  • the CPU 101 includes a phenotype vector generation unit 111, a prescription prediction contraction matrix generation unit 112, a sales impact analysis unit 113, and a product strategy formulation support unit 114.
  • the CPU 101 operates as the phenotype vector generation unit 111 by operating according to the phenotype vector generation program loaded in the memory 102 and operates according to the prescription prediction contraction matrix generation program loaded into the memory 102. It functions as the prescription prediction contraction matrix generation unit 112.
  • the relationship between programs and functional units is the same for other functional units included in the CPU 101.
  • CPU 101 may be realized by hardware such as ASIC (Application Specific Integrated Circuit) or FPGA (Field-Programmable Gate Array).
  • ASIC Application Specific Integrated Circuit
  • FPGA Field-Programmable Gate Array
  • the phenotype vector generation unit 111 generates a phenotype vector.
  • the prescription prediction reduction matrix generation unit 112 generates a prescription prediction reduction matrix.
  • the sales impact analysis unit 113 analyzes the degree to which each index indicating the characteristics of the drug contributes to the prescription of the drug.
  • the product strategy development support unit 114 searches for a drug similar to a target drug (for example, a newly developed drug) that is not included in a drug indicated by a phenotype vector set 123 described later, and information about the similar drug.
  • the auxiliary storage device 103 holds a drug list 121, a prescription prediction model 122, a phenotype vector set 123, and drug sales data 124.
  • the drug list 121 is an example of drug information including a list of drug names. Note that some or all of the data stored in the auxiliary storage device 103 may be stored in a database connected to the prescription prediction device 100.
  • the prescription prediction model 122 is a model that outputs a vector indicating a predicted drug when an encounter vector described later is input.
  • the prescription prediction model 122 is defined by a neural network, for example.
  • a prescription prediction reduction matrix which will be described later, is an example of a parameter of the prescription prediction model 122.
  • a product of an encounter vector and a prescription prediction matrix to be described later is calculated.
  • the phenotype vector set 123 includes phenotype vectors to be described later.
  • the drug sales data 124 includes, for example, time series information on sales of each drug.
  • the prescription prediction apparatus 100 is connected to a database that holds real world data 210, related documents 220, and a medical dictionary 230.
  • the real world data 210, the related literature 220, and the medical dictionary 230 may be stored in the auxiliary storage device 103.
  • the real world data 210 is an example of medical information that holds information on actual medical practices, including receipt data, medical chart data, medical examination data, and the like.
  • Medical treatment includes actions performed on a patient by a doctor such as medical examination, treatment, prescription, medical examination, and examination.
  • the real world data 210 does not hold information indicating QoL and ADL.
  • At least one document included in the related document 220 includes information indicating QOL and ADL that are not included in the real world data 210.
  • the medical dictionary 230 holds a medical concept, a network representing a relationship between medical concepts, and information indicating whether the medical concept is a numerically related concept. For example, a disease name, a drug name, a test name, a test result, an index name indicating QoL, an index name indicating ADL, an event name related to medical care (for example, an adverse event), and medical terms are all examples of medical concepts. is there.
  • the concept related to a numerical value is a concept that can indicate a specific event in the concept as a numerical value.
  • the information used by the prescription prediction apparatus 100 may be expressed in any data structure without depending on the data structure.
  • a data structure appropriately selected from a table, list, database or queue can store the information.
  • FIG. 2A is an example of real world data 210.
  • the real world data 210 includes, for example, a patient ID column 211, an encounter ID column 212, a disease name column 213, a prescription column 214, an examination result column 215, a treatment column 216, an incoming / outpatient column 217, and a date column 218.
  • the patient ID column 211 stores an ID for identifying a patient.
  • the encounter ID column 212 stores an ID for identifying a medical treatment.
  • the disease name column 213 stores the name of the disease that is the subject of medical care.
  • the prescription column 214 stores the name of the medicine prescribed in the medical care.
  • the examination result column 215 stores examination results performed in the medical care.
  • the treatment column 216 stores the name of the treatment performed in the medical care.
  • the “incoming / outpatient” column 217 stores information indicating whether the medical care was an incoming or an outpatient.
  • the date column 218 stores the date on which medical care was performed. Note that when a null value is stored in the treatment column 216 as in the example of FIG. 2A, for example, it indicates that treatment has not been performed or whether treatment has been performed is unknown. The same applies to cases where null values are stored in other fields.
  • FIG. 2B is an explanatory diagram showing an example of medical treatment specified by the real world data 210 of FIG. 2A.
  • FIG. 2B shows the practice performed on patient A.
  • Patient A received medical care with an encounter ID of 100 on January 10, 2018.
  • the name of the disease that is the subject of the medical treatment is diabetes, the drug A is prescribed, the test result is “HbA1c is 10%”, and the medical treatment was received by an outpatient department.
  • Patient A also received medical care with an encounter ID of 200 on February 10, 2018.
  • the name of the disease to be treated is diabetes, drug A is prescribed, the test result is “HbA1c is 9%”, and the medical care was received by an outpatient department.
  • a value related to the medical treatment content is also referred to as encounter information 219.
  • the encounter information 219 is information including values excluding the patient ID, the encounter ID, the date, and the null value among the values included in the record of the real world data 210.
  • FIG. 3 is an example of the related document 220.
  • the related document 220 includes one or more documents, and each document is given a document ID for identifying the document.
  • ICER Insertional Cost Effectiveness Ratio
  • each document in FIG. 3 is a medical concept included in the medical dictionary 230 or a drug name included in the drug list 121 (as described above, the drug name is also an example of a medical concept).
  • each document may be held in a format in which a medical concept in the document can be discriminated, and a function unit that refers to the document in a process described later refers to the medical dictionary 230 and stores the document in the document.
  • a medical concept may be identified.
  • FIG. 4 is an explanatory diagram showing an example of an outline of the entire process performed by the prescription prediction apparatus 100.
  • the phenotype vector generation unit 111 generates a phenotype vector based on the real world data 210 and the related document 220.
  • the phenotype vector is obtained from, for example, a medical concept that appears in association with the target drug in the related document 220 or a medical concept that appears in the real world data 210.
  • the phenotype vector influences the prescription drug determination in the prescription prediction model 122.
  • the medical concept affects the prescription of the target drug in the prescription prediction model 122 (contribution To do).
  • the prescription prediction contraction matrix generation unit 112 calculates, for each drug, a linear sum obtained by applying a weight to a phenotype vector on a network centering on the drug.
  • the weight indicates the degree of influence (contribution) that the medical concept indicated by the corresponding phenotype vector has on the prescription of the medicine indicated by the phenotype vector.
  • the prescription prediction reduction matrix generation unit 112 generates a prescription prediction reduction matrix G by arranging the calculated linear sums and other phenotype vectors.
  • the prescription prediction contraction matrix generation unit 112 generates an encounter vector from the encounter information 219.
  • the prescription prediction contraction matrix generation unit 112 updates the parameters in the prescription prediction model 122 by comparing the predicted drug obtained by inputting the encounter vector into the prescription prediction model 122 and the prescription drug in the encounter information. To do.
  • the sales impact analysis unit 113 evaluates a factor that affects the prescription of the drug from a weight corresponding to a phenotype vector on a network centering on the drug for the drug.
  • the product strategy development support unit 114 selects a drug similar to a target drug (for example, a newly developed drug) that is not included in the phenotype vector set 123 on a network centering on the drug included in the phenotype vector set 123. Inferring from the phenotype vector and the weight corresponding to the phenotype vector.
  • FIG. 5 is a flowchart showing an example of the phenotypic vector generation process.
  • the phenotype vector generation unit 111 selects one or more target drugs d from the drug list 121 (S501).
  • the target medicine to be selected may be, for example, all medicines included in the medicine list 121, or medicines designated from the user via the input interface 105 or from other devices via the communication device 104. There may be.
  • the phenotype vector generation unit 111 selects one unselected medical concept w from the medical concepts to be selected included in the medical dictionary 230 (S502).
  • the medical concept to be selected may be, for example, all medical concepts included in the medical dictionary 230, or specified from the user via the input interface 105 or from another device via the communication device 104. May be a medical concept.
  • the medical concept to be selected may not include the medical concept included in the real world data 210.
  • the phenotype vector generation unit 111 determines whether or not the medical concept w is included in the real world data 210 (S503). When the phenotype vector generation unit 111 determines that the medical concept w is included in the real world data 210 (S503: Yes), the phenotype vector generation unit 111 refers to the real world data 210 and generates one or more context lists Cw (S504). .
  • the phenotype vector generation unit 111 acquires the encounter information of each record including the medical concept w from the real world data 210, for example.
  • the phenotype vector generation unit 111 generates, for each encounter information, a list having elements other than the medical concept w among the values included in the encounter information, and uses the generated list as a context list Cw. To decide. That is, the context list Cw indicates a word group that co-occurs in the medical concept w.
  • the phenotype vector generation unit 111 determines whether all medical concepts to be selected have been selected (S505). If the phenotype vector generation unit 111 determines that there is an unselected medical concept among the medical concepts to be selected (S505: Yes), the process returns to step S502. The processing when the phenotype vector generation unit 111 determines that all the medical concepts to be selected have been selected (S505: Yes) will be described later.
  • the phenotype vector generation unit 111 refers to the medical dictionary 230 to determine whether or not the medical concept w is a numerically related concept. Is determined (S506). When it is determined that the medical concept w is not a numerically related concept (S506: No), the phenotype vector generating unit 111 generates a context list Cd_w for each target drug d with reference to the related document 220 (S507). Then, the process proceeds to step S505.
  • the phenotype vector generation unit 111 identifies a document including the medical concept w and at least one target drug from the related document 220, for example.
  • the phenotype vector generation unit 111 generates, for each combination of each target drug d and each identified document, a list having the medical concept w included in the document and a medical concept other than the target drug d as elements,
  • the generated list is determined as the context list Cd_w. That is, the context list Cd_w indicates a word group that co-occurs in the drug d and the medical concept w.
  • C drug A_adverse event ⁇ acidosis , Diabetes, HbA1c, weight loss ⁇ is generated as a context list.
  • step S507 when the phenotype vector generation unit 111 generates the context list Cd_w from the identified document, for example, the medical concept included in the context list Cd_w may be acquired from the entire document, Among the included sentences, a medical concept included in the context list Cd_w may be acquired from a predetermined range of sentences including a sentence including the medical concept w and a sentence including the target drug d. Moreover, the phenotype vector generation unit 111, for example, in the specified document, when the value of the distance between the medical concept w and the target drug d is large (for example, a predetermined number or more between the medical concept w and the target drug d) May be excluded from the Cd_w generation target.
  • the phenotype vector generation unit 111 refers to the related document 220 and generates a context list Cd_w for each target drug d (S508). ).
  • the phenotype vector generation unit 111 specifies a document including the numerical value of the medical concept w and at least one target drug d from the related document 220, for example.
  • the phenotype vector generation unit 111 includes, for each combination of each target drug d and each identified document, each of the medical concepts other than the target drug d included in the document and the numerical value of the medical concept w.
  • a list is generated, and the generated list is determined as the context list Cd_w. That is, the context list Cd_w indicates a word group that co-occurs in the drug d and the medical concept w.
  • the phenotype vector generation unit 111 acquires information indicating the numerical value of the medical concept w of each context list Cd_w generated in step S508 (S509).
  • the phenotype vector generation unit 111 performs threshold processing on the numerical value acquired in step S509, replaces the information indicating the numerical value of medical concept w with the level obtained by the threshold processing (S510), and proceeds to step S505. To do. For example, two threshold values in threshold processing are predetermined for each numerical medical concept.
  • step S510 for example, when the acquired numerical value is less than the small threshold value of the two threshold values, the phenotype vector generation unit 111 determines that the numerical value level is w_L, and the acquired numerical value is equal to or greater than the small threshold value. And when it is less than a big threshold value among two threshold values, it determines with the level of the said numerical value being w_M, and when the acquired numerical value is more than the said big threshold value, it determines with the level of the said numerical value being w_H.
  • the number of thresholds in the threshold processing may be one or three or more, and may be different for each numerical related concept.
  • step S505 determines in step S505 that all medical concepts to be selected have been selected (S505: Yes)
  • c and w for minimizing J shown in Equation 1 below are set.
  • the phenotype vector is determined and stored in the phenotype vector set 123 (S511), and the phenotype vector generation process is terminated.
  • Equation 1 ⁇ is a set of words (medical concepts) included in the medical dictionary 230, and C w is a context list including the word w among the context lists generated in steps S504, S507, and S508. It is a set.
  • w) indicates the probability that the medical concept w appears in the context (in the document or encounter information) indicated by the context list c, and is defined by the following Equation 2. This is an expression used for obtaining a word vector and a context vector by using a method such as word2vec for the word w and the context list c.
  • V is a set of all context lists generated in step S504, step S507, and step S508, e w is a word vector of w, e c is a context vector of c , and e c ′ is c ′ It is a context vector.
  • phenotype vector represented by e w indicates that influence the determination of prescription drugs in the formulation predictive model 122.
  • FIG. 6 is a flowchart showing an example of prescription prediction contraction matrix generation processing.
  • the prescription prediction contraction matrix generation unit 112 selects one or more target drugs d from the drug list 121 (S601).
  • the target medicine to be selected may be, for example, all medicines included in the medicine list 121, or medicines designated from the user via the input interface 105 or from other devices via the communication device 104. There may be.
  • the prescription prediction contraction matrix generation unit 112 selects one unselected medical concept w from the medical concepts to be selected included in the medical dictionary 230 (S602).
  • the medical concept to be selected may be, for example, all the drugs included in the medical dictionary 230, and may be designated from the user via the input interface 105 or from another device via the communication device 104. May be a medical concept.
  • the prescription prediction contraction matrix generation unit 112 determines whether or not the selected medical concept w is a concept related to a drug (S603). For example, when the medical concept w is included in the drug list 121, the prescription prediction contraction matrix generation unit 112 determines that the medical concept w is a concept related to a drug. In the medical dictionary 230, it may be defined whether each medical concept is a concept related to a drug. In this case, the prescription prediction contraction matrix generation unit 112 refers to the medical dictionary 230 and selects it. It is determined whether or not the medical concept w is a concept related to a medicine.
  • the prescription prediction contraction matrix generation unit 112 determines that the selected medical concept w is not a concept related to a drug (S603: No), the phenotype vector of the medical concept w is collected from the phenotype vector set 123 (S604). To do. Phenotype vector collection target in step S604, for example, with respect to medical concept w being selected phenotypically vector represented by e w.
  • the prescription prediction contraction matrix generation unit 112 determines that the selected medical concept w is a concept related to a drug (S603: Yes)
  • the medical dictionary 230 centering on the target drug d for each target drug d.
  • the phenotypic vectors related to the medical concept w on the network managed in (1) are collected from the phenotype vector set 123 (S605).
  • phenotype vector represented by e d are intended to be included in the network around the subject agents d. It should be noted that a part of the phenotypic vector described above may be excluded from the network centered on the target drug d in accordance with an instruction from the user or the like.
  • Phenotype vector collection target in step S605 for example, with respect to medical concept w being selected phenotypically vector represented by e w.
  • the prescription prediction contraction matrix generation unit 112 multiplies each collected phenotype vector by a predetermined weight (an initial value other than 0) for each target drug d, and calculates a linear sum (S606).
  • a predetermined weight an initial value other than 0
  • e drug A_ICER represented as e 2 in FIG. 4
  • e drug A_adverse event represented as e 3 in FIG.
  • the prescription prediction contraction matrix generation unit 112 determines whether or not all medical concepts to be selected have been selected (S607). When it is determined that there is an unselected medical concept w (S607: No), the prescription prediction contraction matrix generation unit 112 returns to step S602.
  • the prescription prediction reduction matrix generation unit 112 If it is determined that all the medical concepts to be selected have been selected (S607: Yes), the prescription prediction reduction matrix generation unit 112 generates an initial prescription prediction reduction matrix (S608). Specifically, as in the example of FIG. 4 described above, the phenotypic vectors collected in step S604 and the linear sum calculated in step S606 are used as column vectors, for example, in a predetermined order or in an arbitrary order, or As a row vector, a prescription prediction contraction matrix is generated side by side.
  • the prescription prediction contraction matrix generation unit 112 extracts a patient including a prescription for at least one target drug d from the real world data 210 (S609). Next, for the patient, an encounter vector x t is extracted from one encounter information 219 and added to the extracted encounter vectors x 1,... X t ⁇ 1 (S610).
  • the prescription prediction contraction matrix generation unit 112 applies the product calculated in step S611 to the prescription prediction model 122 to obtain a predicted drug vector y t ′ indicating a predicted drug.
  • the parameters of the prescription prediction model 122 are updated so as to minimize L in Equation 3 (S612). Since the prescription prediction reduction matrix is included in the parameter, it can be updated in step S612.
  • Equation 3 y t is a prescription drug that appears to encounter vector extracted in step S610.
  • Equation 4 to 9 Other variables and parameters used in Equation 3 are defined by Equations 4 to 9 below.
  • a (i) in Formula 4 shows the set which consists of the medical concept relevant to the medical concept i containing a chemical
  • RNN in Equation 8 represents a recurrent neural network.
  • softmax in Equation 9 represents a softmax function.
  • G is a prescription prediction reduction matrix. Further, u t, W t, b a, W and b are parameters to be updated.
  • step S612 L is minimized for each patient by the stochastic gradient descent method, but the parameters in the prescription prediction model 122 are optimized by minimizing the average value of L of all patients including the prescription of the target drug d. May be used.
  • the prescription prediction drug vector y t ′ may be optimized by an arbitrary optimization method for bringing the prescription drug vector y t ′ closer to the prescription drug vector y t .
  • the prescription prediction reduction matrix generation unit 112 updates the weight based on the parameter updated in step S612, recalculates the linear sum in step S606 using the updated weight, and updates the prescription prediction reduction matrix. (S613).
  • the weight indicates the degree of influence (contribution) that the medical concept indicated by the corresponding phenotype vector has on the prescription of the drug indicated by the phenotype vector.
  • the prescription prediction reduction matrix generation unit 112 determines whether or not an encounter vector has been extracted from all encounter information of the target patient (S614). If the prescription prediction contraction matrix generation unit 112 determines that there is the encounter information that has not been extracted with the encounter vector (S614: No), the process returns to step S610. If the prescription prediction contraction matrix generation unit 112 determines that the encounter vector has been extracted from all the encounter information (S614: Yes), the process returns to step S609.
  • the prescription prediction contraction matrix generation unit 112 determines whether or not all patients including the prescription of at least one target drug d have been extracted (S615). If it is determined that there is a corresponding patient (S615: No), the process returns to step S609. If it is determined that all the patients have been extracted (S615: Yes), the prescription prediction reduction matrix generation unit 112 ends the prescription prediction reduction matrix generation process.
  • the example of extracting all patients including a prescription for at least one target drug d has been described above, but the extraction target is limited to patients with a predetermined patient ID among patients including a prescription for at least one target drug d. May be.
  • the example in which all the encounter vectors are extracted from the encounter information related to the patient has been described above.
  • the encounter vector is extracted like the encounter information related to records of a predetermined range of the encounter information.
  • the target may be restricted.
  • the prescription prediction model 122 including the prescription prediction reduction matrix is not only the real world data 210 but also the real world data 210 such as the QoL index and the ADL index.
  • Predictive drugs can be predicted with high precision in consideration of information that cannot be obtained from
  • the phenotype vector indicates an index that affects the determination of the prescription drug
  • the weight applied to the phenotype vector is the degree of influence that the medical concept represented by the phenotype vector has on the prescription of the drug represented by the phenotype vector (Contribution) is shown. Therefore, the prescription prediction apparatus 100 of the present embodiment can evaluate the influence that information that cannot be obtained from the real world data 210 such as the QoL index and the ADL index has on the determination of the prescription drug.
  • FIG. 8 is an example of a sales impact analysis screen.
  • the sales impact analysis process is performed after the prescription prediction contraction matrix generation process ends.
  • the sales impact analysis unit 113 accepts designation of a medicine from the user or from another device via the input interface 105, for example.
  • the sales impact analysis unit 113 acquires from the phenotype vector set 123 a phenotype vector on the network centered on the specified drug and the weight multiplied by the phenotype vector, and the sales impact analysis screen 800 Output to.
  • the weight in each phenotype vector is displayed as a graph. Thereby, the user can grasp how much the index that cannot be obtained from the real world data 210 contributes to the prescription of the medicine.
  • FIG. 9 is a flowchart illustrating an example of a product strategy formulation support process.
  • the product strategy development support process is performed after the prescription prediction contraction matrix generation process ends.
  • a drug similar to a target drug for example, a newly developed drug
  • a target drug for example, a newly developed drug
  • the product strategy development support unit 114 receives an input of an initial drug from the user via the input interface 105 or from another device, and from the phenotype vector set 123, a phenotype on the network centering on the initial drug
  • the vector and the weight applied to the phenotype vector are acquired (S901). For example, it is desirable to select a drug having an attribute close to that of the target drug as the initial drug.
  • the product strategy formulation support unit 114 adjusts the weight acquired in step S901 (S902). Specifically, for example, the product strategy development support unit 114 changes each weight to a value designated by the user. Further, for example, one or more thresholds of weights may be set for each of the phenotypic vectors, and the product strategy development support unit 114 performs threshold processing (for example, weights exceeding the thresholds, Alternatively, the weight that is less than the threshold value may be changed to the same value as the threshold value).
  • step S902 the product strategy development support unit 114 may add another phenotype vector that has not been acquired in step S901 and a weight corresponding to the other phenotype vector.
  • the other phenotype vector and the weight corresponding to the other phenotype vector are specified by the user, for example.
  • the product profile of the target drug is determined by the processing in step S901 and step S902.
  • the product strategy formulation support unit 114 determines similar drugs based on the adjusted weights (S903). For example, the product strategy development support unit 114 calculates a linear sum of phenotypic vectors with adjusted weights, and calculates an intervector distance between the calculated linear sum and a linear sum of phenotypic vectors on each drug network. Then, a medicine having a short distance between the calculated vectors (for example, a predetermined number of medicines or a medicine having a distance equal to or less than a predetermined value in order of increasing distance) is determined as a similar medicine.
  • a medicine having a short distance between the calculated vectors for example, a predetermined number of medicines or a medicine having a distance equal to or less than a predetermined value in order of increasing distance
  • the product strategy development support unit 114 may determine, for each drug, between a vector having each adjusted weight as an element and a vector having each weight applied to a phenotype vector on the drug network as an element. A distance may be calculated, and a drug with a close vector distance may be determined as a similar drug.
  • the product strategy formulation support unit 114 refers to the drug sales data 124 and outputs the sales of the similar drug, the share of the similar drug, and the like to the output interface 108 or another device (S904). In step S904, information related to similar drugs other than sales and share may be displayed.
  • FIG. 10 is an explanatory diagram showing an example of a product strategy formulation support process.
  • the drug B is input as the initial drug for the target drug X.
  • information indicating the position of the target drug and the linear sum of each drug on the vector space may be displayed as the comparison drug selection on the vector space.
  • the weights ⁇ 1 , ⁇ 2 , and ⁇ 3 for the drug B, which is the initial drug, are adjusted by changing the product attribute, and it is found that the target drug is close to the drug C. Selected. Furthermore, the sales change of the medicine C which is a similar medicine for every year and the product share of the medicine C in a certain year are displayed.
  • the above-described product strategy formulation support process can determine a drug whose attribute not obtained from the real world data 210 such as QoL and ADL is similar to a drug for which no phenotype vector has been generated.
  • this invention is not limited to the above-mentioned Example, Various modifications are included.
  • the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described.
  • a part of the configuration of a certain embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of a certain embodiment.
  • each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit.
  • Each of the above-described configurations, functions, and the like may be realized by software by interpreting and executing a program that realizes each function by the processor.
  • Information such as programs, tables, and files that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
  • control lines and information lines indicate what is considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

医学情報処理装置は、医学概念の一覧を示す医学辞書と、薬剤の名称を示す薬剤情報と、診療履歴を含む診療情報と、診療情報に含まれない医学概念に関する記載を含む文献と、を保持し、診療情報に含まれない医学概念と薬剤情報に含まれる薬剤との各組み合わせについて、該文献から、当該医学概念及び当該薬剤に関する記載を含む文献を特定し、該組み合わせそれぞれについて、特定した各文献に含まれる医学辞書が示す医学概念、からなる医学概念リストを生成し、診療情報に含まれない各医学概念が、医学概念リストが示す文献の文脈において出現する確率、に基づいて、診療情報に含まれない医学概念のうち、薬剤情報に含まれる薬剤の処方に影響を与える第1医学概念を決定する。

Description

医学情報処理装置、医学情報処理方法、及び記憶媒体 参照による取り込み
 本出願は、2018年5月29日に出願された日本特許出願第2018-102099号の優先権を主張し、その内容を参照することにより、本出願に取り込む。
 本発明は、医学情報処理装置、医学情報処理方法、及び記憶媒体に関する。
 本技術分野の背景技術として、特開2008-210414号公報(特許文献1)がある。この公報には、「本発明のコンピュータ装置は、小売薬局から取得した縦処方データの履歴データベースにリンクし、特定の処方に関連して秘匿すべき患者がデータベースで追跡可能であるか否かを決定し、患者が追跡可能である場合、特定の処方に対する投薬量及び処方生成物と、データベースの当該秘匿すべき患者に対する他の処方の投薬量及び処方生成物とを比較し、対応する数の分類変数に基づく複数の異なる数の処方分類の一つとして、特定の処方と他の処方との間の投薬量又は処方した投薬の変化に基づいて特定の処方を分類し、処方の総数を計数し、市場イベントの発生に応答して処方の総数に基づいて分類変数に関連する予測モデルを生成し、医師の処方実務の予測を表示して警告する。」と記載されている(要約参照)。
特開2008-210414号公報
 特許文献1に記載の技術は、過去の処方データを分析することにより、医師の処方実務を予測する。しかし、処方データ等の診療情報に含まれる情報だけでなく、QoL(Quality of Life)及びADL(Activities of Daily Living)等の診療情報に現れない情報も、処方薬剤の決定に影響を与えるが、特許文献1に記載の技術は当該影響を評価していない。
 そこで本発明の一態様は、QoL指標やADL指標等の診療情報からは得られない情報が処方薬剤の決定に与える影響を評価することを目的とする。
 上記課題を解決するため、本発明の一態様は以下の構成を採用する。医学情報処理装置は、プロセッサとメモリとを備え、前記メモリは、医学概念の一覧を示す医学辞書と、薬剤の名称を示す薬剤情報と、診療履歴を含む診療情報と、前記診療情報に含まれない医学概念に関する記載を含む文献と、を保持し、前記プロセッサは、前記診療情報に含まれない医学概念と前記薬剤情報に含まれる薬剤との組み合わせそれぞれについて、前記文献から、当該医学概念に関する記載と当該薬剤に関する記載とを含む文献を特定し、前記組み合わせそれぞれについて、前記特定した文献それぞれに含まれる前記医学辞書が示す医学概念、からなる医学概念リストを生成し、前記診療情報に含まれない医学概念それぞれが、前記医学概念リストが示す文献の文脈において出現する確率、に基づいて、前記診療情報に含まれない医学概念のうち、前記薬剤情報に含まれる薬剤の処方に影響を与える第1医学概念を決定する。
 本発明の一態様によれば、QoL指標やADL指標等の診療情報からは得られない情報が処方薬剤の決定に与える影響を評価することができる。
 上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
実施例1における処方予測装置の構成例を示すブロック図である。 実施例1におけるリアルワールドデータの一例である。 実施例1におけるリアルワールドデータによって特定された診療の一例を示す説明図である。 実施例1における関連文献の一例である。 実施例1における処方予測装置による処理全体の概略の一例を示す説明図である。 実施例1における表現型ベクトル生成処理の一例を示すフローチャートである。 実施例1における処方予測縮約マトリクス生成処理の一例を示すフローチャートである。 実施例1におけるエンカウンターベクトルの一例である。 実施例1における売上影響分析画面の一例である。 実施例1における製品戦略策定支援処理の一例を示すフローチャートである。 実施例1における製品戦略策定支援処理の一例を示す説明図である。
 以下、本発明の実施形態を図面に基づいて詳細に説明する。本実施形態において、同一の構成には原則として同一の符号を付け、繰り返しの説明は省略する。なお、本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。
 本実施例は医学情報処理装置の一例である処方予測装置について説明する。図1は、処方予測装置の構成例を示すブロック図である。処方予測装置100は、CPU(Central Processing Unit)101、メモリ102、補助記憶装置103、及び通信装置104を有する計算機によって構成される。
 CPU101は、プロセッサを含み、メモリ102に格納されたプログラムを実行する。メモリ102は、不揮発性の記憶素子であるROM(Read Only Memory)及び揮発性の記憶素子であるRAM(Random Access Memory)を含む。ROMは、不変のプログラム(例えば、BIOS(Basic Input/Output System))などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、CPU101が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。
 補助記憶装置103は、例えば、磁気記憶装置(HDD(Hard Disk Drive))、フラッシュメモリ(SSD(Solid State Drive))等の大容量かつ不揮発性の記憶装置であり、CPU101が実行するプログラム及びプログラムの実行時に使用されるデータを格納する。すなわち、プログラムは、補助記憶装置103から読み出されて、メモリ102にロードされて、CPU101によって実行される。
 処方予測装置100は、入力インターフェース105及び出力インターフェース108を有してもよい。入力インターフェース105は、キーボード106やマウス107などが接続され、オペレータからの入力を受けるインターフェースである。出力インターフェース108は、ディスプレイ装置109やプリンタなどが接続され、プログラムの実行結果をオペレータが視認可能な形式で出力するインターフェースである。
 通信装置104は、所定のプロトコルに従って、他の装置との通信を制御するネットワークインターフェース装置である。また、通信装置104は、例えば、USB等のシリアルインターフェースを含む。
 CPU101が実行するプログラムは、リムーバブルメディア(CD-ROM、フラッシュメモリなど)又はネットワークを介して処方予測装置100に提供され、非一時的記憶媒体である不揮発性の補助記憶装置103に格納される。このため、処方予測装置100は、リムーバブルメディアからデータを読み込むインターフェースを有するとよい。
 処方予測装置100は、物理的に一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。
 CPU101は、表現型ベクトル生成部111、処方予測縮約マトリクス生成部112、売上影響分析部113、及び製品戦略策定支援部114を含む。例えば、CPU101は、メモリ102にロードされた表現型ベクトル生成プログラムに従って動作することで、表現型ベクトル生成部111として機能し、メモリ102にロードされた処方予測縮約マトリクス生成プログラムに従って動作することで、処方予測縮約マトリクス生成部112として機能する。CPU101に含まれる他の機能部についても、プログラムと機能部の関係は同様である。
 なお、CPU101に含まれる機能部による機能の一部又は全部が、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)等のハードウェアによって実現されてもよい。
 表現型ベクトル生成部111は、表現型ベクトルを生成する。処方予測縮約マトリクス生成部112は、処方予測縮約マトリクスを生成する。売上影響分析部113は、薬剤の特徴を示す各指標が、当該薬剤の処方に寄与する度合いを分析する。製品戦略策定支援部114は、後述する表現型ベクトル集合123が示す薬剤に含まれないターゲット薬剤(例えば、新規に開発された薬剤)に類似する薬剤及び当該類似する薬剤についての情報を検索する。
 補助記憶装置103は、薬剤リスト121、処方予測モデル122、表現型ベクトル集合123、及び薬剤売上データ124を保持する。薬剤リスト121は、薬剤名の一覧を含む薬剤情報の一例である。なお、補助記憶装置103に格納されている一部又は全部のデータは、処方予測装置100に接続されているデータベースに格納されていてもよい。
 処方予測モデル122は、後述するエンカウンターベクトルが入力されると、予測薬剤を示すベクトルを出力するモデルである。処方予測モデル122は、例えば、ニューラルネットワークによって定義される。なお、後述する処方予測縮約マトリクスは、処方予測モデル122のパラメータの一例である。処方予測モデル122を用いた予測薬剤の算出において、エンカウンターベクトルと後述する処方予測マトリクスとの積が算出される。
 表現型ベクトル集合123は、後述する表現型ベクトルを含む。薬剤売上データ124は、例えば、各薬剤の売り上げの時系列情報を含む。
 処方予測装置100は、リアルワールドデータ210、関連文献220、及び医学辞書230を保持するデータベースに接続されている。なお、リアルワールドデータ210、関連文献220、及び医学辞書230は補助記憶装置103に格納されていてもよい。
 リアルワールドデータ210は、レセプトデータ、カルテデータ、検診データ等を含む、実診療行為の情報を保持する診療情報の一例である。診療とは、診察、治療、処方、検診、及び検査等の医師が患者に対して行う行為を含む。本実施例において、リアルワールドデータ210は、QoL及びADLを示す情報を保持していないものとする。関連文献220に含まれる少なくとも1つの文献は、リアルワールドデータ210に含まれないQoL及びADLを示す情報を含む。
 医学辞書230は、医学概念と、医学概念間の関係を表すネットワークと、医学概念が数値関連の概念であるか否かを示す情報と、を保持する。例えば、病名、薬剤名、検査名、検査結果、QoLを示す指標名、ADLを示す指標名、医療に関連する事象名(例えば有害事象)、及び医学用語等は、いずれも医学概念の一例である。数値関連の概念とは、当該概念における具体的な事象を数値で示すことができる概念である。
 なお、本実施形態において、処方予測装置100が使用する情報は、データ構造に依存せずどのようなデータ構造で表現されていてもよい。例えば、テーブル、リスト、データベース又はキューから適切に選択したデータ構造体が、情報を格納することができる。
 図2Aは、リアルワールドデータ210の一例である。リアルワールドデータ210は、例えば、患者ID欄211、エンカウンターID欄212、病名欄213、処方欄214、検査結果欄215、処置欄216、入来/外来欄217、及び日付欄218を含む。
 患者ID欄211は、患者を識別するIDを格納する。エンカウンターID欄212は、診療を識別するIDを格納する。病名欄213は、診療の対象である病名を格納する。処方欄214は、診療において処方された薬剤の名称を格納する。検査結果欄215は、診療において行われた検査結果を格納する。処置欄216は、診療において行われた処置の名称を格納する。
 入来/外来欄217は、診療が入来によるものであったか外来によるものであったかを示す情報を格納する。日付欄218は、診療が実施された日付を格納する。なお、図2Aの例のように、処置欄216にnull値が格納されている場合、例えば、診療において処置が行われなかった又は処置が行われたか否かが不明であることを示す。他の欄にnull値が格納されている場合についても同様である。
 図2Bは、図2Aのリアルワールドデータ210によって特定された診療の一例を示す説明図である。図2Bは、患者Aに実行された診療を示す。患者Aは、2018年1月10日にエンカウンターIDが100である診療を受けた。当該診療の対象である病名は糖尿病であり、薬剤Aが処方され、検査結果は「HbA1cが10%」であり、外来によって当該診療を受けた。
 また、患者Aは、2018年2月10日にエンカウンターIDが200である診療を受けた。当該診療の対象である病名は糖尿病であり、薬剤Aが処方され、検査結果は「HbA1cが9%」であり、外来によって当該診療を受けた。
 なお、リアルワールドデータ210のレコードに含まれる値のうち、診療内容に関する値をエンカウンター情報219とも呼ぶ。図2Bの例では、エンカウンター情報219は、リアルワールドデータ210のレコードに含まれる値のうち、患者ID、エンカウンターID、日付、及びnull値を除く値からなる情報である。図2Bの例では、エンカウンターID=100についての、エンカウンター情報219は、「糖尿病」、「薬剤A」、「HbA1c:10%」、「外来」からなる。
 図3は、関連文献220の一例である。関連文献220は、1以上の文献を含み、各文献には、文献を識別する文献IDが与えられている。なお、文献IDが2000である文献及び文献IDが3000である文献に記載されているICER(Incremental Cost Effectiveness Ratio)とは、QoLに関わる指標の一例である。
 なお、図3の各文献における下線部は、医学辞書230に含まれる医学概念又は薬剤リスト121に含まれる薬剤名(前述したように薬剤名も医学概念の一例である)である。図3のように、各文献は、文献内における医学概念を判別可能な形式で保持してもよいし、後述する処理において文献を参照する機能部が、医学辞書230を参照して文献内の医学概念を特定してもよい。
 図4は、処方予測装置100による処理全体の概略の一例を示す説明図である。表現型ベクトル生成部111は、リアルワールドデータ210及び関連文献220に基づいて、表現型ベクトルを生成する。表現型ベクトルは、例えば、関連文献220において対象薬剤と共起して出現する医学概念、又はリアルワールドデータ210に出現する医学概念から得られる。表現型ベクトルは、処方予測モデル122における処方薬剤の決定に影響を与える。また、表現型ベクトルが、特に関連文献220において対象薬剤と共起して出現する医学概念から得られた場合、当該医学概念は、処方予測モデル122における当該対象薬剤の処方に影響を与える(寄与する)。
 処方予測縮約マトリクス生成部112は、各薬剤について、当該薬剤を中心としたネットワーク上の表現型ベクトルに重みを掛けた線形和を算出する。当該重みは、対応する表現型ベクトルが示す医学概念が、当該表現型ベクトルが示す薬剤の処方に与える影響度(寄与度)を示す。処方予測縮約マトリクス生成部112は、算出した線形和それぞれと、他の表現型ベクトルと、を並べて処方予測縮約マトリクスGを生成する。
 また、処方予測縮約マトリクス生成部112は、エンカウンター情報219からエンカウンターベクトルを生成する。処方予測縮約マトリクス生成部112は、処方予測モデル122にエンカウンターベクトルを入力して得られた予測薬剤と、エンカウンター情報における処方薬剤と、を比較して、処方予測モデル122におけるパラメータを更新する。
 売上影響分析部113は、ある薬剤について、当該薬剤を中心としたネットワーク上の表現型ベクトルに対応する重みから、当該薬剤の処方に影響を与えた要因を評価する。製品戦略策定支援部114は、表現型ベクトル集合123に含まれないターゲット薬剤(例えば、新規開発された薬剤)に類似する薬剤を、表現型ベクトル集合123に含まれる薬剤を中心としたネットワーク上の表現型ベクトルと当該表現型ベクトルに対応する重みから、推測する。
 図5は、表現型ベクトル生成処理の一例を示すフローチャートである。表現型ベクトル生成部111は、薬剤リスト121から1以上の対象薬剤dを選択する(S501)。選択される対象薬剤は、例えば、薬剤リスト121に含まれる全ての薬剤であってもよいし、入力インターフェース105を介してユーザから、又は通信装置104を介して他の装置から指定された薬剤であってもよい。
 表現型ベクトル生成部111は、医学辞書230に含まれる選択対象の医学概念から、未選択の1つの医学概念wを選択する(S502)。なお、当該選択対象の医学概念は、例えば、医学辞書230に含まれる全ての医学概念であってもよいし、入力インターフェース105を介してユーザから、又は通信装置104を介して他の装置から指定された医学概念であってもよい。また、選択対象の医学概念は、リアルワールドデータ210に含まれる医学概念を含まなくてもよい。
 表現型ベクトル生成部111は、医学概念wがリアルワールドデータ210に含まれるか否かを判定する(S503)。表現型ベクトル生成部111は、医学概念wがリアルワールドデータ210に含まれると判定した場合(S503:Yes)、リアルワールドデータ210を参照して、1以上の文脈リストCwを生成する(S504)。
 表現型ベクトル生成部111は、ステップS504において、例えば、リアルワールドデータ210から医学概念wを含む各レコードのエンカウンター情報を取得する。表現型ベクトル生成部111は、各エンカウンター情報に対して、当該エンカウンター情報に含まれる値のうち医学概念w以外の値それぞれを要素として有するリストを生成し、当該生成したリストを文脈リストCwに決定する。つまり、文脈リストCwは、医学概念wに共起する単語群を示す。
 例えば、医学概念wが「糖尿病」である場合、ステップS504において、図2Aのリアルワールドデータ210から、C糖尿病1={薬剤A,HbA1c:10%,外来}と、C糖尿病2={薬剤A,検査結果HbA1c:9%,外来}と、がそれぞれ文脈リストとして生成される。
 続いて、表現型ベクトル生成部111は、選択対象の全ての医学概念を選択済みであるか否かを判定する(S505)。表現型ベクトル生成部111は、選択対象の医学概念のうち未選択の医学概念があると判定した場合(S505:Yes)、ステップS502に戻る。表現型ベクトル生成部111が、選択対象の全ての医学概念を選択済みであると判定した場合(S505:Yes)の処理については後述する。
 表現型ベクトル生成部111は、医学概念wがリアルワールドデータ210に含まれないと判定した場合(S503:No)、医学辞書230を参照して、医学概念wが数値関連の概念であるか否かを判定する(S506)。表現型ベクトル生成部111は、医学概念wが数値関連の概念でないと判定した場合(S506:No)、関連文献220を参照して、対象薬剤dそれぞれについて、文脈リストCd_wを生成し(S507)、ステップS505に遷移する。
 表現型ベクトル生成部111は、ステップS507において、例えば、関連文献220から、医学概念wと少なくとも1つの対象薬剤と、を含む文献を特定する。表現型ベクトル生成部111は、各対象薬剤dと特定した各文献との組み合わせそれぞれについて、当該文献に含まれる医学概念wと当該対象薬剤d以外の医学概念それぞれを要素として有するリストを生成し、当該生成したリストを文脈リストCd_wに決定する。つまり、文脈リストCd_wは、薬剤d及び医学概念wに共起する単語群を示す。
 例えば、医学概念wが「有害事象」であり、対象薬剤dが「薬剤A」である場合、ステップS507において、図3の例における文献IDが1000の文献から、C薬剤A_有害事象={アシドーシス,糖尿病,HbA1c,体重減少}が文脈リストとして生成される。
 なお、ステップS507において、表現型ベクトル生成部111は特定した文献から文脈リストCd_wを生成する際に、例えば、当該文献全体から文脈リストCd_wに含める医学概念を取得してもよいし、当該文献に含まれる文のうち、医学概念wを含む文と当該対象薬剤dを含む文とを含む所定範囲の文から、文脈リストCd_wに含める医学概念を取得してもよい。また、表現型ベクトル生成部111は、例えば、特定した文献において、医学概念wと対象薬剤dとの距離の値が大きい場合(例えば、医学概念wと対象薬剤dとの間に、所定数以上の単語又は文字が含まれる場合)、当該文献をCd_wの生成対象から除外してもよい。
 表現型ベクトル生成部111は、医学概念wが数値関連の概念であると判定した場合(S506:Yes)、関連文献220を参照して、対象薬剤dそれぞれについて、文脈リストCd_wを生成する(S508)。
 表現型ベクトル生成部111は、ステップS508において、例えば、関連文献220から、医学概念wの数値と少なくとも1つの対象薬剤dと、を含む文献を特定する。表現型ベクトル生成部111は、各対象薬剤dと特定した各文献との組み合わせそれぞれについて、当該文献に含まれる当該対象薬剤d以外の医学概念それぞれと、医学概念wの数値と、を要素として有するリストを生成し、当該生成したリストを文脈リストCd_wに決定する。つまり、文脈リストCd_wは、薬剤d及び医学概念wに共起する単語群を示す。
 例えば、医学概念wが「ICER」であり、対象薬剤が「薬剤A」である場合、ステップS508において、図3の例における文献IDが2000の文献から、C薬剤A_ICER={糖尿病,ICER=500万円,EQ-5D}が文脈リストとして生成される。同様に、医学概念wが「ICER」であり、対象薬剤が「薬剤B」である場合、ステップS508において、図3の例における文献IDが2000の文献から、C薬剤B_ICER={糖尿病,ICER=600万円,EQ-5D}が文脈リストとして生成される。
 表現型ベクトル生成部111は、ステップS508で生成した文脈リストCd_wそれぞれの医学概念wの数値を示す情報を取得する(S509)。ステップS509において、表現型ベクトル生成部111は、例えば、C薬剤A_ICER={糖尿病,ICER=500万円,EQ-5D}から「500万」を取得し、C薬剤B_ICER={糖尿病,ICER=600万円,EQ-5D}から「600万」を取得する。
 表現型ベクトル生成部111は、ステップS509で取得した数値に対して閾値処理を行い、医学概念のwの数値を示す情報を、閾値処理によって得られたレベルに置き換え(S510)、ステップS505に遷移する。例えば、数値関連の医学概念それぞれに対して、閾値処理における2つの閾値が予め定められている。
 表現型ベクトル生成部111は、ステップS510において、例えば、取得した数値が2つの閾値のうち小さい閾値未満である場合、当該数値のレベルをw_Lであると判定し、取得した数値が当該小さい閾値以上かつ2つの閾値のうち大きい閾値未満である場合、当該数値のレベルをw_Mであると判定し、取得した数値が当該大きい閾値以上である場合、当該数値のレベルをw_Hであると判定する。
 例えば、数値関連の医学概念であるICERに対して、2つの閾値300万と550万とが定められているとする。この場合、表現型ベクトル生成部111は、ステップS510において、C薬剤A_ICER={糖尿病,ICER=500万円,EQ-5D}をC薬剤A_ICER={糖尿病,ICER_M,EQ-5D}に変換し、C薬剤B_ICER={糖尿病,ICER_H,EQ-5D}に変換する。
 なお、当該閾値処理における閾値の個数は、1つ又は3つ以上であってもよいし、数値関連の概念ごとに異なっていてもよい。
 表現型ベクトル生成部111は、ステップS505において、選択対象の全ての医学概念を選択済みであると判定した場合(S505:Yes)、下記の式1に示されるJを最小化するcとwを表現型ベクトルに決定して、表現型ベクトル集合123に格納し(S511)、表現型ベクトル生成処理を終了する。
Figure JPOXMLDOC01-appb-M000001
 式1における、θは医学辞書230に含まれる単語(医学概念)からなる集合、CはステップS504、ステップS507、及びステップS508において生成された文脈リストのうち、単語wを含む文脈リストからなる集合である。また、P(c|w)は、文脈リストcが示す(文献又はエンカウンター情報における)文脈において、医学概念wが出現する確率を示し、下記の式2によって定義される。これは、単語w及び文脈リストcに関し、word2vec等の手法によって、単語ベクトル及び文脈ベクトルを求めるとき使われる式である。
Figure JPOXMLDOC01-appb-M000002
 式2における、VはステップS504、ステップS507、及びステップS508において生成された全ての文脈リストからなる集合、eはwの単語ベクトル、eはcの文脈ベクトル、ec’はc’の文脈ベクトルである。
 なお、eで表現される表現型ベクトルは、医学概念wが、処方予測モデル122における処方薬剤の決定に影響を与えることを示す。
 図6は、処方予測縮約マトリクス生成処理の一例を示すフローチャートである。処方予測縮約マトリクス生成部112は、薬剤リスト121から1以上の対象薬剤dを選択する(S601)。選択される対象薬剤は、例えば、薬剤リスト121に含まれる全ての薬剤であってもよいし、入力インターフェース105を介してユーザから、又は通信装置104を介して他の装置から指定された薬剤であってもよい。
 処方予測縮約マトリクス生成部112は、医学辞書230に含まれる選択対象の医学概念から、未選択の1つの医学概念wを選択する(S602)。なお、当該選択対象の医学概念は、例えば、医学辞書230に含まれる全ての薬剤であってもよいし、入力インターフェース105を介してユーザから、又は通信装置104を介して他の装置から指定された医学概念であってもよい。
 処方予測縮約マトリクス生成部112は、選択した医学概念wが、薬剤に関する概念であるか否かを判定する(S603)。処方予測縮約マトリクス生成部112は、例えば、医学概念wが薬剤リスト121に含まれる場合に医学概念wが薬剤に関する概念であると判定する。また、医学辞書230において、各医学概念が薬剤に関する概念であるか否かが定義されていてもよく、この場合、処方予測縮約マトリクス生成部112は、医学辞書230を参照して、選択した医学概念wが薬剤に関する概念であるか否かを判定する。
 処方予測縮約マトリクス生成部112は、選択した医学概念wが、薬剤に関する概念でないと判定した場合(S603:No)、医学概念wの表現型ベクトルを表現型ベクトル集合123から収集する(S604)する。ステップS604における収集対象の表現型ベクトルは、例えば、選択中の医学概念wに対して、eで表される表現型ベクトルである。
 処方予測縮約マトリクス生成部112は、選択した医学概念wが、薬剤に関する概念であると判定した場合(S603:Yes)、対象薬剤dそれぞれについて、当該対象薬剤dを中心とした、医学辞書230で管理されているネットワーク上の医学概念wに関する表現型ベクトルを、表現型ベクトル集合123から収集する(S605)。
 なお、例えば、対象薬剤dが表現型ベクトル集合123に含まれる場合、eで表される表現型ベクトルは、対象薬剤dを中心とするネットワークに含まれるものとする。なお、ユーザ等の指示に従って、対象薬剤dを中心とするネットワークから、前述した表現型ベクトルの一部を除外してもよい。ステップS605における収集対象の表現型ベクトルは、例えば、選択中の医学概念wに対して、eで表される表現型ベクトルである。
 処方予測縮約マトリクス生成部112は、対象薬剤dそれぞれに対して、収集した表現型ベクトルそれぞれに所定の重み(0ではない初期値)を掛け、線形和を算出する(S606)。前述した図4の例では、対象薬剤である薬剤Aについて、e薬剤A(図4においてeとして表されている)、e薬剤A_ICER(図4においてeとして表されている)、e薬剤A_有害事象(図4においてeとして表されている)が、表現型ベクトルとして収集され、重みα、α、αをそれぞれ掛けた線形和、α薬剤A+α薬剤A_ICER+α薬剤A_有害事象-が、処方予測縮約マトリクスGの列ベクトルgiとして算出されている。
 ステップS604又はステップS606の処理に続いて、処方予測縮約マトリクス生成部112は、選択対象の医学概念を全て選択したか否かを判定する(S607)。処方予測縮約マトリクス生成部112は、未選択の医学概念wがあると判定した場合(S607:No)、ステップS602に戻る。
 処方予測縮約マトリクス生成部112は、選択対象の医学概念を全て選択したと判定した場合(S607:Yes)、初期の処方予測縮約マトリクスを生成する(S608)。具体的には、前述した図4の例のように、ステップS604で収集した表現型ベクトルと、ステップS606で算出した線形和と、を、例えば所定の順序又は任意の順序で、列ベクトルとして又は行ベクトルとして、並べて処方予測縮約マトリクスを生成する。処方予測縮約マトリクス生成部112は、少なくとも1つの対象薬剤dの処方を含む患者をリアルワールドデータ210から抽出する(S609)。次に当該患者について、1つのエンカウンター情報219から、エンカウンターベクトルxを抽出し、抽出済みのエンカウンターベクトルx1、・・・t-1に加える(S610)。
 図7は、エンカウンターベクトルの一例である。エンカウンターベクトルの各要素は、エンカウンター情報219が当該要素に対応する値を含むか否か(例えば、含む場合は1、含まない場合は0)を示す。図7は、図2BにおけるエンカウンターID=100のエンカウンター情報219から生成されるエンカウンターベクトルである。
 図6の説明に戻る。処方予測縮約マトリクス生成部112は、処方予測モデル122を用いた予測において、処方予測縮約マトリクスと、ステップS610で抽出したエンカウンターベクトルx1、・・・のそれぞれと、の積を算出する(S611)。
 処方予測縮約マトリクス生成部112は、ステップS611で算出した積を処方予測モデル122に適用して予測薬剤を示す予測薬剤ベクトルyt’を取得し、例えば、確率的勾配降下法によって、下記の式3におけるLを最小化するよう処方予測モデル122のパラメータを更新する(S612)。なお、処方予測縮約マトリクスは、当該パラメータに含まれるため、ステップS612で更新され得る。
Figure JPOXMLDOC01-appb-M000003
 なお、式3における、yは、ステップS610で抽出したエンカウンターベクトルに出現する処方薬剤である。式3に用いられる他の変数及びパラメータは、以下の式4~式9により定義される。
Figure JPOXMLDOC01-appb-M000004
Figure JPOXMLDOC01-appb-M000005
Figure JPOXMLDOC01-appb-M000006
Figure JPOXMLDOC01-appb-M000007
Figure JPOXMLDOC01-appb-M000008
Figure JPOXMLDOC01-appb-M000009
 なお、式4におけるA(i)は薬剤を含む医学概念iに関連する医学概念からなる集合を示す。また、式8におけるRNNは、再起型ニューラルネットワークを示す。また、式9におけるsoftmaxは、ソフトマックス関数を示す。Gは、処方予測縮約マトリクスである。また、ut、t、a、W、bは、更新されるパラメータである。
 なお、ステップS612において確率的勾配降下法によって、患者ごとLを最小化したが、対象薬剤dの処方を含む全患者のLの平均値を最小化することで、処方予測モデル122におけるパラメータを最適化しても良い。また、確率的勾配降下法でなく、処方予測薬剤ベクトルyt’を処方薬剤ベクトルyに近づけるための任意の最適化手法によって最適化されてもよい。
 続いて、処方予測縮約マトリクス生成部112は、ステップS612において更新したパラメータに基づいて重みを更新し、更新した重みを用いてステップS606における線形和を再度算出し、処方予測縮約マトリクスを更新する(S613)。当該重みは、対応する表現型ベクトルが示す医学概念が、当該表現型ベクトルが示す薬剤の処方に与える影響度(寄与度)を示す
 処方予測縮約マトリクス生成部112は、対象患者の全てのエンカウンター情報からエンカウンターベクトルを抽出したか否かを判定する(S614)。処方予測縮約マトリクス生成部112は、エンカウンターベクトルを未抽出の当該エンカウンター情報があると判定した場合(S614:No)、ステップS610に戻る。処方予測縮約マトリクス生成部112は、全ての当該エンカウンター情報から、エンカウンターベクトルを抽出したと判定した場合(S614:Yes)、ステップS609に戻る。
 また、処方予測縮約マトリクス生成部112は、少なくとも1つの対象薬剤dの処方を含む全ての患者を抽出したか否かを判定する(S615)、処方予測縮約マトリクス生成部112は、未抽出の当該患者があると判定した場合(S615:No)、ステップS609に戻る。処方予測縮約マトリクス生成部112は、全ての当該患者を抽出したと判定した場合(S615:Yes)、処方予測縮約マトリクス生成処理を終了する。
 なお、少なくとも1つの対象薬剤dの処方を含む全ての患者を抽出する例を前述したが、少なくとも1つの対象薬剤dの処方を含む患者のうち、所定の患者IDの患者に抽出対象を制限しても良い。また、当該患者に関するエンカウンター情報から全てのエンカウンターベクトルが抽出される例を前述したが、当該エンカウンター情報のうち、所定範囲の日付のレコードに関するエンカウンター情報のように、エンカウンターベクトルの抽出対象が制限されてもよい。
 本実施例のように処方予測縮約マトリクスが生成されることにより、処方予測縮約マトリクスを含む処方予測モデル122は、リアルワールドデータ210だけでなく、QoL指標やADL指標等のリアルワールドデータ210からは得られない情報を考慮して、処方薬剤を高精度に予測することができる。
 さらに、表現型ベクトルは処方薬剤の決定に影響を与える指標を示し、表現型ベクトルに掛けられる重みは、当該表現型ベクトルが示す医学概念が、当該表現型ベクトルが示す薬剤の処方に与える影響度(寄与度)を示す。従って、本実施例の処方予測装置100は、QoL指標やADL指標等のリアルワールドデータ210からは得られない情報が処方薬剤の決定に与える影響を評価することができる。
 売上影響分析処理について説明する。図8は、売上影響分析画面の一例である。まず、売上影響分析部113による売上影響分析処理について説明する。売上影響分析処理は、処方予測縮約マトリクス生成処理の終了後に実施される。売上影響分析部113は、例えば、入力インターフェース105を介してユーザから、又は他の装置から、薬剤の指定を受け付ける。売上影響分析部113は、表現型ベクトル集合123から、指定された薬剤を中心としたネットワーク上の表現型ベクトルと、当該表現型ベクトルに掛けられた重みと、を取得し、売上影響分析画面800に出力する。
 図8の例では、売上影響分析画面800において、各表現型ベクトルにおける重みがグラフとして表示されている。これにより、リアルワールドデータ210から得られない指標が、当該薬剤の処方にどの程度寄与しているかを、ユーザが把握することができる。
 製品戦略策定支援処理について説明する。図9は、製品戦略策定支援処理の一例を示すフローチャートである。製品戦略策定支援処理は、処方予測縮約マトリクス生成処理の終了後に実施される。製品戦略策定支援処理において、ある表現型ベクトル集合123に含まれないターゲット薬剤(例えば、新規に開発された薬剤)に類似する薬剤が検索される。
 製品戦略策定支援部114は、例えば、入力インターフェース105を介してユーザから、又は他の装置から、初期薬剤の入力を受け付け、表現型ベクトル集合123から、初期薬剤を中心としたネットワーク上の表現型ベクトルと、当該表現型ベクトルに掛けられた重みと、を取得する(S901)。なお、例えば、ターゲット薬剤に属性が近い薬剤が、初期薬剤として選択されることが望ましい。
 製品戦略策定支援部114は、ステップS901で取得した重みを調節する(S902)。具体的には、例えば、製品戦略策定支援部114は、各重みをユーザから指定された値に変更する。また、例えば、表現型ベクトルにそれぞれに対して、重みの1以上の閾値が定められていてもよく、製品戦略策定支援部114は、各重みに対して閾値処理(例えば、閾値を超える重み、又は閾値未満である重みを閾値と同じに変更する)を行ってもよい。
 また、製品戦略策定支援部114は、ステップS902において、ステップS901取得しなかった他の表現型ベクトルと、当該他の表現型ベクトルに対応する重みと、を追加してもよい。当該他の表現型ベクトルと、当該他の表現型ベクトルに対応する重みと、は例えば、ユーザによって指定される。ステップS901及びステップS902の処理により、ターゲット薬剤の製品プロファイルが決定される。
 製品戦略策定支援部114は、調節後の重みに基づいて、類似薬剤を決定する(S903)。例えば、製品戦略策定支援部114は、重みを調節した表現型ベクトルの線形和を算出し、算出した線形和と、各薬剤のネットワーク上の表現型ベクトルの線形和と、のベクトル間距離を算出し、算出したベクトル間距離が近い薬剤(例えば、距離が近い順に所定数の薬剤、又は距離が所定値以下の薬剤等)を類似薬剤に決定する。
 また、例えば、製品戦略策定支援部114は、各薬剤について、調節後の重みそれぞれを要素とするベクトルと、当該薬剤のネットワーク上の表現型ベクトルに掛けられている重みそれぞれを要素とするベクトル間距離を算出し、算出したベクトル間距離が近い薬剤を類似薬剤に決定してもよい。
 製品戦略策定支援部114は、薬剤売上データ124を参照して、類似薬剤の売り上げ、及び類似薬剤のシェア等を出力インターフェース108又は他の装置に出力する(S904)。なお、ステップS904において、売り上げ及びシェア以外の類似薬剤に関する情報が表示されていてもよい。
 図10は、製品戦略策定支援処理の一例を示す説明図である。図10の例では、ターゲット薬剤Xに対して、初期薬剤として薬剤Bが入力されている。なお、図10のように、ベクトル空間上での比較薬剤選定として、ターゲット薬剤と各薬剤に対する線形和のベクトル空間上での位置を示す情報が表示されてもよい。
 図10の例では、製品属性変更で、初期薬剤である薬剤Bに対する重みα、α、αが調節されて、ターゲット薬剤は薬剤Cに近いことが判明し、薬剤Cが類似薬剤として選定されている。さらに、類似薬剤である薬剤Cの年度ごとの売り上げ推移、及びある年度における薬剤Cの製品シェアが表示されている。
 前述した製品戦略策定支援処理により、表現型ベクトルが生成されていない薬剤に、QoL及びADL等のリアルワールドデータ210から得られない属性が類似する薬剤、を決定することができる。
 なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることも可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
 また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
 また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

Claims (10)

  1.  医学情報処理装置であって、
     プロセッサとメモリとを備え、
     前記メモリは、
     医学概念の一覧を示す医学辞書と、
     薬剤の名称を示す薬剤情報と、
     診療履歴を含む診療情報と、
     前記診療情報に含まれない医学概念に関する記載を含む文献と、を保持し、
     前記プロセッサは、
     前記診療情報に含まれない医学概念と前記薬剤情報に含まれる薬剤との組み合わせそれぞれについて、前記文献から、当該医学概念に関する記載と当該薬剤に関する記載とを含む文献を特定し、
     前記組み合わせそれぞれについて、前記特定した文献それぞれに含まれる前記医学辞書が示す医学概念、からなる医学概念リストを生成し、
     前記診療情報に含まれない医学概念それぞれが、前記医学概念リストが示す文献の文脈において出現する確率、に基づいて、前記診療情報に含まれない医学概念のうち、前記薬剤情報に含まれる薬剤の処方に影響を与える第1医学概念を決定する、医学情報処理装置。
  2.  請求項1に記載の医学情報処理装置であって、
     前記メモリは、診療履歴が入力されると、処方される予測薬剤を示す値を出力する予測モデルを保持し、
     前記診療情報に含まれる診療履歴は、薬剤の処方履歴を含み、
     前記プロセッサは、
     前記第1医学概念それぞれについて、前記薬剤情報に含まれる各薬剤の処方に対する影響度を決定し、
     前記影響度を示すパラメータを前記予測モデルに適用し、
     前記パラメータを適用した予測モデルに、前記診療情報に含まれる診療履歴それぞれを入力して、予測薬剤を示す情報を取得し、
     前記取得した予測薬剤を示す値と、前記診療情報に含まれる診療履歴それぞれに対応する処方履歴が示す処方薬剤を示す値と、が近づくように、前記影響度を調節し、
     調節後の前記影響度を前記パラメータに反映させる、医学情報処理装置。
  3.  請求項2に記載の医学情報処理装置であって、
     前記パラメータは、行列で表され、
     前記プロセッサは、
     前記薬剤情報に含まれる各薬剤について、当該薬剤の処方に影響を与える第1医学概念を示すベクトルそれぞれと、当該第1医学概念に対応する影響度と、の積の線形和を算出し、
     前記線形和それぞれを、前記行列の行ベクトル又は列ベクトルとして含める、医学情報処理装置。
  4.  請求項2に記載の医学情報処理装置であって、
     前記プロセッサは、
     前記医学辞書を参照して、前記診療情報に含まれる医学概念を特定し、
     前記診療情報に含まれる医学概念それぞれについて、当該医学概念に関する記載を含む診療履歴を特定し、前記特定した診療履歴それぞれに含まれる前記医学辞書が示す医学概念、からなる医学概念リストを生成し、
     前記診療情報に含まれる医学概念それぞれが、当該医学概念に対応する医学概念リストが示す診療履歴の文脈において出現する確率、に基づいて、前記診療情報に含まれる医学概念のうち、処方薬剤の決定に影響を与える第2医学概念を決定し、
     前記パラメータは、前記第2医学概念を反映する、医学情報処理装置。
  5.  請求項4に記載の医学情報処理装置であって、
     前記パラメータは、行列で表され、
     前記行列は、前記第2医学概念を示すベクトルを行ベクトル又は列ベクトルとして有する、医学情報処理装置。
  6.  請求項2に記載の医学情報処理装置であって、
     表示装置に接続され、
     前記プロセッサは、
     前記薬剤情報に含まれる第1薬剤の指定を受け付け、
     前記第1薬剤の処方に影響を与える第1医学概念と、当該第1医学概念に対応する調節後の前記影響度と、を示す情報を、前記表示装置に出力する、医学情報処理装置。
  7.  請求項6に記載の医学情報処理装置であって、
     前記プロセッサは、
     前記出力した影響度の変更指示を受け付け、
     前記変更指示に基づいて、前記出力した影響度を変更し、
     変更後の影響度が示すベクトルと、前記薬剤情報に含まれる各薬剤の処方に影響を与える第1概念に対応する調節後の影響度が示すベクトルと、の距離を算出し、
     前記算出した距離に基づいて、前記第1薬剤の前記薬剤情報に含まれる薬剤から、類似薬剤を決定し、
     前記類似薬剤を示す情報を前記表示装置に出力する、医学情報処理装置。
  8.  請求項1に記載の医学情報処理装置であって、
     前記メモリは、
     前記医学辞書に含まれる医学概念のうち、数値関連の概念を示す数値関連情報を保持し、
     前記プロセッサは、前記医学概念リストに含まれる、前記数値関連情報が示す数値関連の医学概念、が示す数値を、閾値処理によって、所定数の段階の値に置き換える、医学情報処理装置。
  9.  医学情報処理装置による医学情報処理方法であって、
     前記医学情報処理装置は、プロセッサとメモリとを備え、
     前記メモリは、
     医学概念の一覧を示す医学辞書と、
     薬剤の名称を示す薬剤情報と、
     診療履歴を含む診療情報と、
     前記診療情報に含まれない医学概念に関する記載を含む文献と、を保持し、
     前記医学情報処理方法は、
     前記プロセッサが、前記診療情報に含まれない医学概念と前記薬剤情報に含まれる薬剤との組み合わせそれぞれについて、前記文献から、当該医学概念に関する記載と当該薬剤に関する記載とを含む文献を特定し、
     前記プロセッサが、前記組み合わせそれぞれについて、前記特定した文献それぞれに含まれる前記医学辞書が示す医学概念、からなる医学概念リストを生成し、
     前記プロセッサが、前記診療情報に含まれない医学概念それぞれが、前記医学概念リストが示す文献の文脈において出現する確率、に基づいて、前記診療情報に含まれない医学概念のうち、前記薬剤情報に含まれる薬剤の処方に影響を与える第1医学概念を決定する、ことを含む医学情報処理方法。
  10.  医学情報処理装置に医学情報処理を実行させるためのプログラムを格納する計算機読み取り可能な非一時的記憶媒体であって、
     前記医学情報処理装置は、プロセッサとメモリとを備え、
     前記メモリは、
     医学概念の一覧を示す医学辞書と、
     薬剤の名称を示す薬剤情報と、
     診療履歴を含む診療情報と、
     前記診療情報に含まれない医学概念に関する記載を含む文献と、を保持し、
     前記プログラムは、
     前記診療情報に含まれない医学概念と前記薬剤情報に含まれる薬剤との組み合わせそれぞれについて、前記文献から、当該医学概念に関する記載と当該薬剤に関する記載とを含む文献を特定する手順と、
     前記組み合わせそれぞれについて、前記特定した文献それぞれに含まれる前記医学辞書が示す医学概念、からなる医学概念リストを生成する手順と、
     前記診療情報に含まれない医学概念それぞれが、前記医学概念リストが示す文献の文脈において出現する確率、に基づいて、前記診療情報に含まれない医学概念のうち、前記薬剤情報に含まれる薬剤の処方に影響を与える第1医学概念を決定する手順と、を前記プロセッサに実行させる、記憶媒体。
PCT/JP2019/006416 2018-05-29 2019-02-20 医学情報処理装置、医学情報処理方法、及び記憶媒体 WO2019230073A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201980024273.0A CN111971754B (zh) 2018-05-29 2019-02-20 医学信息处理装置、医学信息处理方法及存储介质
US17/054,795 US11469000B2 (en) 2018-05-29 2019-02-20 Medical information processing device, medical information processing method, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-102099 2018-05-29
JP2018102099A JP6975682B2 (ja) 2018-05-29 2018-05-29 医学情報処理装置、医学情報処理方法、及び医学情報処理プログラム

Publications (1)

Publication Number Publication Date
WO2019230073A1 true WO2019230073A1 (ja) 2019-12-05

Family

ID=68698004

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/006416 WO2019230073A1 (ja) 2018-05-29 2019-02-20 医学情報処理装置、医学情報処理方法、及び記憶媒体

Country Status (4)

Country Link
US (1) US11469000B2 (ja)
JP (1) JP6975682B2 (ja)
CN (1) CN111971754B (ja)
WO (1) WO2019230073A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6995233B1 (ja) * 2021-04-06 2022-01-14 エンサイス株式会社 情報処理システム、コンピュータシステム及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017174405A (ja) * 2016-03-24 2017-09-28 富士通株式会社 オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
JP2017174406A (ja) * 2016-03-24 2017-09-28 富士通株式会社 ヘルスケア・リスク推定システム及び方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020138303A1 (en) * 2000-11-08 2002-09-26 Gil Enos Method and apparatus for personalized medical prescription services
US20040249669A1 (en) 2001-11-14 2004-12-09 Pollack Richard D. System and methods for generating physician profiles concerning prescription therapy practices with self-adaptive predictive model
US7630947B2 (en) * 2005-08-25 2009-12-08 Siemens Medical Solutions Usa, Inc. Medical ontologies for computer assisted clinical decision support
JP4672714B2 (ja) * 2007-10-31 2011-04-20 株式会社東芝 文書データ処理装置
US9649469B2 (en) * 2008-04-24 2017-05-16 The Invention Science Fund I Llc Methods and systems for presenting a combination treatment
JP2008210414A (ja) 2008-06-03 2008-09-11 Ims Health Inc 処方実務に関連する医師プロファイルを、自己適合性予測モデルを用いて発生するシステム及び方法
US10475140B2 (en) * 2010-05-13 2019-11-12 Axon Healthcare Services, Llc Prospective management process for medical benefit prescriptions
US9384321B2 (en) * 2010-11-25 2016-07-05 Portable Genomics, Inc. Organization, visualization and utilization of genomic data on electronic devices
WO2014064702A2 (en) * 2012-10-24 2014-05-01 Cathworks Ltd. Automated measurement system and method for coronary artery disease scoring
JP6101563B2 (ja) * 2013-05-20 2017-03-22 株式会社日立製作所 情報構造化システム
US10614196B2 (en) * 2014-08-14 2020-04-07 Accenture Global Services Limited System for automated analysis of clinical text for pharmacovigilance
GB2548627A (en) * 2016-03-24 2017-09-27 Fujitsu Ltd A system and a method for assessing patient treatment risk using open data and clinician input
WO2021195130A1 (en) * 2020-03-23 2021-09-30 Sorcero, Inc. Cross-context natural language model generation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017174405A (ja) * 2016-03-24 2017-09-28 富士通株式会社 オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
JP2017174406A (ja) * 2016-03-24 2017-09-28 富士通株式会社 ヘルスケア・リスク推定システム及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6995233B1 (ja) * 2021-04-06 2022-01-14 エンサイス株式会社 情報処理システム、コンピュータシステム及びプログラム

Also Published As

Publication number Publication date
JP2019207520A (ja) 2019-12-05
US11469000B2 (en) 2022-10-11
JP6975682B2 (ja) 2021-12-01
CN111971754A (zh) 2020-11-20
US20210233666A1 (en) 2021-07-29
CN111971754B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
Norgeot et al. Minimum information about clinical artificial intelligence modeling: the MI-CLAIM checklist
JP6272555B2 (ja) 計算機システム、及び、情報処理方法
Bashir et al. BagMOOV: A novel ensemble for heart disease prediction bootstrap aggregation with multi-objective optimized voting
US11651252B2 (en) Prognostic score based on health information
Zeng et al. Explainable machine-learning predictions for complications after pediatric congenital heart surgery
Tang et al. RapidMic: rapid computation of the maximal information coefficient
Johnson et al. The potential and pitfalls of artificial intelligence in clinical pharmacology
JP2022504508A (ja) モデル支援型事象予測のためのシステム及び方法
WO2019230073A1 (ja) 医学情報処理装置、医学情報処理方法、及び記憶媒体
CN113066531A (zh) 风险预测方法、装置、计算机设备及存储介质
JP7027359B2 (ja) ヘルスケアデータ分析装置及びヘルスケアデータ分析方法
Ebrahimi et al. Analysis of Persian Bioinformatics Research with Topic Modeling
Dunn et al. A cloud-based pipeline for analysis of FHIR and long-read data
Monem et al. A multi-task learning model for predicting drugs combination synergy by analyzing drug–drug interactions and integrated multi-view graph data
Lydia et al. Transforming Health Care Big Data Implementing through Aprior-Mapreduce
García Simón et al. Characterization and treatment of the temporal dimension of genomic variations: a conceptual model-based approach
Rao et al. Medical Data Supervised Learning Ontologies for Accurate Data Analysis
Wang et al. Drug–target interaction prediction through fine-grained selection and bidirectional random walk methodology
Wilcox Leveraging electronic health records for phenotyping
Jovic et al. MULTISAB: A Web Platform for Analysis of Multivariate Heterogeneous Biomedical Time-series
Bertolini et al. Predicting Cancer Patients’ Survival Using Random Forests
Mittal et al. Analysis of supervised feature selection in bioinformatics
JP7171522B2 (ja) ヘルスケアデータ分析装置及び分析方法
Tsumoto et al. Determination of Disease from Discharge Summaries: A Text Mining Approach
Alvarado-Valiente et al. Towards a Classical-Quantum Platform for Pharmacogenetic Simulations

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19811992

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19811992

Country of ref document: EP

Kind code of ref document: A1