WO2020045245A1 - 状態遷移予測装置、予測モデル学習装置、方法およびプログラム - Google Patents

状態遷移予測装置、予測モデル学習装置、方法およびプログラム Download PDF

Info

Publication number
WO2020045245A1
WO2020045245A1 PCT/JP2019/032900 JP2019032900W WO2020045245A1 WO 2020045245 A1 WO2020045245 A1 WO 2020045245A1 JP 2019032900 W JP2019032900 W JP 2019032900W WO 2020045245 A1 WO2020045245 A1 WO 2020045245A1
Authority
WO
WIPO (PCT)
Prior art keywords
feature data
elapsed time
state
data
symptom
Prior art date
Application number
PCT/JP2019/032900
Other languages
English (en)
French (fr)
Inventor
籔内 勉
正造 東
直樹 麻野間
昭宏 千葉
佳那 江口
山田 智広
央 倉沢
吉田 和広
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/271,177 priority Critical patent/US20210257067A1/en
Priority to JP2020539396A priority patent/JP7107375B2/ja
Publication of WO2020045245A1 publication Critical patent/WO2020045245A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Definitions

  • the present invention relates to a state transition prediction device, a prediction model learning device, a method, and a program that are used, for example, in a medical health field to predict a risk of developing a future disease based on a current health condition of a user.
  • Non-Patent Document 1 As one of the methods for calculating a future disease onset risk score based on information representing an individual's health condition, a method of constructing and applying a score function for a single disease has been proposed. For example, in the field of metabolic systems, diabetes and hypertension are distinguished, and an onset risk score is calculated for each disease (for example, see Non-Patent Document 1).
  • onset risk score if the future state transition direction is single, it is possible to compare the period until the transition from the viewpoint of one axis earlier / later. It suffices if the model selection and parameters of the function can be set so as to be correct. That is, an onset / progression risk function for an individual disease is constructed along a period until a transition of the disease occurs.
  • lifestyle-related diseases are a group of diseases in which lifestyle such as eating habits, exercise habits, sleep, and drinking are greatly involved in the onset and progression, and include diabetes, hypertension, neoplasms, and the like. It is known that lifestyle-related diseases occur simultaneously. For example, it is known that a diabetic patient has a high probability of developing hypertension. It is also known that complications of diabetes, which is one of lifestyle-related diseases, are as diverse as nephropathy, retinopathy, and neuropathy.
  • the onset / progression risk function is a period until a transition of one disease occurs.
  • the complications that occur in diabetic patients are various, such as nephropathy, retinopathy, and neuropathy.However, it is possible to calculate a risk score that can compare the progress of diabetes between patients with nephropathy and patients with retinopathy. Have difficulty.
  • the present invention has been made focusing on the above circumstances, and even when there are a plurality of future state transition patterns, a score representing the magnitude of the tendency for state transitions to occur is unified regardless of the state transition patterns. It is intended to provide a technique that can be calculated as a value.
  • a first aspect of a state transition prediction device and method according to the present invention is that a user's health state transitions from a first state to a second state after a first symptom develops. Further, when the second symptom develops from the second state and transitions to the third state, the feature amount related to the first state and the feature amount from the first state to the second state.
  • a characteristic data acquisition unit that acquires characteristic data including an elapsed time of the first state and an elapsed time from the first state to the third state; and a first characteristic data from the acquired characteristic data.
  • the state transition is A selection unit for selecting first and second feature data having different elapsed times; And the feature amount relating to the first state included in the second feature data is used as training data, and is calculated based on each feature amount and included in the first and second feature data.
  • a prediction model generation unit that generates a prediction model by causing the learning device to learn using the score reflecting the elapsed time as the correct answer data.
  • the health condition of the user transitions from the first condition to the second condition with the occurrence of the first symptom, and further, the second condition changes from the second condition to the second condition.
  • a prediction model is created in consideration of the state transition pattern and the elapsed time until the state transition occurs. Therefore, even when there are a plurality of future state transition patterns, it is possible to create a prediction model that can calculate the magnitude of the tendency of the state transition to occur as a score that uniformly represents the magnitude of the tendency regardless of the state transition pattern. it can.
  • FIG. 1 is a block diagram showing a functional configuration of a state transition prediction device according to an embodiment of the present invention.
  • FIG. 2 is a flowchart showing a processing procedure and processing contents of a learning phase by the state transition prediction device shown in FIG.
  • FIG. 3 is a flowchart illustrating a processing procedure and a processing content of a prediction phase by the state transition prediction device illustrated in FIG. 1.
  • FIG. 4 is a diagram illustrating an example of medical record data.
  • FIG. 5 is a diagram illustrating an example of a period up to the onset of onset for each user and correct answer data.
  • FIG. 6 is a diagram illustrating an example of a prediction model learning process in the learning phase illustrated in FIG.
  • FIG. 7 is a diagram illustrating an example of the state transition prediction process in the prediction phase illustrated in FIG.
  • FIG. 1 is a block diagram showing a functional configuration of a state transition prediction device according to an embodiment of the present invention.
  • the state transition prediction device 1 includes, for example, a server computer or a personal computer, and is capable of communicating with an electronic medical records (EMR) server 2 and an access terminal 4 via a network 3.
  • EMR electronic medical records
  • the EMR server 2 is provided for each medical institution such as a hospital, a doctor's office, and a clinic, and stores and manages medical record data including medical data, examination data, medical inquiry data, and the like for each patient.
  • an electronic health record (EHR) server provided to be shared by a plurality of medical institutions in the region, and personal health record (PHR) data are stored.
  • the user terminal may be a user terminal.
  • the access terminal 4 is, for example, a terminal used by a medical or healthcare professional such as a doctor, a nurse, or a public health nurse, a terminal used by a third party authorized by a user such as an insurance company, or a terminal used by the user himself. And comprises, for example, a personal computer, a tablet terminal or a smartphone.
  • the network 3 includes, for example, a public network such as the Internet and an access network for accessing the public network.
  • a public network such as the Internet
  • an access network for example, an in-hospital LAN (Local Area Network) or a wireless LAN is used.
  • a wired telephone network, a CATV (Cable Television) network, a mobile phone network, a public wireless LAN, or the like may be used. is there.
  • the state transition prediction device 1 is provided in, for example, a medical institution, and is configured by, for example, a server computer.
  • the state transition prediction device 1 may be installed alone, but may be provided as one of its extended functions in a doctor terminal, an EMR server, an EHR server, or a cloud server. .
  • the state transition prediction device 1 is realized by hardware and software.
  • the hardware is such that the storage unit 20 and the interface unit 30 are connected to the control unit 10 via a bus (not shown).
  • the interface unit 30 performs data transmission between the EMR server 2 and the access terminal 4 via the network 3. Further, the interface unit 30 may have a function of performing data transmission with a management terminal connected via a LAN or a signal cable.
  • the storage unit 20 includes, as storage media, a nonvolatile memory such as a hard disk drive (HDD) or a solid state drive (SSD) that can be written and read at any time, and a nonvolatile memory such as a read only memory (ROM). , And a volatile memory such as a RAM (Random Access Memory).
  • the storage area is provided with a program storage area and a data storage area.
  • the program storage area stores programs required to execute various control processes according to the embodiment of the present invention.
  • the data storage area includes a medical record data storage unit 21, a learning target data storage unit 22, and a prediction model storage unit 23.
  • the medical record data storage unit 21 is used to store medical record data of a plurality of users obtained from the EMR server 2 or the like.
  • the learning target data storage unit 22 is used to store learning target data selected from a plurality of users' medical record data stored in the medical record data storage unit 21.
  • the prediction model storage unit 23 is used to store a learned prediction model.
  • the control unit 10 includes, for example, a hardware processor such as a CPU (Central Processing Unit), and includes a medical record data acquisition unit 11 and a learning target data selection unit as control function units for implementing an embodiment of the present invention. 12, a training data extraction / correct answer data calculation unit 13, a prediction model learning unit 14, an evaluation data acquisition unit 15, an onset risk score prediction processing unit 16, and a prediction data output unit 17.
  • a hardware processor such as a CPU (Central Processing Unit)
  • the control unit 10 includes, for example, a hardware processor such as a CPU (Central Processing Unit), and includes a medical record data acquisition unit 11 and a learning target data selection unit as control function units for implementing an embodiment of the present invention. 12, a training data extraction / correct answer data calculation unit 13, a prediction model learning unit 14, an evaluation data acquisition unit 15, an onset risk score prediction processing unit 16, and a prediction data output unit 17.
  • Each of these control function units is realized by causing the hardware processor to execute a program stored in the program storage area.
  • the medical record data acquiring unit 11 acquires medical record data of a plurality of users from the EMR server 2 via the network 3 and the interface unit 30, and acquires the medical record data from the personal identification information ( A process of storing the medical record data storage unit 21 in association with the user ID) is performed.
  • the learning target data selection unit 12 performs a process of selecting learning target data by focusing on a plurality of diseases that may occur as complications or complications, for example, diabetes and hypertension.
  • the types of the plurality of diseases of interest are not limited to diabetes and hypertension, but may be other diseases such as nephropathy and retinopathy.
  • the type of the disease to be learned is specified in advance by, for example, an operation manager of the state transition prediction device 1.
  • the learning target data selecting unit 12 first determines whether there is an onset history of the plurality of diseases of interest or the onset of each of the diseases from the medical record data of the plurality of users stored in the medical record data storage unit 21. Select medical record data during follow-up observation. Then, a plurality of sets of medical record data in which the order of onset of the diseases of interest is common and the elapsed time until the onset of each of the diseases is different are selected, and each set of the selected medical record data is set as a learning target data. Is stored in the learning target data storage unit 22.
  • the training data extraction / correct answer data calculation unit 13 determines, for each set of medical record data stored in the learning target data storage unit 22, a feature amount representing the health condition of the user from each medical record data constituting the set. Then, vital data of a predetermined test item included in the test data at the first year of the test is extracted, and the test data is used as training data. For example, HbA1c indicating the blood sugar level, the systolic blood pressure BP, and the body mass index (Body Mass Index: BMI) at the first year of the test are extracted.
  • BMI Body Mass Index
  • the training data extraction / correct answer data calculation unit 13 performs, for each of the medical record data constituting the set, a characteristic quantity representing the health condition of the user, that is, a predetermined test item included in the test data at the first year of the test. Based on the vital data and the elapsed time until the plurality of diseases of interest onset, a risk score at which the plurality of diseases develop as complications or complications is calculated. At this time, the onset risk score is calculated such that a shorter user has a larger value than a user who has a longer elapsed time until the onset.
  • the onset risk score is calculated using the length of the period until the tracking and observation becomes impossible as the elapsed time. Then, the training data extraction / correct answer data calculation unit 13 uses the calculated onset risk score as the correct answer data.
  • the prediction model learning unit 14 uses a learning device composed of, for example, a multilayer neural network, and inputs the training data extracted by the training data extraction / correct data calculation unit 13 into the learning device.
  • the learning parameters of the learning device are adjusted so that the error between the score obtained and the correct data calculated by the training data extraction / correct data calculation unit 13 is minimized.
  • the prediction model reflecting the finally obtained learning parameters is stored in the prediction model storage unit 23 as a learned prediction model.
  • a specific example of the learning process in the prediction model learning unit 14 will be described later.
  • the evaluation data acquisition unit 15 obtains, from the EMR server 2 or the access terminal 4, test data of a user to be predicted, for example, HbA1c, systolic blood pressure, and BMI, Perform processing to acquire as evaluation data.
  • test data of a user to be predicted for example, HbA1c, systolic blood pressure, and BMI.
  • the medical record data of the user may be acquired, and the necessary test data may be extracted from the medical record data as evaluation data.
  • the onset risk score prediction processing unit 16 inputs the evaluation data acquired by the evaluation data acquisition unit 15 into the learned prediction model stored in the prediction model storage unit 23, and outputs the onset that is output from the prediction model. A process of passing the risk score to the prediction data output unit 17 is performed.
  • the onset risk score prediction processing unit 16 may store the onset risk score output from the learned prediction model in a prediction data storage unit (not shown) in the storage unit 20 in association with the user ID. Good.
  • the prediction data output unit 17 performs a process of generating prediction result notification data including the onset risk score passed from the onset risk score prediction processing unit 16 and transmitting the generated notification data from the interface unit 30 to the requesting access terminal 4.
  • FIG. 2 is a flowchart illustrating an example of processing procedures and processing contents of a learning phase by the control unit 10 of the state transition prediction device 1.
  • step S10 the control unit 10 accesses the EMR server 2 via the interface unit 30 under the control of the medical record data acquisition unit 11, and Download the medical record data pertaining to the user. Then, the medical record data is stored in the medical record data storage unit 21 in association with the user ID. In addition, you may make it acquire more medical record data from an EHR server other than an EMR server.
  • the medical record data acquisition unit 11 may acquire the medical record data of all the users managed by the EMR server 2 or the like. Only medical record data of a user having a history of the onset of a plurality of diseases, for example, diabetes and hypertension, may be searched and acquired. By doing so, it is possible to reduce the storage capacity of the medical record data storage unit 21 and reduce the processing load related to the learning target data selection processing described later. In addition, for example, when user attributes such as a user's gender, age group, residence area, and occupation are specified as learning targets, only medical record data of the user corresponding to these user attributes may be acquired. .
  • step S11 the learning target data under the control of the learning target data selection unit 12 as follows. A process for selecting medical record data is performed.
  • the learning target data selecting unit 12 first provides, from the medical record data storage unit 21, a user who has a history of the onset of a plurality of diseases specified in advance as the learning target or a user who is tracking and observing the onset of the plurality of diseases.
  • the medical record data is selected. For example, if the concurrent or complication of diabetes and hypertension is designated as a learning target, there is a history of the onset of diabetes and hypertension, or a medical record of a user who is following up on diabetes and hypertension. Select data.
  • FIG. 4 shows an example of medical record data of the users A to E who have a history of onset of diabetes and hypertension or are tracking the diseases selected by the above processing.
  • the test period the elapsed time until the onset of diabetes, the elapsed time until the onset of hypertension, HbA1c in the first test, the systolic blood pressure (BP) in the first test
  • the test It shows the first BMI associated.
  • the learning target data selecting unit 12 selects a plurality of diseases to be learned, such as diabetes and hypertension, from among the selected medical record data, and the onset patterns (for example, onset order) are common, and Select all medical record data sets with different elapsed times until the onset of the disease.
  • diseases to be learned such as diabetes and hypertension
  • the disease has started at the time when tracking and observation become impossible, that is, at any time after the expiration of the test period, and the elapsed time until the onset is assumed to be the same time I do.
  • the arbitrary point in time is, for example, the day after the inspection or the day when the next inspection after the inspection period is scheduled (one year after the next scheduled inspection date or the last inspection date), or the last after the inspection period. It is set on the day following the day of consultation at the hospital.
  • user A has developed hypertension after the onset of diabetes, and D and E are selected as users having the same onset pattern as this onset pattern.
  • user D selects hypertension on the seventh year after the sixth year of the medical examination
  • user E selects hypertension on the fourth year after the third year of the medical examination. That is, a set of the user A and the user D and a set of the user A and the user E are selected as learning targets.
  • the user C has developed diabetes after the onset of hypertension, and B is selected as a user having the same onset pattern as this onset pattern. However, the user B makes a selection on the assumption that diabetes has developed in the seventh year after receiving the medical examination in the sixth year. That is, a set of the user B and the user C is selected as a learning target. Then, the learning target data selection unit 12 causes the learning target data storage unit 22 to store each set of the selected medical record data.
  • a set of medical record data to be selected includes a plurality of diseases to be learned, such as diabetes and hypertension, which have the same onset pattern (for example, onset order) from the medical record data, and until these diseases develop.
  • the elapsed time is different, and the elapsed time to the onset of hypertension (or diabetes) and the elapsed time to the onset of diabetes (or hypertension) of one user are different from the elapsed time to the onset of hypertension (or diabetes) of the other user and the diabetes (or (Hypertension)
  • All sets of medical record data that are both smaller than the elapsed time until the onset may be selected, and it is assumed that the user who has not developed the symptom has developed at any time after the follow-up observation is disabled
  • the time elapsed until the onset may be set to the same point in time, and the same condition may be applied for selection.
  • the control unit 10 first controls the learning target data in step S12 under the control of the training data extracting / correct answer data calculating unit 13.
  • the learning target data is read from the storage unit 22, and HbA1c, systolic blood pressure, and BMI, which are test data in the first year of the test, are extracted from these learning target data as characteristic amounts representing the health condition of the user.
  • the feature amount representing the user's health condition may be any other value that can be quantitatively represented by an item that can contribute to score calculation, such as a sample test or a physiological test.
  • HbA1c “5.2”, systolic blood pressure “130”, and BMI “28” are extracted from the medical record data of the user B
  • HbA1c “5.6” is extracted from the medical record data of the user C.
  • the systolic blood pressure “137” and the BMI “31” are extracted. Then, the extracted user inspection data is used as training data.
  • step S13 the training data extraction / correct answer data calculation unit 13 determines, for each set of medical record data stored as the learning target data in the learning target data storage unit 22, for each medical record data constituting the set. Based on the test data at the first year of the test, HbA1c, systolic blood pressure, and BMI, and the elapsed time until the onset of diabetes and the elapsed time until the onset of hypertension, a risk score for developing a complication Is calculated.
  • the onset risk score is calculated such that the score of the user whose elapsed time until the onset is short is greater than the score of the user whose elapsed time until the onset is long.
  • a score is calculated using the length of time until the tracking observation becomes impossible as the elapsed time. Then, the training data extraction / correct answer data calculation unit 13 uses the calculated onset risk score as the correct answer data.
  • FIG. 5 is a bar graph showing a period until the onset of diabetes and hypertension of each of the users A to E shown in FIG. 4, and further shows an example of correct data of an onset risk score in consideration of co-morbidity or complications. It is.
  • the learning target data selection unit 12 selects a pair of the user B and the user C, a pair of the user A and the user D, and a pair of the user A and the user E as learning targets.
  • a score is calculated for each set from the medical record data.
  • score Z of the user A from the score Z E users E as the a side is a large value is calculated as i.e. a Z a> Z E.
  • FIG. 6 shows an example of a configuration of a learning device used for learning a prediction model.
  • the learning device for example, a multilayer neural network is used.
  • the multilayer neural network includes, for example, three layers of an input layer IL1, IL2, an intermediate layer ML1, ML2, and an output layer OL1, OL2.
  • the input layers IL1 and IL2 and the intermediate layers ML1 and ML2 are composed of a fully coupled layer
  • Batch Normalization and an activation function ReLU and the output layers OL1 and OL2 are composed of a fully coupled layer.
  • the prediction model learning unit 14 uses the test data in the first year of the test extracted from each medical record data of the users constituting the set by the training data extraction / correct answer data calculation unit 13 as the training data, as the input layer IL1, Input to IL2.
  • the input layer IL1, Input to IL2 For example, taking the group of user B and user C as an example, HbA1c “5.2”, systolic blood pressure “130” and BMI “28”, which are the test data of the first year of user B, and user C HbA1c “5.6”, systolic blood pressure “137”, and BMI “31”, which are the test data of the first year of the test, are input to two input layers IL1 and IL2 of the learning device.
  • the prediction model learning unit 14 compares the score output from the output layers OL1 and OL2 of the learning device corresponding to the test data of the user B in the first year of the test with the score corresponding to the test data of the user C in the first year of the test. The difference is input to the calculation unit SL of the Sigmoid function. Then, the intersection entropy of the output value and the correct value “1” obtained from the relation of the correct data Z B ⁇ Z C of the user B and the user C calculated by the training data extraction / correct data calculation unit 13 is calculated. Error. Then, the error is minimized by the optimization method Adam.
  • a three-dimensional vector of the test data is input to the input layers IL1 and IL2 of the learning device, and a score composed of a one-dimensional vector is output from the output layers OL1 and OL2. That is, the unit size of the input layer of the learning device is “3”, and the unit size of the output layer is “1”.
  • the unit size of the intermediate layer is “64”. The parameters are not limited to these, and the unit size can be changed as appropriate according to the number of items used for calculating the score and the relationship between the items.
  • the prediction model learning unit 14 trains the learning device on the test data of the first year of the test in the learning device for all the sets of the learning target data stored in the learning target data storage unit 22 as in the case of the user B and the user C described above. Input as data, calculate the error of the cross entropy between the Sigmoid function value of the difference of the output of the learning device and the correct value obtained from the relationship between the correct data, and perform optimization processing to minimize this error. Do. Then, when it is detected in step S15 that the learning process using all the learning target data has been completed, the prediction model in which the learning parameters at that time are reflected is stored in the prediction model storage unit 23 as a learned prediction model, and the prediction model Is completed.
  • FIG. 5 also shows, for reference, a case where correct data is individually calculated for diabetes and hypertension. That is, when the risk score of diabetes calculated from examination data of the first year of each user X, the risk score of hypertension was Y, diabetes X A> X B, X A > X C, X A> X D, X A> X E, X B ⁇ X C, X B ⁇ X D, X C> X D, hypertension Y A> Y B, Y A > Y D, Y A> Y E, Y B> Correct data that satisfies the magnitude relation of Y D , Y C > Y D , Y C > Y E is set. Then, when a learning device is trained using these correct answer data, a prediction model for diabetes and a prediction model for hypertension can be generated, respectively. It also makes it possible to predict the risk of developing hypertension alone.
  • FIG. 3 is a flowchart illustrating an example of a procedure and a content of a prediction process performed by the control unit 10 of the state transition prediction device 1.
  • the control unit 10 interfaces the inspection data with the interface in step S20 under the control of the evaluation data acquisition unit 15.
  • the data is taken in as evaluation data via the unit 30.
  • As the test data for example, HbA1c, systolic blood pressure, and BMI, which are vital data representing the feature amount of the current health condition of the prediction target user, are input.
  • the input processing of the test data of the prediction target user is performed from a terminal of a medical worker such as a doctor, a user terminal, or a terminal of an insurance company, for example.
  • FIG. 7 is a diagram showing the processing contents.
  • the onset risk score prediction processing unit 16 reads the learned prediction model stored in the prediction model storage unit 23. Then, in step S21, the acquired evaluation data, for example, HbA1c, systolic blood pressure, and BMI are input to the input layer IL of the learned prediction model. Then, in the trained prediction model, a prediction score is calculated by the input layer IL and the middle layer ML using the three-dimensional vector including the HbA1c, the systolic blood pressure, and the BMI as an input, and is calculated by the one-dimensional vector from the output layer OL. The expressed onset risk score is output.
  • the acquired evaluation data for example, HbA1c, systolic blood pressure, and BMI are input to the input layer IL of the learned prediction model.
  • a prediction score is calculated by the input layer IL and the middle layer ML using the three-dimensional vector including the HbA1c, the systolic blood pressure, and the BMI as an input, and is calculated by the
  • the control unit 10 Under control of the prediction data output unit 17, the control unit 10 generates prediction result notification data including the onset risk score output from the learned prediction model in step S22. .
  • the onset risk score may be included as it is, or the onset risk score determined by the threshold value of the onset risk score may be included, and an advice message according to the onset risk degree may be included. May be included.
  • the prediction data output unit 17 transmits the prediction result notification data from the interface unit 30 to the requesting medical worker terminal, user terminal, or insurance company terminal.
  • the transmission method may be a method of transmitting the data in a form that can be browsed by a browser of the terminal, or a method of transmitting the data in a form attached to an e-mail.
  • effect in the learning phase, there is a history of the onset of a plurality of diseases that may occur as complications or complications, or a medical From the record data, a set of medical record data in which the onset order of each disease of interest is common and the elapsed time until the onset of each disease is different is selected. Then, for each set of the medical record data, the test data at the first year of the test is extracted from each medical record data constituting the set as a characteristic amount representing the health condition of the user, and is used as training data.
  • the risk score of the onset of the plurality of diseases as a complication or complication is calculated as correct data.
  • the onset risk score is calculated such that a shorter user has a larger value than a longer elapsed time until the onset.
  • the training data is input to the learning device, and the learning device performs learning so that the output becomes the correct answer data, thereby generating a learned prediction model.
  • a prediction model that takes into account the onset pattern of the plurality of diseases, that is, the order of onset, and the elapsed time until onset. it can.
  • the test data of the prediction target user is input to the learned prediction model, and the prediction result data including the onset risk score output from the prediction model is output. I have. For this reason, it is possible to predict the risk of complications or complications of a plurality of diseases in the future of the user based on the current test data of the user.
  • the above embodiment may be modified as follows. That is, for example, among the acquired usage data, a set of users who have developed one disease of interest and elapsed time until the onset is different, or a user who has not developed the disease, and the time during which tracking cannot be performed. It is not possible to track the set of users who have different elapsed times, or the users who are affected and those who are not affected, and the elapsed time until the onset of the affected user and the users who are not affected Any one or more sets of users whose elapsed time is different from the elapsed time extended until the time after is selected as learning target data.
  • the error of the risk score calculated based on the score output from the prediction model based on the elapsed time and the elapsed time until the onset of the user or the elapsed time after the time until the tracking becomes impossible is minimized. May learn the model. As described above, by assuming that an unaffected user has developed after the time when the tracking observation becomes impossible, the user is subjected to learning, thereby improving the accuracy by increasing the number of subjects.
  • a state transition prediction device having both a function of learning a prediction model and a function of predicting an onset risk score that predicts an onset risk score using the learned prediction model.
  • a learning device including only a learning function unit of a prediction model and a prediction device including only a prediction function unit of an onset risk score may be configured as separate devices.
  • the present invention in the medical health field, an example has been described in which, based on test data representing the current health condition of a user, a risk of developing multiple complications or complications in the future is predicted.
  • the present invention is not limited to this, and can be applied to other fields as long as the state transition can be observed.
  • transportation equipment such as vehicles, aircraft, ships, etc.
  • manufacturing equipment, power equipment, office equipment, medical equipment, power equipment, etc. the order of failures varies widely, if there are multiple places where there is a possibility of failure.
  • the present invention can also be applied to a case where it is desired to represent the likelihood of occurrence of a failure from a state of a device at a point in time using a uniform score irrespective of the order of failure.
  • the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying its constituent elements in an implementation stage without departing from the scope of the invention.
  • Various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the above embodiments. For example, some components may be deleted from all the components shown in the embodiment. Further, components of different embodiments may be appropriately combined.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

この発明の一実施形態は、医療記録データから着目する各疾病の発症順序が共通でかつ各疾病が発症するまでの時間が異なる医療記録データの組を選択し、この医療記録データの組ごとに当該組を構成する各医療記録データからユーザの健康状態を表す特徴量を抽出してこれを訓練データとし、検査初年時の検査データと上記各疾病が発症するまでの時間とから当該各疾病が併発又は合併症として発症するリスクスコアを算出してこれを正解データとする。このとき発症リスクスコアは、発症までの経過時間が長いユーザより短いユーザの方が大きな値となるように計算される。そして、上記訓練データを学習器に入力してその出力が上記正解データとなるように学習器に学習を行わせ、予測モデルを生成する。

Description

状態遷移予測装置、予測モデル学習装置、方法およびプログラム
 この発明は、例えば、医療健康分野においてユーザの現在の健康状態をもとに将来の疾病の発症リスクを予測するために使用される、状態遷移予測装置、予測モデル学習装置、方法およびプログラムに関する。
 個人の健康状態を表す情報をもとに将来の疾病の発症リスクスコアを算出する手法の一つとして、単一の疾病を対象としたスコア関数を構築し、適用する手法が提案されている。例えば、代謝系分野においては、糖尿病や高血圧症を区別し、それぞれの疾患について発症リスクスコアを算出するようにしている(例えば非特許文献1を参照)。
 発症リスクスコアを算出するための関数設計において、将来の状態遷移方向が単一である場合は、遷移するまでの期間を一軸の早い・遅いという観点で比較可能であり、その一軸での評価が正しくなるように関数のモデル選択とパラメータを設定できればよい。すなわち、個別の疾患に対する発症・進行リスク関数は、当該疾患の遷移が発生するまでの期間に沿って構築される。
Nanri A, et al. "Development of Risk Score for Predicting 3-Year Incidence of Type 2 Diabetes: Japan Epidemiology Collaboration on Occupational Health Study.", PLoS One. 2015 Nov 11;10(11):e0142779. doi: 10.1371/journal.pone.0142779. eCollection 2015.
 ところで、生活習慣病は、食生活や運動習慣、睡眠、飲酒などの生活習慣が発症や進行に大きく関与する疾患群であり、糖尿病や高血圧症、新生物などがこれに含まれる。生活習慣病の疾患は併発することが知られている。例えば、糖尿病の患者が高血圧症を発症する確率が高いことが知られている。また、生活習慣病の一つである糖尿病の合併症は、腎症や網膜症、神経障害など多岐にわたることも知られている。
 しかし、非特許文献1に記載されるように、疾患ごとにスコア関数を構築して疾患の発症リスクのスコアを算出する技術では、発症・進行リスク関数が一つの疾患の遷移が生じるまでの期間に沿って構築されているため、併発や合併する疾患に関して統一的なリスクスコアを算出することができない。例えば、糖尿病患者に発症する合併症は腎症や網膜症、神経障害など多岐にわたるが、腎症の患者と網膜症の患者とで糖尿病の進行度合いを比較できるようなリスクスコアを算出することが困難である。
 この発明は上記事情に着目してなされたもので、将来の状態遷移のパターンが複数存在する場合でも、状態遷移が発生する傾向の大きさを表すスコアを状態遷移のパターンに依らず統一的な値として算出することが可能な技術を提供しようとするものである。
 上記課題を解決するためにこの発明に係る状態遷移予測装置および方法の第1の態様は、ユーザの健康状態が、第1の状態から第1の症状が発症して第2の状態に遷移し、さらに、第2の状態から第2の症状が発症して第3の状態に遷移する場合に、前記第1の状態に係る特徴量と、前記第1の状態から第2の状態になるまでの経過時間、および前記第1の状態から第3の状態になるまでの経過時間とを含む特徴データを取得する特徴データ取得部と、取得された前記特徴データの中から、第1の特徴データの第1の症状と第2の特徴データの第1の症状が同じであり、第1の特徴データの第2の症状と第2の特徴データの第2の症状が同じで、かつ状態遷移の経過時間が異なる第1および第2の特徴データを選択する選択部と、前記第1および第2の特徴データにそれぞれ含まれる前記第1の状態に係る特徴量を訓練データとすると共に、当該各特徴量をもとにそれぞれ算出されかつ前記第1および第2の特徴データにそれぞれ含まれる前記経過時間が反映されたスコアを正解データとして、前記学習器を学習させることで、予測モデルを生成する予測モデル生成部とを具備するものである。
 この発明の第1の態様によれば、ユーザの健康状態が、第1の状態から第1の症状が発症して第2の状態に遷移し、さらに、第2の状態から第2の症状が発症して第3の状態に遷移する場合に、その状態遷移のパターンと状態遷移が発生するまでの経過時間が考慮されて予測モデルが作成される。従って、将来の状態遷移のパターンが複数存在する場合でも、状態遷移が発生する傾向の大きさを状態遷移パターンに依らず統一的に表すスコアとして算出することが可能な予測モデルを作成することができる。
図1は、この発明の一実施形態に係る状態遷移予測装置の機能構成を示すブロック図である。 図2は、図1に示した状態遷移予測装置による学習フェーズの処理手順と処理内容を示すフローチャートである。 図3は、図1に示した状態遷移予測装置による予測フェーズの処理手順と処理内容を示すフローチャートである。 図4は、医療記録データの一例を示す図である。 図5は、ユーザ別の発症に至るまでの期間と正解データの一例を示す図である。 図6は、図2に示した学習フェーズにおける予測モデル学習処理の一例を示す図である。 図7は、図3に示した予測フェーズにおける状態遷移予測処理の一例を示す図である。
 以下、図面を参照してこの発明に係わる実施形態を説明する。
 [一実施形態]
 この発明の一実施形態では、医療健康分野において、ユーザの現在の健康状態を表す検査データをもとに、将来における複数の疾病の併発又は合併症の発症リスクを予測する場合を例にとって説明する。
 (構成例)
 図1は、この発明の一実施形態に係る状態遷移予測装置の機能構成を示すブロック図である。 
 状態遷移予測装置1は、例えばサーバコンピュータ又はパーソナルコンピュータからなり、ネットワーク3を介して、電子医療記録(Electronic Medical Records:EMR)サーバ2およびアクセス端末4との間で通信が可能となっている。
 EMRサーバ2は、例えば病院や医院、診療所等の医療機関ごとに設けられ、患者ごとにその診療データや検査データ、問診データ等を含む医療記録データを蓄積管理する。なお、EMRサーバ2の代わりに、地域内の複数の医療機関で共有されるように設けられる電子健康記録(Electronic Health Records:EHR)サーバや、個人健康記録(Personal Health Records:PHR)データを記憶するユーザ端末であってもよい。
 アクセス端末4は、例えば、医師や看護師、保健師等の医療保健関係者が使用する端末、保険会社等のユーザの許可を受けた第三者が使用する端末、或いはユーザ自身が使用する端末であり、例えばパーソナルコンピュータ、タブレット型端末またはスマートフォンからなる。
 ネットワーク3は、例えば、インターネット等の公衆網と、この公衆網にアクセスするためのアクセス網を含む。アクセス網としては、例えば院内のLAN(Local Area Network)または無線LANが用いられるが、他に有線電話網、CATV(Cable Television)網、携帯電話網または公衆無線LAN等を使用することも可能である。
 状態遷移予測装置1は、例えば、医療機関に設けられるもので、例えばサーバコンピュータにより構成される。なお、状態遷移予測装置1は、それ単独で設置されてもよいが、医師端末や、EMRサーバ、EHRサーバ、さらにはクラウドサーバに、その拡張機能の1つとして設けられるものであってもよい。
 状態遷移予測装置1は、ハードウェアとソフトウェアとにより実現される。ハードウェアは、制御ユニット10に対し、図示しないバスを介して記憶ユニット20およびインタフェースユニット30を接続したものとなっている。
 インタフェースユニット30は、ネットワーク3を介して、EMRサーバ2およびアクセス端末4との間でデータ伝送を行う。またインタフェースユニット30は、LANや信号ケーブルを介して接続される管理端末との間でデータ伝送を行う機能を有していてもよい。
 記憶ユニット20は、記憶媒体として、例えば、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等の随時書込みおよび読出しが可能な不揮発性メモリと、ROM(Read Only Memory)等の不揮発性メモリと、RAM(Random Access Memory)等の揮発性メモリとを組み合わせて構成される。その記憶領域には、プログラム記憶領域と、データ記憶領域とが設けられる。プログラム記憶領域には、この発明の一実施形態に係る各種制御処理を実行するために必要なプログラムが格納されている。
 データ記憶領域には、医療記録データ記憶部21と、学習対象データ記憶部22と、予測モデル記憶部23とが設けられている。医療記録データ記憶部21は、上記EMRサーバ2等から取得された複数のユーザの医療記録データを記憶するために用いられる。学習対象データ記憶部22は、上記医療記録データ記憶部21に記憶された複数のユーザの医療記録データの中から選択された、学習対象のデータを記憶するために使用される。予測モデル記憶部23は、学習済の予測モデルを記憶するために使用される。
 制御ユニット10は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサを備え、この発明の一実施形態を実現するための制御機能部として、医療記録データ取得部11と、学習対象データ選択部12と、訓練データ抽出・正解データ算出部13と、予測モデル学習部14と、評価データ取得部15と、発症リスクスコア予測処理部16と、予測データ出力部17とを有している。これらの制御機能部は、いずれも上記プログラム記憶領域に格納されたプログラムを上記ハードウェアプロセッサに実行させることにより実現される。
 医療記録データ取得部11は、学習フェーズにおいて、上記EMRサーバ2から複数のユーザの医療記録データを、ネットワーク3およびインタフェースユニット30を介して取得し、この医療記録データを上記ユーザの個人識別情報(ユーザID)と関連付けて医療記録データ記憶部21に記憶させる処理を行う。
 学習対象データ選択部12は、併発または合併症として発症する可能性がある複数の疾病、例えば糖尿病と高血圧症に着目して学習対象データを選択する処理を行う。なお、上記着目する複数の疾病の種類は、糖尿病と高血圧症に限定されるものではなく、腎症や網膜症などのその他の疾病であってもよい。上記学習対象とする疾病の種類は、例えば状態遷移予測装置1の運用管理者により事前に指定される。
 学習対象データ選択部12は、上記医療記録データ記憶部21に記憶された複数のユーザの医療記録データの中から、先ず上記着目する複数の疾病の発症履歴があるか又は当該各疾病の発症を追跡観察中の医療記録データを選択する。そして、上記着目する各疾病の発症順序が共通で、かつ当該各疾病が発症するまでの経過時間が異なる医療記録データの組を複数選択し、選択した上記医療記録データの各組を学習対象データとして学習対象データ記憶部22に記憶させる。
 訓練データ抽出・正解データ算出部13は、上記学習対象データ記憶部22に記憶された医療記録データの組ごとに、当該組を構成する各医療記録データから、ユーザの健康状態を表す特徴量として、それぞれ検査初年時の検査データに含まれる所定の検査項目のバイタルデータを抽出し、この検査データを訓練データとする。例えば、検査初年時の、血糖値を示すHbA1cと、収縮期血圧BPと、ボディマス指数(Body Mass Index:BMI)を抽出する。
 また訓練データ抽出・正解データ算出部13は、上記組を構成する各医療記録データの各々について、上記ユーザの健康状態を表す特徴量、つまり検査初年時の検査データに含まれる所定の検査項目のバイタルデータと、上記着目する複数の疾病が発症するまでの経過時間とをもとに、当該複数の疾病が併発または合併症として発症するリスクスコアを算出する。このとき発症リスクスコアは、発症までの経過時間が長いユーザより、短いユーザの方が大きな値となるように計算される。なお、疾病がまだ発症しておらず追跡観察中の医療記録データについては、追跡観察不能になるまでの期間の長さを上記経過時間として発症リスクスコアを算出する。そして、訓練データ抽出・正解データ算出部13は、上記算出された発症リスクスコアを正解データとする。
 予測モデル学習部14は、例えば多層ニューラルネットワークから構成される学習器を用い、この学習器に上記訓練データ抽出・正解データ算出部13により抽出された訓練データを入力し、このとき学習器から出力されるスコアと上記訓練データ抽出・正解データ算出部13により算出された正解データとの誤差が最小化するように、学習器の学習パラメータを調整する。そして、最終的に得られた学習パラメータが反映された予測モデルを学習済の予測モデルとして予測モデル記憶部23に記憶させる。なお、予測モデル学習部14における学習処理の具体例は後述する。
 評価データ取得部15は、予測フェーズにおいて、例えばアクセス端末4からの要求に応じ、上記EMRサーバ2またはアクセス端末4から、予測対象となるユーザの検査データ、例えばHbA1c、収縮期血圧およびBMIを、評価データとして取得する処理を行う。なお、この場合、ユーザの医療記録データを取得して、この医療記録データから必要な検査データを評価データとして抽出するようにしてもよい。
 発症リスクスコア予測処理部16は、予測モデル記憶部23に記憶された学習済の予測モデルに対し、上記評価データ取得部15により取得された評価データを入力し、上記予測モデルから出力される発症リスクスコアを予測データ出力部17に渡す処理を行う。なお、発症リスクスコア予測処理部16は、学習済の予測モデルから出力された発症リスクスコアを、ユーザIDと関連付けて記憶ユニット20内の予測データ記憶部(図示省略)に保存するようにしてもよい。
 予測データ出力部17は、上記発症リスクスコア予測処理部16から渡された発症リスクスコアを含む予測結果通知データを生成し、インタフェースユニット30から要求元のアクセス端末4に向け送信する処理を行う。
 (動作例)
 次に、以上のように構成された状態遷移予測装置1の動作例を説明する。
 (1)学習フェーズ
 学習フェーズが設定されると、状態遷移予測装置1は以下のように予測モデルの学習処理を実行する。
 図2は、状態遷移予測装置1の制御ユニット10による学習フェーズの処理手順と処理内容の一例を示すフローチャートである。
 (1-1)医療記録データの取得
 制御ユニット10は、先ずステップS10において、医療記録データ取得部11の制御の下、インタフェースユニット30を介してEMRサーバ2に対しアクセスし、EMRサーバ2から複数のユーザに係る医療記録データをそれぞれダウンロードする。そして、この医療記録データをユーザIDと関連付けて医療記録データ記憶部21に記憶させる。なお、EMRサーバ以外にEHRサーバからさらに多くの医療記録データを取得するようにしてもよい。
 また、上記医療記録情報の取得に際し、医療記録データ取得部11はEMRサーバ2等で管理されているすべてのユーザの医療記録データを取得してもよいが、例えば学習対象として事前に指定された複数の疾病、例えば糖尿病と高血圧症の発症履歴のあるユーザの医療記録データのみを検索し、取得するようにしてもよい。このようにすると、医療記録データ記憶部21の記憶容量の削減と、後述する学習対象データ選択処理に係る処理負荷を軽減することが可能となる。その他、例えば学習対象としてユーザの性別や年齢層、居住地域、職種等のユーザ属性が指定された場合には、これらのユーザ属性に該当するユーザの医療記録データのみを取得するようにしてもよい。
 (1-2)学習対象データの選択
 ユーザの医療記録データの取得が終了すると、制御ユニット10は次にステップS11において、学習対象データ選択部12の制御の下で、以下のように学習対象となる医療記録データを選択する処理を実行する。
 すなわち、学習対象データ選択部12は、先ず医療記録データ記憶部21から、学習対象として事前に指定された複数の疾病の発症履歴があるか又は当該複数の疾病の発症を追跡観察中のユーザに係る医療記録データを選択する。例えば、学習対象として糖尿病と高血圧症との併発または合併症が指定されている場合には、糖尿病および高血圧症の発症履歴があるか、または糖尿病および高血圧症について追跡観察中のユーザに係る医療記録データを選択する。
 図4は、以上の処理により選択された、糖尿病および高血圧症の発症履歴があるか、又は当該各疾病について追跡観察中のユーザA~Eに係る医療記録データの一例を示す。この例では、ユーザ名に対し、検査期間と、糖尿病発症までの経過時間と、高血圧症発症までの経過時間と、検査初年のHbA1cと、検査初年の収縮期血圧(BP)と、検査初年のBMIを関連付けたものを示している。
 学習対象データ選択部12は、続いて、上記選択された医療記録データの中から、学習対象となる複数の疾病、例えば糖尿病と高血圧症の発症パターン(例えば発症順序)が共通で、かつこれらの疾病が発症するまでの経過時間が異なる医療記録データの組をすべて選択する。
 ただし、疾病がまだ発症していないユーザについては、追跡観察不能になった時点、つまり検査期間経過後の任意の時点で発症したと仮定するとともに、発症までの経過時間を同様の時点までと仮定する。ここで任意の時点は、例えば、検査実施の翌日や検査期間以降の次の検査が予定されていた日(翌年の検査予定日や最後の検査日の1年後)、検査期間以降で最後に病院を受診した日の翌日に設定される。
 例えば、図4に示した医療記録データを例にとると、ユーザAは糖尿病の発症後に高血圧症を発症しており、この発症パターンと同じ発症パターンを有するユーザとしてDおよびEが選択される。ただし、ユーザDは6年目の健康診断受診後の7年目に高血圧が発症、ユーザEは3年目の健康診断受診後の4年目に高血圧が発症したとみなして選択する。つまり、ユーザAとユーザDの組と、ユーザAとユーザEの組が学習対象として選択される。
 また、ユーザCは高血圧症の発症後に糖尿病を発症しており、この発症パターンと同じ発症パターンを有するユーザとしてBが選択される。ただしユーザBは、6年目の健康診断受診後の7年目に糖尿病が発症したとみなして選択する。つまり、ユーザBとユーザCの組が学習対象として選択される。そして学習対象データ選択部12は、上記選択された医療記録データの各組を学習対象データ記憶部22に記憶させる。
 このように2つの症状のうち、後半の症状について、発症の場合と未発症の場合の両方を選択の対象としているが、全ての症状を発症しているユーザ、未発症の症状を含むユーザのどちらかに限定して選択してもよい。また選択する医療記録データの組は医療記録データの中から、学習対象となる複数の疾病、例えば糖尿病と高血圧症の発症パターン(例えば発症順序)が共通で、かつこれらの疾病が発症するまでの経過時間が異なり、さらにあるユーザの高血圧(または糖尿病)発症までの経過時間と糖尿病(または高血圧)発症までの経過時間が、他方のユーザの高血圧(または糖尿病)発症までの経過時間と糖尿病(または高血圧)発症までの経過時間より両方とも小さい医療記録データの組をすべて選択してもよく、未発症の症状を含むユーザについては追跡観察が不能になった以降の任意の時点で発症したと仮定するとともに、発症までの経過時間を同様の時点までとして、同様の条件を適用して選択してよい。
 (1-3)訓練データの抽出と正解データの算出
 上記学習対象データの選択が終了すると、制御ユニット10は訓練データ抽出・正解データ算出部13の制御の下、先ずステップS12において、学習対象データ記憶部22から各学習対象データを読み出し、これらの学習対象データからそれぞれユーザの健康状態を表す特徴量として、検査初年度の検査データである、HbA1c、収縮期血圧およびBMIを抽出する。なお、ユーザの健康状態を表す特徴量としては、検体検査や生理検査など、スコア算出に寄与しうる項目で量的に表せる値であれば他のものでも良い。
 この結果、例えばユーザBの医療記録データからは、HbA1c“5.2”、収縮期血圧“130”およびBMI“28”が抽出され、またユーザCの医療記録データからは、HbA1c“5.6”、収縮期血圧“137”およびBMI“31”が抽出される。そして、この抽出されたユーザの検査データが訓練データとして使用される。
 また訓練データ抽出・正解データ算出部13は、続いてステップS13において、上記学習対象データ記憶部22に学習対象データとして記憶されている医療記録データの各組について、組を構成する医療記録データごとに、検査初年時の検査データである、HbA1c、収縮期血圧およびBMIと、糖尿病が発症するまでの経過時間および高血圧症が発症するまでの経過時間とに基づいて、合併症の発症リスクスコアを算出する。
 但し、このとき発症リスクスコアは、発症までの経過時間が長いユーザのスコアより、発症までの経過時間が短いユーザのスコアの方が大きな値となるように計算される。なお、疾病がまだ発症しておらず追跡観察中のユーザについては、追跡観察不能になるまでの時間の長さを上記経過時間としてスコアを算出する。そして、訓練データ抽出・正解データ算出部13は、上記算出された発症リスクスコアを正解データとする。
 図5は、図4に示した各ユーザA~Eの糖尿病および高血圧症の発症までの期間を棒グラフで図示し、さらに併発又は合併症を考慮した発症リスクスコアの正解データの一例を示したものである。この例では、上記学習対象データ選択部12において、ユーザBとユーザCの組と、ユーザAとユーザDの組と、ユーザAとユーザEの組が学習対象として選択されているので、これらの組についてそれぞれの医療記録データからスコアが算出される。
 例えば、ユーザBとユーザCの組では、発症までの経過時間がユーザBよりユーザCの方が短いので、ユーザBのスコアZB よりユーザCのスコアZC の方が大きな値となるように、つまりZB <ZC となるように計算される。また、ユーザAとユーザDの組では、発症までの経過時間がユーザDよりユーザAの方が短いので、ユーザDのスコアZD よりユーザAのスコアZの方が大きな値となるように、つまりZA >ZD となるように計算される。同様に、ユーザAとユーザEの組では、ユーザEは糖尿病を3年目に発症し、高血圧症が3年の健診期間において未発症なので、ユーザEのスコアZE よりユーザAのスコアZの方が大きな値となるように、つまりZA >ZE となるように計算される。
 (1-4)予測モデルの学習
 制御ユニット10は、次に予測モデル学習部14の制御の下、ステップS14において予測モデルの学習処理を実行する。 
 図6は予測モデルの学習に使用する学習器の構成の一例を示したもので、学習器としては例えば多層ニューラルネットワークが用いられる。多層ニューラルネットワークは、例えば、入力層IL1,IL2、中間層ML1,ML2および出力層OL1,OL2の3層から構成される。このうち入力層IL1,IL2および中間層ML1,ML2は、全結合層とBatch Normalizationと活性化関数ReLUとから構成され、出力層OL1,OL2は全結合層により構成される。
 予測モデル学習部14は、上記訓練データ抽出・正解データ算出部13により、組を構成するユーザの各医療記録データからそれぞれ抽出された検査初年度の検査データを、訓練データとして上記入力層IL1,IL2に入力する。例えば、いまユーザBとユーザCの組を例にとると、ユーザBの検査初年度の検査データであるHbA1c“5.2”、収縮期血圧“130”およびBMI“28”と、ユーザCの検査初年度の検査データであるHbA1c“5.6”、収縮期血圧“137”およびBMI“31”を、学習器の2系統の入力層IL1,IL2に入力する。
 予測モデル学習部14は、学習器の出力層OL1,OL2から出力された、ユーザBの検査初年度の検査データに対応するスコアと、ユーザCの検査初年度の検査データに対応するスコアとの差分をSigmoid関数の計算部SLに入力する。そして、その出力値と、上記訓練データ抽出・正解データ算出部13により算出されたユーザBとユーザCの正解データZB <ZC の関係から得られる正解値“1”との交差エントロピーを算出して誤差とする。そして、最適化法のAdamにより誤差を最小化する。
 すなわち、学習器の入力層IL1,IL2には検査データの3次元ベクトルが入力され、出力層OL1,OL2からは1次元ベクトルからなるスコアが出力される。つまり、学習器の入力層のユニットサイズは“3”、出力層のユニットサイズは“1”となる。また、中間層のユニットサイズは“64”とする。なお、パラメータはこれに限るものではなく、ユニットサイズはスコアの算出に用いる項目数や項目間の関係性に応じて適宜変更可能である。
 予測モデル学習部14は、上記学習対象データ記憶部22に記憶されたすべての学習対象データの組について、上記したユーザBとユーザCの場合と同様に学習器に検査初年度の検査データを訓練データとして入力し、かつ学習器の出力の差分のSigmoid関数値と、正解データの関係から得られる正解値との交差エントロピーの誤差を算出して、この誤差を最小化するための最適化処理を行う。そして、すべての学習対象データによる学習処理が終了したことをステップS15で検出すると、その時点の学習パラメータが反映された予測モデルを学習済の予測モデルとして予測モデル記憶部23に記憶させ、予測モデルの学習処理を終了する。
 なお、図5では参考のため、糖尿病および高血圧症について個々に正解データを算出した場合も示している。すなわち、各ユーザの初年度の検診データから算出される糖尿病のリスクスコアをX、高血圧症のリスクスコアをYとしたとき、糖尿病はX>XB、XA>XC、XA>XD、XA>XE、XB<XC、XB<XD、XC>XD、高血圧症はYA>YB、YA>YD、YA>YE、YB>YD、YC>YD、YC>YEという大小関係を満たす正解データを設定する。そして、これらの正解データを用いて学習器に学習を行わせると、それぞれ糖尿病用の予測モデルと高血圧症用の予測モデルを生成することができ、これらの予測モデルを使用することでそれぞれ糖尿病単独および高血圧症単独の発症リスクを予測することも可能となる。
 (2)予測フェーズ
 予測フェーズが設定されると、状態遷移予測装置1はユーザの将来における複数の疾病の併発または合併症の発症リスクを予測する処理を以下のように実行する。 
 図3は、状態遷移予測装置1の制御ユニット10による予測処理の手順と処理内容の一例を示すフローチャートである。
 (2-1)評価データの取得
 状態遷移予測装置1に対し予測対象ユーザの検査データが入力されると、制御ユニット10は評価データ取得部15の制御の下、ステップS20において上記検査データをインタフェースユニット30を介して評価データとして取り込む。上記検査データとしては、例えば予測対象ユーザの現在の健康状態の特徴量を表すバイタルデータである、HbA1c、収縮期血圧およびBMIが入力される。なお、上記予測対象ユーザの検査データの入力処理は、例えば医師等の医療従事者の端末、ユーザ端末或いは保険会社の端末から行われる。
 (2-2)発症リスクスコアの予測
 状態遷移予測装置1の制御ユニット10は、上記評価データの取り込みが終了すると、発症リスクスコア予測処理部16の制御の下、以下のように発症リスクスコアの予測処理を実行する。図7はその処理内容を示す図である。
 すなわち、発症リスクスコア予測処理部16は、予測モデル記憶部23に記憶されている学習済の予測モデルを読み出す。そして、ステップS21において、上記取得された評価データ、例えばHbA1c、収縮期血圧およびBMIを、上記学習済の予測モデルの入力層ILに入力する。そうすると、学習済の予測モデルでは、上記HbA1c、収縮期血圧およびBMIからなる3次元ベクトルを入力として、入力層ILおよび中間層MLにより予測スコアの演算が行われ、出力層OLから1次元ベクトルにより表される発症リスクスコアが出力される。
 (2-3)予測データの出力
 制御ユニット10は、予測データ出力部17の制御の下、ステップS22において、上記学習済の予測モデルから出力された発症リスクスコアを含む予測結果通知データを生成する。予測結果通知データには、発症リスクスコアをそのまま含めてもよいが、発症リスクスコアをしきい値により判定した発症リスクの度合いを含めるようにしてもよく、また発症リスクの度合いに応じたアドバイスメッセージ等を含めるようにしてもよい。
 予測データ出力部17は、上記予測結果通知データをインタフェースユニット30から要求元の医療従事者端末、ユーザ端末或いは保険会社の端末へ送信する。なお、送信方法は、端末のブラウザにより閲覧可能な形態で送信するものであってもよく、また電子メールに添付する形態で送信するものであってもよい。
 (効果)
 以上述べたように、この発明の一実施形態では、学習フェーズにおいて、併発または合併症として発症する可能性がある複数の疾病の発症履歴があるかまたは当該各疾病の発症を追跡観察中の医療記録データから、着目する各疾病の発症順序が共通で、かつ当該各疾病が発症するまでの経過時間が異なる医療記録データの組を選択する。そして、この医療記録データの組ごとに、当該組を構成する各医療記録データから、ユーザの健康状態を表す特徴量として検査初年時の検査データを抽出しこれを訓練データとする。また、上記検査初年時の検査データと上記複数の疾病が発症するまでの経過時間とから、当該複数の疾病が併発または合併症として発症するリスクスコアを算出して、これを正解データとする。このとき発症リスクスコアは、発症までの経過時間が長いユーザより短いユーザの方が大きな値となるように計算される。そして、上記訓練データを学習器に入力してその出力が上記正解データとなるように学習器に学習を行わせ、学習済の予測モデルを生成するようにしている。
 従って、複数の疾病を併発または合併症として発症する可能性がある場合に、上記複数の疾病の発症パターン、つまり発症順序と、発症するまでの経過時間が考慮された予測モデルを生成することができる。
 またこの発明の一実施形態では、予測フェーズにおいて、予測対象ユーザの検査データを上記学習済の予測モデルに入力し、予測モデルから出力される発症リスクスコアを含む予測結果データを出力するようにしている。このため、ユーザの現在の検査データをもとに、当該ユーザの将来における複数の疾病の併発または合併症の発症リスクを予測することが可能となる。
 [他の実施形態]
 前記一実施形態を以下のとおり変更してもよい。すなわち、例えば取得した利用データのうち、着目している1つの疾病を発症しており、かつ発症までの経過時間が異なるユーザの組、または発症していないユーザであり、追跡が不能となる時間以降まで延長した経過時間が異なるユーザの組、または発症しているユーザと発症していないユーザであり、かつ発症しているユーザの発症までの経過時間と、発症していないユーザの追跡が不能となる時間以降まで延長した経過時間とが異なるユーザの組、のいずれか1つ以上の組を学習対象データとして選択する。次に訓練データの抽出と正解データの算出において、着目している1つの疾病を発症するまでの経過時間が短い方が大きくなるように定義された発症リスクスコアについて、未発症の状態の特徴量をもとに予測モデルが出力するスコアと、ユーザが発症するまでの経過時間または追跡が不能となるまでの時間以降まで延長した経過時間をもとに算出したリスクスコアの誤差を最小とするようにモデルを学習させてもよい。 
 このように未発症のユーザを追跡観察が不能となる時間以降に発症したと仮定して学習の対象とすることで、対象数増大による精度向上効果がある。
 また、前記一実施形態では、予測モデルの学習機能部と、学習された予測モデルを使用して発症リスクスコアを予測する発症リスクスコアの予測機能部との両方の機能を備えた状態遷移予測装置を例にとって説明した。しかし、この発明は、予測モデルの学習機能部のみを備えた学習装置と、発症リスクスコアの予測機能部のみを備えた予測装置とを別々の装置として構成するようにしてもよい。
 さらに、前記一実施形態では、医療健康分野において、ユーザの現在の健康状態を表す検査データをもとに、将来における複数の疾病の併発又は合併症の発症リスクを予測する場合を例にとって説明した。しかし、この発明はそれに限定されるものではなく、状態遷移の観測が可能なものであれば他の分野にも適用可能である。例えば、車両や航空機、船舶などの運輸機器、製造機器、動力機器、オフィス機器、医療機器、電力機器等において、故障する可能性がある箇所が複数あるものを対象に、故障の順序が多岐にわたるものであっても、一時点における機器の状態から故障の発生のし易さを故障順序に無関係な一律のスコアで表したい場合にも、この発明は適用可能である。
 要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
 1…状態遷移予測装置
 2…EMRサーバ
 3…ネットワーク
 4…アクセス端末
 10…制御ユニット
 11…医療記録データ取得部
 12…学習対象データ選択部
 13…訓練データ抽出・正解データ算出部
 14…予測モデル学習部
 15…評価データ取得部
 16…発症リスクスコア予測処理部
 17…予測データ出力部
 20…記憶ユニット
 21…医療記録データ記憶部
 22…学習対象データ記憶部
 23…予測モデル記憶部
 30…インタフェースユニット

Claims (10)

  1.  ユーザの健康状態が、第1の状態から第1の症状が発症して第2の状態に遷移し、さらに、第2の状態から第2の症状が発症して第3の状態に遷移する場合に、前記第1の状態に係る特徴量と、前記第1の状態から第2の状態になるまでの経過時間、および前記第1の状態から第3の状態になるまでの経過時間とを含む特徴データを取得する特徴データ取得部と、
     取得された前記特徴データの中から、第1の特徴データの第1の症状と第2の特徴データの第1の症状が同じであり、第1の特徴データの第2の症状と第2の特徴データの第2の症状が同じで、かつ状態遷移の経過時間が異なる第1および第2の特徴データを選択する選択部と、
     前記第1および第2の特徴データにそれぞれ含まれる前記第1の状態に係る特徴量を訓練データとすると共に、当該各特徴量をもとにそれぞれ算出されかつ前記第1および第2の特徴データにそれぞれ含まれる前記経過時間が反映された予測スコアを正解データとして学習器を学習させ、予測モデルを生成する予測モデル生成部と
     を具備する状態遷移予測装置。
  2.  予測対象となるユーザの健康状態を表す第1の状態に係る特徴量を取得して、当該特徴量を評価データとして前記予測モデルに入力し、この入力に応じて前記予測モデルから出力される予測スコアを、前記予測対象となる前記ユーザの健康状態の将来の状態遷移の予測結果を表す情報として出力する予測部を、さらに具備する請求項1に記載の状態遷移予測装置。
  3.  前記特徴データは、前記第1の状態が第2又は第3の状態に遷移していない場合には、当該状態遷移の追跡が不能となる時間の長さを前記経過時間として含む、請求項1に記載の状態遷移予測装置。
  4.  コンピュータを備える状態遷移予測装置が実行する状態予測方法であって、
     ユーザの健康状態が、第1の状態から第1の症状が発症して第2の状態に遷移し、さらに、第2の状態から第2の症状が発症して第3の状態に遷移する場合に、前記第1の状態に係る特徴量と、前記第1の状態から第2の状態になるまでの経過時間、および前記第1の状態から第3の状態になるまでの経過時間とを含む特徴データを取得する過程と、
     取得された前記特徴データの中から、第1の特徴データの第1の症状と第2の特徴データの第1の症状が同じであり、第1の特徴データの第2の症状と第2の特徴データの第2の症状が同じで、かつ状態遷移の経過時間が異なる第1および第2の特徴データを選択する過程と、
     前記第1および第2の特徴データにそれぞれ含まれる前記第1の状態に係る特徴量を訓練データとすると共に、当該各特徴量をもとにそれぞれ算出されかつ前記第1および第2の特徴データにそれぞれ含まれる前記経過時間が反映された予測スコアを正解データとして学習器を学習させ、予測モデルを生成する過程と
     を具備する状態遷移予測方法。
  5.  予測対象となるユーザの健康状態を表す第1の状態に係る特徴量を取得して、当該特徴量を評価データとして前記予測モデルに入力し、この入力に応じて前記予測モデルから出力されるスコアを、前記予測対象となる前記ユーザの健康状態の将来の状態遷移の予測結果を表す情報として出力する過程を、さらに具備する請求項4に記載の状態遷移予測方法。
  6.  複数のユーザの健康状態に関する特徴データをそれぞれ取得する特徴データ取得部と、
     取得された前記特徴データの中から、前記健康状態の遷移パターンが所定の関連性を有する第1および第2の特徴データを選択する選択部と、
     選択された前記第1および第2の特徴データを入力とし症状の発症リスクを表すスコアを出力とする予測モデルの学習を行う学習部と
     を具備し、
     前記特徴データ取得部は、
      前記健康状態が第1の状態から第1の症状が発症して第2の状態に遷移し、さらに、当該第2の状態から第2の症状が発症して第3の状態に遷移した場合に、前記第1の状態に係る特徴量、前記第1の状態から前記第2の状態に遷移するまでの第1経過時間、および前記第1の状態から前記第3の状態に遷移するまでの第2経過時間を含む第1のタイプの特徴データ、
     および前記健康状態が前記第2の状態から前記第3の状態に遷移しない場合に、前記第2の症状が状態遷移の追跡が不能となる時間以降に発症し前記第3の状態に遷移するものと仮定し、前記第1の状態に係る特徴量と、前記第2経過時間を前記追跡が不能となる時間以降まで延長した第3経過時間を含む第2のタイプの特徴データ、
     の少なくとも一方を取得し、
     前記選択部は、
      複数の前記第1のタイプの特徴データの中の、前記第1の症状同士および前記第2の症状同士が何れも同一であり、かつ前記第1経過時間および第2経過時間の少なくとも一方が異なり、かつ片方の前記第1経過時間と前記第2経過時間が他方の前記第1経過時間と前記第2経過時間より共に小さい特徴データの組、
      複数の前記第2のタイプの特徴データの中の、前記第1の症状同士および前記第2の症状同士が何れも同一であり、かつ前記第1経過時間と前記第3経過時間の少なくとも一方が異なり、かつ片方の前記第1経過時間と前記第3経過時間が他方の前記第1経過時間と前記第3経過時間より共に小さい特徴データの組、
      および前記第1のタイプの特徴データと前記第2のタイプの特徴データの中の、前記第1の症状同士および前記第2の症状同士がいずれも同一で、かつ前記第1経過時間または前記第2経過時間と前記第3経過時間の少なくとも一方が異なり、かつ前記第1のタイプの特徴データの前記第1経過時間と前記第2経過時間が前記第2のタイプの特徴データの前記第1経過時間と前記第3経過時間に対して共に小さいかまたは大きい特徴データの組、
     の少なくとも1つ以上の組を、前記第1および第2の特徴データとして選択し、
     前記学習部は、
      選択された前記第1および第2の特徴データにそれぞれ含まれる前記第1の状態に係る特徴量の組の入力に対し前記予測モデルが出力する第1および第2のスコアと、前記第1および第2の特徴データの各特徴量と前記第1および第2の特徴データにそれぞれ含まれる前記第1経過時間、第2経過時間または第3経過時間とをもとに算出される第1および第2のリスクスコアとの間の誤差を最小とするように、前記予測モデルを学習させる、
     予測モデル学習装置。
  7.  複数のユーザの健康状態に関する特徴データをそれぞれ取得する特徴データ取得部と、取得された前記特徴データの中から、前記健康状態の遷移パターンが所定の関連性を有する第1および第2の特徴データを選択する選択部と、選択された前記第1および第2の特徴データを入力とし症状の発症リスクを表すスコアを出力とする予測モデルの学習を行う学習部とを具備する学習装置が実行する予測モデル学習方法であって、
     前記特徴データ取得部が、
      前記健康状態が第1の状態から第1の症状が発症して第2の状態に遷移し、さらに、当該第2の状態から第2の症状が発症して第3の状態に遷移した場合に、前記第1の状態に係る特徴量、前記第1の状態から前記第2の状態に遷移するまでの第1経過時間、および前記第1の状態から前記第3の状態に遷移するまでの第2経過時間を含む第1のタイプの特徴データ、
      および前記健康状態が前記第2の状態から前記第3の状態に遷移しない場合に、前記第2の症状が状態遷移の追跡が不能となる時間以降に発症し前記第3の状態に遷移するものと仮定し、前記第1の状態に係る特徴量と、前記第2経過時間を前記追跡が不能となる時間以降まで延長した第3経過時間を含む第2のタイプの特徴データ、
     の少なくとも一方を取得し、
     前記選択部が、
      複数の前記第1のタイプの特徴データの中の、前記第1の症状同士および前記第2の症状同士が何れも同一であり、かつ前記第1経過時間および第2経過時間の少なくとも一方が異なり、かつ片方の前記第1経過時間と前記第2経過時間が他方の前記第1経過時間と前記第2経過時間より共に小さい特徴データの組、
      複数の前記第2のタイプの特徴データの中の、前記第1の症状同士および前記第2の症状同士が何れも同一であり、かつ前記第1経過時間と前記第3経過時間の少なくとも一方が異なり、かつ片方の前記第1経過時間と前記第3経過時間が他方の前記第1経過時間と前記第3経過時間より共に小さい特徴データの組、
      および前記第1のタイプの特徴データと前記第2のタイプの特徴データの中の、前記第1の症状同士および前記第2の症状同士がいずれも同一で、かつ前記第1経過時間または前記第2経過時間と前記第3経過時間の少なくとも一方が異なり、かつ前記第1のタイプの特徴データの前記第1経過時間と前記第2経過時間が前記第2のタイプの特徴データの前記第1経過時間と前記第3経過時間に対して共に小さいかまたは大きい特徴データの組、
     の少なくとも1つ以上の組を、前記第1および第2の特徴データとして選択し、
     前記学習部が、
      選択された前記第1および第2の特徴データにそれぞれ含まれる前記第1の状態に係る特徴量の組の入力に対し前記予測モデルが出力する第1および第2のスコアと、前記第1および第2の特徴データの各特徴量と前記第1および第2の特徴データにそれぞれ含まれる前記第1経過時間、第2経過時間または第3経過時間とをもとに算出される第1および第2のリスクスコアとの間の誤差を最小とするように、前記予測モデルを学習させる、
     予測モデル学習方法。
  8.  請求項1乃至3のいずれかに記載の状態遷移予測装置が具備する前記各部の処理を、前記状態遷移予測装置が備えるプロセッサに実行させるプログラム。
  9.  請求項6に記載の予測モデル学習装置が備える前記各部の処理を、前記予測モデル学習装置が備えるプロセッサに実行させるプログラム。
  10.  複数のユーザの健康状態に関する特徴データをそれぞれ取得する特徴データ取得部と、
     取得された前記特徴データの中から、前記健康状態の遷移パターンが所定の関連性を有する第1および第2の特徴データを選択する選択部と、
     選択された前記第1および第2の特徴データを入力とし症状の発症リスクを表すスコアを出力とする予測モデルの学習を行う学習部と
     を具備し、
     前記特徴データ取得部は、
      前記健康状態が第1の状態から第1の症状が発症して第2の状態に遷移した場合に、前記第1の状態に係る特徴量、前記第1の状態から前記第2の状態に遷移するまでの第1経過時間を含む第1のタイプの特徴データ、
      および前記健康状態が前記第1の状態から前記第2の状態に遷移しない場合に、前記第1症状が状態遷移の追跡が不能となる時刻以降に発症し第2の状態に遷移するものと仮定し、前記第1の状態に係る特徴量と、前記第1経過時間を前記追跡が不能となる時間以降まで延長した第4経過時間を含む第2のタイプの特徴データ、
     の少なくとも一方を取得し、
     前記選択部は、
      複数の前記第2のタイプの特徴データの中の、前記第1の症状同士が同一であり、かつ前記第4経過時間が異なる特徴データの組、
      および前記第1のタイプの特徴データと前記第2のタイプの特徴データの中の、前記第1の症状が同一であり、かつ前記第1経過時間と前記第4経過時間が異なる特徴データの組、
     の少なくとも1つ以上の組を、前記第1および第2の特徴データとして選択し、
     前記学習部は、
      選択された前記第1および第2の特徴データにそれぞれ含まれる前記第1の状態に係る特徴量の組の入力に対し前記予測モデルが出力する第1のスコアと、前記第1および第2の特徴データの各特徴量と前記第1および第2の特徴データにそれぞれ含まれる前記第1または第4経過時間をもとに算出される第1のリスクスコアとの間の誤差を最小とするように、前記予測モデルを学習させる、
     予測モデル学習装置。
PCT/JP2019/032900 2018-08-31 2019-08-22 状態遷移予測装置、予測モデル学習装置、方法およびプログラム WO2020045245A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/271,177 US20210257067A1 (en) 2018-08-31 2019-08-22 State transition prediction device, and device, method, and program for learning predictive model
JP2020539396A JP7107375B2 (ja) 2018-08-31 2019-08-22 状態遷移予測装置、予測モデル学習装置、方法およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018163515 2018-08-31
JP2018-163515 2018-08-31

Publications (1)

Publication Number Publication Date
WO2020045245A1 true WO2020045245A1 (ja) 2020-03-05

Family

ID=69642943

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/032900 WO2020045245A1 (ja) 2018-08-31 2019-08-22 状態遷移予測装置、予測モデル学習装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US20210257067A1 (ja)
JP (1) JP7107375B2 (ja)
WO (1) WO2020045245A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220111889A (ko) * 2021-02-03 2022-08-10 김종명 심프텀의 히스토리 추적을 통한 희귀 질병 예측 시스템
JP7408605B2 (ja) 2021-08-19 2024-01-05 Lineヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP7430295B2 (ja) 2021-12-14 2024-02-09 之江実験室 個体慢性疾患進行リスク可視化評価方法及びシステム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11768945B2 (en) * 2020-04-07 2023-09-26 Allstate Insurance Company Machine learning system for determining a security vulnerability in computer software

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015132903A1 (ja) * 2014-03-05 2015-09-11 株式会社日立製作所 医療データ分析システム、医療データ分析方法及び記憶媒体
JP2017027307A (ja) * 2015-07-21 2017-02-02 Kddi株式会社 医療データ解析装置
JP2017117469A (ja) * 2015-12-22 2017-06-29 国立研究開発法人理化学研究所 リスク評価方法、リスク評価装置及びリスク評価プログラム
JP2018067266A (ja) * 2016-10-21 2018-04-26 富士レビオ株式会社 疾病の発症リスク又は再発リスクを予測するためのプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015132903A1 (ja) * 2014-03-05 2015-09-11 株式会社日立製作所 医療データ分析システム、医療データ分析方法及び記憶媒体
JP2017027307A (ja) * 2015-07-21 2017-02-02 Kddi株式会社 医療データ解析装置
JP2017117469A (ja) * 2015-12-22 2017-06-29 国立研究開発法人理化学研究所 リスク評価方法、リスク評価装置及びリスク評価プログラム
JP2018067266A (ja) * 2016-10-21 2018-04-26 富士レビオ株式会社 疾病の発症リスク又は再発リスクを予測するためのプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220111889A (ko) * 2021-02-03 2022-08-10 김종명 심프텀의 히스토리 추적을 통한 희귀 질병 예측 시스템
KR102501629B1 (ko) * 2021-02-03 2023-02-17 김종명 심프텀의 히스토리 추적을 통한 희귀 질병 예측 시스템
JP7408605B2 (ja) 2021-08-19 2024-01-05 Lineヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP7430295B2 (ja) 2021-12-14 2024-02-09 之江実験室 個体慢性疾患進行リスク可視化評価方法及びシステム

Also Published As

Publication number Publication date
US20210257067A1 (en) 2021-08-19
JP7107375B2 (ja) 2022-07-27
JPWO2020045245A1 (ja) 2021-08-10

Similar Documents

Publication Publication Date Title
Beam et al. Big data and machine learning in health care
WO2020045245A1 (ja) 状態遷移予測装置、予測モデル学習装置、方法およびプログラム
Chen et al. OMDP: An ontology-based model for diagnosis and treatment of diabetes patients in remote healthcare systems
US9147041B2 (en) Clinical dashboard user interface system and method
Hannan et al. Predictors of readmission for complications of coronary artery bypass graft surgery
CA2884613C (en) Clinical dashboard user interface system and method
Guterman et al. Association between caregiver depression and emergency department use among patients with dementia
US20210294946A1 (en) Selecting and applying digital twin models
Baker et al. Continuous and automatic mortality risk prediction using vital signs in the intensive care unit: a hybrid neural network approach
JP2020537232A (ja) 全母集団から任意に選択された部分母集団内の被験者における非健康状態のリスク、発生又は進行を予測する医療装置及びコンピュータ実装方法
Srivastava et al. Role of AI techniques and deep learning in analyzing the critical health conditions
Kadi et al. Systematic mapping study of data mining–based empirical studies in cardiology
Pičulin et al. Disease progression of hypertrophic cardiomyopathy: modeling using machine learning
Anderson et al. Perceived symptoms as the primary indicators for 30-day heart failure readmission
Macias et al. Utilizing big data from electronic health records in pediatric clinical care
Herrgårdh et al. Digital twins and hybrid modelling for simulation of physiological variables and stroke risk
CN113436738A (zh) 管理风险用户的方法、装置、设备及存储介质
Awasthi et al. AI and IoT-based intelligent health care & sanitation
Krumholz et al. Evaluating readmission—need for more clarity on methods
Harrington et al. Risk stratification science goes to a new level
Rafiei et al. Meta-learning in healthcare: A survey
Fingert Penetrance of Myocilin mutations—who gets Glaucoma?
Selby et al. Building predictive models for clinical care—where to build and what to predict?
Singla et al. Developing clinical decision support system using machine learning methods for type 2 diabetes drug management
Brandl et al. Developing an eMental health monitoring module for older mourners using fuzzy cognitive maps

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19854808

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020539396

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19854808

Country of ref document: EP

Kind code of ref document: A1