WO2020044824A1 - 介入内容推定装置、方法およびプログラム - Google Patents

介入内容推定装置、方法およびプログラム Download PDF

Info

Publication number
WO2020044824A1
WO2020044824A1 PCT/JP2019/027913 JP2019027913W WO2020044824A1 WO 2020044824 A1 WO2020044824 A1 WO 2020044824A1 JP 2019027913 W JP2019027913 W JP 2019027913W WO 2020044824 A1 WO2020044824 A1 WO 2020044824A1
Authority
WO
WIPO (PCT)
Prior art keywords
health condition
user
target value
target
intervention content
Prior art date
Application number
PCT/JP2019/027913
Other languages
English (en)
French (fr)
Inventor
央 倉沢
正造 東
直樹 麻野間
昭宏 千葉
佳那 江口
籔内 勉
吉田 和広
山田 智広
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/271,295 priority Critical patent/US20210343412A1/en
Publication of WO2020044824A1 publication Critical patent/WO2020044824A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Definitions

  • the present invention relates to an apparatus, a method, and a program for estimating a target value of a health state for bringing a human health state closer to an ideal health state, for example.
  • Lifestyle-related diseases are a group of diseases in which lifestyle habits such as eating habits, exercise habits, sleep, and drinking are greatly involved in onset and progression, and include diabetes and cancer. It is known that active intervention in patients who are not ill or in the early stage of the onset is effective in preventing the onset and progression of lifestyle-related diseases.
  • interventions in eating habits include restriction of the amount of calorie intake, designation of the order of eating, and restriction of meal time.
  • intervention in exercise habits include designation of the amount of exercise, designation of exercise time, and designation of exercise items such as swimming and jogging.
  • Sleep interventions include designation of sleep duration, bedtime, and wake-up time. Interventions in drinking include limiting the amount of drinking and the interval of drinking.
  • the conventionally proposed intervention method simply sets a target value derived from an ideal health condition. This does not take into account a person's current health status, and therefore has limited effect on adherence, which indicates the status of compliance with behavioral changes and interventions.
  • the present invention has been made with a focus on the above circumstances, and the purpose is to provide a more effective health target value as an intervention content in order to bring a human health state closer to an ideal health state. It is an object of the present invention to provide a technique which can be estimated.
  • a first aspect of the present invention provides, for each user, a target value of a health condition determined based on a current health condition and a preset ideal health condition in the future;
  • a first acquisition unit for acquiring record information including a measurement value of the user's health condition after the presentation of the target value of the next health condition to be recommended, and record information acquired by the first acquisition unit Is input to the learning device as training data, and the learning model is trained such that the target value of the next health condition to be recommended next is output from the learning device as an evaluation result.
  • a learning unit for each user, a target value of a health condition determined based on a current health condition and a preset ideal health condition in the future;
  • a first acquisition unit for acquiring record information including a measurement value of the user's health condition after the presentation of the target value of the next health condition to be recommended, and record information acquired by the first acquisition unit Is input to the learning device as training data, and the learning model is trained such that the target value of the next health condition to be recommended next is output
  • the latest record information including the presented target value of the health condition and the measured value of the health condition after the presentation of the target value of the health condition is acquired.
  • a second acquisition unit and the latest record information acquired by the second acquisition unit are input to the intervention content estimation model as evaluation data, and the next output is output from the intervention content estimation model in response to the input.
  • an intervention content estimating unit that outputs information representing a target value of a health condition to be recommended as estimated data.
  • record information including the measurement value of the user's health condition is input as training data
  • information representing a target value of a health condition to be recommended next to the user can be output as an evaluation result.
  • An intervention content estimation model is generated. Therefore, instead of uniquely presenting a uniform target value, an intervention content capable of estimating a more effective health state target value to bring the user's health state closer to the ideal health state An estimation model can be provided.
  • the second aspect of the present invention by inputting record information including a target value of the most recent health condition and a measured value of the health condition after the presentation of the target value as evaluation data to the estimation model, this input content , Information representing the target value of the next health condition to be recommended is output as estimated data. For this reason, it is possible to present a more effective target value of the health state to the user in order to bring the user's health state closer to the ideal health state, thereby providing a uniform target value uniquely. In comparison with the above, a higher effect on adherence to behavioral change and intervention can be expected.
  • FIG. 1 is a block diagram showing a functional configuration of an intervention content estimation device according to an embodiment of the present invention.
  • FIG. 2 is a flowchart illustrating a processing procedure and processing contents of a learning phase by the intervention content estimation device illustrated in FIG. 1.
  • FIG. 3 is a flowchart illustrating a processing procedure and processing contents of an estimation phase performed by the intervention content estimation device illustrated in FIG. 1.
  • FIG. 4 is a diagram showing an example of training data used in the learning phase shown in FIG.
  • FIG. 5 is a diagram illustrating an example of the configuration of the intervention content estimation model.
  • FIG. 6 is a diagram illustrating an example of an estimation result obtained by the intervention content estimation device according to the embodiment of the present invention.
  • FIG. 7 is a diagram illustrating an example of a case where a target value of a conventional health condition is set uniformly.
  • One embodiment of the present invention is to measure the health status of the past multiple days and the health status presented to the user on the same multiple days in order to bring the user's health status closer to the ideal health status in the future. Then, an intervention content estimation model that outputs a target value of a health condition to be recommended next to the user and an expected value of achieving the target when the user inputs the target value is generated by deep reinforcement learning. Thereafter, using the intervention content estimation model, the target value of the next health condition to be recommended and the target achievement expectation value are output and presented to the user as the intervention content.
  • the number of steps and the amount of calorie intake can be considered as parameters indicating the health condition, but not limited thereto, and may be values of eating habits, exercise habits, sleep, drinking, and other habits, and values of sample tests and physiological tests. .
  • the contents of the intervention in addition to the number of steps and the amount of calorie intake, those related to eating habits, exercise habits, sleeping habits, and other lifestyle habits, and values related to sample tests and physiological tests can be applied.
  • FIG. 1 is a block diagram showing a functional configuration of an intervention content estimation device according to an embodiment of the present invention.
  • the intervention content estimation device 1 is composed of, for example, a server computer or a personal computer, and can communicate with a plurality of user terminals 2a to 2n via a network 3.
  • the user terminals 2a to 2n are owned by different users, and are, for example, smartphones, tablet terminals, or personal computers. Each of the user terminals 2a to 2n has, for example, a pedometer and a function of measuring the amount of calorie intake in its own terminal, or receives the number of steps and the amount of calorie intake measured by an external measuring device through communication means or manual input, and receives this. It has a function of storing as information indicating a user's health condition.
  • the user terminals 2a to 2n have a function of receiving the recommended target value of the health condition transmitted from the intervention content estimating apparatus 1 and displaying the target value to the user. Further, the user terminals 2a to 2n, for example, for each day, generate time-series data in which the date information is associated with the measurement value representing the health condition and the recommended target value of the health condition, and store this as record information. I do. Then, it has a function of reading out the time-series data in response to a transmission operation of the user or a transmission request from the intervention content estimating device 1, and transmitting the data to the intervention content estimating device 1.
  • Each of the functions provided in the user terminals 2a to 2n is realized by an application program installed in advance.
  • a wearable terminal having a pedometer, a calorie intake measurement function, and a communication function can also be used.
  • the network 3 includes, for example, a public network such as the Internet and an access network for accessing the public network.
  • a public network such as the Internet
  • an access network for example, a LAN (Local Area Network) or a wireless LAN is used.
  • a wired telephone network, a CATV (Cable Television) network, a mobile telephone network, or the like may be used.
  • the intervention content estimating apparatus 1 is operated by, for example, a medical institution, a health support center, a fitness club, or another health support service provider, and is configured by, for example, a server computer or a personal computer.
  • the intervention content estimating apparatus 1 may be installed alone, but may include a terminal of a medical worker such as a doctor, an electronic medical record (EMR) server installed for each medical institution, and a plurality of servers.
  • EMR electronic medical record
  • EHR Electronic Health Records
  • the user terminals 2a to 2n themselves may be provided as one of the extended functions.
  • the intervention content estimating apparatus 1 includes a control unit 10, a storage unit 20, and an interface unit 30.
  • the interface unit 30 performs data transmission with the user terminals 2a to 2n via the network 3. Further, the interface unit 30 may have a function of performing data transmission with a management terminal (not shown) connected via a LAN or a signal cable.
  • the storage unit 20 includes, as storage media, a nonvolatile memory such as a hard disk drive (HDD) or a solid state drive (SSD) that can be written and read at any time, and a nonvolatile memory such as a read only memory (ROM). , And a volatile memory such as a RAM (Random Access Memory).
  • the storage area is provided with a program storage area and a data storage area.
  • the program storage area stores programs required to execute various control processes according to the embodiment of the present invention.
  • the data storage area includes a training data storage unit 21, an estimation model storage unit 22, and an ideal target value storage unit 23.
  • the training data storage unit 21 is used to store time-series data for a plurality of days acquired from the user terminals 2a to 2n as training data in the learning phase.
  • the estimation model storage unit 22 is used to store the learned intervention content estimation model.
  • the ideal target value storage unit 23 stores an ideal target value in advance.
  • the control unit 10 includes, for example, a hardware processor such as a CPU (Central Processing Unit), and includes, as control functions for implementing an embodiment of the present invention, a training data acquisition unit 11, a training data selection unit 12, It has an estimation model learning unit 13, an evaluation data acquisition unit 14, an intervention content estimation unit 15, and an estimation data output unit 16.
  • a hardware processor such as a CPU (Central Processing Unit)
  • CPU Central Processing Unit
  • Each of these control function units is realized by causing the hardware processor to execute a program stored in the program storage area.
  • the training data obtaining unit 11 obtains time-series data for a plurality of past days of each user from the user terminals 2a to 2n as training data via the network 3 and the interface unit 30, and obtains the obtained training data. Is stored in the training data storage unit 21 in association with the personal identification information (user ID) of the user.
  • the training data selection unit 12 sequentially selects training data for a plurality of days stored in the training data storage unit 21 in units of three days while shifting the date by one day, for example, and provides the training data to the estimation model learning unit 13. I do.
  • the estimation model learning unit 13 uses, for example, deep reinforcement learning to input, for each user, training data including a measured value representing the past three days' health state and a recommended health state target value, The target achievement expected value calculated from the success rate of bringing the current health state closer to the target value corresponding to the ideal health state stored in the ideal target value storage unit 23, that is, the final goal (ideal target value) is achieved.
  • the target value of the next recommended health condition and its value taking into account the probability that it is possible, the continuity to maintain a health condition close to the ideal health condition, the aging of the health condition and the history of intervention so far,
  • the learning device is made to perform learning so that the goal achievement expected value is output as the estimation data of the intervention content.
  • the learned intervention content estimation model is stored in the estimation model storage unit 22.
  • the learning device for example, a multilayer neural network is used. A specific example of the learning process performed by the estimation model learning unit 13 will be described later.
  • the evaluation data acquiring unit 14 responds to the intervention content estimation request from each of the user terminals 2a to 2n and transmits the same measurement value as that transmitted from the user terminals 2a to 2n, for example, indicating the health state for the last three days.
  • a process of acquiring time-series data including a target value indicating a health condition recommended during the period via the network 3 and the interface unit 30 is performed.
  • the intervention content estimation unit 15 inputs the time-series data of the last three days acquired by the evaluation data acquisition unit 14 to the learned intervention content estimation model stored in the estimation model storage unit 22. The process of passing the target value of the recommended health condition to be used on the next day, output from the intervention content estimation model, to the estimation data output unit 16 as the intervention content estimation data is performed.
  • the intervention content estimating unit 15 may store the intervention content estimation data in an estimation data storage unit (not shown) in the storage unit 20 in association with the date of the next day and the user ID. .
  • the estimation data output unit 16 generates estimation result notification data including the recommended target value of the health condition passed from the intervention content estimation unit 15 and sends the data to the requesting user terminals 2a to 2n from the interface unit 30. Perform transmission processing.
  • FIG. 2 is a flowchart illustrating an example of a processing procedure and a processing content of a learning phase by the control unit 10 of the intervention content estimation device 1.
  • a recommended target value of a health condition sent from the intervention content estimating apparatus 1 is displayed on the display unit every day, and is associated with date information. Is stored in the storage unit. At the same time, the step value measured daily by, for example, a pedometer and the calorie intake manually input by the user are stored in the storage unit in association with the date information. Thus, the storage unit stores, for each date, the measured value of the number of steps and the amount of calorie intake indicating the health condition of the day, and the target of the number of steps and the amount of calorie intake indicating the recommended health condition sent from the intervention content estimation device 1. Time-series data including values are sequentially stored. The time-series data stored for each date serves as training data used when the intervention content estimation device 1 learns an estimation model.
  • FIG. 4 shows an example of time-series data (training data) stored in the storage units of the user terminals 2a to 2n.
  • the measured values of the number of steps and the amount of calorie intake representing the daily health status, and the recommended health status presented from the intervention content estimation device 1 Information that specifies any of ⁇ Target steps 6000 steps '', ⁇ Target steps 8000 steps '', ⁇ Target steps 10000 steps '', ⁇ Target calorie intake 3000kcal '', ⁇ Target calorie intake 2500kcal '' It is memorized.
  • a flag “1” is stored for the presented target
  • a flag “0” is stored for the other targets.
  • step S10 the control unit 10 accesses the user terminals 2a to 2n through the interface unit 30 under the control of the training data acquisition unit 11, thereby receiving, for example, eight days of time-series data. .
  • step S11 the time series data is stored in the training data storage unit 21 in association with the user ID.
  • the intervention content estimating apparatus 1 sends the daily step count and the calorie intake amount from the user terminals 2a to 2n. Get only the measured values. Then, the obtained measured values of the number of steps and the amount of calorie intake are associated with the flag information, which is stored in the estimated data storage unit and indicates the target value of the daily health condition recommended for the user, in association with the date. Thus, the training data may be obtained. Further, the time series data to be acquired may be any number of days as long as the data is for a plurality of days.
  • step S12 the control unit 10 of the intervention content estimating apparatus 1 controls the training data selecting unit 12 in step S12, For example, the time series data is read out from the training data storage unit 21 in units of three days while shifting the date by one day, and the time series data for three days is provided to the estimation model learning unit 13 as training data.
  • time-series data for eight days from June 1, 2018 to June 8, 2018 shown in FIG. 4 is acquired and stored in the training data storage unit 21, first of all, The time series data for three days from June 1 to June 3 is selected. Next, time series data for three days from June 2, 2018 to June 4, 2018 is selected, and then time series data for three days, from June 3, 2018 to June 5, 2018, are selected.
  • the training data is selected as the training data while sequentially shifting the date by one day.
  • training data is selected with three days as one unit in one learning process.
  • training data is selected with four days or more or two days as one unit. Is also good.
  • control unit 10 of the intervention content estimating device 1 executes a process of learning the intervention content estimation model as follows in step S13 under the control of the estimation model learning unit 13. I do.
  • the estimation model learning unit 13 generates an intervention content estimation model by, for example, deep reinforcement learning.
  • the appropriate content of the intervention that is, the target value of the health condition can be estimated based on the target achievement expected value by the deep reinforcement learning.
  • a discount rate By setting a parameter called a discount rate, the continuity of the intervention effect can be reflected.
  • the past intervention history can be reflected by setting the number of days to be input at a time as training data to a plurality of days.
  • the agent decides what action to select based on the observed state, and the environment updates the state according to the action. Then, a reward, that is, a success rate is determined based on the updated state.
  • the agent is the intervention content estimation device 1, and determines the target number of steps for the next day based on the user's health status for the last three days.
  • the reward is clipping to make learning easier. For example, +1 if the current health condition is more than 10,000 steps a day and less than 2500 kcal per day, which is the ideal health condition in the future, otherwise +1. -1.
  • the environment is a user, and a measured value of the number of steps on the day when the target number of steps is presented is registered.
  • the Q function is constructed by a multilayer neural network.
  • the multilayer neural network is composed of, for example, three fully connected layers as shown in FIG. Of these, the input layer IL and the intermediate layer ML are composed of a fully coupled layer, Batch @ Normalization and an activation function ReLU, and the output layer OL is composed of a fully coupled layer.
  • a six-dimensional vector is constituted by the number of steps for three days and the measured value of the calorie intake.
  • the flag value (“1” or “1” which is set for the five target values for one day, ie, the target step number of 6000 steps, the target step number of 8000 steps, the target step number of 10,000 steps, the target calorie intake of 3000 kcal, and the target calorie intake of 2500 kcal "0" are connected for three days to form a 15-dimensional vector.
  • a 21-dimensional vector is formed by connecting the 6-dimensional vector of the measured value of the health state and the 15-dimensional vector of the target value of the health state, and this is used as an input value to the input layer IL. That is, the unit size of the input layer IL is “21”.
  • the output of the output layer OL is a five-dimensional vector representing five target values and the expected value of achieving the target. That is, the unit size of the output layer is “5”. The unit size of the intermediate layer is “64”. Note that the parameter is not limited to this, and the unit size can be changed according to the reference period and the number of target options.
  • the reward discount rate (a parameter indicating continuity) is set to, for example, “0.9”.
  • the Q function is defined as a value obtained by adding a reward (success rate) to a value obtained by multiplying a correct answer at the time t by a discount rate as a coefficient of a target achievement expected value of the Q value. Then, the estimation model learning unit 13 learns the Q function so that the mean square error of the correct value is minimized.
  • the estimation model learning unit 13 temporarily stores the parameters obtained by the learning process in step S14. Then, in step S15, it is determined whether or not the learning process for all the time-series data stored in the training data storage unit 21 has been completed. If unselected time-series data remains, the process returns to step S12. The learning process in steps S12 to S14 is repeatedly executed. On the other hand, when the learning process for all the time-series data ends, the parameters of the Q function finally obtained are stored in the estimation model storage unit 22 as the intervention content estimation model, and the process ends.
  • FIG. 3 is a flowchart illustrating an example of a procedure and an operation content of an intervention content estimation process performed by the control unit 10 of the intervention content estimation device 1.
  • the user terminals 2 a to 2 n transmit the time-series data of the target user for the last three days to the intervention content estimation device 1.
  • the control unit 10 of the intervention content estimating device 1 under the control of the evaluation data acquiring unit 14, in step S 20, converts the time-series data transmitted from the user terminals 2 a to 2 n for the last three days into the interface unit. It is taken in as evaluation data via 30.
  • the time-series data includes, for example, as shown in FIG. 4, the number of steps and the calorie intake value indicating the user's health status in the last three days, and the intervention content estimating device 1 for the three days.
  • the target value of the number of steps or the calorie intake and the expected value of achieving the target are included.
  • the input of the measured values of the number of steps and the amount of calorie intake in the user terminals 2a to 2n is performed by transferring the measured values of the pedometer and the calorie meter to the user terminals 2a to 2n by communication or by the user. This is performed by manually inputting the values into the user terminals 2a to 2n.
  • the intervention content estimating unit 15 reads the learned estimation model stored in the estimation model storage unit 22. Then, in step S21, the acquired evaluation data, that is, the measured values of the number of steps and the amount of calorie intake for the last three days, the target number of steps or the amount of calorie intake presented in the past from the intervention content estimating apparatus 1, and Is input to the input layer IL of the learned estimation model as shown in FIG. Then, in the trained estimation model, the operation is performed by the input layer IL and the intermediate layer ML using the data of the 21-dimensional vector as input, and the recommended number of steps or ingestion represented by the 5-dimensional vector from the output layer OL. The target value of the calorie amount and the expected value of the target achievement are output as estimated data ED indicating the content of the intervention on the next day.
  • the acquired evaluation data that is, the measured values of the number of steps and the amount of calorie intake for the last three days, the target number of steps or the amount of calorie intake presented in the past from the intervention content estimating apparatus 1, and Is
  • the following two types of output methods of the intervention content estimation data can be considered.
  • One is to select the one with the highest expected value from among the five options: target steps 6000 steps, target steps 8000 steps, target steps 10,000 steps, target calorie intake 3000 kcal, target calorie intake 2500 kcal.
  • target steps 6000 steps target steps 8000 steps
  • target steps 10,000 steps target calorie intake 3000 kcal
  • target calorie intake 2500 kcal target calorie intake 2500 kcal.
  • the other is the top N items (for example, the top 2 items) in the descending order of the target achievement expected value from among the target step number of 6000 steps, the target step number of 8000 steps, the target step number of 10,000 steps, the target calorie intake of 3,000 kcal, and the target calorie intake of 2500 kcal. ) Is selected and used as estimated data ED.
  • the control unit 10 notifies the notification data including the estimated value output from the intervention content estimation unit 15 and indicating the intervention content of the next day, in step S22. Is generated, and the notification data is transmitted from the interface unit 30 to the requesting user terminals 2a to 2n.
  • the transmission method may be a method in which the user terminal can transmit from the intervention content estimating device 1 in a form that can be browsed by the browser function, or a method in which the user terminal attaches to the electronic mail.
  • the user terminals 2a to 2n Upon receiving the notification data transmitted from the intervention content estimating apparatus 1, the user terminals 2a to 2n display, on the display unit, information indicating the recommended steps or the target value of the calorie intake included in the notification data. At the same time, it is stored as a component of the time-series data in association with the corresponding date.
  • the notification data includes a plurality of top N candidate values (for example, the top two cases) with the highest expected target achievement value
  • the two candidate target values are displayed, Let the user choose the one he likes.
  • the user terminals 2a to 2n store the target value selected by the user as a component of the time-series data in association with the corresponding date.
  • the measured values and the target values of the health status for the past multiple days are sequentially input to the learning device composed of the multilayer neural network for three days. Let them learn.
  • the learning device includes a target achievement expected value determined from a success rate when the user's health state approaches the ideal health state, continuity for maintaining the health state close to the ideal health state, and health. Learning is performed so that the target value of the next recommended health condition and the expected value of achieving the target, which reflect the temporal change of the condition and the intervention history up to now, respectively, are output.
  • the measured value and the target value of the health state of the user for the last three days are input to the learned estimation model, and the recommended health state target value output from the estimation model at this time is input. Is transmitted to the corresponding user terminals 2a to 2n as intervention content estimation data and presented to the user.
  • the target value of the health state when presenting the target value of the health state to the user, based on the measured value of the health state on the most recent date of the user and the target value of the health state presented in advance corresponding to the date, The success rate when approaching the health state to the ideal health state, the continuity to maintain the health state close to the ideal health state, and the change over time of the health state and the history of intervention so far are reflected, The target value for the next health condition is output. For this reason, it is possible to steadily expect an effect toward an ideal health state, and to present an effective intervention content for maintaining a state close to the ideal health state. Furthermore, by considering the past three days' worth of intervention content, it is possible to present the intervention content that has a large effect by taking into account the daily target value and its effect on the target achievement expected value.
  • FIG. 6 shows an example of a change in the target value TW1 of the number of steps presented daily as one of the intervention contents according to an embodiment of the present invention.
  • FIG. 7 shows a conventional example in which the target value TW0 of the number of steps is set uniformly.
  • the target value of the number of steps is not set uniformly, but the target value of the number of steps for the next day is adaptively set according to the content of the user's latest intervention and the change in the number of steps after the intervention. This can increase the effect on adherence to behavioral changes and interventions.
  • the effect can be expected steadily toward the ideal health condition, and the intervention content that contributes to the improvement of lifestyle can be presented, so that, for example, rebound that occurs in a rapid diet can be avoided.
  • the contents of the intervention can be presented in such a manner that the correlation between the contents of the intervention is also taken into account so that the user feels less uncomfortable.
  • the user can execute an action for bringing the health state closer to the ideal without hesitation.
  • an output method for presenting a plurality of intervention contents having a higher goal achievement expectation value to the user it becomes possible for the user to select a desired intervention content.
  • the present invention is not limited to the above embodiment.
  • the case where the function as the intervention content estimation device is provided in the server on the network has been described as an example, but it may be provided as one of the extended functions in the user terminal. This increases the processing load on the user terminal, but has the advantage of reducing communication traffic and communication cost.
  • the functional configuration of the intervention estimating device, the procedure and contents of the learning process and the estimation process, the type of information representing the health condition, and the like can be variously modified without departing from the gist of the present invention.
  • the invention of the present application is not limited to the above-described embodiment, and can be variously modified in an implementation stage without departing from the gist of the invention.
  • the embodiments may be implemented in appropriate combinations as much as possible, in which case the combined effects can be obtained.
  • the above embodiments include inventions at various stages, and various inventions can be extracted by appropriate combinations of a plurality of disclosed constituent elements.
  • the hardware processor comprises: For each user, a target value of a health condition determined based on a current health condition and a preset ideal health condition in the future, and a health condition of the user after the presentation of the target value of the health condition.
  • a process of acquiring record information including the measured value By inputting the acquired record information to a learning device as training data, and learning the learning device so that information representing a target value of a health condition to be recommended next is output as an evaluation result from the learning device.
  • a process of generating an intervention content estimation model By inputting the acquired record information to a learning device as training data, and learning the learning device so that information representing a target value of a health condition to be recommended next is output as an evaluation result from the learning device.
  • the hardware processor comprises: For each of the users, a process of acquiring the latest record information including the presented target value of the health condition and the measured value of the user's health condition after the presentation of the target value of the health condition, The most recent record information obtained by the second obtaining unit is input as evaluation data to the intervention content estimation model, and the next recommended health condition output from the intervention content estimation model in response to this input. And an intervention process of outputting information representing a target value as estimation data.
  • (Appendix 3) Hardware processor, For each user, a target value of a health condition determined based on a current health condition and a preset ideal health condition in the future, and a health condition of the user after the presentation of the target value of the health condition.
  • a process of acquiring record information including the measured value By inputting the acquired record information to a learning device as training data, and learning the learning device so that information representing a target value of a health condition to be recommended next is output as an evaluation result from the learning device.
  • a process of generating an intervention content estimation model For each user, a target value of a health condition determined based on a current health condition and a preset ideal health condition in the future, and a health condition of the user after the presentation of the target value of the health condition.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Hospice & Palliative Care (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Molecular Biology (AREA)
  • Psychiatry (AREA)
  • Psychology (AREA)
  • Social Psychology (AREA)
  • Nutrition Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

この発明の一態様は、人の健康状態を理想的な健康状態へ近づけるために、より一層効果的な介入内容を推定できるようにすることを目的とし、学習フェーズにおいて、過去の複数日分の健康状態の計測値および目標値を多層ニューラルネットワークからなる学習器に順次入力して、ユーザの健康状態を理想的な健康状態に近づける際の成功率から求まる目標達成期待値と、上記理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴がそれぞれ反映された、次に推奨すべき健康状態の目標値およびその目標達成期待値が出力されるように学習させる。そして、推定フェーズにおいて、上記学習済の推定モデルに、ユーザの直近の3日間の健康状態の計測値および目標値を入力し、このとき推定モデルから出力される推奨すべき健康状態の目標値を、ユーザに提示する。

Description

介入内容推定装置、方法およびプログラム
 この発明は、例えば、人の健康状態を理想的な健康状態へ近づけるための健康状態の目標値を推定する装置、方法およびプログラムに関する。
 生活習慣病は、食生活や運動習慣、睡眠、飲酒などの生活習慣が発症や進行に大きく関与する疾患群であり、糖尿病やがんなどがこれに含まれる。生活習慣病の発症・進行予防には未病状態や発症初期の患者への積極的な介入が効果的なことが知られている。例えば、食生活への介入として、摂取カロリ量の制限や、食べる順序の指定、食事時間の制限が挙げられる。運動習慣への介入として、運動量の指定、運動時間の指定、水泳やジョギングなどの運動項目の指定が挙げられる。睡眠への介入として、睡眠時間長、就寝時間や起床時間の指定が挙げられる。飲酒への介入として、飲酒量や飲酒間隔の制限が挙げられる。
 そこで、従来では、理想的な健康状態から導かれる目標値を一意に設定し、この目標値を介入内容として提示する取り組みが提案されている。例えば、運動習慣への介入においては、1日1万歩といった画一的な目標を提示し、行動変容を促していた。また、生活習慣病発症後の治療においては、糖尿病治療ではHbA1c(NGSP)7%を血糖管理目標値として提示し、治療へのアドヒアランスを高めさせていた(例えば非特許文献1を参照)。
日本糖尿病学会、熊本宣言2013-あなたとあなたの大切な人のために Keep your A1c below 7%-、2013.インターネット<URL: http://www.jds.or.jp/common/fckeditor/editor/filemanager/connectors/php/transfer.php?file=/uid000025_6B756D616D6F746F323031332E706466>
 ところが、従来提案されている介入方法は、単に理想的な健康状態から導かれる目標値を一意に設定するものとなっている。このため、人の現在の健康状態を考慮していないことから、行動変容や介入に対する遵守の状況を表すアドヒアランスへの効果は限定的なものになる。
 この発明は上記事情に着目してなされたもので、その目的とするところは、人の健康状態を理想的な健康状態へ近づけるために、介入内容としてより一層効果的な健康状態の目標値を推定できるようにした技術を提供することにある。
 上記目的を達成するためにこの発明の第1の態様は、ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該次に推奨すべき健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する第1の取得部と、前記第1の取得部により取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値が評価結果として出力されるように前記学習器を学習させることで介入内容推定モデルを生成する推定モデル学習部とを具備するものである。
 また、この発明の第2の態様は、前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の健康状態の計測値とを含む直近のレコード情報を取得する第2の取得部と、前記第2の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する介入内容推定部をさらに具備するものである。
 この発明の第1の態様によれば、ユーザの現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を訓練データとして入力すると、前記ユーザに対し次に推奨すべき健康状態の目標値を表す情報が評価結果として出力することが可能な学習済の介入内容推定モデルが生成される。このため、画一的な目標値を一意に提示するのではなく、ユーザの健康状態を理想的な健康状態へ近づけるためにより一層効果的な健康状態の目標値を推定することが可能な介入内容推定モデルを提供することができる。
 この発明の第2の態様によれば、直近の健康状態の目標値と当該目標値の提示後の健康状態の計測値を含むレコード情報を推定モデルに評価データとして入力することで、この入力内容に応じて次に推奨すべき健康状態の目標値を表す情報が推定データとして出力される。このため、ユーザの健康状態を理想的な健康状態へ近づけるためにより一層効果的な健康状態の目標値をユーザに提示することが可能となり、これにより画一的な目標値を一意に提示する場合に比べ、行動変容や介入に対するアドヒアランスに対する高い効果を期待することができる。
図1は、この発明の一実施形態に係る介入内容推定装置の機能構成を示すブロック図である。 図2は、図1に示した介入内容推定装置による学習フェーズの処理手順と処理内容を示すフローチャートである。 図3は、図1に示した介入内容推定装置による推定フェーズの処理手順と処理内容を示すフローチャートである。 図4は、図2に示した学習フェーズにおいて使用される訓練データの一例を示す図である。 図5は、介入内容推定モデルの構成の一例を示す図である。 図6は、この発明の一実施形態に係る介入内容推定装置による推定結果の一例を示す図である。 図7は、従来の健康状態の目標値を画一的に設定する場合の例を示す図である。
 以下、図面を参照してこの発明に係わる実施形態を説明する。 
 [一実施形態]
 (構成例)
 この発明の一実施形態は、ユーザの健康状態を将来の理想的な健康状態へ近づけるために、過去の複数日分の健康状態の計測値と、同じ複数日においてユーザに対し提示された健康状態の目標値とを入力したときに、次にユーザに対し推奨すべき健康状態の目標値およびその目標達成期待値が出力されるような介入内容推定モデルを深層強化学習により生成する。そして、以後この介入内容推定モデルを用いて、次に推奨すべき健康状態の目標値およびその目標達成期待値を出力させ、これを介入内容としてユーザに対し提示するようにしたものである。
 なお、健康状態を示すパラメータとしては歩数や摂取カロリ量が考えられるが、それに限らず、食生活や運動習慣、睡眠、飲酒などの生活習慣や、検体検査や生理検査の値であってもよい。また、介入内容としても、歩数や摂取カロリ量の他に、食生活や運動習慣、睡眠、飲酒などの生活習慣や、検体検査や生理検査の値に関連するものを適用することができる。
 図1は、この発明の一実施形態に係る介入内容推定装置の機能構成を示すブロック図である。 
 介入内容推定装置1は、例えばサーバコンピュータ又はパーソナルコンピュータからなり、ネットワーク3を介して、複数のユーザ端末2a~2nとの間で通信が可能となっている。
 ユーザ端末2a~2nは、それぞれ異なるユーザが所有するもので、例えばスマートフォン、タブレット型端末或いはパーソナルコンピュータからなる。ユーザ端末2a~2nは、例えば自端末に歩数計および摂取カロリ量の計測機能を有するか、または外部の計測機器により計測された歩数および摂取カロリ量を通信手段または手入力により受け取って、これをユーザの健康状態を表す情報として記憶する機能を有する。
 またユーザ端末2a~2nは、介入内容推定装置1から送信された、推奨される健康状態の目標値を受信し、ユーザに対し表示する機能を有する。さらにユーザ端末2a~2nは、例えば日ごとに、その日付情報に健康状態を表す計測値と上記推奨された健康状態の目標値とを関連付けた時系列データを生成し、これをレコード情報として記憶する。そして、ユーザの送信操作または介入内容推定装置1からの送信要求に応じて上記時系列データを読み出し、上記介入内容推定装置1へ送信する機能を有する。
 ユーザ端末2a~2nが備える上記各機能は、いずれも事前にインストールされたアプリケーションプログラムにより実現される。なお、ユーザ端末2a~2nとしては、歩数計および摂取カロリ量計測機能と通信機能とを備えたウェアラブル端末を使用することも可能である。
 ネットワーク3は、例えば、インターネット等の公衆網と、この公衆網にアクセスするためのアクセス網とを含む。アクセス網としては、例えばLAN(Local Area Network)または無線LANが用いられるが、他に有線電話網、CATV(Cable Television)網、携帯電話網等を使用することも可能である。
 ところで、介入内容推定装置1は、例えば、医療機関、保健支援センタ、フィットネスクラブ、その他の健康支援サービス業者が運用するもので、例えばサーバコンピュータ又はパーソナルコンピュータにより構成される。なお、介入内容推定装置1は、それ単独で設置されてもよいが、医師等の医療従事者の端末や、医療機関ごとに設置されている電子医療記録(Electronic Medical Records:EMR)サーバ、複数の医療機関を含む地域ごとに設置される電子健康記録(Electronic Health Records:EHR)サーバ、さらにはサービス事業者のクラウドサーバ等に、その拡張機能の1つとして設けられるものであってもよく、さらにはユーザ端末2a~2n自体にその拡張機能の1つとして設けられてもよい。
 介入内容推定装置1は、制御ユニット10と、記憶ユニット20と、インタフェースユニット30とを備える。インタフェースユニット30は、ネットワーク3を介して、ユーザ端末2a~2nとの間でデータ伝送を行う。またインタフェースユニット30は、LANや信号ケーブルを介して接続される管理端末(図示省略)との間でデータ伝送を行う機能を有していてもよい。
 記憶ユニット20は、記憶媒体として、例えば、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等の随時書込みおよび読出しが可能な不揮発性メモリと、ROM(Read Only Memory)等の不揮発性メモリと、RAM(Random Access Memory)等の揮発性メモリとを組み合わせて構成される。その記憶領域には、プログラム記憶領域と、データ記憶領域とが設けられる。プログラム記憶領域には、この発明の一実施形態に係る各種制御処理を実行するために必要なプログラムが格納されている。
 データ記憶領域には、訓練データ記憶部21と、推定モデル記憶部22と、理想的目標値記憶部23とが設けられている。訓練データ記憶部21は、学習フェーズにおいて、上記ユーザ端末2a~2nから取得された複数日分の時系列データを、訓練データとして記憶するために用いられる。推定モデル記憶部22は、学習済の介入内容推定モデルを記憶するために用いられる。理想的目標値記憶部23には、理想的な目標値が予め記憶されている。
 制御ユニット10は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサを備え、この発明の一実施形態を実現するための制御機能として、訓練データ取得部11と、訓練データ選択部12と、推定モデル学習部13と、評価データ取得部14と、介入内容推定部15と、推定データ出力部16とを有している。これらの制御機能部は、いずれも上記プログラム記憶領域に格納されたプログラムを上記ハードウェアプロセッサに実行させることにより実現される。
 訓練データ取得部11は、学習フェーズにおいて、ユーザ端末2a~2nから各ユーザの過去の複数日分の時系列データを、ネットワーク3およびインタフェースユニット30を介して訓練データとして取得し、取得した訓練データをユーザの個人識別情報(ユーザID)と関連付けて訓練データ記憶部21に記憶させる処理を行う。
 訓練データ選択部12は、上記訓練データ記憶部21に記憶された複数日分の訓練データを、例えば1日ずつ日にちをずらしながら3日分単位で順次選択して推定モデル学習部13に与える処理を行う。
 推定モデル学習部13は、例えば深層強化学習を用い、ユーザごとに、上記過去の3日分の健康状態を表す計測値と推奨された健康状態の目標値とを含む訓練データを入力したとき、理想的目標値記憶部23に記憶された理想的な健康状態に対応する目標値に、現在の健康状態を近づける成功率から求まる目標達成期待値、つまり最終目標(理想的な目標値)が達成できる確率と、上記理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴とが考慮された、次に推奨すべき健康状態の目標値およびその目標達成期待値が介入内容の推定データとして出力されるように、学習器に学習を行わせる。そして、学習済の介入内容推定モデルを推定モデル記憶部22に記憶させる。学習器としては、例えば多層ニューラルネットワークが用いられる。なお、推定モデル学習部13による学習処理の具体例は後述する。
 評価データ取得部14は、推定フェーズにおいて、ユーザ端末2a~2nからの介入内容推定要求に応じ、当該ユーザ端末2a~2nから送信される、例えば直近の3日間の健康状態を示す計測値と同期間に推奨された健康状態を示す目標値とを含む時系列データを、ネットワーク3およびインタフェースユニット30を介して取得する処理を行う。
 介入内容推定部15は、推定モデル記憶部22に記憶された学習済の介入内容推定モデルに対し、上記評価データ取得部14により取得された直近の3日間の時系列データを入力し、このとき上記介入内容推定モデルから出力される、翌日に使用すべき推奨される健康状態の目標値を、介入内容の推定データとして推定データ出力部16に渡す処理を行う。なお、介入内容推定部15は、上記介入内容の推定データを、次の日の日付とユーザIDに対応付けて記憶ユニット20内の推定データ記憶部(図示省略)に保存するようにしてもよい。
 推定データ出力部16は、上記介入内容推定部15から渡された、推奨される健康状態の目標値を含む推定結果通知データを生成し、インタフェースユニット30から要求元のユーザ端末2a~2nに向け送信する処理を行う。
 (動作例)
 次に、以上のように構成された介入内容推定装置1の動作例を説明する。
 (1)学習フェーズ
 学習フェーズが設定されると、介入内容推定装置1は以下のように介入内容推定モデルの学習処理を実行する。 
 図2は、介入内容推定装置1の制御ユニット10による学習フェーズの処理手順と処理内容の一例を示すフローチャートである。
 (1-1)訓練データの取得
 各ユーザ端末2a~2nでは、毎日、介入内容推定装置1から送られる、推奨される健康状態の目標値が表示部に表示されるとともに、日付情報と関連付けられて記憶部に記憶される。またそれと共に、毎日、例えば歩数計により計測された歩数値と、ユーザが手入力した摂取カロリ量が、上記日付情報と関連付けられて記憶部に記憶される。かくして、記憶部には、日付ごとに、その日の健康状態を表す歩数および摂取カロリ量の計測値と、介入内容推定装置1から送られた推奨される健康状態を表す歩数および摂取カロリ量の目標値とからなる時系列データが順次記憶される。この日付ごとに記憶された時系列データは、介入内容推定装置1が推定モデルを学習する際に使用する訓練データとなる。
 図4は、ユーザ端末2a~2nの記憶部に記憶された、時系列データ(訓練データ)の一例を示すものである。この例では、2018年6月1日から6月8日までの期間における、日毎の健康状態を表す歩数および摂取カロリ量の計測値と、介入内容推定装置1から提示された推奨される健康状態を表す目標値として、「目標歩数6000歩」、「目標歩数8000歩」、「目標歩数10000歩」、「目標摂取カロリ量3000kcal」、「目標摂取カロリ量2500kcal」のいずれかを指定する情報が記憶される。ここでは、提示された目標に対しフラグ“1”が記憶され、その他にはフラグ“0”が記憶される例を示している。
 制御ユニット10は、先ずステップS10において、訓練データ取得部11の制御の下、インタフェースユニット30を介してユーザ端末2a~2nに対しアクセスし、これにより例えば8日分の時系列データをそれぞれ受信する。そして、この時系列データを、ステップS11において、ユーザIDと関連付けて訓練データ記憶部21に記憶させる。
 なお、介入内容推定装置1の記憶ユニット20に推定データ記憶部(図示省略)が設けられている場合には、介入内容推定装置1はユーザ端末2a~2nからは毎日の歩数と摂取カロリ量の計測値のみを取得する。そして、この取得した歩数と摂取カロリ量の計測値と、上記推定データ記憶部に記憶された、ユーザに対し推奨した日ごとの健康状態の目標値を表すフラグ情報とを、日付に関連付けて対応付けることにより訓練データを取得するようにしてもよい。また、取得する時系列データは複数日分であれば何日分であってもよい。
 (1-2)訓練データの選択
 ユーザごとに複数日分の時系列データが取得されると、介入内容推定装置1の制御ユニット10は、訓練データ選択部12の制御の下、ステップS12において、上記訓練データ記憶部21から、例えば1日ずつ日にちをずらしながら3日分を1単位として時系列データを読み出し、この3日分の時系列データを訓練データとして推定モデル学習部13に与える。
 例えば、図4に示した2018年6月1日から6月8日までの8日分の時系列データが取得されて訓練データ記憶部21に記憶されているとすれば、この中から先ず2018年6月1日から6月3日までの3日分の時系列データが選択される。次に2018年6月2日から6月4日までの3日分の時系列データが選択され、続いて2018年6月3日から6月5日までの3日分の時系列データが選択されるというように、順次日付を1日ずつシフトしながら、訓練データとして選択される。
 なお、ここでは一回の学習処理に3日分を1単位として訓練データを選択する場合を例にとって説明するが、4日分以上または2日分を1単位として訓練データを選択するようにしてもよい。
 (1-3)推定モデルの学習
 介入内容推定装置1の制御ユニット10は、次に推定モデル学習部13の制御の下、ステップS13において、以下のように介入内容推定モデルを学習させる処理を実行する。
 すなわち、推定モデル学習部13は、例えば、深層強化学習により介入内容推定モデルを生成する。深層強化学習により目標達成期待値をもとに適切な介入内容、つまり健康状態の目標値を推定できる。また、割引率と呼ばれるパラメータを設定することで、介入効果の継続性を反映できる。過去の介入履歴は、訓練データとして一度に入力する日数を複数日にすることで反映させることができる。
 深層強化学習では、例えばエージェントと環境の2つを設計する。エージェントは観測された状態をもとにどのような行動を選択するか決め、環境はその行動によって状態を更新する。そして、更新された状態に基づいて報酬、つまり成功率が決められる。本実施形態では、エージェントは介入内容推定装置1であり、ユーザの直近3日分の健康状態をもとに翌日の目標歩数を決める。報酬は、学習を進みやすくするためクリッピングを導入し、例えば現在の健康状態が将来の理想的な健康状態とした1日1万歩以上かつ摂取カロリ量2500kcal未満であれば+1、そうでなければ-1とする。環境はユーザであり、目標歩数が提示された日の歩数の計測値を登録する。
 Q関数は、多層ニューラルネットワークによる構築される。多層ニューラルネットワークは、例えば図5に示すように3層の全結合層により構成される。このうち入力層ILおよび中間層MLは、全結合層とBatch Normalizationと活性化関数ReLUとから構成され、出力層OLは全結合層により構成される。
 3日分の歩数と摂取カロリ量の計測値により6次元ベクトルが構成される。また、1日分の5つの目標値、つまり目標歩数6000歩、目標歩数8000歩、目標歩数10000歩、目標摂取カロリ量3000kcal、目標摂取カロリ量2500kcalに対し設定されたフラグ値(“1”または“0”)を3日分連結して、15次元ベクトルが構成される。そして、上記健康状態の計測値の6次元ベクトルと、上記健康状態の目標値の15次元ベクトルとを連結することで21次元ベクトルを構成して、これを入力層ILへの入力値とする。つまり、入力層ILのユニットサイズは「21」となる。
 出力層OLの出力は5つの目標値およびその目標達成期待値を表す5次元ベクトルとなる。つまり、出力層のユニットサイズは「5」となる。中間層のユニットサイズは「64」とする。なお、パラメータはこれに限るものではなく、ユニットサイズは参照期間や目標の選択肢の数に沿って変更可能である。
 報酬の割引率(継続性を表すパラメータ)は、例えば“0.9”に設定される。Q関数は、時刻tの正解を、Q値の目標達成期待値に割引率を係数としてかけ合わせた値に報酬(成功率)を足し合わせた値として定義される。そして、推定モデル学習部13は、上記正解値の平均二乗誤差が最小となるようにQ関数を学習する。
 推定モデル学習部13は、上記学習処理により得られたパラメータをステップS14により一時保存する。そして、ステップS15において、訓練データ記憶部21に記憶されたすべての時系列データに対する学習処理が終了したか否かを判定し、未選択の時系列データが残っている場合にはステップS12に戻ってステップS12~S14による学習処理を繰り返し実行する。これに対し、すべての時系列データに対する学習処理が終了すると、最終的に得られたQ関数のパラメータを介入内容推定モデルとして推定モデル記憶部22に記憶させ、処理を終了する。
 (2)推定フェーズ
 推定フェーズが設定されると、介入内容推定装置1は、ユーザごとに、推奨される健康状態の目標値およびその目標達成期待値を推定する処理を以下のように実行する。 
 図3は、介入内容推定装置1の制御ユニット10による介入内容推定処理の手順と処理内容の一例を示すフローチャートである。
 (2-1)評価データの取得
 ユーザ端末2a~2nは、対象ユーザの直近の3日間の時系列データを介入内容推定装置1へ送信する。これに対し介入内容推定装置1の制御ユニット10は、評価データ取得部14の制御の下、ステップS20において、上記ユーザ端末2a~2nから送信された直近の3日間の時系列データを、インタフェースユニット30を介して評価データとして取り込む。上記時系列データには、例えば図4に示したように、ユーザの直近の3日間における健康状態を示す歩数および摂取カロリ量の計測値と、上記3日間のために過去に介入内容推定装置1から提示された歩数または摂取カロリ量の目標値およびその目標達成期待値が含まれる。
 なお、上記ユーザ端末2a~2nにおける、歩数および摂取カロリ量の計測値の入力は、歩数計およびカロリ計の各計測値を通信によりユーザ端末2a~2nへ転送するか、またはユーザが上記各計測値を手操作によりユーザ端末2a~2nに入力することにより行われる。
 (2-2)介入内容の推定
 介入内容推定装置1の制御ユニット10は、上記評価データの取り込みが終了すると、続いて介入内容推定部15の制御の下、以下のように介入内容の推定処理を実行する。
 すなわち、介入内容推定部15は、推定モデル記憶部22に記憶されている学習済の推定モデルを読み出す。そして、ステップS21において、上記取得された評価データ、つまり直近の3日分の歩数および摂取カロリ量の計測値と、過去に介入内容推定装置1から提示された歩数または摂取カロリ量の目標値とから構成される21次元ベクトルのデータを、図5に示すように上記学習済の推定モデルの入力層ILに入力する。そうすると、学習済の推定モデルでは、上記21次元ベクトルのデータを入力として、入力層ILおよび中間層MLにより演算が行われ、出力層OLから5次元ベクトルにより表される、推奨すべき歩数または摂取カロリ量の目標値およびその目標達成期待値が、翌日の介入内容を示す推定データEDとして出力される。
 上記介入内容推定データの出力手法には、例えば次の2種類が考えられる。 
 1つは、目標歩数6000歩、目標歩数8000歩、目標歩数10000歩、目標摂取カロリ量3000kcal、目標摂取カロリ量2500kcalの5つの選択肢のうち、最も目標達成期待値の高いものを選択してこれを推定データEDとするものである。
 もう1つは、目標歩数6000歩、目標歩数8000歩、目標歩数10000歩、目標摂取カロリ量3000kcal、目標摂取カロリ量2500kcalの中から、目標達成期待値が高い順に上位N件(例えば上位2件)の目標値の候補を選択し、これを推定データEDとするものである。
 (2-3)推定データの出力
 制御ユニット10は、推定データ出力部16の制御の下、ステップS22において、上記介入内容推定部15から出力された翌日の介入内容を示す推定値を含む通知データを生成し、当該通知データをインタフェースユニット30から要求元のユーザ端末2a~2nへ送信する。なお、送信方法は、ユーザ端末がブラウザ機能により閲覧可能な形態で介入内容推定装置1から送信するものであってもよく、また電子メールに添付する形態で送信するものであってもよい。
 ユーザ端末2a~2nは、上記介入内容推定装置1から送信された通知データを受信すると、当該通知データに含まれる、推奨される歩数または摂取カロリ量の目標値を表す情報を、表示部に表示させるとともに、該当する日付に関連付けて時系列データの構成要素として記憶する。
 このとき、通知データに目標達成期待値が高い上位複数のN件(例えば上位2件)の目標値の候補が含まれている場合には、上記2件の目標値の候補をそれぞれ表示させ、ユーザに好きな方を選択させる。ユーザ端末2a~2nは、上記ユーザにより選択された目標値を該当する日付に関連付けて時系列データの構成要素として記憶する。
 (効果)
 以上詳述したようにこの発明の一実施形態では、学習フェーズにおいて、過去の複数日分の健康状態の計測値および目標値を、3日分ずつ多層ニューラルネットワークからなる学習器に順次入力して学習させる。このとき、学習器には、ユーザの健康状態を理想的な健康状態に近づける際の成功率から求まる目標達成期待値と、上記理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴がそれぞれ反映された、次に推奨すべき健康状態の目標値およびその目標達成期待値が出力されるように、学習を行わせる。そして、推定フェーズにおいて、上記学習済の推定モデルに、ユーザの直近の3日間の健康状態の計測値および目標値を入力し、このとき推定モデルから出力される推奨すべき健康状態の目標値を、介入内容推定データとして該当するユーザ端末2a~2nへ送信してユーザに提示するようにしている。
 従って、ユーザに対し健康状態の目標値を提示する際に、ユーザの直近の日付における健康状態の計測値と、当該日付に対応して事前に提示された健康状態の目標値とに基づいて、健康状態を理想とする健康状態に近づける際の成功率と、理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴とがそれぞれ反映された、次の健康状態の目標値が出力される。このため、理想的な健康状態に向けて着実に効果が期待され、かつ理想的な健康状態に近い状態を維持させる上で効果的な介入内容を提示するが可能となる。さらに、過去の3日分の介入内容が考慮されることで、日々の目標値とその目標達成期待値への影響が考慮されて効果が大きい介入内容を提示することが可能となる。
 図6は、この発明の一実施形態により介入内容の1つとして日替わりで提示される歩数の目標値TW1の変化例を示したものである。これに対し、図7は歩数の目標値TW0を画一的に設定する従来の例を示すものである。本実施形態では、歩数の目標値を画一的に設定するのではなく、ユーザの直近の介入内容とその介入後の歩数の変化に応じて翌日の歩数の目標値を適応的に設定することによって、行動変容や介入に対するアドヒアランスに対する効果を高めることができる。
 この結果一実施形態によれば、理想的な健康状態に向けて着実に効果が期待でき、生活習慣改善に寄与する介入内容を提示できることで、例えば急激なダイエットで起きるリバウンドを回避でき、さらには介入内容間の相関も考慮されてユーザにとって違和感が軽減されるように介入内容を提示することができる。
 さらに、目標達成期待値が最も高い介入内容を選択して提示することで、ユーザは迷うことなく健康状態を理想に近づけるための行動を実行することが可能となる。一方、目標達成期待値が上位の複数の介入内容をユーザに提示する出力手法を選択することで、ユーザに希望する介入内容を選択させることも可能となる。
 [他の実施形態]
 なお、この発明は上記実施形態に限定されるものではない。例えば、一実施形態では介入内容推定装置としての機能をネットワーク上にサーバに設けた場合を例にとって説明したが、ユーザ端末内にその拡張機能の1つとして設けるようにしてもよい。このようにすると、ユーザ端末の処理負荷が高くなるが、通信トラフィックおよび通信コストを低減できる利点がある。
 その他、介入推定装置の機能構成、学習処理および推定処理の手順と処理内容、健康状態を表す情報の種類等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。
 なお、本願発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。
 [付記]
 上記各実施形態の一部または全部は、特許請求の範囲のほか以下の付記に示すように記載することも可能であるが、これに限られない。
 (付記1)
 ハードウェアプロセッサを備え、
 前記ハードウェアプロセッサが、
  ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する処理と、
  前記取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する処理と
 を、実行するように構成される介入内容推定装置。
 (付記2)
 前記ハードウェアプロセッサが、
  前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する処理と、
  前記第2の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する介入処理と
 を、さらに実行するように構成される介入内容推定装置。
 (付記3)
 ハードウェアプロセッサに、
  ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する処理と、
  前記取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する処理と
 を、実行させるプログラムを記憶する記憶媒体。
 (付記4)
 前記ハードウェアプロセッサに、
  前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する処理と、
  前記第2の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する処理と
 を、さらに実行させるプログラムを記憶する記憶媒体。
  1…介入内容推定装置
  2a~2n…ユーザ端末
  3…ネットワーク
  10…制御ユニット
  11…訓練データ取得部
  12…訓練データ選択部
  13…推定モデル学習部
  14…評価データ取得部
  15…介入内容推定部
  16…推定データ出力部
  20…記憶ユニット
  21…訓練データ記憶部
  22…推定モデル記憶部
  23…理想的目標値記憶部
  30…インタフェースユニット

Claims (8)

  1.  ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する第1の取得部と、
     前記第1の取得部により取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する推定モデル学習部と
     を具備する介入内容推定装置。
  2.  前記推定モデル学習部は、現在の健康状態を前記理想的な健康状態に近づける成功率から求められる目標達成期待値を反映した情報が、前記評価結果として出力されるように前記学習器を学習させる、請求項1に記載の介入内容推定装置。
  3.  前記推定モデル学習部は、現在の健康状態を前記理想的な健康状態に近づける成功率と、当該成功率に対し係数として与えられる割引率とから求められる目標達成期待値を反映した情報が、前記評価結果として出力されるように前記学習器を学習させる、請求項1に記載の介入内容推定装置。
  4.  前記推定モデル学習部は、前記取得されたレコード情報を予め設定した複数日分ずつ訓練データとして学習器に入力し、前記目標達成期待値と、前記ユーザの現在までの健康状態の計測値の経時変化および健康状態の目標値の変化履歴とを反映した情報が、前記評価結果として出力されるように前記学習器を学習させる、請求項2又は3に記載の介入内容推定装置。
  5.  前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する第2の取得部と、
     前記第2の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する介入内容推定部と
     をさらに具備する請求項1乃至4のいずれかに記載の介入内容推定装置。
  6.  プロセッサおよびメモリを有する情報処理装置が実行する介入内容推定方法であって、
     ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する過程と、
     前記取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する学習過程と
     を具備する介入内容推定方法。
  7.  前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する過程と、
     前記取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する推定過程と
     をさらに具備する請求項6に記載の介入内容推定方法。
  8.  請求項1乃至5のいずれかに記載の介入内容推定装置が備える前記各部の処理を、前記介入内容推定装置が備えるプロセッサに実行させるプログラム。
PCT/JP2019/027913 2018-08-31 2019-07-16 介入内容推定装置、方法およびプログラム WO2020044824A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/271,295 US20210343412A1 (en) 2018-08-31 2019-07-16 Intervention content estimation device, method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-163519 2018-08-31
JP2018163519A JP7139795B2 (ja) 2018-08-31 2018-08-31 介入内容推定装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
WO2020044824A1 true WO2020044824A1 (ja) 2020-03-05

Family

ID=69643224

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/027913 WO2020044824A1 (ja) 2018-08-31 2019-07-16 介入内容推定装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US20210343412A1 (ja)
JP (1) JP7139795B2 (ja)
WO (1) WO2020044824A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022158490A1 (ja) * 2021-01-20 2022-07-28 京セラ株式会社 予測システム、制御方法、および制御プログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7496995B2 (ja) 2021-04-28 2024-06-10 国立大学法人大阪大学 推定装置、推定方法、および推定用プログラム
JPWO2022254625A1 (ja) * 2021-06-02 2022-12-08
JPWO2023013475A1 (ja) * 2021-08-03 2023-02-09
CN113782149A (zh) * 2021-11-12 2021-12-10 北京京东方技术开发有限公司 健身方案信息的推荐方法和装置
JP7403868B2 (ja) 2022-02-18 2023-12-25 株式会社ゼロワン 個人情報管理システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001000420A (ja) * 1999-06-16 2001-01-09 Hitachi Plant Eng & Constr Co Ltd 目標達成度評価装置及び目標達成度評価方法
JP2016197330A (ja) * 2015-04-03 2016-11-24 日本電気株式会社 分析システム、リハビリテーション支援システム、方法およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3129254A1 (en) * 2016-02-01 2017-08-10 Dexcom, Inc. System and method for decision support using lifestyle factors
US11114193B2 (en) * 2019-07-03 2021-09-07 Kpn Innovations, Llc Methods and systems for optimizing dietary levels utilizing artificial intelligence

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001000420A (ja) * 1999-06-16 2001-01-09 Hitachi Plant Eng & Constr Co Ltd 目標達成度評価装置及び目標達成度評価方法
JP2016197330A (ja) * 2015-04-03 2016-11-24 日本電気株式会社 分析システム、リハビリテーション支援システム、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022158490A1 (ja) * 2021-01-20 2022-07-28 京セラ株式会社 予測システム、制御方法、および制御プログラム

Also Published As

Publication number Publication date
JP7139795B2 (ja) 2022-09-21
JP2020035365A (ja) 2020-03-05
US20210343412A1 (en) 2021-11-04

Similar Documents

Publication Publication Date Title
WO2020044824A1 (ja) 介入内容推定装置、方法およびプログラム
Cawley et al. Direct medical costs of obesity in the United States and the most populous states
Waki et al. DialBetics with a multimedia food recording tool, FoodLog: smartphone-based self-management for type 2 diabetes
Van Der Heide et al. Associations among health literacy, diabetes knowledge, and self-management behavior in adults with diabetes: results of a dutch cross-sectional study
Gilmore et al. The technology boom: a new era in obesity management
US20130117040A1 (en) Method and System for Supporting a Health Regimen
US20160371998A1 (en) Health-based incentive plans and systems and methods for implementing health-based incentive transactions
WO2017204233A1 (ja) 健康状態予測装置、健康状態予測方法、及びコンピュータ読み取り可能な記録媒体
US11967433B1 (en) Method and system for cardiac risk assessment of a patient using historical and real-time data
CN109300017B (zh) 基于数据分析的保单推荐方法、装置、服务器及存储介质
JP7107375B2 (ja) 状態遷移予測装置、予測モデル学習装置、方法およびプログラム
JP2014229310A (ja) 体重管理システム
Howland et al. Assessing telehealth interventions for physical activity and sedentary behavior self‐management in adults with type 2 diabetes mellitus: An integrative review
JP6957324B2 (ja) 健康管理支援装置、方法およびプログラム
CN113436738A (zh) 管理风险用户的方法、装置、设备及存储介质
JP7359369B2 (ja) 状況判定装置、方法およびプログラム
WO2021106099A1 (ja) 行動支援情報生成装置、方法およびプログラム
Karel et al. Validity of the Flemish working alliance inventory in a Dutch physiotherapy setting in patients with shoulder pain
US8666766B2 (en) System and methods for simulating future medical episodes
US20230032043A1 (en) Methods and systems for conducting online insurance application process
Law et al. Use of an embedded, micro-randomised trial to investigate non-compliance in telehealth interventions
B. SanGiovanni et al. Primary care providers welcome smartphone apps that assist in pediatric weight management
CN111630607A (zh) 用于对可通过行为改变来治疗的疾病的治疗的系统、装置、方法以及程序
JP6192510B2 (ja) 健康プログラム分析システム及びプラットフォームサービス提供方法
KR20220046415A (ko) 빅데이터를 이용한 비만 위험도 정보 제공 방법 및 그 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19854792

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19854792

Country of ref document: EP

Kind code of ref document: A1