WO2020044824A1

WO2020044824A1 - 介入内容推定装置、方法およびプログラム

Info

Publication number: WO2020044824A1
Application number: PCT/JP2019/027913
Authority: WO
Inventors: 央倉沢; 正造東; 直樹麻野間; 昭宏千葉; 佳那江口; 籔内　勉; 吉田　和広; 山田　智広
Original assignee: 日本電信電話株式会社
Priority date: 2018-08-31
Filing date: 2019-07-16
Publication date: 2020-03-05
Also published as: JP7139795B2; JP2020035365A; US20210343412A1

Abstract

この発明の一態様は、人の健康状態を理想的な健康状態へ近づけるために、より一層効果的な介入内容を推定できるようにすることを目的とし、学習フェーズにおいて、過去の複数日分の健康状態の計測値および目標値を多層ニューラルネットワークからなる学習器に順次入力して、ユーザの健康状態を理想的な健康状態に近づける際の成功率から求まる目標達成期待値と、上記理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴がそれぞれ反映された、次に推奨すべき健康状態の目標値およびその目標達成期待値が出力されるように学習させる。そして、推定フェーズにおいて、上記学習済の推定モデルに、ユーザの直近の３日間の健康状態の計測値および目標値を入力し、このとき推定モデルから出力される推奨すべき健康状態の目標値を、ユーザに提示する。

Description

介入内容推定装置、方法およびプログラム

　この発明は、例えば、人の健康状態を理想的な健康状態へ近づけるための健康状態の目標値を推定する装置、方法およびプログラムに関する。

　生活習慣病は、食生活や運動習慣、睡眠、飲酒などの生活習慣が発症や進行に大きく関与する疾患群であり、糖尿病やがんなどがこれに含まれる。生活習慣病の発症・進行予防には未病状態や発症初期の患者への積極的な介入が効果的なことが知られている。例えば、食生活への介入として、摂取カロリ量の制限や、食べる順序の指定、食事時間の制限が挙げられる。運動習慣への介入として、運動量の指定、運動時間の指定、水泳やジョギングなどの運動項目の指定が挙げられる。睡眠への介入として、睡眠時間長、就寝時間や起床時間の指定が挙げられる。飲酒への介入として、飲酒量や飲酒間隔の制限が挙げられる。

　そこで、従来では、理想的な健康状態から導かれる目標値を一意に設定し、この目標値を介入内容として提示する取り組みが提案されている。例えば、運動習慣への介入においては、１日１万歩といった画一的な目標を提示し、行動変容を促していた。また、生活習慣病発症後の治療においては、糖尿病治療ではHbA1c(NGSP)７％を血糖管理目標値として提示し、治療へのアドヒアランスを高めさせていた（例えば非特許文献１を参照）。

日本糖尿病学会、熊本宣言2013－あなたとあなたの大切な人のために Keep your A1c below 7%－、2013．インターネット＜URL: http://www.jds.or.jp/common/fckeditor/editor/filemanager/connectors/php/transfer.php?file=/uid000025_6B756D616D6F746F323031332E706466＞

　ところが、従来提案されている介入方法は、単に理想的な健康状態から導かれる目標値を一意に設定するものとなっている。このため、人の現在の健康状態を考慮していないことから、行動変容や介入に対する遵守の状況を表すアドヒアランスへの効果は限定的なものになる。

　この発明は上記事情に着目してなされたもので、その目的とするところは、人の健康状態を理想的な健康状態へ近づけるために、介入内容としてより一層効果的な健康状態の目標値を推定できるようにした技術を提供することにある。

　上記目的を達成するためにこの発明の第１の態様は、ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該次に推奨すべき健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する第１の取得部と、前記第１の取得部により取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値が評価結果として出力されるように前記学習器を学習させることで介入内容推定モデルを生成する推定モデル学習部とを具備するものである。

　また、この発明の第２の態様は、前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の健康状態の計測値とを含む直近のレコード情報を取得する第２の取得部と、前記第２の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する介入内容推定部をさらに具備するものである。

　この発明の第１の態様によれば、ユーザの現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を訓練データとして入力すると、前記ユーザに対し次に推奨すべき健康状態の目標値を表す情報が評価結果として出力することが可能な学習済の介入内容推定モデルが生成される。このため、画一的な目標値を一意に提示するのではなく、ユーザの健康状態を理想的な健康状態へ近づけるためにより一層効果的な健康状態の目標値を推定することが可能な介入内容推定モデルを提供することができる。

　この発明の第２の態様によれば、直近の健康状態の目標値と当該目標値の提示後の健康状態の計測値を含むレコード情報を推定モデルに評価データとして入力することで、この入力内容に応じて次に推奨すべき健康状態の目標値を表す情報が推定データとして出力される。このため、ユーザの健康状態を理想的な健康状態へ近づけるためにより一層効果的な健康状態の目標値をユーザに提示することが可能となり、これにより画一的な目標値を一意に提示する場合に比べ、行動変容や介入に対するアドヒアランスに対する高い効果を期待することができる。

図１は、この発明の一実施形態に係る介入内容推定装置の機能構成を示すブロック図である。図２は、図１に示した介入内容推定装置による学習フェーズの処理手順と処理内容を示すフローチャートである。図３は、図１に示した介入内容推定装置による推定フェーズの処理手順と処理内容を示すフローチャートである。図４は、図２に示した学習フェーズにおいて使用される訓練データの一例を示す図である。図５は、介入内容推定モデルの構成の一例を示す図である。図６は、この発明の一実施形態に係る介入内容推定装置による推定結果の一例を示す図である。図７は、従来の健康状態の目標値を画一的に設定する場合の例を示す図である。

　以下、図面を参照してこの発明に係わる実施形態を説明する。　
　［一実施形態］
　（構成例）
　この発明の一実施形態は、ユーザの健康状態を将来の理想的な健康状態へ近づけるために、過去の複数日分の健康状態の計測値と、同じ複数日においてユーザに対し提示された健康状態の目標値とを入力したときに、次にユーザに対し推奨すべき健康状態の目標値およびその目標達成期待値が出力されるような介入内容推定モデルを深層強化学習により生成する。そして、以後この介入内容推定モデルを用いて、次に推奨すべき健康状態の目標値およびその目標達成期待値を出力させ、これを介入内容としてユーザに対し提示するようにしたものである。

　なお、健康状態を示すパラメータとしては歩数や摂取カロリ量が考えられるが、それに限らず、食生活や運動習慣、睡眠、飲酒などの生活習慣や、検体検査や生理検査の値であってもよい。また、介入内容としても、歩数や摂取カロリ量の他に、食生活や運動習慣、睡眠、飲酒などの生活習慣や、検体検査や生理検査の値に関連するものを適用することができる。

　図１は、この発明の一実施形態に係る介入内容推定装置の機能構成を示すブロック図である。　
　介入内容推定装置１は、例えばサーバコンピュータ又はパーソナルコンピュータからなり、ネットワーク３を介して、複数のユーザ端末２ａ～２ｎとの間で通信が可能となっている。

　ユーザ端末２ａ～２ｎは、それぞれ異なるユーザが所有するもので、例えばスマートフォン、タブレット型端末或いはパーソナルコンピュータからなる。ユーザ端末２ａ～２ｎは、例えば自端末に歩数計および摂取カロリ量の計測機能を有するか、または外部の計測機器により計測された歩数および摂取カロリ量を通信手段または手入力により受け取って、これをユーザの健康状態を表す情報として記憶する機能を有する。

　またユーザ端末２ａ～２ｎは、介入内容推定装置１から送信された、推奨される健康状態の目標値を受信し、ユーザに対し表示する機能を有する。さらにユーザ端末２ａ～２ｎは、例えば日ごとに、その日付情報に健康状態を表す計測値と上記推奨された健康状態の目標値とを関連付けた時系列データを生成し、これをレコード情報として記憶する。そして、ユーザの送信操作または介入内容推定装置１からの送信要求に応じて上記時系列データを読み出し、上記介入内容推定装置１へ送信する機能を有する。

　ユーザ端末２ａ～２ｎが備える上記各機能は、いずれも事前にインストールされたアプリケーションプログラムにより実現される。なお、ユーザ端末２ａ～２ｎとしては、歩数計および摂取カロリ量計測機能と通信機能とを備えたウェアラブル端末を使用することも可能である。

　ネットワーク３は、例えば、インターネット等の公衆網と、この公衆網にアクセスするためのアクセス網とを含む。アクセス網としては、例えばＬＡＮ（Local Area Network）または無線ＬＡＮが用いられるが、他に有線電話網、ＣＡＴＶ（Cable Television）網、携帯電話網等を使用することも可能である。

　ところで、介入内容推定装置１は、例えば、医療機関、保健支援センタ、フィットネスクラブ、その他の健康支援サービス業者が運用するもので、例えばサーバコンピュータ又はパーソナルコンピュータにより構成される。なお、介入内容推定装置１は、それ単独で設置されてもよいが、医師等の医療従事者の端末や、医療機関ごとに設置されている電子医療記録（Electronic Medical Records：ＥＭＲ）サーバ、複数の医療機関を含む地域ごとに設置される電子健康記録（Electronic Health Records：ＥＨＲ）サーバ、さらにはサービス事業者のクラウドサーバ等に、その拡張機能の１つとして設けられるものであってもよく、さらにはユーザ端末２ａ～２ｎ自体にその拡張機能の１つとして設けられてもよい。

　介入内容推定装置１は、制御ユニット１０と、記憶ユニット２０と、インタフェースユニット３０とを備える。インタフェースユニット３０は、ネットワーク３を介して、ユーザ端末２ａ～２ｎとの間でデータ伝送を行う。またインタフェースユニット３０は、ＬＡＮや信号ケーブルを介して接続される管理端末（図示省略）との間でデータ伝送を行う機能を有していてもよい。

　記憶ユニット２０は、記憶媒体として、例えば、ＨＤＤ（Hard Disk Drive）またはＳＳＤ（Solid State Drive）等の随時書込みおよび読出しが可能な不揮発性メモリと、ＲＯＭ（Read Only Memory）等の不揮発性メモリと、ＲＡＭ（Random Access Memory）等の揮発性メモリとを組み合わせて構成される。その記憶領域には、プログラム記憶領域と、データ記憶領域とが設けられる。プログラム記憶領域には、この発明の一実施形態に係る各種制御処理を実行するために必要なプログラムが格納されている。

　データ記憶領域には、訓練データ記憶部２１と、推定モデル記憶部２２と、理想的目標値記憶部２３とが設けられている。訓練データ記憶部２１は、学習フェーズにおいて、上記ユーザ端末２ａ～２ｎから取得された複数日分の時系列データを、訓練データとして記憶するために用いられる。推定モデル記憶部２２は、学習済の介入内容推定モデルを記憶するために用いられる。理想的目標値記憶部２３には、理想的な目標値が予め記憶されている。

　制御ユニット１０は、例えば、ＣＰＵ（Central Processing Unit）等のハードウェアプロセッサを備え、この発明の一実施形態を実現するための制御機能として、訓練データ取得部１１と、訓練データ選択部１２と、推定モデル学習部１３と、評価データ取得部１４と、介入内容推定部１５と、推定データ出力部１６とを有している。これらの制御機能部は、いずれも上記プログラム記憶領域に格納されたプログラムを上記ハードウェアプロセッサに実行させることにより実現される。

　訓練データ取得部１１は、学習フェーズにおいて、ユーザ端末２ａ～２ｎから各ユーザの過去の複数日分の時系列データを、ネットワーク３およびインタフェースユニット３０を介して訓練データとして取得し、取得した訓練データをユーザの個人識別情報（ユーザＩＤ）と関連付けて訓練データ記憶部２１に記憶させる処理を行う。

　訓練データ選択部１２は、上記訓練データ記憶部２１に記憶された複数日分の訓練データを、例えば１日ずつ日にちをずらしながら３日分単位で順次選択して推定モデル学習部１３に与える処理を行う。

　推定モデル学習部１３は、例えば深層強化学習を用い、ユーザごとに、上記過去の３日分の健康状態を表す計測値と推奨された健康状態の目標値とを含む訓練データを入力したとき、理想的目標値記憶部２３に記憶された理想的な健康状態に対応する目標値に、現在の健康状態を近づける成功率から求まる目標達成期待値、つまり最終目標（理想的な目標値）が達成できる確率と、上記理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴とが考慮された、次に推奨すべき健康状態の目標値およびその目標達成期待値が介入内容の推定データとして出力されるように、学習器に学習を行わせる。そして、学習済の介入内容推定モデルを推定モデル記憶部２２に記憶させる。学習器としては、例えば多層ニューラルネットワークが用いられる。なお、推定モデル学習部１３による学習処理の具体例は後述する。

　評価データ取得部１４は、推定フェーズにおいて、ユーザ端末２ａ～２ｎからの介入内容推定要求に応じ、当該ユーザ端末２ａ～２ｎから送信される、例えば直近の３日間の健康状態を示す計測値と同期間に推奨された健康状態を示す目標値とを含む時系列データを、ネットワーク３およびインタフェースユニット３０を介して取得する処理を行う。

　介入内容推定部１５は、推定モデル記憶部２２に記憶された学習済の介入内容推定モデルに対し、上記評価データ取得部１４により取得された直近の３日間の時系列データを入力し、このとき上記介入内容推定モデルから出力される、翌日に使用すべき推奨される健康状態の目標値を、介入内容の推定データとして推定データ出力部１６に渡す処理を行う。なお、介入内容推定部１５は、上記介入内容の推定データを、次の日の日付とユーザＩＤに対応付けて記憶ユニット２０内の推定データ記憶部（図示省略）に保存するようにしてもよい。

　推定データ出力部１６は、上記介入内容推定部１５から渡された、推奨される健康状態の目標値を含む推定結果通知データを生成し、インタフェースユニット３０から要求元のユーザ端末２ａ～２ｎに向け送信する処理を行う。

　（動作例）
　次に、以上のように構成された介入内容推定装置１の動作例を説明する。
　（１）学習フェーズ
　学習フェーズが設定されると、介入内容推定装置１は以下のように介入内容推定モデルの学習処理を実行する。　
　図２は、介入内容推定装置１の制御ユニット１０による学習フェーズの処理手順と処理内容の一例を示すフローチャートである。

　（１－１）訓練データの取得
　各ユーザ端末２ａ～２ｎでは、毎日、介入内容推定装置１から送られる、推奨される健康状態の目標値が表示部に表示されるとともに、日付情報と関連付けられて記憶部に記憶される。またそれと共に、毎日、例えば歩数計により計測された歩数値と、ユーザが手入力した摂取カロリ量が、上記日付情報と関連付けられて記憶部に記憶される。かくして、記憶部には、日付ごとに、その日の健康状態を表す歩数および摂取カロリ量の計測値と、介入内容推定装置１から送られた推奨される健康状態を表す歩数および摂取カロリ量の目標値とからなる時系列データが順次記憶される。この日付ごとに記憶された時系列データは、介入内容推定装置１が推定モデルを学習する際に使用する訓練データとなる。

　図４は、ユーザ端末２ａ～２ｎの記憶部に記憶された、時系列データ（訓練データ）の一例を示すものである。この例では、2018年6月1日から6月8日までの期間における、日毎の健康状態を表す歩数および摂取カロリ量の計測値と、介入内容推定装置１から提示された推奨される健康状態を表す目標値として、「目標歩数6000歩」、「目標歩数8000歩」、「目標歩数10000歩」、「目標摂取カロリ量3000kcal」、「目標摂取カロリ量2500kcal」のいずれかを指定する情報が記憶される。ここでは、提示された目標に対しフラグ“１”が記憶され、その他にはフラグ“０”が記憶される例を示している。

　制御ユニット１０は、先ずステップＳ１０において、訓練データ取得部１１の制御の下、インタフェースユニット３０を介してユーザ端末２ａ～２ｎに対しアクセスし、これにより例えば８日分の時系列データをそれぞれ受信する。そして、この時系列データを、ステップＳ１１において、ユーザＩＤと関連付けて訓練データ記憶部２１に記憶させる。

　なお、介入内容推定装置１の記憶ユニット２０に推定データ記憶部（図示省略）が設けられている場合には、介入内容推定装置１はユーザ端末２ａ～２ｎからは毎日の歩数と摂取カロリ量の計測値のみを取得する。そして、この取得した歩数と摂取カロリ量の計測値と、上記推定データ記憶部に記憶された、ユーザに対し推奨した日ごとの健康状態の目標値を表すフラグ情報とを、日付に関連付けて対応付けることにより訓練データを取得するようにしてもよい。また、取得する時系列データは複数日分であれば何日分であってもよい。

　（１－２）訓練データの選択
　ユーザごとに複数日分の時系列データが取得されると、介入内容推定装置１の制御ユニット１０は、訓練データ選択部１２の制御の下、ステップＳ１２において、上記訓練データ記憶部２１から、例えば１日ずつ日にちをずらしながら３日分を１単位として時系列データを読み出し、この３日分の時系列データを訓練データとして推定モデル学習部１３に与える。

　例えば、図４に示した2018年6月1日から6月8日までの８日分の時系列データが取得されて訓練データ記憶部２１に記憶されているとすれば、この中から先ず2018年6月1日から6月3日までの３日分の時系列データが選択される。次に2018年6月2日から6月4日までの３日分の時系列データが選択され、続いて2018年6月3日から6月5日までの３日分の時系列データが選択されるというように、順次日付を１日ずつシフトしながら、訓練データとして選択される。

　なお、ここでは一回の学習処理に３日分を１単位として訓練データを選択する場合を例にとって説明するが、４日分以上または２日分を１単位として訓練データを選択するようにしてもよい。

　（１－３）推定モデルの学習
　介入内容推定装置１の制御ユニット１０は、次に推定モデル学習部１３の制御の下、ステップＳ１３において、以下のように介入内容推定モデルを学習させる処理を実行する。

　すなわち、推定モデル学習部１３は、例えば、深層強化学習により介入内容推定モデルを生成する。深層強化学習により目標達成期待値をもとに適切な介入内容、つまり健康状態の目標値を推定できる。また、割引率と呼ばれるパラメータを設定することで、介入効果の継続性を反映できる。過去の介入履歴は、訓練データとして一度に入力する日数を複数日にすることで反映させることができる。

　深層強化学習では、例えばエージェントと環境の２つを設計する。エージェントは観測された状態をもとにどのような行動を選択するか決め、環境はその行動によって状態を更新する。そして、更新された状態に基づいて報酬、つまり成功率が決められる。本実施形態では、エージェントは介入内容推定装置１であり、ユーザの直近３日分の健康状態をもとに翌日の目標歩数を決める。報酬は、学習を進みやすくするためクリッピングを導入し、例えば現在の健康状態が将来の理想的な健康状態とした１日１万歩以上かつ摂取カロリ量2500kcal未満であれば＋１、そうでなければ－１とする。環境はユーザであり、目標歩数が提示された日の歩数の計測値を登録する。

　Q関数は、多層ニューラルネットワークによる構築される。多層ニューラルネットワークは、例えば図５に示すように３層の全結合層により構成される。このうち入力層ＩＬおよび中間層ＭＬは、全結合層とBatch Normalizationと活性化関数ReLUとから構成され、出力層ＯＬは全結合層により構成される。

　３日分の歩数と摂取カロリ量の計測値により６次元ベクトルが構成される。また、１日分の５つの目標値、つまり目標歩数6000歩、目標歩数8000歩、目標歩数10000歩、目標摂取カロリ量3000kcal、目標摂取カロリ量2500kcalに対し設定されたフラグ値（“１”または“０”）を３日分連結して、１５次元ベクトルが構成される。そして、上記健康状態の計測値の６次元ベクトルと、上記健康状態の目標値の１５次元ベクトルとを連結することで２１次元ベクトルを構成して、これを入力層ＩＬへの入力値とする。つまり、入力層ＩＬのユニットサイズは「２１」となる。

　出力層ＯＬの出力は５つの目標値およびその目標達成期待値を表す５次元ベクトルとなる。つまり、出力層のユニットサイズは「５」となる。中間層のユニットサイズは「６４」とする。なお、パラメータはこれに限るものではなく、ユニットサイズは参照期間や目標の選択肢の数に沿って変更可能である。

　報酬の割引率（継続性を表すパラメータ）は、例えば“0.9”に設定される。Ｑ関数は、時刻ｔの正解を、Ｑ値の目標達成期待値に割引率を係数としてかけ合わせた値に報酬（成功率）を足し合わせた値として定義される。そして、推定モデル学習部１３は、上記正解値の平均二乗誤差が最小となるようにQ関数を学習する。

　推定モデル学習部１３は、上記学習処理により得られたパラメータをステップＳ１４により一時保存する。そして、ステップＳ１５において、訓練データ記憶部２１に記憶されたすべての時系列データに対する学習処理が終了したか否かを判定し、未選択の時系列データが残っている場合にはステップＳ１２に戻ってステップＳ１２～Ｓ１４による学習処理を繰り返し実行する。これに対し、すべての時系列データに対する学習処理が終了すると、最終的に得られたＱ関数のパラメータを介入内容推定モデルとして推定モデル記憶部２２に記憶させ、処理を終了する。

　（２）推定フェーズ
　推定フェーズが設定されると、介入内容推定装置１は、ユーザごとに、推奨される健康状態の目標値およびその目標達成期待値を推定する処理を以下のように実行する。　
　図３は、介入内容推定装置１の制御ユニット１０による介入内容推定処理の手順と処理内容の一例を示すフローチャートである。

　（２－１）評価データの取得
　ユーザ端末２ａ～２ｎは、対象ユーザの直近の３日間の時系列データを介入内容推定装置１へ送信する。これに対し介入内容推定装置１の制御ユニット１０は、評価データ取得部１４の制御の下、ステップＳ２０において、上記ユーザ端末２ａ～２ｎから送信された直近の３日間の時系列データを、インタフェースユニット３０を介して評価データとして取り込む。上記時系列データには、例えば図４に示したように、ユーザの直近の３日間における健康状態を示す歩数および摂取カロリ量の計測値と、上記３日間のために過去に介入内容推定装置１から提示された歩数または摂取カロリ量の目標値およびその目標達成期待値が含まれる。

　なお、上記ユーザ端末２ａ～２ｎにおける、歩数および摂取カロリ量の計測値の入力は、歩数計およびカロリ計の各計測値を通信によりユーザ端末２ａ～２ｎへ転送するか、またはユーザが上記各計測値を手操作によりユーザ端末２ａ～２ｎに入力することにより行われる。

　（２－２）介入内容の推定
　介入内容推定装置１の制御ユニット１０は、上記評価データの取り込みが終了すると、続いて介入内容推定部１５の制御の下、以下のように介入内容の推定処理を実行する。

　すなわち、介入内容推定部１５は、推定モデル記憶部２２に記憶されている学習済の推定モデルを読み出す。そして、ステップＳ２１において、上記取得された評価データ、つまり直近の３日分の歩数および摂取カロリ量の計測値と、過去に介入内容推定装置１から提示された歩数または摂取カロリ量の目標値とから構成される２１次元ベクトルのデータを、図５に示すように上記学習済の推定モデルの入力層ＩＬに入力する。そうすると、学習済の推定モデルでは、上記２１次元ベクトルのデータを入力として、入力層ＩＬおよび中間層ＭＬにより演算が行われ、出力層ＯＬから５次元ベクトルにより表される、推奨すべき歩数または摂取カロリ量の目標値およびその目標達成期待値が、翌日の介入内容を示す推定データＥＤとして出力される。

　上記介入内容推定データの出力手法には、例えば次の２種類が考えられる。　
　１つは、目標歩数6000歩、目標歩数8000歩、目標歩数10000歩、目標摂取カロリ量3000kcal、目標摂取カロリ量2500kcalの５つの選択肢のうち、最も目標達成期待値の高いものを選択してこれを推定データＥＤとするものである。

　もう１つは、目標歩数6000歩、目標歩数8000歩、目標歩数10000歩、目標摂取カロリ量3000kcal、目標摂取カロリ量2500kcalの中から、目標達成期待値が高い順に上位N件（例えば上位２件）の目標値の候補を選択し、これを推定データＥＤとするものである。

　（２－３）推定データの出力
　制御ユニット１０は、推定データ出力部１６の制御の下、ステップＳ２２において、上記介入内容推定部１５から出力された翌日の介入内容を示す推定値を含む通知データを生成し、当該通知データをインタフェースユニット３０から要求元のユーザ端末２ａ～２ｎへ送信する。なお、送信方法は、ユーザ端末がブラウザ機能により閲覧可能な形態で介入内容推定装置１から送信するものであってもよく、また電子メールに添付する形態で送信するものであってもよい。

　ユーザ端末２ａ～２ｎは、上記介入内容推定装置１から送信された通知データを受信すると、当該通知データに含まれる、推奨される歩数または摂取カロリ量の目標値を表す情報を、表示部に表示させるとともに、該当する日付に関連付けて時系列データの構成要素として記憶する。

　このとき、通知データに目標達成期待値が高い上位複数のN件（例えば上位２件）の目標値の候補が含まれている場合には、上記２件の目標値の候補をそれぞれ表示させ、ユーザに好きな方を選択させる。ユーザ端末２ａ～２ｎは、上記ユーザにより選択された目標値を該当する日付に関連付けて時系列データの構成要素として記憶する。

　（効果）
　以上詳述したようにこの発明の一実施形態では、学習フェーズにおいて、過去の複数日分の健康状態の計測値および目標値を、３日分ずつ多層ニューラルネットワークからなる学習器に順次入力して学習させる。このとき、学習器には、ユーザの健康状態を理想的な健康状態に近づける際の成功率から求まる目標達成期待値と、上記理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴がそれぞれ反映された、次に推奨すべき健康状態の目標値およびその目標達成期待値が出力されるように、学習を行わせる。そして、推定フェーズにおいて、上記学習済の推定モデルに、ユーザの直近の３日間の健康状態の計測値および目標値を入力し、このとき推定モデルから出力される推奨すべき健康状態の目標値を、介入内容推定データとして該当するユーザ端末２ａ～２ｎへ送信してユーザに提示するようにしている。

　従って、ユーザに対し健康状態の目標値を提示する際に、ユーザの直近の日付における健康状態の計測値と、当該日付に対応して事前に提示された健康状態の目標値とに基づいて、健康状態を理想とする健康状態に近づける際の成功率と、理想的な健康状態に近い健康状態を維持させる継続性と、健康状態の経時変化およびこれまでの介入履歴とがそれぞれ反映された、次の健康状態の目標値が出力される。このため、理想的な健康状態に向けて着実に効果が期待され、かつ理想的な健康状態に近い状態を維持させる上で効果的な介入内容を提示するが可能となる。さらに、過去の３日分の介入内容が考慮されることで、日々の目標値とその目標達成期待値への影響が考慮されて効果が大きい介入内容を提示することが可能となる。

　図６は、この発明の一実施形態により介入内容の１つとして日替わりで提示される歩数の目標値ＴＷ１の変化例を示したものである。これに対し、図７は歩数の目標値ＴＷ０を画一的に設定する従来の例を示すものである。本実施形態では、歩数の目標値を画一的に設定するのではなく、ユーザの直近の介入内容とその介入後の歩数の変化に応じて翌日の歩数の目標値を適応的に設定することによって、行動変容や介入に対するアドヒアランスに対する効果を高めることができる。

　この結果一実施形態によれば、理想的な健康状態に向けて着実に効果が期待でき、生活習慣改善に寄与する介入内容を提示できることで、例えば急激なダイエットで起きるリバウンドを回避でき、さらには介入内容間の相関も考慮されてユーザにとって違和感が軽減されるように介入内容を提示することができる。

　さらに、目標達成期待値が最も高い介入内容を選択して提示することで、ユーザは迷うことなく健康状態を理想に近づけるための行動を実行することが可能となる。一方、目標達成期待値が上位の複数の介入内容をユーザに提示する出力手法を選択することで、ユーザに希望する介入内容を選択させることも可能となる。

　［他の実施形態］
　なお、この発明は上記実施形態に限定されるものではない。例えば、一実施形態では介入内容推定装置としての機能をネットワーク上にサーバに設けた場合を例にとって説明したが、ユーザ端末内にその拡張機能の１つとして設けるようにしてもよい。このようにすると、ユーザ端末の処理負荷が高くなるが、通信トラフィックおよび通信コストを低減できる利点がある。

　その他、介入推定装置の機能構成、学習処理および推定処理の手順と処理内容、健康状態を表す情報の種類等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。

　なお、本願発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。

　［付記］
　上記各実施形態の一部または全部は、特許請求の範囲のほか以下の付記に示すように記載することも可能であるが、これに限られない。

　（付記１）
　ハードウェアプロセッサを備え、
　前記ハードウェアプロセッサが、
　　ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する処理と、
　　前記取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する処理と
　を、実行するように構成される介入内容推定装置。

　（付記２）
　前記ハードウェアプロセッサが、
　　前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する処理と、
　　前記第２の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する介入処理と
　を、さらに実行するように構成される介入内容推定装置。

　（付記３）
　ハードウェアプロセッサに、
　　ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する処理と、
　　前記取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する処理と
　を、実行させるプログラムを記憶する記憶媒体。

　（付記４）
　前記ハードウェアプロセッサに、
　　前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する処理と、
　　前記第２の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する処理と
　を、さらに実行させるプログラムを記憶する記憶媒体。

　　１…介入内容推定装置
　　２ａ～２ｎ…ユーザ端末
　　３…ネットワーク
　　１０…制御ユニット
　　１１…訓練データ取得部
　　１２…訓練データ選択部
　　１３…推定モデル学習部
　　１４…評価データ取得部
　　１５…介入内容推定部
　　１６…推定データ出力部
　　２０…記憶ユニット
　　２１…訓練データ記憶部
　　２２…推定モデル記憶部
　　２３…理想的目標値記憶部
　　３０…インタフェースユニット

Claims

　ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する第１の取得部と、
　前記第１の取得部により取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する推定モデル学習部と
　を具備する介入内容推定装置。
　前記推定モデル学習部は、現在の健康状態を前記理想的な健康状態に近づける成功率から求められる目標達成期待値を反映した情報が、前記評価結果として出力されるように前記学習器を学習させる、請求項１に記載の介入内容推定装置。
　前記推定モデル学習部は、現在の健康状態を前記理想的な健康状態に近づける成功率と、当該成功率に対し係数として与えられる割引率とから求められる目標達成期待値を反映した情報が、前記評価結果として出力されるように前記学習器を学習させる、請求項１に記載の介入内容推定装置。
　前記推定モデル学習部は、前記取得されたレコード情報を予め設定した複数日分ずつ訓練データとして学習器に入力し、前記目標達成期待値と、前記ユーザの現在までの健康状態の計測値の経時変化および健康状態の目標値の変化履歴とを反映した情報が、前記評価結果として出力されるように前記学習器を学習させる、請求項２又は３に記載の介入内容推定装置。
　前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する第２の取得部と、
　前記第２の取得部により取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する介入内容推定部と
　をさらに具備する請求項１乃至４のいずれかに記載の介入内容推定装置。
　プロセッサおよびメモリを有する情報処理装置が実行する介入内容推定方法であって、
　ユーザごとに、現在の健康状態および将来の予め設定された理想的な健康状態をもとに決定される健康状態の目標値と、当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含むレコード情報を取得する過程と、
　前記取得されたレコード情報を訓練データとして学習器に入力し、当該学習器から次に推奨すべき健康状態の目標値を表す情報が評価結果として出力されるように前記学習器を学習させることで、介入内容推定モデルを生成する学習過程と
　を具備する介入内容推定方法。
　前記ユーザごとに、提示された健康状態の目標値と当該健康状態の目標値の提示後の前記ユーザの健康状態の計測値とを含む直近のレコード情報を取得する過程と、
　前記取得された直近のレコード情報を、前記介入内容推定モデルに評価データとして入力し、この入力に応じて当該介入内容推定モデルから出力される次に推奨すべき健康状態の目標値を表す情報を推定データとして出力する推定過程と
　をさらに具備する請求項６に記載の介入内容推定方法。
　請求項１乃至５のいずれかに記載の介入内容推定装置が備える前記各部の処理を、前記介入内容推定装置が備えるプロセッサに実行させるプログラム。