JP2021196773A - 生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法 - Google Patents

生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法 Download PDF

Info

Publication number
JP2021196773A
JP2021196773A JP2020101843A JP2020101843A JP2021196773A JP 2021196773 A JP2021196773 A JP 2021196773A JP 2020101843 A JP2020101843 A JP 2020101843A JP 2020101843 A JP2020101843 A JP 2020101843A JP 2021196773 A JP2021196773 A JP 2021196773A
Authority
JP
Japan
Prior art keywords
lifestyle
prediction
subject
biometric data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020101843A
Other languages
English (en)
Inventor
桃子 深澤
Momoko Fukazawa
達也 影本
Tatsuya Kagemoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pwc Consulting LLC
Original Assignee
Pwc Consulting LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pwc Consulting LLC filed Critical Pwc Consulting LLC
Priority to JP2020101843A priority Critical patent/JP2021196773A/ja
Publication of JP2021196773A publication Critical patent/JP2021196773A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】健診結果に基づいて各個人の生活習慣を予測する。【解決手段】異なる複数のタイミングで対象者から得られた生体データと、生体データと関連して対象者から得られた、生活習慣に関する質問に対する回答とを受け付ける受付部111と、過去に複数の被検者から異なる複数のタイミングで得られた生体データ及び生体データと関連して複数の被検者から得られた質問に対する回答を含む履歴データを利用して生成された予測モデルにより、受付部で受け付けた生体データ及び回答とから、将来の任意の時点の対象者の生活習慣を予測する予測部112とを備える。【選択図】図1

Description

本発明は、健診結果に基づいて各個人の生活習慣を予測する生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法に関する。
高齢化に伴い、個人の健康管理の重要性が増している。個人の日頃の対策により、病気の予防、早期発見、重症化の予防を実現することができる。このためには、定期健康診断の受診率の増加や、健診結果の有効活用が重要である。例えば、定期健康診断の健診結果から、各個人に有効な情報が提供されれば、病気の予防、早期発見、重症化の予防等に役立てることができる。例えば、各個人に合った情報を提供することで、生活習慣を改善し、病気を予防することができる。
例えば、特許文献1では、ユーザに将来発症する可能性のある疾病を予測する技術が開示される。特許文献1に記載の技術では、ユーザにおける疾病の発症の予測に、ユーザの親族の診療データを用いるものである。ところで、疾病の発症を予測するだけでなく、予防に有効な情報を提供できることが好ましい。
特開2020−13246号公報
上記に鑑み、本発明は、健診結果に基づいて将来の生活習慣を予測する生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法を提供する。
本開示に係る生活習慣予測装置は、異なる複数のタイミングで対象者から得られた生体データと、当該生体データと関連して前記対象者から得られた、生活習慣に関する質問に対する回答とを受け付ける受付部と、複数の被検者から異なる複数のタイミングで得られた生体データ及び生体データと関連して過去に前記複数の被検者から得られた前記質問に対する回答を含む履歴データを利用して生成された予測モデルにより、受け付けた前記生体データ及び前記回答とから、将来の任意の時点の前記対象者の生活習慣を予測する予測部と、を備える。
本開示の生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法によれば、対象者の将来の生活習慣を予測することができる。
本開示の生活習慣の予測を説明する概略図である。 予測モデル生成装置を表すブロック図である。 予測モデルの生成に利用する履歴データの一例である。 疾患のリスクの予測を説明する図である。 隠れマルコフモデルを説明するダイアグラムである。 問診結果の変遷を説明する図である。 疾患リスクの変遷を説明する図である。 予測モデルの生成で算出されたパラメータの関係を説明する概略図である。 予測モデルの生成を説明するフローチャートである。 開始確率の算出を説明する概略図である。 遷移確率行列の算出を説明する概略図である。 出力確率行列の算出を説明する概略図である。 生活習慣予測装置を表すブロック図である。 生活習慣の予測に利用される健診結果データの一例である。 生活習慣の予測に利用される問診結果データの一例である。 疾患リスクの予測結果の一例である。 生活習慣の予測結果の一例である。 疾患リスク及び生活習慣の予測結果から導かれた改善の一例である。 ユーザに提案される提案データの一例である。 生活習慣の予測を説明するフローチャートである。 本開示の生活習慣の予測の検証結果を表す表である。
本発明の生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法は、健診結果等を利用して、対象者の生活習慣を予測するものである。
本開示において、「健診」とは、病気の予防・早期発見、健康の保持等の目的で、医師等の医療従事者により対象者の疾患の有無等の診断することであり、種々のデータを取得し、診断することを意味する。例えば、職場や保険組合等で定期的に行われる健康診断である。具体的には、体重、身長、腹囲等の計測、計測値を用いたBMI値等の種々の値の演算、採血、採尿、心電図、画像データの取得、医師の診断等を含むものとする。
「健診結果」とは、健診の結果であり、例えば、バイオマーカーである。具体的には、健診結果には、体重、身長、腹囲、血圧等の種々の計測値、血液検査や採尿検査で得られた血糖値やコレステロール値等の値、これらの値から演算された値を含み得る。また、健診結果には、画像撮影で得られたデータ、心電図、骨密度等のデータを含み得る。さらに、健診結果には、これらの値やデータから医師により判断された疾患のリスクを含むことができる。例えば、疾患のリスクは、ある疾患を発症している可能性や、ある疾患を将来発症する可能性を表す「低」、「中」、「高」等のレベルである。
「問診」とは、健診で医師等が疾患の有無等の判断の目的のために質問することであるとする。例えば、問診には、運動量、食習慣、食の嗜好、睡眠量等に関する質問をすることが考えられる。なお、ここでは、説明を簡単にするため、「問診」は、「健診」に含まれるものではなく、「健診」と関連して行われる質問であるとして説明する。例えば、健診の際中に実際に医師等により質問される場合であっても、「健診」と「問診」は別のものとして説明する。また、健診と問診とは必ずしも同時に行われるものでなくてもよい。例えば、健診を受ける前に、対象者が予め配付された問診に回答する場合には同時に行われるものではないが、この問診は健診と関連付けられる時期に行われる。したがって、健診と問診とは、このように関連するタイミングで行われるものであればよい。
「問診結果」とは、問診に対する対象者の回答であるとする。なお、健診結果に含まれる疾患のリスクは、健診で得られた値やデータとともに、この問診結果を合わせて求めることができる。問診では、病歴、病状、生活習慣等、様々な種類のものがある。一方、本開示は、対象者の生活習慣を予測するものである。したがって、以下では、生活習慣を予測するために利用する問診結果として、生活習慣に関する問診結果を利用するものとする。
「生活習慣」とは、生活するうえで対象者に固定した行動様式であるとする。例えば、生活習慣には、食、運動、睡眠等に関する行動様式が挙げられる。
「疾患」とは、一般的な「病気のうち、特に原因、症状、治療法等が比較的はっきりしているもの」という定義に限らず、人間の体に不調が生じた状態を広く解釈し、病気、疾病等も含むものとする。ここでは、疾患は、特に、生活習慣に影響して発症するものを対象とする。
〈生活習慣予測の概要〉
図1の概略図で示すように、健診では、医師U1等の医療従事者が、対象者U2から種々の値を計測する等により、対象者U2の健診結果データ121を得ることができる。また、健診では、医師U1等は、対象者U2に問診し、対象者U2の問診結果データ122を得ることができる。なお、健診結果データ121は、計測等によって得られた値から求められた『ある疾患のリスク』に関する項目を含む場合もある。
本開示の生活習慣予測装置1では、対象者U2の複数年分の健診結果データ121及び問診結果データ122を利用し、予測モデルMにより、対象者U2の将来の疾患のリスク及び生活習慣を予測する。また、本開示の生活習慣予測装置1で利用される予測モデルMは、予測モデル生成装置2により生成される。
〈予測モデル生成装置〉
まず、図2を用いて、上述の予測モデルMを生成する予測モデル生成装置2について説明する。図2に示すように、実施形態に係る予測モデル生成装置2は、データの処理を実行するCPU等の制御部21、データを記憶するRAMやROM等の記憶部22、ネットワークを介して外部の装置等との間でデータの送受信を実行する通信部23、データの入力に利用される入力部24及びデータの出力に利用される出力部25を備える。例えば、この予測モデル生成装置2で生成された予測モデルMが、生活習慣予測装置1に提供され、利用される。
予測モデル生成装置2は、記憶部22に記憶される予測モデル生成プログラムP2が実行されることで、制御部21が、確率演算部211と、モデル生成部212としての処理を実行する。記憶部22は、予測モデル生成プログラムP2の他、履歴データ221と、演算で得られた確率データ222と、生成された予測モデルMとを記憶する。なお、予測モデル生成装置2は、複数のコンピュータで構成されていてもよい。例えば、データの一部が、他の装置に記憶されており、そのデータを読み出すように構成されていてもよい。具体的には、履歴データ221が外部の記憶装置に記憶されており、予測モデル生成装置2がこれらの記憶装置から必要なタイミングで履歴データ221を読み出して利用する構成であってもよい。
《予測モデル》
ここで、図3A乃至図7を用いて、予測モデルMについて説明する。予測モデルMは、図3Aに示すような複数の被検者A、B、…から過去の健診等で得られた履歴データ221を利用し、機械学習により生成されたモデルである。
具体的には、履歴データ221は、複数の被検者から過去に得られた健診結果データと、これら複数の被検者から健診結果データの取得と関連して得られた問診結果データと、これら複数の被検者について健診結果データから得られた疾患リスクに関する疾患リスクデータとを含む。ここで対象とする所定の疾患は、生活習慣に関連する疾患である。例えば、所定の疾患は、『糖尿病』、『メタボリックシンドローム』、『高脂血症』、『高血圧症』、『高尿酸血症』等のいわゆる『生活習慣病』といわれる疾患である。例えば、履歴データ221は、図3Aに示すように、3000人分の、毎年の健診で得られた7年分の健診結果データと、毎年の健診で得られた7年分の問診結果データと、7年分の健診結果データから得られた各疾患に関する各年の翌年の疾患リスクデータとを含む。なお、ここでは、3000人分の、毎年の健診でえられた7年分のデータの例で説明するが、何人分及び何年分のデータを利用するかについては限定されない。
疾患リスクデータは、健診結果データから求めることができる。例えば、疾患毎に所定のリスクとする健診結果データの値が予め定められる。具体的には、「A値がx1以上、かつB値がx2以上の場合、糖尿病のリスクを『高』とする」等の条件が予め定められる。したがって、このように定められるリスクの条件により、仮に、過去の疾患リスクデータがない場合であっても、過去の健診結果データにより、過去の疾患リスクデータを導くことが可能である。
また、疾患リスクの発生毎に、リスクが継続する期間が定められる。例えば、リスクの程度毎に、その疾患リスクが継続する期間が予め定められる。糖尿病の場合、具体的には、「糖尿病のリスクが継続的に『中』もしくは『高』とされた場合、『リスクあり』の期間とする」等期間の条件が定められる。したがって、このように疾患毎に定められるリスクの期間の条件により、過去のリスクデータにより、将来のリスクを予測することができる。
例えば、図3Bに示すように、ある疾患リスクについて、過去の健診結果データから、各年における被検者A〜Dのリスクの「あり」又は「なし」が決められたとする。この場合、最新で継続的に「リスクあり」となっている年数を「リスクあり期間」とする。具体的には、被検者Aについては、リスクありが「2年」続いているため、「2年」を「リスクあり期間」とする。被検者Bについても、「2年」を「リスクあり期間」とする。さらに、被検者Cについては「3年」を「リスクあり期間」とする。なお、被検者Dについては、「リスクあり」が継続している期間がないため、「リスクあり期間」が「0年」となる。
なお、「リスクあり期間」が終わらないまま、観察期間が完了した場合、「打ち切り」と定義する。図3Bに示す例では、「打ち切り」は、被検者A及び被検者Bのように、最新の健診結果データにおいて、「リスクあり」とされている場合である。一方、被検者Bについては、最新の健診結果データにおいて、リスクが消滅している。また、被検者Dについては、全ての期間について「リスクなし」とされている。
そして、これらの「リスクあり期間」を利用して、確率モデル(例えば、Cox比例ハザードモデル)を応用し、次の未知の年にリスクがありそうか否かを予測する。このとき、「リスクあり」と予測するための確率の閾値を定義する。(例えば、確率70パーセント以上だったらリスクあり、それより低かったらリスクなし等のように閾値を設定する。また、ここで予測モデルMでは、予測される将来の各疾患リスクの有無に応じて、後に実行される生活習慣の予測の要否を判断する。具体的には、予測モデルMは、疾患リスクがありと予測した場合、その後の処理で生活習慣を予測する。
なお、履歴データ221に含まれる各被検者の健診結果データは、同一のタイミングで取得されたものである必要はない。すなわち、被検者Aの健診結果データは、2012年〜2018年に取得されたものであり、被検者Bの健診結果データは、2015年〜2019年に取得されたものである等のように、それぞれ異なるタイミングで取得されたものであってもよい。
予測モデル生成装置2は、図3を用いて上述したような履歴データ221の関係、具体的には、過去の複数の異なるタイミングで取得された複数の被検者の健診結果と、健診結果と関連して取得された過去の問診結果と、健診結果から得られた各疾患に関する翌年の疾患リスクとの関係を学習し、予測モデルMを生成する。具体的には、予測モデル生成装置2は、このような履歴データ221の関係から、後述するように、『潜在変数』、『観測値』を特定し、『開始確率』、『遷移確率』及び『出力確率』のパラメータとして表す予測モデルMを生成する。これにより、予測モデルMは、過去の異なる複数のタイミングで取得された、対象者の健診結果、問診結果及び疾患リスクを入力として、将来の任意の時点の対象者の特定の疾患のリスクと、生活習慣とを予測することができる。なお、ここでは、予測モデルMは、対象者の過去の健診結果、問診結果及び疾患リスクを入力として対象者の将来の疾患リスク及び生活習慣を予測するものとして説明するが、過去の疾患リスクは、過去の健診結果から導くことができる。したがって、予測モデルMへの入力は、過去の健診結果及び問診結果のみとし、予測モデルMにおいて過去の疾患リスクを演算するものであってもよい。また、予測モデルMの生成については、図8のフローチャートを用いて後述する。
《隠れマルコフモデル》
ここで、予測モデルMで生活習慣の予測に利用する隠れマルコフモデルについて、図4を用いて説明する。なお、Nは自然数である。隠れマルコフモデル(Hidden Markov Model: HMM)は確率モデルの一つであり、下記2つの時系列変遷を含む。
(1)マルコフ連鎖である潜在変数プロセス{Ct:t=1,2… }
(2)上記の潜在変数{Ct}に依存する観測値プロセス{Xt:t=1,2 …}
「マルコフ連鎖」とは、現在(t)の状態は、一つ前(t−1)の状態のみに依存するという性質を満たす離散変数の連続である。また、この性質のことを「マルコフ性」という。また、それぞれの時間(t)において観測値Xtは潜在変数Ctのみに依存する。図4では、潜在変数C2の状態は潜在変数C1に依存し、潜在変数C3の状態は潜在変数C2に依存し、潜在変数C4の状態は潜在変数C3に依存することを示す。また、図4では、観測値X1は潜在変数C1にのみ依存し、観測値X2は潜在変数C2にのみ依存し、観測値X3は潜在変数C3にのみ依存し、観測値X4は潜在変数C4にのみ依存することを示す。
ここで、隠れマルコフモデルは、図4で(A)〜(C)に一例を示す3種類のパラメータで表される。
(A)開始確率:1回目の状態を決めるための確率
(B)遷移確率:一つ前の状態から、現在の状態を決めるための確率(状態遷移の確率)
(C)出力確率:同一時期での、潜在変数から観測値を決めるための確率
図5は、2015年〜2019年に毎年行われた健診の際に、同一の対象者U2から得られた問診結果の一例である。具体的には、「外食が多いか」の問診に対する問診結果の一例である。図5に示す例では、この対象者U2からは、毎年「いいえ」という問診結果が得られたことが分かる。
ところで、同一人物の生活習慣が1年で急に大きく変化することは少ない。したがって、ある生活習慣に関する問診に対する翌年の問診結果を予測する場合に、今年の問診結果と大きく変化しないと考えることができる場合がある。言い換えれば、生活習慣に関する問診結果は、前年の問診結果の影響を受けていると考えられる。すなわち、問診結果の時系列データは、図4に示した潜在変数Ctに当てはめることが可能であり、「マルコフ性」を有すると仮定することができる。具体的には、図5に示すように、「外食が多いか」の問診に対して、対象者U2の問診結果が今年「いいえ」であった場合、翌年の問診結果は、今年の問診結果である「いいえ」に大きく依存すると考えることができる。
なお、ここでは、2年経つと、前年とは生活習慣が変わる可能性も高くなり、2年以上前の生活習慣を考慮する必要はないものと仮定するが、その期間は、状況に応じて設定することが好ましい。例えば、必ずしも1年である必要はなく、1年半、半年等のように設定することができる。これらは、1次マルコフモデルの場合であるが、これに限定されない。すなわち、n次マルコフモデルを利用することも考えられる。具体的には、2年経過しても生活習慣が変わる可能性が低いと考えられる場合、ある年の生活習慣に、1年前及び2年前の生活習慣を考慮するようにすることができる。また、毎年の定期健康診断は、同時期に受ける場合が多いが、その年によって5月、6月、7月等のように受ける時期が異なることがある。したがって、正確に1年毎と区切る必要はなく、前年、今年、翌年等のようにある範囲内で特定することができればよい。
上述したように、健診結果には、計測値やデータ等を含む。また、健診結果は、これら計測値やデータ等から決定される所定の疾患リスクを含むこともできる。ここで、計測値やデータ等は、そのときの生活習慣に依存すると考えることができる。したがって、これらの計測値やデータ等から決定される所定の疾患リスクも、そのときの生活習慣に依存すると考えることができる。例えば、図6に示すように、対象者U2に対し、図5の問診と関連するタイミングで行われた健診で疾患リスクが得られたとき、この疾患リスクは、実際には、同年の健診結果によって導かれた問診結果のみに依存すると予測することができる。すなわち、疾患リスクの時系列データは、図4に示した観測値Xtに当てはめることが可能であり、生活習慣に関する問診結果を『潜在変数』と考えるとき、疾患リスクをこの潜在変数に依存する『観測値』と考えることができる。
したがって、このようにして得られる予測モデルMは、図4で示した隠れマルコフモデルを用いると、図7に示すように、(A)開始確率、(B)各潜在変数についての遷移確率、(C)各潜在変数から観測値への出力確率で表される関係となる。具体的には、『開始確率』は、生活習慣の変遷の初年度の状態を決めるための確率である。また、『遷移確率』は、ある年から、次の年の生活習慣の変遷を決めるための確率である。『出力確率』は、各年の生活習慣の状態から、疾患リスクを決めるための確率である。そして、この予測モデルMにより、例えば、2015年〜2019年の生活習慣についての問診結果と、検診結果から得られた疾患リスクとを利用し、2020年の疾患リスクと2020年の生活習慣とを予測することができる。したがって、予測モデルMは、同一の被検者から得られた過去の回答をマルコフチェーンとして利用する隠れマルコフモデルである。
なお、予測モデルMは、具体的には、図7に示す「予測1」と「予測2」を含むことができる。そして、「予測1」の部分は、上述した『疾患毎に定められるリスクの期間の条件』で表すことができる。そして、予測モデルMでは、この「予測1」で「リスクあり」と予測された場合に、「予測2」が実行される。また、「予測2」の部分は、『(A)開始確率』、『(B)遷移確率』、及び、『(C)出力確率』で表すことができる。
《予測モデルの生成》
続いて、図8のフローチャートを用いて予測モデルMの生成処理について説明する。
まず、確率演算部211は、潜在変数となる対象の生活習慣を表す問診を選択する(S01)。例えば、確率演算部211は、履歴データ221に含まれる複数の問診から『外食が多い?』を選択する。これにより、確率演算部211は、後段の処理で、『外食』の生活習慣に関する『開始確率』、『遷移確率』及び『出力確率』を求めることになる。
確率演算部211は、ステップS01で選択した問診の開始確率を算出する(S02)。開始確率は、履歴データ221から、各被検者が対象の問診に対し、初年度の問診結果の割合に応じて決定する。例えば、図9に示すように、問診が『外食は多い?』であり、19.17%の被検者の初年度の問診結果が『はい』であり、80.83%の被検者の初年度の問診結果が『いいえ』であるとき、『外食が多い?』の『はい』に対する開始確率は『0.1917』であり、『いいえ』に対する開始確率は『0.8083』となる。
確率演算部211は、ステップS01で選択した問診の遷移確率を求め、遷移確率行列を算出する(S03)。例えば、図10に示すように、問診が『外食は多い?』に対する問診結果が『はい』であった被検者を対象としたとき、翌年の問診結果も『はい』となる被検者は74.28%であり、『いいえ』となる被検者は25.72%であったとする。また、同様に、問診結果が『いいえ』であった被検者を対象としたとき、翌年の回答結果が『はい』となる割合が6.27%であり、『いいえ』となる被検者は93.73%であったとする。各遷移確率は、それぞれ『0.7428』、『0.2572』、『0.0627』、『0.9373』となるため、下記の遷移確率行列が算出される。そして、確率演算部211は、ビタビアルゴリズムを利用し、各問診と関連付けられる生活習慣について、確率的に最も起こりうる生活習慣変遷を求める。
Figure 2021196773
なお、問診と関連付けられる生活習慣は、細分類化されたものである場合もある。例えば、仮に、『食べる速度が速いか』、『肉類をよく食べる』、『魚類をよく食べる』等の問診は、全て食習慣に関する生活習慣である。しかし、これらの食習慣に関する問診を全て1つの生活習慣として1つの遷移確率行列を求めるのではなく、問診毎を生活習慣として、問診毎に遷移確率行列を求める。具体的には、『食べる速度が速いか』、『肉類をよく食べる』、『魚類をよく食べる』等のそれぞれについて遷移確率行列を求める。
確率演算部211は、観測値となる疾患のリスクを特定する対象の疾患を選択する(S04)。例えば、確率演算部211は、履歴データ221に含まれる疾患から、『糖尿病』を選択する。これにより、確率演算部211は、後段の処理で、対象の問診に関する『糖尿病』の『出力確率』を求めることになる。
確率演算部211は、ステップS01で選択した問診の出力確率を求め、出力確率行列を算出する(S05)。例えば、図11に示すように、問診が『外食は多い?』であり、問診結果が『はい』である被検者は、『糖尿病』のリスクが『高』であった割合が7.68%、『中』であった割合が10.65%、『低』であった割合が81.67%であったとする。また、問診結果が『いいえ』である被検者は、『糖尿病』のリスクが『高』であった割合が5.83%、『中』であった割合が10.39%、『低』であった割合が83.78%であったとする。各出力確率は、それぞれ『0.0768』、『0.1065』、『0.8167』、『0.0583』、『0.1039』、『0.8378』となるため、下記の出力確率行列が算出される。
Figure 2021196773
確率演算部211は、全ての疾患について、出力確率行列の算出がされたか否か判定する(S06)。終了していない疾患がある場合(S06でNO)、ステップS04に戻り、ステップS04〜S05の処理を繰り返し、各疾患について、出力確率行列を算出する。
該当する問診について、全ての疾患について処理が終了した場合(S06でYES)、確率演算部211は、ステップS02で求めた開始確率、S03で求めた遷移確率及びステップS05で求めた出力確率を対象の問診の各確率として決定する(S07)。
確率演算部211は、全ての問診について、開始確率、遷移確率及び出力確率の算出が終了したか否か判定する(S08)。終了していない問診がある場合(S08でNO)、確率演算部211は、ステップS01に戻り、ステップS01〜S08の処理を繰り返し、各問診について、開始確率、遷移確率及び出力確率を算出する。
全ての問診について開始確率、遷移確率及び出力確率が算出された場合(S08でYES)、モデル生成部212は、予め疾患毎に定められるリスクの期間の条件と、各問診について決定された開始確率、遷移確率及び出力確率とを予測モデルMとする(S09)。
〈生活習慣予測装置〉
実施形態に係る生活習慣予測装置1は、上述した隠れマルコフモデルを用いて、過去に得られた対象者の健診結果及び問診結果から、対象者の将来の生活習慣を予測するものである。図12に示すように、実施形態に係る生活習慣予測装置1は、データの処理を実行するCPU等の制御部11、データを記憶するRAMやROM等の記憶部12、ネットワークを介して外部の装置等との間でデータの送受信を実行する通信部13、データの入力に利用される入力部14及びデータの出力に利用される出力部15を備える。
生活習慣予測装置1は、記憶部12に記憶される生活習慣予測プログラムPが実行されることで、制御部11が、受付部111と、予測部112と、生成部113と、提供部114としての処理を実行する。
記憶部12は、生活習慣予測プログラムPの他、健診結果データ121と、問診結果データ122と、疾患リスク123と、提案データ124と、予測モデルMとを記憶する。
なお、生活習慣予測装置1は、複数のコンピュータで構成されていてもよい。例えば、データの一部が、他の装置に記憶されており、そのデータを読み出すように構成されていてもよい。具体的には、健診結果データ121、問診結果データ122、疾患リスク123及び予測モデルMが外部の記憶装置に記憶されており、生活習慣予測装置1がこれらの記憶装置から必要なタイミングでデータ121〜123等を読み出して利用する構成であってもよい。
健診結果データ121は、異なる複数のタイミングで対象者U2から得られた生体データである。例えば、図13に示すように、身長、体重、血圧等の各健診項目について得られた健診結果データである。図13に示す例では、『健診日時』を関連付けることで、各健診結果の取得のタイミングを特定する。なお、図13に示す健診結果データ121は、一例であり、生活習慣の予測に利用可能であれば、健診結果をどのような形式で記憶していてもよい。
問診結果データ122は、生体データである健診結果データ121と関連して、対象者U2から得られた、生活習慣に関する質問である問診に対する回答に関するデータである。例えば、図14に示すように、健診結果データ121と関連して得られたことを特定する『健診日時』と、『問診』に関する情報と、『問診結果』とを関連付ける。図14に示す問診は、「外食が多い」、「食べる量が多い」、「食べる速度が早い」、「肉類を良く食べる」、「魚類をよく食べる」、「歩く速度が早い」、「十分な睡眠がとれている」等に、「はい」又は「いいえ」で回答するものである。なお、図14に示す問診結果データ122は、一例であり、生活習慣の予測に利用可能であれば、問診結果をどのような形式で記憶していてもよい。
疾患リスク123は、健診結果データ121から得られたものであり、対象者U2が所定の疾患を発症する程度を表すものである。なお、この疾患リスク123は、健診結果データ121に含まれるものであってもよい。
予測モデルMは、上述したように、健診結果データ121、問診結果データ122及び疾患リスク123から、将来の任意の時点の対象者U2の特定の疾患のリスク及び生活習慣を予測するものである。
ここで、上述した予測モデル生成装置2が利用する履歴データ221が含む健診結果データは、受付部111が受け付ける健診結果データ121と同種のデータ、すなわち、同一の項目のデータであることが好ましい。具体的には、受付部111が受け付ける健診結果データ121と、予測モデルMの生成に利用される履歴データ221が含む健診結果データとは、少なくとも、生活習慣の予測に利用する項目については、共通する。例えば、受付部111が受け付ける健診結果データ121が、肝機能検査の項目として『GOT(AST)』、『GPT(ALT)』、『γ-GTP』、『ALP』を含み、これを生活習慣の予測に利用する場合、履歴データ221が含む健診結果データも、『GOT(AST)』、『GPT(ALT)』、『γ-GTP』、『ALP』を含む。また、履歴データ221が含む健診結果データは、受付部111が受け付ける健診結果データと異なるタイミングで取得されたものであってよい。
また、履歴データ221が含む問診結果データも、受付部111が受け付ける問診結果データ122と同種のデータ、すなわち、同一の項目のデータであることが好ましい。具体的には、受付部111が受け付ける問診結果データ122と、履歴データが含む問診結果データとは、少なくとも、生活習慣の予測に利用する生活習慣の項目については、共通する。例えば、受付部111が受け付ける問診結果データ122が、『外食が多いか否か』、『食べる量が多いか否か』、『食べる速度が速いか否か』を含み、これらの生活習慣を予測対象とする場合、履歴データ221が含む問診結果データも、『外食が多いか否か』、『食べる量が多いか否か』、『食べる速度が速いか否か』を含む。
受付部111は、過去の異なる複数のタイミングで対象者U2から得られた生体データである健診結果データ121と、当該データと関連して対象者U2から得られた、質問に対する回答である問診結果データ122と、健診結果データ121から得られた疾患リスク123を受け付ける。受付部111は、受け付けた健診結果データ121、問診結果データ122及び疾患リスク123を、記憶部12に記憶させる。『過去の異なる複数のタイミング』とは、例えば、毎年の定期健康診断毎のタイミングである。ここで、受付部111は、例えば、5年分等の所定年数分の健診結果データ121、問診結果データ122データ、及び疾患リスク123を受け付ける。
予測部112は、上述した予測モデルMにより、受付部111が受け付けた健診結果データ121、問診結果データ122及び疾患リスク123とから、将来の任意の時点の対象者U2の疾患リスク及び生活習慣を予測する。『将来の任意の時点』は、受付部111が受け付ける健診結果データ121が得られた過去の異なる複数タイミングに応じて定められるものである。例えば、過去の異なる複数のタイミングが、1年毎の定期健康診断のタイミングであるとき、『将来の任意の時点』は、最後の健康診断から1年後のタイミングである。ただし、この『1年後』は、上述したように、正確な1年後である必要はなく、例えば、最後の健康診断が2019年である場合、将来の任意の時点は、2020年として広い期間を対象とすることができる。
生成部113は、予測部112で予測された疾患リスク及び生活習慣から、対象者U2への生活習慣の改善に関する提案データ124を生成する。例えば、図15Aに示すように翌年の各疾患リスクが予測され、図15Bに示すように翌年の生活習慣が予測された場合、得られた各疾患リスクの予測結果(図15A)及び生活習慣の予測結果(図15B)とから、図15Cに示すような生活習慣に関する改善例を含む提案データ124を生成する。図16に示す提案データ124は、図15Cの生活習慣の改善例と対応している。具体的には、図16に示す提案データ124は、対象者U2の『歩く速度』、『肉を食べる量』及び『睡眠量』については、『現状維持』と判断したが、『食べる速度』については、『ゆっくり食事をすること』を提案するものである。
提供部114は、生成部113が生成した提案データ124を、医師U1等や、対象者U2に提案する。具体的には、図16に示すような、リスク表示部124a、予測生活習慣表示部124b及び提案表示部124cを含む提案データ124を用紙に印刷したり、ディスプレイに表示したりすることで、対象者U2に必要な情報を提供する。したがって、これに基づき、対象者U2は、求められた生活習慣の改善の提案を確認することができる。図16に示す例は、ディスプレイに表示する提案データ124の一例であり、右方向にスライドすることで、他の生活習慣の予測を表示することにより、例えば、対象者U2は、2019年の時点で、2020年の各疾患リスクの予測結果及び生活習慣の予測結果と、各生活習慣に関する改善提案を確認することができる。このような予測結果は、対象者U2が自身で確認する場合にも容易であるし、医師U1等がリスクのある対象者U2に介入する際にも役立てることができる。
なお、図16に示す例のように、複数の疾患についてリスクがある場合、最もリスクが高い生活習慣について得られた結果を提案データ124の予測生活習慣表示部124b及び提案表示部124cに表示するようにしてもよい。これにより、対象者U2は、最もリスクが高い疾患について予防することができる。
〈生活習慣予測の処理〉
図17に示すフローチャートを用いて、生活習慣予測装置1において、疾患リスク及び生活習慣を予測する処理について説明する。
まず、受付部111は、対象者U2の複数年分の健診結果データ121、問診結果データ122及び疾患リスク123を受け付ける(S21)。
予測部112は、予測モデルMにより、ステップS21で受け付けた健診結果データ121、問診結果データ122及び疾患リスク123を用いて、将来の任意の時点の疾患リスク及び生活習慣を予測する(S22)。
生成部113は、ステップS22で得られた将来の疾患リスク及び生活習慣の予測結果を用いて、提案データ124を生成する(S23)。
提供部114は、ステップS23で生成された提案データ124を医師U1や対象者U2等のユーザの端末(図示せず)等に出力することで、提案データ124をユーザに提供する(S24)。
上述したように、生活習慣予測装置1により、過去の健診の健診結果データ121、問診結果データ122及び疾患リスク123から、将来の任意の時点の対象者U2の疾患リスク及び生活習慣を予測する。この生活習慣は、この任意の時点における対象者U2の疾患リスクに影響を与えるものである。したがって、生活習慣予測装置1が、現在から任意の時点での対象者U2への生活習慣の改善内容を提案することで、その疾患に直接影響を与える可能性の高い生活習慣の改善を促すことができる。これにより、対象者U2は、生活習慣予測装置1による提案にしたがって、健康の維持を図ることができる。
〈検証結果〉
図18は、上述した生活習慣予測装置1を用いて、複数の対象者の過去6年分の健診結果データ121、問診結果データ122及び疾患リスク123から、生活習慣を予測した場合の予測精度の結果である。例えば、図18の『1』の行は、『糖尿病』のリスクがあると診断された対象者の、過去6年分の健診結果データ121、問診結果データ122及び疾患リスク123から、今年の各生活習慣を予測した予測精度である。具体的には、今年、「糖尿病のリスクがある」と診断される対象者の『よく外食をするか否か』に関する生活習慣の予測精度は、「0.60」であり、『肉をよく食べるか否か』の生活習慣に関する予測精度は、「0.75」であり、『よく運動するか否か』の生活習慣に関する予測精度は、「0.70」であり、各生活習慣の予測精度の平均値は、「0.71」であったことを示す。
同様に、図18の『2』の行は、今年に『糖尿病』のリスクがあると診断された対象者の、過去3年分の健診結果データ121、問診結果データ122及び疾患リスク123から、今年の各生活習慣を予測した予測精度である。具体的には、今年、「糖尿病のリスクがある」と診断される対象者の『よく外食をするか否か』に関する生活習慣の予測精度は、「0.65」であり、『肉をよく食べるか否か』に関する生活習慣の予測精度は、「0.86」であり、『よく運動するか否か』に関する生活習慣の予測精度は、「0.74」であり、各生活習慣の予測精度の平均値は、「0.76」であることを示す。
このように、図18では、それぞれ『メタボリックシンドローム』、『高脂血症』、『高血圧症』及び『高尿酸血症』のリスクがと診断された対象者の各生活習慣の予測精度である。図18によれば、各対象者U2の各生活習慣が高い精度で予測されたことが分かる。
このように、予測モデルMにより、過去の健診結果データ121、問診結果データ122及び疾患リスク123を利用することで、将来の疾患リスク及び生活習慣を比較的高い精度で予測することができることが分かる。なお、疾患の種別毎に使用する過去の生活習慣に関する問診結果データ122を限定したり、重みをつけることでさらに高い精度で疾患リスク及び生活習慣を予測することが可能となると考えられる。また、性別や年齢を考慮した予測モデルMを生成することでさらに高い精度で将来の疾患リスク及び生活習慣を予測することができると考えられる。したがって、これらの予測結果を総合的に利用することで、対象者に疾患リスクを低くするための生活習慣の改善等の有効な情報を提供することが可能となる。
〈変形例1〉
上述の実施の形態では、生活習慣予測装置1は、対象者U2の生活習慣を予測する。また、この対象者U2の生活習慣の改善を提案することができるものであった。これに対し、変形例に係る生活習慣予測装置1は、あるグループに所属する複数の対象者U2のデータを利用して、このグループに属する対象者U2に有効なカテゴリの情報を提供するものである。具体的には、ある企業に属する対象者U2に対し、例えば、毎年の健康診断毎に、健康を維持するための有効な情報を提供することができる。具体的には、このグループに属する対象者U2について、特定の疾患リスクが高いという場合、その疾患に関し有益な情報を提供してもよい。これは、単にニュースレターのようなレポート等で提供するだけでなく、健康を維持するために有益なセミナーワークショップ等のイベントを提供してもよい。
例えば、このグループに属する複数の対象者U2の生活習慣から、この複数の対象者U2が運動不足であると予測される場合、簡単な運動不足解消を紹介する種々の情報を提供することができる。またこのとき、対象者U2の属性の傾向に応じて、提供する情報を選択してもよい。具体的には、対象者U2の性別及び年齢から、50代の男性の割合が多い場合、50代の男性に有効な情報を提供するようにしてもよい。
〈変形例2〉
上述の例では、受付部111が、複数年分の毎年の健診結果データ121、問診結果データ122及び疾患リスク123を受け付けていたが、これに限定されない。変形例2に係る生活習慣予測装置1では、何らかの理由により、ある年の健診結果が抜けた場合、であっても、生活習慣を予測することができる。例えば、受付部111が、一部の期間を除いた定期的な複数回のタイミングで得られたデータを受け付ける場合もある。具体的には、生活習慣予測装置1が5年分の健診結果データ121、問診結果データ122及び疾患リスク123を用いて生活習慣を予測するとき、2013〜2017、2019年はあるが、2018年の健診結果データ121、問診結果データ122及び疾患リスク123が無いとする。このような場合、2020年の生活習慣を予測するためには、例えば、以下のような方法を利用してもよい。
(1)データがない年を除いた直近5年分のデータで生活習慣を予測する。
例えば、変形例2に係る生活習慣予測装置1では、予測部112は、一部の期間の前後に得られたデータを用いて、将来の任意の時点の対象者の生活習慣を予測する。具体的には、予測部112は、データを受け付けていない2019年の前後である2014年〜2017年及び2019年に取得されたデータを用いて、2020年の生活習慣を予測する。
(2)データがない年を近い年のデータで補間する。
例えば、変形例2に係る生活習慣予測装置1では、予測部112は、データを受け付けていない期間のデータについて、当該期間の前後に取得されたデータを用いて予測のデータを求め、求めた当該予測のデータと、受付部111が受け付けた生体データとを用いて、将来の任意の時点の対象者の生活習慣を予測する。具体的には、予測部112は、データを受け付けていない2018年の前後である2017年と2019年のデータの平均を2018年の予測のデータとして求める。そして、予測部112は、求めた予測の2018年のデータと、2014年〜2017年、2019年のデータとを用いて、2020年の生活習慣を予測する。
本開示の生活習慣予測装置、生活習慣予測方法及び生活習慣予測プログラムは、例えば、健診結果から予測した生活習慣から、対象者に有益な情報を提供する際に有用である。
1 生活習慣予測装置
11 制御部
111 受付部
112 予測部
113 生成部
114 提供部
12 記憶部
121 健診結果データ
122 問診結果データ
123 疾患リスク
124 提案データ
2 予測モデル生成装置
21 制御部
211 確率演算部
212 モデル生成部
22 記憶部
221 履歴データ
222 確率データ
M 予測モデル
P 生活習慣予測プログラム
P2 予測モデル生成プログラム

Claims (11)

  1. 異なる複数のタイミングで対象者から得られた生体データと、当該生体データと関連して前記対象者から得られた、生活習慣に関する質問に対する回答とを受け付ける受付部と、
    過去に複数の被検者から異なる複数のタイミングで得られた生体データ及び当該生体データと関連して前記複数の被検者から得られた前記質問に対する回答を含む履歴データを利用して生成された予測モデルにより、前記受付部で受け付けた前記生体データ及び前記回答とから、将来の任意の時点の前記対象者の生活習慣を予測する予測部と、
    を備える生活習慣予測装置。
  2. 前記予測モデルは、同一の被検者から得られた過去の回答をマルコフチェーンとして利用する隠れマルコフモデルである
    請求項1記載の生活習慣予測装置。
  3. 予測された前記任意の時点の前記生活習慣から、前記対象者に生活習慣の改善内容を提案する提供部をさらに備える
    請求項1又は2に記載の生活習慣予測装置。
  4. 前記過去の異なる複数のタイミングは、定期的な複数回のタイミングであり、前記任意の時点は、当該定期的なタイミングに基づいて決定される
    請求項1乃至3のいずれか1に記載の生活習慣予測装置。
  5. 前記受付部が、一部の期間を除いた前記定期的な複数回のタイミングで得られた生体データ及び当該生体データと関連して得られた回答を受け付けた場合、
    前記予測部は、前記一部の期間の前後に得られた前記生体データ及び前記回答を用いて、将来の任意の時点の前記対象者の生活習慣を予測する
    請求項4に記載の生活習慣予測装置。
  6. 前記受付部が、一部の期間を除いた前記定期的な複数回のタイミングで得られた生体データ及び当該生体データと関連して得られた回答を受け付けた場合、
    前記予測部は、前記生体データ及び前記回答を受け付けていない期間の生体データ及び回答について、当該期間の前後に取得された前記生体データ及び前記回答を用いて予測の生体データ及び予測の回答を求め、求めた当該予測の生体データ及び当該予測の回答と、前記受付部が受け付けた前記生体データ及び前記回答とを用いて、将来の任意の時点の前記対象者の生活習慣を予測する
    請求項4に記載の生活習慣予測装置。
  7. 前記回答は、定期的な健康診断の問診で得られる回答であって、
    前記生体データは、前記健康診断で得られる結果である
    請求項1乃至6のいずれか1に記載の生活習慣予測装置。
  8. 同一のグループに所属する複数の前記対象者の生活習慣を受け付け、複数の前記対象者に応じたカテゴリの情報を提供する
    請求項1乃至7のいずれか1に記載の生活習慣予測装置。
  9. 異なる複数のタイミングで対象者から得られた生体データと、当該生体データと関連して前記対象者から得られた、生活習慣に関する質問に対する回答とを受け付け、
    過去に複数の被検者から異なる複数のタイミングで得られた生体データ及び当該生体データと関連して前記複数の被検者から得られた前記質問に対する回答を含む履歴データを利用して生成された予測モデルにより、受け付けた前記生体データ及び前記回答とから、将来の任意の時点の前記対象者の生活習慣を予測する、
    生活習慣予測方法。
  10. 異なる複数のタイミングで対象者から得られた生体データと、当該生体データと関連して前記対象者から得られた、生活習慣に関する質問に対する回答とを受け付けるステップと、
    過去に複数の被検者から異なる複数のタイミングで得られた生体データ及び当該生体データと関連して前記複数の被検者から得られた前記質問に対する回答を含む履歴データを利用して生成された予測モデルにより、受け付けた前記生体データ及び前記回答とから、将来の任意の時点の前記対象者の生活習慣を予測するステップと、
    をコンピュータに実行させる生活習慣予測プログラム。
  11. 過去に複数の被検者から異なる複数のタイミングで得られた生体データ及び当該生体データと関連して前記複数の被検者から得られた生活習慣に関する質問に対する回答を受け付け、
    受け付けた前記生体データ及び前記回答を利用し、新たに入力する異なる複数のタイミングで対象者から得られた生体データ及び当該生体データと関連して前記対象者から得られた前記質問に対する回答から、将来の任意の時点の前記対象者の生活習慣を予測する予測モデルを生成する、
    を含む予測モデル生成方法。
JP2020101843A 2020-06-11 2020-06-11 生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法 Pending JP2021196773A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020101843A JP2021196773A (ja) 2020-06-11 2020-06-11 生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020101843A JP2021196773A (ja) 2020-06-11 2020-06-11 生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法

Publications (1)

Publication Number Publication Date
JP2021196773A true JP2021196773A (ja) 2021-12-27

Family

ID=79195594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020101843A Pending JP2021196773A (ja) 2020-06-11 2020-06-11 生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法

Country Status (1)

Country Link
JP (1) JP2021196773A (ja)

Similar Documents

Publication Publication Date Title
US11521748B2 (en) Health risk score for risk stratification and compliance monitoring for next best action
US20170147777A1 (en) Method and apparatus for predicting health data value through generation of health data pattern
KR20190079157A (ko) 온라인 기반의 건강 관리 방법 및 장치
Tuarob et al. How are you feeling?: A personalized methodology for predicting mental states from temporally observable physical and behavioral information
JP7190859B2 (ja) 健康情報処理方法、健康情報処理装置、コンピュータプログラム、及び学習モデル
JP6679017B1 (ja) 認知症リスクの提示システムおよび方法
US11529105B2 (en) Digital twin updating
JP5171239B2 (ja) 保健指導対象者選定支援システム
JP2023536514A (ja) 使用者の睡眠環境で測定されたデータに基づいて睡眠状態を予測するためのコンピューティング装置
WO2020027213A1 (ja) 認知症リスクの提示システムおよび方法
JP2015111438A (ja) 生体情報の評価システム及び評価方法
US8666766B2 (en) System and methods for simulating future medical episodes
Cohn et al. Labile affect as a risk factor for aggressive behavior in men.
JP4499503B2 (ja) 発症リスク算出システム及びプログラム
JP2021196773A (ja) 生活習慣予測装置、生活習慣予測方法、生活習慣予測プログラム及び予測モデル生成方法
JP2006127289A (ja) 健康管理支援装置および健康管理支援プログラム
KR102371440B1 (ko) 개인 맞춤 생체나이 예측 모형 생성 방법 및 시스템
JP4499542B2 (ja) 医療情報処理装置、および、プログラム
Maria et al. Obesity Risk Prediction Using Machine Learning Approach
JP2010207272A (ja) 生体情報の評価システム及び評価方法
JP2021532445A (ja) 臨床アセスメントへのコンテキストデータの組み込み
US20210407686A1 (en) Detecting Early Symptoms And Providing Preventative Healthcare Using Minimally Required But Sufficient Data
JP7405352B2 (ja) 認知機能改善ソリューション推定システム、認知機能改善ソリューション推定方法及びプログラム
US11766223B1 (en) Systems and methods for processing of fundus images
JP7508850B2 (ja) 健康診断支援システム、および健康診断支援システムの制御プログラム