以下、発明を実施するための実施例を、図面を用いて説明する。
本発明の実施例1では、住民データ及び介護データから将来の介護度を推計し、自治体の介護施策立案を支援する将来推計システムを説明する。実施例2では、介護データ及び住民データに医療データ及び健診データを加えて、将来の介護度を推計する将来推計システムを説明する。実施例3では、将来の介護度及び介護費を推計する将来推計システムを説明する。実施例4では、介護データ、住民データ、医療データ及び健診データから、将来の介護度及び介護費を推計する将来推計システムを説明する。実施例5では、介護度推計モデルから、将来の介護発生又は介護進行を抑制する施策となる説明変数を抽出し、その施策の効果を推計する将来推計システムを説明する。実施例6では、住民データ及び医療費データから将来の医療費を推計する将来推計システムを説明する。実施例7では、整形データに基づいて、目的変数と関連するカテゴリ変数を決定するための処理を実行する推計モデル構築システムを説明する。
また、以下の実施例では、自治体の住民の動態を考慮して、将来の介護度、介護費、医療費などの住民の各々の将来の状況を示す時系列データを推計するが、自治体以外の所定の集団の構成員の状況を示す時系列データの推計にも本発明を適用できる。例えば、健康保険組合の被保険者について、その動態を考慮して、将来の介護度、介護費、医療費などの被保険者の各々の状況を示す時系列データを推計してもよい。
<実施例1>
実施例1では、蓄積された介護データ及び住民データから、将来の介護度を個人単位に推計する将来推計システムの例を説明する。なお、要介護度の段階mは、介護度無、要支援1、要支援2、要介護1、要介護2、要介護3、要介護4、要介護5の8段階(m=8)として説明する。
図1は、実施例1の将来推計システムの構成を示すブロック図である。
実施例1の将来推計システムは、将来推計端末101及びデータベース130を有する。
将来推計端末101は、入力部102、出力部103、プロセッサ(CPU)104、メモリ105及び記憶媒体106を有する計算機である。
入力部102は、マウス、キーボードなどのヒューマンインターフェースであり、将来推計端末101への入力を受け付ける。出力部103は、将来推計端末101による演算結果を出力するディスプレイやプリンタである。記憶媒体106は、将来推計端末101による介護度推計処理を実現する各種プログラム、及び介護度推計処理の実行結果等を格納する記憶装置であり、例えば、不揮発性記憶媒体(磁気ディスクドライブ、不揮発性メモリ等)で構成される。
メモリ105は、不揮発性の記憶素子であるROM及び揮発性の記憶素子であるRAMを含む。ROMは、不変のプログラム(例えば、BIOS)などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、プロセッサ104が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。すなわち、メモリ105には、記憶媒体106に格納されているプログラムが展開される。
プロセッサ104は、メモリ105にロードされたプログラムを実行する演算装置であり、例えば、CPU、GPUなどである。以下に説明する処理及び演算は、プロセッサ104が実行する。なお、プロセッサ104がプログラムを実行して行う処理の一部を、他の演算装置(例えば、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)などのハードウェア)で実行してもよい。
プロセッサ104によって実行されるプログラムは、リムーバブルメディア(CD-ROM、フラッシュメモリなど)又はネットワークを介して各サーバに提供され、非一時的記憶媒体である不揮発性記憶装置に格納される。このため、計算機システムは、リムーバブルメディアを読み込むインターフェースを有してもよい。
本実施例の将来推計システムは、一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。
記憶媒体106は、データ整形部111、二値化処理部112、介護度推計モデル構築部113、介護度推計部114、推計結果集計部115、モデル構築用データ作成部120、死亡推計モデル構築部121、転出推計モデル構築部122、死亡推計部123、転出推計部124及び人口動態補正部125を実現するためのプログラムを格納する。
データ整形部111は、入力部102に入力された複数人分の、少なくとも2年度分(T年度とT-n年度)の要介護度・介護費等を含む介護データ(図2)と、性別・年齢・住所等を含む住民データ(図3)を取得し、各データを個人別かつ年度別に連結した上で、個人を行に、年度を列に展開した整形データ(図4)を作成する。
二値化処理部112は、データ整形部111で作成された整形データから、T年度の要介護度を取得し、順序尺度データである8段階の要介護度(介護度無(0)<要支援1(1)<要支援2(2)<要介護1(3)<要介護2(4)<要介護3(5)<要介護4(6)<要介護5(7))を7箇所で2値化し、T年度の要介護度について7個の目的変数1~7(図5)を作成する。ここで、目的変数1は要支援1以上(1)と介護度無(0)、目的変数2は要支援2以上(1)と要支援1以下(0)、目的変数3は要介護1以上(1)と要支援2以下(0)、目的変数4は要介護2以上(1)と要介護1以下(0)、目的変数5は要介護3以上(1)と要介護2以下(0)、目的変数6は要介護4以上(1)と要介護3以下(0)、目的変数7は要介護5以上(1)と要介護4以下(0)に二値化される。
介護度推計モデル構築部113は、二値化処理部112で作成されたT年度の要介護度における7個の目的変数1~7について、T-n年度の整形データを説明変数としたロジスティック回帰分析を各目的変数別に7回実行し、7個のロジスティック回帰式から構成される介護度推計モデル(図6)を構築する。なお、将来推計システムの外部から介護度推計モデルが提供される場合、将来推計端末101は介護度推計モデル構築部113を有さなくてもよい。
介護度推計部114は、介護度推計モデル構築部113で構築された介護度推計モデルに、T年度の整形データが入力されると、T+n年度の要介護度別の確率を個人別に推計する(図7)。目的変数1の要支援1以上の確率をP1、目的変数2の要支援2以上の確率をP2、目的変数3の要介護1以上の確率をP3、目的変数4の要介護2以上の確率をP4、目的変数5の要介護3以上の確率をP5、目的変数6の要介護4以上の確率をP6、目的変数7の要介護5以上の確率をP7とすると、要介護度別の確率(NP)は、介護度無(NP0)が1-P1、要支援1(NP1)がP1-P2、要支援2(NP2)がP2-P3、要介護1(NP3)がP3-P4、要介護2(NP4)がP4-P5、要介護3(NP5)がP5-P6、要介護4(NP6)がP6-P7、要介護5(NP7)がP7で推計される。
推計結果集計部115は、入力部102に入力されたユーザの集計条件(T年度の性別、年齢、住所など)に基づいて、介護度推計部114で推計された個人別の介護度推計結果を集計して、任意の集団単位で介護度別の将来推計人数を出力部103に表示する(図8)。
モデル構築用データ作成部120は、死亡推計モデル構築部121及び転出推計モデル構築部122及び、介護度推計モデル構築部113(後述の介護費推計モデル構築部116、医療費推計モデル構築部148を含む)が、それぞれ、死亡推計モデル、転出推計モデル、介護度推計モデル(後述の介護費推計モデル、医療費推計モデルを含む)を構築するために使用するデータを作成する。死亡推計モデル及び転出推計モデルを構築するためのデータは、データ整形部111で作成される整形データ400と共用できるが、他のデータを用いてもよい。
具体的には、モデル構築用データ作成部120は、整形データ400からT+n年度の死亡者を除いて、死亡推計モデルを構築するためのデータを作成する。また、前述の死亡推計モデルを構築するために作成したデータから、T年度の死亡者を除いて、転出推計モデルを構築するためのデータを作成する。さらに、モデル構築用データ作成部120は、前述の転出推計モデルを構築するために作成したデータから、T年度の転出者を除いて、介護度推計モデルを構築するためのデータを作成する。
死亡推計モデル構築部121は、作成されたモデル構築用データ(例えば整形データ400)を用いて、住民の生死を個人別に推定するための死亡推計モデルを構築する。
転出推計モデル構築部122は、作成されたモデル構築用データ(例えば整形データ400)を用いて、当該自治体から住民が転出するかを個人別に推定するための転出推計モデルを構築する。
死亡推計部123は、構築された死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。転出推計部124は、構築された転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。死亡推計部123及び転出推計部124による処理の詳細は、図10を参照して後述する。死亡推計部123及び転出推計部124は、纏めて動態推計部を構成する。また、動態推計部が、死亡、転出以外の住民の動態を推計してもよい。さらに、動態推計部は、一つの推計モデルを用いても、複数の推計モデルを用いてもよい。
人口動態補正部125は、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する(図8のステップ911)。
データベース130は、介護データ記憶部131、住民データ記憶部132、整形データ記憶部133、介護度推計モデル記憶部134、推計結果記憶部135、死亡推計モデル記憶部139、転出推計モデル記憶部140から構成される。
介護データ記憶部131は、入力部102に入力された複数人かつ複数年度分の要介護度、介護費、受給した介護サービス、訪問調査結果(ADL:日常生活動作、IADL:手段的日常生活動作など)などの介護データを格納する。
住民データ記憶部132は、入力部102に入力された複数人かつ複数年度分の性別、年齢、住所などの住民データを格納する。
整形データ記憶部133は、データ整形部111で作成した整形データを格納する。
介護度推計モデル記憶部134は、介護度推計モデル構築部113で構築した介護度推計モデルを格納する。
推計結果記憶部135は、介護度推計部114が推計した介護度推計結果を格納する。
死亡推計モデル記憶部139は、死亡推計モデル構築部121が構築した死亡推計モデルを格納する。
転出推計モデル記憶部140は、転出推計モデル構築部122が構築した転出推計モデルを格納する。
図2は、介護データ記憶部131が格納する介護データ200の例を示す図である。
介護データ200は、複数の住民の複数年分の介護データを管理する。介護データ200は、個人ID201、年度202、要介護度203、介護費204、日常生活自立度205、介護サービスの受給有無(通所介護211、介護予防支援212、介護保健施設213など)、介護サービスの受給回数(通所介護211、介護予防支援212、介護保健施設213など)、訪問調査結果(両足立位保持221、短期記憶222、移動223、食事摂取224、排便225、薬内服226など)を含む。
個人ID201は、一人の住民を示す識別子が登録される。年度202は、介護データが記録された年度を示す情報が登録される。要介護度203は、個人ID201の住民における各年度の要介護度を、0(介護度無)、1(要支援1)、2(要支援2)、3(要介護1)、4(要介護2)、5(要介護3)、6(要介護4)、7(要介護5)の区分で記録する。日常生活自立度205は、個人ID201の住民の各年度の日常生活自立度を、0(自立)、1(ランクI)、2(ランクIIa)、3(ランクIIb)、4(ランクIIIa)、5(ランクIIIb)、6(ランクIV)、7(ランクM)の区分で記録する。介護サービス有無211~213は、個人ID201の住民が各年度に受給した介護サービスを、その種類ごとに1(有)又は0(無)で記録し、介護サービス回数215~217は、その種類ごとに受給した回数を記録する。また、訪問調査結果221~226は、要介護認定の際に調査される74項目の訪問調査結果であり、個人ID201の各年度のADL(日常生活動作である両足立位保持221、移動223、食事摂取224、排便225等)、IADL(手段的日常生活動作である薬内服226等)、認知機能としての短期記憶222などを記録しており、例えば、両足立位保持221では、0(できる)、1(支えが必要)又は2(できない)を記録し、短期記憶222では、0(できる)又は1(できない)を記録する。訪問調査結果は、身体機能・起居動作20項目、生活機能(ADL)12項目、認知機能9項目、精神・行動障害15項目、社会生活への適応(IADL)6項目、特別な医療12項目の計74項目の調査項目からなり、介護データ200は、これらの調査結果を記録する。
図3は、住民データ記憶部132が格納する住民データ300の例を示す図である。
住民データ300は、複数の住民の複数年分の住民データを管理する。住民データ300は、個人ID201、年度202、性別303、年齢304、住所305、死亡306、転出307などを含む。年度202は、住民データが記録された年度を示す情報が登録される。性別303は、個人ID201の住民における性別が登録され、年齢304は、その住民の年齢が年度202別に登録される。また、住所305は、個人ID201の住民の住所が年度ごとに登録される。この例では、A区、B区など地区単位で登録している例を示す。死亡306は、住民が当該年度において死亡した場合に1が登録される。転出307は、住民が当該年度において他の自治体に転出した場合に1が登録される。図では全ての項目を一つの住民データに纏めたが、死亡306及び転出307は、他のデータと別のテーブルで構成してもよい。
図4は、データ整形部111が作成し、整形データ記憶部133が格納する整形データ400の例を示す図である。
整形データ400は、住民データ300及び介護データ200から、複数人分の複数年度分(例えば、T-n年度、T年度の2年度)のデータを抽出し、個人ID201及び年度202で連結して、個人を行に、年度を列に展開したデータである。図示する例では、整形データ400は、個人ID201の住民におけるT-n年度の住民・介護データ401とT年度の住民・介護データ402を示す。このn年の間隔があいた2時点の整形データ400を作成することによって、現在(T年度)データから将来(T+n年度)の介護度を推計できる。
図5は、二値化処理部112が要介護度を二値化して7個の目的変数を作成する処理を示す図である。
図5は、整形データ400から、T年度の要介護度を取得し、順序尺度データである8段階の要介護度(介護度無(0)<要支援1(1)<要支援2(2)<要介護1(3)<要介護2(4)<要介護3(5)<要介護4(6)<要介護5(7))を7箇所で2値化し、T年度の要介護度について7個の目的変数1~7(501~507)を作成する処理を示す。この処理によって、目的変数1(501)は要支援1以上(1)と介護度無(0)に二値化され、目的変数2(502)は要支援2以上(1)と要支援1以下(0)に二値化され、目的変数3(503)は要介護1以上(1)と要支援2以下(0)に二値化され、目的変数4(504)は要介護2以上(1)と要介護1以下(0)に二値化され、目的変数5(505)は要介護3以上(1)と要介護2以下(0)に二値化され、目的変数6(506)は要介護4以上(1)と要介護3以下(0)に二値化され、目的変数7(507)は要介護5以上(1)と要介護4以下(0)に二値化される。
図6は、介護度推計モデル構築部113が構築し、介護度推計モデル記憶部134が格納する介護度推計モデル600の例を示す図である。
介護度推計モデル600は、介護度推計モデル構築部113が構築した7個のロジスティック回帰式であり、二値化したT年度の要介護度である目的変数1~7(501~507)別に、T-n年度の説明変数601の回帰係数(611~617)とZ値(621~627)を記録する。目的変数1~7が示す2値化した要介護度の確率をPi(i=1~7)、説明変数をXj(j=1~J)、回帰係数をaij(i=1~7、j=1~J)とすると、介護度推計モデル600は式1で表される。なお、Jは説明変数の数である。
Pi=1/(1+exp(-Yi)), Yi=ai1×X1+・・・+aiJ×XJ (式1)
また、Z値bij(621~627)は、回帰係数aijをその標準誤差で割った値である。この値は、説明変数間の単位の違いを補正した値であり、目的変数に与える寄与の大きさを説明変数間で比較できる値である。図5及び図6に示すように、二値化したT年度の要介護度である目的変数1~7に与える寄与が高い説明変数を目的変数別に分析でき、介護の発生又は抑制、及び介護度の進行又は抑制に寄与する説明変数を抽出できる。例えば、目的変数1(501)のZ値621が正でその値が大きい説明変数は、要支援1以上の発生(介護の発生)への寄与が高い説明変数であり、逆に、Z値621が負で、その値が小さい説明変数は、要支援1以上の抑制(介護の抑制)への寄与が高い説明変数となる。また、目的変数4(504)のZ値624が正でその値が大きい説明変数は、要介護2以上の発生(介護の進行)への寄与が高い説明変数であり、逆に、Z値621が負で、その値が小さい説明変数は、要介護2以上の抑制(介護の進行抑制)への寄与が高い説明変数である。
図7は、介護度推計部114が推計し、推計結果記憶部135が格納する介護度推計結果700の例を示す図である。
介護度推計結果700は、T年度の整形データ402と、T年度の整形データ402を介護度推計モデル600に入力して推計したT+n年度の要介護度別の確率NP701を個人別に記録する。T+n年度の要介護度別の確率NP701は、介護度無の確率NP0(711)、要支援1の確率NP1(712)、要支援2の確率NP2(713)、要介護1の確率NP3(714)、要介護2の確率NP4(715)、要介護3の確率NP5(716)、要介護4の確率NP6(717)、要介護5の確率NP7(718)を含み、前述した式1で表される介護度推計モデル600にT年度の整形データ402を入力して算出され、T+n年度の2値化された要介護度の確率Piから推計する。具体的には、T+n年度の要介護度別の確率をNPi(i=0~7)は、式2で推計できる。なお、P0=0、P8=1とする。
NPi=Pi-P(i+1) (式2)
これにより、現状の介護データ及び住民データから将来の介護度を個人別に推計できる。
図8は、推計結果集計部115が、出力部103に出力する介護度推計結果表示画面800の例を示す図である。
介護度推計結果表示画面800は、集計条件入力欄810、介護度別推計人数表示欄820及び人口動態補正切替欄830を含む。集計条件入力欄810は、この例では、T年度の性別811及び年齢812を入力する欄を設けているが、整形データに格納されているT年度の任意のデータ項目を条件として入力する欄を設けてもよい。介護度別推計人数表示欄820は、集計条件入力欄810に入力された条件に合致する介護度推計結果700を、T年度の介護度別人数(821~824)及びT+n年度の介護度別推計人数(831~834)を住所別(地区別)に表示する。図示する例では、要介護2以上を表示している。住所別(地区別)のT+n年度の介護度別推計人数は、介護度推計結果700を用いて、住所別(地区別)に、要介護度別の確率NP0~NP7(711~718)を集計して算出する。人口動態補正切替欄830は、図9のステップ911に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄830の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。
図7に示す介護度推計結果700の例では、A区に住んでいる住民は、個人IDがK0001及びK0003であるので、A区の介護度無の推計人数はNP01+NP03、要支援1はNP11+NP13、要支援2はNP21+NP23、要介護1はNP31+NP33、要介護2はNP41+NP43、要介護3はNP51+NP53、要介護4はNP61+NP63、要介護5はNP71+NP73で各々算出される。これにより、地区単位など任意の条件で将来の介護度別の人数を推計でき、自治体の地区診断に活用できる。例えば、図8に示すように、将来(T+n年度)の要介護2以上の人数について、A区がB区より増加し、C区がD区より増加することが推計できれば、A区とC区に対して重点的に介護予防施策を適用するなどの効果的な施策立案が可能になる。
次に、図9のフローチャートを用いて、介護度推計処理を説明する。
図9の処理を開始すると、まず、データ入力ステップ901を実行する。データ入力ステップ901では、将来推計端末101の入力部102が、介護データ200(図2)及び住民データ300(図3)の入力を受ける。入力された介護データ200は介護データ記憶部131に格納され、入力された住民データ300は住民データ記憶部132に格納される。
次に、データ整形ステップ902では、データ整形部111が、データ入力ステップ901で入力された介護データ200(図2)及び住民データ300(図3)から、複数の住民の2年度分(T-n年度、T年度)のデータを抽出し、個人ID201及び年度202で連結した上で、個人を行に、年度を列に展開した整形データ400(図4)を作成する。作成された整形データ400は、整形データ記憶部133に格納される。
次に、二値化処理ステップ903では、二値化処理部112が、データ整形ステップ902で作成された整形データ400から、T年度の要介護度を取得し、順序尺度データである8段階の要介護度(介護度無(0)<要支援1(1)<要支援2(2)<要介護1(3)<要介護2(4)<要介護3(5)<要介護4(6)<要介護5(7))を7箇所で2値化し、図5で説明したように、T年度の要介護度について7個の目的変数1~7(501~507)を作成する。
次に、介護度推計モデル構築ステップ904では、介護度推計モデル構築部113が、二値化処理ステップ903で作成されたT年度の要介護度を二値化した7個の目的変数1~7について、T-n年度の整形データ400を説明変数としたロジスティック回帰分析を各目的変数別に7回実行し、7個のロジスティック回帰式から構成される介護度推計モデル600(図6)を構築する。構築された介護度推計モデル600は、介護度推計モデル記憶部134に格納される。
次に、介護度推計ステップ905では、介護度推計部114が、介護度推計モデル構築ステップ904で構築された介護度推計モデル600に、データ整形ステップ902で作成されたT年度の整形データを入力し、将来(T+n年度)の要介護度別の確率を個人別に推計する。具体的には、図7で説明したように、まず、式1で表される介護度推計モデル600にT年度の整形データを入力して、T+n年度の2値化された要介護度の確率Pi(P1~P7)を算出し、次に、T+n年度の2値化された要介護度の確率Piを式2に入力して、T+n年度の要介護度別の確率NPi(NP0~NP7)を個人別に推計する。推計された将来の介護度推計結果700は、推計結果記憶部135に格納される。
次に、人口動態補正ステップ911では、死亡推計部123が、ステップ910で構築されて死亡推計モデル記憶部139に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部124は、ステップ910で構築されて転出推計モデル記憶部140に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部125が、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。なお、死亡推計部123、転出推計部124及び人口動態補正部125は、人口動態補正切替欄830の設定にかかわらず介護度の推計結果の人口動態補正データを生成するが、人口動態補正切替欄830で「人口動態補正あり」が選択されている場合に、推計結果集計ステップ906の中で介護度の推計結果の人口動態補正データを生成してもよい。
ここで、死亡モデル・転出モデル構築ステップ910について説明する。死亡モデル・転出モデル構築ステップ910では、死亡推計モデル構築部121が、モデル構築用データの各項目を説明変数、死亡306を目的変数として用いたロジスティック回帰分析によって、住民の生死を個人別に推定するための死亡推計モデルを構築する。また、転出推計モデル構築部122が、転出307を目的変数とし、作成されたモデル構築用データの各項目を複数の説明変数として用いたロジスティック回帰分析によって、当該自治体から住民が転出するかを個人別に推定するための転出推計モデルを構築する。
次に、推計結果集計ステップ906では、推計結果集計部115が、まず、介護度推計結果表示画面800(図8)を出力部103に表示し、集計条件(T年度の性別、年齢、住所など)の入力部102への入力をユーザに促す。次に、入力された集計条件に基づいて、介護度推計ステップ905で推計された個人別の介護度推計結果を集計して、介護度別の将来推計人数を出力部103に表示する。図8に例示する介護度推計結果表示画面800では、T年度の男性かつ年齢60歳以上の住民を対象に、T年度(現在)の要介護2以上の人数及びT+n年度(将来)の要介護2以上の将来推計人数を住所別(地区別)に表示している。ユーザは、この情報に基づいて地区別に診断を行い、介護予防施策をどの地区に重点的に配分するかなどの意思決定を行う。
以上により、介護度推計処理を終了する。
図10は、実施例1の死亡モデル・転出モデル構築ステップ910から人口動態補正ステップ911を示す概念図である。
死亡推計モデル構築部121は、整形データ400の各項目を説明変数とし、死亡306を目的変数として用いたロジスティック回帰分析によって死亡推計モデルを構築して、死亡推計モデル記憶部139に格納する。転出推計モデル構築部122は、整形データ400の各項目を説明変数とし、転出307を目的変数として用いたロジスティック回帰分析によって転出推計モデルを構築して、転出推計モデル記憶部140に格納する。
その後、死亡推計部123は、構築された死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定して、住民毎の死亡率を計算する。転出推計部124は、構築された転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定して、住民毎の転出率を計算する。
さらに、介護度推計モデル構築部113は、整形データ400を二値化した要介護度における7個の目的変数1~7について、T-n年度の整形データ400を説明変数としたロジスティック回帰分析によって、介護度別の介護度推計モデルを構築して、介護度推計モデル記憶部134に格納する。
介護度推計部114は、介護度推計モデル記憶部134に格納された介護度推計モデルを用いて、T+n年度の要介護度別の確率を個人別に推計して、介護度推計結果700を推計結果記憶部135に格納する。
最後に、推計結果集計部115は、集計条件(T年度の性別、年齢、住所など)に基づいて、介護度推計部114で推計された個人別の介護度推計結果を集計して(例えば、要介護度別の確率を合計して)、任意の集団単位で介護度別の将来推計人数を出力して、推計結果記憶部135に格納する。
人口動態補正が必要である場合、人口動態補正部125は、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。例えば、要介護度別の確率の合計値から、死亡率Daと転出率Taの和に介護度推計結果(確率Npa0)を乗じた値を全員について減じることによって、人口動態補正後の介護度推計結果を算出できる。個人別の場合は、要介護度別の確率(Npa0~Npa7)から、死亡率Daと転出率Taの和に要介護度別の確率(Npa0~Npa7)を乗じた値を減じればよい。
以上に説明したように、実施例1の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データから、将来の介護度を地区単位や個人単位などミクロな単位で推計できる。また、住民の死亡や転出による人口動態補正を行って介護度を補正するので、より正確に介護度を推計できる。このため、将来の介護度推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策立案が可能になる。
<実施例2>
実施例2では、実施例1で用いた介護データ及び住民データだけでなく、医療データ及び健診データも加えて、将来の介護度を個人単位に推計する将来推計システムの例を説明する。なお、実施例1で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。また、実施例2では、医療データ及び健診データの両方を用いて将来の介護度を推計する将来推計システムを説明するが、医療データ及び健診データの一方を用いてもよい。
図11は、本実施例の将来推計システムの構成を示すブロック図である。実施例2の将来推計システムでは、実施例1の将来推計システム(図1)に、医療データ記憶部136及び健診データ記憶部137が追加される。
医療データ記憶部136は、入力部102に入力された複数人分、複数年度分のアルツハイマー病、パーキンソン病、脊椎障害、関節症などの疾病別の医療機関受診有無及び疾病別の医療費などの医療データを格納する。
健診データ記憶部137は、入力部102に入力された複数人分かつ複数年度分の健康診断の対象者及び健康診断の受診有無などの健診データを格納する。
図12は、医療データ記憶部136が格納する医療データ1100の例を示す図である。
医療データ1100は、複数の住民の複数年分の医療データを管理する。医療データ1100は、個人ID201、年度202、アルツハイマー病、パーキンソン病、脊椎障害、関節症、骨折、てんかん、脳内出血などの疾病別の医療機関受診有無1111~1117及び疾病別の医療費1121~1127を含む。年度202は、医療機関を受診した年度(年月でもよい)を示す情報を記録する。疾病別の医療機関受診有無1111~1117は、個人ID201の各年度の疾病別の受診有無を、1(有)、0(無)として記録する。疾病別医療費1121~1127は、個人ID201の各年度の疾病別医療費を記録する。
図13は、健診データ記憶部137が格納する健診データ1200の例を示す図である。
健診データ1200は、複数の住民の複数年分の健康診断のデータを管理する。健診データ1200は、個人ID201、年度202、健診対象者フラグ1203及び健診受診有無1204を含む。年度202は、健康診断を受診した年度(年月でもよい)を示す情報が登録される。健診対象者フラグ1203は、個人ID201の住民が健康診断の対象者か否かを、1(対象)、0(対象外)として年度別に記録する。健診受診有無1204は、個人ID201の住民が健康診断を受診したか否かを、1(健康診断受診有)、0(健康診断受診無)として年度別に記録する。また、健診データ1200は、健康診断の結果(検査値、問診結果)を記録してもよい。
図14は、データ整形部111が作成し、整形データ記憶部133が格納する整形データ1300の例を示す図である。
整形データ1300は、図4の整形データ400(介護データ、住民データ)に、医療データ1100及び健診データ1200を連結したデータである。すなわち、整形データ1300は、住民データ300、介護データ200、医療データ1100及び健診データ1200から、複数人分の2年度分(T-n年度、T年度)のデータを抽出し、個人ID201と年度202で連結した上で、個人を行に、年度を列に展開したデータである。個人ID201の住民におけるT-n年度の住民・介護・医療・健診データ1301とT年度の住民・介護・医療・健診データ1302を示している。このn年間隔があいた2時点の整形データ1300を作成することによって、現在(T年度)の住民・介護・医療・健診データから将来(T+n年度)の介護度を推計できる。
図15は、介護度推計モデル構築部113が、図14に示す整形データ1300(住民・介護・医療・健診データ)を用いて構築し、介護度推計モデル記憶部134が格納する介護度推計モデル1400の例を示す図である。実施例2の介護度推計モデル1400は、実施例1の介護度推計モデル600(図6)の説明変数に、疾病別医療機関受診有無、疾病別医療費などの医療説明変数1401と、健診受診有無の健診説明変数1402が追加されている。
介護度推計モデル1400は、実施例1で説明したように、まず、二値化処理部112が、図14の整形データ1300のT年度の要介護度を二値化して目的変数1~7を作成し、その後、介護度推計モデル構築部113がT-n年度の整形データ1301(住民・介護・医療・健診データ)を説明変数としたロジスティック回帰分析を目的変数別に実行して構築される。実施例2の介護度推計モデル1400は、二値化したT年度の要介護度である目的変数1~7(501~507)別に、T-n年度の説明変数601の回帰係数(611~617)及びZ値(621~627)を記憶しており、医療データ1100及び健診データ1200の追加により、疾病別医療機関受診有無及び疾病別医療費などの医療説明変数1401(X20、X21…)と、健診受診有無の健診説明変数1402(X30)とが介護度推計モデル1400に追加される。これにより、現在の住民データ及び介護データだけでなく、医療データ及び健診データを考慮して、将来(T+n年度)の介護度を個人単位に推計できる。
次に、図9のフローチャートを用いて、本実施例の介護度推計処理を説明する。
図9の処理を開始すると、まず、データ入力ステップ901を実行する。データ入力ステップ901では、将来推計端末101の入力部102が、介護データ200(図2)、住民データ300(図3)、医療データ1100(図12)及び健診データ1200(図13)の入力を受ける。入力された介護データ200は介護データ記憶部131に格納され、入力された住民データ300は住民データ記憶部132に格納され、入力された医療データ1100は、医療データ記憶部136に格納され、入力された健診データ1200は、健診データ記憶部137に格納される。
次に、データ整形ステップ902では、データ整形部111が、データ入力ステップ901で入力された介護データ200(図2)、住民データ300(図3)、医療データ1100(図12)及び健診データ1200(図13)から、複数の住民の2年度分(T-n年度、T年度)のデータを抽出し、個人ID201及び年度202で連結した上で、個人を行に、年度を列に展開した整形データ1300(図14)を作成する。医療・健診データも含んで作成された整形データ1300は、整形データ記憶部133に格納される。
次に、実施例1と同様に、二値化処理ステップ903と介護度推計モデル構築ステップ904を実行する。
二値化処理ステップ903では、二値化処理部112が、医療データ及び健診データを含む整形データ1300(図14)から、T年度の要介護度について7個の目的変数1~7(501~507)を作成する。
次に、介護度推計モデル構築ステップ904では、介護度推計モデル構築部113が、二値化処理ステップ903で作成されたT年度の要介護度を二値化した7個の目的変数1~7について、T-n年度の医療データ及び健診データを含む整形データ1300を説明変数としたロジスティック回帰分析を各目的変数別に7回実行し、7個のロジスティック回帰式から構成される介護度推計モデル1400(図15)を構築する。構築された介護度推計モデル1400は、介護度推計モデル記憶部134に格納される。
次に、実施例1と同様に、介護度推計ステップ905、人口動態補正ステップ911及び推計結果集計ステップ906を実行する。
介護度推計ステップ905では、介護度推計部114が、介護度推計モデル構築ステップ904で構築された介護度推計モデル1400(図15)に、T年度の医療データ及び健診データを含む整形データ1300を入力して、将来(T+n年度)の要介護度別の確率を個人別に推計し、介護度推計結果700を作成する。作成された将来の介護度推計結果700は、推計結果記憶部135に格納される。
人口動態補正ステップ911では、死亡推計部123が、ステップ910で構築されて死亡推計モデル記憶部139に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部124は、ステップ910で構築されて転出推計モデル記憶部140に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部125が、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。
推計結果集計ステップ906では、推計結果集計部115が、ユーザが入力した集計条件に基づいて、介護度推計結果を集計して、介護度別の将来推計人数を、図8に例示する介護度推計結果表示画面800で出力部103に表示する。ユーザは、この情報に基づいて地区別に診断を行い、介護予防施策をどの地区に重点的に配分するかなどの意思決定を行う。
以上により、本実施例の介護度推計処理を終了する。
以上に説明したように、実施例2の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データに加えて、医療データ及び健診データも考慮して将来の介護度を推計するので、個人単位や地区単位の将来の介護度をより高精度に推計できる。実際のデータで介護度推計精度を検証すると、1年後の個人の介護度を95%以上の正解率で高精度に推計できることが分かった。また、住民の死亡や転出による人口動態補正を行って介護度を補正するので、より正確に介護度を推計できる。また、将来の介護度推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策立案が可能になる。
<実施例3>
実施例3では、実施例1で推計した将来の介護度だけでなく、住民データ及び介護データから将来の介護費を個人単位に推計する将来推計システムの例を説明する。なお、実施例1、2で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。
図16は、本実施例の将来推計システムの構成を示すブロック図である。実施例3の将来推計システムでは、実施例1の将来推計システム(図1)に、介護費推計モデル構築部116、介護費推計部117及び介護費推計モデル記憶部138が追加される。
介護費推計モデル構築部116は、データ整形部111で作成された整形データ400(図4)から、T年度の要介護度及び介護費を取得し、T年度の介護費を目的変数とし、T年度の要介護度を説明変数とした線形回帰分析を行い、T年度の要介護度からT年度の介護費を推計する線形回帰式である介護費推計モデル1600(図17)を構築する。なお、将来推計システムの外部から介護費推計モデルが提供される場合、将来推計端末101は介護費推計モデル構築部116を有さなくてもよい。
介護費推計部117は、介護費推計モデル構築部116で構築された介護費推計モデル1600に、介護度推計部114で推計された図7が示すT+n年度の要介護度別の確率NP(701)を入力し、T+n年度の介護費を個人別に推計する(図18)。推計された介護費推計結果は、介護度推計結果と共に、推計結果記憶部135に格納される。
介護費推計モデル記憶部138は、介護費推計モデル構築部116が構築した介護費推計モデルを格納する。
図17は、介護費推計モデル構築部116が構築し、介護費推計モデル記憶部138が格納する介護費推計モデル1600の例を示す図である。
介護費推計モデル1600は、介護費推計モデル構築部116が構築した線形回帰式であり、T年度の介護費を目的変数1604とし、T年度の要介護度を説明変数1603とした線形回帰分析により算出した回帰係数を記録する。要介護度をXCi(i=1~7、要支援1の有無XC1、要支援2の有無XC2、要介護1の有無XC3、要介護2の有無XC4、要介護3の有無XC5、要介護4の有無XC6、要介護5の有無XC7)、回帰係数をci(i=1~7)、介護費をNCEとすると、介護費推計モデル1600は式3で表される。T+n年度の要介護度別の確率NPi(i=1~7)を、式3のXCi(i=1~7)に、それぞれ入力することによって、将来(T+n年度)の介護費NCE1701を個人別に推計できる。このように、介護度の推計結果を用いて介護費を推計することによって、介護度と介護費が連動した将来推計が可能となり、自治体の介護施策立案に活用しやすい推計結果を作成できる。
NCE=c1×XC1+・・・+c7×XC7 (式3)
図18は、介護度推計部114及び介護費推計部117が推計した介護度・介護費推計結果1700の例を示す図である。介護度・介護費推計結果1700は、T年度の整形データ402と、T年度の整形データ402を介護度推計モデル600に入力して推計したT+n年度の要介護度別の確率NP701と、T+n年度の要介護度別の確率NP701を介護費推計モデル1600に入力して推計したT+n年度の介護費NCE1701とを含む。
図19は、推計結果集計部115が、出力部103に出力する介護度・介護費推計結果表示画面1800の例を示す図である。介護度・介護費推計結果表示画面1800は、実施例1の介護度推計結果表示画面800(図8)に、介護費推計結果表示欄1820を追加したものであり、集計条件入力欄810、介護度別推計人数表示欄820、人口動態補正切替欄830及び介護費推計結果表示欄1820を含む。
介護度別推計人数表示欄820は、実施例1の介護度推計結果表示画面800(図8)と同様に、集計条件入力欄810に入力された条件に合致する介護度・介護費推計結果1700を抽出して、T年度の介護度別人数(821~824)及びT+n年度の介護度別推計人数(831~834)を住所別(地区別)に表示する。図示する例では、要介護2以上を表示している。
人口動態補正切替欄830は、図20のステップ911に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄830の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。
介護費推計結果表示欄1820は、集計条件入力欄810に入力された条件に合致する介護度・介護費推計結果1700を抽出して、T年度の介護費推計結果(1821~1824)及びT+n年度の介護費推計結果(1831~1834)を住所別(地区別)に表示する。住所別(地区別)のT+n年度の介護費推計結果は、介護度・介護費推計結果1700を用いて、住所別(地区別)に、介護費NCE(1701)を集計して算出する。図18に示す介護度・介護費推計結果1700の例では、A区に住んでいる住民は、個人IDがK0001とK0003であるので、A区の介護費推計結果はNCE1+NCE3で算出される。これにより、地区単位など任意の条件で将来の介護費を推計でき、人数だけでなく費用面も考慮した地区診断を行うことができる。例えば、図19に示すように、将来(T+n年度)の介護費が、A区がB区より増加し、C区がD区より増加することが推計されたならば、A区及びC区に対して重点的に介護予防施策を適用するなどの効果的な施策立案が可能になる。
次に、図20のフローチャートを用いて本実施例の介護度・介護費推計処理を説明する。
図20の処理を開始すると、データ入力ステップ901、データ整形ステップ902、二値化処理ステップ903、介護度推計モデル構築ステップ904、介護度推計ステップ905を実行する。これらのステップは、図9で説明した将来の介護度を推計するステップ901~905と同じ処理である。
次に、介護費推計モデル構築ステップ907では、介護費推計モデル構築部116が、データ整形ステップ902で作成されたT年度の整形データを用いて、T年度の介護費を目的変数、T年度の要介護度を説明変数とした線形回帰分析を行い、要介護度から介護費を推計するための介護費推計モデル1600を構築する。構築された介護費推計モデル1600は、介護費推計モデル記憶部138に格納される。
次に、介護費推計ステップ908では、介護費推計部117が、介護費推計モデル構築ステップ907で構築された介護費推計モデル1600に、介護度推計ステップ905で推計されたT+n年度の要介護度別の確率NPiを入力して、T+n年度の介護費を個人別に推計する。推計された将来の介護費推計結果は、介護度推計結果と共に、推計結果記憶部135に格納される。
次に、人口動態補正ステップ911では、死亡推計部123が、ステップ910で構築されて死亡推計モデル記憶部139に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部124は、ステップ910で構築されて転出推計モデル記憶部140に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部125が、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、介護度及び介護費の推計結果を補正する。なお、死亡推計部123、転出推計部124及び人口動態補正部125は、人口動態補正切替欄830の設定にかかわらず介護度及び介護費の推計結果の人口動態補正データを生成するが、人口動態補正切替欄830で「人口動態補正あり」が選択されている場合に、推計結果集計ステップ906の中で介護度の推計結果の人口動態補正データを生成してもよい。
死亡モデル・転出モデル構築ステップ910については、前述した実施例1と同じである。
次に、推計結果集計ステップ906では、推計結果集計部115が、まず、介護度・介護費推計結果表示画面1800(図19)を出力部103に表示し、集計条件(T年度の性別、年齢、住所など)の入力部102への入力をユーザに促す。次に、入力された集計条件に基づいて、介護度推計ステップ905及び介護費推計ステップ908で推計された個人別の介護度・介護費推計結果を集計して、介護度別の将来推計人数と将来の介護費を出力部103に表示する。図19に例示する介護度・介護費推計結果表示画面1800では、T年度の男性かつ年齢60歳以上の住民を対象に、T年度(現在)の要介護2以上の人数及び介護費と、T+n年度(将来)の要介護2以上の将来推計人数及び介護費推計結果を住所別(地区別)に表示している。ユーザは、この情報に基づいて地区別に診断を行い、介護予防施策をどの地区に重点的に配分するかなどの意思決定を行う。
以上により、介護度・介護費推計処理を終了する。
図21は、実施例3の死亡モデル・転出モデル構築ステップ910から人口動態補正ステップ911を示す概念図である。
死亡推計モデル構築部121は、整形データ400の各項目を説明変数とし、死亡306を目的変数して用いたロジスティック回帰分析によって死亡推計モデルを構築して、死亡推計モデル記憶部139に格納する。転出推計モデル構築部122は、整形データ400の各項目を説明変数とし、転出307を目的変数として用いたロジスティック回帰分析によって転出推計モデルを構築して、転出推計モデル記憶部140に格納する。
その後、死亡推計部123は、構築された死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定して、住民毎の死亡率を計算する。転出推計部124は、構築された転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定して、住民毎の転出率を計算する。
さらに、介護度推計モデル構築部113は、整形データ400を二値化した要介護度における7個の目的変数1~7について、T-n年度の整形データ400を説明変数としたロジスティック回帰分析によって、介護度別の介護度推計モデルを構築して、介護度推計モデル記憶部134に格納する。また、介護費推計モデル構築部116は、整形データ400から、T年度の要介護度及び介護費を取得し、T年度の介護費を目的変数とし、T年度の要介護度を説明変数とした線形回帰分析を行い、T年度の要介護度からT年度の介護費を推計する線形回帰式である介護費推計モデルを構築して、介護費推計モデル記憶部138に格納する。
介護度推計部114は、介護度推計モデル記憶部134に格納された介護度推計モデルを用いて、T+n年度の要介護度別の確率を個人別に推計する。介護費推計部117は、介護費推計モデル記憶部138に格納された介護費推計モデルを用いて、T+n年度の介護費を個人別に推計する。介護度・介護費推計結果2200は推計結果記憶部135に格納される。
最後に、推計結果集計部115は、集計条件(T年度の性別、年齢、住所など)に基づいて、介護度推計部114で推計された個人別の介護度推計結果を集計して(例えば、要介護度別の確率を合計して)、任意の集団単位で介護度別の将来推計人数を出力して、推計結果記憶部135に格納する。また、推計結果集計部115は、集計条件に基づいて、介護費推計部117で推計された個人別の介護費推計結果を集計して(例えば、各人の介護費の推計結果を合計して)、任意の集団単位の介護費を出力して、推計結果記憶部135に格納する。
人口動態補正が必要である場合、人口動態補正部125は、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。例えば、要介護度別の確率の合計値から、死亡率Daと転出率Taの和に介護度推計結果(確率Npa0)を乗じた値を全員について減じることによって、人口動態補正後の介護度推計結果を算出できる。介護費については、介護費の合計値から、死亡率Daと転出率Taの和に介護費推計結果Ncaを乗じた値を全員について減じることによって、人口動態補正後の介護費推計結果を算出できる。個人別の場合は、介護費Ncaから、死亡率Daと転出率Taの和に介護費Ncaを乗じた値を減じればよい。
以上に説明したように、実施例3の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データから、将来の介護度及び将来の介護費を地区単位や個人単位などミクロな単位で推計できる。また、住民の死亡や転出による人口動態補正を行って介護度及び介護費を補正するので、より正確に介護度や介護費を推計できる。このため、将来の介護度・介護費推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策を立案が可能になる。また、実施例3の将来推計システムは、介護度の推計結果から介護費を推計するため、介護度と介護費とが連動した将来推計ができ、自治体の介護施策立案に活用しやすい推計結果を出力できる。
<実施例4>
実施例4では、実施例3で用いた介護データ及び住民データだけでなく、医療データ及び健診データも加えて、将来の介護度及び介護費を個人単位に推計する将来推計システムの例を説明する。なお、実施例1~3で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。また、実施例4では、医療データ及び健診データの両方を用いて将来の介護度及び介護費を推計する将来推計システムを説明するが、医療データ及び健診データの一方を用いてもよい。
図22は、本実施例の将来推計システムの構成を示すブロック図である。実施例4の将来推計システムでは、実施例3の将来推計システム(図16)に、実施例2で説明した医療データ記憶部136及び健診データ記憶部137が追加される。
実施例2で説明したように、将来推計システムは、データ整形部111、二値化処理部112、介護度推計モデル構築部113及び介護度推計部114によって、図14に示すT年度の整形データ(住民・介護・医療・健診データを連結したデータ)からT+n年度の要介護度別の確率を個人別に推計し、将来の介護度推計結果を作成する。
また、実施例3で説明したように、将来推計システムは、介護費推計モデル構築部116と介護費推計部117により、T+n年度の要介護度別の確率から、T+n年度の介護費を個人別に推計し、将来の介護費推計結果を作成する。
推計結果集計部115は、入力部102に入力されたユーザの集計条件(T年度の性別、年齢、住所など)に基づいて、個人別の介護度推計結果及び介護費推計結果を集計して、地区別など任意の集団単位で、将来の介護度別推計人数と将来介護費を出力部103に表示する。
以上に説明したように、実施例4の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データに加えて、医療データ及び健診データも考慮して、将来の介護度及び介護費を推計するので、個人単位や地区単位の将来の介護度及び将来の介護費をより高精度に推計できる。実際のデータで推計精度を検証すると、1年後の介護度を95%以上の正解率、1年後の介護費を推計誤差1%以下で高精度に推計できることが分かった。また、住民の死亡や転出による人口動態補正を行って介護度及び介護費を補正するので、より正確に介護度や介護費を推計できる。また、将来の介護度・介護費推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策を立案できる。また、実施例4の将来推計システムでは、介護度の推計結果から介護費を推計するため、介護度と介護費とが連動した将来推計ができ、自治体の介護施策立案に活用しやすい推計結果を出力できる。
<実施例5>
実施例5では、介護度推計モデルから、将来の介護発生又は介護進行を抑制する施策となる説明変数を抽出し、その施策の効果を推計する将来推計システムの例を説明する。なお、実施例1~4で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。
図23は、本実施例の将来推計システムの構成を示すブロック図である。実施例5の将来推計システムは、介護度推計部114、介護費推計部117に加え、説明変数抽出部118、入力値変更部119及び施策効果推計部110を有する。また、データベース130は、前述した整形データ記憶部133、介護度推計モデル記憶部134、推計結果記憶部135及び介護費推計モデル記憶部138から構成される。なお、実施例5の将来推計システムは、既に介護度推計モデル600、1400(図6又は図15)及び介護費推計モデル1600(図17)があることを想定しているので、介護度推計モデル構築部113及び介護費推計モデル構築部116を有さないが、前述した実施例のように、介護度推計モデル構築部113及び介護費推計モデル構築部116が、整形データ400、1300(図4又は図14)から介護度推計モデルや介護費推計モデルを構築してもよい。また、データ整形部111、二値化処理部112及び推計結果集計部115を有してもよい。
説明変数抽出部118は、入力部102でユーザが選択した目的変数(対策が必要な介護度)を対象として、介護度推計モデル600、1400(図6又は図15)から、Z値が負の説明変数を値が小さい順に抽出する。
入力値変更部119は、整形データ記憶部133が管理するT年度の整形データ400、1300(図4又は図14)を取得し、説明変数抽出部118が抽出した説明変数別に、その変数と一致するデータ項目の入力値を変更する。具体的には、その説明変数と一致するデータ項目の入力値を全て有(1)に変更した場合(図24、図29)と、全て無(0)に変更した場合(図25、図30)の二つの整形データを作成する。
介護度推計部114は、入力値変更部119で入力値が変更された二つの整形データを、それぞれ、介護度推計モデルに入力し、T+n年度の要介護度別の確率を推計する。ここで、T+n年度の要介護度別の確率は、入力値を全て有(1)にした場合と、全て無(0)にした場合について推計される。
介護費推計部117は、介護度推計部114で推計されたT+n年度の要介護度別の確率を、介護費推計モデルに入力し、T+n年度の介護費を個人別に推計する。ここで、T+n年度の介護費は、入力値を全て有(1)にした場合と、全て無(0)にした場合について推計される。
施策効果推計部110は、入力値を全て有(1)にした場合の介護度・介護費推計結果(図24、図29)と、全て無(0)にした場合の介護度・介護費推計結果(図25、図30)の差分を施策効果として推計する。
図24は、介護サービスである通所介護の実施率を100%(入力値を全て有(1)に変更)にした場合の介護度・介護費推計結果2200の例を示す図である。介護度・介護費推計結果2200は、領域2201に示すように、通所介護の入力値を全て有(1)に変更したT年度の整形データ402と、介護度推計モデルに入力して推計したT+n年度の要介護度別の確率fNP2202を介護費推計モデルに入力して推計したT+n年度の介護費fNCE2203を格納する。ここで、介護サービスに関するデータは有無データ及び回数データがあるので、有無データの入力値を全て有(1)に変更し、回数データの入力値を全て平均回数に変更する(2201)。
図25は、介護サービスである通所介護の実施率を0%(入力値を全て無(0)に変更)にした場合の介護度・介護費推計結果2300の例を示す図である。介護度・介護費推計結果2300は、領域2301に示すように、通所介護の入力値を全て無(0)に変更したT年度の整形データ402と、介護度推計モデルに入力して推計したT+n年度の要介護度別の確率eNP2302を介護費推計モデルに入力して推計したT+n年度の介護費eNCE2303を格納する。ここで、介護サービスに関するデータは有無データ及び回数データがあるので、有無データを全て無(0)に変更し、回数データも全て0回に変更する(2301)。
図26は、施策効果推計部110が、出力部103に出力する介護施策効果シミュレーション画面2400の例を示す図である。
介護施策効果シミュレーション画面2400は、対策介護度選択欄2410、人口動態補正切替欄830、介護施策選択タブ表示欄2420、施策効果推計対象者の選定欄2430、施策効果推計結果表示欄2440及び集計条件入力欄810を含む。
対策介護度選択欄2410は、入力部102で対策が必要な介護度(目的変数)をユーザに選択させる欄である。図示する例では、対策が必要な介護度(目的変数)として、ユーザが「要介護2以上」が選択されている。
人口動態補正切替欄830は、図28のステップ911に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄830の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。
介護施策選択タブ表示欄2420は、対策介護度選択欄2410で選択された介護度(目的変数)の抑制に寄与が大きい説明変数を選択タブで表示する。具体的には、説明変数抽出部118が、対策介護度選択欄2410で選択された目的変数を対象に、介護度推計モデル(図6又は図15)から、Z値が負の説明変数を値が小さい順に抽出して表示する。図示する例では、目的変数が「要介護2以上」で、「要介護2以上」の抑制に寄与が大きい説明変数が抽出されており、介護度推計モデルから、Z値が負の説明変数を値が小さい順に抽出すると、通所介護2421、介護予防支援2422、介護保健施設2423である例を示す。ユーザは、この選択タブから介護施策を選択する。図示する例では、介護サービスの通所介護2421が選択されている。
施策効果推計対象者の選定欄2430は、施策実施率表示欄2431及び個人別の介護度・介護費抑制効果表示欄2435を含む。
施策実施率表示欄2431は、介護施策選択タブ表示欄2420で選択された介護施策の実施率及び実施人数を示し、デフォルトで表示される初期値は、現在(T年度)の実施率及び実施人数である。図示する例では、通所介護のT年度の実施率が30%で、実施人数が2千人である。
個人別の介護度・介護費抑制効果表示欄2435は、施策効果推計対象者選択欄2432、個人ID201、T年度の整形データ402、T+n年度の介護度・介護費推計結果2200、2300及びT+n年度の介護費抑制額(fNCE-eNCE)2433を個人別に表示する。介護度・介護費推計結果2200は、図24で説明した介護施策の実施率が100%である場合のT+n年度の要介護度別の確率fNP2202及び介護費fNCE2203である。介護度・介護費推計結果2300は、図25で説明した介護施策の実施率が0%である場合のT+n年度の要介護度別の確率eNP2302及び介護費eNCE2303である。T+n年度の介護費抑制額は、介護施策の実施率が100%である場合の介護費fNCEから介護施策の実施率が0%である場合の介護費eNCEを減じた値である。施策効果推計対象者選択欄2432は、介護施策を実施する対象者が選択される欄であり、デフォルトでは、現在(T年度)にその介護施策を実施された人が選択されている。この例では、個人ID201がK0002の人が通所介護を実施する人として選択されている。また、個人別の介護度・介護費抑制効果表示欄2435では、個人別の介護度・介護費抑制効果をその効果が高い順に表示する。具体的には、T+n年度の介護費抑制額(fNCE-eNCE)2433が大きい順に表示するとよい。図示する例では、個人IDがK0003の人の介護費抑制額(fNCE3-eNCE3)が最大で、次がK0002の人である。
ユーザは、個人別の介護度・介護費抑制効果表示欄2435や後述する施策効果推計結果表示欄2440を参照して、施策効果推計対象者選択欄2432で、介護施策を実施する対象者を個別に選択し、変更する。また、施策実施率表示欄2431の実施率や実施人数を変更しても、介護施策を実施する対象者を選択できる。施策実施率表示欄2431の実施率を変更した場合、介護費抑制額2433が大きい対象者から降順に選択される。
施策効果推計結果表示欄2440は、介護度別推計人数表示欄2441及び介護費推計結果表示欄2451を含む。
介護度別推計人数表示欄2441は、施策効果推計部110が、施策効果推計対象者の選定欄2430で選択された対象者全体について、T年度の要介護度及びT+n年度の要介護度別の確率fNP2202とeNP2302を集計し、T年度の介護度別人数821、施策実施率表示欄2431に表示された実施率の場合のT+n年度の介護度別推計人数831及び実施率が0%の場合のT+n年度の介護度別推計人数2442を表示する。図示する例では要介護2以上の人数を表示している。さらに、実施率が0%の場合のT+n年度の介護度別推計人数2442と、施策実施率表示欄2431に表示された実施率の場合のT+n年度の介護度別推計人数831の差分を算出し、介護施策により抑制される介護人数2443を表示する。図示する例では、通所介護を実施率30%で実施すると、介護人数2443が500人抑制される。
介護費推計結果表示欄2451は、施策効果推計部110が、施策効果推計対象者の選定欄2430で選択された全ての対象者について、T年度の介護費とT+n年度の介護費fNCE2203及びeNCE2303を集計し、T年度の介護費1821、施策実施率表示欄2431に表示された実施率の場合のT+n年度の介護費1831及び実施率が0%の場合のT+n年度の介護費2452を表示する。さらに、実施率が0%の場合のT+n年度の介護費2452と、施策実施率表示欄2431に表示された実施率の場合のT+n年度の介護費1831の差分を算出し、介護施策により抑制される介護費2453を表示する。図示する例では、通所介護を実施率30%で実施すると、介護費2453が10億円抑制される。
集計条件入力欄810は、個人別の介護度・介護費抑制効果表示欄2435に表示する対象者の条件を入力する欄である。図示する例では、T年度の年齢入力欄812及び住所入力欄813を設けているが、整形データ400、1300に含まれているT年度の任意のデータ項目を条件とする入力する欄を設けてもよい。図示する例では、年齢入力欄812に40歳以上、住所入力欄813にA区及びB区が入力されている。
図27は、施策効果推計部110が、出力部103に出力する介護施策効果シミュレーション画面2500の例を示す図である。図27では、図26に示す介護施策効果シミュレーション画面2400の介護施策の実施率を変更した例を示す。
介護施策効果シミュレーション画面2500は、対策介護度選択欄2410、人口動態補正切替欄830、介護施策選択タブ表示欄2420、施策効果推計対象者の選定欄2430、施策効果推計結果表示欄2440及び集計条件入力欄810を含む。介護施策効果シミュレーション画面2500の画面構成は、図26に示す介護施策効果シミュレーション画面2400と同じであるため、以下では違いを説明する。
施策実施率表示欄2531は、施策実施率表示欄2431と同様に、介護施策選択タブ表示欄2420で選択された介護施策の実施率及び実施人数を示す。図示する例では、通所介護のT年度の実施率を30%から60%に、実施人数が2千人から4千人に変更されている。
施策効果推計対象者選択欄2532は、施策効果推計対象者選択欄2432と同様に、介護施策を実施する対象者が選択される欄であり、施策実施率表示欄2531で変更した介護施策の実施人数に基づいて、介護施策を実施する対象者が選択される。対象者の選択は、前述したように、介護費抑制額2433が大きい対象者から降順に選択されるとよい。図示する例では、介護費抑制額2433が大きい4千人の対象者が選択されている。
施策効果推計結果表示欄2440は、介護度別推計人数表示欄2441及び介護費推計結果表示欄2451を含み、介護施策の実施率を変更した場合の介護度別推計人数と、介護費推計結果を表示する。
介護度別推計人数表示欄2441は、施策実施率表示欄2531で変更された実施率の場合のT+n年度の介護度別推計人数2544を表示する。図示する例では、通所介護の実施率を60%に変更した場合の要介護2以上の推計人数を表示している。さらに、実施率が0%の場合のT+n年度の介護度別推計人数2442と、施策実施率表示欄2531に表示された実施率の場合のT+n年度の介護度別推計人数2544の差分を算出し、介護施策の実施率変更により抑制される介護人数2543を表示する。図示する例では、通所介護を実施率60%で実施すると、介護人数2543が1000人抑制され、図26に示す実施率30%の場合の500人より増加している。
介護費推計結果表示欄2451は、施策実施率表示欄2531で変更された実施率の場合のT+n年度の介護費2554を表示する。図示する例では、通所介護の実施率を60%に変更した場合の介護費を表示している。さらに、実施率が0%の場合のT+n年度の介護費2452と、施策実施率表示欄2531に表示された実施率の場合のT+n年度の介護費2554の差分を算出し、介護施策の実施率変更により抑制される介護費2553を表示している。図示する例では、通所介護を実施率60%に変更すると、介護費2553が30億円抑制され、図26に示す実施率30%の場合の10億円より抑制額が増加している。
図26及び図27で説明したように、対策が必要な介護度(目的変数)をユーザが選択することで、その介護度(目的変数)の抑制に寄与する介護施策(説明変数)を抽出できる。また、抽出した介護施策(説明変数)の効果として、抑制される介護人数及び介護費を推計できる。さらに、介護施策(説明変数)の実施率を変更した場合の施策効果のシミュレーションも可能である。さらに、個人別の介護度・介護費抑制効果表示欄2435で、介護施策の効果が高い対象者を選定できるので、費用対効果が高い介護施策立案が可能となる。これにより、実施例5の将来推計システムは、自治体の効果的な介護施策立案を支援できる。
次に、図28のフローチャートを用いて本実施例の施策効果推計処理を説明する。
図28の処理を開始すると、まず、対策介護度入力ステップ2601を実行する。対策介護度入力ステップ2601では、まず、将来推計端末101が、図26に示す介護施策効果シミュレーション画面2400を出力部103に表示して、図26で説明したように、対策介護度選択欄2410への、対策が必要な介護度(目的変数)のユーザからの入力を受ける。
次に、説明変数抽出ステップ2602では、説明変数抽出部118が、まず、介護度推計モデル記憶部134に格納される介護度推計モデル(図6又は図15)を取得する。次に、説明変数抽出部118が、対策介護度選択欄2410で選択された目的変数を対象に、介護度推計モデルから、Z値が負の説明変数を値が小さい順(目的変数への寄与が高い順)に抽出する。そして、図26で説明したように、抽出した説明変数を、目的変数への寄与が高い順に、介護施策選択タブ表示欄2420に表示する。
次に、説明変数選択ステップ2603では、将来推計端末101が、介護施策選択タブ表示欄2420に表示された介護施策(説明変数)の中から、施策効果を推計する介護施策(説明変数)のユーザによる選択を受ける。
次に、入力値変更ステップ2604では、まず、入力値変更部119が、整形データ記憶部133が管理するT年度の整形データ(図4又は図14)を取得する。次に、説明変数選択ステップ2603で選択された介護施策(説明変数)と一致する整形データ項目の入力値を変更する。具体的には、図24及び図25で説明したように、その説明変数と一致する整形データ項目の入力値を全て有(1)に変更した場合と、全て無(0)に変更した場合の二つの整形データを作成する。
次に、介護度推計ステップ905では、介護度推計部114が、入力値変更部119で入力値が変更された二つの整形データを、それぞれ、介護度推計モデル記憶部134が格納する介護度推計モデルに入力し、T+n年度の要介護度別の確率を推計する。図24及び図25で説明したように、T+n年度の要介護度別の確率は、入力値を全て有(1)にした場合の確率fNP2202と、全て無(0)にした場合の確率eNP2302とを推計する。推計されたT+n年度の要介護度別の確率は、図26又は図27の個人別の介護度・介護費抑制効果表示欄2435に表示される。
次に、介護費推計ステップ908では、介護費推計部117が、介護度推計部114で推計されたT+n年度の要介護度別の確率を、介護費推計モデル記憶部138が格納する介護費推計モデルに入力し、T+n年度の介護費を個人別に推計する。図24及び図25で説明したように、T+n年度の介護費は、入力値を全て有(1)にした場合の介護費fNCE2203と、全て無(0)にした場合の介護費eNCE2303とを推計する。推計されたT+n年度の介護費は、図26又は図27の個人別の介護度・介護費抑制効果表示欄2435に表示される。
次に、人口動態補正ステップ911では、死亡推計部123が、ステップ910で構築されて死亡推計モデル記憶部139に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部124は、ステップ910で構築されて転出推計モデル記憶部140に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部125が、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、介護度及び介護費の推計結果を補正する。なお、死亡推計部123、転出推計部124及び人口動態補正部125は、人口動態補正切替欄830の設定にかかわらず介護度及び介護費の推計結果の人口動態補正データを生成するが、人口動態補正切替欄830で「人口動態補正あり」が選択されている場合に、推計結果集計ステップ906の中で介護度の推計結果の人口動態補正データを生成してもよい。
死亡モデル・転出モデル構築ステップ910については、前述した実施例1と同じである。
次に、施策効果推計ステップ2605では、まず、施策効果推計部110が、介護費推計ステップ908で推計された介護施策(説明変数)の入力値を全て有(1)にした場合の介護費fNCE2203と、全て無(0)にした場合の介護費eNCE2303から、個人別の介護費抑制額2433を推計する。推計された介護費抑制額は、図26又は図27の個人別の介護度・介護費抑制効果表示欄2435に表示される。
次に、図26及び図27で説明したように、施策効果推計部110が、施策実施率表示欄(2431又は2531)や施策効果推計対象者選択欄(2432又は2532)で、施策効果を推計する対象者のユーザによる選択を受ける。そして、選択された施策効果推計対象者について、介護度及び介護費における抑制効果を推計する。
介護度における抑制効果については、T年度の要介護度及びT+n年度の要介護度別の確率fNP2202及びeNP2302を集計し、T年度の介護度別人数821、施策実施率表示欄(2431又は2531)に表示された実施率の場合のT+n年度の介護度別推計人数(831又は2544)、実施率が0%の場合のT+n年度の介護度別推計人数2442を推計する。さらに、実施率が0%の場合のT+n年度の介護度別推計人数2442、及び施策実施率表示欄(2431又は2531)に表示された実施率の場合のT+n年度の介護度別推計人数(831又は2544)の差分を算出し、介護施策により抑制される介護人数(2443又は2543)を推計する。推計された介護度における抑制効果は、図26又は図27の介護度別推計人数表示欄2441に表示される。
介護費における抑制効果については、選択された施策効果推計対象者について、T年度の介護費及びT+n年度の介護費fNCE2203及びeNCE2303を集計し、T年度の介護費1821、施策実施率表示欄(2431又は2531)に表示された実施率の場合のT+n年度の介護費(1831又は2554)、実施率が0%の場合のT+n年度の介護費2452を推計する。さらに、実施率が0%の場合のT+n年度の介護費2452と、施策実施率表示欄(2431又は2531)に表示された実施率の場合のT+n年度の介護費(1831又は2554)の差分を算出し、介護施策により抑制される介護費(2453又は2553)を推計する。推計された介護費における抑制効果は、図26又は図27の介護費推計結果表示欄2451に表示される。
施策効果推計部110は、介護施策の実施率別の施策効果を推計し、ユーザの費用対効果の高い介護施策の立案を支援する。
以上により、施策効果推計処理を終了する。
以上に説明したように、本実施例5の将来推計システムでは、対策が必要な介護度(目的変数)をユーザが選択することによって、選択された介護度(目的変数)の抑制に寄与する介護施策(説明変数)を抽出できる。また、抽出した介護施策(説明変数)の効果として、抑制される介護人数と介護費を推計できる。さらに、介護施策(説明変数)の実施率を変更した場合の施策効果をシミュレーションできる。さらに、個人別の介護度・介護費抑制効果表示欄2435では、介護施策の効果が高い対象者を選定できるので、費用対効果の高い介護施策を立案できる。これにより、本実施例5の将来推計システムは、自治体の効果的な介護施策立案を支援できる。
前述した例では、対策介護度を「要介護2以上」とし、介護施策を「介護サービス(通所介護)」とした例を説明したが、図29、図30、図31及び図32を用いて、対策介護度を「要支援1以上(介護発生)」とし、介護施策を「健診受診」とした例を説明する。健診受診は、介護の発生抑制に大きく寄与する説明変数であることを実データにより確認している。
図29は、健診受診の実施率(健診受診率)を100%(入力値を全て有(1)に変更)にした場合の介護度・介護費推計結果2700の例を示す図である。介護度・介護費推計結果2700は、健診受診有無2701の入力値を全て有(1)に変更したT年度の整形データ1302と、介護度推計モデルに入力して推計したT+n年度の要介護度別の確率cfNP2702と、T+n年度の要介護度別の確率cfNP2702を介護費推計モデルに入力して推計したT+n年度の介護費cfNCE2703とを格納する。
図30は、健診受診の実施率(健診受診率)を0%(入力値を全て無(0)に変更)にした場合の介護度・介護費推計結果2800の例を示す図である。介護度・介護費推計結果2800は、健診受診有無2801の入力値を全て無(0)に変更したT年度の整形データ1302と、介護度推計モデルに入力して推計したT+n年度の要介護度別の確率ceNP2802と、T+n年度の要介護度別の確率ceNP2802を介護費推計モデルに入力して推計したT+n年度の介護費ceNCE2803を格納する。
図31は、施策効果推計部110が、出力部103に出力する、健診受診についての介護施策効果シミュレーション画面2900の例を示す図である。
介護施策効果シミュレーション画面2900は、図26及び図27と同様に、対策介護度選択欄2410、人口動態補正切替欄830、介護施策選択タブ表示欄2420、施策効果推計対象者の選定欄2430、施策効果推計結果表示欄2440及び集計条件入力欄810を含む。
対策介護度選択欄2410は、入力部102で対策が必要な介護度(目的変数)をユーザに選択させる欄である。図示する例では、対策が必要な介護度(目的変数)として、ユーザが「要支援1以上」を選択した例を示している。
人口動態補正切替欄830は、図28のステップ911に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄830の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。
介護施策選択タブ表示欄2420は、対策介護度選択欄2410で選択された介護度(目的変数)の抑制に寄与が大きい説明変数を選択タブで表示する。具体的には、説明変数抽出部118が、対策介護度選択欄2410で選択された目的変数を対象に、介護度推計モデル(図6又は図15)から、Z値が負の説明変数を値が小さい順に抽出して表示する。図示する例では、目的変数が「要支援1以上」で、「要支援1以上」の抑制に寄与が大きい説明変数を抽出した例を示しており、介護度推計モデルから、Z値が負の説明変数を値が小さい順に抽出すると、健診受診2921である例を示す。ユーザは、この選択タブから、介護施策を選択する。図示する例では、健診受診2921が選択されている。
施策効果推計対象者の選定欄2430は、施策実施率(健診受診率)表示欄2931及び個人別の介護度・介護費抑制効果表示欄2435を含む。
施策実施率表示欄2931は、介護施策選択タブ表示欄2420で選択された介護施策の実施率(健診受診率)及び実施人数を示し、デフォルトで表示される初期値は、現在(T年度)の実施率(健診受診率)及び実施人数である。図示する例では、T年度の健康診断の実施率(受診率)が20%で、実施人数(受診者数)が1万人である。
個人別の介護度・介護費抑制効果表示欄2435は、施策効果推計対象者選択欄2932、個人ID201、T年度の整形データ1302、図29で説明した健診受診率が100%である場合のT+n年度の介護度・介護費推計結果2700(要介護度別の確率cfNP2702と介護費cfNCE2703)、図30で説明した健診受診率が0%である場合のT+n年度の介護度・介護費推計結果2800(要介護度別の確率ceNP2802と介護費ceNCE2803)、及び、T+n年度の介護費抑制額(cfNCE-ceNCE)2933を個人別に表示する。施策効果推計対象者選択欄2932は、介護施策を実施する対象者(健診受診者)が選択される欄であり、デフォルトでは、現在(T年度)にその介護施策を実施された人(健診受診者)が選択されている。この例では、個人ID201がK0001の人が健診を受診した人として選択されている。また、個人別の介護度・介護費抑制効果表示欄2435では、健康診断の受診による個人別の介護度・介護費抑制効果をその効果が高い順に表示する。具体的には、T+n年度の介護費抑制額(cfNCE-ceNCE)2933が大きい順に表示するとよい。図示する例では、個人IDがK0003の人の介護費抑制額(cfNCE3-ceNCE3)が最大で、次がK0002の人である。
ユーザは、個人別の介護度・介護費抑制効果表示欄2435や後述する施策効果推計結果表示欄2440を参照して、施策効果推計対象者選択欄2932で、健康診断の受診を促す対象者を個別に選択し、変更する。また、施策実施率表示欄2931の実施率(健診受診率)や実施人数を変更しても、健康診断の受診を促す対象者を選択できる。施策実施率表示欄2931の実施率(健診受診率)を変更した場合、介護費抑制額2933が大きい対象者から降順に選択される。
施策効果推計結果表示欄2440は、介護度別推計人数表示欄2941及び介護度推計結果表示欄2951を含む。
介護度別推計人数表示欄2941は、施策効果推計部110が、施策効果推計対象者の選定欄2430で選択された対象者全体について、T年度の要介護度及びT+n年度の要介護度別の確率cfNP2702とceNP2802を集計し、T年度の介護度別人数2944、施策実施率表示欄2931に表示された実施率(健診受診率)の場合のT+n年度の介護度別推計人数2945及び実施率(健診受診率)が0%の場合のT+n年度の介護度別推計人数2942を表示する。図示する例では要支援1以上の人数を表示している。さらに、実施率(健診受診率)が0%の場合のT+n年度の介護度別推計人数2942と、施策実施率表示欄2931に表示された実施率の場合のT+n年度の介護度別推計人数2945の差分を算出し、健診受診により抑制される介護人数2943を表示する。図示する例では、健診受診率が20%の場合、介護人数2943が100人抑制される。
介護度推計結果表示欄2951は、施策効果推計部110が、施策効果推計対象者の選定欄2430で選択された全ての対象者について、T年度の介護費及びT+n年度の介護費cfNCE2703及びceNCE2803を集計し、T年度の介護費2954、施策実施率表示欄2931に表示された健診受診率の場合のT+n年度の介護費2955及び健診受診率が0%の場合のT+n年度の介護費2952を表示する。さらに、健診受診率が0%の場合のT+n年度の介護費2952と、施策実施率表示欄2931に表示された健診受診率の場合のT+n年度の介護費2955の差分を算出し、健診受診により抑制される介護費2953を表示する。図示する例では、健診受診率が30%の場合、抑制される介護費2953が10億円である。
集計条件入力欄810は、個人別の介護度・介護費抑制効果表示欄2435に表示する対象者の条件を入力する欄である。図示する例では、T年度の年齢入力欄812、住所入力欄813及び健診対象入力欄814を設けているが、整形データ400、1300に格納されているT年度の任意のデータ項目を条件として入力する欄を設けてもよい。図示する例では、年齢入力欄812に40歳以上、住所入力欄813にA区とB区、健診対象入力欄814に1(対象者)が入力されている。
図32は、施策効果推計部110が、出力部103に出力する、健診受診率を変更した場合の介護施策効果シミュレーション画面3000の例を示す図である。図32では、図31に示す介護施策効果シミュレーション画面2900の健診受診率を変更した場合の例を示す。
介護施策効果シミュレーション画面3000は、対策介護度選択欄2410、介護施策選択タブ表示欄2420、施策効果推計対象者の選定欄2430、施策効果推計結果表示欄2440及び集計条件入力欄810を含む。介護施策効果シミュレーション画面3000の画面構成は、図31に示す介護施策効果シミュレーション画面2900と同じであるため、以下では違いを説明する。
施策実施率表示欄3031は、施策実施率表示欄2931と同様に、介護施策選択タブ表示欄2420で選択された介護施策の実施率及び実施人数を示す。図示する例では、施策実施率表示欄2931の健診受診率が20%から80%に、実施人数が1万人から8万人に変更されている。
施策効果推計対象者選択欄3032は、施策効果推計対象者選択欄2932と同様に、介護施策を実施する対象者が選択される欄であり、施策実施率表示欄2931で変更した健診受診の実施人数に基づいて、健康診断を受診する対象者が選択される。対象者の選択は、前述したように、介護費抑制額2933が大きい対象者から降順に選択されるとよい。図示する例では、介護費抑制額2933が大きい8万人の対象者が選択されている。
施策効果推計結果表示欄2440では、介護度別推計人数表示欄2441及び介護費推計結果表示欄2451を含み、健診受診率を変更した場合の介護度別推計人数と、介護費推計結果を表示する。
介護度別推計人数表示欄2941では、施策実施率表示欄3031で変更された健診受診率の場合のT+n年度の介護度別推計人数3045を表示する。図示する例では、健診受診率を80%に変更した場合の要支援1以上の推計人数を表示している。さらに、健診受診率が0%の場合のT+n年度の介護度別推計人数2942と、施策実施率表示欄3031に表示された健診受診率の場合のT+n年度の介護度別推計人数3045の差分を算出し、健診受診率変更により抑制される介護人数3043を表示する。図示する例では、健診受診率を80%にすると、介護人数3043が2000人抑制され、図31の実施率20%の場合の100人より大幅に増加している。
介護度推計結果表示欄2951は、施策実施率表示欄3031で変更された健診受診率の場合のT+n年度の介護費3055を表示する。図示する例では、健診受診率を80%に変更した場合の介護費を表示している。さらに、健診受診率が0%の場合のT+n年度の介護費2952と、施策実施率表示欄3031に表示された健診受診率の場合のT+n年度の介護費3055の差分を算出し、健診受診率変更により抑制される介護費3053を表示する。図示する例では、健診受診率を80%に変更すると、介護費3053が100億円抑制され、図31の健診受診率20%の場合の10億円より抑制額が大幅に増加している。
図31及び図32で説明したように、実施例5の将来推計システムでは、健康診断の受診によって抑制される介護人数及び介護費を推計できる。さらに、健診受診率を変更した場合の施策効果をシミュレーションできる。さらに、個人別の介護度・介護費抑制効果表示欄2435で、健診受診の効果が高い対象者を選定できるので、費用対効果の高い健診受診率向上施策を立案できる。また、住民の死亡や転出による人口動態補正を行って介護度及び介護費を補正するので、より正確に介護度や介護費を推計できる。自治体にとって住民の健診受診率の向上は、大きな課題となっており、実施例5の将来推計システムは、健診受診率向上に向けた効果的な施策立案を支援できる。
<実施例6>
実施例6では、予め収集した蓄積情報から推計モデルを構築する際に、推計対象である目的変数と関連の強いカテゴリ変数に関して、同一の値を有するレコード毎にデータを分割し、それぞれの値に対応した推計モデルを構築して、医療費を推計する推計モデル構築システムの例を説明する。
以下、実施例6の推計モデル構築システムの構成について説明する。図33は、実施例6の推計モデル構築システムの構成を示すブロック図である。実施例6の推計モデル構築システムは、将来推計端末101及びデータベース160を有する。将来推計端末101は、入力部102、出力部103、プロセッサ104、メモリ105及び記憶媒体106を有する。
入力部102は、マウスや、キーボードなどのヒューマンインターフェースであり、将来推計端末101への入力を受け付ける。出力部103は、推計モデル構築システムによる演算結果を出力するディスプレイやプリンタである。記憶媒体106は、将来推計端末101によるデータ分析処理を実現する各種プログラム、及びデータ分析処理の実行結果等を格納する記憶装置であり、例えば、不揮発性記憶媒体(磁気ディスクドライブ、不揮発性メモリ等)である。
メモリ105は、不揮発性の記憶素子であるROM及び揮発性の記憶素子であるRAMを含む。ROMは、不変のプログラム(例えば、BIOS)などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、プロセッサ104が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。すなわち、メモリ105には、記憶媒体106に格納されているプログラムが展開される。プロセッサ104は、メモリ105にロードされたプログラムを実行する演算装置であり、例えば、CPU、GPUなどである。以下に説明する処理及び演算は、プロセッサ104が実行する。なお、プロセッサ104がプログラムを実行して行う処理の一部を、他の演算装置(例えば、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)などのハードウェア)で実行してもよい。
プロセッサ104によって実行されるプログラムは、リムーバブルメディア(CD-ROM、フラッシュメモリなど)又はネットワークを介して各サーバに提供され、非一時的記憶媒体である不揮発性記憶装置に格納される。このため、計算機システムは、リムーバブルメディアを読み込むインターフェースを含むとよい。
実施例6の推計モデル構築システムは、一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。
将来推計端末101では、記憶媒体106に格納されたデータ整形部111と、医療費推計モデル構築部148と、将来推計部151と、推計情報集約部152と、関連カテゴリ関連付け部153とを機能させる。
プロセッサ104は、各機能部のプログラムに従って処理することによって、所定の機能を提供する機能部として稼働する。例えば、プロセッサ104は、データ整形プログラムに従って処理することでデータ整形部111として機能する。他のプログラムについても同様である。さらに、プロセッサ104は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。
以下、実施例6で扱うデータの種類と構築する推計モデルについて説明する。実施例6では、データとして、個人毎のレセプト情報及び特定健診情報が時系列で含まれたデータを用いる例を説明する。
構築する推計モデルの推計対象としては、将来の疾病に関する個人毎の医療機関の受診リスクと医療費の期待値、及び、それらを統計的に集約した集団の医療機関受診人数と医療費、を推計する例を説明する。
まずデータ整形部111について説明する。データ整形部111は、データ記憶部161に記憶されたレセプト情報及び特定健診情報の個人毎の診療報酬明細書等の個人毎の医療及び健康に関する情報を、特定の期間毎、かつ個人毎に集約した推計用の整形データ201を構築して、整形データ記憶部163に記憶する。なお、実施例6では整形データ201を、個人毎の医療及び健康に関する蓄積情報として扱う。
なお、各記憶部139、140、161~168に格納される情報はデータベース160に限定されるものではなく、将来推計端末101からアクセス可能な記憶部や記憶装置に格納されてもよい。
図34は、データ整形部111で整形した推計用の整形データの一例を説明する図である。実施例6では、例として、個人毎のレセプト情報等の医療に関する情報を年度毎に集約した例を説明する。
3401は、整形データ全体を現す情報である。以下、整形データ3401に含まれる情報を説明する。基本情報3410は、個人毎の基本的なプロファイル情報を含む情報である。
ここでは例として、個人ID3411と、性別3412と、年齢3413と、死亡3414と、転出3415を含む例を示している。個人ID3411は、整形データ3401に含まれる個人毎に一意に割り当てられた個人IDである。性別3412は、個人毎の性別を表す情報である。例えば、男性を0、女性を1、などのように、特定の変数に割り当てられたカテゴリ変数として表すことができる。年齢3413は、個人毎の年齢を表す情報である。例えば、35、21、50のように、整数として表すことができる。死亡3414は、住民が当該年度において死亡した場合に1が登録される。転出3415は、住民が当該年度において他の自治体に転出した場合に1が登録される。
図中、3420は年度毎に集約された個人毎の情報を含む年度情報である。ここでは、2014年度の情報を集約した例を示している。特定健診情報3421は、当該の年度に受けた特定検診に関する情報を含み、例えば、BMI(Body Mass Index)や、血糖、血圧などの情報が含まれる。図中ではBMI3423の情報を例として表示している。
BMI3423は、2014年度に計測されたBMIの情報を含む。ここに含まれる情報は特定健診における問診の情報、例えば、運動習慣に関するアンケート情報や、飲酒、喫煙などに関するアンケート情報を含んでもよい。この場合、データとしては、例えば、一週間の飲酒の量ごとに割り当てられた記号や数値番号を含むカテゴリ変数としてデータが格納される。
レセプト情報3422は、当該の年度に発生したレセプトに関する情報を含む。例えば、レセプトに含まれる傷病名に基づいて定義された、傷病名毎のレセプトの有無、レセプトの発生数、関連する医療費などの情報が含まれる。また傷病名を公知の集約情報に基づき疾病にグルーピングした疾病毎の情報などが含まれる。図中では例として、糖尿病と、糖尿病医療費と、高血圧症、に関する情報が示されている。
糖尿病3424は、糖尿病に関するレセプトの発生を示す情報で、図示の例では、当該の年度に糖尿病に関連するレセプトが少なくとも一つ以上発生した場合を1、発生しなかった場合を0としている。糖尿病医療費3425は、糖尿病に関するレセプトに含まれる医療費を示す情報である。図示の例では、当該の年度に糖尿病に関連して発生した医療費に関する情報が含まれている。
高血圧症3426は、高血圧症に関するレセプトの発生を示す情報で、図示の例では、当該の年度に高血圧症に関連するレセプトが少なくとも一つ以上発生した場合を1、発生しなかった場合を0としている。
図中3430は年度毎に集約された個人毎の情報を含む年度情報である。図示の例では、2015年度の情報を集約した例を示しているが、集計方法は2014年度の年度情報3420と同様である。BMI3431は、2015年度の特定健診で取得されたBMIの情報を含む情報であり、2014年度の情報と同様の方法でテーブルに格納された情報である。上述の整形データ3401を参照することで、個人毎の基本情報と年度毎の健康、医療に関する情報を一度に取得することが可能となる。
次に、医療費推計モデル構築部148について説明する。医療費推計モデル構築部148では、推計モデル構築処理を実行し、整形データ記憶部163に記憶された整形データ3401に基づき、推計モデルを構築する。
以下、医療費推計モデル構築部148で処理する推計モデル構築処理の一例について説明をする。処理の詳細な説明にあたり、まず始めに、本処理で構築する推計モデルの概要について説明する。次に、推計モデルの構築時に、モデル構築に使用される情報の特徴に応じて、二つの異なる形態の推計モデルが構築されうることを説明する。最後に、図35に示される処理のフローチャートを用いて、二つの異なる形態の推計モデルのそれぞれが、どのように構築されるか、各ステップを追って、順に説明する。
まず推計モデルの概要について説明する。実施例6で構築される推計モデルは整形データ3401から構築されるものであって、例えば、ひとつの目的変数、ひとつ以上の説明変数、説明変数から目的変数を推定するための変数間の関係性、の情報を含む推計モデルである。
推計モデルとしては、例えば、レセプト情報に基づく2015年度の糖尿病に関する医療機関の受診有無(0または1の値をとる)を目的変数とし、特定健診に基づく2014年度のBMI(連続値をとる)3423と、空腹時血糖(連続値をとる)を説明変数とする推計モデルを構築することができる。
この推計モデルは、予め学習した変数間の関連性を用いて、2014年度のBMI3423と空腹時血糖の値に基づき、2015年度の糖尿病に関する医療機関の受診有無の確率を推計することができる。
このように、取得時間の異なる情報を説明変数と目的変数に設定した推計モデルを構築することで、将来の情報を推計することが可能となる。本推計モデルの場合、ある年度のBMIと空腹時血糖の情報を入力することで、翌年度の糖尿病の医療機関の受診有無の確率を推計することが可能となる。
例えば、この推計モデルにある個人の2015年度のBMIの情報と空腹時血糖の情報を入力することで、当該個人の2016年度の医療機関の受診有無の値を推計することができる。例えば、受診有無の値を0と1とする場合、0以上かつ1以下の値として、受診有無の確率値を推計することができる。
次に、実施例6において医療費推計モデル構築部148が構築しうる異なる形態の推計モデルについて説明する。実施例6において医療費推計モデル構築部148は、推計モデル内の説明変数に含まれるカテゴリ変数の中で、任意のカテゴリ変数に関し、カテゴリ変数の値ごとに、データを分割し、各データからサブモデルを構築する。さらに、このカテゴリ変数の種類に基づき、二つの異なる形態の推計モデルを構築する。
具体的には、当該カテゴリ変数が、推計モデルを適用する際、つまり、推計したい対象年度の情報に対し、それを推計するために推計モデルが必要とする説明変数の情報を入力する際に、当該カテゴリ変数の値が、(1)確定済みの情報である、(2)未確定の情報である、という二つの条件に応じて、異なる二つの形態の推計モデルを構築しておくことができる。以下、推計モデルの二つの形態について説明する。
第1の形態の推計モデルは、説明変数中のカテゴリ変数Cに含まれる情報が、推計モデルの適用時に、確定済みの情報である場合の推計モデルである。例えば、推計モデルとして、2014年度のBMI3423と、2014年度の空腹時血糖と、2014年度の糖尿病3424の有無、の3つの情報を説明変数とし、2015年度の糖尿病の受診の有無、を目的変数とする推計モデルが一例である。
ここで、医療費推計モデル構築部148は、説明変数に含まれる2014年度の糖尿病3424の有無の値を、データを分割してサブモデルを構築するためのカテゴリ変数として選択するとする。この推計モデルは2014年度の情報から2015年度の情報を推計するモデルとして構築されているため、あるN年度の情報を入力とすると、N+1の年度の情報を推計するモデルである。
このとき、カテゴリ変数に指定した2014年度の糖尿病有無の値は、他の説明変数である2014年度のBMIと空腹時血糖の情報と同様に、2014年度の情報であるため、取得済の情報である。例えば、この推計モデルを用いて、2015年度の情報から2016年度の情報を推定する場合、カテゴリ変数である2014年度の糖尿病有無の値には、確定済みである2015年度の情報を入力して推計できる。このように、説明変数のカテゴリ変数Cに含まれる情報が、推計モデルの適用時において、確定済みの情報である場合、第1の形態の推計モデルとして、カテゴリ変数の値が同一(あるいは所定の条件を満たす)のデータ毎に整形データ3401を分割し、それぞれの整形データ3401からそれぞれのカテゴリ変数の値に対応した推計モデルを構築する。なお、カテゴリ変数の値は、必ずしも同一である必要は無く、整形データ3401の種類によっては、近似値(差分が閾値未満)などの所定の条件を満たすデータ毎に整形データ3401を分割してもよい。
第2の形態の推計モデルは、説明変数中のカテゴリ変数Cに含まれる情報が、推計モデルの適用時に、未確定の情報である場合の推計モデルである。例えば、推計モデルとして、2014年度の疾病Aの受診有無と、2015年度の疾病Aの受診有無を説明変数とし、2015年度の疾病Bの受診の有無を目的変数とする推計モデルが一例である。
ここで、医療費推計モデル構築部148は、説明変数の中の2015年度の疾病Aの受診有無を、データを分割してサブモデルを構築するためのカテゴリ変数として選択するとする。この推計モデルは2014年度の情報と2015年度の情報から、他の2015年度の情報を推計するモデルとして構築されているため、N年度の情報とN+1年度の情報の入力に基づき、他のN+1年度を推計するモデルである。
このとき、カテゴリ変数に指定した2015年度の疾病Aの受診有無の情報は、目的変数である2015年度の疾病Bの受診の有無の情報と同じ年度に取得される情報である。そのため、この推計モデルを適用する場合には、このカテゴリ変数の情報は未確定であると考えられる。
例えば、この推計モデルを用いて、2015年度の情報から2016年度の情報を推計する場合に、カテゴリ変数である2016年度の疾病Aの情報は、他の説明変数とは異なり、推計時には情報が未確定である。この場合には、まず、カテゴリ変数以外の説明変数の情報に基づき、カテゴリ変数の値を推計する第1の推計モデルを構築する。次に、カテゴリ変数の値が同一のデータ毎に整形データを分割し、それぞれのデータからカテゴリ変数の値に対応した第2の推計モデルを構築する。
例えば前述の例では、第1の推計モデルとして、2014年度の疾病Aの受診有無の情報を説明変数とし、2015年度の疾病Aの受診有無の情報を目的変数とする第1の推計モデルを構築する。次に、第2の推計モデルとして、2014年度の疾病Aの受診有無の情報を説明変数とし、2015年度の疾病Bの受診有無の情報を目的変数とする推計モデルを、2015年度の疾病Aの受診有無の値が同一のデータセットごとにそれぞれ構築する。
この推計モデルを用いて、2015年度の情報から2016年度の情報を推計する場合は、まず、第1の推計モデルを用いて、2015年度の疾病Aの受診有無の情報から、2016年度の疾病Aの受診有無の確率分布を推計する。次に、推計した2016年度の疾病Aの受診有無の確率分布の下で、第2の推計モデルをそれぞれ適用し、それら結果を統合して、最終的な推定結果とする。
これらの二つの異なる形態の推計モデルは、整形データ3401に含まれる情報及びデータベース160に記憶された情報に基づき、いずれか適切なものが選択されて構築される。
以下、図35を用いて、医療費推計モデル構築部148で行われる推計モデル構築処理のフローチャートを説明する。
図35は、医療費推計モデル構築部148で実行される推計モデル構築処理の流れを説明するフローチャートである。以下、本フローチャートを用いて、各ステップの処理について説明する。
目的変数・説明変数入力のステップ3501では、医療費推計モデル構築部148は、入力部102から入力された情報に基づき、推計対象とする変数を目的変数に決定し、推計に用いる情報を説明変数に決定する。なお、説明変数と目的変数の対応は、事前に説明変数と目的変数の情報がペアとなった情報を医療費推計モデル構築用変数群記憶部167に記憶しておき、予め記憶された情報を読み出すことで決定してもよい。
整形データ読出処理のステップ3502では、医療費推計モデル構築部148は、予めデータ整形部111で処理されて、整形データ記憶部13に記憶された推計モデル構築用の整形データ3401の情報を、整形データ記憶部163から読み出す。
関連カテゴリ変数読出処理のステップ3503では、医療費推計モデル構築部148は、目的変数の情報に基づき、説明変数に含まれる変数の中に、目的変数を推計するにあたり、カテゴリ変数として扱うべき変数が存在するか否かを判定する。この判定は例えば、医療費推計モデル構築部148が、関連カテゴリ記憶部164に記憶された関連カテゴリマトリクス(関連カテゴリ情報)3701の情報を用いることで実施される。
図37は、関連カテゴリ記憶部164に記憶された関連カテゴリを選択するためのマトリクスの情報である。関連カテゴリマトリクス3701は、推計対象である対象変数の情報を行方向に設定しに、関連する変数に関する情報を列方向に設定する行列であって、各行及び列には整形データ3401に含まれる項目の情報が含まれる。
行方向の対象変数情報3702は、関連を探索する元となる対象変数に関する情報が含まれる。列方向の関連変数情報3703は、関連を探索する先となる項目に関する情報が含まれる。
図示の例では、基本情報B、N年度の情報として、A、y1、y2、N+1年度の情報として、A、y1、y2の計7つの情報が含まれる例を示す。行列は0、1、または空の情報を含む。空のセルは、当該セルが含まれる行の対象変数が、当該セルが含まれる列の関連先の変数と、関連を持っていないことを示す。
0が入っているセルは、当該セルが含まれる行の対象変数が、当該セルが含まれる列の関連先の変数と、関連を持っており、また、関連変数が、推定時には既に観測済みの情報、すなわち、推定時には情報が整形データに含まれることを示す。
1が入っているセルは、当該セルが含まれる行の対象変数が、当該セルが含まれる列の変数と関連を持っており、また、推定時には未観測の情報、すなわち、推定時には情報が整形データに含まれていないことを示す。例えば、関連変数が、対象変数よりも過去の年度の情報に関する変数であれば、其の変数は観測済みの情報である。一方、関連変数が、対象変数と同じ年度に取得された情報であれば当該変数は推計時には、未観測の情報である。
関連カテゴリマトリクス3701を用いて関連カテゴリを読み出す処理を、図36のフローチャートを用いて説明する。図36は、推計モデル構築処理の関連カテゴリ変数読出処理のステップ3503で実行される処理のフローチャートである。
対象変数決定のステップ3601では、医療費推計モデル構築部148が、関連を探索する変数を決定する。具体的には、医療費推計モデル構築部148が、推計モデル構築処理の目的変数・説明変数入力のステップ3501で決定した推計対象の目的変数を、探索する元の変数として決定する。
関連カテゴリ変数探索のステップ3602では、医療費推計モデル構築部148が、関連カテゴリマトリクス3701を用いて、対象変数と関連するカテゴリ変数を探索する。具体的には、医療費推計モデル構築部148が、関連カテゴリマトリクス3701で対象変数とする変数が含まれる行を探索し、0または1が含まれるセルが存在するか否かを探索する。医療費推計モデル構築部148は、0または1が含まれるセルが存在する場合には、該当する列の関連変数を、対象変数に対応した関連カテゴリ変数として、セル内の値と対応付けて、記憶する。
図37で示す関連カテゴリマトリクスを例に説明する。例えば、対象変数が、N+1年度のAの情報である場合は、医療費推計モデル構築部148が、0が存在するセルを含む列であるN年度のAを関連変数として選択する。例えば、医療費推計モデル構築部148は、対象変数が、N+1年度のy1の情報である場合は、1が存在するセルを含む列であるN+1年度のAの情報を関連カテゴリ変数として選択する。
ステップ3603では、医療費推計モデル構築部148が、変数探索のステップ3602で記憶された関連カテゴリ変数について判定を実施する。医療費推計モデル構築部148は、選択された関連カテゴリ変数に、推定時に未確定のカテゴリ変数が含まれるか否かを判定し、含まれる場合は、未確定カテゴリ項目読出のステップ3604に進む。一方、医療費推計モデル構築部148は、推定時に未確定のカテゴリ変数が、含まれない、または、関連カテゴリがひとつも記憶されていない場合は、関連変数情報集約処理のステップ3605に進む。
なお、医療費推計モデル構築部148は、推定時に未確定のカテゴリ変数であるか否かの判定は、関連カテゴリマトリクスから選択した関連カテゴリ変数に対応するセルの値が0であるか1であるかに基づいて判定することができる。
未確定カテゴリ項目対象変数化のステップ3604では、医療費推計モデル構築部148が、ステップ3602で記憶した関連変数の中で、推定時に未確定のカテゴリ変数を新たな対象変数として設定した後、関連カテゴリ変数探索のステップ3602に戻る。以後、全ての未確定の関連カテゴリ変数の処理を完了するまで上記ステップ3602、3603、3604を反復して繰り返す。
ステップ3603の判定と、ステップ3602、3603、3604の繰り返し処理について、図37で示す関連カテゴリマトリクス3701を例に説明する。
例えば、対象変数が、N+1年度のAである場合は、医療費推計モデル構築部148は、0が存在するセルを含む列であるN年度のAが関連カテゴリ変数として記憶する。関連カテゴリマトリクス3701では、0は、対象変数との関連関係において、関連変数が確定済の変数であることを示す。そのため、医療費推計モデル構築部148は、ステップ3603の判定でNoと判定し、ステップ3605に進む。
一方、対象変数が、N+1年度のy1である場合は、医療費推計モデル構築部148は、1が存在するセルを含む列であるN+1年度のAを関連カテゴリ変数として選択する。関連カテゴリマトリクス3701では、1は、対象変数との関連関係において、関連変数が未確定の変数であることを示す。そのため、医療費推計モデル構築部148は、ステップ3603の判定においてYesと判定し、ステップ3604に進む。
ステップ3604では、医療費推計モデル構築部148がN+1年度のAを新たな対象変数に設定する。その後、再度ステップ3602において、医療費推計モデル構築部148は、N+1年度のAに関連するカテゴリ変数として、N年度のAを記憶する。この変数は、N+1年度のAとの関連において、セルに0の値を含み、推定時に確定済の変数であるため、医療費推計モデル構築部148は、2回目のステップ3604においてNoと判定し、繰り返し処理を終了し、ステップ3605に進む。
関連変数情報集約のステップ3605では、医療費推計モデル構築部148がこれまでの処理で記憶された関連カテゴリ変数の情報を集約し、関連カテゴリ変数の関連性を示すツリー構造を構築する。
以下、本処理で構築するツリー構造について図38を用いて説明する。図38A、図38Bは、図37の関連カテゴリマトリクス3701を用いて、関連カテゴリ変数の読出処理で読み出される変数の関連性の例を表すツリー構造である。
図38Aは、対象変数をN+1年度のAに設定して、関連カテゴリ変数の読出処理を実施した場合のツリー構造である。この例では、対象変数に関連するカテゴリ変数として、N年度のAがひとつ読み出されている。図38Aは、関連性を表すツリー構造であって、図中の四角は変数、矢印は関連性を表す。
図38AのA_N+1は、N+1年度のAの情報を表す変数、A_NはN年度のAの情報を表す変数を表す。矢印は根元にある変数が関連変数であり、矢印の先にある変数が、根元の関連変数から影響を受ける対象変数である。
このように、対象変数と関連する関連カテゴリ変数が目的変数の推定時に確定済みの変数である場合、対象変数と関連カテゴリ変数のツリー構造上の距離は1となる。このツリー構造は、前記第1の形態の推計モデルに対応する。
図38Bは、対象変数をN+1年度のy1の情報に設定して、関連カテゴリ変数の読処理を実施した場合のツリー構造である。この例では、対象変数に関連するカテゴリ変数として、N+1年度のAがひとつ目の関連変数として読み出され、次に、N+1年度のAの情報が、推定時に未確定であることから、当該変数を新たな対象変数として読み出されたN年度のAの情報がふたつ目の関連変数として読み出されている。このとき、N+1年度のy1の情報が、N+1年度のAの情報と関連し、さらに、N+1年度のAの情報が、N年度のAの情報と関連している関連性が存在する。
図38Bは、上記関連性の情報を表すツリー構造であって、y1_N+1は、N+1年度のy1の情報を意味する変数、A_N+1は、N+1年度のAの情報を意味する変数、A_NはN年度のAの情報を意味する変数を表す。図38Bより、N_NがA_N+1に影響を与え、さらにA_N+1は、y1_N+1に影響を与えるという関係性が示されている。
このように、対象変数と関連する関連カテゴリ変数に、推定時に未確定の変数が含まれる場合は、対象変数と関連カテゴリ変数のツリー構造の深さが2以上となる。このツリー構造は、前記第2の形態の推計モデルに対応する。図38Bの例では、y1_N+1が根ノードを示し、A_N+1が関連カテゴリ変数の内部ノードを示す。
医療費推計モデル構築部148は、本処理で構築したツリー構造を、関連カテゴリ記憶部164に記憶する。
以上、推計モデル構築処理内の、関連カテゴリ変数読出処理のステップ3503について説明を終了する。以下、図35を用いた推計モデル構築処理の説明に戻る。
データ分割ラベル付け処理のステップ3504では、医療費推計モデル構築部148が、推計モデル構築時に実施するデータの分割を行うための、個々のデータの分類用のラベル付け処理を行う。
具体的には、まず、医療費推計モデル構築部148は、整形データ3401に含まれる説明変数のうち、関連カテゴリ変数読出処理のステップ3503で読み出された関連カテゴリ変数の情報を選択する。次に、医療費推計モデル構築部148は、関連カテゴリ変数読出処理のステップ3503で構築された関連カテゴリ変数間のツリー構造に基づき、対象の変数毎に、当該変数を推計する推計モデルを構築するためのデータ分割用のラベル付けを実行する。以下では、図38Aと図38Bの二つのツリー構造を用いて、それぞれの例を説明する。
まず、図38Aで示すツリー構造を処理する例を説明する。
図38Aのツリー構造では、目的変数は、A_N+1、カテゴリ変数はA_Nである。図39は、推計モデル構築用整形データ3900の一例を示す図である。推計モデル構築用整形データ3900は、整形データ3401から、関連カテゴリ変数の項目の情報を選択した結果を示す。推計モデル構築用整形データ3900は、No3901と、確定カテゴリ3902と、目的変数3903と、説明変数3904~3905とをひとつのエントリに含む。
実施例6では、カテゴリ変数A_Nと目的変数A_N+1は、いずれもyとnの2種類の値を取りうる変数であるとする。なお、yは例えば、カテゴリに該当する場合に設定され、nは例えば、カテゴリに含まれない場合に設定される。データ分割ラベル付け処理のステップ3504では、推計モデル構築用整形データ3900の情報を用いて、推計が必要な変数毎に、データ分割用のラベル付けを実施する。
図38Aのツリー構造において、推計が必要な変数は目的変数であるA_N+1のひとつだけであるので、医療費推計モデル構築部148は、A_N+1を推計するモデルを構築するためのデータ分割処理用のラベル付けを行う。このラベルは、ツリー構造の中で、推計対象である変数の先祖となる変数群の全ての状態の組合せが一意になるように設定する。
例えば、先祖となる変数の直積値を取る変数でラベル付けすることで実施できる。図38Aのツリーでは、A_N+1の先祖ノードは、A_Nのひとつだけであるので、A_Nの値を直接用いることで、ラベル付けできる。
図40Aは、図38Aのツリーに関し、データ分割用のラベルを付与した結果を示すラベル付けテーブル4000である。関連カテゴリ4001は、ラベル付けに用いた変数である。データ分割ラベル4002は、付与されたラベルである。図示の例では、A_Nの値をそのままラベルに用いた例を示している。
図40Bは、ラベル付けテーブル4010の一例を示す図である。ラベル付けテーブル4010は、No4011と、確定カテゴリ4012と、推計対象4013と、データ分割ラベル4014とをひとつのエントリに含む。
図40Bは、図40Aで示したラベルを用いて、図39に示した推計モデル構築用整形データ3900にラベル付けした例である。データ分割ラベル4014は、カテゴリ変数の情報に基づき生成されたラベルの列である。
次に、図38Bで示すツリーを処理する例を説明する。
図41は、推計モデル構築用整形データ4110の一例を示す図である。推計モデル構築用整形データ4110は、整形データ3401から、図38Bの情報に基づき、関連カテゴリ変数項目の情報を選択した結果を示す。推計モデル構築用整形データ4110は、No4111と、確定カテゴリ4112と、未確定カテゴリ4113と、目的変数4114と、説明変数4115~4116とをひとつのエントリに含む。
図38Bの例では、目的変数は、y1_N+1であり、カテゴリ変数は、A_N+1とA_Nのふたつが存在する。このうち、A_Nは確定カテゴリであり、A_N+1は未確定カテゴリである。
ここでは、カテゴリ変数A_NとA_N+1は、いずれもyとnの2種類の値を取りうる変数であるとする。データ分割ラベル付け処理のステップ3504では、この情報に基づき、推計が必要な変数毎に、当該変数を推計する推計モデル構築時にデータを分割する際のラベル付けを実行する。
図38Bのツリーにおいて推計が必要な変数は、目的変数であるy1_N+1と、カテゴリ変数A_N+1のふたつである。そこで、y1_N+1を推計する推計モデルを構築するためのデータ分割処理におけるラベル付けと、A_N+1の推計を実行するモデルを構築するためのデータ分割処理におけるラベル付けの、ふたつのラベル付け処理を実行する。
これらのラベル付けも、図38Aの例と同様に、推計対象の変数の先祖となる変数の値の組合せが一意となるようにラベル付けをすることで実施できる。
図42Aは、ラベル付けテーブル4220の一例を示す図である。図42Aは、図38Bのツリーに関し、カテゴリ変数A_N+1を推計するモデル構築のためのデータ分割ラベルを付与された結果を示すラベル付けテーブル4220である。
関連カテゴリ4221は、ラベル付けに用いた変数である。データ分割ラベル4222は、付与されたラベルである。この例では、推計対象のA_N+1の先祖となる変数は確定カテゴリのA_Nのみであるため、当該値をそのままラベルに用いた例を示している。
図42Bは、ラベル付けテーブル4230の一例を示す図である。図42Bは、図42Aで示したラベルを用いて、図39に示した推計モデル構築用整形データ3900のデータにラベル付けした例である。データ分割ラベル4234が、カテゴリ変数の情報に基づき付与されたラベルの列を表す。
図42Cは、ラベル付けテーブル4240の一例を示す図である。図42Cは、図38Bのツリーに関し、目的変数y1_N+1を推計するモデル構築のためのデータ分割ラベルを付与した結果を示すラベル付けテーブル4240である。
関連カテゴリ4241、4242は、当該ラベル付けに用いた変数である。この例では、推計対象のy1_N+1の先祖となる変数は、確定カテゴリのA_Nと、未確定カテゴリのA_N+1のふたつが存在するため、それら二つの値の組合せを用いた値でラベル付けした例を示している。
図42Dは、ラベル付けテーブル4250の一例を示す図である。ラベル付けテーブル4250は、No4251と、確定カテゴリ4252と、未確定カテゴリ4253と、推計対象4254とデータ分割ラベル4255とを一つのエントリに含む。
図42Dは、図42Cで示したデータ分割ラベル4243を用いて、図41Bに示したデータにラベル付けした例である。データ分割ラベル4255が、カテゴリ変数の情報に基づき付与されたラベルの列を表す。これらのラベル付け処理は、ツリー構造の中で、根である目的変数との距離が遠いノードに対応する変数から順に、実行する。
図38Bの例ではまず、医療費推計モデル構築部148が、A_N+1についてラベル付け処理を実行する。図38Bのツリーでは、A_N+1の先祖ノードは、A_Nのひとつだけであるので、A_Nの値を用いて、ラベル付けする。
次に、医療費推計モデル構築部148は、y1_N+1についてラベル付け処理を実行する。図38Bのツリーでは、y1_N+1の先祖ノードは、A_N+1とA_Nのふたつが存在するので、医療費推計モデル構築部148は、A_N+1の値と、A_Nの値の直積を取った値でラベル付けする。医療費推計モデル構築部148は、ラベル付けした情報を、データ分割情報記憶部165に記憶する。
ステップ3505では、医療費推計モデル構築部148が、関連カテゴリ変数読出処理のステップ3503で読出した未確定の関連カテゴリ変数に関して、推計モデルを未構築の変数が含まれるか否かを判定する。医療費推計モデル構築部148は、未確定の関連カテゴリ変数が読み出されていない、もしくは、全ての未確定の関連カテゴリについて推計モデルを構築している場合には、カテゴリ別目的変数推計モデル構築処理のステップ3507に進む。一方、医療費推計モデル構築部148が、推計モデルを構築していない未確定の関連カテゴリが存在する場合には、未確定カテゴリ推計モデル構築処理のステップ3506に進む。
未確定カテゴリ推計モデル構築処理のステップ3506は、医療費推計モデル構築部148の未確定カテゴリ推計モデル構築部150で実施される処理である。未確定カテゴリ推計モデル構築部150は、関連カテゴリ変数読出処理のステップ3503で読み出した関連カテゴリ変数及びツリーの情報と、データ分割ラベル付け処理のステップ3504で処理したラベル情報を用いて、未確定カテゴリ変数を推計する推計モデルを構築する。
このとき、未確定カテゴリ推計モデル構築部150は、推計モデルの構築対象の変数に関し、データ分割ラベル付け処理でラベル付けした情報に基づき、データを分割し、それぞれ推計モデルを構築する。未確定カテゴリ推計モデル構築部150は、例えば、図42Aに示すラベル付けテーブルを用いて、未確定カテゴリA_N+1に関する推計モデルを構築する場合、ラベルの値が同一であるデータに、整形データ3401を分割し、それぞれのデータについて、目的変数と説明変数の関係性を学習する。
実施例6では、上述のように、ラベルはyとnの二種類が存在するため、未確定カテゴリ推計モデル構築部150は、整形データ3401を二つに分割し、それぞれのデータから推計モデルを構築する。推計モデルの構築は、例えば多項ロジスティック回帰や、BoostingTreeなどの公知または周知の手法を用いることができる。
目的変数推計モデル構築処理のステップ3507では、医療費推計モデル構築部148の目的変数推計モデル構築部149が、関連カテゴリ変数読出処理のステップ3503で読み出した関連カテゴリ変数及びツリーの情報と、データ分割ラベル付け処理のステップ3504で処理したラベル情報を用いて、目的変数を推計する推計モデルを関連するカテゴリ変数の値ごとに構築する。
例えば、図40Aに示すラベル付けテーブル4000を用いて、目的変数A_N+1に関する推計モデルを構築する場合、目的変数推計モデル構築部149は、対象とするラベルの値が同一であるデータに、整形データ3401を分割し、それぞれのデータについて、目的変数と説明変数の関係性を学習する。
実施例6では、ラベルはyとnの二種類が存在するため、医療費推計モデル構築部148が整形データ3401を二つに分割し、それぞれのデータから推計モデルを構築する。例えば、医療費推計モデル構築部148は、図42Dに示すラベル付けテーブル4230を用いて、目的変数y1_N+1(4255)に関する推計モデルを構築する場合、(y、y)、(y、n)、(n、y)、(n、n)の4種類のラベルに基づき、整形データ3401を4つに分割し、それぞれのデータから推計モデルを構築する。推計モデルの構築は、例えば重回帰や多項ロジスティック回帰やBoostingTreeなどの広く公知の手法を用いることができる。
上記処理で構築した未確定カテゴリ推計モデル及び目的変数推計モデルは、医療費推計モデル記憶部166に記憶する。
次に、図35のステップ3508で行われる統合推計モデル構築処理について、以下に説明する。統合推計モデル構築処理では、まず、将来推計部151で処理を行った後に、推計情報集約部152で処理が行われる。
まず、将来推計部151の処理について説明する。将来推計部151では、医療費推計モデル記憶部166に記憶された推計モデルに基づき、個人(整形データ3401)毎の情報の将来推計を実施する。
図43は、将来推計部151で実施する処理のフローチャートを示す図である。以下、各ステップについて説明する。
推計対象情報入力処理のステップ4301では、将来推計部151が、推計対象となるデータの情報と、目的変数の情報と、説明変数の情報と、推計に用いるモデルの情報などの必要な情報を入力部102から受け付ける。なお、推計対象のデータとしては、入力部102から入力された情報以外にも、予め整形データ記憶部163に記憶されたデータを用いてもよい。
モデル読出処理のステップ4302では、将来推計部151が、対象の目的変数と使用する説明変数に対応した目的変数推計モデル及び、未確定カテゴリ推計モデルを、医療費推計モデル記憶部166から読み出す。
データ分割処理のステップ4303では、データ分割情報記憶部165に記憶された、データ分割用のラベル情報を読み出す。
ステップ4304では、将来推計部151が、未推計の未確定カテゴリが存在するか否かを判定する。これは、将来推計部151が、モデル読出処理のステップ4301で読出した推計モデルの中に、未確定カテゴリ変数を推定するための推計モデル(以下、未確定カテゴリ変数推計モデル)が存在するか否かで判定できる。
将来推計部151は、未確定カテゴリ変数が存在し、当該変数の値が未確定である場合は、未確定カテゴリ推計処理のステップ4305に進む。一方、将来推計部151は、未推定の未確定カテゴリ変数が存在しない場合は、目的変数推計処理のステップ4306に進む。
未確定カテゴリ推計処理のステップ4305では、将来推計部151が、未確定カテゴリ変数推計モデルの中で、適用可能なものをひとつ選択し、適用する。適用は以下のふたつの場合分けで実施される。
ひとつ目の例を説明する。未確定カテゴリ推計モデルがひとつしか存在しない場合、将来推計部151は、当該未確定カテゴリ推計モデルを用いて、未確定カテゴリ変数を推計する。この場合、未確定カテゴリ変数は、他に関連カテゴリを持たない、あるいは、関連するカテゴリが全て確定済カテゴリである、のいずれかの条件を満たす。
未確定カテゴリ変数が関連カテゴリを持たない場合は、将来推計部151が全ての整形データ3401を用いて、説明変数から、未確定カテゴリの情報を推計する。未確定カテゴリ変数が関連するカテゴリをもつ場合は、将来推計部151は当該関連カテゴリの値ごとに整形データ3401を分割し、分割した各データに、各カテゴリの値に対応した未確定カテゴリ推計モデルを適用して、未確定カテゴリ変数を推計する。
ふたつ目の例を説明する。未確定カテゴリ推計モデルがふたつ以上存在する場合、未確定カテゴリ推計モデルの中に、未確定カテゴリに関連するカテゴリが未確定のものが含まれる場合がある。
例えば、未確定カテゴリ推計モデルXと未確定カテゴリ推計モデルYが存在し、推計モデルXの推計対象が未確定カテゴリ変数Cであって、推計モデルYの推計対象が未確定カテゴリ変数Dで、推計モデルYに含まれる関連カテゴリがC、である場合を考える。
この場合、関連カテゴリCは未確定であるため、このCの値が確定しない限り、推計モデルYを用いた推計を実施することができない。そこで、将来推計部151は、まず推計モデルXを適用して、未確定カテゴリ変数Cに関する情報を推計し、次に推計した変数Cの情報に基づき、推計モデルYを適用する。
このように、将来推計部151は、関連するカテゴリが未確定のものが含まれないものから順に推計することで、階層的に推計を実施する。具体的には、例えば、カテゴリ変数Cがyとnの2種類の値を取りうる情報である場合には、将来推計部151が、まず推計モデルXを用いて、yの確率を0.6、nの確率を0.4、などと確率値を推計する。
次に、将来推計部151は、推計モデルYを用いて、未確定カテゴリ変数Cがyの場合の未確定カテゴリ変数Dの値Dyと、未確定カテゴリ変数Cがnの場合の未確定カテゴリ変数Dの値Dn、の二つの情報を推計する。
最後に将来推計部151は、これらの情報から期待値を計算し、0.6×Dy+0.4×Dnを未確定カテゴリ変数の推計値とする。なお、未確定カテゴリ変数の値の確率値を用いて推計する場合においても、他の確定カテゴリ変数に関しては、データ分割情報記憶部165に記憶されたラベル情報に基づき、将来推計部151は、データを分割して適用する。
次に、目的変数推計処理のステップ4306では、将来推計部151が目的変数推計モデルを適用する。目的変数推計モデルの適用は以下の三つの場合分けで実施される。
ひとつ目の例を説明する。目的変数推計モデルに関連カテゴリがひとつも存在しないとき、将来推計部151は全ての整形データ3401を用いて、説明変数から目的値の情報を推計する。
ふたつ目の例を説明する。目的変数推計モデルに含まれる関連カテゴリが全て確定カテゴリ変数である場合、将来推計部151は各カテゴリの値ごとに整形データ3401を分割し、分割した各データに、各カテゴリの値に対応した未確定カテゴリ推計モデルを適用して、未確定カテゴリ変数を推計する。
三つ目の例を説明する。目的変数推計モデルに含まれる関連カテゴリに未確定カテゴリ変数が含まれる場合、未確定カテゴリ変数推計モデルで推計した確率情報を用いて推計する。例えば、未確定カテゴリ推計モデルYと目的変数推計モデルZが存在し、未確定カテゴリ推計モデルYの推計対象が未確定カテゴリ変数Dであって、目的変数推計モデルZの推計対象が変数z,目的変数推計モデルZに含まれる関連カテゴリが未確定カテゴリ変数D、である場合を考える。
この場合、未確定カテゴリ変数Dは未確定であるため、この値が確定しない限り、目的変数推計モデルZを用いた推計を実施することができない。そこで将来推計部151は、未確定カテゴリ推計モデルYを用いて推計した未確定カテゴリ変数Dに関する確率情報を用いて、目的変数を推計する。具体的には、例えば、未確定カテゴリ変数Dがyとnの2種類の値を取りうる情報であって、未確定カテゴリ推計モデルYによって推計された未確定カテゴリ変数Dの確率がyの確率を0.3、nの確率を0.7、などの確率値であるとする。
このとき、まず将来推計部151は、目的変数推計モデルZを用いて、未確定カテゴリ変数Dがyの場合の目的変数zの値zyと、未確定カテゴリ変数Dがnの場合の目的変数zの値znの二つの情報を推計する。最後にこれらの情報から期待値を計算し、0.3×zy+0.7×znを目的変数zの推計値とする。
本推計処理で推計した個人毎の推計情報は、整形データ3401と合わせて、推計情報記憶部168に記憶される。
次に、人口動態補正ステップ911では、死亡推計部123が、ステップ910で構築されて死亡推計モデル記憶部139に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部124は、ステップ910で構築されて転出推計モデル記憶部140に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部125が、死亡推計部123及び転出推計部124が推定した当該年度の推定結果を用いて、目的変数である医療費の推計結果を補正する。なお、死亡推計部123、転出推計部124及び人口動態補正部125は、人口動態補正切替欄830の設定にかかわらず介護度及び介護費の推計結果の人口動態補正データを生成するが、図45の推計結果表示画面4500の人口動態補正切替欄830で「人口動態補正あり」が選択されている場合に、推計結果集計ステップ906の中で介護度の推計結果の人口動態補正データを生成してもよい。
死亡モデル・転出モデル構築ステップ910については、前述した実施例1と同じである。
次に、推計情報集約部152の処理について説明する。将来推計部151では、推計情報記憶部168に記憶された個人毎の推計結果を、ある特定のカテゴリ変数に基づいて集約し、集団毎の推計結果を生成する。
図46は、推計情報集約部152で実施される処理の一例を示すフローチャートを示す図である。以下、各ステップについて説明する。
推計情報読出のステップ4601では、推計情報集約部152が、推計情報記憶部168に記憶された推計結果の情報を読み出す。
集約指標決定のステップ4602では、推計情報集約部152が、推計情報記憶部168から読出した推計結果の情報を集約する指標を決定する。推計情報集約部152は、指標として、推計結果の情報と合わせて記憶された個人毎の整形データ3401に含まれる少なくともひとつ以上のカテゴリ変数を、集約する指標として決定する。指標としては、例えば、個人毎の基本情報に含まれる性別や年齢を10歳ごとに階級化した情報や、介護保険の階級や、住所情報から取得した所在地に関する情報、などが挙げられる。
集約方法決定のステップ4603では、推計情報集約部152が、集約指標決定のステップ4602で決定したカテゴリ変数に関して、推計情報をどのように集計するかを決定する。例えば、カテゴリ変数毎に集約した情報の合計、平均、最大値、最小値、中央値、最頻値、標準偏差などの集計方法を決定する。
集約処理のステップ4604では、推計情報集約部152が、集約指標決定のステップ4602で決定した集約指標を、集約方法決定のステップ4603で決定した集計方法で、推計情報を集計する。集計した結果は、推計情報記憶部168に記憶する。
将来推計端末101が出力部103に表示するグラフィカルユーザインターフェイスの一例を以下に示す。
図44は、実施例6を実現する操作画面の一例を示すグラフィカルユーザインターフェイスの図である。図示の例では、整形データ3401を選択し、選択した整形データ3401の推計モデルを構築し、構築した推計モデルのパラメータ及びアーキテクチャに関する情報を表示するための操作画面4400の一例を示す。
図中4401は、整形データ3401を選択するためのボタンである。4402は推計モデル構築処理を実行するためのボタンである。4403は、推計モデルのパラメータ及びアーキテクチャを画面上に表示するためのボタンである。
図中4404は、推計モデルで用いられる目的変数と、説明変数と、カテゴリ変数の情報を表示する表である。
図中4405は、推計モデルに含まれる目的変数推計モデルの中の目的変数推定用パラメータの情報をカテゴリ変数の値による分類ごとに表示する表である。4406は、推計モデルに含まれる未確定カテゴリ変数推計モデルの中の、未確定カテゴリ変数推定用パラメータの情報をカテゴリ変数の値による分類ごとに表示する表である。4407は、推計モデルのアーキテクチャとして、使用された説明変数と、目的変数と、カテゴリ変数との関係性をグラフにより可視化する表示領域である。
表示領域4407は、カテゴリ変数を四角、説明変数を丸の図形で示し、説明変数と目的変数の関係性を矢印で表している例を示している。
将来推計端末101のユーザは実施例6で示す操作画面4400を用いることにより、推計モデルの構築に必要な整形データ3401を選択できる。そして、将来推計端末101は、選択した整形データに基づき、推計モデルの構築処理を実行できる。ユーザは、操作画面4400を用いることで、構築した推計モデルの説明変数や、目的変数や、カテゴリ変数などの各種パラメータと、関係性であるモデルのアーキテクチャを把握できる。
図45は実施例6を実現する推計結果表示画面4500の一例を示すグラフィカルユーザインターフェイスの図である。推計結果表示画面4500は、推計モデルを用いて推計結果を表示するための画面の例を示す。
図中4501は、推計結果を選択するためのボタンである。4502は推定した結果を、年代(または年度)ごとに集約して表示するための表である。図示の例では、2015年度の情報に基づいて、2016年度と2017年度の2型糖尿病の医療費を推計した結果を表示する例を示している。
図中4503は、集計対象を指定するためのプルダウンであり、プルダウン4503で指定された集計対象に応じて、推計情報集約処理が実行され、画面内の情報が更新される。4504は、読み出す推定結果の目的変数を指定するためのプルダウンである。プルダウン4504で指定された対象疾病の情報を画面内の情報として表示する。
図中830は、図43のステップ911に示す人口動態補正を実行するかを切り替えるために操作される人口動態補正切替欄である。人口動態補正切替欄830の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。
図中4505は、プルダウン4503で指定された集計対象で、プルダウン4504で指定された疾病の推計結果を集計した結果を表示するためのグラフ表示領域である。4506は、4503で指定した集計対象で、4504で指定した疾病の集計結果を地図として表示するための地図表示領域である。
実施例6において、実施例3~5のいずれかを組み合わせて介護費と医療費を推計してもよい。
図47は、介護費と医療費の推計結果を表示する推計結果表示画面4700の一例を示すグラフィカルユーザインターフェイスの図である。推計結果表示画面4700は、推計モデルを用いて推計結果を表示するための画面の例であり、対策介護度選択欄2410、人口動態補正切替欄830、介護施策選択タブ表示欄2420、施策効果推計対象者の選定欄2430、施策効果推計結果表示欄2440及び集計条件入力欄810を含む。
対策介護度選択欄2410は、入力部102で対策が必要な介護度(目的変数)をユーザに選択させる欄である。図示する例では、対策が必要な介護度(目的変数)として、「要支援1以上」が選択されている。
人口動態補正切替欄830は、図43のステップ911に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄830の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。
介護施策選択タブ表示欄2420は、対策介護度選択欄2410で選択された介護度(目的変数)の抑制に寄与が大きい説明変数を選択タブで表示する。具体的には、説明変数抽出部118が、対策介護度選択欄2410で選択された目的変数を対象に、介護度推計モデル(図6又は図15)から、Z値が負の説明変数を値が小さい順に抽出して表示する。図示する例では、目的変数が「要支援1以上」で、「要支援1以上」の抑制に寄与が大きい説明変数を抽出した例を示しており、介護度推計モデルから、Z値が負の説明変数を値が小さい順に抽出すると、健診受診2921である例を示す。ユーザは、この選択タブから、介護施策を選択する。図示する例では、健診受診2921が選択されている。
施策効果推計対象者の選定欄2430は、施策実施率(健診受診率)設定欄4701を含む。施策実施率(健診受診率)設定欄4701には、地域(集計対象の住所)毎の施策実施率の現在の値が表示され、シミュレーションする施策実施率の変更後の値がプルダウンで設定可能となっている。
施策効果推計結果表示欄2440は、介護費推計結果表示欄4702及び医療費推計結果表示欄4703を含む。
介護費推計結果表示欄4702については、施策効果推計部110が、施策効果推計対象者の選定欄2430で選択された全ての対象者について、T+n年度の介護費を集計し、施策実施率表示欄2431に表示された現在の実施率の場合のT+n年度の介護費及び設定された実施率の場合のT+n年度の介護費を算出する。さらに、実施率が0%の場合のT+n年度の介護費と、算出された各介護費との差分を算出し、現在の実施率の場合のT+n年度の介護費の抑制額4704及び設定された実施率の場合のT+n年度の介護費の抑制額4705を表示する。
医療費推計結果表示欄4703については、同様に将来推計部150が、施策効果推計対象者の選定欄2430で選択された全ての対象者について、T+n年度の医療費を集計し、施策実施率表示欄2431に表示された現在の実施率の場合のT+n年度の医療費及び設定された実施率の場合のT+n年度の医療費を算出する。さらに、実施率が0%の場合のT+n年度の医療費と、算出された各医療費との差分を算出し、現在の実施率の場合のT+n年度の医療費の抑制額4706及び設定された実施率の場合のT+n年度の医療費の抑制額4707を表示する。
集計条件入力欄810は、施策効果推計結果表示欄2440に表示する対象者の条件を入力する欄である。図示する例では、T年度の年齢入力欄812、住所入力欄813及び健診対象入力欄814を設けているが、整形データ400、1300に格納されているT年度の任意のデータ項目を条件として入力する欄を設けてもよい。図示する例では、年齢入力欄812に40歳以上、住所入力欄813にA市、健診対象入力欄814に1(対象者)が入力されている。
以下、実施例6に係る推計モデル構築システムの効果を説明する。
実施例6に示した推計モデル構築システムは、目的変数を推計するモデルを構築する際に、説明変数に含まれる変数の中で、任意のカテゴリ変数に関して、カテゴリ変数の値が同一のデータ毎にデータを分割し、それぞれのデータから推計モデルを構築することができる。これにより、属性や既往歴等の背景が異なる個体から構成された集団を推計する場合に、推計精度を向上することができる。
実施例6に示した推計モデル構築システムは、カテゴリ変数の値に基づいてデータを分割してモデルを構築する際、推計時にこのカテゴリ変数の値が確定した値であるか、それとも未確定の値であるか否かを判定する。
推計モデル構築システムは、推計時にカテゴリ変数の値が未確定の場合は、カテゴリ変数を推計するモデルと、目的変数を推計するモデルをふたつ構築する。これにより、推計時にカテゴリ変数の値が未確定な場合でも、高い推計精度で推計することができる。例えば、ある年度の、ある疾病に関する医療費を推計する場合に、ある年度の疾病の有無の情報をカテゴリ変数とし、この疾病の有無の情報を推計するモデルと、医療費を推計するモデルのふたつの推計モデルを構築し、それらを階層的に適用することで、医療費を高い精度で推計できる。また、医療費と疾病の有無の情報の二つを同時に推計できる。
実施例6に示した推計モデル構築システムは、カテゴリ変数の値に基づいて、それぞれモデルを構築するため、カテゴリ変数の値ごとに構築したモデルのパラメータを把握できる。これにより、ある特定の群に関し、興味のある目的変数に影響している変数をそれぞれのモデルから把握することができる。
実施例6に示した推計モデル構築システムは、個人毎に集計した情報を任意のカテゴリ変数で集約し、集団の推計を実施することができる。これにより、ユーザが所望する所定の粒度で、集団の将来の健康状態や医療状態を把握することが出来る。
以下、実施例6に係る推計モデル構築システムの変形例を説明する。
実施例6では、対象とするデータとして、個人毎のレセプト情報及び特定健診情報が時系列で含まれたデータを用いた例を説明し、さらに、これらの情報を年度毎に集約し、年度単位に推計するモデルを構築する例を説明したが、実施例6で扱うことの出来るデータはこれに限定されない。
例えば、健康情報に関するセンシング情報や、保険に関する情報など、広く健康や医療あるいは介護に関する情報を扱うことができる。また、情報を集約する時間間隔も、四半期ごと、月ごと、など、広く様々な時間間隔のモデルを構築することができる。また、実施例6の推計モデル構築システムは、定期的な試験の結果などに基づいて教育分野に適用することができる。
実施例6では、推計モデルとして、様々な推計モデルを扱うことができる。例えば、カテゴリ変数の情報を推計するモデルとしては、ロジスティック回帰やニューラルネットワークなどの、説明変数と目的変数の関係性を式で記述したモデルや、サポートベクトルマシンやKNN(k-nearest neighbor algorithm)のように、モデル構築データの部分集合をパラメータ化して保持するモデルや、ベイジアンネットワークのように、説明変数と目的変数の確率的な依存関係を保持するモデルや、ランダムフォレストのように、いくつかの分類ルールを集約したモデル、など、様々なモデルを推計モデルとして活用することができる。
実施例6では、目的変数に関するカテゴリ変数を指定する方法として、関連カテゴリマトリクス3701を用いる方法を説明したが、関連カテゴリマトリクス3701以外の方法を用いて、目的変数に関連するカテゴリ変数を読み出してもよい。例えば、関連カテゴリ変数読出処理で構築する目的変数と関連カテゴリ変数群の関係性を示したツリー構造を、事前に構築し、記憶しておき、当該情報を直接用いて、関連カテゴリ変数を読み出してもよい。
実施例6では、個人毎に推計する推計モデルを構築し、推計した結果を、所定のカテゴリに基づき集団として推計する例を示したが、推計は個人よりも大きな粒度で実施してもよい。例えば、市単位で集約した情報に関して推計する推計モデルを構築してもよい。
以上のように、実施例6に係る推計モデル構築システムは、カテゴリ変数毎の推計モデル構築処理、及び、推定時に未確定のカテゴリ変数を推計する推計モデル構築処理を構築し、背景の異なる人の混在した集団においても、精度の高い将来推計が可能な推計モデルを構築することができる。
<実施例7>
実施例6では、推計対象の目的変数と関連するカテゴリ変数が、事前に関連カテゴリ記憶部164に記憶された推計モデル構築システムの例を説明した。実施例7では、整形データ3401に基づき、目的変数と関連するカテゴリ変数を決定するための処理を実行する推計モデル構築システムの例を説明する。構成や処理などは、関連カテゴリ関連付け部153を除き、前記実施例6と同様であるため、重複した説明を省略する。
関連カテゴリ関連付け部153では、整形データ記憶部163に記憶された整形データ3401と、目的変数の情報を用いて、目的変数に関するカテゴリ変数の項目を決定する。
以下、カテゴリ変数の項目の決定方法を説明する。
一つ目の例を説明する。目的変数と同一の項目であって、過去の時系列で取得された情報を、目的変数と関連するカテゴリ変数とする。例えば、目的変数がある年度の疾病の受診の有無である場合に、過去の年度の同じ疾病の受診の有無を、目的変数と関連するカテゴリ変数として指定する。
例えば、将来のある疾病の受診の有無は、現在の疾病の受診状況に大きく依存するという関係性を有する。そこで、現在の疾病の受診状況に応じて、推計モデルを分離することで、推計精度を向上する。
二つ目の例を説明する。目的変数と同じ時期の情報であって、目的変数との類似度の高い変数をカテゴリ変数として選択する。例えば、相関や相互情報量が一定(閾値)以上の項目を、カテゴリ変数として選択する。例えば、同じ年度のある疾病の医療費に関連するカテゴリ変数として、同じ疾病の受診の有無の情報をカテゴリ変数として指定する。これにより、他の変数に依存した変数の推計精度を向上することができる。
三つ目の例を説明する。ある変数を仮の関連カテゴリ変数として設定し、当該変数に関して、関連カテゴリ変数の値が同一のデータ毎に分割した整形データ3401からそれぞれ目的変数を推計する推計モデルを構築し、それらの推計モデルを用いて目的変数を推計した結果と、整形データ3401を分割せずに単一の推計モデルで推計した結果、または異なるカテゴリ変数で整形データ3401を分割し、構築した推計モデルで推計した結果、のいずれかを比較し、推計の比較結果(推計精度)に基づいて、関連カテゴリ変数を決定する。推計精度の比較は、例えば、過去の整形データ3401を用いた交差検証により実施することができる。
以下、実施例7に係る推計モデル構築システムの効果を説明する。
実施例7に示した推計モデル構築システムは、整形データ3401に基づき、推計モデル構築の対象とする整形データ3401の分割方法を決定することができる。これにより、例えば整形データ3401に含まれる情報の質が変化した場合であっても、当該整形データ3401に適切な推計モデルを自動的に構築することが可能となる。
以上に説明したように、本発明に実施例の将来推計システムは、所定の集団の複数の構成員の各々の第1時点及び第2時点の状況を示す時系列データ(例えば、介護データ記憶部131の介護データ200、データ記憶部161の医療費データ)と構成員の属性を示す構成員データ(例えば住民データ記憶部132の住民データ300)とを個人単位で連結して、前記第1時点及び前記第2時点の整形データ400、1300、3401を作成するデータ整形部111と、第1時点の前記整形データを説明変数として目的変数別の回帰分析によって生成された回帰式からなる推計モデルに第2時点の前記整形データを入力して、第3時点の時系列データを推計するデータ推計部(介護度推計部114、介護費推計部117、将来推計部151)と、構成員の各々が前記所定の集団に所属しなくなる確率を推計する動態推計部(死亡推計部123、転出推計部124)と、動態推計部による推計結果を用いて、データ推計部が推計した時系列データを補正する人口動態補正部125とを有するので、構成員の動態を考慮して将来の状況(例えば、介護度、介護費、疾病発症数、医療費など)を高精度に推計できる。また、構成員の動態に応じて、個人単位で推計結果を補正するので、任意の集団の将来の状況を高精度に予測できる。
また、動態推計部は、第1時点の整形データを説明変数として構成員の死亡を目的変数とした回帰分析によって生成された回帰式からなる死亡推計モデルに第2時点の整形データを入力して、第3時点の前記構成員の死亡の確率を推計する死亡推計部123と、第1時点の整形データを説明変数として構成員の転出を目的変数とした回帰分析によって生成された回帰式からなる転出推計モデルに第2時点の整形データを入力して、第3時点の構成員の転出の確率を推計する転出推計部124とを含み、人口動態補正部125は、死亡推計部123による推計結果及び転出推計部124による推計結果を用いて、データ推計部が推計した時系列データを補正するので、自治体の人口の動態の主要因である死亡と転出を正確に推計できる。
また、第1時点の整形データを説明変数として構成員の死亡を目的変数とした回帰分析によって回帰式からなる死亡推計モデルを生成する死亡推計モデル構築部121と、第1時点の前記整形データを説明変数として構成員の転出を目的変数とした回帰分析によって回帰式からなる転出推計モデルを生成する転出推計モデル構築部122とを有するので、自治体における主要な人口動態変化である住民の死亡と転出を正確に推計できる。
また、時系列データが示す構成員の状況は、要介護度、介護費、及び医療費の少なくとも一つであって、データ推計部は、第3時点の要介護度、介護費、及び医療費の少なくとも一つを推計するので、自治体において介護度及び介護費を正確に推計し、効果的な介護施策を立案し実行できる。
また、前記データ推計部が推計した前記時系列データと、前記動態補正部が前記時系列データを補正したデータとを切り替えて表示する集計部(推計結果集計部115、推計情報集約部152)を有するので、人口動態を補正しない場合と、補正した場合の予測結果を容易に比較分析でき、効果的な介護施策を立案し実行できる。
また、集計部は、データ推計部が推計した時系列データに基づく施策効果と、前記動態補正部が前記時系列データを補正したデータに基づく施策効果とを切り替えて表示するので、人口動態を補正しない場合と、補正した場合の施策効果を容易に比較分析でき、効果的な介護施策を立案し実行できる。
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、ICカード、SDカード、DVD等の記録媒体に格納することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。