JP7296873B2

JP7296873B2 - 将来推計システム及び将来を推計する方法

Info

Publication number: JP7296873B2
Application number: JP2019236534A
Authority: JP
Inventors: 泰隆長谷川; 秀行伴; 哲也森池; 勇人西川; 智堀江
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-12-26
Filing date: 2019-12-26
Publication date: 2023-06-23
Anticipated expiration: 2039-12-26
Also published as: JP2021105823A

Description

本発明は、将来の介護度、介護費、医療費などの将来の状況を推計する将来推計システムに関する。

自治体では、住民の健康寿命の延伸や介護費の適正化のため、地域包括ケアや科学的介護など自治体に蓄積された住民情報、介護、医療及び健診データの利活用を進めており、現在の介護状況だけでなく、将来の介護度及び介護費も把握した上で、効果的な介護施策を立案・実行することが重要である。また、効果的な介護施策を立案するためには、地域特性や個人特性を考慮した施策立案が重要であり、自治体全体だけでなく、地区、校区、個人単位など、より細かいミクロな単位で、将来の介護度及び介護費を推計できる必要がある。

医療費を予測する従来例としては特許文献１（特開２００５－５０３８０公報）がある。特許文献１は、医療費予測サーバは、会社端末から被保険者の個人属性、検診データ、及び生活習慣を受信し、被保険者の個人属性に応じた慢性疾患の発症率を読み取る。そして読み取った発症率を検診データ及び生活習慣で補正する。さらに当該団体の未発症の組合員のうちの被扶養者と将来までの採用者とを対象に、将来の平均発症率とそれに伴う医療費を算出する。さらに、当該慢性疾患を既に発症している組合員にかかる医療費を算出して加算する。同様の手順を、全ての慢性疾患の種類について繰り返すことにより当該団体の組合員にかかる将来の慢性疾患の医療費を算出する。さらに、非慢性疾患医療費を組合員の個人属性に基づいて算出し、慢性疾患の医療費に加算することで、当該団体に将来かかる総医療費負担を算出する医療費予測システムを開示する。

特開２００５－５０３８０公報

しかしながら、特許文献１に開示された医療費予測システムでは、組合員の死亡や転出に起因する動態変化は考慮されておらず、予測結果と実体のズレが大きい。

そこで、本発明は、構成員データ（例えば住民データ）及び時系列データ（例えば介護データ）から将来の将来所の状況（例えば介護度）を個人単位に高精度に推計し、構成員の動態変化を用いて補正して、将来の介護度、介護費、医療費などの将来の状況を高精度で推計する将来推計システムを提供することを目的とする。

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、将来の状況を推計する将来推計システムであって、所定の処理を実行する演算装置と、データが入力される入力部と、前記演算装置がアクセス可能な記憶装置とを備え、前記入力部は、所定の集団の複数の構成員の各々の第１時点及び第２時点の状況を示す時系列データ及び前記構成員の属性を示す構成員データの入力を受け、前記将来推計システムは、前記演算装置が、前記時系列データと前記構成員データとを個人単位で連結して、前記第１時点及び前記第２時点の整形データを作成するデータ整形部と、前記演算装置が、前記第１時点の前記整形データを説明変数として目的変数別の回帰分析によって生成された回帰式からなる推計モデルに前記第２時点の前記整形データを入力して、第３時点の時系列データを推計するデータ推計部と、前記演算装置が、前記構成員の各々が前記所定の集団に所属しなくなる確率を推計する動態推計部と、前記演算装置が、前記動態推計部による推計結果を用いて、前記データ推計部が推計した前記時系列データを補正する動態補正部とを有することを特徴とする。

本発明の一態様によれば、構成員の動態を考慮して将来の状況を高精度に推計できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。

実施例１の将来推計システムの構成を示すブロック図である。介護データの例を示す図である。住民データの例を示す図である。実施例１の整形データの例を示す図である。二値化処理の例を示す図である。実施例１の介護度推計モデルの例を示す図である。介護度推計結果の例を示す図である。介護度推計結果表示画面の例を示す図である。介護度推計処理のフローチャートである。実施例１の死亡モデル・転出モデル構築ステップから人口動態補正ステップを示す概念図である。実施例２の将来推計システムの構成を示すブロック図である。医療データの例を示す図である。健診データの例を示す図である。実施例２の整形データの例を示す図である。実施例２の介護度推計モデルの例を示す図である。実施例３の将来推計システムの構成を示すブロック図である。介護費推計モデルの例を示す図である。介護度・介護費推計結果の例を示す図である。介護度・介護費推計結果表示画面の例を示す図である。介護費推計処理のフローチャートである。実施例３の死亡モデル・転出モデル構築ステップから人口動態補正ステップを示す概念図である。実施例４の将来推計システムの構成を示す図である。実施例５の将来推計システムの構成を示す図である。介護サービス実施率が１００％の場合の介護度・介護費推計結果の例を示す図である。介護サービス実施率が０％の場合の介護度・介護費推計結果の例を示す図である。介護サービス実施率が３０％の場合の介護施策効果シミュレーション画面の例を示す図である。介護サービス実施率が６０％の場合の介護施策効果シミュレーション画面の例を示す図である。介護施策効果推計処理のフローチャートである。健診受診率が１００％の場合の介護度・介護費推計結果の例を示す図である。健診受診率が０％の場合の介護度・介護費推計結果の例を示す図である。健診受診率が２０％の場合の介護施策効果シミュレーション画面の例を示す図である。健診受診率が８０％の場合の介護施策効果シミュレーション画面の例を示す図である。実施例６の推計モデル構築システムの構成を示すブロック図である。実施例６の整形データの一例を示す図である。実施例６の医療費推計モデル構築処理の一例を示すフローチャートである。実施例６の関連カテゴリ読出処理の一例を示すフローチャートである。実施例６の関連カテゴリマトリクスの一例を示す図である。実施例６の関連カテゴリ間の関連性の一例を示すツリーである。実施例６の関連カテゴリ間の関連性の他の例を示すツリーである。実施例６の医療費推計モデル構築用整形データの一例を示す図である。実施例６のラベル付けテーブルの一例を示す図である。実施例６のラベル付けテーブルの一例を示す図である。実施例６の医療費推計モデル構築用整形データの他の例を示す図である。実施例６のラベル付けテーブルの他の例を示す図である。実施例６のラベル付けテーブルの他の例を示す図である。実施例６のラベル付けテーブルの他の例を示す図である。実施例６のラベル付けテーブルの他の例を示す図である。実施例６の推計処理の一例を示すフローチャートである。実施例６の操作画面の一例を示す図である。実施例６の推計結果表示画面の一例を示す図である。実施例６の推計情報集約処理の一例を示すフローチャートである。実施例６の介護施策効果シミュレーション画面の例を示す図である。

以下、発明を実施するための実施例を、図面を用いて説明する。

本発明の実施例１では、住民データ及び介護データから将来の介護度を推計し、自治体の介護施策立案を支援する将来推計システムを説明する。実施例２では、介護データ及び住民データに医療データ及び健診データを加えて、将来の介護度を推計する将来推計システムを説明する。実施例３では、将来の介護度及び介護費を推計する将来推計システムを説明する。実施例４では、介護データ、住民データ、医療データ及び健診データから、将来の介護度及び介護費を推計する将来推計システムを説明する。実施例５では、介護度推計モデルから、将来の介護発生又は介護進行を抑制する施策となる説明変数を抽出し、その施策の効果を推計する将来推計システムを説明する。実施例６では、住民データ及び医療費データから将来の医療費を推計する将来推計システムを説明する。実施例７では、整形データに基づいて、目的変数と関連するカテゴリ変数を決定するための処理を実行する推計モデル構築システムを説明する。

また、以下の実施例では、自治体の住民の動態を考慮して、将来の介護度、介護費、医療費などの住民の各々の将来の状況を示す時系列データを推計するが、自治体以外の所定の集団の構成員の状況を示す時系列データの推計にも本発明を適用できる。例えば、健康保険組合の被保険者について、その動態を考慮して、将来の介護度、介護費、医療費などの被保険者の各々の状況を示す時系列データを推計してもよい。

＜実施例１＞
実施例１では、蓄積された介護データ及び住民データから、将来の介護度を個人単位に推計する将来推計システムの例を説明する。なお、要介護度の段階ｍは、介護度無、要支援１、要支援２、要介護１、要介護２、要介護３、要介護４、要介護５の８段階（ｍ＝８）として説明する。

図１は、実施例１の将来推計システムの構成を示すブロック図である。

実施例１の将来推計システムは、将来推計端末１０１及びデータベース１３０を有する。

将来推計端末１０１は、入力部１０２、出力部１０３、プロセッサ（ＣＰＵ）１０４、メモリ１０５及び記憶媒体１０６を有する計算機である。

入力部１０２は、マウス、キーボードなどのヒューマンインターフェースであり、将来推計端末１０１への入力を受け付ける。出力部１０３は、将来推計端末１０１による演算結果を出力するディスプレイやプリンタである。記憶媒体１０６は、将来推計端末１０１による介護度推計処理を実現する各種プログラム、及び介護度推計処理の実行結果等を格納する記憶装置であり、例えば、不揮発性記憶媒体（磁気ディスクドライブ、不揮発性メモリ等）で構成される。

メモリ１０５は、不揮発性の記憶素子であるＲＯＭ及び揮発性の記憶素子であるＲＡＭを含む。ＲＯＭは、不変のプログラム（例えば、ＢＩＯＳ）などを格納する。ＲＡＭは、ＤＲＡＭ（Dynamic Random Access Memory）のような高速かつ揮発性の記憶素子であり、プロセッサ１０４が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。すなわち、メモリ１０５には、記憶媒体１０６に格納されているプログラムが展開される。

プロセッサ１０４は、メモリ１０５にロードされたプログラムを実行する演算装置であり、例えば、ＣＰＵ、ＧＰＵなどである。以下に説明する処理及び演算は、プロセッサ１０４が実行する。なお、プロセッサ１０４がプログラムを実行して行う処理の一部を、他の演算装置（例えば、ＦＰＧＡ（Field Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）などのハードウェア）で実行してもよい。

プロセッサ１０４によって実行されるプログラムは、リムーバブルメディア（ＣＤ－ＲＯＭ、フラッシュメモリなど）又はネットワークを介して各サーバに提供され、非一時的記憶媒体である不揮発性記憶装置に格納される。このため、計算機システムは、リムーバブルメディアを読み込むインターフェースを有してもよい。

本実施例の将来推計システムは、一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。

記憶媒体１０６は、データ整形部１１１、二値化処理部１１２、介護度推計モデル構築部１１３、介護度推計部１１４、推計結果集計部１１５、モデル構築用データ作成部１２０、死亡推計モデル構築部１２１、転出推計モデル構築部１２２、死亡推計部１２３、転出推計部１２４及び人口動態補正部１２５を実現するためのプログラムを格納する。

データ整形部１１１は、入力部１０２に入力された複数人分の、少なくとも２年度分（Ｔ年度とＴ－ｎ年度）の要介護度・介護費等を含む介護データ（図２）と、性別・年齢・住所等を含む住民データ（図３）を取得し、各データを個人別かつ年度別に連結した上で、個人を行に、年度を列に展開した整形データ（図４）を作成する。

二値化処理部１１２は、データ整形部１１１で作成された整形データから、Ｔ年度の要介護度を取得し、順序尺度データである８段階の要介護度（介護度無（０）＜要支援１（１）＜要支援２（２）＜要介護１（３）＜要介護２（４）＜要介護３（５）＜要介護４（６）＜要介護５（７））を７箇所で２値化し、Ｔ年度の要介護度について７個の目的変数１～７（図５）を作成する。ここで、目的変数１は要支援１以上（１）と介護度無（０）、目的変数２は要支援２以上（１）と要支援１以下（０）、目的変数３は要介護１以上（１）と要支援２以下（０）、目的変数４は要介護２以上（１）と要介護１以下（０）、目的変数５は要介護３以上（１）と要介護２以下（０）、目的変数６は要介護４以上（１）と要介護３以下（０）、目的変数７は要介護５以上（１）と要介護４以下（０）に二値化される。

介護度推計モデル構築部１１３は、二値化処理部１１２で作成されたＴ年度の要介護度における７個の目的変数１～７について、Ｔ－ｎ年度の整形データを説明変数としたロジスティック回帰分析を各目的変数別に７回実行し、７個のロジスティック回帰式から構成される介護度推計モデル（図６）を構築する。なお、将来推計システムの外部から介護度推計モデルが提供される場合、将来推計端末１０１は介護度推計モデル構築部１１３を有さなくてもよい。

介護度推計部１１４は、介護度推計モデル構築部１１３で構築された介護度推計モデルに、Ｔ年度の整形データが入力されると、Ｔ＋ｎ年度の要介護度別の確率を個人別に推計する（図７）。目的変数１の要支援１以上の確率をＰ１、目的変数２の要支援２以上の確率をＰ２、目的変数３の要介護１以上の確率をＰ３、目的変数４の要介護２以上の確率をＰ４、目的変数５の要介護３以上の確率をＰ５、目的変数６の要介護４以上の確率をＰ６、目的変数７の要介護５以上の確率をＰ７とすると、要介護度別の確率（ＮＰ）は、介護度無（ＮＰ０）が１－Ｐ１、要支援１（ＮＰ１）がＰ１－Ｐ２、要支援２（ＮＰ２）がＰ２－Ｐ３、要介護１（ＮＰ３）がＰ３－Ｐ４、要介護２（ＮＰ４）がＰ４－Ｐ５、要介護３（ＮＰ５）がＰ５－Ｐ６、要介護４（ＮＰ６）がＰ６－Ｐ７、要介護５（ＮＰ７）がＰ７で推計される。

推計結果集計部１１５は、入力部１０２に入力されたユーザの集計条件（Ｔ年度の性別、年齢、住所など）に基づいて、介護度推計部１１４で推計された個人別の介護度推計結果を集計して、任意の集団単位で介護度別の将来推計人数を出力部１０３に表示する（図８）。

モデル構築用データ作成部１２０は、死亡推計モデル構築部１２１及び転出推計モデル構築部１２２及び、介護度推計モデル構築部１１３（後述の介護費推計モデル構築部１１６、医療費推計モデル構築部１４８を含む）が、それぞれ、死亡推計モデル、転出推計モデル、介護度推計モデル（後述の介護費推計モデル、医療費推計モデルを含む）を構築するために使用するデータを作成する。死亡推計モデル及び転出推計モデルを構築するためのデータは、データ整形部１１１で作成される整形データ４００と共用できるが、他のデータを用いてもよい。

具体的には、モデル構築用データ作成部１２０は、整形データ４００からＴ＋ｎ年度の死亡者を除いて、死亡推計モデルを構築するためのデータを作成する。また、前述の死亡推計モデルを構築するために作成したデータから、Ｔ年度の死亡者を除いて、転出推計モデルを構築するためのデータを作成する。さらに、モデル構築用データ作成部１２０は、前述の転出推計モデルを構築するために作成したデータから、Ｔ年度の転出者を除いて、介護度推計モデルを構築するためのデータを作成する。

死亡推計モデル構築部１２１は、作成されたモデル構築用データ（例えば整形データ４００）を用いて、住民の生死を個人別に推定するための死亡推計モデルを構築する。

転出推計モデル構築部１２２は、作成されたモデル構築用データ（例えば整形データ４００）を用いて、当該自治体から住民が転出するかを個人別に推定するための転出推計モデルを構築する。

死亡推計部１２３は、構築された死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。転出推計部１２４は、構築された転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。死亡推計部１２３及び転出推計部１２４による処理の詳細は、図１０を参照して後述する。死亡推計部１２３及び転出推計部１２４は、纏めて動態推計部を構成する。また、動態推計部が、死亡、転出以外の住民の動態を推計してもよい。さらに、動態推計部は、一つの推計モデルを用いても、複数の推計モデルを用いてもよい。

人口動態補正部１２５は、死亡推計部１２３及び転出推計部１２４が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する（図８のステップ９１１）。

データベース１３０は、介護データ記憶部１３１、住民データ記憶部１３２、整形データ記憶部１３３、介護度推計モデル記憶部１３４、推計結果記憶部１３５、死亡推計モデル記憶部１３９、転出推計モデル記憶部１４０から構成される。

介護データ記憶部１３１は、入力部１０２に入力された複数人かつ複数年度分の要介護度、介護費、受給した介護サービス、訪問調査結果（ＡＤＬ：日常生活動作、ＩＡＤＬ：手段的日常生活動作など）などの介護データを格納する。

住民データ記憶部１３２は、入力部１０２に入力された複数人かつ複数年度分の性別、年齢、住所などの住民データを格納する。

整形データ記憶部１３３は、データ整形部１１１で作成した整形データを格納する。

介護度推計モデル記憶部１３４は、介護度推計モデル構築部１１３で構築した介護度推計モデルを格納する。

推計結果記憶部１３５は、介護度推計部１１４が推計した介護度推計結果を格納する。

死亡推計モデル記憶部１３９は、死亡推計モデル構築部１２１が構築した死亡推計モデルを格納する。

転出推計モデル記憶部１４０は、転出推計モデル構築部１２２が構築した転出推計モデルを格納する。

図２は、介護データ記憶部１３１が格納する介護データ２００の例を示す図である。

介護データ２００は、複数の住民の複数年分の介護データを管理する。介護データ２００は、個人ＩＤ２０１、年度２０２、要介護度２０３、介護費２０４、日常生活自立度２０５、介護サービスの受給有無（通所介護２１１、介護予防支援２１２、介護保健施設２１３など）、介護サービスの受給回数（通所介護２１１、介護予防支援２１２、介護保健施設２１３など）、訪問調査結果（両足立位保持２２１、短期記憶２２２、移動２２３、食事摂取２２４、排便２２５、薬内服２２６など）を含む。

個人ＩＤ２０１は、一人の住民を示す識別子が登録される。年度２０２は、介護データが記録された年度を示す情報が登録される。要介護度２０３は、個人ＩＤ２０１の住民における各年度の要介護度を、０（介護度無）、１（要支援１）、２（要支援２）、３（要介護１）、４（要介護２）、５（要介護３）、６（要介護４）、７（要介護５）の区分で記録する。日常生活自立度２０５は、個人ＩＤ２０１の住民の各年度の日常生活自立度を、０（自立）、１（ランクＩ）、２（ランクIIａ）、３（ランクIIｂ）、４（ランクIIIａ）、５（ランクIIIｂ）、６（ランクIV）、７（ランクＭ）の区分で記録する。介護サービス有無２１１～２１３は、個人ＩＤ２０１の住民が各年度に受給した介護サービスを、その種類ごとに１（有）又は０（無）で記録し、介護サービス回数２１５～２１７は、その種類ごとに受給した回数を記録する。また、訪問調査結果２２１～２２６は、要介護認定の際に調査される７４項目の訪問調査結果であり、個人ＩＤ２０１の各年度のＡＤＬ（日常生活動作である両足立位保持２２１、移動２２３、食事摂取２２４、排便２２５等）、ＩＡＤＬ（手段的日常生活動作である薬内服２２６等）、認知機能としての短期記憶２２２などを記録しており、例えば、両足立位保持２２１では、０（できる）、１（支えが必要）又は２（できない）を記録し、短期記憶２２２では、０（できる）又は１（できない）を記録する。訪問調査結果は、身体機能・起居動作２０項目、生活機能（ＡＤＬ）１２項目、認知機能９項目、精神・行動障害１５項目、社会生活への適応（ＩＡＤＬ）６項目、特別な医療１２項目の計７４項目の調査項目からなり、介護データ２００は、これらの調査結果を記録する。

図３は、住民データ記憶部１３２が格納する住民データ３００の例を示す図である。

住民データ３００は、複数の住民の複数年分の住民データを管理する。住民データ３００は、個人ＩＤ２０１、年度２０２、性別３０３、年齢３０４、住所３０５、死亡３０６、転出３０７などを含む。年度２０２は、住民データが記録された年度を示す情報が登録される。性別３０３は、個人ＩＤ２０１の住民における性別が登録され、年齢３０４は、その住民の年齢が年度２０２別に登録される。また、住所３０５は、個人ＩＤ２０１の住民の住所が年度ごとに登録される。この例では、Ａ区、Ｂ区など地区単位で登録している例を示す。死亡３０６は、住民が当該年度において死亡した場合に１が登録される。転出３０７は、住民が当該年度において他の自治体に転出した場合に１が登録される。図では全ての項目を一つの住民データに纏めたが、死亡３０６及び転出３０７は、他のデータと別のテーブルで構成してもよい。

図４は、データ整形部１１１が作成し、整形データ記憶部１３３が格納する整形データ４００の例を示す図である。

整形データ４００は、住民データ３００及び介護データ２００から、複数人分の複数年度分（例えば、Ｔ－ｎ年度、Ｔ年度の２年度）のデータを抽出し、個人ＩＤ２０１及び年度２０２で連結して、個人を行に、年度を列に展開したデータである。図示する例では、整形データ４００は、個人ＩＤ２０１の住民におけるＴ－ｎ年度の住民・介護データ４０１とＴ年度の住民・介護データ４０２を示す。このｎ年の間隔があいた２時点の整形データ４００を作成することによって、現在（Ｔ年度）データから将来（Ｔ＋ｎ年度）の介護度を推計できる。

図５は、二値化処理部１１２が要介護度を二値化して７個の目的変数を作成する処理を示す図である。

図５は、整形データ４００から、Ｔ年度の要介護度を取得し、順序尺度データである８段階の要介護度（介護度無（０）＜要支援１（１）＜要支援２（２）＜要介護１（３）＜要介護２（４）＜要介護３（５）＜要介護４（６）＜要介護５（７））を７箇所で２値化し、Ｔ年度の要介護度について７個の目的変数１～７（５０１～５０７）を作成する処理を示す。この処理によって、目的変数１（５０１）は要支援１以上（１）と介護度無（０）に二値化され、目的変数２（５０２）は要支援２以上（１）と要支援１以下（０）に二値化され、目的変数３（５０３）は要介護１以上（１）と要支援２以下（０）に二値化され、目的変数４（５０４）は要介護２以上（１）と要介護１以下（０）に二値化され、目的変数５（５０５）は要介護３以上（１）と要介護２以下（０）に二値化され、目的変数６（５０６）は要介護４以上（１）と要介護３以下（０）に二値化され、目的変数７（５０７）は要介護５以上（１）と要介護４以下（０）に二値化される。

図６は、介護度推計モデル構築部１１３が構築し、介護度推計モデル記憶部１３４が格納する介護度推計モデル６００の例を示す図である。

介護度推計モデル６００は、介護度推計モデル構築部１１３が構築した７個のロジスティック回帰式であり、二値化したＴ年度の要介護度である目的変数１～７（５０１～５０７）別に、Ｔ－ｎ年度の説明変数６０１の回帰係数（６１１～６１７）とＺ値（６２１～６２７）を記録する。目的変数１～７が示す２値化した要介護度の確率をＰｉ（ｉ＝１～７）、説明変数をＸｊ（ｊ＝１～Ｊ）、回帰係数をａｉｊ（ｉ＝１～７、ｊ＝１～Ｊ）とすると、介護度推計モデル６００は式１で表される。なお、Ｊは説明変数の数である。

Pi＝1/(1＋exp(-Yi)), Yi＝ai1×X1＋・・・＋aiJ×XJ (式１)

また、Ｚ値ｂｉｊ（６２１～６２７）は、回帰係数ａｉｊをその標準誤差で割った値である。この値は、説明変数間の単位の違いを補正した値であり、目的変数に与える寄与の大きさを説明変数間で比較できる値である。図５及び図６に示すように、二値化したＴ年度の要介護度である目的変数１～７に与える寄与が高い説明変数を目的変数別に分析でき、介護の発生又は抑制、及び介護度の進行又は抑制に寄与する説明変数を抽出できる。例えば、目的変数１（５０１）のＺ値６２１が正でその値が大きい説明変数は、要支援１以上の発生（介護の発生）への寄与が高い説明変数であり、逆に、Ｚ値６２１が負で、その値が小さい説明変数は、要支援１以上の抑制（介護の抑制）への寄与が高い説明変数となる。また、目的変数４（５０４）のＺ値６２４が正でその値が大きい説明変数は、要介護２以上の発生（介護の進行）への寄与が高い説明変数であり、逆に、Ｚ値６２１が負で、その値が小さい説明変数は、要介護２以上の抑制（介護の進行抑制）への寄与が高い説明変数である。

図７は、介護度推計部１１４が推計し、推計結果記憶部１３５が格納する介護度推計結果７００の例を示す図である。

介護度推計結果７００は、Ｔ年度の整形データ４０２と、Ｔ年度の整形データ４０２を介護度推計モデル６００に入力して推計したＴ＋ｎ年度の要介護度別の確率ＮＰ７０１を個人別に記録する。Ｔ＋ｎ年度の要介護度別の確率ＮＰ７０１は、介護度無の確率ＮＰ０（７１１）、要支援１の確率ＮＰ１（７１２）、要支援２の確率ＮＰ２（７１３）、要介護１の確率ＮＰ３（７１４）、要介護２の確率ＮＰ４（７１５）、要介護３の確率ＮＰ５（７１６）、要介護４の確率ＮＰ６（７１７）、要介護５の確率ＮＰ７（７１８）を含み、前述した式１で表される介護度推計モデル６００にＴ年度の整形データ４０２を入力して算出され、Ｔ＋ｎ年度の２値化された要介護度の確率Ｐｉから推計する。具体的には、Ｔ＋ｎ年度の要介護度別の確率をＮＰｉ（ｉ＝０～７）は、式２で推計できる。なお、Ｐ０＝０、Ｐ８＝１とする。

NPi＝Pi-P(i+1) (式２)

これにより、現状の介護データ及び住民データから将来の介護度を個人別に推計できる。

図８は、推計結果集計部１１５が、出力部１０３に出力する介護度推計結果表示画面８００の例を示す図である。

介護度推計結果表示画面８００は、集計条件入力欄８１０、介護度別推計人数表示欄８２０及び人口動態補正切替欄８３０を含む。集計条件入力欄８１０は、この例では、Ｔ年度の性別８１１及び年齢８１２を入力する欄を設けているが、整形データに格納されているＴ年度の任意のデータ項目を条件として入力する欄を設けてもよい。介護度別推計人数表示欄８２０は、集計条件入力欄８１０に入力された条件に合致する介護度推計結果７００を、Ｔ年度の介護度別人数（８２１～８２４）及びＴ＋ｎ年度の介護度別推計人数（８３１～８３４）を住所別（地区別）に表示する。図示する例では、要介護２以上を表示している。住所別（地区別）のＴ＋ｎ年度の介護度別推計人数は、介護度推計結果７００を用いて、住所別（地区別）に、要介護度別の確率ＮＰ０～ＮＰ７（７１１～７１８）を集計して算出する。人口動態補正切替欄８３０は、図９のステップ９１１に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄８３０の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。

図７に示す介護度推計結果７００の例では、Ａ区に住んでいる住民は、個人ＩＤがＫ０００１及びＫ０００３であるので、Ａ区の介護度無の推計人数はＮＰ０１＋ＮＰ０３、要支援１はＮＰ１１＋ＮＰ１３、要支援２はＮＰ２１＋ＮＰ２３、要介護１はＮＰ３１＋ＮＰ３３、要介護２はＮＰ４１＋ＮＰ４３、要介護３はＮＰ５１＋ＮＰ５３、要介護４はＮＰ６１＋ＮＰ６３、要介護５はＮＰ７１＋ＮＰ７３で各々算出される。これにより、地区単位など任意の条件で将来の介護度別の人数を推計でき、自治体の地区診断に活用できる。例えば、図８に示すように、将来（Ｔ＋ｎ年度）の要介護２以上の人数について、Ａ区がＢ区より増加し、Ｃ区がＤ区より増加することが推計できれば、Ａ区とＣ区に対して重点的に介護予防施策を適用するなどの効果的な施策立案が可能になる。

次に、図９のフローチャートを用いて、介護度推計処理を説明する。

図９の処理を開始すると、まず、データ入力ステップ９０１を実行する。データ入力ステップ９０１では、将来推計端末１０１の入力部１０２が、介護データ２００（図２）及び住民データ３００（図３）の入力を受ける。入力された介護データ２００は介護データ記憶部１３１に格納され、入力された住民データ３００は住民データ記憶部１３２に格納される。

次に、データ整形ステップ９０２では、データ整形部１１１が、データ入力ステップ９０１で入力された介護データ２００（図２）及び住民データ３００（図３）から、複数の住民の２年度分（Ｔ－ｎ年度、Ｔ年度）のデータを抽出し、個人ＩＤ２０１及び年度２０２で連結した上で、個人を行に、年度を列に展開した整形データ４００（図４）を作成する。作成された整形データ４００は、整形データ記憶部１３３に格納される。

次に、二値化処理ステップ９０３では、二値化処理部１１２が、データ整形ステップ９０２で作成された整形データ４００から、Ｔ年度の要介護度を取得し、順序尺度データである８段階の要介護度（介護度無（０）＜要支援１（１）＜要支援２（２）＜要介護１（３）＜要介護２（４）＜要介護３（５）＜要介護４（６）＜要介護５（７））を７箇所で２値化し、図５で説明したように、Ｔ年度の要介護度について７個の目的変数１～７（５０１～５０７）を作成する。

次に、介護度推計モデル構築ステップ９０４では、介護度推計モデル構築部１１３が、二値化処理ステップ９０３で作成されたＴ年度の要介護度を二値化した７個の目的変数１～７について、Ｔ－ｎ年度の整形データ４００を説明変数としたロジスティック回帰分析を各目的変数別に７回実行し、７個のロジスティック回帰式から構成される介護度推計モデル６００（図６）を構築する。構築された介護度推計モデル６００は、介護度推計モデル記憶部１３４に格納される。

次に、介護度推計ステップ９０５では、介護度推計部１１４が、介護度推計モデル構築ステップ９０４で構築された介護度推計モデル６００に、データ整形ステップ９０２で作成されたＴ年度の整形データを入力し、将来（Ｔ＋ｎ年度）の要介護度別の確率を個人別に推計する。具体的には、図７で説明したように、まず、式１で表される介護度推計モデル６００にＴ年度の整形データを入力して、Ｔ＋ｎ年度の２値化された要介護度の確率Ｐｉ（Ｐ１～Ｐ７）を算出し、次に、Ｔ＋ｎ年度の２値化された要介護度の確率Ｐｉを式２に入力して、Ｔ＋ｎ年度の要介護度別の確率ＮＰｉ（ＮＰ０～ＮＰ７）を個人別に推計する。推計された将来の介護度推計結果７００は、推計結果記憶部１３５に格納される。

次に、人口動態補正ステップ９１１では、死亡推計部１２３が、ステップ９１０で構築されて死亡推計モデル記憶部１３９に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部１２４は、ステップ９１０で構築されて転出推計モデル記憶部１４０に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部１２５が、死亡推計部１２３及び転出推計部１２４が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。なお、死亡推計部１２３、転出推計部１２４及び人口動態補正部１２５は、人口動態補正切替欄８３０の設定にかかわらず介護度の推計結果の人口動態補正データを生成するが、人口動態補正切替欄８３０で「人口動態補正あり」が選択されている場合に、推計結果集計ステップ９０６の中で介護度の推計結果の人口動態補正データを生成してもよい。

ここで、死亡モデル・転出モデル構築ステップ９１０について説明する。死亡モデル・転出モデル構築ステップ９１０では、死亡推計モデル構築部１２１が、モデル構築用データの各項目を説明変数、死亡３０６を目的変数として用いたロジスティック回帰分析によって、住民の生死を個人別に推定するための死亡推計モデルを構築する。また、転出推計モデル構築部１２２が、転出３０７を目的変数とし、作成されたモデル構築用データの各項目を複数の説明変数として用いたロジスティック回帰分析によって、当該自治体から住民が転出するかを個人別に推定するための転出推計モデルを構築する。

次に、推計結果集計ステップ９０６では、推計結果集計部１１５が、まず、介護度推計結果表示画面８００（図８）を出力部１０３に表示し、集計条件（Ｔ年度の性別、年齢、住所など）の入力部１０２への入力をユーザに促す。次に、入力された集計条件に基づいて、介護度推計ステップ９０５で推計された個人別の介護度推計結果を集計して、介護度別の将来推計人数を出力部１０３に表示する。図８に例示する介護度推計結果表示画面８００では、Ｔ年度の男性かつ年齢６０歳以上の住民を対象に、Ｔ年度（現在）の要介護２以上の人数及びＴ＋ｎ年度（将来）の要介護２以上の将来推計人数を住所別（地区別）に表示している。ユーザは、この情報に基づいて地区別に診断を行い、介護予防施策をどの地区に重点的に配分するかなどの意思決定を行う。

以上により、介護度推計処理を終了する。

図１０は、実施例１の死亡モデル・転出モデル構築ステップ９１０から人口動態補正ステップ９１１を示す概念図である。

死亡推計モデル構築部１２１は、整形データ４００の各項目を説明変数とし、死亡３０６を目的変数として用いたロジスティック回帰分析によって死亡推計モデルを構築して、死亡推計モデル記憶部１３９に格納する。転出推計モデル構築部１２２は、整形データ４００の各項目を説明変数とし、転出３０７を目的変数として用いたロジスティック回帰分析によって転出推計モデルを構築して、転出推計モデル記憶部１４０に格納する。

その後、死亡推計部１２３は、構築された死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定して、住民毎の死亡率を計算する。転出推計部１２４は、構築された転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定して、住民毎の転出率を計算する。

さらに、介護度推計モデル構築部１１３は、整形データ４００を二値化した要介護度における７個の目的変数１～７について、Ｔ－ｎ年度の整形データ４００を説明変数としたロジスティック回帰分析によって、介護度別の介護度推計モデルを構築して、介護度推計モデル記憶部１３４に格納する。

介護度推計部１１４は、介護度推計モデル記憶部１３４に格納された介護度推計モデルを用いて、Ｔ＋ｎ年度の要介護度別の確率を個人別に推計して、介護度推計結果７００を推計結果記憶部１３５に格納する。

最後に、推計結果集計部１１５は、集計条件（Ｔ年度の性別、年齢、住所など）に基づいて、介護度推計部１１４で推計された個人別の介護度推計結果を集計して（例えば、要介護度別の確率を合計して）、任意の集団単位で介護度別の将来推計人数を出力して、推計結果記憶部１３５に格納する。

人口動態補正が必要である場合、人口動態補正部１２５は、死亡推計部１２３及び転出推計部１２４が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。例えば、要介護度別の確率の合計値から、死亡率Ｄａと転出率Ｔａの和に介護度推計結果（確率Ｎｐａ０）を乗じた値を全員について減じることによって、人口動態補正後の介護度推計結果を算出できる。個人別の場合は、要介護度別の確率（Ｎｐａ０～Ｎｐａ７）から、死亡率Ｄａと転出率Ｔａの和に要介護度別の確率（Ｎｐａ０～Ｎｐａ７）を乗じた値を減じればよい。

以上に説明したように、実施例１の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データから、将来の介護度を地区単位や個人単位などミクロな単位で推計できる。また、住民の死亡や転出による人口動態補正を行って介護度を補正するので、より正確に介護度を推計できる。このため、将来の介護度推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策立案が可能になる。

＜実施例２＞
実施例２では、実施例１で用いた介護データ及び住民データだけでなく、医療データ及び健診データも加えて、将来の介護度を個人単位に推計する将来推計システムの例を説明する。なお、実施例１で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。また、実施例２では、医療データ及び健診データの両方を用いて将来の介護度を推計する将来推計システムを説明するが、医療データ及び健診データの一方を用いてもよい。

図１１は、本実施例の将来推計システムの構成を示すブロック図である。実施例２の将来推計システムでは、実施例１の将来推計システム（図１）に、医療データ記憶部１３６及び健診データ記憶部１３７が追加される。

医療データ記憶部１３６は、入力部１０２に入力された複数人分、複数年度分のアルツハイマー病、パーキンソン病、脊椎障害、関節症などの疾病別の医療機関受診有無及び疾病別の医療費などの医療データを格納する。

健診データ記憶部１３７は、入力部１０２に入力された複数人分かつ複数年度分の健康診断の対象者及び健康診断の受診有無などの健診データを格納する。

図１２は、医療データ記憶部１３６が格納する医療データ１１００の例を示す図である。

医療データ１１００は、複数の住民の複数年分の医療データを管理する。医療データ１１００は、個人ＩＤ２０１、年度２０２、アルツハイマー病、パーキンソン病、脊椎障害、関節症、骨折、てんかん、脳内出血などの疾病別の医療機関受診有無１１１１～１１１７及び疾病別の医療費１１２１～１１２７を含む。年度２０２は、医療機関を受診した年度（年月でもよい）を示す情報を記録する。疾病別の医療機関受診有無１１１１～１１１７は、個人ＩＤ２０１の各年度の疾病別の受診有無を、１（有）、０（無）として記録する。疾病別医療費１１２１～１１２７は、個人ＩＤ２０１の各年度の疾病別医療費を記録する。

図１３は、健診データ記憶部１３７が格納する健診データ１２００の例を示す図である。

健診データ１２００は、複数の住民の複数年分の健康診断のデータを管理する。健診データ１２００は、個人ＩＤ２０１、年度２０２、健診対象者フラグ１２０３及び健診受診有無１２０４を含む。年度２０２は、健康診断を受診した年度（年月でもよい）を示す情報が登録される。健診対象者フラグ１２０３は、個人ＩＤ２０１の住民が健康診断の対象者か否かを、１（対象）、０（対象外）として年度別に記録する。健診受診有無１２０４は、個人ＩＤ２０１の住民が健康診断を受診したか否かを、１（健康診断受診有）、０（健康診断受診無）として年度別に記録する。また、健診データ１２００は、健康診断の結果（検査値、問診結果）を記録してもよい。

図１４は、データ整形部１１１が作成し、整形データ記憶部１３３が格納する整形データ１３００の例を示す図である。

整形データ１３００は、図４の整形データ４００（介護データ、住民データ）に、医療データ１１００及び健診データ１２００を連結したデータである。すなわち、整形データ１３００は、住民データ３００、介護データ２００、医療データ１１００及び健診データ１２００から、複数人分の２年度分（Ｔ－ｎ年度、Ｔ年度）のデータを抽出し、個人ＩＤ２０１と年度２０２で連結した上で、個人を行に、年度を列に展開したデータである。個人ＩＤ２０１の住民におけるＴ－ｎ年度の住民・介護・医療・健診データ１３０１とＴ年度の住民・介護・医療・健診データ１３０２を示している。このｎ年間隔があいた２時点の整形データ１３００を作成することによって、現在（Ｔ年度）の住民・介護・医療・健診データから将来（Ｔ＋ｎ年度）の介護度を推計できる。

図１５は、介護度推計モデル構築部１１３が、図１４に示す整形データ１３００（住民・介護・医療・健診データ）を用いて構築し、介護度推計モデル記憶部１３４が格納する介護度推計モデル１４００の例を示す図である。実施例２の介護度推計モデル１４００は、実施例１の介護度推計モデル６００（図６）の説明変数に、疾病別医療機関受診有無、疾病別医療費などの医療説明変数１４０１と、健診受診有無の健診説明変数１４０２が追加されている。

介護度推計モデル１４００は、実施例１で説明したように、まず、二値化処理部１１２が、図１４の整形データ１３００のＴ年度の要介護度を二値化して目的変数１～７を作成し、その後、介護度推計モデル構築部１１３がＴ－ｎ年度の整形データ１３０１（住民・介護・医療・健診データ）を説明変数としたロジスティック回帰分析を目的変数別に実行して構築される。実施例２の介護度推計モデル１４００は、二値化したＴ年度の要介護度である目的変数１～７（５０１～５０７）別に、Ｔ－ｎ年度の説明変数６０１の回帰係数（６１１～６１７）及びＺ値（６２１～６２７）を記憶しており、医療データ１１００及び健診データ１２００の追加により、疾病別医療機関受診有無及び疾病別医療費などの医療説明変数１４０１（Ｘ２０、Ｘ２１…）と、健診受診有無の健診説明変数１４０２（Ｘ３０）とが介護度推計モデル１４００に追加される。これにより、現在の住民データ及び介護データだけでなく、医療データ及び健診データを考慮して、将来（Ｔ＋ｎ年度）の介護度を個人単位に推計できる。

次に、図９のフローチャートを用いて、本実施例の介護度推計処理を説明する。

図９の処理を開始すると、まず、データ入力ステップ９０１を実行する。データ入力ステップ９０１では、将来推計端末１０１の入力部１０２が、介護データ２００（図２）、住民データ３００（図３）、医療データ１１００（図１２）及び健診データ１２００（図１３）の入力を受ける。入力された介護データ２００は介護データ記憶部１３１に格納され、入力された住民データ３００は住民データ記憶部１３２に格納され、入力された医療データ１１００は、医療データ記憶部１３６に格納され、入力された健診データ１２００は、健診データ記憶部１３７に格納される。

次に、データ整形ステップ９０２では、データ整形部１１１が、データ入力ステップ９０１で入力された介護データ２００（図２）、住民データ３００（図３）、医療データ１１００（図１２）及び健診データ１２００（図１３）から、複数の住民の２年度分（Ｔ－ｎ年度、Ｔ年度）のデータを抽出し、個人ＩＤ２０１及び年度２０２で連結した上で、個人を行に、年度を列に展開した整形データ１３００（図１４）を作成する。医療・健診データも含んで作成された整形データ１３００は、整形データ記憶部１３３に格納される。

次に、実施例１と同様に、二値化処理ステップ９０３と介護度推計モデル構築ステップ９０４を実行する。

二値化処理ステップ９０３では、二値化処理部１１２が、医療データ及び健診データを含む整形データ１３００（図１４）から、Ｔ年度の要介護度について７個の目的変数１～７（５０１～５０７）を作成する。

次に、介護度推計モデル構築ステップ９０４では、介護度推計モデル構築部１１３が、二値化処理ステップ９０３で作成されたＴ年度の要介護度を二値化した７個の目的変数１～７について、Ｔ－ｎ年度の医療データ及び健診データを含む整形データ１３００を説明変数としたロジスティック回帰分析を各目的変数別に７回実行し、７個のロジスティック回帰式から構成される介護度推計モデル１４００（図１５）を構築する。構築された介護度推計モデル１４００は、介護度推計モデル記憶部１３４に格納される。

次に、実施例１と同様に、介護度推計ステップ９０５、人口動態補正ステップ９１１及び推計結果集計ステップ９０６を実行する。

介護度推計ステップ９０５では、介護度推計部１１４が、介護度推計モデル構築ステップ９０４で構築された介護度推計モデル１４００（図１５）に、Ｔ年度の医療データ及び健診データを含む整形データ１３００を入力して、将来（Ｔ＋ｎ年度）の要介護度別の確率を個人別に推計し、介護度推計結果７００を作成する。作成された将来の介護度推計結果７００は、推計結果記憶部１３５に格納される。

人口動態補正ステップ９１１では、死亡推計部１２３が、ステップ９１０で構築されて死亡推計モデル記憶部１３９に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部１２４は、ステップ９１０で構築されて転出推計モデル記憶部１４０に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部１２５が、死亡推計部１２３及び転出推計部１２４が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。

推計結果集計ステップ９０６では、推計結果集計部１１５が、ユーザが入力した集計条件に基づいて、介護度推計結果を集計して、介護度別の将来推計人数を、図８に例示する介護度推計結果表示画面８００で出力部１０３に表示する。ユーザは、この情報に基づいて地区別に診断を行い、介護予防施策をどの地区に重点的に配分するかなどの意思決定を行う。

以上により、本実施例の介護度推計処理を終了する。

以上に説明したように、実施例２の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データに加えて、医療データ及び健診データも考慮して将来の介護度を推計するので、個人単位や地区単位の将来の介護度をより高精度に推計できる。実際のデータで介護度推計精度を検証すると、１年後の個人の介護度を９５％以上の正解率で高精度に推計できることが分かった。また、住民の死亡や転出による人口動態補正を行って介護度を補正するので、より正確に介護度を推計できる。また、将来の介護度推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策立案が可能になる。

＜実施例３＞
実施例３では、実施例１で推計した将来の介護度だけでなく、住民データ及び介護データから将来の介護費を個人単位に推計する将来推計システムの例を説明する。なお、実施例１、２で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。

図１６は、本実施例の将来推計システムの構成を示すブロック図である。実施例３の将来推計システムでは、実施例１の将来推計システム（図１）に、介護費推計モデル構築部１１６、介護費推計部１１７及び介護費推計モデル記憶部１３８が追加される。

介護費推計モデル構築部１１６は、データ整形部１１１で作成された整形データ４００（図４）から、Ｔ年度の要介護度及び介護費を取得し、Ｔ年度の介護費を目的変数とし、Ｔ年度の要介護度を説明変数とした線形回帰分析を行い、Ｔ年度の要介護度からＴ年度の介護費を推計する線形回帰式である介護費推計モデル１６００（図１７）を構築する。なお、将来推計システムの外部から介護費推計モデルが提供される場合、将来推計端末１０１は介護費推計モデル構築部１１６を有さなくてもよい。

介護費推計部１１７は、介護費推計モデル構築部１１６で構築された介護費推計モデル１６００に、介護度推計部１１４で推計された図７が示すＴ＋ｎ年度の要介護度別の確率ＮＰ（７０１）を入力し、Ｔ＋ｎ年度の介護費を個人別に推計する（図１８）。推計された介護費推計結果は、介護度推計結果と共に、推計結果記憶部１３５に格納される。

介護費推計モデル記憶部１３８は、介護費推計モデル構築部１１６が構築した介護費推計モデルを格納する。

図１７は、介護費推計モデル構築部１１６が構築し、介護費推計モデル記憶部１３８が格納する介護費推計モデル１６００の例を示す図である。

介護費推計モデル１６００は、介護費推計モデル構築部１１６が構築した線形回帰式であり、Ｔ年度の介護費を目的変数１６０４とし、Ｔ年度の要介護度を説明変数１６０３とした線形回帰分析により算出した回帰係数を記録する。要介護度をＸＣｉ（ｉ＝１～７、要支援１の有無ＸＣ１、要支援２の有無ＸＣ２、要介護１の有無ＸＣ３、要介護２の有無ＸＣ４、要介護３の有無ＸＣ５、要介護４の有無ＸＣ６、要介護５の有無ＸＣ７）、回帰係数をｃｉ（ｉ＝１～７）、介護費をＮＣＥとすると、介護費推計モデル１６００は式３で表される。Ｔ＋ｎ年度の要介護度別の確率ＮＰｉ（ｉ＝１～７）を、式３のＸＣｉ（ｉ＝１～７）に、それぞれ入力することによって、将来（Ｔ＋ｎ年度）の介護費ＮＣＥ１７０１を個人別に推計できる。このように、介護度の推計結果を用いて介護費を推計することによって、介護度と介護費が連動した将来推計が可能となり、自治体の介護施策立案に活用しやすい推計結果を作成できる。

NCE＝c1×XC1＋・・・＋c7×XC7 (式３)

図１８は、介護度推計部１１４及び介護費推計部１１７が推計した介護度・介護費推計結果１７００の例を示す図である。介護度・介護費推計結果１７００は、Ｔ年度の整形データ４０２と、Ｔ年度の整形データ４０２を介護度推計モデル６００に入力して推計したＴ＋ｎ年度の要介護度別の確率ＮＰ７０１と、Ｔ＋ｎ年度の要介護度別の確率ＮＰ７０１を介護費推計モデル１６００に入力して推計したＴ＋ｎ年度の介護費ＮＣＥ１７０１とを含む。

図１９は、推計結果集計部１１５が、出力部１０３に出力する介護度・介護費推計結果表示画面１８００の例を示す図である。介護度・介護費推計結果表示画面１８００は、実施例１の介護度推計結果表示画面８００（図８）に、介護費推計結果表示欄１８２０を追加したものであり、集計条件入力欄８１０、介護度別推計人数表示欄８２０、人口動態補正切替欄８３０及び介護費推計結果表示欄１８２０を含む。

介護度別推計人数表示欄８２０は、実施例１の介護度推計結果表示画面８００（図８）と同様に、集計条件入力欄８１０に入力された条件に合致する介護度・介護費推計結果１７００を抽出して、Ｔ年度の介護度別人数（８２１～８２４）及びＴ＋ｎ年度の介護度別推計人数（８３１～８３４）を住所別（地区別）に表示する。図示する例では、要介護２以上を表示している。

人口動態補正切替欄８３０は、図２０のステップ９１１に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄８３０の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。

介護費推計結果表示欄１８２０は、集計条件入力欄８１０に入力された条件に合致する介護度・介護費推計結果１７００を抽出して、Ｔ年度の介護費推計結果（１８２１～１８２４）及びＴ＋ｎ年度の介護費推計結果（１８３１～１８３４）を住所別（地区別）に表示する。住所別（地区別）のＴ＋ｎ年度の介護費推計結果は、介護度・介護費推計結果１７００を用いて、住所別（地区別）に、介護費ＮＣＥ（１７０１）を集計して算出する。図１８に示す介護度・介護費推計結果１７００の例では、Ａ区に住んでいる住民は、個人ＩＤがＫ０００１とＫ０００３であるので、Ａ区の介護費推計結果はＮＣＥ１＋ＮＣＥ３で算出される。これにより、地区単位など任意の条件で将来の介護費を推計でき、人数だけでなく費用面も考慮した地区診断を行うことができる。例えば、図１９に示すように、将来（Ｔ＋ｎ年度）の介護費が、Ａ区がＢ区より増加し、Ｃ区がＤ区より増加することが推計されたならば、Ａ区及びＣ区に対して重点的に介護予防施策を適用するなどの効果的な施策立案が可能になる。

次に、図２０のフローチャートを用いて本実施例の介護度・介護費推計処理を説明する。

図２０の処理を開始すると、データ入力ステップ９０１、データ整形ステップ９０２、二値化処理ステップ９０３、介護度推計モデル構築ステップ９０４、介護度推計ステップ９０５を実行する。これらのステップは、図９で説明した将来の介護度を推計するステップ９０１～９０５と同じ処理である。

次に、介護費推計モデル構築ステップ９０７では、介護費推計モデル構築部１１６が、データ整形ステップ９０２で作成されたＴ年度の整形データを用いて、Ｔ年度の介護費を目的変数、Ｔ年度の要介護度を説明変数とした線形回帰分析を行い、要介護度から介護費を推計するための介護費推計モデル１６００を構築する。構築された介護費推計モデル１６００は、介護費推計モデル記憶部１３８に格納される。

次に、介護費推計ステップ９０８では、介護費推計部１１７が、介護費推計モデル構築ステップ９０７で構築された介護費推計モデル１６００に、介護度推計ステップ９０５で推計されたＴ＋ｎ年度の要介護度別の確率ＮＰｉを入力して、Ｔ＋ｎ年度の介護費を個人別に推計する。推計された将来の介護費推計結果は、介護度推計結果と共に、推計結果記憶部１３５に格納される。

次に、人口動態補正ステップ９１１では、死亡推計部１２３が、ステップ９１０で構築されて死亡推計モデル記憶部１３９に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部１２４は、ステップ９１０で構築されて転出推計モデル記憶部１４０に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部１２５が、死亡推計部１２３及び転出推計部１２４が推定した当該年度の推定結果を用いて、介護度及び介護費の推計結果を補正する。なお、死亡推計部１２３、転出推計部１２４及び人口動態補正部１２５は、人口動態補正切替欄８３０の設定にかかわらず介護度及び介護費の推計結果の人口動態補正データを生成するが、人口動態補正切替欄８３０で「人口動態補正あり」が選択されている場合に、推計結果集計ステップ９０６の中で介護度の推計結果の人口動態補正データを生成してもよい。

死亡モデル・転出モデル構築ステップ９１０については、前述した実施例１と同じである。

次に、推計結果集計ステップ９０６では、推計結果集計部１１５が、まず、介護度・介護費推計結果表示画面１８００（図１９）を出力部１０３に表示し、集計条件（Ｔ年度の性別、年齢、住所など）の入力部１０２への入力をユーザに促す。次に、入力された集計条件に基づいて、介護度推計ステップ９０５及び介護費推計ステップ９０８で推計された個人別の介護度・介護費推計結果を集計して、介護度別の将来推計人数と将来の介護費を出力部１０３に表示する。図１９に例示する介護度・介護費推計結果表示画面１８００では、Ｔ年度の男性かつ年齢６０歳以上の住民を対象に、Ｔ年度（現在）の要介護２以上の人数及び介護費と、Ｔ＋ｎ年度（将来）の要介護２以上の将来推計人数及び介護費推計結果を住所別（地区別）に表示している。ユーザは、この情報に基づいて地区別に診断を行い、介護予防施策をどの地区に重点的に配分するかなどの意思決定を行う。

以上により、介護度・介護費推計処理を終了する。

図２１は、実施例３の死亡モデル・転出モデル構築ステップ９１０から人口動態補正ステップ９１１を示す概念図である。

死亡推計モデル構築部１２１は、整形データ４００の各項目を説明変数とし、死亡３０６を目的変数して用いたロジスティック回帰分析によって死亡推計モデルを構築して、死亡推計モデル記憶部１３９に格納する。転出推計モデル構築部１２２は、整形データ４００の各項目を説明変数とし、転出３０７を目的変数として用いたロジスティック回帰分析によって転出推計モデルを構築して、転出推計モデル記憶部１４０に格納する。

さらに、介護度推計モデル構築部１１３は、整形データ４００を二値化した要介護度における７個の目的変数１～７について、Ｔ－ｎ年度の整形データ４００を説明変数としたロジスティック回帰分析によって、介護度別の介護度推計モデルを構築して、介護度推計モデル記憶部１３４に格納する。また、介護費推計モデル構築部１１６は、整形データ４００から、Ｔ年度の要介護度及び介護費を取得し、Ｔ年度の介護費を目的変数とし、Ｔ年度の要介護度を説明変数とした線形回帰分析を行い、Ｔ年度の要介護度からＴ年度の介護費を推計する線形回帰式である介護費推計モデルを構築して、介護費推計モデル記憶部１３８に格納する。

介護度推計部１１４は、介護度推計モデル記憶部１３４に格納された介護度推計モデルを用いて、Ｔ＋ｎ年度の要介護度別の確率を個人別に推計する。介護費推計部１１７は、介護費推計モデル記憶部１３８に格納された介護費推計モデルを用いて、Ｔ＋ｎ年度の介護費を個人別に推計する。介護度・介護費推計結果２２００は推計結果記憶部１３５に格納される。

最後に、推計結果集計部１１５は、集計条件（Ｔ年度の性別、年齢、住所など）に基づいて、介護度推計部１１４で推計された個人別の介護度推計結果を集計して（例えば、要介護度別の確率を合計して）、任意の集団単位で介護度別の将来推計人数を出力して、推計結果記憶部１３５に格納する。また、推計結果集計部１１５は、集計条件に基づいて、介護費推計部１１７で推計された個人別の介護費推計結果を集計して（例えば、各人の介護費の推計結果を合計して）、任意の集団単位の介護費を出力して、推計結果記憶部１３５に格納する。

人口動態補正が必要である場合、人口動態補正部１２５は、死亡推計部１２３及び転出推計部１２４が推定した当該年度の推定結果を用いて、介護度の推計結果を補正する。例えば、要介護度別の確率の合計値から、死亡率Ｄａと転出率Ｔａの和に介護度推計結果（確率Ｎｐａ０）を乗じた値を全員について減じることによって、人口動態補正後の介護度推計結果を算出できる。介護費については、介護費の合計値から、死亡率Ｄａと転出率Ｔａの和に介護費推計結果Ｎｃａを乗じた値を全員について減じることによって、人口動態補正後の介護費推計結果を算出できる。個人別の場合は、介護費Ｎｃａから、死亡率Ｄａと転出率Ｔａの和に介護費Ｎｃａを乗じた値を減じればよい。

以上に説明したように、実施例３の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データから、将来の介護度及び将来の介護費を地区単位や個人単位などミクロな単位で推計できる。また、住民の死亡や転出による人口動態補正を行って介護度及び介護費を補正するので、より正確に介護度や介護費を推計できる。このため、将来の介護度・介護費推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策を立案が可能になる。また、実施例３の将来推計システムは、介護度の推計結果から介護費を推計するため、介護度と介護費とが連動した将来推計ができ、自治体の介護施策立案に活用しやすい推計結果を出力できる。

＜実施例４＞
実施例４では、実施例３で用いた介護データ及び住民データだけでなく、医療データ及び健診データも加えて、将来の介護度及び介護費を個人単位に推計する将来推計システムの例を説明する。なお、実施例１～３で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。また、実施例４では、医療データ及び健診データの両方を用いて将来の介護度及び介護費を推計する将来推計システムを説明するが、医療データ及び健診データの一方を用いてもよい。

図２２は、本実施例の将来推計システムの構成を示すブロック図である。実施例４の将来推計システムでは、実施例３の将来推計システム（図１６）に、実施例２で説明した医療データ記憶部１３６及び健診データ記憶部１３７が追加される。

実施例２で説明したように、将来推計システムは、データ整形部１１１、二値化処理部１１２、介護度推計モデル構築部１１３及び介護度推計部１１４によって、図１４に示すＴ年度の整形データ（住民・介護・医療・健診データを連結したデータ）からＴ＋ｎ年度の要介護度別の確率を個人別に推計し、将来の介護度推計結果を作成する。

また、実施例３で説明したように、将来推計システムは、介護費推計モデル構築部１１６と介護費推計部１１７により、Ｔ＋ｎ年度の要介護度別の確率から、Ｔ＋ｎ年度の介護費を個人別に推計し、将来の介護費推計結果を作成する。

推計結果集計部１１５は、入力部１０２に入力されたユーザの集計条件（Ｔ年度の性別、年齢、住所など）に基づいて、個人別の介護度推計結果及び介護費推計結果を集計して、地区別など任意の集団単位で、将来の介護度別推計人数と将来介護費を出力部１０３に表示する。

以上に説明したように、実施例４の将来推計システムでは、自治体等の機関に蓄積された介護データ及び住民データに加えて、医療データ及び健診データも考慮して、将来の介護度及び介護費を推計するので、個人単位や地区単位の将来の介護度及び将来の介護費をより高精度に推計できる。実際のデータで推計精度を検証すると、１年後の介護度を９５％以上の正解率、１年後の介護費を推計誤差１％以下で高精度に推計できることが分かった。また、住民の死亡や転出による人口動態補正を行って介護度及び介護費を補正するので、より正確に介護度や介護費を推計できる。また、将来の介護度・介護費推計結果は、自治体の地区診断に活用でき、介護予防施策の重点配分など効果的な施策を立案できる。また、実施例４の将来推計システムでは、介護度の推計結果から介護費を推計するため、介護度と介護費とが連動した将来推計ができ、自治体の介護施策立案に活用しやすい推計結果を出力できる。

＜実施例５＞
実施例５では、介護度推計モデルから、将来の介護発生又は介護進行を抑制する施策となる説明変数を抽出し、その施策の効果を推計する将来推計システムの例を説明する。なお、実施例１～４で前述した構成及び処理には同じ符号を付し、それらの説明は省略する。

図２３は、本実施例の将来推計システムの構成を示すブロック図である。実施例５の将来推計システムは、介護度推計部１１４、介護費推計部１１７に加え、説明変数抽出部１１８、入力値変更部１１９及び施策効果推計部１１０を有する。また、データベース１３０は、前述した整形データ記憶部１３３、介護度推計モデル記憶部１３４、推計結果記憶部１３５及び介護費推計モデル記憶部１３８から構成される。なお、実施例５の将来推計システムは、既に介護度推計モデル６００、１４００（図６又は図１５）及び介護費推計モデル１６００（図１７）があることを想定しているので、介護度推計モデル構築部１１３及び介護費推計モデル構築部１１６を有さないが、前述した実施例のように、介護度推計モデル構築部１１３及び介護費推計モデル構築部１１６が、整形データ４００、１３００（図４又は図１４）から介護度推計モデルや介護費推計モデルを構築してもよい。また、データ整形部１１１、二値化処理部１１２及び推計結果集計部１１５を有してもよい。

説明変数抽出部１１８は、入力部１０２でユーザが選択した目的変数（対策が必要な介護度）を対象として、介護度推計モデル６００、１４００（図６又は図１５）から、Ｚ値が負の説明変数を値が小さい順に抽出する。

入力値変更部１１９は、整形データ記憶部１３３が管理するＴ年度の整形データ４００、１３００（図４又は図１４）を取得し、説明変数抽出部１１８が抽出した説明変数別に、その変数と一致するデータ項目の入力値を変更する。具体的には、その説明変数と一致するデータ項目の入力値を全て有（１）に変更した場合（図２４、図２９）と、全て無（０）に変更した場合（図２５、図３０）の二つの整形データを作成する。

介護度推計部１１４は、入力値変更部１１９で入力値が変更された二つの整形データを、それぞれ、介護度推計モデルに入力し、Ｔ＋ｎ年度の要介護度別の確率を推計する。ここで、Ｔ＋ｎ年度の要介護度別の確率は、入力値を全て有（１）にした場合と、全て無（０）にした場合について推計される。

介護費推計部１１７は、介護度推計部１１４で推計されたＴ＋ｎ年度の要介護度別の確率を、介護費推計モデルに入力し、Ｔ＋ｎ年度の介護費を個人別に推計する。ここで、Ｔ＋ｎ年度の介護費は、入力値を全て有（１）にした場合と、全て無（０）にした場合について推計される。

施策効果推計部１１０は、入力値を全て有（１）にした場合の介護度・介護費推計結果（図２４、図２９）と、全て無（０）にした場合の介護度・介護費推計結果（図２５、図３０）の差分を施策効果として推計する。

図２４は、介護サービスである通所介護の実施率を１００％（入力値を全て有（１）に変更）にした場合の介護度・介護費推計結果２２００の例を示す図である。介護度・介護費推計結果２２００は、領域２２０１に示すように、通所介護の入力値を全て有（１）に変更したＴ年度の整形データ４０２と、介護度推計モデルに入力して推計したＴ＋ｎ年度の要介護度別の確率ｆＮＰ２２０２を介護費推計モデルに入力して推計したＴ＋ｎ年度の介護費ｆＮＣＥ２２０３を格納する。ここで、介護サービスに関するデータは有無データ及び回数データがあるので、有無データの入力値を全て有（１）に変更し、回数データの入力値を全て平均回数に変更する（２２０１）。

図２５は、介護サービスである通所介護の実施率を０％（入力値を全て無（０）に変更）にした場合の介護度・介護費推計結果２３００の例を示す図である。介護度・介護費推計結果２３００は、領域２３０１に示すように、通所介護の入力値を全て無（０）に変更したＴ年度の整形データ４０２と、介護度推計モデルに入力して推計したＴ＋ｎ年度の要介護度別の確率ｅＮＰ２３０２を介護費推計モデルに入力して推計したＴ＋ｎ年度の介護費ｅＮＣＥ２３０３を格納する。ここで、介護サービスに関するデータは有無データ及び回数データがあるので、有無データを全て無（０）に変更し、回数データも全て０回に変更する（２３０１）。

図２６は、施策効果推計部１１０が、出力部１０３に出力する介護施策効果シミュレーション画面２４００の例を示す図である。

介護施策効果シミュレーション画面２４００は、対策介護度選択欄２４１０、人口動態補正切替欄８３０、介護施策選択タブ表示欄２４２０、施策効果推計対象者の選定欄２４３０、施策効果推計結果表示欄２４４０及び集計条件入力欄８１０を含む。

対策介護度選択欄２４１０は、入力部１０２で対策が必要な介護度（目的変数）をユーザに選択させる欄である。図示する例では、対策が必要な介護度（目的変数）として、ユーザが「要介護２以上」が選択されている。

人口動態補正切替欄８３０は、図２８のステップ９１１に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄８３０の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。

介護施策選択タブ表示欄２４２０は、対策介護度選択欄２４１０で選択された介護度（目的変数）の抑制に寄与が大きい説明変数を選択タブで表示する。具体的には、説明変数抽出部１１８が、対策介護度選択欄２４１０で選択された目的変数を対象に、介護度推計モデル（図６又は図１５）から、Ｚ値が負の説明変数を値が小さい順に抽出して表示する。図示する例では、目的変数が「要介護２以上」で、「要介護２以上」の抑制に寄与が大きい説明変数が抽出されており、介護度推計モデルから、Ｚ値が負の説明変数を値が小さい順に抽出すると、通所介護２４２１、介護予防支援２４２２、介護保健施設２４２３である例を示す。ユーザは、この選択タブから介護施策を選択する。図示する例では、介護サービスの通所介護２４２１が選択されている。

施策効果推計対象者の選定欄２４３０は、施策実施率表示欄２４３１及び個人別の介護度・介護費抑制効果表示欄２４３５を含む。

施策実施率表示欄２４３１は、介護施策選択タブ表示欄２４２０で選択された介護施策の実施率及び実施人数を示し、デフォルトで表示される初期値は、現在（Ｔ年度）の実施率及び実施人数である。図示する例では、通所介護のＴ年度の実施率が３０％で、実施人数が２千人である。

個人別の介護度・介護費抑制効果表示欄２４３５は、施策効果推計対象者選択欄２４３２、個人ＩＤ２０１、Ｔ年度の整形データ４０２、Ｔ＋ｎ年度の介護度・介護費推計結果２２００、２３００及びＴ＋ｎ年度の介護費抑制額（ｆＮＣＥ－ｅＮＣＥ）２４３３を個人別に表示する。介護度・介護費推計結果２２００は、図２４で説明した介護施策の実施率が１００％である場合のＴ＋ｎ年度の要介護度別の確率ｆＮＰ２２０２及び介護費ｆＮＣＥ２２０３である。介護度・介護費推計結果２３００は、図２５で説明した介護施策の実施率が０％である場合のＴ＋ｎ年度の要介護度別の確率ｅＮＰ２３０２及び介護費ｅＮＣＥ２３０３である。Ｔ＋ｎ年度の介護費抑制額は、介護施策の実施率が１００％である場合の介護費ｆＮＣＥから介護施策の実施率が０％である場合の介護費ｅＮＣＥを減じた値である。施策効果推計対象者選択欄２４３２は、介護施策を実施する対象者が選択される欄であり、デフォルトでは、現在（Ｔ年度）にその介護施策を実施された人が選択されている。この例では、個人ＩＤ２０１がＫ０００２の人が通所介護を実施する人として選択されている。また、個人別の介護度・介護費抑制効果表示欄２４３５では、個人別の介護度・介護費抑制効果をその効果が高い順に表示する。具体的には、Ｔ＋ｎ年度の介護費抑制額（ｆＮＣＥ－ｅＮＣＥ）２４３３が大きい順に表示するとよい。図示する例では、個人ＩＤがＫ０００３の人の介護費抑制額（ｆＮＣＥ３－ｅＮＣＥ３）が最大で、次がＫ０００２の人である。

ユーザは、個人別の介護度・介護費抑制効果表示欄２４３５や後述する施策効果推計結果表示欄２４４０を参照して、施策効果推計対象者選択欄２４３２で、介護施策を実施する対象者を個別に選択し、変更する。また、施策実施率表示欄２４３１の実施率や実施人数を変更しても、介護施策を実施する対象者を選択できる。施策実施率表示欄２４３１の実施率を変更した場合、介護費抑制額２４３３が大きい対象者から降順に選択される。

施策効果推計結果表示欄２４４０は、介護度別推計人数表示欄２４４１及び介護費推計結果表示欄２４５１を含む。

介護度別推計人数表示欄２４４１は、施策効果推計部１１０が、施策効果推計対象者の選定欄２４３０で選択された対象者全体について、Ｔ年度の要介護度及びＴ＋ｎ年度の要介護度別の確率ｆＮＰ２２０２とｅＮＰ２３０２を集計し、Ｔ年度の介護度別人数８２１、施策実施率表示欄２４３１に表示された実施率の場合のＴ＋ｎ年度の介護度別推計人数８３１及び実施率が０％の場合のＴ＋ｎ年度の介護度別推計人数２４４２を表示する。図示する例では要介護２以上の人数を表示している。さらに、実施率が０％の場合のＴ＋ｎ年度の介護度別推計人数２４４２と、施策実施率表示欄２４３１に表示された実施率の場合のＴ＋ｎ年度の介護度別推計人数８３１の差分を算出し、介護施策により抑制される介護人数２４４３を表示する。図示する例では、通所介護を実施率３０％で実施すると、介護人数２４４３が５００人抑制される。

介護費推計結果表示欄２４５１は、施策効果推計部１１０が、施策効果推計対象者の選定欄２４３０で選択された全ての対象者について、Ｔ年度の介護費とＴ＋ｎ年度の介護費ｆＮＣＥ２２０３及びｅＮＣＥ２３０３を集計し、Ｔ年度の介護費１８２１、施策実施率表示欄２４３１に表示された実施率の場合のＴ＋ｎ年度の介護費１８３１及び実施率が０％の場合のＴ＋ｎ年度の介護費２４５２を表示する。さらに、実施率が０％の場合のＴ＋ｎ年度の介護費２４５２と、施策実施率表示欄２４３１に表示された実施率の場合のＴ＋ｎ年度の介護費１８３１の差分を算出し、介護施策により抑制される介護費２４５３を表示する。図示する例では、通所介護を実施率３０％で実施すると、介護費２４５３が１０億円抑制される。

集計条件入力欄８１０は、個人別の介護度・介護費抑制効果表示欄２４３５に表示する対象者の条件を入力する欄である。図示する例では、Ｔ年度の年齢入力欄８１２及び住所入力欄８１３を設けているが、整形データ４００、１３００に含まれているＴ年度の任意のデータ項目を条件とする入力する欄を設けてもよい。図示する例では、年齢入力欄８１２に４０歳以上、住所入力欄８１３にＡ区及びＢ区が入力されている。

図２７は、施策効果推計部１１０が、出力部１０３に出力する介護施策効果シミュレーション画面２５００の例を示す図である。図２７では、図２６に示す介護施策効果シミュレーション画面２４００の介護施策の実施率を変更した例を示す。

介護施策効果シミュレーション画面２５００は、対策介護度選択欄２４１０、人口動態補正切替欄８３０、介護施策選択タブ表示欄２４２０、施策効果推計対象者の選定欄２４３０、施策効果推計結果表示欄２４４０及び集計条件入力欄８１０を含む。介護施策効果シミュレーション画面２５００の画面構成は、図２６に示す介護施策効果シミュレーション画面２４００と同じであるため、以下では違いを説明する。

施策実施率表示欄２５３１は、施策実施率表示欄２４３１と同様に、介護施策選択タブ表示欄２４２０で選択された介護施策の実施率及び実施人数を示す。図示する例では、通所介護のＴ年度の実施率を３０％から６０％に、実施人数が２千人から４千人に変更されている。

施策効果推計対象者選択欄２５３２は、施策効果推計対象者選択欄２４３２と同様に、介護施策を実施する対象者が選択される欄であり、施策実施率表示欄２５３１で変更した介護施策の実施人数に基づいて、介護施策を実施する対象者が選択される。対象者の選択は、前述したように、介護費抑制額２４３３が大きい対象者から降順に選択されるとよい。図示する例では、介護費抑制額２４３３が大きい４千人の対象者が選択されている。

施策効果推計結果表示欄２４４０は、介護度別推計人数表示欄２４４１及び介護費推計結果表示欄２４５１を含み、介護施策の実施率を変更した場合の介護度別推計人数と、介護費推計結果を表示する。

介護度別推計人数表示欄２４４１は、施策実施率表示欄２５３１で変更された実施率の場合のＴ＋ｎ年度の介護度別推計人数２５４４を表示する。図示する例では、通所介護の実施率を６０％に変更した場合の要介護２以上の推計人数を表示している。さらに、実施率が０％の場合のＴ＋ｎ年度の介護度別推計人数２４４２と、施策実施率表示欄２５３１に表示された実施率の場合のＴ＋ｎ年度の介護度別推計人数２５４４の差分を算出し、介護施策の実施率変更により抑制される介護人数２５４３を表示する。図示する例では、通所介護を実施率６０％で実施すると、介護人数２５４３が１０００人抑制され、図２６に示す実施率３０％の場合の５００人より増加している。

介護費推計結果表示欄２４５１は、施策実施率表示欄２５３１で変更された実施率の場合のＴ＋ｎ年度の介護費２５５４を表示する。図示する例では、通所介護の実施率を６０％に変更した場合の介護費を表示している。さらに、実施率が０％の場合のＴ＋ｎ年度の介護費２４５２と、施策実施率表示欄２５３１に表示された実施率の場合のＴ＋ｎ年度の介護費２５５４の差分を算出し、介護施策の実施率変更により抑制される介護費２５５３を表示している。図示する例では、通所介護を実施率６０％に変更すると、介護費２５５３が３０億円抑制され、図２６に示す実施率３０％の場合の１０億円より抑制額が増加している。

図２６及び図２７で説明したように、対策が必要な介護度（目的変数）をユーザが選択することで、その介護度（目的変数）の抑制に寄与する介護施策（説明変数）を抽出できる。また、抽出した介護施策（説明変数）の効果として、抑制される介護人数及び介護費を推計できる。さらに、介護施策（説明変数）の実施率を変更した場合の施策効果のシミュレーションも可能である。さらに、個人別の介護度・介護費抑制効果表示欄２４３５で、介護施策の効果が高い対象者を選定できるので、費用対効果が高い介護施策立案が可能となる。これにより、実施例５の将来推計システムは、自治体の効果的な介護施策立案を支援できる。

次に、図２８のフローチャートを用いて本実施例の施策効果推計処理を説明する。

図２８の処理を開始すると、まず、対策介護度入力ステップ２６０１を実行する。対策介護度入力ステップ２６０１では、まず、将来推計端末１０１が、図２６に示す介護施策効果シミュレーション画面２４００を出力部１０３に表示して、図２６で説明したように、対策介護度選択欄２４１０への、対策が必要な介護度（目的変数）のユーザからの入力を受ける。

次に、説明変数抽出ステップ２６０２では、説明変数抽出部１１８が、まず、介護度推計モデル記憶部１３４に格納される介護度推計モデル（図６又は図１５）を取得する。次に、説明変数抽出部１１８が、対策介護度選択欄２４１０で選択された目的変数を対象に、介護度推計モデルから、Ｚ値が負の説明変数を値が小さい順（目的変数への寄与が高い順）に抽出する。そして、図２６で説明したように、抽出した説明変数を、目的変数への寄与が高い順に、介護施策選択タブ表示欄２４２０に表示する。

次に、説明変数選択ステップ２６０３では、将来推計端末１０１が、介護施策選択タブ表示欄２４２０に表示された介護施策（説明変数）の中から、施策効果を推計する介護施策（説明変数）のユーザによる選択を受ける。

次に、入力値変更ステップ２６０４では、まず、入力値変更部１１９が、整形データ記憶部１３３が管理するＴ年度の整形データ（図４又は図１４）を取得する。次に、説明変数選択ステップ２６０３で選択された介護施策（説明変数）と一致する整形データ項目の入力値を変更する。具体的には、図２４及び図２５で説明したように、その説明変数と一致する整形データ項目の入力値を全て有（１）に変更した場合と、全て無（０）に変更した場合の二つの整形データを作成する。

次に、介護度推計ステップ９０５では、介護度推計部１１４が、入力値変更部１１９で入力値が変更された二つの整形データを、それぞれ、介護度推計モデル記憶部１３４が格納する介護度推計モデルに入力し、Ｔ＋ｎ年度の要介護度別の確率を推計する。図２４及び図２５で説明したように、Ｔ＋ｎ年度の要介護度別の確率は、入力値を全て有（１）にした場合の確率ｆＮＰ２２０２と、全て無（０）にした場合の確率ｅＮＰ２３０２とを推計する。推計されたＴ＋ｎ年度の要介護度別の確率は、図２６又は図２７の個人別の介護度・介護費抑制効果表示欄２４３５に表示される。

次に、介護費推計ステップ９０８では、介護費推計部１１７が、介護度推計部１１４で推計されたＴ＋ｎ年度の要介護度別の確率を、介護費推計モデル記憶部１３８が格納する介護費推計モデルに入力し、Ｔ＋ｎ年度の介護費を個人別に推計する。図２４及び図２５で説明したように、Ｔ＋ｎ年度の介護費は、入力値を全て有（１）にした場合の介護費ｆＮＣＥ２２０３と、全て無（０）にした場合の介護費ｅＮＣＥ２３０３とを推計する。推計されたＴ＋ｎ年度の介護費は、図２６又は図２７の個人別の介護度・介護費抑制効果表示欄２４３５に表示される。

次に、施策効果推計ステップ２６０５では、まず、施策効果推計部１１０が、介護費推計ステップ９０８で推計された介護施策（説明変数）の入力値を全て有（１）にした場合の介護費ｆＮＣＥ２２０３と、全て無（０）にした場合の介護費ｅＮＣＥ２３０３から、個人別の介護費抑制額２４３３を推計する。推計された介護費抑制額は、図２６又は図２７の個人別の介護度・介護費抑制効果表示欄２４３５に表示される。

次に、図２６及び図２７で説明したように、施策効果推計部１１０が、施策実施率表示欄（２４３１又は２５３１）や施策効果推計対象者選択欄（２４３２又は２５３２）で、施策効果を推計する対象者のユーザによる選択を受ける。そして、選択された施策効果推計対象者について、介護度及び介護費における抑制効果を推計する。

介護度における抑制効果については、Ｔ年度の要介護度及びＴ＋ｎ年度の要介護度別の確率ｆＮＰ２２０２及びｅＮＰ２３０２を集計し、Ｔ年度の介護度別人数８２１、施策実施率表示欄（２４３１又は２５３１）に表示された実施率の場合のＴ＋ｎ年度の介護度別推計人数（８３１又は２５４４）、実施率が０％の場合のＴ＋ｎ年度の介護度別推計人数２４４２を推計する。さらに、実施率が０％の場合のＴ＋ｎ年度の介護度別推計人数２４４２、及び施策実施率表示欄（２４３１又は２５３１）に表示された実施率の場合のＴ＋ｎ年度の介護度別推計人数（８３１又は２５４４）の差分を算出し、介護施策により抑制される介護人数（２４４３又は２５４３）を推計する。推計された介護度における抑制効果は、図２６又は図２７の介護度別推計人数表示欄２４４１に表示される。

介護費における抑制効果については、選択された施策効果推計対象者について、Ｔ年度の介護費及びＴ＋ｎ年度の介護費ｆＮＣＥ２２０３及びｅＮＣＥ２３０３を集計し、Ｔ年度の介護費１８２１、施策実施率表示欄（２４３１又は２５３１）に表示された実施率の場合のＴ＋ｎ年度の介護費（１８３１又は２５５４）、実施率が０％の場合のＴ＋ｎ年度の介護費２４５２を推計する。さらに、実施率が０％の場合のＴ＋ｎ年度の介護費２４５２と、施策実施率表示欄（２４３１又は２５３１）に表示された実施率の場合のＴ＋ｎ年度の介護費（１８３１又は２５５４）の差分を算出し、介護施策により抑制される介護費（２４５３又は２５５３）を推計する。推計された介護費における抑制効果は、図２６又は図２７の介護費推計結果表示欄２４５１に表示される。

施策効果推計部１１０は、介護施策の実施率別の施策効果を推計し、ユーザの費用対効果の高い介護施策の立案を支援する。

以上により、施策効果推計処理を終了する。

以上に説明したように、本実施例５の将来推計システムでは、対策が必要な介護度（目的変数）をユーザが選択することによって、選択された介護度（目的変数）の抑制に寄与する介護施策（説明変数）を抽出できる。また、抽出した介護施策（説明変数）の効果として、抑制される介護人数と介護費を推計できる。さらに、介護施策（説明変数）の実施率を変更した場合の施策効果をシミュレーションできる。さらに、個人別の介護度・介護費抑制効果表示欄２４３５では、介護施策の効果が高い対象者を選定できるので、費用対効果の高い介護施策を立案できる。これにより、本実施例５の将来推計システムは、自治体の効果的な介護施策立案を支援できる。

前述した例では、対策介護度を「要介護２以上」とし、介護施策を「介護サービス（通所介護）」とした例を説明したが、図２９、図３０、図３１及び図３２を用いて、対策介護度を「要支援１以上（介護発生）」とし、介護施策を「健診受診」とした例を説明する。健診受診は、介護の発生抑制に大きく寄与する説明変数であることを実データにより確認している。

図２９は、健診受診の実施率（健診受診率）を１００％（入力値を全て有（１）に変更）にした場合の介護度・介護費推計結果２７００の例を示す図である。介護度・介護費推計結果２７００は、健診受診有無２７０１の入力値を全て有（１）に変更したＴ年度の整形データ１３０２と、介護度推計モデルに入力して推計したＴ＋ｎ年度の要介護度別の確率ｃｆＮＰ２７０２と、Ｔ＋ｎ年度の要介護度別の確率ｃｆＮＰ２７０２を介護費推計モデルに入力して推計したＴ＋ｎ年度の介護費ｃｆＮＣＥ２７０３とを格納する。

図３０は、健診受診の実施率（健診受診率）を０％（入力値を全て無（０）に変更）にした場合の介護度・介護費推計結果２８００の例を示す図である。介護度・介護費推計結果２８００は、健診受診有無２８０１の入力値を全て無（０）に変更したＴ年度の整形データ１３０２と、介護度推計モデルに入力して推計したＴ＋ｎ年度の要介護度別の確率ｃｅＮＰ２８０２と、Ｔ＋ｎ年度の要介護度別の確率ｃｅＮＰ２８０２を介護費推計モデルに入力して推計したＴ＋ｎ年度の介護費ｃｅＮＣＥ２８０３を格納する。

図３１は、施策効果推計部１１０が、出力部１０３に出力する、健診受診についての介護施策効果シミュレーション画面２９００の例を示す図である。

介護施策効果シミュレーション画面２９００は、図２６及び図２７と同様に、対策介護度選択欄２４１０、人口動態補正切替欄８３０、介護施策選択タブ表示欄２４２０、施策効果推計対象者の選定欄２４３０、施策効果推計結果表示欄２４４０及び集計条件入力欄８１０を含む。

対策介護度選択欄２４１０は、入力部１０２で対策が必要な介護度（目的変数）をユーザに選択させる欄である。図示する例では、対策が必要な介護度（目的変数）として、ユーザが「要支援１以上」を選択した例を示している。

介護施策選択タブ表示欄２４２０は、対策介護度選択欄２４１０で選択された介護度（目的変数）の抑制に寄与が大きい説明変数を選択タブで表示する。具体的には、説明変数抽出部１１８が、対策介護度選択欄２４１０で選択された目的変数を対象に、介護度推計モデル（図６又は図１５）から、Ｚ値が負の説明変数を値が小さい順に抽出して表示する。図示する例では、目的変数が「要支援１以上」で、「要支援１以上」の抑制に寄与が大きい説明変数を抽出した例を示しており、介護度推計モデルから、Ｚ値が負の説明変数を値が小さい順に抽出すると、健診受診２９２１である例を示す。ユーザは、この選択タブから、介護施策を選択する。図示する例では、健診受診２９２１が選択されている。

施策効果推計対象者の選定欄２４３０は、施策実施率（健診受診率）表示欄２９３１及び個人別の介護度・介護費抑制効果表示欄２４３５を含む。

施策実施率表示欄２９３１は、介護施策選択タブ表示欄２４２０で選択された介護施策の実施率（健診受診率）及び実施人数を示し、デフォルトで表示される初期値は、現在（Ｔ年度）の実施率（健診受診率）及び実施人数である。図示する例では、Ｔ年度の健康診断の実施率（受診率）が２０％で、実施人数（受診者数）が１万人である。

個人別の介護度・介護費抑制効果表示欄２４３５は、施策効果推計対象者選択欄２９３２、個人ＩＤ２０１、Ｔ年度の整形データ１３０２、図２９で説明した健診受診率が１００％である場合のＴ＋ｎ年度の介護度・介護費推計結果２７００（要介護度別の確率ｃｆＮＰ２７０２と介護費ｃｆＮＣＥ２７０３）、図３０で説明した健診受診率が０％である場合のＴ＋ｎ年度の介護度・介護費推計結果２８００（要介護度別の確率ｃｅＮＰ２８０２と介護費ｃｅＮＣＥ２８０３）、及び、Ｔ＋ｎ年度の介護費抑制額（ｃｆＮＣＥ－ｃｅＮＣＥ）２９３３を個人別に表示する。施策効果推計対象者選択欄２９３２は、介護施策を実施する対象者（健診受診者）が選択される欄であり、デフォルトでは、現在（Ｔ年度）にその介護施策を実施された人（健診受診者）が選択されている。この例では、個人ＩＤ２０１がＫ０００１の人が健診を受診した人として選択されている。また、個人別の介護度・介護費抑制効果表示欄２４３５では、健康診断の受診による個人別の介護度・介護費抑制効果をその効果が高い順に表示する。具体的には、Ｔ＋ｎ年度の介護費抑制額（ｃｆＮＣＥ－ｃｅＮＣＥ）２９３３が大きい順に表示するとよい。図示する例では、個人ＩＤがＫ０００３の人の介護費抑制額（ｃｆＮＣＥ３－ｃｅＮＣＥ３）が最大で、次がＫ０００２の人である。

ユーザは、個人別の介護度・介護費抑制効果表示欄２４３５や後述する施策効果推計結果表示欄２４４０を参照して、施策効果推計対象者選択欄２９３２で、健康診断の受診を促す対象者を個別に選択し、変更する。また、施策実施率表示欄２９３１の実施率（健診受診率）や実施人数を変更しても、健康診断の受診を促す対象者を選択できる。施策実施率表示欄２９３１の実施率（健診受診率）を変更した場合、介護費抑制額２９３３が大きい対象者から降順に選択される。

施策効果推計結果表示欄２４４０は、介護度別推計人数表示欄２９４１及び介護度推計結果表示欄２９５１を含む。

介護度別推計人数表示欄２９４１は、施策効果推計部１１０が、施策効果推計対象者の選定欄２４３０で選択された対象者全体について、Ｔ年度の要介護度及びＴ＋ｎ年度の要介護度別の確率ｃｆＮＰ２７０２とｃｅＮＰ２８０２を集計し、Ｔ年度の介護度別人数２９４４、施策実施率表示欄２９３１に表示された実施率（健診受診率）の場合のＴ＋ｎ年度の介護度別推計人数２９４５及び実施率（健診受診率）が０％の場合のＴ＋ｎ年度の介護度別推計人数２９４２を表示する。図示する例では要支援１以上の人数を表示している。さらに、実施率（健診受診率）が０％の場合のＴ＋ｎ年度の介護度別推計人数２９４２と、施策実施率表示欄２９３１に表示された実施率の場合のＴ＋ｎ年度の介護度別推計人数２９４５の差分を算出し、健診受診により抑制される介護人数２９４３を表示する。図示する例では、健診受診率が２０％の場合、介護人数２９４３が１００人抑制される。

介護度推計結果表示欄２９５１は、施策効果推計部１１０が、施策効果推計対象者の選定欄２４３０で選択された全ての対象者について、Ｔ年度の介護費及びＴ＋ｎ年度の介護費ｃｆＮＣＥ２７０３及びｃｅＮＣＥ２８０３を集計し、Ｔ年度の介護費２９５４、施策実施率表示欄２９３１に表示された健診受診率の場合のＴ＋ｎ年度の介護費２９５５及び健診受診率が０％の場合のＴ＋ｎ年度の介護費２９５２を表示する。さらに、健診受診率が０％の場合のＴ＋ｎ年度の介護費２９５２と、施策実施率表示欄２９３１に表示された健診受診率の場合のＴ＋ｎ年度の介護費２９５５の差分を算出し、健診受診により抑制される介護費２９５３を表示する。図示する例では、健診受診率が３０％の場合、抑制される介護費２９５３が１０億円である。

集計条件入力欄８１０は、個人別の介護度・介護費抑制効果表示欄２４３５に表示する対象者の条件を入力する欄である。図示する例では、Ｔ年度の年齢入力欄８１２、住所入力欄８１３及び健診対象入力欄８１４を設けているが、整形データ４００、１３００に格納されているＴ年度の任意のデータ項目を条件として入力する欄を設けてもよい。図示する例では、年齢入力欄８１２に４０歳以上、住所入力欄８１３にＡ区とＢ区、健診対象入力欄８１４に１（対象者）が入力されている。

図３２は、施策効果推計部１１０が、出力部１０３に出力する、健診受診率を変更した場合の介護施策効果シミュレーション画面３０００の例を示す図である。図３２では、図３１に示す介護施策効果シミュレーション画面２９００の健診受診率を変更した場合の例を示す。

介護施策効果シミュレーション画面３０００は、対策介護度選択欄２４１０、介護施策選択タブ表示欄２４２０、施策効果推計対象者の選定欄２４３０、施策効果推計結果表示欄２４４０及び集計条件入力欄８１０を含む。介護施策効果シミュレーション画面３０００の画面構成は、図３１に示す介護施策効果シミュレーション画面２９００と同じであるため、以下では違いを説明する。

施策実施率表示欄３０３１は、施策実施率表示欄２９３１と同様に、介護施策選択タブ表示欄２４２０で選択された介護施策の実施率及び実施人数を示す。図示する例では、施策実施率表示欄２９３１の健診受診率が２０％から８０％に、実施人数が１万人から８万人に変更されている。

施策効果推計対象者選択欄３０３２は、施策効果推計対象者選択欄２９３２と同様に、介護施策を実施する対象者が選択される欄であり、施策実施率表示欄２９３１で変更した健診受診の実施人数に基づいて、健康診断を受診する対象者が選択される。対象者の選択は、前述したように、介護費抑制額２９３３が大きい対象者から降順に選択されるとよい。図示する例では、介護費抑制額２９３３が大きい８万人の対象者が選択されている。

施策効果推計結果表示欄２４４０では、介護度別推計人数表示欄２４４１及び介護費推計結果表示欄２４５１を含み、健診受診率を変更した場合の介護度別推計人数と、介護費推計結果を表示する。

介護度別推計人数表示欄２９４１では、施策実施率表示欄３０３１で変更された健診受診率の場合のＴ＋ｎ年度の介護度別推計人数３０４５を表示する。図示する例では、健診受診率を８０％に変更した場合の要支援１以上の推計人数を表示している。さらに、健診受診率が０％の場合のＴ＋ｎ年度の介護度別推計人数２９４２と、施策実施率表示欄３０３１に表示された健診受診率の場合のＴ＋ｎ年度の介護度別推計人数３０４５の差分を算出し、健診受診率変更により抑制される介護人数３０４３を表示する。図示する例では、健診受診率を８０％にすると、介護人数３０４３が２０００人抑制され、図３１の実施率２０％の場合の１００人より大幅に増加している。

介護度推計結果表示欄２９５１は、施策実施率表示欄３０３１で変更された健診受診率の場合のＴ＋ｎ年度の介護費３０５５を表示する。図示する例では、健診受診率を８０％に変更した場合の介護費を表示している。さらに、健診受診率が０％の場合のＴ＋ｎ年度の介護費２９５２と、施策実施率表示欄３０３１に表示された健診受診率の場合のＴ＋ｎ年度の介護費３０５５の差分を算出し、健診受診率変更により抑制される介護費３０５３を表示する。図示する例では、健診受診率を８０％に変更すると、介護費３０５３が１００億円抑制され、図３１の健診受診率２０％の場合の１０億円より抑制額が大幅に増加している。

図３１及び図３２で説明したように、実施例５の将来推計システムでは、健康診断の受診によって抑制される介護人数及び介護費を推計できる。さらに、健診受診率を変更した場合の施策効果をシミュレーションできる。さらに、個人別の介護度・介護費抑制効果表示欄２４３５で、健診受診の効果が高い対象者を選定できるので、費用対効果の高い健診受診率向上施策を立案できる。また、住民の死亡や転出による人口動態補正を行って介護度及び介護費を補正するので、より正確に介護度や介護費を推計できる。自治体にとって住民の健診受診率の向上は、大きな課題となっており、実施例５の将来推計システムは、健診受診率向上に向けた効果的な施策立案を支援できる。

＜実施例６＞
実施例６では、予め収集した蓄積情報から推計モデルを構築する際に、推計対象である目的変数と関連の強いカテゴリ変数に関して、同一の値を有するレコード毎にデータを分割し、それぞれの値に対応した推計モデルを構築して、医療費を推計する推計モデル構築システムの例を説明する。

以下、実施例６の推計モデル構築システムの構成について説明する。図３３は、実施例６の推計モデル構築システムの構成を示すブロック図である。実施例６の推計モデル構築システムは、将来推計端末１０１及びデータベース１６０を有する。将来推計端末１０１は、入力部１０２、出力部１０３、プロセッサ１０４、メモリ１０５及び記憶媒体１０６を有する。

入力部１０２は、マウスや、キーボードなどのヒューマンインターフェースであり、将来推計端末１０１への入力を受け付ける。出力部１０３は、推計モデル構築システムによる演算結果を出力するディスプレイやプリンタである。記憶媒体１０６は、将来推計端末１０１によるデータ分析処理を実現する各種プログラム、及びデータ分析処理の実行結果等を格納する記憶装置であり、例えば、不揮発性記憶媒体（磁気ディスクドライブ、不揮発性メモリ等）である。

メモリ１０５は、不揮発性の記憶素子であるＲＯＭ及び揮発性の記憶素子であるＲＡＭを含む。ＲＯＭは、不変のプログラム（例えば、ＢＩＯＳ）などを格納する。ＲＡＭは、ＤＲＡＭ（Dynamic Random Access Memory）のような高速かつ揮発性の記憶素子であり、プロセッサ１０４が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。すなわち、メモリ１０５には、記憶媒体１０６に格納されているプログラムが展開される。プロセッサ１０４は、メモリ１０５にロードされたプログラムを実行する演算装置であり、例えば、ＣＰＵ、ＧＰＵなどである。以下に説明する処理及び演算は、プロセッサ１０４が実行する。なお、プロセッサ１０４がプログラムを実行して行う処理の一部を、他の演算装置（例えば、ＦＰＧＡ（Field Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）などのハードウェア）で実行してもよい。

プロセッサ１０４によって実行されるプログラムは、リムーバブルメディア（ＣＤ－ＲＯＭ、フラッシュメモリなど）又はネットワークを介して各サーバに提供され、非一時的記憶媒体である不揮発性記憶装置に格納される。このため、計算機システムは、リムーバブルメディアを読み込むインターフェースを含むとよい。

実施例６の推計モデル構築システムは、一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。

将来推計端末１０１では、記憶媒体１０６に格納されたデータ整形部１１１と、医療費推計モデル構築部１４８と、将来推計部１５１と、推計情報集約部１５２と、関連カテゴリ関連付け部１５３とを機能させる。

プロセッサ１０４は、各機能部のプログラムに従って処理することによって、所定の機能を提供する機能部として稼働する。例えば、プロセッサ１０４は、データ整形プログラムに従って処理することでデータ整形部１１１として機能する。他のプログラムについても同様である。さらに、プロセッサ１０４は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。

以下、実施例６で扱うデータの種類と構築する推計モデルについて説明する。実施例６では、データとして、個人毎のレセプト情報及び特定健診情報が時系列で含まれたデータを用いる例を説明する。

構築する推計モデルの推計対象としては、将来の疾病に関する個人毎の医療機関の受診リスクと医療費の期待値、及び、それらを統計的に集約した集団の医療機関受診人数と医療費、を推計する例を説明する。

まずデータ整形部１１１について説明する。データ整形部１１１は、データ記憶部１６１に記憶されたレセプト情報及び特定健診情報の個人毎の診療報酬明細書等の個人毎の医療及び健康に関する情報を、特定の期間毎、かつ個人毎に集約した推計用の整形データ２０１を構築して、整形データ記憶部１６３に記憶する。なお、実施例６では整形データ２０１を、個人毎の医療及び健康に関する蓄積情報として扱う。

なお、各記憶部１３９、１４０、１６１～１６８に格納される情報はデータベース１６０に限定されるものではなく、将来推計端末１０１からアクセス可能な記憶部や記憶装置に格納されてもよい。

図３４は、データ整形部１１１で整形した推計用の整形データの一例を説明する図である。実施例６では、例として、個人毎のレセプト情報等の医療に関する情報を年度毎に集約した例を説明する。

３４０１は、整形データ全体を現す情報である。以下、整形データ３４０１に含まれる情報を説明する。基本情報３４１０は、個人毎の基本的なプロファイル情報を含む情報である。

ここでは例として、個人ＩＤ３４１１と、性別３４１２と、年齢３４１３と、死亡３４１４と、転出３４１５を含む例を示している。個人ＩＤ３４１１は、整形データ３４０１に含まれる個人毎に一意に割り当てられた個人ＩＤである。性別３４１２は、個人毎の性別を表す情報である。例えば、男性を０、女性を１、などのように、特定の変数に割り当てられたカテゴリ変数として表すことができる。年齢３４１３は、個人毎の年齢を表す情報である。例えば、３５、２１、５０のように、整数として表すことができる。死亡３４１４は、住民が当該年度において死亡した場合に１が登録される。転出３４１５は、住民が当該年度において他の自治体に転出した場合に１が登録される。

図中、３４２０は年度毎に集約された個人毎の情報を含む年度情報である。ここでは、２０１４年度の情報を集約した例を示している。特定健診情報３４２１は、当該の年度に受けた特定検診に関する情報を含み、例えば、ＢＭＩ（ＢｏｄｙＭａｓｓＩｎｄｅｘ）や、血糖、血圧などの情報が含まれる。図中ではＢＭＩ３４２３の情報を例として表示している。

ＢＭＩ３４２３は、２０１４年度に計測されたＢＭＩの情報を含む。ここに含まれる情報は特定健診における問診の情報、例えば、運動習慣に関するアンケート情報や、飲酒、喫煙などに関するアンケート情報を含んでもよい。この場合、データとしては、例えば、一週間の飲酒の量ごとに割り当てられた記号や数値番号を含むカテゴリ変数としてデータが格納される。

レセプト情報３４２２は、当該の年度に発生したレセプトに関する情報を含む。例えば、レセプトに含まれる傷病名に基づいて定義された、傷病名毎のレセプトの有無、レセプトの発生数、関連する医療費などの情報が含まれる。また傷病名を公知の集約情報に基づき疾病にグルーピングした疾病毎の情報などが含まれる。図中では例として、糖尿病と、糖尿病医療費と、高血圧症、に関する情報が示されている。

糖尿病３４２４は、糖尿病に関するレセプトの発生を示す情報で、図示の例では、当該の年度に糖尿病に関連するレセプトが少なくとも一つ以上発生した場合を１、発生しなかった場合を０としている。糖尿病医療費３４２５は、糖尿病に関するレセプトに含まれる医療費を示す情報である。図示の例では、当該の年度に糖尿病に関連して発生した医療費に関する情報が含まれている。

高血圧症３４２６は、高血圧症に関するレセプトの発生を示す情報で、図示の例では、当該の年度に高血圧症に関連するレセプトが少なくとも一つ以上発生した場合を１、発生しなかった場合を０としている。

図中３４３０は年度毎に集約された個人毎の情報を含む年度情報である。図示の例では、２０１５年度の情報を集約した例を示しているが、集計方法は２０１４年度の年度情報３４２０と同様である。ＢＭＩ３４３１は、２０１５年度の特定健診で取得されたＢＭＩの情報を含む情報であり、２０１４年度の情報と同様の方法でテーブルに格納された情報である。上述の整形データ３４０１を参照することで、個人毎の基本情報と年度毎の健康、医療に関する情報を一度に取得することが可能となる。

次に、医療費推計モデル構築部１４８について説明する。医療費推計モデル構築部１４８では、推計モデル構築処理を実行し、整形データ記憶部１６３に記憶された整形データ３４０１に基づき、推計モデルを構築する。

以下、医療費推計モデル構築部１４８で処理する推計モデル構築処理の一例について説明をする。処理の詳細な説明にあたり、まず始めに、本処理で構築する推計モデルの概要について説明する。次に、推計モデルの構築時に、モデル構築に使用される情報の特徴に応じて、二つの異なる形態の推計モデルが構築されうることを説明する。最後に、図３５に示される処理のフローチャートを用いて、二つの異なる形態の推計モデルのそれぞれが、どのように構築されるか、各ステップを追って、順に説明する。

まず推計モデルの概要について説明する。実施例６で構築される推計モデルは整形データ３４０１から構築されるものであって、例えば、ひとつの目的変数、ひとつ以上の説明変数、説明変数から目的変数を推定するための変数間の関係性、の情報を含む推計モデルである。

推計モデルとしては、例えば、レセプト情報に基づく２０１５年度の糖尿病に関する医療機関の受診有無（０または１の値をとる）を目的変数とし、特定健診に基づく２０１４年度のＢＭＩ（連続値をとる）３４２３と、空腹時血糖（連続値をとる）を説明変数とする推計モデルを構築することができる。

この推計モデルは、予め学習した変数間の関連性を用いて、２０１４年度のＢＭＩ３４２３と空腹時血糖の値に基づき、２０１５年度の糖尿病に関する医療機関の受診有無の確率を推計することができる。

このように、取得時間の異なる情報を説明変数と目的変数に設定した推計モデルを構築することで、将来の情報を推計することが可能となる。本推計モデルの場合、ある年度のＢＭＩと空腹時血糖の情報を入力することで、翌年度の糖尿病の医療機関の受診有無の確率を推計することが可能となる。

例えば、この推計モデルにある個人の２０１５年度のＢＭＩの情報と空腹時血糖の情報を入力することで、当該個人の２０１６年度の医療機関の受診有無の値を推計することができる。例えば、受診有無の値を０と１とする場合、０以上かつ１以下の値として、受診有無の確率値を推計することができる。

次に、実施例６において医療費推計モデル構築部１４８が構築しうる異なる形態の推計モデルについて説明する。実施例６において医療費推計モデル構築部１４８は、推計モデル内の説明変数に含まれるカテゴリ変数の中で、任意のカテゴリ変数に関し、カテゴリ変数の値ごとに、データを分割し、各データからサブモデルを構築する。さらに、このカテゴリ変数の種類に基づき、二つの異なる形態の推計モデルを構築する。

具体的には、当該カテゴリ変数が、推計モデルを適用する際、つまり、推計したい対象年度の情報に対し、それを推計するために推計モデルが必要とする説明変数の情報を入力する際に、当該カテゴリ変数の値が、（１）確定済みの情報である、（２）未確定の情報である、という二つの条件に応じて、異なる二つの形態の推計モデルを構築しておくことができる。以下、推計モデルの二つの形態について説明する。

第１の形態の推計モデルは、説明変数中のカテゴリ変数Ｃに含まれる情報が、推計モデルの適用時に、確定済みの情報である場合の推計モデルである。例えば、推計モデルとして、２０１４年度のＢＭＩ３４２３と、２０１４年度の空腹時血糖と、２０１４年度の糖尿病３４２４の有無、の３つの情報を説明変数とし、２０１５年度の糖尿病の受診の有無、を目的変数とする推計モデルが一例である。

ここで、医療費推計モデル構築部１４８は、説明変数に含まれる２０１４年度の糖尿病３４２４の有無の値を、データを分割してサブモデルを構築するためのカテゴリ変数として選択するとする。この推計モデルは２０１４年度の情報から２０１５年度の情報を推計するモデルとして構築されているため、あるＮ年度の情報を入力とすると、Ｎ＋１の年度の情報を推計するモデルである。

このとき、カテゴリ変数に指定した２０１４年度の糖尿病有無の値は、他の説明変数である２０１４年度のＢＭＩと空腹時血糖の情報と同様に、２０１４年度の情報であるため、取得済の情報である。例えば、この推計モデルを用いて、２０１５年度の情報から２０１６年度の情報を推定する場合、カテゴリ変数である２０１４年度の糖尿病有無の値には、確定済みである２０１５年度の情報を入力して推計できる。このように、説明変数のカテゴリ変数Ｃに含まれる情報が、推計モデルの適用時において、確定済みの情報である場合、第１の形態の推計モデルとして、カテゴリ変数の値が同一（あるいは所定の条件を満たす）のデータ毎に整形データ３４０１を分割し、それぞれの整形データ３４０１からそれぞれのカテゴリ変数の値に対応した推計モデルを構築する。なお、カテゴリ変数の値は、必ずしも同一である必要は無く、整形データ３４０１の種類によっては、近似値（差分が閾値未満）などの所定の条件を満たすデータ毎に整形データ３４０１を分割してもよい。

第２の形態の推計モデルは、説明変数中のカテゴリ変数Ｃに含まれる情報が、推計モデルの適用時に、未確定の情報である場合の推計モデルである。例えば、推計モデルとして、２０１４年度の疾病Ａの受診有無と、２０１５年度の疾病Ａの受診有無を説明変数とし、２０１５年度の疾病Ｂの受診の有無を目的変数とする推計モデルが一例である。

ここで、医療費推計モデル構築部１４８は、説明変数の中の２０１５年度の疾病Ａの受診有無を、データを分割してサブモデルを構築するためのカテゴリ変数として選択するとする。この推計モデルは２０１４年度の情報と２０１５年度の情報から、他の２０１５年度の情報を推計するモデルとして構築されているため、Ｎ年度の情報とＮ＋１年度の情報の入力に基づき、他のＮ＋１年度を推計するモデルである。

このとき、カテゴリ変数に指定した２０１５年度の疾病Ａの受診有無の情報は、目的変数である２０１５年度の疾病Ｂの受診の有無の情報と同じ年度に取得される情報である。そのため、この推計モデルを適用する場合には、このカテゴリ変数の情報は未確定であると考えられる。

例えば、この推計モデルを用いて、２０１５年度の情報から２０１６年度の情報を推計する場合に、カテゴリ変数である２０１６年度の疾病Ａの情報は、他の説明変数とは異なり、推計時には情報が未確定である。この場合には、まず、カテゴリ変数以外の説明変数の情報に基づき、カテゴリ変数の値を推計する第１の推計モデルを構築する。次に、カテゴリ変数の値が同一のデータ毎に整形データを分割し、それぞれのデータからカテゴリ変数の値に対応した第２の推計モデルを構築する。

例えば前述の例では、第１の推計モデルとして、２０１４年度の疾病Ａの受診有無の情報を説明変数とし、２０１５年度の疾病Ａの受診有無の情報を目的変数とする第１の推計モデルを構築する。次に、第２の推計モデルとして、２０１４年度の疾病Ａの受診有無の情報を説明変数とし、２０１５年度の疾病Ｂの受診有無の情報を目的変数とする推計モデルを、２０１５年度の疾病Ａの受診有無の値が同一のデータセットごとにそれぞれ構築する。

この推計モデルを用いて、２０１５年度の情報から２０１６年度の情報を推計する場合は、まず、第１の推計モデルを用いて、２０１５年度の疾病Ａの受診有無の情報から、２０１６年度の疾病Ａの受診有無の確率分布を推計する。次に、推計した２０１６年度の疾病Ａの受診有無の確率分布の下で、第２の推計モデルをそれぞれ適用し、それら結果を統合して、最終的な推定結果とする。

これらの二つの異なる形態の推計モデルは、整形データ３４０１に含まれる情報及びデータベース１６０に記憶された情報に基づき、いずれか適切なものが選択されて構築される。

以下、図３５を用いて、医療費推計モデル構築部１４８で行われる推計モデル構築処理のフローチャートを説明する。

図３５は、医療費推計モデル構築部１４８で実行される推計モデル構築処理の流れを説明するフローチャートである。以下、本フローチャートを用いて、各ステップの処理について説明する。

目的変数・説明変数入力のステップ３５０１では、医療費推計モデル構築部１４８は、入力部１０２から入力された情報に基づき、推計対象とする変数を目的変数に決定し、推計に用いる情報を説明変数に決定する。なお、説明変数と目的変数の対応は、事前に説明変数と目的変数の情報がペアとなった情報を医療費推計モデル構築用変数群記憶部１６７に記憶しておき、予め記憶された情報を読み出すことで決定してもよい。

整形データ読出処理のステップ３５０２では、医療費推計モデル構築部１４８は、予めデータ整形部１１１で処理されて、整形データ記憶部１３に記憶された推計モデル構築用の整形データ３４０１の情報を、整形データ記憶部１６３から読み出す。

関連カテゴリ変数読出処理のステップ３５０３では、医療費推計モデル構築部１４８は、目的変数の情報に基づき、説明変数に含まれる変数の中に、目的変数を推計するにあたり、カテゴリ変数として扱うべき変数が存在するか否かを判定する。この判定は例えば、医療費推計モデル構築部１４８が、関連カテゴリ記憶部１６４に記憶された関連カテゴリマトリクス（関連カテゴリ情報）３７０１の情報を用いることで実施される。

図３７は、関連カテゴリ記憶部１６４に記憶された関連カテゴリを選択するためのマトリクスの情報である。関連カテゴリマトリクス３７０１は、推計対象である対象変数の情報を行方向に設定しに、関連する変数に関する情報を列方向に設定する行列であって、各行及び列には整形データ３４０１に含まれる項目の情報が含まれる。

行方向の対象変数情報３７０２は、関連を探索する元となる対象変数に関する情報が含まれる。列方向の関連変数情報３７０３は、関連を探索する先となる項目に関する情報が含まれる。

図示の例では、基本情報Ｂ、Ｎ年度の情報として、Ａ、ｙ１、ｙ２、Ｎ＋１年度の情報として、Ａ、ｙ１、ｙ２の計７つの情報が含まれる例を示す。行列は０、１、または空の情報を含む。空のセルは、当該セルが含まれる行の対象変数が、当該セルが含まれる列の関連先の変数と、関連を持っていないことを示す。

０が入っているセルは、当該セルが含まれる行の対象変数が、当該セルが含まれる列の関連先の変数と、関連を持っており、また、関連変数が、推定時には既に観測済みの情報、すなわち、推定時には情報が整形データに含まれることを示す。

１が入っているセルは、当該セルが含まれる行の対象変数が、当該セルが含まれる列の変数と関連を持っており、また、推定時には未観測の情報、すなわち、推定時には情報が整形データに含まれていないことを示す。例えば、関連変数が、対象変数よりも過去の年度の情報に関する変数であれば、其の変数は観測済みの情報である。一方、関連変数が、対象変数と同じ年度に取得された情報であれば当該変数は推計時には、未観測の情報である。

関連カテゴリマトリクス３７０１を用いて関連カテゴリを読み出す処理を、図３６のフローチャートを用いて説明する。図３６は、推計モデル構築処理の関連カテゴリ変数読出処理のステップ３５０３で実行される処理のフローチャートである。

対象変数決定のステップ３６０１では、医療費推計モデル構築部１４８が、関連を探索する変数を決定する。具体的には、医療費推計モデル構築部１４８が、推計モデル構築処理の目的変数・説明変数入力のステップ３５０１で決定した推計対象の目的変数を、探索する元の変数として決定する。

関連カテゴリ変数探索のステップ３６０２では、医療費推計モデル構築部１４８が、関連カテゴリマトリクス３７０１を用いて、対象変数と関連するカテゴリ変数を探索する。具体的には、医療費推計モデル構築部１４８が、関連カテゴリマトリクス３７０１で対象変数とする変数が含まれる行を探索し、０または１が含まれるセルが存在するか否かを探索する。医療費推計モデル構築部１４８は、０または１が含まれるセルが存在する場合には、該当する列の関連変数を、対象変数に対応した関連カテゴリ変数として、セル内の値と対応付けて、記憶する。

図３７で示す関連カテゴリマトリクスを例に説明する。例えば、対象変数が、Ｎ＋１年度のＡの情報である場合は、医療費推計モデル構築部１４８が、０が存在するセルを含む列であるＮ年度のＡを関連変数として選択する。例えば、医療費推計モデル構築部１４８は、対象変数が、Ｎ＋１年度のｙ１の情報である場合は、１が存在するセルを含む列であるＮ＋１年度のＡの情報を関連カテゴリ変数として選択する。

ステップ３６０３では、医療費推計モデル構築部１４８が、変数探索のステップ３６０２で記憶された関連カテゴリ変数について判定を実施する。医療費推計モデル構築部１４８は、選択された関連カテゴリ変数に、推定時に未確定のカテゴリ変数が含まれるか否かを判定し、含まれる場合は、未確定カテゴリ項目読出のステップ３６０４に進む。一方、医療費推計モデル構築部１４８は、推定時に未確定のカテゴリ変数が、含まれない、または、関連カテゴリがひとつも記憶されていない場合は、関連変数情報集約処理のステップ３６０５に進む。

なお、医療費推計モデル構築部１４８は、推定時に未確定のカテゴリ変数であるか否かの判定は、関連カテゴリマトリクスから選択した関連カテゴリ変数に対応するセルの値が０であるか１であるかに基づいて判定することができる。

未確定カテゴリ項目対象変数化のステップ３６０４では、医療費推計モデル構築部１４８が、ステップ３６０２で記憶した関連変数の中で、推定時に未確定のカテゴリ変数を新たな対象変数として設定した後、関連カテゴリ変数探索のステップ３６０２に戻る。以後、全ての未確定の関連カテゴリ変数の処理を完了するまで上記ステップ３６０２、３６０３、３６０４を反復して繰り返す。

ステップ３６０３の判定と、ステップ３６０２、３６０３、３６０４の繰り返し処理について、図３７で示す関連カテゴリマトリクス３７０１を例に説明する。

例えば、対象変数が、Ｎ＋１年度のＡである場合は、医療費推計モデル構築部１４８は、０が存在するセルを含む列であるＮ年度のＡが関連カテゴリ変数として記憶する。関連カテゴリマトリクス３７０１では、０は、対象変数との関連関係において、関連変数が確定済の変数であることを示す。そのため、医療費推計モデル構築部１４８は、ステップ３６０３の判定でＮｏと判定し、ステップ３６０５に進む。

一方、対象変数が、Ｎ＋１年度のｙ１である場合は、医療費推計モデル構築部１４８は、１が存在するセルを含む列であるＮ＋１年度のＡを関連カテゴリ変数として選択する。関連カテゴリマトリクス３７０１では、１は、対象変数との関連関係において、関連変数が未確定の変数であることを示す。そのため、医療費推計モデル構築部１４８は、ステップ３６０３の判定においてＹｅｓと判定し、ステップ３６０４に進む。

ステップ３６０４では、医療費推計モデル構築部１４８がＮ＋１年度のＡを新たな対象変数に設定する。その後、再度ステップ３６０２において、医療費推計モデル構築部１４８は、Ｎ＋１年度のＡに関連するカテゴリ変数として、Ｎ年度のＡを記憶する。この変数は、Ｎ＋１年度のＡとの関連において、セルに０の値を含み、推定時に確定済の変数であるため、医療費推計モデル構築部１４８は、２回目のステップ３６０４においてＮｏと判定し、繰り返し処理を終了し、ステップ３６０５に進む。

関連変数情報集約のステップ３６０５では、医療費推計モデル構築部１４８がこれまでの処理で記憶された関連カテゴリ変数の情報を集約し、関連カテゴリ変数の関連性を示すツリー構造を構築する。

以下、本処理で構築するツリー構造について図３８を用いて説明する。図３８Ａ、図３８Ｂは、図３７の関連カテゴリマトリクス３７０１を用いて、関連カテゴリ変数の読出処理で読み出される変数の関連性の例を表すツリー構造である。

図３８Ａは、対象変数をＮ＋１年度のＡに設定して、関連カテゴリ変数の読出処理を実施した場合のツリー構造である。この例では、対象変数に関連するカテゴリ変数として、Ｎ年度のＡがひとつ読み出されている。図３８Ａは、関連性を表すツリー構造であって、図中の四角は変数、矢印は関連性を表す。

図３８ＡのＡ＿Ｎ＋１は、Ｎ＋１年度のＡの情報を表す変数、Ａ＿ＮはＮ年度のＡの情報を表す変数を表す。矢印は根元にある変数が関連変数であり、矢印の先にある変数が、根元の関連変数から影響を受ける対象変数である。

このように、対象変数と関連する関連カテゴリ変数が目的変数の推定時に確定済みの変数である場合、対象変数と関連カテゴリ変数のツリー構造上の距離は１となる。このツリー構造は、前記第１の形態の推計モデルに対応する。

図３８Ｂは、対象変数をＮ＋１年度のｙ１の情報に設定して、関連カテゴリ変数の読処理を実施した場合のツリー構造である。この例では、対象変数に関連するカテゴリ変数として、Ｎ＋１年度のＡがひとつ目の関連変数として読み出され、次に、Ｎ＋１年度のＡの情報が、推定時に未確定であることから、当該変数を新たな対象変数として読み出されたＮ年度のＡの情報がふたつ目の関連変数として読み出されている。このとき、Ｎ＋１年度のｙ１の情報が、Ｎ＋１年度のＡの情報と関連し、さらに、Ｎ＋１年度のＡの情報が、Ｎ年度のＡの情報と関連している関連性が存在する。

図３８Ｂは、上記関連性の情報を表すツリー構造であって、ｙ１＿Ｎ＋１は、Ｎ＋１年度のｙ１の情報を意味する変数、Ａ＿Ｎ＋１は、Ｎ＋１年度のＡの情報を意味する変数、Ａ＿ＮはＮ年度のＡの情報を意味する変数を表す。図３８Ｂより、Ｎ＿ＮがＡ＿Ｎ＋１に影響を与え、さらにＡ＿Ｎ＋１は、ｙ１＿Ｎ＋１に影響を与えるという関係性が示されている。

このように、対象変数と関連する関連カテゴリ変数に、推定時に未確定の変数が含まれる場合は、対象変数と関連カテゴリ変数のツリー構造の深さが２以上となる。このツリー構造は、前記第２の形態の推計モデルに対応する。図３８Ｂの例では、ｙ１＿Ｎ＋１が根ノードを示し、Ａ＿Ｎ＋１が関連カテゴリ変数の内部ノードを示す。

医療費推計モデル構築部１４８は、本処理で構築したツリー構造を、関連カテゴリ記憶部１６４に記憶する。

以上、推計モデル構築処理内の、関連カテゴリ変数読出処理のステップ３５０３について説明を終了する。以下、図３５を用いた推計モデル構築処理の説明に戻る。

データ分割ラベル付け処理のステップ３５０４では、医療費推計モデル構築部１４８が、推計モデル構築時に実施するデータの分割を行うための、個々のデータの分類用のラベル付け処理を行う。

具体的には、まず、医療費推計モデル構築部１４８は、整形データ３４０１に含まれる説明変数のうち、関連カテゴリ変数読出処理のステップ３５０３で読み出された関連カテゴリ変数の情報を選択する。次に、医療費推計モデル構築部１４８は、関連カテゴリ変数読出処理のステップ３５０３で構築された関連カテゴリ変数間のツリー構造に基づき、対象の変数毎に、当該変数を推計する推計モデルを構築するためのデータ分割用のラベル付けを実行する。以下では、図３８Ａと図３８Ｂの二つのツリー構造を用いて、それぞれの例を説明する。

まず、図３８Ａで示すツリー構造を処理する例を説明する。

図３８Ａのツリー構造では、目的変数は、Ａ＿Ｎ＋１、カテゴリ変数はＡ＿Ｎである。図３９は、推計モデル構築用整形データ３９００の一例を示す図である。推計モデル構築用整形データ３９００は、整形データ３４０１から、関連カテゴリ変数の項目の情報を選択した結果を示す。推計モデル構築用整形データ３９００は、Ｎｏ３９０１と、確定カテゴリ３９０２と、目的変数３９０３と、説明変数３９０４～３９０５とをひとつのエントリに含む。

実施例６では、カテゴリ変数Ａ＿Ｎと目的変数Ａ＿Ｎ＋１は、いずれもｙとｎの２種類の値を取りうる変数であるとする。なお、ｙは例えば、カテゴリに該当する場合に設定され、ｎは例えば、カテゴリに含まれない場合に設定される。データ分割ラベル付け処理のステップ３５０４では、推計モデル構築用整形データ３９００の情報を用いて、推計が必要な変数毎に、データ分割用のラベル付けを実施する。

図３８Ａのツリー構造において、推計が必要な変数は目的変数であるＡ＿Ｎ＋１のひとつだけであるので、医療費推計モデル構築部１４８は、Ａ＿Ｎ＋１を推計するモデルを構築するためのデータ分割処理用のラベル付けを行う。このラベルは、ツリー構造の中で、推計対象である変数の先祖となる変数群の全ての状態の組合せが一意になるように設定する。

例えば、先祖となる変数の直積値を取る変数でラベル付けすることで実施できる。図３８Ａのツリーでは、Ａ＿Ｎ＋１の先祖ノードは、Ａ＿Ｎのひとつだけであるので、Ａ＿Ｎの値を直接用いることで、ラベル付けできる。

図４０Ａは、図３８Ａのツリーに関し、データ分割用のラベルを付与した結果を示すラベル付けテーブル４０００である。関連カテゴリ４００１は、ラベル付けに用いた変数である。データ分割ラベル４００２は、付与されたラベルである。図示の例では、Ａ＿Ｎの値をそのままラベルに用いた例を示している。

図４０Ｂは、ラベル付けテーブル４０１０の一例を示す図である。ラベル付けテーブル４０１０は、Ｎｏ４０１１と、確定カテゴリ４０１２と、推計対象４０１３と、データ分割ラベル４０１４とをひとつのエントリに含む。

図４０Ｂは、図４０Ａで示したラベルを用いて、図３９に示した推計モデル構築用整形データ３９００にラベル付けした例である。データ分割ラベル４０１４は、カテゴリ変数の情報に基づき生成されたラベルの列である。

次に、図３８Ｂで示すツリーを処理する例を説明する。

図４１は、推計モデル構築用整形データ４１１０の一例を示す図である。推計モデル構築用整形データ４１１０は、整形データ３４０１から、図３８Ｂの情報に基づき、関連カテゴリ変数項目の情報を選択した結果を示す。推計モデル構築用整形データ４１１０は、Ｎｏ４１１１と、確定カテゴリ４１１２と、未確定カテゴリ４１１３と、目的変数４１１４と、説明変数４１１５～４１１６とをひとつのエントリに含む。

図３８Ｂの例では、目的変数は、ｙ１＿Ｎ＋１であり、カテゴリ変数は、Ａ＿Ｎ＋１とＡ＿Ｎのふたつが存在する。このうち、Ａ＿Ｎは確定カテゴリであり、Ａ＿Ｎ＋１は未確定カテゴリである。

ここでは、カテゴリ変数Ａ＿ＮとＡ＿Ｎ＋１は、いずれもｙとｎの２種類の値を取りうる変数であるとする。データ分割ラベル付け処理のステップ３５０４では、この情報に基づき、推計が必要な変数毎に、当該変数を推計する推計モデル構築時にデータを分割する際のラベル付けを実行する。

図３８Ｂのツリーにおいて推計が必要な変数は、目的変数であるｙ１＿Ｎ＋１と、カテゴリ変数Ａ＿Ｎ＋１のふたつである。そこで、ｙ１＿Ｎ＋１を推計する推計モデルを構築するためのデータ分割処理におけるラベル付けと、Ａ＿Ｎ＋１の推計を実行するモデルを構築するためのデータ分割処理におけるラベル付けの、ふたつのラベル付け処理を実行する。

これらのラベル付けも、図３８Ａの例と同様に、推計対象の変数の先祖となる変数の値の組合せが一意となるようにラベル付けをすることで実施できる。

図４２Ａは、ラベル付けテーブル４２２０の一例を示す図である。図４２Ａは、図３８Ｂのツリーに関し、カテゴリ変数Ａ＿Ｎ＋１を推計するモデル構築のためのデータ分割ラベルを付与された結果を示すラベル付けテーブル４２２０である。

関連カテゴリ４２２１は、ラベル付けに用いた変数である。データ分割ラベル４２２２は、付与されたラベルである。この例では、推計対象のＡ＿Ｎ＋１の先祖となる変数は確定カテゴリのＡ＿Ｎのみであるため、当該値をそのままラベルに用いた例を示している。

図４２Ｂは、ラベル付けテーブル４２３０の一例を示す図である。図４２Ｂは、図４２Ａで示したラベルを用いて、図３９に示した推計モデル構築用整形データ３９００のデータにラベル付けした例である。データ分割ラベル４２３４が、カテゴリ変数の情報に基づき付与されたラベルの列を表す。

図４２Ｃは、ラベル付けテーブル４２４０の一例を示す図である。図４２Ｃは、図３８Ｂのツリーに関し、目的変数ｙ１＿Ｎ＋１を推計するモデル構築のためのデータ分割ラベルを付与した結果を示すラベル付けテーブル４２４０である。

関連カテゴリ４２４１、４２４２は、当該ラベル付けに用いた変数である。この例では、推計対象のｙ１＿Ｎ＋１の先祖となる変数は、確定カテゴリのＡ＿Ｎと、未確定カテゴリのＡ＿Ｎ＋１のふたつが存在するため、それら二つの値の組合せを用いた値でラベル付けした例を示している。

図４２Ｄは、ラベル付けテーブル４２５０の一例を示す図である。ラベル付けテーブル４２５０は、Ｎｏ４２５１と、確定カテゴリ４２５２と、未確定カテゴリ４２５３と、推計対象４２５４とデータ分割ラベル４２５５とを一つのエントリに含む。

図４２Ｄは、図４２Ｃで示したデータ分割ラベル４２４３を用いて、図４１Ｂに示したデータにラベル付けした例である。データ分割ラベル４２５５が、カテゴリ変数の情報に基づき付与されたラベルの列を表す。これらのラベル付け処理は、ツリー構造の中で、根である目的変数との距離が遠いノードに対応する変数から順に、実行する。

図３８Ｂの例ではまず、医療費推計モデル構築部１４８が、Ａ＿Ｎ＋１についてラベル付け処理を実行する。図３８Ｂのツリーでは、Ａ＿Ｎ＋１の先祖ノードは、Ａ＿Ｎのひとつだけであるので、Ａ＿Ｎの値を用いて、ラベル付けする。

次に、医療費推計モデル構築部１４８は、ｙ１＿Ｎ＋１についてラベル付け処理を実行する。図３８Ｂのツリーでは、ｙ１＿Ｎ＋１の先祖ノードは、Ａ＿Ｎ＋１とＡ＿Ｎのふたつが存在するので、医療費推計モデル構築部１４８は、Ａ＿Ｎ＋１の値と、Ａ＿Ｎの値の直積を取った値でラベル付けする。医療費推計モデル構築部１４８は、ラベル付けした情報を、データ分割情報記憶部１６５に記憶する。

ステップ３５０５では、医療費推計モデル構築部１４８が、関連カテゴリ変数読出処理のステップ３５０３で読出した未確定の関連カテゴリ変数に関して、推計モデルを未構築の変数が含まれるか否かを判定する。医療費推計モデル構築部１４８は、未確定の関連カテゴリ変数が読み出されていない、もしくは、全ての未確定の関連カテゴリについて推計モデルを構築している場合には、カテゴリ別目的変数推計モデル構築処理のステップ３５０７に進む。一方、医療費推計モデル構築部１４８が、推計モデルを構築していない未確定の関連カテゴリが存在する場合には、未確定カテゴリ推計モデル構築処理のステップ３５０６に進む。

未確定カテゴリ推計モデル構築処理のステップ３５０６は、医療費推計モデル構築部１４８の未確定カテゴリ推計モデル構築部１５０で実施される処理である。未確定カテゴリ推計モデル構築部１５０は、関連カテゴリ変数読出処理のステップ３５０３で読み出した関連カテゴリ変数及びツリーの情報と、データ分割ラベル付け処理のステップ３５０４で処理したラベル情報を用いて、未確定カテゴリ変数を推計する推計モデルを構築する。

このとき、未確定カテゴリ推計モデル構築部１５０は、推計モデルの構築対象の変数に関し、データ分割ラベル付け処理でラベル付けした情報に基づき、データを分割し、それぞれ推計モデルを構築する。未確定カテゴリ推計モデル構築部１５０は、例えば、図４２Ａに示すラベル付けテーブルを用いて、未確定カテゴリＡ＿Ｎ＋１に関する推計モデルを構築する場合、ラベルの値が同一であるデータに、整形データ３４０１を分割し、それぞれのデータについて、目的変数と説明変数の関係性を学習する。

実施例６では、上述のように、ラベルはｙとｎの二種類が存在するため、未確定カテゴリ推計モデル構築部１５０は、整形データ３４０１を二つに分割し、それぞれのデータから推計モデルを構築する。推計モデルの構築は、例えば多項ロジスティック回帰や、ＢｏｏｓｔｉｎｇＴｒｅｅなどの公知または周知の手法を用いることができる。

目的変数推計モデル構築処理のステップ３５０７では、医療費推計モデル構築部１４８の目的変数推計モデル構築部１４９が、関連カテゴリ変数読出処理のステップ３５０３で読み出した関連カテゴリ変数及びツリーの情報と、データ分割ラベル付け処理のステップ３５０４で処理したラベル情報を用いて、目的変数を推計する推計モデルを関連するカテゴリ変数の値ごとに構築する。

例えば、図４０Ａに示すラベル付けテーブル４０００を用いて、目的変数Ａ＿Ｎ＋１に関する推計モデルを構築する場合、目的変数推計モデル構築部１４９は、対象とするラベルの値が同一であるデータに、整形データ３４０１を分割し、それぞれのデータについて、目的変数と説明変数の関係性を学習する。

実施例６では、ラベルはｙとｎの二種類が存在するため、医療費推計モデル構築部１４８が整形データ３４０１を二つに分割し、それぞれのデータから推計モデルを構築する。例えば、医療費推計モデル構築部１４８は、図４２Ｄに示すラベル付けテーブル４２３０を用いて、目的変数ｙ１＿Ｎ＋１（４２５５）に関する推計モデルを構築する場合、（ｙ、ｙ）、（ｙ、ｎ）、（ｎ、ｙ）、（ｎ、ｎ）の４種類のラベルに基づき、整形データ３４０１を４つに分割し、それぞれのデータから推計モデルを構築する。推計モデルの構築は、例えば重回帰や多項ロジスティック回帰やＢｏｏｓｔｉｎｇＴｒｅｅなどの広く公知の手法を用いることができる。

上記処理で構築した未確定カテゴリ推計モデル及び目的変数推計モデルは、医療費推計モデル記憶部１６６に記憶する。

次に、図３５のステップ３５０８で行われる統合推計モデル構築処理について、以下に説明する。統合推計モデル構築処理では、まず、将来推計部１５１で処理を行った後に、推計情報集約部１５２で処理が行われる。

まず、将来推計部１５１の処理について説明する。将来推計部１５１では、医療費推計モデル記憶部１６６に記憶された推計モデルに基づき、個人（整形データ３４０１）毎の情報の将来推計を実施する。

図４３は、将来推計部１５１で実施する処理のフローチャートを示す図である。以下、各ステップについて説明する。

推計対象情報入力処理のステップ４３０１では、将来推計部１５１が、推計対象となるデータの情報と、目的変数の情報と、説明変数の情報と、推計に用いるモデルの情報などの必要な情報を入力部１０２から受け付ける。なお、推計対象のデータとしては、入力部１０２から入力された情報以外にも、予め整形データ記憶部１６３に記憶されたデータを用いてもよい。

モデル読出処理のステップ４３０２では、将来推計部１５１が、対象の目的変数と使用する説明変数に対応した目的変数推計モデル及び、未確定カテゴリ推計モデルを、医療費推計モデル記憶部１６６から読み出す。

データ分割処理のステップ４３０３では、データ分割情報記憶部１６５に記憶された、データ分割用のラベル情報を読み出す。

ステップ４３０４では、将来推計部１５１が、未推計の未確定カテゴリが存在するか否かを判定する。これは、将来推計部１５１が、モデル読出処理のステップ４３０１で読出した推計モデルの中に、未確定カテゴリ変数を推定するための推計モデル（以下、未確定カテゴリ変数推計モデル）が存在するか否かで判定できる。

将来推計部１５１は、未確定カテゴリ変数が存在し、当該変数の値が未確定である場合は、未確定カテゴリ推計処理のステップ４３０５に進む。一方、将来推計部１５１は、未推定の未確定カテゴリ変数が存在しない場合は、目的変数推計処理のステップ４３０６に進む。

未確定カテゴリ推計処理のステップ４３０５では、将来推計部１５１が、未確定カテゴリ変数推計モデルの中で、適用可能なものをひとつ選択し、適用する。適用は以下のふたつの場合分けで実施される。

ひとつ目の例を説明する。未確定カテゴリ推計モデルがひとつしか存在しない場合、将来推計部１５１は、当該未確定カテゴリ推計モデルを用いて、未確定カテゴリ変数を推計する。この場合、未確定カテゴリ変数は、他に関連カテゴリを持たない、あるいは、関連するカテゴリが全て確定済カテゴリである、のいずれかの条件を満たす。

未確定カテゴリ変数が関連カテゴリを持たない場合は、将来推計部１５１が全ての整形データ３４０１を用いて、説明変数から、未確定カテゴリの情報を推計する。未確定カテゴリ変数が関連するカテゴリをもつ場合は、将来推計部１５１は当該関連カテゴリの値ごとに整形データ３４０１を分割し、分割した各データに、各カテゴリの値に対応した未確定カテゴリ推計モデルを適用して、未確定カテゴリ変数を推計する。

ふたつ目の例を説明する。未確定カテゴリ推計モデルがふたつ以上存在する場合、未確定カテゴリ推計モデルの中に、未確定カテゴリに関連するカテゴリが未確定のものが含まれる場合がある。

例えば、未確定カテゴリ推計モデルＸと未確定カテゴリ推計モデルＹが存在し、推計モデルＸの推計対象が未確定カテゴリ変数Ｃであって、推計モデルＹの推計対象が未確定カテゴリ変数Ｄで、推計モデルＹに含まれる関連カテゴリがＣ、である場合を考える。

この場合、関連カテゴリＣは未確定であるため、このＣの値が確定しない限り、推計モデルＹを用いた推計を実施することができない。そこで、将来推計部１５１は、まず推計モデルＸを適用して、未確定カテゴリ変数Ｃに関する情報を推計し、次に推計した変数Ｃの情報に基づき、推計モデルＹを適用する。

このように、将来推計部１５１は、関連するカテゴリが未確定のものが含まれないものから順に推計することで、階層的に推計を実施する。具体的には、例えば、カテゴリ変数Ｃがｙとｎの２種類の値を取りうる情報である場合には、将来推計部１５１が、まず推計モデルＸを用いて、ｙの確率を０．６、ｎの確率を０．４、などと確率値を推計する。

次に、将来推計部１５１は、推計モデルＹを用いて、未確定カテゴリ変数Ｃがｙの場合の未確定カテゴリ変数Ｄの値Ｄｙと、未確定カテゴリ変数Ｃがｎの場合の未確定カテゴリ変数Ｄの値Ｄｎ、の二つの情報を推計する。

最後に将来推計部１５１は、これらの情報から期待値を計算し、０．６×Ｄｙ＋０．４×Ｄｎを未確定カテゴリ変数の推計値とする。なお、未確定カテゴリ変数の値の確率値を用いて推計する場合においても、他の確定カテゴリ変数に関しては、データ分割情報記憶部１６５に記憶されたラベル情報に基づき、将来推計部１５１は、データを分割して適用する。

次に、目的変数推計処理のステップ４３０６では、将来推計部１５１が目的変数推計モデルを適用する。目的変数推計モデルの適用は以下の三つの場合分けで実施される。

ひとつ目の例を説明する。目的変数推計モデルに関連カテゴリがひとつも存在しないとき、将来推計部１５１は全ての整形データ３４０１を用いて、説明変数から目的値の情報を推計する。

ふたつ目の例を説明する。目的変数推計モデルに含まれる関連カテゴリが全て確定カテゴリ変数である場合、将来推計部１５１は各カテゴリの値ごとに整形データ３４０１を分割し、分割した各データに、各カテゴリの値に対応した未確定カテゴリ推計モデルを適用して、未確定カテゴリ変数を推計する。

三つ目の例を説明する。目的変数推計モデルに含まれる関連カテゴリに未確定カテゴリ変数が含まれる場合、未確定カテゴリ変数推計モデルで推計した確率情報を用いて推計する。例えば、未確定カテゴリ推計モデルＹと目的変数推計モデルＺが存在し、未確定カテゴリ推計モデルＹの推計対象が未確定カテゴリ変数Ｄであって、目的変数推計モデルＺの推計対象が変数ｚ，目的変数推計モデルＺに含まれる関連カテゴリが未確定カテゴリ変数Ｄ、である場合を考える。

この場合、未確定カテゴリ変数Ｄは未確定であるため、この値が確定しない限り、目的変数推計モデルＺを用いた推計を実施することができない。そこで将来推計部１５１は、未確定カテゴリ推計モデルＹを用いて推計した未確定カテゴリ変数Ｄに関する確率情報を用いて、目的変数を推計する。具体的には、例えば、未確定カテゴリ変数Ｄがｙとｎの２種類の値を取りうる情報であって、未確定カテゴリ推計モデルＹによって推計された未確定カテゴリ変数Ｄの確率がｙの確率を０．３、ｎの確率を０．７、などの確率値であるとする。

このとき、まず将来推計部１５１は、目的変数推計モデルＺを用いて、未確定カテゴリ変数Ｄがｙの場合の目的変数ｚの値ｚｙと、未確定カテゴリ変数Ｄがｎの場合の目的変数ｚの値ｚｎの二つの情報を推計する。最後にこれらの情報から期待値を計算し、０．３×ｚｙ＋０．７×ｚｎを目的変数ｚの推計値とする。

本推計処理で推計した個人毎の推計情報は、整形データ３４０１と合わせて、推計情報記憶部１６８に記憶される。

次に、人口動態補正ステップ９１１では、死亡推計部１２３が、ステップ９１０で構築されて死亡推計モデル記憶部１３９に格納されている死亡推計モデルを用いて、対象年度において住民の生死を個人別に推定する。また、転出推計部１２４は、ステップ９１０で構築されて転出推計モデル記憶部１４０に格納されている転出推計モデルを用いて、対象年度において当該自治体から住民が転出するかを個人別に推定する。そして、人口動態補正部１２５が、死亡推計部１２３及び転出推計部１２４が推定した当該年度の推定結果を用いて、目的変数である医療費の推計結果を補正する。なお、死亡推計部１２３、転出推計部１２４及び人口動態補正部１２５は、人口動態補正切替欄８３０の設定にかかわらず介護度及び介護費の推計結果の人口動態補正データを生成するが、図４５の推計結果表示画面４５００の人口動態補正切替欄８３０で「人口動態補正あり」が選択されている場合に、推計結果集計ステップ９０６の中で介護度の推計結果の人口動態補正データを生成してもよい。

次に、推計情報集約部１５２の処理について説明する。将来推計部１５１では、推計情報記憶部１６８に記憶された個人毎の推計結果を、ある特定のカテゴリ変数に基づいて集約し、集団毎の推計結果を生成する。

図４６は、推計情報集約部１５２で実施される処理の一例を示すフローチャートを示す図である。以下、各ステップについて説明する。

推計情報読出のステップ４６０１では、推計情報集約部１５２が、推計情報記憶部１６８に記憶された推計結果の情報を読み出す。

集約指標決定のステップ４６０２では、推計情報集約部１５２が、推計情報記憶部１６８から読出した推計結果の情報を集約する指標を決定する。推計情報集約部１５２は、指標として、推計結果の情報と合わせて記憶された個人毎の整形データ３４０１に含まれる少なくともひとつ以上のカテゴリ変数を、集約する指標として決定する。指標としては、例えば、個人毎の基本情報に含まれる性別や年齢を１０歳ごとに階級化した情報や、介護保険の階級や、住所情報から取得した所在地に関する情報、などが挙げられる。

集約方法決定のステップ４６０３では、推計情報集約部１５２が、集約指標決定のステップ４６０２で決定したカテゴリ変数に関して、推計情報をどのように集計するかを決定する。例えば、カテゴリ変数毎に集約した情報の合計、平均、最大値、最小値、中央値、最頻値、標準偏差などの集計方法を決定する。

集約処理のステップ４６０４では、推計情報集約部１５２が、集約指標決定のステップ４６０２で決定した集約指標を、集約方法決定のステップ４６０３で決定した集計方法で、推計情報を集計する。集計した結果は、推計情報記憶部１６８に記憶する。

将来推計端末１０１が出力部１０３に表示するグラフィカルユーザインターフェイスの一例を以下に示す。

図４４は、実施例６を実現する操作画面の一例を示すグラフィカルユーザインターフェイスの図である。図示の例では、整形データ３４０１を選択し、選択した整形データ３４０１の推計モデルを構築し、構築した推計モデルのパラメータ及びアーキテクチャに関する情報を表示するための操作画面４４００の一例を示す。

図中４４０１は、整形データ３４０１を選択するためのボタンである。４４０２は推計モデル構築処理を実行するためのボタンである。４４０３は、推計モデルのパラメータ及びアーキテクチャを画面上に表示するためのボタンである。

図中４４０４は、推計モデルで用いられる目的変数と、説明変数と、カテゴリ変数の情報を表示する表である。

図中４４０５は、推計モデルに含まれる目的変数推計モデルの中の目的変数推定用パラメータの情報をカテゴリ変数の値による分類ごとに表示する表である。４４０６は、推計モデルに含まれる未確定カテゴリ変数推計モデルの中の、未確定カテゴリ変数推定用パラメータの情報をカテゴリ変数の値による分類ごとに表示する表である。４４０７は、推計モデルのアーキテクチャとして、使用された説明変数と、目的変数と、カテゴリ変数との関係性をグラフにより可視化する表示領域である。

表示領域４４０７は、カテゴリ変数を四角、説明変数を丸の図形で示し、説明変数と目的変数の関係性を矢印で表している例を示している。

将来推計端末１０１のユーザは実施例６で示す操作画面４４００を用いることにより、推計モデルの構築に必要な整形データ３４０１を選択できる。そして、将来推計端末１０１は、選択した整形データに基づき、推計モデルの構築処理を実行できる。ユーザは、操作画面４４００を用いることで、構築した推計モデルの説明変数や、目的変数や、カテゴリ変数などの各種パラメータと、関係性であるモデルのアーキテクチャを把握できる。

図４５は実施例６を実現する推計結果表示画面４５００の一例を示すグラフィカルユーザインターフェイスの図である。推計結果表示画面４５００は、推計モデルを用いて推計結果を表示するための画面の例を示す。

図中４５０１は、推計結果を選択するためのボタンである。４５０２は推定した結果を、年代（または年度）ごとに集約して表示するための表である。図示の例では、２０１５年度の情報に基づいて、２０１６年度と２０１７年度の２型糖尿病の医療費を推計した結果を表示する例を示している。

図中４５０３は、集計対象を指定するためのプルダウンであり、プルダウン４５０３で指定された集計対象に応じて、推計情報集約処理が実行され、画面内の情報が更新される。４５０４は、読み出す推定結果の目的変数を指定するためのプルダウンである。プルダウン４５０４で指定された対象疾病の情報を画面内の情報として表示する。

図中８３０は、図４３のステップ９１１に示す人口動態補正を実行するかを切り替えるために操作される人口動態補正切替欄である。人口動態補正切替欄８３０の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。

図中４５０５は、プルダウン４５０３で指定された集計対象で、プルダウン４５０４で指定された疾病の推計結果を集計した結果を表示するためのグラフ表示領域である。４５０６は、４５０３で指定した集計対象で、４５０４で指定した疾病の集計結果を地図として表示するための地図表示領域である。

実施例６において、実施例３～５のいずれかを組み合わせて介護費と医療費を推計してもよい。

図４７は、介護費と医療費の推計結果を表示する推計結果表示画面４７００の一例を示すグラフィカルユーザインターフェイスの図である。推計結果表示画面４７００は、推計モデルを用いて推計結果を表示するための画面の例であり、対策介護度選択欄２４１０、人口動態補正切替欄８３０、介護施策選択タブ表示欄２４２０、施策効果推計対象者の選定欄２４３０、施策効果推計結果表示欄２４４０及び集計条件入力欄８１０を含む。

対策介護度選択欄２４１０は、入力部１０２で対策が必要な介護度（目的変数）をユーザに選択させる欄である。図示する例では、対策が必要な介護度（目的変数）として、「要支援１以上」が選択されている。

人口動態補正切替欄８３０は、図４３のステップ９１１に示す人口動態補正を実行するかを切り替えるために操作される入力欄である。人口動態補正切替欄８３０の下向き三角を操作して表示されるドロップダウンリストによって、「人口動態補正あり」の推計結果と「人口動態補正なし」の推計結果とを切り替え可能となっている。

施策効果推計対象者の選定欄２４３０は、施策実施率（健診受診率）設定欄４７０１を含む。施策実施率（健診受診率）設定欄４７０１には、地域（集計対象の住所）毎の施策実施率の現在の値が表示され、シミュレーションする施策実施率の変更後の値がプルダウンで設定可能となっている。

施策効果推計結果表示欄２４４０は、介護費推計結果表示欄４７０２及び医療費推計結果表示欄４７０３を含む。

介護費推計結果表示欄４７０２については、施策効果推計部１１０が、施策効果推計対象者の選定欄２４３０で選択された全ての対象者について、Ｔ＋ｎ年度の介護費を集計し、施策実施率表示欄２４３１に表示された現在の実施率の場合のＴ＋ｎ年度の介護費及び設定された実施率の場合のＴ＋ｎ年度の介護費を算出する。さらに、実施率が０％の場合のＴ＋ｎ年度の介護費と、算出された各介護費との差分を算出し、現在の実施率の場合のＴ＋ｎ年度の介護費の抑制額４７０４及び設定された実施率の場合のＴ＋ｎ年度の介護費の抑制額４７０５を表示する。

医療費推計結果表示欄４７０３については、同様に将来推計部１５０が、施策効果推計対象者の選定欄２４３０で選択された全ての対象者について、Ｔ＋ｎ年度の医療費を集計し、施策実施率表示欄２４３１に表示された現在の実施率の場合のＴ＋ｎ年度の医療費及び設定された実施率の場合のＴ＋ｎ年度の医療費を算出する。さらに、実施率が０％の場合のＴ＋ｎ年度の医療費と、算出された各医療費との差分を算出し、現在の実施率の場合のＴ＋ｎ年度の医療費の抑制額４７０６及び設定された実施率の場合のＴ＋ｎ年度の医療費の抑制額４７０７を表示する。

集計条件入力欄８１０は、施策効果推計結果表示欄２４４０に表示する対象者の条件を入力する欄である。図示する例では、Ｔ年度の年齢入力欄８１２、住所入力欄８１３及び健診対象入力欄８１４を設けているが、整形データ４００、１３００に格納されているＴ年度の任意のデータ項目を条件として入力する欄を設けてもよい。図示する例では、年齢入力欄８１２に４０歳以上、住所入力欄８１３にＡ市、健診対象入力欄８１４に１（対象者）が入力されている。

以下、実施例６に係る推計モデル構築システムの効果を説明する。

実施例６に示した推計モデル構築システムは、目的変数を推計するモデルを構築する際に、説明変数に含まれる変数の中で、任意のカテゴリ変数に関して、カテゴリ変数の値が同一のデータ毎にデータを分割し、それぞれのデータから推計モデルを構築することができる。これにより、属性や既往歴等の背景が異なる個体から構成された集団を推計する場合に、推計精度を向上することができる。

実施例６に示した推計モデル構築システムは、カテゴリ変数の値に基づいてデータを分割してモデルを構築する際、推計時にこのカテゴリ変数の値が確定した値であるか、それとも未確定の値であるか否かを判定する。

推計モデル構築システムは、推計時にカテゴリ変数の値が未確定の場合は、カテゴリ変数を推計するモデルと、目的変数を推計するモデルをふたつ構築する。これにより、推計時にカテゴリ変数の値が未確定な場合でも、高い推計精度で推計することができる。例えば、ある年度の、ある疾病に関する医療費を推計する場合に、ある年度の疾病の有無の情報をカテゴリ変数とし、この疾病の有無の情報を推計するモデルと、医療費を推計するモデルのふたつの推計モデルを構築し、それらを階層的に適用することで、医療費を高い精度で推計できる。また、医療費と疾病の有無の情報の二つを同時に推計できる。

実施例６に示した推計モデル構築システムは、カテゴリ変数の値に基づいて、それぞれモデルを構築するため、カテゴリ変数の値ごとに構築したモデルのパラメータを把握できる。これにより、ある特定の群に関し、興味のある目的変数に影響している変数をそれぞれのモデルから把握することができる。

実施例６に示した推計モデル構築システムは、個人毎に集計した情報を任意のカテゴリ変数で集約し、集団の推計を実施することができる。これにより、ユーザが所望する所定の粒度で、集団の将来の健康状態や医療状態を把握することが出来る。

以下、実施例６に係る推計モデル構築システムの変形例を説明する。

実施例６では、対象とするデータとして、個人毎のレセプト情報及び特定健診情報が時系列で含まれたデータを用いた例を説明し、さらに、これらの情報を年度毎に集約し、年度単位に推計するモデルを構築する例を説明したが、実施例６で扱うことの出来るデータはこれに限定されない。

例えば、健康情報に関するセンシング情報や、保険に関する情報など、広く健康や医療あるいは介護に関する情報を扱うことができる。また、情報を集約する時間間隔も、四半期ごと、月ごと、など、広く様々な時間間隔のモデルを構築することができる。また、実施例６の推計モデル構築システムは、定期的な試験の結果などに基づいて教育分野に適用することができる。

実施例６では、推計モデルとして、様々な推計モデルを扱うことができる。例えば、カテゴリ変数の情報を推計するモデルとしては、ロジスティック回帰やニューラルネットワークなどの、説明変数と目的変数の関係性を式で記述したモデルや、サポートベクトルマシンやＫＮＮ（k-nearest neighbor algorithm）のように、モデル構築データの部分集合をパラメータ化して保持するモデルや、ベイジアンネットワークのように、説明変数と目的変数の確率的な依存関係を保持するモデルや、ランダムフォレストのように、いくつかの分類ルールを集約したモデル、など、様々なモデルを推計モデルとして活用することができる。

実施例６では、目的変数に関するカテゴリ変数を指定する方法として、関連カテゴリマトリクス３７０１を用いる方法を説明したが、関連カテゴリマトリクス３７０１以外の方法を用いて、目的変数に関連するカテゴリ変数を読み出してもよい。例えば、関連カテゴリ変数読出処理で構築する目的変数と関連カテゴリ変数群の関係性を示したツリー構造を、事前に構築し、記憶しておき、当該情報を直接用いて、関連カテゴリ変数を読み出してもよい。

実施例６では、個人毎に推計する推計モデルを構築し、推計した結果を、所定のカテゴリに基づき集団として推計する例を示したが、推計は個人よりも大きな粒度で実施してもよい。例えば、市単位で集約した情報に関して推計する推計モデルを構築してもよい。

以上のように、実施例６に係る推計モデル構築システムは、カテゴリ変数毎の推計モデル構築処理、及び、推定時に未確定のカテゴリ変数を推計する推計モデル構築処理を構築し、背景の異なる人の混在した集団においても、精度の高い将来推計が可能な推計モデルを構築することができる。

＜実施例７＞
実施例６では、推計対象の目的変数と関連するカテゴリ変数が、事前に関連カテゴリ記憶部１６４に記憶された推計モデル構築システムの例を説明した。実施例７では、整形データ３４０１に基づき、目的変数と関連するカテゴリ変数を決定するための処理を実行する推計モデル構築システムの例を説明する。構成や処理などは、関連カテゴリ関連付け部１５３を除き、前記実施例６と同様であるため、重複した説明を省略する。

関連カテゴリ関連付け部１５３では、整形データ記憶部１６３に記憶された整形データ３４０１と、目的変数の情報を用いて、目的変数に関するカテゴリ変数の項目を決定する。

以下、カテゴリ変数の項目の決定方法を説明する。

一つ目の例を説明する。目的変数と同一の項目であって、過去の時系列で取得された情報を、目的変数と関連するカテゴリ変数とする。例えば、目的変数がある年度の疾病の受診の有無である場合に、過去の年度の同じ疾病の受診の有無を、目的変数と関連するカテゴリ変数として指定する。

例えば、将来のある疾病の受診の有無は、現在の疾病の受診状況に大きく依存するという関係性を有する。そこで、現在の疾病の受診状況に応じて、推計モデルを分離することで、推計精度を向上する。

二つ目の例を説明する。目的変数と同じ時期の情報であって、目的変数との類似度の高い変数をカテゴリ変数として選択する。例えば、相関や相互情報量が一定（閾値）以上の項目を、カテゴリ変数として選択する。例えば、同じ年度のある疾病の医療費に関連するカテゴリ変数として、同じ疾病の受診の有無の情報をカテゴリ変数として指定する。これにより、他の変数に依存した変数の推計精度を向上することができる。

三つ目の例を説明する。ある変数を仮の関連カテゴリ変数として設定し、当該変数に関して、関連カテゴリ変数の値が同一のデータ毎に分割した整形データ３４０１からそれぞれ目的変数を推計する推計モデルを構築し、それらの推計モデルを用いて目的変数を推計した結果と、整形データ３４０１を分割せずに単一の推計モデルで推計した結果、または異なるカテゴリ変数で整形データ３４０１を分割し、構築した推計モデルで推計した結果、のいずれかを比較し、推計の比較結果（推計精度）に基づいて、関連カテゴリ変数を決定する。推計精度の比較は、例えば、過去の整形データ３４０１を用いた交差検証により実施することができる。

以下、実施例７に係る推計モデル構築システムの効果を説明する。

実施例７に示した推計モデル構築システムは、整形データ３４０１に基づき、推計モデル構築の対象とする整形データ３４０１の分割方法を決定することができる。これにより、例えば整形データ３４０１に含まれる情報の質が変化した場合であっても、当該整形データ３４０１に適切な推計モデルを自動的に構築することが可能となる。

以上に説明したように、本発明に実施例の将来推計システムは、所定の集団の複数の構成員の各々の第１時点及び第２時点の状況を示す時系列データ（例えば、介護データ記憶部１３１の介護データ２００、データ記憶部１６１の医療費データ）と構成員の属性を示す構成員データ（例えば住民データ記憶部１３２の住民データ３００）とを個人単位で連結して、前記第１時点及び前記第２時点の整形データ４００、１３００、３４０１を作成するデータ整形部１１１と、第１時点の前記整形データを説明変数として目的変数別の回帰分析によって生成された回帰式からなる推計モデルに第２時点の前記整形データを入力して、第３時点の時系列データを推計するデータ推計部（介護度推計部１１４、介護費推計部１１７、将来推計部１５１）と、構成員の各々が前記所定の集団に所属しなくなる確率を推計する動態推計部（死亡推計部１２３、転出推計部１２４）と、動態推計部による推計結果を用いて、データ推計部が推計した時系列データを補正する人口動態補正部１２５とを有するので、構成員の動態を考慮して将来の状況（例えば、介護度、介護費、疾病発症数、医療費など）を高精度に推計できる。また、構成員の動態に応じて、個人単位で推計結果を補正するので、任意の集団の将来の状況を高精度に予測できる。

また、動態推計部は、第１時点の整形データを説明変数として構成員の死亡を目的変数とした回帰分析によって生成された回帰式からなる死亡推計モデルに第２時点の整形データを入力して、第３時点の前記構成員の死亡の確率を推計する死亡推計部１２３と、第１時点の整形データを説明変数として構成員の転出を目的変数とした回帰分析によって生成された回帰式からなる転出推計モデルに第２時点の整形データを入力して、第３時点の構成員の転出の確率を推計する転出推計部１２４とを含み、人口動態補正部１２５は、死亡推計部１２３による推計結果及び転出推計部１２４による推計結果を用いて、データ推計部が推計した時系列データを補正するので、自治体の人口の動態の主要因である死亡と転出を正確に推計できる。

また、第１時点の整形データを説明変数として構成員の死亡を目的変数とした回帰分析によって回帰式からなる死亡推計モデルを生成する死亡推計モデル構築部１２１と、第１時点の前記整形データを説明変数として構成員の転出を目的変数とした回帰分析によって回帰式からなる転出推計モデルを生成する転出推計モデル構築部１２２とを有するので、自治体における主要な人口動態変化である住民の死亡と転出を正確に推計できる。

また、時系列データが示す構成員の状況は、要介護度、介護費、及び医療費の少なくとも一つであって、データ推計部は、第３時点の要介護度、介護費、及び医療費の少なくとも一つを推計するので、自治体において介護度及び介護費を正確に推計し、効果的な介護施策を立案し実行できる。

また、前記データ推計部が推計した前記時系列データと、前記動態補正部が前記時系列データを補正したデータとを切り替えて表示する集計部（推計結果集計部１１５、推計情報集約部１５２）を有するので、人口動態を補正しない場合と、補正した場合の予測結果を容易に比較分析でき、効果的な介護施策を立案し実行できる。

また、集計部は、データ推計部が推計した時系列データに基づく施策効果と、前記動態補正部が前記時系列データを補正したデータに基づく施策効果とを切り替えて表示するので、人口動態を補正しない場合と、補正した場合の施策効果を容易に比較分析でき、効果的な介護施策を立案し実行できる。

なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。

また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶装置、又は、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に格納することができる。

また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

１０１将来推計端末
１０２入力部
１０３出力部
１０４ＣＰＵ
１０５メモリ
１０６記憶媒体
１１０施策効果推計部
１１１データ整形部
１１２二値化処理部
１１３介護度推計モデル構築部
１１４介護度推計部
１１５推計結果集計部
１１６介護費推計モデル構築部
１１７介護費推計部
１１８説明変数抽出部
１１９入力値変更部
１２０モデル構築用データ作成部
１２１死亡推計モデル構築部
１２２転出推計モデル構築部
１２３死亡推計部
１２４転出推計部
１２５人口動態補正部
１３０データベース
１３１介護データ記録部
１３２住民データ記憶部
１３３整形データ記憶部
１３４介護度推計モデル記憶部
１３５推計結果記憶部
１３６医療データ記憶部
１３７健診データ記憶部
１３８介護費推計モデル記憶部
１３９死亡推計モデル記憶部
１４０転出推計モデル記憶部
１４８医療費推計モデル構築部
１４９目的変数推計モデル構築部
１５０未確定カテゴリ推計モデル構築部
１５１将来推計部
１５２推計情報集約部
１５３関連カテゴリ関連付け部
１６０データベース
１６１データ記憶部
１６３整形データ記憶部
１６４関連カテゴリ記憶部
１６５データ分割情報記憶部
１６６医療費推計モデル記憶部
１６７医療費推計モデル構築用変数群記憶部
１６８推計情報記憶部

Claims

将来の状況を推計する将来推計システムであって、
所定の処理を実行する演算装置と、データが入力される入力部と、前記演算装置がアクセス可能な記憶装置とを備え、
前記入力部は、所定の集団の複数の構成員の各々の第１時点及び第２時点の状況を示す時系列データ及び前記構成員の属性を示す構成員データの入力を受け、
前記将来推計システムは、
前記演算装置が、前記時系列データと前記構成員データとを個人単位で連結して、前記第１時点及び前記第２時点の整形データを作成するデータ整形部と、
前記演算装置が、前記第１時点の前記整形データを説明変数として目的変数別の回帰分析によって生成された回帰式からなる推計モデルに前記第２時点の前記整形データを入力して、第３時点の時系列データを推計するデータ推計部と、
前記演算装置が、前記構成員の各々が前記所定の集団に所属しなくなる確率を推計する動態推計部と、
前記演算装置が、前記動態推計部による推計結果を用いて、前記データ推計部が推計した前記時系列データを補正する動態補正部とを有することを特徴とする将来推計システム。
請求項１に記載の将来推計システムであって、
前記動態推計部は、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の死亡を目的変数とした回帰分析によって生成された回帰式からなる死亡推計モデルに前記第２時点の前記整形データを入力して、第３時点の前記構成員の死亡の確率を推計する死亡推計部と、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の転出を目的変数とした回帰分析によって生成された回帰式からなる転出推計モデルに前記第２時点の前記整形データを入力して、第３時点の前記構成員の転出の確率を推計する転出推計部とを含み、
前記動態補正部は、前記死亡推計部による推計結果及び前記転出推計部による推計結果を用いて、前記データ推計部が推計した前記時系列データを補正することを特徴とする将来推計システム。
請求項２に記載の将来推計システムであって、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の死亡を目的変数とした回帰分析によって回帰式からなる死亡推計モデルを生成する死亡推計モデル構築部と、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の転出を目的変数とした回帰分析によって回帰式からなる転出推計モデルを生成する転出推計モデル構築部とを有することを特徴とする将来推計システム。
請求項１に記載の将来推計システムであって、
前記時系列データが示す構成員の状況は、要介護度、介護費、及び医療費の少なくとも一つであって、
前記データ推計部は、第３時点の要介護度、介護費、及び医療費の少なくとも一つを推計することを特徴とする将来推計システム。
請求項１に記載の将来推計システムであって、
前記演算装置が、前記データ推計部が推計した前記時系列データと、前記動態補正部が前記時系列データを補正したデータとを切り替えて表示するためのデータを出力する集計部を有することを特徴とする将来推計システム。
請求項５に記載の将来推計システムであって、
前記集計部は、前記データ推計部が推計した前記時系列データに基づく施策効果と、前記動態補正部が前記時系列データを補正したデータに基づく施策効果とを切り替えて表示するためのデータを出力することを特徴とする将来推計システム。
計算機システムが将来の状況を推計する方法であって、
前記計算機システムは、所定の処理を実行する演算装置と、前記演算装置がアクセス可能な記憶装置とを備え、
前記方法は、
前記演算装置が、所定の集団の複数の構成員の各々の第１時点及び第２時点の状況を示す時系列データ及び前記構成員の属性を示す構成員データの入力を受ける入力手順と、
前記演算装置が、前記時系列データと前記構成員データとを個人単位で連結して、前記第１時点及び前記第２時点の整形データを作成するデータ整形手順と、
前記演算装置が、前記第１時点の前記整形データを説明変数として目的変数別の回帰分析によって生成された回帰式からなる推計モデルに前記第２時点の前記整形データを入力して、第３時点の時系列データを推計するデータ推計手順と、
前記演算装置が、前記構成員の各々が前記所定の集団に所属しなくなる確率を推計する動態推計手順と、
前記演算装置が、前記動態推計手順における推計結果を用いて、前記データ推計手順で推計された前記時系列データを補正する動態補正手順とを含むことを特徴とする方法。
請求項７に記載の方法であって、
前記動態推計手順は、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の死亡を目的変数とした回帰分析によって生成された回帰式からなる死亡推計モデルに前記第２時点の前記整形データを入力して、第３時点の前記構成員の死亡の確率を推計する死亡推計手順と、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の転出を目的変数とした回帰分析によって生成された回帰式からなる転出推計モデルに前記第２時点の前記整形データを入力して、第３時点の前記構成員の転出の確率を推計する転出推計手順とを含み、
前記動態補正手順では、前記演算装置が、前記死亡推計手順における推計結果及び前記転出推計手順における推計結果を用いて、前記データ推計手順において推計された前記時系列データを補正することを特徴とする方法。
請求項８に記載の方法であって、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の死亡を目的変数とした回帰分析によって回帰式からなる死亡推計モデルを生成する死亡推計モデル構築手順と、
前記演算装置が、前記第１時点の前記整形データを説明変数として前記構成員の転出を目的変数とした回帰分析によって回帰式からなる転出推計モデルを生成する転出推計モデル構築手順とを含むことを特徴とする方法。
請求項７に記載の方法であって、
前記時系列データが示す構成員の状況は、要介護度、介護費、及び医療費の少なくとも一つであって、
前記データ推計手順では、前記演算装置が、第３時点の要介護度、介護費、及び医療費の少なくとも一つを推計することを特徴とする方法。
請求項７に記載の方法であって、
前記演算装置が、前記データ推計手順で推計された前記時系列データと、前記動態補正手順において前記時系列データを補正したデータとを切り替えて表示するためのデータを出力する集計手順を含むことを特徴とする方法。
請求項１１に記載の方法であって、
前記集計手順では、前記データ推計手順において推計された前記時系列データに基づく施策効果と、前記動態補正手順において前記時系列データを補正したデータに基づく施策効果とを切り替えて表示するためのデータを出力することを特徴とする方法。