JP2018194904A

JP2018194904A - 予測システム、予測方法、および予測プログラム

Info

Publication number: JP2018194904A
Application number: JP2017095794A
Authority: JP
Inventors: 悠輔巣籠; Yusuke Sugome; 亮一草間; Ryoichi Kusama; 聖吾原; Seigo Hara
Original assignee: Joho Iryo Co Ltd
Current assignee: Joho Iryo Co Ltd
Priority date: 2017-05-12
Filing date: 2017-05-12
Publication date: 2018-12-06
Anticipated expiration: 2037-05-12
Also published as: JP6929124B2

Abstract

【課題】対象者の将来の状態をより精度良く予測することを目的とする。【解決手段】一実施形態に係る予測システムは取得部、変換部、および予測部を備える。取得部は、対象者の過去の受診記録を所定のデータベースから取得する。受診記録は少なくとも医療処置を示す。変換部は、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する。その要素群は、医療処置を示す要素を少なくとも含む、予測部は、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める。出力ベクトルの要素群は入力ベクトルの要素群に対応する。【選択図】図２

Description

本発明の一側面は予測システム、予測方法、および予測プログラムに関する。

医療または人の健康を管理するための様々なコンピュータシステムが知られている。例えば下記の特許文献１には、対象者の健康状態の推移を予測する医療データ解析装置が記載されている。この解析装置は、異なる種類のデータが頻度要素として混在するバグオブワードの形で与えられた一連の対象者の一連の年代における医療データを、対象者及び年代ごとの個別データの集まりとして、深層学習を適用する。そして、解析装置は、各中間層における当該個別データの表現データを、異なる種類のデータが頻度要素として混在するバグオブワードの圧縮表現として出力する。

特開２０１７−２７３０７号公報

人の健康状態を予測する手法は知られている。しかし、その状態をより精度良く予測することができれば便利であり、さらに、その予測結果に基づいて様々な更なる情報を得ることも可能になる。そのため、対象者の将来の状態をより精度良く予測する仕組みが望まれている。

本発明の一側面に係る予測システムは、対象者の過去の受診記録を所定のデータベースから取得する取得部であって、該受診記録が少なくとも医療処置を示す、該取得部と、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換部であって、要素群が、医療処置を示す要素を少なくとも含む、該変換部と、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測部であって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測部とを備える。

本発明の一側面に係る予測方法は、少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、要素群が、医療処置を示す要素を少なくとも含む、該変換ステップと、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測ステップとを含む。

本発明の一側面に係る予測プログラムは、対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、要素群が、医療処置を示す要素を少なくとも含む、該変換ステップと、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測ステップとをコンピュータシステムに実行させる。

このような側面においては、対象者の受診記録を表現した入力ベクトルを正規化してからその入力ベクトルを学習アルゴリズムに入力することで、対象者の将来の状態の予測を示す出力ベクトルが得られる。入力ベクトルは医療処置を示す要素を少なくとも含み、出力ベクトルはその入力ベクトルに対応する。医療処置を示す要素を少なくとも含む出力ベクトルを出力することで、対象者の状態をより精度良く予測することができる。

本発明の一側面によれば、対象者の将来の状態をより精度良く予測することができる。

実施形態に係る予測システムで用いられるコンピュータのハードウェア構成を示す図である。実施形態に係る予測システムの機能構成を示す図である。実施形態に係る予測システムの動作を示すフローチャートである。実施形態に係る予測プログラムの構成を示す図である。

以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。

実施形態に係る予測システム１０は、対象者の将来の状態を予測するコンピュータシステムである。例えば、予測システム１０は、対象者がいつどのような医療処置を受けるかを予測したり、対象者の身体の状態が将来どのようになるかを予測したりする。「医療処置」とは医療機関が患者に対して行う処置であって、例えば診察、治療、薬の処方の少なくとも一つを含む。より具体的には、医療処置は医療に関する資格を有する者（例えば、医者、看護師、薬剤師など）により施される。人（患者）が医療処置を受けることを「受診」という。「対象者」とは、予測処理の対象となる人（患者）である。

図１は予測システム１０を構成するコンピュータ１００の一般的なハードウェア構成を示す。例えば、コンピュータ１００はプロセッサ１０１、主記憶部１０２、補助記憶部１０３、通信制御部１０４、入力装置１０５、および出力装置１０６を備える。プロセッサ１０１はオペレーティングシステムおよびアプリケーション・プログラムを実行する。主記憶部１０２は例えばＲＯＭおよびＲＡＭで構成される。補助記憶部１０３は例えばハードディスクまたはフラッシュメモリで構成され、一般に主記憶部１０２よりも大量のデータを記憶する。通信制御部１０４は例えばネットワークカードまたは無線通信モジュールで構成される。入力装置１０５は例えばキーボード、マウス、タッチパネルなどで構成される。出力装置１０６は例えばモニタおよびスピーカで構成される。

予測システム１０の各機能要素は、プロセッサ１０１または主記憶部１０２の上に所定のソフトウェア（例えば、後述する予測プログラムＰ１）を読み込ませてそのソフトウェアを実行させることで実現される。プロセッサ１０１はそのソフトウェアに従って、通信制御部１０４、入力装置１０５、または出力装置１０６を動作させ、主記憶部１０２または補助記憶部１０３におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部１０２または補助記憶部１０３内に格納される。

予測システム１０は１台のコンピュータで構成されてもよいし、複数台のコンピュータで構成されてもよい。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネットやイントラネットなどの通信ネットワークを介して接続されることで、論理的に一つの予測システム１０が構築される。

予測システム１０はインターネットやイントラネットなどの通信ネットワークを介してデータベース群２０にアクセスすることができる。データベース群２０は、人々の受診記録を記憶するデータベースの集合である。データベースは、プロセッサまたは外部のコンピュータからの任意のデータ操作（例えば、抽出、追加、削除、上書きなど）に対応できるようにデータ集合を記憶する機能要素または装置である。データベースの実装方法は限定されないが、例えばデータベース管理システム（ＤＢＭＳ）が用いられてもよい。「受診記録」とは、人が過去に受けた医療処置を少なくとも示すデータである。

図２に示すように、本実施形態ではデータベース群２０はレセプトデータベース２１、健診データベース２２、およびアンケートデータベース２３を含む。レセプトデータベース２１、健診データベース２２、およびアンケートデータベース２３が設けられる位置は限定されない。例えば、これらのデータベースの少なくとも一部が予測システム１０とは異なるコンピュータシステムにより管理されてもよいし、予測システム１０の一部であってもよい。また、各データベースの管理主体も限定されない。例えば、予測システム１０の運営者が他の機関からデータを提供されて、これらのデータの集合をデータベース群２０として管理してもよい。

レセプトデータベース２１は、人が過去に受けた医療処置を示すレセプトデータを記憶するデータベースである。例えば、レセプトデータは医療機関で生成されてレセプトデータベース２１に蓄積される。レセプトデータベース２１は各医療機関のレセプトデータベースの集合であってもよいし、各医療機関のレセプトデータが集約された一つのデータベースであってもよい。

レセプトデータの各レコードは対象者ＩＤ、対象者の属性、医療機関ＩＤ、受診日、および医療処置の詳細を含む。対象者ＩＤは医療処置を受けた人を一意に特定する識別子である。対象者の属性は、対象者の性質または特徴を示すデータであり、例えば性別および年齢である。医療機関ＩＤは医療処置を施した医療機関を一意に特定する識別子である。受診日は医療処置が実施された日にちである。医療処置の詳細は１以上の診察項目、１以上の治療項目、および１以上の処方薬を示すデータである。処方薬を示すデータは、薬の種類、用量、および投与日数を含む。診察、治療、および処方薬はいずれも非常に多くの種類が存在するので、医療処置の詳細は非常に多くの（例えば数千、数万の）データ項目を含み得る。

健診データベース２２は、人が過去に受けた健康診断の結果を示す健診データを記憶するデータベースである。例えば、健診データは医療機関で生成されて健診データベース２２に蓄積される。レセプトデータベース２１と同様に、健診データベース２２は各医療機関の健診データベースの集合であってもよいし、各医療機関の健診データが集約された一つのデータベースであってもよい。

健診データの各レコードは対象者ＩＤ、対象者の属性、医療機関ＩＤ、健診日、および検査結果を含む。対象者ＩＤは健康診断を受けた人を一意に特定する識別子である。対象者の属性についてはレセプトデータと同様である。医療機関ＩＤは健康診断を実施した医療機関を一意に特定する識別子である。健診日は健康診断が実施された日にちである。検査結果は健康診断の結果であり、より具体的には複数の検査値の集合である。健康診断は様々な検査項目（例えば、法定の各種項目および非法定の各種項目の少なくとも一方）を含むので、検査結果は多数の（例えば数十、数百の）データ項目を含み得る。

アンケートデータベース２３は、人が過去に回答した健康に関するアンケート結果を示すアンケートデータを記憶するデータベースである。健康に関するアンケートの例として、企業で実施されるストレスチェック、健康診断時に実施される生活習慣に関するアンケートなどが挙げられるが、アンケートの内容はこれらに限定されない。アンケートデータは企業または医療機関で生成されてアンケートデータベース２３に蓄積される。レセプトデータベース２１と同様に、アンケートデータベース２３は各企業または各医療機関のアンケートデータベースの集合であってもよいし、各企業または各医療機関のアンケートデータが集約された一つのデータベースであってもよい。

アンケートデータの各レコードは対象者ＩＤ、実施機関ＩＤ、回答日、およびアンケート結果を含む。対象者ＩＤはアンケートに回答した人を一意に特定する識別子である。実施機関ＩＤはアンケートを実施した機関（例えば企業または医療機関）を一意に特定する識別子である。回答日はアンケートの回答が記入された日である。アンケート結果は複数の回答を示すデータであり、例えばストレスチェック、生活習慣、意識調査などについての様々な回答を含む。

図２は予測システム１０の機能構成を示す。図２に示すように、予測システム１０は機能的構成要素として取得部１１、変換部１２、および予測部１３を備える。

取得部１１は、対象者の過去の受診記録を取得する機能要素である。自動的にまたは予測システム１０のオペレータにより対象者ＩＤが入力されると、取得部１１はこの対象者ＩＤに対応する受診記録をデータベース群２０から読み出す。具体的には、取得部１１はその対象者ＩＤに対応するレセプトデータ、健診データ、およびアンケートデータをレセプトデータベース２１、健診データベース２２、およびアンケートデータベース２３からそれぞれ読み出す。そして、取得部１１はこれらのデータから成る過去の受診記録を変換部１２に出力する。

変換部１２は、過去の受診記録に基づいて複数の入力ベクトルを生成する機能要素である。入力ベクトルはＮ行１列（Ｎ＞１）の行列で示されるデータであり、後述する学習アルゴリズムに入力される。一つの入力ベクトルは過去の一時点における受診記録に対応し、この入力ベクトルはその時点におけるレセプトデータ、健診データ、およびアンケートデータを示す。医療処置の詳細（診察、治療、および処方薬）を含むレセプトデータがＰ個のデータ項目から成り、検査結果（検査値）を含む健診データがＱ個のデータ項目から成り、アンケート結果（回答）を含むアンケートデータがＲ個のデータ項目から成るとする。この場合、ある一時点ｔにおける入力ベクトルｖ_ｔを下記の式（１）で表すことができる。要素ａ_１〜ａ_Ｐはレセプトデータの各データ項目を示し、要素ｂ_１〜ｂ_Ｑは健診データの各データ項目を示し、要素ｃ_１〜ｃ_Ｒはアンケートデータの各データ項目を示す。各入力ベクトルの要素数（行数）は各データのデータ項目数に応じて膨大になり得る。

一般に、人は医療処置を複数回受け、健康診断を定期的に受け、健康に関するアンケートにも定期的に回答する。例えば、人は医療処置を特定の期間において毎月受けたり、健康診断を年に一度受けたり、アンケートに年に一度（例えば健康診断の際に）回答したりする。したがって、取得部１１は一つの対象者ＩＤについて、過去の複数の時点におけるレセプトデータ、健診データ、またはアンケートデータを取得し、複数の時点での受診記録を示す複数の入力ベクトルをこれらのデータから生成する。得られる入力ベクトルの個数をＭとすると、対象者の過去の受診記録は、下記の式（２）で示される入力ベクトルの集合Ｖで表すことができる。集合Ｖ内の入力ベクトルは時系列に並べられる。したがって、この集合Ｖは時系列データである。
Ｖ＝｛ｖ_１，ｖ_２，…，ｖ_Ｍ｝ …（２）

入力ベクトルの要素群は数値で表される。一方、レセプトデータ、健診データ、およびアンケートデータの中には数値で表されていないデータ項目（例えば、テキストで表現されたデータ項目）が存在し得る。この場合には、変換部１２はそのデータ項目を所定の規則に基づいて数値に変換する。非数値を数値に変換する規則は、変換部１２を実現するプログラムコードまたは設定ファイルに予め記述され、変換部１２はその記述に従って変換を実行する。

非数値を数値に変換する方法は限定されず、またその変換方法はデータ項目毎に異なってもよい。例えば、変換部１２は非数値データを二値（０または１）に変換してもよいし、所定の範囲内（例えば０〜１、０〜１０、１〜１００、−５〜＋５など）の数値に変換してもよいし、元データに含まれている値を用いた変換を行ってもよい。一例として、レセプトデータのある項目Ａが、特定の成分Ｂを含む注射を示すものとする。変換部１２はこの項目Ａに対応する要素に、注射の有無を示す二値（０：注射なし、１：注射あり）を代入してもよいし、適用された成分Ｂの量を代入してもよい。

レセプトデータ、健診データ、またはアンケートデータが示す日にち（受診日、健診日、および回答日）は互いに異なり得る。また、これらのデータの個数も互いに異なり得る。例えば、受診日の間隔が健診日の間隔および回答日の間隔よりも小さい場合には、少なくとも一つの入力ベクトルにおいて、健診データおよびアンケートデータに対応する要素が空値になる。このように空値が発生する場合には、取得部１１はその空値を所定の有意な数値（例えば０）に置き換える。これをパディングといい、この処理によりすべての入力ベクトルのすべての要素に有意な数値が設定される。

変換部１２は、生成した各入力ベクトルの要素群を所定の数値範囲内で正規化する。その数値範囲は限定されないが、例えば変換部１２は０以上１以下の範囲で各要素を正規化してもよい。正規化の規則も、変換部１２を実現するプログラムコードまたは設定ファイルに予め記述され、変換部１２はその記述に従って正規化を実行する。

正規化の具体的な規則は限定されず、またその正規化方法は要素ごとに異なってもよい。例えば、変換部１２はある要素を二値（０または１）に変換してもよいし、０から１の間の任意の値に変換してもよい。なお、データ項目によっては正規化しても値が変わらない場合があり得る。下記の式（３）は正規化された入力ベクトルの集合の具体的な一例を示す。

変換部１２は正規化された入力ベクトルの任意の要素についてスパース正則化を実行することで、入力ベクトル内で０の要素を増やしてもよい。このスパース正則化により、過学習を避けつつ学習の精度を上げることが期待できる。スパース正則化の規則も、変換部１２を実現するプログラムコードまたは設定ファイルに予め記述され、変換部１２はその記述に従ってスパース正則化を実行する。

どの要素をスパース正則化の対象とするかは任意に決めてよく、変換部１２は入力ベクトルの全要素についてスパース正則化を実行してもよいし、一部の要素についてのみスパース正則化を実行してもよい。例えば、変換部１２はレセプトデータのうち医療処置を示す要素に対してのみスパース正則化を実行してもよい。あるいは、変換部１２はレセプトデータのうち医療処置に対応する要素と、アンケートデータに対応する要素とに対してのみスパース正則化を実行してもよい。変換部１２は、精度が要求される要素（例えば健診データの検査結果に対応する要素）にはスパース正則化を実行することなく、他の要素の一部または全部に対してスパース正則化を実行してもよい。

変換部１２は、正規化された入力ベクトル、または正規化およびスパース正則化の双方が適用された入力ベクトルを圧縮してもよい。圧縮とは入力ベクトルの次元数を減らす処理である。変換部１２は集合Ｖ内のすべての入力ベクトルにおいて０である要素（行）をこれらの入力ベクトルから取り除くことで、各入力ベクトルの次元数を減らす。

このように、変換部１２は複数の入力ベクトルを生成し（必要であればパディングを実行する）、各入力ベクトルを正規化する。必要であれば、変換部１２はさらにその入力ベクトルに対してスパース正規化および圧縮の少なくとも一方を実行する。変換部１２はこの一連の処理で得られた入力ベクトルの集合Ｖを予測部１３に出力する。

予測部１３は、少なくとも正規化が施された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測（例えば受診予測）を示す出力ベクトルを得る機能要素である。学習アルゴリズム（学習モデル）の例としてＬＳＴＭ（ＬｏｎｇＳｈｏｒｔ−ＴｅｒｍＭｅｍｏｒｙ）、ＧＲＵ（ＧａｔｅｄＲｅｃｕｒｒｅｎｔＵｎｉｔ）、Ａｔｔｅｎｔｉｏｎ（アテンション）が挙げられる。しかし、予測部１３が用いる学習アルゴリズムはこれらに限定されず、任意のアルゴリズムが用いられてよい。

予測部１３は時系列に並べられた複数の入力ベクトルを前半と後半の二つに分ける。続いて、予測部１３はまず前半の入力ベクトルを学習アルゴリズムに処理させることで学習アルゴリズムを学習させる。続いて、予測部１３は後半の入力ベクトルを学習アルゴリズムに処理させることで学習アルゴリズムを検証し、最も計算制度が高いと推定される学習アルゴリズム（以下ではこれを「最良の学習アルゴリズム」ともいう）を得る。すなわち、前半の入力ベクトルの集合は訓練データであり、後半の入力ベクトルの集合はテストデータである。

続いて、予測部１３は得られた最良の学習アルゴリズムを用いて、将来の所定の時期（以下では「対象時期」ともいう）における対象者の状態の予測を示す出力ベクトルを求める。予測したい将来の時期は予め予測システム１０に入力され、例えば対象者ＩＤと共に入力される。予測部１３は現在から対象時期までの期間を複数の単位期間に分割する。そして、予測部１３は現在から対象時期に向かって、単位期間が経過した時点での出力ベクトルを順番に求める。

一例として、過去の期間に対応する入力ベクトルの集合Ｖ＝｛ｖ_１，ｖ_２，…，ｖ_Ｍ｝を用いて、対象時期ｔ_ｙにおける出力ベクトルｖ_ｙを算出するとする。まず、予測部１３は集合Ｖの前半Ｖ_Ｆ＝｛ｖ_１，…，ｖ_ｉ｝を用いて学習アルゴリズムを学習させ、集合Ｖの後半Ｖ_Ｌ＝｛ｖ_ｉ＋１，…，ｖ_Ｍ｝を用いて学習アルゴリズムを検証することで、最良の学習アルゴリズムを得る。

続いて、予測部１３は現時点ｔ_ｃから対象時期ｔ_ｙまでの期間をＮ個の単位期間ｋに分割する。続いて、予測部１３は入力ベクトルの集合Ｖ＝｛ｖ_１，…，ｖ_Ｍ｝を最良の学習アルゴリズムに入力することで、将来の時期（ｔ_ｃ＋１ｋ）における状態の予測を示す出力ベクトルｖ´_１を得る。

続いて、予測部１３は集合Ｖの中で最も古い入力ベクトルｖ_１を除き、代わりにその出力ベクトルｖ´_１を集合Ｖに加える。この結果、入力ベクトルの集合Ｖは｛ｖ_２，…，ｖ_Ｍ，ｖ´_１｝に変わる。予測部１３はこの集合Ｖ＝｛ｖ_２，…，ｖ_Ｍ，ｖ´_１｝を最良の学習アルゴリズムに入力することで、将来の時期（ｔ_ｃ＋２ｋ）における状態の予測を示す出力ベクトルｖ´_２を得る。

続いて、予測部１３は集合Ｖの中で最も古い入力ベクトルｖ_２を除き、代わりにその出力ベクトルｖ´_２を集合Ｖに加えることで、入力ベクトルの集合Ｖ＝｛ｖ_３，…，ｖ_Ｍ，ｖ´_１，ｖ´_２｝を得る。予測部１３はこの集合Ｖ＝｛ｖ_３，…，ｖ_Ｍ，ｖ´_１，ｖ´_２｝を最良の学習アルゴリズムに入力することで、将来の時期（ｔ_ｃ＋３ｋ）における状態の予測を示す出力ベクトルｖ´_３を得る。

このように、予測部１３は入力ベクトルの集合で示される期間を将来に向かってシフトさせながら出力ベクトルを求め続け、最終的に、対象時期ｔ_ｙ（＝ｔ_ｃ＋Ｎｋ）における出力ベクトルｖ´_Ｎを求める。最終的に得られる出力ベクトルの要素群は入力ベクトルの要素群に対応する。したがって、出力ベクトルは、医療処置を示す１以上の要素（レセプトデータの項目に関する予測）を少なくとも含み、人の身体の状態に関する他の要素（健診データデータまたはアンケートデータの項目に関する予測。例えば各種の検査値。）をさらに含み得る。

最終的に得られた出力ベクトルから、対象者が将来の所定の時期においてどのような医療処置を受けるかを知ったり、対象者の身体の将来の状態を知ったりことができる。ただし、この出力ベクトルの各要素は正規化されているので、その正規化された値をそのまま出力しても人には理解しづらい。そこで、予測部１３はこの出力ベクトルを加工してもよい。例えば、予測部１３はその出力ベクトルの正規化を解除することで、出力ベクトルの要素の値を、正規化されていない値に戻してもよい（非正規化）。あるいは、予測部１３は正規化されたままの状態にある出力ベクトルまたは非正規化された出力ベクトルの要素の少なくとも一部をテキストに変換してもよい。

あるいは、予測部１３は出力ベクトルの要素から導出可能な更なるデータを生成してもよい。例えば、予測部１３は医療処置に関する各要素の値と、各医療処置（各診察、各治療、および各処方薬）の単価（医療報酬）とに基づいて、将来の所定の時期における医療費の推定値を求めてもよい。

予測部１３は出力ベクトルそのもの、加工された出力ベクトル、および出力ベクトルから導出されたデータのうちの少なくとも一部を予測結果として出力する。出力方法は限定されない。例えば、予測部１３は予測結果をモニタ上に表示させたりプリンタで印刷したりしてもよいし、所定のデータベースに予測結果を格納してもよいし、他のコンピュータシステムに予測結果を送信してもよい。

このように、予測結果の形式および出力方法は限定されない。いずれにしても、予測システム１０のユーザはその予測結果を参照することで、対象者が将来いつどのような医療処置を受けるかの見当を付けることができる。また、ユーザは対象者がいつ治療を止めるか、将来どのくらい医療費が掛かるかなども知ることが可能である。さらに、ユーザは対象者の身体の状態を示す検査値が将来どのように推移するかを知ることも可能である。

次に、図３を参照しながら、予測システム１０の動作を説明するとともに本実施形態に係る予測方法について説明する。図３は予測システム１０の動作を示すフローチャートである。

まず、取得部１１が対象者の過去の受診記録（レセプトデータ、健診データ、およびアンケートデータ）をデータベース群２０から取得する（ステップＳ１１、取得ステップ）。

続いて、変換部１２がその受診記録に基づいて複数の入力ベクトルを生成する（ステップＳ１２、変換ステップ）。まず、変換部１２はその受診記録に基づいて入力ベクトルの集合を生成する（ステップＳ１２１）。必要であれば、この処理において変換部１２は非数値のデータを数値に変換したりパディングを実行したりする。続いて、変換部１２は各入力ベクトルの要素群を正規化し（ステップＳ１２２）、必要に応じて、正規化された入力ベクトルに対してスパース正則化または圧縮を実行する（ステップＳ１２３）。

続いて、予測部１３が、少なくとも正規化が施された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期（対象時期）における対象者の状態の予測（例えば受診予測）を示す出力ベクトルを求める（ステップＳ１３）。予測部１３は入力ベクトルの集合を用いて学習アルゴリズムを学習させ、さらにその学習結果を検証することで、最良の学習アルゴリズムを得る（ステップＳ１３１）。そして、予測部１３は現在から対象時期に向かって、所定の単位期間ごとに出力ベクトルを求めていく。現時点をｔ_ｃ、単位期間をｋとし、将来の時期をｔ_ｃ＋ｉｋ（ｉ＝１，…，Ｎ）で表すとする。予測部１３はまず将来の時期（ｔ_ｃ＋１ｋ）における状態の予測（例えば受診予測）を示す出力ベクトルを求め、対象時期（ｔ_ｃ＋Ｎｋ）に至るまで変数ｉを増分しながら出力ベクトルの計算を繰り返す（ステップＳ１３２〜Ｓ１３５）。最後に、予測部１３はその対象時期における出力ベクトルに基づく予測結果を出力する（ステップＳ１４）。

次に、図４を参照しながら、少なくとも１台のコンピュータを予測システム１０として機能させるための予測プログラムＰ１を説明する。図４は予測プログラムＰ１の構成を示す図である。

予測プログラムＰ１はメインモジュールＰ１０、取得モジュールＰ１１、変換モジュールＰ１２、および予測モジュールＰ１３を含む。メインモジュールＰ１０は受診予測を統括的に管理する部分である。取得モジュールＰ１１、変換モジュールＰ１２、および予測モジュールＰ１３を実行することで、取得部１１、変換部１２、および予測部１３が実現する。

予測プログラムＰ１は、例えば、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、半導体メモリなどの有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、予測プログラムＰ１は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。

以上説明したように、本発明の一側面に係る予測システムは、対象者の過去の受診記録を所定のデータベースから取得する取得部であって、該受診記録が少なくとも医療処置を示す、該取得部と、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換部であって、要素群が、医療処置を示す要素を少なくとも含む、該変換部と、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測部であって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測部とを備える。

このような側面においては、対象者の受診記録を表現した入力ベクトルを正規化してからその入力ベクトルを学習アルゴリズムに入力することで、対象者の将来の状態の予測を示す出力ベクトルが得られる。入力ベクトルは医療処置を示す要素を少なくとも含み、出力ベクトルはその入力ベクトルに対応する。医療処置を示す要素を少なくとも含む出力ベクトルを出力することで、人の状態をより精度良く予測することができる。例えば、ユーザは、出力ベクトルを参照または利用することで、将来の所定の時期において対象者がどのような医療処置を受けるかを知ることができる（すなわち、対象者の受診の予測が可能になる）。

医療処置を示す値はテキストや数値などの様々な形式で表現されるので、これらの値を単に数値化して学習アルゴリズムに入力するだけでは、計算の精度が上がらなかったり計算に時間が掛かったりする可能性がある。しかし、医療処置を示す要素を含む入力ベクトルを正規化することで、多種多様なデータを使って求める必要がある対象者の将来の状態の予測を精度良くかつ短時間で行うことが可能になる。

他の側面に係る予測システムでは、変換部が、正規化された入力ベクトルの要素群のうち、医療処置を示す要素に対してスパース正則化を実行してもよい。医療処置については非常に多くの種類が存在するので、医療処置を示す要素の数も非常に多くなる。この要素をスパース正則化することで、値が０である要素が増えるので、過学習を避けつつ学習の精度を上げたり、計算時間を短縮したりすることができる。

他の側面に係る予測システムでは、予測部が、出力ベクトルに基づいて、将来の所定の時期における医療費を求めてもよい。この場合には、将来の医療費を予測することができる。

以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。

上記実施形態では受診記録がレセプトデータ、健診データ、およびアンケートデータで構成されたが、健診データおよびアンケートデータの少なくとも一方が省略されてもよい。あるいは、受診記録は、少なくとも、レセプトデータと、人が過去に受けた運動能力測定の結果を示す運動データとから構成されてもよい。したがって、受診記録はレセプトデータ、健診データ、アンケートデータ、および運動データから構成されてもよい。

少なくとも一つのプロセッサにより実行される予測方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ（処理）の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の２以上のステップが組み合わされてもよいし、ステップの一部が修正又は削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。

予測システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」という二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。

１０…予測システム、１１…取得部、１２…変換部、１３…予測部、２０…データベース群、２１…レセプトデータベース、２２…健診データベース、２３…アンケートデータベース、Ｐ１…予測プログラム、Ｐ１０…メインモジュール、Ｐ１１…取得モジュール、Ｐ１２…変換モジュール、Ｐ１３…予測モジュール。

Claims

対象者の過去の受診記録を所定のデータベースから取得する取得部であって、該受診記録が少なくとも医療処置を示す、該取得部と、
前記受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換部であって、前記要素群が、前記医療処置を示す要素を少なくとも含む、該変換部と、
前記正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における前記対象者の状態の予測を示す出力ベクトルを求める予測部であって、前記出力ベクトルの要素群が前記入力ベクトルの要素群に対応する、該予測部と
を備える予測システム。
前記変換部が、前記正規化された入力ベクトルの要素群のうち、前記医療処置を示す要素に対してスパース正則化を実行する、
請求項１に記載の予測システム。
前記予測部が、前記出力ベクトルに基づいて、前記将来の所定の時期における医療費を求める、
請求項１または２に記載の予測システム。
少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、
対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、
前記受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、前記要素群が、前記医療処置を示す要素を少なくとも含む、該変換ステップと、
前記正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における前記対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、前記出力ベクトルの要素群が前記入力ベクトルの要素群に対応する、該予測ステップと
を含む予測方法。
対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、
前記受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、前記要素群が、前記医療処置を示す要素を少なくとも含む、該変換ステップと、
前記正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における前記対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、前記出力ベクトルの要素群が前記入力ベクトルの要素群に対応する、該予測ステップと
をコンピュータシステムに実行させる予測プログラム。