JP2018194904A - 予測システム、予測方法、および予測プログラム - Google Patents

予測システム、予測方法、および予測プログラム Download PDF

Info

Publication number
JP2018194904A
JP2018194904A JP2017095794A JP2017095794A JP2018194904A JP 2018194904 A JP2018194904 A JP 2018194904A JP 2017095794 A JP2017095794 A JP 2017095794A JP 2017095794 A JP2017095794 A JP 2017095794A JP 2018194904 A JP2018194904 A JP 2018194904A
Authority
JP
Japan
Prior art keywords
prediction
medical
element group
input vector
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017095794A
Other languages
English (en)
Other versions
JP6929124B2 (ja
Inventor
悠輔 巣籠
Yusuke Sugome
悠輔 巣籠
亮一 草間
Ryoichi Kusama
亮一 草間
聖吾 原
Seigo Hara
聖吾 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Joho Iryo Co Ltd
Original Assignee
Joho Iryo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Joho Iryo Co Ltd filed Critical Joho Iryo Co Ltd
Priority to JP2017095794A priority Critical patent/JP6929124B2/ja
Publication of JP2018194904A publication Critical patent/JP2018194904A/ja
Application granted granted Critical
Publication of JP6929124B2 publication Critical patent/JP6929124B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】対象者の将来の状態をより精度良く予測することを目的とする。【解決手段】一実施形態に係る予測システムは取得部、変換部、および予測部を備える。取得部は、対象者の過去の受診記録を所定のデータベースから取得する。受診記録は少なくとも医療処置を示す。変換部は、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する。その要素群は、医療処置を示す要素を少なくとも含む、予測部は、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める。出力ベクトルの要素群は入力ベクトルの要素群に対応する。【選択図】図2

Description

本発明の一側面は予測システム、予測方法、および予測プログラムに関する。
医療または人の健康を管理するための様々なコンピュータシステムが知られている。例えば下記の特許文献1には、対象者の健康状態の推移を予測する医療データ解析装置が記載されている。この解析装置は、異なる種類のデータが頻度要素として混在するバグオブワードの形で与えられた一連の対象者の一連の年代における医療データを、対象者及び年代ごとの個別データの集まりとして、深層学習を適用する。そして、解析装置は、各中間層における当該個別データの表現データを、異なる種類のデータが頻度要素として混在するバグオブワードの圧縮表現として出力する。
特開2017−27307号公報
人の健康状態を予測する手法は知られている。しかし、その状態をより精度良く予測することができれば便利であり、さらに、その予測結果に基づいて様々な更なる情報を得ることも可能になる。そのため、対象者の将来の状態をより精度良く予測する仕組みが望まれている。
本発明の一側面に係る予測システムは、対象者の過去の受診記録を所定のデータベースから取得する取得部であって、該受診記録が少なくとも医療処置を示す、該取得部と、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換部であって、要素群が、医療処置を示す要素を少なくとも含む、該変換部と、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測部であって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測部とを備える。
本発明の一側面に係る予測方法は、少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、要素群が、医療処置を示す要素を少なくとも含む、該変換ステップと、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測ステップとを含む。
本発明の一側面に係る予測プログラムは、対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、要素群が、医療処置を示す要素を少なくとも含む、該変換ステップと、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測ステップとをコンピュータシステムに実行させる。
このような側面においては、対象者の受診記録を表現した入力ベクトルを正規化してからその入力ベクトルを学習アルゴリズムに入力することで、対象者の将来の状態の予測を示す出力ベクトルが得られる。入力ベクトルは医療処置を示す要素を少なくとも含み、出力ベクトルはその入力ベクトルに対応する。医療処置を示す要素を少なくとも含む出力ベクトルを出力することで、対象者の状態をより精度良く予測することができる。
本発明の一側面によれば、対象者の将来の状態をより精度良く予測することができる。
実施形態に係る予測システムで用いられるコンピュータのハードウェア構成を示す図である。 実施形態に係る予測システムの機能構成を示す図である。 実施形態に係る予測システムの動作を示すフローチャートである。 実施形態に係る予測プログラムの構成を示す図である。
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
実施形態に係る予測システム10は、対象者の将来の状態を予測するコンピュータシステムである。例えば、予測システム10は、対象者がいつどのような医療処置を受けるかを予測したり、対象者の身体の状態が将来どのようになるかを予測したりする。「医療処置」とは医療機関が患者に対して行う処置であって、例えば診察、治療、薬の処方の少なくとも一つを含む。より具体的には、医療処置は医療に関する資格を有する者(例えば、医者、看護師、薬剤師など)により施される。人(患者)が医療処置を受けることを「受診」という。「対象者」とは、予測処理の対象となる人(患者)である。
図1は予測システム10を構成するコンピュータ100の一般的なハードウェア構成を示す。例えば、コンピュータ100はプロセッサ101、主記憶部102、補助記憶部103、通信制御部104、入力装置105、および出力装置106を備える。プロセッサ101はオペレーティングシステムおよびアプリケーション・プログラムを実行する。主記憶部102は例えばROMおよびRAMで構成される。補助記憶部103は例えばハードディスクまたはフラッシュメモリで構成され、一般に主記憶部102よりも大量のデータを記憶する。通信制御部104は例えばネットワークカードまたは無線通信モジュールで構成される。入力装置105は例えばキーボード、マウス、タッチパネルなどで構成される。出力装置106は例えばモニタおよびスピーカで構成される。
予測システム10の各機能要素は、プロセッサ101または主記憶部102の上に所定のソフトウェア(例えば、後述する予測プログラムP1)を読み込ませてそのソフトウェアを実行させることで実現される。プロセッサ101はそのソフトウェアに従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
予測システム10は1台のコンピュータで構成されてもよいし、複数台のコンピュータで構成されてもよい。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネットやイントラネットなどの通信ネットワークを介して接続されることで、論理的に一つの予測システム10が構築される。
予測システム10はインターネットやイントラネットなどの通信ネットワークを介してデータベース群20にアクセスすることができる。データベース群20は、人々の受診記録を記憶するデータベースの集合である。データベースは、プロセッサまたは外部のコンピュータからの任意のデータ操作(例えば、抽出、追加、削除、上書きなど)に対応できるようにデータ集合を記憶する機能要素または装置である。データベースの実装方法は限定されないが、例えばデータベース管理システム(DBMS)が用いられてもよい。「受診記録」とは、人が過去に受けた医療処置を少なくとも示すデータである。
図2に示すように、本実施形態ではデータベース群20はレセプトデータベース21、健診データベース22、およびアンケートデータベース23を含む。レセプトデータベース21、健診データベース22、およびアンケートデータベース23が設けられる位置は限定されない。例えば、これらのデータベースの少なくとも一部が予測システム10とは異なるコンピュータシステムにより管理されてもよいし、予測システム10の一部であってもよい。また、各データベースの管理主体も限定されない。例えば、予測システム10の運営者が他の機関からデータを提供されて、これらのデータの集合をデータベース群20として管理してもよい。
レセプトデータベース21は、人が過去に受けた医療処置を示すレセプトデータを記憶するデータベースである。例えば、レセプトデータは医療機関で生成されてレセプトデータベース21に蓄積される。レセプトデータベース21は各医療機関のレセプトデータベースの集合であってもよいし、各医療機関のレセプトデータが集約された一つのデータベースであってもよい。
レセプトデータの各レコードは対象者ID、対象者の属性、医療機関ID、受診日、および医療処置の詳細を含む。対象者IDは医療処置を受けた人を一意に特定する識別子である。対象者の属性は、対象者の性質または特徴を示すデータであり、例えば性別および年齢である。医療機関IDは医療処置を施した医療機関を一意に特定する識別子である。受診日は医療処置が実施された日にちである。医療処置の詳細は1以上の診察項目、1以上の治療項目、および1以上の処方薬を示すデータである。処方薬を示すデータは、薬の種類、用量、および投与日数を含む。診察、治療、および処方薬はいずれも非常に多くの種類が存在するので、医療処置の詳細は非常に多くの(例えば数千、数万の)データ項目を含み得る。
健診データベース22は、人が過去に受けた健康診断の結果を示す健診データを記憶するデータベースである。例えば、健診データは医療機関で生成されて健診データベース22に蓄積される。レセプトデータベース21と同様に、健診データベース22は各医療機関の健診データベースの集合であってもよいし、各医療機関の健診データが集約された一つのデータベースであってもよい。
健診データの各レコードは対象者ID、対象者の属性、医療機関ID、健診日、および検査結果を含む。対象者IDは健康診断を受けた人を一意に特定する識別子である。対象者の属性についてはレセプトデータと同様である。医療機関IDは健康診断を実施した医療機関を一意に特定する識別子である。健診日は健康診断が実施された日にちである。検査結果は健康診断の結果であり、より具体的には複数の検査値の集合である。健康診断は様々な検査項目(例えば、法定の各種項目および非法定の各種項目の少なくとも一方)を含むので、検査結果は多数の(例えば数十、数百の)データ項目を含み得る。
アンケートデータベース23は、人が過去に回答した健康に関するアンケート結果を示すアンケートデータを記憶するデータベースである。健康に関するアンケートの例として、企業で実施されるストレスチェック、健康診断時に実施される生活習慣に関するアンケートなどが挙げられるが、アンケートの内容はこれらに限定されない。アンケートデータは企業または医療機関で生成されてアンケートデータベース23に蓄積される。レセプトデータベース21と同様に、アンケートデータベース23は各企業または各医療機関のアンケートデータベースの集合であってもよいし、各企業または各医療機関のアンケートデータが集約された一つのデータベースであってもよい。
アンケートデータの各レコードは対象者ID、実施機関ID、回答日、およびアンケート結果を含む。対象者IDはアンケートに回答した人を一意に特定する識別子である。実施機関IDはアンケートを実施した機関(例えば企業または医療機関)を一意に特定する識別子である。回答日はアンケートの回答が記入された日である。アンケート結果は複数の回答を示すデータであり、例えばストレスチェック、生活習慣、意識調査などについての様々な回答を含む。
図2は予測システム10の機能構成を示す。図2に示すように、予測システム10は機能的構成要素として取得部11、変換部12、および予測部13を備える。
取得部11は、対象者の過去の受診記録を取得する機能要素である。自動的にまたは予測システム10のオペレータにより対象者IDが入力されると、取得部11はこの対象者IDに対応する受診記録をデータベース群20から読み出す。具体的には、取得部11はその対象者IDに対応するレセプトデータ、健診データ、およびアンケートデータをレセプトデータベース21、健診データベース22、およびアンケートデータベース23からそれぞれ読み出す。そして、取得部11はこれらのデータから成る過去の受診記録を変換部12に出力する。
変換部12は、過去の受診記録に基づいて複数の入力ベクトルを生成する機能要素である。入力ベクトルはN行1列(N>1)の行列で示されるデータであり、後述する学習アルゴリズムに入力される。一つの入力ベクトルは過去の一時点における受診記録に対応し、この入力ベクトルはその時点におけるレセプトデータ、健診データ、およびアンケートデータを示す。医療処置の詳細(診察、治療、および処方薬)を含むレセプトデータがP個のデータ項目から成り、検査結果(検査値)を含む健診データがQ個のデータ項目から成り、アンケート結果(回答)を含むアンケートデータがR個のデータ項目から成るとする。この場合、ある一時点tにおける入力ベクトルvを下記の式(1)で表すことができる。要素a〜aはレセプトデータの各データ項目を示し、要素b〜bは健診データの各データ項目を示し、要素c〜cはアンケートデータの各データ項目を示す。各入力ベクトルの要素数(行数)は各データのデータ項目数に応じて膨大になり得る。
Figure 2018194904
一般に、人は医療処置を複数回受け、健康診断を定期的に受け、健康に関するアンケートにも定期的に回答する。例えば、人は医療処置を特定の期間において毎月受けたり、健康診断を年に一度受けたり、アンケートに年に一度(例えば健康診断の際に)回答したりする。したがって、取得部11は一つの対象者IDについて、過去の複数の時点におけるレセプトデータ、健診データ、またはアンケートデータを取得し、複数の時点での受診記録を示す複数の入力ベクトルをこれらのデータから生成する。得られる入力ベクトルの個数をMとすると、対象者の過去の受診記録は、下記の式(2)で示される入力ベクトルの集合Vで表すことができる。集合V内の入力ベクトルは時系列に並べられる。したがって、この集合Vは時系列データである。
V={v,v,…,v} …(2)
入力ベクトルの要素群は数値で表される。一方、レセプトデータ、健診データ、およびアンケートデータの中には数値で表されていないデータ項目(例えば、テキストで表現されたデータ項目)が存在し得る。この場合には、変換部12はそのデータ項目を所定の規則に基づいて数値に変換する。非数値を数値に変換する規則は、変換部12を実現するプログラムコードまたは設定ファイルに予め記述され、変換部12はその記述に従って変換を実行する。
非数値を数値に変換する方法は限定されず、またその変換方法はデータ項目毎に異なってもよい。例えば、変換部12は非数値データを二値(0または1)に変換してもよいし、所定の範囲内(例えば0〜1、0〜10、1〜100、−5〜+5など)の数値に変換してもよいし、元データに含まれている値を用いた変換を行ってもよい。一例として、レセプトデータのある項目Aが、特定の成分Bを含む注射を示すものとする。変換部12はこの項目Aに対応する要素に、注射の有無を示す二値(0:注射なし、1:注射あり)を代入してもよいし、適用された成分Bの量を代入してもよい。
レセプトデータ、健診データ、またはアンケートデータが示す日にち(受診日、健診日、および回答日)は互いに異なり得る。また、これらのデータの個数も互いに異なり得る。例えば、受診日の間隔が健診日の間隔および回答日の間隔よりも小さい場合には、少なくとも一つの入力ベクトルにおいて、健診データおよびアンケートデータに対応する要素が空値になる。このように空値が発生する場合には、取得部11はその空値を所定の有意な数値(例えば0)に置き換える。これをパディングといい、この処理によりすべての入力ベクトルのすべての要素に有意な数値が設定される。
変換部12は、生成した各入力ベクトルの要素群を所定の数値範囲内で正規化する。その数値範囲は限定されないが、例えば変換部12は0以上1以下の範囲で各要素を正規化してもよい。正規化の規則も、変換部12を実現するプログラムコードまたは設定ファイルに予め記述され、変換部12はその記述に従って正規化を実行する。
正規化の具体的な規則は限定されず、またその正規化方法は要素ごとに異なってもよい。例えば、変換部12はある要素を二値(0または1)に変換してもよいし、0から1の間の任意の値に変換してもよい。なお、データ項目によっては正規化しても値が変わらない場合があり得る。下記の式(3)は正規化された入力ベクトルの集合の具体的な一例を示す。
Figure 2018194904
変換部12は正規化された入力ベクトルの任意の要素についてスパース正則化を実行することで、入力ベクトル内で0の要素を増やしてもよい。このスパース正則化により、過学習を避けつつ学習の精度を上げることが期待できる。スパース正則化の規則も、変換部12を実現するプログラムコードまたは設定ファイルに予め記述され、変換部12はその記述に従ってスパース正則化を実行する。
どの要素をスパース正則化の対象とするかは任意に決めてよく、変換部12は入力ベクトルの全要素についてスパース正則化を実行してもよいし、一部の要素についてのみスパース正則化を実行してもよい。例えば、変換部12はレセプトデータのうち医療処置を示す要素に対してのみスパース正則化を実行してもよい。あるいは、変換部12はレセプトデータのうち医療処置に対応する要素と、アンケートデータに対応する要素とに対してのみスパース正則化を実行してもよい。変換部12は、精度が要求される要素(例えば健診データの検査結果に対応する要素)にはスパース正則化を実行することなく、他の要素の一部または全部に対してスパース正則化を実行してもよい。
変換部12は、正規化された入力ベクトル、または正規化およびスパース正則化の双方が適用された入力ベクトルを圧縮してもよい。圧縮とは入力ベクトルの次元数を減らす処理である。変換部12は集合V内のすべての入力ベクトルにおいて0である要素(行)をこれらの入力ベクトルから取り除くことで、各入力ベクトルの次元数を減らす。
このように、変換部12は複数の入力ベクトルを生成し(必要であればパディングを実行する)、各入力ベクトルを正規化する。必要であれば、変換部12はさらにその入力ベクトルに対してスパース正規化および圧縮の少なくとも一方を実行する。変換部12はこの一連の処理で得られた入力ベクトルの集合Vを予測部13に出力する。
予測部13は、少なくとも正規化が施された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測(例えば受診予測)を示す出力ベクトルを得る機能要素である。学習アルゴリズム(学習モデル)の例としてLSTM(Long Short−Term Memory)、GRU(Gated Recurrent Unit)、Attention(アテンション)が挙げられる。しかし、予測部13が用いる学習アルゴリズムはこれらに限定されず、任意のアルゴリズムが用いられてよい。
予測部13は時系列に並べられた複数の入力ベクトルを前半と後半の二つに分ける。続いて、予測部13はまず前半の入力ベクトルを学習アルゴリズムに処理させることで学習アルゴリズムを学習させる。続いて、予測部13は後半の入力ベクトルを学習アルゴリズムに処理させることで学習アルゴリズムを検証し、最も計算制度が高いと推定される学習アルゴリズム(以下ではこれを「最良の学習アルゴリズム」ともいう)を得る。すなわち、前半の入力ベクトルの集合は訓練データであり、後半の入力ベクトルの集合はテストデータである。
続いて、予測部13は得られた最良の学習アルゴリズムを用いて、将来の所定の時期(以下では「対象時期」ともいう)における対象者の状態の予測を示す出力ベクトルを求める。予測したい将来の時期は予め予測システム10に入力され、例えば対象者IDと共に入力される。予測部13は現在から対象時期までの期間を複数の単位期間に分割する。そして、予測部13は現在から対象時期に向かって、単位期間が経過した時点での出力ベクトルを順番に求める。
一例として、過去の期間に対応する入力ベクトルの集合V={v,v,…,v}を用いて、対象時期tにおける出力ベクトルvを算出するとする。まず、予測部13は集合Vの前半V={v,…,v}を用いて学習アルゴリズムを学習させ、集合Vの後半V={vi+1,…,v}を用いて学習アルゴリズムを検証することで、最良の学習アルゴリズムを得る。
続いて、予測部13は現時点tから対象時期tまでの期間をN個の単位期間kに分割する。続いて、予測部13は入力ベクトルの集合V={v,…,v}を最良の学習アルゴリズムに入力することで、将来の時期(t+1k)における状態の予測を示す出力ベクトルv´を得る。
続いて、予測部13は集合Vの中で最も古い入力ベクトルvを除き、代わりにその出力ベクトルv´を集合Vに加える。この結果、入力ベクトルの集合Vは{v,…,v,v´}に変わる。予測部13はこの集合V={v,…,v,v´}を最良の学習アルゴリズムに入力することで、将来の時期(t+2k)における状態の予測を示す出力ベクトルv´を得る。
続いて、予測部13は集合Vの中で最も古い入力ベクトルvを除き、代わりにその出力ベクトルv´を集合Vに加えることで、入力ベクトルの集合V={v,…,v,v´,v´}を得る。予測部13はこの集合V={v,…,v,v´,v´}を最良の学習アルゴリズムに入力することで、将来の時期(t+3k)における状態の予測を示す出力ベクトルv´を得る。
このように、予測部13は入力ベクトルの集合で示される期間を将来に向かってシフトさせながら出力ベクトルを求め続け、最終的に、対象時期t(=t+Nk)における出力ベクトルv´を求める。最終的に得られる出力ベクトルの要素群は入力ベクトルの要素群に対応する。したがって、出力ベクトルは、医療処置を示す1以上の要素(レセプトデータの項目に関する予測)を少なくとも含み、人の身体の状態に関する他の要素(健診データデータまたはアンケートデータの項目に関する予測。例えば各種の検査値。)をさらに含み得る。
最終的に得られた出力ベクトルから、対象者が将来の所定の時期においてどのような医療処置を受けるかを知ったり、対象者の身体の将来の状態を知ったりことができる。ただし、この出力ベクトルの各要素は正規化されているので、その正規化された値をそのまま出力しても人には理解しづらい。そこで、予測部13はこの出力ベクトルを加工してもよい。例えば、予測部13はその出力ベクトルの正規化を解除することで、出力ベクトルの要素の値を、正規化されていない値に戻してもよい(非正規化)。あるいは、予測部13は正規化されたままの状態にある出力ベクトルまたは非正規化された出力ベクトルの要素の少なくとも一部をテキストに変換してもよい。
あるいは、予測部13は出力ベクトルの要素から導出可能な更なるデータを生成してもよい。例えば、予測部13は医療処置に関する各要素の値と、各医療処置(各診察、各治療、および各処方薬)の単価(医療報酬)とに基づいて、将来の所定の時期における医療費の推定値を求めてもよい。
予測部13は出力ベクトルそのもの、加工された出力ベクトル、および出力ベクトルから導出されたデータのうちの少なくとも一部を予測結果として出力する。出力方法は限定されない。例えば、予測部13は予測結果をモニタ上に表示させたりプリンタで印刷したりしてもよいし、所定のデータベースに予測結果を格納してもよいし、他のコンピュータシステムに予測結果を送信してもよい。
このように、予測結果の形式および出力方法は限定されない。いずれにしても、予測システム10のユーザはその予測結果を参照することで、対象者が将来いつどのような医療処置を受けるかの見当を付けることができる。また、ユーザは対象者がいつ治療を止めるか、将来どのくらい医療費が掛かるかなども知ることが可能である。さらに、ユーザは対象者の身体の状態を示す検査値が将来どのように推移するかを知ることも可能である。
次に、図3を参照しながら、予測システム10の動作を説明するとともに本実施形態に係る予測方法について説明する。図3は予測システム10の動作を示すフローチャートである。
まず、取得部11が対象者の過去の受診記録(レセプトデータ、健診データ、およびアンケートデータ)をデータベース群20から取得する(ステップS11、取得ステップ)。
続いて、変換部12がその受診記録に基づいて複数の入力ベクトルを生成する(ステップS12、変換ステップ)。まず、変換部12はその受診記録に基づいて入力ベクトルの集合を生成する(ステップS121)。必要であれば、この処理において変換部12は非数値のデータを数値に変換したりパディングを実行したりする。続いて、変換部12は各入力ベクトルの要素群を正規化し(ステップS122)、必要に応じて、正規化された入力ベクトルに対してスパース正則化または圧縮を実行する(ステップS123)。
続いて、予測部13が、少なくとも正規化が施された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期(対象時期)における対象者の状態の予測(例えば受診予測)を示す出力ベクトルを求める(ステップS13)。予測部13は入力ベクトルの集合を用いて学習アルゴリズムを学習させ、さらにその学習結果を検証することで、最良の学習アルゴリズムを得る(ステップS131)。そして、予測部13は現在から対象時期に向かって、所定の単位期間ごとに出力ベクトルを求めていく。現時点をt、単位期間をkとし、将来の時期をt+ik(i=1,…,N)で表すとする。予測部13はまず将来の時期(t+1k)における状態の予測(例えば受診予測)を示す出力ベクトルを求め、対象時期(t+Nk)に至るまで変数iを増分しながら出力ベクトルの計算を繰り返す(ステップS132〜S135)。最後に、予測部13はその対象時期における出力ベクトルに基づく予測結果を出力する(ステップS14)。
次に、図4を参照しながら、少なくとも1台のコンピュータを予測システム10として機能させるための予測プログラムP1を説明する。図4は予測プログラムP1の構成を示す図である。
予測プログラムP1はメインモジュールP10、取得モジュールP11、変換モジュールP12、および予測モジュールP13を含む。メインモジュールP10は受診予測を統括的に管理する部分である。取得モジュールP11、変換モジュールP12、および予測モジュールP13を実行することで、取得部11、変換部12、および予測部13が実現する。
予測プログラムP1は、例えば、CD−ROM、DVD−ROM、半導体メモリなどの有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、予測プログラムP1は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
以上説明したように、本発明の一側面に係る予測システムは、対象者の過去の受診記録を所定のデータベースから取得する取得部であって、該受診記録が少なくとも医療処置を示す、該取得部と、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換部であって、要素群が、医療処置を示す要素を少なくとも含む、該変換部と、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測部であって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測部とを備える。
本発明の一側面に係る予測方法は、少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、要素群が、医療処置を示す要素を少なくとも含む、該変換ステップと、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測ステップとを含む。
本発明の一側面に係る予測プログラムは、対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、要素群が、医療処置を示す要素を少なくとも含む、該変換ステップと、正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、出力ベクトルの要素群が入力ベクトルの要素群に対応する、該予測ステップとをコンピュータシステムに実行させる。
このような側面においては、対象者の受診記録を表現した入力ベクトルを正規化してからその入力ベクトルを学習アルゴリズムに入力することで、対象者の将来の状態の予測を示す出力ベクトルが得られる。入力ベクトルは医療処置を示す要素を少なくとも含み、出力ベクトルはその入力ベクトルに対応する。医療処置を示す要素を少なくとも含む出力ベクトルを出力することで、人の状態をより精度良く予測することができる。例えば、ユーザは、出力ベクトルを参照または利用することで、将来の所定の時期において対象者がどのような医療処置を受けるかを知ることができる(すなわち、対象者の受診の予測が可能になる)。
医療処置を示す値はテキストや数値などの様々な形式で表現されるので、これらの値を単に数値化して学習アルゴリズムに入力するだけでは、計算の精度が上がらなかったり計算に時間が掛かったりする可能性がある。しかし、医療処置を示す要素を含む入力ベクトルを正規化することで、多種多様なデータを使って求める必要がある対象者の将来の状態の予測を精度良くかつ短時間で行うことが可能になる。
他の側面に係る予測システムでは、変換部が、正規化された入力ベクトルの要素群のうち、医療処置を示す要素に対してスパース正則化を実行してもよい。医療処置については非常に多くの種類が存在するので、医療処置を示す要素の数も非常に多くなる。この要素をスパース正則化することで、値が0である要素が増えるので、過学習を避けつつ学習の精度を上げたり、計算時間を短縮したりすることができる。
他の側面に係る予測システムでは、予測部が、出力ベクトルに基づいて、将来の所定の時期における医療費を求めてもよい。この場合には、将来の医療費を予測することができる。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
上記実施形態では受診記録がレセプトデータ、健診データ、およびアンケートデータで構成されたが、健診データおよびアンケートデータの少なくとも一方が省略されてもよい。あるいは、受診記録は、少なくとも、レセプトデータと、人が過去に受けた運動能力測定の結果を示す運動データとから構成されてもよい。したがって、受診記録はレセプトデータ、健診データ、アンケートデータ、および運動データから構成されてもよい。
少なくとも一つのプロセッサにより実行される予測方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ(処理)の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正又は削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。
予測システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」という二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
10…予測システム、11…取得部、12…変換部、13…予測部、20…データベース群、21…レセプトデータベース、22…健診データベース、23…アンケートデータベース、P1…予測プログラム、P10…メインモジュール、P11…取得モジュール、P12…変換モジュール、P13…予測モジュール。

Claims (5)

  1. 対象者の過去の受診記録を所定のデータベースから取得する取得部であって、該受診記録が少なくとも医療処置を示す、該取得部と、
    前記受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換部であって、前記要素群が、前記医療処置を示す要素を少なくとも含む、該変換部と、
    前記正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における前記対象者の状態の予測を示す出力ベクトルを求める予測部であって、前記出力ベクトルの要素群が前記入力ベクトルの要素群に対応する、該予測部と
    を備える予測システム。
  2. 前記変換部が、前記正規化された入力ベクトルの要素群のうち、前記医療処置を示す要素に対してスパース正則化を実行する、
    請求項1に記載の予測システム。
  3. 前記予測部が、前記出力ベクトルに基づいて、前記将来の所定の時期における医療費を求める、
    請求項1または2に記載の予測システム。
  4. 少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、
    対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、
    前記受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、前記要素群が、前記医療処置を示す要素を少なくとも含む、該変換ステップと、
    前記正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における前記対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、前記出力ベクトルの要素群が前記入力ベクトルの要素群に対応する、該予測ステップと
    を含む予測方法。
  5. 対象者の過去の受診記録を所定のデータベースから取得する取得ステップであって、該受診記録が少なくとも医療処置を示す、該取得ステップと、
    前記受診記録に基づいて複数の入力ベクトルを生成し、各入力ベクトルの要素群を所定の数値範囲内で正規化する変換ステップであって、前記要素群が、前記医療処置を示す要素を少なくとも含む、該変換ステップと、
    前記正規化された各入力ベクトルを学習アルゴリズムに入力することで、将来の所定の時期における前記対象者の状態の予測を示す出力ベクトルを求める予測ステップであって、前記出力ベクトルの要素群が前記入力ベクトルの要素群に対応する、該予測ステップと
    をコンピュータシステムに実行させる予測プログラム。
JP2017095794A 2017-05-12 2017-05-12 予測システム、予測方法、および予測プログラム Active JP6929124B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017095794A JP6929124B2 (ja) 2017-05-12 2017-05-12 予測システム、予測方法、および予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017095794A JP6929124B2 (ja) 2017-05-12 2017-05-12 予測システム、予測方法、および予測プログラム

Publications (2)

Publication Number Publication Date
JP2018194904A true JP2018194904A (ja) 2018-12-06
JP6929124B2 JP6929124B2 (ja) 2021-09-01

Family

ID=64571496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017095794A Active JP6929124B2 (ja) 2017-05-12 2017-05-12 予測システム、予測方法、および予測プログラム

Country Status (1)

Country Link
JP (1) JP6929124B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187723A (ja) * 2019-05-13 2020-11-19 エスアーペー エスエー プライバシーを保護しながら分散された顧客データ上で機械学習すること
JP2021068174A (ja) * 2019-10-23 2021-04-30 株式会社東芝 健康支援システム及びプログラム
JP2022065492A (ja) * 2020-10-15 2022-04-27 アイエムエス ソフトウェア サービシズ リミテッド 情報処理装置、情報処理方法及びプログラム
CN115309754A (zh) * 2022-10-11 2022-11-08 之江实验室 一种基于信息稀疏情形的混频预测方法、装置及设备
JP2022179091A (ja) * 2021-05-21 2022-12-02 株式会社N・フィールド 看護情報処理システム
WO2023276976A1 (ja) * 2021-06-28 2023-01-05 富士フイルム株式会社 医療支援装置、医療支援装置の作動方法、医療支援装置の作動プログラム、学習装置、および学習方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067499A (ja) * 2001-08-22 2003-03-07 Mitsubishi Chemicals Corp 健康診断方法および健康診断システム、健康診断システム用サーバおよび端末、ならびに健康診断システム用プログラム
JP2003263502A (ja) * 2002-03-07 2003-09-19 Heizo Tokutaka 健康診断用の自己組織化マップ及びその作成方法、自己組織化マップを利用した健康状態表示方法、並びに健康状態表示用プログラム
JP2006305260A (ja) * 2005-04-28 2006-11-09 Ichiro Hagiwara 表情診断支援装置
JP2013191021A (ja) * 2012-03-14 2013-09-26 Seiko Epson Corp 健康診断情報提供装置及び健康診断情報提供方法
JP2016197330A (ja) * 2015-04-03 2016-11-24 日本電気株式会社 分析システム、リハビリテーション支援システム、方法およびプログラム
JP2017027509A (ja) * 2015-07-27 2017-02-02 Kddi株式会社 予測モデル構築装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067499A (ja) * 2001-08-22 2003-03-07 Mitsubishi Chemicals Corp 健康診断方法および健康診断システム、健康診断システム用サーバおよび端末、ならびに健康診断システム用プログラム
JP2003263502A (ja) * 2002-03-07 2003-09-19 Heizo Tokutaka 健康診断用の自己組織化マップ及びその作成方法、自己組織化マップを利用した健康状態表示方法、並びに健康状態表示用プログラム
JP2006305260A (ja) * 2005-04-28 2006-11-09 Ichiro Hagiwara 表情診断支援装置
JP2013191021A (ja) * 2012-03-14 2013-09-26 Seiko Epson Corp 健康診断情報提供装置及び健康診断情報提供方法
JP2016197330A (ja) * 2015-04-03 2016-11-24 日本電気株式会社 分析システム、リハビリテーション支援システム、方法およびプログラム
JP2017027509A (ja) * 2015-07-27 2017-02-02 Kddi株式会社 予測モデル構築装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
坪井 祐太: "機械学習による自然言語処理 言葉を扱う技術とビッグデータの接点", PROVISION FALL 2014, JPN6021000034, 31 October 2014 (2014-10-31), JP, pages 44 - 47, ISSN: 0004423230 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187723A (ja) * 2019-05-13 2020-11-19 エスアーペー エスエー プライバシーを保護しながら分散された顧客データ上で機械学習すること
JP7229148B2 (ja) 2019-05-13 2023-02-27 エスアーペー エスエー プライバシーを保護しながら分散された顧客データ上で機械学習すること
US11797879B2 (en) 2019-05-13 2023-10-24 Sap Se Machine learning on distributed customer data while protecting privacy
JP2021068174A (ja) * 2019-10-23 2021-04-30 株式会社東芝 健康支援システム及びプログラム
JP7191800B2 (ja) 2019-10-23 2022-12-19 株式会社東芝 健康支援システム、プログラム及び方法
JP2022065492A (ja) * 2020-10-15 2022-04-27 アイエムエス ソフトウェア サービシズ リミテッド 情報処理装置、情報処理方法及びプログラム
JP7416679B2 (ja) 2020-10-15 2024-01-17 アイエムエス ソフトウェア サービシズ リミテッド 情報処理装置、情報処理方法及びプログラム
JP2022179091A (ja) * 2021-05-21 2022-12-02 株式会社N・フィールド 看護情報処理システム
JP7203896B2 (ja) 2021-05-21 2023-01-13 株式会社N・フィールド 看護情報処理システム
WO2023276976A1 (ja) * 2021-06-28 2023-01-05 富士フイルム株式会社 医療支援装置、医療支援装置の作動方法、医療支援装置の作動プログラム、学習装置、および学習方法
CN115309754A (zh) * 2022-10-11 2022-11-08 之江实验室 一种基于信息稀疏情形的混频预测方法、装置及设备
CN115309754B (zh) * 2022-10-11 2023-03-10 之江实验室 一种基于信息稀疏情形的混频预测方法、装置及设备

Also Published As

Publication number Publication date
JP6929124B2 (ja) 2021-09-01

Similar Documents

Publication Publication Date Title
JP6929124B2 (ja) 予測システム、予測方法、および予測プログラム
Chen et al. Ethical machine learning in healthcare
Li et al. A distributed ensemble approach for mining healthcare data under privacy constraints
Melas et al. Modeling the acceptance of clinical information systems among hospital medical staff: an extended TAM model
Hung et al. Understanding physicians’ acceptance of the Medline system for practicing evidence-based medicine: A decomposed TPB model
US8788291B2 (en) System and method for estimation of missing data in a multivariate longitudinal setup
CA3137079A1 (en) Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers
Konrad et al. Key considerations when using health insurance claims data in advanced data analyses: an experience report
JP2008532104A (ja) 複数の医療関連アウトカムの予測を行い、インターベンション計画の評価を行い、更に同時にバイオマーカー因果性検証を行うことのできる、予測モデルを生成して適用する方法、そのシステム、及びそのコンピュータ・プログラム製品
Li et al. Marginal modeling of cluster-period means and intraclass correlations in stepped wedge designs with binary outcomes
Abdekhoda et al. Determinant factors in applying picture archiving and communication systems (PACS) in healthcare
Feldman et al. Beyond volume: The impact of complex healthcare data on the machine learning pipeline
US20230130083A1 (en) Computer system of computer servers and dedicated computer clients specially programmed to generate synthetic non-reversible electronic data records based on real-time electronic querying and methods of use thereof
He et al. Multiple imputation of missing data in practice: Basic theory and analysis strategies
Zimmer et al. Accurate quantification of uncertainty in epidemic parameter estimates and predictions using stochastic compartmental models
CN112908452A (zh) 事件数据建模
Gao et al. Bayesian causal mediation analysis with multiple ordered mediators
Dubey et al. Predicting diabetic neuropathy risk level using artificial neural network and clinical parameters of subjects with diabetes
Hillsgrove et al. Utilization of data mining for generalizable, all-admission prediction of inpatient mortality
JP2021089523A (ja) 保健医療データ分析システム及び保健医療データ分析方法
JP2020204910A (ja) 情報処理装置、情報処理方法、プログラム及び学習済みモデル
CN113066531B (zh) 风险预测方法、装置、计算机设备及存储介质
Gorter et al. Missing item responses in latent growth analysis: Item response theory versus classical test theory
KR20180108671A (ko) 전자 건강 기록들을 사용하여 의학적 상태들에 대한 진단 및 치료 옵션들을 식별하는 방법 및 시스템
US11361568B2 (en) Generating document content by data analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210810

R150 Certificate of patent or registration of utility model

Ref document number: 6929124

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350