JP6818701B2 - 状態遷移予測モデル学習装置、方法およびプログラム - Google Patents

状態遷移予測モデル学習装置、方法およびプログラム Download PDF

Info

Publication number
JP6818701B2
JP6818701B2 JP2018000147A JP2018000147A JP6818701B2 JP 6818701 B2 JP6818701 B2 JP 6818701B2 JP 2018000147 A JP2018000147 A JP 2018000147A JP 2018000147 A JP2018000147 A JP 2018000147A JP 6818701 B2 JP6818701 B2 JP 6818701B2
Authority
JP
Japan
Prior art keywords
state transition
record
period
training data
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018000147A
Other languages
English (en)
Other versions
JP2019121154A (ja
Inventor
央 倉沢
央 倉沢
昭宏 千葉
昭宏 千葉
佳那 江口
佳那 江口
籔内 勉
勉 籔内
直樹 麻野間
直樹 麻野間
吉田 和広
和広 吉田
正造 東
正造 東
山田 智広
智広 山田
昭典 藤野
昭典 藤野
勝義 林
勝義 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018000147A priority Critical patent/JP6818701B2/ja
Publication of JP2019121154A publication Critical patent/JP2019121154A/ja
Application granted granted Critical
Publication of JP6818701B2 publication Critical patent/JP6818701B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Description

この発明は、検査対象の状態遷移が発生する傾向の大きさを表すスコアを算出するための状態遷移予測モデルを、訓練データを利用して更新する状態遷移予測モデル学習装置、方法およびプログラムに関する。
人が健康から未病(病気になりつつある状態)、発症、重症化へと至る疾病状態の遷移を医療健康データ(検診データやレセプトデータ等)から予測することは、健康維持に向けた施策や治療方針策定、介入支援の効果を高めることに寄与する。例えば、企業で実施した健診結果をもとに発症状態に至りやすい社員を予測できれば、その社員から優先的に保健師が生活習慣を指導して介入の効果を高めることができる。
一般的に、医療健康データを用いた疾病状態の遷移の予測モデル構築には、計測開始日時(例えば、検診を受健した入社時)から最後に計測した日時(例えば、検診を最後に受健した退職時や、現在も勤務していれば直近の受健時)までの期間の検診データと疾病状態が遷移した日時が対になったデータが訓練データとして用いられる。最後に計測した日時に至るまで疾病状態の遷移が発生しなかったデータは、「打ち切り」が生じたデータ(以下、打ち切り訓練データと称する。)として、最後に計測した日時に至るまでに疾病状態の遷移が発生したデータは、疾病状態の遷移が「完了」したデータ(以下、完了訓練データと称する。)として、訓練データに含められる。
疾病状態の遷移の予測を実現する技術として生存時間分析が知られている。生存時間分析を用いることで、疾病状態が遷移するまでの期間の長さと因子との関係性をモデルとして表現できる。例えば、生存時間分析の一手法であるCOX比例ハザードモデルは、因子の有無がある時点における遷移の確率に及ぼす影響の大きさ(ハザード比)を求めることができる(例えば、非特許文献1参照)。しかし、生存時間分析で用いられるモデルの多くは、ハザード比が時間に依存しない変数のみをモデルに含めることを制約とする。それゆえ、生存時間分析の適用範囲は限定的である。
生存時間分析のモデルの制約条件を緩和した方法として、ランキング学習を用いる技術が知られている。このようなランキング学習を用いる技術では、疾病状態が遷移するまでの期間の長さを直接予測せず、疾病状態が遷移するまでの期間の長さに基づく順位が予測される。ランキング学習に使用されるモデルの構築では、疾病状態の遷移のしやすさを表すスコア関数の出力値が順位と一致した大小関係となるように、モデルが学習される(例えば、非特許文献2参照)。しかし、ランキング学習はすべてのレコード間で順位を比較可能であることを前提としているため、訓練データに打ち切り訓練データを含めてモデル学習できない。また、順位を予測対象とするため、疾病状態が遷移するまでの期間の長さを予測することはできない。
D. R. Cox, "Regression Models and Life‐Tables", Journal of the Royal Statistical Society. Series B (Methodological), Vol. 34, No. 2., pp.187-220, 1972.〈URL:http://www.ida.liu.se/~kawah/Cox2.pdf〉 Christopher J. C. Burges, Tal Shaked, Erin Renshaw, Ari Lazier, Matt Deeds, Nicole Hamilton, Gregory N. Hullender. Learning to rank using gradient descent. ICML 2005: 89-96.
上述した生存時間分析では、モデル設計に制約があり、それゆえ適用範囲が限定的であることが課題である。
また、上述したランキング学習は、モデル設計の自由度は生存時間分析よりも高いが、モデルの学習において使用されるすべてのレコード間で順位を比較可能であることを前提としている。そのため、ランキング学習では、訓練データに上述のような打ち切り訓練データを含めてモデル学習できないことと、状態が遷移するまでの期間の長さを直接予測できないことが課題である。
この発明は上記事情に着目してなされたもので、その目的とするところは、検査対象の状態遷移が発生する傾向の大きさを表すスコアを算出するための状態遷移予測モデルを、打ち切り訓練データを利用して更新できる状態遷移予測モデル学習装置、方法およびプログラムを提供することにある。
上記課題を解決するために、この発明の第1の態様は、検査対象に係る所定の検査の結果を含むレコードについて、当該所定の検査の結果に基づいて、当該検査対象の状態遷移が発生する傾向の大きさを表すスコアを算出するための第1予測モデルを学習する状態遷移予測モデル学習装置にあって、前記第1予測モデルを記憶する記憶媒体と、訓練対象に係る前記所定の検査の結果を各々が含む複数時点のレコードと、当該複数時点のレコードの各々に対応する日時で当該訓練対象の状態遷移が発生しているか否かを示す状態遷移発生情報とを含む訓練データを取得する訓練データ取得部と、前記第1予測モデルを使用して、前記取得された訓練データに係るレコードに含まれる前記所定の検査の結果に基づいて、当該レコードに係る前記スコアを算出するスコア算出部と、前記取得された訓練データに係る状態遷移発生情報が、前記複数時点のうちいずれかの時点で前記訓練対象の状態遷移が既に発生していることを示している場合、当該取得された訓練データを完了訓練データとして、当該完了訓練データに含まれる前記複数時点のレコードのうち当該状態遷移が発生する以前の時点のレコードの各々について、当該状態遷移が発生するまでに要した期間の長さを算出する第1期間算出部と、前記取得された訓練データに係る状態遷移発生情報が、前記複数時点のいずれの時点においても前記訓練対象の状態遷移が発生していないことを示している場合、当該取得された訓練データを打ち切り訓練データとして、当該打ち切り訓練データに含まれるレコードの各々について、当該状態遷移が発生するまでに少なくとも要する期間の長さとして、当該レコードに対応する日時から前記複数時点のうち最後の時点のレコードに対応する日時までの期間の長さに、予め設定された期間の長さを加えた期間の長さを算出する第2期間算出部と、前記取得された各訓練データに含まれるレコードのうち2つのレコードを選択するレコード選択部と、前記選択された2つのレコードのうち一方が前記打ち切り訓練データに含まれるレコードであり、もう一方が前記完了訓練データに含まれるレコードであり、かつ、当該打ち切り訓練データに含まれるレコードについて前記算出された前記状態遷移が発生するまでに少なくとも要する期間の長さと比較して、当該完了訓練データに含まれるレコードについて前記算出された前記状態遷移が発生するまでに要した期間の長さが小さい場合に、当該2つのレコードについて前記スコア算出部によって算出されるスコアの大小関係が、当該2つのレコードについて前記算出された期間の長さの大小関係に対応するように、前記第1予測モデルを更新する第1更新部とを備えるようにしたものである。
この発明の第2の態様は、前記状態遷移予測モデル学習装置が、前記選択された2つのレコードの各々が前記完了訓練データからのレコードである場合に、当該2つのレコードについて前記スコア算出部によって算出されるスコアの大小関係が、当該2つのレコードについて前記算出された前記状態遷移が発生するまでに要した期間の長さの大小関係に対応するように、前記第1予測モデルを更新する第2更新部をさらに備えるようにしたものである。
この発明の第3の態様は、前記第1期間算出部が、前記完了訓練データに含まれる前記複数時点のレコードについて、当該複数時点のうち任意の隣接する2つの時点の間の期間が所定の期間を超えており、かつ、当該所定の期間を超える2つの時点のうち後の時点のレコードが、前記訓練対象の状態遷移が既に発生していると示された最初の時点のレコードである場合、当該完了訓練データに含まれる前記複数時点のレコードのうち当該状態遷移が発生する以前の時点のレコードの各々について、前記状態遷移が発生するまでに要した期間の長さとして、当該レコードに対応する日時から当該状態遷移が既に発生していると示された最初の時点のレコードに対応する日時までの期間の長さ以下であり、当該期間の長さから、前記所定の期間を超える2つの時点の間の期間に対応する期間の長さを引いた期間の長さ以上である範囲を算出するようにしたものである。
この発明の第4の態様は、前記記憶媒体が、前記検査対象に係る前記レコードについて前記第1予測モデルを使用して算出されたスコアに基づいて、当該レコードに対応する日時から当該検査対象の状態遷移が発生するまでの期間の長さを推定するための第2予測モデルをさらに記憶し、前記状態遷移予測モデル学習装置が、前記第2予測モデルを使用して、前記訓練対象に係る前記完了訓練データに含まれるレコードについて前記第1予測モデルを使用して算出されたスコアに基づいて、当該レコードに対応する日時から当該訓練対象の状態遷移が発生するまでの期間の長さを推定する期間推定部と、前記訓練対象に係る前記完了訓練データに含まれるレコードについて前記期間推定部によって推定された状態遷移が発生するまでの期間の長さと、当該レコードについて前記第1期間算出部によって算出された前記状態遷移が発生するまでに要した期間の長さとに基づいて、前記第2予測モデルを更新する第3更新部とをさらに備えるようにしたものである。
本願発明では、状態遷移が発生する傾向の大きさを表すスコアを算出するための第1予測モデルの設計で変数を制約なく加えられ、また、完了訓練データのみならず打ち切り訓練データをも利用して第1予測モデルを学習できる。このため、従来よりも利用可能な訓練データの変数の種類とデータの量が豊富で、訓練データの収集が容易となり、実用に耐えうる第1予測モデルとなるまでの構築期間が従来と比べて短くなるという顕著な効果がある。
また、本願発明では、第1予測モデルの構築期間が短くなるので、第1予測モデルを使用して状態遷移が発生するまでの期間の長さを推定することに関し、精度が高い期間推定を行えるようになるまでの所要時間が従来と比べて短くなるという顕著な効果がある。
この発明の第1の実施形態に係る状態遷移予測装置の機能構成を示すブロック図。 図1に示した制御ユニットによって実行される、訓練段階における第1予測モデル学習処理の一例を示すフロー図。 図1に示した制御ユニットによって実行される、訓練段階における第2予測モデル学習処理の一例を示すフロー図。 図1に示した制御ユニットによって実行される、テスト段階における遷移予測処理の一例を示すフロー図。 訓練データの一例を示す図。 訓練データの一例を示す図。 訓練データの一例を示す図。 図5Aに示した訓練データにおいて、状態遷移が発生するまでの期間の長さを算出した例を示す図。 図5Bに示した訓練データにおいて、状態遷移が発生するまでの期間の長さを算出した例を示す図。 図5Cに示した訓練データにおいて、状態遷移が発生するまでの期間の長さを算出した例を示す図。 遷移予測処理において使用される第1予測モデルと第2予測モデルの一例を示す図。 第1予測モデル学習処理の一例の概略図。 第2予測モデル学習処理の一例の概略図。 テストデータの一例を示す図。 テストデータに基づく遷移予測処理の一例の概略図。 表示部において出力される遷移予測処理結果の表示の一例を示す図。
以下、図面を参照してこの発明に係わる実施形態を説明する。
[第1の実施形態]
(構成)
図1は、この発明の第1の実施形態に係る、状態遷移予測モデル学習装置としての状態遷移予測装置1の機能構成を示すブロック図である。
図1に図示される状態遷移予測装置1は、検査対象の状態遷移が発生する傾向の大きさを表すスコアを算出するための第1予測モデル、および、当該算出されたスコアに基づいて上記検査対象の状態遷移が発生するまでの期間の長さを推定するための第2予測モデルを、打ち切り訓練データを含む訓練データを利用して更新して学習することができる。また、状態遷移予測モデル1は、このように学習された第1予測モデルおよび第2予測モデルを使用して、検査対象に係る状態遷移予測を実行することができる。
なお、状態遷移とは、例えば、人が健康から未病(病気になりつつある状態)、発症、重症化へと至る疾病状態の遷移である。なお、この発明の第1の実施形態に係る状態遷移は、上述した疾病状態の遷移に限られるものではなく、状態が遷移し、遷移するまでの期間が条件によって異なる任意のものを対象とする。すなわち、上記状態遷移は、例えば、サービスの契約前・契約後・解約といった顧客状態の遷移や、化学反応による物質の状態の遷移や、風化等の劣化による物質の破壊状態の遷移等を表していてもよい。
状態遷移予測装置1は、ハードウェアとして、制御ユニット11と、記憶ユニット12と、入出力インタフェースユニット13とを備えている。
入出力インタフェースユニット13は、例えば、キーボードやマウス等を含む入力部2によって入力された訓練データ、テストデータ、および操作信号等を制御ユニット11に入力するとともに、制御ユニット11から出力された表示データを表示部3に表示させる。当該訓練データは、例えば、訓練対象に係る所定の検査の結果を各々が含む複数時点のレコードと、当該複数時点のレコードの各々に対応する日時で当該訓練対象の状態遷移が発生しているか否かを示す状態遷移発生情報とを含んでいる。なお、当該対応する日時とは、例えば、各レコードが記録された年度や日時等の、各レコードを代表する日時である。また、テストデータは、検査対象に係る上記所定の検査の結果を含むレコードを含んでいる。
記憶ユニット12は、記憶媒体として例えばHDD(Hard Disc Drive)またはSSD(Solid State Drive)等の随時書き込みおよび読み出しが可能な不揮発メモリを使用したもので、本実施形態を実現するために、訓練データ記憶部121と、管理データ記憶部122と、予測モデル記憶部123と、テストデータ記憶部124と、予測結果記憶部125とを備えている。
訓練データ記憶部121は、入力部2を介して取得された上記訓練データを記憶させるために使用される。
管理データ記憶部122は、訓練データ管理部112の制御下で処理された上記訓練データに係るデータを記憶させるために使用される。
予測モデル記憶部123は、状態遷移予測モデルとしての、第1予測モデルおよび第2予測モデルを記憶している。当該第1予測モデルは、検査対象に係る所定の検査の結果を含むレコードについて、当該所定の検査の結果に基づいて、当該検査対象の状態遷移が発生する傾向の大きさを表すスコアを算出するために使用されるモデルである。また、当該第2予測モデルは、上記検査対象に係る上記レコードについて第1予測モデルを使用して算出されたスコアに基づいて、当該レコードに対応する日時から当該検査対象の状態遷移が発生するまでの期間の長さを推定するために使用されるモデルである。
テストデータ記憶部124は、入力部2を介して取得されたテストデータを記憶させるために使用される。
予測結果記憶部125は、遷移予測部114の制御下で予測された結果である、テストデータに係る検査対象の状態遷移が発生するまでの期間の長さに係る情報を記憶させるために使用される。
制御ユニット11は、CPU(Central Processing Unit)等のハードウェアプロセッサと、プログラムメモリとを備え、本実施形態における処理機能を実行するために、訓練データ取得部111と、訓練データ管理部112と、モデル学習部113と、遷移予測部114と、テストデータ取得部115と、出力制御部116とを備えている。これらの各部における処理機能はいずれも、プログラムメモリに格納されたプログラムを上記ハードウェアプロセッサに実行させることによって実現される。なお、プログラムメモリに格納されたプログラムを用いるのではなく、ネットワークを通して提供されるプログラムを用いてもよい。
訓練データ取得部111は、入力部2によって入力された訓練データを取得し、当該取得された訓練データを、記憶ユニット12の訓練データ記憶部121に記憶させる処理を実行する。なお、訓練データは、訓練対象に係る所定の検査の結果を各々が含む複数時点のレコードと、当該複数時点のレコードの各々に対応する日時で当該訓練対象の状態遷移が発生しているか否かを示す状態遷移発生情報とを含んでいる。
訓練データ管理部112は、記憶ユニット12の訓練データ記憶部121に記憶される訓練データを読み出し、当該読み出された訓練データの管理に係る処理を実行する。
具体的には、訓練データ管理部112が備えるデータ種判別部1121が、上記読み出された訓練データに含まれる上記状態遷移発生情報を参照し、上記複数時点のうちいずれかの時点で訓練対象の状態遷移が既に発生しているか否かを判定する処理を実行する。データ種判別部1121は、上記複数時点のうちいずれかの時点で訓練対象の状態遷移が既に発生していると判定された場合、上記読み出された訓練データが完了訓練データであると判別し、一方、上記複数時点のいずれの時点においても訓練対象の状態遷移が発生していないと判定された場合、上記読み出された訓練データが打ち切り訓練データであると判別する処理を実行する。
次に、訓練データ管理部112が備える遷移期間算出部1122は、上記読み出された訓練データが完了訓練データである場合には、当該完了訓練データに含まれる上記複数時点のレコードのうち上記状態遷移が発生する以前の時点のレコードの各々について、当該状態遷移が発生するまでに要した期間の長さを算出する処理を実行する。
遷移期間算出部1122は、上記読み出された訓練データが打ち切り訓練データである場合には、当該打ち切り訓練データに含まれるレコードの各々について、上記状態遷移が発生するまでに少なくとも要する期間の長さとして、当該レコードに対応する日時から上記複数時点のうち最後の時点のレコードに対応する日時までの期間の長さに、予め設定された期間の長さを加えた期間の長さを算出する処理を実行する。なお、当該予め設定された期間の長さは、例えば、訓練データに等間隔の複数時点のレコードが含まれている場合は、当該複数時点のうち隣接する2つの時点の間隔の長さであってもよい。当該予め設定された期間の長さはこれに限定されるわけではなく、最後の時点のレコードに対応する日時から状態遷移が発生しないであろう先の時点までの任意の間隔の長さであってもよい。
訓練データ管理部112は、上記読み出された訓練データに、データ種判別部1121の制御の下で判別された、当該訓練データが完了訓練データであるか打ち切り訓練データであるかの情報を対応付け、さらに、当該訓練データに含まれる上記複数時点のレコードの各レコードに、遷移期間算出部1122の制御の下で当該レコードについて算出された、上記状態遷移が発生するまでに要した期間の長さ、あるいは、上記状態遷移が発生するまでに少なくとも要する期間の長さを示す情報を対応付けて、記憶ユニット12の管理データ記憶部122に記憶させる処理を実行する。
モデル学習部113は、記憶ユニット12の予測モデル記憶部123に記憶される第1予測モデルおよび第2予測モデルを更新して学習する処理を実行する。
最初に、モデル学習部113において実行される第1予測モデルの更新処理について説明する。
先ず、モデル学習部113は、記憶ユニット12の管理データ記憶部122に記憶される各訓練データに含まれるレコードのうち2つのレコードを選択して読み出す処理を実行する。次に、モデル学習部113は、当該選択された2つのレコードが比較可能なレコードか否かを判定する。すなわち、モデル学習部113は、選択された2つのレコードの各々が完了訓練データからのレコードであるという第1条件を満たすか否かを判定する。あるいは、モデル学習部113は、選択された2つのレコードのうち一方が打ち切り訓練データに含まれるレコードであり、もう一方が完了訓練データに含まれるレコードであり、かつ、管理データ記憶部122に記憶される、当該打ち切り訓練データに含まれるレコードについて算出された上記状態遷移が発生するまでに少なくとも要する期間の長さと比較して、管理データ記憶部122に記憶される、当該完了訓練データに含まれるレコードについて算出された上記状態遷移が発生するまでに要した期間の長さが小さいという第2条件を満たすか否かを判定する。
上述した第1条件と第2条件とのいずれかの条件が満たされた場合、当該選択された2つのレコードの各々について、遷移予測部114が、記憶ユニット12の予測モデル記憶部123に記憶される第1予測モデルを読み出し、当該読み出された第1予測モデルを使用して、当該レコードに含まれる上記所定の検査の結果に基づいて、当該レコードに係る上記スコアを算出する処理を実行する。
モデル学習部113は、上記選択された2つのレコードについて遷移予測部114の制御下で算出された上記スコアの大小関係が、記憶ユニット12の管理データ記憶部122に記憶される、当該2つのレコードについて遷移期間算出部1122の制御下で算出された上記期間の長さの大小関係に対応するように、記憶ユニット12の予測モデル記憶部123に記憶される第1予測モデルのパラメータを更新する処理を実行する。
次に、モデル学習部113において実行される第2予測モデルの更新処理について説明する。
先ず、モデル学習部113は、記憶ユニット12の管理データ記憶部122に記憶される完了訓練データに含まれるレコードのうち1つのレコードを選択して読み出す処理を実行する。
次に、当該選択された1つのレコードについて、遷移予測部114が、記憶ユニット12の予測モデル記憶部123に記憶される第1予測モデルを読み出し、当該読み出された第1予測モデルを使用して、当該レコードに含まれる上記所定の検査の結果に基づいて、当該レコードに係る上記スコアを算出する処理を実行する。
さらに、遷移予測部114は、記憶ユニット12の予測モデル記憶部123に記憶される第2予測モデルを読み出し、当該読み出された第2予測モデルを使用して、上記選択された1つのレコードについて第1予測モデルを使用して算出された上記スコアに基づいて、当該レコードに対応する日時から当該レコードに係る検査対象の状態遷移が発生するまでの期間の長さを推定する処理を実行する。
次に、モデル学習部113は、上記選択された1つのレコードについて遷移予測部114の制御の下で推定された上記状態遷移が発生するまでの期間の長さと、記憶ユニット12の管理データ記憶部122に記憶される、当該レコードについて算出された上記状態遷移が発生するまでに要した期間の長さとに基づいて、記憶ユニット12の予測モデル記憶部123に記憶される第2予測モデルのパラメータを更新する処理を実行する。
遷移予測部114は、第1予測モデルおよび第2予測モデルを使用して、テストデータについて遷移予測処理を実行することができる。
先ず、テストデータ取得部115が、入力部2によって入力されたテストデータを取得し、当該取得されたテストデータを、記憶ユニット12のテストデータ記憶部124に記憶させる処理を実行する。なお、テストデータは、検査対象に係る上記所定の検査の結果を含むレコードを含んでいる。
遷移予測部114は、記憶ユニット12のテストデータ記憶部124に記憶されるテストデータを読み出し、さらに、記憶ユニット12の予測モデル記憶部123に記憶される第1予測モデルを読み出す処理を実行する。遷移予測部114は、当該読み出された第1予測モデルを使用して、上記読み出されたテストデータに係るレコードに含まれる上記所定の検査の結果に基づいて、当該レコードに係る上記スコアを算出する処理を実行する。
さらに、遷移予測部114は、記憶ユニット12の予測モデル記憶部123に記憶される第2予測モデルを読み出す処理を実行することができる。遷移予測部114は、当該読み出された第2予測モデルを使用して、上記テストデータに係るレコードについて第1予測モデルを使用して算出された上記スコアに基づいて、当該レコードに対応する日時から上記検査対象の状態遷移が発生するまでの期間の長さを推定する処理を実行することができる。
遷移予測部114は、上記テストデータに係るレコードについて第1予測モデルを使用して算出された上記スコアを示すデータを、あるいは、上記テストデータに係るレコードについて第2予測モデルを使用して推定された上記状態遷移が発生するまでの期間の長さを示すデータを、記憶ユニット12の予測結果記憶部125に記憶させる処理を実行する。
出力制御部116は、記憶ユニット12の予測結果記憶部125にアクセスし、上記テストデータに係るレコードについて第1予測モデルを使用して算出された上記スコアを示すデータを表す表示データを、あるいは、上記テストデータに係るレコードについて第2予測モデルを使用して推定された上記状態遷移が発生するまでの期間の長さを示すデータを表す表示データを、入出力インタフェースユニット13を介して表示部3に送信する処理を実行する。
(動作)
次に、以上のように構成された状態遷移予測装置1の動作を説明する。
図2は、図1に示した制御ユニット11によって実行される、訓練段階における第1予測モデル学習処理の一例を示すフロー図であり、図3は、図1に示した制御ユニット11によって実行される、訓練段階における第2予測モデル学習処理の一例を示すフロー図である。図4は、図1に示した制御ユニットによって実行される、テスト段階における遷移予測処理の一例を示すフロー図である。
以下では、これらのフロー図について、図5から図12を参照しながら詳細に説明する。
(1)第1予測モデル学習処理
最初に、図2に示す、訓練段階における第1予測モデル学習処理について詳細に説明する。
先ず、ステップS11において、制御ユニット11は、訓練データ取得部111の制御の下、入力部2によって入力された訓練データを取得し、当該取得された訓練データを訓練データ記憶部121に記憶させる。なお、訓練データは、訓練対象に係る所定の検査の結果を各々が含む複数時点のレコードと、当該複数時点のレコードの各々に対応する日時で当該訓練対象の状態遷移が発生しているか否かを示す状態遷移発生情報とを含んでいる。
図5A、図5B、および図5Cはそれぞれ、訓練データとしての、A、B、およびCの3人の医療健康データの一例を示している。各医療健康データは、検査対象としてのA、B、およびCに係る所定の検査の結果である「HbA1c」、「BMI」、および「体脂肪」の数値を各々が含む複数時点のレコードと、当該複数時点のレコードの各々に対応する日時でA、B、およびCの状態遷移が発生すなわち発症しているか否かを示す状態遷移発生情報としての「発症」の項目とを含んでいる。
図5Aに示されるように、Aについては、2009年から2013年までの各年について1つの5年分のレコードがあり、2012年に発症していることが示されている。図5Bに示されるように、Bについては、2005年、2006年、および2008年の各年について1つの3年分のレコードがあり、2007年のレコードは欠落しており、2008年に発症していることが示されている。図5Cに示されるように、Cについては、2003年から2006年までの各年について1つの4年分のレコードがあり、この期間に発症していないことが示されている。
次に、ステップS12において、制御ユニット11は、訓練データ管理部112の制御の下、訓練データ記憶部121に記憶される訓練データを読み出し、訓練データ管理部112のデータ種判別部1121の制御の下、上記読み出された訓練データに含まれる上記状態遷移発生情報を参照し、上記複数時点のうちいずれかの時点で訓練対象の状態遷移が既に発生しているか否かを判定する。その後、制御ユニット11は、データ種判別部1121の制御の下、上記複数時点のうちいずれかの時点で訓練対象の状態遷移が既に発生していると判定された場合、上記読み出された訓練データが完了訓練データであると判別し、一方、上記複数時点のいずれの時点においても訓練対象の状態遷移が発生していないと判定された場合、上記読み出された訓練データが打ち切り訓練データであると判別する。
図5A、図5B、および図5Cの例では、Aに係る医療健康データについては、「発症」の項目により、2012年および2013年のレコードに対応する時点でAの疾病状態の遷移が既に発生すなわち発症していることが示されているため、Aに係る医療健康データは完了訓練データであると判別される。同様に、Bに係る医療健康データについても、「発症」の項目により、2008年のレコードに対応する時点でBの疾病状態の遷移が既に発生すなわち発症していることが示されているため、Bに係る医療健康データも完了訓練データであると判別される。一方、Cに係る医療健康データについては、「発症」の項目により、すべてのレコードに対応する時点でCの疾病状態の遷移が未だ発生していないすなわち発症していないことが示されているため、Cに係る医療健康データは打ち切り訓練データであると判別される。
ステップS13において、制御ユニット11は、訓練データ管理部112の遷移期間算出部1122の制御の下、上記読み出された訓練データが完了訓練データである場合には、当該完了訓練データに含まれる上記複数時点のレコードのうち上記状態遷移が発生する以前の時点のレコードの各々について、当該状態遷移が発生するまでに要した期間の長さを算出する。一方、制御ユニット11は、遷移期間算出部1122の制御の下、上記読み出された訓練データが打ち切り訓練データである場合には、当該打ち切り訓練データに含まれるレコードの各々について、上記状態遷移が発生するまでに少なくとも要する期間の長さとして、当該レコードに対応する日時から上記複数時点のうち最後の時点のレコードに対応する日時までの期間の長さに、予め設定された期間の長さを加えた期間の長さを算出する。
制御ユニット11は、訓練データ管理部112の制御の下、上記読み出された訓練データに、ステップS12において判別された、当該訓練データが完了訓練データであるか打ち切り訓練データであるかの情報を対応付け、さらに、当該訓練データに含まれる上記複数時点のレコードの各レコードに、ステップS13において当該レコードについて算出された、上記状態遷移が発生するまでに要した期間の長さ、あるいは、上記状態遷移が発生するまでに少なくとも要する期間の長さを示す情報を対応付けて、管理データ記憶部122に記憶させる。
図6A、図6B、および図6Cはそれぞれ、図5A、図5B、および図5Cに示した医療健康データにおいて、発症に至るまでの期間の長さ(年)を算出した例を示す図である。
図5Aに示されるAに係る医療健康データは、2012年に発症していることが示されている完了訓練データであり、2009年から2013年までの各年について1つの5年分のレコードを含んでいる。このため、発症する以前である2009年から2012年の時点のレコードの各々について、発症に至るまでに要した期間の長さが算出される。すなわち、図6Aに示されているように、2009年、2010年、2011年、および2012年の時点のレコードに対してそれぞれ、3年、2年、1年、および0年の期間が算出されている。
図5Bに示されるBに係る医療健康データは、2008年に発症していることが示されている完了訓練データであるが、2005年、2006年、および2008年の各年について1つの3年分のレコードを含んでいる一方、2007年のレコードを欠落している。当該医療健康データでは、2008年に発症していることが示されているが、欠落しているレコードに対応する2007年に発症しているか否かはわからない。したがって、図6Bに示されているように、2005年、2006年、および2007年の時点の各レコードに対してそれぞれ、発症に至るまでに要した期間の長さとして、2007年に発症した場合の期間の長さと2008年に発症した場合の期間の長さを並べて、2もしくは3年、1もしくは2年、および、0もしくは1年の期間が算出されている。
当該期間の算出は、例えば、完了訓練データに含まれる複数時点のレコードについて、当該複数時点のうち任意の隣接する2つの時点の間の期間が所定の期間を超えており、かつ、当該所定の期間を超える2つの時点のうち後の時点のレコードが、訓練対象の状態遷移が既に発生していると示された最初の時点のレコードである場合、当該完了訓練データに含まれる複数時点のレコードのうち当該状態遷移が発生する以前の時点のレコードの各々について、状態遷移が発生するまでに要した期間の長さとして、当該レコードに対応する日時から当該状態遷移が既に発生していると示された最初の時点のレコードに対応する日時までの期間の長さ以下であり、当該期間の長さから、上記所定の期間を超える2つの時点の間の期間に対応する期間の長さを引いた期間の長さ以上である範囲を算出するようにすればよい。図6Bの例では、上記所定の期間として、1年を用いており、上記所定の期間を超える2つの時点の間の期間に対応する期間の長さとして、2つの時点の間の期間から1年を引いた期間の長さを用いている。なお、当該所定の期間、および、2つの時点の間の期間に対応する期間の長さは、訓練データに含まれる複数時点のレコードの時間的な間隔に応じてオペレータが設定することができる。
図5Cに示されるCに係る医療健康データは、2003年から2006年までの各年について1つの4年分のレコードを含んでおり、この期間に発症していない打ち切り訓練データである。このため、当該打ち切り訓練データに含まれる2003年から2006年の時点のレコードの各々について、発症に至るまでに少なくとも要する期間の長さとして、当該レコードに対応する日時から最後の時点の2006年の時点のレコードに対応する日時までの期間の長さに、予め設定された期間の長さを加えた期間の長さが算出される。予め設定された期間の長さとしては、例えば、この後少なくとも1年間は発症しないとして1年を用いる。この場合、図6Cに示されているように、2003年、2004年、2005年、および2006年の時点のレコードに対してそれぞれ、発症に至るまでに少なくとも要する期間の長さとして、4年、3年、2年、および1年の期間が算出され、「期間」の項目に、4+、3+、2+、および1+と示されている。
ステップS14において、制御ユニット11は、モデル学習部113の制御の下、管理データ記憶部122に記憶される各訓練データに含まれるレコードのうち2つのレコードを選択して読み出す。
ステップS15において、制御ユニット11は、モデル学習部113の制御の下、選択された2つのレコードが比較可能なレコードか否かを判定する。すなわち、制御ユニット11は、選択された2つのレコードの各々が完了訓練データからのレコードであるという第1条件を満たすか否かを判定する。あるいは、制御ユニット11は、選択された2つのレコードのうち一方が打ち切り訓練データに含まれるレコードであり、もう一方が完了訓練データに含まれるレコードであり、かつ、管理データ記憶部122に記憶される、当該打ち切り訓練データに含まれるレコードについて算出された上記状態遷移が発生するまでに少なくとも要する期間の長さと比較して、管理データ記憶部122に記憶される、当該完了訓練データに含まれるレコードについて算出された上記状態遷移が発生するまでに要した期間の長さが小さいという第2条件を満たすか否かを判定する。いずれの条件も満たされない場合は、ステップS14における処理が再度実行される。
上述した第1条件と第2条件とのいずれかの条件が満たされた場合、ステップS16において、制御ユニット11は、遷移予測部114の制御の下、上記選択された2つのレコードの各々について、予測モデル記憶部123に記憶される第1予測モデルを読み出して使用して、当該レコードに含まれる上記所定の検査の結果に基づいて、当該レコードに係るスコアを算出する。
ステップS17において、制御ユニット11は、モデル学習部113の制御の下、上記選択された2つのレコードについてステップS16において算出されたスコアの大小関係が、管理データ記憶部122に記憶される、当該2つのレコードについてステップS13において算出された期間の長さの大小関係に対応するように、予測モデル記憶部123に記憶される第1予測モデルのパラメータを更新する。
図7は、遷移予測処理において使用される、多層ニューラルネットワークを用いた第1予測モデルと第2予測モデルの一例を示す図である。状態遷移予測モデルは、第1予測モデルと第2予測モデルとを結合したものとして構成される。第1予測モデルは、入力側から順に、全結合層a1、Batch Normalization層b1、ReLU(Rectified Linear Unit)関数、全結合層a2、Batch Normalization層b2、ReLU(Rectified Linear Unit)関数、全結合層a3が結合した多層構成となっている。また、第2予測モデルは、入力側から順に、全結合層a4、Batch Normalization層b3、ReLU(Rectified Linear Unit)関数、全結合層a5が結合した多層構成となっている。第1予測モデルの出力は第2予測モデルの入力となるように結合されている。第1予測モデルの出力はスコアとして用いられる。第2予測モデルの出力は状態遷移が発生するまでの期間の長さとして用いられる。全結合層は、入力層と出力層との間で入力ノードと出力ノードの全てが接続されており、適切な重み係数を適用することで、重要な入力ノードの出力信号を次の出力ノードに反映する。Batch Normalization層は、入力信号の平均値と分散値とを用いて正規化を行うことにより入力信号の分布の偏りを軽減する。
なお、図7において第1予測モデルおよび第2予測モデルの例を図示したが、第1予測モデルと第2予測モデルの設計はこれに限るものでなく、各層のユニット数や中間層の数、活性化関数を変更しても良い。また、リカレントニューラルネットワークを用いて任意時点から過去数年の値を入力層に入力する設計であってもよい。さらに、第1予測モデルと第2予測モデルは多層ニューラルネットワークに限るものでなく、それぞれが状態遷移の発生までの長さを表す数理モデルと状態遷移が発生する傾向の大きさを表すスコアを状態が遷移するまでの期間の長さに変換する回帰モデルであればよい。
図8は、図2に関連して上記で説明した第1予測モデル学習処理の一例の概略図である。ここでは、ステップS14において選択される2つのレコードとして、図6Aに示した、Aに係る医療健康データに含まれる2009年の時点のレコードと、図6Bに示した、Bに係る医療健康データに含まれる2006年の時点のレコードとが選択された場合について説明する。ステップS13における処理において、発症に至るまでの期間の長さとして、Aに係る上記2009年の時点のレコードについては「3年」の期間が算出されており、Bに係る上記2006年の時点のレコードについては「1もしくは2年」の期間が算出されている。ステップS16における処理による、これらの2つのレコードをそれぞれ第1予測モデルに入力したときの出力をスコア(A−2009)とスコア(B−2006)とする。ステップS17の処理では、この2つのスコアの大小関係が、上述した発症に至るまでの期間の長さ「3年」および「1もしくは2年」の大小関係と一致するように、具体的には、例えば、発症に至るまでの長さの大小関係を0と1の二値で定義したうえで、スコアの差異をSigmoid関数に入力した値と大小関係を表す二値との交差エントロピーを誤差とし、誤差逆伝播法及び勾配降下法により、第1予測モデルのパラメータを調整する。図8の例では、先に選択したレコードの方が発症に至るまでの期間が長い場合を1、そうでない場合を0と定義した場合、Aに係る上記2009年の時点のレコードの方がBに係る上記2006年の時点のレコードよりも発症に至るまでの期間が長いので、正解は1となる。スコア(A−2009)からスコア(B−2006)を引いた値をSigmoid関数に入力した値と、正解の1との交差エントロピーを誤差とする。
第1予測モデルの学習には、発症に至るまでの期間の長さの大小関係を比較可能な2つのレコードでのみ用いる。つまり、打ち切り訓練データに含まれるレコードと比較可能なものは、当該レコードに係る発症に至るまでの期間よりも短い期間で発症に至った、完了訓練データに含まれるレコードに限られるため、打ち切り訓練データと完了訓練データの組み合わせには制約がある。図6A、図6B、および図6Cの例を用いると、発症に至るまでの期間の長さが「3年」のAに係る2009年の時点のレコードと、発症に至るまでの期間の長さが「3年+」のCに係る2004年の時点のレコードは、後者の方が長いため大小関係を比較可能である。しかし、発症に至るまでの期間の長さが「3年」のAに係る2009年の時点のデータと、発症に至るまでの期間の長さが「2年+」のCに係る2005年の時点のデータは、後者は少なくとも2年は発症しないことを表し3年発症しないことは確かでないため、比較不可能である。
(2)第2予測モデル学習処理
次に、図3に示す、訓練段階における第2予測モデル学習処理について詳細に説明する。
先ず、ステップS21において、制御ユニット11は、モデル学習部113の制御の下、管理データ記憶部122に記憶される完了訓練データに含まれるレコードのうち1つのレコードを選択して読み出す。
次に、ステップS22において、制御ユニット11は、遷移予測部114の制御の下、当該選択された1つのレコードについて、予測モデル記憶部123に記憶される第1予測モデルを読み出して使用して、当該レコードに含まれる上記所定の検査の結果に基づいて、当該レコードに係る上記スコアを算出する。
ステップS23において、制御ユニット11は、遷移予測部114の制御の下、予測モデル記憶部123に記憶される第2予測モデルを読み出して使用して、上記選択された1つのレコードについて第1予測モデルを使用して算出された上記スコアに基づいて、当該レコードに対応する日時から当該レコードに係る検査対象の状態遷移が発生するまでの期間の長さを推定する。
ステップS24において、制御ユニット11は、モデル学習部113の制御の下、上記選択された1つのレコードについてステップS23において推定された上記状態遷移が発生するまでの期間の長さと、管理データ記憶部122に記憶される、当該レコードについて算出された上記状態遷移が発生するまでに要した期間の長さとに基づいて、予測モデル記憶部123に記憶される第2予測モデルのパラメータを更新する。
図9は、図3に関連して上記で説明した第2予測モデル学習処理の一例の概略図である。ここでは、ステップS21において選択される1つのレコードとして、図6Aに示した、完了訓練データであるAに係る医療健康データに含まれる、2009年の時点のレコードが選択された場合について説明する。ステップS22における処理によって、この1つのレコードを第1予測モデルに入力したときの出力としてスコア(A−2009)が算出されている。次に、ステップS23における処理によって、スコア(A−2009)を第2予測モデルに入力したときの出力として、発症までの期間の長さ(A−2009)が推定されている。ステップS24の処理では、この推定値と、上述した発症に至るまでの長さの正解値との誤差が最小化するように、例えば、誤差逆伝播法及び勾配降下法により、第1予測モデルのパラメータは変更せずに、第2予測モデルのパラメータのみが調整される。図9の例では、推定値と正解値である「3年」との誤差を平均二乗誤差で表す。なお、誤差の計算方法は平均二乗誤差に限るものでなく、平均絶対誤差など2つの値の差異を測るものであればよい。
(3)テストデータに基づく遷移予測処理
最後に、図4に示す、テスト段階における遷移予測処理について詳細に説明する。
先ず、ステップS31において、制御ユニット11は、テストデータ取得部115の制御の下、入力部2によって入力されたテストデータを取得し、当該取得されたテストデータをテストデータ記憶部124に記憶させる。なお、テストデータは、検査対象に係る上記所定の検査の結果を含むレコードを含んでいる。
図10は、テストデータとしての、Dに係る医療健康データの一例を示す図である。図10に示される医療健康データは、検査対象に係る所定の検査の結果である「HbA1c」、「BMI」、および「体脂肪」の数値を含むレコードを含んでいる。
次に、ステップS32において、制御ユニット11は、遷移予測部114の制御の下、テストデータ記憶部124に記憶されるテストデータを読み出し、さらに、予測モデル記憶部123に記憶される第1予測モデルを読み出す。その後、制御ユニット11は、遷移予測部114の制御の下、当該読み出された第1予測モデルを使用して、上記読み出されたテストデータに係るレコードに含まれる上記所定の検査の結果に基づいて、当該レコードに係る上記スコアを算出する。
ステップS33において、制御ユニット11は、遷移予測部114の制御の下、予測モデル記憶部123に記憶される第2予測モデルを読み出して使用して、上記テストデータに係るレコードについて第1予測モデルを使用して算出された上記スコアに基づいて、当該レコードに対応する日時から上記検査対象の状態遷移が発生するまでの期間の長さを推定する。その後、制御ユニット11は、遷移予測部114の制御の下、当該推定された上記状態遷移が発生するまでの期間の長さを示すデータを、予測結果記憶部125に記憶させる。
図11は、図4に関連して上記で説明した遷移予測処理の一例の概略図である。ここでは、ステップS31において取得されるテストデータとして、図10に示したDに係る医療健康データが取得された場合について説明する。ステップS32における処理によって、このテストデータに係るレコードを第1予測モデルに入力したときの出力として、スコア(D−2017)=3.7が算出されている。次に、ステップS33における処理によって、スコア(D−2017)=3.7を第2予測モデルに入力したときの出力として、発症までの期間の長さ(D−2017)=5年が推定されている。
ステップS34において、制御ユニット11は、出力制御部116の制御の下、予測結果記憶部125にアクセスし、上記テストデータに係るレコードについて推定された上記状態遷移が発生するまでの期間の長さを示すデータを表す表示データを、表示部3に送信する。
図12は、表示部3において出力される遷移予測処理結果の表示の一例を示す図である。図12では、図11の例においてDに係る医療健康データから推定された、発症までの期間の長さ(D−2017)=5年を示す表示データが、表示部3において出力される場合の例を示している。
[他の実施形態]
なお、この発明は上記第1の実施形態に限定されるものではない。例えば、訓練データについて、年度ごとのレコードが含まれている場合について例を挙げて説明した。しかしながら、訓練データに含まれるレコードは、他の異なる任意の間隔の複数時点のレコードであってもよく、また、レコードに対応する日時の間隔が一定でなくてもよい。
また、図12の例では、発症に至るまでの期間の長さを、全体の10%が発症するという基準で算出してある例を図示した。しかしながら、このような状態遷移が発生するまでの期間は、異なる基準で算出するようにしてもよい。
その他、状態遷移予測装置や、管理データ記憶部において記憶されるデータ構成や、予測モデル記憶部に記憶される第1予測モデルおよび第2予測モデルの構成等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。
要するにこの発明は、上記第1の実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記第1の実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、上記第1の実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
1…状態遷移予測装置、11…制御ユニット、111…訓練データ取得部、112…訓練データ管理部、1121…データ種判別部、1122…遷移期間算出部、113…モデル学習部、114…遷移予測部、115…テストデータ取得部、116…出力制御部、121…訓練データ記憶部、122…管理データ記憶部、123…予測モデル記憶部、124…テストデータ記憶部、125…予測結果記憶部、12…記憶ユニット、13…入出力インタフェースユニット、2…入力部、3…表示部

Claims (7)

  1. 検査対象に係る所定の検査の結果を含むレコードについて、当該所定の検査の結果に基づいて、当該検査対象の状態遷移が発生する傾向の大きさを表すスコアを算出するための第1予測モデルを学習する状態遷移予測モデル学習装置であって、
    前記第1予測モデルを記憶する記憶媒体と、
    訓練対象に係る前記所定の検査の結果を各々が含む複数時点のレコードと、当該複数時点のレコードの各々に対応する日時で当該訓練対象の状態遷移が発生しているか否かを示す状態遷移発生情報とを含む訓練データを取得する訓練データ取得部と、
    前記第1予測モデルを使用して、前記取得された訓練データに係るレコードに含まれる前記所定の検査の結果に基づいて、当該レコードに係る前記スコアを算出するスコア算出部と、
    前記取得された訓練データに係る状態遷移発生情報が、前記複数時点のうちいずれかの時点で前記訓練対象の状態遷移が既に発生していることを示している場合、当該取得された訓練データを完了訓練データとして、当該完了訓練データに含まれる前記複数時点のレコードのうち当該状態遷移が発生する以前の時点のレコードの各々について、当該状態遷移が発生するまでに要した期間の長さを算出する第1期間算出部と、
    前記取得された訓練データに係る状態遷移発生情報が、前記複数時点のいずれの時点においても前記訓練対象の状態遷移が発生していないことを示している場合、当該取得された訓練データを打ち切り訓練データとして、当該打ち切り訓練データに含まれるレコードの各々について、当該状態遷移が発生するまでに少なくとも要する期間の長さとして、当該レコードに対応する日時から前記複数時点のうち最後の時点のレコードに対応する日時までの期間の長さに、予め設定された期間の長さを加えた期間の長さを算出する第2期間算出部と、
    前記取得された各訓練データに含まれるレコードのうち2つのレコードを選択するレコード選択部と、
    前記選択された2つのレコードのうち一方が前記打ち切り訓練データに含まれるレコードであり、もう一方が前記完了訓練データに含まれるレコードであり、かつ、当該打ち切り訓練データに含まれるレコードについて前記算出された前記状態遷移が発生するまでに少なくとも要する期間の長さと比較して、当該完了訓練データに含まれるレコードについて前記算出された前記状態遷移が発生するまでに要した期間の長さが小さい場合に、当該2つのレコードについて前記スコア算出部によって算出されるスコアの大小関係が、当該2つのレコードについて前記算出された期間の長さの大小関係に対応するように、前記第1予測モデルを更新する第1更新部と
    を備える状態遷移予測モデル学習装置。
  2. 前記選択された2つのレコードの各々が前記完了訓練データからのレコードである場合に、当該2つのレコードについて前記スコア算出部によって算出されるスコアの大小関係が、当該2つのレコードについて前記算出された前記状態遷移が発生するまでに要した期間の長さの大小関係に対応するように、前記第1予測モデルを更新する第2更新部をさらに備える、請求項1に記載の状態遷移予測モデル学習装置。
  3. 前記第1期間算出部は、前記完了訓練データに含まれる前記複数時点のレコードについて、当該複数時点のうち任意の隣接する2つの時点の間の期間が所定の期間を超えており、かつ、当該所定の期間を超える2つの時点のうち後の時点のレコードが、前記訓練対象の状態遷移が既に発生していると示された最初の時点のレコードである場合、当該完了訓練データに含まれる前記複数時点のレコードのうち当該状態遷移が発生する以前の時点のレコードの各々について、前記状態遷移が発生するまでに要した期間の長さとして、当該レコードに対応する日時から当該状態遷移が既に発生していると示された最初の時点のレコードに対応する日時までの期間の長さ以下であり、当該期間の長さから、前記所定の期間を超える2つの時点の間の期間に対応する期間の長さを引いた期間の長さ以上である範囲を算出する、請求項1又は2に記載の状態遷移予測モデル学習装置。
  4. 前記記憶媒体は、前記検査対象に係る前記レコードについて前記第1予測モデルを使用して算出されたスコアに基づいて、当該レコードに対応する日時から当該検査対象の状態遷移が発生するまでの期間の長さを推定するための第2予測モデルをさらに記憶し、
    前記第2予測モデルを使用して、前記訓練対象に係る前記完了訓練データに含まれるレコードについて前記第1予測モデルを使用して算出されたスコアに基づいて、当該レコードに対応する日時から当該訓練対象の状態遷移が発生するまでの期間の長さを推定する期間推定部と、
    前記訓練対象に係る前記完了訓練データに含まれるレコードについて前記期間推定部によって推定された状態遷移が発生するまでの期間の長さと、当該レコードについて前記第1期間算出部によって算出された前記状態遷移が発生するまでに要した期間の長さとに基づいて、前記第2予測モデルを更新する第3更新部とをさらに備える、請求項1乃至3のいずれかに記載の状態遷移予測モデル学習装置。
  5. ハードウェアプロセッサおよびメモリを備える装置が実行する、検査対象に係る所定の検査の結果を含むレコードについて、当該所定の検査の結果に基づいて、当該検査対象の状態遷移が発生する傾向の大きさを表すスコアを算出するための第1予測モデルを学習する状態遷移予測モデル学習方法であって、
    訓練対象に係る前記所定の検査の結果を各々が含む複数時点のレコードと、当該複数時点のレコードの各々に対応する日時で当該訓練対象の状態遷移が発生しているか否かを示す状態遷移発生情報とを含む訓練データを取得する訓練データ取得過程と、
    前記第1予測モデルを使用して、前記取得された訓練データに係るレコードに含まれる前記所定の検査の結果に基づいて、当該レコードに係る前記スコアを算出するスコア算出過程と、
    前記取得された訓練データに係る状態遷移発生情報が、前記複数時点のうちいずれかの時点で前記訓練対象の状態遷移が既に発生していることを示している場合、当該取得された訓練データを完了訓練データとして、当該完了訓練データに含まれる前記複数時点のレコードのうち当該状態遷移が発生する以前の時点のレコードの各々について、当該状態遷移が発生するまでに要した期間の長さを算出する第1期間算出過程と、
    前記取得された訓練データに係る状態遷移発生情報が、前記複数時点のいずれの時点においても前記訓練対象の状態遷移が発生していないことを示している場合、当該取得された訓練データを打ち切り訓練データとして、当該打ち切り訓練データに含まれるレコードの各々について、当該状態遷移が発生するまでに少なくとも要する期間の長さとして、当該レコードに対応する日時から前記複数時点のうち最後の時点のレコードに対応する日時までの期間の長さに、予め設定された期間の長さを加えた期間の長さを算出する第2期間算出過程と、
    前記取得された各訓練データに含まれるレコードのうち2つのレコードを選択するレコード選択過程と、
    前記選択された2つのレコードのうち一方が前記打ち切り訓練データに含まれるレコードであり、もう一方が前記完了訓練データに含まれるレコードであり、かつ、当該打ち切り訓練データに含まれるレコードについて前記算出された前記状態遷移が発生するまでに少なくとも要する期間の長さと比較して、当該完了訓練データに含まれるレコードについて前記算出された前記状態遷移が発生するまでに要した期間の長さが小さい場合に、当該2つのレコードについて前記スコア算出過程において算出されるスコアの大小関係が、当該2つのレコードについて前記算出された期間の長さの大小関係に対応するように、前記第1予測モデルを更新する第1更新過程と
    を備える状態遷移予測モデル学習方法。
  6. 前記検査対象について前記第1予測モデルを使用して算出されたスコアに基づいて、当該レコードに対応する日時から当該検査対象の状態遷移が発生するまでの期間の長さを推定するための第2予測モデルを使用して、前記訓練対象に係る前記完了訓練データに含まれるレコードについて前記第1予測モデルを使用して算出されたスコアに基づいて、当該レコードに対応する日時から当該訓練対象の状態遷移が発生するまでの期間の長さを推定する期間推定過程と、
    前記訓練対象に係る前記完了訓練データに含まれるレコードについて前記期間推定過程において推定された状態遷移が発生するまでの期間の長さと、当該レコードについて前記第1期間算出過程において算出された前記状態遷移が発生するまでに要した期間の長さとに基づいて、前記第2予測モデルを更新する第3更新過程とをさらに備える、請求項5に記載の状態遷移予測モデル学習方法。
  7. 請求項1乃至4のいずれかに記載の状態遷移予測モデル学習装置が備える各部としてハードウェアプロセッサを機能させるプログラム。
JP2018000147A 2018-01-04 2018-01-04 状態遷移予測モデル学習装置、方法およびプログラム Active JP6818701B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018000147A JP6818701B2 (ja) 2018-01-04 2018-01-04 状態遷移予測モデル学習装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018000147A JP6818701B2 (ja) 2018-01-04 2018-01-04 状態遷移予測モデル学習装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2019121154A JP2019121154A (ja) 2019-07-22
JP6818701B2 true JP6818701B2 (ja) 2021-01-20

Family

ID=67306361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018000147A Active JP6818701B2 (ja) 2018-01-04 2018-01-04 状態遷移予測モデル学習装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6818701B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7408605B2 (ja) 2021-08-19 2024-01-05 Lineヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6004084B2 (ja) * 2013-03-29 2016-10-05 富士通株式会社 モデル更新方法、装置、およびプログラム
JP6468653B2 (ja) * 2015-07-27 2019-02-13 Kddi株式会社 予測モデル構築装置

Also Published As

Publication number Publication date
JP2019121154A (ja) 2019-07-22

Similar Documents

Publication Publication Date Title
Akkermans et al. The role of career competencies in the Job Demands—Resources model
CN108135548A (zh) 用于监测压力状态的方法和系统
Fearon et al. Child-evoked maternal negativity from 9 to 27 months: Evidence of gene–environment correlation and its moderation by marital distress
Bray et al. Disentangling the effects of self leader perceptions and ideal leader prototypes on leader judgments using loglinear modeling with latent variables
JP2020077361A (ja) 学習モデル構築装置、入社後評価予測装置、学習モデル構築方法および入社後評価予測方法
JP7107375B2 (ja) 状態遷移予測装置、予測モデル学習装置、方法およびプログラム
Koslowsk A longitudinal analysis of job satisfaction, commitment, and intention to leave
Antoniano-Villalobos et al. A Bayesian nonparametric regression model with normalized weights: A study of hippocampal atrophy in Alzheimer’s disease
US20240194346A1 (en) Improved Health Management Through Causal Relationship Based Feedback on Behavior and Health Metrics Captured by IOT
JP6818701B2 (ja) 状態遷移予測モデル学習装置、方法およびプログラム
Bolton et al. Machine learning and synthetic outcome estimation for individualised antimicrobial cessation
Blom-Smink et al. Prediction of everyday verbal communicative ability of aphasic stroke patients after inpatient rehabilitation
Lawless Armitage Lecture 2011: the design and analysis of life history studies
JP7293050B2 (ja) 軽度認知障害判定システム
JP6840627B2 (ja) ハイパーパラメータの評価方法、計算機及びプログラム
Ieva et al. A semiparametric bivariate probit model for joint modeling of outcomes in STEMI patients
Utsumil et al. Personalized gaussian processes for forecasting of alzheimer’s disease assessment scale-cognition sub-scale (adas-cog13)
Bann et al. Investigating change across time in prevalence or association: the challenges of cross-study comparative research and possible solutions
Althouse et al. Understanding the true significance of a P value
US20190034595A1 (en) Generating robust symptom onset indicators
Mitra et al. Effective integration of geotagged, ancilliary longitudinal survey datasets to improve adulthood obesity predictive models
JP6615424B1 (ja) 作業員支援装置、作業員支援システム、作業員支援方法、及び作業員支援プログラム
JP2022551325A (ja) 診断ツール
Mulligan et al. A multi-timescale, multi-method perspective on older adult neurocognitive adaptability
JP2010022649A (ja) 指標選択装置及び方法ならびにコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201228

R150 Certificate of patent or registration of utility model

Ref document number: 6818701

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150