JPWO2008111349A1 - 生存分析システム、生存分析方法および生存分析用プログラム - Google Patents
生存分析システム、生存分析方法および生存分析用プログラム Download PDFInfo
- Publication number
- JPWO2008111349A1 JPWO2008111349A1 JP2009503927A JP2009503927A JPWO2008111349A1 JP WO2008111349 A1 JPWO2008111349 A1 JP WO2008111349A1 JP 2009503927 A JP2009503927 A JP 2009503927A JP 2009503927 A JP2009503927 A JP 2009503927A JP WO2008111349 A1 JPWO2008111349 A1 JP WO2008111349A1
- Authority
- JP
- Japan
- Prior art keywords
- estimator
- period
- estimation
- event
- actual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Debugging And Monitoring (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
事例の特徴量を示す少なくとも1つの属性値と事象発生までの測定期間である実期間の情報とを含む事例の集合である事例群を基に事象発生までの期間である推定期間を求める生存分析システムであって、複数の実期間毎に事例群の属性値から事象発生の有無を推定する推定器を生成する推定器生成部と、推定器が所定の選別条件を満たすか否かを判定し、推定期間の算出に用いる推定器を選別する推定器選別部と、推定器選別部で選別した推定器を用いて推定期間を算出する期間算出部とを有する。
Description
本発明は、人や生物の生存期間あるいは工業製品の寿命等を解析するために用いられる生存分析システム、生存分析方法及び生存分析用プログラムに関する。
生存分析は、ある不可逆な特定事象が発生するまでの期間を推定し、該特定事象の発生因子を解析することである。例えば、臨床分野では、ある症状、検査結果、薬剤投与等の観測条件(特徴量)で層別化された患者群の生存期間を推定し、死亡に至る因子を解析して治療に役立てるために生存分析が用いられる。生存分析は、生存期間以外に発病や病気の再発等の解析にも用いることができる。また、生存分析は、機器が故障するまでの期間を推定し、機器の信頼性向上に役立てるために故障因子を解析する場合や、顧客が解約するまでの期間を推定し、解約に至る因子を解析して、解約される前に解約を防止する手段を講じるための営業管理等にも適用できる。なお、層別化とは、各事例を、その特徴量に応じて複数の群に分類しておくことである。
生存分析では、ある期間において、目的とする特定事象の発生した事例を死亡例、特定事象の発生していない事例を生存例、特定事象と無関係の原因で事象発生前に観測が打ち切られた事例を打ち切り例と呼ぶ。ここで、死亡や生存は、実際に患者の死亡や生存を意味するとは限らず、例えば特定疾患の発病を解析する場合、ある期間における死亡例は該疾患の発病患者であり、生存例は発病前の監視対象者であり、打ち切り例は事故死や引越しあるいはその他の理由で観測が打ち切られた監視対象者である。
従来の生存分析では、予め定めた発生因子の条件に応じて事例を層別化して検定する手法が主に用いられている。例えば、カプラン・マイヤー解析は、特定疾患の患者群について、横軸を生存期間、縦軸を累積生存確率とする生存曲線を用いて解析する。ここで、打ち切り例については、打ち切り以降は、それ以外の疾患と同じ確率で患者が死亡すると考えて累積生存確率を計算する。したがって、累積生存確率は、時間とともに単純に減少する。また、ログランク検定は、予め定めた複数の条件を満たす複数の患者群を対象とし、所定の時点毎の患者の死亡率を用いて複数の患者群に統計的に有意な差があるか否かを検定し、有意な差がある場合は予め定めた条件が病気の発生因子であったと判定する。
このような生存分析を利用した従来の生存分析システムの一例が特開2003−167959号公報に記載されている。この第1従来例の生存分析システムでは、予め定めた複数の条件(喫煙、飲酒、肥満、高血圧、高血糖、高尿酸等)に該当する複数の監視対象者群に対する健康余命の予測曲線を作成しておき、該予測曲線を用いて健康診断の受診者の健康余命を予測している。
また、従来の生存分析システムの他の例が特開2006−202235号公報に記載されている。この第2従来例の生存分析システムでは、解析対象の事象の発生率を所定の時点毎に算出する複数の推定器を備え、該推定器の出力値を用いて現象発生確率曲線を作成し、該現象発生確率曲線を用いて、例えば特定疾患(癌等)の発症患者の予後生存率や生存期間を推定している。
しかしながら上記した従来の生存分析システムのうち、第1従来例の生存分析システムでは、予め人が各種の条件を層別化して入力する必要があるため、作業や操作が煩雑であるという問題がある。通常、観測期間が長くなると、打ち切り例の数が増加し、観測対象者の死亡例・生存例の数が減少するため、健康余命の予測値の信頼性が低下する傾向にある。第1従来例の生存分析システムでは、そのような信頼性の低い長期の予測値も、信頼性が比較的高い短期の予測値と同等に用いて健康余命を推定するため、事象発生までの期間(推定期間)を正確に求めることができないという問題がある。さらに、第1従来例の生存分析システムでは、予め人が各種の条件を定めているため、発生した特定事象の発生因子は、予め人が想定した因子以外には発見できない問題もある。
一方、第2従来例の生存分析システムでは、観測期間が長くなるほど事象の発生率を正確に推定する推定器を生成することが困難になるため、所定の時点毎に異なる性能の推定器が生成されてしまう。第2従来例の生存分析システムでは、そのような低い性能の推定器も高い性能の推定器と同等に用いて、例えば発症患者の生存期間を推定するため、事象発生までの期間(推定期間)を正確に求めることができないという問題がある。また、第2従来例の生存分析システムでは、例えば発症患者の生存期間を、複数の推定器を用いて算出した所定の時点毎の発生率を全て用いて推定するため、事象が実際に発生(例えば該発症患者の死亡)してもその発生因子を特定することが困難であるという問題もある。
そこで、本発明は、事象発生までの期間を比較的正確に推定できる生存分析システム及び方法を提供することを目的とする。
また、本発明の他の目的は、事象の新たな発生因子の発見に寄与する生存分析システム及び方法を提供することにある。
上記目的を達成するため本発明の生存分析システムは、事例の特徴量を示す少なくとも1つの属性値と事象発生までの測定期間である実期間の情報とを含む事例の集合である事例群を基に事象発生までの期間である推定期間を求める生存分析システムであって、
複数の前記実期間毎に前記事例群の属性値から事象発生の有無を推定する推定器を生成する推定器生成部と、
前記推定器が所定の選別条件を満たすか否かを判定し、前記推定期間の算出に用いる推定器を選別する推定器選別部と、
前記推定器選別部で選別した推定器を用いて前記推定期間を算出する期間算出部と、
を有する。
複数の前記実期間毎に前記事例群の属性値から事象発生の有無を推定する推定器を生成する推定器生成部と、
前記推定器が所定の選別条件を満たすか否かを判定し、前記推定期間の算出に用いる推定器を選別する推定器選別部と、
前記推定器選別部で選別した推定器を用いて前記推定期間を算出する期間算出部と、
を有する。
一方、本発明の生存分析方法は、事例の特徴量を示す少なくとも1つの属性値と事象発生までの測定期間である実期間の情報とを含む事例の集合である事例群を基に事象発生までの期間である推定期間を求めるための生存分析方法であって、
複数の前記実期間毎に前記事例群の属性値から事象発生の有無を推定する推定器を生成し、
前記推定器が所定の選別条件を満たすか否かを判定し、前記推定期間の算出に用いる推定器を選別し、
前記推定器選別部で選別した推定器を用いて前記推定期間を算出する方法である。
複数の前記実期間毎に前記事例群の属性値から事象発生の有無を推定する推定器を生成し、
前記推定器が所定の選別条件を満たすか否かを判定し、前記推定期間の算出に用いる推定器を選別し、
前記推定器選別部で選別した推定器を用いて前記推定期間を算出する方法である。
次に本発明について図面を参照して説明する。
(第1の実施の形態)
図1は本発明の生存分析システムの第1の実施の形態の構成を示すブロック図であり、図2は図1に示した記憶装置一構成例を示すブロック図である。
図1は本発明の生存分析システムの第1の実施の形態の構成を示すブロック図であり、図2は図1に示した記憶装置一構成例を示すブロック図である。
第1の実施の形態の生存分析システムは、入力された複数の事例群のデータから機械学習手法によって推定器を生成し、該推定器を用いて利用者が所望する特定事例の情報(出力情報)を生成する例である。
図1に示すように、第1の実施の形態の生存分析システムは、事例群毎に対応する、事象発生の有無を推定する推定器を生成し、該推定器を用いて事象発生までの期間を算出する学習部300と、事例や各種の条件等のデータを利用者が入力するための入力装置100と、学習部300の処理結果を利用者に提示するための出力装置200と、学習部300の処理結果や利用者によって入力された事例及び各種の条件等が格納される記憶装置400とを有する構成である。
図2に示すように、記憶装置400は、学習部300で生成された推定器が格納される推定器記憶部401と、利用者によって入力された事例群が格納される事例群記憶部402と、各事例群に対応する事象発生までの期間である推定期間が格納される期間記憶部403とを備えている。ここで、事例群とは事例の集合である。事例には、1つ以上の属性値、実期間及びイベントの各データが含まれている。属性値は事例の特徴(例えば、病名、年齢、性別、生活習慣、各種の検査データ等)を示す値であり、実期間は事象(死亡あるいは打ち切り)が発生するまでの実際の時間(測定時間)を示し、イベントは、生存例、死亡例あるいは打ち切り例を示すデータである。推定期間は、学習部300(後述する期間算出部305)によって算出される事例毎の生存期間の推定値である。
図2に示す推定器記憶部401内の推定器1〜k、事例群記憶部402内の事例群1〜k、期間記憶部403内の推定期間1〜kは、それぞれのデータが時系列に短い実時間から順次配置されることを示している。なお、事例群記憶部402内の「全群」は入力された全ての事例群が格納される記憶領域であり、「生存群」は入力された全ての事例群から死亡例や打ち切り例の事例を除いた残りである生存例の事例が保存される記憶領域である。図2では、記憶装置400を、推定器記憶部401、事例群記憶部402及び期間記憶部403に分割して推定器、事例群及び推定期間の各データを個別に格納する例を示しているが、記憶装置400は、このように分割する必要はなく、対応する推定器、事例群及び推定期間毎に順次格納する構成でもよい。また、例えば事例群記憶部402に生存群や事例群の各事例のID番号を格納し、該ID番号と実際の事例の各データとの対応関係を示すテーブル等を別途用意しておき、生存分析の実行時に該テーブルを参照して各事例のデータを読み出すようにしてもよい。
学習部300は、前処理部301、制御部302、推定器生成部303、推定器選別部304、期間算出部305及び後処理部306を備えている。
前処理部301は、利用者によって入力装置100から入力された事例群及び指定条件に応じて各事例群に所定の前処理を実行し、入力された事例群及び前処理後の事例群を事例群記憶部402に格納する。指定条件とは、入力装置100を用いて利用者が入力する指示内容であり、例えば学習パラメータや後述する生存分析に用いる実期間の上限値である最大期間等がある。
制御部302は、入力された事例群に対する生存分析を終了するか否かを判定し、終了する場合は後処理部306に処理を移し、終了しない場合は推定器生成部303に処理を移す。
推定器生成部303は、記憶装置400の事例群記憶部402に時系列に格納された事例群毎に推定器を生成し、生成した推定器を事例群に対応付けて推定器記憶部401に格納する。
推定器選別部304は、事例群記憶部402に格納された事例群に対応して生成された推定器のうち、推定期間の算出に用いる推定器を所定の選別条件にしたがって選別する。
推定器の選別条件としては、例えば選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が短くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果と、選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が長くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果とを用いる。
期間算出部305は、推定器選別部304によって選別された推定器を用いて事象が発生するまでの期間(推定期間)を算出し、算出した推定期間を期間記憶部403に格納する。
期間算出部305は、例えば推定器選別部304にて選別された推定器に対応する実時間のうち、ある推定器に対応する実期間と、該推定器に対応する実期間よりも短い推定器に対応する実期間とを用いて推定期間を算出する。または、事象発生有りと推定された推定器に対応する実期間よりも短い実期間に対応する推定器にて事象発生無しと推定された事例群の実期間を用いて推定期間を算出する。
後処理部306は、記憶部400に格納された推定器、事例群、推定期間を基に、出力装置200で出力する出力情報(予め設定された情報あるいは利用者が指定した情報)を作成し、作成した出力情報を出力装置200に供給する。
本実施形態の生存分析システムは、例えばコンピュータによって実現可能である。コンピュータは、例えば、図3に示すように、プログラムにしたがって所定の処理を実行する処理装置1と、処理装置1に対してコマンドや情報等を入力するための入力装置100と、処理装置1の処理結果をモニタするための出力装置200とを有する構成である。
処理装置1は、CPU11と、CPU11の処理に必要な情報を一時的に記憶する主記憶装置12と、CPU11に上記学習部300の処理を実行させるためのプログラムが記録された記録媒体13と、利用者によって入力装置100から入力された事例群や各種の条件、推定器、推定期間等が格納される記憶装置400として用いられるデータ蓄積装置14と、主記憶装置12、記録媒体13及びデータ蓄積装置14とのデータ転送を制御するメモリ制御インタフェース部15と、入力装置2及び出力装置3とのインタフェース装置であるI/Oインタフェース部16とを有する構成である。CPU11と、メモリ制御インタフェース部15及びI/Oインタフェース部16とはバス18を介して接続されている。なお、処理装置1には、ネットワークとデータを送受信するためのインタフェースである通信制御装置17を備えていてもよい。
処理装置1は、記録媒体13に記録されたプログラムにしたがって上記学習部300の機能をそれぞれ実現する。記録媒体13は、磁気ディスク、半導体メモリ、光ディスクあるいはその他の記録媒体であってもよい。
なお、本実施形態の生存分析システムは、図3に示したコンピュータで実現する構成に限定されるものではない。本実施形態の生存分析システムは、例えば論理回路等から構成されるLSI(Large Scale Integration)やDSP(Digital Signal Processor)等の半導体集積回路装置及びメモリ等により、学習部300や記憶装置400の機能を実現する構成であってもよい。なお、図3ではデータ蓄積装置14を処理装置1内に備える構成を示しているが、データ蓄積装置14は処理装置1から独立して備えていてもよい。
次に、第1の実施の形態の生存分析システムの動作について図4を用いて説明する。
図4は図1に示した生存分析システムの処理手順を示すフローチャートである。
図4に示すように、学習部300は、入力装置100から事例群及び指定条件が入力されると(ステップS0)、まず前処理部301により、入力された事例群をその実期間に応じてソートし、入力された事例群を事例群記憶部402の全群及び生存群にそれぞれ格納する。ソート後の各事例群は、時系列に実時間t1,t2,・・・,tNの順に並べられる。
また、前処理部301は、重複する事例のデータを除くと共に、各事例群の実期間に付与する符号ti(i=1,2,・・・,N)のiの値を0に初期化し、生成後の推定器に付与する符号kの値を1に初期化する(ステップS1)。
なお、事例群が十分に多く存在する場合、あるいは処理時間を短縮したい場合は、前処理部301は、入力された全ての事例の期間ではなく、入力された全ての事例のうち、イベントが死亡例である事例のみ用いてソートしてもよい。
また、事象発生までの期間が長期であるために推定期間を求めることが困難な場合、あるいは事象発生までの期間を推定しても実用上意味が無い場合、予め利用者に指定条件として生存分析に用いる実期間の上限値である最大期間を入力させておき、前処理部301により、入力された事例群のソートの際に該最大期間を超える事例を除いてもよい。
次に、学習部300は、制御部302により生存分析処理の終了条件i≦Nを満たすか否かを判定する(ステップS2)。満たす場合は、後処理部306による処理へ移行し、満たさない場合は推定器生成部303による処理へ移行する。
終了条件i≦Nを満たさない場合、学習部300は、推定器生成部303により、事例群記憶部402の全群に格納されたデータから機械学習手法で用いる訓練データを生成し、該訓練データを用いて実期間tiの事例群に対応する推定器を生成する。推定器生成部303は、予め定めた周知の手法を用いて、あるいは入力装置100を用いて利用者が指定した手法を用いて推定器kを生成し、生成した推定器kを推定器記憶部401に格納する(ステップS3)。訓練データは、実期間及びイベントのデータを用いて、実期間ti以前に観測が打ち切られた打ち切り例の事例を除くと共に、実期間tiで死亡している事例に死亡例とラベル付けし、生存している事例に生存例とラベル付けした後、属性値とラベルを用いて生成する。推定器は、決定木、サポートベクタマシン、ニューラルネットワーク等の周知の機械学習手法を用いて生成することが可能である。
推定器選別部304は、推定器生成部303で生成した推定器kを用いて生存群に格納された事例群の事象発生の有無を推定し、推定結果に基づき該事象群を生存または死亡に分類する。推定器選別部304は、死亡に分類した事例群を事例群記憶部402の事例群kに格納し、生存に分類した事例群を事例群記憶部402の事例群k+1に格納する(ステップS4)。
また、推定器選別部304は、これらの分類結果により推定器生成部303で生成した推定器kが所定の選別条件を満たしているか否かを判定する(ステップS5)。選別条件を満たさない場合は実期間tiのiに1を加算して(ステップS9)、ステップS2の処理に戻ってステップS2からステップS5の処理を繰り返す。また、推定器kが選別条件を満たす場合は、期間算出部305による処理へ移行する。
なお、本実施形態では、iを1ずつ増加させる例を示しているが、事例数が多量であるために処理時間を短縮したい場合は、利用者によって指定された実期間の数単位で、すなわち、利用者によって指定された数の単位でiを増加させてもよい。
推定器選別部304による推定器の選別は、事例群k−1と事例群kの検定処理の結果と、事例群kと事例群k+1の検定処理の結果とに基づいて行なう。選別条件には、予め設定した条件、あるいは入力装置100を用いて利用者が入力した条件を用いる。
選別条件の具体例としては、
(A条件)事例群k−1と事例群kの検定処理の結果、2群に統計上の有意差がある、
(B条件)事例群kと事例群k+1の検定処理の結果、2群に統計上の有意差がある、
(C条件)事例群kの数が予め設定した数または利用者によって指定された数以上である、
(D条件)全ての事例数に対する事例群kの事例数が予め設定した割合または利用者に指定された割合以上である、
(E条件)死亡例と分類された事例群kの事例数、及び生存例と分類された事例群k+1の事例数が共に1以上である、
等の条件のいずれか、あるいはこれらの条件の組合せがある。
(A条件)事例群k−1と事例群kの検定処理の結果、2群に統計上の有意差がある、
(B条件)事例群kと事例群k+1の検定処理の結果、2群に統計上の有意差がある、
(C条件)事例群kの数が予め設定した数または利用者によって指定された数以上である、
(D条件)全ての事例数に対する事例群kの事例数が予め設定した割合または利用者に指定された割合以上である、
(E条件)死亡例と分類された事例群kの事例数、及び生存例と分類された事例群k+1の事例数が共に1以上である、
等の条件のいずれか、あるいはこれらの条件の組合せがある。
検定処理としては、例えばログランク検定や事例群中のイベントが死亡例である事例のみを用いる中央値検定等がある。検定処理にログランク検定を用いる場合、選別条件は、例えば「上記A条件かつB条件を満たす」、または「上記A条件かつB条件を満たす、または上記D条件を満たす」を用いればよい。
ところで、上述したように推定器は必ずしも事象の発生を正確に推定できるとは限らない。ある事例に対応する推定器で推定エラーが発生すると、それよりも実期間が長い事例に対応する推定器の検定に悪影響を及ぼしてしまう。例えば、事象発生までの期間が長いために、いくつかの事例を推定器k−1が誤って死亡例と推定した場合、それよりも実期間が長い推定器kの性能が優れていても検定処理にて2群に統計上の有意差が生じないことがある。事象発生までの期間が短い事例を推定器k−1が誤って生存例と分類した場合も同様である。
このような推定器k−1の推定エラーの影響を防ぐため、推定器選別部304は、事例群記憶部402に格納された事例群k−1から、事象発生までの期間が実期間ti−1よりも長い事例を除き、事例群記憶部402に格納された事例群kから、事象発生までの期間が実期間ti−1以下の事例を除いてもよい。
期間算出部305は、推定器選別部304で選別した推定器を用いて、事例群kに対応する事象発生までの期間である推定期間kを算出し、記憶装置400の期間記憶部403に格納する(ステップS6)。推定期間はk、例えば、
(F条件)実期間ti−1と実期間tiの平均値とする、
(G条件)推定期間k−1と実期間tiの平均値とする、
(H条件)事例群kの事象(死亡)発生までの期間の中央値とする、
(I条件)事例群kの事象(死亡)発生までの期間の平均値とする、
等のいずれかの条件を用いて推定する。
(F条件)実期間ti−1と実期間tiの平均値とする、
(G条件)推定期間k−1と実期間tiの平均値とする、
(H条件)事例群kの事象(死亡)発生までの期間の中央値とする、
(I条件)事例群kの事象(死亡)発生までの期間の平均値とする、
等のいずれかの条件を用いて推定する。
ここで、死亡例の実期間の最大値よりも事象発生までの期間が長くなる打ち切り例については、例えば打ち切られた時点で当該事例を死亡例と仮定し、上記(H条件)及び(I条件)の「事象(死亡)発生までの期間」を、「事象(死亡)発生までの期間と、死亡例の最大期間よりも長い打ち切り例の事象発生までの期間」に置き換えた条件を用いればよい。
期間算出部305により事例群kの推定期間を算出すると、学習部300は、制御部302により、生存に分類された事例群k+1を事例群記憶部402の生存群に格納し(ステップS7)、kに1を加算し(ステップS10)、iに1を加算して(ステップS9)、ステップS2の処理に戻り、ステップS2からステップS10の処理を繰り返す。
制御部302によるステップS2の処理にて終了条件を満たす場合、学習部300は、後処理部306により、予め設定された、または利用者よって指定された出力情報を作成し、出力装置200に出力情報を渡して処理を終了する(ステップS8)。出力情報としては、例えば記憶装置400に格納された推定器kや推定期間kのデータがある。また、事例群の生存曲線や事例群の検定結果等の解析データを利用者の指示に応じて出力してもよい。
なお、本実施形態では、推定器を生成しつつ生成した推定器を選別する処理手順を示したが、全ての推定器を生成した後、実期間が短い事例に対応する推定器から順次選別してもよい。また、本実施形態では、事例が、1つ以上の属性値、実期間及びイベントを含む例を示したが、例えば全てのイベントが死亡例である場合は、属性値及び期間のみを含む事例を用いてもよい。
また、推定器の有効性を検証し、該検証結果を出力情報に含めてもよい。推定器の有効性の検証方法としては、上記カプラン・マイヤー解析によって得られる生存曲線を用いる方法、あるいは上記検定処理で用いるログランク検定や中央値検定で得られる検定値を用いる方法がある。
第1の実施の形態の生存分析システムによれば、複数の推定器を自動的に生成し、推定期間に対応する事例群に対して細かな層別化を自動的に行なうことができる。また、所定の選別条件により複数の推定器の中でも比較的予測が正確な推定器を用いて推定期間を求めるため事象発生までの期間を比較的正確に推定できる。
さらに、推定期間と推定器とを対応付けることができるため、その推定器の条件を解析することにより、推定期間に対応する事象発生因子を新たに発見することが可能になる。したがって、事象の新たな発生因子の発見に寄与する生存分析システムが提供される。
(第2の実施の形態)
次に本発明の生存分析システムの第2の実施の形態について図面を用いて説明する。
(第2の実施の形態)
次に本発明の生存分析システムの第2の実施の形態について図面を用いて説明する。
第2の実施の形態の生存分析システムは、予め入力された複数の事例群のデータから既に推定器が生成され、またそれらに対応する推定期間が既に算出されて記憶装置400に予め格納されている例である。この場合、利用者が特定の事例や各種の条件を入力することで、所望の情報(出力情報)が出力される。
図5は本発明の生存分析システムの第2の実施の形態の構成を示すブロック図である。
図5に示すように、第2の実施の形態の生存分析システムは、事例群毎に対応する、予め生成された推定器を用いて事象発生の有無を判定する予測部500と、事例や各種の条件等のデータを利用者が入力するための入力装置100と、予測部500の処理結果を利用者に提示するための出力装置200と、予測部500の処理結果や利用者によって入力された事例及び各種の条件等が格納される記憶装置400とを有する構成である。
入力装置100、出力装置200及び記憶装置400の構成及び動作は、第1の実施の形態と同様であるため、ここでは説明を省略する。
記憶装置400には、第1の実施の形態と同様に、予め生成された推定器が格納される推定器記憶部401と、利用者によって入力された事例群が格納される事例群記憶部402と、各事例群に対応する事象発生までの期間である推定期間が格納される期間記憶部403とを備えている。
推定器記憶部401内の推定器1〜k、事例群記憶部402内の事例群1〜k、期間記憶部403内の推定期間1〜kは、第1の実施の形態と同様にそれぞれのデータが時系列に短い実時間から順次配置されている。
予測部500は、前処理部501、判定部502及び後処理部503を備えている。
前処理部501は、利用者によって入力装置100から入力された事例及び指定条件に応じて各事例に所定の前処理を実行し、入力された事例及び前処理後の事例を事例群記憶部402に格納する。
判定部502は、前処理後の事例に対応する、推定器記憶部401に格納された推定器を用いて事象発生の有無を判定する。また、事象発生有りと推定した推定器に対応する実期間のうち、最も短い実期間を事象発生までの期間である推定期間であると判定する。
後処理部503は、判定部502で抽出した推定器に対応する実期間を期間記憶部403から読み出し、推定期間として出力する。
なお、第2の実施の形態の生存分析システムも、第1の実施の形態と同様に、例えば図3に示すようなコンピュータ、あるいは論理回路等から構成されるLSIやDSP等の半導体集積回路装置及びメモリ等によって実現することが可能である。
次に、第2の実施の形態の生存分析システムの動作について図6を用いて説明する。
図6は図5に示した生存分析システムの処理手順を示すフローチャートである。
図6に示すように、予測部500は、入力装置100から事例群及び指定条件が入力されると(ステップS20)、まず前処理部501により、推定器に付与する符号kの値を1に初期化する(ステップS21)。ここでは、事例の実期間とイベントの値は未知でよい。また、属性値は、その一部が未知(欠損値)であっても周知の欠損値補間技術(平均値補間、中央地補間等)を用いて欠損したデータを補間すればよい。利用者からは、例えば生存曲線の表示有無等が指定条件として入力装置100を用いて入力される。
判定部502は、前処理後の事例について、推定器記憶部401に格納された対応する推定器kを用いて事象(生存または死亡)発生の有無を判定する(ステップS22)。また、推定結果が死亡であるか否かを判定し(ステップS23)、判定結果が生存である場合はkに1を加算して(ステップS25)ステップS22の処理に戻り、ステップS22及びS24の処理を繰り返す。一方、判定結果が死亡の場合は、推定器kが該事例に対応していると判定する。
後処理部503は、判定部502により分析対象の事例に対応している判定された推定器kに対応する推定期間kを記憶装置400の期間記憶部403から読み出し、該推定期間kを出力情報として出力(ステップS24)した後、処理を終了する。
なお、後処理部503は、入力装置100を用いて入力した利用者の指定条件に応じて、推定器記憶部401に格納された推定器k、該推定器kに対応する事例に該当した条件、期間記憶部403に記憶された事例群を用いて対応する事例群kの生存曲線や検定処理結果等の解析データを出力情報に含めてもよい。事例群kの解析データは予め生成して記憶装置400に格納しておいてもよい。
また、上記説明では、入力した1つの事例について、対応する推定器を用いて事象発生までの推定期間を出力する例を示したが、入力装置100から複数の事例(事例群)を入力し、一度に複数の事例の事象発生までの推定期間を算出し、それらを所定の統計処理した後、入力した事例群に関する情報として出力することも可能である。
また、第2の実施の形態の生存分析システムは、第1の実施の形態の生存分析システムから独立して備えることも可能である。
第2の実施の形態の生存分析システムによれば、推定期間と死亡と推定した推定器とを対応付け、利用者からの指定条件に応じて、その推定器の情報を出力するため、事例に対応する事象発生因子を容易に解析することができる。
この出願は、2007年3月9日に出願された特願2007−060409号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
Claims (30)
- 事例の特徴量を示す少なくとも1つの属性値と事象発生までの測定期間である実期間の情報とを含む事例の集合である事例群を基に事象発生までの期間である推定期間を求める生存分析システムであって、
複数の前記実期間毎に前記事例群の属性値から事象発生の有無を推定する推定器を生成する推定器生成部と、
前記推定器が所定の選別条件を満たすか否かを判定し、前記推定期間の算出に用いる推定器を選別する推定器選別部と、
前記推定器選別部で選別した推定器を用いて前記推定期間を算出する期間算出部と、
を有する生存分析システム。 - 前記事例に前記事象発生の有無または観測の打ち切り例を示すイベントの情報を備え、
前記推定器生成部は、
前記実期間の時点で打ち切り例の事例を除いた残りの事例群の属性値から前記推定器を生成する請求項1記載の生存分析システム。 - 前記推定器選別部は、
選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が短くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果、及び選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が長くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果を、選別対象の推定器を前記推定期間の算出に用いるか否かを判定するための選別条件とする請求項1または2記載の生存分析システム。 - 前記期間算出部は、
前記推定器選別部にて選別された推定器に対応する実時間のうち、前記推定器に対応する実期間と、該推定器に対応する実期間よりも短い推定器に対応する実期間とを用いて前記推定期間を算出する請求項1から3のいずれか1項記載の生存分析システム。 - 前記期間算出部は、
前記推定器選別部にて選別された推定器に対応する実時間のうち、前記推定器に対応する実期間と、該推定器に対応する実期間よりも短くかつ該実期間に最も近い推定器に対応する実期間との平均値を前記推定期間とする請求項4記載の生存分析システム。 - 前記期間推定部は、
前記推定期間の算出に用いる推定器に対応する実期間よりも短い実期間に対応する推定器にて事象発生無しと推定され、前記推定期間の算出に用いる推定器にて事象発生有りと推定された事例群の実期間を用いて推定期間を算出する請求項1から3のいずれか1項記載の生存分析システム。 - 前記期間推定部は、
前記推定期間の算出に用いる推定器の生成時点の実期間よりも短い実期間に対応する推定器で事象発生無しと推定され、前記推定期間の算出に用いる推定器で事象発生有りと推定された事例群の実期間の平均値または中央値のいずれか一方を推定期間とする請求項6記載の生存分析システム。 - 推定期間の算出結果、前記事例群の解析データ及び前記推定器の有効性の検証結果の少なくとも1つを含む、利用者に提示するための出力情報を生成する後処理部を有する請求項1から7のいずれか1項記載の生存分析システム。
- 入力された事例に含まれる該事例の特徴量を示す属性値から事象発生の有無を推定する複数の推定器と、
前記事象発生有りと推定した推定器に対応する実期間のうち、最も短い実期間を事象発生までの期間である推定期間と判定する判定部と、
前記推定期間及び該推定期間に対応する推定器の情報の少なくとも1つを含む出力情報を生成する後処理部と、
を有する生存分析システム。 - 前記後処理部は、
入力された事例に対応する事例群の特徴値を含む出力情報を生成する請求項9に記載の生存分析システム。 - 事例の特徴量を示す少なくとも1つの属性値と事象発生までの測定期間である実期間の情報とを含む事例の集合である事例群を基に事象発生までの期間である推定期間を求めるための生存分析方法であって、
複数の前記実期間毎に前記事例群の属性値から事象発生の有無を推定する推定器を生成し、
前記推定器が所定の選別条件を満たすか否かを判定し、前記推定期間の算出に用いる推定器を選別し、
前記推定器選別部で選別した推定器を用いて前記推定期間を算出する生存分析方法。 - 前記事例に前記事象発生の有無または観測の打ち切り例を示すイベントの情報を備え、
前記実期間の時点で打ち切り例の事例を除いた残りの事例群の属性値から前記推定器を生成する請求項11記載の生存分析方法。 - 選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が短くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果、及び選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が長くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果を、選別対象の推定器を前記推定期間の算出に用いるか否かを判定するための選別条件とする請求項11または12記載の生存分析方法。
- 前記選別された推定器に対応する実時間のうち、前記推定器に対応する実期間と、該推定器に対応する実期間よりも短い推定器に対応する実期間とを用いて前記推定期間を算出する請求項11から13のいずれか1項記載の生存分析方法。
- 前記選別された推定器に対応する実時間のうち、前記推定器に対応する実期間と、該推定器に対応する実期間よりも短くかつ該実期間に最も近い推定器に対応する実期間との平均値を前記推定期間とする請求項14記載の生存分析方法。
- 前記推定期間の算出に用いる推定器に対応する実期間よりも短い実期間に対応する推定器にて事象発生無しと推定され、前記推定期間の算出に用いる推定器にて事象発生有りと推定された事例群の実期間を用いて推定期間を算出する請求項11から13のいずれか1項記載の生存分析方法。
- 前記推定期間の算出に用いる推定器の生成時点の実期間よりも短い実期間に対応する推定器で事象発生無しと推定され、前記推定期間の算出に用いる推定器で事象発生有りと推定された事例群の実期間の平均値または中央値のいずれか一方を推定期間とする請求項16記載の生存分析方法。
- 推定期間の算出結果、前記事例群の解析データ及び前記推定器の有効性の検証結果の少なくとも1つを含む、利用者に提示するための出力情報を生成する請求項11から17のいずれか1項記載の生存分析方法。
- 入力された事例に含まれる該事例の特徴量を示す属性値から事象発生の有無を推定するための複数の推定器を備え、
前記事象発生有りと推定した推定器に対応する実期間のうち、最も短い実期間を事象発生までの期間である推定期間と判定し、
前記推定期間及び該推定期間に対応する推定器の情報の少なくとも1つを含む出力情報を生成する生存分析方法。 - 入力された事例に対応する事例群の特徴値を含む出力情報を生成する請求項19記載の生存分析方法。
- 事例の特徴量を示す少なくとも1つの属性値と事象発生までの測定期間である実期間の情報とを含む事例の集合である事例群を基に事象発生までの期間である推定期間を求めるための処理をコンピュータにより実行するためのプログラムであって、
複数の前記実期間毎に前記事例群の属性値から事象発生の有無を推定する推定器を生成し、
前記推定器が所定の選別条件を満たすか否かを判定し、前記推定期間の算出に用いる推定器を選別し、
前記推定器選別部で選別した推定器を用いて前記推定期間を算出するための処理をコンピュータに実行させるためのプログラム。 - 前記事例に前記事象発生の有無または観測の打ち切り例を示すイベントの情報を備え、
前記実期間の時点で打ち切り例の事例を除いた残りの事例群の属性値から前記推定器を生成する処理をコンピュータに実行させるための請求項21記載のプログラム。 - 選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が短くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果、及び選別対象の推定器による推定結果と該推定器に対応する実時間よりも実時間が長くかつ該実時間に最も近い実時間に対応する推定器による推定結果の検定結果を、選別対象の推定器を前記推定期間の算出に用いるか否かを判定するための選別条件とする処理をコンピュータに実行させるための請求項21または22記載のプログラム。
- 前記選別された推定器に対応する実時間のうち、前記推定器に対応する実期間と、該推定器に対応する実期間よりも短い推定器に対応する実期間とを用いて前記推定期間を算出する処理をコンピュータに実行させるための請求項21から23のいずれか1項記載のプログラム。
- 前記選別された推定器に対応する実時間のうち、前記推定器に対応する実期間と、該推定器に対応する実期間よりも短くかつ該実期間に最も近い推定器に対応する実期間との平均値を前記推定期間とする処理をコンピュータに実行させるための請求項24記載のプログラム。
- 前記推定期間の算出に用いる推定器に対応する実期間よりも短い実期間に対応する推定器にて事象発生無しと推定され、前記推定期間の算出に用いる推定器にて事象発生有りと推定された事例群の実期間を用いて推定期間を算出する処理をコンピュータに実行させるための請求項21から23のいずれか1項記載のプログラム。
- 前記推定期間の算出に用いる推定器の生成時点の実期間よりも短い実期間に対応する推定器で事象発生無しと推定され、前記推定期間の算出に用いる推定器で事象発生有りと推定された事例群の実期間の平均値または中央値のいずれか一方を推定期間とする処理をコンピュータに実行させるための請求項26記載のプログラム。
- 推定期間の算出結果、前記事例群の解析データ及び前記推定器の有効性の検証結果の少なくとも1つを含む、利用者に提示するための出力情報を生成する処理をコンピュータに実行させるための請求項21から27のいずれか1項記載のプログラム。
- 入力された事例に含まれる該事例の特徴量を示す属性値から事象発生の有無を推定するための複数の推定器を備え、
前記事象発生有りと推定した推定器に対応する実期間のうち、最も短い実期間を事象発生までの期間である推定期間と判定し、
前記推定期間及び該推定期間に対応する推定器の情報の少なくとも1つを含む出力情報を生成する処理をコンピュータに実行させるためのプログラム。 - 入力された事例に対応する事例群の特徴値を含む出力情報を生成する処理をコンピュータに実行させるための請求項29記載のプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007060409 | 2007-03-09 | ||
JP2007060409 | 2007-03-09 | ||
PCT/JP2008/052226 WO2008111349A1 (ja) | 2007-03-09 | 2008-02-12 | 生存分析システム、生存分析方法および生存分析用プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2008111349A1 true JPWO2008111349A1 (ja) | 2010-06-24 |
Family
ID=39759292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009503927A Pending JPWO2008111349A1 (ja) | 2007-03-09 | 2008-02-12 | 生存分析システム、生存分析方法および生存分析用プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20100094785A1 (ja) |
JP (1) | JPWO2008111349A1 (ja) |
WO (1) | WO2008111349A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10388179B2 (en) * | 2008-06-18 | 2019-08-20 | Accenture Global Solutions Limited | Analytics platform |
KR102106428B1 (ko) * | 2018-02-19 | 2020-05-06 | 주식회사 셀바스에이아이 | 건강나이 예측 방법 |
US11810013B2 (en) | 2019-11-14 | 2023-11-07 | International Business Machines Corporation | Systems and methods for alerting to model degradation based on survival analysis |
US20210150394A1 (en) * | 2019-11-14 | 2021-05-20 | International Business Machines Corporation | Systems and methods for alerting to model degradation based on survival analysis |
US11455561B2 (en) | 2019-11-14 | 2022-09-27 | International Business Machines Corporation | Alerting to model degradation based on distribution analysis using risk tolerance ratings |
US11768917B2 (en) | 2019-11-14 | 2023-09-26 | International Business Machines Corporation | Systems and methods for alerting to model degradation based on distribution analysis |
JP2021144615A (ja) | 2020-03-13 | 2021-09-24 | 富士通株式会社 | 情報処理方法、情報処理プログラム及び情報処理装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005524124A (ja) * | 2001-10-17 | 2005-08-11 | コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼーション | システムの診断構成要素を識別するための方法および装置 |
US20040010481A1 (en) * | 2001-12-07 | 2004-01-15 | Whitehead Institute For Biomedical Research | Time-dependent outcome prediction using neural networks |
US7505948B2 (en) * | 2003-11-18 | 2009-03-17 | Aureon Laboratories, Inc. | Support vector regression for censored data |
WO2005086068A2 (en) * | 2004-02-27 | 2005-09-15 | Aureon Laboratories, Inc. | Methods and systems for predicting occurrence of an event |
JP4318221B2 (ja) * | 2004-12-02 | 2009-08-19 | 富士通株式会社 | 医療情報分析装置、方法及びプログラム |
JP2006202235A (ja) * | 2005-01-24 | 2006-08-03 | Nara Institute Of Science & Technology | 経時的現象発生解析装置及び経時的現象発生解析方法 |
JP2006293489A (ja) * | 2005-04-06 | 2006-10-26 | Sony Corp | 学習装置および学習方法、並びに学習プログラム |
-
2008
- 2008-02-12 JP JP2009503927A patent/JPWO2008111349A1/ja active Pending
- 2008-02-12 WO PCT/JP2008/052226 patent/WO2008111349A1/ja active Application Filing
- 2008-02-12 US US12/530,428 patent/US20100094785A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2008111349A1 (ja) | 2008-09-18 |
US20100094785A1 (en) | 2010-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6243080B1 (ja) | プリプロセッサおよび異常予兆診断システム | |
JPWO2008111349A1 (ja) | 生存分析システム、生存分析方法および生存分析用プログラム | |
US10332638B2 (en) | Methods and systems for pre-symptomatic detection of exposure to an agent | |
US10613960B2 (en) | Information processing apparatus and information processing method | |
JP5765336B2 (ja) | 障害分析装置、障害分析方法およびプログラム | |
US11664126B2 (en) | Clinical predictor based on multiple machine learning models | |
JP2013131211A (ja) | 疾患診断のための最適の診断要素セット決定装置及び方法 | |
US20180114123A1 (en) | Rule generation method and apparatus using deep learning | |
JP2018045516A (ja) | 分類装置、分類方法およびプログラム | |
CN111178548A (zh) | 集成学习预测方法与系统 | |
CN111095232A (zh) | 发掘用于机器学习技术中的基因组 | |
JP6658507B2 (ja) | 負荷推定システム、情報処理装置、負荷推定方法、及び、コンピュータ・プログラム | |
KR102221067B1 (ko) | 네트워크 엔트로피에 기초하는 생체의 상태 천이의 예조의 검출을 지원하는 검출 장치, 검출 방법 및 검출 프로그램 | |
JP2019105871A (ja) | 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置 | |
US20210174229A1 (en) | Device for ensembling data received from prediction devices and operating method thereof | |
US10692256B2 (en) | Visualization method, visualization device, and recording medium | |
JP2016042123A (ja) | 生成モデル作成装置、推定装置、それらの方法およびプログラム | |
JP2022551325A (ja) | 診断ツール | |
JPWO2019239607A1 (ja) | 診断装置、診断方法及びプログラム | |
US20220359082A1 (en) | Health state prediction system including ensemble prediction model and operation method thereof | |
JPWO2016103611A1 (ja) | 要因分析装置、要因分析方法、および、プログラム | |
KR102502880B1 (ko) | 베이지안 최대엔트로피모델 추정 및 뇌 기능 동적 특성 평가 방법 | |
JP6114209B2 (ja) | モデル処理装置、モデル処理方法、およびプログラム | |
WO2022085785A1 (ja) | 健康改善経路探索装置及び健康改善経路探索方法 | |
D’Silva et al. | Prediction of Hypertension using Machine Learning |