JP2013117926A - イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム - Google Patents

イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム Download PDF

Info

Publication number
JP2013117926A
JP2013117926A JP2011266154A JP2011266154A JP2013117926A JP 2013117926 A JP2013117926 A JP 2013117926A JP 2011266154 A JP2011266154 A JP 2011266154A JP 2011266154 A JP2011266154 A JP 2011266154A JP 2013117926 A JP2013117926 A JP 2013117926A
Authority
JP
Japan
Prior art keywords
matrix
ordered set
calculating
event
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011266154A
Other languages
English (en)
Other versions
JP5839970B2 (ja
Inventor
Takeshi Ide
剛 井手
Raymond Harry Putra Rudy
ルディー・レイモンド・ハリー・プテラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2011266154A priority Critical patent/JP5839970B2/ja
Priority to US13/681,688 priority patent/US8983890B2/en
Priority to US13/688,724 priority patent/US9317804B2/en
Publication of JP2013117926A publication Critical patent/JP2013117926A/ja
Application granted granted Critical
Publication of JP5839970B2 publication Critical patent/JP5839970B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Child & Adolescent Psychology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】イベント系列を示す部分順序集合に基づいて全順序集合を推算し、イベント系列ごとにリスク評価値を算出することができる、イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラムを提供する。
【解決手段】有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する。部分順序集合を近似的な全順序集合に変換し、変換された全順序集合からM次元の特徴ベクトルを算出する。算出したM次元の特徴ベクトルに基づいてリスク評価値を算出する射影行列を算出する。
【選択図】図2

Description

本発明は、所定の事象が発生するリスク評価値を、部分的に時系列に発生するイベント系列ごとに算出する、イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラムに関する。
危機的な事象の発生には、その予兆となるべき数多くのイベントが時系列に発生すると考えられることが多い。したがって、時系列に発生するイベント群(以下、イベント系列)から、危機的な事象が発生する可能性を推算して、事前に警告を発することが好ましい。
しかし、どのイベント系列がどの危機的な事象の発生に結びついているのか、不明確である場合が多い。また、あらゆる場合を事前に想定することは難しく、想定されるイベント系列の数が膨大になることが多い。そこで、ニューロンモデル等を用いてモデル化する、リスク評価値を推算する等の方法により、発生する可能性のある事象を予測するシステムが多々開発されている。
例えば特許文献1では、大多数クラス、少数クラスの双方を含む場合に、属性を考慮したスコアに基づいて実態に応じたリスク予測を行うことができるリスク予測装置が開示されている。特許文献1では、大多数クラスのインスタンス数が少数クラスのインスタンス数よりも非常に大きい不均衡な学習データを用いても、リスク要因に強く関係する属性を正確に同定することができる。
特開2009−237914号公報
しかし、必ずしも大多数クラスがいつも特定されるわけでもなく、属性項目も多岐にわたることが珍しくない。また、同じ属性項目であっても、発生するイベントの時系列が相違するだけで、最終的に発生する事象が相違することも多く、単なる属性を考慮したスコアだけからでは、危機的な事象の発生の予兆であると事前に警告を発することは現実的には困難であるという問題点があった。
特に医療関係のイベントでは、発生する可能性のある危機的に事象に結びつく全てのイベント系列を特定することは現実的に不可能である。一方、特定することができた場合であっても、全く同一のイベント系列はほとんど存在しないと想定されるので、実際のモデルとしては使いにくい。また、長さも要素も異なるイベント系列を比較する手段がなく、イベント系列に基づいてリスク評価値を客観的に算出することは困難であった。
本発明は斯かる事情に鑑みてなされたものであり、イベント系列を示す部分順序集合に基づいて全順序集合を推算し、イベント系列ごとにリスク評価値を算出することができる、イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラムを提供することを目的とする。
上記目的を達成するために第1発明に係る方法は、有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置で実行することが可能な方法であって、前記部分順序集合を近似的な全順序集合に変換するステップと、変換された全順序集合からM次元の特徴ベクトルを算出するステップと、算出したM次元の特徴ベクトルに基づいてリスク評価値を算出する射影行列を算出するステップとを含む。
また、第2発明に係る方法は、第1発明において、部分順序集合に基づきM次元の疎な順序行列を生成し、生成した疎な順序行列と最も類似度が高い密な順序行列を算出する。
また、第3発明に係る方法は、第2発明において、算出した密な順序行列を列ベクトルに変換し、リスクが生じたか否かを示すラベル値を算出する射影行列を、線形回帰により算出する。
次に、上記目的を達成するために第4発明に係る方法は、有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置で実行することが可能な方法であって、前記部分順序集合を近似的な全順序集合に変換するステップと、変換した全順序集合に基づいて、リスクが発生したか否かを示すラベル値の算出誤差が最小となる半正定値行列を算出し、算出した半正定値行列に基づいてリスク評価値を算出する射影行列を算出するステップとを含む。
次に、上記目的を達成するために第5発明に係る装置は、有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置であって、前記部分順序集合を近似的な全順序集合に変換する変換手段と、変換された全順序集合からM次元の特徴ベクトルを算出する特徴ベクトル算出手段と、算出したM次元の特徴ベクトルに基づいてリスク評価値を算出する射影行列を算出する射影行列算出手段とを備える。
また、第6発明に係る装置は、第5発明において、前記変換手段は、部分順序集合に基づきM次元の疎な順序行列を生成し、生成した疎な順序行列と最も類似度が高い密な順序行列を算出する。
また、第7発明に係る装置は、第6発明において、前記射影行列算出手段は、算出した密な順序行列を列ベクトルに変換し、リスクが生じたか否かを示すラベル値を算出する射影行列を、線形回帰により算出する。
次に、上記目的を達成するために第8発明に係るコンピュータプログラムは、有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置で実行することが可能なコンピュータプログラムであって、前記装置を、前記部分順序集合を近似的な全順序集合に変換する変換手段、変換された全順序集合からM次元の特徴ベクトルを算出する特徴ベクトル算出手段、及び算出したM次元の特徴ベクトルに基づいてリスク評価値を算出する射影行列を算出する射影行列算出手段として機能させる。
また、第9発明に係るコンピュータプログラムは、第8発明において、前記変換手段を、部分順序集合に基づきM次元の疎な順序行列を生成し、生成した疎な順序行列と最も類似度が高い密な順序行列を算出する手段として機能させる。
また、第10発明に係るコンピュータプログラムは、第9発明において、前記射影行列算出手段を、算出した密な順序行列を列ベクトルに変換し、リスクが生じたか否かを示すラベル値を算出する射影行列を、線形回帰により算出する手段として機能させる。
本発明によれば、長さも要素もまちまちなイベント系列を示す部分順序集合(行列)を全順序集合(行列)に変換することで、リスク評価値をイベント系列ごとに算出することができ、イベント系列ごとに発生するリスクを容易に比較することが可能となる。また、任意のイベント系列に対するリスク評価値を算出することにより、発生する可能性がある危機的な事象に対するリスクを客観的に評価することも可能となる。
本発明の実施の形態1に係るリスク算出装置の構成を模式的に示すブロック図である。 本発明の実施の形態1に係るリスク算出装置の機能ブロック図である。 本発明の実施の形態1に係るリスク算出装置で取得するイベント系列の例示図である。 イベント系列に含まれるイベント間の類似度を表した類似度行列Sの例示図である。 本発明の実施の形態1に係るリスク算出装置で生成する部分順序行列の例示図である。 本発明の実施の形態1に係るリスク算出装置のCPUの処理手順を示すフローチャートである。 本発明の実施の形態2に係るリスク算出装置の機能ブロック図である。 本発明の実施の形態2に係るリスク算出装置のCPUの処理手順を示すフローチャートである。
以下、本発明の実施の形態に係る、所定の事象が発生するリスク評価値を、部分的に時系列に発生するイベント系列ごとに算出する、イベント系列のリスク評価値を算出するリスク算出装置について、図面に基づいて具体的に説明する。以下の実施の形態は、特許請求の範囲に記載された発明を限定するものではなく、実施の形態の中で説明されている特徴的事項の組み合わせの全てが解決手段の必須事項であるとは限らないことは言うまでもない。
また、本発明は多くの異なる態様にて実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。実施の形態を通じて同じ要素には同一の符号を付している。
以下の実施の形態では、コンピュータシステムにコンピュータプログラムを導入した装置について説明するが、当業者であれば明らかな通り、本発明はその一部をコンピュータで実行することが可能なコンピュータプログラムとして実施することができる。したがって、本発明は、部分的なイベントの順序集合に基づいて全順序集合を推算し、リスク評価値を算出することができるイベント系列のリスクを算出するリスク算出装置というハードウェアとしての実施の形態、ソフトウェアとしての実施の形態、又はソトウェアとハードウェアとの組み合わせの実施の形態をとることができる。コンピュータプログラムは、ハードディスク、DVD、CD、光記憶装置、磁気記憶装置等の任意のコンピュータで読み取ることが可能な記録媒体に記録することができる。
本発明の実施の形態によれば、長さも要素もまちまちなイベント系列を示す部分順序集合(行列)を全順序集合(行列)に変換することで、リスク評価値をイベント系列ごとに算出することができ、イベント系列ごとに発生するリスクを容易に比較することが可能となる。また、任意のイベント系列に対するリスク評価値を算出することにより、発生する可能性がある危機的な事象に対するリスクを客観的に評価することも可能となる。
(実施の形態1)
図1は、本発明の実施の形態1に係るリスク算出装置の構成を模式的に示すブロック図である。本発明の実施の形態1に係るリスク算出装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、ビデオインタフェース15、可搬型ディスクドライブ16、通信インタフェース17及び上述したハードウェアを接続する内部バス18で構成されている。
CPU11は、内部バス18を介してリスク算出装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置13に記憶されたコンピュータプログラム100に従って、種々のソフトウェア的機能を実行する。メモリ12は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム100の実行時にロードモジュールが展開され、コンピュータプログラム100の実行時に発生する一時的なデータ等を記憶する。
記憶装置13は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置13に記憶されたコンピュータプログラム100は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードされ、実行時には記憶装置13からメモリ12へ展開して実行される。もちろん、通信インタフェース17を介して接続されている外部コンピュータからダウンロードされたコンピュータプログラムであっても良い。
通信インタフェース17は内部バス18に接続されており、インターネット、LAN、WAN等の外部のネットワークに接続されることにより、外部コンピュータ等とデータ送受信を行うことが可能となっている。
I/Oインタフェース14は、キーボード21、マウス22等の入力装置と接続され、データの入力を受け付ける。ビデオインタフェース15は、CRTディスプレイ、液晶ディスプレイ等の表示装置23と接続され、所定の画像を表示する。
図2は、本発明の実施の形態1に係るリスク算出装置1の機能ブロック図である。図2において、リスク算出装置1のイベント系列取得部201は、学習データとして、複数のイベントの時系列データであるイベント系列を取得する。具体的には、有限個であるN個(Nは自然数)のイベント系列、イベント系列ごとのリスク値、及びイベント系列ごとに含まれる要素間の類似度を取得する。
図3は、本発明の実施の形態1に係るリスク算出装置1で取得するイベント系列の例示図である。図3の例では、有限であるM種類のイベントからなるイベント系列をイベント系列1、2、・・・、i、j、・・・、Nと表しており、例えばイベント系列1では、イベントAから順にB、C、E、Fとイベントが発生したことを示している。また、右の欄の「1.0」、「0.0」はリスクが生じたか否かを示すラベル値を示しており、イベント系列ごとに、リスクが発生した場合のラベル値を「1.0」、発生しなかった場合のラベル値を「0.0」で表している。
図4は、イベント系列に含まれるイベント間の類似度を表した類似度行列Sの例示図である。例えばイベントiとイベントjとの間の類似度は、類似度行列Sの第i行及び第j列の要素であるSijで表すことができる。同一のイベントの類似度を‘1’で表しており、以下、類似度が高いほど‘1’に近い値を配した類似度行列として取得する。
なお、イベント系列の取得は、通信インタフェース17を介して接続されている外部コンピュータから取得しても良いし、DVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードして取得しても良い。また、イベント系列を、キーボード21、マウス22等の入力装置を介して直接入力を受け付けても良い。
図2に戻って、順序集合変換部(変換手段)202は、取得したイベント系列に基づいて、イベントの順序を表す部分順序行列(部分順序集合)を生成し、生成した部分順序行列を近似的な全順序行列(全順序集合)に変換する。すなわち、取得したイベント系列には、想定されるすべての種類のイベントが含まれているわけではないので、イベントが含まれていない部分を補間することにより全順序行列に変換する。
図5は、本発明の実施の形態1に係るリスク算出装置1で生成する部分順序行列の例示図である。図5では、図3のイベント系列1の部分順序行列として、イベントの種類がA〜Gまでの7種類と仮定した場合の部分順序行列X(1)を示している。
図5に示すように、行は上からイベントA、B、・・・、Gに相当し、列は左からイベントA、B、・・・Gに相当する。βは1より小さい既定値であり、各行のイベントからの間隔に応じた値となっている。
例えば、図3に示すイベント系列1ではイベントA、B、C、E、Fとイベントが発生しているので、イベントAから見ると(第1行)、イベントBは間隔‘1’であるので「β」、イベントCは間隔‘2’であるので「β2 」、イベントDは存在しないので「0」、・・・というように要素が決定する。
つまり、イベント系列iの部分順序行列X(i) の要素X(i)(e1、e2)は、(式1)で求めることができる。(式1)において、関数I(e1、e2)は、イベントe1がイベントe2の前なら‘1’を、それ以外は‘0’を返す関数である。また、sはイベントe1とイベントe2とのホップ数(両者の間隔に比例する値)を示している。例えばイベントAからイベントBでは、ホップ数は‘1’、イベントAからイベントCでは、ホップ数は‘2’となる。したがって、離れるほど小さな値を要素とする部分順序行列を生成することができる。
Figure 2013117926
イベント系列ごとに、(式1)に基づく部分順序行列が生成されるが、そのほとんどの要素が‘0’である疎な順序行列である。そこで、いわゆるラベル伝播手法を用いて、部分順序行列を補間する。すなわち(式2)に従って、相互に類似度が最小となるよう、部分順序行列を補間した密な順序行列Uを算出する。
Figure 2013117926
図2に戻って、特徴ベクトル算出部203は、変換された全順序行列(全順序集合)からM次元の特徴ベクトルを算出する。具体的には、全順序行列を一列の列ベクトルに変換する。例えば3×3行列を列ベクトルに変換する関数vecは(式3)に示すように定義される。
Figure 2013117926
図2に戻って、射影行列算出部204は、算出したM次元の特徴ベクトルに基づいて、リスク評価値を算出するための射影行列を算出する。具体的には、算出したM次元の密な順序行列U(i)(i=1〜N)を、それぞれ(式3)によりN個の列ベクトルに変換し、線形回帰によりイベント系列からリスク評価値を算出する射影行列A及び誤差bを算出する。
つまり、(式4)のように、ベクトル系列取得時のリスク値(ラベル値)y(i)(i=1〜N)と、対応するベクトル系列U(i)(i=1〜N)との関係を定めた場合に、射影行列A及び誤差bを線形回帰により求めることに他ならない。
Figure 2013117926
(式4)の射影行列Aと誤差bとは、(式5)に示すように展開した上で、L1正則化あるいはL2正則化を用いて解くことにより求めることができる。射影行列Aと誤差bとが定まることで、任意のベクトル系列U(i)(i=1〜N)を入力として、リスク値y(i)(i=1〜N)=f(U)をリスク評価値として算出することが可能となる。
Figure 2013117926
図6は、本発明の実施の形態1に係るリスク算出装置1のCPU11の処理手順を示すフローチャートである。リスク算出装置1のCPU11は、複数のイベントの時系列データであるイベント系列を取得する(ステップS601)。具体的には、有限個であるN個(Nは自然数)のイベント系列、イベント系列ごとのリスク値、及びイベント系列ごとに含まれる要素間の類似度を取得する。
CPU11は、取得したイベント系列に基づいて、イベントの順序を表す部分順序行列(部分順序集合)を生成し(ステップS602)、生成した部分順序行列を近似的な全順序行列(全順序集合)に変換する(ステップS603)。すなわち、取得したイベント系列には、想定されるすべての種類のイベントが含まれているわけではないので、イベントが含まれていない部分を補間することにより全順序行列に変換する。
CPU11は、変換された全順序行列からM次元の特徴ベクトル(列ベクトル)を算出する(ステップS604)。具体的には、全順序行列を一列の列ベクトルに変換する。
CPU11は、算出したM次元の特徴ベクトル(列ベクトル)に基づいて、線形回帰によりイベント系列からリスク評価値を算出する射影行列A及び誤差bを算出する(ステップS605)。これにより、任意のベクトル系列の入力に対して、(式4)を用いてリスク評価値を算出することができる。
以上のように本実施の形態1によれば、長さも要素もまちまちなイベント系列を示す部分順序集合(行列)を全順序集合(行列)に変換することで、リスク評価値をイベント系列ごとに算出することができ、イベント系列ごとに発生するリスクを容易に比較することが可能となる。また、任意のイベント系列に対するリスク評価値を算出することにより、発生する可能性がある危機的な事象に対するリスクを客観的に評価することも可能となる。
(実施の形態2)
本発明の実施の形態2に係るリスク算出装置の構成は実施の形態1と同様であることから、同一の符号を付することにより詳細な説明は省略する。本実施の形態2では、リスク評価値を特徴ベクトルを用いずに算出する点で実施の形態1とは相違する。
図7は、本発明の実施の形態2に係るリスク算出装置1の機能ブロック図である。図7において、リスク算出装置1のイベント系列取得部701は、学習データとして、複数のイベントの時系列データであるイベント系列を取得する。具体的には、有限個であるN個(Nは自然数)のイベント系列、イベント系列ごとのリスク値、及びイベント系列ごとに含まれる要素間の類似度を取得する。
イベント系列の取得は、通信インタフェース17を介して接続されている外部コンピュータから取得しても良いし、DVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードして取得しても良い。また、イベント系列を、キーボード21、マウス22等の入力装置を介して直接入力を受け付けても良い。
順序集合変換部(変換手段)702は、取得したイベント系列に基づいて、イベントの順序を表す部分順序行列(部分順序集合)を生成し、生成した部分順序行列を近似的な全順序行列(全順序集合)に変換する。すなわち、取得したイベント系列には、想定されるすべての種類のイベントが含まれているわけではないので、イベントが含まれていない部分を補間することにより全順序行列に変換する。
射影行列算出部703は、半正定値行列算出部704を備えている。半正定値行列算出部704は、変換された全順序行列(全順序集合)に基づいて、リスクが発生したか否かを示すラベル値の算出誤差が最小となる半正定値行列を算出する。ここで、半正定値行列とは、行列の固有値が0又は正である行列を意味する。
具体的には、算出する半正定値行列をV、ラベル値の算出誤差をεとした場合、算出誤差εが最小となる行列が半正定値行列Vとなる。したがって、(式6)を満たす半正定値行列Vを算出すれば良い。
Figure 2013117926
(式6)において、「Tr」は、行列の対角要素を加算する関数であり、対角要素の加算値というスカラ値を返す。第i+時系列のラベル値が‘1’の場合、すなわちリスクが発生した場合は(式6)の第二行に示すように、第i−時系列のラベル値が‘0’の場合、すなわちリスクが発生しなかった場合は(式6)の第三行に示すように、それぞれ(式6)を満たす半正定値行列Vを算出する。
もちろん近似行列Z(Zも半正定値行列)を用いて半正定値行列Vを算出しても良い。この場合、(式7)に基づいて閾値(誤差)ηを最小にする近似行列Zを求めて、半正定値行列Vを算出する。なお、(式7)において、演算子「○」は、演算子を挟む行列間の要素ごとの乗算を意味している。
Figure 2013117926
算出した半正定値行列Vが、射影行列Aに相当する。したがって、任意のベクトル系列の入力に対して、(式4)を用いてリスク評価値を算出することができる。
図8は、本発明の実施の形態2に係るリスク算出装置1のCPU11の処理手順を示すフローチャートである。リスク算出装置1のCPU11は、複数のイベントの時系列データであるイベント系列を取得する(ステップS801)。具体的には、有限個であるN個(Nは自然数)のイベント系列、イベント系列ごとのリスク値、及びイベント系列ごとに含まれる要素間の類似度を取得する。
CPU11は、取得したイベント系列に基づいて、イベントの順序を表す部分順序行列(部分順序集合)を生成し(ステップS802)、生成した部分順序行列を近似的な全順序行列(全順序集合)に変換する(ステップS803)。すなわち、取得したイベント系列には、想定されるすべての種類のイベントが含まれているわけではないので、イベントが含まれていない部分を補間することにより全順序行列に変換する。
CPU11は、変換された全順序行列(全順序集合)に基づいて、リスクが発生したか否かを示すラベル値の算出誤差が最小となる半正定値行列Vを算出する(ステップS804)。具体的には、算出する半正定値行列をV、ラベル値の算出誤差をεとした場合、算出誤差εが最小となる行列が半正定値行列Vとなる。
以上のように本実施の形態2によれば、長さも要素もまちまちなイベント系列を示す部分順序行列(集合)を全順序行列(集合)に変換することで、リスク評価値をイベント系列ごとに算出することができ、イベント系列ごとに発生するリスクを容易に比較することが可能となる。また、特徴ベクトルを算出することなく、任意のイベント系列に対するリスク評価値を算出することが可能となる。
上述した実施の形態1及び2は、医療イベント系列に適用することが効果的である。例えば、頭痛がする、腹痛がする、気分が悪い等の症状は多種多様であり、大きな病気の予兆であるのか否かを判断することは困難である。そこで、学習データとして、多くの患者の問診時のデータ、日常の生活データ等をイベント系列として取得し、糖尿病、がん等の大きな病気を患った場合のリスクを予測するモデルに適用することで、大きな病気を患うリスクを減じることも考えられる。
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。すなわち、実施例として説明した医療イベント系列に限定されるものではなく、原因と結果とが存在するあらゆる事象に適用することが可能であることは言うまでもない。
1 リスク算出装置
11 CPU
12 メモリ
13 記憶装置
14 I/Oインタフェース
15 ビデオインタフェース
16 可搬型ディスクドライブ
17 通信インタフェース
18 内部バス
90 可搬型記録媒体
100 コンピュータプログラム

Claims (10)

  1. 有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置で実行することが可能な方法であって、
    前記部分順序集合を近似的な全順序集合に変換するステップと、
    変換された全順序集合からM次元の特徴ベクトルを算出するステップと、
    算出したM次元の特徴ベクトルに基づいてリスク評価値を算出する射影行列を算出するステップと
    を含む方法。
  2. 部分順序集合に基づきM次元の疎な順序行列を生成し、生成した疎な順序行列と最も類似度が高い密な順序行列を算出する請求項1に記載の方法。
  3. 算出した密な順序行列を列ベクトルに変換し、リスクが生じたか否かを示すラベル値を算出する射影行列を、線形回帰により算出する請求項2に記載の方法。
  4. 有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置で実行することが可能な方法であって、
    前記部分順序集合を近似的な全順序集合に変換するステップと、
    変換した全順序集合に基づいて、リスクが発生したか否かを示すラベル値の算出誤差が最小となる半正定値行列を算出し、算出した半正定値行列に基づいてリスク評価値を算出する射影行列を算出するステップと
    を含む方法。
  5. 有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置であって、
    前記部分順序集合を近似的な全順序集合に変換する変換手段と、
    変換された全順序集合からM次元の特徴ベクトルを算出する特徴ベクトル算出手段と、
    算出したM次元の特徴ベクトルに基づいてリスク評価値を算出する射影行列を算出する射影行列算出手段と
    を備える装置。
  6. 前記変換手段は、部分順序集合に基づきM次元の疎な順序行列を生成し、生成した疎な順序行列と最も類似度が高い密な順序行列を算出する請求項5に記載の装置。
  7. 前記射影行列算出手段は、算出した密な順序行列を列ベクトルに変換し、リスクが生じたか否かを示すラベル値を算出する射影行列を、線形回帰により算出する請求項6に記載の装置。
  8. 有限であるM(Mは自然数)種類のイベントからなるイベント群の一部を時系列に示す部分順序集合であるイベント系列のリスク評価値を算出する装置で実行することが可能なコンピュータプログラムであって、
    前記装置を、
    前記部分順序集合を近似的な全順序集合に変換する変換手段、
    変換された全順序集合からM次元の特徴ベクトルを算出する特徴ベクトル算出手段、及び
    算出したM次元の特徴ベクトルに基づいてリスク評価値を算出する射影行列を算出する射影行列算出手段
    として機能させるコンピュータプログラム。
  9. 前記変換手段を、部分順序集合に基づきM次元の疎な順序行列を生成し、生成した疎な順序行列と最も類似度が高い密な順序行列を算出する手段として機能させる請求項8に記載のコンピュータプログラム。
  10. 前記射影行列算出手段を、算出した密な順序行列を列ベクトルに変換し、リスクが生じたか否かを示すラベル値を算出する射影行列を、線形回帰により算出する手段として機能させる請求項9に記載のコンピュータプログラム。
JP2011266154A 2011-12-05 2011-12-05 イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム Expired - Fee Related JP5839970B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011266154A JP5839970B2 (ja) 2011-12-05 2011-12-05 イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム
US13/681,688 US8983890B2 (en) 2011-12-05 2012-11-20 Calculating risk assessment value of event sequence
US13/688,724 US9317804B2 (en) 2011-12-05 2012-11-29 Calculating risk assessment value of event sequence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011266154A JP5839970B2 (ja) 2011-12-05 2011-12-05 イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2013117926A true JP2013117926A (ja) 2013-06-13
JP5839970B2 JP5839970B2 (ja) 2016-01-06

Family

ID=48524746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011266154A Expired - Fee Related JP5839970B2 (ja) 2011-12-05 2011-12-05 イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム

Country Status (2)

Country Link
US (2) US8983890B2 (ja)
JP (1) JP5839970B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017507552A (ja) * 2013-12-31 2017-03-16 ヴァスコ データ セキュリティ インターナショナル ゲゼルシャフト ミット ベシュレンクテル ハフツング クライアント側のスコアベース認証を与える方法及び装置
JP7490321B2 (ja) 2021-09-22 2024-05-27 Kddi株式会社 情報処理装置及び情報処理方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5839970B2 (ja) * 2011-12-05 2016-01-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム
CN103975327B (zh) * 2011-12-06 2016-08-17 国际商业机器公司 用于可视化事件序列中的风险评估值的方法及设备
US9577897B2 (en) * 2015-02-20 2017-02-21 Adobe Systems Incorporated Providing visualizations of event sequence data
US10762460B2 (en) 2015-12-30 2020-09-01 International Business Machines Corporation Predictive alerts for individual risk of injury with ameliorative actions
CN113011893B (zh) * 2021-03-22 2024-04-26 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066058A (ja) * 2005-08-31 2007-03-15 Toshiba Corp 時系列データ分析装置、時系列データ分析方法、及び時系列データ分析プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4652741B2 (ja) * 2004-08-02 2011-03-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 異常検出装置、異常検出方法、異常検出プログラム、及び記録媒体
JP4201027B2 (ja) * 2006-07-10 2008-12-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 複数の観測結果の間の差異を検出するシステムおよびその方法
EP2073536A4 (en) * 2007-02-28 2011-02-16 Panasonic Corp DISPLAY DEVICE AND ITS CONTROL METHOD
JP5203670B2 (ja) * 2007-10-25 2013-06-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 位置推定システム、方法及びプログラム
JP2009237914A (ja) 2008-03-27 2009-10-15 Toshiba Corp リスク要因を同定するためのリスク予測装置
JP4807418B2 (ja) * 2009-01-27 2011-11-02 トヨタ自動車株式会社 ディファレンシャル装置
DE112010004005B4 (de) * 2009-12-18 2018-01-04 International Business Machines Corporation System, Verfahren und Programm zur Kostenbewertung
JP5570008B2 (ja) * 2010-03-23 2014-08-13 インターナショナル・ビジネス・マシーンズ・コーポレーション カーネル回帰システム、方法及びプログラム
JP5839970B2 (ja) * 2011-12-05 2016-01-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム
CN103975327B (zh) * 2011-12-06 2016-08-17 国际商业机器公司 用于可视化事件序列中的风险评估值的方法及设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066058A (ja) * 2005-08-31 2007-03-15 Toshiba Corp 時系列データ分析装置、時系列データ分析方法、及び時系列データ分析プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015041591; 神嶌敏弘,外1名: '順序のクラスタリング-順序平均の最適性について' 電子情報通信学会技術研究報告 PRMU2003-75〜94 パターン認識・メディア理解 第103巻,第295号, 20030901, pp.49-54, 社団法人電子情報通信学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017507552A (ja) * 2013-12-31 2017-03-16 ヴァスコ データ セキュリティ インターナショナル ゲゼルシャフト ミット ベシュレンクテル ハフツング クライアント側のスコアベース認証を与える方法及び装置
JP7490321B2 (ja) 2021-09-22 2024-05-27 Kddi株式会社 情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
US9317804B2 (en) 2016-04-19
US20130144824A1 (en) 2013-06-06
US8983890B2 (en) 2015-03-17
JP5839970B2 (ja) 2016-01-06
US20130144825A1 (en) 2013-06-06

Similar Documents

Publication Publication Date Title
JP5839970B2 (ja) イベント系列のリスク評価値を算出する方法、装置及びコンピュータプログラム
Depaoli et al. Just another Gibbs sampler (JAGS) flexible software for MCMC implementation
Bryant et al. Thinking inside the box: A participatory, computer-assisted approach to scenario discovery
Wei et al. Structural reliability and reliability sensitivity analysis of extremely rare failure events by combining sampling and surrogate model methods
Kvassay et al. Analysis of minimal cut and path sets based on direct partial Boolean derivatives
Parnianifard et al. Comparative study of metamodeling and sampling design for expensive and semi-expensive simulation models under uncertainty
Kourehli et al. Structural damage detection based on incomplete modal data using pattern search algorithm
US9760592B2 (en) Metrics management and monitoring system for service transition and delivery management
Murgia et al. On the influence of maintenance activity types on the issue resolution time
JP5695763B2 (ja) イベント系列のリスク評価値を可視化する方法、装置及びコンピュータプログラム
Chan et al. A Bayesian conditional autoregressive geometric process model for range data
Liu et al. Reliability analysis and spares provisioning for repairable systems with dependent failure processes and a time-varying installed base
US20170330108A1 (en) Information processing system, information processing method, and recording medium
Zhao et al. Reliability sensitivity analysis using axis orthogonal importance Latin hypercube sampling method
US11023673B2 (en) Establishing a proficiency baseline for any domain specific natural language processing
Shi et al. A Forward and Backward Stagewise algorithm for nonconvex loss functions with adaptive Lasso
US20200104465A1 (en) Real-Time Prediction of Chemical Properties Through Combining Calculated, Structured and Unstructured Data at Large Scale
CN111666191B (zh) 数据质量监控方法、装置、电子设备及存储介质
Marjoram Approximation bayesian computation
US8682825B2 (en) Smarter business intelligence systems
JP2015187773A (ja) データ解析装置、データ解析プログラム及びデータ解析方法
Taghipour et al. Maximum likelihood estimation from interval censored recurrent event data
Rabiepour et al. Structural performance and damage prediction using a novel digital cloning technique
Lampeas et al. A hybrid framework for nonlinear dynamic simulations including full-field optical measurements and image decomposition algorithms
CN112712866A (zh) 一种确定文本信息相似度的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140708

TRDD Decision of grant or rejection written
RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20151020

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151020

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151110

R150 Certificate of patent or registration of utility model

Ref document number: 5839970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees