JP2015118466A - Information processing apparatus and program - Google Patents
Information processing apparatus and program Download PDFInfo
- Publication number
- JP2015118466A JP2015118466A JP2013260489A JP2013260489A JP2015118466A JP 2015118466 A JP2015118466 A JP 2015118466A JP 2013260489 A JP2013260489 A JP 2013260489A JP 2013260489 A JP2013260489 A JP 2013260489A JP 2015118466 A JP2015118466 A JP 2015118466A
- Authority
- JP
- Japan
- Prior art keywords
- data
- decision tree
- output
- item
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、決定木を用いたデータの活用を支援するための技術に関する。 The present invention relates to a technique for supporting utilization of data using a decision tree.
決定木を用いたデータの活用を支援するための技術がある。例えば、特許文献1には、複数の種類の医用画像と、分岐する条件(例えば医用画像の画素単位での画素値)と、それらの条件により判別される病変候補の有無またはその種類とが定められた決定木を用いて、医師が医用画像から病変候補を把握することを支援する技術が記載されている。 There are technologies to support the utilization of data using decision trees. For example, Patent Document 1 defines a plurality of types of medical images, branching conditions (for example, pixel values in pixel units of medical images), and presence / absence or types of lesion candidates determined based on these conditions. A technique for assisting a doctor to grasp a lesion candidate from a medical image using the determined decision tree is described.
特許文献1の技術では、結論(この技術では病変候補の有無またはその種類)を導き出すために有用な分岐の条件が予め定められた決定木が用いられているが、そのような分岐の条件及び結論が分かっていない場合には、データから決定木を生成し、その中から有用な分岐の条件及び結論を見つけ出して用いることがある。その場合に、どの条件及び結論が有用なのかということは、例えば特許文献1に記載されているような条件と結論だけが示された決定木だけを見ても判断しにくい。
そこで、本発明は、決定木から有用な分岐の条件及び結論を見つけやすくすることを目的とする。
In the technique of Patent Document 1, a decision tree in which a branch condition useful for deriving a conclusion (in this technique, the presence or absence of a lesion candidate or its type) is used in advance is used. If the conclusion is not known, a decision tree may be generated from the data, and useful branch conditions and conclusions may be found and used. In that case, it is difficult to determine which conditions and conclusions are useful even if only a decision tree showing only the conditions and conclusions described in Patent Document 1 is viewed.
Accordingly, an object of the present invention is to make it easier to find useful branch conditions and conclusions from a decision tree.
本発明は、複数の対象の各々に関する複数の事項のデータを取得する取得手段と、前記取得手段により取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成手段と、前記生成手段により生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出手段と、前記取得手段により取得されたデータから、前記抽出手段により抽出された決まり事の有意さの度合いを表す有意度を算出する算出手段と、前記生成手段により生成された決定木と、前記抽出手段により抽出された決まり事と、前記算出手段により算出された有意度との一覧を示す一覧データを出力する出力手段とを備える情報処理装置を提供する。 The present invention is predicted when the data of the first item of the target satisfies the condition from the acquisition unit that acquires the data of the plurality of items regarding each of the plurality of targets and the data acquired by the acquisition unit A generation unit that generates a decision tree representing data of the second item of interest, and a decision tree generated by the generation unit when the data of the first item satisfies the condition Extraction means for extracting the rule that the data of the matter is obtained, and calculation means for calculating the significance indicating the degree of significance of the rule extracted by the extraction means from the data acquired by the acquisition means; , An output for outputting list data indicating a list of the decision tree generated by the generation unit, the rules extracted by the extraction unit, and the significance calculated by the calculation unit An information processing apparatus and a stage.
また、前記取得手段は、第1の時期及び当該第1の時期よりもあとの第2の時期における前記複数の事項のデータを取得し、前記生成手段は、前記取得手段により取得された前記第1及び第2の時期における前記複数の事項のデータから前記決定木をそれぞれ生成し、前記抽出手段は、前記第1及び第2の時期のそれぞれについて前記決まり事を抽出し、前記出力手段は、生成された前記決定木または抽出された前記決まり事のうち、前記第1の時期から前記第2の時期にかけて維持されている維持部分と変化した変化部分とを異なる態様の画像で表す画像データを、前記一覧データとして出力してもよい。 Further, the acquisition means acquires data of the plurality of items at a first time and a second time after the first time, and the generation means acquires the first time acquired by the acquisition means. The decision trees are generated from the data of the plurality of items at the first and second periods, respectively, the extraction unit extracts the rules for each of the first and second periods, and the output unit includes: Of the generated decision tree or the extracted rules, image data representing the maintained portion that has been maintained from the first time to the second time and the changed portion that has changed with images of different modes The list data may be output.
また、前記出力手段は、前記維持部分に比べて前記変化部分が認識されやすいようにした前記態様の画像を表す前記画像データを出力してもよい。
さらに、前記出力手段は、前記決定木において前記第2の事項のデータが複数ある場合には当該データをそれぞれ異なる並びに表し、且つ、前記第1及び第2の時期において、共通の前記条件を満たす共通の前記第2の事項のデータがある場合には、前記決定木のルートからの距離が同じ並びに当該共通の第2の事項のデータを表す前記画像データを出力してもよい。
Further, the output means may output the image data representing an image of the aspect in which the change portion is more easily recognized than the maintenance portion.
Further, the output means, when there are a plurality of data of the second matter in the decision tree, represents the data differently, and satisfies the common condition in the first and second periods When there is common second item data, the image data representing the same second item data as well as the same distance from the root of the decision tree may be output.
また、前記出力手段は、前記決まり事が複数ある場合には当該決まり事をそれぞれ異なる並びに表し、且つ、前記第1及び第2の時期において、共通の前記条件を満たす場合に共通の前記第2の事項のデータが得られるという共通の前記決まり事がある場合には、当該共通の決まり事に共通の符号を付して表す前記画像データを出力してもよい。
さらに、前記出力手段は、前記共通の決まり事が複数ある場合には、第1の前記共通の決まり事と第2の前記共通の決まり事とを、前記第1及び第2の時期のいずれにおいても同じ並びの数だけ離して表す画像データを出力してもよい。
また、前記算出手段は、抽出された前記決まり事のp値(probability value)を前記有意度として算出してもよい。
In addition, when there are a plurality of the rules, the output means represents the rules different from each other, and the second means common when the common conditions are satisfied in the first and second periods. In the case where there is a common rule that data of the item can be obtained, the image data represented by adding a common code to the common rule may be output.
In addition, when there are a plurality of the common rules, the output means determines the first common rule and the second common rule at any one of the first time and the second time. Also, image data that is separated by the same number of rows may be output.
The calculating means may calculate the extracted p-value (probability value) of the rule as the significance.
本発明は、コンピュータに、複数の対象の各々に関する複数の事項のデータを取得する取得ステップと、前記取得ステップにおいて取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成ステップと、前記生成ステップにおいて生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出ステップと、前記取得ステップにおいて取得されたデータから、前記抽出ステップにおいて抽出された決まり事の有意さの度合いを表す有意度を算出する算出ステップと、前記生成ステップにおいて生成された決定木と、前記抽出ステップにおいて抽出された決まり事と、前記算出ステップにおいて算出された有意度との一覧を示す一覧データを出力する出力ステップ手段とを実行させるためのプログラムを提供する。 The present invention provides an acquisition step of acquiring a plurality of items of data related to each of a plurality of targets in a computer, and when the data of the first item of the target satisfies a condition from the data acquired in the acquisition step A generation step of generating a decision tree representing data of the second item of interest to be predicted, and a decision tree generated in the generation step, when the data of the first item satisfies the condition An extraction step for extracting the rule that the data of the second matter is obtained, and a significance level representing the degree of significance of the rule extracted in the extraction step is calculated from the data acquired in the acquisition step. A calculation step; a decision tree generated in the generation step; a rule extracted in the extraction step; It provides a program for executing an output step for outputting a list data indicating a list of significant degrees calculated at step out.
本発明によれば、決定木から有用な分岐の条件及び結論を見つけやすくすることができる。 According to the present invention, it is possible to easily find useful branch conditions and conclusions from a decision tree.
[1]第1実施形態
[1−1]全体構成及びハードウェア構成
図1は、本発明の第1実施形態に係る情報提供システム1の全体構成を示す図である。情報提供システム1は、本実施形態においては、医師や看護師などの医療従事者に、医療に関する情報を総合的に提供するためのシステムである。情報提供システム1は、情報処理装置10と、ネットワーク2と、各医療施設3に設けられた複数のサーバ装置4及び複数のクライアント装置5とを備える。ネットワーク2は、装置間のデータのやり取りを仲介するシステムであり、例えば、医療施設3に設けられたLAN(Local Area Network)及びそれらのLANを接続するWAN(Wide Area Network)である。なお、ネットワーク2には、インターネットや無線通信回線などが含まれていてもよい。
[1] First Embodiment [1-1] Overall Configuration and Hardware Configuration FIG. 1 is a diagram showing an overall configuration of an information providing system 1 according to the first embodiment of the present invention. In the present embodiment, the information providing system 1 is a system for comprehensively providing medical information to medical personnel such as doctors and nurses. The information providing system 1 includes an
サーバ装置4は、医療業務に用いられるシステム(以下「医療システム」という。)が有する機能を実行するコンピュータである。医療システムとは、例えば、電子カルテシステムや自動検査装置接続システム、細菌検査・ナビゲーションシステムなどである。サーバ装置4は、ネットワーク2に接続されており、ネットワーク2を介して、医療システムに関係するデータをやり取りする。
The
クライアント装置5は、医療従事者が医療システムを利用するためのプログラムを記憶し、実行するコンピュータであり、例えばパーソナルコンピュータやタブレット端末などである。クライアント装置5は、ネットワーク2に有線または無線で(図1の例では有線で)接続されており、ネットワーク2を介してデータをやり取りする。クライアント装置5は、画像を表示する表示手段を備えており、医療システムに関する画像を表示する。また、医療従事者は、クライアント装置5を操作して、医療システムに関係するデータを入力する。他にも、クライアント装置5は、ブラウザのプログラムを記憶し、実行することで、上述した医療に関する情報を表示手段に表示する。これにより、医療に関する情報が医療従事者に提供される。なお、ブラウザのプログラムは、医療システムを利用するためのプログラムを兼ねている場合もある。
The
情報処理装置10は、情報を処理する機能を有するコンピュータである。情報処理装置10は、ネットワーク2に接続されており、ネットワーク2を介して複数のサーバ装置4から医療に関するデータを収集する。情報処理装置10は、収集したデータの分析を支援するデータ分析支援サービスをクライアント装置5のユーザ、すなわち医療従事者に提供する。
The
図2は、情報処理装置10のハードウェア構成を示す図である。情報処理装置10は、制御部11と、記憶部12と、通信部13とを備える。制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)及びリアルタイムクロックを備えている。CPUは、RAMをワークエリアとして用いてROMや記憶部12に記憶されたプログラムを実行することによって記憶部12及び通信部13の動作を制御する。リアルタイムクロックは、現在の日時を算出する機能を有している。記憶部12は、ハードディスク等を備え、制御部11が制御に用いるデータやプログラムなどを記憶している。通信部13は、ネットワーク2を介して通信を行うための通信回路を備える。
FIG. 2 is a diagram illustrating a hardware configuration of the
[1−2]機能構成
情報処理装置10は、以上のハードウェア構成に基づき、医療従事者が行うデータ分析を支援するための処理である分析支援処理を行う。記憶部12には、分析支援処理を行うためのプログラムが記憶されている。制御部11がそのプログラムを実行して図2に示す各装置を制御することで、以下に述べる機能が実現される。
図3は、情報処理装置10が実現する機能構成の一例を示す図である。情報処理装置10は、取得手段101と、生成手段102と、抽出手段103と、算出手段104と、出力手段105とを備える。
[1-2] Functional Configuration The
FIG. 3 is a diagram illustrating an example of a functional configuration realized by the
[1−2−1]取得手段
取得手段101は、複数の対象の各々に関する複数の事項のデータ(以下「関連データ」という)を取得する手段の一例である。本実施形態では、対象とは、患者のことであり、関連データとは、上述した医療システムに記憶されている患者に関するデータである。具体的には、患者を識別する患者ID(Identification)や患者の年齢、症状、検査の結果、手術の回数などである。関連データとしては、例えば、院内感染対策サーベイランス(JANIS:Japan Nosocomial Infections Surveillance)の事務局に提出されるデータなどが用いられてもよい。
[1-2-1] Acquisition Unit The
上記の関連データは、図1に示すサーバ装置4が記憶している。本実施形態では、各サーバ装置4が、例えば決められた時間の間隔(例えば1ヶ月毎)や決められた日時(例えば毎月1日と15日の午前0時)に、自装置が記憶している関連データを情報処理装置10に送信する。取得手段101は、こうして送信されてきた関連データを取得する。なお、取得手段101は、各サーバ装置4に対して関連データを要求する要求データを送信し、その応答で送信されてくる関連データを取得してもよい。取得手段101は、取得した関連データを記憶して、生成手段102及び算出手段104から参照できるようにしておく。
The related data is stored in the
[1−2−2]生成手段
生成手段102は、取得手段101により取得されたデータから、対象の第1の事項のデータが条件を満たす場合に予測されるその対象の第2の事項のデータを表した決定木を生成する手段の一例である。第1の事項のデータは、例えば説明因子ともいい、第2の事項のデータは、例えば目的因子ともいう。本実施形態では、生成手段102は、患者の生存及び死亡を表す「転帰」と呼ばれる事項を第2の事項とし、「年齢分類」、「熱傷の程度」、「気道熱傷の有無」、「敗血症の有無」及び「手術回数」という5つの事項を第1の事項として決定木を生成する。年齢分類は、患者の年齢を10才未満、10才以上40才以下、41才以上70才未満、70才以上に分類したデータであり、熱傷の程度は、熱傷の程度を10以下、11以上30以下、31以上59以下、60以上で表したデータである。生成手段102は、取得手段101が記憶した関連データを参照し、そのうちの上記第1及び第2の事項のデータから、例えばID3(Iterative Dichotomiser 3)アルゴリズムなどの周知のアルゴリズムを用いて決定木を生成する。
[1-2-2] Generating Unit The generating
図4は、生成された決定木の一例を示す図である。この例では、決定木のルート(「根」ともいう)から「敗血症」の有無という条件で分岐する2つの枝が伸びている。このように、決定木で用いられる条件は、枝が分岐する条件を表しており、以下では「分岐条件」という。「敗血症=なし」という枝からは、「熱傷の程度」という分岐条件で分岐する3つの枝が示されている。最初の枝では、「熱傷の程度=10以下」である場合に「生存」という第2の事項のデータが得られることが示されている。この場合の「生存」を、目的とする第2の事項のデータといい、決定木における「葉」ともいう。葉のあとに示された「20−>18」という数値は、「敗血症=なし」及び「熱傷の程度=10以下」という分岐条件を満たした患者が20名であり、そのうちの18名については「生存」という第2の事項のデータが取得されたことを表している。つまり、第1の事項のデータが分岐条件を満たした場合に目的とする第2の事項のデータが得られた確率を表している。同様に、「熱傷の程度=11−30(11以上30以下)」である場合にも、「14−>14」という確率で「生存」という第2の事項のデータが得られたことが示されている。 FIG. 4 is a diagram illustrating an example of the generated decision tree. In this example, two branches branch from the root of the decision tree (also referred to as “root”) under the condition of “sepsis”. As described above, the condition used in the decision tree represents a condition for branching, and is hereinafter referred to as a “branch condition”. From the branch “sepsis = none”, three branches are shown that branch under the branch condition “degree of burn”. In the first branch, it is shown that the data of the second item “survival” can be obtained when “the degree of burn = 10 or less”. The “survival” in this case is referred to as target second data, and is also referred to as “leaf” in the decision tree. The numerical value of “20-> 18” shown after the leaves indicates that there are 20 patients who satisfy the branching conditions of “sepsis = none” and “degree of burn = 10 or less”, of which 18 are This indicates that data of the second item “survival” has been acquired. That is, it represents the probability that the target data of the second item is obtained when the data of the first item satisfies the branch condition. Similarly, it is shown that the data of the second item “survival” was obtained with a probability of “14−> 14” even when “the degree of burn = 11-30 (11 to 30)”. Has been.
「熱傷の程度=31−59」である場合には、さらに「年齢分類」という分岐条件で分岐する3つの枝が示されている。最初の枝では、「年齢分類10−40(10才以上40才以下)」である場合に「生存」が「3−>3」という確率で得られたことが示されている。続いて、2番目の枝では、「年齢分類41−70」である場合に「死亡」が「2−>2」という確率で得られたことが示され、「年齢分類10未満」である場合に「生存」が「1−>1」という確率で得られたことが示されている。また、「敗血症=有り」という枝では、「気道熱傷の有無」という分岐条件で分岐する2つの枝が示されている。そして、「気道熱傷=なし」の場合には「生存」が「6−>5」という確率で得られたことが示され、「気道熱傷=有り」の場合には「死亡」が「6−>5」という確率で得られたことが示されている。生成手段102は、生成した決定木を示す決定木データを抽出手段103及び出力手段105に供給する。
In the case of “degree of burn = 31-59”, three branches that further branch under the branch condition “age classification” are shown. The first branch shows that “survival” was obtained with a probability of “3-> 3” in the case of “age classification 10-40 (10 to 40 years old)”. Subsequently, in the second branch, when “age classification 41-70” is indicated, it is indicated that “death” was obtained with a probability of “2-> 2”, and when “age classification is less than 10” It is shown that “survival” was obtained with a probability of “1-> 1”. In addition, in the branch “sepsis = present”, two branches that branch under the branch condition “presence / absence of airway burn” are shown. In the case of “airway burn = none”, it is shown that “survival” was obtained with a probability of “6-> 5”, and in the case of “airway burn = present”, “death” was “6- It is shown that it was obtained with a probability of> 5 ”. The
[1−2−3]抽出手段
抽出手段103は、生成手段102により生成された決定木から、第1の事項のデータが分岐条件を満たす場合に第2の事項のデータが得られるという決まり事を抽出する手段の一例である。抽出手段103は、例えば、分岐条件を表すif部と、if部が真である、すなわち分岐条件が満たされる場合に得られる結論を表すthen部とから構成されるif−thenルールという決まり事を、生成手段102から供給された決定木データが示す決定木から抽出する。
[1-2-3] Extraction Unit The
図5は、抽出された決まり事の一例を示す図である。この例では、抽出手段103は、図4に示す決定木の一番上の葉をthen部とし、その葉とルートとを繋ぐ枝をif部とするif−thenルールを抽出している。具体的には、「if 敗血症=なし&熱傷の程度=10以下」である場合に、「then 生存」という結論が得られるという決まり事を抽出している。抽出手段103は、図4に示す他の葉についても決まり事を抽出する。抽出手段103は、抽出した決まり事を示す決まり事データを、算出手段104及び出力手段105に供給する。
FIG. 5 is a diagram illustrating an example of the extracted rules. In this example, the
[1−2−4]算出手段
算出手段104は、取得手段101により取得されたデータから、抽出手段103により抽出された決まり事の有意さの度合いを表す有意度を算出する手段の一例である。決まり事が有意であるということとは、確率的にその決まり事が偶然成り立っているとは考えにくく、その決まり事には意味があると考えられるということである。つまり、有意度とは、その決まり事が偶然成り立つ可能性の低さを示す度合いであり、換言すると、その決まり事に意味がある可能性の高さを示す度合いである。算出手段104は、取得手段101が記憶した関連データを参照し、そのうちの上記第1及び第2の事項のデータから、抽出手段103から供給された決まり事データが示す各決まり事についての有意度を算出する。
[1-2-4] Calculation Unit The
図6は、算出された有意度の例を示す図である。算出手段104は、図6の例では、「確率」、「意外性」及び「p値」を有意度として算出している。算出手段104は、上述した「20−>18」という葉の場合、18÷20=0.9(90%)という値を「確率」として算出する。つまり、算出手段104は、第1の事項のデータが分岐条件(この例では「敗血症=なし」及び「熱傷の程度=10以下」という分岐条件)を満たした対象の数で、そのうち目的とする第2の事項のデータ(この例では「生存」)が取得された対象の数を除した値を有意度(この場合「確率」)として算出する。
FIG. 6 is a diagram illustrating an example of the calculated significance level. In the example of FIG. 6, the
また、算出手段104は、意外なことが起こっている度合いを示す「意外性」を有意度として算出する。例えば、サイコロを振って1が出ると期待される確率(これを「期待確率」という)は1/6である。実際にサイコロを振った場合に1が6回中1回出るとしたならばその確率(これを「実生起確率」という)は1/6である。これらの確率の比率を意外性といい、この例では意外性=実生起確率(1/6)÷期待確率(1/6)=1.00である。意外性は1.00よりも大きいほど意外なことが起こっていることを表す。例えば、1が6回中5回出れば、意外性=実生起確率(5/6)÷期待確率(1/6)=5.00であり、前述の例よりも意外なことが起こっていることを表す。図6の例では、算出手段104は、意外度を234.852と算出している。この意外性が大きいほど、その決まり事が偶然には起こりにくいことを表すため、その決まり事におけるif部とthen部の相関が大きいことを表すことになる。
Further, the
また、算出手段104は、決まり事が正しくないという仮説(いわゆる帰無仮説)を棄却するか否かを判断する際に用いられるp値(probability-value)を有意度として算出する。算出手段104、本実施形態では、カイ二乗値X2 0を用いてp値を算出する。
図7は、カイ二乗値の算出方法を説明するための図である。図7では、或る決まり事について、「if部が真」且つ「then部が真」という対象の件数が「a」、「if部が真」且つ「then部が真でない」という対象の件数が「b」、「if部が真でない」且つ「then部が真」という対象の件数が「c」、「if部が真でない」且つ「then部が真でない」という対象の件数が「d」である場合が2×2のクロス表で示されている。この表では、各行及び各列の合計(「a+b」など)と、全体の合計(「a+b+c+d」)とが示されている。算出手段104は、例えば、次に示す式(1)を用いてカイ二乗値X2 0を算出する。
Further, the calculation means 104 calculates a p-value (probability-value) used as a significance level when determining whether to reject a hypothesis that the rule is not correct (so-called null hypothesis). The calculation means 104, in this embodiment, calculates the p value using the chi-square value X 2 0 .
FIG. 7 is a diagram for explaining a method of calculating the chi-square value. In FIG. 7, for a certain rule, the number of subjects whose “if part is true” and “then part is true” is “a”, “if part is true” and “then part is not true”. Is “b”, “if part is not true” and “then part is true”, the number of cases is “c”, “if part is not true” and “then part is not true”. ”Is shown in a 2 × 2 cross table. In this table, the total of each row and column (such as “a + b”) and the total (“a + b + c + d”) are shown. For example, the
算出手段104は、こうして算出したカイ二乗値X2 0から、所定の計算式を用いてp値を算出する。算出手段104は、図6の例では、0.18180というp値を算出している。なお、算出手段104は、これに限らず、他の周知の方法でp値を算出してもよい。算出手段104は、こうして算出した確率、意外性及びp値という有意度を示す有意度データを、出力手段105に供給する。
The calculating means 104 calculates the p value from the chi-square value X 2 0 calculated in this way using a predetermined calculation formula. In the example of FIG. 6, the
[1−2−5]出力手段
出力手段105は、生成手段102により生成された決定木と、抽出手段103により抽出された決まり事と、算出手段104により算出された値との一覧を示す一覧データを出力する手段の一例である。出力手段105は、例えばクライアント装置5から送信されてきた一覧データを要求する要求データを受信すると、各手段から供給された決定木データ、決まり事データ及び有意度データに基づいて一覧データを生成し、そのクライアント装置5に対して生成した一覧データを出力する。クライアント装置5は、出力されてきた一覧データが示す一覧を、例えばブラウザの機能により表示手段に表示する。
[1-2-5] Output Unit The
図8は、表示された決定木、決まり事及び有意度の一覧の一例を示す図である。この例では、ブラウザのタイトルバーA1に「データ分析支援サービス」という文字列が表示され、メニューバーA2の下側に、決定木が表示された決定木欄A3と、本実施形態における決まり事であるif−thenルール及び各決まり事について算出された有意度が表示されたif−thenルール欄A4とが表示されている。決定木欄A3とif−thenルール欄A4とは、左右に並べて表示されている。 FIG. 8 is a diagram illustrating an example of a list of displayed decision trees, rules, and significance levels. In this example, the character string “data analysis support service” is displayed in the title bar A1 of the browser, the decision tree column A3 in which the decision tree is displayed below the menu bar A2, and the rules in this embodiment. An if-then rule column A4 displaying a certain if-then rule and the significance calculated for each rule is displayed. The decision tree column A3 and the if-the rule column A4 are displayed side by side.
図8では、図4に示す7つの葉を有する決定木が決定木欄A3に表示されており、各葉に対応する7件の決まり事がif−thenルール欄A4に表示されている。if−thenルール欄A4には、他にも、目的因子である「転帰」という文字列と、説明因子である「年齢分類」等の文字列と、決定木の生成に用いられた関連データが関連している対象の件数とが表示されている。このように、出力手段105は、決定木において第2の事項のデータが複数ある場合には、それらのデータをそれぞれ異なる並び(この場合は異なる行)に表す一覧データを出力する。また、出力手段105は、決まり事が複数ある場合にはそれらの決まり事をそれぞれ異なる並び(同じく異なる行)に表す一覧データを出力する。
In FIG. 8, the decision tree having seven leaves shown in FIG. 4 is displayed in the decision tree column A3, and seven rules corresponding to each leaf are displayed in the if-then rule column A4. In the if-then rule column A4, there are also a character string “outcome” as an objective factor, a character string such as “age classification” as an explanatory factor, and related data used for generating the decision tree. The number of related objects is displayed. As described above, when there are a plurality of pieces of data of the second item in the decision tree, the
[1−3]動作
情報処理装置10は、以上の構成に基づき上述した分析支援処理を行う。分析支援処理は、関連データを取得する取得処理と、取得した関連データに基づいて生成した一覧データを出力する出力処理とを含んでいる。以下では、取得処理及び出力処理において情報提供システム1が備える各装置が行う動作について、図9及び図10をそれぞれ参照して説明する。
[1-3] Operation The
図9は、取得処理における各装置の動作の一例を示すシーケンス図である。図9では、複数のサーバ装置4のうちの2つを示しているが、これら以外のサーバ装置4も、これらと同様の動作を行う。まず、サーバ装置4は、例えば医療システムの利用者によりその医療システムに関する情報を入力する操作が行われたときに、その入力操作を受け付ける(ステップS11)。ここで入力される情報は、例えば患者のバイタルデータなどである。サーバ装置4は、受け付けた入力操作に応じた関連データを記憶し(ステップS12)、決められた時間の間隔や決められた時刻などに、関連データを情報処理装置10に送信する(ステップS13)。
FIG. 9 is a sequence diagram illustrating an example of the operation of each device in the acquisition process. In FIG. 9, two of the plurality of
また、別のサーバ装置4は、例えば医療システムの所定の処理を実行する(ステップS21)。次に、サーバ装置4は、ステップS21で実行した処理の結果を関連データとして記憶する(ステップS22)。ここで記憶される関連データは、例えば感染症の病原体の検出結果などである。続いて、サーバ装置4は、前述したステップS13と同様に関連データを情報処理装置10に送信する(ステップS23)。情報処理装置10は、ステップS13及びS23において、送信されてきた関連データをそれぞれ受信し、受信した関連データを取得する(ステップS31)。ステップS13、S23及びS31は、取得部101が行う動作である。
Another
図10は、出力処理における各装置の動作の一例を示すシーケンス図である。図10では、複数のクライアント装置5のうちの1つを示しているが、これ以外のクライアント装置5も、これと同様の動作を行う。出力処理は、情報提供システム1の利用者がクライアント装置5に対して決定木、決まり事及び有意度の一覧を要求する操作(以下「一覧要求操作」という)を行うことを契機に開始される。一覧要求操作の詳細について、図11を参照して説明する。
FIG. 10 is a sequence diagram illustrating an example of the operation of each device in the output process. In FIG. 10, one of the plurality of
図11は、一覧要求操作が行われるときにクライアント装置に表示される画像の例を示す図である。図11(a)では、決定木を生成するために用いる関連データを選択するための画像が表示されている。この例では、選択可能な関連データの一覧である一覧画像B1と、選択された関連データを示す選択データ画像B2と、一覧画像B1から関連データを選択したり、選択データ画像B2から関連データの選択を解除したりするための操作子画像B3とが表示されている。図11(b)では、選択された関連データから、目的因子とする関連データを選択させるための画像が表示されている。この例では、「敗血症の有無」、「熱傷の程度」、「気道熱傷の有無」、「年齢分類」、「手術回数」及び「転帰」という6つの関連データが選択されており、そのうちの「転帰」にチェックがされている状態の選択データ画像B2と、「決定」という文字列を含む操作子画像B4とが表示されている。 FIG. 11 is a diagram illustrating an example of an image displayed on the client device when a list request operation is performed. In FIG. 11A, an image for selecting related data used for generating a decision tree is displayed. In this example, a list image B1 that is a list of related data that can be selected, a selection data image B2 that indicates the selected related data, and related data are selected from the list image B1, or related data is selected from the selected data image B2. An operator image B3 for canceling the selection is displayed. In FIG.11 (b), the image for selecting the relevant data made into a target factor from the selected relevant data is displayed. In this example, six related data of “presence / absence of sepsis”, “degree of burn”, “presence / absence of airway burn”, “age classification”, “number of operations” and “outcome” are selected. A selected data image B2 in which “Outcome” is checked and an operator image B4 including a character string “Determine” are displayed.
図11(b)に示す状態で利用者が操作子画像B4を選択する操作を行うと、クライアント装置5は、この操作を一覧要求操作として受け付け(ステップS41)、目的因子(第2の事項のデータ)を「転帰」のデータとし、説明因子(第1の事項のデータ)を「敗血症の有無」、「熱傷の程度」、「気道熱傷の有無」、「年齢分類」及び「手術回数」とする決定木の生成と、それに対応する決まり事及び有意度との一覧を要求する要求データを情報処理装置10に送信する(ステップS42)。
When the user performs an operation of selecting the operator image B4 in the state shown in FIG. 11B, the
情報処理装置10は、ステップS42においてクライアント装置5からの要求データを受信すると、要求データが示す目的因子及び説明因子の関連データを用いて決定木を生成する(ステップS43)。ステップS43は生成手段102が行う動作である。次に、情報処理装置10は、生成した決定木から決まり事を抽出し(ステップS44)、抽出した各決まり事についての有意度を算出する(ステップS45)。ステップS44は抽出手段103が行う動作であり、ステップS45は算出手段104が行う動作である。続いて、情報処理装置10は、生成した決定木、抽出した決まり事及び算出した有意度を用いて、一覧データを生成し(ステップS46)、生成した一覧データをクライアント装置5に対して出力する(ステップS47)。ステップS46及びS47は出力手段105が行う動作である。クライアント装置5は、ステップS47において一覧データを受信すると、受信した一覧データが示す一覧を表示する(ステップS48)。
When the
[1−4]第一実施形態の効果
本実施形態では、決定木、決まり事及び有意度をまとめた一覧を示す一覧データが出力される。決定木は、説明因子がルートからどのように分岐して葉、つまり目的因子まで繋がっているかという全体像を示す。また、決定木では、例えばルートに近い説明因子ほど目的因子との相関が大きい傾向にある。図4の例であれば、目的因子である「転帰」との相関は、「敗血症の有無」が最も大きく、次いで「熱傷の程度」及び「気道熱傷の有無」、その次に「年齢分類」と続き、「手術の回数」は最も相関が小さいという具合である。このように、決定木は、説明因子と目的因子との相関の大きさを把握するのに役立つ。
[1-4] Effects of First Embodiment In this embodiment, list data indicating a list in which decision trees, rules, and significance levels are collected is output. The decision tree shows the overall picture of how the explanatory factor branches from the root and leads to the leaf, that is, the target factor. In the decision tree, for example, an explanatory factor closer to the root tends to have a larger correlation with the target factor. In the example of FIG. 4, the correlation with the “outcome” as the objective factor is largest in “presence / absence of sepsis”, followed by “degree of burn” and “presence / absence of airway burn”, and then “age classification” Continuing, “the number of operations” has the smallest correlation. Thus, the decision tree is useful for grasping the magnitude of the correlation between the explanatory factor and the objective factor.
また、決まり事は、図5の例であれば、決定木における個々の葉(結論)とそこに至る枝(分岐条件)との関係を、説明因子(if部)と目的因子(then部)との組み合わせで簡潔に示し、有意度は、各決まり事において得られる結論が統計的にどの程度有意であるかということを示す。利用者は、これら3つの情報を合わせて見ることで、各説明因子と目的因子との相関の大きさや、各結論の統計的な有意さの程度(有意度)の大きさなどを見比べながら、分岐条件及び結論の有用さを判断することができる。このような本実施形態によれば、一覧データを出力しない場合に比べて、決定木から有用な分岐の条件及び結論を見つけやすくすることができる。 Further, in the example of FIG. 5, the rule is that the relationship between each leaf (conclusion) and the branch (branch condition) leading to it in the decision tree is as follows: explanatory factor (if part) and objective factor (then part) In a simple manner, the significance level indicates how statistically the conclusion obtained in each rule is. By looking at these three pieces of information together, the user can compare the magnitude of the correlation between each explanatory factor and the objective factor and the degree of statistical significance (significance) of each conclusion. The usefulness of branch conditions and conclusions can be determined. According to the present embodiment, it is possible to make it easier to find useful branch conditions and conclusions from a decision tree than when no list data is output.
また、本実施形態では、有意度としてp値が用いられている。例えば、p値が0.05未満である場合に上述した帰無仮説、すなわち抽出された決まり事が正しくないという仮説を棄却することが一般的であるが、それでは正しい決まり事がほとんど抽出されないということであれば、0.1未満を棄却してもよいし、より厳密に有意さを判断したければ0.01未満を棄却してもよい。このように、本実施形態によれば、p値を用いない場合に比べて、帰無仮説をどの程度の正確さをもって棄却するかということを容易に定めることができる。 In the present embodiment, the p value is used as the significance. For example, when the p-value is less than 0.05, it is common to reject the null hypothesis described above, that is, the hypothesis that the extracted rule is not correct, but that means that the correct rule is hardly extracted. If so, less than 0.1 may be rejected, or less than 0.01 may be rejected if the significance is judged more strictly. Thus, according to the present embodiment, it is possible to easily determine how accurately the null hypothesis is rejected as compared with the case where the p value is not used.
[2]第2実施形態
本発明の第2実施形態について、以下、第1実施形態と異なる点を中心に説明する。第1実施形態では、第1及び第2の事項のデータと時期との関係については特に言及されていなかったが、第2実施形態では、2つの異なる時期における関連データが用いられる。各時期における関連データとは、それらの時期に生成される関連データのことである。本実施形態で用いられる時期の長さは、用いられる関連データによって異なる。例えば、図4等の例で用いた敗血症の有無や熱傷の程度などであれば、数ヶ月から1年という長さの時期が用いられる。また、感染症に関する関連データであれば、その状況が頻繁に変化するため、数日から数週間、1ヶ月程度の長さの時期が用いられる。
[2] Second Embodiment Hereinafter, a second embodiment of the present invention will be described focusing on differences from the first embodiment. In the first embodiment, the relationship between the data of the first and second items and the time is not particularly mentioned, but in the second embodiment, the related data at two different times is used. The related data at each time is related data generated at the time. The length of time used in the present embodiment varies depending on the related data used. For example, if there is the presence or absence of sepsis or the degree of burn used in the example of FIG. In addition, if the data is related to infectious diseases, the situation changes frequently, so a period of several days to several weeks or one month is used.
[2−1]第2実施形態の構成
本実施形態では、取得手段101は、第1の時期及び第1の時期よりもあとの第2の時期における複数の事項のデータを取得する。第1及び第2の時期は、例えば、先々月及び先月である。取得手段101は、関連データを取得するときに、例えば取得した日時を示す日時データをともに記憶しておくことで、取得した関連データがどの時期に取得されたものであるかということが表されるようにする。生成手段102は、取得手段101により取得された第1及び第2の時期における複数の事項のデータから決定木をそれぞれ生成する。生成手段102は、記憶されている各時期の関連データ群を用いることで、このように決定木を生成する。抽出手段103は、第1及び第2の時期のそれぞれについて決まり事を抽出する。
[2-1] Configuration of the Second Embodiment In the present embodiment, the
出力手段105は、生成された決定木及び抽出された決まり事の少なくともいずれか一方(本実施形態では両方)のうち、第1の時期から第2の時期にかけて維持されている部分(以下「維持部分」という)と変化した部分(以下「変化部分」という)とを異なる態様の画像で表す画像データを、一覧データとして出力する。出力手段105は、本実施形態では、維持部分に比べて変化部分が認識されやすいようにした態様の画像を表す画像データを出力する。 The output means 105 is a portion that is maintained from the first time to the second time (hereinafter referred to as “maintain”) of at least one of the generated decision tree and the extracted rule (both in the present embodiment). Image data representing the image of the aspect different from the “part” and the changed part (hereinafter referred to as “change part”) is output as list data. In the present embodiment, the output means 105 outputs image data representing an image in a form in which the changed portion is more easily recognized than the maintained portion.
[2−2]第2実施形態の概要
図12は、出力される画像データの一例を示す図である。この例では、先月における関連データを用いて生成された決定木を表示した決定木欄A5及びその決定木から抽出された決まり事を表示したif−thenルール欄A6が上半分に表示され、その下側に先々月における関連データを用いて生成された決定木を表示した決定木欄A7及びその決定木から抽出された決まり事を表示したif−thenルール欄A8表示されている。決定木、決まり事及び有意度は、上側(先月分)と下側(先々月分)とで互いに異なる部分、すなわち変化部分に下線が引かれている。このように、出力手段105は、下線が引かれていない維持部分に比べて下線が引かれた変化部分が認識されやすいようにした態様の画像を表す画像データを出力している。これにより、このような画像データが出力されない場合に比べて、変化部分が維持部分よりも認識されやすいようになり、利用者が第1の時期から第2の時期にかけて変化した変化部分を把握しやすいようにすることができる。
[2-2] Overview of Second Embodiment FIG. 12 is a diagram illustrating an example of output image data. In this example, a decision tree column A5 displaying a decision tree generated using related data in the previous month and an if-then rule column A6 displaying rules extracted from the decision tree are displayed in the upper half. On the lower side, a decision tree column A7 displaying the decision tree generated using the related data in the previous month and an if-then rule column A8 displaying the rules extracted from the decision tree are displayed. The decision trees, rules, and significance levels are underlined in different portions, that is, changed portions on the upper side (last month) and the lower side (last month). As described above, the
また、図12の例では、先月と先々月とで葉の数は6つと同じであるが、分岐条件が一部異なっている。例えば先々月の決定木には「敗血症=なし」、「熱傷の程度=31−59」及び「年齢分類=10未満」という分岐条件が表されているが、先月の決定木には表されておらず、代わりに先々月の決定木に表されていなかった「敗血症=なし」及び「熱傷の程度=11−30」という分岐条件が表されている。この例では、これらの一方の決定木にのみ表されている分岐条件の行が、他方の決定木でも同じ行だけ空けて表されている。 In the example of FIG. 12, the number of leaves is the same as 6 in the last month and the month before, but the branching conditions are partially different. For example, the decision tree of last month shows the branching conditions of “sepsis = none”, “degree of burn = 31-59” and “age classification = less than 10”, but it is shown in the decision tree of last month. Instead, the branching conditions “sepsis = none” and “degree of burn = 11-30”, which were not shown in the decision tree of the previous month, are shown. In this example, the branch condition rows that are represented only in one of these decision trees are represented by the same row in the other decision tree.
このため、例えば「敗血症=有り」で「気道熱傷=なし」という分岐条件を満たす「生存」という葉、すなわち目的因子については、どちらの月の決定木でもルート(「***決定木:先月(または先々月)***」という文字列が表された行)から数えて9行目の並びに表されている。このように、出力手段105は、第1及び第2の時期において、共通の分岐条件を満たす共通の目的因子がある場合には、決定木のルートからの距離が同じ並びにその共通の目的因子を表す画像データを出力する。このような決定木を示す画像データが出力されることで、共通の目的因子をルートからの距離が異なる並びに表す場合に比べて、第1及び第2の時期における関連データを用いてそれぞれ生成された決定木同士を比較しやすくすることができる。
For this reason, for example, the leaf “survival” that satisfies the branch condition “sepsis = yes” and “airway burn = none”, that is, the objective factor is the root (“*** decision tree: last month” (Or the month before)) The 9th row is counted from the row where the character string “***” is represented). As described above, when there is a common objective factor that satisfies the common branch condition in the first and second periods, the
また、図12の例では、分岐条件及び目的因子が共通する決まり事については共通する符号を付して表されている。例えば、「敗血症=なし」及び「熱傷の程度=10以下」という分岐条件及び「生存」という葉で表された決まり事には「A」という符号が付され、「敗血症=なし」及び「熱傷の程度=11−30」という分岐条件及び「生存」という葉で表された決まり事には「B」という符号が付され、「敗血症=なし」、「熱傷の程度=31−59」及び「年齢分類=10−40」という分岐条件及び「生存」という葉で表された決まり事には「C」という符号が付されている。このように、出力手段105は、第1及び第2の時期において、共通の分岐条件を満たす場合に共通の目的因子が得られるという共通の決まり事がある場合には、それらの共通の決まり事に共通の符号を付して表す画像データを出力する。このような決まり事を示す画像データが出力されることで、これらの共通の決まり事に共通の符号を付さない場合に比べて、第1及び第2の時期における決まり事及び有意度同士を比較しやすくすることができる。
Moreover, in the example of FIG. 12, the common code | symbol is attached | subjected and represented about the rule in which a branch condition and an objective factor are common. For example, a branching condition of “sepsis = none” and “degree of burn = 10 or less” and a rule represented by a leaf of “survival” are marked with “A”, and “sepsis = none” and “burn” The rule represented by the branch condition of “degree of degree = 11-30” and the leaf of “survival” is labeled “B”, and “sepsis = none”, “degree of burn = 31-59” and “ A branching condition “age classification = 10−40” and a rule represented by a leaf “survival” are labeled with “C”. As described above, when there is a common rule that the common objective factor can be obtained when the common branch condition is satisfied in the first and second periods, the
また、if−thenルール欄A8では、「B」という符号が付された決まり事B及びその有意度が表示されていない代わりに、その分の行を空けて表示されている。このため、「A」という符号が付された決まり事Aと「C」という符号が付された決まり事Cは、先月と先々月のどちらにおいても、同じ行数だけ離れて表されていることになる。具体的には、決まり事B及びその有意度が2行で表され、その上下が1行ずつ空いているため、決まり事A及びCはどちらの月でもそれらの行の合計である4行離れて表されている。このように、出力手段105は、第1及び第2の時期に共通する決まり事が複数ある場合には、第1の共通の決まり事(上記例では決まり事A)と第2の共通の決まり事(同じく決まり事C)とを、第1及び第2の時期のいずれにおいても同じ並びの数(上記例では4行)だけ離して表す画像データを出力する。これにより、共通の符号が付された決まり事同士を異なる並びの数だけ離して表す場合に比べて、第1及び第2の時期における決まり事及び有意度同士を比較しやすくすることができる。
In addition, in the if-then rule column A8, the rule B with the sign “B” and its significance are not displayed, but the corresponding lines are displayed with a space. For this reason, the rule A with the sign “A” and the rule C with the sign “C” are separated by the same number of rows in both the last month and the last month. become. Specifically, rule B and its significance are represented by two lines, and the top and bottom are vacant one by one, so rule A and C are 4 lines apart, which is the sum of those lines in both months It is expressed. As described above, when there are a plurality of rules common to the first and second periods, the
[2−3]第2実施形態の他の例
なお、出力手段105は、図12に示すものとは異なる態様の画像を示す画像データを出力してもよい。例えば、出力手段105は、変化部分に比べて維持部分が認識されやすいようにした態様の画像を表す画像データを出力してもよい。
図13は、出力される画像データの他の一例を示す図である。この例では、図12の例と反対に、維持部分に下線が引かれ、変化部分には下線が引かれていない。これにより、図12に示すような画像を示す画像データが出力されない場合に比べて、変化部分よりも維持部分が認識されやすいようになり、利用者が第1の時期から第2の時期にかけて変化していない維持部分を把握しやすいようにすることができる。以上のとおり、出力手段105は、維持部分及び変化部分を異なる態様の画像で表す画像データを出力するものであればよい。これにより、そのような画像データが出力されない場合に比べて、維持部分及び変化部分のうち利用者が着目した方を把握しやすいようにすることができる。
[2-3] Another Example of Second Embodiment Note that the
FIG. 13 is a diagram illustrating another example of output image data. In this example, contrary to the example of FIG. 12, the maintenance part is underlined and the change part is not underlined. As a result, compared to the case where image data indicating an image as shown in FIG. 12 is not output, the maintenance part is more easily recognized than the change part, and the user changes from the first period to the second period. It is possible to make it easier to grasp the maintenance parts that are not. As described above, the
なお、出力手段105は、図12及び図13に示す例では、下線を引くことで変化部分及び維持部分の一方を他方に比べて認識しやすくしたが、これに限らない。例えば、文字を拡大したり、文字の色や太さを変えたりすることで認識しやすくしてもよい。また、文字を点滅させたりアニメーションさせたりすることで認識しやすくしてもよい。要するに、出力手段105は、変化部分及び維持部分の態様を異ならせることで、一方を他方に比べて認識しやすくすればよい。
In the example shown in FIGS. 12 and 13, the
また、取得手段101は、上記のように2つの時期における関連データだけでなく、3つ以上の時期における関連データを取得してもよい。その場合、生成手段102は、取得された各時期における決定木を生成し、抽出手段103は、生成された決定木のそれぞれから決まり事を抽出する。また、算出手段104は、抽出された各決まり事について有意度を算出する。出力手段105は、例えば、前後に連続する時期における維持部分及び変化部分を異なる態様の画像で表す画像データを出力する。この場合、出力手段105は、前後に連続する時期をそれぞれ第1及び第2の時期として出力を行う。また、出力手段105は、最新の時期とそれ以前の時期とを比較した場合の維持部分及び変化部分を異なる態様の画像で表す画像データを出力してもよい。この場合、出力手段105は、最新の時期を第2の時期とし、それ以前の時期をそれぞれ第1の時期として出力を行う。このように比較する時期が増えるほど、例えば決まり事のうち維持されるものと変化するものとの傾向を把握しやすくなる。
Further, the
[3]変形例
上述した各実施形態は、各々が本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、上述した各実施形態及び以下に示す各変形例は、必要に応じてそれぞれ組み合わせて実施してもよい。
[3] Modified Examples Each of the above-described embodiments is merely an example of the embodiment of the present invention, and may be modified as follows. Moreover, you may implement each embodiment mentioned above and each modification shown below, combining each as needed.
[3−1]対象及び関連データ
上記の各実施形態では、患者を対象として患者に関するデータが関連データとして用いられたが、これに限らない。例えば、対象を交通機関の乗客として関連データを乗車する日時や乗車距離、経路、乗車時の天気などとしてもよい。また、対象を商品として関連データを売上げや販売地域、販売価格、店舗周辺の環境などとしてもよい。要するに、決定木を生成するだけの有意性が表されるデータであれば、どのような対象の関連データが用いられてもよい。
[3-1] Target and related data In each of the above embodiments, data related to a patient is used as related data for the patient, but the present invention is not limited to this. For example, it is good also as the date and time, boarding distance, route | route, the weather at the time of boarding, etc. which board relevant data for the passenger of a transportation system. In addition, the related data may be sales, sales area, sales price, environment around the store, etc. with the target as a product. In short, any target related data may be used as long as the data represents the significance sufficient to generate a decision tree.
[3−2]抽出手段
抽出手段103は、上記の各実施形態では、決定木の葉の数だけ決まり事を抽出したが、これに限らない。抽出手段103は、例えば、分岐条件のうち一方が他方の必要条件になっているものがあれば、それらをまとめて簡素化してもよい。例えば、年齢分類として「10才未満」及び「20才未満」という第1の事項のデータが用いられており、分岐条件として「敗血症=なし」及び「10才未満」という分岐条件で「生存」という結論を得る決まり事Xと、「敗血症=なし」及び「20才未満」という分岐条件で「生存」という結論を得る決まり事Yとが抽出された場合、決まり事Xの分岐条件は決まり事Yの分岐条件の必要条件となっている。この場合、抽出手段103は、決まり事Xを決まり事Yにまとめて簡素化した1つの決まり事だけを抽出してもよい。
[3-2] Extraction Unit Although the
なお、抽出手段103は、決まり事X及びYにおいて、分岐条件を満たす対象数が同じであり、且つ、同じ確率で「生存」という結論が得られる場合にのみ、上記のように簡素化した決まり事を抽出してもよい。これはつまり、決まり事X及びYにおける図8等に示す「○−>□」という数値が一致しているということである。また、この場合は、抽出手段103は、決まり事Xを決まり事Yにまとめるだけでなく、決まり事Yを決まり事Xにまとめてもよい。
Note that the
[3−3]算出手段
算出手段104は、上記以外の有意度を算出してもよい。算出手段104は、例えば、p値の算出に用いたカイ二乗値X2 0を有意度として算出してもよい。この場合、カイ二乗値X2 0が自由度1、棄却値0.05のカイ二乗分布表の値(=3.84)よりも大きければ、帰無仮説が棄却されるので、統計的に有意な関連性があるといえる。他にも、抽出手段103により抽出された決まり事の有意さの度合いを表すものであれば、どのような値が有意度として算出されてもよい。
[3-3] Calculation unit The
[3−4]場所画像の出力先
出力手段105は、上述した各実施形態では、クライアント装置5に対して一覧データを出力したが、これに限らず、例えば、情報処理装置10が表示装置を備えている場合に、その表示装置に一覧データを出力してもよい。また、出力手段105は、利用者が電子メールを利用している場合に、その電子メールのアドレスに対して一覧データを出力してもよい。いずれの宛先に一覧データが出力された場合でも、出力された一覧データが示す一覧を利用者が閲覧することができるようになっているとよい。
[3-4] Location Image Output Destination The
[3−5]文字列の向き
出力手段105は、図8等の例では、決定木、決まり事及び有意度を横書きで示した一覧データを出力したが、これに限らず、縦書きで示したものを出力してもよい。また、出力手段105は、決定木の各枝や各葉を画像を用いて表したり、各枝が枝分かれする様子をより視覚的に表す一覧データを出力してもよい。
[3-5] Character String Direction In the example of FIG. 8 or the like, the
[3−6]発明のカテゴリ
本発明は、情報処理装置及び情報処理装置を備える情報提供システムの他にも、情報処理装置が実施する処理を実現するための情報処理方法としても捉えられるものである。ここでいう処理とは、例えば、図9及び図10に示す分析支援処理(取得処理及び出力処理)である。また、本発明は、情報処理装置のようなコンピュータを、図3に示す各手段として機能させるためのプログラムとしても捉えられるものである。このプログラムは、それを記憶させた光ディスク等の記録媒体という形態での提供や、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、それをインストールして利用可能にするという形態での提供などがされるものであってもよい。
[3-6] Category of Invention In addition to the information processing apparatus and the information providing system including the information processing apparatus, the present invention can also be understood as an information processing method for realizing processing performed by the information processing apparatus. is there. The processing here is, for example, the analysis support processing (acquisition processing and output processing) shown in FIGS. 9 and 10. The present invention can also be understood as a program for causing a computer such as an information processing apparatus to function as each unit shown in FIG. This program can be provided in the form of a recording medium such as an optical disk in which it is stored, or provided in the form of being downloaded to a computer via a network such as the Internet, and making it available for installation. It may be done.
1…情報提供システム、2…ネットワーク、4…サーバ装置、5…クライアント装置、10…情報処理装置、11…制御部、12…記憶部、13…通信部、101…取得手段、102…生成手段、103…抽出手段、104…算出手段、105…出力手段。 DESCRIPTION OF SYMBOLS 1 ... Information provision system, 2 ... Network, 4 ... Server apparatus, 5 ... Client apparatus, 10 ... Information processing apparatus, 11 ... Control part, 12 ... Memory | storage part, 13 ... Communication part, 101 ... Acquisition means, 102 ... Generation means , 103 ... extraction means, 104 ... calculation means, 105 ... output means.
Claims (8)
前記取得手段により取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成手段と、
前記生成手段により生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出手段と、
前記取得手段により取得されたデータから、前記抽出手段により抽出された決まり事の有意さの度合いを表す有意度を算出する算出手段と、
前記生成手段により生成された決定木と、前記抽出手段により抽出された決まり事と、前記算出手段により算出された有意度との一覧を示す一覧データを出力する出力手段と
を備える情報処理装置。 An acquisition means for acquiring data of a plurality of items related to each of a plurality of objects;
Generating means for generating, from the data acquired by the acquiring means, a decision tree representing data of the second item of the target predicted when the data of the first item of the target satisfies a condition;
Extraction means for extracting a rule that the data of the second item is obtained when the data of the first item satisfies the condition from the decision tree generated by the generation unit;
A calculating means for calculating a significance level representing the degree of significance of the rules extracted by the extracting means from the data acquired by the acquiring means;
An information processing apparatus comprising: a decision tree generated by the generation unit; an output unit that outputs list data indicating a list of the rules extracted by the extraction unit and the significance calculated by the calculation unit.
前記生成手段は、前記取得手段により取得された前記第1及び第2の時期における前記複数の事項のデータから前記決定木をそれぞれ生成し、
前記抽出手段は、前記第1及び第2の時期のそれぞれについて前記決まり事を抽出し、
前記出力手段は、生成された前記決定木または抽出された前記決まり事のうち、前記第1の時期から前記第2の時期にかけて維持されている維持部分と変化した変化部分とを異なる態様の画像で表す画像データを、前記一覧データとして出力する
請求項1に記載の情報処理装置。 The acquisition means acquires data of the plurality of items in a first period and a second period after the first period,
The generating means generates the decision trees from the data of the plurality of matters at the first and second times acquired by the acquiring means,
The extraction means extracts the rules for each of the first and second periods;
The output means has an image of a mode in which a maintenance portion maintained from the first time to the second time and a changed changed portion of the generated decision tree or the extracted rules are different. The information processing apparatus according to claim 1, wherein image data represented by is output as the list data.
請求項2に記載の情報処理装置。 The information processing apparatus according to claim 2, wherein the output unit outputs the image data representing an image of the aspect in which the change portion is more easily recognized than the maintenance portion.
請求項2または3に記載の情報処理装置。 When there are a plurality of data of the second matter in the decision tree, the output means represents the data differently, and in the first and second periods, the output means 4. The information according to claim 2, wherein when there is data of the second item, the image data representing the data of the common second item having the same distance from the root of the decision tree is output. 5. Processing equipment.
請求項2から4までのいずれか1項に記載の情報処理装置。 When there are a plurality of rules, the output means represents the rules different from each other, and the second item is common when the common conditions are satisfied in the first and second periods. 5. When there is a common rule that data of the above can be obtained, the image data that represents the common rule with a common code is output. 5. Information processing device.
請求項5に記載の情報処理装置。 In the case where there are a plurality of the common rules, the output means has the same first common rule and the second common rule in both the first time period and the second time period. The information processing apparatus according to claim 5, wherein image data that is separated by the number of lines is output.
請求項1から6までのいずれか1項に記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 6, wherein the calculation unit calculates a p value (probability value) of the extracted rule as the significance.
複数の対象の各々に関する複数の事項のデータを取得する取得ステップと、
前記取得ステップにおいて取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成ステップと、
前記生成ステップにおいて生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出ステップと、
前記取得ステップにおいて取得されたデータから、前記抽出ステップにおいて抽出された決まり事の有意さの度合いを表す有意度を算出する算出ステップと、
前記生成ステップにおいて生成された決定木と、前記抽出ステップにおいて抽出された決まり事と、前記算出ステップにおいて算出された有意度との一覧を示す一覧データを出力する出力ステップ手段と
を実行させるためのプログラム。 On the computer,
An acquisition step of acquiring data of a plurality of items related to each of a plurality of objects;
A generation step for generating a decision tree representing data of the second item of the target predicted when the data of the first item of the target satisfies a condition from the data acquired in the acquisition step;
An extraction step for extracting from the decision tree generated in the generation step a rule that the data of the second item is obtained when the data of the first item satisfies the condition;
A calculation step for calculating a significance level representing the degree of significance of the rules extracted in the extraction step from the data acquired in the acquisition step;
An output step means for outputting list data indicating a list of the decision tree generated in the generation step, the rules extracted in the extraction step, and the significance calculated in the calculation step; program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013260489A JP6184857B2 (en) | 2013-12-17 | 2013-12-17 | Information processing apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013260489A JP6184857B2 (en) | 2013-12-17 | 2013-12-17 | Information processing apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015118466A true JP2015118466A (en) | 2015-06-25 |
JP6184857B2 JP6184857B2 (en) | 2017-08-23 |
Family
ID=53531151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013260489A Active JP6184857B2 (en) | 2013-12-17 | 2013-12-17 | Information processing apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6184857B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019212278A (en) * | 2018-05-31 | 2019-12-12 | 富士通株式会社 | Accessible machine learning |
CN110955855A (en) * | 2018-09-27 | 2020-04-03 | 华为终端有限公司 | Information interception method, device and terminal |
JP2020126330A (en) * | 2019-02-01 | 2020-08-20 | 株式会社オービック | Pattern registration work supporting device, pattern registration work supporting method, and pattern registration work supporting program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001022776A (en) * | 1999-07-09 | 2001-01-26 | Hitachi Ltd | Rule generation result report system |
JP2006227942A (en) * | 2005-02-17 | 2006-08-31 | Rumiko Matsuoka | Extraction system of combination set of clinical test data, determination system of neoplasm progress using the same and clinical diagnosis support system |
-
2013
- 2013-12-17 JP JP2013260489A patent/JP6184857B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001022776A (en) * | 1999-07-09 | 2001-01-26 | Hitachi Ltd | Rule generation result report system |
JP2006227942A (en) * | 2005-02-17 | 2006-08-31 | Rumiko Matsuoka | Extraction system of combination set of clinical test data, determination system of neoplasm progress using the same and clinical diagnosis support system |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019212278A (en) * | 2018-05-31 | 2019-12-12 | 富士通株式会社 | Accessible machine learning |
JP7215183B2 (en) | 2018-05-31 | 2023-01-31 | 富士通株式会社 | Accessible machine learning |
CN110955855A (en) * | 2018-09-27 | 2020-04-03 | 华为终端有限公司 | Information interception method, device and terminal |
CN110955855B (en) * | 2018-09-27 | 2023-06-02 | 花瓣云科技有限公司 | Information interception method, device and terminal |
JP2020126330A (en) * | 2019-02-01 | 2020-08-20 | 株式会社オービック | Pattern registration work supporting device, pattern registration work supporting method, and pattern registration work supporting program |
JP7158302B2 (en) | 2019-02-01 | 2022-10-21 | 株式会社オービック | PATTERN REGISTRATION SUPPORT DEVICE, PATTERN REGISTRATION SUPPORT METHOD AND PATTERN REGISTRATION SUPPORT PROGRAM |
Also Published As
Publication number | Publication date |
---|---|
JP6184857B2 (en) | 2017-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wiens et al. | Learning data-driven patient risk stratification models for Clostridium difficile | |
JP4890806B2 (en) | Prediction program and prediction device | |
JP6464612B2 (en) | Data analysis device, data analysis system, sales prediction device, sales prediction system, data analysis method, sales prediction method, program and recording medium | |
JP6184857B2 (en) | Information processing apparatus and program | |
EP2570952A1 (en) | Evaluation information specifying device, evaluation information specifying method, evaluation information specifying program, and computer-readable recording medium recording said program | |
EP3211579A1 (en) | Priority order determination system, method and program for explanatory variable display | |
JP6218151B2 (en) | Shipping work support method, shipping work support device, and shipping work support program | |
JP2006039650A (en) | Response priority order determination device and method therefor | |
JP6270768B2 (en) | Sales representative candidate extraction system | |
JPWO2021015265A5 (en) | ||
JP5914735B1 (en) | Medical system and program | |
JP7046499B2 (en) | Medical information processing equipment and medical information processing method | |
JP6005482B2 (en) | Server apparatus, analysis method, and program | |
Li et al. | InterVA4: An R package to analyze verbal autopsy data | |
JP5417930B2 (en) | Electronic medical record input support program, electronic medical record input support method, and electronic medical record input support device | |
JP2014191466A (en) | Training scenario creation system, training scenario creation method, and program | |
JP2013061721A (en) | Insurance contract support system, insurance contract support method, and insurance contract support web server | |
US20220398522A1 (en) | Medical facility evaluation apparatus, medical facility evaluation method, and computer program | |
Doctor | Assessing antenatal care and newborn survival in sub-Saharan Africa within the context of renewed commitments to save newborn lives | |
JP2011113428A (en) | Medical information processing apparatus and program | |
US20160224912A1 (en) | Information processing apparatus, and non-transitory recording medium | |
WO2024202068A1 (en) | Display method, information processing device, and display program | |
JP6322895B2 (en) | Explanation item management program, explanation item management device, explanation item management method | |
JP2007047979A (en) | Health information management device and control method for health information management device, and program | |
JP2016095654A (en) | Accounting data display method, accounting data display program, and accounting data display device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160623 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170404 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6184857 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |