JP2015118466A - Information processing apparatus and program - Google Patents

Information processing apparatus and program Download PDF

Info

Publication number
JP2015118466A
JP2015118466A JP2013260489A JP2013260489A JP2015118466A JP 2015118466 A JP2015118466 A JP 2015118466A JP 2013260489 A JP2013260489 A JP 2013260489A JP 2013260489 A JP2013260489 A JP 2013260489A JP 2015118466 A JP2015118466 A JP 2015118466A
Authority
JP
Japan
Prior art keywords
data
decision tree
output
item
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013260489A
Other languages
Japanese (ja)
Other versions
JP6184857B2 (en
Inventor
茂樹 横山
Shigeki Yokoyama
茂樹 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KD ICONS CO Ltd
KD-ICONS CO Ltd
Original Assignee
KD ICONS CO Ltd
KD-ICONS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KD ICONS CO Ltd, KD-ICONS CO Ltd filed Critical KD ICONS CO Ltd
Priority to JP2013260489A priority Critical patent/JP6184857B2/en
Publication of JP2015118466A publication Critical patent/JP2015118466A/en
Application granted granted Critical
Publication of JP6184857B2 publication Critical patent/JP6184857B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To make it easy to reach the conditions and conclusion of a useful branch from a decision tree.SOLUTION: Creation means 102 creates, from data acquired by acquisition means 101, a decision tree showing data on a second item of an object, which is predicted when data on a first item of the object satisfies the conditions. Extraction means 103 extracts, from the decision tree created by the creation means 102, the rule that when the data on the first item satisfies the branch conditions the data on the second item is obtained. Calculation means 104 calculates, from the data acquired from the acquisition means 101, the degree of significance indicating the degree of significance of the rule extracted by the extraction means 103. Output means 105 outputs list data showing a list of the decision tree created by the creation means 102, the rule extracted by the extraction means 103, and the value calculated by the calculation means 104.

Description

本発明は、決定木を用いたデータの活用を支援するための技術に関する。   The present invention relates to a technique for supporting utilization of data using a decision tree.

決定木を用いたデータの活用を支援するための技術がある。例えば、特許文献1には、複数の種類の医用画像と、分岐する条件(例えば医用画像の画素単位での画素値)と、それらの条件により判別される病変候補の有無またはその種類とが定められた決定木を用いて、医師が医用画像から病変候補を把握することを支援する技術が記載されている。   There are technologies to support the utilization of data using decision trees. For example, Patent Document 1 defines a plurality of types of medical images, branching conditions (for example, pixel values in pixel units of medical images), and presence / absence or types of lesion candidates determined based on these conditions. A technique for assisting a doctor to grasp a lesion candidate from a medical image using the determined decision tree is described.

特開2009−61170号公報JP 2009-61170 A

特許文献1の技術では、結論(この技術では病変候補の有無またはその種類)を導き出すために有用な分岐の条件が予め定められた決定木が用いられているが、そのような分岐の条件及び結論が分かっていない場合には、データから決定木を生成し、その中から有用な分岐の条件及び結論を見つけ出して用いることがある。その場合に、どの条件及び結論が有用なのかということは、例えば特許文献1に記載されているような条件と結論だけが示された決定木だけを見ても判断しにくい。
そこで、本発明は、決定木から有用な分岐の条件及び結論を見つけやすくすることを目的とする。
In the technique of Patent Document 1, a decision tree in which a branch condition useful for deriving a conclusion (in this technique, the presence or absence of a lesion candidate or its type) is used in advance is used. If the conclusion is not known, a decision tree may be generated from the data, and useful branch conditions and conclusions may be found and used. In that case, it is difficult to determine which conditions and conclusions are useful even if only a decision tree showing only the conditions and conclusions described in Patent Document 1 is viewed.
Accordingly, an object of the present invention is to make it easier to find useful branch conditions and conclusions from a decision tree.

本発明は、複数の対象の各々に関する複数の事項のデータを取得する取得手段と、前記取得手段により取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成手段と、前記生成手段により生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出手段と、前記取得手段により取得されたデータから、前記抽出手段により抽出された決まり事の有意さの度合いを表す有意度を算出する算出手段と、前記生成手段により生成された決定木と、前記抽出手段により抽出された決まり事と、前記算出手段により算出された有意度との一覧を示す一覧データを出力する出力手段とを備える情報処理装置を提供する。   The present invention is predicted when the data of the first item of the target satisfies the condition from the acquisition unit that acquires the data of the plurality of items regarding each of the plurality of targets and the data acquired by the acquisition unit A generation unit that generates a decision tree representing data of the second item of interest, and a decision tree generated by the generation unit when the data of the first item satisfies the condition Extraction means for extracting the rule that the data of the matter is obtained, and calculation means for calculating the significance indicating the degree of significance of the rule extracted by the extraction means from the data acquired by the acquisition means; , An output for outputting list data indicating a list of the decision tree generated by the generation unit, the rules extracted by the extraction unit, and the significance calculated by the calculation unit An information processing apparatus and a stage.

また、前記取得手段は、第1の時期及び当該第1の時期よりもあとの第2の時期における前記複数の事項のデータを取得し、前記生成手段は、前記取得手段により取得された前記第1及び第2の時期における前記複数の事項のデータから前記決定木をそれぞれ生成し、前記抽出手段は、前記第1及び第2の時期のそれぞれについて前記決まり事を抽出し、前記出力手段は、生成された前記決定木または抽出された前記決まり事のうち、前記第1の時期から前記第2の時期にかけて維持されている維持部分と変化した変化部分とを異なる態様の画像で表す画像データを、前記一覧データとして出力してもよい。   Further, the acquisition means acquires data of the plurality of items at a first time and a second time after the first time, and the generation means acquires the first time acquired by the acquisition means. The decision trees are generated from the data of the plurality of items at the first and second periods, respectively, the extraction unit extracts the rules for each of the first and second periods, and the output unit includes: Of the generated decision tree or the extracted rules, image data representing the maintained portion that has been maintained from the first time to the second time and the changed portion that has changed with images of different modes The list data may be output.

また、前記出力手段は、前記維持部分に比べて前記変化部分が認識されやすいようにした前記態様の画像を表す前記画像データを出力してもよい。
さらに、前記出力手段は、前記決定木において前記第2の事項のデータが複数ある場合には当該データをそれぞれ異なる並びに表し、且つ、前記第1及び第2の時期において、共通の前記条件を満たす共通の前記第2の事項のデータがある場合には、前記決定木のルートからの距離が同じ並びに当該共通の第2の事項のデータを表す前記画像データを出力してもよい。
Further, the output means may output the image data representing an image of the aspect in which the change portion is more easily recognized than the maintenance portion.
Further, the output means, when there are a plurality of data of the second matter in the decision tree, represents the data differently, and satisfies the common condition in the first and second periods When there is common second item data, the image data representing the same second item data as well as the same distance from the root of the decision tree may be output.

また、前記出力手段は、前記決まり事が複数ある場合には当該決まり事をそれぞれ異なる並びに表し、且つ、前記第1及び第2の時期において、共通の前記条件を満たす場合に共通の前記第2の事項のデータが得られるという共通の前記決まり事がある場合には、当該共通の決まり事に共通の符号を付して表す前記画像データを出力してもよい。
さらに、前記出力手段は、前記共通の決まり事が複数ある場合には、第1の前記共通の決まり事と第2の前記共通の決まり事とを、前記第1及び第2の時期のいずれにおいても同じ並びの数だけ離して表す画像データを出力してもよい。
また、前記算出手段は、抽出された前記決まり事のp値(probability value)を前記有意度として算出してもよい。
In addition, when there are a plurality of the rules, the output means represents the rules different from each other, and the second means common when the common conditions are satisfied in the first and second periods. In the case where there is a common rule that data of the item can be obtained, the image data represented by adding a common code to the common rule may be output.
In addition, when there are a plurality of the common rules, the output means determines the first common rule and the second common rule at any one of the first time and the second time. Also, image data that is separated by the same number of rows may be output.
The calculating means may calculate the extracted p-value (probability value) of the rule as the significance.

本発明は、コンピュータに、複数の対象の各々に関する複数の事項のデータを取得する取得ステップと、前記取得ステップにおいて取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成ステップと、前記生成ステップにおいて生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出ステップと、前記取得ステップにおいて取得されたデータから、前記抽出ステップにおいて抽出された決まり事の有意さの度合いを表す有意度を算出する算出ステップと、前記生成ステップにおいて生成された決定木と、前記抽出ステップにおいて抽出された決まり事と、前記算出ステップにおいて算出された有意度との一覧を示す一覧データを出力する出力ステップ手段とを実行させるためのプログラムを提供する。   The present invention provides an acquisition step of acquiring a plurality of items of data related to each of a plurality of targets in a computer, and when the data of the first item of the target satisfies a condition from the data acquired in the acquisition step A generation step of generating a decision tree representing data of the second item of interest to be predicted, and a decision tree generated in the generation step, when the data of the first item satisfies the condition An extraction step for extracting the rule that the data of the second matter is obtained, and a significance level representing the degree of significance of the rule extracted in the extraction step is calculated from the data acquired in the acquisition step. A calculation step; a decision tree generated in the generation step; a rule extracted in the extraction step; It provides a program for executing an output step for outputting a list data indicating a list of significant degrees calculated at step out.

本発明によれば、決定木から有用な分岐の条件及び結論を見つけやすくすることができる。   According to the present invention, it is possible to easily find useful branch conditions and conclusions from a decision tree.

第1実施形態に係る情報提供システム1の全体構成を示す1 shows an overall configuration of an information providing system 1 according to a first embodiment. 情報処理装置10のハードウェア構成を示す図The figure which shows the hardware constitutions of the information processing apparatus 10 情報処理装置10が実現する機能構成の一例を示す図The figure which shows an example of the function structure which the information processing apparatus 10 implement | achieves 生成された決定木の一例を示す図Diagram showing an example of the generated decision tree 抽出された決まり事の一例を示す図Diagram showing an example of extracted rules 算出された有意度の例を示す図Figure showing an example of calculated significance カイ二乗値の算出方法を説明するための図Diagram for explaining how to calculate the chi-square value 表示された決定木、決まり事及び有意度の一覧の一例を示す図Diagram showing an example of a list of displayed decision trees, rules, and significance levels 取得処理における各装置の動作の一例を示すシーケンス図Sequence diagram showing an example of the operation of each device in the acquisition process 出力処理における各装置の動作の一例を示すシーケンス図Sequence diagram showing an example of operation of each device in output processing 一覧要求操作が行われるときに表示される画像の例を示す図The figure which shows the example of the image displayed when list request | requirement operation is performed 出力される画像データの一例を示す図The figure which shows an example of the image data output 出力される画像データの他の一例を示す図The figure which shows another example of the image data output

[1]第1実施形態
[1−1]全体構成及びハードウェア構成
図1は、本発明の第1実施形態に係る情報提供システム1の全体構成を示す図である。情報提供システム1は、本実施形態においては、医師や看護師などの医療従事者に、医療に関する情報を総合的に提供するためのシステムである。情報提供システム1は、情報処理装置10と、ネットワーク2と、各医療施設3に設けられた複数のサーバ装置4及び複数のクライアント装置5とを備える。ネットワーク2は、装置間のデータのやり取りを仲介するシステムであり、例えば、医療施設3に設けられたLAN(Local Area Network)及びそれらのLANを接続するWAN(Wide Area Network)である。なお、ネットワーク2には、インターネットや無線通信回線などが含まれていてもよい。
[1] First Embodiment [1-1] Overall Configuration and Hardware Configuration FIG. 1 is a diagram showing an overall configuration of an information providing system 1 according to the first embodiment of the present invention. In the present embodiment, the information providing system 1 is a system for comprehensively providing medical information to medical personnel such as doctors and nurses. The information providing system 1 includes an information processing device 10, a network 2, and a plurality of server devices 4 and a plurality of client devices 5 provided in each medical facility 3. The network 2 is a system that mediates exchange of data between devices, and is, for example, a LAN (Local Area Network) provided in the medical facility 3 and a WAN (Wide Area Network) that connects these LANs. The network 2 may include the Internet or a wireless communication line.

サーバ装置4は、医療業務に用いられるシステム(以下「医療システム」という。)が有する機能を実行するコンピュータである。医療システムとは、例えば、電子カルテシステムや自動検査装置接続システム、細菌検査・ナビゲーションシステムなどである。サーバ装置4は、ネットワーク2に接続されており、ネットワーク2を介して、医療システムに関係するデータをやり取りする。   The server device 4 is a computer that executes a function of a system (hereinafter referred to as “medical system”) used for medical work. The medical system is, for example, an electronic medical record system, an automatic inspection apparatus connection system, a bacteria inspection / navigation system, or the like. The server device 4 is connected to the network 2 and exchanges data related to the medical system via the network 2.

クライアント装置5は、医療従事者が医療システムを利用するためのプログラムを記憶し、実行するコンピュータであり、例えばパーソナルコンピュータやタブレット端末などである。クライアント装置5は、ネットワーク2に有線または無線で(図1の例では有線で)接続されており、ネットワーク2を介してデータをやり取りする。クライアント装置5は、画像を表示する表示手段を備えており、医療システムに関する画像を表示する。また、医療従事者は、クライアント装置5を操作して、医療システムに関係するデータを入力する。他にも、クライアント装置5は、ブラウザのプログラムを記憶し、実行することで、上述した医療に関する情報を表示手段に表示する。これにより、医療に関する情報が医療従事者に提供される。なお、ブラウザのプログラムは、医療システムを利用するためのプログラムを兼ねている場合もある。   The client device 5 is a computer that stores and executes a program for medical personnel to use the medical system, and is, for example, a personal computer or a tablet terminal. The client device 5 is connected to the network 2 by wire or wireless (in the example of FIG. 1, by wire), and exchanges data via the network 2. The client device 5 includes display means for displaying an image, and displays an image related to the medical system. In addition, the medical staff operates the client device 5 and inputs data related to the medical system. In addition, the client device 5 stores and executes a browser program to display the above-described medical information on the display unit. Thereby, the information regarding medical care is provided to the medical staff. The browser program may also serve as a program for using the medical system.

情報処理装置10は、情報を処理する機能を有するコンピュータである。情報処理装置10は、ネットワーク2に接続されており、ネットワーク2を介して複数のサーバ装置4から医療に関するデータを収集する。情報処理装置10は、収集したデータの分析を支援するデータ分析支援サービスをクライアント装置5のユーザ、すなわち医療従事者に提供する。   The information processing apparatus 10 is a computer having a function of processing information. The information processing apparatus 10 is connected to the network 2 and collects medical data from a plurality of server apparatuses 4 via the network 2. The information processing apparatus 10 provides a data analysis support service that supports analysis of collected data to the user of the client apparatus 5, that is, a medical worker.

図2は、情報処理装置10のハードウェア構成を示す図である。情報処理装置10は、制御部11と、記憶部12と、通信部13とを備える。制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)及びリアルタイムクロックを備えている。CPUは、RAMをワークエリアとして用いてROMや記憶部12に記憶されたプログラムを実行することによって記憶部12及び通信部13の動作を制御する。リアルタイムクロックは、現在の日時を算出する機能を有している。記憶部12は、ハードディスク等を備え、制御部11が制御に用いるデータやプログラムなどを記憶している。通信部13は、ネットワーク2を介して通信を行うための通信回路を備える。   FIG. 2 is a diagram illustrating a hardware configuration of the information processing apparatus 10. The information processing apparatus 10 includes a control unit 11, a storage unit 12, and a communication unit 13. The control unit 11 includes a central processing unit (CPU), a read only memory (ROM), a random access memory (RAM), and a real time clock. The CPU controls the operations of the storage unit 12 and the communication unit 13 by executing a program stored in the ROM or the storage unit 12 using the RAM as a work area. The real time clock has a function of calculating the current date and time. The storage unit 12 includes a hard disk or the like, and stores data, programs, and the like used by the control unit 11 for control. The communication unit 13 includes a communication circuit for performing communication via the network 2.

[1−2]機能構成
情報処理装置10は、以上のハードウェア構成に基づき、医療従事者が行うデータ分析を支援するための処理である分析支援処理を行う。記憶部12には、分析支援処理を行うためのプログラムが記憶されている。制御部11がそのプログラムを実行して図2に示す各装置を制御することで、以下に述べる機能が実現される。
図3は、情報処理装置10が実現する機能構成の一例を示す図である。情報処理装置10は、取得手段101と、生成手段102と、抽出手段103と、算出手段104と、出力手段105とを備える。
[1-2] Functional Configuration The information processing apparatus 10 performs an analysis support process that is a process for supporting data analysis performed by a medical worker based on the hardware configuration described above. The storage unit 12 stores a program for performing analysis support processing. The control unit 11 executes the program to control each device shown in FIG.
FIG. 3 is a diagram illustrating an example of a functional configuration realized by the information processing apparatus 10. The information processing apparatus 10 includes an acquisition unit 101, a generation unit 102, an extraction unit 103, a calculation unit 104, and an output unit 105.

[1−2−1]取得手段
取得手段101は、複数の対象の各々に関する複数の事項のデータ(以下「関連データ」という)を取得する手段の一例である。本実施形態では、対象とは、患者のことであり、関連データとは、上述した医療システムに記憶されている患者に関するデータである。具体的には、患者を識別する患者ID(Identification)や患者の年齢、症状、検査の結果、手術の回数などである。関連データとしては、例えば、院内感染対策サーベイランス(JANIS:Japan Nosocomial Infections Surveillance)の事務局に提出されるデータなどが用いられてもよい。
[1-2-1] Acquisition Unit The acquisition unit 101 is an example of a unit that acquires data on a plurality of items (hereinafter referred to as “related data”) regarding each of a plurality of objects. In the present embodiment, the target is a patient, and the related data is data related to the patient stored in the above-described medical system. Specifically, the patient ID (Identification) for identifying the patient, the patient's age, symptom, examination result, number of operations, and the like. As the related data, for example, data submitted to the secretariat of Nosocomial Infections Surveillance (JANIS) may be used.

上記の関連データは、図1に示すサーバ装置4が記憶している。本実施形態では、各サーバ装置4が、例えば決められた時間の間隔(例えば1ヶ月毎)や決められた日時(例えば毎月1日と15日の午前0時)に、自装置が記憶している関連データを情報処理装置10に送信する。取得手段101は、こうして送信されてきた関連データを取得する。なお、取得手段101は、各サーバ装置4に対して関連データを要求する要求データを送信し、その応答で送信されてくる関連データを取得してもよい。取得手段101は、取得した関連データを記憶して、生成手段102及び算出手段104から参照できるようにしておく。   The related data is stored in the server apparatus 4 shown in FIG. In this embodiment, each server device 4 stores the server device 4 at, for example, a predetermined time interval (for example, every month) or a predetermined date and time (for example, the first and the 15th of every month at midnight). Related data is transmitted to the information processing apparatus 10. The acquisition unit 101 acquires the related data transmitted in this way. The acquisition unit 101 may transmit request data for requesting related data to each server device 4 and acquire the related data transmitted in response to the request data. The acquisition unit 101 stores the acquired related data so that the generation unit 102 and the calculation unit 104 can refer to the acquired related data.

[1−2−2]生成手段
生成手段102は、取得手段101により取得されたデータから、対象の第1の事項のデータが条件を満たす場合に予測されるその対象の第2の事項のデータを表した決定木を生成する手段の一例である。第1の事項のデータは、例えば説明因子ともいい、第2の事項のデータは、例えば目的因子ともいう。本実施形態では、生成手段102は、患者の生存及び死亡を表す「転帰」と呼ばれる事項を第2の事項とし、「年齢分類」、「熱傷の程度」、「気道熱傷の有無」、「敗血症の有無」及び「手術回数」という5つの事項を第1の事項として決定木を生成する。年齢分類は、患者の年齢を10才未満、10才以上40才以下、41才以上70才未満、70才以上に分類したデータであり、熱傷の程度は、熱傷の程度を10以下、11以上30以下、31以上59以下、60以上で表したデータである。生成手段102は、取得手段101が記憶した関連データを参照し、そのうちの上記第1及び第2の事項のデータから、例えばID3(Iterative Dichotomiser 3)アルゴリズムなどの周知のアルゴリズムを用いて決定木を生成する。
[1-2-2] Generating Unit The generating unit 102 predicts the data of the second item of the target predicted from the data acquired by the acquiring unit 101 when the data of the target first item satisfies the condition. Is an example of a means for generating a decision tree representing The data of the first item is also called an explanatory factor, for example, and the data of the second item is also called an objective factor, for example. In the present embodiment, the generation unit 102 sets the item called “outcome” representing the survival and death of the patient as the second item, “age classification”, “degree of burn”, “presence / absence of airway burn”, “sepsis” The decision tree is generated with five items of “presence / absence of” and “number of operations” as the first items. The age classification is data in which the patient's age is classified as less than 10 years old, 10 years old or older and 40 years old or less, 41 years old or older and less than 70 years old, 70 years old or older. The data is represented by 30 or less, 31 or more and 59 or less, or 60 or more. The generation unit 102 refers to the related data stored by the acquisition unit 101, and determines a decision tree from the data of the first and second items using a known algorithm such as an ID3 (Iterative Dichotomiser 3) algorithm. Generate.

図4は、生成された決定木の一例を示す図である。この例では、決定木のルート(「根」ともいう)から「敗血症」の有無という条件で分岐する2つの枝が伸びている。このように、決定木で用いられる条件は、枝が分岐する条件を表しており、以下では「分岐条件」という。「敗血症=なし」という枝からは、「熱傷の程度」という分岐条件で分岐する3つの枝が示されている。最初の枝では、「熱傷の程度=10以下」である場合に「生存」という第2の事項のデータが得られることが示されている。この場合の「生存」を、目的とする第2の事項のデータといい、決定木における「葉」ともいう。葉のあとに示された「20−>18」という数値は、「敗血症=なし」及び「熱傷の程度=10以下」という分岐条件を満たした患者が20名であり、そのうちの18名については「生存」という第2の事項のデータが取得されたことを表している。つまり、第1の事項のデータが分岐条件を満たした場合に目的とする第2の事項のデータが得られた確率を表している。同様に、「熱傷の程度=11−30(11以上30以下)」である場合にも、「14−>14」という確率で「生存」という第2の事項のデータが得られたことが示されている。   FIG. 4 is a diagram illustrating an example of the generated decision tree. In this example, two branches branch from the root of the decision tree (also referred to as “root”) under the condition of “sepsis”. As described above, the condition used in the decision tree represents a condition for branching, and is hereinafter referred to as a “branch condition”. From the branch “sepsis = none”, three branches are shown that branch under the branch condition “degree of burn”. In the first branch, it is shown that the data of the second item “survival” can be obtained when “the degree of burn = 10 or less”. The “survival” in this case is referred to as target second data, and is also referred to as “leaf” in the decision tree. The numerical value of “20-> 18” shown after the leaves indicates that there are 20 patients who satisfy the branching conditions of “sepsis = none” and “degree of burn = 10 or less”, of which 18 are This indicates that data of the second item “survival” has been acquired. That is, it represents the probability that the target data of the second item is obtained when the data of the first item satisfies the branch condition. Similarly, it is shown that the data of the second item “survival” was obtained with a probability of “14−> 14” even when “the degree of burn = 11-30 (11 to 30)”. Has been.

「熱傷の程度=31−59」である場合には、さらに「年齢分類」という分岐条件で分岐する3つの枝が示されている。最初の枝では、「年齢分類10−40(10才以上40才以下)」である場合に「生存」が「3−>3」という確率で得られたことが示されている。続いて、2番目の枝では、「年齢分類41−70」である場合に「死亡」が「2−>2」という確率で得られたことが示され、「年齢分類10未満」である場合に「生存」が「1−>1」という確率で得られたことが示されている。また、「敗血症=有り」という枝では、「気道熱傷の有無」という分岐条件で分岐する2つの枝が示されている。そして、「気道熱傷=なし」の場合には「生存」が「6−>5」という確率で得られたことが示され、「気道熱傷=有り」の場合には「死亡」が「6−>5」という確率で得られたことが示されている。生成手段102は、生成した決定木を示す決定木データを抽出手段103及び出力手段105に供給する。   In the case of “degree of burn = 31-59”, three branches that further branch under the branch condition “age classification” are shown. The first branch shows that “survival” was obtained with a probability of “3-> 3” in the case of “age classification 10-40 (10 to 40 years old)”. Subsequently, in the second branch, when “age classification 41-70” is indicated, it is indicated that “death” was obtained with a probability of “2-> 2”, and when “age classification is less than 10” It is shown that “survival” was obtained with a probability of “1-> 1”. In addition, in the branch “sepsis = present”, two branches that branch under the branch condition “presence / absence of airway burn” are shown. In the case of “airway burn = none”, it is shown that “survival” was obtained with a probability of “6-> 5”, and in the case of “airway burn = present”, “death” was “6- It is shown that it was obtained with a probability of> 5 ”. The generation unit 102 supplies decision tree data indicating the generated decision tree to the extraction unit 103 and the output unit 105.

[1−2−3]抽出手段
抽出手段103は、生成手段102により生成された決定木から、第1の事項のデータが分岐条件を満たす場合に第2の事項のデータが得られるという決まり事を抽出する手段の一例である。抽出手段103は、例えば、分岐条件を表すif部と、if部が真である、すなわち分岐条件が満たされる場合に得られる結論を表すthen部とから構成されるif−thenルールという決まり事を、生成手段102から供給された決定木データが示す決定木から抽出する。
[1-2-3] Extraction Unit The extraction unit 103 determines from the decision tree generated by the generation unit 102 that the data of the second item is obtained when the data of the first item satisfies the branch condition. It is an example of a means for extracting. For example, the extracting unit 103 determines the rule of an if-then rule composed of an if part representing a branch condition and a then part representing a conclusion obtained when the if part is true, that is, when the branch condition is satisfied. The data is extracted from the decision tree indicated by the decision tree data supplied from the generation unit 102.

図5は、抽出された決まり事の一例を示す図である。この例では、抽出手段103は、図4に示す決定木の一番上の葉をthen部とし、その葉とルートとを繋ぐ枝をif部とするif−thenルールを抽出している。具体的には、「if 敗血症=なし&熱傷の程度=10以下」である場合に、「then 生存」という結論が得られるという決まり事を抽出している。抽出手段103は、図4に示す他の葉についても決まり事を抽出する。抽出手段103は、抽出した決まり事を示す決まり事データを、算出手段104及び出力手段105に供給する。   FIG. 5 is a diagram illustrating an example of the extracted rules. In this example, the extraction unit 103 extracts an if-then rule in which the top leaf of the decision tree shown in FIG. 4 is the then part and the branch connecting the leaf and the root is the if part. Specifically, the rule is extracted that the conclusion “then survival” is obtained when “if sepsis = none & degree of burn = 10 or less”. The extraction means 103 extracts the rules for the other leaves shown in FIG. The extraction unit 103 supplies rule data indicating the extracted rule to the calculation unit 104 and the output unit 105.

[1−2−4]算出手段
算出手段104は、取得手段101により取得されたデータから、抽出手段103により抽出された決まり事の有意さの度合いを表す有意度を算出する手段の一例である。決まり事が有意であるということとは、確率的にその決まり事が偶然成り立っているとは考えにくく、その決まり事には意味があると考えられるということである。つまり、有意度とは、その決まり事が偶然成り立つ可能性の低さを示す度合いであり、換言すると、その決まり事に意味がある可能性の高さを示す度合いである。算出手段104は、取得手段101が記憶した関連データを参照し、そのうちの上記第1及び第2の事項のデータから、抽出手段103から供給された決まり事データが示す各決まり事についての有意度を算出する。
[1-2-4] Calculation Unit The calculation unit 104 is an example of a unit that calculates, from the data acquired by the acquisition unit 101, a significance level that represents the degree of significance of the rules extracted by the extraction unit 103. . The fact that a rule is significant means that it is unlikely that the rule stood by chance and that the rule is considered meaningful. In other words, the significance level is a degree indicating a low possibility that the rule is accidentally established, and in other words, a degree indicating a high possibility that the rule is meaningful. The calculation unit 104 refers to the related data stored in the acquisition unit 101, and from the data of the first and second items, the significance of each rule indicated by the rule data supplied from the extraction unit 103 Is calculated.

図6は、算出された有意度の例を示す図である。算出手段104は、図6の例では、「確率」、「意外性」及び「p値」を有意度として算出している。算出手段104は、上述した「20−>18」という葉の場合、18÷20=0.9(90%)という値を「確率」として算出する。つまり、算出手段104は、第1の事項のデータが分岐条件(この例では「敗血症=なし」及び「熱傷の程度=10以下」という分岐条件)を満たした対象の数で、そのうち目的とする第2の事項のデータ(この例では「生存」)が取得された対象の数を除した値を有意度(この場合「確率」)として算出する。   FIG. 6 is a diagram illustrating an example of the calculated significance level. In the example of FIG. 6, the calculation unit 104 calculates “probability”, “unexpectedness”, and “p value” as significance levels. The calculation means 104 calculates the value of 18 ÷ 20 = 0.9 (90%) as “probability” in the case of the leaf “20−> 18” described above. In other words, the calculation means 104 is the number of objects for which the data of the first item satisfies the branching conditions (in this example, the branching conditions of “sepsis = none” and “degree of burn = 10 or less”), of which the target A value obtained by dividing the number of objects for which data of the second item (in this example, “survival”) is obtained is calculated as the significance (in this case, “probability”).

また、算出手段104は、意外なことが起こっている度合いを示す「意外性」を有意度として算出する。例えば、サイコロを振って1が出ると期待される確率(これを「期待確率」という)は1/6である。実際にサイコロを振った場合に1が6回中1回出るとしたならばその確率(これを「実生起確率」という)は1/6である。これらの確率の比率を意外性といい、この例では意外性=実生起確率(1/6)÷期待確率(1/6)=1.00である。意外性は1.00よりも大きいほど意外なことが起こっていることを表す。例えば、1が6回中5回出れば、意外性=実生起確率(5/6)÷期待確率(1/6)=5.00であり、前述の例よりも意外なことが起こっていることを表す。図6の例では、算出手段104は、意外度を234.852と算出している。この意外性が大きいほど、その決まり事が偶然には起こりにくいことを表すため、その決まり事におけるif部とthen部の相関が大きいことを表すことになる。   Further, the calculation unit 104 calculates “unexpectedness” indicating the degree of unexpected occurrence as the significance level. For example, the probability that this is expected to be 1 when rolling a dice (this is called “expected probability”) is 1/6. If 1 actually comes out of 6 times when a dice is shaken, the probability (this is called “actual occurrence probability”) is 1/6. The ratio of these probabilities is called unexpectedness, and in this example, unexpectedness = probability (1/6) ÷ expected probability (1/6) = 1.00. The unexpectedness is greater than 1.00, indicating that something unexpected is happening. For example, if 1 comes out 5 times out of 6 times, unexpectedness = probability of occurrence (5/6) ÷ expected probability (1/6) = 5.00, which is more unexpected than the previous example. Represents that. In the example of FIG. 6, the calculation unit 104 calculates the unexpectedness as 234.852. The greater the unexpectedness, the less likely that the event happens by chance, and the greater the correlation between the “if” part and the “then” part in that event.

また、算出手段104は、決まり事が正しくないという仮説(いわゆる帰無仮説)を棄却するか否かを判断する際に用いられるp値(probability-value)を有意度として算出する。算出手段104、本実施形態では、カイ二乗値X2 0を用いてp値を算出する。
図7は、カイ二乗値の算出方法を説明するための図である。図7では、或る決まり事について、「if部が真」且つ「then部が真」という対象の件数が「a」、「if部が真」且つ「then部が真でない」という対象の件数が「b」、「if部が真でない」且つ「then部が真」という対象の件数が「c」、「if部が真でない」且つ「then部が真でない」という対象の件数が「d」である場合が2×2のクロス表で示されている。この表では、各行及び各列の合計(「a+b」など)と、全体の合計(「a+b+c+d」)とが示されている。算出手段104は、例えば、次に示す式(1)を用いてカイ二乗値X2 0を算出する。
Further, the calculation means 104 calculates a p-value (probability-value) used as a significance level when determining whether to reject a hypothesis that the rule is not correct (so-called null hypothesis). The calculation means 104, in this embodiment, calculates the p value using the chi-square value X 2 0 .
FIG. 7 is a diagram for explaining a method of calculating the chi-square value. In FIG. 7, for a certain rule, the number of subjects whose “if part is true” and “then part is true” is “a”, “if part is true” and “then part is not true”. Is “b”, “if part is not true” and “then part is true”, the number of cases is “c”, “if part is not true” and “then part is not true”. ”Is shown in a 2 × 2 cross table. In this table, the total of each row and column (such as “a + b”) and the total (“a + b + c + d”) are shown. For example, the calculation unit 104 calculates the chi-square value X 2 0 using the following equation (1).

Figure 2015118466
Figure 2015118466

算出手段104は、こうして算出したカイ二乗値X2 0から、所定の計算式を用いてp値を算出する。算出手段104は、図6の例では、0.18180というp値を算出している。なお、算出手段104は、これに限らず、他の周知の方法でp値を算出してもよい。算出手段104は、こうして算出した確率、意外性及びp値という有意度を示す有意度データを、出力手段105に供給する。 The calculating means 104 calculates the p value from the chi-square value X 2 0 calculated in this way using a predetermined calculation formula. In the example of FIG. 6, the calculation unit 104 calculates a p value of 0.18180. Note that the calculation unit 104 is not limited to this, and may calculate the p-value by another known method. The calculation means 104 supplies significance data indicating the significance, probability, and p-value calculated in this way to the output means 105.

[1−2−5]出力手段
出力手段105は、生成手段102により生成された決定木と、抽出手段103により抽出された決まり事と、算出手段104により算出された値との一覧を示す一覧データを出力する手段の一例である。出力手段105は、例えばクライアント装置5から送信されてきた一覧データを要求する要求データを受信すると、各手段から供給された決定木データ、決まり事データ及び有意度データに基づいて一覧データを生成し、そのクライアント装置5に対して生成した一覧データを出力する。クライアント装置5は、出力されてきた一覧データが示す一覧を、例えばブラウザの機能により表示手段に表示する。
[1-2-5] Output Unit The output unit 105 is a list showing a list of the decision tree generated by the generation unit 102, the rules extracted by the extraction unit 103, and the values calculated by the calculation unit 104. It is an example of a means for outputting data. For example, when receiving the request data requesting the list data transmitted from the client device 5, the output unit 105 generates list data based on the decision tree data, the rule data, and the significance data supplied from each unit. The generated list data is output to the client device 5. The client device 5 displays the list indicated by the output list data on the display unit by using a browser function, for example.

図8は、表示された決定木、決まり事及び有意度の一覧の一例を示す図である。この例では、ブラウザのタイトルバーA1に「データ分析支援サービス」という文字列が表示され、メニューバーA2の下側に、決定木が表示された決定木欄A3と、本実施形態における決まり事であるif−thenルール及び各決まり事について算出された有意度が表示されたif−thenルール欄A4とが表示されている。決定木欄A3とif−thenルール欄A4とは、左右に並べて表示されている。   FIG. 8 is a diagram illustrating an example of a list of displayed decision trees, rules, and significance levels. In this example, the character string “data analysis support service” is displayed in the title bar A1 of the browser, the decision tree column A3 in which the decision tree is displayed below the menu bar A2, and the rules in this embodiment. An if-then rule column A4 displaying a certain if-then rule and the significance calculated for each rule is displayed. The decision tree column A3 and the if-the rule column A4 are displayed side by side.

図8では、図4に示す7つの葉を有する決定木が決定木欄A3に表示されており、各葉に対応する7件の決まり事がif−thenルール欄A4に表示されている。if−thenルール欄A4には、他にも、目的因子である「転帰」という文字列と、説明因子である「年齢分類」等の文字列と、決定木の生成に用いられた関連データが関連している対象の件数とが表示されている。このように、出力手段105は、決定木において第2の事項のデータが複数ある場合には、それらのデータをそれぞれ異なる並び(この場合は異なる行)に表す一覧データを出力する。また、出力手段105は、決まり事が複数ある場合にはそれらの決まり事をそれぞれ異なる並び(同じく異なる行)に表す一覧データを出力する。   In FIG. 8, the decision tree having seven leaves shown in FIG. 4 is displayed in the decision tree column A3, and seven rules corresponding to each leaf are displayed in the if-then rule column A4. In the if-then rule column A4, there are also a character string “outcome” as an objective factor, a character string such as “age classification” as an explanatory factor, and related data used for generating the decision tree. The number of related objects is displayed. As described above, when there are a plurality of pieces of data of the second item in the decision tree, the output unit 105 outputs list data representing these data in different sequences (in this case, different rows). Further, when there are a plurality of rules, the output unit 105 outputs list data representing the rules in different sequences (similarly different rows).

[1−3]動作
情報処理装置10は、以上の構成に基づき上述した分析支援処理を行う。分析支援処理は、関連データを取得する取得処理と、取得した関連データに基づいて生成した一覧データを出力する出力処理とを含んでいる。以下では、取得処理及び出力処理において情報提供システム1が備える各装置が行う動作について、図9及び図10をそれぞれ参照して説明する。
[1-3] Operation The information processing apparatus 10 performs the analysis support process described above based on the above configuration. The analysis support process includes an acquisition process for acquiring related data and an output process for outputting list data generated based on the acquired related data. Below, the operation | movement which each apparatus with which the information provision system 1 is provided in an acquisition process and an output process demonstrates with reference to FIG.9 and FIG.10, respectively.

図9は、取得処理における各装置の動作の一例を示すシーケンス図である。図9では、複数のサーバ装置4のうちの2つを示しているが、これら以外のサーバ装置4も、これらと同様の動作を行う。まず、サーバ装置4は、例えば医療システムの利用者によりその医療システムに関する情報を入力する操作が行われたときに、その入力操作を受け付ける(ステップS11)。ここで入力される情報は、例えば患者のバイタルデータなどである。サーバ装置4は、受け付けた入力操作に応じた関連データを記憶し(ステップS12)、決められた時間の間隔や決められた時刻などに、関連データを情報処理装置10に送信する(ステップS13)。   FIG. 9 is a sequence diagram illustrating an example of the operation of each device in the acquisition process. In FIG. 9, two of the plurality of server devices 4 are shown, but the server devices 4 other than these perform the same operations. First, for example, when an operation for inputting information related to a medical system is performed by a user of the medical system, the server device 4 receives the input operation (step S11). The information input here is patient vital data, for example. The server device 4 stores related data according to the accepted input operation (step S12), and transmits the related data to the information processing device 10 at a predetermined time interval or a predetermined time (step S13). .

また、別のサーバ装置4は、例えば医療システムの所定の処理を実行する(ステップS21)。次に、サーバ装置4は、ステップS21で実行した処理の結果を関連データとして記憶する(ステップS22)。ここで記憶される関連データは、例えば感染症の病原体の検出結果などである。続いて、サーバ装置4は、前述したステップS13と同様に関連データを情報処理装置10に送信する(ステップS23)。情報処理装置10は、ステップS13及びS23において、送信されてきた関連データをそれぞれ受信し、受信した関連データを取得する(ステップS31)。ステップS13、S23及びS31は、取得部101が行う動作である。   Another server device 4 executes a predetermined process of the medical system, for example (step S21). Next, the server device 4 stores the result of the process executed in step S21 as related data (step S22). The related data stored here is, for example, a detection result of an infectious disease pathogen. Subsequently, the server apparatus 4 transmits related data to the information processing apparatus 10 in the same manner as in step S13 described above (step S23). In steps S13 and S23, the information processing apparatus 10 receives the received related data, and acquires the received related data (step S31). Steps S13, S23, and S31 are operations performed by the acquisition unit 101.

図10は、出力処理における各装置の動作の一例を示すシーケンス図である。図10では、複数のクライアント装置5のうちの1つを示しているが、これ以外のクライアント装置5も、これと同様の動作を行う。出力処理は、情報提供システム1の利用者がクライアント装置5に対して決定木、決まり事及び有意度の一覧を要求する操作(以下「一覧要求操作」という)を行うことを契機に開始される。一覧要求操作の詳細について、図11を参照して説明する。   FIG. 10 is a sequence diagram illustrating an example of the operation of each device in the output process. In FIG. 10, one of the plurality of client devices 5 is shown, but the other client devices 5 perform the same operation. The output process is started when the user of the information providing system 1 performs an operation (hereinafter referred to as “list request operation”) for requesting a list of decision trees, rules, and significances from the client device 5. . Details of the list request operation will be described with reference to FIG.

図11は、一覧要求操作が行われるときにクライアント装置に表示される画像の例を示す図である。図11(a)では、決定木を生成するために用いる関連データを選択するための画像が表示されている。この例では、選択可能な関連データの一覧である一覧画像B1と、選択された関連データを示す選択データ画像B2と、一覧画像B1から関連データを選択したり、選択データ画像B2から関連データの選択を解除したりするための操作子画像B3とが表示されている。図11(b)では、選択された関連データから、目的因子とする関連データを選択させるための画像が表示されている。この例では、「敗血症の有無」、「熱傷の程度」、「気道熱傷の有無」、「年齢分類」、「手術回数」及び「転帰」という6つの関連データが選択されており、そのうちの「転帰」にチェックがされている状態の選択データ画像B2と、「決定」という文字列を含む操作子画像B4とが表示されている。   FIG. 11 is a diagram illustrating an example of an image displayed on the client device when a list request operation is performed. In FIG. 11A, an image for selecting related data used for generating a decision tree is displayed. In this example, a list image B1 that is a list of related data that can be selected, a selection data image B2 that indicates the selected related data, and related data are selected from the list image B1, or related data is selected from the selected data image B2. An operator image B3 for canceling the selection is displayed. In FIG.11 (b), the image for selecting the relevant data made into a target factor from the selected relevant data is displayed. In this example, six related data of “presence / absence of sepsis”, “degree of burn”, “presence / absence of airway burn”, “age classification”, “number of operations” and “outcome” are selected. A selected data image B2 in which “Outcome” is checked and an operator image B4 including a character string “Determine” are displayed.

図11(b)に示す状態で利用者が操作子画像B4を選択する操作を行うと、クライアント装置5は、この操作を一覧要求操作として受け付け(ステップS41)、目的因子(第2の事項のデータ)を「転帰」のデータとし、説明因子(第1の事項のデータ)を「敗血症の有無」、「熱傷の程度」、「気道熱傷の有無」、「年齢分類」及び「手術回数」とする決定木の生成と、それに対応する決まり事及び有意度との一覧を要求する要求データを情報処理装置10に送信する(ステップS42)。   When the user performs an operation of selecting the operator image B4 in the state shown in FIG. 11B, the client device 5 accepts this operation as a list request operation (step S41), and the objective factor (the second matter) Data) is “outcome” data, and explanatory factors (data of the first item) are “sepsis presence / absence”, “degree of burn”, “presence / absence of airway burn”, “age classification” and “number of operations” Request data for requesting a list of decision trees to be generated and corresponding rules and significances is transmitted to the information processing apparatus 10 (step S42).

情報処理装置10は、ステップS42においてクライアント装置5からの要求データを受信すると、要求データが示す目的因子及び説明因子の関連データを用いて決定木を生成する(ステップS43)。ステップS43は生成手段102が行う動作である。次に、情報処理装置10は、生成した決定木から決まり事を抽出し(ステップS44)、抽出した各決まり事についての有意度を算出する(ステップS45)。ステップS44は抽出手段103が行う動作であり、ステップS45は算出手段104が行う動作である。続いて、情報処理装置10は、生成した決定木、抽出した決まり事及び算出した有意度を用いて、一覧データを生成し(ステップS46)、生成した一覧データをクライアント装置5に対して出力する(ステップS47)。ステップS46及びS47は出力手段105が行う動作である。クライアント装置5は、ステップS47において一覧データを受信すると、受信した一覧データが示す一覧を表示する(ステップS48)。   When the information processing apparatus 10 receives the request data from the client apparatus 5 in step S42, the information processing apparatus 10 generates a decision tree using the related data of the objective factor and the explanatory factor indicated by the request data (step S43). Step S43 is an operation performed by the generation unit 102. Next, the information processing apparatus 10 extracts rules from the generated decision tree (step S44), and calculates the significance for each extracted rule (step S45). Step S44 is an operation performed by the extraction unit 103, and step S45 is an operation performed by the calculation unit 104. Subsequently, the information processing apparatus 10 generates list data using the generated decision tree, the extracted rules, and the calculated significance (step S46), and outputs the generated list data to the client apparatus 5. (Step S47). Steps S46 and S47 are operations performed by the output means 105. Upon receiving the list data in step S47, the client device 5 displays a list indicated by the received list data (step S48).

[1−4]第一実施形態の効果
本実施形態では、決定木、決まり事及び有意度をまとめた一覧を示す一覧データが出力される。決定木は、説明因子がルートからどのように分岐して葉、つまり目的因子まで繋がっているかという全体像を示す。また、決定木では、例えばルートに近い説明因子ほど目的因子との相関が大きい傾向にある。図4の例であれば、目的因子である「転帰」との相関は、「敗血症の有無」が最も大きく、次いで「熱傷の程度」及び「気道熱傷の有無」、その次に「年齢分類」と続き、「手術の回数」は最も相関が小さいという具合である。このように、決定木は、説明因子と目的因子との相関の大きさを把握するのに役立つ。
[1-4] Effects of First Embodiment In this embodiment, list data indicating a list in which decision trees, rules, and significance levels are collected is output. The decision tree shows the overall picture of how the explanatory factor branches from the root and leads to the leaf, that is, the target factor. In the decision tree, for example, an explanatory factor closer to the root tends to have a larger correlation with the target factor. In the example of FIG. 4, the correlation with the “outcome” as the objective factor is largest in “presence / absence of sepsis”, followed by “degree of burn” and “presence / absence of airway burn”, and then “age classification” Continuing, “the number of operations” has the smallest correlation. Thus, the decision tree is useful for grasping the magnitude of the correlation between the explanatory factor and the objective factor.

また、決まり事は、図5の例であれば、決定木における個々の葉(結論)とそこに至る枝(分岐条件)との関係を、説明因子(if部)と目的因子(then部)との組み合わせで簡潔に示し、有意度は、各決まり事において得られる結論が統計的にどの程度有意であるかということを示す。利用者は、これら3つの情報を合わせて見ることで、各説明因子と目的因子との相関の大きさや、各結論の統計的な有意さの程度(有意度)の大きさなどを見比べながら、分岐条件及び結論の有用さを判断することができる。このような本実施形態によれば、一覧データを出力しない場合に比べて、決定木から有用な分岐の条件及び結論を見つけやすくすることができる。   Further, in the example of FIG. 5, the rule is that the relationship between each leaf (conclusion) and the branch (branch condition) leading to it in the decision tree is as follows: explanatory factor (if part) and objective factor (then part) In a simple manner, the significance level indicates how statistically the conclusion obtained in each rule is. By looking at these three pieces of information together, the user can compare the magnitude of the correlation between each explanatory factor and the objective factor and the degree of statistical significance (significance) of each conclusion. The usefulness of branch conditions and conclusions can be determined. According to the present embodiment, it is possible to make it easier to find useful branch conditions and conclusions from a decision tree than when no list data is output.

また、本実施形態では、有意度としてp値が用いられている。例えば、p値が0.05未満である場合に上述した帰無仮説、すなわち抽出された決まり事が正しくないという仮説を棄却することが一般的であるが、それでは正しい決まり事がほとんど抽出されないということであれば、0.1未満を棄却してもよいし、より厳密に有意さを判断したければ0.01未満を棄却してもよい。このように、本実施形態によれば、p値を用いない場合に比べて、帰無仮説をどの程度の正確さをもって棄却するかということを容易に定めることができる。   In the present embodiment, the p value is used as the significance. For example, when the p-value is less than 0.05, it is common to reject the null hypothesis described above, that is, the hypothesis that the extracted rule is not correct, but that means that the correct rule is hardly extracted. If so, less than 0.1 may be rejected, or less than 0.01 may be rejected if the significance is judged more strictly. Thus, according to the present embodiment, it is possible to easily determine how accurately the null hypothesis is rejected as compared with the case where the p value is not used.

[2]第2実施形態
本発明の第2実施形態について、以下、第1実施形態と異なる点を中心に説明する。第1実施形態では、第1及び第2の事項のデータと時期との関係については特に言及されていなかったが、第2実施形態では、2つの異なる時期における関連データが用いられる。各時期における関連データとは、それらの時期に生成される関連データのことである。本実施形態で用いられる時期の長さは、用いられる関連データによって異なる。例えば、図4等の例で用いた敗血症の有無や熱傷の程度などであれば、数ヶ月から1年という長さの時期が用いられる。また、感染症に関する関連データであれば、その状況が頻繁に変化するため、数日から数週間、1ヶ月程度の長さの時期が用いられる。
[2] Second Embodiment Hereinafter, a second embodiment of the present invention will be described focusing on differences from the first embodiment. In the first embodiment, the relationship between the data of the first and second items and the time is not particularly mentioned, but in the second embodiment, the related data at two different times is used. The related data at each time is related data generated at the time. The length of time used in the present embodiment varies depending on the related data used. For example, if there is the presence or absence of sepsis or the degree of burn used in the example of FIG. In addition, if the data is related to infectious diseases, the situation changes frequently, so a period of several days to several weeks or one month is used.

[2−1]第2実施形態の構成
本実施形態では、取得手段101は、第1の時期及び第1の時期よりもあとの第2の時期における複数の事項のデータを取得する。第1及び第2の時期は、例えば、先々月及び先月である。取得手段101は、関連データを取得するときに、例えば取得した日時を示す日時データをともに記憶しておくことで、取得した関連データがどの時期に取得されたものであるかということが表されるようにする。生成手段102は、取得手段101により取得された第1及び第2の時期における複数の事項のデータから決定木をそれぞれ生成する。生成手段102は、記憶されている各時期の関連データ群を用いることで、このように決定木を生成する。抽出手段103は、第1及び第2の時期のそれぞれについて決まり事を抽出する。
[2-1] Configuration of the Second Embodiment In the present embodiment, the acquisition unit 101 acquires data of a plurality of items in the first period and the second period after the first period. The first and second periods are, for example, last month and last month. When the acquisition unit 101 acquires related data, for example, by storing date / time data indicating the acquired date / time together, it is indicated at what time the acquired related data is acquired. So that The generation unit 102 generates a decision tree from the data of a plurality of items at the first and second times acquired by the acquisition unit 101. The generation unit 102 generates the decision tree in this way by using the stored related data group for each period. The extraction unit 103 extracts the rules for each of the first and second periods.

出力手段105は、生成された決定木及び抽出された決まり事の少なくともいずれか一方(本実施形態では両方)のうち、第1の時期から第2の時期にかけて維持されている部分(以下「維持部分」という)と変化した部分(以下「変化部分」という)とを異なる態様の画像で表す画像データを、一覧データとして出力する。出力手段105は、本実施形態では、維持部分に比べて変化部分が認識されやすいようにした態様の画像を表す画像データを出力する。   The output means 105 is a portion that is maintained from the first time to the second time (hereinafter referred to as “maintain”) of at least one of the generated decision tree and the extracted rule (both in the present embodiment). Image data representing the image of the aspect different from the “part” and the changed part (hereinafter referred to as “change part”) is output as list data. In the present embodiment, the output means 105 outputs image data representing an image in a form in which the changed portion is more easily recognized than the maintained portion.

[2−2]第2実施形態の概要
図12は、出力される画像データの一例を示す図である。この例では、先月における関連データを用いて生成された決定木を表示した決定木欄A5及びその決定木から抽出された決まり事を表示したif−thenルール欄A6が上半分に表示され、その下側に先々月における関連データを用いて生成された決定木を表示した決定木欄A7及びその決定木から抽出された決まり事を表示したif−thenルール欄A8表示されている。決定木、決まり事及び有意度は、上側(先月分)と下側(先々月分)とで互いに異なる部分、すなわち変化部分に下線が引かれている。このように、出力手段105は、下線が引かれていない維持部分に比べて下線が引かれた変化部分が認識されやすいようにした態様の画像を表す画像データを出力している。これにより、このような画像データが出力されない場合に比べて、変化部分が維持部分よりも認識されやすいようになり、利用者が第1の時期から第2の時期にかけて変化した変化部分を把握しやすいようにすることができる。
[2-2] Overview of Second Embodiment FIG. 12 is a diagram illustrating an example of output image data. In this example, a decision tree column A5 displaying a decision tree generated using related data in the previous month and an if-then rule column A6 displaying rules extracted from the decision tree are displayed in the upper half. On the lower side, a decision tree column A7 displaying the decision tree generated using the related data in the previous month and an if-then rule column A8 displaying the rules extracted from the decision tree are displayed. The decision trees, rules, and significance levels are underlined in different portions, that is, changed portions on the upper side (last month) and the lower side (last month). As described above, the output unit 105 outputs image data representing an image in a mode in which the underlined change portion is more easily recognized than the maintenance portion that is not underlined. As a result, compared with the case where such image data is not output, the changed portion is more easily recognized than the maintained portion, and the user can grasp the changed portion that has changed from the first period to the second period. It can be easy.

また、図12の例では、先月と先々月とで葉の数は6つと同じであるが、分岐条件が一部異なっている。例えば先々月の決定木には「敗血症=なし」、「熱傷の程度=31−59」及び「年齢分類=10未満」という分岐条件が表されているが、先月の決定木には表されておらず、代わりに先々月の決定木に表されていなかった「敗血症=なし」及び「熱傷の程度=11−30」という分岐条件が表されている。この例では、これらの一方の決定木にのみ表されている分岐条件の行が、他方の決定木でも同じ行だけ空けて表されている。   In the example of FIG. 12, the number of leaves is the same as 6 in the last month and the month before, but the branching conditions are partially different. For example, the decision tree of last month shows the branching conditions of “sepsis = none”, “degree of burn = 31-59” and “age classification = less than 10”, but it is shown in the decision tree of last month. Instead, the branching conditions “sepsis = none” and “degree of burn = 11-30”, which were not shown in the decision tree of the previous month, are shown. In this example, the branch condition rows that are represented only in one of these decision trees are represented by the same row in the other decision tree.

このため、例えば「敗血症=有り」で「気道熱傷=なし」という分岐条件を満たす「生存」という葉、すなわち目的因子については、どちらの月の決定木でもルート(「***決定木:先月(または先々月)***」という文字列が表された行)から数えて9行目の並びに表されている。このように、出力手段105は、第1及び第2の時期において、共通の分岐条件を満たす共通の目的因子がある場合には、決定木のルートからの距離が同じ並びにその共通の目的因子を表す画像データを出力する。このような決定木を示す画像データが出力されることで、共通の目的因子をルートからの距離が異なる並びに表す場合に比べて、第1及び第2の時期における関連データを用いてそれぞれ生成された決定木同士を比較しやすくすることができる。   For this reason, for example, the leaf “survival” that satisfies the branch condition “sepsis = yes” and “airway burn = none”, that is, the objective factor is the root (“*** decision tree: last month” (Or the month before)) The 9th row is counted from the row where the character string “***” is represented). As described above, when there is a common objective factor that satisfies the common branch condition in the first and second periods, the output unit 105 has the same distance from the root of the decision tree and the common objective factor. Output the image data to represent. By outputting the image data indicating such a decision tree, it is generated using the related data in the first and second periods, respectively, as compared with the case where the common objective factors are expressed in different distances from the root. This makes it easier to compare the decision trees.

また、図12の例では、分岐条件及び目的因子が共通する決まり事については共通する符号を付して表されている。例えば、「敗血症=なし」及び「熱傷の程度=10以下」という分岐条件及び「生存」という葉で表された決まり事には「A」という符号が付され、「敗血症=なし」及び「熱傷の程度=11−30」という分岐条件及び「生存」という葉で表された決まり事には「B」という符号が付され、「敗血症=なし」、「熱傷の程度=31−59」及び「年齢分類=10−40」という分岐条件及び「生存」という葉で表された決まり事には「C」という符号が付されている。このように、出力手段105は、第1及び第2の時期において、共通の分岐条件を満たす場合に共通の目的因子が得られるという共通の決まり事がある場合には、それらの共通の決まり事に共通の符号を付して表す画像データを出力する。このような決まり事を示す画像データが出力されることで、これらの共通の決まり事に共通の符号を付さない場合に比べて、第1及び第2の時期における決まり事及び有意度同士を比較しやすくすることができる。   Moreover, in the example of FIG. 12, the common code | symbol is attached | subjected and represented about the rule in which a branch condition and an objective factor are common. For example, a branching condition of “sepsis = none” and “degree of burn = 10 or less” and a rule represented by a leaf of “survival” are marked with “A”, and “sepsis = none” and “burn” The rule represented by the branch condition of “degree of degree = 11-30” and the leaf of “survival” is labeled “B”, and “sepsis = none”, “degree of burn = 31-59” and “ A branching condition “age classification = 10−40” and a rule represented by a leaf “survival” are labeled with “C”. As described above, when there is a common rule that the common objective factor can be obtained when the common branch condition is satisfied in the first and second periods, the output unit 105 determines the common rule. Image data represented by a common reference numeral is output. By outputting image data indicating such a rule, the rule and significance in the first and second periods can be compared with the case where these common rules are not assigned a common sign. It can be made easier to compare.

また、if−thenルール欄A8では、「B」という符号が付された決まり事B及びその有意度が表示されていない代わりに、その分の行を空けて表示されている。このため、「A」という符号が付された決まり事Aと「C」という符号が付された決まり事Cは、先月と先々月のどちらにおいても、同じ行数だけ離れて表されていることになる。具体的には、決まり事B及びその有意度が2行で表され、その上下が1行ずつ空いているため、決まり事A及びCはどちらの月でもそれらの行の合計である4行離れて表されている。このように、出力手段105は、第1及び第2の時期に共通する決まり事が複数ある場合には、第1の共通の決まり事(上記例では決まり事A)と第2の共通の決まり事(同じく決まり事C)とを、第1及び第2の時期のいずれにおいても同じ並びの数(上記例では4行)だけ離して表す画像データを出力する。これにより、共通の符号が付された決まり事同士を異なる並びの数だけ離して表す場合に比べて、第1及び第2の時期における決まり事及び有意度同士を比較しやすくすることができる。   In addition, in the if-then rule column A8, the rule B with the sign “B” and its significance are not displayed, but the corresponding lines are displayed with a space. For this reason, the rule A with the sign “A” and the rule C with the sign “C” are separated by the same number of rows in both the last month and the last month. become. Specifically, rule B and its significance are represented by two lines, and the top and bottom are vacant one by one, so rule A and C are 4 lines apart, which is the sum of those lines in both months It is expressed. As described above, when there are a plurality of rules common to the first and second periods, the output unit 105 determines that the first common rule (Rule A in the above example) and the second common rule. The image data expressing the thing (same rule C) is separated by the same number of rows (four lines in the above example) in both the first and second periods. Thereby, it is possible to make it easier to compare the rules and the significance levels in the first and second periods as compared with the case where the rules having the common signs are separated from each other by the number of different sequences.

[2−3]第2実施形態の他の例
なお、出力手段105は、図12に示すものとは異なる態様の画像を示す画像データを出力してもよい。例えば、出力手段105は、変化部分に比べて維持部分が認識されやすいようにした態様の画像を表す画像データを出力してもよい。
図13は、出力される画像データの他の一例を示す図である。この例では、図12の例と反対に、維持部分に下線が引かれ、変化部分には下線が引かれていない。これにより、図12に示すような画像を示す画像データが出力されない場合に比べて、変化部分よりも維持部分が認識されやすいようになり、利用者が第1の時期から第2の時期にかけて変化していない維持部分を把握しやすいようにすることができる。以上のとおり、出力手段105は、維持部分及び変化部分を異なる態様の画像で表す画像データを出力するものであればよい。これにより、そのような画像データが出力されない場合に比べて、維持部分及び変化部分のうち利用者が着目した方を把握しやすいようにすることができる。
[2-3] Another Example of Second Embodiment Note that the output unit 105 may output image data indicating an image having a mode different from that shown in FIG. For example, the output unit 105 may output image data representing an image in a mode in which the maintenance part is more easily recognized than the change part.
FIG. 13 is a diagram illustrating another example of output image data. In this example, contrary to the example of FIG. 12, the maintenance part is underlined and the change part is not underlined. As a result, compared to the case where image data indicating an image as shown in FIG. 12 is not output, the maintenance part is more easily recognized than the change part, and the user changes from the first period to the second period. It is possible to make it easier to grasp the maintenance parts that are not. As described above, the output unit 105 only needs to output image data representing the maintenance part and the change part with images of different modes. Thereby, compared with the case where such image data is not output, it is possible to make it easier to grasp which of the maintenance part and the change part the user has focused on.

なお、出力手段105は、図12及び図13に示す例では、下線を引くことで変化部分及び維持部分の一方を他方に比べて認識しやすくしたが、これに限らない。例えば、文字を拡大したり、文字の色や太さを変えたりすることで認識しやすくしてもよい。また、文字を点滅させたりアニメーションさせたりすることで認識しやすくしてもよい。要するに、出力手段105は、変化部分及び維持部分の態様を異ならせることで、一方を他方に比べて認識しやすくすればよい。   In the example shown in FIGS. 12 and 13, the output unit 105 makes it easier to recognize one of the changed portion and the maintained portion than the other by drawing an underline. However, the present invention is not limited to this. For example, the character may be easily recognized by enlarging the character or changing the color or thickness of the character. Moreover, you may make it easy to recognize by blinking a character or making it animation. In short, the output unit 105 may make it easier to recognize one than the other by changing the modes of the change part and the maintenance part.

また、取得手段101は、上記のように2つの時期における関連データだけでなく、3つ以上の時期における関連データを取得してもよい。その場合、生成手段102は、取得された各時期における決定木を生成し、抽出手段103は、生成された決定木のそれぞれから決まり事を抽出する。また、算出手段104は、抽出された各決まり事について有意度を算出する。出力手段105は、例えば、前後に連続する時期における維持部分及び変化部分を異なる態様の画像で表す画像データを出力する。この場合、出力手段105は、前後に連続する時期をそれぞれ第1及び第2の時期として出力を行う。また、出力手段105は、最新の時期とそれ以前の時期とを比較した場合の維持部分及び変化部分を異なる態様の画像で表す画像データを出力してもよい。この場合、出力手段105は、最新の時期を第2の時期とし、それ以前の時期をそれぞれ第1の時期として出力を行う。このように比較する時期が増えるほど、例えば決まり事のうち維持されるものと変化するものとの傾向を把握しやすくなる。   Further, the acquisition unit 101 may acquire not only related data at two periods as described above but also related data at three or more periods. In that case, the generation unit 102 generates a decision tree at each acquired time, and the extraction unit 103 extracts a rule from each of the generated decision trees. Further, the calculation unit 104 calculates the significance for each extracted rule. The output unit 105 outputs, for example, image data representing a maintenance part and a change part at different times before and after in different images. In this case, the output unit 105 performs output using the first and second timings as successive timings. Further, the output unit 105 may output image data representing the maintenance part and the change part when the latest time and the previous time are compared with different images. In this case, the output unit 105 performs output with the latest time as the second time and the previous time as the first time. As the time for comparison increases in this way, for example, it becomes easier to grasp the tendency between what is maintained and what is changed.

[3]変形例
上述した各実施形態は、各々が本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、上述した各実施形態及び以下に示す各変形例は、必要に応じてそれぞれ組み合わせて実施してもよい。
[3] Modified Examples Each of the above-described embodiments is merely an example of the embodiment of the present invention, and may be modified as follows. Moreover, you may implement each embodiment mentioned above and each modification shown below, combining each as needed.

[3−1]対象及び関連データ
上記の各実施形態では、患者を対象として患者に関するデータが関連データとして用いられたが、これに限らない。例えば、対象を交通機関の乗客として関連データを乗車する日時や乗車距離、経路、乗車時の天気などとしてもよい。また、対象を商品として関連データを売上げや販売地域、販売価格、店舗周辺の環境などとしてもよい。要するに、決定木を生成するだけの有意性が表されるデータであれば、どのような対象の関連データが用いられてもよい。
[3-1] Target and related data In each of the above embodiments, data related to a patient is used as related data for the patient, but the present invention is not limited to this. For example, it is good also as the date and time, boarding distance, route | route, the weather at the time of boarding, etc. which board relevant data for the passenger of a transportation system. In addition, the related data may be sales, sales area, sales price, environment around the store, etc. with the target as a product. In short, any target related data may be used as long as the data represents the significance sufficient to generate a decision tree.

[3−2]抽出手段
抽出手段103は、上記の各実施形態では、決定木の葉の数だけ決まり事を抽出したが、これに限らない。抽出手段103は、例えば、分岐条件のうち一方が他方の必要条件になっているものがあれば、それらをまとめて簡素化してもよい。例えば、年齢分類として「10才未満」及び「20才未満」という第1の事項のデータが用いられており、分岐条件として「敗血症=なし」及び「10才未満」という分岐条件で「生存」という結論を得る決まり事Xと、「敗血症=なし」及び「20才未満」という分岐条件で「生存」という結論を得る決まり事Yとが抽出された場合、決まり事Xの分岐条件は決まり事Yの分岐条件の必要条件となっている。この場合、抽出手段103は、決まり事Xを決まり事Yにまとめて簡素化した1つの決まり事だけを抽出してもよい。
[3-2] Extraction Unit Although the extraction unit 103 has extracted the rules as many as the number of leaves of the decision tree in each of the above embodiments, the present invention is not limited to this. For example, if there is a branching condition in which one of the branching conditions is the other necessary condition, the extracting unit 103 may simplify them. For example, data of the first item of “under 10 years old” and “under 20 years old” is used as the age classification, and “survival” is performed under the branching conditions of “sepsis = none” and “under 10 years old” as the branching conditions. When the rule X that obtains the conclusion is extracted, and the rule Y that obtains the conclusion of “survival” under the branch condition of “sepsis = none” and “under 20 years old” is extracted, the branch condition of the rule X is determined This is a necessary condition for the branch condition of Y. In this case, the extraction unit 103 may extract only one rule that is simplified by combining the rule X with the rule Y.

なお、抽出手段103は、決まり事X及びYにおいて、分岐条件を満たす対象数が同じであり、且つ、同じ確率で「生存」という結論が得られる場合にのみ、上記のように簡素化した決まり事を抽出してもよい。これはつまり、決まり事X及びYにおける図8等に示す「○−>□」という数値が一致しているということである。また、この場合は、抽出手段103は、決まり事Xを決まり事Yにまとめるだけでなく、決まり事Yを決まり事Xにまとめてもよい。   Note that the extraction unit 103 determines the simplified rule as described above only when the number of objects satisfying the branch condition is the same in the rules X and Y and the conclusion “survival” is obtained with the same probability. You may extract things. This means that the numerical values “◯-> □” shown in FIG. Further, in this case, the extraction unit 103 may combine not only the rule X into the rule Y but also the rule Y into the rule X.

[3−3]算出手段
算出手段104は、上記以外の有意度を算出してもよい。算出手段104は、例えば、p値の算出に用いたカイ二乗値X2 0を有意度として算出してもよい。この場合、カイ二乗値X2 0が自由度1、棄却値0.05のカイ二乗分布表の値(=3.84)よりも大きければ、帰無仮説が棄却されるので、統計的に有意な関連性があるといえる。他にも、抽出手段103により抽出された決まり事の有意さの度合いを表すものであれば、どのような値が有意度として算出されてもよい。
[3-3] Calculation unit The calculation unit 104 may calculate significance other than the above. For example, the calculating unit 104 may calculate the chi-square value X 2 0 used for calculating the p value as the significance level. In this case, if the chi-square value X 2 0 is larger than the value (= 3.84) of the chi-square distribution table having a degree of freedom of 1 and a rejection value of 0.05 (= 3.84), the null hypothesis is rejected, so that it is statistically significant. It can be said that there is a relevance. In addition, any value may be calculated as the significance as long as it represents the level of significance of the rules extracted by the extraction unit 103.

[3−4]場所画像の出力先
出力手段105は、上述した各実施形態では、クライアント装置5に対して一覧データを出力したが、これに限らず、例えば、情報処理装置10が表示装置を備えている場合に、その表示装置に一覧データを出力してもよい。また、出力手段105は、利用者が電子メールを利用している場合に、その電子メールのアドレスに対して一覧データを出力してもよい。いずれの宛先に一覧データが出力された場合でも、出力された一覧データが示す一覧を利用者が閲覧することができるようになっているとよい。
[3-4] Location Image Output Destination The output unit 105 outputs the list data to the client device 5 in each embodiment described above. However, the present invention is not limited to this. If provided, the list data may be output to the display device. Further, when the user uses an electronic mail, the output unit 105 may output list data for the address of the electronic mail. Even if the list data is output to any destination, it is preferable that the user can browse the list indicated by the output list data.

[3−5]文字列の向き
出力手段105は、図8等の例では、決定木、決まり事及び有意度を横書きで示した一覧データを出力したが、これに限らず、縦書きで示したものを出力してもよい。また、出力手段105は、決定木の各枝や各葉を画像を用いて表したり、各枝が枝分かれする様子をより視覚的に表す一覧データを出力してもよい。
[3-5] Character String Direction In the example of FIG. 8 or the like, the output unit 105 outputs the list data in which the decision tree, the rule, and the significance are shown in horizontal writing, but not limited thereto, it is shown in vertical writing. May be output. The output unit 105 may output each branch and each leaf of the decision tree using an image, or may output list data that more visually represents how each branch branches.

[3−6]発明のカテゴリ
本発明は、情報処理装置及び情報処理装置を備える情報提供システムの他にも、情報処理装置が実施する処理を実現するための情報処理方法としても捉えられるものである。ここでいう処理とは、例えば、図9及び図10に示す分析支援処理(取得処理及び出力処理)である。また、本発明は、情報処理装置のようなコンピュータを、図3に示す各手段として機能させるためのプログラムとしても捉えられるものである。このプログラムは、それを記憶させた光ディスク等の記録媒体という形態での提供や、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、それをインストールして利用可能にするという形態での提供などがされるものであってもよい。
[3-6] Category of Invention In addition to the information processing apparatus and the information providing system including the information processing apparatus, the present invention can also be understood as an information processing method for realizing processing performed by the information processing apparatus. is there. The processing here is, for example, the analysis support processing (acquisition processing and output processing) shown in FIGS. 9 and 10. The present invention can also be understood as a program for causing a computer such as an information processing apparatus to function as each unit shown in FIG. This program can be provided in the form of a recording medium such as an optical disk in which it is stored, or provided in the form of being downloaded to a computer via a network such as the Internet, and making it available for installation. It may be done.

1…情報提供システム、2…ネットワーク、4…サーバ装置、5…クライアント装置、10…情報処理装置、11…制御部、12…記憶部、13…通信部、101…取得手段、102…生成手段、103…抽出手段、104…算出手段、105…出力手段。 DESCRIPTION OF SYMBOLS 1 ... Information provision system, 2 ... Network, 4 ... Server apparatus, 5 ... Client apparatus, 10 ... Information processing apparatus, 11 ... Control part, 12 ... Memory | storage part, 13 ... Communication part, 101 ... Acquisition means, 102 ... Generation means , 103 ... extraction means, 104 ... calculation means, 105 ... output means.

Claims (8)

複数の対象の各々に関する複数の事項のデータを取得する取得手段と、
前記取得手段により取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成手段と、
前記生成手段により生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出手段と、
前記取得手段により取得されたデータから、前記抽出手段により抽出された決まり事の有意さの度合いを表す有意度を算出する算出手段と、
前記生成手段により生成された決定木と、前記抽出手段により抽出された決まり事と、前記算出手段により算出された有意度との一覧を示す一覧データを出力する出力手段と
を備える情報処理装置。
An acquisition means for acquiring data of a plurality of items related to each of a plurality of objects;
Generating means for generating, from the data acquired by the acquiring means, a decision tree representing data of the second item of the target predicted when the data of the first item of the target satisfies a condition;
Extraction means for extracting a rule that the data of the second item is obtained when the data of the first item satisfies the condition from the decision tree generated by the generation unit;
A calculating means for calculating a significance level representing the degree of significance of the rules extracted by the extracting means from the data acquired by the acquiring means;
An information processing apparatus comprising: a decision tree generated by the generation unit; an output unit that outputs list data indicating a list of the rules extracted by the extraction unit and the significance calculated by the calculation unit.
前記取得手段は、第1の時期及び当該第1の時期よりもあとの第2の時期における前記複数の事項のデータを取得し、
前記生成手段は、前記取得手段により取得された前記第1及び第2の時期における前記複数の事項のデータから前記決定木をそれぞれ生成し、
前記抽出手段は、前記第1及び第2の時期のそれぞれについて前記決まり事を抽出し、
前記出力手段は、生成された前記決定木または抽出された前記決まり事のうち、前記第1の時期から前記第2の時期にかけて維持されている維持部分と変化した変化部分とを異なる態様の画像で表す画像データを、前記一覧データとして出力する
請求項1に記載の情報処理装置。
The acquisition means acquires data of the plurality of items in a first period and a second period after the first period,
The generating means generates the decision trees from the data of the plurality of matters at the first and second times acquired by the acquiring means,
The extraction means extracts the rules for each of the first and second periods;
The output means has an image of a mode in which a maintenance portion maintained from the first time to the second time and a changed changed portion of the generated decision tree or the extracted rules are different. The information processing apparatus according to claim 1, wherein image data represented by is output as the list data.
前記出力手段は、前記維持部分に比べて前記変化部分が認識されやすいようにした前記態様の画像を表す前記画像データを出力する
請求項2に記載の情報処理装置。
The information processing apparatus according to claim 2, wherein the output unit outputs the image data representing an image of the aspect in which the change portion is more easily recognized than the maintenance portion.
前記出力手段は、前記決定木において前記第2の事項のデータが複数ある場合には当該データをそれぞれ異なる並びに表し、且つ、前記第1及び第2の時期において、共通の前記条件を満たす共通の前記第2の事項のデータがある場合には、前記決定木のルートからの距離が同じ並びに当該共通の第2の事項のデータを表す前記画像データを出力する
請求項2または3に記載の情報処理装置。
When there are a plurality of data of the second matter in the decision tree, the output means represents the data differently, and in the first and second periods, the output means 4. The information according to claim 2, wherein when there is data of the second item, the image data representing the data of the common second item having the same distance from the root of the decision tree is output. 5. Processing equipment.
前記出力手段は、前記決まり事が複数ある場合には当該決まり事をそれぞれ異なる並びに表し、且つ、前記第1及び第2の時期において、共通の前記条件を満たす場合に共通の前記第2の事項のデータが得られるという共通の前記決まり事がある場合には、当該共通の決まり事に共通の符号を付して表す前記画像データを出力する
請求項2から4までのいずれか1項に記載の情報処理装置。
When there are a plurality of rules, the output means represents the rules different from each other, and the second item is common when the common conditions are satisfied in the first and second periods. 5. When there is a common rule that data of the above can be obtained, the image data that represents the common rule with a common code is output. 5. Information processing device.
前記出力手段は、前記共通の決まり事が複数ある場合には、第1の前記共通の決まり事と第2の前記共通の決まり事とを、前記第1及び第2の時期のいずれにおいても同じ並びの数だけ離して表す画像データを出力する
請求項5に記載の情報処理装置。
In the case where there are a plurality of the common rules, the output means has the same first common rule and the second common rule in both the first time period and the second time period. The information processing apparatus according to claim 5, wherein image data that is separated by the number of lines is output.
前記算出手段は、抽出された前記決まり事のp値(probability value)を前記有意度として算出する
請求項1から6までのいずれか1項に記載の情報処理装置。
The information processing apparatus according to any one of claims 1 to 6, wherein the calculation unit calculates a p value (probability value) of the extracted rule as the significance.
コンピュータに、
複数の対象の各々に関する複数の事項のデータを取得する取得ステップと、
前記取得ステップにおいて取得されたデータから、前記対象の第1の事項のデータが条件を満たす場合に予測される当該対象の第2の事項のデータを表した決定木を生成する生成ステップと、
前記生成ステップにおいて生成された決定木から、前記第1の事項のデータが前記条件を満たす場合に前記第2の事項のデータが得られるという決まり事を抽出する抽出ステップと、
前記取得ステップにおいて取得されたデータから、前記抽出ステップにおいて抽出された決まり事の有意さの度合いを表す有意度を算出する算出ステップと、
前記生成ステップにおいて生成された決定木と、前記抽出ステップにおいて抽出された決まり事と、前記算出ステップにおいて算出された有意度との一覧を示す一覧データを出力する出力ステップ手段と
を実行させるためのプログラム。
On the computer,
An acquisition step of acquiring data of a plurality of items related to each of a plurality of objects;
A generation step for generating a decision tree representing data of the second item of the target predicted when the data of the first item of the target satisfies a condition from the data acquired in the acquisition step;
An extraction step for extracting from the decision tree generated in the generation step a rule that the data of the second item is obtained when the data of the first item satisfies the condition;
A calculation step for calculating a significance level representing the degree of significance of the rules extracted in the extraction step from the data acquired in the acquisition step;
An output step means for outputting list data indicating a list of the decision tree generated in the generation step, the rules extracted in the extraction step, and the significance calculated in the calculation step; program.
JP2013260489A 2013-12-17 2013-12-17 Information processing apparatus and program Active JP6184857B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013260489A JP6184857B2 (en) 2013-12-17 2013-12-17 Information processing apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013260489A JP6184857B2 (en) 2013-12-17 2013-12-17 Information processing apparatus and program

Publications (2)

Publication Number Publication Date
JP2015118466A true JP2015118466A (en) 2015-06-25
JP6184857B2 JP6184857B2 (en) 2017-08-23

Family

ID=53531151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013260489A Active JP6184857B2 (en) 2013-12-17 2013-12-17 Information processing apparatus and program

Country Status (1)

Country Link
JP (1) JP6184857B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019212278A (en) * 2018-05-31 2019-12-12 富士通株式会社 Accessible machine learning
CN110955855A (en) * 2018-09-27 2020-04-03 华为终端有限公司 Information interception method, device and terminal
JP2020126330A (en) * 2019-02-01 2020-08-20 株式会社オービック Pattern registration work supporting device, pattern registration work supporting method, and pattern registration work supporting program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022776A (en) * 1999-07-09 2001-01-26 Hitachi Ltd Rule generation result report system
JP2006227942A (en) * 2005-02-17 2006-08-31 Rumiko Matsuoka Extraction system of combination set of clinical test data, determination system of neoplasm progress using the same and clinical diagnosis support system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022776A (en) * 1999-07-09 2001-01-26 Hitachi Ltd Rule generation result report system
JP2006227942A (en) * 2005-02-17 2006-08-31 Rumiko Matsuoka Extraction system of combination set of clinical test data, determination system of neoplasm progress using the same and clinical diagnosis support system

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019212278A (en) * 2018-05-31 2019-12-12 富士通株式会社 Accessible machine learning
JP7215183B2 (en) 2018-05-31 2023-01-31 富士通株式会社 Accessible machine learning
CN110955855A (en) * 2018-09-27 2020-04-03 华为终端有限公司 Information interception method, device and terminal
CN110955855B (en) * 2018-09-27 2023-06-02 花瓣云科技有限公司 Information interception method, device and terminal
JP2020126330A (en) * 2019-02-01 2020-08-20 株式会社オービック Pattern registration work supporting device, pattern registration work supporting method, and pattern registration work supporting program
JP7158302B2 (en) 2019-02-01 2022-10-21 株式会社オービック PATTERN REGISTRATION SUPPORT DEVICE, PATTERN REGISTRATION SUPPORT METHOD AND PATTERN REGISTRATION SUPPORT PROGRAM

Also Published As

Publication number Publication date
JP6184857B2 (en) 2017-08-23

Similar Documents

Publication Publication Date Title
Wiens et al. Learning data-driven patient risk stratification models for Clostridium difficile
JP4890806B2 (en) Prediction program and prediction device
JP6464612B2 (en) Data analysis device, data analysis system, sales prediction device, sales prediction system, data analysis method, sales prediction method, program and recording medium
CN103080971A (en) Medical information system and medical information display device
JP6184857B2 (en) Information processing apparatus and program
JP6218151B2 (en) Shipping work support method, shipping work support device, and shipping work support program
US9576304B2 (en) Evaluation information identifying device, evaluation information identifying method, evaluation information identifying program, and computer readable recording medium for recording the program
US20170308825A1 (en) Priority order determination system, method, and program for explanatory variable display
JP2006039650A (en) Response priority order determination device and method therefor
CN109616165A (en) Medical information methods of exhibiting and device
JP2016192013A (en) Sales representative candidate extraction system
JPWO2021015265A5 (en)
JP7046499B2 (en) Medical information processing equipment and medical information processing method
JP2017021641A (en) Medical system and program
JP6005482B2 (en) Server apparatus, analysis method, and program
JP2020106882A (en) Insurance design support system and insurance design support method
Li et al. InterVA4: An R package to analyze verbal autopsy data
JP5417930B2 (en) Electronic medical record input support program, electronic medical record input support method, and electronic medical record input support device
JP2014191466A (en) Training scenario creation system, training scenario creation method, and program
JP2013061721A (en) Insurance contract support system, insurance contract support method, and insurance contract support web server
JP2011113428A (en) Medical information processing apparatus and program
US20160224912A1 (en) Information processing apparatus, and non-transitory recording medium
JP2020201577A (en) Information processing program, information processing method, and information processor
JP6322895B2 (en) Explanation item management program, explanation item management device, explanation item management method
JP2016095654A (en) Accounting data display method, accounting data display program, and accounting data display device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160623

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170726

R150 Certificate of patent or registration of utility model

Ref document number: 6184857

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250