WO2017145517A1

WO2017145517A1 - 情報処理装置と情報処理プログラム並びに情報処理方法

Info

Publication number: WO2017145517A1
Application number: PCT/JP2016/088734
Authority: WO
Inventors: 浜本義彦; 荻原宏是; 飯塚徳男; 爲佐卓夫; 岡正朗
Original assignee: 国立大学法人山口大学
Priority date: 2016-02-26
Filing date: 2016-12-26
Publication date: 2017-08-31
Also published as: US11461598B2; JP2017151868A; US20210182630A1; JP6041331B1

Abstract

定性的な非数値データを含む過去の統計情報に基づいて、論理的に予測を支援することができる情報処理装置を得る。　入力データに対応する判定対象が特定分類に属するか否かを判定する情報処理装置であって、複数の指標のそれぞれは複数の区分を含み、判定対象に対応する入力データと複数の見本対象のそれぞれに対応する複数の見本データとが記憶される記憶部と、判定対象が特定分類に属するか否かを決定する分類判定部と、を有してなり、分類判定部は、見本データの指標情報と分類情報とを用いて複数の分類ごとに集計された指標ごとの各区分に属する見本データの数に基づいて、特定分類が生起したときの指標の区分ごとの第１条件付確率と非特定分類が生起したときの指標の区分ごとの第２条件付確率とを算出し、入力データの指標情報と第１条件付確率と第２条件付確率とに基づいて判定対象が特定分類に属するか否かを決定することを特徴とする。

Description

情報処理装置と情報処理プログラム並びに情報処理方法

　本発明は、複数の事象の中から特定の事象が生じるか否かの予測を支援する情報処理装置と情報処理プログラム並びに情報処理方法に関するものである。

　認識対象が、複数の事象の中のいずれの事象に該当するかを予測する手法の一つとして、Bayes識別則を用いた統計的パターン認識が知られている。パターン認識とは、認識対象からの観測データを認識対象のパターンとして捉えて、そのパターンが属すべきクラスに対応づける情報処理である。統計的パターン認識においては、認識対象の個々のパターンではなく、パターンのなす分布の統計的構造に着目される。
　パターン認識が活用される分野には、例えば、臨床現場がある。すなわち、患者の検査データをパターンとして捉えて、そのパターンが属する診断結果のクラス（患者が特定の疾患状態にあるか否か、あるいは、治療を受けた患者に特定の疾患が再発するか否か、など）を対応づける。
　これまでにも、Bayes識別則を用いた統計的パターン認識を用いて患者が特定の疾患状態にあるか否かを判定することが提案されている（例えば、特許文献１参照）。しかし、特許文献１に開示されている手法で用いられる患者の検査データは、定量的な数値データのみである。すなわち、特許文献１の手法は、定性的な非数値データを取り扱うことができない。

　これに対して、統計的パターン認識とは別に、定性的な非数値データを含む患者の検査データをもとに、肝臓の状態をスコア式として表すことが提案されている（例えば、非特許文献１，２，３，４参照）。例えば、ＴＮＭ分類では、対象となる癌に対して、３つのマーカーＴ因子、Ｎ因子、Ｍ因子が用いられる。Ｔ因子では癌腫の「個数」「大きさ」「脈管侵襲」からスコア値が定まり、Ｎ因子では「リンパ節転移あり」「リンパ節転移なし」でスコア値が決まり、Ｍ因子では「遠隔転移あり」「遠隔転移なし」でスコア値が決まる。そして、各因子のスコア値を加算して総和をとり、所定のカットオフ値と比較して診断をする。ここで、Ｎ因子やＭ因子におけるスコア値は、非数値データ（例えば、「リンパ節転移あり」「リンパ節転移なし」）を単純にしきい値処理して予め決められた数値データに置き換えたものである。つまり、スコア値は、いわゆるダミー変数であって、その数値自体に意味はなく、過去の統計情報に基づいて定まるものではない。そのため、各因子のスコア値を加算して得られる総和そのものも、過去の統計情報に基づくものではない。

　なお、臨床現場において、例えば、肝癌の難治性はその再発の可能性の高さにある。すなわち、たとえ全ての癌が手術により完全に摘出されたとしても、手術から１年後には約３０％の確率で癌が再発する。癌が完全に摘出された手術後は、癌をＣＴ（Computed Tomography）や超音波検査その他の検査で視認することができない。したがって、手術後の患者に対して、再発の可能性が不明のまま、癌の再発を防止するために、抗がん剤の投与や各種検査が実施される。そのため、患者の肉体的・精神的・経済的な負担は大きい。換言すれば、癌の再発を精度よく予測することができれば、患者の負担を軽減することができる。
　しかし、いずれのスコア式も臨床現場の要求に応えることができていない。その原因は、スコア式で用いられる個々のマーカーが再発予測の決め手ではないだけでなく、スコア式で用いられるマーカーの組も医師による試行錯誤の末に得られたものであって、その最適性の論理的な保証はない。また、スコア式で用いられるマーカーは、スコア式ごとに予め決まっている。そのため、スコア式で用いられるマーカーのデータに欠損があれば、そのスコア式を用いることができない。

　不完全なスコア式の予測の性能を向上させる方法として、最先端の分子生命科学によって発見された癌と関連のある遺伝子変異などの分子標的マーカーを用いることが考えられる。しかし、これらの分子標的マーカーの多くは、いわゆる保険適用の対象ではない。保険適用には、治験による薬事法の承認が必要である。そのため、分子標的マーカーが患者に適用されるまでには、膨大な研究費と相当の時間とを要する。

　このように、臨床現場においては、ある疾患の手術（治療）を受けた患者に同疾患が再発するか否かを予測する場合に、予測に必要なマーカーを論理的に特定することや、すでに検査済の患者の検査データから論理的に予測することが望まれている。

特表２０１３－５３２２９５号公報 TATEISHI R, Yoshida H, SHIINA S, et al: Proposal of a New Prognostic Model for Hepatocellular Carcinoma-an Analysis of 403 Patients. Gut 54: 419-425, 2005. IKAI H, TAKAYASU K, OMATA M, et al: A modified Japan Integrated Stage Score for Prognostic Assessment in Patients with Hepatocellular Carcinoma. J Gastroenterology, 41, 884-892, 2006. M. MINAGAWA, I. IKAI, Y. Matsuyama, Y. Yamaoka, M. MAKUUCHI, Staging of Hepatocellular Carcinoma Assessment of the Japanese TNM and AJCC/UICC TNM Systems in a Cohort of 13,772 Patients in Japan, Annals of Surgery, Vol. 245, No.6, pp. 909-922, June 2007. JM HENDERSON, M. SHERMAN, A. TAVILL, M. ABECASSIS, G. CHEJFEC, and T. GRAMLICH, AHPBA/AJCC Consensus Conference on Staging of Hepatocellular Carcinoma: Consensus Statement, HPB, Vol. 5, No.4, pp. 243-250, 2003.

　本発明は、以上のような従来技術の問題点を解消するためになされたもので、定性的な非数値データを含む過去の統計情報に基づいて、論理的に特定の事象の発生の予測を支援することができる情報処理装置と情報処理プログラム並びに情報処理方法を提供することを目的とする。

　本発明は、入力データに対応する判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標に基づいて判定する情報処理装置であって、複数の指標のそれぞれは、複数の区分を含み、判定対象に対応する入力データと、複数の見本対象のそれぞれに対応する複数の見本データと、が記憶される記憶部と、入力データが該当する指標ごとの区分に基づいて、判定対象が特定分類に属するか否かを決定する分類判定部と、を有してなり、入力データは、入力データが該当する複数の指標ごとの区分を示す指標情報、を含み、見本データは、見本データが該当する複数の指標ごとの区分を示す指標情報と、見本対象が特定分類に属するか否かを示す分類情報と、を含み、分類判定部は、見本データの指標情報と見本データの分類情報とを用いて複数の分類ごとに集計された指標ごとの各区分に属する見本データの数に基づいて、特定分類が生起したときの指標の区分ごとの第１条件付確率と、複数の分類のうち特定分類ではない非特定分類が生起したときの指標の区分ごとの第２条件付確率と、を算出し、入力データの指標情報と、第１条件付確率と、第２条件付確率と、に基づいて、判定対象が特定分類に属するか否かを決定する、ことを特徴とする。

　本発明によれば、定性的な非数値データを含む過去の統計情報に基づいて、論理的に特定の事象の発生の予測を支援することができる。

本発明にかかる情報処理装置の実施の形態を示すブロック図である。図１の情報処理装置に記憶される見本データの例を示す模式図である。図１の情報処理装置に記憶される見本データの分類情報の例を示す模式図である。図１の情報処理装置に記憶される見本データの指標情報の例を示す模式図である。図１の情報処理装置に記憶される見本データから抽出された訓練データの指標ごとの区分に属するデータ数の例を示す模式図である。本発明にかかる情報処理方法の例を示すフローチャートである。図６の情報処理方法における指標の選択処理の例を示すフローチャートである。図１の情報処理装置に記憶される見本データから抽出された評価データの指標ごとに該当する区分と分類情報と推定情報と判定情報との関係を示す模式図である。図６の情報処理方法における入力データの分類判定処理の例を示すフローチャートである。図１の情報処理装置が決定した選択指標が表示された画面の例を示す模式図である。図１の情報処理装置が決定した選択指標が表示された別の画面の例を示す模式図である。図１の情報処理装置が決定した選択指標が表示された別の画面の例を示す模式図である。

　以下、図面を参照しながら、本発明にかかる情報処理装置と情報処理プログラム並びに情報処理方法の実施の形態について説明する。

　本発明は、過去の実績を示す見本データから定まる評価値を用いて、数学的基盤の明確な統計的パターン認識理論に基づき、入力データで示される予測の対象において特定の事象が生じるか否かの予測を支援するものである。

　以下に説明する実施の形態は、予測の対象となる肝癌の患者（以下「対象患者」という。）の検査データと、対象患者とは異なる別の患者であって肝癌の摘出手術（以下「手術」という。）を受けた患者（以下「見本患者」という。）の検査データおよび手術後の経過と、を用いて、手術を受けた対象患者の肝癌の再発の有無の予測を支援する場合を例にして、本発明の内容を説明する。
　なお、本発明は、判定の対象が、複数の分類の中の特定分類に属するか否かを判定するものに適用可能であって、本発明の適用可能な範囲は本実施の形態に限られない。

　本発明にかかる情報処理装置は、後述のとおり、見本患者の見本データと、対象患者の入力データと、を用いて、対象患者の肝癌の再発の不確実性を事後確率として数値で表す。本発明にかかる情報処理装置は、この事後確率を用いる統計的パターン認識のBayes識別則により、予測の信頼性を向上させている。

　また、本発明にかかる情報処理装置は、後述のとおり、見本データを用いて、複数の検査項目（マーカー）の中から肝癌の再発の予測に有効な検査項目の選択の不確実性を事後確率として数値で表す。検査項目は、本発明における指標の例である。本発明にかかる情報処理装置は、この事後確率を用いる統計的パターン認識のBayes識別則により、検査項目の選択の信頼性を向上させている。

●情報処理装置●
　図１は、本発明にかかる情報処理装置（以下「本装置」という。）の実施の形態を示すブロック図である。本装置１は、記憶部２と、指標選択部３と、分類判定部４と、を有してなる。指標選択部３は、見本データ抽出部３１と、事前確率算出部３２と、条件付確率算出部３３と、事後確率算出部３４と、分類推定部３５と、指標決定部３６と、を含む。

　本装置１は、パーソナルコンピュータなどで実現される。本装置１では、本発明にかかる情報処理プログラム（以下「本プログラム」という。）が動作して、本プログラムが本装置１のハードウェア資源と協働して、後述する本発明にかかる情報処理方法（以下「本方法」という。）を実現する。

　なお、図示しないコンピュータに本プログラムを実行させることで、同コンピュータを本装置１と同様に機能させて、同コンピュータに本方法を実行させることができる。

　記憶部２は、見本データや入力データなど、本装置１が後述する本方法を実行するために必要な情報が記憶される手段である。

　見本データは、見本患者の検査情報と分類情報とを含む。

　検査情報は、検査項目ごとの検査結果を示す情報である。検査項目は、定性的な検査項目と定量的な検査項目とがある。定性的な検査項目は、例えば、性別、リンパ管侵襲の有無、潰瘍の有無、静脈侵襲の有無、など、いわば順序のつかない非数値データで検査結果が表される検査項目である。定量的な検査項目は、例えば、腫瘍数、腫瘍サイズ、ビリルビン値、アルブミン値、腫瘍の深達度、腫瘍の分化度、腫瘍の肉眼度、など、数値データで検査結果が表される検査項目である。本発明は、後述する検査項目ごとの区分を用いて、検査情報のすべてを離散データで統一する。すなわち、本発明におけるBayes識別則は、通常のBayes識別則とは異なり、定性的な非数値データを取り扱うことができる。

　分類情報は、特定の事象が生起したか否かを示す情報である。
　ここで、特定の事象は、「手術後１年以内に肝癌が再発した」ことをいう。すなわち、分類情報は、「手術後１年以内に肝癌が再発したか否かを示す情報」である。

　入力データは、対象患者の検査情報を含む。

　図２は、記憶部２に記憶される見本データの例を示す模式図である。
　記憶部２には、複数の見本データが記憶される。各見本データは、見本識別子（見本ＩＤ）と関連付けて記憶される。すなわち、本装置１は、見本ＩＤを用いて、見本ＩＤに対応する見本データを、記憶部２から読み出すことができる。見本データに含まれる検査情報は、検査項目を特定する指標識別子（指標ＩＤ）と関連付けられて、記憶部２に記憶される。同図は、例えば、見本ＩＤ「Ｄ_１」の見本データにおいて、指標ＩＤ「Ｘ_１」の検査項目における検査結果を示す検査データは「Ｖ_１１」、指標ＩＤ「Ｘ_２」の検査項目における検査結果を示す検査データは「Ｖ_２１」であることを示す。

　図３は、分類情報の例を示す模式図である。
　分類情報「ω_１」は、「手術後１年以内に肝癌が再発したことを示す情報」である。分類情報「ω_２」は、「手術後１年以内に肝癌が再発しなかったことを示す情報」である。同図は、例えば、見本ＩＤ「Ｄ_１」の見本患者の分類情報が「ω_２」、すなわち、同患者は手術後１年以内に肝癌を再発しなかった、ことを示す。各見本患者は、「手術後１年以内に肝癌が再発した」分類（以下「特定分類」という。）と、「手術後１年以内に肝癌が再発しなかった」分類（以下「非特定分類」という。）のいずれかの分類に属する。

　指標選択部３は、複数の検査項目の中から肝癌の予測に適した検査項目を選択する手段である。検査項目の選択方法については、後述する。

　分類判定部４は、対象患者の肝癌の再発を予測する手段である。肝癌の再発の予測方法については、後述する。

　見本データ抽出部３１は、見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する手段である。

　事前確率算出部３２は、特定分類が生起する確率（以下「第１事前確率」という。）と、非特定分類が生起する確率（以下「第２事前確率」という。）と、を算出する手段である。

　条件付確率算出部３３は、第１条件付確率と第２条件付確率とを算出する手段である。

　第１条件付確率は、訓練データの指標情報と分類情報とを用いて、指標群に含まれる指標の区分ごとに算出される、特定分類が生起したときに指標情報が区分に該当する条件付確率である。指標情報と指標群とについては、後述する。

　第２条件付確率は、訓練データの指標情報と分類情報とを用いて、指標群に含まれる指標の区分ごとに算出される、非特定分類が生起したときに指標情報が区分に該当する条件付確率である。

　指標情報は、見本データ（訓練データ、評価データ）ごとの情報であって、見本データに含まれる検査情報が該当する「検査項目ごとの区分」を示す情報である。

　検査項目ごとの区分は、検査項目で取り得る値を複数に分割したときのそれぞれを特定する情報である。検査項目の区分は、その検査項目で取り得る値が互いに排反事象となるように分割する。すなわち、患者の検査データは、検査項目ごとにいずれかの区分に属する。検査項目が性別であれば、２つの区分「男性」「女性」に分割される。検査項目が腫瘍数であれば、例えば、３つの区分「２個未満」「２個以上７個未満」「７個以上」に分割される。

　指標群は、複数の検査項目の中から選択された１または複数の検査項目の組合せである。

　図４は、記憶部２に記憶される訓練データの指標情報の例を示す模式図である。
　同図は、指標ＩＤ「Ｘ_１」の検査項目が２つの区分に分割されていて、各区分を特定する区分識別子（区分ＩＤ）が「Ｘ_１（１）」「Ｘ_１（２）」であることを示す。同図は、指標ＩＤ「Ｘ_２」の検査項目が３つの区分に分割されていて、各区分を特定する区分ＩＤが「Ｘ_２（１）」「Ｘ_２（２）」「Ｘ_２（３）」であることを示す。同図は、見本ＩＤ「Ｄ_ｔ１」の訓練データは、指標ＩＤ「Ｘ_１」の検査項目において区分ＩＤ「Ｘ_１（２）」の区分に属し、指標ＩＤ「Ｘ_２」の検査項目において区分ＩＤ「Ｘ_２（２）」の区分に属することを示す。

　検査項目ごとの区分を特定する情報、例えば、検査項目が性別における区分「男性」「女性」を特定する情報や、検査項目が腫瘍数における区分「３個未満」「３個以上７個未満」「７個以上」を特定する情報は、記憶部２に予め記憶されている。

　本装置１は、記憶部２に記憶されている検査項目ごとの区分を特定する情報を参照して、各訓練データの検査情報から訓練データの指標情報を生成して記憶部２に記憶する。

　図５は、記憶部２に記憶される検査項目ごとの区分に属する訓練データの数（訓練データに対応する見本患者（以下「訓練患者」という。）の人数）の例を示す模式図である。同図は、指標ごとの区分のそれぞれに属する訓練患者の人数が、分類ごとに記憶されていることを示す。

　同図は、分類ＩＤ「ω_１」の分類に属する訓練患者のうち、指標ＩＤ「Ｘ_１」の検査項目の区分ＩＤ「Ｘ_１（１）」の区分に属する訓練患者の人数は「ｎ^１ _１（１）」人、区分ＩＤ「Ｘ_１（２）」の区分に属する訓練患者の人数は「ｎ^１ _１（２）」人であることを示す。同図は、分類ＩＤ「ω_１」の分類に属する訓練患者のうち、指標ＩＤ「Ｘ_２」の検査項目の区分ＩＤ「Ｘ_２（１）」の区分に属する訓練患者の人数は「ｎ^１ _２（１）」人、区分ＩＤ「Ｘ_２（２）」の区分に属する訓練患者の人数は「ｎ^１ _２（２）」人、区分ＩＤ「Ｘ_２（３）」の区分に属する訓練患者の人数は「ｎ^１ _２（３）」人、であることを示す。

　ここで、分類ＩＤ「ω_１」の分類に属する検査項目ごとの訓練患者の人数は、検査項目に関わらず一定である。すなわち、以下の関係が成り立つ。
　ｎ^１ _１（１）＋ｎ^１ _１（２）＝　ｎ^１ _２（１）＋ｎ^１ _２（２）＋ｎ^１ _２（３）

　本装置１は、訓練データの指標情報と分類情報とを用いて、検査項目ごとの各区分に属する訓練患者の人数を、分類ごとに集計して記憶部２に記憶する。

　本装置１は、分類ごとに集計された、指標ごとの区分のそれぞれに属する訓練患者の人数を用いて、各検査項目の区分ごとの条件付確率（第１条件付確率と第２条件付確率）を算出する。

（式１）

　一般に、検査項目に対する検査結果が複数の区分のいずれかに属するという事象が互いに独立であるとき、以下の式２が成り立つ。

(式２)

　事象が２つの分類ω_１とω_２のいずれかに属するという２クラス問題において、事後確率Ｐ（ω_ｉ｜Ｘ）は、Bayesの定理により、式３となる。

（式３）

　事前確率Ｐ（ω_ｉ）が等確率の０．５とすると、式３に示した事後確率Ｐ（ω_ｉ｜Ｘ）は、式４となる。

（式４）

　式４に式２を代入すると、事後確率Ｐ（ω_ｉ｜Ｘ）は式５で算出される。

（式５）

　ここで、検査項目がＸ_１とＸ_２のとき、つまり、ｄ＝２のときに、訓練患者の検査データがＸ_１（１）とＸ_２（３）に属したとする。このとき、式６が成り立つ。

（式６）

　よって、式５中のＰ（Ｘ_１（１），Ｘ_２（３）｜ω_１）は、式７で算出される。

（式７）

　同様にして、Ｐ（Ｘ_１（１），Ｘ_２（３）｜ω_２）を算出した上で、式５により、分類ω_１とω_２の事後確率を算出する。算出された分類ごとの事後確率を比較して、事後確率が大きい分類に同患者を識別する。

●情報処理方法●
　次に、本装置１が実行する本方法の実施の形態について説明する。

　図６は、本方法の実施の形態を示すフローチャートである。
　先ず、本装置１は、指標選択部３を用いて、複数の検査項目の中から、肝癌の再発の予測に適した検査項目を、選択指標として選択する（Ｓ１）。
　次いで、本装置１は、分類判定部４を用いて、選択指標を用いて入力データの分類を判定、つまり、入力データに対応する対象患者の手術後１年以内の肝癌の再発の有無を予測する（Ｓ２）。

●指標の選択
　図７は、本装置１が指標選択部３を用いて実行する指標の選択処理（Ｓ１）の例を示すフローチャートである。

　先ず、本装置１は、見本データ抽出部３１を用いて、記憶部２に記憶されている見本データを取得し（Ｓ１１）、取得した見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する（Ｓ１２）。本装置１は、例えば、取得した１００件の見本データのうち、８０件の見本データを訓練データとして抽出し、残り２０件の見本データを評価データとして抽出する。本装置１は、見本データの内容（検査結果）を参照することなく、ランダムに見本データから訓練データと評価データとを抽出する。本装置１により抽出される訓練データと評価データの数や、訓練データと評価データの数の比率は、予め、記憶部２に記憶されていて、本装置１は、記憶部２に記憶されているこれらの数や比率に基づいて、見本データを抽出する。
　なお、本発明において、見本データから抽出される評価データの数は、見本データから訓練データを抽出した残りの全見本データでなくてもよい。すなわち、例えば、１００件の見本データのうち、８０件の見本データを訓練データとして抽出し、残り２０件の見本データのうち１５件の見本データを評価データとして抽出してもよい。

　次いで、本装置１は、複数の検査項目のいずれかの組合せで構成される指標群を特定する（Ｓ１３）。複数の検査項目が、例えば、Ｘ_１，Ｘ_２，Ｘ_３の３つのとき、本装置１により特定される指標群は、（Ｘ_１），（Ｘ_２），（Ｘ_３），（Ｘ_１，Ｘ_２），（Ｘ_１，Ｘ_３），（Ｘ_２，Ｘ_３），（Ｘ_１，Ｘ_２，Ｘ_３）の７つである。

　なお、本装置１により特定される指標群に含まれる指標の数が予め決められていて、この指標の数は本装置１が指標群を特定する際に参照できるように記憶部２に記憶されていてもよい。すなわち、例えば、指標群に含まれる指標の数が「２」であり、見本データに含まれる指標がＸ_１，Ｘ_２，Ｘ_３の３つのとき、本装置１は、指標群として（Ｘ_１，Ｘ_２）と（Ｘ_１，Ｘ_３）の２つを特定する。

　次いで、本装置１は、条件付確率算出部３３を用いて、特定された指標群ごとに、指標群に含まれる検査項目の区分ごとの条件付確率（第１条件付確率と第２条件付確率）を、訓練データに基づいて式１により算出する（Ｓ１４）。

　次いで、本装置１は、評価データごとに、事後確率算出部３４を用いて、分類ごとの事後確率を、式５により算出する。

　なお、本実施の形態は、特定分類と非特定分類とが生起する確率は等確率（０．５）としているため、本装置１は、事前確率（第１事前確率と第２事前確率）を算出することなく、事後確率を式５で算出する。

　次いで、本装置１は、分類推定部３５を用いて、評価データの分類を、算出された分類ごとの事後確率に基づいて推定して（Ｓ１５）、推定の当否を判定する（Ｓ１６）。

　本装置１は、例えば、算出された分類ごとの事後確率の大小を比較して、事後確率の大きい分類を評価データの分類として推定する。

　本装置１は、推定された分類を示す推定情報と、記憶部２に見本データとして記憶されている評価データの分類情報と、を比較して、両者が一致するか否かで、評価データの分類の推定の当否を判定する。すなわち、両者が一致すれば評価データの分類の推定は妥当と判定され、両者が不一致であれば評価データの分類の推定は不当と判定される。

　図８は、特定された指標群に含まれる検査項目が「Ｘ_１，Ｘ_２，・・・」であり、見本ＩＤ「Ｄ_ｅ１，Ｄ_ｅ２，・・・」の各評価データが属する検査項目ごとの区分と、各評価データの分類情報と、本装置１が推定した各評価データの分類を示す推定情報と、本装置１が判定した推定の当否を示す判定情報と、の関係を示す模式図である。

　同図は、見本ＩＤ「Ｄ_ｅ１」の評価データの分類情報が分類ＩＤ「ω_１」の分類で、推定情報が分類ＩＤ「ω_１」の分類で、判定情報が妥当であることを示す「Ｔ」であることを示す。すなわち、本装置１は、見本ＩＤ「Ｄ_ｅ１」の評価データに対応する患者が手術後１年以内に肝癌の再発があったことを言い当てている。

　一方、同図は、見本ＩＤ「Ｄ_ｅ２」の評価データの分類情報が分類ＩＤ「ω_２」の分類で、推定情報が分類ＩＤ「ω_１」の分類で、判定情報が不当であることを示す「Ｆ」であることを示す。すなわち、本装置１は、見本ＩＤ「Ｄ_ｅ２」の評価データに対応する患者が手術後１年以内に肝癌の再発が無かったことを言い当てていない。

　本装置１は、すべての指標群に対して、処理Ｓ１４からＳ１６を実行する（Ｓ１７）。

　次いで、本装置１は、指標決定部３６を用いて、指標群ごとの推定の当否の判定結果を比較して（Ｓ１８）、選択指標を決定する（Ｓ１９）。

　本装置１は、例えば、指標群ごとに評価データの判定情報を集計して、推定が妥当と判定された評価データの数が最大の指標群に含まれる検査項目を、選択指標として決定する。

●入力データの分類判定
　図９は、本装置１が分類判定部４を用いて実行する入力データの分類判定処理（Ｓ２）の例を示すフローチャートである。

　先ず、本装置１は、入力データの指標情報を取得する（Ｓ２１）。入力データの指標情報は、前述の見本データの指標情報と同様に、入力データに含まれる検査情報が該当する「検査項目ごとの区分」を示す情報である。本装置１は、入力データと、選択指標に対応する検査項目ごとの区分を特定する情報と、を記憶部２から読み出す。本装置１は、選択指標に対応する検査項目ごとに、入力データの検査情報が該当する区分を特定して、入力データの指標情報を取得する。

　次いで、本装置１は、見本データを用いて決定された選択指標に含まれる指標の区分ごとの条件付確率（処理Ｓ１４と同様に算出）を用いて、入力データの分類ごとの事後確率を、式５により算出する（Ｓ２２）。

　次いで、本装置１は、算出された分類ごとの事後確率を比較する（Ｓ２３）。

　次いで、本装置１は、入力データの分類を特定、すなわち、入力データの分類を特定分類または非特定分類のいずれかに識別する（Ｓ２４）。

　本装置１は、例えば、分類ごとの事後確率の大小を比較して、最大の事後確率に対応する分類を、入力データの分類として識別する。

　特定された入力データの分類は、入力データと関連付けて記憶部２に記憶される。特定された入力データの分類は、本装置１のディスプレイ（不図示）などに、例えば、「患者○○さんは、手術後１年以内に肝癌を再発する可能性は低い」などと表示して出力される。

　図１０は、本装置１が決定した選択指標が表示された画面の例を示す模式図である。同図は、検査項目Ｘ_１、Ｘ_２、・・・、Ｘ_ｎの中から選択指標として選択された検査項目がＸ_１とＸ_２であることを示す。

　図１１は、本装置１が決定した選択指標が表示された別の画面の例を示す模式図である。同図は、検査項目Ｙ_１、Ｙ_２、Ｙ_３、・・・、Ｙ_ｎの中から選択された検査項目の組合せと、同組合せの事後確率とが、事後確率の降順に表示されていることを示す。本装置１は、例えば、本装置１の使用者にこの画面を閲覧させることで、検査項目の組合せの違いを事後確率の大小で確認させることができる。

　図１２は、本装置１が決定した選択指標が表示されたさらに別の画面の例を示す模式図である。同図は、検査項目Ｚ_１とＺ_２の検査を受けているある患者が、検査項目Ｚ_３の検査を受けることで、ある疾患の再発の予測精度が高まることを示す。本装置１は、例えば、図１１に示したような検査項目の組合せと事後確率との対応関係と、ある患者の検査済の検査項目の組合せよりも事後確率が大きい検査項目の組合せを特定して、特定された検査項目の組合せに含まれる検査項目のうち患者の検査済の検査項目以外の検査項目を抽出することができる。

●まとめ●
　以上説明した実施の形態によれば、肝癌の再発の予測に用いる検査項目の適否を、事後確率という数値で比較することができる。その結果、本発明によれば、数値に基づいて論理的に肝癌の再発の予測を支援することができる。

　なお、以上説明した実施の形態は、特定分類と非特定分類の２つの分類を対象とするものであったが、本発明は３つ以上の分類へも適用可能である。

　分類ω_１，ω_２，・・・，ω_ｍ（ｍ≧３）のそれぞれが生起する事象が互いに排反事象で、かつ、それらの和集合が全集合であるとき、入力データは、ｍ個の分類のうちのいずれか一の分類に属する。このとき、検査項目Ｘ_{ｔ１（ｒｔ１）}，Ｘ_{ｔ２（ｒｔ２）}，・・・，Ｘ_{ｔｄ（ｒｔｄ）}が用いられると、本装置は、分類ごとの条件付確率Ｐ（Ｘ_{ｔ１（ｒｔ１）}，Ｘ_{ｔ２（ｒｔ２）}，・・・，Ｘ_{ｔｄ（ｒｔｄ）}｜ω_ｉ）（ｉ＝１，２，・・・，ｍ）を算出した上で、事後確率Ｐ（ω_ｉ｜Ｘ_{ｔ１（ｒｔ１）}，Ｘ_{ｔ２（ｒｔ２）}，・・・，Ｘ_{ｔｄ（ｒｔｄ）}）を式８により算出する。

（式８）

　入力データＸ＝［Ｘ_{ｔ１（ｒｔ１）}，Ｘ_{ｔ２（ｒｔ２）}，・・・，Ｘ_{ｔｄ（ｒｔｄ）}］の事後確率Ｐ（ω_ｉ｜Ｘ_{ｔ１（ｒｔ１）}，Ｘ_{ｔ２（ｒｔ２）}，・・・，Ｘ_{ｔｄ（ｒｔｄ）}）において、式９が成立するとき、本装置は、入力データＸの分類を、分類ω_ｋと判定する。

（式９）

　以下、これまで説明した本装置と本プログラムと本方法の特徴を、まとめて記載しておく。

（特徴１）
　入力データに対応する判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標に基づいて判定する情報処理装置であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記判定対象に対応する入力データと、複数の見本対象のそれぞれに対応する複数の見本データと、が記憶される記憶部と、
　前記入力データが該当する前記指標ごとの区分に基づいて、前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
を有してなり、
　前記入力データは、前記入力データが該当する前記複数の指標ごとの区分を示す指標情報、を含み、
　前記見本データは、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本対象が前記特定分類に属するか否かを示す分類情報と、を含み、
　前記分類判定部は、
　前記見本データの前記指標情報と前記見本データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標の区分ごとの第１条件付確率と、前記複数の分類のうち前記特定分類ではない非特定分類が生起したときの前記指標の区分ごとの第２条件付確率と、を算出し、
　前記入力データの前記指標情報と、前記第１条件付確率と、前記第２条件付確率と、に基づいて、前記判定対象が前記特定分類に属するか否かを決定する、
ことを特徴とする情報処理装置。

（特徴２）
　前記分類判定部は、
　前記入力データの前記指標情報と、前記複数の分類のうち前記特定分類が生起する第１事前確率と、前記第１条件付確率と、に基づいて、前記判定対象が前記特定分類に属する第１事後確率を算出し、
　前記入力データの前記指標情報と、前記複数の分類のうち前記非特定分類が生起する第２事前確率と、前記第２条件付確率と、に基づいて、前記判定対象が前記非特定分類に属する第２事後確率を算出し、
　前記第１事後確率と前記第２事後確率とを比較して、前記判定対象が前記特定分類に属するか否かを決定する、
特徴１記載の情報処理装置。

（特徴３）
　前記複数の指標には、定性的な指標が含まれる、
特徴１記載の情報処理装置。

（特徴４）
　前記複数の指標には、定量的な指標が含まれる、
特徴３記載の情報処理装置。

（特徴５）
　前記複数の指標の中から選択指標を選択する指標選択部、
を備え、
　前記分類判定部は、前記入力データが該当する前記選択指標ごとの区分に基づいて、前記判定対象が前記特定分類に属するか否かを決定する、
特徴１記載の情報処理装置。

（特徴６）
　前記指標選択部は、前記第１条件付確率と前記第２条件付確率とを用いて、前記選択指標を選択する、
特徴５記載の情報処理装置。

（特徴７）
　前記指標選択部は、
　（ａ）前記複数の見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する、見本データ抽出部と、
　（ｂ）前記複数の指標のいずれかの組合せで構成される指標群ごとに、
　前記訓練データの前記指標情報と、前記訓練データの前記分類情報と、前記評価データの前記指標情報と、を用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定し、
　前記評価データの前記分類情報を用いて、前記推定の当否を判定する、
分類推定部と、
　（ｃ）前記指標群ごとの前記推定の当否の判定結果に基づいて、前記選択指標を決定する、指標決定部と、
を備え、
　前記分類推定部は、前記第１条件付確率と前記第２条件付確率とを用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定する、
特徴６記載の情報処理装置。

（特徴８）
　前記見本データ抽出部は、前記複数の見本データの中から複数の前記評価データを抽出し、
　前記分類推定部は、前記複数の評価データごとに、前記第１条件付確率と前記第２条件付確率とを用いて、前記推定の当否の判定結果を示す判定情報を出力し、
　前記指標決定部は、前記複数の評価データごとの前記判定情報に基づいて、前記選択指標を決定する、
特徴７記載の情報処理装置。

（特徴９）
　コンピュータを、特徴１記載の情報処理装置として機能させる、
ことを特徴とする情報処理プログラム。

（特徴１０）
　判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標に基づいて判定する情報処理装置により実行される情報処理方法であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記情報処理装置は、
　前記判定対象に対応する入力データと、複数の見本対象のそれぞれに対応する見本データと、が記憶される記憶部と、
　前記入力データが該当する前記指標ごとの区分に基づいて、前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
を備え、
　前記入力データは、前記入力データが該当する前記複数の指標ごとの区分を示す指標情報、を含み、
　前記見本データは、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本対象が前記特定分類に属するか否かを示す分類情報と、を含み、
　前記情報処理装置が、
　前記見本データの前記指標情報と前記見本データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標の区分ごとの第１条件付確率と、前記複数の分類のうち前記特定分類ではない非特定分類が生起したときの前記指標の区分ごとの第２条件付確率と、を算出するステップと、
　前記入力データの前記指標情報と、前記第１条件付確率と、前記第２条件付確率と、に基づいて、前記判定対象が前記特定分類に属するか否かを決定するステップと、
を有してなることを特徴とする情報処理方法。

（特徴１１）
　入力データに対応する判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標の中から選択された選択指標に基づいて判定する情報処理装置であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記複数の指標の中から前記選択指標を選択する指標選択部と、
　前記入力データが該当する前記選択指標に含まれる指標ごとの区分に基づいて、前記入力データに対応する前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
を有してなり、
　前記選択指標の選択に用いられる複数の見本対象のそれぞれに対応する複数の見本データごとの、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本データに対応する前記見本対象が前記特定分類に属するか否かを示す分類情報と、が記憶される記憶部、
を備え、
　前記指標選択部は、
　（ａ）前記複数の見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する、見本データ抽出部と、
　（ｂ）前記複数の指標のいずれかの組合せで構成される指標群ごとに、
　前記訓練データの前記指標情報と、前記訓練データの前記分類情報と、前記評価データの前記指標情報と、を用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定し、
　前記評価データの前記分類情報を用いて、前記推定の当否を判定する、
分類推定部と、
　（ｃ）前記指標群ごとの前記推定の当否の判定結果に基づいて、前記選択指標を決定する、指標決定部と、
を備え、
　前記分類推定部は、
　（ｂ－１）前記訓練データの前記指標情報と前記訓練データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第１条件付確率と、前記非特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第２条件付確率と、を算出し、
　（ｂ－２）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類が生起する第１事前確率と、前記第１条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記特定分類に属する第１事後確率を算出し、
　（ｂ－３）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類ではない非特定分類が生起する第２事前確率と、前記第２条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記非特定分類に属する第２事後確率を算出し、
　（ｂ－４）前記第１事後確率と前記第２事後確率とを比較して、前記評価データに対応する前記見本対象が前記特定分類に属するか否かの推定の結果を示す推定情報を出力し、
　（ｂ－５）前記評価データの前記推定情報と前記評価データの前記分類情報とを比較して、前記推定の当否の判定結果を示す判定情報を出力し、
　前記指標決定部は、
　（ｃ－１）前記指標群ごとの前記判定情報のうち、所定の条件を満たす判定情報に対応する指標群を特定し、
　（ｃ－２）前記特定された指標群に含まれる指標を前記選択指標として決定する、
ことを特徴とする情報処理装置。

（特徴１２）
　前記分類推定部は、前記第１事前確率と、前記第２事前確率と、を算出する、
特徴１１記載の情報処理装置。

（特徴１３）
　前記見本データ抽出部は、前記複数の見本データの中から複数の前記評価データを抽出し、
　前記分類推定部は、前記複数の評価データごとに、前記判定情報を出力し、
　前記指標決定部は、前記複数の評価データごとの前記判定情報に基づいて、前記選択指標を決定する、
特徴１１または１２記載の情報処理装置。

（特徴１４）
　前記分類推定部は、
　前記複数の評価データごとに、前記第１条件付確率と前記第２条件付確率と前記第１事後確率と前記第２事後確率とを算出して、前記推定情報を出力し、
　前記複数の評価データごとの前記推定情報に基づいて、前記複数の評価データごとの前記判定情報を出力する、
特徴１３記載の情報処理装置。

（特徴１５）
　前記第１事前確率は、前記第２事前確率と等しい、
特徴１１記載の情報処理装置。

（特徴１６）
　コンピュータを、特徴１１記載の情報処理装置として機能させる、
ことを特徴とする情報処理プログラム。

（特徴１７）
　　入力データに対応する判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標の中から選択された選択指標に基づいて判定する情報処理装置により実行される情報処理方法であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記情報処理装置は、
　前記複数の指標の中から前記選択指標を選択する指標選択部と、
　前記入力データが該当する前記選択指標に含まれる指標ごとの区分に基づいて、前記入力データに対応する前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
　前記選択指標の選択に用いられる複数の見本対象のそれぞれに対応する複数の見本データごとの、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本データに対応する前記見本対象が前記特定分類に属するか否かを示す分類情報と、が記憶される記憶部と、
を備え、
　前記情報処理装置が、
　（ａ）前記複数の見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する、見本データ抽出ステップと、
　（ｂ）前記複数の指標のいずれかの組合せで構成される指標群ごとに、
　前記訓練データの前記指標情報と、前記訓練データの前記分類情報と、前記評価データの前記指標情報と、を用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定し、
　前記評価データの前記分類情報を用いて、前記推定の当否を判定する、
分類推定ステップと、
　（ｃ）前記指標群ごとの前記推定の当否の判定結果に基づいて、前記選択指標を決定する、指標決定ステップと、
を有してなり、
　前記分類推定ステップは、
　（ｂ－１）前記訓練データの前記指標情報と前記訓練データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第１条件付確率と、前記非特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第２条件付確率と、を算出するステップと、
　（ｂ－２）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類が生起する第１事前確率と、前記第１条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記特定分類に属する第１事後確率を算出するステップと、
　（ｂ－３）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類ではない非特定分類が生起する第２事前確率と、前記第２条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記非特定分類に属する第２事後確率を算出するステップと、
　（ｂ－４）前記第１事後確率と前記第２事後確率とを比較して、前記評価データに対応する前記見本対象が前記特定分類に属するか否かの推定の結果を示す推定情報を出力するステップと、
　（ｂ－５）前記評価データの前記推定情報と前記評価データの前記分類情報とを比較して、前記推定の当否の判定結果を示す判定情報を出力するステップと、
を備え、
　前記指標決定ステップは、
　（ｃ－１）前記指標群ごとの前記判定情報のうち、所定の条件を満たす判定情報に対応する指標群を特定するステップと、
　（ｃ－２）前記特定された指標群に含まれる指標を前記選択指標として決定するステップと、
を備える、
ことを特徴とする情報処理方法。

　１　　情報処理装置
　２　　記憶部
　３　　指標選択部
　３１　見本データ抽出部
　３２　事前確率算出部
　３３　条件付確率算出部
　３４　事後確率算出部
　３５　分類推定部
　３６　指標決定部
　４　　分類判定部

Claims

　入力データに対応する判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標に基づいて判定する情報処理装置であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記判定対象に対応する入力データと、複数の見本対象のそれぞれに対応する複数の見本データと、が記憶される記憶部と、
　前記入力データが該当する前記指標ごとの区分に基づいて、前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
を有してなり、
　前記入力データは、前記入力データが該当する前記複数の指標ごとの区分を示す指標情報、を含み、
　前記見本データは、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本対象が前記特定分類に属するか否かを示す分類情報と、を含み、
　前記分類判定部は、
　前記見本データの前記指標情報と前記見本データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標の区分ごとの第１条件付確率と、前記複数の分類のうち前記特定分類ではない非特定分類が生起したときの前記指標の区分ごとの第２条件付確率と、を算出し、
　前記入力データの前記指標情報と、前記第１条件付確率と、前記第２条件付確率と、に基づいて、前記判定対象が前記特定分類に属するか否かを決定する、
ことを特徴とする情報処理装置。
　前記分類判定部は、
　前記入力データの前記指標情報と、前記複数の分類のうち前記特定分類が生起する第１事前確率と、前記第１条件付確率と、に基づいて、前記判定対象が前記特定分類に属する第１事後確率を算出し、
　前記入力データの前記指標情報と、前記複数の分類のうち前記非特定分類が生起する第２事前確率と、前記第２条件付確率と、に基づいて、前記判定対象が前記非特定分類に属する第２事後確率を算出し、
　前記第１事後確率と前記第２事後確率とを比較して、前記判定対象が前記特定分類に属するか否かを決定する、
請求項１記載の情報処理装置。
　前記複数の指標には、定性的な指標が含まれる、
請求項１記載の情報処理装置。
　前記複数の指標には、定量的な指標が含まれる、
請求項３記載の情報処理装置。
　前記複数の指標の中から選択指標を選択する指標選択部、
を備え、
　前記分類判定部は、前記入力データが該当する前記選択指標ごとの区分に基づいて、前記判定対象が前記特定分類に属するか否かを決定する、
請求項１記載の情報処理装置。
　前記指標選択部は、前記第１条件付確率と前記第２条件付確率とを用いて、前記選択指標を選択する、
請求項５記載の情報処理装置。
　前記指標選択部は、
　（ａ）前記複数の見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する、見本データ抽出部と、
　（ｂ）前記複数の指標のいずれかの組合せで構成される指標群ごとに、
　前記訓練データの前記指標情報と、前記訓練データの前記分類情報と、前記評価データの前記指標情報と、を用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定し、
　前記評価データの前記分類情報を用いて、前記推定の当否を判定する、
分類推定部と、
　（ｃ）前記指標群ごとの前記推定の当否の判定結果に基づいて、前記選択指標を決定する、指標決定部と、
を備え、
　前記分類推定部は、前記第１条件付確率と前記第２条件付確率とを用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定する、
請求項６記載の情報処理装置。
　前記見本データ抽出部は、前記複数の見本データの中から複数の前記評価データを抽出し、
　前記分類推定部は、前記複数の評価データごとに、前記第１条件付確率と前記第２条件付確率とを用いて、前記推定の当否の判定結果を示す判定情報を出力し、
　前記指標決定部は、前記複数の評価データごとの前記判定情報に基づいて、前記選択指標を決定する、
請求項７記載の情報処理装置。
　コンピュータを、請求項１記載の情報処理装置として機能させる、
ことを特徴とする情報処理プログラム。
　判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標に基づいて判定する情報処理装置により実行される情報処理方法であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記情報処理装置は、
　前記判定対象に対応する入力データと、複数の見本対象のそれぞれに対応する見本データと、が記憶される記憶部と、
　前記入力データが該当する前記指標ごとの区分に基づいて、前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
を備え、
　前記入力データは、前記入力データが該当する前記複数の指標ごとの区分を示す指標情報、を含み、
　前記見本データは、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本対象が前記特定分類に属するか否かを示す分類情報と、を含み、
　前記情報処理装置が、
　前記見本データの前記指標情報と前記見本データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標の区分ごとの第１条件付確率と、前記複数の分類のうち前記特定分類ではない非特定分類が生起したときの前記指標の区分ごとの第２条件付確率と、を算出するステップと、
　前記入力データの前記指標情報と、前記第１条件付確率と、前記第２条件付確率と、に基づいて、前記判定対象が前記特定分類に属するか否かを決定するステップと、
を有してなることを特徴とする情報処理方法。
　入力データに対応する判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標の中から選択された選択指標に基づいて判定する情報処理装置であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記複数の指標の中から前記選択指標を選択する指標選択部と、
　前記入力データが該当する前記選択指標に含まれる指標ごとの区分に基づいて、前記入力データに対応する前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
を有してなり、
　前記選択指標の選択に用いられる複数の見本対象のそれぞれに対応する複数の見本データごとの、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本データに対応する前記見本対象が前記特定分類に属するか否かを示す分類情報と、が記憶される記憶部、
を備え、
　前記指標選択部は、
　（ａ）前記複数の見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する、見本データ抽出部と、
　（ｂ）前記複数の指標のいずれかの組合せで構成される指標群ごとに、
　前記訓練データの前記指標情報と、前記訓練データの前記分類情報と、前記評価データの前記指標情報と、を用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定し、
　前記評価データの前記分類情報を用いて、前記推定の当否を判定する、
分類推定部と、
　（ｃ）前記指標群ごとの前記推定の当否の判定結果に基づいて、前記選択指標を決定する、指標決定部と、
を備え、
　前記分類推定部は、
　（ｂ－１）前記訓練データの前記指標情報と前記訓練データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第１条件付確率と、前記非特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第２条件付確率と、を算出し、
　（ｂ－２）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類が生起する第１事前確率と、前記第１条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記特定分類に属する第１事後確率を算出し、
　（ｂ－３）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類ではない非特定分類が生起する第２事前確率と、前記第２条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記非特定分類に属する第２事後確率を算出し、
　（ｂ－４）前記第１事後確率と前記第２事後確率とを比較して、前記評価データに対応する前記見本対象が前記特定分類に属するか否かの推定の結果を示す推定情報を出力し、
　（ｂ－５）前記評価データの前記推定情報と前記評価データの前記分類情報とを比較して、前記推定の当否の判定結果を示す判定情報を出力し、
　前記指標決定部は、
　（ｃ－１）前記指標群ごとの前記判定情報のうち、所定の条件を満たす判定情報に対応する指標群を特定し、
　（ｃ－２）前記特定された指標群に含まれる指標を前記選択指標として決定する、
ことを特徴とする情報処理装置。
　前記分類推定部は、前記第１事前確率と、前記第２事前確率と、を算出する、
請求項１１記載の情報処理装置。
　前記見本データ抽出部は、前記複数の見本データの中から複数の前記評価データを抽出し、
　前記分類推定部は、前記複数の評価データごとに、前記判定情報を出力し、
　前記指標決定部は、前記複数の評価データごとの前記判定情報に基づいて、前記選択指標を決定する、
請求項１１または１２記載の情報処理装置。
　前記分類推定部は、
　前記複数の評価データごとに、前記第１条件付確率と前記第２条件付確率と前記第１事後確率と前記第２事後確率とを算出して、前記推定情報を出力し、
　前記複数の評価データごとの前記推定情報に基づいて、前記複数の評価データごとの前記判定情報を出力する、
請求項１３記載の情報処理装置。
　前記第１事前確率は、前記第２事前確率と等しい、
請求項１１記載の情報処理装置。
　コンピュータを、請求項１１記載の情報処理装置として機能させる、
ことを特徴とする情報処理プログラム。
　　入力データに対応する判定対象が、複数の分類の中の特定分類に属するか否かを、複数の指標の中から選択された選択指標に基づいて判定する情報処理装置により実行される情報処理方法であって、
　前記複数の指標のそれぞれは、複数の区分を含み、
　前記情報処理装置は、
　前記複数の指標の中から前記選択指標を選択する指標選択部と、
　前記入力データが該当する前記選択指標に含まれる指標ごとの区分に基づいて、前記入力データに対応する前記判定対象が前記特定分類に属するか否かを決定する分類判定部と、
　前記選択指標の選択に用いられる複数の見本対象のそれぞれに対応する複数の見本データごとの、前記見本データが該当する前記複数の指標ごとの区分を示す指標情報と、前記見本データに対応する前記見本対象が前記特定分類に属するか否かを示す分類情報と、が記憶される記憶部と、
を備え、
　前記情報処理装置が、
　（ａ）前記複数の見本データのうち、一部の見本データを訓練データとして抽出し、他の一部の見本データを評価データとして抽出する、見本データ抽出ステップと、
　（ｂ）前記複数の指標のいずれかの組合せで構成される指標群ごとに、
　前記訓練データの前記指標情報と、前記訓練データの前記分類情報と、前記評価データの前記指標情報と、を用いて、前記評価データに対応する前記見本対象が前記特定分類に属するか否かを推定し、
　前記評価データの前記分類情報を用いて、前記推定の当否を判定する、
分類推定ステップと、
　（ｃ）前記指標群ごとの前記推定の当否の判定結果に基づいて、前記選択指標を決定する、指標決定ステップと、
を有してなり、
　前記分類推定ステップは、
　（ｂ－１）前記訓練データの前記指標情報と前記訓練データの前記分類情報とを用いて前記複数の分類ごとに集計された前記指標ごとの各区分に属する見本データの数に基づいて、前記特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第１条件付確率と、前記非特定分類が生起したときの前記指標群に含まれる指標の区分ごとの第２条件付確率と、を算出するステップと、
　（ｂ－２）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類が生起する第１事前確率と、前記第１条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記特定分類に属する第１事後確率を算出するステップと、
　（ｂ－３）前記評価データの前記指標情報と、前記複数の分類のうち前記特定分類ではない非特定分類が生起する第２事前確率と、前記第２条件付確率と、に基づいて、前記評価データに対応する前記見本対象が前記非特定分類に属する第２事後確率を算出するステップと、
　（ｂ－４）前記第１事後確率と前記第２事後確率とを比較して、前記評価データに対応する前記見本対象が前記特定分類に属するか否かの推定の結果を示す推定情報を出力するステップと、
　（ｂ－５）前記評価データの前記推定情報と前記評価データの前記分類情報とを比較して、前記推定の当否の判定結果を示す判定情報を出力するステップと、
を備え、
　前記指標決定ステップは、
　（ｃ－１）前記指標群ごとの前記判定情報のうち、所定の条件を満たす判定情報に対応する指標群を特定するステップと、
　（ｃ－２）前記特定された指標群に含まれる指標を前記選択指標として決定するステップと、
を備える、
ことを特徴とする情報処理方法。