JP2005092291A

JP2005092291A - データ分類支援方法および装置、プログラムおよびそのプログラムを記録した記録媒体

Info

Publication number: JP2005092291A
Application number: JP2003320851A
Authority: JP
Inventors: Minoru Okamoto; 稔岡本
Original assignee: Sysmex Corp
Current assignee: Sysmex Corp
Priority date: 2003-09-12
Filing date: 2003-09-12
Publication date: 2005-04-07

Abstract

【課題】正しい分類結果が得られていない可能性があることを使用者に認識させることが可能なデータ分類支援方法およびデータ分類支援装置を提供する。
【解決手段】このデータ分類支援方法は、１段目の自己組織化マップ１０３ａを用いて、未知データ（検体データ）をいずれかのセルに配置するステップと、検体データが配置されたセルが属する第１分類領域Ｃをさらに分類するための２段目のグループＣの自己組織化マップ１０３ｂを用いて、検体データをグループＣの自己組織化マップ１０３ｂのいずれかのセルに配置するステップと、検体データが配置されたセルが属さない第２分類領域Ｂをさらに分類するためのグループＢの自己組織化マップ１０３ｂを用いて、検体データをグループＢの自己組織化マップ１０３ｂのいずれかのセルに配置するステップと、１段目の自己組織化マップ１０３ａ、２段目のグループＢおよびグループＣの自己組織化マップ１０３ｂを表示するステップとを備えている。
【選択図】図１

Description

この発明は、データ分類支援方法および装置、プログラムおよびそのプログラムを記録した記録媒体に関し、特に、複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかのセルに配置させるデータ分類支援方法および装置、プログラムおよびそのプログラムを記録した記録媒体に関する。

従来、複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかのセルに配置させるデータ分類支援方法が知られている。また、このようなデータ分類支援方法に用いられる分類マップとして、たとえば、Ｔ．Ｋｏｈｏｎｅｎ氏が提案した自己組織化マップ（ＳＯＭ：Ｓｅｌｆ−ＯｒｇａｎｉｚｉｎｇＭａｐｓ）が知られている。ここで、自己組織化マップ（ＳＯＭ）を用いたデータ分類支援方法では、未知データを多次元のベクトルとして扱い、その未知データを、自己組織化アルゴリズムを用いて類似度の高いセルに配置するとともに、そのセルが属する分類領域に分類して、２次元の自己組織化マップ上に表示する（たとえば、特許文献１参照）。

上記特許文献１には、情報入力手段から入力された情報を大分類手段で自己組織化マップ上に類似度の高い情報毎に大まかに分類し、この大分類された結果を振り分け、この振り分けられた情報について、詳細分類手段で詳細な分類を行い、この分類結果を最終的に１つの自己組織化マップ上に配置する方法が開示されている。
特開２００３−６２１１号公報

しかしながら、上記特許文献１に開示された方法では、大分類で類似度が高いとされた領域についてのみ詳細分類手段による分類が行われ、大分類で類似度が高いとされない領域については詳細分類手段による分類が行われないので、使用者は、類似度が高いとされない領域に関する他の分類結果が得られる可能性のあることを認識することができないという問題点がある。特に、大分類手段における分類がいずれの分類であるかが微妙である場合には、類似度が高いとされない領域についても正しい分類結果が得られる可能性がある。このような場合にも、上記特許文献１による方法では、使用者は、詳細分類手段により正しい分類結果が得られていない可能性があることを認識することができないという問題点がある。

この発明は、上記のような課題を解決するためになされたものであり、この発明の一つの目的は、正しい分類結果が得られていない可能性があることを使用者に認識させることが可能なデータ分類支援方法およびデータ分類支援装置を提供することである。

課題を解決するための手段および発明の効果

この発明の第１の局面によるデータ分類支援方法は、複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかのセルに配置するデータ分類支援方法であって、第１分類領域と第２分類領域とを含む第１分類マップを用いて、未知データをいずれかのセルに配置するステップと、未知データが配置されたセルが属する、第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、未知データを第２分類マップのいずれかのセルに配置するステップと、未知データが配置されたセルが属さない、第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、未知データを第３分類マップのいずれかのセルに配置するステップと、第１分類マップ、第２分類マップおよび第３分類マップを表示するステップとを備えている。

この第１の局面によるデータ分類支援方法では、上記のように、未知データが配置されたセルが属する、第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、未知データを第２分類マップのいずれかのセルに配置するとともに、未知データが配置されたセルが属さない、第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、未知データを第３分類マップのいずれかのセルに配置した後、第１分類マップ、第２分類マップおよび第３分類マップを表示することによって、第３分類マップの表示により第２マップの分類結果以外の分類結果が得られる可能性のあることを使用者に認識させることができる。これにより、正しい分類結果が得られていない可能性があることを使用者に認識させることができる。

上記第１の局面によるデータ分類支援方法において、好ましくは、未知データが第１分類マップの第１分類領域および第２分類領域に属する可能性を算出するステップと、算出された可能性を、第１分類マップ、第２分類マップおよび第３分類マップとともに表示するステップとをさらに備える。このように構成すれば、使用者は、未知データが、第２分類マップに対応する第１分類領域および第３分類マップに対応する第２分類領域に属する可能性を視覚的に認識することができる。

上記第１分類マップの可能性を表示するステップを含むデータ分類支援方法において、好ましくは、可能性の大きさは、第１分類マップと、第２分類マップおよび第３分類マップとを結ぶ線の太さによって表示される。このように構成すれば、容易に、使用者は、未知データが第２分類マップおよび第３分類マップに属する可能性を視覚的に認識することができる。

上記第１分類マップの可能性を表示するステップを含むデータ分類支援方法において、好ましくは、可能性の大きさは、割合を示す数値によって表示される。このように構成すれば、使用者は、未知データが第２分類マップおよび第３分類マップに属する可能性を数値的に正確に認識することができる。

上記第１の局面によるデータ分類支援方法において、好ましくは、第２分類マップは、第３分類領域を含み、未知データが第２分類マップの第３分類領域に属する可能性を算出するステップをさらに備える。このように構成すれば、使用者は、未知データが第２分類マップの第３分類領域に属する可能性を数値的に正確に認識することができる。

上記第１の局面によるデータ分類支援方法において、好ましくは、第３分類マップは、第４分類領域を含み、未知データが第３分類マップの第４分類領域に属する可能性を算出するステップをさらに備える。使用者は、未知データが第３分類マップの第４分類領域に属する可能性を数値的に正確に認識することができる。

上記第１の局面によるデータ分類支援方法において、好ましくは、未知データは、臨床検査データである。このように構成すれば、臨床検査データを分類して、第１〜第３分類マップを表示することによって、第３分類マップの表示により第２分類マップの分類結果（疾患名）以外の分類結果（疾患名）が得られる可能性のあることを使用者に認識させることができる。

上記第１の局面によるデータ分類支援方法において、好ましくは、分類マップは、自己組織化マップである。このように構成すれば、自己組織化マップにより、容易に、未知データに最も近いセルベクトルデータを有する最小セルを決定することができる。

この発明の第２の局面によるデータ分類支援方法を実行するためのプログラムは、複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかの前記セルに配置するデータ分類支援方法を実行するためのプログラムであって、第１分類領域と第２分類領域とを含む第１分類マップを用いて、未知データをいずれかのセルに配置するステップと、未知データが配置されたセルが属する、第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、未知データを第２分類マップのいずれかのセルに配置するステップと、未知データが配置されたセルが属さない、第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、未知データを第３分類マップのいずれかのセルに配置するステップと、第１分類マップ、第２分類マップおよび第３分類マップを表示するステップとを備えたデータ分類支援方法を実行するためのプログラムである。

この第２の局面によるデータ分類支援方法を実行するためのプログラムでは、上記のように、未知データが配置されたセルが属する、第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、未知データを第２分類マップのいずれかのセルに配置するとともに、未知データが配置されたセルが属さない、第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、未知データを第３分類マップのいずれかのセルに配置した後、第１分類マップ、第２分類マップおよび第３分類マップを表示することによって、第３分類マップの表示により第２分類マップの分類結果以外の分類結果が得られる可能性のあることを使用者に認識させることができる。これにより、正しい分類結果が得られていない可能性があることを使用者に認識させることができる。

この場合、上記第２の局面によるプログラムを記録したコンピュータ読み取り可能な記録媒体を用いるのが好ましい。

この発明の第３の局面によるデータ分類支援装置は、複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかのセルに配置するデータ分類支援装置であって、第１分類領域と第２分類領域とを含む第１分類マップを用いて、未知データをいずれかのセルに配置する第１セル配置手段と、未知データが配置されたセルが属する、第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、未知データを第２分類マップのいずれかのセルに配置する第２セル配置手段と、未知データが配置されたセルが属さない、第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、未知データを第３分類マップのいずれかのセルに配置する第３セル配置手段と、第１分類マップ、第２分類マップおよび第３分類マップを表示する表示手段とを備えている。

この第３の局面によるデータ分類支援装置では、上記のように、未知データが配置されたセルが属する、第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、未知データを第２分類マップのいずれかのセルに配置する第２セル配置手段と、未知データが配置されたセルが属さない、第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、未知データを第３分類マップのいずれかのセルに配置する第３セル配置手段と、第１分類マップ、第２分類マップおよび第３分類マップを表示する表示手段とを設けることによって、第３分類マップの表示により第２分類マップの分類結果以外の分類結果が得られる可能性のあることを使用者に認識させることができる。これにより、正しい分類結果が得られていない可能性があることを使用者に認識させることができる。

以下、本発明の実施形態を図面に基づいて説明する。なお、本実施形態では、臨床検査データ（未知データ）を所定の疾患（分類領域）に分類する場合に本発明を適用した例について説明する。

図１〜図６は、本発明の一実施形態によるデータ分類支援方法を用いて臨床検査データを所定の疾患に分類する場合に、コンピュータ端末のディスプレイ上に表示される解析結果画面および選択画面を示した図である。また、図７〜図１３は、本発明の一実施形態によるデータ分類支援方法を説明するための図である。以下、本実施形態によるデータ分類支援方法について説明する。

まず、図１〜図３を参照して、本実施形態によるデータ分類支援方法を用いて臨床検査データを所定の疾患（分類領域）に分類する場合に、コンピュータ端末（クライアント）のディスプレイ上に表示される解析結果画面について説明する。なお、このコンピュータ端末（クライアント）は、サーバ（図示せず）に接続されており、登録されたユーザＩＤとパスワードでログイン後に利用することができる。このコンピュータ端末（クライアント）は、本発明の「データ分類支援装置」の一例である。

図１に示した解析結果画面（画面１）には、患者を特定する属性データを表示する患者属性データ表示部１０１と、患者属性データ表示部１０１に表示された患者の検体データを表示する検体データ表示部１０２と、ツリー表示（階層表示）された自己組織化マップ１０３を表示する自己組織化マップ表示部と、最終的な疾患可能性割合を表示する疾患可能性割合表示部１０４とが設けられている。図２には、図１に示した解析結果画面（画面１）のツリー表示（階層表示）された自己組織化マップ１０３の３段目のグループＣ１をクリックした場合に表示される解析詳細ポップアップ画面（画面２−１）が示されている。また、図３には、図２に示した解析詳細ポップアップ画面（画面２−１）の表示切替（中央）タブ１０７をクリックした場合に表示される解析詳細ポップアップ画面（画面２−２）が示されている。図２では、未知データが属する発火セル（最小セル）が自己組織化マップ上の端部（右下）に位置するように表示されており、図３では、未知データが属する発火セル（最小セル）が自己組織化マップ上の中心に位置するように表示されている。また、図２および図３に示した解析詳細ポップアップ画面では、自己組織化マップとともに、各要素毎に、ヒストグラム２０と、対象検体（未知データ）および類似検体のベクトル要素値とが表示される。ここで、要素１は白血球数であり、要素２は赤血球数であり、要素３はヘモグロビン量である。要素１についてのヒストグラム２０は、横軸が白血球数、縦軸が頻度を示している。要素２についてのヒストグラム２０は、横軸が赤血球数、縦軸が頻度を示している。要素３についてのヒストグラム２０は、横軸がヘモグロビン量、縦軸が頻度を示している。なお、他の要素としては、ヘマトクリット値や平均赤血球容積（ＭＣＶ）などの臨床検査データを用いることができる。

なお、図４には、図１に示した解析結果画面（画面１）において、検体データ（未知データ）を選択する場合に、検体データ選択タブ１０５をクリックした際に表示される検体データ選択ポップアップ画面（画面３）が示されている。図５には、図４に示した検体データ選択ポップアップ画面（画面３）のファイル読み込みタブ３１をクリックした場合に表示される検体データ選択ポップアップ画面（画面３−１）が示されている。また、図６には、図１に示した解析結果画面（画面１）において、使用する自己組織化マップを選択する場合に、支援マップ選択タブ１０６をクリックした際に表示される支援マップ選択ポップアップ画面（画面４）が示されている。

次に、図１〜図１３を参照して、コンピュータ端末（クライアント）を用いて行う本実施形態によるデータ分類支援方法について説明する。なお、以下に説明するデータ分類支援方法を行う前に、予め、本実施形態によるデータ分類支援方法を実行するためのプログラムが格納されたＦＤやＣＤなどの記録媒体をコンピュータ端末（クライアント）またはサーバに組み込むかまたは上記記録媒体からコンピュータ端末（クライアント）またはサーバにプログラムをインストールする必要がある。本実施形態によるデータ分類支援方法では、自己組織化マップ（支援マップ）の選択を行った後、未知データの分類を行う。具体的には、まず、図１に示した解析結果画面（画面１）の支援マップ選択タブ１０６をクリックすると、図６に示した支援マップ選択ポップアップ画面（画面４）が開く。この画面４において、プルダウンメニュー３２でサーバデータベース（サーバＤＢ）内のマップ生成元の施設を選択する。これにより、その施設が作成した自己組織化マップがプルダウンメニュー３３に反映される。そして、プルダウンメニュー３３において、プルダウンメニュー３２により選択した施設の自己組織化マップの中から所望の疾患に分類された自己組織化マップを選択する。プルダウンメニュー３３で自己組織化マップを選択すると、解説表示部３４に、選択した自己組織化マップの解説が表示される。

ここで、図７を参照して、本実施形態で用いる自己組織化マップについて説明する。本実施形態で用いる自己組織化マップは、図７に示すような自己組織化マップ学習テーブル構造および自己組織化マップテーブル構造に基づいて作成される。図７に示す自己組織化マップ学習テーブル構造において、横方向に配置された要素１〜要素ＮｅのＮｅ個（Ｎｅ次元）の要素から１つの学習データが構成されている。この学習データは、医師によって判断された実際の患者のデータである。図７に示した例では、学習データがＮｓ個ある場合が示されている。また、各学習データに対応して医師が実際に判断した疾患名（クラス１〜クラスＭ）が示されている。このような各学習データと、それらに対応して医師が実際に判断した疾患名（クラス１〜クラスＭ）とに基づいて、公知の自己組織化アルゴリズムにより、セルベクトルデータおよびそのセルベクトルデータの属するクラス（分類領域）が決定されて２次元の自己組織化マップ（図７の右上の図参照）上に表示される。この自己組織化マップは、ｎ×ｎ＝ｎ^２個のセルから構成されている。なお、セルベクトルデータとは、学習データを自己組織化アルゴリズムを用いて学習することにより得られるデータを意味する。各セルのセルベクトルデータは、学習データと同様、要素１〜要素ＮｅのＮｅ個（Ｎｅ次元）の要素から構成されている。なお、各セルは、必ずセルベクトルデータを有する。その一方、各セルは、学習データを有する場合と有しない場合とがある。

図７に示したような自己組織化マップが所定の施設によって作成され、サーバデータベース（サーバＤＢ）内に保存されている。そして、図６に示した画面４において、そのような自己組織化マップを選択する。

図６に示した画面４において、支援マップ（自己組織化マップ）を選択した後、その支援マップ（自己組織化マップ）を用いて、検体データ（未知データ）の分類が行われる。具体的には、図８に示すように、まず、ステップ４１において、１段目の自己組織化マップ１０３ａ（図１参照）で、検体データ（未知データ）の分類処理を行う。この検体データ（未知データ）の分類処理について、図９および図１０を参照して詳細に説明する。

本実施形態による自己組織化マップの分類処理では、まず、図９に示すように、ステップ５１において、未知データ（検体データ）の読み込みを行う。この未知データ（検体データ）の読み込みは、図１に示した解析結果画面（画面１）の検体データ選択タブ１０５をクリックすることにより行う。具体的には、図１に示した画面１の検体データ選択タブ１０５をクリックすると、図４に示す検体データ選択ポップアップ画面（画面３）が表示される。この画面３において、ファイル読み込みタブ３１をクリックすると、図５に示す検体データ選択ポップアップ画面（画面３−１）が開く。この画面３−１で所定の検体データファイル（ＣＳＶファイルまたはＸＭＬファイル（ＭＭＬファイル））を選択してファイルを読み込む。これにより、その読み込んだファイルの検体データリスト一覧が図４の画面３に表示される。画面３に表示された検体データリスト一覧の中から、解析したい検体をクリックすることにより、検体データの選択が行われる。これにより、図４に示す画面３が閉じ、図１に示した解析結果画面（画面１）の検体データ表示部１０２に、読み込んだ検体データが表示される。なお、この検体データ（未知データ）は、上記学習データおよびセルベクトルデータと同様、要素１〜要素ＮｅのＮｅ個（Ｎｅ次元）の要素から構成されている。

図９に示したステップ５１において上記のように検体データ（未知データ）を読み込んだ後、ステップ５２において、セルベクトルデータと未知データ（検体データ）とを比較する。

本実施形態では、図９に示すステップ５２において、セルベクトルデータと未知データ（検体データ）とを比較することによって、ステップ５３において、未知データに１番目に近いセルベクトルデータを有するセル（発火セル）を最小セルとして決定するとともに、２番目からｎ番目に近いセルベクトルデータを有するセルを類似セルとして決定する。なお、ｎは、２以上の整数であり、本実施形態では「１１」に設定されている。

この後、図９に示すステップ５４において、可能性割合の算出を行う。この可能性割合の計算法を以下に説明する。クラス（分類領域）の個数をＭ、クラス（分類領域）ｃの学習データの個数をＮｃとする。また、クラス（分類領域）ｃに属するｊ番目の学習ベクトルをＳｃｊとする。ｉ番目のセルベクトルＥｉに対するクラス（分類領域）ｃの割合値Ｅｉｃは、Ｅｉｃ＝Ｋｃ／Ｋで計算する。ここで、本実施形態では、Ｅｉとして、未知データ（検体データ）を用いる。全てのクラス（分類領域）（ｃ＝１〜Ｍ）についてのＥｉｃを求め、未知データ（検体データ）のクラス（分類領域）割合値とする。但し、ＫｃおよびＫは以下の式（１）および式（２）によって求める。

上記式（１）において、ｆ（）はガウス関数を利用する。

なお、式（１）のＥｉとして、未知データの代わりに最小セルのセルベクトルデータを用いてもよい。また、ｆ（）として、ガウス関数に代えてデルタ関数などを用いてもよい。

図９に示したステップ５４において、上記のように可能性割合を算出した後、ステップ５５において、自己組織化マップを作成する。

自己組織化マップを作成する際の手順としては、図１０に示すように、まず、ステップ６１において、最小セルマークをメモリ上の自己組織化マップに作成する。本実施形態における最小セルマーク１ａは、図２に示すように、検体データ（未知データ）が最も近い最小セル１の地点を示す「×」を用いる。また、ステップ６２において、検体データ（未知データ）に２番目からｎ番目（１１番目）に近い類似セル２を示す類似セルマーク２ａをメモリ上の自己組織化マップに作成する。この類似セルマーク２ａは、図２に示すように、類似セル２の領域を示す四角形状（□）を用いる。

本実施形態では、図２に示すように、自己組織化マップ上に、未知データに最も距離の近い最小セル（発火セル）１が最小セルマーク１ａにより表示される。この場合、ただ１つのセル（最小セル１）の座標を示すだけでは、その周囲セルのセルベクトルデータと未知データとの距離関係が不明である。そこで、本実施形態では、未知データに最も距離の近い最小セル１だけでなく、その周囲にある距離の近い類似セル２群もマーク表示する。これにより、未知データ（検体データ）と類似セル２との関係も視覚化することが可能となる。この場合、類似セルマーク２ａは、未知データと類似セル２のセルベクトルデータとの距離によって変化を持たせる。具体的には、図２に示すように、類似セルマーク２ａの「□」の線の太さを未知データの距離が遠くなるにしたがって小さくするように変化させる。なお、本実施形態では、類似セルマーク２ａの「□」の線のうちの最も細い線を、１つのセル領域を示す枠線よりも太く示すことにより、類似セルマーク２ａの「□」の線とセル領域を示す枠線とを識別可能に示している。

なお、カラー表示可能な画面では、類似セルマーク２ａの「□」の線の色を、セル領域を示す枠線の色と異ならせることにより、類似セルマーク２ａの「□」の線と、セル領域を示す枠線との太さを異ならせることなく、類似セルマーク２ａの「□」の線とセル領域を示す枠線とを識別可能に示すことが可能である。また、カラー表示可能な画面では、最小セルマーク１ａの色を、類似セルマーク２ａの色およびセル領域を示す枠線の色と異ならせるのが好ましい。

また、最小セルマーク１ａおよび類似セルマーク２ａによりマーク表示されるセル群のエリアは、しきい値Ｓを用いることにより変化させることが可能である。しきい値Ｓによって距離Ｌを算出し、未知データ（検体データ）と、あるセルとの距離がＬよりも小さい時、そのセルを最小セル１および類似セル２として表示する。距離Ｌは、以下の式により算出する。

Ｌ＝自己組織化マップ上の全ての隣接セル間のベクトル間距離の平均×Ｓ
本実施形態では、しきい値Ｓを、未知データ（検体データ）に１番目から１１番目（ｎ番目）に近いセル（最小セル１および類似セル２）がマーク表示されるように設定している。

上記のようにして、図９に示したステップ５５において自己組織化マップが作成される。これにより、図８に示したステップ４１に示した検体データ（未知データ）の１段目の自己組織化マップによる分類処理が完了する。

その後、図８に示したステップ４２において、１段目の自己組織化マップ１０３ａと２段目の自己組織化マップ１０３ｂとを結ぶ線の太さを、図９に示したステップ５４で算出した可能性割合に基づいて決定する。具体的には、可能性割合が大きいほど、線が太くなるように決定する。そして、図８に示したステップ４３において、２段目の自己組織化マップ１０３ｂで、検体データ（未知データ）の分類処理を行う。この分類処理では、上述した分類処理（図９参照）および自己組織化マップ作成処理（図１０参照）と同様の処理が行われる。この２段目の自己組織化マップ１０３ｂでは、１段目の自己組織化マップ１０３ｂに表示された３つのクラス（分類領域）に対応するグループＡ、グループＢおよびグループＣの３つの自己組織化マップが作成される。

２段目の自己組織化マップ１０３ｂで分類処理および自己組織化マップ作成処理を行った後、図８に示したステップ４４において、２段目の自己組織化マップ１０３ｂと３段目の自己組織化マップ１０３ｃとを結ぶ線の太さを、図９に示したステップ５４で算出した可能性割合に基づいて決定する。その後、図８に示したステップ４５において、３段目の自己組織化マップ１０３ｃで、検体データ（未知データ）の分類処理を行う。この分類処理では、上述した分類処理（図９参照）および自己組織化マップ作成処理（図１０参照）と同様の処理が行われる。この３段目の自己組織化マップ１０３ｃでは、２段目のグループＡ、グループＢおよびグループＣの３つの自己組織化マップ１０３ｂの各々に表示された２つのクラス（分類領域）に対応して、各２つずつ（合計６つ）の自己組織化マップ１０３ｃが作成される。そして、図８に示したステップ４６において、図１に示すように、解析結果画面（画面１）に、１段目、２段目および３段目の自己組織化マップ１０３ａ〜１０３ｃがツリー状（階層状）に表示される。なお、本実施形態では、自己組織化マップ１０３ａ〜１０３ｃをツリー状（階層状）に表示する際に、１段目の自己組織化マップ１０３ａと２段目の自己組織化マップ１０３ｂとを結ぶ線の近傍、および、２段目の自己組織化マップ１０３ｂと３段目の自己組織化マップ１０３ｃとを結ぶ線の近傍には、それぞれ、可能性割合が数値で表示される。

本実施形態によるツリー状の自己組織化マップの詳細としては、まず、１段目の自己組織化マップ１０３ａには、３つの分類領域Ａ、ＢおよびＣを有する総括的な自己組織化マップが表示される。なお、この１段目の自己組織化マップ１０３ａは、本発明の「第１分類マップ」の一例であり、分類領域Ｃは、本発明の「第１分類領域」の一例であり、分類領域Ｂは、本発明の「第２分類領域」の一例である。また、２段目の自己組織化マップ１０３ｂでは、０％の可能性割合を有するとともに分類領域Ａ１およびＡ２を有するグループＡと、１０％の可能性割合を有するとともに分類領域Ｂ１およびＢ２を有するグループＢと、９０％の可能性割合を有するとともに分類領域Ｃ１およびＣ２を有するグループＣとの３つの自己組織化マップが表示される。なお、この２段目の自己組織化マップ１０３ｂのうち、グループＣの自己組織化マップは、本発明の「第２分類マップ」の一例であり、分類領域Ｃ１は、本発明の「第３分類領域」の一例である。グループＢの自己組織化マップは、本発明の「第３分類マップ」の一例であり、分類領域Ｂ１は、本発明の「第４分類領域」の一例である。本実施形態では、このように、２段目の自己組織化マップ１０３ｂを表示する際に、最小セル１が属する分類領域Ｃに対応するグループＣの自己組織化マップのみならず、最小セル１が属さない分類領域ＡおよびＢに対応するグループＡおよびグループＢの自己組織化マップも表示される。これにより、グループＣによる分類結果以外の分類結果（グループＢの分類結果）が得られる可能性があることが使用者に容易に認識される。

また、２段目の０％の可能性割合を有するグループＡの自己組織化マップは、３段目の０％の可能性割合を有するグループＡ１の自己組織化マップと０％の可能性割合を有するグループＡ２の自己組織化マップとに分割される。また、２段目の１０％の可能性割合を有するグループＢの自己組織化マップは、３段目の１０％の可能性割合を有するグループＢ１の自己組織化マップと、０％の可能性割合を有するグループＢ２の自己組織化マップとに分割される。また、２段目の９０％の可能性割合を有するグループＣの自己組織化マップは、３段目の９０％の可能性割合を有するグループＣ１の自己組織化マップと、０％の可能性割合を有するグループＣ２の自己組織化マップとに分割される。

次に、図８に示したステップ４７において、図１に示した解析結果画面（画面１）の自己組織化マップ１０３のたとえば３段目のグループＣ１の自己組織化マップがクリックされているかどうかが判断される。クリックされた場合には、図２に示す解析詳細ポップアップ画面（画面２−１）が表示される。

ここで、図１および図２を参照して、図１に示した画面１の疾患可能性割合表示部１０４および３段目の対応する自己組織化マップ１０３ｃの下に表示される最終的な疾患可能性割合について説明する。最終的な疾患可能性割合としては、３段目のグループＣ１に属する疾患（３）が８９％の可能性割合であり、同じグループＣ１に属する疾患（４）が１％の可能性割合である。また、３段目のグループＢ１に属する疾患（８）が７％の可能性割合であり、同じグループＢ１に属する疾患（９）が３％の可能性割合である。より詳細には、９０％の可能性割合を有するグループＣ１の自己組織化マップの拡大図（図２参照）に示すように、疾患（３）を示すクラス（分類領域）１１（ハッチング（斜線）がない領域）に、検体データ（未知データ）が最も近い最小セル１および２番目から１１番目に近い類似セル２が存在するので、このクラス１１に対応する疾患（３）が８９％の可能性割合と大きくなり、最小セル１および類似セル２が属しないクラス１２（ハッチング（斜線）がある領域）に対応する疾患（４）の可能性は１％と小さくなる。また、拡大図は図示されていないが、１０％の可能性割合を有する３段目のグループＢ１の自己組織化マップ（図１参照）中において、１番目に近い最小セル１と、２番目から１１番目に近い類似セル２のうちのいくつかとが存在する一方のクラス（分類領域１３）は、７％の可能性割合を有する疾患（８）に対応し、２番目から１１番目に近い類似セル２のうちの残りが存在する他方のクラス（分類領域１４）は、疾患（８）の可能性割合よりも小さい３％の可能性割合を有する疾患（９）に対応する。

次に、図２、図３および図１１を参照して、図２に示した解析詳細ポップアップ画面（画面２−１）における中央表示処理について説明する。図１１に示すステップ７１では、図２に示した解析詳細ポップアップ画面（画面２−１）において、表示切替タブ（中央）１０７がクリックされているかどうかが判断される。クリックされている場合には、図２に示した解析詳細ポップアップ画面（画面２−１）の自己組織化マップの右下に最小セル１が表示された状態から最小セル１が自己組織化マップの中心になるように、メモリ上の自己組織化マップを移動させる。これにより、図３の解析詳細ポップアップ画面（画面２−２）に示すような自己組織化マップの中心に最小セル１が配置されるような表示に切り替わる。なお、図３に示した中央表示から図２に示した標準表示へは、図３に示した表示切替（標準）タブ１０８をクリックすることにより切り替わる。

次に、図１２および図１３を参照して、図２および図３に示したヒストグラム２０の作成処理について説明する。ヒストグラム２０を作成する際には、まず、図９に示した自己組織化マップ分類処理のステップ５１〜５３と同様、図１２に示すステップ８１〜８３において、未知データ読み込み、セルベクトルデータと未知データとの比較および最小・類似セルの決定を行う。この後、ステップ８４において、図２および図３の解析詳細ポップアップ画面（画面２−１、画面２−２）に表示された自己組織化マップの２つのクラス（分類領域）１１および１２の学習データに基づいて、各要素毎に２つのクラス（分類領域）１１および１２のヒストグラム２０ａおよび２０ｂを作成する。図２および図３に示すように、クラス（分類領域）１１のヒストグラム２０ａは実線で示され、クラス（分類領域）１２のヒストグラム２０ｂは一点鎖線で示されている。この後、図１２に示したステップ８５において、最小セル１および類似セル２に含まれる学習データに基づいて、各要素毎に、最小セル１および類似セル２のヒストグラム２０ｃ（図２および図３参照）を作成する。この最小セル１および類似セル２のヒストグラム２０ｃは、点線で示されている。

この後、図１２に示したステップ８６において、未知データ（検体データ）の位置データをヒストグラム上に縦の実線（図２および図３参照）で示す。これにより、図２および図３に示されるようなヒストグラム２０が作成される。なお、ステップ８４および８５において、学習データに基づいてヒストグラム２０ａ〜２０ｃが作成されるが、図１３に示すように、学習データ３が存在するセルと学習データ３が存在しないセルとがあるので、ステップ８４および８５では、学習データが存在するセルのみについてヒストグラムが作成される。

なお、図２および図３に示すヒストグラム２０を見ると、全ての要素について、縦の実線で示された未知データ（検体データ）は、分類領域（クラス）１１の学習データに基づいて作成された実線のヒストグラム２０ａのピーク値近傍に位置することがわかる。また、全ての要素について、最小セル１および類似セル２の学習データに基づいて作成された点線のヒストグラム２０ｃも、未知データ（検体データ）を示す縦の実線と重なっていることがわかる。また、全ての要素について、縦の実線で示された未知データ（検体データ）は、分類領域（クラス）１２の学習データに基づいて作成された一点鎖線のヒストグラム２０ｂに重なっていないことがわかる。これにより、図２および図３に示すグループＣ１の自己組織化マップが正しいことを推測することができる。また、各要素ごとに、ヒストグラム２０が表示されるので、各要素ごとに、未知データ（検体データ）とヒストグラムとを比較することが可能になる。これにより、未知データと類似検体との関係をより正確に視覚的に認識することが可能になる。

また、図２および図３に示した画面２−１および画面２−２では、各要素毎のヒストグラム２０に対応する対象検体（未知データ）の各要素毎のベクトル要素値が表示される。また、最小セル１および類似セル２のうち学習データが存在するものの中から、検体データ（未知データ）に近いものから順に３つの学習データのベクトル要素値が類似検体として表示される。

本実施形態では、上記のように、２段目の自己組織化マップ１０３ｂを表示する際に、最小セル１が属する１段目の自己組織化マップ１０３ａの分類領域Ｃに対応するグループＣの自己組織化マップのみならず、最小セル１が属さない分類領域ＡおよびＢに対応するグループＡおよびグループＢの自己組織化マップも表示することによって、グループＣによる分類結果以外の分類結果（グループＢの分類結果）が得られる可能性があることを使用者に容易に認識させることができる。これにより、正しい分類結果が得られていない可能性があることを使用者に認識させることができる。

また、本実施形態では、ツリー表示された自己組織化マップ１０３において、可能性割合を線の太さによって表示することにより、可能性割合を視覚的に容易に認識することができる。また、可能性割合を示す線の近傍に可能性割合を数値で表示することによって、使用者は、各自己組織化マップの可能性割合を視覚的に容易に認識することができる。

また、図１に示した解析結果画面（画面１）において、自己組織化マップ１０３とともに、その分類領域に属する可能性割合（疾患可能性割合）を表示することによって、どの疾患にどの可能性で該当するのかを容易に認識することができる。

なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれる。

たとえば、上記実施形態では、本発明の分類マップの一例としての自己組織化マップ（ＳＯＭ）を用いて未知データの分類を行う例を示したが、本発明はこれに限らず、自己組織化マップ以外の分類マップを用いて未知データの分類を行う場合にも、同様に適用可能である。

また、上記実施形態では、ツリー表示された自己組織化マップ１０３において、可能性割合を線の太さおよび数値の両方で表示する例を示したが、本発明はこれに限らず、可能性割合を線の太さおよび数値のいずれか一方、または、他の方法で表示してもよい。

また、上記実施形態では、図２および図３に示した自己組織化マップ上の各分類領域（各クラス）をハッチングの有無により視覚的に識別可能にする例を示したが、実際のカラー表示画面上では、自己組織化マップ上の各分類領域（各クラス）に対応して色を異ならせるのが好ましい。

また、上記実施形態では、図１に示した画面１のグループＣ１の自己組織化マップをクリックした場合に表示される画面を、画面２−１および画面２−２（図２および図３参照）の一例として示したが、本発明はこれに限らず、画面１の他の自己組織化マップ（たとえば、グループＢ１の自己組織化マップ）をクリックした場合にも、画面２−１および画面２−２（図２および図３参照）と同様の画面を表示することができる。この場合、画面１においてクリックされた自己組織化マップの拡大図、ヒストグラム、検体データおよび類似検体データが画面２−１（画面２−２）に表示される。

また、上記実施形態では、検体データ（未知データ）をデータベースから読み込む例について説明したが、本発明はこれに限らず、使用者が検体データ（未知データ）をコンピュータ端末から手入力するようにしてもよい。また、上記実施形態のデータ分類支援方法をＷＥＢサービスとして使用者に提供する場合などには、ネットワーク上に送信された検体データ（未知データ）を含むメッセージをコンピュータ端末またはサーバが受け取るようにしてもよい。

また、上記実施形態では、サーバデータベース（サーバＤＢ）内に保存された所定の施設により作成された自己組織化マップを選択して用いる例を示したが、本発明はこれに限らず、インターネット上の所定のホームページから所定の施設により作成された自己組織化マップをダウンロードして用いるようにしてもよい。

本発明の一実施形態によるデータ分類支援方法による解析結果画面（画面１）を示した図である。図１に示した解析結果画面の解析詳細画面（標準表示）（画面２−１）を示した図である。図１に示した解析結果画面の解析詳細画面（中心表示）（画面２−２）を示した図である。本発明の一実施形態のデータ分類支援方法による検体データ選択画面（画面３）を示した図である。図４に示した検体データ選択画面のファイル読み込み画面（画面３−１）を示した図である。本発明の一実施形態のデータ分類支援方法による支援マップ選択画面（画面４）を示した図である。本発明の一実施形態のデータ分類支援方法による自己組織化マップテーブル構造を示した図である。本発明の一実施形態のデータ分類支援方法による未知データ分類ルーチンを説明するためのフローチャートである。本発明の一実施形態のデータ分類支援方法による自己組織化マップの分類処理を説明するためのフローチャートである。本発明の一実施形態のデータ分類支援方法による自己組織化マップの作成処理を説明するためのフローチャートである。本発明の一実施形態のデータ分類支援方法による中央表示処理を説明するためのフローチャートである。本発明の一実施形態のデータ分類支援方法によるヒストグラム作成処理を説明するためのフローチャートである。本発明の一実施形態によるデータ分類支援方法において、学習データが存在するセルと学習データが存在しないセルとを説明するための図である。

符号の説明

１最小セル
２類似セル
１０３自己組織化マップ（分類マップ）
１０３ａ１段目の自己組織化マップ（第１分類マップ）
Ａ分類領域
Ｂ分類領域（第２分類領域）
Ｃ分類領域（第１分類領域）
１０３ｂ２段目の自己組織化マップ（第２分類マップ（Ｃ）、第３分類マップ（Ｂ））
Ｃ１分類領域（第３類領域）
Ｃ２分類領域
Ｂ１分類領域（第４類領域）
Ｂ２分類領域
１０３ｃ３段目の自己組織化マップ
１０４疾患可能性割合表示部

Claims

複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかの前記セルに配置するデータ分類支援方法であって、
第１分類領域と第２分類領域とを含む第１分類マップを用いて、前記未知データをいずれかのセルに配置するステップと、
前記未知データが配置された前記セルが属する、前記第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、前記未知データを前記第２分類マップのいずれかのセルに配置するステップと、
前記未知データが配置された前記セルが属さない、前記第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、前記未知データを前記第３分類マップのいずれかのセルに配置するステップと、
前記第１分類マップ、前記第２分類マップおよび前記第３分類マップを表示するステップとを備えた、データ分類支援方法。
前記未知データが前記第１分類マップの前記第１分類領域および前記第２分類領域に属する可能性を算出するステップと、
前記算出された可能性を、前記第１分類マップ、前記第２分類マップおよび前記第３分類マップとともに表示するステップとをさらに備える、請求項１に記載のデータ分類支援方法。
前記可能性の大きさは、前記第１分類マップと、前記第２分類マップおよび前記第３分類マップとを結ぶ線の太さによって表示される、請求項２に記載のデータ分類支援方法。
前記可能性の大きさは、割合を示す数値によって表示される、請求項２または３に記載のデータ分類方法。
前記第２分類マップは、第３分類領域を含み、
前記未知データが前記第２分類マップの第３分類領域に属する可能性を算出するステップをさらに備える、請求項１〜４のいずれか１項に記載のデータ分類支援方法。
前記第３分類マップは、第４分類領域を含み、
前記未知データが前記第３分類マップの第４分類領域に属する可能性を算出するステップをさらに備える、請求項１〜５のいずれか１項に記載のデータ分類支援方法。
前記未知データは、臨床検査データである、請求項１〜６のいずれか１項に記載のデータ分類支援方法。
前記分類マップは、自己組織化マップである、請求項１〜７のいずれか１項に記載のデータ分類支援方法。
複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかの前記セルに配置するデータ分類支援方法を実行するためのプログラムであって、
第１分類領域と第２分類領域とを含む第１分類マップを用いて、前記未知データをいずれかのセルに配置するステップと、
前記未知データが配置された前記セルが属する、前記第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、前記未知データを前記第２分類マップのいずれかのセルに配置するステップと、
前記未知データが配置された前記セルが属さない、前記第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、前記未知データを前記第３分類マップのいずれかのセルに配置するステップと、
前記第１分類マップ、前記第２分類マップおよび前記第３分類マップを表示するステップとを備えたデータ分類支援方法を実行するためのプログラム。
請求項９に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
複数のセルの集合体からなる複数の分類領域を含む分類マップを用いて未知データをいずれかの前記セルに配置するデータ分類支援装置であって、
第１分類領域と第２分類領域とを含む第１分類マップを用いて、前記未知データをいずれかのセルに配置する第１セル配置手段と、
前記未知データが配置された前記セルが属する、前記第１分類マップの第１分類領域をさらに分類するための第２分類マップを用いて、前記未知データを前記第２分類マップのいずれかのセルに配置する第２セル配置手段と、
前記未知データが配置された前記セルが属さない、前記第１分類マップの第２分類領域をさらに分類するための第３分類マップを用いて、前記未知データを前記第３分類マップのいずれかのセルに配置する第３セル配置手段と、
前記第１分類マップ、前記第２分類マップおよび前記第３分類マップを表示する表示手段とを備えた、データ分類支援装置。