WO2011001584A1

WO2011001584A1 - 情報分類装置、情報分類方法及び情報分類プログラム

Info

Publication number: WO2011001584A1
Application number: PCT/JP2010/003205
Authority: WO
Inventors: 本橋洋介; 坂上秀和; 一色友宏
Original assignee: 日本電気株式会社
Priority date: 2009-06-29
Filing date: 2010-05-12
Publication date: 2011-01-06
Also published as: JPWO2011001584A1; US20120096003A1

Abstract

　本発明は、検索された情報が同種の情報であっても、それらの情報を適切なグループに分類できる情報分類装置を提供することを目的とする。本発明による情報分類装置は、空間配置手段と、分類手段とを備えている。空間配置手段は、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて、第１の情報種別の情報群と第２の情報種別の情報群とを空間配置する処理を実行する。分類手段は、空間配置手段による処理結果に基づいて、第１の情報種別の情報群を分類する。

Description

情報分類装置、情報分類方法及び情報分類プログラム

　本発明は、検索した情報を適切なグループに分類する情報分類装置、情報分類方法及び情報分類プログラムに関する。

　ある特徴を示すキーワード（以下、特徴語と記す）に該当する情報を検索する場合、検索対象になる文書やメール、Ｗｅｂページから特徴語を予め抽出して保存しておく方法がとられることがある。この方法によれば、ユーザが検索したい特徴語を入力した際に、その特徴語を含む文書を抽出し、表示することができる。

　また、予め特徴語を抽出しなくとも該当の情報を検索できる方法が各種知られている。

　特許文献１には、検索者が抽出したい分野の文献を抽出しやすくなるような概念検索システムが記載されている。特許文献１に記載された概念検索システムでは、ステムベクトル作成手段が、辞書作成用文書群における分野を複数に分割してその分野ごとにステムベクトルを作成する。そして、検索対象文書ベクトル作成手段が、そのステムベクトルおよび検索対象文書群を用いて、分野ごとに検索対象文書ベクトル群を作成する。検索用文章ベクトル作成手段が、検索用データと分野データに基づくステムベクトルとを用いて検索用文章ベクトルを作成すると、ベクトル演算手段が、その検索用文章ベクトルと分野データに基づく検索対象文書ベクトル群とを用いて、ベクトル演算値を演算する。

　また、特許文献２には、検索結果を拡張し、関連性の高い文書をさらに抽出する文書検索装置が記載されている。特許文献２に記載された文書検索装置では、文書分類部が、文書間の引用関係が登録された引用関係インデックスに基づき、検索結果の文書を第１の文書集合に分類する。そして、文書拡張部が、第１の文書集合に含まれる文書と関連度が高く、第１の文書集合に含まれない文書によって構成される第２の文書集合を検索する。

　特許文献３には、操作者の意図を反映する文書分類を短時間で効率よく繰り返し行う文書分類装置が記載されている。特許文献１に記載された文書分類装置では、解析部が入力された文書データを解析すると、ベクトル生成部は、その結果から文書特徴ベクトルを生成する。変換関数算出部が、その文書特徴ベクトル相互の類似性を反映する空間に射影されるための表現空間関数を算出すると、ベクトル変換部は、その関数を用いて文書特徴ベクトルを変換する。そして、分類部は、変換した文書特徴ベクトル間の類似度に基づいて文書を分類する。

　特許文献４には、特定の分野の知識を備えた人物を適切に紹介することのできる人物紹介システムが記載されている。特許文献４に記載された人物紹介システムは、キーワードの組合せや文書タイトル、タスクＩＤ等が検索条件として入力されると、関連するタスク及び文書の検索を行い、その文書の作成者及びそのタスクに所定の役割で参加している人物を抽出する。

特開２００４－８６６３５号公報（段落００１２）特開２００７－３２８７１４号公報（段落００１０、００１９）特開平１１－２９６５５２号公報（段落０１２７～０１２９）特開２００２－３０４５３６号公報（段落００２１～００２４，００３６～００３９）

　大量の文書やメール、Ｗｅｂページから抽出された特徴語を対象として検索する場合、抽出した検索結果が膨大になる恐れや、結果の閲覧に時間がかかってしまうという恐れがある。また、この場合、ユーザは、目的の情報にたどり着くまでに手間がかかったり、最適な情報を手に入れられなかったりするという課題がある。これらの課題は、特許文献１～４に記載された技術を用いることにより、ある程度解消することは可能である。

　しかし、特許文献１に記載された概念検索システムでは、分野ごとに作成されたベクトル群をもとに検索を行うため、例えば、分野が同一であれば、異なる業務やプロジェクトで作成された文書も同一のグループに分類されてしまう。そのため、特許文献１に記載された概念検索システムでは、同一の分野の情報を、同一の業務や、関係するプロジェクトといった単位で情報を抽出できないという課題がある。

　また、特許文献２に記載された文書検索装置では、引用関係のある文書を第１の文書集合に分類する。しかし、実際の業務では、引用関係のない文書が多数存在するため、特許文献２に記載された文書検索装置ではこのような文書を適切にグループ化できないという課題がある。

　さらに、特許文献３に記載された文書分類装置では、文書内の単語の出現回数や各単語の共起性をもとに文書特徴ベクトルを生成し、その文書特徴ベクトルを用いて文書分類を行う。しかし、同一の業務や、関係するプロジェクトで使用される文書に含まれる単語、及び、その際生じる単語の共起性は同様になることが多い。そのため、特許文献３に記載された文書分類装置では、同様の単語が含まれる同種の情報を、同一の業務や、関係するプロジェクトごとにグループ化できないという課題がある。

　また、特許文献４に記載された人物紹介システムでは、指定されたキーワード等に該当する文書を、関連するユーザごとに抽出することは可能であるが、抽出された文書の中に含まれる様々な種類の情報を適切に分類することはできないという課題がある。そのため、ユーザにとっては、抽出結果の閲覧負担が大きくなってしまう。

　以上のように、特許文献１～４に記載された技術を用いたとしても、関係するプロジェクトや業務で使われた文書など、同種の文書を適切に分類することはできなかった。

　そこで、本発明は、検索された情報が同種の情報であっても、それらの情報を適切なグループに分類できる情報分類装置、情報分類方法及び情報分類プログラムを提供することを目的とする。

　本発明による情報分類装置は、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて、第１の情報種別の情報群と第２の情報種別の情報群とを空間配置する処理を実行する空間配置手段と、空間配置手段による処理結果に基づいて、第１の情報種別の情報群を分類する分類手段とを備えたことを特徴とする。

　本発明による情報分類方法は、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて、第１の情報種別の情報群と第２の情報種別の情報群とを空間配置する処理を実行し、処理結果に基づいて、第１の情報種別の情報群を分類することを特徴とする。

　本発明による情報分類プログラムは、コンピュータに、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて、第１の情報種別の情報群と第２の情報種別の情報群とを空間配置する処理を実行する空間配置処理、および、空間配置処理の処理結果に基づいて、第１の情報種別の情報群を分類する分類処理を実行させることを特徴とする。

　本発明によれば、検索された情報が同種の情報であっても、それらの情報を適切なグループに分類できる。

本発明による情報分類装置の一実施形態を示すブロック図である。情報記憶部１６１に記憶される情報の例を示す説明図である。関係性記憶部１６２に記憶される管理情報間の関係の例を示す説明図である。分類部１３０に通知する情報の例を示す説明図である。複数の情報を空間配置する場合の例を説明する説明図である。重み付き重心に情報を配置する例を示す説明図である。登録部１４０が、情報記憶部１６１及び関係性記憶部１６２に情報を登録する場合の例を示す説明図である。本実施形態における処理全体の例を示すフローチャートである。空間配置演算部１３１が行う処理の例を示すフローチャートである。代表情報抽出部１３３が行う処理の例を示すフローチャートである。クラスタラベル演算部１３４が行う処理の例を示すフローチャートである。入出力部１５０が検索要求を受け付ける画面の例を示す説明図である。入出力部１５０が検索要求を受け付ける画面の例を示す説明図である。第１の実施例における処理全体の例を示す説明図である。検索結果画面の例を示す説明図である。本発明の最小構成を示すブロック図である。

　以下、本発明の実施形態を図面を参照して説明する。

　図１は、本発明による情報分類装置の一実施形態を示すブロック図である。本実施形態における情報分類装置は、サーバ１０１を備えている。サーバ１０１は、メールシステム１７１や、文書管理システム１７２、スケジュール管理システム１７３等と接続し、これらの接続先から文書（電子文書）やメール（電子メール）、メール送受信のログデータなどを受信する。すなわち、本発明による情報分類装置は、メールシステム１７１や文書管理システム１７２、スケジュール管理システム１７３など他のシステムと連携できると言える。

　なお、メールシステム１７１や、文書管理システム１７２、スケジュール管理システム１７３等は、本発明における情報分類装置に必須の構成ではない。例えば、サーバ１０１が備える記憶部（図示せず）に、文書やメール、メール送受信のログデータ等を予め記憶している場合、サーバ１０１は、メールシステム１７１や、文書管理システム１７２、スケジュール管理システム１７３等に接続されていなくてもよい。

　サーバ１０１は、演算装置１１０と、記憶装置１６０とを備えている。記憶装置１６０は、情報記憶部１６１と、関係性記憶部１６２とを備えている。情報記憶部１６１は、管理する情報（以下、管理情報と記す。）のＩＤや名前などを記憶する。情報記憶部１６１は、例えば、記憶装置１６０が備える磁気ディスク装置等によって実現される。ここで、管理情報とは、本発明を実現するシステムで管理するすべての情報のことである。管理情報には、検索対象の情報（以下、検索対象情報と記す。）や、検索対象情報と関係性のある情報（以下、関係情報と記す。）などが含まれる。関係情報は、検索対象情報の属性を表す情報とは異なる情報であってもよい。なお、検索対象情報や関係情報は、検索指示に応じて定まる概念であり、管理情報が、検索対象情報又は関係情報のうちの一方に属することを意味するものではない。管理情報は、例えば、後述の登録部１４０やユーザにより情報記憶部１６１に記憶される。

　具体的には、情報記憶部１６１は、管理情報として、文書ファイルやメール、Ｗｅｂページを表示するための画面情報（以下、Ｗｅｂページ情報と記す。）のいずれかを少なくとも記憶する。他にも、情報記憶部１６１は、管理情報として、人物や、会議、スケジュール、プロジェクト、タスク、組織、タグ、書籍を示す情報、画像、動画などを記憶していてもよい。なお、以下の説明では、情報記憶部１６１が、管理情報を識別する識別子（以下、ＩＤと記す。）及び管理情報の内容を表す名称と対応付けて記憶する場合について説明する。

　図２は、情報記憶部１６１に記憶される情報の例を示す説明図である。図２に示す例では、情報記憶部１６１が、ＩＤ２０１と、名称２０２と、情報種別２０３と、情報ＵＲＬ２０４とを記憶していることを示す。ＩＤ２０１は、管理情報を識別する識別子である。名称２０２は、管理情報の内容を表す名称である。情報種別２０３は、管理情報を検索するとき、もしくは、検索結果の情報を分類するとき、対象の情報を絞り込むために使用される情報であり、予め定められる情報である。情報ＵＲＬ２０４は、管理情報の実体が存在する位置を特定するための情報である。

　以下の説明では、情報記憶部１６１が、ＩＤ２０１、名称２０２、情報種別２０３及び情報ＵＲＬ２０４を記憶する場合について説明するが、情報記憶部１６１が記憶する内容は、これらの情報に限定されない。例えば、情報記憶部１６１は、他にも、登録者や登録日時、アクセス権等を記憶していてもよい。また、情報ＵＲＬ２０４は情報種別２０３の内容によっては空白であってもよい。

　関係性記憶部１６２は、管理情報間の関係を示す情報を記憶する。関係性記憶部１６２は、例えば、記憶装置１６０が備える磁気ディスク装置等によって実現される。管理情報間の関係を示す情報は、例えば、後述の登録部１４０やユーザにより関係性記憶部１６２に記憶される。

　図３は、関係性記憶部１６２に記憶される管理情報間の関係を示す情報の例を示す説明図である。図３に示す例では、関係性記憶部１６２が、関係元情報ＩＤ３０１と、関係先情報ＩＤ３０２と、関係種別３０３と、重み値３０４とを記憶していることを示す。関係元情報ＩＤ３０１及び関係先情報ＩＤ３０２は、管理情報を識別する識別子（すなわちＩＤ）であり、関係元情報ＩＤ３０１で識別される管理情報と、関係先情報ＩＤ３０２で識別される管理情報との間に、何らかの関係性を有していることを示す。

　関係種別３０３は、関係元情報ＩＤ３０１で識別される管理情報と、関係先情報ＩＤ３０２で識別される管理情報との間における関係の種類を示す情報である。関係種別３０３は、例えば、情報間の関係の中から、特定の関係のみを抽出する場合などに利用される。重み値３０４は、関係元情報ＩＤ３０１で識別される情報と関係先情報ＩＤ３０２で識別される情報との関係性の度合いを示す値である。

　以下の説明では、関係性記憶部１６２が、関係元情報ＩＤ３０１、関係先情報ＩＤ３０２、関係種別３０３及び重み値３０４を記憶する場合について説明するが、関係性記憶部１６２が記憶する内容は、これらの情報に限定されない。例えば、関係性記憶部１６２は、他にも、関連付け人物ＩＤや、関連付け日時などを記憶していてもよい。

　演算装置１１０は、検索部１２０と、分類部１３０と、登録部１４０と、入出力部１５０とを備えている。入出力部１５０は、ユーザの操作に従って入力された検索要求を受信し、その検索要求を検索部１２０に通知する。なお、入出力部１５０は、ユーザ端末から受信した検索要求を検索部１２０に通知してもよい。検索要求には、検索対象情報を絞り込むためのキーワード（以下、検索語と記す。）が含まれるが、検索要求に含まれる内容は検索語に限定されない。例えば、検索要求には、情報記憶部１６１に記憶された情報を識別するための種別（以下、検索情報種別と記す。）や、検索結果の表示件数、検索対象情報を分類するための関係情報を指定する条件（以下、分類条件、または、分類基準情報と記す。）などを含んでいてもよい。また、入出力部１５０は、分類部１３０から受け取った分類結果をもとに、ユーザに提示するための表示画面を生成し、その表示画面を出力する。

　検索部１２０は、情報検索部１２１と、関係情報検索部１２２とを備えている。情報検索部１２１は、入出力部１５０を介して入力された検索語や検索情報種別をもとに、情報記憶部１６１に記憶された管理情報を検索する。情報検索部１２１が行う検索方法は、広く知られた検索方法で実現できる。例えば、情報検索部１２１は、名称２０２に検索語を含む管理情報を検索したり、情報種別２０３が検索情報種別に一致する管理情報を検索したりしてもよい。また、情報ＵＲＬ２０４にＵＲＬが指定されている場合、情報検索部１２１は、そのＵＲＬで特定される管理情報に対して上記検索を行ってもよい。なお、以下の説明では、情報検索部１２１が、検索語や検索情報種別をもとに検索した管理情報群を、第１の情報群と記す。

　関係情報検索部１２２は、情報検索部１２１から受け取った検索結果（すなわち、第１の情報群）をもとに関係性記憶部１６２を検索し、第１の情報群に関係する管理情報を検索する。具体的には、関係情報検索部１２２は、第１の情報群に含まれるＩＤと一致する「関係元ＩＤ」又は「関係先ＩＤ」を含む行を関係性記憶部１６２から抽出する。そして、関係情報検索部１２２は、一致した「関係元ＩＤ」又は「関係先ＩＤ」に対応するＩＤ（すなわち、「関係元ＩＤ」に対応するＩＤは「関係先ＩＤ」であり、「関係先ＩＤ」に対応するＩＤは、「関係元ＩＤ」）で識別される管理情報を情報記憶部１６１から検索する。なお、以下の説明では、関係情報検索部１２２が、第１の情報群をもとに検索した情報群を、第２の情報群と記す。

　また、関係情報検索部１２２は、第１の情報群と第２の情報群との間の関係性を示す情報（以下、関係性情報と記す。）を生成する。例えば、関係情報検索部１２２は、第１の情報群のＩＤ及び第２の情報群のＩＤに、重み値を対応付けた情報を関係性情報として生成してもよい。

　関係情報検索部１２２は、第１の情報群、第２の情報群及び関係性情報を併せて、分類部１３０に通知する。また、入出力部１５０を介して分類条件が入力されている場合には、分類条件もさらに併せて、分類部１３０に通知する。

　図４は、関係情報検索部１２２が、分類部１３０に通知する情報の例を示す説明図である。図４に示す例では、情報検索部１２１が、ＩＤ＝０００１，０００４を含む情報を第１の情報群２１として検索し、関係情報検索部１２２が、ＩＤ＝０００３，０００５，０００６，０００７，００２７，００４６，００５７を含む情報を第２の情報群として検索したことを示す。また、図４に示す例では、関係情報検索部１２２が、第１の情報群のＩＤ＝０００１と第２の情報群のＩＤ＝０００３とが重み値１の関係性を有することを示す関係性情報２３を生成したことを示す。なお、他のＩＤと重み値との関係も同様であるため、説明を省略する。

　このように、検索部１２０は、全体として、入出力部１５０を介して入力された検索語をもとに管理情報を検索し、情報検索部１２１の検索結果（すなわち、第１の情報群）、関係情報検索部１２２の検索結果（すなわち、第２の情報群及び関係性情報）を併せて分類部１３０に通知する機能を持つと言える。

　以下の説明では、第１の情報群を、検索情報種別「文書」又は「メール」で絞り込まれた管理情報とする。また、第２の情報群を、分類条件「人物」で絞り込まれた管理情報とする。このとき、関係性情報は、「文書」又は「メール」と、「人物」との関係性を示す情報になる。なお、第１の情報群及び第２の情報群を絞り込む検索情報種別や分類条件は、上記内容に限定されない。例えば、第１の情報群を、検索情報種別「人物」で絞り込まれた管理情報に、第２の情報群を、分類条件「文書」又は「メール」で絞り込まれた管理情報にしてもよい。さらに、例えば、第１の情報群を、検索情報種別「画像」（「動画」など）で絞り込まれた管理情報にしてもよい。また、例えば、第２の情報群を、分類条件「プロジェクト」又は「イベント」で絞り込まれた管理情報としてもよい。

　なお、以下の説明では、検索情報種別で絞り込まれた第１の情報群に含まれる情報を、第１の種類の情報、分類条件で絞り込まれた第２の情報群に含まれる情報を、第２の種類の情報と記すこともある。

　分類部１３０は、空間配置演算部１３１と、クラスタリング部１３２と、代表情報抽出部１３３と、クラスタラベル演算部１３４とを備えている。

　空間配置演算部１３１は、関係情報検索部１２２から受け取った、第１の情報群、第２の情報群及び関係性情報をもとに、第１の情報群に含まれる情報、及び、第２の情報群に含まれる情報を空間配置する。ここで、空間配置とは、他の情報群との関係性に応じて各情報を座標空間に配置することを言う。また、以下の説明では、情報同士の関係性が高くなるに従って、距離が近くなるように空間配置するものとする。

　図５は、複数の情報を空間配置する場合の例を説明する説明図である。図５に示す例では、空間配置する対象の情報が、情報Ａ，Ｂ，Ｃであるとする。また、独立したそれぞれの情報は、独立した次元軸上に存在するものと仮定し、初めは、情報Ａ，Ｂ，Ｃのそれぞれは、関係しない（独立した）情報であると仮定して、各次元軸上に等しい距離で存在するものとする。この状態の例を、図５（ａ）に示す。

　ここで、情報Ａと情報Ｂとの間に、何らかの関係性を有している場合、空間配置演算部１３１は、これらの関係性に応じて、情報間の距離を変更して各情報を空間配置する。図５（ｂ）に示す例では、情報Ａと情報Ｂが「人物」であるとし、情報Ａと情報Ｂがメール通信を行う関係性を有しているとする。このとき、空間配置演算部１３１は、２つの情報が関係性を有すると判断し、情報Ａの位置を情報Ｂの次元軸方向に移動し、情報Ｂの位置を情報Ａの次元軸方向に移動する（すなわち、情報Ａと情報Ｂとの距離を近づける）空間配置を行う。

　以下の説明では、空間配置演算部１３１が行列を用いた演算を行うことにより各情報を空間配置する場合について説明するが、空間配置演算部１３１が各情報を空間配置する方法は、行列を用いる場合に限定されない。例えば、空間配置演算部１３１は、ベクトルを用いた演算を行うことにより各情報を空間配置してもよい。

　空間配置演算部１３１は、第１の種類の情報と第２の種類の情報との関係性情報をもとに、第１の種類の情報を空間配置し、さらに、空間配置された情報の配置に基づいて第２の種類の情報を空間配置する。なお、空間配置の順番は、逆であってもよい。すなわち、空間配置演算部１３１が、第１の種類の情報と第２の種類の情報との関係性情報をもとに、第２の種類の情報を空間配置し、さらに、空間配置された情報の配置に基づいて第１の種類の情報を空間配置してもよい。

　以下の説明では、空間配置演算部１３１が、まず、第２の種類の情報（すなわち、「人物」）を空間配置し、空間配置された第２の種類の情報の配置に基づいて第１の種類の情報（すなわち、「文書」または「メール」）を空間配置する場合について説明する。ただし、空間配置演算部１３１は、先に、第１の種類の情報（すなわち、「文書」または「メール」）を空間配置し、空間配置された第１の種類の情報の配置に基づいて第２の種類の情報（すなわち、「人物」）を空間配置してもよい。

　以下、空間配置演算部１３１の動作について説明する。空間配置演算部１３１は、第１の情報群と第２の情報群の間の関係性を示す関係行列Ａを作成する。空間配置演算部１３１は、例えば、以下の（式１）に示す条件に基づいて関係行列Ａを作成する。

　（式１）に例示する関係行列Ａは、情報間の関係性の有無（すなわち、関係性情報）を表現したものであるといえる。なお、（式１）では、関係行列Ａの各要素は１または０であるが、空間配置演算部１３１は、これを関係性記憶部１６２から読み取った重み値に置き換えた関係行列Ａを作成してもよい。

　次に、空間配置演算部１３１は、第２の情報群のそれぞれの情報間の関係性を示す関係行列Ｂを作成する。空間配置演算部１３１は、例えば、以下の（式２）に基づいて関係行列Ｂを作成する。

　ここで、行列Ｃは、関係行列Ａの各行を正規化した行列であり、行列Ｄは、関係行列Ａの各列を正規化した行列である。ここで、正規化とは、各行または各列の値の和を一定の値にすることであり、和を１にすることを意味するものとする。具体的には、空間配置演算部１３１は、関係行列Ａの各行の値を行ごとに加算した値で、該当する行の各値を割ったものを行列の各要素に割り当てた行列Ｃを作成する。同様に、空間配置演算部１３１は、関係行列Ａの各列の値を列ごとに加算した値で、該当する列の各値を割ったものを行列の各要素に割り当てた行列Ｄを作成する。

　（式２）により関係行列Ｂを作成することは、第２の種類の情報間に関係性がある場合、それらの情報間の距離を近づけることを意味する。すなわち、関係行列Ｂを作成することは、第１の種類の情報と第２の種類の情報との関係性をもとに、第２の種類の情報を空間配置することを意味する。ここで、関係行列Ｂの各行が第２の情報群のそれぞれの情報の空間座標になる。例えば、関係行列Ｂの１行目を取り出したベクトルが第２の情報群の１つ目の情報の座標になる。

　次に、空間配置演算部１３１は、第１の情報群のそれぞれの情報間の関係性を示す関係行列Ｅを作成する。空間配置演算部１３１は、例えば、以下の（式３）に基づいて関係行列Ｅを作成する。

　（式３）により関係行列Ｅを作成することは、第１の情報群の各々の情報が、関係する第２の情報群が配置された座標の重み付き重心に配置されることを意味する。図６は、第２の種類の情報の重み付き重心に第１の種類の情報を配置する例を示す説明図である。図６に示す例では、「文書Ａ」と、「人Ａ」との間に、重み値「０．８」の関係性を有し、「文書Ａ」と、「人Ｂ」との間に、重み値「０．４」の関係性を有しているとする。この場合、「文書Ａ」は、「人Ａ」と「人Ｂ」の距離を、１／０．８：１／０．４の比率に内分した位置に空間配置される。

　また、配置済みの情報Ａ，Ｂの座標をそれぞれＸａ，Ｘｂとし、配置する情報Ｃと情報Ａ，Ｂの重み値（関係重み値）をそれぞれＷａｃ，Ｗｂｃとしたとき、情報Ｃが配置される座標Ｘｃは、以下の（式４）によっても算出できる。

　例えば、Ｘａ＝（２，３）、Ｘｂ＝（８，９）とし、情報Ｃと情報Ａの重み値Ｗａｃを０．９、情報Ｃと情報Ｂの重み値Ｗｂｃを０．６とした場合、情報Ｃの座標Ｘｃは、（式４）に基づき、Ｘｃ＝（４．４，５．４）と算出される。

　（式４）に示す式では、配置する情報の座標を、配置済みの２つの情報をもとに算出しているが、配置済みの情報は２つに限られない。配置する情報の座標は、３つ以上の情報に対しても同様に算出可能である。

　このように、重み付き重心に配置するとは、第１の種類の情報と第２の種類の情報との関係性の度合（重み値）をもとに、第２の種類の情報の座標間の内分点に第１の種類の情報を配置することであると言える。すなわち、このように関係行列Ｅを作成することは、空間配置された第２の情報群の座標及び第２の情報群と第１の情報群との重み値に基づいて、第１の情報群を空間配置することを意味する。ここで、関係行列Ｅの各行が第１の情報群のそれぞれの情報の空間座標になる。例えば、関係行列Ｅの１行目を取り出したベクトルが第１の情報群の１つ目の情報の座標になる。

　クラスタリング部１３２は、空間配置演算部１３１が配置した情報群の近接度をもとに、空間配置された各情報をグループ化する。すなわち、空間配置演算部１３１が、関係性の高い情報同士を近い距離に空間配置しているため、近接度をもとにグループ化するとは、クラスタリング部１３２が、近い距離に存在する情報同士をグループ化することであると言える。クラスタリング部１３２は、Ｋ－ｍｅａｎｓ法（ｋ平均法）などの一般的な非階層クラスタリング手法を用いて、各情報をグループ化する。なお、情報をグループ化する方法は、Ｋ－ｍｅａｎｓ法に限定されない。クラスタリング部１３２は、例えば、階層型クラスタリング手法や、その具体的手法であるウォード法などを用いて情報をグループ化してもよい。なお、以下の説明では、空間配置された各情報をグループ化することをクラスタ化すると記すこともある。また、分類された各グループのことをクラスタと記すこともある。

　なお、上記のＫ－ｍｅａｎｓ法については、以下のＵＲＬで示される文献「http://ibisforest.org/index.php?k-means%E6%B3%95」に、階層型クラスタリング手法については、以下のＵＲＬで示される文献「http://gihyo.jp/dev/feature/01/visualization/0002 」に、ウォード法については、以下のＵＲＬで示される「http://case.f7.ems.okayama-u.ac.jp/statedu/hbw2-book/node124.html 」に、それぞれ記載されている。

　ここで、Ｋ－ｍｅａｎｓ法を利用して、各要素を分類する方法について説明する。まず、クラスタリング部１３２は、各要素の中から、ランダムにｋ個の要素を選択する。この要素をｗｅｅｄと記す。各ｗｅｅｄを含むクラスタをｋ個作成するため、クラスタリング部１３２は、最も近いｗｅｅｄを含むクラスタに全ての要素を分類する。クラスタリング部１３２は、各クラスタ内の要素の重心を計算し、その重心を新しいｗｅｅｄに決定する。クラスタリング部１３２は、新しく決定したｗｅｅｄであって、最も近いｗｅｅｄを含むクラスタに全ての要素を分類する処理を再帰的に繰り返す。クラスタリング部１３２は、ｗｅｅｄの座標が一定以上移動しなくなったら処理を終了する。

　代表情報抽出部１３３は、クラスタリング部１３２がグループ化したクラスタ内の代表的な情報（以下、代表情報と記す。）を抽出する。例えば、クラスタ内の第１の情報群の中から代表情報を決定する場合、代表情報抽出部１３３は、分類された第１の情報群の各情報と、分類対象の情報以外の第２の種類の情報との関係性に基づいて代表情報を決定する。このとき、代表情報抽出部１３３は、第２の種類の情報との関係性が最も高い情報を代表情報に決定してもよい。例えば、代表情報抽出部１３３は、クラスタ内の第１の情報群（すなわち、「文書」または「メール」）の各々について、同じクラスタ内の第２の種類の情報（すなわち、「人物」）のうち関係性がある情報の個数を数え、第２の種類の情報の個数が最も多い第１の種類の情報を、そのクラスタにおける代表情報としてもよい。なお、クラスタ内の第２の情報群の中から代表情報を決定する場合、代表情報抽出部１３３は、同様に、第１の種類の情報との関係性に基づいて代表情報を決定すればよい。代表情報抽出部１３３が決定した代表情報は、例えば、入出力部１５０に通知され、分類結果を表示する表示部（図示せず）などに出力される。

　このように、代表情報抽出部１３３が、クラスタ内の代表情報を抽出することで、ユーザの検索結果の閲覧負担を軽減できる。

　クラスタラベル演算部１３４は、クラスタの特徴を示す語（以下、ラベルと記す。）を決定する。例えば、クラスタラベル演算部１３４は、クラスタ内の情報のうち、第１の情報群の特徴を示す語（すなわち、ラベル）を決定する。例えば、クラスタラベル演算部１３４は、クラスタ内に含まれる第１の種類の情報それぞれから抽出した単語や文章（以下、内容語と記す。）をもとに、各クラスタのラベルを決定する。具体的には、クラスタラベル演算部１３４は、形態素解析を行うことで各クラスタに含まれる第１の種類の情報から内容語を抽出する。そして、クラスタラベル演算部１３４は、抽出した内容語のうち、クラスタの内容を示す特徴的な内容語をラベルとして決定し、各クラスタに付与する。クラスタラベル演算部１３４が決定したラベルは、例えば、入出力部１５０に通知され、分類結果を表示する表示部（図示せず）などに出力される。

　クラスタラベル演算部１３４は、例えば、文書内に存在する単語の出現頻度に基づいて特徴的な語を抽出するＴＦ／ＩＤＦ法を使用してクラスタの内容を示す特徴的な内容語を決定してもよい。なお、形態素解析を行う方法は広く知られており、例えば、既存の形態素解析アルゴリズム（例えば「ＭｅＣａｂ」や「ＣｈａＳｅｎ」など）を利用してもよいが、形態素解析を行う方法は、これらの方法に限定されない。

　なお、上記の「ＣｈａＳｅｎ」については、以下のＵＲＬで示される文献「http://chasen-legacy.sourceforge.jp/」に、「ＭｅＣａｂ」については、以下のＵＲＬで示される文献「http://mecab.sourceforge.net」に、ＴＦ／ＩＤＦ法については、以下のＵＲＬで示される文献「http://ja.wikipedia.org/wiki/Tf-idf 」または「http://www.forest.dnj.ynu.ac.jp/~ohmori/Paper/NL121/node6.html」に、それぞれ記載されている。

　このように、クラスタラベル演算部１３４がクラスタ内のラベルを決定することで、そのクラスタの特徴が一目で把握できるため、ユーザの検索結果の閲覧負担を軽減できる。

　以上のように、分類部１３０は、検索部１２０から受け取った検索結果（すなわち、第１の情報群及び第２の情報群）と関係性情報とをもとに、検索結果を分類する機能を持つと言える。

　登録部１４０は、メールシステム１７１や文書管理システム１７２のログデータをもとに、記憶装置１６０（より具体的には、情報記憶部１６１及び関係性記憶部１６２）に情報を記憶させる。例えば、ログ情報がメールの送信ログの場合、登録部１４０は、予め定められたルールに基づき、メールデータおよび送受信者を情報記憶部１６１に記憶させ、送受信者とメールの間の関係性を関係性記憶部１６２に記憶させる。例えば、登録部１４０は、メールシステム１７１や文書管理システム１７２から定期的に送信されるログ情報などを受信し、その情報をもとに生成した情報を記憶装置１６０に記憶させてもよい。

　図７は、登録部１４０が、情報記憶部１６１及び関係性記憶部１６２に情報を登録する場合の例を示す説明図である。図７に示す例では、サーバ１０１の設定情報記憶部（図示せず）が、予め定められたルールとして、図７（ｂ）及び図７（ｃ）に例示するルールを記憶しているものとする。例えば、サーバ１０１が、図７（ａ）に例示するメールＭを受信すると、登録部１４０は、図７（ｂ）に例示された条件に基づき、メール保存名を名称２０２に、「メール」を情報種別２０３に、メール保存先を情報ＵＲＬ２０４にそれぞれ記憶させる。メールの送信元についても同様である。これらの情報を記憶させた結果を、図７（ｄ）に示す。

　また、登録部１４０は、図７（ｃ）に例示された条件に基づき、「メールファイル」と、「Ｆｒｏｍ」との関係を、関係種別「メール作者」、重み値「１」として関係性記憶部１６２に記憶させる。これらの情報を記憶させた結果を、図７（ｅ）に示す。なお、図７（ｃ）に例示する重み値は、例えば、ユーザにより、情報間の関係に基づいて予め設定される値である。例えば、２つの情報の間に「download」という関係を有する場合、重み値を予め「１」に設定し、「reference 」という関係を有する場合に、重み値を予め「０．５」に設定してもよい。このように重み値を設定することにより、登録部１４０は、例えば、図３に例示する情報を生成できる。

　検索部１２０（より具体的には、情報検索部１２１と、関係情報検索部１２２）と、分類部１３０（より具体的には、空間配置演算部１３１と、クラスタリング部１３２と、代表情報抽出部１３３と、クラスタラベル演算部１３４）と、登録部１４０と、入出力部１５０は、プログラム（情報分類プログラム）に従って動作するコンピュータのＣＰＵによって実現される。例えば、プログラムは、サーバ１０１の記憶部（図示せず）に記憶され、ＣＰＵは、そのプログラムを読み込み、プログラムに従って、検索部１２０（より具体的には、情報検索部１２１及び関係情報検索部１２２）、及び、分類部１３０（より具体的には、空間配置演算部１３１、クラスタリング部１３２、代表情報抽出部１３３及びクラスタラベル演算部１３４）、登録部１４０、入出力部１５０として動作してもよい。また、検索部１２０（より具体的には、情報検索部１２１と、関係情報検索部１２２）と、分類部１３０（より具体的には、空間配置演算部１３１と、クラスタリング部１３２と、代表情報抽出部１３３と、クラスタラベル演算部１３４）と、登録部１４０と、入出力部１５０とは、それぞれが専用のハードウェアで実現されていてもよい。

　次に動作について説明する。図８は、本実施形態における処理全体の例を示すフローチャートである。まず、入出力部１５０が、ユーザ端末から送信された検索語やユーザの操作に従って入力された検索語（キーワード）を受信すると（ステップＳ４０１）、情報検索部１２１は、検索語に関係する管理情報を情報記憶部１６１から検索する（ステップＳ４０２）。この検索結果を第１の情報群とする。次に、関係情報検索部１２２は、第１の情報群のそれぞれに関係する管理情報を検索する（ステップＳ４０３）。この検索結果を第２の情報群とする。また、関係情報検索部１２２は、第１の情報群と第２の情報群の関係性を示す関係性情報を生成する。空間配置演算部１３１が、第１の情報群と第２の情報群の空間配置を行うと（ステップＳ４０４）、クラスタリング部１３２は、空間配置された結果の近接度をもとにクラスタ化を行う（ステップＳ４０５）。代表情報抽出部１３３は、グループ化した情報（すなわち、クラスタ）の代表情報（例えば、代表文書）を抽出し（ステップＳ４０６）、クラスタラベル演算部１３４は、そのクラスタにラベルを付与する（ステップＳ４０７）。

　クラスタラベル演算部１３４は、クラスタ化されたグループを、さらにグループ化するか否かを判断する（ステップＳ４０８）。クラスタラベル演算部１３４は、例えば、各クラスタに含まれる文書数が一定数以下になるまでグループ化を行うと判断してもよく、また、グループ化した階層数が、一定数以上になるまでグループ化を行うと判断してもよい。

　グループ化すると判断した場合（ステップＳ４０８におけるＹＥＳ）、クラスタリング部１３２、代表情報抽出部１３３及びクラスタラベル演算部１３４は、ステップＳ４０５からステップＳ４０７の処理を繰り返す。すなわち、クラスタリング部１３２が、クラスタ化した情報が形成する空間配置をもとにクラスタ化を行い（ステップＳ４０４）、代表情報抽出部１３３が、クラスタの代表文書を抽出し、クラスタラベル演算部１３４が、そのクラスタにラベルを付与する（ステップＳ４０７）処理を繰り返す。この繰り返し処理は、分類されたクラスタ内に子クラスタを作ることで階層的なクラスタ構造を生成する再帰的な処理であると言える。このように、クラスタラベル演算部１３４が、階層的なクラスタ構造を生成することにより、より詳細な分類が可能になるため、ユーザにとっては、閲覧負担を軽減できる。

　一方、グループ化しないと判断した場合（ステップＳ４０８におけるＮＯ）、入出力部１５０は、分類結果をもとに、ユーザに提示するための表示画面を表示するための情報を生成し、その情報を表示部（図示せず）などに出力する（ステップＳ４０９）。

　次に、空間配置演算部１３１が、第１の情報群及び第２の情報群を空間配置する動作について説明する。図９は、空間配置演算部１３１が行う処理の例を示すフローチャートである。まず、空間配置演算部１３１は、検索部１２０から受け取った第１の情報群及び第２の情報群のうち、最初に配置する情報を決定する（ステップＳ５０１）。最初に配置される情報は第１の情報群と第２の情報群のどちらでもよい。ただし、情報の個数が少ない情報群を最初に配置する方が、後に配置する情報群をより適切にマッピングできるため、より好ましい。以下の説明では、第２の情報群を先に配置する場合について説明する。

　空間配置演算部１３１は、第１の情報群と第２の情報群の間の関係性を示す関係行列Ａを作成する（ステップＳ５０２）。そして、空間配置演算部１３１は、第２の情報群の中のそれぞれの情報間の関係性を示す関係行列Ｂを作成する（ステップＳ５０３）。最後に、空間配置演算部１３１は、第１の情報群の中のそれぞれの情報間の関係性を示す関係行列Ｅを作成する（ステップＳ５０４）。

　次に、代表情報抽出部１３３が代表情報を抽出する動作について説明する。図１０は、代表情報抽出部１３３が行う処理の例を示すフローチャートである。まず、代表情報抽出部１３３は、各クラスタ内に含まれる第１の種類の情報、及び、第２の種類の情報を抽出する（ステップＳ６０１）。次に、代表情報抽出部１３３は、各クラスタ内の第１の情報群のそれぞれについて、同じクラスタ内の第２の種類の情報のうち関係性があるものの個数を数える（ステップＳ６０２）。そして、代表情報抽出部１３３は、この個数が最も多い第１の種類の情報を、そのクラスタにおける代表情報に決定する（ステップＳ６０３）。

　次に、クラスタラベル演算部１３４がラベルを決定する動作について説明する。図１１は、クラスタラベル演算部１３４が行う処理の例を示すフローチャートである。まず、クラスタラベル演算部１３４は、各クラスタ内に含まれる文書、メール、またはＷｅｂページ情報を抽出する（ステップＳ７０１）。次に、クラスタラベル演算部１３４は、抽出した情報（すなわち、文書、メール、Ｗｅｂページ情報）の内容語を形態素解析などで抽出する（ステップＳ７０２）。そして、クラスタラベル演算部１３４は、抽出した内容語を、それぞれ比較し、クラスタの特徴的な内容語（すなわち、ラベル）を決定する（ステップＳ７０３）。

　以上のように、本発明によれば、空間配置演算部１３１が、第１の種類の情報群と、第２の種類の情報群との関係性（例えば、重み値）に基づいて、第１の種類の情報群と第２の種類の情報群とを空間配置（例えば、重み付き重心に配置）する処理を実行する。そして、クラスタリング部１３２が、空間配置演算部１３１の処理結果に基づいて、第２の種類の情報群（または、第１の種類の情報群）を分類する。そのため、検索された情報が同種の情報であっても、それらの情報を適切なグループに分類できる。

　すなわち、本実施形態で説明したように、空間配置演算部１３１が、「文書」または「メール」と、「人物」との関係性に基づいて「人物」の情報群を空間配置する処理を実行し、その処理結果及び上記関係性に基づいて「文書」または「メール」の情報群を空間配置する処理を実行する。そのため、検索された情報が同種の情報であっても、それらの情報を適切なグループに分類できる。具体的には、関係する業務やプロジェクトごとに対象の文書を適切に分類できる。このように分類された結果をユーザに提示することにより、ユーザにとっては、検索結果を閲覧する時の負担が低減する。

　また、本発明によれば、画像や人物など内容語を含まない情報であっても、他の情報との関係性をもとにこれらの情報を空間配置して、関係する業務やプロジェクトごとに対象の画像や人物を分類する。そのため、このように分類された結果をユーザに提示することによっても、ユーザが検索結果を閲覧する時の負担を低減できる。

　例えば、特許文献１に記載された概念検索システムでは、検索用文章をもとに検索用文章ベクトルを作成するが、画像ファイルや人物などからは検索用文章ベクトルを生成できないため、これらの情報を分類することが出来ない。しかし、本発明によれば、画像や人物など内容語を含まない情報を検索した結果であっても、関係するプロジェクトや業務単位で分類できる。

　また、空間配置演算部１３１が、第１の種類の情報と、その第１の種類の情報の属性を表す内容とは異なる第２の種類の情報との関係性をもとに、第２の種類の情報（また第１の種類の情報）を空間配置してもよい。この場合、上記効果に加え、分類する際に使用する情報が、検索された情報の属性を表す内容とは異なる種類の情報であっても、検索された情報を適切なグループに分類できる。

　例えば、「人物」は、「文書」または「メール」の属性を表す内容とは異なる種類の情報であると言える。しかし、本発明によれば、このような情報であっても、検索対象の情報を適切にグループ化できる。

　なお、本実施形態では、「人物」と、「文書」または「メール」との関係性を用いて説明した。この２つの情報（すなわち、「文書」または「メール」と、「人物」）の関係性は、それぞれの情報を分類するために有効に作用すると考えられ、また、この２つの情報の関係のデータは、比較的入手がしやすい。そのため、この２つの情報を分類対象とすることにより、それぞれの情報を適切なグループに分類できる。

　次に、本発明における変形例について説明する。上記実施形態では、関係情報検索部１２２が、２種類の情報群と、それらの情報群の関係性情報を生成し、空間配置演算部１３１が、一方の種類の情報群を空間配置し、その空間配置をもとに、もう一方の情報群を空間配置する場合について説明した。本変形例では、関係情報検索部１２２が、３種類以上の情報群と、それらの情報群の関係性情報を生成し、空間配置演算部１３１が、各種類の情報群を順次空間配置する点において、上記実施形態と異なる。それ以外については、上記実施形態と同様である。

　関係情報検索部１２２は、情報検索部１２１から受け取った検索結果（すなわち、第１の情報群）をもとに関係性記憶部１６２を検索し、第１の情報群に関係する管理情報を検索する。これを、第２の情報群と記す。そして、関係情報検索部１２２は、第１の情報群と第２の情報群との関係性情報（第１－第２関係性情報と記す。）を生成する。

　さらに、関係情報検索部１２２は、第２の情報群をもとに関係性記憶部１６２を検索し、第２の情報群に関係する管理情報を検索する。これを、第３の情報群と記す。そして、関係情報検索部１２２は、第２の情報群と第３の情報群との関係性情報（第２－第３関係性情報と記す。）を生成する。ここで、関係情報検索部１２２は、第１の情報群と第３の情報群との関係性情報（第１－第３関係性情報と記す。）を生成してもよい。以上の処理を、分類するために使用する関係情報の数だけ繰り返す。

　そして、関係情報検索部１２２は、検索した複数の情報群（例えば、第１の情報群、第２の情報群及び第３の情報群）と、複数の関係性情報（例えば、第１－第２関係性情報及び第２－第３関係性情報）を併せて、分類部１３０に通知する。

　空間配置演算部１３１は、関係情報検索部１２２から受け取った複数の情報群（例えば、第１の情報群、第２の情報群及び第３の情報群）と、複数の関係性情報（例えば、第１－第２関係性情報及び第２－第３関係性情報）とをもとに、各情報群に含まれる情報を空間配置する。具体的には、空間配置演算部１３１は、関係性情報をもとに、第１の種類の情報を空間配置し、空間配置した第１の種類の情報の重み付き重心に、第２の種類の情報を空間配置する。さらに、空間配置演算部１３１は、空間配置した第２の種類の情報の重み付き重心に、第３の情報群に含まれる情報を空間配置する。このように、空間配置演算部１３１は、空間配置した情報の重み付き重心に、順次他の情報群の情報を空間配置する処理を繰り返す。なお、空間配置演算部１３１は、用いる情報の種類の数に応じ、３次元や４次元などの多次元の座標空間に情報を配置してもよい。

　なお、その他の構成については、上記実施形態と同様であるため、説明を省略する。

　以上のように、本変形例によれば、空間配置演算部１３１は、第１の種類の情報群と第２の種類の情報群との関係性に基づいて第１の種類の情報群を空間配置する処理を実行する。さらに、空間配置演算部１３１は、その処理結果及び第１の種類とは異なる他の種類の情報群（例えば、第３の情報群）との関係性に基づいてその他の種類の情報群（例えば、第３の情報群）を配置する。そして、クラスタリング部１３２は、第２の種類とは異なる他の種類の情報群（第３の情報群や、分類するために使用する他の情報群）の配置結果に基づいて、第１の情報種別の情報群を分類する。このように、３種類以上の情報を利用しても、検索された情報を分類できる。

　以下、具体的な実施例により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。図１２及び図１３は、入出力部１５０が検索要求を受け付ける画面の例を示す説明図である。ユーザはこれらの画面に対して、検索語とその他の詳細な条件を入力する。なお、詳細な条件は、予め設定されていてもよい。この場合、ユーザは、詳細な条件を入力しなくてもよい。例えば、図１３に例示する画面で、分類基準情報として予め「人物」が選択されている場合、分類基準情報を特に指定しない場合には、予め選択された「人物」を分類基準情報としてもよい。

　図１２に示す例では、検索語として「自動車」が入力され、検索対象情報として「文書」と「メール」が選択されたことを示す。また、分類基準情報として、予め「人物」が選択されていることを示す。また、図１３に例示する画面を利用し、ユーザは、検索対象の情報（第１の情報群）の種別や、分類に用いる情報（第２の情報群）の種別、検索件数やクラスタリング階層の有無などを設定することができる。

　第１の実施例では、第１の情報群として「メール」または「文書」が、第２の情報群として「人物」が、それぞれ指定されたときに、第１の情報群（すなわち、「メール」または「文書」）を分類する場合について説明する。

　図１４は、第１の実施例における処理全体の例を示す説明図である。まず、ユーザが図１２及び図１３に例示する画面を介して検索語を入力すると（ステップＳ８０１）、情報検索部１２１は、その検索語に関係する「文書」または「メール」を検索する（ステップＳ８０２）。そして、関係情報検索部１２２は、検索結果の「文書」または「メール」に関係する「人物」を検索する（ステップＳ８０３）。ここで、空間配置演算部１３１は、「文書」または「メール」と、「人物」との関係性から関係行列を作成して人物を空間配置する（ステップＳ８０４）。さらに、空間配置演算部１３１は、空間配置された「人物」の座標をもとに、「文書」または「メール」を配置する（ステップＳ８０５）。そして、クラスタリング部１３２は、配置された「文書」または「メール」をクラスタリングする（ステップＳ８０６）。その後、代表情報抽出部１３３は、各クラスタの代表情報を抽出する（ステップＳ８０７）。また、クラスタラベル演算部１３４は、各クラスタのラベルを決定し、クラスタごとにそのラベルを付与する（ステップＳ８０９）。そして、入出力部１５０は、分類部１３０から受け取った代表情報や特徴語、各クラスタに分類された情報（名前や属性などを含む）などをもとに、ユーザに提示するための表示画面を生成し、その表示画面を出力する。

　図１５は、本実施例における入出力部１５０が出力する検索結果画面の例を示す説明図である。図１５の例に示すように、入出力部１５０は、検索結果画面に階層化されたクラスタをツリー形式などで表示する。なお、検索結果画面の表示形式はツリー形式に限定されない。例えば、入出力部１５０は、検索結果を一覧表形式で表示してもよい。このとき、ユーザは必要とするクラスタを選択することで、そのクラスタに含まれる文書またはメールを手に入れることができる。

　なお、本実施例では、第１の情報群として「文書」または「メール」が指定された場合について説明した。第１の情報群には、複数の種類の情報を指定してもよく、「文書」のみ、もしくは、「メール」のみのように、１種類の情報を指定してもよい。

　次に、第２の実施例について説明する。第１の実施例では、第１の情報群（すなわち、「文書」または「メール」）を分類する場合について説明した。第２の実施例では、第１の情報群として「文書」が、第２の情報群として「人物」が、それぞれ指定されたときに、第２の情報群（すなわち、「人物」）を分類する場合について説明する。

　まず、検索語が入力されると、情報検索部１２１は、その検索語に関係する「文書」を検索する。そして、関係情報検索部１２２は、検索結果の「文書」に関係する「人物」を検索する。ここで、空間配置演算部１３１は、「文書」と、「人物」との関係性から関係行列を作成して「文書」を空間配置する。さらに、空間配置演算部１３１は、空間配置された「文書」の座標をもとに「人物」を配置する。そして、クラスタリング部１３２は、配置された「人物」をクラスタリングする。

　このように、第２の実施例によれば、情報間の関係性をもとに文書を空間配置し、その結果から人物を空間配置することで、関係する業務やプロジェクトごとに対象の人物を分類できる。このように分類された結果をユーザに提示することにより、ユーザが検索結果を閲覧する時の負担を低減できる。

　次に、第３の実施例について説明する。第１の実施例及び第２の実施例では、２つの情報群を空間配置する場合について説明した。第３の実施例では、３つの情報群を空間配置する場合について説明する。具体的には、第１の情報群として「文書」が、第２の情報群として「メール」が、第３の情報群として「人物」がそれぞれ指定されたときに、第１の情報群（すなわち、「文書」）を分類する場合について説明する。

　まず、検索語が入力されると、情報検索部１２１は、その検索語に関係する「文書」を検索する。そして、関係情報検索部１２２は、検索結果の「文書」に関係する「メール」を検索する。さらに、関係情報検索部１２２は、検索結果の「メール」に関係する「人物」を検索する。ここで、空間配置演算部１３１は、「人物」と「メール」との関係性から関係行列を作成して「人物」を空間配置する。次に、空間配置演算部１３１は、空間配置された「人物」の座標をもとに「メール」を配置する。さらに、空間配置演算部１３１は、空間配置された「メール」の座標をもとに「文書」を配置する。そして、クラスタリング部１３２は、配置された「文書」をクラスタリングする。このように、３つの情報群を使用しても、検索対象の情報をクラスタリングできる。

　次に、第４の実施例について説明する。第４実施例では、４つの情報群を空間配置する場合について説明する。具体的には、第１の情報群として「文書」が、第２の情報群として「メール」が、第３の情報群として「プロジェクト」が、第４の情報群として「人物」がそれぞれ指定されたときに、第１の情報群（すなわち、「文書」）を分類する場合について説明する。

　まず、検索語が入力されると、情報検索部１２１は、その検索語に関係する「文書」を検索する。そして、関係情報検索部１２２は、検索結果の「文書」に関係する「メール」を検索する。次に、関係情報検索部１２２は、検索結果の「メール」に関係する「プロジェクト」を検索する。さらに、関係情報検索部１２２は、検索結果の「プロジェクト」に関係する「人物」を検索する。

　ここで、空間配置演算部１３１は、「人物」と「プロジェクト」との関係性から関係行列を作成して「人物」を空間配置する。次に、空間配置演算部１３１は、空間配置された「人物」の座標をもとに「プロジェクト」を配置する。さらに、空間配置演算部１３１は、空間配置された「プロジェクト」の座標をもとに「メール」を配置する。最後に、空間配置演算部１３１は、空間配置された「メール」の座標をもとに「文書」を配置する。そして、クラスタリング部１３２は、配置された「文書」をクラスタリングする。このように、３種類以上（ここでは、４種類）の情報を使用しても、検索対象の情報をクラスタリングできる。

　次に、第５の実施例について説明する。第５の実施例では、３つの情報群を空間配置する点において、第３の実施例と同様であるが、各情報群に、複数種類の情報を含んでいる点において、第３の実施例と異なる。具体的には、第１の情報群として「文書」または「メール」が、第２の情報群として「イベント」または「スケジュール」が、第３の情報群として「人物」がそれぞれ指定されたときに、第１の情報群（すなわち、「文書」または「メール」）を分類する場合について説明する。

　まず、検索語が入力されると、情報検索部１２１は、その検索語に関係する「文書」または「メール」を検索する。そして、関係情報検索部１２２は、検索結果の「文書」または「メール」に関係する「イベント」または「スケジュール」を検索する。さらに、関係情報検索部１２２は、検索結果の「イベント」または「スケジュール」に関係する「人物」を検索する。ここで、空間配置演算部１３１は、「人物」と、「イベント」または「スケジュール」との関係性から関係行列を作成して「人物」を空間配置する。次に、空間配置演算部１３１は、空間配置された「人物」の座標をもとに「イベント」または「スケジュール」を配置する。さらに、空間配置演算部１３１は、空間配置された「イベント」または「スケジュール」の座標をもとに「文書」または「メール」を配置する。そして、クラスタリング部１３２は、配置された「文書」または「メール」をクラスタリングする。このように、各情報群に複数の種類の情報を使用しても、検索対象の情報をクラスタリングできる。

　次に、第６の実施例について説明する。第６の実施例では、３つの情報群を空間配置する点において、第３及び第５の実施例と同様であるが、情報群の中に、内容語を含まない情報群が存在する点において、第３及び第５の実施例と異なる。具体的には、第１の情報群として「文書」が、第２の情報群として「動画」が、第３の情報群として「出演人物」がそれぞれ指定されたときに、第２の情報群（すなわち、「動画」）を分類する場合について説明する。

　まず、検索語が入力されると、情報検索部１２１は、その検索語に関係する「文書」を検索する。そして、関係情報検索部１２２は、検索結果の「文書」に関係する「動画」を検索する。また、関係情報検索部１２２は、検索結果の「文書」に関係する「出演人物」を検索する。ここで、空間配置演算部１３１は、「文書」と「出演人物」との関係性から関係行列を作成して「出演人物」を空間配置する。次に、空間配置演算部１３１は、空間配置された「出演人物」の座標をもとに「文書」を配置する。さらに、空間配置演算部１３１は、空間配置された「文書」の座標をもとに「動画」を配置する。そして、クラスタリング部１３２は、配置された「動画」をクラスタリングする。このように、各情報群に複数の種類の情報を使用しても、検索対象の情報をクラスタリングできる。

　なお、「動画」をクラスタリングするため、別の関係性情報を用いてもよい。まず、検索対象情報として「動画」が指定されると、情報検索部１２１は、管理情報の中から「動画」を検索する。そして、関係情報検索部１２２は、検索結果の「動画」に関係する「文書」を検索する。さらに、関係情報検索部１２２は、検索結果の「文書」に関係する「出演人物」を検索する。ここで、空間配置演算部１３１は、「出演人物」と、「文書」との関係性から関係行列を作成して「出演人物」を空間配置する。次に、空間配置演算部１３１は、空間配置された「空間人物」の座標をもとに「文書」を配置する。さらに、空間配置演算部１３１は、空間配置された「文書」の座標をもとに「動画」を配置する。そして、クラスタリング部１３２は、配置された「動画」をクラスタリングする。このように、本実施例によれば、内容語を含まない情報に対してもクラスタリングできる。

　以上、具体的な実施例により本発明を説明したが、本発明は、以下に示す様々なシステムの検索機能にも適用することができる。例えば、本発明を適用できるシステムの例として、Ｗｅｂ検索システム、グループウェア、文書共有システム、コンテンツマネージメントシステム、スケジュール管理システムなどが挙げられるが、本発明を適用できるシステムは、これらのシステムに限られない。他のシステムとして、タスク管理システムや、ウェブログシステムなども挙げられる。

　次に、本発明の最小構成を説明する。図１６は、本発明の最小構成を示すブロック図である。本発明による情報分類装置は、第１の情報種別（例えば、第１の種類の情報）の情報群と第２の情報種別（例えば、第２の種類の情報）の情報群との関係性（例えば、関係性情報、重み値）に基づいて、第１の情報種別の情報群と第２の情報種別の情報群とを空間配置する処理を実行する空間配置手段８１（例えば、空間配置演算部１３１）と、空間配置手段８１による処理結果に基づいて、第１の情報種別の情報群を分類する分類手段８２（例えば、クラスタリング部１３２）とを備えている。

　そのような構成により、検索された情報が同種の情報であっても、それらの情報を適切なグループに分類できる。

　また、少なくとも以下に示すような情報分類装置も、上記に示すいずれかの実施形態及び実施例に記載されていると言える。

（１）第１の情報種別（例えば、第１の種類の情報）の情報群と第２の情報種別（例えば、第２の種類の情報）の情報群との関係性（例えば、関係性情報、重み値）に基づいて、第１の情報種別の情報群と第２の情報種別の情報群とを空間配置する処理を実行する空間配置手段（例えば、空間配置演算部１３１）と、空間配置手段による処理結果に基づいて、第１の情報種別の情報群を分類する分類手段（例えば、クラスタリング部１３２）とを備えた情報分類装置。

（２）空間配置手段が、第１の情報種別（例えば、「文書」または「メール」）の情報群と第２の情報種別（例えば、「人物」）の情報群との関係性に基づいて第２の情報種別の情報群を空間配置する処理を実行し、その処理結果及び関係性に基づいて第１の情報種別の情報群を空間配置する処理を実行する情報分類装置。

（３）空間配置手段が、第１の情報種別の情報と第２の情報種別の情報との関係性の度合いを示す値である重み値が高くになるに従って距離（例えば、座標空間上の距離）が近くなるように空間配置する処理（例えば、関係行列Ｂ、関係行列Ｅを作成する処理）を実行する情報分類装置。

（４）空間配置手段が、第１の情報種別の情報群と、その第１の情報種別の情報（例えば、「文書」または「メール」）の属性を表す内容とは異なる情報である第２の情報種別（例えば、「人物」）の情報群との関係性に基づいて、第１の情報種別の情報群と第２の情報種別の情報群とを空間配置する処理を実行する情報分類装置。

（５）分類手段が分類した情報のグループの中から、そのグループの代表である代表情報を決定する代表情報決定手段（例えば、代表情報抽出部１３３）を備え、代表情報決定手段が、分類対象の各情報と、分類対象の情報以外の情報との関係性（例えば、関係する情報の個数）に基づいて代表情報を決定する情報分類装置。

（６）分類手段が分類した情報のグループごとの特徴を示す語（例えば、ラベル）を決定する特徴語決定手段（例えば、クラスタラベル演算部１３４）を備え、特徴語決定手段が、グループに含まれる情報のそれぞれから抽出した語をもとに、グループにおける特徴を示す語を決定する情報分類装置。

（７）空間配置手段が、文書またはメールと、人物情報との関係性に基づいて、人物情報を空間配置する処理を実行し、空間配置された人物情報の配置及び関係性に基づいて、文書またはメールを空間配置する処理を実行し、分類手段が、空間配置された文書またはメールの配置に基づいて、その文書またはメールを分類する情報分類装置。

（８）空間配置手段が、人物情報と、文書またはメールとの関係性に基づいて、文書またはメールを空間配置する処理を実行し、空間配置された文書またはメールの配置及び関係性に基づいて、人物情報を空間配置する処理を実行し、分類手段が、空間配置された人物情報の配置に基づいて、その人物情報を分類する情報分類装置。

（９）空間配置手段が、画像と人物情報との関係性に基づいて、人物情報を空間配置する処理を実行し、空間配置された人物情報の配置及び関係性に基づいて、画像を空間配置する処理を実行し、分類手段が、空間配置された画像の配置に基づいて、その画像を分類する情報分類装置。

（１０）空間配置手段が、人物情報と画像との関係性に基づいて、画像を空間配置する処理を実行し、空間配置された画像の配置及び関係性に基づいて、人物情報を空間配置する処理を実行し、分類手段が、空間配置された人物情報の配置に基づいて、その人物情報を分類する情報分類装置。

（１１）空間配置手段が、文書またはメールと、プロジェクトまたはイベントとの関係性に基づいて、プロジェクトまたはイベントを空間配置する処理を実行し、空間配置されたプロジェクトまたはイベントの配置及び関係性に基づいて、文書またはメールを空間配置する処理を実行し、分類手段が、空間配置された文書またはメールの配置に基づいて、その文書またはメールを分類する情報分類装置。

（１２）空間配置手段が、プロジェクトまたはイベントと、文書またはメールとの関係性に基づいて、文書またはメールを空間配置する処理を実行し、空間配置された文書またはメールの配置及び関係性に基づいて、プロジェクトまたはイベントを空間配置する処理を実行し、分類手段が、空間配置されたプロジェクトまたはイベントの配置に基づいて、そのプロジェクトまたはイベントを分類する情報分類装置。

（１３）空間配置手段が、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて第２の情報種別の情報群を空間配置する処理を実行し、その処理結果及び第１の情報種別とは異なる他の情報種別の情報群（例えば、第３の情報群）との関係性に基づいてその他の情報種別の情報群（例えば、第３の情報群）を配置し、分類手段が、第２の情報種別とは異なる他の情報種別の情報群（第３の情報群や、分類するために使用する他の情報群）の配置結果に基づいて、第１の情報種別の情報群を分類する情報分類装置。

　以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２００９年６月２９日に出願された日本特許出願２００９－１５４２１２を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本発明は、検索した情報を適切なグループに分類する情報分類装置に好適に適用される。

　１０１　サーバ
　１１０　演算装置
　１２０　検索部
　１２１　情報検索部
　１２２　関係情報検索部
　１３０　分類部
　１３１　空間配置演算部
　１３２　クラスタリング部
　１３３　代表情報抽出部
　１３４　クラスタラベル演算部
　１４０　登録部
　１５０　入出力部
　１６０　記憶装置
　１６１　情報記憶部
　１６２　関係性記憶部
　１７１　メールシステム
　１７２　文書管理システム
　１７３　スケジュール管理システム

Claims

　第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて、前記第１の情報種別の情報群と前記第２の情報種別の情報群とを空間配置する処理を実行する空間配置手段と、
　前記空間配置手段による処理結果に基づいて、前記第１の情報種別の情報群を分類する分類手段とを備えた
　ことを特徴とする情報分類装置。
　空間配置手段は、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて前記第２の情報種別の情報群を空間配置する処理を実行し、当該処理結果及び前記関係性に基づいて前記第１の情報種別の情報群を空間配置する処理を実行する
　請求項１記載の情報分類装置。
　空間配置手段は、第１の情報種別の情報と第２の情報種別の情報との関係性の度合いを示す値である重み値が高くになるに従って距離が近くなるように空間配置する処理を実行する
　請求項１または請求項２記載の情報分類装置。
　空間配置手段は、第１の情報種別の情報群と、当該第１の情報種別の情報の属性を表す内容とは異なる情報である第２の情報種別の情報群との関係性に基づいて、前記第１の情報種別の情報群と前記第２の情報種別の情報群とを空間配置する処理を実行する
　請求項１から請求項３のうちの記載の情報分類装置。
　分類手段が分類した情報のグループの中から、当該グループの代表である代表情報を決定する代表情報決定手段を備え、
　前記代表情報決定手段は、分類対象の各情報と、分類対象の情報以外の情報との関係性に基づいて前記代表情報を決定する
　請求項１から請求項４のうちのいずれか１項に記載の情報分類装置。
　分類手段が分類した情報のグループごとの特徴を示す語を決定する特徴語決定手段を備え、
　前記特徴語決定手段は、前記グループに含まれる前記情報のそれぞれから抽出した語をもとに、前記グループにおける特徴を示す語を決定する
　請求項１から請求項５のうちのいずれか１項に記載の情報分類装置。
　空間配置手段は、文書またはメールと、人物情報との関係性に基づいて、前記人物情報を空間配置する処理を実行し、空間配置された人物情報の配置及び前記関係性に基づいて、前記文書またはメールを空間配置する処理を実行し、
　分類手段は、空間配置された文書またはメールの配置に基づいて、当該前記文書またはメールを分類する
　請求項１から請求項６のうちのいずれか１項に記載の情報分類装置。
　空間配置手段は、人物情報と、文書またはメールとの関係性に基づいて、前記文書またはメールを空間配置する処理を実行し、空間配置された文書またはメールの配置及び前記関係性に基づいて、前記人物情報を空間配置する処理を実行し、
　分類手段は、空間配置された人物情報の配置に基づいて、当該人物情報を分類する
　請求項１から請求項６のうちのいずれか１項に記載の情報分類装置。
　空間配置手段は、画像と人物情報との関係性に基づいて、前記人物情報を空間配置する処理を実行し、空間配置された人物情報の配置及び前記関係性に基づいて、前記画像を空間配置する処理を実行し、
　分類手段は、空間配置された画像の配置に基づいて、当該画像を分類する
　請求項１から請求項６のうちのいずれか１項に記載の情報分類装置。
　空間配置手段は、人物情報と画像との関係性に基づいて、前記画像を空間配置する処理を実行し、空間配置された画像の配置及び前記関係性に基づいて、前記人物情報を空間配置する処理を実行し、
　分類手段は、空間配置された人物情報の配置に基づいて、当該人物情報を分類する
　請求項１から請求項６のうちのいずれか１項に記載の情報分類装置。
　空間配置手段は、文書またはメールと、プロジェクトまたはイベントとの関係性に基づいて、前記プロジェクトまたはイベントを空間配置する処理を実行し、空間配置されたプロジェクトまたはイベントの配置及び前記関係性に基づいて、前記文書またはメールを空間配置する処理を実行し、
　分類手段は、空間配置された文書またはメールの配置に基づいて、当該文書またはメールを分類する
　請求項１から請求項６のうちのいずれか１項に記載の情報分類装置。
　空間配置手段は、プロジェクトまたはイベントと、文書またはメールとの関係性に基づいて、前記文書またはメールを空間配置する処理を実行し、空間配置された文書またはメールの配置及び前記関係性に基づいて、前記プロジェクトまたはイベントを空間配置し、
　分類手段は、空間配置されたプロジェクトまたはイベントの配置に基づいて、当該プロジェクトまたはイベントを分類する
　請求項１から請求項６のうちのいずれか１項に記載の情報分類装置。
　空間配置手段は、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて前記第２の情報種別の情報群を空間配置する処理を実行し、当該処理結果及び第１の情報種別とは異なる他の情報種別の情報群との関係性に基づいて当該他の情報種別の情報群を配置し、
　分類手段は、第２の情報種別とは異なる他の情報種別の情報群の配置結果に基づいて、第１の情報種別の情報群を分類する
　請求項１記載の情報分類装置。
　第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて、前記第１の情報種別の情報群と前記第２の情報種別の情報群とを空間配置する処理を実行し、
　前記処理結果に基づいて、前記第１の情報種別の情報群を分類する
　ことを特徴とする情報分類方法。
　第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて前記第２の情報種別の情報群を空間配置する処理を実行し、当該処理結果及び前記関係性に基づいて前記第１の情報種別の情報群を空間配置する処理を実行する
　請求項１４記載の情報分類方法。
　第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて前記第２の情報種別の情報群を空間配置する処理を実行し、
　前記処理結果及び第１の情報種別とは異なる他の情報種別の情報群との関係性に基づいて当該他の情報種別の情報群を配置し、
　第２の情報種別とは異なる他の情報種別の情報群の配置結果に基づいて、第１の情報種別の情報群を分類する
　請求項１４記載の情報分類方法。
　コンピュータに、
　第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて、前記第１の情報種別の情報群と前記第２の情報種別の情報群とを空間配置する処理を実行する空間配置処理、および、
　前記空間配置処理の処理結果に基づいて、前記第１の情報種別の情報群を分類する分類処理
　を実行させるための情報分類プログラム。
　コンピュータに、
　空間配置処理で、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて前記第２の情報種別の情報群を空間配置する処理を実行させ、当該処理結果及び前記関係性に基づいて前記第１の情報種別の情報群を空間配置する処理を実行させる
　請求項１７記載の情報分類プログラム。
　コンピュータに、
　空間配置処理で、第１の情報種別の情報群と第２の情報種別の情報群との関係性に基づいて前記第２の情報種別の情報群を空間配置する処理を実行させ、当該処理結果及び第１の情報種別とは異なる他の情報種別の情報群との関係性に基づいて当該他の情報種別の情報群を配置させ、
　分類処理で、第２の情報種別とは異なる他の情報種別の情報群の配置結果に基づいて、第１の情報種別の情報群を分類させる
　請求項１７記載の情報分類プログラム。