JP2014048689A

JP2014048689A - 検索支援システム、検索支援方法、およびコンピュータプログラム

Info

Publication number: JP2014048689A
Application number: JP2012188559A
Authority: JP
Inventors: Satoshi Izushi; 聡史出石; Yoichi Kawabuchi; 洋一河渕; Yoshimi Moriwaki; 香美森脇
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2012-08-29
Filing date: 2012-08-29
Publication date: 2014-03-17
Anticipated expiration: 2032-08-29
Also published as: JP5954053B2

Abstract

【課題】ユーザの欲しい情報を従来よりも確実に検索することができるように支援する。
【解決手段】プロファイル管理サーバ１に、ユーザの行動を示すアクションデータ７Ｂを取得するアクションデータ取得部１０２と、アクションデータ７Ｂに示される行動に関連する文書の文書データ６ＤＣを取得する作業文書データ取得部１０３と、文書データ６ＤＣに基づいて文書から単語を抽出する単語抽出部１０５と、抽出された単語をユーザによる検索の際に用いられるキーワードとして示すプロファイルデータ７Ｆを記憶するプロファイルデータ記憶部１２３と、を設ける。
【選択図】図３

Description

本発明は、ユーザがコンピュータによって情報を検索する際の支援のための技術に関する。

従来、ユーザが指定した単語を検索クエリ（検索キー）として情報の検索を行う技術が普及している。

近年、ローカルのコンピュータにもインターネット上のコンピュータにも情報がますます多く記憶されている。よって、非常に多くの情報が検索によってヒットすることがある。ヒットする情報が多いと、ユーザは、さらに、自分に必要な情報をヒットした情報の中から絞り込まなければならない。

したがって、情報の検索を容易に行えることがユーザから求められる。このための方法として、幾つかの方法が考えられる。

例えば、情報を予め分類しておくことが、考えられる。これにより、検索の範囲を限定することができる。分類の方法として、次の方法が提案されている。

複数の文書それぞれに関するコンテキストを取得し、取得されたコンテキストの組合せに応じて複数の文書それぞれの優先度を算出しておく。優先度に応じて、複数の文書を、分類の処理のタイミングが異なる複数のキューのいずれかへ格納する（特許文献１）。そのほか、電子化された文書が入力されるごとにこれを解析して文書タイプ候補を抽出し、文書タイプ別に分類することが、提案されている（特許文献２）。

また、情報に、ユーザから指示された処理に関する属性を対応付けておき、これに基づいて検索を行うことが、提案されている（特許文献３）。

また、情報からキーワードを抽出し、キーワードを辞書に登録しておくことが、提案されている（特許文献４）。

そのほか、無作為に発生して蓄積される操作履歴の中からユーザの意図に基づく一連の操作履歴群を少ない処理量で抽出する方法が、次の通り提案されている。入力装置から入力されるユーザ操作を監視して、ドキュメントの作成／更新／参照処理や、送信／印刷などのドキュメント出力処理を抽出し、操作対象のドキュメント名と、操作が発生した時刻、操作を行ったユーザ識別子および送信先のユーザ識別子などとを操作履歴として記録する。そして、蓄積された操作履歴を解析し、たとえば予め定められた時間的な範囲内にあって時系列に並んだユーザ別の小さな履歴列に分割して、この分割後の操作履歴群をクラスタとして記録する（特許文献５）。

特開２０１２−６８８３７号公報特開平８−２６３４８１号公報特開２００３−１６７７６７号公報ＷＯ０５／０６６８３７号公報特開２０００−１７２６９６号公報

上述の従来の方法によると、情報をある程度絞り込んで検索することができる。しかし、検索クエリとして用いる単語を的確に指定しなければ、ユーザの欲しい情報が上手くヒットしないことがある。

本発明は、このような問題点に鑑み、ユーザの欲しい情報を従来よりも確実に検索することができるように支援することを、目的とする。

本発明の一形態に係る検索支援システムは、ユーザの行動または状況を示すユーザデータを取得するユーザデータ取得手段と、前記ユーザデータに示される前記行動または状況に関連する文書である関連文書の文書データを取得する文書データ取得手段と、前記文書データに基づいて前記関連文書から単語を抽出する単語抽出手段と、抽出された前記単語を前記ユーザによる検索の際に用いられるキーワードとして示すキーワードデータを記憶するキーワードデータ記憶手段と、を有する。

好ましくは、前記文書データ取得手段は、前記ユーザデータに示される前記行動または状況が特定の行動または状況である場合に、前記文書データを取得する。当該特定の行動または状況は、複数あってもよい。そして、複数のうちのいずれか１つに該当すれば文書データを取得してもよい。

または、前記文書データ取得手段は、文書を取り扱うことが前記行動または状況として前記文書データに示されている場合は、当該取り扱う文書のデータを前記文書データとして取得する。文書の作成、編集（コピー、ペースト等）、保存、管理（保存場所の移動、文書名の変更等）、閲覧、破棄、印刷、スキャン、および検索などが、文書の取扱いの例として、挙げられる。前記単語抽出手段は、前記取り扱う文書の中の前記ユーザが注目した部分がさらに前記文書データに示されている場合は、当該部分のみから前記単語を抽出してもよい。ペン型のデバイスによって指される部分またはアンダーラインまたは手書きコメントをユーザが書き込んでいる部分が、注目している部分の一例である。

前記文書データ取得手段は、発言が前記行動または状況として前記文書データに示されている場合は、当該会話の際に前記ユーザが使用する文書のデータを前記文書データとして取得する。前記発言の例として、相手との直接の会話、電話による相手との会話、および会議による発言などが挙げられる。

または、前記特定の行動または状況を変更する変更手段、を有する。

または、前記単語ごとに、重要性の度合いを表わす重要度を算出する、重要度算出手段、を有し、前記キーワードデータ記憶手段は、さらに、前記単語ごとに、当該単語の前記重要度を対応付けて記憶する。

または、前記重要度算出手段は、前記行動または状況に応じたアルゴリズムまたはパラメータによって前記重要度を算出する。

または、前記キーワードデータに基づいて、前記ユーザが指定した検索クエリーを補正する、検索クエリー補正手段と、補正された前記検索クエリーに基づいて情報を検索する処理を行う検索処理手段と、を有する。

または、前記単語同士の関連性の度合いである関連度を算出する関連度算出手段、を有し、前記検索処理手段は、前記検索クエリーを、当該検索クエリーに含まれる単語との前記関連度が最も高い単語を当該検索クエリーに付加することによって、補正する。

または、前記重要度が所定の値以上である前記単語ごとに、当該単語を検索クエリーとして情報を検索する検索手段と、前記検索手段による検索結果を、前記単語ごとにグループ化して提示する、検索結果提示手段と、を有する。

本発明によると、ユーザの欲しい情報を従来よりも確実に検索することができるように支援することができる。

文書管理システムの全体的な構成の例を示す図である。プロファイル管理サーバのハードウェア構成の例を示す図である。プロファイル管理サーバの機能的構成の例を示す図である。端末装置のハードウェア構成の例を示す図である。端末装置の機能的構成の例を示す図である。ディレクトリ構造におけるデータの検索の方法の例を示す図である。取得トリガアクションデータの例を示す図である。取得トリガアクションデータの例を示す図である。取得トリガアクションデータを作成するためのＧＵＩ画面の例を示す図である。取得トリガアクションデータの変形例を示す図である。カレントケースの切換えの例を示す図である。文書データ取得処理の流れの例を説明するフローチャートである。プロファイルデータの例を示す図である。確認ダイアログボックスの例を示す図である。プロファイル管理サーバにおける全体的な処理の流れの例を説明するフローチャートである。プロファイル管理サーバにおける全体的な処理の流れの例を説明するフローチャートである。

図１は、文書管理システム１ＳＹの全体的な構成の例を示す図である。図２は、プロファイル管理サーバ１のハードウェア構成の例を示す図である。図３は、プロファイル管理サーバ１の機能的構成の例を示す図である。図４は、端末装置２のハードウェア構成の例を示す図である。図５は、端末装置２の機能的構成の例を示す図である。

文書管理システム１ＳＹは、図１に示すように、プロファイル管理サーバ１、端末装置２、ドキュメントサーバ３、画像形成装置４、および通信回線５などによって構成される。

文書管理システム１ＳＹは、種々の情報、特に文書を管理しユーザに提供するためのシステムである。文書管理システム１ＳＹは、企業、役所、または学校などの組織に設置され、組織のメンバーによって用いられる。以下、ある企業において文書管理システム１ＳＹが用いられる場合を例に説明する。したがって、この企業の従業員が文書管理システム１ＳＹのユーザである。各ユーザには、ユニークなＩＤ（identification）であるユーザコードが１つずつ与えられている。

プロファイル管理サーバ１、端末装置２、ドキュメントサーバ３、および画像形成装置４は、通信回線５を介して通信を行うことができる。通信回線５として、固定電話回線、携帯電話網、ＰＨＳ（Personal Handy-phone System）回線、専用線、インターネット、またはいわゆるＬＡＮ（Local Area Network）回線などが用いられる。ＬＡＮ回線の全部または一部として、無線ＬＡＮの回線を用いることができる。

プロファイル管理サーバ１は、ユーザごとのプロファイルを管理する。プロファイルとして、特に、ユーザに関連する単語を管理する。また、ユーザに関連する単語をキーワードとして用いて文書の検索を支援する。これらについては、後に詳細に説明する。

プロファイル管理サーバ１は、図２に示すように、ＣＰＵ（Central Processing Unit）１０ａ、ＲＡＭ（Random Access Memory）１０ｂ、ＲＯＭ（Read Only Memory）１０ｃ、ハードディスク１０ｄ、およびＮＩＣ（Network Interface Card）１０ｅなどによって構成される。

ＮＩＣ１０ｅは、端末装置２、ドキュメントサーバ３、および画像形成装置４のほか、インターネット上のウェブサーバなどと通信を行うための装置である。

ＲＯＭ１０ｃまたはハードディスク１０ｄには、図３に示す操作状況データ取得部１０１、アクションデータ取得部１０２、作業文書データ取得部１０３、カレントケース切換部１０４、単語抽出部１０５、重要度算出部１０６、関連度算出部１０７、プロファイルデータ生成部１０８、取得トリガアクション記憶部１２１、カレントケースデータ記憶部１２２、プロファイルデータ記憶部１２３、情報検索部１３１、および学習処理部１３２などの機能を実現するためのプログラムが記憶されている。このプログラムは、プロファイルの管理および情報の検索のためのものである。このプログラムは、必要に応じてＲＡＭ１０ｂにロードされ、ＣＰＵ１０ａによって実行される。

図１に戻って、端末装置２は、文書（ドキュメント）の作成および編集を行ったり、プロファイル管理サーバ１、ドキュメントサーバ３、および画像形成装置４などが提供する種々のサービスを受けたりするための装置である。端末装置２として、パーソナルコンピュータ、タブレットコンピュータ（タブレットＰＣ）、携帯電話端末、またはスマートフォンなどが用いられる。以下、端末装置２としてタブレットコンピュータが用いられる場合を例に説明する。

端末装置２は、図４に示すように、ＣＰＵ２０ａ、ＲＡＭ２０ｂ、フラッシュメモリ２０ｃ、タッチパネルディスプレイ２０ｄ、操作ボタン群２０ｅ、無線ＬＡＮ通信装置２０ｆ、近距離無線通信装置２０ｇ、携帯電話通信装置２０ｈ、マイクロフォン２０ｉ、スピーカ２０ｊ、デジタルカメラ２０ｋ、およびジャイロセンサ２０ｍなどによって構成される。

タッチパネルディスプレイ２０ｄは、ユーザに対してメッセージを与えるための画面、処理の結果を示す画面、またはユーザが指示を入力するための画面などを表示する。また、タッチパネルディスプレイ２０ｄは、タッチされた位置を検知し、ＣＰＵ２０ａにその位置を通知する。

操作ボタン群２０ｅは、いわゆるホーム画面に戻るためのボタン、音量を調整するためのボタン、および電源のオン／オフを切り換えるためのボタンなどによって構成される。

無線ＬＡＮ通信装置２０ｆ、近距離無線通信装置２０ｇ、および携帯電話通信装置２０ｈは、いずれも、無線によって他の装置と通信を行うための装置である。ただし、それぞれ、通信の方式などが異なる。

無線ＬＡＮ通信装置２０ｆは、無線ＬＡＮの規格、つまり、ＩＥＥＥ（Institute of Electrical and Electronics Engineers）８０２．１１の規格に基づいて通信を行う。

近距離無線通信装置２０ｇは、近距離無線通信の規格に基づいて通信を行う。例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）またはＺｉｇＢｅｅなどの規格に基づいて通信を行う。また、ワイヤレスキーボード、ワイヤレスマウス、エアペン（Air Pen）、視線追従型ヘッドマウントディスプレイ、およびジェスチャコントローラなどを、近距離無線通信装置２０ｇを介して端末装置２に接続することもできる。なお、ジェスチャコントローラは、深度センサまたはジャイロセンサなどを有し、ユーザがジェスチャによって本体（本例では、端末装置２）をコントロールするための入力装置である。ジェスチャコントローラとして、マイクロソフト社のＫｉｎｅｃｔまたはリープモーション社のＬＥＡＰなどが用いられる。

携帯電話通信装置２０ｈは、ＣＤＭＡ（Code Division Multiple Access）２０００またはＷ−ＣＤＭＡ（Wideband-CDMA）などの規格に基づいて通信を行う。

マイクロフォン２０ｉは、集音し音声データを生成する。スピーカ２０ｊは、音声データに基づいて音声を出力する。デジタルカメラ２０ｋは、画像を撮影し画像データを生成する。動画像を撮影し動画像の画像データを生成することも、できる。ジャイロセンサ２０ｍは、端末装置２の姿勢を検知する。

フラッシュメモリ２０ｃには、文書（ドキュメント）の作成用のアプリケーション（例えば、ワープロソフト）がインストールされている。そのほか、メーラ、ウェブブラウザ、スケジューラ、メッセンジャ、ＩＰ電話アプリケーション、および声紋判別アプリケーションなどのアプリケーションがインストールされている。

さらに、フラッシュメモリ２０ｃには、図５に示す文書操作検知部２０１、作業文書データ判別部２０２、操作状況通知部２０３、アクション検知部２０４、アクション通知部２０５、作業文書データ送信部２０６、情報検索クライアント２０７、切換要求部２１１、およびケース通知部２１２などの機能を実現するためのプログラムが記憶されている。

これらのプログラムは、必要に応じてＲＡＭ２０ｂにロードされ、ＣＰＵ２０ａによって実行される。

図１に戻って、ドキュメントサーバ３は、文書のデータを管理する。ドキュメントサーバ３として、複数台のサーバが設けられている。特に、ドキュメントサーバ３１は、ファイルサーバであって、ワープロソフトなどのアプリケーションによって作成された文書のデータをファイル単位で管理する。ドキュメントサーバ３２は、ウェブサーバであって、文書のデータをウェブページの単位で管理する。

画像形成装置４は、コピー、ＰＣプリント、ファックス、およびスキャナなどの機能を集約した装置である。一般に、「複合機」または「ＭＦＰ（Multi Function Peripherals）」などと呼ばれることがある。

「ＰＣプリント」は、端末装置２から受信した画像データに基づいて画像を用紙に印刷する機能である。「ネットワークプリンティング」または「ネットワークプリント」などと呼ばれることもある。

次に、図３に示すプロファイル管理サーバ１の各部および図５に示す端末装置２の各部について、説明する。

〔概要〕
端末装置２は、作業の対象である文書を検知し、プロファイル管理サーバ１へ通知する。さらに、端末装置２は、ユーザが行った操作（アクション）を検知し、プロファイル管理サーバ１へ通知する。

プロファイル管理サーバ１は、端末装置２から通知された情報に基づいて、作業の対象である文書のデータ（以下、「文書データ６ＤＣ」と記載する。）を取得する。そして、この文書から単語を検出し、単語ごとの重要性の度合い（重要度）を算出する。さらに、単語同士の関連性の度合い（関連度）を算出する。また、既に重要度および関連度を算出したことがある場合は、重要度および関連度を調整する。

プロファイル管理サーバ１は、算出しまたは調整した重要度または関連度に基づいてプロファイルを生成する。そして、ユーザが検索のキーワードを入力した場合に、プロファイルに基づいてキーワードを補足し、検索の処理を行う。

そのほか、プロファイル管理サーバ１には、アクションの検知のためのデータベースを最適化するための学習機能が備わっている。

〔ユーザによる操作等の検知〕
図６は、ディレクトリ構造におけるデータの検索の方法の例を示す図である。

端末装置２の文書操作検知部２０１（図５参照）は、ユーザによる文書に関する操作を検知する。検知の処理は、例えば、次の方法によって行うことができる。

一般に、文書に関する操作として、文書の作成、編集、保存、管理、閲覧（オープン）、破棄、印刷、および検索などが挙げられる。

これらの操作の検知は、キーロガーによって実現することができる。なお、キーロガーは、キーボード、マウス、またはタッチパネルディスプレイによる入力を随時、監視するエージェントである。これにより、アプリケーションでの作業の操作のほかアプリケーションの起動などのプログラムタスクをも監視し記録することができる。

文書操作検知部２０１は、所定のコマンドに対応するキーが押されたことをキーロガーで監視することによって、操作を検知することができる。

例えば、文書の作成は、新規作成のコマンドに対応するキーの押下を監視することによって検知することができる。保存、閲覧、破棄、印刷、および検索も、それぞれのコマンドに対応するキーの押下を監視することによって検知することができる。編集は、コピーまたはペーストのコマンドに対応するキーの押下を監視することによって検知することができる。管理は、文書のファイルの移動（保存場所の変更）または文書名の変更に対応するキーの押下を監視することによって検知することができる。マーキングは、アンダーラインの付加または手書きのコメントの付加に対応するキーの押下を監視することによって検知することができる。

作業文書データ判別部２０２は、文書操作検知部２０１によって検知された操作（閲覧、作成、または印刷など）の対象である文書データ６ＤＣを判別する。判別の処理は、例えば、次の方法によって行うことができる。

ワープロソフトなどの文書の作成用のアプリケーションが使用されている場合は、作業文書データ判別部２０２は、キーロガーの技術を用いて操作を監視することによって、操作を判別することができる。文書のデータがファイル単位で管理されている場合は、ファイルが文書データ６ＤＣであると判別される。文書のデータがデータベース上で管理されている場合は、このデータベースにおける単位のデータが文書データ６ＤＣであると判別される。

作業文書データ判別部２０２は、操作の直接の対象である文書データ６ＤＣだけでなく、これと同じ階層（フォルダ、ディレクトリ）つまりカレントの階層または下位の階層（サブフォルダ、サブディレクトリ）に保存されているデータも、文書データ６ＤＣであると判別してもよい。この場合は、公知の検索エンジンの技術、例えば、クローラ（Crawler）を用いればよい。クローラによると、図６に示すように、カレントの階層および所定の深さ以内の下位の階層のそれぞれに保存されているデータを検索することができる。作業文書データ判別部２０２は、カレントの階層のＵＲＩ（Uniform Resource Identifier）が与えられると、カレントの階層をルートとみなして、上述の各階層からデータを検索する。そして、検索したデータのうち、文書のデータを文書データ６ＤＣであると判別する。なお、図６において、１〜７の数字は、検索順を意味する。

または、ウェブブラウザが使用されている場合は、作業文書データ判別部２０２は、現在表示されているウェブページが文書データ６ＤＣであると判別する。この場合も、クローラの技術を用いて、ハイパーリンクを順に辿ることによってリンク先のウェブページを検索し、これらのウェブページも文書データ６ＤＣであると判別してもよい。

操作状況通知部２０３は、端末装置２におけるユーザによる操作の状況をプロファイル管理サーバ１へ通知する。具体的には、文書操作検知部２０１によって検知された操作、作業文書データ判別部２０２によって判別された文書データ６ＤＣの識別子（例えば、パス）、および操作を行ったユーザのユーザコードを示す操作状況データ７Ａを生成する。そして、操作状況データ７Ａをプロファイル管理サーバ１へ送信する。

アクション検知部２０４は、ユーザのアクションを検知する。アクションは、端末装置２に対するものに限られない。アクションは、例えば次の方法によって検知することができる。

アクション検知部２０４は、文書の作成、編集、保存、管理、閲覧、破棄、印刷、および検索などの、文書に関する操作は、文書操作検知部２０１と同様、キーロガーの技術を用いて検知する。なお、アクション検知部２０４が文書操作検知部２０１を兼ねてもよい。また、電子メールの送受信およびアプリケーションの切換え（あるアプリケーションを終了し別のアプリケーションを起動すること）などのアクションも、キーロガーの技術を用いて検知する。

さらに、アクション検知部２０４は、文書の中の、ユーザが注目している箇所を、アクションの属性情報として検知する。

一般に、ユーザが文書のマーキングを行っている箇所は、ユーザが注目している箇所の１つである。そこで、アクション検知部２０４は、キーロガーによって、ユーザが下線を引きまたは手書きのコメントを加えている箇所を、属性情報として検知する。エアペンが指す場所を検知することによって、この箇所を検知してもよい。

または、アクション検知部２０４は、デジタルカメラ２０ｋまたは視線追従型ヘッドマウントディスプレイが検知する、ユーザの瞳（視線）の方向に基づいて、文書の閲覧の箇所を検知する。つまり、視線に対応する箇所を属性情報として検知する。公知の技術によると、閲覧の箇所は、単語の単位で検知することができる。

＜参考＞
http://www.toshiba.co.jp/tech/review/2005/11/60_11pdf/rd01.pdf
http://www.murata.co.jp/zaidan/annual/pdf/k03/2011/a04106.pdf

画像形成装置４と連携したジョブを実行させている場合は、アクション検知部２０４は、画像形成装置４からログを取得し、このログを解析することによって、アクションを判別する。

または、アクション検知部２０４は、会議での発言および電話での会話をアクションとして検知する。これらのアクションも、キーロガーによって検知することができる。または、マイクロフォン２０ｉへの音声の入力を監視することによって、これらのアクションを検知してもよい。さらに、この音声を音声認識技術によってテキスト化し、このテキストを属性情報として用いてもよい。音声認識技術として、例えば名古屋工業大学の徳田・李・南角研究室および京都大学の河原研究室のＪｕｌｉｕｓが用いられる。端末装置２に標準に備わっている音声認識ソフトを用いてもよい。

または、アクション検知部２０４は、ジャイロセンサ２０ｍまたはジェスチャコントローラによってユーザが行ったジェスチャ（モーション）に対応するアクションを検知する。さらに、アクションが文書に関する操作である場合は、ユーザが指した箇所をアクションの属性情報として検知する。

または、アクション検知部２０４は、特定のイベント（例えば、会議、営業、昼食など特定の目的のイベント）の開始をアクションとして検知することもできる。例えば、スケジューラに登録されている特定のイベントの日時が訪れたら、特定のイベントが開始したと、検知する。

さらに、アクション検知部２０４は、スケジューラに基づいて、特定の場所への到着をアクションとして検知することもできるし、ある場所から別の場所への移動をアクションとして検知することもできる。または、これらのアクションを、端末装置２の無線ＬＡＮまたは携帯電話網を用いたＧＰＳ（Global Positioning System）機能を用いて検知することもできる。入退室管理システムのほか、監視カメラによって人の動線を監視するシステムによって検知することもできる。

例えば、１３時から社外で会議があるとスケジューラに示されており、現在の時刻が１０時であり、かつ、現在地が家でも職場でもない、という場合に、アクション検知部２０４は、社外会議のための移動をアクションとして検知する。

特定の人から電話が掛かってきたこと、特定の人からメッセンジャでメッセージを受信したこと、特定の人から話し掛けられたこと、および特定の人から重要な電子メールを受信したことなどの受動的なイベントも、アクション検知部２０４は、アクションとして検知する。

アクション検知部２０４は、特定の人から電話が掛かってきたことを、呼出しが特定のＩＰアドレスまたは電話番号からのものであるか否かをチェックすることによって、検知することができる。特定の人からメッセンジャでメッセージを受信したことは、メッセージが特定のＩＰアドレスからのものであるか否かをチェックすることによって、検知することができる。特定の人から話し掛けられたことは、予め特定の人の声紋を登録しておき、マイクロフォン２０ｉに入力された音声の声紋を解析することによって、検知することができる。特定の人から重要な電子メールを受信したことは、受信した電子メールの送信者をチェックし、さらに、受信した電子メールのタイトルまたは本文に所定のキーワードが含まれていることをチェックすることによって、検知することができる。メッセージの受信および電子メールの受信には、メッセンジャまたはメーラなどのアプリケーションが用いられるので、これらをキーロガーによって検知してもよい。

または、アクション検知部２０４は、所定のフォルダ（例えば、所定の共有フォルダ）の中の新しいファイルをユーザが見つけたことをアクションとして検知することもできる。具体的には、キーロガーによる監視の結果および所定のフォルダの状態の変化を履歴として記録しておく。そして、ユーザが所定のフォルダにアクセスした際に、今回のアクセスにおける所定のフォルダの状態と前回のアクセスにおける所定のフォルダの状態とを比較し、新しいファイルがあれば、新しいファイルをユーザが見つけたと、検知する。所定のフォルダに追加されたファイルは、ＲＳＳ（Really Simple Syndication）などの公知の技術によって監視することができる。

アクション通知部２０５は、アクションデータ７Ｂを生成しプロファイル管理サーバ１へ送信する。アクションデータ７Ｂには、アクション検知部２０４によって検知されたアクションおよび属性情報のほか、これらが検知された日時および端末装置２のユーザのユーザコードが示される。

プロファイル管理サーバ１において、操作状況データ取得部１０１（図３参照）は、端末装置２から操作状況データ７Ａを取得する。アクションデータ取得部１０２は、端末装置２からアクションデータ７Ｂを取得する。

〔文書データの取得〕
図７および図８は、取得トリガアクションデータ７Ｃの例を示す図である。図９は、取得トリガアクションデータ７Ｃを作成するためのＧＵＩ画面の例を示す図である。図１０は、取得トリガアクションデータ７Ｃの変形例を示す図である。図１１は、カレントケースの切換えの例を示す図である。

作業文書データ取得部１０３は、予め決められたアクションをユーザが行った場合に、このユーザが使用している文書またはこれから使用しようとしている文書の文書データ６ＤＣを取得する。以下、予め決められたアクションを「取得トリガアクション」と記載することがある。取得トリガアクションは、１つのアクションだけで完結する場合もあれば、複数のアクションを１組に纏めたものである場合もある。

ここで、文書データ６ＤＣの取得の処理について、説明する。取得トリガアクションのデータを取り扱うためのカレントケース切換部１０４、取得トリガアクション記憶部１２１、およびカレントケースデータ記憶部１２２についても、併せて説明する。

取得トリガアクション記憶部１２１には、ユーザごとの取得トリガアクションデータ７Ｃが記憶されている。取得トリガアクションデータ７Ｃは、図７（Ａ）〜（Ｅ）または図８のように、取得トリガアクションがＸＭＬ（Extensible Markup Language）の形式で示されている。

＜ｂｈｉ：ａｃｔｉｏｎ＞は、この行が取得トリガアクションデータ７Ｃの先頭であることを宣言するタグである。＜ｂｈｉ：Ｘ／＞は、Ｘというアクションを表わすタグである。＜／ｂｈｉ：ａｃｔｉｏｎ＞は、１つの取得トリガアクションの記述を終了することを宣言するタグである。

取得トリガアクションデータ７Ｃには、取得トリガアクションを１組だけ示される場合もあれば、複数組示される場合もある。複数組示される場合は、いずれか１つの取得トリガアクションが行われることが、文書データ６ＤＣの取得の要件である。

また、上述の通り、１つの取得トリガアクションにアクションが１つだけ含まれる場合もあれば複数含まれる場合もある。複数含まれる場合は、後述する記述の規則に従って各アクションが行われることによって、取得トリガアクションが行われたとみなされる。

図７（Ａ）に示す取得トリガアクションデータ７Ｃは、１つの取得トリガアクションだけを示している。しかも、この取得トリガアクションには、アクションが１つだけ含まれる。

また、「ｓａｖｅｆｏｌｄｅｒ＝’Ｙ’」は、Ｙというフォルダにデータを保存するアクションを意味する。

したがって、図７（Ａ）の取得トリガアクションデータ７Ｃは、「ｃ：／ｕｓｅｒ／ｓｈａｒｅ／」というパスのフォルダにデータを保存するアクションを取得トリガアクションとして示している。

図７（Ｂ）に示す取得トリガアクションデータ７Ｃも、図７（Ａ）の例と同様に、１つの取得トリガアクションだけを示している。ただし、この取得トリガアクションには、アクションが複数、含まれている。この記述方法は、これら複数のアクションが記述の順にすべて行われることがアクションデータ７Ｂを取得する要件であることを、意味する。

また、「ｗｅｂｕｒｌ＝’Ｙ’」は、ＹというＵＲＬ（Uniform Resource Locator）に基づいてウェブページを閲覧するアクションを意味し、「ｓａｖｅ」は直前に閲覧したウェブページを保存するアクションを意味する。

したがって、図７（Ｂ）の取得トリガアクションデータ７Ｃは、ＨＴＴＰ（Hypertext Transfer Protocol）で「ｅｘａｍｐｌｅ．ｃｏｍ」のウェブサイトのデフォルトのウェブページを閲覧し、保存する、という２つのアクションを、取得トリガアクションとして示している。

または、図７（Ｃ）に示すように、「ｃｏｕｎｔ」のパラメータを用いて回数の条件を加えることができる。「Ｘｃｏｕｎｔ＝’Ｎ’」は、Ｘというアクションが合計でＮ回行われることを要求している。

したがって、図７（Ｃ）の取得トリガアクションデータ７Ｃは、ＨＴＴＰ（Hypertext Transfer Protocol）で「ｅｘａｍｐｌｅ．ｃｏｍ」のウェブサイトのデフォルトのウェブページを合計３回閲覧するアクションを、取得トリガアクションとして示している。

または、連続する同一のアクションを検知することを要件とする場合は、このアクションを連続する行に記述すればよい。図７（Ｄ）の取得トリガアクションデータ７Ｃは、ＨＴＴＰ（Hypertext Transfer Protocol）で「ｅｘａｍｐｌｅ．ｃｏｍ」のウェブサイトのデフォルトのウェブページを連続して２回閲覧することを、取得トリガアクションとして示している。

図７（Ｅ）に示す取得トリガアクションデータ７Ｃは、２つの取得トリガアクションを示している。上述の通り、この記述方法は、これら２つの取得トリガアクションのうちのいずれか一方が行われればアクションデータ７Ｂを取得する要件を満たす、ということを意味する。

また、「ｌｏａｄｆｏｌｄｅｒ＝’Ｙ’」は、Ｙというフォルダからデータを読み出す（ロードする）アクションを意味する。

したがって、図７（Ｅ）の取得トリガアクションデータ７Ｃは、「ｃ：／ｕｓｅｒ／ｓｈａｒｅ／」というパスのフォルダにデータを保存するアクション、および、このフォルダからデータを読み出すアクションを択一的に取得トリガアクションとして示している。３つ以上の取得トリガアクションが取得トリガアクションデータ７Ｃに示される場合もある。

取得トリガアクションを種々のケースに応じて変更することができる。例えば、休憩および仕事のそれぞれのケース取得トリガアクションを使い分けることができる。

図８に示す取得トリガアクションデータ７Ｃには、２つのケースのそれぞれのケース別データ７ＣＳが含まれている。ケース別データ７ＣＳには、ケースに応じた取得トリガアクションが示されている。取得トリガアクションの記述方法は、図７（Ａ）〜（Ｅ）を例に説明した通りである。

ただし、ケース別データ７ＣＳには、そのケース別データ７ＣＳを区別するための、ケース別データ７ＣＳの開始を意味するタグである＜ｂｈｉ：ｃａｓｅｎｏ＝’Ｋ’＞を最初の行に付け、そのケース別データ７ＣＳの終了を意味するタグである＜／ｂｈｉ：ｃａｓｅ＞を最後の行に付ける。「Ｋ」は、取得トリガアクションデータ７Ｃにおけるそのケース別データ７ＣＳのシーケンス番号である。さらに、そのケース別データ７ＣＳの名称を示す＜ｂｈｉ：ｃａｓｅｎａｍｅ＝’Ｍ’＞を２行目に付ける。「Ｍ」は、任意の文字列である。

取得トリガアクションデータ７Ｃは、管理者がテキストエディタによって作成する。そして、その取得トリガアクションデータ７Ｃが与えられたユーザのユーザコードと対応付けて取得トリガアクション記憶部１２１に記憶される。

または、図９に示すようなＧＵＩ（Graphical User Interface）を用意しておき、ユーザがこのＧＵＩを介して取得トリガアクションとするアクションを組み合わせて取得トリガアクションデータ７Ｃを作成できるようにしてもよい。

カレントケースデータ記憶部１２２には、ユーザごとのカレントケースデータ７Ｄが記憶されている。カレントケースデータ７Ｄには、ユーザの現在の状態に応じたケースの識別子、例えば、上述のシーケンス番号が示される。以下、現在の状態に応じたケースを「カレントケース」と記載する。

カレントケース切換部１０４は、カレントケースデータ７Ｄを更新することによって、ユーザのカレントケースを切り換える。

手動による場合は、カレントケース切換部１０４は、次のように切換えの処理を行う。ユーザが端末装置２にシーケンス番号を入力すると、切換要求部２１１は、このシーケンス番号およびこのユーザのユーザコードを示す切換要求データ７Ｅをプロファイル管理サーバ１へ送信する。

カレントケース切換部１０４は、切換要求データ７Ｅからユーザコードおよびシーケンス番号を抽出し、このユーザコードを示すカレントケースデータ７Ｄを、このシーケンス番号が示されるように更新する。

一方、切換えの処理を、ユーザによるシーケンス番号の入力を伴わずに、つまり、自動で、行うこともできる。

この場合は、予め、取得トリガアクションデータ７Ｃにおける＜ｂｈｉ：ｃａｓｅｎｏ＝’Ｋ’＞のタグに「ｔｒｉｇｇｅｒ＝’Ｔ’」を追記しておくことによって、切換えのトリガとなるアクション（以下、「切換トリガアクション」と記載する。）を定義しておく。なお、「Ｔ」が切換トリガアクションである。

この記述方法によると、図１０に示す取得トリガアクションデータ７Ｃは、「Ｍａｉｌｅｒ＿Ａ」というメーラの起動を１番のケースの切換トリガアクションとして示し、「Ｍａｉｌｅｒ＿Ｂ」というメーラの起動を２番のケースの切換トリガアクションとして示している。

アクションは、前述の通り、端末装置２において、アクション検知部２０４によって検知され、検知の結果を示すデータつまりアクションデータ７Ｂがアクション通知部２０５によってプロファイル管理サーバ１へ送信される。そして、プロファイル管理サーバ１において、アクションデータ取得部１０２によってアクションデータ７Ｂが取得される。

カレントケース切換部１０４は、アクションデータ７Ｂが取得されると、このアクションデータ７Ｂに示されるユーザコードを抽出する。このユーザコードを示す取得トリガアクションデータ７Ｃをカレントケースデータ記憶部１２２から読み出す。そして、このアクションデータ７Ｂに示されるアクションが、この取得トリガアクションデータ７Ｃにおいて切換トリガアクションとして示されているか否かをチェックする。示されている場合は、この切換トリガアクションに係るケースのシーケンス番号が示されるように、カレントケースデータ記憶部１２２に記憶されている、このユーザコードのカレントケースデータ７Ｄを更新する。

図１０に示す取得トリガアクションデータ７Ｃによると、カレントケースは、例えば図１１に示すように変更される。

直近に使用されたメーラが「Ｍａｉｌｅｒ＿Ａ」であるときは、図１１（Ａ）において太線で示すように、１番のケースがカレントケースに設定されている。よって、「ｃ：／ｕｓｅｒ／ｓｈａｒｅ／」というフォルダへのデータの保存のアクションが取得トリガアクションである。

その後、「Ｍａｉｌｅｒ＿Ａ」が閉じられ、「Ｍａｉｌｅｒ＿Ｂ」が起動されると、カレントケース切換部１０４は、図１１（Ｂ）において太線で示すように、２番のケースをカレントケースに切り換える。これにより、取得トリガアクションが「ｃ：／ｕｓｅｒ／ｐｅｒｓｏｎａｌ／」というフォルダへのデータの保存のアクションに切り換わる。

〔プロファイルの生成および更新〕
図１２は、文書データ取得処理の流れの例を説明するフローチャートである。図１３は、プロファイルデータ７Ｆの例を示す図である。

作業文書データ取得部１０３は、アクションデータ取得部１０２によってアクションデータ７Ｂが取得されるごとに、図１２に示す手順で処理を実行する。

作業文書データ取得部１０３は、取得されたアクションデータ７Ｂからユーザコードを抽出し、このユーザコードを示す取得トリガアクションデータ７Ｃを取得トリガアクション記憶部１２１から読み出す（＃８０１）。この取得トリガアクションデータ７Ｃにケースごとのケース別データ７ＣＳが含まれている場合は（＃８０２でＹｅｓ）、カレントケースデータ７Ｄに示されるシーケンス番号のケース別データ７ＣＳを抽出する（＃８０３）。

作業文書データ取得部１０３は、アクションデータ７Ｂに示されるアクションが取得トリガアクションデータ７Ｃ（ステップ＃８０３で抽出を行った場合は、ケース別データ７ＣＳ）に示される取得トリガアクションであるか否かを判別する（＃８０４）。複数のアクションの組合せが取得トリガアクションとして示される場合は、そのユーザの、過去に受信したアクションデータ７Ｂに示されるアクションと今回のアクションとを実行順に組み合わせて、取得トリガアクションを満たすか否かを判別する。よって、取得トリガアクションを今回満たさない場合は（＃８０５でＮｏ）、今回取得したアクションデータ７Ｂを次回以降の判別のために保存しておく（＃８０６）。そして、新たなアクションデータ７Ｂが取得されるのを待つ。

条件を満たす場合は（＃８０５でＹｅｓ）、作業文書データ取得部１０３は、アクションデータ７Ｂに示されるアクションつまり今回のアクションが、予め登録されているアクションであれば、アクションデータ７Ｂから属性情報を抽出して適宜参照し、文書データ６ＤＣを取得する（＃８０７、＃８０８）。取得の方法は、アクションデータ７Ｂに示されるアクションに応じて様々である。

例えば、今回のアクションが文書に対する操作（例えば、文書の編集またはマーキング）である場合は、ほぼ同時期に操作状況データ７Ａが操作状況データ取得部１０１によって取得される。そして、この操作状況データ７Ａには、文書データ６ＤＣを特定する情報、例えば、パスが示される。そこで、作業文書データ取得部１０３は、この情報に基づいて、文書データ６ＤＣを、これを記憶している装置（例えば、ドキュメントサーバ３１または端末装置２）から取得する。端末装置２から取得する場合は、作業文書データ取得部１０３は、端末装置２に対して文書データ６ＤＣを要求する。すると、端末装置２において、作業文書データ送信部２０６は、文書データ６ＤＣをフラッシュメモリ２０ｃなどから読み出し、プロファイル管理サーバ１へ送信する。

ただし、アクションが文書の作成である場合は、未だ文書ができていない。このように、アクションに関連する文書が未だ存在しない場合は、作業文書データ取得部１０３は、文書データ６ＤＣの取得を行わず、次のアクションを待つ。

さらに、作業文書データ取得部１０３は、取得した文書データ６ＤＣから、プロファイルの作成に必要な部分を抽出する（＃８０９）。つまり、ユーザのプロファイルの生成に不要な部分を除外する。

例えば、ユーザが注目している箇所（注目箇所）が属性情報として抽出された場合は、注目箇所を必要な部分として抽出し、それ以外の部分を削除する。注目箇所を含む所定の塊（ページ、章、または項など）を抽出し、それ以外の部分を削除してもよい。アクションの種類または日時に応じて残す部分を決定して抽出し、それ以外の部分を削除してもよい。

または、注目箇所が属性情報として抽出されたか否かに関わらず、所定の部分を削除してもよい。例えば、電子メールのヘッダおよびウェブページのバナー広告などを削除してもよい。なお、ウェブページの必要な部分と不要な部分との分別は、エバーノート社のＥｖｅｒｎｏｔｅで採用されているＷｅｂクリッパまたはＣｌｅａｌｙの技術など、領域判別に関する公知の技術によって行うことができる。

このようにして、ユーザに関連する文書のデータが抽出される。以下、作業文書データ取得部１０３によって抽出された必要な部分のデータを「必要部分データ６ＨＢ」と記載する。

単語抽出部１０５は、必要部分データ６ＨＢに示される文書（必要な部分）から単語を抽出する。抽出の処理は、例えば、次の方法で行うことができる。

必要部分データ６ＨＢに示される文書が英語またはフランス語などで記述されている場合は、単語抽出部１０５は、スペースまたは改行のコードに基づいて単語同士を切り分け抽出すればよい。日本語で記述されている場合は、形態素解析の技術を用いて単語を抽出する。この技術を実装しているソフトウェアとして、奈良先端科学技術大学院大学の松本裕治研究室の茶筅（ＣｈａＳｅｎ）および工藤拓氏のＭｅｃａｂが挙げられる。これらのソフトウェアによって形態素解析を行うことによって、単語を抽出すればよい。

重要度算出部１０６は、抽出されたそれぞれの単語の重要度を算出する。重要度は、パターンマッチングによって算出してもよいし、ＴＦ−ＩＤＦ（Term Frequency Inverse Document Frequency）法によって算出してもよい。

パターンマッチングによる重要度の算出は、例えば、次のように行えばよい。「○○は調査すべきである」のような、よく使う重要な言い回しを予め登録しておく。そして、抽出した単語のうち「○○」に該当する単語に対して、所定の点数を加算しまたは所定の係数を掛けるなどして、高い重要度を与える。

ＴＦ−ＩＤＦ法による重要度の算出は、次に示す式に基づいて行えばよい。

「ｎ_i,j」は、単語ｉの、文書ｊにおける出現回数である。｜Ｄ｜は、文書の総数である。｜｛ｄ：ｄ∋ｔ_i｝は、単語ｉを含む文書の総数である。上述の式の「ｉｄｆ」は、一般語フィルタとして働く。そして、多くの文書に出現する単語（一般語）の重要度を下げる役割を果たす。

重要度の算出に用いる方法（アルゴリズム）は、アクションデータ７Ｂに示されるアクションまたはカレントケースデータ７Ｄに示されるカレントケースに応じて使い分けてもよい。例えば、仕事のケースがカレントケースである場合は、パターンマッチングのアルゴリズムによって重要度を算出し、プライベートのケースがカレントケースである場合は、パターンマッチングのＴＦ−ＩＤＦ法のアルゴリズムによって重要度を算出するのが好ましい。仕事の文書には特定の言い回しが登場することが多く、プライベートの文書には特定の言い回しが少なく砕けた表現が登場することが多いからである。

または、カレントケースまたはアクションデータ７Ｂに示されるアクションに応じて、マッチングに用いる言い回しを変えて重要度を算出してもよいし、パラメータの値を変えて重要度を算出してもよい。

例えば、アクションデータ７Ｂに示されるアクションが文書の印刷である場合は、その文書の重要性が高いと考えられる。一方、このアクションが文書の閲覧である場合は、重要性がそれほど高くないと考えられる。そこで、
ｔｆｉｄｆ＝α・ｔｆ・ｉｄｆ
と、重み付けの係数αをパラメータとして設けておき、アクションが文書の印刷である場合は１よりも大きい値をαに設定し、文書の閲覧である場合は１未満の値をαに設定してもよい。ただし、αは、所定の範囲内に制限する。例えば、０≦α≦２、に制限する。

または、単語の品詞に応じて係数を変えてもよい。一般的に固有名詞は他の品詞よりも重要である場合が多いので、重要度が高くなるように係数を設定するのが望ましい。例えば、上述のαを大きな値にする。形容詞は重要でないことが多いので、重要度が低くなるように係数を設定してもよい。助詞および代名詞には、重要度を与えないようにしてもよい。

なお、単語抽出部１０５によって抽出された単語のうち、算出した重要度が所定の値未満である単語は、プロファイルに含まれないよう除外される。除外した単語は、次に説明する関連度算出部１０７およびプロファイルデータ生成部１０８による処理の対象には、ならない。

関連度算出部１０７は、抽出した単語同士の関連度を算出する。算出の処理は、例えば次の方法によって行うことができる。

関連度算出部１０７は、２つの単語同士の、作業文書データ取得部１０３によって抽出された部分における距離を求める。そして、所定の関数またはテーブルに基づいて、その距離に応じた重要度を算出する。所定の関数またはテーブルには、距離が短いほど重要度が高くなるように、距離と重要度との関係が定義されている。例えば、「カテキン｜は、｜内臓脂肪｜の｜燃焼｜に｜効く。｜そのため｜トクホ｜食品｜として｜利用｜されて｜いる」という部分において、「カテキン」、「内臓脂肪」、および「トクホ」の３つが、重要度が所定の値以上の単語として残ったとする。なお、「｜」は、単語と単語との区切りの記号である。句読点などの記号は、無視する。「カテキン」と「内臓脂肪」との距離（いわゆるワード距離）は、自らを含め、３ワードである。よって、関連度算出部１０７は、両単語の関連度を、３ワードに対応する関連度を所定の関数またはテーブルから導くことによって、算出する。同様に、「カテキン」と「トクホ」との距離は、９ワードである。よって、関連度算出部１０７は、両単語の関連度を、９ワードに対応する関連度を所定の関数またはテーブルから導くことによって、算出する。

または、関連度算出部１０７は、シソーラス（分類辞典）を参照し、両単語の持つ意味的な繋がりに基づいて関連度を求めても算出してもよい。

同一の単語が複数抽出された場合は、２つの単語同士の組合せが重複する。例えば、ＷＤ１という単語が２つ抽出され、ＷＤ２という単語が３つ抽出された場合は、２×３、つまり、６組、同一の組合せが出現する。このような場合は、２つの単語同士の距離が最も近い組合せについてのみ、関連度を求めればよい。または、各組合せの関連度の平均値を取ってもよい。

プロファイルデータ生成部１０８は、ユーザごとのプロファイルデータ７Ｆを生成する。プロファイルデータ７Ｆには、図１３のように、そのユーザのアクションに応じて単語抽出部１０５によって抽出された単語のほか、単語を識別するＩＤ（単語コード）、重要度算出部１０６によって算出されたその単語の重要度、抽出元の文書（元文書）、およびその単語の品詞などが示される。さらに、２つの単語の組合せごとに、識別子（組合せコード）および関連度算出部１０７によって算出された関連度などが示される。これらの単語は、そのユーザの特徴を表わす重要なキーワードであると、言える。

生成されたプロファイルデータ７Ｆは、そのユーザのユーザコードと対応付けられてプロファイルデータ記憶部１２３に記憶される。

ただし、そのユーザのプロファイルデータ７Ｆが既にプロファイルデータ記憶部１２３に記憶されている場合は、プロファイルデータ生成部１０８は、そのプロファイルデータ７Ｆを更新する。更新の処理は、例えば次のように行うことができる。

既にプロファイルデータ７Ｆに示される単語については、プロファイルデータ生成部１０８は、その単語の重要度を例えば次の式に基づいて算出し直す。
Ｗｉ＝（１−β）・Ｗ０ｉ＋β・Ｗ１ｉ
ただし、０≦β≦１、である。Ｗ０ｉは、既存のプロファイルデータ７Ｆに示される単語ｉの重要度である。Ｗ１ｉは、重要度算出部１０６によって今回算出された単語ｉの重要度である。

βは、任意に設定することができる。ユーザの過去のアクションを重要視するのであれば、βの値を小さくすればよいし、ユーザの今回のアクションを重要視するのであれば、βの値を大きくすればよい。過去のアクションを全く考慮しないのであれば、βを「１」にすればよい。カレントケースに応じてβの値を変えてもよい。なお、今回のアクションがイレギュラーである可能性があるので、βは、０．３〜０．５程度であるのが望ましい。

既存の単語同士の関連度も同様の方法で算出し直せばよい。つまり、次の式に基づいて算出し直せばよい。
Ｓｍｎ＝（１−γ）・Ｓ０ｍｎ＋γ・Ｓ１ｍｎ
ただし、０≦γ≦１、である。Ｓｍｎ０は、既存のプロファイルデータ７Ｆに示される単語ｍと単語ｎとの関連度である。Ｓｍｎ１は、関連度算出部１０７によって今回算出された関連度である。

そして、プロファイルデータ生成部１０８は、単語ｉの重要度を、算出し直したＷｉに書き換え、単語ｍと単語ｎとの関連度を、算出し直したＳｍｎに書き換える。

上の各式によると、重要度および関連度は、次のように更新される。「カテキン」のこれまでの重要度が「６」であり、今回算出された重要度が「５」であり、βが「０．３」である場合は、これらの値に基づいて重要度を算出し直すと、
Ｗ＝（１−０．３）・６＋０．３・５＝５．７
になる。

また、「カテキン」と「トクホ」とのこれまでの関連度が「９」であり、今回算出された関連度が「１０」であり、γが「０．３」である場合は、これらの値に基づいて関連度を算出し直すと、
Ｓ＝（１−０．３）・９＋０．３・１０＝９．３
になる。

なお、初めて抽出された単語については、プロファイルデータ生成部１０８は、重要度算出部１０６によって今回算出された重要度および単語コードとともにプロファイルデータ７Ｆに追記する。また、初めて抽出された単語と他の単語との関連度については、関連度算出部１０７によって今回算出された重要度とともにプロファイルデータ７Ｆに追記する。

以上の処理によって、ユーザごとに、アクションに応じたプロファイルが生成されまたは更新される。

〔プロファイルを用いた情報の検索〕
情報検索部１３１は、情報の検索の処理を、プロファイルデータ７Ｆを用いて例えば次のように実行する。

ユーザが端末装置２に所定のコマンドを入力すると、情報検索クライアント２０７（図５参照）が起動する。なお、情報検索クライアント２０７は、情報検索部１３１による検索のサービスを受けるクライアントのモジュールである。

情報検索クライアント２０７は、検索のキーワード（以下、「検索キー」と記載する。）を入力するための入力画面をタッチパネルディスプレイ２０ｄに表示させる。そして、ユーザが入力した検索キーおよびこのユーザのユーザコードを示す検索要求データ７Ｇをプロファイル管理サーバ１へ送信する。

プロファイル管理サーバ１において、情報検索部１３１は、検索要求データ７Ｇを取得すると、検索要求データ７Ｇに示されるユーザコードのプロファイルデータ７Ｆをプロファイルデータ記憶部１２３から読み出す。そして、検索要求データ７Ｇに示される検索キー（単語）がプロファイルデータ７Ｆに示される場合は、この検索キーとの関連度が最も高い単語を選出する。

例えば、検索キーが「カテキン」であり、「カテキン」と各単語との関連度が図１３に示す通りである場合は、関連度の最も高い「脂肪」を選出する。

情報検索部１３１は、この検索キーと選出した単語との組合せ（例えば、「カテキン」および「脂肪」）を検索クエリとして用いて検索を行う。検索は、プロファイル管理サーバ１に備わっている検索エンジンを用いてもよいし、他の装置（例えば、ドキュメントサーバ３２）の検索エンジンを用いてもよい。また、この検索キーと選出した単語とをＡＮＤで繋いでもよいし、ＯＲで繋いでもよい。つまり、いわゆるＡＮＤ検索を行ってもよいし、いわゆるＯＲ検索を行ってもよい。

なお、検索キーがプロファイルデータ７Ｆに示されない場合は、情報検索部１３１は、従来通り、検索キーのみを検索クエリとして用いて検索を行う。

そして、情報検索部１３１は、検索結果を示す検索結果データ７Ｈを、要求元である端末装置２へ送信する。

端末装置２において、情報検索クライアント２０７は、検索結果データ７Ｈを受信すると、検索結果をタッチパネルディスプレイ２０ｄに表示させる。

または、情報検索部１３１は、検索要求データ７Ｇに示される検索キー（単語）がプロファイルデータ７Ｆに示される場合に、この検索キーとの関連度が所定の値以上であり、かつ、重要度が最も高い単語を選出し補足してもよい。

または、情報検索部１３１は、上述のいずれかの方法で選出した単語を、検索要求データ７Ｇに示される単語と置き換えて、検索してもよい。

〔学習機能〕
図１４は、確認ダイアログボックスＷＮ１の例を示す図である。

学習処理部１３２は、取得トリガアクションデータ７Ｃに示される、ケースごとの切換トリガアクションを、ユーザの実際のアクションに合わせて設定（学習）し直す処理を、ケース通知部２１２と連携して次のように行う。

上述の通り、ユーザのアクションは、端末装置２によって検知され、プロファイル管理サーバ１へ通知される。この際に、アクションデータ７Ｂが端末装置２からプロファイル管理サーバ１へ送信される。

学習処理部１３２は、このアクションデータ７Ｂに示されるアクションが所定のアクションであれば、現在のケースを回答するように端末装置２に対して要求する。

すると、ケース通知部２１２は、図１４のような確認ダイアログボックスＷＮ１をタッチパネルディスプレイ２０ｄに表示させる。確認ダイアログボックスＷＮ１には、ケースごとにボタンＢＮ１が設けられている。各ボタンＢＮ１には、ボタンに対応するケースのシーケンス番号および名称が示されている。ここで、ユーザは、現在の自分の状況に合うケースのボタンＢＮ１を押す。

ケース通知部２１２は、押されたボタンＢＮ１に対応するケースのシーケンス番号および端末装置２のユーザのユーザコードを示すケース通知データ７Ｊをプロファイル管理サーバ１へ送信する。

学習処理部１３２は、ケース通知データ７Ｊに示されるユーザコードの取得トリガアクションデータ７Ｃの中の、ケース通知データ７Ｊに示されるシーケンス番号のケースの切換トリガアクションのコードを、アクションデータ７Ｂに示されるアクションのコードに書き換える。

例えば、特定の人に話し掛けられるというアクションを示すアクションデータ７Ｂが受信された後、１番のシーケンス番号を示すケース通知データ７Ｊが受信された場合は、学習処理部１３２は、取得トリガアクションデータ７Ｃの中の、シーケンス番号が１番であるケースの切換トリガアクションのコードを、特定の人に話し掛けられるというアクションのコードに書き換える。

同一のケースについて、複数のケース通知データ７Ｊが送信されてきた場合は、学習処理部１３２は、それぞれのケース通知データ７Ｊに示されるアクションのコードが切換トリガアクションのコードとして示されるように取得トリガアクションデータ７Ｃを更新してもよい。

例えば、会議室Ａに到着するというアクションおよび特定の人に話し掛けられるというアクションをそれぞれ示す２つのケース通知データ７Ｊを順次受信した場合は、学習処理部１３２は、それぞれのアクションのコードが切換トリガアクションのコードとして示されるように取得トリガアクションデータ７Ｃを更新する。ただし、それぞれのアクションのコードをＡＮＤ条件で関連付ける。このように更新することによって、ユーザが会議室Ａで特定の人に話し掛けられた場合に所定のケースに切り換えることができる。つまり、アクションの複雑な条件にも対応することができる。

または、ケース通知データ７Ｊを一定の個数蓄積しておき、どのアクションがあった際にどのケースが選択されているのかの傾向を算出してもよい。そして、算出した傾向に基づいて取得トリガアクションデータ７Ｃを更新してもよい。例えば、会議室Ａで特定の人に話し掛けられた際に必ず１番のケースが選択される傾向がある場合は、会議室Ａに到着するというアクションおよび特定の人に話し掛けられるというアクションそれぞれのコードが切換トリガアクションのコードとして示されるように取得トリガアクションデータ７Ｃを更新すればよい。

なお、学習処理部１３２による処理は、常時行うのではなく、所定の期間だけ行ってもよい。

図１５および図１６は、プロファイル管理サーバ１における全体的な処理の流れの例を説明するフローチャートである。

次に、あるユーザＵａのプロファイルを生成し、これに基づいて情報を検索する場合を例に、プロファイル管理サーバ１の全体的な処理の流れを、図１５および図１６のフローチャートを参照しながら説明する。

プロファイル管理サーバ１は、ユーザＵａの端末装置２からアクションデータ７Ｂを受信すると（図１５の＃１１でＹｅｓ）、必要に応じてユーザＵａのカレントケースを切り換える（＃１３）。すなわち、このアクションデータ７Ｂに示されるアクションがユーザＵａの取得トリガアクションデータ７Ｃに示される切換トリガアクションである場合は（＃１２でＹｅｓ）、ユーザＵａのカレントケースをこの切換トリガアクションに対応するケースに切り換える（＃１３）。なお、カレントケースは、ユーザＵａが手動で切り換えることもできる。

さらに、プロファイル管理サーバ１は、アクションデータ７Ｂを受信すると、プロファイルの生成または更新のために使用する文書のデータを取得する（＃１４）。取得の処理の手順は、前に図１２で説明した通りである。

取得に成功した場合は（＃１５でＹｅｓ）、プロファイル管理サーバ１は、形態素解析の技術を適宜使用してこの文書から単語を抽出するとともに（＃１６）、カレントケースに応じた重要度の計算のアルゴリズムまたはパラメータを選択する（＃１７）。なお、ユーザＵｘのプロファイルとして使用されない単語（例えば、助詞または代名詞などの単語）は、削除し（＃１８）、後の処理に用いられないようにするのが、望ましい。

プロファイル管理サーバ１は、選択したアルゴリズムまたはパラメータで各単語の重要度を算出するとともに（＃１９）、複数の単語同士の関連度を算出する（＃２０）。そして、算出した重要度および関連度などを示すプロファイルデータ７Ｆを生成する（＃２１）。なお、既にユーザＵａのプロファイルデータ７Ｆがある場合は、今回算出した重要度および関連度を用いてプロファイルデータ７Ｆを更新する。

また、プロファイル管理サーバ１は、アクションデータ７Ｂを受信すると、現在が所定の時期であれば（図１６の＃２２でＹｅｓ）、ユーザＵａの切換トリガアクションを学習し直す（＃２３、＃２４）。すなわち、プロファイル管理サーバ１は、今回のアクションのケースをユーザに選択させる（＃２３）。そして、それに応じて、ケースの切換えのアクションとして好ましいアクションを求め、これが切換トリガアクションになるようにユーザＵａの取得トリガアクションデータ７Ｃを更新する（＃２４）。

または、プロファイル管理サーバ１は、ユーザＵａの端末装置２から検索キー（検索クエリー）とともに検索の要求を受け付けると（＃２５でＹｅｓ）、このキーワードとして用いられている単語に関連付けられている他の単語のうち、関連度が最も高いものを、ユーザＵａのプロファイルデータ７Ｆから抽出し、これを補足することによって検索クエリーを補完する（＃２６）。そして、補完した検索クエリーで検索を行い（＃２７）、検索結果をユーザＵａの端末装置２へ送信する（＃２８）。

プロファイル管理サーバ１は、図１５および図１６に示す処理を、端末装置２からデータを受信するごとに、適宜、実行する。

本実施形態によると、プロファイル管理サーバ１は、検索のキーワードとして使用する単語を、ユーザのアクションに応じた文書から抽出し、保存する。そして、ユーザが指定した検索クエリを、保存しておいた単語によって補正し、検索を行う。よって、ユーザの欲しい情報を従来よりも確実に検索することができる。

しかも、取得トリガアクションを適宜切り換えるので、ユーザの仕事に関連する単語およびユーザのプライベートに関連する単語を使い分けることができる。

また、複数のアクションを組み合わせて取得トリガアクションを定義することによって、より精度の高い検索を行うことができる。

また、会議への参加および電話による会話など、文書に対する直接的なアクションでないものも、取得トリガアクションとしているので、多様な文書から単語を抽出することができる。しかも、これらのアクションを伴う場合は複数人が１つの文書を同時に参照していることがあり、より重要な文書から単語を抽出することができる。

本実施形態では、プロファイル管理サーバ１は、所定のアクション（取得トリガアクション）を検知したタイミングで、プロファイルデータ７Ｆの生成または更新の処理、学習の処理、切換トリガアクションの変更の処理などを行った。プロファイル管理サーバ１は、所定のアクションの代わりにユーザが所定の状態であることを検知したタイミングで、これらの処理を行ってもよい。

例えば、ユーザが社内に居ること、ユーザが家に居ること、ユーザが移動中であること、メーラに未読のメッセージが残っていること、ユーザが会議中であること、ユーザが休憩中であること、ユーザが電話中であること、メッセンジャが使用中であること、およびユーザが会話中であることなどが、挙げられる。これらの状態は、アクションの場合と同様の方法によって、検知することができる。

端末装置２は、状態およびユーザコードなどを示すデータをアクションデータ７Ｂの代わりにプロファイル管理サーバ１へ送信する。そして、プロファイル管理サーバ１は、このデータに基づいて、上述の各処理を適宜、実行する。

端末装置２は、状態の検知を、所定の時間ごと（例えば、５分ごと）に行えばよい。または、端末装置２の電源がオンになったとき、端末装置２がプロファイル管理サーバ１に接続されたとき、または端末装置２のスリープモードが解除されたときなどに行ってもよい。

ユーザの身体の状態、例えばユーザの脳波の値が所定の範囲であることおよびユーザの脈派の値が所定の範囲であることも、所定の状態として挙げられる。脳波は、脳波計で測定すればよい。そして、測定値を、端末装置２を介してプロファイル管理サーバ１へ送信すればよい。脳波計として、例えば、ニューロスカイ社のＭｉｎｄＳｅｔが用いられる。ＭｉｎｄＳｅｔによると、集中度およびリラックス度を測定することができる。

脈波は、脈波計で測定すればよい。そして、脳波の場合と同様、測定値を、端末装置２を介してプロファイル管理サーバ１へ送信すればよい。脈波計として、コニカミノルタ社のパルスオキシメータが用いられる。パルスオキシメータによると、ストレス度を測定することができる。または、カメラからの画像処理によって脈波を測定することもできる。

本実施形態では、プロファイル管理サーバ１がプロファイルデータ７Ｆを生成したが、端末装置２が生成してもよい。この場合は、図３に示す作業文書データ取得部１０３、カレントケース切換部１０４、単語抽出部１０５、重要度算出部１０６、関連度算出部１０７、プロファイルデータ生成部１０８、取得トリガアクション記憶部１２１、カレントケースデータ記憶部１２２、プロファイルデータ記憶部１２３、情報検索部１３１、および学習処理部１３２の各機能を端末装置２に設ければよい。

本実施形態では、検索クエリの補完だけでなく検索もプロファイル管理サーバ１が行ったが、補完の結果をプロファイル管理サーバ１から端末装置２へ送信し、検索は端末装置２が行ってもよい。

本実施形態では、取得トリガアクションデータ７ＣをＸＭＬで記述したが、他の言語で記述してもよい。

本実施形態では、ユーザが指定した検索クエリーを補正して情報の検索を行ったが、例えば次のように、重要な単語に関する情報を自動的に検索してもよい。

プロファイル管理サーバ１は、プロファイルデータ７Ｆに示される単語のうちの、重要度が所定の値以上である単語を抽出する。抽出した単語それぞれを検索クエリーとして、情報を検索する。例えば、「トクホ」、「ペットボトル」、および「お茶」それぞれの重要度が所定の値以上であれば、これら３つの単語それぞれを検索クエリーとして、情報を検索する。

そして、プロファイル管理サーバ１は、それぞれの単語についての検索結果を示すデータを端末装置２へ送信する。そして、端末装置２は、単語ごとの検索結果を表示する。

また、プロファイル管理サーバ１は、抽出した単語との関連度の高い他の単語を組み合わせて情報を検索し、検索結果を端末装置２へ提供してもよい。

例えば、「トクホ」との関連性が最も高い単語が「飲料」である場合は、プロファイル管理サーバ１は、「トクホ飲料」を検索クエリーとして検索し、検索結果を示すデータを端末装置２へ送信する。そして、端末装置２は、検索結果を、トクホの飲料リストとして、表示する。

または、プロファイル管理サーバ１は、「ペットボトル」との関連性が最も高い単語が「デザイン」である場合は、プロファイル管理サーバ１は、「ペットボトルデザイン」を検索クエリーとして検索し、検索結果を示すデータを端末装置２へ送信する。そして、端末装置２は、検索結果を、ペットボトルのデザイン集として、表示する。または、「作り方」との関連性が最も高い場合は、「ペットボトル作り方」を検索クエリーとして検索し、検索結果を示すデータを端末装置２へ送信する。そして、端末装置２は、検索結果を、ペットボトルの作り方のノウハウ集として、表示する。

または、プロファイル管理サーバ１は、「お茶」との関連性が最も高い単語が「新製品」である場合は、プロファイル管理サーバ１は、「お茶新製品」を検索クエリーとして検索し、検索結果を示すデータを端末装置２へ送信する。そして、端末装置２は、検索結果を、お茶の新製品情報として、表示する。

本実施形態では、端末装置２としてタブレットコンピュータを用いる場合を例に説明したが、ノート型パソコン、携帯電話端末、またはスマートフォンなどを用いることもできる。日立製作所のビジネス顕微鏡を用いてもよい。または、これらを複数台組み合わせて、端末装置２の上述の機能を実現してもよい。

１０２アクションデータ取得部（ユーザデータ取得手段）
１０３作業文書データ取得部（文書データ取得手段）
１０４カレントケース切換部（変更手段）
１０５単語抽出部（単語抽出手段）
１０６重要度算出部（重要度算出手段）
１０７関連度算出部（関連度算出手段）
１２３プロファイルデータ記憶部（キーワードデータ記憶手段）
１３１情報検索部（検索クエリー補正手段、検索処理手段）
６ＤＣ文書データ（文書データ）
７Ｂアクションデータ（ユーザデータ）
７Ｆプロファイルデータ（キーワードデータ）

Claims

ユーザの行動または状況を示すユーザデータを取得するユーザデータ取得手段と、
前記ユーザデータに示される前記行動または状況に関連する文書である関連文書の文書データを取得する文書データ取得手段と、
前記文書データに基づいて前記関連文書から単語を抽出する単語抽出手段と、
抽出された前記単語を前記ユーザによる検索の際に用いられるキーワードとして示すキーワードデータを記憶するキーワードデータ記憶手段と、
を有することを特徴とする検索支援システム。
前記文書データ取得手段は、前記ユーザデータに示される前記行動または状況が特定の行動または状況である場合に、前記文書データを取得する、
請求項１に記載の検索支援システム。
前記文書データ取得手段は、文書を取り扱うことが前記行動または状況として前記文書データに示されている場合は、当該取り扱う文書のデータを前記文書データとして取得する、
請求項２に記載の検索支援システム。
前記単語抽出手段は、前記取り扱う文書の中の前記ユーザが注目した部分がさらに前記文書データに示されている場合は、当該部分のみから前記単語を抽出する、
請求項３に記載の検索支援システム。
前記文書データ取得手段は、発言が前記行動または状況として前記文書データに示されている場合は、当該発言の際に前記ユーザが使用する文書のデータを前記文書データとして取得する、
請求項２に記載の検索支援システム。
前記特定の行動または状況を変更する変更手段、を有する、
請求項２ないし請求項５のいずれかに記載の検索支援システム。
前記単語ごとに、重要性の度合いを表わす重要度を算出する、重要度算出手段、を有し、
前記キーワードデータ記憶手段は、さらに、前記単語ごとに、当該単語の前記重要度を対応付けて記憶する、
請求項１ないし請求項６のいずれかに記載の検索支援システム。
前記重要度算出手段は、前記行動または状況に応じたアルゴリズムまたはパラメータによって前記重要度を算出する、
請求項７に記載の検索支援システム。
前記キーワードデータに基づいて、前記ユーザが指定した検索クエリーを補正する、検索クエリー補正手段と、
補正された前記検索クエリーに基づいて情報を検索する処理を行う検索処理手段と、を有する、
請求項１ないし請求項８のいずれかに記載の検索支援システム。
前記単語同士の関連性の度合いである関連度を算出する関連度算出手段、を有し、
前記検索処理手段は、前記検索クエリーを、当該検索クエリーに含まれる単語との前記関連度が最も高い単語を当該検索クエリーに付加することによって、補正する、
請求項９に記載の検索支援システム。
前記重要度が所定の値以上である前記単語ごとに、当該単語を検索クエリーとして情報を検索する検索手段と、
前記検索手段による検索結果を、前記単語ごとにグループ化して提示する、検索結果提示手段と、を有する、
請求項７または請求項８に記載の検索支援システム。
コンピュータが、
ユーザの行動または状況を示すユーザデータを取得し、
前記ユーザデータに示される前記行動または状況に関連する文書の文書データを取得し、
前記文書データに基づいて前記文書から単語を抽出し、
抽出された前記単語を前記ユーザによる検索の際に用いられるキーワードとして示すキーワードデータをキーワードデータ記憶手段に記憶させる、
ことを特徴とする検索支援方法。
コンピュータに、
前記ユーザの行動または状況を示すユーザデータを取得する処理を実行させ、
前記ユーザデータに示される前記行動または状況に関連する文書の文書データを取得する処理を実行させ、
前記文書データに基づいて前記文書から単語を抽出する処理を実行させ、
抽出された前記単語を前記ユーザによる検索の際に用いられるキーワードとして示すキーワードデータをキーワードデータ記憶手段に記憶させる処理を実行させる、
ことを特徴とするコンピュータプログラム。