JP2008033687A

JP2008033687A - 検索クエリー作成装置

Info

Publication number: JP2008033687A
Application number: JP2006207075A
Authority: JP
Inventors: Akira Karasutani; 彰烏谷; Takahiro Matsuda; 高弘松田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-07-28
Filing date: 2006-07-28
Publication date: 2008-02-14
Anticipated expiration: 2026-07-28
Also published as: US20080027915A1; JP4922692B2; EP1884877A1; US8595229B2

Abstract

【課題】ユーザが処理中の情報だけではなく、ユーザがタスクで参照しあったりデータをコピーしあったりした情報も含む、ユーザがタスクで扱っている全ての情報からクエリーを自動的に作成できるようにする。
【解決手段】計算機１に備えられた検索クエリー作成装置は、ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視部２と、情報操作監視部２により検出された情報操作に関するデータを蓄積する情報操作ＤＢ３と、情報操作ＤＢ３に蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出部４とを備える。
【選択図】図１

Description

本発明は、情報（ファイルやメールなど）を計算機で検索するシステムの検索条件式を作成する技術に関する。

情報検索時の検索条件式（以下、「検索クエリー」又は単に「クエリー」ともいう）を作成する代表的な手法として、次の２つがある。
手法１：ユーザによるクエリー作成
この手法１では、ユーザが、探したい情報に関するキーワードや属性（以下、「メタデータ」ともいう）などを考えてクエリーを作成する。そして、ユーザは、作成したクエリーを検索システムに入力して情報を検索する。Google（登録商標）やMSN Search（MSNは登録商標）などのWeb検索サービスやパソコンのファイル検索ソフトウェアなどで一般的に使われている手法である。

手法２：クエリー自動作成
この手法２では、ユーザではなく計算機が自動的にキーワードや属性などを抽出してクエリーを作成する。クエリーに指定するキーワードや属性などは、ユーザが現在処理している情報を計算機が自動的に分析して取り出す。現在処理している情報とは、ユーザが作成中の文書や閲覧中のWebページなどである。計算機は、作成したクエリーをユーザに提示したり、そのクエリーを用いて自動的に処理中の情報に関連する情報（関連情報）を検索したりする。

図２２は、クエリーを自動作成する従来の装置の概要を示す図である。同図に示したように、従来の装置は、ユーザが作業（以下「タスク」ともいう）を行う計算機（ＰＣ）１０１が、情報操作監視部１０２と、情報検出部１０３と、検索条件抽出部１０４と、クエリー作成部１０５とを備えて構成されている。情報操作監視部１０２は、ユーザが計算機１０１で行った情報操作を監視し、ユーザがどの情報を扱っているかを検出する。尚、同図では、ユーザが操作可能な情報が記録されている情報記録部を１０６として示している。情報検出部１０３は、情報操作監視部１０２の検出結果に基づき、現在ユーザが処理中の情報を検出する。検索条件抽出部１０４は、情報検出部１０３により検出された情報から検索条件を抽出する。クエリー作成部１０５は、検索条件抽出部１０４により抽出された検索条件を組み合わせてクエリーを作成する。そして、作成されたクエリーを用いて情報検索が行われる。

また、この他に、特許文献１には、ユーザが入力中の文書から、その文書の特徴を表す情報（特徴情報）を自動的に抽出して、特徴情報に基づいて関連する文書を検索する方法が記載されている。特徴情報は、その文書中のキーワードやその文書の属性である。同様に、Blinx社の検索システム（URL = http://www.blinkx.com/overview.php）も、ユーザが現在作業中の情報（文書、メール、Webページなど）の内容からキーワードを抽出してクエリーを生成し、検索を実行するシステムである。どちらの方法もユーザが現在作業している情報に対してクエリーを作成する。

また、特許文献２には、ユーザが入力した検索条件式からユーザの情報要求を取り出す方法が記載されている。ユーザが入力した検索条件式を計算機が一定間隔毎に集計して、検索条件の出現頻度などを求めてユーザの情報要求を把握する。
特開平１１−２６５３７８号公報特許第３５４７０６９号公報

従来のクエリー自動作成技術では、計算機はユーザが処理中の情報（文書やWebページなど）だけからクエリーを作成する。この場合、クエリーを作成する情報源は一つだけ（参照中のメールや、作成中のメールだけなど）になる。この情報源がユーザの情報要求に対応する全ての検索条件（キーワードや属性など）を含んでいれば、計算機は適切なクエリーを作成できる。しかし、情報源がユーザの情報要求を満たす十分な情報を含んでいない場合は、計算機が関連情報の検索に適切なクエリーを作成できない可能性がある。不十分な情報から作成されたクエリーを用いて検索を行った場合、検索結果にはユーザの情報要求とは関係のない情報（ノイズ情報）が多く含まれてしまう。

実際にユーザが作業(タスク)をする場合には、ユーザはタスクに関連する様々な情報を参照しながら、タスクを進めることが多い。例えば、ユーザがある文書を作成する場合、ユーザは他の文書や参考になるWebページ、タスクに関係するメールなどを参照しながらタスクを進めることがある。この場合、このタスクの特徴情報はこれら複数の情報に散らばって存在している可能性が高い。しかし、従来技術ではユーザが処理中の情報だけに着目するので、タスクで扱う他の情報源に含まれている特徴情報を抽出できない。その結果、計算機がタスクの特徴情報を十分に集めることができず、タスクの関連情報を的確に検索できる適切なクエリーを作成できない可能性がある。

他にも、タスクで新しく情報（文書やメールなど）を作成し始めた場合、最初のうちは情報に含まれる情報量が少ない。従来技術では処理中の情報だけに着目するので、この少ない情報量の中から関連情報を検索するクエリーを作成しなくてはならない。タスクで他の情報を参照したり、他の情報からデータをコピーしたりしても、それらの情報源に含まれる情報はクエリー作成に使用されない。したがって、情報量が少ないためにユーザの情報要求を十分に反映したクエリーを作成することができない。

本発明は、上記実情に鑑み、ユーザが処理中の情報だけではなく、ユーザがタスクで参照しあったりデータをコピーしあったりした情報も含む、ユーザがタスクで扱っている全ての情報からクエリーを自動的に作成できる検索クエリー作成装置、検索クエリー作成方法、及び検索クエリー作成プログラムを提供することを目的とする。

上記目的を達成するため、本発明の第１の態様に係る検索クエリー作成装置は、ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出手段と、を有することを特徴とする。

この装置によれば、ユーザが計算機で行っている作業を検出することができる。
また、本発明の第２の態様に係る検索クエリー作成装置は、上記第１の態様において、前記タスク検出手段により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出手段を有する、こと特徴とする。

この装置によれば、検出された作業でユーザが扱っていた情報群を同定することができ、その情報群から作業特徴情報を抽出することができる。
また、本発明の第３の態様に係る検索クエリー作成装置は、上記第２の態様において、前記作業特徴情報抽出手段により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成手段を有する、ことを特徴とする。

この装置によれば、抽出されたタスクの作業特徴情報を用いて、ユーザが計算機で行っているタスクに関連する情報を検索するための検索用のクエリーを作成することができる。

また、本発明の第４の態様に係る検索クエリー作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けてユーザの作業を検出する、ことを特徴とする。

この装置によれば、ユーザが現在扱っている情報に係る作業だけでなく、一定のスパンで扱っている情報群に係る作業を検出することができる。
また、本発明の第５の態様に係る検索クエリー作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、ユーザの情報操作の流れに対応した作業を検出することができる。
また、本発明の第６の態様に係る検索クエリー作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、ユーザの情報操作の内容に対応した作業を検出することができる。
また、本発明の第７の態様に係る検索クエリー作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、情報群の類似性だけを用いてユーザの作業を検出する場合よりも、少ない負荷でユーザの作業を検出することができる。
また、本発明の第８の態様に係る検索クエリー作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、情報群の類似性だけを用いてユーザの作業を検出する場合よりも、少ない負荷でユーザの作業を検出することができる。また、同じ作業目的でまったく内容の異なる情報群を扱った場合でも、情報操作の流れを用いて検出しているので、情報群だけを用いて検出した時よりも精度高くタスクを検出することができる。

尚、本発明は、上記各態様に係る装置に限らず、方法及びプログラムとして構成することもできる。

本発明によれば、ユーザが処理中の情報だけではなく、ユーザがタスクで参照しあったりデータをコピーしあったりした情報も含む、ユーザがタスクで扱っている全ての情報からクエリーを自動的に作成することができる。

以下、図面を参照しながら本発明の実施の形態を説明する。
図１は、本発明の一実施の形態に係る検索クエリー作成装置の概要を示す図である。
同図において、計算機（ＰＣ）１は、ユーザが作業を行うことが可能な計算機であり、内部に、情報操作監視部２と情報操作データベース（以下単に「情報操作ＤＢ」という）３とタスク検出部４と作業特徴情報抽出部５とクエリー作成部６とを有した検索クエリー作成装置を備えている。また、計算機１は、図示は省略するが、ネットワークを介して、他の複数の計算機（ＰＣ）やファイルサーバ等とも接続されている。

尚、本実施の形態では、計算機１が検索クエリー作成装置を備えているものとするが、例えば、ファイルサーバがそれを備えるようにすることもできるし、複数の計算機が検索クエリー作成装置の構成要素を分散して備えるようにすることもできる。

情報記録部７は、ユーザによる計算機１からの情報操作が可能な情報が記録されている情報記録部を表しており、計算機１の内部、外部、又はその両方に存在する。
計算機１が備えた検索クエリー作成装置は、詳しくは後述するように、ユーザのタスクを自動的に検出し、ユーザがタスクで扱っている複数の情報（情報群）を分析してクエリーを作成する。作成されたクエリーは、例えば、計算機１によってユーザに提示されたり、或いは、それを用いて計算機１によってタスクの関連情報が検索されたりする。

同図に示した検索クエリー作成装置において、情報操作監視部２は、ユーザが計算機で行う情報操作（情報の参照・作成・印刷、メールの送信・受信・参照、Webページ閲覧など）を監視し、ユーザが計算機で行った情報操作を検出する。情報操作を検出すると、検出した情報操作の操作内容、操作対象、及び操作日時などの情報操作に関するデータを情報操作ＤＢ３へ登録する。これにより、ユーザが計算機で行った全ての情報操作が情報操作ＤＢ３に蓄えられるようになり、情報操作ＤＢ３を参照してユーザの情報操作を分析し、ユーザの情報処理の流れやユーザが扱った情報の変遷を取り出すことが可能になる。

タスク検出部４は、情報操作ＤＢ３を参照してユーザの情報操作を分析し、ユーザのタスク（業務の始まりから終わり）を検出する。ここで、タスクの検出方法としては、ユーザの情報操作を一定時間間隔毎（例えば１０分、３０分毎など）に分割して検出したり、ユーザの情報操作の区切り（例えばファイルのＯＰＥＮからＣＬＯＳＥまでなど）を抽出して検出したり、ユーザが扱っている情報群の間の類似度の変化を求めて検出したり、といった方法がある。また、これらの方法を組み合わせてユーザの情報操作を分析してタスクを検出する方法もある。

例えば、情報群の類似度の変化を使って検出する方法では、ユーザが扱っている情報群をドキュメント空間へマッピングする。ドキュメント空間は、情報に含まれるキーワードや属性の出現頻度を要素とするベクトル空間である。タスク検出部４は、ユーザの情報操作や一定時間間隔など、予め定めた区切り毎に情報群をドキュメント空間へマッピングする。この時ドキュメント空間へマッピングした情報群のベクトルと前回マッピングした時のベクトルとの角度あるいは内積などを求めて、ユーザが扱っている情報の類似度を得る。ここで、この類似度が大きく変化するということは、ユーザが扱っている情報群が大きく変わったということを意味するので、タスクが変わったと推定してタスクを検出する。

タスク検出部４は、タスクを検出すると、検出したタスクに関する情報（タスク情報）を作業特徴情報抽出部５へ伝える。
作業特徴情報抽出部５は、ユーザがタスクで扱っていた情報群から作業特徴情報となるキーワードや属性を抽出する。より詳しくは、作業特徴情報抽出部５は、タスク検出部４からタスク情報を受け取った後、最初に情報操作ＤＢ３を参照してユーザがタスクで扱っていた情報群を同定する。続いて、同定した情報群を分析してキーワードや属性などを抽出し、それをクエリー作成部６へ渡す。

クエリー作成部６は、作業特徴情報抽出部５が抽出したキーワードや属性などを組み合わせて、ユーザのタスクに関連する情報を検索するためのクエリーを作成する。
作成されたクエリーは、例えば、計算機１によってユーザに提示されたり、或いは、それを用いて計算機１によってタスクの関連情報が検索されたりする。

図２は、本実施の形態に係る検索クエリー作成装置の動作の一例を、従来の装置（図２２参照）と対比して示す図である。
図２の例は、現在ユーザが計算機で「次回議題」という情報を作成（執筆）しながら、同時に、「メール」の情報と「前回議事録」という情報を参照している場合、すなわち、３つの情報を同時に参照している場合の例である。

この場合、従来の装置では、たとえユーザが計算機で同時に参照している情報が複数（この場合は「次回議題」、「メール」、「前回議事録」の３つ）であったとしても、現在ユーザが処理中の情報は「次回議題」であるので、その「次回議題」の情報だけからクエリーが作成される。同図の例では、「次回議題」の情報から、検索条件として「ＡＡＡ」と「ＢＢＢ」が抽出され、それらが組み合わされてクエリーとして「ＡＡＡ and ＢＢＢ」が作成されたことを示している。

これに対し、本実施の形態に係る検索クエリー作成装置は、ユーザの行っているタスクを検出して、そのタスク中で同時に扱っている情報群を取り出して、そこからクエリーを作成するものである。よって、本例の場合には、ユーザは３つの情報（「次回議題」、「メール」、「前回議事録」）を参照しながらタスクを行っているので、これら３つの情報から作業特徴情報が抽出されクエリーが作成されるようになる。同図の例では、「次回議題」、「メール」、「前回議事録」の３つの情報から、作業特徴情報として、「次回議題」の「ＡＡＡ」と「ＢＢＢ」、「メール」の「参加者Ｃ」、及び「前回議事録」の「ＤＤＤ」と「ＥＥＥ」が抽出され、それらが組み合わされてクエリーとして「ＡＡＡ and ＢＢＢ and ＤＤＤ and ＥＥＥ and 参加者Ｃ」が作成されたことを示している。

このように、本実施の形態に係る検索クエリー作成装置では、ユーザが処理中の情報（「次回議題」の情報）だけではなく、ユーザがタスクで扱っている全ての情報（「次回議題」、「メール」、及び「前回議事録」の情報）からクエリーを自動的に作成することができる。よって、クエリー作成の元となる情報源を、従来（従来の装置では情報源が一つだけ）に比べて数倍に広げられるので、ユーザの情報要求に近いクエリーを作成することができる可能性が高まる。

以下、本実施の形態に係る検索クエリー作成装置の動作を、各構成要素毎に詳細に説明する。
まず、情報操作監視部２の動作を、図３及び図４を用いて詳細に説明する。

情報操作監視部２は、情報に関する様々な操作を監視して、ユーザが行った操作を検出し、検出した操作を情報操作ＤＢ３に登録する。その監視においては、ユーザが計算機で扱った全ての情報に対する操作を監視する。例えば、ファイルやメール、アドレス帳、予定表、映像、音楽など様々な情報が、操作を監視する対象になる。監視する操作は、情報のオープン、クローズ、読出し、書き込み、印刷、コピー、移動、情報を表示するウィンドウのフォーカスや最大化、最小化など様々な操作になり、それを検出する。

図３は、そのような情報操作監視部２の動作を示すフローチャートである。
同図に示したように、情報操作監視部２は、まず、監視対象となる計算機上において、監視対象となるソフトウェアが動作しているか（実行中であるか）否かを判定する（Ｓ１）。ここで、Ｓ１がＮＯの場合には、動作を終了する。

一方、Ｓ１がＹＥＳの場合には、続いて、監視対象となるソフトウェア上でユーザにより情報操作が行われたか否かを判定する（Ｓ２）。ここで、その判定結果がＮＯの場合には処理がＳ１へ戻る。

一方、Ｓ２の判定結果がＹＥＳの場合には、続いて、Ｓ２で行われた情報操作が監視対象の情報操作であるか否かを判定する（Ｓ３）。ここで、その判定結果がＮＯの場合には処理がＳ１へ戻る。

一方、Ｓ３の判定結果がＹＥＳの場合には、続いて、Ｓ２で行われた情報操作に関するデータを情報操作ＤＢ３へ記録（登録）し（Ｓ４）、処理がＳ１へ戻る。
図４は、図３に示した情報操作監視部２の動作により情報操作ＤＢ３に記録された情報操作に関するデータの一例を示す図である。

図４に示したように、情報操作ＤＢ３には、検出された情報操作毎に、当該情報操作にユニークに付与された操作ＩＤ（「操作ＩＤ」）と、当該情報操作が行われた日付及び時間（「日付」及び「時間」）と、当該情報操作の内容（「操作」）と、当該情報操作の操作対象（「操作対象」）と、必要に応じて記録される操作詳細（「操作詳細」）と、当該情報操作を行ったユーザ名（「ユーザ名」）と、当該情報操作が行われた時に使用された計算機名（「ＰＣ名」）とが記録される。

次に、タスク検出部４の動作を、図５乃至図１６を用いて詳細に説明する。
タスク検出部４は、情報操作ＤＢ３を参照して新しい情報操作の有無を調べる。ここで新しい情報操作が存在した場合には、タスク分析を行ってタスクを検出し、検出したタスクを作業特徴情報抽出部５へ通知する。

尚、タスク検出部４が新しい情報操作の有無を検出する方法としては、例えば、タスク検出部４が定期的に情報操作ＤＢ３を参照したり、或いは、情報操作監視部２が情報操作ＤＢ３に情報操作に関するデータを記録（登録）した際に（図３のＳ４参照）、その旨をタスク検出部４に通知したりして行うという方法がある。

図５は、このようなタスク検出部４の動作を示すフローチャートである。
同図に示したように、タスク検出部４は、まず、情報操作ＤＢ３を参照する（Ｓ１１）。

続いて、参照した情報操作ＤＢ３に、タスク検出の対象ユーザによる対象計算機上（対象ＰＣ上）での新しい情報操作に関するデータが記録されているか否かを判定する（Ｓ１２）。ここで、その判定結果がＮＯの場合には、動作を終了する。

一方、Ｓ１２の判定結果がＹＥＳの場合には、情報操作ＤＢ３から最新の情報操作の操作ＩＤを読み出す（Ｓ１３）。
続いて、読み出した操作ＩＤに基づき、詳しくは後述するタスク分析を行って、タスクを検出する（Ｓ１４）。

続いて、検出されたタスクに関する情報として、詳しくは後述する、タスク開始操作ＩＤとタスク終了操作ＩＤ、若しくは、タスクで扱っている操作対象の一覧を、作業特徴情報抽出部５へ通知し（Ｓ１５）、動作を終了する。

ここで、Ｓ１４で行われるタスク分析について更に詳しく説明する。
Ｓ１４で行われるタスク分析には、
（１）一定時間間隔毎に情報操作を切り出してタスクを検出する方法と、
（２）情報操作の流れを判別してタスクを検出する方法と、
（３）情報操作で扱った情報群（複数の情報）の類似性を比較してタスクを検出する方法と、
（４）これらの方法を組み合わせてタスクを検出する方法と、
がある。（１）〜（４）の各方法を用いたタスク分析について順に説明する。

まず、（１）の方法を用いたタスク分析を、図６及び図７を用いて説明する。
図６は、（１）の方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部４は、まず、図５のＳ１３で情報操作ＤＢ３から読み出した最新の情報操作の操作ＩＤを、タスク終了操作ＩＤとして取得する（Ｓ２１）。

続いて、その最新の情報操作の日時を取得する（Ｓ２２）。
続いて、Ｓ２２で取得した最新の情報操作の日時から、タスク分析での所定時間単位分差し引いた日時を、タスク開始日時として取得する（Ｓ２３）。尚、所定時間単位とは、情報操作を一定時間間隔毎に切り出してタスクを検出するときの、その一定時間間隔のことであり、例えば、３０分、１時間、１日、１週間など予め定めた時間間隔である。

続いて、タスク開始日時以降で、最初の情報操作の操作ＩＤを、タスク開始操作ＩＤとして取得する（Ｓ２４）。
続いて、Ｓ２４で取得したタスク開始操作ＩＤからＳ２１で取得したタスク終了操作ＩＤまでの情報操作を、タスクとして検出し（Ｓ２５）、タスク分析を終了する。

ここで、（１）の方法を用いてタスク分析を行った場合の具体例を、図７を用いて説明する。
図７は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図である。

本例では、同図に示した操作ＩＤ（００１２）の情報操作が、最新の情報操作であるとし、タスク分析での所定時間単位を３０分とする。
この場合は、まず、最新の情報操作の操作ＩＤ（００１２）がタスク終了操作ＩＤとして取得され、その情報操作の日時（Sep/13/06 11:00 AM）が取得される。続いて、その日時から３０分を差し引いた日時(Sep/13/06 10:30 AM)が、タスク開始日時として取得され、タスク開始日時以降で、最初の情報操作の操作ＩＤ（００１０）が取得される。続いて、タスク開始操作ＩＤ（００１０）からタスク終了操作ＩＤ（００１２）までの情報操作（同図の黒塗り部分）がタスクとして検出される。

このような（１）の方法を用いたタスク分析によれば、ユーザが現在扱っている情報に係るタスクだけでなく、一定のスパンで扱っている情報群に係るタスクを検出することができる。

次に、（２）の方法を用いたタスク分析を、図８及び図９を用いて説明する。
（２）の方法を用いたタスク分析では、例えば、ユーザがある情報をオープンしてからクローズするまでは同一のタスクを行っていると考えられるので、こういった情報操作の流れからタスクを検出する。この間にユーザが他の情報に対して情報操作を行った場合には、それらの情報操作も同一タスクのために行われたものとして検出する。

図８は、このような（２）の方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部４は、まず、図５のＳ１３で情報操作ＤＢ３から読み出した最新の情報操作の操作ＩＤ（以下単に「最新情報操作ＩＤ」ともいう）と、その情報操作の操作（例えばＯＰＥＮ、ＣＬＯＳＥ等）を取得する（Ｓ３１）。

続いて、取得した操作が、情報の参照開始に関する操作であるか否かを判定する（Ｓ３２）。ここで、その判定結果がＮＯの場合には処理がＳ３５へ進む。
一方、Ｓ３２の判定結果がＹＥＳの場合には、続いて、その操作で参照している情報以外に、現在参照中の情報が有るか否かを判定する（Ｓ３３）。ここで、その判定結果がＹＥＳの場合には処理がＳ３５へ進む。

一方、Ｓ３３の判定結果がＮＯの場合には、続いて、Ｓ３１で取得した最新情報操作ＩＤをタスク開始操作ＩＤに設定して内部ＲＡＭ（random access memory）等に記憶する（Ｓ３４）。

続いて、Ｓ３４の後、又は、Ｓ３２がＮＯ或いはＳ３３がＹＥＳの場合には、Ｓ３１で取得した最新情報操作ＩＤをタスク終了操作ＩＤに設定する（Ｓ３５）。
続いて、タスク開始操作ＩＤからタスク終了操作ＩＤまでの情報操作を、タスクとして検出し（Ｓ３６）、タスク分析を終了する。

ここで、（２）の方法を用いてタスク分析を行った場合の具体例を、図９を用いて説明する。
図９は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図である。

本例では、同図に示した操作ＩＤ（０００９）の情報操作が、最新の情報操作であるとする。
この場合は、まず、操作ＩＤ（０００９）が最新情報操作ＩＤとして取得され、その情報操作の操作（ＣＬＯＳＥ）が取得される。続いて、その操作（ＣＬＯＳＥ）が参照開始に関する操作ではないので、その操作ＩＤ（０００９）がタスク終了操作ＩＤとして設定される。

尚、タスク開始操作ＩＤについては、過去に、操作ＩＤ（０００２）が最新情報操作ＩＤとして取得され、その情報操作の操作（ＯＰＥＮ）が取得された時点において、その操作（ＯＰＥＮ）が参照開始に関する操作であって、且つ、その時に他に参照中の情報が無かったので、その操作ＩＤ（０００２）がタスク開始操作ＩＤに設定されている。

よって、操作ＩＤ（０００９）がタスク終了操作ＩＤとして設定された後、続いて、タスク開始操作ＩＤ（０００２）からタスク終了操作ＩＤ（０００９）までの情報操作（同図の黒塗り部分）がタスクとして検出される。

このような（２）の方法を用いたタスク分析によれば、ユーザの情報操作の流れに対応したタスクを検出することができる。
次に、（３）の方法を用いたタスク分析を、図１０及び図１１を用いて説明する。

（３）の方法を用いたタスク分析では、タスク検出部４は、ユーザが情報操作で扱った情報群をベクトル空間にマッピングする。ここで、各ベクトルの要素は、情報に含まれるキーワードや属性の頻度である。タスク検出部４は、前回までの情報操作で扱った情報群のベクトル和と、新しい情報操作で扱っている情報のベクトルとの類似性を比較し、その値の大小でタスクを検出する。類似性が高い場合は、ユーザが似たような情報を扱い続けていることを意味する。従って、ユーザのタスクが継続していると判断して、タスクの操作対象テーブルに新しい情報操作で扱っている情報を加える。一方、類似性が低い場合は、ユーザの扱う情報の内容が大きく変わったことを意味する。従って、ユーザが新しくタスクを開始したとして、新しく操作対象テーブルを作成して、新しい情報操作で扱っている情報を登録する。尚、類似性の大小を判断する閾値は、予め設定しておく。また、作成された操作対象テーブルは、内部ＲＡＭ等に記憶される。

図１０は、このような（３）の方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部４は、まず、図５のＳ１３で情報操作ＤＢ３から読み出した最新の情報操作の操作ＩＤと、その情報操作の操作対象（例えばファイルＡ、ファイルＢ等）を取得する（Ｓ４１）。

続いて、取得した操作対象は、操作対象テーブルに未登録か否かを判定する（Ｓ４２）。ここで、その判定結果がＮＯの場合には処理がＳ５１へ進む。
一方、Ｓ４２の判定結果がＹＥＳの場合には、続いて、その操作対象の内容を取得し（Ｓ４３）、取得した内容をベクトル空間であるドキュメント空間にマッピングして、操作対象ベクトル１を取得する（Ｓ４４）。

続いて、操作対象テーブルに登録されている全ての操作対象の内容を取得し（Ｓ４５）、その取得した内容をドキュメント空間にマッピングして、操作対象ベクトル２を取得する（Ｓ４６）。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性（例えば角度や内積等）を取得する（Ｓ４７）。尚、両ベクトルの類似性を、例えば、両者の角度や内積とした場合には、類似性の大小を０、１等といった２値ではなく程度で表現することができる。

続いて、類似性の高低を比較するために、取得した類似性が予め定めた閾値以上か否かを判定する（Ｓ４８）。閾値以上であれば類似性が高いことを、閾値未満であれば類似性が低いことを表す。ここで、その判定結果がＮＯの場合には、操作対象テーブルを削除し（Ｓ４９）、処理がＳ５０へ進む。

一方、Ｓ４８の判定結果がＹＥＳの場合には、Ｓ４１で取得した操作対象を操作対象テーブルに追加登録し、或いは、Ｓ４９の後の場合には、新しく操作対象テーブルを作成して、それにＳ４１で取得した操作対象を登録する（Ｓ５０）。

続いて、操作対象テーブルを、タスクで扱っている操作対象の一覧として検出し（Ｓ５１）、タスク分析を終了する。尚、操作対象テーブルを、タスクで扱っている操作対象の一覧として検出したということは、すなわち、タスクとして、操作対象テーブルに登録されている操作対象を扱っているタスクが検出されたことになる。

ここで、（３）の方法を用いてタスク分析を行った場合の具体例を図１１(a),(b),(c) 及び図１２を用いて説明する。
図１１(a) は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図、同図(b) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録される以前の操作対象テーブルの内容を示す図、同図(c) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録された後の操作対象テーブルの内容を示す図である。図１２は、操作対象がマッピングされたドキュメント空間の一例を示す図である。尚、同図に示したドキュメント空間において、ベクトルの成分は操作対象に含まれる各単語の頻度とし、類似性は操作対象ベクトル１と操作対象ベクトル２との角度とする。

本例では、図１１(a) に示した操作ＩＤ（０００９）の情報操作が、最新の情報操作であるとする。
この場合は、まず、操作ＩＤ（０００９）が最新情報操作ＩＤとして取得され、その操作対象の内容（メールＡ）が取得される。続いて、その内容（メールＡ）がドキュメント空間にマッピングされ、操作対象ベクトル１（図１２参照）が取得される。

続いて、操作対象テーブル（図１１(b) 参照）に登録されている全ての操作対象の内容（ファイルＡ、ファイルＢ）が取得され、その内容（ファイルＡ、ファイルＢ）がベクトル空間にマッピングされ、そのベクトル和から操作対象ベクトル２（図１２参照）が取得される。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性（本例では両者の角度）が取得され、その値が閾値以上か否かが判定される。
この判定で、閾値以上でないと判定されたときには、これまでの操作対象テーブル（図１１(b) 参照）が破棄され、新しい操作対象テーブルが作成され、それに最新情報操作ＩＤ（０００９）の操作対象の内容（メールＡ）が登録される（同図(c) 参照）。続いて、その操作対象テーブルが、タスクで扱っている操作対象の一覧として検出される。

このような（３）の方法を用いたタスク分析によれば、ユーザの情報操作の内容に対応したタスクを検出することができる。
次に、（４）の方法を用いたタスク分析について説明する。

ここでは、（４）の方法を用いたタスク分析として、（１）と（３）を組み合わせた方法を用いたタスク分析と、（２）と（３）を組み合わせた方法を用いたタスク分析とを説明する。

まず、（１）と（３）を組み合わせた方法を用いたタスク分析を、図１３及び図１４(a),(b),(c)を用いて説明する。
（１）と（３）を組み合わせた方法を用いたタスク分析では、タスク検出部４が、情報操作を一定時間間隔毎に切り出した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する。

図１３は、このような（１）と（３）を組み合わせた方法を用いてタスク分析を行う場合のフローチャートである。
同図において、Ｓ６１乃至Ｓ６４では、図６に示したＳ２１乃至Ｓ２４と同様の処理が行われるので、ここでは説明を省略する。

Ｓ６４が終了すると、続いて、Ｓ６４で取得したタスク開始操作ＩＤからＳ６１で取得したタスク終了操作ＩＤまでの操作対象の内容を取得し（Ｓ６５）、取得した内容をベクトル空間であるドキュメント空間にマッピングして、操作対象ベクトル１を取得する（Ｓ６６）。

続くＳ６７以降については、図１０に示したＳ４５以降と同様の処理が行われるので、ここでは説明を省略する。
ここで、（１）と（３）を組み合わせた方法を用いてタスク分析を行った場合の具体例を、図１４(a),(b),(c)を用いて説明する。

図１４(a) は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図、同図(b) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録される以前の操作対象テーブルの内容を示す図、同図(c) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録された後の操作対象テーブルの内容を示す図である。

本例では、図１４(a) に示した操作ＩＤ（０００９）の情報操作が、最新の情報操作であるとし、タスク分析での所定時間単位を１５分とする。
この場合は、まず、最新の情報操作の操作ＩＤ（０００９）がタスク終了操作ＩＤとして取得され、その情報操作の日時（Sep/13/06 10:25 AM）が取得される。続いて、その日時から１５分を差し引いた日時(Sep/13/06 10:10 AM)が、タスク開始日時として取得され、タスク開始日時以降で、最初の情報操作の操作ＩＤ（０００３）が取得される。続いて、タスク開始操作ＩＤ（０００３）からタスク終了操作ＩＤ（０００９）までの情報操作で扱った操作対象の内容（ファイルＡ、ファイルＢ、メールＡ）が取得される。続いて、取得された内容がドキュメント空間にマッピングされ、そのベクトル和から操作対象ベクトル１が取得される。

続いて、操作対象テーブル（同図(b) 参照）に登録されている全ての操作対象の内容（ファイルＡ、ファイルＢ）が取得され、その内容（ファイルＡ、ファイルＢ）がベクトル空間にマッピングされ、そのベクトル和から操作対象ベクトル２が取得される。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性（例えば両者の角度）が取得され、その値が閾値以上か否かが判定される。
この判定で、閾値以上であると判定されたときには、操作対象テーブル（同図(b) 参照）に、操作対象ベクトル１の操作対象の内容（ファイルＡ、ファイルＢ、メールＡ）が追加登録される（同図(c) 参照）。尚、操作対象の内容が重複する場合には（本例ではファイルＡとファイルＢが重複）、上書き登録される。

続いて、その操作対象テーブル（同図(c) 参照）が、タスクで扱っている操作対象の一覧として検出される。
このような（１）と（３）を組み合わせた方法を用いたタスク分析によれば、情報群の類似性だけを用いてユーザのタスクを検出する場合よりも、少ない負荷でユーザのタスクを検出することができる。

次に、（２）と（３）を組み合わせた方法を用いたタスク分析を、図１５及び図１６(a),(b),(c)を用いて説明する。
（２）と（３）を組み合わせた方法を用いたタスク分析では、タスク検出部４が、情報操作の流れを判別した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する。

図１５は、このような（２）と（３）を組み合わせた方法を用いてタスク分析を行う場合のフローチャートである。
同図において、Ｓ８１乃至Ｓ８５では、図８に示したＳ３１乃至Ｓ３５と同様の処理が行われるので、ここでは説明を省略する。

Ｓ８５が終了すると、続いて、タスク開始操作ＩＤからタスク終了操作ＩＤまでの情報操作で扱った操作対象の内容を取得し（Ｓ８６）、取得した内容をベクトル空間であるドキュメント空間にマッピングして、操作対象ベクトル１を取得する（Ｓ８７）。

続くＳ８８以降については、図１０に示したＳ４５以降と同様の処理が行われるので、ここでは説明を省略する。
ここで、（２）と（３）を組み合わせた方法を用いてタスク分析を行った場合の具体例を、図１６(a),(b),(c)を用いて説明する。

図１６(a) は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図、同図(b) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録される以前の操作対象テーブルの内容を示す図、同図(c) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録された後の操作対象テーブルの内容を示す図である。

本例では、図１６(a) に示した操作ＩＤ（０００９）の情報操作が、最新の情報操作であるとする。
この場合は、まず、操作ＩＤ（０００９）が最新情報操作ＩＤとして取得され、その情報操作の操作（ＯＰＥＮ）が取得される。続いて、その操作（ＯＰＥＮ）が参照開始に関する操作であって、且つ、他に参照中の情報が無いので、その操作ＩＤ（０００９）がタスク開始操作ＩＤに設定される。また、その操作ＩＤ（０００９）は、タスク終了操作ＩＤにも設定される。

続いて、タスク開始操作ＩＤ（０００９）からタスク終了操作ＩＤ（０００９）までの情報操作で扱った操作対象の内容（メールＡ）が取得される。続いて、取得された内容（メールＡ）がドキュメント空間にマッピングされ、操作対象ベクトル１が取得される。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性（例えば両者の角度）が取得され、その値が閾値以上か否かが判定される。
この判定で、閾値以上であると判定されたときには、操作対象テーブル（同図(b) 参照）に、操作対象ベクトル１の操作対象の内容（メールＡ）が追加登録される（同図(c) 参照）。

続いて、その操作対象テーブル（同図(c) 参照）が、タスクで扱っている操作対象の一覧として検出される。
このような（２）と（３）を組み合わせた方法を用いたタスク分析によれば、情報群の類似性だけを用いてユーザのタスクを検出する場合よりも、少ない負荷でユーザのタスクを検出することができる。また、同じ作業目的でまったく種類の異なる情報群を扱った場合でも、情報操作の流れを用いて検出しているので、情報群だけを用いて検出した時よりも精度高くタスクを検出することができる。

次に、作業特徴情報抽出部５の動作について図１７及び図１８を用いて詳細に説明する。
作業特徴情報抽出部５は、タスク検出部４が検出したタスクで扱っていた情報群の内容や属性を読み出して、作業特徴情報を抽出する。例えば、情報群の内容に文字列が含まれている場合は、その文字列に対して形態素解析やn-gram処理などを行ってキーワードを抽出する。このように、作業特徴情報としてキーワードを抽出することにより、作業の中身や目的を取り出すことができる。情報群の属性としては、操作対象名（ファイル名、メール題名など）や操作対象の保存先名（フォルダ名、アドレス帳名など）、所有者、更新日時などである。このように、作業特徴情報として属性を抽出することにより、作業に共通する傾向を取り出すことができる。作業特徴情報抽出部５が抽出したキーワードや属性などの作業特徴情報は、そのままクエリー作成部６へ渡されることも、ＴＦ（Term Frequency）やＩＤＦ(Inverted document frequency)などを用いて重み付けて、クエリー作成部６へ渡されることもある。

図１７は、このような作業特徴情報抽出部５の動作を示すフローチャートである。
同図に示したように、作業特徴情報抽出部５は、まず、タスク検出部４から通知されたタスクに関する情報、すなわち、タスク開始操作ＩＤとタスク終了操作ＩＤ、若しくは、タスクで扱っている操作対象の一覧を取得する（Ｓ１０１）。

続いて、取得したものが、タスクで扱っている操作対象の一覧であったか否かを判定する（Ｓ１０２）。ここで、その判定結果がＮＯの場合、すなわち、取得したものがタスク開始操作ＩＤとタスク終了操作ＩＤであった場合には、情報操作ＤＢ３を参照して、タスク開始操作ＩＤからタスク終了操作ＩＤまでの情報操作で扱った操作対象を取得し（Ｓ１０３）、処理がＳ１０４に進む。

一方、Ｓ１０２の判定結果がＹＥＳの場合、又はＳ１０３の後は、続いて、操作対象の内容と、そのメタデータを取得する（Ｓ１０４）。
続いて、取得した操作対象の内容と、文字列を含むメータデータとを解析して、分かち書きする（Ｓ１０５）。分かち書きする際の解析は、形態素解析やn-gram処理などを用いて行われる。

続いて、分かち書きした各要素（キーワード）のＴＦ・ＩＤＦ（ＴＦとＩＤＦとの積）を算出する（Ｓ１０６）。これにより、分かち書きした要素をＴＦ・ＩＤＦで重み付けすることができる。

続いて、文字列以外の各メタデータの出現頻度を算出する（Ｓ１０７）。
続いて、分かち書きした要素とＴＦ・ＩＤＦの組み合わせと、メタデータと出現頻度の組み合わせを、作業特徴情報として抽出し（Ｓ１０８）、動作を終了する。

図１８は、図１７に示した処理を行う作業特徴情報抽出部５の構成例を示す図である。
図１８に示したように、作業特徴情報抽出部５において、ユニット５ａは、入力された操作対象から、操作対象の内容とそのメタデータを取得し、操作対象の内容と文字列を含むメタデータをユニット５ｂへ、文字列以外のメタデータをユニット５ｃへ出力する。尚、同図の例では、操作対象として、操作対象ファイルに登録されているファイルＡ、ファイルＢ、及びメールＡが、ユニット５ｂに入力されたことを示している。また、この場合、ユニット５ａは、メタデータとして、操作対象名、操作対象種類（例えばイメージ、音声等）、操作対象の保存フォルダ名、所有者、作成日時、更新日時、参照日時、送信者、受信者、送受信日時等を取得する。

ユニット５ｂは、操作対象の内容と、文字列を含むメタデータ（例えば操作対象名等）が入力されると、形態素解析やn-gram処理などにより、それを解析して、分かち書きを行い、分かち書きした要素（キーワード）をユニット５ｄへ出力する。

ユニット５ｄは、分かち書きした要素が入力されると、各要素のＴＦ・ＩＤＦを算出し、分かち書きした要素と各要素のＴＦ・ＩＤＦをユニット５ｅへ出力する。これにより、ＴＦ・ＩＤＦにより、分かち書きした要素の重み付けを行って、ノイズを除去（ノイズ成分の重み付けを小さく）することができる。尚、ＩＤＦは、操作対象内で算出される。同図の例では、ＩＤＦは、ファイルＡ、ファイルＢ、及びメールＡ内で、算出される。

ユニット５ｃは、文字列以外のメタデータ（例えば送信日時等）が入力されると、同じメタデータの出現頻度を取得し、メタデータとその出現頻度をユニット５ｅへ出力する。
ユニット５ｅは、ユニット５ｄから入力された、分かち書きした要素と各要素のＴＦ・ＩＤＦ、及び、ユニット５ｃから入力されたメタデータとその出現頻度を、作業特徴情報として出力する。

尚、本実施に形態において、作業特徴情報抽出部５は、作業特徴情報として、分かち書きした各要素のＴＦ・ＩＤＦを抽出（出力）しているが、分かち書きした各要素のＴＦ又は及びＩＤＦを抽出（出力）するようにすることもできるし、或いは、分かち書きした各要素のＴＦ又は及びＤＦ（document frequency）を抽出（出力）するようにすることもできる。このように、作業特徴情報として、ＴＦ・ＩＤＦ、又は、ＴＦ又は及びＩＤＦ若しくはＤＦを抽出することにより、ユーザが作業で重視している点を取り出すことができる。

次に、クエリー作成部６の動作を、図１９を用いて詳細に説明する。
クエリー作成部６は、作業特徴情報抽出部５が抽出したキーワード（分かち書きした要素）や属性（メタデータ）などをそのまま用いてクエリーを作成することができる。また、クエリー作成部６は、検索を行うシステムの条件に合わせてクエリーを作成することもできる。例えば、検索システムがBOOLEAN検索システムの場合は、各作業特徴情報をＡＮＤやＯＲなどの論理式で繋ぎ合わせてクエリーを作成する。このようにした場合には、作業の内容に対して漏れのないクエリーを作成することができる。或いは、検索システムがベクトル空間を用いた検索システムの場合は、各作業特徴情報ベクトル空間にマッピングして各作業特徴情報を要素とするベクトルを作ってクエリーとする。このようにした場合には、作業の内容との類似性を図ることのできるクエリーを作成することができる。

また、クエリー作成部６は、作業特徴情報抽出部５が抽出した作業特徴情報毎の重みを用いて、重みの大きな作業特徴情報だけを用いてクエリーを作成することもできる。この場合、作業特徴情報を使用するかどうかを判断するために、予め重みの閾値を定めておく。尚、作業特徴情報毎の重みは、作業特徴情報の頻度又は及び作業特徴情報を含む文書数を組み合わせて作ることができる。例えば、分かち書きした要素のＴＦ又は及びＤＦを組み合わせて作ることができる。このようにすることで、ユーザが重視している作業特徴情報を用いたクエリーを作成することができる。

図１９は、このような重みの大きな作業特徴情報だけを用いてクエリーを作成するクエリー作成部６の動作を示すフローチャートである。
同図に示したように、クエリー作成部６は、まず、作業特徴情報抽出部５から、分かち書きした要素と各要素のＴＦ・ＩＤＦ、及び、メタデータとその出現回数を取得する。（Ｓ１１１）。

続いて、各要素のＴＦ・ＩＤＦから、要素毎に重みを取得する（Ｓ１１２）。
続いて、要素の重みが大きい順に要素を並べ替え（Ｓ１１３）、要素の重みが予め定めた閾値以上の要素だけを残して他は削除する（Ｓ１１４）。

続いて、残った要素の論理積（ＡＮＤ）と、メタデータの論理和（ＯＲ）を検索クエリーとして作成し（Ｓ１１５）、動作を終了する。
尚、検索クエリーの作成は、図１９に示したフローチャートに従った方法以外にも、次のような方法などがある。

例えば、図１９に示したフローチャートの方法において、メタデータを使用しないで検索クエリーを作成する方法がある。また、取得したメタデータとその出現回数から、出現回数が予め定めた閾値以上のメタデータのみを使用して検索クエリーを作成する方法がある。また、分かち書きした要素のＴＦ・ＩＤＦを用いて、分かち書きした要素をドキュメント空間にマッピングし、それを検索クエリーとする方法がある。

ところで、図１に示した検索クエリー作成装置を備えた計算機１は、例えば、図２０に示すような情報処理装置（コンピュータ）を用いて構成される。
同図に示した情報処理装置は、ＣＰＵ（中央処理装置）１１、メモリ１２、入力装置１３、出力装置１４、外部記憶装置１５、媒体駆動装置１６、ネットワーク接続装置１７を備え、それらはバス１８により互いに接続されている。

メモリ１２は、例えば、ＲＯＭ（read only memory）、ＲＡＭ等を含み、処理に用いられるプログラムおよびデータを格納する。ＣＰＵ１１は、メモリ１２を利用してプログラムを実行することにより、必要な処理を行う。

図１に示した情報操作監視部２、タスク検出部４、作業特徴情報抽出部５、及びクエリー作成部６は、メモリ１２に格納されたプログラムまたはその機能に対応する。
入力装置１３は、例えば、キーボード、ポインティングデバイス、タッチパネル等であり、ユーザからの指示や情報の入力に用いられる。出力装置１４は、例えば、ディスプレイ、プリンタ、スピーカ等であり、ユーザへの問い合わせや処理結果等の出力に用いられる。

外部記憶装置１５は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。情報処理装置は、この外部記憶装置１５に、上記プログラムおよびデータを格納しておき、必要に応じて、それらをメモリ１２にロードして使用する。

媒体駆動装置１６は、可搬記録媒体１９を駆動し、その記録内容にアクセスする。可搬記録媒体１９は、メモリカード、フレキシブルディスク、ＣＤ−ＲＯＭ（compact disk read only memory ）、光ディスク、光磁気ディスク等の任意のコンピュータ読み取り可能な記録媒体である。ユーザは、この可搬記録媒体１９に上記プログラムおよびデータを格納しておき、必要に応じて、それらをメモリ１２にロードして使用する。

図１に示した情報操作ＤＢ３と情報記録部７の各々は、メモリ１２、外部記憶装置１５、又は可搬記録媒体１９に対応する。
ネットワーク接続装置１７は、ＬＡＮ（local area network）やインターネット等の任意の通信ネットワークに接続され、通信に伴うデータ変換を行う。情報処理装置は、必要に応じて、上記プログラムおよびデータを外部の装置からネットワーク接続装置１７を介して受け取り、それらをメモリ１２にロードして使用する。

図２１は、図２０の情報処理装置にプログラムおよびデータを供給することのできるコンピュータ読み取り可能な記録媒体を示している。可搬記録媒体１９やサーバ２１のデータベース２２に格納されたプログラムおよびデータは、情報処理装置２３のメモリ１２にロードされる。サーバ２１は、そのプログラムおよびデータを搬送する搬送信号を生成し、ネットワーク上の任意の伝送媒体を介して情報処理装置２３に送信する。ＣＰＵ１１は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。

（付記１）
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、
前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出手段と、
を有することを特徴とする検索クエリー作成装置。

これによれば、ユーザが計算機で行っている作業を検出することができる。
（付記２）
前記タスク検出手段により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出手段を有する、
こと特徴とする付記１記載の検索クエリー作成装置。

これによれば、検出された作業でユーザが扱っていた情報群を同定することができ、その情報群から作業特徴情報を抽出することができる。
（付記３）
前記作業特徴情報抽出手段により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成手段を有する、
ことを特徴とする付記２記載の検索クエリー作成装置。

これによれば、抽出されたタスクの作業特徴情報を用いて、ユーザが計算機で行っているタスクに関連する情報を検索するための検索用のクエリーを作成することができる。
（付記４）
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けてユーザの作業を検出する、
ことを特徴とする付記１乃至３の何れか一つに記載の検索クエリー作成装置。

これによれば、ユーザが現在扱っている情報に係る作業だけでなく、一定のスパンで扱っている情報群に係る作業を検出することができる。
（付記５）
前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、
ことを特徴とする付記１乃至３の何れか一つに記載の検索クエリー作成装置。

これによれば、ユーザの情報操作の流れに対応した作業を検出することができる。
（付記６）
前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記１乃至３の何れか一つに記載の検索クエリー作成装置。

これによれば、ユーザの情報操作の内容に対応した作業を検出することができる。
（付記７）
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記１乃至３の何れか一つに記載の検索クエリー作成装置。

これによれば、情報群の類似性だけを用いてユーザの作業を検出する場合よりも、少ない負荷でユーザの作業を検出することができる。
（付記８）
前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記１乃至３の何れか一つに記載の検索クエリー作成装置。

これによれば、情報群の類似性だけを用いてユーザの作業を検出する場合よりも、少ない負荷でユーザの作業を検出することができる。また、同じ作業目的でまったく内容の異なる情報群を扱った場合でも、情報操作の流れを用いて検出しているので、情報群だけを用いて検出した時よりも精度高くタスクを検出することができる。
（付記９）
前記タスク検出手段は、ユーザの作業の検出の際に、情報操作で扱っている情報群をベクトル空間にマッピングして、当該マッピングしたベクトル同士の内積を類似度とする、
ことを特徴とする付記６乃至８の何れか一つに記載の検索クエリー作成装置。

これによれば、類似性の大小を０、１等といった２値ではなく程度で表現することができる。
（付記１０）
前記作業特徴情報抽出手段は、同定した情報群の内容からキーワードを抽出して作業特徴情報とする、
ことを特徴とする付記２又は３記載の検索クエリー作成装置。

これによれば、作業の中身や目的を取り出すことができる。
（付記１１）
前記作業特徴情報抽出手段は、抽出したキーワードと、計数した各キーワードの頻度又は及びキーワードを含む文書数とを作業特徴情報とする、
ことを特徴とする付記１０記載の検索クエリー作成装置。

これによれば、ユーザが作業で重視している点を取り出すことができる。
（付記１２）
前記作業特徴情報抽出手段は、同定した情報群の属性を抽出して作業特徴情報とする、
ことを特徴とする付記２又は３記載の検索クエリー作成装置。

これによれば、作業に共通する傾向を取り出すことができる。
（付記１３）
前記作業特徴情報抽出手段により抽出された作業特徴情報を論理式で繋ぎ合わせて検索クエリーとする、
ことを特徴とする付記２、１０、１１、又は１２記載の検索クエリー作成装置。

これによれば、作業の内容に対して漏れのないクエリーを作成することができる。
（付記１４）
前記作業特徴情報抽出手段により抽出された作業特徴情報をベクトル空間にマッピングして検索クエリーとする、
ことを特徴とする付記２、１０、１１、又は１２記載の検索クエリー作成装置。

これによれば、作業の内容との類似性を図ることのできるクエリーを作成することができる。
（付記１５）
前記作業特徴情報抽出手段により抽出された作業特徴情報を、当該作業特徴情報の頻度又は及び当該作業特徴情報を含む文書数を組み合わせて重みを作り、重みの大きさで検索クエリー作成に用いる作業特徴情報を決定する、
ことを特徴とする付記２又は１１記載の検索クエリー作成装置。

これによれば、ユーザが重視している作業特徴情報を用いたクエリーを作ることができる。
（付記１６）
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出し、
検出した情報操作に関するデータを情報操作データベースに蓄積し、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出する、
ことを特徴とする検索クエリー作成方法。
（付記１７）
検出したユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する、
こと特徴とする付記１６記載の検索クエリー作成方法。
（付記１８）
抽出した作業特徴情報を組み合わせて検索クエリーを作成する、
ことを特徴とする付記１７記載の検索クエリー作成方法。
（付記１９）
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視機能と、
前記情報操作監視機能により検出された情報操作に関するデータを情報操作データベースに蓄積させる機能と、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出機能と、
をコンピュータに実現させるための検索クエリー作成プログラム。
（付記２０）
前記タスク検出機能により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出機能、
をコンピュータに実現させるための付記１９記載の検索クエリー作成プログラム。
（付記２１）
前記作業特徴情報抽出機能により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成機能、
をコンピュータに実現させるための付記２０記載の検索クエリー作成プログラム。

以上、本発明について詳細に説明したが、本発明は上記実施形態に限定されず、本発明の要旨を逸脱しない範囲において、各種の改良及び変更を行っても良いのはもちろんである。

本発明の一実施の形態に係る検索クエリー作成装置の概要を示す図である。本発明の一実施の形態に係る検索クエリー作成装置の動作の一例を、従来の装置と対比して示す図である。情報操作監視部の動作を示すフローチャートである。情報操作監視部の動作により情報操作ＤＢに記録された情報操作に関するデータの一例を示す図である。タスク検出部の動作を示すフローチャートである。一定時間間隔毎に情報操作を切り出してタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図である。情報操作の流れを判別してタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図である。情報操作で扱った情報群（複数の情報）の類似性を比較してタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。 (a) は情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図、(b) は操作ＩＤ（０００９）が情報操作ＤＢに登録される以前の操作対象テーブルの内容を示す図、(c) は操作ＩＤ（０００９）が情報操作ＤＢに登録された後の操作対象テーブルの内容を示す図である。操作対象がマッピングされたドキュメント空間の一例を示す図である。情報操作を一定時間間隔毎に切り出した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。 (a) は情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図、(b) は操作ＩＤ（０００９）が情報操作ＤＢに登録される以前の操作対象テーブルの内容を示す図、(c) は操作ＩＤ（０００９）が情報操作ＤＢに登録された後の操作対象テーブルの内容を示す図である。情報操作の流れを判別した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。 (a) は情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図、(b) は操作ＩＤ（０００９）が情報操作ＤＢに登録される以前の操作対象テーブルの内容を示す図、(c) は操作ＩＤ（０００９）が情報操作ＤＢに登録された後の操作対象テーブルの内容を示す図である。作業特徴情報抽出部の動作を示すフローチャートである。作業特徴情報抽出部の構成例を示す図である。重みの大きな作業特徴情報だけを用いてクエリーを作成するクエリー作成部の動作を示すフローチャートである。情報処理装置の構成図である。記録媒体を示す図である。クエリーを自動作成する従来の装置の概要を示す図である。

符号の説明

１計算機
２情報操作監視部
３情報操作データベース
４タスク検出部
５作業特徴情報抽出部
６クエリー作成部
７情報記録部
１１ＣＰＵ
１２メモリ
１３入力装置
１４出力装置
１５外部記憶装置
１６媒体駆動装置
１７ネットワーク接続装置
１８バス
１９可搬記録媒体
２１サーバ
２２データベース
２３情報処理装置
１０１計算機
１０２情報操作監視部
１０３情報検出部
１０４検索条件抽出部
１０５クエリー作成部

Claims

ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、
前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出手段と、
を有することを特徴とする検索クエリー作成装置。
前記タスク検出手段により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出手段を有する、
こと特徴とする請求項１記載の検索クエリー作成装置。
前記作業特徴情報抽出手段により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成手段を有する、
ことを特徴とする請求項２記載の検索クエリー作成装置。
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けてユーザの作業を検出する、
ことを特徴とする請求項１乃至３の何れか一つに記載の検索クエリー作成装置。
前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、
ことを特徴とする請求項１乃至３の何れか一つに記載の検索クエリー作成装置。
前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする請求項１乃至３の何れか一つに記載の検索クエリー作成装置。
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする請求項１乃至３の何れか一つに記載の検索クエリー作成装置。
前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする請求項１乃至３の何れか一つに記載の検索クエリー作成装置。
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出し、
検出した情報操作に関するデータを情報操作データベースに蓄積し、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出する、
ことを特徴とする検索クエリー作成方法。
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視機能と、
前記情報操作監視機能により検出された情報操作に関するデータを情報操作データベースに蓄積させる機能と、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出機能と、
をコンピュータに実現させるための検索クエリー作成プログラム。