JP4977420B2

JP4977420B2 - 検索インデックス作成装置

Info

Publication number: JP4977420B2
Application number: JP2006247451A
Authority: JP
Inventors: 彰烏谷; 高弘松田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-09-13
Filing date: 2006-09-13
Publication date: 2012-07-18
Anticipated expiration: 2026-09-13
Also published as: JP2008070997A; EP1901185A3; US20080065682A1; EP1901185A2; US8533150B2

Description

本発明は、計算機で情報（ファイルやメールなど）を検索するシステムにおける検索索引の作成技術に関する。

従来、情報検索システムにおける検索索引（以下「検索インデックス」又は単に「インデックス」ともいう）の作成技術として、次の２つがある。
ａ．情報毎のインデックス作成
これは、検索対象の情報毎にキーワードや属性（以下「メタデータ」ともいう）を抽出してインデックスを作成する技術である。検索時には、情報毎に検索条件（以下「クエリー」ともいう）と照合して、検索条件を満たす情報を返す。Google（登録商標）やMSN Search（MSNは登録商標）などの多くの情報検索システムが、この方法によりインデックスを作成している。例えば特許文献１には、ユーザの業務内容から業務で扱っている文書を自動的に抽出して、その業務の業務名と担当者、文書名を登録し、それら登録されたメタデータを使って文書を検索する技術が開示されている。

ｂ．情報群のインデックス作成
これは、例えば特許文献２に開示されているように、複数の情報を予め定められた参照番号を用いて情報群に分類し、情報群毎にインデックスを作成する技術である。情報群中のキーワードや文書タイトルなどを抽出してインデックスを作成する。検索時には、情報群とクエリーとを照合して、検索条件を満たす情報群を返す。クエリーと一致しないが情報群には含まれている情報を検索することができる。

図２６は、このｂ．の技術を適用した従来の装置の概要を示す図である。同図に示したように、従来の装置は、ユーザが作業（以下、「タスク」ともいう）を行う計算機（ＰＣ）１０１が、情報群検出部１０２と情報群データベース（以下「情報群ＤＢ」という）１０３とインデックス作成部１０４とインデックス記録部１０５とを備えて構成されている。情報群検出部１０２は、計算機１０１の内部又は外部にある情報記録部１０６に記録されているユーザが操作可能な情報を、各情報に予め定められている参照番号に基づいて情報群に分類し、分類した情報群に関するデータを情報群ＤＢ１０３に記録する。インデックス作成部１０４は、情報群ＤＢ１０３に記録された情報群に関するデータに基づいて、情報群毎にインデックスを作成する。インデックスの作成では、情報群中のキーワードや文書タイトルなどが抽出されてインデックスが作成される。作成されたインデックスは、インデックス記録部１０５に記録され、情報群の検索の際に使用される。
特開平１１−３９２９３号公報特開平１１−１４３９１２号公報

ところで、上述のａ．の技術では、ユーザが作業の中で複数の情報を扱っていて、それらの情報をひとまとめにして検索したいと考えても、情報群毎にインデックスを作成しないので、情報群を検索することができない。また、特許文献１では、業務名、担当者名、文書名などメタデータのみを登録して照合しており、文書内容を扱うことができない。特許文献１は、業務の抽出に操作履歴のシーケンスのみを用いており、その内容に基づいた判断を行っていないので、十分な精度で業務を抽出できない可能性がある。例えば、業務中にユーザが飛び込みで別の業務を始めた場合にも、そこで扱った情報をそのまま業務で扱った情報として登録してしまう可能性がある。

上述のｂ．の技術では、情報群を作るために予め参照番号を各情報に設定しておく必要がある。参照番号のない情報は情報群に含まれないので、検索対象にもならない。また参照番号は固定で動的には変化しない。従って、ユーザの情報の使い方（情報群の分類方法）や視点が変わった場合、参照番号を付け直してインデックスを作り直す必要がある。例えば、ユーザが日常的に複数の情報を扱う作業をした場合、各情報の関連性は日々のタスクによって変化する。しかしながら、ｂ．の技術では情報群が固定であるために、ユーザがある時点のタスクを手がかりに情報を探したくても、そのタスクに相当する情報群が存在しない可能性がある。情報群がなければ、そのインデックスも存在しないので、タスクに関連する情報を検索することができない。

本発明は、上記実情に鑑み、ユーザのタスクを自動的に検出して、タスクで扱っていた情報群毎にインデックス（タスクインデックス）を作成することができ、さらに、各情報群のタスクインデックスの類似性を比較して、類似性の高い情報群同士をまとめたもののタスクインデックスを作成することもできる、検索インデックス作成装置、検索インデックス作成方法、及び、検索インデックス作成プログラムを提供することを目的とする。

上記目的を達成するため、本発明の第１の態様に係る検索インデックス作成装置は、ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録するタスク検出手段と、を有することを特徴とする。

この装置によれば、ユーザが計算機で行っている作業を自動的に検出することができ、その作業で扱っていた情報群を特定することができる。
また、本発明の第２の態様に係る検索インデックス作成装置は、上記第１の態様において、前記タスクデータベースに蓄積された作業に関するデータから、作業同士の類似性を比較し、作業同士で内容の似た作業を検出して、当該作業同士で内容の似た作業をまとめた作業に関するデータを前記タスクデータベースに登録するタスク間類似性分析手段を有する、ことを特徴とする。

この装置によれば、作業同士の類似性を比較して、作業同士で内容の似た作業を検出することができる。
また、本発明の第３の態様に係る検索インデックス作成装置は、上記第１又は２の態様において、前記タスクデータベースに蓄積された作業に関するデータを取得し、作業毎に、作業で扱っていた情報群の検索索引を作成するタスクインデックス作成手段を有する、ことを特徴とする。

この装置によれば、作業毎に、作業で扱っていた情報群の検索索引を作成することができる。よって、予め情報に参照番号を付けずに動的に作業を検出して検索索引を作成できる。また、日々の情報操作に基づいて検出した作業の情報群に対して検索索引が作成されるので、ユーザが過去に行った作業を手がかりに（その時点の記憶を用いて）情報を検索できる。また、この装置によれば、作業同士の類似性を比較して、作業同士で内容の似た作業を検出し、内容の似た作業同士をまとめて大きな作業を作り、その大きな作業で扱っていた情報群の検索索引を作成することもできる。

また、本発明の第４の態様に係る検索インデックス作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けてユーザの作業を検出する、ことを特徴とする。

この装置によれば、ユーザが現在扱っている情報に係る作業だけでなく、一定のスパンで扱っている情報群に係る作業を検出することができる。
また、本発明の第５の態様に係る検索インデックス作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、ユーザの情報操作の流れに対応した作業を検出し、そこで扱っていた情報群を特定することができる。
また、本発明の第６の態様に係る検索インデックス作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、ユーザの情報操作の内容に対応した作業を検出し、そこで扱っていた情報群を特定することができる。
また、本発明の第７の態様に係る検索インデックス作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、情報群の類似性だけを用いてユーザの作業を検出する場合よりも、少ない負荷でユーザの作業を検出することができる。
また、本発明の第８の態様に係る検索インデックス作成装置は、上記第１乃至３の何れか一つの態様において、前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。

この装置によれば、情報群の類似性だけを用いてユーザの作業を検出する場合よりも、少ない負荷でユーザの作業を検出することができる。また、同じ作業目的でまったく内容の異なる情報群を扱った場合でも、情報操作の流れを用いて検出しているので、情報群だけを用いて検出した時よりも精度高く作業を検出することができる。

また、本発明の第９の態様に係る検索インデックス作成装置は、上記第３の態様において、作業の検出と検出した作業に関するデータの前記タスクデータベースへの登録、及び、検出した作業で扱っていた情報群の検索索引の作成を繰り返し行って、繰り返す度に小さな作業を大きな作業にまとめて検出し、検出した作業に関するデータを前記タスクデータベースに登録する、ことを特徴とする。

この装置によれば、作業の検出を繰り返し行うことで、作業を階層化（小作業⇒中作業⇒高作業）して検出することができるので、ユーザの情報ニーズに応じたレベルの作業（例えば日単位の作業、週単位の作業、月単位の作業、年単位の作業など）の検出が可能になる。

また、本発明の第１０の態様に係る検索インデックス作成装置は、上記第３の態様において、前記タスクインデックス作成手段は、複数の作業がまとめられた作業に関するデータを取得したときに、前記タスクデータベースを参照して、当該まとめられた作業に含まれる作業に関するデータを取得し、まとめられた作業毎に、当該まとめられた作業で扱っていた情報群の検索索引を作成する、ことを特徴とする。

この装置によれば、作業の検出を繰り返し行って作業を階層化（小作業⇒中作業⇒高作業）し、その検出した作業毎に検索索引を作成することができるので、ユーザの情報ニーズに応じたレベルの作業（例えば日単位の作業、週単位の作業、月単位の作業、年単位の作業など）を探索することが可能になる。
また、本発明の第１１の態様に係る検索インデックス作成装置は、ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録するタスク検出手段と、を有し、前記タスク検出手段は、最新の情報操作の操作対象の内容と、記憶手段に記憶されているテーブルに登録されている操作対象の内容との間の類似性が高いか否かを判定し、両者の間の類似性が高いと判定した場合には、前記テーブルに前記最新の情報操作の操作対象を追加登録し、両者の間の類似性が高くないと判定した場合には、前記テーブルを前記記憶手段から削除すると共に新規にテーブルを作成して前記記憶手段に記憶し、新規に作成した前記テーブルに前記最新の情報操作の操作対象を登録し、前記記憶手段に記憶されているテーブルに登録されている操作対象を扱っているタスクを、ユーザの作業として検出する、ことを特徴とする。

また、本発明は、上記各態様に係る装置に限らず、方法及びプログラムとして構成することもできる。

本発明によれば、ユーザのタスクを自動的に検出して、タスクで扱っていた情報群毎にインデックス（タスクインデックス）を作成できるので、情報を検索する際には、作成されたタスクインデックスとクエリーとを照合して、検索条件を満たす情報郡を検索結果として返すことができる。また、各情報群のタスクインデックスの類似性を比較して、類似性の高い情報群同士をまとめたもののタスクインデックスも作成できるので、タスクインデックスの類似性が高い、つまり内容が似ていると考えられるタスク同士をまとめて、そのまとめたタスクで扱っていた情報群を一度に検索できるようになる。よって、ユーザの探索視点・情報要求を汲み取り、ユーザの記憶している内容に応じた情報探索を実現することができる。

以下、図面を参照しながら本発明の実施の形態を説明する。
図１は、本発明の一実施の形態に係る検索インデックス作成装置の概要を示す図である。

同図において、計算機（ＰＣ）１は、ユーザが作業を行うことが可能な計算機であり、内部に、情報操作監視部２と情報操作データベース（以下単に「情報操作ＤＢ」という）３とタスク検出部４とタスクデータベース（以下単に「タスクＤＢ」という）５とタスク間類似性分析部６とタスクインデックス作成部７とタスクインデックス記録部８とを有した検索インデックス作成装置、を備えている。また、計算機１は、図示は省略するが、ネットワークを介して、１つ以上の装置（例えば、他の計算機（ＰＣ）やファイルサーバ等）とも接続されている。

尚、本実施の形態では、計算機１が検索インデックス作成装置を備えるものとするが、例えば、ネットワークを介して接続されている複数の装置（複数の計算機等）が検索インデックス作成装置の構成要素を分散して備えるようにすることもできる。

情報記録部９は、ユーザによる計算機１からの情報操作が可能な情報が記録されている記録部を示しており、計算機１の内部、外部、又はその両方に存在する。
計算機１が備えた検索インデックス作成装置は、詳しくは後述するように、ユーザのタスクを自動的に検出し、ユーザがタスクで扱っていた複数の情報（情報群）を抽出し、その情報群を分析して情報群のインデックスを作成する。尚、以下においては、ユーザがタスクで扱っていた情報群のインデックスを「タスクインデックス」という。また、検索インデックス作成装置は、タスクインデックスからタスク毎の類似度を算出し、類似度の高い（作業内容の似た）タスクをまとめて大きなタスクのタスクインデックスを作成する。そして、ユーザが情報を検索するときには、計算機１が、これらのタスクインデックスとクエリーとを照合して検索条件を満たすタスクインデックスを取得し、そのタスクで扱っていた情報群を返す。

このような検索インデックス作成装置において、情報操作監視部２は、ユーザが計算機で行う情報操作（情報の参照・作成・印刷、メールの送信・受信・参照、Webページ閲覧など）を監視し、ユーザが計算機で行った情報操作を検出する。情報操作を検出すると、検出した情報操作の操作内容、操作対象、及び操作日時などの情報操作に関するデータを情報操作ＤＢ３へ登録する。これにより、ユーザが計算機で行った全ての情報操作が情報操作ＤＢ３に蓄えられるようになり、後に、情報操作ＤＢ３を参照してユーザの情報操作を分析し、ユーザの情報処理の流れやユーザが扱った情報の変遷を取り出すことが可能になる。

タスク検出部４は、情報操作ＤＢ３を参照してユーザの情報操作を分析し、ユーザのタスク（タスクの始まりから終わり）を検出する。ここで、タスクの検出方法としては、ユーザの情報操作を一定時間間隔毎（例えば１０分、３０分毎など）に分割して検出したり、ユーザの情報操作の区切り（例えばファイルのＯＰＥＮからＣＬＯＳＥまでなど）を抽出して検出したり、ユーザが扱っている情報群の間の類似度の変化を求めて検出したり、といった方法がある。また、これらの方法を組み合わせてユーザの情報操作を分析してタスクを検出する方法もある。

例えば、情報群の類似度の変化を使って検出する方法では、ユーザが扱っている情報群をドキュメント空間へマッピングする。ドキュメント空間は、情報に含まれるキーワードや属性の出現頻度を要素とするベクトル空間である。タスク検出部４は、ユーザの情報操作や一定時間間隔など、予め定めた区切り毎に情報群をドキュメント空間へマッピングする。この時ドキュメント空間へマッピングした情報群のベクトルと前回マッピングした時のベクトルとの角度あるいは内積などを求めて、ユーザが扱っている情報の類似度を得る。ここで、この類似度が大きく変化するということは、ユーザが扱っている情報群が大きく変わったということを意味するので、タスクが変わったと推定してタスクを検出する。

タスク検出部４は、このようにしてタスクを検出すると、検出したタスクでユーザが扱っていた情報群を同定し、検出したタスクに関するデータをタスクＤＢ５へ登録する。
タスク間類似性分析部６は、タスクＤＢ５を参照してタスクに関するデータを取り出し、それぞれのタスクの類似性を比較する。ここで、タスクの類似性は、各タスクのタスクインデックス（後述のタスクインデックス作成部７により作成されタスクインデックス記録部８に記録されたタスクインデックス）を取得してその内容を比較する。タスクインデックスの内容を比較する方法としては、例えば、各タスクのタスクインデックスをドキュメント空間へマッピングして内容を比較する方法がある。この方法では、ドキュメント空間へマッピングしたタスクインデックスのベクトル同士の角度や内積を求めて、タスク間の類似度を得る。この類似度が近いということは、ユーザが似たような情報群を扱ったタスクを行っていたことを意味するので、タスク同士が似ていると判断して、これらのタスクを１つの大きなタスクにまとめて、まとめたタスクに関するデータをタスクＤＢ５へ登録する。

このタスク間類似性分析部６を再帰的に呼び出すことにより、個々の小さなタスクから、複数のタスクが集まった大きなタスクまで、様々なレベルのタスクを検出し、そのタスクインデックスの作成が可能になる。

タスクインデックス作成部７は、タスク検出部４やタスク間類似性分析部６が検出したタスクで扱っていた情報群を抽出して、その情報群のタスクインデックスを作成する。タスクインデックス作成部７が作成したタスクインデックスは、タスクインデックス記録部８に記録される。

このようにして作成されタスクインデックス記録部８に記録されたタスクインデックスは、ユーザが情報を検索する際に、計算機１によって、クエリーと照合され、そこで検索条件を満たすタスクインデックスが取得されて、そのタスクで扱っていた情報群が返される。

図２は、本実施の形態に係る検索インデックス作成装置により作成されるタスクインデックスの一例を、従来の装置（図２６参照）と対比して示す図である。
同図において、上段の部分は、ユーザが１日目〜５日目までの各タスクで扱っていた情報を示し、中段の部分は、従来の装置により作成されたインデックスの例を示し、下段の部分は、本実施の形態に係る装置により作成されたタスクインデックスの例を示している。尚、上段の部分に示した各情報の（）内の小文字アルファベットは、予め定められた参照番号を示している。

この場合、従来の装置では、ユーザが行った作業（タスク）とは関係なく、予め各情報に定められた参照番号に従って情報群を求めた後に、それぞれの情報群毎にインデックスを作成する。従って、同図の例では、情報A1,A2,A3が参照番号a、情報B1とB2が参照番号b、情報C1が参照番号cに設定されているので、それぞれ参照番号でまとめて情報群が作られ、そのインデックスが作成される。しかし、ユーザは日々のタスクで、予め定められた参照番号とは関係なくタスクに関係する情報を扱う可能性がある。ユーザはそれぞれのタスクで扱った情報を記憶しているが、インデックスはユーザが行ったタスクとは無関係に作られているので、このインデックスを使用した場合、ユーザの記憶に沿った検索を行うことができない。

これに対し、本実施の形態に係る装置では、日々のタスク毎に、そのタスクで扱った情報を取り出して、タスクインデックスを作成する。従って、ユーザが記憶しているタスクと対応するタスクインデックスを作成することができ、ユーザの記憶に沿った検索を行うことができる。尚、同図の例では、タスクの検出方法として日数（日単位）を用いたが、詳しくは後述するように、タスクはこれに限らず様々な方法で検出することができる。

以下、本実施の形態に係る検索インデックス作成装置の動作を、各構成要素毎に詳細に説明する。
まず、情報操作監視部２の動作を、図３及び図４を用いて詳細に説明する。

情報操作監視部２は、情報に関する様々な操作を監視して、ユーザが行った操作を検出し、検出した操作を情報操作ＤＢ３に登録する。監視においては、ユーザが計算機で扱った全ての情報に対する操作を監視する。例えば、ファイルやメール、アドレス帳、予定表、映像、音楽など様々な情報が、操作を監視する対象になる。監視する操作は、情報のオープン、クローズ、読出し、書き込み、印刷、コピー、移動、情報を表示するウィンドウのフォーカスや最大化、最小化など様々な操作になり、それを検出する。

図３は、このような情報操作監視部２の動作を示すフローチャートである。
同図に示したように、情報操作監視部２は、まず、監視対象となる計算機上において、監視対象となるソフトウェアが動作しているか（実行中であるか）否かを判定する（Ｓ１）。ここで、その判定結果がＮＯの場合には、本フローが終了する。

一方、Ｓ１がＹＥＳの場合には、続いて、監視対象となるソフトウェア上でユーザにより情報操作が行われたか否かを判定する（Ｓ２）。ここで、その判定結果がＮＯの場合には処理がＳ１へ戻る。

一方、Ｓ２の判定結果がＹＥＳの場合には、続いて、Ｓ２で行われた情報操作が監視対象の情報操作であるか否かを判定する（Ｓ３）。ここで、その判定結果がＮＯの場合には処理がＳ１へ戻る。

一方、Ｓ３の判定結果がＹＥＳの場合には、続いて、Ｓ２で行われた情報操作に関するデータを情報操作ＤＢ３へ記録（登録）し（Ｓ４）、処理がＳ１へ戻る。
図４は、図３に示した情報操作監視部２の動作により情報操作ＤＢ３に記録された情報操作に関するデータの一例を示す図である。

図４に示したように、情報操作ＤＢ３には、検出された情報操作毎に、当該情報操作にユニークに付与された操作ＩＤ（「操作ＩＤ」）と、当該情報操作が行われた日付及び時間（「日付」及び「時間」）と、当該情報操作の内容（「操作」）と、当該情報操作の操作対象（「操作対象」）と、必要に応じて記録される操作詳細（「操作詳細」）と、当該情報操作を行ったユーザ名（「ユーザ」）と、当該情報操作が行われた時に使用された計算機名（「ＰＣ名」）とが記録される。

次に、タスク検出部４の動作を、図５乃至図１８を用いて詳細に説明する。
タスク検出部４は、情報操作ＤＢ３を参照して新しい情報操作の有無を調べる。ここで新しい情報操作が存在した場合には、タスク分析を行ってタスクを検出し、当該タスクで扱っていた情報群を同定して、検出したタスクに関する情報をタスクＤＢ５へ記録（登録）する。

尚、タスク検出部４が新しい情報操作の有無を検出する方法としては、例えば、タスク検出部４が定期的に情報操作ＤＢ３を参照したり、或いは、情報操作監視部２が情報操作ＤＢ３に情報操作に関するデータを記録（登録）した際に（図３のＳ４参照）その旨をタスク検出部４に通知したりして行うという方法がある。

図５は、そのようなタスク検出部４の動作を示すフローチャートである。
同図に示したように、タスク検出部４は、まず、情報操作ＤＢ３を参照する（Ｓ１１）。

続いて、参照した情報操作ＤＢ３に、タスク検出の対象ユーザによる対象計算機上（対象ＰＣ上）での新しい情報操作に関するデータが記録されているか否かを判定する（Ｓ１２）。ここで、その判定結果がＮＯの場合には、本フローが終了する。

一方、Ｓ１２の判定結果がＹＥＳの場合には、情報操作ＤＢ３から最新の情報操作の操作ＩＤを読み出す（Ｓ１３）。
続いて、詳しくは図６乃至図１６を用いて後述するように、Ｓ１３で読み出した操作ＩＤに基づきタスク分析を行って、タスク（タスクの始めから終わり）の検出を行う（Ｓ１４）。尚、このタスク分析では、タスクの開始を検出した後、タスクの終了を検出するまでの間、ユーザの情報操作を後述の方法で分析し続ける。

続いて、Ｓ１４でタスク（タスクの始めから終わり）を検出したか否かを判定する（Ｓ１５）。ここで、その判定結果がＮＯの場合には、本フローが終了する。
一方、Ｓ１５の判定結果がＹＥＳの場合には、詳しくは図１７及び図１８を用いて後述するように、検出したタスクで扱っていた情報群を同定して、検出したタスクに関するデータをタスクＤＢ５へ記録（登録）し（Ｓ１６）、本フローが終了する。但し、Ｓ１６において、検出したタスクに関するデータが既にタスクＤＢ５に登録済みの場合には、タスクＤＢ５の内容を更新する。

ここで、Ｓ１４におけるタスク分析と、Ｓ１６におけるタスクＤＢ５への登録（又はタスクＤＢ５の更新）について、更に詳しく説明する。
まず、Ｓ１４におけるタスク分析について説明する。

タスク分析には、
（１）一定時間間隔毎に情報操作を切り出してタスクを検出する方法と、
（２）情報操作の流れを判別してタスクを検出する方法と、
（３）情報操作で扱った情報群（複数の情報）の類似性を比較してタスクを検出する方法と、
（４）これらの方法を組み合わせてタスクを検出する方法と、
がある。（１）〜（４）の各方法を用いたタスク分析について順に説明する。

まず、（１）の方法を用いたタスク分析を、図６及び図７を用いて説明する。
図６は、（１）の方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部４は、まず、図５のＳ１３で情報操作ＤＢ３から読み出した最新の情報操作の操作ＩＤを取得する（Ｓ２１）。

続いて、その最新の情報操作の日時を取得する（Ｓ２２）。
続いて、タスク開始日時が設定済みか否かを判定する（Ｓ２３）。
Ｓ２３の判定において、その判定結果がＮＯの場合には、Ｓ２１で取得した操作ＩＤとＳ２２で取得した日時を、タスク開始操作ＩＤとタスク開始日時として設定すると共に内部ＲＡＭ（random access memory）等に記憶し（Ｓ２４）、本フローが終了する。

一方、Ｓ２３の判定結果がＹＥＳの場合には、Ｓ２２で取得した日時が、設定されているタスク開始日時に所定時間単位を加えた日時以内か否かを判定する（Ｓ２５）。尚、所定時間単位とは、情報操作を一定時間間隔毎に切り出してタスクを検出するときの、その一定時間間隔のことであり、例えば、３０分、１時間、１日、１週間など予め定めた時間間隔である。

Ｓ２５の判定において、その判定結果がＹＥＳの場合には、本フローが終了する。
一方、Ｓ２５の判定結果がＮＯの場合には、Ｓ２１で取得した操作ＩＤに係る情報操作の一つ前の情報操作の操作ＩＤを、タスク終了操作ＩＤとして取得する（Ｓ２６）。

続いて、設定されているタスク開始操作ＩＤからＳ２６で取得したタスク終了操作ＩＤまでの情報操作をタスクとして検出する（Ｓ２７）。
続いて、Ｓ２１で取得した操作ＩＤとＳ２２で取得した日時を、タスク開始操作ＩＤとタスク開始日時として設定すると共に内部ＲＡＭ等に記憶し（Ｓ２８）、本フローが終了する。

ここで、（１）の方法を用いてタスク分析を行った場合の具体例を、図７を用いて説明する。
図７は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図である。

本例では、同図に示した操作ＩＤ（００１１）の情報操作が最新の情報操作であるとし、タスク分析での所定時間単位を１時間であるとし、タスク開始操作ＩＤとして操作ＩＤ（０００８）が設定されているものとする。

この場合は、まず、最新の情報操作の操作ＩＤ（００１１）が取得され、その情報操作の日時（Sep/14/06 12:35 PM）が取得される。続いて、設定済みのタスク開始日時であるタスク開始操作ＩＤ（０００８）の日時（Sep/14/06 11:20 AM）が取得される。続いて、操作ＩＤ（００１１）に係る情報操作の操作日時（Sep/14/06 12:35 PM）が、タスク開始日時（Sep/14/06 11:20 AM）に所定時間単位（１時間）を加えた日時（Sep/14/06 12:20 PM）以内か否かが判定される。本例では、その判定結果がＮＯとなるので、操作ＩＤ（００１１）に係る情報操作の一つ前の情報操作の操作ＩＤ（００１０）がタスク終了操作ＩＤとして取得される。続いて、タスク開始操作ＩＤ（０００８）からタスク終了操作ＩＤ（００１０）までの情報操作（同図の黒塗り部分）がタスクとして検出される。続いて、操作ＩＤ（００１１）と、その情報操作の日時(Sep/14/06 12:35 PM)が、タスク開始操作ＩＤとタスク開始日時として設定され内部ＲＡＭ等に記憶される。

尚、（１）の方法を用いたタスク分析では、この例で説明した以外にも、一日刻み単位（当日の0:00AMから11:59PM）や一週間刻み単位(日曜日から土曜日)、時間刻み単位（8:00AM〜8:59AM, 9:00AM〜9:59AM，…）といった具合に、それぞれの刻み単位内に起こった情報操作をタスクとして検出するようにすることもできる。

このような（１）の方法を用いたタスク分析によれば、ユーザが現在扱っている情報に係るタスクだけでなく、一定のスパンで扱っている情報群に係るタスクを検出することができる。

次に、（２）の方法を用いたタスク分析を、図８及び図９を用いて説明する。
（２）の方法を用いたタスク分析では、例えば、ユーザがある情報をオープンしてからクローズするまでは同一のタスクを行っていると考えられるので、こういった情報操作の流れからタスクを検出する。この間にユーザが他の情報に対して情報操作を行った場合には、それらの情報操作も同一タスクのために行われたものとして検出する。

図８は、このような（２）の方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部４は、まず、図５のＳ１３で情報操作ＤＢ３から読み出した最新の情報操作の操作ＩＤ（以下単に「最新情報操作ＩＤ」ともいう）と、その情報操作の操作（例えばＯＰＥＮ、ＣＬＯＳＥ等）を取得する（Ｓ３１）。

続いて、取得した操作が、情報の参照開始もしくは参照終了に関する操作であるか否かを判定する（Ｓ３２）。ここで、その判定結果がＮＯの場合には本フローが終了する。
一方、Ｓ３２の判定結果がＹＥＳであって情報の参照開始に関する操作である場合には、続いて、その操作で参照している情報以外に、現在参照中の情報が有るか否かを判定する（Ｓ３３）。ここで、その判定結果がＹＥＳの場合には本フローが終了する。一方、Ｓ３３の判定結果がＮＯの場合には、続いて、Ｓ３１で取得した最新情報操作ＩＤをタスク開始操作ＩＤに設定して内部ＲＡＭ等に記憶し（Ｓ３４）、本フローが終了する。

一方、Ｓ３２の判定結果がＹＥＳであって情報の参照終了に関する操作である場合には、続いて、その操作で参照を終える情報以外に、現在参照中の情報が有るか否かを判定する（Ｓ３５）。ここで、その判定結果がＹＥＳの場合には本フローが終了する。一方、Ｓ３５の判定結果がＮＯの場合には、続いて、Ｓ３１で取得した最新情報操作ＩＤをタスク終了操作ＩＤに設定する（Ｓ３６）。続いて、タスク開始操作ＩＤからタスク終了操作ＩＤまでの情報操作を、タスクとして検出し（Ｓ３７）、本フローが終了する。

ここで、（２）の方法を用いてタスク分析を行った場合の具体例を、図９を用いて説明する。
図９は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図である。

本例では、同図に示した操作ＩＤ（００１１）の情報操作が、最新の情報操作であるとする。
この場合は、操作ＩＤ（００１１）が最新情報操作ＩＤとして取得され、その情報操作の操作（ＣＬＯＳＥ）が取得される。続いて、その操作（ＣＬＯＳＥ）が参照終了に関する操作であって、且つ、その時に他に参照中の情報はないので、その操作ＩＤ（００１１）がタスク終了操作ＩＤとして設定される。

タスク開始操作ＩＤについては、過去に、操作ＩＤ（０００８）が最新情報操作ＩＤとして取得され、その情報操作の操作（ＯＰＥＮ）が取得された時点において、その操作（ＯＰＥＮ）が参照開始に関する操作であって、且つ、その時に他に参照中の情報が無かったので、その操作ＩＤ（０００８）がタスク開始操作ＩＤに設定されている。

よって、操作ＩＤ（００１１）がタスク終了操作ＩＤとして設定されると、続いて、タスク開始操作ＩＤ（０００８）からタスク終了操作ＩＤ（００１１）までの情報操作（同図の黒塗り部分）がタスクとして検出される。

このような（２）の方法を用いたタスク分析によれば、ユーザの情報操作の流れに対応したタスクを検出することができる。
次に、（３）の方法を用いたタスク分析を、図１０乃至図１２を用いて説明する。

（３）の方法を用いたタスク分析では、タスク検出部４は、ユーザが情報操作で扱った情報群をベクトル空間にマッピングする。ここで、各ベクトルの要素は、情報に含まれるキーワードや属性の頻度である。タスク検出部４は、前回までの情報操作で扱った情報群のベクトル和と、新しい情報操作で扱っている情報のベクトルとの類似性を比較し、その値の大小でタスクを検出する。類似性が高い場合は、ユーザが似たような情報を扱い続けていることを意味する。従って、ユーザのタスクが継続していると判断して、タスクの操作対象テーブルに新しい情報操作で扱っている情報を加える。一方、類似性が低い場合は、ユーザの扱う情報の内容が大きく変わったことを意味する。従って、ユーザが新しくタスクを開始したとして、新しく操作対象テーブルを作成して、新しい情報操作で扱っている情報を登録する。類似性の大小を判断する閾値は、予め設定しておく。尚、作成された操作対象テーブルは、内部ＲＡＭ等に記憶される。

図１０は、このような（３）の方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部４は、まず、図５のＳ１３で情報操作ＤＢ３から読み出した最新の情報操作の操作ＩＤと、その情報操作の操作対象（例えばファイルＡ、ファイルＢ等）を取得する（Ｓ４１）。

続いて、取得した操作対象は、操作対象テーブルに未登録か否かを判定する（Ｓ４２）。ここで、その判定結果がＮＯの場合には処理がＳ５１へ進む。
一方、Ｓ４２の判定結果がＹＥＳの場合には、続いて、その操作対象の内容を取得し（Ｓ４３）、取得した内容をベクトル空間であるドキュメント空間にマッピングして、操作対象ベクトル１を取得する（Ｓ４４）。

続いて、操作対象テーブルに登録されている全ての操作対象の内容を取得し（Ｓ４５）、その取得した内容をドキュメント空間にマッピングして、操作対象ベクトル２を取得する（Ｓ４６）。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性（例えば角度や内積等）を取得する（Ｓ４７）。尚、両ベクトルの類似性を、例えば、両者の角度や内積とした場合には、類似性の大小（高低）を０、１等といった２値ではなく０から１等の範囲の程度で表現することができる。

続いて、類似性の高低を比較するために、取得した類似性が予め定めた閾値以上か否かを判定する（Ｓ４８）。尚、取得した類似性が閾値以上であれば類似性が高いことを、閾値未満であれば類似性が低いことを表す。ここで、その判定結果がＮＯの場合には、操作対象テーブルを削除し（Ｓ４９）、処理がＳ５０へ進む。

一方、Ｓ４８の判定結果がＹＥＳの場合には、Ｓ４１で取得した操作対象を操作対象テーブルに追加登録する（Ｓ５０）。或いは、Ｓ４９の後に行われる場合には、新しく操作対象テーブルを作成して、それにＳ４１で取得した操作対象を登録する（Ｓ５０）。

Ｓ５０の後、又は、Ｓ４２がＮｏの場合には、続いて、操作対象テーブルを、タスクで扱っている操作対象の一覧として検出する（Ｓ５１）。尚、操作対象テーブルを、タスクで扱っている操作対象の一覧として検出したということは、すなわち、操作対象テーブルに登録されている操作対象を扱っているタスクが検出されたことになる。

また、Ｓ５１では、Ｓ４９で操作対象テーブルが削除されてＳ５０で新規に操作対象テーブルが作成されていた場合には、そのこと（新しいタスクを検出したこと）も併せて検出される。

Ｓ５１の処理が終わると、本フローが終了する。
ここで、（３）の方法を用いてタスク分析を行った場合の具体例を図１１(a),(b),(c) 及び図１２を用いて説明する。

図１１(a) は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図、同図(b) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録される前の操作対象テーブルの内容を示す図、同図(c) は、操作ＩＤ（０００９）が情報操作ＤＢ３に登録された後の操作対象テーブルの内容を示す図である。図１２は、操作対象がマッピングされたドキュメント空間の一例を示す図である。尚、同図に示したドキュメント空間において、ベクトルの成分は操作対象に含まれる各単語の頻度とし、類似性は操作対象ベクトル１と操作対象ベクトル２との角度とする。

本例では、図１１(a) に示した操作ＩＤ（０００９）の情報操作が、最新の情報操作であるとする。
この場合は、まず、操作ＩＤ（０００９）が最新情報操作ＩＤとして取得され、その操作対象の内容（ファイルＣ１）が取得される。続いて、その内容（ファイルＣ１）がドキュメント空間にマッピングされ、操作対象ベクトル１（図１２参照）が取得される。

続いて、操作対象テーブル（図１１(b) 参照）に登録されている全ての操作対象の内容（ファイルＡ２）が取得され、その内容（ファイルＡ２）がベクトル空間にマッピングされ、操作対象ベクトル２（図１２参照）が取得される。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性が取得され、その値が閾値以上か否かが判定される。
この判定で、閾値以上であると判定されたときには、これまでの操作対象テーブル（図１１(b) 参照）に最新情報操作ＩＤ（０００９）の操作対象の内容（ファイルＣ１）が追加登録される（同図(c) 参照）。続いて、その操作対象テーブル（同図(c) 参照）が、タスクで扱っている操作対象の一覧として検出される。

このような（３）の方法を用いたタスク分析によれば、ユーザの情報操作の内容に対応したタスクを検出することができる。
次に、（４）の方法を用いたタスク分析について説明する。

ここでは、（４）の方法を用いたタスク分析として、（１）と（３）を組み合わせた方法を用いたタスク分析と、（２）と（３）を組み合わせた方法を用いたタスク分析とを説明する。

まず、（１）と（３）を組み合わせた方法を用いたタスク分析を、図１３及び図１４(a),(b),(c)を用いて説明する。
（１）と（３）を組み合わせた方法を用いたタスク分析では、タスク検出部４が、情報操作を一定時間間隔毎に切り出した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する。

図１３は、このような（１）と（３）を組み合わせた方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部４は、まず、図５のＳ１３で情報操作ＤＢ３から読み出した最新の情報操作の操作ＩＤを取得する（Ｓ６１）。

続いて、その最新の情報操作の日時を取得する（Ｓ６２）。
続いて、Ｓ６２で取得した最新の情報操作の日時から、タスク分析での所定時間単位分差し引いた日時を、タスク開始日時として取得する（Ｓ６３）。尚、所定時間単位とは、情報操作を一定時間間隔毎に切り出してタスクを検出するときの、その一定時間間隔のことであり、例えば、３０分、１時間、１日、１週間など予め定めた時間間隔である。

続いて、タスク開始日時以降で、最初の情報操作の操作ＩＤを、タスク開始操作ＩＤとして取得する（Ｓ６４）。
続いて、Ｓ６４で取得したタスク開始操作ＩＤからＳ６１で取得したタスク終了操作ＩＤまでの操作対象の内容を取得する（Ｓ６５）。

続いて、Ｓ６５で取得した内容をベクトル空間であるドキュメント空間にマッピングして、操作対象ベクトル１を取得する（Ｓ６６）。
続くＳ６７乃至Ｓ７０では、図１０に示したＳ４５乃至Ｓ４９と同様の処理が行われるので、ここでは説明を省略する。

続いて、Ｓ６９の判定結果がＹＥＳの場合には、Ｓ６５で取得した操作対象（操作対象ベクトル１の操作対象）を操作対象テーブルに追加登録する（Ｓ７１）。或いは、Ｓ７０の後に行われる場合には、新しく操作対象テーブルを作成して、それにＳ６５で取得した操作対象を登録する（Ｓ７１）。

続くＳ７２以降については、図１０に示したＳ５１以降と同様の処理が行われるので、ここでは説明を省略する。
ここで、（１）と（３）を組み合わせた方法を用いてタスク分析を行った場合の具体例を、図１４(a),(b),(c)を用いて説明する。

図１４(a) は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図、同図(b) は、操作ＩＤ（００１２）が情報操作ＤＢ３に登録される前の操作対象テーブルの内容を示す図、同図(c) は、操作ＩＤ（００１２）が情報操作ＤＢ３に登録された後の操作対象テーブルの内容を示す図である。

本例では、図１４(a) に示した操作ＩＤ（００１２）の情報操作が、最新の情報操作であるとし、タスク分析での所定時間単位を３０分とする。
この場合は、まず、最新の情報操作の操作ＩＤ（００１２）がタスク終了操作ＩＤとして取得され、その情報操作の日時（Sep/14/06 13:00 PM）が取得される。続いて、その日時から３０分を差し引いた日時(Sep/14/06 12:30 PM)が、タスク開始日時として取得され、タスク開始日時以降で、最初の情報操作の操作ＩＤ（００１１）が取得される。続いて、タスク開始操作ＩＤ（００１１）からタスク終了操作ＩＤ（００１２）までの情報操作で扱った操作対象の内容（ファイルＡ２、メールＤ１）が取得される。続いて、取得された内容がドキュメント空間にマッピングされ、そのベクトル和から操作対象ベクトル１が取得される。

続いて、操作対象テーブル（同図(b) 参照）に登録されている全ての操作対象の内容（ファイルＡ２、ファイルＣ１）が取得され、その内容（ファイルＡ２、ファイルＣ１）がベクトル空間にマッピングされ、そのベクトル和から操作対象ベクトル２が取得される。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性（例えば両者の間の角度）が取得され、その値が閾値以上か否かが判定される。
この判定で、閾値以上であると判定されたときには、操作対象テーブル（同図(b) 参照）に、操作対象ベクトル１の操作対象の内容（ファイルＡ２、メールＤ１）が追加登録される（同図(c) 参照）。尚、操作対象の内容が重複する場合には（本例ではファイルＡ２が重複）、上書き登録される。

続いて、その操作対象テーブル（同図(c) 参照）が、タスクで扱っている操作対象の一覧として検出される。
このような（１）と（３）を組み合わせた方法を用いたタスク分析によれば、情報群の類似性だけを用いてユーザのタスクを検出する場合よりも、少ない負荷でユーザのタスクを検出することができる。

次に、（２）と（３）を組み合わせた方法を用いたタスク分析を、図１５及び図１６(a),(b),(c)を用いて説明する。
（２）と（３）を組み合わせた方法を用いたタスク分析では、タスク検出部４が、情報操作の流れを判別した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する。

図１５は、このような（２）と（３）を組み合わせた方法を用いてタスク分析を行う場合のフローチャートである。
同図において、Ｓ８１乃至Ｓ８６では、図８に示したＳ３１乃至Ｓ３６と同様の処理が行われるので、ここでは説明を省略する。

Ｓ８６が終了すると、続いて、タスク開始操作ＩＤからタスク終了操作ＩＤまでの情報操作で扱った操作対象の内容を取得し（Ｓ８７）、取得した内容をベクトル空間であるドキュメント空間にマッピングして、操作対象ベクトル１を取得する（Ｓ８８）。

続くＳ８９以降については、図１３に示したＳ６７以降と同様の処理が行われるので、ここでは説明を省略する。
ここで、（２）と（３）を組み合わせた方法を用いてタスク分析を行った場合の具体例を、図１６(a),(b),(c)を用いて説明する。

図１６(a) は、情報操作ＤＢ３に登録されている情報操作に関するデータの一例を示す図、同図(b) は、操作ＩＤ（００１３）が情報操作ＤＢ３に登録される前の操作対象テーブルの内容を示す図、同図(c) は、操作ＩＤ（００１３）が情報操作ＤＢ３に登録された後の操作対象テーブルの内容を示す図である。

本例では、図１６(a) に示した操作ＩＤ（００１３）の情報操作が、最新の情報操作であるとする。
この場合は、操作ＩＤ（００１３）が最新情報操作ＩＤとして取得され、その情報操作の操作（ＣＬＯＳＥ）が取得される。続いて、その操作（ＣＬＯＳＥ）が参照終了に関する操作であって、且つ、他に参照中の情報が無いので、その操作ＩＤ（００１３）がタスク終了操作ＩＤに設定される。

タスク開始操作ＩＤについては、過去に、操作ＩＤ（００１２）が最新情報操作ＩＤとして取得され、その情報操作の操作（ＯＰＥＮ）が取得された時点において、その操作（ＯＰＥＮ）が参照開始に関する操作であって、且つ、その時に他に参照中の情報が無かったので、その操作ＩＤ（００１２）がタスク開始操作ＩＤに設定されている。

よって、操作ＩＤ（００１３）がタスク終了操作ＩＤとして設定されると、続いて、タスク開始操作ＩＤ（００１２）からタスク終了操作ＩＤ（００１３）までの情報操作で扱った操作対象の内容（メールＤ１）が取得される。続いて、取得された内容（メールＤ１）がドキュメント空間にマッピングされ、操作対象ベクトル１が取得される。

続いて、操作対象ベクトル１と操作対象ベクトル２の類似性（例えば両者の間の角度）が取得され、その値が閾値以上か否かが判定される。
この判定で、閾値以上であると判定されたときには、操作対象テーブル（同図(b) 参照）に、操作対象ベクトル１の操作対象の内容（メールＤ１）が追加登録される（同図(c) 参照）。

続いて、その操作対象テーブル（同図(c) 参照）が、タスクで扱っている操作対象の一覧として検出される。
このような（２）と（３）を組み合わせた方法を用いたタスク分析によれば、情報群の類似性だけを用いてユーザのタスクを検出する場合よりも、少ない負荷でユーザのタスクを検出することができる。また、同じ作業目的でまったく内容の異なる情報群を扱った場合でも、情報操作の流れを用いて検出しているので、情報群だけを用いて検出した時よりも精度高くタスクを検出することができる。

次に、図５のＳ１６におけるタスクＤＢ５への登録（又はタスクＤＢ５の更新）について、図１７及び図１８を用いて説明する。
図１７は、そのＳ１６におけるタスクＤＢ５への登録（又はタスクＤＢ５の更新）のフローチャートを示す図である。

同図に示したように、タスク検出部４は、まず、タスク分析の結果を取得する（Ｓ１０１）。このＳ１０１では、図５のＳ１４のタスク分析において、タスクとしてタスク開始操作ＩＤからタスク終了操作ＩＤまでの情報操作が検出されていた場合には、そのタスク開始操作ＩＤとタスク終了操作ＩＤをタスク分析結果として取得する。一方、Ｓ１４のタスク分析において、タスクとして操作対象テーブルが検出されていた場合には、その操作対象テーブルをタスク分析結果として取得する。また、操作対象テーブルが検出されていた場合に、更に、新しいタスクを検出したことも検出されていた場合には、タスク分析結果として取得した操作対象テーブルを、新規に作成された操作対象テーブルとして取得する。

Ｓ１０１でタスク開始操作ＩＤとタスク終了操作ＩＤを取得した場合には、続いて、情報操作ＤＢ３を参照して、タスク開始操作ＩＤからタスク終了操作ＩＤまでの操作対象、ユーザ名、ＰＣ名等を取得し（Ｓ１０２）、取得したこれらの情報（タスクに関するデータ）をタスクＤＢ５へ登録する（Ｓ１０３）。尚、登録時には、タスクを一意に定めるタスクＩＤと登録日時（登録日と登録時間）も付加される。

一方、Ｓ１０１で操作対象テーブルを取得した場合には、続いて、それが新規に作成された操作対象テーブルであるか否かを判定する（Ｓ１０４）。
Ｓ１０４の判定結果がＹＥＳの場合には、タスクＤＢ５を参照して、最後に登録されたタスクの登録日時（以下「タスク登録日時」ともいう）を取得する（Ｓ１０５）。続いて、Ｓ１０１で取得した操作対象テーブルを参照して、その操作対象を取得する（Ｓ１０６）。続いて、情報操作ＤＢ３を参照して、Ｓ１０５で取得したタスク登録日時以降に、Ｓ１０６で取得した操作対象に対して行われた情報操作の操作ＩＤやユーザ名、ＰＣ名等を取得し（Ｓ１０７）、取得したこれらの情報（タスクに関するデータ）をタスクＤＢ５へ登録する（Ｓ１０３）。

一方、Ｓ１０４の判定結果がＮＯの場合には、タスクＤＢ５を参照して、最後に登録されたタスクのタスクＩＤとそのタスク登録日時を取得する（Ｓ１０８）。続いて、Ｓ１０１で取得した操作対象テーブルを参照して、その操作対象を取得する（Ｓ１０９）。続いて、情報操作ＤＢ３を参照して、Ｓ１０８で取得したタスク登録日時以降に、Ｓ１０９で取得した操作対象に対して行われた情報操作の操作ＩＤやユーザ名、ＰＣ名等を取得する（Ｓ１１０）。続いて、Ｓ１１０で取得した情報（タスクに関するデータ）をタスクＤＢ５に反映するため、タスクＤＢ５の該当タスクＩＤ（Ｓ１０８で取得したタスクＩＤ）の情報を更新する（Ｓ１１１）。尚、この更新において、Ｓ１１０で取得した情報と該当タスクＩＤの情報との間で重複する部分については、該当タスクＩＤの情報がＳ１１０で取得した情報によって上書きされる。

図１８は、図１７に示したフローによって登録或いは更新されたタスクＤＢ５の内容を示す図である。
同図に示したように、タスクＤＢ５には、登録されるタスク毎に、当該タスクに一意に定められたタスクＩＤ（「タスクＩＤ」）と、当該タスクが登録された日時（「登録日」及び「登録時間」）と、当該タスクで扱った情報群である情報操作の対象（「操作対象」）と、当該タスクを構成する情報操作の操作ＩＤ（「対象となる操作ＩＤ」）と、当該タスクを行ったユーザ名（「ユーザ」）と、当該タスクで使用された計算機名（「ＰＣ名」）等が記録される。尚、タスクＩＤは、タスクをタスクＤＢ５に新規に登録する場合に割り振られる。また、既にタスクＤＢ５に登録済みのタスクに関する情報を更新する場合は、上述のとおり、古いタスクに関する情報が上書きされる。

次に、タスク間類似性分析部６の動作について図１９及び図２０を用いて詳細に説明する。
タスク間類似性分析部６は、タスク同士の類似性を評価（分析）して、複数のタスクをまとめた大きなタスクを検出する。ここで、タスクに対してタスク間類似性分析部６による分析回数をタスクの多重化度（以下「タスク多重化度」ともいう）と定義すると、タスク間類似性分析部６は、同じ多重化度のタスク同士の類似性を分析する。

具体的には、タスク間類似性分析部６は、タスクＤＢ５を参照して同じ多重化度のタスクを取得した後、タスク検出部４による情報の類似性を用いたタスク検出と同様に、各タスクをドキュメント空間にマッピングしてベクトル化する。タスク間類似性分析部６がタスクをドキュメント空間にマッピングする場合、そのタスクのタスクインデックス（詳しくは後述するタスクインデックス作成部７により作成されタスクインデックス記録部８に記録されたタスクインデックス）を取得して、タスクで扱った情報群に含まれるキーワードとその頻度を用いてドキュメント空間にマッピングすることができる。タスク間の類似性は、ドキュメント空間にマッピングしたベクトル同士の類似性を、その角度や内積等により求めて、類似性の高いタスク同士をまとめて新しいタスクを検出し、タスクＤＢ５へ登録する。タスク間類似性分析部６が検出した、複数のタスクをまとめた新しいタスクをタスクＤＢ５へ登録する際には、新たにタスクＩＤを割り当てて、そのタスクＩＤ、登録日時、多重化度、及び、まとめられたタスクのタスクＩＤを記録する。タスクの多重化度は、新しいタスクにまとめられたタスクの多重化度に＋１する。このような処理を多重化度を変えて繰り返すことで、小さなタスクをまとめた大きなタスクを検出することができる。また、タスク間類似性分析部６は、タスクＤＢ５に登録されているタスクの多重化度が予め定めた最大値に達したり、タスクＤＢ５に登録したタスクの数が予め定めた最大値に達したりした時に、この処理を終えるようにすることができる。

図１９は、このようなタスク間類似性分析部６の動作を示すフローチャートである。
同図に示したように、タスク間類似性分析部６は、まず、タスク多重化度Ｎ＝０に設定する（Ｓ１２１）。

続いて、タスクＤＢ５を参照し（Ｓ１２２）、タスク多重化度Ｎのタスクを取得する（Ｓ１２３）。
続いて、タスク多重化度Ｎのタスクが有るか否かを判定する（Ｓ１２４）。ここで、その判定結果がＮＯの場合には、本フローが終了する。

一方、Ｓ１２４の判定結果がＹＥＳの場合には、取得したタスクをドキュメント空間にマッピングする（Ｓ１２５）。ここでのマッピングでは、タスクの操作対象をドキュメント空間にマッピングして、そのベクトル和をタスクのベクトルとする。

尚、このＳ１２５において、取得したタスクが１つだけであった場合には、そのドキュメント空間へのマッピングを行わずに、不図示ではあるが、続くＳ１２６及びＳ１２７をジャンプしてＳ１２８へ処理が進む。

Ｓ１２５の後、続いて、ドキュメント空間にマッピングされた各タスクのベクトルの類似性（例えば角度）を比較する（Ｓ１２６）。尚、各タスクのベクトルの類似性を、例えば、角度や内積とした場合には、類似性の大小を０、１等といった２値ではなく０から１等の範囲の程度で表現することができる。

続いて、Ｓ１２６の比較の結果、類似性が、多重化度に応じて予め定めた閾値以内のタスクをまとめて、新しいタスクとしてタスクＤＢ５に登録する（Ｓ１２７）。尚、この時には、タスク多重化度Ｎ＋１と、被多重化タスクとしてまとめられたタスクのタスクＩＤも、併せて登録される。このような処理は、新しいタスクとしてタスクＤＢ５に登録される全てのタスクに対して行われる。

続いて、タスク多重化度Ｎの値が、予め定めた多重化度に達したか否かを判定する（Ｓ１２８）。その判定結果がＹＥＳの場合には、本フローが終了する。
一方、Ｓ１２８の判定結果がＮＯの場合には、多重化度Ｎ＝Ｎ＋１とし（Ｓ１２９）、Ｓ１２３へ処理が戻る。

ここで、このようなタスク間類似性分析部６の動作が行われた場合の具体例を、図２０を用いて説明する。
本例では、タスク間類似性分析部６の動作が行われる前におけるタスクＤＢ５に登録されている内容を図１８に示したものであるとする。また、図１８では不図示であるが、タスクＩＤ（０００１）、（０００２）、及び、（０００３）の各タスクは何れもタスク多重化度として０がタスクＤＢ５に登録されている。

この場合、タスク間類似性分析部６の動作が行われると、まず、多重化度が０のタスクＩＤ（０００１）、（０００２）、及び、（０００３）のタスクが取得され、各タスクの操作対象がドキュメント空間にマッピングされ、タスク毎に、タスクの操作対象のベクトル和が求められタスクのベクトルが作られる。

続いて、タスクのベクトルの類似性が比較され、類似性の高い（閾値内の）タスクをまとめて新しいタスクとしてタスクＤＢ５に登録される。本例では、図２０に示すように、類似性の高いタスクとして、タスクＩＤ（０００１）及び（０００２）のタスクがまとめられ、新しいタスク（タスクＩＤ（０００４））としてタスクＤＢ５に登録される。このとき、タスクＩＤ（０００４）のタスクのタスク多重化度として１（０＋１）が登録され、また、その被多重化タスクＩＤとして、まとめられたタスクのタスクＩＤ（０００１）及び（０００２）が登録される。もちろん、このときには、その登録日時も登録される。

本例では、これで処理が終了するが、例えば、他にも、タスク多重化度が同一の複数のタスクがタスクＤＢ５に登録されていた場合には、このような処理が、予め定められたタスク多重化度に達するまで繰り返し行われる。但し、予め定められたタスク多重化度に達する以前であっても、次（Ｎ＝Ｎ＋１）のタスク多重化度のタスクが存在しなくなった場合には、そこで処理が終了する。

このようなタスク間類似性分析部６の動作によれば、タスクを階層化（小タスク⇒中タスク⇒高タスク）して取得することができるので、ユーザの情報ニーズに応じたレベルのタスク（例えば日単位のタスク、週単位のタスク、月単位のタスク、年単位のタスクなど）の取得が可能になる。

次に、タスクインデックス作成部７の動作について図２１及び図２２(a),(b)を用いて説明する。
タスクインデックス作成部７は、タスクＤＢ５を参照して、タスクインデックスが未作成のタスクが有るかどうかを調べ、タスクインデックスが未作成のタスクが有った場合にはタスクインデックスを作成し、それをタスクインデックス記録部８に記録する。このタスクインデックスの作成及び記録では、タスクで操作対象となった情報群を取得して、その情報群の内容や属性を取り出し、取り出した内容について形態素解析やn-gramなどの分かち書きを行って、分かち書きした各要素のＴＦ（Term Frequency）やＩＤＦ(Inverted document frequency)などを算出して、これらの組み合わせをタスクインデックスとして作成し記録する。

図２１は、このようなタスクインデックス作成部７の動作を示すフローチャートである。
同図に示したように、タスクインデックス作成部７は、まず、タスクＤＢ５を参照する（Ｓ１３１）。

続いて、タスクインデックスを未作成のタスクが有るか否かを判定する（Ｓ１３２）。ここで、その判定結果がＮＯの場合には、本フローが終了する。
一方、Ｓ１３２の判定結果がＹＥＳの場合には、タスクインデックスを未作成のタスク（タスクに関するデータ）を取得する（Ｓ１３３）。

続いて、Ｓ１３３で取得したタスクに関するデータから、タスクインデックスを未作成のタスクが多重化タスクであるか否かを判定する（Ｓ１３４）。
Ｓ１３４の判定結果がＹＥＳの場合には、多重化タスクに含まれているタスク多重化度０の被多重化タスク（被多重化タスクに関するデータ）を取得し（Ｓ１３５）、その被多重化タスクに関するデータから、全ての被多重化タスクの全ての操作対象を取得する（Ｓ１３６）。

一方、Ｓ１３４の判定結果がＮＯの場合には、Ｓ１３３で取得したタスクに関するデータから、当該タスクの全ての操作対象を取得する（Ｓ１３６）。
続いて、取得した全ての操作対象の内容を取得し、その内容の分かち書きを行って、分かち書きした各要素のＴＦ・ＩＤＦ（ＴＦとＩＤＦの積）を算出する（Ｓ１３７）。

続いて、分かち書きした要素と各要素のＴＦ・ＩＤＦを、当該タスクのタスクインデックスとして、タスクインデックス記録部８に記録し（Ｓ１３８）、本フローが終了する。
このような動作により、タスク毎に、当該タスクで扱っていた情報群のタスクインデックスが作成され、記録される。

尚、分かち書きした要素と各要素のＴＦ・ＩＤＦは、タスクで扱っていた情報群から抽出された、タスクを特徴付ける情報でもあるので、これをタスクインデックスとすることで、ユーザが実際にタスクで扱っていた情報群に関して記憶している内容を使ってタスクインデックスを作成することができる。また、分かち書きした要素であるキーワードや属性を、タスクを特徴付ける情報とすることで、タスクの中身や目的を取り出すこともできる。

図２２(a),(b) は、図２１に示したタスクインデックス作成部７の動作によりタスクインデックス記録部８に記録されたタスクインデックスの一例を示す図である。
本例では、同図(a),(b) に示したように、タスクインデックスを２つのテーブルに分けて記録（登録）している。同図(a) に示したテーブルは、情報群の内容を分かち書きした要素や属性を登録する要素テーブルである。より詳しくは、この要素テーブルは、要素や属性とそれに一意に割り当てられたＩＤ、さらにその要素がいくつの操作対象に含まれているかを表すＤＦ(Document Frequency)や登録日時などを登録する。同図(b) に示したテーブルは、各タスクで扱った操作対象にどういった要素や属性が含まれているのか、その要素や属性は検索する上でどれぐらいの重要性を持つのかを登録する要素重みテーブルである。より詳しくは、この要素重みテーブルは、タスクを一意に表すタスクＩＤ、そのタスクで扱った操作対象の情報群に含まれていた要素や属性を一意に表す要素ＩＤ、その要素ＩＤの要素がこのタスクで扱った操作対象の中に何回出現したかを表すＴＦ、その要素ＩＤの検索重み（ＴＦ×ＤＦの逆数）、登録日時などを登録する。尚、要素の検索重みは、検索方法に合わせて、これ以外にも２値（０：要素が出現しなかった，１要素が出現した）や、確率（要素の出現確率）などを用いることもできる。

このようなタスクインデックス作成部７の動作によれば、タスク検出部４により検出されたタスク毎にタスクインデックスを作成することができることは勿論のこと、階層化（小タスク⇒中タスク⇒高タスク）されたタスク毎にタスクインデックスを作成することもできるので、情報検索時に、計算機１は、ユーザの情報ニーズに応じたレベルのタスク（例えば日単位のタスク、週単位のタスク、月単位のタスク、年単位のタスクなど）で扱っていた情報群を探索することが可能になる。

ここで、計算機１がタスクインデックス記録部８に記録されているタスクインデックスを用いて情報検索を行うときの動作を、図２３を用いて説明する。
図２３は、計算機１が、タスクインデックス記録部８に記録されているタスクインデックスを用いて、タスクで扱った情報群を検索するときのフローチャートを示す図である。

同図に示したように、計算機１は、まず、検索条件を記したクエリーを取得する（Ｓ１４１）。クエリーは、ユーザが手動で検索条件を記したクエリー、或いは、計算機１が自動的に検索条件を記したクエリーである。尚、クエリーは、検索方法（例えばBOOLEAN検索やベクトル空間を用いた検索等）に合わせて記述される。

続いて、Ｓ１４１で取得したクエリーと、タスクインデックス記録部８に記録されている各タスクのタスクインデックスとの適合度合いを比較する（Ｓ１４２）。すなわち、検索を実施する。

続いて、Ｓ１４２の比較の結果、その適合度合いが予め定めた閾値以上であるか否かを判定する（Ｓ１４３）。ここで、その判定結果がＮＯの場合には、本フローが終了する。
一方、Ｓ１４３の判定結果がＹＥＳの場合には、その適合度合いが予め定めた閾値以上のタスクインデックスを取得する（Ｓ１４４）。

続いて、Ｓ１４４で取得したタスクインデックスからタスクＩＤを取得し、タスクＤＢ５を参照して、取得したタスクＩＤのタスクで扱った情報群を取得し提示する（Ｓ１４５）。すなわち、Ｓ１４４で取得したタスクインデックスの操作対象をタスクＤＢ５から取得して提示する。

尚、本フローのＳ１４３において、適合度合いの判定方法は、検索方法によって変わる。例えば、検索方法がBOOLEAN検索の場合、検索条件に指定された要素が出現したタスクはどれかをタスクインデックスを用いて探し出す。或いは、例えば、検索方法がベクトル空間を用いた検索の場合、検索条件に指定された要素が出現したタスクがどれかをタスクインデックスを用いて探し出した後、図１２等を用いて説明した情報の類似性によるタスク分析と同様にして適合度合いを調べる。すなわち、検索条件をドキュメント空間にマッピングしたベクトルと、タスクインデックスの各タスクをドキュメント空間にマッピングしたベクトルとの類似性を調べて、類似性が高いタスクを適合度合いが高いタスクとして得る。

以上のように、本実施の形態に係る検索インデックス作成装置によれば、ユーザが計算機で行っているタスクを自動的に検出して、タスク毎に、タスクで扱っていた情報群を特定し、その情報群からタスクインデックスを作成することができる。よって、予め情報に参照番号を付けずに動的にタスクを検出してタスクインデックスを作成することができる。また、日々の情報操作に基づいて検出したタスクで扱っていた情報群に対してタスクインデックスが作成されるので、ユーザが過去に行ったタスクを手がかりに（その時点の記憶を用いて）情報を検索できる。

また、タスク同士の類似性を比較して、タスク同士で内容の似たタスクを検出し、内容の似たタスク同士をまとめて大きなタスクを作り、その大きなタスクで扱っていた情報群のタスクインデックスを作成することもできる。

ところで、図１に示した検索インデックス作成装置を備えた計算機１は、例えば、図２４に示すような情報処理装置（コンピュータ）を用いて構成される。
同図に示した情報処理装置は、ＣＰＵ（中央処理装置）１１、メモリ１２、入力装置１３、出力装置１４、外部記憶装置１５、媒体駆動装置１６、ネットワーク接続装置１７を備え、それらはバス１８により互いに接続されている。

メモリ１２は、例えば、ＲＯＭ（read only memory）、ＲＡＭ等を含み、処理に用いられるプログラムおよびデータを格納する。ＣＰＵ１１は、メモリ１２を利用してプログラムを実行することにより、必要な処理を行う。

図１に示した情報操作監視部２、タスク検出部４、タスク間類似性分析部６、及びタスクインデックス作成部７は、メモリ１２に格納されたプログラムまたはその機能に対応する。

入力装置１３は、例えば、キーボード、ポインティングデバイス、タッチパネル等であり、ユーザからの指示や情報の入力に用いられる。出力装置１４は、例えば、ディスプレイ、プリンタ、スピーカ等であり、ユーザへの問い合わせや処理結果等の出力に用いられる。

外部記憶装置１５は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。情報処理装置は、この外部記憶装置１５に、上記プログラムおよびデータを格納しておき、必要に応じて、それらをメモリ１２にロードして使用する。

媒体駆動装置１６は、可搬記録媒体１９を駆動し、その記録内容にアクセスする。可搬記録媒体１９は、メモリカード、フレキシブルディスク、ＣＤ−ＲＯＭ（compact disk read only memory ）、光ディスク、光磁気ディスク等の任意のコンピュータ読み取り可能な記録媒体である。ユーザは、この可搬記録媒体１９に上記プログラムおよびデータを格納しておき、必要に応じて、それらをメモリ１２にロードして使用する。

図１に示した情報操作ＤＢ３、タスクＤＢ５、タスクインデックス記録部８、及び情報記録部９の各々は、メモリ１２、外部記憶装置１５、又は可搬記録媒体１９に対応する。また、タスク開始操作ＩＤとタスク開始日時や、タスク開始操作ＩＤや、操作対象テーブルが記憶される内部ＲＡＭは、メモリ１２に対応する。

ネットワーク接続装置１７は、ＬＡＮ（local area network）やインターネット等の任意の通信ネットワークに接続され、通信に伴うデータ変換を行う。情報処理装置は、必要に応じて、上記プログラムおよびデータを外部の装置からネットワーク接続装置１７を介して受け取り、それらをメモリ１２にロードして使用する。

図２５は、図２４の情報処理装置にプログラムおよびデータを供給することのできるコンピュータ読み取り可能な記録媒体を示している。可搬記録媒体１９やサーバ２１のデータベース２２に格納されたプログラムおよびデータは、情報処理装置２３のメモリ１２にロードされる。サーバ２１は、そのプログラムおよびデータを搬送する搬送信号を生成し、ネットワーク上の任意の伝送媒体を介して情報処理装置２３に送信する。ＣＰＵ１１は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。

以上、本発明について詳細に説明したが、本発明は上記実施形態に限定されず、本発明の要旨を逸脱しない範囲において、各種の改良及び変更を行っても良いのはもちろんである。

（付記１）
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、
前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録するタスク検出手段と、
を有することを特徴とする検索インデックス作成装置。
（付記２）
前記タスクデータベースに蓄積された作業に関するデータから、作業同士の類似性を比較し、作業同士で内容の似た作業を検出して、当該作業同士で内容の似た作業をまとめた作業に関するデータを前記タスクデータベースに登録するタスク間類似性分析手段を有する、
ことを特徴とする付記１記載の検索インデックス作成装置。
（付記３）
前記タスクデータベースに蓄積された作業に関するデータを取得し、作業毎に、作業で扱っていた情報群の検索索引を作成するタスクインデックス作成手段を有する、
ことを特徴とする付記１又は２記載の検索インデックス作成装置。
（付記４）
前記タスクインデックス作成手段により作成された検索索引を記録するタスクインデックス記録手段を有する、
ことを特徴とする付記３記載の検索インデックス作成装置。
（付記５）
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けてユーザの作業を検出する、
ことを特徴とする付記１乃至４の何れか一つに記載の検索インデックス作成装置。
（付記６）
前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、
ことを特徴とする付記１乃至４の何れか一つに記載の検索インデックス作成装置。
（付記７）
前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記１乃至４の何れか一つに記載の検索インデックス作成装置。
（付記８）
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記１乃至４の何れか一つに記載の検索インデックス作成装置。
（付記９）
前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記１乃至４の何れか一つに記載の検索インデックス作成装置。
（付記１０）
前記タスク検出手段は、ユーザの作業を検出する際に、情報操作で扱っている情報群をベクトル空間にマッピングして、当該マッピングしたベクトル同士の内積を類似度とする、
ことを特徴とする付記７乃至９の何れか一つに記載の検索インデックス作成装置。
（付記１１）
前記タスク間類似性分析手段は、作業同士の類似性を比較する際に、情報操作で扱っている情報群をベクトル空間にマッピングして、当該マッピングしたベクトル同士の内積を類似度とする、
ことを特徴とする付記２記載の検索インデックス作成装置。
（付記１２）
作業の検出と検出した作業に関するデータの前記タスクデータベースへの登録、及び、検出した作業で扱っていた情報群の検索索引の作成を繰り返し行って、繰り返す度に小さな作業を大きな作業にまとめて検出し、検出した作業に関するデータを前記タスクデータベースに登録する、
ことを特徴とする付記３記載の検索インデックス作成装置。
（付記１３）
前記タスクインデックス作成手段は、複数の作業がまとめられた作業に関するデータを取得したときに、前記タスクデータベースを参照して、当該まとめられた作業に含まれる作業に関するデータを取得し、まとめられた作業毎に、当該まとめられた作業で扱っていた情報群の検索索引を作成する、
ことを特徴とする付記３記載の検索インデックス作成装置。
（付記１４）
前記タスクインデックス作成手段は、作業で扱っていた情報群から、当該作業を特徴付ける情報を抽出して検索索引とする、
ことを特徴とする付記３又は１３記載の検索インデックス作成装置。
（付記１５）
前記タスクインデックス作成手段は、前記作業を特徴付ける情報として、作業で扱っていた情報群の内容を分かち書きしたキーワードや属性を用いて検索索引とする、
ことを特徴とする付記１４記載の検索インデックス作成装置。
（付記１６）
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出し、
検出した情報操作に関するデータを情報操作データベースに蓄積させ、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録する、
ことを特徴とする検索インデックス作成方法。
（付記１７）
前記タスクデータベースに蓄積された作業に関するデータから、作業同士の類似性を比較し、作業同士で内容の似た作業を検出して、当該作業同士で内容の似た作業をまとめた作業に関するデータを前記タスクデータベースに登録する、
ことを特徴とする付記１６記載の検索インデックス作成方法。
（付記１８）
前記タスクデータベースに蓄積された作業に関するデータを取得し、作業毎に、作業で扱っていた情報群の検索索引を作成する、
ことを特徴とする付記１６又は１７記載の検索インデックス作成方法。
（付記１９）
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視機能と、
前記情報操作監視機能により検出された情報操作に関するデータを情報操作データベースに蓄積させる機能と、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録するタスク検出機能と、
をコンピュータに実現させるための検索インデックス作成プログラム。
（付記２０）
前記タスクデータベースに蓄積された作業に関するデータから、作業同士の類似性を比較し、作業同士で内容の似た作業を検出して、当該作業同士で内容の似た作業をまとめた作業に関するデータを前記タスクデータベースに登録するタスク間類似性分析機能、
をコンピュータに実現させるための付記１９記載の検索インデックス作成プログラム。
（付記２１）
前記タスクデータベースに蓄積された作業に関するデータを取得し、作業毎に、作業で扱っていた情報群の検索索引を作成するタスクインデックス作成機能、
をコンピュータに実現させるための付記１９又は２０記載の検索インデックス作成プログラム。

本発明の一実施の形態に係る検索インデックス作成装置の概要を示す図である。本発明の一実施の形態に係る検索インデックス作成装置により作成されるタスクインデックスの一例を、従来の装置と対比して示す図である。情報操作監視部の動作を示すフローチャートである。情報操作監視部の動作により情報操作ＤＢに記録された情報操作に関するデータの一例を示す図である。タスク検出部の動作を示すフローチャートである。一定時間間隔毎に情報操作を切り出してタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図である。情報操作の流れを判別してタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図である。情報操作で扱った情報群（複数の情報）の類似性を比較してタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。 (a) は情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図、(b) は操作ＩＤ（０００９）が情報操作ＤＢに登録される前の操作対象テーブルの内容を示す図、(c) は操作ＩＤ（０００９）が情報操作ＤＢに登録された後の操作対象テーブルの内容を示す図である。操作対象がマッピングされたドキュメント空間の一例を示す図である。情報操作を一定時間間隔毎に切り出した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。 (a) は情報操作ＤＢ３登録されている情報操作に関するデータの一例を示す図、(b) は操作ＩＤ（００１２）が情報操作ＤＢに登録される前の操作対象テーブルの内容を示す図、(c) は操作ＩＤ（００１２）が情報操作ＤＢに登録された後の操作対象テーブルの内容を示す図である。情報操作の流れを判別した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する方法を用いてタスク分析を行う場合のフローチャートである。 (a) は情報操作ＤＢに登録されている情報操作に関するデータの一例を示す図、(b) は操作ＩＤ（００１３）が情報操作ＤＢに登録される前の操作対象テーブルの内容を示す図、(c) は操作ＩＤ（００１３）が情報操作ＤＢに登録された後の操作対象テーブルの内容を示す図である。Ｓ１６におけるタスクＤＢ５への登録（又はタスクＤＢ５の更新）のフローチャートを示す図である。登録或いは更新されたタスクＤＢ５の内容を示す図である。タスク間類似性分析部の動作を示すフローチャートである。タスク間類似性分析部の動作が行われた後のタスクＤＢに登録されている内容の一例を示す図である。タスクインデックス作成部の動作を示すフローチャートである。 (a),(b) は、タスクインデックス作成部の動作によりタスクインデックス記録部に記録されたタスクインデックスの一例を示す図である。計算機が、タスクインデックス記録部に記録されているタスクインデックスを用いて、タスクで扱った情報群を検索するときのフローチャートを示す図である。情報処理装置の構成図である。記録媒体を示す図である。情報群のインデックス作成を行う従来の装置の概要を示す図である。

符号の説明

１計算機
２情報操作監視部
３情報操作データベース
４タスク検出部
５タスクデータベース
６タスク間類似性分析部
７タスクインデックス作成部
８タスクインデックス記録部
９情報記録部
１１ＣＰＵ
１２メモリ
１３入力装置
１４出力装置
１５外部記憶装置
１６媒体駆動装置
１７ネットワーク接続装置
１８バス
１９可搬記録媒体
２１サーバ
２２データベース
２３情報処理装置
１０１計算機
１０２情報群検出部
１０３情報群データベース
１０４インデックス作成部
１０５インデックス記録部
１０６情報記録部

Claims

ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、
前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録するタスク検出手段と、
を有し、
前記タスク検出手段は、最新の情報操作の操作対象の内容と、記憶手段に記憶されているテーブルに登録されている操作対象の内容との間の類似性が高いか否かを判定し、
両者の間の類似性が高いと判定した場合には、前記テーブルに前記最新の情報操作の操作対象を追加登録し、両者の間の類似性が高くないと判定した場合には、前記テーブルを前記記憶手段から削除すると共に新規にテーブルを作成して前記記憶手段に記憶し、新規に作成した前記テーブルに前記最新の情報操作の操作対象を登録し、
前記記憶手段に記憶されているテーブルに登録されている操作対象を扱っているタスクを、ユーザの作業として検出する、
ことを特徴とする検索インデックス作成装置。
前記タスクデータベースに蓄積された作業に関するデータから、作業同士の類似性を比較し、作業同士で内容の似た作業を検出して、当該作業同士で内容の似た作業をまとめた作業に関するデータを前記タスクデータベースに登録するタスク間類似性分析手段を有する、
ことを特徴とする請求項１記載の検索インデックス作成装置。
前記タスクデータベースに蓄積された作業に関するデータを取得し、作業毎に、作業で扱っていた情報群の検索索引を作成するタスクインデックス作成手段を有する、
ことを特徴とする請求項１又は２記載の検索インデックス作成装置。
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作の操作対象の内容を、前記最新の情報操作の操作対象の内容として、処理を行う、
ことを特徴とする請求項１乃至３の何れか一つに記載の検索インデックス作成装置。
前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作の操作対象の内容を、前記最新の情報操作の操作対象の内容として、処理を行う、
ことを特徴とする請求項１乃至３の何れか一つに記載の検索インデックス作成装置。
作業の検出と検出した作業に関するデータの前記タスクデータベースへの登録、及び、検出した作業で扱っていた情報群の検索索引の作成を繰り返し行って、繰り返す度に小さな作業を大きな作業にまとめて検出し、検出した作業に関するデータを前記タスクデータベースに登録する、
ことを特徴とする請求項３記載の検索インデックス作成装置。
前記タスクインデックス作成手段は、複数の作業がまとめられた作業に関するデータを取得したときに、前記タスクデータベースを参照して、当該まとめられた作業に含まれる作業に関するデータを取得し、まとめられた作業毎に、当該まとめられた作業で扱っていた情報群の検索索引を作成する、
ことを特徴とする請求項３記載の検索インデックス作成装置。
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出し、
検出した情報操作に関するデータを情報操作データベースに蓄積させ、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録し、
前記ユーザの作業の検出では、最新の情報操作の操作対象の内容と、記憶手段に記憶されているテーブルに登録されている操作対象の内容との間の類似性が高いか否かを判定し、
両者の間の類似性が高いと判定した場合には、前記テーブルに前記最新の情報操作の操作対象を追加登録し、両者の間の類似性が高くないと判定した場合には、前記テーブルを前記記憶手段から削除すると共に新規にテーブルを作成して前記記憶手段に記憶し、新規に作成した前記テーブルに前記最新の情報操作の操作対象を登録し、
前記記憶手段に記憶されているテーブルに登録されている操作対象を扱っているタスクを、ユーザの作業として検出する、
ことを特徴とする検索インデックス作成方法。
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視機能と、
前記情報操作監視機能により検出された情報操作に関するデータを情報操作データベースに蓄積させる機能と、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出し、当該作業で扱っていた情報群を同定して、当該作業に関するデータをタスクデータベースに登録するタスク検出機能と、
をコンピュータに実現させ、
前記タスク検出機能は、最新の情報操作の操作対象の内容と、記憶手段に記憶されているテーブルに登録されている操作対象の内容との間の類似性が高いか否かを判定し、
両者の間の類似性が高いと判定した場合には、前記テーブルに前記最新の情報操作の操作対象を追加登録し、両者の間の類似性が高くないと判定した場合には、前記テーブルを前記記憶手段から削除すると共に新規にテーブルを作成して前記記憶手段に記憶し、新規に作成した前記テーブルに前記最新の情報操作の操作対象を登録し、
前記記憶手段に記憶されているテーブルに登録されている操作対象を扱っているタスクを、ユーザの作業として検出する、
ことを特徴とする検索インデックス作成プログラム。