JP2008033687A - 検索クエリー作成装置 - Google Patents
検索クエリー作成装置 Download PDFInfo
- Publication number
- JP2008033687A JP2008033687A JP2006207075A JP2006207075A JP2008033687A JP 2008033687 A JP2008033687 A JP 2008033687A JP 2006207075 A JP2006207075 A JP 2006207075A JP 2006207075 A JP2006207075 A JP 2006207075A JP 2008033687 A JP2008033687 A JP 2008033687A
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- task
- work
- search query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】計算機1に備えられた検索クエリー作成装置は、ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視部2と、情報操作監視部2により検出された情報操作に関するデータを蓄積する情報操作DB3と、情報操作DB3に蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出部4とを備える。
【選択図】図1
Description
手法1:ユーザによるクエリー作成
この手法1では、ユーザが、探したい情報に関するキーワードや属性(以下、「メタデータ」ともいう)などを考えてクエリーを作成する。そして、ユーザは、作成したクエリーを検索システムに入力して情報を検索する。Google(登録商標)やMSN Search(MSNは登録商標)などのWeb検索サービスやパソコンのファイル検索ソフトウェアなどで一般的に使われている手法である。
この手法2では、ユーザではなく計算機が自動的にキーワードや属性などを抽出してクエリーを作成する。クエリーに指定するキーワードや属性などは、ユーザが現在処理している情報を計算機が自動的に分析して取り出す。現在処理している情報とは、ユーザが作成中の文書や閲覧中のWebページなどである。計算機は、作成したクエリーをユーザに提示したり、そのクエリーを用いて自動的に処理中の情報に関連する情報(関連情報)を検索したりする。
また、本発明の第2の態様に係る検索クエリー作成装置は、上記第1の態様において、前記タスク検出手段により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出手段を有する、こと特徴とする。
また、本発明の第3の態様に係る検索クエリー作成装置は、上記第2の態様において、前記作業特徴情報抽出手段により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成手段を有する、ことを特徴とする。
また、本発明の第5の態様に係る検索クエリー作成装置は、上記第1乃至3の何れか一つの態様において、前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、ことを特徴とする。
また、本発明の第6の態様に係る検索クエリー作成装置は、上記第1乃至3の何れか一つの態様において、前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。
また、本発明の第7の態様に係る検索クエリー作成装置は、上記第1乃至3の何れか一つの態様において、前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。
また、本発明の第8の態様に係る検索クエリー作成装置は、上記第1乃至3の何れか一つの態様において、前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、ことを特徴とする。
図1は、本発明の一実施の形態に係る検索クエリー作成装置の概要を示す図である。
同図において、計算機(PC)1は、ユーザが作業を行うことが可能な計算機であり、内部に、情報操作監視部2と情報操作データベース(以下単に「情報操作DB」という)3とタスク検出部4と作業特徴情報抽出部5とクエリー作成部6とを有した検索クエリー作成装置を備えている。また、計算機1は、図示は省略するが、ネットワークを介して、他の複数の計算機(PC)やファイルサーバ等とも接続されている。
計算機1が備えた検索クエリー作成装置は、詳しくは後述するように、ユーザのタスクを自動的に検出し、ユーザがタスクで扱っている複数の情報(情報群)を分析してクエリーを作成する。作成されたクエリーは、例えば、計算機1によってユーザに提示されたり、或いは、それを用いて計算機1によってタスクの関連情報が検索されたりする。
作業特徴情報抽出部5は、ユーザがタスクで扱っていた情報群から作業特徴情報となるキーワードや属性を抽出する。より詳しくは、作業特徴情報抽出部5は、タスク検出部4からタスク情報を受け取った後、最初に情報操作DB3を参照してユーザがタスクで扱っていた情報群を同定する。続いて、同定した情報群を分析してキーワードや属性などを抽出し、それをクエリー作成部6へ渡す。
作成されたクエリーは、例えば、計算機1によってユーザに提示されたり、或いは、それを用いて計算機1によってタスクの関連情報が検索されたりする。
図2の例は、現在ユーザが計算機で「次回議題」という情報を作成(執筆)しながら、同時に、「メール」の情報と「前回議事録」という情報を参照している場合、すなわち、3つの情報を同時に参照している場合の例である。
まず、情報操作監視部2の動作を、図3及び図4を用いて詳細に説明する。
同図に示したように、情報操作監視部2は、まず、監視対象となる計算機上において、監視対象となるソフトウェアが動作しているか(実行中であるか)否かを判定する(S1)。ここで、S1がNOの場合には、動作を終了する。
図4は、図3に示した情報操作監視部2の動作により情報操作DB3に記録された情報操作に関するデータの一例を示す図である。
タスク検出部4は、情報操作DB3を参照して新しい情報操作の有無を調べる。ここで新しい情報操作が存在した場合には、タスク分析を行ってタスクを検出し、検出したタスクを作業特徴情報抽出部5へ通知する。
同図に示したように、タスク検出部4は、まず、情報操作DB3を参照する(S11)。
続いて、読み出した操作IDに基づき、詳しくは後述するタスク分析を行って、タスクを検出する(S14)。
S14で行われるタスク分析には、
(1)一定時間間隔毎に情報操作を切り出してタスクを検出する方法と、
(2)情報操作の流れを判別してタスクを検出する方法と、
(3)情報操作で扱った情報群(複数の情報)の類似性を比較してタスクを検出する方法と、
(4)これらの方法を組み合わせてタスクを検出する方法と、
がある。(1)〜(4)の各方法を用いたタスク分析について順に説明する。
図6は、(1)の方法を用いてタスク分析を行う場合のフローチャートである。
同図に示したように、この場合、タスク検出部4は、まず、図5のS13で情報操作DB3から読み出した最新の情報操作の操作IDを、タスク終了操作IDとして取得する(S21)。
続いて、S22で取得した最新の情報操作の日時から、タスク分析での所定時間単位分差し引いた日時を、タスク開始日時として取得する(S23)。尚、所定時間単位とは、情報操作を一定時間間隔毎に切り出してタスクを検出するときの、その一定時間間隔のことであり、例えば、30分、1時間、1日、1週間など予め定めた時間間隔である。
続いて、S24で取得したタスク開始操作IDからS21で取得したタスク終了操作IDまでの情報操作を、タスクとして検出し(S25)、タスク分析を終了する。
図7は、情報操作DB3に登録されている情報操作に関するデータの一例を示す図である。
この場合は、まず、最新の情報操作の操作ID(0012)がタスク終了操作IDとして取得され、その情報操作の日時(Sep/13/06 11:00 AM)が取得される。続いて、その日時から30分を差し引いた日時(Sep/13/06 10:30 AM)が、タスク開始日時として取得され、タスク開始日時以降で、最初の情報操作の操作ID(0010)が取得される。続いて、タスク開始操作ID(0010)からタスク終了操作ID(0012)までの情報操作(同図の黒塗り部分)がタスクとして検出される。
(2)の方法を用いたタスク分析では、例えば、ユーザがある情報をオープンしてからクローズするまでは同一のタスクを行っていると考えられるので、こういった情報操作の流れからタスクを検出する。この間にユーザが他の情報に対して情報操作を行った場合には、それらの情報操作も同一タスクのために行われたものとして検出する。
同図に示したように、この場合、タスク検出部4は、まず、図5のS13で情報操作DB3から読み出した最新の情報操作の操作ID(以下単に「最新情報操作ID」ともいう)と、その情報操作の操作(例えばOPEN、CLOSE等)を取得する(S31)。
一方、S32の判定結果がYESの場合には、続いて、その操作で参照している情報以外に、現在参照中の情報が有るか否かを判定する(S33)。ここで、その判定結果がYESの場合には処理がS35へ進む。
続いて、タスク開始操作IDからタスク終了操作IDまでの情報操作を、タスクとして検出し(S36)、タスク分析を終了する。
図9は、情報操作DB3に登録されている情報操作に関するデータの一例を示す図である。
この場合は、まず、操作ID(0009)が最新情報操作IDとして取得され、その情報操作の操作(CLOSE)が取得される。続いて、その操作(CLOSE)が参照開始に関する操作ではないので、その操作ID(0009)がタスク終了操作IDとして設定される。
次に、(3)の方法を用いたタスク分析を、図10及び図11を用いて説明する。
同図に示したように、この場合、タスク検出部4は、まず、図5のS13で情報操作DB3から読み出した最新の情報操作の操作IDと、その情報操作の操作対象(例えばファイルA、ファイルB等)を取得する(S41)。
一方、S42の判定結果がYESの場合には、続いて、その操作対象の内容を取得し(S43)、取得した内容をベクトル空間であるドキュメント空間にマッピングして、操作対象ベクトル1を取得する(S44)。
図11(a) は、情報操作DB3に登録されている情報操作に関するデータの一例を示す図、同図(b) は、操作ID(0009)が情報操作DB3に登録される以前の操作対象テーブルの内容を示す図、同図(c) は、操作ID(0009)が情報操作DB3に登録された後の操作対象テーブルの内容を示す図である。図12は、操作対象がマッピングされたドキュメント空間の一例を示す図である。尚、同図に示したドキュメント空間において、ベクトルの成分は操作対象に含まれる各単語の頻度とし、類似性は操作対象ベクトル1と操作対象ベクトル2との角度とする。
この場合は、まず、操作ID(0009)が最新情報操作IDとして取得され、その操作対象の内容(メールA)が取得される。続いて、その内容(メールA)がドキュメント空間にマッピングされ、操作対象ベクトル1(図12参照)が取得される。
この判定で、閾値以上でないと判定されたときには、これまでの操作対象テーブル(図11(b) 参照)が破棄され、新しい操作対象テーブルが作成され、それに最新情報操作ID(0009)の操作対象の内容(メールA)が登録される(同図(c) 参照)。続いて、その操作対象テーブルが、タスクで扱っている操作対象の一覧として検出される。
次に、(4)の方法を用いたタスク分析について説明する。
(1)と(3)を組み合わせた方法を用いたタスク分析では、タスク検出部4が、情報操作を一定時間間隔毎に切り出した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する。
同図において、S61乃至S64では、図6に示したS21乃至S24と同様の処理が行われるので、ここでは説明を省略する。
ここで、(1)と(3)を組み合わせた方法を用いてタスク分析を行った場合の具体例を、図14(a),(b),(c)を用いて説明する。
この場合は、まず、最新の情報操作の操作ID(0009)がタスク終了操作IDとして取得され、その情報操作の日時(Sep/13/06 10:25 AM)が取得される。続いて、その日時から15分を差し引いた日時(Sep/13/06 10:10 AM)が、タスク開始日時として取得され、タスク開始日時以降で、最初の情報操作の操作ID(0003)が取得される。続いて、タスク開始操作ID(0003)からタスク終了操作ID(0009)までの情報操作で扱った操作対象の内容(ファイルA、ファイルB、メールA)が取得される。続いて、取得された内容がドキュメント空間にマッピングされ、そのベクトル和から操作対象ベクトル1が取得される。
この判定で、閾値以上であると判定されたときには、操作対象テーブル(同図(b) 参照)に、操作対象ベクトル1の操作対象の内容(ファイルA、ファイルB、メールA)が追加登録される(同図(c) 参照)。尚、操作対象の内容が重複する場合には(本例ではファイルAとファイルBが重複)、上書き登録される。
このような(1)と(3)を組み合わせた方法を用いたタスク分析によれば、 情報群の類似性だけを用いてユーザのタスクを検出する場合よりも、少ない負荷でユーザのタスクを検出することができる。
(2)と(3)を組み合わせた方法を用いたタスク分析では、タスク検出部4が、情報操作の流れを判別した後に、その間にユーザが扱っている情報の類似性を用いてタスクを検出する。
同図において、S81乃至S85では、図8に示したS31乃至S35と同様の処理が行われるので、ここでは説明を省略する。
ここで、(2)と(3)を組み合わせた方法を用いてタスク分析を行った場合の具体例を、図16(a),(b),(c)を用いて説明する。
この場合は、まず、操作ID(0009)が最新情報操作IDとして取得され、その情報操作の操作(OPEN)が取得される。続いて、その操作(OPEN)が参照開始に関する操作であって、且つ、他に参照中の情報が無いので、その操作ID(0009)がタスク開始操作IDに設定される。また、その操作ID(0009)は、タスク終了操作IDにも設定される。
この判定で、閾値以上であると判定されたときには、操作対象テーブル(同図(b) 参照)に、操作対象ベクトル1の操作対象の内容(メールA)が追加登録される(同図(c) 参照)。
このような(2)と(3)を組み合わせた方法を用いたタスク分析によれば、情報群の類似性だけを用いてユーザのタスクを検出する場合よりも、少ない負荷でユーザのタスクを検出することができる。また、同じ作業目的でまったく種類の異なる情報群を扱った場合でも、情報操作の流れを用いて検出しているので、情報群だけを用いて検出した時よりも精度高くタスクを検出することができる。
作業特徴情報抽出部5は、タスク検出部4が検出したタスクで扱っていた情報群の内容や属性を読み出して、作業特徴情報を抽出する。例えば、情報群の内容に文字列が含まれている場合は、その文字列に対して形態素解析やn-gram処理などを行ってキーワードを抽出する。このように、作業特徴情報としてキーワードを抽出することにより、作業の中身や目的を取り出すことができる。情報群の属性としては、操作対象名(ファイル名、メール題名など)や操作対象の保存先名(フォルダ名、アドレス帳名など)、所有者、更新日時などである。このように、作業特徴情報として属性を抽出することにより、作業に共通する傾向を取り出すことができる。作業特徴情報抽出部5が抽出したキーワードや属性などの作業特徴情報は、そのままクエリー作成部6へ渡されることも、TF(Term Frequency)やIDF(Inverted document frequency)などを用いて重み付けて、クエリー作成部6へ渡されることもある。
同図に示したように、作業特徴情報抽出部5は、まず、タスク検出部4から通知されたタスクに関する情報、すなわち、タスク開始操作IDとタスク終了操作ID、若しくは、タスクで扱っている操作対象の一覧を取得する(S101)。
続いて、取得した操作対象の内容と、文字列を含むメータデータとを解析して、分かち書きする(S105)。分かち書きする際の解析は、形態素解析やn-gram処理などを用いて行われる。
続いて、分かち書きした要素とTF・IDFの組み合わせと、メタデータと出現頻度の組み合わせを、作業特徴情報として抽出し(S108)、動作を終了する。
図18に示したように、作業特徴情報抽出部5において、ユニット5aは、入力された操作対象から、操作対象の内容とそのメタデータを取得し、操作対象の内容と文字列を含むメタデータをユニット5bへ、文字列以外のメタデータをユニット5cへ出力する。尚、同図の例では、操作対象として、操作対象ファイルに登録されているファイルA、ファイルB、及びメールAが、ユニット5bに入力されたことを示している。また、この場合、ユニット5aは、メタデータとして、操作対象名、操作対象種類(例えばイメージ、音声等)、操作対象の保存フォルダ名、所有者、作成日時、更新日時、参照日時、送信者、受信者、送受信日時等を取得する。
ユニット5eは、ユニット5dから入力された、分かち書きした要素と各要素のTF・IDF、及び、ユニット5cから入力されたメタデータとその出現頻度を、作業特徴情報として出力する。
クエリー作成部6は、作業特徴情報抽出部5が抽出したキーワード(分かち書きした要素)や属性(メタデータ)などをそのまま用いてクエリーを作成することができる。また、クエリー作成部6は、検索を行うシステムの条件に合わせてクエリーを作成することもできる。例えば、検索システムがBOOLEAN検索システムの場合は、各作業特徴情報をANDやORなどの論理式で繋ぎ合わせてクエリーを作成する。このようにした場合には、作業の内容に対して漏れのないクエリーを作成することができる。或いは、検索システムがベクトル空間を用いた検索システムの場合は、各作業特徴情報ベクトル空間にマッピングして各作業特徴情報を要素とするベクトルを作ってクエリーとする。このようにした場合には、作業の内容との類似性を図ることのできるクエリーを作成することができる。
同図に示したように、クエリー作成部6は、まず、作業特徴情報抽出部5から、分かち書きした要素と各要素のTF・IDF、及び、メタデータとその出現回数を取得する。(S111)。
続いて、要素の重みが大きい順に要素を並べ替え(S113)、要素の重みが予め定めた閾値以上の要素だけを残して他は削除する(S114)。
尚、検索クエリーの作成は、図19に示したフローチャートに従った方法以外にも、次のような方法などがある。
同図に示した情報処理装置 は、CPU(中央処理装置)11、メモリ12、入力装置13、出力装置14、外部記憶装置15、媒体駆動装置16、ネットワーク接続装置17を備え、それらはバス18により互いに接続されている。
入力装置13は、例えば、キーボード、ポインティングデバイス、タッチパネル等であり、ユーザからの指示や情報の入力に用いられる。出力装置14は、例えば、ディスプレイ、プリンタ、スピーカ等であり、ユーザへの問い合わせや処理結果等の出力に用いられる。
ネットワーク接続装置17は、LAN(local area network)やインターネット等の任意の通信ネットワークに接続され、通信に伴うデータ変換を行う。情報処理装置 は、必要に応じて、上記プログラムおよびデータを外部の装置からネットワーク接続装置17を介して受け取り、それらをメモリ12にロードして使用する。
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、
前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出手段と、
を有することを特徴とする検索クエリー作成装置。
(付記2)
前記タスク検出手段により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出手段を有する、
こと特徴とする付記1記載の検索クエリー作成装置。
(付記3)
前記作業特徴情報抽出手段により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成手段を有する、
ことを特徴とする付記2記載の検索クエリー作成装置。
(付記4)
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けてユーザの作業を検出する、
ことを特徴とする付記1乃至3の何れか一つに記載の検索クエリー作成装置。
(付記5)
前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、
ことを特徴とする付記1乃至3の何れか一つに記載の検索クエリー作成装置。
(付記6)
前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記1乃至3の何れか一つに記載の検索クエリー作成装置。
(付記7)
前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記1乃至3の何れか一つに記載の検索クエリー作成装置。
(付記8)
前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする付記1乃至3の何れか一つに記載の検索クエリー作成装置。
(付記9)
前記タスク検出手段は、ユーザの作業の検出の際に、情報操作で扱っている情報群をベクトル空間にマッピングして、当該マッピングしたベクトル同士の内積を類似度とする、
ことを特徴とする付記6乃至8の何れか一つに記載の検索クエリー作成装置。
(付記10)
前記作業特徴情報抽出手段は、同定した情報群の内容からキーワードを抽出して作業特徴情報とする、
ことを特徴とする付記2又は3記載の検索クエリー作成装置。
(付記11)
前記作業特徴情報抽出手段は、抽出したキーワードと、計数した各キーワードの頻度又は及びキーワードを含む文書数とを作業特徴情報とする、
ことを特徴とする付記10記載の検索クエリー作成装置。
(付記12)
前記作業特徴情報抽出手段は、同定した情報群の属性を抽出して作業特徴情報とする、
ことを特徴とする付記2又は3記載の検索クエリー作成装置。
(付記13)
前記作業特徴情報抽出手段により抽出された作業特徴情報を論理式で繋ぎ合わせて検索クエリーとする、
ことを特徴とする付記2、10、11、又は12記載の検索クエリー作成装置。
(付記14)
前記作業特徴情報抽出手段により抽出された作業特徴情報をベクトル空間にマッピングして検索クエリーとする、
ことを特徴とする付記2、10、11、又は12記載の検索クエリー作成装置。
(付記15)
前記作業特徴情報抽出手段により抽出された作業特徴情報を、当該作業特徴情報の頻度又は及び当該作業特徴情報を含む文書数を組み合わせて重みを作り、重みの大きさで検索クエリー作成に用いる作業特徴情報を決定する、
ことを特徴とする付記2又は11記載の検索クエリー作成装置。
(付記16)
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出し、
検出した情報操作に関するデータを情報操作データベースに蓄積し、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出する、
ことを特徴とする検索クエリー作成方法。
(付記17)
検出したユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する、
こと特徴とする付記16記載の検索クエリー作成方法。
(付記18)
抽出した作業特徴情報を組み合わせて検索クエリーを作成する、
ことを特徴とする付記17記載の検索クエリー作成方法。
(付記19)
ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視機能と、
前記情報操作監視機能により検出された情報操作に関するデータを情報操作データベースに蓄積させる機能と、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出機能と、
をコンピュータに実現させるための検索クエリー作成プログラム。
(付記20)
前記タスク検出機能により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出機能、
をコンピュータに実現させるための付記19記載の検索クエリー作成プログラム。
(付記21)
前記作業特徴情報抽出機能により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成機能、
をコンピュータに実現させるための付記20記載の検索クエリー作成プログラム。
2 情報操作監視部
3 情報操作データベース
4 タスク検出部
5 作業特徴情報抽出部
6 クエリー作成部
7 情報記録部
11 CPU
12 メモリ
13 入力装置
14 出力装置
15 外部記憶装置
16 媒体駆動装置
17 ネットワーク接続装置
18 バス
19 可搬記録媒体
21 サーバ
22 データベース
23 情報処理装置
101 計算機
102 情報操作監視部
103 情報検出部
104 検索条件抽出部
105 クエリー作成部
Claims (10)
- ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視手段と、
前記情報操作監視手段により検出された情報操作に関するデータを蓄積する情報操作データベースと、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出手段と、
を有することを特徴とする検索クエリー作成装置。 - 前記タスク検出手段により検出されたユーザの作業から、当該作業で扱っていた情報群を同定し、当該情報群から、作業を特徴付ける作業特徴情報を抽出する作業特徴情報抽出手段を有する、
こと特徴とする請求項1記載の検索クエリー作成装置。 - 前記作業特徴情報抽出手段により抽出された作業特徴情報を組み合わせて検索クエリーを作成するクエリー作成手段を有する、
ことを特徴とする請求項2記載の検索クエリー作成装置。 - 前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けてユーザの作業を検出する、
ことを特徴とする請求項1乃至3の何れか一つに記載の検索クエリー作成装置。 - 前記タスク検出手段は、情報操作の流れを判別してユーザの作業を検出する、
ことを特徴とする請求項1乃至3の何れか一つに記載の検索クエリー作成装置。 - 前記タスク検出手段は、情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする請求項1乃至3の何れか一つに記載の検索クエリー作成装置。 - 前記タスク検出手段は、情報操作を一定時間間隔毎に切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする請求項1乃至3の何れか一つに記載の検索クエリー作成装置。 - 前記タスク検出手段は、情報操作の流れを判別して情報操作を切り分けた後に、当該切り分けた情報操作で扱っている情報群の類似度から判別してユーザの作業を検出する、
ことを特徴とする請求項1乃至3の何れか一つに記載の検索クエリー作成装置。 - ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出し、
検出した情報操作に関するデータを情報操作データベースに蓄積し、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出する、
ことを特徴とする検索クエリー作成方法。 - ユーザの計算機での情報操作を監視してユーザが計算機で行った情報操作を検出する情報操作監視機能と、
前記情報操作監視機能により検出された情報操作に関するデータを情報操作データベースに蓄積させる機能と、
前記情報操作データベースに蓄積された情報操作に関するデータを分析してユーザの作業を検出するタスク検出機能と、
をコンピュータに実現させるための検索クエリー作成プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006207075A JP4922692B2 (ja) | 2006-07-28 | 2006-07-28 | 検索クエリー作成装置 |
EP06255990A EP1884877A1 (en) | 2006-07-28 | 2006-11-23 | Search query generator apparatus |
US11/564,412 US8595229B2 (en) | 2006-07-28 | 2006-11-29 | Search query generator apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006207075A JP4922692B2 (ja) | 2006-07-28 | 2006-07-28 | 検索クエリー作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008033687A true JP2008033687A (ja) | 2008-02-14 |
JP4922692B2 JP4922692B2 (ja) | 2012-04-25 |
Family
ID=37993598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006207075A Expired - Fee Related JP4922692B2 (ja) | 2006-07-28 | 2006-07-28 | 検索クエリー作成装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8595229B2 (ja) |
EP (1) | EP1884877A1 (ja) |
JP (1) | JP4922692B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010134173A1 (ja) * | 2009-05-20 | 2010-11-25 | 富士通株式会社 | 情報処理装置、通信制御方法および通信制御プログラム |
WO2014057529A1 (ja) * | 2012-10-09 | 2014-04-17 | 富士通株式会社 | 情報探索支援方法及び情報処理装置 |
US8793266B2 (en) | 2010-09-30 | 2014-07-29 | International Business Machines Corporation | Graphical user interface for a search query |
JP2015170214A (ja) * | 2014-03-07 | 2015-09-28 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101116434B1 (ko) * | 2010-04-14 | 2012-03-07 | 엔에이치엔(주) | 이미지를 이용한 쿼리 제공 방법 및 시스템 |
JP2015015521A (ja) * | 2013-07-03 | 2015-01-22 | ソニー株式会社 | 通信制御装置、通信制御方法及び端末装置 |
US9208204B2 (en) | 2013-12-02 | 2015-12-08 | Qbase, LLC | Search suggestions using fuzzy-score matching and entity co-occurrence |
US9355152B2 (en) | 2013-12-02 | 2016-05-31 | Qbase, LLC | Non-exclusionary search within in-memory databases |
US9201931B2 (en) | 2013-12-02 | 2015-12-01 | Qbase, LLC | Method for obtaining search suggestions from fuzzy score matching and population frequencies |
US9230041B2 (en) | 2013-12-02 | 2016-01-05 | Qbase, LLC | Search suggestions of related entities based on co-occurrence and/or fuzzy-score matching |
US9619571B2 (en) | 2013-12-02 | 2017-04-11 | Qbase, LLC | Method for searching related entities through entity co-occurrence |
JP2017504105A (ja) * | 2013-12-02 | 2017-02-02 | キューベース リミテッド ライアビリティ カンパニー | インメモリデータベースサーチのためのシステム及び方法 |
US9361317B2 (en) | 2014-03-04 | 2016-06-07 | Qbase, LLC | Method for entity enrichment of digital content to enable advanced search functionality in content management systems |
US11107020B2 (en) * | 2019-03-15 | 2021-08-31 | Microsoft Technology Licensing, Llc | Intelligent task suggestions based on automated learning and contextual analysis of user activity |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172696A (ja) * | 1998-12-03 | 2000-06-23 | Toshiba Corp | ドキュメント管理システム |
JP2002032388A (ja) * | 2000-07-14 | 2002-01-31 | Ricoh Co Ltd | 文書体系化方法、文書選択方法、文書管理装置、文書処理管理システム及び記録媒体 |
JP2005309727A (ja) * | 2004-04-21 | 2005-11-04 | Hitachi Ltd | ファイルシステム |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
JP3195752B2 (ja) * | 1997-02-28 | 2001-08-06 | シャープ株式会社 | 検索装置 |
JPH10326289A (ja) * | 1997-03-28 | 1998-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報提供方法、システムおよびそのプログラムを格納した記憶媒体 |
JP3547069B2 (ja) | 1997-05-22 | 2004-07-28 | 日本電信電話株式会社 | 情報関連づけ装置およびその方法 |
US6012053A (en) | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
US6119117A (en) | 1997-07-15 | 2000-09-12 | Kabushiki Kaisha Toshiba | Document management method, document retrieval method, and document retrieval apparatus |
JPH1139293A (ja) | 1997-07-15 | 1999-02-12 | Toshiba Corp | 文書管理方法、文書検索方法、及び文書検索装置 |
JPH11143912A (ja) | 1997-09-08 | 1999-05-28 | Fujitsu Ltd | 関連文書表示装置 |
US6865715B2 (en) | 1997-09-08 | 2005-03-08 | Fujitsu Limited | Statistical method for extracting, and displaying keywords in forum/message board documents |
US5974412A (en) * | 1997-09-24 | 1999-10-26 | Sapient Health Network | Intelligent query system for automatically indexing information in a database and automatically categorizing users |
US6134532A (en) | 1997-11-14 | 2000-10-17 | Aptex Software, Inc. | System and method for optimal adaptive matching of users to most relevant entity and information in real-time |
JPH11250080A (ja) | 1998-02-27 | 1999-09-17 | Toshiba Corp | 業務支援システムおよび業務支援方法 |
JPH11265378A (ja) | 1998-03-17 | 1999-09-28 | Ntt Data Corp | 自動情報検索装置及び文書作成支援システム |
EP1285365A4 (en) | 2000-03-28 | 2004-01-21 | Dana Farber Cancer Inst Inc | MOLECULAR DATABASE FOR ANTIBODY CHARACTERIZATION |
US6990631B2 (en) | 2000-07-14 | 2006-01-24 | Ricoh Company, Ltd. | Document management apparatus, related document extracting method, and document processing assist method |
NL1016056C2 (nl) | 2000-08-30 | 2002-03-15 | Koninkl Kpn Nv | Methode en systeem voor personalisatie van digitale informatie. |
US7007294B1 (en) * | 2000-10-30 | 2006-02-28 | Koninklijke Philips Electronics N.V. | Method and apparatus for automatic generation of query search terms for a program recommender |
US20020147754A1 (en) * | 2001-01-31 | 2002-10-10 | Dempsey Derek M. | Vector difference measures for data classifiers |
US6778979B2 (en) * | 2001-08-13 | 2004-08-17 | Xerox Corporation | System for automatically generating queries |
US6928639B2 (en) | 2001-09-11 | 2005-08-09 | International Business Machines Corporation | Time-interval based monitor function for dynamic insertion into and removal from a running application |
US20030131016A1 (en) * | 2002-01-07 | 2003-07-10 | Hanny Tanny | Automated system and methods for determining the activity focus of a user a computerized environment |
US7665024B1 (en) * | 2002-07-22 | 2010-02-16 | Verizon Services Corp. | Methods and apparatus for controlling a user interface based on the emotional state of a user |
US7197366B2 (en) * | 2003-05-15 | 2007-03-27 | International Business Machines Corporation | Method and system for administering devices including an action log |
US7162473B2 (en) * | 2003-06-26 | 2007-01-09 | Microsoft Corporation | Method and system for usage analyzer that determines user accessed sources, indexes data subsets, and associated metadata, processing implicit queries based on potential interest to users |
US7225187B2 (en) * | 2003-06-26 | 2007-05-29 | Microsoft Corporation | Systems and methods for performing background queries from content and activity |
US7496563B2 (en) * | 2004-08-04 | 2009-02-24 | International Business Machines Corporation | Method for locating documents a user has previously accessed |
US7707284B2 (en) * | 2005-08-03 | 2010-04-27 | Novell, Inc. | System and method of searching for classifying user activity performed on a computer system |
US7664746B2 (en) | 2005-11-15 | 2010-02-16 | Microsoft Corporation | Personalized search and headlines |
US7451162B2 (en) | 2005-12-14 | 2008-11-11 | Siemens Aktiengesellschaft | Methods and apparatus to determine a software application data file and usage |
US20070299631A1 (en) | 2006-06-27 | 2007-12-27 | Microsoft Corporation | Logging user actions within activity context |
US8407213B2 (en) | 2006-08-31 | 2013-03-26 | Ektimisi Semiotics Holdings, Llc | System and method for identifying a location of interest to be named by a user |
-
2006
- 2006-07-28 JP JP2006207075A patent/JP4922692B2/ja not_active Expired - Fee Related
- 2006-11-23 EP EP06255990A patent/EP1884877A1/en not_active Withdrawn
- 2006-11-29 US US11/564,412 patent/US8595229B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172696A (ja) * | 1998-12-03 | 2000-06-23 | Toshiba Corp | ドキュメント管理システム |
JP2002032388A (ja) * | 2000-07-14 | 2002-01-31 | Ricoh Co Ltd | 文書体系化方法、文書選択方法、文書管理装置、文書処理管理システム及び記録媒体 |
JP2005309727A (ja) * | 2004-04-21 | 2005-11-04 | Hitachi Ltd | ファイルシステム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010134173A1 (ja) * | 2009-05-20 | 2010-11-25 | 富士通株式会社 | 情報処理装置、通信制御方法および通信制御プログラム |
JP5522166B2 (ja) * | 2009-05-20 | 2014-06-18 | 富士通株式会社 | 情報処理装置、通信制御方法および通信制御プログラム |
US8793266B2 (en) | 2010-09-30 | 2014-07-29 | International Business Machines Corporation | Graphical user interface for a search query |
WO2014057529A1 (ja) * | 2012-10-09 | 2014-04-17 | 富士通株式会社 | 情報探索支援方法及び情報処理装置 |
JP5846314B2 (ja) * | 2012-10-09 | 2016-01-20 | 富士通株式会社 | 情報探索支援方法及び情報処理装置 |
JP2015170214A (ja) * | 2014-03-07 | 2015-09-28 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20080027915A1 (en) | 2008-01-31 |
JP4922692B2 (ja) | 2012-04-25 |
EP1884877A1 (en) | 2008-02-06 |
US8595229B2 (en) | 2013-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4922692B2 (ja) | 検索クエリー作成装置 | |
EP2478431B1 (en) | Automatically finding contextually related items of a task | |
KR101377389B1 (ko) | 다차원 검색 시스템, 다차원 검색을 수행하는 컴퓨터 구현 방법 및 컴퓨터 실행가능 시스템 | |
US8255399B2 (en) | Data classifier | |
US7693817B2 (en) | Sensing, storing, indexing, and retrieving data leveraging measures of user activity, attention, and interest | |
US9043413B2 (en) | System and method for extracting, collecting, enriching and ranking of email objects | |
JP5329540B2 (ja) | ユーザ中心の情報探索方法、コンピュータ読み取り可能な記録媒体およびユーザ中心の情報探索システム | |
TW201027375A (en) | Search system, search method and program | |
US20090113281A1 (en) | Identifying And Displaying Tags From Identifiers In Privately Stored Messages | |
US8037403B2 (en) | Apparatus, method, and computer program product for extracting structured document | |
Aliakbary et al. | Web page classification using social tags | |
US8195458B2 (en) | Open class noun classification | |
JP5272585B2 (ja) | 情報処理装置、情報分類方法及びプログラム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
Wang et al. | An automatic online news topic keyphrase extraction system | |
EP3040932A1 (en) | A method for tracking discussion in social media | |
KR101544603B1 (ko) | 개인화된 웹 정보 제공 장치 및 방법 | |
Beel | Retrieving data from mind maps to enhance search applications | |
JP5488334B2 (ja) | 関係コンテンツ評価装置、関係コンテンツ評価システムおよび関係コンテンツ評価方法 | |
Steinberger et al. | Continuous Multi-Source Information Gathering and Classification | |
JP2010066888A (ja) | 同文字異議語の検索装置 | |
Kumar et al. | Enhancing the Search Results through Web Structure Mining Using Frequent Pattern Analysis and Linear Correlation Method | |
JPH11345245A (ja) | データ入出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090409 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120131 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120206 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |