JP2009211385A - 関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラム - Google Patents

関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラム Download PDF

Info

Publication number
JP2009211385A
JP2009211385A JP2008053473A JP2008053473A JP2009211385A JP 2009211385 A JP2009211385 A JP 2009211385A JP 2008053473 A JP2008053473 A JP 2008053473A JP 2008053473 A JP2008053473 A JP 2008053473A JP 2009211385 A JP2009211385 A JP 2009211385A
Authority
JP
Japan
Prior art keywords
work
information
unit
related information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008053473A
Other languages
English (en)
Inventor
Yukihiro Sugano
亨太 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008053473A priority Critical patent/JP2009211385A/ja
Publication of JP2009211385A publication Critical patent/JP2009211385A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】利用者が端末装置等を用いて行っている作業の目的を利用者が特定することなく、作業に関連する文書の推薦ができる関連情報推薦装置を提供する。
【解決手段】関連情報推薦装置は、利用者の入力操作を監視する操作監視部1と、作業の開始と終了とを検出して作業単位を検出する作業単位検出部2と、作業単位検出部2が検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報を特定するデータと特徴データとを対応させて履歴情報として保存する情報/特徴保存部3Aと、利用者の作業対象の情報の特徴データを抽出する作業目的検出部4と、作業目的検出部4が検出した特徴データをもとに履歴情報を検索して関連情報を履歴情報から抽出する関連情報検索部5と、関連情報検索部5が履歴情報から抽出した関連情報を利用者に提示する出力部6とを備えている。
【選択図】図8

Description

本発明は、関連情報推薦方法、関連情報推薦プログラム、関連情報推薦装置および関連情報推薦システムに関し、特に、利用者のアプリケーション操作状況に応じて関連情報を推薦できる関連情報推薦装置、関連情報推薦方法、関連情報推薦システム、および関連情報推薦プログラムに関する。
文書の属性や文書全体の情報を解析して文書の特徴を抽出し、文書間の関連度を算出して推薦文書を選定する関連情報推薦システムがある。そのような関連情報推薦システムは、文書の特徴を記憶する記憶装置、入力情報にもとづいて記憶装置を検索する検索手段、および検索結果を表示する表示装置とから構成されている。記憶装置には、文書の特徴としての属性やキーワードが文書を特定する情報とともに登録されている。検索手段は、入力装置から文字列を入力し、入力した文字列にもとづいて記憶装置を検索し、検索結果にもとづいて関連文書を決定する。
また、特許文献1に記載されているように、利用者の操作にもとづいて文書全体および文書属性間の関連情報を抽出し、それらを記憶することによって、検索精度を高める方式がある。
また、特許文献2には、表示画面を備えた端末装置を用いて文書作成等の目的で操作を行っているときに、ユーザ(利用者)が扱っている文書における画面表示されている部分(注目箇所)に関連する文書を記憶手段から検索して利用者に提示する関連情報推薦システムが記載されている。
また、特許文献3には、業務と文書を関連付けて記憶する記憶手段を有し、利用者の操作履歴にもとづいて利用者が実行する業務を特定し、特定された業務に関連する文書を記憶手段から検索して、利用者に提示する関連情報推薦システムが記載されている。
特開2005−259110号公報(段落0017,0020−0024) 特開平10−254892号公報(段落0028−0029) 特開平11−39293号公報(段落0016−0017)
しかし、関連情報推薦システムでは、利用者の作業目的に応じた関連文書集合の絞りこみを行うことは困難である。特許文献1に記載されたシステムでは、文書自体の内容や属性を用いて文書間の関連度を算出し、関連度を検索手段による検索の精度に反映することができる。しかし、ある文書Xが利用される状況において、その作業目的は状況毎に異なる可能性があるが、上記の関連情報推薦システムでは、文書Xとの関連度が高い文書集合に対して状況に応じてさらなる絞り込みを行うことはできない。その理由は、作業および作業目的という概念について何ら考慮されていないためである。
また、特許文献2に記載されたシステムでは、作業対象の文書における注目箇所に関連する文書を利用者に推薦することができるが、関連する文書は単にキーワードにもとづいて検索されているので、推薦される文書は、利用者が行っている作業目的に合致した文書であるとは限らない。
また、特許文献3に記載されたシステムでは、業務に関連する文書を利用者に提示することができるが、利用者が関連文書の提示を受けるときに、利用者自身が関連文書提示対象の業務を特定しなければならない。
そこで、本発明は、利用者が端末装置等を用いて行っている作業の目的を利用者が特定することなく、作業に関連する文書の推薦ができる関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラムを提供することを目的とする。
本発明による関連情報推薦装置は、利用者の入力操作を監視する操作監視部と、作業の開始と終了とを検出して作業単位を検出する作業単位検出部と、作業単位検出部が検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報を特定するデータと特徴データとを対応させて履歴情報として保存する情報/特徴保存部と、利用者の作業対象の情報の特徴データを抽出する作業目的検出部と、作業目的検出部が検出した特徴データをもとに履歴情報を検索して関連情報を履歴情報から抽出する関連情報検索部と、関連情報検索部が履歴情報から抽出した関連情報を利用者に提示する出力部とを備えたことを特徴とする。
本発明による関連情報推薦方法は、利用者の入力操作を監視し、作業の開始と終了とを検出して作業単位を検出し、検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報を特定するデータと特徴データとを対応させて履歴情報として保存し、利用者の作業対象の情報の特徴データを抽出し、検出した特徴データをもとに履歴情報を検索して関連情報を履歴情報から抽出し、関連情報検索部が履歴情報から抽出した関連情報を利用者に提示することを特徴とする。
本発明による関連情報推薦システムは、通信ネットワークを介して通信可能に接続されるクライアント装置とサーバ装置とを備え、クライアント装置は、利用者の入力操作を監視する操作監視部を含み、サーバ装置は、作業の開始と終了とを検出して作業単位を検出する作業単位検出部と、作業単位検出部が検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報と特徴データとを対応させて履歴情報として保存する情報/特徴保存部と、利用者の作業における情報の特徴データを抽出する作業目的検出部と、作業目的検出部が検出した特徴データをもとに履歴情報を検索して関連情報を履歴情報から抽出する関連情報検索部とを含み、クライアント装置は、関連情報検索部が履歴情報から抽出した関連情報を利用者に提示する出力部を含むことを特徴とする。
本発明による関連情報推薦プログラムは、コンピュータに、利用者の入力操作を監視する処理と、作業の開始と終了とを検出して作業単位を検出する処理と、検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報を特定するデータと特徴データとを対応させて履歴情報として保存する処理と、利用者の作業対象の情報の特徴データを抽出する処理と、検出した特徴データをもとに履歴情報を検索して関連情報を履歴情報から抽出する処理と、関連情報検索部が履歴情報から抽出した関連情報を利用者に提示する処理とを実行させることを特徴とする。
本発明によれば、より作業目的に適う関連情報を検索して推薦できるようになる。その理由は、過去に作業に用いた文書とその作業における文書の利用状況や編集内容を作業記録として記憶しておくことによって、それらを推論に活用できるためである。
以下、本発明実施形態を図面を参照して詳細に説明する。
実施形態1.
図1は、本発明による関連情報推薦システムの第1の実施形態を示すブロック図である。図1に示す第1の実施形態では、関連情報推薦システムは、クライアント装置(以下、クライアントという。)20とサーバ装置(以下、サーバという。)10とが通信ネットワーク30(以下、ネットワーク30という。)30で通信可能に接続されているシステムである。クライアント20は、例えばパーソナルコンピュータで実現される。通信ネットワーク30は、一例として、LANやインターネットである。
クライアント20には、キーボード等やエディタ等を含む入力部101と、入力部100に入力された利用者(ユーザ)3の入力操作を監視する操作監視部201と、関連文書を提示する表示装置等の出力部202とが設けられている。操作監視部201は、エディタ等に対するユーザの操作を監視するソフトウェアである。また、本実施形態では、入力部101は、キーボード等の入力装置に加えて、ファイルを作成したり編集したりするためのエディタ等のアプリケーションソフトウェア(アプリケーション)も含む部分である。従って、操作監視部201は、入力部101に入力された操作を検出することによって、利用者のアプリケーション操作状況を監視することになる。
サーバ10には、利用者の作業の開始と終了を検出して作業単位を検出する作業単位検出部301と、検出された作業単位内で行われた作業内容を解析する作業内容解析部302と、検出された作業単位と作業内容とをデータベースとしての作業履歴記憶部401に記録する作業内容記録部303と、利用者の直近の操作から作業目的を解析する作業目的解析部501と、作業目的と過去の作業履歴から関連する文書を検索する関連文書検索部502が設けられている。なお、作業とは、利用者40が特定の目的のためにパーソナルコンピュータ等の装置を用いて実行する処理(業務)であり、作業単位とは、その処理が開始されてから終了するまでの間の期間を意味する。また、作業目的解析部501は、実際には、作業目的を直接的に特定する処理を行わない。利用者40の作業目的に近いと推定される過去の作業示すデータ(作業ID)を作業履歴記憶部401から抽出することによって、間接的に作業目的を特定する。
作業単位検出部301、作業内容解析部302、作業目的解析部501および関連文書検索部502は、ソフトウェアで実現される。すなわち、サーバ10のCPUが、プログラムに従って処理を実行することによって、それらの機能が実現される。また、関連文書検索部502は、検索した関連文書を、ネットワーク30を介してクライアント20に送信する。クライアント20において、関連文書は、出力部202において利用者40に提示される。
次に、図2および図3の流れ図と図4の説明図を参照して本実施形態の動作を説明する。
まず、利用者40の操作にもとづいて、作業履歴を保存するまでの処理(図2に示す履歴蓄積フェーズ)を説明する。
操作監視部201は、利用者40が入力部101に対して行った操作を検知する。操作監視部201で検知された操作内容を示すデータは、ネットワーク30を介してサーバ10に送信される。サーバ10において、操作監視部201で検知された操作内容を示すデータは、作業単位検出部301と作業内容解析部302とに入力される。作業単位検出部301は、操作内容を示すデータを操作履歴として受け取る。なお、操作監視部201で検知された操作内容を示すデータは作業目的解析部501にも入力されるが、操作内容を示すデータにもとづく作業目的解析部501の処理は、後述する履歴活用フェーズにおいて実行される処理である。
例えば、操作監視部201は、利用者40が入力部101に対して操作を行う度に操作の種別を取得する。操作の種別を取得する方法として、入力部101から操作の種別が伝達されるように構成してもよいし、操作監視部201が、例えばクライアント20に付随するマウスを介して入力された指定位置の情報やキーボードを介して入力された情報を入手し、入手した情報にもとづいて操作の種別を判別するようにしてもよい。また、操作の種別を認識できるのであれば、その他のいずれの方法を用いてもよい。なお、操作の種別として、ファイルの参照、エディタ等の文書操作ツールの起動、エディタ等の文書操作ツールの終了等がある。
そして、操作監視部201は、取得した操作の種別を、上記の操作内容を示すデータとしてサーバ10に送信する。
また、操作監視部201は、利用者40が、作業として、例えばエディタ等のツールを用いて文書操作(編集の他に、文書の閲覧等含む概念)を行っている場合には、操作対象の文書の操作前のデータと操作後のデータとを操作内容を示すデータ(操作履歴)とすることが好ましい。さらに、操作監視部201は、直前に操作が行われた時点から当該操作が行われた時点までの時間を計測して、計測した時間を操作履歴に含める。
図2に示すように、作業単位検出部301は、利用者40の作業の開始を検出する(ステップA1)。例えば、利用者40がエディタ等のツールを使用している場合には、作業単位検出部301は、ツールの起動操作がなされたことを検出した場合に、作業の開始を検出したとする。また、作業環境の起動操作を検出することによって作業の開始を検出したとしてもよい。作業環境の起動操作は、例えば、クライアント20に搭載されているオペレーティングシステムの起動である。また、作業者が、明示的に、入力部101に対して、作業の開始を示す操作を行ってもよい。いずれの場合でも、作業単位検出部301は、操作監視部201が送信する操作内容を示すデータから、作業の開始を検出できる。
また、作業単位検出部301は、利用者40の作業の終了を検出するまで(ステップA3)、利用者40の操作履歴(操作内容を示すデータ)の収集を継続して実行する(ステップA2)。そして、作業単位検出部301は、操作履歴を一時保存する。なお、利用者40が、例えば、利用者40がエディタ等のツールを使用している場合には、作業単位検出部301は、ツールの終了操作がなされたことを検出した場合に、作業の終了を検出したとする。また、作業環境の終了操作を検出することによって作業の終了を検出したとしてもよい。作業環境の終了操作とは、例えば、クライアント20に搭載されているオペレーティングシステムの終了である。また、作業者が、明示的に、入力部101に対して、作業の終了を示す操作を行ってもよい。
利用者40の作業の終了が検出されると、作業内容解析部302は、一時保存されている操作履歴にもとづいて、作業中に利用された複数の文書に対する作業内容の解析を行う。具体的には、作業内容解析部302は、操作履歴にもとづいて、操作中に編集された文書を識別する(ステップA4)。すなわち、文書を特定する。なお、作業内容解析部302は、ステップA4の処理で、編集された文書に限らず、閲覧または参照がなされた文書等すなわち利用者40の操作中に扱われた文書を特定する。さらに、特定した文書毎の編集内容から特徴となるキーワードを抽出する(ステップA5)。なお、作業内容解析部302は、編集された文書以外の閲覧や参照等がなされた文書も対象にしているので、ステップA5の処理では、操作履歴にもとづいて、文書内で相対的に長い時間閲覧された領域、編集された領域、または編集前後の差分を取得し、それらから特徴となるキーワードを抽出する。すなわち、利用者が重視している可能性が高い注目領域における特徴を抽出する。特徴キーワードの抽出として、例えばTF−IDF(Term Frequency−Inverse Document Frequency)等の公知の方法を任意に用いることができる。
作業単位検出部301および作業内容解析部302は、処理結果を、作業内容記録部303に引き渡す。作業内容記録部303は、作業単位検出部301および作業内容解析部302の処理結果を、作業履歴記憶部401に記録する(ステップA6)。
図4は、作業単位検出部301および作業内容解析部302の処理結果として作業履歴記憶部401に記録される作業履歴の一例を示す説明図である。作業履歴として記録される各作業履歴データ(図4における各行に相当)は、「作業ID」、「文書ID」、および「操作領域内の特徴キーワードリスト」の各々のデータを含む。「作業ID」は、例えば、作業単位検出部301によって付番される一意な識別番号である。作業単位検出部301は、検出した作業単位に対して作業IDを付す。「文書ID」は、作業単位において扱われた文書(参照等された文書)を示す識別番号であり、例えば、作業内容解析部302によって付番される。「操作領域内の特徴キーワードリスト」は、作業内容解析部302によって操作領域から抽出された特徴キーワードである。なお、「操作領域」は注目領域に相当する。具体的には、「文書ID」が示す文書において、相対的に長い時間閲覧された領域や編集された領域である。すなわち、「操作領域内の特徴キーワードリスト」に記録される特徴キーワードリストは、一例として、文書内で相対的に長い時間閲覧された領域や、編集された領域から抽出されたキーワードである。
図4に示す例では、「作業ID」として「01」が付された作業単位において、「文書ID」としてA,B,Cが付された文書のそれぞれから抽出された特徴キーワードが「操作領域内の特徴キーワードリスト」に記録されている。
また、「作業ID」として「02」が付された作業単位において、「文書ID」としてA,D,Fが付された文書のそれぞれから抽出された特徴キーワードが「操作領域内の特徴キーワードリスト」に記録されている。
なお、図4に示す例において、「文書ID」としての「A」が2箇所に記録されているが、「作業ID」として「01」が付された作業単位についての「文書ID」としての「A」が示す文書に対応する特徴キーワードと、「作業ID」として「02」が付された作業単位についての「文書ID」としての「A」が示す文書に対応する特徴キーワードとは異なっている。そのような違いは、「文書ID」としての「A」が示す文書において、「大容量化,HDD,SSD,MRAM」の特徴キーワードが抽出された領域と、「再生医療」の特徴キーワードが抽出された注目領域(操作領域)とが異なっていることに起因する。
以上のように、履歴蓄積フェーズでは、作業を示す情報と、文書を示す情報と、操作領域の特徴(文書の編集の場合には、編集内容の特徴)が対応付けられて、作業履歴記憶部401に記録される。
次に、利用者の操作にもとづいて、作業目的への適合性が高い関連文書集合を提供するまでの処理(図3に示す履歴活用フェーズ)を説明する。
操作監視部201は、利用者40が入力部101に対して行った操作を検知する。操作監視部201で検知された操作内容を示すデータは、ネットワーク30を介してサーバ10に送信される。サーバ10において、操作監視部201で検知された操作内容を示すデータは、作業目的解析部501に入力される。作業目的解析部501は、現在の利用者40の作業目的に近いと推定される過去の作業IDを作業履歴記憶部401に記憶されている作業履歴から検索する。
具体的には、作業目的解析部501は、利用者40が現在行っている作業の対象の文書(編集を行っていれば、編集中の文書)を識別する。すなわち、作業の対象の文書を特定する(ステップB1)。さらに、利用者40が行っている作業の対象の文書の領域から特徴キーワードを抽出する(ステップB2)。利用者40が現在文書の編集を行っていれば、編集内容の特徴を抽出することになる。そして、利用者40が現在行っている作業の対象の文書の文書ID、および利用者40が作業(閲覧や編集等)を行っている領域における特徴キーワードをもとに作業履歴記憶部401に記憶されている作業履歴を検索する。すなわち、文書IDが一致し、特徴キーワードが似通っているレコード(作業履歴データ)を選択する。特徴キーワードが似通っているかどうか(類似度が高いか否か)を調べる方法として、キーワード共起重み等の公知のいずれの方法を用いてもよい。作業目的解析部501は、作業履歴から選択したレコードに含まれる作業IDを特定する。
以上の処理によって、現在の利用者の作業目的に近い過去の作業IDを見つけ出すことができる。作業目的解析部501は、特定した作業IDを関連文書検索部502に通知する。関連文書検索部502は、作業目的解析部501から通知された作業IDをもとに、その作業で用いられた文書集合を作業履歴から抽出する。すなわち、特定した作業IDに対応する文書ID、または文書IDで特定される文書名の集合を抽出する。
関連文書検索部502は、抽出した文書集合をクライアント20に送信する。クライアント20において、出力部202は、サーバ10から受信した文書集合を示す情報を、例えば一覧表として出力する。出力部202が表示装置であれば、文書集合を表示する(ステップB3)。なお、文書集合に文書名が含まれる場合に、文書名を出力するのではなく、文書名を特定可能な情報を出力するように構成してもよい。
本実施形態では、文書に対する操作内容を作業単位でまとめて記録し、文書への操作内容の類似性から過去の類似作業を抽出し、その作業に関連する文書を抽出するというように構成されているので、作業目的に沿った精度の高い関連情報を検索して利用者40に推薦できるようになる。
つまり、作業における所定の操作領域(注目領域)内での特徴キーワードが作業履歴データとして記録されることから、作業の目的により適合した特徴キーワードが抽出されるので、作業目的に沿った精度の高い関連情報を検索して推薦できる。
なお、関連情報推薦システムにおいて、作業履歴に特徴キーワードそのものが記録されるように構成されていたが、作業履歴に記録される情報は、操作領域を特徴付ける指標となる情報であればよく、特徴キーワードに限定されない。
また、作業単位において操作対象になった情報として文書(文書ファイル)を例にしたが、作業単位において操作対象になる情報は、文書に限られない。例えば、画像(画像ファイル)を対象とする作業単位において、操作対象になった情報を、画像(画像ファイル)としてもよい。
実施形態2.
図5は、本発明による関連情報推薦システムの第2の実施形態を示すブロック図である。図5に示す第2の実施形態では、サーバ11において、図1に示された第1の実施形態の構成に加えて、文書管理システム601が設けられている。換言すれば、文書管理システム601が搭載されたサーバ11に対して、関連情報推薦機能部(作業単位検出部301、作業内容解析部302、作業内容記録部303、作業履歴記憶部401、作業目的解析部501および関連文書検索部502)が設けられている。なお、図6には、1つのサーバ11に、文書管理システム601と関連情報推薦機能部とが設けられているが、文書管理システム601は、関連情報推薦機能部が設けられたサーバとは異なる装置に設置されていてもよい。つまり、文書管理システム601は、関連情報推薦機能部の外部に設けられていてもよい。また、文書管理システム601は、例えば、文書を蓄積したデータベースを備え、利用者40が、データベースに蓄積されている文書をアクセス(登録、閲覧、編集等)することが可能なアプリケーションである。
図1に示された第1の実施形態では、作業単位検出部301が、操作監視部201を介して、利用者40の明示的な指示入力によって作業の開始と終了とを検出可能であるが、図5に示された第2の実施形態では、関連情報推薦機能部は、例えば関連情報推薦機能部の外部に設けられている文書管理システム601と連動し、文書管理システムへの文書の取り出しおよび格納(チェックインおよびチェックアウト)を作業開始と終了とみなすことによって、作業単位を検出することができる。
なお、作業単位検出部301が文書管理システム601と連動して作業の開始と終了とを検出すること以外の処理は、第1の実施形態の場合と同様である。
実施形態3.
図4に示された例では、作業履歴において、作業目的の特徴は利用者40が文書にアクセスした領域(操作領域)内の特徴キーワードのリストとして表現されるが、図6に示すように、作業履歴データに、最頻表示/編集ページ領域を付加してもよい。最頻表示/編集ページ領域には、作業において使用された文書において、高い頻度で参照された領域を示すデータ、または、編集された領域を特定するデータが、作業単位検出部301によって設定される。換言すれば、利用者40が重点的に閲覧等を行った領域すなわち注目領域を特定するデータが作業履歴データに含められる。
また、第1の実施形態および第2の実施形態では、作業目的解析部501は、利用者40が現在行っている作業の対象の文書の文書ID、および利用者40が閲覧や編集等を行っている領域における特徴キーワードをもとに作業履歴記憶部401に記憶されている作業履歴を検索したが、すなわち、文書IDが一致し、特徴キーワードが似通っている作業履歴データを選択したが、本実施形態では、さらに、最頻表示/編集ページ領域のデータも考慮して作業目的を解析する。すなわち、利用者40が現在閲覧や編集等を行っている領域と、最頻表示/編集ページ領域のデータが示す領域とが重複していることも条件に入れて、作業目的の類似性を判別する。
その他の処理は、第1の実施形態または第2の実施形態における処理と同じである。本実施形態では、作業目的の類似性判別の精度をより高くすることができる。
なお、本実施形態では、作業履歴データに最頻表示/編集ページ領域のデータが含まれているので、関連文書検索部502は、文書集合を作業履歴から抽出するとともに、文書についての最頻表示/編集ページ領域のデータも抽出して、クライアント20の出力部202に送信するようにしてもよい。
実施形態4.
さらに、図7に示すように、作業履歴において、作業履歴データに操作の種類のデータを追加してもよい。図7に示す例では、「閲覧/編集区分」のデータが追加されている。「閲覧」は、最頻表示/編集ページ領域のデータが示す領域が閲覧の対象であったことを示し、「編集」は、最頻表示/編集ページ領域のデータが示す領域が編集の対象であったことを示す。作業内容解析部302は、作業監視部201から操作履歴を取得し、取得した操作履歴にもとづいて、操作の種類を特定する。作業内容記録部303は、特定された操作の種類を示すデータを「閲覧/編集区分」のデータとして記録する。
作業目的解析部501は、第3の実施形態における判別処理に加えて、さらに、閲覧/編集区分のデータも考慮して作業目的を解析する。すなわち、利用者40が現在閲覧や編集等を行っている領域に対する操作種類と、閲覧/編集区分のデータが示す操作種類とが一致していることも条件に入れて、作業目的の類似性を判別する。
その他の処理は、第1の実施形態または第2の実施形態における処理と同じである。本実施形態では、作業目的の類似性判別の精度をさらに高くすることができる。
次に本発明の実施例を説明する。文書A,Bを端末(クライアント20)において参照しながら、文書Cを作成する作業を例にする。
まず、履歴蓄積フェーズ(図2参照)において、利用者40が端末に対し、作業開始を指示し、作業終了を指示するまでの間が作業単位検出部301によって作業単位として認識される。本実施例では、サーバ10は、作業終了時に、作業開始からの間に利用者が参照した文書名、および文書各々に対する重点参照領域を検出する。重点参照領域とは、注目領域の一種であり、利用者40が文書の他領域に比べて、相対的に長時間参照している領域である。操作監視部201は、利用者40の操作を監視することによって、重点参照領域を検出する。例えば、アプリケーションのスクロール領域を監視し、3秒以上停止して表示された領域を、参照した領域とみなすことができる。また、参照された領域の全て、またはページ全体の10%までの範囲を重点参照領域とみなすことができる。
作業内容解析部302は、重点参照領域からTF−IDF法によって特徴キーワードを抽出する。そして、図4に示されたように、作業履歴データを作業履歴に記録する。
履歴活用フェーズでは、まず、利用者40が端末に対して、作業開始を指示する。利用者が文書を参照すると、履歴蓄積フェーズにおける作業内容解析部302の場合の動作と同様の処理で、作業目的解析部501は、利用者40の文書に対する重点閲覧領域を検出する。そして、検出した重点閲覧領域から特徴キーワードを抽出する。さらに、過去の作業履歴を検索し、同一文書名(利用者40が現在作業対象にしている文書名と同一の文書名)で、特徴キーワードが似通っているものを持つ作業レコードを、類似作業レコードとみなす。
例えば、作業履歴における文書A(文書IDがAの文書)の文書IDを含むレコードから、その重点参照領域に「大容量化」および「HDD」という特徴キーワードそのもの、または共起重みが高い特徴キーワードが発見された場合に、作業目的に合致する可能性が高いレコードとして抽出する。例えば、作業01(作業IDが01の作業)のレコードセットが、作業目的に合致する可能性が高いレコードとして抽出される(図4参照)。このことは、同じく文書Aの利用を記録として持つ作業02のキーワードよりも、作業目的への合致度が高いと判定されることを意味する。よって、作業01で同時に利用されていた文書Bおよび文書Cを作業対象文書の候補として利用者に提示する。
なお、上記の各実施形態では、クライアント20に、操作監視部201が設けられ、サーバ10,11に、関連情報推薦機能部(作業単位検出部301、作業内容解析部302、作業内容記録部303、作業履歴記憶部401、作業目的解析部501および関連文書検索部502)が設けられていたが、1つの装置に、操作監視部201とともに、関連情報推薦機能部の機能が設けられていてもよい。
また、サーバ10には作業内容記録部303が設けられ、クライアント20に、操作監視部201とともに、作業内容記録部303を除く関連情報推薦機能部の機能が設けられていてもよい。
図8は、本発明による関連情報推薦装置の主要構成を示すブロック図である。図8に示すように、関連情報推薦装置は、利用者の入力操作を監視する操作監視部1と、作業の開始と終了とを検出して作業単位を検出する作業単位検出部2と、作業単位検出部2が検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データ(例えば、特徴キーワード)を抽出して、情報を特定するデータ(例えば、文書ID)と特徴データとを対応させて履歴情報(図4に示す作業履歴に相当)として保存する情報/特徴保存部3A(図1における作業内容解析部302および作業内容記録部303に相当)と、利用者の作業対象の情報の特徴データを抽出する作業目的検出部4と、作業目的検出部4が検出した特徴データをもとに履歴情報を検索して関連情報を履歴情報から抽出する関連情報検索部5と、関連情報検索部5が履歴情報から抽出した関連情報を利用者に提示する出力部6とを備えている。
図9は、本発明による関連情報推薦装置の他の態様の主要構成を示すブロック図である。図9に示すように、関連情報推薦装置の他の態様は、利用者の入力操作を監視する操作監視部1と、作業の開始と終了とを検出して作業単位を検出する作業単位検出部2と、作業単位検出部2が検出した作業単位中に操作対象になった文書と、当該文書を特徴付ける特徴データ(例えば、特徴キーワード)を抽出して、文書を特定するデータ(例えば、文書ID)と特徴データとを対応させて履歴情報(図4に示す作業履歴に相当)として保存する文書/特徴保存部3B(図1における作業内容解析部302および作業内容記録部303に相当)と、利用者の作業対象の文書の特徴データを抽出する作業目的検出部4と、作業目的検出部4が検出した特徴データをもとに履歴情報を検索して関連文書を履歴情報から抽出する関連情報検索部5と、関連情報検索部5が履歴情報から抽出した関連文書を利用者に提示する出力部6とを備えている。
また、情報/特徴保存部3Aおよび文書/特徴保存部3Bは、作業単位中に操作対象になった情報(例えば、文書)における注目領域から特徴データを抽出することが好ましい。利用者が注目した領域から特徴データを抽出することによって、より作業目的に適った特徴データを抽出でき、その結果、より作業目的に適う関連情報を検索して推薦できるようになるからである。
本発明を、利用者の作業状況に合わせて、関連性の高い文書を一覧表示するプログラムといった用途に適用できる。また、文書管理システムにおける検索処理機能といった用途にも適用できる。
本発明による関連情報推薦システムの第1の実施形態を示すブロック図である。 履歴蓄積フェーズを示す流れ図である。 履歴活用フェーズを示す流れ図である。 作業履歴の一例を示す説明図である。 本発明による関連情報推薦システムの第2の実施形態を示すブロック図である。 第3の実施形態における作業履歴の一例を示す説明図である。 第4の実施形態における作業履歴の一例を示す説明図である。 本発明による関連情報推薦装置の主要構成を示すブロック図である。 本発明による関連情報推薦装置の他の態様の主要構成を示すブロック図である。
符号の説明
1 操作監視部
2 作業単位検出部
3A 情報/特徴保存部
3B 文書/特徴保存部
4 作業目的検出部
5 関連情報検索部
6 出力部
10,11 サーバ
20 クライアント
30 ネットワーク(通信ネットワーク)
40 利用者
101 入力部
202 出力部
201 操作監視部
301 作業単位検出部
302 作業内容解析部
303 作業記録部
401 作業履歴記憶部
501 作業目的解析部
502 関連文書検索部
601 文書管理システム

Claims (13)

  1. 利用者の操作状況に応じて関連情報を推薦する関連情報推薦装置であって、
    利用者の入力操作を監視する操作監視部と、
    作業の開始と終了とを検出して作業単位を検出する作業単位検出部と、
    前記作業単位検出部が検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報を特定するデータと特徴データとを対応させて履歴情報として保存する情報/特徴保存部と、
    利用者の作業対象の情報の特徴データを抽出する作業目的検出部と、
    前記作業目的検出部が検出した特徴データをもとに前記履歴情報を検索して関連情報を前記履歴情報から抽出する関連情報検索部と、
    前記関連情報検索部が履歴情報から抽出した関連情報を利用者に提示する出力部と
    を備えたことを特徴とする関連情報推薦装置。
  2. 情報/特徴保存部は、作業単位中に操作対象になった情報における注目領域から特徴データを抽出する
    請求項1記載の関連情報推薦装置。
  3. 情報として、文書を対象とする
    請求項1または請求項2記載の関連情報推薦装置。
  4. 作業目的検出部は、利用者の作業における文書の特徴データを用いて、当該文書と履歴情報における文書との類似度を算出し、算出した類似度が高い場合に、履歴情報における文書を前記履歴情報から抽出する
    請求項3記載の関連情報推薦装置。
  5. 情報/特徴保存部は、
    作業中に利用された複数の文書におけるそれぞれの特徴キーワードを抽出して文書特徴付ける特徴データとする作業内容解析部と、
    前記作業内容解析部が抽出した特徴キーワードを、文書IDとともに作業内容記憶部に記録する作業内容記録部とを含む
    請求項4記載の関連情報推薦装置。
  6. 作業内容記録部は、文書を特定するデータと、特徴キーワードと、前記文書における特徴キーワード抽出の対象になった注目領域を示すデータとを対応させて履歴情報として保存し、
    関連情報検索部は、作業目的検出部が検出した特徴キーワードをもとに前記履歴情報を検索して、利用者の作業対象が前記対象領域と重複していることを条件にして、関連文書を前記履歴情報から抽出する
    請求項5記載の関連情報推薦装置。
  7. 作業内容記録部は、文書を特定するデータと、特徴キーワードと、前記文書における特徴キーワード抽出の対象になった注目領域を示すデータと、利用者の操作の種類を示すデータとを対応させて履歴情報として保存し、
    関連情報検索部は、作業目的検出部が検出した特徴キーワードをもとに前記履歴情報を検索して、利用者の操作の種類が前記履歴情報における操作の種類と重複していることを条件にして、関連文書を前記履歴情報から抽出する
    請求項6記載の関連情報推薦装置。
  8. 利用者の操作状況に応じて関連情報を推薦する関連情報推薦方法であって、
    利用者の入力操作を監視し、
    作業の開始と終了とを検出して作業単位を検出し、
    検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報を特定するデータと特徴データとを対応させて履歴情報として保存し、
    利用者の作業対象の情報の特徴データを抽出し、
    検出した特徴データをもとに前記履歴情報を検索して関連情報を前記履歴情報から抽出し、
    前記関連情報検索部が履歴情報から抽出した関連情報を利用者に提示する
    ことを特徴とする関連情報推薦方法。
  9. 作業単位中に操作対象になった情報における注目領域から特徴データを抽出して履歴情報として保存する
    請求項8記載の関連情報推薦方法。
  10. 通信ネットワークを介して通信可能に接続されるクライアント装置とサーバ装置とを備え、
    前記クライアント装置は、利用者の入力操作を監視する操作監視部を含み、
    前記サーバ装置は、
    作業の開始と終了とを検出して作業単位を検出する作業単位検出部と、
    前記作業単位検出部が検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報と特徴データとを対応させて履歴情報として保存する情報/特徴保存部と、
    利用者の作業における情報の特徴データを抽出する作業目的検出部と、
    前記作業目的検出部が検出した特徴データをもとに前記履歴情報を検索して関連情報を前記履歴情報から抽出する関連情報検索部とを含み、
    前記クライアント装置は、前記関連情報検索部が履歴情報から抽出した関連情報を利用者に提示する出力部を含む
    ことを特徴とする関連情報推薦システム。
  11. 情報/特徴保存部は、作業単位中に操作対象になった情報における注目領域から特徴データを抽出する
    請求項10記載の関連情報推薦システム。
  12. 利用者の操作状況に応じて関連情報を推薦するための関連情報推薦プログラムであって、
    コンピュータに、
    利用者の入力操作を監視する処理と、
    作業の開始と終了とを検出して作業単位を検出する処理と、
    検出した作業単位中に操作対象になった情報と、当該情報を特徴付ける特徴データを抽出して、情報を特定するデータと特徴データとを対応させて履歴情報として保存する処理と、
    利用者の作業対象の情報の特徴データを抽出する処理と、
    検出した特徴データをもとに前記履歴情報を検索して関連情報を前記履歴情報から抽出する処理と、
    前記関連情報検索部が履歴情報から抽出した関連情報を利用者に提示する処理と
    を実行させるための関連情報推薦プログラム。
  13. コンピュータに、
    作業単位中に操作対象になった情報における注目領域から特徴データを抽出して履歴情報として保存する処理を実行させるための
    請求項12記載の関連情報推薦プログラム。
JP2008053473A 2008-03-04 2008-03-04 関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラム Pending JP2009211385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008053473A JP2009211385A (ja) 2008-03-04 2008-03-04 関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008053473A JP2009211385A (ja) 2008-03-04 2008-03-04 関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラム

Publications (1)

Publication Number Publication Date
JP2009211385A true JP2009211385A (ja) 2009-09-17

Family

ID=41184462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008053473A Pending JP2009211385A (ja) 2008-03-04 2008-03-04 関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラム

Country Status (1)

Country Link
JP (1) JP2009211385A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011036755A1 (ja) * 2009-09-24 2011-03-31 株式会社 東芝 キーワード抽出装置、およびプログラム
WO2011039848A1 (ja) * 2009-09-29 2011-04-07 株式会社 東芝 関心領域抽出装置及びプログラム
JP2011253535A (ja) * 2010-06-03 2011-12-15 Palo Alto Research Center Inc 混成ユーザ行為モデルを用いた行為識別
JP2012014349A (ja) * 2010-06-30 2012-01-19 Nec System Technologies Ltd 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法
WO2014057529A1 (ja) * 2012-10-09 2014-04-17 富士通株式会社 情報探索支援方法及び情報処理装置
JP2015103000A (ja) * 2013-11-25 2015-06-04 シャープ株式会社 ファイル提示システム、制御装置、端末装置、提示方法、および提示プログラム
US9262714B2 (en) 2012-01-11 2016-02-16 Canon Kabushiki Kaisha Frequent pattern extraction apparatus frequent pattern extraction method and program
JP2016134158A (ja) * 2015-01-22 2016-07-25 富士通株式会社 業務評価方法、業務評価プログラムおよび業務評価装置
JP2018005545A (ja) * 2016-07-01 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8904285B2 (en) 2009-09-24 2014-12-02 Kabushiki Kaisha Toshiba Keyword extraction apparatus and program
WO2011036755A1 (ja) * 2009-09-24 2011-03-31 株式会社 東芝 キーワード抽出装置、およびプログラム
JPWO2011036755A1 (ja) * 2009-09-24 2013-02-14 株式会社東芝 キーワード抽出装置、およびプログラム
JP5238886B2 (ja) * 2009-09-24 2013-07-17 株式会社東芝 キーワード抽出装置、およびプログラム
WO2011039848A1 (ja) * 2009-09-29 2011-04-07 株式会社 東芝 関心領域抽出装置及びプログラム
JP5367833B2 (ja) * 2009-09-29 2013-12-11 株式会社東芝 関心領域抽出装置及びプログラム
US9141706B2 (en) 2009-09-29 2015-09-22 Kabushiki Kaisha Toshiba Region-of-interest extraction apparatus and method
JP2011253535A (ja) * 2010-06-03 2011-12-15 Palo Alto Research Center Inc 混成ユーザ行為モデルを用いた行為識別
JP2012014349A (ja) * 2010-06-30 2012-01-19 Nec System Technologies Ltd 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法
US9262714B2 (en) 2012-01-11 2016-02-16 Canon Kabushiki Kaisha Frequent pattern extraction apparatus frequent pattern extraction method and program
WO2014057529A1 (ja) * 2012-10-09 2014-04-17 富士通株式会社 情報探索支援方法及び情報処理装置
JP5846314B2 (ja) * 2012-10-09 2016-01-20 富士通株式会社 情報探索支援方法及び情報処理装置
JP2015103000A (ja) * 2013-11-25 2015-06-04 シャープ株式会社 ファイル提示システム、制御装置、端末装置、提示方法、および提示プログラム
JP2016134158A (ja) * 2015-01-22 2016-07-25 富士通株式会社 業務評価方法、業務評価プログラムおよび業務評価装置
JP2018005545A (ja) * 2016-07-01 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
JP2009211385A (ja) 関連情報推薦装置、関連情報推薦方法、関連情報推薦システムおよび関連情報推薦プログラム
TWI524193B (zh) 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法
US9075873B2 (en) Generation of context-informative co-citation graphs
US8341175B2 (en) Automatically finding contextually related items of a task
US9552352B2 (en) Enrichment of named entities in documents via contextual attribute ranking
US9262714B2 (en) Frequent pattern extraction apparatus frequent pattern extraction method and program
US20070233676A1 (en) Computer-readable recording medium storing information search program, information search method, and information search system
JP5425906B2 (ja) リサーチセッションの検出に基づくリサーチツールへのアクセス
US8234584B2 (en) Computer system, information collection support device, and method for supporting information collection
JP2010128928A (ja) 検索システム及び検索方法
JP2006146628A (ja) 内容画像による文書検索方法および装置
TWI457775B (zh) 網址分類管理方法及使用該方法之電子裝置
JP2012234340A (ja) 商品キーワード管理システム
JP5494493B2 (ja) 情報検索装置、情報検索方法、及びプログラム
JP7171811B2 (ja) 監視装置、ショッピングサーバ、監視方法、及びプログラム
JP2007164633A (ja) コンテンツ検索方法及び装置及びプログラム
JP5217518B2 (ja) 関係情報取得システム、関係情報取得方法および関係情報取得用プログラム
US20050144179A1 (en) Method and apparatus for document-analysis, and computer product
US20170153905A1 (en) User quest-anchored active digital memory assistant
JP2006309509A (ja) 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体
JPWO2013145230A1 (ja) 情報分析支援装置、情報分析支援方法、及び情報分析支援プログラム
JP2009223679A (ja) 電子文書検索装置、及び電子文書検索プログラム
CN113127721A (zh) 一种基于搜索历史记录定向跳转页面的方法及装置
JP2009134535A (ja) ソフトウェア開発支援装置、ソフトウェア開発支援方法及びソフトウェア開発支援プログラム
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム