JP4552509B2 - 関連文書検索のためのプログラム及び装置 - Google Patents

関連文書検索のためのプログラム及び装置 Download PDF

Info

Publication number
JP4552509B2
JP4552509B2 JP2004152057A JP2004152057A JP4552509B2 JP 4552509 B2 JP4552509 B2 JP 4552509B2 JP 2004152057 A JP2004152057 A JP 2004152057A JP 2004152057 A JP2004152057 A JP 2004152057A JP 4552509 B2 JP4552509 B2 JP 4552509B2
Authority
JP
Japan
Prior art keywords
document
user
version
seed
fitness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004152057A
Other languages
English (en)
Other versions
JP2005332326A (ja
JP2005332326A5 (ja
Inventor
文隆 松本
祥一 林
孝 野口
明 黒澤
信雄 鈴木
徹 石垣
信行 竹尾
基行 鷹合
隆直 佐々木
浩 桂林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2004152057A priority Critical patent/JP4552509B2/ja
Publication of JP2005332326A publication Critical patent/JP2005332326A/ja
Publication of JP2005332326A5 publication Critical patent/JP2005332326A5/ja
Application granted granted Critical
Publication of JP4552509B2 publication Critical patent/JP4552509B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、注目する文書に関連する関連文書を検索するための技術に関する。
文書管理においては、随時内容が更新される文書の版管理が重要なポイントの一つとなっている。このため、従来より各種の版管理システムが提案されている。
従来の版管理システムは、例えば特許文献1に示されるように、版管理システムが文書データベースを有しており、ユーザがそのデータベース中の文書に対して編集(すなわち文書内容の更新)を行う場合、該システムが提供する文書編集環境を利用する仕組みとなっているものが多い。また、この種の従来システムでは、版改訂を正確に追跡できるようにするため、誰かが編集している文書(或いは文書内の部分)に対しては他人が編集できないようにロック制御を行うという、厳格な管理を行うものも多い。
このようなシステムは、版管理システムを通さない限り文書の更新ができないので、確実に版管理ができるという利点があるものの、厳格な管理ゆえの不便な点も少なくない。例えば、この従来システムは、文書をシステムの外(例えば各人のパーソナルコンピュータなど)に持ち出して更新したり、また複数人が並列的に文書の更新作業を行い複数の更新結果の文書から新版を選択したりするというような作業の進め方には向かない。
このような自由度の高い作業環境に対応するためのアプローチとしては、例えば、自由な環境で文書を作成し、その文書を版管理システムに入力する際にそれの旧版の文書をユーザが明示的に指定することで、新版と旧版の対応付けを行うという方式がある。しかし、この方式では、旧版の文書をユーザが特定しなければならない。このためには、ユーザは文書の校正作業の推移を注意深く監視するとともに、各文書の格納場所(パス名など)や文書間での内容の変化をチェックしながら新旧の版の対応付けを行わなければならない。これはユーザにとって非常に大きな負担であるし、ミスを誘発する可能性もある。
なお、版管理における新旧版の対応関係をユーザに分かりやすく見せるための技術の1つとしては、特許文献2に示されるものがある。この従来技術のシステムでは、同一文書の版の推移状況や、同一文書ではないが関連のある関連文書の生成状況をカレンダー上に表示することで、文書間の関連やそれら文書の時系列的な作成の流れをユーザに提示している。しかしながら、この従来技術は、既にシステムに登録されている版の情報や文書の関連づけの情報(版も関連づけの一種である)をもとに、文書間の関連を図式化して提示するものであって、システムに未登録の文書に関連する登録済みの文書を探すための助けにはならない。この従来システムでは、未登録の文書を登録済み文書に関連づけるのはユーザの仕事であり、その際にユーザを支援する仕組みについては特段の配慮はなされていない。
ユーザが文書間の関連を把握するのを支援する仕組みとしては、キーワード検索や属性検索など、文書の内容や属性(該文書の作成日や作成者などの情報)に対する検索を利用するものが考えられる。しかし、文書の内容や属性に対する検索は、検索結果の質がキーワード等の検索条件の指定の仕方の巧拙に左右される面が強い。また検索の宿命として意図しない文書が検索される場合もある。
条件指定の巧拙に左右されにくい関連文書検索の仕組みが求められる。また、別の観点では、従来の文書内容や属性に対する検索を補強できる新たな文書検索方式が求められる。
特開2002−269070号公報 特開2002−312352号公報
1つの側面では、本発明は、文書の内容や属性によらない新たな文書検索の技術を提供する。また別の側面では、本発明は、文書の内容や属性を用いた検索方式を補強できる新たな文書検索の技術を提供する。
本発明の1つの側面では、コンピュータシステムを、文書データベースに登録された各文書に対し各ユーザが行った参照についてのログ記録するログ記録手段、前記各文書の中から種文書とする文書の指定を受け付けることが可能な種文書指定手段、前記各文書について、該文書の前記種文書に対する適合度を、前記ログ記録手段に記録されたログ群から求められる各ユーザの各文書に対する参照頻度に基づき計算する適合度計算手段、計算された適合度の値が高い文書から順に示した検索結果を提示する検索結果提示手段、として機能させるためのプログラムであって、前記適合度計算手段は、ユーザと文書の組合せごとに、前記ログ記録手段に記録されたログに基づき当該ユーザの当該文書に対する参照頻度に応じた参照頻度スコアを計算し、ユーザと文書の組合せごとの参照頻度スコアを記憶したインデックステーブルを作成する手段と、前記種文書を参照したユーザを前記参照ログ記録手段から求め、求めた各ユーザの各文書に対する参照頻度スコアを前記インデックステーブルから求め、求めた参照頻度スコアを文書ごとに集計することで、前記種文書に対する各文書の適合度を計算する手段と、を備え、前記インデックステーブルを作成する手段は、ログに記録されたユーザの文書に対する参照の時期が前記文書データベースに対する該文書の登録の時点からあらかじめ定めた期間内の方が該期間後に比べて前記参照頻度スコアに対する該参照の寄与が大きくなる計算式であって、該ユーザが該文書を参照した総回数が同じでも、前記文書データベースに対して該文書が登録された時点からあらかじめ定めた期間以内に該ユーザが該文書を参照した回数が多いほど、前記参照頻度スコアが高くなる計算式により、前記参照頻度スコアを計算する、ことを特徴とするプログラム、を提供する。
参考例では、コンピュータシステムを、ネットワークを介してユーザからメッセージの投稿を受け付け、投稿されたメッセージを該ネットワーク上の各ユーザに公開するコミュニケーション手段であって、相互に関連度が規定された複数の投稿場所を有し、ユーザからそれら投稿場所のうちのいずれかを指定してメッセージの投稿を受け付けると共に、受け付けたメッセージに文書が添付されている場合、該文書を所定の文書データベースに登録するコミュニケーション手段、前記文書データベースに登録された文書群の中から、種文書とする文書の指定を受け付ける種文書指定手段、前記文書データベースに登録された各文書の前記種文書に対する適合度を、前記種文書が添付されたメッセージの投稿場所と他の文書が添付されたメッセージの投稿場所との間の関連度に基づき計算する適合度計算手段、計算された適合度の値が高い文書から順に示した検索結果を提示する検索結果提示手段、として機能させるためのプログラムを提供する。
以下、図面を参照して、本発明を実施するための最良の形態(以下「実施形態」と呼ぶ)について説明する。
図1は、本発明に係る関連文書検索の機能を組み込んだコラボレーション(共同作業)支援システム10の構成を示す機能ブロック図である。コラボレーション支援システム10は、例えば企業等の組織のメンバ(以下では「ユーザ」という)間の共同作業のための各種の情報処理サービスを提供する。提供する情報処理サービスには、電子掲示板(以下では単に「掲示板」と呼ぶ)等のコミュニケーションの場を提供するサービスや、文書等の情報の共有サービス、ワークフロー支援サービスなどがある。本実施形態のシステムでは、目的や課題に応じて個々に「テーマ」と呼ぶ仮想的な場を設け、テーマごとに参加者となるユーザを登録する。そして、掲示板や情報共有、ワークフロー管理などの各種サービスは、テーマごとにその参加者に対して提供する。テーマは、例えば組織内の業務活動や業務に関連する組織構成員の自主活動などの遂行の際に随時現れてくる課題や目的に応じて設定することができる。ユーザは、必要性を感じたときに本システム10上にテーマを開設することができる。テーマという用語は、システム10が提供する場を「課題」の側面から見て名付けたものであり、同じ場を逆にその場を利用した活動の側面から見ればその場は「タスク」等と呼ぶこともできるだろう。テーマという場は、既存の組織の部門分けや職務分担などといった組織構造とは独立して設けることができる。またテーマはデータ通信ネットワーク上での存在なので、現実の職場においてチームを編成するよりも容易に設置したり廃止したりすることができ、スピードが求められるビジネス環境に適している。
コラボレーション支援システム10は、これら情報処理サービスを、インターネットやイントラネットなどのインターネット・プロトコルに準拠したネットワーク20を介し、各ユーザのPC(パーソナル・コンピュータ)30に提供する。本実施形態では、このようなサービスをウェブ(World Wide Web)ベースで、すなわちユーザ側との通信にHTTP(Hypertext Transfer Protocol) を用いたウェブアプリケーションなどの形で、ウェブサーバ100から各ユーザのPC30に提供する。
例えば図2は、本実施形態のシステムがユーザに対して提供するウェブページの一例であり、「○○開発」というテーマについての掲示板を示したウェブページ200である。このウェブページ200は、タイトル表示欄202、メイン表示欄220、各種情報情報欄230を含んでいる。
タイトル表示欄202には、このテーマのテーマ名が表示される。
メイン表示欄220は、テーマに関する主要な情報を提供する欄であり、掲示板や参加者間で共有するファイルの一覧、当該テーマに関する他の情報へのリンク(関連リンク)の一覧などを表示する。これらの情報のいずれをメイン表示欄220に表示するかは、マウス等のポインティング・デバイスでタブ212,214及び216を選ぶことで、選択することができる。図示の例では、タブ212により掲示板のメッセージ一覧画面220が選択表示された場合の例を示している。
メッセージ一覧画面220には、当該掲示板に登録された各メッセージのタイトルを並べたメッセージリスト222が表示される。このリスト222に表示されるタイトルは、メッセージ本文にリンクされており、ユーザはタイトルをクリックするなどの操作でメッセージ本文を画面表示することができる。図に例示したメッセージリストは、各メッセージのタイトルを、該メッセージの登録時刻の時系列順にリスト表示したものであるが、この他にも、それらタイトルをスレッド表示したリスト表示画面を提供することも可能である。
図2のメッセージリスト222の表示例では、各メッセージごとに、「No.」、「属性」、「タイトル」、「添付文書」、「作成者」、「作成日時」などの項目が表示されている。「No.」は、当該掲示板における当該メッセージの登録順序を示す番号である。また、「タイトル」は当該メッセージのタイトル(表題)であり、メッセージ本文にリンクされている。「添付文書」欄224は、当該メッセージに添付してシステム10にアップロードされた文書の情報を示す欄であり、添付文書のファイル名と、該添付文書についての関連文書の検索を指示する関連文書検索ボタン226が示される。添付文書のファイル名は、システム10が保存する当該文書のデータへとリンクされており、ユーザはこのリンクを選択することで、当該文書のファイルを開いて自分のPC30の画面に表示することができる。なお、添付文書へのリンクはメッセージ本文にも表示されるので、メッセージ本文から添付文書にアクセスすることもできる。「作成者」及び「作成日時」は当該メッセージを作成したユーザのユーザ名及びその日時である。
テーマ情報欄230には、このテーマに関する各種の情報が示される。テーマ情報欄230に示される情報の一つとして、このテーマに対する参加者のリストがある。図2の例では、参加者リストとして、メンバー表示欄232、リーダー表示欄234、オブザーバ表示欄236が示されている。ここで、メンバー、リーダー、オブザーバは、それぞれ各参加者の当該テーマ内での役割である。例えば、メンバーはこのテーマでの情報交換や議論等の活動の主体となる人々であり、このテーマの掲示板に対する閲覧及び書込の両方が認められる。また、リーダーはこの掲示板の運営管理を行う人々、オブザーバはこの掲示板の閲覧のみが認められた人々、等と言った具合である。
各ユーザは、PC30から、自分が参加するテーマの掲示板にアクセスし、メッセージ一覧画面220を閲覧し、必要に応じてメッセージリスト222からメッセージを選んでその本文を閲覧する。また、必要に応じ添付文書欄224の添付文書のリンクから添付文書を取得することもできる。また、ユーザは新規書込ボタン228を押下することにより掲示板に投稿する新規メッセージを編集したり、各メッセージに対して設けられた返信ボタン(図示省略)を押下することにより、所望のメッセージ対する返信メッセージを編集したりすることができる。これらメッセージを投稿する際にユーザは添付文書を指定することができ、メッセージがシステム10に投稿されると、それに添付された文書のファイルもシステム10にアップロードされる。以上に説明したメッセージ一覧画面220等の掲示板関係の処理やユーザインタフェースは、一覧画面220に設けた添付文書欄224以外は、従来のものと同様でよい。
また、ユーザは、タブ214をポインティング・デバイスで選択することにより、図3に示すようなファイル一覧画面240を含んだウェブページ200を自分のPC30に表示することができる。ファイル一覧画面240には、システム10が管理する文書ファイルのうち、該テーマの参加者がアクセス可能な文書ファイルの一覧が表示される。本システム10では、各文書ファイルには、アップロード時や版系列への組み込み時などのタイミングで、各ユーザやユーザグループ(例えば「テーマ」の参加者グループ)に与えるアクセス権を設定することができる。例えばあるテーマの掲示板に対するメッセージに添付された文書ファイルの場合、デフォルトの設定では、当該テーマのユーザ群にのみアクセス権が付与される。ファイル一覧画面240の表示では、各文書に設定されたアクセス権の情報に従い、当該ユーザがアクセスできるファイルの一覧が表示される。
本システム10では、システム10はユーザからアップロードされた文書ファイルを版管理しており、ファイル一覧画面240には、ファイルのリストが同一文書の版系列ごとに整理して表示される。すなわち、ファイル一覧画面240には、版系列ごとに表示欄242−1,242−2が設けられ、各表示欄242には、同一文書の版系列ごとのファイルリスト244が表示される。1つの版系列のファイルリスト244には、当該版系列に属する各文書ファイルごとに、「版」の番号、「ファイル名」、ファイルの「サイズ」、該文書ファイルが添付されたメッセージの「メッセージタイトル」、該文書ファイルの「作成者」や「作成日時」等の情報が登録される。「ファイル名」には、当該文書ファイルへのリンクが設定されており、ユーザはポインティング・デバイスでこのリンクを選択することにより、その文書ファイルにアクセスすることができる。また、「メッセージタイトル」には、掲示板の当該メッセージ本文へのリンクが設定されている。各版系列の表示欄242に設けられた版追加ボタン246は、当該版系列に対して文書の新版を追加するためのユーザインタフェース画面を要求するためのボタンである。この版追加も含めた本システム10の版管理については、後で詳しく説明する。
なお、図示は省略しているが、各版系列のファイルリストの表示欄242には、ユーザが当該版系列に対し設定したコメント・説明文を表示することもできる。
以上のように、本実施形態のシステム10は、ウェブサーバ100を通信用のフロントエンドとしてユーザのPC30に各種のサービスを提供するわけである。そして、ウェブサーバ100が対処できない各種サービスに固有の処理は、図1に示すデータベースサーバ110により実行される。
データベースサーバ110は、記憶装置150に格納された各種データを用いて処理を実行する。以下、データベースサーバ110が備える各機能モジュールと、それが利用する記憶装置150のデータ格納部について順に説明していく。
ユーザ認証部112は、このシステム10に対するユーザのアクセスに対し認証処理を実行する機能モジュールである。ユーザ認証部112は、記憶装置150のユーザ情報格納部152に格納された各ユーザのユーザID、パスワード等の認証情報を参照し、このユーザ認証を行う。ユーザは、システム10にログインする際には、ウェブサーバ100が提供するユーザ認証用のウェブページに対してユーザIDや認証情報を入力し、認証を求める。なおユーザ情報格納部152には、これらの他に各ユーザの所属部署や年齢、性別などの個人情報を格納してもよい。
ページ作成部114は、各ユーザに提供するウェブページのデータを作成する機能モジュールである。ページ作成部114は、テーマ情報格納部154やコミュニケーション履歴格納部156など、記憶装置150が備える各データ格納部の持つデータに基づき、図2や図3に例示したウェブページのデータを作成する。すなわち、掲示板等の情報は随時更新されるので、このページ作成部114が随時最新の情報をもとにウェブページを作成するのである。作成されたウェブページはウェブサーバ100が管理し、ユーザからの要求に応じてPC30のブラウザに提供する。
ここで、テーマ情報格納部154には、各テーマごとに、そのテーマの参加者のデータを格納している。参加者のデータは、例えば、当該テーマに参加するユーザのユーザIDのリストである。図2に示したごとくテーマの参加者にメンバーやリーダー等の役割分けがある場合は、参加者のデータは、どのユーザがどの役割を持つかを示す情報を含む。
また、テーマ情報格納部154には、各テーマ間の関係を示す情報も格納されている。すなわち、あるテーマについての議論・情報交換等の活動にあたり、より細分化された下位のテーマが派生してくることはよくあることであるが、このコラボレーション支援システム10では、このように、テーマに対して下位のテーマを設けることができる(図4参照)。このような、テーマ間のツリー状の階層関係(親子関係)の情報がテーマ情報格納部154に登録される。また、このような上位下位の階層関係だけでなく、あるテーマに対して既存のテーマを対等レベルの関連テーマとして設定できるようにすることもできる。システム10は、下位テーマを設定したり、テーマ間の関連づけを行ったりするためのユーザインタフェース用のウェブページを提供する機能を備える。
次に、メッセージ登録部116は、ユーザが入力したメッセージを投稿先の掲示板のデータベースに登録する機能モジュールである。コミュニケーション履歴格納部156が、その掲示板のメッセージを保存するデータベースである。メッセージ投稿では、ユーザは、図2等に示したウェブページ200から投稿用のウェブページを呼び出し、このページにメッセージを入力してウェブサーバ100宛に送信する。送信データには、メッセージの他に、投稿先のテーマを示す識別情報や、返信先のメッセージの識別情報(もしあれば)が含まれる。ウェブサーバ100は、受け取ったそれらの情報をメッセージ登録部116に知らせ、メッセージ登録部116はコミュニケー処理歴格納部156に保持されたそのテーマの掲示板にそのメッセージを登録する。なお、掲示板に投稿されたメッセージ群は、返信の関係に基づきスレッドに分けることができる。
なお、ユーザが投稿したメッセージに添付文書が指定されている場合は、その添付文書のファイルが文書登録部118に渡される。文書登録部118は、その文書ファイルを文書コンテンツ格納部158に格納する。ウェブページに示される文書ファイルへのリンクは、文書コンテンツ格納部158に格納された文書ファイルを指すようにする。
また、文書登録部118は、文書コンテンツ格納部158に格納する文書ファイルごとに、図3に例示したようなサイズや作成者などの各種の文書属性(プロパティ)情報を文書プロパティ格納部160に登録する。登録する文書属性には、当該文書ファイルが添付されたメッセージを特定する情報(例えばテーマとメッセージの識別情報)も含まれる。
以上に説明したユーザ認証部112やページ作成部114,メッセージ登録部116及び文書登録部118の処理は、テーマ間の関係づけのための処理は除き、従来からのものと同様でよい。
版管理部120は、文書コンテンツ格納部158に格納された文書の版管理を行う機能モジュールである。本実施形態では、文書コンテンツ格納部158に格納された文書ファイル群は、それぞれいずれかの版系列に属している。1つ1つの版系列は、図3にも例示したように、同一文書の各版である文書ファイルの系列である。版系列の管理情報は、例えば、版ごとにその版番号と文書ファイルの識別情報(文書ID又はURLなど)の組を並べたものでよい。版管理情報格納部162には、版系列ごとに、そのような管理情報が格納される。図3のような版の情報を含んだファイル一覧画面は、この版管理情報格納部162の情報と、文書プロパティ格納部160に格納された文書属性の情報から作成することができる。なお、これら版系列の管理情報と文書属性情報とは1つのデータベースに統合してもよい。
本実施形態では、文書登録部118が文書ファイルを文書コンテンツ格納部158に格納する際、版管理部120は、その文書ファイルを第1版として新たな版系列を作成し、その版系列の情報を版管理情報格納部162に登録する。また、版管理部120は、既に文書コンテンツ格納部158に格納済みの文書ファイルを既存の版系列に組み込んだり、或いはそれら格納済みの文書ファイル群から新たな版系列を構成したりする。このような既存版系列への組み込みや新規版系列の構成などは、版系列編集のユーザインタフェース用のウェブページをユーザ側に提供し、これに対するユーザの入力に従って行う。このような版系列の編集については、後に詳細に説明する。
ログ管理部122は、本システム10に対するユーザからの操作とそれに対応するシステム10の応答(操作に対して行った処理)のログ(「操作・応答ログ」と呼ぶ)を、操作・応答ログ記録部164に記録する。記録するログとしては、例えば、システム10に対するログイン、掲示板その他のウェブページの閲覧、掲示板への投稿、文書ファイルのアップロード、文書ファイルの閲覧(又はダウンロード)、テーマの開設など、システム10が提供する様々なサービスに対する操作と応答の情報が挙げられる。
検索処理部130は、文書コンテンツ格納部158に格納された文書ファイルに関連する文書の検索(「関連文書検索」と呼ぶ)のための機能モジュールである。検索処理部130は、具体的な検索手段として、コンテンツ検索部132、属性検索部134、参照履歴利用検索部136及びコミュニケーション履歴利用検索部138を備えている。
コンテンツ検索部132は、文書ファイルのコンテンツ(すなわち文書の内容)に対する検索処理を行う機能モジュールである。コンテンツ検索部132は、例えばキーワード検索や自然文検索など、周知の検索手法による検索機能を備える。また、コンテンツ検索部132は、検索の基準となる文書(「種文書」と呼ぶ)の指定を受け付け、その種文書に対して類似度の高い文書を検索する機能を備える。種文書に対する類似度の高い文書の検索は、自然文検索と同様のやり方で実現できる。すなわち、例えば形態素解析などにより種文書に現れる単語を抽出し、種文書に現れる単語群がよく現れる文書を検索すればよい。
属性検索部134は、文書ファイルの属性(プロパティ)に対する検索を行う機能モジュールである。この検索では、例えば、検索条件として、作成者や作成日などといった個別の属性項目についての条件やその組合せの指定を受け付け、その条件を満足する文書を文書プロパティ格納部160のデータから探す。また、属性検索部134は、種文書の指定を受け付け、その種文書の文書属性と類似した文書ファイルを検索する機能も備える。なお、版追加や新規版系列作成のために属性検索を行う場合は、文書属性のうち作成日時の類似性は見ないか、スコアに与える影響を他より小さくする。
参照履歴利用検索部136は、文書コンテンツ格納部158内の文書ファイルに対するユーザの参照履歴に基づき文書検索を行う機能モジュールである。この検索では、ユーザが指定した種文書を参照(閲覧又はダウンロード)したユーザ群がよく参照した文書ファイルを検索する。これは、種文書を参照したユーザ群がよく参照した文書ファイルは、種文書に対する関連性が高いと捉える考え方に基づくものである。
参照履歴利用検索部136の検索は、図5に示すような参照履歴インデックステーブルを用いて行う。このテーブルの各行は本システムに登録された各ユーザに割り当てられ、各列は本システムに登録された文書ファイルに割り当てられている。そして、行i(iはユーザを一意に特定する識別番号)と列k(kは文書ファイルを一意に特定する識別番号)とが交差するセルには、そのユーザのその文書に対する参照頻度スコアSU-ikが登録される。ユーザiの文書ファイルkに対する参照頻度スコアSU-ikは、操作・応答ログ格納部164に登録されたログのうち、文書ファイルに対するユーザからの参照の記録に基づき計算される。もっとも単純には、ユーザiが文書ファイルkを参照した回数をログから求め、これを参照頻度スコアSU-ikとすればよい。文書ファイルごとの参照回数のばらつきを考慮する場合には、ユーザiが文書ファイルkを参照した回数を、その文書ファイルkの全ユーザからの総参照回数(又はその対数)で正規化した値を参照頻度スコア-ikとすればよい。
また、同じ文書ファイルの参照でも、アップロードされてから間もない間に参照するのと、時間が経ってから参照するのとでは、前者の方がユーザのその文書ファイルに対する関心が高いと考えることができる。そこで、文書ファイルがアップロードされてから、ユーザがそれを参照するまでの時間を考慮した参照頻度スコアの計算式を用いることも好適である。このような計算式の一例として次の式(1)を例示する。
SU-ik = (a*C-ik +b*Cimdt-ik)/log(C-ak) ...(1)
ここで、C-ikはユーザiが文書ファイルkを参照した回数であり、Cimdt-ikはユーザiが文書ファイルkの本システム10へのアップロード後所定期間(例えば3時間など)以内にその文書を参照した回数である。またa,bは重み係数である。a,bの値は、実験やシミュレーションなどにより、スコアSUが妥当な値となるよう決定しておく。そしてC-akは、全ユーザによる文書ファイルkの総参照回数である。操作・応答ログには、操作や応答が生じた日時の情報が記録されているので、このように時間を考慮したスコアを計算することができる。
この参照履歴インデックステーブルは、インデックステーブル格納部166に格納されている。インデックス更新部140は、定期的に、或いは管理者から明示的な更新指示が入力された場合などの所定のタイミングで、その時点で操作・応答ログ格納部164に保持されているログに基づき各参照頻度スコアSU-ikを再計算し、参照履歴インデックステーブルを更新する。なお、インデックステーブル格納部166には、参照履歴インデックステーブルの他に、コンテンツ検索部132が利用する全文検索用のインデックステーブルが登録され、インデックス更新部140は文書コンテンツ格納部158に新たな文書ファイルが格納される都度、そのインデックステーブルの更新を行う。
そして、参照履歴利用検索部136は、参照履歴インデックステーブルを参照して、次のような方法により、種文書に対する各文書ファイルの関連性の強さを示す適合度スコアを計算する。すなわち、この計算処理では、まず種文書を参照したユーザを操作・応答ログ格納部164の情報から特定し、これらユーザiの各文書ファイルKに対する適合値MU-ikを次式(2)により計算する。
MU-ik = SU-ik/log(C-ia) ...(2)
ここで、C-iaは、ユーザiが参照した文書ファイルの総数である。
そして、参照履歴利用検索部136は、この適合値MU-ikを、種文書を参照したユーザiについて総和することで、参照履歴からみた種文書に対する文書ファイルkの適合度スコアSr-kを計算する。
Sr-k = ΣMU-ik(ただしΣは種文書を参照したユーザiについての総和)...(3)
このようにして計算される適合度スコアSr-kは、種文書を参照したユーザから高頻度で参照されている文書ほど高い値となる傾向を持つ。なお以上に示した適合度スコアの計算式はあくまで一例であり、同様の傾向を持つ適合度スコアを計算できるものであればどのような計算式を用いてもよい。
参照履歴利用検索部136による検索結果は、この適合度スコアSr-k が高い順の文書ファイルのリストとなる。
次にコミュニケーション履歴利用検索部138について説明する。コミュニケーション履歴検索部138は、各文書ファイルが本システム10に登録される際のコミュニケーション履歴に基づき、ユーザが指定した種文書に関連する文書ファイルを検索する。ここで言うコミュニケーション履歴とは、アップロードされる文書ファイルが添付されたメッセージが掲示板に投稿される履歴のことである。この検索では、文書ファイルが添付されたメッセージが投稿された投稿先の場所(テーマの掲示板や、その中のスレッド)同士の近さに基づき、種文書に近い文書を検索する。ここで、投稿先の場所同士の「近さ」は、テーマ群が構成する関係構造(階層構造や対等の関連づけの構造)における、それら場所同士の関係の近さである。この関係の近さに応じて適合度スコアを求める。
例えば、本システム10上に開設された各テーマの掲示板の関係が図4に示すようなものであるとすると、種文書Sが添付されたメッセージが投稿されたのと同じスレッド301に属するメッセージの添付文書Aは、種文書に対する関連度合いが最も高いと言える。なお、以下では煩雑さを避けるため、「文書が添付されたメッセージの投稿先」などという代わりに、単に「文書の投稿先」ということにする。このように種文書と同じスレッドに投稿された文書Aの適合度スコアの値をHとする。また、種文書Sの投稿先と同じテーマの掲示板300内ではあるが、別のスレッド302に投稿された文書Bは、同一スレッドの場合よりも関連性は低い。したがって文書Bの種文書に対する適合度スコアの値は、Hより低い値Mとする。また種文書の投稿先の掲示板300に対し、テーマの階層関係において直接の下位にあるテーマの掲示板310に投稿された文書Cの適合度スコアは、Mより低い値L1とする。同様に、掲示板300の直接の上位にあるテーマの掲示板320に投稿された文書Fの適合度スコアは、Mより低い値L2とする。なお、L1とL2は同じ値でも構わない。また、掲示板310の下位のテーマの掲示板312に投稿された文書Eの適合度スコアは、文書Cの適合度スコアL1よりも更に低い値LL1(ただし0よりは大)とする。適合度スコアを0〜1の値とするならば、LL1 = (L1)などとすることもできる。これは、テーマの親子関係を1つ経るごとに、関連度合いがL1の比率で下がっていくようにするものである。また、種文書の投稿先のテーマとまったく関連のないのテーマの掲示板330に投稿された文書Dの種文書に対する適合度スコアは0とする。また、図示は省略したが、種文書の投稿先のテーマに対して対等の関連づけがなされているテーマに投稿された文書の適合度スコアは、同一テーマの掲示板300内の文書BのスコアMよりも低い値とする。この値を直接の上位又は下位のテーマの適合度スコアL1,L2より高い値にするのか低い値にするのかは、テーマ間の関連づけの意義の捉え方に依存する。
このように投稿先の関係ごとにH,M等の適合度スコアの値を予めコミュニケーション履歴検索部138に記憶させておく。
検索処理では、文書プロパティ格納部160が格納する情報(すなわち各文書が添付されたメッセージの情報)から種文書の投稿先と各文書ファイルkの投稿先とを求める。そして、テーマ情報格納部154に格納された各テーマ間の関係構造の情報から、種文書に対する文書ファイルkの関係を特定し、この関係に対応する適合度スコアの値Sc-kを求める。
コミュニケーション履歴利用検索部138による検索結果は、この適合度スコアSc-k が高い順の文書ファイルのリストとなる。
検索処理部130は、これら各検索部132〜138の機能を組み合わせて多様な検索を行うことができる。複数の検索部132〜138を組み合わせた場合、それぞれの検索部で求められた適合度スコアから、総合的な適合度スコアを計算する。総合的な適合度は、例えば、各検索部の適合度スコアの重み付け加算や、各検索部の適合度スコアを乗算する等の計算により計算すればよい。例えば、参照履歴利用検索部136とコミュニケーション履歴検索部138の検索を組み合わせる例では、ユーザが指定した種文書に対する各文書ファイルの適合度スコアをそれら各検索部136及び138でそれぞれ計算し、それらスコアを組み合わせることで、各文書ファイルの総合的な適合度スコアを求め、この総合的な適合度スコアの高い順の文書ファイルのリストを検索結果として作成する。ここで、総合的な適合度スコアが所定のしきい値に満たない文書ファイルは足切りし、検索結果には含めない。
検索処理部130による関連文書検索は、例えば版系列編集の際に利用される。関連文書検索を利用した版系列編集の流れは後で詳しく説明する。
差分情報作成部142は、文書間の差分を求める機能モジュールである。これは、例えば検索の際に指定した種文書と、検索された関連文書との間のテキストの差を表示する等の用途に用いる。すなわち、検索された文書がユーザの望む文書であるかどうかを判断する情報の一つとして、種文書との差分(すなわち種文書と異なる部分)の情報を提供するわけである。
以上、コラボレーション支援システム10の構成について説明した。次に、このシステム10による版系列編集の処理の流れを説明する。
第1の処理の流れとして、既存の版系列を指定してこれに対する新版の文書ファイルを探して追加する処理の流れを、操作に用いる一連のユーザインタフェース画面の例を用いて説明する。以下に示すユーザインタフェース画面の例は、いずれもウェブページとしてユーザのPC30に提供されるものであり、記憶装置150内に記憶された各種のデータからページ作成部114が作成したものである。
この処理は、図3に示したファイル一覧画面200から始まる。ユーザは、この画面200に示されたいくつかの版系列の表示欄242のうち、新版を追加したい版系列の表示欄242を選び、その欄の中の版追加ボタン246を押下する。すると、そのユーザのPC30上のブラウザは、版追加画面を要求するリクエストデータをウェブサーバ100に送信する。このリクエストデータには、ユーザが選んだ版系列を示すコードが含まれている。これを受けたウェブサーバ100は、図6に示すような、その版系列に対する版追加画面400のウェブページをブラウザに返す。
版追加画面400には、選択された版系列の文書ファイルリストを表示する表示欄402が設けられ、更に、その版系列に対して追加する新版のファイル名入力欄404が設けられる。
ファイル名入力欄404に入力したファイル名の文書を表示欄402に示された版系列の最新版として登録する場合は、登録ボタン410を押下すればよい。これにより、その版系列とファイル名の情報がウェブサーバ100を介して版管理部120に渡され、版管理部120がそのファイル名の文書を最新版(図示例では第3版)としてその版系列に組み込む。
このファイル名入力欄404に対するファイル名(厳密にはパス名)入力を支援する手段として、ファイル名入力欄404の近傍に参照ボタン406と関連文書検索ボタン408が設けられている。
参照ボタン406を押下すれば、システム10の文書コンテンツ格納部158に格納された文書ファイルのディレクトリツリーを表示したツリー表示画面がブラウザに提供される。ユーザはそのツリーをたどることでファイル名入力欄404に入力すべき文書ファイルを特定することができる。
関連文書検索ボタン408を押下すれば、検索条件指定画面420(図7参照)を示すウェブページがウェブサーバ100からPC30のブラウザに提供される。
提供される検索条件指定画面420には、クエリー指定欄422と適合度条件指定欄426が含まれる。
クエリー指定欄422には、版追加の対象である既存の版系列の各版の文書ファイルのリストが表示される。このリスト表示には、各文書ファイルの版番号、ファイル名、作成者、作成日時等の属性情報が表示されると共に、各ファイルごとにチェックボックス424が示される。ユーザは、このリストの中から、クエリー、すなわち種文書、とする文書ファイルを、チェックボックス424をチェックする(これにはポインティング・デバイスで選択操作を行えばよい)ことにより選択する。図6の例は、「第2版」が種文書として選択されている様子を示している。種文書は複数選択することができる。種文書を複数選択した場合は、各文書ファイルの適合度スコアは、当該文書ファイルの各種文書に対する適合度スコアを総合することで計算する。ここでの総合の仕方は各検索部132〜138の適合度スコアの場合と同様でよい。
適合度条件指定欄426には、各検索部132〜138に対応する4つの適合度条件の名称が示されている。ここで、「文書コンテンツ」はコンテンツ検索部132による検索、「文書プロパティ」は属性検索部134による検索、「コミュニケーション履歴」はコミュニケーション履歴検索部138による検索、「操作・応答ログ」は参照履歴利用検索部136による検索、をそれぞれ示している。ユーザは、各適合度条件の名称の横に設けられたチェックボックス428を選択することで、どの検索部132〜138を利用するかを指定する。図示の例は「操作・応答ログ」(参照履歴利用検索部136)が選択されている状態を示している。複数の検索手段を選択した場合は、各検索手段により求められた適合度スコアを総合することで、各文書の種文書に対する総合的な適合度スコアを計算し、この総合的なスコアに基づき検索結果のソートを行う(詳細は前述)。
ユーザが以上のようにしてクエリー(種文書)と適合度条件(使用する検索手段)を指定し、検索ボタン429を押下すると、その指定の内容がウェブサーバ100を介して検索処理部130に渡され、検索処理が行われる。検索処理の内容については既に説明したのでここでは省略する。この検索処理が終了すると、検索結果表示画面430(図8参照)を示すウェブページが作成され、これが要求元のユーザのPC30に提供される。
検索結果表示画面430には、検索された文書ファイルのリスト431が表示される。図示の例は、3つの文書ファイルが検索された場合を示している。リスト431では、検索された各文書ファイルが適合度スコアの高い順に配列されている。リスト431には、各文書のファイル名や各種属性情報、適合度スコアの値が示され、更にラジオボタン432が示される。ラジオボタン432は、版系列に追加する最新版の文書を指定するためのものである。最新版は、リスト431の中から1つしか選択できない。図示例はもっとも上の文書ファイルが選択された状態を示している。リスト431のファイル名には、文書ファイルへのリンクが設定されているので、ユーザはこのリンクをクリックすることで文書ファイルを開き、その内容を確認することができる。
ユーザは、ファイル名や属性情報、或いは文書ファイルの閲覧などにより最新版の文書を特定できた場合は、その文書のラジオボタン432を選択し、新版追加ボタン434を押下する。これにより、その選択された文書の識別情報と追加先の版系列の識別情報がPC30からウェブサーバ100を介して版管理部120に渡される。版管理部120は、その文書をその版系列の最新版として版管理情報格納部162に登録する。このように最新版の追加が終わると、ユーザのPC30にはウェブサーバ100から再び版追加画面400が提供される。このとき提供される版追加画面400は、追加された最新版が版系列のリスト表示欄402に新たに加わったものとなる。この版系列に対して更に新しい版を追加する場合は、以上の作業を繰り返せばよい。また、版追加を取りやめる場合は、キャンセルボタン412を押下すればよい。
また、検索結果表示画面430には差分情報表示ボタン436が設けられている。ユーザがこれを押下すると、差分表示画面440(図9参照)のウェブページがユーザに提供される。差分表示画面440は、検索結果の各文書について、その文書と種文書との間でテキスト内容が相違する部分を示す差分画像442を一覧表示する。差分画像442の作成は、公知の手法を用いればよい。各文書の差分画像442の近傍には、その文書のファイル名その他の属性情報が表示される。差分画像442における相違部分(差分)は、例えば、差分画像442のページの枠やその近傍の属性情報に用いた色とは異なる目立つ色で表示することで、視認性を高めることができる。表示の順序は、検索結果表示画面430の場合と同様、適合度スコアの順である。相違する場所が分かればよいので、差分画像442は小さい画像でよい。このような小さい差分画像442を一覧表示することで、ユーザが、検索結果の各文書のうちどれが種文書にもっとも似ているか等の判断を行う際の支援ができる。
各文書の差分画像442の欄には、ラジオボタン444が設けられている。ユーザは、差分画像442により最新版の文書を特定できた場合は、その文書のラジオボタン444を選択し、新版追加ボタン446を押下する。これにより、版管理部120がその文書を版系列に最新版として追加する。その後、ユーザには再び版追加画面400(ただし今追加した文書が最新版として加わった状態を示したもの)が提供される。また、リスト表示ボタン448を押下すれば、検索結果表示画面430に戻ることができる。
また、差分表示画面440では1つの種文書に対する差分画像442を示すので、検索条件指定画面420で種文書を複数指定していた場合には、差分表示画面440に種文書変更ボタン441が表示され、ユーザがこれを押下すると、違う種文書に対する差分画像442の一覧が表示される。もちろんこれは一例であり、種文書が複数ある場合に、例えばそれら各種文書に対する差分画像442を並列表示するようにしてもよい。
なお、一覧表示できる程度の小さい差分画像では、差分の文字列の内容等の詳細なところまでは識別できないことが多い。そこで、ユーザの指示に応じて縮小しないページのサイズの差分画像を表示することも好適である。この場合、例えば、各差分画像442の横に、縮小しない差分画像を表示するためのGUIボタンを設ければよい。
以上、既存の版系列を指定してこれに対する新版の文書ファイルを探して追加する処理の流れを説明した。次は、文書ファイルをまず指定し、その文書ファイルを追加すべき版系列を探して版追加を行う場合の流れを説明する。
この場合、版系列に追加する文書ファイルの指定は、図2に示した掲示板のメッセージリスト222中の添付文書欄224中の関連文書検索ボタン226により行う。すなわち、ユーザは、版系列に追加したい文書ファイルをメッセージリスト222から見つけると、その文書ファイルのファイル名の横にある関連文書検索ボタン226を押下することで、その文書ファイルについての版追加処理へと進むことができる。指定された文書が、以降の検索の処理での種文書となる。
また、版系列に追加する文書の指定は、掲示板中のメッセージ本文を表示するメッセージ本文表示画面450(図10参照)から行うこともできる。メッセージ本文表示画面450には、メッセージのタイトルや本文を表示した本文表示欄452と、添付文書へのリンク454(このリンクの隣に属性情報を表示してもよい)が表示される。また添付文書へのリンク454の近傍には、版追加ボタン456が表示される。この版追加ボタン456を押下することで、その近傍のリンク454が示す文書を版追加処理の対象として指定することができる。なお、版系列に追加する文書はこのようにメッセージ本文表示画面450から指定することができるので、メッセージリスト222に添付文書へのリンクや関連文書検索ボタン226を表示することは必須ではない。
このように、掲示板のメッセージのリストやメッセージ本文の表示上に、そのメッセージに対して添付された文書を種文書として指定するためのGUIボタン226又は456を設けたので、ユーザはメッセージの流れや内容を参考にしつつ、種文書を選択することができる。
このように関連文書検索ボタン226や版追加ボタン456により版追加対象の文書が指定されると、ウェブサーバ100は図11に示すような検索条件指定画面460を示すウェブページをユーザのPC30に提供する。検索条件指定画面460の種文書表示欄462には、版追加処理の対象に指定された文書のファイル名や属性情報が表示される。
検索範囲指定欄464は、その種文書に対する関連文書を検索する範囲の指定のための欄であり、何段階かの範囲とそれに対応するラジオボタン465が表示される。図示の例では、検索範囲として、「すべてのテーマ」と「関連するテーマのみ」という2段階の範囲が示される。「すべてのテーマ」は、本システム10に登録されたすべてのテーマを検索範囲とするものであり、それらいずれかのテーマにアップロードされた文書から関連文書が検索される。「関連するテーマのみ」は、種文書を添付したメッセージの投稿先のテーマと関連するテーマ(すなわち同じ階層ツリーの中にあるテーマや、対等の関連づけがされたテーマ)を検索範囲とするものである。このように検索範囲を指定できるようにすることで、種文書の追加先とする版系列をより絞り込むことができる。なお、図7の検索条件指定画面420に、同様の検索範囲指定欄を設けることもできる。
適合度条件指定欄466は、図7の検索条件指定画面420における適合度条件指定欄426と同様である。
検索範囲と適合度条件(検索手段)を指定して検索ボタン467を押下すると、検索処理が実行され、図12に示すような検索結果表示画面470がユーザのPC30に提供される。この検索結果表示画面470は、図8の検索結果表示画面430と同様、検索結果のファイルのリスト471、新版追加ボタン474、及び差分情報表示ボタン476が含まれ、それらの役割は検査結果表示画面430の場合と同様である。検索結果表示画面430と相違する点は、改版履歴確認ボタン472が設けられている点である。
改版履歴確認ボタン472は、検索結果の各文書ごとに設けられている。改版履歴確認ボタン472が押下されると、それに対応する文書ファイルの改版履歴を表示した改版履歴表示画面480がウェブサーバ100からユーザのPC30に提供される。改版履歴表示画面480には、選択された文書ファイルが属する版系列の改版履歴482が示される。この改版履歴482は、図3のファイル一覧画面240における1つ1つの版系列の表示と同様の表示内容を含む。改版履歴482に示される各版のファイル名には、そのファイルへのリンクが張られており、このリンクをクリックすることで、随時その文書ファイルを閲覧することができる。改版履歴482は、この版系列が種文書の版追加先であるのかどうかをユーザが判断する際の1つの判断材料となる。この改版履歴482をみて、種文書をこの版系列に追加してよいと判断した場合、ユーザは、ラジオボタン483又は484を選択することで、版追加の仕方を指示する。ラジオボタン483は、種文書を当該版系列の最新版として登録する方式に対応している。一方ラジオボタン484は、版番号入力欄485に入力した版番号で種文書を当該版系列に登録する方式に対応している。これを用いれば、既存の版系列の途中の版を追加することもできる。ユーザが、ラジオボタン483又は484の一方を選択し、版登録ボタン486を押下すると、改版履歴482に示される版系列に対し種文書が、そのラジオボタンによる指定に従って追加される。また、「1つ前に戻る」ボタン488を押下すれば、検索結果表示画面470に戻ることができる。
なお、検索結果表示画面470の差分情報表示ボタン476を押下すれば、図9に示した差分表示画面440と同様の画面がユーザに提供され、これによりユーザは検索結果の各文書と種文書との差分を確認できる。
以上に説明した2つの流れは、いずれも既存の版系列に対して文書ファイルを新たに追加する場合の例であった。しかし、関連文書の検索は、このような場合だけでなく、まったく新たな版系列を作成するケースにも利用できる。このケースの例について図14及び図15を用いて説明する。
図3の画面から版系列を指定する場合にはこのようなケースはないが、図2のメッセージリスト222や図10のメッセージ本文表示画面450から種文書を指定する場合にはこのようなケースが生じる。この場合、図11に示した検索条件指定画面460により検索条件の指定を受けるところまでは前述と同様でよいが、その後は、図14に示すような検索結果表示画面490を表示する。この検索結果表示画面490には、検索された文書ファイルのリスト491が表示されるが、図8や図12の検索結果表示画面430や470の場合とは異なり、文書ファイル選択用のラジオボタンや新版登録ボタンは示されない。その代わりに、この画面490には、新規版系列作成ボタン492と版追加ボタン494が表示される。
版追加ボタン494は、種文書を既存の版系列に追加する場合に選択するボタンであり、これが押下されると、検索結果の文書から種文書の追加先を選択するための図12と同様の画面がユーザに提供される。以降は、前述と同様の流れで種文書の版登録が行える。
新規版系列作成ボタン492は、検索された文書群と種文書から、新たな版系列を作成する場合に選択するボタンである。このボタン492が押下されると、図15に示す版系列作成画面500がユーザのPC30に提供される。この画面500には、種文書と検索された文書のリスト502が示される。リスト502では、文書ごとに、ファイル名や作成日などの属性情報が示される。また、種文書にはその旨が、検索結果の文書にはそれぞれの適合度スコアの値が表示される。図示の例では、各文書は作成日時の時系列順に配列されており、版の順番が決めやすくなっている。ユーザは、このリスト502の中から、新規の版系列に組み込む文書をチェックボックス506へのチェック入力により選択し、選択した各文書の版番号を、それら各文書に対応して設けられた版番号入力欄504に入力する。そして、版系列に組み込みたい文書をすべて選択し、それら各文書の版番号を入力した上で、版系列生成ボタン508を押下すると、それらの情報がウェブサーバ100を介して版管理部120に伝えられ、版管理部120画素の情報に従って新たな版系列の情報を版管理情報格納部162に登録する。
以上説明したように、この例では、種文書に選んだ文書と、それに関連するとして検索された文書群から、新たな版系列を作成し、版管理情報格納部162に登録することができる。
以上では、ユーザが各文書ファイルに割り当てる版番号を明示的に入力したが、この代わりに単純に時系列順に版番号を決めることも可能である。この場合、版番号入力欄504は不要である。
以上、本発明の好適な実施の形態を説明した。以上説明したように、本実施形態によれば、指定された種文書に関連性の高い関連文書を、各ユーザの文書に対する参照の履歴やそれら各文書の投稿先の関係から特定する手段を設けたので、従来にない新たな観点で関連文書を検索することができる。例えば、同じ文書の版違いの文書の場合、それら文書を参照するユーザはかなりに通っていると想定できるので、参照の履歴に基づく検索は有効に機能する。また、投稿先の関係による検索も、上記実施形態のように、投稿先がテーマ別に開設され、テーマ館に関連づけがあるようなケースでは有効に機能すると期待できる。
以上では、版追加や版系列作成に関連文書検索を利用する例を示したが、上述の関連文書検索は、これ以外の用途にも適用可能である。
以上では便宜上データベースサーバ110を物理的に1つの装置として説明したが、もちろんこれに限ることなく、上述の各種機能モジュール112〜142がそれぞれ別々のコンピュータシステムにて実行されるようにしてもよい。記憶装置150についても同様であり、各種の格納部152〜166を別々のハードウエア装置に設けてももちろんよい。
本発明に係る関連文書検索の機能を組み込んだコラボレーション(共同作業)支援システムの構成を示す機能ブロック図である。 実施形態のシステムが提供する、電子掲示板を含んだウェブページの表示例を示す図である。 実施形態のシステムが提供する、文書ファイル一覧を含んだウェブページの表示例を示す図である。 テーマ間の階層関係、及び各テーマに対して登録された文書間の関係を例示する図である。 参照履歴インデックステーブルのデータ構造を示す図である。 版追加画面の例を示す図である。 検索条件指定画面の例を示す図である。 検索結果表示画面の例を示す図である。 差分表示画面の例を示す図である。 メッセージ本文表示画面の例を示す図である。 検索条件指定画面の別の例を示す図である。 検索結果表示画面の別の例を示す図である。 改版履歴表示画面480の例を示す図である。 検索条件指定画面の更に別の例を示す図である。 版系列作成画面の例を示す図である。
符号の説明
10 コラボレーション支援システム、20 ネットワーク、30 PC、100 ウェブサーバ、110 データベースサーバ、112 ユーザ認証部、114 ページ作成部、116 メッセージ登録部、118 文書登録部、120 版管理部、122 ログ管理部、130 検索処理部、132 コンテンツ検索部、134 属性検索部、136 参照履歴利用検索部、138 コミュニケーション履歴検索部、140 インデックス更新部、142 差分情報作成部、150 記憶装置、152 ユーザ情報格納部、154 テーマ情報格納部、156 コミュニケーション履歴格納部、158 文書コンテンツ格納部、160 文書プロパティ格納部、162 版管理情報格納部、164 操作・応答ログ格納部、166 インデックステーブル格納部。

Claims (10)

  1. コンピュータシステムを、
    文書データベースに登録された各文書に対し各ユーザが行った参照についてのログ記録するログ記録手段、
    前記各文書の中から種文書とする文書の指定を受け付ける種文書指定手段、
    前記各文書について、該文書の前記種文書に対する適合度を、前記ログ記録手段に記録されたログ群から求められる各ユーザの各文書に対する参照頻度に基づき計算する適合度計算手段、
    計算された適合度の値が高い文書から順に提示する提示手段、
    として機能させるためのプログラムであって、
    前記適合度計算手段は、
    ユーザと文書の組合せごとに、前記ログ記録手段に記録されたログに基づき当該ユーザの当該文書に対する参照頻度に応じた参照頻度スコアを計算し、ユーザと文書の組合せごとの参照頻度スコアを記憶したインデックステーブルを作成する手段と、
    前記種文書を参照したユーザを前記参照ログ記録手段から求め、求めた各ユーザの各文書に対する参照頻度スコアを前記インデックステーブルから求め、求めた参照頻度スコアを文書ごとに集計することで、前記種文書に対する各文書の適合度を計算する手段と、
    を備え、
    前記インデックステーブルを作成する手段は、ログに記録されたユーザの文書に対する参照の時期が前記文書データベースに対する該文書の登録の時点からあらかじめ定めた期間内の方が該期間後に比べて前記参照頻度スコアに対する該参照の寄与が大きくなる計算式であって、該ユーザが該文書を参照した総回数が同じでも、前記文書データベースに対して該文書が登録された時点からあらかじめ定めた期間以内に該ユーザが該文書を参照した回数が多いほど、前記参照頻度スコアが高くなる計算式により、前記参照頻度スコアを計算する、
    ことを特徴とするプログラム
  2. 前記計算式は、
    SU-ik = (a*C-ik +b*Cimdt-ik)/log(C-ak) ...(1)
    であり、ここでSU-ikはユーザi(iはユーザを一意に特定する識別情報)の文書k(kは文書を一意に特定する識別情報)に対する参照頻度スコア、C-ikはユーザiが文書kを参照した総回数、Cimdt-ikは前記文書データベースに対して文書kが登録された時点からあらかじめ定めた期間以内にユーザiが該文書を参照した回数、a及びbはあらかじめ定められた重み係数、C-akは全ユーザによる文書kの総参照回数である、
    ことを特徴とする請求項1に記載のプログラム
  3. 前記コンピュータシステムを、
    前記文書データベースに登録された文書群のうち、同一文書の異なる版に該当する各文書の識別情報を版の新旧の順序と対応づける版系列の管理情報を管理する版管理手段、
    前記提示手段に提示された文書群から、前記種文書の旧版となる旧版文書の選択を受け付ける選択手段、
    選択された旧版文書が属する版系列における版の新旧の順序において前記種文書を追加すべき順位の指定を受け付け、該版系列の管理情報に対し前記種文書の識別情報、該種文書が指定された前記順位となるように追加する版追加手段、
    として更に機能させる請求項1からのいずれか1項に記載のプログラム。
  4. 前記コンピュータシステムを、前記文書データベースに登録された文書群のうち、同一文書の異なる版に該当する各文書の識別情報を版の新旧の順序と対応づける版系列の管理情報を管理する版管理手段、として更に機能させると共に、
    前記種文書指定手段は、前記版管理手段に管理された文書群を提示し、その中から種文書の指定を受け付ける手段を含む、
    ことを特徴とする請求項1からのいずれか1項に記載のプログラム。
  5. 前記コンピュータシステムを、
    前記提示手段に提示された文書群から、前記種文書の新版となる新版文書の選択を受け付ける選択手段、
    選択された新版文書の識別情報を、前記種文書が属する版系列の管理情報に対して最新版として追加する版追加手段、
    として更に機能させる請求項に記載のプログラム。
  6. 前記コンピュータシステムを、
    前記種文書と、前記提示手段に提示された各文書との間の差分を示す差分情報を提示する手段、
    として更に機能させる請求項又はに記載のプログラム。
  7. 前記コンピュータシステムを、
    前記文書データベースに登録された文書群のうち、同一文書の異なる版に該当する各文書の識別情報を版の新旧の順序と対応づける版系列の管理情報を管理する版管理手段、
    前記提示手段に提示された文書群から、同一文書の版系列を構成する各文書の選択を受け付ける選択手段、
    選択された各文書の識別情報からなる版系列の管理情報を新たに前記版管理手段に登録する版系列作成手段、
    として更に機能させる請求項1からのいずれか1項に記載のプログラム。
  8. 前記コンピュータシステムを
    前記文書データベースに登録された各文書について、前記種文書との間での文書内容の類似度に基づき、当該文書の前記種文書に対する適合度を計算する内容適合度計算手段、
    前記各文書について、前記適合度計算手段及び前記内容適合度計算手段で計算された前記種文書に対する適合度に基づき、総合的な適合度を計算する総合適合度計算手段、
    として更に機能させると共に、
    前記提示手段は、前記総合的な適合度の値が高い文書から順に示した検索結果を提示する、
    ことを特徴とする請求項1からのいずれか1項に記載のプログラム。
  9. 前記コンピュータシステムを
    前記文書データベースに登録された各文書について、前記種文書との間での文書属性の類似度に基づき、当該文書の前記種文書に対する適合度を計算する属性適合度計算手段、
    前記各文書について、前記適合度計算手段及び前記属性適合度計算手段で計算された前記種文書に対する適合度に基づき、総合的な適合度を計算する総合適合度計算手段、
    として更に機能させると共に、
    前記提示手段は、前記総合的な適合度の値が高い文書から順に示した検索結果を提示する、
    ことを特徴とする請求項1からのいずれか1項に記載のプログラム。
  10. 文書データベースに登録された各文書に対し各ユーザが行った参照についてのログ記録するログ記録手段と、
    前記各文書の中から種文書とする文書の指定を受け付ける種文書指定手段と、
    前記各文書について、該文書の前記種文書に対する適合度を、前記ログ記録手段に記録されたログ群から求められる各ユーザの各文書に対する参照頻度に基づき計算する適合度計算手段と、
    計算された適合度の値が高い文書から順に示した検索結果を提示する提示手段と、
    を備え
    前記適合度計算手段は、
    ユーザと文書の組合せごとに、前記ログ記録手段に記録されたログに基づき当該ユーザの当該文書に対する参照頻度に応じた参照頻度スコアを計算し、ユーザと文書の組合せごとの参照頻度スコアを記憶したインデックステーブルを作成する手段と、
    前記種文書を参照したユーザを前記参照ログ記録手段から求め、求めた各ユーザの各文書に対する参照頻度スコアを前記インデックステーブルから求め、求めた参照頻度スコアを文書ごとに集計することで、前記種文書に対する各文書の適合度を計算する手段と、
    を備え、
    前記インデックステーブルを作成する手段は、ログに記録されたユーザの文書に対する参照の時期が前記文書データベースに対する該文書の登録の時点からあらかじめ定めた期間内の方が該期間後に比べて前記参照頻度スコアに対する該参照の寄与が大きくなる計算式であって、該ユーザが該文書を参照した総回数が同じでも、前記文書データベースに対して該文書が登録された時点からあらかじめ定めた期間以内に該ユーザが該文書を参照した回数が多いほど、前記参照頻度スコアが高くなる計算式により、前記参照頻度スコアを計算する、
    ことを特徴とする関連文書検索装置。
JP2004152057A 2004-05-21 2004-05-21 関連文書検索のためのプログラム及び装置 Expired - Fee Related JP4552509B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004152057A JP4552509B2 (ja) 2004-05-21 2004-05-21 関連文書検索のためのプログラム及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004152057A JP4552509B2 (ja) 2004-05-21 2004-05-21 関連文書検索のためのプログラム及び装置

Publications (3)

Publication Number Publication Date
JP2005332326A JP2005332326A (ja) 2005-12-02
JP2005332326A5 JP2005332326A5 (ja) 2007-06-14
JP4552509B2 true JP4552509B2 (ja) 2010-09-29

Family

ID=35486931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004152057A Expired - Fee Related JP4552509B2 (ja) 2004-05-21 2004-05-21 関連文書検索のためのプログラム及び装置

Country Status (1)

Country Link
JP (1) JP4552509B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4839813B2 (ja) * 2005-12-09 2011-12-21 富士ゼロックス株式会社 情報処理システム及びプログラム
JP2008090418A (ja) * 2006-09-29 2008-04-17 Canon Inc ファイル管理装置およびファイル管理方法
JP2009301442A (ja) * 2008-06-16 2009-12-24 Chugoku Electric Power Co Inc:The 情報共有システム、方法およびプログラム
JP5712930B2 (ja) * 2009-12-04 2015-05-07 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
JP5192518B2 (ja) * 2010-08-04 2013-05-08 三菱電機インフォメーションシステムズ株式会社 文書検索システム、文書検索方法および文書検索プログラム
JP5939579B2 (ja) 2013-03-19 2016-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation リストを作成する装置、方法およびプログラム
JP6160427B2 (ja) * 2013-10-10 2017-07-12 富士ゼロックス株式会社 差分抽出システム及びプログラム
JP7318243B2 (ja) * 2019-03-19 2023-08-01 富士フイルムビジネスイノベーション株式会社 コミュニケーション支援システム及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082641A (ja) * 2000-06-08 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 情報配送方法、情報配送装置、広告提供方法、広告提供装置およびコンピュータプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082641A (ja) * 2000-06-08 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 情報配送方法、情報配送装置、広告提供方法、広告提供装置およびコンピュータプログラム

Also Published As

Publication number Publication date
JP2005332326A (ja) 2005-12-02

Similar Documents

Publication Publication Date Title
US9721039B2 (en) Generating a relationship visualization for nonhomogeneous entities
US8689098B2 (en) System and method for organizing recorded events using character tags
US7472341B2 (en) Multi-user, multi-timed collaborative annotation
US9251265B2 (en) Method and apparatus for collecting and disseminating information over a computer network
US10009391B1 (en) Apparatus and method for acquiring, managing, sharing, monitoring, analyzing and publishing web-based time series data
US8893011B2 (en) Chronology display and feature for online presentations and webpages
Blomberg et al. Reflections on a work-oriented design project
US20080250329A1 (en) Method and system for the collaborative analysis of information
US20100262659A1 (en) Systems and methods for collaboratively annotating electronic documents
US20170213272A1 (en) Computer resource ranking for interconnected user profiles
US20050257158A1 (en) Method of and system for collaboration web-based publishing
US20080082568A1 (en) System and method for managing and utilizing information
US20020161603A1 (en) Interactive publishing system providing content management
JP6567135B2 (ja) ポートフォリオ作成システム
JP4552509B2 (ja) 関連文書検索のためのプログラム及び装置
Ganaee et al. Pakistani university library web sites: Features, contents, and maintenance issues
Woolcott et al. Missing the MARC: Utilization of MARC fields in the search process
Kampmeier et al. Chapter Fifteen. Meeting The Interrelated Challenges Of Tracking Specimen, Nomenclature, And Literature Data In Mandala
Powell et al. Front-End Kibana (FEK) CS5604 Fall 2019
JP2007249622A (ja) 公開/非公開項目を含む情報の提供方法、情報提供システム、プログラム
Crowe et al. Metadata best practices for university archives images
JP7437046B2 (ja) 年史制作方法、プログラム、年史制作装置および年史制作システム
Birrell et al. Match point: Duplication and the scholarly record: The online catalogue and repository interoperability study (OCRIS), and its findings on duplication and authority control in OPACs and IRs
Featherstone et al. Enhancing subject access to electronic collections with VuFind
Withers et al. Creating Web-based listings of electronic journals without creating extra work

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070425

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130723

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4552509

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140723

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees