JP2009015589A - 関連文書提示システム及びプログラム - Google Patents

関連文書提示システム及びプログラム Download PDF

Info

Publication number
JP2009015589A
JP2009015589A JP2007176526A JP2007176526A JP2009015589A JP 2009015589 A JP2009015589 A JP 2009015589A JP 2007176526 A JP2007176526 A JP 2007176526A JP 2007176526 A JP2007176526 A JP 2007176526A JP 2009015589 A JP2009015589 A JP 2009015589A
Authority
JP
Japan
Prior art keywords
document
document file
search keyword
point
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007176526A
Other languages
English (en)
Inventor
Toshiyuki Yamamoto
俊之 山本
Takumi Yasumasu
拓見 安増
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2007176526A priority Critical patent/JP2009015589A/ja
Publication of JP2009015589A publication Critical patent/JP2009015589A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】自動的に複数の文書間を繋ぐ予想外の関連性を見出し、これに基づいて特定文書に関連する複数の文書のリストを提示可能なシステムの実現。
【解決手段】文書ファイル記憶部14と、関連性テーブル18とを備え、検索キーワードが入力された際に、文書ファイル記憶部14から検索キーワードを含む文書ファイルを抽出する処理、各文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータを関連性テーブル18に格納する処理、特定文書の閲覧リクエストが入力された際に、文書ファイル記憶部14から該当の文書ファイルを抽出する処理、この文書ファイルのIDをキーに関連性テーブル18を検索し、関連付けられた検索キーワードを特定する処理、これに関連付けられた他の文書ファイルを特定する処理、各文書ファイルの属性が列記された関連文書リストを生成する処理、関連文書リストと特定文書の内容を表示する画面を生成する処理、この画面を出力する処理を実行するデータ管理部12を備えた関連文書提示システム10。
【選択図】図1

Description

この発明は関連文書提示システム及びプログラムに係り、特に、ユーザが閲覧をリクエストした特定文書に関連する文書を抽出し、そのリストを特定文書の内容と共に提示可能な技術に関する。
データベース内に格納された多数の文書中から特定の文書をディスプレイに表示させた際に、当該文書に関連のある文書の一覧を同時に表示させ、適宜閲覧可能とすることが、ユーザフレンドリーの要請に合致する。
例えば、インターネット上のニュースサイトにおいて特定の記事の表示をリクエストすると、当該記事の詳細情報と共に、「関連記事」のタイトルの下に当該記事と同一の事件を扱った他の記事のタイトル+日付が一覧表示される。これに対し、ユーザが一覧中の任意のタイトルをクリックすると、当該記事の詳細情報がディスプレイを表示される結果、ユーザは関連性のある記事を網羅的にチェックすることが可能となる。
YOMIURI ONLINE[平成19年6月6日検索] インターネットURL:http://www.yomiuri.co.jp/index.htm
しかしながら、従来の関連文書提示システムにおいては、文書間の関連付けを基本的に特定の人間が行っているため、新聞記事のように、見出しでおおまかな内容が把握できて関連付けが比較的容易な文書間でしか関連付けができず、掲示板の投稿記事やWebログ(以下「ブログ」)の記事のように、件数が膨大となる文書間には適用できない点という問題があった。
また、新聞記事の例のように、ある特定の人間の判断によって関連付ける場合には関連性の精度が担保されるというメリットがある反面、その人間が気付かないような隠れた関連性に基づいて文書同士を紐付けるということが期待できず、予想外の関連性を見出すことまでは期待できなかった。因みに、先の掲示板の投稿記事やブログの記事についても、Webサイトの検索機能を利用することによって関連性の高い記事の一覧を得ること自体は可能であるが、この場合も検索を行おうとするユーザが設定した検索キーワードを含む文書が抽出されるものであり、想定内の結果が得られるに過ぎない。
この発明は従来の上記問題を解決するために案出されたものであり、意図的・作為的な関連付け作業を介することなく、複数の文書間を繋ぐ予想外の関連性を見出し、これに基づいて特定文書に関連する複数の文書のリストを提示可能なシステムを提供することを目的としている。
上記の目的を達成するため、請求項1に記載した関連文書提示システムは、複数の文書ファイルが格納された文書ファイル記憶手段と、文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータが格納される関連性記憶手段とを備え、検索キーワードが入力された際に、上記の文書ファイル記憶手段から当該検索キーワードをテキスト中に含む文書ファイルを抽出する処理と、抽出した各文書ファイルの属性が列記された検索結果リストを含む画面を生成する処理と、この画面を出力する処理と、抽出した各文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータを、上記関連性記憶手段に格納する処理と、上記文書ファイル記憶手段に格納された特定文書の閲覧リクエストが入力された際に、該当の文書ファイルを抽出する処理と、当該文書ファイルのIDをキーに上記関連性記憶手段を検索し、当該文書ファイルに関連付けられた検索キーワードを特定する処理と、上記関連性記憶手段を参照し、この検索キーワードに関連付けられた他の文書ファイルを特定する処理と、各文書ファイルの属性が列記された関連文書リストを生成する処理と、この関連文書リストと上記特定文書の内容を表示する画面を生成する処理と、この画面を出力する処理を実行することを特徴としている。
上記「画面を出力」とは、ディスプレイに直接表示することの他に、サーバによって生成された画面をネットワーク経由でクライアント端末に送信することも含まれる(以下同様)。
請求項2に記載した関連文書提示システムは、請求項1のシステムであって、さらに、文書ファイルのIDと検索キーワードとの組合せに対して、所定のレーティングポイントを関連付けた関連ポイントデータを格納しておく関連ポイント記憶手段を備え、上記関連文書リストを生成するに際し、この関連ポイント記憶手段を参照し、文書ファイルIDと検索キーワードの組合せ毎にレーティングポイントの総計を算出する処理と、レーティングポイントの大きい順に関連文書を整列させた関連文書リストを生成する処理を実行することを特徴としている。
請求項3に記載した関連文書提示システムは、請求項2のシステムであって、さらに、上記検索結果リスト中の特定文書の閲覧リクエストが入力された際に、当該文書ファイルのIDと検索キーワードとの組合せに対して所定のレーティングポイントを関連付けた関連ポイントデータを生成し、上記関連ポイント記憶手段に格納する処理を実行することを特徴としている。
請求項4に記載した関連文書提示システムは、請求項2または3のシステムであって、さらに、上記関連文書リスト中の特定の関連文書の閲覧リクエストが入力された際に、当該関連文書ファイルのIDと検索キーワードとの組合せに対して所定のレーティングポイントを関連付けた関連ポイントデータを生成し、上記関連ポイント記憶手段に格納する処理を実行することを特徴としている。
請求項5に記載した関連文書提示システムは、請求項2〜4のシステムであって、さらに、上記検索結果リストまたは関連文書リスト中の特定文書の閲覧リクエストが入力された際に、上記文書ファイル記憶手段から該当の文書ファイルを抽出し、その内容を表示する画面を生成する処理と、この画面を出力する処理と、画面出力と同時に閲覧時間の計測を開始し、ユーザによる所定の閲覧終了動作を検知した時点で閲覧時間を確定する処理と、閲覧時間とレーティングポイントとの対応関係が定義されたポイント変換テーブルを参照し、レーティングポイントを特定する処理と、当該文書ファイルのIDと検索キーワードとの組合せに対して上記のレーティングポイントを関連付けた関連ポイントデータを生成し、上記関連ポイント記憶手段に格納する処理を実行することを特徴としている。
請求項6に記載した関連文書提示システムは、請求項2〜5のシステムであって、さらに、上記検索結果リストまたは関連文書リスト中の特定文書の閲覧リクエストが入力された際に、上記文書ファイル記憶手段から該当の文書ファイルを抽出し、その内容が表示されると共に、当該文書の重要度を問う複数の選択肢が記述された画面を生成する処理と、この画面を出力する処理と、特定の選択肢を選択する回答データが入力された際に、各選択肢とレーティングポイントとの対応関係が定義されたポイント変換テーブルを参照し、レーティングポイントを特定する処理と、当該文書ファイルのIDと検索キーワードとの組合せに対して上記のレーティングポイントを関連付けた関連ポイントデータを生成し、関連ポイント記憶手段に格納する処理を実行することを特徴としている。
請求項7に記載した関連文書提示システムは、請求項1〜6のシステムであって、さらに、予め関連付けの対象外とすべきキーワードを格納しておくリンク対象外記憶手段を備え、検索キーワードが入力された際に、上記リンク対象外記憶手段を参照し、当該検索キーワードがリンク対象外キーワードに該当するか否かを判定する処理と、検索キーワードがリンク対象外キーワードに該当しない場合のみ、抽出した各文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータを上記関連性記憶手段に格納する処理を実行することを特徴としている。
請求項8に記載した関連文書提示システムは、請求項1〜7のシステムであって、さらに上記関連文書リストには、関連文書毎に対応の検索キーワードが記述されていることを特徴としている。
請求項9に記載した関連文書提示プログラムは、コンピュータを、複数の文書ファイルが格納された文書ファイル記憶手段、文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータが格納される関連性記憶手段、検索キーワードが入力された際に、上記の文書ファイル記憶手段から当該検索キーワードをテキスト中に含む文書ファイルを抽出する手段、抽出した各文書ファイルの属性が列記された検索結果リストを含む画面を生成する手段、この画面を出力する手段、抽出した各文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータを、上記関連性記憶手段に格納する手段、上記文書ファイル記憶手段に格納された特定文書の閲覧リクエストが入力された際に、該当の文書ファイルを抽出する手段、当該文書ファイルのIDをキーに上記関連性記憶手段を検索し、当該文書ファイルに関連付けられた検索キーワードを特定する手段、上記関連性記憶手段を参照し、この検索キーワードに関連付けられた他の文書ファイルを特定する手段、各文書ファイルの属性が列記された関連文書リストを生成する手段、この関連文書リストと上記特定文書の内容を表示する画面を生成する手段、この画面を出力する手段として機能させることを特徴としている。
請求項1に記載した関連文書提示システム及び請求項9に記載した関連文書提示プログラムは、「検索キーワードにはユーザの意思や関心がこめられている」という仮定に則り、あるユーザが入力した検索キーワードに基づいて複数の文書が関連付けられ、以後、その中の一つの文書について同一ユーザあるいは他のユーザから閲覧リクエストがあった場合には、当該文書の内容が表示されると同時に、残りの関連文書も一覧表示される。このように、先行ユーザの検索結果を利用することにより、他のユーザは特に検索キーワードを意識することもなく、意外な関連性で結ばれた複数の文書を網羅的に閲覧可能となる。
また、文書間の関連付けは、意図的・作為的な関連付け作業を介することなく、検索キーワードの入力を契機として自動的に処理されるため、掲示板の投稿記事やブログ記事など件数が膨大となる文書ファイル同士を有効に関連付けることが可能となる。
請求項2に記載した関連文書提示システムにあっては、関連文書と検索キーワードの組合せ毎にレーティングポイントが登録され、関連文書リストを生成する際には合計ポイントの多い順に関連文書がソートされる仕組みを備えているため、レーティングポイントの付与方法に工夫を凝らすことにより、より重要度の高い関連文書をリストの上位に配置することが可能となる。
請求項3に記載した関連文書提示システムにあっては、検索ユーザが検索結果リストから特定文書の閲覧をリクエストした場合に、当該文書及び検索キーワードの組合せに対してレーティングポイントが付与され、関連文書リストを生成する際には合計ポイントの多い順に関連文書がソートされる仕組みを備えている。
検索ユーザ自身が、検索結果リスト中から閲覧をリクエストした文書は、関連文書中でも特に重要度が高いものと推定できるため、これにレーティングポイントを付与して関連文書リストにおける順位を上げることにより、他のユーザはより重要度の高い関連文書を選択的に閲覧可能となる。
請求項4に記載した関連文書提示システムにあっては、検索ユーザまたは他のユーザが関連文書リストから特定の関連文書の閲覧をリクエストした場合に、当該文書及び検索キーワードの組合せに対してレーティングポイントが付与される仕組みを備えている。ユーザが関連文書リスト中から閲覧をリクエストした文書は、関連文書中でも比較的重要度が高いものと推定できるため、これにレーティングポイントを付与して関連文書リストにおける順位を上げることにより、他のユーザはより重要度の高い関連文書を選択的に閲覧可能となる。
請求項5に記載した関連文書提示システムにあっては、検索ユーザまたは他のユーザが関連文書リストから特定の関連文書の閲覧をリクエストした場合に、当該文書の閲覧時間を計測し、この閲覧時間の長短に応じて異なるレーティングポイントが関連文書及び検索キーワードの組合せに対して付与される仕組みを備えている。一般に、ユーザによる閲覧時間が長い文書ほど重要度が高いものと推定できるため、これに高いレーティングポイントを付与して関連文書リストにおける順位を上げることにより、他のユーザはより重要度の高い文書を選択的に閲覧可能となる。
請求項6に記載した関連文書提示システムにあっては、検索ユーザまたは他のユーザが関連文書リストから特定の関連文書の閲覧をリクエストした場合に、当該関連文書の重要度について問う選択肢が表示され、その回答データが示す重要度の高低に応じて異なるレーティングポイントを関連文書及び検索キーワードの組合せに対して付与することが可能な仕組みを備えている。このため、先行ユーザの評価を関連文書リストの順位に反映させることが可能となり、他のユーザはより重要度の高い文書を選択的に閲覧可能となる。
請求項7に記載した関連文書提示システムによれば、ユーザによって入力された検索キーワードが、リンク対象外記憶手段に予め登録された対象外キーワードに該当する場合には、関係付けデータの登録がスキップされる仕組みを備えている。この結果、単なる「あ」や「A」、「1」のように、ユーザの意思や関心がこめられているとは思えない、無意味な検索キーワードに基づいて文書同士の関連付けがなされることを有効に回避できる。
請求項8に記載した関連文書提示システムによれば、関連文書リストに列記された関連文書毎に、当該関連文書と特定文書とを紐付けている検索キーワードが表示されるため、ユーザは特定文書と各関連文書間の関係性について一目で認識可能となる。
図1は、この発明に係る関連文書提示システム10の機能構成を示すブロック図であり、データ管理部12と、文書ファイル記憶部14と、検索実施テーブル16と、関連性テーブル18と、関連ポイントテーブル20と、リンク対象外テーブル22とを備えている。
このシステム10には、Webサーバ24が接続されており、このWebサーバ24は、インターネットやイントラネット等のネットワーク26を介して複数のクライアント端末28と接続されている。
このWebサーバ24は、ネットワーク26経由でSNSサービスを各クライアント28に提供する機能を備えている。ここで「SNS」とは、Social Networking Serviceの略であり、Webサイト上で会員制の閉じたコミュニティを形成し、掲示板への投稿や日記の相互閲覧を可能とするものである。会員の投稿した記事や日記等のテキストファイルは、データ管理部12を介して文書ファイル記憶部14に蓄積される。
上記のデータ管理部12は、サーバコンピュータのCPUが、OS及び専用のアプリケーションプログラムに従い、必要な処理を実行することによって実現される。
また、上記の文書ファイル記憶部14、検索実施テーブル16、関連性テーブル18、関連ポイントテーブル20、リンク対象外テーブル22は、同コンピュータのハードディスクに格納されている。
上記の検索実施テーブル16には、図2(a)に示すように、検索実施連番、検索キーワード、検索日時、検索実施ユーザIDのデータ項目が設定されている。また、上記の関連性テーブル18には、図2(b)に示すように、検索キーワード、関連文書ID、登録日時のデータ項目が設定されている。上記の関連ポイントテーブル20には、図2(c)に示すように、検索キーワード、関連文書ID、閲覧ユーザID、レーティングポイント、登録日時のデータ項目が設定されている。さらに、上記のリンク対象外テーブル22には、図2(d)に示すように、対象外キーワード、登録日時、登録ユーザIDのデータ項目が設定されている。
つぎに、図3のフローチャートに従い、このシステム10における文書間の関連付け工程について説明する。
まずユーザが、Webサーバ24によって提供されるSNSサービスにログインし、記事検索用のキーワード入力フィールド(図示省略)に任意の文字列(例えば「特許」)を入力して検索ボタンをクリックすると、クライアント端末28からWebサーバ24に検索リクエストが送信される。
この検索リクエストをWebサーバ24経由で受け取ったデータ管理部12は(S10)、検索実施内容を登録する(S12)。具体的には、検索実施連番、検索キーワード、検索日時、検索実施ユーザIDからなるレコードを、検索実施テーブル16に追加する。
つぎにデータ管理部12は、文書ファイル記憶部14から「特許」の文字列をテキスト中に含む文書ファイルを抽出すると共に(S14)、各文書ファイルのタイトル、作成者、作成年月日等が列記されたリストを生成し、Webサーバ24経由でクライアント端末28に送信する(S16)。
同時にデータ管理部12は、関連付けデータを生成し、関連性テーブル18に登録する(S18)。
図4は、関連付けデータの一例を示すものであり、検索キーワードのデータ項目には今回の「特許」が記述され、関連文書IDのデータ項目には抽出された各文書ファイルのIDが記述されている。
なお、データ管理部12は、関連付けデータを生成する際にリンク対象外テーブル22を参照し、今回の検索キーワードが予め登録された対象外キーワードに該当するか否かをチェックする。
すなわち、リンク対象外テーブル22には、単なる「あ」や「A」、「1」のように、意味をなさない無視すべき文字列が対象外キーワードとして予め多数登録されており、ユーザが検索対象として入力したキーワードがこれらの対象外キーワードと一致する場合には、関連付けデータの登録処理をスキップする。
この結果、ユーザが誤入力あるいは試し入力したような、意味のないキーワードについてまで、関連付けデータが登録されることを回避できる。
Webサーバ24から検索結果のリストを受信したクライアント端末28では、Webブラウザ上に当該検索結果のリストが表示される。
そして、このリスト中の特定の文書のタイトルをユーザがクリックすると、当該文書の閲覧リクエストが、クライアント端末28からWebサーバ24に送信される。
この閲覧リクエストをWebサーバ24経由で受け取ったデータ管理部12は(S20)、関連ポイントテーブル20にレーティングポイントを登録する(S22)。具体的には、検索キーワード、関連文書ID(ユーザが閲覧をリクエストした文書のID)、閲覧ユーザのID、所定のレーティングポイント、登録日時を記述したレコードを生成し、関連ポイントテーブル20に追加する。
上記のレーティングポイントとしては、例えば1ポイントが付与される。
つぎにデータ管理部12は、リクエストされた文書のテキストファイルを文書ファイル記憶部14から抽出し、Webサーバ24経由でクライアント端末28に送信する(S24)。
この結果、クライアント端末28上にWebブラウザの別窓が開き、文書ファイルの全文が表示される。
つぎにデータ管理部12は、ユーザによる当該文書の閲覧時間の計測を開始し(S26)、所定の閲覧終了動作を検出した時点で、閲覧時間を確定する(S28)。
例えば、クライアント端末28から送信された、ユーザが文書の全文表示画面から元の文書リスト画面に戻って来たことを示すイベントを検知した時点で、データ管理部12はユーザによる当該文書の閲覧が終了したものと判断する。
つぎにデータ管理部12は、ユーザによる閲覧時間をポイント変換テーブルに当てはめてレーティングポイントを特定する(S30)。この変換テーブルには、図5に示すように、閲覧時間とポイントとの対応関係が定義されており、例えば、今回の閲覧時間が10分であった場合には、15ポイントが認定される。
つぎにデータ管理部12は、この閲覧時間に対応したレーティングポイントを、関連ポイントテーブル20に登録する(S32)。具体的には、上記と同様、検索キーワード、関連文書ID(ユーザが閲覧した文書のID)、閲覧ユーザのID、今回のレーティングポイント、登録日時を記述したレコードを生成し、関連ポイントテーブル20に追加する。
以上のようにして、各ユーザが文書ファイルの検索をリクエストする度に、データ管理部12によって検索処理が実行されると同時に、検索結果としてリストアップされた各文書ファイルと当該検索キーワードとの関連付けが実行される。したがって、一つの文書ファイルが複数の検索キーワードと関連付けられることも、当然にあり得る。
また、同じ検索キーワードが複数のユーザによって何度も入力されることが予想されるが、データ管理部12はその度に関連付けデータを上書き登録し、登録日時を更新する。したがって、「同一検索キーワード×同一関連文書ID」からなるレコードが重複して存在することはない。
つぎに、図6のフローチャートに従い、このシステム10における関連文書の提示工程について説明する。
まずユーザが、Webサーバ24によって提供されるSNSサービスにログインし、他の会員が書いた日記のタイトルをクリックすると、クライアント端末28からWebサーバ24に当該文書の閲覧リクエストが送信される。
この閲覧リクエストをWebサーバ24経由で受け取ったデータ管理部12は(S50)、ユーザが選択した特定文書のテキストファイルを文書ファイル記憶部14から抽出する(S52)。
つぎにデータ管理部12は、特定文書のIDをキーに関連性テーブル18を検索し、当該文書に関連付けられた1または複数の検索キーワードを取得する(S54)。
つぎにデータ管理部12は、取得した各検索キーワードをキーに関連性テーブル18を検索し、各検索キーワードに関連付けられた他の複数の文書(関連文書)のIDを取得する(S56)。
つぎにデータ管理部12は、関連ポイントテーブル20を参照し、各関連文書の検索キーワード毎のレーティングポイントを集計し、その総計を算出した後(S58)、レーティングポイントの高い順に各関連文書を検索キーワード単位で整列させる(S60)。
つぎにデータ管理部12は、各関連文書のタイトル、作成者、作成年月日等を列挙したリストを生成する(S62)。
上記の特定文書ファイル及び当該文書の関連文書リストは、Webサーバ24によって文書表示画面用のWebファイルに成形され、クライアント端末28に送信される(S64)。
図7は、クライアント端末28のWebブラウザ上に表示されたSNSのWebページを示しており、中央部に設けられた文書表示欄30には、ユーザが閲覧をリクエストした特定文書の全文が表示されている。また、その右側には、当該文書に関連する文書のタイトル、作成者、作成年月日を列記した関連文書リスト32が表示されている。
また、各関連文書には検索キーワード(ここでは「特許」)が表示されているため、ユーザは現在表示されている特定文書と各関連文書とが、「特許」というキーワードを共有することによって関連付けられたという事実を認識することができる。
ここで、ユーザが関連文書リスト32中の一つのタイトルをクリックすると、当該関連文書の閲覧リクエストが、クライアント端末28からWebサーバ24に送信される。
この関連文書の閲覧リクエストをWebサーバ24経由で受け取ったデータ管理部12は(S66)、関連ポイントテーブル20に、検索キーワード、ユーザが閲覧をリクエストした関連文書のID、当該ユーザのID、所定のレーティングポイント、登録日時からなるレコードを追加する(S68)。この場合、レーティングポイントとして例えば1ポイントが付与される。
つぎにデータ管理部12は、リクエストされた関連文書のテキストファイルを文書ファイル記憶部14から抽出し、Webサーバ24経由でクライアント端末28に送信する(S70)。
この結果、クライアント端末28上にWebブラウザの別窓が開き、関連文書ファイルの全文が表示される。
つぎにデータ管理部12は、ユーザによる当該関連文書の閲覧時間の計測を開始し(S72)、所定の閲覧終了動作を検出した時点で閲覧時間を確定する(S74)。
例えば、ユーザが関連文書の全文表示画面から元の関連文書リストが表示された画面に戻って来たことを、クライアント端末28から送信された、ユーザが文書の全文表示画面から元の文書リスト画面に戻って来たことを示すイベントを検知した時点で、データ管理部12はユーザによる関連文書の閲覧が終了したものと判断する。
つぎにデータ管理部12は、ユーザによる閲覧時間を図5のポイント変換テーブルに当てはめて、レーティングポイントを特定する(S76)。例えば、今回の閲覧時間が3分であった場合には、5ポイントが認定される。
つぎにデータ管理部12は、この閲覧時間に対応したレーティングポイントを、関連ポイントテーブル20に登録する(S78)。
今回、ユーザによる関連文書の閲覧行為によって、当該関連文書の「特許」という検索キーワードに係るレーティングポイントがアップする結果、次回、他のユーザが「特許」というキーワードを含む何れかの文書を表示させた際には、更新後のレーティングポイントが反映され、関連文書リスト32中における順位が上昇することとなる。
図7においては、「特許」という検索キーワードで関連付けられた関連文書のリストのみが表示されているが、閲覧中の文書が複数の検索キーワードを介して他の文書と関連付けられている場合には、検索キーワード毎に関連文書リストが表示されることとなる。
この際、最初に検索キーワード毎に関連文書の件数が表示され、ユーザが特定の検索キーワードを選択した時点で当該検索キーワードに係る関連文書リストが展開するように構成することができる。
あるいは、検索キーワード単位で関連文書リストを区切って表示する代わりに、全関連文書をレーティングポイントの大きい順に混在させたリストを表示させてもよい。この場合も、それぞれの関連文書には対応の検索キーワードが明示されるため、ユーザは閲覧中の文書と関連文書との関係について認識することができる。
上記にあっては、ユーザによる関連文書の閲覧時間の長短に応じて、異なるレーティングポイントが付与される例を示したが、レーティングポイントの付与方法はこれに限定されるものではない。
例えば、図8に示すように、文書表示欄30の下方に関連文書の重要度について質問するアンケート欄34を設けておき、閲覧したユーザに「1.とても参考になった/2.参考になった/3.普通/4.あまり参考にならなかった/5.まったく関係なかった」の選択肢の中から評価を選択させるようにしてもよい。
この場合、データ管理部12はクライアント端末28から送信されたアンケートの回答データをポイント変換テーブルに当てはめて、レーティングポイントを特定する。
図の例では「5.まったく関係なかった」が選択されているため、データ管理部12は「−10」ポイントのレーティングポイントを関連ポイントテーブル20に登録する。この結果、当該文書のトータルのレーティングポイントが低下し、次回表示時における関連文書リスト32中の順位が下がることとなる。
これに対し、ユーザが「1.とても参考になった」を選択した場合、データ管理部12は「10」ポイントのレーティングポイントを関連ポイントテーブル20に登録する。この結果、当該文書のトータルのレーティングポイントが上昇し、次回表示時における関連文書リスト32中の順位が上がることとなる。
データ管理部12は、関連性テーブル18に登録された既存の検索キーワードに基づいて、文書ファイル記憶部14内の文書ファイルに対する検索処理を定期的に実施し、関連性テーブル18に新たなレコードを追加する処理を実行する。
この結果、後から発生した文書ファイルに対しても、既存の検索キーワードとの関連付けがなされる。
この発明に係る関連文書提示システムの機能構成を示すブロック図である。 検索実施テーブル、関連性テーブル、関連ポイントテーブル、リンク対象外テーブルのデータ項目を示す図である。 文書間の関連付け工程を示すフローチャートである。 関連性テーブルに登録されたレコードの具体例を示す図である。 ポイント変換テーブルの具体例を示す図である。 関連文書の提示工程を示すフローチャートである。 文書表示欄及び関連文書リストを備えたWebページの一例を示す図である。 アンケート欄及びポイント変換テーブルの具体例を示す図である。
符号の説明
10 関連文書提示システム
12 データ管理部
14 文書ファイル記憶部
16 検索実施テーブル
18 関連性テーブル
20 関連ポイントテーブル
22 リンク対象外テーブル
24 Webサーバ
26 ネットワーク
28 クライアント端末
30 文書表示欄
32 関連文書リスト
34 アンケート欄

Claims (9)

  1. 複数の文書ファイルが格納された文書ファイル記憶手段と、
    文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータが格納される関連性記憶手段とを備え、
    検索キーワードが入力された際に、上記の文書ファイル記憶手段から当該検索キーワードをテキスト中に含む文書ファイルを抽出する処理と、
    抽出した各文書ファイルの属性が列記された検索結果リストを含む画面を生成する処理と、
    この画面を出力する処理と、
    抽出した各文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータを、上記関連性記憶手段に格納する処理と、
    上記文書ファイル記憶手段に格納された特定文書の閲覧リクエストが入力された際に、該当の文書ファイルを抽出する処理と、
    当該文書ファイルのIDをキーに上記関連性記憶手段を検索し、当該文書ファイルに関連付けられた検索キーワードを特定する処理と、
    上記関連性記憶手段を参照し、この検索キーワードに関連付けられた他の文書ファイルを特定する処理と、
    各文書ファイルの属性が列記された関連文書リストを生成する処理と、
    この関連文書リストと上記特定文書の内容を表示する画面を生成する処理と、
    この画面を出力する処理と、
    を実行することを特徴とする関連文書提示システム。
  2. 文書ファイルのIDと検索キーワードとの組合せに対して、所定のレーティングポイントを関連付けた関連ポイントデータを格納しておく関連ポイント記憶手段を備え、
    上記関連文書リストを生成するに際し、この関連ポイント記憶手段を参照し、文書ファイルIDと検索キーワードの組合せ毎にレーティングポイントの総計を算出する処理と、
    レーティングポイントの大きい順に関連文書を整列させた関連文書リストを生成する処理を実行することを特徴とする請求項1に記載の関連文書提示システム。
  3. 上記検索結果リスト中の特定文書の閲覧リクエストが入力された際に、当該文書ファイルのIDと検索キーワードとの組合せに対して所定のレーティングポイントを関連付けた関連ポイントデータを生成し、上記関連ポイント記憶手段に格納する処理を実行することを特徴とする請求項2に記載の関連文書提示システム。
  4. 上記関連文書リスト中の特定の関連文書の閲覧リクエストが入力された際に、当該関連文書ファイルのIDと検索キーワードとの組合せに対して所定のレーティングポイントを関連付けた関連ポイントデータを生成し、上記関連ポイント記憶手段に格納する処理を実行することを特徴とする請求項2または3に記載の関連文書提示システム。
  5. 上記検索結果リストまたは関連文書リスト中の特定文書の閲覧リクエストが入力された際に、上記文書ファイル記憶手段から該当の文書ファイルを抽出し、その内容を表示する画面を生成する処理と、
    この画面を出力する処理と、
    画面出力と同時に閲覧時間の計測を開始し、ユーザによる所定の閲覧終了動作を検知した時点で閲覧時間を確定する処理と、
    閲覧時間とレーティングポイントとの対応関係が定義されたポイント変換テーブルを参照し、レーティングポイントを特定する処理と、
    当該文書ファイルのIDと検索キーワードとの組合せに対して上記のレーティングポイントを関連付けた関連ポイントデータを生成し、上記関連ポイント記憶手段に格納する処理を実行することを特徴とする請求項2〜4の何れかに記載の関連文書提示システム。
  6. 上記検索結果リストまたは関連文書リスト中の特定文書の閲覧リクエストが入力された際に、上記文書ファイル記憶手段から該当の文書ファイルを抽出し、その内容が表示されると共に、当該文書の重要度を問う複数の選択肢が記述された画面を生成する処理と、
    この画面を出力する処理と、
    特定の選択肢を選択する回答データが入力された際に、各選択肢とレーティングポイントとの対応関係が定義されたポイント変換テーブルを参照し、レーティングポイントを特定する処理と、
    当該文書ファイルのIDと検索キーワードとの組合せに対して上記のレーティングポイントを関連付けた関連ポイントデータを生成し、関連ポイント記憶手段に格納する処理を実行することを特徴とする請求項2〜5の何れかに記載の関連文書提示システム。
  7. 予め関連付けの対象外とすべきキーワードを格納しておくリンク対象外記憶手段を備え、
    検索キーワードが入力された際に、上記リンク対象外記憶手段を参照し、当該検索キーワードがリンク対象外キーワードに該当するか否かを判定する処理と、
    検索キーワードがリンク対象外キーワードに該当しない場合のみ、抽出した各文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータを上記関連性記憶手段に格納する処理を実行することを特徴とする請求項1〜6の何れかに記載の関連文書提示システム。
  8. 上記関連文書リストには、関連文書毎に対応の検索キーワードが記述されていることを特徴とする請求項1〜7の何れかに記載の関連文書提示システム。
  9. コンピュータを、
    複数の文書ファイルが格納された文書ファイル記憶手段、
    文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータが格納される関連性記憶手段、
    検索キーワードが入力された際に、上記の文書ファイル記憶手段から当該検索キーワードをテキスト中に含む文書ファイルを抽出する手段、
    抽出した各文書ファイルの属性が列記された検索結果リストを含む画面を生成する手段、
    この画面を出力する手段、
    抽出した各文書ファイルのIDと検索キーワードとの組合せからなる関連付けデータを、上記関連性記憶手段に格納する手段、
    上記文書ファイル記憶手段に格納された特定文書の閲覧リクエストが入力された際に、該当の文書ファイルを抽出する手段、
    当該文書ファイルのIDをキーに上記関連性記憶手段を検索し、当該文書ファイルに関連付けられた検索キーワードを特定する手段、
    上記関連性記憶手段を参照し、この検索キーワードに関連付けられた他の文書ファイルを特定する手段、
    各文書ファイルの属性が列記された関連文書リストを生成する手段、
    この関連文書リストと上記特定文書の内容を表示する画面を生成する手段、
    この画面を出力する手段、
    として機能させることを特徴とする関連文書提示プログラム。
JP2007176526A 2007-07-04 2007-07-04 関連文書提示システム及びプログラム Pending JP2009015589A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007176526A JP2009015589A (ja) 2007-07-04 2007-07-04 関連文書提示システム及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007176526A JP2009015589A (ja) 2007-07-04 2007-07-04 関連文書提示システム及びプログラム

Publications (1)

Publication Number Publication Date
JP2009015589A true JP2009015589A (ja) 2009-01-22

Family

ID=40356418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007176526A Pending JP2009015589A (ja) 2007-07-04 2007-07-04 関連文書提示システム及びプログラム

Country Status (1)

Country Link
JP (1) JP2009015589A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218343A (ja) * 2009-03-18 2010-09-30 Konica Minolta Business Technologies Inc 情報提供方法、情報提供装置、およびコンピュータプログラム
JP2010237900A (ja) * 2009-03-31 2010-10-21 Fujitsu Business Systems Ltd 分析支援処理装置およびそのプログラム
JP2013114485A (ja) * 2011-11-29 2013-06-10 Ge Medical Systems Global Technology Co Llc 医療用画像表示システム
WO2016027372A1 (ja) * 2014-08-22 2016-02-25 株式会社日立製作所 自己産出的情報処理システムおよび方法
KR20220127993A (ko) * 2021-03-12 2022-09-20 주식회사 한글과컴퓨터 동시 사용 기준을 기초로 특정 문서와 연관된 다른 연관 문서들의 정보를 제공할 수 있는 전자 단말 장치 및 그 동작 방법
CN117131256A (zh) * 2023-10-26 2023-11-28 环球数科集团有限公司 一种基于aigc的媒体管理系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS648440A (en) * 1987-07-01 1989-01-12 Hitachi Ltd Automatic retrieving system for document
JP2005196336A (ja) * 2004-01-05 2005-07-21 Dainippon Printing Co Ltd キーワード設定装置及びキーワード検索装置等
JP2005242760A (ja) * 2004-02-27 2005-09-08 Toppan Forms Co Ltd 情報検索支援方法並びにこの方法を使用した情報検索支援システムおよびサーバ
JP2005327006A (ja) * 2004-05-13 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> 情報フィルタリング装置及び方法
JP2006078872A (ja) * 2004-09-10 2006-03-23 Mitsubishi Electric Corp 地図データ処理システム
JP2007148689A (ja) * 2005-11-25 2007-06-14 Nippon Telegr & Teleph Corp <Ntt> 操作検索方法及び装置及びコンピュータ読み取り可能な記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS648440A (en) * 1987-07-01 1989-01-12 Hitachi Ltd Automatic retrieving system for document
JP2005196336A (ja) * 2004-01-05 2005-07-21 Dainippon Printing Co Ltd キーワード設定装置及びキーワード検索装置等
JP2005242760A (ja) * 2004-02-27 2005-09-08 Toppan Forms Co Ltd 情報検索支援方法並びにこの方法を使用した情報検索支援システムおよびサーバ
JP2005327006A (ja) * 2004-05-13 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> 情報フィルタリング装置及び方法
JP2006078872A (ja) * 2004-09-10 2006-03-23 Mitsubishi Electric Corp 地図データ処理システム
JP2007148689A (ja) * 2005-11-25 2007-06-14 Nippon Telegr & Teleph Corp <Ntt> 操作検索方法及び装置及びコンピュータ読み取り可能な記録媒体

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218343A (ja) * 2009-03-18 2010-09-30 Konica Minolta Business Technologies Inc 情報提供方法、情報提供装置、およびコンピュータプログラム
JP2010237900A (ja) * 2009-03-31 2010-10-21 Fujitsu Business Systems Ltd 分析支援処理装置およびそのプログラム
JP2013114485A (ja) * 2011-11-29 2013-06-10 Ge Medical Systems Global Technology Co Llc 医療用画像表示システム
WO2016027372A1 (ja) * 2014-08-22 2016-02-25 株式会社日立製作所 自己産出的情報処理システムおよび方法
JPWO2016027372A1 (ja) * 2014-08-22 2017-06-01 株式会社日立製作所 自己産出的情報処理システムおよび方法
KR20220127993A (ko) * 2021-03-12 2022-09-20 주식회사 한글과컴퓨터 동시 사용 기준을 기초로 특정 문서와 연관된 다른 연관 문서들의 정보를 제공할 수 있는 전자 단말 장치 및 그 동작 방법
KR102545262B1 (ko) 2021-03-12 2023-06-20 주식회사 한글과컴퓨터 동시 사용 기준을 기초로 특정 문서와 연관된 다른 연관 문서들의 정보를 제공할 수 있는 전자 단말 장치 및 그 동작 방법
CN117131256A (zh) * 2023-10-26 2023-11-28 环球数科集团有限公司 一种基于aigc的媒体管理系统
CN117131256B (zh) * 2023-10-26 2023-12-26 环球数科集团有限公司 一种基于aigc的媒体管理系统

Similar Documents

Publication Publication Date Title
US8612416B2 (en) Domain-aware snippets for search results
US8745067B2 (en) Presenting comments from various sources
KR101667344B1 (ko) 검색 결과들을 제공하는 방법 및 시스템
US20080059897A1 (en) Method and system of social networking through a cloud
US20070233715A1 (en) Resource management system, method and program for selecting candidate tag
JP4962945B2 (ja) ブックマーク・タグ設定装置
US20100161592A1 (en) Query Intent Determination Using Social Tagging
US20120271810A1 (en) Method for inputting and processing feature word of file content
JP2012256368A (ja) 検索結果にコレクションアイテムを含めるための技術
KR20080024208A (ko) 검색 결과를 제공하기 위한 시스템 및 방법
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
US20090216724A1 (en) Network resources structuring system
JP2007272872A (ja) 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
JP5237353B2 (ja) 検索装置、検索システム、検索方法、検索プログラム、及び検索プログラムを記憶するコンピュータ読取可能な記録媒体
US20110238653A1 (en) Parsing and indexing dynamic reports
JP2006099341A (ja) 更新履歴生成装置及びプログラム
JP2010257453A (ja) サーチクエリデータを用いて文書にタグ付けするシステム
JP2010128928A (ja) 検索システム及び検索方法
JP2009015589A (ja) 関連文書提示システム及びプログラム
US20160042080A1 (en) Methods, Systems, and Apparatuses for Searching and Sharing User Accessed Content
US8843488B1 (en) Nested display of contextual search results
US20080294626A1 (en) Method and apparatus for leveraged search and discovery - leveraging properties of trails and resources within
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2009205588A (ja) ページ検索システム及びプログラム
JP5407336B2 (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120821