JP2004086847A - 電子ドキュメント評価システム - Google Patents

電子ドキュメント評価システム Download PDF

Info

Publication number
JP2004086847A
JP2004086847A JP2003004952A JP2003004952A JP2004086847A JP 2004086847 A JP2004086847 A JP 2004086847A JP 2003004952 A JP2003004952 A JP 2003004952A JP 2003004952 A JP2003004952 A JP 2003004952A JP 2004086847 A JP2004086847 A JP 2004086847A
Authority
JP
Japan
Prior art keywords
information
search
evaluation
electronic documents
electronic document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003004952A
Other languages
English (en)
Inventor
Takashi Nishi
西 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2003004952A priority Critical patent/JP2004086847A/ja
Publication of JP2004086847A publication Critical patent/JP2004086847A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数の電子ドキュメントをユーザに容易に相対評価させ得る電子ドキュメント評価システムを提供する。
【解決手段】本発明は、複数の電子ドキュメントを相対評価し得る評価情報を得る電子ドキュメント評価システムである。そして、各電子ドキュメントを検索し、各電子ドキュメントにおける検索条件に合致する内容量の多少を表す合致量パラメータを得る情報検索手段と、当該情報検索手段が得た各電子ドキュメントの合致量パラメータに基づいて、ユーザに提示する評価情報を生成する評価情報生成手段とを備えることを特徴とする。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は電子ドキュメント評価システムに関し、例えば、メールマガジンなどの複数の情報(例えば記事)を含む電子ドキュメントを相対評価又は絶対評価するシステムに適用し得るものである。
【0002】
【従来の技術】
近年、インターネットの普及に伴い、趣味や娯楽の範疇はもとより各種業界のビジネス情報など様々なジャンルのWebページがある。また、このような情報をメールマガジンとして発行しているものも多い。
【0003】
ユーザが必要な情報を例えばメールマガジンで得たいときに使われるサービスとして、既刊メールマガジンに対して検索する検索サービスが知られている。これは、従来、メールマガジンのタイトルのみを検索対象としていたが、特許文献1に記載されているように、タイトルのみならず、メールマガジン本文も検索対象とすることで、所望の既刊メールマガジンの検索ができるものである。以下にその方法を記す。
【0004】
【特許文献1】
特開2002−82952号公報
図2は、この公報に係る従来技術の情報検索システムの構成を示すブロック図である。
【0005】
このシステムは、インターネットなどのネットワークを介して互いに接続されるユーザ1、及び、例えばサービス事業者が提供する情報検索装置2を有する。
【0006】
ユーザ1は、例えば、Webブラウザを搭載したクライアント端末201(例えばパソコン;以下、クライアントと呼ぶ)を備えている。情報検索装置2は、インターネットやローカルエリアネットワーク(LAN)に接続された機器などと情報の受け渡しなどをする機能を持つセンターサーバ202と、与えられた検索キーワードなどの検索条件を用いて情報を検索する機能を持つ検索エンジン203と、メールマガジンのタイトル、本文を蓄積するデータベース204とにより構成され、これら構成要素202〜204は、例えば、LANによって接続されている。
【0007】
このシステムでは、まず、ユーザ1のクライアント201がインターネットなどのネットワークを介して情報検索装置2のセンターサーバ202にアクセスして検索キーワードなどの検索条件を入力すると、センターサーバ202は、その検索条件を受けて検索エンジン203に送出すると共に、当該検索条件をデータベース204に保存する。
【0008】
一方、検索エンジン203は、与えられた検索条件、例えば、検索キーワード及びユーザ1が指定する検索態様に基づき、データベース204に蓄積された既刊メールマガジン(バックナンバ)の内から検索キーワードを含むタイトルを検索し、その結果をセンターサーバ202が受信してユーザ1に提示する。
【0009】
これにより、ユーザ1では、クライアント201が検索該当個所を含むタイトルを一覧表示する。この一覧表示では、検索該当個所には対応するメールマガジン本文にリンクが張られる。
【0010】
そして、ユーザ1がいずれかのリンクを選択すべくクリック操作すると、センターサーバ202が検索エンジン203に対応するメールマガジン本文の検索を依頼し、これに応じて検索エンジン203はリンク先のメールマガジン本文をデータベース204から抽出してセンターサーバ202に引き渡す。
【0011】
センターサーバ202は、検索エンジン203が抽出したメールマガジン本文をクライアント201側に閲覧可能な形式に変換する。これにより、クライアント201では、メールマガジン本文が閲覧可能となる。
【0012】
【発明が解決しようとする課題】
しかしながら、上述の従来システムにおいては、対象メールマガジンのリンクを表示する場合の順序が必ずしも優先順位を示すものではないので、ユーザが全てをチェックする必要があり、効率が悪くなる。
【0013】
例えば、複数の新聞記事情報が記載されているメールマガジンを複数取っている場合に、検索キーワードを含む記事が多いメールマガジンからチェックする方が効率が良い。また、完全でなくてもキーワードを含む記事をほぼチェックできれば良い場合に、どこまでメールマガジンをチェックすれば良いのか、従来の技術では判定できない。
【0014】
このような課題は、検索結果などを携帯電話に送信する場合には、特に大きな課題として挙げられる。
【0015】
そのため、電子ドキュメントにおける所望する情報内容の多少などを容易に評価できるような電子ドキュメント評価システムが求められている。
【0016】
【課題を解決するための手段】
本発明は、複数の電子ドキュメントを相対評価し得る評価情報を得る電子ドキュメント評価システムであって、上記各電子ドキュメントを検索し、上記各電子ドキュメントにおける検索条件に合致する内容量の多少を表す合致量パラメータを得る情報検索手段と、当該情報検索手段が得た上記各電子ドキュメントの合致量パラメータに基づいて、ユーザに提示する上記評価情報を生成する評価情報生成手段とを備えることを特徴とする。
【0017】
【発明の実施の形態】
(A)第1の実施形態
以下、本発明による電子ドキュメント評価システムを、メールマガジン(電子ドキュメントの一種)の評価システムに適用した第1の実施形態を図面を参照しながら説明する。
【0018】
(A−1)第1の実施形態の構成
図1は、第1の実施形態の電子ドキュメント評価システムの構成を示すブロック図である。
【0019】
この電子ドキュメント評価システムは、インターネットやLANなどのネットワークを介して互いに接続される、ユーザ1のクライアント201と、インターネットやLANに接続された機器などとの情報の受け渡しなどをする機能と規則に従って表示順を変更する機能を有するセンターサーバ102と、メールマガジンのタイトルや本文などを蓄積するデータベース204と、情報占有率判定装置100とからなる。
【0020】
クライアント201は、詳細構成の図示は省略するが、例えばWebブラウザを搭載したパソコンなどの情報処理端末である。
【0021】
センターサーバ102は、詳細構成の図示は省略するが、例えばプロバイダサーバであってプロバイダサーバとしての一般的なハードウェア構成を有する。
【0022】
データベース204は、ハードウェア的には、大容量の記憶装置と、そのアクセス構成と、通信構成などを有する情報処理装置である。
【0023】
情報占有率判定装置100は、例えば、1台又は複数台の通信機能を備えたパソコン又はそれより上位の情報処理装置であり、機能的には、情報検索部103及び占有率演算部105(搭載されたソフトウェアや、それによって駆動されるハードウェアによる機能分け)を有する。
【0024】
なお、情報検索部103及び占有率演算部105が別個の情報処理装置で構成されている場合には、これらはLANなどによって接続される。また、センターサーバ102に、情報占有率判定装置100の機能を併せて持たせるようにしても良い。
【0025】
情報検索部103は、与えられた検索キーワードなどを用いて情報を検索する機能と、メールマガジン数若しくは各メールマガジンに記載されている各情報の数を蓄積する機能と、検索条件に一致する情報数を蓄積する機能などを持つ。
【0026】
占有率演算部105は、メールマガジンに記載されている中の検索された情報の全情報に対する占有率などを演算するものである。占有率の演算対象の情報や全情報の定義については、以下の動作説明で明らかにする。
【0027】
(A−2)第1の実施形態の動作
次に、上述した構成を有する第1の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)の動作を説明する。
【0028】
まず、ユーザ1のクライアント201がインターネットなどのネットワークを介してセンターサーバ102にアクセスして検索条件を入力すると、センターサーバ102は、その検索条件を受けて情報検索部103に送出すると共に、当該検索条件をデータベース204に保存する。
【0029】
ここで、検索条件は、検索キーワードや、分野情報や、期間や、メールマガジンの発行日などであり、任意に組み合わせることができるものである。分野情報は、例えば、分野名称に対応した検索キーワード群の情報を、センターサーバ102が記憶しており、入力された分野名称を対応する検索キーワード群に変換して検索条件とする。
【0030】
なお、検索対象のメールマガジンの種類を指定するようにしても良く、メールマガジンの種類を指定せずに検索を指示するようにしても良い。また、検索するメールマガジンとしては、データベース204に格納されているものをだけに限らず、検索指示時に、インターネットなどを通じて取り出すようにしても良い。さらに、ユーザ1が購読申込みを行っているメールマガジンを検索対象とするようにしても良い。
【0031】
情報検索部103は、検索条件が与えられると、データベース204に蓄積されている既刊メールマガジン(バックナンバ)の中身を見て、例えばメールマガジン固有の形態に着目したフィルタにより情報(例えば記事)毎に切り分け、その情報毎に、与えられた検索条件(例えば、検索キーワードやユーザ1が指定する検索態様)に合致するか否かを判定する。すなわち、メールマガジン全体が検索条件に合致しているか否かを判定するのではなく、メールマガジンの各情報が検索条件に合致しているか否かを判定する。
【0032】
なお、メールマガジンを各情報(記事)に切り分ける方法としては、既存のいかなる方法を適用しても良い。
【0033】
情報検索部103は、メールマガジンの対象とした情報数(切り出した数)と、検索条件に合致した情報の数と、各メールマガジンを識別する識別子(例えば、メールマガジンのタイトル)とを共に蓄積する。
【0034】
図3は、情報検索部103に蓄積されたデータ内容の一例を示すものである。検索された各メールマガジン毎に、メールマガジンのタイトル、切り出した情報(記事)数、検索条件に合致した情報数のデータが蓄積される。例えば、「○○新聞メールマガジン」には、10件の情報が記載されており、その中で、ユーザ1が与えた検索条件に合致した情報数は7件であったことを示している。
【0035】
情報検索部103による検索が終了すると、センターサーバ102は、情報検索部103から、図3に示したようなデータを取得し、占有率演算部105に与える。
【0036】
データを受信した占有率演算部105は、各メールマガジンに記載されている情報数の和を計算し、情報の総数(全情報数)を得る。また、占有率演算部105は、各メールマガジンに記載されている検索条件に合致した情報数の和を計算し、合致情報の総数を得る。
【0037】
占有率演算部105は、各メールマガジンに記載されている検索条件に合致した情報数を、合致情報の総数で割ることにより、第1の占有率を求める。また、占有率演算部105は、合致情報の総数を、全情報数で割ることにより、第2の占有率を求める。
【0038】
第1の占有率によっては、各メールマガジンに、ユーザ1が必要とする情報がどのくらいの割合(例えば%表記)で記載されているかを知ることができるものである。第2の占有率によっては、ユーザ1が必要としている情報が全体の情報にどのくらいの割合(例えば%表記)で記載されているかを知ることができるものである。
【0039】
図4は、図3のデータ例に対し、第1の占有率及び第2の占有率を計算した結果を示している。計算方法は、次の通りである。
【0040】
3種類のメールマガジンの合致情報の総数は、7+1+2=10件である。例えば、「○○新聞メールマガジン」の場合、合致情報数7件であるので、第1の占有率は、7÷10=0.7(70%)となる。すなわち、この「○○新聞メールマガジン」には、ユーザ1が必要としている情報が70%だけ記載されていることが分かる。
【0041】
また、各メールマガジンに記載されている検索条件に合致した情報数(10件)を、情報の総数(ここでは、10+15+5=30件)で割ることにより、第2の占有率として、10÷30≒0.333(33.3%)が得られる。すなわち、これら全ての(3種類の)のメールマガジンには、ユーザ1が必要としている情報が33.3%だけ記載されていることが分かる。
【0042】
占有率演算部105の結果を受けて、センターサーバ102は、第1の占有率の順に、各メールマガジンのデータを並び替え、メールマガジンのタイトル、第1の占有率及び第2の占有率を含む表示情報(例えばHTML形式のデータ)を形成してクライアント201に送信する。なお、各メールマガジンのデータの並替え機能は、占有率演算部105が有していても良い。また、センターサーバ102は、メールマガジンのタイトル中に検索キーワードが含まれている場合には、その該当個所(以下、検索該当個所と呼ぶ)を区別する表示態様(例えば、表示色を変更する、下線を付与する)にするようにする。さらに、センターサーバ102は、検索条件に合致する情報を含むメールマガジンのタイトル(識別子)には、そのメールマガジンを取り出すことができるリンクを張る。
【0043】
センターサーバ102からの表示情報を受信したクライアント201は、例えば、検索該当個所を含むメールマガジンのタイトルや第1及び第2の占有率を一覧表示する。
【0044】
これにより、ユーザ1は、各メールマガジンに自己が所望する情報を含む割合を認識することができる。そして、ユーザ1は、恐らく、自己が所望する情報を含む割合が高いメールマガジンに係るリンクを選択すべく、クライアント201に対しクリック操作する。
【0045】
このとき、センターサーバ102は、情報検索部103に、対応するメールマガジン本文の検索(取り出し)を依頼し、これに応じて、情報検索部103は、リンク先のメールマガジン本文をデータベース204から抽出してセンターサーバ102に引き渡す。センターサーバ202では、情報検索部103が抽出したメールマガジン本文をクライアント201側に閲覧可能な形式に変換して送信する。クライアント201は、メールマガジン本文を表示させる。
【0046】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)によれば、複数のメールマガジンのそれぞれに記載されている検索条件に合致する情報の総和を必要な情報の100%であると想定し、それぞれのメールマガジンの合致情報占有率(カバー率;第1の占有率)を計算することで、各メールマガジンについて、ユーザが必要な情報のうちどれくらいをカバーできているかを判定(評価)することができる。すなわち、このことにより、必要な情報をどれくらいフォローできているかが一目でわかるようになる。
【0047】
そして、ユーザは、第1の占有率に基づき、効率良く、メールマガジンの本文(内容)を取り出すことができる。第1の占有率に基づき、最初に取り出したメールマガジンの本文の内容で所望する情報の内容が理解できた場合には、他のメールマガジンの本文を取り出すことを省略する場合も生じるであろう。
【0048】
また、各メールマガジンに記載されている検索条件に合致した情報数を、全てのメールマガジンの情報総数で割った第2の占有率も提示するようにしたので、全てのメールマガジンの情報総数と、第1の占有率(カバー率)との関係を、この第2の占有率を参照しながら、ユーザは把握することができる。
【0049】
(B)第2の実施形態
次に、本発明による電子ドキュメント評価システムを、メールマガジン(電子ドキュメントの一種)の評価システムに適用した第2の実施形態を図面を参照しながら説明する。
【0050】
(B−1)第2の実施形態の構成
図5は、第2の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には、同一、対応符号を付して示している。
【0051】
第2の実施形態が第1の実施形態と異なる部分は情報占有率判定装置100Aであり、第2の実施形態の情報占有率判定装置100Aは、情報検索部503及び占有率演算部105に加え、情報蓄積部504及び情報切り出し部506を有する。なお、情報検索部503の機能も、第1の実施形態の情報検索部103と一部異なっている。
【0052】
新たに設けられた情報切り出し部506は、例えば、データベース204に登録されているメールマガジンの中身を独立した情報(記事)毎に切り出す機能を有している。
【0053】
新たに設けられた情報蓄積部504は、情報切り出し部506で切り出された情報を、メールマガジンのタイトルなどの識別子と共に蓄積する機能を有する。
【0054】
なお、情報切り出し部506や情報蓄積部504は、独立した情報処理装置(パソコンなど)として構成されていても良く、1個の情報処理装置上に構成されていても良い。また、情報切り出し部506や情報蓄積部504が、情報検索部503又は占有率演算部105を構成する情報処理装置と同一の情報処理装置で構成されていても良い。
【0055】
第2の実施形態の情報検索部503は、詳細は動作説明で明らかにするが、情報蓄積部504との間で、データや指令を授受する機能を有している。
【0056】
(B−2)第2の実施形態の動作
次に、第2の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)の動作を説明する。以下では、主として、第2の実施形態での特有な動作について説明する。
【0057】
情報切り出し部506は、例えば、定期的に(1日1回所定時刻になると)、又は、データベース204から新しいメールマガジンの格納通知が与えられたときなどに、データベース204に蓄積されている切り出し未処理のメールマガジンの全体情報を取り出す。なお、データベース204が、新たなメールマガジンを格納させた際に、情報切り出し部506に対し、メールマガジンの全体情報を送信するようにしても良い。
【0058】
例えば、タイトルが同じでも発行日が異なるメールマガジンは別個のものと取扱うようにしても良く、この場合には、タイトルが同じでも発行日が異なる切り出し未処理のメールマガジンは、新たなメールマガジンとなる。
【0059】
情報切り出し部506は、切り出し未処理のメールマガジンの全体情報が与えられると、独立した各情報(記事)を切り出す。例えば、各メールマガジンは、記事間の境界を明示する行のキャラクタパターン等を有し、情報切り出し部506は、各メールマガジンに固有のそのような形態に着目したフィルタにより切り出す。
【0060】
情報切り出し部506によって切り出された各情報のデータは、メールマガジンの識別子(例えば、タイトル、タイトル及び発行日の組合せなど)と共に、情報蓄積部504に送信される。
【0061】
情報蓄積部504は、情報切り出し部506から与えられたメールマガジンの情報データを蓄積する。
【0062】
この第2の実施形態の場合、情報検索部503は、検索条件が与えられると、データベース204ではなく、情報蓄積部504をアクセスして、対象とするメールマガジンの情報毎に、与えられた検索条件に合致するか否かを判定し、対象とするメールマガジンにおける対象とした情報数(切り出した数)と、検索条件に合致した情報の数とを、各メールマガジンを識別する識別子と共に蓄積する。
【0063】
これ以降、第1及び第2の占有率をクライアント201に送信するまでの動作の流れは、第1の実施形態と同様であり、その説明は省略する。
【0064】
(B−3)第2の実施形態の効果
第2の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)によっても、第1の実施形態と同様な効果を奏することができる。
【0065】
これに加え、第2の実施形態によれば、各メールマガジンに記載されている独立した情報を、検索とは無関係なタイミングで予め切り出して蓄積しておくようにしたので、検索時には情報の切り出しを行う必要がなく、検索にかかる時間を短縮することができる。
【0066】
(C)第3の実施形態
次に、本発明による電子ドキュメント評価システムを、メールマガジン(電子ドキュメントの一種)の評価システムに適用した第3の実施形態を図面を参照しながら説明する。
【0067】
(C−1)第3の実施形態の構成
図6は、第3の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)の構成を示すブロック図であり、第2の実施形態に係る図5との同一、対応部分には、同一、対応符号を付して示している。
【0068】
第3の実施形態が第2の実施形態と異なる部分は情報占有率判定装置100Bであり、第3の実施形態の情報占有率判定装置100Bは、情報検索部603、占有率演算部605、情報蓄積部504及び情報切り出し部506に加え、類似度判定部606を有する。なお、情報検索部603及び占有率演算部605の機能も、第2の実施形態のものと一部異なっている。また、新たに設けられた類似度判定部606は、独立した情報処理装置で構成されていても良く、情報検索部603等と同一の情報処理装置で構成されていても良い。
【0069】
第3の実施形態の情報検索部603は、類似度判定部606と接続されており、検索条件に合致した情報を情報蓄積部504から取り出したときには類似度判定部606に送信し、類似度判定部606による類似情報の判定結果を受信する機能を有する。
【0070】
類似度判定部606は、情報検索部603から与えられた検索条件に合致した、異なるメールマガジンの情報同士を比較して、類似した情報を認識し、類似情報の判定結果を情報検索部603に送信する機能を有する。
【0071】
第3の実施形態の占有率演算部605は、類似度判定部606の判定結果を加味して、検索条件に合致した情報種類の総数や第3の占有率などを計算して蓄積する機能を有する。
【0072】
(C−2)第3の実施形態の動作
次に、第3の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)の動作を説明する。以下では、主として、第3の実施形態での特有な動作について説明する。
【0073】
情報検索部603が、クライアント201側から与えられた検索条件に基づき、情報蓄積部504から合致する情報を検索する動作までは、第2の実施形態と同様である。
【0074】
この第3の実施形態の場合、情報検索部603は、検索により得られた全ての情報(記事)を類似度判定部606に送信する。
【0075】
このとき、類似度判定部606は、異なるメールマガジンの情報同士の類似度を計算し、同様の情報か否かを判定する。判定方法として、例えば、それぞれの情報を形態素解析し、その形態素解析結果において同一の用語(形態素)の種類数が規定数以上の場合に類似性が高いとして、同じ情報であると判定する方法などを適用できる。
【0076】
類似度判定部606の判定結果は、図7に示すように、各メールマガジンから切り出した情報数、検索条件に合致した情報数と共に、情報検索部603に蓄積される。なお、図7では、類似度判定部606の判定結果を、共通情報数(類似情報数)で示しているが、どれとどれとが類似情報であるかも、情報検索部603に蓄積される。
【0077】
図7は、「△△情報発信マガジン」に含まれている1種類の情報と同様な内容の情報は、「○○新聞メールマガジン」にも含まれており、「××専門マガジン」に含まれている2種類の情報と同様な内容の情報は、「○○新聞メールマガジン」にも含まれている例を示している。
【0078】
検索や類似度判定が終了すると、センターサーバ102は、情報検索部603から、図7に示したようなデータを取得して占有率演算部605に送信する。
【0079】
このとき、占有率演算部605は、検索条件に合致した情報種類の総数や、第3の占有率などを得る。
【0080】
図8は、図7の例に対し、占有率演算部605が得た、検索条件に合致した情報種類の総数や第3の占有率を示している。なお、図8とは異なるが、上述した図4に示したような検索条件に合致した情報の総数や第1の占有率や第2の占有率をも、第3の実施形態の占有率演算部605が得るようにしても良い。
【0081】
3種類のメールマガジン全体を通しては、検索条件に合致した情報の総数10であるが、共通情報数(複数のメールマガジンで内容が重複する情報数)が3個であるので、検索条件に合致した情報種類の総数は7である。
【0082】
第3の占有率は、情報種類という観点からの各メールマガジンでの占有率である。例えば、「○○新聞メールマガジン」の場合、情報数(情報種類数)が7であって、全メールマガジンについての検索条件に合致した情報種類の総数も上述したように7であるので、第3の占有率は、7÷7=1(=100%)となる。「△△情報発信マガジン」及び「○○新聞メールマガジン」についても、情報種類という観点から、第3の占有率が計算されている。
【0083】
占有率演算部605の結果を、ユーザ1(クライアント201)に提示する動作は、上述した第1の実施形態と同様であるので、その説明は省略する。
【0084】
(C−3)第3の実施形態の効果
以上のように、第3の実施形態によっても、ユーザに対して、各メールマガジンを相対評価し得る指標を与えることができる。
【0085】
この第3の実施形態によれば、各メールマガジンに記載されている独立した情報に類似する情報を他のメールマガジンから探すことにより、ユーザが必要とする情報(情報種類)の実質数を把握することができ、情報種類という観点からの第3の占有率をユーザに提示することができる。
【0086】
検索条件に合致した情報という観点からの第1の占有率に基づいた各メールマガジンの評価順序と、検索条件に合致した情報種類という観点からの第3の占有率に基づいた各メールマガジンの評価順序とは、多くの場合、一致するであろうが、不一致の場合には、ユーザは恐らく、情報種類という観点からの第3の占有率を尊重するであろう。
【0087】
(D)第4の実施形態
次に、本発明による電子ドキュメント評価システムを、メールマガジン(電子ドキュメントの一種)の評価システムに適用した第4の実施形態を図面を参照しながら説明する。
【0088】
(D−1)第4の実施形態の構成
図9は、第4の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)の構成を示すブロック図であり、第3の実施形態に係る図6との同一、対応部分には、同一、対応符号を付して示している。
【0089】
第4の実施形態のメールマガジン評価システムでは、クライアント201(ユーザ1)もLANに接続されているとする。
【0090】
以上の点以外で、第4の実施形態が第3の実施形態と異なる部分は情報占有率判定装置100Cであり、第4の実施形態の情報占有率判定装置100Cは、情報検索部603、占有率演算部705、情報蓄積部704、情報切り出し部706及び類似度判定部606に加え、ユーザ登録解除部707を有する。なお、占有率演算部705、情報蓄積部704及び情報切り出し部706の機能も、第3の実施形態のものと一部異なっている。また、新たに設けられたユーザ登録解除部707は、独立した情報処理装置で構成されていても良く、情報検索部603等と同一の情報処理装置で構成されていても良い。
【0091】
第4の実施形態の占有率演算部705は、検索条件を与える毎に計算される第3の占有率が規定値以下だった回数を、メールマガジン別に蓄積する機能を有する。
【0092】
第4の実施形態の情報切り出し部706は、第2の実施形態と同様な各情報の切り出し機能に加え、メールマガジンのユーザ登録を解除するためにメールマガジンのネットワーク上の所在情報(例えばURL;以下、URLと呼ぶ)も切り出す機能をも有する。URLの切り出しは、その文字列の特徴に応じて行う。なお、メールマガジンに解約用のURLが用意されているものであれば、そのURLを切り出す。また、URLの切り出しに代え、ユーザ又はシステム管理者が予め情報蓄積部704に解約用のURLを設定しておくようにしても良く、また、解約推奨時のタイミングでユーザに入力させるようにしても良い。
【0093】
第4の実施形態の情報蓄積部704は、情報切り出し部706で切り出された情報を蓄積すると共に、情報切り出し部706で切り出されたユーザ登録を解除するためのURLも併せて蓄積する。
【0094】
ユーザ登録解除部707は、メールマガジンのユーザ登録を解除するための各種機能を担当する。
【0095】
(D−2)第4の実施形態の動作
次に、第4の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)の動作を説明する。以下では、主として、第4の実施形態での特有な動作について説明する。
【0096】
なお、情報切り出し部706が行うメールマガジンのURLの切り出し動作及び情報蓄積部704が行うURLの蓄積動作も、第4の実施形態での特有な動作であるが、その詳細説明は省略する。
【0097】
第4の実施形態においても、検索指示時に、占有率演算部705が各メールマガジンに対する第3の占有率等を得るまでの動作は、第3の実施形態と同様である。
【0098】
第4の実施形態の占有率演算部705は、各メールマガジンについて第3の占有率を得ると、第3の占有率を規定値(例えば20%)と比較し、第3の占有率が規定値以下であると、内部に蓄積しているる占有率規定値以下回数を1インクリメントする。
【0099】
図10は、第4の実施形態の占有率演算部705が内部蓄積した情報を示すものである。占有率演算部705は、検索条件に合致した情報種類の総数及び第3の占有率だけでなく、占有率規定値以下回数も内部蓄積する。
【0100】
図10に示す例は、ある検索起動に対して、蓄積データを更新した直後の例を示しており、「○○新聞メールマガジン」については、今までの検索で第3の占有率が規定値以下の回数が0回、「△△情報発信マガジン」については10回、「××専門マガジン」については5回であることを表している。
【0101】
センターサーバ102は、占有率演算部705による蓄積結果を受け、表示形式に変換してクライアント201に通知する。
【0102】
このとき、クライアント201は、通知された内容(図10参照)をユーザに提示(表示)すると共に、第3の占有率が規定値以下の回数が規定値(例えば10回)以上のメールマガジンがあれば、ユーザ登録解除部707に通知し、そのメールマガジンの解約処理を実行させる。
【0103】
解約処理では、ユーザ登録解除部707は、例えば、「解約しますか?」というダイアログボックスを示すなどして、解約を推薦する旨をユーザ(クライアント201)に示し、ユーザが解約することを承諾すれば、情報蓄積部704に蓄積されている解約したいメールマガジンに記載されているURL(解約用のURLが用意されているものであればそのURL)を入手し、そのURLにブラウザなどを使ってアクセスし、クライアント201に渡して、ユーザに解約処理を実行させる。
【0104】
(D−3)第4の実施形態の効果
第4の実施形態の電子ドキュメント評価システム(メールマガジン評価システム)によれば、第3の実施形態と同様な効果に加え、以下の効果を奏することができる。
【0105】
第4の実施形態によれば、占有率(第3の占有率)が高頻度で低いメールマガジンを解約対象としてユーザに認識させることができる。
【0106】
このような占有率(第3の占有率)が高頻度で低いメールマガジンを解約した場合には、
(i)切り出し処理、検索処理などを少なくでき、処理速度を速くできる
(ii)データベースに無駄なメールマガジンを蓄積しないので、記憶領域を減少させることができる
などというメリットを生じる。
【0107】
(E)他の実施形態
上記各実施形態においては、電子ドキュメントの例としてメールマガジンを挙げて説明したが、本発明の対象となる電子ドキュメントはメールマガジンに限定されないことは勿論である。例えば、Web情報を電子ドキュメント(情報源)として適用することができる。
【0108】
また、上記各実施形態においては、メールマガジンの相対評価値は、情報数や占有率(第1〜第3の占有率)等であったが、他のパラメータを評価値とするようにしても良い。
【0109】
例えば、1個の情報(記事)に対して、検索キーワードが一致する箇所がタイトルであれば重み2を付与し、記事本体であれば重み1を付与し、リンク先であれば重み1.5を付与して、各記事の値を求め、それを、上記実施形態の1件に代えて適用して占有率を算出するようにしても良い。また例えば、1個の情報(記事)に対して、文字総数に対する検索キーワードと一致した文字数の割合を求め、それを、上記実施形態の1件に代えて適用して占有率を算出するようにしても良い。また、占有率という割合に変換せずに、件数データの提示に止めるようにしても良い。このようにしても、ユーザは、複数のメールマガジンの件数データの比較により、複数のメールマガジンを相対評価できる。
【0110】
さらに、上記各実施形態では、複数の情報(例えば記事;単位情報)を含む電子ドキュメント間を相対評価することを意図したものであったが、1個の情報を含む電子ドキュメント間の相対評価のためにも、本発明を適用することができる。例えば、1個の情報を含む各電子ドキュメントについて、検索キーワードを含む文章数を指標としたり、検索キーワードを含む全ての文章の文字総数を指標としたりすることで、上記各実施形態と同様な処理を行うことができる。
【0111】
上記各実施形態の説明では、その都度、検索条件を入力するようなイメージで説明したが、全て又は一部の検索条件(例えばキーワード)は、いつも同じものであっても良く、情報検索部に予め登録しておくようにしても良い。例えば、キーワード「小泉首相」を登録しておき、情報検索部が毎回の検索起動時に、自動的にキーワード「小泉首相」を含む記事を認識するようにしても良い。
【0112】
また、占有率の情報をシステムが他の機能(第4の実施形態以外の機能)にも利用させるようにしても良い。例えば、占有率が低いメールマガジンに対してだけ、追加の検索キーワードの入力をユーザに求めるようにしても良い。
【0113】
さらに、上記第4の実施形態では、メールマガジンの登録解約の推奨判定を行うものを示したが、逆に、メールマガジンの定期購読の推奨判定を行うようにしても良い。例えば、複数回の単独購入で得た、第4の実施形態のような占有率規定値以下回数に基づき、その回数が少ないメールマガジンに対し、定期購読の推奨を行うようにしても良い。
【0114】
さらにまた、第4の実施形態においては、第3の占有率が規定値以下の回数をメールマガジンの解約推奨の判断材料としたが、過去の検索試行回数のうち何割以上の機会で規定値以下になったかを判断材料にするようにしても良い。また、第4の実施形態に関しては、第3の占有率に代え、第1の占有率など、他のパラメータを用いて、メールマガジンの解約推奨の判断を行うようにしても良い。
【0115】
なお、システムの構成要素の接続形態は上記各実施形態のものに限定されず、例えば、全てがインターネット接続でも良く、全てがLAN接続でも良い。また1個の情報処理装置(例えばパソコン)に全ての構成要素を有するような形態で本発明のシステムを構築しても良い。
【0116】
また、データベースとして各ユーザのメーラを利用することももちろん可能である。
【0117】
【発明の効果】
以上のように、本発明によれば、電子ドキュメントにおける所望する情報内容の多少などをユーザに容易に相対評価させ得る電子ドキュメント評価システムを実現できる。
【図面の簡単な説明】
【図1】第1の実施形態の電子ドキュメント評価システムの構成を示すブロック図である。
【図2】従来技術を示すブロック図である。
【図3】第1の実施形態の情報検索部での情報蓄積の様子を示す説明図である。
【図4】第1の実施形態の占有率演算部の演算結果を示す説明図である。
【図5】第2の実施形態の電子ドキュメント評価システムの構成を示すブロック図である。
【図6】第3の実施形態の電子ドキュメント評価システムの構成を示すブロック図である。
【図7】第3の実施形態の情報検索部での情報蓄積の様子を示す説明図である。
【図8】第3の実施形態の占有率演算部の演算結果を示す説明図である。
【図9】第4の実施形態の情報占有率判定装置を含めたシステム構成を示すブロック図である。
【図10】第4の実施形態の占有率演算部の演算結果を示す説明図である。
【符号の説明】
100、100A、100B、100C…情報占有率判定装置、102…センターサーバ、103、503、603…情報検索部、105、605、705…占有率演算部、201…クライアント(クライアント端末)、504、704…情報蓄積部、506、706…情報切り出し部、606…類似度判定部、707…ユーザ登録解除部。

Claims (8)

  1. 複数の電子ドキュメントを相対評価し得る評価情報を得る電子ドキュメント評価システムであって、
    上記各電子ドキュメントを検索し、上記各電子ドキュメントにおける検索条件に合致する内容量の多少を表す合致量パラメータを得る情報検索手段と、
    当該情報検索手段が得た上記各電子ドキュメントの合致量パラメータに基づいて、ユーザに提示する上記評価情報を生成する評価情報生成手段と
    を備えることを特徴とする電子ドキュメント評価システム。
  2. 上記各電子ドキュメントが、1又は複数の内容が異なる情報を有するものであり、
    上記情報検索手段は、少なくとも上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の数を得るものであり、
    上記評価情報生成手段は、少なくとも上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の数に基づいて、ユーザに提示する上記評価情報を生成するものである
    ことを特徴とする請求項1に記載の電子ドキュメント評価システム。
  3. 上記評価情報生成手段は、上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の数を、上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の数の総和に対する、上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の数の割合を、上記評価情報として生成するものであることを特徴とする請求項2に記載の電子ドキュメント評価システム。
  4. 上記各電子ドキュメントが、1又は複数の内容が異なる情報を有するものであり、
    上記情報検索手段は、少なくとも上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の数と、異なる上記電子ドキュメント間で内容が類似している検索条件に合致する情報の関係データを得るものであり、
    上記評価情報生成手段は、少なくとも上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の数と、異なる上記電子ドキュメント間で内容が類似している検索条件に合致する情報の関係データに基づいて、ユーザに提示する上記評価情報を生成するものである
    ことを特徴とする請求項1に記載の電子ドキュメント評価システム。
  5. 上記評価情報生成手段は、上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報を、上記関係データに基づいて、内容が類似していない情報の種類数に変換し、上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の種類数の総和に対する、上記各電子ドキュメントのそれぞれに含まれている検索条件に合致する情報の種類数の割合を、上記評価情報として生成するものであることを特徴とする請求項4に記載の電子ドキュメント評価システム。
  6. 上記各電子ドキュメントに含まれている情報を予め切り出して蓄積しておく情報切り出し蓄積手段を備え、
    上記情報検索手段は、上記情報切り出し蓄積手段を検索対象とする
    ことを特徴とする請求項2〜5のいずれかに記載の電子ドキュメント評価システム。
  7. 上記評価情報生成手段が生成した上記各電子ドキュメントについての評価情報の履歴を蓄積する評価情報履歴蓄積手段と、
    当該評価情報履歴蓄積手段に蓄積されている上記各電子ドキュメントについての評価情報の履歴に基づいて、上記各電子ドキュメントに対するユーザ登録の推奨判定、及び又は、登録済みユーザに対するユーザ登録解除の推奨判定を行う登録是非判定手段とを有する
    ことを特徴とする請求項1〜6のいずれかに記載の電子ドキュメント評価システム。
  8. 上記登録是非判定手段は、ユーザ登録及び又はユーザ登録解除の実行装置と、ユーザ端末との接続機能を有していることを特徴とする請求項7に記載の電子ドキュメント評価システム。
JP2003004952A 2002-06-27 2003-01-10 電子ドキュメント評価システム Pending JP2004086847A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003004952A JP2004086847A (ja) 2002-06-27 2003-01-10 電子ドキュメント評価システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002187685 2002-06-27
JP2003004952A JP2004086847A (ja) 2002-06-27 2003-01-10 電子ドキュメント評価システム

Publications (1)

Publication Number Publication Date
JP2004086847A true JP2004086847A (ja) 2004-03-18

Family

ID=32071712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003004952A Pending JP2004086847A (ja) 2002-06-27 2003-01-10 電子ドキュメント評価システム

Country Status (1)

Country Link
JP (1) JP2004086847A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244028A (ja) * 2005-03-02 2006-09-14 Nippon Hoso Kyokai <Nhk> 情報提示装置及び情報提示プログラム
JP2021137961A (ja) * 2019-02-17 2021-09-16 有限会社エムズネットヤマキタ 削り花製造器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244028A (ja) * 2005-03-02 2006-09-14 Nippon Hoso Kyokai <Nhk> 情報提示装置及び情報提示プログラム
JP4568144B2 (ja) * 2005-03-02 2010-10-27 日本放送協会 情報提示装置及び情報提示プログラム
JP2021137961A (ja) * 2019-02-17 2021-09-16 有限会社エムズネットヤマキタ 削り花製造器

Similar Documents

Publication Publication Date Title
US9165085B2 (en) System and method for publishing aggregated content on mobile devices
US7392238B1 (en) Method and apparatus for concept-based searching across a network
JP4574356B2 (ja) 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
US7966337B2 (en) System and method for prioritizing websites during a webcrawling process
US8135737B2 (en) Query routing
KR101783396B1 (ko) 인터넷 검색 결과들 및 광고 컨텐츠의 배포
US20010049674A1 (en) Methods and systems for enabling efficient employment recruiting
US20050267872A1 (en) System and method for automated mapping of items to documents
US20030033333A1 (en) Hot topic extraction apparatus and method, storage medium therefor
US20060155693A1 (en) Domain expert search
US20060282504A1 (en) Usage status notification system
WO2002101588A1 (fr) Systeme de gestion de contenus
US20040015485A1 (en) Method and apparatus for improved internet searching
JPWO2007108529A1 (ja) 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
JP2009169924A (ja) 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体
JP2006099341A (ja) 更新履歴生成装置及びプログラム
US20090037396A1 (en) Search apparatus and search method
JP4743766B2 (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
JP2003271609A (ja) 情報監視装置及び情報監視方法
JP2006164256A (ja) 属性評価プログラム、属性評価システムおよび属性評価方法
JP4610543B2 (ja) 期間抽出装置,期間抽出方法,その方法を実装した期間抽出プログラム及びそのプログラムを格納した記録媒体
JP4853915B2 (ja) 検索システム
WO2002041182A1 (fr) Systeme et procede de distribution de nouvelles interessantes
JP2004086847A (ja) 電子ドキュメント評価システム
KR101120040B1 (ko) 연관 질의어 추천 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080520