JP2004192335A - E-mail collecting/searching system - Google Patents
E-mail collecting/searching system Download PDFInfo
- Publication number
- JP2004192335A JP2004192335A JP2002359571A JP2002359571A JP2004192335A JP 2004192335 A JP2004192335 A JP 2004192335A JP 2002359571 A JP2002359571 A JP 2002359571A JP 2002359571 A JP2002359571 A JP 2002359571A JP 2004192335 A JP2004192335 A JP 2004192335A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- web page
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は電子メール収集・検索システムにかかり、特に、メールサーバから電子メールの情報を収集してデータベースに蓄積し、蓄積した電子メールの情報を検索する電子メール収集・検索システムに関する。
【0002】
【従来の技術】
従来、電子メールの検索方法として、次のような検索方法が知られている。(1)メールサーバに蓄積されている電子メールの情報を検索する。
【0003】
(2)電子メールをメールサーバからクライアントのファイルシステムにダウンロードして、クライアントで電子メールの情報を検索する。
【0004】
(3)電子メールの情報をデータベースや文書管理システム等に蓄積して検索する。
【0005】
これらの検索方法によれば、電子メールの属性(タイトル、宛先、送信者、受信日時など)を検索条件にした属性検索や、電子メールの本文や添付ファイルに含まれるキーワードを指定した全文検索を行うことがができる。また、
(4)特許文献1によれば、電子メールをHTML化して蓄積することで、蓄積された電子メールを任意の検索条件のもとで全文検索することが可能である。また、
(5)特許文献2によれば、一度の通信で、電子メール本文と電子メール内に書かれたURLアドレスで指定されたウェブページを取得し、保持しておく。これにより通信環境の整備されていないところにおいても、電子メールの内容に記述されたURLを用いて指定されたウェブページを参照することができる。
【0006】
【特許文献1】
特開2001−36568号公報
【0007】
【特許文献2】
特開2001−34548号公報
【0008】
【発明が解決しようとする課題】
近年インターネットが普及し、個人でホームページを持つユーザが急増している。このようなユーザは電子メールで資料を送付する場合、資料をホームページに掲載しておき、メール本文に資料を掲載したウェブページのURLを記述して送付することが多い。また、インターネットを介して各種の情報を収集する場合、ウェブページの情報を収集した後、収集したウェブページのURLを電子メールの本文に記述して送付することができる。
【0009】
このように、メール本文にウェブページのURLが記述されている場合においては、電子メールを検索するときに、メール本文や添付ファイルの外にメール本文に記述されているURLのウェブページも検索対象にしなければならない。しかしながら、前記従来の検索方法(1)ないし(4)においては、メール本文に記述されているURLのウェブページは検索の対象とされていない。このため、所望の電子メールは検索してもヒットしないことになる。
【0010】
また、前記(5)の検索方法によれば、ウェブページを添付ファイルとして保存しておき、これを全文検索の対象にすることができる。しかしながら、この場合は、ウェブページを保存しておくためのディスク容量が増加する。また、ウェブページが更新された場合においても、古いウェブページを参照してしまうことになる。
【0011】
また、前記(3)の検索方法により属性検索や全文検索を行うためには、電子メールの情報をメール属性、メール本文、及び添付ファイル等に分割して、検索用データとしてデータベースや文書管理システム等に蓄積する必要がある。なお、電子メールの情報を、前記検索用のデータとは別に、電子メールのデータとして再利用する必要がある場合には、収集した電子メールの情報をメールクライアントで再利用可能なファイル形式に変換して、データベースや文書管理システム等に蓄積しておく必要があり、この場合には必要とされるディスク容量が増加する。
【0012】
また、複数のユーザで電子メール検索システムを共用して利用する場合、利用者全員のクライアントPC(パソコン)に当該ファイル形式をサポートしているメールクライアントがインストールされていない場合は、前記蓄積したデータを電子メールのデータとして再利用することができない。
【0013】
本発明はこれらの問題点に鑑みてなされたもので、電子メールによる情報収集を簡易化し、また、収集した電子メールの情報を有効活用することのできる電子メール収集・検索システムを提供する。
【0014】
【課題を解決するための手段】
本発明は、上記の課題を解決するために次のような手段を採用した。
【0015】
メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段と、データベースに蓄積した電子メールの情報を検索する電子メール検索手段を備えた電子メール収集・検索システムにおいて、 前記電子メール収集手段は、前記電子メールのメール属性、メール本文及び添付ファイルの情報を収集するメール情報収集手段、及びメール本文に記述されているURLのウェブページの情報を収集するウェブページ収集手段を備えた。
【0016】
【発明の実施の形態】
以下、本発明の実施形態を添付図面を参照しながら説明する。図1は、本発明の実施形態にかかる電子メール収集・検索システムを説明する図である。本実施形態においては、まず、情報提供者がWWWサーバ等から収集した情報を電子メールでメールサーバに送付する。次いで、電子メール収集・検索システムは、前記電子メールの情報をメールサーバから収集してデータベースに蓄積すると共に、このデータベースをエンドユーザに公開する。これによりエンドユーザは前記データベースを検索して各種情報を取得することができる。
【0017】
図1において、10はメールサーバであり、電子メール11を管理する。該電子メール11には図示しない情報提供者がWWWサーバ20から収集したウェブページ21のURLを含んでいる。20はWWWサーバであり、ウェブページ21を管理する。
【0018】
30ないし32はクライアントであり、電子メール収集・検索システム100により収集された電子メールを検索するエンドユーザとなる。
【0019】
100は電子メール収集・検索システム、110は電子メール収集手段でありメールサーバ10から電子メールの情報を収集してデータベース130に蓄積する。111は電子メールのメール属性、メール本文及び添付ファイルの情報を収集するメール情報収集手段、112はメール本文に記述されているURLのウェブページの情報を収集するウェブページ収集手段である。
【0020】
120はデータベースに蓄積した電子メールの情報を検索する電子メール検索手段、121は電子メールの本文あるいは添付ファイルあるいはメール本文に記述されているURLのウェブページの情報にそれぞれ含まれるキーワードを検索条件に指定して電子メールを検索する全文検索手段、122は電子メールの属性、添付ファイルの属性あるいはメール本文に記述されているURLのウェブページの属性を検索条件にして電子メールを検索する属性検索手段、123は電子メール検索手段で検索した電子メールの情報をメール送信可能な形式に再編集した後,これを検索したユーザにメール送信するメールバック手段である。
【0021】
130はデータベースであり、インデックス(属性検索用及び全文検索用)140、電子メールデータ及びウェブページデータ150、関連データ160で構成される。また、前記インデックス(属性検索用及び全文検索用)140は、メール本文のインデックス141、添付ファイルのインデックス142、ウェブページのインデックス143で構成され、それぞれ属性検索用及び全文検索用のインデックスを保持する。また、前記電子メールデータ及びウェブページデータ150は、メール本文と属性151、添付ファイルと属性152、ウェブページの属性153を保持する。また、前記関連データ160は、メール本文と添付ファイルの関連161、及びメール本文とウェブページの関連162を保持する。
【0022】
図2は電子メール収集手段110におけるメール情報収集手段111の処理を説明するフローチャートである。メール情報収集手段111による処理を定期的に実行することで、新着メールの情報と関連データがデータベースに格納される。
【0023】
図2において、まず、ステップ201において、メールサーバ10の新着メールを1件ずつ受信する。ステップ202において、新着メールの有無を判断する。新着メールがあればステップ203に進み、そうでなければ処理を終了する。ステップ203において、受信した電子メールからメール情報(メール属性、メール本文、添付ファイル)を抽出する。ステップ204において、抽出したメール情報(メール本文と属性)をデータベース130のメール本文と属性151に格納し、メール本文のIDを得る。このとき、必要であれば、送信者や宛先の属性によって公開範囲を限定する情報を設定する。ステップ205において、メール情報(メール本文と属性)をもとにメール本文の属性検索及び全文検索用のインデックスを生成し、データベース130のメール本文のインデックス141に格納する。このとき、属性検索及び全文検索用のインデックスの生成は既存の技術を利用する。
【0024】
ステップ206において、添付ファイルの有無を判定する。添付ファイルがある場合はステップ207に進みそうでない場合はステップ210に進む。ステップ207において、抽出したメール情報(添付ファイルと属性)をデータベース130の添付ファイルと属性152に格納207し、添付ファイルのIDを得る。このとき、必要であれば、送信者や宛先の属性によって公開範囲を限定する情報を設定する。また、すでに同じ内容の添付ファイルがデータベースに格納されている場合は、添付ファイルの実体は登録せずに属性だけ登録するといったような配慮をしてもよい。
【0025】
ステップ208において、メール情報(添付ファイルと属性)をもとに添付ファイルの属性検索及び全文検索用のインデックスを生成し、データベース130の添付ファイルのインデックス142に格納する。このとき、属性検索、及び全文検索用のインデックスの生成は既存の技術を利用する。ステップ209において、格納したメール本文のIDと添付ファイルのIDをメール本文と添付ファイルの関連データ161に格納する。ステップ210において、メール本文に記述されているURLを抽出し、ステップ211において、メール本文にURLの記述があるか否かを判定し、記述がある場合はステップ212に進み、ステップ212において、メール本文のIDとURLをメール本文とウェブページの関連162に格納する。
【0026】
図3は、電子メール収集手段110におけるウェブページ収集手段112の処理を説明するフローチャートである。ウェブページ収集手段112を定期的に実行することで、新着メールのメール本文に記述されているURLのウェブページの情報をデータベースに格納する。また、収集済みのウェブページの情報が最新のウェブページの情報に更新される。
【0027】
図3において、ステップ301において、電子メール収集手段110におけるメール情報収集手段111により蓄積したメール本文とウェブページの関連データ162からURLを1件ずつ入力する。ステップ302において、メール本文とウェブページの関連データの有無を判定し、関連データがなければ処理を終了し、そうでなければステップ303に進む。ステップ303において、入力したURLのウェブページが収集済みかどうかチェックする。収集済みであればステップ304に進み、そうでなければステップ305に進む。ステップ304において当該ウェブページが更新されているか否かをチェックする。ウェブページが更新されていなければ、ステップ301に進み、そうでなければ(未収集のウェブページか、または収集済みのウェブページで、かつ、ウェブページが更新されている場合)ステップ305に進む。ステップ305において、ウェブページの情報(ウェブページデータ及びウェブページの属性)を収集する。ステップ306において、収集したウェブページの属性をデータベース130のウェブページの属性153に格納する。ステップ307において、ウェブページの情報(ウェブページデータ及びウェブページの属性)をもとにウェブページの属性検索、及び全文検索用のインデックスを生成し、ウェブページのインデックス143に格納する。このとき、属性検索、及び全文検索用のインデックスの生成は既存の技術を利用する。
【0028】
図4は、収集される電子メールの例を説明する図である。図4において、電子メール1と電子メール2はメール本文にURLが記述されている。また、電子メール2と電子メール3には添付ファイルが添付されている。また、図4に示す電子メールをデータベースに蓄積する例を図5ないし図9に示す。なお、図5ないし図7においては、メール本文データ、添付ファイルデータ、及びウェブページデータを同一テーブルに格納することを想定している。
【0029】
図5は、メール本文データを蓄積するデータベースの例を説明する図である。図5において、メール本文データは、電子メールを識別するID501と、個人メールか共用メールかを識別する公開502と、メール本文か添付ファイルかウェブデータかを識別する種別503と、電子メールのタイトル504と、電子メールの宛先505と、電子メールの送信者506と、電子メールの受信日時507と、メール本文をアプリケーションで参照する場合のファイル名508と、ファイルサイズ509と、メール本文(BLOB)510と、全文検索用データ511の各属性で構成される。なお、全文検索用データ511は、既存の技術を利用して全文検索インデックスを作成するためのデータであり、利用する既存の技術によっては不要な場合がある。
【0030】
図6は、添付ファイルデータを蓄積するデータベースの例を説明する図である。図6において、添付ファイルデータは、添付ファイルを識別するID601と、当該添付ファイルの電子メールが個人メールか共用メールかを識別する公開602と、メール本文か添付ファイルかウェブデータかを識別する種別603と、電子メールのタイトル604と、電子メールの宛先605と、電子メールの送信者606と、電子メールの受信日時607と、添付ファイル名608と、ファイルサイズ609と、添付ファイル(BLOB)610と、全文検索用データ611の各属性で構成される。なお、全文検索用データ611は、既存の技術を利用して全文検索インデックスを作成するためのデータであり、利用する既存の技術によっては不要な場合がある。
【0031】
図7は、ウェブページデータを蓄積するデータベースの例を説明する図である。図7において、ウェブページデータは、ウェブページのURL701と、メール本文か添付ファイルかウェブデータかを識別する種別702と、ウェブページのタイトル703と、ウェブページの作成者704と、ウェブページの更新日時705と、全文検索用データ706の各属性で構成される。なお、全文検索用データ706は、既存の技術を利用して全文検索インデックスを作成するためのデータであり、利用する既存の技術によっては不要な場合がある。
【0032】
図8は、メール本文と添付ファイルの関連データを蓄積するデータベースの例を説明する図である。図8において、メール本文と添付ファイルの関連データは、電子メールを識別するID801と、添付ファイルを識別するID802の各属性で構成される。
【0033】
図9は、メール本文とウェブページの関連データを蓄積するデータベースの例を説明する図である。図9において、メール本文とウェブページの関連データは、電子メールを識別するID901と、ウェブページのURL902の各属性で構成される。
【0034】
図10は、電子メール検索手段120における検索条件の入力画面の例を説明する図である。図10において、公開種別1001は、個人メール、及び共用メールを検索対象とするかどうかを指定する。検索対象1002は、メール本文、添付ファイル、及びウェブページを検索対象とするかどうかを指定する。全文検索条件1003は、メール本文、添付ファイル、及びウェブページを全文検索するキーワードを指定する。属性検索条件1004は、メール本文、添付ファイル、及びウェブページを属性検索する条件を指定する。
【0035】
この画面で、キーワードに「電子メール」と「SMTP」を指定1005して、検索実行(メール本文のみ表示)1006をクリックすると、指定したキーワードが電子メールのメール本文、または添付ファイル、またはメール本文に記述されているURLのウェブページに含まれる電子メールのメール本文を検索できる。また、この画面で、キーワードに「電子メール」と「SMTP」を指定1005して、検索実行(メール本文、添付ファイル、ウェブページを表示)1007をクリックすると、指定したキーワードを含むメール本文、添付ファイル、及びウェブページの情報を検索できる。
【0036】
図11は、図10で示した検索条件で検索実行(メール本文のみ表示)1006をクリックしたとき表示される検索結果一覧画面の例を示す図である。図11において、種別1101は、メール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1102は電子メールのタイトルである。送信/作成者1103は、電子メールの送信者である。受信/更新日時1104は、電子メールの受信日時である。関連情報1105は、電子メールの関連情報を表示するアンカーである。
【0037】
この検索結果一覧画面から、データベースに蓄積した電子メールの本文、及び関連情報が表示できる。例えば、電子メール「仕様書送付の件」のアンカー1106をクリックすると、電子メール「仕様書送付の件」のメール本文が表示される。また、電子メール「仕様書送付の件」の関連情報のアンカー1107をクリックすると、電子メール「仕様書送付の件」の関連情報が表示される。
【0038】
図12は図10で示した検索条件で検索実行(メール本文、添付ファイル、ウェブページを表示)1007をクリックして表示される検索結果一覧画面の例である。
【0039】
図12において、種別1201は、メール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1202は電子メール、またはウェブページのタイトルである。URL/ファイル名1203は、ウェブページのURL、または添付ファイル名である。送信/作成者1204は、電子メールの送信者、またはウェブページの作成者である。受信/更新日時1205は、電子メールの受信日時、またはウェブページの更新日時である。関連情報1206は、関連情報を表示するアンカーである。
【0040】
この検索結果一覧画面から、データベースに蓄積した電子メールの本文、添付ファイル、及びメール本文に記述されているURLのウェブページが表示できる。また、検索でヒットした情報に関連する電子メールの関連情報が表示できる。例えば、電子メール「SMTPについて」のアンカー1207をクリックすると、電子メール「SMTPについて」のメール本文が表示される。また、電子メール「仕様書送付の件」の添付ファイル「SMTP.doc」のアンカー1108をクリックすると、添付ファイル「SMTP.doc」が表示される。また、ウェブページ「E−mail Page」のURLのアンカー1209をクリックすると、タイトル「E−mail Page」のウェブページが表示される。また、ウェブページ「Java(登録商標) Mail」の関連情報のアンカー1210をクリックすると、メール本文にウェブページ「Java(登録商標) Mail」のURLが記述されている電子メールの関連情報が表示される。
【0041】
図13は、図11に示す関連情報のアンカー1107をクリックした場合に表示される関連情報画面の例を示す図である。図13において、対象1301は検索でヒットした対象を「→」で示している。この例では、メール本文が検索でヒットした対象である。種別1302はメール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1303は電子メールのタイトル、またはウェブページのタイトルである。URL/ファイル名1304はウェブページのURL、または添付ファイル名である。メール送信1305はメール送信用のアンカーである。
【0042】
このアンカーをクリックすると、検索でヒットした電子メールの情報を電子メールの形式に再編集した後、検索したユーザにメール送信する。例えば、送信1306をクリックすると、電子メール「SMTPについて」のメール本文と属性、及び添付ファイルを電子メールの形式に再編集した後、検索したユーザにメール送信する。
【0043】
図14は、図12で示した関連情報のアンカー1210をクリックした場合に表示される関連情報画面の例を示す図である。図14において、対象1401は検索でヒットした対象を「→」で示している。この例では、ウェブページが検索でヒットした対象である。種別1402はメール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1403は電子メールのタイトル、またはウェブページのタイトルである。URL/ファイル名1404はウェブページのURL、または添付ファイル名である。メール送信1405はメール送信用のアンカーである。
【0044】
このアンカーをクリックすると、検索でヒットした電子メールの情報を電子メールの形式に再編集した後、検索したユーザにメール送信する。例えば、送信1406をクリックすると、電子メール「Java(登録商標)調査結果」のメール本文と属性を電子メールの形式に再編集した後、検索したユーザにメール送信する。また、送信1407をクリックすると、電子メール「SMTPについて」のメール本文と属性、及び添付ファイルを電子メールの形式に再編集した後、検索したユーザにメール送信する。
【0045】
図15は、電子メール検索手段120による全文検索121及び属性検索122の各処理を説明するフローチャートである。このフローチャートの各処理により図10ないし図12で示した電子メール検索システムの各画面を得ることができる。
【0046】
図15において、まず、図10の画面を参照して公開種別1001、検索対象1002、全文検索条件1003、及び属性検索条件1004を取得する(ステップ1501)。次に、検索条件式を生成し(ステップ1502)、データベースを検索する(ステップ1503)。このとき、全文検索や属性検索は既存の技術を利用する。ステップ1504においてメール本文がヒットした場合はヒットしたメール本文の情報を検索結果一覧に蓄積する(ステップ1505)。
【0047】
添付ファイルがヒットし(ステップ1506)、かつ、図10における検索実行(メール本文、添付ファイル、ウェブページを表示)1007がクリックされた場合(ステップ1507)、ヒットした添付ファイルの情報を検索結果一覧に蓄積する(ステップ1508)。
【0048】
添付ファイルがヒットし(ステップ1506)、かつ、図10において検索実行(メール本文のみ表示)1006がクリックされた場合(ステップ1507)、メール本文と添付ファイルの関連データからメール本文のIDを1件づつ取得し、該当するメール本文の情報を検索結果一覧に蓄積する(ステップ1509)。
【0049】
ウェブページがヒットし1510、かつ、図10における検索実行(メール本文、添付ファイル、ウェブページを表示)1007がクリックされた場合1511、ヒットしたウェブページの情報を検索結果一覧に蓄積1512する。
【0050】
ウェブページがヒットし(ステップ1510)、かつ、図10における検索実行(メール本文のみ表示)1006がクリックされた場合(ステップ1511)、メール本文とウェブページの関連データからメール本文のIDを1件づつ取得し、該当するメール本文の情報を検索結果一覧に蓄積する(ステップ1513)。最後に、検索結果一覧を表示する(ステップ1514)。
【0051】
図16は電子メール検索手段120による関連情報表示画面(図13ないし図14)の表示情報取得処理を説明するフローチャートである。図16において、まず、関連情報を取得する種別を判定する(ステップ1601)。種別がメール本文のときは、当該電子メールの関連情報を取得する(ステップ1602)。
【0052】
ステップ1602における電子メールの関連情報取得に際しては、まず、メール本文と添付ファイルの関連データ161から添付ファイルのIDを1件づつ取得し(ステップ1603)、添付ファイルのIDがなくなるまで添付ファイルの情報を取得する(ステップ1604,1605)。次に、メール本文とウェブページの関連データ162からウェブページのURLを1件づつ取得し(ステップ1606)、ウェブページのURLがなくなるまでウェブページの情報を取得する(ステップ1607,1608)。
【0053】
種別が添付ファイルのときは、添付ファイルのIDをキーにしてメール本文と添付ファイルの関連データ161からメール本文のIDを1件づつ取得し(ステップ1609)、メール本文のIDがなくなるまで当該電子メールの関連情報を取得する(ステップ1610,1611)。
【0054】
種別がウェブページのときは、ウェブページのURLをキーにしてメール本文とウェブページの関連データ162からメール本文のIDを1件づつ取得し(ステップ1612)、メール本文のIDがなくなるまで、当該電子メールの関連情報を取得する(ステップ1613,1614)。
【0055】
図17は電子メール検索手段120におけるメールバック手段123の処理を説明するフローチャートである。図17において、まず、検索でヒットした電子メールのIDをキーにして、メール本文と属性を取得する(ステップ1701)。次に、メール本文と添付ファイルの関連データ161から添付ファイルのIDを1件づつ取得し(ステップ1702)、添付ファイルのIDがなくなるまで添付ファイルを取得する(ステップ1703,1704)。取得したメール本文と属性、及び添付ファイルをメール送信可能な形式に編集して(ステップ1705)、ログイン中のエンドユーザにメール送信する(ステップ1706)。
【0056】
以上説明したように本発明の実施形態によれば、メールサーバから電子メールの情報を収集してデータベースに蓄積する際に、メール本文に記述されているURLのウェブページの情報を収集可能となる。また、メール本文に記述されているURLのウェブページを検索対象にして電子メールを検索するための必要最小限の情報をデータベースに蓄積できる。また、電子メールの検索時に、電子メールの本文や添付ファイルやメール本文に記述されているURLのウェブページの情報に含まれているキーワードを検索条件に指定して全文検索できる。また、電子メールの検索時に、電子メールの属性(タイトル、宛先、送信者、受信日時など)や添付ファイルの属性(ファイル名、ファイルサイズなど)やウェブページの属性(URL、タイトル、作成者、更新日付など)を検索条件にして属性検索できる。また、検索した電子メールの情報をメール送信可能な形式に再編集した後、これを検索したユーザにメール送信することができる。
【0057】
【発明の効果】
以上説明したように本発明によれば、電子メールによる情報収集を簡易化し、また、収集した電子メールの情報を有効活用することのできる電子メール収集・検索システムを提供することができる。
【図面の簡単な説明】
【図1】本発明の実施形態にかかる電子メール収集・検索システムを説明する図である。
【図2】メール情報収集手段の処理を説明するフローチャートである。
【図3】ウェブページ収集手段の処理を説明するフローチャートである。
【図4】収集される電子メールの例を説明する図である。
【図5】メール本文データを蓄積するデータベースの例を説明する図である。
【図6】添付ファイルデータを蓄積するデータベースの例を説明する図である。
【図7】ウェブページデータを蓄積するデータベースの例を説明する図である。
【図8】メール本文と添付ファイルの関連データを蓄積するデータベースの例を説明する図である。
【図9】メール本文とウェブページの関連データを蓄積するデータベースの例を説明する図である。
【図10】電子メール検索手段における検索条件の入力画面の例を説明する図である。
【図11】検索結果一覧画面の例を示す図である。
【図12】検索結果一覧画面の例を示す図である。
【図13】関連情報画面の例を示す図である。
【図14】関連情報画面の例を示す図である。
【図15】全文検索及び属性検索の各処理を説明するフローチャートである。
【図16】関連情報表示画面の表示情報取得処理を説明するフローチャートである。
【図17】メールバック手段の処理を説明するフローチャートである。
【符号の説明】
10 メールサーバ
11 電子メール
20 WWWサーバ
21 URLのウェブページ
30、31,32 クライアント
100 電子メール収集・検索システム
110 電子メール収集手段
111 メール情報収集手段
112 ウェブページ収集手段
120 電子メール検索手段
121 全文検索手段
122 属性検索手段
123 メールバック手段
130 データベース
140 インデックス(属性検索、及び全文検索用)
141 メール本文のインデックス
142 添付ファイルのインデックス
143 ウェブページのインデックス
150 電子メールデータ及びウェブページデータ
151 メール本文と属性
152 添付ファイルと属性
153 ウェブページの属性
160 関連データ
161 メール本文と添付ファイルの関連
162 メール本文とウェブページの関連[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an e-mail collection / search system, and more particularly to an e-mail collection / search system that collects e-mail information from a mail server, stores the e-mail information in a database, and searches for the stored e-mail information.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, the following search methods have been known as search methods for e-mail. (1) Search for information of electronic mail stored in the mail server.
[0003]
(2) The electronic mail is downloaded from the mail server to the file system of the client, and the client searches for the information of the electronic mail.
[0004]
(3) E-mail information is stored in a database or a document management system and searched.
[0005]
According to these search methods, an attribute search using the attributes (e.g., title, destination, sender, reception date and time) of an e-mail as a search condition, and a full-text search specifying a keyword included in an e-mail text or an attached file are performed. Can be done. Also,
(4) According to
(5) According to
[0006]
[Patent Document 1]
JP 2001-36568 A
[0007]
[Patent Document 2]
JP 2001-34548 A
[0008]
[Problems to be solved by the invention]
2. Description of the Related Art In recent years, the Internet has become widespread, and the number of users who have homepages by themselves has increased rapidly. When sending a material by e-mail, such a user often posts the material on a homepage and describes the URL of the web page on which the material is posted in the body of the mail. When collecting various types of information via the Internet, after collecting the information of the web page, the URL of the collected web page can be described in the body of the e-mail and sent.
[0009]
As described above, when the URL of the web page is described in the mail body, when searching for an e-mail, the web page of the URL described in the mail body besides the mail body and attached file is also searched. Must be. However, in the conventional search methods (1) to (4), the web page of the URL described in the body of the mail is not searched. For this reason, the desired e-mail will not be hit even if searched.
[0010]
Further, according to the search method (5), the web page can be stored as an attached file and can be subjected to full-text search. However, in this case, the disk capacity for storing the web page increases. In addition, even when the web page is updated, the old web page is referred to.
[0011]
In order to perform an attribute search or a full-text search by the search method (3), information of an e-mail is divided into mail attributes, mail texts, attached files, and the like, and a database or a document management system is used as search data. And so on. If it is necessary to reuse the e-mail information as e-mail data separately from the search data, the collected e-mail information is converted into a file format that can be reused by a mail client. Then, it is necessary to accumulate them in a database, a document management system, or the like, and in this case, the required disk capacity increases.
[0012]
If a plurality of users share the e-mail search system, and if a mail client supporting the file format is not installed in the client PCs (PCs) of all the users, the stored data is Cannot be reused as e-mail data.
[0013]
The present invention has been made in view of these problems, and provides an e-mail collection / search system capable of simplifying information collection by e-mail and effectively utilizing the information of the collected e-mail.
[0014]
[Means for Solving the Problems]
The present invention employs the following means in order to solve the above problems.
[0015]
An e-mail collection / search system comprising: an e-mail collection unit that collects e-mail information from a mail server and stores the e-mail information in a database; and an e-mail search unit that searches for e-mail information stored in the database. The collecting means includes a mail information collecting means for collecting information of the mail attribute, the mail body and the attached file of the electronic mail, and a web page collecting means for collecting information of a URL web page described in the mail body. .
[0016]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a diagram illustrating an electronic mail collection / search system according to an embodiment of the present invention. In the present embodiment, first, an information provider sends information collected from a WWW server or the like to a mail server by e-mail. Next, the e-mail collection / search system collects the e-mail information from the mail server and accumulates the information in a database, and publishes this database to end users. This allows the end user to search the database and obtain various information.
[0017]
In FIG. 1,
[0018]
[0019]
[0020]
[0021]
[0022]
FIG. 2 is a flowchart for explaining the processing of the mail
[0023]
In FIG. 2, first, in
[0024]
In
[0025]
In
[0026]
FIG. 3 is a flowchart for explaining processing of the web
[0027]
In FIG. 3, in
[0028]
FIG. 4 is a diagram illustrating an example of collected e-mail. In FIG. 4, the URLs of the
[0029]
FIG. 5 is a diagram illustrating an example of a database that stores mail body data. In FIG. 5, mail body data includes an
[0030]
FIG. 6 is a diagram illustrating an example of a database that stores attached file data. In FIG. 6, the attached file data includes an
[0031]
FIG. 7 is a diagram illustrating an example of a database that stores web page data. In FIG. 7, the web page data includes a
[0032]
FIG. 8 is a diagram illustrating an example of a database that stores data related to a mail text and an attached file. In FIG. 8, the related data between the mail text and the attached file is composed of attributes of an
[0033]
FIG. 9 is a diagram illustrating an example of a database that stores related data between a mail text and a web page. In FIG. 9, the related data between the mail text and the web page includes an
[0034]
FIG. 10 is a view for explaining an example of a search condition input screen in the electronic mail search means 120. In FIG. 10, a
[0035]
On this screen, specify “E-mail” and “SMTP” as
[0036]
FIG. 11 is a diagram showing an example of a search result list screen displayed when a search execution (only the text of the mail) 1006 is clicked under the search conditions shown in FIG. In FIG. 11, a type 1101 is an attribute for identifying a mail text, an attached file, and a web page. Title 1102 is the title of the e-mail. The sender /
[0037]
From the search result list screen, the text of the e-mail accumulated in the database and related information can be displayed. For example, when the
[0038]
FIG. 12 shows an example of a search result list screen displayed by clicking on a search execution (displaying mail text, attached file, web page) 1007 under the search conditions shown in FIG.
[0039]
In FIG. 12, a
[0040]
From the search result list screen, the web page of the URL described in the body of the e-mail, the attached file, and the body of the e-mail stored in the database can be displayed. Also, related information of an e-mail related to the information hit in the search can be displayed. For example, when the
[0041]
FIG. 13 is a diagram illustrating an example of the related information screen displayed when the
[0042]
When the anchor is clicked, the information of the e-mail hit by the search is re-edited into an e-mail format, and then transmitted to the searched user. For example, when the
[0043]
FIG. 14 is a diagram illustrating an example of the related information screen displayed when the
[0044]
When the anchor is clicked, the information of the e-mail hit by the search is re-edited into an e-mail format, and then transmitted to the searched user. For example, when
[0045]
FIG. 15 is a flowchart illustrating each process of the
[0046]
Referring to FIG. 15, first, a
[0047]
When the attached file is hit (step 1506) and the search execution (display of the mail text, the attached file, the web page) 1007 in FIG. 10 is clicked (step 1507), the information of the hit attached file is displayed in the search result list. (Step 1508).
[0048]
If the attached file is hit (step 1506) and the search execution (only the mail text is displayed) 1006 is clicked in FIG. 10 (step 1507), one ID of the mail text is obtained from the data related to the mail text and the attached file. Then, the information of the corresponding mail text is acquired and stored in a search result list (step 1509).
[0049]
If a web page is hit 1510 and a search execution (display of mail text, attached file, web page) 1007 in FIG. 10 is clicked 1511, information of the hit web page is stored 1512 in a search result list.
[0050]
When the web page is hit (step 1510) and the search execution (only the text of the mail) 1006 in FIG. 10 is clicked (step 1511), one ID of the text of the mail is obtained from the relevant data of the text of the mail and the web page. The mail body information is obtained and stored in the search result list (step 1513). Finally, a search result list is displayed (step 1514).
[0051]
FIG. 16 is a flowchart for explaining display information acquisition processing of the related information display screen (FIGS. 13 and 14) by the electronic mail search means 120. In FIG. 16, first, the type of acquiring the related information is determined (step 1601). When the type is the mail text, the related information of the electronic mail is acquired (step 1602).
[0052]
In acquiring the related information of the e-mail in
[0053]
If the type is an attached file, the ID of the attached file is acquired as a key, and the ID of the attached message is acquired one by one from the associated
[0054]
If the type is a web page, the ID of the mail body is acquired one by one from the mail body and the
[0055]
FIG. 17 is a flowchart for explaining the processing of the mail back means 123 in the electronic mail search means 120. Referring to FIG. 17, first, a mail text and attributes are acquired using the ID of the electronic mail hit by the search as a key (step 1701). Next, the IDs of the attached files are acquired one by one from the mail text and the associated
[0056]
As described above, according to the embodiment of the present invention, when collecting e-mail information from a mail server and storing the information in a database, it is possible to collect information on a URL web page described in a mail body. . Further, it is possible to accumulate in a database the minimum necessary information for searching for an e-mail with the URL web page described in the mail text as a search target. When searching for an e-mail, a full-text search can be performed by specifying a keyword included in the information of the URL web page described in the body of the e-mail, the attached file, or the body of the e-mail as a search condition. Also, when searching for an e-mail, the attributes of the e-mail (title, destination, sender, reception date and time, etc.), the attributes of the attached file (file name, file size, etc.) and the attributes of the web page (URL, title, creator, Attribute search can be performed using the update date as a search condition. In addition, after re-editing the retrieved e-mail information into a format that allows e-mail transmission, the e-mail can be transmitted to the retrieved user by e-mail.
[0057]
【The invention's effect】
As described above, according to the present invention, it is possible to provide an e-mail collection / search system capable of simplifying the collection of information by e-mail and effectively utilizing the information of the collected e-mail.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an electronic mail collection / search system according to an embodiment of the present invention.
FIG. 2 is a flowchart illustrating processing of a mail information collecting unit.
FIG. 3 is a flowchart illustrating processing of a web page collection unit.
FIG. 4 is a diagram illustrating an example of collected e-mail.
FIG. 5 is a diagram illustrating an example of a database that stores mail body data.
FIG. 6 is a diagram illustrating an example of a database that stores attached file data.
FIG. 7 is a diagram illustrating an example of a database that stores web page data.
FIG. 8 is a diagram illustrating an example of a database that stores data related to a mail text and an attached file.
FIG. 9 is a diagram illustrating an example of a database that stores data relating to a mail text and a web page.
FIG. 10 is a view for explaining an example of a search condition input screen in the electronic mail search means.
FIG. 11 is a diagram showing an example of a search result list screen.
FIG. 12 is a diagram showing an example of a search result list screen.
FIG. 13 is a diagram showing an example of a related information screen.
FIG. 14 is a diagram showing an example of a related information screen.
FIG. 15 is a flowchart illustrating each process of a full-text search and an attribute search.
FIG. 16 is a flowchart illustrating a display information acquisition process of a related information display screen.
FIG. 17 is a flowchart illustrating processing of a mail back unit.
[Explanation of symbols]
10 Mail server
11 Email
20 WWW server
21 URL web page
30, 31, 32 clients
100 E-mail collection and search system
110 E-mail collection means
111 Mail information collection means
112 Web page collection means
120 E-mail search means
121 Full text search means
122 Attribute search means
123 mail back means
130 Database
140 Index (for attribute search and full text search)
141 Email Body Index
142 Attachment Index
143 Web Page Index
150 E-mail data and web page data
151 Email body and attributes
152 Attachments and Attributes
153 Web Page Attributes
160 Related data
161 Relationship between email text and attached files
162 Relationship between email text and web page
Claims (6)
該プログラムは、コンピュータを、前記電子メールのメール属性、メール本文及び添付ファイルの情報を収集するメール情報収集手段及びメール本文に記述されているURLのウェブページの情報を収集するウェブページ収集手段として機能させるプログラムを備えたことを特徴とする電子メール収集・検索プログラム。An e-mail collection / search program for causing a computer to function as e-mail collection means for collecting e-mail information from a mail server and storing it in a database and e-mail search means for searching for e-mail information stored in the database So,
The program includes a computer as a mail information collecting unit that collects information of the mail attribute, the mail body, and the attached file of the electronic mail, and a web page collecting unit that collects information of a URL web page described in the mail body. An e-mail collection / search program characterized by having a functioning program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002359571A JP4028795B2 (en) | 2002-12-11 | 2002-12-11 | E-mail collection and search system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002359571A JP4028795B2 (en) | 2002-12-11 | 2002-12-11 | E-mail collection and search system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004192335A true JP2004192335A (en) | 2004-07-08 |
JP4028795B2 JP4028795B2 (en) | 2007-12-26 |
Family
ID=32758936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002359571A Expired - Fee Related JP4028795B2 (en) | 2002-12-11 | 2002-12-11 | E-mail collection and search system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4028795B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005036410A1 (en) * | 2003-10-10 | 2005-04-21 | Altage Limited Partnership Company | Automatic information entering server |
JP2006301899A (en) * | 2005-04-20 | 2006-11-02 | Brother Ind Ltd | Data management program, data management apparatus, and data management method |
JP2009193309A (en) * | 2008-02-14 | 2009-08-27 | Sansan Inc | Business card information management apparatus, business card information management method and program |
US8775455B2 (en) | 2008-12-30 | 2014-07-08 | International Business Machines Corporation | Document search system which reflects the situation of using documents in the search results |
-
2002
- 2002-12-11 JP JP2002359571A patent/JP4028795B2/en not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005036410A1 (en) * | 2003-10-10 | 2005-04-21 | Altage Limited Partnership Company | Automatic information entering server |
JP2006301899A (en) * | 2005-04-20 | 2006-11-02 | Brother Ind Ltd | Data management program, data management apparatus, and data management method |
JP2009193309A (en) * | 2008-02-14 | 2009-08-27 | Sansan Inc | Business card information management apparatus, business card information management method and program |
US8775455B2 (en) | 2008-12-30 | 2014-07-08 | International Business Machines Corporation | Document search system which reflects the situation of using documents in the search results |
US9298710B2 (en) | 2008-12-30 | 2016-03-29 | International Business Machines Corporation | Document search system which reflects the situation of using documents in the search results |
Also Published As
Publication number | Publication date |
---|---|
JP4028795B2 (en) | 2007-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7788274B1 (en) | Systems and methods for category-based search | |
US5978828A (en) | URL bookmark update notification of page content or location changes | |
JP3307625B2 (en) | Electronic bulletin board system and mail server | |
US7809710B2 (en) | System and method for extracting content for submission to a search engine | |
US7702811B2 (en) | Method and apparatus for marking of web page portions for revisiting the marked portions | |
AU2005231112B2 (en) | Methods and systems for structuring event data in a database for location and retrieval | |
JP5069730B2 (en) | Event notification function providing device, event notification function providing method, and event notification function providing program | |
AU2007332917B2 (en) | Method and system for intellegent processing of electronic information | |
US20050234848A1 (en) | Methods and systems for information capture and retrieval | |
WO2008057635A1 (en) | System, method, and computer-readable medium for collection and distribution of user-supplied comments associated with network and local content | |
US20100077300A1 (en) | Computer Method and Apparatus Providing Social Preview in Tag Selection | |
JP2006099341A (en) | Update history generation device and program | |
JP2005025620A (en) | Document update notification device, document update notification method, and control program of document update notification device | |
JP2004220251A (en) | Information extraction rule creation system, information extraction rule creation method, and information extraction rule creation program | |
JP4028795B2 (en) | E-mail collection and search system | |
US9117202B2 (en) | Identifying and displaying messages containing an identifier | |
US7895529B1 (en) | System and method for processing featured content | |
JP4253315B2 (en) | Knowledge information collecting system and knowledge information collecting method | |
JP2006343827A (en) | Inter-site relation display system | |
JP2006277061A (en) | Knowledge retrieval system, method and program | |
JP2007012100A (en) | Retrieval method and retrieval device or information providing system based on personal information | |
JP5193977B2 (en) | Event notification function providing system | |
JP2008026968A (en) | Data management device, data program, and data management method | |
KR20000049986A (en) | Messaging service system and method for processing the same | |
Tsai et al. | Information services for novelty mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070306 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070703 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071012 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101019 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |