JP2004192335A - E-mail collecting/searching system - Google Patents

E-mail collecting/searching system Download PDF

Info

Publication number
JP2004192335A
JP2004192335A JP2002359571A JP2002359571A JP2004192335A JP 2004192335 A JP2004192335 A JP 2004192335A JP 2002359571 A JP2002359571 A JP 2002359571A JP 2002359571 A JP2002359571 A JP 2002359571A JP 2004192335 A JP2004192335 A JP 2004192335A
Authority
JP
Japan
Prior art keywords
mail
information
search
web page
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002359571A
Other languages
Japanese (ja)
Other versions
JP4028795B2 (en
Inventor
Yoshiyuki Nishi
好行 西
Yasushi Kawashita
靖司 川下
Makoto Uchikado
内角  真
Takehide Mihara
丈英 三原
Masayoshi Kito
政義 鬼頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002359571A priority Critical patent/JP4028795B2/en
Publication of JP2004192335A publication Critical patent/JP2004192335A/en
Application granted granted Critical
Publication of JP4028795B2 publication Critical patent/JP4028795B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an E-mail collecting/searching system simplifying the information collection by E-mails and effectively using the information in the collected E-mails. <P>SOLUTION: This E-mail collecting/searching system is provided with an E-mail collecting means 110 collecting the information of the E-mails from a mail server 10 and storing it in database 130 and an E-mail searching means 120 searching the information of the E-mails stored in the database 130. The E-mail collecting means 110 is provided with a mail information collecting means 111 collecting mail attributes of the E-mails and information of mail texts and attached files, and a Web page collecting means 112 collecting information of the Web pages having URLs described in the mail texts. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は電子メール収集・検索システムにかかり、特に、メールサーバから電子メールの情報を収集してデータベースに蓄積し、蓄積した電子メールの情報を検索する電子メール収集・検索システムに関する。
【0002】
【従来の技術】
従来、電子メールの検索方法として、次のような検索方法が知られている。(1)メールサーバに蓄積されている電子メールの情報を検索する。
【0003】
(2)電子メールをメールサーバからクライアントのファイルシステムにダウンロードして、クライアントで電子メールの情報を検索する。
【0004】
(3)電子メールの情報をデータベースや文書管理システム等に蓄積して検索する。
【0005】
これらの検索方法によれば、電子メールの属性(タイトル、宛先、送信者、受信日時など)を検索条件にした属性検索や、電子メールの本文や添付ファイルに含まれるキーワードを指定した全文検索を行うことがができる。また、
(4)特許文献1によれば、電子メールをHTML化して蓄積することで、蓄積された電子メールを任意の検索条件のもとで全文検索することが可能である。また、
(5)特許文献2によれば、一度の通信で、電子メール本文と電子メール内に書かれたURLアドレスで指定されたウェブページを取得し、保持しておく。これにより通信環境の整備されていないところにおいても、電子メールの内容に記述されたURLを用いて指定されたウェブページを参照することができる。
【0006】
【特許文献1】
特開2001−36568号公報
【0007】
【特許文献2】
特開2001−34548号公報
【0008】
【発明が解決しようとする課題】
近年インターネットが普及し、個人でホームページを持つユーザが急増している。このようなユーザは電子メールで資料を送付する場合、資料をホームページに掲載しておき、メール本文に資料を掲載したウェブページのURLを記述して送付することが多い。また、インターネットを介して各種の情報を収集する場合、ウェブページの情報を収集した後、収集したウェブページのURLを電子メールの本文に記述して送付することができる。
【0009】
このように、メール本文にウェブページのURLが記述されている場合においては、電子メールを検索するときに、メール本文や添付ファイルの外にメール本文に記述されているURLのウェブページも検索対象にしなければならない。しかしながら、前記従来の検索方法(1)ないし(4)においては、メール本文に記述されているURLのウェブページは検索の対象とされていない。このため、所望の電子メールは検索してもヒットしないことになる。
【0010】
また、前記(5)の検索方法によれば、ウェブページを添付ファイルとして保存しておき、これを全文検索の対象にすることができる。しかしながら、この場合は、ウェブページを保存しておくためのディスク容量が増加する。また、ウェブページが更新された場合においても、古いウェブページを参照してしまうことになる。
【0011】
また、前記(3)の検索方法により属性検索や全文検索を行うためには、電子メールの情報をメール属性、メール本文、及び添付ファイル等に分割して、検索用データとしてデータベースや文書管理システム等に蓄積する必要がある。なお、電子メールの情報を、前記検索用のデータとは別に、電子メールのデータとして再利用する必要がある場合には、収集した電子メールの情報をメールクライアントで再利用可能なファイル形式に変換して、データベースや文書管理システム等に蓄積しておく必要があり、この場合には必要とされるディスク容量が増加する。
【0012】
また、複数のユーザで電子メール検索システムを共用して利用する場合、利用者全員のクライアントPC(パソコン)に当該ファイル形式をサポートしているメールクライアントがインストールされていない場合は、前記蓄積したデータを電子メールのデータとして再利用することができない。
【0013】
本発明はこれらの問題点に鑑みてなされたもので、電子メールによる情報収集を簡易化し、また、収集した電子メールの情報を有効活用することのできる電子メール収集・検索システムを提供する。
【0014】
【課題を解決するための手段】
本発明は、上記の課題を解決するために次のような手段を採用した。
【0015】
メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段と、データベースに蓄積した電子メールの情報を検索する電子メール検索手段を備えた電子メール収集・検索システムにおいて、 前記電子メール収集手段は、前記電子メールのメール属性、メール本文及び添付ファイルの情報を収集するメール情報収集手段、及びメール本文に記述されているURLのウェブページの情報を収集するウェブページ収集手段を備えた。
【0016】
【発明の実施の形態】
以下、本発明の実施形態を添付図面を参照しながら説明する。図1は、本発明の実施形態にかかる電子メール収集・検索システムを説明する図である。本実施形態においては、まず、情報提供者がWWWサーバ等から収集した情報を電子メールでメールサーバに送付する。次いで、電子メール収集・検索システムは、前記電子メールの情報をメールサーバから収集してデータベースに蓄積すると共に、このデータベースをエンドユーザに公開する。これによりエンドユーザは前記データベースを検索して各種情報を取得することができる。
【0017】
図1において、10はメールサーバであり、電子メール11を管理する。該電子メール11には図示しない情報提供者がWWWサーバ20から収集したウェブページ21のURLを含んでいる。20はWWWサーバであり、ウェブページ21を管理する。
【0018】
30ないし32はクライアントであり、電子メール収集・検索システム100により収集された電子メールを検索するエンドユーザとなる。
【0019】
100は電子メール収集・検索システム、110は電子メール収集手段でありメールサーバ10から電子メールの情報を収集してデータベース130に蓄積する。111は電子メールのメール属性、メール本文及び添付ファイルの情報を収集するメール情報収集手段、112はメール本文に記述されているURLのウェブページの情報を収集するウェブページ収集手段である。
【0020】
120はデータベースに蓄積した電子メールの情報を検索する電子メール検索手段、121は電子メールの本文あるいは添付ファイルあるいはメール本文に記述されているURLのウェブページの情報にそれぞれ含まれるキーワードを検索条件に指定して電子メールを検索する全文検索手段、122は電子メールの属性、添付ファイルの属性あるいはメール本文に記述されているURLのウェブページの属性を検索条件にして電子メールを検索する属性検索手段、123は電子メール検索手段で検索した電子メールの情報をメール送信可能な形式に再編集した後,これを検索したユーザにメール送信するメールバック手段である。
【0021】
130はデータベースであり、インデックス(属性検索用及び全文検索用)140、電子メールデータ及びウェブページデータ150、関連データ160で構成される。また、前記インデックス(属性検索用及び全文検索用)140は、メール本文のインデックス141、添付ファイルのインデックス142、ウェブページのインデックス143で構成され、それぞれ属性検索用及び全文検索用のインデックスを保持する。また、前記電子メールデータ及びウェブページデータ150は、メール本文と属性151、添付ファイルと属性152、ウェブページの属性153を保持する。また、前記関連データ160は、メール本文と添付ファイルの関連161、及びメール本文とウェブページの関連162を保持する。
【0022】
図2は電子メール収集手段110におけるメール情報収集手段111の処理を説明するフローチャートである。メール情報収集手段111による処理を定期的に実行することで、新着メールの情報と関連データがデータベースに格納される。
【0023】
図2において、まず、ステップ201において、メールサーバ10の新着メールを1件ずつ受信する。ステップ202において、新着メールの有無を判断する。新着メールがあればステップ203に進み、そうでなければ処理を終了する。ステップ203において、受信した電子メールからメール情報(メール属性、メール本文、添付ファイル)を抽出する。ステップ204において、抽出したメール情報(メール本文と属性)をデータベース130のメール本文と属性151に格納し、メール本文のIDを得る。このとき、必要であれば、送信者や宛先の属性によって公開範囲を限定する情報を設定する。ステップ205において、メール情報(メール本文と属性)をもとにメール本文の属性検索及び全文検索用のインデックスを生成し、データベース130のメール本文のインデックス141に格納する。このとき、属性検索及び全文検索用のインデックスの生成は既存の技術を利用する。
【0024】
ステップ206において、添付ファイルの有無を判定する。添付ファイルがある場合はステップ207に進みそうでない場合はステップ210に進む。ステップ207において、抽出したメール情報(添付ファイルと属性)をデータベース130の添付ファイルと属性152に格納207し、添付ファイルのIDを得る。このとき、必要であれば、送信者や宛先の属性によって公開範囲を限定する情報を設定する。また、すでに同じ内容の添付ファイルがデータベースに格納されている場合は、添付ファイルの実体は登録せずに属性だけ登録するといったような配慮をしてもよい。
【0025】
ステップ208において、メール情報(添付ファイルと属性)をもとに添付ファイルの属性検索及び全文検索用のインデックスを生成し、データベース130の添付ファイルのインデックス142に格納する。このとき、属性検索、及び全文検索用のインデックスの生成は既存の技術を利用する。ステップ209において、格納したメール本文のIDと添付ファイルのIDをメール本文と添付ファイルの関連データ161に格納する。ステップ210において、メール本文に記述されているURLを抽出し、ステップ211において、メール本文にURLの記述があるか否かを判定し、記述がある場合はステップ212に進み、ステップ212において、メール本文のIDとURLをメール本文とウェブページの関連162に格納する。
【0026】
図3は、電子メール収集手段110におけるウェブページ収集手段112の処理を説明するフローチャートである。ウェブページ収集手段112を定期的に実行することで、新着メールのメール本文に記述されているURLのウェブページの情報をデータベースに格納する。また、収集済みのウェブページの情報が最新のウェブページの情報に更新される。
【0027】
図3において、ステップ301において、電子メール収集手段110におけるメール情報収集手段111により蓄積したメール本文とウェブページの関連データ162からURLを1件ずつ入力する。ステップ302において、メール本文とウェブページの関連データの有無を判定し、関連データがなければ処理を終了し、そうでなければステップ303に進む。ステップ303において、入力したURLのウェブページが収集済みかどうかチェックする。収集済みであればステップ304に進み、そうでなければステップ305に進む。ステップ304において当該ウェブページが更新されているか否かをチェックする。ウェブページが更新されていなければ、ステップ301に進み、そうでなければ(未収集のウェブページか、または収集済みのウェブページで、かつ、ウェブページが更新されている場合)ステップ305に進む。ステップ305において、ウェブページの情報(ウェブページデータ及びウェブページの属性)を収集する。ステップ306において、収集したウェブページの属性をデータベース130のウェブページの属性153に格納する。ステップ307において、ウェブページの情報(ウェブページデータ及びウェブページの属性)をもとにウェブページの属性検索、及び全文検索用のインデックスを生成し、ウェブページのインデックス143に格納する。このとき、属性検索、及び全文検索用のインデックスの生成は既存の技術を利用する。
【0028】
図4は、収集される電子メールの例を説明する図である。図4において、電子メール1と電子メール2はメール本文にURLが記述されている。また、電子メール2と電子メール3には添付ファイルが添付されている。また、図4に示す電子メールをデータベースに蓄積する例を図5ないし図9に示す。なお、図5ないし図7においては、メール本文データ、添付ファイルデータ、及びウェブページデータを同一テーブルに格納することを想定している。
【0029】
図5は、メール本文データを蓄積するデータベースの例を説明する図である。図5において、メール本文データは、電子メールを識別するID501と、個人メールか共用メールかを識別する公開502と、メール本文か添付ファイルかウェブデータかを識別する種別503と、電子メールのタイトル504と、電子メールの宛先505と、電子メールの送信者506と、電子メールの受信日時507と、メール本文をアプリケーションで参照する場合のファイル名508と、ファイルサイズ509と、メール本文(BLOB)510と、全文検索用データ511の各属性で構成される。なお、全文検索用データ511は、既存の技術を利用して全文検索インデックスを作成するためのデータであり、利用する既存の技術によっては不要な場合がある。
【0030】
図6は、添付ファイルデータを蓄積するデータベースの例を説明する図である。図6において、添付ファイルデータは、添付ファイルを識別するID601と、当該添付ファイルの電子メールが個人メールか共用メールかを識別する公開602と、メール本文か添付ファイルかウェブデータかを識別する種別603と、電子メールのタイトル604と、電子メールの宛先605と、電子メールの送信者606と、電子メールの受信日時607と、添付ファイル名608と、ファイルサイズ609と、添付ファイル(BLOB)610と、全文検索用データ611の各属性で構成される。なお、全文検索用データ611は、既存の技術を利用して全文検索インデックスを作成するためのデータであり、利用する既存の技術によっては不要な場合がある。
【0031】
図7は、ウェブページデータを蓄積するデータベースの例を説明する図である。図7において、ウェブページデータは、ウェブページのURL701と、メール本文か添付ファイルかウェブデータかを識別する種別702と、ウェブページのタイトル703と、ウェブページの作成者704と、ウェブページの更新日時705と、全文検索用データ706の各属性で構成される。なお、全文検索用データ706は、既存の技術を利用して全文検索インデックスを作成するためのデータであり、利用する既存の技術によっては不要な場合がある。
【0032】
図8は、メール本文と添付ファイルの関連データを蓄積するデータベースの例を説明する図である。図8において、メール本文と添付ファイルの関連データは、電子メールを識別するID801と、添付ファイルを識別するID802の各属性で構成される。
【0033】
図9は、メール本文とウェブページの関連データを蓄積するデータベースの例を説明する図である。図9において、メール本文とウェブページの関連データは、電子メールを識別するID901と、ウェブページのURL902の各属性で構成される。
【0034】
図10は、電子メール検索手段120における検索条件の入力画面の例を説明する図である。図10において、公開種別1001は、個人メール、及び共用メールを検索対象とするかどうかを指定する。検索対象1002は、メール本文、添付ファイル、及びウェブページを検索対象とするかどうかを指定する。全文検索条件1003は、メール本文、添付ファイル、及びウェブページを全文検索するキーワードを指定する。属性検索条件1004は、メール本文、添付ファイル、及びウェブページを属性検索する条件を指定する。
【0035】
この画面で、キーワードに「電子メール」と「SMTP」を指定1005して、検索実行(メール本文のみ表示)1006をクリックすると、指定したキーワードが電子メールのメール本文、または添付ファイル、またはメール本文に記述されているURLのウェブページに含まれる電子メールのメール本文を検索できる。また、この画面で、キーワードに「電子メール」と「SMTP」を指定1005して、検索実行(メール本文、添付ファイル、ウェブページを表示)1007をクリックすると、指定したキーワードを含むメール本文、添付ファイル、及びウェブページの情報を検索できる。
【0036】
図11は、図10で示した検索条件で検索実行(メール本文のみ表示)1006をクリックしたとき表示される検索結果一覧画面の例を示す図である。図11において、種別1101は、メール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1102は電子メールのタイトルである。送信/作成者1103は、電子メールの送信者である。受信/更新日時1104は、電子メールの受信日時である。関連情報1105は、電子メールの関連情報を表示するアンカーである。
【0037】
この検索結果一覧画面から、データベースに蓄積した電子メールの本文、及び関連情報が表示できる。例えば、電子メール「仕様書送付の件」のアンカー1106をクリックすると、電子メール「仕様書送付の件」のメール本文が表示される。また、電子メール「仕様書送付の件」の関連情報のアンカー1107をクリックすると、電子メール「仕様書送付の件」の関連情報が表示される。
【0038】
図12は図10で示した検索条件で検索実行(メール本文、添付ファイル、ウェブページを表示)1007をクリックして表示される検索結果一覧画面の例である。
【0039】
図12において、種別1201は、メール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1202は電子メール、またはウェブページのタイトルである。URL/ファイル名1203は、ウェブページのURL、または添付ファイル名である。送信/作成者1204は、電子メールの送信者、またはウェブページの作成者である。受信/更新日時1205は、電子メールの受信日時、またはウェブページの更新日時である。関連情報1206は、関連情報を表示するアンカーである。
【0040】
この検索結果一覧画面から、データベースに蓄積した電子メールの本文、添付ファイル、及びメール本文に記述されているURLのウェブページが表示できる。また、検索でヒットした情報に関連する電子メールの関連情報が表示できる。例えば、電子メール「SMTPについて」のアンカー1207をクリックすると、電子メール「SMTPについて」のメール本文が表示される。また、電子メール「仕様書送付の件」の添付ファイル「SMTP.doc」のアンカー1108をクリックすると、添付ファイル「SMTP.doc」が表示される。また、ウェブページ「E−mail Page」のURLのアンカー1209をクリックすると、タイトル「E−mail Page」のウェブページが表示される。また、ウェブページ「Java(登録商標) Mail」の関連情報のアンカー1210をクリックすると、メール本文にウェブページ「Java(登録商標) Mail」のURLが記述されている電子メールの関連情報が表示される。
【0041】
図13は、図11に示す関連情報のアンカー1107をクリックした場合に表示される関連情報画面の例を示す図である。図13において、対象1301は検索でヒットした対象を「→」で示している。この例では、メール本文が検索でヒットした対象である。種別1302はメール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1303は電子メールのタイトル、またはウェブページのタイトルである。URL/ファイル名1304はウェブページのURL、または添付ファイル名である。メール送信1305はメール送信用のアンカーである。
【0042】
このアンカーをクリックすると、検索でヒットした電子メールの情報を電子メールの形式に再編集した後、検索したユーザにメール送信する。例えば、送信1306をクリックすると、電子メール「SMTPについて」のメール本文と属性、及び添付ファイルを電子メールの形式に再編集した後、検索したユーザにメール送信する。
【0043】
図14は、図12で示した関連情報のアンカー1210をクリックした場合に表示される関連情報画面の例を示す図である。図14において、対象1401は検索でヒットした対象を「→」で示している。この例では、ウェブページが検索でヒットした対象である。種別1402はメール本文、添付ファイル、及びウェブページを識別するための属性である。タイトル1403は電子メールのタイトル、またはウェブページのタイトルである。URL/ファイル名1404はウェブページのURL、または添付ファイル名である。メール送信1405はメール送信用のアンカーである。
【0044】
このアンカーをクリックすると、検索でヒットした電子メールの情報を電子メールの形式に再編集した後、検索したユーザにメール送信する。例えば、送信1406をクリックすると、電子メール「Java(登録商標)調査結果」のメール本文と属性を電子メールの形式に再編集した後、検索したユーザにメール送信する。また、送信1407をクリックすると、電子メール「SMTPについて」のメール本文と属性、及び添付ファイルを電子メールの形式に再編集した後、検索したユーザにメール送信する。
【0045】
図15は、電子メール検索手段120による全文検索121及び属性検索122の各処理を説明するフローチャートである。このフローチャートの各処理により図10ないし図12で示した電子メール検索システムの各画面を得ることができる。
【0046】
図15において、まず、図10の画面を参照して公開種別1001、検索対象1002、全文検索条件1003、及び属性検索条件1004を取得する(ステップ1501)。次に、検索条件式を生成し(ステップ1502)、データベースを検索する(ステップ1503)。このとき、全文検索や属性検索は既存の技術を利用する。ステップ1504においてメール本文がヒットした場合はヒットしたメール本文の情報を検索結果一覧に蓄積する(ステップ1505)。
【0047】
添付ファイルがヒットし(ステップ1506)、かつ、図10における検索実行(メール本文、添付ファイル、ウェブページを表示)1007がクリックされた場合(ステップ1507)、ヒットした添付ファイルの情報を検索結果一覧に蓄積する(ステップ1508)。
【0048】
添付ファイルがヒットし(ステップ1506)、かつ、図10において検索実行(メール本文のみ表示)1006がクリックされた場合(ステップ1507)、メール本文と添付ファイルの関連データからメール本文のIDを1件づつ取得し、該当するメール本文の情報を検索結果一覧に蓄積する(ステップ1509)。
【0049】
ウェブページがヒットし1510、かつ、図10における検索実行(メール本文、添付ファイル、ウェブページを表示)1007がクリックされた場合1511、ヒットしたウェブページの情報を検索結果一覧に蓄積1512する。
【0050】
ウェブページがヒットし(ステップ1510)、かつ、図10における検索実行(メール本文のみ表示)1006がクリックされた場合(ステップ1511)、メール本文とウェブページの関連データからメール本文のIDを1件づつ取得し、該当するメール本文の情報を検索結果一覧に蓄積する(ステップ1513)。最後に、検索結果一覧を表示する(ステップ1514)。
【0051】
図16は電子メール検索手段120による関連情報表示画面(図13ないし図14)の表示情報取得処理を説明するフローチャートである。図16において、まず、関連情報を取得する種別を判定する(ステップ1601)。種別がメール本文のときは、当該電子メールの関連情報を取得する(ステップ1602)。
【0052】
ステップ1602における電子メールの関連情報取得に際しては、まず、メール本文と添付ファイルの関連データ161から添付ファイルのIDを1件づつ取得し(ステップ1603)、添付ファイルのIDがなくなるまで添付ファイルの情報を取得する(ステップ1604,1605)。次に、メール本文とウェブページの関連データ162からウェブページのURLを1件づつ取得し(ステップ1606)、ウェブページのURLがなくなるまでウェブページの情報を取得する(ステップ1607,1608)。
【0053】
種別が添付ファイルのときは、添付ファイルのIDをキーにしてメール本文と添付ファイルの関連データ161からメール本文のIDを1件づつ取得し(ステップ1609)、メール本文のIDがなくなるまで当該電子メールの関連情報を取得する(ステップ1610,1611)。
【0054】
種別がウェブページのときは、ウェブページのURLをキーにしてメール本文とウェブページの関連データ162からメール本文のIDを1件づつ取得し(ステップ1612)、メール本文のIDがなくなるまで、当該電子メールの関連情報を取得する(ステップ1613,1614)。
【0055】
図17は電子メール検索手段120におけるメールバック手段123の処理を説明するフローチャートである。図17において、まず、検索でヒットした電子メールのIDをキーにして、メール本文と属性を取得する(ステップ1701)。次に、メール本文と添付ファイルの関連データ161から添付ファイルのIDを1件づつ取得し(ステップ1702)、添付ファイルのIDがなくなるまで添付ファイルを取得する(ステップ1703,1704)。取得したメール本文と属性、及び添付ファイルをメール送信可能な形式に編集して(ステップ1705)、ログイン中のエンドユーザにメール送信する(ステップ1706)。
【0056】
以上説明したように本発明の実施形態によれば、メールサーバから電子メールの情報を収集してデータベースに蓄積する際に、メール本文に記述されているURLのウェブページの情報を収集可能となる。また、メール本文に記述されているURLのウェブページを検索対象にして電子メールを検索するための必要最小限の情報をデータベースに蓄積できる。また、電子メールの検索時に、電子メールの本文や添付ファイルやメール本文に記述されているURLのウェブページの情報に含まれているキーワードを検索条件に指定して全文検索できる。また、電子メールの検索時に、電子メールの属性(タイトル、宛先、送信者、受信日時など)や添付ファイルの属性(ファイル名、ファイルサイズなど)やウェブページの属性(URL、タイトル、作成者、更新日付など)を検索条件にして属性検索できる。また、検索した電子メールの情報をメール送信可能な形式に再編集した後、これを検索したユーザにメール送信することができる。
【0057】
【発明の効果】
以上説明したように本発明によれば、電子メールによる情報収集を簡易化し、また、収集した電子メールの情報を有効活用することのできる電子メール収集・検索システムを提供することができる。
【図面の簡単な説明】
【図1】本発明の実施形態にかかる電子メール収集・検索システムを説明する図である。
【図2】メール情報収集手段の処理を説明するフローチャートである。
【図3】ウェブページ収集手段の処理を説明するフローチャートである。
【図4】収集される電子メールの例を説明する図である。
【図5】メール本文データを蓄積するデータベースの例を説明する図である。
【図6】添付ファイルデータを蓄積するデータベースの例を説明する図である。
【図7】ウェブページデータを蓄積するデータベースの例を説明する図である。
【図8】メール本文と添付ファイルの関連データを蓄積するデータベースの例を説明する図である。
【図9】メール本文とウェブページの関連データを蓄積するデータベースの例を説明する図である。
【図10】電子メール検索手段における検索条件の入力画面の例を説明する図である。
【図11】検索結果一覧画面の例を示す図である。
【図12】検索結果一覧画面の例を示す図である。
【図13】関連情報画面の例を示す図である。
【図14】関連情報画面の例を示す図である。
【図15】全文検索及び属性検索の各処理を説明するフローチャートである。
【図16】関連情報表示画面の表示情報取得処理を説明するフローチャートである。
【図17】メールバック手段の処理を説明するフローチャートである。
【符号の説明】
10 メールサーバ
11 電子メール
20 WWWサーバ
21 URLのウェブページ
30、31,32 クライアント
100 電子メール収集・検索システム
110 電子メール収集手段
111 メール情報収集手段
112 ウェブページ収集手段
120 電子メール検索手段
121 全文検索手段
122 属性検索手段
123 メールバック手段
130 データベース
140 インデックス(属性検索、及び全文検索用)
141 メール本文のインデックス
142 添付ファイルのインデックス
143 ウェブページのインデックス
150 電子メールデータ及びウェブページデータ
151 メール本文と属性
152 添付ファイルと属性
153 ウェブページの属性
160 関連データ
161 メール本文と添付ファイルの関連
162 メール本文とウェブページの関連
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an e-mail collection / search system, and more particularly to an e-mail collection / search system that collects e-mail information from a mail server, stores the e-mail information in a database, and searches for the stored e-mail information.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, the following search methods have been known as search methods for e-mail. (1) Search for information of electronic mail stored in the mail server.
[0003]
(2) The electronic mail is downloaded from the mail server to the file system of the client, and the client searches for the information of the electronic mail.
[0004]
(3) E-mail information is stored in a database or a document management system and searched.
[0005]
According to these search methods, an attribute search using the attributes (e.g., title, destination, sender, reception date and time) of an e-mail as a search condition, and a full-text search specifying a keyword included in an e-mail text or an attached file are performed. Can be done. Also,
(4) According to Patent Literature 1, by storing an e-mail in HTML and storing it, it is possible to perform a full-text search on the stored e-mail under arbitrary search conditions. Also,
(5) According to Patent Literature 2, a web page specified by an e-mail text and a URL address written in the e-mail is acquired and held in one communication. This allows the user to refer to the specified web page using the URL described in the content of the e-mail even in a place where the communication environment is not maintained.
[0006]
[Patent Document 1]
JP 2001-36568 A
[0007]
[Patent Document 2]
JP 2001-34548 A
[0008]
[Problems to be solved by the invention]
2. Description of the Related Art In recent years, the Internet has become widespread, and the number of users who have homepages by themselves has increased rapidly. When sending a material by e-mail, such a user often posts the material on a homepage and describes the URL of the web page on which the material is posted in the body of the mail. When collecting various types of information via the Internet, after collecting the information of the web page, the URL of the collected web page can be described in the body of the e-mail and sent.
[0009]
As described above, when the URL of the web page is described in the mail body, when searching for an e-mail, the web page of the URL described in the mail body besides the mail body and attached file is also searched. Must be. However, in the conventional search methods (1) to (4), the web page of the URL described in the body of the mail is not searched. For this reason, the desired e-mail will not be hit even if searched.
[0010]
Further, according to the search method (5), the web page can be stored as an attached file and can be subjected to full-text search. However, in this case, the disk capacity for storing the web page increases. In addition, even when the web page is updated, the old web page is referred to.
[0011]
In order to perform an attribute search or a full-text search by the search method (3), information of an e-mail is divided into mail attributes, mail texts, attached files, and the like, and a database or a document management system is used as search data. And so on. If it is necessary to reuse the e-mail information as e-mail data separately from the search data, the collected e-mail information is converted into a file format that can be reused by a mail client. Then, it is necessary to accumulate them in a database, a document management system, or the like, and in this case, the required disk capacity increases.
[0012]
If a plurality of users share the e-mail search system, and if a mail client supporting the file format is not installed in the client PCs (PCs) of all the users, the stored data is Cannot be reused as e-mail data.
[0013]
The present invention has been made in view of these problems, and provides an e-mail collection / search system capable of simplifying information collection by e-mail and effectively utilizing the information of the collected e-mail.
[0014]
[Means for Solving the Problems]
The present invention employs the following means in order to solve the above problems.
[0015]
An e-mail collection / search system comprising: an e-mail collection unit that collects e-mail information from a mail server and stores the e-mail information in a database; and an e-mail search unit that searches for e-mail information stored in the database. The collecting means includes a mail information collecting means for collecting information of the mail attribute, the mail body and the attached file of the electronic mail, and a web page collecting means for collecting information of a URL web page described in the mail body. .
[0016]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a diagram illustrating an electronic mail collection / search system according to an embodiment of the present invention. In the present embodiment, first, an information provider sends information collected from a WWW server or the like to a mail server by e-mail. Next, the e-mail collection / search system collects the e-mail information from the mail server and accumulates the information in a database, and publishes this database to end users. This allows the end user to search the database and obtain various information.
[0017]
In FIG. 1, reference numeral 10 denotes a mail server, which manages an e-mail 11. The e-mail 11 includes the URL of the web page 21 collected by the information provider (not shown) from the WWW server 20. Reference numeral 20 denotes a WWW server which manages a web page 21.
[0018]
Reference numerals 30 to 32 denote clients, which are end users who search for the electronic mail collected by the electronic mail collection / search system 100.
[0019]
Reference numeral 100 denotes an e-mail collection / search system, and 110 denotes e-mail collection means. The e-mail information is collected from the mail server 10 and stored in the database 130. Reference numeral 111 denotes a mail information collecting unit that collects information of an e-mail attribute, a mail body, and an attached file, and 112 denotes a web page collecting unit that collects information of a URL web page described in the mail body.
[0020]
Reference numeral 120 denotes an e-mail search unit for searching e-mail information stored in a database; 121, a keyword included in information of a web page of a URL described in the body of the e-mail, an attached file, or the body of the e-mail; A full-text search means for searching for an e-mail by designating it. 122 is an attribute search means for searching for an e-mail by using the attribute of an e-mail, the attribute of an attached file, or the attribute of a web page of a URL described in the mail text as a search condition. Reference numeral 123 denotes mail back means for re-editing the information of the e-mail retrieved by the e-mail retrieval means into a format in which the e-mail can be transmitted, and then transmitting the e-mail to the user who retrieved the information.
[0021]
Reference numeral 130 denotes a database, which includes an index (for attribute search and full-text search) 140, e-mail data and web page data 150, and related data 160. The index (for attribute search and for full-text search) 140 includes an index 141 for a mail text, an index for attached files 142, and an index for web pages 143, and holds indexes for attribute search and full-text search, respectively. . The e-mail data and the web page data 150 hold a mail text and an attribute 151, an attached file and an attribute 152, and an attribute 153 of a web page. The related data 160 holds a relation 161 between the mail text and the attached file and a relation 162 between the mail text and the web page.
[0022]
FIG. 2 is a flowchart for explaining the processing of the mail information collecting unit 111 in the electronic mail collecting unit 110. By periodically executing the processing by the mail information collecting unit 111, information on the newly arrived mail and related data are stored in the database.
[0023]
In FIG. 2, first, in step 201, new mails of the mail server 10 are received one by one. In step 202, it is determined whether there is any new mail. If there is a new mail, the process proceeds to step 203; otherwise, the process ends. In step 203, mail information (mail attribute, mail text, attached file) is extracted from the received electronic mail. In step 204, the extracted mail information (mail body and attribute) is stored in the mail body and attribute 151 of the database 130, and the ID of the mail body is obtained. At this time, if necessary, information for limiting the disclosure range according to the attributes of the sender and the destination is set. In step 205, an index for attribute search and full text search of the mail body is generated based on the mail information (mail body and attribute), and stored in the mail body index 141 of the database 130. At this time, an existing technology is used to generate an index for attribute search and full-text search.
[0024]
In step 206, the presence or absence of an attached file is determined. If there is an attached file, the process proceeds to step 207; otherwise, the process proceeds to step 210. In step 207, the extracted mail information (attached file and attribute) is stored 207 in the attached file and attribute 152 of the database 130, and the ID of the attached file is obtained. At this time, if necessary, information for limiting the disclosure range according to the attributes of the sender and the destination is set. When an attached file having the same content is already stored in the database, consideration may be given to registering only the attribute without registering the entity of the attached file.
[0025]
In step 208, an index for attribute search and full text search of the attached file is generated based on the mail information (attached file and attribute) and stored in the attached file index 142 of the database 130. At this time, an existing technology is used for generating an index for attribute search and full-text search. In step 209, the ID of the stored mail text and the ID of the attached file are stored in the associated data 161 of the mail text and the attached file. In step 210, the URL described in the mail body is extracted. In step 211, it is determined whether or not the URL of the mail is described. When the URL is described, the process proceeds to step 212. The body ID and URL are stored in the association 162 between the mail body and the web page.
[0026]
FIG. 3 is a flowchart for explaining processing of the web page collection unit 112 in the electronic mail collection unit 110. By periodically executing the web page collection unit 112, the information of the URL web page described in the mail body of the new mail is stored in the database. Also, the information of the collected web page is updated to the latest web page information.
[0027]
In FIG. 3, in step 301, URLs are input one by one from the mail text and the related data 162 of the web page accumulated by the mail information collecting means 111 in the electronic mail collecting means 110. In step 302, it is determined whether or not there is related data between the mail text and the web page. If there is no related data, the process ends. Otherwise, the process proceeds to step 303. In step 303, it is checked whether the web page of the input URL has been collected. If collected, the process proceeds to step 304; otherwise, the process proceeds to step 305. In step 304, it is checked whether the web page has been updated. If the web page has not been updated, the process proceeds to step 301; otherwise (if the web page is an uncollected web page or a collected web page and the web page has been updated), the process proceeds to step 305. In step 305, web page information (web page data and web page attributes) is collected. In step 306, the collected web page attributes are stored in the web page attributes 153 of the database 130. In step 307, an index for web page attribute search and full text search index is generated based on the web page information (web page data and web page attribute), and stored in the web page index 143. At this time, an existing technology is used for generating an index for attribute search and full-text search.
[0028]
FIG. 4 is a diagram illustrating an example of collected e-mail. In FIG. 4, the URLs of the electronic mail 1 and the electronic mail 2 are described in the mail body. An attached file is attached to the e-mail 2 and the e-mail 3. FIGS. 5 to 9 show examples of storing the e-mail shown in FIG. 4 in the database. 5 to 7, it is assumed that the mail text data, the attached file data, and the web page data are stored in the same table.
[0029]
FIG. 5 is a diagram illustrating an example of a database that stores mail body data. In FIG. 5, mail body data includes an ID 501 for identifying an electronic mail, a publication 502 for identifying a personal mail or a shared mail, a type 503 for identifying a mail body, an attached file, or web data, and a title of the electronic mail. 504, an e-mail destination 505, an e-mail sender 506, an e-mail reception date and time 507, a file name 508 when the e-mail text is referred to by an application, a file size 509, and an e-mail text (BLOB) 510 and each attribute of the full-text search data 511. The full-text search data 511 is data for creating a full-text search index using an existing technology, and may not be necessary depending on the existing technology to be used.
[0030]
FIG. 6 is a diagram illustrating an example of a database that stores attached file data. In FIG. 6, the attached file data includes an ID 601 for identifying the attached file, a publication 602 for identifying whether the electronic mail of the attached file is a personal email or a shared email, and a type for identifying whether the email text is an attached file or an attached file or web data. 603, an e-mail title 604, an e-mail destination 605, an e-mail sender 606, an e-mail reception date and time 607, an attached file name 608, a file size 609, and an attached file (BLOB) 610. And the attributes of the full-text search data 611. The full-text search data 611 is data for creating a full-text search index using an existing technology, and may be unnecessary depending on the existing technology to be used.
[0031]
FIG. 7 is a diagram illustrating an example of a database that stores web page data. In FIG. 7, the web page data includes a URL 701 of the web page, a type 702 for identifying a mail text, an attached file, or web data, a web page title 703, a web page creator 704, and a web page update. It consists of the date and time 705 and each attribute of the full-text search data 706. The full-text search data 706 is data for creating a full-text search index using an existing technology, and may not be necessary depending on the existing technology to be used.
[0032]
FIG. 8 is a diagram illustrating an example of a database that stores data related to a mail text and an attached file. In FIG. 8, the related data between the mail text and the attached file is composed of attributes of an ID 801 for identifying the electronic mail and an ID 802 for identifying the attached file.
[0033]
FIG. 9 is a diagram illustrating an example of a database that stores related data between a mail text and a web page. In FIG. 9, the related data between the mail text and the web page includes an ID 901 for identifying the electronic mail and each attribute of the URL 902 of the web page.
[0034]
FIG. 10 is a view for explaining an example of a search condition input screen in the electronic mail search means 120. In FIG. 10, a publication type 1001 specifies whether a personal mail and a shared mail are to be searched. The search target 1002 specifies whether to search the mail text, the attached file, and the web page. The full-text search condition 1003 specifies a keyword for performing a full-text search of a mail text, an attached file, and a web page. The attribute search condition 1004 specifies a condition for performing attribute search on the mail text, the attached file, and the web page.
[0035]
On this screen, specify “E-mail” and “SMTP” as keywords 1005 and execute search (display only mail text) 1006. Can be searched for the email body of the email included in the URL web page described in. Also, on this screen, specify "E-mail" and "SMTP" as keywords 1005 and execute search (display mail text, attached file, web page) 1007. File and web page information can be searched.
[0036]
FIG. 11 is a diagram showing an example of a search result list screen displayed when a search execution (only the text of the mail) 1006 is clicked under the search conditions shown in FIG. In FIG. 11, a type 1101 is an attribute for identifying a mail text, an attached file, and a web page. Title 1102 is the title of the e-mail. The sender / creator 1103 is the sender of the e-mail. The reception / update date and time 1104 is the date and time when the e-mail was received. The related information 1105 is an anchor for displaying related information of the electronic mail.
[0037]
From the search result list screen, the text of the e-mail accumulated in the database and related information can be displayed. For example, when the anchor 1106 of the e-mail "specification transmission" is clicked, the e-mail text of the e-mail "specification transmission" is displayed. Further, when the anchor 1107 of the related information of the e-mail “specification transmission” is clicked, the relevant information of the e-mail “specification transmission” is displayed.
[0038]
FIG. 12 shows an example of a search result list screen displayed by clicking on a search execution (displaying mail text, attached file, web page) 1007 under the search conditions shown in FIG.
[0039]
In FIG. 12, a type 1201 is an attribute for identifying a mail text, an attached file, and a web page. The title 1202 is an e-mail or a web page title. The URL / file name 1203 is a URL of a web page or an attached file name. The sender / creator 1204 is the sender of the e-mail or the creator of the web page. The reception / update date and time 1205 is the date and time when the e-mail was received or the date and time when the web page was updated. The related information 1206 is an anchor that displays the related information.
[0040]
From the search result list screen, the web page of the URL described in the body of the e-mail, the attached file, and the body of the e-mail stored in the database can be displayed. Also, related information of an e-mail related to the information hit in the search can be displayed. For example, when the anchor 1207 of the e-mail "about SMTP" is clicked, the mail text of the e-mail "about SMTP" is displayed. Also, when the user clicks the anchor 1108 of the attached file “SMTP.doc” of the electronic mail “Specifications sent”, the attached file “SMTP.doc” is displayed. Further, if the anchor 1209 of the URL of the web page “E-mail Page” is clicked, the web page with the title “E-mail Page” is displayed. Further, when the anchor 1210 of the related information of the web page “Java (registered trademark) Mail” is clicked, the related information of the electronic mail in which the URL of the web page “Java (registered trademark) Mail” is described in the body of the mail is displayed. You.
[0041]
FIG. 13 is a diagram illustrating an example of the related information screen displayed when the anchor 1107 of the related information illustrated in FIG. 11 is clicked. In FIG. 13, a target 1301 is a target hit by a search is indicated by “→”. In this example, the mail text is the target of the search. The type 1302 is an attribute for identifying a mail text, an attached file, and a web page. The title 1303 is the title of an e-mail or the title of a web page. The URL / file name 1304 is a URL of a web page or an attached file name. The mail transmission 1305 is an anchor for mail transmission.
[0042]
When the anchor is clicked, the information of the e-mail hit by the search is re-edited into an e-mail format, and then transmitted to the searched user. For example, when the transmission 1306 is clicked, the mail body and attribute of the e-mail “About SMTP” and the attached file are re-edited into the e-mail format, and then transmitted to the searched user.
[0043]
FIG. 14 is a diagram illustrating an example of the related information screen displayed when the anchor 1210 of the related information illustrated in FIG. 12 is clicked. In FIG. 14, a target 1401 is a target hit by a search is indicated by “→”. In this example, the web page is a target hit in the search. The type 1402 is an attribute for identifying a mail text, an attached file, and a web page. The title 1403 is the title of an e-mail or the title of a web page. The URL / file name 1404 is a URL of a web page or an attached file name. The mail transmission 1405 is an anchor for mail transmission.
[0044]
When the anchor is clicked, the information of the e-mail hit by the search is re-edited into an e-mail format, and then transmitted to the searched user. For example, when transmission 1406 is clicked, the mail body and attributes of the electronic mail “Java (registered trademark) search result” are re-edited into an electronic mail format, and then the mail is transmitted to the searched user. When the user clicks send 1407, the mail body and attribute of the e-mail "About SMTP" and the attached file are re-edited to the e-mail format, and then transmitted to the searched user by e-mail.
[0045]
FIG. 15 is a flowchart illustrating each process of the full text search 121 and the attribute search 122 by the electronic mail search means 120. The respective screens of the electronic mail search system shown in FIGS. 10 to 12 can be obtained by the respective processes of this flowchart.
[0046]
Referring to FIG. 15, first, a public type 1001, a search target 1002, a full-text search condition 1003, and an attribute search condition 1004 are acquired with reference to the screen of FIG. 10 (step 1501). Next, a search condition expression is generated (step 1502), and the database is searched (step 1503). At this time, the existing technology is used for the full text search and the attribute search. If the mail text is hit in step 1504, the information of the hit mail text is accumulated in the search result list (step 1505).
[0047]
When the attached file is hit (step 1506) and the search execution (display of the mail text, the attached file, the web page) 1007 in FIG. 10 is clicked (step 1507), the information of the hit attached file is displayed in the search result list. (Step 1508).
[0048]
If the attached file is hit (step 1506) and the search execution (only the mail text is displayed) 1006 is clicked in FIG. 10 (step 1507), one ID of the mail text is obtained from the data related to the mail text and the attached file. Then, the information of the corresponding mail text is acquired and stored in a search result list (step 1509).
[0049]
If a web page is hit 1510 and a search execution (display of mail text, attached file, web page) 1007 in FIG. 10 is clicked 1511, information of the hit web page is stored 1512 in a search result list.
[0050]
When the web page is hit (step 1510) and the search execution (only the text of the mail) 1006 in FIG. 10 is clicked (step 1511), one ID of the text of the mail is obtained from the relevant data of the text of the mail and the web page. The mail body information is obtained and stored in the search result list (step 1513). Finally, a search result list is displayed (step 1514).
[0051]
FIG. 16 is a flowchart for explaining display information acquisition processing of the related information display screen (FIGS. 13 and 14) by the electronic mail search means 120. In FIG. 16, first, the type of acquiring the related information is determined (step 1601). When the type is the mail text, the related information of the electronic mail is acquired (step 1602).
[0052]
In acquiring the related information of the e-mail in step 1602, first, the ID of the attached file is acquired one by one from the mail body and the related data 161 of the attached file (step 1603). Are acquired (steps 1604 and 1605). Next, URLs of the web pages are acquired one by one from the mail text and the related data 162 of the web pages (step 1606), and the information of the web pages is acquired until the URLs of the web pages disappear (steps 1607, 1608).
[0053]
If the type is an attached file, the ID of the attached file is acquired as a key, and the ID of the attached message is acquired one by one from the associated data 161 of the attached file and the attached file (step 1609). The related information of the mail is obtained (steps 1610 and 1611).
[0054]
If the type is a web page, the ID of the mail body is acquired one by one from the mail body and the related data 162 of the web page using the URL of the web page as a key (step 1612). The related information of the e-mail is acquired (steps 1613 and 1614).
[0055]
FIG. 17 is a flowchart for explaining the processing of the mail back means 123 in the electronic mail search means 120. Referring to FIG. 17, first, a mail text and attributes are acquired using the ID of the electronic mail hit by the search as a key (step 1701). Next, the IDs of the attached files are acquired one by one from the mail text and the associated data 161 of the attached files (step 1702), and the attached files are acquired until the IDs of the attached files are exhausted (steps 1703, 1704). The acquired mail text, attribute, and attached file are edited into a format that allows mail transmission (step 1705), and the mail is transmitted to the logged-in end user (step 1706).
[0056]
As described above, according to the embodiment of the present invention, when collecting e-mail information from a mail server and storing the information in a database, it is possible to collect information on a URL web page described in a mail body. . Further, it is possible to accumulate in a database the minimum necessary information for searching for an e-mail with the URL web page described in the mail text as a search target. When searching for an e-mail, a full-text search can be performed by specifying a keyword included in the information of the URL web page described in the body of the e-mail, the attached file, or the body of the e-mail as a search condition. Also, when searching for an e-mail, the attributes of the e-mail (title, destination, sender, reception date and time, etc.), the attributes of the attached file (file name, file size, etc.) and the attributes of the web page (URL, title, creator, Attribute search can be performed using the update date as a search condition. In addition, after re-editing the retrieved e-mail information into a format that allows e-mail transmission, the e-mail can be transmitted to the retrieved user by e-mail.
[0057]
【The invention's effect】
As described above, according to the present invention, it is possible to provide an e-mail collection / search system capable of simplifying the collection of information by e-mail and effectively utilizing the information of the collected e-mail.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an electronic mail collection / search system according to an embodiment of the present invention.
FIG. 2 is a flowchart illustrating processing of a mail information collecting unit.
FIG. 3 is a flowchart illustrating processing of a web page collection unit.
FIG. 4 is a diagram illustrating an example of collected e-mail.
FIG. 5 is a diagram illustrating an example of a database that stores mail body data.
FIG. 6 is a diagram illustrating an example of a database that stores attached file data.
FIG. 7 is a diagram illustrating an example of a database that stores web page data.
FIG. 8 is a diagram illustrating an example of a database that stores data related to a mail text and an attached file.
FIG. 9 is a diagram illustrating an example of a database that stores data relating to a mail text and a web page.
FIG. 10 is a view for explaining an example of a search condition input screen in the electronic mail search means.
FIG. 11 is a diagram showing an example of a search result list screen.
FIG. 12 is a diagram showing an example of a search result list screen.
FIG. 13 is a diagram showing an example of a related information screen.
FIG. 14 is a diagram showing an example of a related information screen.
FIG. 15 is a flowchart illustrating each process of a full-text search and an attribute search.
FIG. 16 is a flowchart illustrating a display information acquisition process of a related information display screen.
FIG. 17 is a flowchart illustrating processing of a mail back unit.
[Explanation of symbols]
10 Mail server
11 Email
20 WWW server
21 URL web page
30, 31, 32 clients
100 E-mail collection and search system
110 E-mail collection means
111 Mail information collection means
112 Web page collection means
120 E-mail search means
121 Full text search means
122 Attribute search means
123 mail back means
130 Database
140 Index (for attribute search and full text search)
141 Email Body Index
142 Attachment Index
143 Web Page Index
150 E-mail data and web page data
151 Email body and attributes
152 Attachments and Attributes
153 Web Page Attributes
160 Related data
161 Relationship between email text and attached files
162 Relationship between email text and web page

Claims (6)

メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段と、データベースに蓄積した電子メールの情報を検索する電子メール検索手段を備えた電子メール収集・検索システムにおいて、前記電子メール収集手段は、前記電子メールのメール属性、メール本文及び添付ファイルの情報を収集するメール情報収集手段、及びメール本文に記述されているURLのウェブページの情報を収集するウェブページ収集手段を備えたことを特徴とする電子メール収集・検索システム。An e-mail collection and search system comprising: an e-mail collection unit that collects e-mail information from a mail server and stores the e-mail information in a database; and an e-mail search unit that searches for e-mail information stored in the database. The collecting means includes a mail information collecting means for collecting information of the mail attribute, the mail body and the attached file of the electronic mail, and a web page collecting means for collecting information of a URL web page described in the mail body. An e-mail collection and search system characterized by the following. メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段と、データベースに蓄積した電子メールの情報を検索する電子メール検索手段を備えた電子メール収集・検索システムにおいて、前記電子メールの情報を蓄積するデータベースは、メール本文、添付ファイル及びウエブページのそれぞれ属性検索及び全文検索用のインデックスと、メール本文、添付ファイル及びウエブページのそれぞれ属性と、メール本文と添付ファイルの関連データ及びメール本文とウエブページの関連データを格納することを特徴とする電子メール収集・検索システム。An e-mail collection and search system comprising: an e-mail collection unit that collects e-mail information from a mail server and stores the e-mail information in a database; and an e-mail search unit that searches for e-mail information stored in the database. The database that accumulates the following information is an index for attribute search and full-text search of the mail body, attached file and web page, respectively, the attributes of the mail body, attached file and web page, and related data of the mail body and attached file and An e-mail collection and retrieval system that stores related data between an e-mail text and a web page. メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段と、データベースに蓄積した電子メールの情報を検索する電子メール検索手段を備えた電子メール収集・検索システムにおいて、前記電子メール検索手段は、電子メールの本文あるいは添付ファイルあるいはメール本文に記述されているURLのウェブページの情報にそれぞれ含まれるキーワードを検索条件に指定して電子メールを検索する全文検索手段を備えたことを特徴とする電子メール収集・検索システム。An e-mail collection and search system comprising: an e-mail collection unit that collects e-mail information from a mail server and stores the e-mail information in a database; and an e-mail search unit that searches for e-mail information stored in the database. The search means includes full-text search means for searching for an e-mail by designating keywords included in the information of the web page of the URL described in the body of the e-mail, the attached file, or the e-mail body as search conditions. E-mail collection and search system. メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段と、データベースに蓄積した電子メールの情報を検索する電子メール検索手段を備えた電子メール収集・検索システムにおいて、前記電子メール検索手段は、電子メールの属性、添付ファイルの属性あるいはメール本文に記述されているURLのウェブページの属性を検索条件にして電子メールを検索する属性検索手段を備えたことを特徴とする電子メール収集・検索システム。An e-mail collection and search system comprising: an e-mail collection unit that collects e-mail information from a mail server and stores the e-mail information in a database; and an e-mail search unit that searches for e-mail information stored in the database. The search means includes an attribute search means for searching for an e-mail by using a search condition based on an attribute of an e-mail, an attribute of an attached file, or an attribute of a web page of a URL described in a mail body. Collection and search system. メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段と、データベースに蓄積した電子メールの情報を検索する電子メール検索手段を備えた電子メール収集・検索システムにおいて、電子メール検索手段で検索した電子メールの情報をメール送信可能な形式に再編集した後,これを検索したユーザにメール送信するメールバック手段を備えたことを特徴とする電子メール収集・検索システム。An e-mail collection and retrieval system including an e-mail collection unit that collects e-mail information from a mail server and stores the e-mail information in a database, and an e-mail search unit that searches for e-mail information stored in the database. An e-mail collection / search system comprising mail back means for re-editing the e-mail information retrieved by the means into a format that can be transmitted by e-mail, and transmitting the e-mail to the user who retrieved the e-mail information. コンピュータを、メールサーバから電子メールの情報を収集してデータベースに蓄積する電子メール収集手段及びデータベースに蓄積した電子メールの情報を検索する電子メール検索手段として機能させるための電子メール収集・検索プログラムであって、
該プログラムは、コンピュータを、前記電子メールのメール属性、メール本文及び添付ファイルの情報を収集するメール情報収集手段及びメール本文に記述されているURLのウェブページの情報を収集するウェブページ収集手段として機能させるプログラムを備えたことを特徴とする電子メール収集・検索プログラム。
An e-mail collection / search program for causing a computer to function as e-mail collection means for collecting e-mail information from a mail server and storing it in a database and e-mail search means for searching for e-mail information stored in the database So,
The program includes a computer as a mail information collecting unit that collects information of the mail attribute, the mail body, and the attached file of the electronic mail, and a web page collecting unit that collects information of a URL web page described in the mail body. An e-mail collection / search program characterized by having a functioning program.
JP2002359571A 2002-12-11 2002-12-11 E-mail collection and search system Expired - Fee Related JP4028795B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002359571A JP4028795B2 (en) 2002-12-11 2002-12-11 E-mail collection and search system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002359571A JP4028795B2 (en) 2002-12-11 2002-12-11 E-mail collection and search system

Publications (2)

Publication Number Publication Date
JP2004192335A true JP2004192335A (en) 2004-07-08
JP4028795B2 JP4028795B2 (en) 2007-12-26

Family

ID=32758936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002359571A Expired - Fee Related JP4028795B2 (en) 2002-12-11 2002-12-11 E-mail collection and search system

Country Status (1)

Country Link
JP (1) JP4028795B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036410A1 (en) * 2003-10-10 2005-04-21 Altage Limited Partnership Company Automatic information entering server
JP2006301899A (en) * 2005-04-20 2006-11-02 Brother Ind Ltd Data management program, data management apparatus, and data management method
JP2009193309A (en) * 2008-02-14 2009-08-27 Sansan Inc Business card information management apparatus, business card information management method and program
US8775455B2 (en) 2008-12-30 2014-07-08 International Business Machines Corporation Document search system which reflects the situation of using documents in the search results

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036410A1 (en) * 2003-10-10 2005-04-21 Altage Limited Partnership Company Automatic information entering server
JP2006301899A (en) * 2005-04-20 2006-11-02 Brother Ind Ltd Data management program, data management apparatus, and data management method
JP2009193309A (en) * 2008-02-14 2009-08-27 Sansan Inc Business card information management apparatus, business card information management method and program
US8775455B2 (en) 2008-12-30 2014-07-08 International Business Machines Corporation Document search system which reflects the situation of using documents in the search results
US9298710B2 (en) 2008-12-30 2016-03-29 International Business Machines Corporation Document search system which reflects the situation of using documents in the search results

Also Published As

Publication number Publication date
JP4028795B2 (en) 2007-12-26

Similar Documents

Publication Publication Date Title
US7788274B1 (en) Systems and methods for category-based search
US5978828A (en) URL bookmark update notification of page content or location changes
JP3307625B2 (en) Electronic bulletin board system and mail server
US7809710B2 (en) System and method for extracting content for submission to a search engine
US7702811B2 (en) Method and apparatus for marking of web page portions for revisiting the marked portions
AU2005231112B2 (en) Methods and systems for structuring event data in a database for location and retrieval
JP5069730B2 (en) Event notification function providing device, event notification function providing method, and event notification function providing program
AU2007332917B2 (en) Method and system for intellegent processing of electronic information
US20050234848A1 (en) Methods and systems for information capture and retrieval
WO2008057635A1 (en) System, method, and computer-readable medium for collection and distribution of user-supplied comments associated with network and local content
US20100077300A1 (en) Computer Method and Apparatus Providing Social Preview in Tag Selection
JP2006099341A (en) Update history generation device and program
JP2005025620A (en) Document update notification device, document update notification method, and control program of document update notification device
JP2004220251A (en) Information extraction rule creation system, information extraction rule creation method, and information extraction rule creation program
JP4028795B2 (en) E-mail collection and search system
US9117202B2 (en) Identifying and displaying messages containing an identifier
US7895529B1 (en) System and method for processing featured content
JP4253315B2 (en) Knowledge information collecting system and knowledge information collecting method
JP2006343827A (en) Inter-site relation display system
JP2006277061A (en) Knowledge retrieval system, method and program
JP2007012100A (en) Retrieval method and retrieval device or information providing system based on personal information
JP5193977B2 (en) Event notification function providing system
JP2008026968A (en) Data management device, data program, and data management method
KR20000049986A (en) Messaging service system and method for processing the same
Tsai et al. Information services for novelty mining

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070306

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees