JP2004070664A - 分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体 - Google Patents
分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2004070664A JP2004070664A JP2002229083A JP2002229083A JP2004070664A JP 2004070664 A JP2004070664 A JP 2004070664A JP 2002229083 A JP2002229083 A JP 2002229083A JP 2002229083 A JP2002229083 A JP 2002229083A JP 2004070664 A JP2004070664 A JP 2004070664A
- Authority
- JP
- Japan
- Prior art keywords
- classification filter
- character strings
- character string
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
【課題】受信する電子メールに含まれる文字列等の情報が有する傾向の変化に伴って新たな分類フィルタの作成または既存の分類フィルタの情報更新を行うことより、新たな分類領域を用いた電子メールのフィルタリングを可能とする分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体を提供する。
【解決手段】コンピュータが、フィルタリング対象の電子メールの本文を文字列に分解し、既存分類フィルタを特徴付ける文字列と重複しない文字列を新たなカテゴリ区分とした後、新たなカテゴリ区分を含む電子メールを抽出し、その中に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新を行う。
【選択図】 図1
【解決手段】コンピュータが、フィルタリング対象の電子メールの本文を文字列に分解し、既存分類フィルタを特徴付ける文字列と重複しない文字列を新たなカテゴリ区分とした後、新たなカテゴリ区分を含む電子メールを抽出し、その中に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新を行う。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、電子メールのフィルタリングシステムで用いる分類フィルタの更新を行う分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来、電子メールのフィルタリングを行うフィルタリングシステムにおいて、フィルタ条件を自動更新するための方法として、予め設定された複数の分類フィルタ間に優先順位を付与し、最初に電子メールがヒットした分類フィルタに対応する処理を電子メールに対して実施する仕組みのものと、フィルタリングの実績に応じて分類フィルタ間の優先順位を更新することによって電子メールの傾向の変化に対応する方法が用いられている。このような分類フィルタ更新方法の例としては、特開平8−235088号公報を挙げることができる。
【0003】
図12は、従来の分類フィルタ更新システムの全体構成例を示す説明図である。同図に示す分類フィルタ更新システム7は、インターネット等の通信ネットワーク3を介して電子メール5の送受信を行うメールサーバとしての機能を具備しており、電子メール5の送受信を行うメール送受信部71、受信した電子メール5に関する情報を抽出するメール抽出部73、フィルタリング対象メールのフィルタリングならびに分類フィルタの新規作成または更新を自動的に行うフィルタリング部75、フィルタリング対象の電子メールアドレスリストを格納するアドレスリスト格納部77を有している。
【0004】
図13は、分類フィルタ更新システム7が行う処理の動作手順を示す処理フロー図である。
【0005】
分類フィルタ更新システム7のメール送受信部71は、通信ネットワーク3から電子メール5を受信する(ステップd11)と、受信した電子メール5をメール抽出部73へ転送する(ステップd12)。
【0006】
メール抽出部73では、メール送受信部11から転送されてきた電子メール5の宛先電子メールアドレスが分類フィルタ更新システム1でのフィルタリング対象メールであるか否かを確認する(ステップS51)ために、フィルタリング対象の電子メールアドレスリストを格納しているアドレスリスト格納部77に対して、電子メール5の宛先電子メールアドレスを含む内容の確認依頼(契約確認依頼)を送信する。アドレスリスト格納部77は契約確認依頼を受信すると、その電子メール5の宛先電子メールアドレスがフィルタリング対象の電子メールアドレスに含まれているか否かを確認し、その確認結果を契約確認応答に乗せて返信する。
【0007】
メール抽出部73は、契約確認応答によって得られた結果転送されてきた電子メール5がフィルタリング対象であった(YES)場合は、電子メール5をフィルタリング部75へ転送する(ステップS52、d14)一方で、契約確認応答によって得られた結果が対象外であった(NO)場合には、電子メール5をメール送受信部71に返信(ステップS53、d13)する。
【0008】
フィルタリング部75が電子メール5を受信すると、カテゴリの分類(ステップS54)、分類結果に応じた処理(ステップS55)、分類フィルタの優先度の入れ替えによる分類フィルタの更新(ステップS56)を順次実行する。
【0009】
【発明が解決しようとする課題】
上述した従来技術では、予め想定可能な分類フィルタがカバーする分類領域の範囲(優先順位変更に限った範囲)では自動更新が可能であるが、新たな分類領域をカバーする分類フィルタの新規作成または追加変更等が必要となる場合には対応できない恐れがあった。
【0010】
本発明は上記に鑑みてなされたものであり、その目的は、受信する電子メールに含まれる文字列等の情報が有する傾向の変化に伴って新たな分類フィルタの作成または既存の分類フィルタの情報更新を行うことより、新たな分類領域を用いた電子メールのフィルタリングを可能とする分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体を提供することにある。
【0011】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するときの分類フィルタ更新方法であって、フィルタリング対象の電子メールを格納する電子メール格納部を有するコンピュータが、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出ステップと、この文字列抽出ステップで抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定ステップと、前記電子メール格納部に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定ステップで設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出ステップと、このカテゴリ区分対象メール抽出ステップで抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新ステップとを実行することを要旨とする。
【0012】
請求項1記載の本発明によれば、フィルタリング対象の電子メールを格納する電子メール格納部を有するコンピュータが、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出し、抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定し、電子メール格納部に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、新たなカテゴリ区分を文字列として含む電子メールを抽出し、この抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行うことにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0013】
ここで、分類フィルタとは、フィルタリング対象の電子メールに含まれ、その電子メールの内容を特徴付ける文字列内容であるカテゴリ区分に関する単語、あるいは電子メールアドレスやURL(Uniform Resource Locator)アドレスの少なくとも一部等の文字列がキーワードとして複数設定されているデータベースまたはファイルを指す。
【0014】
また、分類フィルタ更新処理とは、分類フィルタの新規作成処理や、既存の分類フィルタの情報を追加更新(情報更新)する処理等を含むものとする。
【0015】
さらに、電子メールの本文とは、送信元利用者がメールの内容として記載する内容に加え、通信ネットワークを介して送信されるときの情報や送信元、送信先のアドレス等の情報を示すヘッダ部分等も含むものとする。
【0016】
なお、本発明の分類フィルタ更新方法は、一つのコンピュータによって構築されたシステムによって実行される場合だけでなく、各ステップの実行を適宜分割して二つ以上のコンピュータによって構築されたシステムによって実行される場合も含む。
【0017】
請求項2記載の本発明は、請求項1記載の分類フィルタ更新方法において、前記分類フィルタ更新ステップは、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0018】
請求項2記載の本発明によれば、フィルタリング対象の電子メールから抽出する文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与し、この付与された重みに基づいて新たな分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行うことにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0019】
請求項3記載の本発明は、請求項1または2記載の分類フィルタ更新方法において、前記分類フィルタ更新ステップは、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0020】
請求項3記載の本発明によれば、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属する文字列の組合せのうち前記所定数と同数のものと比較し、個々の文字列に付与される重みとは無関係に独立した重みを付与することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0021】
請求項4記載の本発明は、請求項1乃至3のいずれか一項記載の分類フィルタ更新方法において、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を所定の周期ごとに行うことを要旨とする。
【0022】
請求項4記載の本発明においては、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を予め設定された一定周期ごとに行う。
【0023】
請求項5記載の本発明は、請求項1乃至3のいずれか一項記載の分類フィルタ更新方法において、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、前記電子メール格納部に格納される電子メールが予め設定した一定の数に達するごとに行うことを要旨とする。
【0024】
請求項5記載の本発明においては、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、電子メール格納部に格納した電子メールの数が予め設定した一定の数に達するごとに行う。
【0025】
請求項6記載の本発明は、請求項1乃至5のいずれか一項記載の分類フィルタ更新方法において、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行うことを要旨とする。
【0026】
請求項6記載の本発明においては、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行う。
【0027】
請求項7記載の本発明は、請求項1乃至6のいずれか一項記載の分類フィルタ更新方法において、前記フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することを要旨とする。
【0028】
請求項7記載の本発明によれば、合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することにより、より効率的な電子メールのフィルタリングが可能になる。
【0029】
請求項8記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新する分類フィルタ更新システムであって、フィルタリング対象の電子メールを格納する電子メール格納手段と、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段と、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段と、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段と、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段とを備えたことを要旨とする。
【0030】
請求項8記載の本発明によれば、フィルタリング対象の電子メールを格納する電子メール格納手段と、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段と、抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段と、電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段と、この抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段とを備えた分類フィルタ更新システムを提供することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0031】
なお、本発明の分類フィルタ更新システムは、一つのコンピュータによって構築される場合だけでなく、各手段(の有する機能)を適宜分割して二つ以上のコンピュータによって構築される場合も含む。
【0032】
請求項9記載の本発明は、請求項8記載の分類フィルタ更新システムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0033】
請求項9記載の本発明によれば、フィルタリング対象の電子メールから抽出する文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与し、この付与された重みに基づいて新たな分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新システムを提供することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0034】
請求項10記載の本発明は、請求項8または9記載の分類フィルタ更新システムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0035】
請求項10記載の本発明によれば、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属する文字列の組合せのうち前記所定数と同数のものと比較し、個々の文字列に付与される重みとは無関係に独立した重みを付与する分類フィルタ更新システムを提供することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0036】
請求項11記載の本発明は、請求項8乃至10のいずれか一項記載の分類フィルタ更新システムにおいて、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を所定の周期ごとに行うことを要旨とする。
【0037】
請求項11記載の本発明においては、分類フィルタ更新手段が、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を予め設定された一定周期ごとに行う。
【0038】
請求項12記載の本発明は、請求項8乃至10のいずれか一項記載の分類フィルタ更新システムにおいて、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、前記電子メール格納手段に格納される電子メールが予め設定した一定の数に達するごとに行うことを要旨とする。
【0039】
請求項12記載の本発明においては、分類フィルタ更新手段が、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、電子メール格納手段に格納される電子メールが予め設定した一定の数に達するごとに行う。
【0040】
請求項13記載の本発明は、請求項8乃至12のいずれか一項記載の分類フィルタ更新システムにおいて、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行うことを要旨とする。
【0041】
請求項13記載の本発明においては、分類フィルタ更新手段が、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行う。
【0042】
請求項14記載の本発明は、請求項8乃至13のいずれか一項記載の分類フィルタ更新システムにおいて、前記フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することを要旨とする。
【0043】
請求項14記載の本発明によれば、合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することにより、より効率的な電子メールのフィルタリングが可能になる。
【0044】
請求項15乃至17のいずれかに記載された発明は、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことを可能にする分類フィルタ更新プログラムを提供するものである。
【0045】
請求項15記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するために、コンピュータを、フィルタリング対象の電子メールを格納する電子メール格納手段、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段、として機能させることを要旨とする。
【0046】
請求項16記載の本発明は、請求項15記載の分類フィルタ更新プログラムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0047】
請求項17記載の本発明は、請求項15または16記載の分類フィルタ更新プログラムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0048】
請求項18乃至20のいずれかに記載の発明は、請求項15乃至17のいずれかに記載の分類フィルタ更新プログラムをそれぞれ記録したコンピュータ読取可能な記録媒体を提供するものである。
【0049】
請求項18記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するために、コンピュータを、フィルタリング対象の電子メールを格納する電子メール格納手段、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段、として機能させる分類フィルタ更新プログラムを記録したことを要旨とする。
【0050】
請求項19記載の本発明は、請求項18記載の分類フィルタ更新プログラムを記録した記録媒体であって、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0051】
請求項20記載の本発明は、請求項18または19記載の分類フィルタ更新プログラムを記録した記録媒体であって、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0052】
請求項18乃至20記載の発明によれば、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことを可能にする分類フィルタ更新プログラムをコンピュータ読取可能な記録媒体に記録して広く流通させることが可能になる。
【0053】
【発明の実施の形態】
次に、図面を参照して本発明の実施の形態を説明する。
【0054】
図1は、本発明の一実施形態に係る分類フィルタ更新システムの全体構成を示す説明図である。同図に示す分類フィルタ更新システム1は、インターネット等の通信ネットワーク3を介して電子メール5の送受信を行うメールサーバとしての機能を具備しており、電子メール5の送受信を行うメール送受信部11、受信した電子メール5に関するアドレスやルーチング等の情報を抽出するメール抽出部13、フィルタリング対象メールのフィルタリングならびに分類フィルタの新規作成または追加更新を自動的に行うフィルタリング部15を有している。
【0055】
なお、分類フィルタとは、その分類フィルタの抽出する電子メールの内容のカテゴリ区分(電子メールに含まれる話題や目的や発信者等、その電子メールの内容を特徴付ける文字列のこと。各文字列には特徴づけの大小に係る「重み」がつけられている場合もある一方、複数の文字列の組み合わせで「重み」がつけられている場合もある)に関する単語、電子メールアドレスの少なくとも一部、URLアドレスの少なくとも一部の文字列等がキーワードとして複数設定されているデータベースまたはファイルを指すものとする。
【0056】
分類フィルタ更新システム1は、フィルタリング対象の電子メールアドレスリストを格納するアドレスリスト格納手段の一部であるデータベースとしてのアドレスリスト格納部17、分類フィルタが有するカテゴリ区分ごとに分類された電子メール5の複製(コピー)を記録する電子メール格納手段の一部であるデータベースとしての電子メール格納部19を備えている。なお、アドレスリスト格納部17および電子メール格納部19は、それぞれメール抽出部13およびフィルタリング部15内に設置しておくことも可能である。
【0057】
分類フィルタ更新システム1は、中央処理装置(CPU:Central ProcessingUnit)等を備えた演算装置、RAM(Random Access Memory)等を備えた主記憶装置、キーボードやマウス等からなる入力装置、ディスプレイ装置等からなる出力装置を少なくとも具備するコンピュータによって構成されている。
【0058】
また、本実施形態に係る各種処理を実行するための分類フィルタ更新プログラムは分類フィルタ更新システム内の主記憶装置に格納されている。この分類フィルタ更新プログラムは、CD−ROM、フレキシブルディスク、光磁気ディスク、PCカード等のコンピュータ読取可能な記録媒体に記録して広く流通させることも勿論可能である。
【0059】
図2は、本実施形態に係る分類フィルタ更新処理の流れを示す処理フロー図である。同図においては、電子メールの送信を二重線矢印で表示し、各データベース(格納部)との間での情報の送受信を点線で標記するとともに。メール抽出部13ならびにフィルタリング部15内の処理の一部をフローチャートとして表わしている。
【0060】
以下、図2を用いて分類フィルタ更新方法を説明する。
【0061】
分類フィルタ更新システム1のメール送受信部11は、通信ネットワーク3から電子メール5を受信する(ステップd1)と、受信した電子メール5をメール抽出部13へ転送する(ステップd2)。
【0062】
メール抽出部13では、メール送受信部11から転送されてきた電子メール5の宛先電子メールアドレスが分類フィルタ更新システム1でのフィルタリング対象メールであるか否かを確認する(ステップS1)ために、フィルタリング対象の電子メールアドレスリストを格納しているアドレスリスト格納部17に対して、電子メール5の宛先電子メールアドレスを含む内容の確認依頼(契約確認依頼)を送信する。アドレスリスト格納部17は契約確認依頼を受信すると、その電子メール5の宛先電子メールアドレスがフィルタリング対象の電子メールアドレスに含まれているか否かを確認し、その確認結果を契約確認応答に乗せて返信する。
【0063】
メール抽出部13は、契約確認応答によって得られた結果転送されてきた電子メール5がフィルタリング対象であった(YES)場合は、電子メール5をフィルタリング部15へ転送する(ステップS2、d4)一方で、契約確認応答によって得られた結果が対象外であった(NO)場合には、電子メール5をメール送受信部11に返信(ステップS3、d3)する。
【0064】
メール送受信部11は、宛先の電子メールアドレスに向けて電子メール5を送信する。これにより電子メール5は通信ネットワーク1内のルーチングを再開させる。なお、ここでは通信ネットワーク事業者がメールサーバとしての分類フィルタ更新システム1を管理する場合を想定しているが、それ以外にも企業や団体等のメールサーバのように内部LAN(Local Area Network)を対象としている場合には、通信ネットワーク3内ではなく、そのLAN内でのルーチングを再開させることもある。
【0065】
フィルタリング部15が電子メール5を受信すると、予め分類フィルタ更新システム1と宛先電子メールアドレスの利用者の一方または両方により設定された電子メールの内容のカテゴリ区分毎に設定されている分類フィルタを用いて電子メール5の内容の分類を実施するために、まず受信した電子メール5が、分類フィルタのカテゴリ区分に該当するかどうかの判定を行う(ステップS4)。
【0066】
判定の結果、該当するカテゴリ区分があった場合(YES)には、電子メール5のコピーを電子メール格納部19に格納する(ステップS5)。
【0067】
この後、該当カテゴリ区分の有無に関わらず、カテゴリ区分ごとに設定されている分類フィルタを用いて電子メール5の内容の分類を行う(ステップS6)。電子メール5の内容の分類は全ての分類フィルタで実施される。なお、カテゴリ区分の設定は、分類フィルタ更新システム1だけではなく、利用者側で利用を希望する分類フィルタの設定を行うことも可能である。その場合には、分類フィルタ更新システム1から宛先電子メールアドレスの利用者に複数の分類フィルタを提示し、利用者が希望する分類フィルタを選択するという例が挙げられるが、必ずしもこのような場合に限られるわけではない。
【0068】
このステップS6で行われる分類作業では、電子メールのタイトル、同報宛先電子メールアドレス、発信者電子メールアドレス、経由情報、通信本文等について、分類フィルタとの合致有無を検査して合致した文字列の数、または合致した文字列の「重み」の合計値である合致度(より一般的には、フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす量)を算出し、合致度が一定基準値以上に達する場合はそのカテゴリ区分の内容をもつ電子メールとして分類する。一つの電子メールが複数の電子メールの内容のカテゴリ区分に合致する場合は、最も大きい合致度を有する電子メールの内容のカテゴリ区分に分類するものとする。合致有無を検査する対象範囲としては、電子メールに設定された上記以外のさまざまな情報を含めることも可能である一方、一部の情報に制限して検査する場合もある。
【0069】
フィルタリング部15は、内容の分類を終えた電子メール5について、分類結果である電子メール5の内容のカテゴリ区分に応じて、ルーチングの再開、破棄、分類フィルタ更新システム1内での保留、特定の日時でのルーチングの再開、宛先電子メールアドレスを変更してのルーチングの再開等、分類結果に応じた処理を実施する(ステップS7、S8)。なお、分類フィルタによる合致有無の検査でいずれかの電子メールの内容のカテゴリ区分に分類された電子メール5は、そのコピーが電子メール格納部19に格納される。
【0070】
全ての分類フィルタでの該当カテゴリ区分の合致有無の検査において合致度が予め設定される所定の基準値に達しなかった電子メール5はメール送受信部11に返送され(ステップS6、d5)、通信ネットワーク3でのルーチングを再開する。ここでも、分類フィルタ更新システム1の対象によっては、必ずしも通信ネットワーク3内でのルーチングを行う必要はない。
【0071】
その後、フィルタリング部15は、新規分類フィルタの作成または既存分類フィルタの追加更新等を実施する(ステップS10)。以下、これらの処理について詳述する。
【0072】
<新規分類フィルタの作成>
図3は、フィルタリング部15における新規分類フィルタの作成処理(図2のステップS10)の詳細な動作手順を表すフローチャート図である。
【0073】
まず、新規分類フィルタを作成するか否かの条件判断を行う(ステップS21)。新規分類フィルタの作成は、予めフィルタリング部15に設定された一定周期(例えば、1ヶ月、6ヶ月、1年等の所定の期間)ごとに、前回の新規分類フィルタ作成実施以降に電子メール格納部19に蓄積された電子メール5を用いて実施する。周期の設定は分類フィルタ更新システム1が具備する入力装置からの直接入力によって実施する設定方法と、宛先電子メールアドレスを持つ情報通信端末及び暗証番号などの認証手順を実施した一般の情報通信端末からユーザの要望に合わせて実施する設定方法の一方または両方を可能とする。
【0074】
また、新規分類フィルタ作成を、前述した一定周期ごとに実施する代わりに、予め設定された一定の数の電子メールが電子メール格納部19に蓄積される毎に、前回の新規分類フィルタ作成実施以降に電子メール格納部19に蓄積された電子メールを用いて実施することも可能である。
【0075】
フィルタリング部15が新規の分類フィルタを作成する場合は、電子メール格納部19から蓄積されている電子メール5を取得する(ステップS22)。
【0076】
この場合には、一定数の設定はメールサーバ2からの直接入力によって実施する設定方法と宛先電子メールアドレスを持つ情報通信端末及び暗証番号などの認証手順を実施した一般の情報通信端末からユーザの要望に合わせて実施する設定方法の一方または両方を可能とする。
【0077】
なお、前述した更新周期ならびに更新方法に加えて、宛先電子メールアドレス毎に、前回のその宛先電子メールアドレスの新規分類フィルタ作成実施以降に電子メール格納部19に蓄積された当該電子メールアドレスを宛先とする電子メールを用いて新規分類フィルタの作成を実施することも可能である。このように、新規分類フィルタの作成方法はさまざまな形態をとりうることはいうまでもない。
【0078】
次に、フィルタリング部15は、取得した電子メールを文字列レベルに分解して抽出する(ステップS23)。図4は、ステップS23の一実施例の概要を示す説明図である。同図に示すように、例えば「桜市立第一小学校・学校通信です。8月25日(日)は水泳大会です。当日は、・・・」という内容の本文からなる電子メールが抽出されたとき、この文章は「桜/市立/第一/小/学校/・/学校/通信/です/。/8月/25日/(日)/は/水泳/大会/です/。/当日/は/、/・・・」というように文字列レベルに分解される(斜線/が文字列の境界)。最小単位の文字列をどのように設定するかは、用途等に応じて任意であり、必ずしも上記のように分解されるわけではない。他の電子メールについても同様である。また、句読点や「http://」等の文字列のように、用途によっては分類する意味をほとんど持たない特定の文字列を抽出対象から外すように設定しておくことも勿論可能である。文字列に分解した後、文字列登場回数を累積し、その合計値を算出する。図4の右端にあるグラフは、登場回数の多い順に、「学校」、「桜」、「連絡」等の文字列が抽出された状況を示すものである。
【0079】
ステップS23での文字列抽出の結果、その中で最も数の多い文字列、且つ、既存の分類フィルタが分類する電子メールの内容のカテゴリ区分に用いられていない文字列を新しい分類フィルタが分類する電子メールの内容のカテゴリ区分とする(ステップS24)。
【0080】
図5は、図4で説明した電子メールに関する文字列抽出の結果から、新たな分類カテゴリ区分が作成されるまでの概要を示す説明図である。同図の左端のグラフは、図4の右端に示すグラフと同一である。ここで、図5の場合には一定回数を20回と設定し、文字列抽出を行った電子メールに一定回数以上登場した「学校」、「桜」という文字列を抽出し、その後これらの文字列が、既存の分類フィルタのカテゴリ区分に用いられているかどうかを判定する。図5では、「桜」というカテゴリ区分を有する分類フィルタがすでに用いられている一方で、「学校」というカテゴリ区分は既存の分類フィルタには存在しないので、結果として「学校」という文字列のみ新たな分類フィルタのカテゴリ区分とすることになる。
【0081】
新しい分類フィルタが分類することになる電子メールの内容のカテゴリ区分が確定した後、フィルタリング部15はそのカテゴリ区分を文字列として含む電子メールを、電子メール格納部19から取得した電子メール中から全て抽出する(ステップS25)。図6は、「学校」というカテゴリ区分作成のために実行される電子メール抽出処理(カテゴリ区分対象メール抽出処理)の概要を示す説明図である。
【0082】
ステップS26では、前述した各処理(ステップS21〜S25)に基づいて新規分類フィルタを作成する。
【0083】
以上説明した新規分類フィルタ作成処理を行うフィルタリング部15が、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出された文字列の中で、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成を行う分類フィルタ更新手段としての機能を有することはいうまでもない。
【0084】
図7は、新規分類フィルタ作成処理の概要を示す説明図である。ステップS25で抽出された電子メール(文字列「学校」を含む)は、上記ステップS23の処理と同様に文字列レベルに分解された後、各文字列の登場回数が累積され、その合計値が算出される。その後、予め設定しておいた一定値(図7の場合には10)以上登場する文字列をその分類フィルタを構成するキーワードとして抽出する。図7の場合には、「学校」、「桜」、「連絡」等の文字列がキーワードとして抽出される。その後、既存の分類フィルタのキーワード群との重複度をチェックする。一般に、既存の分類フィルタにも含まれるキーワードは、新規分類フィルタを著しく特徴付けるものとは考えられない。そこで、チェックされた重複度に応じて、例えば重複数が大きい場合には「重み」を大とし、重複数が小さい場合には「重み」を小とする等予め設定した方法に基づいて重み付けを行う。図7の場合、「学校」の重みは8、「桜」の重みは1、「連絡」の重みは4である。すなわち、これらのキーワードのうち、「学校」というキーワードが最も分類フィルタを特徴付けるものであることを意味している。なお、重み付けの方法がこれに限られるわけではない。また、「桜」というキーワードの重みが小さいのは、前述したようにすでに「桜」というキーワードを有するカテゴリ区分が存在し、新たに作成される分類フィルタを特徴付けるキーワードとしての特徴が、他のキーワードに比べて相対的に低いからである。
【0085】
他にも、複数の文字列による組合せに対して重み付けを実施することも可能である。この場合には、同一の電子メール中に存在する文字列の全てだけでなく、名詞と動詞に限定する等、予め分類フィルタ更新システム1が条件を用いて絞り込んだ文字列に対して、予めシステムが指定する単語数による組合せを存在する全てのパターンについて抽出する。そして抽出された組合せのうち、当該カテゴリ区分を示す文字列を含むため電子メール格納部19から抽出されたの電子メールのうち一定数以上存在するものについて、他のカテゴリ区分の分類フィルタに属し且つ同じ構成単語数(文字列の数)の組合せと比較することにより、単語単独の場合とは独立して重み付けを実施する。
【0086】
なお、文字列の組合せを抽出する際の単位範囲は、前述した場合以外にも、同一文章中、同一段落中等、あるいは分類フィルタ更新システム1の設定等に応じて適宜変更可能である。また、他のカテゴリ区分の分類フィルタに属する組合せと比較対照を実施する組合せの抽出方法は、電子メール格納部19から抽出されたの電子メールのうち一定数以上の電子メールの中に存在する場合以外にも、電子メール格納部19から抽出されたの電子メールのうち一定割合以上のメールに含まれる場合や、収集された電子メールの中に一定回数以上登場する場合なども考えられる。さらに、予め明らかに不適切と判断しうる特定の文字列組合せを、分類フィルタを構成する文字列の組合せから外しておくことも可能である。
【0087】
ステップS26で作成された新規分類フィルタは追加され、フィルタリング部15でのフィルタリングの処理に組み込まれる(ステップS27)。
【0088】
図8および図9は、新規作成された分類フィルタの例を示す説明図である。このうち、図8に示す分類フィルタ30は、「職場連絡」というカテゴリ区分に関するものである。文字列と重みの対応テーブル35には、「決算」という文字列(キーワード)の重みが8、「部長」が3、「課長」が2、・・・という対応が与えられている。基準値「7」は、前述したように合致有無の検査をして新規分類フィルタの作成等を実行するか否かを判定するための値である。他方、図9に示す分類フィルタ50も、カテゴリ区分は分類フィルタ30と同様に「職場連絡」であり、この場合の基準値は8と設定されている。この分類フィルタ50においては、複合文字列に対して重み付けがなされている。例えば、対応テーブル55に記載されているように、「歓迎会/新宿/課長」という文字列を全て含む電子メールの重みは1、「商品A/東京/○○会社」という文字列を全て含む電子メールの重みは10、「決算/黒字/本社」という文字列を全て含む電子メールの重みは5と設定されている。各複合文字列の重みが、その複合文字列を構成する個々の文字列の重み(の合計)とは限らず、それらに無関係であることは勿論である。
【0089】
以上説明した本実施形態に係る新規分類フィルタ作成処理によれば、既存のフィルタで分類済みの電子メールから新たな傾向を抽出することによって新規分類フィルタを作成することにより、新たな内容を有する電子メールに対してのフィルタリングを行うことが可能になる。
【0090】
<分類フィルタの情報更新>
図10は、本実施形態に係る分類フィルタ情報更新処理(図2のステップS10)の詳細な動作手順を示すフローチャート図である。
【0091】
まず、分類フィルタの情報更新を行う否かの条件判断を行う(ステップS31、図10では単に「更新条件」と記載)。この条件判断は、新規分類フィルタの作成を行うか否かの条件判断(図3のステップS21を参照)と同様、予めフィルタリング部15に設定された一定周期ごとに、前回の分類フィルタ情報更新実施以降に電子メール格納部19に蓄積された電子メールを用いて更新したり、予め設定された一定数の電子メールが電子メール格納部19に蓄積される毎に更新したりすることも可能である。この場合の一定数の設定についても、新規分類フィルタの作成において説明したのと同様にさまざまな方法を採用することができる。また、宛先の電子メールアドレス毎に、前回のその宛先電子メールアドレスに対応する既存分類フィルタの情報更新実施以降に電子メール格納部19に蓄積された当該電子メールアドレスを宛先とする電子メールを用いて実施することもできる。
【0092】
フィルタリング部15が既存の分類フィルタに設定されている単語、電子メールアドレスの全てまたは一部、インターネットホームページアドレスの全てまたは一部などの文字列がキーワードとそれらの重みを情報更新する場合は、電子メール格納部19から、前回の情報更新以降にその更新対象分類フィルタが分類するカテゴリ区分に分類された電子メールを取得する(ステップS32)。
【0093】
それらの電子メールを文字列レベルに分解して得られた文字列を新しいキーワードとして情報更新用の分類フィルタを作成し(ステップS33)、これを既存の分類フィルタと置換することによって分類フィルタを更新する(ステップS34)。
【0094】
以上説明した分類フィルタ情報更新処理を行うフィルタリング部15が、上述した新規分類フィルタ作成処理の場合と同様に、文字列抽出手段、カテゴリ区分設定手段、カテゴリ区分対象メール抽出手段としての機能を有することは勿論である。加えて、分類フィルタ更新手段として、分類フィルタの情報更新を行う機能を有している。
【0095】
なお、文字列(または複合文字列)に重み付けをする場合は新しいキーワードに対して行う。したがって、全ての分類フィルタを対象に「重み」の再算定が実施され、当該分類フィルタ以外の分類フィルタで用いられているキーワードの重みも変更される場合もある。重み付けの方法は、新規分類フィルタ作成処理と同様である。
【0096】
以上説明した本実施形態に係る分類フィルタの情報更新処理によれば、既存のフィルタで分類済みの電子メールから新たな傾向を抽出することによって既存分類フィルタの情報更新を行うことにより、新規分類フィルタの作成処理と同様に、新たな内容を有する電子メールに対してのフィルタリングを行うことが可能になる。
【0097】
以上説明した本発明の一実施形態によれば、上記分類フィルタの新規追加処理ならびに分類フィルタの情報更新処理において記載した効果に加えて、それらの処理を所定の間隔で行うことにより、受信する電子メールに含まれる文字列等の情報を流行にあわせてその時点で最新のものとすることができ、フィルタリング処理の有効性の寿命が伸びるという効果を得ることもできる。
【0098】
なお、本実施形態においては、例えば以下に示すような分類フィルタの自動削除処理を加えることも可能である。
【0099】
<分類フィルタの削除>
本実施形態においては、予めフィルタリング部15に設定された一定期間以上、上述した合致度が基準値に達することがない分類フィルタは、フィルタリング部15が自動的に削除する機能を具備させることもできる。図11に、分類フィルタ削除処理の動作処理を表すフローチャート図を示す。
【0100】
分類フィルタの各々に設けられる合致度に到達した電子メール(ステップS41)は、その時点からの合致度についての計測が開始される(ステップS42)。
【0101】
フィルタリング部15は、一定期間内における分類フィルタにおける合致度が基準値に到達したか否かを判定し(ステップS43)、基準値に達していない分類フィルタについては削除する(ステップS44)。他方、一定期間内に合致度が基準値に達している分類フィルタについては、ステップS42に戻って処理を繰り返す。
【0102】
一定期間の設定は、分類フィルタ更新システム1からの直接入力によって実施する設定方法と宛先電子メールアドレスを持つ情報通信端末及び暗証番号などの認証手順を実施した一般の情報通信端末からユーザの要望に合わせて実施する設定方法の一方または両方を可能とする。
【0103】
以上説明した分類フィルタの削除処理を行うことによって、上述した実施形態と同様の効果を得ることに加え、フィルタリングに用いられることが少なくなった分類フィルタを適宜削除し、分類フィルタ更新システム1、特にフィルタリング部15の負荷の軽減と処理速度の向上を図ることが可能となる。
【0104】
このように、本発明は上記実施形態と同様の効果を得ることのできるさまざまな実施の形態等を含みうるものであることはいうまでもない。
【0105】
【発明の効果】
以上説明した本発明によれば、受信する電子メールに含まれる文字列等の情報が有する傾向の変化に伴って新たな分類フィルタの作成または既存の分類フィルタの情報更新を行うことより、新たな分類領域を用いた電子メールのフィルタリングを可能とする分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体を提供することができる。
【0106】
また、本発明によれば、フィルタリング処理の有効性の寿命が伸びるという効果を得ることもできる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る分類フィルタ更新システムの全体構成を示す説明図である。
【図2】本発明の一実施形態に係る分類フィルタ更新処理の動作手順を示す処理フロー図である。
【図3】本発明の一実施形態に係る新規分類フィルタ作成処理の動作手順を示すフローチャート図である。
【図4】新規分類フィルタ作成のための文字列抽出処理の一例を示す説明図である。
【図5】新規分類フィルタ作成のカテゴリ区分を示す文字列抽出処理の一例を示す説明図である。
【図6】新規分類フィルタでカテゴリ区分となる文字列を含むカテゴリ区分対象メール抽出処理の一例を示す説明図である。
【図7】新規分類フィルタの作成処理の一例を示す説明図である。
【図8】分類フィルタの構成例を示す説明図である。
【図9】分類フィルタの別な構成例を示す説明図である。
【図10】本発明の一実施形態に係る分類フィルタ情報更新処理の動作手順を示すフローチャート図である。
【図11】本発明の一実施形態に係る分類フィルタ削除処理の動作手順を示すフローチャート図である。
【図12】従来のシステムの全体構成を示す説明図である。
【図13】従来の分類フィルタ更新処理の動作手順を示す処理フロー図である。
【符号の説明】
1、7 分類フィルタ更新システム
3 通信ネットワーク
5 電子メール
11、71 メール送受信部
13、73 メール抽出部
15、75 フィルタリング部
17、77 アドレスリスト格納部
19 電子メール格納部
30、50 分類フィルタ
35、55 対応テーブル
【発明の属する技術分野】
本発明は、電子メールのフィルタリングシステムで用いる分類フィルタの更新を行う分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来、電子メールのフィルタリングを行うフィルタリングシステムにおいて、フィルタ条件を自動更新するための方法として、予め設定された複数の分類フィルタ間に優先順位を付与し、最初に電子メールがヒットした分類フィルタに対応する処理を電子メールに対して実施する仕組みのものと、フィルタリングの実績に応じて分類フィルタ間の優先順位を更新することによって電子メールの傾向の変化に対応する方法が用いられている。このような分類フィルタ更新方法の例としては、特開平8−235088号公報を挙げることができる。
【0003】
図12は、従来の分類フィルタ更新システムの全体構成例を示す説明図である。同図に示す分類フィルタ更新システム7は、インターネット等の通信ネットワーク3を介して電子メール5の送受信を行うメールサーバとしての機能を具備しており、電子メール5の送受信を行うメール送受信部71、受信した電子メール5に関する情報を抽出するメール抽出部73、フィルタリング対象メールのフィルタリングならびに分類フィルタの新規作成または更新を自動的に行うフィルタリング部75、フィルタリング対象の電子メールアドレスリストを格納するアドレスリスト格納部77を有している。
【0004】
図13は、分類フィルタ更新システム7が行う処理の動作手順を示す処理フロー図である。
【0005】
分類フィルタ更新システム7のメール送受信部71は、通信ネットワーク3から電子メール5を受信する(ステップd11)と、受信した電子メール5をメール抽出部73へ転送する(ステップd12)。
【0006】
メール抽出部73では、メール送受信部11から転送されてきた電子メール5の宛先電子メールアドレスが分類フィルタ更新システム1でのフィルタリング対象メールであるか否かを確認する(ステップS51)ために、フィルタリング対象の電子メールアドレスリストを格納しているアドレスリスト格納部77に対して、電子メール5の宛先電子メールアドレスを含む内容の確認依頼(契約確認依頼)を送信する。アドレスリスト格納部77は契約確認依頼を受信すると、その電子メール5の宛先電子メールアドレスがフィルタリング対象の電子メールアドレスに含まれているか否かを確認し、その確認結果を契約確認応答に乗せて返信する。
【0007】
メール抽出部73は、契約確認応答によって得られた結果転送されてきた電子メール5がフィルタリング対象であった(YES)場合は、電子メール5をフィルタリング部75へ転送する(ステップS52、d14)一方で、契約確認応答によって得られた結果が対象外であった(NO)場合には、電子メール5をメール送受信部71に返信(ステップS53、d13)する。
【0008】
フィルタリング部75が電子メール5を受信すると、カテゴリの分類(ステップS54)、分類結果に応じた処理(ステップS55)、分類フィルタの優先度の入れ替えによる分類フィルタの更新(ステップS56)を順次実行する。
【0009】
【発明が解決しようとする課題】
上述した従来技術では、予め想定可能な分類フィルタがカバーする分類領域の範囲(優先順位変更に限った範囲)では自動更新が可能であるが、新たな分類領域をカバーする分類フィルタの新規作成または追加変更等が必要となる場合には対応できない恐れがあった。
【0010】
本発明は上記に鑑みてなされたものであり、その目的は、受信する電子メールに含まれる文字列等の情報が有する傾向の変化に伴って新たな分類フィルタの作成または既存の分類フィルタの情報更新を行うことより、新たな分類領域を用いた電子メールのフィルタリングを可能とする分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体を提供することにある。
【0011】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するときの分類フィルタ更新方法であって、フィルタリング対象の電子メールを格納する電子メール格納部を有するコンピュータが、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出ステップと、この文字列抽出ステップで抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定ステップと、前記電子メール格納部に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定ステップで設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出ステップと、このカテゴリ区分対象メール抽出ステップで抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新ステップとを実行することを要旨とする。
【0012】
請求項1記載の本発明によれば、フィルタリング対象の電子メールを格納する電子メール格納部を有するコンピュータが、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出し、抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定し、電子メール格納部に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、新たなカテゴリ区分を文字列として含む電子メールを抽出し、この抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行うことにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0013】
ここで、分類フィルタとは、フィルタリング対象の電子メールに含まれ、その電子メールの内容を特徴付ける文字列内容であるカテゴリ区分に関する単語、あるいは電子メールアドレスやURL(Uniform Resource Locator)アドレスの少なくとも一部等の文字列がキーワードとして複数設定されているデータベースまたはファイルを指す。
【0014】
また、分類フィルタ更新処理とは、分類フィルタの新規作成処理や、既存の分類フィルタの情報を追加更新(情報更新)する処理等を含むものとする。
【0015】
さらに、電子メールの本文とは、送信元利用者がメールの内容として記載する内容に加え、通信ネットワークを介して送信されるときの情報や送信元、送信先のアドレス等の情報を示すヘッダ部分等も含むものとする。
【0016】
なお、本発明の分類フィルタ更新方法は、一つのコンピュータによって構築されたシステムによって実行される場合だけでなく、各ステップの実行を適宜分割して二つ以上のコンピュータによって構築されたシステムによって実行される場合も含む。
【0017】
請求項2記載の本発明は、請求項1記載の分類フィルタ更新方法において、前記分類フィルタ更新ステップは、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0018】
請求項2記載の本発明によれば、フィルタリング対象の電子メールから抽出する文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与し、この付与された重みに基づいて新たな分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行うことにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0019】
請求項3記載の本発明は、請求項1または2記載の分類フィルタ更新方法において、前記分類フィルタ更新ステップは、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0020】
請求項3記載の本発明によれば、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属する文字列の組合せのうち前記所定数と同数のものと比較し、個々の文字列に付与される重みとは無関係に独立した重みを付与することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0021】
請求項4記載の本発明は、請求項1乃至3のいずれか一項記載の分類フィルタ更新方法において、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を所定の周期ごとに行うことを要旨とする。
【0022】
請求項4記載の本発明においては、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を予め設定された一定周期ごとに行う。
【0023】
請求項5記載の本発明は、請求項1乃至3のいずれか一項記載の分類フィルタ更新方法において、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、前記電子メール格納部に格納される電子メールが予め設定した一定の数に達するごとに行うことを要旨とする。
【0024】
請求項5記載の本発明においては、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、電子メール格納部に格納した電子メールの数が予め設定した一定の数に達するごとに行う。
【0025】
請求項6記載の本発明は、請求項1乃至5のいずれか一項記載の分類フィルタ更新方法において、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行うことを要旨とする。
【0026】
請求項6記載の本発明においては、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行う。
【0027】
請求項7記載の本発明は、請求項1乃至6のいずれか一項記載の分類フィルタ更新方法において、前記フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することを要旨とする。
【0028】
請求項7記載の本発明によれば、合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することにより、より効率的な電子メールのフィルタリングが可能になる。
【0029】
請求項8記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新する分類フィルタ更新システムであって、フィルタリング対象の電子メールを格納する電子メール格納手段と、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段と、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段と、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段と、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段とを備えたことを要旨とする。
【0030】
請求項8記載の本発明によれば、フィルタリング対象の電子メールを格納する電子メール格納手段と、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段と、抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段と、電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段と、この抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段とを備えた分類フィルタ更新システムを提供することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0031】
なお、本発明の分類フィルタ更新システムは、一つのコンピュータによって構築される場合だけでなく、各手段(の有する機能)を適宜分割して二つ以上のコンピュータによって構築される場合も含む。
【0032】
請求項9記載の本発明は、請求項8記載の分類フィルタ更新システムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0033】
請求項9記載の本発明によれば、フィルタリング対象の電子メールから抽出する文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与し、この付与された重みに基づいて新たな分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新システムを提供することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0034】
請求項10記載の本発明は、請求項8または9記載の分類フィルタ更新システムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0035】
請求項10記載の本発明によれば、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属する文字列の組合せのうち前記所定数と同数のものと比較し、個々の文字列に付与される重みとは無関係に独立した重みを付与する分類フィルタ更新システムを提供することにより、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことが可能になる。
【0036】
請求項11記載の本発明は、請求項8乃至10のいずれか一項記載の分類フィルタ更新システムにおいて、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を所定の周期ごとに行うことを要旨とする。
【0037】
請求項11記載の本発明においては、分類フィルタ更新手段が、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を予め設定された一定周期ごとに行う。
【0038】
請求項12記載の本発明は、請求項8乃至10のいずれか一項記載の分類フィルタ更新システムにおいて、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、前記電子メール格納手段に格納される電子メールが予め設定した一定の数に達するごとに行うことを要旨とする。
【0039】
請求項12記載の本発明においては、分類フィルタ更新手段が、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、電子メール格納手段に格納される電子メールが予め設定した一定の数に達するごとに行う。
【0040】
請求項13記載の本発明は、請求項8乃至12のいずれか一項記載の分類フィルタ更新システムにおいて、前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行うことを要旨とする。
【0041】
請求項13記載の本発明においては、分類フィルタ更新手段が、新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行う。
【0042】
請求項14記載の本発明は、請求項8乃至13のいずれか一項記載の分類フィルタ更新システムにおいて、前記フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することを要旨とする。
【0043】
請求項14記載の本発明によれば、合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することにより、より効率的な電子メールのフィルタリングが可能になる。
【0044】
請求項15乃至17のいずれかに記載された発明は、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことを可能にする分類フィルタ更新プログラムを提供するものである。
【0045】
請求項15記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するために、コンピュータを、フィルタリング対象の電子メールを格納する電子メール格納手段、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段、として機能させることを要旨とする。
【0046】
請求項16記載の本発明は、請求項15記載の分類フィルタ更新プログラムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0047】
請求項17記載の本発明は、請求項15または16記載の分類フィルタ更新プログラムにおいて、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0048】
請求項18乃至20のいずれかに記載の発明は、請求項15乃至17のいずれかに記載の分類フィルタ更新プログラムをそれぞれ記録したコンピュータ読取可能な記録媒体を提供するものである。
【0049】
請求項18記載の本発明は、電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するために、コンピュータを、フィルタリング対象の電子メールを格納する電子メール格納手段、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段、として機能させる分類フィルタ更新プログラムを記録したことを要旨とする。
【0050】
請求項19記載の本発明は、請求項18記載の分類フィルタ更新プログラムを記録した記録媒体であって、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを要旨とする。
【0051】
請求項20記載の本発明は、請求項18または19記載の分類フィルタ更新プログラムを記録した記録媒体であって、前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与することを要旨とする。
【0052】
請求項18乃至20記載の発明によれば、既存の分類フィルタでは区分できない電子メールを受信しても、新たな分類領域を有する分類フィルタ用いて電子メールのフィルタリングを行うことを可能にする分類フィルタ更新プログラムをコンピュータ読取可能な記録媒体に記録して広く流通させることが可能になる。
【0053】
【発明の実施の形態】
次に、図面を参照して本発明の実施の形態を説明する。
【0054】
図1は、本発明の一実施形態に係る分類フィルタ更新システムの全体構成を示す説明図である。同図に示す分類フィルタ更新システム1は、インターネット等の通信ネットワーク3を介して電子メール5の送受信を行うメールサーバとしての機能を具備しており、電子メール5の送受信を行うメール送受信部11、受信した電子メール5に関するアドレスやルーチング等の情報を抽出するメール抽出部13、フィルタリング対象メールのフィルタリングならびに分類フィルタの新規作成または追加更新を自動的に行うフィルタリング部15を有している。
【0055】
なお、分類フィルタとは、その分類フィルタの抽出する電子メールの内容のカテゴリ区分(電子メールに含まれる話題や目的や発信者等、その電子メールの内容を特徴付ける文字列のこと。各文字列には特徴づけの大小に係る「重み」がつけられている場合もある一方、複数の文字列の組み合わせで「重み」がつけられている場合もある)に関する単語、電子メールアドレスの少なくとも一部、URLアドレスの少なくとも一部の文字列等がキーワードとして複数設定されているデータベースまたはファイルを指すものとする。
【0056】
分類フィルタ更新システム1は、フィルタリング対象の電子メールアドレスリストを格納するアドレスリスト格納手段の一部であるデータベースとしてのアドレスリスト格納部17、分類フィルタが有するカテゴリ区分ごとに分類された電子メール5の複製(コピー)を記録する電子メール格納手段の一部であるデータベースとしての電子メール格納部19を備えている。なお、アドレスリスト格納部17および電子メール格納部19は、それぞれメール抽出部13およびフィルタリング部15内に設置しておくことも可能である。
【0057】
分類フィルタ更新システム1は、中央処理装置(CPU:Central ProcessingUnit)等を備えた演算装置、RAM(Random Access Memory)等を備えた主記憶装置、キーボードやマウス等からなる入力装置、ディスプレイ装置等からなる出力装置を少なくとも具備するコンピュータによって構成されている。
【0058】
また、本実施形態に係る各種処理を実行するための分類フィルタ更新プログラムは分類フィルタ更新システム内の主記憶装置に格納されている。この分類フィルタ更新プログラムは、CD−ROM、フレキシブルディスク、光磁気ディスク、PCカード等のコンピュータ読取可能な記録媒体に記録して広く流通させることも勿論可能である。
【0059】
図2は、本実施形態に係る分類フィルタ更新処理の流れを示す処理フロー図である。同図においては、電子メールの送信を二重線矢印で表示し、各データベース(格納部)との間での情報の送受信を点線で標記するとともに。メール抽出部13ならびにフィルタリング部15内の処理の一部をフローチャートとして表わしている。
【0060】
以下、図2を用いて分類フィルタ更新方法を説明する。
【0061】
分類フィルタ更新システム1のメール送受信部11は、通信ネットワーク3から電子メール5を受信する(ステップd1)と、受信した電子メール5をメール抽出部13へ転送する(ステップd2)。
【0062】
メール抽出部13では、メール送受信部11から転送されてきた電子メール5の宛先電子メールアドレスが分類フィルタ更新システム1でのフィルタリング対象メールであるか否かを確認する(ステップS1)ために、フィルタリング対象の電子メールアドレスリストを格納しているアドレスリスト格納部17に対して、電子メール5の宛先電子メールアドレスを含む内容の確認依頼(契約確認依頼)を送信する。アドレスリスト格納部17は契約確認依頼を受信すると、その電子メール5の宛先電子メールアドレスがフィルタリング対象の電子メールアドレスに含まれているか否かを確認し、その確認結果を契約確認応答に乗せて返信する。
【0063】
メール抽出部13は、契約確認応答によって得られた結果転送されてきた電子メール5がフィルタリング対象であった(YES)場合は、電子メール5をフィルタリング部15へ転送する(ステップS2、d4)一方で、契約確認応答によって得られた結果が対象外であった(NO)場合には、電子メール5をメール送受信部11に返信(ステップS3、d3)する。
【0064】
メール送受信部11は、宛先の電子メールアドレスに向けて電子メール5を送信する。これにより電子メール5は通信ネットワーク1内のルーチングを再開させる。なお、ここでは通信ネットワーク事業者がメールサーバとしての分類フィルタ更新システム1を管理する場合を想定しているが、それ以外にも企業や団体等のメールサーバのように内部LAN(Local Area Network)を対象としている場合には、通信ネットワーク3内ではなく、そのLAN内でのルーチングを再開させることもある。
【0065】
フィルタリング部15が電子メール5を受信すると、予め分類フィルタ更新システム1と宛先電子メールアドレスの利用者の一方または両方により設定された電子メールの内容のカテゴリ区分毎に設定されている分類フィルタを用いて電子メール5の内容の分類を実施するために、まず受信した電子メール5が、分類フィルタのカテゴリ区分に該当するかどうかの判定を行う(ステップS4)。
【0066】
判定の結果、該当するカテゴリ区分があった場合(YES)には、電子メール5のコピーを電子メール格納部19に格納する(ステップS5)。
【0067】
この後、該当カテゴリ区分の有無に関わらず、カテゴリ区分ごとに設定されている分類フィルタを用いて電子メール5の内容の分類を行う(ステップS6)。電子メール5の内容の分類は全ての分類フィルタで実施される。なお、カテゴリ区分の設定は、分類フィルタ更新システム1だけではなく、利用者側で利用を希望する分類フィルタの設定を行うことも可能である。その場合には、分類フィルタ更新システム1から宛先電子メールアドレスの利用者に複数の分類フィルタを提示し、利用者が希望する分類フィルタを選択するという例が挙げられるが、必ずしもこのような場合に限られるわけではない。
【0068】
このステップS6で行われる分類作業では、電子メールのタイトル、同報宛先電子メールアドレス、発信者電子メールアドレス、経由情報、通信本文等について、分類フィルタとの合致有無を検査して合致した文字列の数、または合致した文字列の「重み」の合計値である合致度(より一般的には、フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす量)を算出し、合致度が一定基準値以上に達する場合はそのカテゴリ区分の内容をもつ電子メールとして分類する。一つの電子メールが複数の電子メールの内容のカテゴリ区分に合致する場合は、最も大きい合致度を有する電子メールの内容のカテゴリ区分に分類するものとする。合致有無を検査する対象範囲としては、電子メールに設定された上記以外のさまざまな情報を含めることも可能である一方、一部の情報に制限して検査する場合もある。
【0069】
フィルタリング部15は、内容の分類を終えた電子メール5について、分類結果である電子メール5の内容のカテゴリ区分に応じて、ルーチングの再開、破棄、分類フィルタ更新システム1内での保留、特定の日時でのルーチングの再開、宛先電子メールアドレスを変更してのルーチングの再開等、分類結果に応じた処理を実施する(ステップS7、S8)。なお、分類フィルタによる合致有無の検査でいずれかの電子メールの内容のカテゴリ区分に分類された電子メール5は、そのコピーが電子メール格納部19に格納される。
【0070】
全ての分類フィルタでの該当カテゴリ区分の合致有無の検査において合致度が予め設定される所定の基準値に達しなかった電子メール5はメール送受信部11に返送され(ステップS6、d5)、通信ネットワーク3でのルーチングを再開する。ここでも、分類フィルタ更新システム1の対象によっては、必ずしも通信ネットワーク3内でのルーチングを行う必要はない。
【0071】
その後、フィルタリング部15は、新規分類フィルタの作成または既存分類フィルタの追加更新等を実施する(ステップS10)。以下、これらの処理について詳述する。
【0072】
<新規分類フィルタの作成>
図3は、フィルタリング部15における新規分類フィルタの作成処理(図2のステップS10)の詳細な動作手順を表すフローチャート図である。
【0073】
まず、新規分類フィルタを作成するか否かの条件判断を行う(ステップS21)。新規分類フィルタの作成は、予めフィルタリング部15に設定された一定周期(例えば、1ヶ月、6ヶ月、1年等の所定の期間)ごとに、前回の新規分類フィルタ作成実施以降に電子メール格納部19に蓄積された電子メール5を用いて実施する。周期の設定は分類フィルタ更新システム1が具備する入力装置からの直接入力によって実施する設定方法と、宛先電子メールアドレスを持つ情報通信端末及び暗証番号などの認証手順を実施した一般の情報通信端末からユーザの要望に合わせて実施する設定方法の一方または両方を可能とする。
【0074】
また、新規分類フィルタ作成を、前述した一定周期ごとに実施する代わりに、予め設定された一定の数の電子メールが電子メール格納部19に蓄積される毎に、前回の新規分類フィルタ作成実施以降に電子メール格納部19に蓄積された電子メールを用いて実施することも可能である。
【0075】
フィルタリング部15が新規の分類フィルタを作成する場合は、電子メール格納部19から蓄積されている電子メール5を取得する(ステップS22)。
【0076】
この場合には、一定数の設定はメールサーバ2からの直接入力によって実施する設定方法と宛先電子メールアドレスを持つ情報通信端末及び暗証番号などの認証手順を実施した一般の情報通信端末からユーザの要望に合わせて実施する設定方法の一方または両方を可能とする。
【0077】
なお、前述した更新周期ならびに更新方法に加えて、宛先電子メールアドレス毎に、前回のその宛先電子メールアドレスの新規分類フィルタ作成実施以降に電子メール格納部19に蓄積された当該電子メールアドレスを宛先とする電子メールを用いて新規分類フィルタの作成を実施することも可能である。このように、新規分類フィルタの作成方法はさまざまな形態をとりうることはいうまでもない。
【0078】
次に、フィルタリング部15は、取得した電子メールを文字列レベルに分解して抽出する(ステップS23)。図4は、ステップS23の一実施例の概要を示す説明図である。同図に示すように、例えば「桜市立第一小学校・学校通信です。8月25日(日)は水泳大会です。当日は、・・・」という内容の本文からなる電子メールが抽出されたとき、この文章は「桜/市立/第一/小/学校/・/学校/通信/です/。/8月/25日/(日)/は/水泳/大会/です/。/当日/は/、/・・・」というように文字列レベルに分解される(斜線/が文字列の境界)。最小単位の文字列をどのように設定するかは、用途等に応じて任意であり、必ずしも上記のように分解されるわけではない。他の電子メールについても同様である。また、句読点や「http://」等の文字列のように、用途によっては分類する意味をほとんど持たない特定の文字列を抽出対象から外すように設定しておくことも勿論可能である。文字列に分解した後、文字列登場回数を累積し、その合計値を算出する。図4の右端にあるグラフは、登場回数の多い順に、「学校」、「桜」、「連絡」等の文字列が抽出された状況を示すものである。
【0079】
ステップS23での文字列抽出の結果、その中で最も数の多い文字列、且つ、既存の分類フィルタが分類する電子メールの内容のカテゴリ区分に用いられていない文字列を新しい分類フィルタが分類する電子メールの内容のカテゴリ区分とする(ステップS24)。
【0080】
図5は、図4で説明した電子メールに関する文字列抽出の結果から、新たな分類カテゴリ区分が作成されるまでの概要を示す説明図である。同図の左端のグラフは、図4の右端に示すグラフと同一である。ここで、図5の場合には一定回数を20回と設定し、文字列抽出を行った電子メールに一定回数以上登場した「学校」、「桜」という文字列を抽出し、その後これらの文字列が、既存の分類フィルタのカテゴリ区分に用いられているかどうかを判定する。図5では、「桜」というカテゴリ区分を有する分類フィルタがすでに用いられている一方で、「学校」というカテゴリ区分は既存の分類フィルタには存在しないので、結果として「学校」という文字列のみ新たな分類フィルタのカテゴリ区分とすることになる。
【0081】
新しい分類フィルタが分類することになる電子メールの内容のカテゴリ区分が確定した後、フィルタリング部15はそのカテゴリ区分を文字列として含む電子メールを、電子メール格納部19から取得した電子メール中から全て抽出する(ステップS25)。図6は、「学校」というカテゴリ区分作成のために実行される電子メール抽出処理(カテゴリ区分対象メール抽出処理)の概要を示す説明図である。
【0082】
ステップS26では、前述した各処理(ステップS21〜S25)に基づいて新規分類フィルタを作成する。
【0083】
以上説明した新規分類フィルタ作成処理を行うフィルタリング部15が、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出された文字列の中で、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成を行う分類フィルタ更新手段としての機能を有することはいうまでもない。
【0084】
図7は、新規分類フィルタ作成処理の概要を示す説明図である。ステップS25で抽出された電子メール(文字列「学校」を含む)は、上記ステップS23の処理と同様に文字列レベルに分解された後、各文字列の登場回数が累積され、その合計値が算出される。その後、予め設定しておいた一定値(図7の場合には10)以上登場する文字列をその分類フィルタを構成するキーワードとして抽出する。図7の場合には、「学校」、「桜」、「連絡」等の文字列がキーワードとして抽出される。その後、既存の分類フィルタのキーワード群との重複度をチェックする。一般に、既存の分類フィルタにも含まれるキーワードは、新規分類フィルタを著しく特徴付けるものとは考えられない。そこで、チェックされた重複度に応じて、例えば重複数が大きい場合には「重み」を大とし、重複数が小さい場合には「重み」を小とする等予め設定した方法に基づいて重み付けを行う。図7の場合、「学校」の重みは8、「桜」の重みは1、「連絡」の重みは4である。すなわち、これらのキーワードのうち、「学校」というキーワードが最も分類フィルタを特徴付けるものであることを意味している。なお、重み付けの方法がこれに限られるわけではない。また、「桜」というキーワードの重みが小さいのは、前述したようにすでに「桜」というキーワードを有するカテゴリ区分が存在し、新たに作成される分類フィルタを特徴付けるキーワードとしての特徴が、他のキーワードに比べて相対的に低いからである。
【0085】
他にも、複数の文字列による組合せに対して重み付けを実施することも可能である。この場合には、同一の電子メール中に存在する文字列の全てだけでなく、名詞と動詞に限定する等、予め分類フィルタ更新システム1が条件を用いて絞り込んだ文字列に対して、予めシステムが指定する単語数による組合せを存在する全てのパターンについて抽出する。そして抽出された組合せのうち、当該カテゴリ区分を示す文字列を含むため電子メール格納部19から抽出されたの電子メールのうち一定数以上存在するものについて、他のカテゴリ区分の分類フィルタに属し且つ同じ構成単語数(文字列の数)の組合せと比較することにより、単語単独の場合とは独立して重み付けを実施する。
【0086】
なお、文字列の組合せを抽出する際の単位範囲は、前述した場合以外にも、同一文章中、同一段落中等、あるいは分類フィルタ更新システム1の設定等に応じて適宜変更可能である。また、他のカテゴリ区分の分類フィルタに属する組合せと比較対照を実施する組合せの抽出方法は、電子メール格納部19から抽出されたの電子メールのうち一定数以上の電子メールの中に存在する場合以外にも、電子メール格納部19から抽出されたの電子メールのうち一定割合以上のメールに含まれる場合や、収集された電子メールの中に一定回数以上登場する場合なども考えられる。さらに、予め明らかに不適切と判断しうる特定の文字列組合せを、分類フィルタを構成する文字列の組合せから外しておくことも可能である。
【0087】
ステップS26で作成された新規分類フィルタは追加され、フィルタリング部15でのフィルタリングの処理に組み込まれる(ステップS27)。
【0088】
図8および図9は、新規作成された分類フィルタの例を示す説明図である。このうち、図8に示す分類フィルタ30は、「職場連絡」というカテゴリ区分に関するものである。文字列と重みの対応テーブル35には、「決算」という文字列(キーワード)の重みが8、「部長」が3、「課長」が2、・・・という対応が与えられている。基準値「7」は、前述したように合致有無の検査をして新規分類フィルタの作成等を実行するか否かを判定するための値である。他方、図9に示す分類フィルタ50も、カテゴリ区分は分類フィルタ30と同様に「職場連絡」であり、この場合の基準値は8と設定されている。この分類フィルタ50においては、複合文字列に対して重み付けがなされている。例えば、対応テーブル55に記載されているように、「歓迎会/新宿/課長」という文字列を全て含む電子メールの重みは1、「商品A/東京/○○会社」という文字列を全て含む電子メールの重みは10、「決算/黒字/本社」という文字列を全て含む電子メールの重みは5と設定されている。各複合文字列の重みが、その複合文字列を構成する個々の文字列の重み(の合計)とは限らず、それらに無関係であることは勿論である。
【0089】
以上説明した本実施形態に係る新規分類フィルタ作成処理によれば、既存のフィルタで分類済みの電子メールから新たな傾向を抽出することによって新規分類フィルタを作成することにより、新たな内容を有する電子メールに対してのフィルタリングを行うことが可能になる。
【0090】
<分類フィルタの情報更新>
図10は、本実施形態に係る分類フィルタ情報更新処理(図2のステップS10)の詳細な動作手順を示すフローチャート図である。
【0091】
まず、分類フィルタの情報更新を行う否かの条件判断を行う(ステップS31、図10では単に「更新条件」と記載)。この条件判断は、新規分類フィルタの作成を行うか否かの条件判断(図3のステップS21を参照)と同様、予めフィルタリング部15に設定された一定周期ごとに、前回の分類フィルタ情報更新実施以降に電子メール格納部19に蓄積された電子メールを用いて更新したり、予め設定された一定数の電子メールが電子メール格納部19に蓄積される毎に更新したりすることも可能である。この場合の一定数の設定についても、新規分類フィルタの作成において説明したのと同様にさまざまな方法を採用することができる。また、宛先の電子メールアドレス毎に、前回のその宛先電子メールアドレスに対応する既存分類フィルタの情報更新実施以降に電子メール格納部19に蓄積された当該電子メールアドレスを宛先とする電子メールを用いて実施することもできる。
【0092】
フィルタリング部15が既存の分類フィルタに設定されている単語、電子メールアドレスの全てまたは一部、インターネットホームページアドレスの全てまたは一部などの文字列がキーワードとそれらの重みを情報更新する場合は、電子メール格納部19から、前回の情報更新以降にその更新対象分類フィルタが分類するカテゴリ区分に分類された電子メールを取得する(ステップS32)。
【0093】
それらの電子メールを文字列レベルに分解して得られた文字列を新しいキーワードとして情報更新用の分類フィルタを作成し(ステップS33)、これを既存の分類フィルタと置換することによって分類フィルタを更新する(ステップS34)。
【0094】
以上説明した分類フィルタ情報更新処理を行うフィルタリング部15が、上述した新規分類フィルタ作成処理の場合と同様に、文字列抽出手段、カテゴリ区分設定手段、カテゴリ区分対象メール抽出手段としての機能を有することは勿論である。加えて、分類フィルタ更新手段として、分類フィルタの情報更新を行う機能を有している。
【0095】
なお、文字列(または複合文字列)に重み付けをする場合は新しいキーワードに対して行う。したがって、全ての分類フィルタを対象に「重み」の再算定が実施され、当該分類フィルタ以外の分類フィルタで用いられているキーワードの重みも変更される場合もある。重み付けの方法は、新規分類フィルタ作成処理と同様である。
【0096】
以上説明した本実施形態に係る分類フィルタの情報更新処理によれば、既存のフィルタで分類済みの電子メールから新たな傾向を抽出することによって既存分類フィルタの情報更新を行うことにより、新規分類フィルタの作成処理と同様に、新たな内容を有する電子メールに対してのフィルタリングを行うことが可能になる。
【0097】
以上説明した本発明の一実施形態によれば、上記分類フィルタの新規追加処理ならびに分類フィルタの情報更新処理において記載した効果に加えて、それらの処理を所定の間隔で行うことにより、受信する電子メールに含まれる文字列等の情報を流行にあわせてその時点で最新のものとすることができ、フィルタリング処理の有効性の寿命が伸びるという効果を得ることもできる。
【0098】
なお、本実施形態においては、例えば以下に示すような分類フィルタの自動削除処理を加えることも可能である。
【0099】
<分類フィルタの削除>
本実施形態においては、予めフィルタリング部15に設定された一定期間以上、上述した合致度が基準値に達することがない分類フィルタは、フィルタリング部15が自動的に削除する機能を具備させることもできる。図11に、分類フィルタ削除処理の動作処理を表すフローチャート図を示す。
【0100】
分類フィルタの各々に設けられる合致度に到達した電子メール(ステップS41)は、その時点からの合致度についての計測が開始される(ステップS42)。
【0101】
フィルタリング部15は、一定期間内における分類フィルタにおける合致度が基準値に到達したか否かを判定し(ステップS43)、基準値に達していない分類フィルタについては削除する(ステップS44)。他方、一定期間内に合致度が基準値に達している分類フィルタについては、ステップS42に戻って処理を繰り返す。
【0102】
一定期間の設定は、分類フィルタ更新システム1からの直接入力によって実施する設定方法と宛先電子メールアドレスを持つ情報通信端末及び暗証番号などの認証手順を実施した一般の情報通信端末からユーザの要望に合わせて実施する設定方法の一方または両方を可能とする。
【0103】
以上説明した分類フィルタの削除処理を行うことによって、上述した実施形態と同様の効果を得ることに加え、フィルタリングに用いられることが少なくなった分類フィルタを適宜削除し、分類フィルタ更新システム1、特にフィルタリング部15の負荷の軽減と処理速度の向上を図ることが可能となる。
【0104】
このように、本発明は上記実施形態と同様の効果を得ることのできるさまざまな実施の形態等を含みうるものであることはいうまでもない。
【0105】
【発明の効果】
以上説明した本発明によれば、受信する電子メールに含まれる文字列等の情報が有する傾向の変化に伴って新たな分類フィルタの作成または既存の分類フィルタの情報更新を行うことより、新たな分類領域を用いた電子メールのフィルタリングを可能とする分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体を提供することができる。
【0106】
また、本発明によれば、フィルタリング処理の有効性の寿命が伸びるという効果を得ることもできる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る分類フィルタ更新システムの全体構成を示す説明図である。
【図2】本発明の一実施形態に係る分類フィルタ更新処理の動作手順を示す処理フロー図である。
【図3】本発明の一実施形態に係る新規分類フィルタ作成処理の動作手順を示すフローチャート図である。
【図4】新規分類フィルタ作成のための文字列抽出処理の一例を示す説明図である。
【図5】新規分類フィルタ作成のカテゴリ区分を示す文字列抽出処理の一例を示す説明図である。
【図6】新規分類フィルタでカテゴリ区分となる文字列を含むカテゴリ区分対象メール抽出処理の一例を示す説明図である。
【図7】新規分類フィルタの作成処理の一例を示す説明図である。
【図8】分類フィルタの構成例を示す説明図である。
【図9】分類フィルタの別な構成例を示す説明図である。
【図10】本発明の一実施形態に係る分類フィルタ情報更新処理の動作手順を示すフローチャート図である。
【図11】本発明の一実施形態に係る分類フィルタ削除処理の動作手順を示すフローチャート図である。
【図12】従来のシステムの全体構成を示す説明図である。
【図13】従来の分類フィルタ更新処理の動作手順を示す処理フロー図である。
【符号の説明】
1、7 分類フィルタ更新システム
3 通信ネットワーク
5 電子メール
11、71 メール送受信部
13、73 メール抽出部
15、75 フィルタリング部
17、77 アドレスリスト格納部
19 電子メール格納部
30、50 分類フィルタ
35、55 対応テーブル
Claims (20)
- 電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するときの分類フィルタ更新方法であって、
フィルタリング対象の電子メールを格納する電子メール格納部を有するコンピュータが、
受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出ステップと、
この文字列抽出ステップで抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定ステップと、
前記電子メール格納部に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定ステップで設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出ステップと、
このカテゴリ区分対象メール抽出ステップで抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新ステップと
を実行することを特徴とする分類フィルタ更新方法。 - 前記分類フィルタ更新ステップは、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを特徴とする請求項1記載の分類フィルタ更新方法。
- 前記分類フィルタ更新ステップは、
フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、
この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与する
ことを特徴とする請求項1または2記載の分類フィルタ更新方法。 - 前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を所定の周期ごとに行うことを特徴とする請求項1乃至3のいずれか一項記載の分類フィルタ更新方法。
- 前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、前記電子メール格納部に格納される電子メールが予め設定した一定の数に達するごとに行うことを特徴とする請求項1乃至3のいずれか一項記載の分類フィルタ更新方法。
- 前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行うことを特徴とする請求項1乃至5のいずれか一項記載の分類フィルタ更新方法。
- 前記フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することを特徴とする請求項1乃至6のいずれか一項記載の分類フィルタ更新方法。
- 電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新する分類フィルタ更新システムであって、
フィルタリング対象の電子メールを格納する電子メール格納手段と、
受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段と、
この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段と、
前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段と、
このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段と
を備えたことを特徴とする分類フィルタ更新システム。 - 前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを特徴とする請求項8記載の分類フィルタ更新システム。
- 前記分類フィルタ更新手段は、
フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、
この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与する
ことを特徴とする請求項8または9記載の分類フィルタ更新システム。 - 前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を所定の周期ごとに行うことを特徴とする請求項8乃至10のいずれか一項記載の分類フィルタ更新システム。
- 前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、前記電子メール格納手段に格納される電子メールが予め設定した一定の数に達するごとに行うことを特徴とする請求項8乃至10のいずれか一項記載の分類フィルタ更新システム。
- 前記新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を、送信先として設定される電子メールアドレスごとに個別に行うことを特徴とする請求項8乃至12のいずれか一項記載の分類フィルタ更新システム。
- 前記フィルタリング対象の電子メールに含まれる情報が既存の分類フィルタに含まれる情報と合致する度合いを表わす合致度が所定期間内に一定値に達しない既存の分類フィルタを自動的に削除することを特徴とする請求項8乃至13のいずれか一項記載の分類フィルタ更新システム。
- 電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するために、コンピュータを、
フィルタリング対象の電子メールを格納する電子メール格納手段、
受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、
この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、
前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、
このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段、
として機能させることを特徴とする分類フィルタ更新プログラム。 - 前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを特徴とする請求項15記載の分類フィルタ更新プログラム。
- 前記分類フィルタ更新手段は、
フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、
この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与する
ことを特徴とする請求項15または16記載の分類フィルタ更新プログラム。 - 電子メールの本文に含まれる文字列を用いて電子メールのフィルタリングを行う分類フィルタを更新するために、コンピュータを、フィルタリング対象の電子メールを格納する電子メール格納手段、受信したフィルタリング対象の電子メールの本文を文字列に分解して抽出する文字列抽出手段、この文字列抽出手段で抽出した文字列のうち所定回数以上抽出され、既存の分類フィルタを特徴付ける文字列と重複しない文字列を分類フィルタの新たなカテゴリ区分として設定するカテゴリ区分設定手段、前記電子メール格納手段に格納されたフィルタリング対象の電子メールの本文を読み出して文字列にそれぞれ分解し、前記カテゴリ区分設定手段で設定した新たなカテゴリ区分を文字列として含む電子メールを抽出するカテゴリ区分対象メール抽出手段、このカテゴリ区分対象メール抽出手段で抽出された電子メールの本文に含まれる文字列のうち所定回数以上抽出された文字列をキーワードとして新規分類フィルタの作成または既存の分類フィルタの情報更新の少なくともいずれか一方を行う分類フィルタ更新手段、として機能させる分類フィルタ更新プログラム
を記録したことを特徴とする分類フィルタ更新プログラムを記録した記録媒体。 - 請求項18記載の分類フィルタ更新プログラムを記録した記録媒体であって、
前記分類フィルタ更新手段は、フィルタリング対象の電子メールに含まれる文字列の各々に対して、既存の分類フィルタに含まれる文字列と重複する度合いに応じて数値化した重みを付与することを特徴とする分類フィルタ更新プログラムを記録した記録媒体。 - 請求項18または19記載の分類フィルタ更新プログラムを記録した記録媒体であって、
前記分類フィルタ更新手段は、
フィルタリング対象の電子メールに含まれる文字列から、同一の電子メールに存在する文字列の全てまたは予め設定された条件を用いて選択した文字列のいずれか一方について所定数の文字列から構成される文字列の組合せを全て抽出し、
この抽出された文字列の組合せのうち、前記カテゴリ区分を示す文字列が予め設定した数以上存在するものに対して、他のカテゴリ区分の既存分類フィルタに属するとともに前記所定数と同数の文字列から構成される文字列の組合せと比較し、文字列の組合せを構成する個々の文字列に付与される重みとは無関係に独立した重みを付与する
ことを特徴とする分類フィルタ更新プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002229083A JP2004070664A (ja) | 2002-08-06 | 2002-08-06 | 分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002229083A JP2004070664A (ja) | 2002-08-06 | 2002-08-06 | 分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004070664A true JP2004070664A (ja) | 2004-03-04 |
Family
ID=32015606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002229083A Pending JP2004070664A (ja) | 2002-08-06 | 2002-08-06 | 分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004070664A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7509381B1 (en) * | 2008-04-21 | 2009-03-24 | International Business Machines Corporation | Adaptive email in-basket ordering |
JP2009199341A (ja) * | 2008-02-21 | 2009-09-03 | Nec Corp | スパム・イベント検出装置及び方法並びにプログラム |
JP2012003560A (ja) * | 2010-06-17 | 2012-01-05 | Nec Corp | フィルタ設定システム、フィルタ設定方法、及びフィルタ設定プログラム |
WO2023223085A1 (en) * | 2022-05-18 | 2023-11-23 | Coupang Corp. | Methods and systems for optimizing filters in product searching |
JP7472652B2 (ja) | 2020-05-21 | 2024-04-23 | 富士通株式会社 | 分類プログラム、分類方法、及び分類装置 |
-
2002
- 2002-08-06 JP JP2002229083A patent/JP2004070664A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009199341A (ja) * | 2008-02-21 | 2009-09-03 | Nec Corp | スパム・イベント検出装置及び方法並びにプログラム |
US7509381B1 (en) * | 2008-04-21 | 2009-03-24 | International Business Machines Corporation | Adaptive email in-basket ordering |
JP2012003560A (ja) * | 2010-06-17 | 2012-01-05 | Nec Corp | フィルタ設定システム、フィルタ設定方法、及びフィルタ設定プログラム |
JP7472652B2 (ja) | 2020-05-21 | 2024-04-23 | 富士通株式会社 | 分類プログラム、分類方法、及び分類装置 |
WO2023223085A1 (en) * | 2022-05-18 | 2023-11-23 | Coupang Corp. | Methods and systems for optimizing filters in product searching |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6182067B1 (en) | Methods and systems for knowledge management | |
US8150827B2 (en) | Methods for enhancing efficiency and cost effectiveness of first pass review of documents | |
JP5661104B2 (ja) | 検索エンジンインデクシング及びインデックスを使用する検索のための方法とシステム | |
JP4906273B2 (ja) | 外部データを使用した検索エンジンスパムの検出 | |
US7272597B2 (en) | Domain expert search | |
US9009153B2 (en) | Systems and methods for identifying a named entity | |
JP4082059B2 (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
US8412704B1 (en) | Providing blog posts relevant to search results | |
US7904958B2 (en) | Spam honeypot domain identification | |
JP5053211B2 (ja) | 自動推論検出によるインバウンド・コンテンツのフィルタリング | |
US8407781B2 (en) | Information providing support device and information providing support method | |
US8335787B2 (en) | Topic word generation method and system | |
US7860971B2 (en) | Anti-spam tool for browser | |
CN1540552A (zh) | 带关联的计算机搜索 | |
JPWO2012095971A1 (ja) | 分類ルール生成装置及び分類ルール生成プログラム | |
US20090240669A1 (en) | Method of managing locations of information and information location management device | |
JP4636473B2 (ja) | リンク情報抽出装置、リンク情報抽出方法およびプログラム | |
JP2010039605A (ja) | 個人検索システム、個人検索方法、プログラムおよび記録媒体 | |
JPH1145284A (ja) | プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2003067304A (ja) | 電子メールフィルタリングシステム、電子メールフィルタリング方法、電子メールフィルタリングプログラム及びそれを記録した記録媒体 | |
JP2004070664A (ja) | 分類フィルタ更新方法、分類フィルタ更新システム、分類フィルタ更新プログラム、および当該プログラムを記録した記録媒体 | |
JP2009199356A (ja) | ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム | |
JP4878468B2 (ja) | 電子メール評価装置および電子メール評価方法 | |
JP3734391B2 (ja) | 個体名の抽出装置、抽出方法、並びに記録媒体 | |
JP2010079619A (ja) | 迷惑メール処理方法、システム、装置及びプログラム |