JP4334210B2 - メッセージ提供システム - Google Patents

メッセージ提供システム Download PDF

Info

Publication number
JP4334210B2
JP4334210B2 JP2002373644A JP2002373644A JP4334210B2 JP 4334210 B2 JP4334210 B2 JP 4334210B2 JP 2002373644 A JP2002373644 A JP 2002373644A JP 2002373644 A JP2002373644 A JP 2002373644A JP 4334210 B2 JP4334210 B2 JP 4334210B2
Authority
JP
Japan
Prior art keywords
mail
identification information
name
analysis
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002373644A
Other languages
English (en)
Other versions
JP2004207940A (ja
Inventor
幸治 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2002373644A priority Critical patent/JP4334210B2/ja
Publication of JP2004207940A publication Critical patent/JP2004207940A/ja
Application granted granted Critical
Publication of JP4334210B2 publication Critical patent/JP4334210B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はメッセージ提供システムに関し、例えば、電子メールシステムなどに適用して好適なものである。
【0003】
【従来の技術】
近年、インターネットや携帯電話の普及の速度は凄まじく、これに比例して、各個人の電子メールの利用も急増している。この結果、人々が電子メールの処理に費やす時間は年々増加している。そして、この問題を解消すべく、電子メールの文章内容をコンピュータに自動解析させようとする研究が広く行なわれている。
【0004】
文章の解析においては、下記の特許文献1に記載されたものなど、多くのアルゴリズムが研究、開発されているが、ほとんどのアルゴリズムでは、文章を単語毎に区切り、予め用意したデータベースの検索結果を利用してそれが何を示すものかを判定する処理を伴う。文章の中から人名を抜き出す処理も、あらかじめ用意された汎用人名データベースを参照し、これに一致するものを人名候補とする処理が一般的である。しかしながら、この汎用人名データベースの作成手段について述べられることは少なく、実際には人名辞書や電話帳等を手作業やスキャナを用いて一つ一つ入力することによって作成することが多い。
【0005】
特に日本においては、姓の種類が世界一とも言われ、数万とも数十万とも言われる姓をデータベースに入力することは膨大な手数を要する作業となる。このような膨大な手数によって作成され、数万〜数十万程度におよぶ登録人名数の巨大な汎用人名データベースは、不特定多数のユーザによって、共通に使用される。
【0006】
電子メールを対象とした文章の解析も同様で、電子メールの本文部分を、当該汎用人名データベースを利用して解析することが可能である。
【0007】
【特許文献1】
特開平2001−202381公報
【0008】
【発明が解決しようとする課題】
しかしながら、基本的に1対1のコミュニケーション手段として利用される電子メールの性質を考慮すると、この巨大な汎用人名データベースをそのまま電子メールの本文部分の解析に利用した場合には、以下の問題(1)〜(3)が発生する。
【0009】
(1)記憶資源の利用や検索処理などの観点で、効率が低い。
【0010】
通常、あるユーザU1が受信する電子メールの本文部分の文章に出現する人名の大部分は、そのユーザU1の知人の名であり、一般的な電子メールユーザの知人の数は、一生を通して知る知人を累計したとしても前記汎用人名データベースの登録人名数(数万〜数十万程度)に比べてはるかに少ない。
【0011】
換言するなら、当該汎用人名データベースに登録されている人名の大部分は、ユーザU1の知人に存在しない人名であり、ユーザU1が受信する電子メールの文章に含まれる確率が極めて低い不必要な人名である。そして、この不必要な人名を汎用人名データベースに蓄積しておくために、膨大な記憶資源が消費されることになるから、前記記憶資源の実効的な利用効率が著しく低い。また、具体的な実行方法にも依存するが、多くの場合、前記検索処理は、汎用人名データベースに登録されている人名の数が多いほど、その検索のために要する処理量が増大し、処理時間も長くなるため、不必要な人名を登録した汎用人名データベースを用いる以上、検索処理の効率も低下する。
【0012】
(2)汎用人名データベースの登録人名数が多いほど、汎用人名データベースから検索された人名が他の固有名詞と一致する頻度が高くなり、検索結果を利用して行われる電子メールの文章の解析処理の効率や品質が低下する。
【0013】
一般的に、人名が他の固有名詞(例えば、地名など)と偶然、一致することがあるが、その場合には、その固有名詞が人名であるか地名であるかを識別するための新たな解析処理(例えば、意味解析など)が必要になって処理量が増大するし、その意味解析などの精度が低ければ、前記文章全体の解析結果の品質を低下させる原因ともなる。
【0014】
上述した不必要な人名を多く登録している前記汎用人名データベースを利用すると、当該汎用人名データベースの検索結果として得られた人名が他の固有名詞と一致する頻度が高いから、当該意味解析などに起因する解析処理の効率低下や、品質低下が大きくなる。
【0015】
例えば「長野」という文字列が、もし汎用人名データベースに格納されていなければ、前記意味解析などを施すことさえ必要なく、地名として扱われることになる可能性が高いが、「長野」という姓は「鈴木」や「田中」といったものに比べると少ないものの、現実に存在しているので、汎用人名データベースが充実し登録人名数が多いほど「長野」という文字列が汎用人名データベースに登録されている確率は高くなる。前記文章に対する解析の具体的な内容にも依存するが、汎用人名データベースに登録されていれば、登録されていない場合に比べ、「長野」という文字列は人名として扱われる確率が高くなる。
【0016】
実際には、「長野」という知人がいる人に対して送られた電子メールの文章中に存在する「長野」という文字列はその知人をさす可能性が高いが、「長野」という知人がいない人に対して送られた電子メールの文章中に存在する「長野」という文字列は地名である確率の方が高いと考えられるが、不特定多数のユーザによって共通に用いられる前記汎用人名データベースの登録内容に、個々のユーザごとに相違する知人の名を反映させることは不可能である。
【0017】
(3)前記汎用人名データベースでは、正規の姓などと異なる変則的な人名に対応することが困難で、柔軟性に欠ける。
【0018】
電子メールがプライベートの利用にも多く使われるようになった結果、人名として、正規の姓(家族名:Family name)ではなく、例えば、愛称(Nickname)や名(個人名:Personal name)だけを記述した変則的な人名も多く見られるようになったが、これらを前記汎用人名データベースに予め登録して不特定多数のユーザが共有するのは不可能に近い。特に、愛称などは、極めてユニークで変則的なものも多く、愛称を示す文字列を予め予測すること自体、困難である。
【0019】
また、もし愛称や個人名を予め前記汎用人名データベースに登録することが可能であったとしても、前記姓の場合と同様に、汎用人名データベースの登録人名数(この場合は、登録された愛称や個人名の数)が多くなるほど、他の固有名詞と区別することが困難となり、前記問題(2)が深刻化する。例えば電子メールの文章中に「ユリ」という文字列があった場合、「ユリ」と呼ばれている知人がいるならば、その文字列は人をさす可能性が高く、そうでなければ、その文字列は植物名である可能性が高いが、不特定多数のユーザにより共通に使用される前記汎用人名データベースの登録内容に、個々のユーザごとに相違する知人の愛称や個人名を反映させることは不可能だからである。
【0020】
前記問題(1)〜(3)を解決するため、不特定多数のユーザが共通に使用する前記汎用人名データベースの替わりに、特定のユーザ(例えば、U1)だけが使用し、そのユーザU1の知人が格納された小さな個別人名データベースを利用することが有効であると考えられるが、そのような個別人名データベースを作成することは、例え、自分の知人だけを入力するにしても、決して容易なものではなく、そのために作業負担も大きい。
【0021】
通常、ユーザU1の知人のすべてが予め整理され明確になっているわけではなく、知人の範囲自体も動的に変動、拡大し得るものだからである。
【0022】
【課題を解決するための手段】
かかる課題を解決するために、本発明は、発信元から発信先に電子メールによってメッセージを提供するためのメッセージ提供システムにおいて、(1)電子メールの発信元又は発信先となり得る個人、又は、複数人が所属するグループに、関連する個人又はグループの識別情報を蓄積している識別情報用データベース手段と、(2)受信又は送信した電子メールのヘッダを解析するヘッダ解析手段と、(3)前記ヘッダ解析手段が解析を終了した直後に、受信又は送信した前記電子メールのメール本文を解析する本文解析手段とを備え、(2)前記ヘッダ解析手段は、(2−1)受信又は送信した前記電子メールのヘッダ内に所定の記述態様で記述される発信元又は発信先識別情報を、当該記述態様をもとに抽出する識別情報抽出手段と、(2−2)当該識別情報抽出手段が抽出した発信元又は発信先識別情報を前記識別情報用データベース手段に蓄積する識別情報蓄積手段とを備え、(3)前記本文解析手段は、受信又は送信した前記電子メールのメール本文を解析する際には、その電子メールのヘッダ解析で得られた識別情報が蓄積された前記識別情報用データベース手段を優先的に利用することを特徴とする。
【0024】
【発明の実施の形態】
(A)実施形態
以下、本発明にかかるメッセージ提供システムの一実施形態について説明する。
【0025】
第1および第2の実施形態に共通する特徴は、受信した電子メールの記述に基づいて、自動的に、当該電子メールを受信した各ユーザ固有の人名データベース(すなわち、個別人名データベース)を作成する点にある。
【0026】
そして、作成された個別人名データベースは、電子メールの本文部分の解析に活用される。
【0027】
電子メールの本文部分の解析は、その解析の内容や目的に応じて、電子メール受信時だけでなく、送信時に行われることもあり得るが、以下では、主として受信時に解析を行う場合を想定する。
【0028】
(A−1)第1の実施形態の構成
本実施形態にかかる通信システム30の全体構成例を図4に示す。
【0029】
図4において、当該通信システム30は、ネットワーク31と、メールサーバ32,33と、通信端末34,35とを備えている。
【0030】
このうちネットワーク31は、LAN(ローカルエリアネットワーク)などであってもかまわないが、ここでは、インターネットであるものとする。
【0031】
メールサーバ32はSMTPサーバやIMAP4サーバ(またはPOP3サーバなど)の機能を有するサーバで、通信端末34を収容している。したがって通信端末34(ユーザU1)の電子メールアドレス(AU1@AAA)を宛先電子メールアドレスとする電子メールは、当該メールサーバ32内の通信端末34のためのメールボックスに着信する。通信端末35を操作するユーザU2が当該ユーザU1宛てに送信する電子メールME1もそのような電子メールの1つである。
【0032】
メールサーバ33は当該メールサーバ32と同じ機能を有するサーバであってもよいが、ここでは、ユーザU2側から送信した電子メールME1をユーザU1側が受信する場合に注目するため、着信した電子メールをその宛先のユーザが取り出すためのプロトコルであるIMAP4(やPOP3)などに対応したIMAP4サーバ(またはPOP3サーバなど)の機能は、当該メールサーバ35が搭載する必要はない。
【0033】
通信端末34はユーザU1によって操作される端末で、例えば、通常のパーソナルコンピュータであってよい。ユーザU1が電子メール(例えば、ME1)を受信するときには、当該通信端末34に搭載されているメールクライアントソフト(メーラ)を利用する。
【0034】
前記個別人名データベースの配置位置には様々なものが考えられ、例えば、メールサーバ32などに配置することも可能であるが、処理の効率などの観点から、電子メールME1のヘッダ部分や本文部分に対する解析を実行する機能主体の配置位置と、当該個別人名データベースの配置位置は近いほうが好ましい。図1に示すように、ヘッダ部分に対する解析(ヘッダ解析)の結果CA1が当該個別人名データベース(例えば、DB1)に登録され、当該個別人名データベースの登録内容CA2(CA1に等しいこともあり得る)を利用して、本文部分に対する解析(本文解析)が実行されるからである。
【0035】
本実施形態では、この機能主体を通信端末34に配置するものとしたため、当該個別人名データベースも通信端末34に配置する。なお、当該個別人名データベースには、符号DB1を付与してある。
【0036】
通信端末35はユーザU2によって操作される端末で、前記通信端末34と同様に、例えば、通常のパーソナルコンピュータであってよい。ユーザU2が電子メール(例えば、ME1)を送信するときには、当該通信端末35に搭載されているメーラを利用する。ここで、前記通信端末34が搭載しているメーラをML1とし、当該通信端末35が搭載しているメーラをML2とする。
【0037】
前記電子メールME1を受信する通信端末34の内部構成例を図5に示す。送信側の通信端末35の内部構成例も基本的に当該通信端末34と同じであってよいが、本実施形態では上述したように、電子メール受信時の解析を想定しているため、後述するメール解析部(前記機能主体に対応)45や前記個別人名データベースDB1など、本実施形態で特徴的な構成要素は、送信側の通信端末35に搭載される必要はない。
【0038】
(A−1−1)通信端末の内部構成例
図5において、当該通信端末34は、通信部40と、制御部41と、操作部42と、表示部43と、記憶部44と、前記メール解析部45とを備えている。
【0039】
このうち通信部40はインターネット31などを経由した通信のために機能する部分で、電子メールME1の受信時には、前記メールサーバ32とのあいだでTCPコネクションの設定などを含む通信を行う。
【0040】
操作部42は、ユーザU1が操作して通信端末34に指示を伝える部分で、例えば、マウスなどのポインティングデバイスやキーボードなどを有する。
【0041】
表示部43は様々な情報の画面表示を行うディスプレイ装置に対応する部分で、例えば、前記メーラML1などの機能に応じ、受信または送信する電子メールの内容(例えば、本文部分の内容など)の画面表示を行う。
【0042】
前記電子メールの本文部分に対する本文解析には様々な目的のものが考えられ、同じ目的に対応する本文解析にも様々な処理内容のものがあり得るが、一例として、当該本文部分の要約を作成することが当該本文解析の目的であるものとすると、解析結果に応じた前記本文部分(ここでは、電子メールME1の本文部分)の要約AB1が当該表示部43に画面表示されることになる。
【0043】
制御部41は、ハードウエア的には当該通信端末34のCPU(中央処理装置)に相当し、ソフトウエア的にはOS(オペレーティングシステム)や前記メーラML1、DBMS(データベース管理システム)などの各種プログラムに相当する部分である。当該DBMSは、前記個別人名データベースDB1を管理するためのシステムである。
【0044】
記憶部44はハードウエア的には、RAM(ランダムアクセスメモリ)や、ハードディスクなどによって構成される記憶資源であり、ソフトウエア的には、前記個別人名データベースDB1や各種のファイルがこの部分に含まれ得る。前記メーラML1などのプログラムファイルもこのようなファイルの一つであるから、メーラML1などの物理的な実体は、この記憶部44に位置する。
【0045】
なお、当該個別人名データベースDB1には、通信端末34が受信した電子メール(例えば、ME1)のヘッダ部分の解析結果に基づいて得られたユーザU1の知人の人名を登録したデータベースである。知人は個々のユーザごとに異なるため、ユーザU1以外のユーザが使用する通信端末(図示せず)が搭載する個別人名データベースには、ユーザU1のための当該個別人名データベースDB1とは異なる人名が登録されることになる。
【0046】
個別人名データベース(ここでは、DB1)に登録される人名には、上述した正規の家族名(姓)のほか、個人名や愛称なども含まれる。もちろん、姓名(家族名+個人名)が含まれていてもよい。
【0047】
メール解析部45は通信端末34が受信した電子メール(例えば、ME1)に対して解析を行って解析結果を出力する部分で、ヘッダ解析部45Aと本文解析部45Bから構成される。メール解析部45が行う解析には大きく分けて2つの種類があり、その1つは、前記ヘッダ解析であり、もう1つは、前記本文解析である。当該ヘッダ解析は、前記ヘッダ解析部45Aが行い、当該本文解析は、前記本文解析部45Bが行う。
【0048】
当該ヘッダ解析は、具体的には、メールヘッダ中の該当するフィールドからユーザU1の知人の人名を抽出する処理である。例えば、現在、広く普及しているRFC2822に準拠した電子メールにおいては、主として、Fromフィールド内のコメントがこの人名に該当するが、必要に応じて、ToフィールドやCcフィールドのコメントから人名を抽出してもよい。
【0049】
Fromフィールドに記述されるコメントは、ユーザU1が受信した電子メール(ここでは、ME1)の送信元(ここでは、ユーザU2)の人名である。スパムメールなどの例外もあるが、本来、未知の人から電子メールが届くことはないはずなので、Fromフィールドに記述されたコメントはユーザU1の知人の人名である可能性が高い。
【0050】
また、Ccフィールドは、同じ内容の電子メール(カーボンコピー)を複数の宛先に届ける場合に、その宛先の電子メールアドレスやコメントを記述するフィールドであるため、このフィールドに記述されたコメントは、電子メールME1と同じものを受信している第3のユーザ(図示せず)の人名である。同じ内容の電子メールを受信したからといって、この第3のユーザとユーザU1が知り合いである保証はないが、少なくとも、この第3のユーザと送信元であるユーザU2は知り合いであるはずなので、当該電子メールME1の本文部分に当該第3のユーザの人名が出現する可能性は高く、前記本文解析との関係上、第3のユーザの人名を抽出して個別人名データベースDB1に登録しておく必要性は高い。この場合、第3のユーザは、ユーザU1にとって、少なくとも間接的な知人であるといえる。
【0051】
Toフィールドは本来、電子メールの宛先の電子メールアドレス(ここでは、AU1@AAA)やコメントを記述するフィールドであるが、このToフィールドに複数の宛先の電子メールアドレスやコメントを羅列して前記Ccフィールドと同様な使い方をすることもあるため、前記Ccフィールドと同様な理由で、このフィールドのコメントから人名を抽出し個別人名データベースDB1に登録しておく必要性は高いといえる。
【0052】
なお、各フィールドに対する前記コメントは必ずしも必須の記述事項ではないため、その記述自体が存在しないこともある。もちろん、記述が存在しなければ、そのフィールドから知人の人名を抽出することはできないが、電子メールユーザは、他の電子メールユーザに理解しやすいように配慮して、コメントを記述することが多い。
【0053】
また、コメントが存在しない場合などには、コメントの替わりに、電子メールアドレス中で@マークから左側に記述されるユーザ名(通常、ユーザのメールボックス名と同じ)を抽出するようにしてもよい。当該ユーザ名は、例えば、前記電子メールアドレス「AU1@AAA」の例では、「AU1」の部分に相当する。
【0054】
コメントの記述を省略する場合、このユーザ名が極めて分かりやすい記述(例えば、ユーザの家族名や姓名をそのままアルファベット表記した記述など)であることが少なくないからである。ユーザ名が十分に分かりやすければ、電子メールを受信したユーザにとって、当該ユーザ名の記述は実質的にコメントと同等な機能を持つことになる。
【0055】
電子メールの本文部分の人名はアルファベットではなく、漢字や仮名で記述されることが多いが、アルファベット表記を漢字や仮名の表記に変換することは比較的容易なので、その変換結果を、個別人名データベースDB1に登録しておくとよい。
【0056】
なお、ヘッダ解析部45Aが電子メール(例えば、ME1)のヘッダ部分から抽出し個別人名データベースDB1に登録した人名は、当該電子メールME1の本文解析を行うときだけ使用し、その本文解析が完了したあとで削除することも可能であるが、削除せずに保存しておき、以降に受信される電子メール(図示せず)の本文解析にも活用することが望ましい。
【0057】
保存することにより、電子メールを受信するたびに当該個別人名データベースDB1の登録人名数が増加し、ユーザU1の知人または間接的な知人の人名を、ほとんど漏れなく登録した有用なデータベースが構成される。また、当該個別人名データベースDB1に登録されるのは、基本的に、ユーザU1の知人または間接的な知人の人名だけである。
【0058】
通信端末34から電子メールを送信するときにもヘッダ解析を実行する場合には、送信時のヘッダ解析によって抽出された知人の人名も、受信時のヘッダ解析で抽出された人名と同様、個別人名データベースDB1へ登録しておき、受信時の本文解析に活用してよい。
【0059】
ユーザU1が送信する電子メール(図示せず)のヘッダ部分の各フィールド(前記Toフィールドや、Ccフィールド、あるいは、Bccフィールド)から抽出できる人名は、通常、ユーザU1の知人であり、ユーザU1が受信する電子メール(例えば、ME1)の本文部分にその人名が出現する確率が高いからである。
【0060】
前記本文解析部45Bが行う本文解析の目的の具体例には、上述した本文部分の要約AB1の生成など様々なものがあり得るが、いずれにしても、当該本文解析は、個別人名データベースDB1に登録された人名を利用して実行される。
【0061】
以下、上記のような構成を有する本実施形態の動作について、図2のフローチャートを参照しながら説明する。
【0062】
図2のフローチャートは、S1〜S5の各ステップを備えている。
【0063】
(A−2)第1の実施形態の動作
前記通信端末35を操作するユーザU2がメーラML2を利用して作成、送信し、メールサーバ33,32を経由して配送され、ユーザU1のメールボックスに着信した電子メールME1を、通信端末34を操作するユーザU1がメーラML1を利用して取り出すと、当該電子メールME1は通信端末34へ届く。
【0064】
このとき、通信端末34内の前記ヘッダ解析部45Aが前記ヘッダ解析を実行し、電子メールME1のヘッダ部分から該当するフィールドの記述内容を取得する(S1)。ここでは、上述したFrom、Cc、Toの各フィールドのすべてから、その記述内容を取得してもよく、一部だけから取得してもよい。
【0065】
そして、当該フィールドの記述内容のなかから、前記コメントを取得する(S2)。
【0066】
コメントの記述が存在しないためにコメントの取得に失敗した場合、次のステップS3はNo側に分岐して処理は前記本文解析部45Bが行う本文解析に進むが、コメントの取得に成功した場合には、ステップS3はYes側に分岐してコメントのデコードを行う(S4)。
【0067】
電子メールのヘッダは一般に、漢字を直接記述することができない規則であるので、漢字でコメント(人名など)を記述すると、電子メールの送信時に、当該漢字は、特定の規則に基づきアルファベットなどにエンコード(符号化)される。もし、エンコードされたままの状態で前記個別人名データベースDB1に格納すると、本文解析を行い個別人名データベースDB1の検索結果を得るたびにデコードする必要が生じてオーバーヘッドが大きくなるから、このように登録前にデコードして本文解析などに有利な所定の文字コードに変換し、デコードした人名を個別人名データベースDB1に登録するのが効率的である(S5)。
【0068】
このようにして個別人名データベースDB1への人名の登録を行うため、ユーザU1の知人等のなかに、例えば、上述した「長野」という姓を持つ者が存在する場合には当該「長野」が個別人名データベースDB1に登録されるが、存在しない場合には、当該「長野」が個別人名データベースDB1に登録されることはない。この点は、前記「ユリ」や愛称などについても同様である。
【0069】
また、前記「鈴木」や「田中」など、我が国では極めて多い姓でさえ、ユーザU1の知人等のなかに、「鈴木」や「田中」という姓を持つ者が存在しなければ、個別人名データベースDB1にこれらが登録されることはない。
【0070】
前記ステップS5の次には、前記ステップS3がNo側に分岐した場合と同様に、前記本文解析部45Bによる本文解析が実行される。上述したように、個別人名データベースDB1には、当該電子メールME1だけでなく、電子メールME1より前に当該通信端末34が受信または送信した電子メールのヘッダ部分の各フィールドから取得した人名も登録してあるため、当該本文解析では、これらの人名も個別人名データベースDB1から検索されて活用される。
【0071】
本文解析の結果として、例えば、前記要約AB1が通信端末34の表示部43に画面表示され得る点は、すでに述べた通りである。
【0072】
なお、ステップS3がNo側に分岐したときには、本文解析を実行するまえに、前記コメントの替わりに上述したユーザ名の抽出、登録等を行うようにしてもよい。
【0073】
以上のような動作により、前記個別人名データベースDB1に登録されるのは、実際に、通信端末34で受信または送信された電子メールのヘッダ部分から抽出された人名だけであるため、上述した汎用人名データベースに比べると、登録人名数ははるかに少ない。しかも、登録されているのは、ユーザU1の知人等の特定の人名に限られるため、不特定多数の人名を登録する必要がない。
【0074】
すなわち、個別人名データベースDB1には基本的に、ユーザU1の知人または間接的な知人の人名だけしか登録されていないため、上述した記憶資源(ここでは、記憶部44)の利用や検索処理などの観点で、効率が高い。
【0075】
また、個別人名データベースDB1から検索された人名が他の固有名詞と一致する頻度も、前記汎用人名データベースに比べて十分に低いため、当該個別人名データベースDB1の検索結果を利用して実行される前記本文解析の効率が高く、なおかつ、解析結果の品質も高い。
【0076】
さらに、登録する人名は単純に電子メールのヘッダ部分の各フィールドから取り出した記述(コメント等の記述)だけに基づいているため、前記愛称や個人名だけの人名など、変則的な人名も、姓や姓名から成る正規の人名と同様の簡単な処理で登録することが可能である。
【0077】
このため、上述した問題(1)〜(3)を解決することができる。
【0078】
なお、前記ToフィールドやCcフィールドからは、ユーザU1自身の人名が取得される可能性も高い。ユーザU1自身の人名も、電子メール(ここでは、ME1)の本文部分に出現する可能性が高いため、個別人名データベースDB1に登録しておくことが望ましい。
【0079】
また、何回も電子メール(ME1はその1つ)を受信していると、同じ人名(ユーザU1自身の人名も含む)が複数回、取得される可能性が高いが、記憶部44の記憶容量を節約するため、同じ人名は一度だけ登録することが望ましい。ただし同じ人名であるか否かの判断も含め、同じ人名を一度だけ登録することは、通常、前記DBMSの機能によって実現されるため、ヘッダ解析部45Aがそのために特段の機能を持つ必要性は低い。
【0080】
(A−3)第1の実施形態の効果
本実施形態によれば、ユーザ(U1)が電子メール(例えば、ME1)を受信または送信するだけで、極めて有用な前記個別人名データベース(DB1)を、自動的に生成することが可能である。
【0081】
当該個別人名データベースは、愛称などの変則的な人名を容易に登録できる点で柔軟性に優れ、ユーザ(U1)の知人等、特定の人名だけを登録し、不特定多数の人名を登録する必要がない点で記憶資源(例えば、記憶部44)の利用効率が高い。
【0082】
また本実施形態では、このような個別人名データベースを利用して本文解析を行うことにより、検索処理の効率が向上するため当該検索処理の結果を利用する本文解析の効率も向上する。
【0083】
さらに、当該個別人名データベースにはユーザ(U1)の知人等、特定の人名しか登録されていないため、不特定多数の人名が検索されることに起因して発生する検索された人名と他の固有名詞との一致の頻度も低減し、この点でも、本文解析の効率が向上する。また、当該一致が発生した場合に必要となる意味解析などの実行に起因する本文解析の効率の低下や、品質の低下を抑制することも可能である。
【0084】
(B)第2の実施形態
以下では、本実施形態が第1の実施形態と相違する点についてのみ説明する。
【0085】
第1の実施形態では、前記コメントの記述はすべて人名を示すものとしたが、実際には、団体や、メーリングリストなどの名称を示すこともあるため、本実施形態は、このようなケースにも対応できるようにしたものである。
【0086】
上述した本文解析の内容や目的によっては、これら団体名なども、広義の人名とみなして前記個別人名データベースDB1に登録したほうが好ましい結果が得られることも多いものと考えられるが、本実施形態が想定するのは、個別人名データベースDB1には、真に、人名のみを登録したほうがよいケースである。
【0087】
(B−1)第2の実施形態の構成および動作
本実施形態の通信システム10の全体構成例は図4に示す通りで、第1の実施形態と同じであってよい。同様に、本実施形態の通信端末34の内部構成例も図5に示す通りで、第1の実施形態と同じであってよい。
【0088】
本実施形態が第1の実施形態と相違するのは、実質的に、前記ヘッダ解析部45Aの動作のみである。
【0089】
当該ヘッダ解析部45Aの動作は、図3のフローチャートに示す。図3のフローチャートは、S1〜S7の各ステップを有するが、すでに説明した図2のフローチャートと同じ符号を付与した各ステップS1〜S5の処理は、第1の実施形態と同じである。
【0090】
図3のフローチャートは、前記ステップS4とS5のあいだに、ステップS6とS7が挿入された構造となっている。
【0091】
当該ステップS4で前記コメントの記述がデコードされたあとに実行されるステップS6では、非人名判定処理を実行する。
【0092】
非人名判定処理はコメントの記述が人名であるか否かを判定するための処理である。非人名判定処理の具体的な内容としては様々なものが考えられるが、一例として、人名の構成要素となる可能性の少ない所定のキーワード(例えば、「株式会社」など)を予め設定しておき、そのキーワードと同じ文字列が含まれている記述は人名ではないと判定することも簡便である。
【0093】
当該非人名判定処理の結果、人名でない(人名の可能性が低い)と判定された場合には、ステップS7はYes側に分岐してその記述は個別人名データベースDB1に登録しないが、反対に、人名である(人名の可能性が高い)と判定された場合には、ステップS7はNo側に分岐して当該記述を個別人名データベースDB1に登録することになる。
【0094】
以降の動作も含め、これ以外の動作は、第1の実施形態と同様である。
【0095】
(B−2)第2の実施形態の効果
本実施形態によれば、第1の実施形態の効果と同等な効果を得ることができる。
【0096】
加えて、本実施形態では、人名であると判定された(人名である可能性が高い)記述だけを個別人名データベース(DB1)に登録することができるため、前記本文解析が団体名などを人名と区別する必要性の高いものである場合にも適切に対応でき、高い品質の解析結果を得ることが可能である。
【0097】
(C)他の実施形態
第1および第2の実施形態における前記本文解析の内容や目的は上述した要約の作成に限らない。例えば、要約を作るのではなく、本文部分の重要と推定される一部だけを単純に切り取って抽出するための解析であってもよい。
【0098】
また、本文解析の解析結果の出力先は、第1および第2の実施形態における表示部43に限定する必要はない。この出力先は本文解析の目的などに依存して変化し得るからである。例えば、ネットワーク経由で転送し、通信端末34以外の通信端末(図示せず)から出力させるようにしてもよい。
【0099】
さらに、本文解析は、その内容や目的に応じて、電子メール受信時だけでなく、送信時に行ってもよい点は上述した通りである。電子メール送信時の解析が必要となるケースとしては、一例として、外部に持ち出すことが禁じられている機密情報を社員などが電子メールを悪用して社外へ流出させることを防止するケースなどがあげられる。これは、例えば、電子メールの本文部分などの解析を通じて機密情報の流出を自動的に検知し、阻止する機能を有するセキュリティシステムなどで利用できる。
【0100】
なお、前記個別人名データベースDB1に登録されている各人名には、最後に読み出された日付を対応付けて管理しておき、所定期間以上、読み出されない人名など、使用の頻度が極めて低いものは削除するようにしてもよい。人名でない記述を誤って登録した場合などには、この削除によって、個別人名データベースDB1の内容を適正化することができる。
【0101】
また、上記第1および第2の実施形態では、電子メールの送信元のユーザU2も宛先のユーザU1も一人であったが、いずれか一方または双方が、複数のユーザから構成されるグループであってもよいことは当然である。一般的に、前記IMAP4などに対応したメールサーバでは、1つのメールボックスを複数のユーザで共有することも容易である。
【0102】
例えば、電子メールを受信する側がグループの場合には、当該電子メールのToフィールドなどに記述される宛先電子メールアドレスも、グループを構成する個々のユーザではなく、当該グループそのものを指定することになるため、前記個別人名データベース(DB1)は、個々のユーザごとに設けられるのではなく、グループごとに設けることになる。
【0103】
なお、宛先(または送信元)のユーザが一人で前記ToフィールドやFromフィールドに当該一人のユーザの電子メールアドレスが記述される場合であっても、個別人名データベースをグループごとに設けることは可能である。
【0104】
例えば、共通の知人が多い複数のユーザが操作する各通信端末をネットワークで接続し、いずれかのユーザが電子メールを受信したり、送信したりするたびに、前記ヘッダ解析を実行して、当該ヘッダ解析で抽出された記述(コメントなど)を同じ個別人名データベースに登録するように構成することが考えられる。
【0105】
一般的に、個別人名データベースの導入直後は、登録人名数が少なすぎて高い品質の本文解析結果を得ることが困難であることが予想できるが、このような構成を取ることによって、早期に、個別人名データベースの登録人名数が十分な数に達することが期待できる。
【0106】
また、個別人名データベースの導入直後に登録人名数が少なすぎて高い品質の本文解析結果を得ることが困難となること等を防止するため、導入時に、ユーザU1自身が手作業で、その場で思い出せる知人の人名を個別人名データベースDB1へ登録することができるようにしてもよい。
【0107】
さらに、必要に応じて、導入時以降に、ユーザU1が個別人名データベースDB1中の登録内容を確認し、不必要と判断した人名等の登録を適宜、抹消できるようにしてもよい。
【0108】
また、上記第1および第2の実施形態では、本発明を電子メールに適用したが、本発明の適用範囲は電子メールに限定されるものではない。
【0109】
例えば、特定のグループ内で利用される電子掲示板などにも、本発明を適用できる可能性がある。電子掲示板は通常、一人の発信者が、不特定多数のユーザに情報を発信するための通信手段であるが、電子掲示板の利用方法や電子掲示板自体の構成によっては、一人(または特定グループ)の発信者が特定の一人(または特定グループ)に対して情報を発信するために利用することも可能だからである。
【0110】
なお、上記第2の実施形態では、人名でないと判定された記述はいずれのデータベースにも登録しなかったが、例えば、団体名を登録するための個別団体名データベースを用意して、当該個別団体名データベースにその記述を登録するようにしてもよい。本文解析の内容などによっては、個別団体名データベースの登録内容も有用である。
【0111】
また、上記第1および第2の実施形態では、電子メールの(ヘッダ部分の)記述から生成した個別人名データベースを、電子メールの(本文部分の)解析に利用したが、個別人名データベースはそれ自体で価値を有するものであるため、本文解析以外の用途に利用することも可能である。
【0112】
一例としては、ユーザ(U1)とは異なる第3者が、例えば、CRM(顧客関係管理)のために、当該個別人名データベースの登録内容を活用することが考えられる。
【0113】
また、パーソナルコンピュータである通信端末34は、住所録などのPIM(個人情報管理)ソフトを搭載していることも多いが、当該PIMソフトの登録内容と前記個別人名データベースの登録内容を相互に利用したり、補完したりできるように構成してもよい。
なお、前記通信端末34,35はパーソナルコンピュータであるものとしたが、これらが、携帯電話機、PHS端末、メール端末などの携帯通信端末であってもよいことは当然である。
【0114】
また、前記メール解析部45や個別人名データベースDB1は、上述した前記通信端末34やメールサーバ32などのほか、メールサーバ32と通信端末34のあいだ等に介在し得るファイアウオールなどに配置することも可能である。
【0115】
以上の説明では主としてハードウエア的に本発明を実現したが、本発明はソフトウエア的に実現することも可能である。
【0116】
【発明の効果】
以上に説明したように、本発明では、メッセージ発信元ユーザ集合を特定する発信元識別情報を蓄積することにより、メッセージ発信先ユーザ集合ごとに固有の蓄積内容を有する柔軟な識別情報用データベース手段を自動的に生成することができ、メッセージ発信先ユーザ集合に属するユーザに当該識別情報用データベース手段を生成するための作業負担は、ほとんど発生しない。
【0117】
また、本発明のメッセージ提供システムでは、このような識別情報用データベース手段を利用することにより、高品質なメッセージ本文の解析結果を、少ない処理量で効率的に得ることが可能となる。
【図面の簡単な説明】
【図1】第1および第2の実施形態の動作説明図である。
【図2】第1の実施形態の動作説明図である。
【図3】第2の実施形態の動作説明図である。
【図4】第1および第2の実施形態にかかる通信システムの全体構成例を示す概略図である。
【図5】第1および第2の実施形態で使用する通信端末の内部構成例を示す概略図である。
【符号の説明】
30…通信システム、31…ネットワーク(インターネット),32,33…メールサーバ、34,35…通信端末、40…通信部、41…制御部、42…操作部、43…表示部、44…記憶部、45…メール解析部、45A…ヘッダ解析部、45B…本文解析部、ME1…電子メール。

Claims (2)

  1. 発信元から発信先に電子メールによってメッセージを提供するためのメッセージ提供システムにおいて、
    電子メールの発信元又は発信先となり得る個人、又は、複数人が所属するグループに、関連する個人又はグループの識別情報を蓄積している識別情報用データベース手段と、
    受信した又は送信する電子メールのヘッダを解析するヘッダ解析手段と、
    前記ヘッダ解析手段が解析を終了した直後に、受信した又は送信する前記電子メールのメール本文を解析する本文解析手段とを備え、
    前記ヘッダ解析手段は、
    受信した又は送信する前記電子メールのヘッダ内に所定の記述態様で記述される発信元又は発信先識別情報を、当該記述態様をもとに抽出する識別情報抽出手段と、
    当該識別情報抽出手段が抽出した発信元又は発信先識別情報を前記識別情報用データベース手段に蓄積する識別情報蓄積手段とを備え、
    前記本文解析手段は、受信した又は送信する前記電子メールのメール本文を解析する際には、その電子メールのヘッダ解析で得られた識別情報が蓄積された前記識別情報用データベース手段を利用する
    ことを特徴とするメッセージ提供システム。
  2. 請求項1に記載のメッセージ提供システムにおいて、
    前記ヘッダ解析手段は、前記識別情報抽出手段が抽出した前記発信元又は発信先識別情報が非人名であるか否かを判定する非人名判定手段をさらに備え、前記識別情報蓄積手段は、前記非人名判定手段が非人名ではないと判定した場合に、前記識別情報用データベース手段に蓄積することを特徴とするメッセージ提供システム。
JP2002373644A 2002-12-25 2002-12-25 メッセージ提供システム Expired - Fee Related JP4334210B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002373644A JP4334210B2 (ja) 2002-12-25 2002-12-25 メッセージ提供システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002373644A JP4334210B2 (ja) 2002-12-25 2002-12-25 メッセージ提供システム

Publications (2)

Publication Number Publication Date
JP2004207940A JP2004207940A (ja) 2004-07-22
JP4334210B2 true JP4334210B2 (ja) 2009-09-30

Family

ID=32811867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002373644A Expired - Fee Related JP4334210B2 (ja) 2002-12-25 2002-12-25 メッセージ提供システム

Country Status (1)

Country Link
JP (1) JP4334210B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4640228B2 (ja) * 2006-03-24 2011-03-02 日本電気株式会社 通信端末におけるニックネーム登録方法及びその装置

Also Published As

Publication number Publication date
JP2004207940A (ja) 2004-07-22

Similar Documents

Publication Publication Date Title
US9977777B2 (en) System and method for read-ahead enhancements
US7543031B2 (en) Publication to shared content sources using natural language electronic mail destination addresses and interest profiles registered by the shared content sources
US7657603B1 (en) Methods and systems of electronic message derivation
JP4956420B2 (ja) 会話ベースの電子メールシステムにおける会話の表示
US20080005284A1 (en) Method and Apparatus For Publishing Textual Information To A Web Page
US20030110227A1 (en) Real time streaming media communication system
CN101194277A (zh) 在基于对话的电子邮件系统中显示对话
JP2014532934A (ja) 電子メールタグ
JP2009521182A (ja) 携帯デバイスおよび携帯デバイスからメッセージを送信する方法
CN114143282A (zh) 邮件处理方法、装置、设备及存储介质
US7962557B2 (en) Automated translator for system-generated prefixes
JP4998302B2 (ja) メール誤配信防止システム、メール誤配信防止方法、及びメール誤配信防止用プログラム
JP4334210B2 (ja) メッセージ提供システム
JP4221132B2 (ja) 情報処理装置及び方法並びにこれに利用される記憶媒体
JP2018152049A (ja) 冗長要素の排除による電子メッセージを編集する方法
JP2004040304A (ja) 電子メールアドレス管理方法およびプログラム、電子メール端末装置
JP7414880B2 (ja) 端末装置、方法及びプログラム
JP3938577B2 (ja) 悪戯メール防止装置、その方法及び記録媒体
JP2000101634A (ja) メール配信装置及びメール配信方法
TWI287720B (en) Junk mail filtering systems and methods based on abnormal features in e-mails
JP2005141760A (ja) 悪戯メール防止装置、その方法及び記録媒体
JP2005100453A (ja) 悪戯メール防止装置、その方法及び記録媒体
CN118118453A (zh) 一种基于攻击视角的邮件生成方法、系统、设备及介质
KR20100096792A (ko) 사내 개인정보 검색장치 및 그 방법
JP2002278959A (ja) 文章入力支援装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061016

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090526

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090623

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130703

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees