JP2012133474A - Determination method of erroneous transmission of electronic mail, determination program and communication apparatus - Google Patents

Determination method of erroneous transmission of electronic mail, determination program and communication apparatus Download PDF

Info

Publication number
JP2012133474A
JP2012133474A JP2010283343A JP2010283343A JP2012133474A JP 2012133474 A JP2012133474 A JP 2012133474A JP 2010283343 A JP2010283343 A JP 2010283343A JP 2010283343 A JP2010283343 A JP 2010283343A JP 2012133474 A JP2012133474 A JP 2012133474A
Authority
JP
Japan
Prior art keywords
mail
target
phrase
address
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010283343A
Other languages
Japanese (ja)
Other versions
JP5584608B2 (en
Inventor
Keisuke Koito
啓介 小糸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Advanced Engineering Ltd
Original Assignee
Fujitsu Advanced Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Advanced Engineering Ltd filed Critical Fujitsu Advanced Engineering Ltd
Priority to JP2010283343A priority Critical patent/JP5584608B2/en
Publication of JP2012133474A publication Critical patent/JP2012133474A/en
Application granted granted Critical
Publication of JP5584608B2 publication Critical patent/JP5584608B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve accuracy in determining whether a destination of electronic mail is wrong.SOLUTION: An appearance frequency of a phrase contained in transmitted or received electronic mail is stored in a phrase database correspondingly to a destination address and a transmission source address of the electronic mail. From among phrases contained in target electronic mail to be transmitted, a target phrase is extracted that is a phrase not contained in a common phrase database which records a phrase used in common for a plurality of electronic mail items. Furthermore, the total number of target phrases is acquired. For each of the target phrases, the appearance frequency stored in the phrase database correspondingly to the destination address of the target electronic mail is compared with a first threshold value and the number of target phrases each having the appearance frequency greater than the first threshold value is acquired. Further, in the case where a ratio of the number of phrases each having the appearance frequency greater than the first threshold in the total number is less than a second threshold value, transmission of the target electronic mail is determined as erroneous transmission.

Description

本発明は、電子メールの誤送信を判定する方法に関する。   The present invention relates to a method for determining an erroneous transmission of an electronic mail.

近年、情報の管理が強く求められるようになってきており、情報の流出を引き起こした企業は信用を失墜してしまう。近年、電子メールがビジネスなどで用いられるようになってきたことに伴って、電子メールの誤送信による情報の流出事故の件数も増加している。従って、電子メールの誤送信を防止することにより、情報の流出を防止することができると期待される。また、電子メールの誤送信等、インターネットを通じて情報が流出してしまった場合は情報の拡散の速度が速いことも指摘されていることからも、電子メールの誤送信を防ぎやすくするシステムが求められている。   In recent years, management of information has been strongly demanded, and companies that have caused information leakage have lost their trust. In recent years, along with the use of e-mail in business and the like, the number of information leakage accidents due to erroneous transmission of e-mail has increased. Therefore, it is expected that information leakage can be prevented by preventing erroneous transmission of electronic mail. In addition, it is pointed out that when information is leaked through the Internet, such as erroneous transmission of email, it is pointed out that the speed of diffusion of information is pointed out. Therefore, a system that makes it easy to prevent erroneous transmission of email is required. ing.

関連する技術として、送信対象メールを語句に分解し、語句の出現頻度と未使用期間指数を用いて得られた誤送信指数に基づいて誤送信を検出するプログラムが知られている。また、宛先アドレスに有効ワードが含まれているかに基づいて、メールの転送の可否を判断するシステムが提案されている。さらに、送信先アドレスの正当性を検証する装置も知られている。この装置は、送受信された電子メールの累積送信回数を格納し、送信先アドレスの組み合わせごとの累積送信回数を基に送信先アドレスの組み合わせを並べ替えた後、送信先アドレスの組み合わせをユーザに提示する。   As a related technique, a program is known in which a transmission target mail is decomposed into words and an erroneous transmission is detected based on an erroneous transmission index obtained using the appearance frequency of the word and an unused period index. In addition, a system has been proposed for determining whether mail can be transferred based on whether a valid word is included in the destination address. Furthermore, an apparatus for verifying the validity of a transmission destination address is also known. This device stores the cumulative number of transmissions of sent and received e-mails, rearranges the combination of destination addresses based on the cumulative number of transmissions for each combination of destination addresses, and then presents the combination of destination addresses to the user To do.

特開2007−34827号公報JP 2007-34827 A 特開2007−272323号公報JP 2007-272323 A 特開2007−148786号公報JP 2007-148786 A

ある語句について計算された誤送信指数を用いて誤送信を判定する方法では、多数のユーザによって使用されうる語句が判定に用いられると、誤送信を検出しづらくなるという問題がある。例えば、曜日や挨拶に用いる言葉など、ユーザによらずに良く用いられる語句を判定に用いた場合、その語句を含むメールの宛先アドレスや送信元アドレスの数が多いことが予測される。このような場合、語句が含まれているかを確認することにより、メールの送信先などが誤っているかを判定することは困難である。従って、多数のユーザに共通して用いられる語句の割合が多い電子メールは、宛先が誤っていたとしても誤送信であると判定されない恐れがある。   In the method of determining erroneous transmission using the erroneous transmission index calculated for a certain phrase, there is a problem that it is difficult to detect erroneous transmission when a phrase that can be used by many users is used for determination. For example, when words and phrases frequently used without depending on the user, such as words used for days of the week and greetings, are used for determination, it is predicted that there are a large number of mail destination addresses and sender addresses including the words. In such a case, it is difficult to determine whether the mail transmission destination or the like is incorrect by confirming whether the phrase is included. Therefore, there is a possibility that an e-mail with a large proportion of words / phrases commonly used by many users will not be determined to be erroneous transmission even if the destination is incorrect.

さらに、宛先アドレスに有効ワードが含まれているかにより転送の下記を判断するシステムや、宛先アドレスの組合せごとの累積送信回数に基づいて宛先アドレスを提示するシステムでは、メールの内容については判断されない。従って、例えば、有効ワードを含む宛先アドレスAに、他の宛先に送信するつもりでユーザが作成したメールが送信される可能性があり、これらのシステムでは誤送信を検出できない場合がある。   Further, in the system that determines the following transfer based on whether the destination address includes a valid word or the system that presents the destination address based on the cumulative number of transmissions for each combination of destination addresses, the contents of the mail are not determined. Therefore, for example, there is a possibility that a mail created by a user intended to be transmitted to another destination is transmitted to a destination address A including a valid word, and these systems may not detect erroneous transmission.

本発明は電子メールの宛先が誤っているかの判定の精度を向上することを目的とする。   An object of the present invention is to improve the accuracy of determining whether an e-mail destination is incorrect.

ある実施形態は、コンピュータに実行させる電子メールの誤送信の判定方法を提供する。コンピュータは、送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶する。コンピュータは、送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得する。コンピュータは、前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けて前記語句データベースに記憶されている前記出現頻度を第1の閾値と比較し、前記出現頻度が前記第1の閾値よりも大きい対象語句の数を取得する。さらに、コンピュータは、前記出現頻度が前記第1の閾値よりも大きい対象語句の数の前記総数に対する割合が第2の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する。   An embodiment provides a method for determining e-mail mistransmission to be executed by a computer. The computer stores the occurrence frequency of the phrase included in the transmitted or received e-mail in the phrase database in association with the destination address and the transmission source address of the e-mail. The computer extracts a target phrase that is a phrase that is not included in the common phrase database that records words commonly used in a plurality of e-mails from among the phrases included in the target e-mail to be transmitted. , To obtain the total number of the target words. For each of the target words, the computer compares the appearance frequency stored in the word database in association with a destination address of the target electronic mail with a first threshold value, and the appearance frequency is the first threshold value. Get the number of target words larger than. Furthermore, the computer determines that the transmission of the target e-mail is an erroneous transmission when the ratio of the number of target words / phrases with an appearance frequency greater than the first threshold to the total is less than a second threshold.

電子メールの宛先が誤っているかの判定の精度が向上する。   The accuracy of determining whether an e-mail destination is incorrect is improved.

複数のユーザの間の通信で使用される語句の分布の例を説明する図である。It is a figure explaining the example of distribution of the phrase used by communication between a plurality of users. 通信装置の構成の一例を示す図である。It is a figure which shows an example of a structure of a communication apparatus. 語句データベースの例を示す図である。It is a figure which shows the example of a phrase database. 共通語句データベースの例を示す図である。It is a figure which shows the example of a common word database. 関連性データベースの例を示す図である。It is a figure which shows the example of a relevance database. 辞書データの例を示す図である。It is a figure which shows the example of dictionary data. 通信装置のハードウェア構成の例を説明する図である。It is a figure explaining the example of the hardware constitutions of a communication apparatus. 受信メールの分割方法の例を説明する図である。It is a figure explaining the example of the division | segmentation method of a received mail. 電子メール分割部の動作の例を説明するフローチャートである。It is a flowchart explaining the example of operation | movement of an email division part. 語句データベースの更新方法の例を説明する図である。It is a figure explaining the example of the update method of a phrase database. 重み係数の算出方法の例を説明する図である。It is a figure explaining the example of the calculation method of a weighting coefficient. 関連性データベースの更新に際して行われる動作の例を説明するフローチャートである。It is a flowchart explaining the example of the operation | movement performed at the time of the update of a relevance database. 送信メールの分割方法の例を説明する図である。It is a figure explaining the example of the division | segmentation method of an outgoing mail. 電子メール分割部と本文誤り判定部の動作の例を説明するフローチャートである。It is a flowchart explaining the example of operation | movement of an email division part and a text error determination part. 電子メール分割部と本文誤り判定部の動作の例を説明するフローチャートである。It is a flowchart explaining the example of operation | movement of an email division part and a text error determination part. アドレス誤り判定部の動作の例を説明するフローチャートである。It is a flowchart explaining the example of operation | movement of an address error determination part. 確認画面の例を示す。An example of a confirmation screen is shown. 修正前語句テーブルの例を示す図である。It is a figure which shows the example of a word table before correction. ランク変更量テーブルの例を説明する図である。It is a figure explaining the example of a rank change amount table. 関連性データベースの更新に際して行われる動作の例を説明するフローチャートである。It is a flowchart explaining the example of the operation | movement performed at the time of the update of a relevance database. 送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database based on a transmission mail. 送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database based on a transmission mail. 送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database based on a transmission mail. 送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database based on a transmission mail. ランク変更量テーブルの例を説明する図である。It is a figure explaining the example of a rank change amount table. 修正前アドレステーブルの例を示す図である。It is a figure which shows the example of the address table before correction. 第3の実施形態に係る関連性データベース更新部の処理の例を説明する図である。It is a figure explaining the example of a process of the relevance database update part which concerns on 3rd Embodiment. 第3の実施形態に係る関連性データベース更新部の動作の例を説明するフローチャートである。It is a flowchart explaining the example of operation | movement of the relevance database update part which concerns on 3rd Embodiment. 第3の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database performed in 3rd Embodiment. 第3の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database performed in 3rd Embodiment. 第3の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database performed in 3rd Embodiment. 第3の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。It is a flowchart explaining the example of the update method of the database performed in 3rd Embodiment. 第4の実施形態に係るネットワークの例を示す図である。It is a figure which shows the example of the network which concerns on 4th Embodiment. 第4の実施形態に係る誤送信判定装置の例を示す図である。It is a figure which shows the example of the erroneous transmission determination apparatus which concerns on 4th Embodiment. 送信メールが誤送信であると判定された場合のユーザへの通知方法の例を説明するフローチャートである。It is a flowchart explaining the example of the notification method to a user when it determines with transmission mail being erroneous transmission.

以下、本実施形態について、図面を参照しながら詳細に説明する。
図1は、複数のユーザの間の通信で使用される語句の分布の例を説明する図である。図1(a)は、3人のユーザA〜Cが通信するときに用いられる語句の分布の例を示す。ユーザAが用いる語句の集合をW1の円で示す。同様に、ユーザBが用いる語句の集合をW2、ユーザCが用いる語句の集合をW3の円で示す。ユーザAとユーザBは、お互いに電子メールの送受信などのコミュニケーションをとるときには、ユーザAとユーザBに共通した語句を用いる。そこで、ユーザAとユーザBの間で送受信される電子メールには、W1とW2の共通部分であるW12とW123に含まれる語句が用いられると予測できる。同様に、ユーザAとユーザCの間で送受信される電子メールには、W13とW123に含まれる語句が用いられると予測できる。さらに、ユーザBとユーザCの間で送受信される電子メールには、W23とW123に含まれる語句が用いられると予測できる。ここで、W123に含まれている語句は、例えば、曜日などユーザA〜Cのいずれもが電子メールに記載する可能性がある語句である。すなわち、W123に含まれる語句は、ユーザAがユーザB、Cのいずれに送信する電子メールに含まれていても良いため、W123の語句に基づいてユーザA〜Cのいずれに送信される電子メールであるかを判定することはできない。
Hereinafter, the present embodiment will be described in detail with reference to the drawings.
FIG. 1 is a diagram for explaining an example of a distribution of phrases used in communication between a plurality of users. Fig.1 (a) shows the example of distribution of the phrase used when the three users AC communicate. A set of words and phrases used by user A is indicated by a circle W1. Similarly, a set of words and phrases used by user B is indicated by a circle W2, and a set of words and phrases used by user C is indicated by a circle W3. When user A and user B communicate with each other, such as sending and receiving e-mails, words and phrases common to user A and user B are used. Therefore, it can be predicted that words included in W12 and W123, which are common parts of W1 and W2, are used for e-mails transmitted and received between user A and user B. Similarly, it can be predicted that the words included in W13 and W123 are used for e-mails transmitted and received between user A and user C. Furthermore, it can be predicted that the words included in W23 and W123 will be used for e-mails transmitted and received between user B and user C. Here, the word / phrase included in W123 is a word / phrase that any of the users A to C, such as a day of the week, may write in the e-mail. That is, since the word / phrase included in W123 may be included in the email sent by user A to either user B or C, the email sent to any of users A to C based on the word / phrase of W123. Cannot be determined.

そこで、ある実施形態に係る通信装置では、多数のユーザが共通して使用する語句(共通語句)を電子メールの宛先が適切であるかの判定に用いる語句から削除する。共通語句は、多数のユーザによって使用される語句であり、例えば、閾値以上の数のユーザによって使用されている語句とすることができる。共通語句の決定方法などについては後述する。図1の例では、共通語句はW123に含まれる語句であるとする。共通語句を除くと、図1(a)に示す語句の集合からW123に含まれる語句が除かれるので、コミュニケーションに用いられる語句は、図1(b)に示すように分布する。従って、通信装置は、例えば、ユーザAからユーザBに送信される電子メールに、W1bとW2bの共通部分であるW12の語句が含まれるかを確認する。ここでは、通信端末は複数のユーザ端末間でのメールの送受信を中継するサーバである場合を例として述べる。   Therefore, in a communication apparatus according to an embodiment, a phrase (common phrase) commonly used by a large number of users is deleted from a phrase used for determining whether an e-mail destination is appropriate. The common word / phrase is a word / phrase used by a large number of users, and can be, for example, a word / phrase used by a number of users equal to or greater than a threshold value. A method for determining a common word will be described later. In the example of FIG. 1, it is assumed that the common phrase is a phrase included in W123. Excluding the common words / phrases, the words / phrases included in W123 are removed from the word / phrase set shown in FIG. 1 (a), so the words / phrases used for communication are distributed as shown in FIG. 1 (b). Therefore, for example, the communication apparatus checks whether the e-mail transmitted from the user A to the user B includes the word / phrase W12 which is a common part of W1b and W2b. Here, a case where the communication terminal is a server that relays mail transmission / reception among a plurality of user terminals will be described as an example.

まず、通信装置は、送受信が行われた電子メールに含まれている語句を、その電子メールが送受信されたユーザに対応付けて記憶する。例えば、W12に含まれる語句をユーザAとユーザBに対応付けて記憶する。通信装置は、同様に、W13に含まれる語句をユーザAとユーザC、W23に含まれる語句をユーザBとユーザC、および、W123に含まれる語句をユーザA〜Cに対応付けて記憶する。   First, the communication device stores the words / phrases included in the transmitted / received electronic mail in association with the user who transmitted / received the electronic mail. For example, the words included in W12 are stored in association with user A and user B. Similarly, the communication device stores words and phrases included in W13 in association with users A and C, words and phrases included in W23 in association with users B and C, and words and phrases included in W123 in association with users AC.

次に、通信装置が、送信元にユーザA、宛先にユーザBが指定されており、宛先に送信される対象となっている電子メール(対象電子メール)を受信したとする。通信装置は、対象電子メールの本文を語句ごとに分割することにより、対象電子メールに含まれている語句を取得する。さらに、通信装置は、取得した語句からW123に含まれている語句を除いた語句を、処理の対象とする語句(対象語句)とする。ここで、通信装置は、予め、W123に含まれる語句を記録した共通語句データベースを記憶しているものとする。通信装置は、対象語句の各々について、W12に含まれているかを確認することにより、ユーザAとユーザBとの間での通信に用いられる語句であるかを確認する。通信装置は、対象語句であり、かつ、W12に含まれている語句の数を求める。W12に含まれている対象語句の数が閾値を下回った場合、通信装置は、対象電子メールの送信は誤送信であると判定する。そこで、通信装置は、誤送信の警告をユーザAに使用されている端末に通知する。   Next, it is assumed that the communication apparatus has received user A as the transmission source and user B as the destination, and has received an electronic mail (target electronic mail) to be transmitted to the destination. The communication device acquires the words included in the target electronic mail by dividing the main body of the target electronic mail into words. Furthermore, the communication apparatus sets a word / phrase obtained by removing a word / phrase included in W123 from the acquired word / phrase as a processing target word / phrase (target word / phrase). Here, it is assumed that the communication device stores in advance a common phrase database in which the phrases included in W123 are recorded. The communication device confirms whether each of the target words / phrases is a word / phrase used for communication between the user A and the user B by confirming whether the target word / phrase is included in W12. The communication apparatus obtains the number of phrases that are the target phrases and are included in W12. When the number of target words included in W12 falls below the threshold, the communication apparatus determines that the transmission of the target electronic mail is an erroneous transmission. Therefore, the communication device notifies the terminal used by the user A of an erroneous transmission warning.

このように、ユーザによらずに良く用いられる語句を、誤送信の判定の際に用いないことにより、いずれのユーザにも用いられる語句の数を含めないで、対象電子メールの送信者と受信者との間で共通に用いられる語句の数を計数する。従って、いずれのユーザにも用いられる語句が多い電子メールについても、誤送信の可能性があるかを精度良く判定することができる。   In this way, by not using words that are frequently used regardless of the user when determining erroneous transmission, the sender and receiver of the target e-mail can be received without including the number of words that are used by any user. Count the number of phrases that are commonly used with a person. Therefore, it is possible to accurately determine whether there is a possibility of erroneous transmission even for an electronic mail that is frequently used by any user.

<装置構成>
通信端末は、送受信を中継するサーバに限られず、例えば、ユーザ端末として実現される場合もある。以下、通信端末が、あるユーザの端末である場合について説明する。
<Device configuration>
The communication terminal is not limited to a server that relays transmission and reception, and may be realized as a user terminal, for example. Hereinafter, a case where the communication terminal is a terminal of a certain user will be described.

図2は、通信装置10の構成の一例を示す図である。通信装置10は、受信部11、送信部12、電子メール作成部13、電子メール分割部14、送信確認部15、タイマ16、記憶部20、判定部40、および、データベース更新部50を備える。判定部40は、本文誤り判定部41とアドレス誤り判定部42を備える。記憶部20は、語句データベース21、共通語句データベース22、関連性データベース23、辞書データ31、データ32、および、プログラム33を記憶している。データベース更新部50は、語句データベース更新部51、共通語句データベース更新部52、および、関連性データベース更新部53を備える。   FIG. 2 is a diagram illustrating an example of the configuration of the communication device 10. The communication device 10 includes a reception unit 11, a transmission unit 12, an e-mail creation unit 13, an e-mail division unit 14, a transmission confirmation unit 15, a timer 16, a storage unit 20, a determination unit 40, and a database update unit 50. The determination unit 40 includes a text error determination unit 41 and an address error determination unit 42. The storage unit 20 stores a phrase database 21, a common phrase database 22, a relevance database 23, dictionary data 31, data 32, and a program 33. The database update unit 50 includes a phrase database update unit 51, a common phrase database update unit 52, and a relevance database update unit 53.

通信装置10は、受信部11を介して、受信メールなどのデータを受信する。受信部11は、受信した電子メールを電子メール分割部14に出力する。通信装置10は、送信部12を介して、通信装置10で生成されたデータなどを、通信装置10の通信先の端末等に送信する。タイマ16は、語句データベース更新部51や関連性データベース更新部53などの要求に応じて、時刻情報を通知する。   The communication device 10 receives data such as a received mail via the receiving unit 11. The receiving unit 11 outputs the received e-mail to the e-mail dividing unit 14. The communication device 10 transmits the data generated by the communication device 10 to the communication destination terminal of the communication device 10 via the transmission unit 12. The timer 16 notifies time information in response to a request from the phrase database update unit 51 and the relevance database update unit 53.

電子メール作成部13は、電子メールの入力画面や宛先の選択画面などを、通信装置10が備える表示部(図示せず)に表示する。また、適宜、電子メールの送信や受信に関する情報やエラーメッセージなどを、表示部に表示する。さらに、送信確認部15から、電子メールの送信を要求されると、電子メール作成部13は、送信が要求された電子メールを送信部12に出力する。なお、電子メール作成部13で生成された電子メールには、個々の電子メールを一意に識別することができる識別子が付されているものとする。識別子は、例えば、作成時刻を表す文字列や通し番号などとすることができる。電子メール作成部13は、電子メール分割部14に電子メールを出力するときに、その電子メールを識別する識別子を合わせて通知するものとする。   The e-mail creation unit 13 displays an e-mail input screen, a destination selection screen, and the like on a display unit (not shown) included in the communication device 10. In addition, information on transmission and reception of e-mails, error messages, and the like are appropriately displayed on the display unit. Further, when the transmission confirmation unit 15 requests transmission of an email, the email creation unit 13 outputs the email requested to be transmitted to the transmission unit 12. It is assumed that an identifier that can uniquely identify each email is attached to the email generated by the email creation unit 13. The identifier can be, for example, a character string representing a creation time or a serial number. When the e-mail creating unit 13 outputs an e-mail to the e-mail dividing unit 14, the e-mail creating unit 13 notifies the e-mail together with an identifier for identifying the e-mail.

電子メール分割部14は、通信装置10が受信した電子メールや電子メール作成部13で作成された電子メールを、複数のパラグラフに分割する。例えば、電子メール分割部14は、電子メールを挨拶文、引用文、署名、本文の4つに分割することができる。さらに、電子メール分割部14は、分割されたパラグラフごとに、含まれている語句を特定する。電子メール分割部14は、通信装置10が受信したメールを分割して得られた語句を、電子メールの送信元アドレスおよび宛先アドレスに対応付けて、語句データベース更新部51に出力する。また、通信装置10が受信したメールの送信元アドレスと宛先アドレスも、関連性データベース更新部53に出力する。   The e-mail dividing unit 14 divides the e-mail received by the communication device 10 and the e-mail created by the e-mail creating unit 13 into a plurality of paragraphs. For example, the e-mail dividing unit 14 can divide the e-mail into four parts: a greeting, a quote, a signature, and a body. Further, the e-mail dividing unit 14 specifies a word / phrase included for each divided paragraph. The e-mail dividing unit 14 outputs the word / phrase obtained by dividing the mail received by the communication device 10 to the word / phrase database updating unit 51 in association with the source address and destination address of the e-mail. In addition, the transmission source address and the destination address of the mail received by the communication device 10 are also output to the relevance database update unit 53.

一方、電子メール作成部13で作成された電子メールを分割して得られた語句については、電子メール分割部14は、電子メールの送信元アドレス、宛先アドレス、および、電子メールの識別子に対応付けて、本文誤り判定部41に出力する。また、電子メール作成部13で作成された電子メールの送信元アドレスと宛先アドレスを、電子メールの識別子に対応付けて、アドレス誤り判定部42に出力する。電子メール分割部14の動作については、後で詳しく説明する。   On the other hand, for words obtained by dividing the email created by the email creation unit 13, the email splitting unit 14 associates the email with the source address, destination address, and identifier of the email. Is output to the text error determination unit 41. Further, the source address and the destination address of the email created by the email creation unit 13 are output to the address error determination unit 42 in association with the identifier of the email. The operation of the e-mail dividing unit 14 will be described in detail later.

図3は、語句データベース21の例を示す図である。語句データベース更新部51は、電子メール分割部14で特定された語句の各々を語句データベース21に記録する。図3に示す例では、電子メール分割部14に特定された語句は、その語句が含まれるパラグラフの種類、2つの電子メールアドレスの組み合わせ、ランク、更新日に対応付けて記録される。ここで、図3の例では、ある語句を含む電子メールの送信元アドレスと宛先アドレスの組み合わせに対応づけてその語句が登録され、2つのアドレスのうちのいずれが送信元アドレスであっても1つの情報に登録される。例えば、「迷惑メール」という語句がt-tanaka@xx-network.co.jpからsuzuki@ghi.co.jpに送信される電子メールに含まれている場合に、図3の矢印で示した情報が更新される。さらに、「迷惑メール」という語句がsuzuki@ghi.co.jpからt-tanaka@xx-network.co.jpに送信される電子メールに含まれている場合にも、図3の矢印で示した情報が更新される。   FIG. 3 is a diagram illustrating an example of the phrase database 21. The phrase database update unit 51 records each phrase specified by the e-mail dividing unit 14 in the phrase database 21. In the example shown in FIG. 3, the phrase specified by the email dividing unit 14 is recorded in association with the type of paragraph in which the phrase is included, the combination of two email addresses, the rank, and the update date. Here, in the example of FIG. 3, the word is registered in association with the combination of the source address and destination address of the e-mail containing a certain word, and one of the two addresses is the source address. Registered in one piece of information. For example, if the phrase “junk mail” is included in an email sent from t-tanaka@xx-network.co.jp to suzuki@ghi.co.jp, the information indicated by the arrow in FIG. Is updated. In addition, the phrase “junk mail” is also indicated by the arrow in FIG. 3 when it is included in an email sent from suzuki@ghi.co.jp to t-tanaka@xx-network.co.jp. Information is updated.

情報が更新される際には、ランクの値が変更される。ここで、ランクは、ある語句が送信元アドレスと宛先アドレスの間で送受信される電子メールに出現する可能性の大きさを表す数値であり、語句の出現頻度を示す数値でもある。ランクの決定方法や更新方法については後述する。なお、図3は、語句データベース21の例であり、語句データベース21に含まれる情報の種類などは、実装に応じて変更されることがある。   When the information is updated, the rank value is changed. Here, the rank is a numerical value indicating the possibility that a certain word will appear in an electronic mail transmitted / received between the transmission source address and the destination address, and is also a numerical value indicating the appearance frequency of the word / phrase. The rank determination method and update method will be described later. 3 is an example of the phrase database 21, and the type of information included in the phrase database 21 may be changed depending on the implementation.

共通語句データベース22は、図1のW123に含まれている語句のように、閾値以上の数のユーザに共通して用いられている語句を記録する。共通語句データベース22は、前述のように、予め、通信装置10に記憶されている場合もあるが、通信装置10が生成することもできる。本実施形態では、共通語句データベース22は、共通語句データベース更新部52により生成され、更新もされるものとする。   The common phrase database 22 records phrases that are commonly used by a number of users equal to or greater than a threshold, such as the phrases included in W123 of FIG. As described above, the common word / phrase database 22 may be stored in the communication device 10 in advance, but may be generated by the communication device 10. In the present embodiment, the common phrase database 22 is generated and updated by the common phrase database update unit 52.

共通語句データベース更新部52は、例えば、語句データベース21で対応付けられている宛先アドレスの数と送信元アドレスの数の合計が閾値よりも大きい語句を、共通語句データベース22に記録する。図4は、共通語句データベース22の例を示す図である。なお、図4は、共通語句データベース22の例であり、実装に応じて、共通語句データベース22に含まれる情報の種類は変更されることがある。例えば、共通語句データベース22は、語句に対応付けて、その語句が含まれる電子メールの宛先アドレスの数と送信元アドレスの数の合計数を記録することもできる。共通語句データベース更新部52は、語句データベース21が更新されると、共通語句データベース22を更新することができる。   For example, the common phrase database update unit 52 records, in the common phrase database 22, a phrase in which the sum of the number of destination addresses and the number of transmission source addresses associated in the phrase database 21 is greater than a threshold value. FIG. 4 is a diagram illustrating an example of the common word / phrase database 22. Note that FIG. 4 is an example of the common phrase database 22, and the type of information included in the common phrase database 22 may be changed depending on the implementation. For example, the common phrase database 22 can record the total number of destination addresses and source addresses of e-mails including the phrase in association with the phrase. The common phrase database update unit 52 can update the common phrase database 22 when the phrase database 21 is updated.

本文誤り判定部41は、共通語句データベース22を参照することにより、電子メール分割部14から入力された語句のうちで共通語句データベース22に含まれていない対象語句を抽出する。さらに、対象語句の各々について、送信元アドレスと宛先アドレスに対応付けられているランクの値を語句データベース21から取得し、取得したランクを第2の閾値と比較する。ここで、ランクが第2の閾値よりも大きい場合は、送信元アドレスと宛先アドレスの間で送受信される電子メール中に、その対象語句が含まれていることにより、そのメールが誤送信である可能性が小さくなることを示す。本文誤り判定部41は、ランクの値が第2の閾値よりも大きい対象語句が、その電子メール中にいくつ含まれているかを計数する。第2の閾値よりもランクの値が大きい対象語句の値が、第3の閾値未満の場合、本文誤り判定部41は、電子メールの文面から誤送信であると判定する。誤送信の可能性があると判定した場合、本文誤り判定部41は、送信確認部15に誤送信の可能性があることを通知する。一方、第2の閾値よりもランクの値が大きい対象語句の値が、第3の閾値よりも大きい場合、本文誤り判定部41は、電子メールの文面から誤送信でないと判定する。すると、本文誤り判定部41は、送信確認部15に誤送信ではないという判定結果を通知する。本文誤り判定部41は、後述するように、送信確認部15から電子メールを送信した旨の通知を受けると、送信されたメールに含まれている対象語句を、送信元アドレスと宛先アドレスに対応付けて、データベース更新部51に出力する。   The text error determination unit 41 refers to the common phrase database 22 to extract target phrases that are not included in the common phrase database 22 among the phrases input from the e-mail dividing unit 14. Further, for each target word / phrase, the rank value associated with the source address and the destination address is acquired from the word / phrase database 21, and the acquired rank is compared with the second threshold value. Here, when the rank is larger than the second threshold, the email is erroneously transmitted because the target word / phrase is included in the email transmitted / received between the source address and the destination address. Indicates that the possibility is reduced. The text error determination unit 41 counts how many target words / phrases whose rank value is greater than the second threshold are included in the e-mail. When the value of the target phrase having a rank value larger than the second threshold is less than the third threshold, the body error determination unit 41 determines that the transmission is erroneous from the text of the e-mail. When it is determined that there is a possibility of erroneous transmission, the text error determination unit 41 notifies the transmission confirmation unit 15 that there is a possibility of erroneous transmission. On the other hand, when the value of the target phrase having a rank value larger than the second threshold value is larger than the third threshold value, the body text error determination unit 41 determines that there is no erroneous transmission from the text of the email. Then, the text error determination unit 41 notifies the transmission confirmation unit 15 of the determination result that there is no erroneous transmission. As will be described later, when the body error determination unit 41 receives a notification that the e-mail has been transmitted from the transmission confirmation unit 15, the text error determination unit 41 corresponds the target word / phrase included in the transmitted mail to the source address and the destination address. In addition, the data is output to the database update unit 51.

図5は、関連性データベース23の例を示す図である。図5の例では、関連性データベース23には、2つのメールアドレスとそれらのメールアドレス間について計算された関連係数を記録している。ここで、関連係数は、2つのメールアドレスの間で電子メールが送受信される可能性を表すものとする。関連係数は0から1までの任意の数とすることができる。関連係数の計算方法と使用方法については、後述する。関連性データベース更新部53は、電子メール分割部14から通知されたアドレスから関連係数を計算し、関連性データベース23に記録する。また、関連性データベース更新部53は、関連性データベース23を更新した履歴も関連性データベース23に記録する。図5の例では、メールアドレスの組合せごとに、過去3回の送受信の記録が、関連性データベース23に記録されている。   FIG. 5 is a diagram illustrating an example of the relevance database 23. In the example of FIG. 5, the relevance database 23 records two e-mail addresses and a relevance coefficient calculated between the e-mail addresses. Here, the related coefficient represents the possibility that an electronic mail is transmitted and received between two mail addresses. The associated coefficient can be any number from 0 to 1. The calculation method and use method of the related coefficient will be described later. The relevance database update unit 53 calculates a relevance coefficient from the address notified from the e-mail dividing unit 14 and records it in the relevance database 23. The relevance database update unit 53 also records the history of updating the relevance database 23 in the relevance database 23. In the example of FIG. 5, the past three transmission / reception records are recorded in the relevance database 23 for each mail address combination.

アドレス誤り判定部42は、関連性データベース23を参照することにより、電子メール分割部14から入力された2つのアドレスの組合せに対応付けられた関連係数の大きさを関連閾値と比較する。ここで、関連閾値は、電子メール分割部14から入力された2つのアドレスの間で電子メールの送受信が行われる可能性があるかを判定するための閾値であり、関連性が関連閾値以上の場合、電子メールの送受信が行われると判定される。例えば、関連閾値は、同一の電子メールが同報される可能性がある2つのアドレスに対応付けられる最小値に設定される場合がある。アドレス誤り判定部42は、関連係数が関連閾値未満の値である場合、宛先アドレスが誤っていると判定する。複数のアドレスに同報される電子メールである場合は、個々の宛先アドレスについて判定が行われる。誤送信の可能性があると判定した場合、アドレス誤り判定部42は、送信確認部15に誤送信の可能性があることを通知する。一方、アドレス誤り判定部42は、関連係数が関連閾値以上の値である場合、送信元アドレスおよび宛先アドレスに含まれているアドレスの組合せからは、誤送信であると判定しない。アドレス誤り判定部42は、後述するように、送信確認部15から、メールを送信した旨の通知を受け取ると、送信されたメールに含まれている送信元アドレスと宛先アドレスを、関連性データベース更新部53に出力する。アドレス誤り判定部42の動作については、後で詳しく説明する。   The address error determination unit 42 refers to the relevance database 23 to compare the magnitude of the related coefficient associated with the combination of the two addresses input from the e-mail dividing unit 14 with the related threshold value. Here, the related threshold value is a threshold value for determining whether or not an e-mail may be transmitted / received between two addresses input from the e-mail dividing unit 14, and the relevance is equal to or higher than the related threshold value. In this case, it is determined that transmission / reception of electronic mail is performed. For example, the related threshold value may be set to a minimum value associated with two addresses where the same electronic mail may be broadcast. The address error determination unit 42 determines that the destination address is incorrect when the related coefficient is a value less than the related threshold. In the case of an e-mail broadcast to a plurality of addresses, the determination is made for each destination address. When it is determined that there is a possibility of erroneous transmission, the address error determination unit 42 notifies the transmission confirmation unit 15 that there is a possibility of erroneous transmission. On the other hand, when the related coefficient is a value equal to or greater than the related threshold, the address error determination unit 42 does not determine that the transmission is erroneous from the combination of the addresses included in the transmission source address and the destination address. As will be described later, when receiving a notification that the mail has been transmitted from the transmission confirmation unit 15, the address error determination unit 42 updates the source database and the destination address included in the transmitted mail by updating the relevance database. To the unit 53. The operation of the address error determination unit 42 will be described in detail later.

送信確認部15は、本文誤り判定部41やアドレス誤り判定部42から、誤送信の可能性があると通知されると、通信装置10の表示部(図示せず)に、エラーメッセージと送信を行うかの指示の入力を要求する確認画面を表示する。送信確認部15は、確認画面を介して、ユーザからメールの送信を指示されると、指示された電子メールを宛先アドレスに送信し、送信したことを本文誤り判定部41とアドレス誤り判定部42に通知する。また、送信確認部15は、本文誤り判定部41とアドレス誤り判定部42の両方が誤送信であると判定しない電子メールについて、その電子メールの送信を電子メール作成部13に指示する。さらに、電子メールを送信したことを、その電子メールを識別する識別子と共に、本文誤り判定部41とアドレス誤り判定部42に通知する。   When notified from the text error determination unit 41 or the address error determination unit 42 that there is a possibility of erroneous transmission, the transmission confirmation unit 15 sends an error message and transmission to a display unit (not shown) of the communication device 10. Display a confirmation screen requesting input of instructions to do. When the transmission confirmation unit 15 is instructed to transmit a mail via the confirmation screen, the transmission confirmation unit 15 transmits the instructed electronic mail to the destination address, and the text error determination unit 41 and the address error determination unit 42 indicate that the transmission has been performed. Notify In addition, the transmission confirmation unit 15 instructs the e-mail creating unit 13 to transmit an e-mail that is not determined to be erroneous transmission by both the body error determination unit 41 and the address error determination unit 42. Further, the fact that the e-mail has been transmitted is notified to the body error determining unit 41 and the address error determining unit 42 together with an identifier for identifying the e-mail.

辞書データ31は、電子メール分割部14が電子メールを語句やパラグラフに分割する際に参照される。辞書データ31は、語句に対応付けてその語句の品詞が記録されているものとする。さらに、人名や挨拶などのパラグラフ分割の判断材料となる語句も辞書データ31に記録されているものとする。図6に辞書データ31の例を示す。辞書データ31は、任意の辞書データを用いることができ、例えば、IPA(Information-technology Promotion Agency, Japan、情報処理推進機構)などで文書の解析用に作成されているデータを用いることができる。   The dictionary data 31 is referred to when the e-mail dividing unit 14 divides the e-mail into words or paragraphs. It is assumed that the dictionary data 31 records the part of speech of the phrase in association with the phrase. Further, it is assumed that words and phrases such as personal names and greetings that are used for determining paragraph division are also recorded in the dictionary data 31. FIG. 6 shows an example of the dictionary data 31. Arbitrary dictionary data can be used as the dictionary data 31, for example, data created for document analysis by IPA (Information-technology Promotion Agency, Japan, Information Processing Promotion Organization) or the like can be used.

通信装置10は、さらに、記憶部20に、データ32とプログラム33も記憶している。通信装置10に備えられているCentral Processing Unit(CPU、図7を参照)は、プログラム33を読み込むことにより、受信部11、送信部12、電子メール作成部13、電子メール分割部14、送信確認部15、判定部40、および、データベース更新部50として動作する。データ32には、例えば、閾値の値、修正前語句テーブル(図17)、ランク変更量テーブル(図18)などが含まれるものとする。修正前語句テーブルとランク変更量テーブルについては後で詳しく説明する。また、記憶部20は、適宜、通信装置10の動作に用いられるデータなどを記録することができる。   The communication device 10 further stores data 32 and a program 33 in the storage unit 20. The Central Processing Unit (CPU, see FIG. 7) provided in the communication device 10 reads the program 33, thereby receiving the receiving unit 11, the transmitting unit 12, the e-mail creating unit 13, the e-mail dividing unit 14, and the transmission confirmation. It operates as the unit 15, the determination unit 40, and the database update unit 50. The data 32 includes, for example, a threshold value, an uncorrected word / phrase table (FIG. 17), a rank change amount table (FIG. 18), and the like. The pre-correction word / phrase table and rank change amount table will be described in detail later. In addition, the storage unit 20 can appropriately record data used for the operation of the communication device 10.

図7は、通信装置10のハードウェア構成の例を説明する図である。通信装置10は、CPU61、メモリ62、入力装置63、出力装置64、外部記憶装置65、媒体駆動装置66、ネットワーク接続装置68、および、バス69を備える。CPU61は、前述のとおり、受信部11、送信部12、電子メール作成部13、電子メール分割部14、送信確認部15、判定部40、および、データベース更新部50として動作する。メモリ62は、記憶部20として動作する。   FIG. 7 is a diagram illustrating an example of the hardware configuration of the communication apparatus 10. The communication device 10 includes a CPU 61, a memory 62, an input device 63, an output device 64, an external storage device 65, a medium drive device 66, a network connection device 68, and a bus 69. As described above, the CPU 61 operates as the reception unit 11, the transmission unit 12, the email creation unit 13, the email division unit 14, the transmission confirmation unit 15, the determination unit 40, and the database update unit 50. The memory 62 operates as the storage unit 20.

通信装置10は、キーボードやマウスなどの入力装置63を備える。ユーザは、入力装置63を介して、電子メールを作成することができる。また、ユーザは、入力装置63を介して、電子メールを送信するかの指示を入力することができる。通信装置10は、ディスプレイなどの出力装置64を備える。電子メール作成部13は、電子メールの作成画面を出力装置64に表示することができる。また、送信確認部15は、出力装置64にエラーメッセージや、電子メールの送信を行うかの指示をユーザに要求する確認画面を表示する。   The communication device 10 includes an input device 63 such as a keyboard and a mouse. The user can create an e-mail via the input device 63. Further, the user can input an instruction as to whether or not to send an e-mail via the input device 63. The communication device 10 includes an output device 64 such as a display. The e-mail creation unit 13 can display an e-mail creation screen on the output device 64. Further, the transmission confirmation unit 15 displays a confirmation screen for requesting the user to send an error message or an instruction on whether to send an e-mail to the output device 64.

外部記憶装置65は、通信装置10で用いられるデータを、適宜、記憶することができる。媒体駆動装置66は、可搬記憶媒体67を読み込むことにより、データやプログラムなどを取得する。通信装置10は、媒体駆動装置66を介して、可搬記憶媒体67に記憶されているデータ等を取得することができる。CPU61は、可搬記憶媒体67に格納されているプログラムを実行することにより、受信部11、送信部12、電子メール作成部13、電子メール分割部14、送信確認部15、判定部40、および、データベース更新部50として動作する場合もある。この場合には、媒体駆動装置66を介して、通信装置10がプログラムを読み込む。なお、可搬記憶媒体67は、例えば、Compact Disc Read Only Memory(CD−ROM)、Universal Serial Bus(USB)メモリ、フラッシュメモリなどとすることができる。ネットワーク接続装置68は、ネットワーク70への接続処理を行う。   The external storage device 65 can store data used in the communication device 10 as appropriate. The medium driving device 66 acquires data, programs, and the like by reading the portable storage medium 67. The communication device 10 can acquire data stored in the portable storage medium 67 via the medium driving device 66. The CPU 61 executes a program stored in the portable storage medium 67, thereby receiving the receiving unit 11, the transmitting unit 12, the e-mail creating unit 13, the e-mail dividing unit 14, the transmission confirming unit 15, the determining unit 40, and In some cases, the database update unit 50 may operate. In this case, the communication device 10 reads the program via the medium driving device 66. The portable storage medium 67 can be, for example, a compact disc read only memory (CD-ROM), a universal serial bus (USB) memory, a flash memory, or the like. The network connection device 68 performs a connection process to the network 70.

<第1の実施形態>
以下、第1の実施形態について説明する。通信装置10は、通信装置10の受信メールから語句やアドレスの関連性を学習して語句データベース21や関連性データベース23を作成し、得られたデータベースを用いて、通信装置10で作成されたメールが誤送信であるかを判定する。誤送信ではないと判定した場合、通信装置10は、送信メールからも、語句やアドレスの関連性を学習することにより、語句データベース21や関連性データベース23を更新する。誤送信であると判定した場合でも、ユーザから送信指示があると、通信装置10は、送信メールを宛先アドレスに向けて送信する。さらに、ユーザからの送信指示があったメールについても、語句やアドレスの関連性を学習する。そこで、まず、受信メールからの学習について説明する。
<First Embodiment>
The first embodiment will be described below. The communication device 10 learns the relevance of words and addresses from the received mail of the communication device 10 to create the word / phrase database 21 and the relevance database 23, and the mail created by the communication device 10 using the obtained database. It is determined whether is an erroneous transmission. When it is determined that it is not an erroneous transmission, the communication device 10 updates the word database 21 and the relevance database 23 by learning the relevance of words and addresses from the transmitted mail. Even when it is determined that the transmission is erroneous, if there is a transmission instruction from the user, the communication device 10 transmits the transmission mail toward the destination address. Furthermore, it also learns the relevance of words and addresses for emails for which there has been a transmission instruction from the user. First, learning from received mail will be described.

〔受信メールからの学習〕
図8は、受信メールの分割方法の例を説明する図である。ここで、図8(a)の受信メールは、受信部11を介して受信され、電子メール分割部14に入力されたものとする。また、電子メール分割部14には、受信部11から受信メールの文面とともに、送信元アドレスと宛先アドレスが通知されているものとする。さらに、宛先アドレスの各々について宛先(To)と同報の宛先(CC、Carbon Copy)のいずれが指定されているかについても通知するものとする。例えば、図8の受信メールの場合、suzuki@ghi.co.jpは、Toに指定された宛先アドレスであることが通知され、sato@ghi.co.jpは、CCが指定された宛先アドレスであることが電子メール分割部14に通知される。以下、図8を参照しながら、受信メールの分割と、受信メールからの語句やアドレスの学習方法について説明する。
[Learning from received mail]
FIG. 8 is a diagram illustrating an example of a method for dividing received mail. Here, it is assumed that the received mail in FIG. 8A is received via the receiving unit 11 and input to the e-mail dividing unit 14. Further, it is assumed that the e-mail dividing unit 14 is notified of the source address and the destination address from the receiving unit 11 together with the text of the received mail. Furthermore, it is assumed that the destination (To) or the broadcast destination (CC, Carbon Copy) is designated for each destination address. For example, in the case of the received mail in FIG. 8, suzuki@ghi.co.jp is notified that it is the destination address designated by To, and sato@ghi.co.jp is the destination address designated by CC. It is notified to the e-mail dividing unit 14 that there is. Hereinafter, with reference to FIG. 8, a method for dividing a received mail and a method of learning words and addresses from the received mail will be described.

電子メール分割部14は、入力された受信メールをパラグラフごとに分割する。例えば電子メール分割部14は、2つの空白行の間にある文字列を、1つのパラグラフと判定することができる。図8(a)の例では、電子メール分割部14は、受信メールをP1〜P8の8個のパラグラフに分割する。   The e-mail dividing unit 14 divides the input received mail into paragraphs. For example, the e-mail dividing unit 14 can determine that a character string between two blank lines is one paragraph. In the example of FIG. 8A, the e-mail dividing unit 14 divides the received mail into eight paragraphs P1 to P8.

次に、電子メール分割部14は、パラグラフに含まれている文字列や記号などを用いて、パラグラフに記載されている内容を判定する。電子メール分割部14は、各パラグラフに辞書データ31で人名、挨拶として登録された語句、記号などが含まれているかと、それぞれが含まれている電子メール全体の中での位置を確認し、得られた結果に応じて、パラグラフに記載されている内容を判定する。例えば、電子メール分割部14は、パラグラフに人名もしくは挨拶に用いられる語句が含まれていて、かつ、記号を含まないパラグラフを、挨拶文に分類する。また、パラグラフに含まれている行の最初の1文字が記号である場合、電子メール分割部14は、そのパラグラフを引用に分類する。さらに、記号が複数連続して記載されていて、人名を含むパラグラフを、署名に分類する。最後に、挨拶文、引用、署名のいずれにも分類されていないパラグラフを、本文に分類する。   Next, the e-mail dividing unit 14 determines the contents described in the paragraph using a character string or a symbol included in the paragraph. The e-mail dividing unit 14 confirms whether each paragraph contains words, symbols, and the like registered as personal names, greetings in the dictionary data 31, and positions in the entire e-mail in which each is included, The content described in the paragraph is determined according to the obtained result. For example, the e-mail dividing unit 14 classifies a paragraph in which a word or phrase used for greetings is included in the paragraph and does not include a symbol as a greeting. Further, when the first character of the line included in the paragraph is a symbol, the e-mail dividing unit 14 classifies the paragraph as a citation. Further, a paragraph including a plurality of symbols and including a person's name is classified as a signature. Finally, paragraphs that are not classified as greetings, quotes, or signatures are classified as text.

パラグラフの分類の例を、図8(a)の受信メールのパラグラフが分類される場合を例として説明する。電子メール分割部14は、例えば、図6に示す辞書データ31を参照することにより、パラグラフP1には、「鈴木」という人名が含まれているが記号を含んでいないと認識する。そこで、電子メール分割部14は、パラグラフP1を挨拶文に分類する。さらに、パラグラフP2には、「田中」という人名と、「お世話になって」という挨拶語句が含まれている。そこで、電子メール分割部14は、パラグラフP2も挨拶文に分類する。また、パラグラフP3、P4、P6、P7はいずれも、人名、挨拶に用いられる語句、記号を含まないので、本文に分類される。パラグラフP5は、行の最初が記号「>」であるので、引用に分類される。パラグラフP8は、記号「−」が2つ以上連続した文字列を含み、「田中」という人名も含んでいるため、署名に分類される。従って、パラグラフP1〜P8は、図8(b)のテーブルに示すように分類される。   An example of paragraph classification will be described by taking the case where the paragraph of the received mail of FIG. 8A is classified as an example. For example, by referring to the dictionary data 31 illustrated in FIG. 6, the e-mail dividing unit 14 recognizes that the paragraph P1 includes the personal name “Suzuki” but does not include the symbol. Therefore, the e-mail dividing unit 14 classifies the paragraph P1 as a greeting. Furthermore, paragraph P2 includes a personal name “Tanaka” and a greeting phrase “Thank you for your help”. Therefore, the e-mail dividing unit 14 also classifies the paragraph P2 as a greeting. Also, paragraphs P3, P4, P6, and P7 do not include personal names, words or symbols used for greetings, and are therefore classified as text. Paragraph P5 is classified as a quote because the beginning of the line is the symbol “>”. Paragraph P8 is classified as a signature because it includes a character string in which two or more symbols “-” are continuous and also includes the name “Tanaka”. Therefore, paragraphs P1-P8 are classified as shown in the table of FIG.

図9は、電子メール分割部14の動作の例を説明するフローチャートである。電子メール分割部14は、電子メールの先頭にポインタを移動する(ステップS1)。次に、ポインタの現在の位置から、ポインタよりも後でポインタから最も近い空白行までをstrに取り出し、ポインタをその空白行の次の行に移動する(ステップS2、S3)。例えば、図8の例では、電子メール分割部14は、電子メールの先頭から次の空白行Xまでを、パラグラフP1とし、ポインタをXの次の行に移動する。次に、電子メール分割部14は、strに取り出したパラグラフに挨拶に用いられる語句が含まれているかを確認する(ステップS4)。挨拶に用いられる語句が含まれていない場合、電子メール分割部14は、パラグラフに人名が含まれているかも確認する(ステップS5)。パラグラフに人名が含まれていない場合、電子メール分割部14は、パラグラフに含まれている行の最初の文字が記号であるかを確認する(ステップS6)。パラグラフに含まれている行の最初の文字が記号ではない場合、電子メール分割部14は、そのパラグラフを「本文」に分類する(ステップS6でNo、ステップS7)。一方、パラグラフに含まれている行の最初の文字が記号である場合、電子メール分割部14は、そのパラグラフを「引用」に分類する(ステップS6でYes、ステップS8)。また、挨拶に用いられる語句がパラグラフに含まれていることが場合、電子メール分割部14は、そのパラグラフを「挨拶文」に分類する(ステップS4でYes、ステップS11)。挨拶に用いられる語句が含まれておらず、人名が含まれるパラグラフについては、電子メール分割部14は、記号が複数連続した文字列が含まれているかを確認する(ステップS5でYes、ステップS9)。記号が複数連続した「----」などの文字列が含まれている場合、電子メール分割部14は、パラグラフを「署名」に設定する(ステップS9でYes、ステップS10)。一方、記号が複数連続した文字列が含まれていない場合、電子メール分割部14は、パラグラフを「挨拶文」に設定する(ステップS9でNo、ステップS11)。さらに、電子メール分割部14は、ポインタの位置が電子メールの末尾であるかを確認し、ポインタが電子メールの末尾に来るまでステップS2〜S12を繰り返す(ステップS12)。   FIG. 9 is a flowchart for explaining an example of the operation of the e-mail dividing unit 14. The e-mail dividing unit 14 moves the pointer to the head of the e-mail (step S1). Next, from the current position of the pointer to the blank line closest to the pointer after the pointer is taken out to str, and the pointer is moved to the next line of the blank line (steps S2 and S3). For example, in the example of FIG. 8, the e-mail dividing unit 14 sets the section from the beginning of the e-mail to the next blank line X as a paragraph P1, and moves the pointer to the next line of X. Next, the e-mail dividing unit 14 confirms whether or not a word used for greeting is included in the paragraph taken out in str (step S4). When the word / phrase used for the greeting is not included, the e-mail dividing unit 14 also checks whether the name of the person is included in the paragraph (step S5). When the person name is not included in the paragraph, the e-mail dividing unit 14 checks whether the first character of the line included in the paragraph is a symbol (step S6). If the first character of the line included in the paragraph is not a symbol, the e-mail dividing unit 14 classifies the paragraph as “text” (No in step S6, step S7). On the other hand, when the first character of the line included in the paragraph is a symbol, the e-mail dividing unit 14 classifies the paragraph as “citation” (Yes in step S6, step S8). In addition, when the phrase used for the greeting is included in the paragraph, the e-mail dividing unit 14 classifies the paragraph into “greeting text” (Yes in step S4, step S11). For paragraphs that do not include words used for greetings and that include personal names, the e-mail dividing unit 14 checks whether a character string including a plurality of consecutive symbols is included (Yes in step S5, step S9). ). When a character string such as “----” including a plurality of symbols is included, the e-mail dividing unit 14 sets the paragraph to “signature” (Yes in step S9, step S10). On the other hand, when a character string including a plurality of symbols is not included, the e-mail dividing unit 14 sets the paragraph as “greeting text” (No in step S9, step S11). Further, the e-mail dividing unit 14 checks whether the pointer is at the end of the e-mail, and repeats steps S2 to S12 until the pointer comes to the end of the e-mail (step S12).

次に、電子メール分割部14は、各パラグラフを語句単位に分割する。このとき、電子メール分割部14は、適宜、辞書データ31を参照することができる。電子メール分割部14は、分割した個々の語句を、その語句を含む電子メールの送信元アドレス、宛先アドレス、および、その語句が含まれていたパラグラフが分類された種類に対応付けて、語句データベース更新部51に出力する。語句データベース更新部51は、電子メール分割部14から入力されたデータに基づいて、語句データベース21に含まれているランクの値と更新日を変更する。   Next, the e-mail dividing unit 14 divides each paragraph into words. At this time, the e-mail dividing unit 14 can refer to the dictionary data 31 as appropriate. The e-mail dividing unit 14 associates each divided word with the source address, the destination address of the e-mail containing the word, and the type into which the paragraph containing the word is classified, The data is output to the update unit 51. The phrase database update unit 51 changes the rank value and update date included in the phrase database 21 based on the data input from the email dividing unit 14.

図10は、語句データベース21の更新方法の例を説明する図である。図10の例では、語句データベース更新部51は、送信元アドレスと宛先アドレスの関係に応じて、図10(a)に示す加算値を、語句データベース21に記録されているランクの値に加算するものとする。宛先アドレスが宛先Toに指定されている場合、ランクの加算値は3であり、宛先アドレスがCCに指定されている場合、ランクの加算値は2である。例えば、図8に示したメールの本文から「迷惑メール」という語句が特定されて、語句データベース更新部51に出力されたとする。すると、語句データベース更新部51は、図3に示した語句データベース21のランクを図10(b)に示すように、変更する。また、語句データベース更新部51は、タイマ16に時刻情報を要求し、得られた時刻情報を更新日の欄に記録する。このように、受信メールから特定された語句について、送信元アドレスと宛先アドレスに対応付けられたランクの値が加算される。従って、ある語句のランクが正の値であることは、その語句と対応付けられているアドレスの組み合わせにおいて、その語句が使用されることが妥当であることを示す。   FIG. 10 is a diagram for explaining an example of a method for updating the phrase database 21. In the example of FIG. 10, the phrase database update unit 51 adds the addition value illustrated in FIG. 10A to the rank value recorded in the phrase database 21 according to the relationship between the transmission source address and the destination address. Shall. When the destination address is designated as the destination To, the rank addition value is 3, and when the destination address is designated as the CC, the rank addition value is 2. For example, it is assumed that the phrase “junk mail” is identified from the text of the mail shown in FIG. 8 and is output to the phrase database update unit 51. Then, the phrase database update unit 51 changes the rank of the phrase database 21 shown in FIG. 3 as shown in FIG. Further, the phrase database update unit 51 requests time information from the timer 16 and records the obtained time information in the update date column. As described above, rank values associated with the transmission source address and the destination address are added to the phrase specified from the received mail. Accordingly, a rank of a word or phrase having a positive value indicates that it is appropriate to use the word or phrase in a combination of addresses associated with the word or phrase.

なお、語句データベース21の更新方法は、実装に応じて変更することができる。例えば、語句データベース更新部51は、前述の更新方法に加えて、さらに、特定のアドレスの間でよく用いられる語句について、他のアドレスでのランクの値を小さくすることもできる。この場合、語句データベース更新部51は、更新を加えた語句について、語句データベース21に登録されている全てのアドレスの組み合わせに対応付けられているランクの平均値(ランク平均値)を求める。ランク平均値が正であれば、語句データベース更新部51は、ランク平均値と、ランクを更新したアドレスの組み合わせについての更新後のランクとの差を求める。得られた差が、予め記憶されている閾値を越えていた場合、語句データベース更新部51は、ランクを加算したアドレスの組み合わせ以外の全てのアドレスに対して、その語句のランクを1減算する。   In addition, the update method of the phrase database 21 can be changed according to implementation. For example, in addition to the updating method described above, the phrase database update unit 51 can further reduce the rank value at other addresses for words that are frequently used between specific addresses. In this case, the phrase database update unit 51 obtains an average value (rank average value) of ranks associated with all combinations of addresses registered in the phrase database 21 for the updated phrase. If the rank average value is positive, the phrase database update unit 51 obtains the difference between the rank average value and the updated rank for the combination of addresses whose rank has been updated. If the obtained difference exceeds a threshold value stored in advance, the phrase database update unit 51 subtracts 1 from the rank of the phrase for all addresses other than the combination of addresses to which the rank is added.

例えば、「IMAP」という語句について、ユーザDとユーザEのアドレスの組み合わせ、ユーザEとユーザFの組み合わせ、ユーザGとユーザHの組み合わせでのランクが、語句データベース21に登録されているとする。また、ユーザDがユーザEから受信したメールに「IMAP」という語句が含まれているとする。この場合、語句データベース更新部51は、ユーザDとユーザEのアドレスの組み合わせに対応付けられた「IMAP」のランクを加算する。次に、語句データベース更新部51は、「IMAP」の登録のあるアドレスの組み合わせの全てについて登録されているランクの平均値(ランク平均値)を求める。ここで、ランク平均値が正であれば、ユーザDとユーザEのアドレスの組み合わせの「IMAP」のランクの値とランク平均値の差が閾値以上であるかが判定される。差が閾値以上であれば、「IMAP」という語句がユーザDとユーザEの間で使われる可能性は、ユーザEとユーザFの間、および、ユーザGとユーザHの間で使われる可能性よりも大きいと考えられる。そこで、語句データベース更新部51は、「IMAP」という語句について、ユーザEとユーザFの組み合わせでのランクと、ユーザGとユーザHの組み合わせでのランクを、それぞれ1つずつ減算する。なお、データベース更新部51は、ランク平均値が正のときにこの処理を行うことにより、特定のアドレス間でのある語句のランクの値が異常に大きな値もしくは小さな値となることを防いでいる。   For example, for the phrase “IMAP”, a combination of the addresses of the user D and the user E, a combination of the user E and the user F, and a combination of the user G and the user H is registered in the phrase database 21. Further, it is assumed that the word “IMAP” is included in the mail received by the user D from the user E. In this case, the phrase database update unit 51 adds the rank of “IMAP” associated with the combination of the addresses of the user D and the user E. Next, the phrase database update unit 51 obtains an average value (rank average value) of ranks registered for all combinations of addresses registered with “IMAP”. If the rank average value is positive, it is determined whether the difference between the rank value of “IMAP” and the rank average value of the combination of the addresses of user D and user E is equal to or greater than the threshold value. If the difference is greater than or equal to the threshold, the phrase “IMAP” may be used between user D and user E, and may be used between user E and user F, and between user G and user H. Is considered to be larger. Therefore, the phrase database update unit 51 subtracts the rank of the combination of the user E and the user F and the rank of the combination of the user G and the user H one by one for the phrase “IMAP”. The database updating unit 51 performs this process when the rank average value is positive, thereby preventing the rank value of a certain phrase between specific addresses from becoming an abnormally large value or a small value. .

語句データベース21が予め決められた回数だけ更新されると、共通語句データベース更新部52は、共通語句データベース22を更新する。例えば、語句データベース21が100回更新されたときに、共通語句データベース更新部52は、語句データベース21を参照し、登録されている語句が何種類のアドレスに対応付けられているかを確認する。このとき、共通語句データベース更新部52は、アドレス1とアドレス2のいずれに登録されていても、同一のメールアドレスは1種類と数えるものとする。また、ランクの値の大きさは参照しない。ある語句に対応付けられているアドレスの数が閾値よりも大きな値となると、共通語句データベース更新部52は、その語句を共通語句データベース22に登録する。一方、共通語句データベース22に登録されている語句についても語句データベース21を参照して、対応付けられているアドレスの数を確認する。対応付けられているメールアドレスの数が閾値未満になると、共通語句データベース更新部52は、その語句を共通語句データベース22から削除する。なお、共通語句データベース更新部52が共通語句データベース22を更新するまでに行われる語句データベース21の更新の回数や、共通語句データベース更新部52が用いる閾値の値は、実装に応じて任意に設定することができる。   When the phrase database 21 is updated a predetermined number of times, the common phrase database update unit 52 updates the common phrase database 22. For example, when the phrase database 21 is updated 100 times, the common phrase database update unit 52 refers to the phrase database 21 and checks how many types of addresses the registered phrase is associated with. At this time, the common phrase database update unit 52 counts the same mail address as one type regardless of whether it is registered in either address 1 or address 2. Also, the magnitude of the rank value is not referred to. When the number of addresses associated with a certain phrase becomes larger than the threshold value, the common phrase database update unit 52 registers the phrase in the common phrase database 22. On the other hand, for the words registered in the common word database 22, the word database 21 is also referred to and the number of associated addresses is confirmed. When the number of associated email addresses is less than the threshold, the common phrase database update unit 52 deletes the phrase from the common phrase database 22. Note that the number of updates of the phrase database 21 performed before the common phrase database update unit 52 updates the common phrase database 22 and the threshold value used by the common phrase database update unit 52 are arbitrarily set according to the implementation. be able to.

次に、関連性データベース23の更新について説明する。図8(a)に示す受信メールについて、電子メール分割部14は、送信元アドレス、宛先アドレス、宛先アドレスの種類を関連性データベース更新部53に通知する。関連性データベース更新部53は、電子メール分割部14から通知された情報を元にして、受信メールについてそれぞれのアドレスの関連性を計算する。アドレスの関連性は、受信したメールの各々から得られるアドレスの関連性と、各々の受信メールを受信した時刻から現在の時刻までの時間の長さとから算出される。例えば、ある受信メールにJ個のアドレスが含まれているとする。この場合、関連性データベース更新部53は、i番目のメールアドレスとj番目のメールアドレスについての、その受信メールでの関連性(Rij)を、次式から計算する。
ij=Ci×Cj
ここで、Ciはi番目のメールアドレスの区分係数であり、Cjはj番目のメールアドレスの区分係数である。区分係数は、メールアドレスが送信元アドレス、Toに指定された宛先アドレス、CCで指定された宛先アドレスのいずれであるかによって決定される値である。以下の説明では、区分係数は次のとおりであるとする。なお、区分係数の値は実装に応じて任意に変更することができる。
送信元アドレス(From)の区分係数 :1
宛先アドレス(To)の区分係数 :1
宛先アドレス(CC)の区分係数 :0.5
Next, the update of the relevance database 23 will be described. For the received mail shown in FIG. 8A, the e-mail dividing unit 14 notifies the relevance database updating unit 53 of the source address, the destination address, and the type of the destination address. The relevance database update unit 53 calculates the relevance of each address for the received mail based on the information notified from the e-mail dividing unit 14. The address relevance is calculated from the address relevance obtained from each received mail and the length of time from the time each received mail is received to the current time. For example, assume that a received mail contains J addresses. In this case, the relevance database update unit 53 calculates the relevance (R ij ) in the received mail for the i-th mail address and the j-th mail address from the following equation.
R ij = Ci × Cj
Here, Ci is a partition coefficient of the i-th mail address, and Cj is a partition coefficient of the j-th mail address. The division coefficient is a value determined by whether the mail address is a source address, a destination address specified in To, or a destination address specified in CC. In the following description, it is assumed that the division coefficients are as follows. Note that the value of the division coefficient can be arbitrarily changed according to the implementation.
Source address (From) division coefficient: 1
Destination address (To) division factor: 1
Destination address (CC) classification factor: 0.5

例えば、図8(a)の電子メールについて、関連性データベース更新部53は、1番目のメールアドレスをt-tanaka@xx-network.co.jp、2番目のメールアドレスをsuzuki@ghi.co.jpに設定したとする。すると、通知されたアドレスの1番目のメールアドレスが送信元アドレスで、2番目のメールアドレスがToに指定された宛先アドレスであるので、関連性を次のように計算することができる。
R12=1×1=1
For example, for the e-mail in FIG. 8A, the relevance database updating unit 53 sets the first e-mail address to t-tanaka@xx-network.co.jp and the second e-mail address to suzuki@ghi.co. Suppose that it is set to jp. Then, since the first mail address of the notified address is the transmission source address and the second mail address is the destination address designated by To, the relevance can be calculated as follows.
R12 = 1 × 1 = 1

関連性データベース更新部53は、受信メールから算出した関連性の値を用いて、関連性を算出したアドレスの間の記録を更新する。このとき、過去の送信履歴を関連性に反映させるために、処理対象のアドレスの組み合わせについて以下の式から算出される加重平均値を関連性データベース23に記録する。
ij×Wcal+Rij_data×Wdata ・・・(1)
ここで、Rij_dataは関連性データベース23に登録されている関連性の値であり、Rijは処理対象の受信メールに基づいて算出された関連性の値である。また、Wdataは、関連性データベース23に記録されている関連性の値の重み係数であり、Wcalは、処理対象の受信メールに基づいて関連性データベース更新部53が算出した関連性の値の重み係数である。関連性データベース更新部53は、処理対象のアドレスの組み合わせで電子メールの送受信が行われた頻度と、最終の送受信が行われてから現在までの時間を用いて、以下のように、重み係数を算出する。
cal=T1/(T1+T2)
data=T2/(T1+T2)
ここで、T1は、処理対象の2つのアドレスの間で行われた電子メールの送受信のうち、関連性データベース23に記録されている最新の送受信が行われた時刻から、現在の時刻までの時間である。T2は、関連性データベース23に記録されている最新の送受信から一定の回数前の送受信までの間に、処理対象の2つのアドレスの間で行われた送受信の平均周期を表す。
The relevance database update unit 53 uses the relevance value calculated from the received mail to update the record between the addresses for which the relevance has been calculated. At this time, in order to reflect the past transmission history in the relevance, the weighted average value calculated from the following formula for the combination of addresses to be processed is recorded in the relevance database 23.
R ij × W cal + R ij_data × W data (1)
Here, R ij_data is a relevance value registered in the relevance database 23, and R ij is a relevance value calculated based on the received mail to be processed. W data is a weighting factor of the relevance value recorded in the relevance database 23, and W cal is the relevance value calculated by the relevance database update unit 53 based on the received mail to be processed. Is a weighting factor. The relevance database update unit 53 uses the frequency of e-mail transmission / reception with the combination of addresses to be processed and the time from the last transmission / reception to the present to calculate the weighting coefficient as follows: calculate.
W cal = T1 / (T1 + T2)
W data = T2 / (T1 + T2)
Here, T1 is the time from the time of the latest transmission / reception recorded in the relevance database 23 to the current time among the transmission / reception of e-mails performed between two addresses to be processed. It is. T2 represents an average period of transmission / reception performed between two addresses to be processed between the latest transmission / reception recorded in the relevance database 23 and transmission / reception a certain number of times before.

図11は、重み係数の算出方法の例を説明する図である。図11を参照しながら、処理対象のアドレスの間でN回目の電子メールの送受信が行われた場合の重み係数の計算について述べる。関連性データベース23には、1〜N−1回の電子メールの送受信から求められた関連性が記録されているとする。また、図5に示すように、関連性データベース23には過去3回の電子メールの送信履歴が記録されているとする。すなわち、N−1回目からN−3回目の送受信が行われた時刻が関連性データベース23に記録されているものとする。以下、処理対象のメールアドレスがt-tanaka@xx-network.co.jpとsuzuki@ghi.co.jpである場合について述べる。   FIG. 11 is a diagram for explaining an example of a weighting factor calculation method. Referring to FIG. 11, the calculation of the weighting factor when the Nth e-mail is transmitted / received between addresses to be processed will be described. In the relevance database 23, it is assumed that relevance obtained from transmission / reception of 1 to N-1 times of electronic mail is recorded. Further, as shown in FIG. 5, it is assumed that the past three email transmission histories are recorded in the relevance database 23. That is, it is assumed that the time when transmission / reception is performed from the (N−1) th time to the (N−3) th time is recorded in the relevance database 23. The following describes the case where the email addresses to be processed are t-tanaka@xx-network.co.jp and suzuki@ghi.co.jp.

図11に示すように、N回目のメールの送受信が2010年7月9日に行われたとする。N−1回目のメールの送受信が2010年7月5日であると、T1は4日間である。さらに、N−2回目とN−3回目の送受信は、2010年7月2日と2010年7月1日に行われているので、N−1回目の送受信からN−2回目の送受信までの期間は3日、N−2回目の送受信からN−3回目の送受信までの期間は1日である。従って、N−1回目からN−3回目の送受信までの送受信の平均周期は、2日であり、T2は2日になる。すると、重み係数は以下のようになる。
cal=4日/(2日+4日)=2/3
data=2日/(2日+4日)=1/3
As shown in FIG. 11, it is assumed that the Nth mail transmission / reception is performed on July 9, 2010. If the (N-1) th mail transmission / reception is on July 5, 2010, T1 is four days. Furthermore, since the N-2 and N-3 transmissions are performed on July 2, 2010 and July 1, 2010, from the N-1 transmission to the N-2 transmission. The period is 3 days, and the period from the (N−2) th transmission / reception to the (N−3) th transmission / reception is one day. Therefore, the average period of transmission / reception from the (N-1) th to the (N-3) th transmission / reception is 2 days, and T2 is 2 days. Then, the weighting coefficient is as follows.
W cal = 4 days / (2 days + 4 days) = 2/3
W data = 2 days / (2 days + 4 days) = 1/3

処理対象のメールアドレスについて関連性データベース23に記録されている関連性の値(Rij_data)は、0.75である。そこで、次式から、関連性の更新値が求められる。
ij×Wcal+Rij_data×Wdata=1×2/3+0.75×1/3=0.92
The relevance value (R ij_data ) recorded in the relevance database 23 for the mail address to be processed is 0.75. Therefore, the relevance update value is obtained from the following equation.
R ij × W cal + R ij_data × W data = 1 × 2/3 + 0.75 × 1/3 = 0.92

重み係数は、関連性データベース23に登録されている関連性と、新たに受信したメールから得られた関連性のどちらに重点をおいて関連性データベース23を更新するかを示す係数である。この例では、平均送受信周期よりも、最終の送受信時刻から現在までの期間が長い場合には、新たに学習した関連性の重みを強くしている。一方、最終の送受信時刻から現在の期間までの時間が平均送受信周期よりも短い場合、データベースに登録された関連性の重みを強くしている。なお、重み係数の設定方法は、一例であり、実装に応じて、様々に変更することができる。   The weighting coefficient is a coefficient indicating whether the relevance database 23 is updated with emphasis on relevance registered in the relevance database 23 or relevance obtained from a newly received mail. In this example, when the period from the last transmission / reception time to the present is longer than the average transmission / reception period, the newly learned relevance weight is increased. On the other hand, when the time from the last transmission / reception time to the current period is shorter than the average transmission / reception cycle, the weight of relevance registered in the database is increased. Note that the method of setting the weighting coefficient is an example, and can be variously changed depending on the implementation.

図12は、関連性データベース23の更新に際して行われる動作の例を説明するフローチャートである。このフローチャートでは、i、jの2つの変数が用いられ、iとjはいずれも正の整数である。受信部11を介して電子メールが受信されると、電子メール分割部14から受信されたメールに含まれるアドレスの情報が関連性データベース更新部53に通知される(ステップS21)。関連性データベース更新部53は、送信元アドレス、Toに指定された宛先アドレス、CCに指定された宛先アドレスの総数Jを取得する(ステップS22)。関連性データベース更新部53は、変数iを1に設定し、jをiより1つ大きい数に設定する(ステップS23、S24)。関連性データベース更新部53は、J個のアドレスのうちのi番目のメールアドレスとj番目のメールアドレスの区分係数の積を求め、i番目のメールアドレスとj番目のメールアドレスの組み合わせについて、関連性データベース23を更新する(ステップS25、S26)。その後、関連性データベース更新部53は、jの値を1だけインクリメントし、jがJより大きい値であるかを確認する(ステップS27、S28)。関連性データベース更新部53は、jがJより大きい値になるまで、ステップS25〜S28を繰り返す。jがJより大きくなると、関連性データベース更新部53は、iの値を1だけインクリメントし、iの値がJ−1よりも大きいかを確認する(ステップS29、S30)。iの値がJ−1よりも大きくなるまで、関連性データベース更新部53は、ステップS24〜S30の処理を繰り返す。   FIG. 12 is a flowchart illustrating an example of an operation performed when the relevance database 23 is updated. In this flowchart, two variables i and j are used, and i and j are both positive integers. When the e-mail is received via the receiving unit 11, the information on the address included in the e-mail received from the e-mail dividing unit 14 is notified to the relevance database update unit 53 (step S21). The relevance database update unit 53 acquires the transmission source address, the destination address designated by To, and the total number J of destination addresses designated by CC (step S22). The relevance database update unit 53 sets the variable i to 1 and sets j to a number one larger than i (steps S23 and S24). The relevance database update unit 53 obtains a product of the division coefficients of the i-th mail address and the j-th mail address among the J addresses, and relates to the combination of the i-th mail address and the j-th mail address. The property database 23 is updated (steps S25 and S26). Thereafter, the relevance database update unit 53 increments the value of j by 1 and checks whether j is a value greater than J (steps S27 and S28). The relevance database update unit 53 repeats steps S25 to S28 until j becomes a value greater than J. When j becomes larger than J, the relevance database update unit 53 increments the value of i by 1 and checks whether the value of i is larger than J-1 (steps S29 and S30). The relevance database update unit 53 repeats the processing of steps S24 to S30 until the value of i becomes larger than J-1.

〔送信メールの誤送信判定〕
次に、送信メールについて行われる誤送信かの判定について説明する。送信メールは、電子メール作成部13で生成され、ユーザから送信の指示が出されたものとする。送信メールには、送信メールを識別する識別子81、および、送信元アドレスや宛先アドレスなどのアドレス情報82が付加されている。図13(a)に、電子メール作成部13で生成された送信メールの例を示す。電子メール作成部13は、送信の指示を取得すると、送信メールのデータを識別子と共に電子メール分割部14に出力する。ここでは、送信メールに「201007091000」という識別子が付されているものとする。
[Determining wrong transmission of outgoing mail]
Next, a description will be given of whether or not an erroneous transmission is performed for a transmission mail. It is assumed that the transmission mail is generated by the e-mail creation unit 13 and a transmission instruction is issued from the user. An identifier 81 for identifying the transmission mail and address information 82 such as a transmission source address and a destination address are added to the transmission mail. FIG. 13A shows an example of a transmission mail generated by the e-mail creation unit 13. When acquiring the transmission instruction, the e-mail creating unit 13 outputs the data of the e-mail to the e-mail dividing unit 14 together with the identifier. Here, it is assumed that the identifier “201007091000” is attached to the outgoing mail.

電子メール分割部14は、電子メール作成部13から入力された送信メールを、受信メールと同様に分割する。図13(a)の例では、送信メールは、パラグラフP11〜P16に分割されたものとする。また、図9を参照しながら説明した方法により、図13(b)に示すように、各パラグラフが分類されているものとする。電子メール分割部14は、送信メールに含まれる各パラグラフを分類すると、パラグラフごとに、含まれている語句を特定する。電子メール分割部14は、特定した語句を、送信メールの識別子、パラグラフの種類、送信元アドレス、宛先アドレス、各宛先アドレスの種類に対応付けて、本文誤り判定部41に出力する。本文誤り判定部41は、電子メール分割部14から送られたデータを記憶部20に記憶する。   The e-mail dividing unit 14 divides the outgoing mail input from the e-mail creating unit 13 in the same manner as the received mail. In the example of FIG. 13A, it is assumed that the outgoing mail is divided into paragraphs P11 to P16. Further, it is assumed that each paragraph is classified as shown in FIG. 13B by the method described with reference to FIG. When the e-mail dividing unit 14 classifies each paragraph included in the outgoing mail, the e-mail dividing unit 14 identifies the included phrase for each paragraph. The e-mail dividing unit 14 outputs the identified phrase to the body error determining unit 41 in association with the identifier of the transmitted mail, the type of paragraph, the source address, the destination address, and the type of each destination address. The text error determination unit 41 stores the data sent from the e-mail dividing unit 14 in the storage unit 20.

本文誤り判定部41は、共通語句データベース22を参照して、「本文」または「引用」に分類されたパラグラフに含まれている語句について対象語句を求める。本文誤り判定部41は求めた対象語句が、送信元アドレスと宛先アドレスの間で送受信された過去の電子メールに含まれているかを確認する。電子メールが2人のユーザの間で繰り返し送受信されている場合、送信者と受信者との間で共通のテーマについて連絡を取り合っていることが考えられる。従って、宛先メールアドレスが誤っていない場合、送信メールには、過去に送信者と受信者の間で送受信された電子メールに含まれていた対象語句が含まれている可能性が高い。   The text error determination unit 41 refers to the common phrase database 22 and obtains a target phrase for a phrase included in a paragraph classified as “text” or “quotation”. The text error determination unit 41 confirms whether or not the obtained target word / phrase is included in past e-mails transmitted / received between the transmission source address and the destination address. When an e-mail is repeatedly transmitted and received between two users, it is conceivable that the sender and the receiver are in contact about a common theme. Therefore, when the destination mail address is not incorrect, it is highly possible that the transmitted mail includes the target word / phrase included in the electronic mail transmitted / received between the sender and the receiver in the past.

例えば、図8(a)の受信メールで引用されているパラグラフP5は、株式会社GHIの鈴木氏からXXネットワーク株式会社の田中氏に送られた電子メールの一部であるとする。田中氏からの返信には、図8(a)のパラグラフP3などに示すように、IMAPサーバの回線速度についての記載が含まれている。さらに、図8(a)の受信メールには「迷惑メールフィルタ」や「迷惑メール」などの対象語句が含まれている。図8(a)の受信メールに対する返信が図13(a)であるとすると、図13(a)の送信メールには、図8(a)のメールに含まれている「迷惑メールフィルタ」などの対象語句が含まれていることが考えられる。   For example, it is assumed that paragraph P5 quoted in the received mail in FIG. 8A is a part of an email sent from Mr. Suzuki of GHI Corporation to Mr. Tanaka of XX Network Corporation. The reply from Mr. Tanaka includes a description of the line speed of the IMAP server as shown in paragraph P3 of FIG. Further, the received mail of FIG. 8A includes target words such as “spam mail filter” and “spam mail”. Assuming that the reply to the received mail in FIG. 8A is FIG. 13A, the sent mail in FIG. 13A includes “spam mail filter” included in the mail in FIG. It is conceivable that the target word or phrase is included.

そこで、本文誤り判定部41は、送信メールの「本文」または「引用」に分類されたパラグラフに含まれている対象語句が語句データベース21に含まれているかを確認する。なお、ここで、語句データベース21のうち、処理対象のメールの送信元メールアドレスと宛先メールアドレスに対応付けられている語句が対象語句と比較される。本文誤り判定部41は、各パラグラフについて含まれている対象語句のうち、語句データベース21のランクの値が閾値以上である対象語句の数を確認する。本文誤り判定部41は、各パラグラフについて含まれている対象語句のうち、処理対象のメールの送信元メールアドレスと宛先メールアドレスに対応付けられているランクの値が閾値以上である対象語句の数(T)を求める。さらに、本文誤り判定部41は、求めた対象語句の数Tと対象語句の総数の比を求める。得られた比が許可閾値(ThOK)以上である場合、本文誤り判定部41は、そのパラグラフからは誤送信ではないと判定する。なお、本文誤り判定部41は、予め、ランクの値と比較される閾値や許可閾値を記憶しているものとする。送信メールに含まれているいずれのパラグラフからも、誤送信でないと判定されると場合、本文誤り判定部41は、誤送信ではないと判定する。一方、1つ以上のパラグラフで誤送信と判定されると、本文誤り判定部41は、その送信メールについて誤送信であると判定する。 Therefore, the text error determination unit 41 checks whether or not the word / phrase database 21 includes the target word / phrase included in the paragraph classified as “text” or “quotation” of the transmitted mail. Here, in the word / phrase database 21, the words / phrases associated with the transmission source mail address and the destination mail address of the mail to be processed are compared with the target word / phrase. The text error determination unit 41 checks the number of target words / phrases whose rank value in the word / phrase database 21 is equal to or greater than a threshold among the target words / phrases included in each paragraph. The text error determination unit 41 includes the number of target words / phrases whose rank values associated with the transmission source mail address and the destination mail address of the mail to be processed are equal to or greater than a threshold among the target words / phrases included in each paragraph. (T) is obtained. Further, the text error determination unit 41 obtains the ratio of the obtained number T of the target words and the total number of the target words. When the obtained ratio is equal to or greater than the permission threshold (Th OK ), the text error determination unit 41 determines from the paragraph that there is no erroneous transmission. Note that the text error determination unit 41 stores in advance a threshold value to be compared with a rank value and a permission threshold value. If it is determined from any paragraph included in the transmitted mail that there is no erroneous transmission, the body error determination unit 41 determines that there is no erroneous transmission. On the other hand, when it is determined that there is an erroneous transmission in one or more paragraphs, the text error determination unit 41 determines that the transmitted mail is an erroneous transmission.

なお、以上の説明は、本文誤り判定部41の動作の一例について述べており、本文誤り判定部41の動作は、実装に応じて変形されることがある。例えば、本文誤り判定部41は、許可閾値の代わりに、エラー閾値(ThNG)を記憶する場合もある。この場合、本文誤り判定部41は、各パラグラフについて含まれている対象語句の総数と、語句データベース21に含まれているランクが閾値未満の対象語句の数との比がエラー閾値以上である場合、本文誤り判定部41は、そのメールが誤送信であると判定する。なお、本文誤り判定部41は、語句データベース21に含まれていない対象語句のランクを0とするものとする。さらに、本文誤り判定部41は、許可閾値とエラー閾値を併用して誤送信の判定を行うこともできる。 In addition, the above description has described an example of the operation of the text error determination unit 41, and the operation of the text error determination unit 41 may be modified depending on the implementation. For example, the text error determination unit 41 may store an error threshold (Th NG ) instead of the permission threshold. In this case, the text error determination unit 41 has a ratio between the total number of target words / phrases included in each paragraph and the number of target words / phrases whose rank included in the word / phrase database 21 is less than the threshold is equal to or greater than the error threshold. The body error determination unit 41 determines that the mail is an erroneous transmission. Note that the text error determination unit 41 sets the rank of the target phrase not included in the phrase database 21 to 0. Further, the text error determination unit 41 can also determine erroneous transmission by using both the permission threshold and the error threshold.

図14Aと図14Bは、電子メール分割部14と本文誤り判定部41の動作の例を説明するフローチャートである。図14AのステップS41、S42、S44、S45は電子メール分割部14の動作である。また、ステップS43とS46〜S58は、本文誤り判定部41の動作である。図14A、図14Bのフローチャートには、定数N、Mが含まれる。ここで、Nは送信メールに含まれるパラグラフの総数、Mはあるパラグラフに含まれる対象語句の数である。また、図14A、図14Bのフローチャートでは、n、m、t、fの4つの変数が用いられる。nとmは正の整数であり、tとfは0か正の整数である。nは電子メール作成部13が処理したパラグラフの計数に用いられる変数であり、mは電子メール作成部13が処理した対象語句の数を計数に用いられる変数である。また、tは、ランクの値が閾値以上の対象語句の数を計数するために使用される変数、fは、ランクの値が閾値未満の対象語句の数を計数するための変数である。図14A、図14Bの例では、閾値が1の場合について示す。すなわち、ランクが正の値の対象語句が1つ処理されるとtが1つ加算され、ランクが0か負の値の対象語句が処理されるとfが1つ加算される。   14A and 14B are flowcharts for explaining an example of operations of the e-mail dividing unit 14 and the text error determining unit 41. Steps S41, S42, S44, and S45 in FIG. 14A are operations of the e-mail dividing unit 14. Steps S43 and S46 to S58 are operations of the text error determination unit 41. 14A and 14B includes constants N and M. Here, N is the total number of paragraphs included in the outgoing mail, and M is the number of target words / phrases included in a certain paragraph. 14A and 14B, four variables n, m, t, and f are used. n and m are positive integers, and t and f are 0 or positive integers. n is a variable used for counting the paragraphs processed by the e-mail creating unit 13, and m is a variable used for counting the number of target words processed by the e-mail creating unit 13. Further, t is a variable used for counting the number of target words / phrases whose rank value is equal to or greater than the threshold value, and f is a variable for counting the number of target words / phrases whose rank value is less than the threshold value. In the example of FIGS. 14A and 14B, the case where the threshold is 1 is shown. That is, if one target word / phrase having a positive rank is processed, one t is added. If a target word / phrase having a zero or negative rank is processed, one f is added.

電子メール分割部14は、パラメータ設定部13から送信メールを受信すると、送信メールをパラグラフごとに分類する(ステップS41、S42)。電子メール分割部14は、送信メールに含まれるパラグラフの総数Nを取得し、本文誤り判定部41に通知する。   When receiving the transmission mail from the parameter setting unit 13, the email division unit 14 classifies the transmission mail for each paragraph (steps S41 and S42). The e-mail dividing unit 14 acquires the total number N of paragraphs included in the transmitted mail and notifies the text error determining unit 41 of the total number.

本文誤り判定部41は、変数nとmを1に設定し、tとfを0に設定する(ステップS43)。電子メール分割部14は、電子メール分割部14からn番目のパラグラフを取得すると、そのパラグラフが「本文」か「引用」のいずれかに分類されているかを確認する(ステップS44)。取得したパラグラフが「本文」か「引用」に分類されていない場合、そのパラグラフについての処理を行わずに次のパラグラフを処理する(ステップS44でNo、ステップS56)。従って、例えば、電子メール分割部14は、P11についての処理を行わずに、パラグラフP12を処理対象とする。パラグラフP12も、図13(b)に示すように「挨拶文」に分類されているため、電子メール分割部14は、パラグラフP12の処理を行わずに、パラグラフP13を処理対象とする。   The text error determination unit 41 sets variables n and m to 1 and sets t and f to 0 (step S43). When the e-mail dividing unit 14 acquires the n-th paragraph from the e-mail dividing unit 14, the e-mail dividing unit 14 checks whether the paragraph is classified as “text” or “citation” (step S44). If the acquired paragraph is not classified as “text” or “quotation”, the next paragraph is processed without performing the processing for that paragraph (No in step S44, step S56). Therefore, for example, the e-mail dividing unit 14 sets the paragraph P12 as a process target without performing the process for P11. Since the paragraph P12 is also classified as “greeting text” as shown in FIG. 13B, the e-mail dividing unit 14 sets the paragraph P13 as a processing target without performing the processing of the paragraph P12.

「本文」もしくは「引用」に分類されたパラグラフの情報を取得すると、電子メール分割部14は、そのパラグラフを語句に分割する(ステップS45)。電子メール分割部14は、分割して得られた語句を本文誤り判定部41に出力する。本文誤り判定部41は、共通語句データベース22を参照し、入力された語句から共通語句データベース22に含まれている語句を削除する。本文誤り判定部41は、残った名詞を対象語句とする。また、本文誤り判定部41は、そのパラグラフに含まれている対象語句の数Mを求める(ステップS46)。本文誤り判定部41は、対象語句が1つ以上含まれている場合、m番目の語句について、宛先アドレスと送信元アドレスの組み合わせに対応付けられているランクの値が正の値であるかを確認する(ステップS47でYes、ステップS48)。確認されたランクの値が0か負の値であれば、本文誤り判定部41は、変数fを1つインクリメントする(ステップS49)。一方、確認されたランクの値が正の数であれば、本文誤り判定部41は、変数tを1つインクリメントする(ステップS50)。変数tもしくはfのいずれかがインクリメントされると、本文誤り判定部41は、変数mを1つインクリメントし、mの値をMと比較する(ステップS51、S52)。mがMより大きくなるまで、本文誤り判定部41は、ステップS48〜S52を繰り返す。例えば、P13の処理において、m=1のときに、本文誤り判定部41は、「ゲートウェイ」を対象語句としたとする。「ゲートウェイ」という語句は図3の語句データベース21では、ランクの値が正である。そこで、本文誤り判定部41は、tを1インクリメントする。   When the information of the paragraph classified as “text” or “citation” is acquired, the e-mail dividing unit 14 divides the paragraph into words (step S45). The e-mail dividing unit 14 outputs the word / phrase obtained by the division to the text error determining unit 41. The text error determination unit 41 refers to the common phrase database 22 and deletes the phrase included in the common phrase database 22 from the input phrase. The text error determination unit 41 sets the remaining noun as the target word / phrase. The text error determination unit 41 obtains the number M of target words / phrases included in the paragraph (step S46). When one or more target words / phrases are included, the text error determination unit 41 determines whether the rank value associated with the combination of the destination address and the source address is a positive value for the mth word / phrase. Confirm (Yes in step S47, step S48). If the confirmed rank value is 0 or a negative value, the body error determination unit 41 increments the variable f by one (step S49). On the other hand, if the confirmed rank value is a positive number, the body error determination unit 41 increments the variable t by one (step S50). When either the variable t or f is incremented, the text error determination unit 41 increments the variable m by one and compares the value of m with M (steps S51 and S52). The text error determination unit 41 repeats steps S48 to S52 until m becomes larger than M. For example, in the process of P13, when m = 1, the text error determination unit 41 assumes that “gateway” is the target word / phrase. The word “gateway” has a positive rank value in the word database 21 of FIG. Therefore, the text error determination unit 41 increments t by 1.

処理対象のパラグラフに含まれている対象語句についての処理が終了すると、本文誤り判定部41は、そのパラグラフの処理結果に基づいて誤送信かを判定する。図14のフローチャートでは、本文誤り判定部41は、変数fとMの比がエラー閾値(ThNG)以上であるかを判定する(ステップS53)。ここで、変数fとMの比は、対象語句の総数に対する、送信元アドレスと宛先アドレスの間で送受信されたことがない対象語句の数の割合である。変数fとMの比がエラー閾値以上の場合、本文誤り判定部41は、本文に誤りがあると判定して、その送信メールの処理を終了する(ステップS55)。 When the processing for the target word / phrase included in the paragraph to be processed ends, the text error determination unit 41 determines whether the transmission is erroneous based on the processing result of the paragraph. In the flowchart of FIG. 14, the text error determination unit 41 determines whether the ratio of the variables f and M is equal to or greater than an error threshold (Th NG ) (step S53). Here, the ratio of the variables f and M is the ratio of the number of target words / phrases that have not been transmitted / received between the source address and the destination address to the total number of target words / phrases. When the ratio between the variables f and M is equal to or greater than the error threshold, the text error determination unit 41 determines that there is an error in the text and ends the processing of the transmitted mail (step S55).

一方、変数fとMの比がエラー閾値(ThNG)未満の場合、さらに、変数tとMの比が許可閾値以上であるかを判定する(ステップS54)。ここで、変数tとMの比は、対象語句の総数に対する、送信元アドレスと宛先アドレスの間で送受信されたことがある対象語句の数の割合である。変数tとMの比がThOKより小さい場合、本文誤り判定部41は、本文に誤りがあると判定してその送信メールの処理を終了する(ステップS55)。一方、f/MがThNG未満で、かつ、t/MがThOK以上の場合、本文誤り判定部41は、nの値を1つインクリメントして、次のパラグラフを処理する。このとき、m=1に設定すると共に、tとfの値を0に設定する(ステップS56)。さらに、本文誤り判定部41は、nの値をNと比較し、nがNより大きくなるまで、ステップS44〜S57を繰り返す(ステップS57)。ステップS57でnがNより大きいと判定されると、本文誤り判定部41は、送信メールが誤送信ではないと判定する(ステップS58)。なお、ステップS47でMが0個である場合、本文誤り判定部41はステップS48〜S54の処理を行わずにステップS56の処理を行う。 On the other hand, if the ratio between the variables f and M is less than the error threshold (Th NG ), it is further determined whether the ratio between the variables t and M is greater than or equal to the permission threshold (step S54). Here, the ratio of the variables t and M is the ratio of the number of target phrases that have been transmitted and received between the source address and the destination address to the total number of target phrases. When the ratio of the variables t and M is smaller than Th OK , the text error determination unit 41 determines that there is an error in the text and ends the processing of the transmitted mail (step S55). On the other hand, when f / M is less than Th NG and t / M is equal to or greater than Th OK , the text error determination unit 41 increments the value of n by one and processes the next paragraph. At this time, m = 1 is set, and the values of t and f are set to 0 (step S56). Further, the text error determination unit 41 compares the value of n with N, and repeats steps S44 to S57 until n becomes larger than N (step S57). If it is determined in step S57 that n is greater than N, the text error determination unit 41 determines that the transmitted mail is not an erroneous transmission (step S58). When M is 0 in step S47, the text error determination unit 41 performs the process of step S56 without performing the processes of steps S48 to S54.

次に、アドレス誤り判定部42による誤送信の判定について説明する。アドレス誤り判定部42は、送信元アドレスから宛先アドレスにメールが送信される可能性を確認する。さらに、宛先アドレスが複数含まれている場合、アドレス誤り判定部42は、宛先アドレスの間の関連性に基づいて、電子メールが同報される可能性があるかを確認する。アドレス誤り判定部42は、送信メールの宛先に記載されているアドレスか送信元アドレスに指定されているメールアドレスから2つのメールアドレスを組み合わせ、各々の組み合わせについて関連性の大きさを確認して、誤送信の可能性があるかを判定する。ここで、アドレス誤り判定部42は、送信元アドレスから宛先アドレスに電子メールが送られる可能性を、関連性データベース23に記録されている関連性の値であるとする。   Next, determination of erroneous transmission by the address error determination unit 42 will be described. The address error determination unit 42 confirms the possibility of mail being transmitted from the transmission source address to the destination address. Further, when a plurality of destination addresses are included, the address error determination unit 42 confirms whether there is a possibility that the electronic mail is broadcast based on the relationship between the destination addresses. The address error determination unit 42 combines two mail addresses from the address described in the destination of the transmitted mail or the mail address specified as the transmission source address, and confirms the magnitude of relevance for each combination. Determine if there is a possibility of erroneous transmission. Here, the address error determination unit 42 assumes that the possibility that an e-mail is sent from the transmission source address to the destination address is the relevance value recorded in the relevance database 23.

過去に電子メールの送受信が行われている電子メールアドレス間では、メールの送受信が繰り返される可能性が大きいと考えられる。例えば、図8(a)のメールは、t-tanaka@xx-network.co.jpからsuzuki@ghi.co.jpに送信されている。従って、図8(a)の電子メールに対する返信や追加の情報を含むメールなどがt-tanaka@xx-network.co.jpとsuzuki@ghi.co.jpの間で送受信される可能性は高いと考えられる。例えば、アドレス誤り判定部42は、関連閾値を記憶している。関連閾値は、0から1までの間の任意の値とすることができるが、アドレス誤り判定部42が誤送信を正しく検出できる程度に実装に応じて調整される。以下の説明では、例えば、アドレス誤り判定部42は、関連閾値を0.5に設定されているものとする。一方、例えば、電子メールの送受信の履歴がないアドレスに向けて電子メールの送信が指示された場合、アドレス誤り判定部42は、誤送信の可能性があると判定する。   It is considered that there is a high possibility that email transmission / reception is repeated between email addresses where email transmission / reception has been performed in the past. For example, the mail in FIG. 8A is transmitted from t-tanaka@xx-network.co.jp to suzuki@ghi.co.jp. Therefore, there is a high possibility that a reply to the e-mail in FIG. 8A or an e-mail containing additional information will be sent and received between t-tanaka@xx-network.co.jp and suzuki@ghi.co.jp. it is conceivable that. For example, the address error determination unit 42 stores a related threshold value. The related threshold value can be any value between 0 and 1, but is adjusted according to the implementation to the extent that the address error determination unit 42 can correctly detect erroneous transmission. In the following description, for example, the address error determination unit 42 is assumed to set the related threshold value to 0.5. On the other hand, for example, when transmission of an e-mail is instructed to an address for which there is no e-mail transmission / reception history, the address error determination unit 42 determines that there is a possibility of erroneous transmission.

図13(a)に示すメールに含まれているアドレスが通知された場合のアドレス誤り判定部42の動作について説明する。図13(a)に示すメールが作成されると、アドレス誤り判定部42には、以下の3つのアドレスが通知される。
送信元アドレス:suzuki@ghi.co.jp
Toに指定された宛先アドレス:t-tanaka@xx-network.co.jp
CCに指定された宛先アドレス:sato@ghi.co.jp
そこで、アドレス誤り判定部42は、関連性データベース23を参照して関連性の値を取得する。ここでは図5に示す関連性データベース23が用いられるものとする。すると、関連性データベース23にt-tanaka@xx-network.co.jpとsato@ghi.co.jpの関連性は記録されていないので、アドレス誤り判定部42は、関連性の値を0とする。得られた関連性の値を関連閾値と比較すると、t-tanaka@xx-network.co.jpとsato@ghi.co.jpの関連性は関連閾値より小さい。
The operation of the address error determination unit 42 when the address included in the mail shown in FIG. 13A is notified will be described. When the mail shown in FIG. 13A is created, the address error determination unit 42 is notified of the following three addresses.
Sender address: suzuki@ghi.co.jp
Destination address specified for To: t-tanaka@xx-network.co.jp
Destination address specified for CC: sato@ghi.co.jp
Therefore, the address error determination unit 42 refers to the relevance database 23 and acquires a relevance value. Here, it is assumed that the relevance database 23 shown in FIG. 5 is used. Then, since the relationship between t-tanaka@xx-network.co.jp and sato@ghi.co.jp is not recorded in the relationship database 23, the address error determination unit 42 sets the relationship value to 0. To do. When the obtained relevance value is compared with the relevance threshold, the relevance between t-tanaka@xx-network.co.jp and sato@ghi.co.jp is smaller than the relevance threshold.

次に、アドレス誤り判定部42は、署名の関連性を検討する。メールの送信者がメールを同報する場合、送信者と同報メールの受取人は、同報メールの内容に関連する業務を行っている可能性が高い。署名の欄には、会社名、部署名、グループ名などが記載されている。従って、アドレス同士の関連性が小さくても、会社名、部署名、グループ名が送信者と共通している場合、宛先は誤っていない可能性がある。そこで、アドレス誤り判定部42は、語句データベース21を参照して、関連性が小さいと判定された組み合わせに含まれるアドレスに対応付けて記録されている語句を取得する。アドレス誤り判定部42は、取得した対象語句同士を比較して、共通している語句の数を計数する。アドレス誤り判定部42は、共通している語句の数を、宛先類似閾値と比較する。共通する語句の数が宛先類似閾値以上の場合、署名が類似していると判定する。署名が類似している場合は、関連性が関連閾値よりも小さくても、アドレス誤り判定部42は、アドレスに誤りがあると判定しない。一方、関連性が関連閾値よりも小さく、さらに、署名が類似していない場合は、アドレス誤り判定部42は、宛先が誤っている可能性があると判定する。   Next, the address error determination unit 42 examines the relevance of the signature. When a mail sender broadcasts a mail, it is highly likely that the sender and the recipient of the broadcast mail are performing work related to the contents of the broadcast mail. The company name, department name, group name, etc. are described in the signature column. Therefore, even if the relationship between addresses is small, if the company name, department name, and group name are the same as the sender, the destination may not be incorrect. Therefore, the address error determination unit 42 refers to the word / phrase database 21 and acquires a word / phrase recorded in association with an address included in a combination determined to be less relevant. The address error determination unit 42 compares the acquired target words and counts the number of common words. The address error determination unit 42 compares the number of common words with the destination similarity threshold. If the number of common words is equal to or greater than the destination similarity threshold, it is determined that the signatures are similar. If the signatures are similar, the address error determination unit 42 does not determine that there is an error in the address even if the relevance is smaller than the relevance threshold. On the other hand, if the relevance is smaller than the relevance threshold and the signatures are not similar, the address error determination unit 42 determines that the destination may be incorrect.

例えば、アドレス誤り判定部42は、t-tanaka@xx-network.co.jpに関連付けられたメールの署名から得られた対象語句を取得する。図8に示した語句データベース21が用いられている場合、t-tanaka@xx-network.co.jpに関連付けて「XXネットワーク」、「田中」、「太郎」、「サポート部」、「03-1122-3344」、「1234-5678」の6種類の語句が記録されている。また、アドレス誤り判定部42は、sato@ghi.co.jpに対応付けられたメールの署名欄から得られた対象語句も取得する。例えば、sato@ghi.co.jpに対応付けて「サポート部」、「GHI株式会社」、「佐藤」の3種類の語句が記録されていたとする。この場合、t-tanaka@xx-network.co.jpとsato@ghi.co.jpの両者に対応付けられた語句のうちでは、「サポート部」が共通する。従って、共通する語句の数は1つである。類似閾値が3であるとすると、アドレス誤り判定部42は、t-tanaka@xx-network.co.jpとsato@ghi.co.jpの署名の類似性は低いと判定し、さらに、送信メールの宛先が誤っている可能性があると判定する。   For example, the address error determination unit 42 acquires the target word / phrase obtained from the signature of the mail associated with t-tanaka@xx-network.co.jp. When the phrase database 21 shown in FIG. 8 is used, “XX Network”, “Tanaka”, “Taro”, “Support Department”, “03-” are associated with t-tanaka@xx-network.co.jp. Six types of phrases “1122-3344” and “1234-5678” are recorded. In addition, the address error determination unit 42 also acquires the target word / phrase obtained from the mail signature column associated with sato@ghi.co.jp. For example, it is assumed that three types of phrases “support department”, “GHI Corporation”, and “Sato” are recorded in association with sato@ghi.co.jp. In this case, among the words associated with both t-tanaka@xx-network.co.jp and sato@ghi.co.jp, the “support section” is common. Therefore, the number of common phrases is one. If the similarity threshold is 3, the address error determination unit 42 determines that the similarity between the signatures of t-tanaka@xx-network.co.jp and sato@ghi.co.jp is low, and further, the outgoing mail It is determined that there is a possibility that the destination is incorrect.

図15は、アドレス誤り判定部42の動作の例を説明するフローチャートである。以下、図15を参照しながら、アドレス誤り判定部42の動作について説明する。アドレス誤り判定部42は、電子メール分割部14から送信メールの送信元アドレスと宛先アドレスを取得する(ステップS61)。ここで、送信元アドレスと宛先アドレスの合計数は、K個であるとする。アドレス誤り判定部42は、変数pを1に設定する(ステップS62)。さらに、アドレス誤り判定部42は、変数qをpよりも1つ大きな値に設定する(ステップS63)。アドレス誤り判定部42は、p番目のメールアドレスとq番目のメールアドレスについて、関連性データベース23を参照して、関連性の値を取得する(ステップS64)。アドレス誤り判定部42は、得られた関連性を関連閾値と比較する(ステップS65)。関連性が関連閾値以上の場合、アドレス誤り判定部42は、qの値を1つインクリメントしてKと比較する(ステップS65〜S67)。qの値がKよりも大きくなるまで、アドレス誤り判定部42は、ステップS64〜S67を繰り返す。   FIG. 15 is a flowchart for explaining an example of the operation of the address error determination unit 42. Hereinafter, the operation of the address error determination unit 42 will be described with reference to FIG. The address error determination unit 42 acquires the transmission source address and the destination address of the transmission mail from the electronic mail division unit 14 (step S61). Here, it is assumed that the total number of source addresses and destination addresses is K. The address error determination unit 42 sets the variable p to 1 (step S62). Further, the address error determination unit 42 sets the variable q to a value one larger than p (step S63). The address error determination unit 42 refers to the relevance database 23 for the p-th mail address and the q-th mail address, and acquires a relevance value (step S64). The address error determination unit 42 compares the obtained association with the association threshold (step S65). If the relevance is greater than or equal to the relevance threshold, the address error determination unit 42 increments the value of q by 1 and compares it with K (steps S65 to S67). The address error determination unit 42 repeats steps S64 to S67 until the value of q becomes larger than K.

一方、ステップS65において、p番目のメールアドレスとq番目のメールアドレスの組み合わせについて関連性データベース23に記録されている関連性が、関連閾値よりも小さいと判定されると、アドレス誤り判定部42は、語句データベース21を参照する。アドレス誤り判定部42は、語句データベース21からp番目のメールアドレスと「署名」に対応付けられている語句を取得する。さらに、アドレス誤り判定部42は、語句データベース21からq番目のメールアドレスと「署名」に対応付けられている語句を取得する(ステップS68)。アドレス誤り判定部42は、各々のメールアドレスに対応付けられた語句を比較して、共通している語句の数を計数する。アドレス誤り判定部42は、共通している語句の数が、宛先類似閾値以上の場合、署名が類似していると判定する(ステップS69)。一方、アドレス誤り判定部42は、共通している語句の数が、宛先類似閾値よりも少ない場合、署名が類似していないと判定し、誤送信の恐れがあると判定して処理を終了する(ステップS69、S70)。   On the other hand, if it is determined in step S65 that the relevance recorded in the relevance database 23 for the combination of the p-th mail address and the q-th mail address is smaller than the relevance threshold, the address error determination unit 42 , Refer to the phrase database 21. The address error determination unit 42 acquires the phrase associated with the p-th mail address and “signature” from the phrase database 21. Furthermore, the address error determination unit 42 acquires a word / phrase associated with the qth mail address and “signature” from the word / phrase database 21 (step S68). The address error determination unit 42 compares the words associated with each mail address and counts the number of common words. The address error determination unit 42 determines that the signatures are similar when the number of common words is equal to or greater than the destination similarity threshold (step S69). On the other hand, if the number of common words is smaller than the destination similarity threshold, the address error determination unit 42 determines that the signatures are not similar, determines that there is a possibility of erroneous transmission, and ends the processing. (Steps S69 and S70).

変数qの値がKより大きくなるまで、誤送信の恐れがあるメールアドレスの組み合わせが検出されなかった場合、アドレス誤り判定部42は、pの値を1つインクリメントする(ステップS71)。アドレス誤り判定部42は、pの値をKと比較し、pがKよりも大きくなるまでステップS63〜S72を繰り返す。pの値がKより大きくなるまで誤送信の恐れがあるメールアドレスの組み合わせが検出されなかった場合、アドレス誤り判定部42は、誤送信ではないと判定して、処理を終了する(ステップS73)。   If a combination of e-mail addresses that may be erroneously transmitted is not detected until the value of the variable q is greater than K, the address error determination unit 42 increments the value of p by one (step S71). The address error determination unit 42 compares the value of p with K, and repeats steps S63 to S72 until p becomes larger than K. If a combination of e-mail addresses that may be erroneously transmitted is not detected until the value of p is greater than K, the address error determination unit 42 determines that there is no erroneous transmission and ends the process (step S73). .

〔送信メールの処理と通信装置から送信されたメールを用いた学習〕
次に、送信メールの処理について述べる。以下、送信確認部15は、送信する電子メールが修正されているかを示す語句修正フラグを参照できるものとする。また、以下の説明では、語句修正フラグが1の場合に電子メールが修正されていることを示すものとし、送信メールの処理を開始するときに語句修正フラグは0に初期化されているものとする。
[Processing of outgoing mail and learning using mail sent from a communication device]
Next, transmission mail processing will be described. Hereinafter, it is assumed that the transmission confirmation unit 15 can refer to a word / phrase correction flag indicating whether an electronic mail to be transmitted has been corrected. Further, in the following description, it is assumed that the e-mail has been corrected when the phrase correction flag is 1, and the phrase correction flag is initialized to 0 when processing of the outgoing mail is started. To do.

まず、新たに生成された送信メールが修正されずに送信される場合について説明する。本文誤り判定部41とアドレス誤り判定部42の判定結果は、送信確認部15に出力される。送信確認部15は、本文誤り判定部41とアドレス誤り判定部42の両方が誤送信ではないと判定すると、電子メール作成部13に送信メールを送信部12に出力することを要求する。このとき、送信確認部15は、送信メールの識別子を電子メール作成部13に通知する。電子メール作成部13は、送信部12に送信メールを出力し、電子メール作成部13から送信部12に出力されたメールは、宛先アドレスに向けて送信される。さらに、送信されたメールに基づいて、語句データベース21や関連性データベース23が更新される。データベースの更新については後述する。   First, a case where a newly generated transmission mail is transmitted without being corrected will be described. The determination results of the text error determination unit 41 and the address error determination unit 42 are output to the transmission confirmation unit 15. If both the text error determination unit 41 and the address error determination unit 42 determine that there is no erroneous transmission, the transmission confirmation unit 15 requests the email creation unit 13 to output the transmission mail to the transmission unit 12. At this time, the transmission confirmation unit 15 notifies the email creation unit 13 of the identifier of the transmission mail. The e-mail creation unit 13 outputs a transmission mail to the transmission unit 12, and the mail output from the e-mail creation unit 13 to the transmission unit 12 is transmitted toward the destination address. Further, the phrase database 21 and the relevance database 23 are updated based on the transmitted mail. The database update will be described later.

一方、本文誤り判定部41とアドレス誤り判定部42のうちの1つ以上が誤送信と判定した場合、送信確認部15は、誤送信と判定された送信メールとその送信メールを送信するかを確認する確認画面を、ディスプレイ等に表示する。図16に、送信メールを送信するかを確認する確認画面の例を示す。ユーザは、表示された送信メールを確認して、メールに誤りが無いと判定すると、確認画面のメール送信ボタン75を押し下す。メール送信ボタン75が押し下された場合、送信確認部15は、送信メールの識別子を電子メール作成部13に通知する。電子メール作成部13は、送信部12に送信メールを出力し、メールの送信が行われる。また、後述するように、語句データベース21や関連性データベース23の更新も行われる。   On the other hand, when one or more of the body error determination unit 41 and the address error determination unit 42 determines that the transmission is erroneous, the transmission confirmation unit 15 determines whether to transmit the transmission mail determined to be erroneous transmission and the transmission mail. A confirmation screen to be confirmed is displayed on a display or the like. FIG. 16 shows an example of a confirmation screen for confirming whether or not to send an outgoing mail. When the user confirms the displayed outgoing mail and determines that the mail has no error, the user pushes down the mail transmission button 75 on the confirmation screen. When the mail transmission button 75 is pressed down, the transmission confirmation unit 15 notifies the email creation unit 13 of the identifier of the transmission mail. The e-mail creation unit 13 outputs a transmission mail to the transmission unit 12, and the mail is transmitted. Further, as will be described later, the phrase database 21 and the relevance database 23 are also updated.

表示されているメールに誤りがある場合、ユーザは、送信中止ボタン76を押し下す。例えば、送信確認部15は、本文誤り判定部41が送信メールに誤りがあると判定している場合、語句修正フラグを1に設定する。さらに、送信確認部15は、送信メールの識別子と共に送信の中止を電子メール作成部13に通知する。電子メール作成部13は、送信確認部15から通知された識別子で識別される電子メールの修正画面をディスプレイに表示し、ユーザからの入力を待つ。ここで、修正画面で修正されるメールは、修正前のメールに付された識別子が付されるものとする。例えば、201007091030の識別子のメールが修正された場合、修正後のメールの識別子も201007091030が用いられる。   If there is an error in the displayed mail, the user pushes down the transmission stop button 76. For example, the transmission confirmation unit 15 sets the phrase correction flag to 1 when the text error determination unit 41 determines that there is an error in the transmitted mail. Further, the transmission confirmation unit 15 notifies the email creation unit 13 of the suspension of transmission together with the identifier of the transmission mail. The e-mail creation unit 13 displays a correction screen of the e-mail identified by the identifier notified from the transmission confirmation unit 15 on the display and waits for input from the user. Here, it is assumed that the mail that is corrected on the correction screen is attached with an identifier attached to the mail before correction. For example, when an email with an identifier of 2011007091030 is corrected, the identifier of the corrected email is also used as 2011007091030.

また、電子メール作成部13は、通知された識別子を本文誤り判定部41に通知する。本文誤り判定部41は、通知された識別子に対応付けられている対象語句を修正前語句テーブルに記録する。図17は修正前語句テーブルの例を示す図である。修正前語句テーブルには、対象語句に対応付けて、送信元アドレス、宛先アドレス、宛先アドレスの種類、対象語句が含まれているパラグラフの種類などが記録される。なお、この場合、語句データベース21や関連性データベース23は更新されない。ユーザによって修正が行われ、修正後のメールについて送信の指示が行われると、通信装置10は、指示された送信メールについて、前述のとおりに誤送信かを判定する。   In addition, the e-mail creation unit 13 notifies the body error determination unit 41 of the notified identifier. The text error determination unit 41 records the target word / phrase associated with the notified identifier in the pre-correction word / phrase table. FIG. 17 is a diagram showing an example of the pre-correction word / phrase table. In the pre-correction word / phrase table, a source address, a destination address, a type of destination address, a type of paragraph including the target word / phrase, and the like are recorded in association with the target word / phrase. In this case, the phrase database 21 and the relevance database 23 are not updated. When correction is performed by the user and a transmission instruction is issued for the corrected mail, the communication device 10 determines whether the instructed transmission mail is erroneously transmitted as described above.

図18は、ランク変更量テーブルの例を示す図である。ランク変更量テーブルは、語句データベース21のランクの変更量を記録している。ランク変更量テーブルは、対象語句に対応付けられているアドレスの種類と、語句データベース更新部51が語句データベース21の更新に用いるランクの加算値を示している。ランクの加算値は、宛先アドレスの種類やメールが過去に修正されているかによって変動する。   FIG. 18 is a diagram illustrating an example of the rank change amount table. The rank change amount table records the rank change amount of the phrase database 21. The rank change amount table indicates the type of address associated with the target phrase and the rank addition value used by the phrase database update unit 51 for updating the phrase database 21. The added value of the rank varies depending on the type of the destination address and whether the mail has been corrected in the past.

図18のNo.1〜6は、誤送信であるかの判定が開始されてから修正が行われずに送信されたメールに含まれている対象語句に適用されるランクの加算値を示している。例えば、No.1は、対象語句に対応付けられた2つのアドレスが送信元アドレスとToに指定された宛先アドレスの場合である。No.7〜24は、誤送信であると判定された後で修正が行われ、修正後に送信されたメールに含まれている対象語句に適用されるランクの加算値を示している。No.7〜12は、修正の前後で共通して用いられている対象語句のランクの加算値である。No.13〜18は、修正の前には用いられていなかったが修正後に用いられている対象語句のランクの加算値である。No.19〜24は、修正の前には用いられていたが修正後に用いられていない対象語句のランクの加算値である。   No. in FIG. Reference numerals 1 to 6 indicate rank addition values applied to the target words / phrases included in the mail transmitted without correction after the determination as to whether the transmission is erroneous. For example, no. 1 is a case where the two addresses associated with the target word / phrase are the source address and the destination address specified in To. No. Reference numerals 7 to 24 indicate rank addition values applied to the target words and phrases included in the mail transmitted after the correction after the correction is determined as erroneous transmission. No. 7 to 12 are added values of ranks of target words that are commonly used before and after the correction. No. Reference numerals 13 to 18 are the added values of the ranks of the target words that have not been used before the correction but are used after the correction. No. Reference numerals 19 to 24 indicate the rank addition values of the target words / phrases that were used before the correction but were not used after the correction.

図18に示すランクの加算値を用いて語句データベース21が修正される場合、語句データベース更新部51は、修正前の本文に誤って記載されていた対象語句のランクの加算値を、図10(a)に示したような、受信メールによる学習の値よりも小さくする。例えば、語句データベース更新部51は、誤って記載されていた対象語句についてのランクの加算値を負の値とすることができる。一方、修正により加えられた対象語句については、語句データベース更新部51は、ランクの加算値を大きくする。以下、語句データベース更新部51が用いるランクの加算値の選択方法と語句データベース21の更新方法について述べる。   When the phrase database 21 is corrected using the rank addition value shown in FIG. 18, the phrase database update unit 51 uses the rank addition value of the target phrase that was erroneously written in the text before correction as shown in FIG. The value is smaller than the learning value by the received mail as shown in a). For example, the phrase database update unit 51 can set a negative addition value for the rank of the target phrase that has been erroneously described. On the other hand, the phrase database update unit 51 increases the rank addition value for the target phrase added by the correction. Hereinafter, a method for selecting the rank addition value used by the phrase database update unit 51 and a method for updating the phrase database 21 will be described.

本文誤り判定部41とアドレス誤り判定部42の両方が誤送信ではないと判定すると、送信メールは修正されずに出力される。送信確認部15は、送信する電子メールが修正されているかを示す語句修正フラグを確認する。送信確認部15は、メールの送信を電子メール作成部13に指示する際に、送信メールの識別子と送信メールの語句修正フラグの値を電子メール作成部13に通知する。電子メール作成部13は、送信メールを送信部12に出力し、さらに、送信メールの識別子と語句修正フラグの値を本文誤り判定部41に通知する。本文誤り判定部41は、通知された識別子に対応付けられている対象語句と、語句修正フラグの値を、語句データベース更新部51に出力する。   If both the body error determination unit 41 and the address error determination unit 42 determine that there is no erroneous transmission, the outgoing mail is output without being corrected. The transmission confirmation unit 15 confirms a word / phrase correction flag indicating whether the electronic mail to be transmitted has been corrected. The transmission confirmation unit 15 notifies the email creation unit 13 of the identifier of the transmission mail and the value of the phrase correction flag of the transmission mail when instructing the email creation unit 13 to send the email. The e-mail creation unit 13 outputs the transmission mail to the transmission unit 12, and further notifies the body error determination unit 41 of the identifier of the transmission mail and the value of the phrase correction flag. The text error determination unit 41 outputs the target word / phrase associated with the notified identifier and the value of the word correction flag to the word / phrase database update unit 51.

語句データベース更新部51は、本文誤り判定部41から入力されたデータを語句データベース21に記録されているデータと比較する。対象語句、送信メールの識別子、パラグラフの種類、送信元アドレス、宛先アドレスの組み合わせが一致するデータが語句データベース21に記録されている場合、語句データベース更新部51は、語句データベース21のランクの値を変更する。語句修正フラグの値が0の場合、語句データベース更新部51は、アドレスの種類に合わせて図18のNo.1〜6から選択された値を、語句データベース21のランクに加算する。なお、語句データベース21に登録されていない対象語句は、語句データベース更新部51により、新たに語句データベース21に登録される。このときも図18のNo.1〜6に記録された加算値が用いられる。   The phrase database update unit 51 compares the data input from the text error determination unit 41 with the data recorded in the phrase database 21. When data that matches the combination of the target phrase, the identifier of the transmitted mail, the paragraph type, the source address, and the destination address is recorded in the phrase database 21, the phrase database update unit 51 calculates the rank value of the phrase database 21. change. When the value of the phrase correction flag is 0, the phrase database update unit 51 matches No. of FIG. The value selected from 1 to 6 is added to the rank of the phrase database 21. Note that target phrases that are not registered in the phrase database 21 are newly registered in the phrase database 21 by the phrase database update unit 51. At this time as well, as shown in FIG. The added values recorded in 1 to 6 are used.

一方、ユーザによって修正が行われ、修正後のメールに誤りがないと判定されると、語句修正フラグは1に設定されている。この場合、語句データベース更新部51は、送信メールに含まれている対象語句と、修正前語句テーブルに含まれている語句を比較する。対象語句が送信メールと修正前語句テーブルの両方に含まれている場合、語句データベース更新部51は、図18のNo.7〜12に指定されたランクを用いて語句データベース21を更新する。送信メールに含まれていて修正前語句テーブルに含まれていない対象語句について、語句データベース更新部51は、図18のNo.13〜18に指定されたランクを用いて語句データベース21を更新する。また、送信メールに含まれておらず、修正前語句テーブルに含まれている対象語句について、語句データベース更新部51は、図18のNo.19〜24に指定されたランクを用いて語句データベース21を更新することにより、ランクの値を小さくする。なお、この場合も、送信されたメールに含まれている対象語句のうちで、語句データベース21に登録されていない対象語句は、語句データベース更新部51により、新たに語句データベース21に登録される。   On the other hand, if the correction is performed by the user and it is determined that there is no error in the corrected mail, the phrase correction flag is set to 1. In this case, the phrase database update unit 51 compares the target phrase included in the transmitted mail with the phrase included in the pre-correction phrase table. When the target word / phrase is included in both the outgoing mail and the uncorrected word / phrase table, the word / phrase database update unit 51 selects No. in FIG. The phrase database 21 is updated using the ranks designated as 7 to 12. For the target words / phrases that are included in the sent mail but not included in the pre-correction word / phrase table, the word / phrase database update unit 51 sets the No. The phrase database 21 is updated using the ranks specified as 13 to 18. In addition, the phrase database update unit 51 performs the processing of No. 1 in FIG. 18 for the target phrases that are not included in the transmitted mail but are included in the pre-correction phrase table. By updating the word / phrase database 21 using the ranks designated as 19 to 24, the rank value is reduced. Also in this case, among the target words / phrases included in the transmitted mail, the target words / phrases not registered in the word / phrase database 21 are newly registered in the word / phrase database 21 by the word / phrase database update unit 51.

このように、誤っているメールに記載されているが修正後の送信メールに記載されていない修正語句は、そのメールの送信元アドレスと宛先アドレスの間での通信に用いられる可能性を表すランクの値が小さく変更される。一方、修正後の送信メールに含まれる対象語句は、そのメールの送信元アドレスと宛先アドレスの間での通信に用いられる可能性を表すランクの値が大きく変更される。   In this way, the correction phrase that is described in the erroneous mail but not in the corrected outgoing mail is a rank that indicates the possibility of being used for communication between the source address and the destination address of the mail. The value of is changed smaller. On the other hand, the value of the rank representing the possibility that the target word / phrase included in the corrected outgoing mail is used for communication between the mail source address and the destination address is greatly changed.

図19は、関連性データベースの更新に際して行われる動作の例を説明するフローチャートである。図19を参照しながら、誤送信ではないと判定されたメール、もしくは、ユーザから送信が指示された送信メールに含まれているアドレスに基づいて、関連性データベース23が更新されるときの関連性データベース更新部53の動作について説明する。   FIG. 19 is a flowchart illustrating an example of an operation performed when updating the relevance database. Referring to FIG. 19, the relevance when relevance database 23 is updated based on the mail that is determined not to be erroneously transmitted or the address included in the transmitted mail instructed to be transmitted from the user. The operation of the database update unit 53 will be described.

メールが送信されると、関連性データベース更新部53は、アドレス誤り判定部42から送信されたメールの送信元アドレスと宛先アドレス、および、各宛先アドレスの種類と、アドレスの総数Kを取得する(ステップS81、S82)。ここで、ステップS82において、関連性データベース更新部53は、アドレス誤り判定部42から、送信元アドレス、Toに指定された宛先アドレス、CCに指定された宛先アドレス、BCCに指定された宛先アドレスを通知される。また、定数Kは、送信元アドレス、Toに指定された宛先アドレス、CCに指定された宛先アドレス、BCCに指定された宛先アドレスの総数であるとする。ステップS83〜S87の処理は、図12を参照しながら説明したステップS23〜S27と同様である。ただし、ステップS85においてアドレスの関連性(Rij)の算出に用いられる区分係数は、以下に示すように、BCCの宛先には、CCに指定された宛先より小さい値が割り当てられるものとする。
送信元アドレス(From)の区分係数 :1
宛先アドレス(To)の区分係数 :1
宛先アドレス(CC)の区分係数 :0.5
宛先アドレス(BCC)の区分係数 :0.25
また、ステップS88とS90では、変数i、jは、定数Kと比較されるものとする。
When the mail is transmitted, the relevance database update unit 53 acquires the transmission source address and destination address of the mail transmitted from the address error determination unit 42, the type of each destination address, and the total number K of addresses ( Steps S81 and S82). Here, in step S82, the relevance database update unit 53 receives the source address, the destination address specified for To, the destination address specified for CC, and the destination address specified for BCC from the address error determination unit 42. Be notified. The constant K is assumed to be the total number of transmission source addresses, destination addresses specified in To, destination addresses specified in CC, and destination addresses specified in BCC. The processes in steps S83 to S87 are the same as steps S23 to S27 described with reference to FIG. However, as the classification coefficient used for calculating the address relevance (R ij ) in step S85, a value smaller than the destination specified in the CC is assigned to the BCC destination as shown below.
Source address (From) division coefficient: 1
Destination address (To) division factor: 1
Destination address (CC) classification factor: 0.5
Destination address (BCC) division factor: 0.25
In steps S88 and S90, the variables i and j are compared with the constant K.

なお、共通語句データベース更新部52の動作は、受信メールについての学習と同様に行われる。共通語句データベース更新部52により、共通語句データベース22は、適宜、更新される。   The operation of the common phrase database update unit 52 is performed in the same manner as the learning for the received mail. The common phrase database update unit 52 updates the common phrase database 22 as appropriate.

図20A〜図20Dは、送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。以下の例では、語句修正フラグ、本文誤りフラグ、アドレス誤りフラグの3種類のフラグが用いられる。本文誤りフラグは、本文誤り判定部41が、送信メールに含まれているパラグラフのいずれかに誤りがある可能性があると判定したことを示す。アドレス誤りフラグは、アドレス誤り判定部42が、宛先アドレスのいずれかが誤っている可能性があると判定したことを示す。なお、図20A〜図20Dは、通信装置10の動作の一例であり、例えば、通信装置10は、本文の誤りをチェックする前にアドレスの関連性による誤送信の検出を行うこともできる。すなわち、ステップS103〜S105の処理は、ステップS106の判定の後に行われる場合がある。また、前述のように、ステップS128とS129の順序を変更することもできる。さらに、以下の例では、送信確認部15は、確認画面を介して入力された情報を、本文誤り判定部41、アドレス誤り判定部42、電子メール作成部13に通知するものとする。   20A to 20D are flowcharts for explaining an example of a database update method based on an outgoing mail. In the following example, three types of flags are used: a phrase correction flag, a text error flag, and an address error flag. The text error flag indicates that the text error determination unit 41 has determined that any of the paragraphs included in the transmitted mail may have an error. The address error flag indicates that the address error determination unit 42 has determined that any of the destination addresses may be incorrect. 20A to 20D are examples of the operation of the communication apparatus 10. For example, the communication apparatus 10 can also detect an erroneous transmission due to address relevance before checking an error in the text. That is, the processes in steps S103 to S105 may be performed after the determination in step S106. Further, as described above, the order of steps S128 and S129 can be changed. Further, in the following example, it is assumed that the transmission confirmation unit 15 notifies the text error determination unit 41, the address error determination unit 42, and the e-mail creation unit 13 of the information input via the confirmation screen.

送信メールが電子メール作成部13から電子メール分割部14に出力されると、送信確認部15は、語句修正フラグを0に設定する(ステップS101)。また、本文誤り判定部41は本文誤りフラグを0に設定し、アドレス誤り判定部42はアドレス誤りフラグを0に設定する(ステップS102)。本文誤り判定部41は、パラグラフごとに対象語句を抽出し、語句データベース21に記録されているランクに基づいて、送信メールの本文に誤りがあるかを判定する(ステップS103、S104)。本文誤り判定部41は、送信メールの本文に誤りがあると判定すると、本文誤りフラグを1に設定する(ステップS104、S105)。一方、本文誤り判定部41が本文に誤りがないと判定した場合、本文誤りフラグは0に設定されたままになる。   When the transmission mail is output from the email creation unit 13 to the email division unit 14, the transmission confirmation unit 15 sets the phrase correction flag to 0 (step S101). The text error determination unit 41 sets the text error flag to 0, and the address error determination unit 42 sets the address error flag to 0 (step S102). The text error determination unit 41 extracts a target word / phrase for each paragraph, and determines whether there is an error in the text of the outgoing mail based on the rank recorded in the word / phrase database 21 (steps S103 and S104). If the text error determination unit 41 determines that there is an error in the text of the outgoing mail, it sets the text error flag to 1 (steps S104 and S105). On the other hand, when the text error determination unit 41 determines that there is no error in the text, the text error flag remains set to 0.

次に、アドレス誤り判定部42は、送信メールに含まれている宛先アドレスと送信元アドレスの関連係数を関連閾値と比較する。関連係数が関連閾値よりも低い場合、アドレス誤り判定部42は、語句データベース21を参照する。アドレス誤り判定部42は、関連閾値が低い2つのメールアドレスに対応付けて署名の欄に記録されている対象語句を取得する。両者に共通する語句の数が類似閾値以上であれば、署名の類似性が高いと判定する。署名の類似性が高い場合、アドレス誤り判定部42は、誤送信と判定しない(ステップS106でNo)。送信確認部15は、アドレス誤り判定部42で誤りと判定されない場合、本文誤りフラグを確認することにより、本文誤り判定部41の判定結果を確認する(ステップS107)。本文誤りフラグが0であれば、本文とアドレスのいずれにも誤りが無いため、通信装置10は、送信メールを宛先アドレスに向けて送信する(ステップS108)。   Next, the address error determination unit 42 compares the association coefficient between the destination address and the transmission source address included in the transmission mail with the association threshold. When the related coefficient is lower than the related threshold value, the address error determination unit 42 refers to the phrase database 21. The address error determination unit 42 acquires the target word / phrase recorded in the signature column in association with two mail addresses having a low related threshold. If the number of phrases common to both is greater than or equal to the similarity threshold, it is determined that the similarity of the signature is high. If the signature similarity is high, the address error determination unit 42 does not determine that there is an erroneous transmission (No in step S106). If the address error determination unit 42 does not determine that there is an error, the transmission confirmation unit 15 confirms the determination result of the text error determination unit 41 by checking the text error flag (step S107). If the text error flag is 0, since there is no error in either the text or the address, the communication device 10 transmits the outgoing mail toward the destination address (step S108).

送信確認部15は、メールを送信する旨を電子メール作成部13に通知した後、語句修正フラグが1になっているかを確認する(ステップS109)。語句修正フラグが0である場合、送信されたメールは本文の語句が修正されていないことを示す。そこで、語句データベース更新部51は、本文誤り判定部41から通知された対象語句の情報に基づいて、語句データベース21を更新する(ステップS110)。また、関連性データベース更新部53は、関連性データベース23を更新する(ステップS111)。   The transmission confirmation unit 15 notifies the e-mail creation unit 13 that the e-mail is to be transmitted, and then confirms whether the phrase correction flag is 1 (step S109). When the word correction flag is 0, the transmitted mail indicates that the word / phrase in the body has not been corrected. Therefore, the phrase database update unit 51 updates the phrase database 21 based on the target phrase information notified from the text error determination unit 41 (step S110). Further, the relevance database update unit 53 updates the relevance database 23 (step S111).

一方、語句修正フラグが1の場合、送信メールの識別子に対応付けられた修正前語句テーブルが生成されている。そこで、語句データベース更新部51は、修正前語句テーブルと本文誤り判定部41から通知された対象語句を比較する(ステップS112)。語句データベース更新部51は、送信メールに含まれている対象語句のランクに正の値を加える。一方、送信メールに含まれずに修正前語句テーブルに含まれている対象語句については、対象語句のランクの値を小さくする(ステップS113)。   On the other hand, when the phrase correction flag is 1, a pre-correction phrase table associated with the identifier of the transmitted mail is generated. Therefore, the phrase database update unit 51 compares the uncorrected phrase table with the target phrase notified from the text error determination unit 41 (step S112). The phrase database update unit 51 adds a positive value to the rank of the target phrase included in the transmitted mail. On the other hand, for the target words / phrases that are not included in the outgoing mail but are included in the pre-correction word / phrase table, the rank value of the target word / phrase is decreased (step S113).

ステップS107において、本文誤りフラグが1であると判定された場合、図20Bに示す処理が行われる。送信確認部15は、図16に示すような確認画面を生成し、ユーザからの入力を待つ(ステップS121)。ユーザが確認画面において送信を指示すると、送信確認部15はメールの送信を電子メール作成部13に通知する。電子メール作成部13は、送信部12を介して送信メールを送信する(ステップS122)。その後、ステップS123〜S127の処理により、語句データベース21、関連性データベース23が更新される。ステップS123〜S127は、ステップS109〜S113と同様である。   If it is determined in step S107 that the text error flag is 1, the process shown in FIG. 20B is performed. The transmission confirmation unit 15 generates a confirmation screen as shown in FIG. 16 and waits for an input from the user (step S121). When the user instructs transmission on the confirmation screen, the transmission confirmation unit 15 notifies the electronic mail creation unit 13 of transmission of the mail. The e-mail creation unit 13 transmits a transmission mail via the transmission unit 12 (step S122). Thereafter, the phrase database 21 and the relevance database 23 are updated by the processing of steps S123 to S127. Steps S123 to S127 are the same as steps S109 to S113.

一方、ユーザから送信の中止が指示されると、送信確認部15は、その旨を電子メール作成部13と本文誤り判定部41に通知する。本文誤り判定部41は、対象語句を修正前語句テーブルに格納する(ステップS121でNo、ステップS128)。次に、送信確認部15は、語句修正フラグを1に設定する(ステップS129)。電子メール作成部13は、送信メールの修正画面を表示する(ステップS130)。修正画面でメールが修正され、ユーザから再度、送信が指示されると、図20Aに示すステップS102以降の処理が行われる(ステップS131)。   On the other hand, when an instruction to stop transmission is given by the user, the transmission confirmation unit 15 notifies the e-mail creation unit 13 and the text error determination unit 41 to that effect. The text error determination unit 41 stores the target phrase in the pre-correction phrase table (No in step S121, step S128). Next, the transmission confirmation unit 15 sets the phrase correction flag to 1 (step S129). The e-mail creation unit 13 displays a send mail correction screen (step S130). When the mail is corrected on the correction screen and the user instructs transmission again, the processing from step S102 shown in FIG. 20A is performed (step S131).

ステップS106において、関連性が関連閾値未満で、さらに、署名の類似性が低いアドレスの組み合わせがある場合、アドレス誤り判定部42は、アドレスに誤りがある可能性があると判定する。そこで、アドレス誤り判定部42は、アドレス誤りフラグを1に設定する(ステップS114)。次に、送信確認部15は、本文誤りフラグの値を確認する(ステップS115)。本文誤りフラグが0の場合の処理を図20Cに示す。送信確認部15は、確認画面を出力して、ユーザからの入力を待つ。ユーザからメールの送信が指示されると、送信確認部15は、メールの送信が指示されたことと送信が指示されたメールを識別する識別子を、電子メール作成部13、本文誤り判定部41、アドレス誤り判定部42に通知する(ステップS141でYes)。電子メール作成部13がメールを送信部12に出力することにより、送信メールが宛先アドレスに向けて送信される(ステップS142)。関連性データベース更新部53は、アドレス誤り判定部42から取得した送信元メールアドレス、宛先メールアドレス、宛先メールアドレスの種類に応じて、関連性データベース23を更新する(ステップS143)。ステップS144〜S146の処理は、ステップS123〜S126の処理と同様である。   In step S106, if there is a combination of addresses whose relevance is less than the relevance threshold and signature similarity is low, the address error determination unit 42 determines that there is a possibility that the address has an error. Therefore, the address error determination unit 42 sets the address error flag to 1 (step S114). Next, the transmission confirmation unit 15 confirms the value of the text error flag (step S115). The processing when the text error flag is 0 is shown in FIG. 20C. The transmission confirmation unit 15 outputs a confirmation screen and waits for an input from the user. When the user sends an email transmission instruction, the transmission confirmation unit 15 sets an identifier for identifying the email instructed to send the email and the email instructed to be sent to the e-mail creation unit 13, the text error determination unit 41, The address error determination unit 42 is notified (Yes in step S141). The e-mail creation unit 13 outputs the e-mail to the transmission unit 12, so that the e-mail is transmitted toward the destination address (step S142). The relevance database update unit 53 updates the relevance database 23 according to the type of the transmission source mail address, the destination mail address, and the destination mail address acquired from the address error determination unit 42 (step S143). The process of steps S144 to S146 is the same as the process of steps S123 to S126.

一方、ユーザからメールを送信しないことを通知されると、送信確認部15は、メールの識別子とメールを送信しないことを電子メール作成部13に通知する(ステップS141でNo)。電子メール作成部13は、メールの修正画面を表示する(ステップS148)。修正画面でメールが修正され、ユーザから再度、送信が指示されると、図20Aに示すステップS102以降の処理が行われる(ステップS149)。   On the other hand, when notified by the user that mail will not be transmitted, the transmission confirmation unit 15 notifies the email creating unit 13 that the mail identifier and the mail are not transmitted (No in step S141). The e-mail creation unit 13 displays a mail correction screen (step S148). When the mail is corrected on the correction screen and the transmission is instructed again by the user, the processing after step S102 shown in FIG. 20A is performed (step S149).

ステップS115で本文誤りフラグが1である場合の処理を図20Dに示す。ステップS151〜S157の処理は、図20Cを参照しながら説明したステップS141〜S147の処理と同様である。また、ステップS158〜S161の処理は、図20Bを参照しながら説明したステップS128〜S131の処理と同様である。   FIG. 20D shows processing when the text error flag is 1 in step S115. The processing of steps S151 to S157 is the same as the processing of steps S141 to S147 described with reference to FIG. 20C. Further, the processes in steps S158 to S161 are the same as the processes in steps S128 to S131 described with reference to FIG. 20B.

このように、本実施形態では、共通語句データベース22に記録されている語句を除いた対象語句の出現頻度を用いて誤送信であるかを判定する。従って、通信装置10は、同業者に良く用いられる語句や挨拶文などを判定対象とした影響によって判定結果が正常値に偏りがちになることを防ぎ、誤送信の検出精度を向上することができる。   As described above, in the present embodiment, it is determined whether the transmission is erroneous using the appearance frequency of the target phrase excluding the phrase recorded in the common phrase database 22. Therefore, the communication apparatus 10 can prevent the determination result from being biased to a normal value due to the influence on the determination target such as a phrase or a greeting often used by the same person, and can improve the detection accuracy of erroneous transmission. .

さらに、本実施形態では、メールの修正により加えられた対象語句のランクの加算値は、修正前のメールと修正後のメールの両方に含まれている対象語句のランクの加算値よりも大きい。このため、語句データベース更新部51は、ユーザの修正内容に合わせて語句データベース21を更新することができる。さらに、本実施形態では、メールの修正により修正後のメールから削除された対象語句は、そのメールに記載することが望ましくない対象語句である可能性が高いため、対応するランクの値が小さく変更される。すなわち、誤送信の判断基準となる語句データベース21がユーザの修正結果に基づいて変更されるので、ユーザの使用回数が増加するほど、通信装置10の誤送信判定の結果は、ユーザの判定に近づく可能性が高い。   Furthermore, in this embodiment, the added value of the rank of the target word / phrase added by the correction of the mail is larger than the added value of the rank of the target word / phrase included in both the mail before the correction and the mail after the correction. For this reason, the phrase database update part 51 can update the phrase database 21 according to a user's correction content. Furthermore, in the present embodiment, the target word / phrase deleted from the mail after correction due to the correction of the mail is likely to be a target word / phrase that is not desirably described in the mail, so the corresponding rank value is changed to be small. Is done. That is, because the phrase database 21 that is a criterion for erroneous transmission is changed based on the correction result of the user, the erroneous transmission determination result of the communication device 10 approaches the determination of the user as the number of times the user is used increases. Probability is high.

また、通信装置10は、送信メールの誤送信の判定を行う際に、本文や引用文など、宛先に応じて内容が変動する可能性が大きなパラグラフに記載されている内容について判定を行う。このため、挨拶文など宛先が変化しても同じ語句が使われる可能性が高いパラグラフの判定結果によって誤送信の検出に失敗する可能性が低くなる。   In addition, when determining the erroneous transmission of the outgoing mail, the communication device 10 determines the content described in the paragraph that is highly likely to change depending on the destination, such as a text or a quote. For this reason, even if the destination changes, such as greetings, the possibility of failing to detect erroneous transmission is reduced due to the determination result of the paragraph that is likely to use the same word / phrase.

<第2の実施形態>
第2の実施形態に係る通信装置10は、通信装置10が本文に誤りがあると判定しても、ユーザが誤送信ではないと判定した場合と、通信装置10とユーザの判定が一致した場合で、語句データベース更新部51の処理が異なる。第2の実施形態にかかる通信装置10は、2種類のランク変更量テーブルを備える。一方のランク変更量テーブルは、他方に比べて、送信されたメールに含まれている対象語句のランクの加算値が大きい。
<Second Embodiment>
When the communication apparatus 10 according to the second embodiment determines that the communication apparatus 10 has an error in the text, the user determines that the transmission is not erroneous, and the communication apparatus 10 and the user's determination match. Thus, the processing of the phrase database update unit 51 is different. The communication device 10 according to the second embodiment includes two types of rank change amount tables. In one rank change amount table, the added value of the ranks of the target words / phrases included in the transmitted mail is larger than that in the other.

例えば、通信装置10は、図18に示すランク変更量テーブルと図21に示すランク変更量テーブルを備えることができる。図21のランク変更量テーブルでは、図18のランク変更量テーブルと比べて、送信されたメールに含まれている対象語句のランクの加算値(No.1〜18)が大きくなっている。語句データベース更新部51は、図18に示すランク変更量テーブルと図21に示すランク変更量テーブルを併用する。本文誤り判定部41で本文に誤りがあると判定されていないメールが送信される場合、語句データベース更新部51は、図18に示すランク変更量テーブルを用いて語句データベース21を更新する。すなわち、ステップS110、S113、S146、S147の場合、語句データベース更新部51は、図18に示すランク変更量テーブルを用いて語句データベース21を更新する。   For example, the communication device 10 can include a rank change amount table shown in FIG. 18 and a rank change amount table shown in FIG. In the rank change amount table of FIG. 21, compared to the rank change amount table of FIG. 18, the added value (Nos. 1 to 18) of the ranks of the target words / phrases included in the transmitted mail is large. The phrase database update unit 51 uses the rank change amount table shown in FIG. 18 and the rank change amount table shown in FIG. When an e-mail that has not been determined by the text error determination unit 41 to be erroneous is sent, the phrase database update unit 51 updates the phrase database 21 using the rank change amount table shown in FIG. That is, in the case of steps S110, S113, S146, and S147, the phrase database update unit 51 updates the phrase database 21 using the rank change amount table shown in FIG.

一方、本文誤り判定部41で本文に誤りがあると判定されたメールが、ユーザが確認画面を確認して誤送信ではないと判定し、送信を指示した場合、語句データベース更新部51は、図21に示すランク変更量テーブルを用いて語句データベース21を更新する。すなわち、ステップS125、S126、S156、S157の場合、語句データベース更新部51は、図21に示すランク変更量テーブルを用いて語句データベース21を更新する。   On the other hand, when the mail that is determined to be erroneous in the body text by the body text error determination unit 41 determines that it is not an erroneous transmission by checking the confirmation screen and instructs the transmission, the phrase database update unit 51 The phrase database 21 is updated using the rank change amount table shown in FIG. That is, in the case of steps S125, S126, S156, and S157, the phrase database update unit 51 updates the phrase database 21 using the rank change amount table shown in FIG.

通信装置10は、本文誤り判定部41が本文に誤りがあると判定したメールについて、ユーザにより誤送信ではないと判定されたとき、送信されたメールに含まれている対象語句のランクの加算値が大きいランク変更量テーブルを用いる。その結果、通信装置10により本文に誤りがあると判定されてもユーザにより誤りが無いと判定された場合、送信メールに含まれている対象語句についての加算値は、通信装置10とユーザの判断が一致した場合に比べて大きな値となる。従って、第2の実施形態によると、ユーザの判断と通信装置10の判断のずれを小さくすることができる。   The communication device 10 adds the ranks of the target phrases included in the transmitted mail when the user determines that the text error determination unit 41 determines that the text has an error and that the mail is not erroneously transmitted. A rank change amount table having a large is used. As a result, when the communication device 10 determines that there is an error in the text, if the user determines that there is no error, the added value for the target word / phrase included in the transmitted mail is determined by the communication device 10 and the user. It becomes a large value compared with the case where. Therefore, according to the second embodiment, it is possible to reduce the difference between the judgment of the user and the judgment of the communication device 10.

<第3の実施形態>
第3の実施形態に係る通信装置10は、宛先アドレスの修正が行われた場合、関連性データベース更新部53は、修正の内容を反映するように関連性データベース23を更新する。修正によって追加されたアドレスは、ユーザによって宛先アドレスとすることが明示的に示されたアドレスである。すなわち、修正によって追加されたアドレスは、他の宛先アドレスや送信元アドレスとの関連性が高いことがユーザから明示的に示されたアドレスである。従って、関連性データベース更新部53は、修正によって追加されたアドレスについて、関連性の値を1に近づける。例えば、関連性データベース更新部53は、追加されたアドレスについての関連性を、関連性データベース23に記録されている関連性の値と1との平均値に変更する。一方、修正によって削除されたアドレスは、ユーザによって宛先アドレスとすることが明示的に否定されたアドレスである。そこで、関連性データベース更新部53は、修正によって削除されたアドレスについて、他の宛先アドレスとの関連性の値を0に近づける。第3の実施形態では、データ32には、修正前アドレステーブル(図22)も含まれる。
<Third Embodiment>
In the communication device 10 according to the third embodiment, when the destination address is corrected, the relevance database update unit 53 updates the relevance database 23 to reflect the content of the correction. The address added by the modification is an address explicitly indicated as a destination address by the user. That is, the address added by the modification is an address that is explicitly indicated by the user to be highly related to other destination addresses and transmission source addresses. Therefore, the relevance database update unit 53 brings the relevance value closer to 1 for the address added by the correction. For example, the relevance database update unit 53 changes the relevance of the added address to an average value of 1 and the relevance value recorded in the relevance database 23. On the other hand, an address deleted by modification is an address that is explicitly denied as a destination address by the user. Therefore, the relevance database update unit 53 brings the value of relevance with other destination addresses closer to 0 for the address deleted by the correction. In the third embodiment, the data 32 also includes a pre-correction address table (FIG. 22).

関連性データベース更新部53は、宛先アドレスが修正されているかを、アドレス修正フラグを確認することにより特定する。アドレス修正フラグが1に設定されている場合、誤送信の判定が開始された後に送信メールの宛先アドレスが修正されていることを示す。一方、アドレス修正フラグが0の場合、送信メールについて誤送信の判定が開始されてから宛先アドレスが修正されていないことを示す。送信確認部15は、アドレスに誤りがあると判定され、ユーザから送信を中止する旨の指示を受け取ったメールについて、そのメールの識別子に対応付けられたアドレス修正フラグの値を1に設定する。さらに、送信確認部15は、アドレス誤り判定部42に、送信を中止したメールの識別子を通知し、その識別子に対応付けられている宛先アドレスを修正前アドレステーブルに格納するように要求する。修正前アドレステーブルの例を図22に示す。修正前アドレステーブルには、送信の中止が指示された送信メールの識別子と宛先アドレスが対応付けて記録される。   The relevance database update unit 53 identifies whether the destination address has been corrected by checking the address correction flag. When the address correction flag is set to 1, it indicates that the destination address of the outgoing mail has been corrected after the erroneous transmission determination is started. On the other hand, when the address correction flag is 0, it indicates that the destination address has not been corrected since the determination of erroneous transmission for the outgoing mail is started. The transmission confirmation unit 15 sets the value of the address correction flag associated with the identifier of the mail to 1 for the mail that has been determined that there is an error in the address and has received an instruction to stop transmission from the user. Further, the transmission confirmation unit 15 notifies the address error determination unit 42 of the identifier of the mail whose transmission has been canceled, and requests the destination address associated with the identifier to be stored in the pre-correction address table. An example of the address table before correction is shown in FIG. In the pre-correction address table, the identifier and destination address of the outgoing mail instructed to stop transmission are recorded in association with each other.

図23は、第3の実施形態に係る関連性データベース更新部53の処理の例を説明する図である。例えば、修正前のメールの宛先アドレスはx1、x2、x3であるとする。一方、修正後の宛先アドレスは、x1、x3、x4であるとする。また、関連性データベース23に記録されているx1〜x4の関連性は、次のとおりであるものとする。
x1とx2の関連性:0.58
x1とx3の関連性:0.75
x1とx4の関連性:0.60
x2とx3の関連性:0.22
x2とx4の関連性:0.03
x3とx4の関連性:0.84
FIG. 23 is a diagram illustrating an example of processing of the relevance database update unit 53 according to the third embodiment. For example, it is assumed that the destination addresses of the mail before correction are x1, x2, and x3. On the other hand, the corrected destination addresses are x1, x3, and x4. In addition, the relevance of x1 to x4 recorded in the relevance database 23 is as follows.
The relationship between x1 and x2: 0.58
The relationship between x1 and x3: 0.75
The relationship between x1 and x4: 0.60
Relationship between x2 and x3: 0.22
Relationship between x2 and x4: 0.03
Relationship between x3 and x4: 0.84

ここで、修正によって追加された宛先アドレスは、x4である。従って、x4は、x1やx3と同じメールを受信する可能性は高い。そこで、関連性データベース更新部53は、図23のNo.3とNo.6に示すように、x4とx1の関連性およびx4とx3の関連性を1に近づける。このとき、関連性データベース更新部53は、関連性データベース23に記録されている関連性と1の平均値を更新後の関連性の値とする。x1とx4の関連性は0.60であることが関連性データベース23に記録されている。そこで、関連性データベース更新部53は、(0.60+1)/2=0.80より、x1とx4の関連性を0.80に変更する。同様に、関連性データベース更新部53は、x3とx4の関連性や、x4と送信元アドレスの間の関連性も更新する。   Here, the destination address added by the modification is x4. Therefore, x4 is highly likely to receive the same mail as x1 and x3. Therefore, the relevance database update unit 53 performs No. 3 in FIG. 3 and no. As shown in FIG. 6, the relationship between x4 and x1 and the relationship between x4 and x3 are brought close to 1. At this time, the relevance database update unit 53 sets the relevance recorded in the relevance database 23 and the average value of 1 as the relevance value after update. It is recorded in the relationship database 23 that the relationship between x1 and x4 is 0.60. Therefore, the relationship database update unit 53 changes the relationship between x1 and x4 to 0.80 from (0.60 + 1) /2=0.80. Similarly, the relationship database update unit 53 also updates the relationship between x3 and x4 and the relationship between x4 and the source address.

一方、修正により削除された宛先アドレスはx2である。従って、x2は、x1やx3と同じメールを受信する可能性は低い。そこで、関連性データベース更新部53は、図23のNo.1とNo.4に示すように、関連性を0に近づける。このとき、関連性データベース更新部53は、関連性データベース23に記録されている関連性と0の平均値を更新後の関連性の値とする。x1とx2の関連性は0.58であることが関連性データベース23に記録されている。そこで、関連性データベース更新部53は、(0.58+0)/2=0.29より、x1とx2の関連性を0.29に変更する。同様に、関連性データベース更新部53は、x2とx3の関連性や、x2と送信元アドレスの間の関連性も更新する。なお、図23を参照しながら述べた計算は、関連性データベース更新部53の動作の例であり、関連性データベース更新部53の行う計算は、実装に応じて変更されることがある。   On the other hand, the destination address deleted by the modification is x2. Therefore, x2 is unlikely to receive the same mail as x1 and x3. Therefore, the relevance database update unit 53 performs No. 3 in FIG. 1 and No. As shown in FIG. 4, the relevance is brought close to 0. At this time, the relevance database update unit 53 sets the relevance recorded in the relevance database 23 and the average value of 0 as the relevance value after update. It is recorded in the relationship database 23 that the relationship between x1 and x2 is 0.58. Therefore, the relationship database update unit 53 changes the relationship between x1 and x2 to 0.29 from (0.58 + 0) /2=0.29. Similarly, the relationship database update unit 53 also updates the relationship between x2 and x3 and the relationship between x2 and the source address. The calculation described with reference to FIG. 23 is an example of the operation of the relevance database update unit 53, and the calculation performed by the relevance database update unit 53 may be changed depending on the implementation.

図24は、第3の実施形態に係る関連性データベース更新部53の動作の例を説明する図である。なお、図24は動作の例を表しており、関連性データベース更新部53の動作は、実装に応じて変更されることがある。例えば、ステップS173、S174の処理をステップS176の後で行われる場合もある。   FIG. 24 is a diagram illustrating an example of the operation of the relevance database update unit 53 according to the third embodiment. FIG. 24 shows an example of the operation, and the operation of the relevance database update unit 53 may be changed depending on the implementation. For example, the processes in steps S173 and S174 may be performed after step S176.

メールが送信されたことが通知されると、関連性データベース更新部53は、送信されたメールの識別子に対応付けられたアドレス修正フラグの値を確認する(ステップS171、S172)。アドレス修正フラグが1である場合、関連性データベース更新部53は修正によって加えられた宛先アドレスを取得する(ステップS172でYes、ステップS173)。次に、関連性データベース更新部53は、修正により追加された宛先アドレスと、送信メールの他の宛先アドレスや送信元アドレスとの間の関連性の値を1に近づける(ステップS174)。さらに、関連性データベース更新部53は、修正により削除された宛先アドレスを取得する(ステップS175)。関連性データベース更新部53は、削除された宛先アドレスについて、送信メールの他の宛先アドレスや送信元アドレスとの間の関連性の値を0に近づける(ステップS176)。   When notified that the mail has been transmitted, the relevance database update unit 53 checks the value of the address correction flag associated with the identifier of the transmitted mail (steps S171 and S172). When the address correction flag is 1, the relevance database update unit 53 acquires the destination address added by the correction (Yes in Step S172, Step S173). Next, the relevance database update unit 53 brings the value of relevance between the destination address added by the modification and the other destination address and source address of the outgoing mail closer to 1 (step S174). Further, the relevance database update unit 53 acquires the destination address deleted by the correction (step S175). The relevance database update unit 53 brings the value of relevance between the other destination address and the transmission source address of the transmitted mail closer to 0 for the deleted destination address (step S176).

一方、アドレス修正フラグが0である場合、関連性データベース更新部53は、送信メールの宛先アドレスと送信元アドレスを取得する(ステップS172でNo、ステップS177)。さらに、関連性データベース更新部53は、取得したアドレスについて、図19を参照しながら説明したように、区分係数を用いて計算した関連性と関連性データベース23に記録されている値に基づいて、関連性データベース23を更新する(ステップS178)。   On the other hand, when the address correction flag is 0, the relevance database update unit 53 acquires the destination address and the transmission source address of the transmission mail (No in step S172, step S177). Further, as described with reference to FIG. 19, the relevance database update unit 53, based on the relevance calculated using the division coefficient and the value recorded in the relevance database 23, as described with reference to FIG. The relevance database 23 is updated (step S178).

図25A〜Dは、第3の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。送信メールが電子メール作成部13から電子メール分割部14に出力されると、送信確認部15は、語句修正フラグとアドレス修正フラグを0に設定する(ステップS201)。ステップS202〜S215は、図20Aを参照しながら説明したステップS102〜S115と同様である。   25A to 25D are flowcharts for explaining an example of a database update method performed in the third embodiment. When the transmission mail is output from the e-mail creation unit 13 to the e-mail division unit 14, the transmission confirmation unit 15 sets the word correction flag and the address correction flag to 0 (step S201). Steps S202 to S215 are the same as steps S102 to S115 described with reference to FIG. 20A.

ステップS215で本文誤りフラグが0である場合の動作を図25Bに示す。図25Bは、メールの本文からは誤送信と判定されず、アドレスの関連性から誤送信の可能性があると判定された場合の動作を表している。ユーザが誤送信であると判断すると、送信確認部15は、メールの送信先アドレスを、メールの識別子と関連付けて修正前アドレステーブルに格納し、アドレス修正フラグを1に設定する(ステップS221でNo、ステップS228、S229)。さらに、送信確認部15は、メールの修正画面を表示する(ステップS230)。メールの修正が行われユーザからの送信指示があると、ステップS202以降の処理が行われる(ステップS231)。ユーザが誤送信ではないと判断した場合のステップS222〜S227の動作は、図20Cを参照しながら説明したステップS142〜S147の動作と同様である。   FIG. 25B shows the operation when the text error flag is 0 in step S215. FIG. 25B shows an operation when it is determined that there is a possibility of erroneous transmission from the relevance of the address without being determined as erroneous transmission from the mail text. If the user determines that the transmission is erroneous, the transmission confirmation unit 15 stores the mail transmission destination address in the pre-correction address table in association with the mail identifier, and sets the address correction flag to 1 (No in step S221). , Steps S228 and S229). Further, the transmission confirmation unit 15 displays a mail correction screen (step S230). When the mail is corrected and there is a transmission instruction from the user, the processing after step S202 is performed (step S231). The operations in steps S222 to S227 when the user determines that there is no erroneous transmission are the same as the operations in steps S142 to S147 described with reference to FIG. 20C.

図25AのステップS215で本文誤りフラグが1である場合の動作を図25Cに示す。図25Cは、メールの本文から誤送信と判定され、アドレスの関連性からも誤送信の可能性があると判定された場合の動作を表している。ユーザが誤送信であると判断すると、送信確認部15は、メールの送信先アドレスを、メールの識別子と関連付けて修正前アドレステーブルに格納し、アドレス修正フラグを1に設定する(ステップS241でNo、ステップS248、S249)。ステップS250〜S253の動作は、図20Dを参照しながら説明したステップS158〜S161と同様である。なお、メールの修正が行われた後でユーザからの送信指示があると、ステップS202以降の処理が行われる(ステップS253)。ユーザが誤送信ではないと判断した場合のステップS242〜S247の動作は、図20Dを参照しながら説明したステップS152〜S157の動作と同様である。   FIG. 25C shows an operation when the text error flag is 1 in step S215 of FIG. 25A. FIG. 25C shows an operation when it is determined that there is a possibility of erroneous transmission from the body of the mail, and it is determined that there is a possibility of erroneous transmission from the relevance of the address. If the user determines that the transmission is wrong, the transmission confirmation unit 15 stores the mail transmission destination address in the pre-correction address table in association with the mail identifier, and sets the address correction flag to 1 (No in step S241). , Steps S248 and S249). The operations in steps S250 to S253 are the same as those in steps S158 to S161 described with reference to FIG. 20D. Note that if there is a transmission instruction from the user after the mail has been corrected, the processing after step S202 is performed (step S253). The operations in steps S242 to S247 when the user determines that there is no erroneous transmission are the same as the operations in steps S152 to S157 described with reference to FIG. 20D.

図25AのステップS207で本文誤りフラグが1である場合の処理を図25Dに示す。ステップS261〜S271の動作は、図20Bを参照しながら説明したステップS121〜131と同様である。ただし、ステップS271でユーザからの送信指示があると、ステップS202以降の処理が行われる。   FIG. 25D shows processing when the text error flag is 1 in step S207 of FIG. 25A. The operations in steps S261 to S271 are the same as those in steps S121 to 131 described with reference to FIG. 20B. However, if there is a transmission instruction from the user in step S271, processing in step S202 and subsequent steps is performed.

このように、第3の実施形態に係る通信装置10は、宛先アドレスの修正が行われた場合、関連性データベース更新部53は、修正の内容を反映してデータベースを修正する。したがって、本実施形態によると、宛先アドレスの判断について、通信装置10の判断結果とユーザとの判断結果のずれを小さくすることができる。   As described above, in the communication device 10 according to the third embodiment, when the destination address is corrected, the relevance database update unit 53 corrects the database by reflecting the content of the correction. Therefore, according to the present embodiment, it is possible to reduce the difference between the determination result of the communication device 10 and the determination result of the user regarding the determination of the destination address.

<第4の実施形態>
メールサーバ、ゲートウェイ装置などが、送信メールについての誤送信の判定や語句データベース21などの更新を実施することもできる。第4の実施形態の場合は、誤送信判定装置90を備える装置は、メールの送信元の通信装置とメールの受信先の通信装置の間で送受信されるメールを中継する。誤送信判定装置90を備える装置は、メールを中継する際に、メールの送信元アドレスと宛先アドレスの関係やメールに含まれている対象語句に基づいて、メールが誤送信である可能性があるかを判定する。
<Fourth Embodiment>
A mail server, a gateway device, or the like can also perform a determination of erroneous transmission of an outgoing mail and update the phrase database 21 or the like. In the case of the fourth embodiment, an apparatus including the erroneous transmission determination apparatus 90 relays mail transmitted and received between a mail transmission source communication apparatus and a mail reception destination communication apparatus. When relaying a mail, the apparatus including the erroneous transmission determination device 90 may cause the mail to be erroneously transmitted based on the relationship between the mail source address and the destination address and the target word / phrase included in the mail. Determine whether.

誤送信判定装置90は、メールサーバ、ゲートウェイ装置などに搭載され、誤送信判定装置90は、第1〜第3の実施形態で説明した誤送信防止方法を実施する。図26は、第4の実施形態に係るネットワークの例を示す。図26(a)に示すネットワーク70は、ユーザ端末91(91a〜91c)、Message Transfer Agent(MTA)92、ゲートウェイ93を備える。図26(a)の例では、MTA92が、誤送信判定装置90を含んでいる。また、図26(b)に示すように、ゲートウェイ93が誤送信判定装置90を含むこともできる。図26(c)には、誤送信判定装置90がインターネット94の誤送信防止サービスサーバ95に搭載されている場合の例を示す。ユーザ端末91(91d〜91f)から送られた送信メールは、誤送信防止サービスサーバ95で処理されることにより、誤送信であるかの判定が行われる。   The erroneous transmission determination device 90 is mounted on a mail server, a gateway device, or the like, and the erroneous transmission determination device 90 implements the erroneous transmission prevention method described in the first to third embodiments. FIG. 26 shows an example of a network according to the fourth embodiment. A network 70 illustrated in FIG. 26A includes user terminals 91 (91a to 91c), a message transfer agent (MTA) 92, and a gateway 93. In the example of FIG. 26A, the MTA 92 includes an erroneous transmission determination device 90. Further, as shown in FIG. 26B, the gateway 93 can include an erroneous transmission determination device 90. FIG. 26C shows an example in which the erroneous transmission determination device 90 is installed in the erroneous transmission prevention service server 95 of the Internet 94. The transmission mail sent from the user terminal 91 (91d to 91f) is processed by the erroneous transmission prevention service server 95 to determine whether it is an erroneous transmission.

図27は、第4の実施形態に係る誤送信判定装置90の例を示す図である。送信判定装置90は、受信部17、送信部12、電子メール分割部14、送信確認部18、タイマ16、記憶部20、判定部40、データベース更新部50を備える。判定部40は、本文誤り判定部41とアドレス誤り判定部42を備える。記憶部20は、語句データベース21、共通語句データベース22、関連性データベース23、辞書データ31、データ34、プログラム33を備える。データベース更新部50は、語句データベース更新部51、共通語句データベース更新部52、および、関連性データベース更新部53を備える。電子メール分割部14、タイマ16、判定部40、データベース更新部50の動作は、第1〜第3の実施形態のいずれかと同様である。また、語句データベース21、共通語句データベース22、関連性データベース23、辞書データ31、プログラム33も第1〜第3の実施形態のいずれかと同様である。   FIG. 27 is a diagram illustrating an example of the erroneous transmission determination device 90 according to the fourth embodiment. The transmission determination device 90 includes a reception unit 17, a transmission unit 12, an email division unit 14, a transmission confirmation unit 18, a timer 16, a storage unit 20, a determination unit 40, and a database update unit 50. The determination unit 40 includes a text error determination unit 41 and an address error determination unit 42. The storage unit 20 includes a phrase database 21, a common phrase database 22, a relevance database 23, dictionary data 31, data 34, and a program 33. The database update unit 50 includes a phrase database update unit 51, a common phrase database update unit 52, and a relevance database update unit 53. The operations of the e-mail dividing unit 14, the timer 16, the determining unit 40, and the database updating unit 50 are the same as those in any of the first to third embodiments. Further, the phrase database 21, the common phrase database 22, the relevance database 23, the dictionary data 31, and the program 33 are the same as in any of the first to third embodiments.

誤送信判定装置90では送信メールが作成されないので、誤送信判定装置90は、受信部17を介して受信した電子メールに基づいて、誤送信の判定やデータベースの更新を行う。誤送信判定装置90は、データ34にアドレス情報を記憶している。アドレス情報は、誤送信判定装置90が誤送信の判定を行う対象となる送信元メールアドレスである。受信部17は、データ34を参照して、誤送信判定装置90が搭載されているメールサーバ等で受信されたメールのうち、アドレス情報に記録されているアドレスが送信元アドレスか宛先アドレスであるメールを取得する。アドレス情報に記録されているアドレスが送信元アドレスであるメールは、第1〜第3の実施形態での送信メールと同様に用いられる。すなわち、誤送信判定装置90は、アドレス情報に記録されているアドレスが送信元アドレスであるメールについて誤送信の判定を行い、判定結果に基づいてメールの送信後のデータベースの更新を行う。一方、宛先アドレスにアドレス情報に記録されているアドレスが含まれているメールについて、誤送信判定装置90は、第1〜第3の実施形態での受信メールと同様の処理を行う。すなわち、宛先アドレスにアドレス情報に記録されているアドレスが含まれているメールについては誤送信の判定を行わずに、データベースの更新に使用する。   Since the transmission error mail is not created in the erroneous transmission determination device 90, the erroneous transmission determination device 90 determines the erroneous transmission and updates the database based on the email received via the receiving unit 17. The erroneous transmission determination device 90 stores address information in the data 34. The address information is a source mail address that is a target for which the erroneous transmission determination device 90 determines the erroneous transmission. The receiving unit 17 refers to the data 34, and among the mails received by the mail server or the like on which the erroneous transmission determination device 90 is mounted, the address recorded in the address information is the source address or the destination address. Get mail. Mail whose address recorded in the address information is a transmission source address is used in the same manner as the transmission mail in the first to third embodiments. That is, the erroneous transmission determination device 90 determines erroneous transmission for a mail whose address recorded in the address information is a transmission source address, and updates the database after the mail is transmitted based on the determination result. On the other hand, for a mail in which the address recorded in the address information is included in the destination address, the erroneous transmission determination device 90 performs the same processing as the received mail in the first to third embodiments. In other words, a mail whose address information includes the address recorded in the address information is used for updating the database without determining erroneous transmission.

送信確認部18は、送信メールが誤送信であるかを本文誤り判定部41とアドレス誤り判定部42の判定結果に基づいて判定し、得られた結果を送信者に通知する。図28は、送信メールが誤送信であると判定された場合のユーザへの通知方法の例を説明するフローチャートである。送信確認部18は、誤送信と判定されたメールについて、誤送信の可能性があることと、誤送信と判定した理由を記述した通知メールを作成し、送信部12を介して、判定対象となったメールの送信元アドレスに送信する(ステップS281)。なお、ここで、送信確認部18は、誤送信と判定した電子メールを識別する識別子を付し、その識別子を、通知メールに含めるものとする。送信確認部18は、通知メールを送信してからタイマ16がタイムアップするまで待機する。ユーザ端末91に通知メールが届くと、ユーザにより誤送信かの判断が行われる。その後、ユーザの判断に基づいてユーザ端末91から、メールの送信を指示するメッセージか、送信を中止する旨を通知するメッセージが誤送信判定装置90を含む装置に送信される。ここで、これらのメッセージには、誤送信と判定されたメールを特定するための識別子が含まれているものとする。   The transmission confirmation unit 18 determines whether the transmitted mail is erroneous transmission based on the determination results of the text error determination unit 41 and the address error determination unit 42 and notifies the sender of the obtained result. FIG. 28 is a flowchart for explaining an example of a notification method to the user when it is determined that the transmitted mail is erroneous transmission. The transmission confirmation unit 18 creates a notification email describing the possibility of erroneous transmission and the reason for determining erroneous transmission for the email determined to be erroneous transmission. It transmits to the transmission source address of the received mail (step S281). Here, the transmission confirmation unit 18 attaches an identifier for identifying an electronic mail determined to be erroneous transmission, and includes the identifier in the notification mail. The transmission confirmation unit 18 waits until the timer 16 times out after transmitting the notification mail. When the notification mail arrives at the user terminal 91, the user determines whether it is an erroneous transmission. Thereafter, based on the user's judgment, a message instructing the transmission of mail or a message notifying that the transmission is to be stopped is transmitted from the user terminal 91 to a device including the erroneous transmission determination device 90. Here, it is assumed that these messages include an identifier for identifying the mail determined to be erroneous transmission.

送信確認部18は、識別子を用いて、ユーザ端末91から通知メールに対する返信のメッセージを受信したかを確認する(ステップS282)。送信確認部18は、返信のメッセージを受信すると、ユーザの判断を確認する(ステップS285)。ユーザからのメッセージが送信を中止することを通知している場合、送信確認部18は、本文誤り判定部41とアドレス誤り判定部42に送信の中止を通知する。本文誤り判定部41は、判定対象のメールに含まれていた対象語句、宛先アドレス、送信元アドレス等を修正前語句テーブルに記録する。同様に、アドレス誤り判定部42は、判定対象のメールに含まれていた宛先アドレス、宛先アドレスの種類、送信元アドレス等を修正前アドレステーブルに記録する。また、送信確認部18は、本文誤り判定部41が誤送信の可能性があると判定している場合は、語句修正フラグを1に設定する。また、アドレス誤り判定部42が誤送信の可能性があると判定している場合は、アドレス修正フラグを1に設定する。(ステップS286)。ユーザは、送信が中止されたメールの識別子に対応づけて、修正後のメールを、誤送信判定装置90を含む装置に送信する。修正後のメールが誤送信と判定されない場合や、ユーザからの送信指示に基づいて送信される場合、メールの送信後に行われるデータベースの更新では、修正前語句テーブルや修正前アドレステーブルが用いられる。データベースの更新方法は、第1〜第3の実施形態で説明した方法と同様である。   The transmission confirmation unit 18 confirms whether a reply message to the notification mail is received from the user terminal 91 using the identifier (step S282). When receiving the reply message, the transmission confirmation unit 18 confirms the user's judgment (step S285). When the message from the user notifies that the transmission is to be stopped, the transmission confirmation unit 18 notifies the body error determination unit 41 and the address error determination unit 42 of the transmission stop. The text error determination unit 41 records the target word / phrase, destination address, source address, etc. included in the mail to be determined in the pre-correction word / phrase table. Similarly, the address error determination unit 42 records the destination address, the destination address type, the source address, and the like included in the determination target mail in the pre-correction address table. The transmission confirmation unit 18 sets the phrase correction flag to 1 when the text error determination unit 41 determines that there is a possibility of erroneous transmission. If the address error determination unit 42 determines that there is a possibility of erroneous transmission, the address correction flag is set to 1. (Step S286). The user transmits the corrected mail to a device including the erroneous transmission determination device 90 in association with the identifier of the mail whose transmission has been canceled. When the mail after correction is not determined to be erroneous transmission, or when the mail is transmitted based on a transmission instruction from the user, the pre-correction word / phrase table or the pre-correction address table is used in updating the database after the mail is transmitted. The database update method is the same as the method described in the first to third embodiments.

一方、ユーザからメールを送信する旨のメッセージを受信した場合、誤送信判定装置90は、判定対象のメールを宛先アドレスに向けて送信する(ステップS287)。また、第1〜第3の実施形態で説明したように、データベースの更新が行われる。   On the other hand, when a message indicating that a mail is transmitted from the user is received, the erroneous transmission determination device 90 transmits the determination target mail toward the destination address (step S287). In addition, as described in the first to third embodiments, the database is updated.

タイマ16がタイムアウトする前に誤送信判定装置90がユーザからの指示を含むメッセージを受信しない場合、送信確認部18は、ユーザが電子メールの送信を中止したとみなす。そこで、送信確認部18は、送信部12を介して、対象電子メールの送信を中止したことを通知するメールを、送信元アドレスに向けて送信する(ステップS283)。また、このとき、判定対象となった送信メールを送信元アドレスに送信する。その後、送信確認部18は、本文誤り判定部41とアドレス誤り判定部42に、判定対象の電子メールについて記憶している対象語句、宛先アドレス、宛先アドレスの種類、送信元アドレスなどのデータと、判定結果を破棄するように要求する(ステップS284)。その結果、誤送信判定装置90は、対象の電子メールの送信や対象電子メールに基づくデータベースの更新を行わない。   If the erroneous transmission determination device 90 does not receive a message including an instruction from the user before the timer 16 times out, the transmission confirmation unit 18 considers that the user has stopped sending the email. Therefore, the transmission confirmation unit 18 transmits a mail notifying that the transmission of the target electronic mail is stopped to the transmission source address via the transmission unit 12 (step S283). Further, at this time, the transmission mail to be determined is transmitted to the transmission source address. Thereafter, the transmission confirmation unit 18 causes the text error determination unit 41 and the address error determination unit 42 to store data such as a target word / phrase, destination address, destination address type, and source address stored for the determination target electronic mail, A request is made to discard the determination result (step S284). As a result, the erroneous transmission determination device 90 does not transmit the target email or update the database based on the target email.

このように、本実施形態によると、メールサーバなどが、送信メールについての誤送信の判定などを実施することもできるため、メールサーバなどに誤送信判定装置90を搭載することにより、誤送信の判定を行うことができる。従って、ユーザ端末91に改変を加えることなく、電子メールの誤送信判定を行うことができ、第1〜第3の実施形態に比べて、システムの導入が容易である。   As described above, according to the present embodiment, since the mail server or the like can also determine the erroneous transmission of the outgoing mail, by installing the erroneous transmission determination device 90 in the mail server or the like, Judgment can be made. Therefore, it is possible to determine erroneous transmission of an email without modifying the user terminal 91, and the introduction of the system is easier than in the first to third embodiments.

<その他>
なお、実施形態は上記に限られるものではなく、様々に変形可能である。以下にその例をいくつか述べる。
<Others>
The embodiment is not limited to the above, and can be variously modified. Some examples are described below.

例えば、語句データベース更新部51は、一定期間以上使われていない対象語句のランクを0に近づけるように変形される場合がある。例えば、語句データベース更新部51は、語句データベース21に含まれている語句とアドレスアドレスの組合せの各々について、最終更新日を確認する。語句データベース更新部51は、最終更新日から一定の期間以上、登録されたアドレスの間で対応付けられた語句が使用されていない場合、その語句について、語句データベース21に記録されたランクを1ずつ0に近づくように修正する。すなわち、語句データベース更新部51は、ランクの値が正の値であれば、ランクの値を1つ小さくし、ランクの値が負であれば、ランクの値を1だけ大きくする。   For example, the phrase database update unit 51 may be modified so that the rank of the target phrase that has not been used for a certain period of time approaches 0. For example, the phrase database update unit 51 confirms the last update date for each combination of a phrase and an address address included in the phrase database 21. The phrase database update unit 51 determines the ranks recorded in the phrase database 21 one by one when the phrase associated with the registered addresses is not used for a certain period from the last update date. Modify to approach 0. That is, the phrase database update unit 51 decreases the rank value by 1 if the rank value is positive, and increases the rank value by 1 if the rank value is negative.

ここで、一定の期間を語句ごとに決定することもできる。例えば、語句データベース更新部51は、ユーザAとユーザBのメールアドレスに対応付けて記憶されている対象語句aについて、ランクの値が更新された履歴を参照して、ランクの値の更新が行われる周期(更新周期)を求めることができる。語句データベース更新部51は、求めた更新周期よりも長い時間にわたってランクが更新されていない場合、語句データベース更新部51は、対象語句aのランクの値を1だけ0に近づくように変更する。その後、語句データベース更新部51は、更新周期ごとに対象語句aのランクが更新されているかを確認し、対象語句aのランクが更新されていない期間が更新周期よりも長くなると、対象語句aのランクを1だけ0に近づける。   Here, a certain period can be determined for each phrase. For example, the phrase database update unit 51 updates the rank value with reference to the history in which the rank value is updated for the target phrase a stored in association with the email addresses of the user A and the user B. Period (update period) can be obtained. If the rank has not been updated for a longer time than the obtained update cycle, the phrase database update unit 51 changes the rank value of the target phrase a so as to approach 0 by 1. Thereafter, the phrase database update unit 51 confirms whether the rank of the target phrase a is updated every update cycle. If the period during which the rank of the target phrase a is not updated is longer than the update period, Move the rank closer to 0 by 1.

このように変形することにより、過去に頻繁に使用された語句が使用されなくなった場合に、語句データベース更新部51は、使用される語句の変遷を反映して語句データベース21を更新することができる。   By changing in this way, when a phrase frequently used in the past is no longer used, the phrase database update unit 51 can update the phrase database 21 to reflect the transition of the phrase used. .

また、共通語句データベース22をオペレータなどが予め決定しておいて、記憶部20に読み込むことができる。この場合は、共通語句データベース22は固定されているので、通信装置10もしくは誤送信判定装置90は、共通語句データベース更新部52を備えない。   Further, the common word / phrase database 22 can be determined in advance by an operator or the like and read into the storage unit 20. In this case, since the common phrase database 22 is fixed, the communication device 10 or the erroneous transmission determination device 90 does not include the common phrase database update unit 52.

アドレス誤り判定部42は、署名が類似しているかを判定する際に、2つのアドレスに共通している語句の数が2つのアドレスに関連付けて登録されている対象語句の総数に占める割合を用いることもできる。例えば、2つのアドレスに共通する語句の数をXcomとする。また、一方のアドレスに関連付けて登録されている対象語句の数をX1、他方のアドレスに関連付けて登録されている対象語句の数をX2とする。アドレス誤り判定部42は、次式から類似度Sを算出する。
S=2×Xcom/(X1+X2)
アドレス誤り判定部42は、類似度Sの値を類似閾値と比較する。類似度Sが類似閾値以上の場合、署名が類似していると判定する。一方、類似度Sが類似閾値未満の場合、署名が類似していないと判定する。判定後のアドレス誤り判定部42の動作は、第1〜第4の実施形態と同様である。
When determining whether the signatures are similar, the address error determination unit 42 uses the ratio of the number of words / phrases common to the two addresses to the total number of target words / phrases registered in association with the two addresses. You can also. For example, let Xcom be the number of words common to two addresses. Further, the number of target words / phrases registered in association with one address is X1, and the number of target words / phrases registered in association with the other address is X2. The address error determination unit 42 calculates the similarity S from the following equation.
S = 2 × Xcom / (X1 + X2)
The address error determination unit 42 compares the value of the similarity S with a similarity threshold. If the similarity S is equal to or greater than the similarity threshold, it is determined that the signatures are similar. On the other hand, when the similarity S is less than the similarity threshold, it is determined that the signatures are not similar. The operation of the address error determination unit 42 after the determination is the same as in the first to fourth embodiments.

上述の第1〜第4実施形態を含む各実施形態に対し、さらに以下の付記を開示する。
(付記1)
送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けて前記語句データベースに記憶されている前記出現頻度を第1の閾値と比較し、前記出現頻度が前記第1の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第1の閾値よりも大きい対象語句の数の前記総数に対する割合が第2の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する
処理をコンピュータに実行させることを特徴とする判定プログラム。
(付記2)
誤送信の可能性があると判定された第1の対象電子メールから抽出された対象語句を、前記第1の対象電子メールの宛先アドレスである第1のアドレスと、前記第1の対象電子メールの送信元アドレスである第2のアドレスとに対応付けて、修正前語句テーブルに記憶し、
前記第1の対象電子メールを修正して作成された第2の対象電子メールの送信が誤送信と判定されていない場合、
前記第2の対象電子メールから抽出された対象語句のうちで、前記修正前語句テーブルに記憶されている対象語句の出現頻度を大きくし、
前記第2の対象電子メールから抽出された対象語句ではなく、前記修正前語句テーブルに記憶されている対象語句の出現頻度を小さくする
処理を前記コンピュータにさらに実行させることを特徴とする付記1に記載の判定プログラム。
(付記3)
第1の対象語句を含むメールが前記第1のアドレスで送信もしくは受信された時刻の履歴から、前記第1の対象語句の前記第1のアドレスに対応付けられた出現頻度が更新された後で、再度前記第1の対象語句の前記第1のアドレスに対応付けられた出現頻度が更新されるまでにかかる時間を表す更新周期を算出し、
前記第1の対象語句の出現頻度が最後に更新された時刻から前記更新周期が経過しても、前記第1の対象語句が含まれているメールが前記第1のアドレスで送信もしくは受信されていない場合、前記第1の対象語句の前記第1のアドレスに対応付けられた出現頻度を小さくする
処理を前記コンピュータにさらに実行させことを特徴とする付記2に記載の判定プログラム。
(付記4)
第1の宛先と第2の宛先とに同一の電子メールが送信される可能性を表す関連係数を、関連データベースに記憶し、
前記第1の宛先に送信される対象電子メールが前記第2の宛先にも送信される場合、前記関連係数が関連閾値以上であるかを確認し、
前記関連係数が前記関連閾値未満の場合、前記対象電子メールの送信は誤送信であると判定する
処理を前記コンピュータにさらに実行させることを特徴とする付記1〜3のいずれかに記載の判定プログラム。
(付記5)
前記第1および第2の宛先を含む第1の対象電子メールの送信が誤送信と判定されると、前記第1の対象電子メールの宛先を修正前アドレステーブルに記憶し、
前記第1の対象電子メールを修正して作成された第2の対象電子メールの送信が誤送信と判定されていない場合、前記修正前アドレステーブルに記録されている前記第1の対象電子メールの宛先と、第2の対象電子メールの宛先を比較し、
前記修正前アドレステーブルに記録され、かつ、前記第2の対象電子メールの宛先に含まれていない宛先と、前記修正前アドレステーブルと前記第2の対象電子メールに共通する宛先との間の関連係数を小さくする
処理を前記コンピュータにさらに実行させることを特徴とする付記4に記載の判定プログラム。
(付記6)
前記第2の対象電子メールの宛先に含まれ、かつ、前記修正前アドレステーブルに記録されていない宛先と、前記修正前アドレステーブルと前記第2の対象電子メールに共通する宛先との間の関連係数を大きくする
処理を前記コンピュータにさらに実行させることを特徴とする付記5に記載の判定プログラム。
(付記7)
前記コンピュータに、前記語句に対応付けられている宛先アドレスの数と送信元アドレスの数の合計が第3の閾値より大きい場合、前記語句を前記共通語句データベースに記憶する
処理をさらに実行させることを特徴とする付記1〜6のいずれかに記載の判定プログラム。
(付記8)
送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けられている前記出現頻度を第1の閾値と比較し、前記出現頻度が前記第1の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第1の閾値よりも大きい対象語句の数の前記総数に対する割合が第2の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する
処理をコンピュータが実行することを特徴とする判定方法。
(付記9)
送信または受信された電子メールに含まれている語句の出現頻度を、前記語句が含まれているメールの宛先アドレスおよび送信元アドレスと対応付けて記憶する語句データベースと、
複数の電子メールに共通して用いられる語句を記録する共通語句データベースと、
送信される対象電子メールに含まれている語句から前記共通語句データベースに含まれる語句を除いて得られた対象語句を抽出し、
前記対象語句の総数を取得し、
前記対象電子メールの宛先アドレスおよび前記対象電子メールの送信元アドレスと対応付けられている前記出現頻度が第1の閾値よりも大きい対象語句の数を取得すると共に、
前記出現頻度が前記第1の閾値よりも大きい対象語句の数の前記総数に対する割合が第2の閾値未満の場合に、前記対象電子メールは誤送信される可能性があると判定する判定部
を備えることを特徴とする通信装置。
The following additional notes are further disclosed for each of the embodiments including the first to fourth embodiments described above.
(Appendix 1)
The frequency of appearance of words included in the transmitted or received e-mail is stored in the word database in association with the destination address and the source address of the e-mail,
Extracting target words / phrases that are not included in a common word / phrase database that records words / phrases commonly used in a plurality of e-mails from words / words included in the target e-mail to be transmitted, and Get the total number of words,
For each of the target words / phrases, the appearance frequency stored in the word / phrase database in association with the destination address of the target electronic mail is compared with a first threshold value, and the appearance frequency is greater than the first threshold value. Get the number of target words,
Causing the computer to execute a process of determining that the transmission of the target e-mail is an erroneous transmission when the ratio of the number of target words / phrases having an appearance frequency greater than the first threshold to the total is less than a second threshold. A judgment program characterized by
(Appendix 2)
The target word / phrase extracted from the first target electronic mail that has been determined to have a possibility of erroneous transmission is converted into a first address that is a destination address of the first target electronic mail and the first target electronic mail. In association with the second address which is the source address of
When the transmission of the second target email created by correcting the first target email is not determined to be erroneous transmission,
Among the target words extracted from the second target e-mail, increase the appearance frequency of the target words stored in the pre-correction word table,
The supplementary note 1 further causes the computer to execute a process of reducing the appearance frequency of the target phrase stored in the pre-correction phrase table instead of the target phrase extracted from the second target e-mail. The determination program described.
(Appendix 3)
After the appearance frequency associated with the first address of the first target word / phrase is updated from the history of the time when the mail including the first target word / phrase is transmitted or received at the first address , Again calculating an update cycle representing the time taken for the appearance frequency associated with the first address of the first target phrase to be updated,
Even if the update period has elapsed since the time when the appearance frequency of the first target word / phrase was last updated, a mail including the first target word / phrase is transmitted or received at the first address. 3. The determination program according to appendix 2, further comprising: causing the computer to further execute a process of reducing an appearance frequency associated with the first address of the first target word / phrase when there is not.
(Appendix 4)
Storing in the related database a related coefficient representing the likelihood that the same email will be sent to the first and second destinations;
If the target email sent to the first destination is also sent to the second destination, check whether the related coefficient is greater than or equal to a related threshold;
The determination program according to any one of appendices 1 to 3, further comprising: causing the computer to further execute a process of determining that the transmission of the target electronic mail is an erroneous transmission when the related coefficient is less than the related threshold value. .
(Appendix 5)
When the transmission of the first target electronic mail including the first and second destinations is determined to be erroneous transmission, the destination of the first target electronic mail is stored in the pre-correction address table;
When the transmission of the second target email created by correcting the first target email is not determined to be erroneous transmission, the first target email recorded in the pre-correction address table Compare the destination with the destination of the second target email,
A relationship between a destination recorded in the pre-correction address table and not included in the destination of the second target e-mail, and a destination common to the pre-correction address table and the second target e-mail The determination program according to appendix 4, further causing the computer to further execute a process of reducing a coefficient.
(Appendix 6)
A destination included in the destination of the second target e-mail and not recorded in the pre-correction address table, and an association between the pre-correction address table and a destination common to the second target e-mail The determination program according to appendix 5, further causing the computer to further execute a process of increasing a coefficient.
(Appendix 7)
Causing the computer to further execute a process of storing the phrase in the common phrase database when the sum of the number of destination addresses and the number of source addresses associated with the phrase is greater than a third threshold value. The determination program according to any one of appendices 1 to 6, which is characterized.
(Appendix 8)
The frequency of appearance of words included in the transmitted or received e-mail is stored in the word database in association with the destination address and the source address of the e-mail,
Extracting target words / phrases that are not included in a common word / phrase database that records words / phrases commonly used in a plurality of e-mails from words / words included in the target e-mail to be transmitted, and Get the total number of words,
For each of the target words and phrases, the appearance frequency associated with the destination address of the target electronic mail is compared with a first threshold value, and the number of target words and phrases whose appearance frequency is greater than the first threshold value is obtained. And
When the ratio of the number of target words whose appearance frequency is greater than the first threshold to the total number is less than a second threshold, the computer executes a process of determining that the transmission of the target email is an erroneous transmission The determination method characterized by.
(Appendix 9)
A word / phrase database that stores the frequency of occurrence of words / phrases included in transmitted or received e-mails in association with the destination address and source address of the mail containing the words / phrases;
A common phrase database that records phrases commonly used in multiple emails;
Extracting a target phrase obtained by excluding a phrase included in the common phrase database from a phrase included in a target e-mail to be transmitted;
Get the total number of the target words,
Obtaining the number of target phrases whose appearance frequency associated with the destination address of the target email and the source address of the target email is greater than a first threshold;
A determination unit that determines that the target e-mail may be erroneously transmitted when the ratio of the number of target words whose appearance frequency is greater than the first threshold to the total number is less than a second threshold; A communication device comprising:

10 通信装置
11、17 受信部
12 送信部
13 電子メール作成部
14 電子メール分割部
15、18 送信確認部
16 タイマ
20 記憶部
21 語句データベース
22 共通語句データベース
23 関連性データベース
31 辞書データ
32、34 データ
40 判定部
41 本文誤り判定部
42 アドレス誤り判定部
50 データベース更新部
51 語句データベース更新部
52 共通語句データベース更新部
53 関連性データベース更新部
61 CPU
62 メモリ
63 入力装置
64 出力装置
65 外部記憶装置
66 媒体駆動装置
67 可搬記憶媒体
68 ネットワーク接続装置
70 ネットワーク
81 アドレス
82 本文
90 誤送信判定装置
91 ユーザ端末
92 MTA
93 ゲートウェイ
94 インターネット
95 誤送信防止サービスサーバ
DESCRIPTION OF SYMBOLS 10 Communication apparatus 11, 17 Reception part 12 Transmission part 13 E-mail preparation part 14 E-mail division part 15, 18 Transmission confirmation part 16 Timer 20 Storage part 21 Phrase database 22 Common phrase database 23 Relevance database 31 Dictionary data 32, 34 data 40 Judgment Unit 41 Text Error Judgment Unit 42 Address Error Judgment Unit 50 Database Update Unit 51 Phrase Database Update Unit 52 Common Phrase Database Update Unit 53 Relevance Database Update Unit 61 CPU
62 Memory 63 Input device 64 Output device 65 External storage device 66 Medium drive device 67 Portable storage medium 68 Network connection device 70 Network 81 Address 82 Body 90 Error transmission judgment device 91 User terminal 92 MTA
93 Gateway 94 Internet 95 Mistransmission Prevention Service Server

Claims (6)

送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けて前記語句データベースに記憶されている前記出現頻度を第1の閾値と比較し、前記出現頻度が前記第1の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第1の閾値よりも大きい対象語句の数の前記総数に対する割合が第2の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する
処理をコンピュータに実行させることを特徴とする判定プログラム。
The frequency of appearance of words included in the transmitted or received e-mail is stored in the word database in association with the destination address and the source address of the e-mail,
Extracting target words / phrases that are not included in a common word / phrase database that records words / phrases commonly used in a plurality of e-mails from words / words included in the target e-mail to be transmitted, and Get the total number of words,
For each of the target words / phrases, the appearance frequency stored in the word / phrase database in association with the destination address of the target electronic mail is compared with a first threshold value, and the appearance frequency is greater than the first threshold value. Get the number of target words,
Causing the computer to execute a process of determining that the transmission of the target e-mail is an erroneous transmission when the ratio of the number of target words / phrases having an appearance frequency greater than the first threshold to the total is less than a second threshold. A judgment program characterized by
誤送信の可能性があると判定された第1の対象電子メールから抽出された対象語句を、前記第1の対象電子メールの宛先アドレスである第1のアドレスと、前記第1の対象電子メールの送信元アドレスである第2のアドレスとに対応付けて、修正前語句テーブルに記憶し、
前記第1の対象電子メールを修正して作成された第2の対象電子メールの送信が誤送信と判定されていない場合、
前記第2の対象電子メールから抽出された対象語句のうちで、前記修正前語句テーブルに記憶されている対象語句の出現頻度を大きくし、
前記第2の対象電子メールから抽出された対象語句ではなく、前記修正前語句テーブルに記憶されている対象語句の出現頻度を小さくする
処理を前記コンピュータにさらに実行させることを特徴とする請求項1に記載の判定プログラム。
The target word / phrase extracted from the first target electronic mail that has been determined to have a possibility of erroneous transmission is converted into a first address that is a destination address of the first target electronic mail and the first target electronic mail. In association with the second address which is the source address of
When the transmission of the second target email created by correcting the first target email is not determined to be erroneous transmission,
Among the target words extracted from the second target e-mail, increase the appearance frequency of the target words stored in the pre-correction word table,
2. The computer further causes the computer to further execute a process of reducing an appearance frequency of a target word / phrase stored in the pre-correction word / phrase table instead of the target word / phrase extracted from the second target electronic mail. Judgment program described in 1.
第1の宛先と第2の宛先とに同一の電子メールが送信される可能性を表す関連係数を、関連データベースに記憶し、
前記第1の宛先に送信される対象電子メールが前記第2の宛先にも送信される場合、前記関連係数が関連閾値以上であるかを確認し、
前記関連係数が前記関連閾値未満の場合、前記対象電子メールの送信は誤送信であると判定する
処理を前記コンピュータにさらに実行させることを特徴とする請求項1もしくは2に記載の判定プログラム。
Storing in the related database a related coefficient representing the likelihood that the same email will be sent to the first and second destinations;
If the target email sent to the first destination is also sent to the second destination, check whether the related coefficient is greater than or equal to a related threshold;
The determination program according to claim 1 or 2, further comprising: causing the computer to further execute a process of determining that the transmission of the target electronic mail is an erroneous transmission when the related coefficient is less than the related threshold value.
前記第1および第2の宛先を含む第1の対象電子メールの送信が誤送信と判定されると、前記第1の対象電子メールの宛先を修正前アドレステーブルに記憶し、
前記第1の対象電子メールを修正して作成された第2の対象電子メールの送信が誤送信と判定されていない場合、前記修正前アドレステーブルに記録されている前記第1の対象電子メールの宛先と、第2の対象電子メールの宛先を比較し、
前記修正前アドレステーブルに記録され、かつ、前記第2の対象電子メールの宛先に含まれていない宛先と、前記修正前アドレステーブルと前記第2の対象電子メールに共通する宛先との間の関連係数を小さくする
処理を前記コンピュータにさらに実行させることを特徴とする請求項3に記載の判定プログラム。
When the transmission of the first target electronic mail including the first and second destinations is determined to be erroneous transmission, the destination of the first target electronic mail is stored in the pre-correction address table;
When the transmission of the second target email created by correcting the first target email is not determined to be erroneous transmission, the first target email recorded in the pre-correction address table Compare the destination with the destination of the second target email,
A relationship between a destination recorded in the pre-correction address table and not included in the destination of the second target e-mail, and a destination common to the pre-correction address table and the second target e-mail The determination program according to claim 3, further causing the computer to execute a process of reducing a coefficient.
送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けられている前記出現頻度を第1の閾値と比較し、前記出現頻度が前記第1の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第1の閾値よりも大きい対象語句の数の前記総数に対する割合が第2の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する
処理をコンピュータが実行することを特徴とする判定方法。
The frequency of appearance of words included in the transmitted or received e-mail is stored in the word database in association with the destination address and the source address of the e-mail,
Extracting target words / phrases that are not included in a common word / phrase database that records words / phrases commonly used in a plurality of e-mails from words / words included in the target e-mail to be transmitted, and Get the total number of words,
For each of the target words and phrases, the appearance frequency associated with the destination address of the target electronic mail is compared with a first threshold value, and the number of target words and phrases whose appearance frequency is greater than the first threshold value is obtained. And
When the ratio of the number of target words whose appearance frequency is greater than the first threshold to the total number is less than a second threshold, the computer executes a process of determining that the transmission of the target email is an erroneous transmission The determination method characterized by.
送信または受信された電子メールに含まれている語句の出現頻度を、前記語句が含まれているメールの宛先アドレスおよび送信元アドレスと対応付けて記憶する語句データベースと、
複数の電子メールに共通して用いられる語句を記録する共通語句データベースと、
送信される対象電子メールに含まれている語句から前記共通語句データベースに含まれる語句を除いて得られた対象語句を抽出し、
前記対象語句の総数を取得し、
前記対象電子メールの宛先アドレスおよび前記対象電子メールの送信元アドレスと対応付けられている前記出現頻度が第1の閾値よりも大きい対象語句の数を取得すると共に、
前記出現頻度が前記第1の閾値よりも大きい対象語句の数の前記総数に対する割合が第2の閾値未満の場合に、前記対象電子メールは誤送信される可能性があると判定する判定部
を備えることを特徴とする通信装置。
A word / phrase database that stores the frequency of occurrence of words / phrases included in transmitted or received e-mails in association with the destination address and source address of the mail containing the words / phrases;
A common phrase database that records phrases commonly used in multiple emails;
Extracting a target phrase obtained by excluding a phrase included in the common phrase database from a phrase included in a target e-mail to be transmitted;
Get the total number of the target words,
Obtaining the number of target phrases whose appearance frequency associated with the destination address of the target email and the source address of the target email is greater than a first threshold;
A determination unit that determines that the target e-mail may be erroneously transmitted when the ratio of the number of target words whose appearance frequency is greater than the first threshold to the total number is less than a second threshold; A communication device comprising:
JP2010283343A 2010-12-20 2010-12-20 E-mail erroneous transmission determination method, determination program, and communication device Expired - Fee Related JP5584608B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010283343A JP5584608B2 (en) 2010-12-20 2010-12-20 E-mail erroneous transmission determination method, determination program, and communication device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010283343A JP5584608B2 (en) 2010-12-20 2010-12-20 E-mail erroneous transmission determination method, determination program, and communication device

Publications (2)

Publication Number Publication Date
JP2012133474A true JP2012133474A (en) 2012-07-12
JP5584608B2 JP5584608B2 (en) 2014-09-03

Family

ID=46649023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010283343A Expired - Fee Related JP5584608B2 (en) 2010-12-20 2010-12-20 E-mail erroneous transmission determination method, determination program, and communication device

Country Status (1)

Country Link
JP (1) JP5584608B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101351A (en) * 2016-12-21 2018-06-28 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method, and program
JP2018110322A (en) * 2017-01-04 2018-07-12 株式会社日立ソリューションズ Adjustment program and adjusting unit
JP2019125062A (en) * 2018-01-12 2019-07-25 カシオ計算機株式会社 Programming support device, programming support method and program
CN110430118A (en) * 2019-06-19 2019-11-08 平安银行股份有限公司 Bill mail management method, apparatus, computer equipment and computer readable storage medium
JP2020154965A (en) * 2019-03-22 2020-09-24 Nttテクノクロス株式会社 Information processing apparatus, information processing method, and program
JP2022031421A (en) * 2019-03-22 2022-02-18 Nttテクノクロス株式会社 Information processor, method for processing information, and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1131109A (en) * 1997-07-10 1999-02-02 Fuji Xerox Co Ltd Electronic mail transmission controller
JP2008123318A (en) * 2006-11-14 2008-05-29 Sony Ericsson Mobilecommunications Japan Inc Communication terminal, and destination right/wrong determining method and program thereof
JP2009271797A (en) * 2008-05-08 2009-11-19 Nomura Research Institute Ltd Noise removing system for document data
JP2010271811A (en) * 2009-05-20 2010-12-02 Panasonic Corp E-mail erroneous transmission prevention device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1131109A (en) * 1997-07-10 1999-02-02 Fuji Xerox Co Ltd Electronic mail transmission controller
JP2008123318A (en) * 2006-11-14 2008-05-29 Sony Ericsson Mobilecommunications Japan Inc Communication terminal, and destination right/wrong determining method and program thereof
JP2009271797A (en) * 2008-05-08 2009-11-19 Nomura Research Institute Ltd Noise removing system for document data
JP2010271811A (en) * 2009-05-20 2010-12-02 Panasonic Corp E-mail erroneous transmission prevention device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101351A (en) * 2016-12-21 2018-06-28 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method, and program
JP2018110322A (en) * 2017-01-04 2018-07-12 株式会社日立ソリューションズ Adjustment program and adjusting unit
JP2019125062A (en) * 2018-01-12 2019-07-25 カシオ計算機株式会社 Programming support device, programming support method and program
JP7020127B2 (en) 2018-01-12 2022-02-16 カシオ計算機株式会社 Programming support equipment, programming support methods, and programs
JP2020154965A (en) * 2019-03-22 2020-09-24 Nttテクノクロス株式会社 Information processing apparatus, information processing method, and program
JP7001630B2 (en) 2019-03-22 2022-01-19 Nttテクノクロス株式会社 Information processing equipment, information processing methods and programs
JP2022031421A (en) * 2019-03-22 2022-02-18 Nttテクノクロス株式会社 Information processor, method for processing information, and program
JP7307145B2 (en) 2019-03-22 2023-07-11 Nttテクノクロス株式会社 Information processing device, information processing method and program
CN110430118A (en) * 2019-06-19 2019-11-08 平安银行股份有限公司 Bill mail management method, apparatus, computer equipment and computer readable storage medium
CN110430118B (en) * 2019-06-19 2023-08-29 平安银行股份有限公司 Bill mail managing method, apparatus, computer device and computer readable storage medium

Also Published As

Publication number Publication date
JP5584608B2 (en) 2014-09-03

Similar Documents

Publication Publication Date Title
US10181957B2 (en) Systems and methods for detecting and/or handling targeted attacks in the email channel
JP5584608B2 (en) E-mail erroneous transmission determination method, determination program, and communication device
US7406506B1 (en) Identification and filtration of digital communications
US7664812B2 (en) Phonetic filtering of undesired email messages
US7930351B2 (en) Identifying undesired email messages having attachments
TWI393391B (en) Apaptive junk message filtering system and method
US9560003B2 (en) Erroneous addressing prevention for electronic messaging
JP4817952B2 (en) E-mail mistransmission prevention system, e-mail mistransmission prevention method, and e-mail mistransmission prevention program
KR100918599B1 (en) Method and apparatus for identifying potential recipients
US9602453B2 (en) Smart attachment to electronic messages
US20030195937A1 (en) Intelligent message screening
CN107657029B (en) Forgotten accessory detection method and device
US20100205259A1 (en) Email management based on user behavior
JP2010072779A (en) Data classifying device, computer program, and data classification method
US20050044160A1 (en) Method and software product for identifying unsolicited emails
US8521825B2 (en) Electronic message monitoring
JP5262429B2 (en) Information processing apparatus, e-mail transmission method, e-mail transmission system, and computer program
US9055018B2 (en) Related message detection and indication
JP5220202B2 (en) Data processing apparatus, data processing method, and program
JP2009037346A (en) Unwanted e-mail exclusion system
JP4802523B2 (en) Electronic message analysis apparatus and method
JP2005182154A (en) Message processing system and method
JP2008245166A (en) Electronic mail processor and electronic mail processing program
JP5051793B2 (en) E-mail control apparatus, control method therefor, and program
JP2008234437A (en) Electronic mail incorrect transmission prevention device and electronic mail incorrect transmission prevention method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130902

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140718

R150 Certificate of patent or registration of utility model

Ref document number: 5584608

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees