WO2016163043A1 - 電子メール誤送信判定装置、電子メール送信システム及び記録媒体 - Google Patents

電子メール誤送信判定装置、電子メール送信システム及び記録媒体 Download PDF

Info

Publication number
WO2016163043A1
WO2016163043A1 PCT/JP2015/076040 JP2015076040W WO2016163043A1 WO 2016163043 A1 WO2016163043 A1 WO 2016163043A1 JP 2015076040 W JP2015076040 W JP 2015076040W WO 2016163043 A1 WO2016163043 A1 WO 2016163043A1
Authority
WO
WIPO (PCT)
Prior art keywords
transmission
mail
transmission destination
destination
feature information
Prior art date
Application number
PCT/JP2015/076040
Other languages
English (en)
French (fr)
Inventor
知人 斉藤
鎌田 信夫
Original Assignee
株式会社ソリトンシステムズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2015080864A external-priority patent/JP5810240B1/ja
Priority claimed from JP2015115282A external-priority patent/JP5876181B1/ja
Application filed by 株式会社ソリトンシステムズ filed Critical 株式会社ソリトンシステムズ
Priority to US15/565,678 priority Critical patent/US10311408B2/en
Priority to EP15888534.3A priority patent/EP3309686B1/en
Publication of WO2016163043A1 publication Critical patent/WO2016163043A1/ja
Priority to US16/412,147 priority patent/US11100471B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/216Handling conversation history, e.g. grouping of messages in sessions or threads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/23Reliability checks, e.g. acknowledgments or fault reporting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/48Message addressing, e.g. address format or anonymous messages, aliases

Definitions

  • the present invention relates to an erroneous email transmission determination device, an email transmission system, and a recording medium.
  • Patent Document 1 Japanese Patent Application Laid-Open No. 2004-151867 is based on a comparison between the appearance frequency of a predetermined vocabulary in the body of an e-mail and the appearance frequency of the vocabulary in an e-mail body previously transmitted to the same destination as the destination of the e-mail.
  • a technique for controlling whether to send the electronic mail or to hold the transmission is described.
  • Patent Document 1 describes a technology that supports the determination of whether or not there is an erroneous transmission based on the politeness of the e-mail body and the presence or absence of a signature attached to the e-mail body.
  • Patent Document 2 discloses an analysis unit that analyzes the validity of a destination address of a transmission mail created by a user based on document data of all past transmitted mails stored in a transmitted mail storage unit, and a result thereof. Is described, and a transmission execution means for receiving a transmission instruction of a user who has viewed it and executing transmission of the transmitted mail is described.
  • each of the destination addresses included in the similar group to which the transmission mail belongs among the similar groups of the transmitted mail configured by the clustering means based on the similarity of the document data as the analysis means It is described that the similarity with the destination address of the transmitted mail is calculated, and the destination address of the transmitted mail with the highest similarity is proposed as a destination address correction candidate.
  • the present invention has been proposed to solve the problems of the prior art.
  • An erroneous email transmission determination device includes: a feature information generation unit that generates feature information related to the content of an email to be transmitted; feature information related to the content of a transmitted email; and a destination of the email
  • An accumulating unit that accumulates in association with each other, a transmission destination candidate selection unit that selects a transmission destination candidate similar to the transmission destination of the e-mail to be transmitted from among transmission destinations of the transmitted e-mail, and accumulation in the accumulation unit
  • the feature information stored in the storage unit in association with the transmission destination is stored in the storage unit in association with another transmission destination different from the transmission destination.
  • the word space area of the feature information associated with the destination and the other destination Attached The feature information is separated from the word space region of the feature information, and the similarity is used as a criterion for determining whether the feature information regarding the contents of an arbitrary e-mail belongs to the word space region of the feature information associated with the destination
  • a similarity model generation unit that generates a degree model, feature information regarding the content of the transmission target email generated by the feature information generation unit, and the transmission target email generated by the similarity model generation unit Based on the similarity model related to the transmission destination and the similarity model related to the transmission destination candidate generated by the similarity model generation unit.
  • a reliability calculation unit that calculates the reliability.
  • An e-mail transmission system includes: an e-mail creating unit that creates an e-mail to be transmitted with a specified destination; and an error regarding the transmission destination of the e-mail to be transmitted created by the e-mail creating unit
  • the e-mail erroneous transmission determination device that determines whether or not there is a high possibility of an error, and the electronic mail to be transmitted when the e-mail erroneous transmission determination device determines that there is no high possibility of an error for the destination
  • An e-mail transmission system includes: an e-mail creating unit that creates an e-mail to be transmitted with a specified destination; and an error regarding the transmission destination of the e-mail to be transmitted created by the e-mail creating unit
  • the e-mail erroneous transmission determination device that determines whether or not there is a high possibility, the display unit that displays the destination candidate selected by the selection unit of the e-mail erroneous transmission determination device, and the e-mail erroneous transmission.
  • the e-mail transmission program according to the present invention is a program for causing a computer to function as each unit of the e-mail erroneous transmission determination device.
  • An e-mail transmission program according to the present invention is a program for causing a computer to function as each unit of the e-mail transmission system.
  • the present invention can prevent an erroneous transmission of an e-mail with high accuracy by preventing an error in a destination address.
  • FIG. 1 is a diagram showing a schematic configuration of an e-mail transmission system 1.
  • the e-mail transmission system 1 includes a mail client 10 that performs mail document creation and transmission processing, a mail error transmission determination device 30 that determines the possibility of erroneous transmission of an email created by the mail client 10, and a mail client 10 And a mail server 50 for transmitting a mail document transmitted from the mail address to a destination address.
  • FIG. 2 is a diagram showing the configuration of the mail client 10.
  • the mail client 10 includes an operation unit 11 that is operated by a user, a display unit 12, a communication unit 13 that performs data communication processing with the outside, and a control unit 14 that controls operation of each unit. ing.
  • the operation unit 11 outputs information according to a user operation, for example, information such as an input mail document, a transmission instruction, and a selection instruction.
  • the display unit 12 displays information from the operation unit 11, information received by the communication unit 13 from the outside, control information from the control unit 14, and the like. For example, the display unit 12 displays an input mail document, a candidate destination address, and other information necessary for seeking a user's judgment.
  • the communication unit 13 communicates with the erroneous mail transmission determination device 30 or the mail server 50 based on the control of the control unit 14. For example, the communication unit 13 transmits authentication data to the mail server 50 and receives authentication data indicating that authentication has been performed from the mail server 50. The communication unit 13 transmits a mail document to be transmitted to the erroneous email transmission determination device 30 and receives a determination result indicating the possibility of erroneous email transmission from the erroneous email transmission determination device 30. Further, the communication unit 13 transmits a mail document to the mail server 50 when the possibility of erroneous mail transmission is small.
  • FIG. 3 is a flowchart showing a mail transmission processing routine of the mail client 10.
  • step S1 when the mail client 10 transmits authentication data to the mail server 50 and receives authentication data indicating that the mail server 50 has been authenticated, the process proceeds to step S2.
  • step S2 the mail client 10 transmits the mail document scheduled to be transmitted to the mail error transmission determination device 30, and proceeds to step S3.
  • step S3 the mail client 10 stands by until a determination result indicating the possibility of erroneous transmission is received from the erroneous mail transmission determination device 30, and when the determination result is received, the process proceeds to step S4.
  • the erroneous mail transmission determination device 30 when transmitting a determination result indicating that there is a high possibility of erroneous transmission to the mail client 10, the erroneous mail transmission determination device 30 also transmits one or more candidate destination addresses instead of the destination address. To do. Further, the erroneous mail transmission determination device 30 may transmit the reliability of each of the destination address and the candidate destination address together to prompt the mail client 10 to verify the determination result.
  • step S4 the mail client 10 analyzes the determination result to determine whether there is a high possibility of erroneous transmission. If the determination is affirmative (if the possibility of erroneous transmission is large), the process proceeds to step S5. In the case of determination, the process proceeds to step S6.
  • step S5 the mail client 10 performs a display process for alerting the possibility of erroneous transmission. Specifically, the mail client 10 executes a warning display routine described later, and ends this routine.
  • step S6 since there is little possibility of erroneous transmission, the mail client 10 transmits a mail document to the mail server 50 and ends this routine. Then, the mail server 50 transmits the mail document transmitted from the mail client 10 to the destination address according to a predetermined protocol.
  • FIG. 4 is a block diagram illustrating a configuration of the erroneous mail transmission determination device 30.
  • the mail mistransmission determination device 30 includes a mail document analysis unit 31 that analyzes a mail document transmitted from the mail client 10, an address book 32 that is a storage unit that stores a destination address of the transmitted mail document, and an address book 32.
  • a candidate destination address selection unit 33 for selecting a candidate destination address in place of the destination address from the address stored in the address, a noun dictionary 34 which is a storage unit for storing a noun, and a mail body feature vector generation for generating a feature vector of a mail document Part 35.
  • the user can also select an address to be stored in the address book 32. That is, the addresses stored in the address book 32 may be all the destination addresses of the sent mail document, or may be one selected by the user among all the destination addresses.
  • the erroneous email transmission determination device 30 further includes an email body feature vector storage unit 36 that stores email body feature vectors, an email body similarity model generation unit 37 that generates an email body similarity model, and an email body similarity model.
  • a mail body similarity model accumulating unit 38 for accumulating, a reliability calculating unit 39 for calculating the reliability, and a destination address validity determining unit 40 for determining the validity of the destination address are provided.
  • FIG. 5 is a flowchart showing a mail text feature vector generation routine.
  • the mail document analysis unit 31 extracts a mail text from the mail document, further extracts a destination address from the mail document, and proceeds to step S12. If the extracted destination address is not stored in the address book 32, the destination address is written in the address book 32.
  • the destination address when the destination address has predetermined characteristics, for example, when the destination address has the same domain as the sender's domain, the destination address may not be written in the address book 32. In other words, for example, only e-mails sent to a domain different from the sender's domain may be determined for erroneous transmission.
  • step S12 the mail document analysis unit 31 performs morphological analysis on the mail text, and extracts all nouns included in the mail text using a noun dictionary.
  • the nouns extracted here are preferably, for example, savory connection nouns, general nouns, proper nouns, and the like. This is because the appearance frequency of each of the S-variant connection noun, the general noun, and the proper noun varies greatly depending on the contents of the mail text. Further, the mail document analysis unit 31 may extract a word even if it is a part of speech other than a noun as long as it is a word that characterizes the content of the mail text.
  • step S13 the mail document analysis unit 31 selects the first noun from all the extracted nouns, and proceeds to step S14.
  • step S14 the mail document analysis unit 31 determines whether the noun being selected has been registered in the noun dictionary 34. If it has not been registered, the process proceeds to step S15. If it has been registered, the process proceeds to step S16. move on.
  • FIG. 6 is a diagram showing the noun dictionary 34.
  • the correspondence index is a value for specifying a noun, and in this embodiment, the corresponding index is the order in which the noun is registered (serial number starting from 0).
  • the correspondence index is not limited to the registered order as long as it is a value that can uniquely identify the noun in the noun dictionary 34, for example, UUID (Universally Unique IDentifier), or the hash value (character string of the noun). It may be a numerical value derived from a hash function as an input).
  • UUID Universally Unique IDentifier
  • the corresponding index is globally unique.
  • a plurality of noun dictionaries 34 can be combined into one noun dictionary 34, or a single noun dictionary 34 can be shared by a plurality of mail client users.
  • step S15 the mail document analysis unit 31 generates a new correspondence index for the noun because the noun being selected is not registered in the noun dictionary 34, and is generated by associating the noun with the noun.
  • the corresponding index is paired and registered in the noun dictionary 34, and the process proceeds to step S16.
  • step S16 the mail document analyzing unit 31 extracts the corresponding index of the noun being selected from the noun dictionary 34, and proceeds to step S17.
  • step S17 the mail document analysis unit 31 increments the appearance frequency counter of the extracted corresponding index, and proceeds to step S18. Therefore, every time one noun is extracted from the mail text, the appearance frequency counter of the noun (corresponding index) increases by one.
  • step S18 the mail document analysis unit 31 determines whether there is an unselected noun among all the nouns extracted in step S12. If there is an unselected noun, the process proceeds to step S19, where an unselected noun. If not, the process proceeds to step S20.
  • step S19 the mail document analysis unit 31 selects the next noun from unselected nouns, and returns to step S14. Then, for all nouns extracted in step S12, the processing from step S14 to step S19 is repeated until the appearance frequency counter of the corresponding index is incremented.
  • step S20 the mail document analysis unit 31 outputs a pair of corresponding indexes and appearance frequency counters for all nouns included in the mail body to the mail body feature vector generation unit 35.
  • the mail body feature vector generation unit 35 generates a mail body feature vector by arranging the corresponding indexes and appearance frequency counters output from the mail document analysis unit 31 in a predetermined order.
  • FIG. 7 is a diagram showing a mail body feature vector.
  • the mail body feature vector is a pair of correspondence indexes and appearance frequency counters arranged in a predetermined order.
  • the mail body feature vector generated by the mail body feature vector generation unit 35 is stored in the mail body feature vector storage unit 36 in association with the destination address.
  • the mail body feature vectors of all the mail documents transmitted to the mail erroneous transmission determination device 30 are sequentially stored in the mail body feature vector storage unit 36. Then, this routine ends.
  • the mail body feature vector storage unit 36 does not continue to store the mail body feature vectors of all the mail documents that have been sent, but stores only the mail body feature vectors transmitted from the present time to a predetermined period before. Also good. In other words, the mail text feature vector storage unit 36 may delete the mail text feature vector that is older than a predetermined period from the current time.
  • the mail body feature vector storage unit 36 may store only the mail body feature vector of the mail document having each address in the address book 32 as the destination address, instead of all the sent mail documents.
  • FIG. 8 is a flowchart showing a mail text similarity model generation routine. This routine is batch-processed at regular intervals, for example, every 24 hours.
  • the mail text similarity model generation unit 37 selects the first address from the address book 32, and proceeds to step S22.
  • the first address corresponds to, for example, the destination address first registered in the address book 32, but is not limited to this, and may be any address registered in the address book 32.
  • the addresses selected from the address book 32 may be limited to addresses related to the mail text similarity model to be updated, instead of all registered addresses.
  • the email body similarity model to be updated corresponds to the email body similarity model for the address that is not reflected even though a new email is sent to the address related to the email body similarity model To do.
  • step S22 the mail body similarity model generation unit 37 extracts all mail body feature vectors having the selected address as the destination address from the mail body feature vector accumulation unit 36, and proceeds to step S23.
  • step S23 the mail body similarity model generation unit 37 randomly extracts a mail body feature vector having a destination address other than the currently selected address from the mail body feature vector accumulation unit 36, and proceeds to step S24.
  • the number of mail text feature vectors extracted in this step is the same as the number of mail text feature vectors extracted in step S22.
  • step S23 the mail body feature vector having an address other than the currently selected address as the destination address is extracted “randomly” because the mail body feature vector group has an address other than the currently selected address as the destination address. This is for retaining the characteristics (variation tendency) as a group of all the mail body feature vectors.
  • the number of “same” number of the mail text feature vectors extracted from step S22 is the contribution from the mail text feature vector group having the selected address as the destination address with respect to the mail text similarity model. This is because the contribution from the mail body feature vector group with the address other than the selected address as the destination address is made equal.
  • step S23 the mail body feature vector is extracted “randomly” and “same” as in step S22, so that the mail body similarity can be determined with high accuracy. This is to generate a model.
  • step S23 it is not essential to extract the mail body feature vector “randomly” and “same” as in step S22. That is, even if such a condition is not satisfied, a mail text similarity model necessary for mail mistransmission determination can be generated.
  • step S24 the mail text similarity model generation unit 37 generates a mail text similarity model related to the selected address using the mail text feature vector group extracted in steps S22 and S23.
  • the mail text similarity model is generated using, for example, SVM (Support Vector Machine).
  • the email body feature vector extracted from the email body of one email is Represented as one data point in the word space.
  • the data points represented by all the mail body feature vector groups extracted at step S22 as a destination address and the mails extracted at step S23 as the destination address. If an optimum hyperplane that separates the data points represented by the text feature vector group can be generated, it is possible to classify any data point in the word space by the hyperplane.
  • the mail text similarity model generation unit 37 generates a mail text similarity model using SVM as the hyperplane. Then, the mail text similarity model generation unit 37 stores the mail text similarity model in the mail text similarity model storage unit 38, and proceeds to step S25.
  • step S25 the mail text similarity model generation unit 37 determines whether there is an unselected address among the addresses to be selected among the addresses registered in the address book 32, and the unselected address is determined. If there is, the process proceeds to step S26, and if there is no unselected address, this routine is terminated.
  • step S26 the mail text similarity model generation unit 37 selects an unselected address and returns to step S22. Then, by repeating the processing from step S22 to step S26, the mail text similarity model generation unit 37 calculates the mail text similarity model for all the addresses to be selected from the addresses registered in the address book 32. It is generated and stored in the mail text similarity model storage unit 38. As a result, the latest mail text similarity model for all addresses registered in the address book 32 is stored in the mail text similarity model storage unit 38.
  • FIG. 9 is a diagram showing an example of a mail text similarity model related to a predetermined address (address A).
  • the noun included in the mail text is a two-dimensional word space having only “XYZ company” and “Saito”.
  • the mail text similarity model is expressed as a broken line in FIG.
  • white circles are data points represented by the mail body feature vector group of the transmitted mail body with the address A as the destination address.
  • a black circle is a data point represented by a mail body feature vector group of a sent mail body having an address other than the address A as a destination address.
  • the mail body similarity model for the address addressed to A is a hyperplane (in this case, a straight line) that separates the area where the white circle mark exists from the area where the black circle mark exists with the highest probability in the two-dimensional word space. Expressed.
  • FIG. 10 is a flowchart showing an erroneous transmission determination processing routine.
  • the reliability calculation unit 39 calculates the reliability for the destination address of the planned outgoing mail. Specifically, the reliability calculation unit 39 includes the mail body feature vector of the destination address generated by the mail body feature vector generation unit 35 and the mail body relating to the destination address stored in the mail body similarity model storage unit 38. The reliability of the destination address is calculated based on the similarity model.
  • FIG. 11 is a diagram for explaining a reliability calculation method using the mail text similarity model.
  • White and black triangles are the mail body feature vectors of the two mail documents to be transmitted.
  • the reliability corresponds to the distance from the mail text similarity model (broken line) to the mail text feature vector (for example, each triangle mark) for which the reliability is calculated. In other words, the longer the distance is, the higher the reliability that the mail body feature vector belongs to the region.
  • the white triangle mark is in the back of the white circle mark area, and the distance from the mail text similarity model is long.
  • the black triangle mark is within the area of the black circle mark, but exists near the mail text similarity model, and the distance from the mail text similarity model is short. Therefore, the mail body having the mail body feature vector corresponding to the white triangle mark can be estimated as a transmission mail with the address addressed to A as the destination address, and its reliability is high. On the other hand, although it can be estimated that the mail body having the mail body feature vector corresponding to the black triangle mark is not a transmission mail with the address addressed to A as the destination address, its reliability is low.
  • step S ⁇ b> 32 the candidate destination address selection unit 33 selects one or more candidate destination addresses to replace the destination address extracted by the mail document analysis unit 31 from all the addresses registered in the address book 32. .
  • the candidate destination address selection unit 33 selects a candidate destination address that is a character address similar to the destination address from the addresses in the address book 32 using, for example, the Levenshtein method or the n-gram method.
  • the candidate destination address selection unit 33 compares the local part (user name) excluding the domain of the destination address with the local part of each address registered in the address book using, for example, the n-gram method. For each of the 32 addresses, the address similarity (0 to 100%), which is an index similar to the destination address, is calculated. Then, the candidate destination address selection unit 33 selects an address having an address similarity equal to or higher than a threshold value (for example, 50%) among the address similarities obtained for each address in the address book 32 as a candidate destination address.
  • a threshold value for example, 50%
  • candidate destination address selection unit 33 may compare the destination address with each address in the address book 32, including not only the local part of the mail address but also the comment part of the mail address.
  • the candidate destination address selection unit 33 can select a candidate destination address having a higher similarity to the destination address by using not only the local part of the address included in the address book 32 but also the comment part. . Then, the reliability calculation unit 39 selects an arbitrary candidate destination address from one or more candidate destination addresses selected by the candidate destination address selection unit 33, and proceeds to step S33.
  • step S33 the reliability calculation unit 39 calculates the reliability for the selected candidate destination address. Specifically, the reliability calculation unit 39 first reads the mail text similarity model related to the selected candidate destination address from the mail text similarity model storage unit 38. Next, the reliability calculation unit 39 receives the email body feature vector of the email to be transmitted generated by the email body feature vector generation unit 35 and the email body similarity model regarding the read candidate destination address being selected. Based on this, the reliability of the selected candidate destination address is calculated, and the process proceeds to step S34.
  • step S34 the destination address validity determination unit 40 determines whether or not the “reliability with respect to the candidate destination address” being selected is greater than the “reliability with respect to the destination address”. If the determination is negative, the process proceeds to step S36. Even if the destination address validity determination unit 40 makes a negative determination, the destination address validity determination unit 40 may proceed to step S35 if the reliability of the destination address is lower than a predetermined threshold.
  • step S35 the destination address validity determination unit 40 determines that there is a possibility of erroneous transmission for the mail document to be transmitted, and sets the selected candidate destination address as the candidate destination address to be presented to the mail client 10. Then, the process proceeds to step S36.
  • the destination address validity determination unit 40 may set the candidate destination address when a negative determination is made in step S34 and the reliability of the destination address is lower than a predetermined threshold.
  • step S36 the destination address validity determination unit 40 determines whether there is an unselected candidate destination address. If there is an unselected candidate destination address, the process proceeds to step S37, and if there is no unselected candidate destination address. Advances to step S38.
  • step S37 the destination address validity determination unit 40 selects an unselected candidate destination address and returns to step S33. Then, by repeatedly executing steps S33 to S37, all combinations of “reliability with respect to destination address” and “reliability with respect to candidate destination address” are respectively compared, and the process proceeds to step S38.
  • step S38 the destination address validity determination unit 40 transmits the determination result to the mail client 10. Specifically, the destination address validity determination unit 40 determines that the possibility of erroneous transmission is low when the “reliability with respect to the destination address” is higher than all the “reliabilities with respect to candidate destination addresses”. Is sent to the mail client 10. In addition, when there are a plurality of candidate destination addresses, the destination address validity determination unit 40 transmits the priority order of the candidate destination addresses according to the respective reliability to the mail client 10 together with the plurality of candidate destination addresses. .
  • destination address validity determination unit 40 may also send the reliability itself for each of the destination address and the candidate destination address to the mail client 10 together.
  • the mail client 10 transmits the mail document to the mail error transmission determination device 30, the mail client 10 receives a determination result indicating the possibility of erroneous transmission. Further, the mail client 10 can receive from the mail erroneous transmission determination device 30 a candidate destination address that replaces the original destination address, together with a determination result that has a high possibility of erroneous transmission. Further, the mail client 10 can receive the priority order of candidate destination addresses when there are a plurality of candidate destination addresses.
  • the mail client 10 transmits the mail document to be transmitted to the mail server 50 (step S6 in FIG. 3), and if the possibility of erroneous transmission is high, be careful. Arousing display is performed (step S5 in FIG. 3).
  • FIG. 12 is a flowchart for executing a warning display routine for performing the warning display shown in step S5 of FIG.
  • the control unit 14 of the mail client 10 executes the processing after the next step S41.
  • step S41 the control unit 14 temporarily suspends transmission of the mail document to the mail server 50. Then, the control unit 14 displays the destination address and the mail document on the display unit 12, performs a warning display for the destination address, and proceeds to step S ⁇ b> 42.
  • FIG. 13 is a diagram schematically showing a warning display.
  • the destination address is highlighted and displayed in a vibration manner, prompting the user to be alerted.
  • vibration blinking, continuous or intermittent change of font (seed, color, size) may be used.
  • the file name of the attached file and the predetermined keyword are highlighted and displayed in vibration.
  • the predetermined keyword may be registered for mail documents for all destination addresses, or may be registered for mail documents for a specific destination address.
  • the amount of vibration in the vibration display may vary depending on the degree of alerting.
  • the vibration amount of the destination address may increase as the possibility that transmission to the destination address is erroneous transmission is high. That is, as shown in FIG. 11, the vibration amount of the destination address is a reliability level that is a distance from the mail body similarity model when the mail body feature vector exists in a destination address area different from the destination address. It may increase as the absolute value increases.
  • the vibration amount of the destination address has a reliability within a predetermined range (for example, the distance from the mail body similarity model even though the mail body feature vector exists in the area of the destination address different from the destination address).
  • the destination address is the first destination for the email sender, and the destination address has a domain different from the domain of the email sender. If the destination address corresponds to at least one of having a specific domain and that the destination address should be described in the BCC column of the e-mail, it may be increased according to the corresponding number. .
  • a display method that enhances alerting other than vibration display may be used. Whether or not these conditions are met is determined by the control unit 14 based on the destination address and past e-mail transmission information.
  • FIG. 14 is a diagram showing a frequency table. Regardless of whether the destination address is listed in the TO column or the CC column, the frequency table is a pair of destination addresses that have transmitted emails in the past, the number of transmissions (frequency number), The date and time (last update date and time) of the last simultaneous transmission to the pair are collectively shown.
  • the frequency table here is a summary of destination address pairs, frequency counts, and last update date, regardless of source, but for each source, destination address pairs, frequency count, and last update date are summarized. It may be.
  • FIG. 15 is a flowchart showing a BCC determination routine for determining whether the destination address should be described in the BCC column.
  • the control unit 14 extracts all destination addresses from the TO column and CC column of the e-mail to be transmitted, and proceeds to step S102.
  • step S102 the control unit 14 selects the first destination address pair and proceeds to step S103. For example, when three destination addresses are extracted in step S101, there are three pairs of destination addresses. In this case, the first pair is selected from the three pairs of destination addresses.
  • step S103 the control unit 14 determines whether or not the frequency number of the pair selected in step S102 is greater than or equal to a predetermined value. If the determination is affirmative, the process proceeds to step S104. If the determination is negative, step S105 is performed. Proceed to Here, a pair whose frequency number is equal to or greater than a predetermined value is regarded as a destination address having a deep connection.
  • step S104 since the pair is considered to have a deep connection, the control unit 14 marks the pair and proceeds to step S105.
  • step S105 the control unit 14 determines whether or not all pairs have been selected. If the determination is affirmative, the process proceeds to step S107. If the determination is negative, the process proceeds to step S106. For example, if there are four destination addresses corresponding to the TO column and CC column of the e-mail to be sent and there are six destination address pairs, whether or not all six destination address pairs have been selected. Is determined.
  • step S106 the control unit 14 selects the next destination address pair and returns to step S103.
  • step S107 the control unit 14 selects the next destination address pair and returns to step S103.
  • step S107 the control unit 14 performs grouping for all the destination addresses of the e-mails scheduled to be transmitted, using the marked pairs. First, the control unit 14 regards each marked pair as one group. Next, the control unit 14 compares the two groups and, when there is a common destination address, sets the two groups as one group. If there is no common destination address, the two groups remain separate groups. The control unit 14 compares all the groups and performs grouping until there is no common destination address.
  • step S104 the control unit 14 sets each destination address that is not marked in any pair with any other destination address as one group. Then, the process proceeds to step S108.
  • step S102 to step S107 is performed for nodes connected by an edge of a predetermined weight or more. This is the same as the general problem of creating an aggregate (cluster). That is, as long as a highly relevant destination address group can be created, the processing from step S102 to step S107 is not limited to this.
  • step S108 the control unit 14 counts all the groups and calculates a BCC determination value for determining whether or not to perform BCC transmission.
  • the BCC determination value is a value obtained by dividing the number of groups by the number of all destination addresses (the number extracted in step S101).
  • step S109 the control unit 14 determines whether or not the BCC determination value is larger than a predetermined value. If the determination is affirmative, the process proceeds to step S110. If the determination is negative, the process proceeds to step S111.
  • This predetermined value is a number greater than or equal to zero and less than 1, and is a threshold value for determining the degree of deep connection between the destination addresses extracted in step S101.
  • the number of groups formed with destination addresses having deep connections is close to the total number of original destination addresses, in other words, between individual destination addresses. Show that there are not many deep connections.
  • BCC transmission is performed when transmitting simultaneously to many destination addresses that are not mutually related. Therefore, when the BCC determination value is larger than the predetermined value, it is considered that the electronic mail should be transmitted by BCC. On the other hand, when the BCC determination value is less than or equal to this predetermined value, there is a sufficient deep connection between the destination addresses, so it is considered that the e-mail need not be transmitted by BCC.
  • step S110 the control unit 14 determines that the electronic mail should be BCC transmitted, displays on the display unit 12 that the electronic mail should be BCC transmitted, and proceeds to step S111.
  • step S111 the control unit 14 updates the frequency table and ends this routine. In detail, in this step, the following frequency table update routine is executed.
  • FIG. 16 is a flowchart showing a frequency table update routine. Note that the update of the frequency table is not necessarily performed at the timing of step S111, and may be performed at a predetermined time of the day.
  • step S121 the control unit 14 extracts all destination addresses from the TO column and CC column of the e-mail to be transmitted, and proceeds to step S122.
  • step S122 the control unit 14 selects the first destination address pair and proceeds to step S123.
  • step S123 the control unit 14 determines whether or not the pair selected in step S122 is in the frequency table. If the determination is affirmative, the process proceeds to step S124. If the determination is negative, the process proceeds to step S127.
  • step S124 the control unit 14 increments (increases by 1) the frequency number of the pair, and proceeds to step S125.
  • step S125 the control unit 14 determines whether all pairs have been selected. If the determination is affirmative, the process proceeds to step S128. If the determination is negative, the process proceeds to step S126.
  • step S126 the control unit 14 selects the next pair and returns to step S123.
  • step S127 the control unit 14 registers the pair in the frequency table, sets the frequency number 1 of the pair, and proceeds to step S125.
  • the destination address of the e-mail sent at a certain time in the past is “aaa@aaa.com”, “bbb@bbb.com”, “ccc@ccc.com” If so, the next three destination address pairs are extracted.
  • the first item (“aaa@aaa.com”; “bbb@bbb.com” “Aaa@aaa.com”; “ccc@ccc.com” “Bbb@bbb.com”; “ccc@ccc.com”
  • the first item (“aaa@aaa.com”; “bbb@bbb.com”) is not included in the frequency table shown in FIG. 14, so it is newly registered in the frequency table.
  • the frequency number is set to 1.
  • the frequency number of each pair of the remaining items is increased (incremented) by one, and as a result, each frequency number is increased from 4 to 5 and from 1 to 2 Is set.
  • step S1208 the control unit 14 deletes an item for which a predetermined time has elapsed from the frequency table, and ends this routine.
  • the control unit 14 determines whether or not the last update date and time for each pair of the frequency table is a predetermined time or more before the current time, and when the predetermined pair meets this condition, the predetermined pair Is deleted from the frequency table. In this way, the control unit 14 constantly updates the frequency table, thereby maintaining the determination accuracy as to whether or not to send the electronic mail by BCC.
  • control unit 14 of the mail client 10 executes the processing shown in FIGS. 15 and 16, but the server side such as the erroneous mail transmission determination device 30 may execute it.
  • step S42 the control unit 14 determines whether or not the transmission button (see the upper right part of FIG. 13) displayed on the display unit 12 has been pressed (clicked). If YES, the process proceeds to step S43, and if NO, the process proceeds to step S44.
  • step S43 the control unit 14 transmits the mail document to the mail server 50 and ends this routine.
  • the mail document is forcibly transmitted to the mail server 50.
  • step S44 the control unit 14 determines whether or not the cancel button (see the upper right part of FIG. 13) displayed on the display unit 12 has been pressed (clicked). If the determination is affirmative, the process proceeds to step S45. If the determination is negative, the process proceeds to step S46. In step S45, the control unit 14 discards (deletes) the mail document and ends this routine.
  • step S46 the control unit 14 determines whether there is a candidate destination address (has been transmitted from the erroneous mail transmission determination device 30). If the determination is affirmative, the process proceeds to step S47. If the determination is negative, the process proceeds to step S50. .
  • step S47 when the control unit 14 detects that a predetermined operation such as a cursor is placed on the destination address on the display screen, the control unit 14 displays a pull-down menu and proceeds to step S48.
  • a predetermined operation such as a cursor
  • FIG. 17 is a diagram showing a state when a pull-down menu including a destination address and a candidate destination address is displayed.
  • the pro-down menu prompts the user to select a destination address or a candidate destination address. Therefore, in the pull-down menu, the destination address is displayed at the top, and then the candidate destination addresses are displayed from the top in descending order of reliability.
  • step S48 the control unit 14 determines whether the destination address in the pull-down menu or any candidate destination address is selected by the user, and determines that the destination address or any candidate destination address is selected, the process proceeds to step S49. move on.
  • step S49 the control unit 14 sets the address (destination address or candidate destination address) selected in step S48 as a new transmission destination, and returns to step S42. As a result, the address selected from the pull-down menu becomes a new destination address, and the processes after step S42 are executed again.
  • step S50 the control unit 14 determines whether the transmission destination remains the first destination address. If the determination is affirmative, the control unit 14 returns to step S41. If the determination is negative, the control unit 14 returns to step S42. And the process after step S41 or step S42 is performed again.
  • the mail client 10 can alert the user to the destination address by vibrating and displaying the destination address when the transmission of the email is suspended. Further, the mail client 10 can present a candidate destination address to the user in place of the current destination address.
  • the mail client 10 presents them to the user from the candidate destination addresses with the highest priority (for example, the candidate destination address with the higher priority is placed at the top of the pull-down menu). You can also.
  • the erroneous email transmission determination device 30 is configured independently of the email client 10 or the email server 50, but may be configured to be incorporated in the email client 10 or the email server 50.
  • destination addresses are extracted from all mail documents transmitted to the erroneous mail transmission determination device 30 shown in FIG. 4, and all the extracted destination addresses are registered in the address book 32.
  • the present invention is not limited to this example, and only the destination address of the electronic mail transmitted through the result of the erroneous mail transmission determination may be registered in the address book 32.
  • the mail document analysis unit 31 shown in FIG. 4 performs morphological analysis on only the mail body. If the text information is included in the e-mail, the mail document analysis unit 31 performs morphological analysis including the mail header and other information. Also good.
  • the mail text similarity model is not limited to SVM and is not particularly limited as long as it statistically indicates the certainty that the mail text is related to a specific destination address.
  • As the mail text similarity model for example, a naive Bayes, a decision tree (CART), a maximum entropy (ME) model, or the like may be used.
  • the mail body similarity model of the present embodiment is sequentially updated from the beginning based on the mail body feature vectors of all mail documents transmitted to the mail error transmission determination device 30.
  • the mail text similarity model may reflect, for example, a difference from the mail text feature vector of today's mail document based on the one generated at a predetermined point in the past.
  • the destination address validity determination unit 40 illustrated in FIG. 4 may be provided in the mail client 10 instead of the mail erroneous transmission determination device 30.
  • the control unit 14 of the mail client 10 illustrated in FIG. 2 has the function of the destination address validity determination unit 40 as described above, and uses each reliability transmitted from the mail erroneous transmission determination device 30.
  • the processing of steps S34 to S37 shown in FIG. 10 is repeatedly executed. In this way, the mail client 10 may make a final determination as to whether or not the mail is erroneously transmitted.
  • the erroneous email transmission determination device 30 determines whether an email to be transmitted is erroneously transmitted without generating a candidate destination address.
  • the candidate destination address selection processing in steps S32 and steps S33, S36, and S37 are omitted.
  • step S34 unlike the first embodiment, the following processing is executed.
  • step S34 the destination address validity determination unit 40 determines whether or not the “reliability with respect to the destination address” is greater than a predetermined threshold value. If the determination is affirmative, the destination address validity determination unit 40 determines that the possibility of erroneous transmission is low. In the case of negative determination, it is determined that there is a high possibility of erroneous transmission, and this determination result is transmitted to the mail client 10.
  • the mail client 10 uses the determination result by the erroneous mail transmission determination device 30 to transmit the electronic mail when the possibility of erroneous transmission of the electronic mail is low, and when the possibility of erroneous transmission of the electronic mail is high. Can temporarily hold the transmission of the e-mail and display an alert.
  • FIG. 18 is a flowchart for executing a warning display routine for performing a warning display in the second embodiment. Steps S51 to S55 of this routine correspond to steps S41 to S45 of the alert display routine shown in FIG. However, in step S54, the control unit 14 determines whether or not the cancel button displayed on the display unit 12 is pressed (clicked). If the determination is affirmative, the process proceeds to step S55, and the determination is negative. Returns to step S51.
  • the mail client 10 may ask the user for the final determination of mail transmission by directly presenting the reliability transmitted from the mail erroneous transmission determination device 30 to the user.
  • mail client 10, mail erroneous transmission determination device 30, and mail server 50 are not limited to a hardware configuration, and may be a general-purpose computer in which a program for executing the above-described processing is installed.
  • the destination address validity determination unit 40 shown in FIG. 4 may be in the mail client 10 instead of the mail erroneous transmission determination device 30.
  • the control unit 14 of the mail client 10 illustrated in FIG. 2 has the function of the destination address validity determination unit 40 as described above, and uses the reliability transmitted from the mail erroneous transmission determination device 30.
  • the process of step S34 in the second embodiment described above is executed. In this way, the mail client 10 may make a final determination as to whether or not the mail is erroneously transmitted.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 電子メール誤送信判定装置は、送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、前記送信対象の電子メールの内容に関する特徴情報と、前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、を備えている。

Description

電子メール誤送信判定装置、電子メール送信システム及び記録媒体
 本発明は、電子メール誤送信判定装置、電子メール送信システム及び記録媒体に関する。
 従来、電子メールの誤送信を防止する技術が開示されている(特許文献1及び特許文献2参照)。
 特許文献1には、電子メールの本文における所定の語彙の出現頻度と、当該電子メールの送信先と同一の送信先に過去に送信された電子メール本文における当該語彙の出現頻度との比較に基づいて、当該電子メールを送信するか、送信を保留するかを制御する技術が記載されている。
 さらに、特許文献1には、当該電子メール本文の丁寧度及び当該電子メール本文に付与される署名の有無に基づいて、誤送信か否かの判定を支援する技術が記載されている。
 特許文献2には、ユーザが作成した送信メールの宛先アドレスの妥当性を、送信済みメール記憶手段に記憶された過去のすべての送信済みメールの文書データに基づいて解析する解析手段と、その結果を表示する表示手段と、それを閲覧したユーザの送信指示を受け付けて、前記送信メールの送信を実行する送信実行手段と、を有する技術が記載されている。
 そして特許文献2では、その解析手段として、文書データの類似度に基づいてクラスタリング手段が構成した送信済みメールの類似グループの内、当該送信メールが属する類似グループに含まれる宛先アドレス群の各々と、送信メールの宛先アドレスとの類似度を算出し、当該類似度が最も高い送信済みメールの宛先アドレスを宛先アドレスの修正候補として提案することが記載されている。
特許第3663844号公報 特許第4817952号公報
 本発明は、従来技術の問題を解決するために提案されたものである。
 本発明に係る電子メール誤送信判定装置は、送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、電子メールに含まれる単語の数を次元数とする単語空間において、前記送信先に対応付けられた特徴情報の単語空間領域と、前記他の送信先に対応付けられた特徴情報の単語空間領域と、を分離するものであって、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、前記特徴情報生成部により生成された前記送信対象の電子メールの内容に関する特徴情報と、前記類似度モデル生成部により生成された前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記類似度モデル生成部により生成された前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、を備えている。
 
 本発明に係る電子メール送信システムは、送信先が指定された送信対象の電子メールを作成する電子メール作成手段と、前記電子メール作成手段により作成された前記送信対象の電子メールの送信先について誤りの可能性が高いか否かを判定する前記電子メール誤送信判定装置と、前記電子メール誤送信判定装置により前記送信先について誤りの可能性が高くないと判定されたときに前記送信対象の電子メールを送信し、前記送信先について誤りの可能性が高いと判定されたときに前記送信対象の電子メールの送信を保留する送信手段と、を備えている。
 本発明に係る電子メール送信システムは、送信先が指定された送信対象の電子メールを作成する電子メール作成手段と、前記電子メール作成手段により作成された前記送信対象の電子メールの送信先について誤りの可能性が高いか否かを判定する前記電子メール誤送信判定装置と、前記電子メール誤送信判定装置の前記選択手段により選択された送信先候補を表示する表示手段と、前記電子メール誤送信判定装置により前記送信先について誤りの可能性が高くないと判定されたときに前記送信対象の電子メールを送信し、前記送信先について誤りの可能性が高いと判定されたときに前記送信対象の電子メールの送信を保留し、送信の保留中に前記表示手段により表示された前記送信先候補の1つが指定されたときに、指定された送信先候補に前記送信対象の電子メールを送信する送信手段と、を備えている。
 本発明に係る電子メール送信プログラムは、コンピュータを前記電子メール誤送信判定装置の各手段として機能させるためのプログラムである。
 また、本発明に係る電子メール送信プログラムは、コンピュータを前記電子メール送信システムの各手段として機能させるためのプログラムである。
 本発明は、宛先アドレスの誤りを防止して電子メールの誤送信を高精度に防止できる。
電子メール送信システムの概略構成を示す図である。 メールクライアントの構成を示す図である。 メールクライアントのメール送信処理ルーチンを示すフローチャートである。 メール誤送信判定装置の構成を示すブロック図である。 メール本文特徴ベクトル生成ルーチンを示すフローチャートである。 名詞辞書を示す図である。 メール本文特徴ベクトルを示す図である。 メール本文類似度モデル生成ルーチンを示すフローチャートである。 所定の宛先アドレスに関するメール本文類似度モデルの一例を示す図である。 誤送信判定処理ルーチンを示すフローチャートである。 メール本文類似度モデルを用いた信頼度の算出方法を説明するための図である。 注意喚起表示ルーチンを実行するフローチャートである。 注意喚起表示を模式的に示す図である。 頻度表を示す図である。 BCC判定ルーチンを示すフローチャートである。 頻度表更新ルーチンを示すフローチャートである。 プルダウンメニューが表示された時の状態を示す図である。 注意喚起表示ルーチンを実行するフローチャートである。
 以下、本発明を実施するための形態について、図面を参照しながら詳細に説明する。
 [第1実施形態]
 図1は、電子メール送信システム1の概略構成を示す図である。
 電子メール送信システム1は、メール文書の作成及び送信処理を行うメールクライアント10と、メールクライアント10により作成された電子メールの誤送信の可能性を判定するメール誤送信判定装置30と、メールクライアント10から送信されるメール文書を宛先アドレスへ送信するメールサーバ50と、を備えている。
 図2は、メールクライアント10の構成を示す図である。
 メールクライアント10は、ユーザの操作が行われる操作部11と、表示部12と、外部との間でデータの通信処理を行う通信部13と、各部の動作制御を行う制御部14と、を備えている。
 操作部11は、ユーザの操作に応じた情報、例えば、入力メール文書、送信指示、選択指示等の情報を出力する。
 表示部12は、操作部11からの情報、通信部13が外部から受信した情報、制御部14からの制御情報等を表示する。例えば、表示部12は、入力メール文書、候補宛先アドレス、その他ユーザの判断を仰ぐために必要な情報を表示する。
 通信部13は、制御部14の制御に基づいて、メール誤送信判定装置30又はメールサーバ50との間で通信する。通信部13は、例えば、メールサーバ50に認証データを送信し、メールサーバ50から認証された旨の認証データを受信する。通信部13は、メール誤送信判定装置30に送信予定のメール文書を送信し、メール誤送信判定装置30からメール誤送信の可能性を示す判定結果などを受信する。さらに、通信部13は、メール誤送信の可能性が小さい場合には、メール文書をメールサーバ50へ送信する。
 以上のように構成されたメールクライアント10は、次の手順に従って、メール文書をメールサーバ50へ送信する。
 図3は、メールクライアント10のメール送信処理ルーチンを示すフローチャートである。
 ステップS1では、メールクライアント10は、メールサーバ50へ認証データを送信し、メールサーバ50から認証された旨の認証データを受信すると、ステップS2に進む。
 ステップS2では、メールクライアント10は、メール誤送信判定装置30に送信予定のメール文書を送信して、ステップS3へ進む。
 ステップS3では、メールクライアント10は、メール誤送信判定装置30から誤送信の可能性を示す判定結果を受信するまで待機し、判定結果を受信すると、ステップS4へ進む。
 なお、メール誤送信判定装置30は、メールクライアント10に対して、誤送信の可能性が大きい旨の判定結果を送信する場合は、併せて、宛先アドレスに代わる1つ以上の候補宛先アドレスも送信する。また、メール誤送信判定装置30は、その判定結果の検証をメールクライアント10に促すべく、宛先アドレス及び候補宛先アドレスの各々についての信頼度を併せて送信してもよい。
 ステップS4では、メールクライアント10は、判定結果を分析して誤送信の可能性が大きいか否かを判定し、肯定判定の場合(誤送信の可能性が大きい場合)はステップS5に進む、否定判定の場合はステップS6へ進む。
 ステップS5では、メールクライアント10は、誤送信の可能性について注意喚起をするための表示処理を行う。メールクライアント10は、具体的には、後述する注意喚起表示ルーチンを実行して、本ルーチンを終了する。
 ステップS6では、メールクライアント10は、誤送信の可能性が小さいので、メールサーバ50へメール文書を送信して、本ルーチンを終了する。そして、メールサーバ50は、メールクライアント10から送信されたメール文書を、所定のプロトコルに従って、宛先アドレスに送信する。
 図4は、メール誤送信判定装置30の構成を示すブロック図である。
 メール誤送信判定装置30は、メールクライアント10から送信されたメール文書を解析するメール文書解析部31と、送信されたメール文書の宛先アドレスを記憶する記憶部であるアドレス帳32と、アドレス帳32に記憶されたアドレスから宛先アドレスに代わる候補宛先アドレスを選択する候補宛先アドレス選択部33と、名詞を記憶する記憶部である名詞辞書34と、メール文書の特徴ベクトルを生成するメール本文特徴ベクトル生成部35と、を備えている。
 なお、ユーザは、アドレス帳32に記憶させるアドレスを選択することもできる。つまり、アドレス帳32に記憶されたアドレスは、送信済みのメール文書のすべての宛先アドレスであってもよいし、当該すべての宛先アドレスのうちのユーザによって選択されたものであってもよい。
 メール誤送信判定装置30は、さらに、メール本文特徴ベクトルを蓄積するメール本文特徴ベクトル蓄積部36と、メール本文類似度モデルを生成するメール本文類似度モデル生成部37と、メール本文類似度モデルを蓄積するメール本文類似度モデル蓄積部38と、信頼度を算出する信頼度算出部39と、宛先アドレスの妥当性を判定する宛先アドレス妥当性判定部40と、を備えている。
 図5は、メール本文特徴ベクトル生成ルーチンを示すフローチャートである。
 ステップS11では、メール文書解析部31は、メール文書からメール本文を抽出して、さらに、メール文書から宛先アドレスを抽出して、ステップS12に進む。なお、抽出された宛先アドレスがアドレス帳32に記憶されていない場合、当該宛先アドレスがアドレス帳32に書き込まれる。
 ただし、宛先アドレスが所定の特徴を持つ、例えば宛先アドレスが送信者のドメインと同じドメインを持つなどの場合、当該宛先アドレスはアドレス帳32に書き込まれない場合もある。つまり、例えば送信者のドメインと異なるドメインに送信される電子メールのみを誤送信の判定対象にする、などとしてもよい。
 ステップS12では、メール文書解析部31は、メール本文について形態素解析を行い、名詞辞書を用いて、メール本文に含まれるすべての名詞を抽出する。ここで抽出される名詞は、例えば、サ変接続名詞、一般名詞、固有名詞などが好適である。サ変接続名詞、一般名詞及び固有名詞の各々の出現頻度は、メール本文の内容に依存して大きく異なるからである。また、メール文書解析部31は、名詞以外の品詞であっても、メール本文の内容を特徴付ける単語であれば、その単語を抽出してもよい。
 ステップS13では、メール文書解析部31は、抽出したすべての名詞の中から、最初の名詞を選択して、ステップS14に進む。
 ステップS14では、メール文書解析部31は、選択中の名詞が名詞辞書34に登録済みであるか否かを判定し、登録済みでない場合はステップS15に進み、登録済みである場合はステップS16に進む。
 図6は、名詞辞書34を示す図である。名詞辞書34には、名詞、及び当該名詞に1対1に対応付けられたインデックスである対応インデックスが登録されている。対応インデックスは、名詞を特定するための値であり、本実施形態では、当該名詞が登録された順番(0から始まる連番)とする。
 なお、対応インデックスは、名詞辞書34の名詞を一意に特定することができる値であれば、登録された順番に限らず、例えばUUID(Universally Unique IDentifier)、あるいは当該名詞のハッシュ値(文字列を入力としたハッシュ関数により導出された数値)などでもよい。UUIDあるいは当該ハッシュ値を用いた場合、当該対応インデックスは大域的一意となる。この結果、複数の名詞辞書34をまとめて一つの名詞辞書34にしたり、一つの名詞辞書34を複数のメールクライアントユーザで共有したりすることが可能になる。
 ステップS15では、メール文書解析部31は、選択中の名詞が名詞辞書34に登録されていないので、当該名詞について新たな対応インデックスを生成し、当該名詞と,当該名詞に対応づけて生成された対応インデックスとをペアにした上で名詞辞書34に登録して、ステップS16へ進む。
 ステップS16では、メール文書解析部31は、選択中の名詞の対応インデックスを名詞辞書34から抽出して、ステップS17へ進む。
 ステップS17では、メール文書解析部31は、抽出した対応インデックスの出現頻度カウンタをインクリメントして、ステップS18へ進む。したがって、メール本文から1つの名詞が抽出される毎に、当該名詞(対応インデックス)の出現頻度カウンタが1つ増加する。
 ステップS18では、メール文書解析部31は、ステップS12で抽出されたすべての名詞のうち未選択の名詞があるかを判定し、未選択の名詞がある場合はステップS19へ進み、未選択の名詞がない場合はステップS20へ進む。
 ステップS19では、メール文書解析部31は、未選択の名詞の中から次の名詞を選択して、ステップS14へ戻る。そして、ステップS12で抽出されたすべての名詞について、対応インデックスの出現頻度カウンタがインクリメントされるまで、ステップS14からステップS19までの処理が繰り返される。
 ステップS20では、メール文書解析部31は、メール本文に含まれるすべての名詞についての対応インデックス及び出現頻度カウンタのペアをメール本文特徴ベクトル生成部35へ出力する。メール本文特徴ベクトル生成部35は、メール文書解析部31から出力された対応インデックス及び出現頻度カウンタを所定の順に配列することで、メール本文特徴ベクトルを生成する。
 図7は、メール本文特徴ベクトルを示す図である。メール本文特徴ベクトルは、同図に示すように、対応インデックス及び出現頻度カウンタのペアが所定の順に配列されたものである。メール本文特徴ベクトル生成部35により生成されたメール本文特徴ベクトルは、宛先アドレスに対応付けられて、メール本文特徴ベクトル蓄積部36に蓄積される。
 このように、メール誤送信判定装置30に送信されたすべてのメール文書のメール本文特徴ベクトルは、メール本文特徴ベクトル蓄積部36に逐次蓄積される。そして、本ルーチンが終了する。
 なお、メール本文特徴ベクトル蓄積部36は、送信済みのすべてのメール文書のメール本文特徴ベクトルを蓄積し続けるのではなく、現時点から所定期間前までに送信されたメール本文特徴ベクトルのみを蓄積してもよい。つまり、メール本文特徴ベクトル蓄積部36は、現時点から所定期間前よりも古いメール本文特徴ベクトルを消去してもよい。
 また、メール本文特徴ベクトル蓄積部36は、送信済みのすべてのメール文書ではなく、アドレス帳32の各アドレスを宛先アドレスとしたメール文書のメール本文特徴ベクトルのみを蓄積してもよい。
 図8は、メール本文類似度モデル生成ルーチンを示すフローチャートである。本ルーチンは、一定時間毎、例えば24時間毎にバッチ処理される。
 ステップS21では、メール本文類似度モデル生成部37は、アドレス帳32から最初のアドレスを選択して、ステップS22へ進む。最初のアドレスとは、例えば、アドレス帳32に最初に登録された宛先アドレスが該当するが、これに限定されるものではなく、アドレス帳32に登録された任意のアドレスでよい。
 ただし、アドレス帳32から選択されるアドレスは、登録済みのすべてのアドレスではなく、更新すべきメール本文類似度モデルに関するアドレスに限定してもよい。更新すべきメール本文類似度モデルとは、メール本文類似度モデルに関するアドレス宛てに新たに電子メールが送信されたにもかかわらず、そのことが反映されていない当該アドレスに関するメール本文類似度モデルが該当する。
 ステップS22では、メール本文類似度モデル生成部37は、メール本文特徴ベクトル蓄積部36から、選択中のアドレスを宛先アドレスとしたすべてのメール本文特徴ベクトルを抽出して、ステップS23へ進む。
 ステップS23では、メール本文類似度モデル生成部37は、メール本文特徴ベクトル蓄積部36から、選択中のアドレス以外のアドレスを宛先アドレスとしたメール本文特徴ベクトルをランダムに抽出して、ステップS24に進む。なお、本ステップで抽出されるメール本文特徴ベクトルの数は、ステップS22で抽出されるメール本文特徴ベクトルの数と同じである。
 ステップS23において、選択中のアドレス以外のアドレスを宛先アドレスとしたメール本文特徴ベクトルが「ランダム」に抽出されるのは、当該メール本文特徴ベクトル群が、選択中のアドレス以外のアドレスを宛先アドレスとしたすべてのメール本文特徴ベクトルのグループとしての特徴(ばらつきの傾向)を保持するためである。また、当該メール本文特徴ベクトルが、ステップS22と「同じ」数だけ抽出されるのは、メール本文類似度モデルに対して、選択中のアドレスを宛先アドレスとしたメール本文特徴ベクトル群からの寄与と、選択中のアドレス以外のアドレスを宛先アドレスとしたメール本文特徴ベクトル群からの寄与と、を同等にするためである。
 つまり、ステップS23において、メール本文特徴ベクトルが「ランダム」に、かつ、ステップS22と「同じ」数だけ抽出されるのは、メール誤送信判定を高精度に行うことを可能とするメール本文類似度モデルを生成するためである。ただし、ステップS23において、メール本文特徴ベクトルが「ランダム」に、かつ、ステップS22と「同じ」数だけ抽出されるのは必須ではない。つまり、このような条件を満たさなくても、メール誤送信判定に必要なメール本文類似度モデルは生成可能である。
 ステップS24では、メール本文類似度モデル生成部37は、ステップS22及びS23で抽出されたメール本文特徴ベクトル群を用いて、選択中のアドレスに関するメール本文類似度モデルを生成する。メール本文類似度モデルは、例えばSVM(Support Vector Machine)を用いて生成される。
 SVMでは、すべての電子メールのメール本文で使用されるすべての名詞の数を次元数とする単語空間を仮定した場合、1通の電子メールのメール本文から抽出されたメール本文特徴ベクトルは、当該単語空間内の1つのデータ点として表される。当該単語空間内において、ステップS22で抽出された、あるアドレスを宛先アドレスとしたすべてのメール本文特徴ベクトル群が表すデータ点と、ステップS23で抽出された、それ以外のアドレスを宛先アドレスとしたメール本文特徴ベクトル群が表すデータ点と、を分離する最適な超平面が生成できれば、当該超平面によって、当該単語空間内における任意のデータ点を分類することが可能になる。
 そこで、メール本文類似度モデル生成部37は、当該超平面として、SVMを用いて、メール本文類似度モデルを生成する。そして、メール本文類似度モデル生成部37は、当該メール本文類似度モデルをメール本文類似度モデル蓄積部38に蓄積して、ステップS25に進む。
 ステップS25では、メール本文類似度モデル生成部37は、アドレス帳32に登録されたアドレスの中で選択対象となるアドレスのうち未選択のアドレスがあるか否かを判定し、未選択のアドレスがある場合はステップS26に進み、未選択のアドレスがない場合は本ルーチンを終了する。
 ステップS26では、メール本文類似度モデル生成部37は、未選択のアドレスを選択して、ステップS22に戻る。そして、ステップS22からステップS26までの処理を繰り返すことにより、メール本文類似度モデル生成部37は、アドレス帳32に登録されたアドレスの中で選択対象となるすべてのアドレスに関するメール本文類似度モデルを生成して、メール本文類似度モデル蓄積部38に蓄積する。これにより、メール本文類似度モデル蓄積部38には、アドレス帳32に登録されているすべてのアドレスに関する最新のメール本文類似度モデルが蓄積される。
 図9は、所定のアドレス(A宛アドレス)に関するメール本文類似度モデルの一例を示す図である。ここでは、メール本文に含まれる名詞が「XYZ社」と「斉藤」だけの2次元単語空間とする。メール本文類似度モデルは、図9の破線として表現される。図9において、白丸印は、A宛アドレスを宛先アドレスとした送信済みメール本文のメール本文特徴ベクトル群が表すデータ点である。また黒丸印は、A宛アドレス以外のアドレスを宛先アドレスとした送信済みメール本文のメール本文特徴ベクトル群が表すデータ点である。そしてA宛アドレスに関するメール本文類似度モデルは、当該2次元単語空間内において、白丸印が存在する領域と黒丸印が存在する領域を最も高い蓋然性でもって分離する超平面(この場合は直線)として表現される。
 図10は、誤送信判定処理ルーチンを示すフローチャートである。
 ステップS31では、信頼度算出部39は、送信予定メールの宛先アドレスに対する信頼度を算出する。具体的には、信頼度算出部39は、メール本文特徴ベクトル生成部35で生成された宛先アドレスのメール本文特徴ベクトルと、メール本文類似度モデル蓄積部38に蓄積された当該宛先アドレスに関するメール本文類似度モデルと、に基づいて、宛先アドレスの信頼度を算出する。
 図11は、メール本文類似度モデルを用いた信頼度の算出方法を説明するための図である。白及び黒の三角印は、送信予定の二つのメール文書のメール本文特徴ベクトルである。信頼度は、メール本文類似度モデル(破線)から信頼度の算出対象としたメール本文特徴ベクトル(例えば各々の三角印)までの距離に相当する。つまり、その距離が長ければ長いほど、当該メール本文特徴ベクトルがその領域に属する信頼性は高くなる。
 図11において、白三角印は、白丸印の領域内の奥にあり、メール本文類似度モデルからの距離が長い。黒三角印は、黒丸印の領域内にあるが、メール本文類似度モデルの近くに存在し、メール本文類似度モデルからの距離が短い。よって、白三角印に対応するメール本文特徴ベクトルをもつメール本文はA宛アドレスを宛先アドレスとした送信メールと推定でき、その信頼性は高い。一方、黒三角印に対応するメール本文特徴ベクトルをもつメール本文はA宛アドレスを宛先アドレスとした送信メールでないと推定できるが、その信頼性は低い。
 ステップS32では、候補宛先アドレス選択部33は、アドレス帳32に登録されているすべてのアドレスの中から、メール文書解析部31で抽出された宛先アドレスに代わる1つ以上の候補宛先アドレスを選択する。候補宛先アドレス選択部33は、例えば、レーベンシュタイン法又はn-gram法などを用いて、アドレス帳32のアドレスから、当該宛先アドレスに似た字面のアドレスである候補宛先アドレスを選択する。
 候補宛先アドレス選択部33は、例えばn-gram法を用いて、宛先アドレスのドメインを除いたローカル部(ユーザ名)と、アドレス帳に登録された各アドレスのローカル部とを対比し、アドレス帳32のアドレス毎に、それが宛先アドレスに類似する指標であるところのアドレス類似度(0~100%)を演算する。そして候補宛先アドレス選択部33は、アドレス帳32のアドレス毎に求められたアドレス類似度のうち、閾値(例えば50%)以上のアドレス類似度となるアドレスを、候補宛先アドレスとして選択する。
 なお、候補宛先アドレス選択部33は、メールアドレスのローカル部に限らず、メールアドレスのコメント部を含めて、宛先アドレスとアドレス帳32の各アドレスとを対比させてもよい。
 例えば、“新宿 太郎”<shinjuku.tarou@example.co.jp>の場合、コメント部は“新宿 太郎”である。候補宛先アドレス選択部33は、アドレス帳32に含まれるアドレスのローカル部だけでなく、そのコメント部を使用すれば、宛先アドレスに対して、より類似度の高い候補宛先アドレスを選択することができる。
 そして、信頼度算出部39は、候補宛先アドレス選択部33で選択された1つ以上の候補宛先アドレスの中から、任意の候補宛先アドレスを選択して、ステップS33に進む。
 ステップS33では、信頼度算出部39は、選択中の候補宛先アドレスに対する信頼度を算出する。具体的には、信頼度算出部39は、最初に、メール本文類似度モデル蓄積部38から、選択中の候補宛先アドレスに関するメール本文類似度モデルを読み出す。信頼度算出部39は、次に、メール本文特徴ベクトル生成部35で生成された送信予定メールのメール本文特徴ベクトルと、読み出された選択中の候補宛先アドレスに関するメール本文類似度モデルと、に基づいて、選択中の候補宛先アドレスの信頼度を算出して、ステップS34に進む。
 ステップS34では、宛先アドレス妥当性判定部40は、選択中の「候補宛先アドレスに対する信頼度」が「宛先アドレスに対する信頼度」よりも大きいか否かを判定し、肯定判定の場合はステップS35に進み、否定判定の場合はステップS36へ進む。なお、宛先アドレス妥当性判定部40は、否定判定の場合であっても、宛先アドレスに対する信頼度が所定の閾値より低い場合には、ステップS35に進んでもよい。
 ステップS35では、宛先アドレス妥当性判定部40は、送信予定のメール文書について誤送信の可能性があると判定し、選択中の候補宛先アドレスをメールクライアント10に提示すべき候補宛先アドレスに設定して、ステップS36に進む。なお、宛先アドレス妥当性判定部40は、ステップS34で否定判定の場合であり、かつ、宛先アドレスに対する信頼度が所定の閾値より低い場合には、当該候補宛先アドレスの設定を行ってもよい。
 ステップS36では、宛先アドレス妥当性判定部40は、未選択の候補宛先アドレスがあるかを判定し、未選択の候補宛先アドレスがある場合はステップS37に進み、未選択の候補宛先アドレスがない場合はステップS38へ進む。
 ステップS37では、宛先アドレス妥当性判定部40は、未選択の候補宛先アドレスを選択して、ステップS33に戻る。そして、ステップS33からステップS37までが繰り返し実行されることにより、「宛先アドレスに対する信頼度」と、「候補宛先アドレスに対する信頼度」と、のすべての組み合わせがそれぞれ比較されて、ステップS38に進む。
 ステップS38では、宛先アドレス妥当性判定部40は、判定結果をメールクライアント10へ送信する。具体的には、宛先アドレス妥当性判定部40は、「宛先アドレスに対する信頼度」がすべての「候補宛先アドレスに対する信頼度」よりも高かった場合は、誤送信の可能性が低い旨の判定結果をメールクライアント10に送信する。また、宛先アドレス妥当性判定部40は、複数の候補宛先アドレスが存在する場合には、複数の候補宛先アドレスと共に、各々の信頼度に応じた候補宛先アドレスの優先順位をメールクライアント10に送信する。
 なお、宛先アドレス妥当性判定部40は、宛先アドレス及び候補宛先アドレスの各々についての信頼度そのものを併せてメールクライアント10に送信してもよい。
 この結果、メールクライアント10は、メール誤送信判定装置30にメール文書を送信すると、誤送信か否かの可能性を示した判定結果を受信する。
 また、メールクライアント10は、誤送信の可能性が高い判定結果と共に、当初の宛先アドレスに代わる候補宛先アドレスをメール誤送信判定装置30から受信することができる。さらに、メールクライアント10は、複数の候補宛先アドレスがある場合には、候補宛先アドレスの優先順位を受信できる。
 そして、メールクライアント10は、誤送信の可能性が低い場合には、送信対象のメール文書をメールサーバ50へ送信し(図3のステップS6)、誤送信の可能性が高い場合には、注意喚起表示を行う(図3のステップS5)。
 図12は、図3のステップS5に示す注意喚起表示を行うための注意喚起表示ルーチンを実行するフローチャートである。メールクライアント10の制御部14は、次のステップS41以降の処理を実行する。
 ステップS41では、制御部14は、メールサーバ50へのメール文書の送信を一時的に保留する。そして、制御部14は、表示部12に、宛先アドレス及びメール文書を表示すると共に、宛先アドレスへの注意喚起表示を行って、ステップS42へ進む。
 図13は、注意喚起表示を模式的に示す図である。指定した宛先アドレスの誤りの可能性が高い場合に、宛先アドレスがハイライト表示されると共に振動表示され、ユーザへの注意喚起が促されている。なお、振動の代わりに、点滅、フォント(種、色、大きさ)の連続的又は間欠的な変更などを用いてもよい。
 更に図13では、添付ファイルが存在する場合や、メール本文中に所定のキーワードが含まれる場合にも、添付ファイルのファイル名及び所定のキーワードがハイライト表示されると共に振動表示される。ここで所定のキーワードは、すべての宛先アドレスへのメール文書を対象にして登録されたものでもよいし、ある特定の宛先アドレスへのメール文書を対象に登録されたものでもよい。
 振動表示における振動量は、その注意喚起の度合いに応じて変化してもよい。例えば、宛先アドレスの振動量は、当該宛先アドレスへの送信が誤送信である可能性が高いほど、大きくなってもよい。つまり、宛先アドレスの振動量は、図11に示すように、当該宛先アドレスとは異なる宛先アドレスの領域にメール本文特徴ベクトルが存在する場合において、メール本文類似度モデルからの距離である信頼度の絶対値が大きくなるに従って、大きくなってもよい。
 更に、宛先アドレスの振動量は、その信頼度が所定の範囲である場合(例えば、当該宛先アドレスとは異なる宛先アドレスの領域にメール本文特徴ベクトルが存在するものの、メール本文類似度モデルからの距離である信頼度の絶対値が十分には大きくない場合)に、宛先アドレスが電子メールの送信元にとって初めての送信先であること、宛先アドレスが電子メールの送信元のドメインとは異なるドメインを有すること、宛先アドレスが特定のドメインを有すること、宛先アドレスが電子メールのBCC欄に記載すべきものであること、の少なくとも1つに該当する場合に、その該当数に応じて、大きくなってもよい。さらには、振動表示以外により注意喚起を高めるような表示方法を用いてもよい。これらの条件に該当するか否かについては、制御部14が、宛先アドレス及び過去の電子メールの送信情報に基づいて判定する。
 ここで、宛先アドレスが電子メールのBCC欄に記載すべきものであるか否かの判定方法について、図14乃至図16を用いて説明する。
 図14は、頻度表を示す図である。頻度表とは、宛先アドレスがTO欄、CC欄のいずれに記載されたかを問わず、過去に電子メールを同時送信したことがある宛先アドレスのペアと、その送信回数(頻度数)と、当該ペアへ最後に同時送信した日時(最終更新日時)と、をまとめて示すものである。ここでの頻度表は、送信元を問わず、宛先アドレスのペア、頻度数、最終更新日時をまとめたものであるが、送信元毎に、宛先アドレスのペア、頻度数、最終更新日時をまとめたものであってもよい。
 例えば、過去のある時刻に送信した電子メールに設定された宛先アドレス(TO欄、CC欄のいずれでも可)が“aaa@aaa.com”、“bbb@bbb.com”、“ccc@ccc.com”である場合、次のように3組の宛先アドレスのペア(“アドレス1”;“アドレス2”)が抽出される。
“アドレス1”      ;“アドレス2”
“aaa@aaa.com”;“bbb@bbb.com”
“aaa@aaa.com”;“ccc@ccc.com”
“bbb@bbb.com”;“ccc@ccc.com”
 頻度表には、上記の3組の宛先アドレスのペアを含む、過去に同時送信されたすべての宛先アドレスのペアが項目として設けられている。そして、それぞれのペアの項目には、過去のすべての電子メールの同時送信が考慮された頻度数及び最終更新日時が記述されている。
 図15は、宛先アドレスがBCC欄に記載すべきものであるかを判定するためのBCC判定ルーチンを示すフローチャートである。
 ステップS101では、制御部14は、送信予定の電子メールのTO欄及びCC欄より、すべての宛先アドレスを抽出して、ステップS102へ進む。
 ステップS102では、制御部14は、最初の宛先アドレスのペアを選択して、ステップS103へ進む。例えば、ステップS101で3つの宛先アドレスが抽出された場合、3組の宛先アドレスのペアが存在する。この場合、3組の宛先アドレスのペアの中から最初の1組のペアが選択される。
 ステップS103では、制御部14は、ステップS102で選択された当該ペアの頻度数が所定値以上であるか否かを判定し、肯定判定のときはステップS104へ進み、否定判定のときはステップS105へ進む。ここでは、頻度数が所定値以上であるペアは、深いつながりがある宛先アドレス同士であるとみなされる。
 ステップS104では、制御部14は、当該ペアは深いつながりがあると考えられるので、当該ペアをマークして、ステップS105へ進む。
 ステップS105では、制御部14は、すべてのペアを選択したか否かを判定し、肯定判定のときはステップS107へ進み、否定判定のときはステップS106へ進む。例えば、送信予定の電子メールのTO欄及びCC欄に合わせて4つの宛先アドレスがあって、6組の宛先アドレスのペアが存在する場合、6組すべての宛先アドレスのペアが選択されたか否かが判定される。
 ステップS106では、制御部14は、次の宛先アドレスのペアを選択して、ステップS103へ戻る。ステップS103からステップS106までの処理が繰り返し実行され、すべての宛先アドレスのペアについてマークするか否かが判定されると、ステップS107へ進む。
 ステップS107では、制御部14は、マークされたペアを用いて、送信予定の電子メールのすべての宛先アドレスについてグループ化を行う。最初に、制御部14は、マークされたそれぞれのペアを1つのグループとみなす。次に、制御部14は、2つのグループを対比して、共通する宛先アドレスがある場合には、当該2つのグループを1つのグループにする。なお、共通する宛先アドレスがない場合には、当該2つのグループは、それぞれ別々のグループのままである。制御部14は、すべてのグループ同士を対比して、共通する宛先アドレスがなくなるまで、グループ化を行う。
 さらに、制御部14は、ステップS104において、他のいずれの宛先アドレスとのペアにおいてもマークされなかった宛先アドレスの各々を、1つのグループとする。そして、ステップS108へ進む。
 なお、各々の宛先アドレスをノード、二つの宛先アドレス間の関連付けをエッジ、頻度数をエッジの重み付けとすれば、ステップS102からステップS107までの処理は、所定の重み付け以上のエッジで結ばれるノードの集合体(クラスタ)を作るという汎用的な問題と同じである。すなわち、関連性の高い宛先アドレスのグループを作ることができれば、ステップS102からステップS107までの処理は、これに限定されるものではない。
 ステップS108では、制御部14は、全てのグループ数をカウントして、BCC送信すべきかを判定するためのBCC判定値を演算する。ここで、BCC判定値は、当該グループ数を、すべての宛先アドレスの数(ステップS101で抽出された数)で除した値である。
 ステップS109では、制御部14は、BCC判定値が所定値より大きいか否かを判定し、肯定判定のときはステップS110へ進み、否定判定のときはステップS111へ進む。この所定値は、ゼロ以上1未満の数であり、ステップS101で抽出された宛先アドレス相互間において、深いつながりが存在する度合いを判定するための閾値である。
 つまり、BCC判定値がこの所定値より大きい場合は、深いつながりを持った宛先アドレスで作られるグループの数が、元の宛先アドレスの総数に近いこと、換言すれば、個々の宛先アドレス相互間において深いつながりがあまり存在しないこと示す。
 一般に、BCC送信は、互いに相互関係のない多くの宛先アドレスに同時送信する場合に実施される。したがって、BCC判定値がこの所定値より大きい場合は、当該電子メールをBCCにて送信すべきと考えられる。他方、BCC判定値がこの所定値以下である場合は、宛先アドレス相互間で深いつながりが十分に存在することから、電子メールはBCCで送信しなくてもよいと考えられる。
 ステップS110では、制御部14は、電子メールをBCC送信すべきと判定して、電子メールをBCC送信すべきである旨を表示部12に表示させて、ステップS111へ進む。
 ステップS111では、制御部14は、頻度表を更新して、本ルーチンを終了する。本ステップでは、詳しくは次の頻度表更新ルーチンが実行される。
 図16は、頻度表更新ルーチンを示すフローチャートである。なお、頻度表の更新は、必ずしもステップS111のタイミングで行われる必要はなく、一日のうちの所定の時刻で行われてもよい。
 ステップS121では、制御部14は、送信予定の電子メールのTO欄及びCC欄より、すべての宛先アドレスを抽出して、ステップS122へ進む。
 ステップS122では、制御部14は、最初の宛先アドレスのペアを選択して、ステップS123へ進む。
 ステップS123では、制御部14は、ステップS122で選択された当該ペアが頻度表にあるか否かを判定し、肯定判定のときはステップS124へ進み、否定判定のときはステップS127へ進む。
 ステップS124では、制御部14は、当該ペアの頻度数をインクリメント(1増加)して、ステップS125へ進む。
 ステップS125では、制御部14は、すべてのペアを選択したかを判定し、肯定判定のときはステップS128へ進み、否定判定のときはステップS126へ進む。
 ステップS126では、制御部14は、次のペアを選択して、ステップS123へ戻る。
 ステップS127では、制御部14は、当該ペアを頻度表に登録して、当該ペアの頻度数1を設定して、ステップS125へ進む。
 例えば、過去のある時刻に送信した電子メールの宛先アドレス(TO欄、CC欄のいずれでも可)が“aaa@aaa.com”、“bbb@bbb.com”、“ccc@ccc.com”である場合、次の3組の宛先アドレスのペアが抽出される。
 “アドレス1”      ;“アドレス2”
“aaa@aaa.com”;“bbb@bbb.com”
“aaa@aaa.com”;“ccc@ccc.com”
“bbb@bbb.com”;“ccc@ccc.com”
 この場合、先頭の項目(“aaa@aaa.com”;“bbb@bbb.com”)は、図14で示した頻度表になかったので新たに頻度表に登録され、先頭の項目のペアの頻度数が1に設定されている。他方、残りの項目は、既に頻度表にあったことから、残りの項目のそれぞれのペアの頻度数が1増加(インクリメント)し、その結果、それぞれの頻度数が4から5及び1から2に設定されている。
 ステップS128では、制御部14は、頻度表から所定時間経過した項目を削除して、本ルーチンを終了する。ここでは、制御部14は、例えば頻度表の各ペアについて最終更新日時が現時点から所定時間以上前であるか否かを判定し、所定のペアがこの条件に該当する場合に、上記所定のペアを頻度表から削除する。制御部14は、このように頻度表を常に更新することにより、電子メールをBCC送信するか否かの判定精度を維持している。
 ここでは、図15及び図16に示す処理をメールクライアント10の制御部14が実行した事例を示したが、メール誤送信判定装置30などサーバ側が実行してもよい。
 再び図12に戻って、ステップS42では、制御部14は、表示部12に表示された送信ボタン(図13右上部参照)が押された(クリックされた)か否かを判定し、肯定判定の場合はステップS43へ進み、否定判定の場合はステップS44へ進む。
 ステップS43では、制御部14は、メール文書をメールサーバ50へ送信して、本ルーチンを終了する。ここでは、ユーザが宛先アドレスを確認した上で強制送信を指示したと考えられるので、メール文書がメールサーバ50へ強制的に送信される。
 ステップS44では、制御部14は、表示部12に表示されたキャンセルボタン(図13右上部参照)が押された(クリックされた)か否かを判定し、肯定判定の場合はステップS45へ進み、否定判定の場合はステップS46へ進む。
 ステップS45では、制御部14は、メール文書を破棄(消去)して、本ルーチンを終了する。
 ステップS46では、制御部14は、候補宛先アドレスがあるか(メール誤送信判定装置30から送信されたか)を判定し、肯定判定の場合はステップS47へ進み、否定判定の場合はステップS50へ進む。
 ステップS47では、制御部14は、表示画面上の宛先アドレスの位置にカーソルがあてられるなど所定の操作がされたことを検出すると、プルダウンメニューを表示させて、ステップS48へ進む。
 図17は、宛先アドレス及び候補宛先アドレスが含まれたプルダウンメニューが表示された時の状態を示す図である。プロダウンメニューは、ユーザに宛先アドレス又は候補宛先アドレスの選択を促すものである。そのため、プルダウンメニューには、最上部に宛先アドレスが表示され、続いて、候補宛先アドレスがその信頼度の高い順に上部から表示されている。
 ステップS48では、制御部14は、プルダウンメニューの宛先アドレス又はいずれかの候補宛先アドレスがユーザによって選択されたかを判定し、宛先アドレス又はいずれかの候補宛先アドレスが選択されたと判定すると、ステップS49へ進む。
 ステップS49では、制御部14は、新たな送信先として、ステップS48で選択されたアドレス(宛先アドレス又は候補宛先アドレス)を設定して、ステップS42へ戻る。この結果、プルダウンメニューから選択されたアドレスが新たな宛先アドレスとなり、再びステップS42以降の処理が実行される。
 ステップS50では、制御部14は、送信先が最初の宛先アドレスのままであるかを判定し、肯定判定の場合はステップS41へ戻り、否定判定の場合はステップS42へ戻る。そして、再び、ステップS41又はステップS42以降の処理が実行される。
 以上のように、メールクライアント10は、電子メールの送信を保留する際に、宛先アドレスを振動表示することによって、ユーザに宛先アドレスへ注意を喚起させることができる。さらに、メールクライアント10は、現在の宛先アドレスに代わる候補宛先アドレスをユーザに提示することができる。
 また、メールクライアント10は、複数の候補宛先アドレスがある場合には、優先順位の高い候補宛先アドレスから(例えば、優先順位のより高い候補宛先アドレスをプルダウンメニューの上位にして)、ユーザに提示することもできる。
 なお、本発明は、上述した実施形態に限定されるものではなく、特許請求の範囲に記載された事項の範囲内で設計変更されたものにも適用可能である。
 例えば、図1では、メール誤送信判定装置30は、メールクライアント10又はメールサーバ50と独立して構成されているが、メールクライアント10又はメールサーバ50に組み込まれた構成でもよい。
 上述した実施形態では、図4に示すメール誤送信判定装置30に送信されたすべてのメール文書から宛先アドレスが抽出され、抽出されたすべての宛先アドレスがアドレス帳32に登録されている。しかし、この例に限らず、メール誤送信の判定結果を経て送信された電子メールの宛先アドレスのみが、アドレス帳32に登録されてもよい。
 また、図4に示すメール文書解析部31は、メール本文のみについて形態素解析を行ったが、電子メールに含まれているテキスト情報であれば、メールヘッダ、その他の情報を含めて形態素解析してもよい。
 メール本文類似度モデルは、SVMに限定されるものではなく、メール本文が特定の宛先アドレスに関するものであることの確からしさを統計的に示すものであれば、特に限定されるものではない。メール本文類似度モデルは、例えば、ナイーブベイズ、決定木(CART)、最大エントロピー(ME)モデルなどを用いてもよい。
 本実施形態のメール本文類似度モデルは、メール誤送信判定装置30に送信されたすべてのメール文書のメール本文特徴ベクトルに基づいて、最初から、逐次更新されたものである。但し、メール本文類似度モデルは、過去の所定時点に生成されたものをベースにして、例えば、本日分のメール文書のメール本文特徴ベクトルとの差分を反映したものでもよい。
 また、図4に示した宛先アドレス妥当性判定部40は、メール誤送信判定装置30ではなく、メールクライアント10内にあってもよい。
 この場合、図2に示したメールクライアント10の制御部14は、上述したような宛先アドレス妥当性判定部40の機能を有することとなり、メール誤送信判定装置30から送信された各信頼度を用いて、図10に示したステップS34~S37の処理を繰り返し実行する。このように、メールクライアント10が、メール誤送信か否かの最終判断を行ってもよい。
 [第2実施形態]
 本発明の第2実施形態に係るメール誤送信判定装置30は、候補宛先アドレスを生成することなく、送信対象の電子メールについて誤送信であるかを判定する。この場合、図10に示す誤送信判定処理ルーチンにおいて、ステップS32の候補宛先アドレスの選択処理、ステップS33、S36及びS37が省略される。また、ステップS34では、第1の実施形態と異なり、次の処理が実行される。
 ステップS34では、宛先アドレス妥当性判定部40は、「宛先アドレスに対する信頼度」が所定の閾値よりも大きいか否かを判定し、肯定判定の場合は誤送信の可能性が低いと判定し、否定判定の場合は誤送信の可能性が高いと判定し、この判定結果をメールクライアント10へ送信する。
 メールクライアント10は、メール誤送信判定装置30による判定結果を用いて、電子メールの誤送信の可能性が低い場合には当該電子メールを送信し、電子メールの誤送信の可能性が高い場合には当該電子メールの送信を一時的に保留して、注意喚起表示することができる。
 図18は、第2実施形態において注意喚起表示を行うための注意喚起表示ルーチンを実行するためのフローチャートである。本ルーチンのステップS51~S55は、図12に示した注意喚起表示ルーチンのステップS41~S45に対応している。但し、ステップS54では、制御部14は、表示部12に表示されたキャンセルボタンが押された(クリックされた)か否かを判定し、肯定判定の場合はステップS55へ進み、否定判定の場合はステップS51へ戻る。
 ここで、メールクライアント10は、メール誤送信判定装置30から送信された信頼度をそのままユーザに提示することで、メール送信の最終判断をユーザに仰ぐようにしてもよい。
 なお、上述したメールクライアント10、メール誤送信判定装置30及びメールサーバ50は、ハードウェア構成に限らず、上述した処理を実行させるためのプログラムがインストールされた汎用コンピュータであってもよい。
 また、第2実施形態においても、図4に示した宛先アドレス妥当性判定部40は、メール誤送信判定装置30ではなく、メールクライアント10内にあってもよい。
 この場合、図2に示したメールクライアント10の制御部14は、上述したような宛先アドレス妥当性判定部40の機能を有することとなり、メール誤送信判定装置30から送信された信頼度を用いて、先述した第2実施形態でのステップS34の処理を実行する。このように、メールクライアント10が、メール誤送信か否かの最終判断を行ってもよい。
10 メールクライアント
30 メール誤送信判定装置
31 メール文書解析部
32 アドレス帳
33 候補宛先アドレス選択部
34 名詞辞書
35 メール本文特徴ベクトル生成部
36 メール本文特徴ベクトル蓄積部
37 メール本文類似度モデル生成部
38 メール本文類似度モデル蓄積部
39 信頼度算出部
40 宛先アドレス妥当性判定部
50 メールサーバ

 

Claims (10)

  1.  送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、
      送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、
     前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、
     前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、電子メールに含まれる単語の数を次元数とする単語空間において、前記送信先に対応付けられた特徴情報の単語空間領域と、前記他の送信先に対応付けられた特徴情報の単語空間領域と、を分離するものであって、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、
     前記特徴情報生成部により生成された前記送信対象の電子メールの内容に関する特徴情報と、前記類似度モデル生成部により生成された前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記類似度モデル生成部により生成された前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、
     を備えた電子メール誤送信判定装置。
  2.  前記信頼度算出部により算出された各信頼度を比較することにより、前記送信対象の電子メールの前記送信先について誤りの可能性が高いか否かを判定する誤送信判定部を更に備えた
     請求項1に記載の電子メール誤送信判定装置。
  3.  前記誤送信判定部により前記送信対象の電子メールの前記送信先について誤りの可能性が高いと判定された場合に、前記送信対象の電子メールの送信先の信頼度よりも高い信頼度の送信先候補を選択する選択部を更に備えた
     請求項2に記載の電子メール誤送信判定装置。
  4.  前記送信先候補選択部は、前記送信先からドメイン部を除いたローカル部を用いて、前記送信先候補を選択する
     請求項1に記載の電子メール誤送信判定装置。
  5.  前記送信先候補選択部は、前記送信先に付加されたコメント部を更に用いて、前記送信先候補を選択する
     請求項1に記載の電子メール誤送信判定装置。
  6.  送信先が指定された送信対象の電子メールを作成する電子メール作成部と、
     送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、電子メールに含まれる単語の数を次元数とする単語空間において、前記送信先に対応付けられた特徴情報の単語空間領域と、前記他の送信先に対応付けられた特徴情報の単語空間領域と、を分離するものであって、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、前記特徴情報生成部により生成された前記送信対象の電子メールの内容に関する特徴情報と、前記類似度モデル生成部により生成された前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記類似度モデル生成部により生成された前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、前記信頼度算出部により算出された各信頼度を比較することにより、前記送信対象の電子メールの前記送信先について誤りの可能性が高いか否かを判定する誤送信判定部と、を有し、前記電子メール作成部により作成された前記送信対象の電子メールの送信先について誤りの可能性が高いか否かを判定する電子メール誤送信判定装置と、
     前記電子メール誤送信判定装置により前記送信先について誤りの可能性が高くないと判定されたときに前記送信対象の電子メールを送信し、前記送信先について誤りの可能性が高いと判定されたときに前記送信対象の電子メールの送信を保留する送信部と、
     を備えた電子メール送信システム。
  7.  送信先が指定された送信対象の電子メールを作成する電子メール作成部と、
     送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、電子メールに含まれる単語の数を次元数とする単語空間において、前記送信先に対応付けられた特徴情報の単語空間領域と、前記他の送信先に対応付けられた特徴情報の単語空間領域と、を分離するものであって、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、前記特徴情報生成部により生成された前記送信対象の電子メールの内容に関する特徴情報と、前記類似度モデル生成部により生成された前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記類似度モデル生成部により生成された前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、前記信頼度算出部により算出された各信頼度を比較することにより、前記送信対象の電子メールの前記送信先について誤りの可能性が高いか否かを判定する誤送信判定部と、前記誤送信判定部により前記送信対象の電子メールの前記送信先について誤りの可能性が高いと判定された場合に、前記送信対象の電子メールの送信先の信頼度よりも高い信頼度の送信先候補を選択する選択部と、を有し、前記電子メール作成部により作成された前記送信対象の電子メールの送信先について誤りの可能性が高いか否かを判定する電子メール誤送信判定装置と、
     前記電子メール誤送信判定装置の前記選択部により選択された送信先候補を表示する表示部と、
     前記電子メール誤送信判定装置により前記送信先について誤りの可能性が高くないと判定されたときに前記送信対象の電子メールを送信し、前記送信先について誤りの可能性が高いと判定されたときに前記送信対象の電子メールの送信を保留し、送信の保留中に前記表示部により表示された前記送信先候補の1つが指定されたときに、指定された送信先候補に前記送信対象の電子メールを送信する送信部と、
     を備えた電子メール送信システム。
  8.  コンピュータを、
     送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、
      送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、
     前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、
     前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、電子メールに含まれる単語の数を次元数とする単語空間において、前記送信先に対応付けられた特徴情報の単語空間領域と、前記他の送信先に対応付けられた特徴情報の単語空間領域と、を分離するものであって、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、
     前記特徴情報生成部により生成された前記送信対象の電子メールの内容に関する特徴情報と、前記類似度モデル生成部により生成された前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記類似度モデル生成部により生成された前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、
     して機能させるためのプログラムが記録された記録媒体。
  9.  コンピュータを、
     送信先が指定された送信対象の電子メールを作成する電子メール作成部と、
     送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、電子メールに含まれる単語の数を次元数とする単語空間において、前記送信先に対応付けられた特徴情報の単語空間領域と、前記他の送信先に対応付けられた特徴情報の単語空間領域と、を分離するものであって、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、前記特徴情報生成部により生成された前記送信対象の電子メールの内容に関する特徴情報と、前記類似度モデル生成部により生成された前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記類似度モデル生成部により生成された前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、前記信頼度算出部により算出された各信頼度を比較することにより、前記送信対象の電子メールの前記送信先について誤りの可能性が高いか否かを判定する誤送信判定部と、を有し、前記電子メール作成部により作成された前記送信対象の電子メールの送信先について誤りの可能性が高いか否かを判定する電子メール誤送信判定装置と、
     前記電子メール誤送信判定装置により前記送信先について誤りの可能性が高くないと判定されたときに前記送信対象の電子メールを送信し、前記送信先について誤りの可能性が高いと判定されたときに前記送信対象の電子メールの送信を保留する送信部と、
     を備えた電子メール送信システムの各部として機能させるためのプログラムが記録された記録媒体。
  10.  コンピュータを、
     送信先が指定された送信対象の電子メールを作成する電子メール作成部と、
     送信対象の電子メールの内容に関する特徴情報を生成する特徴情報生成部と、送信済の電子メールの内容に関する特徴情報と当該電子メールの送信先とを対応付けて蓄積する蓄積部と、前記送信対象の電子メールの送信先に類似する送信先候補を送信済みの電子メールの送信先の中から選択する送信先候補選択部と、前記蓄積部に蓄積された送信先毎に、当該送信先に対応付けられて前記蓄積部に蓄積されている前記特徴情報と、前記送信先とは異なる他の送信先に対応づけられて前記蓄積部に蓄積されている前記特徴情報と、に基づいて、電子メールに含まれる単語の数を次元数とする単語空間において、前記送信先に対応付けられた特徴情報の単語空間領域と、前記他の送信先に対応付けられた特徴情報の単語空間領域と、を分離するものであって、任意の電子メールの内容に関する特徴情報が、前記送信先に対応付けられた特徴情報の単語空間領域に属するかの判定基準となる類似度モデルを生成する類似度モデル生成部と、前記特徴情報生成部により生成された前記送信対象の電子メールの内容に関する特徴情報と、前記類似度モデル生成部により生成された前記送信対象の電子メールの送信先に関する前記類似度モデルと、前記類似度モデル生成部により生成された前記送信先候補に関する前記類似度モデルと、に基づいて、前記送信対象の電子メールの送信先及び送信先候補の各信頼度を算出する信頼度算出部と、前記信頼度算出部により算出された各信頼度を比較することにより、前記送信対象の電子メールの前記送信先について誤りの可能性が高いか否かを判定する誤送信判定部と、前記誤送信判定部により前記送信対象の電子メールの前記送信先について誤りの可能性が高いと判定された場合に、前記送信対象の電子メールの送信先の信頼度よりも高い信頼度の送信先候補を選択する選択部と、を有し、前記電子メール作成部により作成された前記送信対象の電子メールの送信先について誤りの可能性が高いか否かを判定する電子メール誤送信判定装置と、
     前記電子メール誤送信判定装置の前記選択部により選択された送信先候補を表示する表示部と、
     前記電子メール誤送信判定装置により前記送信先について誤りの可能性が高くないと判定されたときに前記送信対象の電子メールを送信し、前記送信先について誤りの可能性が高いと判定されたときに前記送信対象の電子メールの送信を保留し、送信の保留中に前記表示部により表示された前記送信先候補の1つが指定されたときに、指定された送信先候補に前記送信対象の電子メールを送信する送信部と、
     を備えた電子メール送信システムの各部として機能させるためのプログラムが記録された記録媒体。

     
PCT/JP2015/076040 2015-04-10 2015-09-14 電子メール誤送信判定装置、電子メール送信システム及び記録媒体 WO2016163043A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/565,678 US10311408B2 (en) 2015-04-10 2015-09-14 Electronic mail wrong transmission determination apparatus, electronic mail transmission system, and recording medium
EP15888534.3A EP3309686B1 (en) 2015-04-10 2015-09-14 Electronic mail transmission error determination device, electronic mail transmission system, and recording medium
US16/412,147 US11100471B2 (en) 2015-04-10 2019-05-14 Warning apparatus for preventing electronic mail wrong transmission, electronic mail transmission system, and program

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2015-080864 2015-04-10
JP2015080864A JP5810240B1 (ja) 2015-04-10 2015-04-10 電子メール誤送信判定装置、電子メール送信システム及びプログラム
JP2015115282A JP5876181B1 (ja) 2015-06-05 2015-06-05 電子メールの誤送信防止用の注意喚起装置、電子メール送信システム及びプログラム
JP2015-115282 2015-06-05

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US15/565,678 A-371-Of-International US10311408B2 (en) 2015-04-10 2015-09-14 Electronic mail wrong transmission determination apparatus, electronic mail transmission system, and recording medium
US16/412,147 Continuation US11100471B2 (en) 2015-04-10 2019-05-14 Warning apparatus for preventing electronic mail wrong transmission, electronic mail transmission system, and program

Publications (1)

Publication Number Publication Date
WO2016163043A1 true WO2016163043A1 (ja) 2016-10-13

Family

ID=57072334

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/076040 WO2016163043A1 (ja) 2015-04-10 2015-09-14 電子メール誤送信判定装置、電子メール送信システム及び記録媒体

Country Status (3)

Country Link
US (2) US10311408B2 (ja)
EP (1) EP3309686B1 (ja)
WO (1) WO2016163043A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10311408B2 (en) * 2015-04-10 2019-06-04 Soliton Systems K.K. Electronic mail wrong transmission determination apparatus, electronic mail transmission system, and recording medium
GB2555580A (en) * 2016-10-28 2018-05-09 Egress Software Tech Ltd Controlling data transmission
US20190182197A1 (en) * 2017-10-10 2019-06-13 Soliton Systems K.K. Warning apparatus for preventing electronic mail wrong transmission, electronic mail transmission system, and program
CN110034999A (zh) * 2018-12-04 2019-07-19 阿里巴巴集团控股有限公司 防止误操作的消息发送方法和系统
US11206234B2 (en) * 2020-01-13 2021-12-21 International Business Machines Corporation Validating proposed message recipients based on number of message keywords
FR3111718B1 (fr) * 2020-06-25 2024-01-19 Orange Procédé d’aide à la saisie de destinataires dans un courrier électronique, produit programme d'ordinateur, médium de stockage et dispositif correspondant
US20220131896A1 (en) * 2020-10-26 2022-04-28 Mcafee, Llc Contextual Data Security
US11941358B2 (en) 2021-06-14 2024-03-26 Asapp, Inc. Identifying messages entered into an incorrect conversation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241881A (ja) * 2006-03-10 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2010134811A (ja) * 2008-12-08 2010-06-17 Nomura Research Institute Ltd 宛先正否判定システム
JP2014010698A (ja) * 2012-06-29 2014-01-20 Kddi Corp 送信制御装置、送信制御方法、およびプログラム

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05225086A (ja) 1992-02-07 1993-09-03 Fuji Xerox Co Ltd メッセージ転送システム
JP3663844B2 (ja) 1997-07-10 2005-06-22 富士ゼロックス株式会社 電子メール送信制御装置及び方法
US6192165B1 (en) * 1997-12-30 2001-02-20 Imagetag, Inc. Apparatus and method for digital filing
US6161130A (en) 1998-06-23 2000-12-12 Microsoft Corporation Technique which utilizes a probabilistic classifier to detect "junk" e-mail by automatically updating a training and re-training the classifier based on the updated training set
US6601059B1 (en) * 1998-12-23 2003-07-29 Microsoft Corporation Computerized searching tool with spell checking
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7286115B2 (en) * 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
EP1192716B1 (en) * 1999-05-27 2009-09-23 Tegic Communications, Inc. Keyboard system with automatic correction
US6671718B1 (en) * 1999-06-28 2003-12-30 Mark Meister Email client application incorporating an active transmit authorization request
US6564264B1 (en) * 1999-12-08 2003-05-13 At&T Corp. System, apparatus and method for automatic address updating of outgoing and incoming user messages in a communications network
US6816884B1 (en) * 2000-01-27 2004-11-09 Colin T. Summers System and method for creating conversationally-styled summaries from digesting email messages
US7822977B2 (en) * 2000-02-08 2010-10-26 Katsikas Peter L System for eliminating unauthorized electronic mail
US8132110B1 (en) * 2000-05-04 2012-03-06 Aol Inc. Intelligently enabled menu choices based on online presence state in address book
US7320019B2 (en) * 2000-11-30 2008-01-15 At&T Delaware Intellectual Property, Inc. Method and apparatus for automatically checking e-mail addresses in outgoing e-mail communications
US20020087647A1 (en) * 2000-12-28 2002-07-04 Pitney Bowes Incorporated Method for determining a correct recipient for an undeliverable e-mail message
US7543026B2 (en) * 2000-12-28 2009-06-02 Quine Douglas B System and method for address correction of electronic messages
US6745193B1 (en) * 2001-01-25 2004-06-01 Microsoft Corporation System and method for defining, refining, and personalizing communications policies in a notification platform
US6694353B2 (en) * 2001-03-28 2004-02-17 Good Contacts.Com Method and system for automatically updating electronic mail address information within an electronic mail address database
US7657935B2 (en) * 2001-08-16 2010-02-02 The Trustees Of Columbia University In The City Of New York System and methods for detecting malicious email transmission
JP2003076641A (ja) * 2001-08-16 2003-03-14 Internatl Business Mach Corp <Ibm> 電子メール・システム、配信先リストの更新方法およびコンピュータ装置
US7433923B2 (en) * 2001-10-03 2008-10-07 Reginald Adkins Authorized email control system
US20030093483A1 (en) * 2001-11-13 2003-05-15 Allen Kram Henry System and method for facilitating email communications by providing convenient access to most recently and/or frequently used email addresses
JP2003242176A (ja) * 2001-12-13 2003-08-29 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
US7149780B2 (en) * 2001-12-14 2006-12-12 Pitney Bowes Inc. Method for determining e-mail address format rules
US7050822B2 (en) * 2002-10-31 2006-05-23 Nokia Corporation Method for providing a best guess for an intended recipient of a message
US7672267B2 (en) * 2003-02-07 2010-03-02 Sybase 365, Inc. Intermediary network system and method for facilitating message exchange between wireless networks
US7613776B1 (en) * 2003-03-26 2009-11-03 Aol Llc Identifying and using identities deemed to be known to a user
US20050010644A1 (en) * 2003-07-07 2005-01-13 Brown Scott T. High performance electronic message delivery engine
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP2005225086A (ja) 2004-02-13 2005-08-25 Mitsubishi Pencil Co Ltd 液体塗布具
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US7237010B2 (en) * 2004-03-18 2007-06-26 International Business Machines Corporation Method, system and computer program product for generating and processing a disposable email address
US9460346B2 (en) * 2004-04-19 2016-10-04 Google Inc. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20060026244A1 (en) * 2004-07-30 2006-02-02 Xerox Corporation Electronic mail system having a recipient field modifier function
US7620387B2 (en) * 2004-12-22 2009-11-17 Research In Motion Limited Entering contacts in a communication message on a mobile device
US7801925B2 (en) * 2004-12-22 2010-09-21 United States Postal Service System and method for electronically processing address information
US7689654B2 (en) * 2005-03-21 2010-03-30 Sandisk Corporation Email address verification
US20060218088A1 (en) * 2005-03-24 2006-09-28 Flora John R Intelligent auto-fill transaction data
US20070067394A1 (en) * 2005-09-16 2007-03-22 Neil Adams External e-mail detection and warning
EP1929731B1 (en) * 2005-09-27 2016-11-09 Morgan Stanley Rule-based electronic message processing
US7774421B2 (en) * 2005-10-14 2010-08-10 International Business Machines Corporation Mitigating address book weaknesses that permit the sending of e-mail to wrong addresses
US7970834B2 (en) * 2005-11-03 2011-06-28 International Business Machines Corporation Method and program product for tracking a file attachment in an e-mail
AU2006201479B2 (en) * 2005-12-14 2006-07-06 Epip Pty Ltd Improved delivery of electronic documents into a postal network using 'ignore page'
US8402093B2 (en) * 2005-12-22 2013-03-19 Microsoft Corporation Workflow and in-context e-mail recipient handling
US7634463B1 (en) * 2005-12-29 2009-12-15 Google Inc. Automatically generating and maintaining an address book
US7657603B1 (en) * 2006-01-23 2010-02-02 Clearwell Systems, Inc. Methods and systems of electronic message derivation
US7743051B1 (en) * 2006-01-23 2010-06-22 Clearwell Systems, Inc. Methods, systems, and user interface for e-mail search and retrieval
US20070208868A1 (en) * 2006-03-03 2007-09-06 Kidd John T Electronic Communication Relationship Management System And Methods For Using The Same
JP2007241807A (ja) 2006-03-10 2007-09-20 Fujitsu Ltd 電子メール送信プログラム、電子メール送信装置、電子メール送信方法
JP4396657B2 (ja) * 2006-03-16 2010-01-13 ソニー株式会社 通信装置及び送信制御方法及び送信制御プログラム
JP4817952B2 (ja) 2006-04-25 2011-11-16 エヌ・ティ・ティ・コミュニケーションズ株式会社 メール誤送信防止システム、メール誤送信防止方法、およびメール誤送信防止プログラム
US8307038B2 (en) * 2006-06-09 2012-11-06 Microsoft Corporation Email addresses relevance determination and uses
US7836134B2 (en) * 2006-06-09 2010-11-16 Sony Ericsson Mobile Communications Ab E-mail address inspection
US7404439B2 (en) * 2006-07-11 2008-07-29 Frank J. Schuh, Inc. Horizontal drilling
US8495146B2 (en) * 2006-08-09 2013-07-23 International Business Machines Corporation Source initiated autonomic recipient e-mail address correction redistribution
US20110128389A1 (en) * 2006-08-23 2011-06-02 Nikon Corporation Electronic camera and server device
US8050983B1 (en) * 2006-10-31 2011-11-01 Amazon Technologies, Inc. Inhibiting inappropriate communications between users involving tranactions
JP2008123318A (ja) * 2006-11-14 2008-05-29 Sony Ericsson Mobilecommunications Japan Inc 通信端末、宛先正誤判定方法および宛先正誤判定プログラム
US8484296B2 (en) * 2006-11-17 2013-07-09 At&T Intellectual Property I, L.P. Systems and methods for displaying electronic mail messages
US20080168142A1 (en) * 2007-01-08 2008-07-10 International Business Machines Corporation Method for intelligent verification of electronic mail message addresses
US20090006391A1 (en) * 2007-06-27 2009-01-01 T Reghu Ram Automatic categorization of document through tagging
US8103726B2 (en) * 2007-08-17 2012-01-24 International Business Machines Corporation Analyzing email content to determine potential intended recipients
US8307039B2 (en) * 2007-10-24 2012-11-06 Research In Motion Limited Method for disambiguating email recipient fields in an electronic device
US8539029B2 (en) * 2007-10-29 2013-09-17 Microsoft Corporation Pre-send evaluation of E-mail communications
US8726165B1 (en) * 2007-11-01 2014-05-13 Google Inc. Methods for auto-completing contact entry on mobile devices
US8046416B2 (en) * 2007-12-13 2011-10-25 Pitney Bowes Inc. System and methods to determine a recipient for ambiguously addressed mail
US8990225B2 (en) * 2007-12-17 2015-03-24 Palo Alto Research Center Incorporated Outbound content filtering via automated inference detection
US20090182818A1 (en) * 2008-01-11 2009-07-16 Fortinet, Inc. A Delaware Corporation Heuristic detection of probable misspelled addresses in electronic communications
US9560003B2 (en) * 2008-02-14 2017-01-31 Gary Stephen Shuster Erroneous addressing prevention for electronic messaging
US8627231B2 (en) * 2008-03-28 2014-01-07 Sprint Communications Company L.P. List-position locator
US8280963B2 (en) * 2008-04-10 2012-10-02 Microsoft Corporation Caching and exposing pre-send data relating to the sender or recipient of an electronic mail message
US7925992B2 (en) * 2008-05-30 2011-04-12 International Business Machines Corporation Method to assist users in preventing errors when using type-ahead
US8171088B2 (en) * 2008-06-06 2012-05-01 International Business Machines Corporation Facilitating correction of incorrect identities in propagated electronic communications
US8214346B2 (en) * 2008-06-27 2012-07-03 Cbs Interactive Inc. Personalization engine for classifying unstructured documents
MX2011006340A (es) * 2008-12-12 2011-10-28 Atigeo Llc Suministro de recomendaciones utilizando la informacion determinada para dominios de interés.
JP5216637B2 (ja) * 2009-03-10 2013-06-19 株式会社富士通ソーシアルサイエンスラボラトリ メール誤送信防止装置,方法,およびプログラム
JP4731613B2 (ja) * 2009-04-24 2011-07-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 履歴情報付き電子メールの送信先のメールアドレスを検査する装置、方法及びコンピュータプログラム
JP2010271811A (ja) * 2009-05-20 2010-12-02 Panasonic Corp メール誤送信防止装置
US8495151B2 (en) * 2009-06-05 2013-07-23 Chandra Bodapati Methods and systems for determining email addresses
US20100332975A1 (en) * 2009-06-25 2010-12-30 Google Inc. Automatic message moderation for mailing lists
US8984074B2 (en) * 2009-07-08 2015-03-17 Yahoo! Inc. Sender-based ranking of person profiles and multi-person automatic suggestions
US8645480B1 (en) * 2009-07-19 2014-02-04 Aaron T. Emigh Trust representation by similarity
US8572084B2 (en) * 2009-07-28 2013-10-29 Fti Consulting, Inc. System and method for displaying relationships between electronically stored information to provide classification suggestions via nearest neighbor
US8620783B2 (en) * 2009-10-12 2013-12-31 Pitney Bowes Inc. System and method for providing redundant customer communications delivery using hybrid delivery channels
US8843568B2 (en) * 2010-05-17 2014-09-23 Microsoft Corporation Email tags
JP2012014573A (ja) 2010-07-02 2012-01-19 Orange Soft:Kk 宛先表示装置、宛先表示方法及び宛先表示プログラム
JP5481683B2 (ja) 2010-07-23 2014-04-23 Sky株式会社 メールアドレス誤入力判定システムおよびメールアドレス誤入力判定プログラム
US8812599B2 (en) * 2011-01-10 2014-08-19 Epic Systems Corporation Networked inbox
US8819152B2 (en) * 2011-01-25 2014-08-26 Kristy Joi Downing Email addressee verification systems and methods for the same
JP5665566B2 (ja) * 2011-01-26 2015-02-04 キヤノン株式会社 情報処理装置、メールボックス管理方法、およびそのプログラム
US8434150B2 (en) * 2011-03-24 2013-04-30 Microsoft Corporation Using social graphs to combat malicious attacks
JP5513437B2 (ja) 2011-04-25 2014-06-04 日本電信電話株式会社 電子メール誤送信防止システムとその方法と、ユーザ端末装置とユーザプロファイル記録装置
US9219752B2 (en) * 2011-08-26 2015-12-22 Hewlett-Packard Development Company, L.P. Data leak prevention systems and methods
US8521825B2 (en) * 2011-09-26 2013-08-27 International Business Machines Corporation Electronic message monitoring
US9075498B1 (en) * 2011-12-22 2015-07-07 Symantec Corporation User interface for finding similar documents
US9305083B2 (en) * 2012-01-26 2016-04-05 Microsoft Technology Licensing, Llc Author disambiguation
US8914451B2 (en) * 2012-02-17 2014-12-16 Blackberry Limited Electronic device configured with messaging composition interface
US9230244B2 (en) * 2012-03-29 2016-01-05 International Business Machines Corporation Recipient changes in email threads
US9171291B2 (en) * 2012-04-26 2015-10-27 Blackberry Limited Electronic device and method for updating message body content based on recipient changes
JP2013246798A (ja) * 2012-05-29 2013-12-09 Oki Data Corp 宛先入力装置及びプログラム、並びに、データ送信装置及びデータ送信プログラム
US9501746B2 (en) * 2012-11-05 2016-11-22 Astra Identity, Inc. Systems and methods for electronic message analysis
US10152611B2 (en) * 2013-02-08 2018-12-11 Arris Enterprises Llc Identifying and preventing leaks of sensitive information
US9047368B1 (en) * 2013-02-19 2015-06-02 Symantec Corporation Self-organizing user-centric document vault
US10115060B2 (en) * 2013-03-15 2018-10-30 The Rocket Science Group Llc Methods and systems for predicting a proposed electronic message as spam based on a predicted hard bounce rate for a list of email addresses
US9553896B2 (en) * 2013-05-06 2017-01-24 Veeva Systems Inc. System and method for controlling electronic communications
US20140344371A1 (en) * 2013-05-16 2014-11-20 Ean Schiller Communications device, system, and method for those lacking technical knowledge
JP6190174B2 (ja) 2013-06-17 2017-08-30 株式会社野村総合研究所 電子メールの送信制御システム及びプログラム
US9027207B2 (en) * 2013-07-03 2015-05-12 Christopher Lusher Paper clips with integral fastener
US10536428B2 (en) * 2013-07-12 2020-01-14 Skyhook Wireless, Inc. Processing multiple network address observations
US9270629B2 (en) * 2013-09-11 2016-02-23 Sap Se Personalised dynamic email addresses in enterprise environments
US9503405B2 (en) * 2013-10-15 2016-11-22 Ricoh Company, Ltd. Information processing system and method that record result of process that uses e-mail transmission
US9391942B2 (en) * 2013-10-17 2016-07-12 International Business Machines Corporation Symbolic variables within email addresses
US10447641B2 (en) * 2013-11-15 2019-10-15 Google Technology Holdings LLC Name composition assistance in messaging applications
RU2665239C2 (ru) * 2014-01-15 2018-08-28 Общество с ограниченной ответственностью "Аби Продакшн" Автоматическое извлечение именованных сущностей из текста
US8868409B1 (en) * 2014-01-16 2014-10-21 Google Inc. Evaluating transcriptions with a semantic parser
US8892672B1 (en) * 2014-01-28 2014-11-18 Fmr Llc Detecting unintended recipients of electronic communications
CN105099853A (zh) * 2014-04-25 2015-11-25 国际商业机器公司 用于防止消息误发的方法和系统
US9509650B2 (en) * 2014-08-29 2016-11-29 Betteremailing, Llc Electronic message management with conversation participation status
US20160062984A1 (en) * 2014-09-03 2016-03-03 Lenovo (Singapore) Pte. Ltd. Devices and methods for determining a recipient for a message
US20170041275A1 (en) * 2015-02-14 2017-02-09 Open Invention Network, Llc Electronic Correspondence Addressee Verification Systems and Methods for the Same
US10311408B2 (en) * 2015-04-10 2019-06-04 Soliton Systems K.K. Electronic mail wrong transmission determination apparatus, electronic mail transmission system, and recording medium
US10805311B2 (en) * 2016-08-22 2020-10-13 Paubox Inc. Method for securely communicating email content between a sender and a recipient

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241881A (ja) * 2006-03-10 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2010134811A (ja) * 2008-12-08 2010-06-17 Nomura Research Institute Ltd 宛先正否判定システム
JP2014010698A (ja) * 2012-06-29 2014-01-20 Kddi Corp 送信制御装置、送信制御方法、およびプログラム

Also Published As

Publication number Publication date
EP3309686A4 (en) 2019-04-17
US20190266570A1 (en) 2019-08-29
US11100471B2 (en) 2021-08-24
US10311408B2 (en) 2019-06-04
US20180075414A1 (en) 2018-03-15
EP3309686A1 (en) 2018-04-18
EP3309686B1 (en) 2020-08-19

Similar Documents

Publication Publication Date Title
WO2016163043A1 (ja) 電子メール誤送信判定装置、電子メール送信システム及び記録媒体
US10460029B2 (en) Reply information recommendation method and apparatus
KR100918599B1 (ko) 잠재적 수신자를 식별하는 방법 및 장치
CA2859131C (en) Systems and methods for spam detection using character histograms
EP3447656A1 (en) System and method of language processing
CN110990546B (zh) 智能问答语料库更新方法和装置
EP3921992B1 (en) Method and system for processing data packages
JP2008538023A (ja) 電子メールを処理する方法およびシステム
US8521825B2 (en) Electronic message monitoring
JP5876181B1 (ja) 電子メールの誤送信防止用の注意喚起装置、電子メール送信システム及びプログラム
CN113939812A (zh) 使用自然语言输入生成查询
US20190182197A1 (en) Warning apparatus for preventing electronic mail wrong transmission, electronic mail transmission system, and program
US8843574B2 (en) Electronic mail system, user terminal apparatus, information providing apparatus, and computer readable medium
US20190228055A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP5810240B1 (ja) 電子メール誤送信判定装置、電子メール送信システム及びプログラム
CN105324768A (zh) 使用准确度简档的动态查询解析
US20180307669A1 (en) Information processing apparatus
JP4746083B2 (ja) 宛先正否判定システム
US20180026930A1 (en) Method and System for Automatic Content Based E-mail Recipient Determination
US20200274874A1 (en) Communication control apparatus, communication system, and non-transitory computer readable medium
JP2014020797A (ja) 文書配信システム、文書配信装置
JP2002132661A (ja) 自動応答装置及び自動応答方法及び自動応答プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007122148A (ja) 電子メール分類装置および電子メール分類方法
US20230334243A1 (en) Document Processing Method And Information Processing Device
JP2012027719A (ja) メールアドレス誤入力判定システムおよびメールアドレス誤入力判定プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15888534

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 15565678

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2015888534

Country of ref document: EP