JP5626001B2 - E-mail capacity reduction support device, e-mail capacity reduction support method, and program - Google Patents

E-mail capacity reduction support device, e-mail capacity reduction support method, and program Download PDF

Info

Publication number
JP5626001B2
JP5626001B2 JP2011037427A JP2011037427A JP5626001B2 JP 5626001 B2 JP5626001 B2 JP 5626001B2 JP 2011037427 A JP2011037427 A JP 2011037427A JP 2011037427 A JP2011037427 A JP 2011037427A JP 5626001 B2 JP5626001 B2 JP 5626001B2
Authority
JP
Japan
Prior art keywords
mail
quote
quoted
text
email
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011037427A
Other languages
Japanese (ja)
Other versions
JP2012174133A (en
Inventor
晃平 上田
晃平 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011037427A priority Critical patent/JP5626001B2/en
Publication of JP2012174133A publication Critical patent/JP2012174133A/en
Application granted granted Critical
Publication of JP5626001B2 publication Critical patent/JP5626001B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、受信した電子メールの容量(以下「メール容量」とする)削減を支援するための、メール容量削減支援装置、メール容量削減支援方法、及びこれらを実現するためのプログラムに関する。   The present invention relates to a mail capacity reduction support device, a mail capacity reduction support method, and a program for realizing these, to support the reduction of received electronic mail capacity (hereinafter referred to as “mail capacity”).

近年、電子メールの利用はますます拡大しており、大量に受信した電子メールを効率的に整理することが必要になってきている。電子メールを大量に受信すると、電子メールの保存のために確保すべき記憶容量(以下「メール容量」とする。)が増大し、システム環境を圧迫することがあるため、メール容量をできるだけ削減することが特に重要になってきている。   In recent years, the use of e-mail has been increasing, and it has become necessary to efficiently organize a large amount of received e-mails. When a large amount of e-mails are received, the storage capacity (hereinafter referred to as “e-mail capacity”) that must be secured for storing e-mails increases, which may put pressure on the system environment. It has become particularly important.

メール容量を削減する最も簡単な方法は、電子メールを削除することであるが、削除した電子メールは元には戻せないため、本当に削除してよい電子メールかどうかを、利用者が判断する必要がある。電子メールを大量に保存している場合、この作業は利用者にとって大きな負担になる。   The simplest way to reduce email capacity is to delete emails, but deleted emails can't be restored, so you need to decide if you really want to delete them There is. If a large amount of e-mail is stored, this work is a heavy burden on the user.

例えば、特許文献1は、電子メールの重要度を自動的に計算し、利用者にその情報を提示する方法を開示している。この方法を使えば、利用者において、電子メールを削除するかどうかの判断が容易になることが期待できるが、電子メール一通一通に対して削除するかどうかの判断が必要な点は変わっていない。従って、利用者の判断を必要とせずに自動でメール容量を削減できる方法が求められているが、従来からの電子メールを削除する方法では、自動でのメール容量削減は困難である。   For example, Patent Document 1 discloses a method of automatically calculating the importance of an electronic mail and presenting the information to a user. If this method is used, it can be expected that it will be easier for users to decide whether or not to delete e-mails, but the need to decide whether to delete e-mails one by one has not changed. . Accordingly, there is a need for a method that can automatically reduce the mail capacity without requiring the user's judgment, but it is difficult to automatically reduce the mail capacity with the conventional method of deleting an e-mail.

電子メールを削除する以外のメール容量を削減する方法として、電子メールの本文(以下「メール本文」とする。)中の不要な引用文を削除する方法が考えられる。電子メールの返信や転送を繰り返すと、元の電子メールからの引用文が次々と文末、または文中に追加されていき、電子メールが長文化する傾向がある。メール本文のほとんどが引用文である電子メールも少なくない。このため、引用文を削除する方法は、メール容量を削減する方法として効果的と考えられる。   As a method of reducing the mail capacity other than deleting the e-mail, a method of deleting unnecessary quotes in the e-mail body (hereinafter referred to as “e-mail body”) can be considered. When e-mail is replied and forwarded, quotes from the original e-mail are added to the end of the sentence or in the sentence one after another, and the e-mail tends to be long. There are many e-mails in which the body of the mail is quoted. For this reason, the method of deleting the quote is considered to be effective as a method of reducing the mail capacity.

例えば、特許文献2は、引用文を削除する方法の一つを開示している。特許文献2に開示された方法は、電子メールの印刷時に使用する紙を節約する目的で引用文を削除する方法であるが、この方法は、メール容量の削減方法としても有効と考えられる。   For example, Patent Document 2 discloses one method for deleting a quotation. The method disclosed in Patent Document 2 is a method of deleting a quote for the purpose of saving paper used when printing an electronic mail, but this method is considered to be effective as a method for reducing the mail capacity.

また、特許文献3は、引用文を削除する別の方法を開示する。特許文献3に開示された方法では、引用回数が基準回数以下である引用文のみが表示され、それ以外の引用文は削除される。   Patent Document 3 discloses another method for deleting a quote. In the method disclosed in Patent Document 3, only quotes whose citation count is equal to or less than the reference count are displayed, and other quotes are deleted.

特開2002−215543号公報JP 2002-215543 A 特開2009−129231号公報JP 2009-129231 A 特開2002−197030号公報Japanese Patent Laid-Open No. 2002-197030

しかしながら、特許文献2に開示された方法には、大きく分けて以下の第1の問題点と第2の問題点とが存在している。   However, the method disclosed in Patent Document 2 is roughly divided into the following first and second problems.

[第1の問題点]
特許文献2に開示された方法における第1の問題点は、引用文を正しく識別できない可能性があることである。具体的には、特許文献2に開示された方法では、引用文を識別する方法として以下の識別方法1〜識別方法4が提案されているが、各識別方法には、引用文を正しく識別することが難しいという問題がある。
[First problem]
The first problem in the method disclosed in Patent Document 2 is that there is a possibility that a quote cannot be correctly identified. Specifically, in the method disclosed in Patent Document 2, the following identification methods 1 to 4 are proposed as methods for identifying a quotation, but each identification method correctly identifies a quotation. There is a problem that it is difficult.

(識別方法1)識別方法1は、「>」や「>>」などといった、電子メールの返信時や転送時に引用文の行頭に追加される「返信記号」をシステムに記憶させておき、メール本文の各行頭に同記号が存在するときに、その行を引用文と識別する方法である。
(識別方法2)識別方法2は、ある閾値を設定し、この閾値の数だけ行頭に同じ文字が連続しているときに、その行を引用文と識別する方法である。
(識別方法3)識別方法3は、先頭から数文字分が文字及び数字以外である行を引用文と識別する方法である。
(識別方法4)識別方法4は、例えば、開始文字列として「Original Massage」、終了文字列として利用者の署名文を利用し、この間に挟まれた行全てを引用文と識別する方法である。署名文とは、電子メールの送信時に、電子メールの送信者が自分の名前や所属、電話番号等を明らかにするために電子メールに追記する文字列群である。署名文は電子メールの最下部に追加することが多く、内容も毎回固定であることがほとんどである。
(Identification method 1) In the identification method 1, a “reply symbol” added to the beginning of a quoted sentence when replying or forwarding an e-mail, such as “>” or “>>”, is stored in the system. When the same symbol is present at the beginning of each line of the text, this line is identified as a quoted sentence.
(Identification method 2) The identification method 2 is a method in which a certain threshold value is set, and when the same character is continued at the beginning of the line by the number of the threshold value, the line is identified as a quoted sentence.
(Identification method 3) Identification method 3 is a method of identifying a line in which several characters from the beginning are other than letters and numbers as a quoted sentence.
(Identification method 4) The identification method 4 is, for example, a method in which “Original Massage” is used as a start character string, a user's signature is used as an end character string, and all lines sandwiched between these are identified as quoted sentences. . The signature sentence is a group of character strings that are added to the e-mail so as to clarify the name, affiliation, telephone number, etc. of the e-mail sender when the e-mail is transmitted. The signature text is often added at the bottom of the e-mail, and the contents are almost always fixed.

さて、識別方法1では、返信記号としての「>」または「>>」をひとかたまりで一つの記号として処理している。このため、識別方法1については、一連の電子メールのやりとりで、「>>>>」または「>>>>>>」のように引用の階層が深くなるとき、その種類だけあらかじめ返信記号を登録しておかないと、引用文を正しく検出できなくなるという問題がある。さらに、メールソフトの種類または個人の設定によっては、「>」以外にも様々な記号が返信時および転送時に付加される可能性があることから、記憶させておくべき返信記号の数が膨大になり、大きな記憶領域が必要になるという問題もある。   In the identification method 1, “>” or “>>” as a reply symbol is processed as one symbol as a group. For this reason, in the identification method 1, when a citation hierarchy becomes deeper as in “>>>>” or “>>>>>>” in a series of e-mail exchanges, a reply symbol is added in advance for that type. Without registration, there is a problem that it is impossible to correctly detect the quotation. Furthermore, depending on the type of mail software or personal settings, various symbols other than “>” may be added at the time of replying and forwarding, so the number of reply symbols to be stored is enormous. There is also a problem that a large storage area is required.

識別方法2については、返信時および転送時に付加される返信記号が2種類以上存在する場合に機能しないという問題がある。具体例を挙げると、もし、一連の電子メールのやりとりにおいて、メール送信時に引用文に付加する記号として「>」を使う利用者と、「|」を使う利用者とがいるとすると、行頭の文字列が「>|>」のようになるため、実際には引用文であるのに引用文と識別されない事態が発生する。結果、上記問題が発生する。   The identification method 2 has a problem that it does not function when there are two or more types of reply symbols added at the time of reply and transfer. As a specific example, if there are a user who uses “>” as a symbol to be added to a quote when sending a mail and a user who uses “|” in a series of e-mail exchanges, Since the character string is like “> |>”, there is a situation where it is not identified as a quoted sentence although it is actually a quoted sentence. As a result, the above problem occurs.

識別方法3については、引用文ではない文を引用文と誤認識する問題が考えられる。例えば利用者は、メール本文と署名部との区別をつけるために、それらの間に「*******」や「++++++++」などのような記号列を挿入することが多い。このとき、識別方法3を用いると、「*******」または「++++++++」の行が誤って引用文と認識される可能性がある。   Regarding the identification method 3, there is a problem that a sentence that is not a quoted sentence is erroneously recognized as a quoted sentence. For example, in order to distinguish between a mail text and a signature part, a user often inserts a symbol string such as “*******” or “++++++++” between them. At this time, if the identification method 3 is used, the line “*******” or “++++++++” may be erroneously recognized as a quoted sentence.

識別方法4については、一つ目の方法と同様に、メールソフトの種類または個人の設定の違いにより、開始文字列と終了文字列とが異なることが考えられるため、記憶しておくべき文字列の数が膨大になる問題がある。   As for the identification method 4, as in the first method, the start character string and the end character string may differ depending on the type of mail software or individual settings. There is a problem that the number of

[第2の問題点]
特許文献2に開示された方法における第2の問題点は、メール本文中の引用文を正常に識別できたとしても、その引用文を削除してよいかどうかを自動判定できないことである。また、特許文献2に開示された方法では、自動判定ができないため、基本的に、識別した引用文は全て削除されるため、削除後のメール本文が利用者にとって意味不明なものになる可能性が高くなっている。
[Second problem]
The second problem in the method disclosed in Patent Document 2 is that even if a quote in the mail text can be normally identified, it is not possible to automatically determine whether or not the quote can be deleted. In addition, since the method disclosed in Patent Document 2 cannot perform automatic determination, basically, all identified citations are deleted, so that the mail text after deletion may be meaningless to the user. Is high.

ただし、特許文献2に開示された方法が、電子メールを印刷した時の印刷用紙の削減を目的として利用されているのであれば、利用者は、印刷イメージを何らかの手段でプレビューし、内容が意味不明な場合は引用文を削除せずに全文を印刷する、というような対応をとれる。よって、この場合は、第2の問題は生じにくいとも考えられるが、「利用者に手間をかけさせることなく、自動で引用文を削除して、メール容量を削減する」ことを目的にする場合には適切ではない。以上から、第2の問題点を解決するため、削除しても電子メールの意味が通じる引用文とそうでない引用文との判断基準を定義し、その定義に基づいて引用文を削除するかどうか自動判定する技術が求められている。   However, if the method disclosed in Patent Document 2 is used for the purpose of reducing print paper when an e-mail is printed, the user previews the print image by some means, and the contents mean If you are unsure, you can take the action of printing the full text without deleting the quoted text. Therefore, in this case, the second problem may be unlikely to occur. However, the purpose is to “reducing the mail capacity by automatically deleting the quoted text without causing the user to trouble” Is not appropriate. From the above, in order to solve the second problem, whether or not to delete a quotation based on the definition of a quotation that does not have the same meaning as a quotation that can be understood even if it is deleted There is a need for technology for automatic determination.

なお、特許文献2では、引用文を無条件に削除すると電子メールの内容が意味不明になるケースがあることが言及されている。具体的には、「本文中に、過去メールの一部が引用されており、その引用された一部の直後の行に返信又は回答が記載されている場合」である。そして、特許文献2には、この対策として、「ある行が引用文であると判断された際、その次の行が引用文で無ければ、先の引用文に相当する行を削除しないで残してもよい」と記載されている。   Note that Patent Document 2 mentions that there is a case in which the contents of an e-mail become unclear if a quote is deleted unconditionally. Specifically, “a part of the past mail is quoted in the text, and a reply or answer is described in a line immediately after the quoted part”. And as a countermeasure against this, Patent Document 2 states that “when a line is determined to be a quoted sentence, if the next line is not a quoted sentence, the line corresponding to the previous quoted sentence is not deleted. It may be. "

しかしながら、特許文献2には、上記の場合における、明確な削除基準は示されておらず、このような記載があっても、上記第2の問題点の解決は困難である。また、仮に、上記の定義が採用された場合は、例えば、メール本文の最後に署名部が追加されている電子メールについては、署名部が引用文ではないため、それよりも上に存在する引用文が一切削除されないことになる。   However, Patent Document 2 does not show a clear deletion criterion in the above case, and even if there is such a description, it is difficult to solve the second problem. Also, if the above definition is adopted, for example, for an email in which a signature part is added at the end of the email body, the signature part is not a quoted sentence, so a citation that exists above it. No sentence will be deleted.

また、特許文献3に開示された方法では、上述したように、引用回数という単一の基準だけで引用文を削除する。このため、特許文献3に開示された方法でも、削除後の電子メールが利用者にとって意味不明になる可能性は高く、特許文献2に開示された方法と同様の第2の問題が存在していると言える。   Further, in the method disclosed in Patent Document 3, as described above, a quoted sentence is deleted only by a single criterion of the number of citations. For this reason, even in the method disclosed in Patent Document 3, there is a high possibility that the deleted e-mail will be unclear to the user, and there is a second problem similar to the method disclosed in Patent Document 2. I can say that.

本発明の目的の一例は、上記問題を解消し、電子メール中の引用文のうち、削除しても利用者が電子メールの意味を把握できる引用文のみを確実に削除し得る、メール容量削減支援装置、メール容量削減支援方法、及びプログラムを提供することにある。   An example of the object of the present invention is to reduce the mail capacity by eliminating the above-mentioned problem and reliably deleting only quotes that can be understood by the user even if the quotes are deleted in the email. To provide a support device, a mail capacity reduction support method, and a program.

上記目的を達成するため、本発明の一側面におけるメール容量削減支援装置は、受信した電子メールのメール容量の削減を支援する装置であって、
対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、引用文形式判定部と、
前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、引用文一致判定部と、
前記引用文一致判定部による判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、引用文削除部と、
を備えていることを特徴とする。
In order to achieve the above object, a mail capacity reduction support apparatus according to one aspect of the present invention is an apparatus that supports a reduction in mail capacity of a received electronic mail,
A citation format determination unit that determines whether a citation in the body of the target email is described in a full-text citation format or a partial citation format;
When the quoted text is described in a full-text quoted format, the quoted text and the entire character string of the email whose reception date is older than the target email are compared on a line-by-line basis. A quote match determination unit that determines whether or not the number of is equal to or greater than a set threshold;
As a result of determination by the quote match determination unit, when the number of matching lines is equal to or greater than a set threshold, the quote deletion unit that deletes the quote from the text of the target e-mail;
It is characterized by having.

また、上記目的を達成するため、本発明の一側面におけるメール容量削減支援方法は、受信した電子メールのメール容量の削減を支援するための方法であって、
(a)対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、ステップと、
(b)前記(a)のステップによる判定の結果、前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、ステップと、
(c)前記(b)のステップによる判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、ステップと、
を有することを特徴とする。
In order to achieve the above object, a mail capacity reduction support method according to one aspect of the present invention is a method for supporting a reduction in mail capacity of a received electronic mail,
(A) determining whether a quote in the body of the subject email is described in full-text or partial-quote format; and
(B) As a result of the determination in the step (a), when the quoted text is described in a full-text quoted format, the quoted text and the character of the email whose reception date is older than the target email Comparing the entire column by row to determine whether the number of matching rows is greater than or equal to a set threshold; and
(C) as a result of the determination in the step (b), when the number of matching lines is equal to or greater than a set threshold value, the quoted sentence is deleted from the text of the target e-mail; and
It is characterized by having.

更に、上記目的を達成するため、本発明の一側面におけるプログラムは、コンピュータによって、受信した電子メールのメール容量の削減を支援するための、プログラムであって、前記コンピュータに、
(a)対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、ステップと、
(b)前記(a)のステップによる判定の結果、前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、ステップと、
(c)前記(b)のステップによる判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、ステップと、
を実行させることを特徴とする。
Furthermore, in order to achieve the above object, a program according to one aspect of the present invention is a program for supporting reduction of the mail capacity of an e-mail received by a computer.
(A) determining whether a quote in the body of the subject email is described in full-text or partial-quote format; and
(B) As a result of the determination in the step (a), when the quoted text is described in a full-text quoted format, the quoted text and the character of the email whose reception date is older than the target email Comparing the entire column by row to determine whether the number of matching rows is greater than or equal to a set threshold; and
(C) as a result of the determination in the step (b), when the number of matching lines is equal to or greater than a set threshold value, the quoted sentence is deleted from the text of the target e-mail; and
Is executed.

以上のように、本発明における、メール容量削減支援装置、メール容量削減支援方法、及びプログラムによれば、電子メール中の引用文のうち、削除しても利用者が電子メールの意味を把握できる引用文のみを確実に削除することができる。   As described above, according to the mail capacity reduction support device, the mail capacity reduction support method, and the program according to the present invention, the user can grasp the meaning of the e-mail even if the quoted text in the e-mail is deleted. Only quotations can be deleted reliably.

図1は、本発明の実施の形態1におけるメール容量削減支援装置の構成を示すブロック図である。FIG. 1 is a block diagram showing the configuration of the mail capacity reduction support apparatus according to Embodiment 1 of the present invention. 図2は、本発明の実施の形態1におけるメール容量削減支援装置の動作を示すフロー図である。FIG. 2 is a flowchart showing the operation of the mail capacity reduction support apparatus according to Embodiment 1 of the present invention. 図3は、本発明の実施の形態1において採用されているメールの管理構造の一例を示す図である。FIG. 3 is a diagram showing an example of a mail management structure employed in the first embodiment of the present invention. 図4は、本発明の実施の形態1で解析対象となる解析対象メールの一例を示す図である。FIG. 4 is a diagram illustrating an example of an analysis target mail that is an analysis target in the first embodiment of the present invention. 図5は、それぞれ、図4のメールに対する返信メールの一例を示す図である。FIG. 5 is a diagram showing an example of a reply mail for the mail of FIG. 図6は、それぞれ、図4のメールに対する返信メールの一例を示す図である。FIG. 6 is a diagram showing an example of a reply mail for the mail of FIG. 図7は、図5に示したメールから引用文が削除された状態を示す図である。FIG. 7 is a diagram showing a state in which a quote is deleted from the mail shown in FIG. 図8は、図6に示したメールから引用文が削除された状態を示す図である。FIG. 8 is a diagram showing a state in which a quote is deleted from the mail shown in FIG. 図9は、図2に示したステップS2で解析対象となる比較文字列群の一例を示す図である。FIG. 9 is a diagram showing an example of a comparison character string group to be analyzed in step S2 shown in FIG. 図10は、図2に示したステップS2−5における処理の詳細の示すフロー図である。FIG. 10 is a flowchart showing details of the process in step S2-5 shown in FIG. 図11は、引用文の解析に用いられる停止閾値の好ましい範囲を示す図である。FIG. 11 is a diagram illustrating a preferable range of the stop threshold value used for the analysis of the quotation. 図12は、本発明の実施の形態2におけるメール容量削減支援装置の動作を示すフロー図である。FIG. 12 is a flowchart showing the operation of the mail capacity reduction support apparatus according to Embodiment 2 of the present invention. 図13は、本発明の実施の形態1または2におけるメール容量削減支援装置を実現するコンピュータの一例を示すブロック図である。FIG. 13 is a block diagram illustrating an example of a computer that implements the mail capacity reduction support apparatus according to Embodiment 1 or 2 of the present invention.

(発明の概要)
本発明では、「発明が解決しようとする課題」の欄で述べた、第1の問題点(引用文の識別方法の問題)を以下に説明する方法で改善する。
(Summary of Invention)
In the present invention, the first problem (problem of identification method of quotations) described in the column “Problems to be solved by the invention” is improved by the method described below.

返信記号を「>」または「|」のように一文字単位で定義し、システムに記憶させる。その上でメール本文の各行頭にこれらの返信記号が存在するかどうかを確認する。こうすることで、「>>>」、または「>>|>」のような組み合わせをシステムに記憶する必要がなくなるため、記憶領域を大幅に削減できる。同時に、返信記号を後から追加することも容易になる。さらに、行頭に存在する返信記号の数を調べることによって、その引用文が引用された回数も識別できるようになる。本発明ではこの「引用回数」も考慮した方法を提案している(後述)。   A reply symbol is defined in units of one character such as “>” or “|” and stored in the system. Then, check whether these reply symbols exist at the beginning of each line of the mail text. By doing so, it is not necessary to store a combination such as “>>” or “>> |>” in the system, so that the storage area can be greatly reduced. At the same time, it becomes easy to add a reply symbol later. Further, by checking the number of reply symbols present at the beginning of a line, the number of times that the quoted sentence is quoted can be identified. The present invention proposes a method that takes this “quotation count” into account (described later).

また、本発明では、発明が解決しょうとする課題」の欄で述べた、第2の問題点(引用文を削除して良いか自動で判定できない問題)を以下に説明する方法で改善する。   Further, in the present invention, the second problem (problem in which it is not possible to automatically determine whether a quoted sentence can be deleted) described in the section “Problems to be solved by the invention” is improved by the method described below.

引用文を削除してもメール本文が意味不明にならないようにするためには、削除しようとしている引用文の引用元になっている電子メール(以下「引用元メール」とする。)の内容を利用者が把握している、または、その引用元メールを利用者がすぐに参照できる状態にあることが必須である。前者をシステムが自動的に判別することは困難なため、本発明では後者に注目する。   To prevent the body of the email from becoming unclear even if the quote is deleted, the content of the email (hereinafter referred to as “citation email”) that is the source of the quote that is being deleted is used. It is essential that the user knows or is in a state where the user can immediately refer to the citation mail. Since it is difficult for the system to automatically determine the former, the present invention focuses on the latter.

本発明では、「利用者が、ある電子メールの引用元メールをすぐに参照できる状態」を、「同一のメールフォルダ内に、ある電子メールとその引用元メールとが存在する状態」と定義する。そして、本発明では、引用文を削除するかどうかの解析対象となる電子メール(解析対象メール)のメールフォルダ内に、引用元メールが存在するかどうかを検索し、存在する場合に、解析対象メールの引用文が削除されるのが好ましい。   In the present invention, “a state in which a user can immediately refer to a citation mail of a certain e-mail” is defined as “a state in which a certain e-mail and the citation mail exist in the same mail folder”. . Then, in the present invention, it is searched whether there is a citation mail in the mail folder of the e-mail (analysis target mail) to be analyzed whether or not to delete the quoted sentence. Preferably, the email quote is deleted.

同じ一連のやりとりに関する電子メール、つまり、ある電子メールに対して返信または転送を繰り返した一連のメール群は、一つのメールフォルダ内に分類されていることが一般的であるため、この検索方法は有効と考えられる。本発明のメール容量削減効果を高めるためには、メールフォルダへの分類はできるだけ適切に行われていることが好ましい。なお、本発明においてはメールフォルダへの分類方法はどのような方法を用いても良く、利用者が手動で分類しても良いし、公知例を使って自動的に分類しても良い。   Emails related to the same series of exchanges, that is, a series of emails that are repeatedly replied to or forwarded to an email, are generally classified in one email folder, so this search method is It is considered effective. In order to enhance the mail capacity reduction effect of the present invention, it is preferable that the mail folder is classified as appropriately as possible. In the present invention, any mail folder classification method may be used. The user may manually classify the mail folder, or the public folder may be automatically classified.

さて、引用元メールの検索では、まず、「引用文の削除が行われる電子メール(解析対象メール)」の文字列と、「解析対象メールと同じメールフォルダに保存され、かつ、受信日時が解析対象メールよりも過去の電子メール(過去メール)」の文字列とがそれぞれ行単位で比較される。そして、一致する行数が、ある「停止閾値」を超えるかどうかが判定される。   Well, in the search of the citation source mail, first of all, it will be saved in the same mail folder as the analysis target mail and the character string of “Email whose citation is deleted (analysis target mail)” The character string “e-mail in the past than the target mail (past mail)” is compared in units of lines. Then, it is determined whether or not the number of matching lines exceeds a certain “stop threshold”.

判定の結果、超える場合は、その過去メールが解析対象メールの引用元メールと判断される。そして、解析対象メールの引用文が削除されても、利用者は、「引用文の削除後の解析対象メール」と「引用元メール」との双方を参照すること、一連の電子メールのやりとりを理解できると考えられるため、解析対象メールの引用文は削除される。なお、引用文を削除した部分には、引用文を削除したことを示す文字列が挿入されるのが良い。   As a result of the determination, if it exceeds, the past mail is determined as the citation source mail of the analysis target mail. And even if the quoted text of the email to be analyzed is deleted, the user can refer to both the “mail to be analyzed after deletion of the quoted text” and the “quoted mail” and exchange a series of emails. Since it is thought that it can be understood, the quotation of the analysis target mail is deleted. It should be noted that a character string indicating that the quotation has been deleted is preferably inserted in the portion where the quotation has been deleted.

一方、判定の結果、超えない場合、または、過去メールの中に引用元メールが一通も見つからない場合は、解析対象メールの引用文が削除されると、一連の電子メールのやりとりを利用者が理解できなくなると考えられる。従って、これの場合は、引用文は削除されずに、処理が停止される。   On the other hand, if the result of the determination is that it does not exceed, or if no citation mail is found in the past mail, the user will be able to exchange a series of e-mails when the citation of the analysis target mail is deleted. It is thought that it becomes impossible to understand. Therefore, in this case, the quoted sentence is not deleted and the processing is stopped.

なお、たとえ引用元メールが同じメールフォルダにある場合でも、引用文を削除すると電子メールが意味不明になる場合が存在するため、本発明ではこの点も考慮に入れている。具体的には、「返信記号が行頭に存在する行」の間に「返信記号が行頭に存在しない行」がはさまっている場合である(部分引用文)。   It should be noted that even if the citation source mail is in the same mail folder, there is a case where the e-mail may be unclear when the quote is deleted, and the present invention takes this point into consideration. Specifically, this is a case where a “line where no reply symbol exists at the beginning of the line” is sandwiched between “a line where the reply symbol exists at the beginning of the line” (partial quotation).

このような場合、利用者は、引用元メールの内容の一部に対して個別に返信、または回答を記載していると考えられる。従って、このよう場合に、該当引用文を削除すると、それがどの部分に対する返信、または回答なのか理解できなくなり、電子メールが意味不明になる。逆に、引用文がひとかたまりになっている場合は、引用文を削除しても問題ない(全引用文)。そして、部分引用文であるか、全引用文であるかは、各行頭の一文字だけで判定でき、文字列のマッチング処理に比べて少ない処理量で実施できる。このため、全体の処理量を削減する観点から、先に部分引用文か全引用文かの判定が行われ、判定の結果、全引用文の場合にのみ、引用元メールの検索処理(文字列のマッチング処理)が実行される。   In such a case, it is considered that the user individually replies or describes an answer to a part of the content of the citation source mail. Therefore, in this case, if the corresponding quote is deleted, it becomes impossible to understand which part is the reply or answer, and the e-mail becomes unclear. On the other hand, if the quoted text is a group, there is no problem even if the quoted text is deleted (all quoted text). Whether it is a partial quote sentence or a full quote sentence can be determined by only one character at the beginning of each line, and can be implemented with a smaller processing amount than the character string matching process. For this reason, from the viewpoint of reducing the overall processing amount, it is first determined whether the text is a partial quote or a full quote. Matching process) is executed.

(実施の形態1)
以下、本発明の実施の形態1における、メール容量削減支援装置、メール容量削減支援方法、及びプログラムについて、図1〜図10を参照しながら説明する。
(Embodiment 1)
Hereinafter, a mail capacity reduction support apparatus, a mail capacity reduction support method, and a program according to Embodiment 1 of the present invention will be described with reference to FIGS.

[装置構成]
最初に、本実施の形態1におけるメール容量削減支援装置の構成について図1を用いて説明する。図1は、本発明の実施の形態1におけるメール容量削減支援装置の構成を示すブロック図である。
[Device configuration]
First, the configuration of the mail capacity reduction support apparatus according to the first embodiment will be described with reference to FIG. FIG. 1 is a block diagram showing the configuration of the mail capacity reduction support apparatus according to Embodiment 1 of the present invention.

図1に示すように、本実施の形態1におけるメール容量削減支援装置20は、メールサーバ10に接続されており、メールサーバ10を経由して送信されてくる電子メールを記憶するためのメール容量の削減を支援する。本実施の形態1では、メール容量削減支援装置20は、電子メールの送受信を実行可能な端末装置、コンピュータ、携帯電話、スマートフォン等の内部に構築されている。なお、以降においては、電子メールは、単に「メール」と記載する。   As shown in FIG. 1, the mail capacity reduction support apparatus 20 according to the first embodiment is connected to the mail server 10 and stores mail capacity for storing electronic mail transmitted via the mail server 10. To help reduce In the first embodiment, the mail capacity reduction support device 20 is built inside a terminal device, a computer, a mobile phone, a smartphone, or the like that can execute transmission / reception of electronic mail. Hereinafter, the e-mail is simply referred to as “mail”.

また、図1に示すように、メール容量削減支援装置20は、主に、引用文解析部22と、引用文削除部23とを備えている。引用文解析部22は、引用文形式判定部27と、引用文一致判定部28とを備え、この構成により、メールフォルダ中に存在する特定の一通のメールについて、メール本文中の引用文を削除するかどうかの解析を実行する。なお、以下、引用文を削除するかどうかの解析の対象となるメールを「解析対象メール」とする。   As shown in FIG. 1, the mail capacity reduction support device 20 mainly includes a quote sentence analysis unit 22 and a quote sentence deletion unit 23. The quote sentence analysis unit 22 includes a quote sentence format determination unit 27 and a quote sentence match determination unit 28. With this configuration, the quote sentence in the mail text is deleted for a specific mail existing in the mail folder. Analyzes whether or not to Hereinafter, an email that is subject to analysis on whether or not to delete a quoted sentence is referred to as “analysis subject email”.

具体的には、引用文形式判定部27は、解析対象メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する。引用文一致判定部28は、引用文が全文引用形式によって記述されている場合に、引用文と、解析対象メールよりも受信日時が古いメール(以下「過去メール」とする。)の文字列全体とを行単位で比較する。   Specifically, the quoted sentence format determination unit 27 determines whether the quoted text in the body of the analysis target email is described in the full-text quoted format or the partial quoted format. When the quoted sentence is described in the full-text quote format, the quoted sentence match determining unit 28 is the entire character string of the quoted sentence and mail (hereinafter referred to as “past mail”) whose reception date and time is older than the analysis target mail. Are compared line by line.

そして、引用文一致判定部28は、一致する行の数が、設定された閾値(以下「停止閾値」とする。)以上となるかどうかを判定する。また、引用文削除部23は、引用文一致判定部28による判定の結果、一致する行の数が設定された閾値以上となる場合に、解析対象メールからの引用文の削除を実行する。   Then, the quote match determination unit 28 determines whether or not the number of matching lines is equal to or greater than a set threshold (hereinafter referred to as “stop threshold”). Also, the quotation deletion unit 23 deletes the quotation from the analysis target mail when the number of matching lines is equal to or greater than the set threshold as a result of the determination by the quotation match determination unit 28.

このように、メール容量削減支援装置20では、全文引用形式の引用文であるかどうかを判定し、そうである場合にのみ、解析対象メールの過去メールと一致する部分を特定する。また、メール容量削減支援装置20は、一致するとして特定された部分の行の数が、停止閾値以上であるかどうかを判定することにより、解析対象メールと過去メールとが、署名文、定型文等においてのみ一致する場合を排除する。このため、メール容量削減支援装置20によれば、メール中の引用文のうち、削除しても利用者がメールの意味を把握できる引用文のみを確実に削除することができる   In this way, the mail capacity reduction support device 20 determines whether or not the quoted text is in the full text citation format, and if so, identifies the portion that matches the past mail of the analysis target mail. In addition, the mail capacity reduction support device 20 determines whether the number of lines in the portion identified as matching is equal to or greater than the stop threshold, so that the analysis target mail and the past mail can be converted into a signature sentence and a fixed sentence. The case where it matches only in etc. is excluded. For this reason, according to the mail capacity reduction support device 20, it is possible to reliably delete only quotes that allow the user to grasp the meaning of the email even if the quotes are deleted.

ここで、メール容量削減支援装置20の構成いついて、更に具体的に説明する。図1に示すように、本実施の形態1では、メール容量削減支援装置20は、引用文解析部22及び引用文削除部23に加えて、メール受信部21と、メール保存部24と、停止閾値記憶部25と、返信記号記憶部26とを備えている。   Here, the configuration of the mail capacity reduction support apparatus 20 will be described more specifically. As shown in FIG. 1, in the first embodiment, the mail capacity reduction support device 20 includes a mail reception unit 21, a mail storage unit 24, a stop, in addition to the quote analysis unit 22 and the quote deletion unit 23. A threshold storage unit 25 and a reply symbol storage unit 26 are provided.

メール受信部21は、メールサーバ1からメールを受信し、受信したメールをメール保存部24に保存させる。メール保存部24は、保存しているメールを、メールフォルダによって管理する機能を備えている。よって、メール容量削減支援装置20を利用する利用者から、受信されたメールを見た場合、受信されたメールは、メールフォルダ毎に振り分けられた状態となっている。   The mail receiving unit 21 receives mail from the mail server 1 and stores the received mail in the mail storage unit 24. The mail storage unit 24 has a function of managing stored mail using a mail folder. Therefore, when a received mail is viewed from a user who uses the mail capacity reduction support apparatus 20, the received mail is in a state of being sorted for each mail folder.

また、本実施の形態1においては、あるメールに対して返信、転送、および両方を繰り返した一連のメール群は、同じメールフォルダに、まとまって分類および保存されている。更に、指定のメールフォルダへのメールの分類は、利用者による手動処理によって行われていても良いし、例えば、特開2007−304773号広報が開示する公知技術を利用した自動処理によって行われていても良い。   In the first embodiment, a series of mail groups in which reply, transfer, and both are repeated for a certain mail are grouped and stored together in the same mail folder. Further, the mail classification to the designated mail folder may be performed by manual processing by the user, for example, by automatic processing using a publicly known technique disclosed by JP 2007-304773 PR. May be.

更に、本実施の形態1では、引用文解析部22において、引用文一致判定部28は、まず、処理の終了条件となるパラメータ「停止閾値」を停止閾値記憶部25から取得する。また、引用文一致判定部28は、引用文のうち、予め設定された返信記号が1つだけ付加されている行を特定し、特定した行と、過去メールの文字列全体とを行単位で比較する。よって、引用文一致判定部28は、メールの返信時、転送時に、メール本文の各行頭で引用文に付加される可能性がある「返信記号」のリストを、返信記号記憶部26から取得する。   Further, in the first embodiment, in the quote analysis unit 22, the quote match determination unit 28 first acquires a parameter “stop threshold” as a process termination condition from the stop threshold storage unit 25. In addition, the quote match determination unit 28 identifies a line to which only one preset reply symbol is added in the quote, and identifies the identified line and the entire character string of the past mail in line units. Compare. Therefore, the quote match determination unit 28 acquires from the reply symbol storage unit 26 a list of “reply symbols” that may be added to the quote at the beginning of each line of the email body when replying or forwarding the email. .

また、引用文一致判定部28は、取得した「停止閾値」及び「返信記号」と、メール保存部24に保存されている解析対象メールの本文と、解析対象メールと同じメールフォルダに保存されている過去メールの本文とを参照する。そして、引用文解析部22は、参照した情報に基づいて解析を行い、解析対象メールの引用文を削除するかどうかを判定する。   The quote match determination unit 28 stores the acquired “stop threshold” and “reply symbol”, the text of the analysis target email stored in the email storage unit 24, and the same mail folder as the analysis target email. Refer to the text of the past mail. Then, the quote analysis unit 22 performs analysis based on the referred information, and determines whether or not to delete the quote from the analysis target mail.

判定の結果、削除する場合は、引用文一致判定部28は、その処理内容を引用文削除部23に渡し、引用文削除部23に処理を実行させる。本実施の形態1では、引用文削除部23は、解析対象メールの引用文の削除に加え、削除した部分への、引用文を削除したことを示す文字列の挿入も実行する。また、引用文削除部23は、引用文が削除された解析対象メールをメール保存部24に保存させる。   As a result of the determination, when deleting, the quote match determination unit 28 passes the processing contents to the quote deletion unit 23 and causes the quote deletion unit 23 to execute the process. In the first embodiment, in addition to deleting the quoted sentence of the analysis target mail, the quoted sentence deleting unit 23 also executes insertion of a character string indicating that the quoted sentence has been deleted into the deleted part. Further, the quote deletion unit 23 causes the email storage unit 24 to store the analysis target email from which the quote has been deleted.

[装置動作]
次に、本発明の実施の形態1におけるメール容量削減支援装置20の動作について図2を用いて説明する。図2は、本発明の実施の形態1におけるメール容量削減支援装置の動作を示すフロー図である。以下の説明においては、適宜図1を参酌する。また、本実施の形態1では、メール容量削減支援装置20を動作させることによって、メール容量削減支援方法が実施される。よって、本実施の形態1におけるメール容量削減支援方法の説明は、以下のメール容量削減支援装置20の動作説明に代える。
[Device operation]
Next, the operation of the mail capacity reduction support apparatus 20 in Embodiment 1 of the present invention will be described using FIG. FIG. 2 is a flowchart showing the operation of the mail capacity reduction support apparatus according to Embodiment 1 of the present invention. In the following description, FIG. 1 is taken into consideration as appropriate. In the first embodiment, the mail capacity reduction support method is implemented by operating the mail capacity reduction support apparatus 20. Therefore, the description of the mail capacity reduction support method in the first embodiment is replaced with the following description of the operation of the mail capacity reduction support device 20.

最初に、図2に示す動作の説明に先立って、本実施の形態で採用されているメールの管理構造を、図3を用いて説明する。図3は、本発明の実施の形態1において採用されているメールの管理構造の一例を示す図である。   First, prior to the description of the operation shown in FIG. 2, the mail management structure employed in the present embodiment will be described with reference to FIG. FIG. 3 is a diagram showing an example of a mail management structure employed in the first embodiment of the present invention.

図3に示すように、メール保存部24に保存されている全てのメールは、いずれかのメールフォルダ内に振分けられている。そして、あるメールフォルダに注目したとき、そのメールフォルダに登録されている各メールに対して「メール番号」が定義されている。メール番号は、受信日時の古いメールから順に1、2、3、・・・と定義される。メールフォルダに登録されているメール数がN個のとき、メール番号1のメールはそのメールフォルダ内で受信日時が最古のメールであり、メール番号Nのメールは受信日時が最新のメールである。   As shown in FIG. 3, all mails stored in the mail storage unit 24 are sorted into any mail folder. When attention is paid to a certain mail folder, a “mail number” is defined for each mail registered in the mail folder. The mail numbers are defined as 1, 2, 3,... When the number of mails registered in the mail folder is N, the mail with mail number 1 is the oldest mail in the mail folder, and the mail with mail number N is the latest mail with the latest reception date. .

続いて、図2に示す各ステップにおける前提条件について説明する。本実施の形態では、「引用文を削除するかどうかの解析の対象となるメール(解析対象メール)」が保存されているメールフォルダを対象に検索が行われ、このメールフォルダ中に、解析対象メールの「引用元メール」が存在するかどうかが判定される。判定の結果、存在する場合は、解析対象メールの引用文の削除が行われる。解析対象メールのメールフォルダを対象として、引用元メールの検索を行うのは次の理由による。   Subsequently, preconditions in each step shown in FIG. 2 will be described. In this embodiment, a search is performed for a mail folder in which “email to be analyzed whether to delete a quote (email to be analyzed)” is stored, and the analysis target is included in this mail folder. It is determined whether the “quoting mail” of the mail exists. As a result of the determination, if it exists, the quoted sentence of the analysis target mail is deleted. The reason for searching the citation mail for the mail folder of the analysis target mail is as follows.

まず、引用元メールが同じメールフォルダに分類されていれば、解析対象メールの引用文を削除しても、利用者は「引用文削除後の解析対象メール」と「引用元メール」を合わせて参照することで、メールの一連の流れを理解できると考えられるからである。逆に、引用元メールが解析対象メールと同じメールフォルダに分類されていないときに、解析対象メールの引用文が削除されると、利用者は、メールの意味を理解できなくなると考えられるからである。   First, if the quoted mail is classified in the same mail folder, even if the quoted text of the analysis target email is deleted, the user must combine the “parsed email after deleting the quoted text” and the “citation email”. It is because it is thought that a series of mail flows can be understood by referring. On the other hand, if the quoted text of the analysis target email is deleted when the source email is not classified into the same mail folder as the analysis target email, it is considered that the user will not understand the meaning of the email. is there.

従って、本実施の形態1では、実施効果を高める点から、既に述べたように、同じメールフォルダ内には一連のやりとりのメール、つまり、あるメールに対して返信、転送、または両方を繰り返した一連のメール群は、まとめて分類されているものとする。   Therefore, in the first embodiment, in order to enhance the implementation effect, as described above, in the same mail folder, a series of exchange mails, that is, reply, transfer, or both are repeated for a certain mail. Assume that a series of mail groups are grouped together.

また、図2に示す各ステップにおいては、解析対象メールのメール番号をmと定義する。このとき、引用元メールの検索は、メールmよりも受信日時が古いメール、つまり、メール番号がm−1以下のメール(過去メール)に対して実行される。これらのメールは全てメール保存部24に保存されており、引用文解析部22による解析と引用文削除部23による削除との対象となる。なお、引用文解析部22は、後述の図2に示す「引用文解析(前半):ステップS1」と「引用文解析(後半):ステップS2」とを実行する。引用文削除部23は、同じく図2に示す「引用文削除:ステップS3」を実行する。   In each step shown in FIG. 2, the mail number of the analysis target mail is defined as m. At this time, the search for the citation source mail is executed for mail whose reception date is older than that of mail m, that is, mail (past mail) having a mail number of m−1 or less. All of these emails are stored in the email storage unit 24, and are subject to analysis by the quote analysis unit 22 and deletion by the quote deletion unit 23. The quote sentence analysis unit 22 executes “quoted sentence analysis (first half): step S1” and “quoted sentence analysis (second half): step S2” shown in FIG. 2 described later. The quote deletion unit 23 executes “citation deletion: step S3” shown in FIG.

[ステップS1〜S3]
続いて、図2に示す動作をステップ毎に説明する。また、以下の説明では、適宜、図3〜図9も参照する。図2に示すように、メール容量削減装置20の動作は、大きく、「引用文解析(前半):ステップS1」と、「引用文解析(後半):ステップS2」と、「引用文削除ステップS3」とに分けられる。また、ステップS1は、ステップS1−1〜S1−3で構成され、ステップS2は、ステップS2−1〜S2−6で構成されている。
[Steps S1 to S3]
Subsequently, the operation shown in FIG. 2 will be described step by step. In the following description, FIGS. 3 to 9 are also referred to as appropriate. As shown in FIG. 2, the operation of the mail capacity reduction device 20 is large: “quoted sentence analysis (first half): step S1”, “quoted sentence analysis (second half): step S2”, and “quoted sentence deletion step S3”. ”. Step S1 includes steps S1-1 to S1-3, and step S2 includes steps S2-1 to S2-6.

[ステップS1]
「引用文解析(前半):ステップS1」は、引用文を削除する際の前提条件を確認するステップであり、ステップS1において、条件を満たすことが確認されない場合は、ステップS2は実行されず、メール容量削減支援装置20における処理は終了する。
[Step S1]
“Cited sentence analysis (first half): Step S1” is a step for confirming the preconditions for deleting a quoted sentence. If the condition is not confirmed in Step S1, Step S2 is not executed. The processing in the mail capacity reduction support device 20 ends.

[ステップS1−1]
まず、S1−1において、引用文解析部22の引用文一致判定部28は、ステップS2で使用する「停止閾値」を停止閾値記憶部25から取得する。また、引用文一致判定部28は、メールの返信、転送時に、引用文の行頭に付加される「返信記号」のリストを返信記号記憶部26から取得する。
[Step S1-1]
First, in S <b> 1-1, the quote match determination unit 28 of the quote analysis unit 22 acquires the “stop threshold” used in step S <b> 2 from the stop threshold storage unit 25. Also, the quote match determination unit 28 obtains a list of “reply symbols” to be added to the beginning of the quoted sentence from the reply symbol storage unit 26 when replying or forwarding mail.

「停止閾値」は本実施の形態1で使用するパラメータ(正の整数)であり、ステップS2の終了条件になる。返信記号記憶部26は、返信記号として、「>」および「|」のような記号を一文字単位で記憶している。引用文一致判定部28は、記憶されている返信記号を全て取得する。   The “stop threshold” is a parameter (positive integer) used in the first embodiment, and is an end condition of step S2. The reply symbol storage unit 26 stores symbols such as “>” and “|” in units of characters as reply symbols. The quote match determination unit 28 acquires all stored reply symbols.

なお、以降においては、説明の簡略化のために返信記号としては「>」の一種類のみが記憶されているとして説明する。但し、このことは、本発明の本質に影響を与えるものではない。また、本実施の形態1では、メール容量削減支援装置20は、返信記号と停止閾値とを、利用者の手動によって、追加および変更できるように構成されていても良い。   In the following description, it is assumed that only one type of “>” is stored as a reply symbol in order to simplify the description. However, this does not affect the essence of the present invention. In the first embodiment, the mail capacity reduction support device 20 may be configured to be able to add and change the reply symbol and the stop threshold manually by the user.

[ステップS1−2]
次に、S1−2において、引用文解析部22の引用文形式判定部27は、解析対象メールm中に引用文が存在するかどうかを解析する。具体的には、引用文形式判定部27は、メールmの本文の全ての行を対象として、行頭一文字にステップS1−1で取得した返信記号が存在するかどうかを判定する。ここで、返信記号が存在する行が一行も存在しない場合は、メールmに削除可能な引用文そのものが存在しないと考えられるため、メール容量削減支援装置20における処理は停止する。
[Step S1-2]
Next, in S1-2, the quote format determination unit 27 of the quote analysis unit 22 analyzes whether a quote exists in the analysis target mail m. Specifically, the quote format determination unit 27 determines whether or not the reply symbol acquired in step S1-1 exists at the beginning of the line for all lines of the body of the mail m. Here, if there is no line with a reply symbol, it is considered that there is no citation that can be deleted in the mail m, so the processing in the mail capacity reduction support device 20 stops.

例えば、図4に示すメールに対して、ステップS1−2が実行される場合を考える。図4は、本発明の実施の形態1で解析対象となる解析対象メールの一例を示す図である。図4に示すメールには、返信記号「>」が行頭に存在している行は、一行も存在していないため、引用文形式判定部27は、引用文が存在しないと判定し、処理が停止する。   For example, consider the case where step S1-2 is executed for the mail shown in FIG. FIG. 4 is a diagram illustrating an example of an analysis target mail that is an analysis target in the first embodiment of the present invention. In the mail shown in FIG. 4, since there is no line in which the reply symbol “>” is present at the beginning of the line, the quotation sentence format determination unit 27 determines that there is no quotation sentence, and processing is performed. Stop.

[ステップS1−3]
次に、S1−3では、引用文形式判定部27は、メールmの引用文が「分断」されていないかどうかを解析する。ステップS1−3については、図4に加え、図5〜図8を用いて説明する。図5および図6は、それぞれ、図4のメールに対する返信メールの一例を示す図である。図7は、図5に示したメールから引用文が削除された状態を示す図である。図8は、図6に示したメールから引用文が削除された状態を示す図である。
[Step S1-3]
Next, in S1-3, the quotation sentence format determination unit 27 analyzes whether or not the quotation sentence of the mail m is “divided”. Step S1-3 will be described with reference to FIGS. 5 to 8 in addition to FIG. 5 and 6 are diagrams showing examples of reply mails to the mail of FIG. FIG. 7 is a diagram showing a state in which a quote is deleted from the mail shown in FIG. FIG. 8 is a diagram showing a state in which a quote is deleted from the mail shown in FIG.

図5の例では、行頭に返信記号「>」が存在する行は連続しているのに対し、図6の例では、行頭に返信記号「>」が存在する行は分断されている。ここで、前者の図5に示す返信メールは、引用元メールの全文をまとめて引用し、返信内容を追記する「全引用文」によって記載されている。それに対して、後者の図6に示す返信メールは、引用元メールの各部分に返信内容を追記している「部分引用文」によって記載されている。   In the example of FIG. 5, the lines having the reply symbol “>” at the beginning of the line are continuous, whereas in the example of FIG. 6, the lines having the reply symbol “>” at the beginning of the line are divided. Here, the former reply mail shown in FIG. 5 is described by “all quotes” in which the entire quoted mail is quoted together and the reply contents are added. On the other hand, the latter reply mail shown in FIG. 6 is described by “partial quotes” in which reply contents are added to each part of the quoted mail.

ここで、仮に、図5に示されたメールにおいて、引用文を削除すると、図7に示すメールとなる。また、図6に示されたメールにおいて、引用文を削除すると図8に示すメールとなる。後述するが、引用文が削除された場合、引用文削除部23によって、引用文を削除した箇所が分かるような文字列が挿入される。   Here, if the quote is deleted from the mail shown in FIG. 5, the mail shown in FIG. 7 is obtained. Further, if the quote is deleted from the mail shown in FIG. 6, the mail is shown in FIG. As will be described later, when a quoted sentence is deleted, the quoted sentence deleting unit 23 inserts a character string so that the location where the quoted sentence is deleted can be understood.

図4に示す引用元メールと、図7または図8に示す引用文が削除されたメールとが同じメールフォルダ内に存在している場合、利用者は、両メールを合わせて参照することができると考えられる。例えば、図4に示す引用元メールと図7に示す引用文が削除されたメールとの組み合わせの場合、利用者は、双方のメールを参照することで、図7において削除された引用文の内容を把握することができる。   When the citation source mail shown in FIG. 4 and the mail from which the quote text shown in FIG. 7 or FIG. 8 is deleted exist in the same mail folder, the user can refer to both mails together. it is conceivable that. For example, in the case of a combination of the citation source mail shown in FIG. 4 and the mail from which the quote text shown in FIG. 7 is deleted, the user can refer to both mails and the contents of the quote text deleted in FIG. Can be grasped.

これに対し、図4に示す引用元メールと図8に示す引用文が削除されたメールとの組み合わせの場合、図8に示すメールでは、複数個所の引用文が削除されているため、それぞれの引用文が図4のどの部分に該当するのか判断することが困難である。よって、図8に示すメールは、利用者にとって意味不明なメールになってしまう。つまり、全引用文(図5)の場合は、引用文を削除することは可能であるが、部分引用文(図6)の場合は、引用文を削除することは困難である。   On the other hand, in the case of a combination of the citation source mail shown in FIG. 4 and the mail from which the quote text shown in FIG. 8 is deleted, the quote text in a plurality of places is deleted in the mail shown in FIG. It is difficult to determine which part in FIG. 4 the quoted sentence corresponds to. Therefore, the mail shown in FIG. 8 becomes a mail whose meaning is unknown to the user. That is, it is possible to delete a quoted sentence in the case of a full quoted sentence (FIG. 5), but it is difficult to delete a quoted sentence in the case of a partially quoted sentence (FIG. 6).

従って、ステップS1−3では、引用文形式判定部27は、分断の解析として、メールmの引用文が全文引用形式によって記述されているのか、それとも部分引用形式によって記述されているのかを判定する。そして、解析対象メールmが、部分引用形式によって記載されている場合は、ステップS2は実行されず、メール容量削減支援装置20における処理は終了する。   Therefore, in step S1-3, the quotation format determination unit 27 determines whether the quotation of the mail m is described in the full-text quotation format or the partial quotation format as the analysis of the division. . If the analysis target mail m is described in the partial citation format, step S2 is not executed, and the processing in the mail capacity reduction support device 20 ends.

一方、ステップS1−3での判定の結果、解析対象メールmが、全文引用形式によって記載されている場合は、「引用文解析(後半):ステップS2」が実行される。   On the other hand, if the analysis target mail m is described in the full-text citation format as a result of the determination in step S1-3, “quoted sentence analysis (second half): step S2” is executed.

[ステップS2]
以下、「引用文解析(後半)ステップS2」について更に図9を用いて説明する。「引用文解析(前半):ステップS1」では、解析対象メールm本文の行頭一文字だけが解析対象となっているが、「引用文解析(後半)ステップS2」は、これとは異なっている。「引用文解析(後半)ステップS2」では、解析対象メールmの一重引用文(行頭に返信記号が一文字だけ付加されている行)と、解析対象メールmと同じメールフォルダに分類され、且つ解析対象メールよりも受信日時が古いメール(過去メール)の文字列全体とが、行単位で解析対象とされる。図9は、図2に示したステップS2で解析対象となる比較文字列群の一例を示す図である。
[Step S2]
Hereinafter, “cited sentence analysis (second half) step S2” will be further described with reference to FIG. In “quoted sentence analysis (first half): step S 1”, only the first character of the body of the analysis target mail m is analyzed, but “quoted sentence analysis (second half) step S 2” is different from this. In “quoted sentence analysis (second half) step S2”, the analysis target mail m is classified into a single quote sentence (a line with a single reply symbol added to the beginning of the line) and the same mail folder as the analysis target mail m, and analyzed. The entire character string of mail (past mail) whose reception date and time is older than the target mail is analyzed for each line. FIG. 9 is a diagram showing an example of a comparison character string group to be analyzed in step S2 shown in FIG.

[ステップS2−1]
まずS2−1では、引用文一致判定部28は、解析対象メールmの一重引用文の文字列を行単位で取得する。ただし、このとき、文字列は、行頭に存在する「返信記号」が除かれた状態で取得される。また、引用文一致判定部28は、返信記号以外に空白文字しか存在しない行を取得対象から外す。この取得文字列を「比較文字列群A」(図9参照)とする。
[Step S2-1]
First, in S2-1, the quote match determination unit 28 acquires a character string of a single quote in the analysis target mail m in units of lines. However, at this time, the character string is acquired in a state in which the “reply symbol” existing at the beginning of the line is removed. In addition, the quote match determination unit 28 excludes from the acquisition target a line that includes only a blank character other than the reply symbol. This acquired character string is referred to as “comparison character string group A” (see FIG. 9).

ステップS2−1において取得された「比較文字列群A」では、図9に示すように、一重引用文の行数がpであるとき、文字列を取得した順に、行番号は、1、2、・・・、p−1、pと付与される。   In the “comparison character string group A” acquired in step S2-1, as shown in FIG. 9, when the number of lines of a single quote is p, the line numbers are 1, 2 in the order in which the character strings are acquired. ,..., P-1, and p.

[ステップS2−2、S2−3]
次に、S2−2で、引用文一致判定部28は、繰り返し用の変数iの初期値としてm−1を設定する。そして、S2−3で、引用文一致判定部28は、iが1より小さくなっていないかどうかを判定する。iが1より小さくなっている場合は、メール容量削減支援装置20における処理は終了する。
[Steps S2-2 and S2-3]
Next, in S2-2, the quote match determination unit 28 sets m−1 as the initial value of the variable i for repetition. In S <b> 2-3, the quote match determination unit 28 determines whether i is not smaller than 1. If i is smaller than 1, the processing in the mail capacity reduction support device 20 ends.

一方、iが1より小さくなっていない場合は、引用文一致判定部28は、以降に示すように、i=m−1、i=m−2、・・・i=1と減算しながら、ステップS2−3〜ステップS2−6を繰り返し実行する。ここで、メールiは、解析対象メールmの「過去メール」に当たるメールである。つまり、解析対象メールmは常に一通であるのに対し、過去メールiは複数通になる可能性がある。   On the other hand, when i is not smaller than 1, the quotation match determination unit 28 subtracts i = m−1, i = m−2,. Steps S2-3 to S2-6 are repeatedly executed. Here, the mail i is a mail corresponding to the “past mail” of the analysis target mail m. In other words, there is a possibility that there is always one mail to be analyzed m, while there are a plurality of past mail i.

[ステップS2−4]
さて、このiを繰り返し用の変数とした繰り返し処理において、ステップS2−4では、引用文一致判定部28は、現在着目している過去メールiの本文文字列を行単位で全て取得する。ただし、このとき、行頭の数文字に返信記号が存在する場合は、引用文一致判定部28は、返信記号を除いた本文文字列を取得する。また、引用文一致判定部28は、空白文字しか存在しない行を取得対象から外す。この取得文字列を「比較文字列群B」とする。
[Step S2-4]
In the repetition process using i as a variable for repetition, in step S2-4, the quote match determination unit 28 acquires all the text strings of the past mail i currently focused on in line units. However, at this time, if a reply symbol exists in the first few characters of the line, the quote match determination unit 28 acquires a text string excluding the reply symbol. In addition, the quote match determination unit 28 excludes lines having only blank characters from acquisition targets. This acquired character string is referred to as “comparison character string group B”.

ステップS2−4において取得された「比較文字列群B」では、図9に示すように、行数がqであるとき、文字列を取得した順に、行番号は、1、2、・・・、q−1、qと定義される。   In the “comparison character string group B” acquired in step S2-4, as shown in FIG. 9, when the number of lines is q, the line numbers are 1, 2,... , Q-1, q.

[ステップS2−5]
S2−5では、引用文一致判定部28は、比較文字列群Aと比較文字列群Bとを対象として、行単位で文字列比較(マッチング)を実行し、一致する行数が「停止閾値」を超えているかどうかを判定する。
[Step S2-5]
In S2-5, the quote match determination unit 28 performs character string comparison (matching) on a line-by-line basis for the comparison character string group A and the comparison character string group B, and the number of matching lines is “stop threshold value”. ”Is determined.

そして、文字列比較の結果、一致する行数が「停止閾値」を超えている場合は、引用文一致判定部28は、現在注目している過去メールiは解析対象メールmの引用元メールと判断する。そして、この場合、「解析対象メールmの引用文を削除しても、過去メールiを合わせて参照することで、利用者は、メールの一連のやりとりを理解できる」と考えられる。従って、引用文一致判定部28は、iの繰り返し処理を終了し、引用文削除部23に対して、引用文を削除するように通知する。これにより、引用文削除部23がステップS3を実行する。   If the number of matching lines exceeds the “stop threshold” as a result of the character string comparison, the quote match determination unit 28 determines that the past mail i currently focused on is the citation mail of the analysis target mail m. to decide. In this case, it is considered that "the user can understand a series of mail exchanges by referring to the past mail i even if the quotation of the analysis target mail m is deleted". Therefore, the quoted sentence matching determination unit 28 terminates the i repetition process and notifies the quoted sentence deleting unit 23 to delete the quoted sentence. Thereby, the quote deletion part 23 performs step S3.

一方、文字列比較の結果、一致する行数が「停止閾値」を超えていない場合は、引用文一致判定部28は、過去メールiは解析対象メールmの引用元メールではないと判断する。そして、引用文一致判定部28は、ステップS2−6において、iの値を減算し、再度、ステップS2−3以降を実行して、次の過去メールの文字列比較を行う(iの繰り返し処理の継続)。   On the other hand, if the number of matching lines does not exceed the “stop threshold” as a result of the character string comparison, the quote match determination unit 28 determines that the past mail i is not the citation mail of the analysis target mail m. Then, in step S2-6, the quote match determination unit 28 subtracts the value of i, executes step S2-3 and the subsequent steps again, and compares the character strings of the next past mail (repetition processing of i). Continuation).

なお、過去メールの中に、解析対象メールmの引用元メールが一通も存在しない場合、即ち文字列の一致行数が「停止閾値」を超える過去メールが一通も存在しない場合は、解析対象メールmの引用文を削除すると、利用者が一連のメールのやりとりを理解できなくなると考えられる。よって、この場合は、図2中には示されていないが、後述する引用文削除部23による引用文の削除は行われず、メール容量削減支援装置20における処理は終了する。なお、ステップS2−5の詳細については、後述する。 Note that if there is no citation mail of the analysis target mail m in the past mail, that is, if there is no past mail in which the number of matching lines in the character string exceeds the “stop threshold”, the analysis target mail If m quotes are deleted, the user will not be able to understand a series of email exchanges. Therefore, in this case, although not shown in FIG. 2, the quote deletion by the quote deletion unit 23 described later is not performed, and the processing in the mail capacity reduction support device 20 ends. Details of step S2-5 will be described later.

[ステップS3]
ステップS3では、引用文削除部23は、解析対象メールmの全ての引用文を削除し、処理を完了する。このとき、解析対象メールmの本文中のどこの引用文が削除されているのかを、利用者が把握できるようにするために、引用文削除部23は、図7に示すように、「引用文を削除しました」のような文字列を挿入する。
[Step S3]
In step S <b> 3, the quote deletion unit 23 deletes all quotes of the analysis target mail m and completes the process. At this time, in order to enable the user to understand which quotation in the body of the analysis target mail m has been deleted, the quotation deletion unit 23, as shown in FIG. Insert a string like "Sentence deleted".

[ステップS2−5の詳細]
次に、図10を参照して、図2に示した、「過去メールiが解析対象メールmの引用元メールかどうかを判定する処理(ステップS2−5)を更に詳細に説明する。図10は、図2に示したステップS2−5における処理の詳細の示すフロー図である。また、以下の説明では、図9を適宜参照する。
[Details of Step S2-5]
Next, referring to FIG. 10, the “process for determining whether the past mail i is the citation source mail of the analysis target mail m (step S2-5)” shown in FIG. These are the flowcharts which show the detail of the process in step S2-5 shown in FIG 2. Moreover, in the following description, FIG.

[ステップS2−5−1]
まずステップS2−5−1において、引用文一致判定部28は、以下の処理にて使用する変数x、y、sに初期値を設定する。xは、図10に示した比較文字列群Aの行番号を表す変数であり、xの初期値は1に設定される。yは、図10に示した比較文字列群Bの行番号を表す変数であり、yの初期値も1に設定される。
[Step S2-5-1]
First, in step S2-5-1, the quote match determination unit 28 sets initial values for variables x, y, and s used in the following processing. x is a variable representing the line number of the comparison character string group A shown in FIG. 10, and the initial value of x is set to 1. y is a variable representing the line number of the comparison character string group B shown in FIG. 10, and the initial value of y is also set to 1.

[ステップS2−5−2〜S2−5−9]
引用文一致判定部28は、以降に示すように、ステップS2−5−2〜ステップS2−5−9において、変数x(=1、・・・、p)を用いた繰り返し処理と、変数y(=1、・・・q)を用いた繰り返し処理との二重の繰り返し処理を実行する。
[Steps S2-5-2 to S2-5-9]
As shown below, the quote match determination unit 28 performs the iterative process using the variable x (= 1,..., P) and the variable y in steps S2-5-2 to S2-5-9. A double repetition process with the repetition process using (= 1,... Q) is executed.

また、pは、比較文字列群Aの行数であり、S2−5−2で繰り返し処理の終了条件として使用されている。一方、qは、比較文字列群Bの行数であり、S2−5−3で繰り返し処理の終了条件として使用されている。更に、sは、xとyとを用いた二重の繰り返し処理の中で、条件次第でインクリメントしていく変数であり、初期値は0に設定されている。   Further, p is the number of lines in the comparison character string group A, and is used as the end condition of the iterative process in S2-5-2. On the other hand, q is the number of lines of the comparison character string group B, and is used as the end condition of the iterative process in S2-5-3. Further, s is a variable that is incremented depending on conditions in a double iterative process using x and y, and the initial value is set to zero.

ステップS2−5−2〜ステップS2−5−9における、xとyとの二重繰り返し処理を抜ける条件は、以下の条件1と条件2との2つである。「条件1」は、sの値が「停止閾値」に到達すること(ステップS2−5−9の条件を満たすこと)である。「条件2」は、xとyとの全ての組み合わせにおいて文字列のマッチングを行ってもsの値が停止閾値に到達しないこと(ステップS2−5−2の条件を満たさない)である。   In step S2-5-2 to step S2-5-9, there are two conditions, condition 1 and condition 2 below, for exiting the double repetition process of x and y. “Condition 1” is that the value of s reaches the “stop threshold” (the condition of step S2-5-9 is satisfied). “Condition 2” is that the value of s does not reach the stop threshold even if character strings are matched in all combinations of x and y (the condition of step S2-5-2 is not satisfied).

まず「条件1」について説明する。図10に示すように、ステップS2−5−4において、引用文一致判定部28は、比較文字列群Aのx行目と比較文字列群Bのy行目の文字列との比較を行い、文字列が一致するかどうかを判定する。   First, “Condition 1” will be described. As shown in FIG. 10, in step S2-5-4, the quote match determination unit 28 compares the x-th line of the comparison character string group A with the character string of the y-th line of the comparison character string group B. Determine whether the character strings match.

ステップS2−5−4の判定の結果、文字列が一致しない場合は、引用文一致判定部28は、ステップS2−5−5に進み、yをインクリメントし、以降の繰り返し処理を続ける。一方、ステップS2−5−4の判定の結果、文字列が一致する場合は、引用文一致判定部28は、ステップS2−5−8でsをインクリメントした後、ステップS2−5−9に進む。   If the result of determination in step S2-5-4 is that the character strings do not match, the quote match determination unit 28 proceeds to step S2-5-5, increments y, and continues the subsequent iterative processing. On the other hand, as a result of the determination in step S2-5-4, if the character strings match, the quote match determination unit 28 increments s in step S2-5-8, and then proceeds to step S2-5-9. .

ステップS2−5−9では、引用文一致判定部28は、「s=停止閾値」の条件を満たしているかどうかを判定する。ステップS2−5―9は、条件1についての判定ステップである。   In step S2-5-9, the quotation match determination unit 28 determines whether or not the condition “s = stop threshold” is satisfied. Step S2-5-9 is a determination step for Condition 1.

ステップS2−5−9の判定の結果、sの値が停止閾値を満たしている場合、つまり、文字列の一致回数が「停止閾値」に到達した場合、引用文一致判定部28は、現在注目している過去メールiが解析対象メールmの引用元メールと判断する。この結果、引用文削除部23が、図2に示したステップS3を実行し、解析対象メールmの引用文を削除する。   As a result of the determination in step S2-5-9, when the value of s satisfies the stop threshold value, that is, when the number of matches of the character string reaches the “stop threshold value”, the quoted sentence match determination unit 28 It is determined that the past mail i is the citation mail of the analysis target mail m. As a result, the quote deletion unit 23 executes step S3 shown in FIG. 2 and deletes the quote of the analysis target mail m.

一方、ステップS2−5−9の判定の結果、sの値が停止閾値を満たしていない場合は、引用文一致判定部28は、ステップS2−5−6においてxをインクリメントし、更に、ステップS2−5−7においてyを1に初期化し、その上で、以降の繰り返し処理を続ける。   On the other hand, as a result of the determination in step S2-5-9, if the value of s does not satisfy the stop threshold, the quotation match determination unit 28 increments x in step S2-5-6, and further, step S2 In -5-7, y is initialized to 1, and then the subsequent iterative process is continued.

次に条件2について説明する。条件1の終了条件を満たさないまま、比較文字列群Aと比較文字列群Bとの全ての行における比較が終了した場合、条件2が満たされることになる。つまり、図10において、ステップS2−5−6およびステップS2−5−7が実行された後に、ステップS2−5−2の条件が満たされない場合、条件2が満たされることになる。条件2が満たされると、図2に示すステップS2−6が実行される。   Next, condition 2 will be described. If the comparison in all rows of the comparison character string group A and the comparison character string group B is completed without satisfying the termination condition of the condition 1, the condition 2 is satisfied. That is, in FIG. 10, after step S2-5-6 and step S2-5-7 are executed, when the condition of step S2-5-2 is not satisfied, condition 2 is satisfied. When condition 2 is satisfied, step S2-6 shown in FIG. 2 is executed.

つまり、条件2が満たされた状態(ステップS2−5−2の条件が満たされない状態)は、現在注目している過去メールiが解析対象メールmの引用元メールではないと判断された状態である。従って、iをデクリメントした上で、再度、解析対象メールmと過去メールiとの文字列の比較を継続するため、ステップS2−6が実行される。   That is, the state in which the condition 2 is satisfied (the state in which the condition in step S2-5-2 is not satisfied) is a state in which it is determined that the past mail i currently focused on is not the citation mail of the analysis target mail m. is there. Accordingly, after decrementing i, step S2-6 is executed in order to continue the comparison of the character strings of the analysis target mail m and the past mail i again.

なお、図2および図10中には示されていないが、全ての過去メール(メール番号m−1以下のメール全て)について、「条件1」が満たされない場合、即ち、図2に示すステップS3において「Yes」とならない場合は、引用文削除部23による解析対象メールmの引用文の削除は行われず、代わりに、メール容量削減装置20における処理は停止する。   Although not shown in FIG. 2 and FIG. 10, “condition 1” is not satisfied for all past mails (all mails with mail number m−1 or less), that is, step S3 shown in FIG. If “Yes” is not obtained, the quoted sentence of the analysis target mail m is not deleted by the quoted sentence deleting unit 23, and instead, the processing in the mail capacity reduction device 20 is stopped.

ここで、本実施の形態1において用いる「停止閾値」について説明する。停止閾値を適切な値に設定することで、引用文の誤検出を防止したり、引用文を削除する頻度を調整したりすることができる。   Here, the “stop threshold” used in the first embodiment will be described. By setting the stop threshold to an appropriate value, it is possible to prevent erroneous detection of a quoted sentence or adjust the frequency of deleting a quoted sentence.

まず、引用文の誤検出防止について説明する。メールの送信者は、自分の名前、所属、電話番号等を署名文として、メールの最下部に追加することが一般的である。署名文は、たいてい数行程度で構成されており、毎回同じものを追加することがほとんどである。つまり、解析対象メールと過去メールとの文字列を比較したときに、互いに全く関係のないメールであっても、署名文の数行分については文字列が一致する可能性がある。同様のことが、「以上です。」、「お世話になっております。」などのような定型的な文についても言える。   First, prevention of erroneous detection of quotes will be described. The sender of mail generally adds his / her name, affiliation, telephone number, etc. as a signature sentence at the bottom of the mail. The signature text is usually composed of several lines, and the same one is almost always added. That is, when the character strings of the analysis target mail and the past mail are compared, there is a possibility that the character strings match for several lines of the signature sentence even if the mails have nothing to do with each other. The same can be said for typical sentences such as "That's it.", "Thank you for taking care of me."

以上の点から、本実施の形態1においては、「互いに全く関係の無いメール(引用関係または被引用関係にないメール)でも一致する可能性がある行数」以上の値を、停止閾値に設定し、引用文が誤検出されないようにするのが良い。   From the above points, in the first embodiment, the stop threshold is set to a value equal to or greater than “the number of lines that may match even mails that are not related to each other (mails that are not cited or cited)”. And it's better to avoid misdetecting quotes.

また、図9に示すように、停止閾値が小さいほど、過去メールが引用元メールと判定されやすくなり、解析対象メールの引用文が削除される可能性が高くなる。逆に、停止閾値が大きいときは、解析対象メールの引用文が削除される可能性が低くなる。これらのことを利用し、停止閾値の値によって、引用文の削除頻度の調整を行う事が可能となるAlso, as shown in FIG. 9, the smaller the stop threshold, the easier it is to determine that the past mail is the citation source mail, and the higher the possibility that the quoted sentence of the analysis target mail will be deleted. On the other hand, when the stop threshold is large, the possibility that the quoted sentence of the analysis target mail is deleted becomes low. Using these things, it is possible to adjust the deletion frequency of the quoted sentence according to the value of the stop threshold .

また、停止閾値は、上述したように、引用文の誤検出を防止できる値以上とすれば良く、この範囲であればどのような値に設定されていても良い。例えば、メール容量の削減効果を高めたいのであれば、停止閾値を小さい値にすれば良いし、判読性の低下を防ぐ等の目的で、短い引用文を削除しないようにしたいのであれば、停止閾値を大きい値にすれば良い。なお、停止閾値の値は、利用者が普段やりとりしているメールの内容等に応じて、適宜最適な値に設定すれば良い。   Further, as described above, the stop threshold may be set to a value that can prevent erroneous detection of a quoted sentence, and may be set to any value within this range. For example, if you want to increase the mail capacity reduction effect, you can set the stop threshold to a small value, and if you do not want to delete short quotes for the purpose of preventing legibility deterioration, stop What is necessary is just to make a threshold value large. Note that the value of the stop threshold value may be set to an optimal value as appropriate in accordance with the contents of mail that the user normally exchanges.

次に、本実施の形態1において、解析対象メールmから取得する「比較文字列群A」を、多重引用文(引用回数が任意回数の引用文)を対象とせず、一重引用文(引用回数一回の引用文)に限定する理由を説明する。理由は大きく分けて二つある。   Next, in the first embodiment, the “comparison character string group A” acquired from the analysis target mail m does not target multiple quotes (quotes with an arbitrary number of citations) but single quotes (quotes). Explain the reason for limiting to a single quote). There are two main reasons.

一つ目の理由は「処理量を削減するため」である。ある元メールに基づいて、返信メール、または転送メールを作成する場合、メールソフトは、自動的に「元メールの本文の各行頭に返信記号を一文字ずつ付加したメール」を作成する。そして、利用者が、メールソフトが自動的に作成したメールに、返信内容および回答内容等を追記していく形態が、一般的である。   The first reason is “to reduce the amount of processing”. When creating a reply mail or a forward mail based on a certain original mail, the mail software automatically creates a "mail with a reply symbol added to the beginning of each line of the original mail body". In general, the user adds the reply contents and the reply contents to the mail automatically created by the mail software.

このとき、元メールの本文中には、「引用文ではない文(平文)」が通常存在するため、この自動作成されるメールには、利用者が意図的に削除しない限り、一重引用文が存在することになる。従って、引用元メールかどうかの判断材料として、この一重引用文を利用すれば、引用文解析部22は、多重引用文を利用する場合に比べて、少ない処理量で引用元メールを検出することができる。   At this time, since there is usually a “non-quoted sentence (plain text)” in the text of the original email, this automatically created email will contain a single quote unless the user intentionally deletes it. Will exist. Therefore, if this single quotation is used as a material for determining whether or not it is a citation mail, the citation analysis unit 22 can detect the citation mail with a smaller amount of processing than when using multiple citations. Can do.

仮に、メールの返信者または転送者が、一重引用文を意図的に削除した場合は、本発明では引用文の削除はできないことになる。但し、一重引用文は、いわば「直前のやりとりの引用」であり、比較的重要な内容であることが多く、削除するケースは少ないと考えられるため、この意味でも比較対象を一重引用文に限定しても問題はないと考えられる。   If the mail replyer or forwarder intentionally deletes the single quote, the present invention cannot delete the quote. However, single quotes are, so to speak, “quotes from the last exchange”, and are often relatively important, and are considered to be rarely deleted. Therefore, in this sense, the comparison target is limited to single quotes. There seems to be no problem.

なお、図2に示したステップS2において、iの繰り返し処理をiの降順で実施しているのは、メール番号iの大きいメール、即ち、受信日時が新しいメールから順に検索した方が、一重引用文の一致する過去メールを早く検出できると考えられるからである。   Note that in step S2 shown in FIG. 2, i is repeatedly performed in descending order of i. A single quoting is performed when a mail with a larger mail number i, that is, a mail with a new reception date and time is searched in order. This is because it is considered that past emails with matching sentences can be detected quickly.

二つ目の理由は「引用元メールを安定して検出するため」である。上述したように、停止閾値は、「引用関係または被引用関係にないメールであっても一致する可能性がある行数」以上の値に設定するのが良い。この場合において、比較文字列群Aの対象を多重引用文にすると、その中に複数人分の署名文と定型文が含まれる可能性が高いため、比較文字列群Aの内容に応じて停止閾値を変化させないと、引用元メールを安定して検出することができなくなる。これに対して、一重引用文を使えば、比較文字列群Aに含まれる署名文は、一箇所に限られると考えられるため、停止閾値を固定的な値として、メール容量削減支援装置20に登録しておくことができ、結果、安定した動作を期待できる。   The second reason is “to stably detect the original mail”. As described above, the stop threshold value is preferably set to a value equal to or greater than “the number of lines that may match even mail that is not in a citation relationship or a cited relationship”. In this case, if the target of the comparison character string group A is a multiple quote sentence, there is a high possibility that a signature sentence and a fixed sentence will be included in a plurality of people. Unless the threshold is changed, it is impossible to stably detect the citation mail. On the other hand, if a single quote is used, the signature sentence included in the comparison character string group A is considered to be limited to one place. Therefore, the mail threshold reduction support device 20 is set with a fixed stop threshold value. As a result, stable operation can be expected.

また、上述した例では、図1に示したメール保存部24に予め保存されている任意のメール一通を対象として、引用文を削除するかどうかの解析が行われている。しかしながら、本実施の形態1は、上述の例に限定されるものではない。本実施の形態1では、上述の処理対象となるメールとして、複数のメール、例えば、あるメールフォルダ内にある全てのメール等が同時に指定されていても良い。   In the above-described example, an analysis is performed as to whether or not to delete a quote for any mail stored in advance in the mail storage unit 24 shown in FIG. However, Embodiment 1 is not limited to the above example. In the first embodiment, a plurality of mails, for example, all mails in a certain mail folder may be designated at the same time as the mails to be processed.

本実施の形態1において、メール容量削減装置20による処理の開始は、利用者によって手動で行われても良いし、装置自身によって自動で行われても良い。また、自動で開始する場合は、メール容量削減装置20は、メールの受信から一定期間が経過したときに、自動的に処理を開始しても良いし、メールを受信する度に自動的に処理を開始しても良い。   In the first embodiment, the processing by the mail capacity reduction device 20 may be started manually by a user or automatically by the device itself. In addition, when starting automatically, the mail capacity reduction device 20 may automatically start processing when a certain period of time has elapsed since the reception of the mail, or automatically whenever a mail is received. You may start.

メール容量削減装置20が、自動的に処理を開始する態様とした場合は、利用者の手間をより省くことが可能になると考えられる。なお、上述したように、本実施の形態1においては、同じメールフォルダ内に一連のやりとりを行ったメール群がまとめて分類されていることが好ましい。このため、メール容量削減装置20が自動的に処理を開始する場合は、メールフォルダへの分類も自動で実行されているのが好ましい。   When the mail capacity reduction device 20 is configured to automatically start processing, it is considered that it is possible to save the user's trouble. As described above, in the first embodiment, it is preferable that mail groups that have undergone a series of exchanges are grouped together in the same mail folder. For this reason, when the mail capacity reduction device 20 starts processing automatically, it is preferable that the classification into mail folders is also automatically executed.

本発明の実施の形態1におけるプログラムは、コンピュータに、図2に示すステップS1〜S3、図10に示すステップS2−5−1〜S2−5−9を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態1におけるメール容量削減支援装置20とメール容量削減支援方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、メール受信部21、引用文解析部22、引用文削除部23として機能し、処理を行なう。また、コンピュータに備えられたハードディスク等の記憶装置が、メール保存部24、停止閾値保存部25、返信記号記憶部26として機能する。   The program according to the first embodiment of the present invention may be a program that causes a computer to execute steps S1 to S3 shown in FIG. 2 and steps S2-5-1 to S2-5-9 shown in FIG. By installing and executing this program on a computer, the mail capacity reduction support device 20 and the mail capacity reduction support method according to the first embodiment can be realized. In this case, a CPU (Central Processing Unit) of the computer functions as the mail receiving unit 21, the quote analysis unit 22, and the quote deletion unit 23 to perform processing. A storage device such as a hard disk provided in the computer functions as the mail storage unit 24, the stop threshold storage unit 25, and the reply symbol storage unit 26.

[実施の形態1における効果]
本実施の形態1による第1の効果は、受信された各メールから、削除してもメールの意味を把握できる引用文のみを、自動的に削除でき、利用者の手間をかけることなくメール容量を削減できることである。その理由は、解析対象メールだけに注目するのではなく、同じメールフォルダ内に分類されている過去メールにも注目し、過去メールの中に引用元メールが存在する場合に、引用文を削除することが明確に定義され、この定義にそって処理が行われるからである。
[Effect in Embodiment 1]
The first effect of the first embodiment is that it is possible to automatically delete only quotes that can grasp the meaning of mail from each received mail even if it is deleted. Can be reduced. The reason is not to focus only on the emails to be analyzed, but also on the past emails classified in the same mail folder, and delete the quoted text if there is a source email in the past emails This is because it is clearly defined and processing is performed in accordance with this definition.

本実施の形態1による第2の効果は、処理時間を削減できることである。その理由は、たとえ同じメールフォルダ内に引用元メールがあったとしても、削除すると意味が理解できなくなる引用文、つまり部分引用形式で記述されている引用文は、処理対象としないからである。つまり、本実施の形態1では、部分引用形式で記述されている引用文かどうかが判断され、部分引用形式で記述されている引用文の場合は、過去メールから引用元メールを検索する処理において処理対象としていない。結果、処理量が大きくなる、部分引用形式で記述されている引用文を対象とした文字列比較処理は行われず、処理時間が削減される。   The second effect of the first embodiment is that the processing time can be reduced. The reason is that even if there is a citation source mail in the same mail folder, a citation that cannot be understood when deleted, that is, a citation described in a partial citation format is not processed. That is, in the first embodiment, it is determined whether or not a quotation is described in a partial quotation format. In the case of a quotation described in a partial quotation format, Not subject to processing. As a result, the processing time is reduced because character string comparison processing is not performed for a quote sentence described in a partial citation format, which increases the processing amount.

本実施の形態1による第3の効果は、引用元メールの誤検出を防止できることである。その理由は、引用元メールかどうか判定するためのパラメータとして、「停止閾値」を設定し、引用元メールではないのに文字列が一致する原因となる、署名文、または定型文を排除しているからである。本実施の形態1では、解析対象メールと過去メールとが、署名文または定型文において一致しても、停止閾値により、この場合の過去メールが引用元メールと判定されることはない。   A third effect of the first embodiment is that it is possible to prevent erroneous detection of a citation source mail. The reason for this is to set a “stop threshold” as a parameter to determine whether the email is a quoted email, and eliminate the signature or fixed phrase that causes the character string to match even though it is not the quoted email. Because. In the first embodiment, even if the analysis target mail and the past mail match in the signature text or the fixed text, the past mail in this case is not determined to be the citation mail by the stop threshold.

本実施の形態1による第4の効果は、引用元メールの検出頻度を調整できることである。その理由は、本実施の形態1では、「停止閾値」を増減することで、引用元メールの検出頻度を変更できるからである。   The fourth effect of the first embodiment is that the frequency of detecting the citation source mail can be adjusted. The reason is that in the first embodiment, the frequency of detecting the citation source mail can be changed by increasing or decreasing the “stop threshold”.

(実施の形態2)
次に、本発明の実施の形態2における、メール容量削減支援装置、メール容量削減支援方法、及びプログラムについて、図11および図12を参照しながら説明する。
(Embodiment 2)
Next, a mail capacity reduction support device, a mail capacity reduction support method, and a program according to Embodiment 2 of the present invention will be described with reference to FIGS.

本実施の形態2におけるメール容量削減支援装置は、図1に示した実施の形態1におけるメール容量削減装置20と同様の構成を備えているが、引用文解析部22における機能の点で、実施の形態1におけるメール容量削減装置20と異なっている。なお、以下の説明では、図1を適宜参酌する。   The mail capacity reduction support apparatus according to the second embodiment has the same configuration as the mail capacity reduction apparatus 20 according to the first embodiment shown in FIG. This is different from the mail capacity reduction device 20 in the first embodiment. In the following description, FIG. 1 is taken into consideration as appropriate.

本実施の形態2においては、引用文解析部22の引用文一致判定部28が、停止閾値の値を設定する機能を備えている。つまり、実施の形態1においては、停止閾値は、停止閾値記憶部25に定数(正の整数)として記憶されていたが、本実施の形態2では、停止閾値は、解析対象メールmの本文の行数に応じて、都度計算されて設定される。   In the second embodiment, the quote match determination unit 28 of the quote analysis unit 22 has a function of setting a stop threshold value. That is, in the first embodiment, the stop threshold is stored as a constant (a positive integer) in the stop threshold storage unit 25. However, in the second embodiment, the stop threshold is the body of the analysis target mail m. It is calculated and set each time according to the number of lines.

実施の形態1において、図9および図10を用いて説明したように、文字列の一致回数をカウントするための変数sの最大値は、比較文字列群A(解析対象メールmの一重引用文)の総行数pに等しくなる。つまり、図10に示したステップS2−5−9の条件を満たし、引用文を検出するためには、停止閾値はp以下の整数である必要がある。言い換えると、停止閾値がpより大きい場合は、ステップS3に進むことは一切無い。   As described with reference to FIGS. 9 and 10 in the first embodiment, the maximum value of the variable s for counting the number of matching of the character strings is the comparison character string group A (single quoted sentence of the analysis target mail m). ) Is equal to the total number of rows p. That is, in order to satisfy the condition of step S2-5-9 shown in FIG. 10 and detect a quoted sentence, the stop threshold value must be an integer equal to or less than p. In other words, if the stop threshold is greater than p, there is no progress to step S3.

また同時に「引用関係または被引用関係にないメールであっても一致する可能性がある行数」をgとすると、停止閾値はgよりも大きい整数であるのが良い。これは、停止閾値がgより小さい場合は、引用文を誤検出する可能性があるからである。なお、gは正の定数であり、gの適切な値は、利用者がどのようなメールを受信するかに関わらず、おおよそ一定値として与えられると考えられる。   At the same time, if “the number of lines that can be matched even in mail not in citation relationship or citation relationship” is g, the stop threshold value may be an integer larger than g. This is because if the stop threshold is smaller than g, there is a possibility that a quoted sentence is erroneously detected. Note that g is a positive constant, and an appropriate value of g is considered to be given as a substantially constant value regardless of what kind of mail the user receives.

以上から、停止閾値をgより大きくpより小さい値にすれば、引用文を誤検出することなく、かつ、検出漏れを防止できると考えられる。ここで、図11を用いて、停止期間閾値の設定について説明する。図11は、引用文の解析に用いられる停止閾値の好ましい範囲を示す図である。   From the above, it is considered that if the stop threshold is set to a value larger than g and smaller than p, it is possible to prevent a detection omission without erroneously detecting a quoted sentence. Here, the setting of the stop period threshold value will be described with reference to FIG. FIG. 11 is a diagram illustrating a preferable range of the stop threshold value used for the analysis of the quotation.

図11は、引用文一致判定部28が、(a)pがgよりも大きい場合において、(b)停止閾値をgとpとの中間値とする、という2つの条件に基づいて、停止閾値を設定する例を示している。図11の例では、引用文一致判定部28は、停止閾値として、[(g+p)/2]を計算する。なお、本実施の形態2において、停止閾値を計算するための式は、図11の例に限定されるものではない。   FIG. 11 shows the stop threshold based on the two conditions that (b) the stop threshold is an intermediate value between g and p when (a) p is larger than g. An example of setting is shown. In the example of FIG. 11, the quote match determination unit 28 calculates [(g + p) / 2] as the stop threshold. In the second embodiment, the formula for calculating the stop threshold is not limited to the example of FIG.

ただし、停止閾値は整数であるから、計算結果が整数にならないときは、引用文一致判定部28は、例えば、小数点第一位を切り上げる等して、停止閾値を整数にする。なお、pがgよりも小さいときは、上記二つの条件のうち、(a)が満たされず、停止閾値を計算できないため、引用文一致判定部28は、文字列の比較処理に入る前に処理を停止するようにする。   However, since the stop threshold is an integer, when the calculation result does not become an integer, the quote match determination unit 28 sets the stop threshold to an integer, for example, by rounding up the first decimal place. When p is smaller than g, (a) is not satisfied among the above two conditions, and the stop threshold value cannot be calculated. Therefore, the quote match determination unit 28 performs processing before entering the character string comparison process. To stop.

次に、本発明の実施の形態2におけるメール容量削減支援装置の動作について図12を用いて説明する。図12は、本発明の実施の形態2におけるメール容量削減支援装置の動作を示すフロー図である。また、本実施の形態2でも、メール容量削減支援装置を動作させることによって、メール容量削減支援方法が実施される。よって、本実施の形態2におけるメール容量削減支援方法の説明は、以下のメール容量削減支援装置の動作説明に代える。   Next, the operation of the mail capacity reduction support apparatus according to Embodiment 2 of the present invention will be described with reference to FIG. FIG. 12 is a flowchart showing the operation of the mail capacity reduction support apparatus according to Embodiment 2 of the present invention. Also in the second embodiment, the mail capacity reduction support method is implemented by operating the mail capacity reduction support apparatus. Therefore, the description of the mail capacity reduction support method in the second embodiment is replaced with the following description of the operation of the mail capacity reduction support apparatus.

図12に示すように、最初に、ステップA1−1において、引用文一致判定部28が、停止閾値記憶部25から、ステップA2で使用する「停止閾値」の下限gを取得し、更に、返信記号記憶部26から、「返信記号」のリストを取得する。ステップA1−1は、停止閾値の代わりに、停止閾値の下限gが取得される点で、図1に示したステップS1−1と異なっている。   As shown in FIG. 12, first, in step A1-1, the quote match determination unit 28 acquires the lower limit g of the “stop threshold” used in step A2 from the stop threshold storage unit 25, and further returns a reply. A list of “reply symbols” is acquired from the symbol storage unit 26. Step A1-1 is different from Step S1-1 shown in FIG. 1 in that the lower limit g of the stop threshold is acquired instead of the stop threshold.

次に、引用文形式判定部27が、ステップA1−2およびステップA1−3を実行する。ステップA1−2およびステップA1−3は、図2に示した、ステップS1−2およびステップS1−3と同様のステップである。   Next, the quote format determination unit 27 executes Step A1-2 and Step A1-3. Step A1-2 and step A1-3 are the same steps as step S1-2 and step S1-3 shown in FIG.

次に、ステップA2−1において、引用文一致判定部28は、解析対象メールmの一重引用文の文字列(比較文字列群A)を取得するのと同時に、一重引用文の行数pも取得する。   Next, in step A2-1, the quote match determination unit 28 obtains the single quote text (comparison character string group A) of the analysis target mail m, and at the same time, the number p of single quote sentences is also obtained. get.

続いて、ステップA2−2において、引用文一致判定部28は、pがgよりも大きいかどうかを判定する。ステップA2−2の判定の結果、pがgよりも大きくない場合は、処理を停止する。これにより、メール容量削減支援装置における処理は終了する。   Subsequently, in step A2-2, the quote match determination unit 28 determines whether p is larger than g. As a result of the determination in step A2-2, when p is not larger than g, the process is stopped. Thereby, the processing in the mail capacity reduction support apparatus is completed.

一方、ステップA2−2の判定の結果、pがgよりも大きくい場合は、ステップA2−3において、引用文一致判定部28は、引用文一致判定部28は、図11に示したようにpとgとを用いて停止閾値を計算する。   On the other hand, if p is larger than g as a result of the determination in step A2-2, in step A2-3, the quote match determination unit 28 determines that the quote match determination unit 28 is as shown in FIG. A stop threshold is calculated using p and g.

次に、引用文一致判定部28は、ステップA2−4〜ステップA2−8を実行する。なお、ステップA2−4〜ステップA2−8は、それぞれ、図2に示したステップS2−2〜ステップS2−6と同様のステップである。   Next, the quote match determination unit 28 executes Step A2-4 to Step A2-8. Steps A2-4 to A2-8 are the same steps as steps S2-2 to S2-6 shown in FIG.

その後、ステップA3において、引用文削除部23が、解析対象メールmの全ての引用文を削除し、処理を完了する。ステップA3は、図2に示したステップS3と同様のステップである。   Thereafter, in step A3, the quote deletion unit 23 deletes all the quotes of the analysis target mail m and completes the process. Step A3 is the same as step S3 shown in FIG.

以上のように、本実施の形態2によれば、解析対象メールの本文の行数に応じて、停止閾値を最適な値に設定できるので、より確実に、削除してもメールの意味を把握できる引用文のみを削除できる。また、本実施の形態2においても、上述した実施の形態1と同様の効果を得ることができる。   As described above, according to the second embodiment, the stop threshold can be set to an optimum value according to the number of lines in the body of the analysis target mail, so that the meaning of the mail can be grasped even more reliably. Only possible quotes can be deleted. Also in the second embodiment, the same effect as in the first embodiment can be obtained.

本発明の実施の形態2におけるプログラムは、コンピュータに、図12に示すステップA1〜A3、図10に示すステップS2−5−1〜S2−5−9を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態2におけるメール容量削減支援装置とメール容量削減支援方法とを実現することができる。この場合、コンピュータのCPUは、メール受信部21、引用文解析部22、引用文削除部23として機能し、処理を行なう。また、コンピュータに備えられたハードディスク等の記憶装置が、メール保存部24、停止閾値保存部25、返信記号記憶部26として機能する。   The program according to the second embodiment of the present invention may be a program that causes a computer to execute steps A1 to A3 shown in FIG. 12 and steps S2-5-1 to S2-5-9 shown in FIG. By installing and executing this program on a computer, the mail capacity reduction support apparatus and mail capacity reduction support method according to the second embodiment can be realized. In this case, the CPU of the computer functions as the mail reception unit 21, the quote analysis unit 22, and the quote deletion unit 23, and performs processing. A storage device such as a hard disk provided in the computer functions as the mail storage unit 24, the stop threshold storage unit 25, and the reply symbol storage unit 26.

ここで、実施の形態1または2におけるプログラムを実行することによって、メール容量削減支援装置を実現するコンピュータについて図13を用いて説明する。図13は、本発明の実施の形態1または2におけるメール容量削減支援装置を実現するコンピュータの一例を示すブロック図である。   Here, a computer that realizes the mail capacity reduction support apparatus by executing the program according to the first or second embodiment will be described with reference to FIG. FIG. 13 is a block diagram illustrating an example of a computer that implements the mail capacity reduction support apparatus according to Embodiment 1 or 2 of the present invention.

図13に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。   As shown in FIG. 13, the computer 110 includes a CPU 111, a main memory 112, a storage device 113, an input interface 114, a display controller 115, a data reader / writer 116, and a communication interface 117. These units are connected to each other via a bus 121 so that data communication is possible.

CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。   The CPU 111 performs various calculations by developing the program (code) in the present embodiment stored in the storage device 113 in the main memory 112 and executing them in a predetermined order. The main memory 112 is typically a volatile storage device such as a DRAM (Dynamic Random Access Memory). Further, the program in the present embodiment is provided in a state of being stored in a computer-readable recording medium 120. Note that the program in the present embodiment may be distributed on the Internet connected via the communication interface 117.

また、記憶装置113の具体例としては、ハードディスクの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。   Specific examples of the storage device 113 include a hard disk and a semiconductor storage device such as a flash memory. The input interface 114 mediates data transmission between the CPU 111 and an input device 118 such as a keyboard and a mouse. The display controller 115 is connected to the display device 119 and controls display on the display device 119. The data reader / writer 116 mediates data transmission between the CPU 111 and the recording medium 120, and reads a program from the recording medium 120 and writes a processing result in the computer 110 to the recording medium 120. The communication interface 117 mediates data transmission between the CPU 111 and another computer.

また、記録媒体120の具体例としては、CF(Compact Flash)及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記憶媒体、又はCD−ROM(Compact Disk Read Only Memory)などの光学記憶媒体が挙げられる。   Specific examples of the recording medium 120 include general-purpose semiconductor storage devices such as CF (Compact Flash) and SD (Secure Digital), magnetic storage media such as a flexible disk, or CD-ROM (Compact Disk). Optical storage media such as Read Only Memory).

上述した実施の形態の一部又は全部は、以下に記載する(付記1)〜(付記18)によって表現することができるが、以下の記載に限定されるものではない。   Part or all of the above-described embodiments can be expressed by (Appendix 1) to (Appendix 18) described below, but is not limited to the following description.

(付記1)
受信した電子メールのメール容量の削減を支援する装置であって、
対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、引用文形式判定部と、
前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、引用文一致判定部と、
前記引用文一致判定部による判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、引用文削除部と、
を備えていることを特徴とするメール容量削減支援装置。
(Appendix 1)
A device that helps reduce the mail capacity of received emails,
A citation format determination unit that determines whether a citation in the body of the target email is described in a full-text citation format or a partial citation format;
When the quoted text is described in a full-text quoted format, the quoted text and the entire character string of the email whose reception date is older than the target email are compared on a line-by-line basis. A quote match determination unit that determines whether or not the number of is equal to or greater than a set threshold;
As a result of determination by the quote match determination unit, when the number of matching lines is equal to or greater than a set threshold, the quote deletion unit that deletes the quote from the text of the target e-mail;
An e-mail capacity reduction support device characterized by comprising:

(付記2)
前記対象となる電子メールと、前記対象となる電子メールよりも受信日時が古い電子メールとが、同一のメールフォルダによって管理されている、付記1に記載のメール容量削減支援装置。
(Appendix 2)
The mail capacity reduction support device according to appendix 1, wherein the target e-mail and an e-mail whose reception date and time is older than the target e-mail are managed by the same mail folder.

(付記3)
前記引用文一致判定部が、前記引用文のうち、予め設定された返信記号が1つだけ付加されている行を特定し、特定した行と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較する、付記1または2に記載のメール容量削減支援装置。
(Appendix 3)
The quote match determination unit identifies a line to which only one preset reply symbol is added in the quote, and the received date is older than the identified line and the target email. The mail capacity reduction support device according to appendix 1 or 2, which compares the entire character string of an e-mail line by line.

(付記4)
前記引用文一致判定部が、前記閾値を、特定した行の数よりも小さい値に設定する、付記3に記載のメール容量削減支援装置。
(Appendix 4)
The mail capacity reduction support device according to appendix 3, wherein the quotation match determination unit sets the threshold to a value smaller than the number of specified lines.

(付記5)
前記閾値が、互いに関係の無いメール間で一致する可能性がある行数に基づいて、設定されている、付記1〜4のいずれかに記載のメール容量削減支援装置。
(Appendix 5)
The mail capacity reduction support device according to any one of appendices 1 to 4, wherein the threshold is set based on the number of lines that may match between mails that are not related to each other.

(付記6)
前記引用文削除部が、前記対象となる電子メールの本文中の、前記引用文が削除された箇所に、前記引用文が削除されたことを示す文字列を挿入する、付記1から5のいずれかに記載のメール容量削減支援装置。
(Appendix 6)
Any one of appendices 1 to 5, wherein the quote deletion unit inserts a character string indicating that the quote has been deleted at a location where the quote has been deleted in the body of the target e-mail. E-mail capacity reduction support device according to the above.

(付記7)
受信した電子メールのメール容量の削減を支援するための方法であって、
(a)対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、ステップと、
(b)前記(a)のステップによる判定の結果、前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、ステップと、
(c)前記(b)のステップによる判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、ステップと、
を有することを特徴とするメール容量削減支援方法。
(Appendix 7)
A method for helping to reduce the mail capacity of received emails,
(A) determining whether a quote in the body of the subject email is described in full-text or partial-quote format; and
(B) As a result of the determination in the step (a), when the quoted text is described in a full-text quoted format, the quoted text and the character of the email whose reception date is older than the target email Comparing the entire column by row to determine whether the number of matching rows is greater than or equal to a set threshold; and
(C) as a result of the determination in the step (b), when the number of matching lines is equal to or greater than a set threshold value, the quoted sentence is deleted from the text of the target e-mail; and
A mail capacity reduction support method characterized by comprising:

(付記8)
前記対象となる電子メールと、前記対象となる電子メールよりも受信日時が古い電子メールとが、同一のメールフォルダによって管理されている、付記7に記載のメール容量削減支援方法。
(Appendix 8)
The mail capacity reduction support method according to appendix 7, wherein the target e-mail and an e-mail whose reception date and time is older than the target e-mail are managed by the same mail folder.

(付記9)
前記(b)のステップにおいて、前記引用文のうち、予め設定された返信記号が1つだけ付加されている行を特定し、特定した行と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較する、付記7または8に記載のメール容量削減支援方法。
(Appendix 9)
In the step (b), a line to which only one preset reply symbol is added is specified in the quoted sentence, and the received date is older than the specified line and the target e-mail. 9. The mail capacity reduction support method according to appendix 7 or 8, wherein the entire character string of the e-mail is compared in line units.

(付記10)
前記(b)のステップにおいて、前記閾値を、特定した行の数よりも小さい値に設定する、付記9に記載のメール容量削減支援方法。
(Appendix 10)
The mail capacity reduction support method according to appendix 9, wherein, in the step (b), the threshold value is set to a value smaller than the specified number of rows.

(付記11)
前記閾値が、互いに関係の無いメール間で一致する可能性がある行数に基づいて、設定されている、付記7〜10のいずれかに記載のメール容量削減支援方法。
(Appendix 11)
The mail capacity reduction support method according to any one of appendices 7 to 10, wherein the threshold is set based on the number of lines that may match between mails that are not related to each other.

(付記12)
前記(c)のステップで、前記対象となる電子メールの本文中の、前記引用文が削除された箇所に、前記引用文が削除されたことを示す文字列を挿入する、付記7から11のいずれかに記載のメール容量削減支援方法。
(Appendix 12)
In the step (c), a character string indicating that the quoted sentence is deleted is inserted into a place where the quoted sentence is deleted in the text of the target e-mail. The mail capacity reduction support method described in any one of the above.

(付記13)
コンピュータによって、受信した電子メールのメール容量の削減を支援するための、プログラムであって、
前記コンピュータに、
(a)対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、ステップと、
(b)前記(a)のステップによる判定の結果、前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、ステップと、
(c)前記(b)のステップによる判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、ステップと、
を実行させるプログラム。
(Appendix 13)
A program for supporting a reduction in mail capacity of received e-mail by a computer,
In the computer,
(A) determining whether a quote in the body of the subject email is described in full-text or partial-quote format; and
(B) As a result of the determination in the step (a), when the quoted text is described in a full-text quoted format, the quoted text and the character of the email whose reception date is older than the target email Comparing the entire column by row to determine whether the number of matching rows is greater than or equal to a set threshold; and
(C) as a result of the determination in the step (b), when the number of matching lines is equal to or greater than a set threshold value, the quoted sentence is deleted from the text of the target e-mail; and
A program that executes

(付記14)
前記対象となる電子メールと、前記対象となる電子メールよりも受信日時が古い電子メールとが、同一のメールフォルダによって管理されている、付記13に記載のプログラム。
(Appendix 14)
14. The program according to appendix 13, wherein the target e-mail and an e-mail whose reception date and time is older than the target e-mail are managed by the same mail folder.

(付記15)
前記(b)のステップにおいて、前記引用文のうち、予め設定された返信記号が1つだけ付加されている行を特定し、特定した行と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較する、付記13または14に記載のプログラム。
(Appendix 15)
In the step (b), a line to which only one preset reply symbol is added is specified in the quoted sentence, and the received date is older than the specified line and the target e-mail. The program according to appendix 13 or 14, which compares the entire character string of an e-mail line by line.

(付記16)
前記(b)のステップにおいて、前記閾値を、特定した行の数よりも小さい値に設定する、付記15に記載のプログラム。
(Appendix 16)
The program according to appendix 15, wherein in the step (b), the threshold value is set to a value smaller than the specified number of rows.

(付記17)
前記閾値が、互いに関係の無いメール間で一致する可能性がある行数に基づいて、設定されている、付記13〜16のいずれかに記載のプログラム。
(Appendix 17)
The program according to any one of appendices 13 to 16, wherein the threshold is set based on the number of lines that may match between mails that are not related to each other.

(付記18)
前記(c)のステップで、前記対象となる電子メールの本文中の、前記引用文が削除された箇所に、前記引用文が削除されたことを示す文字列を挿入する、付記13から17のいずれかに記載のプログラム。
(Appendix 18)
In the step (c), a character string indicating that the quoted sentence is deleted is inserted into the body of the target e-mail in the place where the quoted sentence is deleted. The program according to any one.

以上のように、本発明によれば、電子メール中の引用文のうち、削除しても利用者が電子メールの意味を把握できる引用文のみを確実に削除することができる。本発明は、電子メールを受信できる様々な端末上で利用可能であり、これらの端末において有用である。   As described above, according to the present invention, it is possible to reliably delete only quotes in which the user can grasp the meaning of the email even if the quotes are deleted from the quotes in the email. The present invention can be used on various terminals capable of receiving electronic mail, and is useful in these terminals.

10 メールサーバ
20 メール容量削減支援装置
21 メール受信部
22 引用文解析部
23 引用文削除部
24 メール保存部
25 停止閾値記憶部
26 返信記号記憶部
27 引用文形式判定部
28 引用文一致判定部
30 端末装置
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
DESCRIPTION OF SYMBOLS 10 Mail server 20 Mail capacity reduction support apparatus 21 Mail receiving part 22 Quote sentence analysis part 23 Quote sentence deletion part 24 Mail preservation | save part 25 Stop threshold value memory | storage part 26 Reply symbol memory | storage part 27 Quote sentence format determination part 28 Quote sentence match determination part 30 Terminal device 110 Computer 111 CPU
112 Main Memory 113 Storage Device 114 Input Interface 115 Display Controller 116 Data Reader / Writer 117 Communication Interface 118 Input Device 119 Display Device 120 Recording Medium 121 Bus

Claims (8)

受信した電子メールのメール容量の削減を支援する装置であって、
対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、引用文形式判定部と、
前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、引用文一致判定部と、
前記引用文一致判定部による判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、引用文削除部と、
を備えていることを特徴とするメール容量削減支援装置。
A device that helps reduce the mail capacity of received emails,
A citation format determination unit that determines whether a citation in the body of the target email is described in a full-text citation format or a partial citation format;
When the quoted text is described in a full-text quoted format, the quoted text and the entire character string of the email whose reception date is older than the target email are compared on a line-by-line basis. A quote match determination unit that determines whether or not the number of is equal to or greater than a set threshold;
As a result of determination by the quote match determination unit, when the number of matching lines is equal to or greater than a set threshold, the quote deletion unit that deletes the quote from the text of the target e-mail;
An e-mail capacity reduction support device characterized by comprising:
前記対象となる電子メールと、前記対象となる電子メールよりも受信日時が古い電子メールとが、同一のメールフォルダによって管理されている、請求項1に記載のメール容量削減支援装置。   The mail capacity reduction support device according to claim 1, wherein the target e-mail and an e-mail having a reception date and time older than the target e-mail are managed by the same mail folder. 前記引用文一致判定部が、前記引用文のうち、予め設定された返信記号が1つだけ付加されている行を特定し、特定した行と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較する、請求項1または2に記載のメール容量削減支援装置。   The quote match determination unit identifies a line to which only one preset reply symbol is added in the quote, and the received date is older than the identified line and the target email. The mail capacity reduction support device according to claim 1 or 2, wherein the entire character string of the electronic mail is compared in units of lines. 前記引用文一致判定部が、前記閾値を、特定した行の数よりも小さい値に設定する、請求項3に記載のメール容量削減支援装置。   4. The mail capacity reduction support device according to claim 3, wherein the quote match determination unit sets the threshold to a value smaller than the number of specified lines. 前記閾値が、互いに関係の無いメール間で一致する可能性がある行数に基づいて、設定されている、請求項1〜4のいずれかに記載のメール容量削減支援装置。   The mail capacity reduction support device according to any one of claims 1 to 4, wherein the threshold is set based on the number of lines that may match between mails that are not related to each other. 前記引用文削除部が、前記対象となる電子メールの本文中の、前記引用文が削除された箇所に、前記引用文が削除されたことを示す文字列を挿入する、請求項1から5のいずれかに記載のメール容量削減支援装置。   The quoted sentence deletion unit inserts a character string indicating that the quoted sentence has been deleted at a place where the quoted sentence has been deleted in the text of the target e-mail. The mail capacity reduction support device according to any one of the above. 受信した電子メールのメール容量の削減を支援するための方法であって、
(a)対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、ステップと、
(b)前記(a)のステップによる判定の結果、前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、ステップと、
(c)前記(b)のステップによる判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、ステップと、
を有することを特徴とするメール容量削減支援方法。
A method for helping to reduce the mail capacity of received emails,
(A) determining whether a quote in the body of the subject email is described in full-text or partial-quote format; and
(B) As a result of the determination in the step (a), when the quoted text is described in a full-text quoted format, the quoted text and the character of the email whose reception date is older than the target email Comparing the entire column by row to determine whether the number of matching rows is greater than or equal to a set threshold; and
(C) as a result of the determination in the step (b), when the number of matching lines is equal to or greater than a set threshold value, the quoted sentence is deleted from the text of the target e-mail; and
A mail capacity reduction support method characterized by comprising:
コンピュータによって、受信した電子メールのメール容量の削減を支援するための、プログラムであって、
前記コンピュータに、
(a)対象となる電子メールの本文中の引用文が全文引用形式及び部分引用形式のいずれによって記述されているかを判定する、ステップと、
(b)前記(a)のステップによる判定の結果、前記引用文が全文引用形式によって記述されている場合に、前記引用文と、前記対象となる電子メールよりも受信日時が古い電子メールの文字列全体とを行単位で比較して、一致する行の数が、設定された閾値以上となるかどうかを判定する、ステップと、
(c)前記(b)のステップによる判定の結果、一致する行の数が設定された閾値以上となる場合に、前記対象となる電子メールの本文中から前記引用文を削除する、ステップと、
を実行させるプログラム。
A program for supporting a reduction in mail capacity of received e-mail by a computer,
In the computer,
(A) determining whether a quote in the body of the subject email is described in full-text or partial-quote format; and
(B) As a result of the determination in the step (a), when the quoted text is described in a full-text quoted format, the quoted text and the character of the email whose reception date is older than the target email Comparing the entire column by row to determine whether the number of matching rows is greater than or equal to a set threshold; and
(C) as a result of the determination in the step (b), when the number of matching lines is equal to or greater than a set threshold value, the quoted sentence is deleted from the text of the target e-mail; and
A program that executes
JP2011037427A 2011-02-23 2011-02-23 E-mail capacity reduction support device, e-mail capacity reduction support method, and program Expired - Fee Related JP5626001B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011037427A JP5626001B2 (en) 2011-02-23 2011-02-23 E-mail capacity reduction support device, e-mail capacity reduction support method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011037427A JP5626001B2 (en) 2011-02-23 2011-02-23 E-mail capacity reduction support device, e-mail capacity reduction support method, and program

Publications (2)

Publication Number Publication Date
JP2012174133A JP2012174133A (en) 2012-09-10
JP5626001B2 true JP5626001B2 (en) 2014-11-19

Family

ID=46976964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011037427A Expired - Fee Related JP5626001B2 (en) 2011-02-23 2011-02-23 E-mail capacity reduction support device, e-mail capacity reduction support method, and program

Country Status (1)

Country Link
JP (1) JP5626001B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107770040A (en) * 2016-08-23 2018-03-06 平安科技(深圳)有限公司 The inquiry method for cleaning and server of Email

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3161520B2 (en) * 1997-12-17 2001-04-25 日本電気株式会社 Portable terminal device and its character data storage method
JP2002197030A (en) * 2000-12-27 2002-07-12 Toshiba Corp Method and device for character message processing
JP3631149B2 (en) * 2001-01-23 2005-03-23 株式会社ジャストシステム E-mail transmission / reception device, e-mail transmission / reception system, e-mail transmission / reception method, program for causing computer to execute e-mail transmission / reception method, and computer-readable recording medium recording the program
JP4099439B2 (en) * 2002-08-29 2008-06-11 株式会社東芝 Message information sharing apparatus and message information sharing method
JP4716136B2 (en) * 2007-09-05 2011-07-06 日本電気株式会社 E-mail storage method, e-mail reproduction method, e-mail system, and e-mail storage / reproduction program
JP2009129231A (en) * 2007-11-26 2009-06-11 Nec Access Technica Ltd Electronic data automatic printing terminal, electronic data automatic printing method, and electronic data automatic printing program

Also Published As

Publication number Publication date
JP2012174133A (en) 2012-09-10

Similar Documents

Publication Publication Date Title
US8499051B2 (en) Multiple messaging communication optimization
US9716685B2 (en) Cautious auto-entry for messaging systems
CN106162584B (en) Method, client, cloud server and system for identifying spam messages
EP2715565B1 (en) Dynamic rule reordering for message classification
US20130246378A1 (en) Partial hash system, method, and computer program product
Coskun et al. Mitigating sms spam by online detection of repetitive near-duplicate messages
CN104509041A (en) Forgotten attachment detection
US8370437B2 (en) Method and apparatus to associate a modifiable CRM related token to an email
US20120265832A1 (en) Message thread management using dynamic pointers
US20200304448A1 (en) System and Method for Detecting and Predicting Level of Importance of Electronic Mail Messages
CN109462538B (en) Electronic device, mail sharing method based on security classification and storage medium
JP5626001B2 (en) E-mail capacity reduction support device, e-mail capacity reduction support method, and program
US20130128301A1 (en) Method and system for repurposing e-mail correspondence to save paper and ink
WO2017096844A1 (en) Email processing method and device
CN101853260A (en) System and method for detecting e-mail content
US20120201458A1 (en) System, method, and computer program product for determining whether text within an image includes unwanted data, utilizing a matrix
RU2583713C2 (en) System and method of eliminating shingles from insignificant parts of messages when filtering spam
CN103095885B (en) A kind of mobile terminal and email address management method thereof
CN106789590B (en) Mail sender classification method and device
JP4746083B2 (en) Address correctness determination system
US8650200B2 (en) System, method, and computer program product for identifying objects as at least potentially unwanted based on strings of symbols
JP2010010859A (en) Storage method of e-mail, and system therefor
JP5366204B2 (en) Mail filtering system, computer program thereof, and information generation method
AT&T sms.dvi
Manek et al. ReP-ETD: A Repetitive Preprocessing technique for Embedded Text Detection from images in spam emails

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140115

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140829

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140915

R150 Certificate of patent or registration of utility model

Ref document number: 5626001

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees