WO2020175371A1 - Email thread extraction device, email thread extraction method, and computer program - Google Patents

Email thread extraction device, email thread extraction method, and computer program Download PDF

Info

Publication number
WO2020175371A1
WO2020175371A1 PCT/JP2020/007065 JP2020007065W WO2020175371A1 WO 2020175371 A1 WO2020175371 A1 WO 2020175371A1 JP 2020007065 W JP2020007065 W JP 2020007065W WO 2020175371 A1 WO2020175371 A1 WO 2020175371A1
Authority
WO
WIPO (PCT)
Prior art keywords
mail
data
mail data
response
thread
Prior art date
Application number
PCT/JP2020/007065
Other languages
French (fr)
Japanese (ja)
Inventor
宏一 千葉
孝治 吉春
Original Assignee
株式会社エー・アンド・ビー・コンピュータ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エー・アンド・ビー・コンピュータ filed Critical 株式会社エー・アンド・ビー・コンピュータ
Priority to JP2021502189A priority Critical patent/JP6905237B2/en
Publication of WO2020175371A1 publication Critical patent/WO2020175371A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Definitions

  • the present invention relates to a mail thread extracting device for collectively extracting mail exchanges (mail threads).
  • Patent Document 1 Patent No. 5 919 4409 discloses a mail data classification device for classifying electronic mail data, such as a threaded display of electronic mail.
  • this mail data classification device the words contained in the email and the response phrase that is the reply word to the word are stored in association with each other, and the keyword relating to the word contained in the email to be classified is searched for, and the response phrase is searched. E-mails containing are extracted, and these are combined and displayed in the same group.
  • Patent Document 1 Patent No. 5 1 9 9 4 4 9
  • the present invention is a mail thread extracting device and a mail thread extracting method capable of appropriately extracting mail exchanges as mail threads using a trained model using a neural network. And to provide computer programs and the like.
  • a mail thread extracting device of the present invention is a mail data storage unit for storing a plurality of electronic mail data
  • a starting point mail data acquisition unit that acquires starting point mail data that is the starting point of the mail thread from the mail data storage unit
  • a response candidate data generation unit that generates response candidate data corresponding to the origin mail data by using a learned model that has learned the correspondence between the mail data and the corresponding response mail data
  • a response mail data acquisition unit that acquires response mail data similar to the response candidate data generated by the response candidate data generation unit from the mail data storage unit;
  • a mail thread generation unit that generates a mail thread by combining the origin mail data and the response mail data is provided.
  • a mail thread extracting device and a mail thread extracting device capable of appropriately extracting e-mail exchanges as mail threads without omission by using a trained model using a neural network. It is possible to provide a code extraction method and a computer program. ⁇ 2020/175371 3 ⁇ (: 170? 2020/007065 Brief explanation of the drawing
  • FIG. 1 is a block diagram showing a schematic configuration of a mail thread extracting device according to a first embodiment of the present invention.
  • FIG. 2 is a diagram showing an example of making a document into a vector.
  • FIG. 3 A diagram showing an example of mail data stored in a mail data storage unit.
  • 4 is a diagram showing an _ example of a user in tough Ace the origin mail data and the search period in the first embodiment to specify the present invention.
  • FIG. 5 is a diagram showing an example of a mail thread according to the first embodiment of the present invention.
  • FIG. 6 is a diagram showing an example of exchange of electronic mail.
  • FIG. 7 is a diagram showing an example of a set of mail data and response mail data used as teacher data.
  • Fig. 8 is a diagram showing an example of a neural network for learning the correspondence relationship of electronic mail.
  • FIG. 9 A flow chart showing an example of a processing flow of mail thread extraction according to the first embodiment of the present invention.
  • FIG. 10 is a block diagram showing a schematic configuration of a mail thread extracting device according to a second embodiment of the present invention.
  • Fig. 11 is a flow chart showing an example of a processing flow of mail thread extraction according to the second embodiment of the present invention.
  • FIG. 12 is a diagram showing an example of a user interface for designating a starting point email data and a search period in the second embodiment of the present invention.
  • FIG. 13 is a diagram showing an example of a mail thread according to the second embodiment of the present invention.
  • FIG. 14 A diagram showing an example of a neural network for learning a similar relationship of response mail data according to a third embodiment of the present invention.
  • FIG. 1 is a block diagram showing a schematic configuration of a mail thread extraction system 100 according to the first embodiment of the present invention.
  • the mail thread extraction system 100 extracts the mail data that is the starting point and the mail data that responds to it according to the specified search conditions, and creates a mail thread by combining the extracted mail data.
  • the mail thread extraction system 100 like the conventional mail thread extraction system, simply extracts the response mail data depending on whether the text data of the subject or the body contains a predetermined keyword.
  • the response mail data is extracted and the mail thread is generated by using the trained model generated based on a large amount of training data, instead of generating the mail thread.
  • the mail thread extraction system 100 includes an extraction device 1 and a learning device 2.
  • the extraction device 1 and the learning device 2 do not need to be always connected.
  • the learner 2 can be configured as a cloud system.
  • the extraction device 1 includes a mail data analysis unit 11, a mail data storage unit 12, an origin mail data acquisition unit 13, a response candidate data generation unit 14, a response mail data acquisition unit 15 and a mail thread. It includes a code generation unit 16.
  • the mail data analysis unit 11 morphologically analyzes the mail data of the electronic mail and then converts it into a vector.
  • the vectorization of mail data is generally performed by a dictionary that is composed of the morphemes of document data and their mouths.
  • Figure 2 shows the dictionary conversion of document data.
  • Document data is made into a dictionary by morphologically analyzing the underlying mail data and giving them a unique clue.
  • Each I mouth represents the dimension of the analytic space composed of a dictionary.
  • Vectorization of mail data is performed by morphological analysis of the mail data to be vectorized, matching with the morphemes in the dictionary, and expressing the number of hits for each mouth as a one-dimensional array (vector). It should be noted that although the result of vector expression changes depending on the underlying document data and the dictionary method, it does not limit the embodiment of the present invention. ⁇ 2020/175371 5 ⁇ (: 170? 2020 /007065
  • the mail data storage unit 12 stores all the mail data vectorized by the mail data analysis unit 11.
  • Figure 3 shows an example of mail data stored in the mail data storage unit 12.
  • the mail database stored in the mail data storage section 12 contains, for example, a mail document, vectorized data, and date and time.
  • the origin mail data acquisition unit 13 acquires from the mail data storage unit 1 2 the mail data that is the starting point of the thread search within the designated search period.
  • the search period and the specification of the mail data that is the starting point of the thread search are specified by the user through the user interface as shown in Fig. 4, for example.
  • the response candidate data generation unit 14 generates response candidate data corresponding to the origin mail data.
  • the response candidate data generation unit 14 holds the trained model 1 4 3, and the response candidate data is generated by inputting the origin mail data to the trained model 1 4 3.
  • This trained model 1 4 3 is generated by the learner 2 shown in Fig. 1. The generation of the trained model 1 4 3 in the learner 2 will be described in detail later.
  • the reply mail data acquisition unit 15 uses the mail data similar to the reply candidate data generated by the reply candidate data generation unit 14 as the reply mail data for replying to the origin mail data, and the mail data storage unit 1 2 To get from.
  • multiple reply mail data multiple reply mail data are acquired.
  • the similarity between the response candidate data and the mail data stored in the mail data storage unit 12 is determined by the inner product of the vector of the response candidate data and the vector of the mail data stored in the mail data storage unit 12 Ask as.
  • the method of obtaining the degree of similarity as the inner product of the vectors does not limit the embodiment of the present invention. For example, a method based on the Euclidean distance is used to compare the vectors. May be calculated.
  • the mail thread generation unit 16 combines the origin mail data and at least one response mail data acquired from the mail data storage unit 12 and combines them.
  • Generate rule thread For example, a mail thread is created that summarizes mail exchanges as shown in Figure 5. In the example of the mail thread shown in Fig. 5, an example is shown in which the origin mail titled "Confirmation of the last day of the year" and the four reply mails that respond to it are displayed as threads.
  • the learning device 2 inputs the data for e-mail learning (teaching data) as shown in Fig. 1, and passes through the learning data analysis part 21 and the data set generation part 22, and the DNN 23 learns to extract the extraction device 1 Create a trained model to be used in the response candidate data generator 14 of.
  • the learning device 2 includes a learning data analysis unit 21, a data set generation unit 22, a DN N (deep neural network) 23, and a learned model storage unit 24.
  • the learning data input to the learning device 2 uses a set of mail data and response mail data for the learning data as teacher data.
  • Figure 6 shows an example of an electronic mail exchanged in the form of a question (Q u e st i o n) and a response (A n swer).
  • Q u e st i o n and A n swer in Figure 6 are associated and extracted as pairs, and these pairs are used as teacher data.
  • Figure 7 shows an example of a set of mail data used as teacher data and response mail data.
  • the learning data analysis unit 21 performs morphological analysis on the learning data and then vectorizes the learning data, similarly to the mail data analysis unit 11 included in the extraction device 1 described above. In the learning data analysis unit 21, the set of mail data and the corresponding reply mail data is converted into learning data.
  • the data set generation unit 22 generates a vectorized version of the input document of the teacher data and a labeled version of the response mail data as a data set to be the input of D N N 23.
  • DN N 23 is a deep neural network that associates vectorized incoming mail data with the label of the reply mail data.
  • Figure 8 shows the image of learning performed in DNN 23.
  • the Q uesti ⁇ n mail data subjected to morphological analysis and the response mail data corresponding to the correct answer are trained as A nswer. For example Q uestion 1 ⁇ 2020/175371 7 ⁇ (: 170? 2020 /007065
  • the response mail data corresponding to is treated as 8 3 6 "1 and learning is performed.
  • the neural network model used in Mouth 23 is a tatami: convolutional neural network ( ⁇ 1 ⁇ 1) or a recursive neural network ([3 ⁇ 4 1 ⁇ 1, !_ 3 chome 1 ⁇ /1). Although a neural network model such as the above can be applied, the type of the neural network model does not limit the present invention.
  • Figure 9 shows the operation flow of the mail thread extraction device 100.
  • 3101 it is determined whether or not the origin mail is designated.
  • the origin mail is specified by the user through the user interface as shown in Fig. 4, for example.
  • the mail thread extraction device 100 obtains the origin mail data within the specified search period from the mail data storage unit 12 (3 1 0 2).
  • the mail thread extraction device 100 inputs the acquired origin mail data into the learned model 1 43 of the response candidate data generation unit 14 to generate the response candidate data (3 1 0 3) .
  • the response mail data acquisition unit 15 acquires the response mail data similar to the response candidate data from the mail data storage unit 12 (3104).
  • a mail thread is generated by combining the origin mail data acquired from the mail data storage unit 12 and at least one response mail data (3105).
  • the response mail data for the origin mail is output (displayed) as a mail thread as shown in Figure 5.
  • multiple reply mails for the mail sent at 12:00:00 on February 10, 2010, with the subject "Confirmation on the last day of the year” are sent to the mail thread.
  • the email displayed at the top of the email thread (reply from account 8888) is selected, and the text of the email, "I am going to work normally" is displayed. , Is displayed in the right column.
  • at least one response mail can be collectively displayed in a thread for one origin mail.
  • the above-described embodiment is merely an example and does not limit the present invention.
  • the form in which at least one reply mail data corresponding to one origin mail is acquired and the mail thread is generated has been exemplified.
  • the mail replying to the reply mail data is exemplified.
  • the form of acquiring data may be used.
  • the mail thread extracting device according to the second embodiment of the present invention which acquires the reply mail data corresponding to the reply mail data and generates the mail thread, will be described as follows. The different configuration will be described.
  • FIG. 10 shows a mail thread extraction system according to a second embodiment of the present invention.
  • the end determination unit 17 determines whether the response mail data acquired from the mail data storage unit 12 is within the specified search period, and if the response mail data is within the search period, Send reply mail data to the origin mail data acquisition unit 13.
  • the origin mail data acquisition unit 13 inputs the received response mail data into the response candidate data generation unit 14 and the corresponding response mail data is received in the response candidate data generation unit 14 and the response mail data acquisition unit 15 Perform the process of extracting data. This processing is performed as long as the response mail data is an email within the specified search period.
  • the mail thread storage unit 18 stores the origin mail data and the reply mail data.
  • the termination determination unit 17 determines that the response mail data is outside the search period, the termination determination unit 17 sends a termination instruction to the mail thread generation unit 16.
  • the mail thread generation unit 16 refers to the origin mail data and the reply mail data stored in the mail thread storage unit 18 and generates a mail thread. Note that the response mails that are judged to be out of the search period by the end judgment unit 17 are not reflected in the mail thread, and the already-stored origin mail data and reply mail data are used. To generate a mail thread.
  • Fig. 11 shows a flow chart of the mail thread extraction method according to the second embodiment of the present invention. ⁇ 2020/175 371 9 ⁇ (: 170? 2020 /007065
  • the origin mail and search period are specified by the user using the user interface as shown in Fig. 12.
  • the origin mail data within the specified search period is acquired from the mail data storage unit 1 2 as incoming mail data (3 2 0 2).
  • the acquired incoming mail data is input to the trained model 1 4 3 of the response candidate data generation unit 14 to generate response candidate data (3 2 0 3).
  • the response mail data acquisition unit 15 acquires response mail data similar to the response candidate data from the mail data storage unit 12 (3 2 0 4 ). It is determined whether or not the response mail data acquired from the mail data storage unit 12 is mail data within the specified search period (3205). If the reply mail data is mail data within the specified search period, the mail thread is generated by combining the incoming mail data and the reply mail data (3206).
  • the determination of the similarity between the response candidate data generated by the response candidate data generation unit 14 and the mail data stored in the mail data storage unit 12 is performed based on the response candidate data and the mail data.
  • the form using the inner product of the Coutl is exemplified, a form in which a plurality of response candidate data having a high degree of similarity are extracted using a trained model trained using the dual network may be used.
  • a mail thread extraction system according to the third embodiment of the present invention will be described with respect to a configuration different from the above-mentioned embodiments. ⁇ 2020/175371 10 ⁇ (: 170? 2020 /007065
  • Fig. 14 shows a similarity learning model for extracting a plurality of response candidate data having a high degree of similarity.
  • the similarity relation learning model is a learning model for extracting highly similar items from the response candidate data 8 11 3 ⁇ « 6 "1 to 8 11 3 ⁇ « 6 ".
  • the above-described embodiment is merely an example and does not limit the present invention.
  • the generation of the learned model by the supervised learning is illustrated, but the learned model may be generated by the unsupervised learning. In that case, the labeling unit 24 is omitted.
  • each functional block of the above embodiment may be realized by a program. Then, a part or all of the processing of each functional block of each of the above-described embodiments is performed by the central processing unit (11), microprocessor, processor, etc. in the computer. Also, the programs for performing each processing are the hard disk, Stored in a storage device such as , Or read at 8 ⁇ /1 and executed.
  • each processing of the above-described embodiments may be realized by hardware, and includes cases where it is realized together with software (03 (operating system), middleware, or a predetermined library).
  • software 03 (operating system), middleware, or a predetermined library).
  • the mail classification system 100 may be realized by mixed processing of software and hardware.
  • the execution order of the processing methods in the above embodiments is not necessarily limited to the description of the above embodiments, and the execution order can be changed without departing from the gist of the invention. is there. Further, in the processing method in the above-described embodiment, some steps may be executed in parallel with other steps without departing from the scope of the invention.
  • a computer program that causes a computer to execute the above-described method and a computer-readable recording medium that records the program are included in the scope of the present invention.
  • the type of computer-readable recording medium is arbitrary.
  • the computer program is not limited to the one recorded in the recording medium, and may be transmitted via a telecommunication line, a wireless or wired communication line, a network typified by the internet, or the like. Good.
  • the present invention can also be described as follows.
  • the mail thread extraction device according to the first configuration of the present invention is
  • a mail data storage unit for storing a plurality of email data
  • a starting point mail data acquisition unit that acquires starting point mail data that is the starting point of the mail thread from the mail data storage unit
  • a response candidate data generation unit that generates response candidate data corresponding to the origin mail data by using a learned model that has learned the correspondence between the mail data and the corresponding response mail data
  • a response mail data acquisition unit that acquires response mail data similar to the response candidate data generated by the response candidate data generation unit from the mail data storage unit;
  • a mail thread extracting unit that combines the origin mail data and the response mail data to generate a mail thread. ⁇ 2020/175371 12 ⁇ (: 170? 2020 /007065
  • a mail document data storage unit that stores mail document data
  • the origin mail document data that is the origin of the mail thread is acquired from the mail document data storage unit.
  • the response candidate data is generated.
  • the response mail document data similar to the response candidate data is acquired from the mail document data storage unit, and the mail thread is generated based on the origin mail document data and the response mail document data.
  • a mail thread extracting device is the mail thread extracting device according to the first configuration, wherein the response mail data acquired by the response mail data acquiring unit is the mail. It is provided with a termination determination unit that determines whether or not the response mail data is a thread target.
  • the terminal determination unit that determines whether or not the reply mail data is the target of the mail thread is provided, and the reply mail data is judged to be the mail of the mail thread.
  • the reply mail data is judged to be the mail of the mail thread.
  • the mail thread extraction method according to the present invention is
  • the origin mail data which is the origin of the mail thread, is acquired from the mail data storage section that stores multiple email data,
  • a mail thread is generated by combining the origin mail data and the response mail data.
  • the origin mail data which is the origin of the mail thread
  • the mail data storage unit that stores a plurality of e-mail data
  • the mail data and the corresponding reply mail are acquired.
  • the response candidate data corresponding to the origin mail data is generated using the learned model that has learned the correspondence with the data.
  • response mail data similar to the response candidate data is acquired from the mail data storage unit, and the start mail data and the reply mail data are combined to generate a mail thread.
  • the origin mail data which is the origin of the mail thread, is acquired from the mail data storage section that stores multiple email data,
  • the computer operated by this program obtains the origin mail data, which is the origin of the mail thread, from the mail database storage part that stores multiple pieces of e-mail data, and the mail data and the corresponding reply mail data.
  • the response candidate data corresponding to the origin mail data is generated by using the learned model in which the correspondence relationship of [1] is learned. Then, the response mail data similar to the response candidate data is acquired from the mail data storage unit, and the origin mail database and the response mail data are combined to generate a mail thread.
  • a trained model is used to search for a corresponding mail based on the e-mail text. It can be extracted comprehensively, and the thread extraction of mail can be performed appropriately.
  • a recording medium recording the above program is also an aspect of the present invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Provided is an email thread extraction device that is capable of using a learned model that uses a neural network to extract an email exchange as a thread completely and suitably. The email thread extraction device comprises: an email data storage unit for storing a plurality of items of email data; an origin email data acquisition unit for acquiring, from the email data storage unit, source email data serving as an origin of an email thread; a reply candidate data generation unit for using a learned model, wherein a correspondence relationship between email data and reply email data corresponding thereto has been learned, to generate reply candidate data corresponding to the origin email data; a reply email data acquisition unit for acquiring, from the email data storage unit, reply email data similar to the reply candidate data generated by the reply candidate data generation unit; and an email thread generation unit for generating an email thread in which the origin email data and the reply email data are combined.

Description

\¥0 2020/175371 1 ?<:17 2020 /007065 明 細 書 \\0 2020/175371 1 ?<:17 2020/007065 Clarification
発明の名称 : Title of invention:
メールスレッド抽出装置、 メールスレッド抽出方法、 およびコンピュータ プログラム Mail thread extracting device, mail thread extracting method, and computer program
技術分野 Technical field
[0001 ] 本発明は、 メールのやり取り (メールスレッ ド) をまとめて抽出するため のメールスレッ ド抽出装置に関する。 The present invention relates to a mail thread extracting device for collectively extracting mail exchanges (mail threads).
背景技術 Background technology
[0002] 従来、 電子メールを共通の話題ごとに管理するための様々な技術が提案さ れている。 例えば、 特許文献 1 (特許第 5 1 9 9 4 4 9号) には、 電子メー ルのスレッ ド表示等について、 電子メールデータの分類に関するメールデー 夕分類装置が開示されている。 このメールデータ分類装置では、 電子メール に含まれる単語と、 その単語に対する返答の単語である応答句を対応させて 記憶しておき、 分類したい電子メールに含まれる単語に関するキーワードを 検索し、 応答句が含まれる電子メールを抽出して、 これらを同一のグループ としてまとめ、 表示する。 [0002] Conventionally, various techniques have been proposed for managing electronic mail for each common topic. For example, Patent Document 1 (Patent No. 5 919 449) discloses a mail data classification device for classifying electronic mail data, such as a threaded display of electronic mail. In this mail data classification device, the words contained in the email and the response phrase that is the reply word to the word are stored in association with each other, and the keyword relating to the word contained in the email to be classified is searched for, and the response phrase is searched. E-mails containing are extracted, and these are combined and displayed in the same group.
[0003] また、 電子メールのヘッダ部の情報である 「タイ トル」 や 「宛先」 等を利 用して電子メールのやり取りをまとめて抽出する技術は、 従来広く用いられ ている。 [0003]Further, a technique of collectively extracting e-mail exchanges using "title", "destination", and the like, which are information in the header part of e-mail, has been widely used.
先行技術文献 Prior art documents
特許文献 Patent literature
[0004] 特許文献 1 :特許第 5 1 9 9 4 4 9号 [0004] Patent Document 1: Patent No. 5 1 9 9 4 4 9
発明の概要 Summary of the invention
発明が解決しようとする課題 Problems to be Solved by the Invention
[0005] しかし、 キーワードを用いたスレッ ド抽出は、 キーワードがうまく設定さ れなければ適切な抽出結果を得ることが難しいという問題がある。 また、 「 〇 2020/175371 2 卩(:170? 2020 /007065 However, thread extraction using keywords has a problem that it is difficult to obtain appropriate extraction results unless the keywords are set properly. Also, " 〇 2020/175371 2 卩 (: 170? 2020 /007065
タイ トル」 や 「宛先」 を用いたスレッ ド抽出では、 内容的には繫がりのある メールであっても、 「タイ トル」 や 「宛先」 が異なるとスレッ ドとして適切 にまとめられないという問題もある。 さらに、 最近は、 人工知能 (八 丨) の 利用が現実的になりつつあり、 ニューラルネッ トワークを利用した学習済み モデルを用いてメールの内容に応じてメールのスレッ ドを抽出することも、 八 Iの適用分野として想定される。 With thread extraction using "Title" and "Destination", even if the email has a conspicuous content, if the "Title" and "Destination" are different, it will not be properly organized as a thread. There is also. Furthermore, recently, the use of artificial intelligence (8) is becoming more practical, and it is possible to extract email threads according to the content of the email using a trained model using a neural network. It is assumed as an application field of I.
[0006] 本発明は、 ニューラルネッ トワークを利用した学習済みモデルを用いて、 メールのやり取りを漏れなく適切にメールスレッ ドとして抽出することが可 能なメールスレッ ド抽出装置、 メールスレッ ド抽出方法およびコンピュータ プログラム等を提供することを目的とする。 [0006] The present invention is a mail thread extracting device and a mail thread extracting method capable of appropriately extracting mail exchanges as mail threads using a trained model using a neural network. And to provide computer programs and the like.
課題を解決するための手段 Means for solving the problem
[0007] 上記の目的を達成するために、 本発明のメールスレッ ド抽出装置は、 複数の電子メールデータを格納するメールデータ格納部と、 In order to achieve the above object, a mail thread extracting device of the present invention is a mail data storage unit for storing a plurality of electronic mail data,
メールスレッ ドの起点となる起点メールデータを前記メールデータ格納部 から取得する起点メールデータ取得部と、 A starting point mail data acquisition unit that acquires starting point mail data that is the starting point of the mail thread from the mail data storage unit,
メールデータとそれに対応する応答メールデータとの対応関係を学習した 学習済みモデルを用いて、 前記起点メールデータに対応する応答候補データ を生成する応答候補データ生成部と、 A response candidate data generation unit that generates response candidate data corresponding to the origin mail data by using a learned model that has learned the correspondence between the mail data and the corresponding response mail data,
前記応答候補データ生成部によって生成された応答候補データに類似する 応答メ _ルデータを前記メ _ルデータ格納部から取得する応答メ _ルデータ 取得部と、 A response mail data acquisition unit that acquires response mail data similar to the response candidate data generated by the response candidate data generation unit from the mail data storage unit;
前記起点メールデータと前記応答メールデータとを組み合わせてメールス レッ ドを生成するメールスレッ ド生成部とを備える。 A mail thread generation unit that generates a mail thread by combining the origin mail data and the response mail data is provided.
発明の効果 Effect of the invention
[0008] 本発明によれば、 ニューラルネッ トワークを利用した学習済みモデルを用 いて、 電子メールのやり取りを漏れなく適切にメールスレッ ドとして抽出す ることが可能なメールスレッ ド抽出装置、 メールスレッ ド抽出方法およびコ ンピュータプログラム等を提供することができる。 〇 2020/175371 3 卩(:170? 2020 /007065 図面の簡単な説明 [0008] According to the present invention, a mail thread extracting device and a mail thread extracting device capable of appropriately extracting e-mail exchanges as mail threads without omission by using a trained model using a neural network. It is possible to provide a code extraction method and a computer program. 〇 2020/175371 3 卩(: 170? 2020/007065 Brief explanation of the drawing
[0009] [図 1]本発明の第 1の実施形態にかかるメールスレッ ド抽出装置の概略構成を 示すブロック図である。 [0009] [Fig. 1] Fig. 1 is a block diagram showing a schematic configuration of a mail thread extracting device according to a first embodiment of the present invention.
[図 2]文書のべクトル化の例を示す図である。 [Fig. 2] Fig. 2 is a diagram showing an example of making a document into a vector.
[図 3]メールデータ格納部に格納されたメールデータの一例を示す図である。 [図 4]本発明の第 1の実施形態における起点メールデータおよび検索期間を指 定するユーザインタフエースの _例を示す図である。 [FIG. 3] A diagram showing an example of mail data stored in a mail data storage unit. 4 is a diagram showing an _ example of a user in tough Ace the origin mail data and the search period in the first embodiment to specify the present invention.
[図 5]本発明の第 1の実施形態に係るメールスレッ ドの一例を示す図である。 [図 6]電子メールのやり取りの一例を示す図である。 FIG. 5 is a diagram showing an example of a mail thread according to the first embodiment of the present invention. FIG. 6 is a diagram showing an example of exchange of electronic mail.
[図 7]教師データとして用いるメールデータと応答メールデータの組の例を示 す図である。 FIG. 7 is a diagram showing an example of a set of mail data and response mail data used as teacher data.
[図 8]電子メールの対応関係を学習するためのニューラルネッ トワークの一例 を示す図である。 [Fig. 8] Fig. 8 is a diagram showing an example of a neural network for learning the correspondence relationship of electronic mail.
[図 9]本発明の第 1の実施形態にかかるメールスレッ ド抽出の処理フローの一 例を示すフローチヤートである。 [FIG. 9] A flow chart showing an example of a processing flow of mail thread extraction according to the first embodiment of the present invention.
[図 10]本発明の第 2の実施形態にかかるメールスレッ ド抽出装置の概略構成 を示すブロック図である。 FIG. 10 is a block diagram showing a schematic configuration of a mail thread extracting device according to a second embodiment of the present invention.
[図 1 1]本発明の第 2の実施形態におけるメールスレッ ド抽出の処理フローの _例を示すフローチヤートである。 [Fig. 11] Fig. 11 is a flow chart showing an example of a processing flow of mail thread extraction according to the second embodiment of the present invention.
[図 12]本発明の第 2の実施形態のおける起点メールデータおよび検索期間を 指定するユーザインタフエースの一例を示す図である。 FIG. 12 is a diagram showing an example of a user interface for designating a starting point email data and a search period in the second embodiment of the present invention.
[図 13]本発明の第 2の実施形態に係るメールスレッ ドの一例を示す図である FIG. 13 is a diagram showing an example of a mail thread according to the second embodiment of the present invention.
[図 14]本発明の第 3の実施形態に係る応答メールデータの類似関係を学習す るためのニューラルネッ トワークの一例を示す図である。 [FIG. 14] A diagram showing an example of a neural network for learning a similar relationship of response mail data according to a third embodiment of the present invention.
発明を実施するための形態 MODE FOR CARRYING OUT THE INVENTION
[0010] 以下、 図面を参照し、 本発明の実施の形態を詳しく説明する。 図中同一ま たは相当部分には同一符号を付してその説明は繰り返さない。 〇 2020/175371 4 卩(:170? 2020 /007065 [0010] Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the drawings, the same or corresponding parts will be denoted by the same reference symbols and description thereof will not be repeated. 〇 2020/175371 4 卩 (: 170? 2020 /007065
[001 1 ] [第 1の実施形態] [001 1] [First embodiment]
図 1は、 本発明の第 1の実施形態に係るメールスレッ ド抽出システム 1 0 〇の概略構成を示すブロック図である。 メールスレッ ド抽出システム 1 0 0 は、 指定された検索条件に応じて、 起点となるメールデータおよびそれに応 答するメールデータを抽出し、 抽出したメールデータをまとめてメールスレ ッ ドを生成する。 ただし、 メールスレッ ド抽出システム 1 0 0は、 従来のメ —ルスレッ ド抽出システムのように、 単純に件名や本文のテキストデータに 所定のキーワードが含まれるか否かによって応答メールデータを抽出してメ —ルスレッ ドを生成するものではなく、 大量の学習用データに基づいて生成 された学習済みモデルを用いて、 応答メールデータを抽出し、 メールスレッ ドを生成する。 FIG. 1 is a block diagram showing a schematic configuration of a mail thread extraction system 100 according to the first embodiment of the present invention. The mail thread extraction system 100 extracts the mail data that is the starting point and the mail data that responds to it according to the specified search conditions, and creates a mail thread by combining the extracted mail data. However, the mail thread extraction system 100, like the conventional mail thread extraction system, simply extracts the response mail data depending on whether the text data of the subject or the body contains a predetermined keyword. The response mail data is extracted and the mail thread is generated by using the trained model generated based on a large amount of training data, instead of generating the mail thread.
[0012] 図 1 に示すように、 メールスレッ ド抽出システム 1 0 0は、 抽出装置 1 と 学習器 2とを備えている。 抽出装置 1 と学習器 2とは、 常時接続されている 必要はない。 例えば、 学習器 2は、 クラウドシステムとして構成することが できる。 As shown in FIG. 1, the mail thread extraction system 100 includes an extraction device 1 and a learning device 2. The extraction device 1 and the learning device 2 do not need to be always connected. For example, the learner 2 can be configured as a cloud system.
[0013] 抽出装置 1は、 メールデータ解析部 1 1、 メールデータ格納部 1 2、 起点 メールデータ取得部 1 3、 応答候補データ生成部 1 4、 応答メールデータ取 得部 1 5、 およびメールスレッ ド生成部 1 6を備えている。 The extraction device 1 includes a mail data analysis unit 11, a mail data storage unit 12, an origin mail data acquisition unit 13, a response candidate data generation unit 14, a response mail data acquisition unit 15 and a mail thread. It includes a code generation unit 16.
[0014] メールデータ解析部 1 1は、 電子メールのメールデータを形態素解析した のち、 べクトル化する。 メールデータのべクトル化は、 一般的に文書データ の形態素とその丨 口によって構成する辞書によって行われる。 図 2に文書デ —夕の辞書化について示す。 文書データの辞書化は、 基になるメールデータ を形態素解析し、 これらにユニークな丨 口を与えることで行われる。 各々の I 口が辞書によって構成される解析空間の次元を表現する。 メールデータの ベクトル化は、 ベクトル化したいメールデータを形態素解析し、 辞書の形態 素と照合して、 各々の丨 口に対する該当数を一次元配列 (ベクトル) で表現 することにより行われる。 なお、 基になる文書データや辞書化の手法により 、 ベクトル表現した結果は変化するが、 本発明の実施形態を限定するもので 〇 2020/175371 5 卩(:170? 2020 /007065 [0014] The mail data analysis unit 11 morphologically analyzes the mail data of the electronic mail and then converts it into a vector. The vectorization of mail data is generally performed by a dictionary that is composed of the morphemes of document data and their mouths. Figure 2 shows the dictionary conversion of document data. Document data is made into a dictionary by morphologically analyzing the underlying mail data and giving them a unique clue. Each I mouth represents the dimension of the analytic space composed of a dictionary. Vectorization of mail data is performed by morphological analysis of the mail data to be vectorized, matching with the morphemes in the dictionary, and expressing the number of hits for each mouth as a one-dimensional array (vector). It should be noted that although the result of vector expression changes depending on the underlying document data and the dictionary method, it does not limit the embodiment of the present invention. 〇 2020/175371 5 卩 (: 170? 2020 /007065
はない。 There is no.
[0015] メールデータ格納部 1 2は、 メールデータ解析部 1 1でベクトル化された 全てのメールデータを格納する。 図 3にメールデータ格納部 1 2に格納され たメールデータの例を示す。 メールデータ格納部 1 2に格納されたメールデ —夕には、 例えばメール文書、 ベクトル化データおよび日時が含まれる。 The mail data storage unit 12 stores all the mail data vectorized by the mail data analysis unit 11. Figure 3 shows an example of mail data stored in the mail data storage unit 12. The mail database stored in the mail data storage section 12 contains, for example, a mail document, vectorized data, and date and time.
[0016] 起点メールデータ取得部 1 3は、 指定された検索期間内におけるスレッ ド 検索の起点になるメールデータをメールデータ格納部 1 2から取得する。 こ こで検索期間およびスレッ ド検索の起点となるメールデータの指定は、 例え ば図 4に示すようなユーザインタフエースを通じてユーザによって指定され る。 The origin mail data acquisition unit 13 acquires from the mail data storage unit 1 2 the mail data that is the starting point of the thread search within the designated search period. Here, the search period and the specification of the mail data that is the starting point of the thread search are specified by the user through the user interface as shown in Fig. 4, for example.
[0017] 応答候補データ生成部 1 4は、 起点メールデータに対応する応答候補デー 夕を生成する。 応答候補データ生成部 1 4は、 学習済みモデル 1 4 3を保持 しており、 起点メールデータを学習済みモデル 1 4 3に入力することで応答 候補データが生成される。 この学習済みモデル 1 4 3は、 図 1 に示す学習器 2で生成される。 学習器 2における学習済みモデル 1 4 3の生成については 、 後に詳しく説明する。 The response candidate data generation unit 14 generates response candidate data corresponding to the origin mail data. The response candidate data generation unit 14 holds the trained model 1 4 3, and the response candidate data is generated by inputting the origin mail data to the trained model 1 4 3. This trained model 1 4 3 is generated by the learner 2 shown in Fig. 1. The generation of the trained model 1 4 3 in the learner 2 will be described in detail later.
[0018] 応答メールデータ取得部 1 5は、 応答候補データ生成部 1 4で生成された 応答候補データに類似したメールデータを、 起点メールデータに応答する応 答メールデータとしてメールデータ格納部 1 2から取得する。 応答メールデ —夕が複数ある場合は、 複数の応答メールデータを取得する。 ここで、 応答 候補データとメールデータ格納部 1 2に格納されたメールデータとの類似の 判断は、 応答候補データのベクトルと、 メールデータ格納部 1 2に格納され たメールデータのベクトルとの内積として求める。 なお、 このベクトルを用 いて類似度を判断する手法において、 べクトルの内積として類似度を求める 手法は本発明の実施形態を限定するものではなく、 例えばユークリッ ド距離 による手法を用いてべクトル同士の類似度を求めてもよい。 The reply mail data acquisition unit 15 uses the mail data similar to the reply candidate data generated by the reply candidate data generation unit 14 as the reply mail data for replying to the origin mail data, and the mail data storage unit 1 2 To get from. When there are multiple reply mail data, multiple reply mail data are acquired. Here, the similarity between the response candidate data and the mail data stored in the mail data storage unit 12 is determined by the inner product of the vector of the response candidate data and the vector of the mail data stored in the mail data storage unit 12 Ask as. In the method of determining the degree of similarity using this vector, the method of obtaining the degree of similarity as the inner product of the vectors does not limit the embodiment of the present invention. For example, a method based on the Euclidean distance is used to compare the vectors. May be calculated.
[0019] メールスレッ ド生成部 1 6は、 メールデータ格納部 1 2から取得した、 起 点メールデータおよび少なくとも一つの応答メールデータを組み合わせてメ —ルスレッ ドを生成する。 例えば、 図 5に示すような形でメールのやり取り がまとめられたメールスレッ ドが生成される。 図 5に示すメールスレッ ドの 例においては、 「年内最終日確認の件」 と題する起点メールとそれに応答す る 4つの返信メールがスレッ ドとして表示される例を示す。 [0019] The mail thread generation unit 16 combines the origin mail data and at least one response mail data acquired from the mail data storage unit 12 and combines them. — Generate rule thread. For example, a mail thread is created that summarizes mail exchanges as shown in Figure 5. In the example of the mail thread shown in Fig. 5, an example is shown in which the origin mail titled "Confirmation of the last day of the year" and the four reply mails that respond to it are displayed as threads.
[0020] 次に、 学習器 2の構成と機能について説明する。 学習器 2は、 図 1 に示す ようにメール学習用データ (教師データ) を入力し、 学習用データ解析部 2 1、 データセッ ト生成部 22を経て、 D N N 23に学習させることにより、 抽出装置 1の応答候補データ生成部 1 4で用いる学習済みモデルを作成する 。 学習器 2は、 学習用データ解析部 2 1、 データセッ ト生成部 22、 DN N (ディープニューラルネッ トワーク) 23、 および学習済みモデル格納部 2 4を備える。 また、 学習器 2に入力する学習用データは、 メールデータとそ れに対する応答メールデータの組を教師データとして用いる。 図 6に質問 ( Q u e s t i o n) 、 応答 (A n swe r) の形でやり取りされる電子メー ルの例を示す。 図 6における Q u e s t i o nおよび A n swe rを対応付 けて組として抽出し、 それらの組を教師データとする。 図 7に教師データと して用いるメールデータとそれに対する応答メールデータの組の例を示す。 [0020] Next, the configuration and function of the learning device 2 will be described. The learning device 2 inputs the data for e-mail learning (teaching data) as shown in Fig. 1, and passes through the learning data analysis part 21 and the data set generation part 22, and the DNN 23 learns to extract the extraction device 1 Create a trained model to be used in the response candidate data generator 14 of. The learning device 2 includes a learning data analysis unit 21, a data set generation unit 22, a DN N (deep neural network) 23, and a learned model storage unit 24. The learning data input to the learning device 2 uses a set of mail data and response mail data for the learning data as teacher data. Figure 6 shows an example of an electronic mail exchanged in the form of a question (Q u e st i o n) and a response (A n swer). Q u e st i o n and A n swer in Figure 6 are associated and extracted as pairs, and these pairs are used as teacher data. Figure 7 shows an example of a set of mail data used as teacher data and response mail data.
[0021] 学習用データ解析部 2 1は、 上述の抽出装置 1 に備えるメールデータ解析 部 1 1 と同様に、 学習用データを形態素解析したのち、 ベクトル化する。 な お、 学習用データ解析部 2 1 においては、 メールデータとそれに対応する応 答メールデータの組を学習用データとしてべクトル化する。 The learning data analysis unit 21 performs morphological analysis on the learning data and then vectorizes the learning data, similarly to the mail data analysis unit 11 included in the extraction device 1 described above. In the learning data analysis unit 21, the set of mail data and the corresponding reply mail data is converted into learning data.
[0022] データセッ ト生成部 22は、 教師データの入力文書をべクトル化したもの と応答メールデータにラベル付けしたものを D N N 23の入力となるデータ セッ トとして生成する。 The data set generation unit 22 generates a vectorized version of the input document of the teacher data and a labeled version of the response mail data as a data set to be the input of D N N 23.
[0023] DN N 23は、 入カメールデータをベクトル化したものと応答メールデー 夕のラベルを関連付けるディープニューラルネッ トワークである。 D N N 2 3で行われる学習のイメージを図 8に示す。 図 8に示すように、 形態素解析 された Q u e s t i 〇 nメールデータと対応する正解ラベル付けされた応答 メールデータを A n s w e rとして学習させる。 例えば Q u e s t i o n 1 〇 2020/175371 7 卩(:170? 2020 /007065 [0023] DN N 23 is a deep neural network that associates vectorized incoming mail data with the label of the reply mail data. Figure 8 shows the image of learning performed in DNN 23. As shown in Fig. 8, the Q uesti 〇 n mail data subjected to morphological analysis and the response mail data corresponding to the correct answer are trained as A nswer. For example Q uestion 1 〇 2020/175371 7 卩 (: 170? 2020 /007065
に対応する応答メールデータを八 3 6 「 1 として対応させて学習を行うThe response mail data corresponding to is treated as 8 3 6 "1 and learning is performed.
。 なお、 口 2 3で用いられるニューラルネッ トワークモデルは、 畳:み込 みニューラルネッ トワーク (〇 1\1) や再帰型ニューラルネッ トワーク ([¾ 1\1、 !_ 3丁1\/1) 等のニューラルネッ トワークモデルが適用できるが、 ニュ —ラルネッ トワークモデルの種類は本発明を限定するものではない。 .. The neural network model used in Mouth 23 is a tatami: convolutional neural network (〇 1\1) or a recursive neural network ([¾ 1\1, !_ 3 chome 1\/1). Although a neural network model such as the above can be applied, the type of the neural network model does not limit the present invention.
[0024] 次に、 上述したメールスレッ ド抽出装置 1 0 0の動作について、 フローチ ャートを用いて説明する。 図 9にメールスレッ ド抽出装置 1 0 0の動作フロ 一を示す。 3 1 0 1 において、 起点メールが指定されたか否かを判定する。 起点メールの指定は、 例えば図 4に示すようなユーザインタフエースを通じ てユーザから起点メールおよび検索期間が指定される。 メールスレッ ド抽出 装置 1 0 0は、 指定された検索期間内の起点メールデータをメールデータ格 納部 1 2から取得する (3 1 0 2) 。 次に、 メールスレッ ド抽出装置 1 0 0 は、 取得した起点メールデータを応答候補データ生成部 1 4の学習済みモデ ル 1 4 3に入力し、 応答候補データを生成する (3 1 0 3) 。 そして、 応答 メールデータ取得部 1 5において、 応答候補データに類似する応答メールデ —夕をメールデータ格納部 1 2から取得する (3 1 0 4) 。 メールデータ格 納部 1 2から取得した起点メールデータと少なくとも一つの応答メールデー 夕を組み合わせて、 メールスレッ ドを生成する (3 1 0 5) 。 例えば図 5に 示すような形で起点メールに対する応答メールデータがメールスレッ ドとし てまとまって出力 (表示) される。 図 5の例では、 「年内最終日確認の件」 という件名で 2 0 1 8年 1 2月 1 0日の 1 2 : 0 0に発信されたメールに対 する複数の返信メールがメールスレッ ドにまとめられている。 図 5の例では 、 メールスレッ ドの一番上に表示されたメール (アカウント 8 8 8からの返 信) が選択されており、 そのメール本文である 「通常通りの出退勤予定です 」 というテキストが、 右側の欄内に表示されている。 このように、 本実施形 態によれば、 一つの起点メールに対して、 少なくとも一つの応答メールをス レッ ドにまとめて表示することができる。 [0024] Next, the operation of the above-mentioned mail thread extracting device 100 will be described using a flow chart. Figure 9 shows the operation flow of the mail thread extraction device 100. In 3101, it is determined whether or not the origin mail is designated. The origin mail is specified by the user through the user interface as shown in Fig. 4, for example. The mail thread extraction device 100 obtains the origin mail data within the specified search period from the mail data storage unit 12 (3 1 0 2). Next, the mail thread extraction device 100 inputs the acquired origin mail data into the learned model 1 43 of the response candidate data generation unit 14 to generate the response candidate data (3 1 0 3) .. Then, the response mail data acquisition unit 15 acquires the response mail data similar to the response candidate data from the mail data storage unit 12 (3104). A mail thread is generated by combining the origin mail data acquired from the mail data storage unit 12 and at least one response mail data (3105). For example, the response mail data for the origin mail is output (displayed) as a mail thread as shown in Figure 5. In the example shown in Fig. 5, multiple reply mails for the mail sent at 12:00:00 on February 10, 2010, with the subject "Confirmation on the last day of the year" are sent to the mail thread. Are summarized in. In the example shown in Fig. 5, the email displayed at the top of the email thread (reply from account 8888) is selected, and the text of the email, "I am going to work normally" is displayed. , Is displayed in the right column. As described above, according to the present embodiment, at least one response mail can be collectively displayed in a thread for one origin mail.
[0025] [第 2の実施形態] 〇 2020/175371 8 卩(:170? 2020 /007065 [0025] [Second Embodiment] 〇 2020/175 371 8 卩 (: 170? 2020 /007065
以上のとおり、 本発明の具体的な実施形態を一つ説明したが、 上述した実 施形態は例示であって、 本発明を限定するものではない。 例えば、 上述の第 1の実施形態においては、 一つの起点メールに対応する少なくとも一つの応 答メールデータを取得し、 メールスレッ ドを生成する形態を例示したが、 応 答メールデータに応答するメールデータを取得する形態でもよい。 以下、 応 答メールデータに対してさらに対応する応答メールデータを取得してメール スレッ ドを生成する、 この発明の第 2の実施形態にかかるメールスレッ ド抽 出装置について、 第 1の実施形態と異なる構成について説明する。 As described above, one specific embodiment of the present invention has been described, but the above-described embodiment is merely an example and does not limit the present invention. For example, in the above-described first embodiment, the form in which at least one reply mail data corresponding to one origin mail is acquired and the mail thread is generated has been exemplified. However, the mail replying to the reply mail data is exemplified. The form of acquiring data may be used. Hereinafter, the mail thread extracting device according to the second embodiment of the present invention, which acquires the reply mail data corresponding to the reply mail data and generates the mail thread, will be described as follows. The different configuration will be described.
[0026] 図 1 0は、 本発明の第 2の実施形態にかかるメールスレッ ド抽出システム [0026] FIG. 10 shows a mail thread extraction system according to a second embodiment of the present invention.
2 0 0の概略構成を示すブロック図である。 終端判定部 1 7は、 メールデー 夕格納部 1 2から取得した応答メールデータが、 指定された検索期間内であ るか否かを判定し、 応答メールデータが検索期間内である場合は、 起点メー ルデータ取得部 1 3に対し、 応答メールデータを送る。 起点メールデータ取 得部 1 3は、 受け取った応答メールデータを応答候補データ生成部 1 4に入 力し、 応答候補データ生成部 1 4および応答メールデータ取得部 1 5におい て、 対応する応答メールデータを抽出する処理を行う。 この処理は、 応答メ —ルデータが、 指定された検索期間内のメールである限りにおいて行われる It is a block diagram showing a schematic structure of 200. The end determination unit 17 determines whether the response mail data acquired from the mail data storage unit 12 is within the specified search period, and if the response mail data is within the search period, Send reply mail data to the origin mail data acquisition unit 13. The origin mail data acquisition unit 13 inputs the received response mail data into the response candidate data generation unit 14 and the corresponding response mail data is received in the response candidate data generation unit 14 and the response mail data acquisition unit 15 Perform the process of extracting data. This processing is performed as long as the response mail data is an email within the specified search period.
[0027] メールスレッ ド格納部 1 8には、 起点メールデータおよび応答メールデー 夕が格納される。 終端判定部 1 7で応答メールデータが検索期間外であると 判定された場合、 終端判定部 1 7はメールスレッ ド生成部 1 6に終了指示を 送る。 終了指示を受けたメールスレッ ド生成部 1 6は、 メールスレッ ド格納 部 1 8に格納されている起点メールデータおよび応答メールデータを参照し 、 メールスレッ ドを生成する。 なお、 終端判定部 1 7で検索期間外と判定さ れた応答メ _ルデ _夕については、 メ _ルスレッ ドには反映させず、 既に格 納されている起点メールデータおよび応答メールデータを用いてメールスレ ッ ドを生成する。 [0027] The mail thread storage unit 18 stores the origin mail data and the reply mail data. When the termination determination unit 17 determines that the response mail data is outside the search period, the termination determination unit 17 sends a termination instruction to the mail thread generation unit 16. Upon receiving the termination instruction, the mail thread generation unit 16 refers to the origin mail data and the reply mail data stored in the mail thread storage unit 18 and generates a mail thread. Note that the response mails that are judged to be out of the search period by the end judgment unit 17 are not reflected in the mail thread, and the already-stored origin mail data and reply mail data are used. To generate a mail thread.
[0028] 図 1 1 に、 本発明の第 2の実施形態にかかるメールスレッ ド抽出方法のフ 〇 2020/175371 9 卩(:170? 2020 /007065 [0028] Fig. 11 shows a flow chart of the mail thread extraction method according to the second embodiment of the present invention. 〇 2020/175 371 9 卩 (: 170? 2020 /007065
口ーチャートを示す。 まず、 検索期間および起点メールが指定されるのを待 つ (3 2 0 1) 。 例えば図 1 2に示すようなユーザインタフエースを用いて ューザから起点メールおよび検索期間が指定される。 指定された検索期間内 の起点メールデータをメールデータ格納部 1 2から入カメールデータとして 取得する (3 2 0 2) 。 取得した入カメールデータを応答候補データ生成部 1 4の学習済みモデル 1 4 3に入力し、 応答候補データを生成する (3 2 0 3) 。 そして、 応答メールデータ取得部 1 5において、 応答候補データに類 似する応答メールデータをメールデータ格納部 1 2から取得する (3 2 0 4 ) 。 メールデータ格納部 1 2から取得した応答メールデータが、 指定された 検索期間内のメールデータか否かを判定する (3 2 0 5) 。 応答メールデー 夕が、 指定された検索期間内のメールデータの場合、 入カメールデータおよ び応答メールデータを組み合わせて、 メールスレッ ドを生成し (3 2 0 6)Shows mouth chart. First, wait for the search period and the starting email to be specified (3201). For example, the origin mail and search period are specified by the user using the user interface as shown in Fig. 12. The origin mail data within the specified search period is acquired from the mail data storage unit 1 2 as incoming mail data (3 2 0 2). The acquired incoming mail data is input to the trained model 1 4 3 of the response candidate data generation unit 14 to generate response candidate data (3 2 0 3). Then, the response mail data acquisition unit 15 acquires response mail data similar to the response candidate data from the mail data storage unit 12 (3 2 0 4 ). It is determined whether or not the response mail data acquired from the mail data storage unit 12 is mail data within the specified search period (3205). If the reply mail data is mail data within the specified search period, the mail thread is generated by combining the incoming mail data and the reply mail data (3206).
、 メールスレッ ド格納部 1 8に格納する (3 2 0 7) 。 そして、 応答メール データを次の入カメールデータとして、 起点メールデータ取得部 1 3に送付 し、 3 2 0 2からの処理を繰り返す。 一方、 3 2 0 5の判定において、 メー ルデータ格納部 1 2から取得した応答メールデータが指定した検索期間外で あると判定された場合、 メールスレッ ド格納部 1 8に既に格納されているメ —ルスレッ ドを出力する (3 2 0 8) 。 例えば図 1 3に示すような形で起点 メールに対する応答メールデータがメールスレッ ドとしてまとまって出力 ( 表 ) される 0 , Stored in the mail thread storage unit 18 (3207). Then, the reply mail data is sent to the origin mail data acquisition unit 13 as the next incoming mail data, and the processes from 3202 are repeated. On the other hand, when it is determined in the determination of 3205 that the response mail data acquired from the mail data storage unit 12 is out of the specified search period, the mail already stored in the mail thread storage unit 18 is determined. — Output the rule thread (3208). For example, in the form shown in Figure 13 the response mail data for the origin mail is collected and output as a mail thread (Table) 0
[0029] [第 3の実施形態] [0029] [Third Embodiment]
上述の実施形態において、 応答候補データ生成部 1 4によって生成された 応答候補データとメールデータ格納部 1 2に格納されたメールデータとの類 似度の判断は、 応答候補データおよびメールデータのべクトルの内積を用い る形態を例示したが、 応答候補データの中で類似度の高いものを、 さらに二 ューラルネッ トワークを用いて学習させた学習済みモデルを用いて複数抽出 する形態でもよい。 以下、 この発明の第 3の実施の形態に係るメールスレッ ド抽出システムについて、 上述の実施形態と異なる構成について説明する。 〇 2020/175371 10 卩(:170? 2020 /007065 In the above embodiment, the determination of the similarity between the response candidate data generated by the response candidate data generation unit 14 and the mail data stored in the mail data storage unit 12 is performed based on the response candidate data and the mail data. Although the form using the inner product of the Coutl is exemplified, a form in which a plurality of response candidate data having a high degree of similarity are extracted using a trained model trained using the dual network may be used. Hereinafter, a mail thread extraction system according to the third embodiment of the present invention will be described with respect to a configuration different from the above-mentioned embodiments. 〇 2020/175371 10 卩 (: 170? 2020 /007065
[0030] 図 1 4に、 応答候補データの中で類似度の高いものを複数抽出するための 類似関係学習モデルを示す。 類似関係学習モデルは、 応答候補データである 八 11 3 \« 6 「 1から八 11 3 \« 6 「 について、 類似の高いものを抽出するた めの学習モデルである。 例えば、 分類モデルにより応答候補データとして八 [0030] Fig. 14 shows a similarity learning model for extracting a plurality of response candidate data having a high degree of similarity. The similarity relation learning model is a learning model for extracting highly similar items from the response candidate data 8 11 3 \« 6 "1 to 8 11 3 \« 6 ". For example, a classification model Eight as candidate data
1が抽出された場合に、 類似関係学習モデルを用いて八
Figure imgf000012_0001
If 1 is extracted, the similarity learning model is used to
Figure imgf000012_0001
「 1 に類似する応答候補データを抽出することが可能となる。 この類似関係 学習モデルで学習された学習済モデルを応答候補データ生成部 1 4に用いて 複数の応答候補データを生成することで、 応答メールデータ取得部 1 5にお いて、 漏れのない応答候補データの取得が可能となる。 なお、 類似関係学習 モデルの学習方法として、 類似する応答候補データを教師データとして学習 を行う教師あり学習や、 教師データを用いず応答候補データのみで学習を行 う教師なし学習が適用できるが、 学習の方法は本発明を限定するものではな い。 “It is possible to extract response candidate data similar to 1. By using the trained model learned by this similarity relationship learning model in the response candidate data generation unit 14, multiple response candidate data are generated. It is possible to obtain complete response candidate data in the response mail data acquisition unit 15. As a learning method for the similarity learning model, there is a teacher that uses similar response candidate data as teacher data. Although learning and unsupervised learning in which learning is performed only with response candidate data without using teacher data can be applied, the learning method does not limit the present invention.
[0031 ] 以上のとおり、 本発明の具体的な実施形態を一つ説明したが、 上述した実 施形態は例示であって、 本発明を限定するものではない。 例えば、 上記の実 施形態では、 教師あり学習による学習済みモデルの生成を例示したが、 教師 なし学習によって学習済みモデルを生成するようにしても良い。 その場合は 、 ラベル付与部 2 4は省略される。 As described above, one specific embodiment of the present invention has been described, but the above-described embodiment is merely an example and does not limit the present invention. For example, in the above embodiment, the generation of the learned model by the supervised learning is illustrated, but the learned model may be generated by the unsupervised learning. In that case, the labeling unit 24 is omitted.
[0032] また、 上記実施形態の各機能ブロックの処理の一部または全部は、 プログ ラムにより実現されるものであってもよい。 そして、 上記各実施形態の各機 能ブロックの処理の一部または全部は、 コンピュータにおいて、 中央演算装 置 (〇 11) 、 マイクロプロセッサ、 プロセッサ等により行われる。 また、 それぞれの処理を行うためのプログラムは、 ハードディスク、
Figure imgf000012_0002
などの 記憶装置に格納されており、
Figure imgf000012_0003
において、 あるいは 八1\/1に読み出され て実行される。
Further, a part or all of the processing of each functional block of the above embodiment may be realized by a program. Then, a part or all of the processing of each functional block of each of the above-described embodiments is performed by the central processing unit (11), microprocessor, processor, etc. in the computer. Also, the programs for performing each processing are the hard disk,
Figure imgf000012_0002
Stored in a storage device such as
Figure imgf000012_0003
, Or read at 8\/1 and executed.
[0033] また、 上記実施形態の各処理をハードウェアにより実現してもよいし、 ソ フトウェア (〇 3 (オペレーテイングシステム) 、 ミ ドルウェア、 あるいは 、 所定のライブラリとともに実現される場合を含む。 ) により実現してもよ 〇 2020/175371 1 1 卩(:170? 2020 /007065 Further, each processing of the above-described embodiments may be realized by hardware, and includes cases where it is realized together with software (03 (operating system), middleware, or a predetermined library). ) Can be realized by 〇 2020/175371 1 1 卩 (: 170? 2020 /007065
い。 さらに、 メール分類システム 1 0 0を、 ソフトウェアおよびハードウェ アの混在処理により実現しても良い。 Yes. Furthermore, the mail classification system 100 may be realized by mixed processing of software and hardware.
[0034] また、 上記実施形態における処理方法の実行順序は、 必ずしも、 上記実施 形態の記載に制限されるものではなく、 発明の要旨を逸脱しない範囲で、 実 行順序を入れ替えることができるものである。 また、 上記実施形態における 処理方法において、 発明の要旨を逸脱しない範囲で、 一部のステップが、 他 のステップと並列に実行されるものであってもよい。 [0034] Further, the execution order of the processing methods in the above embodiments is not necessarily limited to the description of the above embodiments, and the execution order can be changed without departing from the gist of the invention. is there. Further, in the processing method in the above-described embodiment, some steps may be executed in parallel with other steps without departing from the scope of the invention.
[0035] 前述した方法をコンピュータに実行させるコンピュータプログラム及びそ のプログラムを記録したコンビュータ読み取り可能な記録媒体は、 本発明の 範囲に含まれる。 ここで、 コンピュータ読み取り可能な記録媒体の種類は任 意である。 また、 上記コンピュータプログラムは、 上記記録媒体に記録され たものに限られず、 電気通信回線、 無線又は有線通信回線、 インターネッ ト を代表とするネッ トワーク等を経由して伝送されるものであってもよい。 A computer program that causes a computer to execute the above-described method and a computer-readable recording medium that records the program are included in the scope of the present invention. Here, the type of computer-readable recording medium is arbitrary. Further, the computer program is not limited to the one recorded in the recording medium, and may be transmitted via a telecommunication line, a wireless or wired communication line, a network typified by the internet, or the like. Good.
[0036] なお、 本発明の具体的な構成は、 前述の実施形態に限られるものではなく 、 発明の要旨を逸脱しない範囲で種々の変更および修正が可能である。 The specific configuration of the present invention is not limited to the above-described embodiment, and various changes and modifications can be made without departing from the gist of the invention.
[0037] なお、 本発明は、 以下のように説明することもできる。 The present invention can also be described as follows.
[0038] 本発明の第 1の構成にかかるメールスレッ ド抽出装置は、 [0038] The mail thread extraction device according to the first configuration of the present invention is
複数の電子メールデータを格納するメールデータ格納部と、 A mail data storage unit for storing a plurality of email data,
メールスレッ ドの起点となる起点メールデータを前記メールデータ格納部 から取得する起点メールデータ取得部と、 A starting point mail data acquisition unit that acquires starting point mail data that is the starting point of the mail thread from the mail data storage unit,
メールデータとそれに対応する応答メールデータとの対応関係を学習した 学習済みモデルを用いて、 前記起点メールデータに対応する応答候補データ を生成する応答候補データ生成部と、 A response candidate data generation unit that generates response candidate data corresponding to the origin mail data by using a learned model that has learned the correspondence between the mail data and the corresponding response mail data,
前記応答候補データ生成部によって生成された応答候補データに類似する 応答メ _ルデータを前記メ _ルデータ格納部から取得する応答メ _ルデータ 取得部と、 A response mail data acquisition unit that acquires response mail data similar to the response candidate data generated by the response candidate data generation unit from the mail data storage unit;
前記起点メールデータと前記応答メールデータとを組み合わせてメールス レッ ドを生成するメールスレッ ド抽出部とを備える。 〇 2020/175371 12 卩(:170? 2020 /007065 A mail thread extracting unit that combines the origin mail data and the response mail data to generate a mail thread. 〇 2020/175371 12 卩 (: 170? 2020 /007065
[0039] この第 1の構成では、 メール文書データを格納するメール文書データ格納 部を備え、 メールスレッ ドの起点となる起点メール文書データをメール文書 データ格納部から取得する。 そして、 メール文書データとそれに対応する応 答メール文書データとの対応関係を学習した学習済みモデルを用いて、 起点 メール文書データに対応する応答候補データを生成する。 さらに、 応答候補 データに類似する応答メール文書データをメール文書データ格納部から取得 し、 起点メール文書データと応答メール文書データとに基づいてメールスレ ッ ドを生成する。 これにより、 従来のように、 所定の単語によるキーワード 検索によつて関係するメールを抽出しメールスレッ ドを生成する場合よりも 、 学習済みモデルを用いることによりメール本文の繫がりを基に対応するメ —ルを網羅的に抽出することができ、 メールのスレッ ド抽出を適切に行うこ とができる。 [0039] In the first configuration, a mail document data storage unit that stores mail document data is provided, and the origin mail document data that is the origin of the mail thread is acquired from the mail document data storage unit. Then, using the learned model in which the correspondence between the mail document data and the corresponding reply mail document data is learned, the response candidate data corresponding to the starting mail document data is generated. Further, the response mail document data similar to the response candidate data is acquired from the mail document data storage unit, and the mail thread is generated based on the origin mail document data and the response mail document data. As a result, compared to the case where the related mail is extracted by the keyword search using the predetermined word and the mail thread is generated as in the conventional method, the learned model is used to deal with the mail text based on the refinement. The mail can be comprehensively extracted, and the thread extraction of the mail can be appropriately performed.
[0040] 本発明の第 2の構成にかかるメールスレッ ド抽出装置は、 第 1の構成にか かるメールスレッ ド抽出装置において、 前記応答メールデータ取得部により 取得された応答メールデータが、 前記メールスレッ ドの対象となる応答メー ルデータであるか否かを判定する終端判定部を備える。 A mail thread extracting device according to a second configuration of the present invention is the mail thread extracting device according to the first configuration, wherein the response mail data acquired by the response mail data acquiring unit is the mail. It is provided with a termination determination unit that determines whether or not the response mail data is a thread target.
[0041 ] この第 2の構成によれば、 応答メールデータがメールスレッ ドの対象とな るか否かを判定する終端判定部を備え、 応答メールデータがメールスレッ ド の対象メールであると判定された場合に、 前記応答メールデータを起点メー ルデータ取得部に入力し、 前記応答メールデータに応答するメールデータを 取得することで所望のメールスレッ ドを漏れなく取得できる。 [0041] According to the second configuration, the terminal determination unit that determines whether or not the reply mail data is the target of the mail thread is provided, and the reply mail data is judged to be the mail of the mail thread. In this case, by inputting the response mail data into the starting point mail data acquisition unit and acquiring the mail data responding to the response mail data, the desired mail thread can be acquired without omission.
[0042] 本発明に係るメールスレッ ド抽出方法は、 [0042] The mail thread extraction method according to the present invention is
メールスレッ ドの起点となる起点メールデータを、 複数の電子メールデー 夕が格納されたメールデータ格納部から取得し、 The origin mail data, which is the origin of the mail thread, is acquired from the mail data storage section that stores multiple email data,
メールデータとそれに対応する応答メールデータとの対応関係を学習した 学習済みモデルを用いて、 前記起点メールデータに対応する応答候補データ を生成し、 Using the learned model that learned the correspondence between the mail data and the corresponding reply mail data, generate the response candidate data corresponding to the origin mail data,
前記応答候補データに類似する応答メールデータを前記メールデータ格納 〇 2020/175371 13 卩(:170? 2020 /007065 Store response mail data similar to the response candidate data in the mail data 〇 2020/175 371 13 卩 (: 170? 2020 /007065
部から取得し、 Get from the department,
前記起点メールデータと前記応答メールデータとを組み合わせてメールス レッ ドを生成する。 A mail thread is generated by combining the origin mail data and the response mail data.
[0043] このメールスレッ ド抽出方法によれば、 メールスレッ ドの起点となる起点 メールデータを、 複数の電子メールデータが格納されたメールデータ格納部 から取得し、 メールデータとそれに対応する応答メールデータとの対応関係 を学習した学習済みモデルを用いて、 前記起点メールデータに対応する応答 候補データを生成する。 そして、 前記応答候補データに類似する応答メール データを前記メ _ルデータ格納部から取得し、 前記起点メ _ルデータと前記 応答メールデータとを組み合わせてメールスレッ ドを生成する。 これにより 、 従来のように、 所定の単語によるキーワード検索によって関係するメール を抽出しメールスレッ ドを生成する場合よりも、 学習済みモデルを用いるこ とによりメール本文の繫がりを基に対応するメールを網羅的に抽出すること ができ、 メールのスレッ ド抽出を適切に行うことができる。 [0043] According to this mail thread extraction method, the origin mail data, which is the origin of the mail thread, is acquired from the mail data storage unit that stores a plurality of e-mail data, and the mail data and the corresponding reply mail are acquired. The response candidate data corresponding to the origin mail data is generated using the learned model that has learned the correspondence with the data. Then, response mail data similar to the response candidate data is acquired from the mail data storage unit, and the start mail data and the reply mail data are combined to generate a mail thread. As a result, compared to the conventional case where related emails are extracted by keyword search using a predetermined word and an email thread is generated, it is possible to use the model that has already been trained to deal with emails that correspond to the emails based on the refinement of the email body. Can be comprehensively extracted, and the thread extraction of mail can be appropriately performed.
[0044] 本発明にかかるプログラムは、 [0044] The program according to the present invention is
メールスレッ ドの起点となる起点メールデータを、 複数の電子メールデー 夕が格納されたメールデータ格納部から取得し、 The origin mail data, which is the origin of the mail thread, is acquired from the mail data storage section that stores multiple email data,
メールデータとそれに対応する応答メールデータとの対応関係を学習した 学習済みモデルを用いて、 前記起点メールデータに対応する応答候補データ を生成し、 Using the learned model that learned the correspondence between the mail data and the corresponding reply mail data, generate the response candidate data corresponding to the origin mail data,
前記応答候補データに類似する応答メールデータを前記メールデータ格納 部から取得し、 Acquiring response mail data similar to the response candidate data from the mail data storage unit,
前記起点メールデータと前記応答メールデータとを組み合わせてメールス レッ ドを生成する処理を、 コンビュータに実行させるためのプログラムであ る。 It is a program for causing a computer to execute a process of generating a mail thread by combining the origin mail data and the response mail data.
[0045] このプログラムによって動作するコンビュータは、 メールスレッ ドの起点 となる起点メールデータを、 複数の電子メールデータが格納されたメールデ —夕格納部から取得し、 メールデータとそれに対応する応答メールデータと 〇 2020/175371 14 卩(:170? 2020 /007065 [0045] The computer operated by this program obtains the origin mail data, which is the origin of the mail thread, from the mail database storage part that stores multiple pieces of e-mail data, and the mail data and the corresponding reply mail data. When 〇 2020/175371 14 卩 (: 170? 2020 /007065
の対応関係を学習した学習済みモデルを用いて、 前記起点メールデータに対 応する応答候補データを生成する。 そして、 前記応答候補データに類似する 応答メールデータを前記メールデータ格納部から取得し、 前記起点メールデ —夕と前記応答メールデータとを組み合わせてメールスレッ ドを生成する。 これにより、 従来のように、 所定の単語によるキーワード検索によって関係 するメールを抽出しメールスレッ ドを生成する場合よりも、 学習済みモデル を用いることによりメール本文の繫がりを基に対応するメールを網羅的に抽 出することができ、 メールのスレッ ド抽出を適切に行うことができる。 The response candidate data corresponding to the origin mail data is generated by using the learned model in which the correspondence relationship of [1] is learned. Then, the response mail data similar to the response candidate data is acquired from the mail data storage unit, and the origin mail database and the response mail data are combined to generate a mail thread. As a result, compared to the conventional case where a related word is extracted by a keyword search using a predetermined word and a mail thread is generated, a trained model is used to search for a corresponding mail based on the e-mail text. It can be extracted comprehensively, and the thread extraction of mail can be performed appropriately.
[0046] また、 上記のプログラムを記録した記録媒体も、 本発明の一つの態様であ る。 A recording medium recording the above program is also an aspect of the present invention.
符号の説明 Explanation of symbols
[0047] 1 抽出装置、 2 学習器、 1 1 メールデータ解析部 1、 1 2 メール データ格納部、 1 3 起点メールデータ取得部、 1 4 応答候補データ生成 部、 1 5 応答メールデータ取得部、 1 6 メールスレッ ド生成部、 1 7 終端判定部、 1 8 メールスレッ ド格納部、 2 1 学習用データ解析部、 2 2 デ—タセッ ト生成部、 2 3 0 (ディープニューラルネッ トワーク ) 、 2 4 学習済モデル、 1 0 0 メールスレッ ド抽出システム、 2 0 0 メールスレッ ド抽出システム [0047] 1 extractor, 2 learning device, 1 1 mail data analysis unit 1, 1 2 mail data storage unit, 1 3 origin mail data acquisition unit, 1 4 response candidate data generation unit, 1 5 response mail data acquisition unit, 1 6 Mail thread generation unit, 1 7 End judgment unit, 1 8 Mail thread storage unit, 2 1 Learning data analysis unit, 2 2 Data set generation unit, 2 3 0 (deep neural network), 2 4 Trained model, 100 mail thread extraction system, 200 mail thread extraction system

Claims

\¥0 2020/175371 15 卩(:17 2020 /007065 請求の範囲 \¥0 2020/175 371 15 ((17 2020/007065 Claims
[請求項 1 ] 複数の電子メールデータを格納するメールデータ格納部と、 [Claim 1] A mail data storage unit for storing a plurality of electronic mail data,
メールスレッ ドの起点となる起点メールデータを前記メールデータ 格納部から取得する起点メールデータ取得部と、 A starting point mail data acquisition section for acquiring starting point mail data which is the starting point of the mail thread from the mail data storage section,
メールデータとそれに対応する応答メールデータとの対応関係を学 習した学習済みモデルを用いて、 前記起点メールデータに対応する応 答候補データを生成する応答候補データ生成部と、 前記応答候補データ生成部によって生成された応答候補データに類 似する応答メ _ルデ _夕を前記メールデータ格納部から取得する応答 メールデータ取得部と、 前記起点メールデータと前記応答メールデータとを組み合わせてメ —ルスレッ ドを生成するメールスレッ ド生成部とを備える、 メールス レッ ド抽出装置。 A response candidate data generation unit that generates response candidate data corresponding to the start point email data by using a learned model that has learned the correspondence between the email data and the corresponding response email data, and the response candidate data generation The response mail data acquisition unit that acquires the response mail data similar to the response candidate data generated from the mail data storage unit from the mail data storage unit, and the combination of the origin mail data and the reply mail data. A mail thread extraction device including a mail thread generation unit that generates a mail.
[請求項 2] 前記応答メールデータ取得部により取得された応答メールデータが [Claim 2] The response mail data acquired by the response mail data acquisition unit is
、 前記メールスレッ ドの対象となる応答メールデータであるか否かを 判定する終端判定部を備え、 A termination determination unit that determines whether or not the response mail data is the target of the mail thread,
前記終端判定部は、 前記応答メールデータが前記メールスレッ ドの 対象となる応答メールデータであると判定された場合に、 前記応答メ —ルデータを前記起点メールデータ取得部に入力する、 請求項 1 に記 載のメールスレッ ド抽出装置。 The termination determination unit inputs the response mail data to the origin mail data acquisition unit when it is determined that the response mail data is response mail data to be subject to the mail thread. The mail thread extraction device described in.
[請求項 3] コンピュータによって実行されるメールスレッ ド抽出方法であって [Claim 3] A mail thread extraction method executed by a computer,
メールスレッ ドの起点となる起点メールデータを、 複数の電子メー ルデータが格納されたメールデータ格納部から取得し、 The origin mail data, which is the origin of the mail thread, is acquired from the mail data storage section that stores multiple email data,
メールデータとそれに対応する応答メールデータとの対応関係を学 習した学習済みモデルを用いて、 前記起点メールデータに対応する応 答候補データを生成し、 Generate the response candidate data corresponding to the origin mail data by using the learned model that learned the correspondence between the mail data and the corresponding reply mail data,
前記応答候補データに類似する応答メ _ルデータを前記メ _ルデー 〇 2020/175371 16 卩(:170? 2020 /007065 The response mail data similar to the response candidate data is set to the mail data. 〇 2020/175371 16 卩 (: 170? 2020 /007065
夕格納部から取得し、 Get from the evening storage,
前記起点メールデータと前記応答メールデータとを組み合わせてメ —ルスレッ ドを生成する、 メールスレッ ド抽出方法。 A mail thread extracting method for generating a mail thread by combining the origin mail data and the response mail data.
[請求項 4] メールスレッ ドの起点となる起点メールデータを、 複数の電子メー ルデータが格納されたメールデータ格納部から取得し、 [Claim 4] The origin mail data, which is the origin of the mail thread, is acquired from the mail data storage unit that stores a plurality of electronic mail data,
メールデータとそれに対応する応答メールデータとの対応関係を学 習した学習済みモデルを用いて、 前記起点メールデータに対応する応 答候補データを生成し、 Generate the response candidate data corresponding to the origin mail data by using the learned model that learned the correspondence between the mail data and the corresponding reply mail data,
前記応答候補データに類似する応答メールデータを前記メールデー 夕格納部から取得し、 Acquiring response mail data similar to the response candidate data from the mail data storage unit,
前記起点メールデータと前記応答メールデータとを組み合わせてメ —ルスレッ ドを生成する処理を、 コンビユータに実行させるためのプ ログラム。 A program for causing a computer to execute a process of generating a mail thread by combining the origin mail data and the response mail data.
[請求項 5] メールスレッ ドの起点となる起点メールデータを、 複数の電子メー ルデータが格納されたメールデータ格納部から取得し、 [Claim 5] The origin mail data, which is the origin of the mail thread, is acquired from the mail data storage unit that stores a plurality of electronic mail data,
メールデータとそれに対応する応答メールデータとの対応関係を学 習した学習済みモデルを用いて、 前記起点メールデータに対応する応 答候補データを生成し、 Generate the response candidate data corresponding to the origin mail data by using the learned model that learned the correspondence between the mail data and the corresponding reply mail data,
前記応答候補データに類似する応答メールデータを前記メールデー 夕格納部から取得し、 Acquiring response mail data similar to the response candidate data from the mail data storage unit,
前記起点メールデータと前記応答メールデータとを組み合わせてメ —ルスレッ ドを生成する処理を、 コンビユータに実行させるためのプ ログラムを記録した記録媒体。 A recording medium recording a program for causing a computer to execute a process of generating a mail thread by combining the origination mail data and the response mail data.
PCT/JP2020/007065 2019-02-25 2020-02-21 Email thread extraction device, email thread extraction method, and computer program WO2020175371A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021502189A JP6905237B2 (en) 2019-02-25 2020-02-21 Mail thread extractor, mail thread extraction method, and computer program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019031261 2019-02-25
JP2019-031261 2019-02-25

Publications (1)

Publication Number Publication Date
WO2020175371A1 true WO2020175371A1 (en) 2020-09-03

Family

ID=72239566

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/007065 WO2020175371A1 (en) 2019-02-25 2020-02-21 Email thread extraction device, email thread extraction method, and computer program

Country Status (2)

Country Link
JP (1) JP6905237B2 (en)
WO (1) WO2020175371A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004159261A (en) * 2002-11-08 2004-06-03 Nippon Telegr & Teleph Corp <Ntt> Method, device, and program for generating thread, and recording medium
JP2011227850A (en) * 2010-04-23 2011-11-10 Kddi Corp E-mail classification device, e-mail management server, e-mail classification method and e-mail classification program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004159261A (en) * 2002-11-08 2004-06-03 Nippon Telegr & Teleph Corp <Ntt> Method, device, and program for generating thread, and recording medium
JP2011227850A (en) * 2010-04-23 2011-11-10 Kddi Corp E-mail classification device, e-mail management server, e-mail classification method and e-mail classification program

Also Published As

Publication number Publication date
JPWO2020175371A1 (en) 2021-09-13
JP6905237B2 (en) 2021-07-21

Similar Documents

Publication Publication Date Title
WO2022041727A1 (en) Question and answer management method, apparatus, and device for medical inquiry system, and storage medium
US11514698B2 (en) Intelligent extraction of information from a document
WO2020147395A1 (en) Emotion-based text classification method and device, and computer apparatus
CN110298029B (en) Friend recommendation method, device, equipment and medium based on user corpus
CN111597320A (en) Intention recognition device, method, equipment and storage medium based on hierarchical classification
JP2011501275A (en) Text classification with knowledge transfer from heterogeneous datasets
CN110472043B (en) Clustering method and device for comment text
CN111143530A (en) Intelligent answering method and device
CN113094478B (en) Expression reply method, device, equipment and storage medium
CN110879834A (en) Viewpoint retrieval system based on cyclic convolution network and viewpoint retrieval method thereof
CN111193657A (en) Chat expression reply method, device and storage medium
Gallo et al. Semantic text encoding for text classification using convolutional neural networks
CN111125457A (en) Deep cross-modal Hash retrieval method and device
Sadiq et al. High dimensional latent space variational autoencoders for fake news detection
Engin et al. Multimodal deep neural networks for banking document classification
US20190317993A1 (en) Effective classification of text data based on a word appearance frequency
Chattopadhyay et al. Automatic selection of binarization method for robust OCR
CN113221570A (en) Processing method, device, equipment and storage medium based on-line inquiry information
CN112836019A (en) Public health and public health named entity identification and entity linking method and device, electronic equipment and storage medium
CN112199958A (en) Concept word sequence generation method and device, computer equipment and storage medium
CN115906835B (en) Chinese question text representation learning method based on clustering and contrast learning
WO2020175371A1 (en) Email thread extraction device, email thread extraction method, and computer program
JPWO2020111074A1 (en) Email classification device, email classification method, and computer program
CN110555143B (en) Question automatic answering method and computer storage medium
KR102569381B1 (en) System and Method for Machine Reading Comprehension to Table-centered Web Documents

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20763665

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021502189

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20763665

Country of ref document: EP

Kind code of ref document: A1